mojiru【もじをもじる】

「mojiru」はこのブログ名。「もじる」は著名な言い回しに似せて表現すること。ブログでは、本・映画・グルメなどのヒット商品や気になったトレンドを文字をもじったりもじらなかったしながら、フォントを使ったり使わなかったりしながら取り上げていく。更新頻度は1日1回が基本です。[もじる使用例]1.吾輩は下戸である。お酒は飲めない。2.太閤がまずしかったから。3.棋士の一二三に惨敗。

音源分離の最新手法を解説、中級者以上向け実践的技術書

【スポンサーリンク】

f:id:mojiru:20200821144724j:plain

Pythonで学ぶ音源分離 機械学習実践シリーズ

インプレスグループでIT関連メディア事業を展開するインプレスは、戸上真人氏著書で「音源分離」の最新手法を解説した中級者以上向けの実践的な技術書「Pythonで学ぶ音源分離 機械学習実践シリーズ」を2020年8月24日(月)に発売した。


「機械学習実践シリーズ」とは

本書を通して「実際に動くものが作れる」ことを目指して、特定の技術のアルゴリズムと、それを実装するためのコードを豊富に紹介するシリーズ。機械学習の基本から実装までを学ぶことができる。


戸上真人Profile●2017年1月~2018年5月、スタンフォード大学のStanford Data Science Initiative (SDSI) Visiting Scholarとして在籍。2018年6月にLINE株式会社入社。現在、同社のAI研究組織であるData LabsのSpeech TeamのManager兼Principal Researcher。(一社)人工知能学会理事。16年以上に渡り、音声処理の研究開発に従事。東京大学工学系研究科より2011年に博士(工学)授与。登録特許20件以上、査読あり論文9件、査読あり国際会議での採択論文数60件以上。IEEE Senior Member。

 

身近なものにも活用される技術「音源分離」の基礎と実装を解説する一冊「Pythonで学ぶ音源分離 機械学習実践シリーズ」

近年、AIスピーカをはじめとした、人が話した音声を理解する音声認識システムがさまざまな場面で使われている。一般的に音声認識システムは、1人の声を聞き取ることを想定しており、聞きたい声以外の音が入ってきたときには、聞きたい声を正確に聞き取ることが難しくなる。「音源分離」とはこのようにさまざまな音が混ざった中から、欲しい音だけを抽出する技術です。「Pythonで学ぶ音源分離 機械学習実践シリーズ」では、音源分離の基礎から、Pythonを用いた実装までを詳しく解説している。

 

 

音源分離に必要不可欠な数学の基礎知識も網羅「Pythonで学ぶ音源分離 機械学習実践シリーズ」 

音源分離を理解しコードを書くためには、プログラミングに関する知識に加え、線形代数、微分・積分、確率・統計といった数学的知識も必要不可欠となる。「Pythonで学ぶ音源分離 機械学習実践シリーズ」では、線形代数や行列・ベクトルの微分の方法、確率統計の基礎について示しています。とくに音源分離では複素数の行列・ベクトルを用いるため、複素数の計算方法について重点的に解説している。

 


音源分離の実装に必要な準備段階の情報も丁寧にカバー「Pythonで学ぶ音源分離 機械学習実践シリーズ」 

「Pythonで学ぶ音源分離 機械学習実践シリーズ」では、第1章から第4章までを音源分離を扱うための準備の章としている。

第1章は、音源分離とはどういった技術なのか、具体例を提示しながら解説している。
第2章は、音声処理の基本として、音声ファイルの構造と、Pythonパッケージを用いて音声ファイルを開閉する方法を示している。
第3章は、音源分離で必要な、線形代数や行列、ベクトルの微分の方法、確率統計の基礎について示している。
第4章は、第3章の数学的知識をベースに、最適化に関する手法を示している。

第5章からは音源分離の実装について解説。
第5章では、Pyroomacousticsというライブラリを用いて仮想的に設定した部屋で収録した音声をシミュレートする方法を紹介している。
第6章では、ビームフォーミングという手法を解説している。
第7章は、空間モデルのパラメータを、音源方向の推定結果を利用して求める方法を示している。
第8章は、ブラインド音源分離法について紹介している。
第9章は、残響除去の方法を示しいる。
第10章は、残響除去と音源分離を統合的に実行する方法を解説している。
第11章は、PyroomacousticsやNARA-WPEなどのツールや参考文献を紹介している。

 

 

「Pythonで学ぶ音源分離 機械学習実践シリーズ」対象読者

音声処理のエンジニア、研究者

理系の大学生

Pythonで音源分離を実装したい人

 

 

「Pythonで学ぶ音源分離 機械学習実践シリーズ」紙面イメージ

▼「音源分離とは何か?」から丁寧に解説している

f:id:mojiru:20200821144856j:plain

▼NumPySciPyを用いた方法や、スペクトログラムの見方も詳しく解説している

f:id:mojiru:20200821144833j:plain 

「Pythonで学ぶ音源分離 機械学習実践シリーズ」Amazonでの購入はこちら
Pythonで学ぶ音源分離 機械学習実践シリーズ

Pythonで学ぶ音源分離 機械学習実践シリーズ

  • 作者:戸上真人
  • 発売日: 2020/08/24
  • メディア: 単行本(ソフトカバー)
 

 

「Pythonで学ぶ音源分離 機械学習実践シリーズ」楽天市場での購入はこちら
 
©2017-2019 mojiru All Rights Reserved. | プライバシーポリシー