おためし!リアルタイム音声認識
インプレスグループで電子出版事業を手がけるインプレスR&Dは、技術書典や技術書同人誌博覧会をはじめとした各種即売会や、勉強会・LT会などで頒布された技術同人誌を底本とした商業書籍を刊行し、技術同人誌の普及と発展に貢献することを目指し、最新の知見を発信する技術の泉シリーズ2022年4月の新刊として、Bladean Mericle氏著書による、Webページ上でマイクからの音声をリアルタイムに音声認識する技術の解説書「おためし!リアルタイム音声認識」を発売した。
Bladean Mericle Profile●新入社員の頃からコンタクトセンター業界でプログラマーとして働く。最初の10年はIVR(自動音声応答装置)のコールフロー開発に携わる。その後はコンタクトセンター向けの音声認識アプリケーション開発に従事している。使用しているプログラミング言語はC#とJavaが大半だが、Rustのようなnull安全をサポートしている言語に憧れている。最近になってC#でnull安全がサポートされたので、積極的に採用しようと画策している。
技術の泉シリーズについて
「技術の泉シリーズ」は、技術者の知見のアウトプットである技術同人誌を底本とした、2017年創刊の技術書シリーズとなる。NextPublishingによるスピーディーな編集制作とプリントオンデマンドによる1冊からの印刷製本により、技術の変化に追従しつつ返品や品切れのないサスティナブルな出版モデルを特徴としている。本シリーズを通じて、エンジニアの“知の結晶”である技術同人誌の世界に、より多くの人が触れていただくきっかけとなることを目指している。
「おためし!リアルタイム音声認識」発行主旨・内容紹介
「おためし!リアルタイム音声認識」はWebページ上でマイクからの音声をリアルタイムに音声認識する技術の解説書となる。
AWSのS3にHTMLとJavaScriptを用いて音声を取り込み、Amazon Transcribe、Google Chrome、Microsoft Azureの音声サービス、AmiVoice Cloud Platformを使用して音声認識する方法を説明している。
その際、Webページが悪用されないようにAmazon Cognitoを使った簡単な認証についても紹介している。
「おためし!リアルタイム音声認識」は、次世代出版メソッド「NextPublishing」を使用し、出版されている。
「おためし!リアルタイム音声認識」目次
第1章 本書について
第2章 音声認識用Webページを作ろう!
第3章 AWSの音声認識
第4章 Googleの音声認識
第5章 Microsoft Azureの音声認識
第6章 AmiVoiceの音声認識
第7章 おかたづけ
第8章 まとめ
「おためし!リアルタイム音声認識」Amazonでの購入はこちら
「おためし!リアルタイム音声認識」楽天市場での購入はこちら
|
|