ブックモールPC

ブックレビュー
更新日:2009年3月25日

全レビュー一覧&レビュー検索はこちら >>
書名:人と対話するコンピュータを創っています
人と対話するコンピュータを創っています

著者 古井貞熙
出版社 角川学芸出版/KADOKAWA
ISBN 978-4-04-621640-3
発行日
2009年2月27日
価格 1,944円
(本体1,800円+税)
仕様 単色刷/B6変型判/239頁
分類 コンピュータ一般(教養・読物)
 人工知能の研究に関してよく言われることですが、人間というのはまこと奥が深い。多くの人があたりまえにやっていることなのにコンピュータで真似しようとするととてもとてもとても難しい、最高の技術をもってしても普通の人の能力にまったくかなわない、というようなことがたくさんあります。
 人の声から言葉を聞き取るというのもそのひとつ。1960年代から研究されてきてかなりの成果が得られさまざまなところで実用化されてはいるものの、しかしまだまだ人間の能力に遠く及ばない。この本の著者古井先生によると山のやっと5合目くらい、普通の人ができるくらい自由に人と対話できるコンピュータを作るには、あと20年はかかるだろうということです。

 古井先生は音声認識を黎明期から研究してこられた方だそうで、音声認識研究の現状を一般向けにわかりやすくまとめたのがこの本です。
 まず予備知識となる、人が声を出すしくみと声を聞き取るしくみについて。声を出すほうは比較的単純ですが、声を聞き取るほうには脳のはたらきで実に人間的なさまざまな現象が起こります。カクテルパーティ効果というのはわりとよく知られていますよね。
 それから、コンピュータで声を分析し理解する手法について。おなじみのA/D変換とフーリエ変換に続いて、声の特徴をうまく抽出できるケプストラムという手法、ケプストラムの変化を捉えて音韻に結びつけるDPマッチングと隠れマルコフモデル、音韻を言葉として理解するための音声コーパスに統計的言語モデルと、現在主流となっている音声認識技術の要点が解説されています。
 さらに、各国語の音声的特徴とか、世界各国で行われている研究の状況とか、実用化されている音声認識サービスや製品のあれこれ。ところどころ難しい内容もあるのですが、軽く読み飛ばしてもそれなりに大筋は理解できるように書かれています。

 意外なことに、話者認識つまり声を聞いて誰だか判別する技術は、言葉を聞き取るよりも簡単そうな気がするんですが、それほど進んでいないそうです。まあたぶん、実用性が低いと思われてあまり研究されていないだけだろうと思いますけど、もしかしたらなにかとても人間的な、コンピュータには真似のできない能力なのかもしれません。
 うむ、そうですね、稲村優奈さんの地声とアプリコット桜葉の声を聞き分けるのは人間にしかできないことだと思うほうが、そのほうが楽しそうですね。



書評者: 塩見 真一 パソコンの本フォーラム

全レビュー一覧&レビュー検索はこちら >>

Copyright 2002 Bookmall Japan Corporation All rights reserved.
このWEBサイトに掲載されている記事・写真などの無断転載を禁じます。
このWEBサイトについてのお問い合わせはこちらまで。
株式会社ブックモール ジャパン