 |
|
|
分散型音声認識システムの開発について
〜 インターネットで音声認識 〜

No. 2004-002


KDDIと株式会社KDDI研究所 (本社: 埼玉県上福岡市、代表取締役所長: 浅見 徹) は、PCやPDA (携帯情報端末) などの端末に音声を入力し、その音声の特徴をインターネット等のデータ回線を介してセンター側の音声認識装置に送信し、その認識結果をもとに情報提供を行う等、各種サービスに応用が可能な音声認識システムを共同で開発しました。
従来、大量の企業名リストから特定の企業を検索するような音声認識アプリケーションを実現するためには、センターに設置する認識システムへ電話回線を介してアクセスする方法が一般的です。しかしこの方式では音声のみの送受信にとどまり、文字や画像をユーザに提示することが出来ません。
これに対し、音声認識機能を端末とセンターで分散させるDSR (Distributed Speech Recognition: 分散型音声認識) と呼ばれる新しい方式では、音声の特徴を端末でパラメータ化しパケットとして送ることにより、音声とデータをデータ回線上で混在させて扱うことができます。これにより、データ回線だけを用いて地図、写真、文字等の多様な情報を、音声入力によりセンターからダウンロードしたり、画面を見ながら所要の情報を音声で絞り込んだり、音声でWEBサーフィンを行う等、従来の方式では難しかったことが容易に実現できます。また、DSRは音声の情報量を圧縮し、パケットの形で送りますので、従来方式のように音声回線を保留することがなく、経済性にも優れています。
今回、KDDI及びKDDI研究所は、このDSR機能を搭載したPC/PDAとDSR対応の音声認識センターシステムを開発しました。これにより、例えばフィールドエンジニア、営業要員やホームヘルパーが外出先で作業を行ないつつ、PDAに話し掛けて業務メモを作成したり、あるいは旅行者がPDAに話し掛けながら、簡便に地図や観光スポット情報を取得して、ガイドブック不要の気楽な旅を楽しむ、と言うようなアプリケーションが実現可能となります。
今後このシステムを用いてソリューション分野への展開を検討していきます。また広くお客様へご利用いただけるよう携帯電話や車載器、情報家電などへの適用を目指した技術開発にも取り組んでいきます。


|
|