人の声で操作する音声コマンドデバイス

音声認識の技術は、さまざまな分野で用いられ実用化が進んでいます。音声を文字化するテープ起こしにおいても、音声認識の技術が応用されるようになってきましたが、ここでは人間の声による指示で操作を行う音声コマンドデバイスについて考えてみたいと思います。

音声認識技術の実用化が進んでいる

スマートフォンやスマートスピーカーの普及で、一般人にもお馴染みになった感もある音声認識技術。でも、知っているようで、よくわからないという方が多いのではないでしょうか。

音声コマンドデバイス(VCD)とは

人間の声で操作するデバイス

音声コマンドデバイス(Voice command device、略称はVCD)とは、人間の声によって指示を出して操作するデバイスのことです。

ボタン、スイッチ、ダイヤルなどに手を触れなくてもよいので、他の作業をしながら、また目の不自由な方でも簡単に操作することができます。例えばカーナビゲーション、情報家電、スマートフォンなどがあります。

核になるのは音声認識の技術

これらの機器を制御するうえで重要になるのが、音声認識の技術になります。

GoogleやAppleをはじめ、時代を先取りする先進企業が音声認識の研究・開発を積極的に進めていることもあり、話題性のあるVCDが次々と登場し市場を賑わせています。

スマートフォンではお馴染みの機能

音声コマンド機能を搭載したデバイスは、今や珍しいものではなくなりました。なかでも、多くの人にとって現在もっとも身近なのは、やはりスマートフォンと言ってよいでしょう。

スマートフォンでの音声検索のほか、メールの送信、WEBサイトへのアクセス、音楽再生、道案内、地図の表示、メモ書きなど、人の声による指示でさまざまな機能が働きます。

音声認識について

音声認識の精度向上がカギ

VCDは家庭や職場をはじめ、さまざまな施設、乗り物の中、屋外など、あらゆる場で応用できると言っても過言ではありません。

その際、ポイントの1つになるのは、どのような場所・状況であっても人間の声を正確に捉えることができるよう、音声認識の精度を向上することです。

厳しい条件下でも音声認識できるか

スマートフォンのCMで、音声検索をする話者が、スマホのマイクに口を近づけて、話しかけているシーンを見たことがないでしょうか。

やはり確実に音声認識してもらうには、あのようにして音声入力するのがベストです。

しかし、スマホならまだしも、他の機器ですとマイクに口を近づけて話すのが難しいことも当然あります。

さらに、使用する人の年齢、健康状態、話し方の癖、訛り、それから使用状況や使用時の騒音などさまざま環境もありますから、音声認識の技術は非常に大事になります。

SNSでもご購読できます。

コメントを残す

*