音声をテキスト化してくれるソフトがあれば、面倒な文字起こしの作業は必要なくなります。しかし一方、ひと昔、ふた昔も前から「文字起こしは自動化される」と言われ、その方向で技術革新も進んでいるものの、まだ完全自動化は実現していないのが現実です。いったい、どこに問題があるのでしょうか。文字起こし専門業者が現在の状況を踏まえてお伝えします。
自動文字起こしソフトの評価と実用性
音声認識技術を使った自動文字起こしのソフトやアプリ。その進化は目を見張るものがあります。しかし、その実用性となると、文字起こしの専門業者からはまだまだ合格点は出せないのが現実です。
音声をテキスト化するソフトについて
音声認識技術を使った文字起こしソフト・アプリ
文字起こし(テープ起こし)に役立つソフトというと、再生や早送り・巻き戻しの操作がしやすい音声再生ソフトなどが紹介されたものです。しかし近年では、自動テキスト化をしてくれる音声認識ソフトやスマートフォンのアプリが取り上げられることがふえてきました。
確かに、AIを利用した音声認識の技術は年々進化していますから、こういった音声認識のソフトやアプリが自動的に音声を文字にしてくれれば、これほどありがたいことはありません。
しっかり音声入力すればテキスト化できる
しかし、現実にはまだ、そこまで完璧な技術とは言えないのが現状です。現時点では好条件での録音、たとえばヘッドセットを装着したり、スマートフォンのマイクなどに口を近づけて、しっかりと発語した音声であれば高い精度で文字化してくれます。
ですから、スマートフォンなどに口を近づけて単語や短い文を発して、検索や翻訳などのために音声入力するのであれば、実用に使えるでレベルに達していると言ってもいいでしょう。
録音音声のテキスト化は難しい
実際の録音音声は状態がさまざま
しかし、発話者による直接的な音声入力ではなく、ICレコーダー等で録音した長時間の会議、座談会、インタビューなどの音声は、録音状態もさまざまです。
実際、文字起こしの対象となる音声で、スタジオでマイクの前に座ったアナウンサーが滑舌よく話した内容を録音しました、そんな好条件で録ったきれいな音声はまずありません。
大抵は、話し方の訓練など受けたことのない素人が自由に話していますし、場所も会議室や普通の部屋ならいいほうで、喫茶店や居酒屋などのこともあり、録音状態もピンキリです。
現時点では音声認識ソフトは完璧ではない
こうした様々な状態の録音音声のすべてを、音声認識ソフトを使い自動でテキスト化できるかというと、残念ながらまだまだ精度が低いといえます。
こう言うと、「ICレコーダーで録音した音声を再生してみたら、けっこう聞こえますよ」という方がおられます。たしかに、話の内容もだいたいわかるし、なんとなく問題ないように聞こえるという音声は少なくないです。
でも、人間の耳で再生音声を聞くのと、音声認識ソフトが機械的に音声を聞き取るのとでは、じつは差があるのです。人間の耳というか脳は、少々聞き取れなくても、また話している意味がときどきわからなくても、それなりに理解してしまう(理解したつもりになってしまう)ものです。
でも、ソフトやアプリは人間の耳(脳)とは違います。音声を自分の耳で聞いたときにはなんとなく意味が分かったのに、音声認識ソフトを使って文字化された文章を見たら間違いや意味不明な変換が多い、ということが起こったりします。
もちろん、音声認識ソフトが行う音声から文字への変換は、その精度が日進月歩で進化しています。人間が行うような補正や補足も可能になってきています。それでもなお、あくまで現時点ではありますが、さまざまな条件下で録音された音声については、自動的に音声を文字化するのはまだまだ難しいことが多いというのが現実です。
日本語特有の難しさも
話し言葉を自動でテキスト化する際の問題的
音声認識や文字起こしソフトやアプリによる音声テキスト化が困難な理由については、録音状態の問題だけでありません。
文字起こしの対象となる音声は話し言葉になりますので、「あー」「えー」といった無駄な音声や言葉、会話中に頻繁に打たれる「はい、はい」「うん、うん」といった相槌、そのほか言い間違え、言い淀みなど、いわゆるケバと呼ばれる無駄な音声や言葉が多く出てきます。
さらに、人の話というのは、個人差はありますが、よく聞いて(あるいは起こした文章を読んで)みると、文脈が乱れていたり、話の辻褄があわなかったり、何を言わんとしているのか意味不明な話であることが少なくありません。
特に日本語は文法的にも非論理的な文章構造になりがちですし、表記も漢字、ひらがな、カタカナ、さらに外来語も多く、言語表現も多彩で複雑なので、機械的に自動で文字化するのが難しいという面もあります。
スマートフォンで音声検索したり、簡単な短い会話でしたら問題ないでしょう。しかし、文字起こしの録音音声にありがちな、長時間にわたり、さらに複数人が話し言葉で自由に語ったような内容になると、正確に文字化・文章化するのはそう簡単なことではないです。
文字起こしの未来はどうなるか
録音音声の自動テキスト化には課題も残る
以上のような理由で、録音音声をテキスト化する文字起こしに関しては、ソフトやアプリに完全に任せるところまではまだ至っておらず、人力による音声の文字化がいまだに必要とされているということです。
じつは、私が覚えている限りでも、もう20年くらい前から「文字起こしはそのうち、機械が自動的にやるようになるよ」と、専門業者の間でも言われていました。ところが、未だに人間の耳で音声を聞いて文字化する作業が行われてるのが現実です。文字起こしの難しさは単純にITで解決できるというわけではありません。
音声認識や文字起こしソフトの進化は著しい
そうはいっても大きな方向性としては、音声認識技術も急速に進化していますし、時代の流れはソフト・アプリによる自動文字起こしへと向かうのでしょう。
特に、スマートフォンが普及し始めてからの、音声認識技術の進歩は著しいように感じています。さて、5年後、10年後はどうなっているでしょうか。
文字起こしの専門業者について
多忙な方は無理せず業者に外注を
現状ではまだまだ使い勝手がいいといえない音声認識ソフト。お時間のある方やこうした技術に興味のある方は、いろいろと工夫して使ってみるのもよいと思います。癖をつかんで使いこなせれば、お役に立つことでしょう。
しかし、日々のお仕事などが忙しい方、音声テキスト化を急いでいる方、ITはあまり得意でない方などは、無理せずに文字起こしの専門業者にお任せください。
特に会社や大学などにお勤めで、文字起こしはあまり頻繁には頼まないという方は、ご自身であれこれ試行錯誤して時間を無駄にするよりは、業者に外注したほうが間違いないでしょう。
また、当オフィスでは、音声認識ソフトで起こしした原稿を、元の音源と照合して修正する文字起こしの校正サービスも行っております。
当事務所でも文字起こしを受付中
音声テキスト化を今すぐ頼みたいので、専門業者の手を借りたいという方は、本サイトでも文字起こしのサービスについて、くわしい内容を掲載しております(下記参照)。当オフィスは文字起こし専門業者になりますので、プロのライターが録音音声を正確かつ迅速にテキスト化いたします。
また本ページの下方にも、文字起こしの発注・無料見積りのご案内がありますので、依頼をお急ぎでしたらご参照ください。すぐにお申込みいただけます。
コメント
Comments are closed.