画像やPDFの文字をテキスト化(文字起こし)できるOCRソフト

  • このエントリーをはてなブックマークに追加

当事務所はインタビューや会議などの録音音声を文字起こしする専門業者です。今回の記事は文字起こし番外編とでもいえる内容になりますが、画像やPDFの文字をテキスト化できる、便利なOCRソフト・アプリやサイトをご紹介します。

OCR(文字認識)フリーソフト・アプリ

OCRとは、Optical Character Recognition(またはReader)の略で、日本語では光学的文字認識といいます。ちょっと長いので、以下文中では文字認識と表記します。

OCR(文字認識)が役立つ場面

紙やPDFの資料をデジタル化

音声データの文字起こしをお客様から受けたときに、郵送で紙の資料(印刷物等)や、それらの資料(印刷物)をスキャンしてPDFにしたものがメール添付送られてくることがあります。

しかし、資料から引用する文字量が多いと、ワープロソフトで文字起こし入力中にいちいち打ち直すのは、けっこう面倒な作業です。こんなときに、紙やPDFの資料をOCR(文字認識)でテキスト化できると作業の効率アップになります。

なお、活字だけでなく、メモなど手書きの文字を読み取ってデジタル化することも可能です。

名刺の管理

文字起こしの仕事も、今はインターネット上ですべて完結できるようになっているので、直接、お客様や取引先とお会いする機会は随分減りました。

そうはいっても、ビジネスで文字起こしをしていると、名刺を交換したりいただいたりすることがあります。いつの間にか溜まってしまいがちな名刺の管理にもOCR(文字認識)は役立ちます。

名刺管理のソフト・アプリは、広告などでもよく見かけますね。

書籍のデジタル化

古い書籍などデジタルデータが残っていないとき、OCR(文字認識)でテキストを抽出すれば、人力で打ち直すのに比べて圧倒的に手間も時間も経費も節約できます。

実際、この人力での打ち直し作業を当事務所でも請け負ったことがありますが、入力の手間もさることながら、原文と照らし合わせて校正するのも結構大変でした。

さて、こうしてOCRにより抽出したテキストデータですが、あらためて編集し直して改訂本を作ることもできますし、紙にこだわらずに電子書籍にして発行することも可能ですし、活用方法は様々ありそうです。

書類の文章検索

紙の大量の書類であってもデジタル化してしまえば、文字の検索が容易にできます。例えば、書類の一部(担当者、部署、商品名など)に変更があった場合でも、紙のままだと修正するのも大変ですが、デジタル化できれば修正箇所を検索して、一括で直すことも可能です。

そのほか、ビジネスやプライベートでOCR(文字認識)が役立つ場面はいろいろあります。「こんな使い方もあるのか」といった目からうろこの使用法もあるようですので、ご関心のある方はぜひ試されてみてください。

画像・PDFの文字をテキスト化できるフリーソフト

Pick up Tool

MicrosoftのComputer Vision APIを利用したOCRソフトです。

マウスで囲んだ領域内に写っているテキストや、指定した画像の中に写っているテキストを読み取り、プレーンテキストとして出力してくれます。

Ground Truth Text

画像内に映し出されているテキストのうち、マウスで変換したい範囲を囲み、その範囲にある文字を識別し、クリップボードにコピーしてくれます。対応している画像ファイルは、BMP、JPEG、GIF、TIFF、PNG。

QuickOCR

Windows 10 に内蔵されているOCRエンジンを利用したOCRソフトです。マウスドラッグで囲んだ領域内に写っているテキストを読み取り、結果を専用のウインドウ内に抽出してくれます。

いつもは音声データからの文字起こしについて関連情報を掲載していますが、今回は画像・PDFの文字をテキスト化について取り上げてみました。

本記事でご紹介したもの以外にも、OCR(文字認識)ソフト・アプリは多数ありますので、ご興味がありましたらインターネット検索などで探してみてください。

OCRとChatGPTを組み合わせる

ここまでOCRや関連ソフトについて述べてきました。しかし、OCRで抽出したデータは内容によっては、無秩序で整理されておらず、そのままだと利用しにくいことがあります。

そこで、近年普及が目覚ましいChatGPTなどAIチャットボットを利用することで、OCRから抽出したデータを整理・要約したり、使用しやすい形に変更することが可能になります。

ChatGPTの応用範囲はまだまだ未知数といえますが、こんなところでも活用が期待されますね。

当オフィスの文字起こしサービス

当オフィスは、音声や動画からの文字起こしを行っている専門業者になります。残念ながら、OCRソフトを使った印刷物等のデジタル化はお受けしていませんが、通常の文字起こしであればいつでもお引き受けいたします。

以下に、文字起こしサービスに関連するページをご案内いたしますので、ぜひご参照ください。

Excel

Excel(エクセル)での文字について。

ソフト

文字起こしソフトの精度や実用性について。

音声送付

大容量の音声・動画データの送付について。

無料見積

文字起こしの無料見積もりについて。

料金

文字起こしの料金や計算方法についてご案内します。

文字起こし

文字起こしサービス案内のトップページです。

  • このエントリーをはてなブックマークに追加

SNSでもご購読できます。