画像ファイルから文字を抽出するには

はじめに

アプリを使っていて、画面に表示された文字情報をテキストとして取得したいことはよくあるだろう。

対象のテキスト部分がコピペできるようになっていれば簡単なのだが、必ずしもそうなっていないアプリもたくさんある。

特に文字情報を「絵」で表現することがメインとなっているゲームなどのアプリでは、画面に表示されている文字をコピペで取得することはほぼできなくなっている。
そのようなケースでテキストの情報を取得したい場合、画面を目視で読み取って別のソフトに入力したりすることもあるだろう。

実はこの最後の部分は自動化することが可能だ。
画像ファイルをインプットすると、そこに描かれた情報から文字のみを抽出してテキスト化してくれる仕組みが世の中にはある。

いくつか方法はあるが、今回はそれらのうちからGoogleドキュメントを使った方法を紹介する。
これはGoogleドライブを使っている人なら最初から使えるようになっている機能なので、Googleドライブ利用者にはハードルが低い方法となっている。

方法

やり方は簡単だ。
画像ファイルをGoogleドライブにアップロードして、Googleドキュメントで開くだけだ。

すると、画像の中から文字を認識してテキスト化してくれる。

テキストはコピペ可能なので、どこかに保存するなり加工するなり好きにすればよいだろう。

では、実際に試してみよう。

最初に用意したのが以下の画像だ。
これは本田技研工業のロゴをキャプチャーしたものだ。

このファイルに honda.png と名前を付け、Googleドライブにアップロードしてみた。
その時の様子が以下だ。

続いては、Googleドキュメントの起動だ。

やり方は、Googleドライブ上から画像ファイルを右クリックして、表示されたメニューからGoogleドキュメントを選択すればよい。

メニューは二段階になっているので、最初は「アプリで開く」を選択しよう。
すると、2つ目のメニューに「Google ドキュメント」が現れる。

具体的なイメージは以下の通りだ。

上記画面で「Google ドキュメント」を選択すると、Googleドキュメントが起動する。

その様子が以下だ。
元の画像イメージの下に認識されたテキストが表示されている。

上記を見ると、元の画像は文字の輪郭が結構ぼやけていたことが分かるが、この程度であれば特に問題なく認識が可能なようだ。

次はもう少し実用的な画像で試してみよう。
ゲームのキャプチャー画像だ。

以下がその画像だが、ここにそのまま掲載するにはサイズが大きすぎるので、縦横比を保ったまま縮小加工してあることをお断りしておく。

オリジナルは「Final Fantasy Ⅶ Remake」というゲームの画像だ。

中央部に登場人物のセリフが表示されているが、それ以外にも2つ文字が表示されている箇所がある。

まずは、左上隅にゲームのタイトルが表示されている。
もう一つは見にくいのだが、中央部に「神羅」と書かれたエンブレムが表示されていることが分かるだろう。

ちなみに、エンブレムの部分のみを元のサイズで取り出すと以下のようになる。
人間の目にははっきりと文字が読み取れるが、文字の下半分はかなり暗くなっているので、果たしてこれをGoogleドキュメントが認識できるのかは興味深いところだ。

さて、本田技研のロゴと同様の手順でファイルをGoogleドライブにアップロードし、右クリックメニューからGoogleドキュメントを起動した結果が以下だ。

結果的には「神羅」の部分を含めてすべてのテキストの抽出に成功したことが分かる。

ただし、結果をよく見ると、セリフに続いて謎の「x」という文字が認識されてしまっている。
このような文字は元画像にはないので、残念ながら100点満点とは言えない結果となった。

結論としては、文字認識の精度は相当に高いものの、100%認識が成功するわけではないという点には注意する必要があるだろう。

以上で、画像ファイルから文字を抽出する方法の説明は終了だ。

まとめ

画像ファイルから文字を抽出する方法を紹介した。
ゲームなどの「絵」が主体のアプリから情報をテキストで取り出す際に役に立つだろう。
ただし、今回紹介した方法は、必ずしも100%の精度では動作しないことに注意する必要がある。

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です