画像の中にある文字をデータとして活用できたら、手動での入力作業を減らし、効率化が図れますよね?そんな時に役立つのがOCR(Optical Character Recognition)。今回は、Pythonを使って、画像から文字を自動的に抽出する方法をご紹介します。初心者の方でも簡単に実装できるTesseractを利用し、画像内のテキストを瞬時に変換するプロセスをステップバイステップで解説します。Pythonを使った効率的なデータ活用の第一歩を踏み出しましょう!
必要なライブラリのインストール
1 |
pip install pytesseract Pillow |
また、Tesseract OCR自体もシステムにインストールする必要があります。以下はインストール方法の例です。
macOSの場合(Homebrewを使用)
1 |
brew install tesseract |
Windowsの場合
TesseractのWindowsインストーラーをダウンロードしてインストールします。
インストール後、Tesseractのパスを設定する必要があります。例えば、以下のように設定します。
1 |
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe' |
パスの確認方法

プログラミングコード
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
from PIL import Image import pytesseract # Tesseractのパスを指定 (Windowsの場合) pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe' # 画像を開く image = Image.open('sample_image.png') # 画像から日本語テキストを抽出 text = pytesseract.image_to_string(image, lang='jpn') # 結果を表示 print(text) |
言語データの使用
lang='eng'
の部分は英語テキストを抽出する場合の設定です。日本語を抽出したい場合は、Tesseract用の日本語言語パックをインストールし、lang='jpn'
とします。Windowsの場合は、日本語の言語パックをTesseractのGitHubリポジトリからダウンロードし、tessdata
フォルダに追加してください。

サンプルファイルの準備
今回は以下の画像の文字を出力しました

出力結果

謎の鬱や院 eが出力されましたが、なんとなく文字出力をすることができました。
まとめ
この記事では、Pythonを使用して、OCR(光学式文字認識)技術を活用して画像からテキストを自動的に抽出する方法について説明しました。具体的には、PythonのpytesseractライブラリとPillowライブラリを使い、Tesseract OCRエンジンを利用して、画像内のテキストを簡単に取得する手順を紹介しました。初心者でも扱いやすく、画像データの効率的な活用方法の一歩となる実装を詳しく解説しました。
- OCR技術を使用して画像からテキストを抽出する方法を紹介
- PythonとTesseract OCRを使い、手軽に文字認識を実装可能
- 必要なライブラリとTesseractのインストール手順を解説
- 実際にコードを動かして、日本語や英語など多言語対応のテキスト抽出が可能
- Tesseractの日本語言語パックのインストール方法も補足
この記事を通じて、プログラムを活用し効率的にデータ処理を行う方法に触れ、画像からのテキスト抽出が手軽にできることが理解できる内容となっています。
Pythonってどんな物?
プログラミングってどんな物?という方はこちらの記事を参考にしてみてください!!
関連記事
また、プログラミングに興味はあるけどどうやって勉強していいのかわからないという方はプログラミングを視覚的に理解できる講座を作っていますのでこちらを参考にしてみてください!
Udemyというプラットホームを使用して作成した講座です。
初心者向けに作った講座となっております。以下から講座の確認ができるので見てみてください

プログラミング学習を進めているけれど、まだ副収入につなげられていない…そんなあなたへ!今こそ、学んだスキルを活かして副業に挑戦する絶好のチャンスです。プログラミングだけでなく、自分のスキルや商品をネットで販売する『ネットショップ』を開設してみませんか?
ネットショップを持つことで、自分の知識やスキルをより多くの人に届け、副収入を得ることが可能です。学んできたプログラミングを活かして、ショップのカスタマイズや運営も自由自在に行えますし、もし商品作成が難しい場合でも、デジタル商品やサービス提供など、いろんな選択肢があります。
このステップで一歩踏み出せば、今学んでいることが副収入に直結し、自分の時間をより有効に使うことができるはずです!一緒にネットショップを開設し、副業の第一歩を踏み出しましょう!
タイトルテキスト