一般社団法人新技術応用推進基盤は、人工知能(AI)を用いた印刷文章の文字認識ツールを無償提供しています

人工知能文字認識(OCR)とは

OCR(Optical Character Recognition/Reader)とは、日本語では光学式文字認識となり、印刷文書や手書き文字の写真をテキストデータに変換する技術を指します。我が国のビジネスでは、まだまだ「紙」の利用シーンは多く、ビジネスの効率化に期待されている技術の1つです。

過去のビジネス活動をデータとして蓄積し、後世に利用しやすく、展開しやすくするためには、紙よりもデジタルデータでの保管が向いていることは言うまでもありません。
OCR(光学式文字認識)のアイデアは決して新しいものではなく、過去、コピー機メーカーやPDFメーカーは文字認識ソフトの開発に着手してきましたが、これまで「文字認識」の精度はお世辞にも高いとは言えず、またオフィスに1台しか置けないような、大きな読み取り機を必要としました。

しかし現在、畳み込み型ニューラルネットワーク(CNN)に代表されるディープラーニングの手法によって、より効率的な計算で文字の肖像を認識することができるようになりました。Google社はこの文字情報を学習した人工知能をAPI(アプリケーションプログラミングインターフェース)として安価に公開し、私たちは非常に手軽に人工知能の恩恵を享受することができるようになっています。


人工知能文字認識ツール配布

一般社団法人 新技術応用推進基盤では、Google社のAPIを活用し、写真撮影中の文字を認識、Excelに送信して管理できるアンドロイド用アプリを開発し、無償公開することにしました。

無償公開の理由は、各企業様に人工知能利用のイメージをつかんでいただき、本ツールをモックアップとして実際にビジネスに応用するにはどんな開発が必要か企画を練りやすくするためです。また、Google APIや各種ライブラリを活用した人工知能開発を志向する方の為の学習用教材としてもご利用いただけます。

文字認識ツールの機能と内容

本ツールは、「紙の帳票管理の為にOCRを使う」ビジネスをイメージして作成しています。以下の手順で作業すると、Excelに印刷帳票の文章がデジタル化され、リスト表示されます。

  1. Android端末からアプリを起動し、紙の印刷帳票を写真撮影します。
  2. 端末画面に帳票内の文章がテキスト化されて表示されます。手振れ・撮影ミスがないことを確認したら確定ボタンを押します。
  3. 管理パソコンにテキスト情報が送信され、Excel管理表にテキスト情報がリスト表示されます。また合わせて撮影場所・写真元データの情報も送信されてExcelに表示されます。(1撮影1行として、送信のたびExcel管理表の行が追加されていきます)
  4. またExcel管理表には、消込ボタンが付記されており、管理パソコンを見ている管理者がボタンを押すと確認済みとしてリストが消し込まれます。

上記作業手順の為、利用にはAndroid端末と管理用PCそれぞれにアプリをインストールする必要があります。また、本ツールはその目的上、精度・処理速度・UI等を作り込んだものではありません。あくまでイメージアップ・モックアップとしてご利用ください。

人工知能OCR

文字認識ツールの利用条件

  • 本ツールを利用することは、上記・下記すべての利用条件を了承したこととなります。
  • 本ツールはGoogle Vision APIを用いた、写真の文字認識プログラムであり、(一社)新技術応用推進基盤より無償で提供されますが、著作権等の権利は新技術応用推進基盤が保有し、放棄していません。
  • 当団体からの直接配布を受けた法人・個人の私的利用のみ許諾しております。本ツールのすべてまたはその一部でも、商用利用することは認めておりません。
  • 第三者による無断配布や目的外利用(例:本ツールのコピー、改変・配布・販売、二次利用、プログラミングコードの複製等)はいかなる事情においても認めておりません。これが発覚した場合、著作権侵害として損害賠償請求をさせていただく場合がございます。
  • 利用条件内に限り、良識をもったご使用をお願いいたします。また、本ツールを使用したことによるいかなる損害についても、当法人および当法人の社員はその責任を負いません。
  • 本ツールは無料でご利用いただけますが、Google社へのAPI利用料が別途発生する場合がございます。その場合は、利用者がGoogle社へ利用料を支払うこととし、一般社団法人 新技術応用推進基盤はいかなる利用料の支払いも行いません。
  • 本ツールの配布にあたっては当法人でもウイルスチェックを実施しておりますが、インターネット上での配布という仕様上、完全を保証するものではありません。利用者の責任においてウイルス対策を実施した環境にて、ウイルスチェックを実施して使用することを強く推奨します。
  • 本ツールは無償提供という特性上、頻繁なアップデートや保守運用は実施いたしません。また、本ホームページで公開している以外の、本ツールの利用方法や環境準備等といったいかなるお問い合わせにもご回答できません。インターネット上に存在するGoogle Cloud Vision APIの利用方法等を参照し、利用者ご自身での解決をお願いします。

文字認識ツールの利用環境

  • システム条件
    • 本ツールは、「撮影用アプリがインストールされたAndroid端末」、「撮影データを受領し、Google Cloud Vision APIと接続する仮想サーバー」、「仮想サーバーからテキスト化データ/撮影情報をダウンロードし、一覧化するクライアントPCの情報管理Excel」の3つで構成されます
    • そのためツールをダウンロードしたら、APPディレクトリ内のAPKファイルをAndroid端末にインストールするとともに、Vagrant、 virtualbox 等の仮想環境と、情報管理用のクライアントPCをご用意ください
    • Android端末アプリ、情報管理Excelには、仮想サーバーのIPアドレス記入欄がございますので、こちらにご自身の仮想サーバーのIPアドレスを入力し、接続を確認してください
  • ホストサーバ
    • 仮想サーバ(vagrant、 virtualbox )がインストールされ、問題なく立ちあげ・処理可能な環境
    • メモリ8GB以上
    • ダウンロードしたファイルのうち、apiディレクトリとjpgディレクトリをCドライブ直下などに設置してください
    • クライアントPC上で仮想サーバを立ち上げる場合、下記ネットワークセパレータの設定にご注意ください。vagrantの起動には下記コマンドを用いてください
      • vagrant up
      • vagrant provision --provision-with exec
  • クライアントPC
    • Windows 10にて動作確認済み
    • メモリ4GB以上
    • ダウンロードしたファイルのうち、OcrResultList.xlsmを適切なディレクトリに配置してください
    • また、Excelのマクロを有効にしてください
  • Android端末
    • Android 8.1.0 Oreoにて動作確認済み
    • 写真撮影機能必須
    • GPS取得機能必須
  • ネットワーク環境
    • サーバ・クライアント・Android端末はすべて通信可能であり、画像ファイルの送受信に影響がない速度が維持されている環境であることを確認してください
    • サーバ・クライアント・Android端末が同一LAN上に存在する場合、NWセパレータが有効であると通信できないため、無効にする必要があります
  • Googleアカウント
    • 本ツールはGoogle APIを利用しています。利用者ご自身のGoogleアカウントおよび支払い手段をご準備ください
    • Google Developer コンソールにアクセスし、Cloud Vision APIおよびGeocoding APIを有効にしてください
    • 認証情報を取得し、認証キーをapiのconfigディレクトリにあるjuppiter.php内のapikeyに設定してください

文字認識ツールの利用方法

  • 設置・インストール
    • 解凍後、apiディレクトリ、jpgディレクトリをサーバに設置してください
    • APKファイルをAndroid端末にインストールしてください
    • OcrResultList.xlsmをクライアントPCに設置してください
  • 実行
    • Android端末のアプリを起動し、送信先サーバのIPアドレスが正しいことを確認の上、帳票撮影ボタンを押下してください
    • 写真撮影モードに切り替わりますので、紙書類を撮影してください
    • 仮想サーバーを経由してVision APIが文字を解析し、画面に表示されますので、撮影手ブレ等なければ送信ボタンを押下してください
    • 次に、クライアントPCのOcrResultList.xlsmを起動してください
    • 右上の読み込み先サーバのIPアドレスが正しいことを確認後、読み込みボタンを押下してください
    • 撮影場所や撮影元ファイルの情報とともに、文字認識結果がExcelに取り込まれます
  • 解凍後ファイルにあるreadmeファイルも適宜ご参照ください
  • 撮影された写真の元データは、サーバ内のjpgディレクトリに保管されていきます

ツールダウンロード

PAGE TOP