JP2015210636A - 符号読み取り方法及び装置 - Google Patents

符号読み取り方法及び装置 Download PDF

Info

Publication number
JP2015210636A
JP2015210636A JP2014091361A JP2014091361A JP2015210636A JP 2015210636 A JP2015210636 A JP 2015210636A JP 2014091361 A JP2014091361 A JP 2014091361A JP 2014091361 A JP2014091361 A JP 2014091361A JP 2015210636 A JP2015210636 A JP 2015210636A
Authority
JP
Japan
Prior art keywords
code
ratio
image data
data
dots
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014091361A
Other languages
English (en)
Inventor
博志 田村
Hiroshi Tamura
博志 田村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IB RES KK
IB Research KK
Original Assignee
IB RES KK
IB Research KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IB RES KK, IB Research KK filed Critical IB RES KK
Priority to JP2014091361A priority Critical patent/JP2015210636A/ja
Publication of JP2015210636A publication Critical patent/JP2015210636A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】図面をスキャンすることにより得られた画像データから当該図面中の符号を正確に認識する。【解決手段】ドットにより表示された図面の画像データから当該図面中の符号をOCR処理により読み取る符号読み取り装置(100)は入力手段(110)と制御手段(120)と記憶手段(130)とからなる。制御手段は、画像データを一方向においてスキャンし、画像データ内の複数の一塊のドット群を抽出し、抽出された複数の一塊のドット群の各々が示す符号を第一の符号としてOCR処理により認識し、第一の符号と予め定められた基準符号データとを比較し、基準符号データと合致する第一の符号の数を求め、第一の符号の総数に対する当該数の割合を算出し、この割合が予め定められた基準数より大きいか否かを判定し、この割合が基準数より大きい場合には、第一の符号を前記図面中の符号として選択する。【選択図】図1

Description

本発明は、文書、特に図面をスキャンした場合に、当該図面中に含まれる符号を読み取る方法、装置及びプログラムに関する。
文書をスキャンにより読み取る装置として特開2013−92916号公報(特許文献1)に記載されている知的財産管理装置がある。
この知的財産管理装置は、明細書及び図面を含む特許出願書類におけるこれらの明細書及び図面のデータを入力する入力部と、図面から符号(数字またはアルファベット)を抽出するとともに、明細書からその符号に対応する名称を抽出する制御部と、制御部が抽出した名称を当該名称に対応する符号とともに図面上に表示する表示部と、を備えている。
通常、特許出願書類の図面には符号のみが示されているが、上記の知的財産管理装置を用いることにより、表示部には、符号とともに当該符号に対応する名称が表示されるため、図面上においてその符号に対応する名称をそのつど明細書を参照して確認することが不要となり、さらに、明細書を読む際にも図面を参照することが容易になる。
特開2013−92916号公報
図面に記載されている符号を読み取る装置としては光学文字認識(OCR:Optical Character Recognition)装置が用いられる。
具体的には、プリントアウトされた図面をスキャナーで読み取り、図面の内容をディジタルデータ化し、光学文字認識装置を用いてこのディジタルデータから図面内の符号を読み取る。
例えば、公開特許公報に記載されている図面をスキャンする場合、通常は図面の縦方向(上下方向)にスキャンが行われる。ただ、同公報には図面が横向きに掲載されている場合がある。具体的には、図面の頂部が左側を向いて掲載されている場合である。この場合には、図面内の符号も全て横向きに掲載される。このため、図面のスキャンは図面の縦方向(上下方向)及び横方向(左右方向)の両方向において実施される。
しかしながら、一旦図面のスキャンが実施された後においては、スキャンにより得られた画像が縦方向のスキャンによる画像であるか、横方向のスキャンによる画像であるか、判別が極めて困難もしくは不可能であるという問題がある。この判別を正確に行うことができないと、例えば、縦方向のスキャンにより得られた画像と横方向用の画像基準データとを比較することが起こり得るため、画像内の符号を正確に認識することができなくなるという結果になる。
本発明はこのような従来のスキャニングにおける問題点に鑑みてなされたものであり、図面をスキャンすることにより得られた画像データから当該図面中の符号を正確に認識することを可能にする符号読み取り方法、符号読み取り装置及び同方法を実施するプログラムを提供することを目的とする。
上記の目的を達成するため、本発明は、第一の態様として、ドットにより表示された図面の画像データから当該図面中の符号をOCR処理により読み取る方法であって、基準となる符号からなる基準符号データを作成する第一の過程と、前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出する第二の過程と、前記第二の過程において抽出された前記複数の一塊のドット群の各々により示される符号を第一の符号としてOCR処理により認識する第三の過程と、前記第一の符号と前記基準符号データとを比較し、前記基準符号データと合致する第一の符号の数を求め、前記第一の符号の総数に対する当該数の割合を第一の割合として算出する第四の過程と、前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成する第五の過程と、前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出する第六の過程と、前記第六の過程において抽出された前記複数の一塊のドット群の各々により示される符号を第二の符号としてOCR処理により認識する第七の過程と、前記第二の符号と前記基準符号データとを比較し、前記基準符号データと合致する第二の符号の数を求め、前記第二の符号の総数に対する当該数の割合を第二の割合として算出する第八の過程と、前記第一の割合が前記第二の割合より大きいか否かを判定する第九の過程と、前記第一の割合が前記第二の割合より大きい場合には、前記第一の符号を前記図面中の符号として選択し、前記第一の割合が前記第二の割合より大きくない場合には、前記第二の符号を前記図面中の符号として選択する第十の過程と、を備える方法を提供する。
さらに、本発明は、第二の態様として、ドットにより表示された図面の画像データから当該図面中の符号をOCR処理により読み取る方法であって、基準となる符号からなる基準符号データを作成する第一の過程と、前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出する第二の過程と、前記第二の過程において抽出された前記複数の一塊のドット群の各々により示される符号をOCR処理により認識する第三の過程と、前記第三の過程において認識された符号と前記基準符号データとを比較し、前記基準符号データと合致する符号の数を求め、前記第三の過程において認識された符号の総数に対する当該数の割合を算出する第四の過程と、前記割合が予め定められた基準数より大きいか否かを判定する第五の過程と、前記割合が前記基準数より大きい場合には、前記第三の過程において認識された符号を前記図面中の符号として選択する第六の過程と、を備える方法を提供する。
上記の本発明に係る方法は、前記第五の過程において、前記割合が予め定められた基準数より大きくない場合には、前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成する第七の過程と、前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出する第八の過程と、前記第八の過程において抽出された前記複数の一塊のドット群の各々により示される符号を前記図面中の符号としてOCR処理により認識する第九の過程と、をさらに備えることが好ましい。
前記図面と対応する文書がある場合において、前記基準符号データは前記文書から抽出されるものであることが好ましい。
前記図面は特許出願用または実用新案登録出願用の図面であり、前記文書は特許出願用または実用新案登録出願用の明細書であることが好ましい。
本発明は、第三の態様として、ドットにより表示された図面の画像データから当該図面中の符号をOCR処理により読み取る符号読み取り装置であって、入力手段と、制御手段と、記憶手段と、からなり、前記記憶手段は、前記入力手段を介して入力された、予め作成されたデータであって、基準となる符号からなる基準符号データを記憶しており、前記制御手段は、前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出し、抽出された前記複数の一塊のドット群の各々により示される符号を第一の符号としてOCR処理により認識し、前記第一の符号と前記基準符号データとを比較し、前記基準符号データと合致する第一の符号の数を求め、前記第一の符号の総数に対する当該数の割合を第一の割合として算出し、前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成し、前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出し、前記第二の画像データ内の複数の一塊のドット群の各々により示される符号を第二の符号としてOCR処理により認識し、前記第二の符号と前記基準符号データとを比較し、前記基準符号データと合致する第二の符号の数を求め、前記第二の符号の総数に対する当該数の割合を第二の割合として算出し、前記第一の割合が前記第二の割合より大きいか否かを判定し、前記第一の割合が前記第二の割合より大きい場合には、前記第一の符号を前記図面中の符号として選択し、前記第一の割合が前記第八の第二の割合より大きくない場合には、前記第二の符号を前記図面中の符号として選択するものである符号読み取り装置を提供する。
本発明は、第四の態様として、ドットにより表示された図面の画像データから当該図面中の符号をOCR処理により読み取る符号読み取り装置であって、入力手段と、制御手段と、記憶手段と、からなり、前記記憶手段は、前記入力手段を介して入力された、予め作成されたデータであって、基準となる符号からなる基準符号データを記憶しており、前記制御手段は、前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出し、抽出された前記複数の一塊のドット群の各々により示される符号を第一の符号としてOCR処理により認識し、前記第一の符号と前記基準符号データとを比較し、前記基準符号データと合致する第一の符号の数を求め、前記第一の符号の総数に対する当該数の割合を算出し、前記割合が予め定められた基準数より大きいか否かを判定し、前記割合が前記基準数より大きい場合には、前記第一の符号を前記図面中の符号として選択するものである符号読み取り装置を提供する。
上記の本発明に係る符号読み取り装置における前記制御手段は、前記割合が予め定められた基準数より大きくない場合には、前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成し、前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出し、抽出された前記複数の一塊のドット群の各々により示される符号を前記図面中の符号としてOCR処理により認識するものであることが好ましい。
本発明は、第五の態様として、ドットにより表示された図面の画像データから当該図面中の符号をOCR処理により読み取る方法をコンピュータに実行させるためのプログラムであって、前記プログラムが前記コンピュータに実行させる処理は、前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出する第1の処理と、前記第1の処理において抽出された前記複数の一塊のドット群の各々により示される符号を第一の符号としてOCR処理により認識する第2の処理と、基準となる符号からなり、予め作成された基準符号データと前記第一の符号とを比較し、前記基準符号データと合致する第一の符号の数を求め、前記第一の符号の総数に対する当該数の割合を第一の割合として算出する第3の処理と、前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成する第4の処理と、前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出する第5の処理と、前記第5の処理において抽出された前記複数の一塊のドット群の各々により示される符号を第二の符号としてOCR処理により認識する第6の処理と、前記第二の符号と前記基準符号データとを比較し、前記基準符号データと合致する第二の符号の数を求め、前記第二の符号の総数に対する当該数の割合を第二の割合として算出する第7の処理と、前記第一の割合が前記第二の割合より大きいか否かを判定する第8の処理と、前記第一の割合が前記第二の割合より大きい場合には、前記第一の符号を前記図面中の符号として選択し、前記第一の割合が前記第二の割合より大きくない場合には、前記第二の符号を前記図面中の符号として選択する第9の処理と、からなるものであるプログラムを提供する。
本発明は、第六の態様として、ドットにより表示された図面の画像データから当該図面中の符号をOCR処理により読み取る方法をコンピュータに実行させるためのプログラムであって、前記プログラムが前記コンピュータに実行させる処理は、前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出する第1の処理と、前記第1の処理において抽出された前記複数の一塊のドット群の各々により示される符号をOCR処理により認識する第2の処理と、基準となる符号からなり、予め作成された基準符号データと前記第2の処理において認識された符号とを比較し、前記基準符号データと合致する符号の数を求め、前記第2の処理において認識された符号の総数に対する当該数の割合を算出する第3の処理と、前記割合が予め定められた基準数より大きいか否かを判定する第4の処理と、前記割合が前記基準数より大きい場合には、前記第2の処理において認識された符号を前記図面中の符号として選択する第5の処理と、からなるものであるプログラムを提供する。
前記プログラムが前記コンピュータに実行させる処理は、前記第4の処理において、前記割合が予め定められた基準数より大きくない場合には、前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成する第6の処理と、前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出する第7の処理と、前記第7の処理において抽出された前記複数の一塊のドット群の各々により示される符号を前記図面中の符号としてOCR処理により認識する第8の処理と、をさらに備えるものであることが好ましい。
本発明に係る符号読み取り装置によれば、図面の画像データ中の符号が通常の向き(図2参照)であるか、横向き(図3参照)であるかを問わず、豆図面内の符号を正確に読み取ることが可能である。
さらに、本発明に係る符号読み取り装置100においては、正答率(認識された符号の総数に対する基準符号データと合致する符号の数の割合)を算出することにより、以下の効果を得ることができる。
本発明に係る符号読み取り装置においては、図面をスキャンすることにより得られた画像内の一塊のドット群を抽出しているが、この一塊のドット群が符号ではなく、図面に記載されている物の構成要素の一部であることがある。光学文字認識(OCR)装置はその一塊のドット群が符号であるのか、あるいは、物の構成要素の一部であるのかを認識する機能は有していないので、その一塊のドット群が符号ではなく、物の構成要素の一部である場合であっても、その一塊のドット群は何らかの符号に変換されることになる。
例えば、円形の孔が数字の「0」またはアルファベットの「O」に誤変換されたり、あるいは、短い直線が数字の「1」またはアルファベットの「I」に誤変換されるような場合である。
正答率は、図面に対応する明細書中に記載されている符号からなる基準符号データに基づいて算出されるものであるため、例えば、基準符号データ中にアルファベットの「O」や「I」が含まれていなければ、上記のような誤変換を防止することができる。また、基準符号データ中にアルファベットの「O」や「I」が含まれている場合であっても、二つの方向に対応する二つの正答率のうち大きい方の正答率に対応する方向において抽出された符号が選択されるため、誤変換による影響を排除することが可能である。
なお、上記の効果は、本発明に係る符号読み取り方法及び同方法を実行するためのプログラムによっても同様に得ることが可能である。
本発明の第一の実施形態に係る符号読み取り装置のブロック図である。 符号読み取り対象の文書としての図面の一例を示す平面図である。 符号読み取り対象の文書としての図面の一例を示す平面図である。 本発明の第一の実施形態に係る符号読み取り装置の動作を示すフローチャートである。 本発明の第二の実施形態に係る符号読み取り装置の動作を示すフローチャートである。
(第一の実施形態)
図1は本発明の第一の実施形態に係る符号読み取り装置100のブロック図である。
図1に示すように、本実施形態に係る符号読み取り装置100は、入力手段110と、制御手段120と、記憶手段130と、から構成されている。
入力手段110は制御手段120及び記憶手段130に接続されている。
入力手段110は、例えば、キーボードやマウスなどからなる。必要なデータや指示は入力手段110を介して制御手段120または記憶手段130に入力される。
制御手段120は、中央処理装置(CPU)121と、ROMからなる第一メモリ122と、RAMからなる第二メモリ123と、入力手段110を介して入力された各種命令及びデータを中央処理装置121に転送するための入力インターフェイス124と、中央処理装置121により実行された処理の結果を外部に出力する出力インターフェイス125と、中央処理装置121と第一メモリ122、第二メモリ123、入力インターフェイス124及び出力インターフェイス125の各々とを接続するバス126と、から構成されている。
第一メモリ122は中央処理装置121が実行する各種の制御用プログラムその他書き換え不能なデータを格納している。
第二メモリ123は様々なデータ及びパラメータを記憶しているとともに、中央処理装置121に対する作動領域を提供する、すなわち、中央処理装置121が各種の制御用プログラムを実行する上で一時的に必要とされるデータを格納している。
中央処理装置121は第一メモリ122からプログラムを読み出し、そのプログラムを実行する。すなわち、中央処理装置121は第一メモリ122に格納されているプログラムに従って作動する。本実施形態においては、第一メモリ122には、図面の符号を読み取る方法を中央処理装置121に実行させるためのプログラムが格納されており、中央処理装置121はこのプログラムに従って、後述するように、図面の符号を読み取る方法を実行する。
記憶手段130は制御手段120に対する外部メモリである。制御手段120が行った演算の結果その他データを記憶する。
表示手段140は、例えば、液晶ディスプレイからなり、制御手段120が行った演算の結果その他データを画面に表示する。
以上のような構成を有する本実施形態に係る符号読み取り装置100は以下のような動作を行う。
以下、本実施形態に係る符号読み取り装置100を用いて、明細書と図面とからなる特許出願用書類のうち図面内の符号を読み取るものとする。
図2及び図3は符号読み取り対象の文書としての図面の一例を示す。
図2に示される図面160Aは縦方向(上下方向)を向いている。すなわち、図面160Aは通常の向きであり、図面の頂部が上方を向いており、図中の符号(例えば、「120」)も左から右に向かって横方向に数字が配列されている。この場合、図面160Aを横方向X(例えば、左から右へ向かう方向)にスキャンすると、図中の符号「120」は正常な向きの符号として読み取ることができる。
これに対して、図3に示される図面160Bは横方向(左右方向)を向いている。すなわち、図面160Bは図の頂部が左側を向いており、同時に図中の符号も左側を向いている。すなわち、例えば、符号「220」はその中心の回りに反時計方向に90度回転した状態である。この場合、図面160Bを横方向X(左から右へ向かう方向)にスキャンすると、図中の符号「210」は正常な向きの符号としてではなく、横向きの符号として読み取られることになる。
図4は本実施形態に係る符号読み取り装置100の動作を示すフローチャートである。
最初に、基準符号データを作成する(ステップS110)。この基準符号データは、図面をスキャンすることにより得られた画像の比較対象となるものであり、その画像内の符号を読み取る際の基準となるデータである。
例えば、図面160A及び160Bに対応する明細書中に記載されている符号を抽出し、これを基準符号データとする。
この基準符号データは入力手段110を介して記憶手段130に入力され、記憶手段130に記憶されている。
次いで、中央処理装置121は、予め作成されている図面160Aまたは160Bの画像データを一方向(例えば、左から右へ向かう方向)においてスキャンし、この画像データ内の複数の一塊のドット群を抽出する(ステップS120)。
「一塊のドット群」とは、一定のサイズの領域内に固まって存在する複数のドットを指す。例えば、図面に描かれている直線は多数のドットが連続しており、一定のサイズの領域内に固まって存在することはない。このため、一定のサイズの領域内に固まって存在する一塊のドット群は符号を表すものである可能性が大きい。このため、図面内の直線画像を排除できるように一定のサイズを予め設定し、そのサイズまたはそのサイズ以下のサイズの領域内に存在するドット群のみを抽出することとしている。
この後、中央処理装置121は、抽出された複数の一塊のドット群の各々により示される符号を第一の符号としてOCR処理により認識する(ステップS130)。
次いで、中央処理装置121は、第一の符号と基準符号データとを比較し、基準符号データと合致する第一の符号の数A1を求める。その後、第一の符号の総数B1に対する数A1の割合を第一の正答率S1として算出する(ステップS140)。
S1=A1/B1
次いで、中央処理装置121は、複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し(ステップS150)、第二の画像データを作成する(ステップS160)。この第二の画像データは当初の画像データに対してXY軸座標変換がなされたものに相当する。
中央処理装置121は、第二の画像データを一方向(ステップS120におけるスキャンの方向と同一の方向)においてスキャンし、第二の画像データ内の複数の一塊のドット群を抽出する(ステップS170)。
次いで、中央処理装置121は、第二の画像データから抽出された複数の一塊のドット群の各々により示される符号を第二の符号としてOCR処理により認識する(ステップS180)。
ステップS140の場合と同様に、中央処理装置121は、第二の符号と基準符号データとを比較し、基準符号データと合致する第二の符号の数A2を求め、第二の符号の総数B2に対する数A2の割合を第二の正答率S2として算出する(ステップS190)。
S2=A2/B2
次いで、中央処理装置121は、第一の正答率S1が第二の正答率S2より大きいか否かを判定する(ステップS200)。
第一の正答率S1が第二の正答率S2より大きい場合(ステップS200のYES)には、中央処理装置121は、第一の符号を図面中に記載されている符号として選択する(ステップS210)。
これに対して、第一の正答率S1が第二の正答率S2より大きくない場合には、中央処理装置121は、第二の符号を図面中に記載されている符号として選択する(ステップS220)。
以上のように、本実施形態に係る符号読み取り装置100によれば、図面の画像データ中の符号が通常の向き(図2参照)であるか、横向き(図3参照)であるかを問わず、豆図面内の符号を正確に読み取ることが可能である。
さらに、本実施形態に係る符号読み取り装置100においては、正答率S1及びS2を算出することにより、以下の効果を得ることができる。
本実施形態に係る符号読み取り装置100においては、図面をスキャンすることにより得られた画像内の一塊のドット群を抽出しているが、この一塊のドット群が符号ではなく、図面に記載されている物の構成要素の一部であることがある。光学文字認識(OCR)装置はその一塊のドット群が符号であるのか、あるいは、物の構成要素の一部であるのかを認識する機能は有していないので、その一塊のドット群が符号ではなく、物の構成要素の一部である場合であっても、その一塊のドット群は何らかの符号に変換されることになる。
例えば、円形の孔が数字の「0」またはアルファベットの「O」に誤変換されたり、あるいは、短い直線が数字の「1」またはアルファベットの「I」に誤変換されるような場合である。
正答率は、図面に対応する明細書中に記載されている符号からなる基準符号データに基づいて算出されるものであるため、例えば、基準符号データ中にアルファベットの「O」や「I」が含まれていなければ、上記のような誤変換を防止することができる。また、基準符号データ中にアルファベットの「O」や「I」が含まれている場合であっても、二つの方向に対応する二つの正答率のうち大きい方の正答率に対応する方向において抽出された符号が選択されるため、誤変換による影響を排除することが可能である。
(第二の実施形態)
本発明の第二の実施形態に係る符号読み取り装置は第一の実施形態に係る符号読み取り装置100と同一の構造を有しているが、以下に述べるように、本実施形態における中央処理装置121は第一の実施形態に係る符号読み取り装置100における中央処理装置121とは異なる動作を実施する。
図5は本実施形態に係る符号読み取り装置の動作を示すフローチャートである。
最初に、第一の実施形態の場合と同様に、基準符号データを作成する(ステップS210)。基準符号データは入力手段110を介して記憶手段130に入力され、記憶手段130に記憶される。
次いで、中央処理装置121は、予め作成されている図面160Aまたは160Bの画像データを一方向(例えば、右から左へ向かう方向)においてスキャンし、この画像データ内の複数の一塊のドット群を抽出する(ステップS220)。
この後、中央処理装置121は、抽出された複数の一塊のドット群の各々により示される符号を第一の符号としてOCR処理により認識する(ステップS230)。
次いで、中央処理装置121は、第一の符号と基準符号データとを比較し、基準符号データと合致する第一の符号の数A1を求める。その後、第一の符号の総数B1に対する数A1の割合を正答率Sとして算出する(ステップS240)。
S=A1/B1
次いで、中央処理装置121は正答率Sが予め定めた基準数Zと等しいか、あるいは、基準数Zより大きいか否かを判定する(ステップS250)。
基準数Zとは、正答率Sがそれと等しいか、あるいは、それよりも大きければ、図面のスキャン方向が符号の正常の向きと同一であると判定することができる基準となる数である。基準数Zは、予め図面を特定の方向にスキャンすることにより得られたデータに基づいて、予め設定される。例えば、基準数Zは0.75から0.85の範囲内に設定される。
正答率Sが基準数Zと等しいか、あるいは、基準数Zより大きい場合には(ステップS250のYES)、制御手段120の中央処理装置121は第一の符号を図面内の符号と判定する(ステップS260)。
これに対して、正答率Sが基準数Zより小さい場合には(ステップS260のNO)、中央処理装置121は図面のスキャン方向と符号の向きが一致していないものと判定し、複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成する(ステップS270)。この第二の画像データは当初の画像データに対してXY軸座標変換がなされたものに相当する。
中央処理装置121は、第二の画像データを一方向(ステップS220におけるスキャンの方向と同一の方向)においてスキャンし、第二の画像データ内の複数の一塊のドット群を抽出する(ステップS280)。
次いで、中央処理装置121は、第二の画像データから抽出された複数の一塊のドット群の各々により示される符号を図面中の符号としてOCR処理により認識する(ステップS290)。
以上のように、本実施形態に係る符号読み取り装置によれば、第一の実施形態に係る符号読み取り装置100の場合と同様に、図面の画像データ中の符号が通常の向き(図2参照)であるか、横向き(図3参照)であるかを問わず、豆図面内の符号を正確に読み取ることが可能である。
また、本実施形態に係る符号読み取り装置においては、第一の実施形態とは異なり、二つの正答率を算出する必要がないため、制御手段120の処理量を軽減させることができる。
第一及び第二の実施形態に係る符号読み取り装置は上記の構造に限定されるものではなく、種々の改変が可能である。
第一及び第二の実施形態に係る符号読み取り装置においては、図面160A及び160Bを対象として数字の抽出を行ったが、第一及び第二の実施形態に係る符号読み取り装置は図面の他に数字が記載されている全ての文書を対象とすることができる。
また、第一及び第二の実施形態に係る符号読み取り装置は、アラビア数字のみならず、アルファベットその他の外国語文字、ギリシャ数字など任意の記号を対象とすることができる。
100 本発明の第一の実施形態に係る符号抽出装置
110 入力手段
120 制御手段
130 記憶手段

Claims (13)

  1. ドットにより表示された図面の画像データから当該図面中の符号をOCR処理により読み取る方法であって、
    基準となる符号からなる基準符号データを作成する第一の過程と、
    前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出する第二の過程と、
    前記第二の過程において抽出された前記複数の一塊のドット群の各々により示される符号を第一の符号としてOCR処理により認識する第三の過程と、
    前記第一の符号と前記基準符号データとを比較し、前記基準符号データと合致する第一の符号の数を求め、前記第一の符号の総数に対する当該数の割合を第一の割合として算出する第四の過程と、
    前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成する第五の過程と、
    前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出する第六の過程と、
    前記第六の過程において抽出された前記複数の一塊のドット群の各々により示される符号を第二の符号としてOCR処理により認識する第七の過程と、
    前記第二の符号と前記基準符号データとを比較し、前記基準符号データと合致する第二の符号の数を求め、前記第二の符号の総数に対する当該数の割合を第二の割合として算出する第八の過程と、
    前記第一の割合が前記第二の割合より大きいか否かを判定する第九の過程と、
    前記第一の割合が前記第二の割合より大きい場合には、前記第一の符号を前記図面中の符号として選択し、前記第一の割合が前記第二の割合より大きくない場合には、前記第二の符号を前記図面中の符号として選択する第十の過程と、
    を備える方法。
  2. ドットにより表示された図面の画像データから当該図面中の符号をOCR処理により読み取る方法であって、
    基準となる符号からなる基準符号データを作成する第一の過程と、
    前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出する第二の過程と、
    前記第二の過程において抽出された前記複数の一塊のドット群の各々により示される符号をOCR処理により認識する第三の過程と、
    前記第三の過程において認識された符号と前記基準符号データとを比較し、前記基準符号データと合致する符号の数を求め、前記第三の過程において認識された符号の総数に対する当該数の割合を算出する第四の過程と、
    前記割合が予め定められた基準数より大きいか否かを判定する第五の過程と、
    前記割合が前記基準数より大きい場合には、前記第三の過程において認識された符号を前記図面中の符号として選択する第六の過程と、
    を備える方法。
  3. 前記第五の過程において、前記割合が予め定められた基準数より大きくない場合には、前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成する第七の過程と、
    前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出する第八の過程と、
    前記第八の過程において抽出された前記複数の一塊のドット群の各々により示される符号を前記図面中の符号としてOCR処理により認識する第九の過程と、
    を備える請求項2に記載の方法。
  4. 前記図面と対応する文書がある場合において、前記基準符号データは前記文書から抽出されるものであることを特徴とする請求項1乃至3の何れか一項に記載の方法。
  5. 前記図面は特許出願用または実用新案登録出願用の図面であり、前記文書は特許出願用または実用新案登録出願用の明細書であることを特徴とする請求項4に記載の方法。
  6. ドットにより表示された図面の画像データから当該図面中の符号をOCR処理により読み取る符号読み取り装置であって、
    入力手段と、制御手段と、記憶手段と、からなり、
    前記記憶手段は、前記入力手段を介して入力された、予め作成されたデータであって、基準となる符号からなる基準符号データを記憶しており、
    前記制御手段は、
    前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出し、
    抽出された前記複数の一塊のドット群の各々により示される符号を第一の符号としてOCR処理により認識し、
    前記第一の符号と前記基準符号データとを比較し、前記基準符号データと合致する第一の符号の数を求め、前記第一の符号の総数に対する当該数の割合を第一の割合として算出し、
    前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成し、
    前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出し、
    前記第二の画像データ内の複数の一塊のドット群の各々により示される符号を第二の符号としてOCR処理により認識し、
    前記第二の符号と前記基準符号データとを比較し、前記基準符号データと合致する第二の符号の数を求め、前記第二の符号の総数に対する当該数の割合を第二の割合として算出し、
    前記第一の割合が前記第二の割合より大きいか否かを判定し、
    前記第一の割合が前記第二の割合より大きい場合には、前記第一の符号を前記図面中の符号として選択し、前記第一の割合が前記第八の第二の割合より大きくない場合には、前記第二の符号を前記図面中の符号として選択するものである符号読み取り装置。
  7. ドットにより表示された図面の画像データから当該図面中の符号をOCR処理により読み取る符号読み取り装置であって、
    入力手段と、制御手段と、記憶手段と、からなり、
    前記記憶手段は、前記入力手段を介して入力された、予め作成されたデータであって、基準となる符号からなる基準符号データを記憶しており、
    前記制御手段は、
    前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出し、
    抽出された前記複数の一塊のドット群の各々により示される符号を第一の符号としてOCR処理により認識し、
    前記第一の符号と前記基準符号データとを比較し、前記基準符号データと合致する第一の符号の数を求め、前記第一の符号の総数に対する当該数の割合を算出し、
    前記割合が予め定められた基準数より大きいか否かを判定し、
    前記割合が前記基準数より大きい場合には、前記第一の符号を前記図面中の符号として選択するものである符号読み取り装置。
  8. 前記制御手段は、
    前記割合が予め定められた基準数より大きくない場合には、前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成し、
    前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出し、
    抽出された前記複数の一塊のドット群の各々により示される符号を前記図面中の符号としてOCR処理により認識するものであることを特徴とする請求項7に記載の符号読み取り装置。
  9. ドットにより表示された図面の画像データから当該図面中の符号をOCR処理により読み取る方法をコンピュータに実行させるためのプログラムであって、
    前記プログラムが前記コンピュータに実行させる処理は、
    前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出する第1の処理と、
    前記第1の処理において抽出された前記複数の一塊のドット群の各々により示される符号を第一の符号としてOCR処理により認識する第2の処理と、
    基準となる符号からなり、予め作成された基準符号データと前記第一の符号とを比較し、前記基準符号データと合致する第一の符号の数を求め、前記第一の符号の総数に対する当該数の割合を第一の割合として算出する第3の処理と、
    前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成する第4の処理と、
    前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出する第5の処理と、
    前記第5の処理において抽出された前記複数の一塊のドット群の各々により示される符号を第二の符号としてOCR処理により認識する第6の処理と、
    前記第二の符号と前記基準符号データとを比較し、前記基準符号データと合致する第二の符号の数を求め、前記第二の符号の総数に対する当該数の割合を第二の割合として算出する第7の処理と、
    前記第一の割合が前記第二の割合より大きいか否かを判定する第8の処理と、
    前記第一の割合が前記第二の割合より大きい場合には、前記第一の符号を前記図面中の符号として選択し、前記第一の割合が前記第二の割合より大きくない場合には、前記第二の符号を前記図面中の符号として選択する第9の処理と、
    からなるものであるプログラム。
  10. ドットにより表示された図面の画像データから当該図面中の符号をOCR処理により読み取る方法をコンピュータに実行させるためのプログラムであって、
    前記プログラムが前記コンピュータに実行させる処理は、
    前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出する第1の処理と、
    前記第1の処理において抽出された前記複数の一塊のドット群の各々により示される符号をOCR処理により認識する第2の処理と、
    基準となる符号からなり、予め作成された基準符号データと前記第2の処理において認識された符号とを比較し、前記基準符号データと合致する符号の数を求め、前記第2の処理において認識された符号の総数に対する当該数の割合を算出する第3の処理と、
    前記割合が予め定められた基準数より大きいか否かを判定する第4の処理と、
    前記割合が前記基準数より大きい場合には、前記第2の処理において認識された符号を前記図面中の符号として選択する第5の処理と、
    からなるものであるプログラム。
  11. 前記プログラムが前記コンピュータに実行させる処理は、
    前記第4の処理において、前記割合が予め定められた基準数より大きくない場合には、前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成する第6の処理と、
    前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出する第7の処理と、
    前記第7の処理において抽出された前記複数の一塊のドット群の各々により示される符号を前記図面中の符号としてOCR処理により認識する第8の処理と、
    をさらに備えるものであることを特徴とする請求項10に記載のプログラム。
  12. 前記図面と対応する文書がある場合において、前記基準符号データは前記文書から抽出されるものであることを特徴とする請求項10または11に記載のプログラム。
  13. 前記図面は特許出願用または実用新案登録出願用の図面であり、前記文書は特許出願用または実用新案登録出願用の明細書であることを特徴とする請求項12に記載のプログラム。
JP2014091361A 2014-04-25 2014-04-25 符号読み取り方法及び装置 Pending JP2015210636A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014091361A JP2015210636A (ja) 2014-04-25 2014-04-25 符号読み取り方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014091361A JP2015210636A (ja) 2014-04-25 2014-04-25 符号読み取り方法及び装置

Publications (1)

Publication Number Publication Date
JP2015210636A true JP2015210636A (ja) 2015-11-24

Family

ID=54612780

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014091361A Pending JP2015210636A (ja) 2014-04-25 2014-04-25 符号読み取り方法及び装置

Country Status (1)

Country Link
JP (1) JP2015210636A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020030820A (ja) * 2018-08-20 2020-02-27 アイビーリサーチ株式会社 文献解析装置、文献解析方法、文献解析プログラム及び文献解析システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020030820A (ja) * 2018-08-20 2020-02-27 アイビーリサーチ株式会社 文献解析装置、文献解析方法、文献解析プログラム及び文献解析システム

Similar Documents

Publication Publication Date Title
KR102435365B1 (ko) 증명서 인식 방법 및 장치, 전자 기기, 컴퓨터 판독 가능한 저장 매체
JP5616308B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法
JP4694613B2 (ja) 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体
US20150262030A1 (en) Image processing device, image processing method, and image processing program
US20140184610A1 (en) Shaping device and shaping method
US9171218B2 (en) Image processing apparatus, image processing method, and computer readable medium that recognize overlapping elements in handwritten input
JP6000992B2 (ja) 文書ファイル生成装置及び文書ファイル生成方法
US11568623B2 (en) Image processing apparatus, image processing method, and storage medium
JP5538812B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2019159633A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP2015210636A (ja) 符号読み取り方法及び装置
US20230027065A1 (en) Image processing apparatus, image processing method, and non-transitory recording medium
CN111476090A (zh) 水印识别方法和装置
KR20160053544A (ko) 후보 문자의 추출 방법
JP2020087112A (ja) 帳票処理装置および帳票処理方法
US20210019554A1 (en) Information processing device and information processing method
JP2009080727A (ja) 翻訳装置及びプログラム
JP2008027133A (ja) 帳票処理装置及び帳票処理方法ならびに帳票処理方法を実行するプログラムと記憶媒体
US11611678B2 (en) Image processing apparatus and non-transitory computer readable medium
JP2017102587A (ja) 情報処理装置、画像読み取り装置、画像形成装置、および、プログラム
JP5039659B2 (ja) 文字認識方法及び文字認識装置
JP7496715B2 (ja) 仕様情報生成装置、仕様情報生成方法およびプログラム
JP7234554B2 (ja) 情報処理装置及びプログラム
JP7243097B2 (ja) 情報処理装置及びプログラム
JP5176390B2 (ja) 文字入力装置及びコンピュータプログラム