JP2015210636A

JP2015210636A - 符号読み取り方法及び装置

Info

Publication number: JP2015210636A
Application number: JP2014091361A
Authority: JP
Inventors: 博志田村; Hiroshi Tamura
Original assignee: IB Research KK
Current assignee: IB Research KK
Priority date: 2014-04-25
Filing date: 2014-04-25
Publication date: 2015-11-24

Abstract

【課題】図面をスキャンすることにより得られた画像データから当該図面中の符号を正確に認識する。
【解決手段】ドットにより表示された図面の画像データから当該図面中の符号をＯＣＲ処理により読み取る符号読み取り装置(100)は入力手段(110)と制御手段(120)と記憶手段(130)とからなる。制御手段は、画像データを一方向においてスキャンし、画像データ内の複数の一塊のドット群を抽出し、抽出された複数の一塊のドット群の各々が示す符号を第一の符号としてＯＣＲ処理により認識し、第一の符号と予め定められた基準符号データとを比較し、基準符号データと合致する第一の符号の数を求め、第一の符号の総数に対する当該数の割合を算出し、この割合が予め定められた基準数より大きいか否かを判定し、この割合が基準数より大きい場合には、第一の符号を前記図面中の符号として選択する。
【選択図】図１

Description

本発明は、文書、特に図面をスキャンした場合に、当該図面中に含まれる符号を読み取る方法、装置及びプログラムに関する。

文書をスキャンにより読み取る装置として特開２０１３−９２９１６号公報（特許文献１）に記載されている知的財産管理装置がある。

この知的財産管理装置は、明細書及び図面を含む特許出願書類におけるこれらの明細書及び図面のデータを入力する入力部と、図面から符号（数字またはアルファベット）を抽出するとともに、明細書からその符号に対応する名称を抽出する制御部と、制御部が抽出した名称を当該名称に対応する符号とともに図面上に表示する表示部と、を備えている。

通常、特許出願書類の図面には符号のみが示されているが、上記の知的財産管理装置を用いることにより、表示部には、符号とともに当該符号に対応する名称が表示されるため、図面上においてその符号に対応する名称をそのつど明細書を参照して確認することが不要となり、さらに、明細書を読む際にも図面を参照することが容易になる。

特開２０１３−９２９１６号公報

図面に記載されている符号を読み取る装置としては光学文字認識（ＯＣＲ：ＯｐｔｉｃａｌＣｈａｒａｃｔｅｒＲｅｃｏｇｎｉｔｉｏｎ）装置が用いられる。

具体的には、プリントアウトされた図面をスキャナーで読み取り、図面の内容をディジタルデータ化し、光学文字認識装置を用いてこのディジタルデータから図面内の符号を読み取る。

例えば、公開特許公報に記載されている図面をスキャンする場合、通常は図面の縦方向（上下方向）にスキャンが行われる。ただ、同公報には図面が横向きに掲載されている場合がある。具体的には、図面の頂部が左側を向いて掲載されている場合である。この場合には、図面内の符号も全て横向きに掲載される。このため、図面のスキャンは図面の縦方向（上下方向）及び横方向（左右方向）の両方向において実施される。

しかしながら、一旦図面のスキャンが実施された後においては、スキャンにより得られた画像が縦方向のスキャンによる画像であるか、横方向のスキャンによる画像であるか、判別が極めて困難もしくは不可能であるという問題がある。この判別を正確に行うことができないと、例えば、縦方向のスキャンにより得られた画像と横方向用の画像基準データとを比較することが起こり得るため、画像内の符号を正確に認識することができなくなるという結果になる。

本発明はこのような従来のスキャニングにおける問題点に鑑みてなされたものであり、図面をスキャンすることにより得られた画像データから当該図面中の符号を正確に認識することを可能にする符号読み取り方法、符号読み取り装置及び同方法を実施するプログラムを提供することを目的とする。

上記の目的を達成するため、本発明は、第一の態様として、ドットにより表示された図面の画像データから当該図面中の符号をＯＣＲ処理により読み取る方法であって、基準となる符号からなる基準符号データを作成する第一の過程と、前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出する第二の過程と、前記第二の過程において抽出された前記複数の一塊のドット群の各々により示される符号を第一の符号としてＯＣＲ処理により認識する第三の過程と、前記第一の符号と前記基準符号データとを比較し、前記基準符号データと合致する第一の符号の数を求め、前記第一の符号の総数に対する当該数の割合を第一の割合として算出する第四の過程と、前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成する第五の過程と、前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出する第六の過程と、前記第六の過程において抽出された前記複数の一塊のドット群の各々により示される符号を第二の符号としてＯＣＲ処理により認識する第七の過程と、前記第二の符号と前記基準符号データとを比較し、前記基準符号データと合致する第二の符号の数を求め、前記第二の符号の総数に対する当該数の割合を第二の割合として算出する第八の過程と、前記第一の割合が前記第二の割合より大きいか否かを判定する第九の過程と、前記第一の割合が前記第二の割合より大きい場合には、前記第一の符号を前記図面中の符号として選択し、前記第一の割合が前記第二の割合より大きくない場合には、前記第二の符号を前記図面中の符号として選択する第十の過程と、を備える方法を提供する。

さらに、本発明は、第二の態様として、ドットにより表示された図面の画像データから当該図面中の符号をＯＣＲ処理により読み取る方法であって、基準となる符号からなる基準符号データを作成する第一の過程と、前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出する第二の過程と、前記第二の過程において抽出された前記複数の一塊のドット群の各々により示される符号をＯＣＲ処理により認識する第三の過程と、前記第三の過程において認識された符号と前記基準符号データとを比較し、前記基準符号データと合致する符号の数を求め、前記第三の過程において認識された符号の総数に対する当該数の割合を算出する第四の過程と、前記割合が予め定められた基準数より大きいか否かを判定する第五の過程と、前記割合が前記基準数より大きい場合には、前記第三の過程において認識された符号を前記図面中の符号として選択する第六の過程と、を備える方法を提供する。

上記の本発明に係る方法は、前記第五の過程において、前記割合が予め定められた基準数より大きくない場合には、前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成する第七の過程と、前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出する第八の過程と、前記第八の過程において抽出された前記複数の一塊のドット群の各々により示される符号を前記図面中の符号としてＯＣＲ処理により認識する第九の過程と、をさらに備えることが好ましい。

前記図面と対応する文書がある場合において、前記基準符号データは前記文書から抽出されるものであることが好ましい。

前記図面は特許出願用または実用新案登録出願用の図面であり、前記文書は特許出願用または実用新案登録出願用の明細書であることが好ましい。

本発明は、第三の態様として、ドットにより表示された図面の画像データから当該図面中の符号をＯＣＲ処理により読み取る符号読み取り装置であって、入力手段と、制御手段と、記憶手段と、からなり、前記記憶手段は、前記入力手段を介して入力された、予め作成されたデータであって、基準となる符号からなる基準符号データを記憶しており、前記制御手段は、前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出し、抽出された前記複数の一塊のドット群の各々により示される符号を第一の符号としてＯＣＲ処理により認識し、前記第一の符号と前記基準符号データとを比較し、前記基準符号データと合致する第一の符号の数を求め、前記第一の符号の総数に対する当該数の割合を第一の割合として算出し、前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成し、前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出し、前記第二の画像データ内の複数の一塊のドット群の各々により示される符号を第二の符号としてＯＣＲ処理により認識し、前記第二の符号と前記基準符号データとを比較し、前記基準符号データと合致する第二の符号の数を求め、前記第二の符号の総数に対する当該数の割合を第二の割合として算出し、前記第一の割合が前記第二の割合より大きいか否かを判定し、前記第一の割合が前記第二の割合より大きい場合には、前記第一の符号を前記図面中の符号として選択し、前記第一の割合が前記第八の第二の割合より大きくない場合には、前記第二の符号を前記図面中の符号として選択するものである符号読み取り装置を提供する。

本発明は、第四の態様として、ドットにより表示された図面の画像データから当該図面中の符号をＯＣＲ処理により読み取る符号読み取り装置であって、入力手段と、制御手段と、記憶手段と、からなり、前記記憶手段は、前記入力手段を介して入力された、予め作成されたデータであって、基準となる符号からなる基準符号データを記憶しており、前記制御手段は、前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出し、抽出された前記複数の一塊のドット群の各々により示される符号を第一の符号としてＯＣＲ処理により認識し、前記第一の符号と前記基準符号データとを比較し、前記基準符号データと合致する第一の符号の数を求め、前記第一の符号の総数に対する当該数の割合を算出し、前記割合が予め定められた基準数より大きいか否かを判定し、前記割合が前記基準数より大きい場合には、前記第一の符号を前記図面中の符号として選択するものである符号読み取り装置を提供する。

上記の本発明に係る符号読み取り装置における前記制御手段は、前記割合が予め定められた基準数より大きくない場合には、前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成し、前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出し、抽出された前記複数の一塊のドット群の各々により示される符号を前記図面中の符号としてＯＣＲ処理により認識するものであることが好ましい。

本発明は、第五の態様として、ドットにより表示された図面の画像データから当該図面中の符号をＯＣＲ処理により読み取る方法をコンピュータに実行させるためのプログラムであって、前記プログラムが前記コンピュータに実行させる処理は、前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出する第１の処理と、前記第１の処理において抽出された前記複数の一塊のドット群の各々により示される符号を第一の符号としてＯＣＲ処理により認識する第２の処理と、基準となる符号からなり、予め作成された基準符号データと前記第一の符号とを比較し、前記基準符号データと合致する第一の符号の数を求め、前記第一の符号の総数に対する当該数の割合を第一の割合として算出する第３の処理と、前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成する第４の処理と、前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出する第５の処理と、前記第５の処理において抽出された前記複数の一塊のドット群の各々により示される符号を第二の符号としてＯＣＲ処理により認識する第６の処理と、前記第二の符号と前記基準符号データとを比較し、前記基準符号データと合致する第二の符号の数を求め、前記第二の符号の総数に対する当該数の割合を第二の割合として算出する第７の処理と、前記第一の割合が前記第二の割合より大きいか否かを判定する第８の処理と、前記第一の割合が前記第二の割合より大きい場合には、前記第一の符号を前記図面中の符号として選択し、前記第一の割合が前記第二の割合より大きくない場合には、前記第二の符号を前記図面中の符号として選択する第９の処理と、からなるものであるプログラムを提供する。

本発明は、第六の態様として、ドットにより表示された図面の画像データから当該図面中の符号をＯＣＲ処理により読み取る方法をコンピュータに実行させるためのプログラムであって、前記プログラムが前記コンピュータに実行させる処理は、前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出する第１の処理と、前記第１の処理において抽出された前記複数の一塊のドット群の各々により示される符号をＯＣＲ処理により認識する第２の処理と、基準となる符号からなり、予め作成された基準符号データと前記第２の処理において認識された符号とを比較し、前記基準符号データと合致する符号の数を求め、前記第２の処理において認識された符号の総数に対する当該数の割合を算出する第３の処理と、前記割合が予め定められた基準数より大きいか否かを判定する第４の処理と、前記割合が前記基準数より大きい場合には、前記第２の処理において認識された符号を前記図面中の符号として選択する第５の処理と、からなるものであるプログラムを提供する。

前記プログラムが前記コンピュータに実行させる処理は、前記第４の処理において、前記割合が予め定められた基準数より大きくない場合には、前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成する第６の処理と、前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出する第７の処理と、前記第７の処理において抽出された前記複数の一塊のドット群の各々により示される符号を前記図面中の符号としてＯＣＲ処理により認識する第８の処理と、をさらに備えるものであることが好ましい。

本発明に係る符号読み取り装置によれば、図面の画像データ中の符号が通常の向き（図２参照）であるか、横向き（図３参照）であるかを問わず、豆図面内の符号を正確に読み取ることが可能である。

さらに、本発明に係る符号読み取り装置１００においては、正答率（認識された符号の総数に対する基準符号データと合致する符号の数の割合）を算出することにより、以下の効果を得ることができる。

本発明に係る符号読み取り装置においては、図面をスキャンすることにより得られた画像内の一塊のドット群を抽出しているが、この一塊のドット群が符号ではなく、図面に記載されている物の構成要素の一部であることがある。光学文字認識（ＯＣＲ）装置はその一塊のドット群が符号であるのか、あるいは、物の構成要素の一部であるのかを認識する機能は有していないので、その一塊のドット群が符号ではなく、物の構成要素の一部である場合であっても、その一塊のドット群は何らかの符号に変換されることになる。

例えば、円形の孔が数字の「０」またはアルファベットの「Ｏ」に誤変換されたり、あるいは、短い直線が数字の「１」またはアルファベットの「Ｉ」に誤変換されるような場合である。

正答率は、図面に対応する明細書中に記載されている符号からなる基準符号データに基づいて算出されるものであるため、例えば、基準符号データ中にアルファベットの「Ｏ」や「Ｉ」が含まれていなければ、上記のような誤変換を防止することができる。また、基準符号データ中にアルファベットの「Ｏ」や「Ｉ」が含まれている場合であっても、二つの方向に対応する二つの正答率のうち大きい方の正答率に対応する方向において抽出された符号が選択されるため、誤変換による影響を排除することが可能である。

なお、上記の効果は、本発明に係る符号読み取り方法及び同方法を実行するためのプログラムによっても同様に得ることが可能である。

本発明の第一の実施形態に係る符号読み取り装置のブロック図である。符号読み取り対象の文書としての図面の一例を示す平面図である。符号読み取り対象の文書としての図面の一例を示す平面図である。本発明の第一の実施形態に係る符号読み取り装置の動作を示すフローチャートである。本発明の第二の実施形態に係る符号読み取り装置の動作を示すフローチャートである。

（第一の実施形態）
図１は本発明の第一の実施形態に係る符号読み取り装置１００のブロック図である。

図１に示すように、本実施形態に係る符号読み取り装置１００は、入力手段１１０と、制御手段１２０と、記憶手段１３０と、から構成されている。

入力手段１１０は制御手段１２０及び記憶手段１３０に接続されている。

入力手段１１０は、例えば、キーボードやマウスなどからなる。必要なデータや指示は入力手段１１０を介して制御手段１２０または記憶手段１３０に入力される。

制御手段１２０は、中央処理装置（ＣＰＵ）１２１と、ＲＯＭからなる第一メモリ１２２と、ＲＡＭからなる第二メモリ１２３と、入力手段１１０を介して入力された各種命令及びデータを中央処理装置１２１に転送するための入力インターフェイス１２４と、中央処理装置１２１により実行された処理の結果を外部に出力する出力インターフェイス１２５と、中央処理装置１２１と第一メモリ１２２、第二メモリ１２３、入力インターフェイス１２４及び出力インターフェイス１２５の各々とを接続するバス１２６と、から構成されている。

第一メモリ１２２は中央処理装置１２１が実行する各種の制御用プログラムその他書き換え不能なデータを格納している。

第二メモリ１２３は様々なデータ及びパラメータを記憶しているとともに、中央処理装置１２１に対する作動領域を提供する、すなわち、中央処理装置１２１が各種の制御用プログラムを実行する上で一時的に必要とされるデータを格納している。

中央処理装置１２１は第一メモリ１２２からプログラムを読み出し、そのプログラムを実行する。すなわち、中央処理装置１２１は第一メモリ１２２に格納されているプログラムに従って作動する。本実施形態においては、第一メモリ１２２には、図面の符号を読み取る方法を中央処理装置１２１に実行させるためのプログラムが格納されており、中央処理装置１２１はこのプログラムに従って、後述するように、図面の符号を読み取る方法を実行する。

記憶手段１３０は制御手段１２０に対する外部メモリである。制御手段１２０が行った演算の結果その他データを記憶する。

表示手段１４０は、例えば、液晶ディスプレイからなり、制御手段１２０が行った演算の結果その他データを画面に表示する。

以上のような構成を有する本実施形態に係る符号読み取り装置１００は以下のような動作を行う。

以下、本実施形態に係る符号読み取り装置１００を用いて、明細書と図面とからなる特許出願用書類のうち図面内の符号を読み取るものとする。

図２及び図３は符号読み取り対象の文書としての図面の一例を示す。

図２に示される図面１６０Ａは縦方向（上下方向）を向いている。すなわち、図面１６０Ａは通常の向きであり、図面の頂部が上方を向いており、図中の符号（例えば、「１２０」）も左から右に向かって横方向に数字が配列されている。この場合、図面１６０Ａを横方向Ｘ（例えば、左から右へ向かう方向）にスキャンすると、図中の符号「１２０」は正常な向きの符号として読み取ることができる。

これに対して、図３に示される図面１６０Ｂは横方向（左右方向）を向いている。すなわち、図面１６０Ｂは図の頂部が左側を向いており、同時に図中の符号も左側を向いている。すなわち、例えば、符号「２２０」はその中心の回りに反時計方向に９０度回転した状態である。この場合、図面１６０Ｂを横方向Ｘ（左から右へ向かう方向）にスキャンすると、図中の符号「２１０」は正常な向きの符号としてではなく、横向きの符号として読み取られることになる。

図４は本実施形態に係る符号読み取り装置１００の動作を示すフローチャートである。

最初に、基準符号データを作成する（ステップＳ１１０）。この基準符号データは、図面をスキャンすることにより得られた画像の比較対象となるものであり、その画像内の符号を読み取る際の基準となるデータである。

例えば、図面１６０Ａ及び１６０Ｂに対応する明細書中に記載されている符号を抽出し、これを基準符号データとする。

この基準符号データは入力手段１１０を介して記憶手段１３０に入力され、記憶手段１３０に記憶されている。

次いで、中央処理装置１２１は、予め作成されている図面１６０Ａまたは１６０Ｂの画像データを一方向（例えば、左から右へ向かう方向）においてスキャンし、この画像データ内の複数の一塊のドット群を抽出する（ステップＳ１２０）。

「一塊のドット群」とは、一定のサイズの領域内に固まって存在する複数のドットを指す。例えば、図面に描かれている直線は多数のドットが連続しており、一定のサイズの領域内に固まって存在することはない。このため、一定のサイズの領域内に固まって存在する一塊のドット群は符号を表すものである可能性が大きい。このため、図面内の直線画像を排除できるように一定のサイズを予め設定し、そのサイズまたはそのサイズ以下のサイズの領域内に存在するドット群のみを抽出することとしている。

この後、中央処理装置１２１は、抽出された複数の一塊のドット群の各々により示される符号を第一の符号としてＯＣＲ処理により認識する（ステップＳ１３０）。

次いで、中央処理装置１２１は、第一の符号と基準符号データとを比較し、基準符号データと合致する第一の符号の数Ａ１を求める。その後、第一の符号の総数Ｂ１に対する数Ａ１の割合を第一の正答率Ｓ１として算出する（ステップＳ１４０）。

Ｓ１＝Ａ１／Ｂ１

次いで、中央処理装置１２１は、複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し（ステップＳ１５０）、第二の画像データを作成する（ステップＳ１６０）。この第二の画像データは当初の画像データに対してＸＹ軸座標変換がなされたものに相当する。

中央処理装置１２１は、第二の画像データを一方向（ステップＳ１２０におけるスキャンの方向と同一の方向）においてスキャンし、第二の画像データ内の複数の一塊のドット群を抽出する（ステップＳ１７０）。

次いで、中央処理装置１２１は、第二の画像データから抽出された複数の一塊のドット群の各々により示される符号を第二の符号としてＯＣＲ処理により認識する（ステップＳ１８０）。

ステップＳ１４０の場合と同様に、中央処理装置１２１は、第二の符号と基準符号データとを比較し、基準符号データと合致する第二の符号の数Ａ２を求め、第二の符号の総数Ｂ２に対する数Ａ２の割合を第二の正答率Ｓ２として算出する（ステップＳ１９０）。

Ｓ２＝Ａ２／Ｂ２

次いで、中央処理装置１２１は、第一の正答率Ｓ１が第二の正答率Ｓ２より大きいか否かを判定する（ステップＳ２００）。

第一の正答率Ｓ１が第二の正答率Ｓ２より大きい場合（ステップＳ２００のＹＥＳ）には、中央処理装置１２１は、第一の符号を図面中に記載されている符号として選択する（ステップＳ２１０）。

これに対して、第一の正答率Ｓ１が第二の正答率Ｓ２より大きくない場合には、中央処理装置１２１は、第二の符号を図面中に記載されている符号として選択する（ステップＳ２２０）。

以上のように、本実施形態に係る符号読み取り装置１００によれば、図面の画像データ中の符号が通常の向き（図２参照）であるか、横向き（図３参照）であるかを問わず、豆図面内の符号を正確に読み取ることが可能である。

さらに、本実施形態に係る符号読み取り装置１００においては、正答率Ｓ１及びＳ２を算出することにより、以下の効果を得ることができる。

本実施形態に係る符号読み取り装置１００においては、図面をスキャンすることにより得られた画像内の一塊のドット群を抽出しているが、この一塊のドット群が符号ではなく、図面に記載されている物の構成要素の一部であることがある。光学文字認識（ＯＣＲ）装置はその一塊のドット群が符号であるのか、あるいは、物の構成要素の一部であるのかを認識する機能は有していないので、その一塊のドット群が符号ではなく、物の構成要素の一部である場合であっても、その一塊のドット群は何らかの符号に変換されることになる。

（第二の実施形態）
本発明の第二の実施形態に係る符号読み取り装置は第一の実施形態に係る符号読み取り装置１００と同一の構造を有しているが、以下に述べるように、本実施形態における中央処理装置１２１は第一の実施形態に係る符号読み取り装置１００における中央処理装置１２１とは異なる動作を実施する。

図５は本実施形態に係る符号読み取り装置の動作を示すフローチャートである。

最初に、第一の実施形態の場合と同様に、基準符号データを作成する（ステップＳ２１０）。基準符号データは入力手段１１０を介して記憶手段１３０に入力され、記憶手段１３０に記憶される。

次いで、中央処理装置１２１は、予め作成されている図面１６０Ａまたは１６０Ｂの画像データを一方向（例えば、右から左へ向かう方向）においてスキャンし、この画像データ内の複数の一塊のドット群を抽出する（ステップＳ２２０）。

この後、中央処理装置１２１は、抽出された複数の一塊のドット群の各々により示される符号を第一の符号としてＯＣＲ処理により認識する（ステップＳ２３０）。

次いで、中央処理装置１２１は、第一の符号と基準符号データとを比較し、基準符号データと合致する第一の符号の数Ａ１を求める。その後、第一の符号の総数Ｂ１に対する数Ａ１の割合を正答率Ｓとして算出する（ステップＳ２４０）。

Ｓ＝Ａ１／Ｂ１

次いで、中央処理装置１２１は正答率Ｓが予め定めた基準数Ｚと等しいか、あるいは、基準数Ｚより大きいか否かを判定する（ステップＳ２５０）。

基準数Ｚとは、正答率Ｓがそれと等しいか、あるいは、それよりも大きければ、図面のスキャン方向が符号の正常の向きと同一であると判定することができる基準となる数である。基準数Ｚは、予め図面を特定の方向にスキャンすることにより得られたデータに基づいて、予め設定される。例えば、基準数Ｚは０．７５から０．８５の範囲内に設定される。

正答率Ｓが基準数Ｚと等しいか、あるいは、基準数Ｚより大きい場合には（ステップＳ２５０のＹＥＳ）、制御手段１２０の中央処理装置１２１は第一の符号を図面内の符号と判定する（ステップＳ２６０）。

これに対して、正答率Ｓが基準数Ｚより小さい場合には（ステップＳ２６０のＮＯ）、中央処理装置１２１は図面のスキャン方向と符号の向きが一致していないものと判定し、複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成する（ステップＳ２７０）。この第二の画像データは当初の画像データに対してＸＹ軸座標変換がなされたものに相当する。

中央処理装置１２１は、第二の画像データを一方向（ステップＳ２２０におけるスキャンの方向と同一の方向）においてスキャンし、第二の画像データ内の複数の一塊のドット群を抽出する（ステップＳ２８０）。

次いで、中央処理装置１２１は、第二の画像データから抽出された複数の一塊のドット群の各々により示される符号を図面中の符号としてＯＣＲ処理により認識する（ステップＳ２９０）。

以上のように、本実施形態に係る符号読み取り装置によれば、第一の実施形態に係る符号読み取り装置１００の場合と同様に、図面の画像データ中の符号が通常の向き（図２参照）であるか、横向き（図３参照）であるかを問わず、豆図面内の符号を正確に読み取ることが可能である。

また、本実施形態に係る符号読み取り装置においては、第一の実施形態とは異なり、二つの正答率を算出する必要がないため、制御手段１２０の処理量を軽減させることができる。

第一及び第二の実施形態に係る符号読み取り装置は上記の構造に限定されるものではなく、種々の改変が可能である。

第一及び第二の実施形態に係る符号読み取り装置においては、図面１６０Ａ及び１６０Ｂを対象として数字の抽出を行ったが、第一及び第二の実施形態に係る符号読み取り装置は図面の他に数字が記載されている全ての文書を対象とすることができる。

また、第一及び第二の実施形態に係る符号読み取り装置は、アラビア数字のみならず、アルファベットその他の外国語文字、ギリシャ数字など任意の記号を対象とすることができる。

１００本発明の第一の実施形態に係る符号抽出装置
１１０入力手段
１２０制御手段
１３０記憶手段

Claims

ドットにより表示された図面の画像データから当該図面中の符号をＯＣＲ処理により読み取る方法であって、
基準となる符号からなる基準符号データを作成する第一の過程と、
前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出する第二の過程と、
前記第二の過程において抽出された前記複数の一塊のドット群の各々により示される符号を第一の符号としてＯＣＲ処理により認識する第三の過程と、
前記第一の符号と前記基準符号データとを比較し、前記基準符号データと合致する第一の符号の数を求め、前記第一の符号の総数に対する当該数の割合を第一の割合として算出する第四の過程と、
前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成する第五の過程と、
前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出する第六の過程と、
前記第六の過程において抽出された前記複数の一塊のドット群の各々により示される符号を第二の符号としてＯＣＲ処理により認識する第七の過程と、
前記第二の符号と前記基準符号データとを比較し、前記基準符号データと合致する第二の符号の数を求め、前記第二の符号の総数に対する当該数の割合を第二の割合として算出する第八の過程と、
前記第一の割合が前記第二の割合より大きいか否かを判定する第九の過程と、
前記第一の割合が前記第二の割合より大きい場合には、前記第一の符号を前記図面中の符号として選択し、前記第一の割合が前記第二の割合より大きくない場合には、前記第二の符号を前記図面中の符号として選択する第十の過程と、
を備える方法。
ドットにより表示された図面の画像データから当該図面中の符号をＯＣＲ処理により読み取る方法であって、
基準となる符号からなる基準符号データを作成する第一の過程と、
前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出する第二の過程と、
前記第二の過程において抽出された前記複数の一塊のドット群の各々により示される符号をＯＣＲ処理により認識する第三の過程と、
前記第三の過程において認識された符号と前記基準符号データとを比較し、前記基準符号データと合致する符号の数を求め、前記第三の過程において認識された符号の総数に対する当該数の割合を算出する第四の過程と、
前記割合が予め定められた基準数より大きいか否かを判定する第五の過程と、
前記割合が前記基準数より大きい場合には、前記第三の過程において認識された符号を前記図面中の符号として選択する第六の過程と、
を備える方法。
前記第五の過程において、前記割合が予め定められた基準数より大きくない場合には、前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成する第七の過程と、
前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出する第八の過程と、
前記第八の過程において抽出された前記複数の一塊のドット群の各々により示される符号を前記図面中の符号としてＯＣＲ処理により認識する第九の過程と、
を備える請求項２に記載の方法。
前記図面と対応する文書がある場合において、前記基準符号データは前記文書から抽出されるものであることを特徴とする請求項１乃至３の何れか一項に記載の方法。
前記図面は特許出願用または実用新案登録出願用の図面であり、前記文書は特許出願用または実用新案登録出願用の明細書であることを特徴とする請求項４に記載の方法。
ドットにより表示された図面の画像データから当該図面中の符号をＯＣＲ処理により読み取る符号読み取り装置であって、
入力手段と、制御手段と、記憶手段と、からなり、
前記記憶手段は、前記入力手段を介して入力された、予め作成されたデータであって、基準となる符号からなる基準符号データを記憶しており、
前記制御手段は、
前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出し、
抽出された前記複数の一塊のドット群の各々により示される符号を第一の符号としてＯＣＲ処理により認識し、
前記第一の符号と前記基準符号データとを比較し、前記基準符号データと合致する第一の符号の数を求め、前記第一の符号の総数に対する当該数の割合を第一の割合として算出し、
前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成し、
前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出し、
前記第二の画像データ内の複数の一塊のドット群の各々により示される符号を第二の符号としてＯＣＲ処理により認識し、
前記第二の符号と前記基準符号データとを比較し、前記基準符号データと合致する第二の符号の数を求め、前記第二の符号の総数に対する当該数の割合を第二の割合として算出し、
前記第一の割合が前記第二の割合より大きいか否かを判定し、
前記第一の割合が前記第二の割合より大きい場合には、前記第一の符号を前記図面中の符号として選択し、前記第一の割合が前記第八の第二の割合より大きくない場合には、前記第二の符号を前記図面中の符号として選択するものである符号読み取り装置。
ドットにより表示された図面の画像データから当該図面中の符号をＯＣＲ処理により読み取る符号読み取り装置であって、
入力手段と、制御手段と、記憶手段と、からなり、
前記記憶手段は、前記入力手段を介して入力された、予め作成されたデータであって、基準となる符号からなる基準符号データを記憶しており、
前記制御手段は、
前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出し、
抽出された前記複数の一塊のドット群の各々により示される符号を第一の符号としてＯＣＲ処理により認識し、
前記第一の符号と前記基準符号データとを比較し、前記基準符号データと合致する第一の符号の数を求め、前記第一の符号の総数に対する当該数の割合を算出し、
前記割合が予め定められた基準数より大きいか否かを判定し、
前記割合が前記基準数より大きい場合には、前記第一の符号を前記図面中の符号として選択するものである符号読み取り装置。
前記制御手段は、
前記割合が予め定められた基準数より大きくない場合には、前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成し、
前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出し、
抽出された前記複数の一塊のドット群の各々により示される符号を前記図面中の符号としてＯＣＲ処理により認識するものであることを特徴とする請求項７に記載の符号読み取り装置。
ドットにより表示された図面の画像データから当該図面中の符号をＯＣＲ処理により読み取る方法をコンピュータに実行させるためのプログラムであって、
前記プログラムが前記コンピュータに実行させる処理は、
前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出する第１の処理と、
前記第１の処理において抽出された前記複数の一塊のドット群の各々により示される符号を第一の符号としてＯＣＲ処理により認識する第２の処理と、
基準となる符号からなり、予め作成された基準符号データと前記第一の符号とを比較し、前記基準符号データと合致する第一の符号の数を求め、前記第一の符号の総数に対する当該数の割合を第一の割合として算出する第３の処理と、
前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成する第４の処理と、
前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出する第５の処理と、
前記第５の処理において抽出された前記複数の一塊のドット群の各々により示される符号を第二の符号としてＯＣＲ処理により認識する第６の処理と、
前記第二の符号と前記基準符号データとを比較し、前記基準符号データと合致する第二の符号の数を求め、前記第二の符号の総数に対する当該数の割合を第二の割合として算出する第７の処理と、
前記第一の割合が前記第二の割合より大きいか否かを判定する第８の処理と、
前記第一の割合が前記第二の割合より大きい場合には、前記第一の符号を前記図面中の符号として選択し、前記第一の割合が前記第二の割合より大きくない場合には、前記第二の符号を前記図面中の符号として選択する第９の処理と、
からなるものであるプログラム。
ドットにより表示された図面の画像データから当該図面中の符号をＯＣＲ処理により読み取る方法をコンピュータに実行させるためのプログラムであって、
前記プログラムが前記コンピュータに実行させる処理は、
前記画像データを一方向においてスキャンし、前記画像データ内の複数の一塊のドット群を抽出する第１の処理と、
前記第１の処理において抽出された前記複数の一塊のドット群の各々により示される符号をＯＣＲ処理により認識する第２の処理と、
基準となる符号からなり、予め作成された基準符号データと前記第２の処理において認識された符号とを比較し、前記基準符号データと合致する符号の数を求め、前記第２の処理において認識された符号の総数に対する当該数の割合を算出する第３の処理と、
前記割合が予め定められた基準数より大きいか否かを判定する第４の処理と、
前記割合が前記基準数より大きい場合には、前記第２の処理において認識された符号を前記図面中の符号として選択する第５の処理と、
からなるものであるプログラム。
前記プログラムが前記コンピュータに実行させる処理は、
前記第４の処理において、前記割合が予め定められた基準数より大きくない場合には、前記複数の一塊のドット群を構成する各ドットの縦座標及び横座標を横座標及び縦座標にそれぞれ変換し、第二の画像データを作成する第６の処理と、
前記第二の画像データを前記一方向においてスキャンし、前記第二の画像データ内の複数の一塊のドット群を抽出する第７の処理と、
前記第７の処理において抽出された前記複数の一塊のドット群の各々により示される符号を前記図面中の符号としてＯＣＲ処理により認識する第８の処理と、
をさらに備えるものであることを特徴とする請求項１０に記載のプログラム。
前記図面と対応する文書がある場合において、前記基準符号データは前記文書から抽出されるものであることを特徴とする請求項１０または１１に記載のプログラム。
前記図面は特許出願用または実用新案登録出願用の図面であり、前記文書は特許出願用または実用新案登録出願用の明細書であることを特徴とする請求項１２に記載のプログラム。