JP2015201077A - Image processor, image processing method, and image processing program - Google Patents
Image processor, image processing method, and image processing program Download PDFInfo
- Publication number
- JP2015201077A JP2015201077A JP2014080155A JP2014080155A JP2015201077A JP 2015201077 A JP2015201077 A JP 2015201077A JP 2014080155 A JP2014080155 A JP 2014080155A JP 2014080155 A JP2014080155 A JP 2014080155A JP 2015201077 A JP2015201077 A JP 2015201077A
- Authority
- JP
- Japan
- Prior art keywords
- area
- ocr
- image
- scanned image
- function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
Description
この発明は画像処理装置、画像処理方法、および画像処理プログラムに関し、特に、OCR(Optical Character Reader)機能を利用可能な画像処理装置、画像処理方法、および画像処理プログラムに関する。 The present invention relates to an image processing device, an image processing method, and an image processing program, and more particularly to an image processing device, an image processing method, and an image processing program that can use an OCR (Optical Character Reader) function.
画像処理の1つに、スキャン画像に対するOCR(Optical Character Reader)処理が挙げられる。OCR処理を行なうとスキャン画像が文字認識されるため、OCR機能の提供元の信頼度に応じては、元の原稿の情報の漏えいの危険性がある。そのため、たとえば外部装置の提供するOCR機能を利用する場合など、OCR機能の提供元の信用度が高くない場合には、セキュリティーを確保する方法として、スキャン画像を分割して異なる提供元から提供されるOCR機能を利用する、などが考えられる。 One example of image processing is OCR (Optical Character Reader) processing on a scanned image. When the OCR process is performed, the scanned image is recognized, so that there is a risk of leakage of information on the original document depending on the reliability of the OCR function provider. Therefore, for example, when the reliability of the OCR function provider is not high, such as when using the OCR function provided by an external device, the scan image is divided and provided from different providers as a method for ensuring security. It is possible to use the OCR function.
しかしながら、スキャン画像を小エリアに分断してそれぞれ別個にOCR処理を行なうと、分断された小エリア間での意味解析や単語解析ができなくなる。そのため、OCR精度の低下につながるという問題がある。 However, if the scanned image is divided into small areas and OCR processing is performed separately, it becomes impossible to perform semantic analysis and word analysis between the divided small areas. Therefore, there is a problem that the OCR accuracy is reduced.
また、スキャン画像から1文字ずつ切り出す処理は難しいため、小エリアのサイズを小さく設定したり、一部分ずつ重複させて小エリアに分断したりすることが考えられる。しかしながら、そのようにすると、OCRの処理量が増加してしまうという問題もある。 In addition, since it is difficult to cut out characters one by one from the scanned image, it is conceivable to set the size of the small area to be small or to divide it into small areas by overlapping each portion. However, when doing so, there is also a problem that the amount of OCR processing increases.
本発明はこのような問題に鑑みてなされたものであって、セキュリティーを確保しつつ効率的にOCR機能を利用可能な画像処理装置、画像処理方法、および画像処理プログラムを提供することを目的としている。 SUMMARY An advantage of some aspects of the invention is that it provides an image processing apparatus, an image processing method, and an image processing program that can efficiently use an OCR function while ensuring security. Yes.
上記目的を達成するために、本発明のある局面に従うと、画像処理装置はスキャン画像を処理可能な画像処理装置であって、スキャン画像の入力を受け付けるための入力手段と、OCR(Optical Character Reader)機能を利用して、スキャン画像に対してOCR処理することで得られるテキストデータを取得するためのOCR処理手段と、OCR処理手段でのOCR機能の利用を制御するための制御手段とを備える。制御手段は、スキャン画像のレイアウトに基づいてスキャン画像から抽出された第1のエリアと第2のエリアとの関連性の度合を判断するための判断手段を含み、第1のエリアと第2のエリアとの関連性の度合が所定度合以上である場合に、制御手段は、第1のエリアと第2のエリアとのそれぞれに対して異なるOCR機能を利用してOCR処理を行なうよう制御する。 In order to achieve the above object, according to an aspect of the present invention, an image processing apparatus is an image processing apparatus capable of processing a scanned image, an input means for receiving an input of the scanned image, an OCR (Optical Character Reader) ) OCR processing means for acquiring text data obtained by performing OCR processing on the scanned image using the function, and control means for controlling use of the OCR function in the OCR processing means. . The control means includes a determination means for determining the degree of relevance between the first area and the second area extracted from the scan image based on the layout of the scan image, the first area and the second area When the degree of association with the area is equal to or greater than the predetermined degree, the control unit controls the OCR process to be performed on each of the first area and the second area using different OCR functions.
好ましくは、OCR処理手段がそれぞれ異なる提供元から提供される複数のOCR機能を利用可能である場合、制御手段は、第1のエリアと第2のエリアとのそれぞれに対して、それぞれ異なる提供元から提供されるOCR機能を利用してOCR処理を行なうよう制御する。 Preferably, when the OCR processing means can use a plurality of OCR functions provided from different providers, the control means provides different providers for the first area and the second area, respectively. Control is performed to perform OCR processing using the OCR function provided from.
好ましくは、制御手段は、第1のエリアと第2のエリアとのそれぞれに対して、同一の提供元から提供される同一のOCR機能を異なるタイミングで利用してOCR処理を行なうよう制御する。 Preferably, the control means controls the OCR process for each of the first area and the second area by using the same OCR function provided from the same provider at different timings.
好ましくは、判断手段は、第1のエリアおよび第2のエリアに含まれるキーワードに基づいて関連性の度合を判断する。 Preferably, the determination unit determines the degree of relevance based on keywords included in the first area and the second area.
好ましくは、判断手段は、スキャン画像における第1のエリアと第2のエリアとのそれぞれの配置に基づいて関連性の度合を判断する。 Preferably, the determination unit determines the degree of relevance based on the arrangement of the first area and the second area in the scan image.
好ましくは、判断手段において第1のエリアの第2のエリアに対する関連性が判断不能な場合に、制御手段は第1のエリアをさらに複数のエリアに分割し、それぞれ異なるOCR機能を利用してOCR処理を行なうよう制御する。 Preferably, when the determination unit cannot determine the relevance of the first area to the second area, the control unit further divides the first area into a plurality of areas, and uses OCR functions different from each other. Control to perform processing.
好ましくは、画像処理装置は、レイアウトごとに、当該レイアウトに含まれるエリアごとに用いるOCR機能を記憶しておくための記憶領域を有するメモリーをさらに備え、制御手段は、スキャン画像のレイアウトが記憶領域に記憶されているレイアウトに該当する場合に、記憶領域に記憶されているOCR機能を利用してスキャン画像のOCR処理を行なうように制御する。 Preferably, the image processing apparatus further includes a memory having a storage area for storing an OCR function to be used for each area included in the layout for each layout, and the control unit has a storage area for the layout of the scanned image. When the layout corresponds to the layout stored in the storage area, the OCR function stored in the storage area is used to perform OCR processing of the scanned image.
好ましくは、制御手段は、スキャン画像に設定されているセキュリティーレベルが所定範囲である場合に、第1のエリアと第2のエリアとのそれぞれに対して異なるOCR機能を利用してOCR処理を行なうよう制御する。 Preferably, the control means performs OCR processing using different OCR functions for the first area and the second area when the security level set in the scanned image is within a predetermined range. Control as follows.
より好ましくは、入力手段は、スキャン画像に対してセキュリティーレベルを設定するための設定手段を含む。 More preferably, the input means includes setting means for setting a security level for the scanned image.
好ましくは、制御手段は、さらに、スキャン画像から抽出されるエリアに対して設定されているセキュリティーレベルと、OCR処理手段で利用可能なOCR機能のセキュリティーレベルとに基づいて、エリアに対して用いるOCR機能を決定する。 Preferably, the control unit further uses an OCR used for the area based on a security level set for the area extracted from the scanned image and a security level of an OCR function available in the OCR processing unit. Determine function.
好ましくは、スキャン画像はページ単位で分けられ、制御手段は、スキャン画像のページごとのレイアウトに基づいて、第1のエリアと第2のエリアとのそれぞれに対して異なるOCR機能を利用してOCR処理を行なうよう制御する。 Preferably, the scanned image is divided in units of pages, and the control unit uses an OCR function that is different for each of the first area and the second area based on the layout of each page of the scanned image. Control to perform processing.
本発明の他の局面に従うと、画像処理方法はスキャン画像の処理方法であって、スキャン画像の入力を受け付けるステップと、スキャン画像のレイアウトに基づいてスキャン画像から抽出された第1のエリアと第2のエリアとの関連性の度合を判断するステップと、OCR機能を利用して、スキャン画像に対してOCR処理することで得られるテキストデータを取得するステップとを備え、テキストデータを取得するステップは、第1のエリアと第2のエリアとの関連性の度合が所定度合以上である場合に第1のエリアと第2のエリアとのそれぞれに対して異なるOCR機能を利用してOCR処理を行なうステップを含む。
According to another aspect of the present invention, the image processing method is a scan image processing method, the step of receiving an input of the scan image, the first area extracted from the scan image based on the scan image layout, and the first area A step of determining the degree of relevance with the
本発明のさらに他の局面に従うと、画像処理プログラムはコンピューターにスキャン画像の処理を実行させるプログラムであって、スキャン画像の入力を受け付けるステップと、スキャン画像のレイアウトに基づいてスキャン画像から抽出された第1のエリアと第2のエリアとの関連性の度合を判断するステップと、OCR機能を利用して、スキャン画像に対してOCR処理することで得られるテキストデータを取得するステップとをコンピューターに実行させ、テキストデータを取得するステップは、第1のエリアと第2のエリアとの関連性の度合が所定度合以上である場合に第1のエリアと第2のエリアとのそれぞれに対して異なるOCR機能を利用してOCR処理を行なうステップを含む。 According to still another aspect of the present invention, the image processing program is a program that causes a computer to execute processing of a scanned image, and is extracted from the scanned image based on a step of receiving an input of the scanned image and a layout of the scanned image The step of determining the degree of relevance between the first area and the second area and the step of acquiring text data obtained by performing OCR processing on the scanned image using the OCR function The step of executing and acquiring the text data is different for each of the first area and the second area when the degree of association between the first area and the second area is equal to or greater than a predetermined degree. And a step of performing OCR processing using the OCR function.
この発明によると、画像亜処理装置において、セキュリティーを確保しつつ効率的にOCR機能を利用することができる。 According to the present invention, in the image sub-processing apparatus, it is possible to efficiently use the OCR function while ensuring security.
以下に、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部品および構成要素には同一の符号を付してある。それらの名称および機能も同じである。したがって、これらの説明は繰り返さない。 Embodiments of the present invention will be described below with reference to the drawings. In the following description, the same parts and components are denoted by the same reference numerals. Their names and functions are also the same. Therefore, these descriptions will not be repeated.
<装置構成>
図1は、本実施の形態にかかる画像処理装置の一例としてのMFP(Multi-Functional Peripheral)100の装置構成の具体例を示すブロック図である。図1を参照して、MFP100は、装置全体を制御するためのCPU(Central Processing Unit)10と、CPU10で実行されるプログラムを記憶するためのメモリーであるROM(Read Only Memory)11と、CPU10でプログラムを実行する際の作業領域となったり計算値を記憶したりするためのメモリーであるRAM(Random Access Memory)12と、画像データなどを記憶するための大容量の記憶装置の一例としてのHDD(Hard Disk Drive)13と、スキャナー14と、プリンター15と、操作パネル16と、他の装置と通信するためのネットワークコントローラー17とを含む。
<Device configuration>
FIG. 1 is a block diagram showing a specific example of the apparatus configuration of an MFP (Multi-Functional Peripheral) 100 as an example of an image processing apparatus according to the present embodiment. Referring to FIG. 1,
MFP100は、他の装置の一例としてサーバー300と通信可能である。MFP100は、サーバー300と通信することによって、サーバー300が提供するOCR(Optical Character Reader)機能を利用可能である。サーバー300は、複数の種類のOCR機能を提供してもよい。または、MFP100は複数のサーバー300と通信可能であって、それぞれのサーバー300が提供する複数のOCR機能を利用可能であってもよい。
MFP 100 can communicate with
<動作概要>
図2は、MFP100での動作概要を表わした図である。図2を参照して、ユーザーは処理対象のドキュメントに対してスキャンを実行する(ステップ#1)。好ましくは、ユーザーは、スキャン画像に対してセキュリティーレベルを設定する(ステップ#2)。セキュリティーレベルの設定は、解像度の設定と同様に属性としてスキャン画像情報に付加されるものであってもよいし、セキュリティーレベルを表わす、たとえば「社外秘」などの予め規定された画像やコード(たとえばQRコード(登録商標)等)がスキャン画像自体に付加されるものであってもよい。
<Overview of operation>
FIG. 2 is a diagram showing an outline of operation in
図3は、レイアウト解析を説明するための図であって、一例として「請求書」とタイトルされたドキュメントをスキャンすることで得られたスキャン画像が示されている。図3にも示されたように、OCR処理の対象として、請求書や履歴書など、特定のフォーマットで作成されたドキュメントのスキャン画像が一般的に多いと考えられる。MFP100は、このようなフォーマットを有するスキャン画像に対してOCR処理を行なうことで当該ドキュメントに含まれる文字情報(テキスト)を取得することができる。 FIG. 3 is a diagram for explaining the layout analysis. As an example, a scan image obtained by scanning a document titled “Bill” is shown. As shown in FIG. 3, it is generally considered that there are many scanned images of a document created in a specific format such as an invoice or a resume as a target of OCR processing. MFP 100 can acquire character information (text) included in the document by performing OCR processing on the scanned image having such a format.
図3のようなスキャン画像の入力を受け付けたMFP100は、スキャン画像に対してレイアウト解析を実行する(ステップ#3)。レイアウト解析は、画像の特徴量から当該画像に含まれる情報を解析、分析する技術であって、文字を含む画像内の情報の配置を検出する技術を指す。図3のスキャン画像をレイアウト解析した場合、一例としてMFP100は、文字を含む(または含んでいる可能性のある、以下、同様である)エリアとしてエリア501〜517を抽出する。MFP100は文字をエリア以外のエリアとして、罫線で構成された表や、写真、その他の図形を含んだエリアを抽出してもよい。MFP100は、各エリアの配置や内容を表わす情報をレイアウト情報として保持する。MFP100は、フォーマットごとにレイアウト情報を記憶してもよい。
Upon receiving the input of the scan image as shown in FIG. 3, the
MFP100は、さらに、抽出したエリア間での関連性を判断し(ステップ#4)、その判断結果に基づいて各エリアのOCR処理に利用するOCR機能を決定する(ステップ#5)。
The
上記ステップ#4でMFP100は各エリアに対してキーワード検索を行なって、予め規定しているキーワードを含むか否かで各エリアを分類する。たとえば、「株式会社」や「有限会社」などの予め規定しているキーワードを含むエリア504,507,517について、MFP100はエリア504,507,517に含まれるテキストが社名を表わすとしてエリア504,507,517の分類を「社名」とすることができる。同様に、「部」や「部長」、「課長」などの予め規定しているキーワードを含むエリア506について、MFP100はエリア506に含まれるテキストが担当者を表わすとしてエリア506の分類を「担当者」とすることができる。予め規定しているいずれのキーワードも含まないエリア515については、MFP100は、キーワードを含まない「特殊文字列」として分類する。
In
MFP100は、上記ステップ#4で各エリアの分類結果に基づいて、各エリアの関連性を判断する。たとえば、MFP100は、「社名」に分類されたエリア504と「担当者」に分類されたエリア506とを関連性ある組み合わせと特定することができる。好ましくは、MFP100は、さらに、エリアの配置にも基づいて関連性を判断する。たとえば、MFP100は、「社名」に分類されたエリア504と、その近傍に配置された「担当者」に分類されたエリア506とを関連性ある組み合わせと特定することができる。
In
MFP100は、関連性あるエリア(この例ではエリア504およびエリア506)に対してタグを付与するなどしてグループ化する。そして、MFP100は、関連性があるとされた複数のエリアそれぞれのOCRに用いるOCR機能を異なるものとするように、OCR機能を決定し(ステップ#5)、OCR処理を実行させる(ステップ#6)。たとえば、上記の例では、MFP100はエリア504およびエリア506それぞれのOCR処理に利用するOCR機能を異なるOCR機能と決定する。異なるOCR機能とは、エリア504とエリア506とのそれぞれに対して異なる提供元である第1のサーバーの提供するOCR機能と第2のサーバーの提供するOCR機能とを利用することであってもよいし、第1のサーバーの提供する同一のOCR機能をエリア504とエリア506とのそれぞれに対して異なるタイミングで利用することであってもよい。
The
このように、MFP100は、関連性があると判断されたエリアに対して異なるOCR機能を利用するので、たとえば社名と担当者とに対して異なるOCR機能を利用することになる。そのため、複数の情報の間の関連性が分断される。つまり、同一の機会に同一のサーバーの提供するOCR機能において、たとえば社名および担当者などの関連性のある情報がOCR処理されることがない。そのため、当該ドキュメントの内容の漏えいを効果的に防止することができる。
Thus, since
なお、MFP100は、関連性の有無のみならず、関連性の度合を判断してもよい。すなわち、MFP100は予め分類ごとに関連性の度合を記憶しておき、レイアウト分析の結果である各エリアの分類に応じて、エリア間の関連性の度合を判断することができる。この場合、MFP100は、エリア間の関連性の度合に応じて各エリアに用いるOCR機能を決定してもよい。すなわち、MFP100は、エリア間の関連性が所定度以上である場合に異なるOCR機能を利用すると決定し、上記所定度に満たない場合には同一のOCR機能を利用してもよいと決定してもよい。または、OCR機能にセキュリティーレベルが設定されている場合、MFP100は、エリア間の関連性が所定度以上である場合にはこれらエリアそれぞれに対してセキュリティーレベルの高い、それぞれ異なるOCR機能を利用する、と決定してもよい。
Note that the
さらに、MFP100は、スキャン画像のエリアごとにセキュリティーレベルが設定されている場合、当該エリアのセキュリティーレベルもさらに考慮して利用するOCR機能を決定してもよい。つまり、好ましくはMFP100は、エリアに設定されたセキュリティーレベルが高い場合には、セキュリティーレベルの高いOCR機能を利用すると決定する。
Further, when a security level is set for each area of the scanned image,
エリアごとのセキュリティーレベルは、予めドキュメントの作成者が設定してもよいし、フォーマットに関連付けてメモリーに登録されていてもよいし、予めMFP100がキーワードに応じたセキュリティーレベルを記憶しておき、当該エリアから検出されたキーワードに基づいて判断してもよい。
The security level for each area may be set in advance by the document creator, or may be registered in the memory in association with the format, or the
一方、上記ステップ#3のレイアウト解析によって「特殊文字列」と分類されたエリア504については、MFP100はさらに小エリアに分割し、各小エリアの処理に利用するOCR機能を異なるOCR機能に決定する。または、OCR機能にセキュリティーレベルが設定されている場合、MFP100は「特殊文字列」と分類されたエリア504に対して、特殊文字列に分類されていないエリアに対して利用するOCR機能よりもセキュリティーレベルの高いOCR機能を利用すると決定する。
On the other hand, for the area 504 classified as “special character string” by the layout analysis in
「特殊文字列」と分類されたエリアに記載された内容はレイアウト解析では不明であるため、他のエリアに対する関連性が判断不能である。MFP100が「特殊文字列」と分類されたエリアに対して上記のように利用するOCR機能を決定することで、当該エリアの内容の漏えいをより効果的に防止することができる。
Since the contents described in the area classified as “special character string” are unknown in the layout analysis, the relevance to other areas cannot be determined. By determining the OCR function to be used as described above for the area classified as “special character string” by the
また、他の例として上記のようにして「住所」と分類されたエリア505,508についても、MFP100は、さらに小エリアに分類し、各小エリアの処理に利用するOCR機能を異なるOCR機能に決定するようにしてもよい。すなわち、MFP100は、特定の分類に対しては、さらに小エリアに分類し、各小エリアの処理に利用するOCR機能を異なるOCR機能に決定するようにしてもよい。このようにすることで、当該エリアの内容の漏えいをより効果的に防止することができる。
As another example, the
MFP100は、各OCR機能からOCR処理の結果であるテキスト情報を受け取り、それらを統合することで(ステップ#7)、ドキュメントの内容を得ることができる。
The
なお、MFP100は、OCR機能にセキュリティーレベルが設定されている場合、さらに、スキャン画像に対して設定されているセキュリティーレベルもさらに考慮してOCR機能を決定してもよい。すなわち、スキャン画像に対して高いセキュリティーレベルが設定されている場合、MFP100は、最も高いセキュリティーレベルが設定されているOCR機能を用いると決定することができる。最もセキュリティーレベルの高いOCR機能としては、当該MFP100自身に搭載されているOCR機能が挙げられる。一方、スキャン画像に対して設定されているセキュリティーレベルが低い場合には、MFP100は、上記のようにエリア間の関連性の度合を考慮することなく、スキャン画像全体に対していずれかのOCR機能を利用すると決定してもよい。このようにすることで、処理を効率化、高速化することができる。従って、FMP100は、スキャン画像に対して設定されているセキュリティーレベルが所定範囲の場合にのみ、上記のようにレイアウト分析の結果抽出されたエリア間の関連性の度合に応じて利用するOCR機能を決定するようにしてもよい。
When the security level is set for the OCR function, the
好ましくは、MFP100は、エリアごとに決定した利用するOCR機能をOCR情報として、ドキュメントのフォーマットに関連付けてメモリーに記憶する。たとえば、図3の例の場合、MFP100は、ドキュメントのフォーマット「請求書」に関連付けて、エリア501〜517それぞれの分類や利用するOCR機能をメモリーに記憶する。そして、次回の処理でレイアウト解析の結果、処理対象のスキャン画像がフォーマット「請求書」のものであると判断されると、MFP100はメモリーから当該フォーマット「請求書」に関連付けられたOCR情報を読み出して処理対象のスキャン画像に適用する。このようにすることで、2回目以降の処理において利用するOCR機能を決定する処理を高速化することができる。従って、好ましくは、MFP100は、スキャン画像がページ単位で分けられたものである場合、つまり、ドキュメントが複数ページからなるものである場合、ページ単位でレイアウト解析を実行して当該ページのフォーマットを特定し、当該フォーマットに関連付けられたOCR情報がメモリーに登録されているか否かを確認する。
Preferably,
<機能構成>
図4は、MFP100が上記の動作を行なうための機能構成の具体例を表わしたブロック図である。図4の各機能は、MFP100のCPU10がROM11に記憶されているプログラムをRAM12上に読み出して実行することで、主に、CPU10で実現される。しかしながら、少なくとも一部機能が、図1に表わされた他の構成、または図示されない電気回路などの他のハードウェア構成によって実現されてもよい。
<Functional configuration>
FIG. 4 is a block diagram showing a specific example of a functional configuration for causing
図4を参照して、メモリーの一例としてのHDD13は、ドキュメントのフォーマットに関連付けてエリアごとに利用すると決定されたOCR機能を表わした情報であるOCR情報を記憶するための記憶領域であるOCR情報記憶部131を含む。
Referring to FIG. 4,
さらに図4を参照して、CPU10は、スキャナー14やネットワークコントローラー17を介して他の装置からスキャン画像の入力を受け付けるための入力部101と、入力されたスキャン画像に対してOCR処理することで得られるテキストデータを取得するためのOCR処理部102と、スキャン画像に対してOCR処理を実行するためのOCR実行部103と、OCR処理部102でのOCR機能の利用を制御するための制御部104とを含む。好ましくは、入力部101は、スキャン画像に対してセキュリティーレベルを設定するための設定部109を含む。
Further, referring to FIG. 4, the
制御部104は、スキャン画像のレイアウト解析を行なうための解析部105と、解析されたレイアウトに基づいてスキャン画像から文字(または文字列)を含むエリアを抽出するための抽出部106と、抽出されたエリア間の関連性の度合(関連性の有無を含む)を判断するための判断部107と、判断されたエリア間の関連性の度合に基づいて各エリアのOCR処理に利用するOCR機能を決定するための決定部108とを含む。
The
決定部108で決定したエリアごとに利用するOCR機能は、当該ドキュメントのレイアウトに関連付けてOCR情報としてOCR情報記憶部131に記憶される。また、解析部105で解析されたレイアウトから特定されるドキュメントのフォーマットに関連付けられたOCR情報がOCR情報記憶部131に記憶されている場合、制御部104はOCR情報記憶部131から街頭するOCR情報を読み出す。この場合、決定部108は、OCR情報に基づいて各エリアに利用するOCR機能を決定する。
The OCR function used for each area determined by the
判断部107は、各エリアに含まれるキーワードに基づいて関連性の度合を判断する。好ましくは、判断部107は、さらに、スキャン画像における各エリアの配置も考慮して関連性の度合を判断する。
The
決定部108は、エリア間の関連性の度合が所定度合以上である場合に、各エリアに対して異なるOCR機能を利用すると決定する。異なるOCR機能とは、それぞれ異なる提供元から提供されるOCR機能であってもよいし、同一のOCR機能を異なるタイミングで利用することであってもよい。
The
なお、判断部107において関連性の度合が判断不能であったエリアについては、好ましくは決定部108は、当該エリアをさらに複数のエリアに分割してそれぞれ異なるOCR機能を利用すると決定する。
For areas where the degree of relevance cannot be determined by the
<動作フロー>
図5は、MFP100での動作の流れを表わすフローチャートである。図5のフローチャートに表わされた動作は、MFP100のCPU10がROM11に記憶されているプログラムをRAM12上に読み出して実行し、図4の各機能を発揮させることによって実現される。
<Operation flow>
FIG. 5 is a flowchart showing an operation flow in
図5を参照して、CPU10は、スキャン画像の入力を受け付けると(ステップS101でYES)、当該スキャン画像にセキュリティーレベルが設定されているか否かを確認する。入力されたスキャン画像に対して高いセキュリティーレベル、または低いセキュリティーレベルが設定されている場合、または、セキュリティーレベルの設定のない場合(ステップS103でNO)、CPU10は、以降の、エリアごとに異なるOCR機能を利用するための処理を行なうことなく、所定のOCR機能を利用すると決定し(ステップS125)、OCR処理を実行する(ステップS127)。すなわち、スキャン画像のセキュリティーレベルが所定レベルよりも高い場合には、CPU10は、当該スキャン画像のすべてのエリアに対して、たとえばMFP100に搭載されているOCR機能など、セキュリティーレベルの高いOCR機能を利用すると決定する。スキャン画像のセキュリティーレベルが所定レベルよりも低い場合、またはセキュリティーレベルが設定されていない場合には、CPU10は、当該スキャン画像のすべてのエリアに対して、予め規定されたOCR機能を利用すると決定する。
Referring to FIG. 5, when receiving an input of a scanned image (YES in step S101),
入力されたスキャン画像に設定されているセキュリティーレベルが所定範囲である場合(ステップS103でYES)、CPU10は、スキャン画像に対してレイアウト解析を行なって、当該スキャン画像の元のドキュメントのレイアウトを特定して、文字を含んでいるエリアを抽出する(ステップS105)。
If the security level set for the input scan image is within a predetermined range (YES in step S103), the
特定されたレイアウトから得られるフォーマットに関連付けてOCR情報がメモリーに記憶されている場合(ステップS107でYES)、CPU10は、以下の処理に替えて、メモリーから街頭するOCR情報を読み出すことで(ステップS109)、エリアごとの利用するOCR機能を決定し(ステップS125)、OCR処理を実行する(ステップS127)。
When the OCR information is stored in the memory in association with the format obtained from the specified layout (YES in step S107), the
メモリーにOCR情報が登録されていない場合(ステップS107でNO)、CPU10は、エリアごとに利用するOCR機能を決定する処理を実行する。すなわち、CPU10は、上記ステップS105のレイアウト解析によって抽出されたエリアごとにOCR処理を実行して(ステップS111)、当該エリアに予め規定したキーワードが含まれているか否かを検索する(ステップS113)。その結果、当該エリアにキーワードが含まれる場合には(ステップS115でYES)、CPU10は、含まれるキーワードに応じて当該エリアを分類する(ステップS117)。当該エリアにいずれのキーワードも含まれない場合には(ステップS115でNO)、CPU10は、当該エリアを「特殊文字列」に分類する(ステップS119)。
When the OCR information is not registered in the memory (NO in step S107), the
CPU10は、以上のステップS111〜S119の処理を抽出されたすべてのエリアに対して実行する。そして、すべてのエリアに対して処理が終了すると(ステップS121でNO)、CPU10は、各エリアの分類結果に基づいて各エリアの関連性を判断する。すなわち、CPU10は、各エリアの分類結果に応じて関連性あるエリアのグループを特定して、タグを付与するなどしてグループ化する(ステップS123)。このとき、CPU10は、さらに各エリアの配置も考慮して関連性あるエリアのグループを特定してもよい。
CPU10 performs the process of the above step S111-S119 with respect to all the extracted areas. When the processing is completed for all areas (NO in step S121), the
CPU10は、関連性があるとグループ化された複数のエリアそれぞれに利用するOCR機能を異なるものとするように、各エリアに対して利用するOCR機能を決定する(ステップS125)。また、上記ステップS119で「特殊文字列」と分類されたエリアに対しては、CPU10はさらに当該エリアを小エリアに分割し、各小エリアそれぞれに利用するOCR機能を異なるものとするように、各小エリアに対して利用するOCR機能を決定する。
The
CPU10は、スキャン画像のうちの対象のエリアのみを、当該エリアのOCR処理に利用すると決定されたOCR機能を提供するサーバー300に渡して、OCR処理を実行させる(ステップS127)。
The
CPU10は、利用したOCR機能ごとに、当該OCR機能を提供するサーバー300から処理結果であるテキストを受け付ける。そして、それらをエリアの配置に基づいて統合することで(ステップS129)、スキャン画像の内容を得る。
For each used OCR function, the
なお、上記ステップS101で入力されたスキャン画像がページ単位に分けられたものであった場合、CPU10は、ページごとに上記ステップS103〜S129を繰り返す。これによって、CPU10は、ページ単位でレイアウト解析を行ない、当該レイアウトから得られたフォーマットに関連付けられたOCR情報がメモリーに登録されている場合には、(以降のエリアごとにOCR機能を決定する処理を行なうことなく)登録されているOCR情報を利用してOCR機能を決定して処理を実行させることができる。
If the scanned image input in step S101 is divided into pages, the
<実施の形態の効果>
以上の処理がMFP100において実行されることで、MFP100では、セキュリティーを確保しつつ外部装置の提供するOCR機能も利用することができる。すなわち、本実施の形態にかかるMFP100を利用すると、たとえば住所と社名、商品名と単価など、関連性の度合の高い内容を含むエリアがそれぞれ異なるOCR機能を利用してOCR処理がなされる。そのため、たとえ当該OCR機能を提供するサーバー300を介してOCR処理結果である当該エリアの内容が漏えいした場合であっても、関連性が分断されているため、その内容の意味の漏えいは防止される。つまり、上記の例であれば、商品名のみ、または単価のみが第三者に漏えいしたとしても、「その商品の単価」として意味を構成するような内容で第三者に漏えいすることがない。そのため、すべて自身のOCR機能を利用する場合と比較して効率的にOCR処理を行なうことができる。つまり、本実施の形態にかかるMFP100では、セキュリティーを確保しつつ効率的にOCR機能を利用することができる。
<Effect of Embodiment>
By executing the above processing in
さらに、本実施の形態にかかるMFP100では、いったんエリアごとに利用するOCR機能を決定すると、その結果をOCR情報として、フォーマットに関連付けてメモリーに記憶する。そして、次回以降、対象のスキャン画像をレイアウト解析してフォーマットを特定すると、当該フォーマットに関連付けて記憶されているOCR情報を読み出して利用するOCR機能を特定する。一般的に、ドキュメントをOCR処理して用いる場面はオフィス環境であることが多く、多くの場合には「請求書」や「納品書」など、フォーマットに沿って作成されたドキュメントが処理対象となる。従って、フォーマットごとにエリアごとの利用するOCR機能を予め登録しておくことで、2回目以降、処理のつどOCR機能を決定するための処理を繰り返す必要がなく、処理を高速化することができる。
Further, in
<他の例1>
上記の例では、MFP100が自身の搭載するOCR機能を利用してエリアに含まれるキーワードを特定し、分類するものとしている。エリアの分類はOCR機能を利用する方法に限定されない。他の例として、予め管理者等の特定のユーザーやドキュメントの作成者によってエリアごとに分類され、当該分類を表わすタグ等が付与されていてもよい。さらには、予め管理者等の特定のユーザーやドキュメントの作成者によってフォーマットごとのOCR情報が登録されていてもよい。さらには、そのOCR情報は、MFP100のメモリーのみならず、(サーバー300等の)他の記憶装置に登録され、MFP100が当該記憶装置にアクセスしてOCR情報を読み出すようにしてもよい。または、スキャン画像にOCR情報が付加されていてもよい。
<Other example 1>
In the above example, the
<他の例2>
なお、以上の例では、本実施の形態にかかる画像処理装置がMFPであるものとし、さらに、当該MFP自身もOCR機能を搭載するものとしている。しかしながら、画像処理装置はMFPに限定されない。画像処理装置の他の例として、たとえば、汎用のコンピューターやいわゆるタブレットなどと呼ばれる端末装置であってもよい。つまり、OCR機能を提供するサーバー300と通信可能であって、画像データを処理対象のデータとして取扱い可能な装置であればいかなる装置であってもよい。
<Other example 2>
In the above example, the image processing apparatus according to the present embodiment is an MFP, and the MFP itself is also equipped with an OCR function. However, the image processing apparatus is not limited to the MFP. As another example of the image processing apparatus, for example, a terminal device called a general-purpose computer or a so-called tablet may be used. That is, any device can be used as long as it can communicate with the
上記のように画像処理装置が自身がOCR機能を搭載しない場合には、画像処理装置は上記の例のように予めエリアに対して設定された分類を表わす情報に基づいて、当該エリアに対して利用するOCR機能を決定することができる。 When the image processing apparatus itself does not have the OCR function as described above, the image processing apparatus performs the processing for the area based on the information indicating the classification set in advance for the area as in the above example. The OCR function to be used can be determined.
<他の例3>
さらに、上述の処理をMFP100や他の装置である画像処理装置に実行させるためのプログラムを提供することもできる。プログラムを提供することで、汎用のMFPやコンピューターを本実施の形態にかかる画像処理装置として機能させることができる。
<Other example 3>
Furthermore, it is possible to provide a program for causing the
このようなプログラムは、コンピューターに付属するフレキシブルディスク、CD−ROM(Compact Disk-Read Only Memory)、ROM、RAMおよびメモリカードなどのコンピューター読取り可能な記録媒体にて記録させて、プログラム製品として提供することもできる。あるいは、コンピューターに内蔵するハードディスクなどの記録媒体にて記録させて、プログラムを提供することもできる。また、ネットワークを介したダウンロードによって、プログラムを提供することもできる。 Such a program is recorded on a computer-readable recording medium such as a flexible disk attached to the computer, a CD-ROM (Compact Disk-Read Only Memory), a ROM, a RAM, and a memory card, and provided as a program product. You can also Alternatively, the program can be provided by being recorded on a recording medium such as a hard disk built in the computer. A program can also be provided by downloading via a network.
なお、本発明にかかるプログラムは、コンピューターのオペレーティングシステム(OS)の一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の配列で所定のタイミングで呼出して処理を実行させるものであってもよい。その場合、プログラム自体には上記モジュールが含まれずOSと協働して処理が実行される。このようなモジュールを含まないプログラムも、本発明にかかるプログラムに含まれ得る。 A program according to the present invention is a program module that is provided as a part of an operating system (OS) of a computer and that executes necessary processes by calling necessary modules in a predetermined arrangement at a predetermined timing. Also good. In that case, the program itself does not include the module, and the process is executed in cooperation with the OS. A program that does not include such a module can also be included in the program according to the present invention.
また、本発明にかかるプログラムは他のプログラムの一部に組込まれて提供されるものであってもよい。その場合にも、プログラム自体には上記他のプログラムに含まれるモジュールが含まれず、他のプログラムと協働して処理が実行される。このような他のプログラムに組込まれたプログラムも、本発明にかかるプログラムに含まれ得る。 The program according to the present invention may be provided by being incorporated in a part of another program. Even in this case, the program itself does not include the module included in the other program, and the process is executed in cooperation with the other program. Such a program incorporated in another program can also be included in the program according to the present invention.
提供されるプログラム製品は、ハードディスクなどのプログラム格納部にインストールされて実行される。なお、プログラム製品は、プログラム自体と、プログラムが記録された記録媒体とを含む。 The provided program product is installed in a program storage unit such as a hard disk and executed. The program product includes the program itself and a recording medium on which the program is recorded.
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。 The embodiment disclosed this time should be considered as illustrative in all points and not restrictive. The scope of the present invention is defined by the terms of the claims, rather than the description above, and is intended to include any modifications within the scope and meaning equivalent to the terms of the claims.
10 CPU、11 ROM、12 RAM、13 HDD、14 スキャナー、15 プリンター、16 操作パネル、17 ネットワークコントローラー、100 MFP、101 入力部、102 OCR処理部、103 OCR実行部、104 制御部、105 解析部、106 抽出部、107 判断部、108 決定部、109 設定部、131 OCR情報記憶部、300 サーバー、501〜517 エリア。
10 CPU, 11 ROM, 12 RAM, 13 HDD, 14 scanner, 15 printer, 16 operation panel, 17 network controller, 100 MFP, 101 input unit, 102 OCR processing unit, 103 OCR execution unit, 104 control unit, 105
Claims (13)
前記スキャン画像の入力を受け付けるための入力手段と、
OCR(Optical Character Reader)機能を利用して、前記スキャン画像に対してOCR処理することで得られるテキストデータを取得するためのOCR処理手段と、
前記OCR処理手段での前記OCR機能の利用を制御するための制御手段とを備え、
前記制御手段は、前記スキャン画像のレイアウトに基づいて前記スキャン画像から抽出された第1のエリアと第2のエリアとの関連性の度合を判断するための判断手段を含み、
前記第1のエリアと前記第2のエリアとの関連性の度合が所定度合以上である場合に、前記制御手段は、前記第1のエリアと前記第2のエリアとのそれぞれに対して異なるOCR機能を利用してOCR処理を行なうよう制御する、画像処理装置。 An image processing apparatus capable of processing a scanned image,
Input means for receiving input of the scanned image;
OCR processing means for acquiring text data obtained by performing OCR processing on the scanned image using an OCR (Optical Character Reader) function;
Control means for controlling the use of the OCR function in the OCR processing means,
The control means includes determination means for determining the degree of relevance between the first area and the second area extracted from the scan image based on the layout of the scan image,
When the degree of relevance between the first area and the second area is equal to or greater than a predetermined degree, the control means performs different OCR for each of the first area and the second area. An image processing apparatus that controls to perform OCR processing using a function.
前記制御手段は、前記スキャン画像のレイアウトが前記記憶領域に記憶されているレイアウトに該当する場合に、前記記憶領域に記憶されているOCR機能を利用して前記スキャン画像のOCR処理を行なうように制御する、請求項1〜6のいずれかに記載の画像処理装置。 Each layout further includes a memory having a storage area for storing an OCR function used for each area included in the layout,
When the layout of the scanned image corresponds to the layout stored in the storage area, the control means performs OCR processing of the scanned image using the OCR function stored in the storage area. The image processing apparatus according to claim 1, which is controlled.
前記制御手段は、前記スキャン画像のページごとのレイアウトに基づいて、前記第1のエリアと前記第2のエリアとのそれぞれに対して異なるOCR機能を利用してOCR処理を行なうよう制御する、請求項1〜10のいずれかに記載の画像処理装置。 The scanned image is divided into pages,
The control means controls to perform OCR processing using a different OCR function for each of the first area and the second area based on a layout of each page of the scanned image. Item 11. The image processing apparatus according to any one of Items 1 to 10.
前記スキャン画像の入力を受け付けるステップと、
前記スキャン画像のレイアウトに基づいて前記スキャン画像から抽出された第1のエリアと第2のエリアとの関連性の度合を判断するステップと、
OCR機能を利用して、前記スキャン画像に対してOCR処理することで得られるテキストデータを取得するステップとを備え、
前記テキストデータを取得するステップは、前記第1のエリアと前記第2のエリアとの関連性の度合が所定度合以上である場合に前記第1のエリアと前記第2のエリアとのそれぞれに対して異なるOCR機能を利用してOCR処理を行なうステップを含む、画像処理方法。 A method of processing a scanned image,
Receiving an input of the scanned image;
Determining the degree of relevance between the first area and the second area extracted from the scanned image based on the layout of the scanned image;
Using the OCR function to obtain text data obtained by performing OCR processing on the scanned image,
The step of acquiring the text data is performed for each of the first area and the second area when the degree of association between the first area and the second area is a predetermined degree or more. An image processing method including a step of performing OCR processing using different OCR functions.
前記スキャン画像の入力を受け付けるステップと、
前記スキャン画像のレイアウトに基づいて前記スキャン画像から抽出された第1のエリアと第2のエリアとの関連性の度合を判断するステップと、
OCR機能を利用して、前記スキャン画像に対してOCR処理することで得られるテキストデータを取得するステップとを前記コンピューターに実行させ、
前記テキストデータを取得するステップは、前記第1のエリアと前記第2のエリアとの関連性の度合が所定度合以上である場合に前記第1のエリアと前記第2のエリアとのそれぞれに対して異なるOCR機能を利用してOCR処理を行なうステップを含む、画像処理プログラム。 A program that causes a computer to process scanned images,
Receiving an input of the scanned image;
Determining the degree of relevance between the first area and the second area extracted from the scanned image based on the layout of the scanned image;
Using the OCR function to cause the computer to execute text data obtained by performing OCR processing on the scanned image;
The step of acquiring the text data is performed for each of the first area and the second area when the degree of association between the first area and the second area is a predetermined degree or more. An image processing program including a step of performing OCR processing using different OCR functions.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014080155A JP6303742B2 (en) | 2014-04-09 | 2014-04-09 | Image processing apparatus, image processing method, and image processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014080155A JP6303742B2 (en) | 2014-04-09 | 2014-04-09 | Image processing apparatus, image processing method, and image processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015201077A true JP2015201077A (en) | 2015-11-12 |
JP6303742B2 JP6303742B2 (en) | 2018-04-04 |
Family
ID=54552279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014080155A Active JP6303742B2 (en) | 2014-04-09 | 2014-04-09 | Image processing apparatus, image processing method, and image processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6303742B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021070167A (en) * | 2019-10-29 | 2021-05-06 | 株式会社寺岡精工 | Label information processing device, label information processing method and program |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002074263A (en) * | 2000-08-28 | 2002-03-15 | Oki Electric Ind Co Ltd | System for reading facsimile character |
JP2002269497A (en) * | 2001-03-07 | 2002-09-20 | Ricoh Co Ltd | Method and system for inputting document as being proxy for another and recording medium |
JP2004005387A (en) * | 1998-01-28 | 2004-01-08 | Daiwa Computer Service Kk | Document for information inputting system |
JP2006079190A (en) * | 2004-09-07 | 2006-03-23 | Japan Medical Data Center Co Ltd | Optical character reader |
JP2006209649A (en) * | 2005-01-31 | 2006-08-10 | Nec Corp | Confidential document retrieval system, confidential document retrieval method and confidential document retrieval program |
JP2006244315A (en) * | 2005-03-04 | 2006-09-14 | Aidekku:Kk | Data entry system |
JP2012238142A (en) * | 2011-05-11 | 2012-12-06 | Konica Minolta Business Technologies Inc | Image processing system, image processing device and program |
-
2014
- 2014-04-09 JP JP2014080155A patent/JP6303742B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004005387A (en) * | 1998-01-28 | 2004-01-08 | Daiwa Computer Service Kk | Document for information inputting system |
JP2002074263A (en) * | 2000-08-28 | 2002-03-15 | Oki Electric Ind Co Ltd | System for reading facsimile character |
JP2002269497A (en) * | 2001-03-07 | 2002-09-20 | Ricoh Co Ltd | Method and system for inputting document as being proxy for another and recording medium |
JP2006079190A (en) * | 2004-09-07 | 2006-03-23 | Japan Medical Data Center Co Ltd | Optical character reader |
JP2006209649A (en) * | 2005-01-31 | 2006-08-10 | Nec Corp | Confidential document retrieval system, confidential document retrieval method and confidential document retrieval program |
JP2006244315A (en) * | 2005-03-04 | 2006-09-14 | Aidekku:Kk | Data entry system |
JP2012238142A (en) * | 2011-05-11 | 2012-12-06 | Konica Minolta Business Technologies Inc | Image processing system, image processing device and program |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021070167A (en) * | 2019-10-29 | 2021-05-06 | 株式会社寺岡精工 | Label information processing device, label information processing method and program |
Also Published As
Publication number | Publication date |
---|---|
JP6303742B2 (en) | 2018-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210192202A1 (en) | Recognizing text in image data | |
US10817615B2 (en) | Method and apparatus for verifying images based on image verification codes | |
US9626555B2 (en) | Content-based document image classification | |
JP5353148B2 (en) | Image information retrieving apparatus, image information retrieving method and computer program therefor | |
JP4926004B2 (en) | Document processing apparatus, document processing method, and document processing program | |
US8838657B1 (en) | Document fingerprints using block encoding of text | |
CN108108342B (en) | Structured text generation method, search method and device | |
JP2010073114A6 (en) | Image information retrieving apparatus, image information retrieving method and computer program therefor | |
JP2004334334A (en) | Document retrieval system, document retrieval method, and storage medium | |
US10142499B2 (en) | Document distribution system, document distribution apparatus, information processing method, and storage medium | |
US20160321500A1 (en) | Document analysis system, image forming apparatus, and analysis server | |
US9310971B2 (en) | Document viewing device for display document data | |
JP6262708B2 (en) | Document detection method for detecting original electronic files from hard copy and objectification with deep searchability | |
JP2005151127A5 (en) | ||
US20210295033A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2011238043A (en) | Summarized comic image generation device, program and method for generating summary of comic content | |
JP6303742B2 (en) | Image processing apparatus, image processing method, and image processing program | |
JP2006085234A (en) | Electronic document forming device, electronic document forming method, and electronic document forming program | |
JP7172343B2 (en) | Document retrieval program | |
JP2007334670A (en) | Device, method and program for image processing | |
KR20150130253A (en) | Method of extracting adaptive unstructured personal information in image for data loss prevention and apparatus for performing the method | |
JP2014044555A (en) | Image processing apparatus, image processing system, and program | |
JP2004280514A (en) | Pdf file and system for forming pdf file | |
JP2006092226A (en) | Document attribute acquisition method and device and recording medium with program recorded thereon | |
JP2008152502A (en) | Document image retrieval device and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170123 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6303742 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |