JP2012054825A - Graphic region acquisition device and program - Google Patents
Graphic region acquisition device and program Download PDFInfo
- Publication number
- JP2012054825A JP2012054825A JP2010196794A JP2010196794A JP2012054825A JP 2012054825 A JP2012054825 A JP 2012054825A JP 2010196794 A JP2010196794 A JP 2010196794A JP 2010196794 A JP2010196794 A JP 2010196794A JP 2012054825 A JP2012054825 A JP 2012054825A
- Authority
- JP
- Japan
- Prior art keywords
- graphic
- character
- document
- distance
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Facsimile Image Signal Circuits (AREA)
Abstract
Description
本発明は、図形領域取得装置及びプログラムに関する。 The present invention relates to a graphic area acquisition apparatus and a program.
特許文献1には、画像処理装置において、画像中の領域が所定サイズよりも小さいか、または略同色の画素が所定割合以上含まれていると判定されたら、文字判定手段にて文字が含まれているかを判定することが記載されている。 In Patent Document 1, if it is determined in the image processing apparatus that an area in an image is smaller than a predetermined size or that pixels having substantially the same color are included in a predetermined ratio or more, a character determination unit includes a character. It is described to determine whether or not.
特許文献2には、情報処理装置において、画像データの絵柄領域ごとに明度の頻度分布を求め、頻度分布中に存在する明度頻度のピークの数が所定数以上存在する絵柄領域をグラフ領域として検索することが記載されている。
In
本発明の解決しようとする課題は、文書中に含まれる図形が有する図形領域を、図形の周囲に付随する文字を含めて取得することである。 A problem to be solved by the present invention is to acquire a graphic region included in a graphic included in a document including characters accompanying the periphery of the graphic.
上記課題を解決するために、本発明の請求項1に記載の図形領域取得装置は、文書に含まれる文字及び図形を取得する文字図形取得手段と、前記文字と前記図形との幾何学的関係に基づき、前記図形及び、前記図形に関連付けられている前記文字を含む図形領域を取得する図形領域取得手段と、を有する。 In order to solve the above-mentioned problem, a graphic region acquisition apparatus according to claim 1 of the present invention is characterized in that character graphic acquisition means for acquiring characters and graphics included in a document, and a geometric relationship between the characters and the graphic. And a graphic area acquisition means for acquiring a graphic area including the graphic and the character associated with the graphic.
また、本発明の請求項2に記載の図形領域取得装置は、請求項1記載の図形領域取得装置であって、前記図形領域取得手段は、前記図形の外接矩形の少なくとも一辺からの距離が、第1の距離より小さい位置にある前記文字が前記図形に関連付けられていると判断する。
Further, the graphic region acquisition device according to
また、本発明の請求項3に記載の図形領域取得装置は、請求項1又は2記載の図形領域取得装置であって、前記図形領域取得手段は、前記図形の外接矩形の少なくとも一辺から当該辺に最も近い位置にある前記文字までの距離が第2の距離より小さい場合に、前記図形の外接矩形の少なくとも一辺からの距離が、前記第1の距離より小さい位置にある前記文字が前記図形に関連付けられていると判断する。
Moreover, the graphic region acquisition apparatus according to
また、本発明の請求項4に記載の図形領域取得装置は、請求項3記載の図形領域取得装置であって、前記図形領域取得手段は、前記図形の外接矩形の少なくとも一辺から当該辺に最も近い位置にある前記文字までの距離に応じて前記第1の距離を定める。
Further, the graphic area acquisition device according to
また、本発明の請求項5に記載の図形領域取得装置は、請求項1乃至4のいずれかに記載の図形領域取得装置であって、前記図形領域取得手段は、前記図形に関連付けられている前記文字と、他の前記文字との幾何学的関係に基づき、他の前記文字が前記図形に関連付けられていると判断する。
Moreover, the graphic area acquisition apparatus according to
また、本発明の請求項6に記載のプログラムは、コンピュータを、文書に含まれる文字及び図形を取得する文字図形取得手段と、前記文字と前記図形との幾何学的関係に基づき、前記図形及び、前記図形に関連付けられている前記文字を含む図形領域を取得する図形領域取得手段と、を有する図形領域取得装置として動作させる。 According to a sixth aspect of the present invention, there is provided a program, comprising: a computer, a character / figure obtaining unit that obtains a character / figure included in a document; and the geometrical relationship between the character and the graphic; And a graphic region acquiring unit that acquires a graphic region including the character associated with the graphic.
上記請求項1に記載の図形領域取得装置によれば、文書中に含まれる図形が有する図形領域を、図形の周囲に付随する文字を含めて取得することができる。 According to the graphic region acquisition apparatus of the first aspect, it is possible to acquire the graphic region included in the graphic included in the document including the characters accompanying the periphery of the graphic.
また、上記請求項2に記載の図形領域取得装置によれば、図形周囲に近接して配置されている文字を当該図形に関連付けることができる。
Moreover, according to the graphic area acquisition apparatus of the said
また、上記請求項3に記載の図形領域取得装置によれば、かかる構成を有しない場合に比して、図形の周囲に近接して配置されている文字を正確に当該図形に関連付けることができる。 In addition, according to the graphic region acquisition device of the third aspect, characters arranged close to the periphery of the graphic can be accurately associated with the graphic as compared with the case without such a configuration. .
また、上記請求項4に記載の図形領域取得装置によれば、かかる構成を有しない場合に比して、図形の周囲に近接して配置されている文字を正確に当該図形に関連付けることができる。 In addition, according to the graphic region acquisition device of the fourth aspect, characters arranged close to the periphery of the graphic can be accurately associated with the graphic as compared with the case where such a configuration is not provided. .
また、上記請求項5に記載の図形領域取得装置によれば、文書の周囲に近接して配置されている文字と関連し、一連の語や句を構成している文字を当該図形に関連付けることができる。 In addition, according to the graphic region acquisition apparatus of the fifth aspect, the characters constituting a series of words and phrases are associated with the graphic in relation to the characters arranged close to the periphery of the document. Can do.
また、上記請求項6に記載のプログラムによれば、コンピュータを、文書中に含まれる図形が有する図形領域を、図形の周囲に付随する文字を含めて取得する図形領域取得装置として動作させることができる。 According to the program of claim 6, the computer can be operated as a graphic area acquisition device that acquires a graphic area of a graphic included in a document including characters attached to the periphery of the graphic. it can.
図1は、本発明の実施形態に係る図形領域取得装置1の機能ブロック図である。 FIG. 1 is a functional block diagram of a graphic area acquisition apparatus 1 according to an embodiment of the present invention.
図形領域取得装置1は、物理的には汎用の情報処理装置である、CPU(Central Processing Unit)、メモリ、入出力インタフェースを有する一般的なコンピュータを用いて実現される。そして、かかるコンピュータ上で、コンピュータを図形領域取得装置1として動作させるためのコンピュータプログラムを実行することにより、図形領域取得装置1は仮想的に実現される。コンピュータを図形領域取得装置1として動作させるためのコンピュータプログラムは、たとえばDVD−ROM(DVD−Read Only Memory)やCD−ROM(Compact Disk Read Only Memory)等の任意の情報記録媒体に記録して提供しても、インターネットに代表される公衆回線等の電気通信回線を介して、コンピュータ読み取り可能な電気信号として提供してもよい。もちろん、図形領域取得装置1を実現するにあたり用いる情報処理装置は一般的なコンピュータに限られず、マイクロコントローラにより実現しても、またDSP(デジタルシグナルプロセッサ)等を用いて専用の装置を製作してもよい。また、図形領域取得装置1は、単独で動作可能な機器として構成しても、コピー機やファクシミリ等の事務機器に実装あるいは追加されるモジュールとして構成してもよい。 The graphic area acquisition apparatus 1 is realized by using a general computer having a CPU (Central Processing Unit), a memory, and an input / output interface, which is a general-purpose information processing apparatus. And the graphic area acquisition apparatus 1 is virtually implement | achieved by running the computer program for operating a computer as the graphic area acquisition apparatus 1 on this computer. A computer program for operating the computer as the graphic area acquisition device 1 is recorded and provided on an arbitrary information recording medium such as a DVD-ROM (DVD-Read Only Memory) or a CD-ROM (Compact Disk Read Only Memory). Alternatively, it may be provided as a computer-readable electric signal via an electric communication line such as a public line represented by the Internet. Of course, the information processing apparatus used to realize the graphic area acquisition apparatus 1 is not limited to a general computer, and can be realized by a microcontroller, or a dedicated apparatus can be manufactured using a DSP (digital signal processor) or the like. Also good. Further, the graphic area acquisition apparatus 1 may be configured as a device that can operate independently, or may be configured as a module that is mounted or added to office equipment such as a copier or a facsimile.
なお、図示された図形領域取得装置1の機能ブロックは、コンピュータプログラムにより実現される図形領域取得装置1を、その機能に着目して説明の便宜上示したものであり、必ずしも各機能ブロックが物理的に存在する必要はない。 The illustrated functional block of the graphic area acquisition apparatus 1 is a graphic area acquisition apparatus 1 realized by a computer program, for convenience of explanation, focusing on the function, and each functional block is not necessarily a physical block. Need not exist.
文書受付手段として機能する文書受付部2は、任意の文書を電子データとして外部より受け付けるインタフェースである。ここでいう文書は、紙あるいはマイクロフィルム等の物理的な媒体上に記録されたものであっても、電子データとして記録されたものであってもよい。この文書受付部2は、文書を電子データとして受け付けるものであればどのようなものであってもよく、例えば、コンピュータ上で実行されているプロセス間で情報の入出力を行う、いわゆるソケットであっても、LAN(Local Area Network)やインターネット等の公衆回線を含むWAN(Wide Area Network)等に接続された電気通信回線、任意の情報記録媒体読取装置等であってもよいし、紙あるいはマイクロフィルム等の媒体上の文書情報を電子化して読み取るスキャナなどの装置であってもよく、これらの複数を備えていてもよい。また、受け付けられる電子データの形式はどのようなものであってもよく、PDF(Portable Document Format)等のページ記述言語を用いたもの、XML(eXtensible Markup Language)等のマークアップ言語を用いたもの等のメタデータを有する形式のデータであっても、単なるラスタデータであってもよい。電子データの形式がメタデータを有するものである場合には、以降の処理の都合により、ラスタデータに展開してもよいが、必須のものではない。
The
文書受付部2により受け付けられた文書は、文字図形取得手段として機能する文字図形取得部3に受け渡される。文字図形取得手段は、文書に含まれる文字及び図形を取得する手段である。ここで、文字図形取得部3の構成は、文字図形取得手段として機能するものであればどのようなものでもよく、限定はされないが、本実施形態では、文書中に含まれるオブジェクトを取得し、その後、オブジェクトが文字であるか否かを判別して、文字であると判別されたオブジェクトを文字であると認識し、そうでないオブジェクトは図形として認識するように構成されている。ここで、オブジェクトが文字であるかどうかの認識は、オブジェクトの取得毎に行ってもよいし、文書中に含まれるすべてのオブジェクトを取得した後、オブジェクト毎に行ってもよい。一例として、本実施形態に係る文字図形取得部3は、オブジェクトの取得毎に文字かどうかの判別を行う構成とした。
The document received by the
なお、本明細書で、オブジェクトとは、文書中に含まれ、個々に分離されて認識される文字や図形あるいはそれらの一部分を意味している。例えば、文書の背景色により他のオブジェクトと隔てられ、たがいに連結している有彩色の画素の集合は、一つのオブジェクトである。ここで、有彩色とは、文書の背景色でない色を意味しており、例えば背景色が白であれば、黒を含む白以外の色は有彩色である。なお、文字図形取得部3によるオブジェクトの取得に先立って、文書を二値化して、白黒二色のみからなる画像に変換しておいてもよい。
In the present specification, an object means a character or figure included in a document and recognized separately and a part thereof. For example, a set of chromatic pixels separated from other objects by a background color of a document and connected to each other is one object. Here, the chromatic color means a color that is not the background color of the document. For example, if the background color is white, colors other than white including black are chromatic colors. Prior to the acquisition of the object by the character /
図2は、本実施形態に係る文字図形取得部3が文字及び図形を取得する動作を示すフローチャートである。まず、文字図形取得部3は、ステップS01で文書に含まれるオブジェクトを取得する。この方法は特に限定されず、公知のものを含めどのようなものを用いてもよいが、ここでは、いわゆるラベリングの手法により個々のオブジェクトを認識し取得するものとする。
FIG. 2 is a flowchart showing an operation in which the character /
続いて、文字図形取得部3は、ステップS02で取得したオブジェクトが文字か否かを判定する。この判定方法も特に限定されず、合理的に文字とそうでないものを判定できる方法であれば、公知のものを含めどのようなものを用いてもよい。ここでは、注目しているオブジェクトの外接矩形の大きさに基づきオブジェクトを文字であるかどうかを判定する。すなわち、一般に文書に用いられる文字の大きさ(ポイント数)は概ね決まっているため、注目しているオブジェクトの外接矩形の大きさが、通常用いられる文字の外形の大きさより小さい場合には、かかるオブジェクトを文字であると判定するのである。なお、ここでオブジェクトの外接矩形を求めるにあたっては、文書においては、文字は回転されることなく配置されることが通常であることに鑑み、その辺がそれぞれ文書の縦及び横方向に延びる向きであるような矩形を用いることが好ましい。また、これ以外にも、注目しているオブジェクトの特徴、例えば、交点や折れ曲がりの数や、含まれる直線の長さ等を抽出し、一般に文字が有する同種の特徴と比較することにより判定してもよいし、あるいは、OCR(Optical Character Recognition)等に用いられる文字認識を行ない、文字として認識されたオブジェクトを文字として判定してもよい。
Subsequently, the character
ステップS02で文字だと判定された場合には、ステップS03へと進み、注目しているオブジェクトを文字と認識する。この処理は、注目しているオブジェクトのデータに対し、当該オブジェクトが文字であることが判別できるよう操作する処理である。この操作もまた限定されるものではないが、例えば、得られたオブジェクトのデータに、当該オブジェクトが文字であることを示す情報を追加したり、或いは、文字であるようなオブジェクトのリストに、当該オブジェクトを示す識別情報を追加するなどすればよい。 If it is determined in step S02 that the character is a character, the process proceeds to step S03, and the object of interest is recognized as a character. This process is an operation to operate on the data of the object of interest so that it can be determined that the object is a character. Although this operation is not limited, for example, information indicating that the object is a character is added to the obtained object data, or the object is a list of objects that are characters. What is necessary is just to add the identification information which shows an object.
一方、ステップS02で文字だと判定されなかった場合には、ステップS04へと進み、注目しているオブジェクトを図形と認識する。この処理は、文字の場合同様に、注目しているオブジェクトのデータに対し、当該オブジェクトが図形であることが判別できるよう操作する処理である。 On the other hand, if it is not determined in step S02 that the character is a character, the process proceeds to step S04, and the object of interest is recognized as a figure. As in the case of characters, this process is an operation for operating on the data of the object of interest so that it can be determined that the object is a graphic.
ステップS03、S04のいずれの場合であっても、その後ステップS05へと進み、文書に含まれるすべてのオブジェクトを取得したか否か判定する。全てのオブジェクトを取得済みであれば処理を終え、そうでなければステップS01へと戻り、全てのオブジェクトを取得するまで繰り返す。 In either case of steps S03 and S04, the process proceeds to step S05, where it is determined whether all objects included in the document have been acquired. If all objects have been acquired, the process ends. If not, the process returns to step S01 and repeats until all objects are acquired.
図1に戻り、文字図形取得部3により取得された文字及び図形は、図形領域取得手段として機能する図形領域取得部4に受け渡される。図形領域取得手段は、文字と図形との幾何学的関係に基づき、図形及び、図形に関連付けられている文字を含む図形領域を取得する手段である。
Returning to FIG. 1, the characters and graphics acquired by the character /
以下、図形領域取得部4が図形領域を取得する動作を、図3乃至9を参照して説明する。なお、図3は、本実施形態に係る図形領域取得部4が図形領域を取得する動作を示すフローチャートである。
Hereinafter, an operation in which the graphic
図4は、文書の一例を示す図である。この例では、文書中右側に棒グラフが挿入されている。ここで、棒グラフの目盛を示す「100」、「200」及び「300」といった記載、或いは棒グラフの項目名を示す「手法A」、「手法B」及び「提案手法」といった記載は、一般に棒グラフに付随するものと認識され、同文書左側の本文からは区別される。本明細書でいう「図形の周囲に付随する文字」とは、この例に示すように、棒グラフなどの文字でない図形の周囲に配置されており、かかる図形と密接に関連するものとして認識され、他の文字や図形からは区別される文字を指している。 FIG. 4 is a diagram illustrating an example of a document. In this example, a bar graph is inserted on the right side of the document. Here, descriptions such as “100”, “200”, and “300” indicating the scale of the bar graph, or descriptions such as “method A”, “method B”, and “proposed method” indicating the item names of the bar graph are generally used in the bar graph. It is recognized as accompanying and is distinguished from the text on the left side of the document. As used in this specification, “characters attached to the periphery of a graphic” are arranged around a graphic that is not a character such as a bar graph, as shown in this example, and are recognized as being closely related to such a graphic, It refers to characters that are distinguished from other characters and figures.
係る文書は文書受付部2により受け付けられ、文字図形取得部3により文字と図形とが判定された状態で図形領域取得部4に受け渡される(図1参照)。図5は、図形領域取得部4に受け渡された図4の文書を示す概念図である。同図で、文字図形取得部3(図1参照)により判定された文字は、白抜きの外接矩形で示した。
The document is received by the
図形領域取得部4は、まず図3のステップS11において、文書に含まれる図形の一つに注目する。ここでは、図5中に符号5で示す図形が注目されたものとする。
The graphic
続いて、図形領域取得部4は、ステップS12において、注目された図形5の外接矩形6の任意の一辺を選択する。この外接矩形6は、ステップS12乃至ステップS14を説明する図である図6において破線で示され、そして、外接矩形の一辺として、ここでは、同図中左側の辺が選択されたものとする。なお、この外接矩形6は、その辺がそれぞれ文書の縦及び横方向に延びる向きであるような矩形を用いることが好ましい。
Subsequently, the graphic
続いて、ステップS13で、選択された辺から最も近い位置にある文字7までの距離L1を求める。このとき、文字は注目された図形5の外側に位置するものが選ばれる。そして、ステップS14で、距離L1と、予め定められた値である、第2の距離th2を比較し、距離L1が第2の距離th2より小さい場合には、図形領域取得部4は、当該選択された辺の近辺に、注目している図形に関連付けられた文字があると判断し、ステップS15へと進む。このとき、選択された辺から最も近い位置にある文字7の、選択された辺に垂直方向の幅wを取得しておく。図6には以上のステップS13及びステップS14で行われる判断の理解を容易にするため、外接矩形6の左辺に最も近い位置にある文字7、距離L1、第2の距離th2、文字7の幅wを図中に示した。なお、距離L1が第2の距離th2より大きい、又は、選択された辺の側に文字が存在しない場合には、図形領域取得部4は、当該選択された辺の近辺に、注目している図形に関連付けられた文字はないと判断し、ステップS18へと進む。
Subsequently, in step S13, a distance L1 to the
続いて、ステップS15を、図7を用いて説明する。ステップS15において、図形領域取得部4は、選択された辺から、第1の距離th1より近い位置にある文字8を、図形5に関連付けられていると判断する。この第1の距離th1は、本実施形態では、距離L1と幅wを合算したものを用いる。すなわち、th1=L1+wである。これにより、選択された辺から最も近い位置にある文字7に対し、選択された辺に平行な方向において、少なくとも一部分が重複するような位置にある文字が選択されることになる。なお、第1の距離th1は、必ずしも上述の通りに求める必要はなく、他にも、距離L1に一定値を合算したものとしてもよいし、或いは予め定められた一定値とするなどしてもよい。本実施形態のように、第1の距離th1を、図形5の外接矩形6の選択された辺から、当該辺に最も近い位置にある文字7までの距離L1に応じて定めると、そうしない場合、例えば一定値に固定した場合に比して、より正確に図形5に関連付けられた文字が判定される。
Next, step S15 will be described with reference to FIG. In step S <b> 15, the graphic
また、本実施形態では、ステップS15は、ステップS14の判断の結果が肯定的である場合、すなわち、図形5の外接矩形の少なくとも一辺から当該辺に最も近い位置にある文字7までの距離が第2の距離th2より小さい場合に実行される。しかしながら、この構成は必須のものでなく、上述のステップS13及びS14は省略してもよい。
In the present embodiment, step S15 is performed when the result of determination in step S14 is affirmative, that is, when the distance from at least one side of the circumscribed rectangle of the graphic 5 to the
続いて、ステップS16へと進み、図形領域取得部4は、図形5に関連付けられた文字と、他の文字との幾何学的関係に基づき、さらに、他の文字を図形5に関連付ける。これを図8を用いて説明する。
Subsequently, the process proceeds to step S <b> 16, and the graphic
ステップS16では、図形領域取得部4は、図形5に関連付けられた文字から、選択された外接矩形6の一辺から遠ざかる方向に向かい、第3の距離th3より近い位置に文字があるか否かを判定する。この第3の距離th3は、例えば文字7について図示したとおり、文字同士が一連の語や句として関連している場合に、かかる文字間の間隔より大きい値となるよう、予め定めておく。この場合、文字9が発見される。
In step S <b> 16, the graphic
ステップS16で第3の距離th3より近い位置に文字があると判定された場合には、ステップS17に進み、発見された文字9を図形5に関連付ける。そして、再びステップS16へと戻り、同様の判定を繰り返す。この場合、文字9はもはや図形5に関連付けられた文字であるから、文字9からさらに第3の距離th3より近い位置に文字があるか否かが判定されることになる。その結果、文字10が発見され、同様に図形5に関連付けられる。文字8についても同様の処理がなされ、文字11が図形5に関連付けられることになる。そして、関連付けられた文字7乃至11から第3の距離th3より近い位置に文字が発見されない場合に、ステップS18へと進む。
If it is determined in step S16 that there is a character at a position closer than the third distance th3, the process proceeds to step S17, and the found
なお、ここで説明したステップS16及びS17の処理は、上述したとおり、文字同士が一連の語や句として関連している場合に、互いに関連する文字を全て図形5に関連するものとして取得するための処理の一例であり、同様の結果が得られる処理であれば、ここで説明したものと異なる動作を行ってもよい。例えば、本実施形態では、ステップS16において、これまでに関連付けられた文字からの距離に基づいて他の文字が図形5に関連付けられるか否か判定しているが、これに換え、図形5の外接矩形6の選択された辺からの距離に基づき判定するようにしてもよい。あるいは、文字同士の他の幾何学的関係、例えば、選択された辺と平行な方向の位置関係を加味して、他の文字が図形5に関連付けられるか否か判定するようにしてもよい。 Note that, in the processes of steps S16 and S17 described here, as described above, when the characters are related as a series of words and phrases, all the characters related to each other are acquired as related to the graphic 5. As long as it is an example of the process and a process that can obtain the same result, an operation different from that described here may be performed. For example, in this embodiment, in step S16, it is determined whether or not another character is associated with the graphic 5 based on the distance from the character associated so far. The determination may be made based on the distance from the selected side of the rectangle 6. Or you may make it determine whether another character is linked | related with the figure 5 in consideration of the other geometrical relationship between characters, for example, the positional relationship of the direction parallel to the selected edge | side.
図形領域取得部4は、ステップS18にて、注目した図形5の外接矩形6について、全ての辺を選択したか否か判定する。未だ選択されていない外接矩形6の辺がある場合には、ステップS12へと戻り、未選択の辺を選択し、ステップS18までの上述の処理を繰り返す。これにより、図8に示すように、図形5の下側の項目名を示す文字12も図形5に関連付けられる。注目した外接矩形6の全ての辺が選択された場合には、ステップS19へと進む。
In step S <b> 18, the graphic
なお、本実施形態では、外接矩形6の4辺全てについて、ステップS12乃至S17の処理を行い、図形5と関連付けられる文字を探索しているが、必ずしもこれに限定されず、外接矩形6の予め定められた一部の辺についてのみステップS12乃至S17の処理を行うようにしてもよい。たとえば、処理しようとする文書に含まれる図形が、その左側と下側にのみ目盛を有するグラフであることがあらかじめ判っている場合などには、外接矩形6の左側の辺と下側の辺についてのみステップS12乃至S17の処理を行うようにしてもよい。また、ユーザが、外接矩形6のどの辺についてステップS12乃至S17の処理を行うか選択するようにしてもよい。さらに、本実施形態では、ステップS12乃至S17の処理に用いる閾値である第2の距離th2及び第3の距離th3は、外接矩形6のいずれの辺が選択された場合にも共通の値を使用しているが、これに替え、外接矩形6の辺ごとに異なる値を用いてもよい。第1の距離th1に予め定められた値を用いる場合も同様である。 In the present embodiment, the processing of steps S12 to S17 is performed for all four sides of the circumscribed rectangle 6 to search for characters associated with the graphic 5, but the present invention is not limited to this, and the circumscribed rectangle 6 is preliminarily stored. The processes in steps S12 to S17 may be performed only for some determined sides. For example, when it is known in advance that the figure included in the document to be processed is a graph having scales only on the left side and the lower side, the left side and the lower side of the circumscribed rectangle 6 Only steps S12 to S17 may be performed. In addition, the user may select which side of the circumscribed rectangle 6 to perform the processing of steps S12 to S17. Furthermore, in the present embodiment, the second distance th2 and the third distance th3, which are threshold values used in the processing in steps S12 to S17, use a common value when any side of the circumscribed rectangle 6 is selected. However, instead of this, a different value may be used for each side of the circumscribed rectangle 6. The same applies when a predetermined value is used for the first distance th1.
ステップS19では、図形領域取得部4は、注目した図形5についての図形領域13を取得する。図9は、図形領域13を示す図である。本実施形態において、この例では、図形5と、図形5に関連付けられた文字7乃至12を含む外接矩形であって、その辺がそれぞれ文書の縦及び横方向に延びる向きであるような矩形が図形領域13として取得される。
In step S <b> 19, the graphic
なお、図形領域とは、文書において、図形及びその図形に関連付けられた文字が含まれる領域を指しており、かならずしも、本実施形態のように、矩形の領域でなくともよい。すなわち、実際に図形とその図形に関連付けられた文字が文書中に占める領域そのものであってもよい。また、図形領域を示すデータの形式は特に問わない。本実施形態のように、図形領域が矩形である場合には、その幾何学的特徴を示す情報、例えば、その頂点の座標や縦横の幅であって良い。或いは、文書に含まれる文字が、ある図形に関連付けられていることを示すデータでもよい。それぞれの図形及び文字の位置や形状は文字図形取得部3により取得されていることから、ある図形とその図形に関連している文字が分かれば、その図形が有する図形領域は容易に求められる。なお、ここまで説明したように、図形領域は有る一つの図形に対し、少なくともその図形自身を含む領域として図形毎に求められる。そこで、本明細書では、ある図形にある図形領域が対応していることを、図形が有する図形領域、と表現している。
Note that the graphic area refers to an area including a graphic and characters associated with the graphic in a document, and is not necessarily a rectangular area as in the present embodiment. That is, it may be the area itself that the figure and characters associated with the figure actually occupy in the document. In addition, the data format indicating the graphic area is not particularly limited. When the graphic area is rectangular as in the present embodiment, information indicating the geometric feature, for example, the coordinates of the vertex and the horizontal and vertical widths may be used. Or the data which show that the character contained in a document is linked | related with a certain figure may be sufficient. Since the position and shape of each graphic and character are acquired by the character
図3に戻り、図形領域取得部4は、ステップS20で、文書に含まれる全ての図形に注目したか否か判定する。文書に含まれる全ての図形について注目しており、既にステップS11からステップS19までの処理が終了していれば、図形領域取得部4は、取得した図形領域についての情報を更に後段の処理あるいは機器に受け渡し、動作を終了する。まだ注目されていない図形が残存している場合には、ステップS11へと戻り、全ての図形についてステップS11からステップS19までの処理が完了するまで繰り返す。
Returning to FIG. 3, the graphic
なお、本実施形態では行っていないが、図9に示す図形領域13の内部に包含される図形及び文字を、図形5に関連付けるようにしてもよい。このとき、図形領域13を外接矩形として求めている場合には、図形領域13の形状に変化はない。 Although not performed in the present embodiment, a graphic and characters included in the graphic area 13 shown in FIG. 9 may be associated with the graphic 5. At this time, when the graphic area 13 is obtained as a circumscribed rectangle, the shape of the graphic area 13 is not changed.
なお、上述の説明に用いた文書は、説明の便宜を考慮して一例として提示したものであり、これに限定する意図ではない。また、上述の説明では、図形としてグラフを提示したが、これは一例である。グラフは、その周囲に関連付けられるべき文字を持つ代表的な図形であるが、本実施形態における図形は、グラフに限定されない。何らかの図形であって、その周囲に関連付けられるべき文字を持つものであればいかなるものであってもよい。 The document used in the above description is presented as an example in consideration of the convenience of the description, and is not intended to be limited to this. In the above description, a graph is presented as a graphic, but this is an example. The graph is a representative graphic having characters to be associated therewith, but the graphic in the present embodiment is not limited to the graph. Any figure may be used as long as it has characters to be associated with it.
また、本実施形態の図形領域取得装置1により取得された図形領域は、後段の任意の処理あるいは機器に用いてもよく、特段限定されない。後段でなされる処理を例示すると、例えば、文書中の図形を、その周囲の関連付けられた文字を含め、本文から分離して取得する処理や、文書をOCRにて自動認識する際に、文書中に含まれる図形を、その周囲の関連付けられた文字を含め、自動認識の対象外とする処理などが挙げられる。 In addition, the graphic area acquired by the graphic area acquisition apparatus 1 of the present embodiment may be used for any subsequent process or device, and is not particularly limited. Examples of processing performed in the subsequent stage include, for example, processing in which a figure in a document is acquired separately from the body including its associated characters, and when the document is automatically recognized by OCR, And the like, including the associated characters around it, and the like are excluded from automatic recognition.
以上説明した実施形態において示した機能ブロックは、それぞれの実施形態を実施する上での一例であり、機能ブロックの構成や配置を例示したものに限定するものではない。また、フローチャートは、実施形態で示した機器の機能を実現するための一具体例であり、かかる動作に限定されず、同様の機能を有する処理であればいかなる処理を行ってもよい。 The functional blocks shown in the above-described embodiments are examples for implementing the respective embodiments, and are not limited to those illustrating the configuration and arrangement of the functional blocks. The flowchart is a specific example for realizing the function of the device shown in the embodiment, and is not limited to such an operation, and any process may be performed as long as the process has a similar function.
1 図形領域取得装置、2 文書受付部、3 文字図形取得部、4 図形領域取得部、5 図形、6 外接矩形、7,8,9,10,11,12 文字、13 図形領域。 DESCRIPTION OF SYMBOLS 1 Graphic area acquisition apparatus, 2 Document reception part, 3 Character figure acquisition part, 4 Graphic area acquisition part, 5 Graphics, 6 circumscribed rectangle, 7, 8, 9, 10, 11, 12 characters, 13 graphic area.
Claims (6)
前記文字と前記図形との幾何学的関係に基づき、前記図形及び、前記図形に関連付けられている前記文字を含む図形領域を取得する図形領域取得手段と、
を有する図形領域取得装置。 A character graphic acquisition means for acquiring characters and graphics included in the document;
Based on the geometric relationship between the character and the graphic, the graphic region acquisition means for acquiring the graphic region including the graphic and the character associated with the graphic;
A graphic area acquisition device having
文書に含まれる文字及び図形を取得する文字図形取得手段と、
前記文字と前記図形との幾何学的関係に基づき、前記図形及び、前記図形に関連付けられている前記文字を含む図形領域を取得する図形領域取得手段と、
を有する図形領域取得装置として動作させるためのプログラム。 Computer
A character graphic acquisition means for acquiring characters and graphics included in the document;
Based on the geometric relationship between the character and the graphic, the graphic region acquisition means for acquiring the graphic region including the graphic and the character associated with the graphic;
A program for operating as a graphic area acquisition apparatus having
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010196794A JP5720147B2 (en) | 2010-09-02 | 2010-09-02 | Graphic region acquisition apparatus and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010196794A JP5720147B2 (en) | 2010-09-02 | 2010-09-02 | Graphic region acquisition apparatus and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012054825A true JP2012054825A (en) | 2012-03-15 |
JP5720147B2 JP5720147B2 (en) | 2015-05-20 |
Family
ID=45907686
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010196794A Active JP5720147B2 (en) | 2010-09-02 | 2010-09-02 | Graphic region acquisition apparatus and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5720147B2 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10228473A (en) * | 1997-02-13 | 1998-08-25 | Ricoh Co Ltd | Document picture processing method, document picture processor and storage medium |
WO2007018501A1 (en) * | 2005-07-27 | 2007-02-15 | Hewlett-Packard Development Company, L.P. | A method for finding text reading order in a document |
JP2008022159A (en) * | 2006-07-11 | 2008-01-31 | Canon Inc | Document processing apparatus and document processing method |
JP2009147562A (en) * | 2007-12-12 | 2009-07-02 | Canon Inc | Image processing device and method, and program |
-
2010
- 2010-09-02 JP JP2010196794A patent/JP5720147B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10228473A (en) * | 1997-02-13 | 1998-08-25 | Ricoh Co Ltd | Document picture processing method, document picture processor and storage medium |
WO2007018501A1 (en) * | 2005-07-27 | 2007-02-15 | Hewlett-Packard Development Company, L.P. | A method for finding text reading order in a document |
JP2008022159A (en) * | 2006-07-11 | 2008-01-31 | Canon Inc | Document processing apparatus and document processing method |
JP2009147562A (en) * | 2007-12-12 | 2009-07-02 | Canon Inc | Image processing device and method, and program |
Also Published As
Publication number | Publication date |
---|---|
JP5720147B2 (en) | 2015-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10432820B2 (en) | Image processing apparatus, image processing system, control method for image processing apparatus, and non-transitory computer readable medium | |
JP5059545B2 (en) | Image processing apparatus and image processing method | |
CN109543501B (en) | Image processing apparatus, image processing method, and storage medium | |
US20190188462A1 (en) | Form type learning system and image processing apparatus | |
JP5826081B2 (en) | Image processing apparatus, character recognition method, and computer program | |
US8655107B2 (en) | Signal processing apparatus, signal processing method, computer-readable medium and computer data signal | |
JP2007042106A (en) | Document processing method, document processing media, document management method, document processing system, and document management system | |
US8412705B2 (en) | Image processing apparatus, image processing method, and computer-readable storage medium | |
EP2270714A2 (en) | Image processing device and image processing method | |
US10142499B2 (en) | Document distribution system, document distribution apparatus, information processing method, and storage medium | |
US20090324080A1 (en) | Image processing device, image processing method and storage medium | |
US9558433B2 (en) | Image processing apparatus generating partially erased image data and supplementary data supplementing partially erased image data | |
US9691004B2 (en) | Device and method for service provision according to prepared reference images to detect target object | |
JP2010074540A (en) | Image processing apparatus | |
US7864985B1 (en) | Automatic operator-induced artifact detection in document images | |
JP4582204B2 (en) | Image processing apparatus, image conversion method, and computer program | |
US9277094B2 (en) | Image processing apparatus and recording medium | |
JP4859054B2 (en) | Image processing apparatus, image processing method, program, and recording medium | |
JP2012205181A (en) | Image processing device and program | |
JP5720147B2 (en) | Graphic region acquisition apparatus and program | |
US9836799B2 (en) | Service provision program | |
JP5691547B2 (en) | Image change location extraction device, image change location display device, and program | |
JP5159588B2 (en) | Image processing apparatus, image processing method, and computer program | |
JP7365835B2 (en) | Structure recognition system, structure recognition device, structure recognition method, and program | |
JP5397098B2 (en) | Image forming apparatus, image composition method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130819 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140805 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141003 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150224 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150309 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5720147 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |