JP3623998B2 - Image processing method and image processing apparatus - Google Patents

Image processing method and image processing apparatus Download PDF

Info

Publication number
JP3623998B2
JP3623998B2 JP01169695A JP1169695A JP3623998B2 JP 3623998 B2 JP3623998 B2 JP 3623998B2 JP 01169695 A JP01169695 A JP 01169695A JP 1169695 A JP1169695 A JP 1169695A JP 3623998 B2 JP3623998 B2 JP 3623998B2
Authority
JP
Japan
Prior art keywords
image
word
appearance frequency
words
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP01169695A
Other languages
Japanese (ja)
Other versions
JPH08202731A (en
Inventor
康男 福田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP01169695A priority Critical patent/JP3623998B2/en
Priority to US08/562,450 priority patent/US5821929A/en
Publication of JPH08202731A publication Critical patent/JPH08202731A/en
Application granted granted Critical
Publication of JP3623998B2 publication Critical patent/JP3623998B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【産業上の利用分野】
本発明は入力画像に適したキーワードを判断し得る画像処理方法および画像処理装置に関するものである。
【0002】
【従来の技術】
従来、文字認識装置を備えた画像データベースにおいて、文字認識の結果得られた文字列は文書作成の際に再利用されるためのものであったので、データベースに登録される際に付加されるキーワードやファイル名称はユーザが選択し入力していた。また、入力画像の所定位置の画像を文字認識してキーワードとして登録するものがあった。
【0003】
【発明が解決しようとしている課題】
そのため、画像データをデータベースに登録する際にキーワード入力といったユーザの処理が必要となり、データベース登録の自動化等が困難となるという問題があった。また、キーワードを付加しない方法も考えられるが、この場合ユーザのキー入力は不要だが、後で検索する場合にキーワードが登録されないのでキーワードによる簡便な検索が不可能となるという問題点があった。
【0004】
【課題を解決するための手段】
上記課題を解決するために、本発明の画像処理方法は、入力画像内の文字画像を文字認識処理することにより、文字列を生成する文字認識ステップと、前記文字認識ステップで生成された文字列を形態素解析することにより、該文字列から複数の単語を抽出する抽出ステップと、前記抽出ステップで抽出された各単語の出現頻度を調べる出現頻度調査ステップと、前記出現頻度調査ステップで調べた出現頻度に基づいて、前記抽出ステップで抽出された複数の単語の中から、前記入力画像のキーワードとして用いる単語を選択するキーワード選択ステップと、前記入力画像と共に前記キーワード選択ステップで選択された単語を、データベースに登録する登録ステップと、の各ステップを画像処理装置が実行するように制御するための画像処理方法であって、更に、前記キーワード選択ステップでは、選択可能なキーワードの最大数が予め設定されており、且つ、前記出現頻度が高い方の単語から順にキーワードとして選択していく際に、同一の出現頻度の単語が複数存在し且つその出現頻度の単語全てをキーワードとして選択すると前記最大数を超えてしまう場合、その出現頻度の単語の中で前記入力画像上での当該単語の文字画像の大きさが大きいものから順に前記最大数を超えないように選択することを特徴とする。
【0005】
上記課題を解決するために、本発明の画像処理装置は、入力画像内の文字画像を文字認識処理することにより、文字列を生成する文字認識手段と、前記文字認識手段で生成された文字列を形態素解析することにより、該文字列から複数の単語を抽出する抽出手段と、前記抽出手段で抽出された各単語の出現頻度を調べる出現頻度調査手段と、前記出現頻度調査手段で調べた出現頻度に基づいて、前記抽出手段で抽出された複数の単語の中から、前記入力画像のキーワードとして用いる単語を選択するキーワード選択手段と、前記入力画像と共に前記キーワード選択手段で選択された単語をデータベースに登録する登録手段と、を有する画像処理装置であって、更に、前記キーワード選択手段は、選択可能なキーワードの最大数が予め設定されており、且つ、前記出現頻度が高い方の単語から順にキーワードとして選択していく際に、同一の出現頻度の単語が複数存在し且つその出現頻度の単語全てをキーワードとして選択すると前記最大数を超えてしまう場合、その出現頻度の単語の中で前記入力画像上での当該単語の文字画像の大きさが大きいものから順に前記最大数を超えないように選択することを特徴とする。
【0014】
【実施例】
本発明について、図面を参照して詳細に説明する。
【0015】
図7は本実施例における装置の構成を表わすブロック図である。1001は本装置全体の処理を実行するCPUであって、ROM1002或いはRAM1003に格納されている制御プログラムに従って判断及び処理を制御する。1002はROMであり、本実施例において説明するフローチャートの制御プログラム、或いは処理に用いる予め定まっているパラメータ等のデータを記憶している。文字認識処理及び単語分離処理に用いる辞書もROM1002に格納されている。1003はRAMであり、CPU1001での処理中のデータを記憶するワーキングメモリエリアを備える。本実施例で実行する処理の制御プログラムがFD等の着脱可能な記憶媒体から供給される場合は、その制御プログラムはRAM1003に格納される。本実施例において作成されるデータベースもRAM1003に格納される。1004はスキャナであり、原稿画像を光学的に読み込む。読み込まれた画像データはRAM1003に記憶できる。1005はキーボードであり、各種コードの入力、オペレータの指示が入力できる。1006はポインティングデバイスであり、表示器1007の表示画面上の所望の位置を指示でき、また、ボタンをクリックすることにより選択、取消の指示を入力することもできる。1007は表示器であり、CRT或いは液晶表示器からなる。1008は例えばLBP、インクジェット式等のプリンタ、1009は例えばフロッピーディスクなどの外部記憶装置を装着し、データの読み書きを行うフロッピーディスクドライブ(FDD)、1010はこれら各構成間でのデータの受授を行う為のデータバスである。
【0016】
図5は、本発明の一実施例の画像データベースシステムの機能的な構成を示す図である。このシステムにおいて、スキャナ1004より入力した原稿の入力画像をまず画像領域分離手段(501)において、画像領域分離処理を行った後に、文字認識手段(502)により認識結果の文字列を生成し、単語分離手段(503)は、辞書(506)を参照しながら認識結果の文字列を解析し単語毎に分離し、キーワード判定手段(504)によりキーワード判定を行いその結果選択されたキーワードは入力画像とともにデータベース(505)に登録する。
【0017】
図1は、本発明の一実施例の画像データベースシステムの画像入力からデータベースに登録するまでの全体的な処理を表わすフローチャートである。まず、画像領域分離手段501は、入力画像を解析して文字や画像のデータがある部分を矩形で囲むように分離してブロック化し、各ブロックをそのブロックの画像の特徴により画像の種別を分類するが、ここでは仮に入力画像から抽出された各ブロックを文字領域であるか画像領域であるかに分類する。すなわち例えば、入力画像が図2に示す画像であった場合、S101による処理の結果として図3におけるB301〜B307の幾つかのブロックが抽出され、各ブロックを分類してB301〜B306は文字領域、B307は画像領域と判定される。その結果、入力画像中に存在する複数の画像ブロックを取り出して文字部画像領域とその他すなわち画像部画像領域とに分離し、文字部画像領域情報をRAM1003に格納し、文字認識手段502に渡す(S101)。
【0018】
次に、文字認識手段502において文字部画像領域と判定された各画像領域に対して文字認識を行うが、まずその文字部画像領域の画像をさらに1文字単位に切り分ける(文字切り処理)。文字切り処理は、各文字画像領域の画像をまず行方向(左右方向)にヒストグラムをとって行位置を切り出し、次に各行ごとに上下方向にヒストグラムをとって1文字ごとの位置を切り出す。例えば、図3における文字部画像領域B302に対して文字切り処理を行うと図4の一文字画像領域B401〜B409のように分離される。この各一文字画像領域に対し、ROM1002に格納されている辞書を用いてパターンマッチング処理を行い、各一文字画像領域が表わす文字を認識しそれに対応した文字列を出力し(S102)、ブロック情報とともにRAM1003に格納する。例えば、図3の各ブロックを文字認識結果した結果、
・「重要書類」(B301より)
・「観音株式会社 新製品説明会」(B302より)
・「観音株式会社代表取締役社長 大仏 巌」(B303より)
・「拝啓、貴社益々御清栄のことと御慶び申し上げます。さて、この度弊社新製品の発売にさきがけまして新製品説明会を企画いたしましたのでご案内申し上げます。」(B304より)
・「記」(B305より)
・「日時:○月×日 午前8:00〜午後5:00 場所:△△県◎◎市 1−2−3 特設会場 (地図参照)」(B306より)
というような文字列が生成される。
【0019】
次に、S102の結果の文字列をRAM1003から読み出して単語分離手段(503)により単語に分割する(S103)。単語分離手段は、辞書(506)を参照しながら認識結果文字列を単語毎に分離(形態素解析)し(S103)、RAM1003に格納する。RAM1003に格納する際に、各単語の品詞に関する情報を辞書504より抽出し、単語に付加して格納する。
【0020】
次に、RAM1003に格納されている単語分離手段(503)により入力画像から抽出された全単語について、キーワード判定手段504によってキーワード判定処理を行う(S104)。
【0021】
キーワード判定処理(S104)の詳細な処理の流れについては、図6のフローチャートに示し、これを参照しながら説明する。まず、RAM1003に格納されている各単語に付加されている品詞情報を判断し、品詞による絞り込みを行う。本実施例においては、キーワードに適しそうなものとして名詞を取り出す(S601)。先の各ブロックの認識結果である文字列より例えば以下の単語が名詞として抽出される。
【0022】
・「重要書類」(B301より)
・「観音株式会社」、「新製品説明会」(B302)
・「観音株式会社」、「代表取締役社長」、「大仏巌」(B303)
・「清栄」、「お慶び」、「弊社新製品」、「発売」、「新製品説明会」、「企画」、「ご案内」(B304)
・「日時」、「場所」、「△△県◎◎市」、「特設会場」、「地図参照」(B305)
という単語が挙がったとする。次に出現頻度の高い単語ほど、その文書中での重要性が高いと想定されるのでこれらの各単語の出現頻度を調べる(S602)。すると、
・観音株式会社(頻度2、B302、B303より)
・新製品説明会(頻度2、B302、B304より)
・重要書類(頻度1、B301より)
・代表取締役社長(頻度1、B303より)
・大仏巌(頻度1、B303より)
・清栄(頻度1、B304より)
・お慶び(頻度1、B304より)
・弊社新製品(頻度1、B304より)
・発売(頻度1、B304より)
・企画(頻度1、B304より)
・案内(頻度1、B304より)
・日時(頻度1、B305より)
・場所(頻度1、B305より)
・△△県◎◎市(頻度1、B305より)
・特設会場(頻度1、B305より)
・地図参照(頻度1、B305より)
という結果が得られる。
【0023】
次のステップS603において、1つの入力画像に設定し得るキーワードの個数の最大値(K)をここでは仮に5個とする。また名詞の出現頻度の最大値(N)は、先ほどのステップS602の結果より2である。従ってこのステップの処理の結果、
K=5、N=2、S=0、I=2
となる。ここで、Sは選択状態になった名詞の数の合計を表し、Iは作業変数である。
【0024】
次のステップS604では、出現頻度がIである名詞の数を調べそれをMに設定する。従ってここでは、出現頻度2である名詞は、「観音株式会社」、「新製品説明会」の2つなので、本処理の結果Mは2になる。
【0025】
次に、SとMの合計がK以下かどうか、すなわち、出現頻度がIであるキーワードを選んでもキーワードの個数の最大値以下かどうかを判定する(S605)。本例の場合、ここではS=0、M=2なので、S+M=2でステップS605の判定結果は真となり、処理はステップS606へと続き、出現頻度I(=2)である名詞について内部的に選択状態にする。選択状態にする単語は、RAM1003内のキーワード用選択単語格納部に格納する。ここで、M個の名詞が選択状態になったので、SをM増やす(S607)。本例の場合、ここではステップS607の結果Sの値は2となる。
【0026】
次にIが1であるかどうか判定する(S608)。もし、Iが1であれば、ステップS604で判定したのは出現頻度が1である名詞であり、すなわちこれ以上調べる名詞がないということになり、処理はステップS613に移る。本例の場合、ここではIは2であるので、判定の結果は偽になり、ステップS609に処理が移りIは1減算されて1になり、処理はステップS604に戻り、出現頻度が1の単語からキーワードとして登録する単語を選択する処理に入る。
【0027】
今度は出現頻度が1の単語が対象であるので、ステップS604において、本例の場合、ここではMは14となり、次のステップS605の判定は偽(S+M=16で、K=5)となり、処理はステップS610へと移る。
【0028】
ステップS610では、現在選択状態になっている名詞の数が、キーワードの個数の制限と同じかどうかを調べる。もし、同じであれば、次のステップS611及びステップS612を飛ばして、ステップS613へと進む。本例の場合、S=2でK=5なので、判定の結果は偽となり、ステップS611へと進む。
【0029】
ステップS611では(K−S)個のキーワードを出現頻度Iである名詞から選択する。これは、頻度の情報によりS個の名詞がキーワードとして選択されたが、実際登録可能なキーワードはK個なので、残り(K−S)個のキーワードが登録可能なので、それを選択されていない残りの名詞から選択するためである。本例の場合、K=5、S=2なので、5−2=3個のキーワードを残りの14個の名詞から選択する。
【0030】
残り(K−S)個のキーワードの選択方法は、名詞の出現位置が文頭方向にある順に(K−S)個選択(この場合、本例では、「重要書類」、「代表取締役社長」、「大仏巌」が選択される)してもよいし、また、本実施例においては文字認識手段502は文字の大きさに関する情報は出力しなかったが、文字認識手段502により各文字の大きさの情報を抽出し、文字の大きい順に残り(K−S)個の名詞を選択してもよいし、また、これらを組み合わせてもよい。
【0031】
次に、ステップS613で(K−S)個のキーワードを選択したので、全部でK個のキーワードの選択処理が終了し、選択状態になったS個の名詞をキーワードとする。
【0032】
最後に、キーワード判定処理(S104)で選択され、RAM1003のキーワード用選択単語格納部に格納されているキーワードを入力画像とともにRAM1003内のデータベースに登録し(S105)、処理を終了する。
【0033】
キーワードとして登録された単語は、データベースから画像検索する際に、目次的に表示されたり、単語が検索指定入力された場合に、その単語と同一の単語とともにデータベースに記憶されている画像を表示或いは印字するので、画像検索が容易となる。
【0034】
尚、本実施例では、キーワード選択手段によりキーワード個数の制限から幾つかのキーワードを選択していたが、ここでの選択個数を1つにして選択されたキーワードを入力ファイルのファイル名称としてデータベースに登録しても良い。
【0035】
尚、本実施例においては全ての文字を認識してから単語を抽出したが、例えば英文等の単語がスペースにより区切られている言葉の場合は、文字認識する以前に単語領域の画像どうしでマッチングを行って出現頻度の高い単語を検出し、その検出された単語を文字認識してからキーワードとして登録しても良い。
【0036】
【発明の効果】
以上説明したように、本発明によれば、入力画像において出現頻度の高い単語をその入力画像に付加するキーワードとして選択するので、キーボードによるオペレータの手操作を介さなくとも精度良いキーワードを選択することができる。
【0037】
以上説明したように、本発明によれば、キーワードとして登録する単語のパターンを選択してから文字認識するので、余計な文字認識処理に時間を費やすことがなく、キーワードを選択するまでの処理時間を短縮することができる。
【0038】
以上説明したように、本発明によれば、特定の品詞の単語をキーワード選択処理の対象として絞り込むので、選択処理時間を短縮することができ、また、キーワードとして適した単語を選択することができる。
【0039】
以上説明したように、本発明によれば、スキャナにより入力した画像とともに記憶させる単語の選択を入力画像から抽出するので、キーボードを用いた操作が不要となり、操作性が向上する。
【図面の簡単な説明】
【図1】本実施例の処理全体の流れを表わすフローチャート。
【図2】入力画像例を表わす図。
【図3】画像領域分離処理結果例を表わす図。
【図4】一文字画像分離処理結果例を表わす図。
【図5】本実施例の装置の機能構成図。
【図6】キーワード判定処理の流れを表わすフローチャート。
【図7】本実施例の装置の構成ブロック図。
[0001]
[Industrial application fields]
The present invention relates to an image processing method and an image processing apparatus that can determine a keyword suitable for an input image.
[0002]
[Prior art]
Conventionally, in an image database equipped with a character recognition device, a character string obtained as a result of character recognition is for reuse when creating a document. And the file name was selected and entered by the user. In addition, there is a technique in which an image at a predetermined position of an input image is recognized and registered as a keyword.
[0003]
[Problems to be solved by the invention]
Therefore, when registering image data in the database, user processing such as keyword input is required, which makes it difficult to automate database registration. A method without adding a keyword is also conceivable. In this case, the user does not need to enter a key, but there is a problem that a simple search using a keyword becomes impossible because a keyword is not registered when searching later.
[0004]
[Means for Solving the Problems]
In order to solve the above problems, an image processing method of the present invention includes a character recognition step of generating a character string by character recognition processing of a character image in an input image, and a character string generated in the character recognition step. By extracting a plurality of words from the character string, an appearance frequency examining step for examining the appearance frequency of each word extracted in the extraction step, and an appearance examined in the appearance frequency examining step Based on the frequency, a keyword selection step for selecting a word to be used as a keyword of the input image from a plurality of words extracted in the extraction step, and a word selected in the keyword selection step together with the input image, A registration step registered in the database, and an image processing for controlling the image processing apparatus to execute each step. Further, in the keyword selection step, the maximum number of keywords that can be selected is set in advance, and when the keywords are selected in order from the word having the highest appearance frequency, the same number is selected. When there are a plurality of words having the appearance frequency and all the words having the appearance frequency are selected as keywords, the maximum number is exceeded, and the size of the character image of the word on the input image among the words having the appearance frequency In order from the largest, the maximum number is selected so as not to exceed.
[0005]
In order to solve the above problems, an image processing apparatus according to the present invention performs character recognition processing on a character image in an input image to generate a character string, and a character string generated by the character recognition unit. The extraction means for extracting a plurality of words from the character string, the appearance frequency investigation means for examining the appearance frequency of each word extracted by the extraction means, and the appearance examined by the appearance frequency investigation means Based on the frequency, a keyword selection unit that selects a word to be used as a keyword of the input image from among a plurality of words extracted by the extraction unit, and a database that selects the word selected by the keyword selection unit together with the input image The keyword selecting means is preset with a maximum number of selectable keywords. In addition, when selecting as a keyword in order from the word with the highest appearance frequency, if there are a plurality of words with the same appearance frequency and all the words with the appearance frequency are selected as keywords, the maximum number is exceeded. In such a case, it is characterized in that the words having the appearance frequency are selected so as not to exceed the maximum number in descending order of the size of the character image of the word on the input image.
[0014]
【Example】
The present invention will be described in detail with reference to the drawings.
[0015]
FIG. 7 is a block diagram showing the configuration of the apparatus in this embodiment. A CPU 1001 executes processing of the entire apparatus, and controls determination and processing in accordance with a control program stored in the ROM 1002 or the RAM 1003. Reference numeral 1002 denotes a ROM which stores a control program of a flowchart described in the present embodiment or data such as predetermined parameters used for processing. A dictionary used for character recognition processing and word separation processing is also stored in the ROM 1002. Reference numeral 1003 denotes a RAM, which includes a working memory area for storing data being processed by the CPU 1001. When a control program for processing executed in this embodiment is supplied from a removable storage medium such as an FD, the control program is stored in the RAM 1003. The database created in this embodiment is also stored in the RAM 1003. Reference numeral 1004 denotes a scanner which optically reads a document image. The read image data can be stored in the RAM 1003. Reference numeral 1005 denotes a keyboard which can input various codes and operator instructions. Reference numeral 1006 denotes a pointing device, which can indicate a desired position on the display screen of the display 1007, and can input a selection or cancellation instruction by clicking a button. Reference numeral 1007 denotes a display, which includes a CRT or a liquid crystal display. 1008 is a printer such as an LBP or an ink jet printer, 1009 is an external storage device such as a floppy disk, and a floppy disk drive (FDD) for reading and writing data 1010 is a data transfer between these components This is a data bus for performing.
[0016]
FIG. 5 is a diagram showing a functional configuration of the image database system according to the embodiment of the present invention. In this system, the input image of the document input from the scanner 1004 is first subjected to image region separation processing in the image region separation means (501), and then a character string as a recognition result is generated by the character recognition means (502). The separating means (503) analyzes the character string of the recognition result while referring to the dictionary (506) and separates it for each word. The keyword determining means (504) performs keyword determination, and the keyword selected as a result is input together with the input image. Register in the database (505).
[0017]
FIG. 1 is a flowchart showing overall processing from image input to registration in a database of an image database system according to an embodiment of the present invention. First, the image region separation unit 501 analyzes an input image, separates a portion with character or image data into a rectangle so as to be surrounded by a rectangle, and classifies each block according to the image characteristics of the block. However, here, each block extracted from the input image is classified into a character area or an image area. That is, for example, if the input image is the image shown in FIG. 2, several blocks B301 to B307 in FIG. 3 are extracted as a result of the processing in S101, and each block is classified, and B301 to B306 are character regions, B307 is determined to be an image area. As a result, a plurality of image blocks existing in the input image are taken out and separated into a character part image area and other parts, that is, an image part image area, character part image area information is stored in the RAM 1003, and is passed to the character recognition means 502 ( S101).
[0018]
Next, character recognition is performed on each image area determined as a character part image area by the character recognition unit 502. First, the image of the character part image area is further divided into character units (character cutting process). In the character cutting process, the image of each character image region is first cut out in the row direction (left and right direction) to cut out the row position, and then the histogram is cut up and down in each row to cut out the position for each character. For example, when character cut processing is performed on the character part image area B302 in FIG. 3, the character part image areas B401 to B409 in FIG. 4 are separated. A pattern matching process is performed on each one-character image area using a dictionary stored in the ROM 1002, the character represented by each one-character image area is recognized, and a character string corresponding to the character is output (S102). To store. For example, as a result of character recognition for each block in FIG.
・ "Important documents" (from B301)
・ "Kannon Co., Ltd. New Product Briefing" (from B302)
・ "Kannon Co., Ltd. President and Representative Director Satoshi Daibutsu" (from B303)
・ "Dear Sirs, I would like to thank you for your success. Now, I will inform you that we have planned a new product briefing for the launch of our new product." (From B304)
・ "Note" (from B305)
・ "Date and time: XX month x day 8:00 am to 5:00 pm Location: △△ prefecture ◎◎ City 1-2-3 Special venue (see map)" (from B306)
Will be generated.
[0019]
Next, the character string resulting from S102 is read from the RAM 1003 and divided into words by the word separation means (503) (S103). The word separation means separates the recognition result character string for each word (morphological analysis) while referring to the dictionary (506) (S103) and stores it in the RAM 1003. When storing in the RAM 1003, information on the part of speech of each word is extracted from the dictionary 504, added to the word, and stored.
[0020]
Next, the keyword determination unit 504 performs keyword determination processing on all the words extracted from the input image by the word separation unit (503) stored in the RAM 1003 (S104).
[0021]
The detailed processing flow of the keyword determination processing (S104) is shown in the flowchart of FIG. 6 and will be described with reference to this flowchart. First, the part-of-speech information added to each word stored in the RAM 1003 is determined, and narrowing down by part-of-speech is performed. In the present embodiment, nouns are extracted as being suitable for keywords (S601). For example, the following words are extracted as nouns from the character string that is the recognition result of each of the previous blocks.
[0022]
・ "Important documents" (from B301)
・ “Kannon Co., Ltd.”, “New Product Information Session” (B302)
・ "Kannon Co., Ltd.", "President and CEO", "Great Buddha" (B303)
・ "Seiei", "Okay", "Our new product", "Release", "New product briefing", "Planning", "Guide" (B304)
・ "Date and time", "Place", "△△ prefecture ◎◎ city", "special venue", "map reference" (B305)
The word is raised. Next, it is assumed that the word having the highest appearance frequency is more important in the document, so the appearance frequency of each of these words is examined (S602). Then
・ Kannon Co., Ltd. (Frequency 2, from B302 and B303)
・ New product briefing (Frequency 2, from B302 and B304)
・ Important documents (Frequency 1, from B301)
・ President and CEO (Frequency 1, B303)
・ Great Buddha (frequency 1, from B303)
・ Seiei (Frequency 1, from B304)
・ Good night (frequency 1, from B304)
・ Our new product (frequency 1, from B304)
・ Release (frequency 1, from B304)
・ Planning (frequency 1, from B304)
・ Guidance (Frequency 1, from B304)
・ Date (frequency 1, from B305)
・ Location (Frequency 1, from B305)
・ △△ prefecture ◎◎ city (frequency 1, from B305)
・ Special venue (frequency 1, from B305)
・ Map reference (frequency 1, from B305)
The result is obtained.
[0023]
In the next step S603, the maximum number (K) of keywords that can be set in one input image is assumed to be five here. Further, the maximum value (N) of the appearance frequency of nouns is 2 from the result of the previous step S602. Therefore, as a result of processing in this step,
K = 5, N = 2, S = 0, I = 2
It becomes. Here, S represents the total number of selected nouns, and I is a work variable.
[0024]
In the next step S604, the number of nouns whose appearance frequency is I is checked and set to M. Therefore, here, since there are two nouns with the appearance frequency 2, “Kannon Co., Ltd.” and “New Product Information Session”, the result M of this processing is 2.
[0025]
Next, it is determined whether or not the sum of S and M is equal to or less than K, that is, whether or not a keyword having an appearance frequency of I is equal to or less than the maximum number of keywords (S605). In this example, since S = 0 and M = 2 here, the determination result in step S605 is true when S + M = 2, and the process continues to step S606, where the noun with the appearance frequency I (= 2) is internally processed. To the selected state. The word to be selected is stored in the keyword selection word storage unit in the RAM 1003. Here, since M nouns are selected, S is increased by M (S607). In the case of this example, the value of the result S in step S607 is 2 here.
[0026]
Next, it is determined whether I is 1 (S608). If I is 1, it is determined in step S604 that the noun has an appearance frequency of 1, that is, there is no more noun to be examined, and the process moves to step S613. In this example, since I is 2 here, the result of the determination is false, the process proceeds to step S609, I is decremented by 1 and becomes 1, the process returns to step S604, and the appearance frequency is 1. A process of selecting a word to be registered as a keyword from words is started.
[0027]
This time, since the word having the appearance frequency of 1 is a target, in this example, in step S604, M is 14 here, and the determination in the next step S605 is false (S + M = 16, K = 5), The processing moves to step S610.
[0028]
In step S610, it is checked whether the number of nouns currently selected is the same as the limit on the number of keywords. If they are the same, the next step S611 and step S612 are skipped, and the process proceeds to step S613. In this example, since S = 2 and K = 5, the determination result is false, and the process proceeds to step S611.
[0029]
In step S611, (KS) keywords are selected from nouns having the appearance frequency I. This is because S nouns are selected as keywords based on frequency information, but since K keywords can actually be registered, the remaining (K-S) keywords can be registered, so the remaining unselected keywords This is to select from nouns. In this example, since K = 5 and S = 2, 5-2 = 3 keywords are selected from the remaining 14 nouns.
[0030]
The remaining (KS) keywords are selected by selecting (KS) items in the order in which the nouns appear in the direction of the sentence (in this case, in this example, “important documents”, “representative director president” In the present embodiment, the character recognition unit 502 did not output information on the character size, but the character recognition unit 502 does not output the size of each character. And the remaining (KS) nouns may be selected in the descending order of the characters, or these may be combined.
[0031]
Next, since (K-S) keywords are selected in step S613, the selection process of all K keywords is completed, and the selected S nouns are set as keywords.
[0032]
Finally, the keyword selected in the keyword determination process (S104) and stored in the keyword selection word storage unit of the RAM 1003 is registered in the database in the RAM 1003 together with the input image (S105), and the process ends.
[0033]
A word registered as a keyword is displayed in a table of contents when searching for an image from the database, or when a word is specified for search, an image stored in the database together with the same word as that word is displayed or displayed. Since it is printed, image retrieval is facilitated.
[0034]
In this embodiment, some keywords are selected by the keyword selection means due to the limitation of the number of keywords. However, the keywords selected with the selection number set to one here are stored in the database as file names of input files. You may register.
[0035]
In this embodiment, all the characters are recognized and then the words are extracted. For example, in the case where words such as English are separated by spaces, matching is performed between the images in the word area before the characters are recognized. To detect a word having a high appearance frequency, and recognize the detected word as a character and register it as a keyword.
[0036]
【The invention's effect】
As described above, according to the present invention, since a word having a high appearance frequency in the input image is selected as a keyword to be added to the input image, it is possible to select an accurate keyword without the manual operation of the operator using the keyboard. Can do.
[0037]
As described above, according to the present invention, since character recognition is performed after selecting a word pattern to be registered as a keyword, processing time until selecting a keyword is eliminated without spending extra time for character recognition processing. Can be shortened.
[0038]
As described above, according to the present invention, since words of a specific part of speech are narrowed down as keywords for the keyword selection process, the selection process time can be shortened and a word suitable as a keyword can be selected. .
[0039]
As described above, according to the present invention, since the selection of words to be stored together with the image input by the scanner is extracted from the input image, an operation using the keyboard is not necessary, and the operability is improved.
[Brief description of the drawings]
FIG. 1 is a flowchart showing the overall flow of processing of the present embodiment.
FIG. 2 is a diagram illustrating an example of an input image.
FIG. 3 is a diagram illustrating an example of an image region separation process result.
FIG. 4 is a diagram illustrating an example of a single character image separation process result.
FIG. 5 is a functional configuration diagram of the apparatus according to the present embodiment.
FIG. 6 is a flowchart showing the flow of keyword determination processing.
FIG. 7 is a configuration block diagram of the apparatus according to the present embodiment.

Claims (7)

入力画像内の文字画像を文字認識処理することにより、文字列を生成する文字認識ステップと、
前記文字認識ステップで生成された文字列を形態素解析することにより、該文字列から複数の単語を抽出する抽出ステップと、
前記抽出ステップで抽出された単語の出現頻度を調べる出現頻度調査ステップと、
前記出現頻度調査ステップで調べた出現頻度に基づいて、前記抽出ステップで抽出された複数の単語の中から、前記入力画像のキーワードとして用いる単語を選択するキーワード選択ステップと、
前記入力画像と共に前記キーワード選択ステップで選択された単語を、データベースに登録する登録ステップと、の各ステップを画像処理装置が実行するように制御するための画像処理方法であって、更に、
前記キーワード選択ステップでは、選択可能なキーワードの最大数が予め設定されており、且つ、前記出現頻度が高い方の単語から順にキーワードとして選択していく際に、同一の出現頻度の単語が複数存在し且つその出現頻度の単語全てをキーワードとして選択すると前記最大数を超えてしまう場合、その出現頻度の単語の中で前記入力画像上での当該単語の文字画像の大きさが大きいものから順に前記最大数を超えないように選択することを特徴とする、画像処理装置を制御するための画像処理方法。
A character recognition step for generating a character string by performing character recognition processing on the character image in the input image;
An extraction step of extracting a plurality of words from the character string by performing morphological analysis on the character string generated in the character recognition step;
An appearance frequency examining step for examining the appearance frequency of each word extracted in the extraction step ;
A keyword selection step of selecting a word to be used as a keyword of the input image from a plurality of words extracted in the extraction step based on the appearance frequency examined in the appearance frequency investigation step;
A registration step of registering the word selected in the keyword selection step together with the input image in a database, and an image processing method for controlling the image processing apparatus to execute each step,
In the keyword selection step, when the maximum number of keywords that can be selected is set in advance and words are selected in order from the word with the highest appearance frequency, there are a plurality of words having the same appearance frequency. And, when all the words with the appearance frequency are selected as keywords, the maximum number is exceeded, the words in the appearance image in order of the size of the character image of the word on the input image from the largest An image processing method for controlling an image processing apparatus , wherein the selection is made so as not to exceed a maximum number .
前記抽出ステップで抽出する単語は、特定の品詞の単語であることを特徴とする請求項1に記載の画像処理方法。 Words extracted by the extraction step, the image processing method according to claim 1, which is a word in a particular part of speech. 前記特定の品詞は、名詞とすることを特徴とする請求項2に記載の画像処理方法。The image processing method according to claim 2, wherein the specific part of speech is a noun. 更に、前記入力画像と共に前記データベースに登録された単語を、目次的に表示する表示ステップを有することを特徴とする請求項1に記載の画像処理方法。The image processing method according to claim 1, further comprising a display step of displaying the words registered in the database together with the input image in a table of contents. 更に、検索指定入力された単語が前記データベース登録されている場合は、該単語と共に登録されている入力画像を読み出して出力する検索ステップを有することを特徴とする請求項1に記載の画像処理方法。2. The image processing according to claim 1, further comprising: a search step of reading out and outputting an input image registered together with the word when the word specified by the search is registered in the database. Method. 前記入力画像はスキャナより入力された画像情報であることを特徴とする請求項1に記載の画像処理方法。The image processing method according to claim 1, wherein the input image is image information input from a scanner. 入力画像内の文字画像を文字認識処理することにより、文字列を生成する文字認識手段と、
前記文字認識手段で生成された文字列を形態素解析することにより、該文字列から複数の単語を抽出する抽出手段と、
前記抽出手段で抽出された単語の出現頻度を調べる出現頻度調査手段と、
前記出現頻度調査手段で調べた出現頻度に基づいて、前記抽出手段で抽出された複数の単語の中から、前記入力画像のキーワードとして用いる単語を選択するキーワード選択手段と、
前記入力画像と共に前記キーワード選択手段で選択された単語をデータベースに登録する登録手段と、を有する画像処理装置であって、更に、
前記キーワード選択手段は、選択可能なキーワードの最大数が予め設定されており、且つ、前記出現頻度が高い方の単語から順にキーワードとして選択していく際に、同一の出現頻度の単語が複数存在し且つその出現頻度の単語全てをキーワードとして選択すると前記最大数を超えてしまう場合、その出現頻度の単語の中で前記入力画像上での当該単語の文字画像の大きさが大きいものから順に前記最大数を超えないように選択することを特徴とする画像処理装置。
Character recognition means for generating a character string by character recognition processing of a character image in the input image;
Extraction means for extracting a plurality of words from the character string by performing morphological analysis on the character string generated by the character recognition means;
Appearance frequency investigation means for examining the appearance frequency of each word extracted by the extraction means ;
Keyword selection means for selecting a word to be used as a keyword of the input image from a plurality of words extracted by the extraction means based on the appearance frequency checked by the appearance frequency search means;
A registration means for registering a word selected by the keyword selection means together with the input image in a database, and further comprising:
The keyword selection means is preset with a maximum number of keywords that can be selected, and there are a plurality of words having the same appearance frequency when selecting the keywords in descending order of the appearance frequency. And, when all the words with the appearance frequency are selected as keywords, the maximum number is exceeded, the words in the appearance image in order of the size of the character image of the word on the input image from the largest An image processing apparatus that is selected so as not to exceed the maximum number .
JP01169695A 1994-11-30 1995-01-27 Image processing method and image processing apparatus Expired - Fee Related JP3623998B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP01169695A JP3623998B2 (en) 1995-01-27 1995-01-27 Image processing method and image processing apparatus
US08/562,450 US5821929A (en) 1994-11-30 1995-11-24 Image processing method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01169695A JP3623998B2 (en) 1995-01-27 1995-01-27 Image processing method and image processing apparatus

Publications (2)

Publication Number Publication Date
JPH08202731A JPH08202731A (en) 1996-08-09
JP3623998B2 true JP3623998B2 (en) 2005-02-23

Family

ID=11785208

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01169695A Expired - Fee Related JP3623998B2 (en) 1994-11-30 1995-01-27 Image processing method and image processing apparatus

Country Status (1)

Country Link
JP (1) JP3623998B2 (en)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11272707A (en) * 1998-03-26 1999-10-08 Sharp Corp Information processing system
JP4599896B2 (en) * 2004-06-07 2010-12-15 オムロン株式会社 Data name determination device
JP4802502B2 (en) * 2005-01-21 2011-10-26 株式会社日立製作所 Word recognition device and word recognition method
JP4787955B2 (en) * 2005-04-26 2011-10-05 国立大学法人佐賀大学 Method, system, and program for extracting keywords from target document
JP4756930B2 (en) 2005-06-23 2011-08-24 キヤノン株式会社 Document management system, document management method, image forming apparatus, and information processing apparatus
US8261200B2 (en) * 2007-04-26 2012-09-04 Fuji Xerox Co., Ltd. Increasing retrieval performance of images by providing relevance feedback on word images contained in the images
JP2010113735A (en) * 2010-01-21 2010-05-20 Omron Corp Data name determination device
JP5721052B2 (en) * 2011-03-11 2015-05-20 富士ゼロックス株式会社 Image processing apparatus and program
JP6287529B2 (en) * 2014-04-18 2018-03-07 富士通株式会社 Keyword determining apparatus, keyword determining program, and keyword determining method
JP7221143B2 (en) * 2019-06-17 2023-02-13 株式会社日立製作所 Keyword detection device and keyword detection method

Also Published As

Publication number Publication date
JPH08202731A (en) 1996-08-09

Similar Documents

Publication Publication Date Title
JPH0776969B2 (en) Document processor
JP3623998B2 (en) Image processing method and image processing apparatus
US20020067502A1 (en) Methods for digitally printing composite documents
JPH09198395A (en) Document retrieval device
JPH08166959A (en) Picture processing method
JPH0877196A (en) Extracting device for document information
JP2928515B2 (en) Translated word output device
JP3147245B2 (en) Document processing apparatus and document processing method
JPH07134720A (en) Method and device for presenting relative information in sentence preparing system
JPH05181912A (en) Document retrieving device
JPH06223113A (en) Electronic filing device
JPH03132874A (en) Filing method for document
JP2000315209A (en) Image filing device, image filing method and recording medium readable by computer in which program to make computer execute the method is recorded
JPH1115826A (en) Document analyzer and its method
JPH09269952A (en) Document retrieval device/method
JPH05151195A (en) Kanji input device
JPS61265662A (en) Significant page part retrieval system for word processor
JP2893239B2 (en) Translation support dictionary search and display system
JPH0991311A (en) Information storage and retrieval device and its control method
JPH10247237A (en) Document picture processor, document picture processing method and information recording medium
JP5221198B2 (en) Classification system creation support device
JPH07287713A (en) Device for retrieving information
JPH0237471A (en) Information retrieving device
JPH08235282A (en) Device and method for processing document
JPH11143869A (en) Method and device for sentence edit

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041018

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041129

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081203

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091203

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091203

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101203

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111203

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121203

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131203

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees