JP3623998B2 - Image processing method and image processing apparatus - Google Patents
Image processing method and image processing apparatus Download PDFInfo
- Publication number
- JP3623998B2 JP3623998B2 JP01169695A JP1169695A JP3623998B2 JP 3623998 B2 JP3623998 B2 JP 3623998B2 JP 01169695 A JP01169695 A JP 01169695A JP 1169695 A JP1169695 A JP 1169695A JP 3623998 B2 JP3623998 B2 JP 3623998B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- word
- appearance frequency
- words
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【0001】
【産業上の利用分野】
本発明は入力画像に適したキーワードを判断し得る画像処理方法および画像処理装置に関するものである。
【0002】
【従来の技術】
従来、文字認識装置を備えた画像データベースにおいて、文字認識の結果得られた文字列は文書作成の際に再利用されるためのものであったので、データベースに登録される際に付加されるキーワードやファイル名称はユーザが選択し入力していた。また、入力画像の所定位置の画像を文字認識してキーワードとして登録するものがあった。
【0003】
【発明が解決しようとしている課題】
そのため、画像データをデータベースに登録する際にキーワード入力といったユーザの処理が必要となり、データベース登録の自動化等が困難となるという問題があった。また、キーワードを付加しない方法も考えられるが、この場合ユーザのキー入力は不要だが、後で検索する場合にキーワードが登録されないのでキーワードによる簡便な検索が不可能となるという問題点があった。
【0004】
【課題を解決するための手段】
上記課題を解決するために、本発明の画像処理方法は、入力画像内の文字画像を文字認識処理することにより、文字列を生成する文字認識ステップと、前記文字認識ステップで生成された文字列を形態素解析することにより、該文字列から複数の単語を抽出する抽出ステップと、前記抽出ステップで抽出された各単語の出現頻度を調べる出現頻度調査ステップと、前記出現頻度調査ステップで調べた出現頻度に基づいて、前記抽出ステップで抽出された複数の単語の中から、前記入力画像のキーワードとして用いる単語を選択するキーワード選択ステップと、前記入力画像と共に前記キーワード選択ステップで選択された単語を、データベースに登録する登録ステップと、の各ステップを画像処理装置が実行するように制御するための画像処理方法であって、更に、前記キーワード選択ステップでは、選択可能なキーワードの最大数が予め設定されており、且つ、前記出現頻度が高い方の単語から順にキーワードとして選択していく際に、同一の出現頻度の単語が複数存在し且つその出現頻度の単語全てをキーワードとして選択すると前記最大数を超えてしまう場合、その出現頻度の単語の中で前記入力画像上での当該単語の文字画像の大きさが大きいものから順に前記最大数を超えないように選択することを特徴とする。
【0005】
上記課題を解決するために、本発明の画像処理装置は、入力画像内の文字画像を文字認識処理することにより、文字列を生成する文字認識手段と、前記文字認識手段で生成された文字列を形態素解析することにより、該文字列から複数の単語を抽出する抽出手段と、前記抽出手段で抽出された各単語の出現頻度を調べる出現頻度調査手段と、前記出現頻度調査手段で調べた出現頻度に基づいて、前記抽出手段で抽出された複数の単語の中から、前記入力画像のキーワードとして用いる単語を選択するキーワード選択手段と、前記入力画像と共に前記キーワード選択手段で選択された単語をデータベースに登録する登録手段と、を有する画像処理装置であって、更に、前記キーワード選択手段は、選択可能なキーワードの最大数が予め設定されており、且つ、前記出現頻度が高い方の単語から順にキーワードとして選択していく際に、同一の出現頻度の単語が複数存在し且つその出現頻度の単語全てをキーワードとして選択すると前記最大数を超えてしまう場合、その出現頻度の単語の中で前記入力画像上での当該単語の文字画像の大きさが大きいものから順に前記最大数を超えないように選択することを特徴とする。
【0014】
【実施例】
本発明について、図面を参照して詳細に説明する。
【0015】
図7は本実施例における装置の構成を表わすブロック図である。1001は本装置全体の処理を実行するCPUであって、ROM1002或いはRAM1003に格納されている制御プログラムに従って判断及び処理を制御する。1002はROMであり、本実施例において説明するフローチャートの制御プログラム、或いは処理に用いる予め定まっているパラメータ等のデータを記憶している。文字認識処理及び単語分離処理に用いる辞書もROM1002に格納されている。1003はRAMであり、CPU1001での処理中のデータを記憶するワーキングメモリエリアを備える。本実施例で実行する処理の制御プログラムがFD等の着脱可能な記憶媒体から供給される場合は、その制御プログラムはRAM1003に格納される。本実施例において作成されるデータベースもRAM1003に格納される。1004はスキャナであり、原稿画像を光学的に読み込む。読み込まれた画像データはRAM1003に記憶できる。1005はキーボードであり、各種コードの入力、オペレータの指示が入力できる。1006はポインティングデバイスであり、表示器1007の表示画面上の所望の位置を指示でき、また、ボタンをクリックすることにより選択、取消の指示を入力することもできる。1007は表示器であり、CRT或いは液晶表示器からなる。1008は例えばLBP、インクジェット式等のプリンタ、1009は例えばフロッピーディスクなどの外部記憶装置を装着し、データの読み書きを行うフロッピーディスクドライブ(FDD)、1010はこれら各構成間でのデータの受授を行う為のデータバスである。
【0016】
図5は、本発明の一実施例の画像データベースシステムの機能的な構成を示す図である。このシステムにおいて、スキャナ1004より入力した原稿の入力画像をまず画像領域分離手段(501)において、画像領域分離処理を行った後に、文字認識手段(502)により認識結果の文字列を生成し、単語分離手段(503)は、辞書(506)を参照しながら認識結果の文字列を解析し単語毎に分離し、キーワード判定手段(504)によりキーワード判定を行いその結果選択されたキーワードは入力画像とともにデータベース(505)に登録する。
【0017】
図1は、本発明の一実施例の画像データベースシステムの画像入力からデータベースに登録するまでの全体的な処理を表わすフローチャートである。まず、画像領域分離手段501は、入力画像を解析して文字や画像のデータがある部分を矩形で囲むように分離してブロック化し、各ブロックをそのブロックの画像の特徴により画像の種別を分類するが、ここでは仮に入力画像から抽出された各ブロックを文字領域であるか画像領域であるかに分類する。すなわち例えば、入力画像が図2に示す画像であった場合、S101による処理の結果として図3におけるB301〜B307の幾つかのブロックが抽出され、各ブロックを分類してB301〜B306は文字領域、B307は画像領域と判定される。その結果、入力画像中に存在する複数の画像ブロックを取り出して文字部画像領域とその他すなわち画像部画像領域とに分離し、文字部画像領域情報をRAM1003に格納し、文字認識手段502に渡す(S101)。
【0018】
次に、文字認識手段502において文字部画像領域と判定された各画像領域に対して文字認識を行うが、まずその文字部画像領域の画像をさらに1文字単位に切り分ける(文字切り処理)。文字切り処理は、各文字画像領域の画像をまず行方向(左右方向)にヒストグラムをとって行位置を切り出し、次に各行ごとに上下方向にヒストグラムをとって1文字ごとの位置を切り出す。例えば、図3における文字部画像領域B302に対して文字切り処理を行うと図4の一文字画像領域B401〜B409のように分離される。この各一文字画像領域に対し、ROM1002に格納されている辞書を用いてパターンマッチング処理を行い、各一文字画像領域が表わす文字を認識しそれに対応した文字列を出力し(S102)、ブロック情報とともにRAM1003に格納する。例えば、図3の各ブロックを文字認識結果した結果、
・「重要書類」(B301より)
・「観音株式会社 新製品説明会」(B302より)
・「観音株式会社代表取締役社長 大仏 巌」(B303より)
・「拝啓、貴社益々御清栄のことと御慶び申し上げます。さて、この度弊社新製品の発売にさきがけまして新製品説明会を企画いたしましたのでご案内申し上げます。」(B304より)
・「記」(B305より)
・「日時:○月×日 午前8:00〜午後5:00 場所:△△県◎◎市 1−2−3 特設会場 (地図参照)」(B306より)
というような文字列が生成される。
【0019】
次に、S102の結果の文字列をRAM1003から読み出して単語分離手段(503)により単語に分割する(S103)。単語分離手段は、辞書(506)を参照しながら認識結果文字列を単語毎に分離(形態素解析)し(S103)、RAM1003に格納する。RAM1003に格納する際に、各単語の品詞に関する情報を辞書504より抽出し、単語に付加して格納する。
【0020】
次に、RAM1003に格納されている単語分離手段(503)により入力画像から抽出された全単語について、キーワード判定手段504によってキーワード判定処理を行う(S104)。
【0021】
キーワード判定処理(S104)の詳細な処理の流れについては、図6のフローチャートに示し、これを参照しながら説明する。まず、RAM1003に格納されている各単語に付加されている品詞情報を判断し、品詞による絞り込みを行う。本実施例においては、キーワードに適しそうなものとして名詞を取り出す(S601)。先の各ブロックの認識結果である文字列より例えば以下の単語が名詞として抽出される。
【0022】
・「重要書類」(B301より)
・「観音株式会社」、「新製品説明会」(B302)
・「観音株式会社」、「代表取締役社長」、「大仏巌」(B303)
・「清栄」、「お慶び」、「弊社新製品」、「発売」、「新製品説明会」、「企画」、「ご案内」(B304)
・「日時」、「場所」、「△△県◎◎市」、「特設会場」、「地図参照」(B305)
という単語が挙がったとする。次に出現頻度の高い単語ほど、その文書中での重要性が高いと想定されるのでこれらの各単語の出現頻度を調べる(S602)。すると、
・観音株式会社(頻度2、B302、B303より)
・新製品説明会(頻度2、B302、B304より)
・重要書類(頻度1、B301より)
・代表取締役社長(頻度1、B303より)
・大仏巌(頻度1、B303より)
・清栄(頻度1、B304より)
・お慶び(頻度1、B304より)
・弊社新製品(頻度1、B304より)
・発売(頻度1、B304より)
・企画(頻度1、B304より)
・案内(頻度1、B304より)
・日時(頻度1、B305より)
・場所(頻度1、B305より)
・△△県◎◎市(頻度1、B305より)
・特設会場(頻度1、B305より)
・地図参照(頻度1、B305より)
という結果が得られる。
【0023】
次のステップS603において、1つの入力画像に設定し得るキーワードの個数の最大値(K)をここでは仮に5個とする。また名詞の出現頻度の最大値(N)は、先ほどのステップS602の結果より2である。従ってこのステップの処理の結果、
K=5、N=2、S=0、I=2
となる。ここで、Sは選択状態になった名詞の数の合計を表し、Iは作業変数である。
【0024】
次のステップS604では、出現頻度がIである名詞の数を調べそれをMに設定する。従ってここでは、出現頻度2である名詞は、「観音株式会社」、「新製品説明会」の2つなので、本処理の結果Mは2になる。
【0025】
次に、SとMの合計がK以下かどうか、すなわち、出現頻度がIであるキーワードを選んでもキーワードの個数の最大値以下かどうかを判定する(S605)。本例の場合、ここではS=0、M=2なので、S+M=2でステップS605の判定結果は真となり、処理はステップS606へと続き、出現頻度I(=2)である名詞について内部的に選択状態にする。選択状態にする単語は、RAM1003内のキーワード用選択単語格納部に格納する。ここで、M個の名詞が選択状態になったので、SをM増やす(S607)。本例の場合、ここではステップS607の結果Sの値は2となる。
【0026】
次にIが1であるかどうか判定する(S608)。もし、Iが1であれば、ステップS604で判定したのは出現頻度が1である名詞であり、すなわちこれ以上調べる名詞がないということになり、処理はステップS613に移る。本例の場合、ここではIは2であるので、判定の結果は偽になり、ステップS609に処理が移りIは1減算されて1になり、処理はステップS604に戻り、出現頻度が1の単語からキーワードとして登録する単語を選択する処理に入る。
【0027】
今度は出現頻度が1の単語が対象であるので、ステップS604において、本例の場合、ここではMは14となり、次のステップS605の判定は偽(S+M=16で、K=5)となり、処理はステップS610へと移る。
【0028】
ステップS610では、現在選択状態になっている名詞の数が、キーワードの個数の制限と同じかどうかを調べる。もし、同じであれば、次のステップS611及びステップS612を飛ばして、ステップS613へと進む。本例の場合、S=2でK=5なので、判定の結果は偽となり、ステップS611へと進む。
【0029】
ステップS611では(K−S)個のキーワードを出現頻度Iである名詞から選択する。これは、頻度の情報によりS個の名詞がキーワードとして選択されたが、実際登録可能なキーワードはK個なので、残り(K−S)個のキーワードが登録可能なので、それを選択されていない残りの名詞から選択するためである。本例の場合、K=5、S=2なので、5−2=3個のキーワードを残りの14個の名詞から選択する。
【0030】
残り(K−S)個のキーワードの選択方法は、名詞の出現位置が文頭方向にある順に(K−S)個選択(この場合、本例では、「重要書類」、「代表取締役社長」、「大仏巌」が選択される)してもよいし、また、本実施例においては文字認識手段502は文字の大きさに関する情報は出力しなかったが、文字認識手段502により各文字の大きさの情報を抽出し、文字の大きい順に残り(K−S)個の名詞を選択してもよいし、また、これらを組み合わせてもよい。
【0031】
次に、ステップS613で(K−S)個のキーワードを選択したので、全部でK個のキーワードの選択処理が終了し、選択状態になったS個の名詞をキーワードとする。
【0032】
最後に、キーワード判定処理(S104)で選択され、RAM1003のキーワード用選択単語格納部に格納されているキーワードを入力画像とともにRAM1003内のデータベースに登録し(S105)、処理を終了する。
【0033】
キーワードとして登録された単語は、データベースから画像検索する際に、目次的に表示されたり、単語が検索指定入力された場合に、その単語と同一の単語とともにデータベースに記憶されている画像を表示或いは印字するので、画像検索が容易となる。
【0034】
尚、本実施例では、キーワード選択手段によりキーワード個数の制限から幾つかのキーワードを選択していたが、ここでの選択個数を1つにして選択されたキーワードを入力ファイルのファイル名称としてデータベースに登録しても良い。
【0035】
尚、本実施例においては全ての文字を認識してから単語を抽出したが、例えば英文等の単語がスペースにより区切られている言葉の場合は、文字認識する以前に単語領域の画像どうしでマッチングを行って出現頻度の高い単語を検出し、その検出された単語を文字認識してからキーワードとして登録しても良い。
【0036】
【発明の効果】
以上説明したように、本発明によれば、入力画像において出現頻度の高い単語をその入力画像に付加するキーワードとして選択するので、キーボードによるオペレータの手操作を介さなくとも精度良いキーワードを選択することができる。
【0037】
以上説明したように、本発明によれば、キーワードとして登録する単語のパターンを選択してから文字認識するので、余計な文字認識処理に時間を費やすことがなく、キーワードを選択するまでの処理時間を短縮することができる。
【0038】
以上説明したように、本発明によれば、特定の品詞の単語をキーワード選択処理の対象として絞り込むので、選択処理時間を短縮することができ、また、キーワードとして適した単語を選択することができる。
【0039】
以上説明したように、本発明によれば、スキャナにより入力した画像とともに記憶させる単語の選択を入力画像から抽出するので、キーボードを用いた操作が不要となり、操作性が向上する。
【図面の簡単な説明】
【図1】本実施例の処理全体の流れを表わすフローチャート。
【図2】入力画像例を表わす図。
【図3】画像領域分離処理結果例を表わす図。
【図4】一文字画像分離処理結果例を表わす図。
【図5】本実施例の装置の機能構成図。
【図6】キーワード判定処理の流れを表わすフローチャート。
【図7】本実施例の装置の構成ブロック図。[0001]
[Industrial application fields]
The present invention relates to an image processing method and an image processing apparatus that can determine a keyword suitable for an input image.
[0002]
[Prior art]
Conventionally, in an image database equipped with a character recognition device, a character string obtained as a result of character recognition is for reuse when creating a document. And the file name was selected and entered by the user. In addition, there is a technique in which an image at a predetermined position of an input image is recognized and registered as a keyword.
[0003]
[Problems to be solved by the invention]
Therefore, when registering image data in the database, user processing such as keyword input is required, which makes it difficult to automate database registration. A method without adding a keyword is also conceivable. In this case, the user does not need to enter a key, but there is a problem that a simple search using a keyword becomes impossible because a keyword is not registered when searching later.
[0004]
[Means for Solving the Problems]
In order to solve the above problems, an image processing method of the present invention includes a character recognition step of generating a character string by character recognition processing of a character image in an input image, and a character string generated in the character recognition step. By extracting a plurality of words from the character string, an appearance frequency examining step for examining the appearance frequency of each word extracted in the extraction step, and an appearance examined in the appearance frequency examining step Based on the frequency, a keyword selection step for selecting a word to be used as a keyword of the input image from a plurality of words extracted in the extraction step, and a word selected in the keyword selection step together with the input image, A registration step registered in the database, and an image processing for controlling the image processing apparatus to execute each step. Further, in the keyword selection step, the maximum number of keywords that can be selected is set in advance, and when the keywords are selected in order from the word having the highest appearance frequency, the same number is selected. When there are a plurality of words having the appearance frequency and all the words having the appearance frequency are selected as keywords, the maximum number is exceeded, and the size of the character image of the word on the input image among the words having the appearance frequency In order from the largest, the maximum number is selected so as not to exceed.
[0005]
In order to solve the above problems, an image processing apparatus according to the present invention performs character recognition processing on a character image in an input image to generate a character string, and a character string generated by the character recognition unit. The extraction means for extracting a plurality of words from the character string, the appearance frequency investigation means for examining the appearance frequency of each word extracted by the extraction means, and the appearance examined by the appearance frequency investigation means Based on the frequency, a keyword selection unit that selects a word to be used as a keyword of the input image from among a plurality of words extracted by the extraction unit, and a database that selects the word selected by the keyword selection unit together with the input image The keyword selecting means is preset with a maximum number of selectable keywords. In addition, when selecting as a keyword in order from the word with the highest appearance frequency, if there are a plurality of words with the same appearance frequency and all the words with the appearance frequency are selected as keywords, the maximum number is exceeded. In such a case, it is characterized in that the words having the appearance frequency are selected so as not to exceed the maximum number in descending order of the size of the character image of the word on the input image.
[0014]
【Example】
The present invention will be described in detail with reference to the drawings.
[0015]
FIG. 7 is a block diagram showing the configuration of the apparatus in this embodiment. A
[0016]
FIG. 5 is a diagram showing a functional configuration of the image database system according to the embodiment of the present invention. In this system, the input image of the document input from the
[0017]
FIG. 1 is a flowchart showing overall processing from image input to registration in a database of an image database system according to an embodiment of the present invention. First, the image
[0018]
Next, character recognition is performed on each image area determined as a character part image area by the
・ "Important documents" (from B301)
・ "Kannon Co., Ltd. New Product Briefing" (from B302)
・ "Kannon Co., Ltd. President and Representative Director Satoshi Daibutsu" (from B303)
・ "Dear Sirs, I would like to thank you for your success. Now, I will inform you that we have planned a new product briefing for the launch of our new product." (From B304)
・ "Note" (from B305)
・ "Date and time: XX month x day 8:00 am to 5:00 pm Location: △△ prefecture ◎◎ City 1-2-3 Special venue (see map)" (from B306)
Will be generated.
[0019]
Next, the character string resulting from S102 is read from the
[0020]
Next, the
[0021]
The detailed processing flow of the keyword determination processing (S104) is shown in the flowchart of FIG. 6 and will be described with reference to this flowchart. First, the part-of-speech information added to each word stored in the
[0022]
・ "Important documents" (from B301)
・ “Kannon Co., Ltd.”, “New Product Information Session” (B302)
・ "Kannon Co., Ltd.", "President and CEO", "Great Buddha" (B303)
・ "Seiei", "Okay", "Our new product", "Release", "New product briefing", "Planning", "Guide" (B304)
・ "Date and time", "Place", "△△ prefecture ◎◎ city", "special venue", "map reference" (B305)
The word is raised. Next, it is assumed that the word having the highest appearance frequency is more important in the document, so the appearance frequency of each of these words is examined (S602). Then
・ Kannon Co., Ltd. (Frequency 2, from B302 and B303)
・ New product briefing (Frequency 2, from B302 and B304)
・ Important documents (
・ President and CEO (
・ Great Buddha (
・ Seiei (
・ Good night (
・ Our new product (
・ Release (
・ Planning (
・ Guidance (
・ Date (
・ Location (
・ △△ prefecture ◎◎ city (
・ Special venue (
・ Map reference (
The result is obtained.
[0023]
In the next step S603, the maximum number (K) of keywords that can be set in one input image is assumed to be five here. Further, the maximum value (N) of the appearance frequency of nouns is 2 from the result of the previous step S602. Therefore, as a result of processing in this step,
K = 5, N = 2, S = 0, I = 2
It becomes. Here, S represents the total number of selected nouns, and I is a work variable.
[0024]
In the next step S604, the number of nouns whose appearance frequency is I is checked and set to M. Therefore, here, since there are two nouns with the appearance frequency 2, “Kannon Co., Ltd.” and “New Product Information Session”, the result M of this processing is 2.
[0025]
Next, it is determined whether or not the sum of S and M is equal to or less than K, that is, whether or not a keyword having an appearance frequency of I is equal to or less than the maximum number of keywords (S605). In this example, since S = 0 and M = 2 here, the determination result in step S605 is true when S + M = 2, and the process continues to step S606, where the noun with the appearance frequency I (= 2) is internally processed. To the selected state. The word to be selected is stored in the keyword selection word storage unit in the
[0026]
Next, it is determined whether I is 1 (S608). If I is 1, it is determined in step S604 that the noun has an appearance frequency of 1, that is, there is no more noun to be examined, and the process moves to step S613. In this example, since I is 2 here, the result of the determination is false, the process proceeds to step S609, I is decremented by 1 and becomes 1, the process returns to step S604, and the appearance frequency is 1. A process of selecting a word to be registered as a keyword from words is started.
[0027]
This time, since the word having the appearance frequency of 1 is a target, in this example, in step S604, M is 14 here, and the determination in the next step S605 is false (S + M = 16, K = 5), The processing moves to step S610.
[0028]
In step S610, it is checked whether the number of nouns currently selected is the same as the limit on the number of keywords. If they are the same, the next step S611 and step S612 are skipped, and the process proceeds to step S613. In this example, since S = 2 and K = 5, the determination result is false, and the process proceeds to step S611.
[0029]
In step S611, (KS) keywords are selected from nouns having the appearance frequency I. This is because S nouns are selected as keywords based on frequency information, but since K keywords can actually be registered, the remaining (K-S) keywords can be registered, so the remaining unselected keywords This is to select from nouns. In this example, since K = 5 and S = 2, 5-2 = 3 keywords are selected from the remaining 14 nouns.
[0030]
The remaining (KS) keywords are selected by selecting (KS) items in the order in which the nouns appear in the direction of the sentence (in this case, in this example, “important documents”, “representative director president” In the present embodiment, the
[0031]
Next, since (K-S) keywords are selected in step S613, the selection process of all K keywords is completed, and the selected S nouns are set as keywords.
[0032]
Finally, the keyword selected in the keyword determination process (S104) and stored in the keyword selection word storage unit of the
[0033]
A word registered as a keyword is displayed in a table of contents when searching for an image from the database, or when a word is specified for search, an image stored in the database together with the same word as that word is displayed or displayed. Since it is printed, image retrieval is facilitated.
[0034]
In this embodiment, some keywords are selected by the keyword selection means due to the limitation of the number of keywords. However, the keywords selected with the selection number set to one here are stored in the database as file names of input files. You may register.
[0035]
In this embodiment, all the characters are recognized and then the words are extracted. For example, in the case where words such as English are separated by spaces, matching is performed between the images in the word area before the characters are recognized. To detect a word having a high appearance frequency, and recognize the detected word as a character and register it as a keyword.
[0036]
【The invention's effect】
As described above, according to the present invention, since a word having a high appearance frequency in the input image is selected as a keyword to be added to the input image, it is possible to select an accurate keyword without the manual operation of the operator using the keyboard. Can do.
[0037]
As described above, according to the present invention, since character recognition is performed after selecting a word pattern to be registered as a keyword, processing time until selecting a keyword is eliminated without spending extra time for character recognition processing. Can be shortened.
[0038]
As described above, according to the present invention, since words of a specific part of speech are narrowed down as keywords for the keyword selection process, the selection process time can be shortened and a word suitable as a keyword can be selected. .
[0039]
As described above, according to the present invention, since the selection of words to be stored together with the image input by the scanner is extracted from the input image, an operation using the keyboard is not necessary, and the operability is improved.
[Brief description of the drawings]
FIG. 1 is a flowchart showing the overall flow of processing of the present embodiment.
FIG. 2 is a diagram illustrating an example of an input image.
FIG. 3 is a diagram illustrating an example of an image region separation process result.
FIG. 4 is a diagram illustrating an example of a single character image separation process result.
FIG. 5 is a functional configuration diagram of the apparatus according to the present embodiment.
FIG. 6 is a flowchart showing the flow of keyword determination processing.
FIG. 7 is a configuration block diagram of the apparatus according to the present embodiment.
Claims (7)
前記文字認識ステップで生成された文字列を形態素解析することにより、該文字列から複数の単語を抽出する抽出ステップと、
前記抽出ステップで抽出された各単語の出現頻度を調べる出現頻度調査ステップと、
前記出現頻度調査ステップで調べた出現頻度に基づいて、前記抽出ステップで抽出された複数の単語の中から、前記入力画像のキーワードとして用いる単語を選択するキーワード選択ステップと、
前記入力画像と共に前記キーワード選択ステップで選択された単語を、データベースに登録する登録ステップと、の各ステップを画像処理装置が実行するように制御するための画像処理方法であって、更に、
前記キーワード選択ステップでは、選択可能なキーワードの最大数が予め設定されており、且つ、前記出現頻度が高い方の単語から順にキーワードとして選択していく際に、同一の出現頻度の単語が複数存在し且つその出現頻度の単語全てをキーワードとして選択すると前記最大数を超えてしまう場合、その出現頻度の単語の中で前記入力画像上での当該単語の文字画像の大きさが大きいものから順に前記最大数を超えないように選択することを特徴とする、画像処理装置を制御するための画像処理方法。 A character recognition step for generating a character string by performing character recognition processing on the character image in the input image;
An extraction step of extracting a plurality of words from the character string by performing morphological analysis on the character string generated in the character recognition step;
An appearance frequency examining step for examining the appearance frequency of each word extracted in the extraction step ;
A keyword selection step of selecting a word to be used as a keyword of the input image from a plurality of words extracted in the extraction step based on the appearance frequency examined in the appearance frequency investigation step;
A registration step of registering the word selected in the keyword selection step together with the input image in a database, and an image processing method for controlling the image processing apparatus to execute each step,
In the keyword selection step, when the maximum number of keywords that can be selected is set in advance and words are selected in order from the word with the highest appearance frequency, there are a plurality of words having the same appearance frequency. And, when all the words with the appearance frequency are selected as keywords, the maximum number is exceeded, the words in the appearance image in order of the size of the character image of the word on the input image from the largest An image processing method for controlling an image processing apparatus , wherein the selection is made so as not to exceed a maximum number .
前記文字認識手段で生成された文字列を形態素解析することにより、該文字列から複数の単語を抽出する抽出手段と、
前記抽出手段で抽出された各単語の出現頻度を調べる出現頻度調査手段と、
前記出現頻度調査手段で調べた出現頻度に基づいて、前記抽出手段で抽出された複数の単語の中から、前記入力画像のキーワードとして用いる単語を選択するキーワード選択手段と、
前記入力画像と共に前記キーワード選択手段で選択された単語をデータベースに登録する登録手段と、を有する画像処理装置であって、更に、
前記キーワード選択手段は、選択可能なキーワードの最大数が予め設定されており、且つ、前記出現頻度が高い方の単語から順にキーワードとして選択していく際に、同一の出現頻度の単語が複数存在し且つその出現頻度の単語全てをキーワードとして選択すると前記最大数を超えてしまう場合、その出現頻度の単語の中で前記入力画像上での当該単語の文字画像の大きさが大きいものから順に前記最大数を超えないように選択することを特徴とする画像処理装置。Character recognition means for generating a character string by character recognition processing of a character image in the input image;
Extraction means for extracting a plurality of words from the character string by performing morphological analysis on the character string generated by the character recognition means;
Appearance frequency investigation means for examining the appearance frequency of each word extracted by the extraction means ;
Keyword selection means for selecting a word to be used as a keyword of the input image from a plurality of words extracted by the extraction means based on the appearance frequency checked by the appearance frequency search means;
A registration means for registering a word selected by the keyword selection means together with the input image in a database, and further comprising:
The keyword selection means is preset with a maximum number of keywords that can be selected, and there are a plurality of words having the same appearance frequency when selecting the keywords in descending order of the appearance frequency. And, when all the words with the appearance frequency are selected as keywords, the maximum number is exceeded, the words in the appearance image in order of the size of the character image of the word on the input image from the largest An image processing apparatus that is selected so as not to exceed the maximum number .
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01169695A JP3623998B2 (en) | 1995-01-27 | 1995-01-27 | Image processing method and image processing apparatus |
US08/562,450 US5821929A (en) | 1994-11-30 | 1995-11-24 | Image processing method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01169695A JP3623998B2 (en) | 1995-01-27 | 1995-01-27 | Image processing method and image processing apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08202731A JPH08202731A (en) | 1996-08-09 |
JP3623998B2 true JP3623998B2 (en) | 2005-02-23 |
Family
ID=11785208
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP01169695A Expired - Fee Related JP3623998B2 (en) | 1994-11-30 | 1995-01-27 | Image processing method and image processing apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3623998B2 (en) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11272707A (en) * | 1998-03-26 | 1999-10-08 | Sharp Corp | Information processing system |
JP4599896B2 (en) * | 2004-06-07 | 2010-12-15 | オムロン株式会社 | Data name determination device |
JP4802502B2 (en) * | 2005-01-21 | 2011-10-26 | 株式会社日立製作所 | Word recognition device and word recognition method |
JP4787955B2 (en) * | 2005-04-26 | 2011-10-05 | 国立大学法人佐賀大学 | Method, system, and program for extracting keywords from target document |
JP4756930B2 (en) | 2005-06-23 | 2011-08-24 | キヤノン株式会社 | Document management system, document management method, image forming apparatus, and information processing apparatus |
US8261200B2 (en) * | 2007-04-26 | 2012-09-04 | Fuji Xerox Co., Ltd. | Increasing retrieval performance of images by providing relevance feedback on word images contained in the images |
JP2010113735A (en) * | 2010-01-21 | 2010-05-20 | Omron Corp | Data name determination device |
JP5721052B2 (en) * | 2011-03-11 | 2015-05-20 | 富士ゼロックス株式会社 | Image processing apparatus and program |
JP6287529B2 (en) * | 2014-04-18 | 2018-03-07 | 富士通株式会社 | Keyword determining apparatus, keyword determining program, and keyword determining method |
JP7221143B2 (en) * | 2019-06-17 | 2023-02-13 | 株式会社日立製作所 | Keyword detection device and keyword detection method |
-
1995
- 1995-01-27 JP JP01169695A patent/JP3623998B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH08202731A (en) | 1996-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0776969B2 (en) | Document processor | |
JP3623998B2 (en) | Image processing method and image processing apparatus | |
US20020067502A1 (en) | Methods for digitally printing composite documents | |
JPH09198395A (en) | Document retrieval device | |
JPH08166959A (en) | Picture processing method | |
JPH0877196A (en) | Extracting device for document information | |
JP2928515B2 (en) | Translated word output device | |
JP3147245B2 (en) | Document processing apparatus and document processing method | |
JPH05181912A (en) | Document retrieving device | |
JPH06223113A (en) | Electronic filing device | |
JPH03132874A (en) | Filing method for document | |
JPH08161350A (en) | Method and device for electronic filing | |
JPH1115826A (en) | Document analyzer and its method | |
JPH09269952A (en) | Document retrieval device/method | |
JPS61265662A (en) | Significant page part retrieval system for word processor | |
JPH08287077A (en) | Device for supporting selection of keyword | |
JPH0991311A (en) | Information storage and retrieval device and its control method | |
JPH10247237A (en) | Document picture processor, document picture processing method and information recording medium | |
JPH01250135A (en) | Information processor and its information display method | |
JPH07287713A (en) | Device for retrieving information | |
JPH0237471A (en) | Information retrieving device | |
Griffin et al. | MacVector: aligning sequences | |
JPH1145240A (en) | Document processor, storage medium for storing document processing program and document processing method | |
JPH06187370A (en) | Document read assisting device | |
JPH08235282A (en) | Device and method for processing document |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041018 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041116 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041129 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081203 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091203 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091203 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101203 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111203 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121203 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131203 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |