JP2013069150A - Character input device and character input method - Google Patents
Character input device and character input method Download PDFInfo
- Publication number
- JP2013069150A JP2013069150A JP2011207747A JP2011207747A JP2013069150A JP 2013069150 A JP2013069150 A JP 2013069150A JP 2011207747 A JP2011207747 A JP 2011207747A JP 2011207747 A JP2011207747 A JP 2011207747A JP 2013069150 A JP2013069150 A JP 2013069150A
- Authority
- JP
- Japan
- Prior art keywords
- character
- input
- character string
- unit
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
Description
本発明の実施形態は、帳票に記載された情報を読み取り、読み取った情報に含まれる文字列を項目毎に分類する文字入力装置、文字入力方法に関する。 Embodiments described herein relate generally to a character input device and a character input method for reading information described in a form and classifying a character string included in the read information for each item.
例えば名刺などの帳票に記載された情報(会社名、氏名、住所、役職、連絡先の電話番号など)を読み取り項目毎に分類する文字入力装置がある。
この種の文字入力装置では、読み取った結果を、各項目毎に自動的に分類し表示画面に表示してオペレータに確認を促す。
従来、オペレータが認識結果の文字を確認し、場合によっては、認識結果の文字を置き換えるための、いくつかの文字候補を既定の辞書から読み出して予測文字列として表示画面に表示する技術がある。
For example, there is a character input device that classifies information (such as a company name, name, address, job title, and contact phone number) described in a form such as a business card for each reading item.
In this type of character input device, the read results are automatically classified for each item and displayed on the display screen to prompt the operator to confirm.
Conventionally, there is a technique in which an operator confirms a character of a recognition result, and in some cases, reads several character candidates from a default dictionary and displays them as a predicted character string on a display screen to replace the character of the recognition result.
従来の自動項目分類の技術は、それほど精度のよいものではないため、誤分類の発生頻度が高く、誤分類が生じた場合は、該当項目から文字列を削除し再分類する必要があり、多くの時間を要することになる。
また従来の技術の場合、各項目への分類候補として表示される文字は、あくまでも辞書に登録されているものに限られることから、分類する候補として適切なものが表示されないことが多々ある。認識結果として適切でない文字が項目に分類された場合、上記同様に再分類の作業を要し作業効率が低下するという問題があった。
The conventional automatic item classification technology is not very accurate, so the frequency of misclassification is high, and if misclassification occurs, it is necessary to delete the character string from the corresponding item and reclassify it. It will take time.
In the case of the prior art, since characters displayed as classification candidates for each item are limited to those registered in the dictionary, there are many cases where appropriate characters are not displayed as classification candidates. When an unsuitable character is classified as an item as a recognition result, reclassification work is required in the same manner as described above, resulting in a problem that work efficiency is lowered.
本発明が解決しようとする課題は、帳票から読み取った文字列を適切な項目に分類することができる文字入力装置、文字入力方法を提供することにある。 An object of the present invention is to provide a character input device and a character input method that can classify character strings read from a form into appropriate items.
実施形態の文字入力装置は、文字認識部、受付部、第1マッチング部、文字列設定部、記憶部を有する。前記文字認識部は帳票を光学的に読み取って得られた画像に対して文字認識処理を行うことで認識結果として一つ以上の文字列を得る。前記受付部は前記文字認識部により認識された一つ以上の文字列をそれぞれ分類するための項目を有し、各項目に対する入力文字列の入力を受け付ける。前記第1マッチング部は前記受付部により受け付けられた前記入力文字列と前記文字認識部により得られた一つ以上の文字列とをマッチングする。前記文字列設定部は前記入力文字列とマッチした前記文字列を前記入力文字列が入力された項目に対応付けて前記記憶部に記憶する。 The character input device of the embodiment includes a character recognition unit, a reception unit, a first matching unit, a character string setting unit, and a storage unit. The character recognition unit obtains one or more character strings as a recognition result by performing character recognition processing on an image obtained by optically reading a form. The reception unit includes items for classifying one or more character strings recognized by the character recognition unit, and receives input of an input character string for each item. The first matching unit matches the input character string received by the receiving unit with one or more character strings obtained by the character recognition unit. The character string setting unit stores the character string matched with the input character string in the storage unit in association with an item in which the input character string is input.
以下、図面を参照して、実施形態を詳細に説明する。
(第1実施形態)
図1は第1実施形態の文字入力システムの構成を示す図である。
図1に示すように、この実施形態の文字入力システムは、スキャナ1等の画像読取装置と、キーボード2等のキー入力装置と、モニタ3等の表示装置と、これらの機器と通信ケーブルまたはネットワークを介して接続されたコンピュータ10(以下「PC10」と称す)とを有している。
Hereinafter, embodiments will be described in detail with reference to the drawings.
(First embodiment)
FIG. 1 is a diagram showing a configuration of a character input system according to the first embodiment.
As shown in FIG. 1, the character input system of this embodiment includes an image reading device such as a
PC10は、CPU、メモリ、ハードディスク装置、通信インターフェースなどのハードウェアと、ハードディスク装置にインストールされたプログラム(オペレーティングシステム(以下「OS」と称す)、画像認識ソフトウェアなど)を有するコンピュータである。メモリは記憶部13として機能する。
The PC 10 is a computer having hardware such as a CPU, a memory, a hard disk device, and a communication interface, and a program (such as an operating system (hereinafter referred to as “OS”) and image recognition software) installed in the hard disk device. The memory functions as the
ソフトウェア(プログラム)は、画像受付部11、文字認識部12、文字受付部14、第1マッチング部15、マッチング結果選択部16、文字列設定部17などを有している。
The software (program) includes an image reception unit 11, a character recognition unit 12, a
画像受付部11は、スキャナ1から入力される帳票読取結果の画像(以下「入力画像」と称す)を受け付ける。文字認識部12は入力画像中から、文字画像の切り出しと切り出した文字画像に対する文字認識を行うことで、認識結果(テキストデータ(文字)と文字画像(または文字列と文字列画像)との組)を得る。すなわち文字認識部12は帳票を光学的に読み取って得られた画像に対して文字認識処理を行うことで認識結果として一つ以上の文字列(図5参照)を得る。なお以降の説明では単独の文字または文字列を「文字列」と称す。 The image receiving unit 11 receives an image of a form reading result input from the scanner 1 (hereinafter referred to as “input image”). The character recognition unit 12 cuts out a character image from the input image and performs character recognition on the cut out character image, thereby combining a recognition result (text data (character) and character image (or character string and character string image). ) That is, the character recognition unit 12 obtains one or more character strings (see FIG. 5) as a recognition result by performing character recognition processing on an image obtained by optically reading a form. In the following description, a single character or character string is referred to as a “character string”.
文字受付部14は、ユーザーによるキーボード2のキー操作で入力されたテキストデータ(入力文字列と称す)を受け付ける。
具体的には、文字受付部14は、文字認識部12により認識された一つ以上の文字列をそれぞれ分類するための項目を有する画面(図6の入力ウィンドウ51参照)をモニタ3に表示し、各項目に対する入力文字列の入力を受け付ける受付部として機能する。
The
Specifically, the
第1マッチング部15は文字認識部12により得られた認識結果の文字列と文字受付部14により受け付けられた入力文字列とをマッチングする。マッチング結果選択部16は、第1マッチング部15によるマッチングの結果、入力文字列とマッチした文字列が複数存在した場合、リストボックス52に候補リスト(選択候補)としてユーザーに提示し選択を促す。つまり第1マッチング部15でマッチしたマッチング結果を入力候補の文字列として入力ウィンドウ51に表示してユーザーに提示し、その候補の中のいずれかをユーザーに選択させる。
The
文字列設定部17は入力文字列とマッチした文字列を入力文字列が入力された項目に対応付けて記憶部13に記憶する。
また、入力文字列とマッチした文字列が複数存在する場合、文字列設定部17は候補リストからユーザーに選択された候補をその項目に入力された入力文字列と置き換える。すなわち文字列設定部17は入力ウィンドウ51に表示された候補(リストボックス52の候補リスト)の中から、選択された候補を、入力文字列を入力した項目に設定し、項目と認識結果の文字列とを対応付ける。
The character
When there are a plurality of character strings that match the input character string, the character
この実施形態は、PC10に汎用のOSと画像認識ソフトウェアを組み込むことによって構成できるため、以下ではそのような構成を仮定して説明を行う。但し、ここに示した実施形態は一例にしかすぎず、例えば各部を専用ハードウェアや、その集合体、または分散処理用のコンピュータネットワークとしてもよい。すなわち上述の各部の機能を含む構成ならば、ここで挙げた構成に関わらずどのようなもので実装してもよい。 Since this embodiment can be configured by incorporating a general-purpose OS and image recognition software into the PC 10, the following description will be made assuming such a configuration. However, the embodiment shown here is only an example. For example, each unit may be dedicated hardware, an aggregate thereof, or a computer network for distributed processing. That is, as long as the configuration includes the function of each unit described above, any configuration may be used regardless of the configuration given here.
またこの第1実施形態では、記憶部13としてメモリを一例にあげたが、具体的には、例えば画像や変数等のデータを記憶可能なランダムアクセスメモリ(RAM)やハードディスクドライブ装置、フラッシュメモリ、ソリッドステートドライブ(SSD)等である。この他、特に断りがない限りこの実施形態では記憶部13として表記するが、上記したものに限らず記憶部13としては他のいかなる記憶媒体を用いてもよい。
In the first embodiment, a memory is used as an example of the
続いて図2乃至図17を参照して第1実施形態の文字入力システムの動作を説明する。
この第1実施形態の場合、スキャナ1の読み取り台にセットされた名刺がスキャナ1により読み取られると、図2に示すような名刺の画像(入力画像)がPC10に入力される。その入力画像を画像受付部11が受け付け、文字認識部12に渡す。
Next, the operation of the character input system according to the first embodiment will be described with reference to FIGS.
In the case of the first embodiment, when a business card set on the reading stand of the
文字認識部12では、入力画像から文字列が含まれる領域(部分)を検出およびその領域をグループ単位で認識し、認識結果(文字画像とテキストデータとの組)を記憶部13に記憶する。
The character recognition unit 12 detects an area (part) including a character string from the input image, recognizes the area in units of groups, and stores a recognition result (a combination of the character image and text data) in the
具体的には、文字認識部12における文字列の検出・認識動作は、図3のフローチャートに示すような手順で行われる。 Specifically, the character string detection / recognition operation in the character recognition unit 12 is performed according to the procedure shown in the flowchart of FIG.
すなわち、文字認識部12は入力画像中から文字を構成する黒画素の連結成分を検出する(図3のステップS101)。 That is, the character recognizing unit 12 detects a connected component of black pixels constituting the character from the input image (step S101 in FIG. 3).
文字認識部12は連結成分のうち、距離が予め設定された閾値以下の連結成分同士をまとめたグループを作成する(ステップS102)。 The character recognizing unit 12 creates a group in which connected components whose distances are equal to or less than a preset threshold among the connected components are collected (step S102).
文字認識部12は、作成した各々のグループについて外接矩形を算出する(ステップS103)。 The character recognition unit 12 calculates a circumscribed rectangle for each created group (step S103).
文字認識部12は、図4に示すように、各々の外接矩形で囲まれたグループ毎の文字画像について文字認識処理を実行し、図5に示すような認識結果(複数の文字列)を記憶部13に記憶する(ステップS104)。 As shown in FIG. 4, the character recognition unit 12 performs character recognition processing on the character image for each group surrounded by each circumscribed rectangle, and stores the recognition results (a plurality of character strings) as shown in FIG. Store in the unit 13 (step S104).
文字受付部14は、入力ウィンドウ51(図6参照)を表示し、ユーザーがキーボード2を操作することにより、入力ウィンドウ51内の各項目の欄に入力文字列が入力された場合、その入力文字列を受け付け、第1マッチング部15へ渡す。
The
図6に示すように、入力ウィンドウ51には、「姓名」、「会社名」、「部署名」、「役職名」、「事業所名」、「郵便番号」、「住所」などの項目で文字列の入力フィールドが設けられている。この例では「姓名」という項目の入力フィールド(欄)に、例えば「認識」という文字列が入力文字列として入力されたものとする。
As shown in FIG. 6, the
なお、文字受付部14は、この他、キータイプを直接検知して当該文字に変換することで文字を取得してもよい。さらに仮名漢字変換フロントエンドプロセッサ等の外部プログラムを介して行って文字を取得してもよく、前述の趣旨を脱しない限りいかなる方法で文字を取得してもよい。
In addition, the
次に、第1マッチング部15は、文字受付部14で受け付けた入力文字列と文字認識部12での認識結果の文字列とをマッチングし、マッチング結果を列挙(記憶部13に記憶)する。
Next, the
第1マッチング部15は文字受付部14で記憶した入力文字列と、認識結果の文字列各々について、例えばDPマッチングなどの技術を用いてマッチングし、それぞれの文字列のスコア(コスト)を算出し、算出したスコア(コスト)の順(スコア(コスト)の上位何番目まで)に候補を列挙(選出)する。
The
この文字入力システムにおいて、DPマッチングは入力文字列の両端が固定、認識結果の両端がフリーの条件下で行う。 In this character input system, DP matching is performed under conditions where both ends of the input character string are fixed and both ends of the recognition result are free.
一般に文字列同士のDPマッチングによる対応付けでは、図7に示すように、文字間の対応付けの状況によってスコア(以下「コスト」と称す)を定義し、それらを合計することで文字列全体の対応付けのコストを定義する。そして、このコストを最小化することで対応付けを最適化する。 In general, in association by DP matching between character strings, as shown in FIG. 7, a score (hereinafter referred to as “cost”) is defined according to the association situation between characters, and by summing them, Define the cost of mapping. Then, the association is optimized by minimizing this cost.
本実施形態では、図7、図8に示すように、入力文字列「認識」と認識結果の文字列「認識太郎」とで一致する文字が対応付けられた箇所のコストが0、入力文字列の中の文字と認識結果の文字列の中の不読文字とが対応付けられた箇所のコストがC1=10、入力文字列の中の文字と認識結果の文字列の中の文字とで異なる文字が対応付けられた箇所のコストがC2=20、入力文字列中の文字に認識結果の文字列の中の文字が対応付けられなかった場合のコストがC3=100、認識結果中の文字に入力文字列中の文字が対応付けられなかった場合のコストがC4=100とする。 In this embodiment, as shown in FIG. 7 and FIG. 8, the cost of a location where a matching character is matched between the input character string “recognition” and the character string “recognition Taro” of the recognition result is 0, The cost of the location where the character in the character string is associated with the unread character in the character string of the recognition result is C1 = 10, and the character in the input character string is different from the character in the character string of the recognition result The cost associated with the character is C2 = 20, the cost when the character in the recognition result character string is not associated with the character in the input character string is C3 = 100, the character in the recognition result is The cost when characters in the input character string are not associated is assumed to be C4 = 100.
但し、認識結果の文字列の中の文字に入力文字列の中の文字が対応付けられなかった場合でも、当該文字が入力文字列の最初の文字に対応付けられた文字より前あるいは既入力の文字列の最後の文字に対応付けられた文字より後ならば、当該文字のコストは0とする。こうすることで認識結果の文字列の両端がフリー(認識結果に文字を追加可能)のDPマッチングを行うことができる。 However, even if the character in the input character string is not associated with the character in the character string of the recognition result, the character is in front of the character associated with the first character in the input character string or already entered If the character is after the character associated with the last character of the character string, the cost of the character is zero. By doing so, DP matching can be performed in which both ends of the character string of the recognition result are free (characters can be added to the recognition result).
ここで示したコストC1、C2、C3、C4などの値は一例であり、自然なマッチングが期待できる値である限りいかなる値を設定してもよい。 The values such as the costs C1, C2, C3, and C4 shown here are examples, and any values may be set as long as natural matching can be expected.
第1マッチング部15は、上記DPマッチングのコストが最低の認識結果を予め任意に定めた個数以内で列挙(選出)する。また、第1マッチング部15は、コストが予め任意に定められた定数以下(例えば0)の認識結果のみを列挙(選出)することで、図9に示すように、「認識」とい文字列が含まれる認識結果の文字列「認識太郎」、「認識ソリューション株式会社」、「認識県認識市認識町9−99−999」などがスコアの低い順に選出される。
The
第1マッチング部15は、前述のDPマッチングで認識結果の内で入力文字列中の文字と対応付けられた文字の各々を、入力文字列中で対応付けられた文字に置き換え、マッチング結果とする。認識結果、入力文字列およびマッチング結果の一例を図10に示す。
The
マッチング結果選択部16では、第1マッチング部15でマッチしたマッチング結果を入力候補文字列として、図6に示す入力ウィンドウ51の該当フィールドに表示してユーザーに提示し、入力候補文字列のうちいずれかを選択させる。
The matching
マッチング結果選択部16は、マッチング結果を入力中の文字列の直下にリスト表示する。図11にリスト表示の一例を示す。リスト表示の機能はOSやウィジェットセットが提供するリストボックス表示機能により実現される。
The matching
マッチング結果はリストボックス中の表示項目として登録され、マウス等のポインティングデバイスでクリックすることにより選択される。選択されたマッチング結果の番号(値)は変数SPOSに記憶される。変数SPOSは記憶部13に記憶されている。
The matching result is registered as a display item in the list box, and is selected by clicking with a pointing device such as a mouse. The number (value) of the selected matching result is stored in the variable SPOS. The variable SPOS is stored in the
マッチング結果選択部16は、変数SPOSに値を設定した後、後述する文字列設定部17でSPOS番目のマッチング結果が入力文字列に設定されるように制御を行う。
After setting a value in the variable SPOS, the matching
また、マッチング結果選択部16は、マッチング結果がキー操作によっても選択可能となるように、キー入力を監視してリストボックスの表示を制御する。
The matching
図12に示すように、リストボックス52は、表示されている項目のうち1項目が強調表示されようになっており、マッチング結果選択部16は、強調表示によって項目、すなわちマッチング結果の仮選択を示す。
As shown in FIG. 12, in the list box 52, one of the displayed items is highlighted, and the matching
仮選択の状態は、記憶部13に記憶されている変数KPOSで管理する。変数KPOSには仮選択がされていない状態で0が設定され、仮選択がされている状態では仮選択されているマッチング結果の番号が設定される。なお最初のマッチング結果が仮選択されている場合には1が設定される。また、以下ではマッチング結果の個数をnとする。
The temporarily selected state is managed by a variable KPOS stored in the
マッチング結果選択部16は、第1マッチング部15により文字どうしがマッチングされる度に、図13に示すフローチャートの処理を行う。
The matching
すなわち、マッチング結果選択部16は、まず、リストボックスがモニタ3に表示されているか否かを確認し(図13のステップS201)、リストボックスが表示されていなければ(ステップS201のNo)、リストボックスを表示する(ステップS202)。
That is, the matching
続いて、マッチング結果選択部16は、表示したリストボックスにマッチング結果の一覧を設定する(ステップS203)。
Subsequently, the matching
最後に、マッチング結果選択部16は、変数KPOS=0とし、仮選択がなされていない状態にする(ステップS204)。
Finally, the matching
マッチング結果選択部16は、キーボード2の第1の仮選択キー(例えば「↓」の刻印がなされているキー)が押される度に図14に示すフローチャートの処理を行う
すなわち、マッチング結果選択部16は、変数KPOSの値を確認し、変数KPOSの値が0か、0よりも大きな値かを判定する(ステップS301)。
The matching
この判定の結果、変数KPOS>0の場合(ステップS301のYes)、つまり仮選択がなされている場合、マッチング結果選択部16は、変数KPOS=min(KPOS+1、n)とする(ステップS302)。ただし、min(x、y)はxとyのうち小さい方の数を返す関数である。
As a result of this determination, if the variable KPOS> 0 (Yes in step S301), that is, if a temporary selection has been made, the matching
また上記判定の結果、変数KPOS=0の場合(ステップS301のNo)、つまり仮選択がなされていない場合、マッチング結果選択部16は、変数KPOS=1、つまり第1番目のマッチング結果が選択された状態にする(ステップS303)。
As a result of the above determination, if the variable KPOS = 0 (No in step S301), that is, if no temporary selection has been made, the matching
そして最後に、マッチング結果選択部16は、KPOS番目のマッチング結果を強調表示する(ステップS304)。
Finally, the matching
マッチング結果選択部16は、キーボード2の第2の仮選択キー(例えば「↑」の刻印がなされているキー)が押される度に図15に示すフローチャートの処理を行う。
The matching
すなわち、マッチング結果選択部16は、変数KPOSの値を確認し、変数KPOSの値が0か、0よりも大きな値かを判定する(ステップS401)。
That is, the matching
この判定の結果、変数KPOS>0の場合(ステップS401のYes)、つまり仮選択がなされている場合、マッチング結果選択部16は、KPOS=max(KPOS−1、1)とする(ステップS402)。但しmax(x、y)はxとyのうち大きい方の数を返す関数である。
As a result of this determination, if the variable KPOS> 0 (Yes in step S401), that is, if a temporary selection has been made, the matching
また上記判定の結果、変数KPOS=0の場合(ステップS401のNo)、つまり仮選択がなされていない場合、マッチング結果選択部16は、変数KPOS=nとする(ステップS403)。つまり第n番目のマッチング結果が選択された状態にする。
As a result of the determination, if the variable KPOS = 0 (No in step S401), that is, if a temporary selection has not been made, the matching
そして最後に、マッチング結果選択部16は、KPOS番目のマッチング結果を強調表示する(ステップS404)。
Finally, the matching
マッチング結果選択部16は、キーボード2の選択決定キー(例えば「Enter」の刻印がなされているキー)が押される度に図16に示すフローチャートの処理を行う。
The matching
すなわち、マッチング結果選択部16は、変数KPOSの値を確認し、変数KPOSの値が0か、0よりも大きな値かを判定する(図16のステップS501)。
That is, the matching
この判定の結果、KPOS>0の場合(ステップS501のYes)、つまり仮選択がなされている場合、マッチング結果選択部16は、SPOS=KPOSとし(ステップS502)、後述する文字列設定部17でSPOS番目のマッチング結果が入力文字列に設定されるように制御を行う(ステップS503)。
As a result of this determination, if KPOS> 0 (Yes in step S501), that is, if a temporary selection has been made, the matching
続いて、マッチング結果選択部16は、KPOS=0とし(ステップS504)、仮選択がなされていない状態にする。
Subsequently, the matching
最後に、マッチング結果選択部16は、リストボックス52を非表示にする(ステップS505)。
Finally, the matching
マッチング結果選択部16は、キーボード2の第2の選択決定キー(例えば「Tab」の刻印がなされているキー)が押される度に図17に示すフローチャートの処理を行う。
The matching
すなわち、マッチング結果選択部16は、カウンタの値nを1と設定する(図17のステップS601)。
That is, the matching
そして、カウンタの値n=1の場合(ステップS601のYes)、マッチング結果選択部16は、SPOS=1とし(ステップS602)、後述する文字列設定部17でSPOS番目のマッチング結果が入力文字列に設定されるように制御を行う(ステップS603)。
When the counter value n = 1 (Yes in step S601), the matching
そして、マッチング結果選択部16は、KPOS=0とし(ステップS504)、仮選択がなされていない状態にする。
Then, the matching
最後に、マッチング結果選択部16は、リストボックス52を非表示にする(ステップS605)。
Finally, the matching
文字列設定部17は、選択したマッチング結果を入力中の文字列に設定する。
文字列設定部17は、エディットボックス中にマッチング結果選択部16で選択されたマッチング結果を設定すると共に、エディットボックス中に一時保持した入力文字列をマッチング結果選択部16で選択されたマッチング結果の文字列で置き換える。
The character
The character
このようにこの第1実施形態によれば、例えば名刺等の帳票をスキャナ1で読み取って得られた情報(一つ以上の文字列)を、例えば「姓名」、「会社名、」、…「住所」などの各項目に分類する上で、各項目の入力フィールドに初めの数文字程度(1,2文字か単語程度)の入力文字列をキー入力することで、入力文字列と認識結果の一つ以上の文字列とをマッチングし、マッチした文字列を、入力文字列を入力した項目と対応付けて記憶部13に記憶するので、帳票から読み取った文字または文字列を適切な項目に分類することができる。
また、マッチした文字列が複数存在する場合には、キー入力した入力文字列と置換する選択候補としてリストボックスに表示するので、現在仮名漢字変換や携帯端末等で一般的となった予測入力とルックアンドフィールが同様のインターフェースで実現できると共に、文字認識の結果から得た候補からユーザーが選択する形で入力でき、項目への文字入力を効率化することができる。
As described above, according to the first embodiment, for example, information (one or more character strings) obtained by reading a form such as a business card with the
In addition, when there are multiple matching character strings, they are displayed in the list box as selection candidates to be replaced with the input character string input by the key. The look and feel can be realized with the same interface, and the user can input from the candidates obtained from the result of the character recognition, and the character input to the item can be made efficient.
(第2実施形態)
次に、図18を参照して第2実施形態の文字入力システムを説明する。図18は第2の実施形態の文字入力システムの構成を示す図である。なお図18において第1実施形態と同じ構成には同一の符号を付しその説明は省略する。
(Second Embodiment)
Next, a character input system according to the second embodiment will be described with reference to FIG. FIG. 18 is a diagram illustrating a configuration of a character input system according to the second embodiment. In FIG. 18, the same components as those in the first embodiment are denoted by the same reference numerals, and the description thereof is omitted.
図18に示すように、この第2の実施形態の文字入力システムのPC10は、単語辞書記憶部18、第2マッチング部19を有している。単語辞書記憶部18はメモリ等により実現される。単語辞書記憶部18には、複数の単語を格納した単語辞書が記憶されている。図19に示すように、単語辞書には辞書中の単語が文字列の配列として格納されている。
As illustrated in FIG. 18, the
第2マッチング部19は、文字受付部14により受け付けられた入力文字列と文字認識部12により得られた一つ以上の文字列と単語辞書中の単語とをマッチングして、該当項目に分類すべき文字列を選出する。
The
具体的には、第2マッチング部19は、認識結果の文字列と入力文字列をキーにして単語辞書を検索し、ヒットした単語を選択候補(入力候補文字列)として読み出す。
Specifically, the
この場合、マッチング結果選択部16は第2マッチング部19によるマッチング結果を入力ウィンドウ51に該当項目に分類すべき選択候補の文字列として表示し、ユーザーに提示し選択させる。なおマッチング結果選択部16は認識結果の文字列と入力文字列にマッチした単語が複数存在した場合、選択候補として提示する。
In this case, the matching
すなわち本実施形態におけるマッチング結果選択部16は第1マッチング部15の代わりに第2のマッチング部19でマッチしたマッチング結果を候補リストとしてユーザーに提示する。
That is, the matching
続いて、第2実施形態の文字入力システムの動作を説明する。
この第2実施形態では、第2マッチング部19は、文字認識部12での認識結果、文字受付部14で受け付けた入力文字列および単語辞書中の単語をマッチングする。
Next, the operation of the character input system according to the second embodiment will be described.
In the second embodiment, the
第2マッチング部19は、先ず、認識結果の文字列各々について、単語辞書中の単語の各々とマッチングを行い、認識結果の文字列を単語辞書中の単語に置き換えることで、誤読文字または不読文字を除外した補正済み認識結果の文字列を生成する。
The
単語辞書の単語と認識結果の文字列とのマッチングについては、第1の実施形態における第1マッチング部15での入力文字列に対する認識結果の文字列との対応付けと同じ方法で行う。
The matching between the word in the word dictionary and the character string of the recognition result is performed by the same method as the association of the input result character string with the character string of the recognition result in the
次に、第2マッチング部19は、ユーザーによりキー入力された入力文字列と補正済み認識結果の文字列各々とをマッチングし、マッチング結果を得る。補正済み認識結果と入力文字列のマッチングは、第1実施形態における第1マッチング部15での認識結果と入力文字列の対応付けと同じ方法で行う。
Next, the
図20に示すように、認識結果の文字列が、例えば「認識ソンェーション株式会社」であり、キー入力された入力文字列が「ソリューション」である場合、第2マッチング部19は、入力文字列を優先して認識結果の文字列の該当部分を置換することで、「認識ソリューション株式会社」という補正済み認識結果を得る。すなわち認識結果の不読または誤読文字の部分が入力文字列に置換され、正しい文字を入力することができる。
As shown in FIG. 20, when the character string of the recognition result is, for example, “Recognition Sonshon Co., Ltd.” and the input character string input by the key is “Solution”, the
このようにこの第2実施形態によれば、分類対象の項目にキー入力された入力文字列と、認識結果の文字列と単語辞書中の単語とを併せてマッチングすることで、分類対象の項目に、より適切な選択候補をリストアップ(提示)することができる。なお項目欄に入力した入力文字列と認識結果の文字列と単語辞書中の単語などの3つ異なる情報ソースからの文字列をマッチングするには最初に2つをマッチングした後、その結果と残りの一つをマッチングすることになるため、いくつかの組み合わせが考えられるが、文字列のマッチングの全ての組み合わせは本発明の適用範囲に含まれる。 As described above, according to the second embodiment, the input character string key-inputted to the classification target item, the character string of the recognition result, and the word in the word dictionary are matched together to thereby classify the classification target item. In addition, more appropriate selection candidates can be listed (presented). To match the input character string entered in the item field, the character string of the recognition result, and the character string from three different information sources such as words in the word dictionary, first match the two, then the result and the rest However, all combinations of character string matching are included in the scope of the present invention.
(第3実施形態)
次に、第3実施形態の文字入力システムを説明する。なおこの第3実施形態は第1実施形態または第2の実施形態と同様に構成されるため構成図とその説明は省略する。
(Third embodiment)
Next, a character input system according to a third embodiment will be described. Since the third embodiment is configured similarly to the first embodiment or the second embodiment, the configuration diagram and the description thereof are omitted.
この第3実施形態は、マッチング結果に例えば「?」等で示される不読文字が含まれている場合の動作に関するものであり、図21に示すように、姓名の項目欄に、例えば「認識」という入力文字列をユーザーが入力すると、マッチング結果としてリストボックス52に、例えば「認識太郎」、「認識ソリューション??社」、「認識県認識市認識町9−99−999」などの認識結果の文字列が表示される。この例では「認識ソリューション??社」という文字列に不読文字「?」、「?」が二つ含まれている。
この場合、不読文字「?」、「?」が含まれた「認識ソリューション??社」という文字列がユーザーにより選択されると、文字列設定部17は、「認識ソリューション??社」の中の不読文字「?」、「?」の直前までの文字である「認識ソリューション」を、項目欄に入力された編集対象の入力文字列「認識」と置換する。その他の動作は第1または第2実施形態と同様である。
This third embodiment relates to an operation when an unread character indicated by, for example, “?” Is included in the matching result. As shown in FIG. When the user inputs an input character string “”, recognition results such as “recognition Taro”, “recognition solution ??? company”, “recognized prefecture recognition city recognition town 9-99-999”, etc. are entered in the list box 52 as matching results. Is displayed. In this example, the unrecognized characters “?” And “?” Are included in the character string “recognition solution”.
In this case, when the user selects a character string “recognition solution ??? company” including unread characters “?” And “?”, The character
このようにこの第3実施形態によれば、認識結果の文字列と入力中の文字列および単語辞書中の単語を併せてマッチングしたときに、認識結果の中に不読文字や誤読文字が含まれていた場合でも、認識結果の文字列中の不読文字または誤読文字直前までの文字列を入力ウィンドウ51の入力フィールドにキー入力された入力文字列と置換することで、従来のように、誤分類からの再分類の手間をかけることなく、該当項目に適切な文字列を分類でき、作業効率を向上することができる。
As described above, according to the third embodiment, when the character string of the recognition result is matched with the character string being input and the word in the word dictionary, unrecognized characters and misread characters are included in the recognition result. Even if the character string has been read, the character string up to immediately before the unread character or the misread character in the character string of the recognition result is replaced with the input character string key-inputted to the input field of the
(第4実施形態)
次に、第4実施形態の文字入力システムを説明する。なおこの第4実施形態は第1実施形態または第2の実施形態と同様に構成されるため構成図とその説明は省略する。
(Fourth embodiment)
Next, a character input system according to a fourth embodiment will be described. Since the fourth embodiment is configured in the same manner as the first or second embodiment, the configuration diagram and the description thereof are omitted.
この第4実施形態は、第1マッチング部15または第2マッチング部19において、当該入力画像について認識結果の一つ以上の文字列(選択候補)の中からマッチング結果選択部16で既に選択された文字列(候補)に対して提示対象外を示すフラグを付し、フラグが付されている認識結果をマッチングの対象外とする。その他の動作については第1または第2実施形態と同等である。
In the fourth embodiment, in the
このようにこの第4実施形態によれば、第1マッチング部15または第2マッチング部19において、当該入力画像について認識結果の一つ以上の文字列(選択候補)の中からマッチング結果選択部16で既に選択された文字列(候補)をマッチングの対象外とすることで、不必要な候補が提示されなくなり、ユーザーによる候補の選択がし易くなる。
As described above, according to the fourth embodiment, in the
(第5実施形態)
次に、第5実施形態の文字入力システムを説明する。なおこの第5実施形態は第1実施形態または第2の実施形態と同様に構成されるため構成図とその説明は省略する。
(Fifth embodiment)
Next, a character input system according to a fifth embodiment will be described. Since the fifth embodiment is configured similarly to the first embodiment or the second embodiment, the configuration diagram and the description thereof are omitted.
この第5実施形態は、第1実施形態または第2の実施形態とはマッチング結果選択部16の動作が異なる。すなわちこの例のマッチング結果選択部16は、入力画像について認識結果の一つ以上の文字列(選択候補)の中から既に選択された文字列(候補)に対して提示対象外を示すフラグを付し、フラグが付されている認識結果を提示の対象外とする。その他の動作については第1または第2実施形態と同等である。
The fifth embodiment differs from the first embodiment or the second embodiment in the operation of the matching
このようにこの第5実施形態によれば、マッチング結果選択部16において、当該入力画像について認識結果の一つ以上の文字列(選択候補)の中から既に選択された文字列(候補)を提示の対象外とすることで、不必要な候補が提示されなくなり、ユーザーによる候補の選択がし易くなる。
As described above, according to the fifth embodiment, the matching
(第6実施形態)
次に、第6実施形態の文字入力システムを説明する。なおこの第6実施形態は第2の実施形態と同様に構成されるため構成図とその説明は省略する。
(Sixth embodiment)
Next, a character input system according to a sixth embodiment will be described. Since the sixth embodiment is configured in the same manner as the second embodiment, the configuration diagram and description thereof are omitted.
この第6実施形態の場合、入力対象の項目毎に単語辞書または単語グループを複数を備え、第2マッチング部19は単語辞書または単語グループを項目毎に切り替えて対象とする単語をマッチングする。単語辞書は例えば住所辞書、郵便番号辞書、氏名辞書などであり、単語グループは単語辞書とは異なり、例えばカタカナ、数字、記号、漢字などといったグループに分けられた単語の群をいう。
In the case of the sixth embodiment, a plurality of word dictionaries or word groups are provided for each item to be input, and the
このようにこの第6実施形態によれば、入力対象の項目毎に単語辞書または単語グループを複数備え、第2マッチング部19でマッチング対象とする単語辞書または単語グループを項目毎に切り替えることで、不必要な単語とのマッチングを減らすことで処理時間を削減することができる。また誤った単語とのマッチングで認識結果が不正確に訂正されることを防止することができる。
As described above, according to the sixth embodiment, a plurality of word dictionaries or word groups are provided for each input target item, and the word dictionary or word group to be matched by the
(第7実施形態)
次に、図22を参照して第7実施形態の文字入力システムを説明する。
図22に示すように、第7実施形態の文字入力システムは、第1実施形態の構成(第1マッチング部15を有する構成)に加えて、単語辞書記憶部18、第3マッチング部20および予備設定部21を備える。
単語辞書記憶部18には、入力対象の項目(「姓名」、「会社名」、「部署名」、「役職名」、「事業所名」、「郵便番号」、「住所」)毎に単語を格納した単語辞書が記憶されている。
(Seventh embodiment)
Next, a character input system according to a seventh embodiment will be described with reference to FIG.
As shown in FIG. 22, the character input system according to the seventh embodiment includes a word
The word
第3マッチング部20は、認識結果の各々について単語辞書中の単語とのマッチングを行い認識結果と対応する項目を判定する。この際、第3マッチング部20は、ユーザーによる入力に先立って、項目の各々について当該する単語辞書中の単語の各々と認識結果の各々をマッチングする。
The
すなわち、この第3マッチング部20は、第1実施形態の第1マッチング部15において認識結果と文字受付部14で記憶した入力文字列をマッチングするのと同じ方法で、認識結果と単語の各々をマッチングし、認識結果と単語の組み合わせの各々のマッチングのコストを算出する。コストの算出方法については、図7,図8で説明した内容と同様である。
That is, the
予備設定部21は、第3マッチング部20で算出されたコストが最小となる認識結果の文字列を選出して、マッチした項目に対応するフィールドの入力文字列に設定するようマッチング結果選択部16に通知する。マッチング結果選択部16は、この通知を受けて該当項目のフィールドに入力文字列を設定する。
The
予備設定部21およびマッチング結果選択部16は、第3マッチング部20によりマッチングされた項目に、ユーザーによる入力に先立って認識結果を設定する。
The
第7実施形態の場合、図23に示すように、第3マッチング部20は、認識結果の文字が、例えば「姓名」の項目のフィールドに設定する文字列、例えば「認識太?」などの場合、この「認識太?」と「姓名」の項目の単語辞書の単語「太郎」、「一郎」、「花子」…をマッチングし、不読文字「?」の手前の文字「太」に対してコストが最小の「太郎」を選出する。
In the case of the seventh embodiment, as shown in FIG. 23, the
すると、予備設定部21は、第3マッチング部20でマッチした項目のフィールドに、ユーザーによる入力に先立って入力文字列「認識太郎」を設定するようマッチング結果選択部16に通知し、マッチング結果選択部16はこの通知を受けて、選出された入力文字列「認識太郎」を、入力ウィンドウ51の該当項目のフィールドに設定する。
Then, the
このようにこの第7実施形態によれば、入力対象の項目毎に単語を格納した単語辞書を記憶する単語辞書記憶部18と、認識結果の各々について単語辞書中の単語とのマッチングを行い認識結果と対応する項目を判定する第3マッチング部20と、第3マッチング部20でマッチングされた項目に、ユーザーによる入力に先立って認識結果の文字列を設定する予備設定部21とを備えることで、文字列を入力すべき項目を自動的に判定できる認識結果については当該項目のフィールドへ自動入力する。この自動入力によりユーザーによるキー入力の手間を軽減することができる。
As described above, according to the seventh embodiment, the word
(第8実施形態)
次に、図24を参照して第8実施形態の文字入力システムを説明する。
図24に示すように、第8実施形態の文字入力システムは、第2実施形態の構成(第2マッチング部19を有する構成)に加えて、単語辞書記憶部18、第3マッチング部20および予備設定部21を備える。この第8実施形態における単語辞書記憶部18、第3マッチング部20および予備設定部21は第7実施形態と同等である。
(Eighth embodiment)
Next, a character input system according to an eighth embodiment will be described with reference to FIG.
As shown in FIG. 24, the character input system according to the eighth embodiment includes a word
単語辞書記憶部18には、入力対象の項目(「姓名」、「会社名」、「部署名」、「役職名」、「事業所名」、「郵便番号」、「住所」)毎に単語を格納した単語辞書が記憶されている。
The word
第3マッチング部20は、ユーザーによる入力に先立って、項目の各々について当該する単語辞書中の単語の各々と認識結果の各々をマッチングする。
Prior to input by the user, the
すなわち、この第3マッチング部20は、第2実施形態の第2マッチング部19において、文字認識部12での認識結果、文字受付部14で受け付けた入力文字列、および単語辞書の単語をマッチングして、マッチング結果の文字列を選出するのと同じ方法で、認識結果と入力文字列と単語辞書の単語の各々をマッチングし、認識結果と入力文字列と単語との組み合わせの各々のマッチングのコストを算出する。コストの算出方法については、図7,図8で説明した内容と同様である。
That is, the
予備設定部21は、第3マッチング部20で算出されたコストが最小となる認識結果を入力ウィンドウ51の項目に対応する文字列に設定するようマッチング結果選択部16に通知する。
The
マッチング結果選択部16は、この通知を受けて認識結果として選出された入力文字列を、入力ウィンドウ51の該当項目のフィールドに設定する。
The matching
この第8実施形態の場合、第3マッチング部20で、認識結果の文字と項目毎の単語辞書の単語とをマッチングし、予備設定部21によりコストが最小の文字列が選出される。
In the case of the eighth embodiment, the
すると、マッチング結果選択部16は、ユーザーによる入力に先立って、入力ウィンドウ51の該当項目のフィールドに、入力文字列「認識太郎」を設定する。
Then, the matching
そして、第2マッチング部19において、予備設定部21により選出されたコストが最小の入力文字列、文字受付部14で受け付け記憶部13に記憶した入力文字列、および単語辞書の単語をマッチングして、マッチング結果としてフィールドに設定する入力文字列を選出し入力ウィンドウ51の該当項目のフィールドにマッチング結果の文字列が入力される。これにより、ユーザーは、認識結果の文字列を適切な項目に分類することができる。
The
このようにこの第8実施形態によれば、第7実施形態と同様にユーザーによるキー入力の手間を軽減することができる。 As described above, according to the eighth embodiment, it is possible to reduce the effort of key input by the user as in the seventh embodiment.
このように上述した第1乃至第8実施形態によれば、帳票から読み取った文字または文字列を適切な項目に分類することができる文字入力装置、文字入力方法を提供することができる。
また、文字認識の結果が予め列挙した単語や書式にマッチしない場合や複数の項目が候補としてあがったなど、認識結果と入力項目との対応付けを自動的には行えない場合に、ユーザーによりキー入力された文字列を選択候補として採用することにより、認識結果と入力項目の対応付けをスムーズに行えるようになり、認識結果の文字列の修正作業を効率よく行うことができる。
Thus, according to the first to eighth embodiments described above, it is possible to provide a character input device and a character input method that can classify characters or character strings read from a form into appropriate items.
In addition, when the recognition result cannot be automatically matched with the input item, such as when the result of character recognition does not match the pre-listed words or formats, or when multiple items are listed as candidates, the user can enter a key. By adopting the input character string as a selection candidate, it becomes possible to smoothly associate the recognition result with the input item, and it is possible to efficiently correct the character string of the recognition result.
すなわち、文字認識結果を確認および訂正する場合に正しい文字を効率よく入力することができる。 That is, when confirming and correcting the character recognition result, correct characters can be efficiently input.
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。 Although several embodiments of the present invention have been described, these embodiments are presented by way of example and are not intended to limit the scope of the invention. These novel embodiments can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the scope of the invention. These embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the invention described in the claims and the equivalents thereof.
また上記実施形態に示した各構成要素を、コンピュータのハードディスク装置などのストレージにインストールしたプログラムで実現してもよく、また上記プログラムを、コンピュータ読取可能な電子媒体:electronic mediaに記憶しておき、プログラムを電子媒体からコンピュータに読み取らせることで本発明の機能をコンピュータが実現するようにしてもよい。電子媒体としては、例えばCD−ROM等の記録媒体やフラッシュメモリ、リムーバブルメディア:Removable media等が含まれる。さらに、ネットワークを介して接続した異なるコンピュータに構成要素を分散して記憶し、各構成要素を機能させたコンピュータ間で通信することで実現してもよい。 Further, each component shown in the above embodiment may be realized by a program installed in a storage such as a hard disk device of a computer, and the program is stored in a computer-readable electronic medium: electronic media, The computer may realize the functions of the present invention by causing a computer to read a program from an electronic medium. Examples of the electronic medium include a recording medium such as a CD-ROM, flash memory, and removable media. Further, the configuration may be realized by distributing and storing components in different computers connected via a network, and communicating between computers in which the components are functioning.
1…スキャナ、2…キーボード、3…モニタ、10…コンピュータ、11…画像受付部、12…文字認識部、13…記憶部、14…文字受付部、15…第1マッチング部、16…マッチング結果選択部、17…文字列設定部、18…単語辞書記憶部、19…第2マッチング部、20…第3マッチング部、21…予備設定部、51…入力ウィンドウ、52…リストボックス。
DESCRIPTION OF
Claims (10)
前記文字認識部により認識された一つ以上の文字列をそれぞれ分類するための項目を有し、各項目に対する入力文字列の入力を受け付ける受付部と、
前記文字列と前記入力文字列とを対応付けて記憶可能な記憶部と、
前記受付部により受け付けられた前記入力文字列と前記文字認識部により得られた一つ以上の文字列とをマッチングする第1マッチング部と、
前記入力文字列とマッチした前記文字列を前記入力文字列が入力された項目に対応付けて前記記憶部に記憶する文字列設定部と
を具備することを特徴とする文字入力装置。 A character recognition unit that obtains a plurality of character strings as recognition results by performing character recognition processing on an image obtained by optically reading a form;
An accepting unit that has an item for classifying one or more character strings recognized by the character recognizing unit, and that accepts input of an input character string for each item;
A storage unit capable of storing the character string and the input character string in association with each other;
A first matching unit that matches the input character string received by the receiving unit with one or more character strings obtained by the character recognition unit;
A character input device comprising: a character string setting unit that stores the character string that matches the input character string in the storage unit in association with an item in which the input character string is input.
単語を格納した辞書を記憶する辞書記憶部と、
前記文字認識部により認識された一つ以上の文字列をそれぞれ分類するための項目を有し、各項目に対する入力文字列の入力を受け付ける受付部と、
前記文字列と前記入力文字列とを対応付けて記憶可能な記憶部と、
前記受付部により受け付けられた前記入力文字列と前記文字認識部により得られた一つ以上の文字列と前記辞書中の単語とをマッチングする第2マッチング部と、
前記入力文字列とマッチした前記文字列を前記入力文字列が入力された項目に対応付けて前記記憶部に記憶する文字列設定部と
を具備することを特徴とする文字入力装置。 A character recognition unit that obtains one or more character strings as a recognition result by performing character recognition processing on an image obtained by optically reading a form; and
A dictionary storage unit for storing a dictionary storing words;
An accepting unit that has an item for classifying one or more character strings recognized by the character recognizing unit, and that accepts input of an input character string for each item;
A storage unit capable of storing the character string and the input character string in association with each other;
A second matching unit that matches the input character string received by the receiving unit, one or more character strings obtained by the character recognition unit, and a word in the dictionary;
A character input device comprising: a character string setting unit that stores the character string that matches the input character string in the storage unit in association with an item in which the input character string is input.
前記文字列設定部は、
前記提示された選択候補の中から、選択された候補を前記入力文字列が入力された項目に対応付けて前記記憶部に記憶することを特徴とする請求項1または2いずれか記載の文字入力装置。 When a plurality of the character strings and / or words that match the input character string exist, a matching result selection unit that presents as a selection candidate,
The character string setting unit
3. The character input according to claim 1, wherein a candidate selected from the presented selection candidates is stored in the storage unit in association with an item to which the input character string is input. apparatus.
認識結果の一つ以上の文字列の選択候補の中から、選択された文字列に不読文字が含まれていた場合、前記不読文字の直前までの文字列を前記入力文字列と置換することを特徴とする請求項1乃至3いずれか1記載の文字入力装置。 The character string setting unit
If an unread character is included in the selected character string from among one or more character string selection candidates of the recognition result, the character string up to immediately before the unread character is replaced with the input character string. The character input device according to claim 1, wherein the character input device is a character input device.
同じ画像について既に選択された選択候補の文字列をマッチングの対象外とすることを特徴とする請求項3記載の文字入力装置。 The first matching unit or the second matching unit is
4. The character input device according to claim 3, wherein character strings of selection candidates already selected for the same image are excluded from matching.
同じ画像について既に選択された選択候補の文字列を提示の対象外とすることを特徴とする請求項3記載の文字入力装置。 The matching result selection unit
4. The character input device according to claim 3, wherein a character string of selection candidates already selected for the same image is excluded from the subject of presentation.
前記第2マッチング部は、
マッチング対象とする辞書を、前記画像のグループ毎または前記画像から認識した文字列の項目毎に切り替えて使用することを特徴とした請求項2記載の文字入力装置。 A plurality of the dictionaries are provided for each input target item,
The second matching unit includes
The character input device according to claim 2, wherein a dictionary to be matched is switched and used for each group of images or for each item of a character string recognized from the image.
前記文字認識部により文字認識された認識結果の文字列各々について前記単語辞書中の単語とのマッチングを行い、前記認識結果の文字列が属する項目を判定する第3マッチング部と、
前記第3マッチング部により判定された項目に、前記認識結果の文字列を前記入力に先立って設定する予備設定部と、
を具備することを特徴とした請求項1乃至6いずれか1記載の文字入力装置。 A word dictionary storage unit for storing a word dictionary storing words for each input target item;
A third matching unit that performs matching with a word in the word dictionary for each character string of the recognition result recognized by the character recognition unit, and determines an item to which the character string of the recognition result belongs;
A preliminary setting unit that sets the character string of the recognition result in the item determined by the third matching unit prior to the input;
The character input device according to any one of claims 1 to 6, further comprising:
帳票を光学的に読み取って得られた画像に対して前記文字認識部が文字認識処理を行うことで認識結果として一つ以上の文字列を取得し、
取得された一つ以上の文字列をそれぞれ分類するための項目を有する前記受付部が、各項目に対する入力文字列の入力を受け付け、
受け付けられた前記入力文字列と文字認識により得られた一つ以上の文字列とを前記第1マッチング部がマッチングし、
前記入力文字列とマッチした前記文字列を、前記文字列設定部が、前記入力文字列が入力された項目に対応付けて前記記憶部に記憶する
ことを特徴とする文字入力方法。 In a character input method in a character input device having a character recognition unit, a reception unit, a first matching unit, a character string setting unit, and a storage unit,
The character recognition unit performs a character recognition process on an image obtained by optically reading a form to obtain one or more character strings as a recognition result,
The receiving unit having items for classifying one or more acquired character strings, respectively, accepts input of an input character string for each item;
The first matching unit matches the received input character string and one or more character strings obtained by character recognition,
The character input method, wherein the character string setting unit stores the character string matched with the input character string in the storage unit in association with an item to which the input character string is input.
帳票を光学的に読み取って得られた画像に対して前記文字認識部が文字認識処理を行うことで、認識結果として一つ以上の文字列を取得し、
前記文字認識部により認識された一つ以上の文字列をそれぞれ分類するための項目を有する前記受付部が、各項目に対する入力文字列の入力を受け付け、
受け付けられた前記入力文字列と文字認識により得られた一つ以上の文字列と単語が格納された辞書中の単語とを前記第2マッチング部がマッチングし、
前記入力文字列とマッチした前記文字列を、前記文字列設定部が、前記入力文字列が入力された項目に対応付けて前記記憶部に記憶する
ことを特徴とする文字入力方法。 In a character input method in a character input device having a character recognition unit, a reception unit, a second matching unit, a character string setting unit, and a storage unit,
The character recognition unit performs character recognition processing on an image obtained by optically reading a form, thereby obtaining one or more character strings as a recognition result,
The accepting unit having items for classifying one or more character strings recognized by the character recognizing unit accepts input of an input character string for each item,
The second matching unit matches the received input character string with one or more character strings obtained by character recognition and a word in a dictionary storing words;
The character input method, wherein the character string setting unit stores the character string matched with the input character string in the storage unit in association with an item to which the input character string is input.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011207747A JP5571049B2 (en) | 2011-09-22 | 2011-09-22 | Character input device, character input method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011207747A JP5571049B2 (en) | 2011-09-22 | 2011-09-22 | Character input device, character input method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013069150A true JP2013069150A (en) | 2013-04-18 |
JP5571049B2 JP5571049B2 (en) | 2014-08-13 |
Family
ID=48474784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011207747A Active JP5571049B2 (en) | 2011-09-22 | 2011-09-22 | Character input device, character input method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5571049B2 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07230531A (en) * | 1994-02-18 | 1995-08-29 | Toshiba Corp | Device and method for recognizing character |
JPH11138108A (en) * | 1995-03-14 | 1999-05-25 | Hitachi Ltd | Mail readout and classifying device |
JP2001034705A (en) * | 1999-07-26 | 2001-02-09 | Pfu Ltd | Item processing method for personal information entry medium recognizing device, personal information entry medium recognizing device having item processing function and recording medium |
JP2005352799A (en) * | 2004-06-11 | 2005-12-22 | Casio Comput Co Ltd | Character conversion device, and program for character conversion processing |
-
2011
- 2011-09-22 JP JP2011207747A patent/JP5571049B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07230531A (en) * | 1994-02-18 | 1995-08-29 | Toshiba Corp | Device and method for recognizing character |
JPH11138108A (en) * | 1995-03-14 | 1999-05-25 | Hitachi Ltd | Mail readout and classifying device |
JP2001034705A (en) * | 1999-07-26 | 2001-02-09 | Pfu Ltd | Item processing method for personal information entry medium recognizing device, personal information entry medium recognizing device having item processing function and recording medium |
JP2005352799A (en) * | 2004-06-11 | 2005-12-22 | Casio Comput Co Ltd | Character conversion device, and program for character conversion processing |
Also Published As
Publication number | Publication date |
---|---|
JP5571049B2 (en) | 2014-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102609341B1 (en) | Table recognition method, device, equipment, medium and computer program | |
US9042653B2 (en) | Associating captured image data with a spreadsheet | |
JP5400200B2 (en) | System, computer program and method for improving text input in a short hand on keyboard interface | |
US7003725B2 (en) | Method and system for normalizing dirty text in a document | |
US8712989B2 (en) | Wild card auto completion | |
US20080294982A1 (en) | Providing relevant text auto-completions | |
JP4867941B2 (en) | Form processing method, form processing program, form processing apparatus, and form processing system | |
US20120229388A1 (en) | Method and apparatus for preventing incorrect input in portable terminal | |
US20220222292A1 (en) | Method and system for ideogram character analysis | |
JP2011150466A (en) | Device, program and method for recognizing character string | |
JP2015520458A (en) | Method, controller and apparatus for composing words | |
RU2665274C2 (en) | Pop-up verification panel | |
CN107209640B (en) | Text deletion based on input mode | |
JPH08314910A (en) | Different kind of code character string transcribing device and electronic dictionary | |
US10409390B2 (en) | Display device and method for controlling display device | |
CN111142683B (en) | Input assisting program, input assisting method, and input assisting device | |
JP5571049B2 (en) | Character input device, character input method | |
JP4936650B2 (en) | Similar word search device, method thereof, program thereof, and information search device | |
JP2008176764A (en) | Image processing system, image processing method and image processing program | |
JP5550959B2 (en) | Document processing system and program | |
US11972208B2 (en) | Information processing device and information processing method | |
US20210264218A1 (en) | Character recognition system and method | |
US20210042555A1 (en) | Information Processing Apparatus and Table Recognition Method | |
JP5752073B2 (en) | Data correction device | |
US20210295032A1 (en) | Information processing device and non-transitory computer readable medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131003 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131015 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140527 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140625 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5571049 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |