JP5107157B2 - 文字認識プログラム、文字認識装置および文字認識方法 - Google Patents
文字認識プログラム、文字認識装置および文字認識方法 Download PDFInfo
- Publication number
- JP5107157B2 JP5107157B2 JP2008169844A JP2008169844A JP5107157B2 JP 5107157 B2 JP5107157 B2 JP 5107157B2 JP 2008169844 A JP2008169844 A JP 2008169844A JP 2008169844 A JP2008169844 A JP 2008169844A JP 5107157 B2 JP5107157 B2 JP 5107157B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- candidate
- character string
- word
- name
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
本発明はこのような点に鑑みてなされたものであり、低負荷の処理で文字列を精度良く認識することが可能な文字認識プログラム、文字認識装置および文字認識方法を提供することを目的とする。
図1は、文字認識システムの概要を示す図である。この文字認識システムは、コンピュータ1および画像情報取込装置2を有する。コンピュータ1と画像情報取込装置2とは、所定のインタフェースによって接続されており、相互にデータ通信が可能である。コンピュータ1は、画像情報取込装置2から画像情報を取得する。そして、コンピュータ1は、画像情報に含まれる1文字以上の文字列を、その文字列に対応する文字コード列として特定する。ここで、以降の説明では、文字列を特定することと文字コード列を特定することとは同義であるものとする。コンピュータ1は、このような文字列の特定処理を行う文字認識プログラムを実行している。このコンピュータ1は、文字認識プログラムを実行することにより、単語登録情報記憶手段1a、重み付け情報記憶手段1b、画像情報入力手段1c、文字推定手段1d、候補文字列生成手段1eおよび文字列特定手段1fとして機能する。
重み付け情報記憶手段1bは、単語登録情報記憶手段1aに記憶された単語登録情報に含まれる文字の出現回数を各文字に対応付けた重み付け情報を記憶する。
文字推定手段1dは、画像情報入力手段1cから画像情報を取得すると、画像情報に含まれる複数の文字を推定し、推定した複数の文字それぞれに対する複数の候補文字を生成する。そして、文字推定手段1dは、生成した複数の候補文字を候補文字列生成手段1eに出力する。
入力インタフェース105,106は、外部装置からのデータの入力を受け付けるインタフェースである。入力インタフェース105には、キーボード12とマウス13とが接続されている。入力インタフェース105は、キーボード12やマウス13から送られてくる信号を、バス108を介してCPU101に送信する。入力インタフェース106には、スキャナ14が接続されている。入力インタフェース106は、スキャナ14から送られてくる所定の帳票の画像情報に対応する信号をバス108を介してCPU101に送信する。また、入力インタフェース106は、入力インタフェース106の有するDMA(Direct Memory Access)機能により取得する画像情報をバス108を介して直接RAM102に格納することもある。
金融機関辞書記憶部120は、金融機関名を登録した金融機関名テーブルを記憶する。また、金融機関辞書記憶部120は、各金融機関の支店名を各金融機関名に対応付けて登録した、支店名テーブル群を記憶する。なお、金融機関名テーブルおよび支店名テーブル群を含む情報を金融機関辞書と呼ぶこととする。
文字識別部160は、画像情報入力部150から画像情報を取得すると、画像情報に含まれる文字画像を抽出する。文字識別部160は、抽出した文字画像に所定の画像識別処理を行う。ここで、文字識別部160が抽出する文字画像には、金融機関名および各金融機関の支店名が含まれる。金融機関名や各金融機関の支店名といった名称の種別は、例えば、記入された画像上の領域によって区別される。そして、文字識別部160は、文字コード記憶部110に記憶された文字コード対応テーブルに基づいて、各文字の形状に対応する文字コードを取得する。
文字コード対応テーブル111のコード体系としては、例えば、UnicodeやJIS(Japanese Industrial Standards)コード等を用いることができる。
No.を示す項目には、項目の番号を示す値が設定される。金融機関名を示す項目には、金融機関の名称を示す情報が設定される。
図8は、支店名テーブルのデータ構造例を示す図である。支店名テーブル122a,122b,122cには、No.を示す項目、支店名を示す項目が設けられている。ここでは、金融機関名“東京ABC銀行”の支店名を登録したテーブルである支店名テーブル122aに関して説明するが、支店名テーブル122b,122cに関しても同様である。
支店名テーブル122aには、例えば、No.が“1”、支店名が“本店”という情報が設定される。同様にして支店名テーブル122b,122cに関しても他の金融機関の各支店名が登録される。
図10は、金融機関名用重み付けテーブルのデータ構造例を示す図である。金融機関名用重み付けテーブル131には、No.を示す項目、文字コードを示す項目、重み付け値を示す項目が設けられている。各項目の横方向に関連付けられた情報同士が1つの文字コードに関する情報を構成する。
図12は、金融機関名に対する重み付け処理の手順を示すフローチャートである。以下、図12に示す処理をステップ番号に沿って説明する。
このように、コンピュータ100は、更新情報を取得すると、更新後の金融機関名テーブル121に基づいて金融機関名用重み付けテーブル131を更新する。
図13は、金融機関名・支店名の特定処理の手順を示すフローチャートである。以下、図13に示す処理をステップ番号に沿って説明する。
このようにして、コンピュータ100は取得した画像情報に含まれる金融機関名および支店名を特定することができる。予め算出した重み付け値により、候補となる名称に優先順位を付与し、この優先順位の高いものから判定処理を実行することで、特定結果の確からしさの高いものから順に処理が完了する。すなわち、優先順位の低いものに対する判定処理を省略することもでき、特定処理の精度を維持しつつ、コンピュータ100の処理負荷を低減することができる。
図14は、帳票の記入例を示す図である。帳票には、金融機関名を記入する欄201および支店名を記入する欄202が設けられている。金融機関名を記入する欄201には、記入者により、金融機関の名称が記入される。支店名を記入する欄202には、記入者により、記入した金融機関の支店の名称が記入される。このような情報は、例えば、業務システムにおいて銀行口座を特定するための情報として用いられる。
[ステップST1]文字識別部160は、図14の帳票に記入された金融機関名に対する文字識別部160の文字識別処理の結果、候補文字リスト301を取得する。これらの候補文字は、文字識別部160による識別処理の結果の確からしさ等による順序で並んでおり、その順序に特に意味はない。
図16は、名称特定処理の流れを示す第2の模式図である。以下、図16に示す処理をステップ番号に沿って説明する。なお、図16に示す処理は、図15に示すステップST2の後に実行される。
1a 単語登録情報記憶手段
1b 重み付け情報記憶手段
1c 画像情報入力手段
1d 文字推定手段
1e 候補文字列生成手段
1f 文字列特定手段
2 画像情報取込装置
Claims (15)
- 画像情報に含まれる文字列を認識する文字認識プログラムにおいて、
コンピュータを、
前記画像情報を基に前記文字列の各文字を推定し、その推定結果の候補としての1つ以上の候補文字を前記文字列内の各文字について出力する文字推定手段、
複数の単語が登録された単語登録情報に含まれる文字の出現回数を文字ごとに対応付けた重み付け情報に基づき、前記文字推定手段が出力した前記文字列内の各文字に対応する前記候補文字を前記出現回数が多い順に1つずつ抽出して組み合わせることで、前記文字列の候補としての1つ以上の候補文字列を順次生成する候補文字列生成手段、
前記候補文字列をその生成順に前記単語登録情報内の単語と照合し、その照合結果から前記文字列に対応する単語を特定する文字列特定手段、
として機能させることを特徴とする文字認識プログラム。 - 前記候補文字列生成手段は、前記文字推定手段が出力した前記候補文字のうち、前記単語登録情報に含まれない文字を除外して、前記候補文字列を生成することを特徴とする請求項1記載の文字認識プログラム。
- 前記文字列特定手段は、前記候補文字列と前記単語登録情報内の単語との文字の一致率に基づいて、前記文字列に対応する単語を特定することを特徴とする請求項1または2に記載の文字認識プログラム。
- 前記コンピュータを、更に、
前記単語登録情報に含まれる文字の出現回数を算出して前記重み付け情報を生成する重み付け処理手段、
として機能させることを特徴とする請求項1乃至3のいずれか1項記載の文字認識プログラム。 - 画像情報に含まれる第1の文字列と第2の文字列とを認識する文字認識プログラムにおいて、
コンピュータを、
前記画像情報を基に前記第1の文字列および前記第2の文字列の各文字を推定し、その推定結果の候補として、前記第1の文字列の各文字に対応する第1の候補文字と、前記第2の文字列の各文字に対応する第2の候補文字とを、それぞれ1つ以上出力する文字推定手段、
複数の単語が登録された第1の単語登録情報に含まれる文字の出現回数を文字ごとに対応付けた第1の重み付け情報に基づき、前記文字推定手段が出力した前記第1の文字列内の各文字に対応する前記第1の候補文字を前記第1の単語登録情報における出現回数が多い順に1つずつ抽出して組み合わせることで、前記第1の文字列の候補としての1つ以上の第1の候補文字列を順次生成する第1の候補文字列生成手段、
前記第1の候補文字列をその生成順に前記第1の単語登録情報内の単語と照合し、その照合結果から前記第1の文字列と一致すると推定される単語を示す第1の候補単語を複数選択して出力する第1の文字列特定手段、
複数の単語がそれぞれ登録された複数の第2の単語登録情報の中から、前記第1の候補単語から特定される前記第2の単語登録情報を前記第1の候補単語ごとに選択し、選択した前記第2の単語登録情報のそれぞれに含まれる文字の出現回数を文字ごとに対応付けた複数の第2の重み付け情報に基づき、前記文字推定手段が出力した前記第2の文字列内の各文字に対応する前記第2の候補文字を前記第2の単語登録情報における出現回数が多い順に1つずつ組み合わせることで、前記第2の文字列の候補としての1つ以上の第2の候補文字列を前記第1の候補単語ごとにそれぞれ順に生成する第2の候補文字列生成手段、
前記第2の候補文字列をその生成順に対応する前記第2の単語登録情報内の単語と照合し、その照合結果から前記第2の文字列と一致すると推定される単語を示す第2の候補単語を、いずれかの前記第2の単語登録情報から選択して出力するとともに、前記第2の候補単語に対応する前記第1の候補単語を、前記第1の文字列と一致する単語として確定する第2の文字列特定手段、
として機能させることを特徴とする文字認識プログラム。 - 前記第2の文字列特定手段は、前記第2の候補文字列と照合されたすべての単語の中で、照合対象の前記第2の候補文字列との一致率が最も高かった単語を、前記第2の候補単語として選択することを特徴とする請求項5記載の文字認識プログラム。
- 前記第1の文字列特定手段は、前記第1の候補文字列と前記第1の単語登録情報内の単語との一致率に基づいて、前記第1の文字列と一致すると推定される単語を1つに確定できるか否かを判定し、
1つに確定できなかった場合には、複数の前記第1の候補単語を選択して前記第2の文字列特定手段に出力し、
1つに確定できた場合には、確定した単語を唯一の前記第1の候補単語として前記第2の文字列特定手段に出力して、当該第1の候補単語から特定される1つの前記第2の重み付け情報に基づいて前記第2の候補文字列を生成させ、生成された前記第2の候補文字列を用いて前記第2の文字列特定手段に照合処理を実行させる、
ことを特徴とする請求項5または6に記載の文字認識プログラム。 - 前記第1の文字列特定手段は、算出された前記一致率のうちの最大値から所定の割合の範囲または所定の数値の範囲に複数の算出値が存在するか、または1つの算出値のみ存在するかによって、前記第1の文字列と一致すると推定される単語を1つに確定できるか否かを判定することを特徴とする請求項7記載の文字認識プログラム。
- 前記コンピュータを、更に、
前記第1の単語登録情報に含まれる文字の出現回数を算出して前記第1の重み付け情報を生成し、複数の前記第2の単語登録情報のそれぞれに含まれる文字の出現回数を算出して前記第2の単語登録情報ごとに対応付けた複数の前記第2の重み付け情報を生成する重み付け処理手段、
として機能させることを特徴とする請求項5乃至8のいずれか1項記載の文字認識プログラム。 - 前記第1の文字列は、金融機関の名称であり、
前記第2の文字列は、前記金融機関の支店の名称である、
ことを特徴とする請求項5乃至9のいずれか1項記載の文字認識プログラム。 - 画像情報に含まれる文字列を認識する文字認識装置において、
前記画像情報を基に前記文字列の各文字を推定し、その推定結果の候補としての1つ以上の候補文字を前記文字列内の各文字について出力する文字推定手段と、
複数の単語が登録された単語登録情報に含まれる文字の出現回数を文字ごとに対応付けた重み付け情報に基づき、前記文字推定手段が出力した前記文字列内の各文字に対応する前記候補文字を前記出現回数が多い順に1つずつ抽出して組み合わせることで、前記文字列の候補としての1つ以上の候補文字列を順次生成する候補文字列生成手段と、
前記候補文字列をその生成順に前記単語登録情報内の単語と照合し、その照合結果から前記文字列に対応する単語を特定する文字列特定手段と、
を有することを特徴とする文字認識装置。 - 前記候補文字列生成手段は、前記文字推定手段が出力した前記候補文字のうち、前記単語登録情報に含まれない文字を除外して、前記候補文字列を生成することを特徴とする請求項11記載の文字認識装置。
- 前記文字列特定手段は、前記候補文字列と前記単語登録情報内の単語との文字の一致率に基づいて、前記文字列に対応する単語を特定することを特徴とする請求項11または12に記載の文字認識装置。
- 前記単語登録情報に含まれる文字の出現回数を算出して前記重み付け情報を生成する重み付け処理手段を更に有することを特徴とする請求項11乃至13のいずれか1項記載の文字認識装置。
- 画像情報に含まれる文字列を認識する文字認識装置の文字認識方法において、
文字推定手段が、前記画像情報を基に前記文字列の各文字を推定し、その推定結果の候補としての1つ以上の候補文字を前記文字列内の各文字について出力し、
候補文字列生成手段が、複数の単語が登録された単語登録情報に含まれる文字の出現回数を文字ごとに対応付けた重み付け情報に基づき、前記文字推定手段が出力した前記文字列内の各文字に対応する前記候補文字を前記出現回数が多い順に1つずつ抽出して組み合わせることで、前記文字列の候補としての1つ以上の候補文字列を順次生成し、
文字列特定手段が、前記候補文字列をその生成順に前記単語登録情報内の単語と照合し、その照合結果から前記文字列に対応する単語を特定する、
ことを特徴とする文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008169844A JP5107157B2 (ja) | 2008-06-30 | 2008-06-30 | 文字認識プログラム、文字認識装置および文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008169844A JP5107157B2 (ja) | 2008-06-30 | 2008-06-30 | 文字認識プログラム、文字認識装置および文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010009440A JP2010009440A (ja) | 2010-01-14 |
JP5107157B2 true JP5107157B2 (ja) | 2012-12-26 |
Family
ID=41589822
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008169844A Expired - Fee Related JP5107157B2 (ja) | 2008-06-30 | 2008-06-30 | 文字認識プログラム、文字認識装置および文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5107157B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5724356B2 (ja) | 2010-01-19 | 2015-05-27 | 株式会社リコー | 搬送装置、画像形成装置およびプログラム |
JP6127676B2 (ja) | 2013-04-12 | 2017-05-17 | オムロン株式会社 | 画像認識装置、画像認識プログラム、記録媒体、および画像認識方法 |
JP6527256B1 (ja) * | 2018-01-29 | 2019-06-05 | 株式会社 みずほ銀行 | 帳票対応システム、帳票対応方法及び帳票対応プログラム |
JP7118923B2 (ja) * | 2019-05-09 | 2022-08-16 | 株式会社 みずほ銀行 | 帳票対応システム、帳票対応方法及び帳票対応プログラム |
JP2022088183A (ja) * | 2020-12-02 | 2022-06-14 | 株式会社三菱Ufj銀行 | 帳票読取装置及び帳票読取方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0696287A (ja) * | 1992-09-17 | 1994-04-08 | Nec Corp | 単語照合前処理方式 |
JP3221968B2 (ja) * | 1993-04-02 | 2001-10-22 | 沖電気工業株式会社 | 文字認識装置 |
JPH0816730A (ja) * | 1994-06-29 | 1996-01-19 | Oki Electric Ind Co Ltd | 文字認識システム |
JP3085107B2 (ja) * | 1994-11-01 | 2000-09-04 | 松下電器産業株式会社 | 文字認識装置 |
JP3275704B2 (ja) * | 1996-05-21 | 2002-04-22 | 株式会社日立製作所 | 入力文字列推測認識装置 |
JPH1153474A (ja) * | 1997-08-07 | 1999-02-26 | Oki Electric Ind Co Ltd | 文字列認識方法 |
JP2001195636A (ja) * | 2000-01-07 | 2001-07-19 | Hitachi Ltd | 自動取引装置のイメージデータ認識装置 |
JP2005208927A (ja) * | 2004-01-22 | 2005-08-04 | Fujitsu Ltd | 為替データ誤り防止プログラム |
-
2008
- 2008-06-30 JP JP2008169844A patent/JP5107157B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010009440A (ja) | 2010-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10489672B2 (en) | Video capture in data capture scenario | |
CN109522538B (zh) | 表格内容的自动分列方法、装置、设备及存储介质 | |
WO2019233421A1 (zh) | 图像处理方法及装置、电子设备、存储介质 | |
US20210312166A1 (en) | System and method for face recognition based on dynamic updating of facial features | |
WO2019024692A1 (zh) | 语音输入方法、装置、计算机设备和存储介质 | |
AU2019419888A1 (en) | System and method for information extraction with character level features | |
JP2007317022A (ja) | 手書文字処理装置及び手書文字処理方法 | |
JP5107157B2 (ja) | 文字認識プログラム、文字認識装置および文字認識方法 | |
CN108596079B (zh) | 手势识别方法、装置及电子设备 | |
US20100045787A1 (en) | Authenticating apparatus, authenticating system, and authenticating method | |
CN113780098A (zh) | 文字识别方法、装置、电子设备以及存储介质 | |
CN113033271A (zh) | 利用人工智能模块学习脸部辨识的处理方法 | |
US20210279460A1 (en) | Information processing system, information processing method, and non-transitory recording medium | |
KR20200082932A (ko) | 광학 문자 판독 장치를 포함하는 로봇 프로세스 자동화 시스템 | |
JP2015045984A (ja) | 情報処理装置、文字認識方法、及びプログラム | |
US20150178346A1 (en) | Using biometric data to identify data consolidation issues | |
JP4715704B2 (ja) | 音声認識装置、および音声認識プログラム | |
JP2020095374A (ja) | 文字認識システム、文字認識装置、プログラム及び文字認識方法 | |
US20210374147A1 (en) | Information processing apparatus, information processing method, and storage medium | |
CN113971810A (zh) | 文档生成方法、装置、平台、电子设备以及存储介质 | |
JP2010237909A (ja) | 知識補正プログラム、知識補正装置および知識補正方法 | |
CN117081727B (zh) | 一种弱口令检测方法以及装置 | |
WO2022259304A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP7388677B2 (ja) | 入力支援装置、入力支援方法、及びプログラム | |
WO2021230128A1 (ja) | 情報処理装置、情報処理方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100616 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120628 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120710 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120906 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121002 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121003 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5107157 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151012 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |