JP2010282272A - 文字認識方法、文字認識プログラム及び文字認識装置 - Google Patents
文字認識方法、文字認識プログラム及び文字認識装置 Download PDFInfo
- Publication number
- JP2010282272A JP2010282272A JP2009133058A JP2009133058A JP2010282272A JP 2010282272 A JP2010282272 A JP 2010282272A JP 2009133058 A JP2009133058 A JP 2009133058A JP 2009133058 A JP2009133058 A JP 2009133058A JP 2010282272 A JP2010282272 A JP 2010282272A
- Authority
- JP
- Japan
- Prior art keywords
- image information
- kanji
- character
- characters
- roman
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
【課題】名刺等に表記された漢字画像情報とこれに対応するローマ字画像情報とを読み取った際に、ローマ字画像情報から抽出したローマ字で漢字の文字認識処理を補完し、漢字の文字認識精度を向上することができるようにする。
【解決手段】文字認識装置は、画像読取装置100と情報処理装置200とで構成されている。情報処理装置200の制御部201は、原稿の画像情報から抽出した漢字画像情報毎に形状的特徴に基づいて対応する漢字を選択する際に、特定の漢字画像情報と所定の関係を有するローマ字画像情報について選択されたローマ字に基づいて、特定の漢字画像情報について選択処理で選択された複数の漢字の中から特定の漢字画像情報に対応する漢字を検索する。
【選択図】図1
【解決手段】文字認識装置は、画像読取装置100と情報処理装置200とで構成されている。情報処理装置200の制御部201は、原稿の画像情報から抽出した漢字画像情報毎に形状的特徴に基づいて対応する漢字を選択する際に、特定の漢字画像情報と所定の関係を有するローマ字画像情報について選択されたローマ字に基づいて、特定の漢字画像情報について選択処理で選択された複数の漢字の中から特定の漢字画像情報に対応する漢字を検索する。
【選択図】図1
Description
この発明は、名刺等の原稿から文字を読み取る文字認識方法、名刺等の原稿から文字を読み取る処理をコンピュータに実行させる文字認識プログラム、及びこのプログラムがインストールされた文字認識装置に関する。
原稿の画像を読み取る画像読取装置には、原稿から読み取った文字の画像情報から該当する文字を特定する文字認識機能を用いて、名刺に表記されている文字を認識し、住所録を作成するようにした装置がある(例えば、特許文献1参照。)。
従来の画像読取装置では、さらに、名刺の画像情報から文字認識機能によって住所録用のデータとして取り込む際に、名刺の裏面におけるローマ字の画像情報を使用して氏名等の取り込みを行うものもある(例えば、特許文献2参照。)。名刺の裏面の画像情報から認識した裏面文字がローマ字であれば、表面文字である漢字に対応する振り仮名を生成し、生成した振り仮名を漢字とともに記憶する。
しかし、日本語文字には漢字、平仮名、片仮名があるため、ローマ字に比較して文字数が多く、複雑であり、特に漢字はローマ字に比較して認識率が低い。このため、名刺等の原稿から読み取った漢字の画像情報を正確に認識することが難しく、ユーザによる修正が必要になる場合があった。
この発明の目的は、名刺等に表記された漢字画像情報とこれに対応するローマ字画像情報とを読み取った際に、ローマ字画像情報から抽出したローマ字で漢字の文字認識処理を補完し、漢字の認識精度を向上することができる文字認識方法、文字認識プログラム及び文字認識装置を提供することにある。
この発明の文字認識プログラムがインストールされた文字認識装置で実行される文字認識方法は、検索処理を含む。検索処理は、原稿の画像情報から抽出した文字画像情報毎に形状的特徴に基づいて対応する漢字及びローマ字を選択する選択処理時に実行される。検索処理では、画像情報内で特定の漢字画像情報と所定の関係を有するローマ字画像情報について選択されたローマ字に基づいて、特定の漢字画像情報について選択処理で選択された複数の漢字の中から特定の漢字画像情報に対応する漢字を検索する。
この構成では、特定の漢字画像情報に対して複数の漢字が選択された場合、特定の漢字画像情報と所定の関係を有するローマ字画像情報に対して選択されたローマ字に基づいて、選択された複数の漢字の中から特定の漢字画像情報の漢字が検索される。
したがって、ローマ字に比較して認識率の低い漢字の認識処理が、漢字に比較して認識率の高いローマ字の選択結果によって補完される。
この構成において、検索処理が、所定の関係を有するローマ字画像情報に対して選択処理で選択されたローマ字を仮名文字に変換する第1変換処理と、仮名文字を少なくとも1つの漢字に変換する第2変換処理と、を含み、選択処理で選択された複数の漢字のなかから第2変換処理で変換された漢字に一致する漢字を検索するものとすることが好ましい。
特定の漢字画像情報に対して選択された複数の漢字のなかで、特定の漢字画像情報と所定の関係を有するローマ字画像情報のローマ字の称呼から選択された漢字に一致する漢字を特定の漢字画像情報の漢字として確定することで、文字認識精度を向上することができる。
また、確定処理で複数の漢字が確定された場合、何れか1つの漢字の選択入力を受け付ける選択入力処理を含むことが好ましい。特定の漢字画像情報から選択した複数の漢字が特定の漢字画像情報と所定の関係を有するローマ字画像情報のローマ字の称呼から選択された漢字に一致した場合には、ユーザによる選択に委ねることができる。
なお、所定の関係は、一例として、名刺の表裏面の画像情報における同一の氏名についての漢字画像情報とローマ字画像情報との関係である。名刺の表裏面から読み取った画像情報に基づいて、正確な氏名情報を取得することができる。
この発明によれば、ローマ字画像情報から抽出したローマ字でそのローマ字に対応する漢字の文字認識処理を補完することができ、漢字の文字認識精度を向上することができる。
図1に示すように、この発明の実施形態に係る文字認識装置は、画像読取装置100と情報処理装置200とで構成されている。画像読取装置100は、一例としてディジタル複合機である画像形成装置110に搭載されており、原稿トレイ101に載置された原稿を一枚ずつ搬送する間に、原稿の表裏両面から画像を読み取る。
情報処理装置200は、一例としてパーソナルコンピュータであり、制御ボード210、ディスクドライブ220及びハードディスクドライブ230を内蔵し、ディスプレイ240、キーボード250、マウス260が接続されている。制御ボード210には、CPU211にROM212、RAM213、入出力インタフェース214〜217等を接続した制御部201が構成されている。インタフェース214〜217には、それぞれディスプレイ240、キーボード250、マウス260、画像読取装置100が接続されている。
ハードディスクドライブ230には、ディスクドライブ220を介して、名刺情報管理ソフト等のアプリケーションプログラム231、画像読取装置100の動作を制御するスキャナドライバ232がインストールされている。また、ハードディスクドライブ230には、ディスクドライブ220を介して、この発明の文字認識プログラム233が、文字データベース234、第1のテーブル235、第2のテーブル236とともにインストールされている。
文字データベース234は、漢字の画像情報及びローマ字の画像情報で構成されている。第1のテーブル235は、ローマ字と仮名文字との関係を記憶している。第2のテーブル236は、仮名文字と少なくとも1つの漢字との関係を記憶している。
スキャナドライバ232は、ハードディスクドライブ230にインストールされたアプリケーションソフト232が起動している間に、作業者のキーボード250又はマウス260の操作による指示入力に基づいて起動する。スキャナドライバは、作業者のキーボード250又はマウス260の操作による読取開始の指示入力により、画像読取装置100に原稿の読取動作を開始させる。
図2は、情報処理装置200の制御部201が実行する文字認識プログラム232の処理手順を示すフローチャートであり、図3に示す名刺300から読み取った名刺情報を名刺情報管理ソフトで管理する際の処理を示している。情報処理装置200で名刺情報管理ソフトが起動している間に、作業者がキーボード250又はマウス260の操作によって名刺情報の読取を指示すると、制御部201は、スキャナドライバ231によって画像読取装置100に名刺情報の読取動作を開始させる。
画像読取装置100は、原稿トレイ101に載置された原稿としての名刺300の搬送を開始し、名刺300の表面301及び裏面302の両面の画像を読み取る。画像読取装置100は、名刺300の表面301から読み取った表面画像情報及び裏面302から読み取った裏面画像情報を情報処理装置200に送信する。
制御部201は、インタフェース217を介して表面画像情報及び裏面画像情報を受信すると、先ず、裏面画像情報から形状的特徴に基づいて文字データベース234からローマ字候補を選択する(S11)。次いで、制御部201は、表面画像情報から形状的特徴に基づいて文字データベース234から漢字の候補を第1の漢字候補として選択し(S12)、第1の漢字候補が複数存在するか否かの判別を行う(S13)。
第1の漢字候補が複数存在する場合、制御部201は、ステップS11で選択したローマ字候補のうちで対応する文字列を第1のテーブル235を参照して仮名文字に変換し(S14)、さらに、変換した仮名文字を称呼とする少なくとも1つの漢字を第2のテーブルを参照して第2の漢字候補として選択する(S15)。
この後、制御部201は、第1の漢字候補のそれぞれを第2の漢字候補と比較するこの発明の検索処理を実行し(S16)、第1の漢字候補と第2の漢字候補とにおいて共通する単一の漢字候補のみが存在する場合には、その漢字候補を表面画像情報における漢字画像に対応する漢字として決定する(S17,S18)。
ステップS16における検索処理の結果、第1の漢字候補と第2の漢字候補とにおいて共通する複数の漢字候補が存在する場合には、制御部201はそれらの漢字候補をディスプレイ240に表示し(S19)、作業者による選択操作を受け付け、作業者が選択した漢字候補を表面画像情報における漢字画像に対応する漢字として決定する(S20,S18)。
制御部201は、表面画像情報から読み取った漢字画像情報の全てについてステップS12〜S20の処理を繰り返し実行する(S21)。
以上の処理により、漢字画像情報からの漢字の文字認識結果を、ローマ字画像情報からのローマ字の文字認識結果で補完することができる。例えば、名刺300の表面301の「早川」の漢字画像について形状的特徴から図4(A)に示す「甲川」、「早川」、「早州」、「甲州」の4つの第1の漢字候補が選択された場合を考える。この場合、「早川」の画像情報がこの発明の特定の漢字画像情報である。
この場合には、裏面302において表面301の「早川」の漢字画像の位置に対応する位置の「HAYAKAWA」のローマ字画像の形状的特徴から選択したローマ字を仮名文字に変換し、図4(B)に示すように変換後の仮名文字に対応する「早川」、「早河」を第2の漢字候補とする。そして、第1の漢字候補と第2の漢字候補とに共通する「早川」が選択される。したがって、表面301と裏面302とにおける位置関係が、この発明の所定の関係に相当する。
一般に、形状的特徴に基づく漢字認識の精度よりもローマ字認識の精度の方が高い。ローマ字は26文字の中からの選択であるのに対して、形状的特徴が類似する多数の漢字が存在するためである。このため、形状的特徴に基づく漢字認識で漢字を正確に特定することは難しい。そこで、対応するローマ字が原稿画像情報に存在する場合には、形状的特徴に基づいて認識されたローマ字を一旦仮名文字に変換した後、変換された仮名文字を称呼とする漢字を選択し、形状的特徴に基づく漢字認識で選択された複数の類似する漢字のうちで共通する漢字を特定する。これによって、漢字の文字認識をローマ字の文字認識によって補完することができ、漢字の文字認識の精度を向上することができる。
上述の実施形態の説明は、すべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上述の実施形態ではなく、特許請求の範囲によって示される。さらに、本発明の範囲には、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
例えば、原稿は、表面301に漢字画像が記載され、裏面302にローマ字画像が記載されている名刺300に限るものではなく、一方の面に漢字画像とローマ字画像とが記載されている名刺以外のものであってもよい。
また、画像読取装置100を搭載したディジタル複合機110の制御部にこの発明の文字認識プログラムをインストールし、ディジタル複合機110でこの発明の文字認識方法を実行するようにしてもよい。さらに、情報処理装置に単独で接続された画像読取装置でこの発明の文字認識方法を実行するようにしてもよい。
100−画像読取装置
200−情報処理装置
201−制御部
210−制御ボード
230−ハードディスク
231−アプリケーションプログラム
232−スキャナドライバ
233−文字認識プログラム
234−文字データベース
235−第1のテーブル
236−第2のテーブル
200−情報処理装置
201−制御部
210−制御ボード
230−ハードディスク
231−アプリケーションプログラム
232−スキャナドライバ
233−文字認識プログラム
234−文字データベース
235−第1のテーブル
236−第2のテーブル
Claims (12)
- 原稿の画像情報から抽出した文字画像情報毎に形状的特徴に基づいて対応する漢字又はローマ字を選択する選択処理時に、特定の漢字画像情報について複数の漢字が選択された際に、前記原稿の画像情報内で前記特定の漢字画像情報と所定の関係を有するローマ字画像情報について前記選択処理で選択されたローマ字に基づいて、前記特定の漢字画像情報について前記選択処理で選択された複数の漢字のなかから前記特定の漢字画像情報に対応する漢字を検索する検索処理を含む文字認識方法。
- 前記検索処理は、前記所定の関係を有するローマ字画像情報に対して前記選択処理で選択されたローマ字をローマ字と仮名文字との関係を記憶した第1のテーブルを参照して仮名文字に変換する第1変換処理と、前記第1変換処理で変換された仮名文字を仮名文字と漢字との関係を記憶した第2のテーブルを参照して少なくとも1つの漢字に変換する第2変換処理と、を含み、前記選択処理で選択された複数の漢字のなかから前記第2変換処理で変換された漢字に一致する漢字を検索する処理である請求項1に記載の文字認識方法。
- 前記検索処理で複数の漢字が一致された場合、何れか1つの漢字の選択入力を受け付ける選択入力処理を含む請求項1又は2に記載の文字認識方法。
- 前記所定の関係は、名刺の表裏面の画像情報における同一の氏名についての漢字画像情報とローマ字画像情報との関係である請求項1乃至3の何れかに記載の文字認識方法。
- 情報処理装置に原稿の画像情報から抽出した文字画像情報毎に形状的特徴に基づいて対応する漢字又はローマ字を選択する選択処理を実行させる文字認識プログラムであって、
特定の漢字画像情報について複数の漢字が選択された際に、前記原稿の画像情報内で前記特定の漢字画像情報と所定の関係を有するローマ字画像情報について前記選択処理で選択されたローマ字に基づいて、前記特定の漢字画像情報について前記選択処理で選択された複数の漢字のなかから前記特定の漢字画像情報に対応する漢字を検索する検索ステップを含む文字認識プログラム。 - 前記検索ステップは、前記所定の関係を有するローマ字画像情報に対して前記選択処理で選択されたローマ字をローマ字と仮名文字との間系を記憶した第1のテーブルを参照して仮名文字に変換する第1変換ステップと、前記第1変換ステップで変換された仮名文字を仮名文字と漢字との関係を記憶した第2のテーブルを参照して少なくとも1つの漢字に変換する第2変換ステップと、を含み、前記選択ステップで選択された複数の漢字のなかから前記第2変換ステップで変換された漢字に一致する漢字を検索するステップである請求項5に記載の文字認識プログラム。
- 前記確定ステップで複数の漢字が確定された場合、何れか1つの漢字の選択入力を受け付ける選択入力ステップを含む請求項5又は6に記載の文字認識プログラム。
- 前記所定の関係は、名刺の表裏面の画像情報における同一の氏名についての漢字画像情報とローマ字画像情報との関係である請求項5乃至7の何れかに記載の文字認識プログラム。
- 漢字及びローマ字の画像情報を記憶した文字データベースを記憶した記憶部と、
原稿の画像情報から抽出した形状的特徴に基づいて、前記文字データベースから、漢字画像情報毎に漢字を選択するとともにローマ字画像情報毎にローマ字を選択する選択処理を実行する制御部と、を備え、
前記制御部は、特定の漢字画像情報について複数の漢字が存在し、前記特定の漢字画像情報と所定の関係を有するローマ字画像情報が前記画像情報内に存在する場合に、前記所定の関係を有するローマ字画像情報について前記選択処理で選択したローマ字に基づいて、前記特定の漢字画像情報について前記選択処理で選択した複数の漢字のなかから前記特定の漢字画像情報の漢字を検索する検索処理を実行する文字認識装置。 - 前記記憶部は、ローマ字と仮名文字との間系を記憶した第1テーブル、及び仮名文字と漢字との関係を記憶した第2テーブルをさらに記憶し、
前記制御部は、前記検索処理時に、前記所定の関係を有するローマ字画像情報に対して前記選択処理で選択したローマ字を前記第1テーブルを参照して仮名文字に変換する第1変換処理と、前記第1変換処理で変換した仮名文字を前記第2テーブルを参照して少なくとも1つの漢字に変換する第2変換処理と、を順に実行し、前記選択処理で選択した複数の漢字のなかから前記第2変換処理で変換した漢字に一致する漢字を検索する請求項9に記載の文字認識装置。 - 前記制御部は、前記検索処理で複数の漢字を確定した場合、何れか1つの漢字の選択入力を受け付ける請求項9又は11に記載の文字認識装置。
- 前記所定の関係は、名刺の表裏面の画像情報における同一の氏名についての漢字画像情報とローマ字画像情報との関係である請求項9乃至11の何れかに記載の文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009133058A JP2010282272A (ja) | 2009-06-02 | 2009-06-02 | 文字認識方法、文字認識プログラム及び文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009133058A JP2010282272A (ja) | 2009-06-02 | 2009-06-02 | 文字認識方法、文字認識プログラム及び文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010282272A true JP2010282272A (ja) | 2010-12-16 |
Family
ID=43538974
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009133058A Pending JP2010282272A (ja) | 2009-06-02 | 2009-06-02 | 文字認識方法、文字認識プログラム及び文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010282272A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110414515A (zh) * | 2019-08-01 | 2019-11-05 | 上海海事大学 | 基于信息融合处理的汉字图像识别方法、装置及存储介质 |
-
2009
- 2009-06-02 JP JP2009133058A patent/JP2010282272A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110414515A (zh) * | 2019-08-01 | 2019-11-05 | 上海海事大学 | 基于信息融合处理的汉字图像识别方法、装置及存储介质 |
CN110414515B (zh) * | 2019-08-01 | 2023-12-08 | 上海海事大学 | 基于信息融合处理的汉字图像识别方法、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7159608B2 (ja) | 操作画面の表示装置、画像処理装置及びプログラム | |
US10528679B2 (en) | System and method for real time translation | |
US20120030234A1 (en) | Method and system for generating a search query | |
JP2008052372A (ja) | 画像処理装置、手書き情報認識方法、手書き情報認識プログラム | |
JP2019144759A (ja) | 画像処理装置、画像処理装置の制御方法、およびプログラム | |
CN102694940B (zh) | 信息处理装置及其控制方法 | |
JP2010086151A (ja) | データ生成装置、スキャナ、及びコンピュータプログラム | |
US11836442B2 (en) | Information processing apparatus, method, and storage medium for associating metadata with image data | |
US9310971B2 (en) | Document viewing device for display document data | |
US11941903B2 (en) | Image processing apparatus, image processing method, and non-transitory storage medium | |
JP2015204075A (ja) | 電子文書生成システムおよびプログラム | |
US11620844B2 (en) | Image processing apparatus, control method of image processing apparatus, and storage medium | |
US20150261735A1 (en) | Document processing system, document processing apparatus, and document processing method | |
US10638001B2 (en) | Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data | |
JP2007041709A (ja) | 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 | |
JP2021149439A (ja) | 情報処理装置及び情報処理プログラム | |
JP2008092451A (ja) | スキャナシステム | |
JP2000322417A (ja) | 画像ファイリング装置及び方法及び記憶媒体 | |
JP2010282272A (ja) | 文字認識方法、文字認識プログラム及び文字認識装置 | |
JP2019133370A (ja) | 画像処理装置および画像処理プログラム | |
JP7302175B2 (ja) | 情報処理装置、及び情報処理プログラム | |
JP6484974B2 (ja) | 情報処理装置、情報処理システム及びプログラム | |
US20230325126A1 (en) | Information processing apparatus and method and non-transitory computer readable medium | |
JP6303742B2 (ja) | 画像処理装置、画像処理方法、および画像処理プログラム | |
JP5284342B2 (ja) | 文字認識システムおよび文字認識プログラム |