JP4091308B2 - Information processing apparatus and character recognition method - Google Patents

Information processing apparatus and character recognition method Download PDF

Info

Publication number
JP4091308B2
JP4091308B2 JP2002031436A JP2002031436A JP4091308B2 JP 4091308 B2 JP4091308 B2 JP 4091308B2 JP 2002031436 A JP2002031436 A JP 2002031436A JP 2002031436 A JP2002031436 A JP 2002031436A JP 4091308 B2 JP4091308 B2 JP 4091308B2
Authority
JP
Japan
Prior art keywords
character
address information
electronic address
candidate
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002031436A
Other languages
Japanese (ja)
Other versions
JP2003233772A (en
Inventor
外志正 土橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2002031436A priority Critical patent/JP4091308B2/en
Publication of JP2003233772A publication Critical patent/JP2003233772A/en
Application granted granted Critical
Publication of JP4091308B2 publication Critical patent/JP4091308B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、文字認識機能を有する情報処理装置及び文字認識方法に関する。
【0002】
【従来の技術】
OCR(Optical Character Reader)は、紙などの帳票もしくは文書に記された文字を画像として読み込み、それを電子化な文字データに変換する手段として広く用いられている。このようなOCRでは、文字画像を読み込んだ後、文字認識が行われる。
【0003】
文字認識結果の精度の向上を図るため、一般に、文字認識を行った後、さらに文脈や辞書を用いた後処理が行われている。
【0004】
【発明が解決しようとする課題】
文脈や辞書を用いた後処理は、一般的な文字に対しては有効である。しかしながら、文脈や辞書による後処理を適用することができない対象も多い。
【0005】
例えば、近年、インターネットが普及するにつれ、WebページのURL(Uniform Resource Locator)や電子メールアドレスなどの電子アドレス情報が文字認識対象となることが増えつつある状況にあるが、これらの情報は文脈や辞書を用いた後処理を行うことが困難な対象の1つである。
【0006】
本発明は上記実状に鑑みてなされたものであり、文字認識対象に電子アドレス情報が含まれている場合であっても、高精度な文字認識結果を得ることのできる情報処理装置及び文字認識方法を提供することを目的とする。
【0007】
【課題を解決するための手段】
本発明に係る情報処理装置は、文字認識機能を有する情報処理装置であって、読み取った画像の文字列領域の文字認識を文字認識を行って、各文字の候補及びその信頼度を生成する文字認識手段と、前記文字認識手段による文字認識の結果に基づき、電子アドレス情報に該当する文字列があるか否かの判定を含む後処理判定を行う後処理判定手段と、前記後処理判定手段による判定の結果、電子アドレス情報に該当する文字列があった場合に、前記文字認識手段の文字認識結果として得られる電子アドレス情報に該当する文字列を構成する個々の文字の候補とその信頼度から少なくとも一つの電子アドレス情報に該当する文字列の候補を生成する候補生成手段と、前記候補生成手段によって生成された候補を用いてネットワークへの接続を試行するネットワーク接続手段と、前記ネットワーク接続手段によって接続が成功した電子アドレス情報に該当する文字列の候補が1つだけの場合には、この接続が成功した電子アドレス情報に該当する文字列の候補を前記文字認識手段による文字認識結果として確定し、前記ネットワーク接続手段によって接続が成功した電子アドレス情報に該当する文字列の候補が複数ある場合には、これら複数の電子アドレス情報に該当する文字列の候補のうち、最も信頼度が高い電子アドレス情報に該当する文字列の候補を前記文字認識手段による文字認識結果として確定する認識確定手段とを具備することを特徴とする。
【0008】
また、本発明に係る情報処理装置は、文字認識機能を有する情報処理装置であって、前記文書の画像を読み取る文書画像入力手段と、前記文書画像入力手段によって入力された画像からレイアウトを解析して文字列領域を抽出するレイアウト解析手段と、前記レイアウト解析手段によって抽出された領域に対して文字認識を行って、各文字の候補及びその信頼度を生成する文字認識手段と、前記文字認識手段による文字認識の結果に基づき、電子アドレス情報に該当する文字列があるか否かの属性判定、及び前記電子アドレス情報に該当する文字列の信頼性判定を含む後処理判定を行う後処理判定手段と、前記後処理判定手段による属性判定及び信頼性判定の結果、電子アドレス情報に該当する文字列が存在し、且つそれが一定の信頼度に達しないものである場合、その文字列に対して少なくとも一つの電子アドレス情報に該当する文字列の候補を生成する候補生成手段と、前記候補生成手段によって生成された候補を用いてネットワークへの接続を試行するネットワーク接続手段と、前記ネットワーク接続手段によって接続が成功した電子アドレス情報に該当する文字列の候補が1つだけの場合には、この接続が成功した電子アドレス情報に該当する文字列の候補を前記文字認識手段による文字認識結果として確定し、前記ネットワーク接続手段によって接続が成功した電子アドレス情報に該当する文字列の候補が複数ある場合には、これら複数の電子アドレス情報に該当する文字列の候補のうち、最も信頼度が高い電子アドレス情報に該当する文字列の候補を前記文字認識手段による文字認識結果として確定する認識確定手段とを具備することを特徴とする。
【0009】
また、本発明に係る文字認識方法は、文字認識機能を有する情報処理装置に適用される文字認識方法であって、読み取った画像の文字列領域の文字認識を行って、各文字の候補及びその信頼度を生成し、前記文字認識の結果に基づき、電子アドレス情報に該当する文字列があるか否かの判定を含む後処理判定を行い、前記後処理判定手段による判定の結果、電子アドレス情報に該当する文字列があった場合に、前記文字認識手段の文字認識結果として得られる電子アドレス情報に該当する文字列を構成する個々の文字の候補とその信頼度から少なくとも一つの電子アドレス情報に該当する文字列の候補を生成し、前記生成された候補を用いてネットワークへの接続を試行し、前記ネットワークへの接続の試行が成功した電子アドレス情報に該当する文字列の候補が1つだけの場合には、この接続が成功した電子アドレス情報に該当する文字列の候補を前記文字認識手段による文字認識結果として確定し、前記ネットワークへの接続の試行が成功した電子アドレス情報に該当する文字列の候補が複数ある場合には、これら複数の電子アドレス情報に該当する文字列の候補のうち、最も信頼度が高い電子アドレス情報に該当する文字列の候補を前記文字認識手段による文字認識結果として確定することを特徴とする。
【0010】
また、本発明に係る文字認識方法は、文字認識機能を有する情報処理装置に適用される文字認識方法であって、前記文書の画像を読み取り、読み取った画像からレイアウトを解析して文字列領域を抽出し、抽出された領域に対して文字認識を行って、各文字の候補及びその信頼度を生成し、文字認識の結果に基づき、電子アドレス情報に該当する文字列があるか否かの属性判定、及び前記電子アドレス情報に該当する文字列の信頼性判定を含む後処理判定を行い、属性判定及び信頼性判定の結果、電子アドレス情報に該当する文字列が存在し、且つそれが一定の信頼度に達しないものである場合、その文字列に対して少なくとも一つの電子アドレス情報に該当する文字列の候補を生成し、前記生成された候補を用いてネットワークへの接続を試行し、前記ネットワーク接続手段によって接続が成功した電子アドレス情報に該当する文字列の候補が1つだけの場合には、この接続が成功した電子アドレス情報に該当する文字列の候補を前記文字認識手段による文字認識結果として確定し、前記ネットワーク接続手段によって接続が成功した電子アドレス情報に該当する文字列の候補が複数ある場合には、これら複数の電子アドレス情報に該当する文字列の候補のうち、最も信頼度が高い電子アドレス情報に該当する文字列の候補を前記文字認識手段による文字認識結果として確定することを特徴とする。
【0011】
【発明の実施の形態】
以下、図面を参照して本発明の実施形態を説明する。
【0012】
図1は、本発明の一実施形態に係る情報処理装置の構成を示すブロック図である。
【0013】
本情報処理装置は、文書の画像を入力し文字認識を行うものであり、文書画像入力部10、レイアウト解析部20、文字認識部30、後処理判定部40、候補生成部50、ネットワーク接続部60、認識確定部70を備えている。
【0014】
文書画像入力部10は、文書の画像(文字情報を含んだ電子画像データ)を入力するものである。
【0015】
レイアウト解析部20は、文書画像入力部10によって読み取った画像からレイアウトを解析して認識対象の文字列領域を抽出するものである。
【0016】
文字認識部30は、レイアウト解析部20によって抽出された領域に対して文字認識を行うものであり、文字認識の結果として各文字の候補及びその信頼度を生成する。
【0017】
後処理判定部40は、図2に示されるように属性判定部41及び信頼性判定部42を備えており、文字認識部30による文字認識の結果に基づき、電子アドレス情報に該当する文字列があるか否かの属性判定(属性判定部41での処理)及び電子アドレス情報に該当する文字列の信頼性判定を含む後処理判定(信頼性判定部42での処理)を行うものである。上記属性判定は、文字列の並びの法則やフォーム情報などに基づいて行われる。
【0018】
候補生成部50は、後処理判定部40による属性判定及び信頼度判定の結果、電子アドレス情報に該当する文字列が存在し、且つそれが一定の信頼度に達しないものである場合、その文字列に対して少なくとも一つの候補を生成するものである。
【0019】
ネットワーク接続部60は、候補生成部50によって生成された候補を用いてネットワークへの接続を試行する(検証する)ものである。
【0020】
認識確定部70は、ネットワーク接続部60による接続の結果を用いて、文字認識部30による文字認識結果を最終的に確定するものである。例えば、ネットワーク接続の結果、正しいことが確認できた候補の電子アドレス情報を採用して、文字認識結果を最終的に確定する。
【0021】
図3は、文書画像入力部10によって読み取られる文書の画像の一例を示す図である。
【0022】
同図に示される画像70は、WebページのURL(Uniform Resource Locator)及び電子メールアドレスに相当する電子アドレス情報を含むものである。
【0023】
この画像70は、レイアウト解析部20によりレイアウトが解析されると、図4中の枠で示されるように個々の文字列領域が切り出され、当該個々の文字列領域に対して文字認識部30による文字認識処理が行われる。この場合、切り出された個々の文字列領域の中には、URL(Uniform Resource Locator)のアドレスを含む領域71及び電子メールアドレスを含む領域72が存在している。
【0024】
図5は、文字認識部30による認識結果の一例を説明するための図である。
【0025】
同図には、文字認識部30により認識される個々の文字列領域のうち、URLアドレスの領域71(図4)に含まれる文字列「www.tokyo.co.jp」が一例として示されている。この文字列の中のうち、例えば符号73で示される文字「k」に関して認識が行われたとき、信頼度の高い順に「第1候補文字k」(信頼度40)、「第2候補文字h」(信頼度30)、「第3候補文字b」(信頼度20)、・・・などの形で識別結果が得られる。こうした識別結果は、他の文字に関しても個々に得られる。個々の文字について得られた識別結果は、後処理判定部40に送られ、後処理判定の際に利用されることになる。
【0026】
後処理判定部40においては、例えば図4に示されたURLアドレスの領域71に対しては、先頭の「www」などの文字列の認識から、この文字列がURLアドレスを示していることが認識され、生成された候補を用いてネットワークへの接続を試行すべき旨が判断される。同様に、図4に示された電子メールアドレスの領域72に対しては、例えば「〜@〜co.jp」などの文字列からこの文字列が電子メールアドレスであることが認識され、生成された候補を用いてネットワークへの接続を試行すべき旨が判断される。
【0027】
一方、候補生成部50は、既に認識結果として得られている個々の文字の候補とその信頼度から、ネットワークへの接続を試行すべき複数の候補文字列を生成する。
【0028】
例えば図4に示されたURLアドレスの領域71に含まれるURLに対しては、「www.tokyo.co.jp」、「www.tohyo.co.jp」、・・・が候補として生成される。また、図4に示された電子メールアドレスの領域72に含まれる電子メールアドレスに対しては、「taro@tokyo.co.jp」、「taro@tohyo.co.jp」、・・・が候補として生成される。
【0029】
なお、候補生成部50は、電子アドレス情報の属性を特定する文字を含む属性情報を保持しており、候補の文字列が不適切な属性を示す文字を含んでいる場合には、該属性情報に基づいてその文字列を訂正する機能を有している。例えば、不適切な属性を示す文字として「ca.jp」を含んでいれば、候補生成部50は、これを「co.jp」に自動的に訂正することが可能である。
【0030】
候補生成部50により生成された複数の候補文字列は、信頼度が高い候補から順にネットワーク接続部60に送られる。ネットワーク接続部60においては、候補生成部50から受けた候補文字列により、ネットワーク接続を試行する。ネットワーク接続部60は、その候補文字列による接続を試みた結果、当該接続が成功したか否かの結果を認識確定部70に送る。
【0031】
認識確定部70では、接続が正しく行えたものが1つだけの場合はその候補を、複数ある場合はそのうちの信頼度が最も高い候補を、一つも無い場合は文字認識部30(もしくは候補生成部50)で得られた候補のうち信頼度が最も高いものを採用するなどの方法により、認識結果を確定する。
【0032】
次に、図6のフローチャートを参照して、本実施形態に係る情報処理装置の動作を説明する。
【0033】
文書画像入力部10に文書の画像(文字情報を含んだ電子画像データ)が読み取られると(ステップS1)、レイアウト解析部20によって当該画像からレイアウトが解析され、文字列領域の抽出が行われる(ステップS2)。
【0034】
次に、レイアウト解析部20によって抽出された領域に対し、文字認識部30による文字認識が行われる(ステップS3)。この文字認識の結果、各文字の候補及びその信頼度が生成される。
【0035】
次に、文字認識部30により文字認識された結果から、後処理判定部40による後処理判定が行われる。この後処理判定の中では、電子アドレス情報に該当する文字列があるか否かの属性判定、及び電子アドレス情報に該当する文字列の信頼性判定が行われる(ステップS4)。
【0036】
上記属性判定及び信頼度判定の結果、電子アドレス情報に該当する文字列が存在し且つそれが一定の信頼度に達しないものである場合(ステップS5のYes)、ネットワーク接続による試行(検証)が必要であるものとみなされて、候補生成部50が起動され、該当する文字列に対する複数の候補が候補生成部50により生成される(ステップS6)。
【0037】
なお、上記条件を満たさない場合には(ステップS5のNo)、ネットワーク接続による試行(検証)は必要ないため、文字認識部30による文字認識結果が認識確定部70においてそのまま確定される(ステップS8)。
【0038】
候補生成部50によって生成された複数の候補は、ネットワーク接続部60に優先度の高い順に送られ、それら候補を用いたネットワーク接続が試行(検証)される(ステップS7)。
【0039】
ネットワーク接続部60による接続の検証の結果は、認識確定部70に送られる。認識確定部70では、この結果を用いて、文字認識部30による文字認識結果が最終的に確定される(ステップS8)。
【0040】
なお、ネットワーク接続部60による接続確認の方法としては、実際に接続してみる方法のほか、ディレクトリサービスに問い合わせる、ドメイン部のみをwhoisサーバーなどを利用して確認するなど、他の方法を採用してもよい。また、認識結果が電子メールアドレスである場合には、電子メールの送信を実際に行うほか、返信メールの有無によって判断するなどの方法を採用してもよい。
【0041】
このように、本実施形態によれば、電子メールアドレスやURLアドレスなどの電子アドレス情報が文字認識対象に含まれている場合であっても、認識された文字属性に応じてネットワーク接続を通じて認識結果を確認することにより、文字認識の精度を向上させることが可能となる。
【0042】
なお、本発明は、上述した実施形態に限定されるものではなく、その要旨を逸脱しない範囲内で種々変形して実施することが可能である。
【0043】
【発明の効果】
以上詳記したように本発明によれば、文字認識対象に電子アドレス情報が含まれている場合であっても、高精度な文字認識結果を得ることが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る情報処理装置の構成を示すブロック図。
【図2】図1に示される後処理判定部の構成を示すブロック図。
【図3】図1に示される文書画像入力部に入力される文書の画像の一例を示す図。
【図4】図1に示されるレイアウト解析部により個々の文字列領域が切り出される様子を示す図。
【図5】図1に示される文字認識部による認識結果の一例を説明するための図。
【図6】同実施形態に係る情報処理装置の動作を説明するためのフローチャート。
【符号の説明】
10…文書画像入力部
20…レイアウト解析部
30…文字認識部
40…後処理判定部
41…属性判定部
42…信頼性判定部
50…候補生成部
60…ネットワーク接続部
70…認識確定部
71,72…領域
73…文字
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an information processing apparatus having a character recognition function and a character recognition method.
[0002]
[Prior art]
An OCR (Optical Character Reader) is widely used as a means for reading a character written on a form such as paper or a document as an image and converting it into electronic character data. In such OCR, character recognition is performed after a character image is read.
[0003]
In order to improve the accuracy of character recognition results, in general, after character recognition is performed, further post-processing using a context or a dictionary is performed.
[0004]
[Problems to be solved by the invention]
Post-processing using context and dictionary is effective for general characters. However, there are many objects to which post-processing by context or dictionary cannot be applied.
[0005]
For example, as the Internet has become widespread in recent years, electronic address information such as URLs (Uniform Resource Locators) and e-mail addresses of Web pages are becoming subject to character recognition. This is one of the objects that are difficult to perform post-processing using a dictionary.
[0006]
The present invention has been made in view of the above circumstances, and an information processing apparatus and a character recognition method capable of obtaining a highly accurate character recognition result even when the character recognition target includes electronic address information. The purpose is to provide.
[0007]
[Means for Solving the Problems]
An information processing apparatus according to the present invention is an information processing apparatus having a character recognition function, and performs character recognition on a character string region of a read image to generate a character candidate and its reliability. A recognizing unit, a post-processing determining unit that performs a post-processing determination including determining whether or not there is a character string corresponding to the electronic address information based on a result of character recognition by the character recognizing unit; As a result of the determination, if there is a character string corresponding to the electronic address information, from the individual character candidates constituting the character string corresponding to the electronic address information obtained as the character recognition result of the character recognition means and its reliability a candidate generation unit for generating a candidate character string corresponding to at least one of the electronic address information, attempts to connect to the network by using the candidates generated by the candidate generation unit A network connection means for, wherein when the candidate string connected by a network connecting means corresponds to the electronic address information success is only one, the candidate character string corresponding to the electronic address information the connection is successful When there are a plurality of character string candidates corresponding to the electronic address information that is determined as the character recognition result by the character recognition means and successfully connected by the network connection means, the character strings corresponding to the plurality of electronic address information It comprises recognition confirmation means for confirming a character string candidate corresponding to electronic address information with the highest reliability among the candidates as a character recognition result by the character recognition means .
[0008]
An information processing apparatus according to the present invention is an information processing apparatus having a character recognition function, and analyzes a layout from a document image input unit that reads an image of the document and an image input by the document image input unit. Layout analysis means for extracting a character string area, character recognition means for performing character recognition on the area extracted by the layout analysis means, and generating each character candidate and its reliability, and the character recognition means Post-processing determination means for performing post-processing determination including attribute determination whether there is a character string corresponding to the electronic address information and reliability determination of the character string corresponding to the electronic address information based on the result of character recognition by As a result of attribute determination and reliability determination by the post-processing determination means, there is a character string corresponding to the electronic address information, and it reaches a certain level of reliability. If those do not, the candidate generation unit for generating a candidate character string corresponding to at least one of the electronic address information to the string, the connection to the network by using the candidates generated by the candidate generation unit When there is only one character string candidate corresponding to the network connection means to be tried and electronic address information successfully connected by the network connection means, candidate character strings corresponding to the electronic address information successfully connected Is determined as a character recognition result by the character recognition means, and when there are a plurality of character string candidates corresponding to the electronic address information successfully connected by the network connection means, the character strings corresponding to the plurality of electronic address information Character candidate corresponding to the electronic address information with the highest reliability among the candidates Characterized by comprising a recognition determination means for determining as a character recognition result by.
[0009]
The character recognition method according to the present invention is a character recognition method applied to an information processing apparatus having a character recognition function, and performs character recognition of a character string area of a read image , and each character candidate and its character generating the reliability, based on the character recognition result, it performs a post-processing determination includes determining whether there is a character string corresponding to the electronic address information, the result of determination by the post-processing determining means, electronic address information If there is a character string corresponding to the character recognition means, at least one electronic address information is determined from the individual character candidates constituting the character string corresponding to the electronic address information obtained as the character recognition result of the character recognition means and its reliability. generates a candidate of the corresponding string, attempts to connect to the network using the generated candidate, the electronic address information attempt to connect to the network is successful If there is only one character string candidate to be connected, the character string candidate corresponding to the electronic address information for which this connection was successful is confirmed as a character recognition result by the character recognition means, and an attempt to connect to the network is made. If there are multiple character string candidates corresponding to the successful electronic address information, among the character string candidates corresponding to the plurality of electronic address information, the character string candidates corresponding to the electronic address information with the highest reliability. Is determined as a character recognition result by the character recognition means .
[0010]
A character recognition method according to the present invention is a character recognition method applied to an information processing apparatus having a character recognition function, which reads an image of the document, analyzes a layout from the read image, and determines a character string region. Extract and perform character recognition on the extracted area to generate each character candidate and its reliability, and whether or not there is a character string corresponding to the electronic address information based on the result of character recognition Post-processing determination including determination and reliability determination of the character string corresponding to the electronic address information. As a result of attribute determination and reliability determination, there is a character string corresponding to the electronic address information, and it is constant If those do not reach the reliability, at least one of generating a character string candidates corresponding to the electronic address information, connection to the network by using the generated candidate for the character string Line, and wherein, when connected by a network connecting means is only one candidate of the corresponding character string in the electronic address information succeeds, the character recognition of the character string candidates corresponding to the electronic address information the connection is successful If there are a plurality of character string candidates that correspond to the electronic address information that has been successfully connected by the network connection means as a result of character recognition by the means, out of the character string candidates that correspond to the plurality of electronic address information The character string candidate corresponding to the electronic address information having the highest reliability is determined as a character recognition result by the character recognition means .
[0011]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0012]
FIG. 1 is a block diagram showing a configuration of an information processing apparatus according to an embodiment of the present invention.
[0013]
The information processing apparatus inputs a document image and performs character recognition, and includes a document image input unit 10, a layout analysis unit 20, a character recognition unit 30, a post-processing determination unit 40, a candidate generation unit 50, and a network connection unit. 60, a recognition confirmation unit 70 is provided.
[0014]
The document image input unit 10 inputs a document image (electronic image data including character information).
[0015]
The layout analysis unit 20 analyzes a layout from the image read by the document image input unit 10 and extracts a character string region to be recognized.
[0016]
The character recognition unit 30 performs character recognition on the region extracted by the layout analysis unit 20, and generates a candidate for each character and its reliability as a result of character recognition.
[0017]
As shown in FIG. 2, the post-processing determination unit 40 includes an attribute determination unit 41 and a reliability determination unit 42. Based on the result of character recognition by the character recognition unit 30, a character string corresponding to the electronic address information is displayed. Whether or not there is an attribute determination (processing in the attribute determination unit 41) and post-processing determination (processing in the reliability determination unit 42) including reliability determination of the character string corresponding to the electronic address information are performed. The attribute determination is performed based on the rules of character string arrangement, form information, and the like.
[0018]
The candidate generation unit 50 determines that the character string corresponding to the electronic address information exists as a result of attribute determination and reliability determination by the post-processing determination unit 40 and does not reach a certain level of reliability. At least one candidate is generated for the sequence.
[0019]
The network connection unit 60 tries (verifies) connection to the network using the candidates generated by the candidate generation unit 50.
[0020]
The recognition confirmation unit 70 finally determines the character recognition result by the character recognition unit 30 using the result of connection by the network connection unit 60. For example, by adopting candidate electronic address information that has been confirmed to be correct as a result of network connection, the character recognition result is finally determined.
[0021]
FIG. 3 is a diagram illustrating an example of a document image read by the document image input unit 10.
[0022]
An image 70 shown in the figure includes Web page URL (Uniform Resource Locator) and electronic address information corresponding to an electronic mail address.
[0023]
When the layout of the image 70 is analyzed by the layout analysis unit 20, individual character string regions are cut out as shown by the frames in FIG. 4, and the character recognition unit 30 applies the individual character string regions to the individual character string regions. Character recognition processing is performed. In this case, an area 71 including an URL (Uniform Resource Locator) address and an area 72 including an e-mail address exist in each extracted character string area.
[0024]
FIG. 5 is a diagram for explaining an example of a recognition result by the character recognition unit 30.
[0025]
In the figure, the character string “www.tokyo.co.jp” included in the URL address area 71 (FIG. 4) among the individual character string areas recognized by the character recognition unit 30 is shown as an example. Yes. Among the character strings, for example, when the character “k” indicated by reference numeral 73 is recognized, “first candidate character k” (reliability 40), “second candidate character h” in descending order of reliability. "(Reliability 30)", "Third candidate character b" (Reliability 20),... Such identification results are obtained individually for other characters. The identification result obtained for each character is sent to the post-processing determination unit 40 and used in the post-processing determination.
[0026]
In the post-processing determination unit 40, for example, for the URL address area 71 shown in FIG. 4, the character string indicates the URL address from the recognition of the character string such as “www” at the head. It is determined that connection to the network should be attempted using the recognized and generated candidates. Similarly, for the e-mail address area 72 shown in FIG. 4, it is recognized that the character string is an e-mail address from a character string such as “˜@˜co.jp” and is generated. It is determined that the connection to the network should be tried using the candidates.
[0027]
On the other hand, the candidate generation unit 50 generates a plurality of candidate character strings to be tried to connect to the network from the individual character candidates already obtained as recognition results and their reliability.
[0028]
For example, “www.tokyo.co.jp”, “www.tohyo.co.jp”,... Are generated as candidates for the URL included in the URL address area 71 shown in FIG. . Also, “taro@tokyo.co.jp”, “taro@tohyo.co.jp”, etc. are candidates for the email address included in the email address area 72 shown in FIG. Is generated as
[0029]
The candidate generation unit 50 holds attribute information including characters that specify the attribute of the electronic address information, and if the candidate character string includes characters indicating an inappropriate attribute, the attribute information Has a function of correcting the character string based on the For example, if “ca.jp” is included as a character indicating an inappropriate attribute, the candidate generation unit 50 can automatically correct this to “co.jp”.
[0030]
The plurality of candidate character strings generated by the candidate generation unit 50 are sent to the network connection unit 60 in order from the candidate with the highest reliability. The network connection unit 60 attempts network connection using the candidate character string received from the candidate generation unit 50. As a result of trying the connection using the candidate character string, the network connection unit 60 sends the result of whether or not the connection is successful to the recognition confirmation unit 70.
[0031]
In the recognition confirmation unit 70, if there is only one correctly connected, the candidate is selected. If there are a plurality of candidates, the candidate having the highest reliability is selected. The recognition result is determined by a method such as adopting the candidate having the highest reliability among the candidates obtained in the section 50).
[0032]
Next, the operation of the information processing apparatus according to the present embodiment will be described with reference to the flowchart of FIG.
[0033]
When a document image (electronic image data including character information) is read by the document image input unit 10 (step S1), the layout analysis unit 20 analyzes the layout and extracts a character string region (step S1). Step S2).
[0034]
Next, character recognition by the character recognition unit 30 is performed on the region extracted by the layout analysis unit 20 (step S3). As a result of this character recognition, each character candidate and its reliability are generated.
[0035]
Next, post-processing determination by the post-processing determination unit 40 is performed from the result of character recognition by the character recognition unit 30. In this post-processing determination, an attribute determination as to whether there is a character string corresponding to the electronic address information and a reliability determination of the character string corresponding to the electronic address information are performed (step S4).
[0036]
As a result of the attribute determination and the reliability determination, if a character string corresponding to the electronic address information exists and does not reach a certain reliability (Yes in step S5), a trial (verification) by network connection is performed. The candidate generation unit 50 is activated as deemed necessary, and a plurality of candidates for the corresponding character string are generated by the candidate generation unit 50 (step S6).
[0037]
If the above condition is not satisfied (No in step S5), a trial (verification) by network connection is not necessary, and the character recognition result by the character recognition unit 30 is determined as it is in the recognition determination unit 70 (step S8). ).
[0038]
The plurality of candidates generated by the candidate generation unit 50 are sent to the network connection unit 60 in descending order of priority, and network connection using these candidates is tried (verified) (step S7).
[0039]
The result of the connection verification by the network connection unit 60 is sent to the recognition confirmation unit 70. In the recognition confirmation unit 70, the result of character recognition by the character recognition unit 30 is finally confirmed using this result (step S8).
[0040]
In addition to the method of confirming the connection by the network connection unit 60, other methods such as inquiring to the directory service or confirming only the domain unit using a whois server or the like are adopted. May be. In addition, when the recognition result is an e-mail address, a method may be employed in which the e-mail is actually transmitted and a determination is made based on the presence or absence of a reply e-mail.
[0041]
As described above, according to the present embodiment, even when electronic address information such as an e-mail address or a URL address is included in the character recognition target, the recognition result is obtained through the network connection according to the recognized character attribute. By confirming, it is possible to improve the accuracy of character recognition.
[0042]
Note that the present invention is not limited to the above-described embodiment, and various modifications can be made without departing from the scope of the invention.
[0043]
【The invention's effect】
As described above in detail, according to the present invention, it is possible to obtain a highly accurate character recognition result even when the character recognition target includes electronic address information.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of an information processing apparatus according to an embodiment of the present invention.
FIG. 2 is a block diagram showing a configuration of a post-processing determination unit shown in FIG.
FIG. 3 is a view showing an example of a document image input to the document image input unit shown in FIG. 1;
4 is a diagram showing a state in which individual character string regions are cut out by the layout analysis unit shown in FIG. 1;
FIG. 5 is a view for explaining an example of a recognition result by a character recognition unit shown in FIG. 1;
FIG. 6 is a flowchart for explaining the operation of the information processing apparatus according to the embodiment;
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 10 ... Document image input part 20 ... Layout analysis part 30 ... Character recognition part 40 ... Post-processing determination part 41 ... Attribute determination part 42 ... Reliability determination part 50 ... Candidate generation part 60 ... Network connection part 70 ... Recognition confirmation part 71, 72 ... Area 73 ... Character

Claims (10)

文字認識機能を有する情報処理装置であって、
読み取った画像の文字列領域の文字認識を文字認識を行って、各文字の候補及びその信頼度を生成する文字認識手段と、
前記文字認識手段による文字認識の結果に基づき、電子アドレス情報に該当する文字列があるか否かの判定を含む後処理判定を行う後処理判定手段と、
前記後処理判定手段による判定の結果、電子アドレス情報に該当する文字列があった場合に、前記文字認識手段の文字認識結果として得られる電子アドレス情報に該当する文字列を構成する個々の文字の候補とその信頼度から少なくとも一つの電子アドレス情報に該当する文字列の候補を生成する候補生成手段と、
前記候補生成手段によって生成された候補を用いてネットワークへの接続を試行するネットワーク接続手段と、
前記ネットワーク接続手段によって接続が成功した電子アドレス情報に該当する文字列の候補が1つだけの場合には、この接続が成功した電子アドレス情報に該当する文字列の候補を前記文字認識手段による文字認識結果として確定し、前記ネットワーク接続手段によって接続が成功した電子アドレス情報に該当する文字列の候補が複数ある場合には、これら複数の電子アドレス情報に該当する文字列の候補のうち、最も信頼度が高い電子アドレス情報に該当する文字列の候補を前記文字認識手段による文字認識結果として確定する認識確定手段と
を具備することを特徴とする情報処理装置。
An information processing apparatus having a character recognition function,
Character recognition means for performing character recognition on the character string area of the read image and generating each character candidate and its reliability ;
Post-processing determination means for performing post-processing determination including determination of whether or not there is a character string corresponding to the electronic address information based on the result of character recognition by the character recognition means;
When there is a character string corresponding to the electronic address information as a result of the determination by the post-processing determining means, the individual character constituting the character string corresponding to the electronic address information obtained as the character recognition result of the character recognition means Candidate generation means for generating a candidate for a character string corresponding to at least one electronic address information from the candidate and its reliability,
Network connection means for trying to connect to the network using the candidates generated by the candidate generation means;
If there is only one character string candidate corresponding to the electronic address information successfully connected by the network connection means, the character recognition candidate selected by the character recognition means is the character string candidate corresponding to the electronic address information successfully connected. When there are a plurality of character string candidates determined as recognition results and corresponding to the electronic address information successfully connected by the network connection means, the most reliable of the character string candidates corresponding to the plurality of electronic address information. An information processing apparatus comprising: a recognition confirmation unit configured to determine a character string candidate corresponding to electronic address information having a high degree as a character recognition result by the character recognition unit.
文字認識機能を有する情報処理装置であって、
前記文書の画像を読み取る文書画像入力手段と、
前記文書画像入力手段によって入力された画像からレイアウトを解析して文字列領域を抽出するレイアウト解析手段と、
前記レイアウト解析手段によって抽出された領域に対して文字認識を行って、各文字の候補及びその信頼度を生成する文字認識手段と、
前記文字認識手段による文字認識の結果に基づき、電子アドレス情報に該当する文字列があるか否かの属性判定、及び前記電子アドレス情報に該当する文字列の信頼性判定を含む後処理判定を行う後処理判定手段と、
前記後処理判定手段による属性判定及び信頼性判定の結果、電子アドレス情報に該当する文字列が存在し、且つそれが一定の信頼度に達しないものである場合、その文字列に対して少なくとも一つの電子アドレス情報に該当する文字列の候補を生成する候補生成手段と、
前記候補生成手段によって生成された候補を用いてネットワークへの接続を試行するネットワーク接続手段と、
前記ネットワーク接続手段によって接続が成功した電子アドレス情報に該当する文字列の候補が1つだけの場合には、この接続が成功した電子アドレス情報に該当する文字列の候補を前記文字認識手段による文字認識結果として確定し、前記ネットワーク接続手段によって接続が成功した電子アドレス情報に該当する文字列の候補が複数ある場合には、これら複数の電子アドレス情報に該当する文字列の候補のうち、最も信頼度が高い電子アドレス情報に該当する文字列の候補を前記文字認識手段による文字認識結果として確定する認識確定手段と
を具備することを特徴とする情報処理装置。
An information processing apparatus having a character recognition function,
Document image input means for reading an image of the document;
Layout analysis means for analyzing the layout from the image input by the document image input means and extracting a character string area;
Character recognition means for performing character recognition on the region extracted by the layout analysis means, and generating each character candidate and its reliability;
Based on the result of character recognition by the character recognition means, post-processing determination is performed including attribute determination as to whether or not there is a character string corresponding to the electronic address information, and reliability determination of the character string corresponding to the electronic address information. Post-processing determination means;
As a result of attribute determination and reliability determination by the post-processing determination means, if a character string corresponding to the electronic address information exists and does not reach a certain level of reliability, at least one of the character strings Candidate generation means for generating candidate character strings corresponding to one electronic address information ;
Network connection means for trying to connect to the network using the candidates generated by the candidate generation means;
If there is only one character string candidate corresponding to the electronic address information successfully connected by the network connection means, the character recognition candidate selected by the character recognition means is the character string candidate corresponding to the electronic address information successfully connected. When there are a plurality of character string candidates determined as recognition results and corresponding to the electronic address information successfully connected by the network connection means, the most reliable of the character string candidates corresponding to the plurality of electronic address information. An information processing apparatus comprising: a recognition confirmation unit configured to determine a character string candidate corresponding to electronic address information having a high degree as a character recognition result by the character recognition unit.
前記後処理判定手段は、前記電子アドレス情報として、URL(Uniform Resource Locator)アドレスを認識することが可能であることを特徴とする請求項1又は2記載の情報処理装置。  3. The information processing apparatus according to claim 1, wherein the post-processing determination unit can recognize a URL (Uniform Resource Locator) address as the electronic address information. 前記後処理判定手段は、前記電子アドレス情報として、電子メールアドレスを認識することが可能であることを特徴とする請求項1又は2記載の情報処理装置。  3. The information processing apparatus according to claim 1, wherein the post-processing determination unit can recognize an electronic mail address as the electronic address information. 前記候補生成手段が複数個の候補を生成した場合には、前記ネットワーク接続手段は、信頼度の高い候補から順にネットワークへの接続を試行することを特徴とする請求項1又は2記載の情報処理装置。  3. The information processing according to claim 1, wherein, when the candidate generating unit generates a plurality of candidates, the network connection unit tries to connect to the network in order from a candidate having a high reliability. apparatus. 前記候補生成手段は、前記電子アドレス情報の属性を特定する文字を含む属性情報を保持しており、前記候補の文字列が不適切な属性を示す文字を含んでいる場合には、該属性情報に基づいてその文字列を訂正する手段を有することを特徴とする請
求項1又は2記載の情報処理装置。
The candidate generation means holds attribute information including characters specifying the attribute of the electronic address information, and if the candidate character string includes characters indicating an inappropriate attribute, the attribute information 3. The information processing apparatus according to claim 1, further comprising means for correcting the character string based on the information.
文字認識機能を有する情報処理装置に適用される文字認識方法であって、
読み取った画像の文字列領域の文字認識を行って、各文字の候補及びその信頼度を生成し、
前記文字認識の結果に基づき、電子アドレス情報に該当する文字列があるか否かの判定を含む後処理判定を行い、
前記後処理判定手段による判定の結果、電子アドレス情報に該当する文字列があった場合に、前記文字認識手段の文字認識結果として得られる電子アドレス情報に該当する文字列を構成する個々の文字の候補とその信頼度から少なくとも一つの電子アドレス情報に該当する文字列の候補を生成し、
前記生成された候補を用いてネットワークへの接続を試行し、
前記ネットワークへの接続の試行が成功した電子アドレス情報に該当する文字列の候補が1つだけの場合には、この接続が成功した電子アドレス情報に該当する文字列の候補を前記文字認識手段による文字認識結果として確定し、前記ネットワークへの接続の試行が成功した電子アドレス情報に該当する文字列の候補が複数ある場合には、これら複数の電子アドレス情報に該当する文字列の候補のうち、最も信頼度が高い電子アドレス情報に該当する文字列の候補を前記文字認識手段による文字認識結果として確定することを特徴とする文字認識方法。
A character recognition method applied to an information processing apparatus having a character recognition function,
Perform character recognition of the character string area of the read image, generate each character candidate and its reliability,
Based on the result of the character recognition, perform post-processing determination including determination whether there is a character string corresponding to the electronic address information,
When there is a character string corresponding to the electronic address information as a result of the determination by the post-processing determining means, the individual character constituting the character string corresponding to the electronic address information obtained as the character recognition result of the character recognition means Generate a string candidate corresponding to at least one electronic address information from the candidate and its reliability,
Attempts to connect to the network using the generated candidate,
When there is only one character string candidate corresponding to the electronic address information successfully connected to the network, the character recognition means determines that the character string candidate corresponds to the electronic address information successfully connected. When there are a plurality of character string candidates corresponding to the electronic address information that is determined as a character recognition result and the connection attempt to the network is successful, among the character string candidates corresponding to the plurality of electronic address information, A character recognition method characterized in that a character string candidate corresponding to electronic address information having the highest reliability is determined as a character recognition result by the character recognition means .
文字認識機能を有する情報処理装置に適用される文字認識方法であって、
前記文書の画像を読み取り、
読み取った画像からレイアウトを解析して文字列領域を抽出し、
抽出された領域に対して文字認識を行って、各文字の候補及びその信頼度を生成し、
文字認識の結果に基づき、電子アドレス情報に該当する文字列があるか否かの属性判定、及び前記電子アドレス情報に該当する文字列の信頼性判定を含む後処理判定を行い、
属性判定及び信頼性判定の結果、電子アドレス情報に該当する文字列が存在し、且つそれが一定の信頼度に達しないものである場合、その文字列に対して少なくとも一つの電子アドレス情報に該当する文字列の候補を生成し、
前記生成された候補を用いてネットワークへの接続を試行し、
前記ネットワーク接続手段によって接続が成功した電子アドレス情報に該当する文字列の候補が1つだけの場合には、この接続が成功した電子アドレス情報に該当する文字列の候補を前記文字認識手段による文字認識結果として確定し、前記ネットワーク接続手段によって接続が成功した電子アドレス情報に該当する文字列の候補が複数ある場合には、これら複数の電子アドレス情報に該当する文字列の候補のうち、最も信頼度が高い電子アドレス情報に該当する文字列の候補を前記文字認識手段による文字認識結果として確定することを特徴とする文字認識方法。
A character recognition method applied to an information processing apparatus having a character recognition function,
Reads an image of the document,
Analyzing the layout from the scanned image and extracting the character string area
Character recognition is performed on the extracted area, and each character candidate and its reliability are generated.
Based on the result of character recognition, the attribute determination whether there is a character string corresponding to the electronic address information, and the post-processing determination including the reliability determination of the character string corresponding to the electronic address information,
As a result of attribute determination and reliability determination, if a character string corresponding to electronic address information exists and does not reach a certain level of reliability, it corresponds to at least one electronic address information for the character string Generate a string candidate
Attempts to connect to the network using the generated candidate,
If there is only one character string candidate corresponding to the electronic address information successfully connected by the network connection means, the character recognition candidate selected by the character recognition means is the character string candidate corresponding to the electronic address information successfully connected. When there are a plurality of character string candidates determined as recognition results and corresponding to the electronic address information successfully connected by the network connection means, the most reliable of the character string candidates corresponding to the plurality of electronic address information. A character recognition method characterized in that a character string candidate corresponding to electronic address information having a high degree is determined as a character recognition result by the character recognition means .
前記候補の生成において、複数個の候補を生成した場合には、信頼度の高い候補から順にネットワークへの接続を試行することを特徴とする請求項7又は8記載の文字認識方法。  9. The character recognition method according to claim 7, wherein when a plurality of candidates are generated in the generation of the candidates, connection to the network is tried in order from a candidate having a high reliability. 前記電子アドレス情報の属性を特定する文字を含む属性情報を保持しておき、前記候補の文字列が不適切な属性を示す文字を含んでいる場合には、該記属性情報に基づいてその文字列を訂正することを特徴とする請求項7又は8記載の文字認識方法。  If attribute information including a character specifying the attribute of the electronic address information is held, and the candidate character string includes a character indicating an inappropriate attribute, the character is based on the attribute information. The character recognition method according to claim 7 or 8, wherein the column is corrected.
JP2002031436A 2002-02-07 2002-02-07 Information processing apparatus and character recognition method Expired - Fee Related JP4091308B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002031436A JP4091308B2 (en) 2002-02-07 2002-02-07 Information processing apparatus and character recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002031436A JP4091308B2 (en) 2002-02-07 2002-02-07 Information processing apparatus and character recognition method

Publications (2)

Publication Number Publication Date
JP2003233772A JP2003233772A (en) 2003-08-22
JP4091308B2 true JP4091308B2 (en) 2008-05-28

Family

ID=27774846

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002031436A Expired - Fee Related JP4091308B2 (en) 2002-02-07 2002-02-07 Information processing apparatus and character recognition method

Country Status (1)

Country Link
JP (1) JP4091308B2 (en)

Also Published As

Publication number Publication date
JP2003233772A (en) 2003-08-22

Similar Documents

Publication Publication Date Title
JP5387124B2 (en) Method and system for performing content type search
US9521161B2 (en) Method and apparatus for detecting computer fraud
US7991778B2 (en) Triggering actions with captured input in a mixed media environment
US7672543B2 (en) Triggering applications based on a captured text in a mixed media environment
US9779066B2 (en) Method and system for converting punycode text to ASCII/unicode text
US7920759B2 (en) Triggering applications for distributed action execution and use of mixed media recognition as a control input
US7885955B2 (en) Shared document annotation
JP5338063B2 (en) Image recognition program, image recognition apparatus, and image recognition method
JP2713622B2 (en) Tabular document reader
US20060262976A1 (en) Method and System for Multi-Tier Image Matching in a Mixed Media Environment
US20070050712A1 (en) Visibly-Perceptible Hot Spots in Documents
JP4811133B2 (en) Image forming apparatus and image processing apparatus
JP4091308B2 (en) Information processing apparatus and character recognition method
JP2001209756A (en) Method and device for simplifying fax transmission by using user enclosure area
JP2009182530A (en) Business processing execution support device
US20110161305A1 (en) Method and Apparatus for Information Retrieval Based on Partial Machine Recognition of the Same
JP2000137728A (en) Document analyzing device and program recording medium
JP2001022883A (en) Character recognizing system and recording medium for realizing function for the same
JP5331084B2 (en) Specific information extraction apparatus and specific information extraction program
JP2008071040A (en) Method and program for extracting company name
JP4677750B2 (en) Document attribute acquisition method and apparatus, and recording medium recording program
JP4334068B2 (en) Keyword extraction method and apparatus for image document
US20090031203A1 (en) Hyperlinks
Lins et al. Generating Digital Libraries of M. Sc. and Ph. D. Theses
JP2003173421A (en) Character recognition result correcting device

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040512

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050311

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080228

R151 Written notification of patent or utility model registration

Ref document number: 4091308

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110307

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120307

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130307

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140307

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees