JP4245820B2 - 文字認識装置、文字認識方法および記録媒体 - Google Patents

文字認識装置、文字認識方法および記録媒体 Download PDF

Info

Publication number
JP4245820B2
JP4245820B2 JP2001077280A JP2001077280A JP4245820B2 JP 4245820 B2 JP4245820 B2 JP 4245820B2 JP 2001077280 A JP2001077280 A JP 2001077280A JP 2001077280 A JP2001077280 A JP 2001077280A JP 4245820 B2 JP4245820 B2 JP 4245820B2
Authority
JP
Japan
Prior art keywords
character
candidate
result
recognition
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001077280A
Other languages
English (en)
Other versions
JP2002279352A (ja
Inventor
吾朗 別所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001077280A priority Critical patent/JP4245820B2/ja
Publication of JP2002279352A publication Critical patent/JP2002279352A/ja
Application granted granted Critical
Publication of JP4245820B2 publication Critical patent/JP4245820B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Information Transfer Between Computers (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文字認識装置、文字認識方法および記録媒体に関し、特に、文字認識処理によって得られた文字列がURLの場合に、誤変換したときの検証および修正に関する。
【0002】
【従来の技術】
最近の書籍等の記載内容には記事とともにURL(Uniform Resource Locator)も一緒に紹介されていものが多くなっている。
このような書籍等の文書をスキャナで読み取り、文字認識するときには、当然URLをも認識しなければならないが、URLを誤認識するとまったく役に立たないものとなってしまうので、正確を期さなければならない。
しかしながら、認識結果と文書にあるURLとを照合する作業は面倒なものである。
このような書籍等に記述されているURLを構成する文字を自動認識する技術として、特開平9−274646号公報の技術がある。この方法は、URLに使用されうる文字およびテンプレート(固定されたプロトコル、ドメイン名の先頭と種別等の部分についていくつか用意する。)に対する画像を保持して、URL部分を抽出した後、保持した文字画像と抽出した部分画像とを比較することにより文字列として認識している。
この方法によると、テンプレート部分については比較的誤変換はないものの、他の部分の認識処理には認識速度が遅く、しかも誤認識も多くなるという問題がある。
一方、世界中のホームページへのアクセスや電子メールサービスなどのインターネットを介した情報の収集および発信に対して、インターネット接続機能およびブラウザー機能(ホームページを閲覧する機能)を備えたコンピュータやネットワーク端末機等が普及している。
特開平10−334017号公報の技術では、インターネットテレビを使ってテレビ番組を見ていたとき、その番組のホームページや番組内容に関連したホームページが紹介される場合がある。このような場合に、紹介されたホームページを見たいと指示したときに、テレビ画面に表示されているURL部分の画像を抽出し、その画像を文字認識した結果のURLを用いてアクセスできるようにしている。
【0003】
【発明が解決しようとする課題】
しかしながら、URL部分を文字認識するのであれば、その認識率は文字認識装置の性能に頼るのみとなってしまう。
これを解決するために、上記の従来技術では、文字認識した結果の候補が複数検出された場合、これらの複数のURLを順次表示させて、ユーザーに選択させていた。
この方法では、入力された画像のURLと順次表示される候補のURLとをいちいち照合しなければならず、ユーザーの苦労は一向に減少しない。
本発明は、このような問題を解決するためのものであり、文字画像中のURLを認識する際に、ユーザーに労力をかけないで正しい認識結果を得る文字認識装置、文字認識方法および記録媒体を提供することを目的とする。
【0004】
【課題を解決するための手段】
上記の問題を解決するために、請求項1の発明は、インターネットに接続された文字認識装置において、前記インターネットを経由してURLで示される接続先へ接続るインターネット接続部と、入力された画像データ中の各文字画像の特徴量を標準パターンと比較し、各文字画像について確からしさの高い順に候補文字を抽出する文字認識部と、前記文字認識部で抽出されたもっとも確からしさの高い候補文字で構成される文字列がURLのとき、前記インターネット接続部へ前記文字列を与えて、前記インターネット接続部による接続が正常に行われるか否かによって、文字認識結果を検証する結果検証部と、前記結果検証部で認識結果の前記文字列が存在しないURLである場合、前記文字列中の確からしさの最も低い文字を、所定の置き換え規則に従って他の文字に置き換えることにより当該文字列を修正する結果修正部を備え、前記結果検証部は、前記結果修正部で修正された文字列により再度検証を行うことを特徴とする。
また、本発明の請求項2は、請求項に記載された文字認識装置において、前記結果修正部は、
認識結果である前記文字列の候補文字のうち確からしさの最も低い候補文字を、前記文字認識部で抽出された他の候補文字のうち、次に確からしさの高い候補文字で置き換える文字認識装置を特徴とする。
また、本発明の請求項3は、請求項に記載の文字認識装置において、所定の文字に、当該文字と誤認識されやすい文字を順位づけして対応づけた候補文字ラティスを保持し、前記結果修正部は、認識結果である前記文字列の候補文字のうち確からしさの最も低い文字が前記候補文字ラティスに登録された文字の場合、前記候補ラティス中の順位の高い文字から順次置き換えるようにしたことを特徴とする。
【0005】
また、本発明の請求項4は、請求項に記載の文字認識装置において、所定の文字又は文字の組み合わせに、前記画像データからの切り出し時の誤りによって誤認識されやすい文字又は文字の組み合わせを順位づけして対応づけた候補パターンラティスを保持し、前記結果修正部は、
認識結果である前記文字列の候補文字のうち確からしさの最も低い文字又は文字の組み合わせが前記候補文字ラティスに登録されている場合、前記候補パターンラティス中の順位の高い文字又は文字の組み合わせから順次置き換えるようにしたことを特徴とする。
また、本発明の請求項は、インターネット接続部と、文字認識部と、結果検証部と、結果修正部と、を備えた文字認識装置における文書認識方法において、
前記文字認識部が、入力された画像データ中の各文字画像の特徴量を標準パターンと比較し、各文字画像について確からしさの高い順に候補文字を抽出するステップと、
前記結果検証部が、前記文字認識部で抽出されたもっとも確からしさの高い候補文字で構成される文字列がURLのとき、前記インターネット接続部へ前記文字列を与えて、前記インターネット接続部による接続が正常に行われるか否かによって、文字認識結果を検証するステップと、前記結果修正部が、前記結果検証部で認識結果の前記文字列が存在しないURLである場合、前記文字列中の確からしさの最も低い文字を所定の置き換え規則に従って他の文字に置き換えることにより当該文字列を修正するステップと、前記結果検証部は、前記結果修正部で修正された文字列により再度検証を行うステップと、から構成されることを特徴と文字認識方法を特徴とする。
また、本発明の請求項は、請求項に記載された文字認識方法において、前記結果修正部は、認識結果である前記文字列の候補文字のうち確からしさの最も低い候補文字を、前記文字認識部で抽出された他の候補文字のうち、次に確からしさの高い候補文字で置き換えることを特徴とする。
また、本発明の請求項は、請求項に記載の文字認識方法において、前記結果修正部は、認識結果である前記文字列の候補文字のうち確からしさの最も低い候補文字が、所定の文字に、当該文字と誤認識されやすい文字を順位付けて対応づけた候補ラティスに登録された文字の場合、前記候補ラティス中の順位の高い文字から順次置き換えることを特徴とする。
また、本発明の請求項8は、請求項に記載の文字認識方法において、前記結果修正部は、認識結果である前記文字列の候補文字のうち確からしさの最も低い文字又は文字の組み合わせが、所定の文字又は文字の組み合わせに、前記画像データからの切り出し時の誤りによって誤認識されやすい文字又は文字の組み合わせを順位づけして対応づけた候補パターンラティスに登録されている場合、前記候補パターンラティス中の順位の高い文字又は文字の組み合わせから順次置き換えることを特徴とする。
また、本発明の請求項は、請求項5乃至8の何れか一項に記載の文字認識方法をコンピュータに実現させるためのプログラムを記録したプログラムを記録したコンピュータ読み取り可能な記録媒体を特徴とする。
【0006】
【発明の実施の形態】
以下に、図面を用いて本発明の実施例の構成および動作を詳細に述べる。
<実施例>
(1)構成
図1は、本発明の一実施例である文字認識装置の構成をあらわすブロック図である。
実施例の文字認識装置は、画像入力部10、文字認識部20、結果検証部30、インターネット接続部40、結果修正部50、表示部60、画像メモリ70、認識結果メモリ80、ネットワーク90とから構成されている。
ユーザーは、スキャナやCCDカメラ等で文書を読み取らせた文書画像またはテレビ画面やファイルの画像を取り込む。
画像入力部10は、その画像の中から認識する文字画像を取り込む。ユーザーがマウス等によって認識すべき領域を指示したり、または、領域識別等の技術を使って文字画像領域を特定し、その画像データは画像メモリ70へ格納する。
文字認識部20は、画像メモリ70の画像データを個々の文字画像に切り出し、大きさを正規化し、この正規化された文字画像の特徴量を抽出し、この特徴量を標準パターンを保持する認識辞書と比較し、認識の確からしさの値(以下、確信度という)の大きい順に一定個数(例えば、10個)の候補文字を求め、候補文字とその確信度とを認識結果メモリ80へ格納する。
結果検証部30は、認識対象となった文書画像がURLを表す文字列であるかどうかを判断する。この判断は、予め、文字認識する前にURLに当たる文字列であることをディスプレイ等に表示させたときにマウス等のポインティングデバイスを用いて指示してもよい。または、「http」等のトリガーとなる文字を画像の段階で検出してもよいし、認識結果から検出してもよい。
【0007】
URLを表す文字列を検出したとき、この文字列をインターネット接続部40へ渡すことによって、URL文字列に相当するアドレスにインターネット90を介して接続する。
この結果、インターネット接続部40から正常に接続されたことが分かれば、この認識結果のURL文字列は正しく認識されたとして、この文字列で認識結果メモリ80を更新する。
しかし、正常に接続されなかったことが分かれば、この認識結果のURL文字列を修正するために、このURL文字列を結果修正部50へ渡し、修正されたURL文字列をもう一度インターネット接続部40へ渡して、再度検証する。
これを正しくなるまで繰り返すか、または、所定回数繰り返しても正しく修正されないときには、ユーザーに修正させる。
インターネット接続部40は、インターネット接続用のソフトウェアとWWWブラウザーとからなり、インターネットへ接続し、WWWサーバーにあるホームページの閲覧に関する処理を行う。
結果検証部30からURLを渡されると、このURLを持つWWWサーバーにアクセスする。この時、URL文字列が正しいアドレスであれば、相手先のWWWサーバーからHTML文書が送られてくる。しかし、正しいアドレスでなければ、「Not Found」のようなエラーコードが返ってくる。
この結果、即ち、正常に与えられたURLのWWWサーバーに接続できたか否かを結果検証部40へ戻す。
【0008】
例えば、図2に示したように、入力画像「http://www.ricoh.co.jp」に対して、「http://www.ric0h.co.jp」という認識結果が得られたとする。また、この「ric0h」というドメイン名がないとすれば、このままインターネット接続しても、このアドレスは存在しないため、エラーコードが返ってくることになる。
結果修正部50は、結果検証部30から渡された認識結果のURL文字列を修正して戻す。これは、渡された認識結果のURL文字列の中で確信度の低い文字に対して修正するようにする。
例えば、図2を参照すると、入力画像「http://www.ricoh.co.jp」に対して、認識結果のURL文字列「http://www.ric0h.co.jp」の確信度は、「0」以外の文字の確信度は99であり、「0」のみ50の確信度を持っている。このような場合、確信度が一番低い「0」のところに注目して、以下に示す修正を行う。
これらの修正は、いずれか一つであっても、それらを順次実行してもかまわない。
(a)修正対象文字の2位以下の候補文字と置き換える。
上の例の場合、「0」の2位以降の候補文字を使って再びURLを構成する。
例えば、2位の候補であるO(大文字のオー)、それでだめなら3位の候補であるo(小文字のオー)、……という具合に置き換えて修正する。
(b)誤認識しやすい文字に対して、その元になる文字を予め候補文字ラティスとしてテーブル等に保持し、そのいずれかの文字が認識結果に現れたときには、この候補文字ラティスから修正対象文字と置き換える(図3参照)。
o(小文字のオー)、0(ゼロ)、O(大文字のオー)や1(イチ)、l(エル)等といった文字は、誤認識しやすい文字については、候補文字ラティスとして予めテーブル等に保持し、その中の文字が修正対象となったときには、この候補文字ラティスにある候補文字を順次置き換える。
(c)文字切り出しの誤りが発生しやすい文字パターンを登録しておき、これらの文字が現れたときには、登録された別の文字パターンに置き換える(図5参照)。
【0009】
例えば、図4を参照すると、入力画像「http://www.ricoh.co.jp」に対して、認識結果「http://www.ncoh.co.jp」となっている。これは入力画像の文字切り出しのとき「ri」を誤って1文字とみてしまったために起きている。
このような場合には、図5のような切り出しミスを犯しやすい文字に対して切り出し候補ラティスを予めテーブル等に保持しておく。この場合にも「n」の認識時の確信度は低いはずであるから、切り出し候補ラティスを参照して「n」に対する候補文字を順次取り出して置き換える。この場合、「n」は「ri」というパターンに置き換えて、「http://www.ricoh.co.jp」という修正されたUTL文字列を生成する。
(d)URLは、プロトコル(Protocol)と、アドレスを表すドメイン名と、パス(Path)、またはファイル名とからなっている。これらの文字は概ね英文字、数字および記号の一部で構成されている。従って、修正対象文字を、このURLを構成し得るいずれかの文字で置き換える。
上記のような置き換えは、文字認識結果の修正を行なう確信度について、予めしきい値を設けるなどして組み合わせの増加を抑えることもできる。
表示部60は、スキャナ等で入力された画像をディスプレイ等の表示装置へ表示させたり、この表示させた画像の中から認識対象の文字画像をユーザーに選定してもらうときに使ったり、文字認識結果を元の画像と対比させて表示させたりする。
画像メモリ70は、入力した画像を格納する記憶手段(例えば、メモリまたは磁気ディスクのような記憶装置)である。この画像は、文字認識部20の認識対象の画像であり、また、認識結果と対比されて表示され、その認識結果を修正する時等に使われる。
認識結果メモリ80は、認識対象となったすべての文字画像に対して、確信度の高い候補文字から所定の個数(例えば、10個)について、少なくとも文字コードと確信度を格納している。
ネットワーク90は、本発明の文字認識装置とWWW(World Wide Web)サーバーとを結合するための伝送路であって、一般には、ケーブルで実現され、通信プロトコルにはTCP/IPが使われる。但し、伝送路としてはケーブルだけではなく、それらの間の通信プロトコルが一致するものであれば無線LAN等を使ったものであってもよい。
【0010】
このような構成において、実施例の文字認識装置は次のように動作する。
ユーザーは文字認識したい文書をスキャナやCCDカメラから入力するか、またはファイルから画像を入力する。画像入力部10は、この入力された画像を表示させて文字認識したい領域の画像を画像メモリ70へ格納する。
次に、文字認識手段20は、画像メモリ70の画像データを個々の文字画像に切り出し、大きさを正規化し、この正規化された文字画像の特徴量を抽出し、この特徴量と認識辞書と比較を行なって、認識の確からしさ(確信度)が大きい順に一定個数の候補文字を求め、それらの候補文字と確信度を認識結果データとして認識結果メモリ80に格納する。
次に、結果検証部30が呼び出される。
結果検証部30は、認識対象となった文書画像にURLを表す文字列を検出したとき、この文字列をインターネット接続部40へ渡すことによって、URL文字列に相当するアドレスにインターネット90を介して接続する。
インターネット接続部40は、結果検証部30からURLを渡されると、このURLを持つWWWサーバーにアクセスして、相手先のWWWサーバーからHTML文書またはエラーコードが送られてくるかを監視し、正常に接続できたか否かを結果検証部40へ戻す。
この結果を結果検証部40が受け取って、正常に接続されたことが分かれば、この認識結果のURL文字列は正しく認識されたとして、認識結果メモリ80を更新して、検証を終了する。
しかし、正常に接続されなかった場合には、この認識結果のURL文字列を修正するために、このURL文字列を結果修正部50へ渡し、修正されたURL文字列をもう一度インターネット接続部40へ渡して、再度検証する。
これを正しくなるまで繰り返すか、または、所定回数繰り返しても正しく修正されないときには、ユーザーに修正させる。
結果修正部50は、結果検証部30から渡された認識結果のURL文字列を修正して戻す。これは、渡された認識結果のURL文字列の中で確信度の低い文字に対して、以下のような修正を順次行う。
(a)修正対象文字の2位以下の候補文字と置き換える。
(b)誤認識しやすい文字に対して、その元になる文字を予め候補文字ラティスとしてテーブル等に保持し、そのいずれかの文字が認識結果に現れたときには、この候補文字ラティスから修正対象文字と置き換える。
(c)文字切り出しの誤りが発生しやすい文字パターンを登録しておき、これらの文字が現れたときには、登録された別の文字パターンに置き換える。
(d)修正対象文字を、URLを構成し得るいずれかの文字で置き換える。
最後に表示部60は、このように検証の終わった認識結果を認識結果メモリ80から取り出して、入力された画像と対比してディスプレイ等の表示装置へ表示させる。
【0011】
上記のような構成にすることにより、文書画像にURL文字列があったとき、その認識を正確に且つユーザーの労力を少なく行なえる。
また、不確かな状態のまま、実際に相手先に接続するという行為も、電話や電子メールでは間違い相手にとって迷惑であるが、WWWサービスに関してはネットワークトラフィックの増加はあるものの、直接的な迷惑をかけずに検証ができる。
【0012】
(2)処理の流れ
図6は、本実施例の文字認識装置の処理の流れを説明するためのフローチャートである。
ユーザーは文字認識したい文書をスキャナやCCDカメラから入力するか、またはファイルから画像を入力する。
この入力された画像を表示させて文字認識したい領域の画像を画像メモリへ70へ格納する(ステップS100)。
画像メモリ70の画像データを個々の文字画像に切り出し、大きさを正規化し、この正規化された文字画像の特徴量を抽出し、この特徴量と認識辞書と比較を行なって、認識の確からしさ(確信度)が大きい順に一定個数の候補文字を求め、それらの候補文字と確信度を認識結果データとして認識結果メモリ80に格納する(ステップS110)。
認識対象となった文書画像にURLを表す文字列を検出し、この文字列をインターネット90を介して相手のWWWサーバーを呼び出す。
アクセスして、相手先のWWWサーバーからHTML文書またはエラーコードが送られてくるかを監視する(ステップS120)。
WWWサーバーから応答が返ってきたとき、正常に接続されたかどうかを判断し(ステップS130)、正常に接続されたときには、認識結果メモリ80を更新して、この検証は終了し、ステップS150へ進む。
しかし、正常に接続されなかった場合には、この認識結果のURL文字列を修正するためにステップS140へ進む。
ステップS140では、認識結果のURL文字列を修正して戻す。
これは、渡された認識結果のURL文字列の中で確信度の低い文字に対して、以下のような修正を順次行って、ステップS120へ戻って、修正されたURL文字列をもう一度インターネットを介して再度検証する。
(a)修正対象文字の2位以下の候補文字と置き換える。
(b)誤認識しやすい文字に対して、予めテーブルとして保持する候補文字ラティスに登録されたいずれかの文字が認識結果に現れたとき、この候補文字ラティスの候補文字と置き換える。
(c)文字切り出しの誤りが発生しやすい文字パターンを登録しておき、これらの文字が現れたときには、登録された別の文字パターンに置き換える。
(d)修正対象文字を、URLを構成し得るいずれかの文字で置き換える。
最後に、ステップS150では、このように検証の終わった認識結果を認識結果メモリ80から取り出して、入力された画像と対比してディスプレイ等の表示装置へ表示させる。
【0013】
<コンピュータによる実施例>
さらに、本発明は上記の実施の形態のみに限定されたものではない。例えば、図1の文字認識装置は、図7に示したようなコンピュータ装置の構成によっても実現が可能である。
図7のコンピュータ装置は、入力装置1、出力装置2、CPU(Central Processing Unit;中央処理装置)3、メモリ4、記憶装置5、媒体駆動装置6、ネットワーク接続装置7を備え、それらはバス8により互いに接続されている。
入力装置1は、キーボード、マウス、タッチパネル、スキャナ等により構成され、テキストや画像の情報を入力するのに使用される。
出力装置2は、種々の出力情報や入力装置1からの入力された情報などを出力させるものであって、ディスプレイ装置やプリンタ装置である。
CPU3は、種々のプログラムを動作させる。
メモリ4は、画像メモリ70、認識結果メモリ80やプログラム自身を保持し、またそのプログラムがCPU3によって実行されるときに一時的に作成される情報等を保持する。
記憶装置5は、プログラムやプログラム実行時の一時的な情報等を保持する。
本発明の文字認識装置で扱う画像メモリ70、認識結果メモリ80をこの記憶装置5に格納し、プログラム実行時にメモリ4へ取り出すようにしてもよい。
媒体駆動装置6は、プログラムやデータ等を記憶した記録媒体を装着してそれらを読み込み、メモリ4または記憶装置5へ格納するのに用いられる。また、直接データの入出力やプログラム実行するのに使ってもよい。
尚、記録媒体としては半導体媒体(例えば、ROM、ICメモリカード等)、光媒体(例えば、DVD、MO、MD、CD−R等)、磁気媒体(例えば、磁気テープ、フレキシブルディスク等)のいずれであってもよい。
ネットワーク接続装置7は、コンピュータ装置をネットワーク90を介してWWWサーバーへ接続させる。
【0014】
図1に示した文字認識装置を構成する各機能をそれぞれプログラム化し、予めCD−ROM等の記録媒体に書き込んでおき、このCD−ROMをCD−ROMドライブのような媒体駆動装置6を搭載したコンピュータに装着して、これらのプログラムをそれぞれのコンピュータ装置のメモリ4あるいは記憶装置5に格納し、それを実行することによって、上述した実施の形態と同様な機能を実現することができる。
また、ロードしたプログラムを実行することにより前述した実施の形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、オペレーティングシステム等が実際の処理の一部または全部を行い、その処理によって上述した実施の形態の機能が実現される場合も含まれる。
また、上述した実施の形態を実現するプログラムがROM等のような半導体の記録媒体である場合には、媒体駆動装置6からではなく、直接、メモリ4へロードして実行される。
さらに、上述した実施の形態の機能を実現するプログラムが、機能拡張ボードや機能拡張ユニットに備わるメモリにロードされ、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって、上述した実施の形態の機能が実現される場合も含まれる。
【0015】
<本発明のネットワーク環境での運用>
図8は、本発明をネットワーク接続して運用する形態の構成を示している。
図7で示したようなコンピュータ装置からなるユーザーの端末110とサーバー120とをネットワーク90を介して接続し、ユーザーの端末110は、文字認識プログラムを保持するサーバー120からその文字認識プログラムを受信して、画像を入力し、受信した文字認識プログラムを端末110で実行させ、その実行結果を出力するようにする。
このようにすることで、文字認識プログラムが常に最新のものを使え、認識辞書はユーザー固有のものとすることができるという利点がある。
また、図8のようなサーバー120と端末110とをネットワーク90で接続し、サーバー120の磁気ディスク等の記憶装置に本発明の機能を実現する文字認識プログラムを格納しておき、ダウンロード等の形式で頒布することも可能である。
さらに、本発明の機能を実現するプログラムを放送波によって配布することで提供するようにしてもよい。
【0016】
【発明の効果】
以上説明したように、本発明によれば、文書画像にURL文字列があったとき、その認識を正確に且つユーザーの労力を少なく行なえる。
【図面の簡単な説明】
【図1】本発明の一実施例である文字認識装置の構成を示すブロック図である。
【図2】誤認識したときの画像と認識結果を説明するための図である。
【図3】誤認識しやすい文字に関する候補文字ラティスの図である。
【図4】切り出しミスのときの画像と認識結果を説明するための図である。
【図5】切り出しミスのときの候補ラティスを説明するための図である。
【図6】実施例の処理を説明するためのフローチャートである。
【図7】本発明の画像処理装置をコンピュータで実現するときのハードウェアの構成を示す図である。
【図8】本発明をネットワークで運用する形態の構成を示す図である。
【符号の説明】
1 入力装置
2 出力装置
3 CPU
4 メモリ
5 記憶装置
6 媒体駆動装置
7 ネットワーク接続装置
8 バス10 画像入力部
20 文字認識部
30 結果検証部
40 インターネット接続部
50 結果修正部
60 表示部
70 画像メモリ
80 認識結果メモリ
90 インターネット
110 端末
120 サーバー

Claims (9)

  1. インターネットに接続された文字認識装置において、
    前記インターネットを経由してURLで示される接続先へ接続るインターネット接続部と、
    入力された画像データ中の各文字画像の特徴量を標準パターンと比較し、各文字画像について確からしさの高い順に候補文字を抽出する文字認識部と、
    前記文字認識部で抽出されたもっとも確からしさの高い候補文字で構成される文字列がURLのとき、前記インターネット接続部へ前記文字列を与えて、前記インターネット接続部による接続が正常に行われるか否かによって、文字認識結果を検証する結果検証部と
    前記結果検証部で認識結果の前記文字列が存在しないURLである場合、前記文字列中の確からしさの最も低い文字を、所定の置き換え規則に従って他の文字に置き換えることにより当該文字列を修正する結果修正部を備え、
    前記結果検証部は、前記結果修正部で修正された文字列により再度検証を行うことを特徴とする文字認識装置。
  2. 請求項に記載された文字認識装置において、
    前記結果修正部は、
    認識結果である前記文字列の候補文字のうち確からしさの最も低い候補文字を、前記文字認識部で抽出された他の候補文字のうち、次に確からしさの高い候補文字で置き換えることを特徴とする文字認識装置。
  3. 請求項に記載の文字認識装置において、
    所定の文字に、当該文字と誤認識されやすい文字を順位づけして対応づけた候補文字ラティスを保持し、
    前記結果修正部は、
    認識結果である前記文字列の候補文字のうち確からしさの最も低い文字が前記候補文字ラティスに登録された文字の場合、前記候補ラティス中の順位の高い文字から順次置き換えるようにしたことを特徴とする文字認識装置。
  4. 請求項に記載の文字認識装置において、
    所定の文字又は文字の組み合わせに、前記画像データからの切り出し時の誤りによって誤認識されやすい文字又は文字の組み合わせを順位づけして対応づけた候補パターンラティスを保持し、
    前記結果修正部は、
    認識結果である前記文字列の候補文字のうち確からしさの最も低い文字又は文字の組み合わせが前記候補文字ラティスに登録されている場合、前記候補パターンラティス中の順位の高い文字又は文字の組み合わせから順次置き換えるようにしたことを特徴とする文字認識装置。
  5. インターネット接続部と、文字認識部と、結果検証部と、結果修正部と、を備えた文字認識装置における文書認識方法において、
    前記文字認識部が、入力された画像データ中の各文字画像の特徴量を標準パターンと比較し、各文字画像について確からしさの高い順に候補文字を抽出するステップと、
    前記結果検証部が、前記文字認識部で抽出されたもっとも確からしさの高い候補文字で構成される文字列がURLのとき、前記インターネット接続部へ前記文字列を与えて、前記インターネット接続部による接続が正常に行われるか否かによって、文字認識結果を検証するステップと、
    前記結果修正部が、前記結果検証部で認識結果の前記文字列が存在しないURLである場合、前記文字列中の確からしさの最も低い文字を所定の置き換え規則に従って他の文字に置き換えることにより当該文字列を修正するステップと、
    前記結果検証部は、前記結果修正部で修正された文字列により再度検証を行うステップと、から構成されることを特徴とする文字認識方法。
  6. 請求項に記載された文字認識方法において、
    前記結果修正部は、
    認識結果である前記文字列の候補文字のうち確からしさの最も低い候補文字を、前記文字認識部で抽出された他の候補文字のうち、次に確からしさの高い候補文字で置き換えることを特徴とする文字認識方法。
  7. 請求項に記載の文字認識方法において、
    前記結果修正部は、
    認識結果である前記文字列の候補文字のうち確からしさの最も低い候補文字が、所定の文字に、当該文字と誤認識されやすい文字を順位付けて対応づけた候補ラティスに登録された文字の場合、前記候補ラティス中の順位の高い文字から順次置き換えることを特徴とする文字認識方法。
  8. 請求項5に記載の文字認識方法において、
    前記結果修正部は、
    認識結果である前記文字列の候補文字のうち確からしさの最も低い文字又は文字の組み合わせが、所定の文字又は文字の組み合わせに、前記画像データからの切り出し時の誤りによって誤認識されやすい文字又は文字の組み合わせを順位づけして対応づけた候補パターンラティスに登録されている場合、前記候補パターンラティス中の順位の高い文字又は文字の組み合わせから順次置き換えることを特徴とする文字認識方法。
  9. 請求項5乃至8の何れか一項に記載の文字認識方法をコンピュータに実現させるためのプログラムを記録したプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2001077280A 2001-03-16 2001-03-16 文字認識装置、文字認識方法および記録媒体 Expired - Fee Related JP4245820B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001077280A JP4245820B2 (ja) 2001-03-16 2001-03-16 文字認識装置、文字認識方法および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001077280A JP4245820B2 (ja) 2001-03-16 2001-03-16 文字認識装置、文字認識方法および記録媒体

Publications (2)

Publication Number Publication Date
JP2002279352A JP2002279352A (ja) 2002-09-27
JP4245820B2 true JP4245820B2 (ja) 2009-04-02

Family

ID=18934061

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001077280A Expired - Fee Related JP4245820B2 (ja) 2001-03-16 2001-03-16 文字認識装置、文字認識方法および記録媒体

Country Status (1)

Country Link
JP (1) JP4245820B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4655415B2 (ja) * 2001-06-12 2011-03-23 ソニー株式会社 携帯端末及び広告システム
US8849800B2 (en) * 2005-09-19 2014-09-30 Tektronix, Inc. System and method of forwarding end user correlated user and control plane or network states to OSS system
KR100930802B1 (ko) * 2007-06-29 2009-12-09 엔에이치엔(주) 이미지를 이용한 브라우저 제어 방법 및 시스템
JP6131765B2 (ja) * 2013-08-06 2017-05-24 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP2021009625A (ja) * 2019-07-02 2021-01-28 コニカミノルタ株式会社 情報処理装置、文字認識方法および文字認識プログラム

Also Published As

Publication number Publication date
JP2002279352A (ja) 2002-09-27

Similar Documents

Publication Publication Date Title
US6944820B2 (en) Ensuring proper rendering order of bidirectionally rendered text
US6718337B1 (en) Apparatus with extended markup language date capture capability
US8375098B2 (en) Method, system and program product for verifying an attachment file within an e-mail
US20110142344A1 (en) Browsing system, server, and text extracting method
US7693957B2 (en) Data management system storing file in designated folder
US20220201146A1 (en) Information processing apparatus, information processing system, control method of the same, and storage medium
US11115544B2 (en) Information processing apparatus, character recognition method and non-transitory computer-readable recording medium encoded with character recognition instructions
JP4245820B2 (ja) 文字認識装置、文字認識方法および記録媒体
JP5390522B2 (ja) 表示文書を解析に向けて準備する装置
US20080024834A1 (en) Information registration apparatus for registering information onto registering destination on network and method thereof
CN109302543A (zh) 图像处理装置及存储介质
US20040250208A1 (en) Enhanced spelling checking system and method therefore
US8561141B2 (en) Information input assistance device, computer-readable medium, and information input assistance method
US20170054865A1 (en) Information processing system, information processing apparatus, and method for processing information
JP6763173B2 (ja) 文書修正方法、文書修正装置、およびコンピュータプログラム
US11620840B2 (en) Image processing apparatus for extracting a desired character string from a scanned image
US10922475B2 (en) Systems and methods for managing documents containing one or more hyper texts and related information
CN113867707A (zh) 文件夹命名方法及装置
JP2008052698A (ja) 言語フォーマット認識方法および装置
JP4791641B2 (ja) 候補文字出力装置、候補文字出力方法、プログラムおよびコンピュータ読み取り可能な記録媒体
JP2003178261A (ja) 文字認識装置およびプログラム
JP3845385B2 (ja) 指紋照合システム及び指紋データベース更新方法
US10638002B2 (en) System and method for automated printing of network documents
JP2002117373A (ja) アドレス自動入力装置及びその方法、並びに通信端末装置
JP4091308B2 (ja) 情報処理装置及び文字認識方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060526

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080909

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081216

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090107

R150 Certificate of patent or registration of utility model

Ref document number: 4245820

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120116

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130116

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140116

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees