JP4597644B2 - 文字認識装置、プログラムおよび記録媒体 - Google Patents

文字認識装置、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP4597644B2
JP4597644B2 JP2004340559A JP2004340559A JP4597644B2 JP 4597644 B2 JP4597644 B2 JP 4597644B2 JP 2004340559 A JP2004340559 A JP 2004340559A JP 2004340559 A JP2004340559 A JP 2004340559A JP 4597644 B2 JP4597644 B2 JP 4597644B2
Authority
JP
Japan
Prior art keywords
character string
character
classification
adaptation
classification item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004340559A
Other languages
English (en)
Other versions
JP2005182772A (ja
Inventor
和宏 竹原
康司 石塚
哲 鈴木
充宏 斗谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2004340559A priority Critical patent/JP4597644B2/ja
Publication of JP2005182772A publication Critical patent/JP2005182772A/ja
Application granted granted Critical
Publication of JP4597644B2 publication Critical patent/JP4597644B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

この発明は、文字認識装置、及び、文字認識処理をコンピュータに実行させるプログラム、及び、同プログラムを記録する記録媒体に関する。
現在、光学式文字読取(OCR : Optical Character Reader)技術は、文書読取装置、帳票読取装置などのいろいろな文字読取装置として実現され、利用されている。その中には、名刺読取装置のように名刺に記載された氏名、住所、会社名など各々の文字列の項目(以下、これを分類項目と呼ぶ)が何であるかを分類する装置も多く存在する。
この分類項目の判定技術については様々な手法が存在するが、たとえば、特開平10−187885号公報(特許文献1)に、郵便番号、TEL等の記号(文字列)により判定、判定結果に応じた文字認識についての手法が記載されている。
一方、OCRは、近年小型化が進み、OCR機能が搭載された、カメラで読取対象を撮影し認識を行なうカメラ付き携帯電話も発売されている。
図41、図42は、このようなカメラ付き携帯電話で文字認識を行なわせる文字列の例である。このような画像を撮影して、簡単にそのURL(uniform resource locator)から対象のWebにアクセスできるようになれば、OCR機能付携帯電話は、今後一層普及するものと思われる。
特開平10-187885号公報
名刺等に記載されたURL(uniform resource locator)、メールアドレス、電話番号を認識し、電話、メール発信、Webへのアクセスに利用する場合、分類項目の判定機能がないOCRでは、対象がどの分類項目にあたるかを利用者が一々指定しなければならない。この作業は利用者にとって負担であるため、名刺等の対象を認識することを目的としたOCRは項目判定機能が付加されていることが望ましい。
しかしながら、現在の項目判定機能付きOCRは判定した分類項目に適した形で認識結果を出力するが、現在の項目判定技術は完全ではないため、分類項目の判定が誤った場合、かえって認識結果の修正労力が増加してしまうという場合があるという問題が存在する。
図43は、従来の文字認識装置の動作を説明するためのフローチャートである。
図43を参照して、最初にステップS501において、被写体が撮像される。次に、ステップS502において、撮像画像から文字列が抽出され、ステップS503において、文字列の認識が行なわれる。
そしてステップS504にて、その文字列がURL、メールアドレス、電話番号など何であるかを抽出された文字列の構成から判断して、分類項目が決定される。続いてステップS505では、ステップS504にて決定された分類項目での文字列適合化処理が行なわれる(適合化処理に付いては、後述する)。
そして、適合化した文字列がステップS506にて表示され、ステップS507にてその結果を採用するか否かの判断が行なわれる。表示を見た使用者が、表示された結果を採用する場合には処理は終了となる。一方、表示を見た使用者が、結果を採用しない場合には、再度ステップS501に戻り撮像から認識作業を始める。採用の有無の指示は、入力手段のボタンの操作等によって文字認識装置に与えられる。
しかしながら、先に述べたように、従来の項目判定機能付きOCRの判定は、完全ではない。このため、分類項目の判定が誤った場合、かえって認識結果の修正労力が増加してしまうという問題が存在する。
この問題をより具体的に説明する。
図44は、文字認識させる対象の入力画像の一例を示した図である。
たとえば、入力画像が、図44で図示しているような「0123-45-6789@kaisya.co.jp」という文字列であった場合に、正しい分類項目はメールアドレスである。しかし、@の左側が電話番号に似た数字列であるため、誤って電話番号と判定されることが有り得る。
電話番号と判定された場合には、一般の項目判定機能付きOCRでは、電話番号に適合するように出力が行なわれる。
図45は、従来の文字認識装置の出力結果を示した図である。
図45を参照して、文字認識装置501は、表示部507に図示しない撮像手段で撮像した画像の文字認識結果が表示するものである。認識結果は、図45の表示部507に示すように電話番号として適合化され「0123-45-6789」となる。この認識結果を編集して修正する場合には、@以降の文字を数字キー205を用いて手入力しなければならないため、利用者にとって大きな負担である。このため項目判定誤りによる適合化の失敗を回避する方法が必要となってくる。
この問題を回避する方法として、従来は、分類項目を再度指定し文字認識を行なわせる、いわゆる再読取の方法が行なわれている。しかしながら、一つの文字列について再読取を行なうと、その一つの文字列にかかった処理時間は、概算でおよそ2倍程度になることが予想される。この再読取による処理時間の増加は、携帯電話などの処理能力があまり高くない携帯情報端末では、利用者にとって大きな負担となる。
以下、携帯電話などの小型情報端末においては、認識処理時間の増加は、避けなければならない大きな問題であることを述べる。
近年、携帯電話などの小型情報端末も、CPU(Central Processing Unit)の高速化に伴って処理速度が向上しているが、PC(パーソナルコンピュータ)と比較した場合、処理速度の差は大きい。
PCと携帯電話機用デバッグボードでOCRの処理速度を本願発明者が実際に比較した実験の結果を示してこれを説明する。
比較対照プラットフォームとしては、パーソナルコンピュータ(Pentium(登録商標)III搭載)を用意し、処理時間を携帯電話機開発用ボード(モックアップ)と比較した。実験に使用したOCRプログラムは、本願出願人が開発した英文OCRプログラムである。そして、認識対象画像は図41に示したような「http://www.kaisya.co.jp/index.html」と1行、33文字が書かれた画像(1枚)である。
認識時間は、携帯電話機開発用ボードは認識時間1.6秒(速度20.6cps)であったのに対し、パーソナルコンピュータ(Pentium(登録商標)III搭載)では、認識時間は0.1秒(速度330cps)であった。
携帯電話機開発用ボード上での速度は、実際の携帯電話上での速度とほぼ同じであり、上記の実験の結果から、33文字の文字を認識するのに、パーソナルコンピュータ(Pentium(登録商標)III搭載)だと、ほぼ瞬時(0.1秒)で認識が終了するが、携帯電話の場合、1.6秒待たなければならないことがわかる。
認識対象の文字列がより長い場合、携帯電話OCRでは、さらに認識時間がかかり、利用者はいっそう待たされることになる。たとえば、図42は、73文字のURLであるが、このURLを認識した場合、上記実験の結果(PC 330cps, 携帯電話20.6cps)から、携帯電話では、3.5秒かかる。(PCでは、0.2秒)。
以上、1行の英字で書かれた対象の認識実験結果、例を挙げたが、その他にも、英文名刺全体を認識することも考えられる。英文名刺では、100文字以上が記載されていることも多く、上記の例よりさらに認識時間がかかることになる(上記実験結果から、携帯電話では、100文字の認識には、約4.9秒かかる)。
一般に文字認識装置では、認識時間の大半は、標準パターン辞書との照合(マッチング)の時間であり、出願人開発の上記英文OCRでは、認識にかかる処理時間のうち、約80%が、マッチングの処理時間である。従って、携帯電話に搭載されたOCRの場合、利用者の認識待ち時間をできるだけ少なくするために、マッチングにかかる時間を減らす必要がある。
従来、マッチングの処理時間を減らす方法として、大分類による高速化手法などといったマッチング処理自体を速くする方法などがあるが、飛躍的な向上が望めるものではなかった。また、速度向上のため認識精度の低下といった問題が発生し、処理時間の削減問題の解決には適さない。
以上のように、携帯電話などの携帯情報端末では、PCと比較して演算処理能力が低いため、利用者の認識待ち時間が利用者にとって大きな負担となることがある。従来行なわれている再読取の方法で、一つの文字列について再読取を行なうと、その一つの文字列にかかった処理時間は、概算でおよそ2倍程度になることが予想される。この再読取による処理時間の増加は、携帯電話などの携帯情報端末では、利用者にとって結果が表示されるのを長く待つという事は、はなはだ苦痛となる。
本発明は、上記問題点を解決するためになされたものであり、発明の目的は、処理能力が比較的低い場合でも利用者が求める的確な結果を得る文字認識装置を提供することである。
この発明は、要約すると、文字認識装置であって、画像を撮像画像として撮像する画像撮像手段と、撮像画像の文字列部分を画像文字列として抽出する文字列抽出手段と、画像文字列に対して文字認識を行ない、認識文字列を生成する文字列認識手段と、認識文字列に対して、文字列の分類を表す予め定められた分類項目の内、予め設定された複数の分類項目の全てに対して各分類項目に応じた適合化処理を施し、複数の分類項目それぞれに対応した適合化文字列を生成する適合化文字列生成手段と、複数の生成された適合化文字列のひとつを選択する選択方法、或いは、適合化文字列に対応する複数の分類項目のひとつを選択する選択方法の内、少なくともひとつの選択方法で選択を行なう選択手段を備える。
好ましくは、文字認識装置は、複数の生成された適合化文字列を表示する表示方法、或いは適合化文字列に対応する複数の分類項目表示する表示方法の内、少なくともひとつの表示方法で表示する表示手段と、選択手段においてなされる選択がいずれの選択であるかの指示を入力する入力手段とをさらに備える。
好ましくは、文字認識装置は、認識文字列が複数の分類項目のいずれの属性に適合しているかにより認識文字列が、複数の分類項目のいずれの分類項目であるかを判定する分類項目判定手段とをさらに備え、選択手段における選択は、判定された分類項目或いは、判定された分類項目に対応する生成された適合化文字列をもってなされることを特徴とする。
好ましくは、予め定められた複数の分類項目に対して、それぞれ対応する文字列修正処理のための手段を備える文字列修正部をさらに備え、文字列修正部は、適合化文字列が選択された後、選択された適合化文字列に応じた分類項目に対応する文字列修正処理のための手段によって、選択された適合化文字列の修正入力処理を行なう。
好ましくは、適合化文字列の修正入力処理は、表示手段での選択された適合化文字列に応じた分類項目に対応する文字コード体系を用いた表示処理、あるいは入力手段での選択された適合化文字列に応じた分類項目に対応する、入力キーと入力文字との対応付けテーブルを用いた入力処理のうち、少なくともいずれか一方を含む。
好ましくは、予め定められた複数の分類項目を表示する表示手段と、入力手段と選択手段に対し、いずれの分類項目を選択するかの指示を入力する入力手段と、選択手段により選択された適合化文字列を出力する文字列出力手段と、予め定められた複数の分類項目に対して、それぞれ対応する文字列利用処理のための手段を備える文字列利用部とをさらに備え、文字利用部は、適合化文字列が選択された後、選択された適合化文字列に応じた分類項目に対応する文字列利用処理のための手段によって、選択された適合化文字列の利用処理を行なう。
好ましくは、適合化文字列の利用処理は、表示手段での選択された適合化文字列に応じた分類項目に対応する文字コード体系を用いた表示処理、あるいは入力手段での選択された適合化文字列に応じた分類項目に対応する、入力キーと入力文字との対応付けテーブルを用いた入力処理のうち、少なくともいずれか一方を含む。
この発明の他の局面に従うと、文字認識装置であって、画像を撮像画像として撮像する画像撮像手段と、撮像画像の文字列部分を画像文字列として抽出する文字列抽出手段と、画像文字列に対して文字認識を行ない、認識文字列を生成する文字列認識手段と、認識文字列が、予め定められた複数の分類項目のいずれの属性に適合しているかにより、認識文字列が、複数の分類項目の各々のいずれの分類項目であるかを判定する分類項目判定手段と、外部から与えられる分類項目指定情報に応じて複数の分類項目のうちの1つを特定する分類項目特定手段と、認識文字列に対して、分類項目判定手段により判定がなされた分類項目に応じた適合化処理を施して適合化文字列を生成し、分類項目指定情報が与えられたときには分類項目特定手段で特定された分類項目に応じて再度適合化処理を施して適合化文字列を生成する文字列適合化手段とを備える。
好ましくは、予め定められた複数の分類項目に対して、それぞれ対応する文字列修正処理のための手段を備える文字列修正部をさらに備え、文字列修正部は、分類項目が判定または特定された後、判定または特定された分類項目に対応する文字列修正処理のための手段によって、生成された適合化文字列の修正入力処理を行なう。
好ましくは、適合化文字列の修正入力処理は、表示手段での生成された適合化文字列に応じた分類項目に対応する文字コード体系を用いた表示処理、あるいは入力手段での選択された適合化文字列に応じた分類項目に対応する、入力キーと入力文字との対応付けテーブルを用いた入力処理のうち、少なくともいずれか一方を含む。
好ましくは、適合化文字列を出力する文字列出力手段と、予め定められた複数の分類項目に対して、それぞれ対応する文字列利用処理のための手段を備える文字列利用部とをさらに備え、文字利用部は、分類項目が判定または特定された後、判定または特定された分類項目に対応する文字列利用処理のための手段によって、生成された適合化文字列の利用処理を行なう。
好ましくは、適合化文字列の利用処理は、表示手段での生成された適合化文字列に応じた分類項目に対応する文字コード体系を用いた表示処理、あるいは入力手段での生成された適合化文字列に応じた分類項目に対応する、入力キーと入力文字との対応付けテーブルを用いた入力処理のうち、少なくともいずれか一方を含む。
この発明のさらに他の局面に従うと、プログラムであって、画像を入力する画像入力ステップと、入力された画像の文字列部分を画像文字列として抽出する文字列抽出ステップと、画像文字列に対して文字認識を行ない、認識文字列を生成する文字列認識ステップと、認識文字列に対して、文字列の分類を表す予め定められた分類項目の内、予め設定された複数の分類項目の全てに対して各分類項目に応じた適合化処理を施し、複数の分類項目それぞれに対応した適合化文字列を生成する適合化文字列生成ステップと、複数の生成された適合化文字列のひとつを選択する選択方法、或いは、適合化文字列に対応する複数の分類項目のひとつを選択する選択方法の内、少なくともひとつの選択方法で選択するステップとをコンピュータに実行させる。
この発明のさらに他の局面に従うと、プログラムであって、画像を入力する画像入力ステップと、入力された画像の文字列部分を画像文字列として抽出する文字列抽出ステップと、画像文字列に対して文字認識を行ない、認識文字列を生成する文字列認識ステップと、認識文字列が、予め定められた複数の分類項目のいずれの属性に適合しているかにより、認識文字列が複数の分類項目の各々のいずれの分類項目であるかを判定する分類項目判定ステップと、外部から与えられる分類項目指定情報に応じて複数の分類項目のうちの1つを特定する分類項目特定ステップと、認識文字列に対して、分類項目判定ステップにより判定がなされた分類項目に応じた適合化処理を施して適合化文字列を生成し、分類項目指定情報が与えられたときには分類項目特定ステップで特定された分類項目に応じて再度適合化処理を施して適合化文字列を生成する文字列適合化ステップとをコンピュータに実行させる。
この発明のさらに他の局面に従うと、上記のプログラムを記録したコンピュータ読取可能な記録媒体である。
本発明によれば、認識処理時間の増加を抑制しながら全ての分類項目に適合した認識結果を生成するため、分類項目判定が誤ってしまい、それに伴って誤った適合化処理が行なわれた場合でも、即時に正しい分類項目に基づいた結果である適合化文字列を選んで採用することが可能である。
また、従来と変わらない認識処理時間で、分類項目判定結果に基づいた適合化文字列を生成することが可能であり、分類項目判定を誤った場合、適合化処理のみの短い時間で、利用者により特定された正しい分類項目に基づいた結果である適合化文字列を得ることが可能である。
以下において、本発明の実施の形態について図面を参照して詳しく説明する。なお、図中同一符号は、同一または相当部分を示す。
[実施の形態1]
図1はこの発明の実施の形態1の文字認識装置の構成を示すブロック図である。
図1を参照して、文字認識装置100は、画像撮像手段としての画像撮像部101と、撮像した画像を保存する画像保存メモリ111と、制御部110と、制御部110が参照するデータを保存するデータメモリおよび中途段階の処理結果を保存する作業メモリとして働くメモリ112と、表示手段としての表示部107と、入力手段としての入力部108とを備える。
制御部110は、文字列抽出手段としての文字列抽出部102、文字列認識手段としての文字列認識部103と、文字列適合化手段としての文字列適合化部104と、選択手段としての選択部106とを含む。
図1に示す画像撮像部101は、被写体像をデジタル画像データに変換する手段であり、たとえば、CCD(Charge Coupled Device)やCMOS(Complementary Metal-Oxide
Semiconductor)などのセンサーを用いたカメラ、スキャナなどがこれに該当する。また、画像保存メモリ111は、RAM(Random Access Memory)等の半導体メモリを具備している。画像撮像部101により撮像された画像データは画像保存メモリ111内に一時的に格納されるものとする。
なお、本実施の形態では画像を撮像して認識する構成で記載しているが、画像の入力は、光学スキヤナや通信先から、または他の記録媒体などから画像を入手する事でも可能である。この場合には、入手する画像入力手段と一時的に格納される画像記録部を画像撮像部101の代りに持つ事になる。もちろん、これら全ての構成を持つ事も可能である。
また、文字列抽出部102は、画像保存メモリ111内の画像データから、文字列の座標や、文字列を構成する文字ブロックの個数、座標といった画像情報を備えた文字列情報を抽出する文字列抽出手段である。
以下、前述の画像情報を備えた文字列情報を画像文字列と呼ぶことにする。光学式文字認識技術の分野において、画像文字列の抽出に関する手法は数多く存在するが、本発明で用いる手法に制限はなく、どの手法を用いてもかまわない。
また、文字列認識部103は、文字列抽出部102で抽出された文字列に対して、データメモリ112中に保持されている認識辞書と照合を行ない、認識文字列を生成する文字列認識手段である。
認識文字列とは、認識辞書との照合により生成される文字列の文字コード情報であるが、その他に2位以下の認識候補コード、照合辞書との類似度または距離値、文字の座標位置などの情報を含んでいてもかまわない。
文字列認識は、たとえば辞書に登録された文字の標準的な画像パターンと画像文字列との照合(マッチング)し、不一致画素が少ない順に上位の候補に割当てることが考えられる。
画像文字列から認識文字列を生成する手法は、たとえば、文字ブロック間の空白により1文字分の文字ブロックを切り出した後、1文字分の文字ブロック毎に、辞書に登録された文字の標準パターンとの照合(マッチング)を行ない、不一致画素が少ない順に上位の候補に割当てることが考えられる。
しかし、文字列認識に関しても、文字列認識に関する手法は数多く存在し、本発明では、どの手法を用いてもかまわない。
また、文字列適合化部104は、文字列認識部103で生成された認識文字列から分類項目に適合した文字列を生成する処理を行なう文字列適合化手段である。
ここで、分類項目とは、予め分類し設定しておいた、該当する文字列が何を意味しているかを示した事柄の集まりであり、具体的には、電話番号、URL、メールアドレス、氏名、肩書、住所などである。各々の分類項目の文字列にはそれぞれ特徴が有り、その特徴にもとづいて後述のように認識文字列を適正化することが可能である。
選択部106は、文字列適合化部104で生成された適合化文字列のうち、どの文字列を採用するかを選択する選択手段である。文字列適合化部104によって、複数の分類項目について適合化文字列が生成された場合、文字認識装置100において、この選択部106によって選択された適合化文字列が採用される。
なお、選択部106における選択は、後述の入力部108によって入力された情報に基づいて行なわれる。入力部は種々の情報を入力する手段を示し、各種のキーによる入力であり、更に機器の外部よりインタフェースと結びつく通信回線等による情報の入力でも良い。
表示部107では、文字認識装置で扱う種々の情報についての表示が行なわれ、特に実施の形態1の文字認識装置では適合化文字列の表示等が行なわれる。具体的には、携帯電話などのディスプレイが該当する。
入力部108は、文字認識装置で扱う種々の情報を入力するための手段であり、特に実施の形態1の文字認識装置100では、選択手段に対して利用者が選択した情報を入力する処理等が行なわれる。具体的には、数字キー、メニュー画面などで使用する決定キー、カーソル移動のための矢印キーなどである。更に通信回線等による情報の入力でも良い。
図2は、実施の形態1の文字認識装置の動作を説明するためのフローチャートである。
図2を参照して、最初に、ステップS101において、図1の画像撮像部101によって被写体が撮像される。
図3は、認識対象被写体の一例であり、図4はその被写体を画像撮像部101で撮像した場合の撮像画像の例である。
本実施例では、この図4の表示部107に表示されている0123−45−6789@sharp.co.jpを画像文字列として抽出して、複数の分類項目毎に適合化文字列生成の処理をして、その1つを選択するものであり、以下、そのフローを説明する。
再び図2を参照して、次に、ステップS102において、文字列抽出部102は、画像撮像部101からの撮像された画像データ、または画像保存メモリ111内の画像データから、文字列の位置などの文字列の情報を抽出する。前述したように文字列の抽出方法はどのようなものでもかまわない。また、本実施の形態では説明を容易にするため、1行の文字列を画像文字列として抽出したものとするが、複数行の場合についても1行の場合と同様である。
図4の撮像画像を文字列抽出手段により、画像文字列(行)が抽出される。
次に、図2のステップS103において、図1の文字列認識部103は、ステップS202で抽出された画像文字列の認識を行なう。前述したように画像文字列の認識方法はどのようなものでもかまわない。
画像文字列は、文字列に含まれる文字ブロックの個数、各ブロックの座標、文字列全体の座標などの情報を含んでいる。
図5は、画像文字列を認識した認識文字列の例を示した図である。
認識文字列とは、認識処理によって生成される文字情報のことであり、文字コードや文字候補、類似度、座標などの情報を含む。図5に示す認識文字列は、たとえば第1〜第4の文字候補をもつ。なお、kaisyaより後の文字については、候補の図示は省略している。
次に、図2のステップS104において、文字列適合化部104は、文字列認識部103で生成された認識文字列を、本認識装置があらかじめ分類対象としている分類項目(氏名、住所、氏名、肩書、住所、電話番号、URL、メールアドレスなど)に基づいて複数の分類項目それぞれに対応した適合化文字列を生成する。
図6は、図2のステップS104の詳細を示したフローチャートである。
図6を参照して、ステップS104が開始されるとまず、ステップS111において文字列を適合化するための分類項目が決められる。本実施の形態1では、この分類項目の決定は、任意の順番で可能である。
図7は、予めテーブルに登録された分類項目の例である。
図7の例では、1番目の分類として電話番号が、2番目の分類としてURLが、3番目の分類としてメールアドレスが登録されている。このような分類項目のテーブルは、図1のデータメモリ112に保存されている。すなわち、記憶装置として動作するメモリ112は、分類項目の番号を表す1、2、3等の数字情報と、具体的な分類項目を表す情報とを相互に関連付けて記憶していることになる。
図8は、予めテーブルに登録された分類項目に適した認識候補の例である。このような認識候補のテーブルも、図1のデータメモリ112に保存されている。すなわち、記憶装置として動作するメモリ112は、具体的な分類項目を表す情報と、認識候補を表す情報とを相互に関連付けて記憶していることになる。
図8の例は、理解の容易のため、英文OCRのケースを示している。分類項目が電話番号の時には、対象文字は「0〜9 - ( )」であり、除外文字は、「A〜Z a〜z / @
: .」となる。分類項目がURLの時には、対象文字は「0〜9 A〜Z a〜z - : /.」であり、除外文字は、「( ) @」となる。分類項目がメールアドレスの時には、対象文字は「0〜9 A〜Z a〜z @ - .」であり、除外文字は、「() : /」となる。
分類項目の第1番目について適合化を行なう場合は、図8のテーブルを参照して、電話番号に使用される文字コードのみで認識候補が生成される。
たとえば、認識対象が、「0123-45-6789」の数字文字列であり、第1文字目の「0」の各候補が図5に示すように、第1位が「0」(数字)、第2位が「O」(英大文字)、第3位が「o」(英小文字)、第4位が「6」(数字)であるとする。
ここで、分類項目が電話番号である場合は、図8を参照すると分類項目に適した文字コードは、第1位、第4位のコードであり、残りの第2位、第3位の文字コードは適さない文字コードであることがわかる。従って、分類項目の適合化の結果、第1文字目の「0」の認識候補は、第1位が「0」(数字)、第2位が「6」(数字)、第3位および第4位は、候補無しと再生成される。
再び図6を参照して、ステップS111で分類項目が決められると、ステップS112に進む。ステップS112では不要文字列の削除が行なわれる。電話番号として適切な文字列の長さに制限する方法で削除してもよいし、適合化後に対象文字以外が第1位候補に初めて出現した位置以降の文字は削除するというように決めておいてもよい。このようにして、分類項目が電話番号の場合であれば、「@」以降は除去する処理が行なわれる。
図9は、電話番号として適合化された文字列を示した図である。
図5、図9を参照してこのようにして、図5の第4文字目の第1位の候補は「3」と適合化され、第7文字目の第1位の候補は「5」と適合化される。そして、「@」以降の文字は除去される。結局、図9の場合、生成された文字列は、「0123-45-6789」となる。
また、「URL:」など、その後に書かれた文字列が何であるかを表す単語を除去する処理も行なう。たとえば、「URL: http://www.kaisya.co.jp」と書かれた文字列を認識し、分類項目URLについて適合化する場合は、生成された文字列は、「http://www.kaisya.co.jp」となる。この場合は、予め図示しない所定のテーブルに分類項目URLについて削除文字列「URL:」が登録されており、このテーブルを参照することにより文字列の削除が行なわれる。他にも、分類項目が電話であれば「TEL,Tel」等が、メールアドレスであれば「Email」等がテーブルに登録されている。
再び図6を参照して、ステップS112の不要文字列の削除が終了すると、ステップS113に進む。ステップS113では文字列の修正が行なわれる。文字列の修正は、たとえばURLであれば、http , www , co , jp などといった頻出する文字列の誤りパターンを予め認識実験等で調査しテーブルを作成しておく。
図10は、分類項目と認識文字列と修正によるその適合化候補のテーブルの例である。このような適合化候補のテーブルも、図1のデータメモリ112に保存されている。すなわち、記憶装置として動作するメモリ112は、具体的な分類項目を表す情報と、実際に認識した認識文字列を表す情報と適合化候補を表す情報とを相互に関連付けて記憶していることになる。
図10に示すように、「h」は「k」と「p」は「D」と誤認識されやすく、また、「co」は間隔が狭いと「oo」のように誤認識されやすい。また「:」や「.」は、文字として認識されずに欠落しやすい。以上のような事情を考慮して分類項目URLについては、「kttp://」や「http//」の適合化候補を「http://」と登録しておく。また分類項目URLおよびメールアドレスについては、「oo.jp」「co.jD」「cojp」の適合化候補を「co.jp」と登録しておく。
たとえば、「http://www.kaisya.co.jp」の1文字目を「k」と誤認識し、「kttp://www.kaisya.co.jp」と文字列を認識したとする。本例に関していえば、「http://」に類似した文字列として「kttp://」が図10のテーブルに登録されていればこれを参照することで「http://」と修正することは容易にできる。従って、ステップS113の終了時に生成された文字列は、「http://www.kaisya.co.jp」となる。
ステップS113が終了すると、図2のステップS104からステップS105に進む。ステップS104の適合化処理は、分類項目ごとに行なわれる。図7のように分類項目が登録されている場合には、たとえば最初に分類項目「電話番号」に適合化させる処理が行なわれ、適合化処理が終了すると、分類項目「電話番号」について適合化処理が終了したことが記憶される。このように、全ての分類対象について適合化を行なったか否かが記憶されている。まだ適合化を行なっていない残りの分類対象については、ステップS105から再びステップS104に戻り適合化処理が行なわれる。
つまり、ステップS105において、もし、それまでに適合化されていない分類項目があれば、ステップS104へ戻り、まだ適合化されていない分類項目のうちいずれか1つの分類項目について、適合化処理が行なわれる。一方で、もし、ステップS105において、すべての分類項目について文字列適合化部104により適合化文字列が生成されていれば、ステップS106へ進む。
ステップS106で、それまでに生成された適合化文字列が表示部107に並んで表示され、選択部106により表示されている適合化文字列のうち1つの文字列が入力部108よりユーザの指定に応じて選択される。ここで選択された適合化文字列が本認識装置が採用する認識結果となる。
この適合化文字列の選択は、適合化文字列そのものを指定してもよいし、あるいは適合化文字列に応じた分類項目のうち、少なくとも1つの選択方法で指定して選択してもよい。
図11は、この実施の形態1のステップS106での表示例である。
図11を参照して、分類項目「電話番号」に対応して適合化文字列「0123-45-6789」が表示され、分類項目「メールアドレス」に対応して適合化文字列「0123-45-6789 @ kaisya.co.jp」が表示され、分類項目「URL」に対応して適合化文字列「0123-45-6789 G kaisya.co.jp」が表示されている。
実施の形態1では、ディスプレイに表示する際に、現在選択の適合化文字列であることを示す分類項目位置カーソル(図11の206)も同時に表示している。選択の適合化文字列を決定する際は、決定キー203を押下するものとする。
この分類項目位置表示カーソル206は、利用者が上下の矢印キー204を押下する操作と連動して上下に動くものとする。たとえば利用者が矢印キー204のうち上方向の矢印キーを1回押すと分類項目位置表示カーソル206は1つ上の適合化文字列(図では分類項目「電話番号」に対応)の左に位置するものとする。
なお、分類項目位置表示カーソル206の他に、選択した分類項目名を表示する分類項目表示メニュー(図7の207)を具備し、分類項目の表示を行なってもよい。
実施の形態1の処理の特長は、図2のステップS104とステップS105によって、分類項目の文字列適合化可能な複数の分類項目を全て先に文字列適合化して各分類項目毎の適合化文字列を生成するところである。
これによって、ステップS103での文字列認識部103による文字列の認識を一度しか行なわないで少ない操作で適切な文字列を得ることができる。OCRの構成による違いにより一概にはいえないが、前述した出願人が開発したOCRなどでは、前述したように、文字列の認識処理は全体の処理の約80%を占める。このため、文字認識処理を何回も行なうことは、携帯電話などの処理速度の遅い情報端末では、非常に時間がかかることになる。
しかし、本発明では、ステップS103での文字列認識部103による文字列の認識を一度しか行なわないため、全体の処理時間の増加が抑えられ、携帯電話などの処理速度の遅い携帯端末でも十分にOCRの搭載が可能である。
以上説明したように実施の形態1によれば、認識処理時間の増加を抑制しながら全ての分類項目に適合した認識結果を生成するため、分類項目判定が誤ってしまい、それに伴って誤った適合化処理が行なわれた場合でも、即時に正しい分類項目に基づいた結果である適合化文字列を選んで採用することが可能である。
また、上記の実施の形態1では、全ての分類項目に対して適合化処理を施したが、予め適合化を行なう複数の分類項目を定めることができるようにし、定めた複数の分類項目について適合化を行なう構成にすることも可能である。
[実施の形態2]
図12は、実施の形態2の文字認識装置の構成を示すブロック図である。
図12を参照して、文字認識装置200は、図1に示した実施の形態1の文字認識装置100の構成において制御部110に代えて制御部120を含む。制御部120は、制御部110の構成に加えて分類項目判定部121が付与されている。他の部分の構成については、図1の説明と同様であるので説明は繰返さない。
ここで、図12の分類項目判定部121とは、文字列認識部103で生成された認識文字列が、あらかじめ分類対象としている分類項目(氏名、肩書、住所、電話番号、URL、メールアドレスなど)の属性に基づいていずれの分類項目にあたるかを分類する分類項目判定手段である。
図13は、実施の形態2の文字認識装置の動作を説明するためのフローチャートである。
図13のフローチャートは、図2のフローチャートのステップS103とS104との間に分類項目判定ステップであるS204が追加されたものである。したがって、ステップS201〜S203は図1のステップS101〜S103とそれぞれ同様の処理であり、また、ステップS205〜S207は図1のステップS104〜S106と同様の処理である。したがって、これらのステップの説明は繰返さず、図13のステップS204に関係する処理動作のみ説明を行なう。
ステップS204では、分類項目判定部121が、文字列認識部103で生成された認識文字列があらかじめ分類対象としている分類項目(氏名、住所、氏名、肩書、住所、電話番号、URL、メールアドレスなど)のうち、いずれにあたるかを分類項目の属性に基いて判定する。
判定方法についていくつかの例を説明する。
ここで、分類の属性とは、各分類の項目を特定するために、あらかじめ定めている情報である。たとえば、分類が電話番号の場合の属性となる情報とは、連続した4桁の数字列とハイフンと2桁の数字列とハイフンと4桁の数字列を含む構成を示すルールを示す情報、または、連続した始め丸括弧(と5桁の数字列と終わり丸括弧)と1桁の数字列とハイフンと4桁の数字列を含む、などと定めておく。認識文字列がこのルールを示す情報と一致する場合には属性情報を満たすことになる。
このように、各分類項目は、認識された認識文字列に含まれる文字列に対して、各分類項目の鍵になる文字の属性を、数字列が一定の並びで含まれていれば電話番号、@の記号が含まれていればメールアドレス、wwwや、httpなどの文字列が含まれていればURLであるなどで判断することで可能である。
分類項目判定手段はメモリ112に保持されている属性情報を参照し、認識文字列がこれらの属性情報を満たせば、認識文字列の対応する分類項目と判断する。
この分類項目判定の技術は公知技術であるので特に詳細な説明は割愛するが、分類項目判定に関する手法は数多く存在し、本発明では、どの手法を用いてもかまわない。
即ち、予め定められた分類項目の中から機器に設定された複数の分類項目の有する属性特質に、認識文字列が適合或いは一致しているかを、確認してその結果において判定を決めれば良い。重点的言葉の出現があれば適合していると判定する場合もあり、適合度の最も高い分類項目の属性が適合した分類項目として判定しても良い。
他にも、属性情報として所定のテーブルに分類項目URLについて文字列「URL:」が登録されており、このテーブルを参照することにより文字列が分類項目URLであることが判定されてもよい。同様に、「TEL,Tel」等が文字列に含まれている場合に分類項目が電話であると判定してもよいし、「Email」等が文字列に含まれている場合に分類項目がメールアドレスであると判定してもよい。
実施の形態1では、撮像される文字画像を認識する際に、図2のフローに従い分類項目判定を行なう事無く、分類項目を機械が定めた任意の順序で順次分類項目の適合化を行なっている。これに対し、実施の形態2では、先にステップS204の分類項目判定を行なった後、ステップS205とステップS206で分類項目適合化を行ない、再度ステップS205とステップS206で残る他の分類項目について適合化を行なう動作となる。
つまり、最初にステップS204からステップS205へ進んだときは、適合化処理は、ステップS204で判定された分類項目に基づいて行なう。ステップS206からステップS205へ進んだときは、適合化を行なう順序は任意の順序でよい。
次に、ステップS206において、もし、それまでに適合化されていない分類項目があれば、ステップS205へ進み、まだ適合化されていない分類項目のうち任意の1つの分類項目について、適合化処理を行なう。
もし、すべての分類項目について文字列適合化部104により適合化文字列が生成されていれば、ステップS207へ進む。
その結果、ステップS207で、表示部107に、それまでに生成された適合化文字列が全て表示され、選択部106により表示されている適合化文字列のうち1つの文字列を入力部108からの指示に応じて選択する。ここで選択された適合化文字列が本認識装置が採用する認識結果となる。
図11を、この実施の形態2のステップS207での表示例とすると、選択途中の適合化文字列は、最初に表示された時点では、分類項目の判定結果に応じた適合化文字列が他の分類項目に応じた適合化文字列よりも優先して選択されるようにしておく。これによって、分類項目判定手段の項目判定精度が非常に高い場合、ほとんどの場合、矢印キーで選択を変更する必要がなく決定キーを押す操作だけになる。
なお、分類項目位置表示カーソル206の他に、選択した分類項目名を表示する分類項目表示メニュー(図11の207)を具備し、分類項目の表示を行なってもよい。
図14は、実施の形態2の他の画面表示の例である。
図14に示すように、「項目は電話と判定されました」とメッセージを表示したうえで、「それ以外の場合は対応する数字キーを押下してください」と分類項目に対応する数字キーによってユーザに選択させるようにしてもよい。
実施の形態2の発明は、実施の形態1の発明の特徴である1回の処理で全ての分類項目の適合化文字列を表示する際に、分類項目判定手段が判定した分類項目(または、分類項目に応じた適合化文字列)の決定が最も容易になるように構成されている。これによって、分類項目判定手段の判定が正しい時は即選択可能となり、分類項目判定手段の判定が誤っている場合にも他の分類項目を選択操作だけで指定出来るので、実施の形態1の発明をさらに改善したものとなっている。
なお、図2ではステップS204の分類項目判定は、複数の分類項目の適合化処理に先立って行なうように説明しているが、処理順序を変更して複数の分類項目の適合化処理後に行なう事も可能である。
以上説明したように、実施の形態2では、必要に応じて、画像文字列情報を所定の分類項目として判別・分類する分類項目判定手段をも持ち、該分類項目判定手段の分類の適合化文字列にはマークを付けたりカーソルで導いたりして、分類項目判定による適合化文字列を選択する。
以上の構成により、実施の形態2の文字認識装置は、認識処理時間の増加を抑制しながら全ての分類項目に適合した認識結果を生成するため、分類項目判定が誤ってしまい、それに伴って誤った適合化処理が行なわれた場合でも、即時に正しい分類項目に基づいた認識結果である適合化文字列を選んで採用することが可能である。加えて判定結果が正しい場合には、簡単な操作でこれを採用決定することができる。
[実施の形態3]
図15は、実施の形態3の文字認識装置の構成を示すブロック図である。
図15を参照して、文字認識装置300は、図12に示した文字認識装置200の構成において制御部120に代えて制御部130を含む。制御部130は、制御部120の構成において、選択部106に代えて分類項目特定部131を含む。文字認識装置300の他の部分の構成は、図12に示した文字認識装置200と同様であるので説明は繰返さない。
分類項目特定部131は、文字列認識部103で生成された認識文字列が、あらかじめ分類対象としている分類項目のいずれにあたるかを特定する分類項目特定手段であり、入力部108により特定のための分類項目が入力される。
図16は、実施の形態3の認識処理を説明するためのフローチャートである。
図16のフローチャートのステップS301〜S304は、図13のフローチャートのステップS201〜S204と同様な処理であるので、説明は繰返さない。したがってステップS305以降について説明をする。
ステップS304の次にステップS305へ進み、ステップS304で判定された分類項目に応じた適合化文字列が生成される。
次にステップS306へ進み、ステップS305で生成された適合化文字列が適合化の結果として表示部107にて表示される。
図17は、図44の文字列を認識し、分類項目判定部121で電話番号と判定された、ステップS306時点の表示例である。
図17の例では、分類項目が電話番号と判定されたことが表示され、再度適合化処理を行なうか否かの指示を求めている。続いてステップS307において分類項目が適切で無い場合には、分類項目を特定する入力が行なわれる。再度適合化を行なう分類項目を特定する場合、数字キーのうち、1から3までの数字キーを押下することにより分類項目を入力し特定する。数字1キーの押下が、URL、数字2キーがメール、数字3キーが電話番号の特定にあたる。判定された分類項目が適切であったときには、数字9キーの押下を行ない、分類項目の特定は行なわない。
ステップS307において、入力部108から分類項目特定部131に対して分類項目の特定が行なわれた場合、ステップS305へ戻る。ステップS305では、分類項目特定部131により特定された分類項目に応じた適合化文字列が生成される。その後、ステップS306で、分類項目特定部131により特定された分類項目に応じた適合化文字列が表示部107にて表示される。ここで正しい分類項目(メール)に対応する数字2のキーを押下すると、図18のように正しい分類項目による適合化文字列が表示される。
図18は、図44の文字列に対して再度適合化を行なった場合のステップS306時点の表示例である。
以上、ステップS305からステップS307までの処理は、ステップS307で分類項目の特定が行なわれる限り続く。
ステップS307で分類項目の特定がなかった場合、ステップS308へ進み、最後に生成された適合化文字列を本装置で選択して処理を終了する。
図18の例では、分類項目としてメールを選択した結果、正しい文字列が得られたので、現在表示されている適合化文字列を採用し処理を終了する場合、利用者は数字9のキーを押下する。これによりステップS308において結果が確定される。
実施の形態3は、実施の形態1および2と比較して、全ての分類項目に基づく結果を表示しないため、携帯電話など表示画面が小さい情報端末に適している。
また、分類項目判定の判定結果が正しく、分類項目特定による分類項目適合化処理を行なわない場合、分類項目適合化処理は判定された最初の分類項目に対応する1回である。したがって、分類項目判定手段の判定精度がよく、ほとんど分類項目特定処理を行なう必要がないならば、実施の形態2と比較して、多くの使用機会において、認識処理時間が短くなるという利点がある。
以上の構成により、実施の形態3の文字認識装置は、従来と変わらない認識処理時間で、分類項目判定結果に基づいた適合化文字列を生成することが可能であり、分類項目判定を誤った場合、適合化処理のみの短い時間で、利用者により特定された正しい分類項目に基づいた結果である適合化文字列を得ることが可能である。
なお、上述の実施の形態1から形態3までの説明では、分類項目をURL,メールアドレス、電話番号等としているが、他に氏名、住所、肩書き、などの項目も考えられ、また分類項目をどこの国の言語(英文、日本語文、欧州文)であるかを分類する項目としてもよい。
[実施の形態4]
実施の形態1〜3では、分類項目が、電話番号、URL、メールアドレスなどの場合の説明を行ったが、実施の形態4では、分類項目が言語(英語、フランス語、ドイツ語、オランダ語、ギリシャ語、日本語、韓国語、中国語等)である場合の説明を行なう。
図19は、実施の形態4の文字認識装置の構成を示すブロック図である。
図19を参照して、文字認識装置600は、図1に示した文字認識装置100の構成に加え、文字列修正入力部161を含む。文字認識装置600の他の部分の構成は、図1に示した文字認識装置100と同様であるので説明は繰返さない。
ここで、図19の文字列修正入力部161とは、文字列適合化部104で適合化された適合化認識文字列の誤りを修正入力するためのものであり、予め定められた複数の分類項目に対して、それぞれ対応する文字列修正処理のための手段を備える。すなわち、文字列修正部は、適合化文字列が選択された後、選択された適合化文字列に応じた分類項目に対応する文字列修正処理のための手段によって、選択された適合化文字列の修正入力処理を行なう。
図20は、実施の形態4の文字認識装置の動作を説明するためのフローチャートである。
図20のフローチャートは、図2のフローチャートのステップS106の後に、修正入力ステップであるS607が追加されたものである。
ステップS601〜ステップS605は図1のステップS101〜S105と同様の処理である。従って、ステップS604の分類項目の適合化処理と、ステップS607の修正入力処理の説明のみ行なう。
以下、ステップS604の分類項目の適合化処理を、図21のフローチャートを参照して説明する。
図22は、ステップS601で撮像された画像データであり、オランダ語の「ijzer」という単語である。
図23は、図22の画像データから認識処理によって生成された認識文字列の例であり、たとえば第1〜第4の文字候補をもつ。
図24は、予めテーブルに登録された分類項目の例である。
図24の例では、1番目の分類として英語が、2番目の分類としてオランダ語が、3番目の分類としてギリシャ語が登録されている。このような分類項目のテーブルが図19のデータメモリ112に保存されていることは、実施の形態1と同様である。
なお分類項目が上記3言語であることは説明を簡単にするための理由によるものであり、その他の欧州言語、日本語、中国語、韓国語、アラビア語等の言語を定めてもよく、これに限定されるものではない。
図25は、分類項目と認識文字列と修正によるその適合化候補のテーブルの例である。
また、図26は、予めテーブルに登録された分類項目に適した認識候補の例である。図25の適合化候補のテーブル、図26の分類項目に適した認識候補のテーブルも、実施の形態1と同様に、図160のデータメモリ112に保存されている。
再び図21を参照して、ステップS611で分類項目が決められる。以下、分類項目はオランダ語に決められたとする。ステップS611で分類項目が決められると、ステップS612に進む。ステップS612では文字列の修正処理が行われる。
実施の形態1では、最初に必要な対象文字コードのみで認識候補の生成、その後文字列修正の順であったが、実施の形態4では、ステップS612の文字列修正が最初に行われるものとする。
文字列の修正は、特定の言語にのみ存在する複数の文字(記号)を結合した形状の文字に関する修正する処理である。たとえば、オランダ語、ギリシャ語には、下記のように複数の文字(記号)を結合した言語特有の文字が存在する。
Figure 0004597644
これらの文字は、分類項目(言語)が不明な場合、下例のように2文字に誤る可能性がある。
Figure 0004597644
上述の誤りは、各分類項目に特有の適合化規則を登録しておき、この規則を参照することにより修正が可能である。
Figure 0004597644
この修正処理により、図23の認識文字列は、図27に示す認識文字列と修正される。
なお、上記の修正は、文字コードテーブルのみを参照した単純な置き換えではなく、文字ブロック間の距離等、文字のパターン辞書との距離(類似度)も含めて置き換えるか否かを判断するようにして、より修正の精度を高くする構成にすることも可能である。
Figure 0004597644
以上で図20のステップS604の分類項目の適合化処理の説明を終了する。
再び図20を参照して、次にステップS606にて、結果の選択が行われる。
ステップS606では、生成された適合化文字列に対応する分類項目が表示部107に並んで表示され、選択部106により表示されている分類項目のうちの1つの分類項目が入力部108よりユーザの指定に応じて選択される。
図29は、ステップS606での表示例である。図29に示すように、分類項目(言語)が表示部107に表示され、表示されている分類項目に対応した適合化文字列が入力部108によりユーザの指定により選択される。ここで選択された適合化文字列が修正入力処理後、本認識装置が採用する認識結果となる。
再び図20を参照して、次にステップS607にて、修正入力処理が行われる。
修正入力処理とは、ユーザが認識文字列の誤りを手入力にて修正する処理のことである。撮影条件が良好でない(たとえば、照度が低い環境、手ぶれ(カメラ撮影の場合)等)、あるいは、認識対象である画像文字列自体が特殊なフォント、コピーを繰り返し劣化したものである等の様々な理由により、適合化処理後の文字列も誤りがある可能性がある。このように現在の文字認識技術では、修正入力処理は必要不可欠な処理である。
修正入力処理においては、表示部107による(適合化後の)認識文字列、つまり適合化文字列の表示処理、ユーザが入力した文字を表示する処理、および/または入力部108による文字を入力する処理等が必要である。つまり、表示部107は、適合化文字列またはユーザが入力した文字列に応じた分類項目に対応する文字コード体系を用いた表示処理を行ない、入力部108は、適合化文字列に応じた分類項目に対応する、入力キーと入力文字との対応付けテーブルを用いた入力処理を行なう。
このように入力部108で、対応付けテーブルを用いた入力処理を行なうのは、対象言語が定まっている場合、特に携帯機器等の入力キーが限られている機器においては、言語別にキー入力操作と入力文字を対応づけるのが一般的であり、かつ実用的であるからである。具体的には、ステップS607において、分類項目(言語)に応じて入力部108のキー入力操作と入力文字の対応付けの切替が行われる。
以下、ステップS607の修正入力処理に関して、図30のフローチャートを用いて説明を行なう。
最初にステップS621にて、ステップS606で選択された分類項目(言語)に応じて入力キーと入力文字が対応付けされている対応付けテーブルの切替が行われる。
図31は、分類項目がオランダ語、ギリシャ語の場合のキー操作と入力文字の対応付けテーブルの一例である(英語のテーブルは省略している)。図31の例では、各文字は0から9までの各数字キーに対応づけられている。入力方法はいわゆるマルチタップ方式で、たとえばオランダ語の場合、「C」を入力するには2の数字キーを3回押す。この対応づけテーブルも、図19のデータメモリ112に保存されている。
ステップS621では、図31で示される対応付けテーブルが分類項目(言語)に応じて切替えられる。
次にステップS622では、文字列修正入力部161により修正処理が行われる。
図32は、ステップS622の修正処理の一例である、文字列修正入力部161による修正処理例を表す図である。なお、この例は修正処理を説明するための例であり、図28に示す適合化文字列とは、直接関連しない。
分類項目表示メニュー207は、実施の形態1と同じくユーザが選択した分類項目(言語)をユーザに報知するためのものであり、現在オランダ語(Dutch)が選択されていることが表示されている。
認識文字列ボックス210には、図22の画像文字列を読み取った結果の認識文字列が表示されている。ここでは、文字「z」を文字「2」と誤り、「ij2er」となったものとする。
文字「2」を「z」と修正するために、ユーザは最初に矢印キー204のうち左右のキーを操作して、入力/削除位置カーソル211を、削除するzの位置にあわせる。その後、削除キー212を押下して文字「2」を削除した後、数字9のキーを8回押下することにより正しい文字「z」を入力する(この入力操作は、図31の対応付けテーブルに基づいている。)。
以上、分類項目に応じた修正入力が可能な文字列修正入力部の説明を行ったが、前述したように、表示に関しても分類項目に応じた表示設定が行われることも十分可能である。
たとえば、分類項目(言語)が、日本語、中国語など漢字を含む言語の表示をUnicode(ユニコード)等の文字コード体系で統一的に扱うことも可能であるが、Unicodeを使用することによる問題も生じる。たとえば、UCS2(Unicodeの2バイトコード体系)の同じ意味・ルーツの漢字に同一コードを割り当て、UTF8(Unicodeの可変長変換方式)を用いた場合の処理量の増加等である。
したがって、言語に応じた文字コード体系を使うことが有効となる。その際に、分類項目(言語)が選択されているならば、表示処理についても分類項目に応じた表示処理を行なう(つまり、表示のために文字コード体系を切替える)ことにより(図34のステップS621とS622との間で行なう)、より負荷の少ない処理を行なうことが可能である。
すなわち、認識処理のときは、認識処理に適した文字コード体系を用いればよく、各言語の各文字に独自に適宜文字コードを割当てるようにすればよい。たとえば、英語、オランダ語、ドイツ語、フランス語、スペイン語、ギリシャ語のそれぞれの文字に重複がないように独自に文字コードを割当てておき、割当てた文字コード体系に基づいて認識処理を行ない、文字列適合化部104で割当てた文字コード体系に基づいて適合化文字列を出力する。
文字列修正入力部161は、英語、オランダ語、ドイツ語、フランス語、またはスペイン語を表示する場合には、認識処理で用いていた文字コード体系から表示部107にISO−8859−1の文字コード体系に切替えさせ、英語、ギリシャ語を表示する場合には、表示部107にISO−8859−7の文字コード体系に切替えさせるものとすればよい。表示部107は、文字列適合化部104などの他の構成要素から文字コードを受取ったときには、切替えられた文字コード体系にしたがって、受取った文字コードの文字を表示する。
以上、説明したように実施の形態4では、実施の形態1の利点に加えて更に、選択された分類項目に応じて分類項目に即した文字の入力/表示を行なう修正入力処理が可能である。このため、分類項目(言語)毎に文字体系を設定できることにより、分類項目全てを含んだ文字コード体系と比較して少ない処理容量で表示処理が可能であり、またユーザが修正入力処理が容易に行なうことができるという利点がある。
[実施の形態5]
図33は、実施の形態5の文字認識装置の構成を示すブロック図である。
図33を参照して、文字認識装置700は、図12に示した文字認識装置200の構成に加えて、文字列利用部171をさらに含む。
文字列利用部171は、文字列適合化部104にて出力された適合化文字列をユーザが利用するための手段であり、具体的には、メールの宛先や本文の編集機能を含むメール送受信部、または接続先の編集機能を含むWebサイト接続部等である。
図34は、実施の形態5の文字認識装置の動作を説明するためのフローチャートである。
図34のフローチャートのステップS701からステップS707までは、図13のステップS201からステップS207までと同様の処理である。従って、分類項目が言語である場合の分類項目判定(ステップS704)とステップS708、ステップS709の説明のみ行なう。
ステップS704では分類項目(言語)の判定が行われるが、判定の方法としては、言語特有の文字に注目する等の方法がある。たとえば分類項目(言語)が、英語、オランダ語、ギリシャ語のいずれかの場合、認識文字列中にΣという文字があればギリシャ語と判定できる。その他の方法として、各言語の単語辞書を具備し、各単語辞書について認識文字列が存在するか否かを調べ、単語辞書が文字列、または文字列内の単語を含んでいた場合、単語辞書に対応する言語が文字列の言語であるとして分類項目(言語)を判定することが可能である。
ステップS708では、文字列利用部171が選択した分類項目(言語)に対応したものに切替えられる。すなわち、選択した分類項目(言語)に応じて、表示部107では言語に応じた表示処理、入力部108では言語に応じた入力処理に切替えられる。これに関しては、実施の形態4と同様であるため、説明は省略する。
次にステップS709では、選択された言語に応じた文字列利用処理が行われる。
図35は、文字列利用処理の一例であるメール入力処理例である。
分類項目表示メニュー207が示すとおり分類項目(言語)はギリシャ語となっている。選択した分類項目(言語)に応じて表示部107では言語に応じた表示処理が行なわれる。すなわち、ステップS707で選択された適合化文字列は、メール本文領域222に挿入される仕組みとなっている。これにより、ユーザが文字を入力する労力が低減される。
ここで、実施の形態4と同様に、選択した分類項目(言語)に応じて入力部108では言語に応じた入力処理に切替えることにより、誤認識等の修正のため、数字キー205と削除キー212により、誤認識文字削除、新規文字入力を可能とすることは容易である。また、表示部107は、適合化文字列またはユーザが入力した文字列に応じた分類項目に対応する文字コード体系を用いた表示処理を行なう。
また、多言語ドメイン名にも対応するため、ステップS707で選択された適合化文字列が、メールアドレス領域221に挿入される仕組みとしてもよい。
以上、説明したように実施の形態5では、実施の形態1の利点に加えて更に、選択された分類項目に応じて分類項目に即した文字列の利用処理が可能である。このため、分類項目(言語)毎に文字体系を設定できることにより、分類項目全てを含んだ文字コード体系と比較して少ない処理容量で表示処理が可能であり、またユーザが適合化文字列を容易に利用することができるという利点がある。
[実施の形態6]
図36は、実施の形態6の文字認識装置の構成を示すブロック図である。
また、図37は、実施の形態6の文字認識装置の動作を説明するためのフローチャートである。
図36を参照して、文字認識装置800は、図15に示した実施の形態3の文字認識装置300の構成に加えて、文字列修正入力部161と文字列利用部171とをさらに含む。
図37のフローチャートは、図16のフローチャートのステップS308の後に、修正入力処理ステップS809と、文字列利用部の切替えステップS810と、文字列利用ステップS811とが追加されたものである。
図36の構成図、図37のフローチャートは、いずれも実施の形態3,4,5で説明済みの追加構成、追加ステップであるため、説明は繰返さない。
図38は、図37のステップS807時点の表示例である。図38では、ある画像文字列(図による説明は略)を認識し、分類項目表示メニュー207で表示されているとおり、分類項目(言語)の判定を英語と判定している。
もし分類項目判定が正しければ、ユーザは決定キー203を押下して次のステップS808へ進めばよい。もし分類項目が誤っていれば、ユーザは表示部107で表示されている言語に応じた数字キー205を押下して正しい分類項目を選択することができる(数字キー205で、1の数字キーを押下すると英語を選択、2の数字キーを押下するとオランダ語を選択、3の数字キーを押下するとギリシャ語を選択)。
ユーザが選択した言語に応じて文字認識装置800は、適合化処理を行なう。適合化処理に関しては実施の形態4にて説明を行っているので、説明は繰返さない。
以上、実施の形態6では、実施の形態3の利点に加えて更に、選択された分類項目に応じて分類項目に即した文字列の修正入力処理、文字列利用処理が可能である。このため、分類項目(言語)毎に文字体系を設定できることにより、分類項目全てを含んだ文字コード体系と比較して少ない処理容量で表示処理が可能であり、またユーザが修正入力処理が容易に行なうことができるという利点、及び、またユーザが適合化文字列を容易に利用することができるという利点がある。
[プログラムおよび記録媒体についての補足説明]
図1、図12、図15、図19、図33、図36においてそれぞれ制御部110、120、130として、上述のフローチャートの処理を実行するCPUを用いることができる。
図2のステップS101の撮像のステップは画像を入力する画像入力ステップであって、ステップS102は、入力された画像中の文字列を画像文字列として抽出する文字列抽出ステップであって、ステップS103は、画像文字列を認識して認識文字列を生成する文字列認識ステップであって、ステップS104は、認識文字列に対して複数の分類項目に応じた所定の適合化処理を複数の分類項目ごとに施し、適合化文字列を生成する文字列適合化ステップであって、ステップS106は適合化文字列を選択するステップである。したがって、これら各ステップをコンピュータに実行させるプログラムは構成可能である。
図16のステップS301の撮像のステップは画像を入力する画像入力ステップであって、ステップS302は入力された画像中の文字列を画像文字列として抽出する文字列抽出ステップであって、ステップS303は画像文字列を認識して認識文字列を生成する文字列認識ステップであって、ステップS304は認識文字列を用いて画像文字列を所定の分類の属性に基づいて、ひとつの分類項目として判定する分類項目判定ステップであり、ステップS305は認識文字列に対して分類項目に応じた所定の適合化処理を施し、適合化文字列を生成する文字列適合化ステップとであって、ステップS307は認識文字列を、所定の分類のひとつの分類項目として、一意的に特定する分類項目特定ステップである。したがって、これら各ステップをコンピュータに実行させるプログラムは構成可能である。
図39は、プログラムを読込むことが可能な文字認識装置の構成を示したブロック図である。
図39を参照して、文字認識装置400は、図15に示した文字認識装置300の構成に加えて、通信インタフェース部141と、記録媒体143を取付けることができる記録媒体インタフェース部142とをさらに含む。
他の構成として、図示は省略するが、実施の形態1で説明した図1、実施の形態2で説明した図12、実施の形態4で説明した図19、実施の形態5で説明した図33、実施の形態6で説明した図36に対して、各文字認識装置の構成に加えて、通信インタフェース部141と、記録媒体143を取付けることができる記録媒体インタフェース部142とをさらに含むことも可能である。
図40は本発明の実施形態の各処理ステップを実行させるプログラムがコンピュータに可読可能な状況で装置に装着される事を示す図である。
図40を参照して、文字認識装置400には、通信先208から無線または有線の各種通信回線を介してプログラムが受信される。たとえば、これにより文字認識装置としての携帯電話などの端末に新たなプログラムを実行可能な形式で格納することができる。
記録媒体143はプログラムが格納されている記録媒体であって、各種ICメモリや磁気媒体やCD−ROMなど想定される。
このように、本発明の実施形態のプログラムは、通信回線を介しても提供可能であり、また、各種記録媒体でも提供可能である。プログラムを通信手段や記録媒体で供給すれば、プログラムのバージョンアップを後から行なうことにより使用者が同じハードウエアを使用ながら一層快適に操作することが可能となる。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
実施の形態1の文字認識装置の構成を示すブロック図である。 実施の形態1の文字認識装置の動作を説明するためのフローチャートである。 認識対象被写体の一例を示した図である。 図3の認識対象被写体を撮像した表示例の図である。 認識文字列の例を示した図である。 図2のステップS104の詳細を示したフローチャートである。 予めテーブルに登録された分類項目の例を示す図である。 予めテーブルに登録された分類項目に適した認識候補の例を示す図である。 電話番号として適合化された文字列を示した図である。 分類項目と認識文字列と修正によるその適合化候補のテーブルの例を示す図である。 この実施の形態1のステップS106での表示例、及び、この実施の形態2のステップS207での表示例を示す図である。 実施の形態2の文字認識装置の構成を示すブロック図である。 実施の形態2の文字認識装置の動作を説明するためのフローチャートである。 実施の形態2の他の画面表示の例を示す図である。 実施の形態3の文字認識装置の構成を示すブロック図である。 実施の形態3の文字認識装置の動作を説明するためのフローチャートである。 図44の文字列を認識し、分類項目判定部121で電話番号と判定された、ステップS306時点の表示例を示す図である。 図44の文字列に対して再度適合化を行なった場合のステップS306時点の表示例を示す図である。 実施の形態4の文字認識装置の構成を示すブロック図である。 実施の形態4の文字認識装置の動作を説明するためのフローチャートである。 図20のステップS604の詳細を示したフローチャートである。 図20のステップS601で撮像された画像データを表わす図である。 図22の画像データから認識処理によって生成された認識文字列の例を表わす図である。 予めテーブルに登録された分類項目の例を示す図である。 分類項目と認識文字列と修正によるその適合化候補のテーブルの例を示す図である。 予めテーブルに登録された分類項目に適した認識候補の例を示す図である。 図23の認識文字列が修正された例を示す図である。 図27の修正後の文字列が適合化された適合化文字列を示す図である。 図20のステップS606での表示例を表わす図である。 図20のステップS607の修正入力処理の詳細を示したフローチャートである。 分類項目がオランダ語、ギリシャ語の場合のキー操作と入力文字の対応付けテーブルの一例を表わす図である。 ステップS622の修正処理の一例である、文字列修正入力部161による修正処理例を表す図である。 実施の形態5の文字認識装置の構成を示すブロック図である。 実施の形態5の文字認識装置の動作を説明するためのフローチャートである。 文字列利用処理の一例であるメール入力処理例を表わす図である。 実施の形態6の文字認識装置の構成を示すブロック図である。 実施の形態6の文字認識装置の動作を説明するためのフローチャートである。 図37のステップS807時点の表示例を表わす図である。 プログラムを読込むことが可能な文字認識装置の構成を示したブロック図である。 本発明の実施形態の各処理ステップを実行させるプログラムがコンピュータに可読可能な状況で装置に装着される事を示す図である。 カメラ付き携帯電話で文字認識を行なわせる文字列の第1例を示す図である。 カメラ付き携帯電話で文字認識を行なわせる文字列の第2例を示す図である。 従来の文字認識装置の動作を説明するためのフローチャートである。 文字認識させる対象の入力画像の一例を示した図である。 従来の文字認識装置の出力結果を示した図である。
符号の説明
100,200,300,400,600,700,800 文字認識装置、101 画像撮像部、102 文字列抽出部、103 文字列認識部、104 文字列適合化部、106 選択部、107 表示部、108 入力部、110,120,130 制御部、111 画像保存メモリ、112 メモリ、121 分類項目判定部、131 分類項目特定部、141 通信インタフェース部、142 記録媒体インタフェース部、143 記録媒体、161 文字列修正入力部、171 文字列利用部、203 決定キー、204 矢印キー(上下左右)、205 数字キー、206 分類項目位置表示カーソル、207 分類項目表示メニュー、208 通信先、210 認識文字列ボックス、211 入力/削除位置カーソル、212 削除キー、221 メールアドレス領域、222 メール本文領域。

Claims (15)

  1. 画像を撮像画像として撮像する画像撮像手段と、
    前記撮像画像の文字列部分を画像文字列として抽出する文字列抽出手段と、
    前記画像文字列に対して文字認識を行ない、認識文字列を生成する文字列認識手段と、
    前記認識文字列に対して、文字列の分類を表す予め定められた分類項目の内、予め設定された複数の分類項目の全てに対して各分類項目に応じて、不要な文字列の削除および誤りのある文字列の削除を行なうことにより適合化処理を施し、前記複数の分類項目それぞれに対応した適合化文字列を生成する適合化文字列生成手段と、
    複数の生成された前記適合化文字列のひとつを選択する選択方法、或いは、前記適合化文字列に対応する複数の分類項目のひとつを選択する選択方法の内、少なくともひとつの選択方法で選択を行う選択手段とを備え
    前記各分類項目に分類される文字列が含むことができる対象文字と、含むことができない除外文字とが定められている、文字認識装置。
  2. 前記複数の生成された前記適合化文字列を表示する表示方法、或いは前記適合化文字列に対応する複数の分類項目を表示する表示方法の内、少なくともひとつの表示方法で表示する表示手段と、
    前記選択手段においてなされる選択がいずれの選択であるかの指示を入力する入力手段とをさらに備える、請求項1に記載の文字認識装置。
  3. 前記認識文字列が前記複数の分類項目のいずれの属性に適合しているかにより前記認識文字列が、前記複数の分類項目の各々のいずれの分類項目であるかを判定する分類項目判定手段をさらに備え、
    前記選択手段における選択は、前記判定された分類項目或いは、判定された分類項目に対応する生成された適合化文字列をもってなされることを特徴とする請求項1に記載の文字認識装置。
  4. 前記予め定められた複数の分類項目に対して、それぞれ対応する文字列修正処理のための手段を備える文字列修正部をさらに備え、
    前記文字列修正部は、適合化文字列が選択された後、前記選択された適合化文字列に応じた分類項目に対応する文字列修正処理のための手段によって、前記選択された適合化文字列の修正入力処理を行なう、請求項に記載の文字認識装置。
  5. 前記適合化文字列の修正入力処理は、
    前記表示手段での前記選択された適合化文字列に応じた分類項目に対応する文字コード体系を用いた表示処理、あるいは前記入力手段での前記選択された適合化文字列に応じた分類項目に対応する、入力キーと入力文字との対応付けテーブルを用いた入力処理のうち、少なくともいずれか一方を含む、請求項4に記載の文字認識装置。
  6. 前記予め定められた複数の分類項目を表示する表示手段と、
    記選択手段に対し、いずれの分類項目を選択するかの指示を入力する入力手段と、
    前記選択手段により選択された前記適合化文字列を出力する文字列出力手段と、
    前記予め定められた複数の分類項目に対して、それぞれ対応する文字列利用処理のための手段を備える文字列利用部とをさらに備え、
    前記文字利用部は、適合化文字列が選択された後、前記選択された適合化文字列に応じた分類項目に対応する文字列利用処理のための手段によって、前記選択された適合化文字列の利用処理を行なう、請求項1に記載の文字認識装置。
  7. 前記適合化文字列の利用処理は、
    前記表示手段での前記選択された適合化文字列に応じた分類項目に対応する文字コード体系を用いた表示処理、あるいは前記入力手段での前記選択された適合化文字列に応じた分類項目に対応する、入力キーと入力文字との対応付けテーブルを用いた入力処理のうち、少なくともいずれか一方を含む、請求項6に記載の文字認識装置。
  8. 画像を撮像画像として撮像する画像撮像手段と、
    前記撮像画像の文字列部分を画像文字列として抽出する文字列抽出手段と、
    前記画像文字列に対して文字認識を行ない、認識文字列を生成する文字列認識手段と、
    前記認識文字列が、予め設定された複数の分類項目のいずれの属性に適合しているかにより、前記認識文字列が、前記複数の分類項目の各々のいずれの分類項目であるかを判定する分類項目判定手段と、
    外部から与えられる分類項目指定情報に応じて前記複数の分類項目のうちの1つを特定する分類項目特定手段と、
    前記認識文字列に対して、前記分類項目判定手段により判定がなされた前記分類項目に応じて、不要な文字列の削除および誤りのある文字列の削除を行なうことにより適合化処理を施して適合化文字列を生成し、前記分類項目指定情報が与えられたときには前記分類項目特定手段で特定された分類項目に応じて再度前記適合化処理を施して適合化文字列を生成する文字列適合化手段とを備え
    前記各分類項目に分類される文字列が含むことができる対象文字と、含むことができない除外文字とが定められている、文字認識装置。
  9. 前記予め定められた複数の分類項目に対して、それぞれ対応する文字列修正処理のための手段を備える文字列修正部をさらに備え、
    前記文字列修正部は、前記分類項目が判定または特定された後、判定または特定された分類項目に対応する文字列修正処理のための手段によって、前記生成された適合化文字列の修正入力処理を行なう、請求項8に記載の文字認識装置。
  10. 前記適合化文字列の修正入力処理は、
    示手段での前記生成された適合化文字列に応じた分類項目に対応する文字コード体系を用いた表示処理、あるいは入力手段での前記選択された適合化文字列に応じた分類項目に対応する、入力キーと入力文字との対応付けテーブルを用いた入力処理のうち、少なくともいずれか一方を含む、請求項9に記載の文字認識装置。
  11. 適合化文字列を出力する文字列出力手段と、
    前記予め定められた複数の分類項目に対して、それぞれ対応する文字列利用処理のための手段を備える文字列利用部とをさらに備え、
    前記文字利用部は、前記分類項目が判定または特定された後、判定または特定された分類項目に対応する文字列利用処理のための手段によって、前記生成された適合化文字列の利用処理を行なう、請求項8に記載の文字認識装置。
  12. 前記適合化文字列の利用処理は、
    示手段での前記生成された適合化文字列に応じた分類項目に対応する文字コード体系を用いた表示処理、あるいは入力手段での前記生成された適合化文字列に応じた分類項目に対応する、入力キーと入力文字との対応付けテーブルを用いた入力処理のうち、少なくともいずれか一方を含む、請求項11に記載の文字認識装置。
  13. 画像を入力する画像入力ステップと、
    入力された前記画像の文字列部分を画像文字列として抽出する文字列抽出ステップと、
    前記画像文字列に対して文字認識を行ない、認識文字列を生成する文字列認識ステップと、
    前記認識文字列に対して、文字列の分類を表す予め定められた分類項目の内、予め設定された複数の分類項目の全てに対して各分類項目に応じて、不要な文字列の削除および誤りのある文字列の削除を行なうことにより適合化処理を施し、前記複数の分類項目それぞれに対応した適合化文字列を生成する適合化文字列生成ステップと、
    複数の生成された前記適合化文字列のひとつを選択する選択方法、或いは、前記適合化文字列に対応する複数の分類項目のひとつを選択する選択方法の内、少なくともひとつの選択方法で選択するステップとをコンピュータに実行させ
    前記各分類項目に分類される文字列が含むことができる対象文字と、含むことができない除外文字とが定められている、プログラム。
  14. 画像を入力する画像入力ステップと、
    入力された前記画像の文字列部分を画像文字列として抽出する文字列抽出ステップと、
    前記画像文字列に対して文字認識を行ない、認識文字列を生成する文字列認識ステップと、
    前記認識文字列が、予め定められた複数の分類項目のいずれの属性に適合しているかにより、前記認識文字列が、前記複数の分類項目の各々のいずれの分類項目であるかを判定する分類項目判定ステップと、
    外部から与えられる分類項目指定情報に応じて前記複数の分類項目のうちの1つを特定する分類項目特定ステップと、
    前記認識文字列に対して、前記分類項目判定ステップにより判定がなされた前記分類項目に応じて、不要な文字列の削除および誤りのある文字列の削除を行なうことにより適合化処理を施して適合化文字列を生成し、前記分類項目指定情報が与えられたときには前記分類項目特定ステップで特定された分類項目に応じて再度前記適合化処理を施して適合化文字列を生成する文字列適合化ステップとをコンピュータに実行させ、
    前記各分類項目に分類される文字列が含むことができる対象文字と、含むことができない除外文字とが定められている、プログラム。
  15. 請求項13または14に記載したプログラムを記録したコンピュータ読取可能な記録媒体。
JP2004340559A 2003-11-28 2004-11-25 文字認識装置、プログラムおよび記録媒体 Expired - Fee Related JP4597644B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004340559A JP4597644B2 (ja) 2003-11-28 2004-11-25 文字認識装置、プログラムおよび記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003399616 2003-11-28
JP2004340559A JP4597644B2 (ja) 2003-11-28 2004-11-25 文字認識装置、プログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2005182772A JP2005182772A (ja) 2005-07-07
JP4597644B2 true JP4597644B2 (ja) 2010-12-15

Family

ID=34797402

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004340559A Expired - Fee Related JP4597644B2 (ja) 2003-11-28 2004-11-25 文字認識装置、プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP4597644B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7826665B2 (en) * 2005-12-12 2010-11-02 Xerox Corporation Personal information retrieval using knowledge bases for optical character recognition correction
JP2007206985A (ja) * 2006-02-01 2007-08-16 Sharp Corp 文字列抽出装置、文字列抽出方法、そのプログラムおよび記録媒体
JP4800144B2 (ja) * 2006-08-08 2011-10-26 シャープ株式会社 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体
WO2009028555A1 (ja) * 2007-08-30 2009-03-05 Nec Corporation 電子機器、文字列の表示方法、複数文字列のソート方法、および文字列表示/ソートプログラム
JP5239419B2 (ja) * 2008-03-14 2013-07-17 オムロン株式会社 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造
JP2010217996A (ja) * 2009-03-13 2010-09-30 Omron Corp 文字認識装置、文字認識プログラム、および文字認識方法
WO2012144006A1 (ja) * 2011-04-18 2012-10-26 キヤノン株式会社 データ処理装置、データ処理装置の制御方法、及びプログラム
KR101377601B1 (ko) 2012-09-20 2014-03-25 주식회사 인지소프트 모바일 카메라를 이용한 자연 영상 다국어 문자 인식과 번역 시스템 및 방법
JP2020027598A (ja) * 2018-12-27 2020-02-20 株式会社シグマクシス 文字認識装置、文字認識方法及び文字認識プログラム
JP7271987B2 (ja) * 2019-02-14 2023-05-12 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000222522A (ja) * 1999-02-04 2000-08-11 Matsushita Electric Ind Co Ltd 認識処理装置
JP2001147990A (ja) * 1999-11-24 2001-05-29 Sharp Corp 画像データ処理装置及び方法並びにこれに利用される記憶媒体
JP2001209368A (ja) * 2000-01-25 2001-08-03 Nec Office Systems Ltd メッセージ表示装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0477887A (ja) * 1990-07-16 1992-03-11 Seiko Epson Corp 文字認識装置
JP3375766B2 (ja) * 1994-12-27 2003-02-10 松下電器産業株式会社 文字認識装置
JP3727422B2 (ja) * 1996-09-03 2005-12-14 松下電器産業株式会社 文字認識装置及びその方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000222522A (ja) * 1999-02-04 2000-08-11 Matsushita Electric Ind Co Ltd 認識処理装置
JP2001147990A (ja) * 1999-11-24 2001-05-29 Sharp Corp 画像データ処理装置及び方法並びにこれに利用される記憶媒体
JP2001209368A (ja) * 2000-01-25 2001-08-03 Nec Office Systems Ltd メッセージ表示装置

Also Published As

Publication number Publication date
JP2005182772A (ja) 2005-07-07

Similar Documents

Publication Publication Date Title
EP2383970B1 (en) Camera based method for text input and keyword detection
US7623742B2 (en) Method for processing document image captured by camera
JP2713622B2 (ja) 表形式文書読取装置
KR101078086B1 (ko) 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법
KR20100007722A (ko) 카메라 기반 영상의 문자 인식 및 번역 방법
US20050268231A1 (en) Method and device for inputting Chinese phrases
US7277584B2 (en) Form recognition system, form recognition method, program and storage medium
KR20100120753A (ko) 문자인식을 위한 이미지 센서 및 이미지 센싱 방법
JP4597644B2 (ja) 文字認識装置、プログラムおよび記録媒体
EP2806336A1 (en) Text prediction in a text input associated with an image
JP4991407B2 (ja) 情報処理装置、その制御プログラムおよび該制御プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに制御方法
US20020184028A1 (en) Text to speech synthesizer
JP2006209599A (ja) 携帯端末、文字読取方法および文字読取プログラム
WO2013177240A1 (en) Textual information extraction method using multiple images
CN101533476B (zh) 字符识别电子元件、装置及其方法
JP4576211B2 (ja) 文書情報検索システム
JP4800144B2 (ja) 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体
JP4474231B2 (ja) 文書リンク情報取得システム
JPH10171920A (ja) 文字認識装置、その文字認識方法およびその記録媒体
JP4677750B2 (ja) 文書属性取得方法および装置並びにプログラムを記録した記録媒体
JP2005044052A (ja) 携帯型文字認識装置
JP2001094711A (ja) ドキュメント画像処理装置及びドキュメント画像処理方法
JP5018601B2 (ja) 受信文書の言語判別方法及び受信文書翻訳システム並びにその制御プログラム
JP2002117373A (ja) アドレス自動入力装置及びその方法、並びに通信端末装置
JP2009110204A (ja) 文書処理装置、文書処理システム、文書処理方法及び文書処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070302

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100914

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100922

R150 Certificate of patent or registration of utility model

Ref document number: 4597644

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131001

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees