JP4597644B2

JP4597644B2 - 文字認識装置、プログラムおよび記録媒体

Info

Publication number: JP4597644B2
Application number: JP2004340559A
Authority: JP
Inventors: 和宏竹原; 康司石塚; 哲鈴木; 充宏斗谷
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2003-11-28
Filing date: 2004-11-25
Publication date: 2010-12-15
Anticipated expiration: 2024-11-25
Also published as: JP2005182772A

Description

この発明は、文字認識装置、及び、文字認識処理をコンピュータに実行させるプログラム、及び、同プログラムを記録する記録媒体に関する。

現在、光学式文字読取（ＯＣＲ : Optical Character Reader）技術は、文書読取装置、帳票読取装置などのいろいろな文字読取装置として実現され、利用されている。その中には、名刺読取装置のように名刺に記載された氏名、住所、会社名など各々の文字列の項目（以下、これを分類項目と呼ぶ）が何であるかを分類する装置も多く存在する。

この分類項目の判定技術については様々な手法が存在するが、たとえば、特開平１０−１８７８８５号公報（特許文献１）に、郵便番号、TEL等の記号(文字列)により判定、判定結果に応じた文字認識についての手法が記載されている。

一方、ＯＣＲは、近年小型化が進み、ＯＣＲ機能が搭載された、カメラで読取対象を撮影し認識を行なうカメラ付き携帯電話も発売されている。

図４１、図４２は、このようなカメラ付き携帯電話で文字認識を行なわせる文字列の例である。このような画像を撮影して、簡単にそのＵＲＬ(uniform resource locator)から対象のWebにアクセスできるようになれば、ＯＣＲ機能付携帯電話は、今後一層普及するものと思われる。
特開平１０-１８７８８５号公報

名刺等に記載されたＵＲＬ(uniform resource locator)、メールアドレス、電話番号を認識し、電話、メール発信、Webへのアクセスに利用する場合、分類項目の判定機能がないＯＣＲでは、対象がどの分類項目にあたるかを利用者が一々指定しなければならない。この作業は利用者にとって負担であるため、名刺等の対象を認識することを目的としたＯＣＲは項目判定機能が付加されていることが望ましい。

しかしながら、現在の項目判定機能付きＯＣＲは判定した分類項目に適した形で認識結果を出力するが、現在の項目判定技術は完全ではないため、分類項目の判定が誤った場合、かえって認識結果の修正労力が増加してしまうという場合があるという問題が存在する。

図４３は、従来の文字認識装置の動作を説明するためのフローチャートである。

図４３を参照して、最初にステップＳ５０１において、被写体が撮像される。次に、ステップＳ５０２において、撮像画像から文字列が抽出され、ステップＳ５０３において、文字列の認識が行なわれる。

そしてステップＳ５０４にて、その文字列がＵＲＬ、メールアドレス、電話番号など何であるかを抽出された文字列の構成から判断して、分類項目が決定される。続いてステップＳ５０５では、ステップＳ５０４にて決定された分類項目での文字列適合化処理が行なわれる（適合化処理に付いては、後述する）。

そして、適合化した文字列がステップＳ５０６にて表示され、ステップＳ５０７にてその結果を採用するか否かの判断が行なわれる。表示を見た使用者が、表示された結果を採用する場合には処理は終了となる。一方、表示を見た使用者が、結果を採用しない場合には、再度ステップＳ５０１に戻り撮像から認識作業を始める。採用の有無の指示は、入力手段のボタンの操作等によって文字認識装置に与えられる。

しかしながら、先に述べたように、従来の項目判定機能付きＯＣＲの判定は、完全ではない。このため、分類項目の判定が誤った場合、かえって認識結果の修正労力が増加してしまうという問題が存在する。

この問題をより具体的に説明する。

図４４は、文字認識させる対象の入力画像の一例を示した図である。

たとえば、入力画像が、図４４で図示しているような「0123-45-6789@kaisya.co.jp」という文字列であった場合に、正しい分類項目はメールアドレスである。しかし、＠の左側が電話番号に似た数字列であるため、誤って電話番号と判定されることが有り得る。

電話番号と判定された場合には、一般の項目判定機能付きＯＣＲでは、電話番号に適合するように出力が行なわれる。

図４５は、従来の文字認識装置の出力結果を示した図である。

図４５を参照して、文字認識装置５０１は、表示部５０７に図示しない撮像手段で撮像した画像の文字認識結果が表示するものである。認識結果は、図４５の表示部５０７に示すように電話番号として適合化され「0123-45-6789」となる。この認識結果を編集して修正する場合には、＠以降の文字を数字キー２０５を用いて手入力しなければならないため、利用者にとって大きな負担である。このため項目判定誤りによる適合化の失敗を回避する方法が必要となってくる。

この問題を回避する方法として、従来は、分類項目を再度指定し文字認識を行なわせる、いわゆる再読取の方法が行なわれている。しかしながら、一つの文字列について再読取を行なうと、その一つの文字列にかかった処理時間は、概算でおよそ２倍程度になることが予想される。この再読取による処理時間の増加は、携帯電話などの処理能力があまり高くない携帯情報端末では、利用者にとって大きな負担となる。

以下、携帯電話などの小型情報端末においては、認識処理時間の増加は、避けなければならない大きな問題であることを述べる。

近年、携帯電話などの小型情報端末も、ＣＰＵ（Central Processing Unit）の高速化に伴って処理速度が向上しているが、ＰＣ（パーソナルコンピュータ）と比較した場合、処理速度の差は大きい。

ＰＣと携帯電話機用デバッグボードでＯＣＲの処理速度を本願発明者が実際に比較した実験の結果を示してこれを説明する。

比較対照プラットフォームとしては、パーソナルコンピュータ(Pentium(登録商標)III搭載)を用意し、処理時間を携帯電話機開発用ボード（モックアップ）と比較した。実験に使用したＯＣＲプログラムは、本願出願人が開発した英文ＯＣＲプログラムである。そして、認識対象画像は図４１に示したような「http://www.kaisya.co.jp/index.html」と１行、３３文字が書かれた画像(１枚)である。

認識時間は、携帯電話機開発用ボードは認識時間1.6秒(速度20.6cps)であったのに対し、パーソナルコンピュータ(Pentium(登録商標)III搭載)では、認識時間は0.1秒（速度330cps）であった。

携帯電話機開発用ボード上での速度は、実際の携帯電話上での速度とほぼ同じであり、上記の実験の結果から、３３文字の文字を認識するのに、パーソナルコンピュータ(Pentium(登録商標)III搭載)だと、ほぼ瞬時（0.1秒）で認識が終了するが、携帯電話の場合、1.6秒待たなければならないことがわかる。

認識対象の文字列がより長い場合、携帯電話ＯＣＲでは、さらに認識時間がかかり、利用者はいっそう待たされることになる。たとえば、図４２は、７３文字のＵＲＬであるが、このＵＲＬを認識した場合、上記実験の結果（PC 330cps, 携帯電話20.6cps）から、携帯電話では、3.5秒かかる。（PCでは、0.2秒）。

以上、１行の英字で書かれた対象の認識実験結果、例を挙げたが、その他にも、英文名刺全体を認識することも考えられる。英文名刺では、１００文字以上が記載されていることも多く、上記の例よりさらに認識時間がかかることになる（上記実験結果から、携帯電話では、１００文字の認識には、約4.9秒かかる）。

一般に文字認識装置では、認識時間の大半は、標準パターン辞書との照合（マッチング）の時間であり、出願人開発の上記英文ＯＣＲでは、認識にかかる処理時間のうち、約８０％が、マッチングの処理時間である。従って、携帯電話に搭載されたＯＣＲの場合、利用者の認識待ち時間をできるだけ少なくするために、マッチングにかかる時間を減らす必要がある。

従来、マッチングの処理時間を減らす方法として、大分類による高速化手法などといったマッチング処理自体を速くする方法などがあるが、飛躍的な向上が望めるものではなかった。また、速度向上のため認識精度の低下といった問題が発生し、処理時間の削減問題の解決には適さない。

以上のように、携帯電話などの携帯情報端末では、ＰＣと比較して演算処理能力が低いため、利用者の認識待ち時間が利用者にとって大きな負担となることがある。従来行なわれている再読取の方法で、一つの文字列について再読取を行なうと、その一つの文字列にかかった処理時間は、概算でおよそ２倍程度になることが予想される。この再読取による処理時間の増加は、携帯電話などの携帯情報端末では、利用者にとって結果が表示されるのを長く待つという事は、はなはだ苦痛となる。

本発明は、上記問題点を解決するためになされたものであり、発明の目的は、処理能力が比較的低い場合でも利用者が求める的確な結果を得る文字認識装置を提供することである。

この発明は、要約すると、文字認識装置であって、画像を撮像画像として撮像する画像撮像手段と、撮像画像の文字列部分を画像文字列として抽出する文字列抽出手段と、画像文字列に対して文字認識を行ない、認識文字列を生成する文字列認識手段と、認識文字列に対して、文字列の分類を表す予め定められた分類項目の内、予め設定された複数の分類項目の全てに対して各分類項目に応じた適合化処理を施し、複数の分類項目それぞれに対応した適合化文字列を生成する適合化文字列生成手段と、複数の生成された適合化文字列のひとつを選択する選択方法、或いは、適合化文字列に対応する複数の分類項目のひとつを選択する選択方法の内、少なくともひとつの選択方法で選択を行なう選択手段を備える。

好ましくは、文字認識装置は、複数の生成された適合化文字列を表示する表示方法、或いは適合化文字列に対応する複数の分類項目表示する表示方法の内、少なくともひとつの表示方法で表示する表示手段と、選択手段においてなされる選択がいずれの選択であるかの指示を入力する入力手段とをさらに備える。

好ましくは、文字認識装置は、認識文字列が複数の分類項目のいずれの属性に適合しているかにより認識文字列が、複数の分類項目のいずれの分類項目であるかを判定する分類項目判定手段とをさらに備え、選択手段における選択は、判定された分類項目或いは、判定された分類項目に対応する生成された適合化文字列をもってなされることを特徴とする。

好ましくは、予め定められた複数の分類項目に対して、それぞれ対応する文字列修正処理のための手段を備える文字列修正部をさらに備え、文字列修正部は、適合化文字列が選択された後、選択された適合化文字列に応じた分類項目に対応する文字列修正処理のための手段によって、選択された適合化文字列の修正入力処理を行なう。

好ましくは、適合化文字列の修正入力処理は、表示手段での選択された適合化文字列に応じた分類項目に対応する文字コード体系を用いた表示処理、あるいは入力手段での選択された適合化文字列に応じた分類項目に対応する、入力キーと入力文字との対応付けテーブルを用いた入力処理のうち、少なくともいずれか一方を含む。

好ましくは、予め定められた複数の分類項目を表示する表示手段と、入力手段と選択手段に対し、いずれの分類項目を選択するかの指示を入力する入力手段と、選択手段により選択された適合化文字列を出力する文字列出力手段と、予め定められた複数の分類項目に対して、それぞれ対応する文字列利用処理のための手段を備える文字列利用部とをさらに備え、文字利用部は、適合化文字列が選択された後、選択された適合化文字列に応じた分類項目に対応する文字列利用処理のための手段によって、選択された適合化文字列の利用処理を行なう。

好ましくは、適合化文字列の利用処理は、表示手段での選択された適合化文字列に応じた分類項目に対応する文字コード体系を用いた表示処理、あるいは入力手段での選択された適合化文字列に応じた分類項目に対応する、入力キーと入力文字との対応付けテーブルを用いた入力処理のうち、少なくともいずれか一方を含む。

この発明の他の局面に従うと、文字認識装置であって、画像を撮像画像として撮像する画像撮像手段と、撮像画像の文字列部分を画像文字列として抽出する文字列抽出手段と、画像文字列に対して文字認識を行ない、認識文字列を生成する文字列認識手段と、認識文字列が、予め定められた複数の分類項目のいずれの属性に適合しているかにより、認識文字列が、複数の分類項目の各々のいずれの分類項目であるかを判定する分類項目判定手段と、外部から与えられる分類項目指定情報に応じて複数の分類項目のうちの１つを特定する分類項目特定手段と、認識文字列に対して、分類項目判定手段により判定がなされた分類項目に応じた適合化処理を施して適合化文字列を生成し、分類項目指定情報が与えられたときには分類項目特定手段で特定された分類項目に応じて再度適合化処理を施して適合化文字列を生成する文字列適合化手段とを備える。

好ましくは、予め定められた複数の分類項目に対して、それぞれ対応する文字列修正処理のための手段を備える文字列修正部をさらに備え、文字列修正部は、分類項目が判定または特定された後、判定または特定された分類項目に対応する文字列修正処理のための手段によって、生成された適合化文字列の修正入力処理を行なう。

好ましくは、適合化文字列の修正入力処理は、表示手段での生成された適合化文字列に応じた分類項目に対応する文字コード体系を用いた表示処理、あるいは入力手段での選択された適合化文字列に応じた分類項目に対応する、入力キーと入力文字との対応付けテーブルを用いた入力処理のうち、少なくともいずれか一方を含む。

好ましくは、適合化文字列を出力する文字列出力手段と、予め定められた複数の分類項目に対して、それぞれ対応する文字列利用処理のための手段を備える文字列利用部とをさらに備え、文字利用部は、分類項目が判定または特定された後、判定または特定された分類項目に対応する文字列利用処理のための手段によって、生成された適合化文字列の利用処理を行なう。

好ましくは、適合化文字列の利用処理は、表示手段での生成された適合化文字列に応じた分類項目に対応する文字コード体系を用いた表示処理、あるいは入力手段での生成された適合化文字列に応じた分類項目に対応する、入力キーと入力文字との対応付けテーブルを用いた入力処理のうち、少なくともいずれか一方を含む。

この発明のさらに他の局面に従うと、プログラムであって、画像を入力する画像入力ステップと、入力された画像の文字列部分を画像文字列として抽出する文字列抽出ステップと、画像文字列に対して文字認識を行ない、認識文字列を生成する文字列認識ステップと、認識文字列に対して、文字列の分類を表す予め定められた分類項目の内、予め設定された複数の分類項目の全てに対して各分類項目に応じた適合化処理を施し、複数の分類項目それぞれに対応した適合化文字列を生成する適合化文字列生成ステップと、複数の生成された適合化文字列のひとつを選択する選択方法、或いは、適合化文字列に対応する複数の分類項目のひとつを選択する選択方法の内、少なくともひとつの選択方法で選択するステップとをコンピュータに実行させる。

この発明のさらに他の局面に従うと、プログラムであって、画像を入力する画像入力ステップと、入力された画像の文字列部分を画像文字列として抽出する文字列抽出ステップと、画像文字列に対して文字認識を行ない、認識文字列を生成する文字列認識ステップと、認識文字列が、予め定められた複数の分類項目のいずれの属性に適合しているかにより、認識文字列が複数の分類項目の各々のいずれの分類項目であるかを判定する分類項目判定ステップと、外部から与えられる分類項目指定情報に応じて複数の分類項目のうちの１つを特定する分類項目特定ステップと、認識文字列に対して、分類項目判定ステップにより判定がなされた分類項目に応じた適合化処理を施して適合化文字列を生成し、分類項目指定情報が与えられたときには分類項目特定ステップで特定された分類項目に応じて再度適合化処理を施して適合化文字列を生成する文字列適合化ステップとをコンピュータに実行させる。

この発明のさらに他の局面に従うと、上記のプログラムを記録したコンピュータ読取可能な記録媒体である。

本発明によれば、認識処理時間の増加を抑制しながら全ての分類項目に適合した認識結果を生成するため、分類項目判定が誤ってしまい、それに伴って誤った適合化処理が行なわれた場合でも、即時に正しい分類項目に基づいた結果である適合化文字列を選んで採用することが可能である。

また、従来と変わらない認識処理時間で、分類項目判定結果に基づいた適合化文字列を生成することが可能であり、分類項目判定を誤った場合、適合化処理のみの短い時間で、利用者により特定された正しい分類項目に基づいた結果である適合化文字列を得ることが可能である。

以下において、本発明の実施の形態について図面を参照して詳しく説明する。なお、図中同一符号は、同一または相当部分を示す。

［実施の形態１］
図１はこの発明の実施の形態１の文字認識装置の構成を示すブロック図である。

図１を参照して、文字認識装置１００は、画像撮像手段としての画像撮像部１０１と、撮像した画像を保存する画像保存メモリ１１１と、制御部１１０と、制御部１１０が参照するデータを保存するデータメモリおよび中途段階の処理結果を保存する作業メモリとして働くメモリ１１２と、表示手段としての表示部１０７と、入力手段としての入力部１０８とを備える。

制御部１１０は、文字列抽出手段としての文字列抽出部１０２、文字列認識手段としての文字列認識部１０３と、文字列適合化手段としての文字列適合化部１０４と、選択手段としての選択部１０６とを含む。

図１に示す画像撮像部１０１は、被写体像をデジタル画像データに変換する手段であり、たとえば、ＣＣＤ（Charge Coupled Device）やＣＭＯＳ（Complementary Metal-Oxide
Semiconductor）などのセンサーを用いたカメラ、スキャナなどがこれに該当する。また、画像保存メモリ１１１は、ＲＡＭ（Random Access Memory）等の半導体メモリを具備している。画像撮像部１０１により撮像された画像データは画像保存メモリ１１１内に一時的に格納されるものとする。

なお、本実施の形態では画像を撮像して認識する構成で記載しているが、画像の入力は、光学スキヤナや通信先から、または他の記録媒体などから画像を入手する事でも可能である。この場合には、入手する画像入力手段と一時的に格納される画像記録部を画像撮像部１０１の代りに持つ事になる。もちろん、これら全ての構成を持つ事も可能である。

また、文字列抽出部１０２は、画像保存メモリ１１１内の画像データから、文字列の座標や、文字列を構成する文字ブロックの個数、座標といった画像情報を備えた文字列情報を抽出する文字列抽出手段である。

以下、前述の画像情報を備えた文字列情報を画像文字列と呼ぶことにする。光学式文字認識技術の分野において、画像文字列の抽出に関する手法は数多く存在するが、本発明で用いる手法に制限はなく、どの手法を用いてもかまわない。

また、文字列認識部１０３は、文字列抽出部１０２で抽出された文字列に対して、データメモリ１１２中に保持されている認識辞書と照合を行ない、認識文字列を生成する文字列認識手段である。

認識文字列とは、認識辞書との照合により生成される文字列の文字コード情報であるが、その他に２位以下の認識候補コード、照合辞書との類似度または距離値、文字の座標位置などの情報を含んでいてもかまわない。

文字列認識は、たとえば辞書に登録された文字の標準的な画像パターンと画像文字列との照合（マッチング）し、不一致画素が少ない順に上位の候補に割当てることが考えられる。

画像文字列から認識文字列を生成する手法は、たとえば、文字ブロック間の空白により１文字分の文字ブロックを切り出した後、１文字分の文字ブロック毎に、辞書に登録された文字の標準パターンとの照合（マッチング）を行ない、不一致画素が少ない順に上位の候補に割当てることが考えられる。

しかし、文字列認識に関しても、文字列認識に関する手法は数多く存在し、本発明では、どの手法を用いてもかまわない。

また、文字列適合化部１０４は、文字列認識部１０３で生成された認識文字列から分類項目に適合した文字列を生成する処理を行なう文字列適合化手段である。

ここで、分類項目とは、予め分類し設定しておいた、該当する文字列が何を意味しているかを示した事柄の集まりであり、具体的には、電話番号、ＵＲＬ、メールアドレス、氏名、肩書、住所などである。各々の分類項目の文字列にはそれぞれ特徴が有り、その特徴にもとづいて後述のように認識文字列を適正化することが可能である。

選択部１０６は、文字列適合化部１０４で生成された適合化文字列のうち、どの文字列を採用するかを選択する選択手段である。文字列適合化部１０４によって、複数の分類項目について適合化文字列が生成された場合、文字認識装置１００において、この選択部１０６によって選択された適合化文字列が採用される。

なお、選択部１０６における選択は、後述の入力部１０８によって入力された情報に基づいて行なわれる。入力部は種々の情報を入力する手段を示し、各種のキーによる入力であり、更に機器の外部よりインタフェースと結びつく通信回線等による情報の入力でも良い。

表示部１０７では、文字認識装置で扱う種々の情報についての表示が行なわれ、特に実施の形態１の文字認識装置では適合化文字列の表示等が行なわれる。具体的には、携帯電話などのディスプレイが該当する。

入力部１０８は、文字認識装置で扱う種々の情報を入力するための手段であり、特に実施の形態１の文字認識装置１００では、選択手段に対して利用者が選択した情報を入力する処理等が行なわれる。具体的には、数字キー、メニュー画面などで使用する決定キー、カーソル移動のための矢印キーなどである。更に通信回線等による情報の入力でも良い。

図２は、実施の形態１の文字認識装置の動作を説明するためのフローチャートである。

図２を参照して、最初に、ステップＳ１０１において、図１の画像撮像部１０１によって被写体が撮像される。

図３は、認識対象被写体の一例であり、図４はその被写体を画像撮像部１０１で撮像した場合の撮像画像の例である。

本実施例では、この図４の表示部１０７に表示されている０１２３−４５−６７８９＠ｓｈａｒｐ．ｃｏ．ｊｐを画像文字列として抽出して、複数の分類項目毎に適合化文字列生成の処理をして、その１つを選択するものであり、以下、そのフローを説明する。

再び図２を参照して、次に、ステップＳ１０２において、文字列抽出部１０２は、画像撮像部１０１からの撮像された画像データ、または画像保存メモリ１１１内の画像データから、文字列の位置などの文字列の情報を抽出する。前述したように文字列の抽出方法はどのようなものでもかまわない。また、本実施の形態では説明を容易にするため、１行の文字列を画像文字列として抽出したものとするが、複数行の場合についても１行の場合と同様である。

図４の撮像画像を文字列抽出手段により、画像文字列（行）が抽出される。

次に、図２のステップＳ１０３において、図１の文字列認識部１０３は、ステップＳ２０２で抽出された画像文字列の認識を行なう。前述したように画像文字列の認識方法はどのようなものでもかまわない。

画像文字列は、文字列に含まれる文字ブロックの個数、各ブロックの座標、文字列全体の座標などの情報を含んでいる。

図５は、画像文字列を認識した認識文字列の例を示した図である。

認識文字列とは、認識処理によって生成される文字情報のことであり、文字コードや文字候補、類似度、座標などの情報を含む。図５に示す認識文字列は、たとえば第１〜第４の文字候補をもつ。なお、kaisyaより後の文字については、候補の図示は省略している。

次に、図２のステップＳ１０４において、文字列適合化部１０４は、文字列認識部１０３で生成された認識文字列を、本認識装置があらかじめ分類対象としている分類項目（氏名、住所、氏名、肩書、住所、電話番号、ＵＲＬ、メールアドレスなど）に基づいて複数の分類項目それぞれに対応した適合化文字列を生成する。

図６は、図２のステップＳ１０４の詳細を示したフローチャートである。

図６を参照して、ステップＳ１０４が開始されるとまず、ステップＳ１１１において文字列を適合化するための分類項目が決められる。本実施の形態１では、この分類項目の決定は、任意の順番で可能である。

図７は、予めテーブルに登録された分類項目の例である。

図７の例では、１番目の分類として電話番号が、２番目の分類としてＵＲＬが、３番目の分類としてメールアドレスが登録されている。このような分類項目のテーブルは、図１のデータメモリ１１２に保存されている。すなわち、記憶装置として動作するメモリ１１２は、分類項目の番号を表す１、２、３等の数字情報と、具体的な分類項目を表す情報とを相互に関連付けて記憶していることになる。

図８は、予めテーブルに登録された分類項目に適した認識候補の例である。このような認識候補のテーブルも、図１のデータメモリ１１２に保存されている。すなわち、記憶装置として動作するメモリ１１２は、具体的な分類項目を表す情報と、認識候補を表す情報とを相互に関連付けて記憶していることになる。

図８の例は、理解の容易のため、英文ＯＣＲのケースを示している。分類項目が電話番号の時には、対象文字は「0〜9 - （）」であり、除外文字は、「A〜Z a〜ｚ / @
: ．」となる。分類項目がＵＲＬの時には、対象文字は「0〜9 A〜Z a〜z - : /.」であり、除外文字は、「( ) @」となる。分類項目がメールアドレスの時には、対象文字は「0〜9 A〜Z a〜z @ - .」であり、除外文字は、「() : /」となる。

分類項目の第１番目について適合化を行なう場合は、図８のテーブルを参照して、電話番号に使用される文字コードのみで認識候補が生成される。

たとえば、認識対象が、「0123-45-6789」の数字文字列であり、第１文字目の「０」の各候補が図５に示すように、第１位が「0」(数字)、第２位が「O」(英大文字)、第３位が「o」(英小文字)、第４位が「6」(数字)であるとする。

ここで、分類項目が電話番号である場合は、図８を参照すると分類項目に適した文字コードは、第１位、第４位のコードであり、残りの第２位、第３位の文字コードは適さない文字コードであることがわかる。従って、分類項目の適合化の結果、第１文字目の「０」の認識候補は、第１位が「0」(数字)、第２位が「6」(数字)、第３位および第４位は、候補無しと再生成される。

再び図６を参照して、ステップＳ１１１で分類項目が決められると、ステップＳ１１２に進む。ステップＳ１１２では不要文字列の削除が行なわれる。電話番号として適切な文字列の長さに制限する方法で削除してもよいし、適合化後に対象文字以外が第１位候補に初めて出現した位置以降の文字は削除するというように決めておいてもよい。このようにして、分類項目が電話番号の場合であれば、「＠」以降は除去する処理が行なわれる。

図９は、電話番号として適合化された文字列を示した図である。

図５、図９を参照してこのようにして、図５の第４文字目の第１位の候補は「３」と適合化され、第７文字目の第１位の候補は「５」と適合化される。そして、「＠」以降の文字は除去される。結局、図９の場合、生成された文字列は、「0123-45-6789」となる。

また、「URL:」など、その後に書かれた文字列が何であるかを表す単語を除去する処理も行なう。たとえば、「URL: http://www.kaisya.co.jp」と書かれた文字列を認識し、分類項目ＵＲＬについて適合化する場合は、生成された文字列は、「http://www.kaisya.co.jp」となる。この場合は、予め図示しない所定のテーブルに分類項目ＵＲＬについて削除文字列「URL:」が登録されており、このテーブルを参照することにより文字列の削除が行なわれる。他にも、分類項目が電話であれば「TEL，Tel」等が、メールアドレスであれば「Email」等がテーブルに登録されている。

再び図６を参照して、ステップＳ１１２の不要文字列の削除が終了すると、ステップＳ１１３に進む。ステップＳ１１３では文字列の修正が行なわれる。文字列の修正は、たとえばＵＲＬであれば、http , www , co , jp などといった頻出する文字列の誤りパターンを予め認識実験等で調査しテーブルを作成しておく。

図１０は、分類項目と認識文字列と修正によるその適合化候補のテーブルの例である。このような適合化候補のテーブルも、図１のデータメモリ１１２に保存されている。すなわち、記憶装置として動作するメモリ１１２は、具体的な分類項目を表す情報と、実際に認識した認識文字列を表す情報と適合化候補を表す情報とを相互に関連付けて記憶していることになる。

図１０に示すように、「h」は「k」と「p」は「D」と誤認識されやすく、また、「co」は間隔が狭いと「oo」のように誤認識されやすい。また「:」や「.」は、文字として認識されずに欠落しやすい。以上のような事情を考慮して分類項目ＵＲＬについては、「kttp://」や「http//」の適合化候補を「http://」と登録しておく。また分類項目ＵＲＬおよびメールアドレスについては、「oo.jp」「co.jD」「cojp」の適合化候補を「co.jp」と登録しておく。

たとえば、「http://www.kaisya.co.jp」の１文字目を「k」と誤認識し、「kttp://www.kaisya.co.jp」と文字列を認識したとする。本例に関していえば、「http://」に類似した文字列として「kttp://」が図１０のテーブルに登録されていればこれを参照することで「http://」と修正することは容易にできる。従って、ステップＳ１１３の終了時に生成された文字列は、「http://www.kaisya.co.jp」となる。

ステップＳ１１３が終了すると、図２のステップＳ１０４からステップＳ１０５に進む。ステップＳ１０４の適合化処理は、分類項目ごとに行なわれる。図７のように分類項目が登録されている場合には、たとえば最初に分類項目「電話番号」に適合化させる処理が行なわれ、適合化処理が終了すると、分類項目「電話番号」について適合化処理が終了したことが記憶される。このように、全ての分類対象について適合化を行なったか否かが記憶されている。まだ適合化を行なっていない残りの分類対象については、ステップＳ１０５から再びステップＳ１０４に戻り適合化処理が行なわれる。

つまり、ステップＳ１０５において、もし、それまでに適合化されていない分類項目があれば、ステップＳ１０４へ戻り、まだ適合化されていない分類項目のうちいずれか１つの分類項目について、適合化処理が行なわれる。一方で、もし、ステップＳ１０５において、すべての分類項目について文字列適合化部１０４により適合化文字列が生成されていれば、ステップＳ１０６へ進む。

ステップＳ１０６で、それまでに生成された適合化文字列が表示部１０７に並んで表示され、選択部１０６により表示されている適合化文字列のうち１つの文字列が入力部１０８よりユーザの指定に応じて選択される。ここで選択された適合化文字列が本認識装置が採用する認識結果となる。

この適合化文字列の選択は、適合化文字列そのものを指定してもよいし、あるいは適合化文字列に応じた分類項目のうち、少なくとも１つの選択方法で指定して選択してもよい。

図１１は、この実施の形態１のステップＳ１０６での表示例である。

図１１を参照して、分類項目「電話番号」に対応して適合化文字列「0123-45-6789」が表示され、分類項目「メールアドレス」に対応して適合化文字列「0123-45-6789 @ kaisya.co.jp」が表示され、分類項目「ＵＲＬ」に対応して適合化文字列「0123-45-6789 G kaisya.co.jp」が表示されている。

実施の形態１では、ディスプレイに表示する際に、現在選択の適合化文字列であることを示す分類項目位置カーソル（図１１の２０６）も同時に表示している。選択の適合化文字列を決定する際は、決定キー２０３を押下するものとする。

この分類項目位置表示カーソル２０６は、利用者が上下の矢印キー２０４を押下する操作と連動して上下に動くものとする。たとえば利用者が矢印キー２０４のうち上方向の矢印キーを１回押すと分類項目位置表示カーソル２０６は１つ上の適合化文字列（図では分類項目「電話番号」に対応）の左に位置するものとする。

なお、分類項目位置表示カーソル２０６の他に、選択した分類項目名を表示する分類項目表示メニュー（図７の２０７）を具備し、分類項目の表示を行なってもよい。

実施の形態１の処理の特長は、図２のステップＳ１０４とステップＳ１０５によって、分類項目の文字列適合化可能な複数の分類項目を全て先に文字列適合化して各分類項目毎の適合化文字列を生成するところである。

これによって、ステップＳ１０３での文字列認識部１０３による文字列の認識を一度しか行なわないで少ない操作で適切な文字列を得ることができる。ＯＣＲの構成による違いにより一概にはいえないが、前述した出願人が開発したＯＣＲなどでは、前述したように、文字列の認識処理は全体の処理の約８０％を占める。このため、文字認識処理を何回も行なうことは、携帯電話などの処理速度の遅い情報端末では、非常に時間がかかることになる。

しかし、本発明では、ステップＳ１０３での文字列認識部１０３による文字列の認識を一度しか行なわないため、全体の処理時間の増加が抑えられ、携帯電話などの処理速度の遅い携帯端末でも十分にＯＣＲの搭載が可能である。

以上説明したように実施の形態１によれば、認識処理時間の増加を抑制しながら全ての分類項目に適合した認識結果を生成するため、分類項目判定が誤ってしまい、それに伴って誤った適合化処理が行なわれた場合でも、即時に正しい分類項目に基づいた結果である適合化文字列を選んで採用することが可能である。

また、上記の実施の形態１では、全ての分類項目に対して適合化処理を施したが、予め適合化を行なう複数の分類項目を定めることができるようにし、定めた複数の分類項目について適合化を行なう構成にすることも可能である。

［実施の形態２］
図１２は、実施の形態２の文字認識装置の構成を示すブロック図である。

図１２を参照して、文字認識装置２００は、図１に示した実施の形態１の文字認識装置１００の構成において制御部１１０に代えて制御部１２０を含む。制御部１２０は、制御部１１０の構成に加えて分類項目判定部１２１が付与されている。他の部分の構成については、図１の説明と同様であるので説明は繰返さない。

ここで、図１２の分類項目判定部１２１とは、文字列認識部１０３で生成された認識文字列が、あらかじめ分類対象としている分類項目（氏名、肩書、住所、電話番号、ＵＲＬ、メールアドレスなど）の属性に基づいていずれの分類項目にあたるかを分類する分類項目判定手段である。

図１３は、実施の形態２の文字認識装置の動作を説明するためのフローチャートである。

図１３のフローチャートは、図２のフローチャートのステップＳ１０３とＳ１０４との間に分類項目判定ステップであるＳ２０４が追加されたものである。したがって、ステップＳ２０１〜Ｓ２０３は図１のステップＳ１０１〜Ｓ１０３とそれぞれ同様の処理であり、また、ステップＳ２０５〜Ｓ２０７は図１のステップＳ１０４〜Ｓ１０６と同様の処理である。したがって、これらのステップの説明は繰返さず、図１３のステップＳ２０４に関係する処理動作のみ説明を行なう。

ステップＳ２０４では、分類項目判定部１２１が、文字列認識部１０３で生成された認識文字列があらかじめ分類対象としている分類項目（氏名、住所、氏名、肩書、住所、電話番号、ＵＲＬ、メールアドレスなど）のうち、いずれにあたるかを分類項目の属性に基いて判定する。

判定方法についていくつかの例を説明する。

ここで、分類の属性とは、各分類の項目を特定するために、あらかじめ定めている情報である。たとえば、分類が電話番号の場合の属性となる情報とは、連続した４桁の数字列とハイフンと２桁の数字列とハイフンと４桁の数字列を含む構成を示すルールを示す情報、または、連続した始め丸括弧（と５桁の数字列と終わり丸括弧）と１桁の数字列とハイフンと４桁の数字列を含む、などと定めておく。認識文字列がこのルールを示す情報と一致する場合には属性情報を満たすことになる。

このように、各分類項目は、認識された認識文字列に含まれる文字列に対して、各分類項目の鍵になる文字の属性を、数字列が一定の並びで含まれていれば電話番号、＠の記号が含まれていればメールアドレス、ｗｗｗや、ｈｔｔｐなどの文字列が含まれていればＵＲＬであるなどで判断することで可能である。

分類項目判定手段はメモリ１１２に保持されている属性情報を参照し、認識文字列がこれらの属性情報を満たせば、認識文字列の対応する分類項目と判断する。

この分類項目判定の技術は公知技術であるので特に詳細な説明は割愛するが、分類項目判定に関する手法は数多く存在し、本発明では、どの手法を用いてもかまわない。

即ち、予め定められた分類項目の中から機器に設定された複数の分類項目の有する属性特質に、認識文字列が適合或いは一致しているかを、確認してその結果において判定を決めれば良い。重点的言葉の出現があれば適合していると判定する場合もあり、適合度の最も高い分類項目の属性が適合した分類項目として判定しても良い。

他にも、属性情報として所定のテーブルに分類項目ＵＲＬについて文字列「URL:」が登録されており、このテーブルを参照することにより文字列が分類項目ＵＲＬであることが判定されてもよい。同様に、「TEL，Tel」等が文字列に含まれている場合に分類項目が電話であると判定してもよいし、「Email」等が文字列に含まれている場合に分類項目がメールアドレスであると判定してもよい。

実施の形態１では、撮像される文字画像を認識する際に、図２のフローに従い分類項目判定を行なう事無く、分類項目を機械が定めた任意の順序で順次分類項目の適合化を行なっている。これに対し、実施の形態２では、先にステップＳ２０４の分類項目判定を行なった後、ステップＳ２０５とステップＳ２０６で分類項目適合化を行ない、再度ステップＳ２０５とステップＳ２０６で残る他の分類項目について適合化を行なう動作となる。

つまり、最初にステップＳ２０４からステップＳ２０５へ進んだときは、適合化処理は、ステップＳ２０４で判定された分類項目に基づいて行なう。ステップＳ２０６からステップＳ２０５へ進んだときは、適合化を行なう順序は任意の順序でよい。

次に、ステップＳ２０６において、もし、それまでに適合化されていない分類項目があれば、ステップＳ２０５へ進み、まだ適合化されていない分類項目のうち任意の１つの分類項目について、適合化処理を行なう。

もし、すべての分類項目について文字列適合化部１０４により適合化文字列が生成されていれば、ステップＳ２０７へ進む。

その結果、ステップＳ２０７で、表示部１０７に、それまでに生成された適合化文字列が全て表示され、選択部１０６により表示されている適合化文字列のうち１つの文字列を入力部１０８からの指示に応じて選択する。ここで選択された適合化文字列が本認識装置が採用する認識結果となる。

図１１を、この実施の形態２のステップＳ２０７での表示例とすると、選択途中の適合化文字列は、最初に表示された時点では、分類項目の判定結果に応じた適合化文字列が他の分類項目に応じた適合化文字列よりも優先して選択されるようにしておく。これによって、分類項目判定手段の項目判定精度が非常に高い場合、ほとんどの場合、矢印キーで選択を変更する必要がなく決定キーを押す操作だけになる。

なお、分類項目位置表示カーソル２０６の他に、選択した分類項目名を表示する分類項目表示メニュー（図１１の２０７）を具備し、分類項目の表示を行なってもよい。

図１４は、実施の形態２の他の画面表示の例である。

図１４に示すように、「項目は電話と判定されました」とメッセージを表示したうえで、「それ以外の場合は対応する数字キーを押下してください」と分類項目に対応する数字キーによってユーザに選択させるようにしてもよい。

実施の形態２の発明は、実施の形態１の発明の特徴である１回の処理で全ての分類項目の適合化文字列を表示する際に、分類項目判定手段が判定した分類項目（または、分類項目に応じた適合化文字列）の決定が最も容易になるように構成されている。これによって、分類項目判定手段の判定が正しい時は即選択可能となり、分類項目判定手段の判定が誤っている場合にも他の分類項目を選択操作だけで指定出来るので、実施の形態１の発明をさらに改善したものとなっている。

なお、図２ではステップＳ２０４の分類項目判定は、複数の分類項目の適合化処理に先立って行なうように説明しているが、処理順序を変更して複数の分類項目の適合化処理後に行なう事も可能である。

以上説明したように、実施の形態２では、必要に応じて、画像文字列情報を所定の分類項目として判別・分類する分類項目判定手段をも持ち、該分類項目判定手段の分類の適合化文字列にはマークを付けたりカーソルで導いたりして、分類項目判定による適合化文字列を選択する。

以上の構成により、実施の形態２の文字認識装置は、認識処理時間の増加を抑制しながら全ての分類項目に適合した認識結果を生成するため、分類項目判定が誤ってしまい、それに伴って誤った適合化処理が行なわれた場合でも、即時に正しい分類項目に基づいた認識結果である適合化文字列を選んで採用することが可能である。加えて判定結果が正しい場合には、簡単な操作でこれを採用決定することができる。

［実施の形態３］
図１５は、実施の形態３の文字認識装置の構成を示すブロック図である。

図１５を参照して、文字認識装置３００は、図１２に示した文字認識装置２００の構成において制御部１２０に代えて制御部１３０を含む。制御部１３０は、制御部１２０の構成において、選択部１０６に代えて分類項目特定部１３１を含む。文字認識装置３００の他の部分の構成は、図１２に示した文字認識装置２００と同様であるので説明は繰返さない。

分類項目特定部１３１は、文字列認識部１０３で生成された認識文字列が、あらかじめ分類対象としている分類項目のいずれにあたるかを特定する分類項目特定手段であり、入力部１０８により特定のための分類項目が入力される。

図１６は、実施の形態３の認識処理を説明するためのフローチャートである。

図１６のフローチャートのステップＳ３０１〜Ｓ３０４は、図１３のフローチャートのステップＳ２０１〜Ｓ２０４と同様な処理であるので、説明は繰返さない。したがってステップＳ３０５以降について説明をする。

ステップＳ３０４の次にステップＳ３０５へ進み、ステップＳ３０４で判定された分類項目に応じた適合化文字列が生成される。

次にステップＳ３０６へ進み、ステップＳ３０５で生成された適合化文字列が適合化の結果として表示部１０７にて表示される。

図１７は、図４４の文字列を認識し、分類項目判定部１２１で電話番号と判定された、ステップＳ３０６時点の表示例である。

図１７の例では、分類項目が電話番号と判定されたことが表示され、再度適合化処理を行なうか否かの指示を求めている。続いてステップＳ３０７において分類項目が適切で無い場合には、分類項目を特定する入力が行なわれる。再度適合化を行なう分類項目を特定する場合、数字キーのうち、１から３までの数字キーを押下することにより分類項目を入力し特定する。数字１キーの押下が、ＵＲＬ、数字２キーがメール、数字３キーが電話番号の特定にあたる。判定された分類項目が適切であったときには、数字９キーの押下を行ない、分類項目の特定は行なわない。

ステップＳ３０７において、入力部１０８から分類項目特定部１３１に対して分類項目の特定が行なわれた場合、ステップＳ３０５へ戻る。ステップＳ３０５では、分類項目特定部１３１により特定された分類項目に応じた適合化文字列が生成される。その後、ステップＳ３０６で、分類項目特定部１３１により特定された分類項目に応じた適合化文字列が表示部１０７にて表示される。ここで正しい分類項目（メール）に対応する数字２のキーを押下すると、図１８のように正しい分類項目による適合化文字列が表示される。

図１８は、図４４の文字列に対して再度適合化を行なった場合のステップＳ３０６時点の表示例である。

以上、ステップＳ３０５からステップＳ３０７までの処理は、ステップＳ３０７で分類項目の特定が行なわれる限り続く。

ステップＳ３０７で分類項目の特定がなかった場合、ステップＳ３０８へ進み、最後に生成された適合化文字列を本装置で選択して処理を終了する。

図１８の例では、分類項目としてメールを選択した結果、正しい文字列が得られたので、現在表示されている適合化文字列を採用し処理を終了する場合、利用者は数字９のキーを押下する。これによりステップＳ３０８において結果が確定される。

実施の形態３は、実施の形態１および２と比較して、全ての分類項目に基づく結果を表示しないため、携帯電話など表示画面が小さい情報端末に適している。

また、分類項目判定の判定結果が正しく、分類項目特定による分類項目適合化処理を行なわない場合、分類項目適合化処理は判定された最初の分類項目に対応する１回である。したがって、分類項目判定手段の判定精度がよく、ほとんど分類項目特定処理を行なう必要がないならば、実施の形態２と比較して、多くの使用機会において、認識処理時間が短くなるという利点がある。

以上の構成により、実施の形態３の文字認識装置は、従来と変わらない認識処理時間で、分類項目判定結果に基づいた適合化文字列を生成することが可能であり、分類項目判定を誤った場合、適合化処理のみの短い時間で、利用者により特定された正しい分類項目に基づいた結果である適合化文字列を得ることが可能である。

なお、上述の実施の形態１から形態３までの説明では、分類項目をＵＲＬ，メールアドレス、電話番号等としているが、他に氏名、住所、肩書き、などの項目も考えられ、また分類項目をどこの国の言語（英文、日本語文、欧州文）であるかを分類する項目としてもよい。

［実施の形態４］
実施の形態１〜３では、分類項目が、電話番号、ＵＲＬ、メールアドレスなどの場合の説明を行ったが、実施の形態４では、分類項目が言語（英語、フランス語、ドイツ語、オランダ語、ギリシャ語、日本語、韓国語、中国語等）である場合の説明を行なう。

図１９は、実施の形態４の文字認識装置の構成を示すブロック図である。

図１９を参照して、文字認識装置６００は、図１に示した文字認識装置１００の構成に加え、文字列修正入力部１６１を含む。文字認識装置６００の他の部分の構成は、図１に示した文字認識装置１００と同様であるので説明は繰返さない。

ここで、図１９の文字列修正入力部１６１とは、文字列適合化部１０４で適合化された適合化認識文字列の誤りを修正入力するためのものであり、予め定められた複数の分類項目に対して、それぞれ対応する文字列修正処理のための手段を備える。すなわち、文字列修正部は、適合化文字列が選択された後、選択された適合化文字列に応じた分類項目に対応する文字列修正処理のための手段によって、選択された適合化文字列の修正入力処理を行なう。

図２０は、実施の形態４の文字認識装置の動作を説明するためのフローチャートである。

図２０のフローチャートは、図２のフローチャートのステップＳ１０６の後に、修正入力ステップであるＳ６０７が追加されたものである。

ステップＳ６０１〜ステップＳ６０５は図１のステップＳ１０１〜Ｓ１０５と同様の処理である。従って、ステップＳ６０４の分類項目の適合化処理と、ステップＳ６０７の修正入力処理の説明のみ行なう。

以下、ステップＳ６０４の分類項目の適合化処理を、図２１のフローチャートを参照して説明する。

図２２は、ステップＳ６０１で撮像された画像データであり、オランダ語の「ijzer」という単語である。

図２３は、図２２の画像データから認識処理によって生成された認識文字列の例であり、たとえば第１〜第４の文字候補をもつ。

図２４は、予めテーブルに登録された分類項目の例である。

図２４の例では、１番目の分類として英語が、２番目の分類としてオランダ語が、３番目の分類としてギリシャ語が登録されている。このような分類項目のテーブルが図１９のデータメモリ１１２に保存されていることは、実施の形態１と同様である。

なお分類項目が上記３言語であることは説明を簡単にするための理由によるものであり、その他の欧州言語、日本語、中国語、韓国語、アラビア語等の言語を定めてもよく、これに限定されるものではない。

図２５は、分類項目と認識文字列と修正によるその適合化候補のテーブルの例である。
また、図２６は、予めテーブルに登録された分類項目に適した認識候補の例である。図２５の適合化候補のテーブル、図２６の分類項目に適した認識候補のテーブルも、実施の形態１と同様に、図１６０のデータメモリ１１２に保存されている。

再び図２１を参照して、ステップＳ６１１で分類項目が決められる。以下、分類項目はオランダ語に決められたとする。ステップＳ６１１で分類項目が決められると、ステップＳ６１２に進む。ステップＳ６１２では文字列の修正処理が行われる。

実施の形態１では、最初に必要な対象文字コードのみで認識候補の生成、その後文字列修正の順であったが、実施の形態４では、ステップＳ６１２の文字列修正が最初に行われるものとする。

文字列の修正は、特定の言語にのみ存在する複数の文字(記号)を結合した形状の文字に関する修正する処理である。たとえば、オランダ語、ギリシャ語には、下記のように複数の文字(記号)を結合した言語特有の文字が存在する。

これらの文字は、分類項目（言語）が不明な場合、下例のように２文字に誤る可能性がある。

上述の誤りは、各分類項目に特有の適合化規則を登録しておき、この規則を参照することにより修正が可能である。

この修正処理により、図２３の認識文字列は、図２７に示す認識文字列と修正される。

なお、上記の修正は、文字コードテーブルのみを参照した単純な置き換えではなく、文字ブロック間の距離等、文字のパターン辞書との距離（類似度）も含めて置き換えるか否かを判断するようにして、より修正の精度を高くする構成にすることも可能である。

以上で図２０のステップＳ６０４の分類項目の適合化処理の説明を終了する。

再び図２０を参照して、次にステップＳ６０６にて、結果の選択が行われる。

ステップＳ６０６では、生成された適合化文字列に対応する分類項目が表示部１０７に並んで表示され、選択部１０６により表示されている分類項目のうちの１つの分類項目が入力部１０８よりユーザの指定に応じて選択される。

図２９は、ステップＳ６０６での表示例である。図２９に示すように、分類項目（言語）が表示部１０７に表示され、表示されている分類項目に対応した適合化文字列が入力部１０８によりユーザの指定により選択される。ここで選択された適合化文字列が修正入力処理後、本認識装置が採用する認識結果となる。

再び図２０を参照して、次にステップＳ６０７にて、修正入力処理が行われる。

修正入力処理とは、ユーザが認識文字列の誤りを手入力にて修正する処理のことである。撮影条件が良好でない（たとえば、照度が低い環境、手ぶれ（カメラ撮影の場合）等）、あるいは、認識対象である画像文字列自体が特殊なフォント、コピーを繰り返し劣化したものである等の様々な理由により、適合化処理後の文字列も誤りがある可能性がある。このように現在の文字認識技術では、修正入力処理は必要不可欠な処理である。

修正入力処理においては、表示部１０７による（適合化後の）認識文字列、つまり適合化文字列の表示処理、ユーザが入力した文字を表示する処理、および／または入力部１０８による文字を入力する処理等が必要である。つまり、表示部１０７は、適合化文字列またはユーザが入力した文字列に応じた分類項目に対応する文字コード体系を用いた表示処理を行ない、入力部１０８は、適合化文字列に応じた分類項目に対応する、入力キーと入力文字との対応付けテーブルを用いた入力処理を行なう。

このように入力部１０８で、対応付けテーブルを用いた入力処理を行なうのは、対象言語が定まっている場合、特に携帯機器等の入力キーが限られている機器においては、言語別にキー入力操作と入力文字を対応づけるのが一般的であり、かつ実用的であるからである。具体的には、ステップＳ６０７において、分類項目（言語）に応じて入力部１０８のキー入力操作と入力文字の対応付けの切替が行われる。

以下、ステップＳ６０７の修正入力処理に関して、図３０のフローチャートを用いて説明を行なう。

最初にステップＳ６２１にて、ステップＳ６０６で選択された分類項目（言語）に応じて入力キーと入力文字が対応付けされている対応付けテーブルの切替が行われる。

図３１は、分類項目がオランダ語、ギリシャ語の場合のキー操作と入力文字の対応付けテーブルの一例である（英語のテーブルは省略している）。図３１の例では、各文字は０から９までの各数字キーに対応づけられている。入力方法はいわゆるマルチタップ方式で、たとえばオランダ語の場合、「Ｃ」を入力するには２の数字キーを３回押す。この対応づけテーブルも、図１９のデータメモリ１１２に保存されている。

ステップＳ６２１では、図３１で示される対応付けテーブルが分類項目（言語）に応じて切替えられる。

次にステップＳ６２２では、文字列修正入力部１６１により修正処理が行われる。

図３２は、ステップＳ６２２の修正処理の一例である、文字列修正入力部１６１による修正処理例を表す図である。なお、この例は修正処理を説明するための例であり、図２８に示す適合化文字列とは、直接関連しない。

分類項目表示メニュー２０７は、実施の形態１と同じくユーザが選択した分類項目（言語）をユーザに報知するためのものであり、現在オランダ語(Dutch)が選択されていることが表示されている。

認識文字列ボックス２１０には、図２２の画像文字列を読み取った結果の認識文字列が表示されている。ここでは、文字「z」を文字「2」と誤り、「ij2er」となったものとする。

文字「2」を「z」と修正するために、ユーザは最初に矢印キー２０４のうち左右のキーを操作して、入力/削除位置カーソル２１１を、削除するzの位置にあわせる。その後、削除キー２１２を押下して文字「2」を削除した後、数字９のキーを８回押下することにより正しい文字「z」を入力する（この入力操作は、図３１の対応付けテーブルに基づいている。）。

以上、分類項目に応じた修正入力が可能な文字列修正入力部の説明を行ったが、前述したように、表示に関しても分類項目に応じた表示設定が行われることも十分可能である。

たとえば、分類項目（言語）が、日本語、中国語など漢字を含む言語の表示をUnicode(ユニコード)等の文字コード体系で統一的に扱うことも可能であるが、Unicodeを使用することによる問題も生じる。たとえば、UCS2（Unicodeの２バイトコード体系）の同じ意味・ルーツの漢字に同一コードを割り当て、UTF8（Unicodeの可変長変換方式）を用いた場合の処理量の増加等である。

したがって、言語に応じた文字コード体系を使うことが有効となる。その際に、分類項目（言語）が選択されているならば、表示処理についても分類項目に応じた表示処理を行なう（つまり、表示のために文字コード体系を切替える）ことにより（図３４のステップＳ６２１とＳ６２２との間で行なう）、より負荷の少ない処理を行なうことが可能である。

すなわち、認識処理のときは、認識処理に適した文字コード体系を用いればよく、各言語の各文字に独自に適宜文字コードを割当てるようにすればよい。たとえば、英語、オランダ語、ドイツ語、フランス語、スペイン語、ギリシャ語のそれぞれの文字に重複がないように独自に文字コードを割当てておき、割当てた文字コード体系に基づいて認識処理を行ない、文字列適合化部１０４で割当てた文字コード体系に基づいて適合化文字列を出力する。

文字列修正入力部１６１は、英語、オランダ語、ドイツ語、フランス語、またはスペイン語を表示する場合には、認識処理で用いていた文字コード体系から表示部１０７にＩＳＯ−８８５９−１の文字コード体系に切替えさせ、英語、ギリシャ語を表示する場合には、表示部１０７にＩＳＯ−８８５９−７の文字コード体系に切替えさせるものとすればよい。表示部１０７は、文字列適合化部１０４などの他の構成要素から文字コードを受取ったときには、切替えられた文字コード体系にしたがって、受取った文字コードの文字を表示する。

以上、説明したように実施の形態４では、実施の形態１の利点に加えて更に、選択された分類項目に応じて分類項目に即した文字の入力／表示を行なう修正入力処理が可能である。このため、分類項目（言語）毎に文字体系を設定できることにより、分類項目全てを含んだ文字コード体系と比較して少ない処理容量で表示処理が可能であり、またユーザが修正入力処理が容易に行なうことができるという利点がある。

［実施の形態５］
図３３は、実施の形態５の文字認識装置の構成を示すブロック図である。

図３３を参照して、文字認識装置７００は、図１２に示した文字認識装置２００の構成に加えて、文字列利用部１７１をさらに含む。

文字列利用部１７１は、文字列適合化部１０４にて出力された適合化文字列をユーザが利用するための手段であり、具体的には、メールの宛先や本文の編集機能を含むメール送受信部、または接続先の編集機能を含むWebサイト接続部等である。

図３４は、実施の形態５の文字認識装置の動作を説明するためのフローチャートである。

図３４のフローチャートのステップＳ７０１からステップＳ７０７までは、図１３のステップＳ２０１からステップＳ２０７までと同様の処理である。従って、分類項目が言語である場合の分類項目判定（ステップＳ７０４）とステップＳ７０８、ステップＳ７０９の説明のみ行なう。

ステップＳ７０４では分類項目（言語）の判定が行われるが、判定の方法としては、言語特有の文字に注目する等の方法がある。たとえば分類項目（言語）が、英語、オランダ語、ギリシャ語のいずれかの場合、認識文字列中にΣという文字があればギリシャ語と判定できる。その他の方法として、各言語の単語辞書を具備し、各単語辞書について認識文字列が存在するか否かを調べ、単語辞書が文字列、または文字列内の単語を含んでいた場合、単語辞書に対応する言語が文字列の言語であるとして分類項目（言語）を判定することが可能である。

ステップＳ７０８では、文字列利用部１７１が選択した分類項目（言語）に対応したものに切替えられる。すなわち、選択した分類項目（言語）に応じて、表示部１０７では言語に応じた表示処理、入力部１０８では言語に応じた入力処理に切替えられる。これに関しては、実施の形態４と同様であるため、説明は省略する。

次にステップＳ７０９では、選択された言語に応じた文字列利用処理が行われる。

図３５は、文字列利用処理の一例であるメール入力処理例である。

分類項目表示メニュー２０７が示すとおり分類項目（言語）はギリシャ語となっている。選択した分類項目（言語）に応じて表示部１０７では言語に応じた表示処理が行なわれる。すなわち、ステップＳ７０７で選択された適合化文字列は、メール本文領域２２２に挿入される仕組みとなっている。これにより、ユーザが文字を入力する労力が低減される。

ここで、実施の形態４と同様に、選択した分類項目（言語）に応じて入力部１０８では言語に応じた入力処理に切替えることにより、誤認識等の修正のため、数字キー２０５と削除キー２１２により、誤認識文字削除、新規文字入力を可能とすることは容易である。また、表示部１０７は、適合化文字列またはユーザが入力した文字列に応じた分類項目に対応する文字コード体系を用いた表示処理を行なう。

また、多言語ドメイン名にも対応するため、ステップＳ７０７で選択された適合化文字列が、メールアドレス領域２２１に挿入される仕組みとしてもよい。

以上、説明したように実施の形態５では、実施の形態１の利点に加えて更に、選択された分類項目に応じて分類項目に即した文字列の利用処理が可能である。このため、分類項目（言語）毎に文字体系を設定できることにより、分類項目全てを含んだ文字コード体系と比較して少ない処理容量で表示処理が可能であり、またユーザが適合化文字列を容易に利用することができるという利点がある。

［実施の形態６］
図３６は、実施の形態６の文字認識装置の構成を示すブロック図である。

また、図３７は、実施の形態６の文字認識装置の動作を説明するためのフローチャートである。

図３６を参照して、文字認識装置８００は、図１５に示した実施の形態３の文字認識装置３００の構成に加えて、文字列修正入力部１６１と文字列利用部１７１とをさらに含む。

図３７のフローチャートは、図１６のフローチャートのステップＳ３０８の後に、修正入力処理ステップＳ８０９と、文字列利用部の切替えステップＳ８１０と、文字列利用ステップＳ８１１とが追加されたものである。

図３６の構成図、図３７のフローチャートは、いずれも実施の形態３，４，５で説明済みの追加構成、追加ステップであるため、説明は繰返さない。

図３８は、図３７のステップＳ８０７時点の表示例である。図３８では、ある画像文字列（図による説明は略）を認識し、分類項目表示メニュー２０７で表示されているとおり、分類項目（言語）の判定を英語と判定している。

もし分類項目判定が正しければ、ユーザは決定キー２０３を押下して次のステップＳ８０８へ進めばよい。もし分類項目が誤っていれば、ユーザは表示部１０７で表示されている言語に応じた数字キー２０５を押下して正しい分類項目を選択することができる（数字キー２０５で、１の数字キーを押下すると英語を選択、２の数字キーを押下するとオランダ語を選択、３の数字キーを押下するとギリシャ語を選択）。

ユーザが選択した言語に応じて文字認識装置８００は、適合化処理を行なう。適合化処理に関しては実施の形態４にて説明を行っているので、説明は繰返さない。

以上、実施の形態６では、実施の形態３の利点に加えて更に、選択された分類項目に応じて分類項目に即した文字列の修正入力処理、文字列利用処理が可能である。このため、分類項目（言語）毎に文字体系を設定できることにより、分類項目全てを含んだ文字コード体系と比較して少ない処理容量で表示処理が可能であり、またユーザが修正入力処理が容易に行なうことができるという利点、及び、またユーザが適合化文字列を容易に利用することができるという利点がある。

［プログラムおよび記録媒体についての補足説明］
図１、図１２、図１５、図１９、図３３、図３６においてそれぞれ制御部１１０、１２０、１３０として、上述のフローチャートの処理を実行するＣＰＵを用いることができる。

図２のステップＳ１０１の撮像のステップは画像を入力する画像入力ステップであって、ステップＳ１０２は、入力された画像中の文字列を画像文字列として抽出する文字列抽出ステップであって、ステップＳ１０３は、画像文字列を認識して認識文字列を生成する文字列認識ステップであって、ステップＳ１０４は、認識文字列に対して複数の分類項目に応じた所定の適合化処理を複数の分類項目ごとに施し、適合化文字列を生成する文字列適合化ステップであって、ステップＳ１０６は適合化文字列を選択するステップである。したがって、これら各ステップをコンピュータに実行させるプログラムは構成可能である。

図１６のステップＳ３０１の撮像のステップは画像を入力する画像入力ステップであって、ステップＳ３０２は入力された画像中の文字列を画像文字列として抽出する文字列抽出ステップであって、ステップＳ３０３は画像文字列を認識して認識文字列を生成する文字列認識ステップであって、ステップＳ３０４は認識文字列を用いて画像文字列を所定の分類の属性に基づいて、ひとつの分類項目として判定する分類項目判定ステップであり、ステップＳ３０５は認識文字列に対して分類項目に応じた所定の適合化処理を施し、適合化文字列を生成する文字列適合化ステップとであって、ステップＳ３０７は認識文字列を、所定の分類のひとつの分類項目として、一意的に特定する分類項目特定ステップである。したがって、これら各ステップをコンピュータに実行させるプログラムは構成可能である。

図３９は、プログラムを読込むことが可能な文字認識装置の構成を示したブロック図である。

図３９を参照して、文字認識装置４００は、図１５に示した文字認識装置３００の構成に加えて、通信インタフェース部１４１と、記録媒体１４３を取付けることができる記録媒体インタフェース部１４２とをさらに含む。

他の構成として、図示は省略するが、実施の形態１で説明した図１、実施の形態２で説明した図１２、実施の形態４で説明した図１９、実施の形態５で説明した図３３、実施の形態６で説明した図３６に対して、各文字認識装置の構成に加えて、通信インタフェース部１４１と、記録媒体１４３を取付けることができる記録媒体インタフェース部１４２とをさらに含むことも可能である。

図４０は本発明の実施形態の各処理ステップを実行させるプログラムがコンピュータに可読可能な状況で装置に装着される事を示す図である。

図４０を参照して、文字認識装置４００には、通信先２０８から無線または有線の各種通信回線を介してプログラムが受信される。たとえば、これにより文字認識装置としての携帯電話などの端末に新たなプログラムを実行可能な形式で格納することができる。

記録媒体１４３はプログラムが格納されている記録媒体であって、各種ＩＣメモリや磁気媒体やＣＤ−ＲＯＭなど想定される。

このように、本発明の実施形態のプログラムは、通信回線を介しても提供可能であり、また、各種記録媒体でも提供可能である。プログラムを通信手段や記録媒体で供給すれば、プログラムのバージョンアップを後から行なうことにより使用者が同じハードウエアを使用ながら一層快適に操作することが可能となる。

今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

実施の形態１の文字認識装置の構成を示すブロック図である。実施の形態１の文字認識装置の動作を説明するためのフローチャートである。認識対象被写体の一例を示した図である。図３の認識対象被写体を撮像した表示例の図である。認識文字列の例を示した図である。図２のステップＳ１０４の詳細を示したフローチャートである。予めテーブルに登録された分類項目の例を示す図である。予めテーブルに登録された分類項目に適した認識候補の例を示す図である。電話番号として適合化された文字列を示した図である。分類項目と認識文字列と修正によるその適合化候補のテーブルの例を示す図である。この実施の形態１のステップＳ１０６での表示例、及び、この実施の形態２のステップＳ２０７での表示例を示す図である。実施の形態２の文字認識装置の構成を示すブロック図である。実施の形態２の文字認識装置の動作を説明するためのフローチャートである。実施の形態２の他の画面表示の例を示す図である。実施の形態３の文字認識装置の構成を示すブロック図である。実施の形態３の文字認識装置の動作を説明するためのフローチャートである。図４４の文字列を認識し、分類項目判定部１２１で電話番号と判定された、ステップＳ３０６時点の表示例を示す図である。図４４の文字列に対して再度適合化を行なった場合のステップＳ３０６時点の表示例を示す図である。実施の形態４の文字認識装置の構成を示すブロック図である。実施の形態４の文字認識装置の動作を説明するためのフローチャートである。図２０のステップＳ６０４の詳細を示したフローチャートである。図２０のステップＳ６０１で撮像された画像データを表わす図である。図２２の画像データから認識処理によって生成された認識文字列の例を表わす図である。予めテーブルに登録された分類項目の例を示す図である。分類項目と認識文字列と修正によるその適合化候補のテーブルの例を示す図である。予めテーブルに登録された分類項目に適した認識候補の例を示す図である。図２３の認識文字列が修正された例を示す図である。図２７の修正後の文字列が適合化された適合化文字列を示す図である。図２０のステップＳ６０６での表示例を表わす図である。図２０のステップＳ６０７の修正入力処理の詳細を示したフローチャートである。分類項目がオランダ語、ギリシャ語の場合のキー操作と入力文字の対応付けテーブルの一例を表わす図である。ステップＳ６２２の修正処理の一例である、文字列修正入力部１６１による修正処理例を表す図である。実施の形態５の文字認識装置の構成を示すブロック図である。実施の形態５の文字認識装置の動作を説明するためのフローチャートである。文字列利用処理の一例であるメール入力処理例を表わす図である。実施の形態６の文字認識装置の構成を示すブロック図である。実施の形態６の文字認識装置の動作を説明するためのフローチャートである。図３７のステップＳ８０７時点の表示例を表わす図である。プログラムを読込むことが可能な文字認識装置の構成を示したブロック図である。本発明の実施形態の各処理ステップを実行させるプログラムがコンピュータに可読可能な状況で装置に装着される事を示す図である。カメラ付き携帯電話で文字認識を行なわせる文字列の第１例を示す図である。カメラ付き携帯電話で文字認識を行なわせる文字列の第２例を示す図である。従来の文字認識装置の動作を説明するためのフローチャートである。文字認識させる対象の入力画像の一例を示した図である。従来の文字認識装置の出力結果を示した図である。

符号の説明

１００，２００，３００，４００，６００，７００，８００文字認識装置、１０１画像撮像部、１０２文字列抽出部、１０３文字列認識部、１０４文字列適合化部、１０６選択部、１０７表示部、１０８入力部、１１０，１２０，１３０制御部、１１１画像保存メモリ、１１２メモリ、１２１分類項目判定部、１３１分類項目特定部、１４１通信インタフェース部、１４２記録媒体インタフェース部、１４３記録媒体、１６１文字列修正入力部、１７１文字列利用部、２０３決定キー、２０４矢印キー（上下左右）、２０５数字キー、２０６分類項目位置表示カーソル、２０７分類項目表示メニュー、２０８通信先、２１０認識文字列ボックス、２１１入力/削除位置カーソル、２１２削除キー、２２１メールアドレス領域、２２２メール本文領域。

Claims

画像を撮像画像として撮像する画像撮像手段と、
前記撮像画像の文字列部分を画像文字列として抽出する文字列抽出手段と、
前記画像文字列に対して文字認識を行ない、認識文字列を生成する文字列認識手段と、
前記認識文字列に対して、文字列の分類を表す予め定められた分類項目の内、予め設定された複数の分類項目の全てに対して各分類項目に応じて、不要な文字列の削除および誤りのある文字列の削除を行なうことにより適合化処理を施し、前記複数の分類項目それぞれに対応した適合化文字列を生成する適合化文字列生成手段と、
複数の生成された前記適合化文字列のひとつを選択する選択方法、或いは、前記適合化文字列に対応する複数の分類項目のひとつを選択する選択方法の内、少なくともひとつの選択方法で選択を行う選択手段とを備え、
前記各分類項目に分類される文字列が含むことができる対象文字と、含むことができない除外文字とが定められている、文字認識装置。
前記複数の生成された前記適合化文字列を表示する表示方法、或いは前記適合化文字列に対応する複数の分類項目を表示する表示方法の内、少なくともひとつの表示方法で表示する表示手段と、
前記選択手段においてなされる選択がいずれの選択であるかの指示を入力する入力手段とをさらに備える、請求項１に記載の文字認識装置。
前記認識文字列が前記複数の分類項目のいずれの属性に適合しているかにより前記認識文字列が、前記複数の分類項目の各々のいずれの分類項目であるかを判定する分類項目判定手段をさらに備え、
前記選択手段における選択は、前記判定された分類項目或いは、判定された分類項目に対応する生成された適合化文字列をもってなされることを特徴とする請求項１に記載の文字認識装置。
前記予め定められた複数の分類項目に対して、それぞれ対応する文字列修正処理のための手段を備える文字列修正部をさらに備え、
前記文字列修正部は、適合化文字列が選択された後、前記選択された適合化文字列に応じた分類項目に対応する文字列修正処理のための手段によって、前記選択された適合化文字列の修正入力処理を行なう、請求項２に記載の文字認識装置。
前記適合化文字列の修正入力処理は、
前記表示手段での前記選択された適合化文字列に応じた分類項目に対応する文字コード体系を用いた表示処理、あるいは前記入力手段での前記選択された適合化文字列に応じた分類項目に対応する、入力キーと入力文字との対応付けテーブルを用いた入力処理のうち、少なくともいずれか一方を含む、請求項４に記載の文字認識装置。
前記予め定められた複数の分類項目を表示する表示手段と、
前記選択手段に対し、いずれの分類項目を選択するかの指示を入力する入力手段と、
前記選択手段により選択された前記適合化文字列を出力する文字列出力手段と、
前記予め定められた複数の分類項目に対して、それぞれ対応する文字列利用処理のための手段を備える文字列利用部とをさらに備え、
前記文字列利用部は、適合化文字列が選択された後、前記選択された適合化文字列に応じた分類項目に対応する文字列利用処理のための手段によって、前記選択された適合化文字列の利用処理を行なう、請求項１に記載の文字認識装置。
前記適合化文字列の利用処理は、
前記表示手段での前記選択された適合化文字列に応じた分類項目に対応する文字コード体系を用いた表示処理、あるいは前記入力手段での前記選択された適合化文字列に応じた分類項目に対応する、入力キーと入力文字との対応付けテーブルを用いた入力処理のうち、少なくともいずれか一方を含む、請求項６に記載の文字認識装置。
画像を撮像画像として撮像する画像撮像手段と、
前記撮像画像の文字列部分を画像文字列として抽出する文字列抽出手段と、
前記画像文字列に対して文字認識を行ない、認識文字列を生成する文字列認識手段と、
前記認識文字列が、予め設定された複数の分類項目のいずれの属性に適合しているかにより、前記認識文字列が、前記複数の分類項目の各々のいずれの分類項目であるかを判定する分類項目判定手段と、
外部から与えられる分類項目指定情報に応じて前記複数の分類項目のうちの１つを特定する分類項目特定手段と、
前記認識文字列に対して、前記分類項目判定手段により判定がなされた前記分類項目に応じて、不要な文字列の削除および誤りのある文字列の削除を行なうことにより適合化処理を施して適合化文字列を生成し、前記分類項目指定情報が与えられたときには前記分類項目特定手段で特定された分類項目に応じて再度前記適合化処理を施して適合化文字列を生成する文字列適合化手段とを備え、
前記各分類項目に分類される文字列が含むことができる対象文字と、含むことができない除外文字とが定められている、文字認識装置。
前記予め定められた複数の分類項目に対して、それぞれ対応する文字列修正処理のための手段を備える文字列修正部をさらに備え、
前記文字列修正部は、前記分類項目が判定または特定された後、判定または特定された分類項目に対応する文字列修正処理のための手段によって、前記生成された適合化文字列の修正入力処理を行なう、請求項８に記載の文字認識装置。
前記適合化文字列の修正入力処理は、
表示手段での前記生成された適合化文字列に応じた分類項目に対応する文字コード体系を用いた表示処理、あるいは入力手段での前記選択された適合化文字列に応じた分類項目に対応する、入力キーと入力文字との対応付けテーブルを用いた入力処理のうち、少なくともいずれか一方を含む、請求項９に記載の文字認識装置。
適合化文字列を出力する文字列出力手段と、
前記予め定められた複数の分類項目に対して、それぞれ対応する文字列利用処理のための手段を備える文字列利用部とをさらに備え、
前記文字列利用部は、前記分類項目が判定または特定された後、判定または特定された分類項目に対応する文字列利用処理のための手段によって、前記生成された適合化文字列の利用処理を行なう、請求項８に記載の文字認識装置。
前記適合化文字列の利用処理は、
表示手段での前記生成された適合化文字列に応じた分類項目に対応する文字コード体系を用いた表示処理、あるいは入力手段での前記生成された適合化文字列に応じた分類項目に対応する、入力キーと入力文字との対応付けテーブルを用いた入力処理のうち、少なくともいずれか一方を含む、請求項１１に記載の文字認識装置。
画像を入力する画像入力ステップと、
入力された前記画像の文字列部分を画像文字列として抽出する文字列抽出ステップと、
前記画像文字列に対して文字認識を行ない、認識文字列を生成する文字列認識ステップと、
前記認識文字列に対して、文字列の分類を表す予め定められた分類項目の内、予め設定された複数の分類項目の全てに対して各分類項目に応じて、不要な文字列の削除および誤りのある文字列の削除を行なうことにより適合化処理を施し、前記複数の分類項目それぞれに対応した適合化文字列を生成する適合化文字列生成ステップと、
複数の生成された前記適合化文字列のひとつを選択する選択方法、或いは、前記適合化文字列に対応する複数の分類項目のひとつを選択する選択方法の内、少なくともひとつの選択方法で選択するステップとをコンピュータに実行させ、
前記各分類項目に分類される文字列が含むことができる対象文字と、含むことができない除外文字とが定められている、プログラム。
画像を入力する画像入力ステップと、
入力された前記画像の文字列部分を画像文字列として抽出する文字列抽出ステップと、
前記画像文字列に対して文字認識を行ない、認識文字列を生成する文字列認識ステップと、
前記認識文字列が、予め定められた複数の分類項目のいずれの属性に適合しているかにより、前記認識文字列が、前記複数の分類項目の各々のいずれの分類項目であるかを判定する分類項目判定ステップと、
外部から与えられる分類項目指定情報に応じて前記複数の分類項目のうちの１つを特定する分類項目特定ステップと、
前記認識文字列に対して、前記分類項目判定ステップにより判定がなされた前記分類項目に応じて、不要な文字列の削除および誤りのある文字列の削除を行なうことにより適合化処理を施して適合化文字列を生成し、前記分類項目指定情報が与えられたときには前記分類項目特定ステップで特定された分類項目に応じて再度前記適合化処理を施して適合化文字列を生成する文字列適合化ステップとをコンピュータに実行させ、
前記各分類項目に分類される文字列が含むことができる対象文字と、含むことができない除外文字とが定められている、プログラム。
請求項１３または１４に記載したプログラムを記録したコンピュータ読取可能な記録媒体。