JP4785614B2

JP4785614B2 - 漢字の読みを生成する情報処理装置、情報処理方法、これらの情報処理をコンピュータに実行させるためのプログラム、およびそのプログラムを記録した記録媒体

Info

Publication number: JP4785614B2
Application number: JP2006135281A
Authority: JP
Inventors: 至幸小山
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2006-05-15
Filing date: 2006-05-15
Publication date: 2011-10-05
Anticipated expiration: 2026-05-15
Also published as: JP2007305046A

Description

本発明は、漢字の読みを生成する情報処理装置に関し、特に、漢字で表わされた姓名の読みを生成する装置に関する。

現在、光学式文字読取（ＯＣＲ：Optical Character Recognition）技術は、文書読取装置、帳票読取装置など、さまざまな文字読取装置に利用されている。その中には、名刺読取装置のように、名刺の紙面を撮像した画像情報から文字情報を認識し、認識された文字情報（文字列）を姓名、住所、会社名などの項目に分類する装置がある。このように分類された文字列の読みを生成する技術がある。このような文字列の読みを生成する技術に関して、たとえば、以下の公報に開示された技術がある。

特開平５−２０３００号公報（特許文献１）は、文字認識の認識精度を向上させ、かつ認識した文字の読みを正確に生成する技術を開示する。特許文献１に開示された文書処理装置は、名刺の表面イメージと裏面イメージとを読取るための読取り手段と、読取り手段で読取った表面イメージと裏面イメージとに基づいて、名刺の表面文字と裏面文字とを認識するための認識手段と、認識手段によって認識された裏面文字が英語表記であるのか否かを判定するための判定手段と、判定手段によって英語表記であると判定されたときには、表面文字と裏面文字とを住所、姓名、電話番号等の各住所録データに分割するための分割手段と、分割手段によって分割した表面文字と裏面文字の各住所録データをそれぞれ比較し、表面文字の表記と一致する裏面文字の表記を選択するための選択手段と、選択手段によって選択された裏面文字の表記に基づいて、その表記に対応する読みを生成するための生成手段と、生成手段によって生成された読みを、その読みに対応する表面文字の表記に関連づけて記憶するための記憶手段とを含む。

この公報に開示された文書処理装置によると、読取り手段によって読取られた名刺の表面イメージと裏面イメージとが、認識手段により表面文字と裏面文字として認識される。判定手段により裏面文字が英語表記であるのか否かが判定される。判定結果が英語表記であるときには、分割手段により表面文字と裏面文字とが住所、姓名、電話番号等の各住所録データに分割される。分割された表面文字と裏面文字との各住所録データが選択手段によりそれぞれ比較され、表面文字の表記と一致する裏面文字の表記が選択される。生成手段により、選択された裏面文字の表記に基づいて、その表記に対応する読みが生成される。生成された読みは、その読みに対応する表面文字の表記に関連づけられて、記憶手段に記憶される。したがって、名刺の裏面に表面文字の英語表記がある場合には、英語表記が参照されて表面文字が認識されるので、認識率が向上する。また、裏面の英語表記から読みが生成されるので、正確な読みを生成することができる。
特開平５−２０３００号公報

しかしながら、特許文献１に開示された文書処理装置においては、表面文字の表記に対応する読みを生成するためには、名刺の表面イメージと裏面イメージとを読取る必要があり時間がかかるという問題があった。

本発明は、上述の課題を解決するためになされたものであって、その目的は、姓名の読みを効率よく生成することができる情報処理装置、情報処理方法、これらの情報処理を実現するプログラム、およびそのプログラムを記録した記録媒体を提供することである。

第１の発明に係る情報処理装置は、漢字と漢字の読みを表わす表音文字（たとえばローマ字や仮名）とを対応させた第１の情報を予め記憶するための手段と、個人の姓名を表わす漢字と個人のメールアドレスに含まれる第２の情報とを取得するための取得手段と、第１の情報に基づいて、姓名を表わす漢字の読みの候補を生成するための生成手段と、第２の情報と候補とを照合した結果に基づいて、姓名を表わす漢字の読みを決定するための決定手段とを含む。

第１の発明によると、個人の姓名を表わす漢字と個人のメールアドレスに含まれる第２の情報とが取得手段により取得される。個人の姓名とメールアドレスとは、たとえば名刺の場合、表面あるいは裏面のいずれかの同一面上に記載されることが多い。そのため、名刺のいずれか一方の紙面のみを撮像した画像情報から姓名を表わす漢字と第２の情報とを取得することができる。取得された個人の姓名を表わす漢字の読みの候補が、漢字の読みを表音文字として予め記憶した第１の情報に基づいて生成される。生成された候補と、取得されたメールアドレスに含まれる第２の情報（たとえば、個人を識別するための情報（以下、個人識別情報とも称する））とを照合した結果（たとえば一致する文字の数や位置）に基づいて、姓名を表わす漢字の読みが決定される。メールアドレスには、個人の姓名の全部または一部の読みをローマ字で記載したものが含まれることが多い。そのため、生成された候補から姓名の読みを決定することができる。その結果、姓名の読みを効率よく決定することができる情報処理装置を提供することができる。

第２の発明に係る情報処理装置においては、第１の発明の構成に加えて、決定手段は、第２の情報と候補とで一致する文字の数に基づいて、読みを決定するための手段を含む。

第２の発明によると、第２の情報と候補とで一致する文字の数に基づいて、読みが決定される。そのため、姓名の全部または一部の読みと候補とで一致する文字の数に基づいて、個人の姓名の読みを決定することができる。そのため、姓名の読みを精度よく決定することができる。

第３の発明に係る情報処理装置においては、第２の発明の構成に加えて、決定手段は、一致する文字の数が最も多い候補を、読みとして決定するための手段を含む。

第３の発明によると、第２の情報と候補とで一致する文字の数が最も多い候補が読みとして決定される。そのため、他の候補に比べて個人の姓名の読みとより多く一致する候補を姓名の読みとして決定することができる。

第４の発明に係る情報処理装置においては、第１の発明の構成に加えて、決定手段は、第２の情報と候補とで一致する文字の位置に基づいて、読みを決定するための手段を含む。

第４の発明によると、第２の情報と候補とで一致する文字の位置に基づいて、読みが決定される。たとえば、先頭または末尾の文字が第２の情報の先頭または末尾の文字と一致する候補が優先されて、読みが決定される。先頭または末尾の文字が第２の情報の先頭または末尾の文字と一致する候補は一致しない候補と比べて、より正確な読みであることが多い。そのため、姓名の読みを精度よく決定することができる。

第５の発明に係る情報処理装置においては、第４の発明の構成に加えて、決定手段は、先頭の文字が第２の情報の先頭の文字と一致する候補を優先させて、読みを決定するための手段を含む。

第５の発明によると、先頭の文字が第２の情報の先頭の文字と一致する候補が優先されて、読みが決定される。先頭の文字が第２の情報の先頭の文字と一致する候補は一致しない候補と比べて、より正確な読みであることが多い。そのため、姓名の読みを精度よく決定することができる。

第６の発明に係る情報処理装置においては、第４の発明の構成に加えて、決定手段は、末尾の文字が第２の情報の末尾の文字と一致する候補を優先させて、読みを決定するための手段を含む。

第６の発明によると、末尾の文字が第２の情報の末尾の文字と一致する候補が優先されて、読みが決定される。末尾の文字が第２の情報の末尾の文字と一致する候補は一致しない候補と比べて、より正確な読みであることが多い。そのため、姓名の読みを精度よく決定することができる。

第７の発明に係る情報処理装置においては、第４〜第６のいずれかの発明の構成に加えて、生成手段は、姓を表わす漢字の読みである姓候補と名を表わす漢字の読みである名候補とを生成するための手段を含む。決定手段は、姓候補と第２の情報とで一致する文字の位置と、名候補と第２の情報とで一致する文字の位置とが、第２の情報において異なるように読みを決定するための手段を含む。

第７の発明によると、姓候補と名候補とが別々に生成される。姓候補と第２の情報とで一致する文字の位置と、名候補と第２の情報とで一致する文字の位置とが、第２の情報において異なるように読みが決定される。これにより、第２情報における姓候補および名候補と一致する文字が重複することが抑制されるため、姓および名の正確な読みを決定することができる。

第８の発明に係る情報処理装置においては、第１〜第７のいずれかの発明の構成に加えて、決定手段は、第２の情報および候補のいずれかの文字数に対する、第２の情報と候補とで一致する文字の数の割合が、すべての候補において予め定められた割合より小さい場合は、予め定められた条件を満足する候補を読みとして決定するための手段を含む。

第８の発明によると、第２の情報および候補のいずれかの文字数に対する、第２の情報と候補とで一致する文字の数の割合が、すべての候補において予め定められた割合より小さい場合は、予め定められた条件を満足する候補に読みが決定される。たとえば、姓名に用いられる頻度の高い候補が読みとして決定される。そのため、メールアドレスに個人の姓名が含まれない場合や、メールアドレスの一部が個人の姓名の読みの一部と偶然に一致する場合であっても、正確な読みを決定することができる。

第９の発明に係る情報処理装置においては、第８の発明の構成に加えて、決定手段は、姓名に用いられる頻度の高い候補を読みとして決定するための手段を含む。

第９の発明によると、一致する文字の数の割合が、すべての候補において予め定められた割合より小さい場合は、姓名に用いられる頻度の高い候補が読みとして決定される。そのため、メールアドレスに個人の姓名が含まれない場合や、メールアドレスの一部が個人の姓名の読みの一部と偶然に一致する場合であっても、正確な読みである可能性が高い候補を読みに決定することができる。

第１０の発明に係る情報処理装置においては、第１〜第７のいずれかの発明の構成に加えて、決定手段は、第２の情報および候補のいずれかの文字数に対する、第２の情報と候補とで一致する文字の数の割合が、すべての候補において予め定められた割合より小さい場合は、第２の情報に基づいて、読みを決定するための手段を含む。

第１０の発明によると、第２の情報および候補のいずれかの文字数に対する、第２の情報と候補とで一致する文字の数の割合が、すべての候補において予め定められた割合より小さい場合は、第２の情報に基づいて、読みが決定される。たとえば、第２の情報に対応する仮名が読みとして決定される。そのため、姓名の読みを決定することができ、かつ、正確な読みの候補が生成されない場合であっても、正確な読みである可能性が高い読みを決定することができる。

第１１の発明に係る情報処理装置は、第１〜第１０のいずれかの発明の構成に加えて、第２の情報に対応する仮名を生成するための手段をさらに含む。生成手段は、候補を仮名で生成するための手段を含む。決定手段は、対応する仮名と候補とを照合した結果に基づいて、読みを決定するための手段を含む。

第１１の発明によると、第２の情報に対応する仮名と候補の読みを表わす仮名とを照合した結果に基づいて、読みを決定することができる。

第１２の発明に係る情報処理装置においては、第１〜第１１のいずれかの発明の構成に加えて、第２の情報は、ローマ字を含む。生成手段は、候補をローマ字で生成するための手段を含む。

第１２の発明によると、第２の情報に含まれるローマ字と候補の読みを表わすローマ字とを照合した結果に基づいて、読みを決定することができる。

第１３の発明に係る情報処理装置においては、第１〜第１２のいずれかの発明の構成に加えて、第２の情報は、メールアドレスに含まれる個人を識別するための文字である。

第１３の発明によると、第２の情報は、メールアドレスに含まれる個人を識別するための文字である。メールアドレスに含まれる個人を識別するための文字には、個人の姓名の全部または一部をローマ字で記載したものが含まれることが多い。そのため、姓名の読みを精度よく生成することができる。

第１４の発明に係る情報処理装置においては、第１〜第１３のいずれかの発明の構成に加えて、取得手段は、撮像された画像情報を認識することにより文字情報を取得するための手段を含む。

第１４の発明によると、撮像された画像情報を認識することにより文字情報が取得される。そのため、たとえば、姓名とメールアドレスが記載された名刺などの像が撮像された画像情報から文字情報である姓名を表わす漢字およびメールアドレスを取得することができる。

第１５の発明に係る情報処理装置においては、第１〜第１４のいずれかの発明の構成に加えて、第１の情報は、漢字と、漢字を姓名に用いる場合の読みとを対応させた情報である。

第１５の発明によると、第１の情報は、漢字と、漢字を姓名に用いる場合の読みとを対応させた情報である。そのため、漢字のすべての読みを記憶する場合と比べて、第１の情報を記憶するための容量を低減することができる。

第１６の発明に係る情報処理方法は、記憶手段、取得手段、生成手段、および決定手段を備える情報処理装置によって行なわれる情報処理方法である。この情報処理方法は、漢字と漢字の読みを表わす表音文字とを対応させた第１の情報を、記憶手段を用いて記憶するステップと、個人の姓名を表わす漢字および個人のメールアドレスに含まれる第２の情報を、取得手段を用いて取得するステップと、第１の情報に基づいて、姓名を表わす漢字の読みの候補を、生成手段を用いて生成するステップと、第２の情報と候補とを照合した結果に基づいて、姓名を表わす漢字の読みを、決定手段を用いて決定するステップとを含む。

第１６の発明によると、個人の姓名を表わす漢字と個人のメールアドレスに含まれる第２の情報とが取得手段を用いて取得される。個人の姓名とメールアドレスとは、たとえば名刺の場合、表面あるいは裏面のいずれかの同一面上に記載されることが多い。そのため、名刺を撮像した画像情報から姓名を表わす漢字と第２の情報とを取得する場合、名刺のいずれか一方の面の画像情報を取得するだけでよい。取得された個人の姓名を表わす漢字の読みの候補が、漢字の読みを表音文字として予め記憶した第１の情報に基づいて生成される。生成された候補と、取得されたメールアドレスに含まれる第２の情報（たとえば、個人識別情報）とを照合した結果（たとえば一致する文字の数や位置）に基づいて、姓名を表わす漢字の読みが決定される。メールアドレスには、個人の姓名の全部または一部の読みをローマ字で記載したものが含まれることが多い。そのため、生成された候補のうちから姓名の読みを決定することができる。その結果、姓名の読みを効率よく生成することができる情報処理方法を提供することができる。

第１７の発明に係るプログラムは、第１６の発明に係る情報処理方法を実現するプログラムである。これにより、第１７の発明に係るプログラムを、たとえばコンピュータにインストールすることで、第１６の発明の情報処理方法をコンピュータに実行させることができる。

第１８の発明に係る記録媒体は、第１７の発明に係るプログラムを記録したコンピュータ読取可能な記録媒体である。これにより、第１８の発明に係る記録媒体から第１７の発明に係るプログラムを、たとえばコンピュータにインストールすることで、第１６の発明に係る情報処理方法をコンピュータに実行させることができる。

以下、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰返さない。なお、本実施の形態においては、名刺の画像情報から認識した姓名の読みを生成する情報処理装置について説明するが、本発明に係る情報処理装置はこれに限定されない。たとえば、本発明に係る情報処理装置は、通信先から受信した電子メール情報に含まれる姓名の読みを生成する装置に適用できる。

図１を参照して、本実施の形態に係る情報処理装置１００について説明する。情報処理装置１００は、入力装置２００と出力装置３００とに接続されている。

入力装置２００は、イメージスキャナやＣＣＤ（Charge Coupled Device）などで構成される。入力装置２００は、名刺などの被写体の像を入力して画像情報に変換し、情報処理装置１００に送信する。なお、入力装置２００は、通信先や記録媒体などから被写体の画像情報を入力する装置であってもよい。

出力装置３００は、液晶表示装置などで構成され、情報処理装置１００で生成した読みや他の文字列を出力する。

情報処理装置１００は、記憶部１２０と、文字認識部１３０と、情報取得部１４０と、生成部１５０と、決定部１６０と、これらの各部に接続された制御部１１０とを含む。

記憶部１２０は、各部で実行される処理の中間データを記憶する。また、記憶部１２０には、文字認識情報部１２２と、漢字読み情報部１２４とが予め記憶される。

文字認識部１３０は、制御部１１０からの制御信号を受信すると、入力装置２００から受信した画像情報を文字認識情報部１２２を用いて文字情報として認識する。文字認識技術としては、ＯＣＲを使用する。なお、他の技術を使用してもよい。

情報取得部１４０は、制御部１１０からの制御信号を受信すると、文字認識部１３０により認識された文字情報から姓名情報とメールアドレス情報とを取得する。

生成部１５０は、制御部１１０からの制御信号を受信すると、情報取得部１４０で取得された姓名情報の読みの候補を漢字読み情報部１２４を用いて生成する。

決定部１６０は、制御部１１０からの制御信号を受信すると、生成部１５０で生成された読みの候補とメールアドレス情報とを照合し、姓名情報の読みの候補から姓名情報の読みを決定する。

制御部１１０は、各部に制御信号を送信し各部の処理を制御したり、各部からの情報に基づいて演算したりして、情報処理装置１００全体を制御する。

図２を参照して、漢字読み情報部１２４について説明する。図２に示すように、漢字読み情報部１２４には、漢字とその読みを表わしたローマ字とが対応付けられて記憶される。漢字読み情報部１２４は、記憶容量を低減するために、漢字に対するすべての読みではなく、漢字が姓や名に用いられる場合の読みのみが記憶される。読みが複数ある場合は、姓名に用いられる頻度が高い順に記憶される。これは、たとえば「子」の場合、姓名に用いられる場合の読みの頻度が、「ｋｏ」のほうが「ｓｈｉ」より高いことが理由である。

なお、漢字読み情報部１２４の内容は、漢字とその読みを表わした情報であれば、図２に示したような情報に限定されない。たとえば、漢字読み情報部１２４は、１つの漢字に対して姓用の読みと名用の読みとが分けられて記憶される情報であってもよい。また、漢字読み情報部１２４は、読みが姓や名に用いられる頻度情報が予め記憶された情報であってもよい。漢字読み情報部１２４は、姓名に用いられる位置で読みの頻度が異なる漢字（たとえば、名の１文字目の場合は「よし」と、２文字目以降では「み」と読む頻度が高い「美」）に対して、姓名に用いられる位置に応じた読みの頻度情報をさらに記憶した情報であってもよい。漢字読み情報部１２４は、漢字ごとの情報ではなく、姓および名の単語単位での読みを記憶した情報であってもよい。

図３を参照して、本実施の形態に係る情報処理装置１００を構成する制御部１１０が読みの候補を生成する際に実行するプログラムの制御構造について説明する。

ステップ（以下、ステップをＳと略す）１００にて、制御部１１０は、入力装置２００から送信される画像情報を受信したか否かを判断する。受信すると（Ｓ１００にてＹＥＳ）、処理はＳ１０２に移される。そうでないと（Ｓ１００にてＮＯ）、処理はＳ１００に戻される。

Ｓ１０２にて、制御部１１０は、受信した画像情報を文字情報として認識させるように文字認識部１３０に制御信号を送信する。

Ｓ１０４にて、制御部１１０は、認識された文字情報から姓名情報を取得するように情報取得部１４０に制御信号を送信する。制御部１１０は、たとえば、姓名によく用いられる文字が連続している文字列を姓名情報として取得するように制御信号を送信する。なお、姓名情報の取得方法はこれに限定されない。たとえば、名刺の画像情報を受信した場合、制御部１１０は、受信した名刺の画像情報のうち、中央付近に存在する最も大きいサイズの文字列を姓名情報として取得するように制御信号を送信するようにしてもよい。

Ｓ１０６にて、制御部１１０は、認識された文字情報からメールアドレス情報を取得するように情報取得部１４０に制御信号を送信する。制御部１１０は、たとえば、受信した画像情報のうち、「＠」を含む一連の文字列から、「E-mail:」などのキーワード除いた文字列をメールアドレス情報として取得するように制御信号を送信する。なお、メールアドレス情報の取得方法はこれに限定されない。たとえば、制御部１１０は、「E-mail:」などのキーワードを含む文字列をメールアドレス情報として取得するように制御信号を送信してもよい。

Ｓ１０８にて、制御部１１０は、取得された姓名情報を姓情報と名情報とに分割するように情報取得部１４０に制御信号を送信する。制御部１１０は、たとえば、姓名情報の空白文字より前に記載された情報を姓情報、空白文字より後に記載された情報を名情報として分割するように制御信号を送信する。なお、空白文字がない場合は、分割する位置を姓名情報の文字列の中央付近にしたり、姓よりも名で使われる頻度が高い漢字の前にしたりしてもよい。また、分割する位置が複数考えられる場合は、複数の候補について以下のステップの処理を行ない、後述する候補決定処理で最良に一致するものを決定してもよい。

Ｓ１１０にて、制御部１１０は、姓情報と名情報とを記憶部１２０に記憶する。Ｓ１１２にて、制御部１１０は、姓情報の１文字を記憶部１２０から読み出す。

Ｓ１１４にて、制御部１１０は、読み出した姓情報の１文字についての読みを、漢字読み情報部１２４を用いて検索するように生成部１５０に制御信号を送信する。

Ｓ１１６にて、制御部１１０は、姓情報に含まれるすべての文字の読みを検索したか否かを判断する。すべての文字の読みを検索すると（Ｓ１１６にてＹＥＳ）、処理はＳ１１８に移される。そうでないと（Ｓ１１６にてＮＯ）、処理はＳ１１２に戻される。

Ｓ１１８にて、制御部１１０は、検索された読みを組合せて、姓情報の読みの候補（以下、姓候補とも称する）を生成するように生成部１５０に制御信号を送信する。制御部１１０は、検索された読みが複数存在する場合、すべての組合せの姓候補を生成する。

Ｓ１２０にて、制御部１１０は、名情報の１文字を記憶部１２０から読み出す。Ｓ１２２にて、制御部１１０は、読み出した名情報の１文字についての読みを、漢字読み情報部１２４を用いて検索するように生成部１５０に制御信号を送信する。

Ｓ１２４にて、制御部１１０は、名情報に含まれるすべての文字の読みを検索したか否かを判断する。すべての文字の読みを検索すると（Ｓ１２４にてＹＥＳ）、処理はＳ１２６に移される。そうでないと（Ｓ１２４にてＮＯ）、処理はＳ１２０に戻される。

Ｓ１２６にて、制御部１１０は、検索された読みを組合せて、名情報の読みの候補（以下、名候補とも称する）を生成するように生成部１５０に制御信号を送信する。制御部１１０は、検索された読みが複数存在する場合、すべての組合せの名候補を生成する。

図４を参照して、本実施の形態に係る情報処理装置１００を構成する制御部１１０が姓名情報の読みを決定する際に実行するプログラムの制御構造について説明する。

Ｓ２００にて、制御部１１０は、メールアドレス情報から個人識別情報を取得するように決定部１６０に制御信号を送信する。個人識別情報とは、メールアドレス情報に含まれる、個人を識別するための文字列である。制御部１１０は、たとえば、メールアドレス情報に含まれる「＠」より前の文字列を個人識別情報として取得する。

Ｓ２０２にて、制御部１１０は、取得された個人識別情報を分割するように決定部１６０に制御信号を送信する。制御部１１０は、たとえば、分割区切り文字の前後で個人識別情報を分割するように制御信号を送信する。分割区切り文字とは、メールアドレスに含まれる文字を区切るために使用される文字であり、たとえば、「_」、「.」、「-」、および数字などである。なお、Ｓ２００およびＳ２０２において、メールアドレス情報から個人識別情報を取得した後に個人識別情報を分割したが、メールアドレス情報を分割した後に個人識別情報を取得してもよい。

Ｓ２０４にて、制御部１１０は、分割された個人識別情報を記憶部１２０に記憶する。Ｓ２０６にて、制御部１１０は、分割された個人識別情報の１つを記憶部１２０から読み出す。Ｓ２０８にて、制御部１１０は、姓候補を記憶部１２０から読み出す。

Ｓ３００にて、制御部１１０は、読み出された個人識別情報と姓候補との一致度合を算出する。なお、本処理の詳細は後述する。

Ｓ２１０にて、制御部１１０は、すべての名候補の一致度合を算出したか否かを判断する。すべての名候補の一致度合を算出すると（Ｓ２１０にてＹＥＳ）、処理はＳ２１２に移される。そうでないと（Ｓ２１０にてＮＯ）、処理はＳ２０８に戻される。

Ｓ２１２にて、制御部１１０は、名候補を記憶部１２０から読み出す。Ｓ３００にて、制御部１１０は、読み出された個人識別情報と名候補との一致度合を算出する。Ｓ２１４にて、制御部１１０は、すべての名候補の一致度合を算出したか否かを判断する。すべての名候補の一致度合を算出すると（Ｓ２１４にてＹＥＳ）、処理はＳ２１６に移される。そうでないと（Ｓ２１４にてＮＯ）、処理はＳ２１２に戻される。

Ｓ２１６にて、制御部１１０は、分割された個人識別情報のすべての一致度合を算出したか否かを判断する。すべての一致度合を算出すると（Ｓ２１６にてＹＥＳ）、処理はＳ４００に移される。そうでないと（Ｓ２１６にてＮＯ）、処理はＳ２０６に戻される。

Ｓ４００にて、制御部１１０は、姓名の読みを決定するように決定部１６０に制御信号を送信する。なお、本処理の詳細は後述する。

Ｓ２１８にて、制御部１１０は、図５に示すような記憶部１２０に記憶されるローマ字と平仮名との対応情報を用いて、決定された読みの候補をローマ字から平仮名に変換する。なお、図５におけるローマ字は、ヘボン式で記載されているが、訓令式であってもよい。Ｓ２２０にて、制御部１１０は、変換した読みを出力装置３００に出力する。

図６を参照して、本実施の形態に係る情報処理装置１００を構成する制御部１１０が、個人識別情報と姓候補あるいは名候補との一致度合を算出する際に実行するプログラムの制御構造について説明する。なお、本構造についての説明においては、便宜上、姓候補と名候補とを区別することなく単に候補と記載する。

Ｓ３０２にて、制御部１１０は、個人識別情報と候補とで一致する文字数を一致数としてカウントする。なお、制御部１１０は、先頭および末尾を除き、連続して一致する文字数が１以下である場合には、一致数にカウントしない。

Ｓ３０４にて、制御部１１０は、個人識別情報または候補の先頭または末尾の文字が一致するか否かを判断する。一致すると（Ｓ３０４にてＹＥＳ）、処理はＳ３０６に移される。そうでないと（Ｓ３０４にてＮＯ）、処理はＳ３０８に移される。

Ｓ３０６にて、制御部１１０は、一致数にプラス１カウントする。Ｓ３０８にて、制御部１１０は、個人識別情報と候補とで一致する文字の個人識別情報における位置（以下、一致位置と称する）を記憶する。

図７を参照して、本実施の形態に係る情報処理装置１００を構成する制御部１１０が、姓名の読みを決定する際に実行するプログラムの制御構造について説明する。

Ｓ４０２にて、制御部１１０は、個人識別情報の文字数に対する一致数の割合が予め定められた割合より大きい姓候補が存在するか否かを判断する。制御部１１０は、たとえば、一致数の割合が０パーセントより大きい姓候補が存在するか否か（すなわち、一致する文字を含む姓候補が存在するか否か）を判断する。なお、一致数の割合は０パーセントに限定されない。また、制御部１１０は、姓候補の文字数に対する一致数の割合が予め定められた割合より大きい候補が存在するか否かを判断してもよい。予め定められた割合よりも大きい姓候補が存在すると（Ｓ４０２にてＹＥＳ）、処理はＳ４０４に移される。そうでないと（Ｓ４０２にてＮＯ）、処理はＳ４０６に移される。

Ｓ４０４にて、制御部１１０は、一致数が最も多い姓候補を姓情報の読みとして決定するように決定部１６０に制御信号を送信する。

Ｓ４０６にて、制御部１１０は、姓に用いられる頻度が高い姓候補を姓情報の読みとして決定するように決定部１６０に制御信号を送信する。すなわち、漢字読み情報部１２４は、姓名に用いられる頻度の高い順に読みを記憶しているため、制御部１１０は、漢字読み情報部１２４に最初に記憶されている読みを姓情報の読みに決定するように決定部１６０に制御信号を送信する。

Ｓ４０８にて、制御部１１０は、一致位置が決定された姓候補と重複しない名候補を抽出する。Ｓ４１０にて、制御部１１０は、抽出された名候補のうち、個人識別情報の文字数に対する一致数の割合が予め定められた割合より大きい名候補が存在するか否かを判断する。制御部１１０は、たとえば、一致数の割合が０パーセントより大きい名候補が存在するか否か（すなわち、一致する文字を含む名候補が存在するか否か）を判断する。なお、一致数の割合は０パーセントに限定されない。また、制御部１１０は、名候補の文字数に対する一致数の割合が予め定められた割合より大きい候補が存在するか否かを判断してもよい。予め定められた割合よりも大きい名候補が存在すると（Ｓ４１０にてＹＥＳ）、処理はＳ４１２に移される。そうでないと（Ｓ４１０にてＮＯ）、処理はＳ４１４に移される。

Ｓ４１２にて、制御部１１０は、一致数が最も多い名候補に名情報の読みを決定するように決定部１６０に制御信号を送信する。

Ｓ４１４にて、制御部１１０は、名に用いられる頻度が高い名候補に名情報の読みを決定するように決定部１６０に制御信号を送信する。すなわち、漢字読み情報部１２４は、読みを姓名に用いられる頻度の高い順に記憶しているため、制御部１１０は、漢字読み情報部１２４に最初に記憶されている読みを名情報の読みに決定するように決定部１６０に制御信号を送信する。

Ｓ４１６にて、制御部１１０は、決定した姓情報の読みと名情報の読みとを組合せて氏名情報の読みを決定するように決定部１６０に制御信号を送信する。

以上のような構造およびフローチャートに基づく、本実施の形態に係る情報処理装置１００の動作について説明する。

第１に、図８に示す名刺を文字認識した場合の動作を説明する。この名刺には、姓名を表わす漢字である「角田美子」、メールアドレス「ykakuta@xyz.com」が表面に記載されている。そのため、名刺の表面の像の画像情報を入力装置２００に入力するだけで、「角田美子」と「ykakuta@xyz.com」とが情報処理装置１００に入力される。

入力装置２００から画像情報を受信すると（Ｓ１００にてＹＥＳ）、「ＸＹＺ」、「総務部」、「角田美子」、「ＸＹＺ株式会社」、「大阪市阿倍野区○○町△△番□□号」、「電話（06）1234-5678」、「FAX（06）1234-9999」、「E-mail: ykakuta@xyz.com」の文字が認識される（Ｓ１０２）。これらの文字情報のうち、姓名でよく使われる文字が連続している「角田美子」が姓名情報として取得され（Ｓ１０４）、「E-mail」や「＠」を含む「E-mail: ykakuta@xyz.com」のうち、「E-mail:」を除いた「ykakuta@xyz.com」がメールアドレス情報として取得される（Ｓ１０６）。

姓名情報「角田美子」は、空白文字より前に記載された姓情報「角田」と、空白文字より後に記載された名情報「美子」とに分割され（Ｓ１０８）、記憶部１２０に記憶される（Ｓ１１０）。

「角田」のうち「角」と「田」の読み仮名が順次検索され（Ｓ１１２〜Ｓ１１６）、図９（Ａ）に示すように、「tsunota」、「tsunoda」などの複数の姓候補が生成される（Ｓ１１８）。「美子」についても同様にして、図９（Ｂ）に示すように、「miko」、「yoshiko」の名候補が生成される（Ｓ１２０〜Ｓ１２６）。

メールアドレス情報「ykakuta@xyz.com」のうち、「＠」より前の文字列「ykakuta」が個人識別情報として取得される（Ｓ２００）。なお、この「ykakuta」は、「角田美子」の読みである「かくたよしこ」の「よしこ」をローマ字で表わした「yoshiko」の最初の文字である「y」と、「かくた」をローマ字で表わした「kakuta」とを組合せたものである。

「ykakuta」と姓候補および名候補の一致度合が算出される（Ｓ３００）。図９（Ａ）に示すように、姓候補「tsunota」の場合、「ykakuta」と一致する「ta」の２文字分が一致数としてカウントされ（Ｓ３０２）、末尾の文字である「ａ」が一致しているため一致数にプラス１カウントされ（Ｓ３０６）、一致数の合計は「３」となる。さらに、一致位置が「ykakuta」における６文字目から７文字目であることが記憶される（Ｓ３０８）。このような処理がすべての姓候補について行なわれると（Ｓ２１０にてＹＥＳ）、名候補の一致度合も同様に算出される（Ｓ２１２、Ｓ３００）。

このようにして、図９（Ａ）および（Ｂ）のような算出結果を得ると、姓名の読みを決定する処理が行なわれる（Ｓ４００）。

一致数の合計が「７」で最も大きい姓候補「kakuta」に姓の読みが決定される（Ｓ４０２にてＹＥＳ、Ｓ４０４）。姓候補「kakuta」の一致位置は「２−７（「ykakuta」における２文字目から７文字目）」であるため、一致位置が重複しない「１−１（「ykakuta」における１文字目）」である「yoshiko」が抽出される（Ｓ４０８）。抽出された名候補は「yoshiko」だけであり一致数が最も多い候補であるため、名の読みが「yoshiko」に決定される（Ｓ４１０にてＹＥＳ、Ｓ４１２）。氏名情報の読みが「kakuta yoshiko」に決定される（Ｓ４１６）。「kakuta yoshiko」が「かくたよしこ」に変換され（Ｓ２１８）、出力装置３００に出力される（Ｓ２２０）。

このように、姓候補と名候補とが別々に生成され、姓候補および名候補と個人識別情報「ykakuta」との一致位置が重複しないように姓と名との読みが決定される。そのため、個人識別情報「ykakuta」における姓候補および名候補と一致する文字が重複することが抑制される。これにより、姓および名の正確な読みを決定することができる。

第２に、図１０に示す名刺を文字認識した場合の動作を説明する。図８に示す名刺を文字認識した場合と同様の処理が行なわれ（Ｓ１００〜Ｓ１２４）、氏名情報「角田美子」の姓候補と名候補が生成され（Ｓ１１８、Ｓ１２６）、個人識別情報「yo-kakuta」が取得される（Ｓ２００）。なお、この「yo-kakuta」は、「角田美子」の読みである「かくたよしこ」の「よしこ」をローマ字で表わした「yoshiko」の「yo」と、「かくた」をローマ字で表わした「kakuta」とを、「-」で組合せたものである。

「yo-kakuta」は、「-」の前後で「yo」と「kakuta」とに分割される（Ｓ２０２）。図１１に示すように、「yo」と各姓候補および各名候補との一致度合が算出される（Ｓ３００）。図１２に示すように、「kakuta」と各姓候補および各名候補との一致度合が算出される（Ｓ２１６、Ｓ３００）。

図１１（Ａ）に示すように、１つ目の個人識別情報「yo」と各姓候補とは一致する文字がなく、すべての候補の一致数の合計がゼロとして算出される。

図１１（Ｂ）に示すように、１つ目の個人識別情報「yo」と名候補「miko」とは、末尾の「o」が一致し一致数の合計が「２」と算出される（Ｓ３０２、Ｓ３０６）。１つ目の個人識別情報「yo」と名候補「yoshiko」とは、先頭の「yo」が一致し一致数合計が「３」と算出される（Ｓ３０２、Ｓ３０６）。

２つ目の個人識別情報「kakuta」についても同様に一致度合が算出され（Ｓ４００）、図１２に示すような算出結果となる。

２つ目の個人識別情報「kakuta」と完全に一致し、一致数の合計が最も多い「８」である姓候補「kakuta」が姓の読みとして決定される（Ｓ４０２にてＹＥＳ、Ｓ４０４）。２つ目の個人識別情報「kakuta」の１文字目から６文字目までと重複しない（Ｓ４０８）、１つ目の個人識別情報「yo」との一致数の合計が最も多い「yoshiko」が名の読みとして決定される（Ｓ４１０にてＹＥＳ、Ｓ４１２）。

第３に、図１３に示す名刺を文字認識した場合の動作を説明する。図８に示す名刺を文字認識した場合と同様の処理が行なわれ（Ｓ１００〜Ｓ１２４）、氏名情報「田中健」の姓候補と名候補が生成され（Ｓ１１８、Ｓ１２６）、個人識別情報「ktanaka」が取得される（Ｓ２００）。なお、この「ktanaka」は、「田中健」の読みである「たなかけん」の「けん」をローマ字で表わした「ken」の最初の文字である「k」と、「たなか」をローマ字で表わした「tanaka」とを組合せたものである。

一致度合の算出結果を図１４に示す。この場合、最も一致数の合計が多い姓候補「tanaka」が姓の読みに決定される（Ｓ４０２にてＹＥＳ、Ｓ４０４）。名候補「takeshi」は、他の名候補「ken」と一致数の合計が同じ「２」であるが、名候補「takeshi」の一致位置「２−３（「ktanaka」の２文字目から３文字目）」は、決定された姓候補「tanaka」の一致位置「２−７（「ktanaka」の２文字目から７文字目）」と重複しているため、「takeshi」は名候補として取得されずに「ken」が取得される（Ｓ４０８）。このように、個人識別情報における一致位置が重複しないように姓候補と名候補との読みが決定されるため、姓および名の正確な読みを決定することができる。

第４に、図１５に示す名刺を文字認識した場合の動作を説明する。図８に示す名刺を文字認識した場合と同様の処理が行なわれて（Ｓ１００〜Ｓ１２４）、氏名情報「田中健」の姓候補と名候補が生成され（Ｓ１１８、Ｓ１２６）、個人識別情報「ke-tanaka」とが取得される（Ｓ２００）。なお、この「ke-tanaka」は、「たなかけん」の「けん」をローマ字で表わした「ken」の「ke」と、「たなか」をローマ字で表わした「tanaka」とを、「-」で組合せたものである。

「ke-tanaka」は、「-」の前後で「ke」と「tanaka」とに分割される（Ｓ２０２）。一致度合の算出結果を図１６および図１７に示す。

図１６（Ａ）に示すように、１つ目の個人識別情報「ke」と各姓候補とは一致する文字がなく、すべての候補の一致数の合計がゼロとして算出される。

図１６（Ｂ）に示すように、１つ目の個人識別情報「ke」と名候補「ken」とは、「ke」の２文字が一致し、先頭の文字「k」が一致するため、一致数の合計が「３」と算出される。１つ目の個人識別情報「ke」と名候補「takeshi」とは、「takeshi」の中間の「ke」の２文字が一致するため一致数の合計が「２」と算出される。このように、一致する文字数が同じであっても、先頭の文字が一致する「ken」が、中間の文字が一致する「takeshi」より一致数の合計が多く算出される。これにより、正確な読みである「ken」を優先させて、姓名の読みを精度よく決定することができる。

２つ目の個人識別情報「tanaka」についても同様に一致度合が算出され、図１７に示すような算出結果となる。

２つ目の個人識別情報「tanaka」と完全に一致し、一致数の合計が最も多い「８」である姓候補「tanaka」が姓の読みとして決定される（Ｓ４０２にてＹＥＳ、Ｓ４０４）。決定された姓候補「tanaka」と一致位置が重複しない（Ｓ４０８）、１つ目の個人識別情報「ke」との一致数が最も多い「３」である「ken」が名の読みとして決定される（Ｓ４１０にてＹＥＳ、Ｓ４１２）。

なお、第１〜第４の動作の説明においては、一致数の割合が予め定められた割合より大きい候補が存在する場合（Ｓ４０２にてＹＥＳ、Ｓ４１０にてＹＥＳ）について説明した。これに対し、一致数の割合が予め定められた割合より大きい候補が存在しない場合（Ｓ４０２にてＮＯ、Ｓ４１０にてＮＯ）には、各候補のうち、姓名に用いられる頻度が高い候補が読みとして決定される（Ｓ４０６、Ｓ４１４）。すなわち、漢字読み情報部１２４は、姓名に用いられる頻度の高い順に読みを記憶しているため、漢字読み情報部１２４に最初に記憶されている読みを組合せた候補が読みに決定される。そのため、一致数の割合が予め定められた割合より大きい候補が存在しない場合であっても、正確な読みである可能性が高い候補を読みに決定することができる。

以上のように、本実施の形態に係る情報処理装置によれば、名刺の画像情報から氏名情報とメールアドレスの個人識別情報とが取得される。氏名を表わす漢字の読みの候補が個人識別情報と照合された結果で、正確な氏名の読みが決定される。そのため、姓名の読みを効率よく決定することができる。

なお、上述した実施の形態において、漢字読み情報部１２４は、図２に示すように、漢字とその読みを表わしたローマ字とが対応付けられて記憶されていたが、図１８に示すように、漢字とその読みを平仮名で表わした情報であってもよい。この場合、姓候補と名候補とを平仮名で生成し、個人識別情報に含まれるローマ字を平仮名に変換して、各候補と個人識別情報との平仮名の一致度合を算出することで、姓名の読みを決定することができる。

また、上述した実施の形態において、一致数の割合が予め定められた割合より大きい候補が存在しない場合（Ｓ４０２にてＮＯ、Ｓ４１０にてＮＯ）、姓や名に用いられる頻度が高い候補を読みとして決定した（Ｓ４０６、Ｓ４１４）。これに対し、たとえば、個人識別情報に含まれるローマ字を仮名に変換したものを、姓名の読みとして決定してもよい。これにより、姓名の読みを決定することができ、かつ、正確な読みの候補が生成されない場合であっても正確な読みである可能性が高い読みを決定することができる。

今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

本発明の実施の形態に係る情報処理装置１００の構成を示すブロック図である。本発明の実施の形態に係る情報処理装置１００に記憶される情報を示す図（その１）である。本発明の実施の形態に係る情報処理装置１００を構成する制御部の制御構造を示すフローチャート（その１）である。本発明の実施の形態に係る情報処理装置１００を構成する制御部の制御構造を示すフローチャート（その２）である。本発明の実施の形態に係る情報処理装置１００に記憶される情報を示す図（その２）である。本発明の実施の形態に係る情報処理装置１００を構成する制御部の制御構造を示すフローチャート（その３）である。本発明の実施の形態に係る情報処理装置１００を構成する制御部の制御構造を示すフローチャート（その４）である。本発明の実施の形態に係る情報処理装置１００が画像情報として取得する名刺を表わす図（その１）である。本発明の実施の形態に係る情報処理装置１００が算出した一致度合の結果を示す図（その１）である。本発明の実施の形態に係る情報処理装置１００が画像情報として取得する名刺を表わす図（その２）である。本発明の実施の形態に係る情報処理装置１００が算出した一致度合の結果を示す図（その２）である。本発明の実施の形態に係る情報処理装置１００が算出した一致度合の結果を示す図（その３）である。本発明の実施の形態に係る情報処理装置１００が画像情報として取得する名刺を表わす図（その３）である。本発明の実施の形態に係る情報処理装置１００が算出した一致度合の結果を示す図（その４）である。本発明の実施の形態に係る情報処理装置１００が画像情報として取得する名刺を表わす図（その４）である。本発明の実施の形態に係る情報処理装置１００が算出した一致度合の結果を示す図（その５）である。本発明の実施の形態に係る情報処理装置１００が算出した一致度合の結果を示す図（その６）である。本発明の実施の形態に係る情報処理装置１００に記憶される情報を示す図（その３）である。

符号の説明

１００情報処理装置、１１０制御部、１２０記憶部、１２２文字認識情報部、１２４漢字読み情報部、１３０文字認識部、１４０情報所得部、１５０生成部、１６０決定部。

Claims

漢字と前記漢字の読みを表わす表音文字とを対応させた第１の情報を予め記憶するための手段と、
個人の姓名を表わす漢字と前記個人のメールアドレスに含まれる第２の情報とを取得するための取得手段と、
前記第１の情報に基づいて、前記姓名を表わす漢字のうちの姓を表わす漢字の読みである姓候補と名を表わす漢字の読みである名候補とを生成するための生成手段と、
前記第２の情報と一致する文字の前記第２の情報における位置が互いに異なる前記姓候補および前記名候補を決定し、決定された前記姓候補および前記名候補をそれぞれ前記姓を表わす漢字の読みおよび前記名を表わす漢字の読みと決定するための決定手段とを含む、情報処理装置。
前記決定手段は、生成された前記姓候補のうち前記第２の情報と一致する文字の数が最も多い最多一致姓候補を前記姓を表わす漢字の読みと決定し、生成された前記名候補のうち前記第２の情報と一致する文字の位置が前記最多一致姓候補とは異なる非重複名候補を前記名を表わす漢字の読みと決定する、請求項１に記載の情報処理装置。
前記決定手段は、前記最多一致姓候補のうち先頭または末尾の文字が前記第２の情報の先頭または末尾の文字と一致する姓候補を優先的に前記姓を表わす漢字の読みと決定する、請求項２に記載の情報処理装置。
前記決定手段は、前記非重複名候補が複数存在する場合、複数の前記非重複名候補のうち前記第２の情報と一致する文字の数が最も多い非重複最多一致名候補を前記名を表わす漢字の読みと決定する、請求項２に記載の情報処理装置。
前記決定手段は、前記非重複最多一致名候補のうち先頭の文字または末尾の文字が前記第２の情報の先頭または末尾の文字と一致する名候補を優先的に前記名を表わす漢字の読みと決定する、請求項４に記載の情報処理装置。
前記決定手段は、前記第２の情報および前記姓候補のいずれかの文字数に対する、前記第２の情報と前記姓候補とで一致する文字の数の割合が、すべての姓候補において予め定められた割合より小さい場合は、姓に用いられる頻度の高い姓候補または前記第２の情報に対応する読みを前記姓を表わす漢字の読みと決定するための手段を含む、請求項１〜５のいずれかに記載の情報処理装置。
前記決定手段は、前記第２の情報および前記名候補のいずれかの文字数に対する、前記第２の情報と前記名候補とで一致する文字の数の割合が、すべての名候補において予め定められた割合より小さい場合は、名に用いられる頻度の高い名候補または前記第２の情報に対応する読みを前記名を表わす漢字の読みと決定するための手段を含む、請求項１〜５のいずれかに記載の情報処理装置。
前記情報処理装置は、前記第２の情報に対応する仮名を生成するための手段をさらに含み、
前記生成手段は、前記姓候補および前記名候補を仮名で生成するための手段を含み、
前記決定手段は、前記対応する仮名と前記姓候補および前記名候補とを照合した結果に基づいて、前記姓を表わす漢字の読みおよび前記名を表わす漢字の読みを決定するための手段を含む、請求項１〜５のいずれかに記載の情報処理装置。
前記第２の情報は、ローマ字を含み、
前記生成手段は、前記姓候補および前記名候補をローマ字で生成するための手段を含む、請求項１〜５のいずれかに記載の情報処理装置。
前記第２の情報は、前記メールアドレスに含まれる個人を識別するための文字である、請求項１〜５のいずれかに記載の情報処理装置。
前記取得手段は、撮像された画像情報を認識することにより文字情報を取得するための手段を含む、請求項１〜５のいずれかに記載の情報処理装置。
前記第１の情報は、前記漢字と、前記漢字を姓名に用いる場合の読みとを対応させた情報である、請求項１〜５のいずれかに記載の情報処理装置。
記憶手段、取得手段、生成手段、および決定手段を備える情報処理装置によって行われる情報処理方法であって、
漢字と前記漢字の読みを表わす表音文字とを対応させた第１の情報を、前記記憶手段を用いて記憶するステップと、
個人の姓名を表わす漢字および前記個人のメールアドレスに含まれる第２の情報を、前記取得手段を用いて取得するステップと、
前記第１の情報に基づいて、前記姓名を表わす漢字のうちの姓を表わす漢字の読みである姓候補と名を表わす漢字の読みである名候補とを、前記生成手段を用いて生成するステップと、
前記第２の情報と一致する文字の前記第２の情報における位置が互いに異なる前記姓候補および前記名候補を決定し、決定された前記姓候補および前記名候補をそれぞれ前記姓を表わす漢字の読みおよび前記名を表わす漢字の読みと前記決定手段を用いて決定するステップとを含む、情報処理方法。
請求項１３に記載の情報処理方法をコンピュータに実行させるためのプログラム。
請求項１４に記載のプログラムを記録したコンピュータ読取可能な記録媒体。