しかしながら、特許文献1に開示された文書処理装置においては、表面文字の表記に対応する読みを生成するためには、名刺の表面イメージと裏面イメージとを読取る必要があり時間がかかるという問題があった。
本発明は、上述の課題を解決するためになされたものであって、その目的は、姓名の読みを効率よく生成することができる情報処理装置、情報処理方法、これらの情報処理を実現するプログラム、およびそのプログラムを記録した記録媒体を提供することである。
第1の発明に係る情報処理装置は、漢字と漢字の読みを表わす表音文字(たとえばローマ字や仮名)とを対応させた第1の情報を予め記憶するための手段と、個人の姓名を表わす漢字と個人のメールアドレスに含まれる第2の情報とを取得するための取得手段と、第1の情報に基づいて、姓名を表わす漢字の読みの候補を生成するための生成手段と、第2の情報と候補とを照合した結果に基づいて、姓名を表わす漢字の読みを決定するための決定手段とを含む。
第1の発明によると、個人の姓名を表わす漢字と個人のメールアドレスに含まれる第2の情報とが取得手段により取得される。個人の姓名とメールアドレスとは、たとえば名刺の場合、表面あるいは裏面のいずれかの同一面上に記載されることが多い。そのため、名刺のいずれか一方の紙面のみを撮像した画像情報から姓名を表わす漢字と第2の情報とを取得することができる。取得された個人の姓名を表わす漢字の読みの候補が、漢字の読みを表音文字として予め記憶した第1の情報に基づいて生成される。生成された候補と、取得されたメールアドレスに含まれる第2の情報(たとえば、個人を識別するための情報(以下、個人識別情報とも称する))とを照合した結果(たとえば一致する文字の数や位置)に基づいて、姓名を表わす漢字の読みが決定される。メールアドレスには、個人の姓名の全部または一部の読みをローマ字で記載したものが含まれることが多い。そのため、生成された候補から姓名の読みを決定することができる。その結果、姓名の読みを効率よく決定することができる情報処理装置を提供することができる。
第2の発明に係る情報処理装置においては、第1の発明の構成に加えて、決定手段は、第2の情報と候補とで一致する文字の数に基づいて、読みを決定するための手段を含む。
第2の発明によると、第2の情報と候補とで一致する文字の数に基づいて、読みが決定される。そのため、姓名の全部または一部の読みと候補とで一致する文字の数に基づいて、個人の姓名の読みを決定することができる。そのため、姓名の読みを精度よく決定することができる。
第3の発明に係る情報処理装置においては、第2の発明の構成に加えて、決定手段は、一致する文字の数が最も多い候補を、読みとして決定するための手段を含む。
第3の発明によると、第2の情報と候補とで一致する文字の数が最も多い候補が読みとして決定される。そのため、他の候補に比べて個人の姓名の読みとより多く一致する候補を姓名の読みとして決定することができる。
第4の発明に係る情報処理装置においては、第1の発明の構成に加えて、決定手段は、第2の情報と候補とで一致する文字の位置に基づいて、読みを決定するための手段を含む。
第4の発明によると、第2の情報と候補とで一致する文字の位置に基づいて、読みが決定される。たとえば、先頭または末尾の文字が第2の情報の先頭または末尾の文字と一致する候補が優先されて、読みが決定される。先頭または末尾の文字が第2の情報の先頭または末尾の文字と一致する候補は一致しない候補と比べて、より正確な読みであることが多い。そのため、姓名の読みを精度よく決定することができる。
第5の発明に係る情報処理装置においては、第4の発明の構成に加えて、決定手段は、先頭の文字が第2の情報の先頭の文字と一致する候補を優先させて、読みを決定するための手段を含む。
第5の発明によると、先頭の文字が第2の情報の先頭の文字と一致する候補が優先されて、読みが決定される。先頭の文字が第2の情報の先頭の文字と一致する候補は一致しない候補と比べて、より正確な読みであることが多い。そのため、姓名の読みを精度よく決定することができる。
第6の発明に係る情報処理装置においては、第4の発明の構成に加えて、決定手段は、末尾の文字が第2の情報の末尾の文字と一致する候補を優先させて、読みを決定するための手段を含む。
第6の発明によると、末尾の文字が第2の情報の末尾の文字と一致する候補が優先されて、読みが決定される。末尾の文字が第2の情報の末尾の文字と一致する候補は一致しない候補と比べて、より正確な読みであることが多い。そのため、姓名の読みを精度よく決定することができる。
第7の発明に係る情報処理装置においては、第4〜第6のいずれかの発明の構成に加えて、生成手段は、姓を表わす漢字の読みである姓候補と名を表わす漢字の読みである名候補とを生成するための手段を含む。決定手段は、姓候補と第2の情報とで一致する文字の位置と、名候補と第2の情報とで一致する文字の位置とが、第2の情報において異なるように読みを決定するための手段を含む。
第7の発明によると、姓候補と名候補とが別々に生成される。姓候補と第2の情報とで一致する文字の位置と、名候補と第2の情報とで一致する文字の位置とが、第2の情報において異なるように読みが決定される。これにより、第2情報における姓候補および名候補と一致する文字が重複することが抑制されるため、姓および名の正確な読みを決定することができる。
第8の発明に係る情報処理装置においては、第1〜第7のいずれかの発明の構成に加えて、決定手段は、第2の情報および候補のいずれかの文字数に対する、第2の情報と候補とで一致する文字の数の割合が、すべての候補において予め定められた割合より小さい場合は、予め定められた条件を満足する候補を読みとして決定するための手段を含む。
第8の発明によると、第2の情報および候補のいずれかの文字数に対する、第2の情報と候補とで一致する文字の数の割合が、すべての候補において予め定められた割合より小さい場合は、予め定められた条件を満足する候補に読みが決定される。たとえば、姓名に用いられる頻度の高い候補が読みとして決定される。そのため、メールアドレスに個人の姓名が含まれない場合や、メールアドレスの一部が個人の姓名の読みの一部と偶然に一致する場合であっても、正確な読みを決定することができる。
第9の発明に係る情報処理装置においては、第8の発明の構成に加えて、決定手段は、姓名に用いられる頻度の高い候補を読みとして決定するための手段を含む。
第9の発明によると、一致する文字の数の割合が、すべての候補において予め定められた割合より小さい場合は、姓名に用いられる頻度の高い候補が読みとして決定される。そのため、メールアドレスに個人の姓名が含まれない場合や、メールアドレスの一部が個人の姓名の読みの一部と偶然に一致する場合であっても、正確な読みである可能性が高い候補を読みに決定することができる。
第10の発明に係る情報処理装置においては、第1〜第7のいずれかの発明の構成に加えて、決定手段は、第2の情報および候補のいずれかの文字数に対する、第2の情報と候補とで一致する文字の数の割合が、すべての候補において予め定められた割合より小さい場合は、第2の情報に基づいて、読みを決定するための手段を含む。
第10の発明によると、第2の情報および候補のいずれかの文字数に対する、第2の情報と候補とで一致する文字の数の割合が、すべての候補において予め定められた割合より小さい場合は、第2の情報に基づいて、読みが決定される。たとえば、第2の情報に対応する仮名が読みとして決定される。そのため、姓名の読みを決定することができ、かつ、正確な読みの候補が生成されない場合であっても、正確な読みである可能性が高い読みを決定することができる。
第11の発明に係る情報処理装置は、第1〜第10のいずれかの発明の構成に加えて、第2の情報に対応する仮名を生成するための手段をさらに含む。生成手段は、候補を仮名で生成するための手段を含む。決定手段は、対応する仮名と候補とを照合した結果に基づいて、読みを決定するための手段を含む。
第11の発明によると、第2の情報に対応する仮名と候補の読みを表わす仮名とを照合した結果に基づいて、読みを決定することができる。
第12の発明に係る情報処理装置においては、第1〜第11のいずれかの発明の構成に加えて、第2の情報は、ローマ字を含む。生成手段は、候補をローマ字で生成するための手段を含む。
第12の発明によると、第2の情報に含まれるローマ字と候補の読みを表わすローマ字とを照合した結果に基づいて、読みを決定することができる。
第13の発明に係る情報処理装置においては、第1〜第12のいずれかの発明の構成に加えて、第2の情報は、メールアドレスに含まれる個人を識別するための文字である。
第13の発明によると、第2の情報は、メールアドレスに含まれる個人を識別するための文字である。メールアドレスに含まれる個人を識別するための文字には、個人の姓名の全部または一部をローマ字で記載したものが含まれることが多い。そのため、姓名の読みを精度よく生成することができる。
第14の発明に係る情報処理装置においては、第1〜第13のいずれかの発明の構成に加えて、取得手段は、撮像された画像情報を認識することにより文字情報を取得するための手段を含む。
第14の発明によると、撮像された画像情報を認識することにより文字情報が取得される。そのため、たとえば、姓名とメールアドレスが記載された名刺などの像が撮像された画像情報から文字情報である姓名を表わす漢字およびメールアドレスを取得することができる。
第15の発明に係る情報処理装置においては、第1〜第14のいずれかの発明の構成に加えて、第1の情報は、漢字と、漢字を姓名に用いる場合の読みとを対応させた情報である。
第15の発明によると、第1の情報は、漢字と、漢字を姓名に用いる場合の読みとを対応させた情報である。そのため、漢字のすべての読みを記憶する場合と比べて、第1の情報を記憶するための容量を低減することができる。
第16の発明に係る情報処理方法は、記憶手段、取得手段、生成手段、および決定手段を備える情報処理装置によって行なわれる情報処理方法である。この情報処理方法は、漢字と漢字の読みを表わす表音文字とを対応させた第1の情報を、記憶手段を用いて記憶するステップと、個人の姓名を表わす漢字および個人のメールアドレスに含まれる第2の情報を、取得手段を用いて取得するステップと、第1の情報に基づいて、姓名を表わす漢字の読みの候補を、生成手段を用いて生成するステップと、第2の情報と候補とを照合した結果に基づいて、姓名を表わす漢字の読みを、決定手段を用いて決定するステップとを含む。
第16の発明によると、個人の姓名を表わす漢字と個人のメールアドレスに含まれる第2の情報とが取得手段を用いて取得される。個人の姓名とメールアドレスとは、たとえば名刺の場合、表面あるいは裏面のいずれかの同一面上に記載されることが多い。そのため、名刺を撮像した画像情報から姓名を表わす漢字と第2の情報とを取得する場合、名刺のいずれか一方の面の画像情報を取得するだけでよい。取得された個人の姓名を表わす漢字の読みの候補が、漢字の読みを表音文字として予め記憶した第1の情報に基づいて生成される。生成された候補と、取得されたメールアドレスに含まれる第2の情報(たとえば、個人識別情報)とを照合した結果(たとえば一致する文字の数や位置)に基づいて、姓名を表わす漢字の読みが決定される。メールアドレスには、個人の姓名の全部または一部の読みをローマ字で記載したものが含まれることが多い。そのため、生成された候補のうちから姓名の読みを決定することができる。その結果、姓名の読みを効率よく生成することができる情報処理方法を提供することができる。
第17の発明に係るプログラムは、第16の発明に係る情報処理方法を実現するプログラムである。これにより、第17の発明に係るプログラムを、たとえばコンピュータにインストールすることで、第16の発明の情報処理方法をコンピュータに実行させることができる。
第18の発明に係る記録媒体は、第17の発明に係るプログラムを記録したコンピュータ読取可能な記録媒体である。これにより、第18の発明に係る記録媒体から第17の発明に係るプログラムを、たとえばコンピュータにインストールすることで、第16の発明に係る情報処理方法をコンピュータに実行させることができる。
以下、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰返さない。なお、本実施の形態においては、名刺の画像情報から認識した姓名の読みを生成する情報処理装置について説明するが、本発明に係る情報処理装置はこれに限定されない。たとえば、本発明に係る情報処理装置は、通信先から受信した電子メール情報に含まれる姓名の読みを生成する装置に適用できる。
図1を参照して、本実施の形態に係る情報処理装置100について説明する。情報処理装置100は、入力装置200と出力装置300とに接続されている。
入力装置200は、イメージスキャナやCCD(Charge Coupled Device)などで構成される。入力装置200は、名刺などの被写体の像を入力して画像情報に変換し、情報処理装置100に送信する。なお、入力装置200は、通信先や記録媒体などから被写体の画像情報を入力する装置であってもよい。
出力装置300は、液晶表示装置などで構成され、情報処理装置100で生成した読みや他の文字列を出力する。
情報処理装置100は、記憶部120と、文字認識部130と、情報取得部140と、生成部150と、決定部160と、これらの各部に接続された制御部110とを含む。
記憶部120は、各部で実行される処理の中間データを記憶する。また、記憶部120には、文字認識情報部122と、漢字読み情報部124とが予め記憶される。
文字認識部130は、制御部110からの制御信号を受信すると、入力装置200から受信した画像情報を文字認識情報部122を用いて文字情報として認識する。文字認識技術としては、OCRを使用する。なお、他の技術を使用してもよい。
情報取得部140は、制御部110からの制御信号を受信すると、文字認識部130により認識された文字情報から姓名情報とメールアドレス情報とを取得する。
生成部150は、制御部110からの制御信号を受信すると、情報取得部140で取得された姓名情報の読みの候補を漢字読み情報部124を用いて生成する。
決定部160は、制御部110からの制御信号を受信すると、生成部150で生成された読みの候補とメールアドレス情報とを照合し、姓名情報の読みの候補から姓名情報の読みを決定する。
制御部110は、各部に制御信号を送信し各部の処理を制御したり、各部からの情報に基づいて演算したりして、情報処理装置100全体を制御する。
図2を参照して、漢字読み情報部124について説明する。図2に示すように、漢字読み情報部124には、漢字とその読みを表わしたローマ字とが対応付けられて記憶される。漢字読み情報部124は、記憶容量を低減するために、漢字に対するすべての読みではなく、漢字が姓や名に用いられる場合の読みのみが記憶される。読みが複数ある場合は、姓名に用いられる頻度が高い順に記憶される。これは、たとえば「子」の場合、姓名に用いられる場合の読みの頻度が、「ko」のほうが「shi」より高いことが理由である。
なお、漢字読み情報部124の内容は、漢字とその読みを表わした情報であれば、図2に示したような情報に限定されない。たとえば、漢字読み情報部124は、1つの漢字に対して姓用の読みと名用の読みとが分けられて記憶される情報であってもよい。また、漢字読み情報部124は、読みが姓や名に用いられる頻度情報が予め記憶された情報であってもよい。漢字読み情報部124は、姓名に用いられる位置で読みの頻度が異なる漢字(たとえば、名の1文字目の場合は「よし」と、2文字目以降では「み」と読む頻度が高い「美」)に対して、姓名に用いられる位置に応じた読みの頻度情報をさらに記憶した情報であってもよい。漢字読み情報部124は、漢字ごとの情報ではなく、姓および名の単語単位での読みを記憶した情報であってもよい。
図3を参照して、本実施の形態に係る情報処理装置100を構成する制御部110が読みの候補を生成する際に実行するプログラムの制御構造について説明する。
ステップ(以下、ステップをSと略す)100にて、制御部110は、入力装置200から送信される画像情報を受信したか否かを判断する。受信すると(S100にてYES)、処理はS102に移される。そうでないと(S100にてNO)、処理はS100に戻される。
S102にて、制御部110は、受信した画像情報を文字情報として認識させるように文字認識部130に制御信号を送信する。
S104にて、制御部110は、認識された文字情報から姓名情報を取得するように情報取得部140に制御信号を送信する。制御部110は、たとえば、姓名によく用いられる文字が連続している文字列を姓名情報として取得するように制御信号を送信する。なお、姓名情報の取得方法はこれに限定されない。たとえば、名刺の画像情報を受信した場合、制御部110は、受信した名刺の画像情報のうち、中央付近に存在する最も大きいサイズの文字列を姓名情報として取得するように制御信号を送信するようにしてもよい。
S106にて、制御部110は、認識された文字情報からメールアドレス情報を取得するように情報取得部140に制御信号を送信する。制御部110は、たとえば、受信した画像情報のうち、「@」を含む一連の文字列から、「E-mail:」などのキーワード除いた文字列をメールアドレス情報として取得するように制御信号を送信する。なお、メールアドレス情報の取得方法はこれに限定されない。たとえば、制御部110は、「E-mail:」などのキーワードを含む文字列をメールアドレス情報として取得するように制御信号を送信してもよい。
S108にて、制御部110は、取得された姓名情報を姓情報と名情報とに分割するように情報取得部140に制御信号を送信する。制御部110は、たとえば、姓名情報の空白文字より前に記載された情報を姓情報、空白文字より後に記載された情報を名情報として分割するように制御信号を送信する。なお、空白文字がない場合は、分割する位置を姓名情報の文字列の中央付近にしたり、姓よりも名で使われる頻度が高い漢字の前にしたりしてもよい。また、分割する位置が複数考えられる場合は、複数の候補について以下のステップの処理を行ない、後述する候補決定処理で最良に一致するものを決定してもよい。
S110にて、制御部110は、姓情報と名情報とを記憶部120に記憶する。S112にて、制御部110は、姓情報の1文字を記憶部120から読み出す。
S114にて、制御部110は、読み出した姓情報の1文字についての読みを、漢字読み情報部124を用いて検索するように生成部150に制御信号を送信する。
S116にて、制御部110は、姓情報に含まれるすべての文字の読みを検索したか否かを判断する。すべての文字の読みを検索すると(S116にてYES)、処理はS118に移される。そうでないと(S116にてNO)、処理はS112に戻される。
S118にて、制御部110は、検索された読みを組合せて、姓情報の読みの候補(以下、姓候補とも称する)を生成するように生成部150に制御信号を送信する。制御部110は、検索された読みが複数存在する場合、すべての組合せの姓候補を生成する。
S120にて、制御部110は、名情報の1文字を記憶部120から読み出す。S122にて、制御部110は、読み出した名情報の1文字についての読みを、漢字読み情報部124を用いて検索するように生成部150に制御信号を送信する。
S124にて、制御部110は、名情報に含まれるすべての文字の読みを検索したか否かを判断する。すべての文字の読みを検索すると(S124にてYES)、処理はS126に移される。そうでないと(S124にてNO)、処理はS120に戻される。
S126にて、制御部110は、検索された読みを組合せて、名情報の読みの候補(以下、名候補とも称する)を生成するように生成部150に制御信号を送信する。制御部110は、検索された読みが複数存在する場合、すべての組合せの名候補を生成する。
図4を参照して、本実施の形態に係る情報処理装置100を構成する制御部110が姓名情報の読みを決定する際に実行するプログラムの制御構造について説明する。
S200にて、制御部110は、メールアドレス情報から個人識別情報を取得するように決定部160に制御信号を送信する。個人識別情報とは、メールアドレス情報に含まれる、個人を識別するための文字列である。制御部110は、たとえば、メールアドレス情報に含まれる「@」より前の文字列を個人識別情報として取得する。
S202にて、制御部110は、取得された個人識別情報を分割するように決定部160に制御信号を送信する。制御部110は、たとえば、分割区切り文字の前後で個人識別情報を分割するように制御信号を送信する。分割区切り文字とは、メールアドレスに含まれる文字を区切るために使用される文字であり、たとえば、「_」、「.」、「-」、および数字などである。なお、S200およびS202において、メールアドレス情報から個人識別情報を取得した後に個人識別情報を分割したが、メールアドレス情報を分割した後に個人識別情報を取得してもよい。
S204にて、制御部110は、分割された個人識別情報を記憶部120に記憶する。S206にて、制御部110は、分割された個人識別情報の1つを記憶部120から読み出す。S208にて、制御部110は、姓候補を記憶部120から読み出す。
S300にて、制御部110は、読み出された個人識別情報と姓候補との一致度合を算出する。なお、本処理の詳細は後述する。
S210にて、制御部110は、すべての名候補の一致度合を算出したか否かを判断する。すべての名候補の一致度合を算出すると(S210にてYES)、処理はS212に移される。そうでないと(S210にてNO)、処理はS208に戻される。
S212にて、制御部110は、名候補を記憶部120から読み出す。S300にて、制御部110は、読み出された個人識別情報と名候補との一致度合を算出する。S214にて、制御部110は、すべての名候補の一致度合を算出したか否かを判断する。すべての名候補の一致度合を算出すると(S214にてYES)、処理はS216に移される。そうでないと(S214にてNO)、処理はS212に戻される。
S216にて、制御部110は、分割された個人識別情報のすべての一致度合を算出したか否かを判断する。すべての一致度合を算出すると(S216にてYES)、処理はS400に移される。そうでないと(S216にてNO)、処理はS206に戻される。
S400にて、制御部110は、姓名の読みを決定するように決定部160に制御信号を送信する。なお、本処理の詳細は後述する。
S218にて、制御部110は、図5に示すような記憶部120に記憶されるローマ字と平仮名との対応情報を用いて、決定された読みの候補をローマ字から平仮名に変換する。なお、図5におけるローマ字は、ヘボン式で記載されているが、訓令式であってもよい。S220にて、制御部110は、変換した読みを出力装置300に出力する。
図6を参照して、本実施の形態に係る情報処理装置100を構成する制御部110が、個人識別情報と姓候補あるいは名候補との一致度合を算出する際に実行するプログラムの制御構造について説明する。なお、本構造についての説明においては、便宜上、姓候補と名候補とを区別することなく単に候補と記載する。
S302にて、制御部110は、個人識別情報と候補とで一致する文字数を一致数としてカウントする。なお、制御部110は、先頭および末尾を除き、連続して一致する文字数が1以下である場合には、一致数にカウントしない。
S304にて、制御部110は、個人識別情報または候補の先頭または末尾の文字が一致するか否かを判断する。一致すると(S304にてYES)、処理はS306に移される。そうでないと(S304にてNO)、処理はS308に移される。
S306にて、制御部110は、一致数にプラス1カウントする。S308にて、制御部110は、個人識別情報と候補とで一致する文字の個人識別情報における位置(以下、一致位置と称する)を記憶する。
図7を参照して、本実施の形態に係る情報処理装置100を構成する制御部110が、姓名の読みを決定する際に実行するプログラムの制御構造について説明する。
S402にて、制御部110は、個人識別情報の文字数に対する一致数の割合が予め定められた割合より大きい姓候補が存在するか否かを判断する。制御部110は、たとえば、一致数の割合が0パーセントより大きい姓候補が存在するか否か(すなわち、一致する文字を含む姓候補が存在するか否か)を判断する。なお、一致数の割合は0パーセントに限定されない。また、制御部110は、姓候補の文字数に対する一致数の割合が予め定められた割合より大きい候補が存在するか否かを判断してもよい。予め定められた割合よりも大きい姓候補が存在すると(S402にてYES)、処理はS404に移される。そうでないと(S402にてNO)、処理はS406に移される。
S404にて、制御部110は、一致数が最も多い姓候補を姓情報の読みとして決定するように決定部160に制御信号を送信する。
S406にて、制御部110は、姓に用いられる頻度が高い姓候補を姓情報の読みとして決定するように決定部160に制御信号を送信する。すなわち、漢字読み情報部124は、姓名に用いられる頻度の高い順に読みを記憶しているため、制御部110は、漢字読み情報部124に最初に記憶されている読みを姓情報の読みに決定するように決定部160に制御信号を送信する。
S408にて、制御部110は、一致位置が決定された姓候補と重複しない名候補を抽出する。S410にて、制御部110は、抽出された名候補のうち、個人識別情報の文字数に対する一致数の割合が予め定められた割合より大きい名候補が存在するか否かを判断する。制御部110は、たとえば、一致数の割合が0パーセントより大きい名候補が存在するか否か(すなわち、一致する文字を含む名候補が存在するか否か)を判断する。なお、一致数の割合は0パーセントに限定されない。また、制御部110は、名候補の文字数に対する一致数の割合が予め定められた割合より大きい候補が存在するか否かを判断してもよい。予め定められた割合よりも大きい名候補が存在すると(S410にてYES)、処理はS412に移される。そうでないと(S410にてNO)、処理はS414に移される。
S412にて、制御部110は、一致数が最も多い名候補に名情報の読みを決定するように決定部160に制御信号を送信する。
S414にて、制御部110は、名に用いられる頻度が高い名候補に名情報の読みを決定するように決定部160に制御信号を送信する。すなわち、漢字読み情報部124は、読みを姓名に用いられる頻度の高い順に記憶しているため、制御部110は、漢字読み情報部124に最初に記憶されている読みを名情報の読みに決定するように決定部160に制御信号を送信する。
S416にて、制御部110は、決定した姓情報の読みと名情報の読みとを組合せて氏名情報の読みを決定するように決定部160に制御信号を送信する。
以上のような構造およびフローチャートに基づく、本実施の形態に係る情報処理装置100の動作について説明する。
第1に、図8に示す名刺を文字認識した場合の動作を説明する。この名刺には、姓名を表わす漢字である「角田 美子」、メールアドレス「ykakuta@xyz.com」が表面に記載されている。そのため、名刺の表面の像の画像情報を入力装置200に入力するだけで、「角田 美子」と「ykakuta@xyz.com」とが情報処理装置100に入力される。
入力装置200から画像情報を受信すると(S100にてYES)、「XYZ」、「総務部」、「角田 美子」、「XYZ株式会社」、「大阪市阿倍野区○○町△△番□□号」、「電話(06)1234-5678」、「FAX(06)1234-9999」、「E-mail: ykakuta@xyz.com」の文字が認識される(S102)。これらの文字情報のうち、姓名でよく使われる文字が連続している「角田 美子」が姓名情報として取得され(S104)、「E-mail」や「@」を含む「E-mail: ykakuta@xyz.com」のうち、「E-mail:」を除いた「ykakuta@xyz.com」がメールアドレス情報として取得される(S106)。
姓名情報「角田 美子」は、空白文字より前に記載された姓情報「角田」と、空白文字より後に記載された名情報「美子」とに分割され(S108)、記憶部120に記憶される(S110)。
「角田」のうち「角」と「田」の読み仮名が順次検索され(S112〜S116)、図9(A)に示すように、「tsunota」、「tsunoda」などの複数の姓候補が生成される(S118)。「美子」についても同様にして、図9(B)に示すように、「miko」、「yoshiko」の名候補が生成される(S120〜S126)。
メールアドレス情報「ykakuta@xyz.com」のうち、「@」より前の文字列「ykakuta」が個人識別情報として取得される(S200)。なお、この「ykakuta」は、「角田 美子」の読みである「かくた よしこ」の「よしこ」をローマ字で表わした「yoshiko」の最初の文字である「y」と、「かくた」をローマ字で表わした「kakuta」とを組合せたものである。
「ykakuta」と姓候補および名候補の一致度合が算出される(S300)。図9(A)に示すように、姓候補「tsunota」の場合、「ykakuta」と一致する「ta」の2文字分が一致数としてカウントされ(S302)、末尾の文字である「a」が一致しているため一致数にプラス1カウントされ(S306)、一致数の合計は「3」となる。さらに、一致位置が「ykakuta」における6文字目から7文字目であることが記憶される(S308)。このような処理がすべての姓候補について行なわれると(S210にてYES)、名候補の一致度合も同様に算出される(S212、S300)。
このようにして、図9(A)および(B)のような算出結果を得ると、姓名の読みを決定する処理が行なわれる(S400)。
一致数の合計が「7」で最も大きい姓候補「kakuta」に姓の読みが決定される(S402にてYES、S404)。姓候補「kakuta」の一致位置は「2−7(「ykakuta」における2文字目から7文字目)」であるため、一致位置が重複しない「1−1(「ykakuta」における1文字目)」である「yoshiko」が抽出される(S408)。抽出された名候補は「yoshiko」だけであり一致数が最も多い候補であるため、名の読みが「yoshiko」に決定される(S410にてYES、S412)。氏名情報の読みが「kakuta yoshiko」に決定される(S416)。「kakuta yoshiko」が「かくた よしこ」に変換され(S218)、出力装置300に出力される(S220)。
このように、姓候補と名候補とが別々に生成され、姓候補および名候補と個人識別情報「ykakuta」との一致位置が重複しないように姓と名との読みが決定される。そのため、個人識別情報「ykakuta」における姓候補および名候補と一致する文字が重複することが抑制される。これにより、姓および名の正確な読みを決定することができる。
第2に、図10に示す名刺を文字認識した場合の動作を説明する。図8に示す名刺を文字認識した場合と同様の処理が行なわれ(S100〜S124)、氏名情報「角田 美子」の姓候補と名候補が生成され(S118、S126)、個人識別情報「yo-kakuta」が取得される(S200)。なお、この「yo-kakuta」は、「角田 美子」の読みである「かくた よしこ」の「よしこ」をローマ字で表わした「yoshiko」の「yo」と、「かくた」をローマ字で表わした「kakuta」とを、「-」で組合せたものである。
「yo-kakuta」は、「-」の前後で「yo」と「kakuta」とに分割される(S202)。図11に示すように、「yo」と各姓候補および各名候補との一致度合が算出される(S300)。図12に示すように、「kakuta」と各姓候補および各名候補との一致度合が算出される(S216、S300)。
図11(A)に示すように、1つ目の個人識別情報「yo」と各姓候補とは一致する文字がなく、すべての候補の一致数の合計がゼロとして算出される。
図11(B)に示すように、1つ目の個人識別情報「yo」と名候補「miko」とは、末尾の「o」が一致し一致数の合計が「2」と算出される(S302、S306)。1つ目の個人識別情報「yo」と名候補「yoshiko」とは、先頭の「yo」が一致し一致数合計が「3」と算出される(S302、S306)。
2つ目の個人識別情報「kakuta」についても同様に一致度合が算出され(S400)、図12に示すような算出結果となる。
2つ目の個人識別情報「kakuta」と完全に一致し、一致数の合計が最も多い「8」である姓候補「kakuta」が姓の読みとして決定される(S402にてYES、S404)。2つ目の個人識別情報「kakuta」の1文字目から6文字目までと重複しない(S408)、1つ目の個人識別情報「yo」との一致数の合計が最も多い「yoshiko」が名の読みとして決定される(S410にてYES、S412)。
第3に、図13に示す名刺を文字認識した場合の動作を説明する。図8に示す名刺を文字認識した場合と同様の処理が行なわれ(S100〜S124)、氏名情報「田中 健」の姓候補と名候補が生成され(S118、S126)、個人識別情報「ktanaka」が取得される(S200)。なお、この「ktanaka」は、「田中 健」の読みである「たなか けん」の「けん」をローマ字で表わした「ken」の最初の文字である「k」と、「たなか」をローマ字で表わした「tanaka」とを組合せたものである。
一致度合の算出結果を図14に示す。この場合、最も一致数の合計が多い姓候補「tanaka」が姓の読みに決定される(S402にてYES、S404)。名候補「takeshi」は、他の名候補「ken」と一致数の合計が同じ「2」であるが、名候補「takeshi」の一致位置「2−3(「ktanaka」の2文字目から3文字目)」は、決定された姓候補「tanaka」の一致位置「2−7(「ktanaka」の2文字目から7文字目)」と重複しているため、「takeshi」は名候補として取得されずに「ken」が取得される(S408)。このように、個人識別情報における一致位置が重複しないように姓候補と名候補との読みが決定されるため、姓および名の正確な読みを決定することができる。
第4に、図15に示す名刺を文字認識した場合の動作を説明する。図8に示す名刺を文字認識した場合と同様の処理が行なわれて(S100〜S124)、氏名情報「田中 健」の姓候補と名候補が生成され(S118、S126)、個人識別情報「ke-tanaka」とが取得される(S200)。なお、この「ke-tanaka」は、「たなか けん」の「けん」をローマ字で表わした「ken」の「ke」と、「たなか」をローマ字で表わした「tanaka」とを、「-」で組合せたものである。
「ke-tanaka」は、「-」の前後で「ke」と「tanaka」とに分割される(S202)。一致度合の算出結果を図16および図17に示す。
図16(A)に示すように、1つ目の個人識別情報「ke」と各姓候補とは一致する文字がなく、すべての候補の一致数の合計がゼロとして算出される。
図16(B)に示すように、1つ目の個人識別情報「ke」と名候補「ken」とは、「ke」の2文字が一致し、先頭の文字「k」が一致するため、一致数の合計が「3」と算出される。1つ目の個人識別情報「ke」と名候補「takeshi」とは、「takeshi」の中間の「ke」の2文字が一致するため一致数の合計が「2」と算出される。このように、一致する文字数が同じであっても、先頭の文字が一致する「ken」が、中間の文字が一致する「takeshi」より一致数の合計が多く算出される。これにより、正確な読みである「ken」を優先させて、姓名の読みを精度よく決定することができる。
2つ目の個人識別情報「tanaka」についても同様に一致度合が算出され、図17に示すような算出結果となる。
2つ目の個人識別情報「tanaka」と完全に一致し、一致数の合計が最も多い「8」である姓候補「tanaka」が姓の読みとして決定される(S402にてYES、S404)。決定された姓候補「tanaka」と一致位置が重複しない(S408)、1つ目の個人識別情報「ke」との一致数が最も多い「3」である「ken」が名の読みとして決定される(S410にてYES、S412)。
なお、第1〜第4の動作の説明においては、一致数の割合が予め定められた割合より大きい候補が存在する場合(S402にてYES、S410にてYES)について説明した。これに対し、一致数の割合が予め定められた割合より大きい候補が存在しない場合(S402にてNO、S410にてNO)には、各候補のうち、姓名に用いられる頻度が高い候補が読みとして決定される(S406、S414)。すなわち、漢字読み情報部124は、姓名に用いられる頻度の高い順に読みを記憶しているため、漢字読み情報部124に最初に記憶されている読みを組合せた候補が読みに決定される。そのため、一致数の割合が予め定められた割合より大きい候補が存在しない場合であっても、正確な読みである可能性が高い候補を読みに決定することができる。
以上のように、本実施の形態に係る情報処理装置によれば、名刺の画像情報から氏名情報とメールアドレスの個人識別情報とが取得される。氏名を表わす漢字の読みの候補が個人識別情報と照合された結果で、正確な氏名の読みが決定される。そのため、姓名の読みを効率よく決定することができる。
なお、上述した実施の形態において、漢字読み情報部124は、図2に示すように、漢字とその読みを表わしたローマ字とが対応付けられて記憶されていたが、図18に示すように、漢字とその読みを平仮名で表わした情報であってもよい。この場合、姓候補と名候補とを平仮名で生成し、個人識別情報に含まれるローマ字を平仮名に変換して、各候補と個人識別情報との平仮名の一致度合を算出することで、姓名の読みを決定することができる。
また、上述した実施の形態において、一致数の割合が予め定められた割合より大きい候補が存在しない場合(S402にてNO、S410にてNO)、姓や名に用いられる頻度が高い候補を読みとして決定した(S406、S414)。これに対し、たとえば、個人識別情報に含まれるローマ字を仮名に変換したものを、姓名の読みとして決定してもよい。これにより、姓名の読みを決定することができ、かつ、正確な読みの候補が生成されない場合であっても正確な読みである可能性が高い読みを決定することができる。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
100 情報処理装置、110 制御部、120 記憶部、122 文字認識情報部、124 漢字読み情報部、130 文字認識部、140 情報所得部、150 生成部、160 決定部。