JP4800144B2 - 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体 - Google Patents

文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP4800144B2
JP4800144B2 JP2006216188A JP2006216188A JP4800144B2 JP 4800144 B2 JP4800144 B2 JP 4800144B2 JP 2006216188 A JP2006216188 A JP 2006216188A JP 2006216188 A JP2006216188 A JP 2006216188A JP 4800144 B2 JP4800144 B2 JP 4800144B2
Authority
JP
Japan
Prior art keywords
character string
character
type
target
determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006216188A
Other languages
English (en)
Other versions
JP2008040910A (ja
Inventor
和宏 竹原
至幸 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2006216188A priority Critical patent/JP4800144B2/ja
Publication of JP2008040910A publication Critical patent/JP2008040910A/ja
Application granted granted Critical
Publication of JP4800144B2 publication Critical patent/JP4800144B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

本発明は、対象となる文字列の種類を判定する文字列判定装置に関するものである。
現在、光学式文字読取(OCR : Optical Character Reader)技術は、文書読取装置、帳票読取装置などのいろいろな文字読取装置として実現され、利用されている。その中には、名刺読取装置のように名刺に記載された氏名、住所、会社名など各々の文字列の項目が何であるかを判定する装置も多く存在する。
一方、OCRは、近年小型化が進み、カメラで読取対象を撮影し、その認識を行なうカメラ付き携帯電話も発売されている。これらの携帯電話に搭載されたOCRは、認識対象を1行毎に撮影した後、認識するといった仕様が一般的であり、認識対象が、メールアドレス、URL(uniform resource locator)、電話番号等の英数字文字列のみのものや、氏名、住所等の日本語文字列を認識するものも存在する。
これら、携帯電話に搭載されたOCRの主な用途は、名刺またはその他の文書に記載された、氏名、電話番号、メールアドレス、URL等を、当該携帯電話が有する電話帳へ登録するというものである。
上記カメラ付き携帯電話に搭載されたOCRが一般的に、名刺全体を一度に撮影し、名刺に記載された、氏名、住所、会社名の全項目を認識するのではなく、一行単位で撮影し、認識するという仕様になっている理由の一つとして、携帯電話の処理能力の問題があると考えられる。以下、その問題について述べる。
特許文献1に、PC(パーソナルコンピュータ)と、携帯電話との処理速度の差が記されている。これによると、「http://www.kaisya.co.jp/index.html」という1行、33文字が書かれた画像(1枚)を認識する場合、携帯電話では、1.6秒の処理時間がかかっているのに対し、パーソナルコンピュータ(Pentium(登録商標)III搭載)では、0.1秒の処理時間で済む。
カメラの撮影範囲を広げ、例えば、名刺1枚を撮影し、名刺1枚に記載された全項目を認識するという仕様の場合、例えば、名刺1枚中に165文字の文字が記載されていたとすると、上述の処理速度の値から単純計算で8秒(1.6÷33×165)の処理時間がかかるといえる。
上記の計算は、認識対象を英文とした場合の推定値であり、日本語で記載された名刺を対象とする場合、氏名、住所などの日本語文字列を認識しなければならない。従って、一般的には、さらに認識処理時間は増大するものと推定される。
このように、携帯電話等の小型情報端末では、処理能力が低いため、名刺1枚程度の大きさの文書の認識でも処理時間が長いという問題が存在し、携帯電話等の小型情報端末にOCRを搭載するにあたり、解決すべき課題であるといえる。
この処理時間が長いという問題を解消する一つの方法として、認識対象を名刺の全項目ではなく、ユーザが所望する項目に限定するという方法が考えられる。
携帯電話を始めとするカメラ付き携帯情報端末のOCRの主な用途の一つは、読み取った情報(氏名、住所、会社名、電話、メールアドレス等)を、携帯情報端末が有する、電話帳等のデータベースに登録することと考えられるが、OCRが携帯電話等に搭載された場合には、氏名、電話、メールアドレスに限定した認識機能でも、十分役に立つと考えられる。
従って、認識対象項目を必要な項目に限定し、認識対象から必要な項目のみを自動的に抽出し、認識するという方法は、有効な解決方法であるといえる。
以下、上記解決方法の具体的な例として、名刺から電話帳登録に必要な項目を抽出する方法について述べる。名刺から電話帳登録に用いられる、氏名、電話、メールアドレスを自動で抽出する方法として、次のような方法が考えられる。
名刺から姓名行を取り出すには、例えば、特許文献2に記載されているように、名刺の中央に大きくレイアウトされている文字列を取り出せばよく、比較的容易に抽出できる。
これに対して、名刺から電話行や、メールアドレス行をレイアウト情報のみで抽出するのは難しい。従って、例えば、文字列が、英数字文字列か、日本語文字列かを判定し、英数字文字列であれば電話行、または、メール行とする、といった判定、抽出方法が考えられる。
文字列が、英数字文字列か、日本語文字列かを判定する技術の一例が、特許文献3に
記載されている。この特許文献3に記載の文字認識方法では、文字列内の文字の複雑度を測定し、英数字文字列か、日本語文字列かを判定する。この手法を用いて、最初に名刺に記載された文字列を抽出した後、文字列が日本語行か英語行かの判定を行い、英語行であれば、電話、メールの可能性があるので当該文字列をさらに詳細に認識し、日本語行であれば認識しないという処理を行うことが考えられる。
なお、文字を構成する点が連結した領域に外接する矩形を抽出し、抽出した矩形を用いて文字列を抽出する手法の一例として、特許文献4に記載の手法を挙げることができる。
特開2005-182772号公報(2005年7月7日公開) 特開平6―103402号公報(1994年4月15日公開) 特開昭62―22186号公報(1987年1月30日公開) 特開平5−81474号公報(1993年4月2日公開)
ところが、特許文献3に記載の文字認識方法は、認識対象が一般的な日本語文字列であるか英語文字列であるかを判定するものであり、この方法では、英語文字列がどのような種類の文字列であるか、例えば、電話番号であるか、メールアドレスであるかなど、を一意的に判定することができない。また、対象文字列が予め定められた文字列の項目(種類)のうちのどれに相当するのかを絞り込むことも不可能である。
それゆえ、対象文字列の種類を判定するためには、処理量の多い、パターンマッチング等の認識処理を行わなければならないという問題が生じる。
本発明は、上記の問題点を解決するためになされたもので、その目的は、認識対象となる文字列が、予め定められた種類のどれに相当するものかを少ない処理量で判定することができる文字列判定装置を提供することにある。
本発明に係る文字列判定装置は、上記の課題を解決するために、対象文字列を構成する文字の形状を示す文字列情報を取得し、当該文字列情報によって示される文字の形状をもとに対象文字列の種類を判定する文字列判定装置であって、文字列の種類と対応付けられた、特定の形状を示す情報である文字列パターンが上記文字列情報に含まれているかどうかを検出する特定文字検出手段と、上記特定文字検出手段によって、上記文字列パターンが上記文字列情報内に検出された場合に、当該文字列パターンに対応する文字列の種類を、当該対象文字列の種類とする種類判定手段とを備えることを特徴としている。
本発明に係る文字列判定方法は、上記の課題を解決するために、対象文字列を構成する文字の形状を示す文字列情報を取得し、当該文字列情報によって示される文字の形状をもとに対象文字列の種類を判定する文字列判定装置における文字列判定方法であって、文字列の種類と対応付けられた、特定の形状を示す情報である文字列パターンが上記文字列情報に含まれているかどうかを検出する特定文字検出工程と、上記特定文字検出手段によって、上記文字列パターンが上記文字列情報内に検出された場合に、当該文字列パターンに対応する文字列の種類を、当該対象文字列の種類とする種類判定工程とを含むことを特徴としている。
上記の構成によれば、特定文字検出手段は、文字列パターンが文字列情報内に含まれているかどうかを検出し、含まれている場合に、種類判定手段は、当該文字列パターンに対応する文字列の種類が、当該対象文字列の種類であると判定する。
それゆえ、文字列情報に文字列パターンが含まれているか否かを検出することにより、対象文字列の種類を判定することができ、対象文字列の各文字がどの文字であるかを認識する構成に比べて、対象文字列の種類の判定にかかる処理量を低減することができる。
従って、携帯電話など、処理能力が低い小型携帯端末に組み込んだ場合でも、迅速に対象文字列の判定を行うことができる文字列判定装置を実現できる。
なお、上記文字には、括弧、コンマ、コロン、セミコロン等、文書を表記する場合に用いる記号も含まれる。
また、上記文字列パターンは、特定の形状を有する文字の情報または特定の相対位置関係を有する構成部分を含む文字の情報、もしくはその両方を含むものであるであることが好ましい。
上記の構成によれば、文字列パターンは、特定の形状を有する文字の情報または特定の相対位置関係を有する構成部分を含む文字の情報、もしくはその両方を含むものであるため、当該文字列パターンを検出するための処理量は、各文字を辞書を用いたマッチングにより識別する方法における処理量に比べて少なくてすむ。
それゆえ、対象文字列の種類の判定にかかる処理量をさらに低減することができる。
また、上記文字列判定装置は、上記種類判定手段によって上記種類の候補が複数挙げられた場合に、当該種類の候補にそれぞれ対応する複数の文字認識辞書を参照することにより、上記文字列情報に含まれる文字を識別する文字認識手段をさらに備えることが好ましい。
上記の構成によれば、種類判定手段によって対象文字列の種類の候補が複数挙げられた場合に、文字認識手段は、複数の候補にそれぞれ対応する複数の文字認識辞書を参照することにより、文字列情報に含まれる文字を識別する。すなわち、上記の構成では、種類判定手段によって対象文字列の種類が絞り込まれ、絞り込まれた種類に関して文字認識手段が文字の識別を行う。
それゆえ、文字認識手段に容量の小さい文字認識辞書を利用させることができ、文字認識にかかる処理量を低減するとともに、その処理速度を速めることができる。
また、上記文字列判定装置は、上記種類判定手段によって上記種類の候補が複数挙げられた場合、かつ、指定された対象文字列の種類である指定種類と一致する種類の対象文字列が、上記複数の候補の中に含まれている場合に、上記指定種類と対応する文字認識辞書を参照することにより、上記文字列情報に含まれる文字を識別する文字認識手段とをさらに備えることが好ましい。
上記構成によれば、文字認識手段は、種類判定手段によって対象文字列の種類の候補が複数挙げられた場合、かつ、上記指定種類と一致する種類の対象文字列が、複数の候補の中に含まれる場合に、当該指定種類と対応する文字認識辞書を参照することにより、上記文字列情報に含まれる文字を識別する。すなわち、指定種類の情報を参照することによって対象文字列の種類が絞り込まれ、絞り込まれた種類に関して文字認識手段が文字の識別を行う。
それゆえ、文字認識手段に容量の小さい文字認識辞書を利用させることができ、文字認識にかかる処理量をさらに低減するとともに、その処理速度をさらに速めることができる。
また、上記文字列判定装置は、上記文字認識手段の文字認識結果に基づいて上記対象文字列の種類を特定する文字列特定手段をさらに備えることが好ましい。
上記の構成によれば、文字列特定手段は、文字認識手段の文字認識結果を利用することにより、対象文字列の種類を特定する。文字認識手段の文字認識結果は、文字列情報に含まれる文字が何であるかを示すものであるため、対象文字列の種類をひとつに特定することができる。
また、上記文字列判定装置の上記各手段としてコンピュータを機能させるための文字列判定プログラムおよび当該文字列判定プログラムを記録したコンピュータ読み取り可能な記録媒体も本発明の技術的範囲に含まれる。
本発明に係る文字列判定装置は、以上のように、文字列の種類と対応付けられた、特定の形状を示す情報である文字列パターンが文字列情報に含まれているかどうかを検出する特定文字検出手段と、上記特定文字検出手段によって、上記文字列パターンが上記文字列情報内に検出された場合に、当該文字列パターンに対応する文字列の種類を、当該対象文字列の種類とする種類判定手段とを備える構成である。
本発明に係る文字列判定方法は、以上のように、文字列の種類と対応付けられた、特定の形状を示す情報である文字列パターンが文字列情報に含まれているかどうかを検出する特定文字検出工程と、上記特定文字検出手段によって、上記文字列パターンが上記文字列情報内に検出された場合に、当該文字列パターンに対応する文字列の種類を、当該対象文字列の種類とする種類判定工程とを含む構成である。
それゆえ、対象文字列の種類の判定にかかる処理量を低減することができるという効果を奏する。
本発明の実施の一形態について図1〜図14に基づいて説明すれば、以下のとおりである。以下では、本発明の文字列判定装置の一例として、携帯電話1を挙げて説明するが、本発明の文字列判定装置は、携帯電話に限定されない。携帯電話1は、名刺等の認識対象文書の画像を撮像し、その撮像画像に含まれる複数または単数の文字列の情報(文字列情報)を取得し、当該文字列情報によって示される文字の形状をもとに対象文字列の種類を判定する。そして、携帯電話1は、対象文字列に含まれる、電話番号、メールアドレス等の情報をデータベースである電話帳に登録する機能を有するものである。
(携帯電話1の構成)
図2は、本実施形態の携帯電話1(文字列認識装置)の構成を示す機能ブロック図である。図2に示すように、携帯電話1は、主制御部2、一時記憶部3、記憶部4、入力制御部5、操作部6、出力制御部7、表示部8およびカメラ9を備えている。これら各部は、データバスで接続されている。
なお、携帯電話1は、通信部、マイク、スピーカー等、携帯電話として機能するために必要な部材を備えているが、これらの部材は、図2では省略してある。
主制御部2は、携帯電話1を制御するものであり、文字列判定部2aおよび文字列判定制御部2bを備えている。
文字列判定部2aは、文字列抽出部21、特定文字判定部22、文字列認識部23(文字認識手段)および項目判定部24(文字列特定手段)を備えている。これら各部の詳細については後述する。
文字列判定制御部2bは、文字列判定部2aの各部を制御する。
一時記憶部3は、RAM(Random Access Memory)等の半導体メモリを具備しており、データを一時的に記憶する機能を有している。この一時記憶部3は、対象文書記憶部31、対象文字列記憶部32、対象項目記憶部33および認識結果記憶部34を備えている。
対象文書記憶部31は、認識対象の文書画像(以下、これを対象画像と称する)を一時的に記憶する。
対象文字列記憶部32は、対象文書記憶部31に記憶された対象画像から文字列抽出部21によって抽出された文字列の情報(文字列情報)(以下、これを対象文字列と称する)を一時的に記憶する。
対象項目記憶部33は、ユーザが指定した、文字列の項目(以下、これを認識対象項目と称する)を記憶する。
認識結果記憶部34は、文字列認識部23の認識結果を一時的に記憶する。
記憶部4は、ROM(Read Only Memory)またはハードディスク等を具備しており、データを(恒常的に)記憶する機能を有している。この記憶部4は、文字判定ルールテーブル41、対応項目テーブル42、文字認識辞書43および電話帳44を備えている。
文字判定ルールテーブル41は、対象文字列記憶部32に記憶された対象文字列に特定の文字列パターン(以下、単に文字列パターンと称する)が含まれているか否かを判定するためのルールを規定するものであり、特定文字判定部22により利用されるテーブルである。この文字判定ルールテーブル41の詳細については後述する。また、後述するように、上記文字列パターンは、文字列の種類と対応付けられた、特定の形状を示す情報であり、特定の形状を有する文字の情報または特定の相対位置関係を有する構成部分を含む文字の情報、もしくはその両方を含むものである。
対応項目テーブル42は、対象文字列に含まれる文字列パターンと、対象文字列の項目との対応関係を示すものである。すなわち、文字列パターンは、対応項目テーブル42によって文字列の種類と対応付けられている。特定文字判定部22は、この対応項目テーブル42を参照し、対象文字列に含まれる文字列パターンを検出する。この対応項目テーブル42の詳細については後述する。
文字認識辞書43は、文字列認識部23が用いる文字パターンマッチング辞書である。
電話帳44は、ユーザによって使用されるデータベースであり、ユーザが登録した氏名、電話番号、FAX番号、メールアドレス、URL、住所等の情報を格納している。この電話帳44への書き込みは、主制御部2によって行われる。
入力制御部5は、ユーザによる操作部6の入力操作を検出し、主制御部2へ選択、指示、決定などの命令を送信する。特に、入力制御部5は、ユーザが指定した対象文字列の項目である認識対象項目(指定種類)の情報を受け付ける。この入力制御部5は、対象項目指示部51(受付手段)を備えている。
対象項目指示部51は、操作部6を介して入力された、ユーザからの認識対象項目の指示を受け取り、その指示情報を主制御部2へ送信する。
操作部6は、ユーザの指示を受け付け、その指示を入力制御部5に出力するための入力装置である。例えば、入力キーなど、文字認識装置の形態によっていろいろな種類のものがあるが、例えば、いわゆるキーボードを構成するキー、十字キー、数字キーなどを、操作部6として用いることができる。
出力制御部7は、主制御部2から出力された各種の情報、例えば、対象文字列の認識結果を受け取り、その情報を表示部8を介して出力する。
表示部8は、液晶ディスプレイ(LCD(Liquid Crystal Display)等の画像表示方式の表示機器であり、出力制御部7から出力された情報を表示できる。
カメラ9は、例えば、CCD(Charge Coupled)カメラであり、認識対象となる文字列を撮像する。カメラ9が撮像した対象画像は、入力制御部5および主制御部2を介して、対象文書記憶部31に格納される。
(文字列判定部2aの各部の詳細)
次に、文字列判定部2aが備える機能ブロックについて詳細に説明する。
文字列抽出部21は、対象文書記憶部31に記憶された対象画像から、対象文字列を抽出し、抽出した対象文字列を対象文字列記憶部32に出力する。出力された対象文字列は、対象文字列記憶部32に一時記憶される。文字列を抽出する方法は、特に限定されず、従来用いられてきたどのような手法でもかまわない。本実施形態では、矩形(連結した文字ブロック)を抽出し、抽出した矩形を用いて文字列を抽出する手法を用いる。このような抽出手法の一例は、特許文献4に記載されている。文字列抽出部21から出力される文字列情報がどのようなものであるかについては、後述する。
図1は、特定文字判定部22の構成を示す機能ブロック図である。
特定文字判定部22は、対象文字列記憶部32に記憶された対象文字列、すなわち、文字列抽出部21によって抽出された対象文字列の項目を判定する。
この特定文字判定部22は、図1に示すように、文字列パターン検出部22a(特定文字検出手段)、項目判定部22b(種類判定手段)および項目比較部22c(項目比較手段)を備えている。
文字列パターン検出部22aは、対象文字列記憶部32に記憶された対象文字列に含まれる文字列パターンを検出する。具体的には、文字列パターン検出部22aは、対応項目テーブル42を参照し、文字列の項目と対応付けられた文字列パターンが対象文字列に含まれているかどうかを順に検出する。対象文字列に文字列パターンが含まれているか否かを判定する方法は、記憶部4の文字判定ルールテーブル41に記載されており、文字列パターン検出部22aは、この文字判定ルールテーブル41を参照しつつ、文字列パターンの検出を行う。
項目判定部22bは、対応項目テーブル42を参照して、文字列パターン検出部22aによって検出された文字列パターンに対応する項目を、対象文字列の項目として判定する。換言すれば、項目判定部22bは、文字列パターン検出部22aによって、文字列パターンが対象文字列内に検出された場合に、当該文字列パターンに対応する文字列の項目を、当該対象文字列の項目とする。
項目比較部22cは、項目判定部22bによって判定された項目と、対象項目記憶部33に記憶されている認識対象項目とを比較する。
文字列認識部23は、対象文字列記憶部32に記憶された対象文字列、すなわち、文字列抽出部21によって抽出された対象文字列に含まれる文字を、文字認識辞書43を参照することにより認識する。このとき、文字列認識部23は、項目判定部22bによって判定された項目の候補に対応する文字認識辞書または認識対象項目と対応する文字認識辞書を参照することにより、上記対象文字列に含まれる文字を識別する。
文字列認識部23は、特に、項目判定部22bによって対象文字列の項目がひとつに決定されなかった場合(項目の候補が複数挙げられた場合)かつ、入力制御部5によって受け付けた認識対象項目と一致する項目の対象文字列が、上記複数の候補の中に含まれる場合に、認識処理を行う。なお、文字列認識部23は、上記項目の候補が1つの場合でも、対象文字列の内容(具体的には、文字コード)を認識するために認識処理を行う。
文字列認識部23による文字識別の方法は、特に限定されず、従来用いられてきたどのような方法でもかまわない。文字列認識部23は、対象文字列に含まれる文字の認識結果を、認識結果記憶部34へ出力する。出力された認識結果は、認識結果記憶部34に記憶される。
項目判定部24は、認識結果記憶部34に記憶された、対象文字列に含まれる文字の認識結果、すなわち、文字列認識部23によって出力された当該文字の認識結果を用いて、対象文字列の項目をひとつに特定する。項目判定部24における項目判定の方法は、特に限定されず、従来用いられてきたどのような方法でもかまわない。項目判定部24は、判定結果を文字列判定制御部2bへ出力する。
(携帯電話1の認識対象文書)
次に、携帯電話1の認識対象文書について、図3を参照しつつ説明する。図3は、携帯電話1の認識対象文書の一例を示す図である。
携帯電話1の認識対象文書の一例として名刺を挙げることができる。図3に示すように、一例として挙げる名刺には氏名として「△山×男」が、所属部署として「総務部」が、会社名として「XYZ株式会社」が記載されている。さらに、名刺の下段部には電話番号、メールアドレス、ホームページのURLが記載されている。
携帯電話1の認識対象文書は、名刺に限定されず、手紙または広告等の文書であってもよい。
(表示部8に表示される項目の例)
次に、表示部8に表示される対象文字列の項目の一例について、図4を参照しつつ説明する。図4は、表示部8に表示される対象文字列の項目の一例を示す図である。
図4に示すように、携帯電話1は、表示部8に複数の項目(図4では、1〜5)を示し、どの項目の文字列を認識するのかに関してユーザからの指示を待つ。
ユーザが操作部6の数字キー1から数字キー5のいずれかを押下することにより、1から5のうちのいずれかの対象項目の組が決定される。例えば、ユーザは、氏名、電話、メールという項目に限定した文字列の認識を望む場合、これらの項目の組み合わせ(認識対象項目)は、番号4で示されているため、数字キー4を押下すればよい。
複数の項目の組み合わせは、図4に示したものに限定されず、どのような組み合わせであってもよい。
(対応項目テーブル42の詳細)
次に、対応項目テーブル42について図5および図6を参照しつつ説明する。対応項目テーブル42は、対象文字列に含まれる文字列パターンと、対象文字列の項目との対応関係を示すものである。図5および図6は、対応項目テーブル42の一例を示す図である。
図5および図6に示すように、対応項目テーブル42は、文字列パターンとそれに対応する対象文字列の項目とが同一行に書かれており、対象文字列に或る文字列パターンが含まれていれば、その対象文字列は、その文字列パターンに対応する項目(項目群の一部)に相当するものであることを示している。文字列パターンにはそれぞれ通し番号(図5では、1〜6)がふられている。なお、図5および図6において、対応項目テーブル42の右側の破線で囲まれた列は、対象文字列の例を示したものであり、対応項目テーブル42内の情報ではない。
また、対応項目テーブル42は、図5と図6とで区別しているように、文字列パターンの内容に応じて、2種類に大別できる。すなわち、一方は、含まれている文字列パターンに対応する項目が一つのもの(図5の対応項目テーブル42a)であり、他方は、文字列パターンに対応する項目が2つ以上のもの(図6の対応項目テーブル42b)である。
対応項目テーブル42aは、対象文字列中に文字列パターンが存在する場合、対象文字列の項目が確定するテーブルである。
例えば、図5に示すように、対象文字列に、「L」、「:」および括弧(( )の文字列パターンが含まれている場合、当該対象文字列の項目は、「電話」となる。
対応項目テーブル42bは、対応項目テーブル42aを適用できない場合、すなわち、対象文字列の項目をひとつに特定できない場合に用いられるテーブルである。
例えば、図6に示すように、対象文字列に、「L」および「:」の文字列パターンが含まれている場合、当該対象文字列の項目は、「電話」、「メール」、「URL」のいずれかとなる。
このように、項目判定を行うときには、まず、項目が一つに特定できるか否かを対応項目テーブル42aを用いて調べ、項目が一つに特定できない場合に、対応項目テーブル42bを用いて項目を絞り込むようにすればよい。
なお、項目判定に用いる文字列パターンは、図5および図6に示したものに限定されない。
(文字判定ルールテーブル41の詳細)
次に、文字判定ルールテーブル41について図7を参照しつつ説明する。図7は、文字判定ルールテーブル41の一例を示す図である。文字判定ルールテーブル41は、対象文字列に文字列パターンが含まれているか否かを判定するためのルールを規定するものである。文字列パターン検出部22aが以下に説明するルールに従って、文字列パターンの検出を行う。
なお、図7では、各ルールを理解しやすいように文章で表現しているが、実際には、各ルールは、コンピュータによって認識可能な形式で表現される。
図7に示すように、文字判定ルールテーブル41は、どのような形状(構成矩形数も含む)または文字列における文字の相対位置関係を有していれば、どの文字であると認識するのかという判定ルールを示すものである。すなわち、文字列パターンは、特定の形状を有する文字または特定の相対位置関係を有する構成部分を含む文字を含むものであり、文字判定ルールテーブル41は、文字の形状または位置関係と文字判定結果とを対応づけるものである。
以下、各文字についてその判定方法を、図8〜図10を参照しつつ具体的に説明する。図8は、コロンの形状を示す図である。図9は、括弧の形状を示す図である。図10は、スラッシュの形状を示す図である。
図8に示すように、コロンは、2個の矩形(構成部分)からなり、2個の矩形とも、小さい矩形である。実際には、文字を構成する2個の矩形の幅および高さが、((文字列の高さ)×(閾値1))未満であるという基準で判定すればよい。
また、コロンの文字は、細長い。実際には、文字高>文字幅×(閾値2)という基準を用いて判定する。また、2個の矩形は、垂直方向走査線による走査にてほぼ重なっていることが必要である。
これは、図8に示す例を用いて説明すれば、α1は、α2と比べて、それほど小さい値でないかどうかを調べればよい。実際には、閾値を用いて判定する。なお、α1は、コロンの上段部の左端と下段部の左端のうち、より右にある端から、上段部の右端と下段部の右端のうち、より左にある端までの距離であり、α2は、コロンの上段部の左端と下段部の左端のうち、より左にある端から、上段部の右端と下段部の右端のうち、より右にある端までの距離である。
以下に説明する文字に関しても、実際は閾値等を用いた判定が適用されるが、判定ルールの概要のみを説明する。
図9に示すように、左括弧(( )に関しては、左上隅、左下隅、右中程(図9の破線四角の部分)に、文字成分がないか否かを調べればよい。右括弧( ))についても同様である。
スラッシュの連続「//」の判定は、左から右に走査線を走らせることで行う。図10に示すように、文字の左端から最初に文字成分にぶつかるまでの距離をβ1、最初の文字成分から2番目の文字成分までの距離をβ2、2番目の文字成分から文字右端までの距離を、β3とすると、
β1は、上部ラインから下部ラインに移るにつれ、ほぼ単調に減少していくが、逆に、
β3は、上部ラインから下部ラインに移るにつれ、ほぼ単調に増加していく。
β2は、走査線がどのライン上であるかにかかわらず、ほぼ一定である。
以上のような特徴を持てば、スラッシュの連続からなる文字と判定する。
スラッシュは、スラッシュの連続「//」と同じように、左から右への走査線で左端から文字成分、文字成分から右端までの距離の増加、減少の状態によって判定可能である。
「L」は、水平方向に文字成分ヒストグラムをとると、左端に大きな山があり、それ以降ほぼ一定である。また、垂直方向に文字成分ヒストグラムをとると、底辺を除きほぼ一定、底辺部分に大きな山がある。このようなヒストグラムをとることにより、「L」を判定する。
ピリオドは、1個の小さい矩形が文字列の下側に存在するという基準を用いて判定すればよい。
ハイフンは、1個の横に細長い矩形が文字列中程に存在するという基準を用いて判定すればよい。
数字、l(エル)は、1個の矩形からなり、縦幅が横幅に比べ大きいなどの基準によって容易に判定できる。
実際には、「l(エル)」「1(壱)」は、「0」、「2」、「3」等に比べ、更に縦長であるため、個々の判定用閾値を設定することが好ましい。
また、「話」「舌」などは、形状、位置によって判定することは難しい。従って、「話」、「舌」のみの認識辞書を使って、文字認識を行い、信頼度が0.9以上(最大は1)あるとき、「話」、「舌」と判定することもできる。
なお、各文字の判定ルールは、上記のものに限られず、判定対象文字自体も上記のものに限られない。
なお、「話」の文字は、「言」と「舌」の2文字に分離されてしまう可能性がある。
その対策として、「舌」+「:」のルールを追加してもよい。
(文字列抽出部21によって抽出された文字列情報の構造)
次に、文字列抽出部21によって抽出された文字列の情報の一例について、図11を参照しつつ説明する。図11は、文字列抽出部21によって抽出された文字列情報60の構造の例を示す図である。図11には、1文字列分の文字列情報が示されている。
この文字列情報は、文字列が何文字から構成されるかを示す文字数情報61、
文字列の左上および右下の座標を示す文字列座標情報62、文字列に含まれる各文字に関する文字情報63から成る。
さらに、文字情報63は、文字を構成する矩形の数である文字矩形数情報64、文字の左上および右下の座標を示す文字座標情報65、各文字ごとの文字矩形情報66から成る。文字矩形情報66には、文字を構成する矩形分だけ、矩形の座標が含まれている。
なお、文字列の抽出には従来技術を用いればよいと上述したが、日本語には分離文字等があるため、文字パターンマッチングの結果の文字の信頼度(類似度等)を用いずに1文字を正しく確定することは難しい。従って、本実施形態では、垂直方向走査線による走査にてオーバーラップする文字矩形群を、1文字としている。
この抽出方法を、名刺等に記載されたメールアドレスを抽出する例を用いて説明する。ここでは、
メール:sharp.taro@sharp.co.jp
の先頭5文字分を認識する。
この文字列に含まれる文字のうち、「メ」、「ー」、「s」は、1文字1矩形として認識される。「ル」は、左側の「ノ」と、右側の「レ」との2矩形として認識されるが、これらの矩形は垂直方向走査線による走査にて重ならないので、別の文字として扱われる。
「:」は、上部の点と下部の点の2点から成るが、垂直方向走査線による走査にて重なっているので、上部の点と下部の点の2矩形で1文字として認識される。
(文字認識辞書43を利用した文字認識方法)
次に、文字列認識部23による文字認識辞書43の利用方法の例について説明する。
例えば、対象文字列の項目が、「電話」であると判定された場合、0から9までの数字、ハイフン、括弧の他に、名刺で電話の前によく記載されているキー単語(電話、TEL、Tel: 等)内の文字、すなわち、
「電」、「話」、「T」、「E」、「L」、「t」、「e」、「l」、「:」
などの文字のみを辞書照合時に用いればよい。
対象文字列の項目が、「メール」であると判定されたときも同じく、英数字、@、ピリオド、ハイフン、アンダースコアの他に、よく使われるキー単語(メール: 等)内の文字、すなわち、
「メ」、「ー」、「ル」、「:」、
などの文字のみを辞書照合時に用いればよい。
対象文字列の項目がひとつに特定された場合、項目の特定は不要であるが、対象文字列の内容(具体的には、文字コード)が不明であるため、通常、文字認識辞書を用いて、対象文字列の内容を決める(具体的には、文字列の認識を行う)ことが必要である。
このとき、必要な辞書カテゴリのみを使うことによりマッチングの高速化が可能となる。
対象文字列が一意に決まらなかった場合は、項目に対応した照合対象文字の和を用いればよい。例えば、項目が電話かFAXのいずれかで、一意に決まらない場合であれば、項目が電話のときに照合する辞書文字カテゴリと項目がFAXのときに照合する辞書文字カテゴリの両方を用いればよい。
(携帯電話1における処理の流れ)
次に、携帯電話1において、対象画像から複数の文字列を抽出し、各文字列の項目を判定する処理の流れについて、図12を参照しつつ説明する。図12は、携帯電話1における処理の流れを示すフローチャートである。なお、以下では、特定文字判定部22において対象文字列の項目がひとつに決まらない場合の処理の流れについて説明する。
まず、ユーザが操作部6を介して認識対象項目の指示を入力すると、その指示は対象項目指示部51に伝達される(S1)。そして、対象項目指示部51は、当該指示(認識対象項目の情報)を主制御部2へ出力する(受付工程)。
上記指示を受け取ると、主制御部2は、認識対象項目の情報を対象項目記憶部34に格納する。
さらに、主制御部2は、カメラ9を制御することによって認識対象の文書を撮像し、その撮像画像である対象画像を対象文書記憶部31に格納する(S2)。
対象画像の格納が終了すると、文字列判定制御部2bは、文字列抽出部21に文字列抽出命令を出力する。
この文字列抽出命令を受け取ると、文字列抽出部21は、対象文書記憶部31に格納された対象画像から、対象文字列を抽出する(S3)。文字列抽出部21は、抽出した対象文字列を、対象文字列記憶部32に一時記憶させる。なお、抽出された対象文字列の個数をMとする。
対象文字列の抽出が終了すると、文字列判定制御部2bは、自らが備えるカウンタ(不図示)を1に初期化する(m=1)(S4)。
次に、文字列判定制御部2bは、カウンタの値(m)が文字列数M以下であるか否かを判定する(S5)。
カウンタの値(m)が文字列数M以下ではない場合(S5にてNO)、文字列判定制御部2bは、一連の処理を終了する。すなわち、文字列抽出部21が抽出した対象文字列のすべてについて判定を終えると、文字列判定制御部2bは、一連の処理を終了する。
カウンタの値(m)が文字列数M以下である場合(S5にてYES)、文字列判定制御部2bは、特定文字判定部22の文字列パターン検出部22aへ文字列パターン検出命令を出力する。
文字列パターン検出命令を受け取ると、文字列パターン検出部22aは、m番目の対象文字列に文字列パターンが含まれているか否かを、文字判定ルールテーブル41および対応項目テーブル42を参照しつつ判定する(特定文字検出工程)。このとき、文字列パターン検出部22aは、項目対応テーブル42のn番目(nは、1から項目対応テーブル42に規定された文字列パターンの総数までの数)の文字列パターンが含まれているか否かを順に判定する。文字列パターン検出部22aは、この判定結果を文字列判定制御部2bへ出力する。なお、文字判定ルールテーブル41および項目対応テーブル42の参照方法の詳細については、後述する。
文字列パターンが含まれていない場合(S6にてNO)、文字列パターン検出部22aは、その旨を示す情報を文字列判定制御部2bへ出力する。この情報を受け取ると、文字列判定制御部2bは、カウンタの値(m)を1増やし(S10)、S6に戻る。
文字列パターンが含まれている場合には(S6にてYES)、文字列パターン検出部22aは、検出した文字列パターンを項目判定部22bへ出力する(S7)。
この文字列パターンを受け取ると、項目判定部22bは、対応項目テーブル42を参照して、当該文字列パターンに対応する文字列の項目の候補を判定し(種類判定工程)、判定結果を項目比較部22cへ出力する。
この判定結果を受け取ると、項目比較部22cは、判定された項目の複数の候補と、対象項目記憶部34に格納された認識対象項目(S1で選択された項目)とを比較し、複数の候補に認識対象項目が含まれているか否かを判定する(S8)。項目比較部22cは、その判定結果を文字列判定制御部2bへ出力する。
複数の候補に認識対象項目が含まれていない場合(S8にてNO)、文字列判定制御部2bは、カウンタの値(m)を1増やし(S11)、S6に戻る。
一方、複数の候補に認識対象項目が含まれている場合(S7にてYES)、文字列判定制御部2bは、対象文字列を認識するよう命じる認識命令を文字列認識部23へ出力する。
この認識命令を受け取ると、文字列認識部23は、上述したように、認識対象項目に対応する文字認識辞書を参照して、対象文字列記憶部32に記憶された対象文字列に特定の文字が含まれているか否かを判定する(文字認識工程)(S9)。文字列認識部23は、その判定結果(検出した特定の文字を含む)を認識結果記憶部34に格納するとともに、格納が完了したことを示す完了情報を項目判定部24へ出力する。
この完了情報を受け取ると、項目判定部24は、認識結果記憶部34に格納された対象文字列に特定の文字が含まれている場合には、当該特定文字に対応する項目を、対象文字列の項目とし(S10)、この判定結果を文字列判定制御部2bへ出力する。
文字列判定制御部2bは、当該判定結果を、出力制御部7を介して表示部8へ出力する。
一方、対象文字列に特定の文字が含まれていない場合には、項目判定部24は、その旨を示す情報を文字列判定制御部2bへ出力する。この情報を受けた文字列判定制御部2bは、判定結果を出力しないことが好ましい。
項目判定部24による項目判定が終了すると、文字列判定制御部2bは、カウンタの値(m)を1増やし(S11)、S6に戻る。
なお、項目判定部22bにおいて、対象文字列の項目が一意に決まっていればS10の項目判定処理を略すことも可能である。また、複数の項目から一意の項目に絞り込んだとき、その項目が認識対象項目に一致していなければ、認識結果を出力しない方が好ましい。
また、表示部8に判定結果が表示された後に、ユーザによって所定の操作が行われた場合に、主制御部2は、文字コードから成る対象文字列のテキスト情報、すなわち、文字列認識部23によって得られた、対象文字列の認識結果を電話帳44に格納すればよい。
(特定文字判定部22における処理の詳細)
次に、特定文字判定部22における処理の詳細について図13を参照しつつより詳細に説明する。図13は、特定文字判定部22における処理の流れを示すフローチャートである。
上記の文字列パターン検出命令を受け取ると、文字列パターン検出部22aは、まず、自らが備えるカウンタ(不図示)の値(n)を1に初期化する(n=1)(S21)。
次に、文字列パターン検出部22aは、カウンタの値(n)を参照し、nがN1以下であるか否かを判定する(S22)。ここで、N1は、項目が一つに特定できる項目対応テーブル42aに示される、文字列パターンと項目との対の数(項目対応テーブル42aの行の数)である。図5に示された例では、N1は6である。
nがN1以下であれば(S22にてYES)、文字列パターン検出部22aは、対象文字列が対応項目テーブル42aの第n番目の文字列パターンを含んでいるか否かの判定を行い(S23)、その判定結果および検出した文字列パターンを項目判定部22bへ出力する。
対象文字列が対応項目テーブル42aの第n番目の文字列パターンを含んでいる場合(S23にてYES)、項目判定部22bは、当該文字列パターンに対応する項目が対象文字列の項目であると判定する。そして、項目判定部22bは、この判定結果を文字列判定制御部2bへ出力する。
対象文字列が対応項目テーブル42aの第n番目の文字列パターンを含んでいない場合(S23にてNO)、項目判定部22bは、その判定結果を文字列パターン検出部22aへ出力する。そして、文字列パターン検出部22aは、nの値を1増やし(S24)、S22に戻る。
一方、nがN1以下でなければ、すなわち、項目対応テーブル42aに示されたすべての文字列パターンについての判定を終了すれば(S22にてNO)、特定文字判定部22は、項目対応テーブル42bに示された文字列パターンについて判定を行う(S25〜S29)。S25以降の処理は、S24までの処理とほぼ同様であるが、全文字列パターンに関して判定する点が異なっている。これは、項目が一つに限定できない文字列パターンを検出しているためである。
全ての文字列パターンの有無が判定された後、項目判定部22bは、これまでに検出できた文字列パターンに対応する項目群から、項目を絞り込むという処理を行う(S29)。
(文字列パターン検出部22aにおける処理の流れ)
次に、対象文字列に文字列パターンが含まれているか否かを判定する処理の流れについて図14を参照しつつ説明する。図14は、文字列パターン検出部22aにおける処理の流れを示すフローチャートである。
図14のフローチャートを用いた以下の説明では、文字列パターンがコロン「:」+「//」に合致するか否かを判定する処理について述べるが、その他の文字列パターンについてもほぼ同様の処理が行われる。
上記の文字列パターン検出命令を受け取ると、文字列パターン検出部22aは、自らが備えるカウンタの値(t)を1に初期化する(S31)。
次に、文字列パターン検出部22aは、tがT以下であるか否かを判定する(S32)。なお、上記Tは、対象文字列の文字数である。
tがTより大きければ、すなわち、対象文字列に含まれるすべての文字について判定を行えば、処理を終了する。
tがT以下であれば、文字列パターン検出部22aは、t番目の文字が、コロン「:」であるか否かの判定を行う(S33)。コロンであるか否かの判定は、上述した通りである。
t番目の文字が、コロンである場合(S33にてYES)、文字列パターン検出部22aは、t+1番目の文字が、スラッシュの連続からなる文字「//」であるか否かの判定を行う(S34)。スラッシュの連続であれば(S34にてYES)、文字列パターン検出部22aは、処理を終了し、そうでなければ(S34にてNO)、S35の処理を行う。
一方、t番目の文字が、コロンでない場合(S33にてNO)、文字列パターン検出部22aは、カウンタtを1増やし(S35)、S32の処理に戻る。
なお、図14に示す例は、2個のスラッシュが垂直方向走査線でオーバーラップして1文字に扱われる場合の例である。2個のスラッシュが重ならない場合は、t番目の文字が「:」、かつ、t+1番目の文字が「/」、かつ、t+2番目の文字が「/」 であるか否かを判定すればよい。
その他の文字列パターンが含まれているか否かの判定についても、図14のフローチャートと同様の方法にて容易に調べられる。
(認識対象文書が名刺である場合の処理の例)
最後に、以上説明した処理によって、図3に示す名刺がどのように認識されるかについて述べる。なお、図12のS1において、氏名、電話、メールの項目が選択されたとものとする。
氏名「△山×男」、所属「総務部」、会社名「XYZ株式会社」の各文字列に関しては、上述した特定の文字列パターンが含まれていない。これには次のように対処する。
まず、氏名については、上述したように、特許文献2等に述べられている方法にて、最初に氏名のみ抽出しておけばよい。
残りの所属、会社名については、特定の文字列パターンが存在しない。これについては、従来の手法(たとえば、特許文献3等)の手法を用いて、日本語文字列か英語文字列かの判定を行えばよい。所属、会社名は、日本語文字列と判定される(はずである)ので、これらの文字列に対しては認識処理を行わないようにすればよい。
残りの電話、メール、URLは、上述した特定の文字列パターンを検索する方法で、項目の特定が可能である。
電話行の「TEL:0123-45-6789」は、
(1)文字列パターン(「L」+「:」)に合致することから、電話、メール、または、URLと判定され、
(2)文字列パターン(ハイフン+数字列+ハイフン)に合致することから、電話、または、FAXと判定されるが、
(1)および(2)に共通な項目は、電話しかないため、電話行の項目は、「電話」に特定される。従って、上記電話行は、文字列認識部23における文字認識処理の対象とならない。
メール行の「sankaku.batsu@sxyz.co.jp」は、ピリオドを3個含んでいるので、メール、または、URLの何れかと判定される。
上述した本実施形態の説明では、どちらであるかを特定できるルールはないので、メール行は、メールまたはURLの何れかと判定されるため、文字列認識部23における文字認識処理の対象となる。
文字列認識部23における文字列認識処理の後、項目判定部24における項目判定処理において、対象文字列が@を有すること等により、当該対象文字列はメール行と判定され、その結果が表示部8に表示される。
URL行の「http://www.xyz.co.jp」は、文字列パターン(「:」+「//」)に合致しているので、URLと判定される。従って、上記URL行は、文字列認識部23における文字列認識処理の対象とならない。
なお、なんらかの理由で文字列パターンが抽出できなかった場合には、同じく特許文献3等に記載の従来手法を用いて、日本語文字列か英語文字列かの判定を行った後、英語文字列であれば、電話、または、メール項目として認識すればよい。電話、FAX、メール、URLは、英語文字列と判定される(はずである)ので、電話、または、メール項目として認識すればよい。
(携帯電話1の効果)
以上のように、本実施形態の携帯電話1(文字列判定装置)によれば、認識対象文書に記載された文字列に含まれる特定の文字列パターンに着目することにより、文字列の項目を絞り込むことができ、さらに特定の文字列については一意に決定することが可能である。
さらに、項目の判定は、主として、文字の形状、文字列中における文字の相対位置等の少なくともいずれか一つの特徴を用いるため、項目判定にかかる処理量が少ない。それゆえ、上記文字列判定装置は、小型の携帯情報端末等の処理能力が低い機器への搭載にも適している。
本発明の文字列判定装置では、ユーザが欲する特定の項目のみを抽出し、当該特定の項目に対して認識処理を適用することができる。このこと(および、この手法自体も簡単かつ高速であること)により、小型の携帯情報端末等の処理能力が低い機器でも認識処理時間を低減することができる。
また、上記文字列判定装置では、必ずしも文字列の項目が1つに決まらない場合がある。例えば、メールまたはURLのどちらか、という判定結果になる場合がある。
しかしながら、文字列の項目を限定し、必要な辞書カテゴリのみを使うことによりマッチングの高速化が可能であるという利点がある。項目が一意に決まらない場合は、文字列認識後、文字列の認識結果から項目を判定するという従来の方法を用いればよい。このときの従来の方法はどのようなものであってもよい。
さらに、認識対象とする項目はユーザが選択できることにより、ユーザにとって使い勝手がよい。
また、ユーザが選択した必要な項目のみを認識し、その結果を出力するため、ユーザにとって不要な項目を削除(または、修正)することによるユーザの負担が、全項目を出力する場合に比べて少ないという利点がある。
また、上記文字列判定装置は、認識対象項目を限定しない場合でも、最初に文字列の項目を絞り込み、絞り込んだ対象項目に必要な文字カテゴリのみを使った辞書照合処理を行うことにより、認識対象の全項目を認識するよりも、認識処理時間の短縮が図れるという効果も奏する。
なお、認識対象文書は、画像に制限されるものでない。例えば、オンライン手書き文字列の認識処理では、画像情報の代わりにストローク情報を用いればよい。
(変更例)
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
例えば、上述の構成では、入力制御部5が、ユーザが指定した対象文字列の項目である認識対象項目(指定種類)の情報を受け付けていたが、認識対象項目の情報は、予め記憶部4に格納されていてもよい。
また、上述した携帯電話1の各ブロック、特に主制御部2は、ハードウェアロジックによって構成してもよいし、次のようにCPUを用いてソフトウェアによって実現してもよい。
すなわち、携帯電話1は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである携帯電話1の制御プログラム(文字列認識プログラム)のプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記携帯電話1に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
また、携帯電話1を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
本発明の文字列判定装置は、認識対象となる文字列が、予め定められた種類のどれに相当するものかを少ない処理量で判定することができるため、処理能力の低い携帯端末にも好適に組み込むことができる。
一実施形態の携帯電話が備える特定文字判定部の構成を示す機能ブロック図である。 上記携帯電話の構成を示す機能ブロック図である。 上記携帯電話の認識対象文書の一例を示す図である。 上記携帯電話が備える表示部に表示される対象文字列の項目の一例を示す図である。 対応項目テーブルの一例を示す図である。 対応項目テーブルの一例を示す図である。 文字判定ルールテーブルの一例を示す図である。 コロンの形状を示す図である。 括弧の形状を示す図である。 スラッシュの形状を示す図である。 上記携帯電話が備える文字列抽出部によって抽出された文字列情報の構造の例を示す図である。 上記携帯電話における処理の流れを示すフローチャートである。 上記携帯電話が備える特定文字判定部における処理の流れを示すフローチャートである。 上記携帯電話が備える文字列パターン検出部における処理の流れを示すフローチャートである。
符号の説明
1 携帯電話(文字列判定装置)
22a 文字列パターン検出部(特定文字検出手段)
22b 項目判定部(種類判定手段)
23 文字列認識部(文字認識手段)
24 項目判定部(文字列特定手段)
43 文字認識辞書
51 対象項目指示部(受付手段)
60 文字列情報(対象文字列)

Claims (7)

  1. 対象文字列を構成する文字の形状を示す文字列情報を取得し、当該文字列情報によって示される文字の形状をもとに対象文字列の種類を判定する文字列判定装置であって、
    文字列の種類と対応付けられた、特定の形状を示す情報である文字列パターンが上記文字列情報に含まれているかどうかを検出する特定文字検出手段と、
    上記特定文字検出手段によって、上記文字列パターンが上記文字列情報内に検出された場合に、当該文字列パターンに対応する文字列の種類を、当該対象文字列の種類とする種類判定手段と
    上記種類判定手段によって上記種類の候補が複数挙げられた場合に、当該種類の候補にそれぞれ対応する複数の文字認識辞書を参照することにより、上記文字列情報に含まれる文字を識別する文字認識手段と、
    上記文字認識手段の文字認識結果に基づいて上記対象文字列の種類を特定する文字列特定手段と、を備えることを特徴とする文字列判定装置。
  2. 対象文字列を構成する文字の形状を示す文字列情報を取得し、当該文字列情報によって示される文字の形状をもとに対象文字列の種類を判定する文字列判定装置であって、
    文字列の種類と対応付けられた、特定の形状を示す情報である文字列パターンが上記文字列情報に含まれているかどうかを検出する特定文字検出手段と、
    上記特定文字検出手段によって、上記文字列パターンが上記文字列情報内に検出された場合に、当該文字列パターンに対応する文字列の種類を、当該対象文字列の種類とする種類判定手段と
    上記種類判定手段によって上記種類の候補が複数挙げられた場合、かつ、指定された対象文字列の種類である指定種類と一致する種類の対象文字列が、上記複数の候補の中に含まれている場合に、上記指定種類と対応する文字認識辞書を参照することにより、上記文字列情報に含まれる文字を識別する文字認識手段と、
    上記文字認識手段の文字認識結果に基づいて上記対象文字列の種類を特定する文字列特定手段と、を備えることを特徴とする文字列判定装置。
  3. 上記文字列パターンは、特定の形状を有する文字の情報または特定の相対位置関係を有する構成部分を含む文字の情報、もしくはその両方を含むものであることを特徴とする請求項1または2に記載の文字列判定装置。
  4. 請求項1〜のいずれか1項に記載の文字列判定装置の上記各手段としてコンピュータを機能させるための文字列判定プログラム。
  5. 請求項に記載の文字列判定プログラムを記録したコンピュータ読み取り可能な記録媒体。
  6. 対象文字列を構成する文字の形状を示す文字列情報を取得し、当該文字列情報によって示される文字の形状をもとに対象文字列の種類を判定する文字列判定装置における文字列判定方法であって、
    文字列の種類と対応付けられた、特定の形状を示す情報である文字列パターンが上記文字列情報に含まれているかどうかを検出する特定文字検出工程と、
    上記特定文字検出工程によって、上記文字列パターンが上記文字列情報内に検出された場合に、当該文字列パターンに対応する文字列の種類を、当該対象文字列の種類とする種類判定工程と
    上記種類判定工程によって上記種類の候補が複数挙げられた場合に、当該種類の候補にそれぞれ対応する複数の文字認識辞書を参照することにより、上記文字列情報に含まれる文字を識別する文字認識工程と、
    上記文字認識工程の文字認識結果に基づいて上記対象文字列の種類を特定する文字列特定工程と、を含むことを特徴とする文字列判定方法。
  7. 対象文字列を構成する文字の形状を示す文字列情報を取得し、当該文字列情報によって示される文字の形状をもとに対象文字列の種類を判定する文字列判定装置における文字列判定方法であって、
    文字列の種類と対応付けられた、特定の形状を示す情報である文字列パターンが上記文字列情報に含まれているかどうかを検出する特定文字検出工程と、
    上記特定文字検出工程によって、上記文字列パターンが上記文字列情報内に検出された場合に、当該文字列パターンに対応する文字列の種類を、当該対象文字列の種類とする種類判定工程と、
    上記種類判定工程によって上記種類の候補が複数挙げられた場合、かつ、指定された対象文字列の種類である指定種類と一致する種類の対象文字列が、上記複数の候補の中に含まれている場合に、上記指定種類と対応する文字認識辞書を参照することにより、上記文字列情報に含まれる文字を識別する文字認識工程と、
    上記文字認識工程の文字認識結果に基づいて上記対象文字列の種類を特定する文字列特定工程と、を含むことを特徴とする文字列判定方法。
JP2006216188A 2006-08-08 2006-08-08 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP4800144B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006216188A JP4800144B2 (ja) 2006-08-08 2006-08-08 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006216188A JP4800144B2 (ja) 2006-08-08 2006-08-08 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2008040910A JP2008040910A (ja) 2008-02-21
JP4800144B2 true JP4800144B2 (ja) 2011-10-26

Family

ID=39175819

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006216188A Expired - Fee Related JP4800144B2 (ja) 2006-08-08 2006-08-08 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP4800144B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010217996A (ja) * 2009-03-13 2010-09-30 Omron Corp 文字認識装置、文字認識プログラム、および文字認識方法
JP6086017B2 (ja) * 2013-04-17 2017-03-01 富士通セミコンダクター株式会社 データ処理装置、及び、データ処理プログラム
JP5952776B2 (ja) * 2013-05-24 2016-07-13 富士通フロンテック株式会社 文字認識装置、文字認識方法、および文字認識プログラム
JP6503478B2 (ja) * 2016-01-20 2019-04-17 株式会社Pfu モバイル端末、画像処理方法、および、プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3375766B2 (ja) * 1994-12-27 2003-02-10 松下電器産業株式会社 文字認識装置
JP2001008072A (ja) * 1999-06-22 2001-01-12 Casio Comput Co Ltd 電子カメラ及びその制御方法
JP2001109763A (ja) * 1999-10-07 2001-04-20 Nkk Corp 情報処理装置
JP2003152829A (ja) * 2001-11-14 2003-05-23 Sharp Corp 通信機
JP4597644B2 (ja) * 2003-11-28 2010-12-15 シャープ株式会社 文字認識装置、プログラムおよび記録媒体
JP2006099270A (ja) * 2004-09-28 2006-04-13 Toshiba Corp 文字認識装置

Also Published As

Publication number Publication date
JP2008040910A (ja) 2008-02-21

Similar Documents

Publication Publication Date Title
US7730050B2 (en) Information retrieval apparatus
KR101199747B1 (ko) 단어 인식 방법 및 단어 인식용 프로그램의 기록매체 및 정보 처리 장치
US20140056475A1 (en) Apparatus and method for recognizing a character in terminal equipment
JP2007317022A (ja) 手書文字処理装置及び手書文字処理方法
KR101078086B1 (ko) 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법
US20060285748A1 (en) Document processing device
KR20100000190A (ko) 문자인식장치에서의 문자인식방법 및 그 장치
CN108256523B (zh) 基于移动终端的识别方法、装置及计算机可读存储介质
JP2010086151A (ja) データ生成装置、スキャナ、及びコンピュータプログラム
CN109388935B (zh) 单证验证方法及装置、电子设备及可读存储介质
US7697722B2 (en) Portable terminal and character reading method using a portable terminal
JP4800144B2 (ja) 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体
JP4668345B1 (ja) 情報処理装置、および情報処理装置の制御方法
US9641740B2 (en) Apparatus and method for auto-focusing in device having camera
JP5239419B2 (ja) 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造
JP2004152036A (ja) 文字認識機能付携帯電話機器及び認識文字の修正方法並びにプログラム
JP4597644B2 (ja) 文字認識装置、プログラムおよび記録媒体
US20130330005A1 (en) Electronic device and character recognition method for recognizing sequential code
JP4802502B2 (ja) 単語認識装置および単語認識方法
CN110909723B (zh) 信息处理装置及计算机可读存储介质
JP2012226085A (ja) 電子機器、制御方法、および制御プログラム
JP4851604B2 (ja) 携帯電子機器および携帯電子機器の制御方法
KR20050003075A (ko) 문자인식기능과 전자사전을 구비하는 휴대통신장치및 문자인식기능을 구비하는 전자사전
KR20200049435A (ko) 문자 인식에 기반한 서비스 제공 방법 및 장치
JP4431335B2 (ja) 文字列読み取りプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080806

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110328

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110802

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110803

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140812

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4800144

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees