JP4800144B2 - 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体 - Google Patents
文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体 Download PDFInfo
- Publication number
- JP4800144B2 JP4800144B2 JP2006216188A JP2006216188A JP4800144B2 JP 4800144 B2 JP4800144 B2 JP 4800144B2 JP 2006216188 A JP2006216188 A JP 2006216188A JP 2006216188 A JP2006216188 A JP 2006216188A JP 4800144 B2 JP4800144 B2 JP 4800144B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- type
- target
- determination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
記載されている。この特許文献3に記載の文字認識方法では、文字列内の文字の複雑度を測定し、英数字文字列か、日本語文字列かを判定する。この手法を用いて、最初に名刺に記載された文字列を抽出した後、文字列が日本語行か英語行かの判定を行い、英語行であれば、電話、メールの可能性があるので当該文字列をさらに詳細に認識し、日本語行であれば認識しないという処理を行うことが考えられる。
図2は、本実施形態の携帯電話1(文字列認識装置)の構成を示す機能ブロック図である。図2に示すように、携帯電話1は、主制御部2、一時記憶部3、記憶部4、入力制御部5、操作部6、出力制御部7、表示部8およびカメラ9を備えている。これら各部は、データバスで接続されている。
次に、文字列判定部2aが備える機能ブロックについて詳細に説明する。
次に、携帯電話1の認識対象文書について、図3を参照しつつ説明する。図3は、携帯電話1の認識対象文書の一例を示す図である。
次に、表示部8に表示される対象文字列の項目の一例について、図4を参照しつつ説明する。図4は、表示部8に表示される対象文字列の項目の一例を示す図である。
次に、対応項目テーブル42について図5および図6を参照しつつ説明する。対応項目テーブル42は、対象文字列に含まれる文字列パターンと、対象文字列の項目との対応関係を示すものである。図5および図6は、対応項目テーブル42の一例を示す図である。
次に、文字判定ルールテーブル41について図7を参照しつつ説明する。図7は、文字判定ルールテーブル41の一例を示す図である。文字判定ルールテーブル41は、対象文字列に文字列パターンが含まれているか否かを判定するためのルールを規定するものである。文字列パターン検出部22aが以下に説明するルールに従って、文字列パターンの検出を行う。
β1は、上部ラインから下部ラインに移るにつれ、ほぼ単調に減少していくが、逆に、
β3は、上部ラインから下部ラインに移るにつれ、ほぼ単調に増加していく。
β2は、走査線がどのライン上であるかにかかわらず、ほぼ一定である。
以上のような特徴を持てば、スラッシュの連続からなる文字と判定する。
その対策として、「舌」+「:」のルールを追加してもよい。
次に、文字列抽出部21によって抽出された文字列の情報の一例について、図11を参照しつつ説明する。図11は、文字列抽出部21によって抽出された文字列情報60の構造の例を示す図である。図11には、1文字列分の文字列情報が示されている。
文字列の左上および右下の座標を示す文字列座標情報62、文字列に含まれる各文字に関する文字情報63から成る。
メール:sharp.taro@sharp.co.jp
の先頭5文字分を認識する。
次に、文字列認識部23による文字認識辞書43の利用方法の例について説明する。
「電」、「話」、「T」、「E」、「L」、「t」、「e」、「l」、「:」
などの文字のみを辞書照合時に用いればよい。
「メ」、「ー」、「ル」、「:」、
などの文字のみを辞書照合時に用いればよい。
次に、携帯電話1において、対象画像から複数の文字列を抽出し、各文字列の項目を判定する処理の流れについて、図12を参照しつつ説明する。図12は、携帯電話1における処理の流れを示すフローチャートである。なお、以下では、特定文字判定部22において対象文字列の項目がひとつに決まらない場合の処理の流れについて説明する。
次に、特定文字判定部22における処理の詳細について図13を参照しつつより詳細に説明する。図13は、特定文字判定部22における処理の流れを示すフローチャートである。
次に、対象文字列に文字列パターンが含まれているか否かを判定する処理の流れについて図14を参照しつつ説明する。図14は、文字列パターン検出部22aにおける処理の流れを示すフローチャートである。
最後に、以上説明した処理によって、図3に示す名刺がどのように認識されるかについて述べる。なお、図12のS1において、氏名、電話、メールの項目が選択されたとものとする。
(1)文字列パターン(「L」+「:」)に合致することから、電話、メール、または、URLと判定され、
(2)文字列パターン(ハイフン+数字列+ハイフン)に合致することから、電話、または、FAXと判定されるが、
(1)および(2)に共通な項目は、電話しかないため、電話行の項目は、「電話」に特定される。従って、上記電話行は、文字列認識部23における文字認識処理の対象とならない。
以上のように、本実施形態の携帯電話1(文字列判定装置)によれば、認識対象文書に記載された文字列に含まれる特定の文字列パターンに着目することにより、文字列の項目を絞り込むことができ、さらに特定の文字列については一意に決定することが可能である。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
22a 文字列パターン検出部(特定文字検出手段)
22b 項目判定部(種類判定手段)
23 文字列認識部(文字認識手段)
24 項目判定部(文字列特定手段)
43 文字認識辞書
51 対象項目指示部(受付手段)
60 文字列情報(対象文字列)
Claims (7)
- 対象文字列を構成する文字の形状を示す文字列情報を取得し、当該文字列情報によって示される文字の形状をもとに対象文字列の種類を判定する文字列判定装置であって、
文字列の種類と対応付けられた、特定の形状を示す情報である文字列パターンが上記文字列情報に含まれているかどうかを検出する特定文字検出手段と、
上記特定文字検出手段によって、上記文字列パターンが上記文字列情報内に検出された場合に、当該文字列パターンに対応する文字列の種類を、当該対象文字列の種類とする種類判定手段と、
上記種類判定手段によって上記種類の候補が複数挙げられた場合に、当該種類の候補にそれぞれ対応する複数の文字認識辞書を参照することにより、上記文字列情報に含まれる文字を識別する文字認識手段と、
上記文字認識手段の文字認識結果に基づいて上記対象文字列の種類を特定する文字列特定手段と、を備えることを特徴とする文字列判定装置。 - 対象文字列を構成する文字の形状を示す文字列情報を取得し、当該文字列情報によって示される文字の形状をもとに対象文字列の種類を判定する文字列判定装置であって、
文字列の種類と対応付けられた、特定の形状を示す情報である文字列パターンが上記文字列情報に含まれているかどうかを検出する特定文字検出手段と、
上記特定文字検出手段によって、上記文字列パターンが上記文字列情報内に検出された場合に、当該文字列パターンに対応する文字列の種類を、当該対象文字列の種類とする種類判定手段と、
上記種類判定手段によって上記種類の候補が複数挙げられた場合、かつ、指定された対象文字列の種類である指定種類と一致する種類の対象文字列が、上記複数の候補の中に含まれている場合に、上記指定種類と対応する文字認識辞書を参照することにより、上記文字列情報に含まれる文字を識別する文字認識手段と、
上記文字認識手段の文字認識結果に基づいて上記対象文字列の種類を特定する文字列特定手段と、を備えることを特徴とする文字列判定装置。 - 上記文字列パターンは、特定の形状を有する文字の情報または特定の相対位置関係を有する構成部分を含む文字の情報、もしくはその両方を含むものであることを特徴とする請求項1または2に記載の文字列判定装置。
- 請求項1〜3のいずれか1項に記載の文字列判定装置の上記各手段としてコンピュータを機能させるための文字列判定プログラム。
- 請求項4に記載の文字列判定プログラムを記録したコンピュータ読み取り可能な記録媒体。
- 対象文字列を構成する文字の形状を示す文字列情報を取得し、当該文字列情報によって示される文字の形状をもとに対象文字列の種類を判定する文字列判定装置における文字列判定方法であって、
文字列の種類と対応付けられた、特定の形状を示す情報である文字列パターンが上記文字列情報に含まれているかどうかを検出する特定文字検出工程と、
上記特定文字検出工程によって、上記文字列パターンが上記文字列情報内に検出された場合に、当該文字列パターンに対応する文字列の種類を、当該対象文字列の種類とする種類判定工程と、
上記種類判定工程によって上記種類の候補が複数挙げられた場合に、当該種類の候補にそれぞれ対応する複数の文字認識辞書を参照することにより、上記文字列情報に含まれる文字を識別する文字認識工程と、
上記文字認識工程の文字認識結果に基づいて上記対象文字列の種類を特定する文字列特定工程と、を含むことを特徴とする文字列判定方法。 - 対象文字列を構成する文字の形状を示す文字列情報を取得し、当該文字列情報によって示される文字の形状をもとに対象文字列の種類を判定する文字列判定装置における文字列判定方法であって、
文字列の種類と対応付けられた、特定の形状を示す情報である文字列パターンが上記文字列情報に含まれているかどうかを検出する特定文字検出工程と、
上記特定文字検出工程によって、上記文字列パターンが上記文字列情報内に検出された場合に、当該文字列パターンに対応する文字列の種類を、当該対象文字列の種類とする種類判定工程と、
上記種類判定工程によって上記種類の候補が複数挙げられた場合、かつ、指定された対象文字列の種類である指定種類と一致する種類の対象文字列が、上記複数の候補の中に含まれている場合に、上記指定種類と対応する文字認識辞書を参照することにより、上記文字列情報に含まれる文字を識別する文字認識工程と、
上記文字認識工程の文字認識結果に基づいて上記対象文字列の種類を特定する文字列特定工程と、を含むことを特徴とする文字列判定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006216188A JP4800144B2 (ja) | 2006-08-08 | 2006-08-08 | 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006216188A JP4800144B2 (ja) | 2006-08-08 | 2006-08-08 | 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008040910A JP2008040910A (ja) | 2008-02-21 |
JP4800144B2 true JP4800144B2 (ja) | 2011-10-26 |
Family
ID=39175819
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006216188A Expired - Fee Related JP4800144B2 (ja) | 2006-08-08 | 2006-08-08 | 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4800144B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010217996A (ja) * | 2009-03-13 | 2010-09-30 | Omron Corp | 文字認識装置、文字認識プログラム、および文字認識方法 |
JP6086017B2 (ja) * | 2013-04-17 | 2017-03-01 | 富士通セミコンダクター株式会社 | データ処理装置、及び、データ処理プログラム |
JP5952776B2 (ja) * | 2013-05-24 | 2016-07-13 | 富士通フロンテック株式会社 | 文字認識装置、文字認識方法、および文字認識プログラム |
JP6503478B2 (ja) * | 2016-01-20 | 2019-04-17 | 株式会社Pfu | モバイル端末、画像処理方法、および、プログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3375766B2 (ja) * | 1994-12-27 | 2003-02-10 | 松下電器産業株式会社 | 文字認識装置 |
JP2001008072A (ja) * | 1999-06-22 | 2001-01-12 | Casio Comput Co Ltd | 電子カメラ及びその制御方法 |
JP2001109763A (ja) * | 1999-10-07 | 2001-04-20 | Nkk Corp | 情報処理装置 |
JP2003152829A (ja) * | 2001-11-14 | 2003-05-23 | Sharp Corp | 通信機 |
JP4597644B2 (ja) * | 2003-11-28 | 2010-12-15 | シャープ株式会社 | 文字認識装置、プログラムおよび記録媒体 |
JP2006099270A (ja) * | 2004-09-28 | 2006-04-13 | Toshiba Corp | 文字認識装置 |
-
2006
- 2006-08-08 JP JP2006216188A patent/JP4800144B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008040910A (ja) | 2008-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7730050B2 (en) | Information retrieval apparatus | |
KR101199747B1 (ko) | 단어 인식 방법 및 단어 인식용 프로그램의 기록매체 및 정보 처리 장치 | |
US20140056475A1 (en) | Apparatus and method for recognizing a character in terminal equipment | |
JP2007317022A (ja) | 手書文字処理装置及び手書文字処理方法 | |
KR101078086B1 (ko) | 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법 | |
US20060285748A1 (en) | Document processing device | |
KR20100000190A (ko) | 문자인식장치에서의 문자인식방법 및 그 장치 | |
CN108256523B (zh) | 基于移动终端的识别方法、装置及计算机可读存储介质 | |
JP2010086151A (ja) | データ生成装置、スキャナ、及びコンピュータプログラム | |
CN109388935B (zh) | 单证验证方法及装置、电子设备及可读存储介质 | |
US7697722B2 (en) | Portable terminal and character reading method using a portable terminal | |
JP4800144B2 (ja) | 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体 | |
JP4668345B1 (ja) | 情報処理装置、および情報処理装置の制御方法 | |
US9641740B2 (en) | Apparatus and method for auto-focusing in device having camera | |
JP5239419B2 (ja) | 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造 | |
JP2004152036A (ja) | 文字認識機能付携帯電話機器及び認識文字の修正方法並びにプログラム | |
JP4597644B2 (ja) | 文字認識装置、プログラムおよび記録媒体 | |
US20130330005A1 (en) | Electronic device and character recognition method for recognizing sequential code | |
JP4802502B2 (ja) | 単語認識装置および単語認識方法 | |
CN110909723B (zh) | 信息处理装置及计算机可读存储介质 | |
JP2012226085A (ja) | 電子機器、制御方法、および制御プログラム | |
JP4851604B2 (ja) | 携帯電子機器および携帯電子機器の制御方法 | |
KR20050003075A (ko) | 문자인식기능과 전자사전을 구비하는 휴대통신장치및 문자인식기능을 구비하는 전자사전 | |
KR20200049435A (ko) | 문자 인식에 기반한 서비스 제공 방법 및 장치 | |
JP4431335B2 (ja) | 文字列読み取りプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080806 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110328 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110802 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110803 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140812 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4800144 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |