JP2005141604A - 携帯情報端末における文字認識方法および携帯情報端末 - Google Patents

携帯情報端末における文字認識方法および携帯情報端末 Download PDF

Info

Publication number
JP2005141604A
JP2005141604A JP2003379289A JP2003379289A JP2005141604A JP 2005141604 A JP2005141604 A JP 2005141604A JP 2003379289 A JP2003379289 A JP 2003379289A JP 2003379289 A JP2003379289 A JP 2003379289A JP 2005141604 A JP2005141604 A JP 2005141604A
Authority
JP
Japan
Prior art keywords
character
information terminal
portable information
dictionary data
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003379289A
Other languages
English (en)
Inventor
Eiji Makimoto
英二 巻本
Hisao Ogata
日佐男 緒方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003379289A priority Critical patent/JP2005141604A/ja
Publication of JP2005141604A publication Critical patent/JP2005141604A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Telephone Function (AREA)

Abstract

【課題】
従来の携帯情報端末を用いた文字認識方法では、端末のメモリリソースの制限等により認識対象字種が限定されてしまい、カタカナ、漢字や各国言語を認識対象として場合、メモリ使用量や起動時間・処理時間の増加が課題となっている。
【解決手段】
上記課題を解決するために、画像を入力する画像入力部と、入力した画像データを表示する表示部と、利用者がボタン入力操作する操作部と、画像内の文字を認識する文字認識部と、全体を制御する制御部とを備えた携帯情報端末において、文字認識に使用する文字識別辞書データを制御部内部メモリとメモリカードへ分割し、制御部メモリリソースを効率良く利用することで、より多くの認識対象文字に対して、高速に文字認識する文字認識方法を提供する。
【選択図】 図1

Description

本発明は、付属のカメラ等から取得した画像中の文字列を文字認識し、コード化して利用する文字認識機能を搭載する携帯情報端末およびその文字認識方法に関する。
従来、携帯情報端末にて入力した画像から文字認識をする場合、端末のメモリリソースの制限等により認識対象字種が英数字の活字に限られており、カタカナ、漢字または各国言語や手書き文字を認識対象とした場合、起動時や文字認識の処理時間増加やメモリ使用量増加が課題となっている。携帯情報端末にカメラや外部入力等の画像入力部を具備し、入力した画像中の文字列を文字認識によりコード化して利用する技術としては、例えば特許文献1に記載の発明がある。
特開2002−252691号公報(第3〜4項、第1〜2図)
従来の携帯情報端末にて入力した画像から文字認識をする場合、端末のメモリリソースの制限等により認識対象字種が英数字の活字に限られており、カタカナ、漢字または各国言語や手書き文字を認識対象とした場合、文字認識処理に必要なメモリ使用量の増加や、起動時や認識処理の処理時間増加が課題となっている。
本発明は、前述の課題に鑑みなされたもので、携帯情報端末にて多数の認識対象文字に対して文字認識を行う場合に限られたメモリリソースを効率良く利用し、高速な文字認識を実現することを目的とする。
前述した課題を解決するための手段として、付属カメラ等の画像入力部と、画像入力部によって入力した画像を表示する表示部と、利用者が入力操作する操作部と、画像中の文字列イメージを文字認識し、コード化する文字認識部と、前記各部を制御する制御部を備えた携帯情報端末で入力した画像中の文字列をコード化する場合の文字認識部では、プログラム部と文字識別に使用する識別辞書データ部とを認識対象字種別に複数に分割し、利用状況に応じてアクセス速度の異なるメモリへ分けてロードして使用することによって、多数の字種を認識対象とすることが出来る。
また、上記の文字認識部について、文字識別に使用する識別辞書データを文字識別精度のレベルに応じて複数に分割し、プログラム起動時には文字識別に必要最低限の辞書データをロードし、プログラム起動後に必要に応じて辞書データを追加ロードすることでプログラム起動時間を短縮することが出来る。
携帯情報端末の画像入力部より取得した画像から文字認識をする場合に、限られたメモリリソースを効率良く利用することで、多くの字種を認識対象文字として扱うことができる。また、プログラムの起動時間や認識処理時間を短縮することができる。
以下、本発明の実施例として図を用いて説明する。
図1は、本実施形態に係る画像入力手段を持つ携帯情報端末あるいは携帯電話100の概略を示す構成図である。名刺や雑誌、あるいは看板などの文字認識対象の画像が、画像入力部110から入力され、文字認識部160において行候補の抽出を行い、文字行の候補(画像)を表示部120に表示する。利用者が操作部130を操作することで抽出した文字行候補から認識対象となる文字行を選択し、選択した文字行を端末内部に備えられた認識部160において文字認識する。
メモリカード140は、用途に応じて脱着可能なフラッシュメモリで、利用者が画像入力部110にて撮影した画像や、インターネット等からダウンロードしたデータを記録、保存することが可能である。また、メモリカード140は、一般的に携帯情報端末に内蔵している物理メモリよりもアクセス速度が遅い。
なお、上記動作は端末内部に備えられた制御部150によって制御される。
図2は文字認識処理のうち、各文字データに対する文字識別処理についての概略を示す図である。まず、識別対象の文字201と認識対象字種202が入力され、入力文字の特徴量情報を抽出する(S203)、特徴量情報としては、入力文字情報をさまざまな尺度で表現した情報量で、例えば黒画素分布情報や文字輪郭情報が挙げられる。
次に、抽出した文字特徴量と文字識別の為の標準パターン情報を格納した文字識別辞書情報を使い入力文字の文字識別を行う。通常、文字識別処理では高速処理を目的とし、多階層の識別を行う。候補絞込み識別(S204)では多数の候補字種から候補絞込み辞書205を用いて高速に文字候補を絞り込み(206)、絞り込んだ候補の中から詳細文字識別(S207)により詳細辞書208を用いて、高精度に文字識別を行い、最終結果を出力する(S209)
図3は携帯情報端末100の文字認識部160での処理手順を示す。文字認識プログラムが起動するとメモリ上へ文字識別辞書データがロードされる(S301)。次に画像入力部110で取得された画像と文字認識に必要な認識対象字種等の認識情報が入力され(S302)、入力画像から認識対象の文字行を抽出(S303)し、文字行から1文字ごとに切り出す(S304)。
切り出された文字は図2で説明した文字識別部に入力され(S305)、文字特徴量抽出(S306)、候補絞込み識別(S307)、詳細文字識別(S308)を行い、識別結果を出力する(S309)。文字列中の全ての文字に対して文字識別を実施(S310)した後、各文字の文字識別結果から文字列としての結果を出力し(S311)、携帯情報端末の表示部120に文字認識結果を表示する。
上記図3に示す文字認識方法で、漢字等の多くの字種を認識対象とした場合、認識候補数分だけの文字識別辞書データが必要となり、これを起動時にメモリ上へ展開する必要がある為に、多くのメモリリソースが必要となり、また、認識処理を実施するまでの起動時間が多くかかるといった問題がある。
図4は、上記問題を改善した第2の実施形態の構成図である。制御部401及びメモリカード404は、図1における制御部150及びメモリカード140に相当する。携帯情報端末の制御部401に含まれる高速アクセス可能なメモリには認識プログラム402と候補絞込み辞書403のみをロードし、詳細辞書データ405はメモリカード404に格納し、必要に応じてメモリカードへアクセスをする。
図5に本実施形態の処理手順を示す。まずプログラム起動時に候補絞込み辞書のみをロードする(S501)、これにより図2の場合に比べプログラム起動時間が早くなる。以降(S502〜S507)は図2の手順と同じである。候補絞込み識別(S507)にて絞り込まれた候補字種についてのみ、メモリカードに格納してある詳細辞書データを制御部のメモリ上にロードし(S508)、以降(S509〜S512)と図2と同様に文字識別を実施し、文字列認識結果を出力する。
図5に示す文字認識手順で処理させた場合、1文字識別する毎に絞込み後の候補数分だけメモリカードのアクセスが発生し、認識処理時間がかかるといった課題も考えられる。そこで、図6は、メモリカードをへのアクセスを減らす第3の実施形態の処理手順である。図5の処理と同様にプログラム起動時に候補絞込み辞書のみをロードし(S601)、以降(S602〜S607)は図5の手順と同じである。ここでは、候補絞込み識別(S607)を入力文字行中の全文字に対して実施し(S608)、全文字に対する絞込み候補について重複を省いて必要な詳細辞書データをメモリカードから制御部のメモリ上にロードし(S609)、全文字分の詳細文字識別を行い(S610)、文字列認識結果を出力する。これにより、認識対象文字列中に同一文字や類似文字がある場合等に重複して同じ詳細辞書データをメモリカードへアクセスすることを防ぐことが出来る。
図7は、図1の携帯情報端末上で動作する文字認識方式において、多種の文字を認識対象とする為の実施形態の概略図である。図4と同様に文字認識部を携帯情報端末の制御部701に含まれる高速アクセス可能なメモリとメモリカード705に分けて格納する。制御部のメモリ上には認識プログラム702、候補絞込み辞書703と詳細辞書情報を格納するキャッシュ領域704を設け、メモリカード上には多種多様な言語の詳細辞書706を格納し、文字認識処理時に入力される認識対象情報によって使用頻度が高いと想定される詳細辞書データを制御部メモリのキャッシュ領域にロードして使用できるようにあらかじめカテゴリ分けしておく。
図8に本実施形態の処理手順を示す。まずプログラム起動時に候補絞込み辞書のみをロードし(S801)、画像・認識情報を入力する(S802)。次に入力された認識情報から認識対象に合わせた使用されると想定される詳細辞書データをキャッシュ領域へロードする(S803)。以降(S804〜S809)までは図6の認識手順と同様である。認識対象の全文字に対して候補絞込みを実施後、詳細文字識別に必要な詳細辞書データがキャッシュ領域にない場合にはメモリカードから必要な詳細辞書データをロードする。以降は図6の処理手順と同様に全文字分の詳細文字識別を行い(S811)、文字列認識結果を出力する(S812)。
図9は、図1の携帯情報端末上で動作する文字認識方式において、多種の文字を認識対象とし、プログラム起動時間を短縮する為の実施形態の概略図である。図7と同様に文字認識部を形態情報端末の制御部901に含まれる高速アクセス可能なメモリとメモリカード905に分けて格納する。
制御部のメモリ上には認識プログラム902、候補絞込み辞書903と詳細辞書情報を格納するキャッシュ領域904を設け、メモリカード上には詳細辞書906を格納し、詳細辞書データを識別精度のレベルに合わせて分割してロードして使用できるようにあらかじめレベル分けしておく。プログラム起動時には最低レベルの詳細辞書データをロードして起動し、以降の文字認識処理と平行して残りの詳細辞書データを追加ロードしていくことでプログラム起動時間を短縮できる。
図10に本実施形態の処理手順を示す。まずプログラム起動時に候補絞込み辞書をロードし(S1001)、続けてメモリカードに格納している詳細辞書から文字識別に必要な最低レベルの辞書データをキャッシュ領域へロードし(S1002)、プログラム実行可能状態とする。また、必要に応じて以降文字認識処理と平行し、残りの詳細辞書データについても追加ロードすることで高精度の文字識別も実現できる(S1020)。
以降、画像・認識情報入力(S1003)から文字列認識結果出力(S1011)まで図8の処理手順と同じである。
携帯情報端末の構成図を示す図である。 文字識別処理の概要を説明する図である。 一般的な文字認識処理の手順を示す図である。 本願発明の実施形態の構成・概要を説明する図である。 本願発明の実施形態の処理手順を示す図である。 本願発明の実施形態の処理手順を示す図である。 本願発明の実施形態の構成・概要を説明する図である。 本願発明の実施形態の処理手順を示す図である。 本願発明の実施形態の構成・概要を説明する図である。 本願発明の実施形態の処理手順を示す図である。
符号の説明
100…携帯情報端末(携帯端末)、110…画像入力部、120…表示部、130…操作部、140…メモリカード、150…制御部、160…文字認識部

Claims (8)

  1. 画像入力部と、
    前記画像入力部から入力した画像データを表示する表示部と、
    入力の操作を行う操作部と、
    画像データに含まれる文字列イメージをコード化する文字認識部と、
    データやプログラムを一時的に記憶する高速メモリと、
    前記各部を制御する制御部と、
    を有し、文字識別プログラムと文字識別辞書データを用いて候補絞込みをしてから文字識別を行う携帯情報端末であって、
    前記制御部は前記文字識別プログラムと候補絞込み用の辞書データとを前記高速メモリ上へロードして候補絞込みを行い、端末付属のメモリカードに記憶した詳細辞書データを用いて最終的な文字識別結果を算出することを特徴とする携帯情報端末。
  2. 請求項1に記載の携帯情報端末であって、
    前記制御部は、認識対象となっている行単位の全ての文字に対して前記候補絞込み用の辞書データを用いて候補絞込みを実施した後、必要な候補文字に対してのみ詳細辞書データにアクセスすることを特徴とする携帯情報端末。
  3. 請求項1に記載の携帯情報端末であって、
    前記高速メモリ内に詳細辞書データを格納する一定もしくは可変容量のキャッシュ領域を有し、認識対象文字の種類や言語によって、キャッシュ領域の詳細辞書データの種類や容量を切替えて使用することを特徴とする携帯情報端末。
  4. 請求項3に記載の携帯情報端末であって、
    前記詳細辞書データを文字識別精度のレベルに応じて分割し、プログラム起動時には文字識別に必要な最低限の辞書データを前記高速メモリ上のキャッシュ領域へロードしてプログラム実行可能な状態とし、文字認識プログラム起動後、必要に応じて辞書データを追加的にロードすることを特徴とする携帯情報端末。
  5. 入力した画像データに含まれる文字列イメージをコード化する、携帯情報端末における文字認識方法であって、
    文字識別プログラムと候補絞込み用の辞書データとを当該携帯情報端末内の高速メモリ上へロードするステップと、
    前記文字識別プログラムと候補絞込み用の辞書データとを用いて候補絞込みを行うステップと、
    当該端末付属のメモリカードに記憶した詳細辞書データを用いて最終的な文字識別結果を算出するステップと
    から成ることを特徴とする携帯情報端末における文字認識方法。
  6. 請求項5に記載の携帯情報端末における文字認識方法であって、
    前記候補絞込みを行うステップは、認識対象となっている行単位の全ての文字に対して前記候補絞込み用の辞書データを用いて候補絞込みを実施し、
    前記文字識別結果を算出するステップは、必要な候補文字に対してのみ詳細辞書データにアクセスすることを特徴とする携帯情報端末における文字認識方法。
  7. 請求項5に記載の携帯情報端末における文字認識方法であって、
    前記文字識別結果を算出するステップは、
    当該携帯情報端末内の高速メモリに詳細辞書データを格納する一定もしくは可変容量のキャッシュ領域を確保するステップと、
    認識対象文字の種類や言語によって、前記キャッシュ領域の詳細辞書データの種類や容量を切替えて使用するステップと
    から成ることを特徴とする携帯情報端末における文字認識方法。
  8. 請求項7に記載の携帯情報端末における文字認識方法であって、
    前記文字識別結果を算出するステップは、
    前記詳細辞書データを文字識別精度のレベルに応じて分割するステップと、
    文字識別に必要な最低限の辞書データを前記高速メモリ上のキャッシュ領域へロードしてプログラム実行可能な状態とするステップと、
    必要に応じて辞書データを追加的にロードするステップと
    から成ることを特徴とする携帯情報端末における文字認識方法。
JP2003379289A 2003-11-10 2003-11-10 携帯情報端末における文字認識方法および携帯情報端末 Pending JP2005141604A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003379289A JP2005141604A (ja) 2003-11-10 2003-11-10 携帯情報端末における文字認識方法および携帯情報端末

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003379289A JP2005141604A (ja) 2003-11-10 2003-11-10 携帯情報端末における文字認識方法および携帯情報端末

Publications (1)

Publication Number Publication Date
JP2005141604A true JP2005141604A (ja) 2005-06-02

Family

ID=34689386

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003379289A Pending JP2005141604A (ja) 2003-11-10 2003-11-10 携帯情報端末における文字認識方法および携帯情報端末

Country Status (1)

Country Link
JP (1) JP2005141604A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008021173A (ja) * 2006-07-13 2008-01-31 Oki Joho Systems:Kk 携帯情報端末および電子メールシステム
EP2120185A1 (en) 2008-03-14 2009-11-18 Omron Corporation Character recognition program, character recognition electronic component, character recognition device, character recognition method, and data structure

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008021173A (ja) * 2006-07-13 2008-01-31 Oki Joho Systems:Kk 携帯情報端末および電子メールシステム
EP2120185A1 (en) 2008-03-14 2009-11-18 Omron Corporation Character recognition program, character recognition electronic component, character recognition device, character recognition method, and data structure

Similar Documents

Publication Publication Date Title
US10311142B2 (en) Character input apparatus, character input assist method, and character input assist program
JP6122800B2 (ja) 電子機器、文字列表示方法、および文字列表示プログラム
JP2019180965A (ja) ゲームプログラム及びゲーム装置
JP2004046315A (ja) 文字認識装置および文字認識方法、プログラムおよび記憶媒体
CN106127837A (zh) 网络漫画的多国语言支持系统
US20100171714A1 (en) Electronic device inputting characters and method thereof
US20150081278A1 (en) Electronic device, character conversion method, and storage medium
CN111880668A (zh) 输入显示方法、装置及电子设备
EP2120185B1 (en) Character recognition program, character recognition electronic component, character recognition device, character recognition method, and data structure
JP2005141604A (ja) 携帯情報端末における文字認識方法および携帯情報端末
CN112449230B (zh) 字符串显示处理方法、装置、终端及存储介质
CN111738283A (zh) 存储介质以及字符识别方法
US20080255846A1 (en) Method of providing language objects by indentifying an occupation of a user of a handheld electronic device and a handheld electronic device incorporating the same
CN110955747B (zh) 修改复杂文本字形的方法和装置
CN110597593B (zh) 用户引导任务的处理方法、装置、计算机设备及存储介质
US11494923B2 (en) Information processing device and non-transitory computer readable medium
KR100618324B1 (ko) 휴대용 단말기의 문자 입력 표시방법
CN110989894B (zh) 电子设备、电子设备的控制方法和记录有程序的记录介质
JP2008102657A (ja) 文字入力装置および文字入力方法
JP2010049564A (ja) 漢字認識プログラム、携帯端末装置、及び、漢字認識方法
CN117010326A (zh) 文本处理方法及装置、文本处理模型的训练方法及装置
JP2004310349A (ja) 言語入力システム及び方法
CN113900762A (zh) 页面显示方法、装置、计算机设备和存储介质
KR101365855B1 (ko) 문자를 예측하여 표시하기 위한 동적으로 생성된 키패드
CN116225243A (zh) 一种在uefi bios中支持中文输入的方法及装置

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050223

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060315

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060509

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090319

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090707

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090915