JP2005141603A - 携帯端末の文字認識における処理対象選択方法および携帯端末 - Google Patents
携帯端末の文字認識における処理対象選択方法および携帯端末 Download PDFInfo
- Publication number
- JP2005141603A JP2005141603A JP2003379288A JP2003379288A JP2005141603A JP 2005141603 A JP2005141603 A JP 2005141603A JP 2003379288 A JP2003379288 A JP 2003379288A JP 2003379288 A JP2003379288 A JP 2003379288A JP 2005141603 A JP2005141603 A JP 2005141603A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- character recognition
- recognition
- mobile terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/02—Constructional features of telephone sets
- H04M1/0202—Portable telephone sets, e.g. cordless phones, mobile phones or bar type handsets
- H04M1/026—Details of the structure or mounting of specific components
- H04M1/0264—Details of the structure or mounting of specific components for a camera module assembly
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Character Input (AREA)
- Telephone Function (AREA)
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
カメラが付いた携帯情報端末において、文字認識処理を精度良く実施する為には、画像内で認識対象の文字列が傾斜しないようにする必要がある。あるいは、文字の記述方向に縦書きと横書きの2通りがある場合、正しい文字認識結果を得るためにそれぞれに合わせた文字行方向を指定する必要がある。これらはいずれも使用者による指定、あるいは、補正の負担が大きかった。また、日本語を文字認識して認識結果をキーとして検索しようとした場合、英単語と異なり文字の区切れ目がないため、検索対象語を指定する使用者の負担が大きいという問題があった。
【解決手段】
文字行の傾斜を適切に修正するために、文字行の傾きを示すインジケータを情報端末装置の画面上に表示する。あるいは、日本語を文字認識して認識結果をキーとして検索するために、形態素解析結果とカーソルの位置情報を用いて検索対象語を指定する。
【選択図】 図1
Description
また、過去に撮影済の画像に対して文字認識処理を実施する場合は、上記の特段の注意を払って撮影されていない限り、認識対象文字列が画像内で傾斜している場合がある。この場合は文字認識処理を実施する前に画像処理ソフトウェア等を用いて画像の角度補正をする必要がある(第二の課題)。
更に、文字の記述方向が縦書きと横書きの2通りがある場合、画像の角度を調整して認識対象文字列を抽出したとしても、文字認識にあたっては認識対象文字列が縦書きなのか横書きなのかを設定する必要がある。名刺等の画像を取得して文字認識処理を実施する場合、縦書きと横書きのフォーマットが存在するため、その都度認識モードを設定しなおさなければいけないと問題がある。また新聞、雑誌等、縦書き文字列と横書き文字列が混在している文書においても文字の記述方向切り替えの負担は大きい(第三の課題)。
カメラ付携帯情報端末等の装置を利用する場合、乗り物での移動中など、画像の安定した位置で撮影しにくい環境下での利用が十分考えられる。しかし、従来技術では認識対象文字列が画像に対して傾斜が小さく抑えられた状態で選択されなければ文字認識精度が十分得られなかった。その為、使用者は認識対象画像を撮影する際に角度を調整する為に特段の注意が必要であった(第四の課題)。
加えて、カメラ付き携帯情報端末において文字認識した結果を用いて辞書検索やインターネットの検索を行おうとした場合、英単語の場合は空白により単語単位に分かれているので検索対象の単語を選択するのは容易である。しかし、同様な処理を日本語に適用しようとすると、英単語の場合と異なり、単語間の空白といったレイアウト情報による区切りが存在しないので、使用者は検索対象の文字列を1文字ずつ選択する必要があり、指定の負担が大きかった(第五の課題)。
Claims (22)
- 画像を撮影する画像撮影部と、
画像内から文字認識対象文字行を抽出する文字行抽出部と、
画像内の文字を認識する文字認識部と、
前記画像を回転させて傾きを補正する画像処理部と、
認識対象となる画像を表示するための画像表示部と、
を備えた携帯情報端末であって、
文字認識処理に好適な撮影角度を定量的に表示する角度インジケータを表示し、好適な角度と判定された撮影画像に対して文字認識を行う事を特徴とする携帯端末。 - 撮影済静止画像から文字認識対象文字行を抽出する文字行抽出部と、
該画像内の文字を認識する文字認識部と、
該画像を回転させて傾きを補正する画像処理部と、
認識対象となる画像を表示するための画像表示部と、
を備えた携帯情報端末であって、
前記撮影済静止画像の回転処理と、
文字認識対象文字列候補の抽出処理と、
前記抽出された文字認識対象文字列候補から所望の認識対象文字列を選択する選択処理と、
前記選択された認識対象文字列に対する文字認識処理と
を実施する事を特徴とする携帯端末。 - 請求項1または2に記載の携帯端末であって、
前記抽出された文字行の外接矩形のアスペクト比により、横書きもしくは縦書きの何れかを自動的に判断し、認識モードを切り替えることを特徴とする携帯端末。 - 請求項1記載の携帯端末であって、
画像撮影時の携帯情報端末の表示画面の方向に従って、横書きもしくは縦書きの何れかを自動的に判断し、認識モードを切り替えることを特徴とする携帯端末。 - 請求項2記載の携帯端末であって、
前記撮影された画像内の文字列の傾きに追従して、認識対象文字列候補の外接矩形を自動的に生成、表示すること特徴とする携帯端末。 - 画像を撮影する画像撮影部と、
該画像内から文字認識対象文字行を抽出する文字行抽出部と、
該画像内の文字を認識する文字認識部と、
前記文字認識部の出力を基に検索候補語を生成する検索候補語生成部と、
前記検索候補語生成部の出力を画面表示する画像表示部と、
前記画面表示された検索候補語を選択するためのユーザーインターフェース部と、
を備えることを特徴とする携帯端末。 - 請求項6に記載の携帯端末であって、
前記検索候補語生成部は、文字認識部の出力に対して形態素解析を用いて検索候補語を生成することを特徴とする携帯端末。 - 請求項6に記載の携帯端末であって、
前記検索候補語生成部は、文字認識結果の文字列における個々の文字コードに対応する文字カテゴリを割り当て、文字カテゴリの同じ文字コードを一つの検索候補語として出力することを特徴とする携帯端末。 - 請求項6に記載の携帯端末であって、
前記検索候補語生成部は、文字認識の出力に対する形態素解析の結果と、文字認識結果の個々の文字コードに対応する文字カテゴリを割り当てた結果との、両者の情報を用いて検索候補語を出力することを特徴とする携帯端末。 - 請求項6に記載の携帯端末であって、
前記検索候補語生成部は、文字認識結果の文字列における個々の文字コードの情報と幾何学情報との、いずれかを用いて検索候補語を生成することを特徴とする携帯端末。 - 請求項6に記載の携帯端末であって、
前記検索候補語生成部は、文字認識の出力に対して形態素解析を用いて検索候補語を生成し、カーソルの位置に合わせて形態素および形態素を組み合わせた複合語のいずれかを選択するための選択領域座標を生成することを特徴とする携帯端末。 - 撮影した画像から抽出した文字認識対象文字行の文字を認識する携帯端末における文字認識方法であって、
画像を撮影するステップと、
前記画像から文字認識対象文字行を抽出するステップと、
前記撮影した画像を回転させて傾きを補正するステップと、
認識対象となる画像を表示するステップと、
文字認識処理に好適な撮影角度を携帯情報端末使用者に定量的に表示するステップと、
前記表示された撮影角度に従って好適な角度を判定するステップと、
前記判定された好適な撮影角度にて撮影した画像に対して文字認識を行うステップと、
から成る事を特徴とする携帯端末における文字認識方法。 - 撮影済みの画像から抽出した文字認識対象文字行の文字を認識する携帯端末における文字認識方法であって、
前記画像内から文字認識対象文字行を抽出するステップと、
前記画像を回転させて傾きを補正するステップと、
認識対象となる画像を表示するステップと、
前記撮影済画像の回転処理を行うステップと、
前記回転処理と同時に文字認識対象文字列候補を抽出するステップと、
前記抽出された文字認識対象文字列候補から認識対象文字列を選択するステップと、
前記選択された認識対象文字列に対して文字認識を行うステップと
からなることを特徴とする携帯端末における文字認識方法。 - 請求項12もしくは13に記載の携帯端末における文字認識方法であって、前記文字認識を行うステップは、
抽出された文字行の外接矩形のアスペクト比により横書きおよび縦書きのいずれかを自動的に判定するステップと、
前記判定結果に基いて認識モードを切り替えるステップと
をさらに含むことを特徴とする携帯端末における文字認識方法。 - 請求項12記載の携帯端末における文字認識方法であって、前記文字認識を行うステップは、
画像撮影時の携帯情報端末の表示画面の向きに従って、横書きおよび縦書きのいずれかを自動的に判定するステップと、
前記判定結果に基いて認識モードを切り替えるステップと
をさらに含むことを特徴とする携帯端末における文字認識方法。 - 請求項13記載の携帯情報端末において、前記文字認識対象文字列候補から認識対象文字列を選択するステップは、
撮影済み画像内の文字列の傾きに追従して、認識対象文字列候補の外接矩形を自動的に生成して表示するステップをさらに含むこと特徴とする携帯端末における文字認識方法。 - 画像を撮影するステップと、
前記画像から文字認識対象文字行を抽出するステップと、
前記画像内の文字を認識するステップと、
前記文字認識された結果を用いて携帯端末内外に格納されたデータを検索するステップとから成る携帯端末における検索対象語選択方法であって、
前記文字認識された結果を基に検索候補語を生成するステップと、
前記検索候補語を画面表示するステップと、
前記画面表示された検索候補語を選択するステップと
をさらに含むことを特徴とする携帯端末における検索対象語選択方法。 - 請求項17に記載の携帯端末における検索対象語選択方法であって、
前記検索候補語を生成するステップは、前記文字認識された結果に対して形態素解析を用いて検索候補語を生成するステップをさらに含むことを特徴とする携帯端末における検索対象語選択方法。 - 請求項17に記載の携帯端末における検索対象語選択方法であって、
前記検索候補語を生成するステップは、
前記文字認識された結果の文字列における個々の文字コードに対応する文字カテゴリを割り当てるステップと,
前記文字カテゴリの同じ文字コードを一つの検索候補語として出力するステップと
をさらに含むことを特徴とする携帯端末における検索対象語選択方法。 - 請求項17に記載の携帯端末における検索対象語選択方法であって、
前記検索候補語を生成するステップは、
前記文字認識さらた結果に対する形態素解析の結果と文字認識結果の個々の文字コードに対応する文字カテゴリを割り当てた結果の両者の情報を用いて検索候補語を出力することを特徴とする携帯端末における検索対象語選択方法。 - 請求項17に記載の携帯端末における検索対象語選択方法であって、
前記検索候補語を生成するステップは、
前記文字認識された結果の文字列における個々の文字コードの情報と幾何学情報のいずれかを用いて検索候補語を生成することを特徴とする携帯端末における検索対象語選択方法。 - 請求項17に記載の携帯端末における検索対象語選択方法であって、
前記検索候補語を生成するステップは、
前記文字認識された結果に対して形態素解析を用いて検索候補語を生成するステップと、
カーソルの位置に合わせて形態素および形態素を組み合わせた複合語のいずれかを選択するための選択領域座標を生成するステップと
をさらに含むことを特徴とする携帯端末における検索対象語選択方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003379288A JP4443194B2 (ja) | 2003-11-10 | 2003-11-10 | 携帯端末の文字認識における処理対象選択方法および携帯端末 |
TW093129992A TWI294100B (en) | 2003-11-10 | 2004-10-04 | Mobile handset and the method of the character recognition on a mobile handset |
KR1020040089371A KR100615058B1 (ko) | 2003-11-10 | 2004-11-04 | 휴대 정보 단말 장치의 문자인식에 있어서의 처리 대상 선택 방법 및 휴대 정보 단말 장치 |
CNB2004100889727A CN1292377C (zh) | 2003-11-10 | 2004-11-09 | 便携终端的字符识别中的处理对象选择方法及便携终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003379288A JP4443194B2 (ja) | 2003-11-10 | 2003-11-10 | 携帯端末の文字認識における処理対象選択方法および携帯端末 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005141603A true JP2005141603A (ja) | 2005-06-02 |
JP4443194B2 JP4443194B2 (ja) | 2010-03-31 |
Family
ID=34689385
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003379288A Expired - Fee Related JP4443194B2 (ja) | 2003-11-10 | 2003-11-10 | 携帯端末の文字認識における処理対象選択方法および携帯端末 |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP4443194B2 (ja) |
KR (1) | KR100615058B1 (ja) |
CN (1) | CN1292377C (ja) |
TW (1) | TWI294100B (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007206593A (ja) * | 2006-02-06 | 2007-08-16 | Seiko Epson Corp | 斜め印刷方法およびプリンタ |
WO2007094537A1 (en) | 2006-02-14 | 2007-08-23 | Olaworks, Inc. | Method and system for tagging digital data |
JP2009003936A (ja) * | 2007-06-21 | 2009-01-08 | Sharp Corp | デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体 |
JP2009219166A (ja) * | 2005-06-20 | 2009-09-24 | Samsung Electronics Co Ltd | イメージに係る情報をユーザーに提供する方法及びシステム、並びにこのための移動通信端末機 |
JP2012008733A (ja) * | 2010-06-23 | 2012-01-12 | King Jim Co Ltd | カード情報管理装置 |
US8144989B2 (en) | 2007-06-21 | 2012-03-27 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text orientation in a digital image |
JP2013054742A (ja) * | 2011-08-31 | 2013-03-21 | Samsung Electronics Co Ltd | 光学式文字読取機を用いたスケジュール管理方法、及び携帯端末 |
CN103377371A (zh) * | 2012-04-25 | 2013-10-30 | 佳能株式会社 | 用于改善识别特征的方法和系统和光学字符识别系统 |
JP2016057796A (ja) * | 2014-09-09 | 2016-04-21 | 株式会社アイエスピー | 携帯端末装置用のスキューロジック文字認識方法、プログラム及び携帯端末装置 |
JP2016076093A (ja) * | 2014-10-07 | 2016-05-12 | 富士通株式会社 | 文字認識支援装置、文字認識支援プログラム及び文字認識支援方法 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101674415B (zh) * | 2005-09-09 | 2011-12-07 | 佳能株式会社 | 摄像设备 |
CN101482924B (zh) * | 2008-01-08 | 2012-01-04 | 华晶科技股份有限公司 | 名片显像角度自动辨正方法 |
CN104461424B (zh) * | 2014-12-01 | 2017-11-03 | 上海斐讯数据通信技术有限公司 | 一种在单元格中显示旋转字符串的系统及方法 |
KR101712391B1 (ko) | 2015-06-22 | 2017-03-07 | 한국표준과학연구원 | 스마트폰을 기반으로 하는 현장용 그래프 수치 분석 어플리케이션 및 그를 이용한 수치 분석방법 |
CN106325522B (zh) * | 2016-09-05 | 2019-03-29 | 广东小天才科技有限公司 | 一种电子终端调节光标大小的方法和装置 |
KR102391068B1 (ko) * | 2020-07-24 | 2022-04-28 | 엄춘호 | 문서 인식 시스템 및 방법 |
CN112183372A (zh) * | 2020-09-29 | 2021-01-05 | 深圳数联天下智能科技有限公司 | 文本识别方法、装置、设备及可读存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3281469B2 (ja) * | 1993-11-18 | 2002-05-13 | 株式会社リコー | 文書画像の傾き検出方法および装置 |
JPH11250179A (ja) * | 1998-02-27 | 1999-09-17 | Matsushita Joho System Kk | 文字認識装置および文字認識方法 |
-
2003
- 2003-11-10 JP JP2003379288A patent/JP4443194B2/ja not_active Expired - Fee Related
-
2004
- 2004-10-04 TW TW093129992A patent/TWI294100B/zh not_active IP Right Cessation
- 2004-11-04 KR KR1020040089371A patent/KR100615058B1/ko not_active IP Right Cessation
- 2004-11-09 CN CNB2004100889727A patent/CN1292377C/zh not_active Expired - Fee Related
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009219166A (ja) * | 2005-06-20 | 2009-09-24 | Samsung Electronics Co Ltd | イメージに係る情報をユーザーに提供する方法及びシステム、並びにこのための移動通信端末機 |
JP2007206593A (ja) * | 2006-02-06 | 2007-08-16 | Seiko Epson Corp | 斜め印刷方法およびプリンタ |
WO2007094537A1 (en) | 2006-02-14 | 2007-08-23 | Olaworks, Inc. | Method and system for tagging digital data |
JP2009003936A (ja) * | 2007-06-21 | 2009-01-08 | Sharp Corp | デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体 |
US8144989B2 (en) | 2007-06-21 | 2012-03-27 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text orientation in a digital image |
US8208725B2 (en) | 2007-06-21 | 2012-06-26 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text orientation in a digital image |
JP2012008733A (ja) * | 2010-06-23 | 2012-01-12 | King Jim Co Ltd | カード情報管理装置 |
JP2013054742A (ja) * | 2011-08-31 | 2013-03-21 | Samsung Electronics Co Ltd | 光学式文字読取機を用いたスケジュール管理方法、及び携帯端末 |
CN103377371A (zh) * | 2012-04-25 | 2013-10-30 | 佳能株式会社 | 用于改善识别特征的方法和系统和光学字符识别系统 |
JP2016057796A (ja) * | 2014-09-09 | 2016-04-21 | 株式会社アイエスピー | 携帯端末装置用のスキューロジック文字認識方法、プログラム及び携帯端末装置 |
JP2016076093A (ja) * | 2014-10-07 | 2016-05-12 | 富士通株式会社 | 文字認識支援装置、文字認識支援プログラム及び文字認識支援方法 |
Also Published As
Publication number | Publication date |
---|---|
KR20050045832A (ko) | 2005-05-17 |
CN1617163A (zh) | 2005-05-18 |
TW200516509A (en) | 2005-05-16 |
KR100615058B1 (ko) | 2006-08-22 |
JP4443194B2 (ja) | 2010-03-31 |
CN1292377C (zh) | 2006-12-27 |
TWI294100B (en) | 2008-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4443194B2 (ja) | 携帯端末の文字認識における処理対象選択方法および携帯端末 | |
US9019308B2 (en) | Display apparatus and computer-readable medium | |
US9251428B2 (en) | Entering information through an OCR-enabled viewfinder | |
US20050052558A1 (en) | Information processing apparatus, information processing method and software product | |
JP2011008752A (ja) | ドキュメント操作システム、ドキュメント操作方法およびそのためのプログラム | |
US20090278959A1 (en) | Camera | |
JP5075997B2 (ja) | 電子機器、プログラムおよび文字列認識方法 | |
JP2006107048A (ja) | 視線対応制御装置および視線対応制御方法 | |
KR20120069699A (ko) | 정보 표시 장치 | |
Pu et al. | Framework based on mobile augmented reality for translating food menu in Thai language to Malay language | |
JP2003209643A (ja) | 画像処理装置 | |
JP3355708B2 (ja) | コマンド処理装置 | |
JP2003323587A (ja) | 視覚障害者用文書作成方法及び装置並びにプログラム | |
JP2018159972A (ja) | 情報処理装置、方法及びプログラム | |
JP2000089880A (ja) | データ表示装置 | |
JP2006184415A (ja) | 画像処理装置、画像処理プログラム及び画像処理方法 | |
JP2009026007A (ja) | 辞書機能を備えた電子装置および制御プログラム | |
JP4631261B2 (ja) | 撮影画像投影装置、その画像処理方法及びプログラム | |
JP2003216893A (ja) | カメラ付携帯情報端末 | |
JP2006053622A (ja) | 文書リンク情報取得システム | |
JP5605208B2 (ja) | 辞書機能を備えた電子機器およびプログラム | |
JP2010191907A (ja) | 文字入力装置および文字入力方法 | |
JP3355707B2 (ja) | コマンド処理装置 | |
JP2005018507A (ja) | 携帯情報端末及びそれを用いた文字認識方法 | |
JPH08190603A (ja) | 文字認識装置及びその候補文字表示方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20050223 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060315 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060315 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060509 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20060821 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090423 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090512 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090707 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090915 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091222 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100112 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130122 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |