JP4453016B2 - 携帯端末、文字読取方法および文字読取プログラム - Google Patents

携帯端末、文字読取方法および文字読取プログラム Download PDF

Info

Publication number
JP4453016B2
JP4453016B2 JP2005023036A JP2005023036A JP4453016B2 JP 4453016 B2 JP4453016 B2 JP 4453016B2 JP 2005023036 A JP2005023036 A JP 2005023036A JP 2005023036 A JP2005023036 A JP 2005023036A JP 4453016 B2 JP4453016 B2 JP 4453016B2
Authority
JP
Japan
Prior art keywords
character string
image
character
string
tracking target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005023036A
Other languages
English (en)
Other versions
JP2006209599A (ja
Inventor
利久 伊藤
Original Assignee
株式会社カシオ日立モバイルコミュニケーションズ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社カシオ日立モバイルコミュニケーションズ filed Critical 株式会社カシオ日立モバイルコミュニケーションズ
Priority to JP2005023036A priority Critical patent/JP4453016B2/ja
Priority to KR1020060007574A priority patent/KR100759165B1/ko
Priority to CNB2006100067420A priority patent/CN100437626C/zh
Priority to US11/342,441 priority patent/US7697722B2/en
Publication of JP2006209599A publication Critical patent/JP2006209599A/ja
Application granted granted Critical
Publication of JP4453016B2 publication Critical patent/JP4453016B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Telephone Function (AREA)

Description

本発明は、携帯電話機やPHS(Personal Handyphone System)や携帯情報端末などの携帯端末に係わり、特に、カメラを搭載し撮影機能を備えた携帯端末、文字認識方法および文字認識プログラムに関する。
近年、携帯電話やPHSなどの携帯端末においては、電子メールを作成し送信したり、インターネットを利用するためにURL(Uniform Resource Locator)を入力したり、インターネット上の検索サイトを利用するためにキーワードを入力したりすることが広まり、携帯端末に文字データを入力する機会が増えている。しかし、携帯端末は、小型であるため、少数のキーしか搭載できず、PC(Personal Computer)で広く用いられている文字を入力するのに適したQwerty配列のキーボードを搭載するのが困難である。
そこで携帯端末では、1つのキーに複数の文字を割り当て、キーを押下した回数によって入力する文字を変化させるというのが一般的である。しかしながら、上記のような1つのキーに複数の文字を割り当て、キーを押下した回数によって入力する文字を変化させる携帯端末では、文字を入力するのに多くのキー押下が必要になり、操作が煩雑で、時間がかかる。そこで、従来技術では、画像撮像装置を利用して撮影した文字の画像を利用し、それに対応する文字コードを取得することによって入力する技術が提案されている(例えば特許文献1参照)。
特開2002−111841公報
しかしながら、上述した従来技術では、撮像装置を搭載した携帯端末で文字を撮影するには、携帯端末を文字にかなり近づけなければならず、わずかな携帯端末の動きでも撮影に大きく影響する。特に、連続して文字を入力したいときは、1つの文字を撮影した後、携帯端末を動かさなければならないので、直前まで撮影していた文字を容易に見失ってしまうという問題がある。
そこで本発明は、直前に撮影し入力した文字を追尾することによって、連続する単語や文字列を撮影して容易に読み取ることができる携帯端末、文字読取方法および文字読取プログラムを提供することを目的とする。
上記目的達成のため、請求項1記載の発明による携帯端末は、文章を撮影する画像撮像手段と、前記画像撮像手段により撮影された文章の画像を表示する表示手段と、前記画像撮像手段により撮影された文章の画像から、少なくとも1つの文字列を含む画像を切り出す文字列切り出し手段と、前記文字列切り出し手段が切り出した画像に含まれる文字列を認識し、該文字列の文字コード列を取得する文字認識手段と、前記文字認識手段によって取得された文字コード列と、直前に前記画像撮像手段によって撮像された文章の画像の切り出された文字列から取得された文字コード列とを比較し、文字コードの並びが少なくとも部分的に同じであれば、前記文字認識手段によって取得された文字コード列の文字列を追尾対象文字列とし、当該追尾対象文字列と、前記画像撮像手段による撮影可能範囲内で、前記追尾対象文字列の近傍に存る周辺文字列との位置関係に基づいて、前記追尾対象文字列の移動方向を特定しその移動方向を前記表示手段に視認可能に表示する文字列追尾手段とを具備し、前記画像撮影手段、前記表示手段、前記文字列切り出し手段、前記文字認識手段、及び前記文字列追尾手段による動作を所定の時間間隔で繰り返し実行する、ことを特徴とする。
また、好ましい態様として、例えば請求項2記載のように、請求項1記載の携帯端末において、前記文字列追尾手段により追尾対象文字列とされた文字列の文字コード列を最終的な入力文字列とするようにしてもよい。
また、好ましい態様として、例えば請求項3記載のように、請求項1または2に記載の携帯端末において、前記文字列追尾手段は、前記追尾対象文字列を、前記表示手段上で強調表示させるようにしてもよい。
また、好ましい態様として、例えば請求項記載のように、請求項1ないしのいずれかに記載の携帯端末において、前記文字列切り出し手段は、前記画像撮像手段が撮影した画像から文字列の画像を切り出すとき、前記文字列の画像が前記画像撮像手段によって撮影された画像上のどこに位置するかを示す文字列画像位置情報を取得し、前記文字列追尾手段は、前記文字列画像位置情報に基づいて前記追尾対象文字列が前記画像撮像手段の撮影可能範囲外に在るか否かを判断し、前記追尾対象文字列が前記画像撮像手段の撮影可能範囲外に出ようとしている場合には、前記文字列切り出し手段に対して、次回の動作時に、前記文字列画像位置情報によって示される位置の付近にあり、かつ前記画像撮像手段の撮影可能範囲内に在る文字列を前記追尾対象文字列の移動方向を特定するためのマーカー文字列として切り出すよう指示し、前記文字列切り出し手段によって前記追尾対象文字列の近傍に在るマーカー文字列が切り出されると、前記追尾対象文字列と前記マーカー文字列との位置関係に基づいて、前記画像撮像手段による撮影可能範囲に対する前記追尾対象文字列の移動方向を特定するようにしてもよい。
また、好ましい態様として、例えば請求項記載のように、請求項1ないしのいずれかに記載の携帯端末において、前記文字列切り出し手段は、前記画像撮像手段が撮影した画像から文字列の画像を切り出すとき、さらに、前記切り出した文字列の画像サイズを示す画像サイズ情報を取得し、前記文字列追尾手段は、同じ文字列か判定する際、前記文字列画像位置情報と前記画像サイズ情報とに基づいて、文字列が略同一位置、もしくは、略同一画像サイズであるか判断し、比較する文字列が略同一位置、もしくは、略同一画像サイズであれば、同じ文字列であると判定するようにしてもよい。
また、好ましい態様として、例えば請求項記載のように、請求項1ないしのいずれかに記載の携帯端末において、前記文字列切り出し手段は、前記画像撮像手段が撮影した画像から文字列の画像を切り出すとき、さらに、前記切り出した文字列の画像サイズを示す画像サイズ情報を取得し、前記文字列追尾手段は、同じ文字列か判定する際、前記文字列画像位置情報と前記画像サイズ情報とに基づいて、文字列が略同一位置、かつ略同一画像サイズであるか判断し、比較する文字列が略同一位置、かつ略同一画像サイズであれば、同じ文字列であると判定するようにしてもよい。
また、好ましい態様として、例えば請求項記載のように、請求項ないしのいずれかに記載の携帯端末において、前記文字列追尾手段は、前記文字列切り出し手段に対して、次回の動作時に、前記マーカー文字列の在る位置から前記追尾対象文字列が在る方向へ隣接する文字列を切り出すように命令を出し、前記文字列切り出し手段がその文字列を切り出すことができれば、それを新たなマーカー文字列とし、前記追尾対象文字列と前記新たなマーカー文字列との位置関係に基づいて、前記画像撮像手段による撮影可能範囲に対する前記追尾対象文字列の移動方向を特定するようにしてもよい。
請求項1記載の発明によれば、文字列切り出し手段により、画像撮像手段により撮影された文章の画像から、少なくとも1つの文字列を含む画像を切り出し、文字認識手段により、切り出した画像に含まれる文字列を認識して該文字列の文字コード列を取得し、文字列追尾手段により、前記文字認識手段によって取得された文字コード列と、直前に前記画像撮像手段によって撮像された文章の画像の切り出された文字列から取得された文字コード列とを比較し、文字コードの並びが少なくとも部分的に同じであれば、前記文字認識手段によって取得された文字コード列の文字列を追尾対象文字列とし、当該追尾対象文字列と、前記画像撮像手段による撮影可能範囲内で、前記追尾対象文字列の近傍に存る周辺文字列との位置関係に基づいて、前記追尾対象文字列の移動方向を特定しその移動方向を前記表示手段に視認可能に表示するようにしたので、撮影した連続する単語や文字列の中から特定の文字列を容易に読み取ることができるという利点が得られる。

また、請求項2記載の発明によれば、前記文字列追尾手段により追尾対象文字列とされた文字列の文字コード列を最終的な入力文字列とするようにしたので、撮影した連続する単語や文字列の中から特定の文字列を容易に読み取ることができるという利点が得られる。
また、請求項3記載の発明によれば、前記画像撮像手段により撮影された文章の画像を表示手段に表示する際、前記文字列追尾手段により追尾対象文字列を、前記表示手段上で強調表示するようにしたので、直前に撮影していた単語や文字列を容易に認知することができ、撮影した連続する単語や文字列の中から特定の文字列を容易に読み取ることができるという利点が得られる。
また、請求項記載によれば、前記画像撮像手段が撮影した画像から文字列の画像を切り出すとき、前記文字列切り出し手段により、前記文字列の画像が前記画像撮像手段によって撮影された画像上のどこに位置するかを示す文字列画像位置情報を取得し、前記文字列追尾手段により、前記文字列画像位置情報に基づいて前記追尾対象文字列が前記画像撮像手段の撮影可能範囲外に在るか否かを判断し、前記追尾対象文字列が前記画像撮像手段の撮影可能範囲外に出ようとしている場合には、前記文字列切り出し手段に対して、次回の動作時に、前記文字列画像位置情報によって示される位置の付近にあり、かつ前記画像撮像手段の撮影可能範囲内に在る文字列前記追尾対象文字列の移動方向を特定するためのマーカー文字列として切り出すよう指示し、前記文字列切り出し手段によって前記追尾対象文字列の近傍に在るマーカー文字列が切り出されると、前記追尾対象文字列と前記マーカー文字列との位置関係に基づいて、前記画像撮像手段による撮影可能範囲に対する前記追尾対象文字列の移動方向を特定するようにしたので、追尾対象文字列を随時追跡することができ、撮影した連続する単語や文字列の中から特定の文字列を容易に読み取ることができるという利点が得られる。
また、請求項記載の発明によれば、前記画像撮像手段が撮影した画像から文字列の画像を切り出すとき、前記文字列切り出し手段により、さらに、前記切り出した文字列の画像サイズを示す画像サイズ情報を取得し、前記文字列追尾手段により、同じ文字列か判定する際、前記文字列画像位置情報と前記画像サイズ情報とに基づいて、文字列が略同一位置、もしくは、略同一画像サイズであるか判断し、比較する文字列が略同一位置、もしくは、略同一画像サイズであれば、同じ文字列であると判定するようにしたので、追尾対象文字列を随時追跡することができ、撮影した連続する単語や文字列の中から特定の文字列を容易に読み取ることができるという利点が得られる。
また、請求項記載の発明によれば、前記画像撮像手段が撮影した画像から文字列の画像を切り出すとき、前記文字列切り出し手段により、さらに、前記切り出した文字列の画像サイズを示す画像サイズ情報を取得し、前記文字列追尾手段により、同じ文字列か判定する際、前記文字列画像位置情報と前記画像サイズ情報とに基づいて、文字列が略同一位置、かつ略同一画像サイズであるか判断し、比較する文字列が略同一位置、かつ略同一画像サイズであれば、同じ文字列であると判定するようにしたので、追尾対象文字列を随時追跡することができ、撮影した連続する単語や文字列の中から特定の文字列を容易に読み取ることができるという利点が得られる。
また、請求項記載の発明によれば、前記文字列追尾手段により、前記文字列切り出し手段に対して、次回の動作時に、前記マーカー文字列の在る位置から前記追尾対象文字列が在る方向へ隣接する文字列を切り出すように命令を出し、前記文字列切り出し手段がその文字列を切り出すことができれば、それを新たなマーカー文字列とし、前記追尾対象文字列と前記新たなマーカー文字列との位置関係に基づいて、前記画像撮像手段による撮影可能範囲に対する前記追尾対象文字列の移動方向を特定するようにしたので、マーカー文字列を随時更新することで、追尾対象文字列を随時追跡することができ、撮影した連続する単語や文字列の中から特定の文字列を容易に読み取ることができるという利点が得られる。
以下、本発明の実施の形態を、図面を参照して説明する。なお、以下では、英文が記述された文章を読み取る場合について説明する。本実施形態による携帯端末は、単語毎に文字列を読み取るものとする。
A.実施形態の構成
図1は、本発明の実施形態による携帯端末の略構成を示すブロック図である。図において、携帯端末は、画像撮像装置10、文字列切り出し部20、文字認識部30、文字列追尾部40および表示部50を備えている。画像撮像装置10は、文章の画像を撮影する。文字列切り出し部20は、画像撮像装置10から画像データを受け取り、そのデータから文字列の画像を切り出し、その文字列の画像が画像撮像装置10から受け取った画像データのどこに位置するかを示す文字列画像位置情報や文字列の画像サイズを示す画像サイズ情報を取得する。文字認識部30は、文字列切り出し部20から受け取った文字列の画像とその文字列画像位置情報とからその文字列に対応する文字コード列を取得する。
文字列追尾部40は、文字認識部30から受け取った2つの文字列の文字コードや文字列画像位置情報、画像サイズ情報などを比較し、同じかどうか判定し、同じか、もしくは部分的に同じであれば、最終的に入力文字列とする追尾対象文字列または該追尾対象文字列を追尾するためのマーカー文字列として認識する。また、文字列追尾部40は、文字列画像位置情報および画像サイズ情報に従って、追尾対象文字列またはマーカー文字列が画像撮像装置10の撮影可能範囲から外に出たか、または撮影可能範囲から外に出る可能性があるかを判定し、追尾対象文字列またはマーカー文字列が画像撮像装置10の撮影可能範囲から外に出た場合または撮影可能範囲から外に出ることが予想される場合に、文字列切り出し部20に対して、その追尾対象文字列またはマーカー文字列に隣接し、かつ画像撮像装置10の撮影可能範囲にある文字列を切り出すように命令を出す。表示部50は、画像撮像装置10から受け取った画像データを表示し、文字列追尾部40から追尾対象文字列の文字列画像位置情報を受け取った場合に、その文字列画像を強調表示し、文字列追尾部40から追尾対象文字列の有る方向の情報を受け取った場合に、その方向を示す。
なお、図1に示す文字列切り出し部20、文字認識部30および文字列追尾部40は、CPUのソフトウェアとして実現されてもよい。
B.実施形態の動作
次に、上述した実施形態の動作について図を参照して説明する。ここで、図2および図3は、本実施形態による携帯端末の動作を示すフローチャートである。端末使用者が文章を画像撮像装置10で写すと(ステップS10)、画像撮像装置10は、文字列切り出し部20と表示部50にその画像データを転送する。表示部50は、その画像データを表示する(ステップS10)。文字列切り出し部20は、単語の画像を切り出し(ステップS12)、切り出した画像データとその文字列画像位置情報とを文字認識部30に転送する。
文字認識部30は、単語の画像から文字列を認識し(ステップS14)、それに対応する文字コード列を取得し、文字列追尾部40にその文字コード列と文字列画像位置情報とを転送する。文字列追尾部40は、文字コード列と文字列画像位置情報とを受け取ると、それらを記憶し、前に受け取った文字コード列と文字列画像位置情報との有無を調べる(ステップS16)。そして、前に受け取った文字コード列と文字列画像位置情報とが無い場合には、ステップS10に戻り、上述した処理を繰り返す。
一方、前に受け取った文字コード列と文字列画像位置情報とが有る場合には、前に受け取った文字コード列と、今回受け取った文字コード列とを比較し、全部、若しくは、一部が同じか調べる(ステップS18)。そして、同じでなければ、ステップS10に戻り、上述した処理を繰り返す。一方、全部、若しくは、一部が同じなら、その単語を追尾対象文字列として認識し、その追尾対象文字列の文字列画像位置情報および画像サイズ情報に従って、その画像データが画像撮像装置10の撮影可能な領域の外に出ているか調べる(ステップS20)。そして、撮影可能な領域の外に出ていなければ、その追尾対象文字列を強調表示し(ステップS22)、ステップS10に戻り、上述した処理を繰り返す。
一方、追尾対象文字列の画像データが画像撮像装置10の撮影可能な領域外に出ていれば、文字切り出し部20に追尾対象文字列の隣にあり、かつ画像撮像装置10の撮影可能な領域にある単語を切り出すように命令を出す。文字切り出し部20は、追尾対象文字列の隣にあり、かつ画像撮像装置10の撮影可能な領域にある単語を切り出し、切り出した画像データとその文字列画像位置情報とを文字認識部30に転送する。文字認識部30は、単語の画像から文字列を認識し、それに対応する文字コード列を取得し、文字列追尾部40にその文字コード列と文字列画像位置情報を転送する(ステップS24)。文字列追尾部40は、追尾対象文字列の隣の単語の文字コード列とその文字列画像位置情報とをマーカー文字列の情報と認識して記憶し、マーカー文字列追尾処理に移行する(ステップS26)。
文字列追尾部40は、図3に示すマーカー文字列追尾処理に移行する際、そのマーカー文字列が追尾対象文字列の上下に何行ずれた位置にあるか、若しくは、横に何単語ずれた位置にあるかを記憶する。マーカー文字列が追尾対象文字列から下にx単語、右にy行ずれた位置にある場合の位置情報をマーカー文字列位置情報P(x、y)と表す。本実施形態では、マーカー文字列が追尾対象文字列に対してどちらの方向に位置するかをグラフィカルに示すために、その方向を示す矢印を表示する。そこで、マーカー文字列位置情報P(x、y)のx、yの値の組み合わせに応じて取り得る、マーカー文字列の追尾対象文字列に対する方向について、予め矢印(マーク)を、図4に示すように、テーブル化して記憶している。その後、P(x、y)から追尾対象文字列がどの方向にあるか調べ、図4に示すテーブルからその方向を向いている矢印を取得して表示部50に表示し(ステップS30)、画像撮像装置10に文字列を撮影し、処理を続けることを命令する(ステップS32)。
画像撮像装置10は、文字列を撮影し、その画像データを文字列切り出し部20に転送する。文字列切り出し部20は、マーカー文字列の文字列画像位置情報が示す位置付近にある文字列を切り出し、その画像データとその文字列画像位置情報とを文字認識部30に転送する(ステップS34)。文字認識部30は、受け取った文字列の画像データを認識し、対応する文字コード列を取得し(ステップS36)、文字列追尾部40にその文字コード列と文字列画像位置情報とを転送する。
文字列追尾部40は、前に記憶したマーカー文字列の文字コード列と今回受け取った文字コード列とを比較し、全部、若しくは、一部が同じかどうか調べる(ステップS38)。そして、同じでなければ、文字列追尾部40は、追尾対象文字列の文字コード列と文字列画像位置情報、及び、マーカー文字列の文字コード列と文字列画像位置情報を廃棄し、マーカー文字列追尾処理を終了し、図2のステップS10に戻る。
一方、前に記憶したマーカー文字列の文字コード列と今回受け取った文字コード列とが同じであれば、文字列追尾部40は、文字列切り出し部20に、マーカー文字列に隣接し、追尾対象文字列がある方向に存在する文字列を切り出すように命令を出し、文字列切り出し部20にその文字列を切り出させ(ステップS40)、文字列の画像データが切り出すことができたか否かを判断する(ステップS42)。そして、文字列切り出し部20がその文字列を切り出すことができなければ、マーカー文字列をそのままとし、次の処理(ステップS46)に進む。
一方、文字列切り出し部20がその文字列を切り出すことができれば、その画像データとその文字列画像位置情報とを文字認識部30に転送し、文字認識部30は受け取った文字列の画像データから対応する文字コード列を取得し、文字列追尾部40にその文字コード列と文字列画像位置情報とを転送し、文字列追尾部40は受け取った文字コード列と文字列画像位置情報から、その文字列がマーカー文字列に対してどの方向にあるか調べ、P(x、y)を更新し、その文字列を新たなマーカー文字列とする(ステップS44)。
文字列追尾部40は、マーカー文字列の更新の有無にかかわらず、そのマーカー文字列の文字列画像位置情報および画像サイズ情報に従って、マーカー文字列の画像データが画像撮像装置10の撮影可能な領域の外に出ているか調べる(ステップS46)。そして、撮影可能な領域の外に出ていなければ、ステップS30に戻り、上述した処理を繰り返す。
一方、マーカー文字列の画像データが撮影可能な領域の外に出ていれば、文字列追尾部40は、マーカー文字列の隣にあり、かつ画像撮像装置10の撮影可能な領域にある単語の認識を行う(ステップS48)。すなわち、文字列追尾部40は、マーカー文字列の隣にあり、かつ画像撮像装置10の撮影可能な領域にある単語を切り出すように、文字切り出し部20に命令を出す。文字切り出し部20は、マーカー文字列の隣にあり、かつ画像撮像装置10の撮影可能な領域にある単語を切り出し、切り出した画像データとその文字列画像位置情報とを文字認識部30に転送する。
文字認識部30は、単語の画像から文字列を認識し、それに対応する文字コード列を取得し、文字列追尾部40にその文字コード列と文字列画像位置情報を転送する。文字列追尾部40は、受け取った文字コード列と文字列画像位置情報とから、その文字列がマーカー文字列に対してどの方向にあるか調べ、P(x、y)を更新し、その文字列を新たなマーカー文字列とする(ステップS50)。
次に、そのマーカー文字列が追尾対象文字列であるか判断する(ステップS52)。すなわち、文字列追尾部40は、P(x、y)がx=0、かつ、y=0ならば、そのマーカー文字列を追尾対象文字列とし、マーカー文字列追尾処理を終了し、図2のステップS10に戻る。これに対して、P(x、y)において、xが0でないか、または、yが0でなければ、マーカー文字列追尾処理のステップS30に戻り、マーカー文字列の追尾を継続する。
次に、上述した本実施形態の携帯端末の動作例を、図5を参照して説明する。英文を撮影すると、画像の中央付近にある文字「Hitachi」が追尾対象文字列として認識され、枠B1で囲まれて強調表示される(図5(a))。その後、手ぶれ等で端末が左に動き、追尾対象文字列「Hitachi」が撮影範囲外に出そうになった場合、「Hitachi」の隣にある単語「are」がマーカー文字列として認識され、マーカー文字列位置情報P(x、y)はP(−1、0)となり、追尾対象文字列の在る方向が矢印A1で示される(図5(b))。この状態において、追尾対象文字列の在る方向は右なので、「are」に隣接し、右にある文字列「Hita」が認識され、マーカー文字列位置情報P(x、y)はP(0、0)となる。
したがって、「Hita」は追尾対象文字列と認識され、枠B2で囲まれて強調表示される(図5(c))。しかし、「Hita」は撮影範囲外に出そうであるので、隣にある単語「are」がマーカー文字列として認識され、マーカー文字列位置情報P(x、y)はP(−1、0)となり、追尾対象文字列の在る方向が矢印A1で示される(図5(b))。この場合、図5(b)と図5(c)の動作が繰り返される。
さらに、手ぶれ等によって端末が左下に動いた場合、マーカー文字列「are」が撮影範囲外に出そうになるので、撮影範囲内に有り、かつ隣接する文字列「Inspire」を新たなマーカー文字列とする。この場合、「Inspire」は下に在るので、マーカー文字列位置情報P(x、y)はP(−1、1)となり、追尾対象文字列が在る方向が矢印A2で示される(図5(d))。
次に、マーカー文字列に隣接し、追尾対象文字列が在る方向に存在する文字を認識する。この場合、「are」なので、それを新たなマーカー文字列として更新し、マーカー文字列位置情報P(x、y)をP(−1、0)とする(図5(e))。しかし、マーカー文字列「are」が撮影範囲外に出そうであるので、撮影範囲内に有り、かつ隣接する文字列「Inspire」を新たなマーカー文字列とし、マーカー文字列位置情報P(x、y)をP(−1、1)とする(図5(d))。以降、端末が動くまで図5(d)と図5(e)の動作が繰り返される。
次に、ユーザが追尾対象文字列を探すために、図5(e)の状態から端末を右に動かす。これにより、追尾対象文字列が在る方向に存在し、マーカー文字列に隣接する文字列「the」を認識する。認識した文字列「the」はマーカー文字列の右に在るので、マーカー文字列位置情報P(x、y)をP(0、1)とし、認識した文字列「the」を新たなマーカー文字列とする(図4(f))。このとき、追尾対象文字列が在る方向に隣接する文字列は撮影範囲内に無いので、「the」がマーカー文字列のままになり、追尾対象文字列が在る方向が矢印A3で示される。
さらに、追尾対象文字列の在る方向は上を指しているので、ユーザは端末を上に動かす。追尾対象文字列の在る方向に存在し、マーカー文字列に隣接する文字列を認識すると、「Hi」が認識できる。この文字列「Hi」はマーカー文字列の上に在るので、マーカー文字列位置情報P(x、y)を更新し、P(0、0)とする。P(0、0)となったので、この文字列「Hi」を追尾対象文字列とし、枠B3で囲んで強調表示する(図5(g))。
以降、上述したように、手ぶれなどにより端末を大きく動かしてしまい、表示部50に表示される直前に撮影していた単語や文字列(追尾対象文字列)が移動してしまっても、リアルタイムで、追尾対象文字列を強調表示するとともに、該追尾対象文字列の近傍の文字列をマーカー文字列として認識し、該マーカー文字列と追尾対象文字列との位置関係から、追尾対象文字列が存在する方向をグラフィカルな矢印で示すという動作を繰り返すようにしたので、直前に撮影していた単語や文字列(追尾対象文字列)を容易に探し出すことができる。
なお、上述した実施形態において、文字列追尾部40が2つの単語の比較を行う際、文字コード列の比較ではなく、2つの単語の文字列画像位置情報を比較し、2つの単語の文字列画像位置の横方向の差が一文字の横方向の大きさ以内であり、かつ、2つの単語の文字列画像位置の縦方向の差が一文字の縦方向の大きさ以内であれば、同じ単語と判定するようにしても良い。
また、文字列追尾部40が2つの単語の比較を行う際、文字コード列の比較ではなく、2つの単語の画像サイズを比較し、2つの単語の画像サイズの横方向の差が一文字の横方向の大きさ以内であり、かつ、2つの単語の画像サイズの縦方向の差が一文字の縦方向の大きさ以内であれば、同じ単語と判定するようにしても良い。
また、文字列追尾部40が2つの単語の比較を行う際、上記2つの単語の文字列画像位置情報を比較するとともに、上記2つの単語の画像サイズを比較し、これら2種類の比較において両方とも同じ単語と判定できた場合に、同じ単語と判定するようにしても良い。
また、本実施形態においては、文字列切り出し部20は、英文を前提にして単語を切り出すとしたが、日本語のように単語の切り出しが困難な言語の場合は、漢字とひらがなのように、複雑な文字と単純な文字との境目を区切りとして切り出しても良い。
上述した実施形態によれば、画像撮像装置10で文字を撮影する際、直前に撮影していた単語や文字列を容易に認知することができる。すなわち、手ぶれなどにより端末を大きく動かしてしまい、直前に撮影していた単語や文字列を見失ってしまっても、表示部50に表示される直前に撮影していた単語や文字列のある方向を示す印によって、直前に撮影していた単語や文字列を容易に探し出すことができる。
この発明の実施の形態に係る携帯端末の構成を示すブロック図である。 この発明の実施の形態に係る携帯端末の動作を示すフローチャートである。 この発明の実施の形態に係る携帯端末の動作を示すフローチャートである。 マーカー文字列位置情報P(x、y)値に応じて表示部に表示する矢印の例を示す概念図である。 この発明の実施の形態に係る携帯端末の動作例を示す模式図である。
符号の説明
10 画像撮像装置(画像撮像手段)
20 文字列切り出し部(文字列切り出し手段)
30 文字認識部(文字認識手段)
40 文字列追尾部(文字列追尾手段)
50 表示部(表示手段)

Claims (9)

  1. 文章を撮影する画像撮像手段と、
    前記画像撮像手段により撮影された文章の画像を表示する表示手段と、
    前記画像撮像手段により撮影された文章の画像から、少なくとも1つの文字列を含む画像を切り出す文字列切り出し手段と、
    前記文字列切り出し手段が切り出した画像に含まれる文字列を認識し、該文字列の文字コード列を取得する文字認識手段と、
    前記文字認識手段によって取得された文字コード列と、直前に前記画像撮像手段によって撮像された文章の画像の切り出された文字列から取得された文字コード列とを比較し、文字コードの並びが少なくとも部分的に同じであれば、前記文字認識手段によって取得された文字コード列の文字列を追尾対象文字列とし、当該追尾対象文字列と、前記画像撮像手段による撮影可能範囲内で、前記追尾対象文字列の近傍に存る周辺文字列との位置関係に基づいて、前記追尾対象文字列の移動方向を特定しその移動方向を前記表示手段に視認可能に表示する文字列追尾手段と
    を具備し、
    前記画像撮影手段、前記表示手段、前記文字列切り出し手段、前記文字認識手段、及び前記文字列追尾手段による動作を所定の時間間隔で繰り返し実行する、
    ことを特徴とする携帯端末。
  2. 前記文字列追尾手段により追尾対象文字列とされた文字列の文字コード列を最終的な入力文字列とすることを特徴とする請求項1記載の携帯端末。
  3. 前記文字列追尾手段は、前記追尾対象文字列を、前記表示手段上で強調表示させることを特徴とする請求項1または2に記載の携帯端末。
  4. 前記文字列切り出し手段は、前記画像撮像手段が撮影した画像から文字列の画像を切り出すとき、前記文字列の画像が前記画像撮像手段によって撮影された画像上のどこに位置するかを示す文字列画像位置情報を取得し、
    前記文字列追尾手段は、前記文字列画像位置情報に基づいて前記追尾対象文字列が前記画像撮像手段の撮影可能範囲外に在るか否かを判断し、前記追尾対象文字列が前記画像撮像手段の撮影可能範囲外に出ようとしている場合には、前記文字列切り出し手段に対して、次回の動作時に、前記文字列画像位置情報によって示される位置の付近にあり、かつ前記画像撮像手段の撮影可能範囲内に在る文字列を前記追尾対象文字列の移動方向を特定するためのマーカー文字列として切り出すよう指示し、前記文字列切り出し手段によって前記追尾対象文字列の近傍に在るマーカー文字列が切り出されると、前記追尾対象文字列と前記マーカー文字列との位置関係に基づいて、前記画像撮像手段による撮影可能範囲に対する前記追尾対象文字列の移動方向を特定することを特徴とする請求項1ないし3のいずれかに記載の携帯端末。
  5. 前記文字列切り出し手段は、前記画像撮像手段が撮影した画像から文字列の画像を切り出すとき、さらに、前記切り出した文字列の画像サイズを示す画像サイズ情報を取得し、
    前記文字列追尾手段は、同じ文字列か判定する際、前記文字列画像位置情報と前記画像サイズ情報とに基づいて、文字列が略同一位置、もしくは、略同一画像サイズであるか判断し、比較する文字列が略同一位置、もしくは、略同一画像サイズであれば、同じ文字列であると判定することを特徴とする請求項1ないし4のいずれかに記載の携帯端末。
  6. 前記文字列切り出し手段は、前記画像撮像手段が撮影した画像から文字列の画像を切り出すとき、さらに、前記切り出した文字列の画像サイズを示す画像サイズ情報を取得し、
    前記文字列追尾手段は、同じ文字列か判定する際、前記文字列画像位置情報と前記画像サイズ情報とに基づいて、文字列が略同一位置、かつ略同一画像サイズであるか判断し、比較する文字列が略同一位置、かつ略同一画像サイズであれば、同じ文字列であると判定することを特徴とする請求項1ないし4のいずれかに記載の携帯端末。
  7. 前記文字列追尾手段は、前記文字列切り出し手段に対して、次回の動作時に、前記マーカー文字列の在る位置から前記追尾対象文字列が在る方向へ隣接する文字列を切り出すように命令を出し、前記文字列切り出し手段がその文字列を切り出すことができれば、それを新たなマーカー文字列とし、前記追尾対象文字列と前記新たなマーカー文字列との位置関係に基づいて、前記画像撮像手段による撮影可能範囲に対する前記追尾対象文字列の移動方向を特定することを特徴とする請求項4ないし6のいずれかに記載の携帯端末。
  8. 撮像部を備える携帯端末の文字読取方法において、
    前記撮影部により文章を所定の時間間隔で連続して撮影する第1のステップと、
    前記撮像部により撮影された文章の画像を表示部に表示する第2のステップと、
    撮影した文章の画像から、少なくとも1つの文字列を含む画像を切り出す第3のステップと、
    切り出した画像に含まれる文字列を認識し、該文字列の文字コード列を取得する第4のステップと、
    前記取得した文字コード列と、直前に撮像された文章の画像から切り出された文字列から取得された文字コード列とを比較し、文字コードの並びが少なくとも部分的に同じであれば、前記第4のステップで取得された文字コード列の文字列を追尾対象文字列とし、当該追尾対象文字列と、前記撮像部による撮影可能範囲内で、前記追尾対象文字列の近傍に存る周辺文字列との位置関係に基づいて、前記追尾対象文字列の移動方向を特定しその移動方向を前記表示部に視認可能に表示する第5のステップと、
    前記第1から第5のステップを所定の時間間隔で繰り返し実行する第6のステップと、
    前記追尾対象文字列とされた文字列の文字コード列を最終的な入力文字列とする第7のステップと
    を含むことを特徴とする文字読取方法。
  9. 撮像部を備える携帯端末による文字読取プログラムにおいて、
    前記撮像部により文章を撮影する第1の機能、
    前記撮像部により撮影された文章の画像を表示部に表示する第2の機能、
    撮影した文章の画像から、少なくとも1つの文字列を含む画像を切り出す第3の機能、
    切り出した画像に含まれる文字列を認識し、該文字列の文字コード列を取得する第4の機能、
    前記取得した文字コード列と、直前に撮像された文章の画像から切り出された文字列から取得された文字コード列とを比較し、文字コードの並びが少なくとも部分的に同じであれば、前記第4の機能で取得された文字コード列の文字列を追尾対象文字列とし、当該追尾対象文字列と、前記撮像部による撮影可能範囲内で、前記追尾対象文字列の近傍に存る周辺文字列との位置関係に基づいて、前記追尾対象文字列の移動方向を特定しその移動方向を前記表示部に視認可能に表示する第5の機能、
    前記第1から第5の機能を所定の時間間隔で繰り返し実行する第6の機能、
    前記追尾対象文字列とされた文字列の文字コード列を最終的な入力文字列とする第7の機能
    をコンピュータに実行させることを特徴とする文字読取プログラム。
JP2005023036A 2005-01-31 2005-01-31 携帯端末、文字読取方法および文字読取プログラム Expired - Fee Related JP4453016B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2005023036A JP4453016B2 (ja) 2005-01-31 2005-01-31 携帯端末、文字読取方法および文字読取プログラム
KR1020060007574A KR100759165B1 (ko) 2005-01-31 2006-01-25 휴대단말, 휴대단말을 이용한 문자판독방법
CNB2006100067420A CN100437626C (zh) 2005-01-31 2006-01-27 便携式终端、使用便携式终端的字符读取方法
US11/342,441 US7697722B2 (en) 2005-01-31 2006-01-30 Portable terminal and character reading method using a portable terminal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005023036A JP4453016B2 (ja) 2005-01-31 2005-01-31 携帯端末、文字読取方法および文字読取プログラム

Publications (2)

Publication Number Publication Date
JP2006209599A JP2006209599A (ja) 2006-08-10
JP4453016B2 true JP4453016B2 (ja) 2010-04-21

Family

ID=36907688

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005023036A Expired - Fee Related JP4453016B2 (ja) 2005-01-31 2005-01-31 携帯端末、文字読取方法および文字読取プログラム

Country Status (4)

Country Link
US (1) US7697722B2 (ja)
JP (1) JP4453016B2 (ja)
KR (1) KR100759165B1 (ja)
CN (1) CN100437626C (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7841533B2 (en) 2003-11-13 2010-11-30 Metrologic Instruments, Inc. Method of capturing and processing digital images of an object within the field of view (FOV) of a hand-supportable digitial image capture and processing system
US20080094496A1 (en) * 2006-10-24 2008-04-24 Kong Qiao Wang Mobile communication terminal
JP4668220B2 (ja) * 2007-02-20 2011-04-13 ソニー株式会社 画像処理装置および画像処理方法、並びにプログラム
JP4941020B2 (ja) * 2007-03-14 2012-05-30 カシオ計算機株式会社 撮像装置及び撮像装置制御プログラム
KR101012729B1 (ko) * 2008-10-31 2011-02-09 한국과학기술원 마커를 이용한 문자열 추출 시스템 및 그 방법
CN102420932A (zh) * 2010-09-27 2012-04-18 汉王科技股份有限公司 一种图像拍摄装置和方法
JP2018005622A (ja) * 2016-07-04 2018-01-11 株式会社ウェルキャット 携帯型電子機器
JP7458816B2 (ja) 2020-02-18 2024-04-01 キヤノン株式会社 データ入力支援装置、データ入力支援方法、表示装置、及びプログラム

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07220025A (ja) 1994-01-31 1995-08-18 Canon Inc 画像処理装置
JPH11103411A (ja) 1997-09-29 1999-04-13 Sony Corp 画像撮影装置
CN1179533C (zh) * 1997-12-29 2004-12-08 三星电子株式会社 用于移动无线电通信终端的字符识别系统及其方法
JP2000207487A (ja) 1999-01-20 2000-07-28 Sony Corp 情報処理装置および方法、並びに提供媒体
JP2001128131A (ja) 1999-10-28 2001-05-11 Casio Comput Co Ltd 画像通信システム、通信端末装置及び記録媒体
US6754389B1 (en) * 1999-12-01 2004-06-22 Koninklijke Philips Electronics N.V. Program classification using object tracking
US6470094B1 (en) * 2000-03-14 2002-10-22 Intel Corporation Generalized text localization in images
US7031553B2 (en) * 2000-09-22 2006-04-18 Sri International Method and apparatus for recognizing text in an image sequence of scene imagery
JP2002111841A (ja) 2000-10-04 2002-04-12 Sony Corp 携帯通信端末および文字読取装置
JP2002152696A (ja) 2000-11-10 2002-05-24 Hitachi Ltd 携帯端末
IL155821A0 (en) * 2000-11-17 2003-12-23 Weitman Jacob Applications for mobile digital camera that distinguish between text and image-information in an image
KR20020054702A (ko) * 2000-12-28 2002-07-08 이인동 아이엠티-2000을 이용한 문자인식방법
JP4240859B2 (ja) * 2001-09-05 2009-03-18 株式会社日立製作所 携帯端末装置及び通信システム
JP2004023158A (ja) 2002-06-12 2004-01-22 Sharp Corp 画像撮像装置
US7903875B2 (en) * 2002-08-07 2011-03-08 Panasonic Corporation Character recognition processing device, character recognition processing method, and mobile terminal device
JP2004129131A (ja) 2002-10-07 2004-04-22 Matsushita Electric Ind Co Ltd 監視カメラシステム
JP3990253B2 (ja) * 2002-10-17 2007-10-10 埼玉日本電気株式会社 携帯電話装置
JP2005020205A (ja) 2003-06-24 2005-01-20 Casio Comput Co Ltd 画像撮影装置

Also Published As

Publication number Publication date
CN1815491A (zh) 2006-08-09
KR100759165B1 (ko) 2007-09-14
US20060193517A1 (en) 2006-08-31
CN100437626C (zh) 2008-11-26
JP2006209599A (ja) 2006-08-10
US7697722B2 (en) 2010-04-13
KR20060088026A (ko) 2006-08-03

Similar Documents

Publication Publication Date Title
JP4453016B2 (ja) 携帯端末、文字読取方法および文字読取プログラム
EP2383970B1 (en) Camera based method for text input and keyword detection
EP1553517B1 (en) Character recognition processing device, character recognition processing method, and mobile terminal device
KR101199747B1 (ko) 단어 인식 방법 및 단어 인식용 프로그램의 기록매체 및 정보 처리 장치
KR101606469B1 (ko) 이미지 분석방법, 특히 이동 단말기용 이미지 분석방법
KR20030021120A (ko) 휴대 장치 및 전송 시스템
KR102236616B1 (ko) 정보 처리 장치, 그의 제어 방법, 및 기억 매체
JP2007034625A (ja) 情報表示装置
JP4443194B2 (ja) 携帯端末の文字認識における処理対象選択方法および携帯端末
JP2006277001A (ja) 入力イメージ表示方法および入力イメージ表示プログラム
JP4597644B2 (ja) 文字認識装置、プログラムおよび記録媒体
JP2008040910A (ja) 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体
JP4474231B2 (ja) 文書リンク情報取得システム
JP2003030654A (ja) パターン識別装置、パターン識別方法及びパターン識別用プログラム
JP5223739B2 (ja) 携帯式文字認識装置、文字認識プログラム及び文字認識方法
JP4576358B2 (ja) 文字画像処理装置及び文字画像処理方法
KR20050003075A (ko) 문자인식기능과 전자사전을 구비하는 휴대통신장치및 문자인식기능을 구비하는 전자사전
JP4017948B2 (ja) 認識結果の確認支援装置及び方法ならびにコンピュータプログラム
JP2002279352A (ja) 文字認識装置、文字認識方法および記録媒体
JP4371306B2 (ja) カラー画像処理装置及びカラー画像処理プログラム
JP2005141520A (ja) 携帯端末における文字認識用パラメータ設定方法および携帯端末
JP4431335B2 (ja) 文字列読み取りプログラム
JP2005149178A (ja) ジェスチャー処理装置およびジェスチャー処理方法
JP2006330780A (ja) 文字認識装置および文字認識プログラム
JP2006331216A (ja) 画像処理装置、画像処理装置における処理対象範囲指定方法、画像処理範囲指定プログラム、および画像処理範囲指定プログラムを記録する記録媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060614

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060614

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090618

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090625

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090724

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091124

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20091214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100107

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100120

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130212

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130212

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130212

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130212

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140212

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140212

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140212

Year of fee payment: 4

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees