JP2006134156A - 画像文字列検索装置及びそのプログラム - Google Patents
画像文字列検索装置及びそのプログラム Download PDFInfo
- Publication number
- JP2006134156A JP2006134156A JP2004323800A JP2004323800A JP2006134156A JP 2006134156 A JP2006134156 A JP 2006134156A JP 2004323800 A JP2004323800 A JP 2004323800A JP 2004323800 A JP2004323800 A JP 2004323800A JP 2006134156 A JP2006134156 A JP 2006134156A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- candidate
- search
- storage means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Character Discrimination (AREA)
Abstract
【課題】画像中から少なくとも1つの文字よりなる所定の文字列を検索し、該当文字列を明示的に表示することが可能な画像文字列検索装置及びそのプログラムを提供する。
【解決手段】画像入力手段1から入力され、第1の記憶手段4に記憶された画像に対して文字認識手段81により文字認識処理を実行し、認識結果の候補文字と、当該候補文字の位置情報とを含む多数の文字候補を第2の記憶手段5に記憶し、検索手段82により多数の文字候補からユーザが文字入力手段2から入力した所定の文字列中の文字に対応する候補文字を含む文字候補を検索して第4の記憶手段7に記憶し、検索結果画像作成手段83により検索結果の文字候補の位置情報に従い当該検索結果の文字候補を第1の記憶手段4に記憶された画像上で特定する検索結果画像を作成し、第1の記憶手段4に記憶された画像とともに表示手段3に表示する。
【選択図】図1
【解決手段】画像入力手段1から入力され、第1の記憶手段4に記憶された画像に対して文字認識手段81により文字認識処理を実行し、認識結果の候補文字と、当該候補文字の位置情報とを含む多数の文字候補を第2の記憶手段5に記憶し、検索手段82により多数の文字候補からユーザが文字入力手段2から入力した所定の文字列中の文字に対応する候補文字を含む文字候補を検索して第4の記憶手段7に記憶し、検索結果画像作成手段83により検索結果の文字候補の位置情報に従い当該検索結果の文字候補を第1の記憶手段4に記憶された画像上で特定する検索結果画像を作成し、第1の記憶手段4に記憶された画像とともに表示手段3に表示する。
【選択図】図1
Description
本発明は、画像中から少なくとも1つの文字よりなる所定の文字列を検索する技術に関する。
従来、名称等が判っている店の所在地を知りたいような場合、住所もしくは経度緯度情報を名称等に対応付けて蓄積したデータベースを元に位置を特定していた。こういったシステムの場合、例えば「山田医院」を探すには、検索システムに文字列「山田医院」を入力し、データベースから得られた「山田医院」の住所情報を元に、その所在地を地図上に重畳表示することにより、位置をユーザに指し示していた。また、ユーザを目的地へ誘導するには、カーナビゲーションシステムのようにGPSなどで得たユーザの位置情報を元に、目的地の方向や距離を表示していた。
また、情報検索システムの中には、ユーザの母国語と異なる言語の情報を検索することが可能、例えば日本語のデータベースに英語でアクセスするといったことが可能な情報検索システムがあった(特許文献1参照)。
特開2001−22787号公報
このように、従来の目的地同定技術では、その絶対位置の検索は所在地データベースを用いることにより可能であったが、ユーザを目的地へ誘導したり、ユーザの近傍の目的地を検索するにはGPSなどの位置情報取得機能が必要であり、大掛かりなシステムが必要であった。また、精緻な所在地データベースを整備・維持するには膨大なコストを要するという問題があった。
本発明の目的は、ユーザをその名称等が判っている目的地へ簡易に誘導可能とするため、画像中から少なくとも1つの文字よりなる所定の文字列を検索し、該当文字列を明示的に表示することが可能な画像文字列検索装置及びそのプログラムを提供することにある。
本発明は、上記の問題に鑑みてなされたものであり、画像中から少なくとも1つの文字よりなる所定の文字列を検索する装置であって、画像を入力するための画像入力手段と、画像入力手段から入力された画像を記憶する第1の記憶手段と、第1の記憶手段に記憶された画像に対して文字認識処理を実行し、認識結果の候補文字と、当該候補文字の前記画像中での位置情報とを少なくとも含む多数の文字候補を生成する文字認識手段と、文字認識手段によって生成された多数の文字候補を記憶する第2の記憶手段と、ユーザの操作に基づいて所定の文字列を入力するための文字入力手段と、文字入力手段から入力された所定の文字列を記憶する第3の記憶手段と、第2の記憶手段から多数の文字候補を読み出すとともに第3の記憶手段からユーザが入力した所定の文字列を読み出し、多数の文字候補から所定の文字列中の文字に対応する候補文字を含む文字候補を検索する検索手段と、検索手段によって検索された検索結果の文字候補を記憶する第4の記憶手段と、第4の記憶手段から検索結果の文字候補を読み出し、その位置情報に従い当該検索結果の文字候補を第1の記憶手段に記憶された画像上で特定する検索結果画像を作成する検索結果画像作成手段と、第1の記憶手段に記憶された画像及び検索結果画像作成手段によって作成された検索結果画像を表示するための表示手段とを備えたことを特徴とする。
また、前記画像文字列検索装置において、文字入力手段から入力された検索対象言語以外の言語による所定の文字列を検索対象言語による所定の文字列に翻訳する翻訳手段を備えたことを特徴とする。
本発明によれば、画像中からユーザが入力した所定の文字列を検索し、該当文字列を明示的に表示することができるため、所定の文字列としてユーザの目的とする店等の名称を入力すれば、画像、特にユーザの視界程度の範囲の画像内にある当該名称を含む看板、標識、ネオンサイン等を特定することができ、これによってユーザを目的とする店等を誘導することが可能となる。また、この際、検索対象言語以外の言語で所定の文字列を入力することもでき、検索対象言語が非母国語であっても使用することができる。
以下、図面を用いて本発明の実施の形態を説明する。
<第1の実施の形態>
図1は本発明の第1の実施の形態にかかる画像文字列検索装置を示すもので、図中、1は画像入力手段、2は文字入力手段、3は表示手段、4は第1の記憶手段、5は第2の記憶手段、6は第3の記憶手段、7は第4の記憶手段、8は中央演算処理装置(CPU)である。
図1は本発明の第1の実施の形態にかかる画像文字列検索装置を示すもので、図中、1は画像入力手段、2は文字入力手段、3は表示手段、4は第1の記憶手段、5は第2の記憶手段、6は第3の記憶手段、7は第4の記憶手段、8は中央演算処理装置(CPU)である。
画像入力手段1は、ユーザの視界程度の範囲の画像を入力するためのものであり、デジタルカメラ、ビデオカメラ等が用いられる。文字入力手段2は、ユーザの操作に基づいて少なくとも1つの文字よりなる所定の文字列を入力するためのものであり、キーボード、デジタイザ等が用いられる。表示手段3は、第1の記憶手段4に記憶された画像及び後述する検索結果画像作成手段によって作成された検索結果画像を表示するためのものであり、CRTや液晶ディスプレイ等が用いられる。
第1の記憶手段4は、画像入力手段1から入力された画像を記憶する。第2の記憶手段5は、後述する文字認識手段によって生成された多数の文字候補を記憶する。第3の記憶手段6は、文字入力手段2から入力された所定の文字列を記憶する。第4の記憶手段7は、後述する検索手段によって検索された検索結果の文字候補を記憶する。
中央演算処理装置(CPU)8は、図2にフローチャートで示すプログラムに従って前述した各部を制御するとともに、この際、文字認識手段81、検索手段82及び検索結果画像作成手段83を構成する。
文字認識手段81は、第1の記憶手段4に記憶された画像に対して文字認識処理を実行し、認識結果の候補文字と、当該候補文字の前記画像中での位置情報と、当該候補文字の大きさ情報とを含む多数の文字候補を生成する。検索手段82は、第2の記憶手段5から多数の文字候補を読み出すとともに第3の記憶手段6からユーザが入力した所定の文字列を読み出し、多数の文字候補から所定の文字列中の文字に対応する候補文字を含み、各候補文字の相対位置がほぼ直線状で且つ各候補文字の大きさがほぼ等しい文字候補を検索する。検索結果画像作成手段83は、第4の記憶手段7から検索結果の文字候補を読み出し、その位置情報及び大きさ情報に従い当該検索結果の文字候補を第1の記憶手段4に記憶された画像上で特定する検索結果画像を作成する。
以下、本発明装置による文字列の検索方法を説明する。
まず、CPU8は、ユーザの視界程度の範囲の画像が画像入力手段1から入力されると、これを第1の記憶手段4に記憶する(s1)。
図3は画像入力手段1から入力され、第1の記憶手段4に記憶された画像の一例を示すもので、当該画像100中には、それぞれ「小山田医院」、「鈴木商店」、「田中病院」、「小山田駅」の文字列を含む看板101,102,103,104が存在している(なお、実際の画像中には、看板以外の建物や道路、車両、人、その他景観を構成する物体が存在するが、簡単化のため省略した。)。
次に、CPU8は、その文字認識手段81により、第1の記憶手段4に記憶された画像に対して文字認識処理を実行し、認識結果の候補文字と、当該候補文字の前記画像中での位置情報と、大きさ情報とを含む多数の文字候補を生成し(s2)、これらを第2の記憶手段5に記憶する(s3)。
図4は前記文字認識手段81において生成された多数の文字侯補(文字候補リスト)の一例、ここでは図3の画像100に対応する例を示すもので、項番と、候補文字(実際には対応する文字コード)と、画像100の左上隅を(x0,y0)とした候補文字の画像の左上座標(x1,y1)及び右下座標(x2,y2)とからなるデータとして生成される。なお、ここでは候補文字の画像の左上座標及び右下座標により、候補文字の画像中での位置情報と、当該候補文字の大きさ情報とを表しているが、候補文字の画像の重心座標により位置情報を表し、候補文字の画像の大きさにより大きさ情報を表すようにしても良い。また、項番は説明のために記載した情報であり必須ではない。
次に、CPU8は、ユーザの操作に基づいて所定の文字列が文字入力手段2から入力されると、これを第3の記憶手段6に記憶する(s4)。
次に、CPU8は、その検索手段82により、第2の記憶手段5から多数の文字候補を読み出すとともに第3の記憶手段6からユーザが入力した所定の文字列を読み出し、多数の文字候補から所定の文字列中の各文字に対応する候補文字を含み、各候補文字の相対位置がほぼ直線状で且つ各候補文字の大きさがほぼ等しい文字候補を検索し(s5)、これらを第4の記憶手段7に記憶する(s6)。
所定の文字列として、例えば「小山田」が入力された場合を例に取ると、検索手段82は図4の文字侯補リストから文字列「小山田」になり得る文字候補の組み合わせを検索(抽出)する。抽出に当たっては、文字候補が所定の文字列中の各文字に対応する候補文字を含む、即ち所定の文字列の文字と候補文字とが一致していることに加えて、各候補文字の相対位置がほぼ直線状であること、各候補文字の大きさがほぼ等しいことによって判定する。その結果、ここでは図3における看板101上の文字列「小山田医院」に基づく項番1,2,3の文字侯補の組み合わせと、図3における看板104上の文字列「小山田駅」に基づく項番201,202,203の文字侯補の組み合わせとが文字列「小山田」の検索結果として抽出される。また、項番1,2,101の組み合わせは、候補文字は文字列と一致するものの、各候補文字の相対位置が直線状でないこと、項番101の候補文字だけが極端に小さいことから抽出されない。
なお、本装置が字形の似ている文字に関するデータベースを有しており、当該データベース中に「田」と「由」が似ていると記載されていれば、項番1,2,4の文字侯補の組み合わせを検索結果として抽出することも可能である。
次に、CPU8は、その検索結果画像作成手段83により、第4の記憶手段7から検索結果の文字候補を読み出し、その位置情報及び大きさ情報に従い当該検索結果の文字候補を第1の記憶手段4に記憶された画像上で特定する検索結果画像、例えば当該検索結果の文字候補を囲む大きさ及び位置を備えた矩形枠状の検索結果画像を作成する(s7)。
最後に、CPU8は、第1の記憶手段5に記憶された画像100及び前記作成した検索結果画像を表示手段3に重畳して表示する(s8)。
図5は表示画面の一例を示すもので、前述した項番1,2,3の文字侯補の組み合わせに対応する文字列を含む看板101の画像上に当該文字列を囲む矩形枠状の検索結果画像201が重畳して表示され、前述した項番201,202,203の文字侯補の組み合わせに対応する文字列を含む看板104の画像上に当該文字列を囲む矩形枠状の検索結果画像202が重畳して表示される。
なお、本実施の形態では、所定の文字列の文字と候補文字との一致、各候補文字の相対位置が直線状、各候補文字の大きさがほぼ同一の3つを検索の際の判定基準としたが、候補文字の一致のみ、あるいは候補文字の一致と相対位置が直線状のみで判定することも可能である(勿論、判定精度は悪くなる。)。一方、文字認識手段において候補文字の色やフォント種別の情報を文字候補の情報に含めるようにすれば、検索手段において各候補文字の色やフォントが同一であることなども判定基準とすることができ、より判定精度を上げることができる。また、「特開2000−132639:文字抽出認識方法及び装置及びこの方法を記録した記録媒体」記載の技術を用いれば、直線以外の並び方の規則性を基に判定することも可能である。
<第2の実施の形態>
図6は本発明の第2の実施の形態にかかる画像文字列検索装置、ここでは第1の実施の形態において検索対象言語と入力時の言語とが異なる場合であっても検索可能とした例を示すもので、図中、第1の実施の形態と同一構成部分は同一符号をもって表す。即ち、1は画像入力手段、2は文字入力手段、3は表示手段、4は第1の記憶手段、5は第2の記憶手段、6は第3の記憶手段、7は第4の記憶手段、8aは中央演算処理装置(CPU)である。
図6は本発明の第2の実施の形態にかかる画像文字列検索装置、ここでは第1の実施の形態において検索対象言語と入力時の言語とが異なる場合であっても検索可能とした例を示すもので、図中、第1の実施の形態と同一構成部分は同一符号をもって表す。即ち、1は画像入力手段、2は文字入力手段、3は表示手段、4は第1の記憶手段、5は第2の記憶手段、6は第3の記憶手段、7は第4の記憶手段、8aは中央演算処理装置(CPU)である。
中央演算処理装置(CPU)8aは、図7にフローチャートで示すプログラムに従って前述した各部を制御するとともに、この際、文字認識手段81、検索手段82、検索結果画像作成手段83及び翻訳手段84を構成する。
翻訳手段84は、文字入力手段2から入力された検索対象言語以外の言語による所定の文字列を検索対象言語による所定の文字列に翻訳する。
以下、本発明装置による文字列の検索方法を説明するが、検索対象言語は日本語、入力言語は英語であり、入力画像は第1の実施の形態の場合と同じであるとする。
ステップs1〜s3の処理は、第1の実施の形態の場合と同じであり、第1の記憶手段4に記憶される画像及び第2の記憶手段5に記憶される多数の文字侯補(文字候補リスト)も第1の実施の形態の場合と同じである。
CPU8aは、ユーザの操作に基づいて検索対象言語以外の言語、ここでは英語による所定の文字列が文字入力手段2から入力されると、その翻訳手段84により、検索対象言語による所定の文字列に翻訳する(s11)。
英語による所定の文字列として、例えば「hospital」が入力された場合を例に取ると、翻訳手段84は「hospital」を検索対象言語である日本語、即ち「病院」、「医院」、「診療所」等に翻訳する。
次に、CPU8aは、翻訳後の所定の文字列を第3の記憶手段6に記憶し(s12)、以後、第1の実施の形態の場合と同様のステップs5〜s8の処理を行う。
この場合、ステップs5の処理により、図4の文字侯補リストから文字列「病院」、「医院」、「診療所」になり得る文字候補の組み合わせ、即ち図3における看板101上の文字列「小山田医院」に基づく項番5,6の文字候補の組み合わせと、図3における看板103上の文字列「田中医院」に基づく項番103,104の文字候補の組み合わせとが検索(抽出)され、また、ステップs6の処理により、これらの検索結果が第4の記憶手段7に記憶され、また、ステップs7,s8の処理により、表示手段3には図8に示すように、前述した項番5,6の文字侯補の組み合わせに対応する文字列を含む看板101の画像上に当該文字列を囲む矩形枠状の検索結果画像301が重畳して表示され、前述した項番103,104の文字侯補の組み合わせに対応する文字列を含む看板103の画像上に当該文字列を囲む矩形枠状の検索結果画像302が重畳して表示される。
<第3の実施の形態>
図9は本発明の第3の実施の形態にかかる画像文字列検索装置、ここでは第1の実施の形態において検索対象言語と入力時の言語とが異なる場合であっても検索可能とするとともに、検索結果の文字候補を入力時の言語でも表示可能とした例を示すもので、図中、第1の実施の形態と同一構成部分は同一符号をもって表す。即ち、1は画像入力手段、2は文字入力手段、3は表示手段、4は第1の記憶手段、5は第2の記憶手段、6は第3の記憶手段、7は第4の記憶手段、8bは中央演算処理装置(CPU)である。
図9は本発明の第3の実施の形態にかかる画像文字列検索装置、ここでは第1の実施の形態において検索対象言語と入力時の言語とが異なる場合であっても検索可能とするとともに、検索結果の文字候補を入力時の言語でも表示可能とした例を示すもので、図中、第1の実施の形態と同一構成部分は同一符号をもって表す。即ち、1は画像入力手段、2は文字入力手段、3は表示手段、4は第1の記憶手段、5は第2の記憶手段、6は第3の記憶手段、7は第4の記憶手段、8bは中央演算処理装置(CPU)である。
中央演算処理装置(CPU)8bは、図10にフローチャートで示すプログラムに従って前述した各部を制御するとともに、この際、文字認識手段81、検索手段82、翻訳手段85及び検索結果画像作成手段86を構成する。
翻訳手段85は、文字入力手段2から入力された検索対象言語以外の言語による所定の文字列を検索対象言語による所定の文字列に翻訳するとともに、第4の記憶手段7から検索結果の文字候補を読み出して前記入力時の言語による検索結果の文字候補に翻訳する。検索結果画像作成手段86は、第4の記憶手段7から検索結果の文字候補を読み出し、その位置情報及び大きさ情報に従い当該検索結果の文字候補を第1の記憶手段4に記憶された画像上で特定するとともに、翻訳手段85によって翻訳された入力時の言語による検索結果の文字候補を含む検索結果画像を作成する。
以下、本発明装置による文字列の検索方法を説明するが、検索対象言語は日本語、入力言語は英語であり、入力画像は第1、第2の実施の形態の場合と同じであり、入力文字列及び検索結果は第2の実施の形態の場合と同じであるとする。
ステップs1〜s6(s11,s12を含む)の処理は、第2の実施の形態の場合と同じであり、第1の記憶手段4に記憶される画像、第2の記憶手段5に記憶される多数の文字侯補(文字候補リスト)、第3の記憶手段6に記憶される翻訳後の所定の文字列及び第4の記憶手段7に記憶される検索結果も第2の実施の形態の場合と同じである。
CPU8bは、翻訳手段85により、第4の記憶手段7から検索結果の文字候補を読み出し、前記入力時の言語による検索結果の文字候補に翻訳する(s21)。
前述したように第4の記憶手段7に記憶された検索結果の文字候補は、項番5,6の文字候補の組み合わせである「医院」と、項番103,104の文字候補の組み合わせである「病院」とであるから、両者はいずれも入力時の言語(英語)の該当する言葉「hospital」に翻訳される。
次に、CPU8bは、その検索結果画像作成手段86により、第4の記憶手段7から検索結果の文字候補を読み出し、その位置情報及び大きさ情報に従い当該検索結果の文字候補を第1の記憶手段4に記憶された画像上で特定するとともに、翻訳手段85によって翻訳された入力時の言語による検索結果の文字候補を含む検索結果画像、例えば当該検索結果の文字候補を囲む大きさ及び位置を備えた矩形枠とともに入力時の言語による検索結果の文字候補からなる検索結果画像を作成する(s22)。
最後に、CPU8bは、第1の記憶手段5に記憶された画像100及び前記作成した検索結果画像を表示手段3に重畳して表示する(s8)。
図11は表示画面の一例を示すもので、前述した項番5,6の文字侯補の組み合わせに対応する文字列を含む看板101の画像上に当該文字列を囲む矩形枠並びに入力時の言語による検索結果の文字候補「hospital」からなる検索結果画像401が重畳して表示され、前述した項番103,104の文字侯補の組み合わせに対応する文字列を含む看板103の画像上に当該文字列を囲む矩形枠並びに入力時の言語による検索結果の文字候補「hospital」からなる検索結果画像402が重畳して表示される。
<第4の実施の形態>
図12は本発明の第4の実施の形態にかかる画像文字列検索装置、ここでは第1の実施の形態において検索対象言語と入力言語とが異なる場合であっても検索可能とするとともに、検索結果の文字候補及びその近傍の文字列を入力時の言語で表示するようにした例を示すもので、図中、第1の実施の形態と同一構成部分は同一符号をもって表す。即ち、1は画像入力手段、2は文字入力手段、3は表示手段、4は第1の記憶手段、5は第2の記憶手段、6は第3の記憶手段、7は第4の記憶手段、8cは中央演算処理装置(CPU)である。
図12は本発明の第4の実施の形態にかかる画像文字列検索装置、ここでは第1の実施の形態において検索対象言語と入力言語とが異なる場合であっても検索可能とするとともに、検索結果の文字候補及びその近傍の文字列を入力時の言語で表示するようにした例を示すもので、図中、第1の実施の形態と同一構成部分は同一符号をもって表す。即ち、1は画像入力手段、2は文字入力手段、3は表示手段、4は第1の記憶手段、5は第2の記憶手段、6は第3の記憶手段、7は第4の記憶手段、8cは中央演算処理装置(CPU)である。
中央演算処理装置(CPU)8cは、図13にフローチャートで示すプログラムに従って前述した各部を制御するとともに、この際、文字認識手段81、検索手段82、翻訳手段87及び検索結果画像作成手段88を構成する。
翻訳手段87は、文字入力手段2から入力された検索対象言語以外の言語による所定の文字列を検索対象言語による所定の文字列に翻訳するとともに、第4の記憶手段7から検索結果の文字候補を読み出して前記入力時の言語による検索結果の文字候補に翻訳し、第2の記憶手段5から当該検索結果の文字候補の近傍の文字候補を読み出して前記入力時の言語による文字候補に翻訳する。検索結果画像作成手段88は、第4の記憶手段7から検索結果の文字候補を読み出し、その位置情報及び大きさ情報に従い当該検索結果の文字候補を第1の記憶手段4に記憶された画像上で特定するとともに、翻訳手段87によって翻訳された入力時の言語による検索結果の文字候補及びその近傍の文字候補を含む検索結果画像を作成する。
以下、本発明装置による文字列の検索方法を説明するが、検索対象言語は日本語、入力言語は英語であり、入力画像は第1、第2の実施の形態の場合と同じであり、入力文字列及び検索結果は第2の実施の形態の場合と同じであるとする。
ステップs1〜s6(s11,s12を含む)の処理は、第2の実施の形態の場合と同じであり、第1の記憶手段4に記憶される画像、第2の記憶手段5に記憶される多数の文字侯補(文字候補リスト)、第3の記憶手段6に記憶される翻訳後の所定の文字列及び第4の記憶手段7に記憶される検索結果も第2の実施の形態の場合と同じである。
CPU8cは、翻訳手段87により、第4の記憶手段7から検索結果の文字候補を読み出し、前記入力時の言語による検索結果の文字候補に翻訳し、第2の記憶手段5から当該検索結果の文字候補の近傍の文字候補を読み出し、前記入力時の言語による文字候補に翻訳する(s31)。
前述したように第4の記憶手段7に記憶された検索結果の文字候補は、項番5,6の文字候補の組み合わせである「医院」と、項番103,104の文字候補の組み合わせである「病院」とであるから、両者はいずれも入力時の言語(英語)の該当する言葉「hospital」に翻訳される。また、項番5,6の文字候補の近傍にある文字候補は項番1,2,3の文字候補の組み合わせである「小山田」であり、項番103,104の文字候補の近傍にある文字候補は項番101,102の文字候補の組み合わせである「田中」であるから、それぞれ入力時の言語(英語(但し、ここではローマ字))の該当する言葉「Oyamada」と「Tanaka」とに翻訳される。
なお、前述した近傍の文字候補の判定は、単にある距離内にある文字集合を対象にしたり、「特開2000−132639:文字抽出認識方法及び装置及びこの方法を記録した記録媒体」のように並び方の規則性に基づいたり、さらに、言語モデルを備えて「特開平08−315078:日本語文字認識方法及び装置」のように単語として妥当なもののみを抽出すること等により可能である。
次に、CPU8cは、その検索結果画像作成手段88により、第4の記憶手段7から検索結果の文字候補を読み出し、その位置情報及び大きさ情報に従い当該検索結果の文字候補を第1の記憶手段4に記憶された画像上で特定するとともに、翻訳手段87によって翻訳された入力時の言語による検索結果の文字候補及びその近傍の文字候補を含む検索結果画像、例えば当該検索結果の文字候補を囲む大きさ及び位置を備えた矩形枠とともに入力時の言語による検索結果の文字候補及びその近傍の文字候補からなる検索結果画像を作成する(s32)。
最後に、CPU8cは、第1の記憶手段5に記憶された画像100及び前記作成した検索結果画像を表示手段3に重畳して表示する(s8)。
図14は表示画面の一例を示すもので、前述した項番5,6の文字侯補の組み合わせに対応する文字列を含む看板101の画像上に当該文字列を囲む矩形枠並びに入力時の言語による検索結果の文字候補「hospital」及びその近傍の文字候補「Oyamada」からなる検索結果画像501が重畳して表示され、前述した項番103,104の文字侯補の組み合わせに対応する文字列を含む看板103の画像上に当該文字列を囲む矩形枠並びに入力時の言語による検索結果の文字候補「hospital」及びその近傍の文字候補「Tanaka」からなる検索結果画像502が重畳して表示される。
なお、本発明中の第1乃至第4の記憶手段という記載は、どのようなデータを記憶するかという機能上の違いに基づく表現であり、ハードウェア的に4つの個別の記憶装置が必要であるという意味ではない。また、実施の形態では、文字認識手段、検索手段、検索結果画像作成手段及び翻訳手段を中央演算処理装置(CPU)上でプログラムにより構成した例を示したが、それぞれハードウェアで構成しても良いことはいうまでもない。
1:画像入力手段、2:文字入力手段、3:表示手段、4:第1の記憶手段、5:第2の記憶手段、6:第3の記憶手段、7:第4の記憶手段、8,8a,8b,8c:中央演算処理装置(CPU)、81:文字認識手段、82:検索手段、83,86,88:検索結果画像作成手段、84,85,87:翻訳手段、100:入力画像、101,102,103,104:看板、201,202,301,302,401,402,501,502:検索結果画像。
Claims (11)
- 画像中から少なくとも1つの文字よりなる所定の文字列を検索する装置であって、
画像を入力するための画像入力手段と、
画像入力手段から入力された画像を記憶する第1の記憶手段と、
第1の記憶手段に記憶された画像に対して文字認識処理を実行し、認識結果の候補文字と、当該候補文字の前記画像中での位置情報とを少なくとも含む多数の文字候補を生成する文字認識手段と、
文字認識手段によって生成された多数の文字候補を記憶する第2の記憶手段と、
ユーザの操作に基づいて所定の文字列を入力するための文字入力手段と、
文字入力手段から入力された所定の文字列を記憶する第3の記憶手段と、
第2の記憶手段から多数の文字候補を読み出すとともに第3の記憶手段からユーザが入力した所定の文字列を読み出し、多数の文字候補から所定の文字列中の文字に対応する候補文字を含む文字候補を検索する検索手段と、
検索手段によって検索された検索結果の文字候補を記憶する第4の記憶手段と、
第4の記憶手段から検索結果の文字候補を読み出し、その位置情報に従い当該検索結果の文字候補を第1の記憶手段に記憶された画像上で特定する検索結果画像を作成する検索結果画像作成手段と、
第1の記憶手段に記憶された画像及び検索結果画像作成手段によって作成された検索結果画像を表示するための表示手段とを備えた
ことを特徴とする画像文字列検索装置。 - 請求項1記載の画像文字列検索装置において、
文字入力手段から入力された検索対象言語以外の言語による所定の文字列を検索対象言語による所定の文字列に翻訳する翻訳手段を備えた
ことを特徴とする画像文字列検索装置。 - 請求項1記載の画像文字列検索装置において、
文字入力手段から入力された検索対象言語以外の言語による所定の文字列を検索対象言語による所定の文字列に翻訳するとともに、第4の記憶手段から検索結果の文字候補を読み出して前記入力時の言語による検索結果の文字候補に翻訳する翻訳手段と、
第4の記憶手段から検索結果の文字候補を読み出し、その位置情報に従い当該検索結果の文字候補を第1の記憶手段に記憶された画像上で特定するとともに、翻訳手段によって翻訳された入力時の言語による検索結果の文字候補を含む検索結果画像を作成する検索結果画像作成手段とを備えた
ことを特徴とする画像文字列検索装置。 - 請求項1記載の画像文字列検索装置において、
文字入力手段から入力された検索対象言語以外の言語による所定の文字列を検索対象言語による所定の文字列に翻訳するとともに、第4の記憶手段から検索結果の文字候補を読み出して前記入力時の言語による検索結果の文字候補に翻訳し、第2の記憶手段から当該検索結果の文字候補の近傍の文字候補を読み出して前記入力時の言語による文字候補に翻訳する翻訳手段と、
第4の記憶手段から検索結果の文字候補を読み出し、その位置情報に従い当該検索結果の文字候補を第1の記憶手段に記憶された画像上で特定するとともに、翻訳手段によって翻訳された入力時の言語による検索結果の文字候補及びその近傍の文字候補を含む検索結果画像を作成する検索結果画像作成手段とを備えた
ことを特徴とする画像文字列検索装置。 - 請求項1乃至4いずれか記載の画像文字列検索装置において、
第2の記憶手段から多数の文字候補を読み出すとともに第3の記憶手段からユーザが入力した所定の文字列を読み出し、多数の文字候補から所定の文字列中の各文字に対応する候補文字を含み、各候補文字の相対位置がほぼ直線状である文字候補を検索する検索手段を備えた
ことを特徴とする画像文字列検索装置。 - 請求項1乃至4いずれか記載の画像文字列検索装置において、
第1の記憶手段に記憶された画像に対して文字認識処理を実行し、認識結果の候補文字と、当該候補文字の前記画像中での位置情報と、当該候補文字の大きさ情報とを少なくとも含む多数の文字候補を生成する文字認識手段と、
第2の記憶手段から多数の文字候補を読み出すとともに第3の記憶手段からユーザが入力した所定の文字列を読み出し、多数の文字候補から所定の文字列中の各文字に対応する候補文字を含み、各候補文字の相対位置がほぼ直線状で且つ各候補文字の大きさがほぼ等しい文字候補を検索する検索手段とを備えた
ことを特徴とする画像文字列検索装置。 - 請求項6記載の画像文字列検索装置において、
第4の記憶手段から検索結果の文字候補を読み出し、その位置情報及び大きさ情報に従い当該検索結果の文字候補を第1の記憶手段に記憶された画像上で特定する検索結果画像を作成する検索結果画像作成手段を備えた
ことを特徴とする画像文字列検索装置。 - 画像中から少なくとも1つの文字よりなる所定の文字列を検索するプログラムであって、
第1の記憶手段、第2の記憶手段、第3の記憶手段、第4の記憶手段、画像入力手段、文字入力手段及び表示手段を備えた計算機に、
画像入力手段から入力された画像を第1の記憶手段に記憶する工程と、
第1の記憶手段に記憶された画像に対して文字認識処理を実行し、認識結果の候補文字と、当該候補文字の前記画像中での位置情報とを少なくとも含む多数の文字候補を生成する工程と、
前記生成した多数の文字候補を第2の記憶手段に記憶する工程と、
ユーザの操作に基づいて文字入力手段から入力された所定の文字列を第3の記憶手段に記憶する工程と、
第2の記憶手段から多数の文字候補を読み出すとともに第3の記憶手段からユーザが入力した所定の文字列を読み出し、多数の文字候補から所定の文字列中の文字に対応する候補文字を含む文字候補を検索する工程と、
前記検索結果の文字候補を第4の記憶手段に記憶する工程と、
第4の記憶手段から検索結果の文字候補を読み出し、その位置情報に従い当該検索結果の文字候補を第1の記憶手段に記憶された画像上で特定する検索結果画像を作成する工程と、
第1の記憶手段に記憶された画像及び前記作成した検索結果画像を表示手段に表示する工程とを実行させる
ことを特徴とする画像文字列検索プログラム。 - 請求項8記載の画像文字列検索プログラムにおいて、
文字入力手段から入力された検索対象言語以外の言語による所定の文字列を検索対象言語による所定の文字列に翻訳する工程を含む
ことを特徴とする画像文字列検索プログラム。 - 請求項8記載の画像文字列検索プログラムにおいて、
文字入力手段から入力された検索対象言語以外の言語による所定の文字列を検索対象言語による所定の文字列に翻訳する工程と、
第4の記憶手段から検索結果の文字候補を読み出し、前記入力時の言語による検索結果の文字候補に翻訳する工程と、
第4の記憶手段から検索結果の文字候補を読み出し、その位置情報に従い当該検索結果の文字候補を第1の記憶手段に記憶された画像上で特定するとともに、入力時の言語による検索結果の文字候補を含む検索結果画像を作成する工程とを含む
ことを特徴とする画像文字列検索プログラム。 - 請求項8記載の画像文字列検索プログラムにおいて、
文字入力手段から入力された検索対象言語以外の言語による所定の文字列を検索対象言語による所定の文字列に翻訳する工程と、
第4の記憶手段から検索結果の文字候補を読み出し、前記入力時の言語による検索結果の文字候補に翻訳し、第2の記憶手段から当該検索結果の文字候補の近傍の文字候補を読み出し、前記入力時の言語による文字候補に翻訳する工程と、
第4の記憶手段から検索結果の文字候補を読み出し、その位置情報に従い当該検索結果の文字候補を第1の記憶手段に記憶された画像上で特定するとともに、入力時の言語による検索結果の文字候補及びその近傍の文字候補を含む検索結果画像を作成する工程とを含む
ことを特徴とする画像文字列検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004323800A JP2006134156A (ja) | 2004-11-08 | 2004-11-08 | 画像文字列検索装置及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004323800A JP2006134156A (ja) | 2004-11-08 | 2004-11-08 | 画像文字列検索装置及びそのプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006134156A true JP2006134156A (ja) | 2006-05-25 |
Family
ID=36727640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004323800A Pending JP2006134156A (ja) | 2004-11-08 | 2004-11-08 | 画像文字列検索装置及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006134156A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012064050A (ja) * | 2010-09-16 | 2012-03-29 | Toshiba Corp | 画像検索装置、方法及びプログラム |
WO2012120695A1 (ja) | 2011-03-10 | 2012-09-13 | オムロン株式会社 | 文字列検知装置、画像処理装置、文字列検知方法、制御プログラムおよび記録媒体 |
-
2004
- 2004-11-08 JP JP2004323800A patent/JP2006134156A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012064050A (ja) * | 2010-09-16 | 2012-03-29 | Toshiba Corp | 画像検索装置、方法及びプログラム |
WO2012120695A1 (ja) | 2011-03-10 | 2012-09-13 | オムロン株式会社 | 文字列検知装置、画像処理装置、文字列検知方法、制御プログラムおよび記録媒体 |
US9129383B2 (en) | 2011-03-10 | 2015-09-08 | Omron Corporation | Character string detection device, image processing device, character string detection method, control program and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4461769B2 (ja) | 文書検索・閲覧手法及び文書検索・閲覧装置 | |
CN108710601B (zh) | 一种文本显示方法及其设备、存储介质、电子设备 | |
JP6462970B1 (ja) | 分類装置、分類方法、生成方法、分類プログラム及び生成プログラム | |
US20100299134A1 (en) | Contextual commentary of textual images | |
CN113359986B (zh) | 增强现实数据展示方法、装置、电子设备及存储介质 | |
JP2014197341A (ja) | 電子書籍制作装置、電子書籍システム、電子書籍制作方法及びプログラム | |
JP4589159B2 (ja) | ラスタ地図検索装置 | |
CN102968266A (zh) | 识别方法及装置 | |
JPH07121539A (ja) | 機械翻訳装置 | |
JP2006134156A (ja) | 画像文字列検索装置及びそのプログラム | |
JP2008027133A (ja) | 帳票処理装置及び帳票処理方法ならびに帳票処理方法を実行するプログラムと記憶媒体 | |
JP2008210229A (ja) | 知的財産情報検索装置、知的財産情報検索方法及び知的財産情報検索プログラム | |
US10528852B2 (en) | Information processing apparatus, method and computer program product | |
CN113272873A (zh) | 用于增强现实的方法和设备 | |
JP2006172380A (ja) | 空間データの検索用インデックス作成装置および空間データ検索装置および空間データの検索用インデックス作成方法 | |
JP2013175136A (ja) | トレース支援装置、トレース支援システム、トレース支援方法、およびトレース支援プログラム | |
JP2003067407A (ja) | 車載情報検索機器及び情報検索方法 | |
WO2023170735A1 (ja) | 学習方法、推定方法、学習推定システム、およびプログラム | |
TW200725317A (en) | System and method of scanning a name card to search for a navigation map | |
JP2000268039A (ja) | 検索装置及び記録媒体 | |
JP2010181991A (ja) | 画像検索指令システムおよびその動作制御方法 | |
JPS6325764A (ja) | 文書作成装置 | |
JP2009157470A (ja) | 電子文書処理装置及びプログラム | |
JP2007328231A (ja) | 対象物内容表示情報のデータ構造、地図情報のデータ構造、地図情報を記録した記録媒体、表示制御装置、その方法、そのプログラム、および、そのプログラムを記録した記録媒体 | |
JPH10228236A (ja) | 地図表示装置 |