JP2004118281A - 抽出文字列辞書検索装置及び方法並びにプログラム - Google Patents

抽出文字列辞書検索装置及び方法並びにプログラム Download PDF

Info

Publication number
JP2004118281A
JP2004118281A JP2002276833A JP2002276833A JP2004118281A JP 2004118281 A JP2004118281 A JP 2004118281A JP 2002276833 A JP2002276833 A JP 2002276833A JP 2002276833 A JP2002276833 A JP 2002276833A JP 2004118281 A JP2004118281 A JP 2004118281A
Authority
JP
Japan
Prior art keywords
character string
dictionary
image
camera
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002276833A
Other languages
English (en)
Other versions
JP4116852B2 (ja
Inventor
Shinichi Sei
清 愼一
Toshiaki Kawashima
川嶋 俊明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Social Science Labs Ltd
Original Assignee
Fujitsu Social Science Labs Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Social Science Labs Ltd filed Critical Fujitsu Social Science Labs Ltd
Priority to JP2002276833A priority Critical patent/JP4116852B2/ja
Publication of JP2004118281A publication Critical patent/JP2004118281A/ja
Application granted granted Critical
Publication of JP4116852B2 publication Critical patent/JP4116852B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

【課題】本発明は、抽出文字列辞書検索装置に関し、カメラ付き携帯情報端末で撮影した画像についての文字認識により得た文字列で辞書を検索してその結果を返信することを目的とする。
【解決手段】抽出文字列辞書検索装置3は、カメラ付き携帯情報端末1からこれで撮影した画像を受信する受信手段31、41と、画像を解析して文字列を含む部分画像を抽出しこの部分画像の中から文字認識の処理対象を特定する画像解析対象特定手段42、43と、前記処理対象について文字認識を行なって文字列を得る文字列認識手段44と、文字列で辞書を検索してその結果を得る辞書検索手段45と、検索の結果に基づいて応答を作成してカメラ付き携帯情報端末1に送信する送信手段46、32とを備える。
【選択図】     図3

Description

【0001】
【発明の属する技術分野】
本発明は、抽出文字列辞書検索装置及び方法並びにプログラムに関し、特に、カメラ付き携帯情報端末で撮影した画像についての文字認識により得た文字列で辞書を検索してその結果を返信する抽出文字列辞書検索装置及び方法並びにプログラムに関する。
【0002】
【従来の技術】
いわゆる電子辞書の発達により、ごく小型の電子辞書に、国語辞典、漢和辞典、英和辞典、和英辞典等の多くの辞書を収納することが可能となっている。従って、何冊もの辞書を持ち歩くことなく、出先で単語の意味、漢字の意味、英単語の意味,専門用語の意味等を知ることができる。例えば、海外旅行先等で新聞、雑誌、看板、広告等を見て判らない単語があれば、これを電子辞書に入力することにより、当該単語の意味を知ることができる。
【0003】
また、インターネットの発達により、ネットワーク上での種々の翻訳サービスを利用することができる。これによれば、同様に、海外旅行先等でインターネットに接続さえできれば、前述の新聞等における判らない単語の意味を知ることができる。
【0004】
【発明が解決しようとする課題】
前述の電子辞書によると、知りたい分野の電子辞書を持ち歩く必要があるが、予め当該知りたい分野が判っているとは限らない。また、中国語や韓国語等の電子辞書は、容易には入手できない。また、辞書を引くことに変わりはないので、辞書を引く手間がかかり、煩わしい。更に、利用者にとって、自分が詳しくない分野の辞書を引く場合、当該辞書の使い方が判らない場合が殆どである。
【0005】
また、電子辞書やインターネットによると、文字入力が必須である。しかし、携帯電話や携帯情報端末(PDA、以下、両者を単に携帯情報端末という)からの文字の入力は、キーが小さいので、入力が面倒であり、誤入力も多くなる。もっともパーソナルコンピュータの持ち歩きは更に面倒である。また、携帯情報端末では、入力できない文字も多く存在する。例えば、機種によって入力できない文字や、英語以外の言語例えばハングル等は、入力できないのが通常である。
【0006】
そこで、本発明者は、出先で看板等を見て判らない単語があったら、その写真(画像)を撮影して送信するのみで、その単語の意味等を応答として得ることができれば、極めて便利であると考えた。
【0007】
本発明は、カメラ付き携帯情報端末で撮影した画像についての文字認識により得た文字列で辞書を検索してその結果を返信する抽出文字列辞書検索装置を提供することを目的とする。
【0008】
また、本発明は、カメラ付き携帯情報端末で撮影した画像についての文字認識により得た文字列で辞書を検索してその結果を返信する抽出文字列辞書検索方法を提供することを目的とする。
【0009】
また、本発明は、カメラ付き携帯情報端末で撮影した画像についての文字認識により得た文字列で辞書を検索してその結果を返信する抽出文字列辞書検索プログラムを提供することを目的とする。
【0010】
【課題を解決するための手段】
本発明の抽出文字列辞書検索装置は、カメラ付き携帯情報端末から当該カメラ付き携帯情報端末で撮影した画像を受信する受信手段と、画像を解析して文字列を含む1又は複数の部分画像を抽出し部分画像の中から文字認識の処理対象を特定する画像解析対象特定手段と、文字認識の処理対象について文字認識を行なって文字列を得る文字列認識手段と、予め用意された1又は複数の辞書と、文字列で辞書を検索してその結果を得る辞書検索手段と、辞書の検索の結果に基づいて応答を作成してカメラ付き携帯情報端末に送信する送信手段とを備える。
【0011】
本発明の抽出文字列辞書検索方法は、カメラ付き携帯情報端末から当該カメラ付き携帯情報端末で撮影した画像を受信し、画像を解析して文字列を含む1又は複数の部分画像を抽出し部分画像の中から文字認識の処理対象を特定し、文字認識の処理対象について文字認識を行なって文字列を得て、文字列で予め用意された1又は複数の辞書を検索してその結果を得て、辞書の検索の結果に基づいて応答を作成してカメラ付き携帯情報端末に送信する。
【0012】
本発明の抽出文字列辞書検索装置及び方法によれば、カメラ付き携帯情報端末で知りたい単語(文字列)の写真(画像)を撮影して送信するのみで、その単語の意味等を応答として得ることができる。従って、電子辞書のように知りたい分野の電子辞書を持ち歩く必要がなく、単語を入力する(電子辞書を引く)手間も必要なく、辞書の使い方を知っている必要もない。また、文字入力の必要がないので、入力の手間を不要にでき、誤入力もなく、更に、入力できない文字についてもその意味を知ることができる。
【0013】
本発明の抽出文字列辞書検索プログラムは、カメラ付き携帯情報端末とネットワークを介して接続された抽出文字列辞書検索装置において抽出文字列辞書検索処理を実行するプログラムである。前記プログラムは、コンピュータに、カメラ付き携帯情報端末から当該カメラ付き携帯情報端末で撮影した画像を受信させ、画像を解析して文字列を含む1又は複数の部分画像を抽出させ部分画像の中から文字認識の処理対象を特定させ、文字認識の処理対象について文字認識を行なって文字列を得させ、文字列で予め用意された1又は複数の辞書を検索させ、辞書の検索の結果に基づいて応答を作成して前記カメラ付き携帯情報端末に送信させる。
【0014】
本発明の抽出文字列辞書検索プログラムは、フレキシブルディスク、CD−ROM、CD−R/W、DVD等のコンピュータ読取可能な記録媒体に格納して提供することができるので、抽出文字列辞書検索装置及び方法を容易に実現することができる。
【0015】
【発明の実施の形態】
図1(A)は、抽出文字列辞書検索システム構成図であり、 本発明の抽出文字列辞書検索装置を含む抽出文字列辞書検索システムの構成を示す。
【0016】
抽出文字列辞書検索システムは、図1(A)に示すように、カメラ付き携帯情報端末1と、カメラ付き携帯情報端末1とネットワーク2を介して接続された抽出文字列辞書検索装置又は抽出文字列辞書検索サーバ(以下、抽出検索装置という)3とからなる。ネットワーク2は、例えばインターネット2からなる。カメラ付き携帯情報端末1は、例えば使用者である旅行者により海外等に携帯される。抽出検索装置3は、例えば使用者の母国(これに限られない)に存在するISP(インターネットサービスプロバイダ)又はASP(アプリケーションサービスプロバイダ)に設けられる。カメラ付き携帯情報端末1は、写真付きの電子メール100を抽出検索装置3に送信し、これから応答200である情報URLを受信する。
【0017】
カメラ付き携帯情報端末1は、この例では周知のカメラ付きの携帯電話であり、通常の携帯電話としての機能の他に、電子メール(この例では、インターネットメール)通信の機能を含むインターネット通信の機能を有する。カメラ付き携帯情報端末1は、カメラ付きの携帯電話の他に、カメラ付きのPDA、カメラ付きの小型の専用端末等を含む。以下の説明においては、カメラ付き携帯情報端末1を、単に携帯電話1ということとする。携帯電話1は、当該携帯電話1で撮影した写真(の画像)を含む電子メール100を、インターネット2を介して、抽出検索装置3に送信する。
【0018】
このために、携帯電話1は、図1(B)に示すように、カメラ11、インターネット通信部12、表示画面13を備える。インターネット通信部12は、当該携帯電話1のカメラ11で撮影した写真(の画像又は画像データ)を含む電子メール100を作成して、指定された宛先に送信する。この場合、宛先は抽出検索装置3のメールアドレスである。
【0019】
インターネット通信部12の送信する電子メール100の一例を図2に示す。即ち、電子メール100は、題名、宛先、本文、画像101からなる。題名は、電子メール100の題名であり、利用者により当該携帯電話1の入力部(図示せず)から入力される。例えば、この例では、利用者が当該写真に付す写真の名前である。宛先は、電子メール100の送信先であり、この例では抽出検索装置3のメールアドレスである。本文は、電子メール100の本文であり、この例では補助情報(後述する)が当該携帯電話1の入力部から入力される。画像101は、電子メール100に添付される写真であり、当該携帯電話1のカメラ11で撮影した写真の画像(画像データ)101からなる。
【0020】
画像101は、図2に示すように、通常、1又は複数の文字列を含む(含んでよい)。従って、利用者はあまり写真の構図を意識する必要がなく、負担が少ない。文字列は、通常、種々の看板、旗、ドア、紙等に描かれていることが多いので、同色(又は、同明度)の背景で囲まれている。従って、本発明においては、同色(又は、同明度)の背景で囲まれた領域が、後述するように、部分画像として抽出される。
【0021】
画像101に含まれる文字列は、外国語又は専門用語であることが多い。そこで、当該外国語又は専門用語の分野を示す情報として、補助情報を入力する。補助情報は、後述するように、抽出検索装置3における文字認識(OCR処理)及び辞書検索のための参考情報であり、認識すべき文字の種類(即ち、言語の種類)を特定し、また、当該検索の分野(即ち、辞書の種類)を特定するための情報である。補助情報としては、例えば当該旅行している国の言語名、当該撮影した店舗の種類(飲食店であれば、料理)、動物等を入力すればよい。従って、利用者の負担は殆どない。図2に示す例の場合、補助情報は「韓国」「韓国語」「ハングル」等と入力すればよい。なお、補助情報は必ずしも入力する必要はない。補助情報が入力されない場合、電子メール100の本文の部分は空とされる。
【0022】
なお、補助情報としては、位置情報(例えば、中央、下、右上等)、色情報(例えば、赤、黒等)、大きさ情報(例えば、大きい方、小さい方等)を入力するようにしてもよい。この場合の補助情報は、対象特定部43における複数の部分画像の中から文字認識の処理対象とする1個の部分画像を特定するための参考情報として用いられる。例えば、位置情報が「下」であれば、後述する複数の部分画像から、図5(B)に示す部分画像ではなく、当該位置情報に該当する図5(C)に示す部分画像が特定される。特定させたい看板の文字が例えば「赤」であれば、色情報として「赤」を入力すれば当該部分画像が文字認識の処理対象として特定される。例えば、大きさ情報が「小さい方」であれば、後述する複数の部分画像から、図5(B)に示す部分画像ではなく、当該位置情報に該当する図5(C)に示す部分画像が特定される。
【0023】
更に、補助情報として「インターネット検索」と入力するようにしてもよい。この場合の補助情報は、辞書検索のための参考情報として用いられる。但し、辞書検索部45は、検索対象を抽出検索装置3(自サーバ)の辞書記憶部35に用意された辞書と共に、他のサーバ(図示せず)上のWeb(ウェブ)ページとする。即ち、抽出検索装置3の辞書を検索すると共に、インターネット2を介して周知の検索サイト(例えば、Google、goo等、登録商標)をアクセスして、他のサーバ上のWebページ検索の結果を得る。又は、抽出検索装置3に用意された辞書ではなく、他のサーバ上のWebページのみを検索するようにしてもよい。これらにより、抽出文字列そのものの情報のみでなく、関連情報も得ることができる。
【0024】
抽出検索装置3は、写真を含む電子メール100に対する応答200を当該携帯電話1に送信する。このために、抽出検索装置3は、図3に示すように、受信部31、送信部32、Web閲覧部(Webサーバ)33、抽出文字列辞書検索処理部34、辞書記憶部35を備える。抽出文字列辞書検索処理部(以下、抽出検索処理部)34は、メール解析部41、画像解析部42、対象特定部43、文字列認識部44、辞書検索部45、メール作成部46からなる。辞書記憶部35は、ディスク装置等の補助記憶からなり、辞書部51と閲覧情報部52とからなる。辞書部51は、種々の辞書、事典、辞典等(この明細書では、単に辞書という)を格納する。閲覧情報部52は、Webサーバ33により閲覧される情報を格納する。
【0025】
抽出検索処理部34は、主記憶上に存在し当該処理を実行する抽出文字列辞書検索プログラムを、当該CPU上で実行することにより実現される。抽出文字列辞書検索プログラムは、フレキシブルディスク、CD−ROM、CD−R/W、DVD等のコンピュータ読取可能な記録媒体に格納して提供することができるので、抽出検索装置3を容易に実現することができる。
【0026】
受信部31は、周知の電子メール受信部であり、メール解析部41と共に前述の受信手段を構成し、携帯電話1から当該携帯電話1で撮影した画像を含む電子メール100を受信する。受信部31は、受信した電子メール100をメール解析部41に送る。
【0027】
受信した電子メール100の一例を図4に示す。図2に示す電子メール100は、実際には、図4に示すフォーマットで送信され受信される。図4に示すように、電子メール100は、ヘッダ部102、ボディ部103からなる。
【0028】
ヘッダ部102は、返信先のメールアドレス、送信元のメールアドレス、宛先のメールアドレス、題名を含む。返信先のメールアドレスは、当該電子メール100に対する応答200を返信すべきアドレスであり、利用者の携帯電話1のメールアドレスである。送信元のメールアドレスは、当該電子メール100を送信してきた利用者の携帯電話1のメールアドレスである。宛先のメールアドレスは、当該電子メール100の宛先のアドレスであり、当該抽出検索装置3のメールアドレスである。
【0029】
ボディ部103は、本文、画像101を含み、主として、テキスト文書である本文と、所定のエンコーディングされた画像データである画像101とからなるマルチパート(2パート)からなる。本文はスペース又は改行で区切られた単語の集合である。各々の単語は補助情報である。画像101は1個のみとされる。
【0030】
メール解析部41は、周知の電子メール解析部であり、受信部31と共に前述の受信手段を構成し、受信部31から電子メール100を受け取ると、受信した電子メール100を解析して、当該電子メール100から返信先のメールアドレス、補助情報、画像を取り出し、メール検索データ150を例えば辞書記憶部35の所定の記憶領域(図示せず)に作成する。
【0031】
メール検索データ150の一例を図5(A)に示す。メール検索データ150は、ID、画像(101)、補助情報、メールアドレス、(特定された)部分画像、文字列、辞書を引いた結果(検索結果)の数、(辞書を引いた)結果#1〜結果#nからなる。IDは、受信した電子メール100毎にメール解析部41により付与され、ユニークなものとされる。電子メール100はこのIDにより管理される。画像及び補助情報は、各々、図4に示すように、メール解析部41により、ボディ部103から取り出された画像101及び本文の内容である。即ち、携帯電話1から送信されたものである。メールアドレスは、図4に示すように、メール解析部41により、ヘッダ部102の返信先から取り出されたメールアドレスである。即ち、電子メール100を送信してきた携帯電話1のメールアドレスである。なお、画像及び部分画像は、当該画像及び部分画像を格納するアドレスを示すようにしてもよい。
【0032】
メール検索データ150を作成した時点では、部分画像、文字列、検索結果の数、結果#1〜結果#nは空である。部分画像は、文字認識の処理対象として特定された部分画像であり、OCR処理の対象となる画像である。文字列は、文字認識処理の結果である認識した文字列であり、当該部分画像から読み取られた文字列である。検索結果の数は、当該文字列をキーワードとして辞書を検索した結果の数であり、何個の結果があるかを示す。結果#1〜結果#nは、当該文字列をキーワードとして辞書を検索した結果であり、辞書データへのポインタ(URL)である。これらについては後述する。
【0033】
画像解析部42は、対象特定部43と共に前述の画像解析対象特定手段を構成し、メール検索データ150が作成されると、その画像(以下、区別のために、全体画像という)101を参照して、当該全体画像101を解析して文字列を含む1又は複数の部分画像を抽出する。文字列を含む部分画像は、前述のように、当該全体画像101の中で、同色(又は、同明度)の背景で囲まれた領域である。画像解析部42は、全体画像101から1又は複数の当該領域を切り出して、これらを部分画像とする。図2に示す全体画像101の例から判るように、文字列を含む部分画像は、1個の全体画像101の中に複数存在する場合がある。抽出された部分画像の一例を図5(B)及び図5(C)に示す。これらは図2に示す全体画像101から抽出された部分画像である。
【0034】
画像解析部42は、抽出した部分画像が1個である場合、当該部分画像をメール検索データ150の部分画像(の格納領域)に格納し、この旨を文字列認識部44に通知する。抽出した部分画像が複数である場合、画像解析部42は、当該複数の部分画像を対象特定部43に送る。なお、複数の部分画像をメール検索データ150の部分画像に格納し、この旨を対象特定部43に通知するようにしてもよい。
【0035】
対象特定部43は、画像解析部42と共に前述の画像解析対象特定手段を構成し、抽出された部分画像が複数存在する場合、当該複数の部分画像の中から、文字認識の処理対象とすべき部分画像を特定する。文字認識の処理対象とされる部分画像は、全体画像101における当該部分画像の位置又は当該部分画像の大きさにより特定される。即ち、全体画像101において中央よりの部分画像又は大きな部分画像が文字認識の処理対象とされる。例えば、図5(B)及び図5(C)に示す部分画像についてみると、図5(B)の部分画像が、図5(C)の部分画像よりも、全体画像101において、中央よりに存在しかつ大きい。従って、この場合、図5(B)の部分画像が文字認識の処理対象とされる。対象特定部43は、特定した文字認識の処理対象の部分画像をメール検索データ150の部分画像に格納し、この旨を文字列認識部44に通知する。
【0036】
文字列認識部44は、前述の文字列認識手段であって、画像解析部42又は対象特定部43からメール検索データ150への部分画像の格納を通知されると、当該文字認識の処理対象の部分画像について文字認識処理を行なって文字列を得る。文字列認識部44における文字認識処理は、例えば周知のOCR(Optical Character Reader)処理である。文字認識処理により得られた文字列の一例を図5(D)に示す。この文字列は、図5(B)の部分画像から得たものであり、ハングルからなる文字列である。文字列認識部44は、文字認識処理の結果である認識した文字列をメール検索データ150の文字列(の格納領域)に格納し、この旨を辞書検索部45に通知する。
【0037】
この文字認識処理において、文字列認識部44は、文字認識に先立って、メール検索データ150の補助情報を参照して、これを用いて文字認識をすべき文字の種類を特定する。即ち、文字認識すべき言語の種類を特定する。文字又は言語の種類は複数存在する。従って、複数の文字又は言語について、各々の文字認識(OCR)処理プログラムが予め用意される。図2に示す例の場合、補助情報は「韓国」「韓国語」又は「ハングル」等であるから、例えばハングルについての文字認識処理プログラムによる文字認識処理が行われる。
【0038】
メール検索データ150の補助情報が予め用意された文字又は言語の種類と異なる場合、文字列認識部44は、文字又は言語の種類の特定において推論処理を行う。例えば、補助情報が「韓国」であり、用意された文字又は言語が「韓国語」又は「ハングル」である場合、文字列認識部44は、当該補助情報に基づいて、文字認識をすべき文字の種類は「韓国語」又は「ハングル」であると判断する。このために、文字列認識部44は、例えば推論テーブル(図示せず)を備える。推論テーブルは、例えば同一の文字又は言語の種類とすべき補助情報(例えば「韓国」「韓国語」「ハングル」等)を1個のグループとして格納し、これらのいずれかが入力された場合、当該文字又は言語の種類を示すと判断する。これは、言語に限らず、専門用語についても同様である。例えば、「料理」「クッキング」等を1個のグループとして、推論テーブルに格納するようにすればよい。
【0039】
メール検索データ150の補助情報が空である場合、文字列認識部44は、当該補助情報に基づいて、文字認識をすべき文字の種類は「日本語」であると判断する。これにより、漢字、平仮名、片仮名の文字認識処理が行われる。なお、これは、利用者の母国において最も多く使用されると考えられるためである。従って、補助情報が空である場合、利用者の母国語(例えば、韓国語)又はその文字(例えば、ハングル)について文字認識を行なうようにすればよい。
【0040】
辞書検索部45は、前述の辞書検索手段であって、文字列認識部44からメール検索データ150への文字列の格納を通知されると、当該文字列で辞書部51の辞書を検索して、その結果を得る。辞書検索部45は、辞書を検索した結果をメール検索データ150に格納し、この旨をメール作成部46に通知する。即ち、当該検索結果に基づいて、メール検索データ150において、その検索結果の数(の格納領域)に当該検索した結果の数nを格納し、結果#1〜結果#n(の格納領域)に当該検索した結果を格納する。当該検索した結果は、前述のように、辞書を検索した結果である辞書データを示すURLである。なお、検索の結果、該当するデータが存在しない場合、結果の数nに「0」が格納される。
【0041】
前述のように、辞書部51の辞書は、予め用意された1又は複数の辞書からなる。辞書は、例えば国語辞典、英和辞典、和英辞典、韓日(ハングル)辞典、中国語辞典、百科事典、料理辞典、植物図鑑、地図、人名辞典等、種々の辞書からなる。文字列のみでは、検索する辞書の数が多くなるので処理時間が長くなり、また、例えばアルファベットからなる文字列で国語辞典を検索しても正しい結果は得られない。そこで、補助情報が利用される。
【0042】
個々の辞書は、各項目毎の辞書データを、複数格納してなる。個々の辞書データは、図6(A)に示すように、キーワード、分野、概要、詳細(HTML文書)、URLからなる。キーワードは、当該辞書を引くためのキーであり、当該項目である文字列(単語)である。分野は、当該辞書がどの分野の辞書のデータであるかを示す。例えば、「日本語」又は「国語」であれば「国語辞典」のデータであることを示す。概要は、当該キーワードに対応する意味の概要である。詳細は、当該キーワードに対応する意味の詳細であり、例えばHTML形式で記述された説明文(HTML文書)である。URLは、当該説明文(のコピー)の存在するアドレスを示し、実際には、閲覧情報部52内において当該説明文の存在するアドレスを示す。
【0043】
この辞書検索処理において、辞書検索部45は、辞書検索に先立って、メール検索データ150の補助情報を参照して、これを用いて検索する分野を特定する。即ち、検索する辞書を特定する。検索する対象として特定される辞書の数は、1とは限らず、複数であってもよい。従って、検索の結果も(1又は)複数得られる場合がある。
【0044】
図2に示す例の場合、補助情報は「韓国」「韓国語」「ハングル」等であるから、韓日辞典が検索対象として特定される。そして、図5(D)に示す文字列をキーワードとして当該辞書を検索する。この結果、例えば、図6(B)に示すように、当該キーワードを持つ辞書データから、読み「サムゲタン」を含む概要「韓国の代表的なスープです。」と、詳細のHTML文書「一匹の鶏の・・・・の料理。」と、そのアドレスを示すURL#1とが取り出される。この検索結果に基づいて、メール検索データ150において、その検索結果の数に「1」を格納し、結果#1に概要「サムゲタン」及び「韓国の代表的なスープです。」とURL#1とを格納する。また、閲覧情報部52内において、当該URL#1に詳細のHTML文書「一匹の鶏の・・・・の料理。」のコピーが格納される。
【0045】
メール検索データ150の補助情報が予め用意された辞書の種類と異なる場合、辞書検索部45は、文字列認識部44と同様に、検索する辞書の特定において推論テーブルを用いた推論処理を行う。また、メール検索データ150の補助情報が空である場合にも、辞書検索部45は、文字列認識部44と同様に、当該補助情報に基づいて、検索すべき辞書は「国語辞典」であると判断する。
【0046】
メール作成部46は、周知の電子メール作成部であり、送信部32と共に前述の送信手段を構成し、辞書検索部45からメール検索データ150への検索結果等の格納を通知されると、当該メール検索データ150に基づいて応答200を作成する。メール作成部46は、作成した応答200を送信部32に送る。
【0047】
応答200の一例を図7に示す。応答200も、電子メール100と同様に、ヘッダ部202とボディ部203とからなる。ヘッダ部202は、送信元のメールアドレス、宛先のメールアドレス、題名を含む。送信元のメールアドレスは、当該応答200を送信する抽出検索装置3のメールアドレスである。宛先のメールアドレスは、当該応答200を受信する携帯電話1のメールアドレスである。ボディ部203は、本文、URL(URL#1)を含む。これらは、予め用意されたテンプレート250を利用して作成される。テンプレート250において、メール検索データ150の結果#1の概要「サムゲタン」が題名及び本文に対応する部分に嵌め込まれ、「韓国の代表的なスープです」が本文に対応する部分に嵌め込まれ、HTHL文書のURL#1が<詳細>に対応するように嵌め込まれる。メール検索データ150において結果#nまでが存在する場合、本文及びURLの組がn個作成される。
【0048】
メール検索データ150において結果の数nが「0」である場合、メール作成部46は、応答200としてエラーメッセージを作成する。エラーメッセージは、例えば、「サムゲタン」に代えて「判りませんでした」とされ、「韓国の代表・・・」に代えて「写真は対象物を真中に大きく写して下さい。補助情報を入れると認識率が上がります。」とされる。
【0049】
送信部32は、周知の電子メール送信部であり、メール作成部46と共に前述の送信手段を構成し、メール作成部46の作成した応答200を、インターネット2を介して、携帯電話1に送信する。携帯電話1は、これをそのインターネット通信部12で受信し、当該応答200の内容を表示画面13に表示する。応答200の表示の一例を図8(A)に示す。これを見た携帯電話1の利用者は、詳細を知りたければ、<詳細>を選択する(クリックする)。
【0050】
これに応じて、携帯電話1は、<詳細>に対応して埋め込まれているURL(URL#1)により、抽出検索装置3のWebサーバ33にアクセスする。アクセスされたWebサーバ33は、閲覧情報部52の中から当該URL#1の情報「一匹の鶏の・・・・の料理。」を取り出して、携帯電話1に返信する。携帯電話1は、これを受信してその内容を表示画面13に表示する。当該URLの情報の表示の一例を図8(B)に示す。これにより、図2に示す看板を撮影するのみで、その概略及び詳細な意味を知ることができる。なお、実際には、図8(B)に示すように、当該URL#1の情報に加えて、当該文字列の概要の中の読み(例えば、サムゲタン)も同時に表示される。Webサーバ33に多くのアクセスが集中する場合、Webサーバ33を複数設けて、これらで分散処理を行なうようにしてもよい。
【0051】
図9は、辞書検索結果受信処理フローであり、携帯電話1における辞書検索結果受信処理を示す。
【0052】
携帯電話1が、そのカメラ11で撮影した写真の画像を添付した図2に示すような電子メール100をインターネット通信部12で作成して、抽出検索装置3に送信する(ステップS11)。従って、インターネット通信部12は、抽出検索装置3における受信部31、メール解析部41、メール作成部46、送信部32と同様の機能を備えると考えてよい。この後、携帯電話1が、抽出検索装置3から応答200を受信して、図8(A)に示すように、これを表示画面13に表示する(ステップS12)。これを見た携帯電話1の利用者が当該画面の<詳細>を選択すると、携帯電話1が、当該URLにより抽出検索装置3のWebサーバ33にアクセスする(ステップS13)。この後、携帯電話1が、Webサーバ33から当該URLの内容を受信して、図8(B)に示すように、これを表示画面13に表示する(ステップS14)。
【0053】
図10は、抽出文字列辞書検索処理フローであり、本発明の抽出検索装置3における抽出文字列辞書検索処理を示す。
【0054】
抽出検索装置3において、受信部31が携帯電話1から当該携帯電話1で撮影した画像101を含む電子メール100を受信する(ステップS21)。この電子メール100をメール解析部41が解析して、画像101を含むメール検索データ150を作成する(ステップS22)。この後、画像解析部42が、メール検索データ150の画像101を解析して、文字列を含む1又は複数の部分画像を抽出し(ステップS23)、部分画像が複数存在する場合、対象特定部43がその中から文字認識の処理対象を特定する(ステップS24)。この後、文字列認識部44が、補助情報により文字認識の文字又は言語を特定した上で、文字認識の処理対象について文字認識処理を行なって文字列を得ると(ステップS25)、辞書検索部45が、補助情報により辞書を特定した上で、前記文字列を用いて辞書を検索してその結果を得る(ステップS26)。この検索の結果に基づいて、メール作成部46が応答200を作成して(ステップS27)、送信部32が応答200を辞書の検索の結果として、携帯電話1に送信する(ステップS28)。
【0055】
図11は、抽出文字列辞書検索処理フローであり、本発明の抽出検索装置3における処理を示す。
【0056】
抽出検索装置3において、Webサーバ33が携帯電話1からURLを受信(HTTPを受信)すると(ステップS31)、閲覧情報部52の中から当該URLの情報を取り出して、携帯電話1に返信(HTTPで結果送信)する(ステップS32)。
【0057】
以上、本発明をその実施の態様に従って説明したが、本発明は、その主旨の範囲内において、種々の変形が可能である。
【0058】
例えば、応答200において、どの電子メール100に対する回答であるかを判りやすくするために、当該電子メール100に含まれていた画像101を添付するようにしてもよい。また、画像101に代えて、文字認識の処理対象となった部分画像を添付するようにしてもよい。また、抽出検索装置3を複数のサーバで構成するようにしてもよい。例えば、送受信サーバで電子メール100を受信し応答200を送信し、画像処理サーバで電子メール100から画像101を取り出して更に部分画像を抽出し、文字認識処理サーバで部分画像から文字列を抽出し、辞書検索サーバで文字列により辞書を検索するようにしてもよい。
【0059】
以上から判るように、本発明の実施の形態の特徴を列記すると、以下の通りである。
(付記1) カメラ付き携帯情報端末から当該カメラ付き携帯情報端末で撮影した画像を受信する受信手段と、
前記画像を解析して文字列を含む1又は複数の部分画像を抽出し、前記部分画像の中から文字認識の処理対象を特定する画像解析対象特定手段と、
前記文字認識の処理対象について文字認識を行なって文字列を得る文字列認識手段と、
予め用意された1又は複数の辞書と、
前記文字列で前記辞書を検索してその結果を得る辞書検索手段と、
前記辞書の検索の結果に基づいて応答を作成して前記カメラ付き携帯情報端末に送信する送信手段とを備える
ことを特徴とする抽出文字列辞書検索装置。
(付記2)前記画像解析対象特定手段が、前記画像から同色又は同明度の背景で囲まれた領域を部分画像として抽出する
ことを特徴とする付記1に記載の抽出文字列辞書検索装置。
(付記3)前記画像解析対象特定手段が、複数の部分画像を抽出した場合、当該複数の部分画像の中から前記画像の中央よりの部分画像又は大きな部分画像を、前記文字認識の処理対象として特定する
ことを特徴とする付記1に記載の抽出文字列辞書検索装置。
(付記4)前記辞書は、キーワード毎に、その分野、概要、詳細情報、URLからなる辞書データを格納する
ことを特徴とする付記1に記載の抽出文字列辞書検索装置。
(付記5)前記受信手段が前記カメラ付き携帯情報端末から前記画像と共に補助情報を受信し、
前記辞書検索手段が、前記補助情報に基づいて、検索する辞書を特定する
ことを特徴とする付記1に記載の抽出文字列辞書検索装置。
(付記6)前記受信手段が前記カメラ付き携帯情報端末から前記画像と共に補助情報を受信しない場合、前記辞書検索手段が、検索する辞書を国語辞典と特定する
ことを特徴とする付記5に記載の抽出文字列辞書検索装置。
(付記7)前記補助情報が、前記画像解析対象特定手段が、複数の部分画像を抽出した場合、複数の部分画像の中から文字認識の処理対象とする1個の文字列を特定するための参考情報となる位置情報、色情報、大きさ情報からなる
ことを特徴とする付記5に記載の抽出文字列辞書検索装置。
(付記8)前記補助情報が、インターネットを介してアクセスしてWebページ検索の結果を得ることを指示する情報からなる
ことを特徴とする付記5に記載の抽出文字列辞書検索装置。
(付記9) カメラ付き携帯情報端末から当該カメラ付き携帯情報端末で撮影した画像を受信し、
前記画像を解析して文字列を含む1又は複数の部分画像を抽出し、前記部分画像の中から文字認識の処理対象を特定し、
前記文字認識の処理対象について文字認識を行なって文字列を得て、
前記文字列で予め用意された1又は複数の辞書を検索してその結果を得て、
前記辞書の検索の結果に基づいて応答を作成して前記カメラ付き携帯情報端末に送信する
ことを特徴とする抽出文字列辞書検索方法。
(付記10) カメラ付き携帯情報端末と、
前記カメラ付き携帯情報端末とネットワークを介して接続された抽出文字列辞書検索装置とからなり、
前記抽出文字列辞書検索装置は、更に、
前記カメラ付き携帯情報端末から当該カメラ付き携帯情報端末で撮影した画像を受信する受信手段と、
前記画像を解析して文字列を含む1又は複数の部分画像を抽出し、前記部分画像の中から文字認識の処理対象を特定する画像解析対象特定手段と、
前記文字認識の処理対象について文字認識を行なって文字列を得る文字列認識手段と、
予め用意された1又は複数の辞書と、
前記文字列で前記辞書を検索してその結果を得る辞書検索手段と、
前記辞書の検索の結果に基づいて応答を作成して前記カメラ付き携帯情報端末に送信する送信手段とを備える
ことを特徴とする抽出文字列辞書検索システム。
(付記11)カメラ付き携帯情報端末とネットワークを介して接続された抽出文字列辞書検索装置において抽出文字列辞書検索処理を実行するプログラムであって、
前記プログラムは、コンピュータに、
カメラ付き携帯情報端末から当該カメラ付き携帯情報端末で撮影した画像を受信させ、
前記画像を解析して文字列を含む1又は複数の部分画像を抽出させ、前記部分画像の中から文字認識の処理対象を特定させ、
前記文字認識の処理対象について文字認識を行なって文字列を得させ、
前記文字列で予め用意された1又は複数の辞書を検索させ、
前記辞書の検索の結果に基づいて応答を作成して前記カメラ付き携帯情報端末に送信させる
ことを特徴とする抽出文字列辞書検索プログラム。
(付記12)カメラ付き携帯情報端末とネットワークを介して接続された抽出文字列辞書検索装置において抽出文字列辞書検索処理を実行するプログラムを記録するコンピュータ読取可能な記録媒体であって、
前記プログラムは、コンピュータに、
カメラ付き携帯情報端末から当該カメラ付き携帯情報端末で撮影した画像を受信させ、
前記画像を解析して文字列を含む1又は複数の部分画像を抽出させ、前記部分画像の中から文字認識の処理対象を特定させ、
前記文字認識の処理対象について文字認識を行なって文字列を得させ、
前記文字列で予め用意された1又は複数の辞書を検索させ、
前記辞書の検索の結果に基づいて応答を作成して前記カメラ付き携帯情報端末に送信させる
ことを特徴とする抽出文字列辞書検索プログラム記録媒体。
【0060】
【発明の効果】
本発明によれば、抽出文字列辞書検索装置及び方法において、カメラ付き携帯情報端末で知りたい単語(文字列)の写真(画像)を撮影して送信するのみで、その単語の意味等を応答として得ることができるので、電子辞書のように知りたい分野の電子辞書を持ち歩く必要がなく、単語を入力する(電子辞書を引く)手間も必要なく、辞書の使い方を知っている必要もない。また、文字入力の必要がないので、入力の手間を不要にでき、誤入力もなく、入力できない文字についてもその意味を知ることができる。
【0061】
また、本発明によれば、抽出文字列辞書検索プログラムは、フレキシブルディスク、CD−ROM、CD−R/W、DVD等のコンピュータ読取可能な記録媒体に格納して提供することができるので、前述の抽出文字列辞書検索装置及び方法を容易に実現することができる。
【図面の簡単な説明】
【図1】抽出文字列辞書検索システム及びカメラ付き携帯情報端末構成図である。
【図2】電子メールの一例を示す図である。
【図3】抽出文字列辞書検索装置構成図である。
【図4】電子メールの一例を示す図である。
【図5】メール検索データの一例、部分画像の一例、文字列の一例を示す図である。
【図6】辞書データ、メール検索データの一例を示す図である。
【図7】応答の一例を示す図である。
【図8】応答の表示の一例、URLの情報の表示の一例を示す図である。
【図9】辞書検索結果受信処理フローであり、カメラ付き携帯情報端末における辞書検索結果受信処理を示す。
【図10】抽出文字列辞書検索処理フローであり、抽出文字列辞書検索装置における抽出文字列辞書検索処理を示す。
【図11】抽出文字列辞書検索処理フローであり、抽出文字列辞書検索装置における処理を示す。
【符号の説明】
3   抽出文字列辞書検索装置
31  受信部
32  送信部
33  Web閲覧部(Webサーバ)
34  抽出文字列辞書検索処理部
35  辞書記憶部
41  メール解析部
42  画像解析部
43  対象特定部
44  文字列認識部
45  辞書検索部
46  メール作成部
51  辞書部
52  閲覧情報部

Claims (6)

  1. カメラ付き携帯情報端末から当該カメラ付き携帯情報端末で撮影した画像を受信する受信手段と、
    前記画像を解析して文字列を含む1又は複数の部分画像を抽出し、前記部分画像の中から文字認識の処理対象を特定する画像解析対象特定手段と、
    前記文字認識の処理対象について文字認識を行なって文字列を得る文字列認識手段と、
    予め用意された1又は複数の辞書と、
    前記文字列で前記辞書を検索してその結果を得る辞書検索手段と、
    前記辞書の検索の結果に基づいて応答を作成して前記カメラ付き携帯情報端末に送信する送信手段とを備える
    ことを特徴とする抽出文字列辞書検索装置。
  2. 前記画像解析対象特定手段が、前記画像から同色又は同明度の背景で囲まれた領域を部分画像として抽出する
    ことを特徴とする請求項1に記載の抽出文字列辞書検索装置。
  3. 前記画像解析対象特定手段が、複数の部分画像を抽出した場合、当該複数の部分画像の中から前記画像の中央よりの部分画像又は大きな部分画像を、前記文字認識の処理対象として特定する
    ことを特徴とする請求項1に記載の抽出文字列辞書検索装置。
  4. 前記受信手段が前記カメラ付き携帯情報端末から前記画像と共に補助情報を受信し、
    前記辞書検索手段が、前記補助情報に基づいて、検索する辞書を特定する
    ことを特徴とする請求項1に記載の抽出文字列辞書検索装置。
  5. カメラ付き携帯情報端末から当該カメラ付き携帯情報端末で撮影した画像を受信し、
    前記画像を解析して文字列を含む1又は複数の部分画像を抽出し、前記部分画像の中から文字認識の処理対象を特定し、
    前記文字認識の処理対象について文字認識を行なって文字列を得て、
    前記文字列で予め用意された1又は複数の辞書を検索してその結果を得て、
    前記辞書の検索の結果に基づいて応答を作成して前記カメラ付き携帯情報端末に送信する
    ことを特徴とする抽出文字列辞書検索方法。
  6. カメラ付き携帯情報端末とネットワークを介して接続された抽出文字列辞書検索装置において抽出文字列辞書検索処理を実行するプログラムであって、
    前記プログラムは、コンピュータに、
    カメラ付き携帯情報端末から当該カメラ付き携帯情報端末で撮影した画像を受信させ、
    前記画像を解析して文字列を含む1又は複数の部分画像を抽出させ、前記部分画像の中から文字認識の処理対象を特定させ、
    前記文字認識の処理対象について文字認識を行なって文字列を得させ、
    前記文字列で予め用意された1又は複数の辞書を検索させ、
    前記辞書の検索の結果に基づいて応答を作成して前記カメラ付き携帯情報端末に送信させる
    ことを特徴とする抽出文字列辞書検索プログラム。
JP2002276833A 2002-09-24 2002-09-24 抽出文字列辞書検索装置及び方法並びにプログラム Expired - Fee Related JP4116852B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002276833A JP4116852B2 (ja) 2002-09-24 2002-09-24 抽出文字列辞書検索装置及び方法並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002276833A JP4116852B2 (ja) 2002-09-24 2002-09-24 抽出文字列辞書検索装置及び方法並びにプログラム

Publications (2)

Publication Number Publication Date
JP2004118281A true JP2004118281A (ja) 2004-04-15
JP4116852B2 JP4116852B2 (ja) 2008-07-09

Family

ID=32272607

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002276833A Expired - Fee Related JP4116852B2 (ja) 2002-09-24 2002-09-24 抽出文字列辞書検索装置及び方法並びにプログラム

Country Status (1)

Country Link
JP (1) JP4116852B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006085461A (ja) * 2004-09-16 2006-03-30 Casio Hitachi Mobile Communications Co Ltd 情報処理装置、情報処理方法及び情報処理プログラム
WO2008056589A1 (fr) * 2006-11-07 2008-05-15 Lab. At-Site, Ltd. Système de présentation d'images utilisant un réseau de communication
JP2010134968A (ja) * 2010-03-16 2010-06-17 Casio Computer Co Ltd 情報表示制御装置及びプログラム
JP2015072533A (ja) * 2013-10-02 2015-04-16 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP2020154606A (ja) * 2019-03-19 2020-09-24 富士ゼロックス株式会社 情報処理装置及びプログラム
KR20210047618A (ko) * 2019-10-22 2021-04-30 류승완 텍스트 검색을 이용한 지도 정보 제공 장치 및 그 방법

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006085461A (ja) * 2004-09-16 2006-03-30 Casio Hitachi Mobile Communications Co Ltd 情報処理装置、情報処理方法及び情報処理プログラム
WO2008056589A1 (fr) * 2006-11-07 2008-05-15 Lab. At-Site, Ltd. Système de présentation d'images utilisant un réseau de communication
JP2010134968A (ja) * 2010-03-16 2010-06-17 Casio Computer Co Ltd 情報表示制御装置及びプログラム
JP2015072533A (ja) * 2013-10-02 2015-04-16 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP2020154606A (ja) * 2019-03-19 2020-09-24 富士ゼロックス株式会社 情報処理装置及びプログラム
JP7293764B2 (ja) 2019-03-19 2023-06-20 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
KR20210047618A (ko) * 2019-10-22 2021-04-30 류승완 텍스트 검색을 이용한 지도 정보 제공 장치 및 그 방법
KR102271720B1 (ko) * 2019-10-22 2021-07-01 류승완 텍스트 검색을 이용한 지도 정보 제공 장치 및 그 방법

Also Published As

Publication number Publication date
JP4116852B2 (ja) 2008-07-09

Similar Documents

Publication Publication Date Title
US7707039B2 (en) Automatic modification of web pages
US7305435B2 (en) Internet access via smartphone camera
US8005831B2 (en) System and methods for creation and use of a mixed media environment with geographic location information
US6564254B1 (en) System and a process for specifying a location on a network
CN101061478B (zh) 用于识别web文档的方法和系统
US8195659B2 (en) Integration and use of mixed media documents
US20110218018A1 (en) Techniques for Retrieving Documents Using an Image Capture Device
JP2009295153A (ja) ウェブベースのテキスト検出方法及びシステム
JPH08305731A (ja) 文書格納等の方法及び文書サーバ
US7770112B2 (en) Data conversion method and apparatus to partially hide data
JP2010072842A (ja) 画像処理装置および画像処理方法
JP6239045B2 (ja) 検索対象のタイプをインタラクティブに表示する検索サービス提供方法及び装置
US20150363381A1 (en) Template management apparatus, non-transitory computer readable medium, and template management method
US9881001B2 (en) Image processing device, image processing method and non-transitory computer readable recording medium
EP1312039A2 (en) System and method for automatic preparation and searching of scanned documents
JP2010217996A (ja) 文字認識装置、文字認識プログラム、および文字認識方法
US20060167899A1 (en) Meta-data generating apparatus
RU2698405C2 (ru) Способ поиска в базе данных
JP4116852B2 (ja) 抽出文字列辞書検索装置及び方法並びにプログラム
JP2011165092A (ja) 文書画像関連情報提供装置、及び文書画像関連情報取得システム
KR20060116114A (ko) 광학 문자 판독을 이용한 문서 검색 및 텍스트 정보 추출시스템 및 그 방법
JP2004157668A (ja) 検索システム、検索方法および検索プログラム
JP2000020549A (ja) 文書データベースシステムへの入力支援装置
WO2009104193A1 (en) Provisioning of media objects associated with printed documents
JP5721052B2 (ja) 画像処理装置およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050603

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080328

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080415

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080418

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140425

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees