JP2015072533A - Information processing apparatus and information processing program - Google Patents

Information processing apparatus and information processing program Download PDF

Info

Publication number
JP2015072533A
JP2015072533A JP2013206926A JP2013206926A JP2015072533A JP 2015072533 A JP2015072533 A JP 2015072533A JP 2013206926 A JP2013206926 A JP 2013206926A JP 2013206926 A JP2013206926 A JP 2013206926A JP 2015072533 A JP2015072533 A JP 2015072533A
Authority
JP
Japan
Prior art keywords
character
character string
candidate
display
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013206926A
Other languages
Japanese (ja)
Other versions
JP6187108B2 (en
Inventor
木村 俊一
Shunichi Kimura
俊一 木村
関野 雅則
Masanori Sekino
雅則 関野
越 裕
Yutaka Koshi
裕 越
裕一 大根田
Yuichi Oneda
裕一 大根田
渡辺 美樹
Miki Watanabe
美樹 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2013206926A priority Critical patent/JP6187108B2/en
Publication of JP2015072533A publication Critical patent/JP2015072533A/en
Application granted granted Critical
Publication of JP6187108B2 publication Critical patent/JP6187108B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an information processing apparatus that performs, when a display character string included in an image is recognized, processing corresponding to the display character string.SOLUTION: An information processing apparatus includes reception means for receiving a result of character recognition, storage means for storing the display character string and processing information in association with each other, search means for searching for the display character string in the result of the character recognition, extraction means for extracting, when the search means has successfully searched the display character string in the result of the character recognition, processing information corresponding to the display character string from the storage means, and processing means for performing processing on the basis of the processing information extracted by the extraction means.

Description

本発明は、情報処理装置及び情報処理プログラムに関する。   The present invention relates to an information processing apparatus and an information processing program.

特許文献1には、印刷物に記載されたURIを読み取ってインターネットのWWWサーバから該当するコンテンツを取得し表示する携帯型情報端末装置を提供することを課題とし、人が片手で把持できる程度のサイズの情報端末装置の上面には、表示装置、操作スイッチ、実行ボタン、スピーカ、アンテナ、読み取り開始ボタンが設けられ、底面にはスキャナ用の読み取り窓が設けられ、印刷物上のURIを含むエリアの画像を、読み取り窓を通じて内部のスキャナで読み取ると、その画像中からURIが抽出され、内蔵のブラウザが起動され、ブラウザは無線通信回線によって接続されるプロバイダー経由でURIに対応するコンテンツをインターネット上のWWWサーバから取得し、表示装置に表示することが開示されている。   Patent Document 1 has an object of providing a portable information terminal device that reads a URI described in a printed matter and acquires and displays the corresponding content from an Internet WWW server, and is of a size that can be grasped with one hand. A display device, an operation switch, an execution button, a speaker, an antenna, and a reading start button are provided on the top surface of the information terminal device, and a reading window for a scanner is provided on the bottom surface, and an image of an area including a URI on the printed material. Is read by the internal scanner through the reading window, the URI is extracted from the image, the built-in browser is activated, and the browser transmits the content corresponding to the URI via the provider connected by the wireless communication line on the Internet. Obtaining from a server and displaying on a display device is disclosed.

特許文献2には、操作に不慣れな者でも、所定のアプリケーションプログラムを迅速かつ確実に起動できるようにすることを課題とし、例えば、ワードプロセッサプログラムの名称として「三太郎」、その後に「.」で区切られて三太郎で開く(処理を開始するためにデータを取り込む)べきファイル名として「特許明細書」と印刷されたカード状のオブジェクトのように、所定のアプリケーションプログラムの名称と、その引数が印刷されたカード状のオブジェクトをCCDビデオカメラにより撮像させ、パーソナルコンピュータは、CCDビデオカメラにより撮像された画像データを文字認識処理し、認識した結果得られた文字の名称のアプリケーションプログラムを起動させた後、引数として認識されたファイル名のデータ取り込みやオプション設定などの操作を自動的に実行させることが開示されている。   Japanese Patent Laid-Open No. 2004-26883 has a problem that even a person unfamiliar with the operation can quickly and surely start a predetermined application program. The name of a given application program and its arguments are printed, such as a card-like object that is printed as “patent specification” as the file name to be opened by Santaro (capture data to start processing). After the card-like object is imaged by the CCD video camera, the personal computer performs character recognition processing on the image data imaged by the CCD video camera, and after starting the application program of the character name obtained as a result of recognition, Import data of recognized file names as arguments Causing operations such descriptions set automatically executed is disclosed.

特許文献3には、インターネットを簡単に利用することができるようにすることを課題とし、世界規模で広がるインターネット上の情報ソースを一意に特定するURLが印刷されているカード状のオブジェクトをCCDビデオカメラに撮像させ、パーソナルコンピュータは、CCDビデオカメラにより撮像された画像データから文字認識処理によりURLを認識すると、インターネットブラウザを起動した後、文字認識して得られたURLに自動的にアクセスして、情報を表示することが開示されている。   In Patent Document 3, it is an object to make it easy to use the Internet, and a card-like object on which a URL for uniquely specifying an information source on the Internet spreading worldwide is printed as a CCD video. When the personal computer recognizes the URL by image recognition processing from the image data captured by the CCD video camera, the personal computer automatically accesses the URL obtained by character recognition after starting the Internet browser. Displaying information is disclosed.

特開2001−184141号公報JP 2001-184141 A 特開2000−207485号公報JP 2000-207485 A 特開2000−207338号公報JP 2000-207338 A

本発明は、画像内に含まれている表示文字列が認識された場合に、その表示文字列に対応する処理を行うようにした情報処理装置及び情報処理プログラムを提供することを目的としている。   An object of the present invention is to provide an information processing apparatus and an information processing program that perform processing corresponding to a display character string when a display character string included in an image is recognized.

かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、文字認識結果を受け付ける受付手段と、表示文字列と処理情報を対応させて記憶する記憶手段と、前記文字認識結果内から前記表示文字列を検索する検索手段と、前記検索手段によって前記文字認識結果内から前記表示文字列が検索できた場合は、前記記憶手段から該表示文字列に対応する処理情報を抽出する抽出手段と、前記抽出手段によって抽出された処理情報に基づいて、処理を行う処理手段を具備することを特徴とする情報処理装置である。
The gist of the present invention for achieving the object lies in the inventions of the following items.
The invention of claim 1 is a receiving means for receiving a character recognition result, a storage means for storing a display character string and processing information in association with each other, a search means for searching for the display character string from the character recognition result, When the display character string can be searched from the character recognition result by the search means, the extraction means for extracting the processing information corresponding to the display character string from the storage means, and the processing information extracted by the extraction means An information processing apparatus comprising processing means for performing processing based on the information processing apparatus.

請求項2の発明は、前記文字認識結果内から前記表示文字列としての候補を検索する候補検索手段をさらに具備し、前記検索手段は、前記候補検索手段によって検索された候補内から前記表示文字列を検索することを特徴とする請求項1に記載の情報処理装置である。   The invention of claim 2 further includes candidate search means for searching for candidates as the display character string from the character recognition result, wherein the search means displays the display character from the candidates searched by the candidate search means. The information processing apparatus according to claim 1, wherein a column is searched.

請求項3の発明は、前記候補検索手段における前記候補は、前記表示文字列の一部又は全てを示す正規表現で記載された情報であり、前記候補検索手段は、前記文字認識結果に対して、前記候補の正規表現検索を行うことによって検索することを特徴とする請求項2に記載の情報処理装置である。   According to a third aspect of the present invention, the candidate in the candidate search means is information described in a regular expression indicating a part or all of the display character string, and the candidate search means The information processing apparatus according to claim 2, wherein a search is performed by performing a regular expression search for the candidate.

請求項4の発明は、前記候補検索手段における前記候補は、表示文字が存在する位置の範囲を示す情報であり、前記文字認識結果には、各文字の位置が含まれており、前記候補検索手段は、前記文字認識結果に対して、認識文字の位置が前記候補の範囲に該当するものを抽出することによって検索することを特徴とする請求項2又は3に記載の情報処理装置である。   According to a fourth aspect of the present invention, the candidate in the candidate search means is information indicating a range of positions where display characters exist, and the character recognition result includes a position of each character, and the candidate search The information processing apparatus according to claim 2 or 3, wherein the means searches the character recognition result by extracting a character whose recognized character position falls within the candidate range.

請求項5の発明は、前記候補検索手段における前記候補は、表示文字の大きさの範囲を示す情報であり、前記文字認識結果には、各文字の大きさが含まれており、前記候補検索手段は、前記文字認識結果に対して、認識文字の大きさが前記候補の範囲に該当するものを抽出することによって検索することを特徴とする請求項2から4のいずれか一項に記載の情報処理装置である。   According to a fifth aspect of the present invention, the candidate in the candidate search means is information indicating a range of display character size, and the character recognition result includes the size of each character, and the candidate search 5. The method according to claim 2, wherein the means searches the character recognition result by extracting a character whose recognized character size corresponds to the candidate range. 6. Information processing apparatus.

請求項6の発明は、前記候補検索手段における前記候補は、表示文字の色の範囲を示す情報であり、前記文字認識結果には、各文字の色が含まれており、前記候補検索手段は、前記文字認識結果に対して、認識文字の色が前記候補の範囲に該当するものを抽出することによって検索することを特徴とする請求項2から5のいずれか一項に記載の情報処理装置である。   According to a sixth aspect of the present invention, the candidate in the candidate search means is information indicating a color range of display characters, and the character recognition result includes a color of each character. The information processing apparatus according to claim 2, wherein the character recognition result is searched by extracting a character whose color corresponds to the candidate range. It is.

請求項7の発明は、コンピュータを、文字認識結果を受け付ける受付手段と、表示文字列と処理情報を対応させて記憶する記憶手段と、前記文字認識結果内から前記表示文字列を検索する検索手段と、前記検索手段によって前記文字認識結果内から前記表示文字列が検索できた場合は、前記記憶手段から該表示文字列に対応する処理情報を抽出する抽出手段と、前記抽出手段によって抽出された処理情報に基づいて、処理を行う処理手段として機能させるための情報処理プログラムである。   The invention of claim 7 is a computer for receiving a character recognition result, a storage unit for storing a display character string and processing information in association with each other, and a search unit for searching for the display character string from the character recognition result. And when the display character string can be searched from within the character recognition result by the search means, an extraction means for extracting processing information corresponding to the display character string from the storage means, and an extraction means extracted by the extraction means It is an information processing program for functioning as a processing means for performing processing based on processing information.

請求項1の情報処理装置によれば、画像内に含まれている表示文字列が認識された場合に、その表示文字列に対応する処理を行うことができる。   According to the information processing apparatus of the first aspect, when a display character string included in the image is recognized, a process corresponding to the display character string can be performed.

請求項2の情報処理装置によれば、本構成を有していない場合に比較して、表示文字列に対応する処理情報を高速に検索することができる。   According to the information processing apparatus of the second aspect, the processing information corresponding to the display character string can be searched at a higher speed than in the case where the present configuration is not provided.

請求項3の情報処理装置によれば、文字認識結果に対して、正規表現検索を行うことによって検索対象を少なくすることができる。   According to the information processing apparatus of the third aspect, it is possible to reduce the number of search objects by performing a regular expression search on the character recognition result.

請求項4の情報処理装置によれば、文字認識結果に対して、認識文字の位置が候補の範囲に該当するものを抽出することによって検索対象を少なくすることができる。   According to the information processing apparatus of the fourth aspect, it is possible to reduce the number of search objects by extracting the character recognition result whose position of the recognized character falls within the candidate range.

請求項5の情報処理装置によれば、文字認識結果に対して、認識文字の大きさが候補の範囲に該当するものを抽出することによって検索対象を少なくすることができる。   According to the information processing apparatus of the fifth aspect, it is possible to reduce the number of search objects by extracting the character recognition result whose character size corresponds to the candidate range.

請求項6の情報処理装置によれば、文字認識結果に対して、認識文字の色が候補の範囲に該当するものを抽出することによって検索対象を少なくすることができる。   According to the information processing apparatus of the sixth aspect, it is possible to reduce the number of search objects by extracting the character recognition result whose color of the recognized character falls within the candidate range.

請求項7の情報処理プログラムによれば、画像内に含まれている表示文字列が認識された場合に、その表示文字列に対応する処理を行うことができる。   According to the information processing program of the seventh aspect, when a display character string included in the image is recognized, a process corresponding to the display character string can be performed.

第1の実施の形態の構成例についての概念的なモジュール構成図である。It is a conceptual module block diagram about the structural example of 1st Embodiment. 第1の実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by 1st Embodiment. 第1の実施の形態が対象とするテキスト列の例を示す説明図である。It is explanatory drawing which shows the example of the text string which 1st Embodiment makes object. 表示文字列・コマンドテーブルのデータ構造例を示す説明図である。It is explanatory drawing which shows the example of a data structure of a display character string and command table. 第2の実施の形態の構成例についての概念的なモジュール構成図である。It is a conceptual module block diagram about the structural example of 2nd Embodiment. 第2の実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by 2nd Embodiment. 第2の実施の形態が対象とするテキスト列の例を示す説明図である。It is explanatory drawing which shows the example of the text string which 2nd Embodiment makes object. 表示文字列・コマンドテーブルのデータ構造例を示す説明図である。It is explanatory drawing which shows the example of a data structure of a display character string and command table. 第3実施の形態の構成例についての概念的なモジュール構成図である。It is a notional module block diagram about the structural example of 3rd Embodiment. 第3の実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by 3rd Embodiment. 第3の実施の形態による処理例を示す説明図である。It is explanatory drawing which shows the process example by 3rd Embodiment. カメラ付携帯情報端末が文書を撮影する例を示す説明図である。It is explanatory drawing which shows the example which a portable information terminal with a camera image | photographs a document. 画像における座標系の例を示す説明図である。It is explanatory drawing which shows the example of the coordinate system in an image. 文字位置座標の例を示す説明図である。It is explanatory drawing which shows the example of a character position coordinate. 文字候補位置情報の例を示す説明図である。It is explanatory drawing which shows the example of character candidate position information. 第4の実施の形態の構成例についての概念的なモジュール構成図である。It is a notional module block diagram about the structural example of 4th Embodiment. 第4の実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by 4th Embodiment. 第5の実施の形態の構成例についての概念的なモジュール構成図である。It is a notional module block diagram about the structural example of 5th Embodiment. 第5の実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by 5th Embodiment. 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。It is a block diagram which shows the hardware structural example of the computer which implement | achieves this Embodiment.

まず、本実施の形態を説明する前に、その前提となる技術について説明する。なお、この説明は、本実施の形態の理解を容易にすることを目的とするものである。
例えば、特許文献1に記載の技術では、PDA(Personal Digital Assistants)、PC(Personal Computer)付属カメラで、画像を撮影し、その画像内の文字を認識し、画像内に記載されているURL(Uniform Resource Locator、なお、URI:Uniform Resource Identifierを含む)を抽出する。予め「http://」等のキーワードを登録しておき、キーワードで開始する文字列を抽出する。そして、認識したURL(URI)をwebブラウザで自動表示する。
また、例えば、特許文献2に記載の技術では、PDA、PC付属カメラで、画像を撮影し、その画像内の文字を認識し、画像内に記載されているコマンドを抽出する。例えば、予め「ワードプロセッサ」という単語をコマンド名として登録しておき、文字認識結果が登録してあるコマンド名と合致すれば、コマンドとして抽出する。そして、コマンドの次の文字列を引数として抽出し、コマンドと引数を用いて、アプリケーション(コンピュータ・プログラム)を起動する。例えば、コマンドが「ワードプロセッサ」、引数が「文書」である場合、「ワードプロセッサ」というアプリケーションを起動して、「文書」を開くことになる。
これらの技術では、画像内にURLやコマンド名がそのまま記載されているときのみ、webブラウザ等のコマンドを自動起動させることができるものである。
文書にURLを直接記載すると、画像としては煩雑となってしまい、デザイン性が失われる場合が多い。例えば、URLには、意味の無い英数字の長い文字列が記載されていることが多く、見た目が美しくない。
また、画像自体は変更せずに、URLやコマンドのみを変更したい場合がある。そのため、URLやコマンドを変更しようとすると、チラシ、カタログなどの文書のデザインを変更しなければならなくなる。デザインは時間とコストをかけて作成されているものであり、簡単に変更できない。そのため、URLやコマンドが簡単に変更できないという問題点がある。
従来技術では、文字認識を行ったテキスト列の中からURLやコマンドの検索が簡単にできることを前提としている。例えば、登録したURLやコマンドの種類が莫大である場合に、その検索に時間がかかることとなる。登録したURLやコマンド数がNの場合、N回の検索をテキスト列に対して掛けないといけなくなる。Nが大きな数である場合には、現実的な時間で終了しなくなる。
First, before explaining the present embodiment, a technique that is a premise thereof will be described. This description is intended to facilitate understanding of the present embodiment.
For example, in the technique described in Patent Document 1, an image is captured with a PDA (Personal Digital Assistants) or PC (Personal Computer) attached camera, characters in the image are recognized, and a URL ( Uniform Resource Locator (including URI: Uniform Resource Identifier)). A keyword such as “http: //” is registered in advance, and a character string starting with the keyword is extracted. The recognized URL (URI) is automatically displayed by a web browser.
Further, for example, in the technique described in Patent Document 2, an image is taken with a PDA or PC-attached camera, characters in the image are recognized, and a command described in the image is extracted. For example, the word “word processor” is registered in advance as a command name, and if the character recognition result matches the registered command name, it is extracted as a command. Then, the character string next to the command is extracted as an argument, and an application (computer program) is started using the command and the argument. For example, when the command is “word processor” and the argument is “document”, an application “word processor” is started to open “document”.
In these techniques, a command such as a web browser can be automatically activated only when a URL or a command name is described as it is in an image.
If the URL is directly described in the document, the image becomes complicated and the design is often lost. For example, a long string of meaningless alphanumeric characters is often described in the URL, and the appearance is not beautiful.
In some cases, it is desired to change only the URL and the command without changing the image itself. Therefore, if the URL or command is to be changed, the design of a document such as a flyer or a catalog must be changed. Designs are time-consuming and costly and cannot be changed easily. Therefore, there is a problem that the URL and the command cannot be easily changed.
The prior art is based on the premise that URLs and commands can be easily retrieved from a text string that has been subjected to character recognition. For example, when the number of registered URLs and commands is enormous, the search takes time. If the number of registered URLs and commands is N, N searches must be performed on the text string. When N is a large number, it does not end in a realistic time.

以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
<第1の実施の形態>
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
Hereinafter, examples of various preferred embodiments for realizing the present invention will be described with reference to the drawings.
<First Embodiment>
FIG. 1 is a conceptual module configuration diagram of a configuration example according to the first embodiment.
The module generally refers to components such as software (computer program) and hardware that can be logically separated. Therefore, the module in the present embodiment indicates not only a module in a computer program but also a module in a hardware configuration. Therefore, the present embodiment is a computer program for causing these modules to function (a program for causing a computer to execute each procedure, a program for causing a computer to function as each means, and a function for each computer. This also serves as an explanation of the program and system and method for realizing the above. However, for the sake of explanation, the words “store”, “store”, and equivalents thereof are used. However, when the embodiment is a computer program, these words are stored in a storage device or stored in memory. It is the control to be stored in the device. Modules may correspond to functions one-to-one, but in mounting, one module may be configured by one program, or a plurality of modules may be configured by one program, and conversely, one module May be composed of a plurality of programs. The plurality of modules may be executed by one computer, or one module may be executed by a plurality of computers in a distributed or parallel environment. Note that one module may include other modules. Hereinafter, “connection” is used not only for physical connection but also for logical connection (data exchange, instruction, reference relationship between data, etc.). “Predetermined” means that the process is determined before the target process, and not only before the process according to this embodiment starts but also after the process according to this embodiment starts. In addition, if it is before the target processing, it is used in accordance with the situation / state at that time or with the intention to be decided according to the situation / state up to that point. When there are a plurality of “predetermined values”, they may be different values, or two or more values (of course, including all values) may be the same. In addition, the description having the meaning of “do B when it is A” is used in the meaning of “determine whether or not it is A and do B when it is judged as A”. However, the case where it is not necessary to determine whether or not A is excluded.
In addition, the system or device is configured by connecting a plurality of computers, hardware, devices, and the like by communication means such as a network (including one-to-one correspondence communication connection), etc., and one computer, hardware, device. The case where it implement | achieves by etc. is included. “Apparatus” and “system” are used as synonymous terms. Of course, the “system” does not include a social “mechanism” (social system) that is an artificial arrangement.
In addition, when performing a plurality of processes in each module or in each module, the target information is read from the storage device for each process, and the processing result is written to the storage device after performing the processing. is there. Therefore, description of reading from the storage device before processing and writing to the storage device after processing may be omitted. Here, the storage device may include a hard disk, a RAM (Random Access Memory), an external storage medium, a storage device via a communication line, a register in a CPU (Central Processing Unit), and the like.

第1の実施の形態である情報処理装置は、表示文字列が記載された文書を撮影した画像を文字認識し、その表示文字列に対応する処理を行うものであって、図1の例に示すように、文字認識モジュール110、文字列検索モジュール120、表示文字列・コマンドテーブル140、コマンド処理モジュール150を有している。表示文字列に対応する処理としては、例えば、webページを自動表示すること、アプリケーションを自動起動すること等がある。具体的には、表示文字列が含まれている文書を、カメラ付きの携帯情報端末で撮影し、その画像を文字認識し、その表示文字列と対応する処理を行わせるものである。
また、表示文字列には、文書においてデザイン上違和感のあるURL、コマンドは含まない。つまり、URLやコマンドを記載しなくても、webブラウザ等のコマンドを動作させるものである。
The information processing apparatus according to the first embodiment performs character recognition on an image obtained by photographing a document in which a display character string is described, and performs processing corresponding to the display character string. As shown, it has a character recognition module 110, a character string search module 120, a display character string / command table 140, and a command processing module 150. Examples of the processing corresponding to the display character string include automatically displaying a web page and automatically starting an application. Specifically, a document including a display character string is photographed by a portable information terminal with a camera, the image is recognized, and processing corresponding to the display character string is performed.
In addition, the display character string does not include URLs and commands that are uncomfortable in design in the document. That is, a command such as a web browser is operated without describing a URL or a command.

文字認識モジュール110は、文字列検索モジュール120と接続されている。文字認識モジュール110は、文字が記載されている画像105を受け付け、その画像105を文字認識する。画像105を受け付けるとは、例えば、カメラ、スキャナ等で画像105を読み込むこと、ファックス等で通信回線を介して外部機器から画像105を受信すること、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像105を読み出すこと等が含まれる。画像105は、2値画像、多値画像(カラー画像を含む)であってもよい。受け付ける画像105は、1枚であってもよいし、複数枚であってもよい。また、画像105の内容として、広告宣伝用のパンフレット、ビジネスに用いられる文書等であってもよい。文字認識は、既存の技術を用いればよい。
そして、文字認識モジュール110の文字認識結果として、テキスト列115を文字列検索モジュール120に渡す。
The character recognition module 110 is connected to the character string search module 120. The character recognition module 110 accepts an image 105 on which characters are described, and recognizes the image 105 as characters. Accepting the image 105 means, for example, reading the image 105 with a camera, a scanner, etc., receiving the image 105 from an external device via a communication line with a fax, etc., a hard disk (in addition to what is built in the computer, Etc.) including reading out the image 105 stored in the network (including those connected via a network). The image 105 may be a binary image or a multi-value image (including a color image). One image may be received or a plurality of images may be received. Further, the content of the image 105 may be an advertisement pamphlet, a document used in business, or the like. The existing technology may be used for character recognition.
Then, the text string 115 is passed to the character string search module 120 as a character recognition result of the character recognition module 110.

表示文字列・コマンドテーブル140は、文字列検索モジュール120と接続されている。表示文字列・コマンドテーブル140は、表示文字列と処理情報(以下、コマンドともいう)を対応させて記憶する。例えば、表示文字列・コマンドテーブル400を記憶している。図4は、表示文字列・コマンドテーブル400のデータ構造例を示す説明図である。表示文字列・コマンドテーブル400は、番号欄410、表示文字列欄420、コマンド欄430を有している。番号欄410は、表示文字列とコマンドの対応を、本実施の形態において一意に識別するための番号を記憶している。表示文字列欄420は、表示文字列を記憶している。つまり、文字認識の対象となった画像105内に記載されている可能性がある表示文字列が記憶されている。コマンド欄430は、その表示文字列に対応するコマンドを記憶している。コマンド欄430に記憶させるコマンドとして、URLであってもよく、その場合のコマンド処理は、そのURLにアクセスするためのwebブラウザを起動することである。また、コマンド欄430に記憶させるコマンドとして、アプリケーション名及びその引数(引数が無い場合もある)であってもよく、その場合のコマンド処理は、そのアプリケーションを起動することである。   The display character string / command table 140 is connected to the character string search module 120. The display character string / command table 140 stores display character strings and processing information (hereinafter also referred to as commands) in association with each other. For example, a display character string / command table 400 is stored. FIG. 4 is an explanatory diagram showing an example of the data structure of the display character string / command table 400. The display character string / command table 400 includes a number column 410, a display character string column 420, and a command column 430. The number column 410 stores a number for uniquely identifying the correspondence between the display character string and the command in the present embodiment. The display character string column 420 stores a display character string. That is, the display character string which may be described in the image 105 used as the object of character recognition is memorize | stored. The command column 430 stores a command corresponding to the display character string. The command stored in the command column 430 may be a URL, and the command processing in that case is to start a web browser for accessing the URL. The command stored in the command column 430 may be an application name and its argument (there may be no argument), and the command processing in that case is to start the application.

文字列検索モジュール120は、文字認識モジュール110、表示文字列・コマンドテーブル140、コマンド処理モジュール150と接続されている。文字列検索モジュール120は、文字認識結果であるテキスト列115内から表示文字列・コマンドテーブル140に記憶されている表示文字列を検索する。具体的には、表示文字列・コマンドテーブル400の表示文字列欄420が記憶している表示文字列とテキスト列115とのマッチング処理を行う。
そして、文字列検索モジュール120は、その検索によってテキスト列115内から表示文字列が検索できた場合は、表示文字列・コマンドテーブル140からその表示文字列に対応する処理情報を抽出する。具体的には、検索された表示文字列に対応する表示文字列・コマンドテーブル400のコマンド欄430が記憶しているコマンド125を抽出する。
The character string search module 120 is connected to the character recognition module 110, the display character string / command table 140, and the command processing module 150. The character string search module 120 searches for a display character string stored in the display character string / command table 140 from the text string 115 as a character recognition result. Specifically, matching processing between the display character string stored in the display character string column 420 of the display character string / command table 400 and the text string 115 is performed.
If the display character string can be searched from the text string 115 by the search, the character string search module 120 extracts processing information corresponding to the display character string from the display character string / command table 140. Specifically, the command 125 stored in the command column 430 of the display character string / command table 400 corresponding to the retrieved display character string is extracted.

コマンド処理モジュール150は、文字列検索モジュール120と接続されている。コマンド処理モジュール150は、文字列検索モジュール120によって抽出された処理情報であるコマンド125に基づいて、処理を行う。前述したように、コマンド125がURLである場合は、そのURLにアクセスするためのwebブラウザを起動する。また、コマンド125がアプリケーション名及びその引数である場合は、そのアプリケーションを起動する。   The command processing module 150 is connected to the character string search module 120. The command processing module 150 performs processing based on the command 125 that is processing information extracted by the character string search module 120. As described above, when the command 125 is a URL, a web browser for accessing the URL is activated. If the command 125 is an application name and its argument, the application is activated.

図2は、第1の実施の形態による処理例を示すフローチャートである。
ステップS202では、文字認識モジュール110が、画像105を受け付ける。例えば、デジタルカメラ、カメラ付きスマートフォン等の携帯情報端末で、写真を取得する。カタログなどの文書における商品の写真を撮る。写真はデジタル画像(画像105)として取り込まれる。
ステップS204では、文字認識モジュール110が、画像105を文字認識する。つまり、画像105は文字認識されて、画像105中の文字がテキスト列115に変換されて出力される。例えば、文字認識結果であるテキスト列115として、図3に例示のテキスト列315である「商品の説明文:本商品(商品番号123−456)は大変お買い得で、センスも良く、お値段も手ごろ。そのうえ、色や形も抜群。買わない手はありません。」がある。
FIG. 2 is a flowchart illustrating a processing example according to the first exemplary embodiment.
In step S202, the character recognition module 110 receives the image 105. For example, a photograph is acquired by a portable information terminal such as a digital camera or a smartphone with a camera. Take pictures of products in catalogs and other documents. The photograph is captured as a digital image (image 105).
In step S204, the character recognition module 110 recognizes the image 105 as characters. That is, the image 105 is recognized, and the characters in the image 105 are converted into a text string 115 and output. For example, as the text string 115 as a character recognition result, the text string 315 illustrated in FIG. 3 is “Product description: This product (product number 123-456) is very bargain, has a good sense, and is reasonably priced. Besides, the color and shape are outstanding. There is no hand to buy. ”

ステップS206では、文字列検索モジュール120が、表示文字列・コマンドテーブル140から表示文字列を抽出する。例えば、表示文字列・コマンドテーブル140内の表示文字列・コマンドテーブル400には、表示文字列(表示文字列欄420)とコマンド(コマンド欄430)がペアとなって格納されている。表示文字列は画像105内に記入される可能性のある文字列である。図4の例では、表示文字列として、商品番号が格納されている。また、コマンドとしてURLが格納されている。番号(番号欄410)の1番から順に、表示文字列を表示文字列・コマンドテーブル400から抽出する。
ステップS208では、文字列検索モジュール120が、文字認識結果内から表示文字列を検索する。つまり、ステップS206で抽出した表示文字列をクエリとして、テキスト列115の検索を行う。検索は一般の全文検索アルゴリズム等を利用すればよい。図3、図4の例では、表示文字列・コマンドテーブル400内の1番目の「123−456」が、テキスト列315から検索されることとなる。
In step S <b> 206, the character string search module 120 extracts a display character string from the display character string / command table 140. For example, the display character string / command table 400 in the display character string / command table 140 stores a display character string (display character string column 420) and a command (command column 430) as a pair. The display character string is a character string that may be entered in the image 105. In the example of FIG. 4, the product number is stored as the display character string. A URL is stored as a command. The display character strings are extracted from the display character string / command table 400 in order from the first number (number field 410).
In step S208, the character string search module 120 searches the display character string from the character recognition result. That is, the text string 115 is searched using the display character string extracted in step S206 as a query. The search may use a general full-text search algorithm or the like. In the example of FIGS. 3 and 4, the first “123-456” in the display character string / command table 400 is searched from the text string 315.

ステップS210では、文字列検索モジュール120が、文字認識結果内に表示文字列があるか否かを判断し、ある場合はステップS212へ進み、それ以外の場合はステップS216へ進む。検索にヒットした場合(ステップS210でY)、テキスト列115の中に抽出した表示文字列が存在していることとなる。
ステップS212では、文字列検索モジュール120が、表示文字列・コマンドテーブル140から検索された表示文字列に対応するコマンド125を抽出する。例えば、表示文字列・コマンドテーブル400内で、その表示文字列とペアになっているコマンド125を抽出する。
ステップS214では、コマンド処理モジュール150が、コマンド125を解釈して、そのコマンド125の処理を行う。図3、図4の例では、検索された表示文字列に対応するURL(表示文字列・コマンドテーブル400内の番号:1のhttp://www.abc.def/xxx)をwebブラウザで表示する。
ステップS216では、エラー処理を行う。例えば、「撮影した画像内には、コマンドに対応する表示文字列が無い」旨を、表示装置に表示するようにしてもよい。また、単に文書を撮影したのみで、エラー表示等の処理は行わなくてもよい。
In step S210, the character string search module 120 determines whether or not there is a display character string in the character recognition result. If there is, the process proceeds to step S212. Otherwise, the process proceeds to step S216. If the search is hit (Y in step S210), the extracted display character string exists in the text string 115.
In step S212, the character string search module 120 extracts a command 125 corresponding to the display character string searched from the display character string / command table 140. For example, the command 125 paired with the display character string is extracted from the display character string / command table 400.
In step S214, the command processing module 150 interprets the command 125 and processes the command 125. In the example of FIGS. 3 and 4, the URL (http: //www.abc.def/xxx of the display character string / command table 400: 1) corresponding to the retrieved display character string is displayed on the web browser. To do.
In step S216, error processing is performed. For example, it may be displayed on the display device that “there is no display character string corresponding to the command in the photographed image”. Further, it is not necessary to perform processing such as error display only by photographing a document.

<第2の実施の形態>
図5は、第2の実施の形態の構成例についての概念的なモジュール構成図である。
なお、前述の実施の形態と同種の部位には同一符号を付し重複した説明を省略する(以下、同様)。
第2の実施の形態である情報処理装置は、表示文字列が記載された文書を撮影した画像を文字認識し、その表示文字列に対応する処理を行うものであって、図5の例に示すように、文字認識モジュール110、正規表現検索モジュール520、文字列DB検索モジュール530、表示文字列・コマンドテーブル140、コマンド処理モジュール150を有している。特に、登録した表示文字列の数が膨大であっても、現実的な時間で動作する。
<Second Embodiment>
FIG. 5 is a conceptual module configuration diagram of a configuration example according to the second embodiment.
In addition, the same code | symbol is attached | subjected to the site | part of the same kind as the above-mentioned embodiment, and the overlapping description is abbreviate | omitted (hereinafter the same).
The information processing apparatus according to the second embodiment performs character recognition on an image obtained by photographing a document in which a display character string is described, and performs processing corresponding to the display character string. As shown, a character recognition module 110, a regular expression search module 520, a character string DB search module 530, a display character string / command table 140, and a command processing module 150 are included. In particular, even if the number of registered display character strings is enormous, it operates in a realistic time.

表示文字列・コマンドテーブル140が記憶している表示文字列と処理情報の対応は多くてもよい。第1の実施の形態では、各行毎に表示文字列をクエリとしてテキスト列内の文字列を検索する例を示したが、その方法では、表示文字列数に比例する時間が検索に必要となる。1検索に1ms必要な場合、かつ、100万この表示文字列がある場合を例にとると、1000秒必要になってしまう。
そこで、第2の実施の形態では以下の動作を行う。
まず、全表示文字列(又は、大部分の表示文字列)に合致する正規表現517を生成する。例えば、表示文字列・コマンドテーブル140内の表示文字列を解析して、「3桁の数字−3桁の数字」という正規表現517を生成する。正規表現517の生成は、既存の手法を用いればよい。この正規表現517をクエリとして、正規表現検索モジュール520は、テキスト列115に対して正規表現検索を行う。正規表現検索としては、正規表現ライブラリを用いたり、grepコマンドを用いたりすれば実現できる。
正規表現検索モジュール520は、正規表現検索にヒットした場合の文字列(抽出文字列525)を文字列DB検索モジュール530に渡す。図7の例で、「3桁の数字−3桁の数字」という正規表現の場合、「123−456」、「333−333」の2つの文字列が抽出文字列525としてある。
これらの抽出文字列525をクエリとして、文字列DB検索モジュール530が、表示文字列・コマンドテーブル140から、抽出文字列525に合致する表示文字列を検索する。この検索方法としては、一般的な文字列検索を用いることができる。
文字列DB検索モジュール530における検索の結果、ヒットした表示文字列に対応するコマンド125を出力する。
このようにすることによって、表示文字列・コマンドテーブル140内の全ての表示文字列をクエリにする必要がなくなり、検索が高速化される。
The correspondence between the display character string stored in the display character string / command table 140 and the processing information may be many. In the first embodiment, an example of searching for a character string in a text string using a display character string as a query for each row has been shown. However, in this method, a time proportional to the number of display character strings is required for the search. . If 1 ms is required for one search and there are 1 million display character strings, 1000 seconds are required.
Therefore, the following operation is performed in the second embodiment.
First, a regular expression 517 that matches all display character strings (or most display character strings) is generated. For example, the display character string in the display character string / command table 140 is analyzed, and the regular expression 517 “three-digit number—three-digit number” is generated. The regular expression 517 may be generated using an existing method. Using the regular expression 517 as a query, the regular expression search module 520 performs a regular expression search on the text string 115. The regular expression search can be realized by using a regular expression library or a grep command.
The regular expression search module 520 passes the character string (extracted character string 525) when the regular expression search is hit to the character string DB search module 530. In the example of FIG. 7, in the case of the regular expression “three-digit number—three-digit number”, two character strings “123-456” and “333-333” are extracted character strings 525.
Using these extracted character strings 525 as queries, the character string DB search module 530 searches the display character string / command table 140 for a display character string that matches the extracted character string 525. As this search method, a general character string search can be used.
As a result of the search in the character string DB search module 530, a command 125 corresponding to the display character string hit is output.
By doing so, it is not necessary to use all the display character strings in the display character string / command table 140 as queries, and the search speeds up.

図5の例に示したモジュール間の関係、処理としては、以下のようになる。
文字認識モジュール110は、正規表現検索モジュール520と接続されている。
正規表現検索モジュール520は、文字認識モジュール110、文字列DB検索モジュール530と接続されている。正規表現検索モジュール520は、文字認識結果であるテキスト列115内から表示文字列としての候補を検索する。ここでの候補は、表示文字列の一部又は全てを示す正規表現で記載された情報であり、正規表現検索モジュール520は、テキスト列115に対して、候補の正規表現検索を行うことによって検索する。
文字列DB検索モジュール530は、正規表現検索モジュール520、表示文字列・コマンドテーブル140、コマンド処理モジュール150と接続されている。文字列DB検索モジュール530は、正規表現検索モジュール520によって検索された候補内から表示文字列を検索する。
表示文字列・コマンドテーブル140は、文字列DB検索モジュール530と接続されている。コマンド処理モジュール150は、文字列DB検索モジュール530と接続されている。
The relationship and processing between modules shown in the example of FIG. 5 are as follows.
The character recognition module 110 is connected to the regular expression search module 520.
The regular expression search module 520 is connected to the character recognition module 110 and the character string DB search module 530. The regular expression search module 520 searches for a candidate for a display character string from the text string 115 that is a character recognition result. The candidate here is information described in a regular expression indicating a part or all of the display character string, and the regular expression search module 520 searches the text string 115 by performing a candidate regular expression search. To do.
The character string DB search module 530 is connected to the regular expression search module 520, the display character string / command table 140, and the command processing module 150. The character string DB search module 530 searches the display character string from the candidates searched by the regular expression search module 520.
The display character string / command table 140 is connected to the character string DB search module 530. The command processing module 150 is connected to the character string DB search module 530.

図6は、第2の実施の形態による処理例を示すフローチャートである。
ステップS602では、文字認識モジュール110が、画像105を受け付ける。ステップS202と同等の処理を行う。
ステップS604では、文字認識モジュール110が、画像105を文字認識する。ステップS204と同等の処理を行う。図7に例示のテキスト列715である「商品の説明文:本商品(商品番号123−456)は大変お買い得で、センスも良く、お値段も手ごろ。そのうえ、色や形も抜群。買わない手はありません。電話番号は333−3333」がある。
FIG. 6 is a flowchart illustrating a processing example according to the second exemplary embodiment.
In step S602, the character recognition module 110 receives the image 105. Processing equivalent to that in step S202 is performed.
In step S604, the character recognition module 110 recognizes characters in the image 105. Processing equivalent to that in step S204 is performed. The text column 715 illustrated in FIG. 7 is “Product description: This product (product number 123-456) is very bargain, has a good sense, is reasonably priced, and is excellent in color and shape. There is no phone number 333-3333 ".

ステップS606では、正規表現検索モジュール520が、表示文字列・コマンドテーブル140内の表示文字列から生成された正規表現517を受け付ける。例えば、表示文字列・コマンドテーブル140内には図8に例示の表示文字列・コマンドテーブル800が記憶されている。表示文字列・コマンドテーブル800は、図4に例示の表示文字列・コマンドテーブル400と同等のものである。ただし、表示文字列・コマンドテーブル800の行数(表示文字列とコマンドの対応の数)は多い。表示文字列・コマンドテーブル800の表示文字列欄820内の表示文字列を解析することによって、「3桁の数字−3桁の数字」という正規表現517を生成する。
ステップS608では、正規表現検索モジュール520が、文字認識結果内から正規表現517に合致する文字列を検索する。ここでの検索は、正規表現検索である。図7の例では、「123−456」と「333−333」が検索されることとなり、これらの文字列が抽出文字列525となる。
ステップS610では、文字列DB検索モジュール530が、表示文字列・コマンドテーブル140から抽出文字列525を検索する。前述の例では、「123−456」と「333−333」の2つだけが対象となり、「123−456」が検索される。
In step S606, the regular expression search module 520 receives the regular expression 517 generated from the display character string in the display character string / command table 140. For example, the display character string / command table 800 illustrated in FIG. 8 is stored in the display character string / command table 140. The display character string / command table 800 is equivalent to the display character string / command table 400 illustrated in FIG. However, the number of lines in the display character string / command table 800 (the number of correspondence between the display character string and the command) is large. By analyzing the display character string in the display character string field 820 of the display character string / command table 800, a regular expression 517 of “three digits—three digits” is generated.
In step S608, the regular expression search module 520 searches for a character string that matches the regular expression 517 from the character recognition result. The search here is a regular expression search. In the example of FIG. 7, “123-456” and “333-333” are searched, and these character strings become the extracted character string 525.
In step S610, the character string DB search module 530 searches the display character string / command table 140 for the extracted character string 525. In the above example, only “123-456” and “333-333” are targeted, and “123-456” is searched.

ステップS612では、文字列検索モジュール120が、文字認識結果(抽出文字列525)内に表示文字列があるか否かを判断し、ある場合はステップS614へ進み、それ以外の場合はステップS618へ進む。ステップS210と同等の処理を行う。
ステップS614では、文字列検索モジュール120が、表示文字列・コマンドテーブル140から検索された表示文字列に対応するコマンド125を抽出する。ステップS212と同等の処理を行う。
ステップS616では、コマンド処理モジュール150が、コマンド125を解釈して、そのコマンド125の処理を行う。ステップS214と同等の処理を行う。
ステップS618では、エラー処理を行う。ステップS216と同等の処理を行う。
In step S612, the character string search module 120 determines whether or not there is a display character string in the character recognition result (extracted character string 525). If there is, the process proceeds to step S614. Otherwise, the process proceeds to step S618. move on. Processing equivalent to that in step S210 is performed.
In step S614, the character string search module 120 extracts a command 125 corresponding to the display character string searched from the display character string / command table 140. Processing equivalent to that in step S212 is performed.
In step S616, the command processing module 150 interprets the command 125 and processes the command 125. Processing equivalent to that in step S214 is performed.
In step S618, error processing is performed. Processing equivalent to that in step S216 is performed.

また、第2の実施の形態では、画像105として静止画、動画像のいずれであってもよい。その場合、文字認識モジュール110が、画像105が動画像であるか否かを判断する。画像105が動画像である場合、その動画像を構成する複数のフレーム画像を、文字認識モジュール110が文字認識する。その結果、フレーム画像毎に、テキスト列115を生成する。そして、正規表現検索モジュール520は、正規表現517に合致する文字列がある最初のフレーム画像におけるテキスト列115を対象として処理を行う。例えば、操作者がカメラ付きスマートフォンの操作を誤って、静止画ではなく、動画像の撮影をした場合であっても高速に処理ができるようにしている。   In the second embodiment, the image 105 may be either a still image or a moving image. In that case, the character recognition module 110 determines whether the image 105 is a moving image. When the image 105 is a moving image, the character recognition module 110 recognizes a plurality of frame images constituting the moving image. As a result, a text string 115 is generated for each frame image. Then, the regular expression search module 520 performs processing on the text string 115 in the first frame image having a character string that matches the regular expression 517. For example, even if an operator mistakenly operates a smartphone with a camera and shoots a moving image instead of a still image, high-speed processing can be performed.

<第3の実施の形態>
図9は、第3実施の形態の構成例についての概念的なモジュール構成図である。
第3の実施の形態である情報処理装置は、表示文字列が記載された文書を撮影した画像を文字認識し、その表示文字列に対応する処理を行うものであって、図9の例に示すように、文字認識モジュール110、候補位置文字抽出モジュール920、文字列DB検索モジュール530、表示文字列・コマンドテーブル140、コマンド処理モジュール150を有している。特に、登録した表示文字列の数が膨大であっても、現実的な時間で動作する。
<Third Embodiment>
FIG. 9 is a conceptual module configuration diagram of a configuration example according to the third embodiment.
The information processing apparatus according to the third embodiment performs character recognition on an image obtained by photographing a document in which a display character string is described, and performs processing corresponding to the display character string. As shown, a character recognition module 110, a candidate position character extraction module 920, a character string DB search module 530, a display character string / command table 140, and a command processing module 150 are included. In particular, even if the number of registered display character strings is enormous, it operates in a realistic time.

図11、図12の例を用いて説明する。図11(a)の例に示すように、文書1100には、複数の商品(商品名、商品の説明、商品番号等を含む)が記載されているとする。ここで、コマンド処理モジュール150が行う処理は、商品の詳細情報が記載されているURLを表示することとする。
図12の例に示すように、操作者はカメラ付携帯情報端末1210を用いて文書1100を撮影する。その際、操作者は、図11(b)の例に示すユーザの撮影画像1110のように、詳細情報を取得したい商品が中心となるように撮影することが多い。操作者は、自分が撮影した商品に関するwebページが自動で表示されることを期待しているからである。また、詳細情報を取得したい商品(コマンド処理モジュール150における処理が行われる画像)が中心となるように撮影する旨を提示するようにしてもよい。
第3の実施の形態では、まず、ユーザの撮影画像1110(画像105)を文字認識モジュール110が文字認識し、文字認識結果テキスト列1120を得る。ところが、操作者は、単に「中心となるように撮影」するだけであるため、対象とすべき表示文字列だけを抽出できるとは限らない。文書内の隣接する別の商品の画像や説明が写り込む可能性が大きい。図11(b)の例では、右側のシャツの画像、その説明文B等が該当する。
そこで、候補位置文字抽出モジュール920は、図11(c)の例に示す文字認識結果テキスト列1120(テキスト列・各文字位置915)内から、後段の文字列DB検索モジュール530で利用可能な候補文字列である抽出結果1125(抽出文字列525)を抽出する。
第3の実施の形態では、ユーザの撮影画像1110中の位置情報を利用する。候補位置文字抽出モジュール920は、文字候補位置情報917を受け付ける。また、文字認識モジュール110の文字認識結果として、テキスト列に加えて、各文字位置情報(テキスト列・各文字位置915)を得る。文字候補位置情報917と、文字位置の詳細例については、図13〜15を用いて後述する。
候補位置文字抽出モジュール920では、文字候補位置情報917に合致する文字列を文字認識結果テキスト列1120から抽出する。抽出結果は、図11(d)の例に示す抽出結果1125のようになる。このように文字認識結果のテキスト列の内容を限定することができて、隣接する画像(商品等)の影響を避けることができる。
抽出文字列525から、さらに、第2の実施の形態の正規表現検索モジュール520によって正規表現で再抽出してもよい。
This will be described with reference to the examples of FIGS. As shown in the example of FIG. 11A, it is assumed that the document 1100 describes a plurality of products (including product names, product descriptions, product numbers, and the like). Here, the processing performed by the command processing module 150 displays a URL in which detailed product information is described.
As shown in the example of FIG. 12, the operator uses the camera-equipped portable information terminal 1210 to photograph the document 1100. At that time, the operator often shoots such that a product for which detailed information is to be acquired is the center, such as a photographed image 1110 of the user shown in the example of FIG. This is because the operator expects that a web page related to the product photographed by the operator is automatically displayed. In addition, it may be presented that photographing is performed so that a product (an image to be processed in the command processing module 150) for which detailed information is to be acquired is centered.
In the third embodiment, first, the character recognition module 110 performs character recognition on the user's photographed image 1110 (image 105) to obtain a character recognition result text string 1120. However, since the operator simply “photographs so as to be centered”, it is not always possible to extract only the display character string to be targeted. There is a high possibility that an image or description of another adjacent product in the document will be reflected. In the example of FIG. 11B, the image of the right shirt, the description B thereof, and the like are applicable.
Therefore, the candidate position character extraction module 920 is a candidate that can be used in the subsequent character string DB search module 530 from the character recognition result text string 1120 (text string / each character position 915) shown in the example of FIG. An extraction result 1125 (extracted character string 525) that is a character string is extracted.
In the third embodiment, position information in the user's captured image 1110 is used. The candidate position character extraction module 920 receives character candidate position information 917. In addition to the text string, each character position information (text string / character position 915) is obtained as a character recognition result of the character recognition module 110. Character candidate position information 917 and detailed examples of character positions will be described later with reference to FIGS.
The candidate position character extraction module 920 extracts a character string that matches the character candidate position information 917 from the character recognition result text string 1120. The extraction result is like an extraction result 1125 shown in the example of FIG. In this way, the contents of the text string of the character recognition result can be limited, and the influence of adjacent images (products etc.) can be avoided.
Further, the extracted character string 525 may be re-extracted with a regular expression by the regular expression search module 520 of the second embodiment.

図9の例に示したモジュール間の関係、処理としては、以下のようになる。
文字認識モジュール110は、候補位置文字抽出モジュール920と接続されている。
候補位置文字抽出モジュール920は、文字認識モジュール110、文字列DB検索モジュール530と接続されている。候補位置文字抽出モジュール920は、文字認識結果であるテキスト列・各文字位置915内から表示文字列としての候補を検索する。ここでの候補は、表示文字が存在する位置の範囲を示す情報(文字候補位置情報917)であり、テキスト列・各文字位置915には、各文字の位置が含まれており、候補位置文字抽出モジュール920は、テキスト列・各文字位置915に対して、認識文字の位置が候補の範囲に該当するものを抽出することによって検索する。なお、文字候補位置情報917は、予め定められた範囲を示す値であってもよいし、画像105内の属性情報として含まれているピント位置の情報を用いてもよい。例えば、そのピント位置を中心として、予め定められた長さの辺の矩形で定義される文字候補位置情報917であってもよい。
文字列DB検索モジュール530は、候補位置文字抽出モジュール920、表示文字列・コマンドテーブル140、コマンド処理モジュール150と接続されている。文字列DB検索モジュール530は、候補位置文字抽出モジュール920によって検索された候補(抽出文字列525)内から表示文字列を検索する。
表示文字列・コマンドテーブル140は、文字列DB検索モジュール530と接続されている。コマンド処理モジュール150は、文字列DB検索モジュール530と接続されている。
The relationship and processing between modules shown in the example of FIG. 9 are as follows.
The character recognition module 110 is connected to the candidate position character extraction module 920.
The candidate position character extraction module 920 is connected to the character recognition module 110 and the character string DB search module 530. The candidate position character extraction module 920 searches for a candidate as a display character string from the text string / character position 915 that is a character recognition result. The candidate here is information (character candidate position information 917) indicating a range of positions where the display character exists, and the text string / character position 915 includes the position of each character. The extraction module 920 searches the text string / each character position 915 by extracting a character string whose recognized character position falls within the candidate range. Note that the character candidate position information 917 may be a value indicating a predetermined range, or information on a focus position included as attribute information in the image 105 may be used. For example, it may be character candidate position information 917 defined by a rectangle with a predetermined length around the focus position.
The character string DB search module 530 is connected to the candidate position character extraction module 920, the display character string / command table 140, and the command processing module 150. The character string DB search module 530 searches the display character string from the candidates (extracted character string 525) searched by the candidate position character extraction module 920.
The display character string / command table 140 is connected to the character string DB search module 530. The command processing module 150 is connected to the character string DB search module 530.

図10は、第3の実施の形態による処理例を示すフローチャートである。
ステップS1002では、文字認識モジュール110が、画像105を受け付ける。ステップS202と同等の処理を行う。
ステップS1004では、文字認識モジュール110が、画像105を文字認識し、各文字の位置を抽出する。ステップS204と同等の処理を行うが、各文字のテキスト情報とともにその文字の位置をも抽出する。
ステップS1006では、候補位置文字抽出モジュール920が、文字候補位置情報917を受け付ける。
ステップS1008では、候補位置文字抽出モジュール920が、文字認識結果であるテキスト列・各文字位置915内の文字候補位置情報917に該当する文字列(抽出文字列525)を抽出する。
ステップS1010では、文字列DB検索モジュール530が、表示文字列・コマンドテーブル140から表示文字列を抽出する。ステップS206と同等の処理を行う。
FIG. 10 is a flowchart illustrating a processing example according to the third exemplary embodiment.
In step S1002, the character recognition module 110 receives the image 105. Processing equivalent to that in step S202 is performed.
In step S1004, the character recognition module 110 recognizes the image 105 and extracts the position of each character. Processing equivalent to that in step S204 is performed, but the character position is extracted together with the text information of each character.
In step S1006, the candidate position character extraction module 920 receives the character candidate position information 917.
In step S1008, the candidate position character extraction module 920 extracts a character string (extracted character string 525) corresponding to the character candidate position information 917 in the text string / character position 915 as the character recognition result.
In step S1010, the character string DB search module 530 extracts a display character string from the display character string / command table 140. Processing equivalent to that in step S206 is performed.

ステップS1012では、抽出文字列525内から表示文字列を検索する。つまり、ステップS1010で抽出した表示文字列をクエリとして、抽出文字列525の検索を行う。検索は一般の検索アルゴリズムを利用すればよい
ステップS1014では、文字列検索モジュール120が、文字認識結果(抽出文字列525)内に表示文字列があるか否かを判断し、ある場合はステップS1016へ進み、それ以外の場合はステップS1020へ進む。
ステップS1016では、文字列検索モジュール120が、表示文字列・コマンドテーブル140から検索された表示文字列に対応するコマンド125を抽出する。ステップS212と同等の処理を行う。
ステップS1018では、コマンド処理モジュール150が、コマンド125を解釈して、そのコマンド125の処理を行う。ステップS214と同等の処理を行う。
ステップS1020では、エラー処理を行う。ステップS216と同等の処理を行う。
In step S1012, the display character string is searched from the extracted character string 525. That is, the extracted character string 525 is searched using the display character string extracted in step S1010 as a query. The search may use a general search algorithm. In step S1014, the character string search module 120 determines whether there is a display character string in the character recognition result (extracted character string 525). Otherwise, go to step S1020.
In step S1016, the character string search module 120 extracts a command 125 corresponding to the display character string searched from the display character string / command table 140. Processing equivalent to that in step S212 is performed.
In step S1018, the command processing module 150 interprets the command 125 and processes the command 125. Processing equivalent to that in step S214 is performed.
In step S1020, error processing is performed. Processing equivalent to that in step S216 is performed.

図13は、画像における座標系の例を示す説明図である。図14は、文字位置座標1420の例を示す説明図である。図15は、文字候補位置情報1530の例を示す説明図である。
文字候補位置情報917とテキスト列・各文字位置915内の文字位置の詳細例を説明する。画像105は、画素が2次元に配列された形状で表すことができる。各画素位置をXとYの座標で表すことができる。ここでは、画像1300の左上を原点1310として、図13に示す例のようにX軸とY軸を規定する。なお、これは一例であって、画素位置が特定できれば、原点1310や軸の規定方法は、どのように行ってもよい。
文字認識の結果、XY座標系における文字位置を得ることができる。図14に示す例のように、文字認識の対象となった文字画像の外接矩形の左上の座標(文字位置座標1420)を文字位置とすることができる。もちろんのことながら、文字位置座標として、左上座標ではなく、右下座標や、外接矩形の中心位置等を用いてもよい。
文字候補位置情報917としては、画像105の大きさに対する相対的な位置関係を指定する。つまり、図15に示す例のように、画像1300のサイズをX軸方向に1、Y軸方向に1として設定した正規化座標系において、抽出したい文字位置の範囲(文字候補位置情報1530)を指定する。
文字候補位置情報917として、例えば、X軸方向に0.2〜0.8の範囲、Y軸方向に0.3〜0.7の範囲といった指定を行うことができる。
文字認識で得られたテキスト列・各文字位置915の文字位置も、同様にX軸方向とY軸方向に正規化された座標系で表現されていればよい。文字位置が文字候補位置情報917で示される領域内に存在しているテキスト列を抽出する。
又は、正規化された座標ではなくてもよい。文字候補位置情報917、テキスト列・各文字位置915の文字位置は、X座標、Y座標が整数で規定された画素位置そのものであってもよい。
FIG. 13 is an explanatory diagram illustrating an example of a coordinate system in an image. FIG. 14 is an explanatory diagram showing an example of character position coordinates 1420. FIG. 15 is an explanatory diagram illustrating an example of the character candidate position information 1530.
A detailed example of character candidate position information 917 and a text string / character position in each character position 915 will be described. The image 105 can be represented by a shape in which pixels are two-dimensionally arranged. Each pixel position can be represented by X and Y coordinates. Here, with the upper left corner of the image 1300 as the origin 1310, the X axis and the Y axis are defined as in the example shown in FIG. This is an example, and the origin 1310 and the axis defining method may be performed in any way as long as the pixel position can be specified.
As a result of character recognition, the character position in the XY coordinate system can be obtained. As in the example shown in FIG. 14, the upper left coordinate (character position coordinate 1420) of the circumscribed rectangle of the character image targeted for character recognition can be set as the character position. Of course, not the upper left coordinates but the lower right coordinates, the center position of the circumscribed rectangle, or the like may be used as the character position coordinates.
As the character candidate position information 917, a relative positional relationship with respect to the size of the image 105 is designated. That is, in the normalized coordinate system in which the size of the image 1300 is set to 1 in the X-axis direction and 1 in the Y-axis direction as in the example shown in FIG. specify.
As the character candidate position information 917, for example, a range of 0.2 to 0.8 in the X axis direction and a range of 0.3 to 0.7 in the Y axis direction can be specified.
Similarly, the text string obtained by character recognition and the character position of each character position 915 need only be expressed in a coordinate system normalized in the X-axis direction and the Y-axis direction. A text string in which the character position exists in the area indicated by the character candidate position information 917 is extracted.
Or it may not be a normalized coordinate. The character position of the character candidate position information 917, the text string, and each character position 915 may be the pixel position itself in which the X coordinate and the Y coordinate are defined by integers.

<第4の実施の形態>
図16は、第4の実施の形態の構成例についての概念的なモジュール構成図である。
第4の実施の形態である情報処理装置は、表示文字列が記載された文書を撮影した画像を文字認識し、その表示文字列に対応する処理を行うものであって、図16の例に示すように、文字認識モジュール110、候補サイズ文字抽出モジュール1620、文字列DB検索モジュール530、表示文字列・コマンドテーブル140、コマンド処理モジュール150を有している。特に、登録した表示文字列の数が膨大であっても、現実的な時間で動作する。
第3の実施の形態では文字候補位置情報917を用いて限定したが、第4の実施の形態では文字候補サイズ情報1617を用いて限定する。
<Fourth embodiment>
FIG. 16 is a conceptual module configuration diagram of a configuration example according to the fourth embodiment.
The information processing apparatus according to the fourth embodiment performs character recognition on an image obtained by photographing a document in which a display character string is described, and performs processing corresponding to the display character string. As shown, it has a character recognition module 110, a candidate size character extraction module 1620, a character string DB search module 530, a display character string / command table 140, and a command processing module 150. In particular, even if the number of registered display character strings is enormous, it operates in a realistic time.
In the third embodiment, the character candidate position information 917 is used for limitation, but in the fourth embodiment, character candidate size information 1617 is used for limitation.

第3の実施の形態で規定したような座標系で、文字サイズを規定すればよい。文字認識モジュール110による文字認識の結果、各文字の外接矩形のサイズ(縦画素数、横画素数)を抽出する。その画素数を画像105のサイズ(縦画素数と横画素数)で正規化して、本実施の形態で扱える文字サイズを得る。
候補サイズ文字抽出モジュール1620は、その文字サイズをテキスト列とともに文字認識結果として受け取る。
また、文字候補サイズ情報1617として、例えば、横サイズ範囲0.01〜0.1、縦サイズ範囲0.01〜0.1等の閾値を設定する。
文字認識結果としての文字サイズが、文字候補サイズ情報1617で定められる範囲に収まっていれば、抽出文字列1625として文字列DB検索モジュール530へ出力する。この範囲に収まっていないものは、抽出文字列1625として出力しない(表示文字列が含まれていないとして除外する)。
なお、文字候補サイズ情報1617で定められる範囲と文字サイズの関係として、以下のいずれであってもよい。
(1)文字サイズが縦横共に範囲内にあるときのみ、該当する文字認識結果のテキスト列を抽出文字列1625として出力する。
(2)文字サイズの縦横どちらか一方が範囲内にあれば、該当する文字認識結果のテキスト列を抽出文字列1625として出力する。
また、文字候補サイズ情報1617として、外接矩形の面積を指定してもよいし、文字列のサイズを指定してもよい。また、文字列が横書きの場合、文字列の高さの範囲を指定するようにしてもよい。文字列が縦書きの場合、文字列の幅の範囲を指定するようにしてもよい。
What is necessary is just to prescribe | regulate a character size by the coordinate system which prescribes | regulates in 3rd Embodiment. As a result of character recognition by the character recognition module 110, the size (number of vertical pixels and number of horizontal pixels) of the circumscribed rectangle of each character is extracted. The number of pixels is normalized by the size of the image 105 (the number of vertical pixels and the number of horizontal pixels) to obtain a character size that can be handled in this embodiment.
The candidate size character extraction module 1620 receives the character size together with the text string as a character recognition result.
As the character candidate size information 1617, for example, threshold values such as a horizontal size range of 0.01 to 0.1 and a vertical size range of 0.01 to 0.1 are set.
If the character size as the character recognition result is within the range determined by the character candidate size information 1617, it is output to the character string DB search module 530 as the extracted character string 1625. Those not within this range are not output as the extracted character string 1625 (excluded as not including the display character string).
The relationship between the range defined by the character candidate size information 1617 and the character size may be any of the following.
(1) Only when the character size is within the range both vertically and horizontally, the corresponding character recognition result text string is output as the extracted character string 1625.
(2) If either the vertical or horizontal character size is within the range, the corresponding character recognition result text string is output as the extracted character string 1625.
In addition, as the character candidate size information 1617, the area of the circumscribed rectangle may be designated, or the size of the character string may be designated. When the character string is written horizontally, the range of the character string height may be specified. When the character string is vertically written, the range of the width of the character string may be specified.

図16の例に示したモジュール間の関係、処理としては、以下のようになる。
文字認識モジュール110は、候補サイズ文字抽出モジュール1620と接続されている。
候補サイズ文字抽出モジュール1620は、文字認識モジュール110、文字列DB検索モジュール530と接続されている。候補サイズ文字抽出モジュール1620は、文字認識結果であるテキスト列・各文字サイズ1615内から表示文字列としての候補を検索する。ここでの候補は、表示文字の大きさの範囲を示す情報(文字候補サイズ情報1617)であり、テキスト列・各文字サイズ1615には、各文字の大きさが含まれており、候補サイズ文字抽出モジュール1620は、テキスト列・各文字サイズ1615に対して、認識文字の大きさが候補の範囲に該当するものを抽出することによって検索する。
文字列DB検索モジュール530は、候補サイズ文字抽出モジュール1620、表示文字列・コマンドテーブル140、コマンド処理モジュール150と接続されている。文字列DB検索モジュール530は、候補サイズ文字抽出モジュール1620によって検索された候補(抽出文字列1625)内から表示文字列を検索する。
表示文字列・コマンドテーブル140は、文字列DB検索モジュール530と接続されている。コマンド処理モジュール150は、文字列DB検索モジュール530と接続されている。
The relationship and processing between modules shown in the example of FIG. 16 are as follows.
The character recognition module 110 is connected to the candidate size character extraction module 1620.
The candidate size character extraction module 1620 is connected to the character recognition module 110 and the character string DB search module 530. The candidate size character extraction module 1620 searches for a candidate as a display character string from the text string / each character size 1615 as a character recognition result. The candidates here are information (character candidate size information 1617) indicating the size range of display characters, and the text string / character size 1615 includes the size of each character. The extraction module 1620 searches the text string / each character size 1615 by extracting those whose recognized character size falls within the candidate range.
The character string DB search module 530 is connected to the candidate size character extraction module 1620, the display character string / command table 140, and the command processing module 150. The character string DB search module 530 searches the display character string from the candidates (extracted character string 1625) searched by the candidate size character extraction module 1620.
The display character string / command table 140 is connected to the character string DB search module 530. The command processing module 150 is connected to the character string DB search module 530.

図17は、第4の実施の形態による処理例を示すフローチャートである。
ステップS1702では、文字認識モジュール110が、画像105を受け付ける。ステップS202と同等の処理を行う。
ステップS1704では、文字認識モジュール110が、画像105を文字認識し、各文字のサイズを抽出する。ステップS204と同等の処理を行うが、各文字のテキスト情報とともにその文字のサイズをも抽出する。
ステップS1706では、候補サイズ文字抽出モジュール1620が、文字候補サイズ情報1617を受け付ける。
ステップS1708では、候補サイズ文字抽出モジュール1620が、文字認識結果であるテキスト列・各文字サイズ1615内の文字候補サイズ情報1617に該当する文字列(抽出文字列1625)を抽出する。
ステップS1710では、文字列DB検索モジュール530が、表示文字列・コマンドテーブル140から表示文字列を抽出する。ステップS206と同等の処理を行う。
FIG. 17 is a flowchart illustrating a processing example according to the fourth exemplary embodiment.
In step S1702, the character recognition module 110 receives the image 105. Processing equivalent to that in step S202 is performed.
In step S1704, the character recognition module 110 recognizes characters in the image 105 and extracts the size of each character. A process equivalent to step S204 is performed, but the size of the character is extracted together with the text information of each character.
In step S1706, the candidate size character extraction module 1620 receives the character candidate size information 1617.
In step S1708, the candidate size character extraction module 1620 extracts a character string (extracted character string 1625) corresponding to the character candidate size information 1617 in the text string / character size 1615 as a character recognition result.
In step S1710, the character string DB search module 530 extracts a display character string from the display character string / command table 140. Processing equivalent to that in step S206 is performed.

ステップS1712では、抽出文字列1625内から表示文字列を検索する。つまり、ステップS1710で抽出した表示文字列をクエリとして、抽出文字列1625の検索を行う。検索は一般の検索アルゴリズムを利用すればよい
ステップS1714では、文字列検索モジュール120が、文字認識結果(抽出文字列1625)内に表示文字列があるか否かを判断し、ある場合はステップS1716へ進み、それ以外の場合はステップS1720へ進む。
ステップS1716では、文字列検索モジュール120が、表示文字列・コマンドテーブル140から検索された表示文字列に対応するコマンド125を抽出する。ステップS212と同等の処理を行う。
ステップS1718では、コマンド処理モジュール150が、コマンド125を解釈して、そのコマンド125の処理を行う。ステップS214と同等の処理を行う。
ステップS1720では、エラー処理を行う。ステップS216と同等の処理を行う。
In step S1712, the display character string is searched from the extracted character string 1625. That is, the extracted character string 1625 is searched using the display character string extracted in step S1710 as a query. A general search algorithm may be used for the search. In step S1714, the character string search module 120 determines whether or not there is a display character string in the character recognition result (extracted character string 1625). Otherwise, the process proceeds to step S1720.
In step S <b> 1716, the character string search module 120 extracts a command 125 corresponding to the display character string searched from the display character string / command table 140. Processing equivalent to that in step S212 is performed.
In step S1718, the command processing module 150 interprets the command 125 and processes the command 125. Processing equivalent to that in step S214 is performed.
In step S1720, error processing is performed. Processing equivalent to that in step S216 is performed.

<第5の実施の形態>
図18は、第5の実施の形態の構成例についての概念的なモジュール構成図である。
第5の実施の形態である情報処理装置は、表示文字列が記載された文書を撮影した画像を文字認識し、その表示文字列に対応する処理を行うものであって、図18の例に示すように、文字認識モジュール110、候補色文字抽出モジュール1820、文字列DB検索モジュール530、表示文字列・コマンドテーブル140、コマンド処理モジュール150を有している。特に、登録した表示文字列の数が膨大であっても、現実的な時間で動作する。
第3の実施の形態では文字候補位置情報917、第4の実施の形態では文字候補サイズ情報1617を用いて限定したが、第5の実施の形態では文字候補色情報1817(例えば、黒、赤等を示す情報)を用いて限定する。
<Fifth embodiment>
FIG. 18 is a conceptual module configuration diagram of a configuration example according to the fifth embodiment.
The information processing apparatus according to the fifth embodiment performs character recognition on an image obtained by photographing a document in which a display character string is described, and performs processing corresponding to the display character string. As shown, it has a character recognition module 110, a candidate color character extraction module 1820, a character string DB search module 530, a display character string / command table 140, and a command processing module 150. In particular, even if the number of registered display character strings is enormous, it operates in a realistic time.
In the third embodiment, the character candidate position information 917 is used, and in the fourth embodiment, the character candidate size information 1617 is used. However, in the fifth embodiment, the character candidate color information 1817 (for example, black, red, etc.) is used. And the like).

候補色文字抽出モジュール1820は、文字認識モジュール110から文字認識結果としてテキスト列とともに各文字の色(テキスト列・各文字色1815)を受け取る。また、候補色文字抽出モジュール1820は、文字認識結果内の文字位置情報から得られた文字位置と画像105から、文字認識結果として各文字の色を抽出するようにしてもよい。
文字候補色情報1817として、文字色の範囲を規定する。文字候補色情報1817によって規定された範囲内の色の文字だけを抽出文字列1825として文字列DB検索モジュール530へ出力する。例えば、文字候補色情報1817として、色差成分の信号強度を規定する。文字色をYCbCrに色変換を行う。
色差成分強度C=sqrt(Cb+Cr)として定義する。(sqrtは平方根を取得する関数)
文字候補色情報1817として、輝度情報TYと、色成分強度の閾値TCを設定する。Y<TYかつ、C<TCの場合に、候補色文字抽出モジュール1820が、該当するテキスト列を抽出する。例えば、この場合は、黒文字のみを抽出する場合に相当する。
The candidate color character extraction module 1820 receives the character color (text string / character color 1815) together with the text string as a character recognition result from the character recognition module 110. The candidate color character extraction module 1820 may extract the color of each character as a character recognition result from the character position obtained from the character position information in the character recognition result and the image 105.
A character color range is defined as the character candidate color information 1817. Only characters having a color within the range defined by the character candidate color information 1817 are output as the extracted character string 1825 to the character string DB search module 530. For example, the signal intensity of the color difference component is defined as the character candidate color information 1817. The character color is converted to YCbCr.
The color difference component intensity is defined as C = sqrt (Cb 2 + Cr 2 ). (Sqrt is a function for obtaining the square root)
As character candidate color information 1817, luminance information TY and a color component intensity threshold TC are set. When Y <TY and C <TC, the candidate color character extraction module 1820 extracts the corresponding text string. For example, this case corresponds to extracting only black characters.

図18の例に示したモジュール間の関係、処理としては、以下のようになる。
文字認識モジュール110は、候補色文字抽出モジュール1820と接続されている。
候補色文字抽出モジュール1820は、文字認識モジュール110、文字列DB検索モジュール530と接続されている。候補色文字抽出モジュール1820は、文字認識結果であるテキスト列・各文字色1815内から表示文字列としての候補を検索する。ここでの候補は、表示文字の色の範囲を示す情報(文字候補色情報1817)であり、テキスト列・各文字色1815には、各文字の色が含まれており、候補色文字抽出モジュール1820は、テキスト列・各文字色1815に対して、認識文字の色が候補の範囲に該当するものを抽出することによって検索する。
文字列DB検索モジュール530は、候補色文字抽出モジュール1820、表示文字列・コマンドテーブル140、コマンド処理モジュール150と接続されている。文字列DB検索モジュール530は、候補色文字抽出モジュール1820によって検索された候補(抽出文字列1825)内から表示文字列を検索する。
表示文字列・コマンドテーブル140は、文字列DB検索モジュール530と接続されている。コマンド処理モジュール150は、文字列DB検索モジュール530と接続されている。
The relationship and processing between modules shown in the example of FIG. 18 are as follows.
The character recognition module 110 is connected to the candidate color character extraction module 1820.
The candidate color character extraction module 1820 is connected to the character recognition module 110 and the character string DB search module 530. The candidate color character extraction module 1820 searches for a candidate as a display character string from the text string / character color 1815 as a character recognition result. The candidate here is information (character candidate color information 1817) indicating the color range of the display character, and the text string / each character color 1815 includes the color of each character. 1820 searches for a text string / each character color 1815 by extracting those whose recognized character color falls within the candidate range.
The character string DB search module 530 is connected to the candidate color character extraction module 1820, the display character string / command table 140, and the command processing module 150. The character string DB search module 530 searches the display character string from the candidates (extracted character string 1825) searched by the candidate color character extraction module 1820.
The display character string / command table 140 is connected to the character string DB search module 530. The command processing module 150 is connected to the character string DB search module 530.

図19は、第5の実施の形態による処理例を示すフローチャートである。
ステップS1902では、文字認識モジュール110が、画像105を受け付ける。ステップS202と同等の処理を行う。
ステップS1904では、文字認識モジュール110が、画像105を文字認識し、各文字の色を抽出する。ステップS204と同等の処理を行うが、各文字のテキスト情報とともにその文字の色をも抽出する。
ステップS1906では、候補色文字抽出モジュール1820が、文字候補色情報1817を受け付ける。
ステップS1908では、候補色文字抽出モジュール1820が、文字認識結果であるテキスト列・各文字色1815内の文字候補色情報1817に該当する文字列(抽出文字列1825)を抽出する。
ステップS1910では、文字列DB検索モジュール530が、表示文字列・コマンドテーブル140から表示文字列を抽出する。ステップS206と同等の処理を行う。
FIG. 19 is a flowchart illustrating a processing example according to the fifth exemplary embodiment.
In step S1902, the character recognition module 110 receives the image 105. Processing equivalent to that in step S202 is performed.
In step S1904, the character recognition module 110 recognizes the image 105 and extracts the color of each character. A process equivalent to step S204 is performed, but the character color is extracted together with the text information of each character.
In step S1906, the candidate color character extraction module 1820 accepts the character candidate color information 1817.
In step S1908, the candidate color character extraction module 1820 extracts a character string (extracted character string 1825) corresponding to the character candidate color information 1817 in the text string / each character color 1815 as the character recognition result.
In step S1910, the character string DB search module 530 extracts a display character string from the display character string / command table 140. Processing equivalent to that in step S206 is performed.

ステップS1912では、抽出文字列1825内から表示文字列を検索する。つまり、ステップS1910で抽出した表示文字列をクエリとして、抽出文字列1825の検索を行う。検索は一般の検索アルゴリズムを利用すればよい
ステップS1914では、文字列検索モジュール120が、文字認識結果(抽出文字列1825)内に表示文字列があるか否かを判断し、ある場合はステップS1916へ進み、それ以外の場合はステップS1920へ進む。
ステップS1916では、文字列検索モジュール120が、表示文字列・コマンドテーブル140から検索された表示文字列に対応するコマンド125を抽出する。ステップS212と同等の処理を行う。
ステップS1918では、コマンド処理モジュール150が、コマンド125を解釈して、そのコマンド125の処理を行う。ステップS214と同等の処理を行う。
ステップS1920では、エラー処理を行う。ステップS216と同等の処理を行う。
In step S1912, the display character string is searched from the extracted character string 1825. That is, the extracted character string 1825 is searched using the display character string extracted in step S1910 as a query. The search may use a general search algorithm. In step S1914, the character string search module 120 determines whether or not there is a display character string in the character recognition result (extracted character string 1825). Otherwise, the process proceeds to step S1920.
In step S1916, the character string search module 120 extracts a command 125 corresponding to the display character string searched from the display character string / command table 140. Processing equivalent to that in step S212 is performed.
In step S 1918, the command processing module 150 interprets the command 125 and processes the command 125. Processing equivalent to that in step S214 is performed.
In step S1920, error processing is performed. Processing equivalent to that in step S216 is performed.

図20を参照して、本実施の形態の情報処理装置のハードウェア構成例について説明する。図20に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部2017と、プリンタなどのデータ出力部2018を備えたハードウェア構成例を示している。   A hardware configuration example of the information processing apparatus according to the present embodiment will be described with reference to FIG. The configuration illustrated in FIG. 20 is configured by, for example, a personal computer (PC), and illustrates a hardware configuration example including a data reading unit 2017 such as a scanner and a data output unit 2018 such as a printer.

CPU(Central Processing Unit)2001は、前述の実施の形態において説明した各種のモジュール、すなわち、文字認識モジュール110、文字列検索モジュール120、コマンド処理モジュール150、正規表現検索モジュール520、文字列DB検索モジュール530、候補位置文字抽出モジュール920、候補サイズ文字抽出モジュール1620、候補色文字抽出モジュール1820等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。   A CPU (Central Processing Unit) 2001 includes various modules described in the above-described embodiments, that is, a character recognition module 110, a character string search module 120, a command processing module 150, a regular expression search module 520, a character string DB search module. 530, a candidate position character extraction module 920, a candidate size character extraction module 1620, a candidate color character extraction module 1820, and the like are control units that execute processing according to a computer program describing an execution sequence of each module.

ROM(Read Only Memory)2002は、CPU2001が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)2003は、CPU2001の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス2004により相互に接続されている。   A ROM (Read Only Memory) 2002 stores programs, calculation parameters, and the like used by the CPU 2001. A RAM (Random Access Memory) 2003 stores programs used in the execution of the CPU 2001, parameters that change as appropriate during the execution, and the like. These are connected to each other by a host bus 2004 including a CPU bus.

ホストバス2004は、ブリッジ2005を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス2006に接続されている。   The host bus 2004 is connected via a bridge 2005 to an external bus 2006 such as a PCI (Peripheral Component Interconnect / Interface) bus.

キーボード2008、マウス等のポインティングデバイス2009は、操作者により操作される入力デバイスである。ディスプレイ2010は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。   A keyboard 2008 and a pointing device 2009 such as a mouse are input devices operated by an operator. The display 2010 includes a liquid crystal display device or a CRT (Cathode Ray Tube), and displays various types of information as text or image information.

HDD(Hard Disk Drive)2011は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU2001によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、画像105、テキスト列115、コマンド125、表示文字列・コマンドテーブル140、正規表現517、抽出文字列525、テキスト列・各文字位置915、文字候補位置情報917、テキスト列・各文字サイズ1615、文字候補サイズ情報1617、抽出文字列1625、テキスト列・各文字色1815、文字候補色情報1817、抽出文字列1825などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。   An HDD (Hard Disk Drive) 2011 includes a hard disk, drives the hard disk, and records or reproduces a program executed by the CPU 2001 and information. The hard disk includes an image 105, a text string 115, a command 125, a display character string / command table 140, a regular expression 517, an extracted character string 525, a text string / character positions 915, character candidate position information 917, a text string / characters. A size 1615, character candidate size information 1617, an extracted character string 1625, a text string / each character color 1815, character candidate color information 1817, an extracted character string 1825, and the like are stored. Further, various computer programs such as various other data processing programs are stored.

ドライブ2012は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体2013に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース2007、外部バス2006、ブリッジ2005、及びホストバス2004を介して接続されているRAM2003に供給する。リムーバブル記録媒体2013も、ハードディスクと同様のデータ記録領域として利用可能である。   The drive 2012 reads data or a program recorded in a removable recording medium 2013 such as a mounted magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory, and the data or program is read from the interface 2007 and an external bus 2006. , The bridge 2005, and the RAM 2003 connected via the host bus 2004. The removable recording medium 2013 can also be used as a data recording area similar to the hard disk.

接続ポート2014は、外部接続機器2015を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート2014は、インタフェース2007、及び外部バス2006、ブリッジ2005、ホストバス2004等を介してCPU2001等に接続されている。通信部2016は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部2017は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部2018は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。   The connection port 2014 is a port for connecting the external connection device 2015, and has a connection unit such as USB, IEEE1394. The connection port 2014 is connected to the CPU 2001 and the like via the interface 2007, the external bus 2006, the bridge 2005, the host bus 2004, and the like. The communication unit 2016 is connected to a communication line and executes data communication processing with the outside. The data reading unit 2017 is a scanner, for example, and executes document reading processing. The data output unit 2018 is, for example, a printer, and executes document data output processing.

なお、図20に示す情報処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図20に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図20に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。   Note that the hardware configuration of the information processing apparatus illustrated in FIG. 20 illustrates one configuration example, and the present embodiment is not limited to the configuration illustrated in FIG. 20, and the modules described in the present embodiment are executed. Any configuration is possible. For example, some modules may be configured with dedicated hardware (for example, Application Specific Integrated Circuit (ASIC), etc.), and some modules are in an external system and connected via a communication line In addition, a plurality of systems shown in FIG. 20 may be connected to each other via a communication line so as to cooperate with each other. Further, it may be incorporated in a copying machine, a fax machine, a scanner, a printer, a multifunction machine (an image processing apparatus having any two or more functions of a scanner, a printer, a copying machine, a fax machine, etc.).

なお、前述の各種の実施の形態を組み合わせてもよく(例えば、ある実施の形態内のモジュールを他の実施の形態内に追加する、入れ替えをする等も含む)、また、各モジュールの処理内容として背景技術で説明した技術を採用してもよい。例えば、正規表現検索モジュール520、候補位置文字抽出モジュール920、候補サイズ文字抽出モジュール1620、候補色文字抽出モジュール1820の2つ以上を組み合わせてもよい。
具体的には、正規表現、文字サイズ、文字位置、文字色を組み合わせて、候補を抽出してもよい。
限定条件1:正規表現
限定条件2:文字サイズ
限定条件3:文字位置
限定条件4:文字色
とした場合、全ての限定条件に合致する文字のみを候補として抽出する。もちろんのことながら、限定条件は1個でも2個でも3個でも4個でもそれ以上でもよい。
正規表現を用いない場合、形態素解析等を用いて単語に分離して、分離した単語を用いて、文字列DB検索モジュール530が表示文字列・コマンドテーブル140を検索してもよい。
Note that the above-described various embodiments may be combined (for example, adding or replacing a module in one embodiment in another embodiment), and processing contents of each module The technique described in the background art may be employed. For example, two or more of the regular expression search module 520, the candidate position character extraction module 920, the candidate size character extraction module 1620, and the candidate color character extraction module 1820 may be combined.
Specifically, candidates may be extracted by combining regular expressions, character sizes, character positions, and character colors.
Restriction condition 1: Regular expression Restriction condition 2: Character size Restriction condition 3: Character position Restriction condition 4: When character color is used, only characters that match all restriction conditions are extracted as candidates. Of course, the limiting condition may be one, two, three, four, or more.
When a regular expression is not used, the character string DB search module 530 may search the display character string / command table 140 using words separated by morphological analysis or the like and using the separated words.

文字列検索モジュール120(文字列DB検索モジュール530)は、複数の表示文字列が検索にヒットした場合、その表示文字列に対応するコマンド125の全てを、コマンド処理モジュール150に出力してもよいし、最初のコマンド125だけを、コマンド処理モジュール150に出力してもよい。
前述の例ではコマンド125としてURLを示したが、URLではなく、アプリケーション名、引数等であってもよく、コンピュータのアプリケーションを起動できるものであればよい。
図4、図8の例に示したテーブルの行に番号が振ってあるが、この番号は無くてもよい。
情報処理装置として、文字認識モジュール110は必須ではない。文字認識結果を受け付けることができれば、同様の処理、効果を得ることができる。
表示文字列・コマンドテーブル140の内容を書き換えることによって、表示文字列は変更せずに(つまり、撮影対象である文書の内容は変更することなしに)、コマンドだけ(URLだけ)を変更することが可能となる。
正規表現が表示文字列の全てを表現していない場合は、表現していない表示文字列を個々にクエリとして検索すればよい。
前述の例では、正規表現としていたが、類似の文字列限定方法であればよい。例えば、数字だけを抽出して、抜き出す等の単純な方式でもよい。
The character string search module 120 (character string DB search module 530) may output all of the commands 125 corresponding to the display character strings to the command processing module 150 when a plurality of display character strings hits the search. Then, only the first command 125 may be output to the command processing module 150.
In the above example, the URL is shown as the command 125. However, instead of the URL, an application name, an argument, or the like may be used as long as it can start a computer application.
Numbers are assigned to the rows of the tables shown in the examples of FIGS. 4 and 8, but this number may be omitted.
As the information processing apparatus, the character recognition module 110 is not essential. If the character recognition result can be received, similar processing and effects can be obtained.
By rewriting the contents of the display character string / command table 140, only the command (only the URL) is changed without changing the display character string (that is, without changing the content of the document to be photographed). Is possible.
If the regular expression does not represent all of the display character string, the display character string that is not expressed may be individually searched as a query.
In the above example, a regular expression is used, but a similar character string limiting method may be used. For example, a simple method of extracting only numbers and extracting them may be used.

なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
The program described above may be provided by being stored in a recording medium, or the program may be provided by communication means. In that case, for example, the above-described program may be regarded as an invention of a “computer-readable recording medium recording the program”.
The “computer-readable recording medium on which a program is recorded” refers to a computer-readable recording medium on which a program is recorded, which is used for program installation, execution, program distribution, and the like.
The recording medium is, for example, a digital versatile disc (DVD), which is a standard established by the DVD Forum, such as “DVD-R, DVD-RW, DVD-RAM,” and DVD + RW. Standard “DVD + R, DVD + RW, etc.”, compact disc (CD), read-only memory (CD-ROM), CD recordable (CD-R), CD rewritable (CD-RW), Blu-ray disc ( Blu-ray (registered trademark) Disc), magneto-optical disk (MO), flexible disk (FD), magnetic tape, hard disk, read-only memory (ROM), electrically erasable and rewritable read-only memory (EEPROM (registered trademark)) )), Flash memory, Random access memory (RAM) SD (Secure Digital) memory card and the like.
The program or a part of the program may be recorded on the recording medium for storage or distribution. Also, by communication, for example, a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), a wired network used for the Internet, an intranet, an extranet, etc., or wireless communication It may be transmitted using a transmission medium such as a network or a combination of these, or may be carried on a carrier wave.
Furthermore, the program may be a part of another program, or may be recorded on a recording medium together with a separate program. Moreover, it may be divided and recorded on a plurality of recording media. Further, it may be recorded in any manner as long as it can be restored, such as compression or encryption.

110…文字認識モジュール
120…文字列検索モジュール
140…表示文字列・コマンドテーブル
150…コマンド処理モジュール
520…正規表現検索モジュール
530…文字列DB検索モジュール
920…候補位置文字抽出モジュール
1620…候補サイズ文字抽出モジュール
1820…候補色文字抽出モジュール
DESCRIPTION OF SYMBOLS 110 ... Character recognition module 120 ... Character string search module 140 ... Display character string and command table 150 ... Command processing module 520 ... Regular expression search module 530 ... Character string DB search module 920 ... Candidate position character extraction module 1620 ... Candidate size character extraction Module 1820 ... Candidate color character extraction module

Claims (7)

文字認識結果を受け付ける受付手段と、
表示文字列と処理情報を対応させて記憶する記憶手段と、
前記文字認識結果内から前記表示文字列を検索する検索手段と、
前記検索手段によって前記文字認識結果内から前記表示文字列が検索できた場合は、前記記憶手段から該表示文字列に対応する処理情報を抽出する抽出手段と、
前記抽出手段によって抽出された処理情報に基づいて、処理を行う処理手段
を具備することを特徴とする情報処理装置。
A receiving means for receiving the character recognition result;
Storage means for storing display character strings and processing information in association with each other;
Search means for searching for the display character string from the character recognition result;
An extraction means for extracting processing information corresponding to the display character string from the storage means when the display character string can be searched from the character recognition result by the search means;
An information processing apparatus comprising processing means for performing processing based on the processing information extracted by the extraction means.
前記文字認識結果内から前記表示文字列としての候補を検索する候補検索手段
をさらに具備し、
前記検索手段は、前記候補検索手段によって検索された候補内から前記表示文字列を検索する
ことを特徴とする請求項1に記載の情報処理装置。
Candidate search means for searching for candidates as the display character string from the character recognition result further comprises:
The information processing apparatus according to claim 1, wherein the search unit searches the display character string from candidates searched by the candidate search unit.
前記候補検索手段における前記候補は、前記表示文字列の一部又は全てを示す正規表現で記載された情報であり、
前記候補検索手段は、前記文字認識結果に対して、前記候補の正規表現検索を行うことによって検索する
ことを特徴とする請求項2に記載の情報処理装置。
The candidate in the candidate search means is information described in a regular expression indicating a part or all of the display character string,
The information processing apparatus according to claim 2, wherein the candidate search unit searches the character recognition result by performing a regular expression search for the candidate.
前記候補検索手段における前記候補は、表示文字が存在する位置の範囲を示す情報であり、前記文字認識結果には、各文字の位置が含まれており、
前記候補検索手段は、前記文字認識結果に対して、認識文字の位置が前記候補の範囲に該当するものを抽出することによって検索する
ことを特徴とする請求項2又は3に記載の情報処理装置。
The candidate in the candidate search means is information indicating a range of positions where display characters exist, and the character recognition result includes the position of each character,
The information processing apparatus according to claim 2, wherein the candidate search unit searches the character recognition result by extracting a character whose recognized character position falls within the range of the candidate. .
前記候補検索手段における前記候補は、表示文字の大きさの範囲を示す情報であり、前記文字認識結果には、各文字の大きさが含まれており、
前記候補検索手段は、前記文字認識結果に対して、認識文字の大きさが前記候補の範囲に該当するものを抽出することによって検索する
ことを特徴とする請求項2から4のいずれか一項に記載の情報処理装置。
The candidate in the candidate search means is information indicating a range of display character size, and the character recognition result includes the size of each character,
The candidate search means searches for the character recognition result by extracting a character whose recognized character size falls within the candidate range. The information processing apparatus described in 1.
前記候補検索手段における前記候補は、表示文字の色の範囲を示す情報であり、前記文字認識結果には、各文字の色が含まれており、
前記候補検索手段は、前記文字認識結果に対して、認識文字の色が前記候補の範囲に該当するものを抽出することによって検索する
ことを特徴とする請求項2から5のいずれか一項に記載の情報処理装置。
The candidate in the candidate search means is information indicating a display character color range, and the character recognition result includes the color of each character,
The said candidate search means searches by extracting the thing from which the color of a recognition character corresponds to the said candidate range with respect to the said character recognition result. The Claim 1 characterized by the above-mentioned. The information processing apparatus described.
コンピュータを、
文字認識結果を受け付ける受付手段と、
表示文字列と処理情報を対応させて記憶する記憶手段と、
前記文字認識結果内から前記表示文字列を検索する検索手段と、
前記検索手段によって前記文字認識結果内から前記表示文字列が検索できた場合は、前記記憶手段から該表示文字列に対応する処理情報を抽出する抽出手段と、
前記抽出手段によって抽出された処理情報に基づいて、処理を行う処理手段
として機能させるための情報処理プログラム。
Computer
A receiving means for receiving the character recognition result;
Storage means for storing display character strings and processing information in association with each other;
Search means for searching for the display character string from the character recognition result;
An extraction means for extracting processing information corresponding to the display character string from the storage means when the display character string can be searched from the character recognition result by the search means;
An information processing program for causing a processing unit to perform processing based on processing information extracted by the extraction unit.
JP2013206926A 2013-10-02 2013-10-02 Information processing apparatus and information processing program Expired - Fee Related JP6187108B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013206926A JP6187108B2 (en) 2013-10-02 2013-10-02 Information processing apparatus and information processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013206926A JP6187108B2 (en) 2013-10-02 2013-10-02 Information processing apparatus and information processing program

Publications (2)

Publication Number Publication Date
JP2015072533A true JP2015072533A (en) 2015-04-16
JP6187108B2 JP6187108B2 (en) 2017-08-30

Family

ID=53014873

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013206926A Expired - Fee Related JP6187108B2 (en) 2013-10-02 2013-10-02 Information processing apparatus and information processing program

Country Status (1)

Country Link
JP (1) JP6187108B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002163604A (en) * 2000-11-28 2002-06-07 Canon Inc System and method for acquiring url, and storage medium stored with program for executing processing therefor
JP2003141003A (en) * 2001-10-30 2003-05-16 Canon Inc Network terminal device, network system, content acquiring method for network terminal device, printed matter forming method for network terminal device, and content delivery method and program for network system
JP2004118281A (en) * 2002-09-24 2004-04-15 Fujitsu Social Science Laboratory Ltd Extracted character string dictionary search device and method therefor, and program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002163604A (en) * 2000-11-28 2002-06-07 Canon Inc System and method for acquiring url, and storage medium stored with program for executing processing therefor
JP2003141003A (en) * 2001-10-30 2003-05-16 Canon Inc Network terminal device, network system, content acquiring method for network terminal device, printed matter forming method for network terminal device, and content delivery method and program for network system
JP2004118281A (en) * 2002-09-24 2004-04-15 Fujitsu Social Science Laboratory Ltd Extracted character string dictionary search device and method therefor, and program

Also Published As

Publication number Publication date
JP6187108B2 (en) 2017-08-30

Similar Documents

Publication Publication Date Title
CN108959586B (en) Identifying textual terms in response to a visual query
US8892990B2 (en) Automatic creation of a table and query tools
JP2004234228A (en) Image search device, keyword assignment method in image search device, and program
US8244037B2 (en) Image-based data management method and system
US20140254942A1 (en) Systems and methods for obtaining information based on an image
JP2009295153A (en) Web based text detection method and web based system
JP2007286864A (en) Image processor, image processing method, program, and recording medium
US20110157215A1 (en) Image output device, image output system and image output method
US20160026858A1 (en) Image based search to identify objects in documents
US9658991B2 (en) Reordering text from unstructured sources to intended reading flow
JP2010072842A (en) Image processing apparatus and image processing method
US20110125731A1 (en) Information processing apparatus, information processing method, program, and information processing system
US10152540B2 (en) Linking thumbnail of image to web page
JP2014010722A (en) Retrieval device, retrieval method and program
US11670067B2 (en) Information processing apparatus and non-transitory computer readable medium
US20210295033A1 (en) Information processing apparatus and non-transitory computer readable medium
JP2008191936A (en) Method for supporting construction of content registration/search system, and apparatus for supporting construction of content registration/search system
US8077977B2 (en) Image processing system, image processing method, computer readable medium and computer data signal
JP6187108B2 (en) Information processing apparatus and information processing program
JP4391157B2 (en) Document processing apparatus, document processing method, document processing program, and recording medium
JP5913774B2 (en) Web site sharing method, electronic device, and computer program
US11995908B2 (en) Information processing device and non-transitory computer readable medium
US20210295032A1 (en) Information processing device and non-transitory computer readable medium
US20210191991A1 (en) Information processing apparatus and non-transitory computer readable medium
JP4765831B2 (en) Image processing system and image processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160524

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170310

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170508

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170704

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170717

R150 Certificate of patent or registration of utility model

Ref document number: 6187108

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees