JP2015072533A - Information processing apparatus and information processing program - Google Patents
Information processing apparatus and information processing program Download PDFInfo
- Publication number
- JP2015072533A JP2015072533A JP2013206926A JP2013206926A JP2015072533A JP 2015072533 A JP2015072533 A JP 2015072533A JP 2013206926 A JP2013206926 A JP 2013206926A JP 2013206926 A JP2013206926 A JP 2013206926A JP 2015072533 A JP2015072533 A JP 2015072533A
- Authority
- JP
- Japan
- Prior art keywords
- character
- character string
- candidate
- display
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 38
- 238000000605 extraction Methods 0.000 claims abstract description 56
- 230000014509 gene expression Effects 0.000 claims description 44
- 238000000034 method Methods 0.000 description 41
- 230000008569 process Effects 0.000 description 27
- 239000000284 extract Substances 0.000 description 19
- 238000010586 diagram Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 13
- 238000004590 computer program Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000010845 search algorithm Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
Images
Landscapes
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、情報処理装置及び情報処理プログラムに関する。 The present invention relates to an information processing apparatus and an information processing program.
特許文献1には、印刷物に記載されたURIを読み取ってインターネットのWWWサーバから該当するコンテンツを取得し表示する携帯型情報端末装置を提供することを課題とし、人が片手で把持できる程度のサイズの情報端末装置の上面には、表示装置、操作スイッチ、実行ボタン、スピーカ、アンテナ、読み取り開始ボタンが設けられ、底面にはスキャナ用の読み取り窓が設けられ、印刷物上のURIを含むエリアの画像を、読み取り窓を通じて内部のスキャナで読み取ると、その画像中からURIが抽出され、内蔵のブラウザが起動され、ブラウザは無線通信回線によって接続されるプロバイダー経由でURIに対応するコンテンツをインターネット上のWWWサーバから取得し、表示装置に表示することが開示されている。
特許文献2には、操作に不慣れな者でも、所定のアプリケーションプログラムを迅速かつ確実に起動できるようにすることを課題とし、例えば、ワードプロセッサプログラムの名称として「三太郎」、その後に「.」で区切られて三太郎で開く(処理を開始するためにデータを取り込む)べきファイル名として「特許明細書」と印刷されたカード状のオブジェクトのように、所定のアプリケーションプログラムの名称と、その引数が印刷されたカード状のオブジェクトをCCDビデオカメラにより撮像させ、パーソナルコンピュータは、CCDビデオカメラにより撮像された画像データを文字認識処理し、認識した結果得られた文字の名称のアプリケーションプログラムを起動させた後、引数として認識されたファイル名のデータ取り込みやオプション設定などの操作を自動的に実行させることが開示されている。 Japanese Patent Laid-Open No. 2004-26883 has a problem that even a person unfamiliar with the operation can quickly and surely start a predetermined application program. The name of a given application program and its arguments are printed, such as a card-like object that is printed as “patent specification” as the file name to be opened by Santaro (capture data to start processing). After the card-like object is imaged by the CCD video camera, the personal computer performs character recognition processing on the image data imaged by the CCD video camera, and after starting the application program of the character name obtained as a result of recognition, Import data of recognized file names as arguments Causing operations such descriptions set automatically executed is disclosed.
特許文献3には、インターネットを簡単に利用することができるようにすることを課題とし、世界規模で広がるインターネット上の情報ソースを一意に特定するURLが印刷されているカード状のオブジェクトをCCDビデオカメラに撮像させ、パーソナルコンピュータは、CCDビデオカメラにより撮像された画像データから文字認識処理によりURLを認識すると、インターネットブラウザを起動した後、文字認識して得られたURLに自動的にアクセスして、情報を表示することが開示されている。
In
本発明は、画像内に含まれている表示文字列が認識された場合に、その表示文字列に対応する処理を行うようにした情報処理装置及び情報処理プログラムを提供することを目的としている。 An object of the present invention is to provide an information processing apparatus and an information processing program that perform processing corresponding to a display character string when a display character string included in an image is recognized.
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、文字認識結果を受け付ける受付手段と、表示文字列と処理情報を対応させて記憶する記憶手段と、前記文字認識結果内から前記表示文字列を検索する検索手段と、前記検索手段によって前記文字認識結果内から前記表示文字列が検索できた場合は、前記記憶手段から該表示文字列に対応する処理情報を抽出する抽出手段と、前記抽出手段によって抽出された処理情報に基づいて、処理を行う処理手段を具備することを特徴とする情報処理装置である。
The gist of the present invention for achieving the object lies in the inventions of the following items.
The invention of
請求項2の発明は、前記文字認識結果内から前記表示文字列としての候補を検索する候補検索手段をさらに具備し、前記検索手段は、前記候補検索手段によって検索された候補内から前記表示文字列を検索することを特徴とする請求項1に記載の情報処理装置である。
The invention of
請求項3の発明は、前記候補検索手段における前記候補は、前記表示文字列の一部又は全てを示す正規表現で記載された情報であり、前記候補検索手段は、前記文字認識結果に対して、前記候補の正規表現検索を行うことによって検索することを特徴とする請求項2に記載の情報処理装置である。
According to a third aspect of the present invention, the candidate in the candidate search means is information described in a regular expression indicating a part or all of the display character string, and the candidate search means The information processing apparatus according to
請求項4の発明は、前記候補検索手段における前記候補は、表示文字が存在する位置の範囲を示す情報であり、前記文字認識結果には、各文字の位置が含まれており、前記候補検索手段は、前記文字認識結果に対して、認識文字の位置が前記候補の範囲に該当するものを抽出することによって検索することを特徴とする請求項2又は3に記載の情報処理装置である。
According to a fourth aspect of the present invention, the candidate in the candidate search means is information indicating a range of positions where display characters exist, and the character recognition result includes a position of each character, and the candidate search The information processing apparatus according to
請求項5の発明は、前記候補検索手段における前記候補は、表示文字の大きさの範囲を示す情報であり、前記文字認識結果には、各文字の大きさが含まれており、前記候補検索手段は、前記文字認識結果に対して、認識文字の大きさが前記候補の範囲に該当するものを抽出することによって検索することを特徴とする請求項2から4のいずれか一項に記載の情報処理装置である。
According to a fifth aspect of the present invention, the candidate in the candidate search means is information indicating a range of display character size, and the character recognition result includes the size of each character, and the candidate search 5. The method according to
請求項6の発明は、前記候補検索手段における前記候補は、表示文字の色の範囲を示す情報であり、前記文字認識結果には、各文字の色が含まれており、前記候補検索手段は、前記文字認識結果に対して、認識文字の色が前記候補の範囲に該当するものを抽出することによって検索することを特徴とする請求項2から5のいずれか一項に記載の情報処理装置である。
According to a sixth aspect of the present invention, the candidate in the candidate search means is information indicating a color range of display characters, and the character recognition result includes a color of each character. The information processing apparatus according to
請求項7の発明は、コンピュータを、文字認識結果を受け付ける受付手段と、表示文字列と処理情報を対応させて記憶する記憶手段と、前記文字認識結果内から前記表示文字列を検索する検索手段と、前記検索手段によって前記文字認識結果内から前記表示文字列が検索できた場合は、前記記憶手段から該表示文字列に対応する処理情報を抽出する抽出手段と、前記抽出手段によって抽出された処理情報に基づいて、処理を行う処理手段として機能させるための情報処理プログラムである。 The invention of claim 7 is a computer for receiving a character recognition result, a storage unit for storing a display character string and processing information in association with each other, and a search unit for searching for the display character string from the character recognition result. And when the display character string can be searched from within the character recognition result by the search means, an extraction means for extracting processing information corresponding to the display character string from the storage means, and an extraction means extracted by the extraction means It is an information processing program for functioning as a processing means for performing processing based on processing information.
請求項1の情報処理装置によれば、画像内に含まれている表示文字列が認識された場合に、その表示文字列に対応する処理を行うことができる。 According to the information processing apparatus of the first aspect, when a display character string included in the image is recognized, a process corresponding to the display character string can be performed.
請求項2の情報処理装置によれば、本構成を有していない場合に比較して、表示文字列に対応する処理情報を高速に検索することができる。 According to the information processing apparatus of the second aspect, the processing information corresponding to the display character string can be searched at a higher speed than in the case where the present configuration is not provided.
請求項3の情報処理装置によれば、文字認識結果に対して、正規表現検索を行うことによって検索対象を少なくすることができる。 According to the information processing apparatus of the third aspect, it is possible to reduce the number of search objects by performing a regular expression search on the character recognition result.
請求項4の情報処理装置によれば、文字認識結果に対して、認識文字の位置が候補の範囲に該当するものを抽出することによって検索対象を少なくすることができる。 According to the information processing apparatus of the fourth aspect, it is possible to reduce the number of search objects by extracting the character recognition result whose position of the recognized character falls within the candidate range.
請求項5の情報処理装置によれば、文字認識結果に対して、認識文字の大きさが候補の範囲に該当するものを抽出することによって検索対象を少なくすることができる。 According to the information processing apparatus of the fifth aspect, it is possible to reduce the number of search objects by extracting the character recognition result whose character size corresponds to the candidate range.
請求項6の情報処理装置によれば、文字認識結果に対して、認識文字の色が候補の範囲に該当するものを抽出することによって検索対象を少なくすることができる。 According to the information processing apparatus of the sixth aspect, it is possible to reduce the number of search objects by extracting the character recognition result whose color of the recognized character falls within the candidate range.
請求項7の情報処理プログラムによれば、画像内に含まれている表示文字列が認識された場合に、その表示文字列に対応する処理を行うことができる。 According to the information processing program of the seventh aspect, when a display character string included in the image is recognized, a process corresponding to the display character string can be performed.
まず、本実施の形態を説明する前に、その前提となる技術について説明する。なお、この説明は、本実施の形態の理解を容易にすることを目的とするものである。
例えば、特許文献1に記載の技術では、PDA(Personal Digital Assistants)、PC(Personal Computer)付属カメラで、画像を撮影し、その画像内の文字を認識し、画像内に記載されているURL(Uniform Resource Locator、なお、URI:Uniform Resource Identifierを含む)を抽出する。予め「http://」等のキーワードを登録しておき、キーワードで開始する文字列を抽出する。そして、認識したURL(URI)をwebブラウザで自動表示する。
また、例えば、特許文献2に記載の技術では、PDA、PC付属カメラで、画像を撮影し、その画像内の文字を認識し、画像内に記載されているコマンドを抽出する。例えば、予め「ワードプロセッサ」という単語をコマンド名として登録しておき、文字認識結果が登録してあるコマンド名と合致すれば、コマンドとして抽出する。そして、コマンドの次の文字列を引数として抽出し、コマンドと引数を用いて、アプリケーション(コンピュータ・プログラム)を起動する。例えば、コマンドが「ワードプロセッサ」、引数が「文書」である場合、「ワードプロセッサ」というアプリケーションを起動して、「文書」を開くことになる。
これらの技術では、画像内にURLやコマンド名がそのまま記載されているときのみ、webブラウザ等のコマンドを自動起動させることができるものである。
文書にURLを直接記載すると、画像としては煩雑となってしまい、デザイン性が失われる場合が多い。例えば、URLには、意味の無い英数字の長い文字列が記載されていることが多く、見た目が美しくない。
また、画像自体は変更せずに、URLやコマンドのみを変更したい場合がある。そのため、URLやコマンドを変更しようとすると、チラシ、カタログなどの文書のデザインを変更しなければならなくなる。デザインは時間とコストをかけて作成されているものであり、簡単に変更できない。そのため、URLやコマンドが簡単に変更できないという問題点がある。
従来技術では、文字認識を行ったテキスト列の中からURLやコマンドの検索が簡単にできることを前提としている。例えば、登録したURLやコマンドの種類が莫大である場合に、その検索に時間がかかることとなる。登録したURLやコマンド数がNの場合、N回の検索をテキスト列に対して掛けないといけなくなる。Nが大きな数である場合には、現実的な時間で終了しなくなる。
First, before explaining the present embodiment, a technique that is a premise thereof will be described. This description is intended to facilitate understanding of the present embodiment.
For example, in the technique described in
Further, for example, in the technique described in
In these techniques, a command such as a web browser can be automatically activated only when a URL or a command name is described as it is in an image.
If the URL is directly described in the document, the image becomes complicated and the design is often lost. For example, a long string of meaningless alphanumeric characters is often described in the URL, and the appearance is not beautiful.
In some cases, it is desired to change only the URL and the command without changing the image itself. Therefore, if the URL or command is to be changed, the design of a document such as a flyer or a catalog must be changed. Designs are time-consuming and costly and cannot be changed easily. Therefore, there is a problem that the URL and the command cannot be easily changed.
The prior art is based on the premise that URLs and commands can be easily retrieved from a text string that has been subjected to character recognition. For example, when the number of registered URLs and commands is enormous, the search takes time. If the number of registered URLs and commands is N, N searches must be performed on the text string. When N is a large number, it does not end in a realistic time.
以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
<第1の実施の形態>
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
Hereinafter, examples of various preferred embodiments for realizing the present invention will be described with reference to the drawings.
<First Embodiment>
FIG. 1 is a conceptual module configuration diagram of a configuration example according to the first embodiment.
The module generally refers to components such as software (computer program) and hardware that can be logically separated. Therefore, the module in the present embodiment indicates not only a module in a computer program but also a module in a hardware configuration. Therefore, the present embodiment is a computer program for causing these modules to function (a program for causing a computer to execute each procedure, a program for causing a computer to function as each means, and a function for each computer. This also serves as an explanation of the program and system and method for realizing the above. However, for the sake of explanation, the words “store”, “store”, and equivalents thereof are used. However, when the embodiment is a computer program, these words are stored in a storage device or stored in memory. It is the control to be stored in the device. Modules may correspond to functions one-to-one, but in mounting, one module may be configured by one program, or a plurality of modules may be configured by one program, and conversely, one module May be composed of a plurality of programs. The plurality of modules may be executed by one computer, or one module may be executed by a plurality of computers in a distributed or parallel environment. Note that one module may include other modules. Hereinafter, “connection” is used not only for physical connection but also for logical connection (data exchange, instruction, reference relationship between data, etc.). “Predetermined” means that the process is determined before the target process, and not only before the process according to this embodiment starts but also after the process according to this embodiment starts. In addition, if it is before the target processing, it is used in accordance with the situation / state at that time or with the intention to be decided according to the situation / state up to that point. When there are a plurality of “predetermined values”, they may be different values, or two or more values (of course, including all values) may be the same. In addition, the description having the meaning of “do B when it is A” is used in the meaning of “determine whether or not it is A and do B when it is judged as A”. However, the case where it is not necessary to determine whether or not A is excluded.
In addition, the system or device is configured by connecting a plurality of computers, hardware, devices, and the like by communication means such as a network (including one-to-one correspondence communication connection), etc., and one computer, hardware, device. The case where it implement | achieves by etc. is included. “Apparatus” and “system” are used as synonymous terms. Of course, the “system” does not include a social “mechanism” (social system) that is an artificial arrangement.
In addition, when performing a plurality of processes in each module or in each module, the target information is read from the storage device for each process, and the processing result is written to the storage device after performing the processing. is there. Therefore, description of reading from the storage device before processing and writing to the storage device after processing may be omitted. Here, the storage device may include a hard disk, a RAM (Random Access Memory), an external storage medium, a storage device via a communication line, a register in a CPU (Central Processing Unit), and the like.
第1の実施の形態である情報処理装置は、表示文字列が記載された文書を撮影した画像を文字認識し、その表示文字列に対応する処理を行うものであって、図1の例に示すように、文字認識モジュール110、文字列検索モジュール120、表示文字列・コマンドテーブル140、コマンド処理モジュール150を有している。表示文字列に対応する処理としては、例えば、webページを自動表示すること、アプリケーションを自動起動すること等がある。具体的には、表示文字列が含まれている文書を、カメラ付きの携帯情報端末で撮影し、その画像を文字認識し、その表示文字列と対応する処理を行わせるものである。
また、表示文字列には、文書においてデザイン上違和感のあるURL、コマンドは含まない。つまり、URLやコマンドを記載しなくても、webブラウザ等のコマンドを動作させるものである。
The information processing apparatus according to the first embodiment performs character recognition on an image obtained by photographing a document in which a display character string is described, and performs processing corresponding to the display character string. As shown, it has a
In addition, the display character string does not include URLs and commands that are uncomfortable in design in the document. That is, a command such as a web browser is operated without describing a URL or a command.
文字認識モジュール110は、文字列検索モジュール120と接続されている。文字認識モジュール110は、文字が記載されている画像105を受け付け、その画像105を文字認識する。画像105を受け付けるとは、例えば、カメラ、スキャナ等で画像105を読み込むこと、ファックス等で通信回線を介して外部機器から画像105を受信すること、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像105を読み出すこと等が含まれる。画像105は、2値画像、多値画像(カラー画像を含む)であってもよい。受け付ける画像105は、1枚であってもよいし、複数枚であってもよい。また、画像105の内容として、広告宣伝用のパンフレット、ビジネスに用いられる文書等であってもよい。文字認識は、既存の技術を用いればよい。
そして、文字認識モジュール110の文字認識結果として、テキスト列115を文字列検索モジュール120に渡す。
The
Then, the
表示文字列・コマンドテーブル140は、文字列検索モジュール120と接続されている。表示文字列・コマンドテーブル140は、表示文字列と処理情報(以下、コマンドともいう)を対応させて記憶する。例えば、表示文字列・コマンドテーブル400を記憶している。図4は、表示文字列・コマンドテーブル400のデータ構造例を示す説明図である。表示文字列・コマンドテーブル400は、番号欄410、表示文字列欄420、コマンド欄430を有している。番号欄410は、表示文字列とコマンドの対応を、本実施の形態において一意に識別するための番号を記憶している。表示文字列欄420は、表示文字列を記憶している。つまり、文字認識の対象となった画像105内に記載されている可能性がある表示文字列が記憶されている。コマンド欄430は、その表示文字列に対応するコマンドを記憶している。コマンド欄430に記憶させるコマンドとして、URLであってもよく、その場合のコマンド処理は、そのURLにアクセスするためのwebブラウザを起動することである。また、コマンド欄430に記憶させるコマンドとして、アプリケーション名及びその引数(引数が無い場合もある)であってもよく、その場合のコマンド処理は、そのアプリケーションを起動することである。
The display character string / command table 140 is connected to the character
文字列検索モジュール120は、文字認識モジュール110、表示文字列・コマンドテーブル140、コマンド処理モジュール150と接続されている。文字列検索モジュール120は、文字認識結果であるテキスト列115内から表示文字列・コマンドテーブル140に記憶されている表示文字列を検索する。具体的には、表示文字列・コマンドテーブル400の表示文字列欄420が記憶している表示文字列とテキスト列115とのマッチング処理を行う。
そして、文字列検索モジュール120は、その検索によってテキスト列115内から表示文字列が検索できた場合は、表示文字列・コマンドテーブル140からその表示文字列に対応する処理情報を抽出する。具体的には、検索された表示文字列に対応する表示文字列・コマンドテーブル400のコマンド欄430が記憶しているコマンド125を抽出する。
The character
If the display character string can be searched from the
コマンド処理モジュール150は、文字列検索モジュール120と接続されている。コマンド処理モジュール150は、文字列検索モジュール120によって抽出された処理情報であるコマンド125に基づいて、処理を行う。前述したように、コマンド125がURLである場合は、そのURLにアクセスするためのwebブラウザを起動する。また、コマンド125がアプリケーション名及びその引数である場合は、そのアプリケーションを起動する。
The
図2は、第1の実施の形態による処理例を示すフローチャートである。
ステップS202では、文字認識モジュール110が、画像105を受け付ける。例えば、デジタルカメラ、カメラ付きスマートフォン等の携帯情報端末で、写真を取得する。カタログなどの文書における商品の写真を撮る。写真はデジタル画像(画像105)として取り込まれる。
ステップS204では、文字認識モジュール110が、画像105を文字認識する。つまり、画像105は文字認識されて、画像105中の文字がテキスト列115に変換されて出力される。例えば、文字認識結果であるテキスト列115として、図3に例示のテキスト列315である「商品の説明文:本商品(商品番号123−456)は大変お買い得で、センスも良く、お値段も手ごろ。そのうえ、色や形も抜群。買わない手はありません。」がある。
FIG. 2 is a flowchart illustrating a processing example according to the first exemplary embodiment.
In step S202, the
In step S204, the
ステップS206では、文字列検索モジュール120が、表示文字列・コマンドテーブル140から表示文字列を抽出する。例えば、表示文字列・コマンドテーブル140内の表示文字列・コマンドテーブル400には、表示文字列(表示文字列欄420)とコマンド(コマンド欄430)がペアとなって格納されている。表示文字列は画像105内に記入される可能性のある文字列である。図4の例では、表示文字列として、商品番号が格納されている。また、コマンドとしてURLが格納されている。番号(番号欄410)の1番から順に、表示文字列を表示文字列・コマンドテーブル400から抽出する。
ステップS208では、文字列検索モジュール120が、文字認識結果内から表示文字列を検索する。つまり、ステップS206で抽出した表示文字列をクエリとして、テキスト列115の検索を行う。検索は一般の全文検索アルゴリズム等を利用すればよい。図3、図4の例では、表示文字列・コマンドテーブル400内の1番目の「123−456」が、テキスト列315から検索されることとなる。
In step S <b> 206, the character
In step S208, the character
ステップS210では、文字列検索モジュール120が、文字認識結果内に表示文字列があるか否かを判断し、ある場合はステップS212へ進み、それ以外の場合はステップS216へ進む。検索にヒットした場合(ステップS210でY)、テキスト列115の中に抽出した表示文字列が存在していることとなる。
ステップS212では、文字列検索モジュール120が、表示文字列・コマンドテーブル140から検索された表示文字列に対応するコマンド125を抽出する。例えば、表示文字列・コマンドテーブル400内で、その表示文字列とペアになっているコマンド125を抽出する。
ステップS214では、コマンド処理モジュール150が、コマンド125を解釈して、そのコマンド125の処理を行う。図3、図4の例では、検索された表示文字列に対応するURL(表示文字列・コマンドテーブル400内の番号:1のhttp://www.abc.def/xxx)をwebブラウザで表示する。
ステップS216では、エラー処理を行う。例えば、「撮影した画像内には、コマンドに対応する表示文字列が無い」旨を、表示装置に表示するようにしてもよい。また、単に文書を撮影したのみで、エラー表示等の処理は行わなくてもよい。
In step S210, the character
In step S212, the character
In step S214, the
In step S216, error processing is performed. For example, it may be displayed on the display device that “there is no display character string corresponding to the command in the photographed image”. Further, it is not necessary to perform processing such as error display only by photographing a document.
<第2の実施の形態>
図5は、第2の実施の形態の構成例についての概念的なモジュール構成図である。
なお、前述の実施の形態と同種の部位には同一符号を付し重複した説明を省略する(以下、同様)。
第2の実施の形態である情報処理装置は、表示文字列が記載された文書を撮影した画像を文字認識し、その表示文字列に対応する処理を行うものであって、図5の例に示すように、文字認識モジュール110、正規表現検索モジュール520、文字列DB検索モジュール530、表示文字列・コマンドテーブル140、コマンド処理モジュール150を有している。特に、登録した表示文字列の数が膨大であっても、現実的な時間で動作する。
<Second Embodiment>
FIG. 5 is a conceptual module configuration diagram of a configuration example according to the second embodiment.
In addition, the same code | symbol is attached | subjected to the site | part of the same kind as the above-mentioned embodiment, and the overlapping description is abbreviate | omitted (hereinafter the same).
The information processing apparatus according to the second embodiment performs character recognition on an image obtained by photographing a document in which a display character string is described, and performs processing corresponding to the display character string. As shown, a
表示文字列・コマンドテーブル140が記憶している表示文字列と処理情報の対応は多くてもよい。第1の実施の形態では、各行毎に表示文字列をクエリとしてテキスト列内の文字列を検索する例を示したが、その方法では、表示文字列数に比例する時間が検索に必要となる。1検索に1ms必要な場合、かつ、100万この表示文字列がある場合を例にとると、1000秒必要になってしまう。
そこで、第2の実施の形態では以下の動作を行う。
まず、全表示文字列(又は、大部分の表示文字列)に合致する正規表現517を生成する。例えば、表示文字列・コマンドテーブル140内の表示文字列を解析して、「3桁の数字−3桁の数字」という正規表現517を生成する。正規表現517の生成は、既存の手法を用いればよい。この正規表現517をクエリとして、正規表現検索モジュール520は、テキスト列115に対して正規表現検索を行う。正規表現検索としては、正規表現ライブラリを用いたり、grepコマンドを用いたりすれば実現できる。
正規表現検索モジュール520は、正規表現検索にヒットした場合の文字列(抽出文字列525)を文字列DB検索モジュール530に渡す。図7の例で、「3桁の数字−3桁の数字」という正規表現の場合、「123−456」、「333−333」の2つの文字列が抽出文字列525としてある。
これらの抽出文字列525をクエリとして、文字列DB検索モジュール530が、表示文字列・コマンドテーブル140から、抽出文字列525に合致する表示文字列を検索する。この検索方法としては、一般的な文字列検索を用いることができる。
文字列DB検索モジュール530における検索の結果、ヒットした表示文字列に対応するコマンド125を出力する。
このようにすることによって、表示文字列・コマンドテーブル140内の全ての表示文字列をクエリにする必要がなくなり、検索が高速化される。
The correspondence between the display character string stored in the display character string / command table 140 and the processing information may be many. In the first embodiment, an example of searching for a character string in a text string using a display character string as a query for each row has been shown. However, in this method, a time proportional to the number of display character strings is required for the search. . If 1 ms is required for one search and there are 1 million display character strings, 1000 seconds are required.
Therefore, the following operation is performed in the second embodiment.
First, a
The regular
Using these extracted
As a result of the search in the character string
By doing so, it is not necessary to use all the display character strings in the display character string / command table 140 as queries, and the search speeds up.
図5の例に示したモジュール間の関係、処理としては、以下のようになる。
文字認識モジュール110は、正規表現検索モジュール520と接続されている。
正規表現検索モジュール520は、文字認識モジュール110、文字列DB検索モジュール530と接続されている。正規表現検索モジュール520は、文字認識結果であるテキスト列115内から表示文字列としての候補を検索する。ここでの候補は、表示文字列の一部又は全てを示す正規表現で記載された情報であり、正規表現検索モジュール520は、テキスト列115に対して、候補の正規表現検索を行うことによって検索する。
文字列DB検索モジュール530は、正規表現検索モジュール520、表示文字列・コマンドテーブル140、コマンド処理モジュール150と接続されている。文字列DB検索モジュール530は、正規表現検索モジュール520によって検索された候補内から表示文字列を検索する。
表示文字列・コマンドテーブル140は、文字列DB検索モジュール530と接続されている。コマンド処理モジュール150は、文字列DB検索モジュール530と接続されている。
The relationship and processing between modules shown in the example of FIG. 5 are as follows.
The
The regular
The character string
The display character string / command table 140 is connected to the character string
図6は、第2の実施の形態による処理例を示すフローチャートである。
ステップS602では、文字認識モジュール110が、画像105を受け付ける。ステップS202と同等の処理を行う。
ステップS604では、文字認識モジュール110が、画像105を文字認識する。ステップS204と同等の処理を行う。図7に例示のテキスト列715である「商品の説明文:本商品(商品番号123−456)は大変お買い得で、センスも良く、お値段も手ごろ。そのうえ、色や形も抜群。買わない手はありません。電話番号は333−3333」がある。
FIG. 6 is a flowchart illustrating a processing example according to the second exemplary embodiment.
In step S602, the
In step S604, the
ステップS606では、正規表現検索モジュール520が、表示文字列・コマンドテーブル140内の表示文字列から生成された正規表現517を受け付ける。例えば、表示文字列・コマンドテーブル140内には図8に例示の表示文字列・コマンドテーブル800が記憶されている。表示文字列・コマンドテーブル800は、図4に例示の表示文字列・コマンドテーブル400と同等のものである。ただし、表示文字列・コマンドテーブル800の行数(表示文字列とコマンドの対応の数)は多い。表示文字列・コマンドテーブル800の表示文字列欄820内の表示文字列を解析することによって、「3桁の数字−3桁の数字」という正規表現517を生成する。
ステップS608では、正規表現検索モジュール520が、文字認識結果内から正規表現517に合致する文字列を検索する。ここでの検索は、正規表現検索である。図7の例では、「123−456」と「333−333」が検索されることとなり、これらの文字列が抽出文字列525となる。
ステップS610では、文字列DB検索モジュール530が、表示文字列・コマンドテーブル140から抽出文字列525を検索する。前述の例では、「123−456」と「333−333」の2つだけが対象となり、「123−456」が検索される。
In step S606, the regular
In step S608, the regular
In step S610, the character string
ステップS612では、文字列検索モジュール120が、文字認識結果(抽出文字列525)内に表示文字列があるか否かを判断し、ある場合はステップS614へ進み、それ以外の場合はステップS618へ進む。ステップS210と同等の処理を行う。
ステップS614では、文字列検索モジュール120が、表示文字列・コマンドテーブル140から検索された表示文字列に対応するコマンド125を抽出する。ステップS212と同等の処理を行う。
ステップS616では、コマンド処理モジュール150が、コマンド125を解釈して、そのコマンド125の処理を行う。ステップS214と同等の処理を行う。
ステップS618では、エラー処理を行う。ステップS216と同等の処理を行う。
In step S612, the character
In step S614, the character
In step S616, the
In step S618, error processing is performed. Processing equivalent to that in step S216 is performed.
また、第2の実施の形態では、画像105として静止画、動画像のいずれであってもよい。その場合、文字認識モジュール110が、画像105が動画像であるか否かを判断する。画像105が動画像である場合、その動画像を構成する複数のフレーム画像を、文字認識モジュール110が文字認識する。その結果、フレーム画像毎に、テキスト列115を生成する。そして、正規表現検索モジュール520は、正規表現517に合致する文字列がある最初のフレーム画像におけるテキスト列115を対象として処理を行う。例えば、操作者がカメラ付きスマートフォンの操作を誤って、静止画ではなく、動画像の撮影をした場合であっても高速に処理ができるようにしている。
In the second embodiment, the
<第3の実施の形態>
図9は、第3実施の形態の構成例についての概念的なモジュール構成図である。
第3の実施の形態である情報処理装置は、表示文字列が記載された文書を撮影した画像を文字認識し、その表示文字列に対応する処理を行うものであって、図9の例に示すように、文字認識モジュール110、候補位置文字抽出モジュール920、文字列DB検索モジュール530、表示文字列・コマンドテーブル140、コマンド処理モジュール150を有している。特に、登録した表示文字列の数が膨大であっても、現実的な時間で動作する。
<Third Embodiment>
FIG. 9 is a conceptual module configuration diagram of a configuration example according to the third embodiment.
The information processing apparatus according to the third embodiment performs character recognition on an image obtained by photographing a document in which a display character string is described, and performs processing corresponding to the display character string. As shown, a
図11、図12の例を用いて説明する。図11(a)の例に示すように、文書1100には、複数の商品(商品名、商品の説明、商品番号等を含む)が記載されているとする。ここで、コマンド処理モジュール150が行う処理は、商品の詳細情報が記載されているURLを表示することとする。
図12の例に示すように、操作者はカメラ付携帯情報端末1210を用いて文書1100を撮影する。その際、操作者は、図11(b)の例に示すユーザの撮影画像1110のように、詳細情報を取得したい商品が中心となるように撮影することが多い。操作者は、自分が撮影した商品に関するwebページが自動で表示されることを期待しているからである。また、詳細情報を取得したい商品(コマンド処理モジュール150における処理が行われる画像)が中心となるように撮影する旨を提示するようにしてもよい。
第3の実施の形態では、まず、ユーザの撮影画像1110(画像105)を文字認識モジュール110が文字認識し、文字認識結果テキスト列1120を得る。ところが、操作者は、単に「中心となるように撮影」するだけであるため、対象とすべき表示文字列だけを抽出できるとは限らない。文書内の隣接する別の商品の画像や説明が写り込む可能性が大きい。図11(b)の例では、右側のシャツの画像、その説明文B等が該当する。
そこで、候補位置文字抽出モジュール920は、図11(c)の例に示す文字認識結果テキスト列1120(テキスト列・各文字位置915)内から、後段の文字列DB検索モジュール530で利用可能な候補文字列である抽出結果1125(抽出文字列525)を抽出する。
第3の実施の形態では、ユーザの撮影画像1110中の位置情報を利用する。候補位置文字抽出モジュール920は、文字候補位置情報917を受け付ける。また、文字認識モジュール110の文字認識結果として、テキスト列に加えて、各文字位置情報(テキスト列・各文字位置915)を得る。文字候補位置情報917と、文字位置の詳細例については、図13〜15を用いて後述する。
候補位置文字抽出モジュール920では、文字候補位置情報917に合致する文字列を文字認識結果テキスト列1120から抽出する。抽出結果は、図11(d)の例に示す抽出結果1125のようになる。このように文字認識結果のテキスト列の内容を限定することができて、隣接する画像(商品等)の影響を避けることができる。
抽出文字列525から、さらに、第2の実施の形態の正規表現検索モジュール520によって正規表現で再抽出してもよい。
This will be described with reference to the examples of FIGS. As shown in the example of FIG. 11A, it is assumed that the
As shown in the example of FIG. 12, the operator uses the camera-equipped
In the third embodiment, first, the
Therefore, the candidate position
In the third embodiment, position information in the user's captured
The candidate position
Further, the extracted
図9の例に示したモジュール間の関係、処理としては、以下のようになる。
文字認識モジュール110は、候補位置文字抽出モジュール920と接続されている。
候補位置文字抽出モジュール920は、文字認識モジュール110、文字列DB検索モジュール530と接続されている。候補位置文字抽出モジュール920は、文字認識結果であるテキスト列・各文字位置915内から表示文字列としての候補を検索する。ここでの候補は、表示文字が存在する位置の範囲を示す情報(文字候補位置情報917)であり、テキスト列・各文字位置915には、各文字の位置が含まれており、候補位置文字抽出モジュール920は、テキスト列・各文字位置915に対して、認識文字の位置が候補の範囲に該当するものを抽出することによって検索する。なお、文字候補位置情報917は、予め定められた範囲を示す値であってもよいし、画像105内の属性情報として含まれているピント位置の情報を用いてもよい。例えば、そのピント位置を中心として、予め定められた長さの辺の矩形で定義される文字候補位置情報917であってもよい。
文字列DB検索モジュール530は、候補位置文字抽出モジュール920、表示文字列・コマンドテーブル140、コマンド処理モジュール150と接続されている。文字列DB検索モジュール530は、候補位置文字抽出モジュール920によって検索された候補(抽出文字列525)内から表示文字列を検索する。
表示文字列・コマンドテーブル140は、文字列DB検索モジュール530と接続されている。コマンド処理モジュール150は、文字列DB検索モジュール530と接続されている。
The relationship and processing between modules shown in the example of FIG. 9 are as follows.
The
The candidate position
The character string
The display character string / command table 140 is connected to the character string
図10は、第3の実施の形態による処理例を示すフローチャートである。
ステップS1002では、文字認識モジュール110が、画像105を受け付ける。ステップS202と同等の処理を行う。
ステップS1004では、文字認識モジュール110が、画像105を文字認識し、各文字の位置を抽出する。ステップS204と同等の処理を行うが、各文字のテキスト情報とともにその文字の位置をも抽出する。
ステップS1006では、候補位置文字抽出モジュール920が、文字候補位置情報917を受け付ける。
ステップS1008では、候補位置文字抽出モジュール920が、文字認識結果であるテキスト列・各文字位置915内の文字候補位置情報917に該当する文字列(抽出文字列525)を抽出する。
ステップS1010では、文字列DB検索モジュール530が、表示文字列・コマンドテーブル140から表示文字列を抽出する。ステップS206と同等の処理を行う。
FIG. 10 is a flowchart illustrating a processing example according to the third exemplary embodiment.
In step S1002, the
In step S1004, the
In step S1006, the candidate position
In step S1008, the candidate position
In step S1010, the character string
ステップS1012では、抽出文字列525内から表示文字列を検索する。つまり、ステップS1010で抽出した表示文字列をクエリとして、抽出文字列525の検索を行う。検索は一般の検索アルゴリズムを利用すればよい
ステップS1014では、文字列検索モジュール120が、文字認識結果(抽出文字列525)内に表示文字列があるか否かを判断し、ある場合はステップS1016へ進み、それ以外の場合はステップS1020へ進む。
ステップS1016では、文字列検索モジュール120が、表示文字列・コマンドテーブル140から検索された表示文字列に対応するコマンド125を抽出する。ステップS212と同等の処理を行う。
ステップS1018では、コマンド処理モジュール150が、コマンド125を解釈して、そのコマンド125の処理を行う。ステップS214と同等の処理を行う。
ステップS1020では、エラー処理を行う。ステップS216と同等の処理を行う。
In step S1012, the display character string is searched from the extracted
In step S1016, the character
In step S1018, the
In step S1020, error processing is performed. Processing equivalent to that in step S216 is performed.
図13は、画像における座標系の例を示す説明図である。図14は、文字位置座標1420の例を示す説明図である。図15は、文字候補位置情報1530の例を示す説明図である。
文字候補位置情報917とテキスト列・各文字位置915内の文字位置の詳細例を説明する。画像105は、画素が2次元に配列された形状で表すことができる。各画素位置をXとYの座標で表すことができる。ここでは、画像1300の左上を原点1310として、図13に示す例のようにX軸とY軸を規定する。なお、これは一例であって、画素位置が特定できれば、原点1310や軸の規定方法は、どのように行ってもよい。
文字認識の結果、XY座標系における文字位置を得ることができる。図14に示す例のように、文字認識の対象となった文字画像の外接矩形の左上の座標(文字位置座標1420)を文字位置とすることができる。もちろんのことながら、文字位置座標として、左上座標ではなく、右下座標や、外接矩形の中心位置等を用いてもよい。
文字候補位置情報917としては、画像105の大きさに対する相対的な位置関係を指定する。つまり、図15に示す例のように、画像1300のサイズをX軸方向に1、Y軸方向に1として設定した正規化座標系において、抽出したい文字位置の範囲(文字候補位置情報1530)を指定する。
文字候補位置情報917として、例えば、X軸方向に0.2〜0.8の範囲、Y軸方向に0.3〜0.7の範囲といった指定を行うことができる。
文字認識で得られたテキスト列・各文字位置915の文字位置も、同様にX軸方向とY軸方向に正規化された座標系で表現されていればよい。文字位置が文字候補位置情報917で示される領域内に存在しているテキスト列を抽出する。
又は、正規化された座標ではなくてもよい。文字候補位置情報917、テキスト列・各文字位置915の文字位置は、X座標、Y座標が整数で規定された画素位置そのものであってもよい。
FIG. 13 is an explanatory diagram illustrating an example of a coordinate system in an image. FIG. 14 is an explanatory diagram showing an example of character position coordinates 1420. FIG. 15 is an explanatory diagram illustrating an example of the character
A detailed example of character
As a result of character recognition, the character position in the XY coordinate system can be obtained. As in the example shown in FIG. 14, the upper left coordinate (character position coordinate 1420) of the circumscribed rectangle of the character image targeted for character recognition can be set as the character position. Of course, not the upper left coordinates but the lower right coordinates, the center position of the circumscribed rectangle, or the like may be used as the character position coordinates.
As the character
As the character
Similarly, the text string obtained by character recognition and the character position of each
Or it may not be a normalized coordinate. The character position of the character
<第4の実施の形態>
図16は、第4の実施の形態の構成例についての概念的なモジュール構成図である。
第4の実施の形態である情報処理装置は、表示文字列が記載された文書を撮影した画像を文字認識し、その表示文字列に対応する処理を行うものであって、図16の例に示すように、文字認識モジュール110、候補サイズ文字抽出モジュール1620、文字列DB検索モジュール530、表示文字列・コマンドテーブル140、コマンド処理モジュール150を有している。特に、登録した表示文字列の数が膨大であっても、現実的な時間で動作する。
第3の実施の形態では文字候補位置情報917を用いて限定したが、第4の実施の形態では文字候補サイズ情報1617を用いて限定する。
<Fourth embodiment>
FIG. 16 is a conceptual module configuration diagram of a configuration example according to the fourth embodiment.
The information processing apparatus according to the fourth embodiment performs character recognition on an image obtained by photographing a document in which a display character string is described, and performs processing corresponding to the display character string. As shown, it has a
In the third embodiment, the character
第3の実施の形態で規定したような座標系で、文字サイズを規定すればよい。文字認識モジュール110による文字認識の結果、各文字の外接矩形のサイズ(縦画素数、横画素数)を抽出する。その画素数を画像105のサイズ(縦画素数と横画素数)で正規化して、本実施の形態で扱える文字サイズを得る。
候補サイズ文字抽出モジュール1620は、その文字サイズをテキスト列とともに文字認識結果として受け取る。
また、文字候補サイズ情報1617として、例えば、横サイズ範囲0.01〜0.1、縦サイズ範囲0.01〜0.1等の閾値を設定する。
文字認識結果としての文字サイズが、文字候補サイズ情報1617で定められる範囲に収まっていれば、抽出文字列1625として文字列DB検索モジュール530へ出力する。この範囲に収まっていないものは、抽出文字列1625として出力しない(表示文字列が含まれていないとして除外する)。
なお、文字候補サイズ情報1617で定められる範囲と文字サイズの関係として、以下のいずれであってもよい。
(1)文字サイズが縦横共に範囲内にあるときのみ、該当する文字認識結果のテキスト列を抽出文字列1625として出力する。
(2)文字サイズの縦横どちらか一方が範囲内にあれば、該当する文字認識結果のテキスト列を抽出文字列1625として出力する。
また、文字候補サイズ情報1617として、外接矩形の面積を指定してもよいし、文字列のサイズを指定してもよい。また、文字列が横書きの場合、文字列の高さの範囲を指定するようにしてもよい。文字列が縦書きの場合、文字列の幅の範囲を指定するようにしてもよい。
What is necessary is just to prescribe | regulate a character size by the coordinate system which prescribes | regulates in 3rd Embodiment. As a result of character recognition by the
The candidate size
As the character
If the character size as the character recognition result is within the range determined by the character
The relationship between the range defined by the character
(1) Only when the character size is within the range both vertically and horizontally, the corresponding character recognition result text string is output as the extracted
(2) If either the vertical or horizontal character size is within the range, the corresponding character recognition result text string is output as the extracted
In addition, as the character
図16の例に示したモジュール間の関係、処理としては、以下のようになる。
文字認識モジュール110は、候補サイズ文字抽出モジュール1620と接続されている。
候補サイズ文字抽出モジュール1620は、文字認識モジュール110、文字列DB検索モジュール530と接続されている。候補サイズ文字抽出モジュール1620は、文字認識結果であるテキスト列・各文字サイズ1615内から表示文字列としての候補を検索する。ここでの候補は、表示文字の大きさの範囲を示す情報(文字候補サイズ情報1617)であり、テキスト列・各文字サイズ1615には、各文字の大きさが含まれており、候補サイズ文字抽出モジュール1620は、テキスト列・各文字サイズ1615に対して、認識文字の大きさが候補の範囲に該当するものを抽出することによって検索する。
文字列DB検索モジュール530は、候補サイズ文字抽出モジュール1620、表示文字列・コマンドテーブル140、コマンド処理モジュール150と接続されている。文字列DB検索モジュール530は、候補サイズ文字抽出モジュール1620によって検索された候補(抽出文字列1625)内から表示文字列を検索する。
表示文字列・コマンドテーブル140は、文字列DB検索モジュール530と接続されている。コマンド処理モジュール150は、文字列DB検索モジュール530と接続されている。
The relationship and processing between modules shown in the example of FIG. 16 are as follows.
The
The candidate size
The character string
The display character string / command table 140 is connected to the character string
図17は、第4の実施の形態による処理例を示すフローチャートである。
ステップS1702では、文字認識モジュール110が、画像105を受け付ける。ステップS202と同等の処理を行う。
ステップS1704では、文字認識モジュール110が、画像105を文字認識し、各文字のサイズを抽出する。ステップS204と同等の処理を行うが、各文字のテキスト情報とともにその文字のサイズをも抽出する。
ステップS1706では、候補サイズ文字抽出モジュール1620が、文字候補サイズ情報1617を受け付ける。
ステップS1708では、候補サイズ文字抽出モジュール1620が、文字認識結果であるテキスト列・各文字サイズ1615内の文字候補サイズ情報1617に該当する文字列(抽出文字列1625)を抽出する。
ステップS1710では、文字列DB検索モジュール530が、表示文字列・コマンドテーブル140から表示文字列を抽出する。ステップS206と同等の処理を行う。
FIG. 17 is a flowchart illustrating a processing example according to the fourth exemplary embodiment.
In step S1702, the
In step S1704, the
In step S1706, the candidate size
In step S1708, the candidate size
In step S1710, the character string
ステップS1712では、抽出文字列1625内から表示文字列を検索する。つまり、ステップS1710で抽出した表示文字列をクエリとして、抽出文字列1625の検索を行う。検索は一般の検索アルゴリズムを利用すればよい
ステップS1714では、文字列検索モジュール120が、文字認識結果(抽出文字列1625)内に表示文字列があるか否かを判断し、ある場合はステップS1716へ進み、それ以外の場合はステップS1720へ進む。
ステップS1716では、文字列検索モジュール120が、表示文字列・コマンドテーブル140から検索された表示文字列に対応するコマンド125を抽出する。ステップS212と同等の処理を行う。
ステップS1718では、コマンド処理モジュール150が、コマンド125を解釈して、そのコマンド125の処理を行う。ステップS214と同等の処理を行う。
ステップS1720では、エラー処理を行う。ステップS216と同等の処理を行う。
In step S1712, the display character string is searched from the extracted
In step S <b> 1716, the character
In step S1718, the
In step S1720, error processing is performed. Processing equivalent to that in step S216 is performed.
<第5の実施の形態>
図18は、第5の実施の形態の構成例についての概念的なモジュール構成図である。
第5の実施の形態である情報処理装置は、表示文字列が記載された文書を撮影した画像を文字認識し、その表示文字列に対応する処理を行うものであって、図18の例に示すように、文字認識モジュール110、候補色文字抽出モジュール1820、文字列DB検索モジュール530、表示文字列・コマンドテーブル140、コマンド処理モジュール150を有している。特に、登録した表示文字列の数が膨大であっても、現実的な時間で動作する。
第3の実施の形態では文字候補位置情報917、第4の実施の形態では文字候補サイズ情報1617を用いて限定したが、第5の実施の形態では文字候補色情報1817(例えば、黒、赤等を示す情報)を用いて限定する。
<Fifth embodiment>
FIG. 18 is a conceptual module configuration diagram of a configuration example according to the fifth embodiment.
The information processing apparatus according to the fifth embodiment performs character recognition on an image obtained by photographing a document in which a display character string is described, and performs processing corresponding to the display character string. As shown, it has a
In the third embodiment, the character
候補色文字抽出モジュール1820は、文字認識モジュール110から文字認識結果としてテキスト列とともに各文字の色(テキスト列・各文字色1815)を受け取る。また、候補色文字抽出モジュール1820は、文字認識結果内の文字位置情報から得られた文字位置と画像105から、文字認識結果として各文字の色を抽出するようにしてもよい。
文字候補色情報1817として、文字色の範囲を規定する。文字候補色情報1817によって規定された範囲内の色の文字だけを抽出文字列1825として文字列DB検索モジュール530へ出力する。例えば、文字候補色情報1817として、色差成分の信号強度を規定する。文字色をYCbCrに色変換を行う。
色差成分強度C=sqrt(Cb2+Cr2)として定義する。(sqrtは平方根を取得する関数)
文字候補色情報1817として、輝度情報TYと、色成分強度の閾値TCを設定する。Y<TYかつ、C<TCの場合に、候補色文字抽出モジュール1820が、該当するテキスト列を抽出する。例えば、この場合は、黒文字のみを抽出する場合に相当する。
The candidate color
A character color range is defined as the character
The color difference component intensity is defined as C = sqrt (Cb 2 + Cr 2 ). (Sqrt is a function for obtaining the square root)
As character
図18の例に示したモジュール間の関係、処理としては、以下のようになる。
文字認識モジュール110は、候補色文字抽出モジュール1820と接続されている。
候補色文字抽出モジュール1820は、文字認識モジュール110、文字列DB検索モジュール530と接続されている。候補色文字抽出モジュール1820は、文字認識結果であるテキスト列・各文字色1815内から表示文字列としての候補を検索する。ここでの候補は、表示文字の色の範囲を示す情報(文字候補色情報1817)であり、テキスト列・各文字色1815には、各文字の色が含まれており、候補色文字抽出モジュール1820は、テキスト列・各文字色1815に対して、認識文字の色が候補の範囲に該当するものを抽出することによって検索する。
文字列DB検索モジュール530は、候補色文字抽出モジュール1820、表示文字列・コマンドテーブル140、コマンド処理モジュール150と接続されている。文字列DB検索モジュール530は、候補色文字抽出モジュール1820によって検索された候補(抽出文字列1825)内から表示文字列を検索する。
表示文字列・コマンドテーブル140は、文字列DB検索モジュール530と接続されている。コマンド処理モジュール150は、文字列DB検索モジュール530と接続されている。
The relationship and processing between modules shown in the example of FIG. 18 are as follows.
The
The candidate color
The character string
The display character string / command table 140 is connected to the character string
図19は、第5の実施の形態による処理例を示すフローチャートである。
ステップS1902では、文字認識モジュール110が、画像105を受け付ける。ステップS202と同等の処理を行う。
ステップS1904では、文字認識モジュール110が、画像105を文字認識し、各文字の色を抽出する。ステップS204と同等の処理を行うが、各文字のテキスト情報とともにその文字の色をも抽出する。
ステップS1906では、候補色文字抽出モジュール1820が、文字候補色情報1817を受け付ける。
ステップS1908では、候補色文字抽出モジュール1820が、文字認識結果であるテキスト列・各文字色1815内の文字候補色情報1817に該当する文字列(抽出文字列1825)を抽出する。
ステップS1910では、文字列DB検索モジュール530が、表示文字列・コマンドテーブル140から表示文字列を抽出する。ステップS206と同等の処理を行う。
FIG. 19 is a flowchart illustrating a processing example according to the fifth exemplary embodiment.
In step S1902, the
In step S1904, the
In step S1906, the candidate color
In step S1908, the candidate color
In step S1910, the character string
ステップS1912では、抽出文字列1825内から表示文字列を検索する。つまり、ステップS1910で抽出した表示文字列をクエリとして、抽出文字列1825の検索を行う。検索は一般の検索アルゴリズムを利用すればよい
ステップS1914では、文字列検索モジュール120が、文字認識結果(抽出文字列1825)内に表示文字列があるか否かを判断し、ある場合はステップS1916へ進み、それ以外の場合はステップS1920へ進む。
ステップS1916では、文字列検索モジュール120が、表示文字列・コマンドテーブル140から検索された表示文字列に対応するコマンド125を抽出する。ステップS212と同等の処理を行う。
ステップS1918では、コマンド処理モジュール150が、コマンド125を解釈して、そのコマンド125の処理を行う。ステップS214と同等の処理を行う。
ステップS1920では、エラー処理を行う。ステップS216と同等の処理を行う。
In step S1912, the display character string is searched from the extracted
In step S1916, the character
In step S 1918, the
In step S1920, error processing is performed. Processing equivalent to that in step S216 is performed.
図20を参照して、本実施の形態の情報処理装置のハードウェア構成例について説明する。図20に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部2017と、プリンタなどのデータ出力部2018を備えたハードウェア構成例を示している。
A hardware configuration example of the information processing apparatus according to the present embodiment will be described with reference to FIG. The configuration illustrated in FIG. 20 is configured by, for example, a personal computer (PC), and illustrates a hardware configuration example including a
CPU(Central Processing Unit)2001は、前述の実施の形態において説明した各種のモジュール、すなわち、文字認識モジュール110、文字列検索モジュール120、コマンド処理モジュール150、正規表現検索モジュール520、文字列DB検索モジュール530、候補位置文字抽出モジュール920、候補サイズ文字抽出モジュール1620、候補色文字抽出モジュール1820等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
A CPU (Central Processing Unit) 2001 includes various modules described in the above-described embodiments, that is, a
ROM(Read Only Memory)2002は、CPU2001が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)2003は、CPU2001の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス2004により相互に接続されている。
A ROM (Read Only Memory) 2002 stores programs, calculation parameters, and the like used by the
ホストバス2004は、ブリッジ2005を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス2006に接続されている。
The
キーボード2008、マウス等のポインティングデバイス2009は、操作者により操作される入力デバイスである。ディスプレイ2010は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。
A
HDD(Hard Disk Drive)2011は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU2001によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、画像105、テキスト列115、コマンド125、表示文字列・コマンドテーブル140、正規表現517、抽出文字列525、テキスト列・各文字位置915、文字候補位置情報917、テキスト列・各文字サイズ1615、文字候補サイズ情報1617、抽出文字列1625、テキスト列・各文字色1815、文字候補色情報1817、抽出文字列1825などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
An HDD (Hard Disk Drive) 2011 includes a hard disk, drives the hard disk, and records or reproduces a program executed by the
ドライブ2012は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体2013に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース2007、外部バス2006、ブリッジ2005、及びホストバス2004を介して接続されているRAM2003に供給する。リムーバブル記録媒体2013も、ハードディスクと同様のデータ記録領域として利用可能である。
The
接続ポート2014は、外部接続機器2015を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート2014は、インタフェース2007、及び外部バス2006、ブリッジ2005、ホストバス2004等を介してCPU2001等に接続されている。通信部2016は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部2017は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部2018は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
The
なお、図20に示す情報処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図20に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図20に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。 Note that the hardware configuration of the information processing apparatus illustrated in FIG. 20 illustrates one configuration example, and the present embodiment is not limited to the configuration illustrated in FIG. 20, and the modules described in the present embodiment are executed. Any configuration is possible. For example, some modules may be configured with dedicated hardware (for example, Application Specific Integrated Circuit (ASIC), etc.), and some modules are in an external system and connected via a communication line In addition, a plurality of systems shown in FIG. 20 may be connected to each other via a communication line so as to cooperate with each other. Further, it may be incorporated in a copying machine, a fax machine, a scanner, a printer, a multifunction machine (an image processing apparatus having any two or more functions of a scanner, a printer, a copying machine, a fax machine, etc.).
なお、前述の各種の実施の形態を組み合わせてもよく(例えば、ある実施の形態内のモジュールを他の実施の形態内に追加する、入れ替えをする等も含む)、また、各モジュールの処理内容として背景技術で説明した技術を採用してもよい。例えば、正規表現検索モジュール520、候補位置文字抽出モジュール920、候補サイズ文字抽出モジュール1620、候補色文字抽出モジュール1820の2つ以上を組み合わせてもよい。
具体的には、正規表現、文字サイズ、文字位置、文字色を組み合わせて、候補を抽出してもよい。
限定条件1:正規表現
限定条件2:文字サイズ
限定条件3:文字位置
限定条件4:文字色
とした場合、全ての限定条件に合致する文字のみを候補として抽出する。もちろんのことながら、限定条件は1個でも2個でも3個でも4個でもそれ以上でもよい。
正規表現を用いない場合、形態素解析等を用いて単語に分離して、分離した単語を用いて、文字列DB検索モジュール530が表示文字列・コマンドテーブル140を検索してもよい。
Note that the above-described various embodiments may be combined (for example, adding or replacing a module in one embodiment in another embodiment), and processing contents of each module The technique described in the background art may be employed. For example, two or more of the regular
Specifically, candidates may be extracted by combining regular expressions, character sizes, character positions, and character colors.
Restriction condition 1: Regular expression Restriction condition 2: Character size Restriction condition 3: Character position Restriction condition 4: When character color is used, only characters that match all restriction conditions are extracted as candidates. Of course, the limiting condition may be one, two, three, four, or more.
When a regular expression is not used, the character string
文字列検索モジュール120(文字列DB検索モジュール530)は、複数の表示文字列が検索にヒットした場合、その表示文字列に対応するコマンド125の全てを、コマンド処理モジュール150に出力してもよいし、最初のコマンド125だけを、コマンド処理モジュール150に出力してもよい。
前述の例ではコマンド125としてURLを示したが、URLではなく、アプリケーション名、引数等であってもよく、コンピュータのアプリケーションを起動できるものであればよい。
図4、図8の例に示したテーブルの行に番号が振ってあるが、この番号は無くてもよい。
情報処理装置として、文字認識モジュール110は必須ではない。文字認識結果を受け付けることができれば、同様の処理、効果を得ることができる。
表示文字列・コマンドテーブル140の内容を書き換えることによって、表示文字列は変更せずに(つまり、撮影対象である文書の内容は変更することなしに)、コマンドだけ(URLだけ)を変更することが可能となる。
正規表現が表示文字列の全てを表現していない場合は、表現していない表示文字列を個々にクエリとして検索すればよい。
前述の例では、正規表現としていたが、類似の文字列限定方法であればよい。例えば、数字だけを抽出して、抜き出す等の単純な方式でもよい。
The character string search module 120 (character string DB search module 530) may output all of the
In the above example, the URL is shown as the
Numbers are assigned to the rows of the tables shown in the examples of FIGS. 4 and 8, but this number may be omitted.
As the information processing apparatus, the
By rewriting the contents of the display character string / command table 140, only the command (only the URL) is changed without changing the display character string (that is, without changing the content of the document to be photographed). Is possible.
If the regular expression does not represent all of the display character string, the display character string that is not expressed may be individually searched as a query.
In the above example, a regular expression is used, but a similar character string limiting method may be used. For example, a simple method of extracting only numbers and extracting them may be used.
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
The program described above may be provided by being stored in a recording medium, or the program may be provided by communication means. In that case, for example, the above-described program may be regarded as an invention of a “computer-readable recording medium recording the program”.
The “computer-readable recording medium on which a program is recorded” refers to a computer-readable recording medium on which a program is recorded, which is used for program installation, execution, program distribution, and the like.
The recording medium is, for example, a digital versatile disc (DVD), which is a standard established by the DVD Forum, such as “DVD-R, DVD-RW, DVD-RAM,” and DVD + RW. Standard “DVD + R, DVD + RW, etc.”, compact disc (CD), read-only memory (CD-ROM), CD recordable (CD-R), CD rewritable (CD-RW), Blu-ray disc ( Blu-ray (registered trademark) Disc), magneto-optical disk (MO), flexible disk (FD), magnetic tape, hard disk, read-only memory (ROM), electrically erasable and rewritable read-only memory (EEPROM (registered trademark)) )), Flash memory, Random access memory (RAM) SD (Secure Digital) memory card and the like.
The program or a part of the program may be recorded on the recording medium for storage or distribution. Also, by communication, for example, a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), a wired network used for the Internet, an intranet, an extranet, etc., or wireless communication It may be transmitted using a transmission medium such as a network or a combination of these, or may be carried on a carrier wave.
Furthermore, the program may be a part of another program, or may be recorded on a recording medium together with a separate program. Moreover, it may be divided and recorded on a plurality of recording media. Further, it may be recorded in any manner as long as it can be restored, such as compression or encryption.
110…文字認識モジュール
120…文字列検索モジュール
140…表示文字列・コマンドテーブル
150…コマンド処理モジュール
520…正規表現検索モジュール
530…文字列DB検索モジュール
920…候補位置文字抽出モジュール
1620…候補サイズ文字抽出モジュール
1820…候補色文字抽出モジュール
DESCRIPTION OF
Claims (7)
表示文字列と処理情報を対応させて記憶する記憶手段と、
前記文字認識結果内から前記表示文字列を検索する検索手段と、
前記検索手段によって前記文字認識結果内から前記表示文字列が検索できた場合は、前記記憶手段から該表示文字列に対応する処理情報を抽出する抽出手段と、
前記抽出手段によって抽出された処理情報に基づいて、処理を行う処理手段
を具備することを特徴とする情報処理装置。 A receiving means for receiving the character recognition result;
Storage means for storing display character strings and processing information in association with each other;
Search means for searching for the display character string from the character recognition result;
An extraction means for extracting processing information corresponding to the display character string from the storage means when the display character string can be searched from the character recognition result by the search means;
An information processing apparatus comprising processing means for performing processing based on the processing information extracted by the extraction means.
をさらに具備し、
前記検索手段は、前記候補検索手段によって検索された候補内から前記表示文字列を検索する
ことを特徴とする請求項1に記載の情報処理装置。 Candidate search means for searching for candidates as the display character string from the character recognition result further comprises:
The information processing apparatus according to claim 1, wherein the search unit searches the display character string from candidates searched by the candidate search unit.
前記候補検索手段は、前記文字認識結果に対して、前記候補の正規表現検索を行うことによって検索する
ことを特徴とする請求項2に記載の情報処理装置。 The candidate in the candidate search means is information described in a regular expression indicating a part or all of the display character string,
The information processing apparatus according to claim 2, wherein the candidate search unit searches the character recognition result by performing a regular expression search for the candidate.
前記候補検索手段は、前記文字認識結果に対して、認識文字の位置が前記候補の範囲に該当するものを抽出することによって検索する
ことを特徴とする請求項2又は3に記載の情報処理装置。 The candidate in the candidate search means is information indicating a range of positions where display characters exist, and the character recognition result includes the position of each character,
The information processing apparatus according to claim 2, wherein the candidate search unit searches the character recognition result by extracting a character whose recognized character position falls within the range of the candidate. .
前記候補検索手段は、前記文字認識結果に対して、認識文字の大きさが前記候補の範囲に該当するものを抽出することによって検索する
ことを特徴とする請求項2から4のいずれか一項に記載の情報処理装置。 The candidate in the candidate search means is information indicating a range of display character size, and the character recognition result includes the size of each character,
The candidate search means searches for the character recognition result by extracting a character whose recognized character size falls within the candidate range. The information processing apparatus described in 1.
前記候補検索手段は、前記文字認識結果に対して、認識文字の色が前記候補の範囲に該当するものを抽出することによって検索する
ことを特徴とする請求項2から5のいずれか一項に記載の情報処理装置。 The candidate in the candidate search means is information indicating a display character color range, and the character recognition result includes the color of each character,
The said candidate search means searches by extracting the thing from which the color of a recognition character corresponds to the said candidate range with respect to the said character recognition result. The Claim 1 characterized by the above-mentioned. The information processing apparatus described.
文字認識結果を受け付ける受付手段と、
表示文字列と処理情報を対応させて記憶する記憶手段と、
前記文字認識結果内から前記表示文字列を検索する検索手段と、
前記検索手段によって前記文字認識結果内から前記表示文字列が検索できた場合は、前記記憶手段から該表示文字列に対応する処理情報を抽出する抽出手段と、
前記抽出手段によって抽出された処理情報に基づいて、処理を行う処理手段
として機能させるための情報処理プログラム。 Computer
A receiving means for receiving the character recognition result;
Storage means for storing display character strings and processing information in association with each other;
Search means for searching for the display character string from the character recognition result;
An extraction means for extracting processing information corresponding to the display character string from the storage means when the display character string can be searched from the character recognition result by the search means;
An information processing program for causing a processing unit to perform processing based on processing information extracted by the extraction unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013206926A JP6187108B2 (en) | 2013-10-02 | 2013-10-02 | Information processing apparatus and information processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013206926A JP6187108B2 (en) | 2013-10-02 | 2013-10-02 | Information processing apparatus and information processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015072533A true JP2015072533A (en) | 2015-04-16 |
JP6187108B2 JP6187108B2 (en) | 2017-08-30 |
Family
ID=53014873
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013206926A Expired - Fee Related JP6187108B2 (en) | 2013-10-02 | 2013-10-02 | Information processing apparatus and information processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6187108B2 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002163604A (en) * | 2000-11-28 | 2002-06-07 | Canon Inc | System and method for acquiring url, and storage medium stored with program for executing processing therefor |
JP2003141003A (en) * | 2001-10-30 | 2003-05-16 | Canon Inc | Network terminal device, network system, content acquiring method for network terminal device, printed matter forming method for network terminal device, and content delivery method and program for network system |
JP2004118281A (en) * | 2002-09-24 | 2004-04-15 | Fujitsu Social Science Laboratory Ltd | Extracted character string dictionary search device and method therefor, and program |
-
2013
- 2013-10-02 JP JP2013206926A patent/JP6187108B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002163604A (en) * | 2000-11-28 | 2002-06-07 | Canon Inc | System and method for acquiring url, and storage medium stored with program for executing processing therefor |
JP2003141003A (en) * | 2001-10-30 | 2003-05-16 | Canon Inc | Network terminal device, network system, content acquiring method for network terminal device, printed matter forming method for network terminal device, and content delivery method and program for network system |
JP2004118281A (en) * | 2002-09-24 | 2004-04-15 | Fujitsu Social Science Laboratory Ltd | Extracted character string dictionary search device and method therefor, and program |
Also Published As
Publication number | Publication date |
---|---|
JP6187108B2 (en) | 2017-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108959586B (en) | Identifying textual terms in response to a visual query | |
US8892990B2 (en) | Automatic creation of a table and query tools | |
JP2004234228A (en) | Image search device, keyword assignment method in image search device, and program | |
US8244037B2 (en) | Image-based data management method and system | |
US20140254942A1 (en) | Systems and methods for obtaining information based on an image | |
JP2009295153A (en) | Web based text detection method and web based system | |
JP2007286864A (en) | Image processor, image processing method, program, and recording medium | |
US20110157215A1 (en) | Image output device, image output system and image output method | |
US20160026858A1 (en) | Image based search to identify objects in documents | |
US9658991B2 (en) | Reordering text from unstructured sources to intended reading flow | |
JP2010072842A (en) | Image processing apparatus and image processing method | |
US20110125731A1 (en) | Information processing apparatus, information processing method, program, and information processing system | |
US10152540B2 (en) | Linking thumbnail of image to web page | |
JP2014010722A (en) | Retrieval device, retrieval method and program | |
US11670067B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
US20210295033A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2008191936A (en) | Method for supporting construction of content registration/search system, and apparatus for supporting construction of content registration/search system | |
US8077977B2 (en) | Image processing system, image processing method, computer readable medium and computer data signal | |
JP6187108B2 (en) | Information processing apparatus and information processing program | |
JP4391157B2 (en) | Document processing apparatus, document processing method, document processing program, and recording medium | |
JP5913774B2 (en) | Web site sharing method, electronic device, and computer program | |
US11995908B2 (en) | Information processing device and non-transitory computer readable medium | |
US20210295032A1 (en) | Information processing device and non-transitory computer readable medium | |
US20210191991A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP4765831B2 (en) | Image processing system and image processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160524 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170310 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170315 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170508 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170523 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170621 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170704 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170717 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6187108 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |