JP6484974B2 - Information processing apparatus, information processing system, and program - Google Patents
Information processing apparatus, information processing system, and program Download PDFInfo
- Publication number
- JP6484974B2 JP6484974B2 JP2014193541A JP2014193541A JP6484974B2 JP 6484974 B2 JP6484974 B2 JP 6484974B2 JP 2014193541 A JP2014193541 A JP 2014193541A JP 2014193541 A JP2014193541 A JP 2014193541A JP 6484974 B2 JP6484974 B2 JP 6484974B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- character
- search
- document data
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、情報処理装置、情報処理システム及びプログラムに関する。 The present invention relates to an information processing apparatus, an information processing system, and a program.
従来、スキャナ等で読み込んだ文書画像から文字を認識して文書データに変換するOCR(Optical Character Recognition)技術が知られている。また、複数の言語を含む文書に対してOCR処理を行う技術も提案されている。例えば、特許文献1には、複数の言語を含む文書に対して、文書の領域ごとに異なる言語でOCR処理を行う技術が記載されている。
2. Description of the Related Art Conventionally, an OCR (Optical Character Recognition) technique for recognizing characters from a document image read by a scanner or the like and converting them into document data is known. A technique for performing OCR processing on a document including a plurality of languages has also been proposed. For example,
また、複数のOCR結果から、ユーザが入力した検索条件に合致するOCR結果を検索する技術も知られている(例えば特許文献2)。 Further, a technique for searching for an OCR result that matches a search condition input by a user from a plurality of OCR results is also known (for example, Patent Document 2).
ここで複数言語が含まれる文書には、例えば、文書の一部分が日本語で記載され、他の部分が韓国語で記載され、更に他の部分が英語で記載されている文書や、文書全体で日本語と韓国語と英語が混在して記載されている文書がある。日本語と韓国語は文字形状が類似しているため、特に後者の文書ではOCR処理において文字認識の精度が低下する。そして文字認識の精度が低下すると、OCR結果に対する検索精度も低下してしまう。 Here, a document including a plurality of languages includes, for example, a document in which a part of the document is written in Japanese, another part is written in Korean, and another part is written in English. Some documents contain a mixture of Japanese, Korean, and English. Since Japanese and Korean have similar character shapes, the accuracy of character recognition is reduced in the OCR process especially in the latter document. If the accuracy of character recognition is reduced, the search accuracy for the OCR result is also reduced.
本発明は、複数言語が含まれる文書に対する文字認識の精度を高め、文字認識結果に対する検索精度を向上させることができる情報処理装置、情報処理システム及びプログラムを提供することを目的とする。 An object of the present invention is to provide an information processing apparatus, an information processing system, and a program capable of improving the accuracy of character recognition for a document including a plurality of languages and improving the search accuracy for a character recognition result.
本発明の請求項1に係る情報処理装置は、互いに異なる複数の文字セットを含む文書を画像として読み取った文書画像データを取得するデータ取得手段と、前記複数の文字セットごとに、該文字セットにより前記文書画像データの全体を文字認識し文書データに変換して、1つの前記文書画像データに対して前記文字セットの数に応じた数の前記文書データを生成する文書データ生成手段と、前記文書データ生成手段により生成された複数の前記文書データを記憶する文書データ記憶手段と、検索条件として入力された入力文字の文字セットを判定する検索文字セット判定手段と、前記文書データ記憶手段に記憶された複数の前記文書データのうち、前記検索文字セット判定手段により判定された前記入力文字の文字セットに対応する前記文書データに対して、前記検索条件として入力された前記入力文字の検索を実行する検索実行手段と、を含むことを特徴とする。
An information processing apparatus according to
本発明の請求項2に係る情報処理装置は、請求項1に記載の構成において、前記文書に、互いに異なる第1の文字セット及び第2の文字セットが含まれる場合、前記文書データ生成手段は、前記第1の文字セットに基づいて前記文書画像データの全体を文字認識し文書データに変換して第1の文書データを生成するとともに、前記第2の文字セットに基づいて前記文書画像データの全体を文字認識し文書データに変換して第2の文書データを生成する。
In the information processing apparatus according to claim 2 of the present invention, in the configuration according to
本発明の請求項3に係る情報処理装置は、請求項1に記載の構成において、前記文書に、互いに異なる第1の文字セット及び第2の文字セットが含まれる場合、前記文書データ生成手段は、互いに文字形状が非類似の前記第1の文字セット及び第3の文字セットに基づいて、前記文書画像データの全体を文字認識し文書データに変換して第1の文書データを生成するとともに、互いに文字形状が非類似の前記第2の文字セット及び第4の文字セットに基づいて、前記文書画像データの全体を文字認識し文書データに変換して第2の文書データを生成する。
In the information processing apparatus according to claim 3 of the present invention, in the configuration according to
本発明の請求項4に係る情報処理装置は、請求項1に記載の構成において、前記検索条件として入力された前記入力文字の文字セットに対応する前記文書データを、前記文書データ記憶手段から取得する文書データ取得手段をさらに含み、前記検索条件として入力された前記入力文字の文字セットが第5の文字セットであった場合、前記文書データ取得手段は、前記文書データ記憶手段から、前記第5の文字セットを含む少なくとも1つの前記文書データを取得し、前記検索実行手段は、取得された前記文書データごとに、前記入力文字の検索を実行する。
The information processing apparatus according to claim 4 of the present invention, obtained in arrangement according to
本発明の請求項5に係る情報処理装置は、請求項1に記載の構成において、前記互いに異なる複数の文字セットは、互いに異なる複数の言語である。
An information processing apparatus according to claim 5 of the present invention is the configuration according to
本発明の請求項6に係る情報処理システムは、文字変換装置と検索装置とを含む情報処理システムであって、前記文字変換装置は、互いに異なる複数の文字セットを含む文書を画像として読み取った文書画像データを取得するデータ取得手段と、前記複数の文字セットごとに、該文字セットにより前記文書画像データの全体を文字認識し文書データに変換して、1つの前記文書画像データに対して前記文字セットの数に応じた数の前記文書データを生成する文書データ生成手段と、前記文書データ生成手段により生成された複数の前記文書データを記憶する文書データ記憶手段と、前記文書データを前記検索装置に送信する送信手段と、を含み、前記検索装置は、前記文書データを前記文字変換装置から受信する受信手段と、検索条件として入力された入力文字の文字セットを判定する検索文字セット判定手段と、前記文書データ記憶手段に記憶された複数の前記文書データのうち、前記検索文字セット判定手段により判定された前記入力文字の文字セットに対応する前記文書データに対して、前記検索条件として入力された前記入力文字の検索を実行する検索実行手段と、前記検索実行手段による検索結果を、前記検索条件を入力したユーザのユーザ端末に送信する送信手段と、を含むことを特徴とする。 An information processing system according to claim 6 of the present invention is an information processing system including a character conversion device and a search device, wherein the character conversion device reads a document including a plurality of different character sets as an image. Data acquisition means for acquiring image data; and for each of the plurality of character sets, the character set is used to recognize the whole of the document image data and convert it into document data. Document data generation means for generating the number of document data corresponding to the number of sets, document data storage means for storing a plurality of the document data generated by the document data generation means, and the search device for the document data anda transmitting means for transmitting to said search device includes: a receiving means for receiving the document data from the character conversion unit, as a search condition A search character set determination unit that determines a character set of the input character that has been input, and the character of the input character determined by the search character set determination unit among the plurality of document data stored in the document data storage unit for the document data corresponding to the set, the search execution means for executing a search for the inputted input character as the search condition, the search result by the search executing means, the user of the user terminal that inputs the search condition And transmitting means for transmitting to.
本発明の請求項7に係るプログラムは、互いに異なる複数の文字セットを含む文書を画像として読み取った文書画像データを取得するデータ取得手段、前記複数の文字セットごとに、該文字セットにより前記文書画像データの全体を文字認識し文書データに変換して、1つの前記文書画像データに対して前記文字セットの数に応じた数の前記文書データを生成する文書データ生成手段、前記文書データ生成手段により生成された複数の前記文書データを記憶する文書データ記憶手段、検索条件として入力された入力文字の文字セットを判定する検索文字セット判定手段、及び、前記文書データ記憶手段に記憶された複数の前記文書データのうち、前記検索文字セット判定手段により判定された前記入力文字の文字セットに対応する前記文書データに対して、前記検索条件として入力された前記入力文字の検索を実行する検索実行手段、としてコンピュータを機能させるためのプログラムである。このプログラムは、CD−ROMやDVD−ROMなどの、コンピュータが読み取り可能な情報記憶媒体に格納されてもよい。 A program according to claim 7 of the present invention is a data acquisition means for acquiring document image data obtained by reading a document including a plurality of character sets different from each other as an image, and for each of the plurality of character sets, the document image by the character set. It converts the entire data to the character recognition document data, one of the document the relative image data character sets document data generating means for generating the number of the document data corresponding to the number of the previous SL document data generating means Document data storage means for storing a plurality of document data generated by the above, a search character set determination means for determining a character set of input characters input as a search condition, and a plurality of data stored in the document data storage means wherein among the document data, the document de corresponding to the character set of the search character sets the input character determined by the determining means For the data, a program for the search executing means for executing a search for the inputted input character as the search condition, a computer to function as a. This program may be stored in a computer-readable information storage medium such as a CD-ROM or a DVD-ROM.
本発明の請求項1、5、6、7の構成によれば、複数言語が含まれる文書に対する文字認識の精度が高まり、文字認識結果に対する検索精度が向上する。 According to the configurations of the first, fifth, sixth, and seventh aspects of the present invention, the accuracy of character recognition for a document including a plurality of languages is improved, and the search accuracy for character recognition results is improved.
本発明の請求項2の構成によれば、文書画像データは、文書に含まれる言語に応じたそれぞれの文書データに変換される。 According to the configuration of claim 2 of the present invention, the document image data is converted into each document data corresponding to the language included in the document.
本発明の請求項3の構成によれば、文書画像データは、文書に含まれる言語ごとに、互いに文字形状が非類似の2つの言語に基づいて、1つの文書データに変換される。 According to the configuration of claim 3 of the present invention, the document image data is converted into one document data based on two languages whose character shapes are dissimilar to each other for each language included in the document.
本発明の請求項4の構成によれば、複数の文書データが取得された場合、文書データごとに入力文字の検索が実行される。 According to the configuration of claim 4 of the present invention, when a plurality of document data is acquired, the input character is searched for each document data.
本発明の一実施形態について、図面を用いて以下に説明する。図1は、本実施形態に係る情報処理システムの全体構成図である。同図に示すように、情報処理システム10は、情報処理装置100、複合機400、及び、ユーザ端末500を含んでいる。情報処理装置100は、OCRサーバ200(文字変換装置)及び検索サーバ300(検索装置)を含んでいる。OCRサーバ200及び検索サーバ300は、別個の装置として設けられてもよいし、これらの機能が1つの装置に含まれてもよい。
An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is an overall configuration diagram of an information processing system according to the present embodiment. As illustrated in FIG. 1, the
情報処理装置100、複合機400、及びユーザ端末500は、LAN(Local Area Network)やインターネット等の通信ネットワークを介して相互に接続されている。
The
複合機400は、コピー機能、FAX機能、及びスキャナ機能等を含んでいる。本実施形態では、ユーザの操作に基づき文書を画像として読み取るスキャナ機能に着目して説明する。複合機400は、用紙等の対象物(文書)を光学的に走査することにより文書を画像として読み取り、読み取った文書画像データを、内部の記憶部に保存するとともに、OCRサーバ200に送信する。なお、複合機400は、OCRサーバ200からの指示に基づいて、記憶部に保存されている文書画像データをOCRサーバ200に送信してもよい。複合機400は、周知の構成を適用することができる。
The
ユーザ端末500は、通信ネットワークに接続された、ユーザが利用する端末装置である。ユーザ端末500は、ユーザの操作に基づいて、通信ネットワークを介してOCRサーバ200、検索サーバ300、及び複合機400とデータ通信を行う。これにより、例えば、ユーザは、ユーザ端末500を操作して、OCRサーバ200にOCR処理の実行を指示したり、検索サーバ300にOCR結果に対する検索処理の実行を指示したり、検索サーバ300から検索結果を取得したりする。また、ユーザは、ユーザ端末500を操作して、OCR処理に関する各種設定を行ったり、各種設定を変更したりする。ユーザ端末500には、ブラウザや電子メールクライアント等のソフトウェアが組み込まれていてもよい。ユーザ端末500は、例えば、パーソナルコンピュータ、PDA(Personal Digital Assistant)、スマートフォン等の携帯情報端末等である。情報処理システム10に含まれるユーザ端末500の数は限定されない。
The
[OCRサーバの構成]
OCRサーバ200は、複合機400から文書画像データを受信するとOCR処理を実行する。図2は、OCRサーバ200のハードウェア構成を示すブロック図である。OCRサーバ200は、CPU21、メモリ22、記憶部23、及び通信部24を含むコンピュータで構成されている。これらのハードウェア要素はバスにより相互にデータの授受が可能に接続されている。通信部24は、通信ネットワークを介して、検索サーバ300、複合機400及びユーザ端末500とデータ通信を行う。CPU21は、OCRサーバ200の各部を制御したり、各種の情報処理を実行したりする。メモリ22は、各種のプログラムやデータを保持する。メモリ22には、CPU21の作業領域も確保される。記憶部23は、各種のデータを記憶する。記憶部23は、OCRサーバ200の外部に設けられてもよい。
[Configuration of OCR server]
When the
図3は、OCRサーバ200の機能的なブロック図である。図3に示すように、OCRサーバ200は、機能的には、データ受信部201、OCR実行言語決定部202、OCR実行部203、及び、OCR結果送信部204を含む。これらの要素はメモリ22(図2参照)に格納されたプログラムをCPU21が実行することにより実現される。このプログラムはCD−ROM、DVD−ROM、メモリカードなどのコンピュータが読み取り可能な情報記憶媒体からOCRサーバ200にインストールされてもよいし、インターネット等の通信ネットワークを介してダウンロードされてもよい。OCRサーバ200の記憶部23には、データ保管部205、言語情報記憶部206、及びOCR結果記憶部207が含まれる。
FIG. 3 is a functional block diagram of the
データ受信部201(データ取得手段)は、複合機400から送信される文書画像データを受信する。データ受信部201は、受信した文書画像データをデータ保管部205に保管する。データ保管部205は、OCR処理の実行前の文書画像データを一時的に保管する。データ保管部205は、例えばキューで構成され、キューイングの処理を行う。
The data receiving unit 201 (data acquisition unit) receives document image data transmitted from the multi-function peripheral 400. The
OCR実行言語決定部202は、OCR処理を実行するための言語(以下、OCR実行言語という。)を決定する。例えば、日本語の文書画像データに対して日本語でOCR処理を実行する場合は、OCR実行言語は日本語となる。
The OCR execution
ここで、文書に複数の言語(文字セット)が混在する場合、OCR処理の文字認識の精度が低下することが知られている。文字形状が類似していない言語が混在している場合は、それぞれの言語の文字形状をそれぞれの言語として認識するため、認識する確率は高い。しかし、特に、複数の言語の文字形状が類似する場合には、誤認識する確率が高くなり、文字認識精度がさらに低下するおそれがある。なお、文字には、記号や数字が含まれてもよい。そこで、本実施形態に係るOCRサーバ200は、文字形状が互いに類似しない複数の言語を組み合わせた言語グループ(以下、非類似言語グループという。)に基づいて、OCR処理を実行する。例えば、日本語と韓国語と中国語とは文字形状が相互に類似するが、これらと英語とは相互に類似しない。このため、「日本語・英語」、「韓国語・英語」、「中国語・英語」のそれぞれを非類似言語グループに設定する。非類似言語グループは、OCRサーバ200の管理者やユーザ端末500のユーザ等により予め設定される。設定された非類似言語グループの情報は、言語情報記憶部206に保存される。図4は、非類似言語グループのテーブルの一例を示す図である。テーブルには、各非類似言語グループの識別情報(ID)が付される。上記した言語以外では、例えばタイ語は、英語、日本語、韓国語、及び中国語のいずれとも文字形状が類似していない非類似言語グループとして設定できる。他には、ヒンズー語とビルマ語は文字形状が類似している言語として設定してもよい。
Here, when a plurality of languages (character sets) are mixed in a document, it is known that the accuracy of character recognition in OCR processing is lowered. When languages that do not have similar character shapes are mixed, the character shapes of the respective languages are recognized as the respective languages, so the probability of recognition is high. However, in particular, when the character shapes of a plurality of languages are similar, the probability of erroneous recognition increases and the character recognition accuracy may further decrease. Note that the characters may include symbols and numbers. Therefore, the
OCR実行言語決定部202は、言語情報記憶部206に保存される非類似言語グループから、ユーザにより選択された言語に対応する非類似言語グループを抽出して、OCR実行言語グループに決定する。図5は、ユーザが言語を選択する選択画面の一例である。選択画面は、OCRサーバ200に接続されたユーザ端末500の表示部に表示されてもよいし、OCRサーバ200上の操作画面に表示されてもよい。ユーザは、選択画面において、所望の言語を選択(チェック)する。以下、OCR実行言語決定部202の動作フローについて、具体例を挙げて説明する。
The OCR execution
図6は、OCR実行言語決定部202の動作フロー図である。ここでは、図5の選択画面において、ユーザが「日本語」と「韓国語」と「英語」を選択した場合を例に挙げる。
FIG. 6 is an operation flowchart of the OCR execution
初めに、OCR実行言語決定部202は、ユーザ端末500からOCR実行言語の設定指示を受信する(S101)。例えば、ユーザがユーザ端末500の表示画面(図5参照)において、「日本語」と「韓国語」と「英語」を選択すると、選択内容を表すデータ(設定指示)がOCRサーバ200に送信され、OCR実行言語決定部202が受信する。次に、OCR実行言語決定部202は、選択された言語の中から1つの言語を取得する(S102)。ここでは例えば、「日本語」を取得する。
First, the OCR execution
次に、OCR実行言語決定部202は、言語情報記憶部206に保存された非類似言語グループ(図4参照)から、取得した言語を含む非類似言語グループを取得する(S103)。ここでは、「日本語」を含む非類似言語グループの「日本語・英語」(ID:JE)を取得する。次に、OCR実行言語決定部202は、取得した非類似言語グループをOCR実行言語グループに登録する(S104)。
Next, the OCR execution
次に、OCR実行言語決定部202は、ユーザにより選択された言語が他にあるか否かを判定し(S105)、他にある場合はS102に戻り上記処理を繰り返す。ここでは、上記各処理により、OCR実行言語決定部202は、「韓国語」を取得し、「韓国語」を含む非類似言語グループの「韓国語・英語」(ID:KE)を取得する。なお、ユーザにより選択された言語には「英語」が含まれるが(図5参照)、「英語」は上記非類似言語グループ(ID:JE、KE)に既に含まれるため、新たな非類似言語グループは取得されない。登録された非類似言語グループの情報は、言語情報記憶部206に保存される。図7は、登録された非類似言語グループの情報を示すテーブルである。
Next, the OCR execution
ユーザにより選択された言語が他にない場合(S105でNO)、OCR実行言語決定部202は、登録された上記非類似言語グループ(ID:JE、KE)をOCR実行言語グループに決定する(S106)。
When there is no other language selected by the user (NO in S105), the OCR execution
以上のようにして、OCR実行言語決定部202は、OCR実行言語(OCR実行言語グループ)を決定する。
As described above, the OCR execution
図3に戻り、OCR実行部203(文書データ生成手段)は、OCR実行言語決定部202により決定されたOCR実行言語グループによりOCR処理を実行して、OCR結果(文書データ)を生成する。OCR結果送信部204は、OCR結果を検索サーバ300に送信する。以下、OCR実行部203の動作フローについて、具体例を挙げて説明する。
Returning to FIG. 3, the OCR execution unit 203 (document data generation unit) executes the OCR process using the OCR execution language group determined by the OCR execution
図8は、OCR実行部203の動作フロー図である。ここでは、OCR実行言語グループとして、図7に示す「日本語・英語」と「韓国語・英語」が決定された場合を例に挙げる。
FIG. 8 is an operation flowchart of the
初めに、データ受信部201が複合機400から文書画像データを受信する(S201)。受信した文書画像データを「D1」と称す。次に、OCR実行部203は、OCR実行言語グループから非類似言語グループを1つ取得する(S202)。ここでは例えば、「日本語・英語」の非類似言語グループを取得する。
First, the
次に、OCR実行部203は、取得した非類似言語グループを使用して、文書画像データD1に対してOCR処理を実行する(S203)。具体的には、文書画像データD1に日本語と英語の文字が含まれる場合は、日本語に対応する部分は日本語に変換され、英語に対応する部分は英語に変換される。日本語と英語は文字形状が類似しないため、日本語が英語に変換されたり、英語が日本語に変換されたりする誤変換を防ぐことができる。また、文書画像データD1に日本語と韓国語の文字が含まれる場合は、日本語に対応する部分は日本語に変換され、韓国語に対応する部分は変換されない(エラーになる)か、あるいは文字形状が類似する日本語に変換される。これにより、日本語の部分は韓国語に変換されることはないため、少なくとも日本語の部分は確実に日本語に変換される。
Next, the
次に、OCR実行部203は、OCR結果(第1OCR結果;第1文書データ)と、使用した非類似言語グループの情報とを関連付けてOCR結果記憶部207に保存する(S204)。図9は、OCR結果記憶部207に保存されるOCR結果の情報を示すテーブルである。ここでは、上記情報がOCR処理ID:t1として保存される。
Next, the
次に、OCR実行部203は、OCR実行言語グループに他の非類似言語グループがあるか否かを判定し(S205)、他の非類似言語グループがある場合はS202に戻り上記処理を繰り返す。
Next, the
ここでは、OCR実行部203は、「韓国語・英語」の非類似言語グループを取得し、「韓国語・英語」を使用して文書画像データD1に対して再度OCR処理を実行する(S203)。具体的には、文書画像データD1に韓国語と英語の文字が含まれる場合は、韓国語に対応する部分は韓国語に変換され、英語に対応する部分は英語に変換される。韓国語と英語は文字形状が類似しないため、韓国語が英語に変換されたり、英語が韓国語に変換されたりする誤変換を防ぐことができる。また、文書画像データD1に韓国語と日本語の文字が含まれる場合は、韓国語に対応する部分は韓国語に変換され、日本語に対応する部分は変換されない(エラーになる)か、あるいは文字形状が類似する韓国語に変換される。すなわち、韓国語の部分は日本語に変換されることはないため、少なくとも韓国語の部分は確実に韓国語に変換される。
Here, the
次に、OCR実行部203は、OCR結果(第2OCR結果;第2文書データ)と、使用した非類似言語グループの情報とを関連付けてOCR結果記憶部207に保存する(S204)。ここでは、上記情報がOCR処理ID:t2として保存される(図9参照)。なお、図9では、各OCR処理ID:t1、t2において、同一のJOB_ID:JOB001が登録されているが、これは、OCR実行部203の1回の動作(上記の例では、2回のOCR処理を含む)を示している。図10には、OCR実行動作とOCR結果との関係を模式的に示している。また、JOB_IDは、文書画像データにも対応している。また、上記の例では、非類似言語グループが2つ登録されているため、1回のOCR実行に対してOCR処理が2回(ID:t1、t2)行われているが、非類似言語グループが3つ登録されている場合は、1回のOCR実行に対してOCR処理が3回行われることになる。
Next, the
以上のようにして、OCR実行部203はOCR処理を実行する。すなわち、OCR実行部203は、例えば文書に日本語と韓国語が混在する場合、初めに、文書画像データ全体に対して日本語及び英語でOCR処理を実行し、続いて、同じ文書画像データ全体に対して韓国語及び英語でOCR処理を実行する。1回目のOCR処理の結果では、日本語の部分が確実に日本語に変換されている。また、2回目のOCR処理の結果では、韓国語の部分が確実に韓国語に変換されている。文書中に日本語及び韓国語に類似した文字があったとしても、少なくとも本来の言語によりOCR処理した結果の方には、正確な変換文字が反映されることになる。このため、文書中の文字のうち、正確に文字変換されず、何れのOCR結果にも含まれなくなるような文字が生じることはない。換言すると、文書中の全ての文字を正確に文字変換することができる。よって、複数言語が含まれる文書に対する文字認識の精度を高めることができる。
As described above, the
[検索サーバの構成]
検索サーバ300は、OCRサーバ200において生成されたOCR結果に対して、ユーザにより入力された検索条件に基づいて文字列検索を実行する。図2には、検索サーバ300のハードウェア構成を示している。検索サーバ300は、CPU31、メモリ32、記憶部33、及び通信部34を含むコンピュータで構成されている。これらのハードウェア要素はバスにより相互にデータの授受が可能に接続されている。通信部34は、通信ネットワークを介して、OCRサーバ200及びユーザ端末500とデータ通信を行う。CPU31は、検索サーバ300の各部を制御したり、各種の情報処理を実行したりする。メモリ32は、各種のプログラムやデータを保持する。メモリ32には、CPU31の作業領域も確保される。記憶部33は、各種のデータを記憶する。記憶部33は、検索サーバ300の外部に設けられていてもよい。
Search server configuration
The
図11は、検索サーバ300の機能的なブロック図である。図11に示すように、検索サーバ300は、機能的には、OCR結果受信部301、OCR情報管理部302、検索指示受信部303、検索言語判定部304、検索処理部305、及び、検索結果送信部306を含む。これらの要素はメモリ32(図2参照)に格納されたプログラムをCPU31が実行することにより実現される。このプログラムはCD−ROM、DVD−ROM、メモリカードなどのコンピュータが読み取り可能な情報記憶媒体から検索サーバ300にインストールされてもよいし、インターネット等の通信ネットワークを介してダウンロードされてもよい。検索サーバ300の記憶部33は、OCR結果保管部307、OCR情報記憶部308、及び文字情報記憶部309が含まれる。
FIG. 11 is a functional block diagram of the
OCR結果受信部301は、OCRサーバ200からOCR結果を受信する。OCR結果受信部301は、受信したOCR結果をOCR結果保管部307に保管する。OCR結果保管部307は、検索処理の実行前のOCR結果を一時的に保管する。OCR結果保管部307は、例えばキューで構成され、キューイングの処理を行う。ここでは例えば、ID:t1〜t4のOCR結果(図9参照)を受信する。
The OCR
OCR情報管理部302は、OCR結果受信部301が受信したOCR結果をOCR情報記憶部308に保存する。OCR情報記憶部308に保存される情報は、OCR結果記憶部207(図9参照)に保存されるOCR結果の情報と同一である。
The OCR
以下では、検索サーバ300の検索処理及び検索処理を実行する要素について、図12の動作フローを参照しつつ説明する。図12は、検索サーバ300の動作フロー図である。
Hereinafter, the search processing of the
検索指示受信部303は、ユーザ端末500から検索指示を受信する(S301)。例えばユーザはユーザ端末500において、所望の検索条件(検索キーワード)を入力する。検索キーワードが入力されると、検索キーワードを含む検索指示が、ユーザ端末500から検索サーバ300に送信される。
The search
検索言語判定部304は、受信した上記検索指示に含まれる情報(検索キーワード)に基づいて、検索対象の言語を判定する(S302)。具体的には、検索言語判定部304は、検索キーワードの文字の文字コードを取得し、文字コード対応テーブルを参照して、取得した文字コードに対応する言語を判定する。文字コード対応テーブルは、文字情報記憶部309に予め登録されている。図13は、文字コード対応テーブルの一例を示す図である。例えば、検索キーワードの開始文字の文字コードが「3040」で、終了文字コードが「309F」で、文字種別が「ひらがな」の場合、検索言語判定部304は、当該検索キーワードを、「日本語」と判定する。
The search
検索処理部305(検索実行手段)は、OCR情報記憶部308に保存された全てのOCR結果(図9参照)から、検索言語判定部304により判定された言語に対応するOCR結果を1つ取得し(S303)、取得したOCR結果に対して、文字列検索を実行する(S304)。例えば、ID:t1〜t4の4つのOCR結果が保存されているとすると、このうち、OCR実行言語グループ(非類似言語グループ)に「日本語」を含むID:t1のOCR結果を取得し、文字列検索を実行する。上記判定された言語に該当するOCR結果が他にある場合(S305でYES)、S303に戻り上記処理が繰り返される。ここでは、OCR実行言語グループに「日本語」を含むID:t3のOCR結果を取得し、文字列検索を実行する。
The search processing unit 305 (search execution means) obtains one OCR result corresponding to the language determined by the search
検索結果送信部306は、検索結果を、検索指示を送信したユーザ端末500に送信する(S306)。検索結果は、検索キーワードを含む文書画像データであってもよいし、検索キーワードを含む文字変換後のテキストデータであってもよい。また、文書画像データやテキストデータにおいて、検索キーワードに該当する部分の表示形態を変更してもよい。例えば、該当部分を、反転表示、カラー表示、太字表示、枠付き表示などの表示形態に変更してもよい。
The search
以上のようにして、検索サーバ300は検索処理を実行する。上記構成によれば、文字認識精度が高いOCR処理による結果に対して、検索条件に応じた言語の検索を行うため、検索精度を向上させることができる。
As described above, the
[変形例]
本実施形態は上記構成に限定されない。例えば情報処理システム10は、OCR結果として、文字列検索可能な文書ファイル(例えば、サーチャブルPDF)を生成する機能と、生成した上記文書ファイルをユーザ端末500にダウンロードさせる機能とを含んでもよい。この機能を実現するために情報処理システム10は、OCR実行言語グループごとに上記文書ファイルを生成する手段と、OCR対象文書に、生成した上記文書ファイルとOCR実行言語グループとを関連付けて管理する手段と、検索結果の文書表示時に、検索条件としてのキーワードを含む言語情報を一時的に保持する手段と、検索結果の表示後に上記文書ファイルのダウンロードが指示された場合に、上記保持手段で保持されている言語情報に関連付けられている文書ファイルをダウンロードさせる手段とを含んでいればよい。これにより、ユーザが所望する適切な文字列検索可能文書をユーザの負担無くダウンロードさせることができる。
[Modification]
The present embodiment is not limited to the above configuration. For example, the
以上の説明では、互いに異なる複数の「言語」を例に挙げたが、本実施形態に係る情報処理装置は、「言語」に限定されない。本実施形態に係る情報処理装置は、例えば、読み取り対象の文書中に、「ひらがな」と「カタカナ」が含まれる場合や、「ひらがな」と「漢字」が含まれる場合や、「ひらがな」と「アラビア数字」が含まれる場合等、互いに文字の種類(文字セット)が異なる場合でも適用可能である。文字セットには、例えば、言語の他、ひらがな、カタカナ、漢字、アラビア数字等の文字の種類が含まれる。また、同じ文字の種類又は同じ言語のうち文字の字体が異なるもの同士を、別々の文字セットとしてもよい。OCR実行部203は、例えば、「ひらがな」(第1の文字セット)と「カタカナ」(第2の文字セット)を含む文書において、ひらがなの部分はひらがな(OCR実行言語)によりOCR処理を行い、カタカナの部分はカタカナ(OCR実行言語)によりOCR処理を行う。これにより、ひらがなの部分は確実にひらがらに変換され、カタカナの部分は確実にカタカナに変換される。
In the above description, a plurality of “languages” which are different from each other are given as examples. However, the information processing apparatus according to the present embodiment is not limited to “languages”. The information processing apparatus according to the present embodiment, for example, includes “Hiragana” and “Katakana” in the document to be read, “Hiragana” and “Kanji”, or “Hiragana” and “ The present invention is applicable even when the character types (character sets) are different from each other, such as when “Arabic numerals” are included. The character set includes, for example, character types such as hiragana, katakana, kanji, and Arabic numerals in addition to languages. Also, different character sets of the same character type or the same language may be used as different character sets. For example, in a document including “Hiragana” (first character set) and “Katakana” (second character set), the
このように、本実施形態に係る情報処理装置10は、互いに異なる複数の文字セットを含む文書を画像として読み取った文書画像データを取得するデータ受信部201と、複数の文字セットごとに、該文字セットにより上記文書画像データの全体を文字認識し文書データに変換して、1つの上記文書画像データに対して上記文字セットの数に応じた数の上記文書データを生成するOCR実行部203と、OCR実行部203により生成された少なくとも1つの上記文書データにおいて、検索条件として入力された入力文字の検索を実行する検索処理部305と、を含む構成である。
As described above, the
10 情報処理システム、100 情報処理装置、200 OCRサーバ、300 検索サーバ、400 複合機、500 ユーザ端末、21,31 CPU、22,32 メモリ、23,33 記憶部、24,34 通信部、201 データ受信部、202 OCR実行言語決定部、203 OCR実行部、204 OCR結果送信部、205 データ保管部、206 言語情報記憶部、207 OCR結果記憶部、301 OCR結果受信部、302 OCR情報管理部、303 検索指示受信部、304 検索言語判定部、305 検索処理部、306 検索結果送信部、307 OCR結果保管部、308 OCR情報記憶部、309 文字情報記憶部309。
DESCRIPTION OF
Claims (7)
前記複数の文字セットごとに、該文字セットにより前記文書画像データの全体を文字認識し文書データに変換して、1つの前記文書画像データに対して前記文字セットの数に応じた数の前記文書データを生成する文書データ生成手段と、
前記文書データ生成手段により生成された複数の前記文書データを記憶する文書データ記憶手段と、
検索条件として入力された入力文字の文字セットを判定する検索文字セット判定手段と、
前記文書データ記憶手段に記憶された複数の前記文書データのうち、前記検索文字セット判定手段により判定された前記入力文字の文字セットに対応する前記文書データに対して、前記検索条件として入力された前記入力文字の検索を実行する検索実行手段と、
を含むことを特徴とする情報処理装置。 Data acquisition means for acquiring document image data obtained by reading a document including a plurality of different character sets as an image;
For each of the plurality of character sets, the entire document image data is recognized by the character set and converted into document data, and the number of the documents corresponding to the number of the character sets for one document image data. Document data generating means for generating data;
Document data storage means for storing a plurality of the document data generated by the document data generation means ;
A search character set determination means for determining a character set of an input character input as a search condition;
Among the plurality of document data stored in the document data storage means, for the document data corresponding to the determined character set of the input character by the search character set determining unit, entered as the search condition a search executing means for executing a search of the input character,
An information processing apparatus comprising:
前記文書データ生成手段は、前記第1の文字セットに基づいて前記文書画像データの全体を文字認識し文書データに変換して第1の文書データを生成するとともに、前記第2の文字セットに基づいて前記文書画像データの全体を文字認識し文書データに変換して第2の文書データを生成する、
ことを特徴とする請求項1に記載の情報処理装置。 If the document includes different first and second character sets,
The document data generation means recognizes the entire document image data based on the first character set and converts it into document data to generate first document data, and based on the second character set. Recognizing the entire document image data and converting it to document data to generate second document data;
The information processing apparatus according to claim 1.
前記文書データ生成手段は、互いに文字形状が非類似の前記第1の文字セット及び第3の文字セットに基づいて、前記文書画像データの全体を文字認識し文書データに変換して第1の文書データを生成するとともに、互いに文字形状が非類似の前記第2の文字セット及び第4の文字セットに基づいて、前記文書画像データの全体を文字認識し文書データに変換して第2の文書データを生成する、
ことを特徴とする請求項1に記載の情報処理装置。 If the document includes different first and second character sets,
The document data generation means recognizes the entire document image data based on the first character set and the third character set whose character shapes are dissimilar to each other, converts the document image data into document data, and converts the first document set into document data. The second document data is generated by generating the data, recognizing the entire document image data based on the second character set and the fourth character set having dissimilar character shapes, and converting the document image data into document data. Generate
The information processing apparatus according to claim 1.
前記検索条件として入力された前記入力文字の文字セットが第5の文字セットであった場合、
前記文書データ取得手段は、前記文書データ記憶手段から、前記第5の文字セットを含む少なくとも1つの前記文書データを取得し、
前記検索実行手段は、取得された前記文書データごとに、前記入力文字の検索を実行する、
ことを特徴とする請求項1に記載の情報処理装置。 The document data corresponding to the character set of the inputted input character as the search condition further comprises document data obtaining means for obtaining from the document data storage unit,
When the character set of the inputted input character as the search condition is a fifth character set,
The document data acquisition means acquires at least one document data including the fifth character set from the document data storage means;
The search executing means, for each said were acquisition document data, perform a search of the input character,
The information processing apparatus according to claim 1.
ことを特徴とする請求項1に記載の情報処理装置。 The plurality of different character sets are a plurality of different languages.
The information processing apparatus according to claim 1.
前記文字変換装置は、
互いに異なる複数の文字セットを含む文書を画像として読み取った文書画像データを取得するデータ取得手段と、
前記複数の文字セットごとに、該文字セットにより前記文書画像データの全体を文字認識し文書データに変換して、1つの前記文書画像データに対して前記文字セットの数に応じた数の前記文書データを生成する文書データ生成手段と、
前記文書データ生成手段により生成された複数の前記文書データを記憶する文書データ記憶手段と、
前記文書データを前記検索装置に送信する送信手段と、を含み、
前記検索装置は、
前記文書データを前記文字変換装置から受信する受信手段と、
検索条件として入力された入力文字の文字セットを判定する検索文字セット判定手段と、
前記文書データ記憶手段に記憶された複数の前記文書データのうち、前記検索文字セット判定手段により判定された前記入力文字の文字セットに対応する前記文書データに対して、前記検索条件として入力された前記入力文字の検索を実行する検索実行手段と、
前記検索実行手段による検索結果を、前記検索条件を入力したユーザのユーザ端末に送信する送信手段と、
を含むことを特徴とする情報処理システム。 An information processing system including a character conversion device and a search device,
The character conversion device includes:
Data acquisition means for acquiring document image data obtained by reading a document including a plurality of different character sets as an image;
For each of the plurality of character sets, the entire document image data is recognized by the character set and converted into document data, and the number of the documents corresponding to the number of the character sets for one document image data. Document data generating means for generating data;
Document data storage means for storing a plurality of the document data generated by the document data generation means ;
Transmitting means for transmitting the document data to the search device,
The search device includes:
Receiving means for receiving the document data from the character conversion device;
A search character set determination means for determining a character set of an input character input as a search condition;
Among the plurality of document data stored in the document data storage means, for the document data corresponding to the determined character set of the input character by the search character set determining unit, entered as the search condition a search executing means for executing a search of the input character,
Transmitting means for transmitting a search result by the search execution means to a user terminal of a user who has input the search condition;
An information processing system comprising:
前記複数の文字セットごとに、該文字セットにより前記文書画像データの全体を文字認識し文書データに変換して、1つの前記文書画像データに対して前記文字セットの数に応じた数の前記文書データを生成する文書データ生成手段、
前記文書データ生成手段により生成された複数の前記文書データを記憶する文書データ記憶手段、
検索条件として入力された入力文字の文字セットを判定する検索文字セット判定手段、及び、
前記文書データ記憶手段に記憶された複数の前記文書データのうち、前記検索文字セット判定手段により判定された前記入力文字の文字セットに対応する前記文書データに対して、前記検索条件として入力された前記入力文字の検索を実行する検索実行手段、
としてコンピュータを機能させるためのプログラム。 Data acquisition means for acquiring document image data obtained by reading a document including a plurality of different character sets as an image;
For each of the plurality of character sets, the entire document image data is recognized by the character set and converted into document data, and the number of the documents corresponding to the number of the character sets for one document image data. Document data generating means for generating data ,
Document data storage means for storing a plurality of the document data generated by the previous SL document data generating means,
Search character set determination means for determining a character set of input characters input as a search condition, and
Among the plurality of document data stored in the document data storage means, for the document data corresponding to the determined character set of the input character by the search character set determining unit, entered as the search condition search execution means for executing a search of the input character,
As a program to make the computer function as.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014193541A JP6484974B2 (en) | 2014-09-24 | 2014-09-24 | Information processing apparatus, information processing system, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014193541A JP6484974B2 (en) | 2014-09-24 | 2014-09-24 | Information processing apparatus, information processing system, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016066157A JP2016066157A (en) | 2016-04-28 |
JP6484974B2 true JP6484974B2 (en) | 2019-03-20 |
Family
ID=55805619
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014193541A Active JP6484974B2 (en) | 2014-09-24 | 2014-09-24 | Information processing apparatus, information processing system, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6484974B2 (en) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10177623A (en) * | 1996-12-16 | 1998-06-30 | Ricoh Co Ltd | Document recognizing device and language processor |
JPH11338977A (en) * | 1998-05-28 | 1999-12-10 | Canon Inc | Method and device for character processing and storage medium |
JP4640593B2 (en) * | 2005-07-14 | 2011-03-02 | 日本電気株式会社 | Multilingual document search device, multilingual document search method, and multilingual document search program |
JP2011232991A (en) * | 2010-04-28 | 2011-11-17 | Murata Mach Ltd | Search device and image processing system |
JP5672953B2 (en) * | 2010-10-26 | 2015-02-18 | 株式会社リコー | Image processing apparatus, image processing method, and image processing program |
JP2013164728A (en) * | 2012-02-10 | 2013-08-22 | Canon Inc | Information processor for determining language relating to character in image |
-
2014
- 2014-09-24 JP JP2014193541A patent/JP6484974B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016066157A (en) | 2016-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9866725B2 (en) | Image processing system, information processing apparatus, and recordable medium | |
US10306085B2 (en) | Information processing apparatus, control method of information processing apparatus, and recording medium | |
JP6066108B2 (en) | Electronic document generation system and program | |
US8294928B2 (en) | Data management system to extract text data | |
US11301675B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP2010074290A (en) | Information processing device, information processing method, program, and storage medium | |
US10078479B2 (en) | Printing process system and information processing apparatus | |
US20230108397A1 (en) | Apparatus, information processing method, and storage medium | |
JP6484974B2 (en) | Information processing apparatus, information processing system, and program | |
JP2007041709A (en) | Document processing system, control method of document processing system, document processing device, computer program and computer readable storage medium | |
JP6907659B2 (en) | Information processing system, information processing device, information processing method and program | |
US20150070724A1 (en) | Information processing system and information processing method | |
JP2016096393A (en) | Information processing apparatus, system, information processing method, and program | |
JP6749583B2 (en) | Information processing device, image processing device, and program | |
US20150264204A1 (en) | Document management system, document managing method, and recording medium storing a document managing program | |
JP2012049668A (en) | Document reading apparatus, information processing apparatus, and program for information processing apparatus | |
JP6589508B2 (en) | Information processing apparatus, image forming apparatus, and program | |
US11252296B2 (en) | Facsimile for displaying address confirmation, control method, and non-transitory recording medium | |
US11637937B2 (en) | Information processing apparatus, information processing method, and non-transitory storage medium | |
JP5910254B2 (en) | Image forming apparatus, image forming apparatus control method, and image forming apparatus control program | |
JP2018133724A (en) | Image forming apparatus, image processing system, control method, and program | |
US20240073345A1 (en) | Image forming apparatus, non-transitory computer readable medium storing image forming program, and information processing system | |
US10021263B2 (en) | Image processor acquiring image log, and computer-readable non-transitory recording medium storing program for image processor | |
JP2007281774A (en) | Image processing system and method, image processing device, program, and recording medium | |
US20200004485A1 (en) | Information processing apparatus, method, and non-transitory recording medium storing instructions for executing an information processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170905 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180626 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180622 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180827 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190204 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6484974 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |