JP2016066157A

JP2016066157A - 情報処理装置、情報処理システム及びプログラム

Info

Publication number: JP2016066157A
Application number: JP2014193541A
Authority: JP
Inventors: 祐大竹; Hiroshi Otake
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2014-09-24
Filing date: 2014-09-24
Publication date: 2016-04-28
Anticipated expiration: 2034-09-24
Also published as: JP6484974B2

Abstract

【課題】複数言語が含まれる文書に対する文字認識の精度を高め、文字認識結果に対する検索精度を向上させることができる情報処理装置を提供する。【解決手段】情報処理装置１００は、互いに異なる複数の言語を含む文書を画像として読み取った文書画像データを取得するデータ受信部２０１と、前記複数の言語ごとに、前記文書画像データの全体をＯＣＲ処理するＯＣＲ実行部２０３と、検索条件として入力された入力文字の言語に対応する複数のＯＣＲ結果において、前記入力文字の検索を実行する検索処理部と、を含む。【選択図】図３

Description

本発明は、情報処理装置、情報処理システム及びプログラムに関する。

従来、スキャナ等で読み込んだ文書画像から文字を認識して文書データに変換するＯＣＲ（Optical Character Recognition）技術が知られている。また、複数の言語を含む文書に対してＯＣＲ処理を行う技術も提案されている。例えば、特許文献１には、複数の言語を含む文書に対して、文書の領域ごとに異なる言語でＯＣＲ処理を行う技術が記載されている。

また、複数のＯＣＲ結果から、ユーザが入力した検索条件に合致するＯＣＲ結果を検索する技術も知られている（例えば特許文献２）。

特開２００６−２６０１１５号公報特開２００４−２１３０９１号公報

ここで複数言語が含まれる文書には、例えば、文書の一部分が日本語で記載され、他の部分が韓国語で記載され、更に他の部分が英語で記載されている文書や、文書全体で日本語と韓国語と英語が混在して記載されている文書がある。日本語と韓国語は文字形状が類似しているため、特に後者の文書ではＯＣＲ処理において文字認識の精度が低下する。そして文字認識の精度が低下すると、ＯＣＲ結果に対する検索精度も低下してしまう。

本発明は、複数言語が含まれる文書に対する文字認識の精度を高め、文字認識結果に対する検索精度を向上させることができる情報処理装置、情報処理システム及びプログラムを提供することを目的とする。

本発明の請求項１に係る情報処理装置は、互いに異なる複数の文字セットを含む文書を画像として読み取った文書画像データを取得するデータ取得手段と、前記複数の文字セットごとに、該文字セットにより前記文書画像データの全体を文字認識し文書データに変換して、１つの前記文書画像データに対して前記文字セットの数に応じた数の前記文書データを生成する文書データ生成手段と、前記文書データ生成手段により生成された少なくとも１つの前記文書データにおいて、検索条件として入力された入力文字の検索を実行する検索実行手段と、を含むことを特徴とする。

本発明の請求項２に係る情報処理装置は、請求項１に記載の構成において、前記文書に、互いに異なる第１の文字セット及び第２の文字セットが含まれる場合、前記文書データ生成手段は、前記第１の文字セットに基づいて前記文書画像データの全体を文字認識し文書データに変換して第１の文書データを生成するとともに、前記第２の文字セットに基づいて前記文書画像データの全体を文字認識し文書データに変換して第２の文書データを生成する。

本発明の請求項３に係る情報処理装置は、請求項１に記載の構成において、前記文書に、互いに異なる第１の文字セット及び第２の文字セットが含まれる場合、前記文書データ生成手段は、互いに文字形状が非類似の前記第１の文字セット及び第３の文字セットに基づいて、前記文書画像データの全体を文字認識し文書データに変換して第１の文書データを生成するとともに、互いに文字形状が非類似の前記第２の文字セット及び第４の文字セットに基づいて、前記文書画像データの全体を文字認識し文書データに変換して第２の文書データを生成する。

本発明の請求項４に係る情報処理装置は、請求項１に記載の構成において、前記文書データ生成手段により生成された複数の前記文書画像データに対応する複数の前記文書データを記憶する記憶手段から、検索条件として入力された入力文字の文字セットに対応する前記文書データを取得する文書データ取得手段をさらに含み、検索条件として入力された入力文字の文字セットが第５の文字セットであった場合、前記文書データ取得手段は、前記記憶手段から、前記第５の文字セットを含む少なくとも１つの前記文書データを取得し、前記検索実行手段は、前記取得された前記文書データごとに、前記入力文字の検索を実行する。

本発明の請求項５に係る情報処理装置は、請求項１に記載の構成において、前記互いに異なる複数の文字セットは、互いに異なる複数の言語である。

本発明の請求項６に係る情報処理システムは、文字変換装置と検索装置とを含む情報処理システムであって、前記文字変換装置は、互いに異なる複数の文字セットを含む文書を画像として読み取った文書画像データを取得するデータ取得手段と、前記複数の文字セットごとに、該文字セットにより前記文書画像データの全体を文字認識し文書データに変換して、１つの前記文書画像データに対して前記文字セットの数に応じた数の前記文書データを生成する文書データ生成手段と、前記文書データを前記検索装置に送信する送信手段と、を含み、前記検索装置は、前記文書データを前記文字変換装置から受信する受信手段と、前記文書データ生成手段により生成された少なくとも１つの前記文書データにおいて、検索条件として入力された入力文字の検索を実行する検索実行手段と、前記検索実行手段による検索結果を、前記検索条件を入力したユーザのユーザ端末に送信する送信手段と、を含むことを特徴とする。

本発明の請求項７に係るプログラムは、互いに異なる複数の文字セットを含む文書を画像として読み取った文書画像データを取得するデータ取得手段、前記複数の文字セットごとに、該文字セットにより前記文書画像データの全体を文字認識し文書データに変換して、１つの前記文書画像データに対して前記文字セットの数に応じた数の前記文書データを生成する文書データ生成手段、及び、前記文書データ生成手段により生成された少なくとも１つの前記文書データにおいて、検索条件として入力された入力文字の検索を実行する検索実行手段、としてコンピュータを機能させるためのプログラムである。このプログラムは、ＣＤ−ＲＯＭやＤＶＤ−ＲＯＭなどの、コンピュータが読み取り可能な情報記憶媒体に格納されてもよい。

本発明の請求項１、５、６、７の構成によれば、複数言語が含まれる文書に対する文字認識の精度が高まり、文字認識結果に対する検索精度が向上する。

本発明の請求項２の構成によれば、文書画像データは、文書に含まれる言語に応じたそれぞれの文書データに変換される。

本発明の請求項３の構成によれば、文書画像データは、文書に含まれる言語ごとに、互いに文字形状が非類似の２つの言語に基づいて、１つの文書データに変換される。

本発明の請求項４の構成によれば、複数の文書データが取得された場合、文書データごとに入力文字の検索が実行される。

本実施形態に係る情報処理システムの全体構成図である。ＯＣＲサーバ及び検索サーバのハードウェア構成を示すブロック図である。ＯＣＲサーバの機能的なブロック図である。非類似言語グループのテーブルの一例を示す図である。ユーザが言語を選択する選択画面の一例である。ＯＣＲ実行言語決定部の動作フロー図である。登録された非類似言語グループの情報を示すテーブルである。ＯＣＲ実行部の動作フロー図である。ＯＣＲ結果の情報を示すテーブルである。ＯＣＲ実行動作とＯＣＲ結果との関係を模式的に示す図である。検索サーバの機能的なブロック図である。検索サーバの動作フロー図である。文字コード対応テーブルの一例を示す図である。

本発明の一実施形態について、図面を用いて以下に説明する。図１は、本実施形態に係る情報処理システムの全体構成図である。同図に示すように、情報処理システム１０は、情報処理装置１００、複合機４００、及び、ユーザ端末５００を含んでいる。情報処理装置１００は、ＯＣＲサーバ２００（文字変換装置）及び検索サーバ３００（検索装置）を含んでいる。ＯＣＲサーバ２００及び検索サーバ３００は、別個の装置として設けられてもよいし、これらの機能が１つの装置に含まれてもよい。

情報処理装置１００、複合機４００、及びユーザ端末５００は、ＬＡＮ（Local Area Network）やインターネット等の通信ネットワークを介して相互に接続されている。

複合機４００は、コピー機能、ＦＡＸ機能、及びスキャナ機能等を含んでいる。本実施形態では、ユーザの操作に基づき文書を画像として読み取るスキャナ機能に着目して説明する。複合機４００は、用紙等の対象物（文書）を光学的に走査することにより文書を画像として読み取り、読み取った文書画像データを、内部の記憶部に保存するとともに、ＯＣＲサーバ２００に送信する。なお、複合機４００は、ＯＣＲサーバ２００からの指示に基づいて、記憶部に保存されている文書画像データをＯＣＲサーバ２００に送信してもよい。複合機４００は、周知の構成を適用することができる。

ユーザ端末５００は、通信ネットワークに接続された、ユーザが利用する端末装置である。ユーザ端末５００は、ユーザの操作に基づいて、通信ネットワークを介してＯＣＲサーバ２００、検索サーバ３００、及び複合機４００とデータ通信を行う。これにより、例えば、ユーザは、ユーザ端末５００を操作して、ＯＣＲサーバ２００にＯＣＲ処理の実行を指示したり、検索サーバ３００にＯＣＲ結果に対する検索処理の実行を指示したり、検索サーバ３００から検索結果を取得したりする。また、ユーザは、ユーザ端末５００を操作して、ＯＣＲ処理に関する各種設定を行ったり、各種設定を変更したりする。ユーザ端末５００には、ブラウザや電子メールクライアント等のソフトウェアが組み込まれていてもよい。ユーザ端末５００は、例えば、パーソナルコンピュータ、ＰＤＡ（Personal Digital Assistant）、スマートフォン等の携帯情報端末等である。情報処理システム１０に含まれるユーザ端末５００の数は限定されない。

［ＯＣＲサーバの構成］
ＯＣＲサーバ２００は、複合機４００から文書画像データを受信するとＯＣＲ処理を実行する。図２は、ＯＣＲサーバ２００のハードウェア構成を示すブロック図である。ＯＣＲサーバ２００は、ＣＰＵ２１、メモリ２２、記憶部２３、及び通信部２４を含むコンピュータで構成されている。これらのハードウェア要素はバスにより相互にデータの授受が可能に接続されている。通信部２４は、通信ネットワークを介して、検索サーバ３００、複合機４００及びユーザ端末５００とデータ通信を行う。ＣＰＵ２１は、ＯＣＲサーバ２００の各部を制御したり、各種の情報処理を実行したりする。メモリ２２は、各種のプログラムやデータを保持する。メモリ２２には、ＣＰＵ２１の作業領域も確保される。記憶部２３は、各種のデータを記憶する。記憶部２３は、ＯＣＲサーバ２００の外部に設けられてもよい。

図３は、ＯＣＲサーバ２００の機能的なブロック図である。図３に示すように、ＯＣＲサーバ２００は、機能的には、データ受信部２０１、ＯＣＲ実行言語決定部２０２、ＯＣＲ実行部２０３、及び、ＯＣＲ結果送信部２０４を含む。これらの要素はメモリ２２（図２参照）に格納されたプログラムをＣＰＵ２１が実行することにより実現される。このプログラムはＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭ、メモリカードなどのコンピュータが読み取り可能な情報記憶媒体からＯＣＲサーバ２００にインストールされてもよいし、インターネット等の通信ネットワークを介してダウンロードされてもよい。ＯＣＲサーバ２００の記憶部２３には、データ保管部２０５、言語情報記憶部２０６、及びＯＣＲ結果記憶部２０７が含まれる。

データ受信部２０１（データ取得手段）は、複合機４００から送信される文書画像データを受信する。データ受信部２０１は、受信した文書画像データをデータ保管部２０５に保管する。データ保管部２０５は、ＯＣＲ処理の実行前の文書画像データを一時的に保管する。データ保管部２０５は、例えばキューで構成され、キューイングの処理を行う。

ＯＣＲ実行言語決定部２０２は、ＯＣＲ処理を実行するための言語（以下、ＯＣＲ実行言語という。）を決定する。例えば、日本語の文書画像データに対して日本語でＯＣＲ処理を実行する場合は、ＯＣＲ実行言語は日本語となる。

ここで、文書に複数の言語（文字セット）が混在する場合、ＯＣＲ処理の文字認識の精度が低下することが知られている。文字形状が類似していない言語が混在している場合は、それぞれの言語の文字形状をそれぞれの言語として認識するため、認識する確率は高い。しかし、特に、複数の言語の文字形状が類似する場合には、誤認識する確率が高くなり、文字認識精度がさらに低下するおそれがある。なお、文字には、記号や数字が含まれてもよい。そこで、本実施形態に係るＯＣＲサーバ２００は、文字形状が互いに類似しない複数の言語を組み合わせた言語グループ（以下、非類似言語グループという。）に基づいて、ＯＣＲ処理を実行する。例えば、日本語と韓国語と中国語とは文字形状が相互に類似するが、これらと英語とは相互に類似しない。このため、「日本語・英語」、「韓国語・英語」、「中国語・英語」のそれぞれを非類似言語グループに設定する。非類似言語グループは、ＯＣＲサーバ２００の管理者やユーザ端末５００のユーザ等により予め設定される。設定された非類似言語グループの情報は、言語情報記憶部２０６に保存される。図４は、非類似言語グループのテーブルの一例を示す図である。テーブルには、各非類似言語グループの識別情報（ＩＤ）が付される。上記した言語以外では、例えばタイ語は、英語、日本語、韓国語、及び中国語のいずれとも文字形状が類似していない非類似言語グループとして設定できる。他には、ヒンズー語とビルマ語は文字形状が類似している言語として設定してもよい。

ＯＣＲ実行言語決定部２０２は、言語情報記憶部２０６に保存される非類似言語グループから、ユーザにより選択された言語に対応する非類似言語グループを抽出して、ＯＣＲ実行言語グループに決定する。図５は、ユーザが言語を選択する選択画面の一例である。選択画面は、ＯＣＲサーバ２００に接続されたユーザ端末５００の表示部に表示されてもよいし、ＯＣＲサーバ２００上の操作画面に表示されてもよい。ユーザは、選択画面において、所望の言語を選択（チェック）する。以下、ＯＣＲ実行言語決定部２０２の動作フローについて、具体例を挙げて説明する。

図６は、ＯＣＲ実行言語決定部２０２の動作フロー図である。ここでは、図５の選択画面において、ユーザが「日本語」と「韓国語」と「英語」を選択した場合を例に挙げる。

初めに、ＯＣＲ実行言語決定部２０２は、ユーザ端末５００からＯＣＲ実行言語の設定指示を受信する（Ｓ１０１）。例えば、ユーザがユーザ端末５００の表示画面（図５参照）において、「日本語」と「韓国語」と「英語」を選択すると、選択内容を表すデータ（設定指示）がＯＣＲサーバ２００に送信され、ＯＣＲ実行言語決定部２０２が受信する。次に、ＯＣＲ実行言語決定部２０２は、選択された言語の中から１つの言語を取得する（Ｓ１０２）。ここでは例えば、「日本語」を取得する。

次に、ＯＣＲ実行言語決定部２０２は、言語情報記憶部２０６に保存された非類似言語グループ（図４参照）から、取得した言語を含む非類似言語グループを取得する（Ｓ１０３）。ここでは、「日本語」を含む非類似言語グループの「日本語・英語」（ＩＤ：ＪＥ）を取得する。次に、ＯＣＲ実行言語決定部２０２は、取得した非類似言語グループをＯＣＲ実行言語グループに登録する（Ｓ１０４）。

次に、ＯＣＲ実行言語決定部２０２は、ユーザにより選択された言語が他にあるか否かを判定し（Ｓ１０５）、他にある場合はＳ１０２に戻り上記処理を繰り返す。ここでは、上記各処理により、ＯＣＲ実行言語決定部２０２は、「韓国語」を取得し、「韓国語」を含む非類似言語グループの「韓国語・英語」（ＩＤ：ＫＥ）を取得する。なお、ユーザにより選択された言語には「英語」が含まれるが（図５参照）、「英語」は上記非類似言語グループ（ＩＤ：ＪＥ、ＫＥ）に既に含まれるため、新たな非類似言語グループは取得されない。登録された非類似言語グループの情報は、言語情報記憶部２０６に保存される。図７は、登録された非類似言語グループの情報を示すテーブルである。

ユーザにより選択された言語が他にない場合（Ｓ１０５でＮＯ）、ＯＣＲ実行言語決定部２０２は、登録された上記非類似言語グループ（ＩＤ：ＪＥ、ＫＥ）をＯＣＲ実行言語グループに決定する（Ｓ１０６）。

以上のようにして、ＯＣＲ実行言語決定部２０２は、ＯＣＲ実行言語（ＯＣＲ実行言語グループ）を決定する。

図３に戻り、ＯＣＲ実行部２０３（文書データ生成手段）は、ＯＣＲ実行言語決定部２０２により決定されたＯＣＲ実行言語グループによりＯＣＲ処理を実行して、ＯＣＲ結果（文書データ）を生成する。ＯＣＲ結果送信部２０４は、ＯＣＲ結果を検索サーバ３００に送信する。以下、ＯＣＲ実行部２０３の動作フローについて、具体例を挙げて説明する。

図８は、ＯＣＲ実行部２０３の動作フロー図である。ここでは、ＯＣＲ実行言語グループとして、図７に示す「日本語・英語」と「韓国語・英語」が決定された場合を例に挙げる。

初めに、データ受信部２０１が複合機４００から文書画像データを受信する（Ｓ２０１）。受信した文書画像データを「Ｄ１」と称す。次に、ＯＣＲ実行部２０３は、ＯＣＲ実行言語グループから非類似言語グループを１つ取得する（Ｓ２０２）。ここでは例えば、「日本語・英語」の非類似言語グループを取得する。

次に、ＯＣＲ実行部２０３は、取得した非類似言語グループを使用して、文書画像データＤ１に対してＯＣＲ処理を実行する（Ｓ２０３）。具体的には、文書画像データＤ１に日本語と英語の文字が含まれる場合は、日本語に対応する部分は日本語に変換され、英語に対応する部分は英語に変換される。日本語と英語は文字形状が類似しないため、日本語が英語に変換されたり、英語が日本語に変換されたりする誤変換を防ぐことができる。また、文書画像データＤ１に日本語と韓国語の文字が含まれる場合は、日本語に対応する部分は日本語に変換され、韓国語に対応する部分は変換されない（エラーになる）か、あるいは文字形状が類似する日本語に変換される。これにより、日本語の部分は韓国語に変換されることはないため、少なくとも日本語の部分は確実に日本語に変換される。

次に、ＯＣＲ実行部２０３は、ＯＣＲ結果（第１ＯＣＲ結果；第１文書データ）と、使用した非類似言語グループの情報とを関連付けてＯＣＲ結果記憶部２０７に保存する（Ｓ２０４）。図９は、ＯＣＲ結果記憶部２０７に保存されるＯＣＲ結果の情報を示すテーブルである。ここでは、上記情報がＯＣＲ処理ＩＤ：ｔ１として保存される。

次に、ＯＣＲ実行部２０３は、ＯＣＲ実行言語グループに他の非類似言語グループがあるか否かを判定し（Ｓ２０５）、他の非類似言語グループがある場合はＳ２０２に戻り上記処理を繰り返す。

ここでは、ＯＣＲ実行部２０３は、「韓国語・英語」の非類似言語グループを取得し、「韓国語・英語」を使用して文書画像データＤ１に対して再度ＯＣＲ処理を実行する（Ｓ２０３）。具体的には、文書画像データＤ１に韓国語と英語の文字が含まれる場合は、韓国語に対応する部分は韓国語に変換され、英語に対応する部分は英語に変換される。韓国語と英語は文字形状が類似しないため、韓国語が英語に変換されたり、英語が韓国語に変換されたりする誤変換を防ぐことができる。また、文書画像データＤ１に韓国語と日本語の文字が含まれる場合は、韓国語に対応する部分は韓国語に変換され、日本語に対応する部分は変換されない（エラーになる）か、あるいは文字形状が類似する韓国語に変換される。すなわち、韓国語の部分は日本語に変換されることはないため、少なくとも韓国語の部分は確実に韓国語に変換される。

次に、ＯＣＲ実行部２０３は、ＯＣＲ結果（第２ＯＣＲ結果；第２文書データ）と、使用した非類似言語グループの情報とを関連付けてＯＣＲ結果記憶部２０７に保存する（Ｓ２０４）。ここでは、上記情報がＯＣＲ処理ＩＤ：ｔ２として保存される（図９参照）。なお、図９では、各ＯＣＲ処理ＩＤ：ｔ１、ｔ２において、同一のＪＯＢ＿ＩＤ：ＪＯＢ００１が登録されているが、これは、ＯＣＲ実行部２０３の１回の動作（上記の例では、２回のＯＣＲ処理を含む）を示している。図１０には、ＯＣＲ実行動作とＯＣＲ結果との関係を模式的に示している。また、ＪＯＢ＿ＩＤは、文書画像データにも対応している。また、上記の例では、非類似言語グループが２つ登録されているため、１回のＯＣＲ実行に対してＯＣＲ処理が２回（ＩＤ：ｔ１、ｔ２）行われているが、非類似言語グループが３つ登録されている場合は、１回のＯＣＲ実行に対してＯＣＲ処理が３回行われることになる。

以上のようにして、ＯＣＲ実行部２０３はＯＣＲ処理を実行する。すなわち、ＯＣＲ実行部２０３は、例えば文書に日本語と韓国語が混在する場合、初めに、文書画像データ全体に対して日本語及び英語でＯＣＲ処理を実行し、続いて、同じ文書画像データ全体に対して韓国語及び英語でＯＣＲ処理を実行する。１回目のＯＣＲ処理の結果では、日本語の部分が確実に日本語に変換されている。また、２回目のＯＣＲ処理の結果では、韓国語の部分が確実に韓国語に変換されている。文書中に日本語及び韓国語に類似した文字があったとしても、少なくとも本来の言語によりＯＣＲ処理した結果の方には、正確な変換文字が反映されることになる。このため、文書中の文字のうち、正確に文字変換されず、何れのＯＣＲ結果にも含まれなくなるような文字が生じることはない。換言すると、文書中の全ての文字を正確に文字変換することができる。よって、複数言語が含まれる文書に対する文字認識の精度を高めることができる。

［検索サーバの構成］
検索サーバ３００は、ＯＣＲサーバ２００において生成されたＯＣＲ結果に対して、ユーザにより入力された検索条件に基づいて文字列検索を実行する。図２には、検索サーバ３００のハードウェア構成を示している。検索サーバ３００は、ＣＰＵ３１、メモリ３２、記憶部３３、及び通信部３４を含むコンピュータで構成されている。これらのハードウェア要素はバスにより相互にデータの授受が可能に接続されている。通信部３４は、通信ネットワークを介して、ＯＣＲサーバ２００及びユーザ端末５００とデータ通信を行う。ＣＰＵ３１は、検索サーバ３００の各部を制御したり、各種の情報処理を実行したりする。メモリ３２は、各種のプログラムやデータを保持する。メモリ３２には、ＣＰＵ３１の作業領域も確保される。記憶部３３は、各種のデータを記憶する。記憶部３３は、検索サーバ３００の外部に設けられていてもよい。

図１１は、検索サーバ３００の機能的なブロック図である。図１１に示すように、検索サーバ３００は、機能的には、ＯＣＲ結果受信部３０１、ＯＣＲ情報管理部３０２、検索指示受信部３０３、検索言語判定部３０４、検索処理部３０５、及び、検索結果送信部３０６を含む。これらの要素はメモリ３２（図２参照）に格納されたプログラムをＣＰＵ３１が実行することにより実現される。このプログラムはＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭ、メモリカードなどのコンピュータが読み取り可能な情報記憶媒体から検索サーバ３００にインストールされてもよいし、インターネット等の通信ネットワークを介してダウンロードされてもよい。検索サーバ３００の記憶部３３は、ＯＣＲ結果保管部３０７、ＯＣＲ情報記憶部３０８、及び文字情報記憶部３０９が含まれる。

ＯＣＲ結果受信部３０１は、ＯＣＲサーバ２００からＯＣＲ結果を受信する。ＯＣＲ結果受信部３０１は、受信したＯＣＲ結果をＯＣＲ結果保管部３０７に保管する。ＯＣＲ結果保管部３０７は、検索処理の実行前のＯＣＲ結果を一時的に保管する。ＯＣＲ結果保管部３０７は、例えばキューで構成され、キューイングの処理を行う。ここでは例えば、ＩＤ：ｔ１〜ｔ４のＯＣＲ結果（図９参照）を受信する。

ＯＣＲ情報管理部３０２は、ＯＣＲ結果受信部３０１が受信したＯＣＲ結果をＯＣＲ情報記憶部３０８に保存する。ＯＣＲ情報記憶部３０８に保存される情報は、ＯＣＲ結果記憶部２０７（図９参照）に保存されるＯＣＲ結果の情報と同一である。

以下では、検索サーバ３００の検索処理及び検索処理を実行する要素について、図１２の動作フローを参照しつつ説明する。図１２は、検索サーバ３００の動作フロー図である。

検索指示受信部３０３は、ユーザ端末５００から検索指示を受信する（Ｓ３０１）。例えばユーザはユーザ端末５００において、所望の検索条件（検索キーワード）を入力する。検索キーワードが入力されると、検索キーワードを含む検索指示が、ユーザ端末５００から検索サーバ３００に送信される。

検索言語判定部３０４は、受信した上記検索指示に含まれる情報（検索キーワード）に基づいて、検索対象の言語を判定する（Ｓ３０２）。具体的には、検索言語判定部３０４は、検索キーワードの文字の文字コードを取得し、文字コード対応テーブルを参照して、取得した文字コードに対応する言語を判定する。文字コード対応テーブルは、文字情報記憶部３０９に予め登録されている。図１３は、文字コード対応テーブルの一例を示す図である。例えば、検索キーワードの開始文字の文字コードが「３０４０」で、終了文字コードが「３０９Ｆ」で、文字種別が「ひらがな」の場合、検索言語判定部３０４は、当該検索キーワードを、「日本語」と判定する。

検索処理部３０５（検索実行手段）は、ＯＣＲ情報記憶部３０８に保存された全てのＯＣＲ結果（図９参照）から、検索言語判定部３０４により判定された言語に対応するＯＣＲ結果を１つ取得し（Ｓ３０３）、取得したＯＣＲ結果に対して、文字列検索を実行する（Ｓ３０４）。例えば、ＩＤ：ｔ１〜ｔ４の４つのＯＣＲ結果が保存されているとすると、このうち、ＯＣＲ実行言語グループ（非類似言語グループ）に「日本語」を含むＩＤ：ｔ１のＯＣＲ結果を取得し、文字列検索を実行する。上記判定された言語に該当するＯＣＲ結果が他にある場合（Ｓ３０５でＹＥＳ）、Ｓ３０３に戻り上記処理が繰り返される。ここでは、ＯＣＲ実行言語グループに「日本語」を含むＩＤ：ｔ３のＯＣＲ結果を取得し、文字列検索を実行する。

検索結果送信部３０６は、検索結果を、検索指示を送信したユーザ端末５００に送信する（Ｓ３０６）。検索結果は、検索キーワードを含む文書画像データであってもよいし、検索キーワードを含む文字変換後のテキストデータであってもよい。また、文書画像データやテキストデータにおいて、検索キーワードに該当する部分の表示形態を変更してもよい。例えば、該当部分を、反転表示、カラー表示、太字表示、枠付き表示などの表示形態に変更してもよい。

以上のようにして、検索サーバ３００は検索処理を実行する。上記構成によれば、文字認識精度が高いＯＣＲ処理による結果に対して、検索条件に応じた言語の検索を行うため、検索精度を向上させることができる。

［変形例］
本実施形態は上記構成に限定されない。例えば情報処理システム１０は、ＯＣＲ結果として、文字列検索可能な文書ファイル（例えば、サーチャブルＰＤＦ）を生成する機能と、生成した上記文書ファイルをユーザ端末５００にダウンロードさせる機能とを含んでもよい。この機能を実現するために情報処理システム１０は、ＯＣＲ実行言語グループごとに上記文書ファイルを生成する手段と、ＯＣＲ対象文書に、生成した上記文書ファイルとＯＣＲ実行言語グループとを関連付けて管理する手段と、検索結果の文書表示時に、検索条件としてのキーワードを含む言語情報を一時的に保持する手段と、検索結果の表示後に上記文書ファイルのダウンロードが指示された場合に、上記保持手段で保持されている言語情報に関連付けられている文書ファイルをダウンロードさせる手段とを含んでいればよい。これにより、ユーザが所望する適切な文字列検索可能文書をユーザの負担無くダウンロードさせることができる。

以上の説明では、互いに異なる複数の「言語」を例に挙げたが、本実施形態に係る情報処理装置は、「言語」に限定されない。本実施形態に係る情報処理装置は、例えば、読み取り対象の文書中に、「ひらがな」と「カタカナ」が含まれる場合や、「ひらがな」と「漢字」が含まれる場合や、「ひらがな」と「アラビア数字」が含まれる場合等、互いに文字の種類（文字セット）が異なる場合でも適用可能である。文字セットには、例えば、言語の他、ひらがな、カタカナ、漢字、アラビア数字等の文字の種類が含まれる。また、同じ文字の種類又は同じ言語のうち文字の字体が異なるもの同士を、別々の文字セットとしてもよい。ＯＣＲ実行部２０３は、例えば、「ひらがな」（第１の文字セット）と「カタカナ」（第２の文字セット）を含む文書において、ひらがなの部分はひらがな（ＯＣＲ実行言語）によりＯＣＲ処理を行い、カタカナの部分はカタカナ（ＯＣＲ実行言語）によりＯＣＲ処理を行う。これにより、ひらがなの部分は確実にひらがらに変換され、カタカナの部分は確実にカタカナに変換される。

このように、本実施形態に係る情報処理装置１０は、互いに異なる複数の文字セットを含む文書を画像として読み取った文書画像データを取得するデータ受信部２０１と、複数の文字セットごとに、該文字セットにより上記文書画像データの全体を文字認識し文書データに変換して、１つの上記文書画像データに対して上記文字セットの数に応じた数の上記文書データを生成するＯＣＲ実行部２０３と、ＯＣＲ実行部２０３により生成された少なくとも１つの上記文書データにおいて、検索条件として入力された入力文字の検索を実行する検索処理部３０５と、を含む構成である。

１０情報処理システム、１００情報処理装置、２００ＯＣＲサーバ、３００検索サーバ、４００複合機、５００ユーザ端末、２１，３１ＣＰＵ、２２，３２メモリ、２３，３３記憶部、２４，３４通信部、２０１データ受信部、２０２ＯＣＲ実行言語決定部、２０３ＯＣＲ実行部、２０４ＯＣＲ結果送信部、２０５データ保管部、２０６言語情報記憶部、２０７ＯＣＲ結果記憶部、３０１ＯＣＲ結果受信部、３０２ＯＣＲ情報管理部、３０３検索指示受信部、３０４検索言語判定部、３０５検索処理部、３０６検索結果送信部、３０７ＯＣＲ結果保管部、３０８ＯＣＲ情報記憶部、３０９文字情報記憶部３０９。

Claims

互いに異なる複数の文字セットを含む文書を画像として読み取った文書画像データを取得するデータ取得手段と、
前記複数の文字セットごとに、該文字セットにより前記文書画像データの全体を文字認識し文書データに変換して、１つの前記文書画像データに対して前記文字セットの数に応じた数の前記文書データを生成する文書データ生成手段と、
前記文書データ生成手段により生成された少なくとも１つの前記文書データにおいて、検索条件として入力された入力文字の検索を実行する検索実行手段と、
を含むことを特徴とする情報処理装置。
前記文書に、互いに異なる第１の文字セット及び第２の文字セットが含まれる場合、
前記文書データ生成手段は、前記第１の文字セットに基づいて前記文書画像データの全体を文字認識し文書データに変換して第１の文書データを生成するとともに、前記第２の文字セットに基づいて前記文書画像データの全体を文字認識し文書データに変換して第２の文書データを生成する、
ことを特徴とする請求項１に記載の情報処理装置。
前記文書に、互いに異なる第１の文字セット及び第２の文字セットが含まれる場合、
前記文書データ生成手段は、互いに文字形状が非類似の前記第１の文字セット及び第３の文字セットに基づいて、前記文書画像データの全体を文字認識し文書データに変換して第１の文書データを生成するとともに、互いに文字形状が非類似の前記第２の文字セット及び第４の文字セットに基づいて、前記文書画像データの全体を文字認識し文書データに変換して第２の文書データを生成する、
ことを特徴とする請求項１に記載の情報処理装置。
前記文書データ生成手段により生成された複数の前記文書画像データに対応する複数の前記文書データを記憶する記憶手段から、検索条件として入力された入力文字の文字セットに対応する前記文書データを取得する文書データ取得手段をさらに含み、
検索条件として入力された入力文字の文字セットが第５の文字セットであった場合、
前記文書データ取得手段は、前記記憶手段から、前記第５の文字セットを含む少なくとも１つの前記文書データを取得し、
前記検索実行手段は、前記取得された前記文書データごとに、前記入力文字の検索を実行する、
ことを特徴とする請求項１に記載の情報処理装置。
前記互いに異なる複数の文字セットは、互いに異なる複数の言語である、
ことを特徴とする請求項１に記載の情報処理装置。
文字変換装置と検索装置とを含む情報処理システムであって、
前記文字変換装置は、
互いに異なる複数の文字セットを含む文書を画像として読み取った文書画像データを取得するデータ取得手段と、
前記複数の文字セットごとに、該文字セットにより前記文書画像データの全体を文字認識し文書データに変換して、１つの前記文書画像データに対して前記文字セットの数に応じた数の前記文書データを生成する文書データ生成手段と、
前記文書データを前記検索装置に送信する送信手段と、を含み、
前記検索装置は、
前記文書データを前記文字変換装置から受信する受信手段と、
前記文書データ生成手段により生成された少なくとも１つの前記文書データにおいて、検索条件として入力された入力文字の検索を実行する検索実行手段と、
前記検索実行手段による検索結果を、前記検索条件を入力したユーザのユーザ端末に送信する送信手段と、
を含むことを特徴とする情報処理システム。
互いに異なる複数の文字セットを含む文書を画像として読み取った文書画像データを取得するデータ取得手段、
前記複数の文字セットごとに、該文字セットにより前記文書画像データの全体を文字認識し文書データに変換して、１つの前記文書画像データに対して前記文字セットの数に応じた数の前記文書データを生成する文書データ生成手段、及び、
前記文書データ生成手段により生成された少なくとも１つの前記文書データにおいて、検索条件として入力された入力文字の検索を実行する検索実行手段、
としてコンピュータを機能させるためのプログラム。