JP2016066157A - 情報処理装置、情報処理システム及びプログラム - Google Patents

情報処理装置、情報処理システム及びプログラム Download PDF

Info

Publication number
JP2016066157A
JP2016066157A JP2014193541A JP2014193541A JP2016066157A JP 2016066157 A JP2016066157 A JP 2016066157A JP 2014193541 A JP2014193541 A JP 2014193541A JP 2014193541 A JP2014193541 A JP 2014193541A JP 2016066157 A JP2016066157 A JP 2016066157A
Authority
JP
Japan
Prior art keywords
document
character
data
search
ocr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014193541A
Other languages
English (en)
Other versions
JP6484974B2 (ja
Inventor
祐 大竹
Hiroshi Otake
祐 大竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2014193541A priority Critical patent/JP6484974B2/ja
Publication of JP2016066157A publication Critical patent/JP2016066157A/ja
Application granted granted Critical
Publication of JP6484974B2 publication Critical patent/JP6484974B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】複数言語が含まれる文書に対する文字認識の精度を高め、文字認識結果に対する検索精度を向上させることができる情報処理装置を提供する。【解決手段】情報処理装置100は、互いに異なる複数の言語を含む文書を画像として読み取った文書画像データを取得するデータ受信部201と、前記複数の言語ごとに、前記文書画像データの全体をOCR処理するOCR実行部203と、検索条件として入力された入力文字の言語に対応する複数のOCR結果において、前記入力文字の検索を実行する検索処理部と、を含む。【選択図】図3

Description

本発明は、情報処理装置、情報処理システム及びプログラムに関する。
従来、スキャナ等で読み込んだ文書画像から文字を認識して文書データに変換するOCR(Optical Character Recognition)技術が知られている。また、複数の言語を含む文書に対してOCR処理を行う技術も提案されている。例えば、特許文献1には、複数の言語を含む文書に対して、文書の領域ごとに異なる言語でOCR処理を行う技術が記載されている。
また、複数のOCR結果から、ユーザが入力した検索条件に合致するOCR結果を検索する技術も知られている(例えば特許文献2)。
特開2006−260115号公報 特開2004−213091号公報
ここで複数言語が含まれる文書には、例えば、文書の一部分が日本語で記載され、他の部分が韓国語で記載され、更に他の部分が英語で記載されている文書や、文書全体で日本語と韓国語と英語が混在して記載されている文書がある。日本語と韓国語は文字形状が類似しているため、特に後者の文書ではOCR処理において文字認識の精度が低下する。そして文字認識の精度が低下すると、OCR結果に対する検索精度も低下してしまう。
本発明は、複数言語が含まれる文書に対する文字認識の精度を高め、文字認識結果に対する検索精度を向上させることができる情報処理装置、情報処理システム及びプログラムを提供することを目的とする。
本発明の請求項1に係る情報処理装置は、互いに異なる複数の文字セットを含む文書を画像として読み取った文書画像データを取得するデータ取得手段と、前記複数の文字セットごとに、該文字セットにより前記文書画像データの全体を文字認識し文書データに変換して、1つの前記文書画像データに対して前記文字セットの数に応じた数の前記文書データを生成する文書データ生成手段と、前記文書データ生成手段により生成された少なくとも1つの前記文書データにおいて、検索条件として入力された入力文字の検索を実行する検索実行手段と、を含むことを特徴とする。
本発明の請求項2に係る情報処理装置は、請求項1に記載の構成において、前記文書に、互いに異なる第1の文字セット及び第2の文字セットが含まれる場合、前記文書データ生成手段は、前記第1の文字セットに基づいて前記文書画像データの全体を文字認識し文書データに変換して第1の文書データを生成するとともに、前記第2の文字セットに基づいて前記文書画像データの全体を文字認識し文書データに変換して第2の文書データを生成する。
本発明の請求項3に係る情報処理装置は、請求項1に記載の構成において、前記文書に、互いに異なる第1の文字セット及び第2の文字セットが含まれる場合、前記文書データ生成手段は、互いに文字形状が非類似の前記第1の文字セット及び第3の文字セットに基づいて、前記文書画像データの全体を文字認識し文書データに変換して第1の文書データを生成するとともに、互いに文字形状が非類似の前記第2の文字セット及び第4の文字セットに基づいて、前記文書画像データの全体を文字認識し文書データに変換して第2の文書データを生成する。
本発明の請求項4に係る情報処理装置は、請求項1に記載の構成において、前記文書データ生成手段により生成された複数の前記文書画像データに対応する複数の前記文書データを記憶する記憶手段から、検索条件として入力された入力文字の文字セットに対応する前記文書データを取得する文書データ取得手段をさらに含み、検索条件として入力された入力文字の文字セットが第5の文字セットであった場合、前記文書データ取得手段は、前記記憶手段から、前記第5の文字セットを含む少なくとも1つの前記文書データを取得し、前記検索実行手段は、前記取得された前記文書データごとに、前記入力文字の検索を実行する。
本発明の請求項5に係る情報処理装置は、請求項1に記載の構成において、前記互いに異なる複数の文字セットは、互いに異なる複数の言語である。
本発明の請求項6に係る情報処理システムは、文字変換装置と検索装置とを含む情報処理システムであって、前記文字変換装置は、互いに異なる複数の文字セットを含む文書を画像として読み取った文書画像データを取得するデータ取得手段と、前記複数の文字セットごとに、該文字セットにより前記文書画像データの全体を文字認識し文書データに変換して、1つの前記文書画像データに対して前記文字セットの数に応じた数の前記文書データを生成する文書データ生成手段と、前記文書データを前記検索装置に送信する送信手段と、を含み、前記検索装置は、前記文書データを前記文字変換装置から受信する受信手段と、前記文書データ生成手段により生成された少なくとも1つの前記文書データにおいて、検索条件として入力された入力文字の検索を実行する検索実行手段と、前記検索実行手段による検索結果を、前記検索条件を入力したユーザのユーザ端末に送信する送信手段と、を含むことを特徴とする。
本発明の請求項7に係るプログラムは、互いに異なる複数の文字セットを含む文書を画像として読み取った文書画像データを取得するデータ取得手段、前記複数の文字セットごとに、該文字セットにより前記文書画像データの全体を文字認識し文書データに変換して、1つの前記文書画像データに対して前記文字セットの数に応じた数の前記文書データを生成する文書データ生成手段、及び、前記文書データ生成手段により生成された少なくとも1つの前記文書データにおいて、検索条件として入力された入力文字の検索を実行する検索実行手段、としてコンピュータを機能させるためのプログラムである。このプログラムは、CD−ROMやDVD−ROMなどの、コンピュータが読み取り可能な情報記憶媒体に格納されてもよい。
本発明の請求項1、5、6、7の構成によれば、複数言語が含まれる文書に対する文字認識の精度が高まり、文字認識結果に対する検索精度が向上する。
本発明の請求項2の構成によれば、文書画像データは、文書に含まれる言語に応じたそれぞれの文書データに変換される。
本発明の請求項3の構成によれば、文書画像データは、文書に含まれる言語ごとに、互いに文字形状が非類似の2つの言語に基づいて、1つの文書データに変換される。
本発明の請求項4の構成によれば、複数の文書データが取得された場合、文書データごとに入力文字の検索が実行される。
本実施形態に係る情報処理システムの全体構成図である。 OCRサーバ及び検索サーバのハードウェア構成を示すブロック図である。 OCRサーバの機能的なブロック図である。 非類似言語グループのテーブルの一例を示す図である。 ユーザが言語を選択する選択画面の一例である。 OCR実行言語決定部の動作フロー図である。 登録された非類似言語グループの情報を示すテーブルである。 OCR実行部の動作フロー図である。 OCR結果の情報を示すテーブルである。 OCR実行動作とOCR結果との関係を模式的に示す図である。 検索サーバの機能的なブロック図である。 検索サーバの動作フロー図である。 文字コード対応テーブルの一例を示す図である。
本発明の一実施形態について、図面を用いて以下に説明する。図1は、本実施形態に係る情報処理システムの全体構成図である。同図に示すように、情報処理システム10は、情報処理装置100、複合機400、及び、ユーザ端末500を含んでいる。情報処理装置100は、OCRサーバ200(文字変換装置)及び検索サーバ300(検索装置)を含んでいる。OCRサーバ200及び検索サーバ300は、別個の装置として設けられてもよいし、これらの機能が1つの装置に含まれてもよい。
情報処理装置100、複合機400、及びユーザ端末500は、LAN(Local Area Network)やインターネット等の通信ネットワークを介して相互に接続されている。
複合機400は、コピー機能、FAX機能、及びスキャナ機能等を含んでいる。本実施形態では、ユーザの操作に基づき文書を画像として読み取るスキャナ機能に着目して説明する。複合機400は、用紙等の対象物(文書)を光学的に走査することにより文書を画像として読み取り、読み取った文書画像データを、内部の記憶部に保存するとともに、OCRサーバ200に送信する。なお、複合機400は、OCRサーバ200からの指示に基づいて、記憶部に保存されている文書画像データをOCRサーバ200に送信してもよい。複合機400は、周知の構成を適用することができる。
ユーザ端末500は、通信ネットワークに接続された、ユーザが利用する端末装置である。ユーザ端末500は、ユーザの操作に基づいて、通信ネットワークを介してOCRサーバ200、検索サーバ300、及び複合機400とデータ通信を行う。これにより、例えば、ユーザは、ユーザ端末500を操作して、OCRサーバ200にOCR処理の実行を指示したり、検索サーバ300にOCR結果に対する検索処理の実行を指示したり、検索サーバ300から検索結果を取得したりする。また、ユーザは、ユーザ端末500を操作して、OCR処理に関する各種設定を行ったり、各種設定を変更したりする。ユーザ端末500には、ブラウザや電子メールクライアント等のソフトウェアが組み込まれていてもよい。ユーザ端末500は、例えば、パーソナルコンピュータ、PDA(Personal Digital Assistant)、スマートフォン等の携帯情報端末等である。情報処理システム10に含まれるユーザ端末500の数は限定されない。
[OCRサーバの構成]
OCRサーバ200は、複合機400から文書画像データを受信するとOCR処理を実行する。図2は、OCRサーバ200のハードウェア構成を示すブロック図である。OCRサーバ200は、CPU21、メモリ22、記憶部23、及び通信部24を含むコンピュータで構成されている。これらのハードウェア要素はバスにより相互にデータの授受が可能に接続されている。通信部24は、通信ネットワークを介して、検索サーバ300、複合機400及びユーザ端末500とデータ通信を行う。CPU21は、OCRサーバ200の各部を制御したり、各種の情報処理を実行したりする。メモリ22は、各種のプログラムやデータを保持する。メモリ22には、CPU21の作業領域も確保される。記憶部23は、各種のデータを記憶する。記憶部23は、OCRサーバ200の外部に設けられてもよい。
図3は、OCRサーバ200の機能的なブロック図である。図3に示すように、OCRサーバ200は、機能的には、データ受信部201、OCR実行言語決定部202、OCR実行部203、及び、OCR結果送信部204を含む。これらの要素はメモリ22(図2参照)に格納されたプログラムをCPU21が実行することにより実現される。このプログラムはCD−ROM、DVD−ROM、メモリカードなどのコンピュータが読み取り可能な情報記憶媒体からOCRサーバ200にインストールされてもよいし、インターネット等の通信ネットワークを介してダウンロードされてもよい。OCRサーバ200の記憶部23には、データ保管部205、言語情報記憶部206、及びOCR結果記憶部207が含まれる。
データ受信部201(データ取得手段)は、複合機400から送信される文書画像データを受信する。データ受信部201は、受信した文書画像データをデータ保管部205に保管する。データ保管部205は、OCR処理の実行前の文書画像データを一時的に保管する。データ保管部205は、例えばキューで構成され、キューイングの処理を行う。
OCR実行言語決定部202は、OCR処理を実行するための言語(以下、OCR実行言語という。)を決定する。例えば、日本語の文書画像データに対して日本語でOCR処理を実行する場合は、OCR実行言語は日本語となる。
ここで、文書に複数の言語(文字セット)が混在する場合、OCR処理の文字認識の精度が低下することが知られている。文字形状が類似していない言語が混在している場合は、それぞれの言語の文字形状をそれぞれの言語として認識するため、認識する確率は高い。しかし、特に、複数の言語の文字形状が類似する場合には、誤認識する確率が高くなり、文字認識精度がさらに低下するおそれがある。なお、文字には、記号や数字が含まれてもよい。そこで、本実施形態に係るOCRサーバ200は、文字形状が互いに類似しない複数の言語を組み合わせた言語グループ(以下、非類似言語グループという。)に基づいて、OCR処理を実行する。例えば、日本語と韓国語と中国語とは文字形状が相互に類似するが、これらと英語とは相互に類似しない。このため、「日本語・英語」、「韓国語・英語」、「中国語・英語」のそれぞれを非類似言語グループに設定する。非類似言語グループは、OCRサーバ200の管理者やユーザ端末500のユーザ等により予め設定される。設定された非類似言語グループの情報は、言語情報記憶部206に保存される。図4は、非類似言語グループのテーブルの一例を示す図である。テーブルには、各非類似言語グループの識別情報(ID)が付される。上記した言語以外では、例えばタイ語は、英語、日本語、韓国語、及び中国語のいずれとも文字形状が類似していない非類似言語グループとして設定できる。他には、ヒンズー語とビルマ語は文字形状が類似している言語として設定してもよい。
OCR実行言語決定部202は、言語情報記憶部206に保存される非類似言語グループから、ユーザにより選択された言語に対応する非類似言語グループを抽出して、OCR実行言語グループに決定する。図5は、ユーザが言語を選択する選択画面の一例である。選択画面は、OCRサーバ200に接続されたユーザ端末500の表示部に表示されてもよいし、OCRサーバ200上の操作画面に表示されてもよい。ユーザは、選択画面において、所望の言語を選択(チェック)する。以下、OCR実行言語決定部202の動作フローについて、具体例を挙げて説明する。
図6は、OCR実行言語決定部202の動作フロー図である。ここでは、図5の選択画面において、ユーザが「日本語」と「韓国語」と「英語」を選択した場合を例に挙げる。
初めに、OCR実行言語決定部202は、ユーザ端末500からOCR実行言語の設定指示を受信する(S101)。例えば、ユーザがユーザ端末500の表示画面(図5参照)において、「日本語」と「韓国語」と「英語」を選択すると、選択内容を表すデータ(設定指示)がOCRサーバ200に送信され、OCR実行言語決定部202が受信する。次に、OCR実行言語決定部202は、選択された言語の中から1つの言語を取得する(S102)。ここでは例えば、「日本語」を取得する。
次に、OCR実行言語決定部202は、言語情報記憶部206に保存された非類似言語グループ(図4参照)から、取得した言語を含む非類似言語グループを取得する(S103)。ここでは、「日本語」を含む非類似言語グループの「日本語・英語」(ID:JE)を取得する。次に、OCR実行言語決定部202は、取得した非類似言語グループをOCR実行言語グループに登録する(S104)。
次に、OCR実行言語決定部202は、ユーザにより選択された言語が他にあるか否かを判定し(S105)、他にある場合はS102に戻り上記処理を繰り返す。ここでは、上記各処理により、OCR実行言語決定部202は、「韓国語」を取得し、「韓国語」を含む非類似言語グループの「韓国語・英語」(ID:KE)を取得する。なお、ユーザにより選択された言語には「英語」が含まれるが(図5参照)、「英語」は上記非類似言語グループ(ID:JE、KE)に既に含まれるため、新たな非類似言語グループは取得されない。登録された非類似言語グループの情報は、言語情報記憶部206に保存される。図7は、登録された非類似言語グループの情報を示すテーブルである。
ユーザにより選択された言語が他にない場合(S105でNO)、OCR実行言語決定部202は、登録された上記非類似言語グループ(ID:JE、KE)をOCR実行言語グループに決定する(S106)。
以上のようにして、OCR実行言語決定部202は、OCR実行言語(OCR実行言語グループ)を決定する。
図3に戻り、OCR実行部203(文書データ生成手段)は、OCR実行言語決定部202により決定されたOCR実行言語グループによりOCR処理を実行して、OCR結果(文書データ)を生成する。OCR結果送信部204は、OCR結果を検索サーバ300に送信する。以下、OCR実行部203の動作フローについて、具体例を挙げて説明する。
図8は、OCR実行部203の動作フロー図である。ここでは、OCR実行言語グループとして、図7に示す「日本語・英語」と「韓国語・英語」が決定された場合を例に挙げる。
初めに、データ受信部201が複合機400から文書画像データを受信する(S201)。受信した文書画像データを「D1」と称す。次に、OCR実行部203は、OCR実行言語グループから非類似言語グループを1つ取得する(S202)。ここでは例えば、「日本語・英語」の非類似言語グループを取得する。
次に、OCR実行部203は、取得した非類似言語グループを使用して、文書画像データD1に対してOCR処理を実行する(S203)。具体的には、文書画像データD1に日本語と英語の文字が含まれる場合は、日本語に対応する部分は日本語に変換され、英語に対応する部分は英語に変換される。日本語と英語は文字形状が類似しないため、日本語が英語に変換されたり、英語が日本語に変換されたりする誤変換を防ぐことができる。また、文書画像データD1に日本語と韓国語の文字が含まれる場合は、日本語に対応する部分は日本語に変換され、韓国語に対応する部分は変換されない(エラーになる)か、あるいは文字形状が類似する日本語に変換される。これにより、日本語の部分は韓国語に変換されることはないため、少なくとも日本語の部分は確実に日本語に変換される。
次に、OCR実行部203は、OCR結果(第1OCR結果;第1文書データ)と、使用した非類似言語グループの情報とを関連付けてOCR結果記憶部207に保存する(S204)。図9は、OCR結果記憶部207に保存されるOCR結果の情報を示すテーブルである。ここでは、上記情報がOCR処理ID:t1として保存される。
次に、OCR実行部203は、OCR実行言語グループに他の非類似言語グループがあるか否かを判定し(S205)、他の非類似言語グループがある場合はS202に戻り上記処理を繰り返す。
ここでは、OCR実行部203は、「韓国語・英語」の非類似言語グループを取得し、「韓国語・英語」を使用して文書画像データD1に対して再度OCR処理を実行する(S203)。具体的には、文書画像データD1に韓国語と英語の文字が含まれる場合は、韓国語に対応する部分は韓国語に変換され、英語に対応する部分は英語に変換される。韓国語と英語は文字形状が類似しないため、韓国語が英語に変換されたり、英語が韓国語に変換されたりする誤変換を防ぐことができる。また、文書画像データD1に韓国語と日本語の文字が含まれる場合は、韓国語に対応する部分は韓国語に変換され、日本語に対応する部分は変換されない(エラーになる)か、あるいは文字形状が類似する韓国語に変換される。すなわち、韓国語の部分は日本語に変換されることはないため、少なくとも韓国語の部分は確実に韓国語に変換される。
次に、OCR実行部203は、OCR結果(第2OCR結果;第2文書データ)と、使用した非類似言語グループの情報とを関連付けてOCR結果記憶部207に保存する(S204)。ここでは、上記情報がOCR処理ID:t2として保存される(図9参照)。なお、図9では、各OCR処理ID:t1、t2において、同一のJOB_ID:JOB001が登録されているが、これは、OCR実行部203の1回の動作(上記の例では、2回のOCR処理を含む)を示している。図10には、OCR実行動作とOCR結果との関係を模式的に示している。また、JOB_IDは、文書画像データにも対応している。また、上記の例では、非類似言語グループが2つ登録されているため、1回のOCR実行に対してOCR処理が2回(ID:t1、t2)行われているが、非類似言語グループが3つ登録されている場合は、1回のOCR実行に対してOCR処理が3回行われることになる。
以上のようにして、OCR実行部203はOCR処理を実行する。すなわち、OCR実行部203は、例えば文書に日本語と韓国語が混在する場合、初めに、文書画像データ全体に対して日本語及び英語でOCR処理を実行し、続いて、同じ文書画像データ全体に対して韓国語及び英語でOCR処理を実行する。1回目のOCR処理の結果では、日本語の部分が確実に日本語に変換されている。また、2回目のOCR処理の結果では、韓国語の部分が確実に韓国語に変換されている。文書中に日本語及び韓国語に類似した文字があったとしても、少なくとも本来の言語によりOCR処理した結果の方には、正確な変換文字が反映されることになる。このため、文書中の文字のうち、正確に文字変換されず、何れのOCR結果にも含まれなくなるような文字が生じることはない。換言すると、文書中の全ての文字を正確に文字変換することができる。よって、複数言語が含まれる文書に対する文字認識の精度を高めることができる。
[検索サーバの構成]
検索サーバ300は、OCRサーバ200において生成されたOCR結果に対して、ユーザにより入力された検索条件に基づいて文字列検索を実行する。図2には、検索サーバ300のハードウェア構成を示している。検索サーバ300は、CPU31、メモリ32、記憶部33、及び通信部34を含むコンピュータで構成されている。これらのハードウェア要素はバスにより相互にデータの授受が可能に接続されている。通信部34は、通信ネットワークを介して、OCRサーバ200及びユーザ端末500とデータ通信を行う。CPU31は、検索サーバ300の各部を制御したり、各種の情報処理を実行したりする。メモリ32は、各種のプログラムやデータを保持する。メモリ32には、CPU31の作業領域も確保される。記憶部33は、各種のデータを記憶する。記憶部33は、検索サーバ300の外部に設けられていてもよい。
図11は、検索サーバ300の機能的なブロック図である。図11に示すように、検索サーバ300は、機能的には、OCR結果受信部301、OCR情報管理部302、検索指示受信部303、検索言語判定部304、検索処理部305、及び、検索結果送信部306を含む。これらの要素はメモリ32(図2参照)に格納されたプログラムをCPU31が実行することにより実現される。このプログラムはCD−ROM、DVD−ROM、メモリカードなどのコンピュータが読み取り可能な情報記憶媒体から検索サーバ300にインストールされてもよいし、インターネット等の通信ネットワークを介してダウンロードされてもよい。検索サーバ300の記憶部33は、OCR結果保管部307、OCR情報記憶部308、及び文字情報記憶部309が含まれる。
OCR結果受信部301は、OCRサーバ200からOCR結果を受信する。OCR結果受信部301は、受信したOCR結果をOCR結果保管部307に保管する。OCR結果保管部307は、検索処理の実行前のOCR結果を一時的に保管する。OCR結果保管部307は、例えばキューで構成され、キューイングの処理を行う。ここでは例えば、ID:t1〜t4のOCR結果(図9参照)を受信する。
OCR情報管理部302は、OCR結果受信部301が受信したOCR結果をOCR情報記憶部308に保存する。OCR情報記憶部308に保存される情報は、OCR結果記憶部207(図9参照)に保存されるOCR結果の情報と同一である。
以下では、検索サーバ300の検索処理及び検索処理を実行する要素について、図12の動作フローを参照しつつ説明する。図12は、検索サーバ300の動作フロー図である。
検索指示受信部303は、ユーザ端末500から検索指示を受信する(S301)。例えばユーザはユーザ端末500において、所望の検索条件(検索キーワード)を入力する。検索キーワードが入力されると、検索キーワードを含む検索指示が、ユーザ端末500から検索サーバ300に送信される。
検索言語判定部304は、受信した上記検索指示に含まれる情報(検索キーワード)に基づいて、検索対象の言語を判定する(S302)。具体的には、検索言語判定部304は、検索キーワードの文字の文字コードを取得し、文字コード対応テーブルを参照して、取得した文字コードに対応する言語を判定する。文字コード対応テーブルは、文字情報記憶部309に予め登録されている。図13は、文字コード対応テーブルの一例を示す図である。例えば、検索キーワードの開始文字の文字コードが「3040」で、終了文字コードが「309F」で、文字種別が「ひらがな」の場合、検索言語判定部304は、当該検索キーワードを、「日本語」と判定する。
検索処理部305(検索実行手段)は、OCR情報記憶部308に保存された全てのOCR結果(図9参照)から、検索言語判定部304により判定された言語に対応するOCR結果を1つ取得し(S303)、取得したOCR結果に対して、文字列検索を実行する(S304)。例えば、ID:t1〜t4の4つのOCR結果が保存されているとすると、このうち、OCR実行言語グループ(非類似言語グループ)に「日本語」を含むID:t1のOCR結果を取得し、文字列検索を実行する。上記判定された言語に該当するOCR結果が他にある場合(S305でYES)、S303に戻り上記処理が繰り返される。ここでは、OCR実行言語グループに「日本語」を含むID:t3のOCR結果を取得し、文字列検索を実行する。
検索結果送信部306は、検索結果を、検索指示を送信したユーザ端末500に送信する(S306)。検索結果は、検索キーワードを含む文書画像データであってもよいし、検索キーワードを含む文字変換後のテキストデータであってもよい。また、文書画像データやテキストデータにおいて、検索キーワードに該当する部分の表示形態を変更してもよい。例えば、該当部分を、反転表示、カラー表示、太字表示、枠付き表示などの表示形態に変更してもよい。
以上のようにして、検索サーバ300は検索処理を実行する。上記構成によれば、文字認識精度が高いOCR処理による結果に対して、検索条件に応じた言語の検索を行うため、検索精度を向上させることができる。
[変形例]
本実施形態は上記構成に限定されない。例えば情報処理システム10は、OCR結果として、文字列検索可能な文書ファイル(例えば、サーチャブルPDF)を生成する機能と、生成した上記文書ファイルをユーザ端末500にダウンロードさせる機能とを含んでもよい。この機能を実現するために情報処理システム10は、OCR実行言語グループごとに上記文書ファイルを生成する手段と、OCR対象文書に、生成した上記文書ファイルとOCR実行言語グループとを関連付けて管理する手段と、検索結果の文書表示時に、検索条件としてのキーワードを含む言語情報を一時的に保持する手段と、検索結果の表示後に上記文書ファイルのダウンロードが指示された場合に、上記保持手段で保持されている言語情報に関連付けられている文書ファイルをダウンロードさせる手段とを含んでいればよい。これにより、ユーザが所望する適切な文字列検索可能文書をユーザの負担無くダウンロードさせることができる。
以上の説明では、互いに異なる複数の「言語」を例に挙げたが、本実施形態に係る情報処理装置は、「言語」に限定されない。本実施形態に係る情報処理装置は、例えば、読み取り対象の文書中に、「ひらがな」と「カタカナ」が含まれる場合や、「ひらがな」と「漢字」が含まれる場合や、「ひらがな」と「アラビア数字」が含まれる場合等、互いに文字の種類(文字セット)が異なる場合でも適用可能である。文字セットには、例えば、言語の他、ひらがな、カタカナ、漢字、アラビア数字等の文字の種類が含まれる。また、同じ文字の種類又は同じ言語のうち文字の字体が異なるもの同士を、別々の文字セットとしてもよい。OCR実行部203は、例えば、「ひらがな」(第1の文字セット)と「カタカナ」(第2の文字セット)を含む文書において、ひらがなの部分はひらがな(OCR実行言語)によりOCR処理を行い、カタカナの部分はカタカナ(OCR実行言語)によりOCR処理を行う。これにより、ひらがなの部分は確実にひらがらに変換され、カタカナの部分は確実にカタカナに変換される。
このように、本実施形態に係る情報処理装置10は、互いに異なる複数の文字セットを含む文書を画像として読み取った文書画像データを取得するデータ受信部201と、複数の文字セットごとに、該文字セットにより上記文書画像データの全体を文字認識し文書データに変換して、1つの上記文書画像データに対して上記文字セットの数に応じた数の上記文書データを生成するOCR実行部203と、OCR実行部203により生成された少なくとも1つの上記文書データにおいて、検索条件として入力された入力文字の検索を実行する検索処理部305と、を含む構成である。
10 情報処理システム、100 情報処理装置、200 OCRサーバ、300 検索サーバ、400 複合機、500 ユーザ端末、21,31 CPU、22,32 メモリ、23,33 記憶部、24,34 通信部、201 データ受信部、202 OCR実行言語決定部、203 OCR実行部、204 OCR結果送信部、205 データ保管部、206 言語情報記憶部、207 OCR結果記憶部、301 OCR結果受信部、302 OCR情報管理部、303 検索指示受信部、304 検索言語判定部、305 検索処理部、306 検索結果送信部、307 OCR結果保管部、308 OCR情報記憶部、309 文字情報記憶部309。

Claims (7)

  1. 互いに異なる複数の文字セットを含む文書を画像として読み取った文書画像データを取得するデータ取得手段と、
    前記複数の文字セットごとに、該文字セットにより前記文書画像データの全体を文字認識し文書データに変換して、1つの前記文書画像データに対して前記文字セットの数に応じた数の前記文書データを生成する文書データ生成手段と、
    前記文書データ生成手段により生成された少なくとも1つの前記文書データにおいて、検索条件として入力された入力文字の検索を実行する検索実行手段と、
    を含むことを特徴とする情報処理装置。
  2. 前記文書に、互いに異なる第1の文字セット及び第2の文字セットが含まれる場合、
    前記文書データ生成手段は、前記第1の文字セットに基づいて前記文書画像データの全体を文字認識し文書データに変換して第1の文書データを生成するとともに、前記第2の文字セットに基づいて前記文書画像データの全体を文字認識し文書データに変換して第2の文書データを生成する、
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記文書に、互いに異なる第1の文字セット及び第2の文字セットが含まれる場合、
    前記文書データ生成手段は、互いに文字形状が非類似の前記第1の文字セット及び第3の文字セットに基づいて、前記文書画像データの全体を文字認識し文書データに変換して第1の文書データを生成するとともに、互いに文字形状が非類似の前記第2の文字セット及び第4の文字セットに基づいて、前記文書画像データの全体を文字認識し文書データに変換して第2の文書データを生成する、
    ことを特徴とする請求項1に記載の情報処理装置。
  4. 前記文書データ生成手段により生成された複数の前記文書画像データに対応する複数の前記文書データを記憶する記憶手段から、検索条件として入力された入力文字の文字セットに対応する前記文書データを取得する文書データ取得手段をさらに含み、
    検索条件として入力された入力文字の文字セットが第5の文字セットであった場合、
    前記文書データ取得手段は、前記記憶手段から、前記第5の文字セットを含む少なくとも1つの前記文書データを取得し、
    前記検索実行手段は、前記取得された前記文書データごとに、前記入力文字の検索を実行する、
    ことを特徴とする請求項1に記載の情報処理装置。
  5. 前記互いに異なる複数の文字セットは、互いに異なる複数の言語である、
    ことを特徴とする請求項1に記載の情報処理装置。
  6. 文字変換装置と検索装置とを含む情報処理システムであって、
    前記文字変換装置は、
    互いに異なる複数の文字セットを含む文書を画像として読み取った文書画像データを取得するデータ取得手段と、
    前記複数の文字セットごとに、該文字セットにより前記文書画像データの全体を文字認識し文書データに変換して、1つの前記文書画像データに対して前記文字セットの数に応じた数の前記文書データを生成する文書データ生成手段と、
    前記文書データを前記検索装置に送信する送信手段と、を含み、
    前記検索装置は、
    前記文書データを前記文字変換装置から受信する受信手段と、
    前記文書データ生成手段により生成された少なくとも1つの前記文書データにおいて、検索条件として入力された入力文字の検索を実行する検索実行手段と、
    前記検索実行手段による検索結果を、前記検索条件を入力したユーザのユーザ端末に送信する送信手段と、
    を含むことを特徴とする情報処理システム。
  7. 互いに異なる複数の文字セットを含む文書を画像として読み取った文書画像データを取得するデータ取得手段、
    前記複数の文字セットごとに、該文字セットにより前記文書画像データの全体を文字認識し文書データに変換して、1つの前記文書画像データに対して前記文字セットの数に応じた数の前記文書データを生成する文書データ生成手段、及び、
    前記文書データ生成手段により生成された少なくとも1つの前記文書データにおいて、検索条件として入力された入力文字の検索を実行する検索実行手段、
    としてコンピュータを機能させるためのプログラム。
JP2014193541A 2014-09-24 2014-09-24 情報処理装置、情報処理システム及びプログラム Active JP6484974B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014193541A JP6484974B2 (ja) 2014-09-24 2014-09-24 情報処理装置、情報処理システム及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014193541A JP6484974B2 (ja) 2014-09-24 2014-09-24 情報処理装置、情報処理システム及びプログラム

Publications (2)

Publication Number Publication Date
JP2016066157A true JP2016066157A (ja) 2016-04-28
JP6484974B2 JP6484974B2 (ja) 2019-03-20

Family

ID=55805619

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014193541A Active JP6484974B2 (ja) 2014-09-24 2014-09-24 情報処理装置、情報処理システム及びプログラム

Country Status (1)

Country Link
JP (1) JP6484974B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10177623A (ja) * 1996-12-16 1998-06-30 Ricoh Co Ltd 文書認識装置および言語処理装置
JPH11338977A (ja) * 1998-05-28 1999-12-10 Canon Inc 文字処理方法及び装置、記憶媒体
JP2007025939A (ja) * 2005-07-14 2007-02-01 Nec Corp 多言語文書検索装置および多言語文書検索方法、並びに、多言語文書を検索するプログラム
JP2011232991A (ja) * 2010-04-28 2011-11-17 Murata Mach Ltd 検索装置及び画像処理装置
JP2012093895A (ja) * 2010-10-26 2012-05-17 Ricoh Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
JP2013164728A (ja) * 2012-02-10 2013-08-22 Canon Inc 画像内の文字に係る言語を判定する情報処理装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10177623A (ja) * 1996-12-16 1998-06-30 Ricoh Co Ltd 文書認識装置および言語処理装置
JPH11338977A (ja) * 1998-05-28 1999-12-10 Canon Inc 文字処理方法及び装置、記憶媒体
JP2007025939A (ja) * 2005-07-14 2007-02-01 Nec Corp 多言語文書検索装置および多言語文書検索方法、並びに、多言語文書を検索するプログラム
JP2011232991A (ja) * 2010-04-28 2011-11-17 Murata Mach Ltd 検索装置及び画像処理装置
JP2012093895A (ja) * 2010-10-26 2012-05-17 Ricoh Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
JP2013164728A (ja) * 2012-02-10 2013-08-22 Canon Inc 画像内の文字に係る言語を判定する情報処理装置

Also Published As

Publication number Publication date
JP6484974B2 (ja) 2019-03-20

Similar Documents

Publication Publication Date Title
US10789045B2 (en) Non-transitory computer-readable recording medium storing computer-readable instructions for causing information processing device to execute communication processing with image processing program and voice-recognition program, information processing device, and method of controlling information processing device
US20080050019A1 (en) Image processing apparatus, and computer program product
US9866725B2 (en) Image processing system, information processing apparatus, and recordable medium
US20160259933A1 (en) Information processing system, information processing apparatus, and information processing method
JP6066108B2 (ja) 電子文書生成システムおよびプログラム
US8294928B2 (en) Data management system to extract text data
US11301675B2 (en) Image processing apparatus, image processing method, and storage medium
JP2010074290A (ja) 情報処理装置、情報処理方法、プログラム及び記憶媒体
US11100363B2 (en) Character recognition program and method
US11800032B2 (en) Apparatus, information processing method, and storage medium
JP2008227583A (ja) 画像処理システム、エージェント装置、情報処理装置、エージェントプログラム、指示書作成プログラム
JP6484974B2 (ja) 情報処理装置、情報処理システム及びプログラム
JP2007041709A (ja) 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
US20150070724A1 (en) Information processing system and information processing method
JP2016096393A (ja) 情報処理装置、システム、情報処理方法およびプログラム
JP6749583B2 (ja) 情報処理装置、画像処理装置およびプログラム
US20170344326A1 (en) Printing process system and information processing apparatus
US20160373602A1 (en) Information processing apparatus, method of controlling information processing apparatus, and program
JP2018092569A (ja) 情報処理システム、情報処理装置、情報処理方法及びプログラム
JP7302175B2 (ja) 情報処理装置、及び情報処理プログラム
US20150264204A1 (en) Document management system, document managing method, and recording medium storing a document managing program
JP2012049668A (ja) 原稿読取装置、情報処理装置及び情報処理装置用のプログラム
JP6589508B2 (ja) 情報処理装置、画像形成装置及びプログラム
JP2015177265A (ja) 画像処理装置、画像処理システム、情報記憶方法およびプログラム
US20240073345A1 (en) Image forming apparatus, non-transitory computer readable medium storing image forming program, and information processing system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170905

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180626

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190204

R150 Certificate of patent or registration of utility model

Ref document number: 6484974

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350