JP6885318B2

JP6885318B2 - 画像処理装置

Info

Publication number: JP6885318B2
Application number: JP2017241113A
Authority: JP
Inventors: 忍吉奥
Original assignee: Kyocera Document Solutions Inc
Current assignee: Kyocera Document Solutions Inc
Priority date: 2017-12-15
Filing date: 2017-12-15
Publication date: 2021-06-16
Anticipated expiration: 2037-12-15
Also published as: JP2019109628A; US10810383B2; US20190188267A1

Description

本発明は、テキストの翻訳機能を有する画像処理装置に関し、特に互いに異なる種類の言語からなる各テキストを比較するための技術に関する。

例えば、特許文献１に記載の技術は、機械翻訳による翻訳文を編集して対訳文を作成する際に、原文中の訳抜けの可能性がある単語を検出して提示している。

また、特許文献２に記載の技術は、画像の印刷出力を行うのに加えて、その画像に含まれる文字等に例えば文法上の誤りがあった場合に、これを検出し、それを出力画像に付記して指摘するものである。

また、特許文献３に記載の技術は、複数の翻訳結果に含まれる単語または単語列の対応関係を照合、比較、結合するものである。

特開２０１４−１３７６１３号公報特開２００４−１９９４８３号公報特開２０１２−１１８８８３号公報

ここで、１つのテキストを該テキストとは異なる種類の言語に翻訳して、各言語のテキストをそれぞれのファイルに格納しておけば、互いに異なる言語を用いるそれぞれのユーザーが、ファイルの適宜選択により実質的には同一内容のテキストを読むことができる。

ところが、各ファイルのいずれかのテキストが更新されたにもかかわらず、他のファイルのテキストが更新されなかった場合は、各ファイルのテキストに差異が生じて、各ファイルのテキストの内容が整合しなくなる。この場合、その差異を検出できるようにすることが望まれる。

しかしながら、特許文献１乃至特許文献３のいずれにおいても、互いに異なる種類の言語の各テキストを比較して、両テキストの差異を検出するものではない。

本発明は、上記の事情に鑑みなされたものであり、互いに異なる種類の言語のテキストを比較して、各テキストの内容の差異を検出することを目的とする。

本発明の一局面にかかる画像処理装置は、互いに異なる種類の言語のテキストを有する第１ファイル及び第２ファイルを検索する検索部と、前記第１ファイル及び前記第２ファイルに格納されているそれぞれの原稿画像からテキスト領域を判定し、判定したテキスト領域からテキストを抽出するレイアウト解析部と、前記第２ファイルのテキストを、前記第１ファイルのテキストと同一種類の言語に翻訳して、前記第２ファイルの翻訳テキストを生成する翻訳部と、前記第１ファイルのテキストと、前記第２ファイルの前記翻訳テキストを比較して、この比較に基づき前記第１ファイルのテキストと前記第２ファイルのテキストの差異を検出する比較部と、前記比較部によって検出された前記差異を出力するための処理を行う出力部と、を備え、前記第１ファイル及び前記第２ファイルには、複数のテキストがそれぞれ格納されており、前記レイアウト解析部は、前記第１ファイルの前記原稿画像における各テキスト領域の位置と、前記第２ファイルの前記原稿画像における各テキスト領域の位置とに基づき、前記第１ファイルの各テキスト領域のテキストと前記第２ファイルの各テキスト領域のテキストとの対応関係を検出し、前記翻訳部は、前記第２ファイルの各テキストを、前記第１ファイルの各テキストと同一種類の言語に翻訳して、それぞれの翻訳テキストを生成し、前記比較部は、前記第１ファイルの各テキストに対応する、前記第２ファイルにおけるそれぞれのテキストを前記対応関係に基づいて特定し、前記第１ファイルの各テキストと、対応する前記第２ファイルの前記各翻訳テキストとをそれぞれ比較して、前記第１ファイルの各テキストと前記第２ファイルの各テキストとの差異をそれぞれに検出し、前記出力部は、前記差異の数が予め設定された閾値以下の場合に、前記検出された差異別に、前記差異を前記第１ファイルのテキスト又はこれに対応する前記第２ファイルのテキストに記した状態で、当該両テキストを併記した画像を作成し、当該作成した画像を出力するための処理を行い、前記差異の数が前記閾値を超える場合に、前記検出された差異別に、前記差異を前記第１ファイルのテキスト又はこれに対応する前記第２ファイルのテキストに記して、当該差異が記されたテキストのみを示す画像を作成し、当該作成した画像を出力するための処理を行うものである。

本発明によれば、互いに異なる種類の言語のテキストを比較して、各テキストの内容の差異を検出することができる。

本発明の画像処理装置の一実施形態を適用した画像形成装置を示す断面図である。本実施形態の画像形成装置の主要内部構成を示すブロック図である。第１ファイルに格納されている原稿画像及び第２ファイルに格納されている原稿画像の一例を示す図である。第１ファイルに格納されている原稿画像及び第２ファイルに格納されている原稿画像の他の例を示す図である。第１ファイルの日本語の各テキストと第２ファイルの英語の各テキストを交互に併記した状態を示す図である。第１ファイルに格納されている原稿画像及び第２ファイルに格納されている原稿画像の別の例を示す図である。第１ファイルに格納されている原稿画像及び第２ファイルに格納されている原稿画像の更に別の例を示す図である。第１ファイル及び第２ファイルを検索して、第１ファイルのテキストと第２ファイルのテキストの差異を検出して出力するための処理手順を示すフローチャートである。図８Ａに引き続く処理手順を示すフローチャートである。表示部に表示された言語併記モードの選択画面を示す図である。表示部に表示された言語併記モードの設定画面を示す図である。

以下、本発明の一実施形態について図面を参照して説明する。

図１は、本発明の画像処理装置の一実施形態を適用した画像形成装置を示す断面図である。この画像形成装置１０は、例えば、コピー機能、プリンター機能、スキャナー機能、及びファクシミリ機能のような複数の機能を兼ね備えたＭＦＰ（複合機）である。この画像形成装置１０は、画像読取部１１と、画像形成部１２とを備えている。

画像読取部１１は、原稿画像を光学的に読み取るスキャナーを有し、このスキャナーの撮像素子から出力されたアナログ信号をデジタル信号に変換して、原稿画像を示す画像データを生成する。

画像形成部１２は、画像読取部１１で生成された画像データ又は外部から受信した画像データによって示される画像を記録紙に印刷するものであり、マゼンタ用の画像形成ユニット３Ｍ、シアン用の画像形成ユニット３Ｃ、イエロー用の画像形成ユニット３Ｙ、及びブラック用の画像形成ユニット３Ｂｋを備えている。各画像形成ユニット３Ｍ、３Ｃ、３Ｙ、及び３Ｂｋのいずれにおいても、感光体ドラム４の表面を均一帯電させ、感光体ドラム４の表面を露光して、感光体ドラム４の表面に静電潜像を形成し、感光体ドラム４の表面の静電潜像をトナー像に現像して、感光体ドラム４の表面のトナー像を、中間転写ベルト５に転写する。これにより、カラーのトナー像（画像）が中間転写ベルト５上に形成される。このカラーのトナー像は、中間転写ベルト５と２次転写ローラー６の間のニップ域Ｎにおいて給紙部７から搬送路８を通じて搬送されてきた記録紙Ｐに２次転写される。

この後、定着装置１５で記録紙Ｐが加熱及び加圧されて、記録紙Ｐ上のトナー像が熱圧着により定着され、更に記録紙Ｐが排出ローラー対１６を通じて排出トレイ１７に排出される。

図２は、画像形成装置１０の主要内部構成を示す機能ブロック図である。図２に示すように画像形成装置１０は、制御ユニット３１、表示部３２、操作部３４、タッチパネル３５、ネットワーク通信部３６、ファクシミリ通信部３７、記憶部３８、画像メモリー３９、画像読取部１１、及び画像形成部１２などを備えている。これらの構成要素は、互いにバスを通じてデータ又は信号の送受信を可能とされている。

表示部３２は、液晶ディスプレイ（ＬＣＤ：Liquid Crystal Display）や有機ＥＬ（ＯＬＥＤ：Organic Light-Emitting Diode）ディスプレイなどから構成される。

操作部３４は、例えば、表示部３２に表示されているＧＵＩにおけるフォーカスを移動させる矢印キー、ＧＵＩに対して確定操作を行う決定キー、スタートキーなどを備えている。

表示部３２の画面には、タッチパネル３５が重ねられている。タッチパネル３５は、所謂抵抗膜方式や静電容量方式などのタッチパネルであって、タッチパネル３５に対するユーザーの指などの接触（タッチ）をその接触位置と共に検知し、表示部３２の画面上のＧＵＩなどに対するユーザーの指示を入力する。従って、タッチパネル３５は、表示部３２の画面に対するユーザー操作が入力される操作部としての役割を果たす。

ネットワーク通信部３６は、ネットワークを通じて他の端末装置（図示せず）との間で各種のデータを送受信する。ファクシミリ通信部３７は、画像データを、ネットワークを通じて他の画像形成装置やファクシミリ装置（図示せず）などとの間で送受信する。

記憶部３８は、大容量のＳＳＤ（Solid State Drive）、ＨＤＤ（Hard Disk Drive）などからなり、各種のデータやプログラムを記憶している。

画像メモリー３９は、画像読取部１１により読取られた原稿画像を示す画像データ、制御部４１により記憶部３８から読み出された画像データ、及びネットワーク通信部３６により受信された画像データなどを一時的に記憶する。

制御ユニット３１は、プロセッサー、ＲＡＭ(Random Access Memory）、及びＲＯＭ（Read Only Memory）などから構成される。プロセッサーは、ＣＰＵ（Central Processing Unit）、ＭＰＵ、又はＡＳＩＣ等である。この制御ユニット３１は、制御部４１、表示制御部４２、通信制御部４３、検索部４４、レイアウト解析部４５、翻訳部４６、比較部４７、及び出力部４８を備えており、これらの構成要素は、上記のＲＯＭ又は記憶部３８に記憶されているプログラムが上記のプロセッサーで実行されることにより機能するか、あるいはそれぞれハード回路により構成されている。

制御部４１は、画像形成装置１０の全体的な動作制御を司る。表示制御部４２は、表示部３２を制御して、上記ＧＵＩ、あるいは各種の情報などを表示部３２に表示させる。通信制御部４３は、ネットワーク通信部３６及びファクシミリ通信部３７の通信動作を制御する機能を有する。

検索部４４は、操作部３４又はタッチパネル３５の操作により指定されたファイル又は該指定されたファイルに関連する他のファイルを記憶部３８から検索して読み出す。また、検索部４４は、それらのファイルを通信制御部４３並びにネットワーク通信部３６を通じて、ネットワーク上のストレージから検索して取得する。ネットワーク上のストレージは、サーバー、ワークステーション、ＰＣなどにより提供される。

レイアウト解析部４５は、画像メモリー３９内の画像データによって示される原稿画像に対してレイアウト解析などを行って該原稿画像におけるテキスト領域、画像領域、表領域などを判定する。更に、レイアウト解析部４５は、テキスト領域から文字テキストを抽出する。

記憶部３８には、パターンマッチング用の複数の文字パターンを記憶した文字データベースＤＢが保存されている。レイアウト解析部４５は、テキスト領域から、文字認識（ＯＣＲ）技術により、テキスト領域に含まれる各画像をそれぞれ文字テキストに変換する。更に、文字データベースＤＢには、複数種の言語別に、各文字パターンが登録されているので、レイアウト解析部４５は、変換した文字テキストに基づき、当該文字テキストが示す文字の言語の種類を判定する。以下、原稿画像に含まれるテキスト領域を文字テキストに変換してなる文字テキスト群をテキストという。

翻訳部４６は、比較対象とするそれぞれ異なる言語からなる２つのテキストについて、一方のテキストを他方のテキストと同一の言語に翻訳して、翻訳テキストを生成する。

比較部４７は、任意のテキストと、当該テキストの比較対象となる翻訳テキストとを比較して、この比較に基づき該各テキストの差異を検出する。

出力部４８は、比較部４７により検出された各テキストの差異を出力するための処理を行う。出力部４８は、各テキストの差異（例えば、当該差異を示す画像）を、画像形成部１２により記録紙に記録させる、あるいは通信制御部４３並びにネットワーク通信部３６によりネットワーク上の端末装置に送信させる、等の制御を行う。

このような構成の画像形成装置１０において、例えば、ユーザーが、操作部３４又はタッチパネル３５を操作することによりコピー機能を選択して、このコピージョブの実行を指示すると、制御部４１は、画像読取部１１により原稿画像を読取らせて、原稿画像を示す画像データを画像メモリー３９に一旦記憶させ、この画像データを画像メモリー３９から画像形成部１２に入力させて、画像形成部１２より原稿画像を記録紙に印刷させる。

また、ユーザーが、操作部３４又はタッチパネル３５を操作して、予め定められた言語併記モードを選択した上で、互いに異なる種類の言語のテキストを含むそれぞれの原稿画像を有する第１ファイル及び第２ファイルの検索を指示する。なお、この時点では、第１ファイル及び第２ファイルに用いられている言語は、ユーザーが自己判断で把握しているものとする。

検索部４４は、この指示に従って、第１ファイル及び第２ファイルを記憶部３８又はネットワーク上のストレージから検索して画像メモリー３９に記憶させる。続いて、レイアウト解析部４５が、第１ファイルの原稿画像からテキスト（任意のテキスト）を抽出すると共に第２ファイルの原稿画像からテキスト（比較対象のテキスト）を抽出する。

翻訳部４６は、第２ファイルのテキストを第１ファイルのテキストと同一種類の言語に翻訳して、第２ファイルについて翻訳テキストを生成する。比較部４７は、第１ファイルのテキストと、第２ファイルの翻訳テキストを比較して、この比較に基づき第１ファイルのテキストと第２ファイルのテキストの差異を検出する。

出力部４８は、当該検出された差異を第１ファイルのテキスト又は前記第２ファイルのテキストに記した状態で、例えば、該各テキストを併記して出力する。

例えば、検索部４４は、図３に示すような原稿画像Ｇ１からなる第１ファイルと原稿画像Ｇ２からなる第２ファイルを記憶部３８から読み出し、又はネットワーク上のストレージから取得して、画像メモリー３９に記憶させる。

レイアウト解析部４５は、画像メモリー３９内の第１ファイルの原稿画像Ｇ１に対してレイアウト解析などを施して、各テキスト領域Ｘ１及び各画像領域Ｚ１などを判定する。レイアウト解析部４５は、各テキスト領域Ｘ１別に、複数の文字テキストからなるテキストＴ１を、上述した文字テキスト変換によりテキスト領域Ｘ１から抽出する。

そして、レイアウト解析部４５は、画像メモリー３９内の第２ファイルの原稿画像Ｇ２に対してレイアウト解析などを施して、各テキスト領域Ｘ２及び各画像領域Ｚ２などを判定し、各テキスト領域Ｘ２別に、複数の文字テキストからなるテキストＴ２を、上述した文字テキスト変換によりテキスト領域Ｘ２から抽出する。

また、レイアウト解析部４５は、第１ファイルの原稿画像Ｇ１における各テキスト領域Ｘ１の位置と第２ファイルの原稿画像Ｇ２における各テキスト領域Ｘ２の位置に基づき、各テキスト領域Ｘ１のテキストＴ１と各テキスト領域Ｘ２のテキストＴ２との対応関係、すなわち、各テキスト領域Ｘ１のテキストＴ１のいずれと、各テキスト領域Ｘ２のテキストＴ２のいずれが比較対象とされる関係であるか、を検出する。

レイアウト解析部４５による解析により、例えば、図３に示すように、第１ファイルの原稿画像Ｇ１には、日本語の複数のテキスト領域Ｘ１及び複数の画像領域Ｚ１が含まれ、また第２ファイルの原稿画像Ｇ２には、英語の複数のテキスト領域Ｘ２及び複数の画像領域Ｚ２が含まれていることが解析される。

ここでは、原稿画像Ｇ１における日本語の各テキストＴ１と原稿画像Ｇ２における英語の各テキストＴ２を例示しているが、日本語と英語を直接比較することができない。このため、翻訳部４６は、レイアウト解析部４５による解析結果に基づいて、第２ファイルの英語の各テキストＴ２を、第１ファイルの各テキストＴ１と同一言語である日本語に翻訳して、第２ファイルの英語の各テキストＴ２について、それぞれの翻訳テキストを生成する。

そして、比較部４７は、第１ファイルの各テキストＴ１別に、テキストＴ１と該テキストＴ１に対応するテキストＴ２を翻訳した翻訳テキストを比較して、この比較に基づきテキストＴ１とテキストＴ２の差異を検出する。例えば、比較部４７は、第１ファイルのテキストＴ１には記載されていない単語を、当該テキストＴ１に対応する、第２ファイルのテキストＴ２についての翻訳テキストから抽出して、第２ファイルのテキストＴ２から当該抽出した単語に対応する単語を検出し、この検出した単語を差異として検出する。あるいは、比較部４７は、第２ファイルのテキストＴ２についての翻訳テキストに記載されていない単語を第１ファイルのテキストＴ１から検出し、この検出した単語を差異として検出する。

出力部４８は、例えば、図３に示すように原稿画像Ｇ１と原稿画像Ｇ２を横に並べて併記した上で、原稿画像Ｇ１における日本語のテキストＴ１に対してその差異を記し、或いは、原稿画像Ｇ２における英語のテキストＴ２に対してその差異を記した画像を作成する。例えば、出力部４８は、テキストＴ１又はテキストＴ２における差異として検出された単語に対して下線又は枠を付し、或いは、該単語を他の単語とは異なる色で表示する等の異なる形態とした画像を作成する。

ここで、出力部４８は、図３に示すように原稿画像Ｇ１及び原稿画像Ｇ２に多くの画像領域が含まれている場合は、上記のように原稿画像Ｇ１と原稿画像Ｇ２を併記した画像を作成することが好ましい。これにより、原稿画像Ｇ１及び原稿画像Ｇ２をそれらの体裁を損なうことのない画像を作成できる。

また、原稿画像Ｇ１及び原稿画像Ｇ２に含まれる画像領域の数が少ない場合には、出力部４８は、原稿画像Ｇ１と原稿画像Ｇ２を併記した画像を作成する代わりに、原稿画像Ｇ１から日本語の各テキストＴ１のみを抽出すると共に、原稿画像Ｇ２から英語の各テキストＴ２のみを抽出して、各テキストＴ１と各テキストＴ２を併記し、テキストＴ１又はテキストＴ２の少なくとも一方において、差異として検出された単語に対して下線又は枠を付し、或いは、該単語を他の単語とは異なる色で示す等の異なる形態とした画像を作成するようにしてもよい。これにより、原稿画像Ｇ１及び原稿画像Ｇ２が混在する場合よりも、各テキストＴ１と各テキストＴ２の比較が容易になる。

図４は、第１ファイルの原稿画像と第２ファイルの原稿画像の他の例を示している。第１ファイルの原稿画像Ｇ１には、表領域Ｈ１、日本語の複数のテキスト領域Ｘ１、及び１つの画像領域Ｚ１が含まれ、また第２ファイルの原稿画像Ｇ２には、表領域Ｈ２、英語の複数のテキスト領域Ｘ２、及び１つの画像領域Ｚ２が含まれるものとする。

ここでも、検索部４４が第１ファイル及び第２ファイルを検索して画像メモリー３９に記憶させる。レイアウト解析部４５は、第１ファイルの原稿画像Ｇ１に対してレイアウト解析などを施して、表領域Ｈ１、各テキスト領域Ｘ１、及び画像領域Ｚ１を判定すると共に、第２ファイルの原稿画像Ｇ２に対してレイアウト解析などを施して、表領域Ｈ２、各テキスト領域Ｘ２、及び画像領域Ｚ２を判定し、各テキストＴ１及び各テキストＴ２をそれぞれのテキスト領域Ｘ１、Ｘ２から抽出し、また各テキスト領域Ｘ１のテキストＴ１と各テキスト領域Ｘ２のテキストＴ２との対応関係を検出する。

翻訳部４６は、第２ファイルの各テキストＴ２を第１ファイルの各テキストＴ１と同一種類の日本語に翻訳して、それぞれの翻訳テキストを生成する。比較部４７は、第１ファイルの各テキストＴ１別に、テキストＴ１と該テキストＴ１に対応するテキストＴ２を翻訳した翻訳テキストを比較して、この比較に基づきテキストＴ１とテキストＴ２の差異を検出する。出力部４８は、原稿画像Ｇ１と原稿画像Ｇ２を横に並べて併記して、日本語のテキストＴ１又は英語のテキストＴ２の少なくとも何れか一方に、差異として検出された単語を下線又は枠等や、異なる色表示で示した画像を作成する。

また、図４に示すように第１ファイルの原稿画像Ｇ１及び第２ファイルの原稿画像Ｇ２を併記する代わりに、図５に示すように第１ファイルの日本語の各テキストＴ１と第２ファイルの英語の各テキストＴ２を交互に併記してもよい。図５では、日本語のテキストＴ１毎に、テキストＴ１と該テキストＴ１に対応する英語のテキストＴ２を上下に並べて併記している。また、出力部４８は、日本語のテキストＴ１又は英語の各テキストＴ２の少なくとも一方において、差異として検出された単語を下線又は枠や異なる色表示で示した画像を作成する。この場合、出力部４８は、原稿画像Ｇ１又は原稿画像Ｇ２のいずれかの表領域及び画像領域を用いて、当該第１ファイルの日本語の各テキストＴ１と第２ファイルの英語の各テキストＴ２を交互に併記した画像を作成する。

図６は、第１ファイルの原稿画像と第２ファイルの原稿画像について、別の例を示している。図６には、出力部４８が、第１ファイルの原稿画像Ｇ１と第２ファイルの原稿画像Ｇ２を横に並べて併記し、また日本語の各テキストＴ１又は英語の各テキストＴ２の少なくとも一方において、差異として検出された単語を下線又は枠や異なる色表示で示した画像を作成した例を示している。

これらの原稿画像Ｇ１及び原稿画像Ｇ２に含まれている画像領域の数が少ないため、出力部４８は、原稿画像Ｇ１と原稿画像Ｇ２を併記する代わりに、原稿画像Ｇ１における各テキストＴ１と原稿画像Ｇ２における各テキストＴ２を抽出して併記し、画像領域を表示する画像の作成を省略するようにしても構わない。

図７は、第１ファイルの原稿画像と第２ファイルの原稿画像について、更に別の例を示している。図７には、出力部４８が、第１ファイルの原稿画像Ｇ１と第２ファイルの原稿画像Ｇ２を横に並べて併記した画像を作成した例を示している。この例では、第１ファイルの原稿画像Ｇ１には、３つの表示欄Ｒからなる表領域Ｈ１が含まれ、それぞれの表示欄Ｒには、日本語の複数のテキスト領域Ｘ１及び複数の画像領域Ｚ１が含まれている。同様に、第２ファイルの原稿画像Ｇ２には、３つの表示欄Ｒからなる表領域Ｈ２が含まれ、それぞれの表示欄Ｒには、英語の複数のテキスト領域Ｘ２及び複数の画像領域Ｚ２が含まれている。この例では、出力部４８は、日本語の各テキストＴ１又は英語の各テキストＴ２の少なくとも一方において、差異として検出された単語を下線又は枠や異なる色表示で示した画像を作成する。

ここで、出力部４８は、これらの原稿画像Ｇ１と原稿画像Ｇ２を横に並べて併記する代わりに、原稿画像Ｇ１における各テキストＴ１と原稿画像Ｇ２における各テキストＴ２を抽出して併記し、各表示欄Ｒにおける画像領域を表示する画像の作成を省略するようにしても構わない。

次に、上記のように第１ファイル及び第２ファイルを検索して、第１ファイルのテキストと第２ファイルのテキストの差異を検出して出力するための処理手順を、図８Ａ及び図８Ｂに示すフローチャートなどを参照して説明する。

まず、ユーザーが、操作部３４及びタッチパネル３５を操作して、図９に示すような言語併記モードの選択画面Ｄ１の表示指示を入力すると、この表示指示に従って、制御部４１は、その選択画面Ｄ１を、表示制御部４２を通じて表示部３２に表示させる。この言語併記モードの選択画面Ｄ１には、言語併記モードのオンオフを指示するためのチェックボックスＣＨ１１、ＣＨ１２、バックキーＢＫ、及びネクストキーＮＸが表示されている。ユーザーが、操作部３４又はタッチパネル３５を操作して、言語併記モードのオンを指示するためのチェックボックスＣＨ１１にチェックを入れて、ネクストキーＮＸを指示する
と、制御部４１は、言語併記モードを受け付ける（Ｓ１０１）。

制御部４１は、言語併記モードを受け付けると、表示制御部４２は、設定画面Ｄ１を非表示として、代わりに、図１０に示すような言語併記モードの設定画面Ｄ２を表示部３２に表示させる（Ｓ１０２）。この言語併記モードの設定画面Ｄ２には、互いに異なる種類の言語の２つのテキストをそれぞれ格納した第１ファイル及び第２ファイルの有無を指示するための各チェックボックスＣＨ２１、ＣＨ２２、第１ファイル及び第２ファイルに格納されている原稿画像におけるテキスト領域、画像領域、表領域の有無を指示するための各チェックボックスＣＨ２３、ＣＨ２４、ＣＨ２５、言語併記モードの適用範囲（例えば原稿画像の頁）を指示するための各チェックボックスＣＨ２６、ＣＨ２７、及び第１ファイルのテキストと第２ファイルのテキストの差異を通知するか否かを指示するためのチェックボックスＣＨ２８、バックキーＢＫ、及びネクストキーＮＸが表示されている。

図１０には、言語併記モードの設定画面Ｄ２として、デフォルト設定として、第１ファイル及び第２ファイルの両方有に対応するチェックボックスＣＨ２１がユーザーにより操作され、第１ファイル及び第２ファイルに格納されている原稿画像におけるテキスト領域、画像領域、表領域の有に対応する各チェックボックスＣＨ２３、ＣＨ２４、ＣＨ２５が操作され、言語併記モードの適用範囲として全範囲を指示するチェックボックスＣＨ２６が操作され、第１ファイルのテキストと第２ファイルのテキストの差異の通知に対応するチェックボックスＣＨ２８が操作され、これら操作された各箇所にチェックを示す画像が表示された例を示している。ユーザーは、操作部３４又はタッチパネル３５を操作して、任意のチェックボックスを操作することで、各チェックボックスに対応付けられた上記各指示が入力され、制御部４１に受け付けられる。

そして、ユーザーが、操作部３４又はタッチパネル３５を操作して、ネクストキーＮＸを指定すると、制御部４１は、言語併記モードの設定画面Ｄ２における設定に基づき言語併記モードを実行する指示が入力され、制御部４１が当該実行指示を受け付ける。

続いて、ユーザーが、操作部３４又はタッチパネル３５を操作して、互いに異なる種類の言語のテキストを含む第１ファイルの名称及び第２ファイルの名称を入力して、第１ファイル及び第２ファイルを指定すると、検索部４４は、第１ファイル及び第２ファイルを記憶部３８から検索する（Ｓ１０３）。あるいは、ユーザーが、操作部３４又はタッチパネル３５を操作して、第１ファイルの名称を入力して、第１ファイルを指定すると、検索部４４は、第１ファイルを記憶部３８から検索し、更に、第１ファイルの名称などに基づき該第１ファイルに関連する第２ファイルを記憶部３８から検索する。なお、表示制御部４２が、記憶部３８に予め記憶されている複数のファイルを示す一覧を表示部３２に表示させて、ユーザーが、操作部３４又はタッチパネル３５を操作して、この一覧において、第１ファイル及び第２ファイル、又は第１ファイルを選択して指定可能とし、当該指定を制御部４１が受け付けるようにしてもよい。

このとき、検索部４４は、第１ファイル及び第２ファイルを記憶部３８から検索することができないか、又は第１ファイルのみを記憶部３８から検索して読み出すと（Ｓ１０３「Ｎｏ」）、第１ファイル及び第２ファイルをネットワーク上のストレージから検索するか、又は第１ファイルの名称などに基づき該第１ファイルに関連する第２ファイルをネットワーク上のストレージから検索する（Ｓ１０４、Ｓ１０５）。そして、検索部４４が、ストレージにアクセスできないか（Ｓ１０４「Ｎｏ」）、第１ファイル及び第２ファイルをストレージから検索できない場合（Ｓ１０３で第１ファイルのみを記憶部３８から検索して読み出しているときは、第２ファイルをストレージから検索できない場合）は（Ｓ１０５「Ｎｏ」）、表示制御部４２は、言語併記モードの終了通知のメッセージを表示部３２に表示させ（Ｓ１０６）、図８Ａ及び図８Ｂの処理を終了する。

また、検索部４４が、ストレージにアクセスして（Ｓ１０４「Ｙｅｓ」）、第１ファイル及び第２ファイルをストレージから検索できた場合（Ｓ１０３で第１ファイルのみを記憶部３８から検索して読み出しているときは、第２ファイルをストレージから検索できた場合）は（Ｓ１０５「Ｙｅｓ」）、表示制御部４２は、第１ファイル及び第２ファイル（Ｓ１０３で第１ファイルのみを記憶部３８から検索して読み出しているときは、第２ファイルのみ）を表示部３２に表示させる（Ｓ１０７）。このとき、ユーザーが、第１ファイル及び第２ファイル（Ｓ１０３で第１ファイルのみを記憶部３８から検索して読み出しているときは第２ファイルのみ）を選択するための操作を、操作部３４等を介して行わなければ（Ｓ１０８「Ｎｏ」）、表示制御部４２は、言語併記モードの終了通知のメッセージを表示部３２に表示させ（Ｓ１０６）、図８Ａ及び図８Ｂの処理を終了する。

また、ユーザーが、操作部３４又はタッチパネル３５を操作して、第１ファイル及び第２ファイル（Ｓ１０３で第１ファイルのみを記憶部３８から検索して読み出しているときは第２ファイルのみ）を選択して、制御部４１が当該選択を受け付けると（Ｓ１０８「Ｙｅｓ」）、検索部４４は、ストレージから検索した第１ファイル及び第２ファイルの両方（Ｓ１０３で第１ファイルのみを記憶部３８から検索して読み出しているときは、第２ファイルのみ）を取得する。

従って、検索部４４が第１ファイル及び第２ファイルを記憶部３８から検索により読み出せたか（Ｓ１０３「Ｙｅｓ」）、あるいはユーザーが操作部３４又はタッチパネル３５を操作して、第１ファイル及び第２ファイルの両方の選択（Ｓ１０３で第１ファイルのみを記憶部３８から検索して読み出しているときは第２ファイルの選択）が制御部４１に受け付けられると（Ｓ１０８「Ｙｅｓ」）、第１ファイル及び第２ファイルの両方（Ｓ１０３で第１ファイルのみを記憶部３８から検索して読み出しているときは第２ファイルのみ）が取得されることとなる。

なお、ユーザーによる操作部３４等を介した上記設定画面Ｄ２の操作により、上記言語併記モードが適用される範囲が入力されると、制御部４１は当該範囲の指定を受け付ける。検索部４４は、当該指示が示す適用範囲に従って、記憶部３８内の第１ファイルから該適用範囲に対応する頁の原稿画像を読出して画像メモリー３９に記憶させると共に、記憶部３８内の第２ファイルから該適用範囲に対応する頁の原稿画像を読出して画像メモリー３９に記憶させる（Ｓ１０９）。

そして、レイアウト解析部４５は、画像メモリー３９内の第１ファイルの原稿画像及び第２ファイルの原稿画像別に、原稿画像に対してレイアウト解析などを行って該原稿画像におけるテキスト領域、画像領域、表領域などを逐次判定し、それぞれのテキスト領域から上記文字テキスト変換によりテキストを抽出すると共に、当該抽出した各テキストが示す文字の言語を判定する（Ｓ１１０）。また、レイアウト解析部４５は、第１ファイルの原稿画像における各テキスト領域の位置と第２ファイルの原稿画像における各テキスト領域の位置に基づき、第１ファイルの各テキスト領域のテキストと第２ファイルの各テキスト領域のテキストとの対応関係を検出する。

翻訳部４６は、第２ファイルの各テキストを、第１ファイルの各テキストと同一の言語に翻訳して、第２ファイルの各テキストについてそれぞれ翻訳テキストを生成し、これらの翻訳テキストを第２ファイルの各テキストに対応付けて記憶部３８に記憶させる（Ｓ１１１）。

比較部４７は、第１ファイルの各テキストに対応する、第２ファイルにおけるそれぞれのテキストを上記対応関係に基づいて特定し、第１ファイルの各テキストと、第１ファイルの各テキストに対応するそれぞれの第２ファイルのテキストの翻訳テキストとを比較する（Ｓ１１２）。比較部４７は、この比較に基づき第１ファイルのテキストと第２ファイルのテキストの差異の有無を逐次判定する（Ｓ１１３）。

比較部４７は、差異が有れば（Ｓ１１３「有」）、この差異を記憶部３８に記憶されている上記第１ファイルの各テキスト、又は第２ファイルの各テキストのいずれかに記して、該各テキストを対応付ける（Ｓ１１４）。例えば、比較部４７は、第１ファイルのテキストには記載されていない単語を翻訳テキストから抽出して、第２ファイルのテキストからその抽出した単語に対応する単語を差異として求め、その求めた単語を第２ファイルのテキストに記して、当該第１ファイルのテキストと第２ファイルのテキストを対応付ける。あるいは、比較部４７は、翻訳テキストに記載されていない単語を差異として第１ファイルのテキストから求め、この求めた単語を第１ファイルのテキストに記して、当該第１ファイルのテキストと第２ファイルのテキストを対応付ける。

また、比較部４７は、第１ファイルのテキストと第２ファイルのテキストの差異が無ければ（Ｓ１１３「無」）、差異を記すことなく、当該記憶部３８に記憶されている第１ファイルのテキストと第２ファイルのテキストを対応付ける（Ｓ１１５）。

そして、比較部４７は、第１ファイルの各テキストのうちに翻訳テキストと比較されていないテキストが残っているか否かを判定し（Ｓ１１６）、残っていると判定すると（Ｓ１１６「Ｙｅｓ」）、Ｓ１１２〜Ｓ１１６の処理を繰り返し、未だ比較していない第１ファイルの各テキストとこれに対応する翻訳テキストとを比較する。一方、比較部４７は、残っていないと判定すると（Ｓ１１６「Ｎｏ」）、Ｓ１１２〜Ｓ１１６の処理を終了して、Ｓ１１７に移行する。

制御部４１は、Ｓ１１２〜Ｓ１１６の処理が終了すると、記憶部３８に記憶されている第１ファイルの各テキストと、当該各テキストに対応付けられた第２ファイルのそれぞれのテキストとを参照して、第１ファイルのテキスト及びこれに対応付けられた第２ファイルのテキストについてＳ１１４で差異として求められた単語の数を検出する。そして、制御部４１は、単語の数が予め設定された判定値Ｑ（Ｑ＝０又は整数。本実施形態では０とする）以下であるか否かを判定する（Ｓ１１７）。制御部４１は、単語の数が判定値Ｑ以下であると判定すると（Ｓ１１７「Ｙｅｓ」）、第１ファイルの各テキストと第２ファイルの各テキストが一致する旨を示すメッセージを、表示制御部４２が表示部３２に表示させる（Ｓ１１８）。出力部４８は、第１ファイルの各テキストと第２ファイルの各テキストを併記した画像を作成し、当該画像を出力するための処理を行う（Ｓ１１９）。

また、制御部４１は、単語の数が判定値Ｑを超えていると判定すると（Ｓ１１７「Ｎｏ」）、第１ファイルの各テキストと第２ファイルの各テキストが一致しない旨を示すメッセージを、表示制御部４２が表示部３２に表示させる（Ｓ１２０）。出力部４８は、各差異となる単語別に、その単語を第１ファイルのテキスト又は第２ファイルのテキストに記した状態で、第１ファイルの各テキストと第２ファイルの各テキストを併記した画像を作成して、当該画像を出力するための処理を行う（Ｓ１２１）。

なお、上記Ｓ１１７において、制御部４１が、単語の数が予め設定された判定値Ｑを上記０ではなく、例えば、５などの整数値にして上記判定を行うと、当該整数値が示す数以下しか差異がない場合には、第１ファイルの各テキストと第２ファイルの各テキストが一致したものとして、上記メッセージを表示制御部４２が表示部３２に表示させることができる。異なる言語からなる文章の一方を翻訳して変換し、同一の言語に揃えたとしても、変換後の文章の内容が、変換していない方の文章に完全に一致しないこともある。このため、このように判定値Ｑを変更することにより、第１ファイルの各テキストと第２ファイルの各テキストとが一致すると判断する基準を、ユーザーが求めるレベルに調整することが可能になる。

出力部４８の処理による、第１ファイルの各テキストと第２ファイルの各テキストの出力形態は、図３〜図７に示した通りである。例えば、出力部４８は、第１ファイルの原稿画像における各画像領域の数又は第２ファイルの原稿画像における各画像領域の数が予め設定された規定値Ｓ１（例えば、３）以下であるか否かを判定する。出力部４８は、各画像領域の数が規定値Ｓ１を超えると判定すると、図３に示すように第１ファイルの原稿画像と第２ファイルの原稿画像を画像メモリー３９から読み出して併記し、差異となる単語を記憶部３８から逐次読み出して、該各原稿画像のテキストにおけるその差異となる単語に対して下線又は枠を付したり、該単語を他の単語とは異なる色で示した画像を作成する。

また、出力部４８は、第１ファイルの原稿画像における各画像領域の数又は第２ファイルの原稿画像における各画像領域の数が規定値Ｓ１以下であると判定すると、第１ファイルの原稿画像から日本語の各テキストを抽出すると共に、第２ファイルの原稿画像から英語の各テキストを抽出して、第１ファイルの各テキストと第２ファイルの各テキストを併記し、差異となる単語を記憶部３８から逐次読み出して、該各テキストにおけるその差異となる単語に対して下線又は枠を付したり、該単語を他の単語とは異なる色で示した画像を作成する。

また、出力部４８は、図４に示すように第１ファイルの原稿画像と第２ファイルの原稿画像を画像メモリー３９から読み出して併記し、差異となる単語を記憶部３８から逐次読み出して、該各原稿画像のテキストにおけるその差異となる単語に対して下線又は枠を付したり、該単語を他の単語とは異なる色で示した画像を作成する。あるいは、出力部４８は、図５に示すように第１ファイルのテキスト毎に、第１ファイルのテキストと該テキストに対応する第２ファイルのテキストを上下に並べて併記し、差異となる単語を記憶部３８から逐次読み出して、該各元テキストにおけるその差異となる単語を下線又は枠や色で示した画像を作成する。

また、出力部４８は、図６に示すように第１ファイルの原稿画像と第２ファイルの原稿画像を横に並べて併記し、第１ファイルのテキスト又は第２ファイルのテキストにおける差異となる単語を下線又は枠や色表示で示した画像を作成するようにしてもよい。

また、出力部４８は、図７に示すように第１ファイルの原稿画像における各表領域と第２ファイルの原稿画像における各表領域を横に並べて併記し、第１ファイルのテキスト又は第２ファイルのテキストにおける差異となる単語を下線又は枠や色表示で示した画像を作成するようにしてもよい。

このように本実施形態では、第２ファイルのテキストを第１ファイルのテキストと同一の言語に翻訳して翻訳テキストを生成し、第１ファイルのテキストと、当該第２ファイルの翻訳テキストを比較することにより、この比較に基づき第１ファイルのテキストと第２ファイルのテキストの差異を検出する。これにより、言語が異なる各テキストの差異を容易に確認することができる。本実施形態によれば、例えば、一方のテキストのみが更新された場合に、更新の内容が両テキストに反映されているかの確認作業が容易となる。また上記のように検出される差異を視認することで、ユーザーは、各テキストの一方に対する他方の翻訳精度を確認することも可能になる。

また、本実施形態によれば、出力部４８が、各テキストを併記し、各テキストのいずれかに該各テキストの差異を記した画像を作成するので、出力された当該画像を視認することで、ユーザーは、両テキストを容易に比較することができる。

また、本実施形態によれば、出力部４８は、第１ファイルの原稿画像における各画像領域の数又は第２ファイルの原稿画像における各画像領域の数が規定値Ｓ１を超える場合に、原稿画像Ｇ１と原稿画像Ｇ２を併記した画像を作成するので、画像領域を記さないことにより原稿画像Ｇ１と原稿画像Ｇ２の体裁が崩れる事態を低減できる。また、出力部４８は、該各画像領域の数が規定値Ｓ１以下の場合に、原稿画像Ｇ１と原稿画像Ｇ２を併記する代わりに、原稿画像Ｇ１における日本語の各テキストＴ１と原稿画像Ｇ２における英語の各テキストＴ２を抽出して併記しているので、画像領域を記さないことにより原稿画像Ｇ１と原稿画像Ｇ２の体裁が崩れない場合に限って、画像領域を記さないようにして、ユーザーが、各テキストＴ１と各テキストＴ２の差異を容易に確認可能となる。

なお、上記実施形態では、比較部４７は、第２ファイルについて翻訳テキストを作成するようにしているが、第２ファイルはそのままのテキストを用い、第１ファイルのテキストを翻訳して翻訳テキストを作成し、第１及び第２ファイルを比較するようにしてもよい。

また、上記実施形態では、レイアウト解析部４５が、第１ファイル及び第２ファイルに格納されているそれぞれの原稿画像からテキスト領域を判定し、判定したテキスト領域からテキストを抽出して、当該抽出した第１ファイル及び第２ファイルのテキストが互いに比較対象とされるが、レイアウト解析部４５の処理によることなく、第１ファイル及び第２ファイルが当初からそれぞれテキストデータを有しており、当該テキストデータ部分を比較対象のテキストとして、比較部４７が上述した比較を行うようにしてもよい。

また、第１ファイルのテキスト及び第２ファイルのテキストとして、種々の言語を適用することが可能である。

また、出力部４８は、差異の数を計数し、この差異の数が予め設定された閾値以下の場合に、差異別に、差異を第１ファイルのテキスト又は第２ファイルのテキストに記した状態で、該各テキストを併記した画像を作成し、差異の数が閾値を超える場合に、差異別に、差異を第１ファイルのテキスト又は第２ファイルのテキストに記して、差異が記された方のテキストのみを示す画像を作成するようにしてもよい。この場合は、差異の数が多いときには、差異が記された方のテキストのみをユーザーが確認することとなり、ユーザーは差異を容易に確認できる。

また、出力部４８は、互いに対応する第１ファイルのテキストと第２ファイルのテキストのいずれかに差異が記されている場合に、該各テキストを併記した画像を作成し、互いに対応する第１ファイルのテキストと第２ファイルのテキストのいずれにも差異が記されていない場合には、該各テキストの画像の作成を省略してもよい。

また、第１ファイルのテキストと第２ファイルのテキストの併記方向を、ユーザーが任意に設定できるようにしてもよい。例えば、図１０に示す言語併記モードの設定画面Ｄ２において、併記方向を上下方向及び左右方向のいずれかに設定するための２つのチェックボックスを表示して、操作部３４又はタッチパネル３５の操作により該各チェックボックスのいずれかをユーザーが操作する。そして、出力部４８は、操作されたチェックボックスに応じた、第１ファイルのテキストと第２ファイルのテキストの併記方向を受け付け、この受け付けた併記方向に従って、併記方向を上下方向及び左右方向のいずれかに設定する。

更に、言語併記モードの設定画面Ｄ２において、第１ファイルのテキストと第２ファイルのテキストの併記の順番を設定することができるようにしてもよい。

また、出力部４８は、第１ファイルのテキストと第２ファイルのテキストの併記方向を左右方向に設定した状態で、第１ファイルのテキストと第２ファイルのテキストの少なくとも一方の左右方向長さが予め設定された規定長さを超えた場合に、各テキストの併記方向を上下方向に変更してもよい。この場合は、各テキストの少なくとも一方の左右方向長さが長くなり過ぎて、各テキストを左右方向に併記することが困難になったときに、各テキストの併記方向が上下方向に変更されるので、各テキストの併記を維持することができる。

また、図１乃至図１０を用いて説明した上記実施形態の構成及び処理は、本発明の一例に過ぎず、本発明を当該構成及び処理に限定する趣旨ではない。

１０画像形成装置
１１画像読取部
１２画像形成部
３１制御ユニット
３２表示部
３４操作部
３５タッチパネル
３６ネットワーク通信部
３７ファクシミリ通信部
３８記憶部
３９画像メモリー
４１制御部
４２表示制御部
４３通信制御部
４４検索部
４５レイアウト解析部
４６翻訳部
４７比較部
４８出力部

Claims

互いに異なる種類の言語のテキストを有する第１ファイル及び第２ファイルを検索する検索部と、
前記第１ファイル及び前記第２ファイルに格納されているそれぞれの原稿画像からテキスト領域を判定し、判定したテキスト領域からテキストを抽出するレイアウト解析部と、
前記第２ファイルのテキストを、前記第１ファイルのテキストと同一種類の言語に翻訳して、前記第２ファイルの翻訳テキストを生成する翻訳部と、
前記第１ファイルのテキストと、前記第２ファイルの前記翻訳テキストを比較して、この比較に基づき前記第１ファイルのテキストと前記第２ファイルのテキストの差異を検出する比較部と、
前記比較部によって検出された前記差異を出力するための処理を行う出力部と、を備え、
前記第１ファイル及び前記第２ファイルには、複数のテキストがそれぞれ格納されており、
前記レイアウト解析部は、前記第１ファイルの前記原稿画像における各テキスト領域の位置と、前記第２ファイルの前記原稿画像における各テキスト領域の位置とに基づき、前記第１ファイルの各テキスト領域のテキストと前記第２ファイルの各テキスト領域のテキストとの対応関係を検出し、
前記翻訳部は、前記第２ファイルの各テキストを、前記第１ファイルの各テキストと同一種類の言語に翻訳して、それぞれの翻訳テキストを生成し、
前記比較部は、前記第１ファイルの各テキストに対応する、前記第２ファイルにおけるそれぞれのテキストを前記対応関係に基づいて特定し、前記第１ファイルの各テキストと、対応する前記第２ファイルの前記各翻訳テキストとをそれぞれ比較して、前記第１ファイルの各テキストと前記第２ファイルの各テキストとの差異をそれぞれに検出し、
前記出力部は、
前記差異の数が予め設定された閾値以下の場合に、前記検出された差異別に、前記差異を前記第１ファイルのテキスト又はこれに対応する前記第２ファイルのテキストに記した状態で、当該両テキストを併記した画像を作成し、当該作成した画像を出力するための処理を行い、
前記差異の数が前記閾値を超える場合に、前記検出された差異別に、前記差異を前記第１ファイルのテキスト又はこれに対応する前記第２ファイルのテキストに記して、当該差異が記されたテキストのみを示す画像を作成し、当該作成した画像を出力するための処理を行う画像処理装置。
前記比較部は、前記第１ファイルのテキストには記載されていない単語を、前記第２ファイルの前記翻訳テキストから抽出して、前記第２ファイルの翻訳テキストから該抽出した単語に対応する、前記第２ファイルのテキスト中の単語を前記差異として検出する請求項１に記載の画像処理装置。
前記比較部は、前記第２ファイルの前記翻訳テキストには記載されていない単語を前記第１ファイルのテキストから抽出して、この抽出した単語を前記差異として検出する請求項１に記載の画像処理装置。