JP2008299780A - 画像処理装置、及び画像処理プログラム - Google Patents

画像処理装置、及び画像処理プログラム Download PDF

Info

Publication number
JP2008299780A
JP2008299780A JP2007147887A JP2007147887A JP2008299780A JP 2008299780 A JP2008299780 A JP 2008299780A JP 2007147887 A JP2007147887 A JP 2007147887A JP 2007147887 A JP2007147887 A JP 2007147887A JP 2008299780 A JP2008299780 A JP 2008299780A
Authority
JP
Japan
Prior art keywords
sentence
area
character
character size
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007147887A
Other languages
English (en)
Inventor
Hironari Konno
裕也 今野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2007147887A priority Critical patent/JP2008299780A/ja
Priority to US12/078,163 priority patent/US8510093B2/en
Priority to CN2008100945208A priority patent/CN101320429B/zh
Publication of JP2008299780A publication Critical patent/JP2008299780A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors

Abstract

【課題】文書を翻訳した前後で各文章領域間の相対的な文字の大小関係を保つ。
【解決手段】画像処理装置10は、文書画像を文章領域に分割し、分割された各文章領域に含まれる文字を認識し、認識される文字のサイズに応じて各文章領域をグループに分類し、文章領域毎に、その文章領域に含まれる文字からなる文章を所定の言語に翻訳し、文章領域の文字サイズを、該文章領域のサイズ、行間、文字間、及び翻訳後の文章の文字数に基づいて算出し、同一のグループに分類された文章領域毎に、翻訳後の文字サイズが同一となるように各文字領域の文字サイズを補正する。
【選択図】図1

Description

本発明は、画像処理装置、及び画像処理プログラムに関する。
スキャン文書からOCRにより取得したテキストを翻訳し、元の文書のレイアウトに翻訳文を埋め込んで出力するシステムがある(例えば、特許文献1を参照)。
特開平8−6948号公報
しかしながら、従来の技術では、元の文書のレイアウトを維持するために、文章領域の大きさと翻訳後の文字量とに基づいて翻訳文の文字サイズが決定されるので、元の文書では同じ大きさであった文字が翻訳文では異なった大きさの文字として出力されてしまうことがあった。そのため、従来の技術では、元の文書における各文書領域間の相対的な文字の大小関係が保たれないという問題があった。
本発明の目的は、文書を翻訳した前後で各文章領域間の相対的な文字の大小関係を保つことができる画像処理装置、及び画像処理プログラムを提供することにある。
上記目的を達成するために、請求項1に記載の画像処理装置の発明は、文書画像を文章領域に分割する領域分割手段と、前記領域分割手段により分割された各文章領域に含まれる文字を認識する文字認識手段と、前記各文章領域を前記文字認識手段により認識される文字のサイズに応じてグループに分類する分類手段と、前記文章領域毎に、該文章領域に含まれる文字からなる文章を所定の言語に翻訳する翻訳手段と、前記文章領域毎に前記翻訳手段により翻訳される文章の文字サイズを、該文章領域のサイズ、行間、文字間、及び翻訳後の文章の文字数に基づいて算出する算出手段と、前記分類手段により同一のグループに分類された文章領域毎に、前記算出手段により算出された文字サイズが同一となるように各文字領域の文字サイズを補正する補正手段と、を含むことを特徴とする。
請求項2に記載の発明は、請求項1に記載の発明において、前記補正手段は、前記分類手段により同一のグループに分類された文章領域のうち最小の文字サイズに合うように補正する、ことを特徴とする。
請求項3に記載の発明は、請求項1又は2に記載の発明において、前記分類手段により分類されるグループの文字サイズに基づいて、各グループの順序を決定する順序決定手段をさらに含み、前記補正手段は、前記順序決定手段により決定される各グループの順序が保たれるように、前記各文章領域の文字サイズをさらに補正する、ことを特徴とする。
請求項4に記載の発明は、請求項3に記載の発明において、前記分類手段により分類される各グループの文字サイズの比を記憶する文字サイズ情報記憶手段をさらに含み、前記補正手段は、前記文字サイズ情報記憶手段に記憶される各グループの文字サイズの比に基づいて、前記各グループの文字サイズを補正する、ことを特徴とする。
請求項5に記載の画像処理プログラムの発明は、文書画像を文章領域に分割する領域分割手段、前記領域分割手段により分割された各文章領域に含まれる文字を認識する文字認識手段、前記各文章領域を前記文字認識手段により認識される文字のサイズに応じてグループに分類する分類手段、前記文章領域毎に、該文章領域に含まれる文字からなる文章を所定の言語に翻訳する翻訳手段、前記文章領域毎に前記翻訳手段により翻訳される文章の文字サイズを、該文章領域のサイズ、行間、文字間、及び翻訳後に該文章領域に含まれる文章の文字数に基づいて算出する算出手段、及び、前記分類手段により同一のグループに分類された文章領域毎に、前記算出手段により算出された文字サイズが同一となるように各文字領域の文字サイズを補正する補正手段、としてコンピュータを機能させることを特徴とする。
請求項1の発明によれば、文書を翻訳した前後で各文章領域間の相対的な文字の大小関係を保つことができる。
請求項2の発明によれば、文章画像のレイアウトを維持したまま各文章領域間の相対的な文字の大小関係を保つことができる。
請求項3の発明によれば、各文章領域間の文字の大きさの順序を保つことができる。
請求項4の発明によれば、各文章領域間の文字の大きさの相対関係を明らかにすることができる。
請求項5の発明によれば、文書を翻訳した前後で各文章領域間の相対的な文字の大小関係を保つようにコンピュータを機能させることができる。
以下、本発明を実施するための最良の実施の形態(以下、実施形態という)を、図面に従って説明する。
図1には本実施形態に係る画像処理システム1のシステム構成図を示す。図1に示されるように、画像処理システム1は、画像処理装置10とスキャナ20とを含むシステムである。本実施形態に係る画像処理装置10とスキャナ20とは、共にUSBインターフェースを備え、両者を接続するUSBケーブルを介して相互にデータ通信を行う。
スキャナ20は、CCDカメラを具備し、文書画像をCCDカメラにより走査してスキャン画像を生成する画像走査装置である。スキャナ20は、生成したスキャン画像を、USBインターフェースを介して接続された画像処理装置10に送信する。
画像処理装置10は、スキャナ20から受信したスキャン画像に対して画像処理を行う装置である。画像処理装置10は、ハードウェアとして、少なくともCPU(中央処理装置)やメモリを備え、メモリに格納されるプログラムをCPUが順次実行することで処理を行うコンピュータである。そして、図1に示されるように、画像処理装置10は、機能的な構成として、画像取得部100、レイアウト解析部102、文字認識部104、文字サイズ測定部106、グループ分類部108、翻訳処理部110、文字サイズ決定部112、及び翻訳文書生成部114を備える。各部の機能は、コンピュータ読み取り可能な情報記憶媒体に格納された画像処理プログラムが、図示しない媒体読取装置を用いてコンピュータシステムたる画像処理装置10に読み込まれ、該画像処理装置10により実行されることで実現されるものとしてよい。なお、ここでは情報記憶媒体によって画像処理プログラムが画像処理装置10に供給されることとしたが、インターネット等のデータ通信ネットワークを介して遠隔地から画像処理プログラムが画像処理装置10にダウンロードされてよいのはもちろんである。以下、各部の詳細について説明する。
画像取得部100は、接続されるスキャナ20からスキャン画像を受信して取得する。スキャン画像の受信は、USBケーブルを介して行われる。
レイアウト解析部102は、画像取得部100により取得されたスキャン画像のレイアウトを解析する。レイアウト解析は、文書画像を構成するタイトル領域、本文領域、ヘッダ/フッタ領域、図領域、表領域等に分割することにより行われる。レイアウト解析には公知の手法を用いることとしてよい。そして、レイアウト解析部102より解析されたレイアウトの中から、テキストが含まれる領域(以下、文章領域とする)が処理対象として抽出される。文章領域の抽出は、文字を含まない領域、例えば図のみからなる領域を除外することで行うこととしてよい。
文字認識部104は、文章領域に含まれる文字をOCR処理により認識する。OCR処理は、文章領域を文字毎の領域に分割した上で、各分割領域を対象としたパターンマッチングを行い、そのマッチング結果に基づいて各領域に含まれる文字を決定することで行われる。
文字サイズ測定部106は、各文章領域に含まれる文字のサイズ(以下、文字サイズ)を測定する。文字サイズの測定値は、文章領域の少なくとも一部における文字認識部104により認識された文字のサイズから演算された平均値としてもよいし、文字サイズの最頻値としてもよい。文字サイズの測定は、全ての文章領域に対して行い、測定された文字サイズを各文章領域に関連づけてメモリに記憶する。
グループ分類部108は、文章領域毎に測定された文字サイズに応じて、文章領域をグループに分類する。グループの分類は、文字サイズが同一の文章領域を同一のグループに分類することとしてもよいし、文字サイズが予め定められた範囲内にある文章領域を同一のグループに分類することとしてもよい。本実施形態では、文字サイズが同一の文章領域を同一のグループとして分類することとする。
翻訳処理部110は、文章領域毎に含まれる文章を構文解析した後に、所定の言語(例えば英語)に翻訳する。ここでの文章領域に含まれる文章とは、文字認識部104による認識結果から得られたテキストデータである。翻訳処理には公知の手法を用いることとしてよい。
文字サイズ決定部112は、翻訳処理後の各文章領域の文字サイズを決定する。文字サイズ決定部112は、文字サイズ算出部112Aと、文字サイズ補正部112Bとを含む。
文字サイズ算出部112Aは、文章領域のサイズ、行間、文字間、及びその文章領域に含まれるテキストを翻訳して得られた翻訳文の文字数に基づいて、翻訳文がその文章領域に収まる文字サイズを算出する。文字サイズ算出部112Aは、各文章領域について上記の文字サイズ算出処理を行う。
文字サイズ補正部112Bは、翻訳文における各文章領域の文字サイズが、原文における各文章領域の文字サイズの相対的な関係を維持するように、翻訳文の文字サイズを補正する。文字サイズ補正部112Bにより行われる第1の補正は、文字サイズ算出部112Aにより算出された各文章領域の文字サイズが、分類されたグループ毎に同じサイズとなるようにする補正である。第1の補正は、例えば、同一のグループに含まれる文章領域のうち最小の文字サイズに他の文章領域の文字サイズを合わせることにより行う。こうしてグループ毎に文章領域に収まるように、グループ内の文字サイズを統一する。
そして、文字サイズ補正部112Bにより行われる第2の補正は、グループ間の文字サイズの順序が元の文書における順序と一致するようにする補正である。第2の補正は、グループ間の文字サイズの順序が元の文書における順序と一致するか否かを判断し、一致していないと判断される場合に、順序が合っていないグループ(以下、不整合グループ)の文字サイズをさらに補正することで行われる。第2の補正は、例えば、不整合グループについて記憶された元々の順序の前後に該当するグループの文字サイズの間に含まれる文字サイズを不整合グループの新たな文字サイズとするようにして行うこととしてよい。
また、第2の補正では、元々の各グループ間の文字サイズの比率をメモリに記憶しておき、翻訳後の各グループの文字サイズをメモリに記憶した文字サイズの比率に基づいてさらに補正することとしてもよい。具体的には、元々のグループの文字サイズが5,10,20ポイントであるとすると、これらの文字サイズの比率1:2:4をメモリに記憶し、中間のグループの翻訳後の文字サイズを、前後のグループとの文字サイズの距離が(2−1):(4−2)、すなわち、1:2となるように補正することとしてもよい。
翻訳文書生成部114は、レイアウト解析部102により解析されたレイアウトと、上記決定された各文章領域の翻訳文、及び各文章領域の文字サイズとに基づいて、翻訳文書データを生成する。翻訳文書データは、例えば、ワードプロセッサーのデータ形式や、PDLデータ等の予め定められたデータ形式に生成するようにしてもよい。
次に、図2乃至5を参照しつつ、画像処理装置10による原文の文書(スキャン画像)から翻訳文書を生成する処理の具体的な流れを説明する。図2は、翻訳文書の生成処理のフロー図である。
画像処理装置10は、スキャナ20にスキャン指示を送信する。スキャナ20は、画像処理装置10からスキャン指示を受信すると、セットされた文書画像をCCDカメラによりスキャンしてスキャン画像を生成する。スキャナ20は生成したスキャン画像を画像処理装置10に送信し、画像処理装置10は送信されたスキャン画像を受信して取得する(S101)。
画像処理装置10はスキャナ20から受信したスキャン画像のレイアウトを解析して(S102)、スキャン画像のレイアウトに含まれる文章領域を特定する。ここで具体例として、スキャン画像のレイアウトの一例を図3に示す。図3に示されるように、スキャン画像200は文章領域a−fを含むものである。
画像処理装置10は、解析されたレイアウトに含まれる各文章領域(a−f)について、それぞれの文章領域に含まれる文字を認識する文字認識処理を行う(S103)。
次に、画像処理装置10は、文章領域毎の文字サイズを測定する(S104)。文字サイズの測定は、例えば、文章領域毎にその文章領域から認識された文字の大きさの平均値や最頻値を算出することにより行うこととしてよい。そして、図3(A)の各文章領域の中に示されているのは、上記測定の結果得られた原文の文字サイズである。
文字サイズの測定処理がすべての文章領域について行われると、画像処理装置10は各文章領域について測定された文字サイズに基づいて、各文章領域をグループに分類する(S105)。本実施例においては文字サイズが同じ文章領域を同一のグループに分類することとし、図3(A)に示された例では、「a」、「b」、「c,f」、「d,e」がそれぞれ同一のグループとして分類される。そして、各グループを文字サイズの小さい順にG1(d,e),G2(a)、G3(c,f),G4(b)とし、各グループの文字サイズ、及びその文字サイズに応じた順序をメモリに記憶する。
画像処理装置10は、上記のグループ化処理を終えると、各文章領域について認識された文字からなる文章を所定の言語(例えば、英語や中国語等)に翻訳する処理を行う(S106)。
画像処理装置10は、上記の翻訳処理を終えると、翻訳後の文章(以下、翻訳文章)がそれぞれの文章領域に収まり、かつ、原文における各文書領域の相対的な文字サイズの関係が保たれるように、各文章領域の文字サイズを決定する(S107)。ここで、各文章領域の文字サイズの決定処理については、図4に示されるフロー図を参照しつつ説明する。
図4に示されるように、画像処理装置10は、まず文章領域毎にその文章領域のサイズと、翻訳文章の文字数とに基づいて文章領域に収まる文字サイズを演算する(S201)。図3(B)において、各文章領域の中に示されているのは、上記演算された文字サイズである。
画像処理装置10は、上記の文字サイズの演算処理を終えると、グループ毎にそのグループに属する文章領域の文字サイズのうち最小の文字サイズを、当該グループの文字サイズとして決定する(S202)。そして、グループに属する文章領域の文字サイズは全て、上記決定されたグループの文字サイズに暫定的に変更される。これが文字サイズの第1の補正である。図3(C)において各文章領域の中に示されているのは、上記第1の補正により変更された文字サイズである。
画像処理装置10は、全てのグループについて上記の文字サイズの決定処理を終えると、次に、上記決定された文字サイズにより、元の文書画像におけるグループ間の文字サイズの順序が保たれているか否かを判断する(S203)。ここで、グループ間の順序が保たれていないと判断する場合には(S203:N)、画像処理装置10はグループ間の順序を保つように各グループの文字サイズを算出し、その算出値を新たな文字サイズとする(S204)。これが文字サイズの第2の補正である。
ここで、図5を参照しつつ、グループの文字サイズの決定処理を具体的な例とともに説明する。図5には、上述した流れで各文章領域の文字サイズが決定される様子が示されている。すなわち、画像処理装置10は、まず文字サイズ毎にグループを形成し(A)、次に翻訳処理後にレイアウトに収まる文字サイズを算出し(B)、そしてグループ毎に文字サイズを統一(C)する。画像処理装置10はその上で、統一された文字サイズが元の文書における順序を保つものであるか否かを判断する。グループの順序が保たれているか否かの判断は、現在決定されている文字サイズが小さい順に、元の順序と比較することにより行う。
本実施形態における例では、「d,e」はグループG1であり元の順序と同一であるが、次に小さいグループ「c,f」はグループG3となっているため、原文とは文字サイズの順序が相違していると判断される。ここで、グループ間の順序を元に戻すために、翻訳後のグループのうち、現在の1番目のグループすなわちG1と、現在の2番目のグループすなわちG3との間に、本来2番目のグループであるべきG2が元々の各グループ間の文字サイズの相対関係を維持するようにG2の文字サイズを算出する。文字サイズの算出は、G1,G2,G3のそれぞれの元の文字サイズの比率に基づいて行われる。上記の例では、G1,G2,G3のそれぞれの元の文字サイズの比率8:10:12に基づくG1とG2,及びG2とG3との距離、すなわち、図5においてG1とG3とを1:1に分ける位置に対応する文字サイズを算出し、算出された値をG2の文字サイズとすることで行うこととしてもよい。算出された文字サイズが整数値とならない場合には、その値に最も近い整数値を新たな文字サイズとしてもよい。そして上記算出された文字サイズを新たなグループG2の文字サイズとすると、G3及びG4の順位は3,4となり、各文章領域の順序は元の状態と同一となる。
画像処理装置10は、上記の文字サイズの決定処理を終えると、処理S108に進み、上記決定された各文章領域の文字サイズにより翻訳文書を生成し(S108)、処理を終了する。
なお、本発明は上記の実施形態に限定されるものではない。
例えば、文字サイズ補正部112Bにおいてグループ間の文字サイズの間隔が所定の間隔よりも狭いか否かをさらに判断し、所定の間隔よりも狭いと判断する場合には、グループの文字サイズを補正するようにしてもよい。ここでの文字サイズの補正は、グループ間の文字サイズを均等な間隔に配置することで行ってもよい。
文字サイズ決定部112において、同じグループに分類された文章領域の翻訳後の文字サイズ分布に偏りがあり、かつ文字サイズが大きくかけ離れた要素が存在すると判断される場合には、文字サイズが大きく離れた要素をグループから除外して扱うこととしてもよい。
また、文字サイズ決定部112においてグループの文字サイズを合わせる際に、文字の縦横比率を変化させることで、最低文字サイズよりも大きな文字サイズを基準に文字サイズを合わせるようにしてもよい。
また、文章領域の翻訳後の文字間隔や行間を調整することにより、小さい文字サイズに抑えられた領域の文章の長さを調整するようにしてもよい。
本実施形態に係る画像処理システムのシステム構成図である。 翻訳文書の生成処理のフロー図である。 スキャン画像のレイアウトの一例を示す図である。 文章領域の文字サイズの決定処理のフロー図である。 グループの文字サイズの決定処理の具体例を説明する図である。
符号の説明
1 画像処理システム、10 画像処理装置、20 スキャナ、100 画像取得部、102 レイアウト解析部、104 文字認識部、106 文字サイズ測定部、108 グループ分類部、110 翻訳処理部、112 文字サイズ決定部、112A 文字サイズ算出部、112B 文字サイズ補正部、114 翻訳文書生成部、200 スキャン画像、a,b,c,d,e,f 文章領域。

Claims (5)

  1. 文書画像を文章領域に分割する領域分割手段と、
    前記領域分割手段により分割された各文章領域に含まれる文字を認識する文字認識手段と、
    前記各文章領域を前記文字認識手段により認識される文字のサイズに応じてグループに分類する分類手段と、
    前記文章領域毎に、該文章領域に含まれる文字からなる文章を所定の言語に翻訳する翻訳手段と、
    前記文章領域毎に前記翻訳手段により翻訳される文章の文字サイズを、該文章領域のサイズ、行間、文字間、及び翻訳後の文章の文字数に基づいて算出する算出手段と、
    前記分類手段により同一のグループに分類された文章領域毎に、前記算出手段により算出された文字サイズが同一となるように各文字領域の文字サイズを補正する補正手段と、
    を含むことを特徴とする画像処理装置。
  2. 前記補正手段は、前記分類手段により同一のグループに分類された文章領域のうち最小の文字サイズに合うように補正する、
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記分類手段により分類されるグループの文字サイズに基づいて、各グループの順序を決定する順序決定手段をさらに含み、
    前記補正手段は、前記順序決定手段により決定される各グループの順序が保たれるように、前記各文章領域の文字サイズをさらに補正する、
    ことを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記分類手段により分類される各グループの文字サイズの比を記憶する文字サイズ情報記憶手段をさらに含み、
    前記補正手段は、前記文字サイズ情報記憶手段に記憶される各グループの文字サイズの比に基づいて、前記各グループの文字サイズを補正する、
    ことを特徴とする請求項3に記載の画像処理装置。
  5. 文書画像を文章領域に分割する領域分割手段、
    前記領域分割手段により分割された各文章領域に含まれる文字を認識する文字認識手段、
    前記各文章領域を前記文字認識手段により認識される文字のサイズに応じてグループに分類する分類手段、
    前記文章領域毎に、該文章領域に含まれる文字からなる文章を所定の言語に翻訳する翻訳手段、
    前記文章領域毎に前記翻訳手段により翻訳される文章の文字サイズを、該文章領域のサイズ、行間、文字間、及び翻訳後に該文章領域に含まれる文章の文字数に基づいて算出する算出手段、及び、
    前記分類手段により同一のグループに分類された文章領域毎に、前記算出手段により算出された文字サイズが同一となるように各文字領域の文字サイズを補正する補正手段、
    としてコンピュータを機能させることを特徴とする画像処理プログラム。
JP2007147887A 2007-06-04 2007-06-04 画像処理装置、及び画像処理プログラム Pending JP2008299780A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007147887A JP2008299780A (ja) 2007-06-04 2007-06-04 画像処理装置、及び画像処理プログラム
US12/078,163 US8510093B2 (en) 2007-06-04 2008-03-27 Image processing apparatus, image processing method and computer readable medium
CN2008100945208A CN101320429B (zh) 2007-06-04 2008-04-18 图像处理装置和图像处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007147887A JP2008299780A (ja) 2007-06-04 2007-06-04 画像処理装置、及び画像処理プログラム

Publications (1)

Publication Number Publication Date
JP2008299780A true JP2008299780A (ja) 2008-12-11

Family

ID=40089220

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007147887A Pending JP2008299780A (ja) 2007-06-04 2007-06-04 画像処理装置、及び画像処理プログラム

Country Status (3)

Country Link
US (1) US8510093B2 (ja)
JP (1) JP2008299780A (ja)
CN (1) CN101320429B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012103872A (ja) * 2010-11-10 2012-05-31 Sharp Corp 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体
JP2017041039A (ja) * 2015-08-19 2017-02-23 日本電信電話株式会社 変換装置、変換方法、及びプログラム
JP2018152120A (ja) * 2018-05-31 2018-09-27 日本電信電話株式会社 変換装置、変換方法、及びプログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4821869B2 (ja) * 2009-03-18 2011-11-24 富士ゼロックス株式会社 文字認識装置、画像読取装置、およびプログラム
JP6303979B2 (ja) * 2014-10-29 2018-04-04 株式会社リコー 情報処理システム、情報処理装置、情報処理方法およびプログラム
JP6888410B2 (ja) * 2017-05-15 2021-06-16 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
CN110032700B (zh) * 2019-04-04 2021-09-07 网易(杭州)网络有限公司 信息发布控制方法、装置、存储介质及电子设备
US11393236B2 (en) * 2020-01-17 2022-07-19 Konica Minolta Business Solutions U.S.A., Inc. Approximating the layout of a paper document

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5517409A (en) * 1992-03-24 1996-05-14 Ricoh Company, Ltd. Image forming apparatus and method having efficient translation function
JPH05324720A (ja) 1992-05-19 1993-12-07 Ricoh Co Ltd 対訳画像形成装置
JPH0728829A (ja) 1993-07-12 1995-01-31 Casio Comput Co Ltd 翻訳支援装置
JP3213197B2 (ja) 1994-04-20 2001-10-02 キヤノン株式会社 画像処理装置およびその制御方法
JPH086948A (ja) 1994-06-22 1996-01-12 Matsushita Electric Ind Co Ltd 機械翻訳機
JP3636490B2 (ja) 1994-10-31 2005-04-06 キヤノン株式会社 画像処理装置および画像処理方法
TW347503B (en) * 1995-11-15 1998-12-11 Hitachi Ltd Character recognition translation system and voice recognition translation system
US6012073A (en) * 1996-10-21 2000-01-04 Corbis Corporation Method and system for displaying original documents and translations thereof
JPH11175527A (ja) * 1997-12-15 1999-07-02 Fujitsu Ltd 出力制御装置及び出力制御方法
JP4011268B2 (ja) * 2000-07-05 2007-11-21 株式会社アイアイエス 多言語翻訳システム
JP2002082987A (ja) * 2000-09-06 2002-03-22 Seiko Epson Corp 文書情報閲読支援装置、ディジタルコンテンツ作成システム、ディジタルコンテンツ配信システム及び記憶媒体
WO2002033607A1 (en) * 2000-10-16 2002-04-25 Iis Inc. Method for offering multilingual information translated in many languages through a communication network
FR2817429B1 (fr) * 2000-11-29 2003-01-31 Eastman Kodak Co Procede pour envoyer des images sur un terminal a faible capacite d'affichage
JP2003044461A (ja) 2001-07-30 2003-02-14 Seiko Epson Corp レイアウト装置、レイアウトプログラム及びレイアウト方法
US20030200078A1 (en) * 2002-04-19 2003-10-23 Huitao Luo System and method for language translation of character strings occurring in captured image data
US7299452B1 (en) * 2002-05-10 2007-11-20 Oracle International Corporation System and method for testing the compatibility of a computer application with a foreign character set
JP2006092027A (ja) * 2004-09-21 2006-04-06 Fuji Xerox Co Ltd 文字認識装置、文字認識方法および文字認識プログラム
JP2006252048A (ja) * 2005-03-09 2006-09-21 Fuji Xerox Co Ltd 翻訳装置、翻訳プログラムおよび翻訳方法
US7865353B2 (en) * 2005-03-22 2011-01-04 Fuji Xerox Co., Ltd. Translation device, image processing device, translation method, and recording medium
JP2006268150A (ja) 2005-03-22 2006-10-05 Fuji Xerox Co Ltd 翻訳を行う装置、方法、プログラムおよび該プログラムを記憶した記憶媒体
JP4311365B2 (ja) * 2005-03-25 2009-08-12 富士ゼロックス株式会社 文書処理装置およびプログラム
JP2006277103A (ja) * 2005-03-28 2006-10-12 Fuji Xerox Co Ltd 文書翻訳方法および文書翻訳装置
US20060245005A1 (en) * 2005-04-29 2006-11-02 Hall John M System for language translation of documents, and methods

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012103872A (ja) * 2010-11-10 2012-05-31 Sharp Corp 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体
US9110871B2 (en) 2010-11-10 2015-08-18 Sharp Kabushiki Kaisha Correcting a document character size based on the average value of each character size
JP2017041039A (ja) * 2015-08-19 2017-02-23 日本電信電話株式会社 変換装置、変換方法、及びプログラム
JP2018152120A (ja) * 2018-05-31 2018-09-27 日本電信電話株式会社 変換装置、変換方法、及びプログラム

Also Published As

Publication number Publication date
US8510093B2 (en) 2013-08-13
CN101320429A (zh) 2008-12-10
US20080300858A1 (en) 2008-12-04
CN101320429B (zh) 2013-04-24

Similar Documents

Publication Publication Date Title
US8170862B2 (en) Document image processing device and document image processing program for maintaining layout in translated documents
JP2008299780A (ja) 画像処理装置、及び画像処理プログラム
JP5511450B2 (ja) 画像処理装置、画像処理方法及びプログラム
US8452099B2 (en) Optical character recognition (OCR) engines having confidence values for text types
US9110871B2 (en) Correcting a document character size based on the average value of each character size
JP2006260274A (ja) 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
US8086040B2 (en) Text representation method and apparatus
JP2010062911A (ja) 画像処理装置、画像処理方法およびプログラム
JP2009053932A (ja) 文書画像処理装置、及び文書画像処理プログラム
JP2010009509A (ja) 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
CN111985465A (zh) 文本识别方法、装置、设备及存储介质
US20130314755A1 (en) Image capture device for extracting textual information
US8908970B2 (en) Textual information extraction method using multiple images
US10911636B2 (en) Image inclination angle detection apparatus that detects inclination angle of image with respect to document, image forming apparatus, and computer-readable non-transitory recording medium storing image inclination angle detection program
JP5126018B2 (ja) 文書画像処理装置及びプログラム
JP4998176B2 (ja) 翻訳装置及びプログラム
JP2015207903A (ja) 画像処理装置、画像形成装置およびプログラム
JP4872285B2 (ja) 文書管理装置、文書管理システムおよび文書管理方法
JP2009205209A (ja) 文書画像処理装置、及び文書画像処理プログラム
AU2021412659A1 (en) Architecture for digitalizing documents using multi-model deep learning, and document image processing program
JP6852359B2 (ja) 画像処理装置及びプログラム
JP2008294831A (ja) 画像歪み補正装置
JP4687558B2 (ja) 画像照合装置、画像照合方法及びプログラム
JP2023021595A (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム
JP2010146143A (ja) 文書処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090512

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090706

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090818