JP2011141749A - 文書画像生成装置、文書画像生成方法及びコンピュータプログラム - Google Patents

文書画像生成装置、文書画像生成方法及びコンピュータプログラム Download PDF

Info

Publication number
JP2011141749A
JP2011141749A JP2010002097A JP2010002097A JP2011141749A JP 2011141749 A JP2011141749 A JP 2011141749A JP 2010002097 A JP2010002097 A JP 2010002097A JP 2010002097 A JP2010002097 A JP 2010002097A JP 2011141749 A JP2011141749 A JP 2011141749A
Authority
JP
Japan
Prior art keywords
character
image
word
characters
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010002097A
Other languages
English (en)
Other versions
JP4999938B2 (ja
Inventor
Takeshi Kutsumi
毅 九津見
Ichiko Sada
いち子 佐田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2010002097A priority Critical patent/JP4999938B2/ja
Priority to US12/981,675 priority patent/US8958080B2/en
Priority to CN201110002438.XA priority patent/CN102141979B/zh
Publication of JP2011141749A publication Critical patent/JP2011141749A/ja
Application granted granted Critical
Publication of JP4999938B2 publication Critical patent/JP4999938B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】単語又は連語からなる語句の下方又は上方の行間にきれいに揃って見えるように補足説明を付与することが可能な文書画像生成装置、文書画像生成方法及びコンピュータプログラムを提供する。
【解決手段】ベースラインから下方へ突出する形状を有する文字「g,j,p,q,y 」及び上方へ離隔する文字「’,”」を夫々記憶した特殊文字(下)及び特殊文字(上)にない文字が含まれる単語「giant 」の場合、「g 」を除く文字の下端のY座標の平均値YBavを単語の下端のY座標とする。特殊文字(下)にある文字のみが含まれる単語「jpy 」の場合、各文字の下端のY座標の平均値YBav0に一定の値を加えた値YBavを単語の下端のY座標とする。特殊文字(上)にある文字のみが含まれる単語「””」の場合、各文字の上端のY座標の平均値YTavから一定の値を減じた値YBavを単語の下端のY座標とする。
【選択図】図13

Description

本発明は、画像データに基づく画像に含まれる単語又は連語からなる語句に補足説明を付与した補足説明付文書の画像を生成する文書画像生成装置、文書画像生成方法及びコンピュータプログラムに関する。
近年、原稿画像がスキャナで読み取られた画像データ、ウェブブラウザで表示すべく生成されたデータ等の電子データに基づく画像(原文書画像)に含まれる原文に対し、文字を認識して原文の行間に補足説明(以下、ルビという)を付与する技術が知られている。例えば、特許文献1では、原文の各行の行間領域に翻訳文を配置する方法が提案されている。特許文献1の段落0044から0046の記載によれば、行間領域の特定及び行間領域の縦幅(行方向と直交するY軸方向についての行間領域の長さ)の決定は行単位で行われる。
特開2009−53838号公報
しかしながら、ルビを各行の下方の行間に付与する場合、例えばアルファベットの小文字「g,j,p,q,y 」のように、文字を順次的に配列するための基準線(いわゆるベースライン)から突出して配置される部分があるときは、原文に含まれる文字の形状によって原文の下端のY座標が単語又は連語ごとに変動して見えることがある。これは、アルファベットの文字「’,”」のように文字全体が基準線から大きく離隔している場合も同様である。このような場合、ルビが付与される行間領域の上端のY座標を一律に行単位で統一していては、ルビが単語又は連語の下方の行間にきれいに揃っているように見えないという問題があった。
本発明は斯かる事情に鑑みてなされたものであり、その目的とするところは、単語又は連語からなる語句の下方又は上方の行間にきれいに揃っているように見える補足説明を付与することが可能な文書画像生成装置、文書画像生成方法及びコンピュータプログラムを提供することにある。
本発明に係る文書画像生成装置は、横書きの文章が含まれる原稿画像を表す画像データを受け付け、受け付けた画像データに基づく画像に含まれる語句に補足説明を付与した補足説明付文書の画像を生成する文書画像生成装置において、前記画像データに基づく画像に含まれる文字の前記画像における上下方向の位置を特定する文字位置特定手段と、前記語句中の文字について前記文字位置特定手段が特定した位置に基づいて、前記語句に対する補足説明を付与すべき上下方向の位置を決定する付与位置決定手段と、前記語句中の文字が特定の形状を有する文字と一致するか否かを判定する判定手段とを備え、前記付与位置決定手段は、前記判定手段による一致/不一致の判定結果に応じて異なる位置を決定するようにしてあることを特徴とする。
本発明に係る文書画像生成装置は、前記特定の形状は、文字を配列するための横方向の基準線から下方へ突出するもの(又は上方へ離隔するもの)であることを特徴とする。
本発明に係る文書画像生成装置は、前記判定手段が、全ての文字が一致しないと判定した場合、前記付与位置決定手段は、前記語句中の文字について前記文字位置特定手段が特定した上下方向の位置に係る平均的な位置に基づいて、前記補足説明を付与すべき位置を決定するようにしてあり、前記判定手段が、少なくとも1文字が一致すると判定した場合、前記付与位置決定手段は、前記補足説明を付与すべき位置を上方へ(又は下方へ)偏倚させて決定するようにしてあることを特徴とする。
本発明に係る文書画像生成装置は、前記補足説明は、語句に対する訳語、語句の読み、又は語句に対する注釈であることを特徴とする。
本発明に係る文書画像生成装置は、前記画像データに基づく画像及び前記補足説明をPDFファイル形式のデータに変換する手段を備えることを特徴とする。
本発明に係る文書画像生成方法は、横書きの文章が含まれる原稿画像を表す画像データを受け付け、受け付けた画像データに基づく画像に含まれる語句に補足説明を付与した補足説明付文書の画像を生成する文書画像生成方法において、前記画像データに基づく画像に含まれる文字の前記画像における上下方向の位置を特定するステップと、前記語句中の文字について特定した位置に基づいて、前記語句に対する補足説明を付与すべき上下方向の位置を決定する付与位置決定ステップと、前記語句中の文字が特定の形状を有する文字と一致するか否かを判定するステップとを含み、前記付与位置決定ステップは、一致/不一致の判定結果に応じて異なる位置を決定することを特徴とする。
本発明に係るコンピュータプログラムは、画像データを受け付けて文書処理及び画像処理するコンピュータに、画像データに基づく画像に含まれる横書きの語句に補足説明を付与した補足説明付文書の画像を生成させるコンピュータプログラムにおいて、コンピュータに、前記画像データに基づく画像に含まれる文字の前記画像における上下方向の位置を特定させるステップと、コンピュータに、前記語句中の文字について特定させた位置に基づいて、前記語句に対する補足説明を付与すべき上下方向の位置を決定させる付与位置決定ステップと、コンピュータに、前記語句中の文字が所定の形状を有する文字と一致するか否かを判定させるステップとを含み、前記付与位置決定ステップは、コンピュータに、一致/不一致の判定結果に応じて異なる位置を決定させることを特徴とする。
本発明にあっては、画像読取装置等から受け付けた画像データに基づく画像(原文書画像)において、原文書画像に含まれる文字の上下方向の位置を特定し、原文書画像に含まれる横書きの語句に対する補足説明を付与すべき上下方向の位置を語句中の文字の位置に基づいて決定し、語句中の文字が特定の形状を有する文字と一致するか否かに応じて、補足説明を付与すべき位置を異ならせる。
これにより、語句に付与すべき補足説明の位置が、標準的には、語句中の文字の位置から一律に決まる語句の位置に対して決定され、語句中の文字の一部又は全部が特定の形状を有する文字である場合は、前記語句の位置とは異なる位置に対して決定される。
本発明にあっては、文字を配列するための横方向の基準線(ベースライン)から下方へ突出するもの(又は上方へ離隔するもの)を特定の形状としてある。
これにより、語句に対する補足説明を付与すべき上下方向の位置を決定する際に、語句中の文字の形状によって文字の上下方向の位置が変化する度合いが最大限に反映される。
本発明にあっては、原文書画像に含まれる語句中に特定の形状、即ち文字を配列するための横方向の基準線から下方へ突出する形状(又は上方へ離隔する形状)を有する文字が1つも含まれていない場合は、語句に対する補足説明を付与すべき位置を、語句中の文字の上下方向に係る平均的な位置に基づいて決定する。
また、語句中に特定の形状を有する文字が1つでも含まれている場合は、補足説明を付与すべき位置を、語句中の文字の上下方向に係る平均的な位置に対して上方に(又は下方に)偏倚させて決定する。
本発明にあっては、補足説明は、語句に対する訳語、語句の読み、又は語句に対する注釈の何れにも適用される。
本発明にあっては、画像データに基づく画像(原文画像)及び補足説明を、PDFファイルの異なるレイヤに割り付けて重ね合わせる。
これにより、原文画像のレイアウトが保存され、原文の行間にルビがぴったりと揃うように付与される。
本発明によれば、原文書画像に含まれる語句に付与すべき補足説明の位置が、標準的には、語句中の文字の位置から決まる語句の位置に対して決定され、語句中の文字の一部又は全部が特定の形状を有する文字である場合は、前記語句の位置とは異なる位置に対して決定される。
従って、文字が特定の形状を有することにより変動して決まる語句の位置を補正することによって、補足説明を付与すべき位置を決定した場合は、語句の下方又は上方の行間にきれいに揃っているように見える補足説明を付与することが可能となる。
本発明に係る文書画像生成装置の内部構成を示すブロック図である。 原文書画像及び訳語付文書画像の例を示す模式図である。 文書画像生成装置が実行する処理の手順を示すフローチャートである。 文字認識により得られた文字データの例を示す概念図である。 ステップS14の訳語取得処理の手順を示すフローチャートである。 行データの内容例を示す概念図である。 テキストデータ及び改行データの内容例を示す概念図である。 訳語データの内容例を示す概念図である。 ステップS15の付属情報決定処理の手順を示すフローチャートである。 ステップS15の付属情報決定処理の手順を示すフローチャートである。 ステップS163の上下方向位置決定処理の手順を示すフローチャートである。 特殊文字データベースに記憶した文字コードが表す文字を示す説明図である。 特殊文字データベースに記憶した文字コードが表す文字が含まれている単語の例を示す説明図である。 訳語画像の例を示す模式図である。
以下、本発明をその実施の形態を示す図面に基づいて詳述する。
図1は、本発明に係る文書画像生成装置の内部構成を示すブロック図である。図中1は文書画像生成装置であり、文書画像生成装置1は、パーソナルコンピュータ(PC)又はサーバ装置等の汎用コンピュータを用いて構成されている。文書画像生成装置1は、演算を行うCPU11と、演算に伴って発生する一時的な情報を記憶するRAM12と、光ディスク又はメモリカード等の記録媒体2から情報を読み取るCD−ROMドライブ等のドライブ部13と、ハードディスク等の記憶部14とを備えている。
CPU11は、記録媒体2から本発明のコンピュータプログラム21をドライブ部13に読み取らせ、読み取ったコンピュータプログラム21を記憶部14に記憶させる。コンピュータプログラム21は必要に応じて記憶部14からRAM12へロードされ、ロードされたコンピュータプログラム21に基づいて、CPU11が文書画像生成装置1に必要な処理を実行する。
尚、コンピュータプログラム21は、図示しない外部のサーバ装置からインターネット又はLAN等の通信ネットワークを介して文書画像生成装置1へダウンロードされて、記憶部14に記憶される形態であってもよい。
記憶部14には、また、自然言語処理に必要なデータを記録した辞書データベース22及び特定の形状を有する文字のデータを記録した特殊文字データベース23を記憶している。辞書データベース22は、言語の文法、構文の出現頻度、及び単語の意味等を示す情報を記録している。特殊文字データベース23は、欧文フォントのベースラインから離隔した位置に文字の一部または全部を配してデザインされた文字を表す文字コードを記憶している。辞書データベース22及び特殊文字データベース23は、最初から記憶部14に記憶されている形態でもよく、また記録媒体2に記録されたものがドライブ部13で読み取られて記憶部14に記憶される形態でもよい。
文書画像生成装置1は、また、使用者が操作することによる各種の処理指示等の情報が入力されるキーボード又はポインティングデバイス等の入力部15と、各種の情報を表示する液晶ディスプレイ等の表示部16と、画像読取装置31及び画像形成装置32が接続されたインタフェース部17とを備えている。画像読取装置31は、フラットベッドスキャナ又はフィルムスキャナ等のスキャナであり、画像形成装置32は、インクジェットプリンタ又はレーザープリンタ等のプリンタである。
尚、画像読取装置31及び画像形成装置32は一体に構成されていてもよい。
画像読取装置31は、文書原稿に記録された原稿画像を光学的に読み取って画像データを生成し、生成した画像データを文書画像生成装置1へ送信する。インタフェース部17は、画像読取装置31から送信された画像データを受信し、CPU11から与えられた画像データを画像形成装置32へ送信する。画像形成装置32は、文書画像生成装置1から送信された画像データに基づいて画像を形成する。
CPU11は、本発明のコンピュータプログラム21をRAM12にロードし、ロードしたコンピュータプログラム21に従って、本発明の文書画像生成方法の処理を実行する。この文書画像生成方法では、画像読取装置31が文書原稿に記録された原稿画像を読み取ることによって生成した画像データを受け付け、受け付けた画像データに基づく原文書画像から、文章中の単語又は連語に対する訳語を付与した訳語付文書画像を生成する。
ここで連語とは、複数の単語から構成された独自の意味を有する語句であって、名詞句、動詞句、熟語、又は慣用句等が連語に相当する。
図2は、原文書画像及び訳語付文書画像の例を示す模式図であり、図2(a)は原文書画像の例を示し、図2(b)は訳語付文書画像の例を示す。図2(a)に示す原文書画像には、「X-ray crystallographic analysis also confirmed the molecular structure. 」という内容の文章が含まれている。本発明の文書画像生成方法では、図2(b)に示すように、連語「X-ray crystallographic analysis 」、並びに単語「confirmed 」、「molecular 」及び「structure 」に対する訳語を付与した訳語付文書画像を生成する。本実施の形態においては、図2に示すように、横書きの文章に対し、単語又は連語の下方の行間に訳語を配置する例について説明する。
図3は、文書画像生成装置1が実行する処理の手順を示すフローチャートである。CPU11は、RAM12にロードしたコンピュータプログラム21に従って、以下の処理を実行する。文書画像生成装置1は、まず、原稿画像が読み取られた画像データを受け付けて(S10)、画像データに基づく画像である原文書画像を取得する処理を行う(S11)。ステップS10,11では、画像読取装置31に文書原稿が載置された状態で、使用者が入力部15を操作することにより、入力部15が処理指示を受け付け、CPU11がインタフェース部17から画像読取装置31へ画像読取の指示を送信する。
画像読取装置31は、文書原稿に記録された原稿画像を光学的に読み取ることによって画像データを生成し、生成した画像データを文書画像生成装置1へ送信する。文書画像生成装置1は、画像読取装置31から送信された画像データをインタフェース部17で受信し、受信して受け付けた画像データをRAM12に記憶することによって、画像データに基づく原文書画像を取得する処理を実行する。なお、ステップS10,11に代えて、予め記憶部14に記憶してある画像データをRAM12に読み出すことによって、原文書画像を取得する処理を実行してもよい。またCPU11は、ステップS11の処理の際に、必要に応じて、解像度の調整、及び画像データのデータ形式の変換等の画像処理を行う。
CPU11は、次に、RAM12に記憶した原文書画像から、文字が含まれている文字領域を抽出し(S12)、抽出した文字領域に含まれる文字を認識する処理を実行する(S13)。ステップS13の処理では、CPU11は、例えば従来のOCR(Optical Character Recognition )技術を利用して、文字領域に含まれる文字の認識と、原文書画像中での文字位置の特定とを行う。
図4は、文字認識により得られた文字データの例を示す概念図である。図4に示す例は、図2に例を示した原文書画像から文字を認識した結果の一部を示している。文字認識により得られた文字データは、文字の認識結果と文字に係る付属情報とを含んでなる。文字認識処理では、行内にあるスペースも文字として認識するようになっており、文字データにはスペースを認識した認識結果と、その認識結果に係る付属情報とが含まれている。図4に示す文字データは、文字の夫々に順に付した文字番号、各文字の原文書画像における位置、文字領域に付した領域番号、各文字の行内での位置を示す行内位置情報、文字のサイズ、及び文字の内容を示す認識結果を含んでなる。各文字の位置は、原文書画像における文字の左端のX座標、上端のY座標、右端のX座標、及び下端のY座標で表されている。
図4には、原文書画像の下端左端を原点とし、座標をポイントの単位で表した例を示している。行内位置情報は、行頭を示す1、行末を示す2、行中を示す0、及び行頭かつ行末を示す3の何れかの数値で文字の行内での位置を示す。例えば、CPU11は、原文書画像中で文字の左側方に他の文字が無い場合に行内位置情報の1を生成し、文字の右側方に他の文字が無い場合に行内位置情報の2を生成し、右にも左にも他の文字がない場合に行内位置情報の3を生成する処理を行う。文字のサイズとしては、文字のフォントサイズをポイントの単位で示している。CPU11は、ステップS13の文字認識処理により取得した文字データを、RAM12に記憶させる。
CPU11は、次に、文字認識処理により取得した文字データから、認識した文字で構成される文章に含まれる単語又は連語に対する訳語を取得する訳語取得処理を実行する(S14)。
図5は、ステップS14の訳語取得処理の手順を示すフローチャートである。CPU11は、ステップS13で認識した文字データに基づいて、原文書画像に含まれる各行におけるテキストの内容を表す行データを生成する(S141)。ステップS141では、CPU11は、文字番号の順に行頭の文字から行末の文字まで文字を並べることによって一行分の行データを生成し、各行毎に行データを生成する。
図6は、行データの内容例を示す概念図である。図6に示す例は、図2に例を示した原文書画像から行データを生成した結果を示している。図6では、0を開始値として各行に順に付した行番号に関連付けて、各行におけるテキストの内容を表す行テキストが関連付けられている。行テキストの内容は、文字認識処理で認識された文字を表す文字コードからなる。
CPU11は、次に、生成した行データに基づき、原文書画像に含まれるテキストの内容を表すテキストデータ、及び原文書画像中での改行位置を記録した改行データを生成する(S142)。ステップS142では、CPU11は、各行の行テキストを行番号の順に連結することにより、テキストデータを生成する。このとき、原文書画像に記載されている言語が英語等のスペースで単語が区切られている言語である場合は、各行テキストの最後尾にスペースを挿入した上で行テキストを連結する。これは、スペースで単語が区切られている言語では、改行位置が単語の区切りになっていることが多いためである。日本語等のスペースで単語が区切られていない言語の場合は、CPU11は、スペースを挿入せずに行テキストを連結する。更にステップS142では、CPU11は、行テキストを連結する都度、連結により生成されたテキストデータの中でどの位置が原文書画像中での改行位置に対応した位置であるかを記録することにより、改行データを生成する。
図7は、テキストデータ及び改行データの内容例を示す概念図である。図7(a)はテキストデータの例を示し、図6の例に示す各行データを順に連結した内容となっている。図7ではテキストデータを2行に亘って表示しているが、データ上ではテキストデータは一行分のデータとなっている。ステップS142では、ステップS12で抽出した文字領域からステップS13で認識した文字が含まれるテキストデータが生成される。即ち、ステップS142で生成されるテキストデータには、一般的に複数の文が含まれる。
図7(b)は改行データの内容例を示しており、各行番号が示す行における改行位置を、0を開始値としてテキスト中の各文字に順に付した番号で示している。スペースで単語が区切られている言語の場合は、図7(b)に示すように、改行位置は、行テキストを連結する際に挿入したスペースの位置とすればよい。スペースで単語が区切られていない言語の場合は、各行末の文字の位置を改行位置とすればよい。改行位置で行データを連結したテキストデータを生成することにより、以降の処理で行う自然言語処理では、複数の行に亘って文単位で自然言語処理を実行することができ、効率的で高精度の自然言語処理を実行することが可能となる。例えば、複数の行に亘る連語については、行単位の自然言語処理では連語に含まれる各単語に対する訳語が得られるのみであるのに対し、複数の行に亘った自然言語処理では連語の訳語が得られる。
CPU11は、次に、生成したテキストデータに対して、自然言語処理を行うことにより、テキストデータが表す文章に含まれる単語及び連語の意味を推定する処理を行う(S143)。ステップS143では、CPU11は、辞書データベース22に記録されたデータに基づいて、文章の形態素解析、局所構文解析、及び品詞推定等の自然言語処理を行うことにより、文章に含まれる単語、及び複数の単語からなる連語を特定し、意味を推定する。CPU11は、次に、文章に含まれる単語及び連語の内、訳語付文書画像に付加するために訳語を取得すべき単語及び連語を選択する処理を行う(S144)。
辞書データベース22に記録してあるデータでは、単語及び連語の夫々について難易度を予め定めてあり、また記憶部14は、訳語付文書画像中に訳語を付与すべき単語及び連語の難易度を設定した設定情報を記憶している。設定情報の内容は、使用者が入力部15を操作することにより、使用者によって予め設定しておくことが可能である。ステップS144では、CPU11は、設定情報で定められた難易度以上の難易度が定められている単語及び連語を、訳語を取得すべき単語及び連語として選択する。ステップS144により、訳語を配置することが必要な単語及び連語が選択される。なお、ステップS144では、訳語を付与すべき単語及び連語の難易度を入力するための入力画面を表示部16に表示し、入力部15で難易度を入力される処理を行ってもよく、また、使用者が入力部15を操作することにより、訳語を取得すべき単語及び連語を逐一指定する処理を行ってもよい。
CPU11は、次に、選択した単語及び連語の夫々について、辞書データベース22から訳語を取得する処理を行う(S145)。訳語が複数存在する場合、CPU11は、ステップS143の自然言語処理により推定した意味に対応する訳語を取得する。CPU11は、単語又は連語と取得した訳語とを関連付けた訳語データを生成してRAM12に記憶させ、処理をメインの処理へ戻す。図8は、訳語データの内容例を示す概念図である。訳語を取得すべき連語として「X-ray crystallographic analysis 」が選択され、訳語を取得すべき単語として「confirmed 」、「molecular 」及び「structure 」が選択され、夫々に対して訳語が関連付けられている。
図3に戻って、CPU11は、取得した訳語の夫々について、訳語付文書画像に訳語を配置する際の位置及びサイズ等の訳語の配置状態を示す付属情報を決定する付属情報決定処理を実行する(S15)。図9及び図10は、ステップS15の付属情報決定処理の手順を示すフローチャートである。CPU11は、文字データに基づいて、原文書画像に含まれる各行の平均高さ及び行間の大きさ(縦幅)を算出する(S151)。ステップS151では、CPU11は、各行について文字データから行内の文字の上端及び下端のY座標を取得し、夫々の平均値を各行の上端及び下端の平均Y座標とする。そして、CPU11は、一の行の上端及び下端の平均Y座標の差を一の行の平均高さとし、一の行の下端の平均Y座標と次の行の上端の平均Y座標との差を行間の大きさとする。CPU11は、算出した平均高さ及び行間の大きさを各行に関連付けてRAM12に記憶させる。CPU11は、次に、取得した訳語の中から、一の訳語を選択する(S152)。
CPU11は、次に、訳語のフォントサイズを決定する処理を行う(S153)。ステップS153では、訳語を付与すべき単語又は連語が含まれる行と次の行との行間の大きさを取得し、取得した行間の大きさと、訳語を付与すべき単語又は連語のフォントサイズとを比較する。行間の大きさが、単語又は連語のフォントサイズの40%よりも小さい場合、CPU11は、訳語のフォントサイズを単語又は連語のフォントサイズの40%に決定する。行間の大きさが、単語又は連語のフォントサイズの80%よりも大きい場合、CPU11は、訳語のフォントサイズを単語又は連語のフォントサイズの80%に決定する。行間の大きさが、単語又は連語のフォントサイズの40%以上80%以下である場合、CPU11は、訳語のフォントサイズを行間と同じ大きさに決定する。尚、閾値として、40%又は80%とは異なる値を用いてもよい。
ステップS153のように、各単語又は連語別に訳語のフォントサイズを決定することにより、画像読取時に行が歪んで読み取られる等の原因により原文書画像中で行間の大きさに変動がある場合でも、各行の文字に重ならないように訳語を配置することができる。
尚、本発明では、各単語又は連語別に訳語のフォントサイズを決定するのではなく、行単位で訳語のフォントサイズを決定する処理を行ってもよい。この場合は、一行内で訳語のフォントサイズが変動することがないので、行間に訳語を配置した文書の美観が向上する。また本発明では、文字を認識した文字領域単位で統一した訳語のフォントサイズを定める処理を行ってもよい。この場合は、訳語のフォントサイズが段落等の文字領域内で統一され、行間に訳語を配置した文書の美観が向上する。
CPU11は、次に、単語又は連語に隣接する行間で、行に沿った方向の訳語を配置すべき開始位置、及び訳語を配置することが可能な終端位置を設定する処理を行う(S154)。ここで、開始位置は、訳語が配置されたときの訳語の先端の位置であり、終端位置は、訳語がこれ以降には配置されないように定めた限界の位置である。ステップS154では、CPU11は、訳語を付与すべき単語又は連語の最初の文字の左端のX座標を開始位置に設定し、単語又は連語の最後の文字の右端のX座標を終端位置に設定する。連語の途中に改行が存在する場合、CPU11は、行末を終端位置に設定する。
尚、本発明では、開始位置を、単語又は連語の最初の文字の左端から所定量だけずらした位置としてもよく、終端位置を、最後の文字の右端から所定量だけずらした位置としてもよい。
CPU11は、次に、訳語の文字数にフォントサイズを乗じることによって訳語の長さを計算し、終端位置の値から開始位置の値を引くことによって訳語を配置可能な配置スペースの長さを計算し、訳語の長さが配置スペースの長さよりも長いか否かを判定する(S155)。訳語の長さが配置スペースの長さよりも長い場合(S155:YES)、CPU11は、行中で、訳語を付与すべき単語又は連語の後方に隣接する位置に、他の訳語を行間に配置しない単語が存在するか否かを判定する(S156)。他の訳語を行間に配置しない単語が後方に存在する場合(S156:YES)、CPU11は、後方に隣接する単語を選択し、選択した単語の最後の文字の右端のX座標を終端位置に設定することにより、終端位置を修正し(S157)、処理をステップS155へ戻す。
ステップS156で、他の訳語を行間に配置しない単語が後方に存在しない場合(S156:NO)、CPU11は、行中で、訳語を付与すべき単語又は連語の前方に隣接する位置に、他の訳語を行間に配置しない単語が存在するか否かを判定する(S158)。他の訳語を行間に配置しない単語が前方に存在する場合(S158:YES)、CPU11は、前方に隣接する単語の中心位置よりも後方に位置する範囲内で、開始位置を前方にずらすことにより、開始位置を修正する(S159)。
ステップS159では、例えば、CPU11は、訳語の長さから配置スペースの長さを引いた値が、前方に隣接する単語の中心位置から開始位置までの距離より小さい場合に、訳語の長さから配置スペースの長さを引いた値だけ開始位置を前方にずらす処理を行う。また例えば、CPU11は、訳語の長さから配置スペースの長さを引いた値が、前方に隣接する単語の中心位置から開始位置までの距離以上である場合に、前方に隣接する単語の中心位置から所定量だけ後方にずれた位置を開始位置とする処理を行う。開始位置を前方にずらし過ぎた場合は、訳語と単語又は連語との対応関係が不明瞭となるので、ステップS159の処理では、開始位置を、前方に隣接する単語の中心位置よりも後方の位置とするのが適切である。
CPU11は、次に、訳語の長さが、開始位置を修正した後の配置スペースの長さよりも長いか否かを判定する(S160)。訳語の長さが配置スペースの長さよりも長い場合(S160:YES)、又はステップS158で他の訳語を行間に配置しない単語が前方に存在しない場合(S158:NO)、CPU11は、配置スペースの長さの値を訳語の長さの値で除することにより、訳語の長さの圧縮率を計算する(S161)。ステップS155で訳語の長さが配置スペースの長さ以下である場合(S155:NO)、又はステップS160で訳語の長さが配置スペースの長さ以下である場合(S160:NO)、CPU11は、訳語の長さの圧縮率を1に決定する(S162)。
ステップS155〜S162の処理により、訳語を付与すべき単語又は連語の長さよりも長い訳語については、他の訳語を配置すべき単語が前後に存在する場合に、訳語の長さが配置スペースに収まるように、訳語の長さが縮小される。訳語の長さを縮小することにより、訳語を配置したときに他の訳語に位置が重なることが無く、単語又は連語と訳語との対応関係が明確となる。また他の訳語を配置すべき単語が前後に存在しない場合には、訳語を付与すべき単語又は連語に隣接した行間の位置に加えて、前後の単語に隣接した行間の位置を含む位置に、訳語の行に沿った方向の配置位置が定められる。このため、訳語を配置する際には、前後の単語に隣接した部分にまで訳語が配置され、極端に訳語の長さが圧縮されることが無く、読み易い大きさで訳語を配置することができる。
ステップS161又はS162の処理が終了した場合、CPU11は、単語又は連語に隣接する行間で、行方向と直交する方向、即ち上下方向の訳語の配置位置を決定する上下方向位置決定処理を行う(S163)。
図11は、ステップS163の上下方向位置決定処理の手順を示すフローチャートである。図11の処理では、判定のためのワークメモリ1〜3をRAM12に確保してあり、CPU11は、処理に先立ってこれらのワークメモリ1〜3をクリアする(S1631)。
CPU11は、次に、訳語を付与すべき単語又は連語に含まれる文字のうち先頭から順に1文字を選択し(S1632)、選択した1文字の文字コードが、特殊文字DB1(図12参照)に記憶した文字コードと一致するか否かを判定する(S1633)。選択した1文字の文字コードが特殊文字DB1に記憶した文字コードと一致する場合(S1633:YES)、CPU11は、選択した1文字をワークメモリ1に記憶する(S1634)。ここでの文字の記憶は、文字コードの記憶による。
図12は、特殊文字データベース23に記憶した文字コードが表す文字を示す説明図である。特殊文字データベース23は、図12(a)及び12(b)に夫々示す特殊文字DB1及び特殊文字DB2からなる。特殊文字DB1には、アルファベットのフォントにおけるベースラインから下方に突出した部分を有する5つの文字「g,j,p,q,y 」の文字コードを記憶してあり、特殊文字DB2には、ベースラインから文字全体が上方に離隔した2つの文字「’,”」の文字コードを記憶してある。
訳語を付与すべき単語又は連語に含まれている文字の文字コードが特殊文字DB1の文字コードと一致する場合は、単語又は連語の下端がベースラインから下方に離隔しているように見える。また、単語又は連語に含まれている文字の文字コードが特殊文字DB2の文字コードと一致する場合は、逆に、単語又は連語の下端がベースラインから上方に離隔しているように見える。このような場合に、単語又は連語に訳語を配置すべき位置を上下方向に変更することにより、訳語が単語又は連語の下方の行間にぴったりと揃っているように見せることができる。
図13は、特殊文字データベース23に記憶した文字コードが表す文字が含まれている単語の例を示す説明図である。図13(a)に示す単語「giant 」には、特殊文字DB1の文字「g」と文字コードが一致する文字が含まれている。また、図13(b)に示す単語「jpy 」は、特殊文字DB1の文字コードが表す文字のみからなる。更に、図13(c)に示す単語「” ”」は、特殊文字DB2の文字コードが表す文字のみからなる。ここでは、単語「giant 」及び「jpy 」に含まれる文字の下端のY座標を、先頭の文字から順にYBn(n=1,2,3・・・)とする。また、単語「” ”」に含まれる文字の上端のY座標をYT1とする。
図11に戻って、選択した1文字の文字コードが特殊文字DB1に記憶した文字コードと一致しない場合(S1633:NO)、CPU11は、選択した1文字の文字コードが、特殊文字DB2に記憶した文字コードと一致するか否かを判定する(S1635)。特殊文字DB2に記憶した文字コードと一致する場合(S1635:YES)、CPU11は、選択した1文字をワークメモリ2に記憶し(S1634)、一致しない場合(S1635:NO)、CPU11は、選択した1文字をワークメモリ3に記憶する(S1637)。つまり、ワークメモリ3には、特殊文字DB1にも特殊文字DB2にもない文字が記憶される。
ステップS1634、S1636、又はS1637の処理を終えた場合、CPU11は、訳語を付与すべき単語又は連語に含まれる文字のうち、未選択の文字があるか否かを判定する(S1638)。未選択の文字がある場合(S1638:YES)、CPU11は、処理をステップS1632に戻す。未選択の文字がない場合(S1638:NO)、CPU11は、ワークメモリ3に記憶された文字があるか否かを判定する(S1639)。
ワークメモリ3内に文字がある場合(S1639:YES)、即ち、図13(a)に示す単語「giant 」について処理した場合のように、ワークメモリ3に特殊文字DB1にも特殊文字DB2にもない文字が記憶されている場合、CPU11は、訳語を付与すべき単語又は連語に含まれる文字のうち、特にワークメモリ3内の文字により、単語又は連語の下端位置を決定する(S1640)。単語「giant 」を例にした場合、CPU11は、文字「i,a,n,t 」夫々の下端のY座標YB2,YB3,YB4,YB5の値を取得し、これらの平均の値YBavを算出して単語「giant 」の下端のY座標とする。
尚、ここでY座標を算出する場合の平均値は、算術平均による値に限定されるものではなく、例えば、中央値のような値を用いてもよい。
ステップS1639で、ワークメモリ3内に文字がない場合(S1639:NO)、CPU11は、ワークメモリ1に記憶された文字があるか否かを判定する(S1639)。ワークメモリ1内に文字がある場合(S1641:YES)、即ち、図13(b)に示す単語「jpy 」について処理した場合のように、ワークメモリ3に特殊文字DB1にも特殊文字DB2にもない文字が記憶されておらず、ワークメモリ1に特殊文字DB1にある文字が記憶されている場合、CPU11は、訳語を付与すべき単語又は連語に含まれる文字のうち、特にワークメモリ1内の文字により、単語又は連語の下端位置を決定する(S1642)。単語「jpy 」を例にした場合、CPU11は、「j,p,y 」の文字夫々の下端のY座標YB1,YB2,YB3を取得してこれらの平均の値YBav0を算出し、値YBav0に対して、ステップS151で算出した各行の平均高さに一定値(例えば0.2)を掛けた値だけ上方にシフトさせた値YBavを、単語「jpy 」の下端のY座標とする。
ステップS1641で、ワークメモリ1内に文字がない場合(S1641:NO)、即ち、図13(c)に示す単語「” ”」について処理した場合のように、ワークメモリ1,3に文字が記憶されておらず、ワークメモリ2に特殊文字DB2にある文字が記憶されている場合、つまり、訳語を付与すべき単語又は連語に含まれる文字が全てワークメモリ2に記憶されている場合、CPU11は、ワークメモリ2内の文字により、単語又は連語の下端位置を決定する(S1643)。単語「” ”」を例にした場合、CPU11は、2つの文字「”,”」の上端のY座標YT1,YT2を取得してこれらの平均の値YTavを算出し、単語「” ”」が属する行の平均高さを値YTavから減算して得た値YBavを単語「” ”」の下端のY座標とする。
ステップS1640、S1642、又はS1643の処理を終えた場合、CPU11は、単語又は連語に付与すべき訳語の下端位置を決定し(S1644)、処理を付属情報決定処理に戻す。ステップS1644では、CPU11は、Y座標が値YBavである位置から、ステップS153で決定した訳語のフォントサイズだけ下方へずらした位置を、訳語の下端位置、即ち上下方向の訳語の配置位置と決定する。ステップS163の上下方向位置決定処理により、訳語付の文書中で訳語を配置する位置が、文書中の単語又は連語に隣接する行間に定まる。またステップS153〜S163の処理により、ステップS152で選択した訳語のフォントサイズ、配置位置、及び圧縮率を示す付属情報が決定される。
本発明では、ステップS1644で算出した訳語の下端位置から、更に下方へ一定ポイント数だけずらせた位置を訳語の配置位置と決定してもよい。この場合は、訳語と単語又は連語との間に一定の隙間が確保されて読み易さが向上する。また本発明では、行の位置と傾きとを検出し、行の傾きに沿って訳語の配置位置を決定する処理を行ってもよい。この場合は、画像読取時に行が歪んで読み取られる等の原因により行が傾いている状態の原文書画像についても、行に沿って訳語を配置することが可能となる。
ステップS163の処理が終了した場合、CPU11は、取得した訳語のうち、まだ付属情報を決定していない訳語があるか否かを判定する(S165)。まだ付属情報を決定していない訳語がある場合(S165:YES)、CPU11は、処理をステップS152へ戻して、まだ付属情報を決定していない訳語の中から一の訳語を選択する。まだ付属情報を決定していない訳語が無い場合(S165:NO)、CPU11は、訳語データに含まれる訳語に、決定した付属情報を関連付けた上で、訳語データをRAM12に記憶させ、処理をメインの処理へ戻す。
ステップS13〜S15の処理は、ステップS12で抽出した文字領域の夫々について実行される。
CPU11は、次に、原文書画像と同一の大きさの画像中に、付属情報で定められた配置状態で夫々の訳語を配置して、訳語画像を生成する処理を行う(S17)。ステップS17では、CPU11は、原文書画像と同一の大きさの画像中に、訳語データに含まれる夫々の訳語を、付属情報が示すサイズで付属情報が示す配置位置に配置して、訳語画像を生成する。具体的には、付属情報が示すフォントサイズで生成した訳語の長さを適宜の圧縮率で圧縮し、訳語の先頭文字の左端は開始位置となり、訳語の下端は上下方向の配置位置となるように、夫々の訳語を配置した画像を生成する。更に、ステップS17では、CPU11は、訳語画像中に、訳語を取得した連語に対して下線に相当する線を配置する。更に、ステップS17では、CPU11は、訳語画像中に配置した夫々の文字に当該文字を示すテキストデータを関連付ける。またステップS17では、生成する訳語画像中の訳語及び線以外の部分は透明にしておく。
図14は、訳語画像の例を示す模式図である。図14に示す例は、図2に例を示した原文書画像中から生成した訳語画像を示している。図14では、原文書画像中の単語及び連語に対する訳語が配置されており、更に、原文書画像中の連語「X-ray crystallographic analysis 」に対して下線に相当する線が配置されている。
CPU11は、次に、原文書画像と同一の大きさの透明画像中に、原文書画像中の各文字の位置に相当する位置に各文字を示すテキストデータを関連付けた透明テキスト画像を生成し、原文書画像に透明テキスト画像と訳語画像とを重ねることによって、訳語付文書画像を生成する(S18)。例えば、ステップS18では、PDF(Portable Document Format)形式の画像で訳語付文書画像を生成することとし、CPU11は、原文書画像を第1の画像レイヤ、透明テキスト画像を第2の画像レイヤ、訳語画像を第3の画像レイヤとして重ねることにより、PDF形式の訳語付文書画像を生成する。図2(b)に示す訳語付文書画像は、図2(a)に示す原文書画像に図12に示す訳語画像を重ねることにより生成した訳語付文書画像である。原文書画像に透明テキスト画像と訳語画像とを重ねた訳語付文書画像を生成することにより、文書の内容及び訳語の内容を訳語付文書画像から検索することが可能となり、また文書の内容及び訳語の内容をコピーすることも容易となる。
CPU11は、次に、訳語付文書画像を表す画像データを、インタフェース部17から画像形成装置32へ送信し、画像形成装置32に画像データに基づいて訳語付文書画像を形成させる処理を行い(S19)、本発明の文書画像生成の処理を終了する。なお、本発明では、ステップS19で訳語付文書画像を形成する処理を行わずに、表示部16で表示するか、又は訳語付文書画像を表す画像データを記憶部14に記憶させる処理を行ってもよい。
以上の処理により、図2(b)に示す如き訳語付文書画像が生成される。原文書画像に含まれる単語又は連語からなる語句に対する訳語が、単語又は連語に隣接する行間に配置されており、訳語付文書を読む使用者は、訳語を利用して文書の内容を理解することができる。
また、語句中の文字が、特殊文字データベースに記憶された特定の形状を有する文字と一致するか否かに応じて補足説明を付与すべき上下方向の位置を異ならせる。これにより。語句に付与すべき補足説明の位置が、標準的には、語句中の文字の上下方向の位置から決まる語句の位置に対して決定され、語句中の文字の一部又は全部が特定の形状を有する文字である場合は、前記語句の位置とは異なる位置に対して決定される。
従って、文字が特定の形状を有することにより変動して決まる語句の位置を補正することによって、補足説明を付与すべき位置を決定した場合は、語句の下方の行間にきれいに揃っているように見える補足説明を付与することが可能となる。
また、特殊文字データベースには、ベースラインから下方へ突出する形状を有する文字「g,j,p,q,y 」(又は上方へ離隔する文字「’,”」)を記憶してあるため、補足説明を付与すべき位置を決定する際に、語句中の文字の形状により文字の上下方向の位置が変化する度合いを最大限に反映させて、語句の位置を適正に補正することが可能となる。つまり、語句中の全ての文字が特殊文字データベースに記憶された文字である場合、上下方向の平均的な文字の位置から語句の位置が下方に(又は上方に)偏倚しているように決まることを考慮して、補足説明を付与すべき位置を平均的な位置より上方に(又は下方に)決定する。そして、語句中の文字の少なくとも1つが特殊文字データベースに記憶されていない文字である場合は、特殊文字データベースに記憶されている文字を除いた文字の上下方向の平均的な位置を語句の位置として、補足説明を付与すべき位置を決定する。
換言すれば、語句中に特殊文字データベースに記憶された文字が1つも含まれていない場合は、補足説明を付与すべき位置を、語句中の文字の上下方向に係る平均的な位置に基づいて決定する。また、語句中に特殊文字データベースに記憶された文字が1つでも含まれている場合は、補足説明を付与すべき位置を、語句中の文字の上下方向に係る平均的な位置に対して上方に(又は下方に)偏倚させて決定する。
従って、補足説明を付与する位置が、単語又は連語からなる語句の下端から不自然に離隔しないように補正することが可能となる。
更にまた、訳語付文書画像は、原文書画像に訳語画像を重ねることによって生成されるので、文書に含まれる文字のサイズ及び位置は不変であり、文書のレイアウトは維持される。従って、原文書と訳語付の文書とを比較することが容易であり、文書の内容を正しく理解することが容易となる。また訳語付文書画像では、文章を翻訳した訳文を生成するのではなく、単語又は連語に対する訳語を付加しているので、原文書と訳語との対応関係は明らかであり、把握し易い。また原文書での単語の綴り間違い、文字認識の処理における誤認識、又は自然言語処理の不備による誤訳等があった場合でも、誤った訳語が付加されるだけであって、前後の文脈から訳語が誤っていることを推測することは容易であり、使用者が文書の内容を正しく理解することを大きく妨げることはない。また本発明では、原文書に対する加工を行わないので、文字認識の処理における誤認識等の原因により誤った内容の原文書を生成することが無く、使用者は正しく文書の内容を理解することができる。
尚、本実施の形態にあっては、文書画像生成装置1は、画像読取装置31及び画像形成装置32が接続された汎用コンピュータであるが、これに限定されるものではなく、文書画像生成装置1は、画像読取機能を備えたスキャナ又は複合機等の画像処理装置であってもよい。また本実施の形態にあっては、文書画像生成装置1が、コンピュータプログラム21に基づいて本発明の文書画像生成方法を実行する形態を示したが、これに限るものではなく、文書画像生成装置1は、本発明の文書画像生成方法に係る処理の一部又は全部を実行する専用の情報処理回路を備えて本発明に係る処理を実行する形態であってもよい。
また本実施の形態にあっては、画像読取装置31で生成した原文書画像に対して本発明に係る処理を実行する形態を示したが、文書画像生成装置1は、その他の方法で得られた原文書画像に対して本発明に係る処理を実行する形態であってもよい。例えば、文書画像生成装置1は、ファクシミリ通信又は電子メール等により外部から送信された画像データを受信し、受信した画像データに対して文書画像生成方法の処理を実行する形態であってもよい。また例えば、文書画像生成装置1は、インタフェース部17に撮影装置を接続してあり、撮影装置が原稿画像を撮影することによって取得した原文書画像に対して文書画像生成方法の処理を実行する形態であってもよい。
また例えば、文書画像生成装置1は、インタフェース部17に代えて、外部のウェブサーバ装置が接続されている通信ネットワークに接続された通信部を備えてあり、ウェブサーバ装置から送信されたウェブページ用のデータを通信部が受信し、受信したデータに基づく画像データに対して文書画像生成方法の処理を実行する形態であってもよい。具体的には、受信したデータに基づいて、ウェブページである原文書画像を表す画像データを生成し、生成した画像データとウェブページ用のデータとをRAM12に記憶させる。この場合、ウェブページ用のデータが画像データ等のテキストデータを抽出できるデータであるときは、RAM12に記憶した画像データに基づく原文書画像から認識した文字を、RAM12に記憶したウェブページ用のデータから抽出したテキストデータに合わせるようにすればよい。本発明に係る処理を実行して生成した訳語付文書画像は、表示部16に表示してもよいし、インタフェース部17から画像形成装置32へ送信してもよい。
更にまた、本実施の形態にあっては、ルビ(補足説明)として単語又は連語に対する訳語を取得し、訳語を行間に配置した訳語付文書画像を生成する形態を示したが、本発明に係るルビは訳語に限るものではない。例えば、本発明は、ルビとして、単語又は連語の読みを読み仮名、発音記号又はピンイン記号等で説明した読み情報を、単語又は連語に隣接した行間に配置する形態であってもよい。この形態の場合は、文書を読む使用者は、文書中の単語又は連語の読みを確認することができる。また例えば、本発明は、ルビとして、単語又は連語の意味、同義語又は由来等を説明した注釈を、単語又は連語に隣接した行間に配置する形態であってもよい。この形態の場合は、文書を読む使用者は、たとえ母国語であっても難解な言葉又は専門用語等を理解することができる。これらの形態では、文書画像生成装置1は、単語又は連語に関連づけた読み情報又は注釈を辞書データベース22に予め記録しておき、辞書データベース22から読み情報又は注釈を取得する処理を行う。
更にまた、本実施の形態にあっては、横書きの語句の下方の行間に補足説明を付与しているが、語句の上方の行間に補足説明を付与してもよいし、本発明を縦書きの文章に対して適用してもよい。例えば、日本語による縦書きの文書に対して本発明の処理を実行する形態の場合は、訳語は単語又は連語に隣接する右側方の行間に配置すればよい。
更にまた、本実施の形態にあっては、文書画像生成装置1は辞書データベース22を内部の記憶部14に記録してある形態を示したが、これに限るものではなく、本発明の文書画像生成装置は、外部の辞書データベースを用いて本発明に係る処理を実行する形態であってもよい。例えば、文書画像生成装置の外部のサーバ装置に辞書データベースを記憶しておき、文書画像生成装置は、必要に応じて外部の辞書データベースから必要なデータを読み出すことによって本発明に係る処理を実行してもよい。
1 文書画像生成装置
11 CPU
12 RAM
14 記憶部
16 表示部
17 インタフェース部
2 記録媒体
21 コンピュータプログラム
22 辞書データベース
23 特殊文字データベース23
31 画像読取装置
32 画像形成装置

Claims (7)

  1. 横書きの文章が含まれる原稿画像を表す画像データを受け付け、受け付けた画像データに基づく画像に含まれる語句に補足説明を付与した補足説明付文書の画像を生成する文書画像生成装置において、
    前記画像データに基づく画像に含まれる文字の前記画像における上下方向の位置を特定する文字位置特定手段と、
    前記語句中の文字について前記文字位置特定手段が特定した位置に基づいて、前記語句に対する補足説明を付与すべき上下方向の位置を決定する付与位置決定手段と、
    前記語句中の文字が特定の形状を有する文字と一致するか否かを判定する判定手段とを備え、
    前記付与位置決定手段は、前記判定手段による一致/不一致の判定結果に応じて異なる位置を決定するようにしてあること
    を特徴とする文書画像生成装置。
  2. 前記特定の形状は、文字を配列するための横方向の基準線から下方へ突出するもの(又は上方へ離隔するもの)であることを特徴とする請求項1に記載の文書画像生成装置。
  3. 前記判定手段が、全ての文字が一致しないと判定した場合、前記付与位置決定手段は、前記語句中の文字について前記文字位置特定手段が特定した上下方向の位置に係る平均的な位置に基づいて、前記補足説明を付与すべき位置を決定するようにしてあり、
    前記判定手段が、少なくとも1文字が一致すると判定した場合、前記付与位置決定手段は、前記補足説明を付与すべき位置を上方へ(又は下方へ)偏倚させて決定するようにしてあること
    を特徴とする請求項2に記載の文書画像生成装置。
  4. 前記補足説明は、語句に対する訳語、語句の読み、又は語句に対する注釈であることを特徴とする請求項1から3の何れか1項に記載の文書画像生成装置。
  5. 前記画像データに基づく画像及び前記補足説明をPDFファイル形式のデータに変換する手段を備えることを特徴とする請求項1から4の何れか1項に記載の文書画像生成装置。
  6. 横書きの文章が含まれる原稿画像を表す画像データを受け付け、受け付けた画像データに基づく画像に含まれる語句に補足説明を付与した補足説明付文書の画像を生成する文書画像生成方法において、
    前記画像データに基づく画像に含まれる文字の前記画像における上下方向の位置を特定するステップと、
    前記語句中の文字について特定した位置に基づいて、前記語句に対する補足説明を付与すべき上下方向の位置を決定する付与位置決定ステップと、
    前記語句中の文字が特定の形状を有する文字と一致するか否かを判定するステップとを含み、
    前記付与位置決定ステップは、一致/不一致の判定結果に応じて異なる位置を決定すること
    を特徴とする文書画像生成方法。
  7. 画像データを受け付けて文書処理及び画像処理するコンピュータに、画像データに基づく画像に含まれる横書きの語句に補足説明を付与した補足説明付文書の画像を生成させるコンピュータプログラムにおいて、
    コンピュータに、前記画像データに基づく画像に含まれる文字の前記画像における上下方向の位置を特定させるステップと、
    コンピュータに、前記語句中の文字について特定させた位置に基づいて、前記語句に対する補足説明を付与すべき上下方向の位置を決定させる付与位置決定ステップと、
    コンピュータに、前記語句中の文字が所定の形状を有する文字と一致するか否かを判定させるステップとを含み、
    前記付与位置決定ステップは、コンピュータに、一致/不一致の判定結果に応じて異なる位置を決定させること
    を特徴とするコンピュータプログラム。
JP2010002097A 2010-01-07 2010-01-07 文書画像生成装置、文書画像生成方法及びコンピュータプログラム Active JP4999938B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010002097A JP4999938B2 (ja) 2010-01-07 2010-01-07 文書画像生成装置、文書画像生成方法及びコンピュータプログラム
US12/981,675 US8958080B2 (en) 2010-01-07 2010-12-30 Document image generating apparatus, document image generating method and computer program, with adjustment of ruby-added image
CN201110002438.XA CN102141979B (zh) 2010-01-07 2011-01-07 文档图像生成装置、文档图像生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010002097A JP4999938B2 (ja) 2010-01-07 2010-01-07 文書画像生成装置、文書画像生成方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2011141749A true JP2011141749A (ja) 2011-07-21
JP4999938B2 JP4999938B2 (ja) 2012-08-15

Family

ID=44224553

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010002097A Active JP4999938B2 (ja) 2010-01-07 2010-01-07 文書画像生成装置、文書画像生成方法及びコンピュータプログラム

Country Status (3)

Country Link
US (1) US8958080B2 (ja)
JP (1) JP4999938B2 (ja)
CN (1) CN102141979B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013097446A (ja) * 2011-10-28 2013-05-20 Sharp Corp 情報出力装置、情報出力方法、及びコンピュータプログラム
JP2014203339A (ja) * 2013-04-08 2014-10-27 京セラドキュメントソリューションズ株式会社 画像処理装置、画像形成装置、及び画像処理プログラム
JP2015172792A (ja) * 2014-03-11 2015-10-01 株式会社リコー 翻訳システム、情報処理装置、情報処理方法およびプログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10275445B2 (en) * 2013-03-19 2019-04-30 Rakuten, Inc. Document processing device, document processing method, program, and information storage medium
JP5449633B1 (ja) * 2013-03-22 2014-03-19 パナソニック株式会社 広告翻訳装置、広告表示装置、および広告翻訳方法
CN103365835B (zh) * 2013-05-29 2018-02-09 苏州市职业大学 包含松散结构的汉语多词表达敏感特征的抽取方法
CN109034163A (zh) * 2018-07-19 2018-12-18 商洛学院 英语翻译系统
JP7490472B2 (ja) * 2020-07-06 2024-05-27 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06301713A (ja) * 1993-04-13 1994-10-28 Ricoh Co Ltd 対訳表示方法及び文書表示装置並びにディジタル複写装置
JP2003165262A (ja) * 2001-11-29 2003-06-10 Fuji Xerox Co Ltd 描画装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2042780B (en) * 1979-02-12 1982-07-14 Philips Electronic Associated Alphanumeric character display
CA1223366A (en) * 1984-09-27 1987-06-23 Abijah S. Fox System for automatic adjustment and editing of handwritten text images
JPH0554069A (ja) 1991-08-22 1993-03-05 Ricoh Co Ltd デジタル翻訳装置
CN1265307C (zh) * 2002-12-12 2006-07-19 华为技术有限公司 语言本地化中特征字符串的提取与替换方法
JP3899336B2 (ja) * 2003-09-16 2007-03-28 シャープ株式会社 文書処理装置、文書処理方法、文書処理プログラム、および、記録媒体
US7747629B2 (en) * 2006-08-23 2010-06-29 International Business Machines Corporation System and method for positional representation of content for efficient indexing, search, retrieval, and compression
JP4483909B2 (ja) * 2007-08-24 2010-06-16 富士ゼロックス株式会社 翻訳装置及びプログラム
JP2009294788A (ja) 2008-06-03 2009-12-17 Ricoh Co Ltd 情報処理装置、情報処理方法、制御プログラム及び記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06301713A (ja) * 1993-04-13 1994-10-28 Ricoh Co Ltd 対訳表示方法及び文書表示装置並びにディジタル複写装置
JP2003165262A (ja) * 2001-11-29 2003-06-10 Fuji Xerox Co Ltd 描画装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013097446A (ja) * 2011-10-28 2013-05-20 Sharp Corp 情報出力装置、情報出力方法、及びコンピュータプログラム
JP2014203339A (ja) * 2013-04-08 2014-10-27 京セラドキュメントソリューションズ株式会社 画像処理装置、画像形成装置、及び画像処理プログラム
JP2015172792A (ja) * 2014-03-11 2015-10-01 株式会社リコー 翻訳システム、情報処理装置、情報処理方法およびプログラム

Also Published As

Publication number Publication date
US8958080B2 (en) 2015-02-17
US20110164291A1 (en) 2011-07-07
CN102141979A (zh) 2011-08-03
CN102141979B (zh) 2014-01-29
JP4999938B2 (ja) 2012-08-15

Similar Documents

Publication Publication Date Title
JP4948586B2 (ja) 文書画像生成装置、文書画像生成方法、コンピュータプログラム及び記録媒体
JP4999938B2 (ja) 文書画像生成装置、文書画像生成方法及びコンピュータプログラム
Piotrowski Natural language processing for historical texts
US7783472B2 (en) Document translation method and document translation device
US8588528B2 (en) Systems and methods for displaying scanned images with overlaid text
US20060285746A1 (en) Computer assisted document analysis
US20060217958A1 (en) Electronic device and recording medium
JP5372110B2 (ja) 情報出力装置、情報出力方法、及びコンピュータプログラム
JP2010009509A (ja) 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
JP5528420B2 (ja) 翻訳装置、翻訳方法及びコンピュータプログラム
US20240104290A1 (en) Device dependent rendering of pdf content including multiple articles and a table of contents
JP5604276B2 (ja) 文書画像生成装置および文書画像生成方法
JP7315420B2 (ja) テキストの適合および修正の方法
JP2006252164A (ja) 中国語文書処理装置
US11842141B2 (en) Device dependent rendering of PDF content
JP2007034425A (ja) 翻訳装置、プログラム及び記憶媒体
JP3206600B2 (ja) 文書生成装置
JP2024071936A (ja) 情報処理装置、情報処理方法、及びプログラム
JP2014219909A (ja) 文書画像生成装置、文書画像生成方法、及びコンピュータプログラム
JP2023052750A (ja) 自動翻訳装置及び自動翻訳プログラム
TW202207184A (zh) 用於電子裝置之點字轉換方法及其電腦程式產品
JP2015076030A (ja) 文書画像生成装置、文書画像生成方法、及びコンピュータプログラム
JPH04107679A (ja) 機械翻訳装置
Piotrowski Acquiring Historical Texts
JPH06318272A (ja) 文書認識装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111108

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120424

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120515

R150 Certificate of patent or registration of utility model

Ref document number: 4999938

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150525

Year of fee payment: 3