JP5144736B2 - 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体 - Google Patents

文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体 Download PDF

Info

Publication number
JP5144736B2
JP5144736B2 JP2010251375A JP2010251375A JP5144736B2 JP 5144736 B2 JP5144736 B2 JP 5144736B2 JP 2010251375 A JP2010251375 A JP 2010251375A JP 2010251375 A JP2010251375 A JP 2010251375A JP 5144736 B2 JP5144736 B2 JP 5144736B2
Authority
JP
Japan
Prior art keywords
character
line
character size
average value
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010251375A
Other languages
English (en)
Other versions
JP2012103872A (ja
Inventor
いち子 佐田
毅 九津見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2010251375A priority Critical patent/JP5144736B2/ja
Priority to US13/292,125 priority patent/US9110871B2/en
Priority to CN201110354797.1A priority patent/CN102592299B/zh
Publication of JP2012103872A publication Critical patent/JP2012103872A/ja
Application granted granted Critical
Publication of JP5144736B2 publication Critical patent/JP5144736B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Description

文書に含まれる文字にルビ状の補足説明文字列を付すことにより補足説明付き文書を生成する文書生成装置、文書生成方法、その文書生成方法をコンピュータに実行させることを特徴とするコンピュータプログラム、および、そのコンピュータプログラムを記録したことを特徴とするコンピュータが読み取り可能な記録媒体に関する。
従来、文字を含む原文書画像を文字認識し、認識された文字をテキスト化する文字認識技術が広く用いられている。また、第1の言語の文字列を第2の言語の文字列に翻訳する自動翻訳技術も用いられている。さらには、文字認識技術と自動翻訳技術とを組み合わせた技術も実用化されている。この技術では、紙文書をスキャンして得られた文書画像に対して文字認識を行うとともに、認識された文字をテキスト化し、そのテキストの翻訳文を原文とともに表示する画像を生成する。さらに、原文とともに翻訳文を表示するにあたり、原文の文字サイズに応じて翻訳文の文字サイズを決定する技術も提案されている。
例えば、特許文献1に開示された文書画像処理装置は、文書領域、画像領域等の割り付けを解析して、文字列を含む1又は複数の文章領域を設定し、各文章領域に含まれる文字列を認識し、認識された文字列の翻訳を行う。そして、この文書画像処理装置は、各文章領域の文字サイズ及び行間隔に基づいて、各文章領域を1又は複数のグループに分類し、このグループごとに翻訳文字列の文字サイズを決定し、決定された文字サイズの翻訳文字列を配置して翻訳文追記画像を生成する。
ここで、文書画像処理装置は、翻訳文字列の文字サイズを、原文の文字サイズと同じサイズに設定する。このサイズで翻訳文字列を原文の行間に配置できない場合は、文書画像処理装置は、原文の行間に収まる範囲内のサイズに翻訳文字列の文字サイズを設定する。この場合、各文章領域の原文の文字サイズと行間隔の値として、文字認識された文字のサイズと行間隔の平均値が用いられる。
また、この文書画像処理装置は、翻訳文字列の文字サイズを決定した後、文書画像において原文および翻訳文の文字列が占める領域の割合を算出し、この割合に基づいて翻訳文字列の文字サイズの補正を行う。具体的には、文書画像処理装置は、上記割合が大きい場合に、文字サイズが最大の翻訳文字列を小さいサイズにするか、翻訳文字列全体の文字サイズを小さくすることで可読性を維持する。
特開2010−128599号公報
しかしながら、上述した特許文献1の技術では、それぞれの文書領域に適した文字サイズで翻訳文字列の配置を行うことが難しくなる場合があった。
例えば、レイアウトが複雑な原文書の場合、1つの文章領域内において、文字のサイズが異なったり、空行等が含まれていたりすることがある。また、文字認識処理の際、実際の文字ではない画像部分が文字として認識されたり、文字認識処理の結果から得られる原文の文字サイズに誤りが存在したりすることもある。
そのため、文章領域単位で原文の文字サイズの平均値を算出した場合、その平均値が実際の文字サイズの傾向とかけ離れた値となる可能性がある。その結果、文章領域単位で決定した翻訳文字列の文字サイズが適正ではなく、原文書の文字サイズに比べて翻訳文字列の文字サイズが大き過ぎたり小さ過ぎたりして、文書の閲覧性が悪くなる。
また、翻訳文字列の文字サイズの補正は、各文章領域を分類したグループごとに行われるため、1つの文章領域に文字サイズの小さな文字列や狭い行間が局所的に存在した場合に、それらに対して大き過ぎる文字サイズで翻訳文字列が配置される可能性もあり得る。また、1つの文章領域に文字サイズの大きな文字列や広い行間が局所的に存在した場合に、それらに対して小さ過ぎる文字サイズで翻訳文字列が配置される可能性もあり得る。
本発明は、上記課題に鑑み、文書の文字サイズに即した文字サイズでルビ状の補足説明文字列が付された補足説明付き文書を容易かつ効率的に生成することのできる文書生成装置、文書生成方法、その文書生成方法をコンピュータに実行させることを特徴とするコンピュータプログラム、および、そのコンピュータプログラムを記録したことを特徴とするコンピュータが読み取り可能な記録媒体を提供することを目的とする。
上記課題を解決する為に、本発明の第1の技術手段は、文書に含まれる文字にルビ状の補足説明文字列を付すことにより補足説明付き文書を生成する文書生成装置であって、前記文書中の文字領域に含まれる文字の文字サイズの情報を記憶する記憶部と、前記記憶部から前記文字サイズの情報を読み出し、読み出した文字サイズの情報を各文字領域の文字サイズに基づいて文字領域ごとに補正する文字サイズ補正部と、前記文字サイズ補正部により補正された文字サイズの情報に基づいて、1つの文字領域を2以上の文字領域に分割する文字領域分割部と、前記文字領域分割部により分割されてできた文字領域内の文字について前記文字サイズ補正部により文字サイズの情報が補正された場合に、補正された文字サイズの情報に基づいて、前記補足説明文字列の表示形態の情報を前記文字領域分割部により分割されてできた文字領域ごとに生成する表示形態情報生成部と、前記表示形態情報生成部において生成された表示形態の情報に基づいて、前記補足説明付き文書を生成する文書生成部と、前記文字サイズ補正部により文字サイズが補正された各文字の中心位置が、文字サイズが補正される前の各文字の中心位置とそれぞれ一致するように、前記文字サイズが補正された文字を配置したものとし、該配置に基づいて各文字領域の行間隔の情報を文字領域ごとに補正する行間隔補正部とを備え、前記表示形態情報生成部は、前記行間隔補正部により補正された行間隔の情報に基づいて、前記補足説明文字列の表示形態の情報を生成することを特徴とする。
本発明の第2の技術手段は、第1の技術手段において、前記文字サイズ補正部は、各文字領域内の各行に含まれる文字に対して行ごとに文字サイズを決定し、決定された文字サイズの平均値を文字領域ごとに算出し、算出された文字サイズの平均値に基づいて前記文字サイズの情報を補正することを特徴とする。
本発明の第3の技術手段は、第2の技術手段において、前記文字サイズ補正部は、文字数が所定の閾値に満たない行がある場合に、該行を除外して前記文字サイズの平均値を算出することを特徴とする。
本発明の第4の技術手段は、第2または第3の技術手段において、前記文字サイズ補正部は、1つの文字領域の先頭行を含む連続するn行に対してそれぞれ決定された文字サイズの平均値を算出した後、該先頭行からn+1行目までの各行に対して決定された文字サイズの平均値を算出する場合に、前記連続するn行に対してそれぞれ決定された文字サイズの平均値とn+1行目の行に対して決定された文字サイズとを比較し、該連続するn行に対してそれぞれ決定された文字サイズの平均値とn+1行目の行に対して決定された文字サイズとの間の差が所定の基準よりも大きい場合に、前記先頭行からn+1行目までの各行に対して決定された文字サイズの平均値の算出を中止し、前記連続するn行に対してそれぞれ決定された文字サイズの平均値に基づいて前記文字サイズの情報を補正することを特徴とする。
本発明の第5の技術手段は、第4の技術手段において、前記文字領域分割部は、前記連続するn行に対してそれぞれ決定された文字サイズの平均値と、前記n+1行目の行に対して決定された文字サイズとの間の差が所定の基準よりも大きい場合に、前記n行目の行と前記n+1行目の行との間を境として前記文字領域を分割することを特徴とする。
本発明の第6の技術手段は、第5の技術手段において、前記文字サイズ補正部は、前記文字領域分割部により前記文字領域が分割された場合に、前記n+1行目以降の行に対して決定された文字サイズの平均値を算出することを特徴とする。
本発明の第7の技術手段は、第3〜第6のいずれか1つの技術手段において、前記文字サイズ補正部は、前記文字領域内の行ごとに決定された文字サイズに各行に含まれる文字数の重みを付けて該行ごとに決定された文字サイズの重み付きの平均値を算出し、該重み付きの平均値に基づいて前記文字サイズの情報を補正することを特徴とする。
本発明の第8の技術手段は、第7の技術手段において、前記文字サイズ補正部は、前記重み付きの平均値の算出対象から除外する文字の指定を受け付け、指定を受け付けた文字を除外して前記重み付きの平均値を算出することを特徴とする。
本発明の第9の技術手段は、第8の技術手段において、前記文字サイズ補正部は、各行の総文字数に対する前記指定を受け付けた文字の数の割合に係る閾値の指定を受け付け、該割合が該閾値以上である場合に、指定を受け付けた文字を除外して前記重み付きの平均値を算出することを特徴とする。
本発明の第10の技術手段は、第7の技術手段において、前記文字サイズ補正部は、前記重み付きの平均値の算出対象から除外する文字種の指定を受け付け、指定を受け付けた文字種の文字を除外して前記重み付きの平均値を算出することを特徴とする。
本発明の第11の技術手段は、第10の技術手段において、前記文字サイズ補正部は、各行の総文字数に対する前記指定を受け付けた文字種の文字数の割合に係る閾値の指定を受け付け、該割合が該閾値以上である場合に、指定を受け付けた文字種の文字を除外して前記重み付きの平均値を算出することを特徴とする。
本発明の第12の技術手段は、第の技術手段において、前記行間隔補正部は、各行間の行間隔の平均値を算出することにより前記行間隔の情報を補正し、1つの文字領域の先頭行を含む連続するm行の行間隔の平均値と、m行目の行とm+1行目の行との間の行間隔を比較し、該連続するm行の行間隔の平均値と、m行目の行とm+1行目の行との間の行間隔の間の差が所定の基準よりも大きい場合に、m行目の行とm+1行目の行との間の行間隔を前記各行間の行間隔の平均値の算出対象から除外することを特徴とする。
本発明の第13の技術手段は、第1〜第12のいずれか1つの技術手段において、前記表示形態情報生成部は、前記文書に含まれる文字の訳語、読み、あるいは、注釈の表示形態の情報を前記補足説明文字列の表示形態の情報として生成することを特徴とする。
本発明の第14の技術手段は、第1〜第13のいずれか1つの技術手段において、前記文書に含まれる単語、連語、あるいは、フレーズごとに該単語、連語、あるいは、フレーズの翻訳を行う翻訳処理部をさらに備え、前記文書生成部は、該単語、連語、あるいは、フレーズごとに訳語を付与した補足説明付き文書を生成することを特徴とする。
本発明の第15の技術手段は、コンピュータを、上記文書生成装置として機能させるコンピュータプログラムである。
本発明の第16の技術手段は、上記コンピュータプログラムを記録したことを特徴とするコンピュータが読み取り可能な記録媒体である。
本発明によれば、文書に含まれる文字の文字サイズを補正し、補正された文字サイズの情報に基づいて文字領域を分割し、分割してできた文字領域内の文字に対して文字サイズの情報が補正された場合に、補正された文字サイズの情報に基づいてルビ状の補足説明文字列の表示形態の情報を、分割してできた文字領域ごとに生成し、生成した表示形態の情報に基づいて補足説明付き文書を生成するので、文書の文字サイズに即した文字サイズでルビ状の補足説明文字列が付された補足説明付き文書を容易かつ効率的に生成することができる。
本発明の実施形態に係る文書生成装置の機能ブロック図である。 原文文字サイズの補正の一例について説明する図である。 原文文字サイズの補正の他の一例について説明する図である。 本発明の実施形態に係る文書生成処理の処理手順の一例を示すフローチャートである。 図4に示した原文文字サイズ補正処理の処理手順の一例を示すフローチャートである。 図4に示した行間隔補正処理の処理手順の一例を示すフローチャートである。
以下、本発明の実施形態について図面を参照して詳細に説明する。図1は、本発明の実施形態に係る文書生成装置10の機能ブロック図である。文書生成装置10は、文書に含まれる文字にルビ状の補足説明文字列(以下、ルビと呼ぶ。)を付すことにより補足説明付き文書(以下、ルビ付き文書と呼ぶ。)を生成する装置である。ルビとは、文字の読み方や意味などを示す注釈(例えば、読み仮名や発音記号、ピンイン記号、訳語、専門用語や難解な語句の説明)であり、その文字の近傍に文字との対応関係が分かるように配置されるものである。
なお、以下では、英語の文字にルビとして日本語の訳語を付す場合を例に挙げて文書生成装置10についての説明を行うが、文字の読み方や意味などを示す注釈をルビとして付す場合にも本発明を適用することができ、本発明を幅広い用途に利用することができる。また、以下では、横書きの文書に訳語を付す場合について説明するが、本発明は縦書きの文書に訳語を付す場合にも容易に適用することができる。
図1に示すように、文書生成装置10は、制御部11、入力部12、表示部13、バッファ14、ネットワークI/F(Interface)部15、記憶部16、画像取得部17、レイアウト解析部18、文字認識部19、文字サイズ補正部20、文字領域分割部21、行間隔補正部22、翻訳処理部23、表示形態情報生成部24、文書生成部25を備える。各機能部はバス26を介して互いに接続されている。
制御部11は、文書生成装置10を全体制御する処理部である。この制御部11は、各機能部間のデータの授受などを司る。入力部12は、キーボードやマウスなどの入力装置である。表示部13は、ディスプレイなどの表示装置である。バッファ14は、メモリ(例えば、RAM(Random Access Memory))などにより構成され、データを一時的に記憶する記憶装置である。ネットワークI/F部15は、LAN(Local Area Network)やWAN(Wide Area Network)等のIP(Internet Protocol)ネットワークを介して外部装置と通信を行うネットワークインターフェースである。
記憶部16は、メモリ(例えば、フラッシュROM(Read Only Memory)、EEPROM(Electrically Erasable and Programmable Read Only Memory))やハードディスク装置などの記憶装置である。この記憶部16は、ルビ文字列生成用辞書データ16a、レイアウト解析データ16b、原文文字列データ16c、原文文字付属情報データ16d、平均値データ16e、ルビ文字列データ16f、ルビ付属情報データ16gを記憶する。
ルビ文字列生成用辞書データ16aは、英語および日本語の文法データ、各構文の出現頻度のデータとともに、英語の単語や連語およびそれらに対する日本語の訳語などを含むデータである。ここで、連語とは、2つ以上の単語が連結し、1つのまとまった意味を示す語句(例えば、名詞句、動詞句、熟語、慣用句など)のことである。レイアウト解析データ16bは、レイアウト解析部18による原文書画像のレイアウト解析の結果を示すデータである。具体的には、レイアウト解析データ16bは、原文書画像に含まれる文字領域、画像領域、余白等の位置やサイズの情報を含んでいる。
原文文字列データ16cは、文字認識部19による原文書画像の文字認識の結果得られた各文字のテキスト情報である。原文文字付属情報データ16dは、原文書画像の文字認識の結果得られた各文字の位置やサイズなどのデータである。平均値データ16eは、各文字領域における文字サイズおよび行間隔の平均値のデータである。ルビ文字列データ16fは、翻訳処理部23によりルビ文字列として生成された訳語のデータである。ルビ付属情報データ16gは、翻訳処理部23によりルビ文字列として生成された訳語の位置やサイズなどのデータである。
ここで、記憶部16には予めデータを記憶させておく必要はなく、例えば、外部メモリに記憶されたデータをドライバによって読み出し、記憶部16に記憶させることとしてもよい。また、ネットワークI/F部15を介して外部装置からデータをダウンロードして記憶部16に記憶させることとしてもよい。
画像取得部17は、文字画像を含む原文書画像の画像データを取得する。例えば、画像取得部17は、ネットワークI/F部15を介してフラットベッドスキャナやフィルムスキャナなどが文書生成装置10に接続されている場合、あるいは、それらのスキャナを文書生成装置10が有している場合に、それらのスキャナにより読み取られた画像データを取得する。
レイアウト解析部18は、画像取得部17により取得された原文書画像のレイアウトを解析する処理部である。具体的には、レイアウト解析部18は、原文書画像に含まれる文字領域、画像領域、余白等の割り付けを解析し、各領域の位置やサイズなどを検出する。そして、レイアウト解析部18は、各領域の位置やサイズなどの情報を記憶部16にレイアウト解析データ16bとして記憶する。
文字認識部19は、レイアウト解析部18により検出された文字領域に含まれる文字を認識し、認識した文字をテキスト情報に変換する処理部である。また、この文字認識部19は、認識した文字の位置やサイズなどを検出する処理を行う。そして、文字認識部19は、テキスト情報を記憶部16に原文文字列データ16cとして記憶するとともに、検出した文字の位置やサイズなどの情報を記憶部16に原文文字付属情報データ16dとして記憶する。
レイアウト解析部18および文字認識部19は、例えば、OCR(Optical Character Recognition)などで従来用いられている文字認識技術と同様の技術を用いて原文書画像のレイアウトを解析することにより文字領域を検出し、さらに検出した文字領域内の各文字の画像を文字認識してテキスト情報に変換する。
文字サイズ補正部20は、文字認識部19により認識された原文文字サイズの補正を行う処理部である。具体的には、文字サイズ補正部20は、各文字領域に対して、文字認識部19による文字認識の結果得られた各行の文字サイズの平均値を算出することにより、原文文字サイズの補正を行う。ここで、文字サイズ補正部20は、各行の文字サイズを、例えば各行に含まれる文字の文字サイズの平均値を算出することにより算出する。補正された原文文字サイズは、ルビの文字サイズを設定するために用いられる。なお、各行の文字サイズは、各行に含まれる文字の文字サイズの中央値や最頻値、最大値を用いるなど、他の方法で算出することとしてもよい。
これにより、文字認識部19により認識された文字のサイズが均一ではない場合でも、文字領域ごとにルビの文字サイズを統一することができ、文字領域に極端に小さな文字や極端に大きな文字が含まれていたとしても、ルビの文字サイズを適切に設定することができる。
図2は、原文文字サイズの補正の一例について説明する図である。図2に示すように、例えば、行数が5行の文字領域において、文字認識部19により認識された各行の文字サイズが、9ポイント、8ポイント、9ポイント、10.5ポイント、8.5ポイントであるものとする。この場合、平均値は9ポイントとなる。よって、図2に示すように、文字サイズ補正部20は、この文字領域に含まれる文字の文字サイズを9ポイントに補正する。
なお、上述した処理において、行に含まれる文字の数が所定の閾値に満たない場合は、その行を除外して平均値を算出することとしてもよい。文字でない部分が誤って文字と認識され、誤って認識された文字を含む行の文字数が少なくなることが予測される場合などに、そのような行を除外することにより、適切な文字サイズの平均値を算出することができる。
また、文字サイズ補正部20は、各行の文字サイズに各行に含まれる文字数の重みをつけて重み付きの平均値を算出し、算出した重み付きの平均値を用いて原文文字サイズの補正を行うこととしてもよい。
例えば、行数が2行の文字領域において、1行目の文字のサイズが10ポイントで、文字数が30文字であり、2行目の文字のサイズが20ポイントで、文字数が1文字であるものとする。この場合、平均値は(10+20)/2=15ポイントとなるが、この平均値は平均的な文字サイズを表しているとは言い難い。一方、重み付きの平均値は(10×30+20×1)/(30+1)=10.3ポイントとなる。このように、文字サイズ補正部20は、重み付きの平均値を用いることにより、平均的な文字サイズをより適切に算出することができ、原文文字サイズの補正を効果的に行うことができる。
重み付きの平均値の算出する際、文字サイズ補正部20は、重み付きの平均値の算出対象から除外する文字または文字種の指定を受け付け、指定を受け付けた文字または文字種の文字を除外して重み付きの平均値を算出することとしてもよい。除外する文字または文字種は、予め文書生成装置10の記憶部16に記憶しておくこととしてもよいし、ユーザから指定を受け付けることとしてもよい。あるいは、指定を受け付けた文字または文字種の文字(例えば、記号などの特殊文字)の含有率、すなわち、各行の総文字数に対する指定を受け付けた文字または文字種の文字の数の割合が所定の閾値以上である場合に、その文字または文字種の文字を平均値の算出対象から除外することとしてもよい。この閾値は、予め文書生成装置10の記憶部16に記憶しておくこととしてもよいし、ユーザから指定を受け付けることとしてもよい。
文字認識部19は、文書の目次で見出しとページ番号とを結び付けるために用いられる「・・・」などの記号列を誤って文字として認識する場合があるが、上述のように、このような記号列を平均値の算出対象から除外することにより、適切な文字サイズの平均値を算出することができる。
さらに、文字サイズ補正部20は、サイズが大きく異なる文字が原文書に含まれる場合に、それらの文字の文字サイズを外れ値として除外して平均値を算出し、算出した平均値を用いて原文文字サイズの補正を行うこととしてもよい。図3は、原文文字サイズの補正の他の一例について説明する図である。図3に示すように、例えば、行数が8行の文字領域において、文字認識部19により認識された各行の文字サイズが、15ポイント、16ポイント、14ポイント、15ポイント、7ポイント、6ポイント、5ポイント、6ポイントであるものとする。
文字サイズ補正部20は、ある文字領域において1行目からn行目(n>1)までの文字サイズの平均値を算出するため、n行目の文字サイズの情報を取得した場合に、n行目の文字サイズと、1行目からn−1行目までの文字サイズの平均値とを比較する。そして、文字サイズ補正部20は、n行目の文字サイズと上記平均値との差が所定の基準よりも大きい場合、1行目からn−1行目までの文字サイズを平均値で置き換え、1行目からn−1行目までの行に含まれる文字のサイズを補正する。所定の基準とは、例えば、n行目の文字サイズ、および、平均値のうち、大きい値をA、小さい値をBとしたとき、AはBの2倍であるという基準である。文字サイズを補正した後、文字サイズ補正部20は、n行目以降の行に対して平均値を算出する処理を継続する。
n行目の文字サイズと平均値との差が所定の基準よりも大きくない場合、文字サイズ補正部20は、1行目からn+1行目までの文字サイズの平均値を算出するため、n+1行目の文字サイズの情報を取得し、上述した処理と同様の処理を継続する。
図3の例では、行に含まれる文字の数は所定の閾値以上であるものとする。文字サイズ補正部20は、1行目と2行目の平均値を算出する際に、16ポイントという2行目の文字サイズの情報を取得する。この場合、平均値(1行目の文字サイズ)は15ポイントであり、2行目の文字サイズ(16ポイント)は平均値の2倍よりも大きくないので、文字サイズ補正部20は、14ポイントという3行目の文字サイズの情報を取得する。文字サイズ補正部20は、以下同様の処理を繰り返し、7ポイントという5行目の文字サイズの情報を取得する。
1行目から4行目までの文字サイズの平均値は15ポイントであり、この値は7ポイントという5行目の文字サイズの2倍よりも大きい。そのため、図3に示すように、文字サイズ補正部20は、1行目から4行目までの文字サイズを15ポイントという平均値で置き換え、1行目から4行目までの行に含まれる文字のサイズを補正する。
その後、文字サイズ補正部20は、5行目以降の行に対して平均値を算出する処理を継続する。具体的には、文字サイズ補正部20は、5行目と6行目との平均値を算出する際に、6ポイントという6行目の文字サイズの情報を取得する。この場合、平均値(5行目の文字サイズ)は7ポイントであり、6行目の文字サイズ(6ポイント)は平均値の2倍よりも大きくないので、文字サイズ補正部20は、5ポイントという3行目の文字サイズの情報を取得する。文字サイズ補正部20は、同様の処理を8行目まで繰り返し、5行目から8行目までの文字サイズの平均値として6ポイントという値を得る。8行目が文字領域の最終行であるので、文字サイズ補正部20は、図3に示すように、5行目から8行目までの文字サイズを6ポイントという平均値で置き換え、5行目から8行目までの行に含まれる文字のサイズを補正する。
これにより、例えば、ある文字領域内で他の行の文字サイズと大きく異なる文字サイズの行が含まれることとなった場合でも、文字サイズ補正部20が、平均値を算出する対象行を文字サイズに応じて設定することにより、適切な文字サイズの平均値を算出することができる。
文字領域分割部21は、レイアウト解析部18により検出された文字領域にサイズが大きく異なる文字が含まれている場合に、文字のサイズがほぼ均一となるよう文字領域を分割する処理部である。この文字領域分割部21は、文字サイズ補正部20と連動して機能する。具体的には、文字領域分割部21は、文字サイズ補正部20が1行目からn行目までの文字サイズの平均値を算出するため、n行目の文字サイズの情報を取得し、n行目の文字サイズと、1行目からn−1行目までの文字サイズの平均値との差が所定の基準よりも大きいと判定した場合に、1行目からn−1行目までを含む文字領域とn行目以降の行を含む文字領域とに文字領域を分割する。
これにより、例えば、レイアウト解析部18によるレイアウト解析処理に誤りがあるなどして、1つの文字領域にサイズが大きく異なる文字が含まれているような場合であっても、その文字領域が同程度のサイズの文字を含む複数の文字領域に分割されるので、各文字領域において適切な文字サイズの平均値を算出することができ、その平均値を用いてルビの文字サイズを適切に設定することができる。また、文字サイズ補正部20、文字領域分割部21は、処理を1行分進めるごとに、文字サイズの補正をその行で区切るか、文字領域を分割するかの判定処理をそれぞれ行っている。このような判定処理は、文字サイズの補正が行われ、さらに文字領域の分割箇所が決定されるごとに、文字領域内の文字列の翻訳およびルビの生成を行うような場合に特に効果的である。すなわち、文字サイズの補正が行われ、分割箇所が決定された文字領域については、翻訳処理およびルビの生成処理を進めることができるため、そのような文字領域内の文字列に対してルビを付与する処理を迅速に実行することができる。
行間隔補正部22は、文字サイズ補正部20により補正された原文文字サイズの情報を用いて、文字領域分割部21により分割された各文字領域における行間隔を補正する処理部である。具体的には、行間隔補正部22は、各文字領域について、文字サイズ補正部20により補正された文字サイズで各原文文字を配置したとした場合の各行間の行間隔の平均値を算出し、算出した平均値を用いて行間隔を補正する。ここで、行間隔補正部22は、文字サイズが補正された各原文文字の中心位置が、サイズを補正する前の各原文文字の中心位置とそれぞれ一致するように、文字サイズが補正された各原文文字を配置したものと仮定する。そして、行間隔補正部22は、ある行nの下端座標と次の行n+1の下端座標との差を算出し、その差から文字サイズが補正された行n+1の原文文字の縦方向の長さを差し引くことにより各行間の行間隔を算出する。なお、文字サイズが補正された各原文文字の配置は、これ以外のものであってもよい。
補正された行間隔の情報は、訳語の配置位置を決定するために用いられる。これにより、文書の行間隔に即した位置に訳語がルビとして付されたルビ付き文書を容易かつ効率的に生成することができる。
例えば、行間隔補正部22は、文字サイズが補正された原文文字からなる各行の先頭文字の下端の座標とその行の次の行の先頭文字の上端の座標の差から行間隔を算出する。そして、行間隔補正部22は、各文字領域において、行間隔を1行ずつ算出する毎に、行間隔の平均値を算出する。なお、ここでは、文書が横書きの場合について説明しているが、文書が縦書きの場合は、列の先頭文字の左端の座標とその列の次の列の先頭文字の右端の座標の差から行間隔を算出すればよい。
行間隔補正部22は、ある文字領域において、1行目からm行目(m>2)までの各行間の行間隔の平均値を算出するため、m−1行目とm行目との間の行間隔の情報を取得した場合に、m−1行目とm行目との間の行間隔と、1行目からm−1行目までの各行間の行間隔の平均値とを比較する。そして、行間隔補正部22は、m−1行目とm行目との間の行間隔と上記平均値との差が所定の基準よりも大きい場合、m−1行目とm行目との間の行間隔を外れ値として平均値の算出対象から除外する。所定の基準とは、例えば、m−1行目とm行目との間の行間隔、および、平均値のうち、大きい値をA、小さい値をBとしたとき、AはBの2倍であるという基準である。その後、行間隔補正部22は、m行目とm+1行目との間の行間以降の行間に対して平均値を算出する処理を継続する。
これにより、例えば、ある文字領域内に空行があったり、行間隔が極端に大きい行間や小さい行間があったりした場合でも、行間隔補正部22が、その行間隔を平均値の算出対象から除外するので、適切な行間隔の平均値を算出することができ、その平均値を用いて訳語の配置位置を適切に設定することができる。
翻訳処理部23は、文字認識部19により認識された原文文字列に対応する訳語をルビ文字列として生成する処理を行う。具体的には、翻訳処理部23は、原文文字列に含まれる単語あるいは連語ごとに、ルビ文字列生成用辞書データ16aを参照することにより単語あるいは連語の訳語を生成し、生成した訳語を単語あるいは連語に対応付けて、記憶部16にルビ文字列データ16fとして記憶する。なお、本実施形態では、単語あるいは連語ごとに、翻訳処理部23が訳語を生成することとしたが、単語あるいは連語に加えてフレーズごとに翻訳処理部23が訳語を生成することとしてもよい。ここで、フレーズとは、複数の単語や連語からなる単語列のことである。個々のフレーズは通常辞書に登録されていないので、例えば、翻訳処理部23は、フレーズに含まれる単語や連語を翻訳し、その翻訳結果を用いてフレーズ全体の訳語を生成することとすればよい。あるいは、その他の方法でフレーズの訳語を生成することとしてもよい。
表示形態情報生成部24は、翻訳処理部23により生成された訳語を画像上に配置する際の配置位置や文字サイズの情報を生成する処理部である。この表示形態情報生成部24は、生成した情報を記憶部16にルビ付属情報データ16gとして記憶する。
具体的には、表示形態情報生成部24は、文字サイズ補正部20により補正された文字サイズに対して所定の割合となるよう訳語の文字サイズを設定する。そして、表示形態情報生成部24は、訳語を配置する行間の直上にある原文文字列の下端と訳語の上端とがほぼ一致するよう訳語の配置位置を設定し、さらに原文文字列と訳語とが接していると視覚上認められる範囲内で訳語の配置位置を調整する。
または、表示形態情報生成部24は、レイアウト解析部18により検出された文字領域、あるいは文字領域分割部21により分割されてできた文字領域ごとに、文字サイズ補正部20により補正された文字サイズ、および、行間隔補正部22により補正された行間隔で原文文字を配置したとした場合の行間の中央線上に訳語が並ぶように訳語の配置位置を設定することとしてもよい。ここで、表示形態情報生成部24は、各文字領域の1行目については、文字サイズが補正された各原文文字の中心位置が、サイズを補正する前の各原文文字の中心位置とそれぞれ一致するように配置し、その後、文字サイズ補正部20により補正された文字サイズ、および、行間隔補正部22により補正された行間隔で順次各行の原文文字を配置したものとして訳語の配置位置を設定する。なお、文字サイズが補正された各原文文字の配置はこれ以外のものであってもよく、また、訳語の配置位置は、行間隔の中央線上の位置以外の位置にしてもよい。
この場合、表示形態情報生成部24は、訳語の文字サイズを設定するため、レイアウト解析部18により検出された文字領域、あるいは文字領域分割部21により分割されてできた文字領域ごとに、行間隔補正部22により補正された行間隔と、文字サイズ補正部20により補正された文字サイズとを比較する。
原文書が横書きの文書であって、行間隔が文字サイズ補正部20により文字サイズが補正された原文文字の縦方向の長さの40%に満たないとき、表示形態情報生成部24は、訳語の文字の縦方向の長さが上記原文文字の縦方向の長さの40%となるよう訳語の文字サイズを設定する。また、行間隔が上記原文文字の縦方向の長さの80%を超えるときは、表示形態情報生成部24は、訳語の文字の縦方向の長さが上記原文文字の縦方向の長さの80%となるよう訳語の文字サイズを設定する。さらに、行間隔が上記原文文字の縦方向の長さの40〜80%であるときは、表示形態情報生成部24は、訳語の文字の縦方向の長さが行間隔と同じ長さとなるよう訳語の文字サイズを設定する。なお、上記処理では、40%、80%とは別の閾値を用いることとしてよい。また、原文書が縦書きの文書である場合でも原文文字の横方向の長さを基準とすることにより、同様の方法で訳語の文字サイズを設定することができる。
文書生成部25は、原文文字列に訳語が付された文書画像を生成する処理部である。具体的には、文書生成部25は、翻訳処理部23により単語あるいは連語ごとに生成された訳語を、表示形態情報生成部24により設定された配置位置に、設定された文字サイズで配置したルビ情報テキストレイヤを生成する。そして、文書生成部25は、生成したルビ情報テキストレイヤを原文書画像に重ね合わせることにより、原文文字列に訳語が付された文書画像を生成する。
ここで、文書生成部25は、単語あるいは連語単位で翻訳がなされ、その翻訳の結果得られた訳語を付与した文書画像を生成する。このように、文単位で翻訳を行うのではなく、単語あるいは連語単位で翻訳を行うので、文字認識部19による文字認識に誤りがあった場合でも、その影響は文の一部に部分的に及ぶに留まり、その影響が文全体の翻訳に及ぶことを防止できる。
つぎに、本発明の実施形態に係る文書生成処理の処理手順の一例について説明する。図4は、本発明の実施形態に係る文書生成処理の処理手順の一例を示すフローチャートである。
図4に示すように、文書生成装置10の画像取得部17は、文字画像を含む原文書画像の画像データを取得する(ステップS100)。そして、レイアウト解析部18は、画像取得部17により取得された原文書画像のレイアウト解析を実行する(ステップS101)。続いて、文字認識部19は、レイアウト解析部18により検出された文字領域に含まれる文字を認識し、認識した文字をテキスト情報に変換するとともに、認識した文字の位置やサイズなどを検出する文字認識処理を行う(ステップS102)。
そして、文字サイズ補正部20は、文字認識部19により認識された原文文字サイズの補正を行う(ステップS103)。なお、この補正処理において、レイアウト解析部18により検出された文字領域にサイズが大きく異なる文字が含まれている場合、文字領域分割部21は、文字のサイズがほぼ均一となるよう文字領域を分割する。この補正処理については、図5を用いて詳しく説明する。
続いて、行間隔補正部22は、文字サイズ補正部20により補正された原文文字サイズの情報を用いて、文字領域分割部21により分割された各文字領域における行間隔を補正する(ステップS104)。この補正処理については、図6を用いて詳しく説明する。
その後、翻訳処理部23は、文字認識部19により認識された原文文字列に対応する訳語をルビ文字列として生成し、表示形態情報生成部24は、文字サイズ補正部20により補正された原文文字サイズの情報、および、行間隔補正部22により補正された行間隔の情報を用いて、翻訳処理部23により生成された訳語を画像上に配置する配置位置や文字サイズの情報を生成する処理を行う(ステップS105)。
そして、文書生成部25は、翻訳処理部23により生成された訳語を、表示形態情報生成部24により設定された配置位置に、設定された文字サイズで配置したルビ情報テキストレイヤを生成するとともに、生成したルビ情報テキストレイヤを原文書画像に重ねることにより、原文文字列に訳語が付された文書画像を生成する処理を行う(ステップS106)。
つぎに、図4に示した原文文字サイズ補正処理の処理手順の一例について説明する。図5は、図4に示した原文文字サイズ補正処理の処理手順の一例を示すフローチャートである。ここで、原文文字サイズ補正処理は、各文字領域の先頭行から開始されるものとする。
図5に示すように、文書生成装置10の文字サイズ補正部20は、処理対象として着目している行がその文字領域の1行目の行か否かを判定する(ステップS200)。そして、文字サイズ補正部20は、着目している行がその文字領域の1行目の行である場合(ステップS200においてYESの場合)、着目している行の文字サイズをバッファ14に格納する(ステップS201)。着目している行がその文字領域の1行目の行でない場合(ステップS200においてNOの場合)、文字サイズ補正部20は、その文字領域の1行目から着目している行までの各行の文字サイズの平均値を算出し、算出した平均値をバッファ14に格納する(ステップS202)。
ステップS201あるいはステップS202の処理の後、文字サイズ補正部20は、その文字領域内に次の行があるか否かを調べる(ステップS203)。次の行がない場合(ステップS203においてNOの場合)、文字サイズ補正部20は、バッファに格納した値を当該文字領域に対応付けて記憶部16に平均値データ16eとして記憶する(ステップS208)。そして、文字サイズ補正部20は、この原文文字サイズ補正処理がなされていない未処理の文字領域があるか否かを調べる(ステップS209)。
未処理の文字領域がない場合(ステップS209においてNOの場合)、文字サイズ補正部20は、この原文文字サイズ補正処理を終了する。未処理の文字領域がある場合(ステップS209においてYESの場合)、ステップS200に移行して、文字サイズ補正部20は、未処理の文字領域に対して、処理対象として着目している行がその文字領域の1行目の行か否かを判定する処理を行い、それ以降の処理を継続する。
ステップS203において、次の行がある場合(ステップS203においてYESの場合)、文字サイズ補正部20は、着目している行を指し示すポインタを1行分進め、次の行を着目している行として設定する(ステップS204)。
その後、文字領域分割部21は、着目している行の文字サイズと平均値との差が、所定の基準よりも大きいか否かを調べる(ステップS205)。その差が所定の基準よりも大きくない場合(ステップS205においてNOの場合)、ステップS202に移行し、文字サイズ補正部20は、その文字領域の1行目から着目している行までの各行の文字サイズの平均値を算出し、算出した平均値をバッファ14に格納する処理を行う。
その差が所定の基準よりも大きい場合(ステップS205においてYESの場合)、文字サイズ補正部20は、バッファに格納した値を当該文字領域に対応付けて記憶部16に平均値データ16eとして記憶する(ステップS206)。ここで記憶された値は、2つに分割された文字領域のうち、着目している行の1つ前の行を含む文字領域の平均値である。その後、文字領域分割部21は、着目している行と、着目している行の1つ前の行との間を境として、文字領域を2つに分割する(ステップS207)。
その後、ステップS200に移行して、文字サイズ補正部20は、分割の結果生じた2つの文字領域のうち、着目している行を含む文字領域について、着目している行がその文字領域の1行目の行であるか否かを調べる処理を行い、それ以降の処理を継続する。
なお、上記処理において、平均値データ16eとして各文字領域に対応付けて記憶された平均値が、各文字領域の補正された原文文字サイズとなる。行間隔補正部22は、この補正された原文文字サイズの情報を用いて、各文字領域における行間隔を補正する。また、表示形態情報生成部24は、補正された原文文字サイズの情報を用いて、訳語を画像上に配置する配置位置や文字サイズの情報を生成する。
つぎに、図4に示した行間隔補正処理の処理手順の一例について説明する。図6は、図4に示した行間隔補正処理の処理手順の一例を示すフローチャートである。ここで、行間隔補正処理は、各文字領域の1つ目の行間、すなわち、各文字領域の先頭行と次の行との間の行間から開始されるものとする。
図6に示すように、文書生成装置10の行間隔補正部22は、処理対象とする文字領域について文字サイズ補正部20により補正された文字サイズで各原文文字を配置した場合の各行間の行間隔を算出する(ステップS300)。そして、行間隔補正部22は、その文字領域の1つ目の行間の行間隔をバッファ14に格納する(ステップS301)。続いて、行間隔補正部22は、その文字領域内に次の行間があるか否かを調べる(ステップS302)。次の行間がない場合(ステップS302においてNOの場合)、行間隔補正部22は、バッファに格納した値を当該文字領域に対応付けて記憶部16に平均値データ16eとして記憶する(ステップS307)。そして、行間隔補正部22は、この行間隔補正処理がなされていない未処理の文字領域があるか否かを調べる(ステップS308)。
未処理の文字領域がない場合(ステップS308においてNOの場合)、行間隔補正部22は、この行間隔補正処理を終了する。未処理の文字領域がある場合(ステップS308においてYESの場合)、ステップS300に移行して、行間隔補正部22は、未処理の文字領域に対して各行間の行間隔を算出する処理を行い、それ以降の処理を継続する。
ステップS302において、次の行間がある場合(ステップS302においてYESの場合)、行間隔補正部22は、着目している行間を指し示すポインタを行間1つ分進め、次の行間を着目している行間として設定する(ステップS303)。
その後、行間隔補正部22は、着目している行間の行間隔と平均値との差が、所定の基準よりも大きいか否かを調べる(ステップS304)。その差が所定の基準よりも大きくない場合(ステップS304においてNOの場合)、行間隔補正部22は、その文字領域の1つ目の行間から着目している行間までの各行間の行間隔の平均値を算出し、算出した平均値をバッファ14に格納する処理を行う(ステップS305)。
その差が所定の基準よりも大きい場合(ステップS304においてYESの場合)、行間隔補正部22は、着目している行間の行間隔を平均値の算出対象から除外する(ステップS306)。そして、ステップS302に移行し、行間隔補正部22は、その文字領域内に次の行間があるか否かを調べ、それ以降の処理を継続する。
なお、上記処理において、平均値データ16eとして各文字領域に対応付けて記憶された平均値が、各文字領域の補正された行間隔となる。表示形態情報生成部24は、補正された行間隔の情報を用いて、訳語を画像上に配置する配置位置の情報を生成する。
なお、上記実施形態では、すべての文字領域について原文文字サイズの補正や文字領域の分割、行間隔の補正が完了した後に、翻訳処理部23がルビ文字列を生成し、表示形態情報生成部24がルビ文字列の配置位置や文字サイズを設定することとしているが、すべての文字領域について上記処理が完了していなくとも、原文文字サイズの補正や文字領域の分割、行間隔の補正が完了した文字領域から先行してルビ文字列の生成処理、ルビ文字列の配置位置や文字サイズの設定処理を実行することとしてもよい。
さて、これまで文書生成装置10および文書生成方法の実施形態を中心に説明を行ったが、本発明はこれらの実施形態に限定されるものではなく、文書生成装置10の機能を実現するためのコンピュータプログラムとしての形態、あるいは、当該コンピュータプログラムが記録されたコンピュータ読み取り可能な記録媒体の形態として本発明が実施されることとしてもよい。
ここで、記録媒体としては、ディスク系(例えば、磁気ディスク、光ディスク等)、カード系(例えば、メモリカード、光カード等)、半導体メモリ系(例えば、ROM、不揮発性メモリ等)、テープ系(例えば、磁気テープ、カセットテープ等)等、さまざまな形態のものを採用することができる。
これら記録媒体に上述した本実施形態の文書生成装置10の機能を実現させるコンピュータプログラム、または、文書生成方法をコンピュータに実行させるコンピュータプログラムを記録して流通させることにより、コストの低廉化、及び可搬性や汎用性を向上させることができる。
そして、コンピュータに上記記録媒体を装着し、コンピュータにより記録媒体に記録されたコンピュータプログラムを読み出してメモリに格納し、コンピュータが備えるプロセッサ(CPU:Central Processing Unit、MPU:Micro Processing Unit)が当該コンピュータプログラムをメモリから読み出して実行することにより、本実施形態に係る文書生成装置10の機能を実現し、文書生成方法を実行することができる。
また、本発明は上述した実施形態に限定されず、本発明の要旨を逸脱しない範囲内で各種の変形、修正が可能である。
10…文書生成装置、11…制御部、12…入力部、13…表示部、14…バッファ、15…ネットワークI/F(Interface)部、16…記憶部、16a…ルビ文字列生成用辞書データ、16b…レイアウト解析データ、16c…原文文字列データ、16d…原文文字付属情報データ、16f…ルビ文字列データ、16g…ルビ付属情報データ、17…画像取得部、18…レイアウト解析部、19…文字認識部、20…文字サイズ補正部、21…文字領域分割部、22…行間隔補正部、23…翻訳処理部、24…表示形態情報生成部、25…文書生成部、26…バス

Claims (16)

  1. 文書に含まれる文字にルビ状の補足説明文字列を付すことにより補足説明付き文書を生成する文書生成装置であって、
    前記文書中の文字領域に含まれる文字の文字サイズの情報を記憶する記憶部と、
    前記記憶部から前記文字サイズの情報を読み出し、読み出した文字サイズの情報を各文字領域の文字サイズに基づいて文字領域ごとに補正する文字サイズ補正部と、
    前記文字サイズ補正部により補正された文字サイズの情報に基づいて、1つの文字領域を2以上の文字領域に分割する文字領域分割部と、
    前記文字領域分割部により分割されてできた文字領域内の文字について前記文字サイズ補正部により文字サイズの情報が補正された場合に、補正された文字サイズの情報に基づいて、前記補足説明文字列の表示形態の情報を前記文字領域分割部により分割されてできた文字領域ごとに生成する表示形態情報生成部と、
    前記表示形態情報生成部において生成された表示形態の情報に基づいて、前記補足説明付き文書を生成する文書生成部と、
    前記文字サイズ補正部により文字サイズが補正された各文字の中心位置が、文字サイズが補正される前の各文字の中心位置とそれぞれ一致するように、前記文字サイズが補正された文字を配置したものとし、該配置に基づいて各文字領域の行間隔の情報を文字領域ごとに補正する行間隔補正部とを備え、
    前記表示形態情報生成部は、前記行間隔補正部により補正された行間隔の情報に基づいて、前記補足説明文字列の表示形態の情報を生成することを特徴とする文書生成装置。
  2. 前記文字サイズ補正部は、各文字領域内の各行に含まれる文字に対して行ごとに文字サイズを決定し、決定された文字サイズの平均値を文字領域ごとに算出し、算出された文字サイズの平均値に基づいて前記文字サイズの情報を補正することを特徴とする請求項1に記載の文書生成装置。
  3. 前記文字サイズ補正部は、文字数が所定の閾値に満たない行がある場合に、該行を除外して前記文字サイズの平均値を算出することを特徴とする請求項2に記載の文書生成装置。
  4. 前記文字サイズ補正部は、1つの文字領域の先頭行を含む連続するn行に対してそれぞれ決定された文字サイズの平均値を算出した後、該先頭行からn+1行目までの各行に対して決定された文字サイズの平均値を算出する場合に、前記連続するn行に対してそれぞれ決定された文字サイズの平均値とn+1行目の行に対して決定された文字サイズとを比較し、該連続するn行に対してそれぞれ決定された文字サイズの平均値とn+1行目の行に対して決定された文字サイズとの間の差が所定の基準よりも大きい場合に、前記先頭行からn+1行目までの各行に対して決定された文字サイズの平均値の算出を中止し、前記連続するn行に対してそれぞれ決定された文字サイズの平均値に基づいて前記文字サイズの情報を補正することを特徴とする請求項2または3に記載の文書生成装置。
  5. 前記文字領域分割部は、前記連続するn行に対してそれぞれ決定された文字サイズの平均値と、前記n+1行目の行に対して決定された文字サイズとの間の差が所定の基準よりも大きい場合に、前記n行目の行と前記n+1行目の行との間を境として前記文字領域を分割することを特徴とする請求項4に記載の文書生成装置。
  6. 前記文字サイズ補正部は、前記文字領域分割部により前記文字領域が分割された場合に、前記n+1行目以降の行に対して決定された文字サイズの平均値を算出することを特徴とする請求項5に記載の文書生成装置。
  7. 前記文字サイズ補正部は、前記文字領域内の行ごとに決定された文字サイズに各行に含まれる文字数の重みを付けて該行ごとに決定された文字サイズの重み付きの平均値を算出し、該重み付きの平均値に基づいて前記文字サイズの情報を補正することを特徴とする請求項3〜6のいずれか1項に記載の文書生成装置。
  8. 前記文字サイズ補正部は、前記重み付きの平均値の算出対象から除外する文字の指定を受け付け、指定を受け付けた文字を除外して前記重み付きの平均値を算出することを特徴とする請求項7に記載の文書生成装置。
  9. 前記文字サイズ補正部は、各行の総文字数に対する前記指定を受け付けた文字の数の割合に係る閾値の指定を受け付け、該割合が該閾値以上である場合に、指定を受け付けた文字を除外して前記重み付きの平均値を算出することを特徴とする請求項8に記載の文書生成装置。
  10. 前記文字サイズ補正部は、前記重み付きの平均値の算出対象から除外する文字種の指定を受け付け、指定を受け付けた文字種の文字を除外して前記重み付きの平均値を算出することを特徴とする請求項7に記載の文書生成装置。
  11. 前記文字サイズ補正部は、各行の総文字数に対する前記指定を受け付けた文字種の文字数の割合に係る閾値の指定を受け付け、該割合が該閾値以上である場合に、指定を受け付けた文字種の文字を除外して前記重み付きの平均値を算出することを特徴とする請求項10に記載の文書生成装置。
  12. 前記行間隔補正部は、各行間の行間隔の平均値を算出することにより前記行間隔の情報を補正し、1つの文字領域の先頭行を含む連続するm行の行間隔の平均値と、m行目の行とm+1行目の行との間の行間隔を比較し、該連続するm行の行間隔の平均値と、m行目の行とm+1行目の行との間の行間隔の間の差が所定の基準よりも大きい場合に、m行目の行とm+1行目の行との間の行間隔を前記各行間の行間隔の平均値の算出対象から除外することを特徴とする請求項に記載の文書生成装置。
  13. 前記表示形態情報生成部は、前記文書に含まれる文字の訳語、読み、あるいは、注釈の表示形態の情報を前記補足説明文字列の表示形態の情報として生成することを特徴とする請求項1〜12のいずれか1項に記載の文書生成装置。
  14. 前記文書に含まれる単語、連語、あるいは、フレーズごとに該単語、連語、あるいは、フレーズの翻訳を行う翻訳処理部をさらに備え、前記文書生成部は、該単語、連語、あるいは、フレーズごとに訳語を付与した補足説明付き文書を生成することを特徴とする請求項1〜13のいずれか1項に記載の文書生成装置。
  15. コンピュータを、請求項に記載の文書生成装置として機能させるコンピュータプログラム。
  16. 請求項15に記載のコンピュータプログラムを記録したことを特徴とするコンピュータが読み取り可能な記録媒体。
JP2010251375A 2010-11-10 2010-11-10 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体 Active JP5144736B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010251375A JP5144736B2 (ja) 2010-11-10 2010-11-10 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体
US13/292,125 US9110871B2 (en) 2010-11-10 2011-11-09 Correcting a document character size based on the average value of each character size
CN201110354797.1A CN102592299B (zh) 2010-11-10 2011-11-10 文件生成装置和文件生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010251375A JP5144736B2 (ja) 2010-11-10 2010-11-10 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2012103872A JP2012103872A (ja) 2012-05-31
JP5144736B2 true JP5144736B2 (ja) 2013-02-13

Family

ID=46020818

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010251375A Active JP5144736B2 (ja) 2010-11-10 2010-11-10 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体

Country Status (3)

Country Link
US (1) US9110871B2 (ja)
JP (1) JP5144736B2 (ja)
CN (1) CN102592299B (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9147178B2 (en) * 2012-01-16 2015-09-29 International Business Machines Corporation De-identification in visual media data
JP6028392B2 (ja) * 2012-05-24 2016-11-16 富士通株式会社 生成プログラム、生成方法、生成装置、検索プログラム、検索方法および検索装置
JP6028393B2 (ja) * 2012-05-24 2016-11-16 富士通株式会社 照合プログラム、照合方法および照合装置
US9858271B2 (en) * 2012-11-30 2018-01-02 Ricoh Company, Ltd. System and method for translating content between devices
KR20150006740A (ko) * 2013-07-09 2015-01-19 류중하 문자에 대한 기호 이미지 구성 방법, 및 기호 이미지에 대한 대응되는 문자의 분석 방법
JP5877272B2 (ja) * 2013-03-19 2016-03-02 楽天株式会社 文書処理装置、文書処理方法、プログラムおよび情報記憶媒体
JP6201488B2 (ja) * 2013-07-29 2017-09-27 富士通株式会社 選択文字特定プログラム、選択文字特定方法、及び、選択文字特定装置
JP6398945B2 (ja) * 2015-10-29 2018-10-03 コニカミノルタ株式会社 情報付加文書生成装置、プログラム
JP7027757B2 (ja) * 2017-09-21 2022-03-02 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
JP7090894B2 (ja) * 2018-07-26 2022-06-27 武蔵エンジニアリング株式会社 文字列表示装置および文字列表示方法
JP7293974B2 (ja) * 2019-08-19 2023-06-20 ブラザー工業株式会社 制御プログラム、および情報処理装置
CN112100980A (zh) * 2020-09-21 2020-12-18 湖南省汉星信息科技有限责任公司 附加信息文字的显示方法、装置、设备及存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0620091A (ja) * 1992-06-30 1994-01-28 Matsushita Electric Ind Co Ltd 文字サイズ抽出方法
JP3294919B2 (ja) 1993-10-21 2002-06-24 松下電器産業株式会社 機械翻訳装置
US7391917B2 (en) * 2003-02-13 2008-06-24 Canon Kabushiki Kaisha Image processing method
JP2008299780A (ja) * 2007-06-04 2008-12-11 Fuji Xerox Co Ltd 画像処理装置、及び画像処理プログラム
JP4998176B2 (ja) 2007-09-27 2012-08-15 富士ゼロックス株式会社 翻訳装置及びプログラム
JP2009193283A (ja) 2008-02-14 2009-08-27 Fuji Xerox Co Ltd 文書画像処理装置、及び文書画像処理プログラム
JP5126018B2 (ja) 2008-11-25 2013-01-23 富士ゼロックス株式会社 文書画像処理装置及びプログラム
US8261180B2 (en) * 2009-04-28 2012-09-04 Lexmark International, Inc. Automatic forms processing systems and methods

Also Published As

Publication number Publication date
JP2012103872A (ja) 2012-05-31
US9110871B2 (en) 2015-08-18
CN102592299A (zh) 2012-07-18
CN102592299B (zh) 2014-11-19
US20120117461A1 (en) 2012-05-10

Similar Documents

Publication Publication Date Title
JP5144736B2 (ja) 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体
US6336124B1 (en) Conversion data representing a document to other formats for manipulation and display
JP5105513B2 (ja) 処理対象として適切なテキストを選択する技術
JP2007004633A (ja) 言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置
JP5372110B2 (ja) 情報出力装置、情報出力方法、及びコンピュータプログラム
JP4999938B2 (ja) 文書画像生成装置、文書画像生成方法及びコンピュータプログラム
US20140380169A1 (en) Language input method editor to disambiguate ambiguous phrases via diacriticization
JP2009053932A (ja) 文書画像処理装置、及び文書画像処理プログラム
CN114118011A (zh) 文档处理方法、电子设备及存储介质
US20140297253A1 (en) Translation support apparatus, translation support system, and translation support program
JP7481999B2 (ja) 辞書編集装置、辞書編集方法及び辞書編集プログラム
JP2004220616A (ja) 3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置
JP3294919B2 (ja) 機械翻訳装置
JP5833087B2 (ja) 文字列処理装置、方法、及びプログラム
US20220156446A1 (en) Device Dependent Rendering of PDF Content Including Multiple Articles and a Table of Contents
JP2008027133A (ja) 帳票処理装置及び帳票処理方法ならびに帳票処理方法を実行するプログラムと記憶媒体
JP2009032026A (ja) 表示制御装置、方法、プログラムおよび記録媒体
JP7315420B2 (ja) テキストの適合および修正の方法
JP5604276B2 (ja) 文書画像生成装置および文書画像生成方法
JP2000353159A (ja) 表記・読み対応付け装置、表記・読み対応辞書作成方法、テキスト読み振り装置、テキスト読み振り方法および記録媒体
JPWO2007114182A1 (ja) データ入力装置、方法、及びプログラム
US20230039280A1 (en) Device dependent rendering of pdf content
CN117391045B (zh) 可复制蒙文的可携带文件格式文件输出方法
JP2019053461A (ja) 画像処理装置、プログラム及び画像データ
JP6528927B2 (ja) 文書処理装置及びプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121001

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121030

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121122

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151130

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5144736

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150