JP4948586B2 - 文書画像生成装置、文書画像生成方法、コンピュータプログラム及び記録媒体 - Google Patents

文書画像生成装置、文書画像生成方法、コンピュータプログラム及び記録媒体 Download PDF

Info

Publication number
JP4948586B2
JP4948586B2 JP2009255373A JP2009255373A JP4948586B2 JP 4948586 B2 JP4948586 B2 JP 4948586B2 JP 2009255373 A JP2009255373 A JP 2009255373A JP 2009255373 A JP2009255373 A JP 2009255373A JP 4948586 B2 JP4948586 B2 JP 4948586B2
Authority
JP
Japan
Prior art keywords
word
supplementary explanation
collocation
length
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009255373A
Other languages
English (en)
Other versions
JP2011100356A (ja
Inventor
いち子 佐田
毅 九津見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2009255373A priority Critical patent/JP4948586B2/ja
Priority to CN2010105389906A priority patent/CN102053950B/zh
Priority to US12/940,818 priority patent/US8503786B2/en
Publication of JP2011100356A publication Critical patent/JP2011100356A/ja
Application granted granted Critical
Publication of JP4948586B2 publication Critical patent/JP4948586B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

本発明は、画像により表現される文章に対して補足説明を付加する処理を行う文書画像生成装置、文書画像生成方法コンピュータプログラム及び記録媒体に関する。
従来、原稿をスキャンして得られた画像に表現される文書等、電子データで表現される文書に対して、文字認識を行い、自動で翻訳を行う技術が知られている。特許文献1には、文書中の単語に対する訳語を単語に近接した行間に配置し、文書の行間が狭い場合には文書の文字サイズを小さくした文書を作成する技術が記載されている。特許文献2には、文書の単語に近接した行間に訳語を配置する際に、訳語の表示長さを文書の単語の表示長さよりも小さくなるように訳語の表示形態を調整する技術が記載されている。特許文献3には、熟語に対して訳語を配置することが可能であり、訳語を配置した熟語に対しては下線を付す技術が記載されている。特許文献4には、文書に対する訳文を生成し、生成した訳文を文書の行間に配置した文書を作成する技術が記載されている。
特開平7−121539号公報 特開平5−324720号公報 特開平6−301713号公報 特開平2009−53838号公報
特許文献1に記載の技術では、文書の文字サイズが小さくなるので、文書のイメージが崩れ、文書のレイアウトを維持できない。特許文献2及び3に記載の技術では、訳語の表示長さが調整されるため、文書が横書き文書の場合はX軸方向のレイアウトの維持は考慮されるものの、Y軸方向のレイアウトの維持については考慮されていないので、文書及び訳語がY軸方向に伸びていき、文書のレイアウトが維持できない。文書のレイアウトが維持できない場合は、元の文書との比較が困難になるという問題がある。また特許文献4に記載の技術では、訳文では語順が文書から変化するので、文書と訳文との間で単語同士の対応関係を把握することが困難となる。また単語の綴り間違い、文字の誤認識、又は誤訳等があった場合には、訳文全体が間違った訳文となり、訳文から文書の意味を理解することが困難になるという問題がある。
本発明は、斯かる事情に鑑みてなされたものであって、その目的とするところは、文書の文字サイズ及び文字位置等を変化させず、各単語及び連語に対する訳語等の補足説明を追加した文書の画像を生成することによって、文書のレイアウトを維持し、文書をより理解し易くする文書画像生成装置、文書画像生成方法コンピュータプログラム及び記録媒体を提供することにある。
本発明に係る文書画像生成装置は、複数の行を含んでなる文書を表す画像から、文書に含まれる単語、又は複数の単語からなる連語に対する補足説明を文書に付加した補足説明付文書を表す画像を生成する文書画像生成装置において、文書を表す原文書画像を取得する原文書画像取得手段と、該原文書画像取得手段が取得した原文書画像に含まれる文字の認識及び原文書画像中での文字位置の特定を行う文字認識手段と、該文字認識手段が認識した文字で構成される文書に対して自然言語処理を行うことによって、文書に含まれる単語又は連語の意味を確定し、各単語又は連語の意味に対応する補足説明を取得する補足説明取得手段と、文書に含まれる単語又は連語の内で、文書中に補足説明を配置すべき単語又は連語を選択する手段と、前記文字認識手段が認識した文字の位置に基づき、各単語又は連語に対応して取得した補足説明について、文書中で補足説明を配置すべき位置として、原文書画像中で該単語又は連語に近接した行間の位置を定める位置決定手段と、該位置決定手段が定めた原文書画像中の位置に相当する位置に各補足説明を配置した補足説明テキストレイヤを、原文書画像からなる原文書画像レイヤに重ねることにより、補足説明付文書を表す画像を生成する画像生成手段とを備え、前記位置決定手段は、補足説明の長さが当該補足説明に対応する単語又は連語の長さよりも長いか否かを判定する手段と、補足説明の長さが当該補足説明に対応する単語又は連語の長さよりも長い場合に、前記単語又は連語の前後の単語が他の補足説明を配置すべき単語であるか否かを判定する手段と、補足説明に対応する単語又は連語の前後の単語のいずれか又は両方が他の補足説明を配置すべき単語ではない場合に、文書中で補足説明を配置すべき位置として、補足説明に対応する単語又は連語に近接した行間の位置と、前記単語又は連語の前後の単語の内で他の補足説明を配置すべき単語ではない単語に近接する行間の位置とを含む位置を定める手段と、補足説明に対応する単語又は連語の前後の単語のいずれか又は両方が他の補足説明を配置すべき単語である場合に、補足説明に対応する単語又は連語の前後の単語の内で他の補足説明を配置すべき単語の長さから所定長を差し引いた長さよりも他の補足説明の長さの方が短いか否かを判定する手段と、他の補足説明を配置すべき単語の長さから所定長を差し引いた長さよりも他の補足説明の長さの方が短い場合に、文書中で補足説明を配置すべき位置として、補足説明に対応する単語又は連語に近接した行間の位置と、前記単語又は連語の前後の単語の内で他の補足説明を配置すべき単語であって該単語の長さから所定長を差し引いた長さよりも他の補足説明の長さの方が短い単語に近接する行間の位置の一部とを含む位置を定める手段と、文書中で補足説明を配置すべき位置として定めた位置に配置できる文字列の長さよりも長い補足説明の長さを縮小する手段とを有することを特徴とする。
本発明に係る文書画像生成装置は、前記位置決定手段は、補足説明を取得した連語が、該連語に含まれる複数の単語が文書中で不連続に配置されている不連続連語であるか否かを判定する手段と、補足説明を取得した連語が不連続連語である場合に、文書中で補足説明を配置すべき位置として、不連続連語に含まれる先頭単語、不連続連語に含まれる連続単語列、又は不連続連語に含まれる最長単語のいずれかに原文書画像中で近接した行間の位置を定める手段とを有することを特徴とする。
本発明に係る文書画像生成装置は、前記画像生成手段は、原文書画像中の不連続連語の位置に相当する位置に不連続連語であることを示す印を配置した画像からなる印画像レイヤを、原文書画像レイヤに更に重ねるように構成してあることを特徴とする。
本発明に係る文書画像生成装置は、前記画像生成手段は、原文書画像に含まれる各文字を示すテキストデータを、透明にした状態で原文書画像中の各文字の位置に相当する位置に配置した原文書テキストレイヤを、原文書画像レイヤに更に重ねるように構成してあることを特徴とする。
本発明に係る文書画像生成装置は、前記補足説明取得手段は、補足説明として、単語若しくは連語に対する訳語、単語若しくは連語の読み、又は単語若しくは連語に対する注釈を取得するように構成してあることを特徴とする。
本発明に係る文書画像生成装置は、前記補足説明取得手段は、前記文字認識手段が認識
した文字で構成される行毎の文字列を行順に連結してなる文書の内容に対して自然言語処
理を行うように構成してあることを特徴とする
本発明に係る文書画像生成装置は、複数の行を含んでなる文書を表す画像から、文書に含まれる単語、又は複数の単語からなる連語に対する補足説明として訳語を文書に付加した補足説明付文書を表す画像を生成する文書画像生成装置において、文書を表す原文書画像を取得する原文書画像取得手段と、該原文書画像取得手段が取得した原文書画像に含まれる文字の認識及び原文書画像中での文字位置の特定を行う文字認識手段と、該文字認識手段が認識した文字で構成される行毎の文字列を行順に連結してなる文書の内容に対して自然言語処理を行うことによって、文書に含まれる単語又は連語の意味を確定し、各単語又は連語の意味に対応する訳語を取得する手段と、文書に含まれる単語又は連語の内で、訳語を付加すべき単語又は連語を選択する手段と、前記文字認識手段が認識した文字の位置に基づき、各単語又は連語に対応して取得した訳語について、文書中で訳語を配置すべき位置として、原文書画像中で該単語又は連語に近接した行間の位置を定める位置決定手段と、該位置決定手段が定めた原文書画像中の位置に相当する位置に各訳語を配置した補足説明テキストレイヤ、原文書画像中の不連続連語の位置に相当する位置に不連続連語であることを示す印を配置した画像からなる印画像レイヤ、及び原文書画像に含まれる各文字を示すテキストデータを透明にした状態で原文書画像中の各文字の位置に相当する位置に配置した原文書テキストレイヤを、原文書画像からなる原文書画像レイヤに重ねることにより、補足説明付文書を表す画像を生成する手段とを備え、前記位置決定手段は、訳語を取得した連語の内、連語に含まれる複数の単語が文書中で不連続に配置されている不連続連語について、文書中で訳語を配置すべき位置として、不連続連語に含まれる先頭単語、不連続連語に含まれる連続単語列、又は不連続連語に含まれる最長単語の内で長さが最大のものに原文書画像中で近接した行間の位置を定める手段と、訳語の内で当該訳語に対応する単語又は連語の長さよりも長い訳語について、前記単語又は連語の前後の単語が他の訳語を配置すべき単語であるか否かを判定する手段と、訳語に対応する単語又は連語の前後の単語のいずれか又は両方が他の訳語を配置すべき単語ではない場合に、文書中で訳語を配置すべき位置として、訳語に対応する単語又は連語に近接した行間の位置と、前記単語又は連語の前後の単語の内で他の訳語を配置すべき単語ではない単語に近接する行間の位置とを含む位置を定める手段と、訳語に対応する単語又は連語の前後の単語のいずれか又は両方が他の訳語を配置すべき単語である場合に、訳語に対応する単語又は連語の前後の単語の内で他の訳語を配置すべき単語の長さから所定長を差し引いた長さよりも他の訳語の長さの方が短いか否かを判定する手段と、他の訳語を配置すべき単語の長さから所定長を差し引いた長さよりも他の訳語の長さの方が短い場合に、文書中で訳語を配置すべき位置として、訳語に対応する単語又は連語に近接した行間の位置と、前記単語又は連語の前後の単語の内で他の訳語を配置すべき単語であって該単語の長さから所定長を差し引いた長さよりも他の訳語の長さの方が短い単語に近接する行間の位置の一部とを含む位置を定める手段と、文書中で訳語を配置すべき位置として定めた位置に配置できる文字列の長さよりも長い訳語の長さを縮小する手段とを有することを特徴とする。
本発明に係る文書画像生成装置は、外部の装置から送信されたウェブページ用のデータを受信する手段と、該手段が受信したデータに基づいてウェブページを表示する手段とを更に備え、前記原文書画像取得手段は、原文書画像として、ウェブページを取得する手段を有することを特徴とする。
本発明に係る文書画像生成方法は、複数の行を含んでなる文書を表す画像から、文書に含まれる単語、又は複数の単語からなる連語に対する補足説明を文書に付加した補足説明付文書を表す画像を生成する方法において、文書を表す原文書画像を取得するステップと、取得した原文書画像に含まれる文字の認識及び原文書画像中での文字位置の特定を行うステップと、認識した文字で構成される文書に対して自然言語処理を行うことによって、文書に含まれる単語又は連語の意味を確定し、各単語又は連語の意味に対応する補足説明を取得するステップと、文書に含まれる単語又は連語の内で、文書中に補足説明を配置すべき単語又は連語を選択するステップと、認識した文字の位置に基づき、各単語又は連語に対応して取得した補足説明について、文書中で補足説明を配置すべき位置として、原文書画像中で該単語又は連語に近接した行間の位置を定める位置決定ステップと、該位置決定ステップで定めた原文書画像中の位置に相当する位置に各補足説明を配置した補足説明テキストレイヤを、原文書画像からなる原文書画像レイヤに重ねることにより、補足説明付文書を表す画像を生成するステップとを含み、前記位置決定ステップは、補足説明の長さが当該補足説明に対応する単語又は連語の長さよりも長いか否かを判定するステップと、補足説明の長さが当該補足説明に対応する単語又は連語の長さよりも長い場合に、前記単語又は連語の前後の単語が他の補足説明を配置すべき単語であるか否かを判定するステップと、補足説明に対応する単語又は連語の前後の単語のいずれか又は両方が他の補足説明を配置すべき単語ではない場合に、文書中で補足説明を配置すべき位置として、補足説明に対応する単語又は連語に近接した行間の位置と、前記単語又は連語の前後の単語の内で他の補足説明を配置すべき単語ではない単語に近接する行間の位置とを含む位置を定めるステップと、補足説明に対応する単語又は連語の前後の単語のいずれか又は両方が他の補足説明を配置すべき単語である場合に、補足説明に対応する単語又は連語の前後の単語の内で他の補足説明を配置すべき単語の長さから所定長を差し引いた長さよりも他の補足説明の長さの方が短いか否かを判定するステップと、他の補足説明を配置すべき単語の長さから所定長を差し引いた長さよりも他の補足説明の長さの方が短い場合に、文書中で補足説明を配置すべき位置として、補足説明に対応する単語又は連語に近接した行間の位置と、前記単語又は連語の前後の単語の内で他の補足説明を配置すべき単語であって該単語の長さから所定長を差し引いた長さよりも他の補足説明の長さの方が短い単語に近接する行間の位置の一部とを含む位置を定めるステップと、文書中で補足説明を配置すべき位置として定めた位置に配置できる文字列の長さよりも長い補足説明の長さを縮小するステップとを含むことを特徴とする
本発明に係るコンピュータプログラムは、コンピュータに、複数の行を含んでなる文書を表す画像から、文書に含まれる単語、又は複数の単語からなる連語に対する補足説明を文書に付加した補足説明付文書を表す画像を生成する処理を実行させるためのコンピュータプログラムにおいて、文書を表す原文書画像を取得するステップと、取得した原文書画像に含まれる文字の認識及び原文書画像中での文字位置の特定を行うステップと、認識した文字で構成される文書に対して自然言語処理を行うことによって、文書に含まれる単語又は連語の意味を確定し、各単語又は連語の意味に対応する補足説明を取得するステップと、文書に含まれる単語又は連語の内で、文書中に補足説明を配置すべき単語又は連語を選択するステップと、認識した文字の位置に基づき、各単語又は連語に対応して取得した補足説明について、文書中で補足説明を配置すべき位置として、原文書画像中で該単語又は連語に近接した行間の位置を定める位置決定ステップと、該位置決定ステップで定めた原文書画像中の位置に相当する位置に各補足説明を配置した補足説明テキストレイヤを、原文書画像からなる原文書画像レイヤに重ねることにより、補足説明付文書を表す画像を生成するステップとを含み、前記位置決定ステップは、補足説明の長さが当該補足説明に対応する単語又は連語の長さよりも長いか否かを判定するステップと、補足説明の長さが当該補足説明に対応する単語又は連語の長さよりも長い場合に、前記単語又は連語の前後の単語が他の補足説明を配置すべき単語であるか否かを判定するステップと、補足説明に対応する単語又は連語の前後の単語のいずれか又は両方が他の補足説明を配置すべき単語ではない場合に、文書中で補足説明を配置すべき位置として、補足説明に対応する単語又は連語に近接した行間の位置と、前記単語又は連語の前後の単語の内で他の補足説明を配置すべき単語ではない単語に近接する行間の位置とを含む位置を定めるステップと、補足説明に対応する単語又は連語の前後の単語のいずれか又は両方が他の補足説明を配置すべき単語である場合に、補足説明に対応する単語又は連語の前後の単語の内で他の補足説明を配置すべき単語の長さから所定長を差し引いた長さよりも他の補足説明の長さの方が短いか否かを判定するステップと、他の補足説明を配置すべき単語の長さから所定長を差し引いた長さよりも他の補足説明の長さの方が短い場合に、文書中で補足説明を配置すべき位置として、補足説明に対応する単語又は連語に近接した行間の位置と、前記単語又は連語の前後の単語の内で他の補足説明を配置すべき単語であって該単語の長さから所定長を差し引いた長さよりも他の補足説明の長さの方が短い単語に近接する行間の位置の一部とを含む位置を定めるステップと、文書中で補足説明を配置すべき位置として定めた位置に配置できる文字列の長さよりも長い補足説明の長さを縮小するステップとを含む処理をコンピュータに実行させることを特徴とする
本発明に係るコンピュータでの読み取りが可能な記録媒体は、前記記載のコンピュータプログラムを記録してあることを特徴とする。
本発明においては、画像読取装置等を用いて取得した原文書画像から文字を認識し、認識した文字から構成される文書の自然言語処理を行うことで、文書に含まれる単語又は連語に対する訳語等の補足説明を取得し、補足説明を単語又は連語に近接する行間の位置に相当する位置に配置した補足説明テキストレイヤを、原文書画像からなる原文書画像レイヤに重ねることにより補足説明付文書画像を生成する。
また本発明においては、補足説明を取得した連語が不連続連語である場合に、不連続連語に対する補足説明を、補足説明画像中で、不連続連語に含まれる連続単語、連続単語列又は最長単語に近接する行間の位置に相当する位置に配置する。これにより、不連続連語の意味が理解し易くなる位置に、補足説明が配置される。
また本発明においては、不連続連語を示す下線等の印を配置した印画像レイヤを原文書画像レイヤに更に重ねることにより補足説明付文書画像を生成することで、補足説明付文書画像中で不連続連語の範囲が明確に示される。
また本発明においては、単語又は連語の長さよりも長い補足説明については、補足説明の長さが補足説明を配置すべき配置スペースに収まるように、補足説明の長さを縮小する。他の補足説明を配置すべき単語が前後に存在しない場合には、単語又は連語に近接する行間の位置に加えて、前後の単語に近接した行間の位置にまで補足説明を配置できるようにする。また前後の単語が他の補足説明を配置すべき単語であっても、前後の単語に近接して配置すべき他の補足説明の長さが単語の長さに比べて十分に短い場合は、単語又は連語に近接した行間の位置に加えて、前後の単語に近接した行間の位置の一部を含む位置にまで補足説明を配置できるようにする。
また本発明においては、補足説明テキストレイヤに加えて、原文書画像に含まれる文字を示すテキストデータを各文字の位置に相当する位置に配置した原文書テキストレイヤを、原文書画像レイヤに更に重ねることにより補足説明付文書画像を生成することで、原文書テキストレイヤに含まれるテキスト又は補足説明テキストレイヤに含まれるテキストを手掛かりとして文書の内容を検索することを可能にする。
また本発明においては、補足説明は、単語若しくは連語に対する訳語、単語若しくは連語の読み仮名等の読み、又は単語若しくは連語に対する注釈のいずれかである。
また本発明においては、認識した文字で構成される各行を行順に連結してなる文書の内容に対して自然言語処理を行うことにより、複数の行に亘った文単位で自然言語処理を行う。
また本発明においては、ウェブページ用のデータから原文書画像を生成し、生成した原文書画像から補足説明付文書画像を生成することにより、ウェブページの読解を容易にする。
本発明にあっては、補足説明付文書画像は、原文書画像レイヤに補足説明テキストレイヤを重ねることによって生成されるので、文書に含まれる文字のサイズ及び位置は不変であり、文書のレイアウトは維持される。また補足説明付文書画像では、文書を翻訳した訳文を生成するのではなく、単語又は連語に対する訳語を付加しているので、訳文を配置する方法に比べて文書中のスペースを有効利用でき、また原文書と訳語との対応関係がより明確となって把握し易くなる。従って、原文書と訳語付の文書とを比較することが容易であり、文書の内容を正しく理解することが容易となる。
また本発明にあっては、原文書画像レイヤを作成する際に、取得した原文書画像に基づいて原文書を再描画するのではなく、取得した原文書画像自体を原文書画像とするので、文字認識の処理における誤認識等の原因によって原文書の内容が改変されることがなく、原文書の内容の改変を防止することができる。また補足説明付文書画像に含まれる補足説明テキストレイヤは、画像データではなく主にテキストからなるデータであるので、補足説明付文書画像の省容量化を図ることができる。また、補足説明テキストレイヤに含まれるテキストを手掛かりとして文書の内容を検索することができるので、文書内容の詳細な検討又は文書内容の再利用等が容易となる。また、原文書画像レイヤとは別に、補足説明テキストレイヤ、印画像レイヤ及び原文書テキストレイヤを個別に作成し、各レイヤを重ねることによって補足説明付文書画像を作成しているので、全てを含む画像を描画する方法に比べて、処理がより簡便となり、各レイヤの取捨選択も容易となる等、本発明は優れた効果を奏する。
実施の形態1に係る本発明の文書画像生成装置の内部構成を示すブロック図である。 原文書画像及び補足説明付文書画像の例を示す模式図である。 実施の形態1に係る文書画像生成装置が実行する処理の手順を示すフローチャートである。 文字認識により得られた文字データの例を示す概念図である。 ステップS14の訳語取得処理の手順を示すフローチャートである。 行データの内容例を示す概念図である。 テキストデータ及び改行データの内容例を示す概念図である。 訳語データの内容例を示す概念図である。 ステップS15の付属情報決定処理の手順を示すフローチャートである。 ステップS15の付属情報決定処理の手順を示すフローチャートである。 後方修正処理の手順を示すフローチャートである。 前方修正処理の手順を示すフローチャートである。 訳語の長さが単語よりも長い場合の例を示す模式図である。 訳語の長さが連語よりも長く、前後に他の訳語が配置される場合の例を示す模式図である。 訳語の開始位置及び終端位置の両方を修正できる付属情報決定処理におけるステップS1512以降の処理の手順を示すフローチャートである。 訳語の長さが連語よりも長く、前後に他の訳語が配置される場合の例を示す模式図である。 ステップS16の補足説明付文書画像生成処理の手順を示すフローチャートである。 補足説明テキストレイヤ及び印画像レイヤの例を示す模式図である。 実施の形態2に係る本発明の文書画像生成装置の内部構成を示すブロック図である。 実施の形態2に係る文書画像生成装置が実行する処理の手順を示すフローチャートである。
以下本発明をその実施の形態を示す図面に基づき具体的に説明する。
(実施の形態1)
図1は、実施の形態1に係る本発明の文書画像生成装置の内部構成を示すブロック図である。本実施の形態に係る文書画像生成装置1は、PC又はサーバ装置等の汎用コンピュータを用いて構成されており、演算を行うCPU11と、演算に伴って発生する一時的な情報を記憶するRAM12と、光ディスク又はメモリカード等の記録媒体2から情報を読み取るCD−ROMドライブ等のドライブ部13と、ハードディスク等の記憶部14とを備えている。CPU11は、記録媒体2から本発明のコンピュータプログラム21をドライブ部13に読み取らせ、読み取ったコンピュータプログラム21を記憶部14に記憶させる。コンピュータプログラム21は必要に応じて記憶部14からRAM12へロードされ、ロードされたコンピュータプログラム21に基づいてCPU11は文書画像生成装置に必要な処理を実行する。なお、コンピュータプログラム21は、インターネット又はLAN等の通信ネットワークを介して図示しない外部のサーバ装置から文書画像生成装置1へダウンロードされて記憶部14に記憶される形態であってもよい。
また記憶部14には、自然言語処理に必要なデータを記録した辞書データベース22を記憶している。辞書データベース22は、言語の文法、構文の出現頻度、及び単語の意味等を示す情報を記録している。辞書データベース22は、最初から記憶部14に記憶されている形態でもよく、また記録媒体2に記録されてあってドライブ部13で記録媒体2から読み取られて記憶部14に記憶される形態でもよい。
また文書画像生成装置1は、使用者が操作することによる各種の処理指示等の情報が入力されるキーボード又はポインティングデバイス等の入力部15と、各種の情報を表示する液晶ディスプレイ等の表示部16とを備えている。更に文書画像生成装置1は、画像読取装置31及び画像形成装置32が接続されたインタフェース部17を備えている。画像読取装置31は、フラットベッドスキャナ又はフィルムスキャナ等のスキャナであり、画像形成装置32は、インクジェットプリンタ又はレーザープリンタ等のプリンタである。なお画像読取装置31及び画像形成装置32は一体に構成されていてもよい。画像読取装置31は、文書原稿に記録された画像を光学的に読み取って画像データを生成し、生成した画像データを文書画像生成装置1へ送信し、インタフェース部17は、画像読取装置31から送信された画像データを受信する。またインタフェース部17は、画像データを画像形成装置32へ送信し、画像形成装置32は、文書画像生成装置1から送信された画像データに基づいて画像を形成する。
CPU11は、本発明のコンピュータプログラム21をRAM12にロードし、ロードしたコンピュータプログラム21に従って、本発明の文書画像生成方法の処理を実行する。文書画像生成方法では、画像読取装置31で文書原稿に記録された画像を読み取ることによって生成した原文書画像から、文書中の単語又は連語に対する訳語を補足説明として付加した補足説明付文書画像を生成する。ここで連語とは、複数の単語から構成され、独自の意味を有する語句であり、名詞句、動詞句、熟語、又は慣用句等が連語に相当する。また連語には、連語に含まれる複数の単語が文書中に連続して配置されている連続連語と、複数の単語が不連続に配置されている不連続連語とがある。不連続連語は、例えば、「He takes difference into consideration.」という文章の「takes…into consideration」のように、連語に含まれる複数の単語の間に他の単語が配置されている連語である。また本実施の形態では、連語の途中で改行が行われている連語についても、不連続連語として扱う。
図2は、原文書画像及び補足説明付文書画像の例を示す模式図であり、図2(a)は原文書画像の例を示し、図2(b)は補足説明付文書画像の例を示す。図2(a)に示す原文書画像には、「X-ray crystallographic analysis also confirmed the molecular structure. 」という内容の文章が含まれている。本発明の文書画像生成方法では、図2(b)に示すように、連語「X-ray crystallographic analysis 」、並びに単語「confirmed 」、「molecular 」及び「structure 」に対する訳語を付した補足説明付文書画像を生成する。連語「X-ray crystallographic analysis 」は本来は連続連語であるものの、図2(a)に示す例では途中で改行が行われているので、不連続連語として扱われる。本実施の形態においては、図2に示すように、横書きの文書に対し、単語又は連語の下側の行間に訳語を配置する例について説明する。
図3は、実施の形態1に係る文書画像生成装置1が実行する処理の手順を示すフローチャートである。CPU11は、RAM12にロードしたコンピュータプログラム21に従って、以下の処理を実行する。文書画像生成装置1は、まず、文書を表す画像である原文書画像を取得する処理を行う(S11)。ステップS11では、画像読取装置31に文書原稿が載置された状態で、使用者が入力部15を操作することにより、入力部15は処理指示を受け付け、CPU11は、インタフェース部17から画像読取装置31へ画像読取の指示を送信する。画像読取装置31は、文書原稿に記録された画像を光学的に読み取ることによって画像データを生成し、生成した画像データを文書画像生成装置1へ送信する。文書画像生成装置1は、画像読取装置31から送信された画像データをインタフェース部17で受信し、受信した画像データをRAM12に記憶することによって、画像データが表す原文書画像を取得する処理を実行する。なお、ステップS11では、予め記憶部14に記憶してある画像データをRAM12に読み出すことによって、原文書画像を取得する処理を実行してもよい。またCPU11は、ステップS11の処理の際に、必要に応じて、解像度の調整、及び画像データのデータ形式の変換等の画像処理を行う。
CPU11は、次に、RAM12に記憶した画像データが表す原文書画像から、文字が含まれている文字領域を抽出し(S12)、抽出した文字領域に含まれる文字を認識する処理を実行する(S13)。ステップS13の処理では、CPU11は、例えば従来のOCR(Optical Character Recognition )技術を利用して、文字領域に含まれる文字の認識と、原文書画像中での文字位置の特定とが行われる。
図4は、文字認識により得られた文字データの例を示す概念図である。図4に示す例は、図2に例を示した原文書画像中から文字を認識した結果の一部を示している。文字認識により得られた文字データは、文字の認識結果と文字に係る付属情報とを含んでなる。文字認識処理では、行内にあるスペースも文字として認識するようになっており、文字データにはスペースを認識した認識結果とその認識結果に係る付属情報とが含まれている。図4に示す文字データは、文字の夫々に順に付した文字番号、各文字の原文書画像における位置、文字領域に付した領域番号、各文字の行内での位置を示す行内位置情報、文字のサイズ、及び文字の内容を示す認識結果を含んでなる。各文字の位置は、原文書画像における文字の左端のX座標、上端のY座標、右端のX座標、及び下端のY座標で表されている。図4には、原文書画像の下端左端を原点とし、座標をポイントの単位で表した例を示している。行内位置情報は、行頭を示す1、行末を示す2、行中を示す0、及び行頭かつ行末を示す3の何れかの数値で文字の行内での位置を示す。例えば、CPU11は、原文書画像中で文字の左側に他の文字が無い場合に行内位置情報の1を生成し、文字の右側に他の文字が無い場合に行内位置情報の2を生成し、右にも左にも他の文字がない場合に行内位置情報の3を生成する処理を行う。文字のサイズとしては、文字のフォントサイズをポイントの単位で示している。CPU11は、ステップS13の文字認識処理により取得した文字データを、RAM12に記憶させる。
CPU11は、次に、文字認識処理により取得した文字データから、認識した文字で構成される文書に含まれる単語又は連語に対する訳語を取得する訳語取得処理を実行する(S14)。図5は、ステップS14の訳語取得処理の手順を示すフローチャートである。CPU11は、ステップS13で取得した文字データに基づいて、文書に含まれる各行におけるテキストの内容を表す行データを生成する(S141)。ステップS141では、CPU11は、文字番号の順に行頭の文字から行末の文字まで文字を並べることによって一行分の行データを生成し、各行毎に行データを生成する。図6は、行データの内容例を示す概念図である。図6に示す例は、図2に例を示した原文書画像中から行データを生成した結果を示している。0を開始値として各行に順に付した行番号に関連付けて、各行におけるテキストの内容を表す行テキストが関連付けられている。行テキストの内容は、文字認識処理で認識された文字を示す文字コードからなる。
CPU11は、次に、生成した行データに基づき、文書に含まれるテキストの内容を表すテキストデータ、及び文書中での改行位置を記録した改行データを生成する(S142)。ステップS142では、CPU11は、各行の行テキストを行番号の順に連結することにより、テキストデータを生成する。このとき、文書に記載されている言語が英語等のスペースで単語が区切られている言語である場合は、各行テキストの最後尾にスペースを挿入した上で行テキストを連結する。これは、スペースで単語が区切られている言語では、改行位置が単語の区切りになっていることが多いためである。日本語等のスペースで単語が区切られていない言語の場合は、CPU11は、スペースを挿入せずに行テキストを連結する。更にステップS142では、CPU11は、行テキストを連結する都度、連結により生成されたテキストデータの中でどの位置が文書中での改行位置に対応した位置であるかを記録することにより、改行データを生成する。
図7は、テキストデータ及び改行データの内容例を示す概念図である。図7(a)はテキストデータの例を示し、図6の例に示す各行データを順に連結した内容となっている。図7中ではテキストデータを2行に亘って表示しているが、データ上ではテキストデータは一行分のデータとなっている。ステップS142では、ステップS12で抽出した文字領域からステップS13で認識した文字が含まれるテキストデータが生成される。即ち、ステップS142で生成されるテキストデータには、一般的に複数の文が含まれる。図7(b)は改行データの内容例を示しており、各行番号が示す行における改行位置を、0を開始値としてテキスト中の各文字に順に付した番号で示している。スペースで単語が区切られている言語の場合は、図7(b)に示すように、改行位置は、行テキストを連結する際に挿入したスペースの位置とすればよい。スペースで単語が区切られていない言語の場合は、各行末の文字の位置を改行位置とすればよい。改行位置で行データを連結したテキストデータを生成することにより、以降の処理で行う自然言語処理では、複数の行に亘って文単位で自然言語処理を実行することができ、効率的で高精度の自然言語処理を実行することが可能となる。例えば、複数の行に亘る連語については、行単位の自然言語処理では連語に含まれる各単語に対する訳語が得られるのみであるのに対し、複数の行に亘った自然言語処理では連語の訳語が得られる。
CPU11は、次に、生成したテキストデータに対して、自然言語処理を行うことにより、テキストデータが表す文章に含まれる単語及び連語の意味を推定する処理を行う(S143)。ステップS143では、CPU11は、辞書データベース22に記録されたデータに基づいて、文章の形態素解析、局所構文解析、及び品詞推定等の自然言語処理を行うことにより、文章中に含まれる単語、及び複数の単語からなる連語を特定し、意味を推定する。CPU11は、次に、文章に含まれる単語及び連語の内、補足説明付文書画像に付加するために訳語を取得すべき単語及び連語を選択する処理を行う(S144)。辞書データベース22に記録してあるデータでは、単語及び連語の夫々について難易度を予め定めてあり、また記憶部14は、補足説明付文書画像中に訳語を付加すべき単語及び連語の難易度を設定した設定情報を記憶している。設定情報の内容は、使用者が入力部15を操作することにより、使用者によって予め設定しておくことが可能である。ステップS144では、CPU11は、設定情報で定められた難易度以上の難易度が定められている単語及び連語を、訳語を取得すべき単語及び連語として選択する。ステップS144により、訳語を配置することが必要な単語及び連語が選択される。なお、ステップS144では、訳語を付加すべき単語及び連語の難易度を入力するための入力画面を表示部16に表示し、入力部15で難易度を入力される処理を行ってもよく、また、使用者が入力部15を操作することにより、訳語を取得すべき単語及び連語を逐一指定する処理を行ってもよい。
CPU11は、次に、選択した単語及び連語の夫々について、辞書データベース22から訳語を取得する処理を行う(S145)。訳語が複数存在する場合は、CPU11は、ステップS143の自然言語処理により推定した意味に対応する訳語を取得する。CPU11は、単語又は連語と取得した訳語とを関連付けた訳語データを生成してRAM12に記憶させ、処理をメインの処理へ戻す。図8は、訳語データの内容例を示す概念図である。訳語を取得すべき連語として「X-ray crystallographic analysis 」が選択され、訳語を取得すべき単語として「confirmed 」、「molecular 」及び「structure 」が選択され、夫々に対して訳語が関連付けられている。
CPU11は、次に、取得した訳語の夫々について、補足説明付文書画像に訳語を配置する際の位置及びサイズ等の訳語の配置状態を示す付属情報を決定する付属情報決定処理を実行する(S15)。図9及び図10は、ステップS15の付属情報決定処理の手順を示すフローチャートである。CPU11は、文字データに基づいて、文書に含まれる各行の行間の大きさを計算する(S1501)。ステップS1501では、CPU11は、文字データから各行の先頭文字の上端及び下端のY座標を取得し、一の行の先頭文字の下端のY座標と次の行の先頭文字の上端のY座標との差を計算することにより、行間の大きさを計算する。CPU11は、計算した行間の大きさを各行に関連付けてRAM12に記憶させる。CPU11は、次に、取得した訳語の中から、一の訳語を選択する(S1502)。
CPU11は、次に、ステップS1502で選択した訳語が不連続連語の訳語であるか否かを判定する(S1503)。訳語が不連続連語の訳語である場合は(S1503:YES)、CPU11は、訳語に係る不連続連語に含まれる単語又は連続単語列の内、行間に訳語を配置することにより訳語を近接させる単語又は連続単語列を決定する処理を行う(S1504)。ステップS1504では、CPU11は、不連続連語に含まれる先頭単語、連続単語列、又は最長単語の長さを互いに比較し、長さが最大である単語又は連続単語列を、訳語を近接させる単語又は連続単語列として決定する処理を行う。長さの比較には、連続単語列に含まれるスペースをも一文字として数えた文字数を比較すればよい。不連続連語の場合、できるだけ長い単語又は連続単語列に訳語を近接させた方が訳語と連語との対応関係を把握し易い。また使用者が文章を文頭から順に読んでいく際には、不連続連語の訳語はできるだけ先頭の単語に近接していた方が意味を理解し易い。従って、ステップS1504の処理により、不連続連語の意味がより理解し易くなる位置に、訳語の配置位置が定められる。
ステップS1503で訳語が不連続連語の訳語ではない場合(S1503:NO)、又はステップS1504が終了した場合は、訳語のフォントサイズを決定する処理を行う(S1505)。ステップS1505では、CPU11は、訳語を近接して配置させるべき単語、連語又は連続単語列が含まれる行と次の行との行間の大きさを取得し、取得した行間の大きさと、訳語を近接して配置させるべき単語、連語又は連続単語列のフォントサイズとを比較する。行間の大きさが、単語、連語又は連続単語列のフォントサイズの40%よりも小さい場合は、CPU11は、訳語のフォントサイズを、単語、連語又は連続単語列のフォントサイズの40%に決定する。行間の大きさが、単語、連語又は連続単語列のフォントサイズの80%よりも大きい場合は、CPU11は、訳語のフォントサイズを、単語、連語又は連続単語列のフォントサイズの80%に決定する。行間の大きさが、単語、連語又は連続単語列のフォントサイズの40%以上80%以下である場合は、CPU11は、訳語のフォントサイズを、行間と同じ大きさに決定する。なお、閾値として、40%又は80%とは異なる値を用いてもよい。
ステップS1505のように、各単語又は連語別に訳語のフォントサイズを決定することにより、画像読取時に行が歪んで読み取られる等の原因により文書中で行間の大きさに変動がある場合でも、各行の文字に重ならないように訳語を配置することができる。なお、本発明では、各単語又は連語別に訳語のフォントサイズを決定するのではなく、行単位で訳語のフォントサイズを決定する処理を行ってもよい。この場合は、一行内で訳語のフォントサイズが変動することがないので、行間に訳語を配置した文書の美観が向上する。また本発明では、文字を認識した文字領域単位で統一した訳語のフォントサイズを定める処理を行ってもよい。この場合は、訳語のフォントサイズが段落等の文字領域内で統一され、行間に訳語を配置した文書の美観が向上する。
CPU11は、次に、単語又は連語に近接する行間の中で、行に沿った方向の訳語を配置すべき開始位置、及び訳語を配置することが可能な終端位置を設定する処理を行う(S1506)。ここで、開始位置は、訳語が配置されたときの訳語の先端の位置であり、終端位置は、訳語がこれ以降には配置されないように定めた限界の位置である。ステップS1506は、CPU11は、訳語を近接して配置させるべき単語、連語又は連続単語列の最初の文字の左端のX座標を、開始位置に設定し、単語、連語又は連続単語列の最後の文字の右端のX座標を、終端位置に設定する。連語の途中に改行が存在する場合は、CPU11は、行末を終端位置に設定する。なお、本発明では、開始位置を、単語、連語又は連続単語列の最初の文字の左端から所定量だけずらした位置としてもよく、終端位置を、最後の文字の右端から所定量だけずらした位置としてもよい。またステップS1506では、CPU11は、以前の処理により開始位置又は終端位置が既に定まっている場合は既に定まっている位置を採用する処理を行う。
CPU11は、次に、訳語の文字数にフォントサイズを乗じることによって訳語の長さを計算し、終端位置の値から開始位置の値を引くことによって訳語を配置可能な配置スペースの長さを計算し、訳語の長さが配置スペースの長さよりも長いか否かを判定する(S1507)。訳語の長さが配置スペースの長さ以下である場合は(S1507:NO)、CPU11は、訳語の長さの圧縮率を1に決定する(S1508)。即ち、訳語を縮小せずに文書中に配置することになる。CPU11は、次に、単語又は連語に近接する行間の中で、行に交差する方向の訳語の配置位置を決定する処理を行う(S1509)。ステップS1509では、CPU11は、訳語を近接して配置させるべき単語、連語又は連続単語列に含まれる各文字の下端のY座標を全て取得し、取得したY座標の値を平均し、Y座標の平均値から訳語のフォントサイズだけ下方へずらした位置を、行に交差する方向の訳語の配置位置と決定する。ステップS1509の処理により、補足説明付文書中で訳語を配置する位置が、文書中の単語、連語又は連続単語列に近接する行間に定まる。またステップS1505以降、ステップS1509までの処理により、ステップS1502で選択した訳語のフォントサイズ、配置位置、及び圧縮率を示す付属情報が決定される。
ステップS1509が終了した後は、CPU11は、取得した訳語の内、まだ付属情報を決定していない訳語があるか否かを判定する(S1510)。まだ付属情報を決定していない訳語がある場合は(S1510:YES)、CPU11は、処理をステップS1502へ戻して、まだ付属情報を決定していない訳語の中から一の訳語を選択する。まだ付属情報を決定していない訳語が無い場合は(S1510:NO)、CPU11は、付属情報決定処理を終了する。
ステップS1507で訳語の長さが配置スペースの長さよりも長い場合は(S1507:YES)、CPU11は、配置スペースの長さの値を訳語の長さの値で除することにより、訳語の長さの圧縮率を計算する(S1511)。CPU11は、次に、計算した圧縮率が予め定めてある閾値より小さいか否かを判定する(S1512)。圧縮率の閾値は、1以下の所定の値に予め定められており、コンピュータプログラム21に含まれているか、又は設定により記憶部14に記憶されている。圧縮率が閾値以上である場合は(S1512:NO)、CPU11は、処理をステップS1509へ進める。
ステップS1512で圧縮率が閾値より小さい場合は(S1512:YES)、CPU11は、行中で、訳語を近接して配置させるべき単語、連語又は連続単語列の後方に隣接する位置に、他の訳語を行間に配置しない単語が存在するか否かを判定する(S1513)。他の訳語を行間に配置しない単語が後方に存在する場合は(S1513:YES)、CPU11は、後方に隣接する単語の最後の文字の右端のX座標を終端位置に設定することにより、終端位置を修正する(S1514)。CPU11は、次に、訳語を配置可能な配置スペースの長さを計算し、訳語の長さが配置スペースの長さよりも長いか否かを判定する(S1515)。訳語の長さが配置スペースの長さ以下である場合は(S1515:NO)、CPU11は、処理をステップS1508へ進める。訳語の長さが配置スペースの長さよりも長い場合は(S1515:YES)、CPU11は、配置スペースの長さの値を訳語の長さの値で除することにより、訳語の長さの圧縮率を計算し(S1516)、処理をステップS1509へ進める。
ステップS1513で、他の訳語を行間に配置しない単語が後方に存在しない場合は(S1513:NO)、CPU11は、行中で、訳語を近接して配置させるべき単語、連語又は連続単語列の前方に隣接する位置に、他の訳語を行間に配置しない単語が存在するか否かを判定する(S1517)。他の訳語を行間に配置しない単語が前方に存在する場合は(S1517:YES)、CPU11は、前方に隣接する単語の中心位置よりも後方に位置する範囲内で、開始位置を前方にずらすことにより、開始位置を修正する(S1518)。ステップS1518では、例えば、CPU11は、訳語の長さから配置スペースの長さを引いた値が、前方に隣接する単語の中心位置から開始位置までの距離より小さい場合は、訳語の長さから配置スペースの長さを引いた値だけ開始位置を前方にずらす処理を行う。また例えば、CPU11は、訳語の長さから配置スペースの長さを引いた値が、前方に隣接する単語の中心位置から開始位置までの距離以上である場合には、前方に隣接する単語の中心位置から所定量だけ後方にずれた位置を開始位置とする処理を行う。開始位置を前方にずらし過ぎた場合は、訳語と単語又は連語との対応関係が不明瞭となるので、ステップS1518の処理では、開始位置を、前方に隣接する単語の中心位置よりも後方の位置とするのが適切である。ステップS1518が終了した後は、CPU11は、処理をステップS1515へ進める。
ステップS1517で、他の訳語を行間に配置しない単語が前方に存在しない場合は(S1517:NO)、CPU11は、訳語を近接して配置させるべき単語、連語又は連続単語列の位置が行末ではなく、当該単語、連語又は連続単語列の後方に隣接する単語の長さから所定の最小訳語間隔を差し引いた値よりも、後方の単語に近接して配置させるべき訳語の長さが小さいか否かを判定する(S1519)。最小訳語間隔は、文書中に配置する訳語が互いに区別できるように訳語の間に確保すべきスペースの長さの下限値である。最小訳語間隔の値としては、予め定められている値を用いるか、又は訳語のフォントサイズに応じた値を用いる。後方の単語の長さから最小訳語間隔を差し引いた値よりも後方の訳語の長さが小さい場合は(S1519:YES)、CPU11は、後方の訳語を配置する位置を本来の位置より後方へずらし、選択中の訳語を配置することが可能な終端位置をより後方へずらす後方修正処理を行う(S1520)。
図11は、後方修正処理の手順を示すフローチャートである。CPU11は、現在の配置スペースの長さと行中の単語の間隔と後方の単語の長さとを足し合わせた値から、後方の訳語の長さと最小訳語間隔とを差し引いた値が、圧縮率を1とした選択中の訳語の長さよりも小さいか否かを判定する(S15201)。前記値が圧縮率1の訳語の長さよりも小さい場合は(S15201:YES)、CPU11は、現在の配置スペースの長さと行中の単語の間隔と後方の単語の長さとを足し合わせた値から、後方の訳語の長さと最小訳語間隔とを差し引いた値で、圧縮率を1とした選択中の訳語の長さを除することにより、訳語の長さの圧縮率を計算する(S15202)。CPU11は、次に、計算した圧縮率を圧縮率1の訳語の長さに乗ずることにより訳語の長さを計算し、訳語の開始位置の座標に訳語の長さを加算した座標を終端位置の座標に設定することにより、訳語の終端位置を修正する(S15203)。CPU11は、次に、後方の単語の開始位置の座標に後方の単語の長さを加算した座標から、後方の訳語の長さを差し引いた座標を、後方の訳語の開始位置に設定することにより、後方の訳語を配置すべき位置を修正する(S15204)。
ステップS15201で、現在の配置スペースの長さと行中の単語の間隔と後方の単語の長さとを足し合わせた値から、後方の訳語の長さと最小訳語間隔とを差し引いた値が、圧縮率を1とした選択中の訳語の長さ以上である場合は(S15201:NO)、訳語の長さの圧縮率を1に決定する(S15205)。CPU11は、次に、訳語の開始位置の座標に圧縮率1の訳語の長さを加算した座標を終端位置の座標に設定することにより、訳語の終端位置を修正する(S15206)。CPU11は、次に、訳語の開始位置の座標に訳語の長さと最小訳語間隔とを加算した座標を、後方の訳語の開始位置に設定することにより、後方の訳語を配置すべき位置を修正する(S15207)。ステップS15204又はステップS15207が終了した後は、CPU11は、後方修正処理を終了し、処理を付属情報決定処理へ戻す。ステップS1520の後方修正処理が終了した後は、CPU11は、処理をステップS1509へ進める。
ステップS1519で、訳語を近接して配置させるべき単語、連語若しくは連続単語列の位置が行末であるか、又は、後方の訳語の長さが、後方の単語の長さから最小訳語間隔を差し引いた値以上である場合は(S1519:NO)、CPU11は、訳語を近接して配置させるべき単語、連語又は連続単語列の位置が行頭ではなく、当該単語、連語又は連続単語列の前方に隣接する単語の長さから最小訳語間隔を差し引いた値よりも、前方の単語に近接して配置させるべき訳語の長さが小さいか否かを判定する(S1521)。前方の単語の長さから最小訳語間隔を差し引いた値よりも前方の訳語の長さが小さい場合は(S1521:YES)、CPU11は、選択中の訳語を配置することが可能な開始位置をより前方へずらす前方修正処理を行う(S1522)。
図12は、前方修正処理の手順を示すフローチャートである。CPU11は、現在の配置スペースの長さと行中の単語の間隔と前方の単語の長さとを足し合わせた値から、前方の訳語の長さと最小訳語間隔とを差し引いた値が、圧縮率を1とした選択中の訳語の長さよりも小さいか否かを判定する(S15221)。前記値が圧縮率1の訳語の長さよりも小さい場合は(S15221:YES)、CPU11は、現在の配置スペースの長さと行中の単語の間隔と前方の単語の長さとを足し合わせた値から、前方の訳語の長さと最小訳語間隔とを差し引いた値で、圧縮率を1とした選択中の訳語の長さを除することにより、訳語の長さの圧縮率を計算する(S15222)。CPU11は、次に、前方の単語の開始位置の座標に前方の訳語の長さと最小訳語間隔とを加算した座標を、訳語の開始位置に設定することにより、選択中の訳語の開始位置を修正する(S15223)。
ステップS15221で、現在の配置スペースの長さと行中の単語の間隔と前方の単語の長さとを足し合わせた値から、前方の訳語の長さと最小訳語間隔とを差し引いた値が、圧縮率を1とした選択中の訳語の長さ以上である場合は(S15221:NO)、訳語の長さの圧縮率を1に決定する(S15224)。CPU11は、次に、訳語の終端位置の座標から圧縮率1の訳語の長さを差し引いた座標を開始位置の座標に設定することにより、訳語の開始位置を修正する(S15225)。ステップS15223又はステップS15225が終了した後は、CPU11は、前方修正処理を終了し、処理を付属情報決定処理へ戻す。ステップS1522の前方修正処理が終了した後は、CPU11は、処理をステップS1509へ進める。またステップS1521で、訳語を近接して配置させるべき単語、連語若しくは連続単語列の位置が行頭であるか、又は、前方の訳語の長さが、前方の単語の長さから最小訳語間隔を差し引いた値以上である場合でも(S1521:NO)、CPU11は、処理をステップS1509へ進める。
ステップS1507以降の処理により、訳語を近接して配置させるべき単語、連語又は連続単語列の長さよりも長い訳語については、訳語の長さが配置スペースに収まるように、訳語の長さが縮小される。訳語の長さを縮小することにより、訳語を配置したときに他の訳語に位置が重なることが無く、単語又は連語と訳語との対応関係が明確となる。また他の訳語を配置すべき単語が前後に存在しない場合には、訳語を近接して配置させるべき単語、連語又は連続単語列に近接した行間の位置に加えて、前後の単語に近接した行間の位置を含む位置に、訳語の行に沿った方向の配置位置が定められる。このため、訳語を配置する際には、前後の単語に近接した部分にまで訳語が配置され、極端に訳語の長さが圧縮されることが無く、読み易い大きさで訳語を配置することができる。図13は、訳語の長さが単語よりも長い場合の例を示す模式図である。図13(a)には、訳語の長さを縮小して訳語を配置した例を示し、図13(b)には、前後の単語に近接した行間の位置にまで訳語を配置した例を示す。単語「show」に対する訳語の長さが長く、後方の単語「an」には訳語が配置されないので、図13(b)に示す例では、後方の単語に近接した部分を含む位置に訳語が配置され、訳語の大きさが図13(a)に比べて読み易い大きさとなっている。
また前述の処理では、前後の単語が共に他の訳語を配置すべき単語であっても、前後の単語に近接して配置すべき他の訳語の長さが単語の長さに比べて十分に短い場合は、訳語を近接して配置させるべき単語、連語又は連続単語列に近接した行間の位置に加えて、前後の単語に近接した行間の位置の一部を含む位置に、訳語の行に沿った方向の配置位置が定められる。図14は、訳語の長さが連語よりも長く、前後に他の訳語が配置される場合の例を示す模式図である。連語「identified as 」に近接して訳語「〜が〜であると認識する」が配置される例を示す。図14(a)は、後方の単語に近接した行間の位置の一部にも訳語を配置した例を示す。後方の単語に近接した行間の位置の一部にも訳語を配置する場合は、訳語の終端位置を後方へずらし、更に、後方の単語に近接して配置すべき他の訳語の位置をより後方にずらすことになる。図14(b)は、後方の単語に近接した行間の位置の一部にも訳語を配置した上で訳語の長さを縮小した例を示す。訳語の終端位置を後方へずらしても、訳語の配置スペースよりも訳語の長さの方がまだ長い場合には、訳語の長さを縮小することになる。図14(c)は、前方の単語に近接した行間の位置の一部にも訳語を配置した例を示す。前方の単語に近接した行間の位置の一部にも訳語を配置する場合は、前方の単語に近接して配置すべき他の訳語の位置は変更せずに、訳語の開始位置を前方へずらすことになる。図14(d)は、前方の単語に近接した行間の位置の一部にも訳語を配置した上で訳語の長さを縮小した例を示す。訳語の開始位置を前方へずらしても、訳語の配置スペースよりも訳語の長さの方がまだ長い場合には、訳語の長さを縮小することになる。このように、前後の単語に他の訳語が配置されていても、単語と訳語との対応関係が保たれる範囲内で前後の単語に近接した部分にまで訳語が配置されることにより、極端に訳語の長さが圧縮されることが無く、読み易い大きさで訳語を配置することができる。なお、本発明は、付属情報決定処理でステップS1519〜S1522の処理を省略する形態であってもよい。この形態では、ステップS1517でNOの場合は処理をステップS1509へ進めればよい。
以上で説明した付属情報決定処理では、訳語の開始位置又は終端位置のいずれか一方のみを修正する処理を行っているが、本発明では、訳語の開始位置及び終端位置の両方を修正できる処理を行ってもよい。訳語の開始位置及び終端位置の両方を修正できる付属情報決定処理を次に説明する。訳語の開始位置及び終端位置の両方を修正できる付属情報決定処理においても、図9のフローチャートで説明したステップS1501〜S1512と同様の処理を行う。図15は、訳語の開始位置及び終端位置の両方を修正できる付属情報決定処理におけるステップS1512以降の処理の手順を示すフローチャートである。
ステップS1512で圧縮率が閾値より小さい場合は(S1512:YES)、CPU11は、行中で、訳語を近接して配置させるべき単語、連語又は連続単語列の後方に隣接する位置に、他の訳語を行間に配置しない単語が存在するか否かを判定する(S1531)。他の訳語を行間に配置しない単語が後方に存在する場合は(S1531:YES)、CPU11は、後方に隣接する単語の最後の文字の右端のX座標を終端位置に設定することにより、訳語の終端位置を修正し、訳語の長さの圧縮率を計算する(S1532)。ステップS1532では、CPU11は、訳語の長さが配置スペースの長さよりも長いか否かを判定し、訳語の長さが配置スペースの長さよりも長い場合は、配置スペースの長さの値を訳語の長さの値で除することにより圧縮率を計算し、訳語の長さが配置スペースの長さ以下である場合は、圧縮率を1にする処理を行う。CPU11は、次に、計算した圧縮率が予め定めてある閾値より小さいか否かを判定する(S1533)。圧縮率が閾値以上である場合は(S1533:NO)、CPU11は、処理をステップS1509へ進める。
ステップS1533で圧縮率が閾値より小さい場合は(S1533:YES)、CPU11は、行中で、訳語を近接して配置させるべき単語、連語又は連続単語列の前方に隣接する位置に、他の訳語を行間に配置しない単語が存在するか否かを判定する(S1534)。他の訳語を行間に配置しない単語が前方に存在する場合は(S1534:YES)、CPU11は、前方に隣接する単語の中心位置よりも後方に位置する範囲内で、開始位置を前方にずらすことにより、訳語の開始位置を修正し、訳語の長さの圧縮率を計算する(S1535)。CPU11は、次に、処理をステップS1509へ進める。
ステップS1531で、他の訳語を行間に配置しない単語が後方に存在しない場合は(S1531:NO)、CPU11は、行中で、訳語を近接して配置させるべき単語、連語又は連続単語列の前方に隣接する位置に、他の訳語を行間に配置しない単語が存在するか否かを判定する(S1536)。他の訳語を行間に配置しない単語が前方に存在する場合は(S1536:YES)、CPU11は、訳語の開始位置を修正し、訳語の長さの圧縮率を計算する(S1537)。CPU11は、次に、計算した圧縮率が閾値より小さいか否かを判定する(S1538)。圧縮率が閾値以上である場合は(S1538:NO)、CPU11は、処理をステップS1509へ進める。圧縮率が閾値より小さい場合は(S1538:YES)、CPU11は、訳語を近接して配置させるべき単語、連語又は連続単語列の位置が行末ではなく、当該単語、連語又は連続単語列の後方に隣接する単語の長さから所定の最小訳語間隔を差し引いた値よりも、後方の単語に近接して配置させるべき訳語の長さが小さいか否かを判定する(S1539)。訳語を近接して配置させるべき単語、連語若しくは連続単語列の位置が行末であるか、又は、後方の訳語の長さが、後方の単語の長さから最小訳語間隔を差し引いた値以上である場合は(S1539:NO)、CPU11は、処理をステップS1509へ進める。後方の単語の長さから最小訳語間隔を差し引いた値よりも後方の訳語の長さが小さい場合は(S1539:YES)、CPU11は、後方修正処理を行う(S1540)。ステップS1540の後方修正処理では、図11のフローチャートで説明したステップS1520の後方修正処理と同様の処理を実行する。ステップS1540が終了した後は、CPU11は、処理をステップS1509へ進める。
ステップS1536で、訳語を近接して配置させるべき単語、連語又は連続単語列の前方に隣接する位置に、他の訳語を行間に配置しない単語が存在しない場合は(S1536:NO)、CPU11は、訳語を近接して配置させるべき単語、連語又は連続単語列の位置が行末ではなく、当該単語、連語又は連続単語列の後方に隣接する単語の長さから所定の最小訳語間隔を差し引いた値よりも、後方の単語に近接して配置させるべき訳語の長さが小さいか否かを判定する(S1541)。後方の単語の長さから最小訳語間隔を差し引いた値よりも後方の訳語の長さが小さい場合は(S1541:YES)、CPU11は、後方修正処理を行う(S1542)。ステップS1542の後方修正処理では、図11のフローチャートで説明したステップS1520の後方修正処理と同様の処理を実行する。CPU11は、次に、ステップS1542の後方修正処理で計算した圧縮率が閾値より小さいか否かを判定する(S1543)。圧縮率が閾値以上である場合は(S1543:NO)、CPU11は、処理をステップS1509へ進める。
ステップS1534で、他の訳語を行間に配置しない単語が前方に存在しない場合(S1534:NO)、ステップS1541で、訳語を近接して配置させるべき単語、連語若しくは連続単語列の位置が行末であるか、又は、後方の訳語の長さが、後方の単語の長さから最小訳語間隔を差し引いた値以上である場合(S1541:NO)、或いは、ステップS1543で圧縮率が閾値より小さい場合は(S1543:YES)、CPU11は、訳語を近接して配置させるべき単語、連語又は連続単語列の位置が行頭ではなく、当該単語、連語又は連続単語列の前方に隣接する単語の長さから最小訳語間隔を差し引いた値よりも、前方の単語に近接して配置させるべき訳語の長さが小さいか否かを判定する(S1544)。訳語を近接して配置させるべき単語、連語若しくは連続単語列の位置が行頭であるか、又は、前方の訳語の長さが、前方の単語の長さから最小訳語間隔を差し引いた値以上である場合は(S1544:NO)、CPU11は、処理をステップS1509へ進める。前方の単語の長さから最小訳語間隔を差し引いた値よりも前方の訳語の長さが小さい場合は(S1544:YES)、CPU11は、前方修正処理を行う(S1545)。ステップS1545の前方修正処理では、図12のフローチャートで説明したステップS1522の前方修正処理と同様の処理を実行する。CPU11は、次に、処理をステップS1509へ進める。
ステップS1531〜S1541の処理を実行することにより、訳語の開始位置及び終端位置の両方を修正することができる。図16は、訳語の長さが連語よりも長く、前後に他の訳語が配置される場合の例を示す模式図である。図16に示す例は、後方の単語に近接した行間の位置の一部にも訳語を配置し、更に、前方の単語に近接した行間の位置の一部にも訳語を配置した例である。このように、前後の単語に近接した行間の位置を用いて訳語を配置することにより、訳語の長さをできるだけ圧縮せずに、読み易い大きさで訳語を配置することができる。
以上の如く、ステップS15の付属情報決定処理を終了した後は、訳語データに含まれる訳語に、決定した付属情報を関連付けた上で、訳語データをRAM12に記憶させ、処理をメインの処理へ戻す。ステップS13〜S15の処理は、ステップS12で抽出した文字領域の夫々について実行される。
CPU11は、次に、原文書画像中に、付属情報で定められた配置状態で夫々の訳語を配置した補足説明付文書画像を生成する補足説明付文書画像生成処理を行う(S16)。図17は、ステップS16の補足説明付文書画像生成処理の手順を示すフローチャートである。CPU11は、まず、原文書画像と同一の大きさのレイヤ中に、訳語データに含まれる夫々の訳語のテキストデータを、付属情報が示すサイズで、付属情報が示す配置位置に配置した補足説明テキストレイヤを生成する(S161)。具体的には、付属情報が示すフォントサイズで生成した訳語の長さを圧縮率で圧縮し、訳語の先頭文字の左端は開始位置となり、訳語の下端は行に交差する方向の配置位置となるように、各訳語のテキストを配置した画像を生成する。ステップS161では、生成する補足説明テキストレイヤ中の訳語のテキストデータ以外の部分は透明にしておく。CPU11は、次に、原文書画像と同一の大きさの画像中に、訳語を取得した不連続連語に対する下線に相当する線を、不連続連語であることを示す印として配置した印画像レイヤを生成する(S162)。ステップS162では、生成する印画像レイヤ中の線以外の部分は透明にしておく。
図18は、補足説明テキストレイヤ及び印画像レイヤの例を示す模式図である。図18に示す例は、図2に例を示した原文書画像中から生成した補足説明テキストレイヤ及び印画像レイヤである。図18(a)は、補足説明テキストレイヤを示し、原文書画像中の単語及び連語に対する訳語が配置されている。図18(b)は、印画像レイヤを示し、原文書画像中の連語「X-ray crystallographic analysis 」に対する下線に相当する線が配置されている。この連語は、連語の途中で改行が行われることにより不連続連語となっており、連語に対する下線に相当する線が配置される。
CPU11は、次に、原文書画像と同一の大きさの透明なレイヤ中に、原文書画像中の各文字の位置に相当する位置に各文字を示すテキストデータを透明にした状態で配置した原文書テキストレイヤを生成し(S163)、原文書画像を画像レイヤにした原文書画像レイヤを生成する(S164)。CPU11は、次に、補足説明テキストレイヤ、印画像レイヤ、及び原文書テキストレイヤを、原文書画像レイヤに重ねることにより、補足説明付文書画像を生成し(S165)、生成した補足説明付文書画像を表す画像データをRAM12に記憶させ、処理をメインの処理へ戻す。例えば、ステップS16では、PDF(Portable Document Format)形式の画像で補足説明付文書画像を生成することとし、CPU11は、PDF形式のレイヤとして各レイヤを生成し、生成した補足説明テキストレイヤ、印画像レイヤ、及び原文書テキストレイヤを、原文書画像レイヤに重ねることにより、PDF形式の補足説明付文書画像を生成する。図2(b)に示す補足説明付文書画像は、図2(a)に示す原文書画像に図18に示す補足説明テキストレイヤ及び印画像レイヤ並びに透明な原文書テキストレイヤを重ねることにより生成した補足説明付文書画像である。原文書画像レイヤに補足説明テキストレイヤ及び原文書テキストレイヤを重ねた補足説明付文書画像を生成することにより、文書の内容及び訳語の内容を補足説明付文書画像から検索することが可能となり、また文書の内容及び訳語の内容をコピーすることも容易となる。なお、印画像レイヤ及び原文書テキストレイヤは、補足説明付文書画像を生成するために必須のものではなく、ステップS16では、原文書画像レイヤに少なくとも補足説明テキストレイヤを重ねることにより、印画像レイヤ及び/又は原文書テキストレイヤを含まない補足説明付文書画像を生成する処理を行ってもよい。
CPU11は、次に、補足説明付文書画像を表す画像データを、インタフェース部17から画像形成装置32へ送信し、画像形成装置32に画像データに基づいて補足説明付文書画像を形成させる処理を行い(S17)、本発明の文書画像生成の処理を終了する。なお、本発明では、ステップS17で補足説明付文書画像を形成する処理を行わずに、表示部16で表示するか、又は補足説明付文書画像を表す画像データを記憶部14に記憶させる処理を行ってもよい。
以上の処理により、図2(b)に示す如き補足説明付文書画像が生成される。文書に含まれる単語又は連語に対する訳語が、単語又は連語に近接する行間に配置されており、文書を読む使用者は、訳語を利用して文書の内容を理解することができる。なお、図2(b)には、単語又は連語に近接する上下の行間の内、下側の行間に訳語を配置する例を示しているが、本発明では、単語又は連語の上側の行間に訳語を配置してもよい。補足説明付文書画像は、原文書画像レイヤに補足説明テキストレイヤを重ねることによって生成されるので、文書に含まれる文字のサイズ及び位置は不変であり、文書のレイアウトは維持される。従って、原文書と訳語付の文書とを比較することが容易であり、文書の内容を正しく理解することが容易となる。また補足説明付文書画像では、文書を翻訳した訳文を生成するのではなく、単語又は連語に対する訳語を付加しているので、原文書と訳語との対応関係は明らかであり、把握し易い。また原文書での単語の綴り間違い、文字認識の処理における誤認識、又は自然言語処理の不備による誤訳等があった場合でも、誤った訳語が付加されるだけであって、前後の文脈から訳語が誤っていることを推測することは容易であり、使用者が文書の内容を正しく理解することを大きく妨げることはない。また本発明では、原文書に対する加工を行わないので、文字認識の処理における誤認識等の原因により誤った内容の原文書を生成することが無く、使用者は正しく文書の内容を理解することができる。
また図2(b)に示す如く、補足説明付文書画像では、不連続連語に対する訳語を付加すると共に、不連続連語に下線を付してある。下線を付してあることにより、不連続連語の範囲が明確に示されており、使用者が不連続連語の範囲を把握し、文書の意味を理解することが容易となる。なお、不連続連語であることを示す印としては、下線に限るものではなく、本発明では、波線を付すか、又は同一の不連続連語に含まれる単語には同一の数字を付す等、その他の印を補足説明付文書画像中に配置する処理を行ってもよい。また本発明では、不連続連語に限らず、連続連語についても連語の範囲を明確に示す印を補足説明付文書画像中に配置する処理を行ってもよい。この場合は、連続連語を示す印と不連続連語を示す印としては互いに異なる印を用いることが望ましい。
なお、本実施の形態においては、本発明の文書画像生成装置1は画像読取装置31及び画像形成装置32が接続された汎用コンピュータである形態を示したが、本発明の文書画像生成装置は、画像読取機能を備えたスキャナ又は複合機等の画像処理装置であってもよい。また本実施の形態においては、コンピュータプログラム21に基づいて本発明の文書画像生成方法を実行する形態を示したが、これに限るものではなく、本発明の文書画像生成装置は、本発明の文書画像生成方法に係る処理の一部又は全部を実行する専用の情報処理回路を備えて本発明に係る処理を実行する形態であってもよい。
また本実施の形態においては、画像読取装置31で生成した原文書画像に対して本発明に係る処理を実行する形態を示したが、本発明の文書画像生成装置は、その他の方法で得られた原文書画像に対して本発明に係る処理を実行する形態であってもよい。例えば、文書画像生成装置1は、ファクシミリ通信又は電子メール等により外部から送信された画像データを受信し、受信した画像データに対して文書画像生成方法の処理を実行する形態であってもよい。また例えば、文書画像生成装置1は、インタフェース部17に撮影装置を接続してあり、撮影装置が文書を撮影することによって取得した原文書画像に対して文書画像生成方法の処理を実行する形態であってもよい。
(実施の形態2)
図19は、実施の形態2に係る本発明の文書画像生成装置1の内部構成を示すブロック図である。本実施の形態に係る文書画像生成装置1は、外部のウェブサーバ装置4が接続されている通信ネットワークNに接続された通信部18を備えている。通信部18は、通信ネットワークNを介してウェブサーバ装置4から送信されたウェブページ用のデータを受信し、CPU11は、受信したデータに基づいたウェブページを表示部16に表示させる。文書画像生成装置1のその他の構成は実施の形態1と同様であり、対応する部分に同符号を付してその説明を省略する。実施の形態2に係る文書画像生成装置1は、ウェブページを表示部16に表示する際に、ウェブページに含まれる単語又は連語に対する訳語を生成して表示する処理を行う。
図20は、実施の形態2に係る文書画像生成装置1が実行する処理の手順を示すフローチャートである。CPU11は、RAM12にロードしたコンピュータプログラム21に従って、以下の処理を実行する。文書画像生成装置1は、通信ネットワークNを介してウェブサーバ装置4から送信されたウェブページ用のデータを通信部18で受信し、受信したデータに基づいて、ウェブページである原文書画像を表す画像データを生成することにより、ウェブページ用のデータと原文書画像とを取得する(S21)。CPU11は、ウェブページ用のデータと原文書画像を表す画像データとをRAM12に記憶させる。CPU11は、次に、RAM12に記憶した画像データが表す原文書画像から、文字が含まれている文字領域を抽出し(S22)、抽出した文字領域に含まれる文字を認識する処理を実行する(S23)。ステップS22の処理では、実施の形態1におけるステップS12と同様の処理を行い、ステップS23の処理では、実施の形態1におけるステップS13と同様の処理を行う。
CPU11は、次に、RAM12に記憶したウェブページ用のデータから、テキストデータを抽出し、抽出したテキストデータとステップS23で認識した文字とを比較し、文字をテキストデータに合わせるように、認識した文字を修正する処理を行う(S24)。なお、ウェブページ用のデータが画像データ等のテキストデータを抽出できないデータである場合は、ステップS24の処理を省略してもよい。CPU11は、次に、認識した文字で構成される文書に含まれる単語又は連語に対する訳語を取得する訳語取得処理を実行し(S25)、取得した訳語の夫々について付属情報を決定する付属情報決定処理を実行する(S26)。ステップS25の処理では、実施の形態1におけるステップS14と同様の処理を行い、ステップS26の処理では、実施の形態1におけるステップS15と同様の処理を行う。
CPU11は、次に、原文書画像中に、付属情報で定められた配置状態で夫々の訳語を配置した補足説明付文書画像を生成する補足説明付文書画像生成処理を行う(S27)。ステップS27の処理では、実施の形態1におけるステップS16と同様の処理を行う。CPU11は、次に、生成した補足説明付文書画像を表示部16に表示させる処理を行い(S28)、本発明の文書画像生成の処理を終了する。なお、文書画像生成装置1は、更に、図示しない画像形成装置を用いて補足説明付文書画像を形成する処理を行ってもよい。
以上の処理により、ウェブページに含まれる単語又は連語に対する訳語が行間に配置された補足説明付文書画像が表示部16に表示される。ウェブページを閲覧する使用者は、外国語で記載されたウェブページであっても、訳語を利用してウェブページの内容を理解することができる。補足説明付文書画像は、元のウェブページである原文書画像レイヤに補足説明テキストレイヤを重ねることによって生成されるので、使用者はウェブページのレイアウトが維持された状態で訳語付のウェブページを閲覧することができる。
なお、以上の実施の形態1及び2では、補足説明として単語又は連語に対する訳語を取得し、訳語を行間に配置した補足説明付文書画像を生成する形態を示したが、本発明に係る補足説明は訳語に限るものではない。例えば、本発明は、補足説明として、単語又は連語の読みを読み仮名、発音記号又はピンイン記号等で説明した読み情報を、単語又は連語に近接した行間に配置する形態であってもよい。この形態の場合は、文書を読む使用者は、文書中の単語又は連語の読みを確認することができる。また例えば、本発明は、補足説明として、単語又は連語の意味、同義語又は由来等を説明した注釈を、単語又は連語に近接した行間に配置する形態であってもよい。この形態の場合は、文書を読む使用者は、たとえ母国語であっても難解な言葉又は専門用語等を理解することができる。これらの形態では、文書画像生成装置1は、単語又は連語に関連づけた読み情報又は注釈を辞書データベース22に予め記録しておき、辞書データベース22から読み情報又は注釈を取得する処理を行う。
また以上の実施の形態1及び2では、横書きの文書に対して本発明を適用する例を示したが、本発明は縦書きの文書に対しても適用可能である。例えば、日本語による縦書きの文書に対して本発明の処理を実行する形態であってもよく、この形態の場合は、訳語は単語又は連語に近接する右側の行間に配置すればよい。また以上の実施の形態1及び2では、文書画像生成装置1は辞書データベース22を内部の記憶部14に記録してある形態を示したが、これに限るものではなく、本発明の文書画像生成装置は、外部の辞書データベースを用いて本発明に係る処理を実行する形態であってもよい。例えば、文書画像生成装置の外部のサーバ装置に辞書データベースを記憶しておき、文書画像生成装置は、必要に応じて外部の辞書データベースから必要なデータを読み出すことによって本発明に係る処理を実行してもよい。
1 文書画像生成装置
11 CPU
12 RAM
14 記憶部
16 表示部
17 インタフェース部
18 通信部
2 記録媒体
21 コンピュータプログラム
22 辞書データベース
31 画像読取装置
32 画像形成装置

Claims (11)

  1. 複数の行を含んでなる文書を表す画像から、文書に含まれる単語、又は複数の単語からなる連語に対する補足説明を文書に付加した補足説明付文書を表す画像を生成する文書画像生成装置において、
    文書を表す原文書画像を取得する原文書画像取得手段と、
    該原文書画像取得手段が取得した原文書画像に含まれる文字の認識及び原文書画像中での文字位置の特定を行う文字認識手段と、
    該文字認識手段が認識した文字で構成される文書に対して自然言語処理を行うことによって、文書に含まれる単語又は連語の意味を確定し、各単語又は連語の意味に対応する補足説明を取得する補足説明取得手段と、
    文書に含まれる単語又は連語の内で、文書中に補足説明を配置すべき単語又は連語を選択する手段と、
    前記文字認識手段が認識した文字の位置に基づき、各単語又は連語に対応して取得した補足説明について、文書中で補足説明を配置すべき位置として、原文書画像中で該単語又は連語に近接した行間の位置を定める位置決定手段と、
    該位置決定手段が定めた原文書画像中の位置に相当する位置に各補足説明を配置した補足説明テキストレイヤを、原文書画像からなる原文書画像レイヤに重ねることにより、補足説明付文書を表す画像を生成する画像生成手段とを備え、
    前記位置決定手段は、
    補足説明の長さが当該補足説明に対応する単語又は連語の長さよりも長いか否かを判定する手段と、
    補足説明の長さが当該補足説明に対応する単語又は連語の長さよりも長い場合に、前記単語又は連語の前後の単語が他の補足説明を配置すべき単語であるか否かを判定する手段と、
    補足説明に対応する単語又は連語の前後の単語のいずれか又は両方が他の補足説明を配置すべき単語ではない場合に、文書中で補足説明を配置すべき位置として、補足説明に対応する単語又は連語に近接した行間の位置と、前記単語又は連語の前後の単語の内で他の補足説明を配置すべき単語ではない単語に近接する行間の位置とを含む位置を定める手段と、
    補足説明に対応する単語又は連語の前後の単語のいずれか又は両方が他の補足説明を配置すべき単語である場合に、補足説明に対応する単語又は連語の前後の単語の内で他の補足説明を配置すべき単語の長さから所定長を差し引いた長さよりも他の補足説明の長さの方が短いか否かを判定する手段と、
    他の補足説明を配置すべき単語の長さから所定長を差し引いた長さよりも他の補足説明の長さの方が短い場合に、文書中で補足説明を配置すべき位置として、補足説明に対応する単語又は連語に近接した行間の位置と、前記単語又は連語の前後の単語の内で他の補足説明を配置すべき単語であって該単語の長さから所定長を差し引いた長さよりも他の補足説明の長さの方が短い単語に近接する行間の位置の一部とを含む位置を定める手段と、
    文書中で補足説明を配置すべき位置として定めた位置に配置できる文字列の長さよりも長い補足説明の長さを縮小する手段と
    を有することを特徴とする文書画像生成装置。
  2. 前記位置決定手段は、
    補足説明を取得した連語が、該連語に含まれる複数の単語が文書中で不連続に配置されている不連続連語であるか否かを判定する手段と、
    補足説明を取得した連語が不連続連語である場合に、文書中で補足説明を配置すべき位置として、不連続連語に含まれる先頭単語、不連続連語に含まれる連続単語列、又は不連続連語に含まれる最長単語のいずれかに原文書画像中で近接した行間の位置を定める手段と
    を有することを特徴とする請求項1に記載の文書画像生成装置。
  3. 前記画像生成手段は、
    原文書画像中の不連続連語の位置に相当する位置に不連続連語であることを示す印を配置した画像からなる印画像レイヤを、原文書画像レイヤに更に重ねるように構成してあること
    を特徴とする請求項2に記載の文書画像生成装置。
  4. 前記画像生成手段は、
    原文書画像に含まれる各文字を示すテキストデータを、透明にした状態で原文書画像中の各文字の位置に相当する位置に配置した原文書テキストレイヤを、原文書画像レイヤに更に重ねるように構成してあること
    を特徴とする請求項1から3までのいずれか一つに記載の文書画像生成装置。
  5. 前記補足説明取得手段は、
    補足説明として、単語若しくは連語に対する訳語、単語若しくは連語の読み、又は単語若しくは連語に対する注釈を取得するように構成してあること
    を特徴とする請求項1から4までのいずれか一つに記載の文書画像生成装置。
  6. 前記補足説明取得手段は、
    前記文字認識手段が認識した文字で構成される行毎の文字列を行順に連結してなる文書の内容に対して自然言語処理を行うように構成してあること
    を特徴とする請求項1から5までのいずれか一つに記載の文書画像生成装置。
  7. 複数の行を含んでなる文書を表す画像から、文書に含まれる単語、又は複数の単語からなる連語に対する補足説明として訳語を文書に付加した補足説明付文書を表す画像を生成する文書画像生成装置において、
    文書を表す原文書画像を取得する原文書画像取得手段と、
    該原文書画像取得手段が取得した原文書画像に含まれる文字の認識及び原文書画像中での文字位置の特定を行う文字認識手段と、
    該文字認識手段が認識した文字で構成される行毎の文字列を行順に連結してなる文書の内容に対して自然言語処理を行うことによって、文書に含まれる単語又は連語の意味を確定し、各単語又は連語の意味に対応する訳語を取得する手段と、
    文書に含まれる単語又は連語の内で、訳語を付加すべき単語又は連語を選択する手段と、
    前記文字認識手段が認識した文字の位置に基づき、各単語又は連語に対応して取得した訳語について、文書中で訳語を配置すべき位置として、原文書画像中で該単語又は連語に近接した行間の位置を定める位置決定手段と、
    該位置決定手段が定めた原文書画像中の位置に相当する位置に各訳語を配置した補足説明テキストレイヤ、原文書画像中の不連続連語の位置に相当する位置に不連続連語であることを示す印を配置した画像からなる印画像レイヤ、及び原文書画像に含まれる各文字を示すテキストデータを透明にした状態で原文書画像中の各文字の位置に相当する位置に配置した原文書テキストレイヤを、原文書画像からなる原文書画像レイヤに重ねることにより、補足説明付文書を表す画像を生成する手段とを備え、
    前記位置決定手段は、
    訳語を取得した連語の内、連語に含まれる複数の単語が文書中で不連続に配置されている不連続連語について、文書中で訳語を配置すべき位置として、不連続連語に含まれる先頭単語、不連続連語に含まれる連続単語列、又は不連続連語に含まれる最長単語の内で長さが最大のものに原文書画像中で近接した行間の位置を定める手段と、
    訳語の内で当該訳語に対応する単語又は連語の長さよりも長い訳語について、前記単語又は連語の前後の単語が他の訳語を配置すべき単語であるか否かを判定する手段と、
    訳語に対応する単語又は連語の前後の単語のいずれか又は両方が他の訳語を配置すべき単語ではない場合に、文書中で訳語を配置すべき位置として、訳語に対応する単語又は連語に近接した行間の位置と、前記単語又は連語の前後の単語の内で他の訳語を配置すべき単語ではない単語に近接する行間の位置とを含む位置を定める手段と、
    訳語に対応する単語又は連語の前後の単語のいずれか又は両方が他の訳語を配置すべき単語である場合に、訳語に対応する単語又は連語の前後の単語の内で他の訳語を配置すべき単語の長さから所定長を差し引いた長さよりも他の訳語の長さの方が短いか否かを判定する手段と、
    他の訳語を配置すべき単語の長さから所定長を差し引いた長さよりも他の訳語の長さの方が短い場合に、文書中で訳語を配置すべき位置として、訳語に対応する単語又は連語に近接した行間の位置と、前記単語又は連語の前後の単語の内で他の訳語を配置すべき単語であって該単語の長さから所定長を差し引いた長さよりも他の訳語の長さの方が短い単語に近接する行間の位置の一部とを含む位置を定める手段と、
    文書中で訳語を配置すべき位置として定めた位置に配置できる文字列の長さよりも長い訳語の長さを縮小する手段と
    を有することを特徴とする文書画像生成装置。
  8. 外部の装置から送信されたウェブページ用のデータを受信する手段と、
    該手段が受信したデータに基づいてウェブページを表示する手段とを更に備え、
    前記原文書画像取得手段は、
    原文書画像として、ウェブページを取得する手段を有すること
    を特徴とする請求項1からまでのいずれか一つに記載の文書画像生成装置。
  9. 複数の行を含んでなる文書を表す画像から、文書に含まれる単語、又は複数の単語からなる連語に対する補足説明を文書に付加した補足説明付文書を表す画像を生成する方法において、
    文書を表す原文書画像を取得するステップと、
    取得した原文書画像に含まれる文字の認識及び原文書画像中での文字位置の特定を行うステップと、
    認識した文字で構成される文書に対して自然言語処理を行うことによって、文書に含まれる単語又は連語の意味を確定し、各単語又は連語の意味に対応する補足説明を取得するステップと、
    文書に含まれる単語又は連語の内で、文書中に補足説明を配置すべき単語又は連語を選択するステップと、
    認識した文字の位置に基づき、各単語又は連語に対応して取得した補足説明について、文書中で補足説明を配置すべき位置として、原文書画像中で該単語又は連語に近接した行間の位置を定める位置決定ステップと、
    該位置決定ステップで定めた原文書画像中の位置に相当する位置に各補足説明を配置した補足説明テキストレイヤを、原文書画像からなる原文書画像レイヤに重ねることにより、補足説明付文書を表す画像を生成するステップとを含み、
    前記位置決定ステップは、
    補足説明の長さが当該補足説明に対応する単語又は連語の長さよりも長いか否かを判定するステップと、
    補足説明の長さが当該補足説明に対応する単語又は連語の長さよりも長い場合に、前記単語又は連語の前後の単語が他の補足説明を配置すべき単語であるか否かを判定するステップと、
    補足説明に対応する単語又は連語の前後の単語のいずれか又は両方が他の補足説明を配置すべき単語ではない場合に、文書中で補足説明を配置すべき位置として、補足説明に対応する単語又は連語に近接した行間の位置と、前記単語又は連語の前後の単語の内で他の補足説明を配置すべき単語ではない単語に近接する行間の位置とを含む位置を定めるステップと、
    補足説明に対応する単語又は連語の前後の単語のいずれか又は両方が他の補足説明を配置すべき単語である場合に、補足説明に対応する単語又は連語の前後の単語の内で他の補足説明を配置すべき単語の長さから所定長を差し引いた長さよりも他の補足説明の長さの方が短いか否かを判定するステップと、
    他の補足説明を配置すべき単語の長さから所定長を差し引いた長さよりも他の補足説明の長さの方が短い場合に、文書中で補足説明を配置すべき位置として、補足説明に対応する単語又は連語に近接した行間の位置と、前記単語又は連語の前後の単語の内で他の補足説明を配置すべき単語であって該単語の長さから所定長を差し引いた長さよりも他の補足説明の長さの方が短い単語に近接する行間の位置の一部とを含む位置を定めるステップと、
    文書中で補足説明を配置すべき位置として定めた位置に配置できる文字列の長さよりも長い補足説明の長さを縮小するステップと
    を含むことを特徴とする文書画像生成方法。
  10. コンピュータに、複数の行を含んでなる文書を表す画像から、文書に含まれる単語、又は複数の単語からなる連語に対する補足説明を文書に付加した補足説明付文書を表す画像を生成する処理を実行させるためのコンピュータプログラムにおいて、
    文書を表す原文書画像を取得するステップと、
    取得した原文書画像に含まれる文字の認識及び原文書画像中での文字位置の特定を行うステップと、
    認識した文字で構成される文書に対して自然言語処理を行うことによって、文書に含まれる単語又は連語の意味を確定し、各単語又は連語の意味に対応する補足説明を取得するステップと、
    文書に含まれる単語又は連語の内で、文書中に補足説明を配置すべき単語又は連語を選択するステップと、
    認識した文字の位置に基づき、各単語又は連語に対応して取得した補足説明について、文書中で補足説明を配置すべき位置として、原文書画像中で該単語又は連語に近接した行間の位置を定める位置決定ステップと、
    該位置決定ステップで定めた原文書画像中の位置に相当する位置に各補足説明を配置した補足説明テキストレイヤを、原文書画像からなる原文書画像レイヤに重ねることにより、補足説明付文書を表す画像を生成するステップとを含み、
    前記位置決定ステップは、
    補足説明の長さが当該補足説明に対応する単語又は連語の長さよりも長いか否かを判定するステップと、
    補足説明の長さが当該補足説明に対応する単語又は連語の長さよりも長い場合に、前記単語又は連語の前後の単語が他の補足説明を配置すべき単語であるか否かを判定するステップと、
    補足説明に対応する単語又は連語の前後の単語のいずれか又は両方が他の補足説明を配置すべき単語ではない場合に、文書中で補足説明を配置すべき位置として、補足説明に対応する単語又は連語に近接した行間の位置と、前記単語又は連語の前後の単語の内で他の補足説明を配置すべき単語ではない単語に近接する行間の位置とを含む位置を定めるステップと、
    補足説明に対応する単語又は連語の前後の単語のいずれか又は両方が他の補足説明を配置すべき単語である場合に、補足説明に対応する単語又は連語の前後の単語の内で他の補足説明を配置すべき単語の長さから所定長を差し引いた長さよりも他の補足説明の長さの方が短いか否かを判定するステップと、
    他の補足説明を配置すべき単語の長さから所定長を差し引いた長さよりも他の補足説明の長さの方が短い場合に、文書中で補足説明を配置すべき位置として、補足説明に対応する単語又は連語に近接した行間の位置と、前記単語又は連語の前後の単語の内で他の補足説明を配置すべき単語であって該単語の長さから所定長を差し引いた長さよりも他の補足説明の長さの方が短い単語に近接する行間の位置の一部とを含む位置を定めるステップと、
    文書中で補足説明を配置すべき位置として定めた位置に配置できる文字列の長さよりも長い補足説明の長さを縮小するステップと
    を含む処理をコンピュータに実行させることを特徴とするコンピュータプログラム。
  11. 請求項10に記載のコンピュータプログラムを記録してあることを特徴とするコンピュータでの読み取りが可能な記録媒体。
JP2009255373A 2009-11-06 2009-11-06 文書画像生成装置、文書画像生成方法、コンピュータプログラム及び記録媒体 Active JP4948586B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009255373A JP4948586B2 (ja) 2009-11-06 2009-11-06 文書画像生成装置、文書画像生成方法、コンピュータプログラム及び記録媒体
CN2010105389906A CN102053950B (zh) 2009-11-06 2010-11-05 文档图像生成装置和文档图像生成方法
US12/940,818 US8503786B2 (en) 2009-11-06 2010-11-05 Document image generation apparatus, document image generation method and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009255373A JP4948586B2 (ja) 2009-11-06 2009-11-06 文書画像生成装置、文書画像生成方法、コンピュータプログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2011100356A JP2011100356A (ja) 2011-05-19
JP4948586B2 true JP4948586B2 (ja) 2012-06-06

Family

ID=43958290

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009255373A Active JP4948586B2 (ja) 2009-11-06 2009-11-06 文書画像生成装置、文書画像生成方法、コンピュータプログラム及び記録媒体

Country Status (3)

Country Link
US (1) US8503786B2 (ja)
JP (1) JP4948586B2 (ja)
CN (1) CN102053950B (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012099946A (ja) * 2010-10-29 2012-05-24 Canon Inc 画像処理装置、画像処理装置の制御方法及びプログラム
JP5337194B2 (ja) 2011-04-25 2013-11-06 シャープ株式会社 画像処理装置
US8996351B2 (en) * 2011-08-24 2015-03-31 Ricoh Company, Ltd. Cloud-based translation service for multi-function peripheral
JP5708419B2 (ja) * 2011-09-29 2015-04-30 フリュー株式会社 画像表示システム、学習システム、画像表示方法、および制御プログラム
JP5372110B2 (ja) 2011-10-28 2013-12-18 シャープ株式会社 情報出力装置、情報出力方法、及びコンピュータプログラム
JP5528420B2 (ja) * 2011-12-05 2014-06-25 シャープ株式会社 翻訳装置、翻訳方法及びコンピュータプログラム
JP5972578B2 (ja) * 2012-01-16 2016-08-17 シャープ株式会社 画像処理装置、画像形成装置、プログラム、記録媒体
JP2014059766A (ja) * 2012-09-18 2014-04-03 Sharp Corp 画像処理装置、画像形成装置、プログラム、記録媒体
US9535899B2 (en) 2013-02-20 2017-01-03 International Business Machines Corporation Automatic semantic rating and abstraction of literature
JP5449633B1 (ja) * 2013-03-22 2014-03-19 パナソニック株式会社 広告翻訳装置、広告表示装置、および広告翻訳方法
US9298802B2 (en) 2013-12-03 2016-03-29 International Business Machines Corporation Recommendation engine using inferred deep similarities for works of literature
US10073835B2 (en) * 2013-12-03 2018-09-11 International Business Machines Corporation Detecting literary elements in literature and their importance through semantic analysis and literary correlation
US9552344B2 (en) 2013-12-03 2017-01-24 International Business Machines Corporation Producing visualizations of elements in works of literature
US9792276B2 (en) 2013-12-13 2017-10-17 International Business Machines Corporation Content availability for natural language processing tasks
JP6295908B2 (ja) * 2014-09-30 2018-03-20 京セラドキュメントソリューションズ株式会社 データ作成装置、画像形成装置、及びデータ作成方法
US11100557B2 (en) 2014-11-04 2021-08-24 International Business Machines Corporation Travel itinerary recommendation engine using inferred interests and sentiments
US10452781B2 (en) * 2017-05-24 2019-10-22 Ca, Inc. Data provenance system
JP6885318B2 (ja) * 2017-12-15 2021-06-16 京セラドキュメントソリューションズ株式会社 画像処理装置
CN109240572B (zh) * 2018-07-20 2021-01-05 华为技术有限公司 一种获取图片的方法、对图片进行处理的方法及装置
CN110598623B (zh) * 2019-09-06 2022-12-06 联易融数字科技集团有限公司 切割及提取图片的方法、装置、计算机设备及存储介质
CN111046863B (zh) * 2019-12-10 2023-07-11 南宁凯旋互联网科技有限公司 数据处理方法、装置、设备及计算机可读存储介质
CN113435217B (zh) * 2021-06-25 2023-12-19 青岛海尔科技有限公司 语言测试处理方法、装置及电子设备
TWI792470B (zh) * 2021-08-03 2023-02-11 汪榮桔 具辨識功能之防偽方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05324720A (ja) * 1992-05-19 1993-12-07 Ricoh Co Ltd 対訳画像形成装置
JPH06301713A (ja) 1993-04-13 1994-10-28 Ricoh Co Ltd 対訳表示方法及び文書表示装置並びにディジタル複写装置
JPH0756924A (ja) * 1993-06-30 1995-03-03 Ricoh Co Ltd 対訳装置
JP3294919B2 (ja) 1993-10-21 2002-06-24 松下電器産業株式会社 機械翻訳装置
JPH09284446A (ja) * 1996-04-18 1997-10-31 Ricoh Co Ltd 情報処理装置およびデジタル複写機および情報記憶媒体
JP4428266B2 (ja) 2005-03-22 2010-03-10 富士ゼロックス株式会社 翻訳装置およびプログラム
KR101443404B1 (ko) * 2006-09-15 2014-10-02 구글 인코포레이티드 페이퍼 및 전자 문서내의 주석의 캡처 및 디스플레이
US8144990B2 (en) * 2007-03-22 2012-03-27 Sony Ericsson Mobile Communications Ab Translation and display of text in picture
JP4483909B2 (ja) * 2007-08-24 2010-06-16 富士ゼロックス株式会社 翻訳装置及びプログラム
CN101309449A (zh) * 2008-07-04 2008-11-19 沈阳格微软件有限责任公司 一种基于手机彩信/短信的远程翻译服务方法

Also Published As

Publication number Publication date
JP2011100356A (ja) 2011-05-19
CN102053950A (zh) 2011-05-11
US20110110599A1 (en) 2011-05-12
US8503786B2 (en) 2013-08-06
CN102053950B (zh) 2013-10-16

Similar Documents

Publication Publication Date Title
JP4948586B2 (ja) 文書画像生成装置、文書画像生成方法、コンピュータプログラム及び記録媒体
US7783472B2 (en) Document translation method and document translation device
US6119077A (en) Translation machine with format control
JP4999938B2 (ja) 文書画像生成装置、文書画像生成方法及びコンピュータプログラム
US8965125B2 (en) Image processing device, method and storage medium for storing and displaying an electronic document
JP4372133B2 (ja) 辞書登録装置、辞書登録方法及び辞書登録プログラム
CN103093252B (zh) 信息输出装置以及信息输出方法
JP2009294788A (ja) 情報処理装置、情報処理方法、制御プログラム及び記録媒体
JP4785655B2 (ja) 文書処理装置及び文書処理方法
JP2006252048A (ja) 翻訳装置、翻訳プログラムおよび翻訳方法
JP4924990B2 (ja) 文書処理装置および文書処理プログラム
JP2003186889A (ja) 文書に注釈付けし、文書イメージから要約を生成する方法及び装置
JP5604276B2 (ja) 文書画像生成装置および文書画像生成方法
JPH05108716A (ja) 機械翻訳装置
JP4992216B2 (ja) 翻訳装置及びプログラム
JP2002358481A (ja) 画像処理装置
JPH0883280A (ja) 文書処理装置
US20230137350A1 (en) Image processing apparatus, image processing method, and storage medium
US11842141B2 (en) Device dependent rendering of PDF content
JP2015076030A (ja) 文書画像生成装置、文書画像生成方法、及びコンピュータプログラム
JP3206600B2 (ja) 文書生成装置
JP2007034425A (ja) 翻訳装置、プログラム及び記憶媒体
JP2014219909A (ja) 文書画像生成装置、文書画像生成方法、及びコンピュータプログラム
JP2009205209A (ja) 文書画像処理装置、及び文書画像処理プログラム
JP2007094722A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110802

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110930

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120117

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120214

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120306

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4948586

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150