JP2011141749A - 文書画像生成装置、文書画像生成方法及びコンピュータプログラム - Google Patents
文書画像生成装置、文書画像生成方法及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2011141749A JP2011141749A JP2010002097A JP2010002097A JP2011141749A JP 2011141749 A JP2011141749 A JP 2011141749A JP 2010002097 A JP2010002097 A JP 2010002097A JP 2010002097 A JP2010002097 A JP 2010002097A JP 2011141749 A JP2011141749 A JP 2011141749A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- word
- characters
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
【解決手段】ベースラインから下方へ突出する形状を有する文字「g,j,p,q,y 」及び上方へ離隔する文字「’,”」を夫々記憶した特殊文字(下)及び特殊文字(上)にない文字が含まれる単語「giant 」の場合、「g 」を除く文字の下端のY座標の平均値YBavを単語の下端のY座標とする。特殊文字(下)にある文字のみが含まれる単語「jpy 」の場合、各文字の下端のY座標の平均値YBav0に一定の値を加えた値YBavを単語の下端のY座標とする。特殊文字(上)にある文字のみが含まれる単語「””」の場合、各文字の上端のY座標の平均値YTavから一定の値を減じた値YBavを単語の下端のY座標とする。
【選択図】図13
Description
これにより、語句に付与すべき補足説明の位置が、標準的には、語句中の文字の位置から一律に決まる語句の位置に対して決定され、語句中の文字の一部又は全部が特定の形状を有する文字である場合は、前記語句の位置とは異なる位置に対して決定される。
これにより、語句に対する補足説明を付与すべき上下方向の位置を決定する際に、語句中の文字の形状によって文字の上下方向の位置が変化する度合いが最大限に反映される。
また、語句中に特定の形状を有する文字が1つでも含まれている場合は、補足説明を付与すべき位置を、語句中の文字の上下方向に係る平均的な位置に対して上方に(又は下方に)偏倚させて決定する。
これにより、原文画像のレイアウトが保存され、原文の行間にルビがぴったりと揃うように付与される。
従って、文字が特定の形状を有することにより変動して決まる語句の位置を補正することによって、補足説明を付与すべき位置を決定した場合は、語句の下方又は上方の行間にきれいに揃っているように見える補足説明を付与することが可能となる。
図1は、本発明に係る文書画像生成装置の内部構成を示すブロック図である。図中1は文書画像生成装置であり、文書画像生成装置1は、パーソナルコンピュータ(PC)又はサーバ装置等の汎用コンピュータを用いて構成されている。文書画像生成装置1は、演算を行うCPU11と、演算に伴って発生する一時的な情報を記憶するRAM12と、光ディスク又はメモリカード等の記録媒体2から情報を読み取るCD−ROMドライブ等のドライブ部13と、ハードディスク等の記憶部14とを備えている。
尚、コンピュータプログラム21は、図示しない外部のサーバ装置からインターネット又はLAN等の通信ネットワークを介して文書画像生成装置1へダウンロードされて、記憶部14に記憶される形態であってもよい。
尚、画像読取装置31及び画像形成装置32は一体に構成されていてもよい。
図5は、ステップS14の訳語取得処理の手順を示すフローチャートである。CPU11は、ステップS13で認識した文字データに基づいて、原文書画像に含まれる各行におけるテキストの内容を表す行データを生成する(S141)。ステップS141では、CPU11は、文字番号の順に行頭の文字から行末の文字まで文字を並べることによって一行分の行データを生成し、各行毎に行データを生成する。
尚、本発明では、各単語又は連語別に訳語のフォントサイズを決定するのではなく、行単位で訳語のフォントサイズを決定する処理を行ってもよい。この場合は、一行内で訳語のフォントサイズが変動することがないので、行間に訳語を配置した文書の美観が向上する。また本発明では、文字を認識した文字領域単位で統一した訳語のフォントサイズを定める処理を行ってもよい。この場合は、訳語のフォントサイズが段落等の文字領域内で統一され、行間に訳語を配置した文書の美観が向上する。
尚、本発明では、開始位置を、単語又は連語の最初の文字の左端から所定量だけずらした位置としてもよく、終端位置を、最後の文字の右端から所定量だけずらした位置としてもよい。
図11は、ステップS163の上下方向位置決定処理の手順を示すフローチャートである。図11の処理では、判定のためのワークメモリ1〜3をRAM12に確保してあり、CPU11は、処理に先立ってこれらのワークメモリ1〜3をクリアする(S1631)。
尚、ここでY座標を算出する場合の平均値は、算術平均による値に限定されるものではなく、例えば、中央値のような値を用いてもよい。
ステップS13〜S15の処理は、ステップS12で抽出した文字領域の夫々について実行される。
また、語句中の文字が、特殊文字データベースに記憶された特定の形状を有する文字と一致するか否かに応じて補足説明を付与すべき上下方向の位置を異ならせる。これにより。語句に付与すべき補足説明の位置が、標準的には、語句中の文字の上下方向の位置から決まる語句の位置に対して決定され、語句中の文字の一部又は全部が特定の形状を有する文字である場合は、前記語句の位置とは異なる位置に対して決定される。
従って、文字が特定の形状を有することにより変動して決まる語句の位置を補正することによって、補足説明を付与すべき位置を決定した場合は、語句の下方の行間にきれいに揃っているように見える補足説明を付与することが可能となる。
換言すれば、語句中に特殊文字データベースに記憶された文字が1つも含まれていない場合は、補足説明を付与すべき位置を、語句中の文字の上下方向に係る平均的な位置に基づいて決定する。また、語句中に特殊文字データベースに記憶された文字が1つでも含まれている場合は、補足説明を付与すべき位置を、語句中の文字の上下方向に係る平均的な位置に対して上方に(又は下方に)偏倚させて決定する。
従って、補足説明を付与する位置が、単語又は連語からなる語句の下端から不自然に離隔しないように補正することが可能となる。
11 CPU
12 RAM
14 記憶部
16 表示部
17 インタフェース部
2 記録媒体
21 コンピュータプログラム
22 辞書データベース
23 特殊文字データベース23
31 画像読取装置
32 画像形成装置
Claims (7)
- 横書きの文章が含まれる原稿画像を表す画像データを受け付け、受け付けた画像データに基づく画像に含まれる語句に補足説明を付与した補足説明付文書の画像を生成する文書画像生成装置において、
前記画像データに基づく画像に含まれる文字の前記画像における上下方向の位置を特定する文字位置特定手段と、
前記語句中の文字について前記文字位置特定手段が特定した位置に基づいて、前記語句に対する補足説明を付与すべき上下方向の位置を決定する付与位置決定手段と、
前記語句中の文字が特定の形状を有する文字と一致するか否かを判定する判定手段とを備え、
前記付与位置決定手段は、前記判定手段による一致/不一致の判定結果に応じて異なる位置を決定するようにしてあること
を特徴とする文書画像生成装置。 - 前記特定の形状は、文字を配列するための横方向の基準線から下方へ突出するもの(又は上方へ離隔するもの)であることを特徴とする請求項1に記載の文書画像生成装置。
- 前記判定手段が、全ての文字が一致しないと判定した場合、前記付与位置決定手段は、前記語句中の文字について前記文字位置特定手段が特定した上下方向の位置に係る平均的な位置に基づいて、前記補足説明を付与すべき位置を決定するようにしてあり、
前記判定手段が、少なくとも1文字が一致すると判定した場合、前記付与位置決定手段は、前記補足説明を付与すべき位置を上方へ(又は下方へ)偏倚させて決定するようにしてあること
を特徴とする請求項2に記載の文書画像生成装置。 - 前記補足説明は、語句に対する訳語、語句の読み、又は語句に対する注釈であることを特徴とする請求項1から3の何れか1項に記載の文書画像生成装置。
- 前記画像データに基づく画像及び前記補足説明をPDFファイル形式のデータに変換する手段を備えることを特徴とする請求項1から4の何れか1項に記載の文書画像生成装置。
- 横書きの文章が含まれる原稿画像を表す画像データを受け付け、受け付けた画像データに基づく画像に含まれる語句に補足説明を付与した補足説明付文書の画像を生成する文書画像生成方法において、
前記画像データに基づく画像に含まれる文字の前記画像における上下方向の位置を特定するステップと、
前記語句中の文字について特定した位置に基づいて、前記語句に対する補足説明を付与すべき上下方向の位置を決定する付与位置決定ステップと、
前記語句中の文字が特定の形状を有する文字と一致するか否かを判定するステップとを含み、
前記付与位置決定ステップは、一致/不一致の判定結果に応じて異なる位置を決定すること
を特徴とする文書画像生成方法。 - 画像データを受け付けて文書処理及び画像処理するコンピュータに、画像データに基づく画像に含まれる横書きの語句に補足説明を付与した補足説明付文書の画像を生成させるコンピュータプログラムにおいて、
コンピュータに、前記画像データに基づく画像に含まれる文字の前記画像における上下方向の位置を特定させるステップと、
コンピュータに、前記語句中の文字について特定させた位置に基づいて、前記語句に対する補足説明を付与すべき上下方向の位置を決定させる付与位置決定ステップと、
コンピュータに、前記語句中の文字が所定の形状を有する文字と一致するか否かを判定させるステップとを含み、
前記付与位置決定ステップは、コンピュータに、一致/不一致の判定結果に応じて異なる位置を決定させること
を特徴とするコンピュータプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010002097A JP4999938B2 (ja) | 2010-01-07 | 2010-01-07 | 文書画像生成装置、文書画像生成方法及びコンピュータプログラム |
US12/981,675 US8958080B2 (en) | 2010-01-07 | 2010-12-30 | Document image generating apparatus, document image generating method and computer program, with adjustment of ruby-added image |
CN201110002438.XA CN102141979B (zh) | 2010-01-07 | 2011-01-07 | 文档图像生成装置、文档图像生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010002097A JP4999938B2 (ja) | 2010-01-07 | 2010-01-07 | 文書画像生成装置、文書画像生成方法及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011141749A true JP2011141749A (ja) | 2011-07-21 |
JP4999938B2 JP4999938B2 (ja) | 2012-08-15 |
Family
ID=44224553
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010002097A Active JP4999938B2 (ja) | 2010-01-07 | 2010-01-07 | 文書画像生成装置、文書画像生成方法及びコンピュータプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8958080B2 (ja) |
JP (1) | JP4999938B2 (ja) |
CN (1) | CN102141979B (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013097446A (ja) * | 2011-10-28 | 2013-05-20 | Sharp Corp | 情報出力装置、情報出力方法、及びコンピュータプログラム |
JP2014203339A (ja) * | 2013-04-08 | 2014-10-27 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置、画像形成装置、及び画像処理プログラム |
JP2015172792A (ja) * | 2014-03-11 | 2015-10-01 | 株式会社リコー | 翻訳システム、情報処理装置、情報処理方法およびプログラム |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10275445B2 (en) * | 2013-03-19 | 2019-04-30 | Rakuten, Inc. | Document processing device, document processing method, program, and information storage medium |
JP5449633B1 (ja) * | 2013-03-22 | 2014-03-19 | パナソニック株式会社 | 広告翻訳装置、広告表示装置、および広告翻訳方法 |
CN103365835B (zh) * | 2013-05-29 | 2018-02-09 | 苏州市职业大学 | 包含松散结构的汉语多词表达敏感特征的抽取方法 |
CN109034163A (zh) * | 2018-07-19 | 2018-12-18 | 商洛学院 | 英语翻译系统 |
JP7490472B2 (ja) * | 2020-07-06 | 2024-05-27 | キヤノン株式会社 | 情報処理装置、情報処理方法およびプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06301713A (ja) * | 1993-04-13 | 1994-10-28 | Ricoh Co Ltd | 対訳表示方法及び文書表示装置並びにディジタル複写装置 |
JP2003165262A (ja) * | 2001-11-29 | 2003-06-10 | Fuji Xerox Co Ltd | 描画装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2042780B (en) * | 1979-02-12 | 1982-07-14 | Philips Electronic Associated | Alphanumeric character display |
CA1223366A (en) * | 1984-09-27 | 1987-06-23 | Abijah S. Fox | System for automatic adjustment and editing of handwritten text images |
JPH0554069A (ja) | 1991-08-22 | 1993-03-05 | Ricoh Co Ltd | デジタル翻訳装置 |
CN1265307C (zh) * | 2002-12-12 | 2006-07-19 | 华为技术有限公司 | 语言本地化中特征字符串的提取与替换方法 |
JP3899336B2 (ja) * | 2003-09-16 | 2007-03-28 | シャープ株式会社 | 文書処理装置、文書処理方法、文書処理プログラム、および、記録媒体 |
US7747629B2 (en) * | 2006-08-23 | 2010-06-29 | International Business Machines Corporation | System and method for positional representation of content for efficient indexing, search, retrieval, and compression |
JP4483909B2 (ja) * | 2007-08-24 | 2010-06-16 | 富士ゼロックス株式会社 | 翻訳装置及びプログラム |
JP2009294788A (ja) | 2008-06-03 | 2009-12-17 | Ricoh Co Ltd | 情報処理装置、情報処理方法、制御プログラム及び記録媒体 |
-
2010
- 2010-01-07 JP JP2010002097A patent/JP4999938B2/ja active Active
- 2010-12-30 US US12/981,675 patent/US8958080B2/en active Active
-
2011
- 2011-01-07 CN CN201110002438.XA patent/CN102141979B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06301713A (ja) * | 1993-04-13 | 1994-10-28 | Ricoh Co Ltd | 対訳表示方法及び文書表示装置並びにディジタル複写装置 |
JP2003165262A (ja) * | 2001-11-29 | 2003-06-10 | Fuji Xerox Co Ltd | 描画装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013097446A (ja) * | 2011-10-28 | 2013-05-20 | Sharp Corp | 情報出力装置、情報出力方法、及びコンピュータプログラム |
JP2014203339A (ja) * | 2013-04-08 | 2014-10-27 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置、画像形成装置、及び画像処理プログラム |
JP2015172792A (ja) * | 2014-03-11 | 2015-10-01 | 株式会社リコー | 翻訳システム、情報処理装置、情報処理方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
US8958080B2 (en) | 2015-02-17 |
US20110164291A1 (en) | 2011-07-07 |
CN102141979A (zh) | 2011-08-03 |
CN102141979B (zh) | 2014-01-29 |
JP4999938B2 (ja) | 2012-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4948586B2 (ja) | 文書画像生成装置、文書画像生成方法、コンピュータプログラム及び記録媒体 | |
JP4999938B2 (ja) | 文書画像生成装置、文書画像生成方法及びコンピュータプログラム | |
Piotrowski | Natural language processing for historical texts | |
US7783472B2 (en) | Document translation method and document translation device | |
US8588528B2 (en) | Systems and methods for displaying scanned images with overlaid text | |
US20060285746A1 (en) | Computer assisted document analysis | |
US20060217958A1 (en) | Electronic device and recording medium | |
JP5372110B2 (ja) | 情報出力装置、情報出力方法、及びコンピュータプログラム | |
JP2010009509A (ja) | 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体 | |
JP5528420B2 (ja) | 翻訳装置、翻訳方法及びコンピュータプログラム | |
US20240104290A1 (en) | Device dependent rendering of pdf content including multiple articles and a table of contents | |
JP5604276B2 (ja) | 文書画像生成装置および文書画像生成方法 | |
JP7315420B2 (ja) | テキストの適合および修正の方法 | |
JP2006252164A (ja) | 中国語文書処理装置 | |
US11842141B2 (en) | Device dependent rendering of PDF content | |
JP2007034425A (ja) | 翻訳装置、プログラム及び記憶媒体 | |
JP3206600B2 (ja) | 文書生成装置 | |
JP2024071936A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP2014219909A (ja) | 文書画像生成装置、文書画像生成方法、及びコンピュータプログラム | |
JP2023052750A (ja) | 自動翻訳装置及び自動翻訳プログラム | |
TW202207184A (zh) | 用於電子裝置之點字轉換方法及其電腦程式產品 | |
JP2015076030A (ja) | 文書画像生成装置、文書画像生成方法、及びコンピュータプログラム | |
JPH04107679A (ja) | 機械翻訳装置 | |
Piotrowski | Acquiring Historical Texts | |
JPH06318272A (ja) | 文書認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111027 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111108 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120424 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120515 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4999938 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150525 Year of fee payment: 3 |