JP5144736B2 - 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体 - Google Patents
文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP5144736B2 JP5144736B2 JP2010251375A JP2010251375A JP5144736B2 JP 5144736 B2 JP5144736 B2 JP 5144736B2 JP 2010251375 A JP2010251375 A JP 2010251375A JP 2010251375 A JP2010251375 A JP 2010251375A JP 5144736 B2 JP5144736 B2 JP 5144736B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- line
- character size
- average value
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
Description
Claims (16)
- 文書に含まれる文字にルビ状の補足説明文字列を付すことにより補足説明付き文書を生成する文書生成装置であって、
前記文書中の文字領域に含まれる文字の文字サイズの情報を記憶する記憶部と、
前記記憶部から前記文字サイズの情報を読み出し、読み出した文字サイズの情報を各文字領域の文字サイズに基づいて文字領域ごとに補正する文字サイズ補正部と、
前記文字サイズ補正部により補正された文字サイズの情報に基づいて、1つの文字領域を2以上の文字領域に分割する文字領域分割部と、
前記文字領域分割部により分割されてできた文字領域内の文字について前記文字サイズ補正部により文字サイズの情報が補正された場合に、補正された文字サイズの情報に基づいて、前記補足説明文字列の表示形態の情報を前記文字領域分割部により分割されてできた文字領域ごとに生成する表示形態情報生成部と、
前記表示形態情報生成部において生成された表示形態の情報に基づいて、前記補足説明付き文書を生成する文書生成部と、
前記文字サイズ補正部により文字サイズが補正された各文字の中心位置が、文字サイズが補正される前の各文字の中心位置とそれぞれ一致するように、前記文字サイズが補正された文字を配置したものとし、該配置に基づいて各文字領域の行間隔の情報を文字領域ごとに補正する行間隔補正部とを備え、
前記表示形態情報生成部は、前記行間隔補正部により補正された行間隔の情報に基づいて、前記補足説明文字列の表示形態の情報を生成することを特徴とする文書生成装置。 - 前記文字サイズ補正部は、各文字領域内の各行に含まれる文字に対して行ごとに文字サイズを決定し、決定された文字サイズの平均値を文字領域ごとに算出し、算出された文字サイズの平均値に基づいて前記文字サイズの情報を補正することを特徴とする請求項1に記載の文書生成装置。
- 前記文字サイズ補正部は、文字数が所定の閾値に満たない行がある場合に、該行を除外して前記文字サイズの平均値を算出することを特徴とする請求項2に記載の文書生成装置。
- 前記文字サイズ補正部は、1つの文字領域の先頭行を含む連続するn行に対してそれぞれ決定された文字サイズの平均値を算出した後、該先頭行からn+1行目までの各行に対して決定された文字サイズの平均値を算出する場合に、前記連続するn行に対してそれぞれ決定された文字サイズの平均値とn+1行目の行に対して決定された文字サイズとを比較し、該連続するn行に対してそれぞれ決定された文字サイズの平均値とn+1行目の行に対して決定された文字サイズとの間の差が所定の基準よりも大きい場合に、前記先頭行からn+1行目までの各行に対して決定された文字サイズの平均値の算出を中止し、前記連続するn行に対してそれぞれ決定された文字サイズの平均値に基づいて前記文字サイズの情報を補正することを特徴とする請求項2または3に記載の文書生成装置。
- 前記文字領域分割部は、前記連続するn行に対してそれぞれ決定された文字サイズの平均値と、前記n+1行目の行に対して決定された文字サイズとの間の差が所定の基準よりも大きい場合に、前記n行目の行と前記n+1行目の行との間を境として前記文字領域を分割することを特徴とする請求項4に記載の文書生成装置。
- 前記文字サイズ補正部は、前記文字領域分割部により前記文字領域が分割された場合に、前記n+1行目以降の行に対して決定された文字サイズの平均値を算出することを特徴とする請求項5に記載の文書生成装置。
- 前記文字サイズ補正部は、前記文字領域内の行ごとに決定された文字サイズに各行に含まれる文字数の重みを付けて該行ごとに決定された文字サイズの重み付きの平均値を算出し、該重み付きの平均値に基づいて前記文字サイズの情報を補正することを特徴とする請求項3〜6のいずれか1項に記載の文書生成装置。
- 前記文字サイズ補正部は、前記重み付きの平均値の算出対象から除外する文字の指定を受け付け、指定を受け付けた文字を除外して前記重み付きの平均値を算出することを特徴とする請求項7に記載の文書生成装置。
- 前記文字サイズ補正部は、各行の総文字数に対する前記指定を受け付けた文字の数の割合に係る閾値の指定を受け付け、該割合が該閾値以上である場合に、指定を受け付けた文字を除外して前記重み付きの平均値を算出することを特徴とする請求項8に記載の文書生成装置。
- 前記文字サイズ補正部は、前記重み付きの平均値の算出対象から除外する文字種の指定を受け付け、指定を受け付けた文字種の文字を除外して前記重み付きの平均値を算出することを特徴とする請求項7に記載の文書生成装置。
- 前記文字サイズ補正部は、各行の総文字数に対する前記指定を受け付けた文字種の文字数の割合に係る閾値の指定を受け付け、該割合が該閾値以上である場合に、指定を受け付けた文字種の文字を除外して前記重み付きの平均値を算出することを特徴とする請求項10に記載の文書生成装置。
- 前記行間隔補正部は、各行間の行間隔の平均値を算出することにより前記行間隔の情報を補正し、1つの文字領域の先頭行を含む連続するm行の行間隔の平均値と、m行目の行とm+1行目の行との間の行間隔を比較し、該連続するm行の行間隔の平均値と、m行目の行とm+1行目の行との間の行間隔の間の差が所定の基準よりも大きい場合に、m行目の行とm+1行目の行との間の行間隔を前記各行間の行間隔の平均値の算出対象から除外することを特徴とする請求項1に記載の文書生成装置。
- 前記表示形態情報生成部は、前記文書に含まれる文字の訳語、読み、あるいは、注釈の表示形態の情報を前記補足説明文字列の表示形態の情報として生成することを特徴とする請求項1〜12のいずれか1項に記載の文書生成装置。
- 前記文書に含まれる単語、連語、あるいは、フレーズごとに該単語、連語、あるいは、フレーズの翻訳を行う翻訳処理部をさらに備え、前記文書生成部は、該単語、連語、あるいは、フレーズごとに訳語を付与した補足説明付き文書を生成することを特徴とする請求項1〜13のいずれか1項に記載の文書生成装置。
- コンピュータを、請求項1に記載の文書生成装置として機能させるコンピュータプログラム。
- 請求項15に記載のコンピュータプログラムを記録したことを特徴とするコンピュータが読み取り可能な記録媒体。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010251375A JP5144736B2 (ja) | 2010-11-10 | 2010-11-10 | 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体 |
US13/292,125 US9110871B2 (en) | 2010-11-10 | 2011-11-09 | Correcting a document character size based on the average value of each character size |
CN201110354797.1A CN102592299B (zh) | 2010-11-10 | 2011-11-10 | 文件生成装置和文件生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010251375A JP5144736B2 (ja) | 2010-11-10 | 2010-11-10 | 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012103872A JP2012103872A (ja) | 2012-05-31 |
JP5144736B2 true JP5144736B2 (ja) | 2013-02-13 |
Family
ID=46020818
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010251375A Active JP5144736B2 (ja) | 2010-11-10 | 2010-11-10 | 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9110871B2 (ja) |
JP (1) | JP5144736B2 (ja) |
CN (1) | CN102592299B (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9147178B2 (en) * | 2012-01-16 | 2015-09-29 | International Business Machines Corporation | De-identification in visual media data |
JP6028392B2 (ja) * | 2012-05-24 | 2016-11-16 | 富士通株式会社 | 生成プログラム、生成方法、生成装置、検索プログラム、検索方法および検索装置 |
JP6028393B2 (ja) * | 2012-05-24 | 2016-11-16 | 富士通株式会社 | 照合プログラム、照合方法および照合装置 |
US9858271B2 (en) * | 2012-11-30 | 2018-01-02 | Ricoh Company, Ltd. | System and method for translating content between devices |
KR20150006740A (ko) * | 2013-07-09 | 2015-01-19 | 류중하 | 문자에 대한 기호 이미지 구성 방법, 및 기호 이미지에 대한 대응되는 문자의 분석 방법 |
JP5877272B2 (ja) * | 2013-03-19 | 2016-03-02 | 楽天株式会社 | 文書処理装置、文書処理方法、プログラムおよび情報記憶媒体 |
JP6201488B2 (ja) * | 2013-07-29 | 2017-09-27 | 富士通株式会社 | 選択文字特定プログラム、選択文字特定方法、及び、選択文字特定装置 |
JP6398945B2 (ja) * | 2015-10-29 | 2018-10-03 | コニカミノルタ株式会社 | 情報付加文書生成装置、プログラム |
JP7027757B2 (ja) * | 2017-09-21 | 2022-03-02 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及び情報処理プログラム |
JP7090894B2 (ja) * | 2018-07-26 | 2022-06-27 | 武蔵エンジニアリング株式会社 | 文字列表示装置および文字列表示方法 |
JP7293974B2 (ja) * | 2019-08-19 | 2023-06-20 | ブラザー工業株式会社 | 制御プログラム、および情報処理装置 |
CN112100980A (zh) * | 2020-09-21 | 2020-12-18 | 湖南省汉星信息科技有限责任公司 | 附加信息文字的显示方法、装置、设备及存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0620091A (ja) * | 1992-06-30 | 1994-01-28 | Matsushita Electric Ind Co Ltd | 文字サイズ抽出方法 |
JP3294919B2 (ja) | 1993-10-21 | 2002-06-24 | 松下電器産業株式会社 | 機械翻訳装置 |
US7391917B2 (en) * | 2003-02-13 | 2008-06-24 | Canon Kabushiki Kaisha | Image processing method |
JP2008299780A (ja) * | 2007-06-04 | 2008-12-11 | Fuji Xerox Co Ltd | 画像処理装置、及び画像処理プログラム |
JP4998176B2 (ja) | 2007-09-27 | 2012-08-15 | 富士ゼロックス株式会社 | 翻訳装置及びプログラム |
JP2009193283A (ja) | 2008-02-14 | 2009-08-27 | Fuji Xerox Co Ltd | 文書画像処理装置、及び文書画像処理プログラム |
JP5126018B2 (ja) | 2008-11-25 | 2013-01-23 | 富士ゼロックス株式会社 | 文書画像処理装置及びプログラム |
US8261180B2 (en) * | 2009-04-28 | 2012-09-04 | Lexmark International, Inc. | Automatic forms processing systems and methods |
-
2010
- 2010-11-10 JP JP2010251375A patent/JP5144736B2/ja active Active
-
2011
- 2011-11-09 US US13/292,125 patent/US9110871B2/en active Active
- 2011-11-10 CN CN201110354797.1A patent/CN102592299B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012103872A (ja) | 2012-05-31 |
US9110871B2 (en) | 2015-08-18 |
CN102592299A (zh) | 2012-07-18 |
CN102592299B (zh) | 2014-11-19 |
US20120117461A1 (en) | 2012-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5144736B2 (ja) | 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体 | |
US6336124B1 (en) | Conversion data representing a document to other formats for manipulation and display | |
JP5105513B2 (ja) | 処理対象として適切なテキストを選択する技術 | |
JP2007004633A (ja) | 言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置 | |
JP5372110B2 (ja) | 情報出力装置、情報出力方法、及びコンピュータプログラム | |
JP4999938B2 (ja) | 文書画像生成装置、文書画像生成方法及びコンピュータプログラム | |
US20140380169A1 (en) | Language input method editor to disambiguate ambiguous phrases via diacriticization | |
JP2009053932A (ja) | 文書画像処理装置、及び文書画像処理プログラム | |
CN114118011A (zh) | 文档处理方法、电子设备及存储介质 | |
US20140297253A1 (en) | Translation support apparatus, translation support system, and translation support program | |
JP7481999B2 (ja) | 辞書編集装置、辞書編集方法及び辞書編集プログラム | |
JP2004220616A (ja) | 3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置 | |
JP3294919B2 (ja) | 機械翻訳装置 | |
JP5833087B2 (ja) | 文字列処理装置、方法、及びプログラム | |
US20220156446A1 (en) | Device Dependent Rendering of PDF Content Including Multiple Articles and a Table of Contents | |
JP2008027133A (ja) | 帳票処理装置及び帳票処理方法ならびに帳票処理方法を実行するプログラムと記憶媒体 | |
JP2009032026A (ja) | 表示制御装置、方法、プログラムおよび記録媒体 | |
JP7315420B2 (ja) | テキストの適合および修正の方法 | |
JP5604276B2 (ja) | 文書画像生成装置および文書画像生成方法 | |
JP2000353159A (ja) | 表記・読み対応付け装置、表記・読み対応辞書作成方法、テキスト読み振り装置、テキスト読み振り方法および記録媒体 | |
JPWO2007114182A1 (ja) | データ入力装置、方法、及びプログラム | |
US20230039280A1 (en) | Device dependent rendering of pdf content | |
CN117391045B (zh) | 可复制蒙文的可携带文件格式文件输出方法 | |
JP2019053461A (ja) | 画像処理装置、プログラム及び画像データ | |
JP6528927B2 (ja) | 文書処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120807 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121001 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121030 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121122 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151130 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5144736 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |