JPS62247485A - 文字認識装置における認識結果出力方法 - Google Patents
文字認識装置における認識結果出力方法Info
- Publication number
- JPS62247485A JPS62247485A JP61090037A JP9003786A JPS62247485A JP S62247485 A JPS62247485 A JP S62247485A JP 61090037 A JP61090037 A JP 61090037A JP 9003786 A JP9003786 A JP 9003786A JP S62247485 A JPS62247485 A JP S62247485A
- Authority
- JP
- Japan
- Prior art keywords
- character
- font
- size
- information
- style
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 5
- 238000010586 diagram Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
■技術分野
本発明は、文字認識装置における文字出力装置に関する
ものである。
ものである。
■従来技術
従来、文字認識装置では、認識対象文字の大きさや書体
の違いを区別せず、認識結果は、どんな文字に対しても
文字コードだけであり、これを、出力装置(プリンター
、ディスプレイ等)に印字する際には1元の文字の大き
さや書体にはかかわらず、同一のフォント(大きさ、字
体)だけであった。
の違いを区別せず、認識結果は、どんな文字に対しても
文字コードだけであり、これを、出力装置(プリンター
、ディスプレイ等)に印字する際には1元の文字の大き
さや書体にはかかわらず、同一のフォント(大きさ、字
体)だけであった。
第3図は従来の文字認識装置の認識結果を説明するため
の図である。
の図である。
例えば、第3図のような、見出しが大きなゴシック体で
書かれ、本文は明朝体で書かれた文書を文字認識装置で
読取ると、その結果は文字コード列だけであり、見出し
文字の大きさや、ゴシック体、明朝体の情報が付加され
ていないために、出力装置(プリンター、ディスプレイ
等)上では同一の文字となってしまう。
書かれ、本文は明朝体で書かれた文書を文字認識装置で
読取ると、その結果は文字コード列だけであり、見出し
文字の大きさや、ゴシック体、明朝体の情報が付加され
ていないために、出力装置(プリンター、ディスプレイ
等)上では同一の文字となってしまう。
■ 目的
本発明は、文字認識方法における対象文字のフォントを
認識結果に付加することを目的とするものである。
認識結果に付加することを目的とするものである。
■構成
第1図は本発明の一実施例の構成を示すブロック図であ
り、1はスキャナー、2は文字切出し部、3は大きさ判
定部、4は特徴抽出部、5はフォント判定部、6は辞書
検索部、7は結果判定部、8は出力装置である。
り、1はスキャナー、2は文字切出し部、3は大きさ判
定部、4は特徴抽出部、5はフォント判定部、6は辞書
検索部、7は結果判定部、8は出力装置である。
これは、文字切出し部2から文字の大きさの情報を得て
、文字の大きさを判定する大きさ判定部3と、フォント
(書体)の判定を行うフォント判定部5とから出力され
る文字の大きさ、フォントの情報を付加して、結果を出
力する結果判定部7と、出力袋!i!8を備えた文字認
識装置である。
、文字の大きさを判定する大きさ判定部3と、フォント
(書体)の判定を行うフォント判定部5とから出力され
る文字の大きさ、フォントの情報を付加して、結果を出
力する結果判定部7と、出力袋!i!8を備えた文字認
識装置である。
(実施例1)
文字の高さ、幅をそれぞれH,Wとし、予め与えられた
標準文字の高さ、幅をHsat W、tとし、倍率をH
,、Wlとすれば、 H,= O(7)時、O< H<(3/4)Hl。
標準文字の高さ、幅をHsat W、tとし、倍率をH
,、Wlとすれば、 H,= O(7)時、O< H<(3/4)Hl。
=1 (3/4)Hl、≦H<(5/4)H,。
=2 (5/4)H,、≦H<(7/4)H,。
=3 (7/4)Hi、≦H<(9/4)H,。
となる。
ここで、例としてHI=O〜7、W8=0〜7の8段階
の値を取るとし、文字コードに1バイトの大きさの情報
を付加すれば第3図の文書は第2図のようになる。
の値を取るとし、文字コードに1バイトの大きさの情報
を付加すれば第3図の文書は第2図のようになる。
(実施例2)
第2図は本発明におけるフォント情報付加の説明図であ
り、21はフォント情報(1byte)、22は文字コ
ード(2byte)を、また、00は明朝体、olはゴ
シック体、10はナール体、11は教科書体を示す。
り、21はフォント情報(1byte)、22は文字コ
ード(2byte)を、また、00は明朝体、olはゴ
シック体、10はナール体、11は教科書体を示す。
フォント判定部5で、一般によく知られたフォント判定
法(各フォントの辞書との照合を行い、最も距離の小さ
い文字のフォントと判定するなど)でその文字の書体を
判定し、例えば、明朝体、ゴシック体、ナール体、教科
書体の4種類の情報を付加したものである。
法(各フォントの辞書との照合を行い、最も距離の小さ
い文字のフォントと判定するなど)でその文字の書体を
判定し、例えば、明朝体、ゴシック体、ナール体、教科
書体の4種類の情報を付加したものである。
■効果
以上説明したように、本発明は、元の文書の文字の大き
さや書体の情報を保存することが可能となり、認識結果
から文章を再生する場合に、ある程度忠実に再現するこ
とが出来るという利点がある。
さや書体の情報を保存することが可能となり、認識結果
から文章を再生する場合に、ある程度忠実に再現するこ
とが出来るという利点がある。
第1図は本発明の一実施例の構成を示すブロック図、第
2図は本発明におけるフォント情報付加の説明図、第3
図は従来の文字認識装置の認識結果を説明するための図
である。 1 ・・・スキャナー、2・・・文字切出し部、3・・
・大きさ判定部、4・・・特徴抽出部、5 ・・・フォ
ント判定部、6・・・辞書検索部、7・・・結果判定部
、8・・・出力装置、21・・・フォント情報、22・
・・文字コード。 特許出願人 株式会社 リコー 第2図 21 ・・・フJ ン)41N (I byte
)n・・・()コー)(2byte) 3図 良丁認識 耳戴#8床
2図は本発明におけるフォント情報付加の説明図、第3
図は従来の文字認識装置の認識結果を説明するための図
である。 1 ・・・スキャナー、2・・・文字切出し部、3・・
・大きさ判定部、4・・・特徴抽出部、5 ・・・フォ
ント判定部、6・・・辞書検索部、7・・・結果判定部
、8・・・出力装置、21・・・フォント情報、22・
・・文字コード。 特許出願人 株式会社 リコー 第2図 21 ・・・フJ ン)41N (I byte
)n・・・()コー)(2byte) 3図 良丁認識 耳戴#8床
Claims (2)
- (1)文字認識装置の文字切出し部において、予め指定
された標準文字サイズと、実際に切り出された文字パタ
ーンの大きさとを比較し、その比率をその文字の認識結
果に付加することを特徴とする対象文字情報付加方法。 - (2)対象文字の書体を判別し、その情報を認識情報に
付加することを特徴とする特許請求の範囲第(1)項記
載の対象文字情報付加方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61090037A JP2584973B2 (ja) | 1986-04-21 | 1986-04-21 | 文字認識装置における認識結果出力方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61090037A JP2584973B2 (ja) | 1986-04-21 | 1986-04-21 | 文字認識装置における認識結果出力方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS62247485A true JPS62247485A (ja) | 1987-10-28 |
JP2584973B2 JP2584973B2 (ja) | 1997-02-26 |
Family
ID=13987453
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61090037A Expired - Fee Related JP2584973B2 (ja) | 1986-04-21 | 1986-04-21 | 文字認識装置における認識結果出力方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2584973B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01159723A (ja) * | 1987-12-16 | 1989-06-22 | Fujitsu Ltd | 手書き文字入力装置 |
JPH03260886A (ja) * | 1990-03-12 | 1991-11-20 | Fuji Facom Corp | 文字認識方法 |
EP0584776A2 (en) * | 1992-08-25 | 1994-03-02 | Canon Kabushiki Kaisha | Information processing method and apparatus |
JPH06176188A (ja) * | 1992-12-03 | 1994-06-24 | Ibm Japan Ltd | 認識文字の情報作成方法及び装置 |
US5513278A (en) * | 1993-05-27 | 1996-04-30 | Matsushita Electric Industrial Co., Ltd. | Handwritten character size determination apparatus based on character entry area |
JP2021504781A (ja) * | 2017-12-01 | 2021-02-15 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | ブロックに基づく文書メタデータの抽出のための方法、コンピュータ・プログラム及びシステム |
-
1986
- 1986-04-21 JP JP61090037A patent/JP2584973B2/ja not_active Expired - Fee Related
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01159723A (ja) * | 1987-12-16 | 1989-06-22 | Fujitsu Ltd | 手書き文字入力装置 |
JPH03260886A (ja) * | 1990-03-12 | 1991-11-20 | Fuji Facom Corp | 文字認識方法 |
EP0584776A2 (en) * | 1992-08-25 | 1994-03-02 | Canon Kabushiki Kaisha | Information processing method and apparatus |
EP0584776A3 (en) * | 1992-08-25 | 1994-12-14 | Canon Kk | Information processing method and device. |
US5911013A (en) * | 1992-08-25 | 1999-06-08 | Canon Kabushiki Kaisha | Character recognition method and apparatus capable of handling handwriting |
JPH06176188A (ja) * | 1992-12-03 | 1994-06-24 | Ibm Japan Ltd | 認識文字の情報作成方法及び装置 |
US5513278A (en) * | 1993-05-27 | 1996-04-30 | Matsushita Electric Industrial Co., Ltd. | Handwritten character size determination apparatus based on character entry area |
JP2021504781A (ja) * | 2017-12-01 | 2021-02-15 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | ブロックに基づく文書メタデータの抽出のための方法、コンピュータ・プログラム及びシステム |
Also Published As
Publication number | Publication date |
---|---|
JP2584973B2 (ja) | 1997-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5384863A (en) | Methods and apparatus for automatic modification of semantically significant portions of a document without document image decoding | |
EP0702322B1 (en) | Method and apparatus for identifying words described in a portable electronic document | |
JP2765665B2 (ja) | タイポグラフィカル情報付き文書の翻訳装置 | |
KR900013419A (ko) | 문서 처리 시스템 및 요소 마크 확장 방법 | |
CN109492199A (zh) | 一种基于ocr预判断的pdf文件转换方法 | |
US6771816B1 (en) | Generating a text mask for representing text pixels | |
US7586628B2 (en) | Method and system for rendering Unicode complex text data in a printer | |
JPS62247485A (ja) | 文字認識装置における認識結果出力方法 | |
EP1093078B1 (en) | Reducing apprearance differences between coded and noncoded units of text | |
JPH0991371A (ja) | 文字表示装置 | |
JP2763227B2 (ja) | 書式決定方法 | |
JPH0916582A (ja) | 文書作成装置及び同装置に用いられる認識結果出力方法 | |
JP2788506B2 (ja) | 文字認識装置 | |
JP2773691B2 (ja) | プリンタ装置 | |
JP2584973C (ja) | ||
JP3391103B2 (ja) | テキスト合成装置 | |
JPS583083A (ja) | 印刷編集方式 | |
JPH01196685A (ja) | 文字検出方法 | |
JPS6327990A (ja) | 文字認識方法 | |
JP2000187704A (ja) | 文字認識装置及びその方法及び記憶媒体 | |
JP2796140B2 (ja) | 自然言語処理用データ編集支援装置 | |
JPH01209586A (ja) | 倍角文字・半角文字混在文章の文字認識方式 | |
JP2594043B2 (ja) | 罫線作成装置 | |
JP3347322B2 (ja) | 文書処理装置及び前記装置における文書処理方法 | |
JPH10187887A (ja) | 書体識別装置および書体識別方法および情報記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |