JPS62247485A - 文字認識装置における認識結果出力方法 - Google Patents

文字認識装置における認識結果出力方法

Info

Publication number
JPS62247485A
JPS62247485A JP61090037A JP9003786A JPS62247485A JP S62247485 A JPS62247485 A JP S62247485A JP 61090037 A JP61090037 A JP 61090037A JP 9003786 A JP9003786 A JP 9003786A JP S62247485 A JPS62247485 A JP S62247485A
Authority
JP
Japan
Prior art keywords
character
font
size
information
style
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61090037A
Other languages
English (en)
Other versions
JP2584973B2 (ja
Inventor
Michiyoshi Tachikawa
道義 立川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61090037A priority Critical patent/JP2584973B2/ja
Publication of JPS62247485A publication Critical patent/JPS62247485A/ja
Application granted granted Critical
Publication of JP2584973B2 publication Critical patent/JP2584973B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 ■技術分野 本発明は、文字認識装置における文字出力装置に関する
ものである。
■従来技術 従来、文字認識装置では、認識対象文字の大きさや書体
の違いを区別せず、認識結果は、どんな文字に対しても
文字コードだけであり、これを、出力装置(プリンター
、ディスプレイ等)に印字する際には1元の文字の大き
さや書体にはかかわらず、同一のフォント(大きさ、字
体)だけであった。
第3図は従来の文字認識装置の認識結果を説明するため
の図である。
例えば、第3図のような、見出しが大きなゴシック体で
書かれ、本文は明朝体で書かれた文書を文字認識装置で
読取ると、その結果は文字コード列だけであり、見出し
文字の大きさや、ゴシック体、明朝体の情報が付加され
ていないために、出力装置(プリンター、ディスプレイ
等)上では同一の文字となってしまう。
■ 目的 本発明は、文字認識方法における対象文字のフォントを
認識結果に付加することを目的とするものである。
■構成 第1図は本発明の一実施例の構成を示すブロック図であ
り、1はスキャナー、2は文字切出し部、3は大きさ判
定部、4は特徴抽出部、5はフォント判定部、6は辞書
検索部、7は結果判定部、8は出力装置である。
これは、文字切出し部2から文字の大きさの情報を得て
、文字の大きさを判定する大きさ判定部3と、フォント
(書体)の判定を行うフォント判定部5とから出力され
る文字の大きさ、フォントの情報を付加して、結果を出
力する結果判定部7と、出力袋!i!8を備えた文字認
識装置である。
(実施例1) 文字の高さ、幅をそれぞれH,Wとし、予め与えられた
標準文字の高さ、幅をHsat W、tとし、倍率をH
,、Wlとすれば、 H,= O(7)時、O< H<(3/4)Hl。
=1   (3/4)Hl、≦H<(5/4)H,。
=2  (5/4)H,、≦H<(7/4)H,。
=3   (7/4)Hi、≦H<(9/4)H,。
となる。
ここで、例としてHI=O〜7、W8=0〜7の8段階
の値を取るとし、文字コードに1バイトの大きさの情報
を付加すれば第3図の文書は第2図のようになる。
(実施例2) 第2図は本発明におけるフォント情報付加の説明図であ
り、21はフォント情報(1byte)、22は文字コ
ード(2byte)を、また、00は明朝体、olはゴ
シック体、10はナール体、11は教科書体を示す。
フォント判定部5で、一般によく知られたフォント判定
法(各フォントの辞書との照合を行い、最も距離の小さ
い文字のフォントと判定するなど)でその文字の書体を
判定し、例えば、明朝体、ゴシック体、ナール体、教科
書体の4種類の情報を付加したものである。
■効果 以上説明したように、本発明は、元の文書の文字の大き
さや書体の情報を保存することが可能となり、認識結果
から文章を再生する場合に、ある程度忠実に再現するこ
とが出来るという利点がある。
【図面の簡単な説明】
第1図は本発明の一実施例の構成を示すブロック図、第
2図は本発明におけるフォント情報付加の説明図、第3
図は従来の文字認識装置の認識結果を説明するための図
である。 1 ・・・スキャナー、2・・・文字切出し部、3・・
・大きさ判定部、4・・・特徴抽出部、5 ・・・フォ
ント判定部、6・・・辞書検索部、7・・・結果判定部
、8・・・出力装置、21・・・フォント情報、22・
・・文字コード。 特許出願人  株式会社 リコー 第2図 21  ・・・フJ ン)41N  (I byte 
)n・・・()コー)(2byte) 3図 良丁認識 耳戴#8床

Claims (2)

    【特許請求の範囲】
  1. (1)文字認識装置の文字切出し部において、予め指定
    された標準文字サイズと、実際に切り出された文字パタ
    ーンの大きさとを比較し、その比率をその文字の認識結
    果に付加することを特徴とする対象文字情報付加方法。
  2. (2)対象文字の書体を判別し、その情報を認識情報に
    付加することを特徴とする特許請求の範囲第(1)項記
    載の対象文字情報付加方法。
JP61090037A 1986-04-21 1986-04-21 文字認識装置における認識結果出力方法 Expired - Fee Related JP2584973B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61090037A JP2584973B2 (ja) 1986-04-21 1986-04-21 文字認識装置における認識結果出力方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61090037A JP2584973B2 (ja) 1986-04-21 1986-04-21 文字認識装置における認識結果出力方法

Publications (2)

Publication Number Publication Date
JPS62247485A true JPS62247485A (ja) 1987-10-28
JP2584973B2 JP2584973B2 (ja) 1997-02-26

Family

ID=13987453

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61090037A Expired - Fee Related JP2584973B2 (ja) 1986-04-21 1986-04-21 文字認識装置における認識結果出力方法

Country Status (1)

Country Link
JP (1) JP2584973B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01159723A (ja) * 1987-12-16 1989-06-22 Fujitsu Ltd 手書き文字入力装置
JPH03260886A (ja) * 1990-03-12 1991-11-20 Fuji Facom Corp 文字認識方法
EP0584776A2 (en) * 1992-08-25 1994-03-02 Canon Kabushiki Kaisha Information processing method and apparatus
JPH06176188A (ja) * 1992-12-03 1994-06-24 Ibm Japan Ltd 認識文字の情報作成方法及び装置
US5513278A (en) * 1993-05-27 1996-04-30 Matsushita Electric Industrial Co., Ltd. Handwritten character size determination apparatus based on character entry area
JP2021504781A (ja) * 2017-12-01 2021-02-15 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation ブロックに基づく文書メタデータの抽出のための方法、コンピュータ・プログラム及びシステム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01159723A (ja) * 1987-12-16 1989-06-22 Fujitsu Ltd 手書き文字入力装置
JPH03260886A (ja) * 1990-03-12 1991-11-20 Fuji Facom Corp 文字認識方法
EP0584776A2 (en) * 1992-08-25 1994-03-02 Canon Kabushiki Kaisha Information processing method and apparatus
EP0584776A3 (en) * 1992-08-25 1994-12-14 Canon Kk Information processing method and device.
US5911013A (en) * 1992-08-25 1999-06-08 Canon Kabushiki Kaisha Character recognition method and apparatus capable of handling handwriting
JPH06176188A (ja) * 1992-12-03 1994-06-24 Ibm Japan Ltd 認識文字の情報作成方法及び装置
US5513278A (en) * 1993-05-27 1996-04-30 Matsushita Electric Industrial Co., Ltd. Handwritten character size determination apparatus based on character entry area
JP2021504781A (ja) * 2017-12-01 2021-02-15 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation ブロックに基づく文書メタデータの抽出のための方法、コンピュータ・プログラム及びシステム

Also Published As

Publication number Publication date
JP2584973B2 (ja) 1997-02-26

Similar Documents

Publication Publication Date Title
US5384863A (en) Methods and apparatus for automatic modification of semantically significant portions of a document without document image decoding
EP0702322B1 (en) Method and apparatus for identifying words described in a portable electronic document
JP2765665B2 (ja) タイポグラフィカル情報付き文書の翻訳装置
KR900013419A (ko) 문서 처리 시스템 및 요소 마크 확장 방법
CN109492199A (zh) 一种基于ocr预判断的pdf文件转换方法
US6771816B1 (en) Generating a text mask for representing text pixels
US7586628B2 (en) Method and system for rendering Unicode complex text data in a printer
JPS62247485A (ja) 文字認識装置における認識結果出力方法
EP1093078B1 (en) Reducing apprearance differences between coded and noncoded units of text
JPH0991371A (ja) 文字表示装置
JP2763227B2 (ja) 書式決定方法
JPH0916582A (ja) 文書作成装置及び同装置に用いられる認識結果出力方法
JP2788506B2 (ja) 文字認識装置
JP2773691B2 (ja) プリンタ装置
JP2584973C (ja)
JP3391103B2 (ja) テキスト合成装置
JPS583083A (ja) 印刷編集方式
JPH01196685A (ja) 文字検出方法
JPS6327990A (ja) 文字認識方法
JP2000187704A (ja) 文字認識装置及びその方法及び記憶媒体
JP2796140B2 (ja) 自然言語処理用データ編集支援装置
JPH01209586A (ja) 倍角文字・半角文字混在文章の文字認識方式
JP2594043B2 (ja) 罫線作成装置
JP3347322B2 (ja) 文書処理装置及び前記装置における文書処理方法
JPH10187887A (ja) 書体識別装置および書体識別方法および情報記録媒体

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees