JPH03252894A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH03252894A
JPH03252894A JP2051372A JP5137290A JPH03252894A JP H03252894 A JPH03252894 A JP H03252894A JP 2051372 A JP2051372 A JP 2051372A JP 5137290 A JP5137290 A JP 5137290A JP H03252894 A JPH03252894 A JP H03252894A
Authority
JP
Japan
Prior art keywords
dictionary
vertical
writing
character
appear
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2051372A
Other languages
English (en)
Other versions
JP2904849B2 (ja
Inventor
Keiji Kojima
啓嗣 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2051372A priority Critical patent/JP2904849B2/ja
Publication of JPH03252894A publication Critical patent/JPH03252894A/ja
Application granted granted Critical
Publication of JP2904849B2 publication Critical patent/JP2904849B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字認識装置に関し、特に認識用辞書の編成
とその使用方法に関する。
〔従来の技術〕
日本語文章を扱う漢字OCR等においては、辞書をどの
ように編威し、それをどのように使用して認識を行うか
が認識効率や辞書コストの面で重要な課題となっている
例えば、特開昭59−148983号公報には、帳票を
認識対象として、帳票内の項目名称の認識に専用漢字辞
書を用い、他の記入欄の認識に汎用性の高い比較的少文
字種の漢字辞書を用いる方式%式% また、特開昭59−177683号公報には、普通文字
用辞書と微小文字用辞書を備え1文字パターンを普通文
字か微小文字かに大分類して一方の辞書を選択して認識
する光学的文字読取装置が述べられている。
〔発明が解決しようとする課題〕
近年、縦書き、横書き、縦書き・横書き混在といった具
合に様々な書式を扱う必要性が高まっているが、前記従
来技術は、そのような書式の多様性を考慮したものでは
ない。
縦書き、横書き、縦書き・横書き混在の文書を扱う場合
、全文字について縦書き用と横書き用の別々の辞書を用
意することも考えられるが、辞書全体の規模が2倍に膨
らむという問題がある。
よって本発明の目的は、縦書き、横書き、その混在とい
った様々な書式に対して、辞書の規模を抑え効率的に認
識することが可能な文字認識装置を提供することにある
〔課題を解決するための手段〕
上記課題を解決するために、本発明は、縦書き文章中に
のみ出現する文字を登録した縦書き専用辞書、横書き文
章中にのみ出現する文字を登録した横書き専用辞書、並
びに縦書き文章及び横書き文章の両方に出現する文字を
登録した縦横共有辞書を備え、縦書き文章の認識に縦書
き専用辞書及び縦横共有辞書を使用し、横書き文章の認
識に横書き専用辞書及び縦横共有辞書を使用することを
特徴とするものである。
〔作 用〕
第3図に示すように、「」〜()[コ 【]などの文字
(記号)は縦書きの場合と横書きの場合とで字形が大き
く異なるため、これを縦書き/横書きの区別をしないで
辞書を作成し、縦書き文章または横書き文章の文字認識
を行うと、無駄な処理が増加し非効率であるだけでなく
、文章の向きから明らかに誤っている変な認識結果が生
しることがある。
これに対し、本発明によれば、第3図(a)に示したよ
うな横書き文章中にのみ出現する文字は横書き専用辞書
に登録し、第3図(b)に示したような縦書き文章中に
のみ出現する文字は縦書き専用辞書に登録し、それ以外
の横書き文章中にも縦書き文章中にも出現する大部分の
文字は縦横共有辞書に登録し、横書き文章の文字を対象
にしている場合は横書き専用辞書と縦横共有辞書を使っ
て認識し、逆に縦書き文章の文字を対象にしている場合
は縦書き専用辞書と縦横共有辞書を使って認識する。
このように、文章の向きから出現する筈のない文字を登
録した専用辞書は使用しないので処理効率が向上し、ま
た明らかに不適当な文字と誤認することも少なくなるた
め後処理の効率も上がる6また、文章の向きに依存する
特定の文字を除く大部分の文字の辞書は縦横共有辞書に
統合される形になるため、辞書全体の規模の増大を防ぐ
ことができる。
〔実施例〕
第1図は本発明の一実施例に係る文字v!、識装翼装置
略ブロック図である。
イメージメモリ10はスキャナ等より入力された原稿イ
メージを蓄える。前処理部11は、入力原稿イメージに
対し、行の切り出し1文字の切り出し、横書き/縦書き
文章領域の判定、文章の向きを考慮した文字のサイズや
向きの正規化(辞書が横書きを標準としている場合に縦
書き文章の文字については90度回転する)などの処理
を行う。
辞書としては、前記の如く編成された横書き専用辞書1
4、縦書き専用辞書15及び縦横共有辞書16が設れら
けている。これらの辞書14,15.16は独立した辞
書ファイルとして作られてもよいし、第2図に示すよう
に、一つの辞書ファイルとして作成し、個々の辞書レコ
ードRにいずれの辞書であるかを示すフラグFを設定し
た構造とすることもできる。
選択部13は、前処理部11での横書き/縦書き文章領
域判定の結果に従い、横書き文章領域の認識処理時に横
書き専用辞書14と縦横共有辞書16を選び認識部12
よりアクセス可能とし、縦書き文章領域の認識処理時に
縦書き専用辞書15と縦横共有辞書16を選び認識部1
2よりアクセス可能とする。ただし、第2図のような辞
書構造の場合には、選択部13は各辞書レコードのフラ
グを調べ、認識部12のアクセスを選択的に可能とする
ことにより、同様の辞書選択を行う。
認識部12は、前処理後の文字イメージの特徴パターン
を抽出し、選択部13によって選択された辞書に登録さ
れた標準特徴パターン(テンプレート)との距離演算を
行い、距離の小さいN位までの候補を得る。そして、認
識結果候補のデータを出力ファイル17に格納する。
なお、入力原稿イメージをデイスプレィに表示し、画面
上でマウス等を用いて縦書き文章領域と横書き文章領域
を指定してもよい。
〔発明の効果〕
以上説明した如く、本発明によれば、縦書き文章、横書
き文章、その混在というような多様な書式に対し、辞書
の規模増大を抑えつつ効率的に認識することができると
ともに、文章の向きから考えて明らかに不自然な誤認を
少なくできる。
【図面の簡単な説明】
第1図は本発明の一実施例に係る文字認識装置の概略ブ
ロック図、第2図は辞書構造の変形例を示す図、第3図
は横書き専用辞書及び縦書き専用辞書に登録する文字の
例を示す図である。 10・・・イメージメモリ、 11・・・前処理部、1
2・・・認識部、 13・・・選択部、14・・・横書
き専用辞書、 15・・・縦書き専用辞書、 16・・・縦横共有辞書
、17・・・出力ファイル。 0−1樅τ傳田 Δ−鏝わJ−雨 0−一班諜失塙 第1 第3図

Claims (1)

    【特許請求の範囲】
  1. (1)縦書き文章中にのみ出現する文字を登録した縦書
    き専用辞書、横書き文章中にのみ出現する文字を登録し
    た横書き専用辞書、並びに縦書き文章及び横書き文章の
    両方に出現する文字を登録した縦横共有辞書を備え、縦
    書き文章の認識に縦書き専用辞書及び縦横共有辞書を使
    用し、横書き文章の認識に横書き専用辞書及び縦横共有
    辞書を使用することを特徴とする文字認識装置。
JP2051372A 1990-03-02 1990-03-02 文字認識装置 Expired - Lifetime JP2904849B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2051372A JP2904849B2 (ja) 1990-03-02 1990-03-02 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2051372A JP2904849B2 (ja) 1990-03-02 1990-03-02 文字認識装置

Publications (2)

Publication Number Publication Date
JPH03252894A true JPH03252894A (ja) 1991-11-12
JP2904849B2 JP2904849B2 (ja) 1999-06-14

Family

ID=12885114

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2051372A Expired - Lifetime JP2904849B2 (ja) 1990-03-02 1990-03-02 文字認識装置

Country Status (1)

Country Link
JP (1) JP2904849B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1011542A (ja) * 1996-06-20 1998-01-16 Fujitsu Ltd 文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1011542A (ja) * 1996-06-20 1998-01-16 Fujitsu Ltd 文字認識装置

Also Published As

Publication number Publication date
JP2904849B2 (ja) 1999-06-14

Similar Documents

Publication Publication Date Title
US6021218A (en) System and method for organizing recognized and unrecognized objects on a computer display
Kadner et al. Adaptifont: Increasing individuals’ reading speed with a generative font model and bayesian optimization
JPS62278073A (ja) 手書き原稿作成方法
JPH03252894A (ja) 文字認識装置
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JPS61240361A (ja) 手書き文字による文書作成装置
CN112101356A (zh) 一种图片中特定文本的定位方法、装置及存储介质
JPS63142460A (ja) 文書処理システムにおける罫線の移動・複写処理方式
JPH10302025A (ja) 手書き文字認識装置およびそのプログラム記録媒体
JPH0782530B2 (ja) 手書き文字認識装置
JPS60217483A (ja) 文字認識装置
JPH02282883A (ja) 手書き入力認識方式
JPH0634259B2 (ja) 文字認識装置
KR100408082B1 (ko) 인식률 및 가독성이 높은 한글 필기용 광학적 문자인식입력 방법
JPH04123185A (ja) 文書認識方式
JPH04123262A (ja) 表形式データ処理装置
JPH07210629A (ja) 文字認識方式
JPH0610447Y2 (ja) 画像処理装置
JPH02240789A (ja) 文字列切り出し方式
JPH01209586A (ja) 倍角文字・半角文字混在文章の文字認識方式
JPH06208657A (ja) 文字認識方法及び装置
JPS62260287A (ja) オンライン手書き文字認識方式
JPS6326789A (ja) 文字認識装置
JPH11184970A (ja) 筆記データ入力装置、及び記憶媒体
JPS63100535A (ja) 画像表示装置の「るび」表示制御方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090326

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100326

Year of fee payment: 11

EXPY Cancellation because of completion of term