JP2904849B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2904849B2
JP2904849B2 JP2051372A JP5137290A JP2904849B2 JP 2904849 B2 JP2904849 B2 JP 2904849B2 JP 2051372 A JP2051372 A JP 2051372A JP 5137290 A JP5137290 A JP 5137290A JP 2904849 B2 JP2904849 B2 JP 2904849B2
Authority
JP
Japan
Prior art keywords
dictionary
horizontal
vertical
writing
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2051372A
Other languages
English (en)
Other versions
JPH03252894A (ja
Inventor
啓嗣 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2051372A priority Critical patent/JP2904849B2/ja
Publication of JPH03252894A publication Critical patent/JPH03252894A/ja
Application granted granted Critical
Publication of JP2904849B2 publication Critical patent/JP2904849B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
〔産業上の利用分野〕 本発明は、文字認識装置に関し、特に認識用辞書の編
成とその使用方法に関する。 〔従来の技術〕 日本語文章を扱う漢字OCR等においては、辞書をどの
ように編成し、それをどのように使用して認識を行うか
が認識効率や辞書コストの面で重要な課題となってい
る。 例えば、特開昭59−148983号公報には、帳票を認識対
象として、帳票内の項目名称の認識に専用漢字辞書を用
い、他の記入欄の認識に汎用性の高い比較的少文字種の
漢字辞書を用いる方式が述べられている。 また、特開昭59−177683号公報には、普通文字用辞書
と微小文字用辞書を備え、文字パターンを普通文字か微
小文字かに大分類して一方の辞書を選択して認識する光
学的文字読取装置が述べられている。 〔発明が解決しようとする課題〕 近年、縦書き、横書き、縦書き・横書き混在といった
具合に様々な書式を扱う必要性が高まっているが、前記
従来技術は、そのような書式の多様性を考慮したもので
はない。 縦書き、横書き、縦書き・横書き混在の文書を扱う場
合、全文字について縦書き用横書き用の別々の辞書を用
意することも考えられるが、辞書全体の規模が2倍に膨
らむという問題がある。 よって本発明の目的は、縦書き、横書き、その混在と
いった様々な書式に対して、辞書の規模を抑え効率的に
認識することが可能な文字認識装置を提供することにあ
る。 〔課題を解決するための手段〕 上記課題を解決するために、本発明は、縦書き文章中
にのみ出現する文字を登録した縦書き専用辞書、横書き
文章中にのみ出現する文字を登録した横書き専用辞書、
並びに縦書き文章及び横書き文章の両方に出現する文字
を登録した縦横共有辞書を備え、縦書き文章の認識に縦
書き専用辞書及び縦横共有辞書を使用し、横書き文章の
認識に横書き専用辞書及び縦横共有辞書を使用すること
を特徴とするものである。 〔作用〕 第3図に示すように、「 」〜( )[ ]
〔実施例〕
第1図は本発明の一実施例に係る文字認識装置の概略
ブロック図である。 イメージメモリ10はスキャナ等により入力された原稿
イメージを蓄える。前処理部11は、入力原稿イメージに
対し、行の切り出し、文字の切り出し、横書き/縦書き
文章領域の判定、文章の向きを考慮した文字のサイズや
向きの正規化(辞書が横書きを標準としている場合に縦
書き文章の文字については90度回転する)などの処理を
行う。 辞書としては、前記の如く構成された横書き専用辞書
14、縦書き専用辞書15及び縦横共有辞書16が設れらけて
いる。これらの辞書14,15,16は独立した辞書ファイルと
して作られてもよいし、第2図に示すように、一つの辞
書ファイルとして作成し、個々の辞書レコードRにいず
れの辞書であるかを示すフラグFを設定した構造とする
こともできる。 選択部13は、前処理部11での横書き/縦書き文章領域
判定の結果に従い、横書き文章領域の認識処理時に横書
き専用辞書14と縦横共有辞書16を選び認識部12よりアク
セス可能とし、縦書き文書領域の認識処理時に縦書き専
用辞書15と縦横共有辞書16を選び認識部12よりアクセス
可能とする。ただし、第2図のような辞書構造の場合に
は、選択部13は各辞書レコードのフラグを調べ、認識部
12のアクセスを選択的に可能とすることにより、同様の
辞書選択を行う。 認識部12は、前処理後の文字イメージの特徴パターン
を抽出し、選択部13によって選択された辞書に登録され
た標準特徴パターン(テンプレート)との距離演算を行
い、距離の小さいN位までの候補を得る。そして、認識
結果候補のデータを出力ファイル17に格納する。 なお、入力原稿イメージをディスプレイに表示し、画
面上でマウス等を用いて縦書き文章領域と横書き文章領
域を指定してもよい。 〔発明の効果〕 以上説明した如く、本発明によれば、縦書き文章、横
書き文章、その混在というような多様な書式に対し、辞
書の規模増大を抑えつつ効率的に認識することができる
とともに、文章の向きから考えて明らかに不自然な誤認
を少なくできる。
【図面の簡単な説明】
第1図は本発明の一実施例に係る文字認識装置の概略ブ
ロック図、第2図は辞書構造の変形例を示す図、第3図
は横書き専用辞書及び縦書き専用辞書に登録する文字の
例を示す図である。 10…イメージメモリ、11…前処理部、12…認識部、13…
選択部、14…横書き専用辞書、15…縦書き専用辞書、16
…縦横共有辞書、17…出力ファイル。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】縦書き文章中にのみ出現する文字を登録し
    た縦書き専用辞書、横書き文章中にのみ出現する文字を
    登録した横書き専用辞書、並びに縦書き文章及び横書き
    文章の両方に出現する文字を登録した縦横共有辞書を備
    え、縦書き文章の認識に縦書き専用辞書及び縦横共有辞
    書を使用し、 横書き文章の認識に横書き専用辞書及び縦横共有辞書を
    使用することを特徴とする文字認識装置。
JP2051372A 1990-03-02 1990-03-02 文字認識装置 Expired - Lifetime JP2904849B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2051372A JP2904849B2 (ja) 1990-03-02 1990-03-02 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2051372A JP2904849B2 (ja) 1990-03-02 1990-03-02 文字認識装置

Publications (2)

Publication Number Publication Date
JPH03252894A JPH03252894A (ja) 1991-11-12
JP2904849B2 true JP2904849B2 (ja) 1999-06-14

Family

ID=12885114

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2051372A Expired - Lifetime JP2904849B2 (ja) 1990-03-02 1990-03-02 文字認識装置

Country Status (1)

Country Link
JP (1) JP2904849B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1011542A (ja) * 1996-06-20 1998-01-16 Fujitsu Ltd 文字認識装置

Also Published As

Publication number Publication date
JPH03252894A (ja) 1991-11-12

Similar Documents

Publication Publication Date Title
US10741167B2 (en) Document mode processing for portable reading machine enabling document navigation
US6546385B1 (en) Method and apparatus for indexing and searching content in hardcopy documents
US9626000B2 (en) Image resizing for optical character recognition in portable reading machine
US7505056B2 (en) Mode processing in portable reading machine
US8150107B2 (en) Gesture processing with low resolution images with high resolution processing for optical character recognition for a reading machine
US7629989B2 (en) Reducing processing latency in optical character recognition for portable reading machine
US5350303A (en) Method for accessing information in a computer
US8711188B2 (en) Portable reading device with mode processing
US8626512B2 (en) Cooperative processing for portable reading machine
JP3289968B2 (ja) 電子的文書処理のための装置および方法
US8284999B2 (en) Text stitching from multiple images
US8249309B2 (en) Image evaluation for reading mode in a reading machine
US8186581B2 (en) Device and method to assist user in conducting a transaction with a machine
US20150043822A1 (en) Machine And Method To Assist User In Selecting Clothing
US20060071950A1 (en) Tilt adjustment for optical character recognition in portable reading machine
US20060006235A1 (en) Directed reading mode for portable reading machine
US5854860A (en) Image filing apparatus having a character recognition function
JP2904849B2 (ja) 文字認識装置
JPH08263587A (ja) 文書入力方法および文書入力装置
JPH05303619A (ja) 電子スクラップブック
Sugawara Document reading system for the visually disabled
Kamiya et al. The Development of a Document Digitizing System: The" Information Factory
Coy A Look at Optoelectronic Document Processing
Sugawara Document Reader for the Visually Disabled
JPH01171078A (ja) 手書き文字から電気活字への変換装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090326

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100326

Year of fee payment: 11

EXPY Cancellation because of completion of term