JPH0345431B2 - - Google Patents

Info

Publication number
JPH0345431B2
JPH0345431B2 JP58050631A JP5063183A JPH0345431B2 JP H0345431 B2 JPH0345431 B2 JP H0345431B2 JP 58050631 A JP58050631 A JP 58050631A JP 5063183 A JP5063183 A JP 5063183A JP H0345431 B2 JPH0345431 B2 JP H0345431B2
Authority
JP
Japan
Prior art keywords
character
recognition
input
categories
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58050631A
Other languages
English (en)
Other versions
JPS59176882A (ja
Inventor
Eiichiro Yamamoto
Yoshihisa Fujii
Tozen Hai
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58050631A priority Critical patent/JPS59176882A/ja
Publication of JPS59176882A publication Critical patent/JPS59176882A/ja
Publication of JPH0345431B2 publication Critical patent/JPH0345431B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (A) 発明の技術分野 本発明は光学文字読取装置(OCR)など文字
認識装置に係り、特に単語辞書を備え単語として
の文字の連続性をチエツクすることによつて認識
精度を向上する文字認識装置に関する。
(B) 技術の背景 文字認識装置においては認識精度を向上するこ
とが最重要技術課題であることは言うまでもな
く、このため、予想される単語・熟語あるいは文
字列等を予め記憶する単語辞書を備え、入力文字
列を構成する各々の入力文字を文字カテゴリ毎の
標準特徴によつて認識し認識候補文字カテゴリを
得たのち、前記単語辞書によつて前後の認識候補
文字カテゴリとの連続性をチエツクする方式の文
字認識装置が用いられている。
(C) 従来技術と問題点 前記単語辞書を用い前後の認識候補文字カテゴ
リとの連続性をチエツクすることによつて認識精
度を向上する文字認識装置においては、単語辞書
との照合の対象とする入力文字列を何らかの方法
によつて識別する必要があり、従来、例えば文字
記入者が該当文字列にアンダラインを付ける、あ
るいは住所名等においては住所区分単位毎に予め
記入枠を定める等の方法が用いられていた。
しかし、前者においては文字記入者の負担を増
加し、また後者は適用範囲が限定され、一般の文
章等のように連続する文字列に対し適用すること
が困難であつた。
(D) 発明の目的 本発明の目的は、単語辞書を用い前後の認識候
補文字カテゴリの連続性チエツクすることによつ
て認識精度を向上する文字認識装置において、単
語辞書との照合の対象とする入力文字列の識別を
自動的におこなうことにある。
(E) 発明の構成 本発明になる文字認識装置は、入力文字列を構
成する各々の入力文字を文字カテゴリ毎の標準特
徴によつて認識し前記入力文字毎に前記標準特徴
との類似度もしくは該類似度の順位を付し認識候
補文字カテゴリを得る認識部と、前記認識部にお
いて得られる認識候補文字カテゴリがすべて所定
の文字カテゴリ例えば漢字のみである入力文字を
識別する識別部と、前記所定の文字カテゴリのみ
を構成要素とする単語を予め記憶する単語辞書
と、前記識別部によつて識別された入力文字に対
する認識候補文字カテゴリと前記単語辞書に記憶
される単語とを照合し該認識候補文字カテゴリの
中から前記識別された入力文字に対する認識文字
カテゴリを選択する照合部とを備えるものであ
る。
(F) 発明の実施例 次に本発明の要旨を図示実施例により具体的に
説明する。
第1図は本発明一実施例のブロツク図を示す。
図において1は入力文字を読取つて光電変換する
観測部、2は観測部1の出力として得られた入力
文字から該入力文字の特徴を抽出する特徴抽出
部、3は認識の対象とする文字カテゴリ毎の標準
特徴を予め記憶する文字辞書、4は特徴抽出部2
において得られた入力文字の特徴と文字辞書3に
記憶する標準特徴とを比較することによつて該入
力文字に対する認識候補文字カテゴリを類似度の
順に最大5個(候補カテゴリの個数はかならずし
も一定にする必要なく類似度等を基準にして可変
してもよい)求める認識部、5は認識部4におい
て得られた認識候補文字カテゴリを入力文字列の
順に該入力文字列を構成する各々の入力文字に対
応させ前記類似度の順に一時格納するバツフア、
6は認識部4において得られバツフア5に一時記
憶した入力文字毎の認識候補文字カテゴリがすべ
て漢字のみである入力文字に対し識別を施す識別
部、7は漢字のみを構成要素とする単語を予め記
憶する単語辞書、8はバツフア5に一時記憶され
た認識候補文字カテゴリのうち識別部6によつて
識別を施された入力文字が複数個連続する文字列
を構成する各々の入力文字に対する認識候補文字
カテゴリと単語辞書7に記憶される単語のうち構
成文字数が前記文字列と等しい単語とを照合し前
記認識候補文字カテゴリの中から前記識別をうけ
た入力文字に対する認識文字カテゴリを選択する
照合部、9はバツフア5に一時記憶された入力文
字毎の認識候補文字カテゴリのうち照合部8によ
る照合の対象とならなかつた入力文字の第1位の
類似度の認識候補文字カテゴリと照合部8におい
て選択された認識文字カテゴリとを認識結果とし
て入力文字列の順に格納する出力バツフアであ
る。
第2図は照合部8の詳細ブロツク図を示す。図
において、8−1は識別部6を制御しバツフア5
に一時記憶した入力文字毎の認識候補文字カテゴ
リがすべて漢字のみである入力文字を識別させる
とともに該識別をうけた入力文字が複数個連続す
る入力文字に対する認識候補文字カテゴリをバツ
フア5から取出す制御回路、8−2は制御回路8
−1によつてバツフア5から取出された複数個の
入力文字の各々に対する認識候補文字カテゴリを
それぞれ類似度の順に格納するレジスタ、8−3
は単語辞書7を制御しレジスタ8−2に格納した
認識候補文字カテゴリに対応する入力文字の数と
文字数の等しい単語を順次読出す制御回路、8−
4は制御回路8−3によつて単語辞書7から読出
された単語を格納するレジスタ、8−5はレジス
タ8−4に格納する単語とレジスタ8−2に格納
する認識候補文字カテゴリとを照合しレジスタ8
−4に格納されている単語を構成する各々の漢字
がレジスタ8−2の中の対応する認識候補文字カ
テゴリの何位にあるかを調べ該各々の漢字に対す
る順位の和を求める計算回路、8−6は計算回路
8−5によつて得られた値を順次格納するレジス
タ、8−7はレジスタ8−6に順次格納される値
の最小値を格納するレジスタ、8−8はレジスタ
8−6に順次格納される値とレジスタ8−7に格
納されている値とを比較しレジスタ8−6の値が
8−7の値より小さければレジスタ8−6の値を
レジスタ8−7にセツトするとともにレジスタ8
−4の内容をレジスタ8−9にセツトする比較器
である。
以上のような構成において、具体的な例とし
て、「電子計算機の分野における進歩がめざまし
い現在…」なる文字列を認識する場合について次
に説明する。
第3図は前記入力文字列及び該入力文字列を構
成する各々の入力文字に対し認識部4において得
られバツフア5に一時記憶された類似度第5位ま
での認識候補文字カテゴリならびに識別部6によ
つて施された識別(〇印)を示す。
識別を施された入力文字が複数個連続する文字
列は「計算機」・「分野」・「進歩」及び「現在」で
あり、照合部8はこれらの文字列を構成する入力
文字に対する認識文字カテゴリを選択する。
まず、文字列「計算機」に対しては第4図に示
すように、「計」・「算」及び「機」の各々に対す
る認識候補文字カテゴリが類似度の順にレジスタ
8−2に格納される。
一方、レジスタ8−4には漢字三文字からなる
単語が単語辞書7から順次読出されて格納され、
計算回路8−5はレジスタ8−4に格納した単語
を構成する各々の漢字がレジスタ8−2の中の対
応する認識候補文字カテゴリの何位にあるかを調
べる。図示例では「計」は2位・「算」は1位・
「機」は1位であり、その和として4が得られ、
これがレジスタ8−6に格納される。
レジスタ8−7には最初に大きな値を格納し、
単語辞書7に予め記憶した漢字三文字から成る単
語のすべてに対し前記のような処理をおこなう
と、計算回路8−5において得られた和の最小値
がレジスタ8−7に格納され、前記最小値に対応
する単語がレジスタ8−9にセツトされる。
同様にして「分野」・「進歩」・「現在」等の文字
列を構成する入力文字に対する認識文字カテゴリ
が選択される。
なお、前記文字列を除く他の入力文字、すなわ
ち「電」・「子」・「の」・「に」…に対しては類似度
第1位の認識候補文字カテゴリが認識結果として
出力バツフア9に出力される。
(G) 発明の効果 以上説明したように、本発明によれば、単語辞
書との照合の対象とする入力文字列の識別を自動
的におこなうことができる。
【図面の簡単な説明】
第1図は本発明一実施例のブロツク図、第2図
は照合部8の詳細ブロツク図、第3図と第4図は
実施例の説明図を示す。 図中、4は認識部、6は識別部、7は単語辞
書、8は照合部である。

Claims (1)

    【特許請求の範囲】
  1. 1 入力文字列を構成する各々の入力文字を文字
    カテゴリ毎の標準特徴によつて認識し前記入力文
    字毎に前記標準特徴との類似度もしくは該類似度
    の順位を付し認識候補文字カテゴリを得る認識部
    と、前記認識部において得られる認識候補文字カ
    テゴリがすべて所定の文字カテゴリのみである入
    力文字を識別する識別部と、前記所定の文字カテ
    ゴリのみを構成要素とする単語を予め記憶する単
    語辞書と、前記識別部によつて識別された入力文
    字に対する認識候補文字カテゴリと前記単語辞書
    に記憶される単語とを照合し該認識候補文字カテ
    ゴリの中から前記識別された入力文字に対する認
    識文字カテゴリを選択する照合部とを備えること
    を特徴とする文字認識装置。
JP58050631A 1983-03-26 1983-03-26 文字認識装置 Granted JPS59176882A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58050631A JPS59176882A (ja) 1983-03-26 1983-03-26 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58050631A JPS59176882A (ja) 1983-03-26 1983-03-26 文字認識装置

Publications (2)

Publication Number Publication Date
JPS59176882A JPS59176882A (ja) 1984-10-06
JPH0345431B2 true JPH0345431B2 (ja) 1991-07-11

Family

ID=12864316

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58050631A Granted JPS59176882A (ja) 1983-03-26 1983-03-26 文字認識装置

Country Status (1)

Country Link
JP (1) JPS59176882A (ja)

Also Published As

Publication number Publication date
JPS59176882A (ja) 1984-10-06

Similar Documents

Publication Publication Date Title
CN110705302B (zh) 命名实体的识别方法、电子设备及计算机存储介质
JPH0345431B2 (ja)
EP0553745A2 (en) Character recognition apparatus
JP3548372B2 (ja) 文字認識装置
JPS60147888A (ja) 文字認識後処理方法及びその装置
JPH0546814A (ja) 文字読み取り装置
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JPH07296005A (ja) 日本語テキスト登録・検索装置
JP2746345B2 (ja) 文字認識の後処理方法
JP2997151B2 (ja) 漢字変換装置
JPH0795337B2 (ja) 単語認識方式
JP2838850B2 (ja) 仮名漢字変換装置
JPH03257693A (ja) 文字認識結果修正方式
JP3725206B2 (ja) 文字認識装置
JP2574741B2 (ja) 言語処理方法
JP3139624B2 (ja) 形態素解析装置
CN115310458A (zh) 一种人名翻译方法、系统、设备及计算机可读存储介质
JPS61161588A (ja) 文字認識後処理方式
JPS6059487A (ja) 手書文字認識装置
JPS59180676A (ja) 文字認識装置
JPS63138479A (ja) 文字認識装置
JPS60144886A (ja) 文字認識装置における後処理方式
JPS5930176A (ja) 文字判定処理方式
JPS60217489A (ja) 文字認識装置
JPS62247451A (ja) 日本語処理装置の単語辞書構成法