JPH08227427A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH08227427A
JPH08227427A JP7280636A JP28063695A JPH08227427A JP H08227427 A JPH08227427 A JP H08227427A JP 7280636 A JP7280636 A JP 7280636A JP 28063695 A JP28063695 A JP 28063695A JP H08227427 A JPH08227427 A JP H08227427A
Authority
JP
Japan
Prior art keywords
word
information
candidate
character
name word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7280636A
Other languages
English (en)
Inventor
Yoshiaki Kurosawa
由明 黒沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7280636A priority Critical patent/JPH08227427A/ja
Publication of JPH08227427A publication Critical patent/JPH08227427A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】本発明は、簡易に且つ高速度に人名単語と候補
カテゴリとの比較を行って人名単語の認識を効果的に行
い、同時にその人名単語に対する住所、電話番号等の情
報を効果的に得ることができる文字認識装置を提供す
る。 【解決手段】文字認識に用いる単語辞書14に、認識対
象の人名単語14aと該人名単語14aにかかる住所、
電話番号等の情報を属性データ14bを組にして、これ
らが互いに隣接するように登録し、各認識対象の人名単
語と候補カテゴリとの比較照合の際、情報を飛ばして人
名単語のみを検索するとともに、単語辞書14中の人名
単語14aが特定されると、これに隣接して登録された
住所、電話番号等の情報を読出すようにしている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば手書入力さ
れたn文字からなる単語を簡易に且つ効果的に認識し、
その認識結果によって示されるデータベース等の情報を
得ることのできる文字認識装置に関する。
【0002】
【従来の技術】文字を認識する場合、基本的にはその文
字の特徴を検出して行われるが、n文字からなる単語を
認識するとき、個々の文字をそれぞれ認識し、その結果
を組合せるだけでは不十分なことが多い。また或る文字
の認識が不十分な場合にはその単語を認識することが困
難となることもある。
【0003】そこで従来では、図5に示すように認識装
置を構成し、有意の単語数が限られることを利用して個
々の文字認識が不十分な場合であってもその単語を認識
するような工夫が施されている。即ち、文字入力部1を
介して与えられるn文字の文字列からなる単語を認識部
2に導びいて文字認識する。この認識が困難な場合に
は、その単語に対する複数の候補カテゴリを求めて単語
照合部3に与える。この単語照合部3では、上記候補カ
テゴリの中の単語として有意な組合せを、単語辞書4に
登録された単語の中から探し出し、これによって正しい
単語の選択を行いその認識を行う。
【0004】
【発明が解決しようとする課題】このような認識処理に
よれば、個々の文字に対する認識結果が不完全であって
も、その候補カテゴリの組合せによって有意な単語を選
び出すことができ、結果として効果的な単語認識が可能
となる。然し乍ら、文字認識によって得られる候補カテ
ゴリが多い場合、その組合せが膨大となる為に、単語と
の照合に極めて多大な時間を要すると云う不具合があ
る。
【0005】一方、このように文字認識装置において、
認識された単語に関する情報を検索したいことがある。
これは、例えば、認識対象単語が人名単語で与えられる
ような場合、この認識対象である人名単語に直接的なも
のでないが、人名単語に対する情報である住所、電話番
号等の情報を検索したい場合である。
【0006】このような場合、従来では、候補カテゴリ
との比較照合に用いる辞書として人名単語を登録した辞
書を用意し、これと別個に人名単語に対応する住所、電
話番号等の情報を記憶したテーブルを用意するようにし
ている。つまり、従来では、認識対象単語が人名単語で
与えられる場合、人名/住所、電話番号等に対応させて
記憶したデータベースが既に存在しているため、これと
文字認識装置を別個に構築し、人名のみを記憶した単語
辞書を用いて文字認識を行った後に得られた人名単語で
上記既存のデータベースを検索するようにしている。
【0007】ところが、これまでのものは、管理するデ
ータベースが文字認識に用いる人名単語を登録した辞書
と住所、電話番号等の情報の検索に用いるテーブルとの
2個になってしまい、その管理が面倒になるという欠点
があり、さらに、単語辞書中の人名単語を特定するため
の検索、特定した後のテーブル読み出しのためのテーブ
ル指定、テーブルの検索という繁雑な手順を必ず経る必
要があり、検索を2度行うために時間もかかるという欠
点があった。
【0008】本発明はこのような事情を考慮してなされ
たもので、その目的とするところは、簡易に且つ高速度
に人名単語と候補カテゴリとの比較を行って人名単語の
認識を効果的に行い、同時にその人名単語に対する住
所、電話番号等の情報を効果的に得ることができる文字
認識装置を提供することにある。
【0009】
【課題を解決するための手段】請求項1記載の発明は、
文字列として与えられた入力単語の各文字につき認識し
てそれぞれの候補カテゴリを求める手段と、予め認識対
象の人名単語と該人名単語にかかる住所、電話番号等の
情報とを隣接させ組としたものを複数組登録した単語辞
書と、この単語辞書のうち前記情報を除いて前記人名単
語のみを検索しこの検索した人名単語と上記候補カテゴ
リとを比較照合する手段と、比較照合が行われた人名単
語の前記入力単語に対する一致度を候補カテゴリの候補
順位または入力単語の文字に対する類似度から計算して
一致度の高い人名単語を候補単語として選択する手段
と、この選択された人名単語と該人名単語にかかる住
所、電話番号等の情報を前記単語辞書から読出す手段と
により構成している。
【0010】この結果、請求項1記載の発明によれば、
文字認識に用いる単語辞書に認識対象の人名単語と該人
名単語にかかる住所、電話番号等の情報とを組にし、こ
れらが互いに隣接するように登録し、認識対象の人名単
語と候補カテゴリとの比較照合の際、住所、電話番号等
の情報を飛ばして人名単語のみを検索するという新たな
構成を採用することにより、管理するデータベースを1
個にでき、管理制御が簡単にすることができ、特に、単
語辞書中の人名単語が特定されると、これに隣接して登
録された住所、電話番号等の情報を読出せばよいので、
認識対象である人名単語に対して、これに対応する住
所、電話番号等の情報を1度の検索で得られるようにな
り、データベースの検索や管理を能率よく行うことがで
きる。
【0011】
【発明の実施の形態】以下、本発明の一実施の形態を図
面に従い説明する。図1は、一実施の形態の概略構成を
示す図である。この場合、n文字からなる文字列として
与えられる入力単語は、認識部11にて各文字につきそ
れぞれ認識され、それぞれr個の候補カテゴリ(文字コ
ード)が求められる。これらの候補カテゴリは、その候
補順位に応じて第1位から第r位まで各単語文字位置毎
に定められる。
【0012】尚、このとき各候補カテゴリの文字に対す
る類似度、つまり候補カテゴリの標準文字パターンと入
力文字パターンとが似ている度合をそれぞれ求め、この
類似度と候補カテゴリとを一体的に扱うようにしてもよ
い。
【0013】かくして、認識部11によって求められた
n文字に対するそれぞれr個の候補カテゴリの組合せに
よって得られる認識対象単語はrn 個となる。そして、
これらの候補カテゴリは、編集部12を介して単語照合
部13に与えられる。
【0014】一方、単語辞書14には詳細は後述する
が、n文字からなるLn 個の人名単語と、その人名単語
にかかる住所、電話番号等の情報とをそれぞれ対応して
予め登録している。これらの人名単語は順次読出されて
前記単語照合部13に与えられ、認識処理に供される。
【0015】さて、単語照合部13は、基本的には次の
ように構成される。前記認識部11を介して認識された
n文字に対するr個の候補カテゴリ、つまりn×r個の
候補カテゴリは候補文字レジスタ21に格納される。ま
たアドレスカウンタ22の制御を受けて単語辞書14か
ら読出される人名単語は単語辞書レジスタ23に格納さ
れる。この単語辞書レジスタ23に格納された人名単語
の各文字はコンパレータ24に供給され、レジスタカウ
ンタ25の制御を受けて候補文字レジスタ21から順次
読出される候補カテゴリと単語文字位置に対応して一致
比較される。
【0016】コンパレータ24によって人名単語と候補
カテゴリとの一致が単語文字位置毎に行われる。そし
て、その一致検出情報は一致度計算部26に与えられ、
この計算部26にてレジスタ23に格納されて比較に供
された人名単語の入力単語に対する一致度が計算されて
いる。この一致度計算は、例えば一致した候補カテゴリ
の候補順位を各単語文字位置毎に求め、その候補順位情
報の総合値を求める等して行われる。また前記したよう
に候補カテゴリについてその類似度が求められている場
合には、各単語文字位置毎に一致検出された候補カテゴ
リの類似度の総和値として一致度を求めるようにしても
よい。
【0017】尚、この一致比較によっていずれかの単語
文字位置において一致する候補カテゴリが見出されない
場合には、その人名単語に対する一致性がないものとし
て取扱うようにすればよい。
【0018】そして、このような単語の一致度計算は、
単語辞書14から人名単語を読出す都度繰返して行わ
れ、n個の全ての人名単語につき、その一致度が求めら
れる。しかして、このようにして求められた各人名単語
の入力単語に対する一致度の情報はソート処理部27に
導びかれ、一致度の高いものから順にソート処理され
る。そして、一致度の高いx個の人名単語が候補単語と
して編集部12に与えられる。
【0019】この編集部12では、これらの候補単語と
入力単語の認識情報とを総合的に編集し、これを判定し
て認識結果を得、その認識された人名単語と共に該単語
にかかる住所、電話番号等の情報を求めている。
【0020】このような照合処理は、具体的には次のよ
うにして行われる。図2はその一例を示すもので、候補
文字レジスタ21は、n行r列の記憶エリアを持つシフ
トレジスタにより構成される。
【0021】しかして、n文字につきそれぞれ認識され
た候補カテゴリは、n行に単語文字位置を対応させ、そ
の候補順位に従ってr列に亘って順次格納される。そし
て、これらの格納された候補カテゴリは、カウンタ25
の制御を受けて1列毎に並列的に読出され、コンパレー
タ24に与えられる。また、このコンパレータ24には
レジスタ23から人名単語の各文字データが単語文字位
置に対応して並列的に与えられている。
【0022】これによって、各単語文字位置において、
候補カテゴリと単語文字との同時対比が行われる。そし
て、一致結果を得た単語文字位置からその情報が一致度
計算部26に与えられ、そのときのカウンタ25の計算
値が候補順位情報として取込まれる。そして、1回の比
較が終了したとき、カウンタ25が歩進されて次の1列
の候補カテゴリがコンパレータ24に与えられ、同様に
して一致検出が行われる。そして、この一致検出は、r
回繰返して行われ、これによってレジスタ23に格納さ
れた単語に対する照合処理を終える。
【0023】このとき、一致度計算部26には各単語文
字位置毎に一致検出された候補カテゴリを示すカウント
値、つまり候補順位の情報が得られており、この情報に
したがって、レジスタ23に格納された単語の入力単語
に対する一致度が求められている。
【0024】ソート処理部27では、このときのアドレ
スカウンタ22のカウント値から、上記一致度が求めら
れた人名単語を認識しており、その一致度の高い人名単
語を、一致度とカウント値として格納している。そし
て、次に入力された単語の一致度と、先に入力された単
語の一致度とを比較し、一致度の低い単語情報を切捨て
ると共に、その並び換えを行う等してソート処理を行っ
ている。
【0025】尚、この場合、候補文字レジスタ21に格
納した候補カテゴリに対応して、その類似度情報を別の
記憶エリアに格納しておき、一致度計算を前記した候補
順位に代えて類似度情報に従って行うようにしてもよ
い。
【0026】また、この図2に示す構成では、照合処理
を各単語文字位置につき並列的に同時に実行するように
したが、図3に示すようにシリアルに実行するようにし
ても良い。即ち候補文字レジスタ21をn×r個の記憶
エリアをもつものとし、これらの記憶エリアに候補カテ
ゴリを順に格納するように構成する。尚、ここでは候補
カテゴリと共に類似度情報も格納するようにしたものを
示す。そして、上記候補カテゴリをカウンタ25のアド
レス制御により順次読出してコンパレータ24に供給す
る共に、レジスタ23に格納された人名単語の各文字を
セレクタ28を介して順次読出するようにする。この場
合、第1位の文字をセレクトしてその文字位置における
候補文字を順次読出して一致検出し、その後、第2位の
文字をセレクトしてその文字位置の候補カテゴリに対す
る一致検出を行うようにカウンタ25のアドレス制御
と、セレクタ28のセレクト制御を同期させるようにす
ればよい。このようにしても、図2で述べた例と同様に
照合処理を行うことができる。
【0027】図4は上述した認識処理の概念を示す図で
あり、ここでは入力単語として「黒沢」なる人名単語が
与えられる例を示している。また、単語辞書14には、
認識対象とする人名単語14aと共に、その人名単語1
4aにかかる情報として住所、電話番号等の情報が属性
データ14bとして予め登録されている。
【0028】そして、このうちの人名単語14aが入力
単語に対する認識処理に供されることになり、この人名
単語14aが認識結果として前述した如く求められたと
き、この人名単語14aと共に、住所、電話番号等の情
報が読出されることになる。この読出し処理は、前記編
集部12により行われる。
【0029】これにより、認識対象として人名単語14
aが与えられ、これら人名単語14aの属性データ14
bとして登録されている住所、電話番号等の情報を1回
の検索で得られるようになり、これらの情報をもって会
員名簿や顧客台帳等のデータベース検索や管理を効率よ
く行うことができるようになる。
【0030】従って、このようにすれば、文字認識に用
いる単語辞書14に、認識対象の人名単語14aと、該
人名単語14aにかかる住所、電話番号等の情報を組に
して、これらが互いに隣接するように登録し、認識対象
の人名単語と候補カテゴリとの比較照合の際、情報を飛
ばして人名単語のみを検索するという新たな構成を採用
することにより、管理するデータベースを1個にでき、
管理制御が簡単にすることができ、特に、単語辞書14
中の人名単語14aが特定されると、これに隣接して登
録された住所、電話番号等の情報を読出せばよいので、
これら人名単語に対応する住所、電話番号等の情報を1
度の検索で効率よく得られるようになり、データベース
の検索や管理を能率よく行うことができる。
【0031】
【発明の効果】以上述べたように本発明によれば、人名
単語と候補カテゴリとの比較を行って人名単語の認識を
効果的に行うと同時に、その人名単語に対する住所、電
話番号等の情報を効果的に得ることができ、これ故、人
名単語とそのデータベースとを一体に取扱うことが可能
となり、データベース検索や管理制御等において実用上
多大なる効果が奏せられる。
【図面の簡単な説明】
【図1】本発明の一実施の形態の概略構成を示す図。
【図2】一実施の形態の単語照合部の基本的な構成例を
示す図。
【図3】一実施の形態の単語照合部の基本的な構成例を
示す図。
【図4】一実施の形態の認識処理概念を示す図。
【図5】従来装置の一例を示す概略構成図。
【符号の説明】
11…認識部、 12…編集部、 13…単語照合部、 14…単語辞書、 21…候補文字レジスタ、 22…アドレスカウンタ、 23…単語辞書レジスタ、 24…コンパレータ、 25…レジスタカウンタ、 26…一致度計算部、 27…ソート処理部、 28…セレクタ、 14a…単語、 14b…属性データ。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文字列として与えられた入力単語の各文
    字につき認識してそれぞれの候補カテゴリを求める手段
    と、 予め認識対象の人名単語と該人名単語にかかる住所、電
    話番号等の情報とを隣接させ組としたものを複数組登録
    した単語辞書と、 この単語辞書のうち前記情報を除いて前記人名単語のみ
    を検索しこの検索した人名単語と上記候補カテゴリとを
    比較照合する手段と、 比較照合が行われた人名単語の前記入力単語に対する一
    致度を候補カテゴリの候補順位または入力単語の文字に
    対する類似度から計算して一致度の高い人名単語を候補
    単語として選択する手段と、 この選択された人名単語と該人名単語にかかる住所、電
    話番号等の情報を前記単語辞書から読出す手段とを具備
    したことを特徴とする文字認識装置。
JP7280636A 1995-10-27 1995-10-27 文字認識装置 Pending JPH08227427A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7280636A JPH08227427A (ja) 1995-10-27 1995-10-27 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7280636A JPH08227427A (ja) 1995-10-27 1995-10-27 文字認識装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP57163401A Division JPS5953985A (ja) 1982-09-20 1982-09-20 文字認識装置

Publications (1)

Publication Number Publication Date
JPH08227427A true JPH08227427A (ja) 1996-09-03

Family

ID=17627825

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7280636A Pending JPH08227427A (ja) 1995-10-27 1995-10-27 文字認識装置

Country Status (1)

Country Link
JP (1) JPH08227427A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6327373B1 (en) 1998-02-18 2001-12-04 Kabushiki Kaisha Toshiba Mail address reading apparatus and mail sorting apparatus

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5576400A (en) * 1978-12-04 1980-06-09 Fujitsu Ltd Retrieval by speech system for chinese character items
JPS5710876A (en) * 1980-06-23 1982-01-20 Toshiba Corp Electronic dictionary
JPS5725074A (en) * 1980-07-21 1982-02-09 Fujitsu Ltd Character recognition post-processing system
JPS57108959A (en) * 1980-12-25 1982-07-07 Casio Comput Co Ltd Data storage device of electronic dictionary

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5576400A (en) * 1978-12-04 1980-06-09 Fujitsu Ltd Retrieval by speech system for chinese character items
JPS5710876A (en) * 1980-06-23 1982-01-20 Toshiba Corp Electronic dictionary
JPS5725074A (en) * 1980-07-21 1982-02-09 Fujitsu Ltd Character recognition post-processing system
JPS57108959A (en) * 1980-12-25 1982-07-07 Casio Comput Co Ltd Data storage device of electronic dictionary

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6327373B1 (en) 1998-02-18 2001-12-04 Kabushiki Kaisha Toshiba Mail address reading apparatus and mail sorting apparatus

Similar Documents

Publication Publication Date Title
US5774588A (en) Method and system for comparing strings with entries of a lexicon
US5404507A (en) Apparatus and method for finding records in a database by formulating a query using equivalent terms which correspond to terms in the input query
US6738515B1 (en) Pattern string matching apparatus and pattern string matching method
WO2016057000A1 (en) Customs tariff code classification
JPS6120038B2 (ja)
US4104717A (en) Automatic system for providing telephone number information service
US4020473A (en) Automatic system for providing telephone number information service
JPH08227427A (ja) 文字認識装置
JPH0474756B2 (ja)
CN113535895A (zh) 搜索文本处理方法、装置、电子设备及介质
KR19990025292A (ko) 필터링 과정에 의한 이미지 데이터 베이스의 효과적 검색 방법
JP2998054B2 (ja) 文字認識方法及び文字認識装置
US20120011434A1 (en) Method for Object Recognition and Describing Structure of Graphical objects
JPS5953986A (ja) 文字認識装置
JP2839515B2 (ja) 文字読取システム
JP2519245B2 (ja) 情報検索装置
JPH02148174A (ja) Ocrによる住所データベース検索装置
JP3104893B2 (ja) 情報検索方式
JP2001147930A (ja) 文字列比較方法および文字列比較を用いた情報検索装置
JPH07114622A (ja) 文字認識装置の後処理方法
JP2680311B2 (ja) 文字認識方式
CN114387974A (zh) 一种基于声纹识别的串案方法、系统、装置及存储介质
JPS63138479A (ja) 文字認識装置
JPH02308384A (ja) 住所認識装置
JPH07271869A (ja) 電子帳票検索システム