JP2725454B2 - 文字コード知識処理方式 - Google Patents

文字コード知識処理方式

Info

Publication number
JP2725454B2
JP2725454B2 JP2318863A JP31886390A JP2725454B2 JP 2725454 B2 JP2725454 B2 JP 2725454B2 JP 2318863 A JP2318863 A JP 2318863A JP 31886390 A JP31886390 A JP 31886390A JP 2725454 B2 JP2725454 B2 JP 2725454B2
Authority
JP
Japan
Prior art keywords
knowledge processing
dictionary
character code
result
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2318863A
Other languages
English (en)
Other versions
JPH04188383A (ja
Inventor
慎治 佐瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=18103802&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2725454(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP2318863A priority Critical patent/JP2725454B2/ja
Publication of JPH04188383A publication Critical patent/JPH04188383A/ja
Application granted granted Critical
Publication of JP2725454B2 publication Critical patent/JP2725454B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は文字認識結果等を確認・補正する文字コード
知識処理方式に関するものである。
〔従来の技術〕
各種業務の合理化等のため、対象物に記載された文字
を光学的に認識することがしばしば行われている。
しかし、生の文字認識結果そのものには誤りが多く含
まれ、そのままでは使用できないことから、知識処理に
よりノイズの除去や誤りの訂正を行い、認識結果の信頼
性を向上させるようにしている。
また、光学的に認識された文字に限らず、キーボード
等から入力された文字に対しても同様な処理が施されて
いる。
ところで、従来、この種の文字コード知識処理方式で
は、予め ・文字情報 ・単語情報 ・文字間の遷移情報 ・単語間の遷移情報 等を辞書として記憶領域に保持しておき、入力した文
字コード列と比較・照合し、正しいことを確認し、ある
いは、より正しいと推定される文字コード列に補正する
ようにしていた。
〔発明が解決しようとする課題〕
上述したように、従来の文字コード知識処理方式にあ
っては、必要な情報を全て記憶領域上に保持しなければ
ならなかったため、記憶容量が不足したり、処理時間が
長くなる等の欠点があった。
例えば、住所認識専用の文字コード知識処理を考える
と、地域名だけ必要な単語数は約40万語となり、このた
めに必要な記憶容量や処理時間は膨大なものとなる。そ
して、この他に、一般に住所に付記されるアパート・マ
ンション名等を予め辞書として保持し、照合を行うとい
うことになると、記憶容量や処理時間からいって実現困
難となる。
本発明は上記の点に鑑み提案されたものであり、その
目的とするところは、コンパクトな辞書で高速に処理を
実行することのできる文字コード知識処理方式を提供す
ることにある。
〔課題を解決するための手段〕
本発明は上記の目的を達成するため、入力文字コード
列を知識処理用の常駐辞書に基づいて知識処理する第1
知識処理部と、 その結果に基づいて知識処理用の逐次辞書を作成する
辞書作成部と、 常駐辞書および逐次辞書に基づいて第1知識処理部の
結果を更に知識処理する第2知識処理部とを備えるよう
にしている。
〔作用〕
本発明の文字コード知識処理方式にあっては、入力文
字コード列を第1知識処理部が常駐辞書に基づいて知識
処理し、その結果に基づいて辞書作成部が逐次辞書を作
成し、常駐辞書および新たに作成された逐次辞書に基づ
いて第2知識処理部が第1知識処理部の結果を更に知識
処理する。
〔実施例〕
以下、本発明の実施例につき図面を参照して説明す
る。
第1図は本発明の文字コード知識処理方式の一実施例
を示す構成図である。
第1図において、本実施例は、入力文字コード格納部
1と第1知識処理部2と辞書作成部3と第2知識処理部
4と知識処理結果格納部5と常駐辞書6と逐次辞書7と
から構成され、実際には中央処理装置(CPU),メモリ
装置,ハードディスク等の記憶媒体,各種プログラム等
の回路装置から構成される。なお、各部の機能等は、重
複を避けるため、以下の動作を通して説明することとす
る。
文字を光学的に認識した結果である文字コード列やキ
ーボード等から入力された文字コード列は、予め入力文
字コード格納部1に格納されているものとする。
第2図は住所を認識した結果の入力文字コード列の例
を示したものであり、確率の高い順に上から10個の候補
が並んでおり、横一列がひとまとまりの文字列である。
第1図において、第1知識処理部2は入力文字コード
格納部1から入力文字コード列を取り出し、常駐辞書6
の情報を用い、単語の照合等を含む知識処理を施す。な
お、知識処理の技法については周知であるため、その説
明は省略する。また、常駐辞書6は、例えば住所知識処
理に関して、地域名が単語情報として登録されている。
第3図は第1知識処理部2の処理結果の例を示したも
のであり、上段が参考のために示した正しい住所、中段
が第1知識処理部2の処理結果であり、下線部が知識処
理によって確定した部分、下線の引かれていない部分が
入力文字コード列の第1候補をそのまま結果として出力
した部分、下段が入力文字コード列(第2図と同じ)で
ある。すなわち、常駐辞書6の地域名の単語情報によ
り、「小金井市」,「貫井北町」等を正しいものと認識
し、確定する。
次いで、第1図において、辞書作成部3は第1知識処
理部2の結果に応じ、同時に出現する可能性の高い単語
に関する情報等を含む逐次辞書7を入力文字コード列毎
に作成する。例えば、第3図の例では、前半の処理結果
に含まれる地域名「小金井市」,「貫井北町」を抽出す
ると共に、更に、「小金井市」の属する「東京都」を類
推し、これらを単語情報として逐次辞書7に登録する。
これは、アパート・マンション等の名称には地域名等が
多く用いられているという事実に基づく。なお、逐次辞
書7には、これらの単語がアパート・マンション等の名
称、略称等に連なるという遷移情報も含める。
次いで、第2知識処理部4は常駐辞書6と新たに作成
された逐次辞書7とを用いて、第1知識処理部2の結果
に対して更に知識処理を施し、結果を知識処理結果格納
部5に格納する。
第4図は第2知識処理部4の処理結果の例を示したも
のであり、上段が参考のために示した正しい住所、中段
が第2知識処理部4の処理結果であり、下線部が知識処
理によって確定した部分、下段が入力文字コード列(第
2図と同じ)である。すなわち、常駐辞書6に格納され
た「アパート」,「マンション」,「パレ」等の一般的
な単語情報と逐次辞書7に格納された地域名等の情報に
より「パレ」,「小金井」,「105号」を正しいものと
認識し、確定する。なお、「武蔵」については、それ以
前の結果から類推して逐次辞書7に情報を作成できなか
ったため、処理せずにそのまま出力している。
そして、知識処理結果格納部5に格納された結果は、
認識の目的に沿って適宜に利用される。
〔発明の効果〕
以上説明したように、本発明の文字コード知識処理方
式にあっては、常駐辞書として基本的な情報を割り当て
て記憶領域上に保持し、逐次辞書としては常駐辞書によ
る知識処理結果から類推して必要な情報を作成して記憶
領域上に追加保持すればよいことから、全体の記憶容量
が少なくて済むと共に、検索対象が少なくなることから
照合に要する処理時間が短くなって処理が高速に行える
という効果がある。
【図面の簡単な説明】 第1図は本発明の文字コード知識処理方式の一実施例を
示す構成図、 第2図は入力文字コード列の例を示す図、 第3図は第1知識処理部の結果の例を示す図および、 第4図は第2知識処理部の結果の例を示す図である。 図において、 1……入力文字コード格納部 2……第1知識処理部 3……辞書作成部 4……第2知識処理部 5……知識処理結果格納部 6……常駐辞書 7……逐次辞書

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】入力文字コード列を知識処理用の常駐辞書
    に基づいて知識処理する第1知識処理部と、 その結果に基づいて知識処理用の逐次辞書を作成する辞
    書作成部と、 常駐辞書および逐次辞書に基づいて第1知識処理部の結
    果を更に知識処理する第2知識処理部とを備えたことを
    特徴とする文字コード知識処理方式。
  2. 【請求項2】辞書作成部は、第1知識処理部の結果に応
    じ、同時に出現する可能性の高い単語に関する情報等を
    含む逐次辞書を作成することを特徴とした請求項1記載
    の文字コード知識処理方式。
  3. 【請求項3】文字認識結果の住所知識処理に適用したこ
    とを特徴とする請求項1または2記載の文字コード知識
    処理方式。
JP2318863A 1990-11-22 1990-11-22 文字コード知識処理方式 Expired - Lifetime JP2725454B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2318863A JP2725454B2 (ja) 1990-11-22 1990-11-22 文字コード知識処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2318863A JP2725454B2 (ja) 1990-11-22 1990-11-22 文字コード知識処理方式

Publications (2)

Publication Number Publication Date
JPH04188383A JPH04188383A (ja) 1992-07-06
JP2725454B2 true JP2725454B2 (ja) 1998-03-11

Family

ID=18103802

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2318863A Expired - Lifetime JP2725454B2 (ja) 1990-11-22 1990-11-22 文字コード知識処理方式

Country Status (1)

Country Link
JP (1) JP2725454B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2856409B2 (ja) * 1989-02-27 1999-02-10 株式会社東芝 文字認識装置および方法

Also Published As

Publication number Publication date
JPH04188383A (ja) 1992-07-06

Similar Documents

Publication Publication Date Title
CN113380223B (zh) 多音字消歧方法、装置、系统及存储介质
JP2725454B2 (ja) 文字コード知識処理方式
CN115455922B (zh) 表单校验方法、装置、电子设备和存储介质
CN116756382A (zh) 检测敏感字符串的方法、装置、设置及存储介质
JP2000250931A (ja) 位置情報の自動抽出装置および自動抽出方法と記録媒体
JP2839515B2 (ja) 文字読取システム
JP3108121B2 (ja) 音声認識装置の辞書制御方式
CN109582296B (zh) 一种基于栈增强lstm的程序表示方法
JP2942375B2 (ja) 文字読取装置
JP2619499B2 (ja) べた書き住所の文字認識後処理方式
JP2795003B2 (ja) 文字認識処理装置
JP3018579B2 (ja) 名前検索処理装置
JPH07271920A (ja) 文字認識装置
JP2874199B2 (ja) 単語辞書照合装置
JPS63103393A (ja) 単語認識装置
JP2835065B2 (ja) 文字列検索方法
JPS63138478A (ja) 文字認識方式
JPS63138480A (ja) 文字認識方式
JP2002288194A (ja) 戸籍情報処理装置及び方法、プログラム
JPS62285189A (ja) 文字認識後処理方式
JPH05135212A (ja) 住所単語照合方法
JPH03189891A (ja) 辞書参照による知識処理を行う文字列読み取り装置
JP2000172695A (ja) データ格納方法、データベース、データベース検索方法、データベース検索装置、及び記録媒体
JPS62236088A (ja) 濁点・半濁点つき文字の認識装置
JPH07152545A (ja) データ項目名変換装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071205

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081205

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091205

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091205

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101205

Year of fee payment: 13

EXPY Cancellation because of completion of term