JPH03257693A - 文字認識結果修正方式 - Google Patents

文字認識結果修正方式

Info

Publication number
JPH03257693A
JPH03257693A JP2057071A JP5707190A JPH03257693A JP H03257693 A JPH03257693 A JP H03257693A JP 2057071 A JP2057071 A JP 2057071A JP 5707190 A JP5707190 A JP 5707190A JP H03257693 A JPH03257693 A JP H03257693A
Authority
JP
Japan
Prior art keywords
address
character
recognition
dictionary
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2057071A
Other languages
English (en)
Inventor
Tsuyoshi Kitani
木谷 強
Hideyuki Isoyama
磯山 秀幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Group Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP2057071A priority Critical patent/JPH03257693A/ja
Publication of JPH03257693A publication Critical patent/JPH03257693A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字認識結果修正方式に関し、より詳細には
、光学式文字読取り装置(OCR)等の文字認識装置に
おいて、売上げ伝票、配送伝票等に記入される住所の文
字認識結果について、認識誤りを修正し、更に、部分的
に省略された住所文字列を補うことを可能とする文字認
識結果修正方式〔従来の技術〕 従来、文字認識結果から正しい住所表記を得る技術とし
て、認識結果の中の郵便番号が利用できる場合は、郵便
番号に対応する住所を住所辞書から検索してそれを住所
とするという技術が知られている。また、郵便番号が利
用できない場合は、認識結果文字と類似した文字が格納
されている辞書から、正しい認識文字となる可能性があ
る文字を認識結果に追加した後、認識結果から候補文字
の組み合わせを作成し、住所辞書から一致する住所を探
して、一致したものを正しい住所とするという技術も知
られている。
しかしながら、上記従来技術は、住所の一部が省略され
ている場合、解析が不可能になるという問題があったば
かりではなく、省略された部分を補い省略のない住所に
修正することはできないという問題があった。また、住
所の検索は、文字列の完全一致を前提としているため、
複数の解析結果が得られることが少なく、解析結果に対
して候補順位を決定する技術がなかった。
辞書から文字列を検索する場合、処理時間を短縮するた
めには、検索前に文字列を可能な限り区切っておくこと
が有効であるが、従来の住所辞書検索技術では、住所の
構造を利用して認識結果文字列を最小単位毎に精度良く
区切る手法を採用していなかった。
更に、文字認識処理装置とのインタラクションに関する
技術として、認識誤りを正しい住所に修正する過程で、
同一の住所文字列に対して文字認識処理を異なる処理パ
ラメータで再度実行することが有効である場合があるが
、従来は、このような技術がなく、解析過程で得られる
情報を有効に活用していなかった。
認識結果の候補文字群から確からしい文字を選び出すこ
とは、住所辞書を検索するときの処理時間を短縮するた
めに必要であるが、上述の如く、従来は、固定的な文字
認識処理パラメータを採用していたため、認識結果中か
ら確からしい候補を選び出す技術(文字認識候補の絞り
込み技術)は、文字認識処理パラメータの変化に対応し
て絞り込み方式を動的に変化させるものではなかった。
なお、上記従来技術に関しては、例えば、清野他による
「自由記載住所文字列に対する知識処理」(電子情報通
信学会春季全国大会D−465,pp、6−185゜1
989)、鈴木他による[手書き住所認識の後処理法」
(情報処理学会筒38口金国大会IK−1,pp、64
9.1989)。
宮尾他による[OCRによる住所データ読取について」
(情報処理学会全国大会4E−5,pp、 1841.
1987)等の記載を参考にすることができる。
〔発明が解決しようとする課題〕
上述の如く、従来技術では、住所の検索において文字列
の完全一致を前提としているため、認識結果の中に正し
い認識文字が存在しない場合は、精度良く正しい住所を
得ることができなかっただけでなく、住所の記述に省略
がある場合に、省略住所を補完することができなかった
。更に、従来技術では、解析の過程で得られる情報を基
に、認識処理方式を変化させて再度認識処理を行うこと
をしておらず、また、認識処理パラメータの変化に対応
して、認識結果に適した絞り込み方法で絞り込みをしな
いため、この点からも精度良<ga結果を得ることがで
きなかった。
更に、検索技術についても、認識結果文字列を最小単位
毎に精度良く区切る手法を採用していないため、検索す
る認識結果の組み合わせの個数が多くなって、対象とす
るデータが大量になった場台、処理時間が長くかかると
いう間層があった。
本発明は上記事情に鑑みてなされたもので、その目的と
するところは、従来の技術における上述の如き問題を解
消し、住所の認識結果の中に正しい認識文字が存在しな
い場合や、住所の記述が一部省略された場合でも、短い
処理時間で正しい住所に修正し、かつ、省略された住所
を正しく補完することが可能な文字gst+結果修正方
式を提供することにある。
[課題を解決するための手段] 本発明の上記目的は、文字認識装置から出力された住所
文字列の認識結果を、予め蓄えられている住所文字列と
比較して、必要により修正を加える文字認識結果修正装
置において、郵便番号と該郵便番号に対応する住所文字
列の情報を有する住所辞書と、住所の区切り文字の順序
構造および該区切り文字間の文字数1文字種類、住所文
字列の省略可能性を記憶した住所構造辞書とを備え、前
記認識結果の候補文字群から認識文字として確からしい
文字を選択する候補絞り込みステップと、認識結果と該
認識結果に含まれる郵便番号に基づいて前記住所辞書を
用いて住所を決定する郵便番号利用ステップと、認識結
果から前記住所構造辞書を用いて住所構造を決定するス
テップとを有することを特徴とする文字認識結果修正方
式によって達成される。
〔作用〕
本発明に係る文字認識結果修正方式では、郵便番号が利
用できる場合には、認識結果と、郵便番号から住所辞書
を検索して得た住所文字列との類似度を求めることによ
り、郵便番号から検索して得た住所文字列が採用できる
か否かを決定するので、認識結果に正しい認識文字が含
まれていない場合でも、住所を決定できる。この処理は
、住所の一部分が省略されているときも有効であるよう
に考慮されているので、住所の記述に省略がある場合で
も、住所を決定できる。この場合には、住所構造を解析
して住所辞書を検索する必要がないので、処理時間を短
縮できるという利点もある。
また、郵便番号から検索して得た住所文字列が採用でき
ないと判断した場合には、郵便番号に誤りがあることを
指摘できる効果もある。
また、郵便番号が利用できない場合の住所辞書検索技術
については、住所の構造を基に、認識結果文字列を最小
単位毎に精度良く区切る手法を採用しているため、検索
する認識結果の組み合わせの個数が少なくなり、短い処
理時間で処理が可能になる。更に、認識結果と住所辞書
の文字列が完全に一致しない場合でも、類似した文字列
であると判断した場合には、住所辞書の文字列を採用す
るので、認識結果に正しい認識文字が含まれていない場
合であっても、住所の候補を決定することができ、また
、住所の一部が省略されている場合にも、省略された文
字列を補うことができるという効果もある。
なお、認識結果の文字群から確からしい文字を選択する
ステップを、文字認識パラメータに依存して異なる傾向
を示す認識結果に対しても、各文字認識パラメータに対
応して確がらしい文字を選択するようにした場合には、
文字認識パラメータを変更して認識を再実行することも
含めて、候補文字を絞り込む場合に正解文字を落とす可
能性が低くなり、高い処理精度が得られるという効果が
あるものである。
〔実施例J 以下、本発明の実施例を図面に基づいて詳細に説明する
第1図は、本発明の一実施例である住所文字認識結果修
正・補完処理の概要を示す動作フロー図である。本実施
例の住所文字認識結果修正・補完処理は、図示されてい
ない文字認識装置から入力された住所の文字認識結果を
、内部処理可能なデータ形式に変換する入力処理1.変
換された認識結果を保持するl!!識結果保持2.Bj
l結果の中から確からしい文字を選択する認識候補絞り
込み処理3.郵便番号と住所文字列が格納されている住
所辞書6を参照し、郵便番号を基に認識結果の地名部の
住所表記を決定する郵便番号利用処理4゜認識結果の住
所構造を決定するのに必要なデータ(第2図参照)が格
納されている住所構造辞書5を参照し、認識結果の住所
構造を決定する住所構造決定処理7.住所辞書6を参照
して、認識結果の候補文字群から正しい組み合わせを選
び、正しい認識文字がない場合には正しい住所に修正し
、記述に省略があった場合には省略された住所を補って
正しい住所を決定する住所決定・補完処理8゜認識結果
の解析状況に基づき、異なるパラメータで認識処理を再
実行するか否かを判断する再依頼判定処理9.解析結果
の優先順位を決定する候補順位決定処理10.決定した
住所を図示されていない出力装置に出力可能なデータ形
式に変換する出力処理11で構成されている。なお、上
記各処理のうち、認識候補絞り込み処理3.郵便番号利
用処理4.住所構造決定処理7.住所決定・補完処理8
、再依頼判定処理9および候補順位決定処理IOについ
ては、第5図〜第1O図に、その詳細を示すフローチャ
ートを示した。
第2図は、住所構造辞書5の内容を示す図である。住所
構造辞書5には、地名部の情報として、住所の区切りを
示す「県」、「市」、「町」等の区切り文字り出現順序
、住所文字列の省略可能性9区切り文字間の文字数およ
び文字種類が、リスト形式で格納され、番地部の情報と
して、住所の区切りを示す「T目ノ、[番地J、[号J
等の区切り文字の出現順序およびrx−y−zJ(ただ
し、x、y、zは自然数)のように頻繁に使用される番
地表記の構造に関するデータが格納されている。なお、
ここでは、上述の住所文字列の省略可能性については、
区切り文字が省略可能な場合を「?」で表わし、区切り
文字間の文字数については、文字数がX文字以上y文字
以下であることを、各区切り文字リストの第2要素をX
、第3要素をyとして表わしている。
また、文字種類については、H,に、J、N、Sおよび
Aで表わしており、これらは、それぞれ、ひらがな、カ
タカナ、漢字、数字、任意の文字種類およびアルファベ
ットを表わしている。
次に、本装置による住所文字列の修正・補完処理を、第
1図および第5図〜第1O図に基づいて、説明する。
図示されていない文字認識装置から入力された住所の認
識結果は、入力処理1において内部処理可能なデータ形
式に変換された後、認識結果データ保持部に蓄積される
。w!、#l結果には、認識文字1文字に対して、複数
の候補文字と[距離値Jと呼ばれる認識文字の確からし
さを表わす数値が含まれ、更に、郵便番号と住所のふり
がなの認識結果が含まれる場合もある。
認識候補絞り込み処理3では、第5図に示すような手順
により、文字認識処理パラメータに依存し、異なる傾向
を持つ認識結果に対して、適切な絞り込み方式を適用す
ることにより、確からしい文字候補を選択する。ここで
用いられる絞り込み方式としては、一定の認ぶ候補数ま
たは一定の距離値で絞り込む方式、距離値の項差または
積比を求めて、規定値を閾値として絞り込む方式等があ
り、それぞれの文字認識パラメータに対して、どの絞り
込み方式が適切であるかは、予め認識結果を評価して定
めておくものとする。
また、認識結果に郵便番号が含まれている場合には、郵
便番号利用処理4で、第6図に示すような手順により、
郵便番号を基に住所辞書6を検索して住所文字列を得、
これを認識結果と比較して住所を決定する。この状況を
、第3図を用いて説明する。
まず、検索した住所文字列と認識結果の候補文字群とを
比較し、一致した各文字の候補順位の合計を求める。こ
のとき、一致する文字がなければ適当な最高点(ここで
は、5点)を与える。次に、求めた合計値を文字数で割
って平均値を求め、平均値が規定値以下の場合は、郵便
番号を基に検索した住所文字列が正しいと判断する。た
だし、認識結果の住所文字列は、一部がもともと省略さ
れて記入されていることがあるので、文字列を比較する
場合には、住所区切り文字単位に住所をシフトさせなが
ら比較する。平均値が規定値以上の場合には、郵便番号
の認識結果に誤りがあると判断し、郵便番号を基に検索
した文字列は使用しないことにする。
一方、認識結果に郵便番号が含まれていない場合には、
住所構造決定処理7で、第7図に示すような手順により
、住所構造辞書5を参照して、認識結果の住所構造を決
定する。この状況を、第4図を用いて説明する。
まず、住所区切り文字を認識結果中から探し出す。次に
、この中から区切り文字の順序と、区切り文字間の文字
数および文字種類が住所構造辞書5に定義されている内
容と一致する組み合わせを選択する。以下の処理では、
一致したすべての区切り文字の組み合わせを住所構造の
対象とする。
住所決定・補完処理8では、第8図に示すような手順に
より、区切り文字間の認識結果文字を組み合わせ、住所
辞書6の区切り文字に該当するデータブロック中に組み
合わせた文字列が存在するか否かを調べる。存在すれば
、正しい住所の候補とするが、存在するものがない場合
は、組み合わせた文字列と辞書内の文字列とを比較し、
長さが等しく、かつ、全文字数に対して予め定めておい
た割合以上の文字コードか一致している住所辞書6内の
文字列を選び出して、正しい住所の候補とする。例えば
、「港区赤坂・・・・」のように先頭の住所が省略され
ている場合は、先頭に「東京都Jを補い、「東京都赤坂
・・・・」のように途中が省略されている場合は、途中
に「港区」を補い、正式な住所とする。
再依頼判定処理9では、第9図に示すような手順により
、住所決定・補完処理8の処理結果を調べ、異なる認識
処理パラメータで再認識する必要があると判断した場合
には、文字認識処理装置に対して処理パラメータを指定
して対認識を依頼する。例えば、番地部の構造解析結果
がX、 y、zを自然数としてrx−y−z」の構造で
、かつ、X、y。
Zに対応する文字の認識結果の候補文字群に数字がなか
った場合には、この部分を数字モードで対認識するよう
、文字認識処理装置に依頼を行う。
候補順位決定処理10では、第1O図に示すような手順
により、上述の処理により得られた住所の候補それぞれ
について、郵便番号利用処理4の処理と同様に、候補順
位の平均値を求め、更に、認識結果に含まれるふりがな
と住所辞書6から得たふりがなの類似度を、両者に共通
な部分文字列の長さを求めることにより比較し、候補の
確からしい順序を決定する。
最後に出力処理処理IIにより、住所文字認識結果の修
正・補完した文字列を外部出力装置に出力する。
上記実施例によれば、文字認識パラメータに依存して異
なる傾向を持つ認識結果に対しても、文字認識パラメー
タに対応して候補文字群から確からしい文字を選択する
ので、候補文字を絞り込む場合に正解文字を落とす可能
性が低くなり、高い処理精度が得られるという効果があ
る。また、郵便番号が利用できる場合には、認識結果と
、郵便番号から住所辞書を検索して得た住所文字列との
類似度を求めることにより、郵便番号から検索して得た
住所文字列が採用できるか否かを決定するので、認識結
果に正しい認識文字が含まれていない場合でも、住所を
決定できる。この処理は、住所の一部分が省略されてい
るときも有効であるように考慮されているので、住所の
記述に省略がある場合でも、住所を決定できる。なお、
この場合には、住所構造を解析して住所辞書を検索する
必要がないので、処理時間を短縮できるという利点もあ
る。また、郵便番号から検索して得た住所文字列が採用
できないと判断した場合には、郵便番号に誤りがあるこ
とを指摘できる効果もある。
また、郵便番号が利用できない場合の住所辞書検索技術
については、住所の構造を基に、g!!!識結果文字列
を最小単位毎に精度良く区切る手法を採用しているため
、検索する認識結果の組み合わせの個数が少なくなり、
短い処理時間で処理が可能になる。更に、認識結果と住
所辞書の文字列が完全に一致しない場合でも、類似した
文字列であると判断した場合には、住所辞書の文字列を
採用するので、認識結果に正しい認識文字が含まれてい
ない場合であっても、住所の候補を決定することができ
、また、住所の一部が省略されている場合にも、省略さ
れた文字列を補うことができるという効果もある。
なお、上記実施例は、本発明の一実施態様を示すもので
あり、本発明は他にも種々の実施態様が可能であること
は言うまでもない。
〔発明の効果〕
以上、詳細に説明した如く、本発明によれば、文字認識
結果修正方式として、文字認ra装置から出力された住
所文字列の認識結果を、予め蓄えられている住所文字列
と比較して、必要により修正を加える文字認識結果修正
装置において、郵便番号と該郵便番号に対応する住所文
字列の情報を有する住所辞書と、住所の区切り文字の順
序構造および該区切り文字間の文字数9文字種類、住所
文字列の省略可能性を記憶した住所構造辞書とを備え、
前記認識結果の候補文字群から認識文字として確からし
い文字を選択する候補絞り込みステップと、認識結果と
該認識結果に含まれる郵便番号に基づいて前記住所辞書
を用いて住所を決定する郵便番号利用ステップと、認識
結果から前記住所構造辞書を用いて住所構造を決定する
ステップとを有する如く構成したことにより、住所の認
識結果の中に正しい認識文字が存在しない場合や、住所
の記述が一部省略された場合でも、短い処理時間で正し
い住所に修正し、かつ、省略された住所を正しく補完す
ることが可能な文字認識結果修正方式を実現できるとい
う顕著な効果を奏するものである。
【図面の簡単な説明】
第1図は本発明の一実施例である住所文字認識結果修正
・補完処理の概要を示す動作フローチャート、第2図は
住所構造辞書の内容の一例を示す図、第3図は郵便番号
を利用した住所決定の一例を示す図、第4図は住所構造
を決定する一例を示す図、第5図〜第】0図は第1図の
各ステップの詳細を示すフローチャートである。 1:入力処理、2:認識結果保持処理、3:認識候補絞
り込み処理、4:郵便番号利用処理、5:住所構造辞書
、6:住所辞書、7:住所構造決定処理、8:住所決定
・補完処理、9:再依頼判定処理、lO:候補順位決定
処理、11:出力処理、51.52,61〜66.71
〜76.81〜89,89 a 、89 b 、91,
92 :第 ■ 図 第 図 al 第1候補 第2候補 第3候補 bl 認識結果 犬坂府市導帝町・・・・・・・・ 夫隈偽帝道市・・・・・・・・・ 大系 希・・・・・・・・・・・ ■住所構造辞書部に適合する住所区切り文字の組み合わ
せを選ぶ(1)        府   町 (2)        府  市 (3)         市  町 第 3 図 認識結果の文字列(絞り込まれた結果)■郵便番号を基
き住所辞書から住所を検索■認識結果の候補文字部と比
較 候補順位の合計値:5+5+5+5+5+候補順位の平
均値:35/7文字−5〉α平均値が規定値より大きい
ため採用し ■「東京都」を省略して比較 候補順位の合計値: 1+3+1+2−7候補順位の平
均値 7/4文字−1,75平均値が規定値より小さい
ため採用ま ただし、一致した文字がない場合の候補順位を採用を決
定するための規定値αを2とする候補順位 認識結果 第4候補 ヌ 東京都港区赤坂 5+5−35 、ない 港区赤坂 〈α −る ・5とし、 郵便番号から得た住所の 第 5 図 第 図 第 8 図(その1) 第 図 第 図

Claims (1)

  1. 【特許請求の範囲】 (1)文字認識装置から出力された住所文字列の認識結
    果を、予め蓄えられている住所文字列と比較して、必要
    により修正を加える文字認識結果修正装置において、郵
    便番号と該郵便番号に対応する住所文字列の情報を有す
    る住所辞書と、住所の区切り文字の順序構造および該区
    切り文字間の文字数、文字種類、住所文字列の省略可能
    性を記憶した住所構造辞書とを備え、前記認識結果の候
    補文字群から認識文字として確からしい文字を選択する
    候補絞り込みステップと、認識結果と該認識結果に含ま
    れる郵便番号に基づいて前記住所辞書を用いて住所を決
    定する郵便番号利用ステップと、認識結果から前記住所
    構造辞書を用いて住所構造を決定するステップとを有す
    ることを特徴とする文字認識結果修正方式。(2)前記
    各ステップに加えて、前記住所辞書を参照して認識結果
    の候補文字群の組み合わせの中から正しい住所を選択し
    、また、正しい認識文字列がない場合に類似文字列を前
    記住所辞書から検索することにより正しい住所に修正し
    、かつ、部分的に省略された住所を補う住所決定・補完
    ステップを有することを特徴とする請求項1記載の文字
    認識結果修正方式。 (3)前記各ステップに加えて、前記住所決定・補完ス
    テップでの解析結果に基づいて、文字認識処理部に対し
    、異なる文字認識パラメータを指定して再度文字認識処
    理依頼するステップを有することを特徴とする請求項1
    または2記載の文字認識結果修正方式。 (4)前記各ステップに加えて、認識結果に含まれる住
    所のふり仮名を利用して、解析の結果得られた複数の住
    所の確からしさの順位を決定するステップを有すること
    を特徴とする請求項1〜3のいずれかに記載の文字認識
    結果修正方式。 (5)前記候補絞り込みステップは、文字認識パラメー
    タに依存して異なる傾向を示す認識結果に対しても、各
    文字認識パラメータに対応して確からしい文字を選択す
    るステップであることを特徴とする請求項1〜4のいず
    れかに記載の文字認識結果修正方式。
JP2057071A 1990-03-08 1990-03-08 文字認識結果修正方式 Pending JPH03257693A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2057071A JPH03257693A (ja) 1990-03-08 1990-03-08 文字認識結果修正方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2057071A JPH03257693A (ja) 1990-03-08 1990-03-08 文字認識結果修正方式

Publications (1)

Publication Number Publication Date
JPH03257693A true JPH03257693A (ja) 1991-11-18

Family

ID=13045221

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2057071A Pending JPH03257693A (ja) 1990-03-08 1990-03-08 文字認識結果修正方式

Country Status (1)

Country Link
JP (1) JPH03257693A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11120293A (ja) * 1997-10-16 1999-04-30 Fujitsu Ltd 文字認識/修正方式
JP2007042097A (ja) * 2005-07-29 2007-02-15 Fujitsu Ltd キー文字抽出プログラム、キー文字抽出装置、キー文字抽出方法、一括地名認識プログラム、一括地名認識装置および一括地名認識方法
JP2011018109A (ja) * 2009-07-07 2011-01-27 Toshiba Corp 認識文字列補正装置および認識文字列補正用プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11120293A (ja) * 1997-10-16 1999-04-30 Fujitsu Ltd 文字認識/修正方式
JP2007042097A (ja) * 2005-07-29 2007-02-15 Fujitsu Ltd キー文字抽出プログラム、キー文字抽出装置、キー文字抽出方法、一括地名認識プログラム、一括地名認識装置および一括地名認識方法
JP2011018109A (ja) * 2009-07-07 2011-01-27 Toshiba Corp 認識文字列補正装置および認識文字列補正用プログラム

Similar Documents

Publication Publication Date Title
US20190385001A1 (en) Data extraction using neural networks
US5754847A (en) Word/number and number/word mapping
US8140533B1 (en) Harvesting relational tables from lists on the web
US5553284A (en) Method for indexing and searching handwritten documents in a database
CN112800769B (zh) 命名实体识别方法、装置、计算机设备和存储介质
CN113656547B (zh) 文本匹配方法、装置、设备及存储介质
CN113590784A (zh) 三元组信息抽取方法、装置、电子设备、及存储介质
CN111459977A (zh) 自然语言查询的转换
CN111767738A (zh) 一种标签校验方法、装置、设备和存储介质
CN115688779A (zh) 一种基于自监督深度学习的地址识别方法
CN116561389A (zh) 一种文本匹配方法、装置、设备及存储介质
US20030126138A1 (en) Computer-implemented column mapping system and method
US5551026A (en) Stored mapping data with information for skipping branches while keeping count of suffix endings
JPH03257693A (ja) 文字認識結果修正方式
CN109992716B (zh) 一种基于itq算法的印尼语相似新闻推荐方法
CN113836950A (zh) 商品标题文本翻译方法及其装置、设备与介质
CN112579774A (zh) 模型训练方法、模型训练装置及终端设备
Daciuk et al. Natural Language Dictionaries Implemented as Finite Automata.
CN115186667B (zh) 基于人工智能的命名实体识别方法及装置
US20230297777A1 (en) Personalized natural language processing system
CN114528841A (zh) 实体识别方法、装置、电子设备及存储介质
JP3722231B2 (ja) コンパクトにエンコードされて記憶されたストリングの組を有する製品
JP2918380B2 (ja) 文字認識結果の後処理方法
JPH06274701A (ja) 単語照合装置
JPH04111186A (ja) 住所文字列に対する文字認識結果修正方法