JPH02165287A - 文字列入力方式 - Google Patents

文字列入力方式

Info

Publication number
JPH02165287A
JPH02165287A JP63319953A JP31995388A JPH02165287A JP H02165287 A JPH02165287 A JP H02165287A JP 63319953 A JP63319953 A JP 63319953A JP 31995388 A JP31995388 A JP 31995388A JP H02165287 A JPH02165287 A JP H02165287A
Authority
JP
Japan
Prior art keywords
character
probability
candidates
candidate
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63319953A
Other languages
English (en)
Inventor
Akimichi Tanaka
明通 田中
Osamu Nakamura
修 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP63319953A priority Critical patent/JPH02165287A/ja
Publication of JPH02165287A publication Critical patent/JPH02165287A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字枠なしでべたに書かれた手書き文字列を
入力とし、これを文字コード列に変換する文字列入力を
、文字列パターンの形状情報に加え、lllI語レベル
又は文レベルの用語の知識を用いて高精度に行う文字列
入力り式に関する。
(従来の技術) 近年、マンマシンインタフェースの1つとして、手書き
文字列入力の研究が盛んである。■古き文字列入力には
、文字枠中に手書き文字を記入する方法と、文字枠なし
でべたに書く方法とに大別できる。
一般に、文字枠なしでべたに書かれた手書き文字列の入
力処理は、1文字領域の切り出し、1文字認識、用語辞
書との照合と進んでいく。この際、各段階の処理にはあ
いまい刊があるため、各段階ごとに複数の候補が出力さ
れ、この中から全体として最もふされしいものを選ぶ必
要がある。
そのための方法として、各段階で得られた候補に得点を
付け、この17点に適当な小み付けを行って合計得点を
締出し、これによって処理全体を通してのふされしさを
判定することが提案されている(仲林他、「用語あいま
い検索を用いた手書き文字列入力方式」、昭和62年度
人工知能学会全国大会予稿集、pl)、 435−/1
38)。
第6図は、上記提案されている手書き文字列人力方式を
説明するための図である。図示するように、手書き文字
列入力方式は、1文字領域の切り出し、1文字認識、及
び用語辞書との照合(用語照合)の各段階を含む。図中
、口で囲まれた文字は1文字領域として切り出された文
字を示す。また〔 〕中の数字は各段階で得られる候補
の得点をホす。図示する例では、]゛知知識いう丁書き
入力文字に対し、1文字g7域切り出し処理により(1
)〜(3)の3つの候補が1q点と共に得られている。
これらの3つの候補〈1)〜(3)の各々に対して、1
文字認識処理を行う。例えば、「矢」という1文字領域
中の文字に対して、「矢」や1失」の候補がこれらの得
点とともに得られる。
このようにして得られる1文字認識の候補に対し、用語
照合を行う。例えば、1゛知」と1識」を結合した[知
識1と用語辞書との照合を行い、得点を1qる。
このような処理において、例えば1文字領域切り出しで
の得点をal、1文字認識での97点をa2.用語知識
との照合による得点を83とし、合削得点を、各19点
を重み付き加算して。
J =W1  ・al +W2  ・a2 +W3  
’ a3  (1)で求めるとする。いま、各段階の7
点が第6図に小すように与えられたとき、重みを W+ =1.Wz =1.W3 =1       ■
とすると、候補(2>、(3)、(6)、(8)。
(10)と選び[知識1と認識するのが30点で最高得
点となり、1文字認識の得点の高さによって未知語が選
ばれてしまう。これに対処するため、W3のみの重みを
変更して、 VV+ = 1 、 W2= 1 、 W3工2   
   ■とすると、候補(2)、(3)、(7)、(8
)。
(9)と選び[知識1と認識するのが32で最高得点と
なる。このように、1文字認識では(7点の低い[識1
が、用語照合重みを人にすることにより、1職」に代っ
て選ばれる。
〔発明が解決しようとする課題〕
しかしながら、上記従来の文字列人力方式にあっては、
重み付けの方法に明確な基準がなく、経験に頼るしかな
いので、文字切り出しの信頼性が低いという問題点があ
る。
また、各段階での候補及び得点の決定は各段階で独立し
て行うので、共通の尺度となるべきものがなく、よって
文字切り出しの精度を向上させるには限界がある。換言
すれば、他の段階で得られる結果がもつあいまい性を何
ら考慮していない。
更に、最終結果は式(1)により決定するため、用語照
合により1文字認識の得点が低い文字を正解とする一方
、1文字認識の得点が高いものは未知の用語であっても
認める、という2つの処理を統合した判定には適さない
という問題点がある。
従って、本発明は上記問題点を解決し、各段階が独立し
て(単独で)出力するあいまい性のある結果と、他の段
階の出力から決定されるあいまい性のある結果を統合し
て、1文字領域切り出し、1文字認識及び用語照合に関
する知識を相互にすべて活用することにより、全体とし
て最もふされしい結果を得るようにして、文字切り出し
の信頼性を高めることを目的とする。
〔課題を解決するための手段〕
第1図は、本発明の原理ブロック図である。
同図において、文字切り出し1段1は、文字枠なしでべ
たに書かれた手書き文字列入力から、1文字領域の候補
を確率を付与して出力する。
1文字認識手段2は、文字切り出し手段1から出力され
た1文字領域の候補に対して認識を行い、文字コードの
候補を確率を付与して出力する。
用語照合手段3は、1文字認識f段2の出力結果から用
語候補を確率を付与して出力する。
第1の確率統合手段4は、文字切り出し手段1が出力し
た1文字領域候補の確率と1文字認識手段2の出力結果
を根拠として(qられる1文字領域候補の確率とを統合
して総合的な1文字領域候補の確率を19る。
第2の確率統合手段5は、1文字認識手段2が出力した
文字コード候補の確率と用語照合手段3の出力結果を根
拠として得られる文字コード候補の確率とを統合して総
合的な文字コード候補の確率を得る。
出力判定手段6は、第1の確率統合手段4と第2の確率
統合手段5との出力に基づき、最終結果となる文字列コ
ード列を出力する。
そして、第1の確率統合手段4及び第2の確率統合手段
5の出力をそれぞれ文字切り出し手段1及び1文字認識
手段2にフィードバックし、確率の統合を定常状態に達
するまで繰り返し行う。
〔作用〕
手書き入力文字列は文字切り出し手段1で切り出される
。このとき、切り出された1文字領域の候補ごとに正し
さを表わす確率を付与する。切り出された1文字領域の
候補は、1文字認識1段2で文字認識され、文字コード
の候補が得られる。
このとき、文字コードの候補には、正しさを表わす確率
が付与される。文字コードの候補は用語照合手段3に与
えられ、用語候補が得られる。このとき、得られた用語
候補ごとに、正しさを表わす確率が付与される。
文字切り出し手段1で得られた1文字領域候補のV&率
と、1文字認識手段2の出力結果を根拠にして得られる
1文字領域候補の確率は、第1の確率統合手段4で統合
され、総合的な1文字領域候補の確率を得る。また、1
文字認識手段2で得られた文字コード候補の確率と、用
語照合手段3の出力結果を根随にして得られる文字コー
ド候補の確率は、第2の確率統合手段5で統合され、総
合的な文字コード候補の確率を得る。
上記各統合処理は、文字領域候補及び文字コード候補の
確率が定常状態に達するまで、繰り返し行われる。すな
わち、第1の確率統合手段4で得られた文字領域候補の
確率は、文字切り出し手段1にフィードバックされ、新
たなく更新された)確率として1文字認識手段2及び第
1の確率統合手段4に与えられる。同様に、第2の確率
統合手段5で得られた文字]−ド候補の確率は、1文字
認識手段2にフィードバックされ、新たな確率として用
語照合手段3及び第2の確率統合手段5に与えられる。
以上のようにして、第1の確率統合手段4及び第2の確
率統合1段5でそれぞれ得られた出力、すなわち定常状
態の確率値をもとに、出力判定手段6は最終結果となる
文字コード列を出力する。
このように、処理の各段1it!i(1文字領域切り出
し、1文字認識、用語照合)で得られる複数候補に、正
しさを表わす確率を付与することで、異なる処理段階の
結果を共通の尺度で比較することが可能になる。
また、候補の確率は各処理段階単独で求める他に、他の
処理段階の結果を使って求められるものも考慮している
。すなわち、1文字認識によって得られる文字コード候
補の確率は、1文字認識単独で決まる確率の他に用語照
合の結果から(qられる確率も統合して決定する。既存
技術では段階間の関連は考慮されていないため、後者の
確率は考慮されていない。
更に、上述したように、同一候補に対して異なる根拠か
ら複数の確率が与えられ、これらを統合することになる
が、相互に依存する−例えば、用語候補の確率は1文字
認識の結果を使って決定されるが、1文字認識の結果を
定めるためには用語候補の確率が必要−場合があるため
、統合部iを反復して定常点を求めている。
〔実施例〕
以下、本発明の一実施例を図面を参照して説明する。
第2図は、本発明の一実施例のブロック図である。図示
するように、本実施例は文字切り出し部11.1文字認
識部12.用語照合部13.第1の確率統合部14.第
2の確率統合部15.及び出力判定部16を具備してい
る。第1の確率統合部14は、文字切り出し確率算出部
14a及び確率統合計算部14bを具備している。第2
の確率統合部15は、1文字認識確率鋒出部15a及び
確率統合計算部15bを具備している。
文字切り出し部11は、文字枠なしでべたに書かれた手
古き文字列から1文字領域を切り出し、それが正しい確
率を付与している。手書き文字列は、例えばダブレット
に筆記されたストロークのX、Y座標に相当する。
第3図は、文字切り出し部11の入出力関係を示す図で
ある。同図において、「知識」という手書き文字列に対
して(1)〜(4)で示す1文字領域の候補101が、
それが正しい確率(()中の数字)とともに得られてい
る。この確率は、例えばDelρ5ter−3hare
rの確率理論を用いて求めることができる(シェー77
:“討拠の数学理論″′、プリンストン・ユニバージテ
ィー・プレス。
+976; 3hafer : A  Mathema
tical Theory ofEvidence 、
 Pr1nceton  Univ 、 Press、
197(i)。
尚、確率の算出方法については、後述する。また、図中
の[不明、1とは切り出し法が不明である確率を意味し
ている。
1文字認識部12は、文字切り出し部11で10られた
1文字領域101に対して認識を行い、文字コードの候
補102を確率を付与して出力する。第4図は、1文字
認識部12の入出力関係を示す図である。図示するよう
に、文字切り出し部11で得られた6つの1文字順1j
li候補に対する認識により、(51−(10)の文字
]−ドの候補が得られる。尚、便宜上、図では文字」−
ドそのものではなく、認識した文字を示している。
用語照合部13は、1文′?′認識部12で得られた1
文字認識結果から用語の知識(予め用語を辞占中に格納
しである)を用いて、用語の候補103とそれが正しい
確率を求める。
第5図は、用語照合部13の人出力関係を示す図である
。図示するように、1文字認識部12で得られた6つの
1文字領域候補102に対し、「知識」という用語はあ
るが、1矢口識」、1知載」。
「矢口言」という用語はないため、[知識1という用語
のみ確率を付与して出力している。
第1の確率統合部14の文字切り出し確率紳出部14a
は1文字認識部12で(!7られた文字コードの候補1
02の確率を根拠に、1文字領域候補の確率を算出する
。例えば、第3図の1文字領域候補(3)に対する1文
字認識結果は、第4図の文字コードの候補(8)と(9
)であり、第3図の候補(4)に対する1文字認識結果
は第4図の候補(10)である。この場合、候補(1o
)の方が候補(8)及び(9)よりも確率が高いので、
1文字領域候補(4)の方が候補(3)よりも高いこと
がわかる。文字切り出し確率算出部14aは上記の処理
を、前述したD eIlpster−8harerの確
率理論に従い行う。
確率統合計算部14bは、文字切り出し部11が付与し
た1文字領域候補の確率と、文字切り出し確率算出部1
4aが棹出した1文字領域候補の確率とを統合する。
ここで、確率の統合は、o eipstcrの統合部(
上記文献参照)に基づいて行う。今、ここで確率変数の
とりうる値がX+、Xz、X3であり、これらの確率が
それぞれD+ 、 D2 、 l)3 、またどの値を
とるか不明である確率を特徴とする特許の時、pI 、
 D2 、 px 、 E)  は確率であるから、Σ
 p・ +p−1 i=1 をみたす。また別の根拠から同様の確率p′1゜O’ 
210’ 31 D’ 、が得られたとすると、統合確
率p−(i=1.2.3)を[) empsterの統
ξ 会則により ■ により4埠する。以上は確率変数のとりつる値が3つ、
根拠が2つの場合を示したが、全く同様の方法で確率変
数のとりうる値の数、Pf1拠の数を増やすことは容易
である。
第2の確率統合部1501文字認識確率算出部15aは
、用語照合部13で得られた用−nの候補103の確率
を根拠に、文字コード候補の確率を算出する。例えば、
第3図の候補(1)、(2)は、[知1が文字切り出し
部11により2通りに切り出されたことを示す。同様に
1文字認識単独では誤りである(1)の確率が高くなる
ことら考えられる。この場合、(1)は誤りであっても
それぞれの領域を[矢1、「口Jと読むことができ、1
文字認識部12は第4図(5)、(6)、(7)に示す
ように「矢1と「口」、[知1をほぼ同様の確率で出力
し、ここまででは誤りを発見できない。しかし用語照合
部13では[矢口識1という用語はないが1知識」とい
う用語はあるという出力を出すため、これを根拠とする
と「矢1と[口、Iの確率は低り1゛知]は高いという
確率が得られる。
1文字認識確率筒用部15aには、上記の処理を前述し
たD euster−8harerの確率理論に従い行
う。
以上のとおり、第1の確率統合部14が文字切り出し部
11と1文字認識部12の結果を統合して新たな文字切
り出しの確率を計算し、第2の確率統合部15が1文字
認識部12と用語照合部13の結果を統合して新たな1
文字認識の確率を計nする。この計篩過稈は第2図に示
すようにお互いに干渉のあるループ状となっているため
、適当な初期値から始めて上式に基づいた統泪合計を繰
り返し、定常状態に達した時の値を解とする。
出力判定部16は、繰り返し法により確率の統合を行う
ため、収束判定を行い、最も確率の高いものを結果とし
て出力する。
次に、本実施例の動作を説明する。「知識」という手出
ぎ文字列が文字切り出し部11に入力された場合、文字
切り出し部11は第3図に示す1文字領域候補(1)〜
(4)をその確率とともに出力する。この1文字領域候
補(1)〜(4)は1文字認識部12に与えられ、第4
図に示す文字コード候補(5)〜(10)が確率ととも
に出力される。この文字」−ド候補(5)・〜(10)
は用語照合部13に送られ、第5図に示す用語の候補(
11)が確率とともに出力される。
文字切り出し部11の出力101は確率統合3t Ff
部14bに送られ、1文字認識部12の出力102は文
字切り出し確率算出部14alC送られる。そして、前
述したようにして、確率統合SI算部14bは、1文字
領域候補の統合した確率を算出する。
同様にして、確率統合51吟部15bは文字コード候補
の統合した確率を算出する。
ここで、文字切りし部11は1aJを候補(3)及び(
4)の2通りに切り出す。文字切り出し部11の単独処
理では誤りである候補(3)の確率が高くなることが考
えられる。しかし、各1文字領域候補に対して1文字認
識部12が、ぶ識を行うと、候補(3)の場合は文字と
して正しくない切り出し法を含むため、第4図の候補(
9)のように確率の非常に低い認識結果が生ヂる。そこ
で、1文字認識結果を根拠とした文字切り出しの確率は
候補(3)より(4)の方が高くなり、第1の確率統合
手段14が先に得られた確率と統合した結果も、候補(
4)の方が高くなって正解が得られる。
また、前述したように、第3図の候補(1)。
(2)に対し、1文字認識部12の中和処理では[矢]
と「口」、「知」をほぼ同様の確率で出力してしまう。
しかし、用語照合により「矢口識という用語はないが「
知識」という用語はあるという結果を得る。従って、こ
れを根拠にすると、矢」と「口」の確率は低く、1知」
は高いという確率が得られる。そこで、第2の確率統合
部15が先に得られた確率と統合した結果も1−矢」と
1口」の確率より[知、1の方が高くなって正解が得ら
れる。
〔発明の効果〕
以上説明したように、本発明の文字列人力方式では、各
処理が甲種で出力するあいまい性のある結束と、他の処
理の出ツノ結果から決定されるあいまい性のある結果を
統合して全体として最もふされして結果を得ることがで
きる。そのため文字切り出し、1文字認識、用6Rに関
する知識をすべて活用した、信頼性の高い結果を得るこ
とができる。
【図面の簡単な説明】
第1図は本発明の原理ブロック図、 第2図は本発明の一実施例のブロック図、第3図は文字
切りし部11の人出力関係の一例を示す図、 第4図は1文字認識部12の人出力関係の・−例を示す
図、 第5図は用語照合部13の入出力関係の一例を示す図、
及び 第6図は従来の文字列人力方式を説明するための図であ
る。 1・・・文字切り出し手段、2・・・1文字認識手段、
3・・・用語照合手段、4・・・第1の確率統合手段、
5・・・第2の確率統合手段、6・・・出力判定1段、
11・・・文字切り出し部、12・・・1文字認識部、
13・・・用語照合部、14・・・第1の確率統合部、
14a・・・文字切り出し確率筒用部、14b・・・確
率統合部n部、15・・・第2の確率統合部、15a・
・・1文字認識確率算出部、15b・・・確率統合手段
部、16・・・出力判定部。 〔o3〕 (0,4) 文字切り出し部11の入出力量gの一例を示す図第3図 本発明の原理ブロック図 第1図 第4図 用語照合部13の入出力関係の一例を示す図第5図 欠口m
〔0〕 」 従来O文字々11人力方式をト明するためO凹第6図

Claims (1)

  1. 【特許請求の範囲】 文字枠なしでべたに書かれた手書き文字列から、1文字
    領域の候補を確率を付与して出力する文字切り出し手段
    と、 該文字切り出し手段から出力された1文字領域の候補に
    対して認識を行い、文字コードの候補を確率を付与して
    出力する1文字認識手段と、該1文字認識手段の出力結
    果から用語候補を確率を付与して出力する用語照合手段
    と、 前記文字切り出し手段が出力した1文字領域候補の確率
    と前記1文字認識手段の出力結果を根拠として得られる
    1文字領域候補の確率とを統合して総合的な1文字領域
    候補の出力を得る第1の確率統合手段と、 前記1文字認識手段が出力した文字コード候補の確率と
    前記用語照合手段の出力結果を根拠として得られる文字
    コード候補の確率とを統合して総合的な文字コード候補
    の確率を得る第2の確率統合手段と、 前記第1の確率統合手段と前記第2の確率統合手段との
    出力に基づき、最終結果となる文字列コード列を出力す
    る出力判定手段とを具備し、前記第1の確率統合手段及
    び前記第2の確率統合手段の出力をそれぞれ前記文字切
    り出し手段及び前記1文字認識手段にフィードバックし
    、確率の統合を定常状態に達するまで繰り返し行うこと
    を特徴とする文字列入力方式。
JP63319953A 1988-12-19 1988-12-19 文字列入力方式 Pending JPH02165287A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63319953A JPH02165287A (ja) 1988-12-19 1988-12-19 文字列入力方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63319953A JPH02165287A (ja) 1988-12-19 1988-12-19 文字列入力方式

Publications (1)

Publication Number Publication Date
JPH02165287A true JPH02165287A (ja) 1990-06-26

Family

ID=18116090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63319953A Pending JPH02165287A (ja) 1988-12-19 1988-12-19 文字列入力方式

Country Status (1)

Country Link
JP (1) JPH02165287A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728949A (ja) * 1992-11-13 1995-01-31 Internatl Business Mach Corp <Ibm> 筆跡認識装置及び方法
CN108875745A (zh) * 2018-08-09 2018-11-23 同程网络科技股份有限公司 组合验证码的分割识别方法及其系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728949A (ja) * 1992-11-13 1995-01-31 Internatl Business Mach Corp <Ibm> 筆跡認識装置及び方法
CN108875745A (zh) * 2018-08-09 2018-11-23 同程网络科技股份有限公司 组合验证码的分割识别方法及其系统
CN108875745B (zh) * 2018-08-09 2021-11-19 同程网络科技股份有限公司 组合验证码的分割识别方法及其系统

Similar Documents

Publication Publication Date Title
JP2795719B2 (ja) 認識距離の差に基づく最良優先探索処理方法
US6513005B1 (en) Method for correcting error characters in results of speech recognition and speech recognition system using the same
CN111984766B (zh) 缺失语义补全方法及装置
WO1995027954A1 (en) Pattern recognition method and system
JP3761937B2 (ja) パターン認識方法及び装置及びコンピュータ制御装置
Rahaman et al. A rule based system for bangla voice and text to bangla sign language interpretation
CN111694936A (zh) 用于ai智能面试的识别的方法、装置、计算机设备及存储介质
JPH02165287A (ja) 文字列入力方式
CN111292741B (zh) 智能语音交互机器人
JP2966002B2 (ja) 音声認識装置
JP3324910B2 (ja) 日本語解析装置
JPH049320B2 (ja)
JP3001334B2 (ja) 認識用言語処理装置
JP2660998B2 (ja) 日本語処理装置
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JPH0566597B2 (ja)
JPS61122781A (ja) 音声ワ−ドプロセツサ
JPH04115383A (ja) オンライン手書き文字認識装置の文字認識方式
JP2994992B2 (ja) 手書き文字オンライン認識装置とその字体登録・学習方法
JP2798747B2 (ja) 自然言語処理方式
JP2921838B2 (ja) 手書き文字認識方式
JP3143906B2 (ja) 未知語の存在の判定装置
JPH10301597A (ja) 音声認識装置
JPH06111077A (ja) 文書認識装置の評価装置
JPH05314319A (ja) パターン認識後処理方式