JP2847715B2 - 文字認識装置及び文字認識方法 - Google Patents

文字認識装置及び文字認識方法

Info

Publication number
JP2847715B2
JP2847715B2 JP63215572A JP21557288A JP2847715B2 JP 2847715 B2 JP2847715 B2 JP 2847715B2 JP 63215572 A JP63215572 A JP 63215572A JP 21557288 A JP21557288 A JP 21557288A JP 2847715 B2 JP2847715 B2 JP 2847715B2
Authority
JP
Japan
Prior art keywords
branch
scanning
character
dictionary
parallel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63215572A
Other languages
English (en)
Other versions
JPH0262683A (ja
Inventor
公義 吉田
秋夫 坂野
寛文 田守
公之 茶谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP63215572A priority Critical patent/JP2847715B2/ja
Priority to KR1019890011869A priority patent/KR0126675B1/ko
Priority to US07/398,086 priority patent/US5010579A/en
Priority to GB8919522A priority patent/GB2222476B/en
Priority to CN89106956A priority patent/CN1019157B/zh
Publication of JPH0262683A publication Critical patent/JPH0262683A/ja
Priority to HK121995A priority patent/HK121995A/xx
Application granted granted Critical
Publication of JP2847715B2 publication Critical patent/JP2847715B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 以下の順序で説明する。
A 産業上の利用分野 B 発明の概要 C 従来の技術 D 発明が解決しようとする課題 E 課題を解決するための手段(第1図) F 作用 G 実施例(第1図〜第11図) H 発明の効果 A 産業上の利用分野 この発明は文字認識装置における検定走査制御装置及
び文字認識方法に関する。
B 発明の概要 この発明は、文字認識を行う場合の検定走査におい
て、その認識辞書のデータを、いわばサブルーチン形式
とすることにより、認識辞書の小型化及び認識時間の短
縮を実現したものである。
C 従来の技術 一般に、手書き文字の認識は、次の2段階により処理
される。すなわち、 第1段階:タブレットなどから入力される手書き文字の
筆跡(点列)から各種の特徴を抽出する。
第2段階:第1段階で抽出した特徴と、認識辞書に記述
してある各文字の特徴とを比較検定し、十分に一致度の
高い文字を検出する。
このため、第2段階で使用する辞書の代表的な構造
は、例えば次のとおりである。すなわち、 のように、各文字の様々な書き方についてすべての特徴
を並記している。また、 I.共通部分をもつ複数種の文字のとき 「林」は、〔木偏の特徴〕,〔木の特徴〕である。
「松」は、〔木偏の特徴〕,〔公の特徴〕である。
II.複数の書き方がある部分を含む文字のとき などのように、辞書に記述してある特徴に共通部分があ
っても、各々の全体を並記している。
文献:「日経エレクトロニクス」1983年12月5日号11
5〜133ページ D 発明が解決しようとする課題 認識辞書が、上述のような構造なので、辞書に重複部
分が多くなり、辞書が大型化してしまう。また、比較検
討時、共通特徴部分を多重に比較走査するので、認識時
間が長くなってしまう。
この発明は、このような問題点を一掃しようとするも
のである。
E 課題を解決するための手段 このため、この発明においては、認識辞書の構造を、
例えば、引用、局所並列、木分岐、分岐並列の論理に対
応する特徴記述構造とするとともに、その論理構造が互
いに自由に再帰的に使用可能な構造とし、この記述にし
たがって認識検定を行うようにしたものである。
F 作用 辞書の走査が多重再帰的に行われ、辞書サイズが小さ
くなるとともに、認識時間が短縮される。
G 実施例 第1図において、(1)は走査制御中央ユニット、
(2)は走査状況保存記憶ユニット、(3)は認識辞書
を示す。
そして、ユニット(1)は、入力された筆跡から抽出
された特徴データを順次取り出すとともに、辞書(3)
から特徴を取り出して比較検定を行うものである。
このため、ユニット(1)は、辞書走査点指示器A1
検定保存域指示器A2、作業域A3及び局所並列スタックA4
を有する。
ここで、指示器A1は、辞書(3)の中から現在読み出
す点を指示するポインタ、例えばアドレスレジスタであ
り、これが指示する点から認識検定命令が取り出され
る。また、指示器A2は、比較検定中に、意味列的な分岐
が発生したとき、例えば、指示器A1が木分岐や分岐並列
を示したとき、ユニット(1)の状態などを保存する領
域を指示する。そして、分岐が発生するごとにユニット
(2)の中の1つの保存域を指示する。
さらに、作業域A3は、第2図に示すように、認識比較
検定を順次行うのに必要な抽出データ読み出し点指示器
A31と、途中までの検定結果(部分一致度など)A32と、
辞書(3)の走査続行スタックA33とを有する。この場
合、スタックA33は、再帰的引用を実現するために複数
個の走査続行点を保存するスタックA332と、このスタッ
クA332に現在保存されている走査続行点の個数(最後に
保存された走査続行点の位置)などのスタック状態を示
すA331とを有し、スタックA33は全体としてはFILOの動
作を行う。
また、スタックA4は、第3図に示すように、局所並列
の多重度を示すスタック状態指示器A411と、途中までの
並列枝の検定結果を保持する複数の結果保持器A412とか
ら構成される。
さらに、ユニット(2)は、W個(Wは辞書(3)の
意味列的な分岐の最大の段数以上の値)の保存域B1,B2,
‥‥Bwにより構成される。この場合、第i番目の保存域
Bi(i=1〜wのいずれか)は、認識辞書(3)の検定
走査中に、意味列的分岐が発生したとき、その時点にお
けるユニット(1)の状態と、意味列的な次の分岐枝の
先頭位置とを保存するための記憶回路である。
次に、認識検定走査の概略について第5図により説明
しよう。なお、この図において、〔1〕〜〔13〕は、走
査の中止がない場合における比較走査の順序を示す。ま
た、不合格中止点S1〜S3は、根分岐点から順に入力筆跡
と比較を続けて行ったときに、不一致の程度が大きくな
り、限度を越える点である。さらに、検定が、枝の終端
の文字コードCn(n=1〜8のいずれか)まで不合格に
ならずに達した場合、その文字コードCnを認識結果とし
て候補文字が出力される。また、この図の例では、分岐
段数は4段である。
「逐次走査」 認識辞書(3)の内容(意味的検定木)の枝に沿って
順に検定コードを辞書(3)から取り出し、その検定コ
ードにしたがって入力特徴データ(これは入力筆跡から
抽出されている)を検定する。
「分岐走査」 逐次走査中に、検定木の分岐点に達したとき、その時
点におけるユニット(1)の状態を保存域Biにコピー
し、その後、第1の分岐に沿って逐次操作を続ける。
「走査の中止」 逐次走査中に(検定途中)で、合格度が限度を越えて
低下したとき、以降の枝に沿った走査を取り止めて分岐
点まで戻り、保存域Biに保持されている分岐直前の状態
にユニット(1)の状態を戻して次の分岐に沿って逐次
走査を再開する。再開点は走査の中止が発生した点に最
も近い分岐点とする。
「走査の終端」 逐次走査が枝の終端に達したとき、終端に記述されて
いる文字コードCnを出力文字として、候補文字出力を行
う。候補文字を出力した後走査の中止と同様に最も近い
分岐点から走査を再開する。
次に認識辞書の論理構造及びその走査について説明し
よう。
「引用」 文字の筆跡の一部には、例えば偏や旁あるいはそれら
の一部などのように、多種の文字に対して共通な特徴を
もつ部分がある。そこで、これらの特徴検定記述(以
下、「被引用記述」と呼ぶ)を取り出して辞書(3)の
一ヵ所に置き、多数の文字検定記述から「引用」する。
このため、例えば第6図Aに辞書(3)の論理構造を
示すように、前置枝3aに続いて引用の必要となる点に、
引用開始マークQSと、被引用記述枝の位置を示す位置デ
ータQAとを置く。また、被引用記述技(引用子)Q1の最
後には、引用の終了を示す帰続コードQRを置く。
なお、位置データQAの形式には、絶対アドレス、相対
アドレス、表を通してアドレスが得られる被引用記述枝
番号などがある。
そして、逐次走査中に、引用開始マークQSが見つかっ
たときには、後置枝bの先頭の位置情報を、ユニット
(1)の作業域A3の走査続行スタックA33に保存(プッ
シュ)する。次に、位置データQAから被引用記述技Q1
位置情報を得てユニット(1)の辞書走査指示器A1に設
定し、逐次走査を被引用記述枝Q1に沿って続ける。
そして、この被引用記述枝Q1に沿って逐次走査を行っ
ているときに、被引用記述枝Q1の終了条件が成立したと
き、例えば帰続コードQRが得られたとき、ユニット
(1)の走査続行スタックA33から以前に保存(プッシ
ュ)しておいた後置枝bの位置情報を取り出して(ポッ
プして)辞書走査点指示器A1に設定し、逐次走査を後置
枝bに沿って続ける。
したがって、この場合の意味列(特徴記述列)は、第
6図Bに示すようになり、前置子a→被引用記述技Q1
後値枝bの順に走査が行われる。
「木分岐」 多種の文字で、書き出しからの一部の筆跡が、偏など
のように共通の特徴をもつものがある。手書き文字の認
識は、入力筆跡を、辞書中のすべての文字特徴と比較検
定し、十分特徴が一致している文字を選ぶことである。
そして、多種の文字と比較する場合、書き出しの共通部
分は一回だけ比較検定し、その結果を記憶しておけば、
第2以降の文字に対しては共通部分の検定は不要で省略
でき、差異が始まる点以降についてのみ検定すればよい
ことになる。
「本分岐」は、このような考え方したがった処理で、
差異の発生時点までの検定結果を保存する保存域B1〜Bw
をユニット(2)に設け、第5図の枝〔2〕,〔3〕,
〔4〕などの逐次走査を開始する前に、直前のユニット
(1)の状態と、それぞれの次の走査再開点(枝
〔7〕,〔6〕,〔5〕などの先頭位置)とを組として
記憶保持することにより再帰的多重分岐走査を実現する
ものである。
したがって、例えば第7図Aに辞書(3)の論理構造
を示すように、前値枝aに続いて木分岐の必要となる点
に、木分岐点を示す木分岐開始マークTSを置く。続い
て、次の木分岐枝Tj+1(図では、j=1〜3)の先頭位
置を示す位置データTAと、木分岐枝Tjと、終了コードTE
と、文字コードCjとを1組とし、その複数組(図では3
組)を置く。
この場合、位置データTAの表現形式は、自枝Tjの長さ
(=枝Tj+1の相対オフセット値)、次技Tj+1の絶対アド
レスなどとする。また、最後の木分岐枝T3の文字コード
C3の次には、木分岐枝群の終了を示す終了コードETを置
くとともに、木分岐技T3の位置データTA3は終了コードE
Tの位置を示すデータとする。
さらに終了コードTEは、1つの文字に関するすべての
検定項目列が終了したことを示すコードであり、文字コ
ードCjは、その木分岐枝Cjに該当する文字のコード、例
えばJISコードである。
そして、逐次走査中に木分岐開始コードTSが見つかっ
たときには、ユニット(1)に含まれる検定保存域指示
器A2が指示する保存域Biに、作業域A3の全情報(抽出デ
ータ取り出し走査位置指示器A31、合格度などその時点
までの認識検定結果A32、走行続行スタックA33)と、位
置データTAから計算される次の分岐枝の位置情報とを保
存のために転送した後、逐次走査を続ける。
なお、ユニット(1)の検定保存域指示器A2が指示す
る保存域Biは、保存転送されるごとに1つずつ隣りの保
存域に変更する。
また、逐次走査中に終了コードTEに達したときには、
その時点の作業域Biの中の(全)合格度と、その終了コ
ードにTEに続く文字コードCjを一組として、新しく見つ
かった候補文字として認識出力を行う。
さらに、文字検定が行われた場合には、あるいはその
前に合格度の低下により走査の中止が行われた場合に
は、最後に保存された保存域のBiの内容のうち、作業域
A3の対応情報はユニット(1)の作業域A3に戻し、再開
分岐枝位置情報はユニット(1)の辞書点指示器A1に戻
す。この処理によりユニットの作業域A3の状態は分岐発
生直前の状態に戻り、走査点は次の分岐枝の先頭にな
る。
なお、保存域Biをユニット(1)に戻したとき、同時
に保存域指示器A2の示す保存域を1つの元の方に移す。
そして、走査点が次の分岐点の先頭になると、指示器
A1の示す辞書(3)のコードによって処理は次の3つの
いずれかに分かれる。
i.次の分岐枝の位置情報の場合(TA2,TA3のとき) 分岐走査と同一の動作を行う。すなわち、分岐直前の
作業域状態と、次の分岐枝再開位置情報の保存後、逐次
走査を行う。
ii.分岐枝列の最後を示すデータのとき(TA=ETのと
き) 再開走査の最初からの動作を行う。これにより分岐点
が1段階戻ることになる。
iii.辞書(3)の全木の最後になったとき(第5図の根
分岐の最後が終ったとき) 認識検定辞書走査を完了する。
このときまでに出力された検定文字が候補文字とし
て、利用される。例えば合格度の最も高い文字のみを使
うなど。
したがって、この場合の意味列は、第7図Bに示すよ
うになり、前置枝aに続いて各木分岐枝T1,T2,T3の走査
が行われる。
「並列」 一つの文字の一部の特徴が、第10図に示すように枝
b1,b2,‥‥,bnのいずれかであるとき、特徴記述は意味
的には前置共通部、並列部、後置共通部になる。即ち、
並列部は一つの文字中で異なる部分であり、例えば、手
書き文字を入力する人によって異なる部分文字である。
例えば、点を打つ方向、書き順の異なる部分、通常複数
画で書く部分を1画で書く略字部分などがそれぞれ並列
部で構成される。このように、並列部を設けることによ
り、入力者による文字入力の違いを吸収することがで
き、文字認識の確度を向上させることができる。前置共
通部は、第10図に示すように、一つの文字で「並列部」
の前に位置する部分(画)で、辞書が並列化されていな
い部分(画)である。後置共通部は、第10図に示すよう
に、一つの文字で「並列部」の後に位置する部分(画)
で、辞書が並列化されていない部分(画)である。「並
列」は枝b1,b2,‥‥,bnの記述する筆跡部分が一定部分
に関するものか否かで、次の2つに大別する。
i 局所並列(第8図) 枝b1,‥‥,bnか筆跡の一定部分に関するものである場
合であり、したがって、後置部の開始時、抽出データ走
査点がb1,‥‥,bnのいずれにおいても不変である場合の
「並列」を「局所並列」と呼ぶ。この「局所並列」は、
例えば、同じ量(画数)を並列化する際に適用される。
例えば、同じ画数で、点の打つ方向が異なる場合や書き
順が異なる場合などに「局所並列」が用いられる。この
局所並列は、任意の枝に含まれてもよい。したがって、
局所並列の一つの並列枝biに含まれてもよく、再帰的に
引用が可能となる。
ii 分岐並列(第9図) 例えば、枝b1が楷書の2画の部分の記述であり、枝b2
がそれが続けて書かれた場合の記述である、というよう
に、枝b1,‥‥,bnが異なる量の抽出データに関する記述
である場合、後置部開始時の抽出データ走査点が変化す
る。このような並列を「分岐並列」と呼ぶ。即ち、後置
部の開始時、抽出データ走査点がb1,‥‥bnで異なる場
合の「並列」を「分岐並列」と呼ぶ。この「分岐並列」
は、例えば、異なる量(画数)を並列化する際に適用さ
れる。例えば、通常2画で書くところを1画の略字で書
く場合など、並列化される部分の画数が異なる部分に用
いられる。この場合、並列の開始点が暗黙の分岐開始点
として処理する必要がある。
この分岐並列記述部を含むことができる枝には一定の
制約がある。すなわち、「意味的に局所並列の並列枝に
は、分岐並列記述を含んではならない」という制約であ
り、このことは辞書記述に一定の制約を要求する。後述
するように、辞書(3)が前記制約を満たしていない場
合、そのことを発見する機能を有し、発見時に辞書不正
規で完了するようにしている。
次に、これら「局所並列」及び「分岐並列」について
詳述する。
「局所並列」 例えば、第8図Aに辞書(3)の論理構造を示すよう
に、前置枝aに続いて局所並列の必要となる点(局所並
列部の先頭)に、局所並列開始マークPSを置く。続い
て、本分岐におけるデータTA,Tj,TEと同様に、位置デー
タPAと、並列枝Pjと、終了コードPEとを1組とし、その
複数組(図では3組)を置く。
この場合、最後の並列枝P3に続く終了コードPEの次に
は並列枝群の終了を示す終了コードEPを置くとともに、
並列枝P3の位置データPA3は、終了コードEPの位置を示
すデータとする。また、この終了コードEPの後ろに、後
置子bを続ける。
なお、並列枝Pjの長さは、位置データPAからわかるの
で、終了コードPEを置かずに、走査位置指示器A1が、次
の並列枝の先頭に達したことを見るようにすることもで
きる。
そして、逐次走査中に、局所並列コードPSが見つかっ
たときには、スタック状態を次の状態(1段増加)に
し、続いて局所並列スタックA4のスタック状態A411を次
の状態(1段増加)にしてから、このスタック状態A411
の示す結果保持器A412に仮に不合格の結論を表すデータ
を入れ、次に、分岐時の走査と同様の処理(保存及び再
開点設定)を行ったのち、逐次走査を続ける。
そして、並列枝の逐次走査中に局所並列枝終端条件が
成立するか、または合格度低下による走査中止条件が成
立したときには、結果保持器A412に保持されている仮り
の結論と、ユニット(1)の現在の結論A32の良い方の
結論とを保持器A412に入れ直し、次にユニット(1)に
保持域Biをコピーし回復させるとともに、次の並列枝へ
処理を移す。
この場合、前の処理で設定された辞書走査点指示器A1
が示すコードによって処理は次の2つに分かれる。
i 次の並列枝であったとき(PA2,PA3のとき) 位置データPAの直後から逐次走査を続ける。
ii 並列枝列の終了であったとき(PA=EPのとき) 結果保持器A412の内容を抽出データ走査点指示器A31
に移し、スタック状態指示器A411を1段前の状態に戻し
たのち、次に述べる局所並列の完了処理を行う。
この完了処理は、検定結果A32に保持されている結果
にしたがって、次の2つに分かれる。
i 走査の中止 これは、すべての並列枝が不合格で検定結果A32が不
合格を示すときであり、走査の中止条件成立時の処理を
行う。
ii 走査の継続 これは、合格レベルになる並列枝があって検定結果A
32が合格を示すときであり、位置データPA(=EP)の直
後から逐次走査を続ける。
したがって、この場合の意味列は、第8図Bに示すよ
うになり、前置枝aに続いて並列枝P1,P2,P3の走査が行
われ、続いて後置枝bの走査が行われる。
「分岐並列」 例えば第9図Aに辞書(3)の構造を示すように、前
置枝aに続いて分岐並列の必要となる点に、この分岐並
列を示す分岐並列マークBSと、後置子bの先頭位置を示
す位置データBNとを置く。続いて、局所並列と同様に、
位置データBA、並列枝Bj、終了コードBEとを1組とし、
その複数組(図では3組)を置く。
また、最後に、並列枝群の終了コードEBを置き、続け
て後置子bを置く。
そして、逐次走査中に分岐並列マークBSを見つけたと
きには、ユニット(1)の走査続行スタックA33に後置
子bの位置データBNを保存し、以後、木分岐の走査時と
同様の処理を行う。
したがって、この場合には、ユニット(1)の走査続
行スタックA33と、保存域Biに保持する続行スタックと
の両方に、後置子bの位置情報が二重に保存されている
ことになる。
なお、逐次走査中に走査点が分岐並列枝のBiの終端に
達したことを知る方法として、辞書記述に終端コードBE
を入れておく方法、あるいは走査点指示器A1が、保存域
Bi内に保持されている再開分岐枝の位置情報の位置に達
したことを調べる方法などがある。
また、分岐並列枝Bjを逐次走査しているときに分岐並
列枝Bjの終端条件が成立したとき、引用の場合の復帰走
査と同一の処理を行なう。ただし、この場合、ユニット
(1)の続行スタックA33のみ、ポップし、保存域Biに
保持されてる続行点スタックは変更しないので、後置枝
bの位置情報は残されている。
したがって、この場合の意味列は、第9図Bに示すよ
うになる。
第11図Aは、この発明を適用した場合の辞書(3)の
論理構造の一例を示し、同図Bはその意味列を示す。ま
た、a〜kは枝である。
そして、この図からも明らかなように辞書(3)の論
理構造を複合化することができ、辞書(3)の小型化及
び認識の高速化を実現できる。
ここで、この発明のポイントをまとめると、次のとお
りである。
I 再帰的局所並列記述に対応する局所並列スタック
(複数個の結果保持器及びその使用状態保持器)と独立
に、走査続行点スタック(複数個の引用点と分岐並列後
置枝点の保持器と、その使用状況保持器)との2種類の
スタック(記憶装置)を持つ。
II 複数個の保存域から構成される走査状況保存ユニッ
トと、最後に保存した保存域を指示する検定保存域指示
器を持ち、かつ、保存域に少くとも抽出データ読み出し
走査点情報と途中までの検定結果合格度と走査続行点が
積上げられた走査続行点スタック情報と辞書の走査再開
(分岐枝)位置情報とを保存する。
III II項において、走査再開位置情報を走査続行点ス
タックの最後に付加した形成で保存する。
IV 認識辞書に分岐並列開始コードを使用し、かつ、分
岐発生後部の位置情報を認識走査制御中央エンジンと保
存域の両方に設定する。
V 認識辞書の局所並列記述枝の操作中に、分岐を発生
するコードが見つかった時に辞書が不正であることを示
す信号を出す。
VI 認識辞書の被引用記述枝の走査中に分岐を発生する
コードが見つかった場合に辞書が不正であることを示す
信号を出す。
VII 認識辞書は、分岐発生型の並列記述部を含む(被
引用記述枝を含む)認識辞書記述体系で圧縮されてい
る。
VIII 再帰的な局所並列記述を含み、ある段の局所並列
記述部が不合格と検定されても、その段が最上段でない
限り再帰的局所並列全体を不合格とは判定しない。
IX 分岐発生並列開始マークと、(並列記述部に続く)
後置記述の位置情報コードとの両方を対で使用する。
X 認識辞書は、再帰的木分岐の各枝の先頭に次の枝の
位置情報コードを持つ。
XI 分岐枝の最初の枝の前にのみ分岐マークを持ち第2
番目以降には分岐マークを省略し、分岐枝の列の最後に
分岐列完了マークを持つ。
H 発明の効果 この発明によれば、認識辞書(3)のサイズを大幅に
圧縮できる。すなわち、引用記述の再帰的使用が可能な
ので、辞書(3)を圧縮できる。また、引用記述の中
で、分岐形並列記述を使用できるので、辞書(3)を圧
縮できる。さらに、分岐形並列記述の中で再び分岐形並
列記述を使用できるので、辞書(3)を圧縮できる。
また、偏など書き始めから共通な部分の検定を、一回
しか行わないので、認識時間を短縮できる。すなわち、
局所並列記述を使うことができ、辞書圧縮と同時に後置
記述は1回のみ検定するので、認識時間を短縮できる。
【図面の簡単な説明】
第1図はこの発明の一例の系統図、第2図〜第11図はそ
の説明のための図である。 (1)は走査制御中央ユニット、(2)は走査保存記憶
ユニット、(3)は認識辞書である。
フロントページの続き (72)発明者 茶谷 公之 東京都品川区北品川6丁目7番35号 ソ ニー株式会社内 (56)参考文献 特開 昭62−208182(JP,A) 特開 昭62−216092(JP,A) 特開 昭60−22283(JP,A) 特開 昭59−45500(JP,A) 「サイエンスライブラリ情報電算機35 アルゴリズムの設計と解析▲I▼」、 サイエンス社、p.46〜53 (58)調査した分野(Int.Cl.6,DB名) G06K 9/68

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】手書き文字を認識する文字認識装置におい
    て、 木分岐構造される文字の特徴を表す特徴データと、上記
    特徴データの木分岐内の複数の異なる分岐から引用参照
    される文字の一部の特徴を表す被引用データとが記憶さ
    れている文字辞書と、 手書き入力された情報から特徴データを順次取出す抽出
    手段と、 上記文字辞書内の読み出し位置を指示する読出位置指示
    手段と、 上記読出位置指示手段の読み出し位置に応じて上記文字
    辞書の木分岐構造された特徴データ及び被引用データを
    走査する認識検定走査制御手段と、 上記文字辞書の分岐位置における走査前に、次の走査続
    行点を記憶する走査続行点記憶手段と、 上記認識検定走査制御手段が、分岐枝の走査を終了した
    際に上記走査続行点記憶手段に記憶されている走査続行
    点を上記読出位置指示手段に読み込む再帰制御手段と を備えたことを特徴とする文字認識装置。
  2. 【請求項2】手書き文字を認識する文字認識方法におい
    て、 木分岐構造される文字の特徴を表す特徴データと、上記
    特徴データの木分岐内の複数の異なる分岐から引用参照
    される文字の一部の特徴を表す被引用データとが設定さ
    れた文字辞書を用意し、 手書き入力された情報から上記特徴データを順次取出す
    抽出ステップと、 上記文字辞書内の読み出し位置を指示する読出位置指示
    ステップと、 上記読出位置指示ステップの読み出し位置に応じて上記
    文字辞書の木分岐構造された特徴データ及び被引用デー
    タを走査する認識検定走査制御ステップと、 上記文字辞書の分岐位置における走査の前に、次の走査
    続行点を記憶する走査続行点記憶ステップと、 認識検定走査制御ステップが、分岐枝の走査を終了した
    際に上記走査続行点記憶ステップで記憶された走査続行
    点を文字辞書内の読み出し位置として上記認識検定走査
    制御ステップを行う再帰制御ステップと を備えたことを特徴とする文字認識方法。
JP63215572A 1988-08-30 1988-08-30 文字認識装置及び文字認識方法 Expired - Fee Related JP2847715B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP63215572A JP2847715B2 (ja) 1988-08-30 1988-08-30 文字認識装置及び文字認識方法
KR1019890011869A KR0126675B1 (ko) 1988-08-30 1989-08-21 온-라인 수기 문자 인식 장치
US07/398,086 US5010579A (en) 1988-08-30 1989-08-24 Hand-written, on-line character recognition apparatus and method
GB8919522A GB2222476B (en) 1988-08-30 1989-08-29 A data input device for a data processing device
CN89106956A CN1019157B (zh) 1988-08-30 1989-08-30 联机手写字符识别装置
HK121995A HK121995A (en) 1988-08-30 1995-07-27 A data input device for a data processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63215572A JP2847715B2 (ja) 1988-08-30 1988-08-30 文字認識装置及び文字認識方法

Publications (2)

Publication Number Publication Date
JPH0262683A JPH0262683A (ja) 1990-03-02
JP2847715B2 true JP2847715B2 (ja) 1999-01-20

Family

ID=16674653

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63215572A Expired - Fee Related JP2847715B2 (ja) 1988-08-30 1988-08-30 文字認識装置及び文字認識方法

Country Status (6)

Country Link
US (1) US5010579A (ja)
JP (1) JP2847715B2 (ja)
KR (1) KR0126675B1 (ja)
CN (1) CN1019157B (ja)
GB (1) GB2222476B (ja)
HK (1) HK121995A (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5675668A (en) * 1992-04-08 1997-10-07 Kawaski Steel Corporation Coding method, semiconductor memory for implementing coding method, decoder for semiconductor memory and method for identification of hand-written characters
JPH0684006A (ja) * 1992-04-09 1994-03-25 Internatl Business Mach Corp <Ibm> オンライン手書き文字認識方法
US5592566A (en) * 1992-05-27 1997-01-07 Apple Computer, Incorporated Method and apparatus for computerized recognition
US6041137A (en) 1995-08-25 2000-03-21 Microsoft Corporation Radical definition and dictionary creation for a handwriting recognition system
US6103599A (en) * 1997-07-25 2000-08-15 Silicon Genesis Corporation Planarizing technique for multilayered substrates
JP2003162687A (ja) * 2001-11-28 2003-06-06 Toshiba Corp 手書き文字入力装置、手書き文字認識プログラム
US7729542B2 (en) * 2003-04-04 2010-06-01 Carnegie Mellon University Using edges and corners for character input
US7236631B1 (en) 2003-04-18 2007-06-26 Kamran Reihani System and method for automated symbolic recognition including logical symbols
US7239749B1 (en) 2003-04-18 2007-07-03 Kamran Reihani System and method for automated symbolic recognition including evidence-based technique
US7242805B1 (en) 2003-04-18 2007-07-10 Kamran Reihani System and method for automated symbolic recognition including database modeling
US7227995B1 (en) 2003-04-18 2007-06-05 Kamran Reihani System and method for automated symbolic recognition including spatial reasoning
US7218782B1 (en) 2003-04-18 2007-05-15 Kamran Reihani System and method for automated symbolic recognition including multi-phase symbolic reshaping

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3846752A (en) * 1972-10-02 1974-11-05 Hitachi Ltd Character recognition apparatus
JPS5156139A (en) * 1974-11-13 1976-05-17 Hitachi Ltd Mojomitorisochi niokeru kiridashihoshiki
US3996557A (en) * 1975-01-14 1976-12-07 MI2 Corporation Character recognition system and method
JPS5827551B2 (ja) * 1979-05-18 1983-06-10 日本電信電話株式会社 オンライン手書き文字認識方式
US4495646A (en) * 1982-04-20 1985-01-22 Nader Gharachorloo On-line character recognition using closed-loop detector
JPS5945500A (ja) * 1982-09-08 1984-03-14 日本電気株式会社 パタンマツチング装置
JPS5998283A (ja) * 1982-11-27 1984-06-06 Hitachi Ltd パターン切出しおよび認識方法、ならびにそのシステム
US4531231A (en) * 1983-01-19 1985-07-23 Communication Intelligence Corporation Method for distinguishing between complex character sets
US4561105A (en) * 1983-01-19 1985-12-24 Communication Intelligence Corporation Complex pattern recognition method and system
US4718102A (en) * 1983-01-19 1988-01-05 Communication Intelligence Corporation Process and apparatus involving pattern recognition
JPS6022283A (ja) * 1983-07-19 1985-02-04 Nec Corp パタ−ンマツチング装置
JPS60136892A (ja) * 1983-12-26 1985-07-20 Hitachi Ltd オンライン手書き図形認識装置
US4610025A (en) * 1984-06-22 1986-09-02 Champollion Incorporated Cryptographic analysis system
US4731857A (en) * 1984-06-29 1988-03-15 International Business Machines Corporation Recognition system for run-on handwritten characters
JPH0610829B2 (ja) * 1984-06-29 1994-02-09 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション 手書き文字認識方法
JPS6126192A (ja) * 1984-07-17 1986-02-05 Oki Electric Ind Co Ltd ハングル字母列からのハングル文字認識方法
JPS6274181A (ja) * 1985-09-27 1987-04-04 Sony Corp 文字認識装置
JPH0661114B2 (ja) * 1986-03-13 1994-08-10 富士通株式会社 オンライン手書文字認識装置
US4949388A (en) * 1987-02-19 1990-08-14 Gtx Corporation Method and apparatus for recognition of graphic symbols

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
「サイエンスライブラリ情報電算機35 アルゴリズムの設計と解析▲I▼」、サイエンス社、p.46〜53

Also Published As

Publication number Publication date
GB2222476B (en) 1993-07-21
GB8919522D0 (en) 1989-10-11
US5010579A (en) 1991-04-23
KR0126675B1 (ko) 1998-04-04
KR900003766A (ko) 1990-03-27
CN1040694A (zh) 1990-03-21
JPH0262683A (ja) 1990-03-02
HK121995A (en) 1995-08-04
GB2222476A (en) 1990-03-07
CN1019157B (zh) 1992-11-18

Similar Documents

Publication Publication Date Title
JP2726568B2 (ja) 文字認識方法及び装置
US4685142A (en) Method and device for handwritten letter recognition
EP0325233B1 (en) Character string recognition system
JP2847715B2 (ja) 文字認識装置及び文字認識方法
KR20020009583A (ko) 색인키 데이터 필드를 추출하기 위한 시스템 및 방법
Cannon OPCOL: An Optimal Text Collation Algorithm
JP2801602B2 (ja) 単語認識装置
JP3115459B2 (ja) 文字認識辞書の構成方法及び検索方法
JP2844789B2 (ja) 文字認識方法及び文字認識装置
JPH0758499B2 (ja) 文字認識装置
JPH0357509B2 (ja)
JP2746345B2 (ja) 文字認識の後処理方法
JPH02148174A (ja) Ocrによる住所データベース検索装置
JP2784004B2 (ja) 文字認識装置
JP2969751B2 (ja) 文字認識処理方式
JPS58125184A (ja) 光学的文字読取装置
JPH0272497A (ja) 光学的文字読取装置
JPS63138479A (ja) 文字認識装置
JPS6095689A (ja) 光学的文字読取装置
JPS6336487A (ja) 文字読取方式
JPH07271920A (ja) 文字認識装置
JP3036246B2 (ja) 情報検索装置
JPH02181269A (ja) 住所認識方式
JPH06259602A (ja) 候補文字抽出装置
JPH03116393A (ja) マッチング方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees