JP2592097B2 - 欧文速記文字認識装置 - Google Patents

欧文速記文字認識装置

Info

Publication number
JP2592097B2
JP2592097B2 JP63120479A JP12047988A JP2592097B2 JP 2592097 B2 JP2592097 B2 JP 2592097B2 JP 63120479 A JP63120479 A JP 63120479A JP 12047988 A JP12047988 A JP 12047988A JP 2592097 B2 JP2592097 B2 JP 2592097B2
Authority
JP
Japan
Prior art keywords
character
shorthand
pen
point
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63120479A
Other languages
English (en)
Other versions
JPH01291395A (ja
Inventor
直樹 桜井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63120479A priority Critical patent/JP2592097B2/ja
Publication of JPH01291395A publication Critical patent/JPH01291395A/ja
Application granted granted Critical
Publication of JP2592097B2 publication Critical patent/JP2592097B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、コンピユータを用いた速記文字認識装置に
係り、特に、手書きによる欧文の速記文字の認識に好適
な欧文速記文字認識装置に関する。
〔従来の技術〕
パソコン(パーソナル・コンピユータ)などのデータ
処理装置を用い、タブレツト装置などから入力される手
書き文字によるデータを認識するようにした文字認識装
置としては、従来から種々のものが知られており、その
例を、特公昭57−6151号、特公昭57−16382号、特公昭5
7−19471号、の各公報、或いは特開昭53−45935号、特
開昭55−14095号、特開昭55−61884号の各公報に見るこ
とができる。
ところで、これらは、いずれも、各文字ごとに分離し
て書いてゆく。普通の書き方により入力される文字を対
象としていた。
〔発明が解決しようとする課題〕
上記従来技術は、いずれも手書き欧文速記文字の認識
については特に配慮がされておらず、このため、手書き
欧文速記文字データが入力された場合での、各文字の区
切や各文節の区切の検出に難点があり、文字認識が困難
であるという問題点があつた。
本発明の目的は、手書き欧文速記文字を対象として、
常に充分な認識結果が得られるようにした、手書き欧文
速記文字認識装置を提供することにある。
〔課題を解決するための手段〕
上記目的は、複数の文字が一筆書きされている手書き
欧文速記文字の各文字ごとのデータの区切の検出を、入
力描画時での筆点の軌跡のベクトル変化速度と軌跡の同
一点回帰、及び軌跡の消失の少なくとも一方に基づいて
行ない、この区切の検出に応じて、予め使用者ごとに記
憶してある文字の大きさに基づく使用者の学習により文
字長の判別に必要な境界値を定め、この境界値に基づく
所定のパターンマッチング処理による各文字の認識を開
始し、上記各文節ごとのデータの区切の検出を、上記軌
跡の消失点と再出現点との間の距離に基づいて行ない、
この区切の検出を契機として文節変換を開始するように
して達成される。
〔作 用〕
入力されたデータが各文字ごとに区分できれば、所定
のパターン・マツチング処理により、欧文の各文字の認
識が可能になり、入力されたデータが各文節に区分でき
れば、これを契機として文節変換が可能になり、認識し
た各文字から欧文に変換することができる。
〔実施例〕
以下、本発明による欧文速記文字認識装置について、
図示の実施例により詳細に説明する。
なお、以下に説明する実施例は、英文速記文字を対象
としているが、本発明は、英語に限らず、ドイツ語,フ
ランス語などの手書き速記文字を対象としても実施可能
である。
第2図は本発明の一実施例が適用されたデータ処理装
置の一例で、図において、1はコンピユータ装置、2は
座標入力装置である。
この第2図から明らかなように、この実施例では、比
較的小型のコンピユータ装置、一般的にはパーソナルコ
ンピユータ装置、あるいはビジネスコンピユータ装置等
と呼ばれる種類のコンピユータ装置1に、手書き速記文
字入力装置として働く座標入力装置2を接続することに
よつてシステムが構成されている。そして、座標入力装
置2は、本実施例においては後述するように、タブレツ
トと、当該タブレツトの描画面に文字を描く入力ペンと
を備える。また、コンピユータ装置1は、中央処理装置
1a,メモリ1b,表示装置1c,キーボード1dなどで構成され
ている。
座標入力装置2は、第3図にその外観を示すように、
タブレツト2aと、当該タブレツト2aの描画面に文字を描
く入力ペン2bとを備え、さらにタブレツト2aは、その描
画面2cに、文字入力領域2d及び各種モード等を指定する
領域2e,2f,2g等が設けられている。そして、この座標入
力装置2はタブレツト2aの描画面2cに入力、ペン2bの先
端である筆点が接触しているか否かを示すステータス情
報と、筆点の接触位置を示すX座標値情報,Y座標値情報
とを必要に応じて出力する働きをする。なお、座標入力
装置2は、タブレツトに限定されるものではなく、上記
の出力情報が送り出せるものなら、どのような座標入力
装置を用いてもよい。
入力ペン2bにより、文字入力領域2dに文字を書き込ん
でゆくと、筆点に関するデータとしてのX,Y座標値情報
が順次出力される。各種モード設定は、対応する領域2
e,2f,2gに入力ペン2bを押し当てることによつて指示す
るようにしてある。メモリ1bには、速記文字認識手段,
離間検出手段,速記英文節変換処理手段,及びこれら各
処理を有効に起動するための各種プログラムが記憶して
あり、中央処理装置1aは、当該プログラムを処理実行す
ることにより、所定の機能を達成する。更に、このメモ
リ1bは、これらの各プログラムを中央処理装置1aが処理
を実行するにあたり、必要とする座標入力装置2からの
各種データ、及び処理に必要な各種中間データを記憶す
るための各種記憶部を提供する働きをする。表示装置1c
は、本実施例の場合、入力中の手書き文字の筆跡を順次
表示、あるいは認識された文字を表示する等の用途に使
用する。
第1図は本発明の原理を示したもので、前記した各構
成部分間での相互の関連をブロツク図によつて示した図
であり、Aは手書き速記文字入力手段で、第1図及び第
3図に示した座標入力装置2に相当する。SHRGは速記文
字認識手段、PNUPは離間検出手段、そしてEJCNは速記英
文節変換処理手段である。これらの手段SHRG,PNUP,EJCN
は、前記したように、メモリ1bにプログラムの形で記憶
され、中央処理装置1aが当該プログラムを処理実行する
ことにより、これらは所定の機能を発揮する。
この第1図において、手書き速記文字入力手段Aは座
標入力装置2のタブレツト2aにある描画面2dのいずれか
の部分に対する入力ペン2bの先端接触部、すなわち筆点
の軌跡に関するデータを順次出力する。
速記文字認識手段SHRGは手書き速記文字入力手段Aか
らの出力データを順次入力し、当該データに基づいて手
書き速記文字を順次認識処理する。
離間検出手段PNUPは同様に、手書き速記文字入力手段
Aからの出力データを順次入力し、当該データに基づい
て、入力ペン2bの先端、すなわち筆点が描画面2dに接触
しているか否かを検出する。なお、この接触の有無を離
間という。
速記英文節変換処理手段EJCNは、速記文字認識手段SH
RGによつて認識された文字データを入力し、当該文字デ
ータに基づいて離間検出手段PNUPからの筆点離間距離検
出情報に応答し、英文文節対応変換処理を実行する。
これにより、変換指示キー等の操作を必要とすること
なく、変換タイミングの自動判定が可能な手書き速記文
字変換装置を得ることができる。
次に、これら各手段による動作について、以下に詳細
に説明する。
各処理手段の詳細に当たり、まず第17図につき詳細に
説明する。この第17図は各処理手段の実行に必要な一次
記憶部の構成を示すメモリ構成図であり、各記憶部はメ
モリ1bの予め定めたアドレスに設定する。
GDSTは座標入力装置2からの受信信号、すなわちステ
ータス信号,X座標値情報,Y座標値情報の各信号の取得状
態を記憶する座標値情報取得状態記憶部である。
STT,XDT,YDTは座標入力装置2からそれぞれ受信した
前記ステータス情報やX座標値情報,Y座標値情報を各々
記憶する記憶部である。
PNFは最も近い過去の入力ペン2bの筆点の座標値に伴
うステータス情報、すなわちペンアツプ状態か、ペンダ
ウン状態かを記憶する前ペン状態記憶部であり、PSTは
現在のステータス情報記憶部STTの内容と、最も近い過
去のステータス情報記憶部PNFとの内容から入力ペン2b
の状態、すなわちペンダウン時点,ペンダウン中,ペン
アツプ時点のいずかれの状態を記憶するペン状態記憶部
である。
DOTSは座標入力装置2からそれぞれ受信したステータ
ス情報,X座標値情報,Y座標値情報、及びこれらによつて
得られた各種情報を順次記憶し、筆点の軌跡に関するデ
ータを順次循環的に記憶する座標値記憶部である。この
座標値記憶部DOTSは論理的に環状に構成され、筆点の軌
跡に関する情報を循環的に記憶する。
STCMは記憶された速記文字の文字コードを順次記憶し
て蓄積する文字コード記憶部である。
以下、この第17図を参照して、各図につき詳細に説明
する。
第4図,第5図は主処理手段を示すフローチヤートで
あり、ここで、第5図は座標入力手段2から出力される
各種情報をコンピユータ装置1へ割り込み機能を利用し
て入力する軌跡取得手段TGを示したもので、この処理で
は、先ずステツプ5aで、後記詳述するように、座標取得
手段GDを起動し、当該時点に於ける筆点の座標情報、入
力ペン2bのステータス情報を取り込み、これを座標値記
憶部DOTSに順次記憶する。続く、ステツプ5bでは、後記
詳述するように、ペン状態取得手段PSを起動し、ステツ
プ5aでの記憶内容から入力ペン2bの状態を判定し、同様
に、座標値記憶部DOTSに、これを記憶する。
第4図に示す主処理手段では、先ずステツプ4aにおい
て、初期化手段INITを起動する。この手段INITは、後記
詳述するように、各種一時記憶部、及び装置の各部の初
期化を行う。続くステツプ4bでは、後記詳述するよう
に、文字区切検出手段SPDTを起動する。この手段SPDT
は、第5図に示す軌跡取得手段TGによつて取り込んだデ
ータに基づき、各速記文字の区切を検出する。すなわ
ち、速記文字は第18図に示すように、複数の文字が一筆
で書かれるため、各文字の認識に当たり、その各速記文
字の分離のために、その区切を検出する必要があるので
ある。
こうして、ステツプ4bで文字区切検出手段SPDTを実行
し、速記文字の区切が検出されたら、次にステツプ4cで
は速記文字認識処理手段SHCRを起動する。この手段SHCR
は文字区切検出手段SPDTからの文字区切検出情報に応答
し、速記文字一文字分のデータに基づき速記文字を認識
する。
そして、ステツプ4dでは、この認識した文字の文字コ
ードを文字コード記憶部STCMへ順次記憶する。
続くステツプ4eでは、入力ペン2bがタブレツト2aの描
画面2cから離れたか、否かを判定し、これが離れていな
ければ、処理をステツプ4bに戻し、次の文字の認識を実
行する。しかしてペンアツプが検出された後、次のペン
ダウンが検出され、一文字の認識が終わるという一連の
動作がなされるとステツプ4fに進み、ここでペンアツプ
期間距離判定を行い、求められた距離が一定値以下であ
れば、ペンアツプ動作を含む一文節書き込み継続中とみ
なし、ステツプ4bに戻り、再び文字の認識を始める。
ペンアツプ距離が一定値以上であれば、ステツプ4gに
進み、文字コード記憶部STCMに記憶されているペンアツ
プ前の文字コードに基づいて、英文節変換EJCNを実行す
る。そして、変換された文節は文書作成装置等のプログ
ラムに渡され、ステツプ4hにおいて、当該一連の処理を
終了するか否かを判定し、終了でなければ処理をステツ
プ4bへ戻し、再度一連の処理を繰り返す。
このような、一連の処理の実行により、手書き速記さ
れた速記文字が英文に変換される。
なお、第1図との対応において、ステツプ4b,4c,4dが
速記文字認識手段SHRGに対応し、ステツプ4e,4f,4jは離
間検出手段PNUを構成する。
次に、第4図,第5図における各処理手段について詳
細に説明する。
第6図は、第5図のステツプ5aでその概略を示した座
標値取得手段GDの詳細を示すフローチヤートである。
当該手段GDは、まずその起動によりステツプ6aにおい
て、座標入力装置2からの各種情報を受信し、続くステ
ツプ6bにおいては、当該手段GDの内部状態がどの情報の
入力待ち状態であるかを識別する。ここで、座標値取得
状態記憶部GDSTの記憶内容は、「0」の時はステータス
情報待ち、「1」の時はX座標値情報待ち、「2」の時
はY座標情報待ちと予め定めてある。
次に、ステツプ6c,ステツプ6f,ステツプ6jでは、入力
情報と待ち情報とのデータ型式のチエツクを行う。特
に、ステツプ6fとステツプ6jでは、異なる型式の入力デ
ータを検出した場合、当該記憶部GDSTをステツプ6i,6m
でクリアすることにより、内部状態をリセツトする。
さらに、ステツプ6d,ステツプ6g,ステツプ6kでは、受
信情報をそれぞれ対応する記憶部STT,XDT,YDTに転送記
憶し、ステツプ6e,ステツプ6h,ステツプ6lで待ち状態が
遷移するように記憶部GDSTの記憶内容を書き換える。
そして、最後に、ステツプ6nにおいて、記憶部STT,XD
T,YDTに記憶したステータス情報、座標値情報を座標値
記憶部DOTSに転送記憶する。
従つて、この座標値取得手段GDは、座標入力手段2か
らの情報をステータス情報,X座標値情報,Y座標値情報の
順に順次取り込み、取り込んだ各情報を対応する記憶部
STT,XDT,YDTに記憶し、これらすべての情報を受信記憶
したことにより、続く処理手段の実行を促す働きをする
のである。
次に第7図は、第5図のステツプ5bでその概略を示し
たペン状態取得手段PSの詳細を示すフローチヤートであ
る。
当該手段PSは、まずその起動によりステツプ7aにおい
て、ステータス情報記憶部STTの記憶内容を参照し、現
在、入力ペン2bの状態が、ダウン状態かを判定する。
次に、ステツプ7b,ステツプ7cにおいて、入力ペン2b
の状態変化を検出する。すなわち、現在のペン状態、つ
まり、ステータス情報記憶部STTと前ステータス情報記
憶部PNFとの記憶内容を比較し、それぞれがペンダウン
状態とペンダウン状態であればペンダウン継続中、ペン
ダウン状態とペンアツプ状態であればペンダウン時点、
ペンアツプ状態とペンダウン状態であればペンアツプ時
点と判定とする。
次に、ステツプ7d,ステツプ7e,ステツプ7fで、それぞ
れ対応する状態を示す情報をペン状態記憶部PSTに転送
記憶する。さらに、ペン状態に状態変化のある場合、す
なわち、ペンアツプ状態からペンダウン状態、またはペ
ンダウン状態からペンアツプ状態に変化した場合には、
それぞれ対応するステツプ7g,7hにおいて、現在のペン
状態を示す情報を次の処理に備え、前ペン状態記憶部PN
Fに転送記憶する。
そして、最後に、ステツプ7iで記憶部PSTの内容を、
前記と同様に座標記憶部DOTSに記憶する。
このペン状態取得手段PSの実行により、現在のペン状
態が、ペンダウン時点か、ペンダウン継続中か、または
ペンアツプ時点であるかが識別できる。
以上、第6図,第7図に示した座標取得手段GD,ペン
状態取得手段PSにより筆点の軌跡の座標、及び入力ペン
2bの状態が記憶部DOTSに順次記憶されることとなる。
第8図は、第4図のステツプ4aでその概略を示した初
期化手段INITの詳細を示すフローチヤートである。
当該手段INITは、前記したように、装置及び一時記憶
部を初期状態にセツトする働きをするが、本実施例にお
いては、座標入力装置2はコンピユータ装置1に通信ポ
ートを介して接続するようにしてあるため、まずステツ
プ8aではこの通信ポートのボーレートを、例えば9600
〔BPS〕にセツトする。通常、キーボード1bのボーレー
トが9600〔BPS〕なので、これと互換が保てるように、
同じボーレートにセツトするのである。次のステツプ8b
では、キーボード1bによる割込を無効にし、これにより
キーボード1bの代わりに、座標入力装置2によるデータ
の入力を可能にする。そして、システムで管理している
システムバツフア内に認識した文字を挿入する。
続くステツプ8cで各種ワークエリアとしての記憶部を
初期化し、ステツプ8dでは認識した速度文字コードを記
憶するメモリーバツフアを初期化する。本実例の場合、
これを30文字分確保することとしてある。
次に、ステツプ8eでは表示装置1cの表示画面上のカー
ソルの位置を記憶する。
最後に、ステツプ8fで、一般文字認識におけるスイツ
チ動作を決めてもらう。スイツチ動作としては、速記文
字の認識が誤認識にならない様なスイツチ動作方法、例
えば、ペンの横の突部を押す、もしくは、点を2回以上
続けて押す。もしくは筆圧を変えるなどの方法がある。
なお、このため、ステツプ8eでは、画面にスイツチング
方法を表示し、その中からユーザーにスイツチ動作の種
類の指定をしてもらうようになつている。
次に、速記文字の認識処理について述べる。
速記の基本文字認識としては、速記文字のドツト列間
の角度とベクトル変化、同一点の認識、速度文字の長短
の区別による認識、速記文字の1文字のドツト列のn点
近似した点の絶対的角度差と相対的角度差による認識、
及び速記文字のn点分割したドツトを相関法と距離法で
処理する方式の認識などが知られているが、それぞれの
場合に応じて最適な認識方法を採用する。
第9図は、第4図のステツプ4bで示した文字区切検出
手段SPDTの詳細を示すフローチヤートである。この実施
例では、次の2つの方法により文字区切を検出する。
文字区切検出法 (i) 速記点間ベクトルの急激な変化による認識筆記
者がタブレツト2aの描画面2c上に描いた速記文字の軌跡
のx座標,y座標は、第5図に示した軌跡手段TGによつて
座標値記憶部DOTSに順次記憶される。そこで、ステツプ
9aでは、この座標値情報を順次読み出し、筆点のある位
置の座標値(xi,yi)と次に取り組まれた筆点の座標値
(xi+1,yi+1)との角度θを下記(1)式で算出し、
これを記憶する。なお、以下、このθを速記点間ベク
トル、略して単にベクトルと呼ぶ。
続くステツプ9bでは、ステツプ9aで検出したベクトル
値θと、前回に検出されていたベクトル値θi-1との
差を調べ、これにより、第18図に示すようなベクトルθ
に急激な変化が現れている点SPを検出する。なお、こ
の実施例では、このときでのベクトルθの急変値とし
ては、60゜以上を設定してある。
こうして、ベクトルθが60゜以上変化している点SP
が検出されたら、この点SPを1文字の区切とする。そし
て、この実施例では、文字区切検出フラグMFIが設定し
てあり、点SPが検出されたら、このフラグMFIを「1」
にする。なお、このフラグMFIは、後述する、文字の角
度により、文字認識する場合に使用されるものである。
(ii) 速記点間ベクトルと同一点認識による認識筆点
の軌跡が同一座標点を通り、かつ、このときの最初の軌
跡が通つたときでの速記点間ベクトルθi-1に対して、
次に軌跡が通つたときでの速度点間ベクトルθが所定
角W以上の差を示したとき、文字の区切と判定する。
|θ−θi-1|≧W この実施例では、W=60゜に設定してある。
また、このとき、 −180゜<θ<180゜ −180゜<θi+1<180゜ が満足しているものとする。
以上の判断は、ステツプ9cと9dで処理される。なお、
このとき、英文速記では、母音の前の情報の分離が必要
になるので、ステツプ9fの処理を行うようになつてい
る。
ペンアツプによる認識 ペンアツプが検出されたら、直ちに区切であるとす
る。そして、この処理はステツプ9eで与えられる。
上記の3種の文字区切検出方法によつて文字の区切を
認識するのであるが、文字区切が検出されない時は、処
理をステツプ9aに戻し、再度次の筆点との間の角度とペ
ンアツプと同一点の検出を行う。
こうして文字区切が検出されると、速記点間ベクトル
θと、筆点の軌跡座標xi,yiを1文字分としてデータ
の分離が可能となる。なお、筆記開始は、ペンダウン情
報によつて検出でき、更に筆記終了は、ペンアツプ情報
によつて検出可能である。
第10図は、第4図のステツプ4cでその概略を示した速
記文字認識処理手段SHCRの詳細を示すフローチヤートで
ある。
まず、速記文字の長短の認識について述べる。
速記文字の例は第22図と第23図に示した通りである
が、この図から判る様に、速記では長い線は短い線のほ
ぼ3倍の長さで書かれるのが原則である。
そこで、長い線と短い線を区別する為に、この実例で
は、通常1.2〔cm〕を基準にして、短い線の速記文字と
長い線の速記文字とを区別するようになつている。
しかし、例外もあり、第22図(a)の、A凹のFと
V、A−のCHとJ、E凹のPとBなどがそれである。
そこで、この場合には、さらに短い文字の2倍と3倍
とで境界値を設定する。すなわち、一般的に、1〔cm〕
以上の長い文字は平均2〔cm〕、それ以下の短い文字
は、平均して7〔mm〕の長さに収まつているからであ
る。
しかし速記者によつて文字の大きさが異なるので、本
実施例では、この長短の区別のための境界値を筆記者が
指令できる学習モードが備えられており、ステツプ10e
では、この学習モードを選択するために別途設けてある
スイツチを判定し、スイツチオンの場合はステツプ10f
で学習手段STUMを起動する。第12図に、この学習手段ST
UMの詳細フローチヤートを示す。
まず、ステツプ12aで相対角度の和と角度の相違度差
の和が近似している文字を指定し、その文字を筆記者が
日常的に書く大きさで書くよう筆記者に対し入力要求す
る。そして、ステツプ12bでその書いた文字を表示装置1
cにそのまま表示し、筆記者自身に同じ速記文字角度で
それぞれの大きさを認識させる。
そして、例えば、“N"と“M"の文字のように、文字の
大きさだけが違う文字を、筆記者がその大きさを逆に書
いてしまつた場合には、これをステツプ12dで判定し、
ステツプ12cで表示装置にミスである旨のメツセージを
表示し、再入力を要求する。そしてこれらの繰り返しに
より、ステツプ12eで筆記者の手書き文字の長短が区別
できる点を認識し、記憶する。なお、上記した「文字の
大きさ」は、本実施例では以下の手法により定めること
としている。
まず、1文字分に区分けされたx,y座標を、ステツプ1
0cでN個のサンプル点に等分割近似する。なお、2の実
施例では、N=12である。
第21図は、「V」の速記文字の例であり、これを12個
のサンプル点で等分割近似した場合を示している。
次に、第25図に示すように、1文字として認識された
N個のサンプル点から重心座標(X,Y)を、次式で求め
る。
このようにして求めた重心から、最も距離が離れサン
プル点までの距離を(3)式によつて求め、その長さl
を文字の大きさとする。
以上の認識処理がステツプ10gである。
次に角度の認識について、その原理を述べる。
速記文字の記述される角度は、第19図の場合か、もし
くは、第23図の様な円である。そして、速記文字は、基
本的には、上記したタイプの角度で描かれる為、この実
施例では、以下の2通りの認識方法を利用して速記文字
を認識する。これを実行するのが、第10図のステツプ10
hで示す角度文字認識手段AGRGである。
なお、このとき、一般文字の認識については、予めそ
のためのスイツチが設けてあり、これがオンにされてい
るため、ステツプ10dで除かれてステツプ10lに移行して
いる。
第11図が角度文字認識手段AGRGの詳細フローチヤート
で、上記したように2種の方法により認識を行う。
相対角度の和による認識 まず、ステツプ11aでは、サンプル点の相対角度を算
出する。第20図においては、角度θは、始点Ps(xs,y
s)からサンプル点Pi(i=1〜6)への角度を示す。
この角度θは次式(4)によつて算出する。
次に前述したMFIの状態を見て、MFIが1でなければ、
次のステツプに移る。
MFIが1の時、以下の処理をする。
次に、突極点認識による文字情報の分離を行う。
第26図に示す通りに、文字が複数書かれていたにもか
かわらず、前述した、1文字の分離を認識する処理SPDT
で、それが検出されなかつた時に、(4)式で求めた値
の増減方向を調べ、増減方向が逆に、もしくは急激に増
加減少する様になつた点を1文字として分離すべき点と
して認識する。そして、この時には、XY座標データの1
文字単位の分離化を行うため、第10図のステツプ10cに
戻る。
ステツプ11cでは、(4)式によつて求めた値から相
対角度の和を次式(5)によつて求める。
次に、ステツプ11dでこれらの算出値に基づき、速記
文字の角度タイプと、文字の凸凹を検出する。
第22図は、第19図に示した速記文字の各々の長さの長
短、角度のタイプ、凹凸により分類した図であり、この
様な分類に応じ、速記文字を認識する。なお、この図に
は、速記文字の対応する「英音」をカツコ書きにて付記
してある。続く、ステツプ11eにおいては、サンプル点
の角度の相違度差の和を算出する。
角度の相違度差の和による認識 すなわち、第21図の角度θ(i=1〜10)は各サン
プル点を結ぶベクトルの差であり、このステツプ11eで
は、この角度θの総和を算出するのである。
以上のようにして算出した相対角度の和と角度の相違
度差の和とを、予め作成した標準辞書の対応する角度値
をステツプ11fで比較して、両者の角度差の少ない文字
をステツプ11gで選択し、記憶する。
第10図に戻り、ここでのステツプ10gにおいては、前
記のようにして速記文字の大きさを認識し、続くステツ
プ10hではこの文字の大きさと、前記した相対角度の和
と前記した角度の相違度差の和で、速記文字を認識し、
複数の候補文字を選択する。ステツプ10iでは、近似方
向ベクトル系列法による文字認識手段BRGMを起動する。
当該手段BRGMは、その詳細を第13図に示すように、選
び出した複数の候補文字から以下のセグメントの近似方
向ベクトル系列法によつて、正しく、速記文字を認識す
るものである。当該手段BRGMは、その前処理として、ス
テツプ13aによりサンプル点例データを候補文字の標準
辞書の大きさのデータに変換する。そして、次に示す、
近似方向ベクトル系列法に基づく計算を実行する。
近似方向ベクトルは、セグメント両端点の差分値その
ものとする。一文字をN等分して得られる(N+1)個
の特徴点をP1(始点)〜PN+1(終点)とすれば、近似方
向ベクトルΔPiは、 ΔPi=Pi+1−Pi =(Xi+1−Xi,Yi+1−Yi) ……(6) ただし、i=1〜N,Pn=(Xn,Yn) n=1〜N+1である。
S′は、 入力文字と標準パターンのストローク間距離dsは、特
徴パラメータ間の距離の総和として求めている。
すなわち、 となる。
ステツプ13bでは、文字の大きさと角度によつて得ら
れた候補文字の標準辞書パターンと、筆記者の速記文字
を上記(8)式で計算し、パラメータ距離が最小値の文
字を選択する。
ステツプ13cでは、この選び出した文字と、筆記者の
筆記文字とを、前記(7)式で得た近似方向ベクトル間
距離が近似値であれば、ステツプ13dで文字が認識され
たことを記憶し、そうでなければ、ステツプ13eで文字
が認識されない事を記憶する。
そして、再び第10図に戻り、ステツプ10kを実行す
る。このステツプ10kは文字が認識されたか否かを判定
する処理であり、具体的には第13図のステツプ13d、あ
るいはステツプ13eでの記憶内容に応じてこれを判定す
る。ここで、文字が認識済であれば第10図に示す速記文
字認識SHRGの実行は終了する。他方、ここで文字が認識
されなかつた場合には、ステツプ10lで特殊文字認識手
段SCRGを起動する。第14図はこの特殊文字認識手段SCRG
の詳細を示すフローチヤートである。
この第14図の当該手段SCRGは、第22図と第24図に示す
ような、ペン離間が文字書き込み途中で行われる場合な
どの特種な文字の判定を行い、これらに応じて文字認識
を実行する。
まず、最初に、ステツプ14aの判定により、この特種
文字認識が、一般文字認識をするために呼ばれた場合
は、一般文字認識のステツプ14lに移る。それ以外の場
合は、ステツプ14dに移る。
ここで、ステツプ14dの角度文字認識手段と、ステツ
プ14eの文字の大きさ認識手段、ステツプ14fの認識文字
候補群を選ぶ手段、それにステツプ14gの近似方向ベク
トル系列法による文字認識処理は、比較する辞書データ
を、速記文字のデータの代わりに特種文字データと入れ
換えているだけで、第10図のSHCRのステツプ10h,10g,10
jと同様な動作を行う。
次のステツプ14hでは、今までのステツプで認識され
た文字の文字群変換認識処理を行う。第16図に、この文
字群変換認識処理SCHRGの詳細なフローチヤートを示
す。
まず、ステツプ16aで点ではないとされたときには、
次のステツプ16bで、直前に認識された文字が第27図の
(a)部に示すような母音の〔i〕として認識されてい
る時、認済してすでにシステムバツフアに蓄えてある1
文字前の認識済文字コードを、該当する文字コードに置
き換える。
他方、次のステツプ16cでは、SCRGで認識されなかつ
た文字の組み合わせ認識をする。例えば第28図の様な
「?」の文字の場合、文字区切は図中のSP部で認識さ
れ、その文字全部が、第29図の様に、組み合わせて1文
字として認識されるので、ステツプ16cでは、すでに組
み合わせてある特種文字のパターン群と今まで認識した
パターン群とをマツチングさせ、それでも認識されない
時は、ユーザーの特種文字は、画数3の特種文字だと認
識し、SCRGのステツプで認識されたパターンコードを蓄
え、第14図のステツプに戻る。
そして、ステツプ14jで、描かれた文字の画数を調
べ、特殊文字辞書に載つている最大画素よりも多いとき
にはエラーを表示する。また、その前にステツプ14iで
スイツチを調べ、一般文字認識処理スイツチがオンのと
きにはステツプ14lに進のである。
ここで、第4図に戻り、ステツプ4dで文字コードを記
憶した後、ステツプ4jで、ペンアツプカウンタを調べ、
オンであれば、ペンアツプ期間距離検出を行うステツプ
4fに移り、オフであればステツプ4eに移る。
ステツプ4eではペンアツプ検出を行い、ペンアツプで
なければ、ステツプ4bに戻り、再び文字検出を行う。そ
して、ペンアツプが検出されたら、ステツプ4fに進む。
ステツプ4fはペンアツプ期間距離検出の処理PLDであ
り、その詳細を第15図のフローチヤートを用いて説明す
る。
ステツプ15aでペンアツプカウンタを調べ、それがオ
ンでなければ、ステツプ15cでペンアツプカウンタをオ
ンにして、ステツプ15eでペンアツプ離間距離を小にし
て第4図のステツプ4bに移る。
ペンアツプカウンタがオンであれば、ステツプ15b
で、ペンアツプ前に認識してきた文字群の、ステツプ10
gで求めた重心の平均値を求める。次にステツプ15bで求
めた値とペンアツプ後に求めた文字の重心との距離を、
ステツプ15dで求め、その値が一定以上であれば、ペン
アツプ期間距離を「大」に設定して、ステツプ15fに移
り、ペンアツプカウンタをオフにする。
以上の様にして、ペンアツプ離距の大小を求め、小で
あれば、ステツプ4bに戻り、再び文字認識を始める。
従つて、この実施例によれば、タブレツト2aの描画面
2dに1文節を手書きし、その終了により入力ペン2bを描
画面2dから離し、再び文字区切と文字認識を1文字分行
うと、ペンアツプ前の1文節の全部の重心とペンダウン
後の1文字の重心との距離(ペンアツプ期間距離)を求
め、その値が一定以上であれば、ペンアツプ前の1文節
をステツプ4gの英文音声対応処理手段に移し、1文節認
識を行い、一定値以下であればステツプ4bに戻り、続け
て速記文字を認識する動作が得られることになる。
つまり、ペンアツプ期間距離の検出により、1文節単
位に入力し、「認識」のスイツチをオンにするという一
連の動作は不要になり、ユーザーにタブレツトを意識さ
せずに、速記入力を行わせることができる。
次に、第4図の速記英文節変換処理手段EJCN(ステツ
プ4g)について説明する。
このステツプ4gは、今までに文節のコードとして蓄え
てきた速記文字コードを、文節として認識し、正確な文
字に変換して出力する英文節処理変換であり、第30図に
その詳細フローチヤートを示す。
まず、ステツプ30aでは、文節の文字数を計算する。
そして、ステツプ30bの判断により文節の途中にペンア
ツプが有る場合はステツプ30cと30dを実行し、キーワー
ドの探索文字数の最大値をペンアツプの認識された点ま
でとする。
ステツプ30eでは、前方向からと後ろ方向から順々
に、第31図に示す辞書のキーワード(省略する時に使う
文字組み合わせパターン)と比較する。キーワードが見
つかつた時には、ステツプ30gに移り、キーワード辞書
(第31図)により文字の探索を行う。
ステツプ30hでは、前後方向の探索文字数を増やし、
そして以前より1つ文字数の多いキーワードを探す。一
連の操作を、キーワードのMAXまで探し、該当するキー
ワードが見つからなかつた時、もしくは、キーワード辞
書で該当する文節がない時、ステツプ30jで正当な辞書
で頭から探索してゆき、探索された時には、ステツプ30
kで正当な文節の英語に直し、該当する文字がない時
は、ステツプ4dで蓄えてある文字コードを変換せずにそ
のまま返すのである。
従つて、この実施例によれば、速記文字を入力する
と、以上の様な処理が繰り返され、速記文字を認識して
英文に変換されて行くことになり、タブレツトによる英
文速記文字認識が可能となる。
なお、以上の実施例では、英文速記文字の認識に本発
明を適用した例について説明したが、本発明は英文速記
文字に限定されるものではなく、他のヨーロツバ言語の
速記文字を対象として実施してもよいことは言うまでも
ない。
〔発明の効果〕
本発明によれば、欧文速記文字を対象として、その1
文字単位の区切認識が可能なため、入力した文字が即座
に判断でき、その結果、欧文速記文字認識により、欧文
の1文字単位の認識が行え、かつ、ペン離間距離検出に
より、欧文節変換のタイミングを自動判定することがで
きる為、変換指示キー等の操作を必要とする事なく、速
記欧文節変換が行え、さらには速記の省略形パターンの
探索により、より高速な辞書とのマツチング動作が行
え、より容易に高速に、速記文字を認識する事ができ
る。
【図面の簡単な説明】
第1図は本発明の概要を示す機能ブロツク図、第2図は
本発明の一実施例が適用された文字認識装置の説明図、
第3図は座標入力装置の一例を示す説明図、第4図及び
第5図は本発明の一実施例における主処理手段を示すフ
ローチヤート、第6図は座標取得処理GDを示すフローチ
ヤート、第7図はペン状態取得処理PSを示すフローチヤ
ート、第8図は初期化処理INITを示すフローチヤート、
第9図は文字区切検出処理SPDTを示すフローチヤート、
第10図は速記文字認識処理SHCRを示すフローチヤート、
第11図は角度文字認識処理AGRGを示すフローチヤート、
第12図は学習処理STUMを示すフローチヤート、第13図は
近似方向ベクトル系列法による文字認識処理BRGMを示す
フローチヤート、第14図は特殊文字認識処理SCRGを示す
フローチヤート、第15図はペンアツプ離間距離検出処理
PLDのフローチヤート、第16図は文字群変換認識処理SCH
RGを示すフローチヤート、第17図は各種処理で使用され
るメモリの構成図、第18図は文字区切認識の説明図、第
19図は速記文字構成角度の説明図、第20図及び第21図は
角度文字認識の説明図、第22図,第23図それに第24図は
英文速記文字の説明図、第25図は文字の大きさ認識の原
理説明図、第26図は一筆書きされた2文字の速記文字の
一例を示す説明図、第27図,第28図それに第29図は特殊
文字認識の原理説明図、第30図は速記英文節変換処理EJ
CNを示すフローチヤート、第31図はEJCN処理で使用する
辞書の説明図である。 1……コンピユータ装置、2……座標入力装置、2a……
タブレツト、2b……入力ペン、2c……描画面、2d……文
字入力領域、2e〜2f……モード設定領域。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】検出面に対する点接触部分の位置座標を検
    出する手段を備え、上記検出面を描画面として与えられ
    る筆点の軌跡に関するデータを順次取込み、複数の文字
    が一筆書きされている手書き欧文速記文字の各文字ごと
    のデータの区切と、各文節ごとのデータの区切とを識別
    し、文字認識する方式の欧文速記文字認識装置におい
    て、 上記各文字ごとのデータの区切の検出を、上記軌跡のベ
    クトル変化速度と軌跡の同一点回帰、及び軌跡の消失の
    少なくとも一方に基づいて行ない、この文字ごとの区切
    の検出に応じて、予め使用者ごとに記憶してある文字の
    大きさに基づく使用者の学習により文字長の判別に必要
    な境界値を定め、この境界値に基づく所定のパターンマ
    ッチング処理による各文字の認識処理を開始し、 上記各文節ごとのデータの区切の検出を、上記軌跡の消
    失点と再出現点との間の距離に基づいて行ない、この文
    節ごとの区切の検出を契機として文節変換処理を開始す
    るように 構成したことを特徴とする欧文速記文字認識装置。
JP63120479A 1988-05-19 1988-05-19 欧文速記文字認識装置 Expired - Fee Related JP2592097B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63120479A JP2592097B2 (ja) 1988-05-19 1988-05-19 欧文速記文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63120479A JP2592097B2 (ja) 1988-05-19 1988-05-19 欧文速記文字認識装置

Publications (2)

Publication Number Publication Date
JPH01291395A JPH01291395A (ja) 1989-11-22
JP2592097B2 true JP2592097B2 (ja) 1997-03-19

Family

ID=14787193

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63120479A Expired - Fee Related JP2592097B2 (ja) 1988-05-19 1988-05-19 欧文速記文字認識装置

Country Status (1)

Country Link
JP (1) JP2592097B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7128505B2 (en) 2002-08-14 2006-10-31 Fanuc Ltd. Apparatus for preventing chips and/or cutting liquid from being scattered in machine tool

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6464055B2 (ja) * 2015-08-21 2019-02-06 株式会社Nttドコモ 文字処理システム及び文字処理プログラム
JP2018045377A (ja) * 2016-09-13 2018-03-22 株式会社Nttドコモ 文字処理システム及び文字処理プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60170861U (ja) * 1984-04-17 1985-11-12 河原井 敏活 文字入力装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Conference Proceedings IEEE Southeastcon 1988 PP.336−339(1988 April)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7128505B2 (en) 2002-08-14 2006-10-31 Fanuc Ltd. Apparatus for preventing chips and/or cutting liquid from being scattered in machine tool

Also Published As

Publication number Publication date
JPH01291395A (ja) 1989-11-22

Similar Documents

Publication Publication Date Title
EP1564675B1 (en) Apparatus and method for searching for digital ink query
US7706615B2 (en) Information processing method and information processing device
JP5071914B2 (ja) 認識グラフ
US7526128B2 (en) Line extraction in digital ink
EP1743275B1 (en) Apparatus and method for handwriting recognition
US6694056B1 (en) Character input apparatus/method and computer-readable storage medium
US20060062461A1 (en) Chinese character handwriting recognition system
JP2002203208A (ja) オンライン文字認識装置及び方法並びにコンピュータ読み取り可能な記憶媒体及びオンライン文字認識プログラム
KR19990006650A (ko) 온라인 문자 입력 장치 및 문자 입력 방법
US7580573B2 (en) Segmentation-based recognition
JP2592097B2 (ja) 欧文速記文字認識装置
JP2007102369A (ja) ジェスチャ認識装置およびジェスチャ認識方法
Nguyen et al. Semi-incremental recognition of on-line handwritten Japanese text
US7680334B2 (en) Presenting recognised handwritten symbols
JPH063593B2 (ja) 手書き速記文字変換装置
KR100356037B1 (ko) 수기 입력 방식에서 다문자를 인식할 수 있는 장치 및 그방법
JPH07302306A (ja) 文字入力装置
JPH07117993B2 (ja) 手書き文字認識のための特定ユーザ用プロトタイプ集合生成方法
JPH01222390A (ja) 手書き速記文字認識装置
Hsieh et al. A fingertip extraction method and its application to handwritten alphanumeric characters recognition
JP2002259907A (ja) 言語入力
AU2004214901B2 (en) Line extraction in digital ink
JPH06208657A (ja) 文字認識方法及び装置
JPS6215683A (ja) 情報認識装置
KR20040099937A (ko) 터치스크린을 이용한 문자입력장치 및 그 방법

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees