JP3416268B2 - 画像認識装置及びその方法 - Google Patents

画像認識装置及びその方法

Info

Publication number
JP3416268B2
JP3416268B2 JP14942294A JP14942294A JP3416268B2 JP 3416268 B2 JP3416268 B2 JP 3416268B2 JP 14942294 A JP14942294 A JP 14942294A JP 14942294 A JP14942294 A JP 14942294A JP 3416268 B2 JP3416268 B2 JP 3416268B2
Authority
JP
Japan
Prior art keywords
recognition
input
image
similarity
operator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP14942294A
Other languages
English (en)
Other versions
JPH0816723A (ja
Inventor
克彦 阪口
常一 新井
英司 高須
裕人 吉井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP14942294A priority Critical patent/JP3416268B2/ja
Priority to US08/495,102 priority patent/US5781663A/en
Priority to KR1019950018150A priority patent/KR100237281B1/ko
Priority to DE69524677T priority patent/DE69524677D1/de
Priority to EP95304594A priority patent/EP0690407B1/en
Publication of JPH0816723A publication Critical patent/JPH0816723A/ja
Priority to HK98113121A priority patent/HK1012106A1/xx
Application granted granted Critical
Publication of JP3416268B2 publication Critical patent/JP3416268B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば座標指示手段と
してペンとデジタイザを用い、入力軌跡を認識して操作
コマンドや文字入力等を行うための画像認識装置及びそ
の方法に関するものである。
【0002】
【従来の技術】従来、ペン入力の行える電子機器におい
ては、文字入力や単なる軌跡入力の行える入力モードに
おいて、操作コマンドもペンにより入力できるようにし
たジェスチャコマンド(Gesture command)入力を備えた
ものが多い。
【0003】従来、このようなジェスチャコマンドは、
あらかじめコマンドに対応する入力軌跡が決められてお
り、この決められた入力軌跡が認識されれば、対応する
コマンドが動作するように構成されている。また、単な
る軌跡入力と区別したり、文字認識や図形認識との誤認
識を避けるために制限が設けられている。
【0004】例えば、文字入力のモードでは、入力可能
な文字と識別不可能な軌跡入力の形はジェスチャコマン
ドでは使用しないか、逆にジェスチャコマンドで使用す
る入力軌跡と形が似ている文字は文字認識できないよう
になっている。同様に図形認識モードでは、図形でよく
現れる○、△、□などの形は、ジェスチャコマンドでは
使用しないように構成されている。また、コマンドの入
力を行うモードか、コマンド以外の入力を行うモードか
を使用者に明示的に指示させるものもある。
【0005】以上の如く、基本的には、同一入力モード
でジェスチャコマンドと他の入力とが混在しないように
同じ形の軌跡入力が発生しないように制限が付けられて
いる。
【0006】
【発明が解決しようとする課題】しかしながら、上記従
来例のジェスチャコマンドの入力モードを使用者が明示
的に指示するものでは、入力途中でたびたびモードを変
更する場合が生じた場合、スムースな入力が行えず使用
者にとっては、かなり使い難いものとなる。
【0007】また、モードレスの場合に関しては、上述
のごとくジェスチャコマンドで使用する軌跡の形もしく
は文字、図形認識できる形が制限されてしまう。このた
め本来使用者が直感的に分かりやすい形をジェスチャコ
マンドで使用したくても使えなかったり、入力文字に制
限が加えられ簡単に入力できない文字が存在したりす
る。さらに、図形入力モードと文字入力モードで、同じ
意味で使われるコマンドのジェスチャがモードによって
違ったりするので、使用者の混乱を招いている。例え
ば、消去を意味するX形のジェスチャコマンドが、文字
入力が行われない場面では有効なのに、文字入力場面で
はアルファベットのXとして扱われたり、アンドゥ(取
消)を意味するガンマ形のジェスチャコマンドが存在す
る場合には、ギリシャ文字のγが入力不可能とされたり
している。このような例でもわかるように使用者にとっ
て入力場面で使えるジェスチャが違ったりするので、分
かり難く混乱を招く原因となったりしている。
【0008】本発明は上記従来例に鑑みてなされたもの
で、操作者が何を意図して軌跡を入力したか明確にで
き、良く似た形ではあっても異なる軌跡の認識を混乱す
ることなく行える画像認識装置及びその方法を提供する
ことを目的とする。
【0009】
【0010】
【課題を解決するための手段】上記目的を達成するため
に本発明の画像認識装置は次のような構成を備える。す
なわち、座標を入力する座標入力手段と、該座標入力手
段により入力される座標点により形成される入力画像に
対して複数の異なる認識処理を実行し、前記複数の認識
処理それぞれからコードおよびその類似度を出力する認
識手段と、前記複数の認識処理それぞれから出力された
コードのうち、最高類似度との差が所定値以内にある類
似度のコードが存在する場合、前記入力画像が複数通り
の意味を有するコードとして認識されうる多義画像であ
ると判定する判定手段と、該判定手段により多義画像で
あることが判定された場合、前記複数通りの意味のうち
から1つをオペレータに選択させるための選択画面を表
示して、オペレータに選択させる選択手段と、前記判定
手段で使用される前記所定値をオペレータに設定させる
ための設定画面を表示して、オペレータに設定させる設
定手段と、を備えることを特徴とする。
【0011】また、上記目的を達成するために本発明の
画像認識方法は次のような構成を備える。すなわち、座
標入力手段を介して入力された座標点により形成される
入力画像に対して、複数の異なる認識処理を実行し、前
記複数の認識処理それぞれからコードおよびその類似度
を出力する認識工程と、前記複数の認識処理それぞれか
ら出力されたコードのうち、最高類似度との差が所定値
以内にある類似度のコードが存在する場合、前記入力画
像が複数通りの意味を有するコードとして認識されうる
多義画像であると判定する判定工程と、該判定工程によ
り多義画像であることが判定された場合、前記複数通り
の意味のうちから1つをオペレータに選択させるための
選択画面を表示して、オペレータに選択させる選択工程
と、前記判定工程で使用される前記所定値をオペレータ
に設定させるための設定画面を表示して、オペレータに
設定させる設定工程と、を備えることを特徴とする。
【0012】
【0013】
【0014】
【第1実施例】図1は、本発明の特徴を最もよく表わし
た実施例の入力装置の構成を示すものである。図1の構
成は、ペンコンピュータなどのペン入力機器の入力処理
に関するものでありペンから入力されたデータをアプリ
ケーションなど次段の処理に送るために動作するもので
ある。以下図面の説明を行う。
【0015】図中、1はペンでデジタイザに描いた軌跡
データを、認識すべき単位で取りまとめて以降の処理へ
送るための軌跡入力処理をおこなう軌跡入力手段であ
る。2は入力された軌跡データを、文字入力モード,図
形入力モード,コマンド入力モードなどといった入力モ
ードに応じてどの認識を行うか識別し、次段の認識処理
に送る使用認識識別手段である。この使用認識識別手段
2は、使用される認識が複数あるときは複数の認識手段
に入力軌跡データを送るように構成されている。3は送
られた軌跡データ(画像)を、あらかじめ定められたど
の図形に似ているかを認識し、結果として図形の種別を
示す図形コードと、どの程度似ているかを0から100
%であらわす類似度とを以降の処理に送る図形認識手段
である。4は同様に送られた軌跡データから認識される
文字コードと類似度を以降の処理に送る文字認識手段で
ある。5も同様に送られた軌跡データから認識されるコ
マンドの種別を示すジェスチャコードと類似度を以降の
処理に送るジェスチャ認識手段である。これら符号3〜
5の各認識手段で使われる認識アルゴリズムと類似度算
出方法に関しては、近年コンピュータなどで使用されて
いるどの方法でもよく、公知でもある技術なので説明を
省略する。6は、前記複数の認識手段より送られて来た
結果の類似度の比較を行う類似度判定手段である。すな
わち、同一の画像に対して、その画像がいずれかの認識
処理における固有のコードとして認識できず、複数の認
識処理それぞれにおいて意味を持つコードとして認識し
得る多義画像であるかの判定を行う。7は類似入力が考
えられる場合に使用者にどの入力を意図したのかを選択
させる選択画面表示手段、8は認識の結果、あるいは選
択の結果として最終的に決定されたデータを入力する入
力決定手段である。
【0016】図2は選択画面表示手段7によって表示さ
れた選択画面表示の一例であり、(a)は、入力された
軌跡が、ジェスチャコマンドの削除コマンドであるのか
文字のアルファベットXの入力であるのか、類似判定手
段6で区別がつかず、使用者に選択させるために表示さ
れたものである。使用者は、この選択画面表示を見て機
械が入力判定できないことを知り、図2(a)のボタン
A1とボタンA2のどちらかをペンでタップ指示するこ
とで意図を伝えることが可能となる。ボタンBは取消ボ
タンであり、本実施例では、どちらの入力も意図せず入
力自体を無効にしたいとき指示するものであり、この指
示によって入力の軌跡データを消去して入力前の状態の
戻す。ただこれは、認識自体を無効にすることも可能で
あり、図2(b)の様にストロークボタンCを設け、そ
れを押すことによって、入力された軌跡の認識処理のみ
を無効とし、軌跡データは表示しておくだけということ
もできる。例えば、手書きの描画アプリケーションなど
の場合は、認識処理は行わず単なるストローク入力のみ
を行いたい場合もあり得る。その場合には、ストローク
ボタンCを押して本実施例の認識処理だけを無効にし、
軌跡の画像をそのまま本入力装置により入力するデータ
として、入力決定手段8から次段の処理に入力させれば
よい。
【0017】次に、図2の選択表示画面が出力される入
力場面、すなわち文字入力とジェスチャ入力が可能な入
力場面において、“X”形状の軌跡がペンによって入力
されたときの処理の流れを例にとり、図3のフローチャ
ートを用いて説明する。
【0018】図3のフローチャートは、軌跡が入力され
図1軌跡入力手段1で認識対象となるように軌跡がある
程度まとまったときに起動され、図1での符号2〜7の
各手段がどのように処理を行うのかを示している。本実
施例において軌跡入力手段1は、入力された軌跡データ
を、ペンが入力面に接触して次にペンが接触面から離れ
るまでを1ストロークとし、ストロークと次のストロー
クの入力までのペンアップ時間が一定時間過ぎるとそれ
までのストローク群をひとつのシンボル構成データと見
なし、それ以降の処理を起動する。この軌跡データの分
割については、手書き文字認識では文字切りといわれ
る、一文字ごとの構成ストロークを単位とする分割手法
が利用できる。この手法についても数々の手法が論文等
で公知となっている。
【0019】なお、本実施例の入力装置の構成は図10
によっても示される。図10において、デジタイザ90
1から手書き入力された軌跡データは表示パネル903
に表示されると共に、CPU902によって、必要に応
じて文字や図形、コマンドとして認識処理される。CP
U902はRAM904あるいはROM905に格納さ
れたプログラムを実行することで必要な処理を実現す
る。図1に示した各ブロックは、図1の各ブロックなら
びにCPU902による処理により実現される。なお、
図10において、デジタイザ901が透明部材ににより
構成される場合には、表示パネル903上に重ね合わ
せ、入力をトレースするように軌跡を表示する構成とす
れば、入力がより自然に行える。
【0020】図3において、軌跡入力手段1により軌跡
が入力されると、まずステップS1において類似度を格
納する記憶領域r0〜r2をクリアする。次にステップ
S2において使用認識識別手段2を用い、現在アプリケ
ーションでどのような認識が使われるのかをチェックし
て識別フラグfgをセットする。フラグfgは図形認
識,文字認識,ジェスチャ認識のそれぞれについてfg
(0),fg(1),fg(2)が用意されている。本
実施例ではこれらフラグは、アプリケーションがシステ
ムに予めセットしておくように設計されている。アプリ
ケーションもしくはユーティリティ等でペンによる認識
を利用とする場合は、どのような認識を使用するかは、
既知のことであり設計時に決定されるので、本実施例の
ように予めセットすることは可能である。図2の選択表
示画面が出力される場合だと文字認識とジェスチャ認識
とが使用されているので、fg(1),fg(2)が1
にセットされている。ちなみにfg(0)は図形認識が
使用される場合セットされる。
【0021】次にステップS3〜ステップS8に移るわ
けだが、ここでは各フラグfgをチェックし、セットさ
れている認識処理を、前記入力手段より送られたストロ
ーク群を入力として実行し、処理結果であるそれぞれの
認識コードとその認識結果の確度に相当する類似度rと
をセットする。この類似度は完全にマッチできたものを
100とし、まったくマッチできないものを0とし計算
されている。図2の例でいえば、ステップS5,ステッ
プS7でフラグfg(1),fg(2)が1だと判定さ
れ、ステップS6,ステップS8の処理が実行される。
その結果、認識された文字コードcode1 とその類似度r
1、ジェスチャの種別を示すジェスチャコードcode2 と
その類似度r2が設定される。本例では、アルファベッ
トのXとXジェスチャコードがそれぞれcode1 ,code2
に格納され、それぞれの類似度はr1に85、r2に7
0が格納されたものとする。図形認識は行われないか
ら、当然図形の種別を示す図形コードcode0 とその類似
度r0は何も設定されない。よってr0はまったくマッ
チされなかったを意味する0のままである。
【0022】つぎにステップS9へ移りr0,r1,r
2の最大値をmrに格納する。図2の例だと文字コード
に対する類似度r1が最も高く、85という値がmrに
格納される。ステップS10ではこのmrが所定の閾値
を越えているかどうかを判定する。本実施例では、70
という類似度を予めかなり高い類似度として設定した。
得られた最高類似度mrが所定値以上であるある場合、
すなわち一定以上の認識確度がある場合は処理ステップ
S11に進むが、そうでない場合は何も認識できなかっ
たとして何もせずすべての処理を終える。
【0023】処理ステップS11では、更に最も高い類
似度mrに近い値を持つものがあるかどうかをチェック
する。図2の場合だとジェスチャの類似度r2が近いと
判断される。この判定は、最高類似度mrについて所定
値幅以内に他の類似度が存在するかにより行われる。図
3の場合には所定値幅は20である。このように似てい
るものがあると判断された場合は、処理ステップS12
へ進み選択表示画面を出力し使用者が選んだ結果を記憶
領域codeに格納して全ての処理を終える。似たものがな
い場合は、処理ステップS13へ進み最高類似度mrを
得た認識処理により得られたコードをcodeに格納して処
理を終える。
【0024】ここで、ステップS3から、図2(b)の
例で説明する。
【0025】実行されるべき認識は、文字認識とジェス
チャ認識であり、fg(1)=1,fg(2)=1であ
る。そこで、文字認識を行って文字“X”を認識してコ
ードcode1に文字コード“X”を格納し、類似度r1に
値85をセットする(ステップS6)。
【0026】また、ジェスチャ認識を行って削除コマン
ドとして認識し、コードcode2に削除コマンドコードを
格納し、類似度r2に値70をセットする(ステップS
8)。
【0027】次に最高類似度mrとしてr1=85をセ
ットし(ステップS9)、それが70以上かテストする
(ステップS10)。mr=85>70であるので、
(mrー20)=(85ー20)=65以上の類似度を
得た認識処理があるかテストする(ステップS11)。
ジェスチャ認識はr2=70であり、条件を満たすた
め、図2(b)を画面に表示する。オペレータは表示さ
れた画面に従って、文字“X”として認識させたいなら
「文字認識」ボタンを、削除コマンドとして認識させた
いなら「削除コマンド」ボタンを選択する。また、単に
入力したままの線図形として入力したいなら「ストロー
ク」ボタンを選択する。この選択の結果、選択されたコ
ードをcodeに格納してそれを入力するデータとする。た
だし、「ストローク」が選択されたならコードは入力さ
れないことはもちろんである。
【0028】以上の様に動作させることによって同じ入
力場面で使われているコマンド認識(ジェスチャ認
識)、文字認識、図形認識、単なるストロークといった
区別をシステム自体が明確に判別できない場合には、使
用者に選択させることが出来る。よって前記それぞれの
認識は他の認識処理がどのような形を認識できるのかを
意識しなくてもよい。
【0029】なお本実施例で用いた類似度は、認識の確
度を示すようなものであればよく、また値の範囲もどの
ようにしても構わない。それぞれの認識の確度の比較が
大まかに行えれば、本発明の趣旨は実現できるものであ
り、図3のステップS10,ステップS11で用いた値
もそれにあわせて実現すればよい。また、前述認識処理
以外の複数の認識処理を使用する場合にも図3で説明し
た類似度r,認識コードcode,使用認識識別フラグfg
等をそれにあわせて増設すれば容易に実現可能である。
【0030】
【第2実施例】図4は、本発明の第2実施例の特徴を最
もあらわすもので、複数の認識処理の関係を設定するた
めの画面である。本実施例は、基本的には実施例1と同
様の構成をしている。但し実施例1で説明した図3のフ
ローチャートにおける動作処理が若干異なっている。こ
の違いを図4,図5を用いて説明する。
【0031】まず図4中、10は、本実施例1で説明し
た選択表示画面を出す頻度を設定するためのバーであ
る。このバーにおけるボタン101を左に近付ければ、
類似度が近いコードであるとして認識されても、選択表
示場面が余り表示されなくなり、逆に右に近付ければあ
まり似ていなくてもよく表示される。これは、このバー
を動かすことによって図3ステップS11で説明したm
r−20の20に当たる値を変化させるためである。そ
もそもこの20という値は、類似度の範囲を決定してい
たもので実施例1では予め定められた値としたが、本実
施例では図4の10で設定される値を格納した記憶エリ
アから処理実行ごとに読出し使用される。つまり、図4
のバー10の左端を0とし右端を40として、その間の
値がバーの位置によってリニアに設定され、記憶領域r
rとして記憶される。図3ステップS11では、まず記
憶エリアrrより値を読みだし、mr−rrとして実行
する。このように処理を行えば、当然選択表示画面の表
示頻度が使用者の望むように変えることが可能となる。
【0032】次に、図4において、領域11,12,1
3は複数の認識の優先度合を設定する領域である。それ
ぞれの枠のなかに数字を入力することによって複数の認
識の優先度を決定することが可能となっている。例えば
領域11,12,13にそれぞれ100が入力された場
合は、ジェスチャ認識、文字認識、図形認識が同じ優先
度で扱われる。100:70:70の様に入力された場
合は、ジェスチャ認識のみがかなり優先度が高く扱われ
る。これらの値は、認識類似度に乗ずる百分率を意味し
ている。実際の処理では、図3ステップS9の処理前
に、それぞれの認識類似度rにこの百分率を乗ずる。先
の例である100:70:70の場合だと図3のそれぞ
れのrは、r0=r0*0.7,r1=r1*0.7,
r2=r2*1.0となり、結果として図形認識、文字
認識の類似度(認識確度)が下がった事になり、入力さ
れた軌跡はコマンドとして認識されやすくなる。但し、
それでも類似度が似ている場合は、図3の処理と同様に
選択表示画面を出力し、オペレータに選択させる。な
お、図4の画面による入力は、軌跡の入力先だってあら
かじめ行っておくものとする。
【0033】以上の実施例2の処理の流れを図5に示
す。図5の処理は上述したように基本的には図3の処理
と同じで、ステップS8.5とステップS10.5が追
加されただけである。ステップS8.5では、先に述べ
た優先度のコントロールを行うために類似度に演算を行
い、ステップS10.5では、選択表示画面の表示頻度
をコントロールするために記憶エリアrrから設定され
た値を読み出しているだけである。ステップS11が図
3と多少異なるが、これも先に述べたように読み出した
rrを類似度の類似範囲とするためmr−rrとして使
用しているだけである。
【0034】以上のような処理を行えば、同じ入力場面
で使われているコマンド認識(ジェスチャ認識)、文字
認識、図形認識、単なるストロークといった区別をシス
テム自体が明確に判別できない場合には、使用者に選択
させることが出来る。よって前記それぞれの認識は他の
認識処理がどのような形を認識できるのかを意識しなく
てもよいばかりでなく、表示選択画面の表示頻度や複数
の認識の優先度を使用者が自分の好みに合わせて設定す
ることが可能である。
【0035】
【第3実施例】図6は本発明の第3実施例のデータ入力
装置の特徴を最もあらわす構成図である。
【0036】図中、各ブロックは図1とよく似ているが
構成のしかたが違う。本実施例では、ペンコンピュータ
のようにジェスチャ認識がどのような場面でも必ず使用
され、ジェスチャ認識と他の認識処理の混乱を防ぐ事を
実現されている。このような限定があれば、本発明の趣
旨は構成方法にはあまり依存せず実現することが可能で
ある。
【0037】図6のブロック21,22,23,25,
26,27は、それぞれ図1の軌跡入力手段1、使用認
識識別手段2、ジェスチャ認識手段5、選択画面表示手
段7、図形認識手段3、文字認識手段4と同様のもので
ある。類似判定手段24が図1と異なっている。
【0038】図7は、類似判定手段24により使用され
る類似テーブルをあらわす図であり、類似テーブルは類
似判定手段により有される。図中、列aは入力された軌
跡を示し、列bはジェスチャコードが格納され、列cは
図形の種別を識別するコードが格納され、列dには文字
コードが格納されている。但しこの図は説明をし易くす
るために概念的に書いた図であり、それぞれの行中には
実際のコードは記さず形を示した。また入力の軌跡列a
は実際のテーブルには存在しない。
【0039】図8は、実施例3の処理の流れを示した図
であり、ジェスチャ認識手段23から文字認識手段27
までの処理により、結果がでるまでの処理を示してい
る。
【0040】以下、本実施例の動作を図8の流れ図を用
いて説明する。
【0041】まずステップS801でジェスチャ認識を
呼び出し、その認識結果であるジェスチャコードcode2
と認識結果の類似度r2をセットする。次に類似度判定
手段であるステップS802,ステップS803の処理
に移り、先ずステップS802で類似度のチェックを行
う。ここで認識結果の確度である類似度r2が70を越
える場合、すなわちかなり確度が高い場合は、処理ステ
ップS803に移り図7の類似テーブルを検索する。こ
の検索は、図7の列bのジェスチャコードがcode2 と一
致するかどうかを検索することによって行う。例えば入
力が図形701の様になされ、ジェスチャ認識の結果が
コード702である場合は、図7のテーブルによって、
図形にも文字にも対応する認識結果が存在することが判
別できる。よって、これらのコードをそれぞれcode0,c
ode1にセットし、次のステップS804に進む。ステッ
プS804では、ステップS803で検索した結果、類
似形が存在したかどうかで分岐を行い、存在する場合は
ステップS805に移り選択表示画面を出力し、使用者
に意図した入力を選択させそのコードを最終的な認識コ
ードとして全ての処理を終える。この選択画面は図2に
示したものと同じで良い。
【0042】処理ステップS802の分岐で認識確度が
高くないと判断された場合はステップS806へ進み、
ステップS806とステップS808で使用認識フラグ
fgをそれぞれチェックし、図形認識処理を呼び出すス
テップS807、文字認識処理を呼び出すステップS8
09のどちらかの処理を実現し、最終の認識結果コード
を決定し全ての処理を終える。
【0043】以上のような動作により、文字認識、コマ
ンド認識、図形認識といった複数の認識で同様の形を使
用することが可能である。本実施例では、ジェスチャ認
識と他のひとつのみの併用しか考慮されていないが、全
ての認識を動作させる第1実施例の場合よりもかなり高
速な処理が可能である。また、この第3実施例と第1実
施例を併用にすることによって、高速かつ複数の認識の
併用が可能となる。尚、本発明は、複数の機器から構成
されるシステムに適用しても1つの機器から成る装置に
適用しても良い。また、本発明は、システム或は装置に
プログラムを供給することによって達成される場合にも
適用できることはいうまでもない。
【0044】
【発明の効果】以上説明したように、本発明の画像認識
装置及びその方法は、複数の認識が同一場面で使われ、
それぞれの認識で使用するよく似た形が存在する場合で
も、入力された軌跡がどの認識入力か識別困難であって
も使用者が意図した様に認識させることができる。
【0045】また、使用者にとっては、それぞれのモー
ドでどの認識処理に対する入力かを明確に指示できるば
かりでなく、モードによって使用できないジェスチャ
や、文字等が存在しなくなり使用上での混乱を低減でき
ると共に、モードごとに違う形のジェスチャコマンドを
記憶したりする手間を省く効果がある。
【0046】さらに、認識システム提供者側にとって
も、他の認識処理がどのような形を認識し、どのような
形が使用不可能なのか等を考慮する必要がなくなり、ど
のような形も使用することが可能である。
【0047】また、コマンドの入力においては、より直
感的でかつ統一性のあるコマンドを使用することが可能
となる。
【0048】
【図面の簡単な説明】
【図1】本発明の第1実施例の構成を示す構成図であ
る。
【図2】本発明の第1実施例の選択画面表示の例であ
る。
【図3】本発明の第1実施例の動作を示す流れ図であ
る。
【図4】本発明の第2実施例の複数の認識処理関係設定
画面で例の図ある。
【図5】本発明の第2実施例の動作を示す流れ図であ
る。
【図6】本発明の第3実施例の構成を示す構成図であ
る。
【図7】本発明の第3実施例の類似テーブルの一例の図
である。
【図8】本発明の第3実施例の動作を示す流れ図であ
る。
【図9】実施例の入力装置の構成を示すブロック図であ
る。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 吉井 裕人 東京都大田区下丸子3丁目30番2号 キ ヤノン株式会社内 (56)参考文献 特開 平6−111073(JP,A) 特開 平6−119496(JP,A) 特開 平6−208654(JP,A) 特開 平8−6706(JP,A) 特開 平6−149465(JP,A) 特開 昭64−41081(JP,A) 2D−1 知識ベースに基づいた手書 き情報認識,情報処理学会第43回(平成 3年後期)全国大会予稿集,日本,1991 年,pp.2−19〜2−20 (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 座標を入力する座標入力手段と、 該座標入力手段により入力される座標点により形成され
    る入力画像に対して複数の異なる認識処理を実行し、前
    記複数の認識処理それぞれからコードおよびその類似度
    を出力する認識手段と、 前記複数の認識処理それぞれから出力されたコードのう
    ち、最高類似度との差が所定値以内にある類似度のコー
    ドが存在する場合、前記入力画像が複数通りの意味を有
    するコードとして認識されうる多義画像であると判定す
    る判定手段と、 該判定手段により多義画像であることが判定された場
    合、前記複数通りの意味のうちから1つをオペレータに
    選択させるための選択画面を表示して、オペレータに選
    択させる選択手段と、 前記判定手段で使用される前記所定値をオペレータに設
    定させるための設定画面を表示して、オペレータに設定
    させる設定手段と、 を備えることを特徴とする画像認識装置。
  2. 【請求項2】 前記認識手段は、文字認識処理と図形認
    識処理とコマンド認識処理とのうちの少なくとも2つを
    実行し、各認識処理により前記入力画像をコードとして
    認識するとともにそれぞれの認識の結果に対する確から
    しさとして類似度を算出することを特徴とする請求項1
    記載の画像認識装置。
  3. 【請求項3】 前記設定手段は、更に、前記複数の認識
    処理に対する優先度をオペレータに入力させるための画
    面を表示して、オペレータに入力させることを特徴とす
    る請求項1記載の画像認識装置。
  4. 【請求項4】 座標入力手段を介して入力された座標点
    により形成される入力画像に対して、複数の異なる認識
    処理を実行し、前記複数の認識処理それぞれからコード
    およびその類似度を出力する認識工程と、 前記複数の認識処理それぞれから出力されたコードのう
    ち、最高類似度との差が所定値以内にある類似度のコー
    ドが存在する場合、前記入力画像が複数通りの意味を有
    するコードとして認識されうる多義画像であると判定す
    る判定工程と、 該判定工程により多義画像であることが判定された場
    合、前記複数通りの意味のうちから1つをオペレータに
    選択させるための選択画面を表示して、オペレータに選
    択させる選択工程と、 前記判定工程で使用される前記所定値をオペレータに設
    定させるための設定画面を表示して、オペレータに設定
    させる設定工程と、 を備えることを特徴とする画像認識方法。
  5. 【請求項5】 前記認識工程では、文字認識処理と図形
    認識処理とコマンド認識処理とのうちの少なくとも2つ
    を実行し、各認識処理により前記入力画像をコードとし
    て認識するとともにそれぞれの認識の結果に対する確か
    らしさとして類似度を算出することを特徴とする請求項
    4記載の画像認識方法。
  6. 【請求項6】 前記設定工程では、更に、前記複数の認
    識処理に対する優先度をオペレータに入力させるための
    画面を表示して、オペレータに入力させることを特徴と
    する請求項4記載の画像認識方法。
JP14942294A 1994-06-30 1994-06-30 画像認識装置及びその方法 Expired - Fee Related JP3416268B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP14942294A JP3416268B2 (ja) 1994-06-30 1994-06-30 画像認識装置及びその方法
US08/495,102 US5781663A (en) 1994-06-30 1995-06-27 System for recognizing various input data types
KR1019950018150A KR100237281B1 (ko) 1994-06-30 1995-06-29 이미지 인식 장치 및 방법
DE69524677T DE69524677D1 (de) 1994-06-30 1995-06-29 Gerät und Verfahren zur Bilderkennung
EP95304594A EP0690407B1 (en) 1994-06-30 1995-06-29 Image recognition apparatus and method
HK98113121A HK1012106A1 (en) 1994-06-30 1998-12-10 Image recognition apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14942294A JP3416268B2 (ja) 1994-06-30 1994-06-30 画像認識装置及びその方法

Publications (2)

Publication Number Publication Date
JPH0816723A JPH0816723A (ja) 1996-01-19
JP3416268B2 true JP3416268B2 (ja) 2003-06-16

Family

ID=15474771

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14942294A Expired - Fee Related JP3416268B2 (ja) 1994-06-30 1994-06-30 画像認識装置及びその方法

Country Status (6)

Country Link
US (1) US5781663A (ja)
EP (1) EP0690407B1 (ja)
JP (1) JP3416268B2 (ja)
KR (1) KR100237281B1 (ja)
DE (1) DE69524677D1 (ja)
HK (1) HK1012106A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8644612B2 (en) 2008-12-26 2014-02-04 Canon Kabushiki Kaisha Information processing apparatus and locus data recognition method

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3839877B2 (ja) * 1996-07-05 2006-11-01 キヤノン株式会社 手書きパターン処理装置及び手書きパターン処理方法
IL119498A (en) * 1996-10-27 2003-02-12 Advanced Recognition Tech Application launching system
US5889888A (en) * 1996-12-05 1999-03-30 3Com Corporation Method and apparatus for immediate response handwriting recognition system that handles multiple character sets
IL119955A0 (en) 1997-01-01 1997-04-15 Advanced Recognition Tech An instruction and/or identification input unit
US6304674B1 (en) * 1998-08-03 2001-10-16 Xerox Corporation System and method for recognizing user-specified pen-based gestures using hidden markov models
JP2001160067A (ja) * 1999-09-22 2001-06-12 Ddi Corp 類似文書検索方法および該類似文書検索方法を利用した推薦記事通知サービスシステム
US7006247B1 (en) * 2000-05-02 2006-02-28 Fuji Xerox Co., Ltd. Image processing apparatus
US20020141643A1 (en) * 2001-02-15 2002-10-03 Denny Jaeger Method for creating and operating control systems
US20020186885A1 (en) * 2001-06-12 2002-12-12 Aviad Zlotnick Verifying results of automatic image recognition
US6868383B1 (en) * 2001-07-12 2005-03-15 At&T Corp. Systems and methods for extracting meaning from multimodal inputs using finite-state devices
JP2003162687A (ja) * 2001-11-28 2003-06-06 Toshiba Corp 手書き文字入力装置、手書き文字認識プログラム
KR20040083788A (ko) * 2003-03-25 2004-10-06 삼성전자주식회사 제스쳐 커맨드를 이용하여 프로그램을 구동시킬 수 있는휴대용 단말기 및 이를 이용한 프로그램 구동 방법
US7379562B2 (en) 2004-03-31 2008-05-27 Microsoft Corporation Determining connectedness and offset of 3D objects relative to an interactive surface
US7394459B2 (en) 2004-04-29 2008-07-01 Microsoft Corporation Interaction between objects and a virtual environment display
US7787706B2 (en) 2004-06-14 2010-08-31 Microsoft Corporation Method for controlling an intensity of an infrared source used to detect objects adjacent to an interactive display surface
US7593593B2 (en) 2004-06-16 2009-09-22 Microsoft Corporation Method and system for reducing effects of undesired signals in an infrared imaging system
US7519223B2 (en) * 2004-06-28 2009-04-14 Microsoft Corporation Recognizing gestures and using gestures for interacting with software applications
US7576725B2 (en) 2004-10-19 2009-08-18 Microsoft Corporation Using clear-coded, see-through objects to manipulate virtual objects
US7499027B2 (en) 2005-04-29 2009-03-03 Microsoft Corporation Using a light pointer for input on an interactive display surface
US8760389B2 (en) * 2005-06-24 2014-06-24 Nokia Corporation Handwriting recognition in electronic devices
US7525538B2 (en) 2005-06-28 2009-04-28 Microsoft Corporation Using same optics to image, illuminate, and project
US7911444B2 (en) 2005-08-31 2011-03-22 Microsoft Corporation Input method for surface of interactive display
US8060840B2 (en) 2005-12-29 2011-11-15 Microsoft Corporation Orientation free user interface
US7515143B2 (en) 2006-02-28 2009-04-07 Microsoft Corporation Uniform illumination of interactive display panel
KR100765264B1 (ko) * 2006-08-04 2007-10-09 삼성전자주식회사 디스플레이장치 및 그 제어방법
US8212857B2 (en) 2007-01-26 2012-07-03 Microsoft Corporation Alternating light sources to reduce specular reflection
US8315482B2 (en) * 2007-06-26 2012-11-20 Microsoft Corporation Integrated platform for user input of digital ink
JP2009110092A (ja) * 2007-10-26 2009-05-21 Alps Electric Co Ltd 入力処理装置
US20090278848A1 (en) * 2008-05-12 2009-11-12 Microsoft Corporation Drawing familiar graphs while system determines suitable form
JP2010015238A (ja) * 2008-07-01 2010-01-21 Sony Corp 情報処理装置、及び補助情報の表示方法
WO2010011923A1 (en) * 2008-07-24 2010-01-28 Gesturetek, Inc. Enhanced detection of circular engagement gesture
US8605941B2 (en) * 2008-07-25 2013-12-10 Qualcomm Incorporated Enhanced detection of gesture
US9335909B2 (en) * 2009-06-03 2016-05-10 Honda Motor Co., Ltd. Drawing assist device, drawing assist program, and drawing assist method
US8423916B2 (en) * 2008-11-20 2013-04-16 Canon Kabushiki Kaisha Information processing apparatus, processing method thereof, and computer-readable storage medium
JP5178484B2 (ja) * 2008-12-08 2013-04-10 キヤノン株式会社 情報処理装置及び情報処理方法
WO2010087796A1 (en) 2009-01-30 2010-08-05 Thomson Licensing Method for controlling and requesting information from displaying multimedia
KR101576460B1 (ko) * 2009-06-18 2015-12-10 엘지전자 주식회사 데이터 출력 방법 및 그 장치
JP5538967B2 (ja) 2009-06-18 2014-07-02 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
US9563350B2 (en) * 2009-08-11 2017-02-07 Lg Electronics Inc. Mobile terminal and method for controlling the same
US20130120280A1 (en) * 2010-05-28 2013-05-16 Tim Kukulski System and Method for Evaluating Interoperability of Gesture Recognizers
JP5675214B2 (ja) 2010-08-18 2015-02-25 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
US8768944B2 (en) 2010-08-18 2014-07-01 Canon Kabushiki Kaisha Information processing apparatus, information processing method, and storage medium
JP5719145B2 (ja) 2010-11-02 2015-05-13 キヤノン株式会社 情報処理装置、その処理方法及びプログラム
WO2012068544A2 (en) 2010-11-20 2012-05-24 Kushler Clifford A Performing actions on a computing device using a contextual keyboard
US9286477B2 (en) * 2012-08-29 2016-03-15 Symantec Corporation Secure app ecosystem with key and data exchange according to enterprise information control policy
US10228775B2 (en) * 2016-01-22 2019-03-12 Microsoft Technology Licensing, Llc Cross application digital ink repository
DE102016201845A1 (de) * 2016-02-08 2017-08-10 Volkswagen Aktiengesellschaft Verfahren und System zum Erfassen einer Eingabe für eine Einrichtung

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0650538B2 (ja) * 1984-03-28 1994-06-29 株式会社日立製作所 手書き文字・図形認識の認識モード指定方法
US4764972A (en) * 1985-05-23 1988-08-16 Nec Corporation Continuous characters recognition system
JPH07107708B2 (ja) * 1986-09-26 1995-11-15 株式会社日立製作所 パタ−ン認識方法
JP2685450B2 (ja) * 1987-08-06 1997-12-03 日本電信電話株式会社 オンライン手書き文字図形入力編集方法
US5022081A (en) * 1987-10-01 1991-06-04 Sharp Kabushiki Kaisha Information recognition system
JP2865210B2 (ja) * 1989-12-04 1999-03-08 ソニー株式会社 文字認識装置
JP2925359B2 (ja) * 1991-06-19 1999-07-28 キヤノン株式会社 文字処理方法及び装置
US5592566A (en) * 1992-05-27 1997-01-07 Apple Computer, Incorporated Method and apparatus for computerized recognition
US5502774A (en) * 1992-06-09 1996-03-26 International Business Machines Corporation Automatic recognition of a consistent message using multiple complimentary sources of information
JPH06111073A (ja) * 1992-09-25 1994-04-22 Sanyo Electric Co Ltd 手書き情報認識装置
JP3213403B2 (ja) * 1992-10-07 2001-10-02 三洋電機株式会社 手書き情報処理装置および手書き情報処理方法
JPH06149465A (ja) * 1992-11-02 1994-05-27 Sharp Corp 手書き入力装置
US5583543A (en) * 1992-11-05 1996-12-10 Sharp Kabushiki Kaisha Pen input processing apparatus
US5448475A (en) * 1992-11-18 1995-09-05 Sharp Kabushiki Kaisha Word processing apparatus with handwriting input function
JPH06208654A (ja) * 1993-01-08 1994-07-26 Hitachi Software Eng Co Ltd ペン入力図形編集システム
US5566248A (en) * 1993-05-10 1996-10-15 Apple Computer, Inc. Method and apparatus for a recognition editor and routine interface for a computer system
JP3486459B2 (ja) * 1994-06-21 2004-01-13 キヤノン株式会社 電子情報機器及びその制御方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
2D−1 知識ベースに基づいた手書き情報認識,情報処理学会第43回(平成3年後期)全国大会予稿集,日本,1991年,pp.2−19〜2−20

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8644612B2 (en) 2008-12-26 2014-02-04 Canon Kabushiki Kaisha Information processing apparatus and locus data recognition method

Also Published As

Publication number Publication date
EP0690407B1 (en) 2001-12-19
JPH0816723A (ja) 1996-01-19
US5781663A (en) 1998-07-14
HK1012106A1 (en) 1999-07-23
KR100237281B1 (ko) 2000-01-15
DE69524677D1 (de) 2002-01-31
KR960002079A (ko) 1996-01-26
EP0690407A3 (en) 1996-08-28
EP0690407A2 (en) 1996-01-03

Similar Documents

Publication Publication Date Title
JP3416268B2 (ja) 画像認識装置及びその方法
US6107994A (en) Character input method and apparatus arrangement
JP3535624B2 (ja) 検索装置及び方法
US5481278A (en) Information processing apparatus
US20090090567A1 (en) Gesture determination apparatus and method
JPH0772970A (ja) 情報選択装置及び情報選択方法
US10416868B2 (en) Method and system for character insertion in a character string
JPH06242885A (ja) 文書編集方法
JPH09231393A (ja) 命令入力装置
JPH1020995A (ja) 手書き文字認識装置及び方法
JPH08305821A (ja) データ処理方法とその装置
US6342894B1 (en) Icon display method
JP2005251222A (ja) 手書き入力装置、手書き入力プログラム、および、プログラム記録媒体
JPH0721007A (ja) 情報処理装置及びメニュー選択方式
EP0519713A2 (en) Character input method and apparatus
JPH06187089A (ja) スクロール制御方法
CN112740151A (zh) 一种终端设备的数据输入方法、终端设备及存储介质
JP3526479B2 (ja) オンライン手書き文字入力方法及び装置
JP2001147751A (ja) 情報端末及びその制御方法
JPH08190603A (ja) 文字認識装置及びその候補文字表示方法
JPH10162101A (ja) 手書き文字認識装置および手書き文字認識方法
JP2660795B2 (ja) 手書き入力編集方法
CN113050845A (zh) 一种处理方法和处理装置
JPH10254675A (ja) データ入力方法とその方法を用いたデータ入力装置
JPH09230991A (ja) 情報処理装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030317

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090404

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090404

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100404

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110404

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130404

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130404

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140404

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees