JPH075977A - 複合形態による対象物指示方法 - Google Patents

複合形態による対象物指示方法

Info

Publication number
JPH075977A
JPH075977A JP14507193A JP14507193A JPH075977A JP H075977 A JPH075977 A JP H075977A JP 14507193 A JP14507193 A JP 14507193A JP 14507193 A JP14507193 A JP 14507193A JP H075977 A JPH075977 A JP H075977A
Authority
JP
Japan
Prior art keywords
pointing
display
instruction
voice
positional relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP14507193A
Other languages
English (en)
Other versions
JP3170103B2 (ja
Inventor
Haru Andou
ハル 安藤
Yoshinori Kitahara
義典 北原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP14507193A priority Critical patent/JP3170103B2/ja
Publication of JPH075977A publication Critical patent/JPH075977A/ja
Application granted granted Critical
Publication of JP3170103B2 publication Critical patent/JP3170103B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)

Abstract

(57)【要約】 【構成】表示装置の画面上に表示された複数の表示物の
一つを対象物として指示する際、指もしくはペンによる
ポインティング指示と音声による指示とを併用する、複
合形態による対象物指示方法であって、前記複数の表示
物の相互の位置関係を求め、該位置関係を表わす表示物
知識テーブルを作成しておき、前記位置関係を含む音声
による表示物の指示に対する音声認識結果を前記表示物
知識テーブルの内容に照らして、該音声が指示する対象
物候補を求め、前記ポインティング指示に基づく位置情
報を求め、該ポインティング指示に基づく位置情報と前
記対象物候補とに基づき対象物を特定するようにした。 【効果】 ユーザが、音声とポインティングジェスチャ
を用いて対象物を指示するにあたり、音声認識誤りを減
少させ、ユーザが、入力方法を意識することが無くな
り、自然で使いやすい対話システムを構成することがで
きる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、パーソナルコンピュー
タ(パソコン)、ワークステーション、ワードプロセッ
サ(ワープロ)等のOA機器に搭載された図形編集シス
テム等のユーザインタフェースに関し、特に、ユーザに
とって使い勝手のよい、複合形態による対象物指示方法
に関する。
【0002】
【従来の技術】従来の対象物指示方法では、北原他「音
声入力による情報検索システムにおける口語文受理方法
の検討」(日本音響学会春季講演論文集 3−5−7
1991.3)等に見られるように、音声のみを用いて
対象物を指示するものや、対象物の表示範囲内をマウス
等のポインティングデバイスの指示(マウスイベント)
によって対象物を認識するものが知られている。
【0003】また、図形を指示する場合、B.A.Bolt “P
ut that there"(Computer Graphics, 14,3,1980)pp2
62−270に開示されているように、ジェスチャーを
伴う指示代名詞の発声で指示する他、図形編集を行う前
に、予め画面上に描かれている物体に名前をつけてお
き、以後この名前を使用するといった方法があった。
【0004】
【発明が解決しようとする課題】上記の従来技術では、
画面上に指示すべき対象物または物体が離散して存在す
る場合には、画面上の対象物を指やポインティングデバ
イスで指示しながら、「これ」あるいは「この四角形」とい
うような発声指示を行うことは、対象物を特定するのに
十分である。しかし、画面上の対象物が相互に近接し、
あるいは重なりあっているような場合、指等で対象物を
一意に特定するのは困難な場合があり、その指示をより
複雑な音声指示で補う必要が生じることが考えられる。
一方、より複雑な音声指示は誤認識の可能性が高くなる
という問題がある。
【0005】本発明の目的は、ユーザが、メディアの利
用形態を意識せずに、自然に情報入力出来る様にし、さ
らに音声認識において大きな課題である誤認識を複数の
入力モードを利用することにより減少させ、図形編集、
画像編集等において、ユーザにとって自然で使い勝手の
よい対象物指示方法を提供することにある。
【0006】
【課題を解決するための手段】上記の問題を解決するた
めに、本発明による複合形態による対象物指示方法は、
表示装置の画面上に表示された複数の表示物の一つを対
象物として指示する際、指もしくはペンによるポインテ
ィング指示と音声による指示とを併用する、複合形態に
よる対象物指示方法であって、前記複数の表示物の相互
の位置関係を求め、該位置関係を表わす表示物知識テー
ブルを作成しておき、前記位置関係を含む音声による表
示物の指示に対する音声認識結果を前記表示物知識テー
ブルの内容に照らして、該音声が指示する対象物候補を
求め、前記ポインティング指示に基づく位置情報を求
め、該ポインティング指示に基づく位置情報と前記対象
物候補とに基づき対象物を特定するようにしたものであ
る。
【0007】また、本発明による複合形態入力装置は、
情報を表示する情報表示手段と、該情報表示手段の表示
画面上で指もしくはペンを用いて画面上の位置を指示す
るポインティング手段と、音声による指示を認識する音
声認識手段とを備え、ポインティング指示と音声による
指示とを併用して前記表示画面上の複数の表示物の一つ
を対象物として指示する複合形態入力装置であって、少
なくとも前記表示画面上に表示された複数の表示物の名
称を表わす単語および該複数の表示物の相互の位置関係
を表わす単語を含む単語辞書を格納する手段と、前記複
数の表示物の相互の位置関係を求める手段と、該位置関
係を表わす表示物知識テーブルを格納する手段と、前記
ポインティング指示に基づく位置情報を求める手段と、
前記音声認識手段により認識された表示物の名称および
位置関係を前記表示物知識テーブルに照らして、対象物
候補を求めると共に、前記位置情報に照らして該対象物
候補から対象物を特定する対象物特定手段とを備えたも
のである。
【0008】
【作用】画面に表示されている複数の表示物の相互の位
置関係を記憶している知識テーブルを具備し、ユーザ
が、音声やポインティングジェスチャにより対象物を指
示すると、音声情報とポインティングジェスチャが取り
込まれる。音声入力に対しては、音声認識の手法として
例えば音声情報の形態素解析及び構文解析が行われ、該
解析結果により対象物の図形の名称および他の図形との
位置関係が抽出される。この音声認識結果と図形知識テ
ーブルとの照合により、対象物候補がしぼられる。さら
に、ポインティングジェスチャによって入力された位置
座標に照らして対象物候補群中から対象物が一意に特定
される。
【0009】また、音声情報解析手段において算出され
た尤度が大きい対象物候補であっても、音声認識誤りの
可能性があり、このような場合にはポインティングジェ
スチャにより指示された範囲に照らしてその対象物候補
が除外されるので、音声認識誤りによる対象物認識誤り
を防止することができる。
【0010】また、1回の操作によって対象物候補が複
数個認識され、さらに対象物をしぼり込む必要がある場
合には、対象物候補拡大手段によりそれら対象物候補が
位置関係を保って拡大表示され、ユーザが、音声、ポイ
ンティングジェスチャ等を再度入力することにより、候
補をしぼることが可能になる。
【0011】
【実施例】以下、本発明の実施例を図面を用いて詳細に
説明する。
【0012】図1は、本発明の一実施例を示すブロック
図である。ここでは、図形編集システムを想定して説明
を行なう。ただし、本発明は、該システムに限らず、C
ADシステム等、画像処理システム一般への応用が可能
である。
【0013】図1のシステムは、情報処理装置1、主記
憶装置2、タッチパネル5、このタッチパネル5の制御
装置3、ディスプレイ4、このディスプレイ4を制御す
る表示制御装置6、マイク8、このマイク8の入力信号
をデジタル信号に変換するA/D変換装置7、および各
種プログラムおよびデータを格納する外部記憶装置とし
てのディスク9からなる。
【0014】ディスク9上のシステムプログラム11、
図形編集プログラム12、音響認識プログラム13、ポ
インティング座標読み込みプログラム14、対象物指示
プログラム15、音響標準パタンデータ16、単語辞書
17および表示物知識テーブル作成プログラム18は、
システム立ち上げ時に、主記憶装置2にロードされる。
【0015】音響認識プログラム13は、図5に示すよ
うに、音声入力プログラム131、特徴抽出プログラム
132より構成される。
【0016】対象物指示プログラム15は、図10に示
すように、ポインティング領域認識プログラム151、
辞書マッチングプログラム152、及び対象物候補拡大
プログラム153から構成されている。
【0017】辞書マッチングプログラム152の起動時
に用いられる単語辞書17は、図11に示す様に、単語
番号111と、各単語番号のスロットに属する互いに意
味の近い類義語の代表単語112、及び類義語113よ
りなる。例えば、「円」、「まる」という類義語には代
表単語が「円」とされ、「内側」、「内」、「中」「中
側」という類義語には代表単語が「内側」とされてい
る。単語番号111は、後述する表示物知識テーブル
(図11)に定める表示物の相互の位置関係を表わす単
語(例えば、内側、外側)については、表示物知識テー
ブルに格納する関係説明番号と同じにしてある。
【0018】図19に、本実施例に処理で用いられる主
記憶装置2上の各種バッファメモリを示す。これらの各
バッファメモリについては、それぞれ利用される処理の
中で言及する。
【0019】図2は、主記憶装置2にロードされた図形
編集プログラム12を通じてディスプレイ4に表示され
た図形編集画面の一例である。本例では、画面の大きさ
は、横幅1000、縦幅700としている。同図におい
ては、図形編集プログラム12によって主記憶装置2に
記憶された円描画テーブル、長方形描画テーブル、及び
三角形描画テーブルに基づいて、円7個、長方形1個、
及び三角形1個が、グラフィックモードで描かれてい
る。
【0020】図3に示すように、円描画テーブルTB1
は、テーブル番号E=801、円番号100、中心x座
標101、中心y座標102、半径103及び色番号1
04より構成され、長方形描画テーブルTB3は、テー
ブル番号E=802、長方形番号200、左上頂点のx
座標201、y座標202、縦長203、横長204及
び色番号205より構成される。また、三角形描画テー
ブルTB3は、テーブル番号E=803、三角形番号3
00、頂点座標1のx座標3011、頂点座標1のy座
標3012、頂点座標2のx座標3021、頂点座標2
のy座標3022、頂点座標3のx座標3031、頂点
座標3のy座標3032及び色番号304より構成され
る。色番号については、図形の色が白の場合は“100
1”、黒の場合は“1002”、赤の場合には“100
3”というように記憶される。同図の円描画テーブルT
B1の例では、円番号C1として中心(280、34
0)、半径50、色が白の円、円番号C2として中心
(390、230)、半径50、色が黒の円、円番号C
3として中心(390、340)、半径20、色が白の
円、円番号C4として中心(390、340)、半径1
0、色が白の円、円番号C5として中心(530、27
0)、半径40、色が白の円、円番号C6として中心
(530、270)、半径60、色が白の円の円がそれ
ぞれ描画されている。長方形描画テーブルTB2の例で
は、長方形番号R1として左上頂点の座標が(140、
460)、縦長120、横長250、色が白である長方
形が描画されている。同様に、三角形描画テーブルTB
3の例では、三角形番号T1として、頂点座標(62
0、520)、(550、660)、(680、63
0)、色が白である三角形が描画されている。なお、画
面上のXY座標は、画面の左上を原点とする。
【0021】この時、描画テーブルに描かれている円の
個数、長方形の個数、及び三角形の個数が、主記憶装置
2上のバッファメモリF1、F2及びF3に格納されて
いるものとする。すなわち、前記の例では、F1に
“6”、F2に“1”、F3に“1”が格納されてい
る。また、F1+F2+F3の値を主記憶装置2上のバ
ッファメモリWに格納する。本実施例の場合は、W=8
となる。さらに、画面表示物全体の通し番号は、円、長
方形、三角形の順に1からWとつけられる。例えば、通
し番号=1の図形は、円番号“C1”の図形、通し番号
=7の図形は、長方形番号“R1”の図形となる。
【0022】また、主記憶装置2上に表示物間の位置関
係を記憶した表示物知識テーブルを設ける。この表示物
知識テーブルは、例えば図4のテーブルNTに示す様
に、任意の2個の図形A,B間の位置関係を、次のよう
に関係説明番号を用いて定義する。すなわち、図形Aが
図形Bの右側にある場合は“6050”、左側にある場
合は“6040”、図形Aが図形Bと交差している場合
は“7040”、図形Aが図形Bに内含されている場合
は“8042”(被内含)、図形Aが図形Bを内含して
いる場合は“8041”(内含)とする。図形Aと図形
Bとの関係説明番号は、図では1個のみを示している
が、複数の関係説明番号を用いる場合もある。例えば、
右側かつ交差というような場合には、“6050”およ
び“7040”の2つの関係説明番号が格納される。こ
の表示物知識テーブルNTは、表示物間の位置関係だけ
でなく、表示物の属性、例えば、自動車⊃窓(自動車の
窓)の関係等を記憶することも可能である。
【0023】図18に、表示物知識テーブル作成プログ
ラムの処理フローを示す。この処理は、画面上で図形が
入力作成されたときに実行される。
【0024】まず、個々の図形のすべての輪郭点の座標
値のX座標の最大値Xmx1および最小値Xmn1を抽
出し(s181)、次に、Xmn1<Xb<Xmx1の
範囲にあるXbを座標値として持つ臨界点を抽出し、さ
らにその最小値Ymn1(Xb)および最大値Ymx1
(Xb)を求める(s182)。そこで、表示されてい
る図形の全ての組み合わせについて、個々の図形のXm
n1<Xb<Xmx1、Ymn1(Xb)<Yb<Ym
x1(Xb)の範囲について、2つの図形の共通座標の
有無を考慮して包含関係(交差関係も含む)を判断する
(s183)。さらに、個々の図形のX最大値と最小値
の平均値XniおよびY最大値と最小値の平均値Yni
を算出し(s184)、表示されている図形のすべてに
ついて(Xni,Yni)の比較を行い、相互の位置関
係を抽出する(s185)。このようにして得られた結
果は、図4の表示図形知識テーブルNTに格納される。
【0025】なお、図18の処理は、一度にすべての図
形について処理するようにしたが、新たな図形が追加さ
れるごとに、その追加図形について既存の図形との位置
関係を求めるようにすることも可能である。
【0026】図14に、図形編集プログラム12起動後
の処理の流れを示す。
【0027】ユーザは、画面上の表示物のうちから対象
物を1つ指示するものとする。まず、情報処理装置1
は、主記憶装置2上の音響認識プログラム13を起動し
(s301)、さらにポインティング座標読み込みプロ
グラム14を起動する(s302)。音響認識プログラ
ム13が起動されると、最初に、音声入力プログラム1
31(図5)が起動される。ユーザは、タッチパネル5
上で、指或いはペン等によって対象物を指示したり(図
6)、マイク4を用いて音声のみ(発声例“長方形”)
によって対象物を指示したりする(図7)(s30
3)。指等によるポインティング入力あるいは音声入力
のみの指示で不十分な場合は、タッチパネル5上で対象
物を指示しながら同時にマイク4を用いて音声(“内側
の円”)で該対象物を指示する(図8)。音声入力が行
われた場合には、“1”が主記憶装置2上の音声入力識
別バッファメモリAに書き込まれる。また、音声入力が
行われなかった場合には、“0”が当該バッファメモリ
Aに書き込まれる。ポインティングが入力された場合に
は、“1”が主記憶装置2上のポインティング入力識別
バッファメモリBに書き込まれる。また、ポインティン
グが入力されなかった場合には、“0”が主記憶装置2
上のバッファメモリBに書き込まれる。
【0028】まず、図8の様な、音声入力とポインティ
ング入力の2つが同時に行われた場合について述べる。
この場合、ユーザの音声が入力されると(s101)、
音声入力プログラム131によって、この音声信号がA
/D変換装置7に取り込まれ、ディジタル信号に変換さ
れた後(s102)、主記憶装置2に送られる。続い
て、特徴抽出プログラム132(図5)が起動され、該
ディジタル信号を、10msのフレーム周期で、特徴ベ
クトルとして、例えば、斉藤、中田「音声情報処理の基
礎」(オーム社、昭56)記載のLPCケプストラム係
数の時系列に変換する(s103)。ここで、フレーム
周期は10msに限定されることなく、20ms、30
ms等任意に設定することができる。また、特徴ベクト
ルも、LPCケプストラム係数のみに限定されず、バン
ドパスフィルタの出力等を使用することも可能である。
【0029】一方、主記憶装置2上のポインティング座
標読み込みプログラム14は、音響認識プログラム13
が起動されるのと同時に、情報処理装置1によって起動
され(s302)、並列処理が行なわれる。このポイン
ティング座標読み込みプログラム14起動後の処理の流
れの一例を図13により説明する。
【0030】まず、主記憶装置2上のバッファメモリP
及びQをゼロリセットする(s201、s202)。該
プログラムは、ユーザの指先或いはペン等がタッチパネ
ル5に触れている間(s203)、一定時間間隔で接触
座標をパネル制御装置3を通じて取り込み(s20
4)、座標を取り込む毎にPをインクリメントし、さら
に主記憶装置2のポインティング領域テーブルとして、
取り込んだx座標を配列メモリX[P]へ、y座標を配
列メモリY[P]へ、座標入力時刻を配列メモリT
[P]へ書き込む(s205)。ポインティング領域テ
ーブルは、図9のテーブルPTに示すように、座標番号
200、入力時刻201、x座標202、y座標203
より構成されており、一定時間毎に、入力時刻、x座標
及びy座標データが、入力された順序で座標番号“1”
から格納されていく。前記例では、100ms毎に座標
データを記憶している。また指先或いはペン等が、タッ
チパネル5から離れてからある一定時間Toが経過する
と書き込みを終了する(s203)。
【0031】図14に戻り、ユーザによるポインティン
グ入力や音声入力が終了すると、主記憶装置2上の対象
物指示プログラム15(図10)が起動される(s30
4)。まず始めに、バッファメモリAの値を確認し(s
305)、バッファメモリAが“1”の場合(すなわち
音声入力が行われた場合)には、まず辞書マッチングプ
ログラム152が起動され(s306)、続いてバッフ
ァメモリBの値を確認し(s307)、バッファメモリ
Bが“1”の場合(ポインティング入力が行われた場
合)には、ポインティング領域認識プログラム151が
起動される(s308)。バッファメモリAが“0”の
場合(音声入力が行われなかった場合)には、ポインテ
ィング領域認識プログラム151が即起動される(s3
11)。
【0032】前記図8の例においては、バッファメモリ
Aが“1”、バッファメモリBが“1”であるため、ポ
インティング領域認識プログラム151および辞書マッ
チングプログラム152が共に起動される。
【0033】図16により辞書マッチングプログラム1
52の処理を説明する。先程求められた特徴ベクトルと
音響標準パタンデータ16とのマッチングが行われる
(s161)。これは、例えば、前述した北原他「音声
入力による情報検索システムにおける口語文受理方法の
検討」(日本音響学会、3−5−7、平3)に記載の方
法で行われ、その結果、入力音声は文字列に変換され
る。前記の例をとれば、この文字列は“うちがわのえ
ん”となる。さらに、前記文字列は、従来から行われて
いる方法、例えば、相沢他「計算機によるカナ漢字変
換」(NHK技術研究、25、5、昭48)に記載され
ているような最長一致法を用いて形態素解析され(s1
62)、さらに単語辞書17(図11)とのマッチング
が行われ、個々の単語は代表単語に集約され、単語番号
を与えられた結果、音声認識結果の尤度の最大値として
(「内側」、名詞、8042)、(「の」、格助詞、9
00)、(「円」、名詞、701)の様な形態素情報が
得られる。次に、主記憶装置2上に表示物間の位置関係
を記憶した表示図形知識テーブルNT(図4)の円のコ
ラム(図形Aの一つの縦の欄)にある関係説明番号と、
(「内側」、名詞、8042)内の単語番号、すなわち
“8042”とがマッチングされ(s163)、対象物
候補群が抽出される(s164)。本例では、円描画テ
ーブル中の円番号“C4”、円番号“C5”が抽出され
る。また、対象物候補数を主記憶装置2上のバッファメ
モリGに格納する。本実施例では、G=2となる。
【0034】次に、図15によりポインティング領域認
識プログラム151の処理を説明する。主記憶装置2上
のX[1]からX[P]に格納されているX座標値のう
ちの最小値XMnと最大値XMxと、Y[1]からY
[P]に格納されているY座標値の内の最小値YMnと
最大値YMxを算出し(s151)、XMn、XMxの
平均値とYMn、YMxの平均値が示す座標(Xnt,
Ynt)を求める(s152)。次に、座標(Xnt,
Ynt)と対象物候補群中の個々の対象物候補との距離
lgを順次計算し(s153)、最も距離が短かった対
象物候補を一意に対象物と特定する(s154)。
【0035】図14に戻り、図15のポインティング領
域認識プログラム151の処理により対象物候補群中に
(Xnt,Ynt)から等距離にある対象物候補が複数
個得られた場合には(s309)、対象物候補拡大プロ
グラム153が起動され(s310)、該候補図形群が
位置関係を保って拡大され、再度、音声やポインティン
グによって対象物指示を行う(s303)ことにより、
それら複数個のうちから対象物をしぼることができる。
【0036】図17により、対象物候補群拡大プログラ
ム153の処理を説明する。まず、対象物候補群のある
領域にウィンドウを生成する(s171)。続いて、対
象物候補群の相互の位置関係を保ちながら拡大した画像
を該ウィンドウ上に表示する(s172)。そこで、ユ
ーザによる再度の指示で対象物を確定した(s173)
後、当該ウィンドウを消去する(s174)。
【0037】図8の例において、音声認識の結果、尤度
の最も大きい認識候補が“内側の円”となり、対象物候
補として円C4,C5が得られる。かつポインティング
領域認識プログラム151により、指示座標から対象物
候補群中の個々の対象物候補の中心座標までの距離が最
小の円C4が指示された対象物と判定される。
【0038】なお、図14のステップs308では、既
に辞書マッチングプログラム152により音声認識の結
果、対象物候補が得られているので、ポインティング領
域認識の処理においては、指示座標と対象物候補の中心
座標との距離を算出することなく、以下のようなより簡
易な方法を用いることができる。すなわち、ポインティ
ングジェスチャにより指示された近傍のX方向(または
Y方法)範囲内に、個々の対象物候補の中心座標が内包
されるか否かを調べ、内包される対象物候補が1個存在
すれば、これが指示された対象物と判定される。2個以
上存在すれば、対象物候補群を拡大して再度指示を行
う。内包される対象物候補が存在しなければ、音声誤認
識の可能性があり、音声情報解析手段において算出され
た尤度の次順に大きい方ものについて順次、該尤度に対
応する単語で表わされる対象物の中心座標が、ポインテ
ィングジェスチャにより指示された範囲内に存在するか
どうかを判定し、該範囲内に存在する候補が抽出された
時点で該候補を一意に対象物と特定する。
【0039】ポインティングジェスチャにより指示され
た範囲としては、例えば、XMn−d1≦Xj≦XMx
+d2(d1,d2の値については後述)で定める座標
Xjの範囲とする。ここで、d1は画面の横幅の1/1
0の長さで、ここではd1=10とする。また、d2は
画面横幅の1/20の長さで、ここではd2=5とす
る。d1の方を大きくしたのは、右利きのユーザは図形
の右側を指示すると考えられるからである。左利きのユ
ーザに対してはd1,d2の値を逆にする。したがっ
て、d1,d2の値はユーザが設定できるようにするこ
とが好ましい。但し、ポインティングジェスチャにより
指示される範囲を、X方向でなくY方向で定めるように
すれば、すなわち、YMn−d1≦Yj≦YMx+d2
とすれば、利き腕に関係なく、d1>d2とすればよ
い。
【0040】なお、図7の様に、音声入力のみ行われた
場合には、“1”が主記憶装置2上の音声入力識別バッ
ファメモリAに書き込まれ、ポインティング入力識別バ
ッファメモリBには“0”が書き込まれる。バッファメ
モリAが“1”、バッファメモリBが“0”の場合に
は、辞書マッチングプログラム152のみが起動され、
求められた特徴ベクトルと音響標準パタンデータ16と
のマッチングが、前述のように行われ、その結果、入力
音声は文字列に変換される。図7の例では、この文字列
は“ちょうほうけい”となる。さらに、この文字列は、
前述の最長一致法を用いて形態素解析され、さらに単語
辞書とのマッチングが行われた結果、(「長方形」、名
詞)の様な形態素情報が得られる。次に、抽出された名
詞番号と存在するテーブル番号とのマッチングが行わ
れ、本例では、テーブル番号E=802が抽出される。
該テーブルには、図形R1の1つしか記憶されていない
ので、R1が選択され、長方形R1が画面上で強調表示
(例えば点滅)する。
【0041】また、図5の様に、ポインティング入力の
み行われた場合には、“0”が主記憶装置2上の音声入
力識別バッファメモリAに書き込まれ、ポインティング
入力識別バッファメモリBには“1”が書き込まれる。
バッファメモリAが“0”、バッファメモリBが“1”
の場合には、ポインティング領域認識プログラム151
のみが起動され、主記憶装置2上のX[1]からX
[P]に格納されているX座標値のうちの最小値XMn
と最大値XMxと、Y[1]からY[P]に格納されて
いるY座標値の内の最小値YMnと最大値YMxを算出
し、XMn、XMxの平均値とYMn、YMxの平均値
が示す座標(Xnt,Ynt)と対象物候補群中の個々
の対象物候補との距離を順次計算し、最も距離が短かっ
た対象物候補を一意に対象物と特定する。また、(Xn
t,Ynt)から最も距離が短い対象物候補が複数個あ
る場合には、対象物候補拡大プログラム153が起動さ
れて(s310)、該候補図形群が位置関係を保って拡
大され、再度、音声やポインティングによって対象物指
示を行うことにより、それら複数個のうちから対象物を
しぼることができる。
【0042】
【発明の効果】画面に表示されている複数の表示物の包
含関係及び表示物間の位置関係を記憶しているテーブル
を備えることにより、ユーザが入力した音声情報とポイ
ンティングジェスチャによる位置情報から、複数の画面
表示物のうちユーザが意図する対象物を正確に認識する
ことができる。また、音声認識過程において算出された
尤度のうち最大値を持つ単語に対応する表示物が、ポイ
ンティングジェスチャにより指示された或る範囲内に存
在しない場合には、順次大きい尤度を持つ音声認識候補
単語を採用することにより、音声認識誤りによる対象物
誤認識を減少させることができ、ユーザの使い勝手は向
上する。また、1回の操作によって対象物候補が複数個
認識された場合、それら対象物候補を位置関係を保って
拡大表示する機能を備えることにより、1回の入力情報
だけでは対象物を一意に指示することが出来ない場合で
も、早く簡便に対象物を一意に特定できる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る図形編集システムを示
すブロック図である。
【図2】実施例の図形編集画面の一例を示す説明図であ
る。
【図3】実施例における描画テーブルのデータ構造の一
例を示す説明図である。
【図4】実施例における表示図形知識テーブルのデータ
構造の一例を示す説明図である。
【図5】実施例における音響認識プログラムのモジュー
ル構成を示す説明図である。
【図6】実施例においてポインティングジェスチャのみ
で対象物を指示している様子を示す図形編集画面の一例
の説明図である。
【図7】実施例において音声のみで対象物を指示してい
る様子を示す図形編集画面の一例の説明図である。
【図8】実施例において音声とポインティングジェスチ
ャの両方を用いて対象物を指示している様子を示す図形
編集画面の一例の説明図である。
【図9】実施例におけるポインティング領域テーブルの
データ構造の一例を示す説明図である。
【図10】実施例における対象物指示プログラム15の
モジュール構成を示す説明図である。
【図11】実施例における単語辞書17のデータ構造の
一例を示す説明図である。
【図12】実施例における音響認識プログラム13起動
後の処理の流れの一例を示すフローチャートである。
【図13】実施例におけるポインティング座標読み込み
プログラム14起動後の処理の流れの一例を示すフロー
チャートである。
【図14】実施例における図形編集プログラム12起動
後の処理の流れの一例を示すフローチャートである。
【図15】実施例におけるポインティング領域認識プロ
グラム151起動後の処理の流れの一例を示すフローチ
ャートである。
【図16】実施例における辞書マッチングプログラム1
52起動後の処理の流れの一例を示すフローチャートで
ある。
【図17】実施例における対象物候補拡大プログラム1
53起動後の処理の流れの一例を示すフローチャートで
ある。
【図18】実施例における表示物知識テーブル作成プロ
グラム18起動後の処理の流れの一例を示すフローチャ
ートである。
【図19】実施例において用いるバッファメモリの説明
図である。
【符号の説明】
1…情報処理装置、2…主記憶装置、3…パネル制御装
置、4…ディスプレイ、5…タッチパネル、6…表示制
御装置、7…A/D変換装置、8…マイク、11…シス
テムプログラム、12…図形編集プログラム、13…音
響認識プログラム、14…ポインティング座標読み込み
プログラム、15…対象物指示プログラム、16…音響
標準パタンデータ、17…単語辞書、18…表示物知識
テーブル作成プログラム、

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】表示装置の画面上に表示された複数の表示
    物の一つを対象物として指示する際、指もしくはペンに
    よるポインティング指示と音声による指示とを併用す
    る、複合形態による対象物指示方法であって、 前記複数の表示物の相互の位置関係を求め、該位置関係
    を表わす表示物知識テーブルを作成しておき、 前記位置関係を含む音声による表示物の指示に対する音
    声認識結果を前記表示物知識テーブルの内容に照らし
    て、該音声が指示する対象物候補を求め、 前記ポインティング指示に基づく位置情報を求め、 該ポインティング指示に基づく位置情報と前記対象物候
    補とに基づき対象物を特定することを特徴とする、複合
    形態による対象物指示方法。
  2. 【請求項2】前記音声認識による最も尤度の高い対象物
    候補のうち前記ポインティング指示による指示位置から
    最も近い位置に存在するものを対象物として特定するこ
    とを特徴とする、請求項1記載の複合形態による対象物
    指示方法。
  3. 【請求項3】前記ポインティング指示に基づく位置情報
    からその指示範囲を求め、該指示範囲内に、前記音声認
    識による最も尤度の高い対象物候補が存在するとき、そ
    の対象物候補を対象物として特定することを特徴とす
    る、請求項1記載の複合形態による対象物指示方法。
  4. 【請求項4】前記指示範囲内に最も尤度の高い対象物候
    補が複数存在するとき、該複数の対象物候補を含む画像
    領域を拡大し、その後、再度、前記指もしくはペンによ
    る指示および音声による指示を受けることを特徴とする
    請求項3記載の、複合形態による表示物指示方法。
  5. 【請求項5】前記指示範囲内に最も尤度の高い対象物候
    補が存在しないとき、次に尤度の高い対象物候補が前記
    指示範囲内に存在する場合、その対象物候補を対象物と
    して特定することを特徴とする請求項4記載の、複合形
    態による対象物指示方法。
  6. 【請求項6】前記指示範囲は、前記指もしくはペンの指
    示座標の予め定められた近傍の範囲であることを特徴と
    する請求項3、4、または5記載の複合形態による対象
    物指示方法。
  7. 【請求項7】情報を表示する情報表示手段と、該情報表
    示手段の表示画面上で指もしくはペンを用いて画面上の
    位置を指示するポインティング手段と、音声による指示
    を認識する音声認識手段とを備え、ポインティング指示
    と音声による指示とを併用して前記表示画面上の複数の
    表示物の一つを対象物として指示する複合形態入力装置
    であって、 少なくとも前記表示画面上に表示された複数の表示物の
    名称を表わす単語および該複数の表示物の相互の位置関
    係を表わす単語を含む単語辞書を格納する手段と、 前記複数の表示物の相互の位置関係を求める手段と、 該位置関係を表わす表示物知識テーブルを格納する手段
    と、 前記ポインティング指示に基づく位置情報を求める手段
    と、 前記音声認識手段により認識された表示物の名称および
    位置関係を前記表示物知識テーブルに照らして、対象物
    候補を求めると共に、前記位置情報に照らして該対象物
    候補から対象物を特定する対象物特定手段と、 を備えたことを特徴とする複合形態入力装置。
  8. 【請求項8】前記対象物特定手段により複数の対象物候
    補から一つの対象物を特定できない場合に、それらの対
    象物候補を位置関係を保って拡大する拡大手段を備える
    ことを特徴とする請求項7記載の複合形態入力装置。
JP14507193A 1993-06-16 1993-06-16 複合形態による対象物指示方法 Expired - Fee Related JP3170103B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14507193A JP3170103B2 (ja) 1993-06-16 1993-06-16 複合形態による対象物指示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14507193A JP3170103B2 (ja) 1993-06-16 1993-06-16 複合形態による対象物指示方法

Publications (2)

Publication Number Publication Date
JPH075977A true JPH075977A (ja) 1995-01-10
JP3170103B2 JP3170103B2 (ja) 2001-05-28

Family

ID=15376712

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14507193A Expired - Fee Related JP3170103B2 (ja) 1993-06-16 1993-06-16 複合形態による対象物指示方法

Country Status (1)

Country Link
JP (1) JP3170103B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005178473A (ja) * 2003-12-17 2005-07-07 Denso Corp 車載機器用インターフェース

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005178473A (ja) * 2003-12-17 2005-07-07 Denso Corp 車載機器用インターフェース

Also Published As

Publication number Publication date
JP3170103B2 (ja) 2001-05-28

Similar Documents

Publication Publication Date Title
JP3267047B2 (ja) 音声による情報処理装置
US5600765A (en) Display system capable of accepting user commands by use of voice and gesture inputs
US6570588B1 (en) Editing support system including an interactive interface
US10817739B2 (en) Content-aware selection
JP3471919B2 (ja) 機械作動方法及びプロセッサ制御機械を作動するために使用する方法
US5687254A (en) Searching and Matching unrecognized handwriting
US8600164B2 (en) Method and tool for recognizing a hand-drawn table
JP7105695B2 (ja) デジタルインク対話性のためのシステムおよび方法
US10489642B2 (en) Handwriting auto-complete function
US20150019227A1 (en) System, device and method for processing interlaced multimodal user input
US20060001656A1 (en) Electronic ink system
WO2019000681A1 (zh) 信息排版方法、装置、设备及计算机存储介质
US20090245645A1 (en) Method and tool for recognizing a hand-drawn table
WO2010006087A9 (en) Process for providing and editing instructions, data, data structures, and algorithms in a computer system
JP2001272995A (ja) 音声認識方法及び装置
KR20150027885A (ko) 전자 필기 운용 방법 및 이를 지원하는 전자 장치
US7370288B1 (en) Method and system for selecting objects on a display device
US7170503B2 (en) Layer editing method and apparatus in a pen computing system
CN110850982A (zh) 基于ar的人机交互学习方法、系统、设备及存储介质
US8869061B1 (en) User interface for searching an electronic document
JP3170103B2 (ja) 複合形態による対象物指示方法
JP4148867B2 (ja) 筆跡処理装置
CN113849118A (zh) 一种应用于电子白板的图像识别方法及相关装置
JPH0883092A (ja) 情報入力装置及び情報入力方法
US8810580B2 (en) Method and tool for creating irregular-shaped tables

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090316

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090316

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100316

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110316

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110316

Year of fee payment: 10

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110316

Year of fee payment: 10

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110316

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees