JP3984658B2 - 情報処理装置及びその方法 - Google Patents

情報処理装置及びその方法 Download PDF

Info

Publication number
JP3984658B2
JP3984658B2 JP14138093A JP14138093A JP3984658B2 JP 3984658 B2 JP3984658 B2 JP 3984658B2 JP 14138093 A JP14138093 A JP 14138093A JP 14138093 A JP14138093 A JP 14138093A JP 3984658 B2 JP3984658 B2 JP 3984658B2
Authority
JP
Japan
Prior art keywords
voice
processing
extraction
information processing
holding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP14138093A
Other languages
English (en)
Other versions
JPH06332660A (ja
Inventor
雅章 山田
康弘 小森
恭則 大洞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP14138093A priority Critical patent/JP3984658B2/ja
Publication of JPH06332660A publication Critical patent/JPH06332660A/ja
Application granted granted Critical
Publication of JP3984658B2 publication Critical patent/JP3984658B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Digital Computer Display Output (AREA)

Description

【0001】
【産業上の利用分野】
本発明は、コンピュータ等の情報処理装置及びその方法に関し、特に入力インタフェースを改良した情報処理装置及びその方法に関するものである。
【0002】
【従来の技術】
従来から、コンピュータ等の情報機器を始めとして、ビデオの予約情報処理装置や電子レンジ等の家庭用電化製品、コピー機などの事務用品には、タッチパネルやマウス等のポインティングデバイスが用意されている。ユーザはこれらのポインティングデバイスを用いて処理の対象となる位置と処理を行うタイミングを指示することができる。
【0003】
例えば、図2では画面上に3つの箱が描かれている。ユーザがマウスを用いてマウスカーソル(図中の矢印)を左の箱に移動させ、マウスボタンをクリックすると、マウスカーソルの置かれている座標と処理の開始を指示することができる。この例では、「指示された座標がどの箱の中にあるかを調べ、該当する箱(左)の色を変える。」という処理が行われる。
【0004】
また、ポインティングディバイスは、処理の対象となる位置、及び処理のタイミングを指示することができるが、処理内容を指示することはできない。従って、最も単純な形態をとった場合、ポインティングディバイスを用いて指示できる処理はただ1つに限られる。しかし、ポインティングディバイスを用いて処理したい内容は、ただ1つとは限らない。
【0005】
例えば、前記の図2の例では、「色を赤に変える」処理を行いたいこともあれば、「色を青に変える」処理をしたいこともある。このような場合、ポインティングディバイスでは処理する内容がただ1つであるならば、どちらか一方の処理しか行えない。
【0006】
この欠点を補うために従来では、ポインティングディバイスの操作にユーザの意図する複数種の処理を結び付ける次のような方法がとられてきた。
【0007】
(1)ポインティングディバイスの操作後、処理内容を指示する手段を設ける。この方法の例としては、ポインティングディバイスの操作後にメニューが表示され、ユーザがメニューから処理内容を選択する方法がある。図2の場合では、メニューからどの色かを選択することになる。あるいは、メニューの代わりにキーボードなどの処理内容の指示に向いた装置・方法を用いて処理内容を指示する方法も当該方法に含まれる。
【0008】
(2)最初に処理内容を決定する操作、即ちモードを決定する操作を行い、処理を変える。この方法の例としては、前記(1)の方法とは逆に、予め処理内容を決定しておく。図3の例のように、「予め[赤]ボタンを選択しておくと箱が赤くなる」といった方法である。
【0009】
(3)ボタンのクリック回数により処理内容を変える。この方法の例としては、例えばポインティングディバイスがマウスの場合、「マウスボタンのクリック回数が1回ならば赤、2回ならば青、……」と決めておく方法である。
【0010】
(4)シフトキーなどの修飾キーを押しながら、クリックや画面のタッチを行うことにより、修飾キー無しの場合とは別の処理を行うようにする。
【0011】
(5)ポインティングディバイスが、マウスやトラックボールなどの場合にはボタンの数を増やす。
【0012】
(6)ただ1つの処理でも間に合うようなユーザインタフェースを設計する。この方法の例としては、「箱の左上ならば赤、右上ならば青、……」というように細分化したユーザインタフェースを設計しておくことにより、常にただ1つの処理しか行えなくてもよいようにする方法である。
【0013】
【発明が解決しようとする課題】
しかしながら、上記従来例による、ポインティングディバイスの操作を複数種の処理に結びつける方法では次のような問題があった。
【0014】
1.ポインティングディバイスの操作の後に処理内容を指示する手段を設ける上記(1)の方法では、目的の処理を行うまでの操作量・時間が増大する。
【0015】
2.最初にモードを決定する操作を行ってから、処理を変える上記(2)方法では、目的の処理を行うまでの操作量が増大する。さらに、現在どのモードにあるのかをユーザが記憶していなくてはならない。
【0016】
3.クリック回数により処理内容を変える上記(3)の方法では、クリック回数はせいぜい3〜4回が限度であり、また、多数のクリックはユーザの運動能力に負担をかけ、誤操作が生じやすいばかりか、ユーザがクリックの回数とそれによって生ずる処理との対応を覚えにくい。
【0017】
4.修飾キーを用いる上記(4)の方法では、多数の修飾キーを用いると修飾キーを探して押すのに時間がかかり、また、ユーザは修飾キーと処理との対応を覚えにくい。
【0018】
5.ボタンの数を増やす上記(5)の方法では、物理的な限界があり、かつその限界が小さい。
【0019】
6.ただ1つの処理でも間に合うようなユーザインタフェースを設計する上記(6)の方法では、処理が細かくなり過ぎる。例えば上記の例では、箱の面積の有効領域が4色ならば4分の1になってしまう。また、ユーザインタフェースの設計に手間がかかる。
【0020】
本発明は上記従来の問題点に鑑み、ポインティングディバイスの操作に複数種の処理を結び付ける場合において、その操作性を向上させた情報処理装置及びその方法を提供することを目的とする。
【0021】
【課題を解決するための手段】
上記目的を達成するために本発明の情報処理装置は、音声を取り込む音声取込み手段と、前記音声取込み手段により取り込まれた音声を保持する音声保持手段と、入力手段の操作が検出された場合、前記音声保持手段に保持された音声のうち該検出時点の前後の音声を抽出する抽出手段と、前記抽出手段により抽出された音声のみを音声認識する音声認識手段と、前記入力手段の操作と前記音声認識手段の認識結果とに基づいて処理を判断する処理判断手段と、前記処理判断手段によって判断された処理を実行する処理実行手段と
を備えることを特徴とする。
上記目的と達成するために本発明の情報処理方法は、音声を取り込む工程と、前記取り込まれた音声を保持する工程と、入力手段の操作が検出された場合、前記保持された音声のうち該検出時点の前後の音声を抽出する抽出工程と、前記抽出工程で抽出された音声のみを音声認識する音声認識工程と、前記入力手段の操作と前記音声認識工程における認識結果とに基づいて処理を判断する処理判断工程と、前記処理判断工程によって判断された処理を実行する処理実行工程とを備えることを特徴とする。
【0023】
【実施例】
以下、図面を参照して本発明の実施例を説明する。
【0024】
図1は、本発明に係る情報処理装置である計算機の第1実施例の概略構成を示すブロック図である。
【0025】
同図中、1はシステムバスであり、このシステムバス1には、CRTディスプレイ等の表示装置2と、ポインティングディバイス3と、キーボード等の入力装置4と、マイクロホン等の音声入力装置5と、該音声入力装置5から供給される音声を計算機処理できるように変形するI/O装置6と、数値演算等を行ってシステム全体の動作を制御する中央処理装置7と、ディスク装置等の外部メモリ8と、RAMやROM等の内部メモリ9とが接続されている。尚、中央処理装置7は内部メモリ9に記憶された、例えば後述するフローチャートの制御プログラムに従って動作制御を行う。
【0026】
以上のように構成される計算機の動作を図4のフローチャートを参照しつつ説明する。
【0027】
まず、ステップS1において音声入力装置5及びI/O装置6を用いてユーザの発生した音声を計算機に取り込む。次に、前記ステップS1で取り込まれた音声データを外部メモリ装置8に保持する。このステップS2が終了した後は、前記ステップS1に戻り、音声取込みを続ける。
【0028】
ポインティングディバイスの操作が検出されると、ステップS3の処理に移行する。ステップS3では前記ステップS2で外部メモリ8に保持された音声データのうち、ポインティングディバイスの操作された時点の前後の音声データを抽出する。この音声データを抽出する処理の一例を図5のフローチャートに示す。
【0029】
図5において、ステップS21で、抽出範囲開始時刻Tsをポインティングディバイスの操作が行われた時刻に設定する。次にステップS22で、時刻Tsから始まる音声データを予め定められた時間ΔTの分量だけ読み込む。その後のステップS23では、前記ステップS22で読み込んだ音声データの2乗平均値を計算する。
【0030】
続くステップS24において、前記ステップS23で計算した2乗平均値が予め定められた閾値Th1より大きいか否かを調べ、大きい場合はステップS25へ進み、大きくない場合はステップS26へ進む。ステップS25では、抽出範囲開始時刻TsをΔTだけ減じ、前記ステップS22へ戻る。また、ステップS26では、抽出範囲終了時刻Teをポインティングディバイスの操作が行われた時刻に設定する。
【0031】
次にステップS27で、時刻Teから始まる音声データを予め定められた時間ΔTの分量だけ読み込み、ステップS28で、前記ステップS27で読み込んだ音声データの2乗平均値を計算する。その後、さらにステップS29で前記ステップS28で計算した2乗平均値が予め定められた閾値Th2より大きいか否かを調べ、大きいならばステップS30へ進み、大きくないならば抽出開始時刻及び抽出終了時刻が定まるので、この音声データ抽出フローを終了する。ステップS30では、抽出範囲終了時刻TeをΔTでけ増加し、前記ステップS27へ戻る。
【0032】
図4に戻り、音声データを抽出する前記ステップS3が終了した後、ステップS4に進む。ステップS4では、前記ステップS3で抽出された音声データから、パターンマッチングに必要なパラメータを計算する。次に、ステップS5で、外部メモリ装置8から音声認識のための標準パターンのパラメータを読み出す。その後、ステップS6で、前記ステップS4で計算されたパラメータと前記ステップS5で読み出された標準パターンのパラメータとのマッチングを行い、最もマッチした標準パターンを音声認識結果として得る。
【0033】
ステップS7では、前記ステップS6によって得られた音声認識結果に対応するユーザインタフェース(UI)の処理内容を算出し、ステップS8で前記ステップS7で算出したUI処理を実行する。このステップS8の処理が終了すると、ポインティングディバイスの操作待ちとなり、処理フローが終了する。
【0034】
以上の如く説明した実施例を、マウスによるファイル操作の場合に適用すると次のようになる。
【0035】
まず、音声取込みステップS1及び音声データ保持ステップS2は、プログラム開始と同時に行われる。表示装置2に表示された内容を示す図6において、マウスカーソル(図中の矢印)を「ファイル1」のアイコン(欠けた長方形)の上に移動し、マウスボタンをクリックすると音声データ抽出ステップS3へ移行する。ここで、説明のために、マウスボタンをクリックする際のユーザの発声内容を例えば「選択」とする。
【0036】
ステップS3では、前述した処理フローに従い、マウスクリックの行われた時点の前後の音声データを抽出する。続いて、パラメータ計算ステップS4で、前記ステップS3で抽出された音声データをパラメータ化する。このステップS4で得られたパラメータの例を図7に示す。
【0037】
次に、標準パターン読出しステップS5で、音声認識に用いる標準パターンを読み出す。読み出された標準パターンの例を図8に示す。その後、パターンマッチングステップS6でパターンマッチングを行い、図8に示された標準パターンのうち、図7に最も近い標準パターンを持つ「選択」を音声認識結果として得る。続いて、UI処理内容算出ステップS7で、認識結果「選択」に対応するUI処理内容を得る。UI処理内容の算出には、図9で示される表を用いる。この算出処理の結果、UI処理内容「UI:select」を得る。
【0038】
UI処理ステップS8では、UI処理内容算出ステップS7で算出されたUI処理内容「UI:select」を実行する。「UI:select」を実行した結果、「ファイル1」が選択され、それを示すために「ファイル1」のアイコンが表示装置2上で反転表示される(図10)。以上により、「ファイル1」上での発声「選択」を伴うマウスクリックに対する処理が終了する。
【0039】
図11は本発明の情報処理装置の第2実施例を示すフローチャートである。
【0040】
上記第1実施例において、音声データからパラメータを計算するパラメータ計算ステップS4は、音声認識を行う一連のステップの中で実行したが、図11に示すように、ユーザの発声内容を取込み、保持する一連のステップの中で実行していもよい。
【0041】
すなわち、図11に示すように、第1実施例のパラメータ計算ステップS4を音声取込みステップS1´の次にパラメータ計算ステップS4´として設け、第1実施例の音声データ保持ステップS2の代わりにパラメータ保持ステップS32を設ける。さらに、第1実施例の音声データ抽出ステップS3の代わりにパラメータ抽出ステップS3の代わりにパラメータ抽出ステップS33を設ける。
【0042】
前記パラメータ保持ステップS32では、パラメータ計算ステップS4´で計算されたパターンマッチングに必要なパラメータを外部メモリ装置8に保持する。また、パラメータ抽出ステップS33では、前記パラメータ保持ステップS32で保持されたパラメータのうち、ポインティングディバイスの操作された前後の時点のパラメータを抽出する。
【0043】
図12(a),(b)は本発明の情報処理装置の第3実施例を示すフローチャートである。
【0044】
上記第1及び第2の実施例では並行処理的なフローを用いたが、例えば図12(a),(b)に示すように単一のフロー内で行うこともできる。
【0045】
なお、本発明は、図示の実施例に限定されず、種々の変形が可能である。例えば、その変形例として次のようなものがある。
【0046】
(1)上記実施例では、ポインティングディバイスとしてマウスを用いたが、これに限定されず、例えばタブレット・タッチパネル・ライトペン等を用いてもよいし、キーボード上に設けられたキーでも、予め本実施例に説明したような処理の実行と対応づけた入力手段であれば良い。
【0047】
(2)上記実施例では、マウスのクリックを検出した時を例としたが、マウスボタンが離された場合やマウスが移動された際に本発明を適用してもよい。
【0048】
(3)本発明を従来技術である修飾キー、クリック回数やモードと組み合わせることも可能である。たとえば、修飾キーを組み合わせた場合、第1実施例のUI処理内容算出ステップS7で用いた図9に示す対応図の代わりに、図13に示すような対応図を用いればよい。
【0049】
【発明の効果】
以上に説明したように、本発明によれば、ポインティングディバイス等の入力手段と音声認識とを組み合わせた入力インタフェースが構成でき、入力手段の操作に複数種の処理を結び付ける場合において、その操作性を著しく向上させることが可能となる。
【0050】
例えば、(1)目的の処理を行うまでの操作量、時間を短縮することができる。
【0051】
(2)現在、どのモードにあるのかをユーザが記憶する必要がない。
【0052】
(3)ユーザの運動能力に負担をかけないため、誤操作が生じにくい。
【0053】
(4)修飾キーを用いるなどの方法に対し、処理との対応関係が言葉で表せるため、操作と処理との対応を覚えやすい。
【0054】
(5)1種類のポインティングディバイスの操作で多くの種類の処理が行えるので、ユーザインタフェースが細かくなり過ぎない。
【図面の簡単な説明】
【図1】本発明に係る情報処理装置の第1実施例の概略構成を示すブロック図である。
【図2】従来の情報処理装置を説明するための説明図である。
【図3】従来の情報処理装置を説明するための他の説明図である
【図4】前記第1実施例のメイン処理を示すフローチャートである。
【図5】前記第1実施例における音声データ抽出処理を示すフローチャートである。
【図6】前記第1実施例におけるマウス操作直前の表示内容を示す図である。
【図7】前記第1実施例におけるパラメータ計算ステップS4で得られたパラメータの例を示す図である。
【図8】前記第1実施例における標準パターン読出しステップS5で読み出される標準パターンの例を示す図である。
【図9】前記第1実施例における音声認識結果とUI処理内容との対応例を示した対応図である。
【図10】前記第1実施例の処理終了時の表示内容を示す図である。
【図11】本発明の情報処理装置の第2実施例を示すフローチャートである。
【図12】本発明の情報処理装置の第3実施例を示すフローチャートである。
【図13】音声認識結果とUI処理内容との他の対応例を示した対応図である。
【符号の説明】
2 表示装置
3 ポインティングディバイス
4 入力装置
5 音声入力装置
6 I/O装置
7 中央処理装置
8 外部メモリ
9 内部メモリ

Claims (2)

  1. 音声を取り込む音声取込み手段と、
    前記音声取込み手段により取り込まれた音声を保持する音声保持手段と、
    入力手段の操作が検出された場合、前記音声保持手段に保持された音声のうち該検出時点の前後の音声を抽出する抽出手段と、
    前記抽出手段により抽出された音声のみを音声認識する音声認識手段と、
    前記入力手段の操作と前記音声認識手段の認識結果とに基づいて処理を判断する処理判断手段と、
    前記処理判断手段によって判断された処理を実行する処理実行手段と
    を備えることを特徴とする情報処理装置。
  2. 音声を取り込む工程と、
    前記取り込まれた音声を保持する工程と、
    入力手段の操作が検出された場合、前記保持された音声のうち該検出時点の前後の音声を抽出する抽出工程と、
    前記抽出工程で抽出された音声のみを音声認識する音声認識工程と、
    前記入力手段の操作と前記音声認識工程における認識結果とに基づいて処理を判断する処理判断工程と、
    前記処理判断工程によって判断された処理を実行する処理実行工程と
    を備えることを特徴とする情報処理方法。
JP14138093A 1993-05-20 1993-05-20 情報処理装置及びその方法 Expired - Fee Related JP3984658B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14138093A JP3984658B2 (ja) 1993-05-20 1993-05-20 情報処理装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14138093A JP3984658B2 (ja) 1993-05-20 1993-05-20 情報処理装置及びその方法

Publications (2)

Publication Number Publication Date
JPH06332660A JPH06332660A (ja) 1994-12-02
JP3984658B2 true JP3984658B2 (ja) 2007-10-03

Family

ID=15290654

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14138093A Expired - Fee Related JP3984658B2 (ja) 1993-05-20 1993-05-20 情報処理装置及びその方法

Country Status (1)

Country Link
JP (1) JP3984658B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08166866A (ja) * 1994-10-14 1996-06-25 Hitachi Ltd 対話型インターフェースを具備した編集支援システム
JP3363283B2 (ja) * 1995-03-23 2003-01-08 株式会社日立製作所 入力装置、入力方法、情報処理システムおよび入力情報の管理方法
JP3844874B2 (ja) * 1998-02-27 2006-11-15 株式会社東芝 マルチモーダルインタフェース装置およびマルチモーダルインタフェース方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60146327A (ja) * 1984-01-11 1985-08-02 Hitachi Ltd 計算機対話方法
JPS6277643A (ja) * 1985-09-20 1987-04-09 Fujitsu Ltd 音声絵図作成装置

Also Published As

Publication number Publication date
JPH06332660A (ja) 1994-12-02

Similar Documents

Publication Publication Date Title
TWI398818B (zh) 手勢辨識方法與系統
CN103270483B (zh) 具有手势识别单元的系统
US7849421B2 (en) Virtual mouse driving apparatus and method using two-handed gestures
TW201038048A (en) Control method of mobile phone
JP2007122496A (ja) 表示情報選択装置及び方法、プログラム並びに記録媒体
US20140218315A1 (en) Gesture input distinguishing method and apparatus in touch input device
CN109343757A (zh) 一种电子设备的操作控制方法及电子设备
WO2014146516A1 (zh) 一种左右手交互装置及方法
US20120313968A1 (en) Image display system, information processing apparatus, display device, and image display method
US20110037731A1 (en) Electronic device and operating method thereof
WO2013101371A1 (en) Apparatus and method for automatically controlling display screen density
JP3984658B2 (ja) 情報処理装置及びその方法
CN107179835A (zh) 一种输入方法和装置、一种用于输入的装置
JP2000148366A (ja) 文字・記号入力装置および文字・記号入力方法
JPH1049700A (ja) ペン入力装置、ペン入力方法、入力装置及び入力方法
JPH09237151A (ja) グラフィカルユーザインタフェース
JPH0991116A (ja) 情報処理装置及びその方法
JP3475069B2 (ja) 操作キー表示方法及び情報処理装置
US7170523B2 (en) Drawing-information processing apparatus and drawing-information processed method
JPH0922330A (ja) タッチパネルの入力方法
JPH04280318A (ja) マウス入力におけるページ検索方式
US11194466B2 (en) Procedure for entering commands for an electronic setup
JPH04273322A (ja) 階層メニュー選択装置
JPH03129513A (ja) 機能選択方式
TW201519072A (zh) 依據滑動手勢切換程序執行之觸控裝置及其方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20031216

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040316

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060428

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070426

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070709

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100713

Year of fee payment: 3

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100713

Year of fee payment: 3

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110713

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120713

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees