JPH06342365A - 線型音声制御方法及び装置 - Google Patents

線型音声制御方法及び装置

Info

Publication number
JPH06342365A
JPH06342365A JP3263204A JP26320491A JPH06342365A JP H06342365 A JPH06342365 A JP H06342365A JP 3263204 A JP3263204 A JP 3263204A JP 26320491 A JP26320491 A JP 26320491A JP H06342365 A JPH06342365 A JP H06342365A
Authority
JP
Japan
Prior art keywords
cursor
linear
voice control
acoustic characteristic
generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3263204A
Other languages
English (en)
Other versions
JP2940842B2 (ja
Inventor
Jr Frank A Mckiel
エイ. マッキール、 ジュニア フランク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH06342365A publication Critical patent/JPH06342365A/ja
Application granted granted Critical
Publication of JP2940842B2 publication Critical patent/JP2940842B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0489Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using dedicated keyboard keys or combinations thereof
    • G06F3/04892Arrangements for controlling cursor position based on codes indicative of cursor displacements from one discrete location to another, e.g. using cursor control keys associated to different directions or using the tab key
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/038Indexing scheme relating to G06F3/038
    • G06F2203/0381Multimodal input, i.e. interface arrangements enabling the user to issue commands by simultaneous use of input devices of different nature, e.g. voice plus gesture on digitizer

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Position Input By Displaying (AREA)
  • User Interface Of Digital Computer (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

(57)【要約】 【目的】 コンピュータディスプレイシステム内でカー
ソル位置を線型音声制御する。 【構成】 コンピュータシステムと共にマイクロフォン
26を利用して音声発生を検出する。検出された各音声
は次に分析回路34で有声音及び無声音の発生が検出さ
れる。次に、各有声音発生のピッチ及び各無声音発生の
仮想周波数の変動を利用して、コンピュータディスプレ
イシステムにおいてカーソル位置を2つの軸で独立的に
線型変化させる。分析回路34は、有効な制御信号が発
生したことを保証するために短い遅延を含む。そして、
ピッチ又は仮想周波数の初期値からの増加又は減少を利
用して、2つの軸の正又は負の方向にカーソルの移動を
開始する。ピッチ又は仮想周波数が初期値に戻るまで、
又は発声が終わるまで、カーソルの動きは持続する。カ
ーソルの外観を図形的に変えて有効制御信号の存在を示
すことができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は一般に改良型データ処理
システムに係り、特にデータ処理システムにおけるカー
ソル制御のための方法及び装置に係る。さらにより詳細
には、本発明は、データ処理システムのカーソル位置の
線型音声制御のための方法及び装置に関する。
【0002】
【従来の技術】種々の機械的及び/又は電気的装置の音
声制御は、当該技術においてよく知られている。手がふ
さがった状況において又は身障者の間で、このような装
置の正確な制御は非常に所望されるテクノロジーであ
る。
【0003】既知の電気器具用制御装置は、口笛又は手
をたたく音に応答して器具へ電力を供給したり又は取り
除いたりする簡単な電力継電器から、複雑なコマンドが
口頭で入力される高性能コンピュータ制御装置へわたっ
ている。例えば、所望の個人を識別する口頭コマンドに
応答して出力テレフォンコールを自動的にダイアルする
テレフォンシステムがある。
【0004】最新のコンピュータシステムは、いわゆ
る”グラフィック・ユーザー・インターフェース”すな
わち”GUI”をしばしば利用して、図的表現又はアイ
コンを図形的に指定しこれらのアイコンを当該技術で周
知の方法で操作することによって、コンピュータユーザ
ーがコンピュータアプリケーションにアクセスするこ
と、及び固有のもっともな方法でコンピュータファイル
を操作することを可能にする。このような図形指定は、
マウス又はライトペンのような図形ポインティング装置
を利用して行われ、所望のコンピュータアプリケーショ
ンを選択する”カーソル”を再配置するのが典型的であ
る。
【0005】カーソルの音声制御は、”UP”、”DO
WN”、”LEFT”、”RIGHT”及び”STO
P”のようなあるコマンド音声の発生を認識することに
よって、ある最新式コンピュータシステムで達成されて
いる。このアプローチは、所望の位置でカーソルを位置
決めするのに典型的に必要な繰り返しが多数であるため
に、精密なカーソル制御が厄介であることが判明した。
他のシステムは、選択された母音の音に応答してカーソ
ルをディスプレイスクリーンの種々の領域へマッピング
することによって、カーソルの大まかな位置決めを可能
にした。しかしながら、上記のように、このシステムは
精密なカーソル位置決めが厄介である。
【0006】従って、口頭のコマンドによってコンピュ
ータシステムのカーソル位置を正確に制御できるシステ
ムが必要であることは明らかである。
【0007】
【発明が解決しようとする課題】従って、本発明の目的
は、改良型コンピュータシステムを提供することであ
る。
【0008】本発明のもう1つの目的は、コンピュータ
システムにおけるカーソル制御のために改良された方法
及び装置を提供することである。
【0009】更に本発明の目的は、コンピュータシステ
ムにおける線型音声カーソル制御のために改良された方
法及び装置を提供することである。
【0010】
【課題を解決するための手段及び作用】上記目的は、以
下に記載するようにして達成される。音声発生を検出す
るためにコンピュータシステムと共にマイクロフォンが
利用され、各音声発生は次に分析回路へ連結されて有声
音及び無声音の発生を検出する。次に、各有声音発生の
ピッチ及び各無声音発生の仮想周波数の変動は、コンピ
ュータディスプレイシステムにおいてカーソル位置を2
つの軸で独立的に線型変化させるために利用される。本
発明の記載された実施例では、有効な制御信号が発生し
たことを保証するために、分析回路は短い遅延を含む。
その後、ピッチ又は仮想周波数の初期値からの増加又は
減少を利用して、2つの軸の正又は負の方向にカーソル
の移動を開始する。ピッチ又は仮想周波数が初期値に戻
るまで、又は発声が終わるまで、カーソルの動きは持続
する。本発明の一実施例において、カーソルの外観は、
図形的に変えられて有効制御信号の存在を示す。
【0011】
【実施例】本発明の特徴であると信じられる新規性は、
特許請求の範囲に明示されている。しかしながら、好ま
しい使用モードと共に本発明自身、更なる目的、及びそ
の利点は、添付図面と共に実施例の以下の詳細な記載を
読むことによって最もよく理解されるであろう。
【0012】図面、特に図1を参照すると、本発明の方
法及び装置を実行するために利用されるコンピュータシ
ステム10の一部略図及び一部絵画図が示されている。
示されるように、コンピュータシステム10は、当該技
術で周知の方法でディスプレイスクリーン14を提供す
るために利用されるディスプレイ装置12を備えてい
る。ディスプレイスクリーン14内には、カーソル16
が示されている。カーソル16は矢印型態様で示されて
いるが、多数の異なる形でカーソルを表示し得ること
は、当業者によって認識されるであろう。ディスプレイ
装置12にはプロセッサ18が連結される。プロセッサ
18は、コンピュータシステム10の中央処理装置を含
み、キーボード20へも連結されている。キーボード2
0はコンピュータ技術の当業者に周知の方法で利用され
て、コンピュータユーザーが種々のコマンドシーケンス
をキーボード入力するのを可能にすると共に、データエ
ントリーのために種々のコンピュータアプリケーション
との対話を可能にする。
【0013】当業者は、本明細書を参照して、ニューヨ
ーク、アーモンクのインターナショナル・ビジネス・マ
シーンズ・コーポレイションによって製造される PS/2
IBMパーソナルコンピュータのような先行技術で周知の
パーソナルコンピュータシステムを利用してコンピュー
タシステム10が実行され得ることがわかるであろう。
プロセッサ18へは、図形ポインティング装置22が連
結される。本発明の記載された実施例では、図形ポイン
ティング装置22はマウスを含む。図形ポインティング
装置22は、次にプロセッサ18内のマウスドライバ2
4へコンピュータ技術で周知の方法で連結される。当然
ながら、マウスドライバ24はハードウェア又はソフト
ウェアの何れにおいても実行できる。
【0014】本発明の重要な特徴によると、マイクロフ
ォン26もプロセッサ18へ連結される。本発明の記載
された実施例によると、マイクロフォン26は、以下に
より詳細に示される方法でディスプレイスクリーン14
内のカーソル16の位置決めを制御するために、音声発
生が利用されることを可能にする。本発明の記載された
実施例によると、マイクロフォン26のアナログ出力
は、インターフェース回路28へ連結される。インター
フェース回路28は、図2に関してより詳細に開示され
るようなインターフェース回路であることが好ましく、
ここに開示される型の音声発生をマウスドライバ24に
次に連結される制御信号へ変換するために利用され、且
つディスプレイスクリーン14内でカーソル16を線型
に再配置するために利用される。
【0015】本発明の方法及び装置は、”UP”、”R
IGHT”、”STOP”等の音声コマンドを利用する
よりは、音声の線型且つ独立的な2つの音響特性を利用
して、どんな程度の分解能においてもカーソルの位置決
めを実行する。更に、利用する音響特性は、カーソルの
選択された位置決めを達成するために必要とされる音が
容易に予測できるように選択される。
【0016】カーソル制御のために候補として利用され
る1つの音響特性はピッチである。多くの人間は、不変
ピッチを持続する又は少なくとも1オクターブに渡って
連続的に音声発生のピッチを上昇させること及び降下さ
せることができる。ピッチは、母音発生を考えないで、
すなわちフォルマント又は周波数シフトを無視して、容
易に持続され得る。ピッチの連続性及び独立性によっ
て、これは本発明の方法及び装置の優れた音響特性とさ
れる。
【0017】振幅もまた多くの話し手によって連続的に
変えられるが、話し手の声道共鳴及び放射特性、並びに
室内音響のため、振幅はピッチの関数として変化する。
更に、高振幅の出力は、話し手の息をより急速に使い尽
くすと共に、恐らく同一の物理的場所にいる他のユーザ
ーの邪魔をする。
【0018】従って、本発明の好ましい実施例では、音
声の摩擦性又は歯擦性のような無声音の発生を利用す
る。無声音は、口蓋に対して舌が形成するような声道の
収縮部分を通過する乱気流によって物理的に造りだされ
る。”S”サウンドのような歯擦音は、”仮想”又は”
見かけの”周波数に大まかに中心が置かれたランダムノ
イズ周波数バンドから成る”ノイズ円錐”を造りだす。
このノイズ円錐は、声道の気流の乱れによってつくられ
るホワイトノイズが、舌と歯の空洞及び歯と唇の空洞に
よって再生的にフィルタリングされるときにもたらされ
る。
【0019】話し手が声道の形を物理的に変えることに
よる空洞共鳴の制御を利用して、ノイズ出力の仮想周波
数をシフトさせる。無声歯擦音発生の仮想周波数のこの
制御は、歯を介して口笛をふくようにして訓練される。
【0020】当業者は、ピッチを補足するために軸制御
入力として歯擦音声のような無声発生の仮想周波数を利
用することが多数の利点を有することがわかるであろ
う。広範囲に渡って仮想周波数を連続的に変えられると
いう本質的な性質に加えて、その非反復性及びスペクト
ル分離によってこの音響特性はピッチから容易に分離さ
れる。歯擦性は、その形成においてでさえもピッチから
完全に独立している。
【0021】本発明の方法及び装置での実験は、経験の
あるユーザーは”S”サウンドを利用して無声音を発生
させることができ、それによって、他方の軸に影響を及
ぼさずに一方の軸でのカーソル移動を制御することがで
きるということが判明した。同様に、ユーザーはまった
く歯擦音でない”M”サウンドをハミングして、ピッチ
関連軸のみを制御することができる。最後に、経験のあ
るユーザーは、”Z”サウンドを利用して、両方の軸を
同時に制御することができる。
【0022】さて図2を参照すると、本発明の方法及び
装置を実行するために利用される図1のインターフェー
ス回路構成28の略図が示されている。図示されるよう
に、マイクロフォン26の出力は、ハイパスフィルタ3
0及びローパスフィルタ52へ同時に連結されている。
本発明の記載された実施例では、ハイパスフィルタ30
及びローパスフィルタ52はいずれも、約500ヘルツ
のカットオフ周波数を有し、有声音発生と無声音又は歯
擦音発生との間のクロストーク効果を最小限にするよう
作用する。
【0023】まずハイパスフィルタ30を参照して、無
声音又は歯擦音発生の処理について説明する。本発明の
記載された実施例では、ハイパスフィルタ30の出力
は、アナログ−デジタル変換器32へ連結されるのが好
ましい。その後、この信号は、デジタルコンピュータ技
術において周知の方法でデジタル領域で処理される。ア
ナログ−デジタル変換器32の出力は、次にスペクトル
分析回路34へ連結される。
【0024】スペクトル分析回路34は、多数の高速フ
ーリエ変換を平均することによって無声音発生でのスペ
クトル分析を実行することが好ましい。歯擦エネルギの
存在表示も、好ましくはスペクトル分析回路34で発生
され、ロックオンヒステリシス回路38へ連結されて無
声音発生の存在又は不在を表示する。無声音発生の平均
スペクトルを表示するスペクトル分析回路34の出力
は、次に仮想周波数計算回路36へ連結される。無声音
発生の仮想周波数は、無声発生の平均スペクトルから、
スペクトル下方の全体の面積を得るために各周波数区間
のレベルを総計することによって計算される。その後、
スペクトルは線型関数でたたみ込まれ積算されて、線型
たたみ込み面積を提供する。これは、簡単な面積で比を
形成するのに利用され、無声発生の中心すなわち仮想周
波数の線型インジケータを提供する。
【0025】無声発生の中心すなわち仮想周波数を表示
するブロック36の出力は、次に時間重み付け平均回路
40へ連結される。時間重み付け平均回路40は、ロッ
クオンヒステリシス回路38によって発生された存在又
は不在信号と共に利用されてより平滑な操作を提供す
る。有声及び無声音のための存在又は不在インジケータ
は、一時的ノイズ又はドロップアウトが一般に制御の活
動化又は非活動化を引き起こさないように、ヒステリシ
ス処理を施されるのが好ましい。
【0026】時間重み付け平均回路40の出力は、次に
増幅され、制御信号として利用するために出力増幅器5
0へ連結される。制御信号は、マウスドライバ24へ連
結されて(図1参照)、第1軸でのカーソル16の動き
を制御する。本発明の記載された実施例では、増幅器5
0の第2出力は、以下に詳細に記載される方法でカーソ
ル16の図形的外観を変更するために利用されるのが好
ましい。カーソル16の外観のこの図形的変更は、1つ
の軸における有効な制御信号の存在を容易に示すために
利用される。
【0027】ローパスフィルタ52へ戻って参照して、
有声発生の処理について説明する。上記のように、ロー
パスフィルタ52の出力は、アナログ−デジタル変換回
路54へ連結される。その後、そこで発生されたデジタ
ル信号は、デジタルコンピュータ技術において当業者に
よく知られた方法で処理される。アナログ−デジタル変
換器54の出力は、ピッチ抽出回路56へ連結されるの
が好ましい。ピッチ抽出回路56は、当該技術で周知の
どんなピッチ抽出回路を利用しても実行され得るが、本
発明の記載された実施例は、当該技術で周知のタイプの
付加的な自己相関ピッチ抽出器を有効に利用する。上記
のように、ピッチ抽出回路56から存在又は不在信号が
発生されて、ロックオンヒステリシス回路58へ連結さ
れて、上記のように利用されて、一時的性質のノイズ信
号又はドロップアウトが制御信号を活動化又は非活動化
するのを妨げる。
【0028】再びピッチ抽出回路56を参照して、有声
発生のピッチを表示する出力は、次に時間重み付け平均
回路60へ連結されて、無声発生に関して上記に記載し
たように処理される。上記のように、存在又は不在表示
のヒステリシス処理は、有効制御信号が存在することを
保証するために利用される。本発明の記載された実施例
では、制御信号の存在又は不在と見なすために、約10
0ミリ秒の遅延を利用する。
【0029】認定期間を持ちこたえることにより無声制
御信号が一度有効と考えられると、ロックオンヒステリ
シス回路38の出力は活動中になり、そしてすぐ、リー
ディングエッジ検出器42がロックオン状態の入手を認
め、時間重み付け平均回路40をブロック36からの入
力時に存在した値へ初期化する。リーディングエッジ検
出器42の出力はまた信号ゲート44を活動化し、平均
回路40からの初期値出力をメモリ46に記憶する。そ
の後、全ての連続読み取りがメモリ46に記憶されたリ
ファレンス値と差動比較器48によって比較され、発声
の始まりから生じた相対的な増加又は減少を計算する。
従って、もしユーザーが制御を開始して、歯擦仮想周波
数を増大させると、カーソルの速度は正の方向に増大す
る。更に、ロックオンヒステリシス回路38は、ロック
オン状態の間のみ信号がマウスドライバへ通過されるよ
うに出力増幅器50を可能にする働きをする。
【0030】上記と同一の相互作用は、リーディングエ
ッジ検出器60、信号ゲート64、リファレンスメモリ
66、差動比較器68及び増幅器70の機能によって、
発声の有声様相の初期ロックオンに適合する。同様に、
もしユーザーが制御を開始して、ピッチを増大したら、
カーソルの速度は所定軸にそって正方向に増大する。
【0031】本発明の記載された実施例では、上昇ピッ
チが持続される限りは、カーソルは動き続ける。制御発
声開始に利用された初期ピッチへ戻るか、又は発声を全
く停止するかによって、カーソルの動きは停止する。当
業者は勿論、制御発声のピッチ又は仮想周波数の値をこ
の初期値より低くすることによって、カーソルがそれぞ
れの軸に沿って反対方向に移動させられることがわかる
であろう。上記のように、増幅器70の出力は、マウス
ドライバ24(図1参照)へ連結されて、第2軸でのカ
ーソル16の動きを制御するのが好ましい。また、増幅
器70の第2出力は、カーソル16の外観を以下により
詳細に説明されるようにして図形的に変更するために利
用される。
【0032】図3(A)〜図3(C)を参照すると、本
発明の方法及び装置に従って造られた、図形的に変更さ
れたカーソル16の絵画図が示されている。図示される
ように、図3(A)〜図3(C)では、カーソル16は
コンピュータシステム10のディスプレイスクリーン1
4(図1参照)内に示されている。図3(A)中では、
カーソル16は、カーソル16を形成する矢じりの左半
分に暗部72を含む。本発明の記載された実施例では、
矢じり16の左半分の暗部72の存在は、水平軸の有効
制御信号の存在を示す。従って、カーソル16を口頭で
再配置しようとするコンピュータシステム10のユーザ
ーは、カーソル16の表示を参照することによって、有
効制御信号が口頭で発生されたことを視覚的に確認でき
る。
【0033】勿論、第2暗部領域74は、図3(B)に
示されるように、鉛直軸の有効制御信号の存在を示すた
めに利用される。この方法で、ユーザーは、彼又は彼女
がカーソル16を鉛直方向に再配置するために適切な口
頭コマンドを正確に発生したことを確認するであろう。
【0034】最後に、オペレータが有声及び無声制御発
声を同時に発生して、カーソル16を図3(C)に示さ
れるように斜めに移動させる場合には、カーソル16内
で暗部72及び74は図3(C)に示されるように図形
的に表示される。
【0035】以上を参照して、当業者は、音声発生を利
用して精密な移動でカーソルを線型制御する新規な方法
を本発明の出願人が提供したことを理解するであろう。
ディスプレイスクリーン14内でカーソル16を線型に
再配置するためにこれらの音声発生の選択された線型可
変音響特性を利用することによって、及びユーザーが選
択された範囲に渡って音響特性を線型に容易に変えられ
るようにこれらの音響特性を注意深く選択することによ
って、本発明の方法及び装置は、ディスプレイスクリー
ン14内でカーソル16の配置を急速且つ正確に制御す
る技法を提供する。
【0036】本発明は、好ましい態様を参照して特に示
され記載されたが、本発明の精神及び範囲から逸脱する
ことなく、形式及び詳細に種々の変化が成され得ること
は、当業者によって理解されるであろう。
【0037】
【発明の効果】上記に説明したように、本発明の方法及
び装置によって、コンピュータシステム内のカーソル位
置を口頭のコマンドによって精密に制御することが可能
になった。
【図面の簡単な説明】
【図1】本発明の方法及び装置を実行するために利用さ
れるコンピュータシステムの一部略図及び一部絵画図で
ある。
【図2】図1のインターフェース回路の略図である。
【図3】(A)、(B)及び(C)は、本発明の方法及
び装置に従って形成された図形的に変更されたカーソル
の絵画図である。
【符号の説明】
10 コンピュータシステム 12 ディスプレイ装置 14 ディスプレイスクリーン 16 カーソル 18 プロセッサ 20 キーボード 22 図形ポインティング装置 24 マウスドライバ 26 マイクロフォン 28 インターフェース回路

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 選択された位置に表示されたカーソルを
    有するディスプレイスクリーンを含むコンピュータシス
    テムにおいて精密なカーソル動作を線型音声制御するた
    めの方法であって、 音声発生を検出するステップと、 前記音声発生の少なくとも1つの線型可変音響特性を決
    定するステップと、 前記少なくとも1つの音響特性の変動に応答して前記カ
    ーソルの位置を線型に変えるステップと、 を含む線型音声制御方法。
  2. 【請求項2】 少なくとも1つの線型可変音響特性を決
    定する前記ステップは、前記音声発生のピッチを決定す
    るステップを含む請求項1記載の線型音声制御方法。
  3. 【請求項3】 更に、前記ディスプレイスクリーン内に
    前記音声発生の検出の図形的表示を提供するステップを
    含む請求項1記載の線型音声制御方法。
  4. 【請求項4】 前記ディスプレイスクリーン内に前記音
    声発生の検出の図形的表示を提供する前記ステップは、
    前記カーソルの外観を図形的に変えるステップを含む請
    求項3記載の線型音声制御方法。
  5. 【請求項5】 前記音声発生の少なくとも1つの線型可
    変音響特性を決定する前記ステップは、前記音声発生の
    第1の線型可変音響特性と第2の線型可変音響特性を決
    定するステップを含むと共に、前記カーソルの位置は、
    前記第1の音響特性の変動に応答して第1の軸で線型に
    変えられ、且つ前記第2の音響特性の変動に応答して第
    2の軸で線型に変えられる請求項1記載の線型音声制御
    方法。
  6. 【請求項6】 前記第2の線型可変音響特性を決定する
    前記ステップは、無声音発生の仮想周波数を決定するス
    テップを含む請求項5記載の線型音声制御方法。
  7. 【請求項7】 選択された位置に表示されたカーソルを
    有するコンピュータディスプレイシステムにおいてカー
    ソル位置を線型音声制御するための装置であって、 音声発生を検出するための音響入力手段と、 前記音声発生の少なくとも1つの線型可変音響特性を決
    定するための、前記音響入力手段に連結された発声分析
    手段と、 前記少なくとも1つの音響特性の変動に応答して前記カ
    ーソルの位置を線型に変えるための、前記発声分析手段
    へ連結されたカーソル位置決め手段と、 を備える線型音声制御装置。
  8. 【請求項8】 前記少なくとも1つの線型可変音響特性
    がピッチを含む請求項7記載の線型音声制御装置。
  9. 【請求項9】 前記音響入力手段は、マイクロフォンを
    含む請求項7記載の線型音声制御装置。
  10. 【請求項10】 前記発声分析手段は、有声音発生及び
    無声音発生を検出するための手段を含む請求項7記載の
    線型音声制御装置。
  11. 【請求項11】 前記発声分析手段が有声音発生のピッ
    チを検出すると共に、前記カーソル位置決め手段が前記
    ピッチの変動に応答して第1軸での前記カーソル位置を
    線型に変える請求項10記載の線型音声制御装置。
  12. 【請求項12】 前記発声分析手段が無声音発生の仮想
    周波数を決定するための手段を含むと共に、前記カーソ
    ル位置決め手段が前記仮想周波数の変動に応答して第2
    軸での前記カーソル位置を線型に変える請求項11記載
    の線型音声制御装置。
JP3263204A 1990-12-26 1991-09-13 線型音声制御方法及び装置 Expired - Fee Related JP2940842B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/633,882 US5133011A (en) 1990-12-26 1990-12-26 Method and apparatus for linear vocal control of cursor position
US633882 1990-12-26

Publications (2)

Publication Number Publication Date
JPH06342365A true JPH06342365A (ja) 1994-12-13
JP2940842B2 JP2940842B2 (ja) 1999-08-25

Family

ID=24541511

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3263204A Expired - Fee Related JP2940842B2 (ja) 1990-12-26 1991-09-13 線型音声制御方法及び装置

Country Status (5)

Country Link
US (1) US5133011A (ja)
EP (1) EP0493295B1 (ja)
JP (1) JP2940842B2 (ja)
CA (1) CA2055543C (ja)
DE (1) DE69131009T2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006268510A (ja) * 2005-03-24 2006-10-05 Nifty Corp コンピュータ制御方法,マウス制御音出力プログラム及びマウス制御プログラム
US7286991B2 (en) 2002-05-30 2007-10-23 International Business Machines Corporation Computer, display control device, pointer position control method, and program
WO2008139550A1 (ja) * 2007-05-01 2008-11-20 Osaka Electro-Communication University 入力インタフェース装置
US7921364B2 (en) 2005-11-03 2011-04-05 Nuance Communications, Inc. Controlling a computer user interface with sound
JP2012074030A (ja) * 2010-09-29 2012-04-12 Sony Corp 情報処理機構を有する電子デバイスシステム及びその作動方法
JP2012098892A (ja) * 2010-11-01 2012-05-24 Casio Comput Co Ltd 位置入力装置、位置入力方法及びプログラム

Families Citing this family (189)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03163623A (ja) * 1989-06-23 1991-07-15 Articulate Syst Inc 音声制御コンピュータ・インターフェース
US5386494A (en) * 1991-12-06 1995-01-31 Apple Computer, Inc. Method and apparatus for controlling a speech recognition function using a cursor control device
WO1993014454A1 (en) * 1992-01-10 1993-07-22 Foster-Miller, Inc. A sensory integrated data interface
EP0633520B1 (en) * 1993-07-01 2000-09-20 Koninklijke Philips Electronics N.V. Remote control having voice input
SE502013C2 (sv) * 1994-03-08 1995-07-17 Hassan Toosi Talstyrd inmatningsanordning med logiskt standardgränssnitt
JP3267047B2 (ja) * 1994-04-25 2002-03-18 株式会社日立製作所 音声による情報処理装置
US5497337A (en) * 1994-10-21 1996-03-05 International Business Machines Corporation Method for designing high-Q inductors in silicon technology without expensive metalization
US5646647A (en) * 1994-11-14 1997-07-08 International Business Machines Corporation Automatic parking of cursor in a graphical environment
DE69529399T2 (de) * 1994-11-17 2003-10-30 Koninkl Philips Electronics Nv Gerät mit einem bildschirm mit aktivem und passivem modus
EP0817002A3 (en) * 1996-07-01 2001-02-14 International Business Machines Corporation Speech supported navigation of a pointer in a graphical user interface
US5920841A (en) * 1996-07-01 1999-07-06 International Business Machines Corporation Speech supported navigation of a pointer in a graphical user interface
US5897614A (en) * 1996-12-20 1999-04-27 International Business Machines Corporation Method and apparatus for sibilant classification in a speech recognition system
US7630895B2 (en) * 2000-01-21 2009-12-08 At&T Intellectual Property I, L.P. Speaker verification method
US6076055A (en) * 1997-05-27 2000-06-13 Ameritech Speaker verification method
US6408087B1 (en) 1998-01-13 2002-06-18 Stmicroelectronics, Inc. Capacitive semiconductor user input device
US6075534A (en) * 1998-03-26 2000-06-13 International Business Machines Corporation Multiple function graphical user interface minibar for speech recognition
DE19816933A1 (de) 1998-04-16 1999-10-21 Nokia Mobile Phones Ltd Verfahren zum Steuern einer elektronischen Einrichtung, insbesondere einer Mobilstation eines Mobilfunknetzes
US7386600B1 (en) * 1998-09-11 2008-06-10 Lv Partners, L.P. Launching a web site using a personal device
US7440993B1 (en) 1998-09-11 2008-10-21 Lv Partners, L.P. Method and apparatus for launching a web browser in response to scanning of product information
US7370114B1 (en) 1998-09-11 2008-05-06 Lv Partners, L.P. Software downloading using a television broadcast channel
US7392945B1 (en) * 1998-09-11 2008-07-01 Lv Partners, L.P. Portable scanner for enabling automatic commerce transactions
US7379901B1 (en) 1998-09-11 2008-05-27 Lv Partners, L.P. Accessing a vendor web site using personal account information retrieved from a credit card company web site
US6704864B1 (en) 1999-08-19 2004-03-09 L.V. Partners, L.P. Automatic configuration of equipment software
US7191247B1 (en) * 1998-09-11 2007-03-13 Lv Partners, Lp Method for connecting a wireless device to a remote location on a network
US6745234B1 (en) 1998-09-11 2004-06-01 Digital:Convergence Corporation Method and apparatus for accessing a remote location by scanning an optical code
US6823388B1 (en) 1998-09-11 2004-11-23 L.V. Parners, L.P. Method and apparatus for accessing a remote location with an optical reader having a programmable memory system
US7284066B1 (en) 1998-09-11 2007-10-16 Lv Partners, Lp Method and apparatus for matching a user's use profile in commerce with a broadcast
US7536478B2 (en) 1998-09-11 2009-05-19 Rpx-Lv Acquisition Llc Method and apparatus for opening and launching a web browser in response to an audible signal
US7792696B1 (en) * 1998-09-11 2010-09-07 RPX-LV Acquisition, LLC Method and apparatus for allowing a broadcast to remotely control a computer
US6868433B1 (en) 1998-09-11 2005-03-15 L.V. Partners, L.P. Input device having positional and scanning capabilities
US6636896B1 (en) 1998-09-11 2003-10-21 Lv Partners, L.P. Method and apparatus for utilizing an audibly coded signal to conduct commerce over the internet
US6594632B1 (en) * 1998-11-02 2003-07-15 Ncr Corporation Methods and apparatus for hands-free operation of a voice recognition system
US7206747B1 (en) 1998-12-16 2007-04-17 International Business Machines Corporation Speech command input recognition system for interactive computer display with means for concurrent and modeless distinguishing between speech commands and speech queries for locating commands
US6233560B1 (en) 1998-12-16 2001-05-15 International Business Machines Corporation Method and apparatus for presenting proximal feedback in voice command systems
US6192343B1 (en) 1998-12-17 2001-02-20 International Business Machines Corporation Speech command input recognition system for interactive computer display with term weighting means used in interpreting potential commands from relevant speech terms
US8275617B1 (en) 1998-12-17 2012-09-25 Nuance Communications, Inc. Speech command input recognition system for interactive computer display with interpretation of ancillary relevant speech query terms into commands
US6937984B1 (en) 1998-12-17 2005-08-30 International Business Machines Corporation Speech command input recognition system for interactive computer display with speech controlled display of recognized commands
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US20020138656A1 (en) * 2001-03-23 2002-09-26 Neil Hickey System for and method of providing interfaces to existing computer applications
US6983307B2 (en) * 2001-07-11 2006-01-03 Kirusa, Inc. Synchronization among plural browsers
ITFI20010199A1 (it) 2001-10-22 2003-04-22 Riccardo Vieri Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico
US20050083300A1 (en) * 2003-10-20 2005-04-21 Castle Daniel C. Pointer control system
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7633076B2 (en) 2005-09-30 2009-12-15 Apple Inc. Automated response to and sensing of user activity in portable devices
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9053089B2 (en) 2007-10-02 2015-06-09 Apple Inc. Part-of-speech tagging using latent analogy
US8620662B2 (en) 2007-11-20 2013-12-31 Apple Inc. Context-aware unit selection
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8065143B2 (en) 2008-02-22 2011-11-22 Apple Inc. Providing text input using speech data and non-speech data
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8464150B2 (en) 2008-06-07 2013-06-11 Apple Inc. Automatic language identification for dynamic text processing
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8768702B2 (en) 2008-09-05 2014-07-01 Apple Inc. Multi-tiered voice feedback in an electronic device
US8898568B2 (en) 2008-09-09 2014-11-25 Apple Inc. Audio user interface
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8583418B2 (en) 2008-09-29 2013-11-12 Apple Inc. Systems and methods of detecting language and natural language strings for text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US8862252B2 (en) 2009-01-30 2014-10-14 Apple Inc. Audio user interface for displayless electronic device
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US10540976B2 (en) 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8682649B2 (en) 2009-11-12 2014-03-25 Apple Inc. Sentiment prediction from textual data
US8600743B2 (en) 2010-01-06 2013-12-03 Apple Inc. Noise profile determination for voice-related feature
US8381107B2 (en) 2010-01-13 2013-02-19 Apple Inc. Adaptive audio feedback system and method
US8311838B2 (en) 2010-01-13 2012-11-13 Apple Inc. Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
DE112011100329T5 (de) 2010-01-25 2012-10-31 Andrew Peter Nelson Jerram Vorrichtungen, Verfahren und Systeme für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8713021B2 (en) 2010-07-07 2014-04-29 Apple Inc. Unsupervised document clustering using latent semantic density analysis
US8719006B2 (en) 2010-08-27 2014-05-06 Apple Inc. Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis
US8719014B2 (en) 2010-09-27 2014-05-06 Apple Inc. Electronic device with text error correction based on voice recognition data
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US10515147B2 (en) 2010-12-22 2019-12-24 Apple Inc. Using statistical language models for contextual lookup
US8781836B2 (en) 2011-02-22 2014-07-15 Apple Inc. Hearing assistance system for providing consistent human speech
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10672399B2 (en) 2011-06-03 2020-06-02 Apple Inc. Switching between text data and audio data based on a mapping
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8812294B2 (en) 2011-06-21 2014-08-19 Apple Inc. Translating phrases from one language into another using an order-based set of declarative rules
US8706472B2 (en) 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US8775442B2 (en) 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
US10019994B2 (en) 2012-06-08 2018-07-10 Apple Inc. Systems and methods for recognizing textual identifiers within a plurality of words
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US8935167B2 (en) 2012-09-25 2015-01-13 Apple Inc. Exemplar-based latent perceptual modeling for automatic speech recognition
DE212014000045U1 (de) 2013-02-07 2015-09-24 Apple Inc. Sprach-Trigger für einen digitalen Assistenten
US10572476B2 (en) 2013-03-14 2020-02-25 Apple Inc. Refining a search based on schedule items
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US9977779B2 (en) 2013-03-14 2018-05-22 Apple Inc. Automatic supplementation of word correction dictionaries
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10642574B2 (en) 2013-03-14 2020-05-05 Apple Inc. Device, method, and graphical user interface for outputting captions
US9733821B2 (en) 2013-03-14 2017-08-15 Apple Inc. Voice control to diagnose inadvertent activation of accessibility features
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
KR101904293B1 (ko) 2013-03-15 2018-10-05 애플 인크. 콘텍스트-민감성 방해 처리
US11151899B2 (en) 2013-03-15 2021-10-19 Apple Inc. User training by intelligent digital assistant
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014144949A2 (en) 2013-03-15 2014-09-18 Apple Inc. Training an at least partial voice command system
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
DE112014002747T5 (de) 2013-06-09 2016-03-03 Apple Inc. Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的系统和方法
AU2014306221B2 (en) 2013-08-06 2017-04-06 Apple Inc. Auto-activating smart responses based on activities from remote devices
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61235941A (ja) * 1985-04-11 1986-10-21 Nec Corp カ−ソル制御装置
JPS62157938A (ja) * 1985-12-28 1987-07-13 Fujitsu Ltd 音声によるカ−ソル位置制御方式

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62284424A (ja) * 1986-06-02 1987-12-10 Fujitsu Ltd 音声によるカ−ソル位置制御方式
NL8601938A (nl) * 1986-07-28 1988-02-16 Philips Nv Opspaninrichting voor het op een aandrijfspil opspannen van een optische plaat.
US5068645A (en) * 1987-10-14 1991-11-26 Wang Laboratories, Inc. Computer input device using an orientation sensor
JPH01290031A (ja) * 1988-05-17 1989-11-21 Sharp Corp 音声入力可能な処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61235941A (ja) * 1985-04-11 1986-10-21 Nec Corp カ−ソル制御装置
JPS62157938A (ja) * 1985-12-28 1987-07-13 Fujitsu Ltd 音声によるカ−ソル位置制御方式

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7286991B2 (en) 2002-05-30 2007-10-23 International Business Machines Corporation Computer, display control device, pointer position control method, and program
US7870002B2 (en) 2002-05-30 2011-01-11 Nuance Communications, Inc. Computer, display control device, pointer position control method, and program
JP2006268510A (ja) * 2005-03-24 2006-10-05 Nifty Corp コンピュータ制御方法,マウス制御音出力プログラム及びマウス制御プログラム
US7921364B2 (en) 2005-11-03 2011-04-05 Nuance Communications, Inc. Controlling a computer user interface with sound
WO2008139550A1 (ja) * 2007-05-01 2008-11-20 Osaka Electro-Communication University 入力インタフェース装置
JPWO2008139550A1 (ja) * 2007-05-01 2010-07-29 学校法人 大阪電気通信大学 入力インタフェース装置
JP2012074030A (ja) * 2010-09-29 2012-04-12 Sony Corp 情報処理機構を有する電子デバイスシステム及びその作動方法
JP2012098892A (ja) * 2010-11-01 2012-05-24 Casio Comput Co Ltd 位置入力装置、位置入力方法及びプログラム

Also Published As

Publication number Publication date
EP0493295B1 (en) 1999-03-17
DE69131009D1 (de) 1999-04-22
CA2055543A1 (en) 1992-06-27
EP0493295A3 (en) 1993-01-27
EP0493295A2 (en) 1992-07-01
US5133011A (en) 1992-07-21
DE69131009T2 (de) 1999-10-07
CA2055543C (en) 1996-05-14
JP2940842B2 (ja) 1999-08-25

Similar Documents

Publication Publication Date Title
JP2940842B2 (ja) 線型音声制御方法及び装置
US20210366508A1 (en) Vowel sensing voice activity detector
US9934775B2 (en) Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US10303436B2 (en) Assistive apparatus having accelerometer-based accessibility
US10409552B1 (en) Speech-based audio indicators
JPH05216618A (ja) 音声対話システム
Kostov et al. Emotion in user interface, voice interaction system
Sundaram et al. Automatic acoustic synthesis of human-like laughter
Qin et al. Proximic: Convenient voice activation via close-to-mic speech detected by a single microphone
JP3399674B2 (ja) 画面制御装置とその方法
Seipp et al. BackPat: one-handed off-screen patting gestures
JP4906776B2 (ja) 音声制御装置
KR102252665B1 (ko) 오디오 파일 재생 방법 및 장치
Rekimoto et al. Derma: silent speech interaction using transcutaneous motion sensing
US20110044473A1 (en) Sound source playing apparatus for compensating output sound source signal and method of compensating sound source signal output from sound source playing apparatus
US20030040916A1 (en) Voice driven mouth animation system
Kuchenbecker Voice balance—a spirit level based on vocal sounds
JPWO2020116001A1 (ja) 情報処理装置および情報処理方法
JP3744161B2 (ja) 音声指示装置および音声指示情報記憶媒体
WO2020102943A1 (zh) 手势识别模型的生成方法、装置、存储介质及电子设备
JPS62157938A (ja) 音声によるカ−ソル位置制御方式
Su et al. Low-cost human computer interfaces for the disabled
WO2019187543A1 (ja) 情報処理装置および情報処理方法
EP1147516A1 (en) Voice driven mouth animation system
JP2599974B2 (ja) 音声検出方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees