JP4812941B2 - 注目期間を有する音声入力装置 - Google Patents

注目期間を有する音声入力装置 Download PDF

Info

Publication number
JP4812941B2
JP4812941B2 JP2000592724A JP2000592724A JP4812941B2 JP 4812941 B2 JP4812941 B2 JP 4812941B2 JP 2000592724 A JP2000592724 A JP 2000592724A JP 2000592724 A JP2000592724 A JP 2000592724A JP 4812941 B2 JP4812941 B2 JP 4812941B2
Authority
JP
Japan
Prior art keywords
command
period
mode
interest
activation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000592724A
Other languages
English (en)
Other versions
JP2002534716A (ja
Inventor
ヴィンセンティウス ピー バイル
ポール エー ピー カウフホルツ
ルーカス ジェイ エフ グールツ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2002534716A publication Critical patent/JP2002534716A/ja
Application granted granted Critical
Publication of JP4812941B2 publication Critical patent/JP4812941B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Selective Calling Equipment (AREA)
  • Details Of Television Systems (AREA)

Description

【0001】
【技術分野】
本発明は、機器を制御する装置であって、該装置が、音声入力を受信する受信ユニットと、該受信された入力を解析して命令を認識する解析ユニットと、該命令を上記機器に送信する送信ユニットと、当該装置を上記機器の実際の制御のために動作していない待機モードから上記機器の実際の制御のために動作する作動モードへ切り換える活性化ユニットとを有するような装置に関する。
【0002】
また、本発明は斯かる装置を有する遠隔制御器にも関する。
【0003】
また、本発明は複数の斯様な装置を有するシステムにも関する。
【0004】
また、本発明は機器を制御する方法であって、該方法が、音声入力を受信する受信ステップと、該受信された入力を解析して命令を認識する解析ステップと、該命令を上記機器に送信する送信ステップと、上記命令の認識及び送信を可能にする活性化ステップとを有するような方法に関する。
【0005】
【背景技術】
このような装置は、マイクロソフト・エージェントAPI(アプリケーション・プログラミング・インターフェース)を用いて、エージェントとして実施化することができる。マイクロソフト・コーポレーションから入手可能な1997年8月発行の“マイクロソフト・エージェント用の設計キャラクタ”なる文献は、エージェントを如何にして機器のインターフェースの一部として開発するかを記載している。マイクロソフト・エージェントによれば、機器はコンピュータ上で動作するクライアント・アプリケーション・プログラムである。該エージェントはユーザに対して異なるアニメーションを用いたキャラクタとして表示され、これにより当該エージェントの実際の状態に応じて実際のアニメーションが選択される。マウス及びキーボードを介しての命令に加えて、該エージェントは音声入力を介しての命令を受信することができる。これを実現するため、ユーザは、所謂プッシュ/トーク・ホット・キーを押すことにより該エージェントを聴話モードにする。これにより、該エージェントは音声入力を知覚するようになり、ユーザは所望の命令又は複数の命令を話すことができる。該エージェントが聴話状態に入ったことを視覚化するために、対応する聴話アニメーションが画面上に表示される。聴話状態においては、エージェントは音声入力における命令を認識しようとする。該エージェントが命令を認識したら、この命令は、実行のために、当該エージェントが割り当てられたクライアント・アプリケーション・プログラムに伝送される。
【0006】
【発明の開示】
本発明の一つの目的は、既知の装置よりもユーザが使い易い冒頭で述べたような装置を提供することにある。
【0007】
本発明によれば、この目的は、前記活性化ユニットが音声入力を受信すると共に、受信された該音声入力を解析して活性化命令を認識し、且つ、該活性化命令を認識すると当該装置を前記待機モードから前記作動モードに切り換えるように構成されていることを特徴とする装置において達成される。ユーザは、上記活性化命令を話すことにより本発明による上記装置を作動モードにすることができ、ユーザは特別なキーを押す必要がない。このことは、この装置が斯様な特別なキーを必要としないことを意味する。更に、ユーザは当該装置を物理的に操作する必要がない。何故なら、音声入力のみが必要とされ、手作業無しで操作が完了するからである。このことは、ユーザが当該機器の制御に加えて他の仕事を行っている状況では特に有利である。斯様な状況の一例は、車を運転しながら、カーラジオ又は自動車電話を操作する場合である。本発明による装置には物理的に接触する必要はないので、ユーザは、該ユーザにより話される入力が当該装置において受信され得る限りにおいて該装置から或る距離離れてさえしてもよい。
【0008】
本発明による装置の一実施例が、請求項2に記載されている。この装置は、或る期間にわたり命令が付与されないと、作動モードから待機モードへ自律的に切り替わるので、ユーザが該装置をはっきりと待機モードに切り換える必要はない。待機モードへの上記自律的な切換により、該装置が偶発的に作動モードに留まる可能性は殆どない。該装置は偶発的に作動モードに留まるべきでない。何故なら、その場合には、何らかの進行中の会話中の命令を認識し、これらの意図しない命令を実行のために被制御機器に送信してしまう可能性があるからである。ユーザが上記活性化命令を話した場合、該装置は、ユーザが上記機器を制御する命令の何れかを話してよい注目期間を提供する。斯様な命令が上記注目期間中に与えられない場合は、該装置は待機モードに戻る。この仕組みも、該装置の意図せぬ動作、及びそれに対応する上記機器の意図せぬ制御を防止する。待機モードの該装置が、会話から活性化命令を偶発的に拾ったとしても、該装置は続いて、その注目期間の間だけしか作動状態に留まらず、次いで待機モードに戻る。これは、上記機器の意図しない制御の可能性を低減する。
【0009】
本発明による装置の一実施例が、請求項3に記載されている。この装置は、該装置が作動モードに入ると可聴信号によりユーザに通知し、音声入力における命令に対して感知的となる。この通知の目的では、可聴信号の方が視覚信号より優れている。何故なら、視覚信号は、ユーザが画面又は該可視信号を表示する装置の一部に連続して注意を払うことを要するからである。従って、視覚信号は、特に意図せぬ作動モードへの投入の場合に通知されないままとなり得、かくして、ユーザは該装置のモードの変化に気が付かないままとなる。この装置の他の利点は、該装置が表示画面ないしで完全に動作し、かくして、製造コストを節約する点にある。
【0010】
本発明による装置の一実施例が、請求項4に記載されている。注意信号が、ユーザに上記注目期間中の時間の進行を通知すると共に、ユーザに当該装置が作動モードにあり、音声入力を介して命令を受信する準備ができていることを再び通知するために使用される。
【0011】
本発明による装置の一実施例が、請求項5に記載されている。終了信号は、ユーザに対して、当該装置が最早作動モードにはなく、従って音声入力における命令に対して感知的でないことを通知する。この装置は、待機モードと作動モードとの間の容易且つ明確な切換により、機器のユーザが使い易い且つ柔軟性のある制御を見込んでいる。前記活性化命令を認識すると、当該装置は、ユーザに対して該装置が音声入力における命令に対して感知的である注目期間の開始を通知するような開始信号を生成する。そして、該装置は認識された命令を実行のために上記機器に送信する。所定の期間の間に何の命令も付与及び認識されない場合は、当該装置は時間切れとなり、上記注目期間の終了を示すと共に該装置が最早音声入力における命令に対して感知的でないことを示す終了信号を生成する。2つの命令の間の期間が上記所定の“時間切れ”期間よりも短い限り、該装置は作動モードに留まり、音声入力における命令を受信する用意ができている。
【0012】
テレビジョン受像機又はハイファイセットのような機器を制御するために遠隔制御器を使用することは良く知られている。被制御機器の機能は、該遠隔制御器上の対応するキー及びキーの組み合わせを押すことにより活性化又は調整することができる。斯かる遠隔制御器上のキーを押す結果、該遠隔制御器により例えば赤外線のような無線の符号化された信号が送信される。この信号は上記機器において受信され、対応する作用に変換される。例としては、ハイファイセットの音量設定を調整する、及びテレビジョン受像機上のチャンネルを選択する等が挙げられる。このように、命令は当該遠隔制御器上のキーを押すことにより与えられ、該命令は各遠隔制御器により制御される機器により実行される。
【0013】
遠隔制御器には、本発明による装置を有効に備えることができる。この場合、該遠隔制御器によりサポートされる命令の幾つかは、音声入力として与えることができる。これは、同じ命令がサポートされねばならない場合、該遠隔制御器上の所要のキーの数を減少させる。他の例として、本発明による装置により新たな命令がサポートされる場合には、該遠隔制御器はキーの数を増やすことなく多数の命令をサポートすることが可能である。更に、該遠隔制御器の全ての命令が本発明による装置によりサポートされるようにし、かくして、遠隔制御器を全く命令キーを備えないものとすることも可能である。
【0014】
多数の制御されるべき機器を有するシステムは、この制御のために各々の装置を有する。斯様なシステムにおいては、各装置が自身の固有な活性化命令を有しているのが有利である。何故なら、その場合には、単一の装置を作動モードにし、他の装置を待機モードのままとするのが容易であるからである。ユーザは、単に、所望の機器を制御する装置の活性化命令を話し、次いで該機器用の命令を話せばよい。他の機器は、命令の幾つかが目下制御されている機器用のものと同一であっても、応答することはない。何故なら、それらの装置は、斯かる命令を認識及び送信しない待機モードにあるからである。このシステムの上記装置の1以上は1つの総合装置に統合することもできる。この総合装置は、対応する活性化命令が受信及び認識された後、上記装置のうちの当該1つのものの仕事を実行する。
【0015】
上記被制御機器は、種々の種類のものの1つとすることができる。例えば、該機器は、テレビジョン受像機又はコンピュータ上で走るアプリケーション・プログラムのような単一の独立した機器とすることができる。この目的のため、本発明による装置は、異なる実施例を有することができる。該装置は、遠隔制御器のような、単独で動作し、且つ、認識された命令を無線リンクを介して機器に送信するような別体の装置とすることができる。また、該装置は、コンピュータ上で走ると共にアプリケーション・プログラムに対するインターフェースの一部を形成するようなソフトウェアとして実施化することもできる。その場合、該装置は当該被制御アプリケーション・プログラムに対して、命令をソフトウェア・プロトコルにおけるパラメータとして送信し、これにより或るソフトウェア・コンポーネントが他のソフトウェア・コンポーネントを或るパラメータ集合を用いて呼び出すようにする。更に、該装置は上記被制御機器に、例えば専用ハードウェア・ユニットとして、統合することができ、かくして、単一の物理的機器を形成する。その場合には、命令のはっきりした送信は存在せず、該装置は上記被制御機器を直接制御することができる。
【0016】
本発明の他の目的は、冒頭で述べたような方法であって、既知の方法よりもユーザが一層使い易い方法を提供することにある。本発明によれば、この目的は、前記活性化ステップが、音声入力を受信し、受信された前記入力を解析して活性化命令を認識し、前記活性化命令を認識すると前記命令の前記認識及び送信を可能にする、ような各副ステップを有していることを特徴とする方法において達成される。
【0017】
【発明を実施するための最良の形態】
以下、本発明及びその作用効果を実施例に基づき添付図面を参照して更に解説する。
【0018】
図1は、本発明による装置の最も重要な構成要素を概念的に示している。該装置100は、音声入力を用いて機器101を遠隔制御しようとするものである。該装置は、フィリップス社製のパームPC、ニノ(Nino)上で実施化される。該パームPCは、ウィンドウズCE・オペレーティング・システムを動作させる小さな物理的寸法のコンピュータであるので、手に容易に保持することができる。しかしながら、該装置は他の好適な型式のコンピュータ上でも実施化することができる。該装置は、ワーキング・メモリ104にロードされたプログラム命令を実行するプロセッサ102を有している。また、該装置は周辺機器と通信するためのインターフェース106も有している。更に、該装置は種々の構成要素間で命令及びデータを交換するためのバス108を有している。該装置に取り付けられるものとしては、該装置のユーザから音声を受信するためのマイクロフォン110及びユーザに対して可聴信号を発生するスピーカ112がある。更に、該装置は、該装置により制御される機器101に対して赤外線信号の形で命令を送信する送信機114を有している。
【0019】
該装置の種々のタスクは、当該装置の上記ワーキング・メモリにロードされるプログラム・モジュールにより実行される。マイクロフォン110により捕捉された音声入力を受信する受信モジュール116が設けられている。該音声入力は、或る単語及び句を認識するために解析モジュール118において解析される。該装置の待機モードにおいては、上記解析モジュールは音声入力における“Nino”なる単語を認識しようと試みる。この単語は当該装置の活性化命令であり、音声入力中で該単語が認識されたら、該装置は活性化ユニット120により作動モードに切り換えられる。該作動モードにおいては、前記解析モジュールは、機器101を制御するために使用される所定の命令集合からの命令を認識しようと試みる。命令が認識された場合、送信モジュール122は、該命令が送信機114により赤外線信号として送出されるよう準備する。更に、該装置は、前記活性化命令の認識後又は或る命令の認識後に経過した時間を測定するタイマ・モジュール124を有している。斯かる認識から所定の期間以上に経過したら、該装置は上記作動モードから待機モードに戻る。他の例として、該装置は特別な待機命令を用いて作動モードから待機モードに切り換えられることもできる。その場合には、作動モードにおいて認識される前記命令集合は該待機命令を含み、該待機命令は音声入力において認識されると機器101には送信されず、当該装置が待機モードになるようにする。従って、この代替え例では、ユーザははっきりと待機モードに切り換えることができる。
【0020】
音声認識を処理する上記モジュールは、Vocomなる音声認識ソフトウェア・パッケージに基づいて実施化されている。装置100は、上記機器に対して意図しない命令を伝送する可能性を減らすために、待機モード及び作動モードを有している。当該装置が作動モードのみしか有していないとしたら、命令が進行中の会話中で誤って認識されてしまう可能性が存在することになる。このように認識された命令は機器101に送信され、該機器により実行されてしまうであろう。上記待機モードにおいては、当該装置は前記活性化命令の認識に関してのみ感知的であり、他の話し命令には応答しないであろう。この構成は、意図しない命令の認識及び実行の危険性を低減する。意図しない命令の認識により発生するエラーは挿入エラーとしても知られている。何故なら、命令が誤って挿入されたかのように見えるからである。
【0021】
本発明による装置の一実施例は、ユーザにモード又はモードの変更に関して通知する可聴信号を生成する通知モジュール126を有している。当該装置が作動モードに切り換えられた場合、該通知モジュールは“それで?(Yes?)”なる句である開始信号を生成する。この句はスピーカ112により再生される。該開始信号は、上記機器を制御する目的の音声入力における命令に対して該装置が感知的となる注目期間の開始を示す。何の命令も認識されない場合、上記注目期間より短い所定の期間後に、上記通知モジュールは注意信号を生成してユーザに注目期間の経過を通知する。該注意信号は、“それで?(Well?)”なる句として実施化され、当該装置が依然として音声入力における命令を待つ作動モードにあることをユーザに対して示す。該注目期間の全期間の間に何の命令も認識されない場合は、上記通知モジュールは終了信号を生成して、当該装置が待機モードに戻ったことを示す。該終了信号は、聴者から興味を失ったことをまねた、あくびのような音として実施化される。上記の代わりとして、上記注目期間の活性は、該注目期間の間に邪魔にならない音を発生させることにより聴覚的に示すことも可能である。その場合には、該注目期間の過程は発生される音の変化により示すことができる。この場合、上記の発生される音は、該注目期間の進行と調和させて変化される。例えば、該音の周波数が、該注目期間がその終了に向かって進むにつれて益々高くなる。
【0022】
図2は、本発明の装置の一実施例における主要なステップを伴うフローチャートを示している。ステップ202においては音声入力が解析され、ステップ204においては該入力において“Nino”なる活性化命令が認識されたかが判断される。そうでない場合は、制御はステップ202に戻され、更なる音声入力を解析する。ステップ204において活性化命令が認識された場合は、ステップ205において前記開始信号が付与され、ステップ206において該装置の注目期間が開始される。この場合、該装置はステップ208において音声入力における命令を受信及び認識して前記機器を制御すべく活動状態になる。ステップ210において命令が認識されると、この命令はステップ212において上記被制御機器に送信される。該装置は音声入力における命令の更なる受信のために作動モードに留まるので、ステップ206において新たな注目期間が開始される。ステップ210において何の命令も認識されないと判断されると(これは、何の命令も全く与えられないという事実によっても生じ得る)、ステップ214において当該注目期間の第1部分が既に経過したかが判断される。該第1期間が経過していた場合は、ステップ216において注意信号が付与されると共に、制御がステップ208に渡され、当該注目期間の残部に関して音声入力を解析する。依然として何の命令も認識されず、且つ、上記注意信号が付与された場合は、ステップ218において当該注目期間の全てが経過したかが判断される。そうでない場合は、制御はステップ208に戻され、更なる音声入力を解析する。しかしながら、該注目期間が経過した場合は、ステップ220において前記終了信号が付与され、当該装置は待機モードに切り換えられる。更に、実行はステップ202で継続され、音声入力において前記活性化命令が再び付与されたかが解析される。
【0023】
図3Aは本発明による遠隔制御器の平面図を示し、図3Bは本発明による該遠隔制御器の開放側面図を示している。該遠隔制御器は図1に関連して説明した装置100を有している。該遠隔制御器は、更に、音声入力を受信するためのマイクロフォン110を有すると共に、ユーザに対して信号を再生するためのスピーカ112を有することができる。ユーザにより話され且つ装置100により認識された命令は、赤外線信号302として被制御機器に送信される。該遠隔制御器は該被制御機器を制御するための多数の命令キー304を有することができる。その場合、一つのキーは、話し命令としても付与することができる命令に対応するか、又は当該キーを押すことにより専ら付与することが可能な命令に対応させることができる。本発明による遠隔制御器の一実施例においては、該遠隔制御器によりサポートされる全ての命令は音声入力において該装置100により認識することができる。斯かる実施例においては、上記遠隔制御器上には命令キーは必要とされない。
【0024】
図4は、本発明による多数の装置を備えるシステムを示している。これら装置の各々は、当該システムにおける各機器を制御するためのものである。装置402は機器404を制御し、装置406は機器408を制御し、装置410は機器412を制御する。前記制御命令は当該遠隔制御器により赤外線信号として送出され、これにより各装置は自身の被制御機器に対して特別に符号化された信号を使用する。この固有の符号化により、装置402により送信された赤外線信号414は機器404に対してのみ効果を有するが、該信号は上記機器の各々に到達し得る。本発明によれば、上記装置の各々は、特定の装置を待機モードから作動モードに切り換えるための、例えば装置402に対して符号416で示されるように、自身の固有の活性化命令を有している。ユーザは所望の機器を制御する装置の活性化命令を話すことができ、該装置は作動モードに切り替わる。ユーザにより話される後続の命令は、当該装置によってのみ認識され、この装置により該装置に関連する機器を制御するために送信される。他の装置は待機モードに留まり、如何なる命令も送信することはないであろう。従って、1以上の命令が異なる機器に対して同一であっても、当該機器の制御に問題が生じることはない。何故なら、1個のみの装置を作動モードに切り換える可能性が遥かに高いからである。
【0025】
他の例としては、装置402、406及び410を1つの制御装置に合成するものがある。この場合、これはバスを介して各被制御機器に接続され、特定の機器の固有の活性化命令が認識された場合に該機器をアドレス指定する。
【0026】
他の実施例においては、本発明の装置は表示器を備える。これは、被制御機器の表示器とすることもできる。この実施例においては、上記注目期間の開始が当該表示器上にアイコンの形で示される。他の例として、アイコンは当該装置を表すために使用することができ、該装置が待機モードから作動モードに切り替わる際に該アイコンは形を変化させる。この場合、該アイコンは作動モードにおいて或る命令が認識されたことを示すために使用することもできる。例えば、該事例がアニメーション化された人の場合、命令が正しく認識された場合、該人が頷くようにすることができる。この場合、上記注目期間の進行は、当該アイコンの大きさを変化させることにより示すことができ、かくして、該アイコンは上記注目期間の間に時間の経過に関連して縮む。
【図面の簡単な説明】
【図1】 図1は、本発明による装置の最も重要な構成要素を概念的に示す。
【図2】 図2は、本発明の装置の一実施例における主要なステップを伴うフローチャートを示す。
【図3A】 図3Aは、本発明による遠隔制御器の平面図を示す。
【図3B】 図3Bは、本発明による上記遠隔制御器の開放側面図を示す。
【図4】 図4は、本発明による複数の装置を備えるシステムを示す。
【符号の説明】
100…装置
101…機器
102…プロセッサ
110…マイクロフォン
112…スピーカ
114…送信機
116…受信モジュール
118…解析モジュール
120…活性化ユニット
122…送信モジュール
124…タイマ・モジュール
126…通知モジュール

Claims (9)

  1. 機器を制御する装置であって、
    ・音声入力を受信する受信ユニットと、
    ・当該受信された入力を解析して命令を認識する解析ユニットと、
    ・当該装置を、当該装置が前記機器の実際の制御のために作動していない待機モードから、当該装置が前記機器の実際の制御のために作動する作動モードへ切り換える活性化ユニットと、
    を有する装置であって、
    前記活性化ユニットは、音声入力を受信し、この受信された音声入力を解析して活性化命令を認識し、さらに前記活性化命令を認識すると当該装置を前記待機モードから前記作動モードに切り換えるように構成され、
    前記作動モードへ入った後に、前記機器を制御するための音声入力における命令に対して当該装置が感知的である注目期間を示す繰り返し可聴音を生成し、前記注目期間の終了に向かって前記可聴音の周波数が高くなるように構成されている装置。
  2. 請求項1に記載の装置であって、該装置は、前記作動モードにおいて所定の注目期間の間に何れかの命令が認識されるかを判定するように構成されると共に、前記注目期間の間に何の命令も認識されなかった場合は前記作動モードを離脱して前記待機モードに入るように構成されていることを特徴とする装置。
  3. 請求項1に記載の装置であって、該装置は、前記作動モードに入る際に、当該装置が前記作動モードに留まる注目期間の開始を示す可聴開始信号を生成するように構成されていることを特徴とする装置。
  4. 請求項3に記載の装置であって、該装置は、前記作動モードにおいて所定の他の期間の間に何れかの命令が認識されるかを判定するように構成されると共に、該所定の他の期間の間に何の命令も認識されなかった場合に、当該装置が前記作動モードに留まる前記注目期間の進行を示す可聴注意信号を生成するように構成されていることを特徴とする装置。
  5. 請求項3に記載の装置であって、該装置は、前記作動モードにおいて所定の期間の間に何れかの命令が認識されるかを判定するよう構成されると共に、前記所定の期間の間に何の命令も認識されなかった場合に前記作動モードを離脱して前記待機モードに入ると共に、この場合に、前記注目期間の終了を示す可聴終了信号を生成するように構成されていることを特徴とする装置。
  6. 請求項1ないし5のうちいずれか1つに記載の装置を有する機器。
  7. 請求項1ないし5のうちいずれか1つに記載の装置を有する遠隔制御器。
  8. 請求項1に記載の装置を複数有し、各装置は対応する機器を制御し、各装置は自身の固有の活性化命令を認識するように構成されていることを特徴とするシステム。
  9. 機器を制御する方法であって、
    前記機器を制御する装置において音声入力を受信する受信ステップと、
    ・当該受信された入力を解析して命令を認識する解析ステップと、
    ・前記命令の前記認識と送信とを可能にする活性化ステップと、
    を有する方法であって、
    前記活性化ステップは、
    ・音声入力を受信する副ステップと、
    ・当該受信された入力を解析して、活性化命令を認識する副ステップと、
    ・前記活性化命令を認識すると、前記装置を、前記装置が前記機器の実際の制御のために作動していない待機モードから、前記装置が前記機器の実際の制御のために作動する作動モードへ切り換えて、前記命令の当該認識及び送信を可能にする副ステップと、
    を有し、
    前記作動モードへ入った後に、前記機器を制御するための音声入力における命令が感知されることができる注目期間を示す繰り返し可聴音を生成し、前記注目期間の終了に向かって前記可聴音の周波数が高くなるようにした方法。
JP2000592724A 1999-01-06 1999-09-03 注目期間を有する音声入力装置 Expired - Fee Related JP4812941B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP99200014 1999-01-06
EP99200014.1 1999-01-06
PCT/EP1999/006551 WO2000041065A1 (en) 1999-01-06 1999-09-03 Speech input device with attention span

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2011115310A Division JP5208246B2 (ja) 1999-01-06 2011-05-24 注目期間を有する音声入力装置

Publications (2)

Publication Number Publication Date
JP2002534716A JP2002534716A (ja) 2002-10-15
JP4812941B2 true JP4812941B2 (ja) 2011-11-09

Family

ID=8239782

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2000592724A Expired - Fee Related JP4812941B2 (ja) 1999-01-06 1999-09-03 注目期間を有する音声入力装置
JP2011115310A Expired - Lifetime JP5208246B2 (ja) 1999-01-06 2011-05-24 注目期間を有する音声入力装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2011115310A Expired - Lifetime JP5208246B2 (ja) 1999-01-06 2011-05-24 注目期間を有する音声入力装置

Country Status (6)

Country Link
US (1) US6718307B1 (ja)
EP (1) EP1058876B1 (ja)
JP (2) JP4812941B2 (ja)
KR (1) KR100753780B1 (ja)
DE (1) DE69941686D1 (ja)
WO (1) WO2000041065A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015098109A1 (ja) 2013-12-26 2015-07-02 パナソニックIpマネジメント株式会社 音声認識処理装置、音声認識処理方法、および表示装置
WO2015098079A1 (ja) 2013-12-26 2015-07-02 パナソニックIpマネジメント株式会社 音声認識処理装置、音声認識処理方法、および表示装置

Families Citing this family (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6415258B1 (en) * 1999-10-06 2002-07-02 Microsoft Corporation Background audio recovery system
US8374875B2 (en) 2000-01-31 2013-02-12 Intel Corporation Providing programming information in response to spoken requests
DE10021389A1 (de) * 2000-05-03 2001-11-08 Nokia Mobile Phones Ltd Verfahren zum Steuern eines Systems, insbesondere eines elektrischen und/oder elektronischen Systems mit zumindest einer Anwendungseinrichtung
EP1305791A1 (en) * 2000-07-21 2003-05-02 Koninklijke Philips Electronics N.V. Speech control over a plurality of devices
CN1173498C (zh) * 2000-10-13 2004-10-27 国际商业机器公司 语音允许的蓝牙设备管理和访问装置及有关控制方法
GB0029573D0 (en) * 2000-12-02 2001-01-17 Hewlett Packard Co Activation of voice-controlled apparatus
EP1215658A3 (en) 2000-12-05 2002-08-14 Hewlett-Packard Company Visual activation of voice controlled apparatus
DE10163213A1 (de) * 2001-12-21 2003-07-10 Philips Intellectual Property Verfahren zum Betrieb eines Spracherkennungssystems
JP2003241797A (ja) * 2002-02-22 2003-08-29 Fujitsu Ltd 音声対話システム
WO2003085639A1 (en) * 2002-04-08 2003-10-16 Koninklijke Philips Electronics N.V. Controlling an apparatus based on speech
US20030234763A1 (en) * 2002-06-24 2003-12-25 Xerox Corporation System and method for audible feedback for touch screen displays
DE10251209A1 (de) * 2002-10-31 2004-05-19 Sennheiser Electronic Gmbh & Co. Kg Mikrofonsystem
US20060085183A1 (en) * 2004-10-19 2006-04-20 Yogendra Jain System and method for increasing recognition accuracy and modifying the behavior of a device in response to the detection of different levels of speech
US20060085199A1 (en) * 2004-10-19 2006-04-20 Yogendra Jain System and method for controlling the behavior of a device capable of speech recognition
US20060235698A1 (en) * 2005-04-13 2006-10-19 Cane David A Apparatus for controlling a home theater system by speech commands
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
JP2007324866A (ja) * 2006-05-31 2007-12-13 Funai Electric Co Ltd 電子機器及びテレビ受像機
FR2902948A1 (fr) * 2006-06-22 2007-12-28 Michael Attali Appareil d'emission d'ondes radioelectriques a faible portee
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US7769593B2 (en) * 2006-09-28 2010-08-03 Sri International Method and apparatus for active noise cancellation
US8224286B2 (en) 2007-03-30 2012-07-17 Savox Communications Oy Ab (Ltd) Radio communication device
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
JP4809454B2 (ja) * 2009-05-17 2011-11-09 株式会社半導体理工学研究センター 発話推定による回路起動方法及び回路起動装置
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9111538B2 (en) * 2009-09-30 2015-08-18 T-Mobile Usa, Inc. Genius button secondary commands
US8995625B2 (en) * 2009-09-30 2015-03-31 T-Mobile Usa, Inc. Unified interface and routing module for handling audio input
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9992745B2 (en) 2011-11-01 2018-06-05 Qualcomm Incorporated Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate
EP2788978B1 (en) 2011-12-07 2020-09-23 QUALCOMM Incorporated Low power integrated circuit to analyze a digitized audio stream
US9117449B2 (en) * 2012-04-26 2015-08-25 Nuance Communications, Inc. Embedded system for construction of small footprint speech recognition with user-definable constraints
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9142215B2 (en) * 2012-06-15 2015-09-22 Cypress Semiconductor Corporation Power-efficient voice activation
US9026448B2 (en) * 2012-08-16 2015-05-05 Nuance Communications, Inc. User interface for entertainment systems
US9031848B2 (en) 2012-08-16 2015-05-12 Nuance Communications, Inc. User interface for searching a bundled service content data source
US9106957B2 (en) 2012-08-16 2015-08-11 Nuance Communications, Inc. Method and apparatus for searching data sources for entertainment systems
US8799959B2 (en) 2012-08-16 2014-08-05 Hoi L. Young User interface for entertainment systems
US9497515B2 (en) 2012-08-16 2016-11-15 Nuance Communications, Inc. User interface for entertainment systems
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
CN103021411A (zh) * 2012-11-27 2013-04-03 威盛电子股份有限公司 语音控制装置和语音控制方法
US9265458B2 (en) 2012-12-04 2016-02-23 Sync-Think, Inc. Application of smooth pursuit cognitive testing paradigms to clinical drug development
US9047857B1 (en) * 2012-12-19 2015-06-02 Rawles Llc Voice commands for transitioning between device states
DE102013001219B4 (de) * 2013-01-25 2019-08-29 Inodyn Newmedia Gmbh Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus
US9380976B2 (en) 2013-03-11 2016-07-05 Sync-Think, Inc. Optical neuroinformatics
US9892729B2 (en) 2013-05-07 2018-02-13 Qualcomm Incorporated Method and apparatus for controlling voice activation
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197737A1 (en) * 2013-06-08 2014-12-11 Apple Inc. Automatically adapting user interfaces for hands-free interaction
JP2015011170A (ja) * 2013-06-28 2015-01-19 株式会社ATR−Trek ローカルな音声認識を行なう音声認識クライアント装置
US20150074524A1 (en) * 2013-09-10 2015-03-12 Lenovo (Singapore) Pte. Ltd. Management of virtual assistant action items
CN105723451B (zh) * 2013-12-20 2020-02-28 英特尔公司 从低功率始终侦听模式到高功率语音识别模式的转换
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
JP6543455B2 (ja) * 2014-10-22 2019-07-10 株式会社大林組 水中作業支援システム
RU2571891C1 (ru) * 2015-01-30 2015-12-27 Андрей Федорович Изнак Устройство для контроля внимания оператора в системах "человек-техника"
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10235353B1 (en) * 2017-09-15 2019-03-19 Dell Products Lp Natural language translation interface for networked devices
US10515637B1 (en) 2017-09-19 2019-12-24 Amazon Technologies, Inc. Dynamic speech processing

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02181559A (ja) * 1989-01-05 1990-07-16 Toshiba Corp 電話装置
JPH0370243A (ja) * 1989-08-09 1991-03-26 Toshiba Corp 無線電話装置
JPH0962293A (ja) * 1995-08-21 1997-03-07 Seiko Epson Corp 音声認識対話装置および音声認識対話処理方法
JPH10312194A (ja) * 1997-03-12 1998-11-24 Seiko Epson Corp 認識対象音声検出方法およびその装置
JPH10319991A (ja) * 1997-05-20 1998-12-04 Sony Corp 電子機器の音声認識起動方法及び装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4528687A (en) * 1981-10-22 1985-07-09 Nissan Motor Company, Limited Spoken-instruction controlled system for an automotive vehicle
US5267323A (en) * 1989-12-29 1993-11-30 Pioneer Electronic Corporation Voice-operated remote control system
GB2265232A (en) * 1992-05-12 1993-09-22 John Roger Clarke Power saving unit
AU4773193A (en) * 1992-07-17 1994-02-14 Voice Powered Technology International, Inc. Voice operated remote control device
US5577164A (en) * 1994-01-28 1996-11-19 Canon Kabushiki Kaisha Incorrect voice command recognition prevention and recovery processing method and apparatus
US6070140A (en) * 1995-06-05 2000-05-30 Tran; Bao Q. Speech recognizer
US6075575A (en) * 1995-10-02 2000-06-13 Starsight Telecast, Inc. Remote control device and method for using television schedule information
US6052666A (en) * 1995-11-06 2000-04-18 Thomson Multimedia S.A. Vocal identification of devices in a home environment
US6188986B1 (en) * 1998-01-02 2001-02-13 Vos Systems, Inc. Voice activated switch method and apparatus
JPH11205430A (ja) * 1998-01-20 1999-07-30 Kobe Steel Ltd 音声ダイアル機能付き電話機
US6253184B1 (en) * 1998-12-14 2001-06-26 Jon Ruppert Interactive voice controlled copier apparatus

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02181559A (ja) * 1989-01-05 1990-07-16 Toshiba Corp 電話装置
JPH0370243A (ja) * 1989-08-09 1991-03-26 Toshiba Corp 無線電話装置
JPH0962293A (ja) * 1995-08-21 1997-03-07 Seiko Epson Corp 音声認識対話装置および音声認識対話処理方法
JPH10312194A (ja) * 1997-03-12 1998-11-24 Seiko Epson Corp 認識対象音声検出方法およびその装置
JPH10319991A (ja) * 1997-05-20 1998-12-04 Sony Corp 電子機器の音声認識起動方法及び装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015098109A1 (ja) 2013-12-26 2015-07-02 パナソニックIpマネジメント株式会社 音声認識処理装置、音声認識処理方法、および表示装置
WO2015098079A1 (ja) 2013-12-26 2015-07-02 パナソニックIpマネジメント株式会社 音声認識処理装置、音声認識処理方法、および表示装置
US9767795B2 (en) 2013-12-26 2017-09-19 Panasonic Intellectual Property Management Co., Ltd. Speech recognition processing device, speech recognition processing method and display device
US9905225B2 (en) 2013-12-26 2018-02-27 Panasonic Intellectual Property Management Co., Ltd. Voice recognition processing device, voice recognition processing method, and display device

Also Published As

Publication number Publication date
US6718307B1 (en) 2004-04-06
EP1058876A1 (en) 2000-12-13
WO2000041065A1 (en) 2000-07-13
KR100753780B1 (ko) 2007-08-31
EP1058876B1 (en) 2009-11-25
JP2011176879A (ja) 2011-09-08
JP5208246B2 (ja) 2013-06-12
JP2002534716A (ja) 2002-10-15
KR20010041676A (ko) 2001-05-25
DE69941686D1 (de) 2010-01-07

Similar Documents

Publication Publication Date Title
JP4812941B2 (ja) 注目期間を有する音声入力装置
US11011172B2 (en) Electronic device and voice recognition method thereof
CN110459221B (zh) 多设备协同语音交互的方法和装置
US8280086B2 (en) Remote control system for a hearing aid
KR20190051368A (ko) 전자 장치 및 전자 장치 간 음성으로 기능을 실행하는 방법
US6505159B1 (en) Apparatus and method for providing speech input to a speech recognition system
JP2006352869A (ja) 通信端末機及び通信端末機における通話内容送信方法
CN103760969A (zh) 移动终端及语音控制应用程序的方法
US20070061147A1 (en) Distributed speech recognition method
CN110049193A (zh) 基于车载hud和方向盘蓝牙控制的微信消息回复装置
CN110727821A (zh) 防止设备被误唤醒的方法、装置、系统和计算机存储介质
CN109743618B (zh) 音乐播放方法、终端和计算机可读存储介质
US20060129408A1 (en) A remote control device and method with speech control
CN102451557A (zh) 游戏声控操控装置及其实现方法
CN110839169B (zh) 一种智能设备遥控装置及基于其的控制方法
CN114999496A (zh) 音频传输方法、控制设备及终端设备
CN114296837A (zh) 固件的控制方法、装置、电子设备及计算机可读存储介质
CN108446579B (zh) 一种图形码识别的方法及终端
CN110660386A (zh) 一种语音寻找遥控器的方法及系统
KR102494051B1 (ko) 전자 장치 및 이의 음성 인식 방법
KR100423495B1 (ko) 음성인식에 의한 휴대용 기기의 동작제어 장치 및 방법
CN115802083A (zh) 控制方法、装置、分体电视及可读存储介质
WO2019178739A1 (zh) 音箱、智能终端及基于音箱及智能终端的交互控制方法
JP3141142U (ja) 多機能ブルートゥースインターネット電話装置
CN112328201A (zh) 音频路径切换方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060901

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100105

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100402

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100409

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100705

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110524

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110531

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110728

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110824

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140902

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140902

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140902

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees