JP2008009120A - リモートコントローラ並びに家電機器 - Google Patents
リモートコントローラ並びに家電機器 Download PDFInfo
- Publication number
- JP2008009120A JP2008009120A JP2006179261A JP2006179261A JP2008009120A JP 2008009120 A JP2008009120 A JP 2008009120A JP 2006179261 A JP2006179261 A JP 2006179261A JP 2006179261 A JP2006179261 A JP 2006179261A JP 2008009120 A JP2008009120 A JP 2008009120A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- section
- unit
- recognition
- remote controller
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Selective Calling Equipment (AREA)
Abstract
【解決手段】MPU5は、通常はスリープ状態を維持しながら定期的に音声入力の有無を監視し、ある一定区間のサンプリングされた音声入力の積算値を区間の前後で差分をとり、差分が予め設定された閾値を超えたときにのみ認識を開始するようにして音声区間の開始位置を正確に把握する。この際、雑音を避けるためFFTを用いて人の音声領域の周波数帯のみの音声レベルの積算、閾値を超えるスパイクノイズの除去、あるいはHMMを利用して過去のフレームから得られた音声特徴量の変遷に沿った補正処理を行うことで音声信号に混入したノイズを排除する。また、ユーザはボタンを利用して音声入力するときのみボタンを押し続けるようにし、リモコン1のMPU5はボタン押下信号がある時のみ音声認識する。
【選択図】図1
Description
図1は、本発明の実施の形態1におけるリモコンのハードウェア構成を示す図であり、リモコン1は、図1に示すように、ユーザーの音声を音声信号の形で取り込む音声取込部2と、取り込んだ音声信号を増幅する増幅部3と、増幅された音声信号をMPU(Micro Processor Unit)が処理できるようにアナログ信号からディジタル信号に変換あるいは、MPUが出力したディジタル信号をアナログ信号である音声に変換するためのA/D・D/Aコンバータ4と、各種演算および処理を実行するMPU5と、音声信号を音声として出力する音声出力部6と、処理中あるいは処理済みの各種データ類を記憶するRAM7と、ソフトウェア及び音声データベース8を記憶するROM9と、エアコンに対して操作指令信号を赤外線により送信する通信部10とから構成されている。また、A/D・D/Aコンバータ4、MPU5、RAM7、ROM9及び通信部10は共通のバスに接続されており、音声取込部2と音声出力部6は増幅部3を介してA/D・D/Aコンバータ4に接続されている。なお、エアコン11は通信部12を標準で装備している。
また、図9に示すように、リモコン1にはボタン16とONを示すLED(Light Emitting Diode)17とOFFを示すLEDが搭載されている。
実施の形態1では、時間領域での音声信号レベル積算量の差分により音声入力区間を検出したが、これに限らず、周波数領域で音声入力区間を検出することも選択可能である。この実施の形態2では、この周波数領域で音声入力区間を検出する方法について説明する。
音響分析部13は、周期的に上記一定区間の音声を取り込み、取り込んだ音声を高速フーリエ変換(FFT:Fast Fourier Transform)により周波数成分に変換し、変換された周波数成分のうち、帯域通過フィルタ(BPF:Band Pass Filter)や低域通過フィルタ(LPF:Low Pass Filter)を用いて人間の音声周波数帯域(相対的に低域のホルマント領域)のみの周波数成分について各周波数成分のレベルを1つの区間に渡って約100μ秒(11kHz)単位で積算した積算量を1つ前の区間のそれと比較して差分を算出し、この差分をFFT逆変換したものと音声認識開始用の閾値とを比較する。そして、差分をFFT逆変換したものが音声認識開始用の閾値を超えた区間から一連の複数区間を特徴量・補足計算部14に送る。特徴量・補足計算部14は、音声認識アルゴリズムに応じて音声区間の特徴ベクトル抽出や他の補足計算を行い、得られた特徴ベクトルを音声認識部15に送る。そして、音声認識部15は特徴量・補足計算部14から送られた特徴ベクトルと音声データベース8の語句とに基づいて認識処理を実行し、認識結果を操作指令として通信部10を介して空調機11などの家電機器に送りこの機器を操作する。
また、事前に登録した複数区間の音声レベルや定期的(周期的)に取り込んだ音声区間における音声レベルの解析結果を基に、音声認識の対象とするべき周波数帯や差分による音声区間検出の閾値を決定する事も可能である。この場合、雑音が多く、音声の差分が小さくなる場合でも対応可能である。音響分析部13は、差分がある一定範囲内で推移している時に定期的に取り込んだ音が定常雑音やスパイクノイズなどのノイズなのか音声なのかを上記の閾値を用いて判断する。これにより閾値を決定する要因である音声とノイズを判断でき、誤判定なく自動学習により閾値を変化させる事も可能である。この判定でも遠くの人間の声が混じっていたりして完全ではないので、判定は複数回繰り返した結果と比較し、ノイズのデータベースと比較したり、複数回の音量レベルを基に例えば平均値を計算したりして定常雑音の大きさを判断したりするので、たとえ瞬時的に誤判定が起こり閾値が変化しても正常に収束可能である。
これにより、環境に合わせて音量、周波数の少なくとも一方を使用することで、より精度の高い単語発生検知を行うことができる。そして少なくとも一方が閾値を超えた場合に音声認識を開始する(どちらも閾値を超えないと音声認識を開始しない)ようにしておけば、予め決められた数値などで判断した場合と異なり、個人差を補いきれず、認識を開始しない(勝手に認識を開始する)といった問題を低減することが可能である。
実施の形態1及び実施の形態2では音声レベルの積算量の差分に基づいて音声入力開始時点を特定したが、より簡単な方法として図9に示すボタン16をユーザーが押下操作することで音声入力開始時点をリモコンに通知させるようにしてもよい。この実施の形態3では、このような実施の形態について説明する。
ユーザーが図9のボタン16を押した時にボタン16は押下信号を発生する。MPU5はボタン16からの押下信号を図示しない入出力部を介して受信すると、音声認識を開始する。そして、ユーザーがボタンを押し続けている間はボタン16から押下信号が継続して発生するので、MPU5はこの押下信号を受信している間はユーザーの音声を音声取り込み部2に取り込ませ、音声認識を行う。従って、ユーザーはボタンを押し続けている間自由に話すことができるので焦って話す必要はない。
MPU5は、ステップS81において、ボタン付きか否かを調べ、ボタン付きである場合には、ボタンが押されるまでS82を繰り返し実行して待つ。ステップS82においてMPU5はユーザーによるボタンの押下信号を検出すると、音声取り込みを開始する(ステップS1)。ステップS1〜S9の動作は図7と同じなので説明を省略する。ステップS83において、MPU5はボタンが押下されなくなったか否かを調べ、まだ押されていればステップS1に戻り、S1〜S9の音声認識処理を再開する。ステップS83において、ボタンが押されなくなったことを検出したら、音声認識処理を終了する。また、S81において、ボタンがない場合のS1〜S9の動作は図7と同じなので説明を省略する。
Claims (14)
- 周期的な所定期間を示す区間毎にこの区間内の音声信号レベルの積算量を一つ前の区間のそれと比較し、差分が音声認識開始用の閾値を超えた区間から次に前記差分が音声認識終了用の閾値を超えた区間までの一連の複数区間の音声信号を出力する音響分析部と、
この音響分析部が出力した一連の複数区間の音声信号レベルを基に音声認識アルゴリズムを適用して前記複数区間の各区間毎に音声特徴ベクトルの抽出や他の補足計算を行う特徴量・補足計算部と、
この特徴量・補足計算部によって抽出された特徴ベクトルと予め保有するデータベースの語句とに基づいて音声認識を行う音声認識部と、
この音声認識部が認識した結果を操作指令として外部機器に送信する通信部とを備えたことを特徴とするリモートコントローラ。 - 周期的な所定期間を示す区間毎にこの区間内の音声を取り込み、FFTにより周波数成分に変換し、所定の周波数帯における各周波数成分のレベルの積算量を一つ前の区間のそれと比較して差分を算出し、この差分をFFT逆変換した結果が音声認識開始用の閾値を超えた区間から次に前記差分が音声認識終了用の閾値を超えた区間までの一連の複数区間の音声信号を出力する音響分析部と、
この音響分析部が出力した一連の複数区間の音声信号レベルを基に音声認識アルゴリズムを適用して前記複数区間の各区間毎に音声特徴ベクトルの抽出や他の補足計算を行う特徴量・補足計算部と、
この特徴量・補足計算部によって抽出された特徴ベクトルと予め保有するデータベースの語句とに基づいて音声認識を行う音声認識部と、
この音声認識部が認識した結果を操作指令として外部機器に送信する通信部とを備えたことを特徴とするリモートコントローラ。 - 前記音響分析部は、前記差分が前記音声認識開始用の閾値を超えた区間を音声開始区間とし、所定の基準により少なくとも前記音声認識開始用の閾値を超えた区間の前後の区間を単語発声開始時点とし、前記差分が前記音声認識終了用の閾値を超えた区間を音声終了区間とし、所定の基準により少なくとも前記音声認識終了用の閾値を超えた区間の前後の区間を単語発声終了時点とすることを特徴とした請求項1記載のリモートコントローラ。
- 前記音響分析部は、区間毎でなく複数区間(以下、周期という)毎にこの周期内の音声を取り込み、周波数成分に変換し、所定の周波数帯における各周波数成分のレベルの積算量を一つ前の周期のそれと比較して差分を算出し、この差分をFFT逆変換した結果が音声認識開始用の閾値を超えた区間から一連の複数区間の音声信号を出力することを特徴とする請求項2記載のリモートコントローラ。
- 前記音響分析部は、音声入力区間を検出後、別の閾値を超える差分が存在した周波数帯域だけについて前記音声入力区間内の各区間毎の周波数成分をFFT逆変換した結果を音声信号として出力することを特徴とする請求項2記載のリモートコントローラ。
- 前記音響分析部は、音声入力区間を検出後、変化があった周波数帯域の周波数成分の重み付けを重くしてこの周波数成分を再構成し、前記音声入力区間内の各区間毎の周波数成分をFFT逆変換した結果を音声信号として出力することを特徴とする請求項2記載のリモートコントローラ。
- 前記音響分析部は、音声帯域の周波数成分で予め定めた上限値よりも大きいレベルの周波数成分を除去することを特徴とした請求項2記載のリモートコントローラ。
- 前記音響分析部は、音声帯域の周波数成分で予め定めた上限値よりも大きいレベルの周波数成分の重みを軽くしたことを特徴とした請求項2記載のリモートコントローラ。
- 前記音響分析部は、音声帯域の周波数成分で予め定めた上限値よりも大きいレベルの周波数成分を、隣接する周波数の成分のレベルの平均値に置き換えたことを特徴とした請求項2記載のリモートコントローラ。
- 前記音声認識部は、音声入力開始区間検出後、音声認識部のアルゴリズムに合わせて、単語発生区間の終了を待たずに並列処理にて順次処理することを特徴とする請求項1〜9のいずれかに記載のリモートコントローラ。
- 前記音響分析部は、事前に登録した音声や定期的(周期的)に取り込んだ音声区間の解析結果を基に周波数帯、差分の閾値を決定し、この閾値を用いて入力した音声が定常雑音なのかスパイクノイズなのかを判断することを特徴とする請求項1記載のリモートコントローラ。
- プロセッサと、音声取込部と、音声出力部と、ボタンと、表示部と通信部とを備え、
前記音声取込部は、前記ボタンから信号を受信すると外部から最初の音声を取り込み、
前記プロセッサは請求項1〜11のいずれかに記載の音響分析部、特徴量・補足計算部及び音声認識部を実現し、前記音声取込部が取り込んだ前記最初の音声を認識し、認識した結果を外部のユーザーに伝えるべく音声出力部に出力し、前記ボタンあるいは前記音声取り込み部から許可の旨の信号あるいは許可の旨の音声を受信すると、音声認識し、前記最初の音声を認識した結果を操作指令として前記通信部を介して外部の機器に送信することを特徴とするリモートコントローラ。 - データベースを備え、
前記プロセッサは前記最初の音声を認識した結果を学習し前記データベースに反映することを特徴とする請求項12記載のリモートコントローラ。 - 通信部を備え、
請求項1〜13のいずれかに記載のリモートコントローラから前記通信部を介して操作指令を受信してこの操作指令に基づいて動作することを特徴とする家電機器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006179261A JP4675840B2 (ja) | 2006-06-29 | 2006-06-29 | リモートコントローラ並びに家電機器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006179261A JP4675840B2 (ja) | 2006-06-29 | 2006-06-29 | リモートコントローラ並びに家電機器 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008009120A true JP2008009120A (ja) | 2008-01-17 |
JP4675840B2 JP4675840B2 (ja) | 2011-04-27 |
Family
ID=39067412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006179261A Expired - Fee Related JP4675840B2 (ja) | 2006-06-29 | 2006-06-29 | リモートコントローラ並びに家電機器 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4675840B2 (ja) |
Cited By (87)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009150894A1 (ja) * | 2008-06-10 | 2009-12-17 | 日本電気株式会社 | 音声認識システム、音声認識方法および音声認識用プログラムが格納された記憶媒体 |
JP2012508903A (ja) * | 2008-11-12 | 2012-04-12 | エスシーティアイ ホールディングス、インク | 自動音声テキスト変換のためのシステムと方法 |
JP2012185861A (ja) * | 2012-07-03 | 2012-09-27 | Toshiba Corp | 操作装置及び操作方法 |
KR101192813B1 (ko) | 2010-12-14 | 2012-10-26 | (주)이엔엠시스템 | 대기 상태에서 저주파 영역 음향에 대해서 음성인식을 수행하는 음성인식 시스템 및 그 제어방법 |
WO2013188007A1 (en) * | 2012-06-15 | 2013-12-19 | Spansion Llc | Power-efficient voice activation |
JP2014170984A (ja) * | 2013-03-01 | 2014-09-18 | Casio Comput Co Ltd | 通信装置及びプログラム |
JP2015501438A (ja) * | 2011-09-23 | 2015-01-15 | ディジマーク コーポレイション | 状況(Context)に基づくスマートフォンセンサロジック |
JP2016521948A (ja) * | 2013-06-13 | 2016-07-25 | アップル インコーポレイテッド | 音声コマンドによって開始される緊急電話のためのシステム及び方法 |
JP2017515429A (ja) * | 2014-03-11 | 2017-06-08 | サウンドリー インコーポレイテッドSoundlly Inc. | 低電力関連コンテンツ提供システム、方法、及びプログラムを記録したコンピューターで読むことができる記録媒体 |
US9865248B2 (en) | 2008-04-05 | 2018-01-09 | Apple Inc. | Intelligent text-to-speech conversion |
US9966060B2 (en) | 2013-06-07 | 2018-05-08 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9986419B2 (en) | 2014-09-30 | 2018-05-29 | Apple Inc. | Social reminders |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10049675B2 (en) | 2010-02-25 | 2018-08-14 | Apple Inc. | User profiling for voice input processing |
US10079014B2 (en) | 2012-06-08 | 2018-09-18 | Apple Inc. | Name recognition system |
US10083690B2 (en) | 2014-05-30 | 2018-09-25 | Apple Inc. | Better resolution when referencing to concepts |
US10108612B2 (en) | 2008-07-31 | 2018-10-23 | Apple Inc. | Mobile device having human language translation capability with positional feedback |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US10311871B2 (en) | 2015-03-08 | 2019-06-04 | Apple Inc. | Competing devices responding to voice triggers |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10332518B2 (en) | 2017-05-09 | 2019-06-25 | Apple Inc. | User interface for correcting recognition errors |
US10356243B2 (en) | 2015-06-05 | 2019-07-16 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10354652B2 (en) | 2015-12-02 | 2019-07-16 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10381016B2 (en) | 2008-01-03 | 2019-08-13 | Apple Inc. | Methods and apparatus for altering audio output signals |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US10403283B1 (en) | 2018-06-01 | 2019-09-03 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10410637B2 (en) | 2017-05-12 | 2019-09-10 | Apple Inc. | User-specific acoustic models |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US10417405B2 (en) | 2011-03-21 | 2019-09-17 | Apple Inc. | Device access using voice authentication |
US10417344B2 (en) | 2014-05-30 | 2019-09-17 | Apple Inc. | Exemplar-based natural language processing |
US10431204B2 (en) | 2014-09-11 | 2019-10-01 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10438595B2 (en) | 2014-09-30 | 2019-10-08 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10453443B2 (en) | 2014-09-30 | 2019-10-22 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10482874B2 (en) | 2017-05-15 | 2019-11-19 | Apple Inc. | Hierarchical belief states for digital assistants |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
US10497365B2 (en) | 2014-05-30 | 2019-12-03 | Apple Inc. | Multi-command single utterance input method |
US10529332B2 (en) | 2015-03-08 | 2020-01-07 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US10580409B2 (en) | 2016-06-11 | 2020-03-03 | Apple Inc. | Application integration with a digital assistant |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10643611B2 (en) | 2008-10-02 | 2020-05-05 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10657961B2 (en) | 2013-06-08 | 2020-05-19 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10684703B2 (en) | 2018-06-01 | 2020-06-16 | Apple Inc. | Attention aware virtual assistant dismissal |
US10699717B2 (en) | 2014-05-30 | 2020-06-30 | Apple Inc. | Intelligent assistant for home automation |
CN111380189A (zh) * | 2020-03-27 | 2020-07-07 | 四川虹美智能科技有限公司 | 智能空调控制方法及智能空调 |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10733993B2 (en) | 2016-06-10 | 2020-08-04 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10755703B2 (en) | 2017-05-11 | 2020-08-25 | Apple Inc. | Offline personal assistant |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10769385B2 (en) | 2013-06-09 | 2020-09-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
JP2020528610A (ja) * | 2017-07-25 | 2020-09-24 | トップ システム カンパニー リミテッドTop System Co., Ltd. | Tv画面位置調節機の音声認識型遠隔制御装置 |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10789945B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Low-latency intelligent automated assistant |
US10791176B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US10810274B2 (en) | 2017-05-15 | 2020-10-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US10904611B2 (en) | 2014-06-30 | 2021-01-26 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US10942702B2 (en) | 2016-06-11 | 2021-03-09 | Apple Inc. | Intelligent device arbitration and control |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US11023513B2 (en) | 2007-12-20 | 2021-06-01 | Apple Inc. | Method and apparatus for searching using an active ontology |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US11049094B2 (en) | 2014-02-11 | 2021-06-29 | Digimarc Corporation | Methods and arrangements for device to device communication |
US11048473B2 (en) | 2013-06-09 | 2021-06-29 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US11069347B2 (en) | 2016-06-08 | 2021-07-20 | Apple Inc. | Intelligent automated assistant for media exploration |
US11069336B2 (en) | 2012-03-02 | 2021-07-20 | Apple Inc. | Systems and methods for name pronunciation |
US11127397B2 (en) | 2015-05-27 | 2021-09-21 | Apple Inc. | Device voice control |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US11217255B2 (en) | 2017-05-16 | 2022-01-04 | Apple Inc. | Far-field extension for digital assistant services |
US11231904B2 (en) | 2015-03-06 | 2022-01-25 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
US11314370B2 (en) | 2013-12-06 | 2022-04-26 | Apple Inc. | Method for extracting salient dialog usage from live data |
US11350253B2 (en) | 2011-06-03 | 2022-05-31 | Apple Inc. | Active transport based notifications |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US11495218B2 (en) | 2018-06-01 | 2022-11-08 | Apple Inc. | Virtual assistant operation in multi-device environments |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56135898A (en) * | 1980-03-26 | 1981-10-23 | Sanyo Electric Co | Voice recognition device |
JPS62129899A (ja) * | 1985-11-30 | 1987-06-12 | 日本電気株式会社 | 音声区間検出方法 |
JPH03253899A (ja) * | 1990-03-05 | 1991-11-12 | Ricoh Co Ltd | 音声区間検出方式 |
JPH04178698A (ja) * | 1990-11-13 | 1992-06-25 | Toyota Central Res & Dev Lab Inc | 波形生成装置 |
JPH06230799A (ja) * | 1993-02-04 | 1994-08-19 | Nippon Telegr & Teleph Corp <Ntt> | 信号記録装置 |
JP2000163098A (ja) * | 1998-11-25 | 2000-06-16 | Mitsubishi Electric Corp | 音声認識装置 |
JP2001265367A (ja) * | 2000-03-16 | 2001-09-28 | Mitsubishi Electric Corp | 音声区間判定装置 |
JP2004294659A (ja) * | 2003-03-26 | 2004-10-21 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JP2004294814A (ja) * | 2003-03-27 | 2004-10-21 | Clarion Co Ltd | 遠隔制御装置 |
-
2006
- 2006-06-29 JP JP2006179261A patent/JP4675840B2/ja not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56135898A (en) * | 1980-03-26 | 1981-10-23 | Sanyo Electric Co | Voice recognition device |
JPS62129899A (ja) * | 1985-11-30 | 1987-06-12 | 日本電気株式会社 | 音声区間検出方法 |
JPH03253899A (ja) * | 1990-03-05 | 1991-11-12 | Ricoh Co Ltd | 音声区間検出方式 |
JPH04178698A (ja) * | 1990-11-13 | 1992-06-25 | Toyota Central Res & Dev Lab Inc | 波形生成装置 |
JPH06230799A (ja) * | 1993-02-04 | 1994-08-19 | Nippon Telegr & Teleph Corp <Ntt> | 信号記録装置 |
JP2000163098A (ja) * | 1998-11-25 | 2000-06-16 | Mitsubishi Electric Corp | 音声認識装置 |
JP2001265367A (ja) * | 2000-03-16 | 2001-09-28 | Mitsubishi Electric Corp | 音声区間判定装置 |
JP2004294659A (ja) * | 2003-03-26 | 2004-10-21 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JP2004294814A (ja) * | 2003-03-27 | 2004-10-21 | Clarion Co Ltd | 遠隔制御装置 |
Cited By (110)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11023513B2 (en) | 2007-12-20 | 2021-06-01 | Apple Inc. | Method and apparatus for searching using an active ontology |
US10381016B2 (en) | 2008-01-03 | 2019-08-13 | Apple Inc. | Methods and apparatus for altering audio output signals |
US9865248B2 (en) | 2008-04-05 | 2018-01-09 | Apple Inc. | Intelligent text-to-speech conversion |
WO2009150894A1 (ja) * | 2008-06-10 | 2009-12-17 | 日本電気株式会社 | 音声認識システム、音声認識方法および音声認識用プログラムが格納された記憶媒体 |
US8886527B2 (en) | 2008-06-10 | 2014-11-11 | Nec Corporation | Speech recognition system to evaluate speech signals, method thereof, and storage medium storing the program for speech recognition to evaluate speech signals |
US10108612B2 (en) | 2008-07-31 | 2018-10-23 | Apple Inc. | Mobile device having human language translation capability with positional feedback |
US11348582B2 (en) | 2008-10-02 | 2022-05-31 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10643611B2 (en) | 2008-10-02 | 2020-05-05 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US8566088B2 (en) | 2008-11-12 | 2013-10-22 | Scti Holdings, Inc. | System and method for automatic speech to text conversion |
JP2012508903A (ja) * | 2008-11-12 | 2012-04-12 | エスシーティアイ ホールディングス、インク | 自動音声テキスト変換のためのシステムと方法 |
US10692504B2 (en) | 2010-02-25 | 2020-06-23 | Apple Inc. | User profiling for voice input processing |
US10049675B2 (en) | 2010-02-25 | 2018-08-14 | Apple Inc. | User profiling for voice input processing |
KR101192813B1 (ko) | 2010-12-14 | 2012-10-26 | (주)이엔엠시스템 | 대기 상태에서 저주파 영역 음향에 대해서 음성인식을 수행하는 음성인식 시스템 및 그 제어방법 |
US10417405B2 (en) | 2011-03-21 | 2019-09-17 | Apple Inc. | Device access using voice authentication |
US10930289B2 (en) | 2011-04-04 | 2021-02-23 | Digimarc Corporation | Context-based smartphone sensor logic |
US9595258B2 (en) | 2011-04-04 | 2017-03-14 | Digimarc Corporation | Context-based smartphone sensor logic |
US10510349B2 (en) | 2011-04-04 | 2019-12-17 | Digimarc Corporation | Context-based smartphone sensor logic |
US10199042B2 (en) | 2011-04-04 | 2019-02-05 | Digimarc Corporation | Context-based smartphone sensor logic |
US11350253B2 (en) | 2011-06-03 | 2022-05-31 | Apple Inc. | Active transport based notifications |
JP2015501438A (ja) * | 2011-09-23 | 2015-01-15 | ディジマーク コーポレイション | 状況(Context)に基づくスマートフォンセンサロジック |
US11069336B2 (en) | 2012-03-02 | 2021-07-20 | Apple Inc. | Systems and methods for name pronunciation |
US10079014B2 (en) | 2012-06-08 | 2018-09-18 | Apple Inc. | Name recognition system |
US9142215B2 (en) | 2012-06-15 | 2015-09-22 | Cypress Semiconductor Corporation | Power-efficient voice activation |
WO2013188007A1 (en) * | 2012-06-15 | 2013-12-19 | Spansion Llc | Power-efficient voice activation |
JP2012185861A (ja) * | 2012-07-03 | 2012-09-27 | Toshiba Corp | 操作装置及び操作方法 |
JP2014170984A (ja) * | 2013-03-01 | 2014-09-18 | Casio Comput Co Ltd | 通信装置及びプログラム |
US9966060B2 (en) | 2013-06-07 | 2018-05-08 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US10657961B2 (en) | 2013-06-08 | 2020-05-19 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10769385B2 (en) | 2013-06-09 | 2020-09-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US11048473B2 (en) | 2013-06-09 | 2021-06-29 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
JP2016521948A (ja) * | 2013-06-13 | 2016-07-25 | アップル インコーポレイテッド | 音声コマンドによって開始される緊急電話のためのシステム及び方法 |
US11314370B2 (en) | 2013-12-06 | 2022-04-26 | Apple Inc. | Method for extracting salient dialog usage from live data |
US11049094B2 (en) | 2014-02-11 | 2021-06-29 | Digimarc Corporation | Methods and arrangements for device to device communication |
JP2017515429A (ja) * | 2014-03-11 | 2017-06-08 | サウンドリー インコーポレイテッドSoundlly Inc. | 低電力関連コンテンツ提供システム、方法、及びプログラムを記録したコンピューターで読むことができる記録媒体 |
US11257504B2 (en) | 2014-05-30 | 2022-02-22 | Apple Inc. | Intelligent assistant for home automation |
US10497365B2 (en) | 2014-05-30 | 2019-12-03 | Apple Inc. | Multi-command single utterance input method |
US10417344B2 (en) | 2014-05-30 | 2019-09-17 | Apple Inc. | Exemplar-based natural language processing |
US10699717B2 (en) | 2014-05-30 | 2020-06-30 | Apple Inc. | Intelligent assistant for home automation |
US10083690B2 (en) | 2014-05-30 | 2018-09-25 | Apple Inc. | Better resolution when referencing to concepts |
US10657966B2 (en) | 2014-05-30 | 2020-05-19 | Apple Inc. | Better resolution when referencing to concepts |
US10714095B2 (en) | 2014-05-30 | 2020-07-14 | Apple Inc. | Intelligent assistant for home automation |
US10904611B2 (en) | 2014-06-30 | 2021-01-26 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10431204B2 (en) | 2014-09-11 | 2019-10-01 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10438595B2 (en) | 2014-09-30 | 2019-10-08 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10390213B2 (en) | 2014-09-30 | 2019-08-20 | Apple Inc. | Social reminders |
US10453443B2 (en) | 2014-09-30 | 2019-10-22 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9986419B2 (en) | 2014-09-30 | 2018-05-29 | Apple Inc. | Social reminders |
US11231904B2 (en) | 2015-03-06 | 2022-01-25 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US10529332B2 (en) | 2015-03-08 | 2020-01-07 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US11087759B2 (en) | 2015-03-08 | 2021-08-10 | Apple Inc. | Virtual assistant activation |
US10311871B2 (en) | 2015-03-08 | 2019-06-04 | Apple Inc. | Competing devices responding to voice triggers |
US11127397B2 (en) | 2015-05-27 | 2021-09-21 | Apple Inc. | Device voice control |
US10356243B2 (en) | 2015-06-05 | 2019-07-16 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10354652B2 (en) | 2015-12-02 | 2019-07-16 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US11069347B2 (en) | 2016-06-08 | 2021-07-20 | Apple Inc. | Intelligent automated assistant for media exploration |
US10733993B2 (en) | 2016-06-10 | 2020-08-04 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US11152002B2 (en) | 2016-06-11 | 2021-10-19 | Apple Inc. | Application integration with a digital assistant |
US10942702B2 (en) | 2016-06-11 | 2021-03-09 | Apple Inc. | Intelligent device arbitration and control |
US10580409B2 (en) | 2016-06-11 | 2020-03-03 | Apple Inc. | Application integration with a digital assistant |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10553215B2 (en) | 2016-09-23 | 2020-02-04 | Apple Inc. | Intelligent automated assistant |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US10332518B2 (en) | 2017-05-09 | 2019-06-25 | Apple Inc. | User interface for correcting recognition errors |
US10755703B2 (en) | 2017-05-11 | 2020-08-25 | Apple Inc. | Offline personal assistant |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10847142B2 (en) | 2017-05-11 | 2020-11-24 | Apple Inc. | Maintaining privacy of personal information |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US11405466B2 (en) | 2017-05-12 | 2022-08-02 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US10789945B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Low-latency intelligent automated assistant |
US10791176B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US10410637B2 (en) | 2017-05-12 | 2019-09-10 | Apple Inc. | User-specific acoustic models |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
US10810274B2 (en) | 2017-05-15 | 2020-10-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10482874B2 (en) | 2017-05-15 | 2019-11-19 | Apple Inc. | Hierarchical belief states for digital assistants |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US11217255B2 (en) | 2017-05-16 | 2022-01-04 | Apple Inc. | Far-field extension for digital assistant services |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
JP2020528610A (ja) * | 2017-07-25 | 2020-09-24 | トップ システム カンパニー リミテッドTop System Co., Ltd. | Tv画面位置調節機の音声認識型遠隔制御装置 |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US11009970B2 (en) | 2018-06-01 | 2021-05-18 | Apple Inc. | Attention aware virtual assistant dismissal |
US10403283B1 (en) | 2018-06-01 | 2019-09-03 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US10984798B2 (en) | 2018-06-01 | 2021-04-20 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10684703B2 (en) | 2018-06-01 | 2020-06-16 | Apple Inc. | Attention aware virtual assistant dismissal |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US11495218B2 (en) | 2018-06-01 | 2022-11-08 | Apple Inc. | Virtual assistant operation in multi-device environments |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
US10944859B2 (en) | 2018-06-03 | 2021-03-09 | Apple Inc. | Accelerated task performance |
US10504518B1 (en) | 2018-06-03 | 2019-12-10 | Apple Inc. | Accelerated task performance |
CN111380189A (zh) * | 2020-03-27 | 2020-07-07 | 四川虹美智能科技有限公司 | 智能空调控制方法及智能空调 |
CN111380189B (zh) * | 2020-03-27 | 2021-05-04 | 四川虹美智能科技有限公司 | 智能空调控制方法及智能空调 |
Also Published As
Publication number | Publication date |
---|---|
JP4675840B2 (ja) | 2011-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4675840B2 (ja) | リモートコントローラ並びに家電機器 | |
CN108735209B (zh) | 唤醒词绑定方法、智能设备及存储介质 | |
JP6801095B2 (ja) | 音声制御システム及びそのウェイクアップ方法、ウェイクアップ装置、並びに家電製品、コプロセッサ | |
US9779725B2 (en) | Voice wakeup detecting device and method | |
CN110291489B (zh) | 计算上高效的人类标识智能助理计算机 | |
CN108231079B (zh) | 用于控制电子设备的方法、装置、设备以及计算机可读存储介质 | |
US20170256270A1 (en) | Voice Recognition Accuracy in High Noise Conditions | |
US8972252B2 (en) | Signal processing apparatus having voice activity detection unit and related signal processing methods | |
CN108711430B (zh) | 语音识别方法、智能设备及存储介质 | |
US10991372B2 (en) | Method and apparatus for activating device in response to detecting change in user head feature, and computer readable storage medium | |
EP3693966A1 (en) | System and method for continuous privacy-preserved audio collection | |
EP3890342B1 (en) | Waking up a wearable device | |
CN109272991B (zh) | 语音交互的方法、装置、设备和计算机可读存储介质 | |
CN112102850B (zh) | 情绪识别的处理方法、装置、介质及电子设备 | |
KR102361458B1 (ko) | 사용자 발화 응답 방법 및 이를 지원하는 전자 장치 | |
WO2014130463A2 (en) | Hybrid performance scaling or speech recognition | |
CN110265036A (zh) | 语音唤醒方法、系统、电子设备及计算机可读存储介质 | |
KR102563817B1 (ko) | 사용자 음성 입력 처리 방법 및 이를 지원하는 전자 장치 | |
CN111599361A (zh) | 一种唤醒方法、装置、计算机存储介质及空调器 | |
CN109032345B (zh) | 设备控制方法、装置、设备、服务端和存储介质 | |
KR20190096308A (ko) | 전자기기 | |
CN115206306A (zh) | 语音交互方法、装置、设备及系统 | |
CN113808584B (zh) | 语音唤醒方法、装置、电子设备及存储介质 | |
CN112669837B (zh) | 智能终端的唤醒方法、装置及电子设备 | |
CN110262767A (zh) | 基于靠近嘴部检测的语音输入唤醒装置、方法和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080530 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101001 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101012 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110118 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110126 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140204 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |