JP6076994B2 - オーディオ特徴データの抽出と分析 - Google Patents
オーディオ特徴データの抽出と分析 Download PDFInfo
- Publication number
- JP6076994B2 JP6076994B2 JP2014538799A JP2014538799A JP6076994B2 JP 6076994 B2 JP6076994 B2 JP 6076994B2 JP 2014538799 A JP2014538799 A JP 2014538799A JP 2014538799 A JP2014538799 A JP 2014538799A JP 6076994 B2 JP6076994 B2 JP 6076994B2
- Authority
- JP
- Japan
- Prior art keywords
- processor
- audio
- codec
- mode
- low power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title description 19
- 238000000605 extraction Methods 0.000 title description 15
- 238000000034 method Methods 0.000 claims description 123
- 238000001514 detection method Methods 0.000 claims description 78
- 230000000694 effects Effects 0.000 claims description 72
- 230000007704 transition Effects 0.000 claims description 36
- 238000012546 transfer Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 15
- 238000001914 filtration Methods 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 230000003139 buffering effect Effects 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 7
- 230000008447 perception Effects 0.000 claims 1
- 230000004913 activation Effects 0.000 description 16
- 238000012545 processing Methods 0.000 description 14
- 238000003860 storage Methods 0.000 description 7
- 238000002604 ultrasonography Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000003213 activating effect Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000036279 refractory period Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W52/00—Power management, e.g. TPC [Transmission Power Control], power saving or power classes
- H04W52/02—Power saving arrangements
- H04W52/0209—Power saving arrangements in terminal devices
- H04W52/0261—Power saving arrangements in terminal devices managing power supply demand, e.g. depending on battery level
- H04W52/0274—Power saving arrangements in terminal devices managing power supply demand, e.g. depending on battery level by switching on or off the equipment or parts thereof
- H04W52/028—Power saving arrangements in terminal devices managing power supply demand, e.g. depending on battery level by switching on or off the equipment or parts thereof switching on or off only a part of the equipment circuit blocks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W52/00—Power management, e.g. TPC [Transmission Power Control], power saving or power classes
- H04W52/02—Power saving arrangements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Telephone Function (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Power Sources (AREA)
Description
本出願は、参照によりそれぞれの内容全体が本明細書に組み込まれている、2011年11月1日に出願した米国仮出願第61/554,318号および2012年5月30日に出願した米国非仮出願第13/483,732号の優先権を主張するものである。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1]
プロセッサにおいて低電力状態から遷移して出ることと、
前記低電力状態から遷移して出た後に、バッファから、前記プロセッサの前記低電力状態の期間中に受信されたオーディオデータの特徴を示すオーディオ特徴データを取り出すことと
を備える方法。
[C2]
前記プロセッサは、デジタルシグナルプロセッサを備え、前記取り出されたオーディオ特徴データに基づきアプリケーションプロセッサをアクティブ化するかどうかを決定することをさらに備えるC1に記載の方法。
[C3]
前記オーディオ特徴データは、前記プロセッサの前記低電力状態の少なくとも一部分の期間においてアクティブであるコーダ/デコーダ(CODEC)によって抽出されるC1に記載の方法。
[C4]
前記プロセッサは、複数のモードで動作するように構成される、ここにおいて、前記複数のモードのうちの第1のモードにおけるCODEC活動/プロセッサ活動の比は、前記複数のモードのうちの第2のモードにおけるCODEC活動/プロセッサ活動の比よりも大きく、前記プロセッサのアプリケーションコンテキストに基づき前記プロセッサをどのようなモードで動作させるかを決定することをさらに備えるC1に記載の方法。
[C5]
前記第1のモードの期間において、前記CODECは常時オンであり、前記プロセッサは第1の比率でデューティサイクルされ、前記第2のモードの期間において、前記CODECは第2の比率でデューティサイクルされ、前記プロセッサは前記第1の比率でデューティサイクルされ、前記第2の比率は前記第1の比率以上であるC4に記載の方法。
[C6]
前記第1のモードの期間において、前記CODECは第1の比率でデューティサイクルされ、前記プロセッサは第2の比率でデューティサイクルされ、前記第2のモードの期間において、前記CODECは第3の比率でデューティサイクルされ、前記プロセッサは前記第2の比率でデューティサイクルされ、ここにおいて前記第1の比率は、前記第2の比率よりも大きく、前記第3の比率は前記第2の比率以下であるC4に記載の方法。
[C7]
特定のモードにおいて、前記オーディオ特徴データは、複数のオーディオフレームに対応し、前記プロセッサは、前記低電力状態に遷移して戻る前に前記オーディオ特徴データを取り出して処理するC4に記載の方法。
[C8]
特定のモードにおいて、前記オーディオ特徴データは、単一のオーディオフレームに対応し、ここにおいて、前記プロセッサは、前記低電力状態に遷移して戻る前に前記オーディオ特徴データを取り出して処理するC4に記載の方法。
[C9]
前記プロセッサは、プログラム可能な時間期間の終了に応答して前記低電力状態から遷移して出る、
蓄積−フォワード−モードでは、前記プログラム可能な時間期間は、前記バッファのサイズに基づき決定される最大の時間期間以下である、
直接転送モードでは、前記プログラム可能な時間期間は、前記バッファの前記サイズと非依存である、C4に記載の方法。
[C10]
前記プロセッサは、前記低電力状態にあり、前記CODECは、
前記オーディオデータを受信し、
複数のフィルタを介して前記オーディオデータをフィルタし、
前記複数のフィルタのうちの各々からフィルタされたオーディオデータのエネルギーを計算し、
対数関数を前記計算されたエネルギーに適用して、前記オーディオ特徴データを生成し、
前記オーディオ特徴データを前記バッファ内に格納し、
前記オーディオデータを破棄する、
C3に記載の方法。
[C11]
前記バッファは、前記CODECの内部にある、C3に記載の方法。
[C12]
前記バッファは、前記CODECの外部にあり、また前記プロセッサの外部にある、C3に記載の方法。
[C13]
前記プロセッサは、デューティサイクルに基づき前記低電力状態に遷移して入り、そして出る、C1に記載の方法。
[C14]
前記オーディオ特徴データを変換することと、
前記変換されたオーディオ特徴データに1つまたは複数の音声認識オペレーションを実行すること、
前記1つまたは複数の音声認識オペレーションを実行した後に前記低電力状態に遷移して戻ることと
をさらに備えるC1に記載の方法。
[C15]
前記オーディオ特徴データを変換することは、複数のメル周波数ケプストラム係数を生成するC14に記載の方法。
[C16]
前記1つまたは複数の音声認識オペレーションは、聴取位置オペレーション、キーワード検出オペレーション、オーディオフィンガープリンティングオペレーション、ターゲット音検出オペレーション、ノベルティ検出オペレーション、またはこれらのいずれかの組合せを含むC14に記載の方法。
[C17]
前記プロセッサは、ワイヤレスデバイス内に一体化され、前記1つまたは複数の音声認識オペレーションの結果に基づき前記ワイヤレスデバイスの移動局モデムの少なくとも一部をアクティブ化するかどうかを決定することをさらに備えるC14に記載の方法。
[C18]
前記1つ又は複数の音声認識オペレーションの結果を複数のアプリケーションの各々に供給することをさらに備えるC14に記載の方法。
[C19]
コーダ/デコーダ(CODEC)においてオーディオデータの一つのフレームを受信することと、
オーディオデータの前記フレームからオーディオ特徴データを抽出することと、及び
前記デューティサイクルされるプロセッサのアクティブ状態の期間中にデューティサイクルされるプロセッサによってアクセス可能なように、バッファに前記抽出されたオーディオ特徴データを格納することと
を備える方法。
[C20]
前記CODECのアナログ/デジタルコンバータをオーディオデータの前記受信されたフレームに適用することをさらに備えるC19に記載の方法。
[C21]
前記オーディオ特徴データを抽出することは、
複数のフィルタを介してオーディオデータの前記フレームをフィルタすることと、
前記複数のフィルタのうちの各々からフィルタされたオーディオデータのエネルギーを計算することと、
対数関数を前記計算されたエネルギーに適用して前記オーディオ特徴データを生成することと
を備えるC19に記載の方法。
[C22]
前記複数のフィルタの各々は、人間の知覚の周波数スケールの異なる部分に対応するメル帯域フィルタを備えるC21に記載の方法。
[C23]
前記オーディオ特徴データを抽出した後にオーディオデータの前記フレームを破棄することをさらに備える、C19に記載の方法。
[C24]
プロセッサと、
前記プロセッサが低電力状態にあるか、またはアクティブ状態にあるかに依存せず、フィルタされたオーディオデータのエネルギーを発生するために、オーディオデータの1つまたは複数のフレームをフィルタする、ように構成された複数のフィルタと、
前記フィルタされたオーディオデータの前記エネルギーに基づきオーディオ特徴データを生成するように構成されたコンバータと、
変換関数を前記オーディオ特徴データに適用して変換データを生成するように構成された変換器と、
ここにおいて、前記プロセッサは、前記低電力状態から前記アクティブ状態に遷移した後に、前記変換データに1つまたは複数のオペレーションを実行するように構成される、
を備えた装置。
[C25]
コーダ/デコーダ(CODEC)をさらに備え、前記コンバータは、対数コンバータを備え、ここにおいて、前記複数のフィルタおよび前記対数コンバータは、前記CODECに一体化されるC24に記載の装置。
[C26]
前記変換器は、前記プロセッサに一体化された離散コサイン変換器を備えるC24に記載の装置。
[C27]
前記オーディオ特徴データを格納するように構成されたバッファをさらに備えるC24に記載の装置。
[C28]
前記バッファは、ランダムアクセスメモリ(RAM)を備えるC24に記載の装置。
[C29]
下記を行うように構成されたプロセッサを備える装置、
前記プロセッサのアプリケーションコンテキストに基づき第1のモードでの動作と第2のモードでの動作とを動的に切り替えること、
低電力状態から遷移して出た後に、バッファから、オーディオ特徴データを取り出すこと、前記オーディオ特徴データは、前記プロセッサが前記低電力状態にある間にコーダ/デコーダ(CODEC)によって受信されたオーディオデータの特徴を示す、
前記オーディオ特徴データを分析すること、
ここにおいて、前記第1のモードにおけるCODEC活動/プロセッサ活動の比は、前記第2のモードにおけるCODEC活動/プロセッサ活動の比よりも大きい。
[C30]
前記第1のモードの期間において、前記CODECは、常時オンであり、前記プロセッサは第1の比率でデューティサイクルされ、前記第2のモードの期間において、前記CODECは第2の比率でデューティサイクルされ、前記プロセッサは前記第1の比率でデューティサイクルされ、前記第2の比率は前記第1の比率以上であるC29に記載の装置。
[C31]
前記第1のモードの期間において、前記CODECは第1の比率でデューティサイクルされ、前記プロセッサは第2の比率でデューティサイクルされ、ここにおいて、前記第2のモードの期間において、前記CODECは第3の比率でデューティサイクルされ、前記プロセッサは前記第2の比率でデューティサイクルされ、ここにおいて、前記第1の比率は、前記第2の比率よりも大きく、ここにおいて、前記第3の比率は前記第2の比率以上である、
C29に記載の装置。
[C32]
前記アプリケーションコンテキストは、聴取位置検出、連続的キーワード検出、連続的オーディオフィンガープリンティング、ターゲット音検出、ノベルティ検出、またはこれらの任意の組合せを含むC29に記載の装置。
[C33]
前記コーダ/デコーダ(CODEC)をさらに備え、ここにおいて、前記CODECは、前記オーディオデータから前記オーディオ特徴データを抽出し、前記バッファに前記抽出されたオーディオ特徴データを格納するように構成される、C29に記載の装置。
[C34]
前記プロセッサは、プログラム可能な時間期間の終了に応答して前記低電力状態から遷移して出る、C29に記載の装置。
[C35]
オーディオデータの1つまたは複数のフレームを受信するための手段と、
プロセッサが低電力状態にあるか、またはアクティブ状態にあるかに依存せずフィルタされたオーディオデータを発生するためにオーディオデータの前記1つまたは複数のフレームをフィルタするための手段と、
前記フィルタされたオーディオデータの前記エネルギーに基づきオーディオ特徴データを生成するための手段と、
前記オーディオ特徴データを変換して変換データを生成するための手段と、
前記プロセッサが前記低電力状態から前記アクティブ状態に遷移した後に、前記変換データに1つまたは複数のオペレーションを実行するための手段と、
を備える装置。
[C36]
フィルタするための前記手段、生成するための前記手段、および変換するための前記手段の少なくとも1つの出力をバッファリングするための手段をさらに備えるC35に記載の装置。
[C37]
プロセッサによる実行時に、前記プロセッサに以下を行わせる命令を備える非一時的プロセッサ可読媒体、
第1のモードでの動作と第2のモードでの動作とを動的に切り替える、ここにおいて、前記第1のモードにおけるコーダ/デコーダ(CODEC)活動/プロセッサ活動の比は、前記第2のモードにおけるCODEC活動/プロセッサ活動の比よりも大きいことと、
デューティサイクルの期間において低電力状態から遷移して出ることと、
前記低電力状態において抽出されたオーディオ特徴データを分析することと、及び
前記低電力状態に遷移して戻ること。
[C38]
前記オーディオ特徴データは、CODECによって抽出される、C37に記載の非一時的プロセッサ可読媒体。
[C39]
電子デバイスの第1のコンポーネントにおいて音声データを受け取ることと、
前記第1のコンポーネントにおいて、前記音声データに対して少なくとも1つの信号検出オペレーションを実行することと、
前記少なくとも1つの信号検出オペレーションの結果に基づき前記電子デバイスの第2のコンポーネントを選択的にアクティブにすること、
ここにおいて、アクティブであるときの前記第2のコンポーネントは、アクティブであるときの前記第1のコンポーネントに比べて前記電子デバイスにおいてより多くの電力を消費する、
を備える方法。
[C40]
前記第1のコンポーネントは、コーダ/デコーダ(CODEC)の第1の部分を備えるC39に記載の方法。
[C41]
前記第2の部分は、前記CODECの第2の部分を備えるC40に記載の方法。
[C42]
前記第2のコンポーネントは、前記電子デバイスのプロセッサを備えるC40に記載の方法。
[C43]
前記第2のコンポーネントにおいて、少なくとも1つの第2の信号検出オペレーションを実行することと、
前記少なくとも1つの第2の信号検出オペレーションの結果に基づき前記電子デバイスの第3のコンポーネントを選択的にアクティブ化すること、
ここにおいて、アクティブであるときの前記第3のコンポーネントは、アクティブであるときの前記第2のコンポーネントに比べて前記電子デバイスにおいてより多くの電力を消費する、
をさらに備えるC40に記載の方法。
[C44]
前記少なくとも1つの信号検出オペレーションは、二乗平均平方根(RMS)分類オペレーション、帯域電力分類オペレーション、時間領域オペレーション、周波数領域オペレーション、パターンマッチングオペレーション、モデルベースオペレーション、ノベルティ検出オペレーション、またはこれらの任意の組合せを備えるC39に記載の方法。
Claims (44)
- プロセッサが低電力モードにある間にアクティブコーダ/デコーダ(CODEC)においてオーディオデータを受信することと、前記プロセッサは、CODEC活動/プロセッサ活動の比が、前記低電力モードにおけるCODEC活動/プロセッサ活動の比よりも小さい第2のモードに、前記プロセッサのアプリケーションコンテキストに基づき遷移するように構成される、
前記プロセッサが前記低電力モードから遷移して出た後に、バッファから、オーディオ特徴データを取り出すことと、前記オーディオ特徴データは、前記オーディオデータの特徴を示す、
を備える、方法。 - 前記プロセッサは、デジタルシグナルプロセッサを備え、前記取り出されたオーディオ特徴データに基づきアプリケーションプロセッサをアクティブ化するかどうかを決定することをさらに備える、請求項1に記載の方法。
- 前記プロセッサが前記低電力モードにある間に前記バッファ内に前記オーディオ特徴データを格納すること
をさらに備える、請求項1に記載の方法。 - 前記アプリケーションコンテキストは、アプリケーションの実行に関連し、ここにおいて、前記アプリケーションの実行は、聴取位置検出、連続的キーワード検出、連続的オーディオフィンガープリンティング、ターゲット音検出、ノベルティ検出、またはこれらの任意の組合せを含む、請求項1に記載の方法。
- 前記低電力モードの期間において、前記CODECはオンであり、前記プロセッサは第1の比率でデューティサイクルされ、ここにおいて、前記第2のモードの期間において、前記CODECは第2の比率でデューティサイクルされ、前記プロセッサは前記第1の比率でデューティサイクルされ、ここにおいて、前記第2の比率は前記第1の比率以上である、請求項1に記載の方法。
- 前記低電力モードの期間において、前記CODECは第1の比率でデューティサイクルされ、前記プロセッサは第2の比率でデューティサイクルされ、ここにおいて、前記第2のモードの期間において、前記CODECは第3の比率でデューティサイクルされ、前記プロセッサは前記第2の比率でデューティサイクルされ、ここにおいて、前記第1の比率は前記第2の比率よりも大きく、前記第3の比率は前記第2の比率以下である、請求項1に記載の方法。
- 前記オーディオ特徴データは、複数のオーディオフレームに対応し、ここにおいて、前記オーディオ特徴データは、前記プロセッサが前記低電力モードである間に前記オーディオデータから抽出され、ここにおいて、前記プロセッサは、前記第2のモードから前記低電力モードに遷移する前に前記オーディオ特徴データを取り出して処理する、請求項1に記載の方法。
- 前記オーディオ特徴データは、単一のオーディオフレームに対応し、ここにおいて、前記プロセッサは、前記第2のモードから前記低電力モードに遷移する前に前記オーディオ特徴データを取り出して処理する、請求項1に記載の方法。
- 前記プロセッサは、プログラム可能な時間期間の終了に応答して前記低電力モードから遷移して出る、
蓄積−フォワード−モードでは、前記プログラム可能な時間期間は、前記バッファのサイズに基づき決定される最大の時間期間以下である、
直接転送モードでは、前記プログラム可能な時間期間は、前記バッファの前記サイズと非依存である、請求項1に記載の方法。 - プロセッサにおいて低電力状態から遷移して出ることと、
前記低電力状態から遷移して出た後に、バッファからオーディオ特徴データを取り出すことと、前記オーディオ特徴データは、前記低電力状態の少なくとも一部分の期間においてアクティブであるコーダ/デコーダ(CODEC)によって抽出され、前記低電力状態の期間において受信されたオーディオデータの特徴を示す、
ここにおいて、前記プロセッサが前記低電力状態にある間に前記CODECは、
前記オーディオデータを受信し、
複数のフィルタを介して前記オーディオデータをフィルタし、
前記複数のフィルタのうちの各々から、フィルタされたオーディオデータのエネルギーを計算し、
対数関数を前記計算されたエネルギーに適用して、前記オーディオ特徴データを生成し、
前記オーディオ特徴データを前記バッファ内に格納し、
前記オーディオデータを破棄する、
を備える、方法。 - 前記バッファは、前記CODECの内部にある、請求項10に記載の方法。
- 前記バッファは、前記CODECの外部にあり、また前記プロセッサの外部にあり、ここにおいて、前記プロセッサは、固定のデューティサイクルに従って一定の比率で前記低電力状態に遷移して入り、そして出る、請求項10に記載の方法。
- 前記オーディオ特徴データは、前記プロセッサの低電力状態の期間において前記バッファで受信されたオーディオデータの特徴を示し、ここにおいて、前記プロセッサは、デューティサイクルに基づき前記低電力状態に遷移して入り、そして出る、請求項1に記載の方法。
- 前記オーディオ特徴データを変換することと、
前記変換されたオーディオ特徴データに1つまたは複数の音声認識オペレーションを実行することと、
前記1つまたは複数の音声認識オペレーションを実行した後に、前記低電力状態に遷移することと
をさらに備える、請求項13に記載の方法。 - 前記オーディオ特徴データを変換することは、複数のメル周波数ケプストラム係数を生成する、請求項14に記載の方法。
- 前記1つまたは複数の音声認識オペレーションは、聴取位置オペレーション、キーワード検出オペレーション、オーディオフィンガープリンティングオペレーション、ターゲット音検出オペレーション、ノベルティ検出オペレーション、またはこれらの任意の組合せを含む、請求項14に記載の方法。
- 前記プロセッサは、ワイヤレスデバイスに一体化され、ここにおいて、前記オーディオ特徴データは、前記プロセッサの低電力状態の期間において前記バッファで受信されたオーディオデータの特徴を示し、さらに、
前記オーディオ特徴データを変換することと、
前記変換されたオーディオ特徴データに1つまたは複数の音声認識オペレーションを実行することと、
前記1つまたは複数の音声認識オペレーションの結果に基づき前記ワイヤレスデバイスの移動局モデムの少なくとも一部をアクティブ化するかどうかを決定することと
を備える、請求項1に記載の方法。 - 前記1つまたは複数の音声認識オペレーションの結果を複数のアプリケーションの各々に提供することをさらに備える、請求項17に記載の方法。
- デューティサイクルされるプロセッサが第1のモードにある間にアクティブコーダ/デコーダ(CODEC)においてオーディオデータの1つのフレームを受信することと、前記デューティサイクルされるプロセッサは、CODEC活動/プロセッサ活動の比が、前記第1のモードにおけるCODEC活動/プロセッサ活動の比よりも小さいアクティブモードに、前記プロセッサのアプリケーションコンテキストに基づき遷移するように構成される、
オーディオデータの前記フレームからオーディオ特徴データを抽出することと、
前記デューティサイクルされるプロセッサが前記第1のモードにある間に、前記アクティブモードの期間において前記デューティサイクルされるプロセッサによってアクセス可能なように、バッファ内に前記抽出されたオーディオ特徴データを格納することと
を備える、方法。 - 前記CODECのアナログ/デジタルコンバータをオーディオデータの前記受信されたフレームに適用することをさらに備える、請求項19に記載の方法。
- 前記オーディオ特徴データを抽出することは、
複数のフィルタを介してオーディオデータの前記フレームをフィルタすることと、
前記複数のフィルタのうちの各々から、フィルタされたオーディオデータのエネルギーを計算することと、
対数関数を前記計算されたエネルギーに適用して、前記オーディオ特徴データを生成することと
を備える、請求項19に記載の方法。 - 前記複数のフィルタの各々は、人間の知覚の周波数スケールの異なる部分に対応するメル帯域フィルタを備える、請求項21に記載の方法。
- 前記オーディオ特徴データを抽出した後に、オーディオデータの前記フレームを破棄することをさらに備える、請求項19に記載の方法。
- プロセッサのアプリケーションコンテキストに基づき低電力モードでの動作とアクティブモードでの動作とを切り替えるように構成された前記プロセッサと、
前記プロセッサが前記低電力モードにあるとき、
フィルタされたオーディオデータのエネルギーを発生するために、オーディオデータの1つまたは複数のフレームをフィルタし、
前記フィルタされたオーディオデータの前記エネルギーに基づきオーディオ特徴データを生成する
ように構成されたコンポーネントと、
変換関数を前記オーディオ特徴データに適用して、変換データを生成するように構成された変換器と
ここにおいて、コンポーネント活動/プロセッサ活動の比は、前記アクティブモードに比べて前記低電力モードにおいてより大きく、ここにおいて、前記プロセッサは、前記アクティブモードに前記低電力モードから遷移して出た後に、前記変換データに1つまたは複数のオペレーションを実行するように構成される、
を備える、装置。 - オーディオデータの前記1つまたは複数のフレームをフィルタするように構成された複数のフィルタと、
前記オーディオ特徴データを生成するように構成された対数コンバータと、
コーダ/デコーダ(CODEC)と、ここにおいて、前記複数のフィルタおよび前記対数コンバータは、前記CODECに一体化される、
をさらに備える、請求項24に記載の装置。 - 前記変換器は、前記プロセッサに一体化された離散コサイン変換器を備える、請求項24に記載の装置。
- 前記オーディオ特徴データを格納するように構成されたバッファをさらに備える、請求項24に記載の装置。
- 前記バッファは、ランダムアクセスメモリ(RAM)を備える、請求項27に記載の装置。
- 低電力モードから遷移して出た後に、バッファから、オーディオ特徴データを取り出すことと、前記オーディオ特徴データは、プロセッサが前記低電力モードにある間にアクティブコーダ/デコーダ(CODEC)によって受信されたオーディオデータの特徴を示す、ここにおいて、第2のモードにおけるCODEC活動/プロセッサ活動の比は、前記低電力モードにおけるCODEC活動/プロセッサ活動の比よりも小さい、
前記オーディオ特徴データを分析することと、
ここにおいて、前記プロセッサは、前記プロセッサのアプリケーションコンテキストに基づき前記低電力モードと前記第2のモードとを切り替えるように構成される、
を行うように構成された前記プロセッサ
を備える、装置。 - 前記低電力モードの期間において、前記CODECはオンであり、前記プロセッサは第1の比率でデューティサイクルされ、ここにおいて、前記第2のモードの期間において、前記CODECは第2の比率でデューティサイクルされ、前記プロセッサは前記第1の比率でデューティサイクルされ、ここにおいて、前記第2の比率は前記第1の比率以上である、請求項29に記載の装置。
- 前記低電力モードの期間において、前記CODECは第1の比率でデューティサイクルされ、前記プロセッサは第2の比率でデューティサイクルされ、ここにおいて、前記第2のモードの期間において、前記CODECは第3の比率でデューティサイクルされ、前記プロセッサは前記第2の比率でデューティサイクルされ、ここにおいて、前記第1の比率は前記第2の比率よりも大きく、ここにおいて、前記第3の比率は前記第2の比率以上である、請求項29に記載の装置。
- 前記アプリケーションコンテキストは、アプリケーションの実行に関連し、ここにおいて、前記アプリケーションの実行は、聴取位置検出、連続的キーワード検出、連続的オーディオフィンガープリンティング、ターゲット音検出、ノベルティ検出、またはこれらの任意の組合せを含む、請求項29に記載の装置。
- 前記CODECをさらに備え、ここにおいて、前記CODECは、前記オーディオデータから前記オーディオ特徴データを抽出し、前記バッファ内に前記抽出されたオーディオ特徴データを格納するように構成される、請求項29に記載の装置。
- 前記プロセッサは、プログラム可能な時間期間の終了に応答して前記低電力モードから遷移して出る、請求項29に記載の装置。
- オーディオデータの1つまたは複数のフレームを受信するための手段と、前記受信するための手段は、
プロセッサが、第1のモードにあるとき、フィルタされたオーディオデータのエネルギーを発生するために、オーディオデータの前記1つまたは複数のフレームをフィルタするための手段と、
前記プロセッサが、前記第1のモードにあるとき、前記フィルタされたオーディオデータの前記エネルギーに基づきオーディオ特徴データを生成するための手段と、
ここにおいて、前記プロセッサは、前記プロセッサのアプリケーションコンテキストに基づき前記第1のモードでの動作とアクティブモードでの動作とを切り替えるように構成され、受信するための前記手段の活動/前記プロセッサの活動の比は、前記アクティブモードに比べて前記第1のモードにおいてより大きい、
を含み、
前記オーディオ特徴データを変換して変換データを生成するための手段と、
前記プロセッサが前記第1のモードから前記アクティブモードに遷移して出た後に、前記変換データに1つまたは複数のオペレーションを実行するための手段と、
を備える、装置。 - 前記第1のモードは、前記プロセッサの低電力状態に対応し、
フィルタするための前記手段、生成するための前記手段、および変換するための前記手段のうちの少なくとも1つの出力をバッファリングするための手段
をさらに備える、請求項35に記載の装置。 - プロセッサによる実行時に、前記プロセッサに、
低電力モードでの動作と第2のモードでの動作とを切り替えることと、ここにおいて、前記低電力モードにおけるコーダ/デコーダ(CODEC)活動/プロセッサ活動の比は、前記第2のモードにおけるCODEC活動/プロセッサ活動の比よりも大きい、
デューティサイクルの期間において前記低電力モードから遷移して出ることと、
第2の時間期間でオーディオ特徴データを分析することと、前記オーディオ特徴データは、前記CODECがアクティブであり、前記プロセッサが前記低電力モードにあるとき、第1の時間期間において抽出される、
前記第2のモードから前記低電力モードに遷移することと
を行わせる命令を記憶する、プロセッサ可読媒体。 - 前記オーディオ特徴データは、前記CODECによって抽出される、請求項37に記載のプロセッサ可読媒体。
- 電子デバイスの第1のコンポーネントにおいて音声データを受信することと、
前記第1のコンポーネントがアクティブであり、前記電子デバイスの第2のコンポーネントが低電力モードにある間に、前記音声データに少なくとも1つの信号検出オペレーションを実行することと、
前記少なくとも1つの信号検出オペレーションの結果に基づき前記第2のコンポーネントをアクティブ化することと、
ここにおいて、前記第2のコンポーネントは、前記第2のコンポーネントのアプリケーションコンテキストに基づき前記低電力モードでの動作と第2のモードでの動作とを切り替えるように構成され、第2のコンポーネント活動/第1のコンポーネント活動の比は、前記第2のモードに比べて前記低電力モードにおいてより少ない、
を備える、方法。 - 前記第1のコンポーネントは、コーダ/デコーダ(CODEC)に含まれる、請求項39に記載の方法。
- アクティブであるときの前記第2のコンポーネントは、アクティブであるときの前記第1のコンポーネントに比べて前記電子デバイスにおいてより多くの電力を消費する、請求項39に記載の方法。
- 前記第2のコンポーネントは、前記電子デバイスのプロセッサを備える、請求項39に記載の方法。
- 前記第1のコンポーネントにおいて、少なくとも1つの第2の信号検出オペレーションを実行することと、
前記少なくとも1つの第2の信号検出オペレーションの結果に基づき前記電子デバイスの前記第2のコンポーネントをアクティブ化することと
をさらに備える、請求項39に記載の方法。 - 前記少なくとも1つの信号検出オペレーションは、二乗平均平方根(RMS)分類オペレーション、帯域電力分類オペレーション、時間領域オペレーション、周波数領域オペレーション、パターンマッチングオペレーション、モデルベースオペレーション、ノベルティ検出オペレーション、またはこれらの任意の組合せを含む、請求項39に記載の方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161554318P | 2011-11-01 | 2011-11-01 | |
US61/554,318 | 2011-11-01 | ||
US13/483,732 US9992745B2 (en) | 2011-11-01 | 2012-05-30 | Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate |
US13/483,732 | 2012-05-30 | ||
PCT/US2012/057078 WO2013066523A2 (en) | 2011-11-01 | 2012-09-25 | Extraction and analysis of audio feature data |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015501450A JP2015501450A (ja) | 2015-01-15 |
JP2015501450A5 JP2015501450A5 (ja) | 2016-10-06 |
JP6076994B2 true JP6076994B2 (ja) | 2017-02-08 |
Family
ID=48173294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014538799A Active JP6076994B2 (ja) | 2011-11-01 | 2012-09-25 | オーディオ特徴データの抽出と分析 |
Country Status (8)
Country | Link |
---|---|
US (1) | US9992745B2 (ja) |
EP (1) | EP2774420A2 (ja) |
JP (1) | JP6076994B2 (ja) |
KR (1) | KR101622493B1 (ja) |
CN (2) | CN108551686B (ja) |
BR (1) | BR112014010032A8 (ja) |
IN (1) | IN2014MN00769A (ja) |
WO (1) | WO2013066523A2 (ja) |
Families Citing this family (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101804799B1 (ko) * | 2011-10-25 | 2017-12-06 | 삼성전자주식회사 | 저전력으로 오디오 데이터를 재생하는 장치 및 방법 |
KR20160036104A (ko) | 2011-12-07 | 2016-04-01 | 퀄컴 인코포레이티드 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
CN104396275B (zh) * | 2012-03-29 | 2017-09-29 | 海宝拉株式会社 | 使用耳内插入型麦克风的有线无线耳机 |
WO2013179263A1 (en) * | 2012-05-30 | 2013-12-05 | Marvell World Trade Ltd. | Network presence offload |
US9256269B2 (en) * | 2013-02-20 | 2016-02-09 | Sony Computer Entertainment Inc. | Speech recognition system for performing analysis to a non-tactile inputs and generating confidence scores and based on the confidence scores transitioning the system from a first power state to a second power state |
US9703350B2 (en) * | 2013-03-15 | 2017-07-11 | Maxim Integrated Products, Inc. | Always-on low-power keyword spotting |
US9270801B2 (en) * | 2013-03-15 | 2016-02-23 | Intel Corporation | Low power audio trigger via intermittent sampling |
US9892729B2 (en) * | 2013-05-07 | 2018-02-13 | Qualcomm Incorporated | Method and apparatus for controlling voice activation |
US20140337030A1 (en) * | 2013-05-07 | 2014-11-13 | Qualcomm Incorporated | Adaptive audio frame processing for keyword detection |
US20140337031A1 (en) * | 2013-05-07 | 2014-11-13 | Qualcomm Incorporated | Method and apparatus for detecting a target keyword |
US20150032238A1 (en) | 2013-07-23 | 2015-01-29 | Motorola Mobility Llc | Method and Device for Audio Input Routing |
CN104683933A (zh) | 2013-11-29 | 2015-06-03 | 杜比实验室特许公司 | 音频对象提取 |
WO2015100430A1 (en) | 2013-12-24 | 2015-07-02 | Digimarc Corporation | Methods and system for cue detection from audio input, low-power data processing and related arrangements |
JP6068401B2 (ja) * | 2014-07-30 | 2017-01-25 | ファナック株式会社 | 加工プログラムの読み出し時間に左右されないdnc運転手段を備えた数値制御装置 |
US9549273B2 (en) | 2014-08-28 | 2017-01-17 | Qualcomm Incorporated | Selective enabling of a component by a microphone circuit |
WO2016048037A1 (ko) * | 2014-09-23 | 2016-03-31 | 엘지전자 주식회사 | 무선 통신 시스템에서 장치 대 장치 단말의 디스커버리 신호 전송 방법 및 장치 |
CN106797507A (zh) * | 2014-10-02 | 2017-05-31 | 美商楼氏电子有限公司 | 低功率声学装置和操作方法 |
US9693375B2 (en) * | 2014-11-24 | 2017-06-27 | Apple Inc. | Point-to-point ad hoc voice communication |
US9652017B2 (en) | 2014-12-17 | 2017-05-16 | Qualcomm Incorporated | System and method of analyzing audio data samples associated with speech recognition |
US10719115B2 (en) * | 2014-12-30 | 2020-07-21 | Avago Technologies International Sales Pte. Limited | Isolated word training and detection using generated phoneme concatenation models of audio inputs |
CN104636474A (zh) * | 2015-02-13 | 2015-05-20 | 王磊 | 构建音频指纹库及检索音频指纹的方法和设备 |
AU2015390534B2 (en) | 2015-04-10 | 2019-08-22 | Honor Device Co., Ltd. | Speech recognition method, speech wakeup apparatus, speech recognition apparatus, and terminal |
US11956503B2 (en) * | 2015-10-06 | 2024-04-09 | Comcast Cable Communications, Llc | Controlling a device based on an audio input |
US10057642B2 (en) | 2015-10-06 | 2018-08-21 | Comcast Cable Communications, Llc | Controlling the provision of power to one or more devices |
US9779735B2 (en) | 2016-02-24 | 2017-10-03 | Google Inc. | Methods and systems for detecting and processing speech signals |
WO2017151650A1 (en) | 2016-02-29 | 2017-09-08 | Littrell Robert J | A piezoelectric mems device for producing a signal indicative of detection of an acoustic stimulus |
CN106910494B (zh) | 2016-06-28 | 2020-11-13 | 创新先进技术有限公司 | 一种音频识别方法和装置 |
CN106782529B (zh) * | 2016-12-23 | 2020-03-10 | 北京云知声信息技术有限公司 | 语音识别的唤醒词选择方法及装置 |
US11024302B2 (en) * | 2017-03-14 | 2021-06-01 | Texas Instruments Incorporated | Quality feedback on user-recorded keywords for automatic speech recognition systems |
CN108563468B (zh) * | 2018-03-30 | 2021-09-21 | 深圳市冠旭电子股份有限公司 | 一种蓝牙音箱数据处理的方法、装置及蓝牙音箱 |
US10321251B1 (en) * | 2018-06-18 | 2019-06-11 | Republic Wireless, Inc. | Techniques of performing microphone switching for a multi-microphone equipped device |
WO2020111676A1 (ko) | 2018-11-28 | 2020-06-04 | 삼성전자 주식회사 | 음성 인식 장치 및 방법 |
KR20200063984A (ko) * | 2018-11-28 | 2020-06-05 | 삼성전자주식회사 | 음성 인식 장치 및 방법 |
CN109814406B (zh) * | 2019-01-24 | 2021-12-24 | 成都戴瑞斯智控科技有限公司 | 一种轨道模型电控仿真系统的数据处理方法及解码器架构 |
EP3939336A4 (en) | 2019-03-14 | 2022-12-07 | Qualcomm Technologies, Inc. | PIEZOELECTRIC MEMS DEVICE WITH ADAPTIVE THRESHOLD FOR DETECTING AN ACOUSTIC STIMULUS |
WO2020186265A1 (en) * | 2019-03-14 | 2020-09-17 | Vesper Technologies Inc. | Microphone having a digital output determined at different power consumption levels |
US11726105B2 (en) | 2019-06-26 | 2023-08-15 | Qualcomm Incorporated | Piezoelectric accelerometer with wake function |
CN113628616A (zh) * | 2020-05-06 | 2021-11-09 | 阿里巴巴集团控股有限公司 | 音频采集设备、无线耳机以及电子设备系统 |
TWI748587B (zh) * | 2020-08-04 | 2021-12-01 | 瑞昱半導體股份有限公司 | 聲音事件偵測系統及方法 |
KR102599480B1 (ko) * | 2021-05-18 | 2023-11-08 | 부산대학교 산학협력단 | 키워드 음성인식을 위한 자동 학습 시스템 및 방법 |
CN115579013B (zh) * | 2022-12-09 | 2023-03-10 | 深圳市锦锐科技股份有限公司 | 一种低功耗音频解码器 |
CN116456441B (zh) * | 2023-06-16 | 2023-10-31 | 荣耀终端有限公司 | 声音处理装置、方法和电子设备 |
Family Cites Families (71)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5278944A (en) * | 1992-07-15 | 1994-01-11 | Kokusai Electric Co., Ltd. | Speech coding circuit |
JPH07121195A (ja) | 1993-10-25 | 1995-05-12 | Sony Corp | 音声処理用ディジタルシグナルプロセッサ |
JPH07244494A (ja) | 1994-03-04 | 1995-09-19 | Ricoh Co Ltd | 音声認識装置 |
US6070140A (en) | 1995-06-05 | 2000-05-30 | Tran; Bao Q. | Speech recognizer |
US5721938A (en) | 1995-06-07 | 1998-02-24 | Stuckey; Barbara K. | Method and device for parsing and analyzing natural language sentences and text |
JP3674990B2 (ja) | 1995-08-21 | 2005-07-27 | セイコーエプソン株式会社 | 音声認識対話装置および音声認識対話処理方法 |
JP3726448B2 (ja) | 1997-03-12 | 2005-12-14 | セイコーエプソン株式会社 | 認識対象音声検出方法およびその装置 |
JP4827274B2 (ja) | 1997-12-30 | 2011-11-30 | ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー | コマンド辞書を使用する音声認識方法 |
GB2342828A (en) | 1998-10-13 | 2000-04-19 | Nokia Mobile Phones Ltd | Speech parameter compression; distributed speech recognition |
EP1058876B1 (en) | 1999-01-06 | 2009-11-25 | Koninklijke Philips Electronics N.V. | Speech input device with attention span |
US6408272B1 (en) | 1999-04-12 | 2002-06-18 | General Magic, Inc. | Distributed voice user interface |
US6393572B1 (en) * | 1999-04-28 | 2002-05-21 | Philips Electronics North America Corporation | Sleepmode activation in a slave device |
JP2000315097A (ja) | 1999-04-30 | 2000-11-14 | Canon Inc | 電子機器、その制御方法、及び記録媒体 |
US6594630B1 (en) | 1999-11-19 | 2003-07-15 | Voice Signal Technologies, Inc. | Voice-activated control for electrical device |
US8108218B1 (en) | 1999-12-13 | 2012-01-31 | Avaya Inc. | Methods and apparatus for voice recognition for call treatment modification on messaging |
KR100340045B1 (ko) | 1999-12-24 | 2002-06-12 | 오길록 | 저전력 음성 명령어 구동 휴대 정보단말 장치 및 그를 이용한 음성인식 방법 |
KR100447667B1 (ko) | 2000-04-12 | 2004-09-08 | 이경목 | 음성 인식 기능을 갖는 컴퓨터와 학습용 인형들을 이용한 상호 대화 언어 학습 시스템 |
JP2002123283A (ja) | 2000-10-12 | 2002-04-26 | Nissan Motor Co Ltd | 音声認識操作装置 |
US20020077830A1 (en) | 2000-12-19 | 2002-06-20 | Nokia Corporation | Method for activating context sensitive speech recognition in a terminal |
EP1374228B1 (en) | 2001-03-14 | 2005-02-02 | International Business Machines Corporation | Method and processor system for processing of an audio signal |
US8266451B2 (en) | 2001-08-31 | 2012-09-11 | Gemalto Sa | Voice activated smart card |
US6987947B2 (en) * | 2001-10-30 | 2006-01-17 | Unwired Technology Llc | Multiple channel wireless communication system |
KR100594140B1 (ko) | 2002-04-13 | 2006-06-28 | 삼성전자주식회사 | 무선통신시스템의 패킷 데이터 서비스 방법 |
TWI225640B (en) | 2002-06-28 | 2004-12-21 | Samsung Electronics Co Ltd | Voice recognition device, observation probability calculating device, complex fast fourier transform calculation device and method, cache device, and method of controlling the cache device |
JP2004226698A (ja) | 2003-01-23 | 2004-08-12 | Yaskawa Electric Corp | 音声認識装置 |
JP2004265217A (ja) | 2003-03-03 | 2004-09-24 | Nec Corp | 音声認識機能を有する移動通信端末とその端末を利用したキーワード検索方法 |
KR20050110021A (ko) | 2003-03-17 | 2005-11-22 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 디바이스의 원격 제어 방법 |
JP2004294946A (ja) | 2003-03-28 | 2004-10-21 | Toshiba Corp | 携帯型電子機器 |
JP4301896B2 (ja) | 2003-08-22 | 2009-07-22 | シャープ株式会社 | 信号分析装置、音声認識装置、プログラム、記録媒体、並びに電子機器 |
TWI222837B (en) | 2003-10-14 | 2004-10-21 | Design Technology Inc G | Audio signal compression processing device to with reduced power consumption |
US20060074658A1 (en) | 2004-10-01 | 2006-04-06 | Siemens Information And Communication Mobile, Llc | Systems and methods for hands-free voice-activated devices |
JP2007219207A (ja) | 2006-02-17 | 2007-08-30 | Fujitsu Ten Ltd | 音声認識装置 |
JP2007255897A (ja) | 2006-03-20 | 2007-10-04 | Clarion Co Ltd | ナビゲーションシステム並びに装置、その制御方法及び制御プログラム |
US20070254680A1 (en) | 2006-05-01 | 2007-11-01 | Shary Nassimi | Wirefree intercom having low power system and process |
KR100744301B1 (ko) | 2006-06-01 | 2007-07-30 | 삼성전자주식회사 | 음성 인식을 이용하여 동작 모드를 전환하는 휴대 단말기및 그 방법 |
US8207936B2 (en) | 2006-06-30 | 2012-06-26 | Sony Ericsson Mobile Communications Ab | Voice remote control |
EP1879000A1 (en) | 2006-07-10 | 2008-01-16 | Harman Becker Automotive Systems GmbH | Transmission of text messages by navigation systems |
EP1939860B1 (en) | 2006-11-30 | 2009-03-18 | Harman Becker Automotive Systems GmbH | Interactive speech recognition system |
US9760146B2 (en) | 2007-01-08 | 2017-09-12 | Imagination Technologies Limited | Conditional activation and deactivation of a microprocessor |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US20080221884A1 (en) | 2007-03-07 | 2008-09-11 | Cerra Joseph P | Mobile environment speech processing facility |
US7774626B2 (en) | 2007-03-29 | 2010-08-10 | Intel Corporation | Method to control core duty cycles using low power modes |
EP1978765A1 (en) | 2007-04-02 | 2008-10-08 | BRITISH TELECOMMUNICATIONS public limited company | Power management scheme for mobile communication devices |
JP2008309864A (ja) | 2007-06-12 | 2008-12-25 | Fujitsu Ten Ltd | 音声認識装置および音声認識方法 |
US20090055005A1 (en) | 2007-08-23 | 2009-02-26 | Horizon Semiconductors Ltd. | Audio Processor |
US8725520B2 (en) | 2007-09-07 | 2014-05-13 | Qualcomm Incorporated | Power efficient batch-frame audio decoding apparatus, system and method |
US8554550B2 (en) * | 2008-01-28 | 2013-10-08 | Qualcomm Incorporated | Systems, methods, and apparatus for context processing using multi resolution analysis |
US8050932B2 (en) * | 2008-02-20 | 2011-11-01 | Research In Motion Limited | Apparatus, and associated method, for selecting speech COder operational rates |
KR20090107365A (ko) | 2008-04-08 | 2009-10-13 | 엘지전자 주식회사 | 이동 단말기 및 그 메뉴 제어방법 |
JP5327838B2 (ja) | 2008-04-23 | 2013-10-30 | Necインフロンティア株式会社 | 音声入力分散処理方法及び音声入力分散処理システム |
US8244528B2 (en) | 2008-04-25 | 2012-08-14 | Nokia Corporation | Method and apparatus for voice activity determination |
CA2665055C (en) | 2008-05-23 | 2018-03-06 | Accenture Global Services Gmbh | Treatment processing of a plurality of streaming voice signals for determination of responsive action thereto |
JP2010136292A (ja) * | 2008-12-08 | 2010-06-17 | Toshiba Corp | 画像処理装置 |
WO2010078386A1 (en) | 2008-12-30 | 2010-07-08 | Raymond Koverzin | Power-optimized wireless communications device |
JP4809454B2 (ja) | 2009-05-17 | 2011-11-09 | 株式会社半導体理工学研究センター | 発話推定による回路起動方法及び回路起動装置 |
JP2011071937A (ja) | 2009-09-28 | 2011-04-07 | Kyocera Corp | 電子機器 |
US20110099507A1 (en) | 2009-10-28 | 2011-04-28 | Google Inc. | Displaying a collection of interactive elements that trigger actions directed to an item |
CN201752079U (zh) | 2010-01-15 | 2011-02-23 | 硕呈科技股份有限公司 | 待命模式的电源变动唤醒装置 |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
KR20110110434A (ko) | 2010-04-01 | 2011-10-07 | 삼성전자주식회사 | 저전력 오디오 재생장치 및 방법 |
KR101733205B1 (ko) | 2010-04-05 | 2017-05-08 | 삼성전자주식회사 | 오디오 디코딩 시스템 및 그것의 오디오 디코딩 방법 |
US9112989B2 (en) | 2010-04-08 | 2015-08-18 | Qualcomm Incorporated | System and method of smart audio logging for mobile devices |
US8359020B2 (en) | 2010-08-06 | 2013-01-22 | Google Inc. | Automatically monitoring for voice input based on context |
US8606293B2 (en) | 2010-10-05 | 2013-12-10 | Qualcomm Incorporated | Mobile device location estimation using environmental information |
US9443511B2 (en) | 2011-03-04 | 2016-09-13 | Qualcomm Incorporated | System and method for recognizing environmental sound |
US8798995B1 (en) | 2011-09-23 | 2014-08-05 | Amazon Technologies, Inc. | Key word determinations from voice data |
US8924219B1 (en) | 2011-09-30 | 2014-12-30 | Google Inc. | Multi hotword robust continuous voice command detection in mobile devices |
US9031847B2 (en) | 2011-11-15 | 2015-05-12 | Microsoft Technology Licensing, Llc | Voice-controlled camera operations |
US8666751B2 (en) | 2011-11-17 | 2014-03-04 | Microsoft Corporation | Audio pattern matching for device activation |
KR20160036104A (ko) | 2011-12-07 | 2016-04-01 | 퀄컴 인코포레이티드 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
DE102013001219B4 (de) | 2013-01-25 | 2019-08-29 | Inodyn Newmedia Gmbh | Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus |
-
2012
- 2012-05-30 US US13/483,732 patent/US9992745B2/en active Active
- 2012-09-25 WO PCT/US2012/057078 patent/WO2013066523A2/en active Application Filing
- 2012-09-25 CN CN201810674458.3A patent/CN108551686B/zh active Active
- 2012-09-25 BR BR112014010032A patent/BR112014010032A8/pt not_active IP Right Cessation
- 2012-09-25 IN IN769MUN2014 patent/IN2014MN00769A/en unknown
- 2012-09-25 CN CN201280052875.5A patent/CN103999517B/zh not_active Expired - Fee Related
- 2012-09-25 JP JP2014538799A patent/JP6076994B2/ja active Active
- 2012-09-25 EP EP12780940.8A patent/EP2774420A2/en not_active Withdrawn
- 2012-09-25 KR KR1020147011118A patent/KR101622493B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
CN103999517A (zh) | 2014-08-20 |
WO2013066523A2 (en) | 2013-05-10 |
CN108551686A (zh) | 2018-09-18 |
EP2774420A2 (en) | 2014-09-10 |
KR20140082737A (ko) | 2014-07-02 |
BR112014010032A2 (pt) | 2017-06-13 |
BR112014010032A8 (pt) | 2017-06-20 |
KR101622493B1 (ko) | 2016-05-18 |
US9992745B2 (en) | 2018-06-05 |
US20130110521A1 (en) | 2013-05-02 |
WO2013066523A3 (en) | 2013-07-11 |
CN103999517B (zh) | 2018-06-12 |
JP2015501450A (ja) | 2015-01-15 |
IN2014MN00769A (ja) | 2015-07-03 |
CN108551686B (zh) | 2021-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6076994B2 (ja) | オーディオ特徴データの抽出と分析 | |
JP2015501450A5 (ja) | ||
US9549273B2 (en) | Selective enabling of a component by a microphone circuit | |
US20210264947A1 (en) | System and method of determining auditory context information | |
TWI730584B (zh) | 關鍵詞的檢測方法以及相關裝置 | |
CN105869655B (zh) | 音频装置以及语音检测方法 | |
CN111210021B (zh) | 一种音频信号处理方法、模型训练方法以及相关装置 | |
US10714092B2 (en) | Music detection and identification | |
EP2994911B1 (en) | Adaptive audio frame processing for keyword detection | |
CN110265011B (zh) | 一种电子设备的交互方法及其电子设备 | |
JP2016526178A (ja) | ターゲットキーワードを検出するための方法および装置 | |
CN103440862A (zh) | 一种语音与音乐合成的方法、装置以及设备 | |
WO2019233228A1 (zh) | 电子设备及设备控制方法 | |
US11264049B2 (en) | Systems and methods for capturing noise for pattern recognition processing | |
WO2019242414A1 (zh) | 语音处理方法、装置、存储介质及电子设备 | |
JP2017509009A (ja) | オーディオストリームの中の音楽の追跡 | |
WO2020228226A1 (zh) | 一种纯音乐检测方法、装置及存储介质 | |
US10693944B1 (en) | Media-player initialization optimization | |
CN104049707B (zh) | 永远接通低功率关键字检出 | |
JP2024081689A (ja) | ノイズロバストなキーワードスポッティングのためのカスケードアーキテクチャ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150824 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150915 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160517 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20160816 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160817 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170111 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6076994 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |