JP2012155651A - 信号処理装置および方法、並びに、プログラム - Google Patents
信号処理装置および方法、並びに、プログラム Download PDFInfo
- Publication number
- JP2012155651A JP2012155651A JP2011016398A JP2011016398A JP2012155651A JP 2012155651 A JP2012155651 A JP 2012155651A JP 2011016398 A JP2011016398 A JP 2011016398A JP 2011016398 A JP2011016398 A JP 2011016398A JP 2012155651 A JP2012155651 A JP 2012155651A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- covered
- control
- sound
- acoustic signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 89
- 238000000034 method Methods 0.000 title description 124
- 238000001514 detection method Methods 0.000 claims description 96
- 238000004364 calculation method Methods 0.000 claims description 32
- 238000003672 processing method Methods 0.000 claims description 5
- 238000001228 spectrum Methods 0.000 abstract description 78
- 238000006243 chemical reaction Methods 0.000 abstract description 34
- 238000003860 storage Methods 0.000 description 37
- 238000010586 diagram Methods 0.000 description 15
- 238000009825 accumulation Methods 0.000 description 12
- 238000005070 sampling Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
【解決手段】覆われ検出部103は、時間周波数変換部102により音響信号が変換されて得られたパワースペクトルを解析し、そのパワースペクトルに観測される共振点の特徴(例えば周波数や大きさ等)から、音響信号入力部101が覆われている様子(覆われ状態)を判定し、その判定結果(覆われ状態を示す情報)を機器制御決定部104に供給する。機器制御決定部104は、覆われ検出部103から供給される判定結果(音響信号入力部101の覆われ状態を示す情報)に応じて、図示せぬ電子機器の制御内容を決定し、その制御情報(命令やデータ等)を、その電子機器等に出力する。本発明は、例えば、画像処理装置に適用することができる。
【選択図】図1
Description
1.第1の実施の形態(制御装置)
2.第2の実施の形態(制御装置)
3.第3の実施の形態(携帯型音楽再生装置)
4.第4の実施の形態(携帯電話機)
5.第5の実施の形態(パーソナルコンピュータ)
[制御装置]
図1は、本発明を適用した制御装置の一実施の形態の構成を表している。
図2は、図1の覆われ検出部103の主な構成例を示すブロック図である。図2に示されるように、覆われ検出部103は、周波数特性蓄積部111、覆われ特徴量算出部112、および覆われ状態検出部113を有する。
図8は、図1の機器制御決定部104の主な構成例を示すブロック図である。図8に示されるように、機器制御決定部104は、覆われ状態蓄積部161と制御内容決定部162を有する。
次に、図11のフローチャートを参照して、制御装置100により実行される制御処理の流れの例を説明する。
次に、図12のフローチャートを参照して、図11のステップS103において覆われ検出部103により実行される覆われ状態検出処理の流れの例を説明する。
次に、図13のフローチャートを参照して、図11のステップS104において、機器制御決定部104により実行される制御内容決定処理の流れの例を説明する。
[制御装置]
音響信号入力部101が複数設けられるようにしてもよい。図14は、本発明を適用した制御装置の一実施の形態の構成を表している。
図15は、図14の覆われ検出部203の主な構成例を示すブロック図である。図15に示されるように、覆われ検出部203は、覆われ検出部103の場合の周波数特性蓄積部111の代わりに周波数特性蓄積部211を有し、さらに、覆われ特徴量算出部112および覆われ状態検出部113の他に差分算出部212を有する。
この場合の、制御処理の流れの例を図17のフローチャートを参照して説明する。このフローチャートは、図11のフローチャートに対応する。
次に、図18のフローチャートを参照して、図17のステップS205において覆われ検出部203により実行される覆われ状態検出処理の流れの例を説明する。このフローチャートは、図12のフローチャートに対応する。
[携帯型音楽再生装置]
まず、最初に、制御装置100および制御装置200を携帯型音楽再生装置に適用する場合について説明する。
t2 - t1 >= T となる場合、現在再生中の曲を巻き戻す制御情報を生成して出力する。
t2 - t1 >= T となる場合、現在再生中の曲を早送りする制御情報を生成して出力する。
この場合の制御処理の流れの例を図20のフローチャートを参照して説明する。この場合の制御処理においては、第1の実施の形態において説明した制御処理(図11)の場合と基本的に同様の処理が行われる。
次に、図21のフローチャートを参照して、図20のステップS307において実行される制御内容決定処理の流れの例を説明する。
[携帯電話機]
次に、制御装置100および制御装置200を携帯電話機に適用する場合について説明する。
図24のフローチャートを参照して、この場合の制御処理の流れの例を説明する。
次に、図24のフローチャートを参照して、図23のステップS404において実行される制御内容決定処理の流れの例を説明する。
[パーソナルコンピュータ]
上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。この場合、例えば、図25に示されるようなパーソナルコンピュータとして構成されるようにしてもよい。
Claims (14)
- 集音する集音手段と、
前記集音手段により集音されて得られた音響信号の周波数特性における共振周波数および前記共振周波数の成分の大きさに基づいて、前記集音手段の覆われ状態を検出する覆われ検出手段と、
前記覆われ検出手段により検出された前記集音手段の覆われ状態に応じて、制御対象の機器の制御内容を決定する機器制御決定手段と
を備える信号処理装置。 - 前記覆われ検出手段は、前記集音手段が覆われているか否か、若しくは、前記集音手段が覆われている度合いを検出する
請求項1に記載の信号処理装置。 - 前記覆われ検出手段は、共振周波数および前記共振周波数の成分の大きさを所定の閾値と比較し、その比較結果に応じて前記集音手段の覆われ状態を検出する
請求項1に記載の信号処理装置。 - 前記覆われ検出手段は、複数の時刻における前記音響信号の周波数特性における共振周波数および前記共振周波数の成分の大きさを加算し、その加算結果に基づいて、前記集音手段の覆われ状態を検出する
請求項1に記載の信号処理装置。 - 前記機器制御決定手段は、前記集音手段が覆われているか否か、若しくは、前記集音手段が覆われている度合いに応じて前記制御内容を決定する
請求項1に記載の信号処理装置。 - 前記機器制御決定手段は、前記集音手段が覆われている時間に応じて前記制御内容を決定する
請求項1に記載の信号処理装置。 - 前記機器制御決定手段は、前記集音手段が覆われている度合いに応じて、前記制御内容の制御量を決定する
請求項1に記載の信号処理装置。 - 前記集音手段を複数備える
請求項1に記載の信号処理装置。 - 複数の前記集音手段のそれぞれにおいて得られた音響信号の周波数特性の差分を算出する差分算出手段をさらに備え、
前記覆われ検出手段は、前記差分算出手段により算出された前記差分における前記共振周波数および前記共振周波数の成分の大きさに基づいて、前記集音手段の覆われ状態を検出する
請求項8に記載の信号処理装置。 - 前記機器制御決定手段は、各集音手段の互いに同様の覆われ状態に対して、互いに異なる制御内容を割り当てる
請求項8に記載の信号処理装置。 - 前記集音手段は、通話処理のために集音し、
前記覆われ検出手段は、前記集音手段により前記通話処理のために集音されて得られた音響信号の周波数特性における共振周波数および前記共振周波数の成分の大きさに基づいて、前記集音手段の覆われ状態を検出する
請求項1に記載の信号処理装置。 - 前記集音手段により集音されて得られた前記音響信号に対して音声認識処理を行う音声認識処理手段をさらに備え、
前記機器制御決定手段は、前記覆われ検出手段により検出された前記集音手段の覆われ状態、および、前記音声認識処理手段による前記音声認識処理の結果に応じて、前記制御内容を決定する
請求項1に記載の信号処理装置。 - 信号処理装置の信号処理方法であって、
集音手段が、集音し、
覆われ検出手段が、集音されて得られた音響信号の周波数特性における共振周波数および前記共振周波数の成分の大きさに基づいて、前記集音手段の覆われ状態を検出し、
機器制御決定手段が、検出された前記集音手段の覆われ状態に応じて、制御対象の機器の制御内容を決定する
信号処理方法。 - コンピュータを、
集音する集音手段、
前記集音手段により集音されて得られた音響信号の周波数特性における共振周波数および前記共振周波数の成分の大きさに基づいて、前記集音手段の覆われ状態を検出する覆われ検出手段、
前記覆われ検出手段により検出された前記集音手段の覆われ状態に応じて、制御対象の機器の制御内容を決定する機器制御決定手段
として機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011016398A JP2012155651A (ja) | 2011-01-28 | 2011-01-28 | 信号処理装置および方法、並びに、プログラム |
US13/354,126 US20120197420A1 (en) | 2011-01-28 | 2012-01-19 | Signal processing device, signal processing method, and program |
CN2012100193132A CN102625203A (zh) | 2011-01-28 | 2012-01-20 | 信号处理装置、信号处理方法和程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011016398A JP2012155651A (ja) | 2011-01-28 | 2011-01-28 | 信号処理装置および方法、並びに、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012155651A true JP2012155651A (ja) | 2012-08-16 |
JP2012155651A5 JP2012155651A5 (ja) | 2014-02-27 |
Family
ID=46564855
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011016398A Pending JP2012155651A (ja) | 2011-01-28 | 2011-01-28 | 信号処理装置および方法、並びに、プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20120197420A1 (ja) |
JP (1) | JP2012155651A (ja) |
CN (1) | CN102625203A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014147785A1 (ja) * | 2013-03-21 | 2014-09-25 | 富士通株式会社 | 動作検知装置,動作検知方法,プログラム及び記録媒体 |
JP2014204318A (ja) * | 2013-04-05 | 2014-10-27 | パナソニック株式会社 | 携帯端末装置 |
JP2016127502A (ja) * | 2015-01-06 | 2016-07-11 | 富士通株式会社 | 通信装置及びプログラム |
JP2017527163A (ja) * | 2014-06-30 | 2017-09-14 | ゼットティーイー コーポレーションZte Corporation | メインマイクロホンを選択する方法及び装置 |
JP2018142949A (ja) * | 2017-02-28 | 2018-09-13 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 収音装置、収音方法、プログラムおよび撮像装置 |
JP2020108166A (ja) * | 2016-04-11 | 2020-07-09 | ソニー株式会社 | ヘッドホン、再生制御方法、並びにプログラム |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013205830A (ja) * | 2012-03-29 | 2013-10-07 | Sony Corp | トーン成分検出方法、トーン成分検出装置およびプログラム |
US20140044286A1 (en) * | 2012-08-10 | 2014-02-13 | Motorola Mobility Llc | Dynamic speaker selection for mobile computing devices |
JP2014175993A (ja) * | 2013-03-12 | 2014-09-22 | Sony Corp | 通知制御装置、通知制御方法、およびプログラム |
JP7192348B2 (ja) * | 2018-09-25 | 2022-12-20 | 富士フイルムビジネスイノベーション株式会社 | 制御装置、制御システム及びプログラム |
US10623845B1 (en) | 2018-12-17 | 2020-04-14 | Qualcomm Incorporated | Acoustic gesture detection for control of a hearable device |
KR102652553B1 (ko) * | 2019-02-08 | 2024-03-29 | 삼성전자 주식회사 | 전자 장치 및 전자 장치의 마이크로폰 블록 검출 방법 |
CN116266893A (zh) * | 2021-12-16 | 2023-06-20 | 华为技术有限公司 | 耳机控制方法及相关系统、存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001512732A (ja) * | 1997-08-05 | 2001-08-28 | ザ ステーリン ファンデーション フォー キャンサー リサーチ (The Stehlin Foundation for Cancer Research) | 9−ニトロ−20−カンプトセシン(9−nitro−20−camptothecin)の調製および精製方法 |
JP2004347866A (ja) * | 2003-05-22 | 2004-12-09 | Sony Corp | 被制御機器の制御装置および制御方法 |
WO2010125797A1 (ja) * | 2009-04-28 | 2010-11-04 | パナソニック株式会社 | 補聴装置、及び補聴方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1298959A3 (de) * | 2001-09-24 | 2006-04-19 | Siemens Audiologische Technik GmbH | Hörgerät mit Störsignalsteuerung |
JP2006087018A (ja) * | 2004-09-17 | 2006-03-30 | Matsushita Electric Ind Co Ltd | 音響処理装置 |
US8374362B2 (en) * | 2008-01-31 | 2013-02-12 | Qualcomm Incorporated | Signaling microphone covering to the user |
-
2011
- 2011-01-28 JP JP2011016398A patent/JP2012155651A/ja active Pending
-
2012
- 2012-01-19 US US13/354,126 patent/US20120197420A1/en not_active Abandoned
- 2012-01-20 CN CN2012100193132A patent/CN102625203A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001512732A (ja) * | 1997-08-05 | 2001-08-28 | ザ ステーリン ファンデーション フォー キャンサー リサーチ (The Stehlin Foundation for Cancer Research) | 9−ニトロ−20−カンプトセシン(9−nitro−20−camptothecin)の調製および精製方法 |
JP2004347866A (ja) * | 2003-05-22 | 2004-12-09 | Sony Corp | 被制御機器の制御装置および制御方法 |
WO2010125797A1 (ja) * | 2009-04-28 | 2010-11-04 | パナソニック株式会社 | 補聴装置、及び補聴方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014147785A1 (ja) * | 2013-03-21 | 2014-09-25 | 富士通株式会社 | 動作検知装置,動作検知方法,プログラム及び記録媒体 |
JP6032350B2 (ja) * | 2013-03-21 | 2016-11-24 | 富士通株式会社 | 動作検知装置及び動作検知方法 |
JP2014204318A (ja) * | 2013-04-05 | 2014-10-27 | パナソニック株式会社 | 携帯端末装置 |
JP2017527163A (ja) * | 2014-06-30 | 2017-09-14 | ゼットティーイー コーポレーションZte Corporation | メインマイクロホンを選択する方法及び装置 |
JP2016127502A (ja) * | 2015-01-06 | 2016-07-11 | 富士通株式会社 | 通信装置及びプログラム |
JP2020108166A (ja) * | 2016-04-11 | 2020-07-09 | ソニー株式会社 | ヘッドホン、再生制御方法、並びにプログラム |
US11290803B2 (en) | 2016-04-11 | 2022-03-29 | Sony Corporation | Headphone, reproduction control method, and program |
JP2018142949A (ja) * | 2017-02-28 | 2018-09-13 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 収音装置、収音方法、プログラムおよび撮像装置 |
JP7009165B2 (ja) | 2017-02-28 | 2022-01-25 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 収音装置、収音方法、プログラムおよび撮像装置 |
Also Published As
Publication number | Publication date |
---|---|
US20120197420A1 (en) | 2012-08-02 |
CN102625203A (zh) | 2012-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2012155651A (ja) | 信号処理装置および方法、並びに、プログラム | |
US10824391B2 (en) | Audio user interface apparatus and method | |
US20210035563A1 (en) | Per-epoch data augmentation for training acoustic models | |
EP3090429B1 (en) | Modifying operations based on acoustic ambience classification | |
US9837068B2 (en) | Sound sample verification for generating sound detection model | |
JP2023041843A (ja) | 音声区間検出装置、音声区間検出方法及びプログラム | |
JP6844608B2 (ja) | 音声処理装置および音声処理方法 | |
US20140337021A1 (en) | Systems and methods for noise characteristic dependent speech enhancement | |
JP2021503633A (ja) | 音声ノイズ軽減方法、装置、サーバー及び記憶媒体 | |
CN104335600A (zh) | 多麦克风移动装置中检测及切换降噪模式的方法 | |
JP5411807B2 (ja) | チャネル統合方法、チャネル統合装置、プログラム | |
US20150310878A1 (en) | Method and apparatus for determining emotion information from user voice | |
US20190392839A1 (en) | System for creating speaker model, recognition system, computer program product, and controller | |
US20140316783A1 (en) | Vocal keyword training from text | |
KR20130101943A (ko) | 음원 끝점 검출 장치 및 그 방법 | |
TW202223877A (zh) | 用戶話音輪廓管理 | |
US11895474B2 (en) | Activity detection on devices with multi-modal sensing | |
JP6182895B2 (ja) | 処理装置、処理方法、プログラム及び処理システム | |
US11290802B1 (en) | Voice detection using hearable devices | |
JP2015169827A (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
US10142730B1 (en) | Temporal and spatial detection of acoustic sources | |
JP6723033B2 (ja) | 情報処理装置、情報処理システム、サーバ、端末装置、情報処理方法及びプログラム | |
KR20190120535A (ko) | 음성 신호 선별 기반 음성 인식 장치 | |
KR102102387B1 (ko) | 다채널오디오스트리밍에서 화자의 발화구간을 검출하는 방법 및 시스템 | |
JP5375869B2 (ja) | 楽曲再生装置、楽曲再生方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140109 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140109 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140826 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140827 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150326 |