JP5936070B2 - 音声処理装置及びその制御方法とその制御プログラム、該音声処理装置を備えた車両、情報処理装置及び情報処理システム - Google Patents
音声処理装置及びその制御方法とその制御プログラム、該音声処理装置を備えた車両、情報処理装置及び情報処理システム Download PDFInfo
- Publication number
- JP5936070B2 JP5936070B2 JP2012552642A JP2012552642A JP5936070B2 JP 5936070 B2 JP5936070 B2 JP 5936070B2 JP 2012552642 A JP2012552642 A JP 2012552642A JP 2012552642 A JP2012552642 A JP 2012552642A JP 5936070 B2 JP5936070 B2 JP 5936070B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- microphone
- mixed
- noise
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 65
- 238000000034 method Methods 0.000 title claims description 49
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 230000001629 suppression Effects 0.000 claims description 85
- 230000005236 sound signal Effects 0.000 claims description 53
- 239000002847 sound insulator Substances 0.000 claims description 18
- 238000010586 diagram Methods 0.000 description 24
- 230000003044 adaptive effect Effects 0.000 description 18
- 239000000463 material Substances 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 239000007779 soft material Substances 0.000 description 4
- 230000006837 decompression Effects 0.000 description 3
- 238000009413 insulation Methods 0.000 description 3
- 230000002950 deficient Effects 0.000 description 2
- 230000035515 penetration Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000012780 transparent material Substances 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/34—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by using a single transducer with sound reflecting, diffracting, directing or guiding means
- H04R1/342—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by using a single transducer with sound reflecting, diffracting, directing or guiding means for microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/05—Noise reduction with a separate noise microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/11—Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/13—Acoustic transducers and sound field adaptation in vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Description
所望音声と雑音とが混在した第1混在音を入力して第1混在信号を出力する第1マイクと、
前記第1マイクと同じ音空間に開放され、前記所望音声と前記雑音とが前記第1混在音とは異なる割合で混在した第2混在音を入力して第2混在信号を出力する第2マイクと、
前記第1混在音を前記第1マイクに対して集音する凹面を備えた第1集音部と、
前記第2混在音を前記第2マイクに対して集音する凹面を備え、前記第1集音部とは異なる向きに配置された第2集音部と、
前記第1混在信号と前記第2混在信号とに基づいて推定雑音信号を抑圧し、擬似音声信号を出力する雑音抑圧回路と、
を備え、
前記第2マイクが前記雑音を集音する方向に前記第2集音部を移動可能とする第2可動部と、
前記第2マイクに入力される前記第2混在音において前記雑音の割合がより多くなるように、前記雑音抑圧回路が用いる第2パラメータに従って前記第2可動部の移動を制御して前記第2集音部の向きを変更する第2移動制御手段と、
をさらに備える。
上記音声処理装置を備えた車両であって、
前記第1マイク及び前記第1集音部は、車内の乗員が発声する所望音声が前記第1集音部によって前記第1マイクに集音される位置に配置され、
前記第2マイク及び前記第2集音部は、車内の雑音源から発生する雑音が前記第2集音部によって前記第2マイクに集音される位置に配置されている。
上記音声処理装置を備えた情報処理装置であって、
前記第1マイク及び前記第1集音部は、前記情報処理装置の操作者が発声する所望音声が前記第2第1集音部によって前記第1マイクに集音される位置に配置され、
前記第2マイク及び前記第2集音部は、前記操作者と同じ音空間にある雑音源から発生する雑音が前記第1集音部によって前記第2マイクに集音される位置に配置されている。
上記音声処理装置を備えた情報処理システムであって、
前記音声処理装置の出力する前記擬似音声信号から所望音声を認識する音声認識装置と、
前記音声認識装置が認識した所望音声に従って情報を処理する情報処理装置と、
を備える。
所望音声と雑音とが混在した第1混在音を入力して第1混在信号を出力する第1マイクと、
前記第1マイクと同じ音空間に開放され、前記所望音声と前記雑音とが前記第1混在音とは異なる割合で混在した第2混在音を入力して第2混在信号を出力する第2マイクと、
前記第1混在音を前記第1マイクに対して集音する凹面を備えた第1集音部と、
前記第2混在音を前記第2マイクに対して集音する凹面を備え、前記第1集音部とは異なる向きに配置された第2集音部と、
前記第1混在信号と前記第2混在信号とに基づいて推定雑音信号を抑圧し、擬似音声信号を出力する雑音抑圧回路と、
を備える音声処理装置の制御方法であって、
前記雑音抑圧回路のパラメータを取得するステップと、
前記雑音抑圧回路のパラメータに従って、前記第2マイクに入力される前記第2混在音において前記雑音の割合がより多くなるように、前記第2集音部の方向を決定するステップと、
前記第2集音部の方向を制御するステップと、
を含む。
所望音声と雑音とが混在した第1混在音を入力して第1混在信号を出力する第1マイクと、
前記第1マイクと同じ音空間に開放され、前記所望音声と前記雑音とが前記第1混在音とは異なる割合で混在した第2混在音を入力して第2混在信号を出力する第2マイクと、
前記第1混在音を前記第1マイクに対して集音する凹面を備えた第1集音部と、
前記第2混在音を前記第2マイクに対して集音する凹面を備え、前記第1集音部とは異なる向きに配置された第2集音部と、
前記第1混在信号と前記第2混在信号とに基づいて推定雑音信号を抑圧し、擬似音声信号を出力する雑音抑圧回路と、
を備える音声処理装置の制御プログラムであって、
前記雑音抑圧回路のパラメータを取得するステップと、
前記雑音抑圧回路のパラメータに従って、前記第2マイクに入力される前記第2混在音において前記雑音の割合がより多くなるように、前記第2集音部の方向を決定するステップと、
前記第2集音部の方向を制御するステップと、
をコンピュータに実行させる。
本発明の第1実施形態としての音声処理装置100について、図1を用いて説明する。 図1に示すように、音声処理装置100は、第1マイク101と、第2マイク103と、第1集音部111と、第2集音部112と、雑音抑圧回路106と、を含む。第1マイク101は、所望音声と雑音とが混在した第1混在音108を入力して第1混在信号102を出力する。第2マイク103は、第1マイク101と同じ音空間110に開放され、所望音声と雑音とが第1混在音108とは異なる割合で混在した第2混在音109を入力して第2混在信号104を出力する。第1集音部111は、第1混在音108を第1マイク101に対して集音する凹面111aを備えている。第2集音部112は、第2混在音109を第2マイク103に対して集音する凹面112aを備え、第1集音部111とは異なる向きに配置されている。雑音抑圧回路106は、第1混在信号102と第2混在信号104とに基づいて推定雑音信号を抑圧し、擬似音声信号107を出力する。
第2実施形態においては、第1マイク、第2マイク、第1集音部、第2集音部が一体に固定されたマイクセットを有している。音声源や雑音源の位置を考慮して、このマイクセットを所望の位置に配置することによって、簡単な構成で、所望音声と雑音とが混在する同じ音空間において、所望音声と雑音をそれぞれ集音して雑音を正確に推定して所望音声に近い擬似音声を復元することができる。
図2は、本実施形態に係る音声処理装置220を備えた情報処理システム200の構成を示すブロック図である。なお、図2において、音声処理装置220は、第1マイク、第2マイク、第1集音部、第2集音部が一体に固定されたマイクセット230と、雑音抑圧回路206とを含む。また、情報処理システム200は、音声処理装置220と、さらに、音声認識装置208と、情報処理装置209とを含む。
本実施形態において、第1及び第2集音部は所定位置に予め固定的に配置される。以下、マイクセットの2つの構成例について説明するが、これに限定されない。
図3Aは、本実施形態に係る固定した集音部を含むマイクセット230の一例230−1を示す図である。
図3Bは、本実施形態に係る固定した集音部を含むマイクセット230の他例230−2を示す図である。
以下、図3A及び図3Bの二次曲面あるいは二次曲面を近似した擬似曲面である音反射面305a、305b、355a、355bが、その焦点位置に集音することを、二次曲面については図4Aを使って、二次曲面を近似した擬似曲面については図4Bを使って説明する。
図4Aは、本実施形態に係る集音部となる二次曲面405aを有するマイク支持部材405による集音を説明する図である。
図4Bは、本実施形態に係る集音部となる擬似曲面455aを有するマイク支持部材455による集音を説明する図である。擬似曲面455aとは、二次曲面の接線方向に延びる平面の集合体である。
図5は、本実施形態に係る雑音抑圧回路206の構成を示す図である。
第2実施形態においては、マイクセットにおいて第1マイク及び第2マイクがマイク支持部材に予め決められた方向に固定されている例を説明した。第3実施形態においては、マイク支持部材が移動することにより第2集音部の向きが変更可能である例、あるいは第2集音部の向き自身が移動可能である例について説明する。第2集音部は雑音の入力が大きくなるように移動する。本実施形態によれば、第2マイクがより大きな雑音を入力することで、雑音抑圧回路において抑圧される雑音の正確さ、出力される擬似音声の正確さを高めることができる。なお、第2実施形態と共通の構成や処理の説明は省略する。
図6は、本実施形態に係る音声処理装置620を備えた情報処理システム600の構成を示すブロック図である。なお、図6において、音声処理装置620は、第1マイク、第2マイク、第1集音部、第2集音部、第2集音部を可動とする可動部とが一体に固定されたマイクセット630と、雑音抑圧回路606と、集音制御部640とを含む。また、情報処理システム600は、音声処理装置620と、さらに、音声認識装置208と、情報処理装置209とを含む。
本実施形態においては、第2集音部が雑音を集音するように移動する。以下、マイクセットについて2つの構成例を説明するが、これに限定されない。
図7は、本実施形態に係る移動する第2集音部となる音反射面752aを含むマイクセット630の一例630−1を示す図である。なお、第2集音部を移動させる可動部については図示されていない。例えば、ステップモータなどが配置されて、第2集音部の向きが自動調整される。
図8は、本実施形態に係る移動する第2集音部である集音体805を含むマイクセット630の他例630−2を示す図である。なお、第2集音部を移動させる可動部については図示されていない。例えば、ステップモータなどが配置されて、第2集音部の向きが自動調整される。
図9は、本実施形態に係る音声処理装置のハードウエア構成を示すブロック図である。なお、図9には、次の第4実施形態で使用されるデータも図示されている。また、図9には、音声処理装置620に接続する音声認識装置208と情報処理装置209とを図示する。
図10は、本実施形態に係る集音部位置制御パラメータDB951の構成を示す図である。
図11は、本実施形態に係る音声処理手順を示すフローチャートである。図11のフローチャートは、図9のCPU910がRAM940を使用して実行し、図6の集音制御部640を実現する。
図12Aは、本実施形態に係る第2集音部の調整手順の第1例を示すフローチャートである。図12Aの例では、雑音抑圧回路からの出力信号やパラメータに基づいて、第2マイクへの雑音入力を大きくするための第2集音部の調整を行なう。
図12Bは、本実施形態に係る第2集音部の調整手順の第2例を示すフローチャートである。図12Bの例では、第2マイクを上下左右の方向に少しずつ動かしてより雑音の音量が大きくなる方向に向けることにより、第2マイクへの雑音入力を大きくするための第2集音部の調整を行なう。
図12Cは、本実施形態に係る第2集音部の調整手順の第3例を示すフローチャートである。図12Cの例では、音声が発声されていない状態で2つのマイクを用いて雑音源の方向を決定することにより、第2マイクへの雑音入力を大きくするための第2集音部の調整を行なう。
第3実施形態においては、第2集音部の位置を調整可能として、変化する雑音源に対応して第2マイクへの雑音の入力を大きくした。第4実施形態においては、第1集音部の位置も変更可能とすることにより、所望音声の入力を大きくする調整を行なう。本実施形態によれば、所望音声を発しする音声源の位置の変化にも対応して所望音声の入力を大きくし、より正確な擬似音声を復元する。なお、第2及び第3実施形態と共通の構成や処理は説明を省略する。
図13は、本実施形態に係る音声処理装置1320を備えた情報処理システム1300の構成を示すブロック図である。
図14は、本実施形態に係る音声処理手順を示すフローチャートである。図14のフローチャートは、図9のCPU910がRAM940を使用して実行し、図13の集音制御部1340を実現する。
第2及び第4実施形態では、音声処理装置を備えた情報処理システムの汎用の構成及び動作を説明した。第5乃至第8実施形態では、上記音声処理装置を備えた情報処理システムを具体的な情報処理システムに適用した場合の数例を説明する。
図15は、本実施形態に係る音声処理装置を備えた情報処理システムである車両システム1500の構成を示すブロック図である。なお、図15において、音声処理装置は、第1マイク301と、第2マイク303と、両側に第1マイク301に音声を集音する第1集音部となる音反射面355aと第2マイク303に雑音を集音する第2集音部となる音反射面355bとを有するマイク支持部材355と、雑音抑圧回路206とを含む。なお、マイク支持部材355は遮音体であるのが望ましい。また、車両システム1500は、音声処理装置と、さらに、音声認識装置208と、情報処理装置であるカーナビゲーション装置1509とを含む。なお、第1マイク301と、第2マイク303と、遮音体であるマイク支持部材355とは、一体の音声入力ユニットであるマイクセットとして提供されてよい。
第6実施形態は、上記音声処理装置を備えた情報処理システムとして車両システムを想定した場合であって、雑音を集音する第2集音部の向きを調整可能とした図8において、マイク支持部材を分離したマイクセットを使用した実施形態である。本実施形態によれば、車両を運転中のカーナビゲーション装置への乗員の音声指示を、車内の多数の雑音源が発声する雑音を抑圧して、正確に伝えることが可能となる。
図16は、本実施形態に係る音声処理装置を備えた情報処理システムである車両システム1600の構成を示すブロック図である。なお、図16において、音声処理装置は、第1マイク301と、第2マイク303と、第1マイク301に音声を集音する第1集音部である音反射面751aを有する第1マイク支持部材751と、第2マイク303に音声を集音する可動の第2集音部である集音体805を有する第2マイク支持部材1652と、雑音抑圧回路206と、集音制御部640とを含む。第1マイク支持部材751は遮音体であるのが望ましい。また、車両システム1600は、音声処理装置と、さらに、音声認識装置208と、情報処理装置であるカーナビゲーション装置1509とを含む。なお、第1マイク301と、第2マイク303と、第1マイク支持部材355、第2マイク支持部材1652、第2集音部である集音体805とは、音声入力ユニットであるマイクセットとして提供されてよい。
第7実施形態は、上記音声処理装置を備えた情報処理システムとしてパーソナルコンピュータ(以下、PCと略す)、特にノート型PCを想定した場合であって、図3Bで示した第1マイクと第2マイクとがマイク支持部材の両側に設置されたマイクセット230−1を使用した実施形態である。本実施形態によれば、ノート型PCへの操作者の音声指示を、室内の雑音、例えは空調機などの機器や他人の発声した音声などの雑音を抑圧して、正確にノート型PCへ伝えることが可能となる。
図17は、本実施形態に係る音声処理装置を備えた情報処理システムであるノート型パーソナルコンピュータ(以下、ノート型PC1700)の構成を示すブロック図である。なお、図17には、ノート型PCの本来の機能などについては説明を省略し、本実施形態の特徴である第1マイク301及び第2マイク303への集音に関連する構成を説明する。
第7実施形態は、第1集音部や第2集音部はマイク支持部材に固定された構成であった。第8実施形態は、雑音を集音する第2集音部の向きを調整可能とした図8と類似の構成で、逆に音声を集音する第1集音部の向きを調整可能とし、且つ、マイク支持部材を分離したマイクセットを使用した実施形態である。本実施形態によれば、ノート型PCへの操作者の音声指示を、より大きな集音された音声を入力し、且つ、室内の雑音、例えは空調機などの機器や他人の発声した音声などの雑音を抑圧して、正確にノート型PCへ伝えることが可能となる。
図18は、本実施形態に係る音声処理装置を備えた情報処理システムであるパーソナルコンピュータ(ノート型PC1800)の構成を示すブロック図である。なお、図18には、ノート型PCの本来の機能などについては説明を省略し、本実施形態の特徴である第1マイク301及び第2マイク303への集音に関連する構成を説明する。
以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。また、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステム又は装置も、本発明の範疇に含まれる。
Claims (21)
- 所望音声と雑音とが混在した第1混在音を入力して第1混在信号を出力する第1マイクと、
前記第1マイクと同じ音空間に開放され、前記所望音声と前記雑音とが前記第1混在音とは異なる割合で混在した第2混在音を入力して第2混在信号を出力する第2マイクと、
前記第1混在音を前記第1マイクに対して集音する凹面を備えた第1集音部と、
前記第2混在音を前記第2マイクに対して集音する凹面を備え、前記第1集音部とは異なる向きに配置された第2集音部と、
前記第1混在信号と前記第2混在信号とに基づいて推定雑音信号を抑圧し、擬似音声信号を出力する雑音抑圧回路と、
を備え、
前記第2マイクが前記雑音を集音する方向に前記第2集音部を移動可能とする第2可動部と、
前記第2マイクに入力される前記第2混在音において前記雑音の割合がより多くなるように、前記雑音抑圧回路が用いる第2パラメータに従って前記第2可動部の移動を制御して前記第2集音部の向きを変更する第2移動制御手段と、
をさらに備える音声処理装置。 - 前記第2移動制御手段は、方向を変えながら前記第2混在音に混在する前記雑音を示す情報を取得し、前記雑音が最大となる方向への前記第2集音部の移動を制御する請求項1に記載の音声処理装置。
- 前記第2移動制御手段は、前記所望音声の無い条件で、前記第1マイクが入力した第1混在音における雑音と前記第2マイクが入力した第2混在音における雑音との間の、時間遅延に基づいて雑音源の位置を推測し、推測した前記雑音源の方向への前記第2集音部の移動を制御する請求項1に記載の音声処理装置。
- 前記第1集音部及び前記第2集音部の凹面は、それぞれ、前記第1マイク及び前記第2マイクの位置が焦点となる二次曲面の音反射面である請求項1乃至3のいずれか1項に記載の音声処理装置。
- 前記第1集音部及び前記第2集音部の凹面は、それぞれ、前記第1マイク及び前記第2マイクの位置が焦点となる二次曲面を近似した擬似曲面の音反射面である請求項1乃至3のいずれか1項に記載の音声処理装置。
- 前記擬似曲面は、前記二次曲面の接線方向に延びる平面の集合体である請求項5に記載の音声処理装置。
- 前記第1マイクが前記所望音声を集音するマイクであり、前記第2マイクが前記雑音を集音するマイクであって、
前記第2集音部の二次曲面または擬似曲面が集音する、曲面の軸に垂直な範囲は、前記第1集音部の二次曲面または擬似曲面が集音する、曲面の軸に垂直な範囲よりも広い請求項1乃至6のいずれか1項に記載の音声処理装置。 - 前記第1マイクが前記所望音声を集音する方向に前記第1集音部を移動可能とする第1可動部をさらに備える請求項1乃至7のいずれか1項に記載の音声処理装置。
- 前記第1マイクに入力される前記第1混在音において前記所望音声の割合がより多くなるように、前記第1可動部の移動を制御する第1移動制御手段をさらに備える請求項8に記載の音声処理装置。
- 前記第1移動制御手段は、前記第1集音部の向きを変更する請求項9に記載の音声処理装置。
- 前記第1移動制御手段は、前記雑音抑圧回路が用いる第1パラメータに従って前記第1可動部の移動を制御する請求項9または10に記載の音声処理装置。
- 前記第1マイクと第2マイクとの間に配置された遮音体をさらに備える請求項1乃至11のいずれか1項に記載の音声処理装置。
- 前記第1マイク及び前記第1集音部が前記遮音体の一方の面に取り付けられ、前記第2マイク及び前記第2集音部が前記遮音体の他方の面に取り付けられて、前記第1マイク、前記第2マイク、前記第1集音部、前記第2集音部及び前記遮音体を一体の音声入力ユニットとして備える請求項12に記載の音声処理装置。
- 前記第1集音部を前記第1マイクと挟む位置に取り付けられた第1遮音体と、前記第2集音部を前記第2マイクと挟む位置に取り付けられた第2遮音体とをさらに備える請求項1乃至11のいずれか1項に記載の音声処理装置。
- 前記雑音抑圧回路は、
前記第1混在信号に混在すると推定される前記推定雑音信号を、前記第1混在信号から減算する第1減算手段と、
前記第2混在信号に混在すると推定される推定音声信号を、前記第2混在信号から減算する第2減算手段と、
前記推定雑音信号を前記第2減算手段の出力信号から生成する推定雑音信号生成手段と、
前記推定音声信号を前記第1減算手段の出力信号から生成する推定音声信号生成手段と、
を有し、
前記擬似音声信号は、前記第1減算手段の出力信号である請求項1乃至14のいずれか1項に記載の音声処理装置。 - 請求項1乃至15のいずれか1項に記載の音声処理装置を備えた車両であって、
前記第1マイク及び前記第1集音部は、車内の乗員が発声する所望音声が前記第1集音部によって前記第1マイクに集音される位置に配置され、
前記第2マイク及び前記第2集音部は、車内の雑音源から発生する雑音が前記第2集音部によって前記第2マイクに集音される位置に配置されている車両。 - 請求項1乃至15のいずれか1項に記載の音声処理装置を備えた情報処理装置であって、
前記第1マイク及び前記第1集音部は、前記情報処理装置の操作者が発声する所望音声が前記第1集音部によって前記第1マイクに集音される位置に配置され、
前記第2マイク及び前記第2集音部は、前記操作者と同じ音空間にある雑音源から発生する雑音が前記第2集音部によって前記第2マイクに集音される位置に配置されている情報処理装置。 - 前記情報処理装置は、ノート型パーソナルコンピュータであって、
前記第1マイク及び前記第1集音部は、ディスプレイの操作者側の面またはキーボード面に配置され、前記第2マイク及び前記第2集音部は、前記ディスプレイの操作者とは反対側の面に配置されている請求項17に記載の情報処理装置。 - 請求項1乃至15のいずれか1項に記載の音声処理装置を備えた情報処理システムであって、
前記音声処理装置の出力する前記擬似音声信号から所望音声を認識する音声認識装置と、
前記音声認識装置が認識した所望音声に従って情報を処理する情報処理装置と、
を備える情報処理システム。 - 所望音声と雑音とが混在した第1混在音を入力して第1混在信号を出力する第1マイクと、
前記第1マイクと同じ音空間に開放され、前記所望音声と前記雑音とが前記第1混在音とは異なる割合で混在した第2混在音を入力して第2混在信号を出力する第2マイクと、
前記第1混在音を前記第1マイクに対して集音する凹面を備えた第1集音部と、
前記第2混在音を前記第2マイクに対して集音する凹面を備え、前記第1集音部とは異なる向きに配置された第2集音部と、
前記第1混在信号と前記第2混在信号とに基づいて推定雑音信号を抑圧し、擬似音声信号を出力する雑音抑圧回路と、
を備える音声処理装置の制御方法であって、
前記雑音抑圧回路のパラメータを取得するステップと、
前記雑音抑圧回路のパラメータに従って、前記第2マイクに入力される前記第2混在音において前記雑音の割合がより多くなるように、前記第2集音部の方向を決定するステップと、
前記第2集音部の方向を制御するステップと、
を含む音声処理装置の制御方法。 - 所望音声と雑音とが混在した第1混在音を入力して第1混在信号を出力する第1マイクと、
前記第1マイクと同じ音空間に開放され、前記所望音声と前記雑音とが前記第1混在音とは異なる割合で混在した第2混在音を入力して第2混在信号を出力する第2マイクと、
前記第1混在音を前記第1マイクに対して集音する凹面を備えた第1集音部と、
前記第2混在音を前記第2マイクに対して集音する凹面を備え、前記第1集音部とは異なる向きに配置された第2集音部と、
前記第1混在信号と前記第2混在信号とに基づいて推定雑音信号を抑圧し、擬似音声信号を出力する雑音抑圧回路と、
を備える音声処理装置の制御プログラムであって、
前記雑音抑圧回路のパラメータを取得するステップと、
前記雑音抑圧回路のパラメータに従って、前記第2マイクに入力される前記第2混在音において前記雑音の割合がより多くなるように、前記第2集音部の方向を決定するステップと、
前記第2集音部の方向を制御するステップと、
をコンピュータに実行させる制御プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011005316 | 2011-01-13 | ||
JP2011005316 | 2011-01-13 | ||
PCT/JP2011/077996 WO2012096073A1 (ja) | 2011-01-13 | 2011-12-03 | 音声処理装置及びその制御方法とその制御プログラムを格納した記憶媒体、該音声処理装置を備えた車両、情報処理装置及び情報処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2012096073A1 JPWO2012096073A1 (ja) | 2014-06-09 |
JP5936070B2 true JP5936070B2 (ja) | 2016-06-15 |
Family
ID=46506987
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012552642A Active JP5936070B2 (ja) | 2011-01-13 | 2011-12-03 | 音声処理装置及びその制御方法とその制御プログラム、該音声処理装置を備えた車両、情報処理装置及び情報処理システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20130282370A1 (ja) |
JP (1) | JP5936070B2 (ja) |
WO (1) | WO2012096073A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6211890B2 (ja) * | 2013-01-24 | 2017-10-11 | 日本電信電話株式会社 | 収音装置 |
KR101827276B1 (ko) * | 2016-05-13 | 2018-03-22 | 엘지전자 주식회사 | 전자 장치 및 그 제어 방법 |
JP2018191145A (ja) * | 2017-05-08 | 2018-11-29 | オリンパス株式会社 | 収音装置、収音方法、収音プログラム及びディクテーション方法 |
JP7127448B2 (ja) * | 2018-09-13 | 2022-08-30 | 日本電気株式会社 | 音響特性計測装置、音響特性計測方法、およびプログラム |
CN110750142A (zh) * | 2019-10-21 | 2020-02-04 | 湖南理工学院 | 一种基于人工智能的自媒体信息编辑装置 |
CN111627456B (zh) * | 2020-05-13 | 2023-07-21 | 广州国音智能科技有限公司 | 噪音排除方法、装置、设备及可读存储介质 |
CN113066500B (zh) * | 2021-03-30 | 2023-05-23 | 联想(北京)有限公司 | 声音采集方法、装置及设备和存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5514827U (ja) * | 1978-07-12 | 1980-01-30 | ||
JPH07231495A (ja) * | 1994-02-18 | 1995-08-29 | Hokkaido Univ | 集音器 |
JP2004215066A (ja) * | 2003-01-07 | 2004-07-29 | Nissan Motor Co Ltd | 自動車用音声入力装置 |
JP2004279241A (ja) * | 2003-03-17 | 2004-10-07 | Internatl Business Mach Corp <Ibm> | 音源位置取得システム、音源位置取得方法、該音源位置取得システムに使用するための音反射要素および該音反射要素の形成方法 |
JP2005236407A (ja) * | 2004-02-17 | 2005-09-02 | Toshiba Corp | 音響処理装置、音響処理方法および製造方法 |
JP2006525743A (ja) * | 2003-05-08 | 2006-11-09 | タンドベルク・テレコム・エイ・エス | 音源追跡のための配置及び方法 |
WO2009051132A1 (ja) * | 2007-10-19 | 2009-04-23 | Nec Corporation | 信号処理システムと、その装置、方法及びそのプログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07210180A (ja) * | 1994-01-12 | 1995-08-11 | Sony Corp | 集音マイク |
JP4163294B2 (ja) * | 1998-07-31 | 2008-10-08 | 株式会社東芝 | 雑音抑圧処理装置および雑音抑圧処理方法 |
US6826528B1 (en) * | 1998-09-09 | 2004-11-30 | Sony Corporation | Weighted frequency-channel background noise suppressor |
US20040114778A1 (en) * | 2002-12-11 | 2004-06-17 | Gobeli Garth W. | Miniature directional microphone |
EP1667114B1 (en) * | 2003-09-02 | 2013-06-19 | NEC Corporation | Signal processing method and apparatus |
JP4797330B2 (ja) * | 2004-03-08 | 2011-10-19 | 日本電気株式会社 | ロボット |
CN1983642A (zh) * | 2006-02-09 | 2007-06-20 | 易斌宣 | 超高倍率聚光太阳能电池装置 |
US20100098266A1 (en) * | 2007-06-01 | 2010-04-22 | Ikoa Corporation | Multi-channel audio device |
US9302630B2 (en) * | 2007-11-13 | 2016-04-05 | Tk Holdings Inc. | System and method for receiving audible input in a vehicle |
JP2009124540A (ja) * | 2007-11-16 | 2009-06-04 | Toyota Motor Corp | 車両用通話装置、通話方法 |
JP2010023534A (ja) * | 2008-07-15 | 2010-02-04 | Panasonic Corp | 騒音低減装置 |
US8229126B2 (en) * | 2009-03-13 | 2012-07-24 | Harris Corporation | Noise error amplitude reduction |
-
2011
- 2011-12-03 JP JP2012552642A patent/JP5936070B2/ja active Active
- 2011-12-03 US US13/978,446 patent/US20130282370A1/en not_active Abandoned
- 2011-12-03 WO PCT/JP2011/077996 patent/WO2012096073A1/ja active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5514827U (ja) * | 1978-07-12 | 1980-01-30 | ||
JPH07231495A (ja) * | 1994-02-18 | 1995-08-29 | Hokkaido Univ | 集音器 |
JP2004215066A (ja) * | 2003-01-07 | 2004-07-29 | Nissan Motor Co Ltd | 自動車用音声入力装置 |
JP2004279241A (ja) * | 2003-03-17 | 2004-10-07 | Internatl Business Mach Corp <Ibm> | 音源位置取得システム、音源位置取得方法、該音源位置取得システムに使用するための音反射要素および該音反射要素の形成方法 |
JP2006525743A (ja) * | 2003-05-08 | 2006-11-09 | タンドベルク・テレコム・エイ・エス | 音源追跡のための配置及び方法 |
JP2005236407A (ja) * | 2004-02-17 | 2005-09-02 | Toshiba Corp | 音響処理装置、音響処理方法および製造方法 |
WO2009051132A1 (ja) * | 2007-10-19 | 2009-04-23 | Nec Corporation | 信号処理システムと、その装置、方法及びそのプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2012096073A1 (ja) | 2012-07-19 |
JPWO2012096073A1 (ja) | 2014-06-09 |
US20130282370A1 (en) | 2013-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5936070B2 (ja) | 音声処理装置及びその制御方法とその制御プログラム、該音声処理装置を備えた車両、情報処理装置及び情報処理システム | |
CN112020864B (zh) | 麦克风阵列中的智能波束控制 | |
JP5936069B2 (ja) | 音声処理装置及びその制御方法とその制御プログラム、該音声処理装置を備えた車両、情報処理装置及び情報処理システム | |
JP3780516B2 (ja) | ロボット聴覚装置及びロボット聴覚システム | |
CN105679302B (zh) | 定向声音修改 | |
JP2022539794A (ja) | マルチモーダルユーザインターフェース | |
US20120308039A1 (en) | Sound source separation system, sound source separation method, and acoustic signal acquisition device | |
JP4982807B2 (ja) | 操作方法およびそのための操作装置、プログラム | |
JP7447796B2 (ja) | 音声信号処理装置、雑音抑圧方法 | |
JP2016126022A (ja) | 音声処理装置 | |
JPWO2019187834A1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2019062435A (ja) | 機器制御装置、機器制御プログラム、機器制御方法、対話装置、及びコミュニケーションシステム | |
JP5939161B2 (ja) | 音声処理装置及びその制御方法とその制御プログラム、情報処理システム | |
WO2014125669A1 (ja) | 音声入力装置、音声処理方法、音声処理プログラム、天井部材ならびに車両 | |
KR20190090281A (ko) | 사운드를 제어하는 전자 장치 및 그 동작 방법 | |
JP6872710B2 (ja) | 指向性制御装置および指向性制御方法 | |
JP5086768B2 (ja) | 通話装置 | |
Li et al. | Optimal active noise control in large rooms using a “locally global” control strategy | |
KR102168812B1 (ko) | 사운드를 제어하는 전자 장치 및 그 동작 방법 | |
JP6481397B2 (ja) | マイクロホン間隔制御装置及びプログラム | |
JP5888011B2 (ja) | 遮音度測定用伝達特性生成方法、遮音度測定用伝達特性生成装置、遮音度測定方法および遮音度測定装置 | |
JP4552034B2 (ja) | ヘッドセット型マイクロフォンアレイ音声入力装置 | |
JP4953095B2 (ja) | 情報処理装置 | |
US20040151326A1 (en) | Active diffracted sound control apparatus | |
CN117308272B (zh) | 基于空调的降噪方法、装置、空调及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151015 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160414 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160427 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5936070 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |