JP5339501B2 - 音声収集方法、システム及びプログラム - Google Patents
音声収集方法、システム及びプログラム Download PDFInfo
- Publication number
- JP5339501B2 JP5339501B2 JP2008189504A JP2008189504A JP5339501B2 JP 5339501 B2 JP5339501 B2 JP 5339501B2 JP 2008189504 A JP2008189504 A JP 2008189504A JP 2008189504 A JP2008189504 A JP 2008189504A JP 5339501 B2 JP5339501 B2 JP 5339501B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speech
- microphone
- sound
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
本発明は、所定の距離を隔てて配置された2つのマイクロホン素子を有するマイクロホンアレイを用い、特定の音源からこれらのマイクロホン素子に音声が到達する時間の差、すなわち時間遅れを利用する。さらに、本発明においては、マイクロホンアレイが含む2つのマイクロホン素子を結ぶ線分が、顧客と販売員を結ぶ線分と略平行となるように配置する。例えば、上方から見て、本発明により、マイクロホンアレイは顧客と販売員とを結ぶ直線上に配置される。このような配置により、顧客又は販売員が発する音声の、2つのマイクロホン素子のそれぞれへの到達時間の差は最大に近づき得る。従って、本発明においては、複数の対面販売ブースが並ぶ状況等において、マイクロホン素子への到達時間差が必ずしも最大ではない隣接ブースからの音声等を効果的にカットし、並びに到達時間差を利用し得る配置の範囲内において販売員や顧客の姿勢や位置の変化を許容し得る。さらに、一般に、マイクロホンアレイにおいては、同位相(同じ時間遅れ)で到達する方向からの音声を区別できないという問題(鏡像位置の問題)があるが、本発明においてはマイクロホン素子の配置によりこの問題を避けることが可能である。
また、本発明は、CSP(Cross power-Spectrum Phase、白色化相互相関)係数に基づく目的話者発話区間検出により、顧客と販売員の発話を区別し、個別に音声認識を行い得る。同時に、CSP法による話者方向インデックスと音声認識結果のタイムスタンプを併用することにより、目的話者音声の録音を簡便化し、録音箇所を選択的に指定し得る。換言すれば、本発明は、方向インデックスと音声認識結果から、録音話者及び録音箇所を指定するインタフェースを有することを特徴としている。
さらに、本発明は前記CSP係数に基づいて利得調整、すなわち音声強調を行うことによって高い音声認識性能を実現する。本発明では、CSP係数に基づく利得調整処理を、代表的な雑音除去手法であるスペクトル減算(Spectrum Subtraction、SSと略称)処理及びフロアリング(Flooring)処理とを組み合わせた処理手順に結び付けている。具体的には、SS処理とFlooring処理との間で利得調整を行う。この一連の処理によって、音声分離と同時に音声強調を行い、ソフトウェア処理として実用的な音声認識性能を低コストに実現する。
図1は、本発明の一実施形態に係る音声収集システムの一例を概略的に示す図である。図1において、音声収集システム10は、マイクロホンアレイ11、目的音声抽出装置12、及び顧客対話記録サーバ13を有しており、マイクロホンアレイ11は2つのマイクロホン11a及び11bを備え、これらは例えば市販入手可能な一体型又は一組のステレオマイク等でもよい。目的音声抽出装置12の詳細は、図7を用いて後述する。
次いで、本発明に係る音声収集システム等においては、CSP係数を算出し、これを用いて音声強調処理を実施し得る。具体的には、音声強調処理は、SS処理とFlooring処理においてCSP係数を用いて利得調整を実施し、これらにより販売員の音声を特定する性能や、音声認識の性能を向上し得る。以下、具体的な音声処理手段の構成要素及びその関係について例示する。
図4はマイクロホンの位置に対する話者方向インデックスの一例を示す図である。マイクロホンアレイ11に含まれるマイクロホン11a及び11bを結ぶ方向ベクトルを仮定すると、話者からの音声が到達する方向は、マイクロホンアレイ11を中心とする当該方向ベクトルに対する方位角の範囲として区別し得る。例えば、マイクロホン11aからマイクロホン11bの方向に沿って到達する音声は、当該方向ベクトルと略平行であり、方位角の余弦の値は+1に近い(図4に示す話者方向インデックスが+7の領域)。また例えば、マイクロホン11bからマイクロホン11aの方向に沿って到達する音声は、当該方向ベクトルと逆平行に近く、方位角の余弦の値は−1に近い(図4に示す話者方向インデックスが−7の領域)。数1に示したように、マイクロホン間隔d及び音速cが与えられると、到達時間差τは角度θに依存するので、図4に示す話者方向インデックスは、到達時間差τの情報を含む。
図6に、本発明の一実施形態に係る、マイクロホンアレイの配置の例を示す。前述のように、AFEを用いた際には鏡像位置の問題があるので、マイクロホンの位置に配慮する必要があり、例えば、図6に符号Aで示す位置(隣のブース16との敷居17等)にマイクロホンアレイ11を配置した場合には、隣のブース16の音声まで同じように抽出してしまうことがある。
図7は、図1に示す目的音声抽出装置12を詳細に示すブロック図である。図7において、いま販売員22と顧客21が1対1で対話しているものとする。目的音声抽出装置12は、発話区間インデックス検出処理部31、第1の音声認識部32、第2の音声認識部33、統合選択部34、及び録音範囲抽出部35を有しており、発話区間インデックス検出処理部31にはマイクロホン11a及び11bから受けたそれぞれの音声信号が入力される。
図8は発話区間インデックス検出処理部31における処理を説明するためのフロー図である。発話区間インデックス検出処理部31では、音声信号を取得して(ステップS1)、当該音声信号がマイクロホン11aからの入力であるか否かを判定する(ステップS2)。マイクロホン11a(第1のマイクロホン)からの入力であれば、販売員デジタル音声入力信号ついて、例えば、ハニング窓又はハミング窓による窓掛け処理が行われ、販売員窓掛け処理済信号とされる(ステップS3)。続いて、販売員窓掛け処理済信号は、離散フーリエ変換処理によって周波数領域に変換されて販売員周波数領域信号とされ(ステップS4)、図中破線の囲みで示す処理に移行する。同様に、ステップS2において、マイクロホン11b(第2のマイクロホン)からの入力であると判定されと、顧客デジタル音声入力信号について、同様にして、窓掛け処理(ステップS5)、離散フーリエ変換処理(ステップS6)が行われて、顧客周波数領域信号とされる。
本発明に係る音声収集においては、前述の図8を用いて音声処理の諸段階及びそれらの順序を示したように、SS処理→CSPによる利得調整→Flooring処理の順で、目的音声を収集するための音声強調処理を行う。この順序は、本発明に係る音声収集方法のための音声強調において重要なポイントであり、以下に処理順番の違いによる音声強調の性能の差を例示する。
図10に、本発明の一実施形態に係る、可搬型販売員音声収集装置60の動作状況を例示する。可搬型販売員音声収集装置60は、マイクロホン60a及び60bを備え、これらは図1〜3及び図6を用いて前述の、本発明に係る音声収集方法の実施装置におけるマイクロホンアレイを構成する。さらに、可搬型販売員音声収集装置60は、本発明に係る音声収集方法の諸段階を実施可能なデジタル信号処理手段を備え、記憶手段、音声再生手段等を適宜含む。
図11は、本発明の一実施形態に係る、販売員音声収集装置のハードウェア構成を示す図である。図11においては、販売員音声収集装置を情報処理装置1000とし、そのハードウェア構成を例示する。以下は、コンピュータを典型とする情報処理装置として全般的な構成を説明するが、その環境に応じて必要最小限な構成を選択できることはいうまでもない。
図5には、情報処理装置1000の内部にハードディスク1074が含まれる例を示したが、バスライン1005又はI/Oコントローラ1070に外部機器接続用インタフェース(図示せず)を接続し、情報処理装置1000の外部にハードディスクを接続又は増設してもよい。
11 マイクロホンアレイ
12 目的音声抽出装置
13 顧客対話記録サーバ
31 発話区間インデックス検出処理部
32、33 音声認識部
34 統合選択部
35 録音範囲抽出部
60 可搬型販売員音声収集装置
105、106 離散フーリエ変換処理部
110 CSP係数算出部
120 群遅延アレイ処理部、
130 雑音推定部
140 SS処理部
150 利得調整処理部
160 フロアリング処理部
Claims (14)
- 互いに到来方向が異なる複数の音声のうち目的とする目的音声を抽出して収集するために、少なくとも第1のマイクロホン及び第2のマイクロホンを所定の距離離して配置するマイクロホンアレイを用いる音声収集方法であって、
前記複数の音声は第1の音声及び第2の音声であり、前記第1の音声の発生源及び前記第2の音声の発生源を結ぶ線分と、前記マイクロホンアレイに含まれる前記第1のマイクロホン及び前記第2のマイクロホンを結ぶ線分とが略平行に配置された前記第1のマイクロホン及び前記第2のマイクロホンで受けた音声の信号をそれぞれ離散フーリエ変換して、音声の到来方向に関連する複数のCSP係数を求め、前記複数のCSP係数より前記複数の音声の信号を検出するステップと、
前記求めた前記複数のCSP係数から、前記第1のマイクロホン及び前記第2のマイクロホンを結ぶ線分と前記到来方向のなす角度の範囲を区別するための音声方向インデックスを検出するステップと、
前記検出した前記音声方向インデックスにより、前記検出した前記複数の音声の信号から前記目的音声の信号を抽出するステップと、
前記それぞれ離散フーリエ変換した結果に基づいて、推定される雑音のパワースペクトル(Uω)と減算定数(α)とを用いるSS(スペクトルサブトラクション)処理をするステップと、
前記SS処理をするステップの出力及び前記CSP係数より利得調整を実施するステップと、
前記利得調整を実施するステップの出力についてフロアリング係数(β)を用いてフロアリング処理を実施するステップと、
を含む前記音声収集方法。 - 前記複数の音声は第1の音声及び第2の音声であり、前記第1の音声の発生源と前記第2の音声の発生源のそれぞれは、前記第1のマイクロホン及び前記第2のマイクロホンを結ぶ線分を中心軸として予め定められた角度の範囲内に位置する、請求項1に記載の音声収集方法。
- 前記音声方向インデックスを検出するステップは、前記複数のCSP係数の大小関係を比較して、1つの音声が前記第1のマイクロホン及び第2のマイクロホンに到達する時間の差が依存する、到来方向の角度の範囲を区別するための前記音声方向インデックスを決定する、請求項1に記載の音声収集方法。
- さらに、前記それぞれ離散フーリエ変換した結果に基づいて、前記目的音声を強調するためにアレイ処理をするステップを含む、請求項1に記載の音声収集方法。
- 前記複数の音声は第1の音声及び第2の音声であり、前記複数の音声の信号を検出するステップは、さらに前記CSP係数より前記第1の音声の信号及び第2の音声の信号の少なくとも一方について発話区間を検出する、請求項1に記載の音声収集方法。
- 前記複数の音声の信号を検出するステップは、さらに前記検出した発話区間より前記第1の音声の信号及び前記第2の音声の信号の少なくとも一方を分離する、請求項5に記載の音声収集方法。
- 前記複数の音声の信号を検出するステップは、さらに前記第1の音声の信号及び前記第2の音声の信号にそれぞれ対応する音声方向インデックスを第1の音声方向インデックス及び第2の音声方向インデックスとして対応付ける、請求項5に記載の音声収集方法。
- 前記目的音声の信号を抽出するステップは、さらに
前記第1の音声の信号及び前記第2の音声の信号と前記第1の音声方向インデックス及び前記第2の音声方向インデックスより、前記第1の音声の信号及び前記第2の音声の信号についてそれぞれ音声認識処理を行って第1の音声認識結果及び第2の音声認識結果を得るとともに、当該第1の音声及び第2の音声が発話された時間を示す第1の時間情報及び第2の時間情報を得る音声認識ステップと、
前記第1の音声認識結果及び前記第2の音声認識結果を前記第1の時間情報及び前記第2の時間情報とともに統合する統合ステップと、
前記統合の結果により抽出すべき箇所が選択されると当該箇所に応じた発話区間の音声の信号を切り出す切り出しステップと、
を含む請求項7に記載の音声収集方法。 - 前記統合ステップは、さらに前記第1の音声認識結果及び前記第2の音声認識結果、前記第1の時間情報及び前記第2の時間情報、及び前記第1の音声方向インデックス及び前記第2の音声方向インデックスとを関連付けるステップを含む、請求項8に記載の音声収集方法。
- 前記切り出しステップは、前記統合された情報からの前記選択された箇所に応じた音声方向インデックス及び時間情報に従って発話区間の音声の信号を切り出すステップを含む、請求項8に記載の音声収集方法。
- 前記切り出した音声の信号を録音対象音声として録音するステップを含む、請求項8に記載の音声収集方法。
- 請求項1から11のいずれか1項に記載の方法の各ステップを、コンピュータを用いて実行するためのコンピュータプログラム。
- 互いに到来方向が異なる複数の音声のうち目的とする目的音声を抽出して収集するために、少なくとも第1のマイクロホン及び第2のマイクロホンを所定の距離離して配置するマイクロホンアレイを用いる音声収集システムであって、
前記複数の音声は第1の音声及び第2の音声であり、前記第1の音声の発生源及び前記第2の音声の発生源を結ぶ線分と、前記マイクロホンアレイに含まれる前記第1のマイクロホン及び前記第2のマイクロホンを結ぶ線分とが略平行に配置された前記第1のマイクロホン及び前記第2のマイクロホンで受けた音声の信号をそれぞれ離散フーリエ変換して、音声の到来方向に関連する複数のCSP係数を求め、前記複数のCSP係数より前記複数の音声の信号を検出する音声検出手段と、
前記求めた前記複数のCSP係数から、前記第1のマイクロホン及び前記第2のマイクロホンを結ぶ線分と前記到来方向のなす角度の範囲を区別するための音声方向インデックスを検出する音声方向インデックス検出手段と、
前記検出した前記音声方向インデックスにより前記検出した前記複数の音声の信号から前記目的音声の信号を抽出する目的音声抽出手段と、
前記それぞれ離散フーリエ変換した結果に基づいて、推定される雑音のパワースペクトル(Uω)と減算定数(α)とを用いるSS(スペクトルサブトラクション)処理をする手段と、
前記SS処理をする手段の出力及び前記CSP係数より利得調整を実施する手段と、
前記利得調整を実施する手段の出力についてフロアリング係数(β)を用いてフロアリング処理を実施する手段と、
を含む音声収集システム。 - 互いに到来方向が異なる第1の音声及び第2の音声のうち前記第1の音声を抽出して収集するために、少なくとも第1のマイクロホン及び第2のマイクロホンを所定の距離離して配置するマイクロホンアレイを用いる音声収集システムであって、
前記第1の音声の発生源と前記第2の音声の発生源のそれぞれは、前記第1のマイクロホン及び前記第2のマイクロホンを結ぶ線分を中心軸として予め定められた角度の範囲内に位置し、
前記第1のマイクロホン及び前記第2のマイクロホンで受けた音声の信号をそれぞれ離散フーリエ変換した結果に基づいて目的の音声を強調するためにアレイ処理をする手段と、
前記それぞれ離散フーリエ変換した結果に基づいて、推定される雑音のパワースペクトル(Uω)と減算定数(α)とを用いるSS(スペクトルサブトラクション)処理をする手段と、
前記それぞれ離散フーリエ変換した結果よりCSP係数を求め、前記SS処理をする手段の出力及び前記CSP係数より利得調整を実施する手段と、
前記利得調整を実施する手段の出力についてフロアリング係数(β)を用いてフロアリング処理を実施する手段と、
前記フロアリング処理を実施した音声信号より前記第1の音声の信号及び第2の音声の信号を検出する音声検出手段と、
前記第1の音声及び前記第2の音声のそれぞれについて独立に、前記求めた前記CSP係数の大小関係を比較して、1つの音声が前記第1のマイクロホン及び前記第2のマイクロホンに到達する時間の差が依存する、到来方向の角度の範囲を区別するための音声方向インデックスを決定する音声方向インデックス検出手段と、
前記音声方向インデックスにより前記第1の音声の信号を抽出する目的音声抽出手段と、
前記CSP係数より前記第1の音声の信号の発話区間を検出する発話区間検出手段と、
前記検出した発話区間より前記第1の音声の信号を分離する目的音声分離手段と、
を含む音声収集システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008189504A JP5339501B2 (ja) | 2008-07-23 | 2008-07-23 | 音声収集方法、システム及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008189504A JP5339501B2 (ja) | 2008-07-23 | 2008-07-23 | 音声収集方法、システム及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010026361A JP2010026361A (ja) | 2010-02-04 |
JP5339501B2 true JP5339501B2 (ja) | 2013-11-13 |
Family
ID=41732236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008189504A Expired - Fee Related JP5339501B2 (ja) | 2008-07-23 | 2008-07-23 | 音声収集方法、システム及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5339501B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10950227B2 (en) | 2017-09-14 | 2021-03-16 | Kabushiki Kaisha Toshiba | Sound processing apparatus, speech recognition apparatus, sound processing method, speech recognition method, storage medium |
WO2022010320A1 (ko) * | 2020-07-10 | 2022-01-13 | 주식회사 아모센스 | 음성을 처리하기 위한 장치 및 이의 작동 방법 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2493327B (en) * | 2011-07-05 | 2018-06-06 | Skype | Processing audio signals |
JP2013072978A (ja) * | 2011-09-27 | 2013-04-22 | Fuji Xerox Co Ltd | 音声解析装置および音声解析システム |
JP6007487B2 (ja) * | 2011-12-07 | 2016-10-12 | 富士ゼロックス株式会社 | 情報処理装置、情報処理システムおよびプログラム |
JP6056544B2 (ja) * | 2013-02-26 | 2017-01-11 | 富士ゼロックス株式会社 | 音声解析装置、信号解析装置、音声解析システムおよびプログラム |
JP6051996B2 (ja) * | 2013-03-26 | 2016-12-27 | 富士ゼロックス株式会社 | 音声解析装置、音声解析システムおよびプログラム |
JP5929810B2 (ja) * | 2013-03-27 | 2016-06-08 | 富士ゼロックス株式会社 | 音声解析システム、音声端末装置およびプログラム |
JP6369022B2 (ja) * | 2013-12-27 | 2018-08-08 | 富士ゼロックス株式会社 | 信号解析装置、信号解析システムおよびプログラム |
KR101616112B1 (ko) * | 2014-07-28 | 2016-04-27 | (주)복스유니버스 | 음성 특징 벡터를 이용한 화자 분리 시스템 및 방법 |
CN105848062B (zh) * | 2015-01-12 | 2018-01-05 | 芋头科技(杭州)有限公司 | 多声道的数字麦克风 |
KR101547261B1 (ko) * | 2015-03-05 | 2015-08-27 | (주)지앤넷 | 화자 식별 방법 |
WO2017046888A1 (ja) * | 2015-09-16 | 2017-03-23 | 株式会社東芝 | 集音装置、集音方法およびプログラム |
US10580411B2 (en) | 2017-09-25 | 2020-03-03 | Cirrus Logic, Inc. | Talker change detection |
CN110310642B (zh) * | 2018-03-20 | 2023-12-26 | 阿里巴巴集团控股有限公司 | 语音处理方法、系统、客户端、设备和存储介质 |
CN108735226B (zh) * | 2018-07-09 | 2024-04-02 | 科沃斯商用机器人有限公司 | 语音采集方法、装置及设备 |
KR101970346B1 (ko) * | 2019-02-19 | 2019-04-17 | 주식회사 소리자바 | 화자 위치를 이용하여 빔포밍 수음 각도를 조절하는 음성인식장치 |
KR101970347B1 (ko) * | 2019-02-19 | 2019-04-17 | 주식회사 소리자바 | 화자 음성의 노이즈를 제거하는 음성인식장치 |
KR101970753B1 (ko) * | 2019-02-19 | 2019-04-22 | 주식회사 소리자바 | 음성인식을 이용한 회의록 작성 시스템 |
CN113658579B (zh) * | 2021-09-18 | 2024-01-30 | 重庆紫光华山智安科技有限公司 | 音频信号处理方法、装置、电子设备及可读存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4815661B2 (ja) * | 2000-08-24 | 2011-11-16 | ソニー株式会社 | 信号処理装置及び信号処理方法 |
JP2002135642A (ja) * | 2000-10-24 | 2002-05-10 | Atr Onsei Gengo Tsushin Kenkyusho:Kk | 音声翻訳システム |
JP4247037B2 (ja) * | 2003-01-29 | 2009-04-02 | 株式会社東芝 | 音声信号処理方法と装置及びプログラム |
EP1923866B1 (en) * | 2005-08-11 | 2014-01-01 | Asahi Kasei Kabushiki Kaisha | Sound source separating device, speech recognizing device, portable telephone, sound source separating method, and program |
JP4422662B2 (ja) * | 2005-09-09 | 2010-02-24 | 日本電信電話株式会社 | 音源位置・受音位置推定方法、その装置、そのプログラム、およびその記録媒体 |
JP4565162B2 (ja) * | 2006-03-03 | 2010-10-20 | 独立行政法人産業技術総合研究所 | 発話イベント分離方法、発話イベント分離システム、及び、発話イベント分離プログラム |
JP2007257088A (ja) * | 2006-03-20 | 2007-10-04 | Univ Of Electro-Communications | ロボット装置及びそのコミュニケーション方法 |
JP5156260B2 (ja) * | 2007-04-27 | 2013-03-06 | ニュアンス コミュニケーションズ,インコーポレイテッド | 雑音を除去して目的音を抽出する方法、前処理部、音声認識システムおよびプログラム |
-
2008
- 2008-07-23 JP JP2008189504A patent/JP5339501B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10950227B2 (en) | 2017-09-14 | 2021-03-16 | Kabushiki Kaisha Toshiba | Sound processing apparatus, speech recognition apparatus, sound processing method, speech recognition method, storage medium |
WO2022010320A1 (ko) * | 2020-07-10 | 2022-01-13 | 주식회사 아모센스 | 음성을 처리하기 위한 장치 및 이의 작동 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP2010026361A (ja) | 2010-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5339501B2 (ja) | 音声収集方法、システム及びプログラム | |
US8762137B2 (en) | Target voice extraction method, apparatus and program product | |
US9666183B2 (en) | Deep neural net based filter prediction for audio event classification and extraction | |
EP3289586B1 (en) | Impulsive noise suppression | |
US9959886B2 (en) | Spectral comb voice activity detection | |
US20170061978A1 (en) | Real-time method for implementing deep neural network based speech separation | |
US20120185246A1 (en) | Noise suppression using multiple sensors of a communication device | |
EP3757993A1 (en) | Pre-processing for automatic speech recognition | |
Roman et al. | Pitch-based monaural segregation of reverberant speech | |
Shokouhi et al. | Robust overlapped speech detection and its application in word-count estimation for prof-life-log data | |
JP2007288242A (ja) | オペレータ評価方法、装置、オペレータ評価プログラム、記録媒体 | |
Singh et al. | Linear Prediction Residual based Short-term Cepstral Features for Replay Attacks Detection. | |
Grondin et al. | WISS, a speaker identification system for mobile robots | |
CN108389590B (zh) | 一种时频联合的语音削顶检测方法 | |
JP2017097160A (ja) | 音声処理装置、音声処理方法、およびプログラム | |
JP3649032B2 (ja) | 音声認識方法 | |
JP5271734B2 (ja) | 話者方向推定装置 | |
JP4612468B2 (ja) | 信号抽出装置 | |
KR102628500B1 (ko) | 대면녹취단말장치 및 이를 이용한 대면녹취방법 | |
Zwyssig et al. | On the effect of SNR and superdirective beamforming in speaker diarisation in meetings | |
JPH01255000A (ja) | 音声認識システムに使用されるテンプレートに雑音を選択的に付加するための装置及び方法 | |
Maraboina et al. | Multi-speaker voice activity detection using ICA and beampattern analysis | |
JP5672155B2 (ja) | 話者判別装置、話者判別プログラム及び話者判別方法 | |
Venkatesan et al. | Analysis of monaural and binaural statistical properties for the estimation of distance of a target speaker | |
Ichikawa et al. | Effective speech suppression using a two-channel microphone array for privacy protection in face-to-face sales monitoring |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110606 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130206 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130709 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20130710 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130802 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |