JP6056544B2 - 音声解析装置、信号解析装置、音声解析システムおよびプログラム - Google Patents
音声解析装置、信号解析装置、音声解析システムおよびプログラム Download PDFInfo
- Publication number
- JP6056544B2 JP6056544B2 JP2013035602A JP2013035602A JP6056544B2 JP 6056544 B2 JP6056544 B2 JP 6056544B2 JP 2013035602 A JP2013035602 A JP 2013035602A JP 2013035602 A JP2013035602 A JP 2013035602A JP 6056544 B2 JP6056544 B2 JP 6056544B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- voice
- wearer
- acquisition means
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
請求項2の発明によれば、本構成を採用しない場合に比較して、分離された音声信号の何れが装着者の発話音声による音声信号であるかをより容易に識別することができる。
請求項3の発明によれば、信号取得手段により取得した信号が、複数の信号源による混合信号であった場合でも、複数の信号源のうち1つの信号源から取得した信号であるか他の信号源から取得した信号であるかを識別することができる信号解析装置を提供することができる。
請求項4の発明によれば、複数の装着者の音声取得手段で取得される音声に基づき、装着者のコミュニケーション関係が把握できる音声解析システムを構築できる。
請求項5の発明によれば、装着者と1人の他者が対話している場合に、分離された音声信号が、装着者の発話音声であるか他者の発話音声であるかを識別できる。
請求項6の発明によれば、音声取得手段により取得した音声が、装着者の発話音声と他者の発話音声とが混合したものであった場合でも、装着者の発話音声と他者の発話音声とを識別できる機能をコンピュータにより実現できる。また音声取得手段に音声が到達する時間差を利用して装着者の発話音声と他者の発話音声とを識別できる機能をコンピュータにより実現できる。
例えば、2人の人がおり、この2人が対話するときは、通常は2人が交互に発話することで対話が行われる。一方、この2人が同時に発話する場合もあり、この場合音声は、混ざり合い混合音声となる。そしてこのとき混合音声をそれぞれの発話者のそれぞれの音声に分離する従来技術が存在する。これは、例えば、独立成分分析(ICA:Independent Component Analysis)を用いる手法であり、この手法によれば、混合音声の信号である混合音声信号をそれぞれの発話者の音声信号に分離することができる。
しかしながらこの手法を用いて混合音声信号を分離しても、分離後の音声信号が何れの発話者のものであるかを特定できない問題があった。
そこで本実施形態では、以下の音声解析システム1を用いることでこの問題の解決を図っている。
まず、第1の実施形態について説明する。
<システム構成例>
図1は、第1の実施形態による音声解析システムの構成例を示す図である。
図1に示すように、本実施形態の音声解析システム1は、音声解析装置の一例である端末装置10と、ホスト装置20とを備えて構成される。端末装置10とホスト装置20とは、無線通信回線を介して接続されている。無線通信回線の種類としては、Wi−Fi(Wireless Fidelity)、Bluetooth(登録商標)、ZigBee、UWB(Ultra Wideband)等の既存の方式による回線を用いて良い。また、図示の例では、端末装置10が1台のみ記載されているが、端末装置10は、使用者各人が装着して使用するものであり、実際には使用者数分の端末装置10が用意される。以下、端末装置10を装着した使用者を装着者と呼ぶ。
本実施形態のマイクロフォン11a、11b、12a、12bとして用いられるマイクロフォンの種類としては、ダイナミック型、コンデンサ型等、既存の種々のものを用いて良い。とくに無指向性のMEMS(Micro Electro Mechanical Systems)型マイクロフォンが好ましい。
データ蓄積部22は、例えばパーソナルコンピュータの磁気ディスク装置等の記憶装置により実現され、データ受信部21から取得した受信データを発話者別に蓄積する。ここで、発話者の識別は、端末装置10から送信される端末IDと、あらかじめホスト装置20に登録されている発話者名と端末IDの照合により行う。また、端末装置10から端末IDのかわりに装着者状態を送信するようにしてもよい。
図2は、端末装置10の構成例を示す図である。
上記のように、端末装置10は、各使用者に装着されて使用される。使用者が装着可能とするため、本実施形態の端末装置10は、図2に示すように、装置本体30と、装置本体30に接続された提げ紐40とを備えた構成とする。図示の構成において、使用者は、提げ紐40に首を通し、装置本体30を首から提げて装着する。
図3は、本実施形態における音声解析部15の機能構成例を示した図である。
図示するように音声解析部15は、音声信号取得手段151と、分離手段152と、自他識別手段153とを備える。
図4では、装着者は端末装置10を装着しており、このとき装着者の発話音声と他者の発話音声は、ともにマイクロフォン11a、11b、12a、12bにより捉えられ、音声信号が生成される。
図中、発話者の元の音声信号を音声信号S1、他者の元の音声信号を音声信号S2としている。装着者と他者とが同時に発話したときは、マイクロフォン11a、11b、12a、12bでは、それぞれ音声信号S1と音声信号S2とが混合した混合音声信号が生成される。
このときマイクロフォン11aとマイクロフォン11bとは、ほぼ同じ箇所に隣接して配されるため、両者は、ほぼ同じ混合信号を生成する。図5では、マイクロフォン11a、11bにより生成された混合信号を混合音声信号X1として図示している。また同様にマイクロフォン12aとマイクロフォン12bとは、ほぼ同じ箇所に隣接して配されるため、両者は、ほぼ同じ混合信号を生成する。図5では、マイクロフォン12a、12bにより生成された混合音声信号を混合音声信号X2として図示している。
なお混合音声信号X1、X2を分離音声信号Y1、Y2、Y3、Y4に分離するのは、例えば、上述したICAを使用することで行うことができる。
ここではマイクロフォンの組同士が離間する距離の分に対応して音声が予め定められた時間差で到達することを利用する。まず図4に示すように、装着者の口(発声部位)とマイクロフォン11a、11bとの間の距離をLa1、装着者の口とマイクロフォン12a、12bとの間の距離をLa2とする。また、他者の口(発声部位)とマイクロフォン11a、11bとの間の距離をLb1、他者の口とマイクロフォン12a、12bとの間の距離をLb2とする。この場合、次の関係が成り立つ。
La1>La2
Lb1≒Lb2
(1)分離音声信号Y1と分離音声信号Y3
(2)分離音声信号Y1と分離音声信号Y4
(3)分離音声信号Y2と分離音声信号Y3
(4)分離音声信号Y2と分離音声信号Y4
以上のようにして分離音声信号Y1、Y2、Y3、Y4のそれぞれが、装着者の発話音声による音声信号であるか装着者以外の他者の発話音声による音声信号であるかを識別することができる。
図7は、本実施形態における端末装置10の動作を示すフローチャートである。
図7に示すように、端末装置10のマイクロフォン11a、11b、12a、12bが音声を取得すると、各マイクロフォン11a、11b、12a、12bから取得音声に応じた電気信号(音声信号)が増幅器13a、13b、14a、14bへ送られる(ステップ101)。増幅器13a、13b、14a、14bは、マイクロフォン11a、11b、12a、12bからの音声信号を取得すると、増幅して音声解析部15へ送る(ステップ102)。
このときマイクロフォン11a、11b、12a、12bで取得された音声信号が、混合音声信号ではなく、装着者または他者のそれぞれ単独の発話音声に基づく音声信号である場合もある。そしてこの場合、分離手段152でICA処理を行うと、装着者または他者の単独の音声信号と、無音音声(小さなノイズ音)の信号とに分離される。ただしこの無音音声の信号は、発話音声に基づく音声信号に対し、非常に微弱な信号であるため、区別が容易である。よってこのような信号が分離されたときは、発話音声に基づく音声信号として扱わなければよい。
このときマイクロフォン11a、11b、12a、12bで取得された音声信号が、混合音声信号ではなく、装着者または他者のそれぞれ単独の発話音声に基づく音声信号であったときは、分離音声信号は、無声音声の信号を除くと2つのみ生成される。これは、装着者単独の発話音声に基づく音声信号であるか、他者単独の発話音声に基づく音声信号であるかのどちらかである。そしてこれを識別するのは、図6で説明した方法と同様である。即ち、この2つの分離音声信号の何れかの波形を時間差tだけ、時間的にシフトさせ、分離音声信号の相関関係を調べればよい。
また上述した例では、信号取得手群を構成する組の数は、2組であったが、これに限られることはなく、3組以上でもよい。この場合、上述したマイクロフォンの組同士の距離dが複数存在することになり、それぞれについて自他識別を行うことで、自他識別の精度が向上しやすくなる。
本実施形態のシステムでは、複数の端末装置10により上記のようにして得られた発話に関する情報(以下、発話情報)がホスト装置20に集められる。ホスト装置20は、複数の端末装置10から得られた情報を用いて、例えば、装着者同士の会話関係を解析する。
図8に示すように、端末装置10をそれぞれ装着した二人の装着者A、装着者Bが会話している場合を考える。このとき、装着者Aの端末装置10Aにおいて装着者の発話として認識される音声は、装着者Bの端末装置10Bでは他者の発話として認識される。反対に、端末装置10Bにおいて装着者の発話として認識される音声は、端末装置10Aでは他者の発話として認識される。
なお本実施形態における端末装置10が行なう処理は、ソフトウェアとハードウェア資源とが協働することにより実現される。即ち、端末装置10に設けられた制御用コンピュータ内部の図示しないCPUが、端末装置10の各機能を実現するプログラムを実行し、これらの各機能を実現させる。
次に第2の実施形態について説明する。
<信号解析装置の構成例>
第1の実施形態では、例えば、端末装置10が、マイクロフォン11a、11b、12a、12bにより発話者の音声を取得し、これにより生成された混合音声信号を発話者毎に分離して分離音声信号とした。そして分離音声信号が端末装置10を装着する装着者の発話音声による音声信号であるか他者の発話音声による音声信号であるかを識別していたが、これに限られるものではない。
図10に示すように、本実施形態の信号解析装置50は、信号源から送信された信号を取得する信号取得手段として、センサ51−1、51−2、…、51−nの組と、センサ52−1、52−2、…、52−nの組とを備える。また、信号解析装置50は、取得した信号を解析する信号解析部55と、電源部57とを備える。
またセンサ51とセンサ52とは、本実施形態では、信号源1からの距離が異なる位置に配される。ここでは、センサ51は、信号源1から遠い位置に配置され、センサ52は、信号源1から近い位置に配置されるものとする。その結果、センサ51とセンサ52とは、予め定められた距離dだけ離間して配置する。
またセンサ51−1、51−2、…、51−nのそれぞれは、隣接して配される。またセンサ52−1、52−2、…、52−nのそれぞれも同様に隣接して配される。
また本実施形態の信号解析装置50は、上記形態に限られるものではなく、第1の実施形態で例示したように、増幅器やデータ送信部などを設けてもよい。
さらに本実施形態の信号解析装置50に第1の実施形態で例示したようなホスト装置20を接続し、この装置に信号解析装置50で解析した結果をデータとして送信して、データの蓄積や分析等を行なう信号解析システムとしてもよい。
図12は、本実施形態における信号解析部55の機能構成例を示した図である。
図示するように信号解析部55は、信号情報取得手段551と、分離手段552と、信号源識別手段553とを備える。
なお混合信号情報を分離して分離信号情報とするのは、図5で説明したのと同様に例えば、ICAを使用することで行うことができる。なおここでは、n個の信号源から出力されたn個の信号が、混合している場合を考える。この場合、分離手段552により、混合信号情報は、n個の分離信号情報に分離される。
具体的には、図6で説明したように各分離信号情報の相関関係を導出し、相関関係が最も高いもの2つが、信号源1から取得した信号の情報であると判定する。そして他の分離信号情報については、他の信号源2〜信号源nから取得された信号の情報であると判定する。
図13は、本実施形態における信号解析装置50の動作を示すフローチャートである。
図13に示すように、信号解析装置50のセンサ51、センサ52が信号を取得すると(ステップ201)、取得された信号は、信号の情報として信号解析部55へ送られる。
Claims (6)
- 隣接して配される複数の音声取得手段からなる組を装着者の発声部位から異なる距離離間させて複数配置することで構成される音声取得手段群にて生成された音声信号を取得する音声信号取得手段と、
前記音声取得手段により生成された音声信号が複数の発話者による混合音声信号であったときに、当該混合音声信号を前記組のそれぞれについて発話者毎に分離する分離手段と、
前記音声取得手段群と発話者との位置関係を利用して異なる組において発話者毎に分離された音声信号を比較したときの相関関係に基づいて、前記分離手段により分離されたそれぞれの音声信号が、装着者の発話音声による音声信号であるか装着者以外の他者の発話音声による音声信号であるかを識別する自他識別手段と、
を備えることを特徴とする音声解析装置。 - 前記自他識別手段は、異なる組において発話者毎に分離された音声信号の波形を予め定められた時間差分ずらしたときの相関関係を求めることを特徴とする請求項1に記載の音声解析装置。
- 隣接して配される複数の信号取得手段からなる組を予め定められた距離離間させて複数配置することで構成される信号取得手段群にて取得された信号の情報を取得する信号情報取得手段と、
前記信号取得手段により取得された信号の情報が複数の信号源による混合信号情報であったときに、当該混合信号情報を前記組のそれぞれについて何れかの信号源からの信号の情報として分離する分離手段と、
前記信号取得手段群と信号源との位置関係を利用して異なる組において信号源毎に分離された信号を比較したときの相関関係に基づいて、前記分離手段により分離されたそれぞれの信号の情報が、前記複数の信号源のうち1つの信号源から取得した信号の情報であるか他の信号源から取得した信号の情報であるかを識別する信号源識別手段と、
を備えることを特徴とする信号解析装置。 - 隣接して配される複数の音声取得手段からなる組を装着者の発声部位から異なる距離離間させて複数配置することで構成される音声取得手段群と、
前記音声取得手段により生成された音声信号が複数の発話者による混合音声信号であったときに、当該混合音声信号を前記組のそれぞれについて発話者毎に分離する分離手段と、
前記音声取得手段群と発話者との位置関係を利用して異なる組において発話者毎に分離された音声信号を比較したときの相関関係に基づいて、前記分離手段により分離されたそれぞれの音声信号が、装着者の発話音声による音声信号であるか装着者以外の他者の発話音声による音声信号であるかを識別する自他識別手段と、
を備えることを特徴とする音声解析システム。 - 前記組を構成する音声取得手段は、2個であり、前記音声取得手段群を構成する当該組は2組であることを特徴とする請求項4に記載の音声解析システム。
- コンピュータに、
隣接して配される複数の音声取得手段からなる組を装着者の発声部位から異なる距離離間させて複数配置することで構成される音声取得手段群にて生成された音声信号を取得する機能と、
前記音声取得手段により生成された音声信号が複数の発話者による混合音声信号であったときに、当該混合音声信号を前記組のそれぞれについて発話者毎に分離する機能と、
前記音声取得手段群と発話者との位置関係を利用して異なる組において発話者毎に分離された音声信号を比較したときの相関関係に基づいて、分離されたそれぞれの音声信号が、装着者の発話音声による音声信号であるか装着者以外の他者の発話音声による音声信号であるかを識別する機能と、
を実現させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013035602A JP6056544B2 (ja) | 2013-02-26 | 2013-02-26 | 音声解析装置、信号解析装置、音声解析システムおよびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013035602A JP6056544B2 (ja) | 2013-02-26 | 2013-02-26 | 音声解析装置、信号解析装置、音声解析システムおよびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014164164A JP2014164164A (ja) | 2014-09-08 |
JP6056544B2 true JP6056544B2 (ja) | 2017-01-11 |
Family
ID=51614803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013035602A Active JP6056544B2 (ja) | 2013-02-26 | 2013-02-26 | 音声解析装置、信号解析装置、音声解析システムおよびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6056544B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6515591B2 (ja) * | 2015-03-03 | 2019-05-22 | 富士ゼロックス株式会社 | 音声解析装置、音声解析システムおよびプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0792988A (ja) * | 1993-09-27 | 1995-04-07 | Matsushita Electric Ind Co Ltd | 音声検出装置と映像切り替え装置 |
WO2007105436A1 (ja) * | 2006-02-28 | 2007-09-20 | Matsushita Electric Industrial Co., Ltd. | ウェアラブル端末 |
JP4649437B2 (ja) * | 2007-04-03 | 2011-03-09 | 株式会社東芝 | 信号分離抽出装置 |
JP5195652B2 (ja) * | 2008-06-11 | 2013-05-08 | ソニー株式会社 | 信号処理装置、および信号処理方法、並びにプログラム |
JP5339501B2 (ja) * | 2008-07-23 | 2013-11-13 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声収集方法、システム及びプログラム |
JP5246120B2 (ja) * | 2009-09-29 | 2013-07-24 | 沖電気工業株式会社 | 収音装置、利得制御方法、およびプログラム |
US9354310B2 (en) * | 2011-03-03 | 2016-05-31 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for source localization using audible sound and ultrasound |
-
2013
- 2013-02-26 JP JP2013035602A patent/JP6056544B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014164164A (ja) | 2014-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6031761B2 (ja) | 音声解析装置および音声解析システム | |
JP5772447B2 (ja) | 音声解析装置 | |
JP6003472B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP6003510B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP5867066B2 (ja) | 音声解析装置 | |
JP2013135325A (ja) | 音声解析装置 | |
US8983843B2 (en) | Motion analyzer having voice acquisition unit, voice acquisition apparatus, motion analysis system having voice acquisition unit, and motion analysis method with voice acquisition | |
JP6160042B2 (ja) | 位置特定システム | |
JP6476938B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP5862318B2 (ja) | 音解析装置、音解析システムおよびプログラム | |
JP6007487B2 (ja) | 情報処理装置、情報処理システムおよびプログラム | |
JP6056544B2 (ja) | 音声解析装置、信号解析装置、音声解析システムおよびプログラム | |
JP6191747B2 (ja) | 音声解析装置および音声解析システム | |
JP6031767B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP2013164468A (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP2013140534A (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP6515591B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP2013072978A (ja) | 音声解析装置および音声解析システム | |
JP6051996B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP5929810B2 (ja) | 音声解析システム、音声端末装置およびプログラム | |
JP6369022B2 (ja) | 信号解析装置、信号解析システムおよびプログラム | |
JP2014048618A (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP6187112B2 (ja) | 音声解析装置、表示装置、音声解析システムおよびプログラム | |
JP2014050048A (ja) | 音声解析装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150306 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160405 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160601 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161121 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6056544 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |