JP6476938B2 - 音声解析装置、音声解析システムおよびプログラム - Google Patents
音声解析装置、音声解析システムおよびプログラム Download PDFInfo
- Publication number
- JP6476938B2 JP6476938B2 JP2015020287A JP2015020287A JP6476938B2 JP 6476938 B2 JP6476938 B2 JP 6476938B2 JP 2015020287 A JP2015020287 A JP 2015020287A JP 2015020287 A JP2015020287 A JP 2015020287A JP 6476938 B2 JP6476938 B2 JP 6476938B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- acquisition means
- microphone
- wearer
- sound pressure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
しかしながらマイクロフォンの周囲に障害物等が存在した場合、障害物の影響により音圧が変化し、自他識別の精度が低下する場合がある。
本発明は、マイクロフォンの周囲に障害物等が存在した場合でも影響を受けにくく、自他識別の精度が低下しにくい音声解析装置等を提供することを目的とする。
請求項2に記載の発明は、前記自他識別手段は、前記音声取得手段のうち前記発声部位から最も近い位置に配された音声取得手段と、当該発声部位から最も遠い位置に配された音声取得手段との2個をまず選択することを特徴とする請求項1に記載の音声解析装置である。
請求項3に記載の発明は、前記自他識別手段は、選択された2個の前記音声取得手段について、前記発声部位から最も近い位置に配された音声取得手段が取得した音声の音圧に対して選択された他方の音声取得手段が取得した音声の音圧が大きいときには、他方の音声取得手段の替わりに、前記発声部位から次に遠い位置に配された音声取得手段を選択することを特徴とする請求項1または2に記載の音声解析装置である。
請求項4に記載の発明は、前記自他識別手段は、選択された他方の音声取得手段の音圧を前記発声部位から最も遠い位置に配された音声取得手段に合わせ補正することを特徴とする請求項1乃至3の何れか1項に記載の音声解析装置である。
請求項5に記載の発明は、装着者の発声部位から異なる距離にて配され話者の音声を取得する3個以上の音声取得手段と、前記音声取得手段の中から2個を選択し、選択された当該音声取得手段で取得された音声の音圧から、取得された音声が、装着者の発話音声であるか装着者以外の他者の発話音声であるかを識別する自他識別手段であって、当該音声取得手段のうち第1の音声取得手段よりも発声部位から遠い第2の音声取得手段の音圧が予め定めた値よりも大きい場合に、当該第1の音声取得手段よりも発声部位から遠く且つ当該第2の音声取得手段よりも近い第3の音声取得手段および当該第1の音声取得手段の2個を選択して発話音声を識別する自他識別手段と、を備えることを特徴とする音声解析システムである。
請求項6に記載の発明は、コンピュータに、装着者の発声部位から異なる距離にて配され話者の音声を取得する3個以上の音声取得手段により生成された音声に関する情報を取得する音声情報取得機能と、前記音声取得手段の中から2個を選択し、選択された当該音声取得手段で取得された音声の音圧から、取得された音声が、装着者の発話音声であるか装着者以外の他者の発話音声であるかを識別する自他識別機能であって、当該音声取得手段のうち第1の音声取得手段よりも発声部位から遠い第2の音声取得手段の音圧が予め定めた値よりも大きい場合に、当該第1の音声取得手段よりも発声部位から遠く且つ当該第2の音声取得手段よりも近い第3の音声取得手段および当該第1の音声取得手段の2個を選択して発話音声を識別する自他識別機能と、を実現させるプログラムである。
請求項2の発明によれば、自他識別の精度がより向上する。
請求項3の発明によれば、自他識別の精度がより高い音声取得手段を順に選択することができる。
請求項4の発明によれば、音圧の差を補正し、自他識別の精度を向上させることができる。
請求項5の発明によれば、複数の装着者の音声取得手段で取得される音声に基づき、装着者のコミュニケーション関係が把握できるシステムを構築できる。
請求項6の発明によれば、音声取得手段の周囲に障害物等が存在した場合でも自他識別の精度が低下しにくくなる機能をコンピュータにより実現できる。
図1は、本実施形態による音声解析システムの構成例を示す図である。
図1に示すように、本実施形態の音声解析システム1は、音声解析装置の一例である端末装置10と、ホスト装置20とを備えて構成される。端末装置10とホスト装置20とは、無線通信回線を介して接続されている。無線通信回線の種類としては、Wi−Fi(Wireless Fidelity、登録商標)、Bluetooth(登録商標)、ZigBee(登録商標)、UWB(Ultra Wideband)等の既存の方式による回線を用いて良い。また、図示の例では、端末装置10が1台のみ記載されているが、端末装置10は、使用者各人が装着して使用するものであり、実際には使用者数分の端末装置10が用意される。以下、端末装置10を装着した使用者を装着者と呼ぶ。
データ蓄積部22は、例えばパーソナルコンピュータの磁気ディスク装置等の記憶装置により実現され、データ受信部21から取得した受信データを発話者別に蓄積する。ここで、発話者の識別は、端末装置10から送信される端末IDと、あらかじめホスト装置20に登録されている発話者名と端末IDの照合により行う。また、端末装置10から端末IDのかわりに装着者状態を送信するようにしてもよい。
図2は、端末装置10の構成例を示す図である。
上記のように、端末装置10は、各使用者に装着されて使用される。使用者が装着可能とするため、本実施形態の端末装置10は、図2に示すように、装置本体30と、装置本体30に接続された提げ紐40とを備えた構成とする。図示の構成において、使用者は、提げ紐40に首を通し、装置本体30を首から提げて装着する。
次に、本実施形態における発話者の識別方法について説明する。
本実施形態のシステムは、原則として端末装置10に設けられた2つのマイクロフォン11、12により取得された音声の情報を用いて、端末装置10の装着者自身の発話(自己発話)音声と他者の発話音声とを識別する。言い換えれば、本実施形態は、取得音声の発話者に関して自他の別を識別する。また、本実施形態では、取得音声の情報のうち、形態素解析や辞書情報を用いて得られる言語情報ではなく、音圧(マイクロフォン11、12への入力音量)等の非言語情報に基づいて発話者を識別する。言い換えれば、言語情報により特定される発話内容ではなく、非言語情報により特定される発話状況から音声の発話者を識別する。
図3に示す関係において、装着者の口(発声部位)である音源aと第1マイクロフォン11との間の距離をLa1、音源aと第2マイクロフォン12との間の距離をLa2とする。また、他者の口(発声部位)である音源bと第1マイクロフォン11との間の距離をLb1、音源bと第2マイクロフォン12との間の距離をLb2とする。この場合、次の関係が成り立つ。
La2>La1(La2≒1.5×La1〜4×La1)
Lb1≒Lb2
上述したように、音圧は、マイクロフォン11、12と音源との間の距離に応じて距離減衰する。図4において、距離La1の場合の音圧Ga1と距離La2の場合の音圧Ga2とを比較すると、音圧Ga1は、音圧Ga2の4倍程度となっている。一方、距離Lb1と距離Lb2とが近似するため、距離Lb1の場合の音圧Gb1と距離Lb2の場合の音圧Gb2とは、ほぼ等しい。そこで、本実施形態では、この音圧比の差を用いて、取得音声における装着者自身の発話音声と他者の発話音声とを識別する。なお、図4に示した例では、距離Lb1、Lb2を60cmとしたが、ここでは音圧Gb1と音圧Gb2とがほぼ等しくなることに意味があり、距離Lb1、Lb2は図示の値に限定されない。
図4を参照して説明したように、装着者自身の発話音声に関して、第1マイクロフォン11の音圧Ga1は、第2マイクロフォン12の音圧Ga2の数倍(例えば4倍程度)である。また、他者の発話音声に関して、第1マイクロフォン11の音圧Gb1は、第2マイクロフォン12の音圧Gb2とほぼ等しい(1倍程度)。そこで、本実施形態では、第1マイクロフォン11の音圧と第2マイクロフォン12の音圧との比に閾値(第1の閾値)を設定する。そして、音圧比が第1の閾値よりも大きい音声は装着者自身の発話音声と判断し、音圧比が第1の閾値よりも小さい音声は他者の発話音声と判断する。図5に示す例では、第1の閾値を2とし、音圧比Ga1/Ga2は第1の閾値2を超えるので装着者自身の発話音声と判断され、音圧比Gb1/Gb2は第1の閾値2よりも小さいので他者の発話音声と判断されている。
第2マイクロフォン12の近くに障害物が存在すると、上述したように増幅により音圧Ga2が本来取得されるものより大きくなる。その結果、図示するように音圧比Ga1/Ga2が、1未満となる。この場合、図5で説明したように、第1の閾値を2とすると、本来は装着者自身の発話音声であったものが、他者の発話音声と判断されてしまうことになる。
第3マイクロフォン13は、第2マイクロフォン12より第1マイクロフォン11により近く配置される。そのため第3マイクロフォン13の近くに障害物が存在する可能性は、第2マイクロフォン12よりも小さい。よって第2マイクロフォン12の近くに障害物が存在すると判断した場合、音圧比Ga1/Ga2の替わりに、音圧比Ga1/Ga3により装着者自身の発話音声であるか、他者の発話音声であるかを判断する。
図7は、本実施形態における端末装置10の動作を示すフローチャートである。
図7に示すように、端末装置10のマイクロフォン11、12、13が音声を取得する(ステップ101)と、各マイクロフォン11、12、13から取得音声に応じた電気信号(音声信号)が増幅器14へ送られる。増幅器14は、マイクロフォン11、12、13からの音声信号を取得すると、音声信号を増幅して音声解析部15へ送る(ステップ102)。
そして音声解析部15は、第1マイクロフォン11と他のマイクロフォンとの平均音圧の比(音圧比)を求める(ステップ106)。即ち、第1マイクロフォン11と第2マイクロフォン12の音圧比Ga1/Ga2を求める。また第1マイクロフォン11と第3マイクロフォン13の音圧比を求める。ただし、このとき第3マイクロフォン13の平均音圧は、上述した補正係数を用いて補正を行うことが好ましい。よってここでは補正後の第3マイクロフォン13の平均音圧Ga3’を使用し、音圧比Ga1/Ga3’を求める。
端末装置10の実施形態については、上述した例に限られるものではない。ここでは、端末装置10の変形例について説明を行なう。
図示する端末装置10は、図2に示した端末装置10に比較して、第3マイクロフォン13が複数設けられている。ここでは、第3マイクロフォン13として、第3マイクロフォン13−1および第3マイクロフォン13−2を図示している。
本実施形態の第3マイクロフォン13−1および第3マイクロフォン13−2は、第1マイクロフォン11と第2マイクロフォン12との間に設けられる点では、図2の場合と同様である。一方、図8では、第3マイクロフォン13−1は、第3マイクロフォン13−2よりも第2マイクロフォン12に近い位置に設けられている。即ち、発話者の発声部位からの距離は、第1マイクロフォン11、第3マイクロフォン13−2、第3マイクロフォン13−1、第2マイクロフォン12の順で大きくなる。
なお図8では、説明を簡単にするため、第3マイクロフォン13は、第3マイクロフォン13−1と第3マイクロフォン13−2の2個であったが、さらに多くの第3マイクロフォン13を用意してもよい。この場合、第3マイクロフォン13は、装着者の発声部位から遠い順から順次選択していくようにする。
ここでは第3マイクロフォン13は、n個用意され、それぞれ第3マイクロフォン13−1、第3マイクロフォン13−2、 … 、第3マイクロフォン13−nとする。これらは全て第1マイクロフォン11と第2マイクロフォン12との間に設けられる。またこの順で第2マイクロフォン12により近い位置に設けられている。即ち、発話者の発声部位からの距離は、第1マイクロフォン11、第3マイクロフォン13−n、 … 、第3マイクロフォン13−2、第3マイクロフォン13−1、第2マイクロフォン12の順で大きくなる。
次に音声解析部15は、音圧比Ga1/Ga3−i’が第2の閾値以上であるか否かを判定する(ステップ212)。つまりまず音圧比Ga1/Ga3−1’が第2の閾値以上であるか否かが判定される。
そしてカウンタiがnより大きくなったか否かを判定する(ステップ214)。
さらにカウンタiがnより大きくない場合(ステップ214でNo)、ステップ212に戻る。
そして選択された2個のマイクロフォンについて、発声部位から最も近い位置に配された第1マイクロフォン11が取得した音声の音圧に対して選択された他方のマイクロフォンが取得した音声の音圧が予め定めた値よりも大きいときには、他方のマイクロフォンの替わりに、発声部位から次に遠い位置に配されたマイクロフォンを選択する。
さらに選択された他方のマイクロフォンの音圧を発声部位から最も遠い位置に配された第2マイクロフォン12に合わせ補正する。
そして音圧比を基に発話音声が装着者の発話音声であるか他者の発話音声であるかを識別する。これによりマイクロフォンの周囲に障害物等が存在した場合でも障害物の影響を受けにくく、自他識別の精度が低下しにくい。
音声に関する情報を受信した端末装置10では、データ解析部23において複数の端末装置10から送られた音声が解析され、装着者の会話関係が判定される。
以下に本実施形態における装着者の会話関係を判定する具体的な方法について説明を行なう。ここではまず同一の部屋内等の同一のエリアにおいて二人の装着者が会話を行なっている場合に、この二人の装着者が会話をしていることを判定する場合について説明する。
図10に示すように、端末装置10をそれぞれ装着した装着者A、装着者Bが会話している場合を考える。このとき、装着者Aおよび装着者Bは同一エリア内におり、互いの発話音声が届く距離にある。よって装着者A、装着者Bの発話音声は、装着者Aの端末装置10Aと装着者Bの端末装置10Bの双方に捉えられる。
つまり自他識別情報が付与されることで、取得された音声が装着者自身によるものであるのか、装着者以外の他者のものであるのかが予め判別できているため、発話者が切り替わったタイミングなどが明確に把握できる。そしてこのタイミングにおいて発話者が逆転する装着者同士を見つければ、この装着者同士が会話をしていると判断できる。
このように装着者同士の会話関係を判断することで、装着者のコミュニケーション関係が把握できるシステムを構築できる。
なお図7、図9−1、図9−2で説明を行った本実施形態における端末装置10が行なう処理は、ソフトウェアとハードウェア資源とが協働することにより実現される。即ち、端末装置10に設けられた制御用コンピュータ内部の図示しないCPUが、端末装置10の各機能を実現するプログラムを実行し、これらの各機能を実現させる。
Claims (6)
- 装着者の発声部位から異なる距離にて配され話者の音声を取得する3個以上の音声取得手段により生成された音声に関する情報を取得する音声情報取得手段と、
前記音声取得手段の中から2個を選択し、選択された当該音声取得手段で取得された音声の音圧から、取得された音声が、装着者の発話音声であるか装着者以外の他者の発話音声であるかを識別する自他識別手段であって、当該音声取得手段のうち第1の音声取得手段よりも発声部位から遠い第2の音声取得手段の音圧が予め定めた値よりも大きい場合に、当該第1の音声取得手段よりも発声部位から遠く且つ当該第2の音声取得手段よりも近い第3の音声取得手段および当該第1の音声取得手段の2個を選択して発話音声を識別する自他識別手段と、
を備えることを特徴とする音声解析装置。 - 前記自他識別手段は、前記音声取得手段のうち前記発声部位から最も近い位置に配された音声取得手段と、当該発声部位から最も遠い位置に配された音声取得手段との2個をまず選択することを特徴とする請求項1に記載の音声解析装置。
- 前記自他識別手段は、選択された2個の前記音声取得手段について、前記発声部位から最も近い位置に配された音声取得手段が取得した音声の音圧に対して選択された他方の音声取得手段が取得した音声の音圧が大きいときには、他方の音声取得手段の替わりに、前記発声部位から次に遠い位置に配された音声取得手段を選択することを特徴とする請求項1または2に記載の音声解析装置。
- 前記自他識別手段は、選択された他方の音声取得手段の音圧を前記発声部位から最も遠い位置に配された音声取得手段に合わせ補正することを特徴とする請求項1乃至3の何れか1項に記載の音声解析装置。
- 装着者の発声部位から異なる距離にて配され話者の音声を取得する3個以上の音声取得手段と、
前記音声取得手段の中から2個を選択し、選択された当該音声取得手段で取得された音声の音圧から、取得された音声が、装着者の発話音声であるか装着者以外の他者の発話音声であるかを識別する自他識別手段であって、当該音声取得手段のうち第1の音声取得手段よりも発声部位から遠い第2の音声取得手段の音圧が予め定めた値よりも大きい場合に、当該第1の音声取得手段よりも発声部位から遠く且つ当該第2の音声取得手段よりも近い第3の音声取得手段および当該第1の音声取得手段の2個を選択して発話音声を識別する自他識別手段と、
を備えることを特徴とする音声解析システム。 - コンピュータに、
装着者の発声部位から異なる距離にて配され話者の音声を取得する3個以上の音声取得手段により生成された音声に関する情報を取得する音声情報取得機能と、
前記音声取得手段の中から2個を選択し、選択された当該音声取得手段で取得された音声の音圧から、取得された音声が、装着者の発話音声であるか装着者以外の他者の発話音声であるかを識別する自他識別機能であって、当該音声取得手段のうち第1の音声取得手段よりも発声部位から遠い第2の音声取得手段の音圧が予め定めた値よりも大きい場合に、当該第1の音声取得手段よりも発声部位から遠く且つ当該第2の音声取得手段よりも近い第3の音声取得手段および当該第1の音声取得手段の2個を選択して発話音声を識別する自他識別機能と、
を実現させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015020287A JP6476938B2 (ja) | 2015-02-04 | 2015-02-04 | 音声解析装置、音声解析システムおよびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015020287A JP6476938B2 (ja) | 2015-02-04 | 2015-02-04 | 音声解析装置、音声解析システムおよびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016144134A JP2016144134A (ja) | 2016-08-08 |
JP6476938B2 true JP6476938B2 (ja) | 2019-03-06 |
Family
ID=56570874
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015020287A Active JP6476938B2 (ja) | 2015-02-04 | 2015-02-04 | 音声解析装置、音声解析システムおよびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6476938B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018090343A1 (zh) * | 2016-11-18 | 2018-05-24 | 北京小米移动软件有限公司 | 麦克风、音频处理的方法及装置 |
JP6786139B1 (ja) * | 2020-07-06 | 2020-11-18 | Fairy Devices株式会社 | 音声入力装置 |
JP7363716B2 (ja) | 2020-08-25 | 2023-10-18 | トヨタ自動車株式会社 | 音解析システム、音解析方法、及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5625697A (en) * | 1995-05-08 | 1997-04-29 | Lucent Technologies Inc. | Microphone selection process for use in a multiple microphone voice actuated switching system |
JP4669041B2 (ja) * | 2006-02-28 | 2011-04-13 | パナソニック株式会社 | ウェアラブル端末 |
JP5772447B2 (ja) * | 2011-09-27 | 2015-09-02 | 富士ゼロックス株式会社 | 音声解析装置 |
JP6031761B2 (ja) * | 2011-12-28 | 2016-11-24 | 富士ゼロックス株式会社 | 音声解析装置および音声解析システム |
JP5738218B2 (ja) * | 2012-02-28 | 2015-06-17 | 日本電信電話株式会社 | 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム |
-
2015
- 2015-02-04 JP JP2015020287A patent/JP6476938B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016144134A (ja) | 2016-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5772447B2 (ja) | 音声解析装置 | |
JP6031761B2 (ja) | 音声解析装置および音声解析システム | |
CN111512646B (zh) | 低延迟音频增强的方法和设备 | |
DK2882204T3 (en) | Hearing aid device for hands-free communication | |
JP6003472B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP5772448B2 (ja) | 音声解析システムおよび音声解析装置 | |
JP6003510B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
CN107465970B (zh) | 用于语音通信的设备 | |
JP5867066B2 (ja) | 音声解析装置 | |
JP2013135325A (ja) | 音声解析装置 | |
JP6476938B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
US8983843B2 (en) | Motion analyzer having voice acquisition unit, voice acquisition apparatus, motion analysis system having voice acquisition unit, and motion analysis method with voice acquisition | |
JP6007487B2 (ja) | 情報処理装置、情報処理システムおよびプログラム | |
JP5862318B2 (ja) | 音解析装置、音解析システムおよびプログラム | |
JP6160042B2 (ja) | 位置特定システム | |
JP6191747B2 (ja) | 音声解析装置および音声解析システム | |
JP6031767B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP2013164468A (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP2013140534A (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP2013072978A (ja) | 音声解析装置および音声解析システム | |
JP5929810B2 (ja) | 音声解析システム、音声端末装置およびプログラム | |
JP6056544B2 (ja) | 音声解析装置、信号解析装置、音声解析システムおよびプログラム | |
JP6051996B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP6369022B2 (ja) | 信号解析装置、信号解析システムおよびプログラム | |
JP2014048618A (ja) | 音声解析装置、音声解析システムおよびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180116 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190121 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6476938 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |