JP6003472B2 - 音声解析装置、音声解析システムおよびプログラム - Google Patents
音声解析装置、音声解析システムおよびプログラム Download PDFInfo
- Publication number
- JP6003472B2 JP6003472B2 JP2012211177A JP2012211177A JP6003472B2 JP 6003472 B2 JP6003472 B2 JP 6003472B2 JP 2012211177 A JP2012211177 A JP 2012211177A JP 2012211177 A JP2012211177 A JP 2012211177A JP 6003472 B2 JP6003472 B2 JP 6003472B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- wearer
- acquired
- acquisition means
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000004458 analytical method Methods 0.000 title claims description 63
- 238000000034 method Methods 0.000 description 25
- 230000000737 periodic effect Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 238000007405 data analysis Methods 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 8
- 238000013500 data storage Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000012937 correction Methods 0.000 description 5
- 238000009795 derivation Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 239000011347 resin Substances 0.000 description 3
- 229920005989 resin Polymers 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 229920000742 Cotton Polymers 0.000 description 1
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 210000003109 clavicle Anatomy 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 239000002649 leather substitute Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 239000012209 synthetic fiber Substances 0.000 description 1
- 229920002994 synthetic fiber Polymers 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S11/00—Systems for determining distance or velocity not using reflection or reradiation
- G01S11/14—Systems for determining distance or velocity not using reflection or reradiation using ultrasonic, sonic, or infrasonic waves
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
特許文献2には、互いに離間して配置された複数のマイクロフォンと、マイクロフォンで収音された音声情報の位相差に基づいて、マイクロフォンへの音声の入射角θを算出する音方向情報算出部と、入射角θに基づいて、音源から発せられた音声の方向性を判別する音方向性判別部と、マイクロフォンで収音された音声情報から、方向性が確定していると判断される音声情報のみを検出する音声検出部と、を備える音声検出装置が開示されている。
請求項3に記載の発明は、前記距離導出手段は、複数の前記位相差によって前記第1の装着者と前記第2の装着者との間の仮の距離をそれぞれ導出し、複数の当該仮の距離の平均を前記第1の装着者と前記第2の装着者との間の距離とすることを特徴とする請求項1または2に記載の音声解析装置である。
請求項4に記載の発明は、前記距離導出手段は、複数の前記位相差によって前記第1の装着者と前記第2の装着者との間の仮の距離をそれぞれ導出し、複数の当該仮の距離の中から最も確度の高いものを選択して前記第1の装着者と前記第2の装着者との間の距離とすることを特徴とする請求項1乃至3の何れか1項に記載の音声解析装置である。
請求項2の発明によれば、一方が自発話・他方が他発話とした音声について、複数の周波数の音波間の位相差を位相として用いて、装着者の間の距離を導出することができる。
請求項3の発明によれば、平均化効果が期待できる。
請求項4の発明によれば、本構成を採用しない場合に比較して、精度よく装着者の間の距離を導出することができる。
請求項5の発明によれば、音声取得手段を装着する複数の装着者が対峙する距離を、絶対的な位相や時間の精密な測定をせずに把握するために必要な情報を得られる音声解析装置を提供できる。
請求項6の発明によれば、音声取得手段を装着する複数の装着者が対峙する距離を、絶対的な位相や時間の精密な測定をせずに把握することができる音声解析システムを提供できる。
請求項7の発明によれば、音声取得手段を装着する複数の装着者が対峙する距離を、絶対的な位相や時間の精密な測定をせずに把握することができる機能をコンピュータにより実現できる。
図1は、本実施形態による音声解析システムの構成例を示す図である。
図1に示すように、本実施形態の音声解析システム1は、音声解析装置の一例である端末装置10と、同様に音声解析装置の一例であるホスト装置20とを備えて構成される。端末装置10とホスト装置20とは、無線通信回線を介して接続されている。無線通信回線の種類としては、Wi−Fi(Wireless Fidelity)(登録商標)、Bluetooth(登録商標)、ZigBee(登録商標)、UWB(Ultra Wideband)等の既存の方式による回線を用いて良い。また、図示の例では、端末装置10が1台のみ記載されているが、詳しくは後述するように、端末装置10は、使用者各人が装着して使用するものであり、実際には使用者数分の端末装置10が用意される。以下、端末装置10を装着した使用者を装着者と呼ぶ。
図2は、端末装置10の構成例を示す図である。
上記のように、端末装置10は、各使用者に装着されて使用される。使用者が装着可能とするため、本実施形態の端末装置10は、図2に示すように、装置本体30と、装置本体30に接続された提げ紐40とを備えた構成とする。図示の構成において、使用者は、提げ紐40に首を通し、装置本体30を首から提げて装着する。
次に、本実施形態における発話者の識別方法について説明する。
本実施形態のシステムは、端末装置10に設けられた2つのマイクロフォン11、12により取得された音声の情報を用いて、端末装置10の装着者自身の発話音声(自己の発話音声)と他者の発話音声とを識別する。言い換えれば、本実施形態は、取得音声の発話者に関して自他の別を識別する。また、本実施形態では、取得音声の情報のうち、形態素解析や辞書情報を用いて得られる言語情報ではなく、音圧(マイクロフォン11、12への入力音量)等の非言語情報に基づいて発話者を識別する。言い換えれば、言語情報により特定される発話内容ではなく、非言語情報により特定される発話状況から音声の発話者を識別する。
図3に示す関係において、装着者の口(発声部位)である音源aと第1マイクロフォン11との間の距離をLa1、音源aと第2マイクロフォン12との間の距離をLa2とする。また、他者の口(発声部位)である音源bと第1マイクロフォン11との間の距離をLb1、音源bと第2マイクロフォン12との間の距離をLb2とする。この場合、次の関係が成り立つ。
La1>La2(La1≒1.5×La2〜4×La2)
Lb1≒Lb2
上述したように、音圧は、マイクロフォン11、12と音源との間の距離に応じて距離減衰する。図4において、距離La1の場合の音圧Ga1と距離La2の場合の音圧Ga2とを比較すると、音圧Ga2は、音圧Ga1の4倍程度となっている。一方、距離Lb1と距離Lb2とが近似するため、距離Lb1の場合の音圧Gb1と距離Lb2の場合の音圧Gb2とは、ほぼ等しい。そこで、本実施形態では、この音圧比の差を用いて、取得音声における装着者自身の発話音声と他者の発話音声とを識別する。なお、図4に示した例では、距離Lb1、Lb2を60cmとしたが、ここでは音圧Gb1と音圧Gb2とがほぼ等しくなることに意味があり、距離Lb1、Lb2は図示の値に限定されない。
図4を参照して説明したように、装着者自身の発話音声に関して、第2マイクロフォン12の音圧Ga2は、第1マイクロフォン11の音圧Ga1の数倍(例えば4倍程度)である。また、他者の発話音声に関して、第2マイクロフォン12の音圧Ga2は、第1マイクロフォン11の音圧Ga1とほぼ等しい(1倍程度)。そこで、本実施形態では、第2マイクロフォン12の音圧と第1マイクロフォン11の音圧との比に閾値を設定する。そして、音圧比が閾値よりも大きい音声は装着者自身の発話音声と判断し、音圧比が閾値よりも小さい音声は他者の発話音声と判断する。図5に示す例では、閾値を2とし、音圧比Ga2/Ga1は閾値2を超えるので装着者自身の発話音声と判断され、音圧比Gb2/Gb1は閾値2よりも小さいので他者の発話音声と判断されている。
次に、本実施形態において、音声に含まれる複数の周波数の音波間の位相差を算出する方法について説明する。
図6は、音声に含まれる種々の周波数の音波について説明した図である。図6は、音声の一例として、「あ」の音を発声したときのパワースペクトルを示している。ここで図中横軸は、音声をフーリエ変換した後の周波数(Hz)であり、縦軸は、振幅を表わす。
図6に示すパワースペクトルによれば、このとき音声に含まれる音波は、約117Hzである基本周波数の音波の成分と、この基本周波数に対し整数倍の周波数となる倍音の音波の成分が含まれていることがわかる。なお図では、基本周波数となる音波の成分を図中(i)で示し、倍音となる音波の成分を、(ii)、(iii)、(iv)、(v)、(vi)、(vii)、(viii)、(ix)でそれぞれ示している。なおこの場合(i)〜(ix)で示した音波の周波数は、それぞれ約117Hz刻みとなる。
図7(a)〜(c)は、2つの周波数の音波を選択し、この2つの周波数における音波の位相差の概念について説明した図である。
図7(a)は、図6で示したパワースペクトルである。そして図7(b)は、横軸を時間とし、縦軸を振幅としたときの音波の波形を表わす。このうち「ω1」で示す音波は、図6において(i)で示した基本周波数の音波の波形である。そして「ω2」で示す音波は、図6において(ii)で示した倍音の周波数の音波の波形である。図示するように「ω1」と「ω2」は、ともに正弦波となる。
図8は、本実施形態における端末装置10の動作を示すフローチャートである。
図8に示すように、端末装置10のマイクロフォン11、12が音声を取得すると、各マイクロフォン11、12から取得音声に応じた電気信号(音声信号)が第1増幅器13および第2増幅器14へ送られる(ステップ101)。第1増幅器13および第2増幅器14は、マイクロフォン11、12からの音声信号を取得すると、信号を増幅して音声解析部15へ送る(ステップ102)。
ホスト装置20のデータ受信部21では、上述した解析結果の情報を含む音声に関する情報を受信する。
音声に関する情報を受信したホスト装置20では、データ解析部23において複数の端末装置10から送られた音声が解析され、装着者の間の距離が導出される。
以下に本実施の形態における装着者の間の距離を導出する具体的な方法について説明を行なう。ここでは二人の装着者が会話を行なっている場合について考える。
図では、二人の装着者として、装着者A(第1の装着者)と装着者B(第2の装着者)がおり、そして装着者Aが発声している場合を示している。なお説明の便宜上、ここでは装着者Aが装着する端末装置10を端末装置10Aとする。また装着者Bが装着する端末装置10を端末装置10Bとする。このとき端末装置10Aに備えられるマイクロフォン11、12は第1の音声取得手段として捉えることができ、端末装置10Bに備えられるマイクロフォン11、12は第2の音声取得手段として捉えることができる。
この状況において、装着者Aの発話音声は、時間の経過に従い、まず装着者Aの端末装置10Aにより捉えることができる。さらにその後、装着者Bの端末装置10Bより捉えることができる。
そして端末装置10Aおよび端末装置10Bでは、それぞれ「ω1」で示す音波と「ω2」で示す音波の位相差を得ることができる。これは「ω2−ω1」で示す正弦波の位相を得ることができると言い換えることもできる。
即ち、ここでは、複数の装着者の中の1人(装着者A)の発話音声を自己の発話音声として取得した場合に導出された位相差の位相と、これと同じ音声を他者の発話音声として取得した場合に導出された位相差の位相とを比較することで、装着者の間の距離を導出している。これは、音声を装着者Aのマイクロフォン11、12が自己の発話音声として取得し、装着者Aのマイクロフォン11、12で取得した音声と同じ音声を装着者Bのマイクロフォン11、12が他者の発話音声として取得した場合に、この音声についてそれぞれ導出された位相差の位相によって、装着者Aと装着者Bとの間の距離を導出すると言い換えることもできる。
図10は、本実施形態におけるホスト装置20の動作を示すフローチャートである。
以下、図1、図10を使用して本実施形態のホスト装置20の動作を説明する。
まずデータ受信部21が、複数の端末装置10から自他識別情報、図8のステップ112で選択した音声の周波数、ステップ113で算出した音波間の位相差を含む音声に関する情報を受信する(ステップ201)。そしてこの情報は、いったんデータ蓄積部22に蓄積される(ステップ202)。
装着者の会話関係を判定には、まずデータ解析部23は、端末装置10から送信された自他識別情報を基にして、自己発話であると識別したものを検知する(ステップ203)。
次にデータ解析部23は、自己発話であると検知した発話音声に対し、音波間の位相差を取得する(ステップ204)。
さらにデータ解析部23は、他者の発話であると検知したこの発話音声に対し、音波間の位相差を取得する(ステップ206)。
また上述した例では、説明をわかりやすくするため、発話音声の中から2つの異なる周波数の音波を選択し、この2つの音波の位相差を1つ求めていたが、これに限られるものではない。
図11は、発話音声の中から3つ以上の異なる周波数の音波を選択し、それぞれの周波数の音波を使用して、音波の位相差を複数求める第1の例について説明した図である。
図11では、(i)〜(ix)で示した周波数の音波について、隣接する周波数の音波をそれぞれ選択する場合を示している。即ちこの場合は、(i)と(ii)、(ii)と(iii)、(iii)と(iv)、(iv)と(v)、(v)と(vi)、(vi)と(vii)、(vii)と(viii)、および(viii)と(ix)で示した8組の周波数の音波を選択し、これらの位相差を求める。なおこれらの周波数の差は、図6で説明したように、約117Hzでほぼ一定となる。
そしてこれら8組の組毎に音波の位相差を使用することで、装着者の間の距離を求める。つまり8組の周波数の音波を選択することで、位相差も8通り得られる。さらにこれにより得られる装着者の間の距離も8通り導出できる。本実施の形態では、この導出された8通りの距離を装着者の間の仮の距離とし、そして仮の距離の平均を、最終的な装着者の間の距離とする。
このように平均化を行なうことで、装着者の間の距離をより精度よく求めることができる。
対して、本実施の形態では、異なる周波数の音波の周波数の差を利用するため、より高い周波数のものも組み合わせることができ、多様な組み合わせが可能である。よってこのような問題は生じにくい。
次に周期解について説明を行なう。
図12は、周期解について説明した図である。ここで横軸は、実際の装着者の間の距離である。また縦軸は、本実施の形態の方法により導出された装着者の間の距離である。ここでは例えば、実際の装着者の間の距離が2mであった場合に、本実施の形態の方法により得られた装着者の間の距離は、2mのみならず、−3.8m、−0.9m、4.9m、7.8mの場合もあることになっている。これは、上記2つの異なる周波数の音波の位相差は0〜2πの間を採るが、この位相差は、1周期ずれれば、また元の値に戻る。よって位相差が1周期ずれる毎にそれぞれ解が得られることになる。図12の場合では、この1周期の長さが2.9mであるため、2.9mピッチで周期的な解(周期解)が得られる。
本実施の形態では、この複数得られる解の中から正解を選択することが必要となる。正解を選択の方法の一例としては、装着者同士が会話をするための距離として、近すぎたり遠すぎたりする距離を排除することによって求める方法を採用することができる。そしてこれにより、2mを適切な距離として選択することができる。
また本実施の形態では、周期解の中から正解を選択する方法として、以下の方法を用いることができる。ここでは、発話音声の音波の中から選択する周波数を、図11の場合とは別の方法とすることで、周期解の中から正解をより選択しやすくする。
図13および図14(a)〜(b)は、周期解の中から正解を選択する方法の一例を説明した図である。
このうち図13は、発話音声の中から3つ以上の異なる周波数の音波を選択し、それぞれの周波数の音波を使用して、音波の位相差を複数求める第2の例について説明した図である。また図14(a)は、これにより導出される周期解について説明した図である。そして図14(b)は、図14(a)の一部を拡大した図である。
図13に示すように、ここでは、3組の周波数の音波を選択している。つまり(i)と(ii)で示した組(組1)、(iii)と(x)で示した組(組2)、および(v)と(xi)で示した組(組3)の周波数の音波を選択する。これらの3組の周波数の差は、それぞれ117Hz、19.5Hz、58.6Hzとなる。そしてこれらの組毎に、装着者の間の距離を求める。
また上述した例では、装着者Aと装着者Bとの距離を端末装置10Aと端末装置10Bとの距離を測定することで求めていたが、厳密には、導出される距離は、端末装置10Aと端末装置10Bとの距離にはならない。
図15は、端末装置10Aと端末装置10Bとの距離と、実際に導出される距離との関係について説明した図である。
装着者Aの口(発声部位)からの発話音声は、距離L1を伝搬し、装着者Aの端末装置10Aのマイクロフォン11に捉えられる。一方、装着者Aの発話音声は、距離L2を伝搬し、装着者Bの端末装置10Bのマイクロフォン11に捉えられる。よって、これらのマイクロフォン11により捉えられる装着者Aの発話音声を基にして、導出される距離は、L2−L1となる。これは、端末装置10Aと端末装置10Bとの距離(マイクロフォン11同士の距離)ΔLとは異なる。ただし、L2−L1とΔLとの差はわずかであるため、L2−L1≒ΔLとしても、問題が生じることは少ない。
まず装着者Aの口(発声部位)と、端末装置10Aのマイクロフォン11と、端末装置10Aのマイクロフォン11とを結ぶことで形成される三角形を考える。そしてこの三角形において、端末装置10Aのマイクロフォン11の箇所の角度をθとする。この場合、θ=90°と近似できるため、下記の(1)式が成り立つ。
ΔL=(L22―L12)1/2 …(1)
そしてこのような方法により求められたΔLを、補正後の装着者の間の距離とすることができる。
なお図10で説明を行った本実施形態におけるホスト装置20が行なう処理は、ソフトウェアとハードウェア資源とが協働することにより実現される。即ち、ホスト装置20に設けられた制御用コンピュータ内部の図示しないCPUが、ホスト装置20の各機能を実現するプログラムを実行し、これらの各機能を実現させる。
装着者Aおよび装着者Bに端末装置10Aおよび端末装置10Bをそれぞれ装着させ、装着者Aおよび装着者Bの距離を変更しつつ、装着者の間の距離を導出した。具体的には、図11における(i)と(ii)で示す117Hzと234Hzの周波数の音波用い、この2つの周波数の音波の位相差を使用して、装着者Aと装着者Bの間の距離を導出した。
結果を図16に示す。
図16では、横軸を実際の距離、縦軸を上記の方法により導出された距離として、この2つの間の関係を図示している。これによれば、装着者Aと装着者Bとの距離は、1m〜3mまでについて、ほぼ正確に測定できることがわかる。なおこの導出された装着者Aと装着者Bとの距離の誤差は、18.2cm以内であった。
Claims (7)
- 音声を取得し第1の装着者に装着された第1の音声取得手段および音声を取得し第2の装着者に装着された第2の音声取得手段によりそれぞれ取得された音声について、当該それぞれの音声に関する情報をそれぞれの装着者から取得する音声情報取得手段と、
前記第1の音声取得手段で取得した音声および当該第1の音声取得手段で取得した音声と同じ音声を前記第2の音声取得手段で取得した場合の音声がそれぞれの装着者の発話音声であるか他者の発話音声であるかを識別した情報である自他識別の情報と、当該第1の音声取得手段で取得した音声および当該第1の音声取得手段で取得した音声と同じ音声を当該第2の音声取得手段で取得した場合の音声に含まれる複数の周波数の正弦波間の位相差とに基づき、前記第1の装着者と前記第2の装着者との間の距離を導出する距離導出手段と、
を備えたことを特徴とする音声解析装置。 - 前記距離導出手段は、音声を第1の音声取得手段が自己の発話音声として取得し、当該第1の音声取得手段で取得した音声と同じ音声を第2の音声取得手段が他者の発話音声として取得した場合に、当該音声についてそれぞれ導出された前記位相差の位相によって、前記第1の装着者と前記第2の装着者との間の距離を導出することを特徴とする請求項1に記載の音声解析装置。
- 前記距離導出手段は、複数の前記位相差によって前記第1の装着者と前記第2の装着者との間の仮の距離をそれぞれ導出し、複数の当該仮の距離の平均を前記第1の装着者と前記第2の装着者との間の距離とすることを特徴とする請求項1または2に記載の音声解析装置。
- 前記距離導出手段は、複数の前記位相差によって前記第1の装着者と前記第2の装着者との間の仮の距離をそれぞれ導出し、複数の当該仮の距離の中から最も確度の高いものを選択して前記第1の装着者と前記第2の装着者との間の距離とすることを特徴とする請求項1乃至3の何れか1項に記載の音声解析装置。
- 音声を取得し装着者に装着された音声取得手段と、
前記音声取得手段で取得した音声が装着者の発話音声であるか他者の発話音声であるかを識別する自他識別手段と、
前記音声取得手段で取得した音声に含まれる複数の周波数の正弦波間の位相差を導出する位相差導出手段と、
前記自他識別手段からの自他識別の情報および前記位相差導出手段により導出された前記位相差の情報を含む音声に関する情報を送出する音声情報送出手段と、
を備えたことを特徴とする音声解析装置。 - 音声を取得し第1の装着者に装着された第1の音声取得手段と、
音声を取得し第2の装着者に装着された第2の音声取得手段と、
前記第1の音声取得手段で取得した音声および当該第1の音声取得手段で取得した音声と同じ音声を前記第2の音声取得手段で取得した場合の音声がそれぞれの装着者の発話音声であるか他者の発話音声であるかを識別した情報である自他識別の情報と、当該第1の音声取得手段で取得した音声および当該第1の音声取得手段で取得した音声と同じ音声を当該第2の音声取得手段で取得した場合の音声に含まれる複数の周波数の正弦波間の位相差とに基づき、前記第1の装着者と前記第2の装着者との間の距離を導出する距離導出手段と、
を備えたことを特徴とする音声解析システム。 - コンピュータに、
音声を取得し第1の装着者に装着された第1の音声取得手段および音声を取得し第2の装着者に装着された第2の音声取得手段によりそれぞれ取得された音声について、当該それぞれの音声に関する情報をそれぞれの装着者から取得する機能と、
前記第1の音声取得手段で取得した音声および当該第1の音声取得手段で取得した音声と同じ音声を前記第2の音声取得手段で取得した場合の音声がそれぞれの装着者の発話音声であるか他者の発話音声であるかを識別した情報である自他識別の情報と、当該第1の音声取得手段で取得した音声および当該第1の音声取得手段で取得した音声と同じ音声を当該第2の音声取得手段で取得した場合の音声に含まれる複数の周波数の正弦波間の位相差とに基づき、前記第1の装着者と前記第2の装着者との間の距離を導出する機能と、
を実現させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012211177A JP6003472B2 (ja) | 2012-09-25 | 2012-09-25 | 音声解析装置、音声解析システムおよびプログラム |
US13/777,432 US9368118B2 (en) | 2012-09-25 | 2013-02-26 | Voice analyzer, voice analysis system, and non-transitory computer readable medium storing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012211177A JP6003472B2 (ja) | 2012-09-25 | 2012-09-25 | 音声解析装置、音声解析システムおよびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014066579A JP2014066579A (ja) | 2014-04-17 |
JP6003472B2 true JP6003472B2 (ja) | 2016-10-05 |
Family
ID=50339726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012211177A Expired - Fee Related JP6003472B2 (ja) | 2012-09-25 | 2012-09-25 | 音声解析装置、音声解析システムおよびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9368118B2 (ja) |
JP (1) | JP6003472B2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5772448B2 (ja) * | 2011-09-27 | 2015-09-02 | 富士ゼロックス株式会社 | 音声解析システムおよび音声解析装置 |
WO2016078786A1 (de) * | 2014-11-19 | 2016-05-26 | Sivantos Pte. Ltd. | Verfahren und vorrichtung zum schnellen erkennen der eigenen stimme |
JP6515591B2 (ja) * | 2015-03-03 | 2019-05-22 | 富士ゼロックス株式会社 | 音声解析装置、音声解析システムおよびプログラム |
US9685156B2 (en) * | 2015-03-12 | 2017-06-20 | Sony Mobile Communications Inc. | Low-power voice command detector |
JP6592940B2 (ja) * | 2015-04-07 | 2019-10-23 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US10028051B2 (en) * | 2015-08-31 | 2018-07-17 | Panasonic Intellectual Property Management Co., Ltd. | Sound source localization apparatus |
WO2017064929A1 (ja) * | 2015-10-16 | 2017-04-20 | ソニー株式会社 | 情報処理装置及び情報処理システム |
DE102016203987A1 (de) * | 2016-03-10 | 2017-09-14 | Sivantos Pte. Ltd. | Verfahren zum Betrieb eines Hörgeräts sowie Hörgerät |
US10074359B2 (en) * | 2016-11-01 | 2018-09-11 | Google Llc | Dynamic text-to-speech provisioning |
US20190065608A1 (en) * | 2017-08-29 | 2019-02-28 | Lenovo (Singapore) Pte. Ltd. | Query input received at more than one device |
US11621738B1 (en) * | 2021-09-30 | 2023-04-04 | Shenzhen GOODIX Technology Co., Ltd. | Bidirectional phase-based distance estimation with crystal offset |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61209382A (ja) * | 1985-03-14 | 1986-09-17 | Nec Corp | 距離測定装置 |
JPH06186328A (ja) | 1992-12-21 | 1994-07-08 | Fujitsu Ltd | 超音波距離測定装置 |
JP3572391B2 (ja) * | 1999-08-04 | 2004-09-29 | 日産自動車株式会社 | 距離計測装置 |
JP2006042201A (ja) * | 2004-07-29 | 2006-02-09 | Advanced Telecommunication Research Institute International | 距離測定システム、距離測定方法ならびに通信装置 |
US8577048B2 (en) * | 2005-09-02 | 2013-11-05 | Harman International Industries, Incorporated | Self-calibrating loudspeaker system |
JP2007172423A (ja) * | 2005-12-23 | 2007-07-05 | Fuji Xerox Co Ltd | 発話状態検出装置および方法 |
CN101359473A (zh) * | 2007-07-30 | 2009-02-04 | 国际商业机器公司 | 自动进行语音转换的方法和装置 |
US7800541B2 (en) * | 2008-03-31 | 2010-09-21 | Golba Llc | Methods and systems for determining the location of an electronic device |
JP5129024B2 (ja) * | 2008-05-27 | 2013-01-23 | 株式会社船井電機新応用技術研究所 | 音声入力装置及び音声会議システム |
EP2297727B1 (en) * | 2008-06-30 | 2016-05-11 | Dolby Laboratories Licensing Corporation | Multi-microphone voice activity detector |
JP4527204B2 (ja) * | 2008-09-26 | 2010-08-18 | パナソニック株式会社 | 死角車両検出装置及びその方法 |
US8442833B2 (en) * | 2009-02-17 | 2013-05-14 | Sony Computer Entertainment Inc. | Speech processing with source location estimation using signals from two or more microphones |
JP2010283676A (ja) * | 2009-06-05 | 2010-12-16 | Sony Corp | 音声検出装置、音声検出方法及び撮像システム |
US8560309B2 (en) * | 2009-12-29 | 2013-10-15 | Apple Inc. | Remote conferencing center |
JP2011205324A (ja) | 2010-03-25 | 2011-10-13 | Nec Corp | 音声処理装置、音声処理方法およびプログラム |
US9305553B2 (en) * | 2010-04-28 | 2016-04-05 | William S. Meisel | Speech recognition accuracy improvement through speaker categories |
US9170325B2 (en) * | 2012-08-30 | 2015-10-27 | Microsoft Technology Licensing, Llc | Distance measurements between computing devices |
-
2012
- 2012-09-25 JP JP2012211177A patent/JP6003472B2/ja not_active Expired - Fee Related
-
2013
- 2013-02-26 US US13/777,432 patent/US9368118B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014066579A (ja) | 2014-04-17 |
US9368118B2 (en) | 2016-06-14 |
US20140088966A1 (en) | 2014-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6003472B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP6031761B2 (ja) | 音声解析装置および音声解析システム | |
JP6003510B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP5772447B2 (ja) | 音声解析装置 | |
KR102565882B1 (ko) | 복수의 마이크들을 포함하는 음향 출력 장치 및 복수의 마이크들을 이용한 음향 신호의 처리 방법 | |
JP2013135325A (ja) | 音声解析装置 | |
JP5867066B2 (ja) | 音声解析装置 | |
US8983843B2 (en) | Motion analyzer having voice acquisition unit, voice acquisition apparatus, motion analysis system having voice acquisition unit, and motion analysis method with voice acquisition | |
JP6007487B2 (ja) | 情報処理装置、情報処理システムおよびプログラム | |
JP6476938B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP6160042B2 (ja) | 位置特定システム | |
JP5862318B2 (ja) | 音解析装置、音解析システムおよびプログラム | |
JP6031767B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP6515591B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP5929810B2 (ja) | 音声解析システム、音声端末装置およびプログラム | |
JP2013083621A (ja) | 位置出力装置、位置出力システムおよびプログラム | |
JP2013140534A (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP2013164468A (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP6056544B2 (ja) | 音声解析装置、信号解析装置、音声解析システムおよびプログラム | |
JP6051996B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP2013072978A (ja) | 音声解析装置および音声解析システム | |
JP6369022B2 (ja) | 信号解析装置、信号解析システムおよびプログラム | |
JP2014050048A (ja) | 音声解析装置 | |
JP5948969B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP2014048618A (ja) | 音声解析装置、音声解析システムおよびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150306 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160204 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160301 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160328 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160809 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160822 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6003472 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |