JP6007487B2 - 情報処理装置、情報処理システムおよびプログラム - Google Patents
情報処理装置、情報処理システムおよびプログラム Download PDFInfo
- Publication number
- JP6007487B2 JP6007487B2 JP2011268288A JP2011268288A JP6007487B2 JP 6007487 B2 JP6007487 B2 JP 6007487B2 JP 2011268288 A JP2011268288 A JP 2011268288A JP 2011268288 A JP2011268288 A JP 2011268288A JP 6007487 B2 JP6007487 B2 JP 6007487B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- wearer
- microphone
- speaker
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Details Of Audible-Bandwidth Transducers (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Description
特許文献2には、複数のマイクロホンで受音した信号を処理し、音源の位置を推定する方法において、まず、受音信号の相互相関関数を全てのマイクロホンの組について計算し、次に、上記相互相関関数について、基準マイクロホンと他のマイクロホンとの間の相互相関関数の最大値を与える時間差を求め、これを予備推定時間差とし、そして、全てのマイクロホンについての遅延和のパワーを最大にする時間差を上記予備推定時間差の近傍で探索して、これを推定時間差とし、最後に、上記推定時間差に基づいて音源位置を計算する音源位置推定方法が開示されている。
請求項3に記載の発明は、話者の音声を取得する少なくとも2以上の音声取得手段と、
前記少なくとも2以上の音声取得手段が取得した話者の音声の情報に基づいて、話者が本対面角度出力手段を装着する装着者か当該装着者とは異なる人である他者かを識別した自他識別情報と、当該装着者と当該話者との向き合う角度である対面角度の情報とを取得する取得手段と、前記取得手段により取得された前記自他識別情報と前記対面角度の情報とを送信する送信手段と、を備える対面角度出力手段と、前記対面角度出力手段の前記送信手段により送信された前記自他識別情報と前記対面角度の情報とを受信する受信手段と、前記受信手段が受信した前記自他識別情報と前記対面角度の情報とに基づいて、前記装着者と前記他者との対話状況を特定する特定手段と、を備えることを特徴とする情報処理システムである。
請求項3の発明によれば、装着者と他者の対話状況を特定することができるシステムを構築できる。
請求項4の発明によれば、装着者と他者の対話状況を特定することができるシステムを構築できる。
請求項5の発明によれば、装着者と他者の対話状況を特定することができる機能をコンピュータにより実現できる。
<システム構成例>
図1は、本実施形態による対面角度出力システムの構成例を示す図である。
図1に示すように、本実施形態の対面角度出力システム1は、対面角度出力装置の一例である端末装置10とホスト装置20とを備えて構成される。端末装置10とホスト装置20とは、無線通信回線を介して接続されている。無線通信回線の種類としては、Wi−Fi(Wireless Fidelity)、Bluetooth(登録商標)、ZigBee、UWB(Ultra Wideband)等の既存の方式による回線を用いて良い。また、図示の例では、端末装置10が1台のみ記載されているが、詳しくは後述するように、端末装置10は、使用者各人が装着して使用するものであり、実際には使用者数分の端末装置10が用意される。
本実施形態の第1マイクロフォン11a、第2マイクロフォン11b、第3マイクロフォン11cとして用いられるマイクロフォンの種類としては、ダイナミック型、コンデンサ型等、既存の種々のものを用いて良い。とくに無指向性のMEMS(Micro Electro Mechanical Systems)型マイクロフォンが好ましい。
図2は、端末装置10の構成例を示す図である。
上記のように、端末装置10は、各使用者に装着されて使用される。使用者が装着可能とするため、本実施形態の端末装置10は、図2に示すように、装置本体30と、装置本体30に両端が接続することにより環形状をなす提げ紐40とを備えた構成とする。図示の構成において、使用者は、提げ紐40に首を通し、装置本体30を首から提げて装着する。そのため本実施の形態では、装置本体30および提げ紐40を「人間の首に掛けられる部材」と表現できる。また本実施の形態では、端末装置10を装着する使用者を装着者として表現することがある。
以上の構成において、話者が装着者か装着者以外の者である他者であるかを識別(自他識別)する方法について説明する。
本実施形態のシステムは、端末装置10に設けられたマイクロフォンのうち、例えば、第1マイクロフォン11aと第3マイクロフォン11cにより収録された音声の情報を用いて、端末装置10の装着者自身の発話音声と他者の発話音声とを識別する。言い換えれば、本実施形態は、収録音声の発話者に関して自他の別を識別する。また、本実施形態では、収録音声の情報のうち、形態素解析や辞書情報を用いて得られる言語情報ではなく、音圧(第1マイクロフォン11aと第3マイクロフォン11cへの入力音量)等の非言語情報に基づいて発話者を識別する。言い換えれば、言語情報により特定される発話内容ではなく、非言語情報により特定される発話状況から音声の発話者を識別する。
また上述した例では、第1マイクロフォン11aおよび第3マイクロフォン11cによる収録音声の音圧を基に自他識別の判断を行なったが、これに収録音声の位相差の情報を加味することも考えられる。つまり装着者の口(発声部位)を音源とすると、上述した通り、第1マイクロフォン11aと音源との間の距離と、第3マイクロフォン11cと音源との間の距離は大きく異なる。そのため第1マイクロフォン11aによる収録音声と、第3マイクロフォン11cによる収録音声の位相差は大きくなる。一方、装着者以外の者(他者)の口(発声部位)を音源とした場合は、上述の通り、他者が装着者から離れているため、第1マイクロフォン11aと音源との間の距離と、第3マイクロフォン11cと音源との間の距離は、大きく変わらない。そのため第1マイクロフォン11aによる収録音声と、第3マイクロフォン11cによる収録音声の位相差は小さくなる。よって第1マイクロフォン11aおよび第3マイクロフォン11cによる収録音声の位相差を考慮することで自他識別の判断の精度が向上する。
図3は、本実施の形態における対面角度について説明した図である。
本実施の形態において対面角度とは、端末装置10の装着者と話者との向き合う角度である。そして本実施の形態で定義される対面角度の一例として図3では、水平方向の対面角度を示している。つまり図3は、装着者と話者を頭上から見た図である。そして本実施の形態は、本実施の形態では、対面角度αとして、2個の音声取得手段である第1マイクロフォン11aと第2マイクロフォン11bとを結ぶ線分と、この線分の中点および話者を結ぶ線分との角度を採用する。これにより対面角度の数学的取り扱いがより簡単になる。そしてこの定義を採用した場合、例えば、装着者と話者とがそれぞれ正面を向いて対向しているときは、この二人の対面角度αは、90°となる。
図4は、第1マイクロフォン11aおよび第2マイクロフォン11bを使用して対面角度αを求める方法について説明した図である。
ここで、点Sが話者の位置、より正確には、話者の音声の音源である発声点の位置であるとする。そして発声点から発した音声は、点Sから同心円状に広がる。ただし音声は有限の速度である音速で広がるため音声が第1マイクロフォン11aに到達した時間と第2マイクロフォン11bに到達した時間とは異なり、音声の行路差δに対応した時間差Δtが生じる。そして第1マイクロフォン11aと第2マイクロフォン11bとの間の距離をD、中点Cと点Sの間の距離をLとするとこれらの間には次の(1)式が成立する。
図5(a)〜(c)は、本実施の形態において時間差Δtを求める方法を説明した図である。このうち図5(a)は、第1マイクロフォン11aと第2マイクロフォン11bに到達する話者の音声をサンプリング周波数1MHzでサンプリングし、そのデータの中から連続する5000ポイントを抜き出した図である。
ここで横軸は5000ポイントのデータにそれぞれに付けられたデータ番号を表わし、縦軸は、話者の音声の振幅を表わす。そして実線は、第1マイクロフォン11aに到達した話者の音声の波形信号であり、点線は、第2マイクロフォン11bに到達した話者の音声の波形信号である。
図5(c)に示すようにデータ番号0を基準にしてピーク位置は、−227ポイントずれている。これは第1マイクロフォン11aを基準にして第2マイクロフォン11bに到達する話者の音声が、この分遅延して到達することを意味する。本実施の形態においてサンプリング周波数は、上述の通り1MHzなので、サンプリングした各データ間の時間は、1×10−6(s)である。よってこの遅延時間としては227×1×10−6(s)=227(μs)となる。つまりこの場合、時間差Δtは、227(μs)である。
図6により例えば、装着者と話者とが正面同士で向き合っているとき、つまり対面角度αが90°の場合は、時間差Δtは、0であり、対面角度αが90°の場合からずれるに従い時間差Δtは大きくなることがわかる。
なお対面角度αは、上述のようにして算出してもよいが、例えば、図6を基にして時間差Δtに対する対面角度αをLUT(Look up Table)として、端末装置10内に保持しておき、Δtを求めた後、このLUTを参照することにより対面角度αを求めてもよい。
まずマイクロフォン11a、11b、11cが、話者の音声を取得する(ステップ101)。そして第1増幅器13a、第2増幅器13b、第3増幅器13cがそれぞれマイクロフォン11a、11b、11cからの音声信号を増幅する(ステップ102)。
次に増幅された音声信号は、音声解析部15に送られ、上述した手法により話者が他者であるか否かを判断する(ステップ103)。話者が装着者であると識別(即ち他者ではないと識別)された場合(ステップ103でNo)は、ステップ101に戻る。一方、話者が他者であると識別された場合(ステップ103でYes)は、図5で説明した手法により、まず第1マイクロフォン11aと第2マイクロフォン11bに話者の音声が到達する時間差Δtが求められる(ステップ104)。さらに図4で説明した手法により、この時間差Δtおよび第1マイクロフォン11aと第2マイクロフォン11bが離間する距離Dに基づいて、装着者と話者との向き合う角度である対面角度αを求める(ステップ105)。この対面角度αの情報は、データ送信部16によりホスト装置20に出力する(ステップ106)。
図8(a)〜(b)は、実際に使用される端末装置10の具体例を示した図である。
このうち図8(a)は、図2に示した端末装置10と同様のものであり、第1マイクロフォン11a、第2マイクロフォン11b、第3マイクロフォン11cの3つのマイクロフォンを配したものである。そして第1マイクロフォン11aと第2マイクロフォン11bとの距離D12を10cmとし、第2マイクロフォン11bと第3マイクロフォン11cの距離D23および第3マイクロフォン11cと第1マイクロフォン11aの距離D31を共に35cmとしている。
さらにこの形態によれば、複数の対面角度αを出力することができる。つまり3つのマイクロフォンにより2つのマイクロフォンからなる組を3つ構成することができるため、これにより3通りの対面角度αが出力できることになる。よって本実施の形態では、水平方向の角度のみならず、第2マイクロフォン11bと第3マイクロフォン11cの組または第3マイクロフォン11cと第1マイクロフォン11aの組を使用することで、上下方向の対面角度αが可能となる。つまり本構成によれば、音声解析部15(図1参照)は、2つのマイクロフォンからなる組を2組以上使用することにより複数の対面角度を出力することができる。
図8(b)は、マイクロフォンが2箇所に配された端末装置10について説明した図である。
図8(b)に示した端末装置10では、図8(a)に示した端末装置10に対し、第1マイクロフォン11aは同様の位置に配置されている。一方、第2マイクロフォン11bは、図8(a)における第3マイクロフォン11cがあった位置に配置されている。つまり第2マイクロフォン11bは、ケース31に設けられ、第1マイクロフォン11aとの距離D12を35cmとしている。さらに図8(a)における第2マイクロフォン11bがあった位置には、マイクロフォンは配置されていない。この端末装置10では、第1マイクロフォン11aと第2マイクロフォン11bは、装着者の口からの距離が互いに異なる2つのマイクロフォン、および水平方向の距離が離れた2つのマイクロフォンの双方を兼ねている。
一方、対面角度についても同様に出力することができる。ただしこの対面角度は、第1マイクロフォン11aと第2マイクロフォン11bとを結ぶ線を通る面を基準としたものとなる。よって水平面を基準とした対面角度を求めるためには、第1マイクロフォン11aと第2マイクロフォン11bとを結ぶ線と水平面との角度を予め把握しておき、それを基に角度の補正をすればよい。ただし、この補正は必ずしも行なう必要はない。
ここで装着者と話者との関係として判定を行なう事項としては、例えば、装着者と他者とのコミュニケーション関係である。例えば、装着者と話者が近い距離に位置し、さらに対面角度の情報により向き合っていることがわかれば、装着者と話者が会話を行なっている可能性が高い。また装着者と話者が反対方向を向いていれば、会話を行なっていない可能性が高い。実際には、他に話者や装着者の音声が取得されるタイミングや、間合いなど他の情報も使用して判定が行なわれる。また装着者と話者との関係として、上下方向の対面角度を使用して、一方が他方を上から見下ろしている関係にあるなどの判定も可能である。また複数の端末装置10からの情報をもとに、会話を行っている複数人の間での位置の相互関係などの処理をしても良い。
なお図7で説明を行った本実施の形態における端末装置10が行なう処理は、ソフトウェアとハードウェア資源とが協働することにより実現される。即ち、端末装置10に設けられた制御用コンピュータ内部の図示しないCPUが、端末装置10の各機能を実現するプログラムを実行し、これらの各機能を実現させる。
Claims (5)
- 話者の音声を取得する少なくとも2以上の音声取得手段が取得した話者の音声の情報に基づいて、話者が端末装置を装着する装着者か当該装着者とは異なる人である他者かを識別した自他識別情報と、当該装着者と当該他者との向き合う角度である対面角度の情報とを取得する取得手段と、
前記取得手段が取得した前記自他識別情報と前記対面角度の情報とに基づいて、前記装着者と前記他者との対話状況を特定する特定手段と、
を備えたことを特徴とする情報処理装置。 - 前記特定手段は、前記装着者と前記他者とが会話を行なっているか否かを特定することを特徴とする請求項1記載の情報処理装置。
- 話者の音声を取得する少なくとも2以上の音声取得手段と、
前記少なくとも2以上の音声取得手段が取得した話者の音声の情報に基づいて、話者が本対面角度出力手段を装着する装着者か当該装着者とは異なる人である他者かを識別した自他識別情報と、当該装着者と当該話者との向き合う角度である対面角度の情報とを取得する取得手段と、
前記取得手段により取得された前記自他識別情報と前記対面角度の情報とを送信する送信手段と、
を備える対面角度出力手段と、
前記対面角度出力手段の前記送信手段により送信された前記自他識別情報と前記対面角度の情報とを受信する受信手段と、
前記受信手段が受信した前記自他識別情報と前記対面角度の情報とに基づいて、前記装着者と前記他者との対話状況を特定する特定手段と、
を備えることを特徴とする情報処理システム。 - 話者の音声を取得する少なくとも2以上の音声取得手段と、
前記少なくとも2以上の音声取得手段により取得された前記音声の情報を送信する送信手段と、
前記送信手段により送信された前記音声の情報を受信する受信手段と、
前記受信手段により受信された複数の前記音声の情報に基づいて、話者が端末装置を装着する装着者か当該装着者とは異なる人である他者かを識別した自他識別情報と、当該装着者と当該他者との向き合う角度である対面角度の情報とを取得する取得手段と、
前記取得手段が取得した前記自他識別情報と前記対面角度の情報とに基づいて、前記装着者と前記他者との対話状況を特定する特定手段と、
を備えることを特徴とする情報処理システム。 - コンピュータに、
話者の音声を取得する少なくとも2以上の音声取得手段が取得した話者の音声の情報に基づいて、話者が端末装置を装着する装着者か当該装着者とは異なる人である他者かを識別した自他識別情報と、当該装着者と当該他者との向き合う角度である対面角度の情報とを取得する機能と、
取得した前記自他識別情報と前記対面角度の情報とに基づいて、前記装着者と前記他者との対話状況を特定する機能と、
を実現させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011268288A JP6007487B2 (ja) | 2011-12-07 | 2011-12-07 | 情報処理装置、情報処理システムおよびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011268288A JP6007487B2 (ja) | 2011-12-07 | 2011-12-07 | 情報処理装置、情報処理システムおよびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013121078A JP2013121078A (ja) | 2013-06-17 |
JP6007487B2 true JP6007487B2 (ja) | 2016-10-12 |
Family
ID=48773525
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011268288A Active JP6007487B2 (ja) | 2011-12-07 | 2011-12-07 | 情報処理装置、情報処理システムおよびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6007487B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9700766B2 (en) | 2013-04-01 | 2017-07-11 | Acushnet Company | Golf club head with improved striking face |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6766086B2 (ja) | 2017-09-28 | 2020-10-07 | キヤノン株式会社 | 撮像装置およびその制御方法 |
CN111527446B (zh) * | 2017-12-26 | 2022-05-17 | 佳能株式会社 | 摄像设备及其控制方法和记录介质 |
JP7292853B2 (ja) * | 2017-12-26 | 2023-06-19 | キヤノン株式会社 | 撮像装置及びその制御方法及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11304906A (ja) * | 1998-04-20 | 1999-11-05 | Nippon Telegr & Teleph Corp <Ntt> | 音源位置推定方法およびそのプログラムを記録した記録媒体 |
JP3598932B2 (ja) * | 2000-02-23 | 2004-12-08 | 日本電気株式会社 | 話者方向検出回路及びそれに用いる話者方向検出方法 |
JP2007108518A (ja) * | 2005-10-14 | 2007-04-26 | Sharp Corp | 音声録音再生装置 |
JP4557919B2 (ja) * | 2006-03-29 | 2010-10-06 | 株式会社東芝 | 音声処理装置、音声処理方法および音声処理プログラム |
JP5339501B2 (ja) * | 2008-07-23 | 2013-11-13 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声収集方法、システム及びプログラム |
-
2011
- 2011-12-07 JP JP2011268288A patent/JP6007487B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9700766B2 (en) | 2013-04-01 | 2017-07-11 | Acushnet Company | Golf club head with improved striking face |
Also Published As
Publication number | Publication date |
---|---|
JP2013121078A (ja) | 2013-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111512646B (zh) | 低延迟音频增强的方法和设备 | |
US8892424B2 (en) | Audio analysis terminal and system for emotion estimation of a conversation that discriminates utterance of a user and another person | |
JP6003472B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP5772447B2 (ja) | 音声解析装置 | |
JP6031761B2 (ja) | 音声解析装置および音声解析システム | |
JP6003510B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP2013135325A (ja) | 音声解析装置 | |
JP6007487B2 (ja) | 情報処理装置、情報処理システムおよびプログラム | |
JP5867066B2 (ja) | 音声解析装置 | |
JP2018025855A (ja) | 情報処理サーバ、情報処理装置、情報処理システム、情報処理方法、およびプログラム | |
US8983843B2 (en) | Motion analyzer having voice acquisition unit, voice acquisition apparatus, motion analysis system having voice acquisition unit, and motion analysis method with voice acquisition | |
JP6031767B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP6476938B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP5862318B2 (ja) | 音解析装置、音解析システムおよびプログラム | |
JP2014044172A (ja) | 位置特定システムおよび端末装置 | |
JP6191747B2 (ja) | 音声解析装置および音声解析システム | |
JP6515591B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP2013083621A (ja) | 位置出力装置、位置出力システムおよびプログラム | |
JP5929810B2 (ja) | 音声解析システム、音声端末装置およびプログラム | |
JP2013140534A (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP2013164468A (ja) | 音声解析装置、音声解析システムおよびプログラム | |
US20130080170A1 (en) | Audio analysis apparatus and audio analysis system | |
JP5948969B2 (ja) | 音声解析装置、音声解析システムおよびプログラム | |
JP6056544B2 (ja) | 音声解析装置、信号解析装置、音声解析システムおよびプログラム | |
JP6369022B2 (ja) | 信号解析装置、信号解析システムおよびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141121 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160105 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160303 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160816 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160829 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6007487 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |