JP3598384B2

JP3598384B2 - 三者会話データ収録装置

Info

Publication number: JP3598384B2
Application number: JP2002269608A
Authority: JP
Inventors: 克也高梨; 均井佐原; 雅光柴田
Original assignee: National Institute of Information and Communications Technology
Current assignee: National Institute of Information and Communications Technology
Priority date: 2002-09-17
Filing date: 2002-09-17
Publication date: 2004-12-08
Anticipated expiration: 2022-09-17
Also published as: JP2004110898A

Description

【０００１】
【発明の属する技術分野】
本発明は、三者間における対話進行のメカニズムの解明を行う際に用いる三者会話データ収録装置に関するものである。
【０００２】
【従来の技術】
近年、インターネットがビジネスと同様、生活にも使われ始められるようになり、今後、健常者、高齢者、障害者を含め益々多くの人が利用・参加できるものにするために、人間とコンピュータとの間における会話を行う対話システムの開発が活発に行われるようになってきている。このような対話システムの開発には、対話進行のメカニズムの解明に必要不可欠な対話コーパスが用いられている（例えば、特許文献１参照。）。
【０００３】
【特許文献１】
特表２００１−５１６９０５号公報（段落番号０００２〜０００４）
【０００４】
【発明が解決しようとする課題】
しかしながら、従来の対話コーパスは二者間の課題指向的対話を収録したものが大半であり、対話の基本構造を定式化する上で、二者対話に基づく分析では不十分な点が多く、三者以上の参与者を含むコミュニケーションツールの開発や対話規則についての理論的研究のための基礎的データとして、三者会話コーパスの構築が重要とされているが、この三者間における会話を収録するに有用な収録装置の提供がなされていなかった。
【０００５】
そこで、本発明は、上述する問題を解決することを主たる課題とするものである。
【０００６】
【課題を解決するための手段】
すなわち、本発明は、三者間における会話を収録する三者会話データ収録装置であって、各話者の音声を各々収音する収音部と、前記収音部で収音する各話者の音声を異なる二者毎の組にして録音する録音部と、前記収音部で収音する他の二者の音声をその収音時に一の話者各々に対して出力する音声出力部とを具備することを特徴とする。
【０００７】
このような構成によれば、録音部に組みにして録音した二者毎の組にした話者間における対話進行を分析でき、さらに、この分析した二者毎の話者間における対話進行に基づき、三者間における対話進行の過程の分析を好適に行うことができるといった、対話コーパスの作成に有用な三者会話データ収録装置を提供することができる。
【０００８】
なお、複数の話者が重複して発話した場合でも、収音した各話者の音声の聞き分けを確実に行うためには、前記収音部が、各々の話者の音声を他の話者の音声と混同しないように収音することが望ましい。
【０００９】
また、前記収音部が各話者の収音時に、音響出力部から出力される他者の音声が混同することを防止するためには、各話者毎に対をなす二つの音声出力部を備え、この対をなす二つの音声出力部を、各話者の両耳にそれぞれ直接取り付けあるいは近傍に配置していることが好ましい。
【００１０】
さらに、前記音声出力部の取り付け状態による不自然さ等を感じさせず自然な会話を促すためには、前記音声出力部が、前記収音部で収音する他の話者の音声出力レベルを、前記他の話者が位置する方向の耳に対して大きく前記他の話者が位置しない方向の耳に対して小さくなるようにレベル調整し一の話者の両耳に対して出力し、さらに、他の話者を映した映像を表示する画像出力部を備え、前記音声出力部が、前記収音部で収音する他の話者の音声出力レベルを、前記画像出力部に表示する他者の映像の位置に合致させて出力すればよい。また、他の話者を映した映像を表示する画像出力部を備え、前記音声出力部が、前記収音部で収音する他の二者の音声を、前記画像出力部に表示される前記他の二者の話者間における左右の位置関係と一致させて一の話者の両耳に出力するといった態様も考えられる。
【００１１】
なお、話者に違和感等を覚えさせることなく自然な会話を行わせるためには、前記音声出力部を、自分の音声が自分に聞こえるように、前記収音部で収音する話者の音声をその話者へ出力するように構成すればよく、さらに、三者間における円滑な会話を実現させるためには、前記音声出力部が、三者間の会話を促す第四の話者の音声を前記各話者に出力することが望まれる。
【００１２】
また、本発明の三者会話データ収録装置を構成する各部のレベル調整を行うためには、前記録音部の録音レベルや前記音声出力部の音声出力レベルを調整可能な正弦波等の基準信号を出力する基準信号出力部を具備すればよい。
【００１３】
さらに、会話の全体を好適に把握するためには、会話時の前記各話者の音声と各話者が映った映像とを収録する総合収録部を備えればよい。
【００１４】
なお、収音した音声データを好適に整理・分析するためには、前記録音部で収録する音声が、所定のサンプリング周波数でサンプリングし所定の値で量子化してデジタルデータ化したものであることが好ましく、特に、前記録音部で収録する音声が、記録媒体における録音位置を絶対的あるいは相対的に指定可能なタイムコードとともに収録したものであることが望まれる。
【００１５】
また、前記録音部に、異なる二者の音声を各チャンネルに分離して収録する３台の２チャンネル録音機を用いれば、本発明の三者会話データ収録装置を簡単に構成することができる。
【００１６】
【発明の実施の形態】
以下、図面を用いて本発明の実施形態について説明する。
【００１７】
図１は、本発明の三者会話データ収録装置Ａを構成する音声系統図を示す図である。図２は、本発明の三者会話データ収録装置Ａを構成する映像系統図を示す図である。図３は、本発明の三者会話データ収録装置Ａにおける収録の実施態様を示す図である。
【００１８】
本発明の三者会話データ収録装置Ａは、図１、図２及び図３に示すように、３人の話者１ａ、１ｂ、１ｃ（以下、「話者１」と総称する。）それぞれの音声Ａ、Ｂ、Ｃを収音する収音部たるマイクロホン２ａ、２ｂ、２ｃ（以下、「マイクロホン２」と総称する。）と、このマイクロホン２で収音する各話者１の音声Ａ、Ｂ、Ｃを異なる二者毎の組みにして録音する録音部３と、各話者１の両耳に取り付ける対をなす音声出力部たる音声出力ユニットを設けたヘッドホン４ａ、４ｂ、４ｃ（以下、「ヘッドホン４」と総称する。）と、前記話者１の会話を促す第４の話者たるオペレータ１ｄの音声Ｄを収音するマイクロホン２ｄと、前記マイクロホン２で収音する話者１の音声Ｄを前記オペレータ１ｄに対して出力するヘッドホン４ｄと、前記収音部２で収音する各話者１の音声Ａ、Ｂ、Ｃを調整し前記録音部３やヘッドホン４に出力する音響調整部５と、前記録音部３やヘッドホン４のレベル調整を行うための基準信号を出力する基準信号出力部６と、前記話者１の音声等を収録し会話全体の全体像を把握するための総合収録部７とを主な構成要素としている。そして、各々の話者１の音声Ａ、Ｂ、Ｃが他の話者１の音声Ａ、Ｂ、Ｃと混同しないように各話者１をそれぞれ入室させる３室から成る防音ボックスＳａ、Ｓｂ、Ｓｃ（以下、「防音ボックスＳ」と総称する。）を設け、前記各部の全体又はその主要部をこの防音ボックスＳ内に配置するとともに、各話者１の対面する環境を創出するための、各話者１ａ、１ｂ、１ｃをそれぞれ撮影するビデオカメラＶａ、Ｖｂ、Ｖｃ（以下、「ビデオカメラＶ」と総称する。）と、このビデオカメラＶで映した他者の映像を表示する画像出力部８とを備えている。
【００１９】
以下、各部を詳述する。
【００２０】
マイクロホン２は、各話者１毎の音声Ａ、Ｂ、Ｃを収音するものであって、話者１ａの音声Ａを収音するマイクロホン２ａと、話者１ｂの音声Ｂを収音するマイクロホン２ｂと、話者１ｃの音声Ｃを収音するマイクロホン２ｃとを、それぞれの話者１ａ、１ｂ、１ｃの近傍に配置している。
【００２１】
録音部３は、異なる二者の音声を各チャンネルに分離して収録する入力チャンネルを２チャンネル有する３台の２チャンネル録音機３ａ、３ｂ、３ｃで構成されるものである。なお、本実施形態では、この２チャンネル録音機に一般的なＤＡＴレコーダを用い、このＤＡＴレコーダに挿入する記録媒体たるデジタルオーディオテープ（以下、「ＤＡＴ」とする。）に各音声を収録するようにしている。より具体的には、２チャンネル録音機３ａには、一方のチャンネルに話者１ａの音声Ａを他方のチャンネルに話者１ｂの音声Ｂを録音するように設定している。２チャンネル録音機３ｂには、一方のチャンネルに話者１ｂの音声Ｂを他方のチャンネルに話者１ｃの音声Ｃを録音するように設定している。２チャンネル録音機３ｃには、一方のチャンネルに話者１ｃの音声Ｃを他方のチャンネルに話者１ａの音声Ａを録音するように設定している。なお、本実施形態では、前記２チャンネル録音機３ａ、３ｂ、３ｃの各チャンネルにおいて、各話者１の音声をサンプリング周波数が４８ｋＨｚ、１６ｂｉｔで量子化したデジタルデータでＤＡＴに録音するように設定している。
【００２２】
ヘッドホン４は、前記マイクロホン２で収音する他の二者の音声をその収音時に一の話者１各々に対して出力するものであって、各話者１の両耳に取り付ける各々のヘッドホン４には、それぞれ対をなし異なる出力レベルで出力可能な音声出力ユニットが設けられている。より具体的には、話者１ａの左耳及び右耳にそれぞれ音声出力ユニット４ａＬ、４ａＲが取り付けられ、話者１ｂの左耳及び右耳にそれぞれ音声出力ユニット４ｂＬ、４ｂＲが取り付けられ、話者１ｃの左耳及び右耳にそれぞれ音声出力ユニット４ｃＬ、４ｃＲが取り付けられるように構成している。また、本実施形態では、オペレータ１ｄの左耳及び右耳にそれぞれ同様の音声出力ユニット４ｄＬ、４ｄＲを設けている。
【００２３】
音響調整部５は、複数の音声や映像を混合したり調整したりする一般的な音響ミキサを一又は複数台接続することにより、前記マイクロホン２で収音する各話者１の音声Ａ、Ｂ、Ｃを混合したりその周波数特性等を調整したりするものであって、本実施形態では、図示しない五台の音響ミキサのうち、四台を各話者１ａ、１ｂ、１ｃ及びオペレータ１ｄの近傍に配置し、他の一台を前記四台のミキサにそれぞれ接続し得るように配置して、これら五台の音響ミキサを適宜接続することにより、この音響調整部５を構成している。そして、この音響調整部５に、前記マイクロホン２で収音する各話者１の音声Ａ、Ｂ、Ｃ及びマイクロホン２ｄで収音するオペレータ１ｄの音声Ｄと前記基準信号出力部６が出力する基準信号等を入力する入力チャンネルと、この入力チャンネルに入力される前記音声Ａ、Ｂ、Ｃ、Ｄ等を混合したりその周波数特性等を調整したりする図示しない音響特性調整部と、この音響特性調整部で調整等が行われた出力信号を出力する出力チャンネルとを備えるようにしている。より具体的には、前記音響特性調整部を適宜調整することにより、入力チャンネルから入力する話者１ａの音声Ａを、２チャンネル録音機３ａの一方のチャンネル及び２チャンネル録音機３ｃの一方のチャンネルに対して、他の話者１ｂ、１ｃの音声Ｂ、Ｃと分離した状態で出力するように設定している。同様に、入力チャンネルから入力する話者１ｂの音声Ｂを、２チャンネル録音機３ａの一方のチャンネル及び２チャンネル録音機３ｂの一方のチャンネルに対して、他の話者１ａ、１ｃの音声Ａ、Ｃと分離した状態で出力するように設定している。また、入力チャンネルから入力する話者１ｃの音声Ｃを、２チャンネル録音機３ｂの一方のチャンネル及び２チャンネル録音機３ｃの一方のチャンネルに対して、他の話者１ａ、１ｂの音声Ａ、Ｂと分離した状態で出力するように設定している。
【００２４】
さらに、前記音響特性調整部を適宜調整することにより、各話者の両耳に直接取り付けている対をなす二つの音声出力ユニットそれぞれに、画像出力部８に表示する他の二者の映像と一致するように出力レベルを調節して出力するように設定している。より具体的には、本実施形態では、後述する画像出力部８に表示する他の二者が映った映像と一致させ、話者１ａの左耳に直接取り付けた音声出力ユニット４ａＬには話者１ｃの音声Ｃを出力し、その右耳に直接取り付けた音声出力ユニット４ａＲには話者１ｂの音声Ｂを出力するように設定している。同様に、話者１ｂの左耳に直接取り付けた音声出力ユニット４ｂＬには話者１ａの音声Ａを出力し、その右耳に直接取り付けた音声出力ユニット４ｂＲには話者１ｃの音声Ｃを出力するように設定している。また、話者１ｃの左耳に直接取り付けた音声出力ユニット４ｃＬには話者１ｂの音声Ｂを出力し、その右耳に直接取り付けた音声出力ユニット４ｃＲには話者１ａの音声Ａを出力するように設定している。
【００２５】
さらにまた、本実施形態では、前記音響特性調整部を適宜調整することにより、各話者１が自分の音声を自分でも聴くことができるように各自のヘッドホン４に各自の音声を出力するように設定するとともに、オペレータ１ｄの音声Ｄを、各話者１のヘッドホン４及び該オペレータのヘッドホン４ｄに出力するように設定している。
【００２６】
基準信号出力部６は、前記録音部３の録音レベルや前記音声出力ユニットの音声出力レベルを調整可能な正弦波等の基準信号を出力するものである。また、本実施形態では、該基準信号出力部６が、収録する音声のＤＡＴにおける録音位置を絶対的あるいは相対的な収録時間として示すタイムコードを収録時に出力し、このタイムコードが、前記録音部３で音声とともにＤＡＴに収録されるように構成している。
【００２７】
総合収録部７は、会話時の前記各話者１の音声を２チャンネルの音声チャンネルに収録するとともに各話者１が映った映像を１チャンネルの映像チャンネルに収録するものである。なお、本実施形態では、各話者１の音声及び映像により会話全体の全体像を把握し得るように、この総合収録部７を一般的なデジタルビデオカメラＤＶで構成し、そして一本のデジタルビデオカメラ用テープにおける一方の音声チャンネルに話者１ａ、１ｃの音声Ａ及びＣを収録し、他方の音声チャンネルに話者１ｂとオペレータ１ｄの音声Ｂ及びＤを収録するとともに、映像チャンネルにモニタ画面を４分割したそれぞれの画面に話者１ａ、１ｂ、１ｃの映像が表示し得るように収録している。
【００２８】
防音ボックスＳは、その内部で発生する音を外部に放射しないようにすると共に、その外部で発生した音を内部に進入しないようにする遮音機能を有するものであって、本実施形態では、防音ボックスＳａ、Ｓｂ、Ｓｃにそれぞれ入出した話者１ａ、１ｂ、１ｃの音声が、前記収音部２や音響出力部以外によっては相互に伝わらないように構成している。
【００２９】
ビデオカメラＶは、動画などを撮影可能ないわゆる一般的なビデオカメラであって、本実施形態では、前記防音ボックスＳａ、Ｓｂ、ＳｃにそれぞれビデオカメラＶａ、Ｖｂ、Ｖｃを配置することにより、その防音ボックスＳ内にいる話者１ａ、１ｂ、１ｃそれぞれの映像を撮影するように構成している。
【００３０】
画像出力部８は、前記ビデオカメラＶで撮影した話者１の映像を表示可能ないわゆる一般的なモニタ装置であって、本実施形態では、前記防音ボックスＳａ、Ｓｂ、Ｓｃにそれぞれ２台の画像出力部８を配置するとともに前記オペレータ１ｄが視ることが可能な位置に１台の画像出力部８ｘを配置している。より具体的には、話者１ａが入室する防音ボックスＳａには２台の画像出力部８ａＬと８ａＲとをそれぞれ話者１ａに対して左右に並べて配置し、さらに、この画像出力部８ａＬには話者１ｃの映像ｃを表示し画像出力部８ａＲには話者１ｂの映像ｂを表示するように設定している。また、同様に、話者１ｂが入室する防音ボックスＳｂには２台の画像出力部８ｂＬと８ｂＲとをそれぞれ話者１ｂに対して左右に並べて配置し、さらに、この画像出力部８ｂＬには話者１ａの映像ａを表示し画像出力部８ｂＲには話者１ｃの映像ｃを表示するように設定し、話者１ｃが入室する防音ボックスＳｃには２台の画像出力部８ｃＬと８ｃＲとをそれぞれ話者１ｃに対して左右に並べて配置し、さらに、この画像出力部８ｃＬには話者１ｂの映像ｂを表示し画像出力部８ｃＲには話者１ａの映像ａを表示するように設定している。一方、前記オペレータ１ｄが視聴可能な位置に配置した画像出力部８ｘには、デジタルビデオカメラＤＶから出力される各話者１の映像ａ、ｂ、ｃをモニタ画面上に４分割して表示するように設定している。
【００３１】
次に、以上のように構成される三者会話データ収録装置Ａにおける収録方法について説明する。
【００３２】
まず、基準信号出力部６から所定の周波数の正弦波を出力し、音響調整部５における図示しない音響特性調整部を調整することにより、前記録音部３の録音レベルや音声出力ユニットの音声出力レベルを調整する。なお、本実施形態では、２チャンネル録音機３ａ、３ｂ、３ｃにおける各チャンネルの録音レベルが略等しくなるように設定するとともに、対をなす音声出力ユニット間における音声出力レベルが略等しくなるように設定している。
【００３３】
そして、このように各レベルを調整した三者会話データ収録装置Ａにおいて、各話者１が初対面の組み合わせた場合にも、自然な活発な会話が行われるようオペレータ１ｄを用意し、その際の各話者１の音声や話者の身振りや表情を収録する。なお、オペレータ１ｄを用意せず、趣味や好み等各話者が話題にしやすく、自己紹介的な話題リストや写真等を用意することにより、自然な活発な会話が行われるように構成する実施態様も考えられる。
【００３４】
この収録の具体的な方法としては、例えば、話者１ａが他の話者１ｂ、１ｃに対して話し掛けると、話し掛けた音声Ａは話者１ａの近傍に設けたマイクロホン２ａで収音され、このマイクロホン２ａと接続している音響調整部５の入力チャンネルに入力される。そして、この音響調整部５に入力された話者１ａの音声Ａは、音響調整部５の音響特性調整部を介して、話者１ｂの左耳に取り付けている音声出力ユニット４ｂＬ及び話者１ｃの右耳に取り付けている音声出力ユニット４ｃＲに出力される。このようにこれら音声出力ユニット４ｂＬ及び４ｃＲから出力される話者１ａの音声Ａを聞いた話者１ｂ及び１ｃが、前記話者１ａの音声Ａの内容に応じた返事等を行うと、話者１ｂ及び１ｃが発する音声Ｂ及びＣは、話者１ａの音声と同様、音響調整部５の音響特性調整部を介して、他の話者に出力される。このようにして、三者間における会話が進行されることとなる。ところで、このような三者間における会話が進行している際に、話者１ａの音声Ａは、前記音響調整部５の音響特性調整部を介して２チャンネル録音機３ａ及び３ｃに出力され、それぞれの２チャンネル録音機の１チャンネルに、基準信号出力部６が出力するタイムコードとともに録音されることとなる。また、同様に、話者１ｂの音声Ｂは、２チャンネル録音機３ａ及び３ｂに出力され、それぞれの２チャンネル録音機の１チャンネルに録音され、話者１ｃの音声Ｂは、２チャンネル録音機３ｂ及び、３ｃに出力され、それぞれの２チャンネル録音機の１チャンネルに基準信号出力部６が出力するタイムコードとともに録音されることとなる。このようにして、三者間における会話の進行中に、各話者１の音声Ａ、Ｂ、Ｃを録音することができる。
【００３５】
ところで、このような会話の際に、各話者１の映像をその各話者１が入室している各防音ボックスＳ内に設けたビデオカメラＶが撮影し、各防音ボックスＳ内に設けた画像出力部８に表示する。より具体的には、ビデオカメラＶａで撮影する話者１ａの映像は、話者１ｂの入室している防音ボックスＳｂ内の左側の画像出力部８ｂＬ及び話者１ｃの入室している防音ボックスＳｂ内の右側の画像出力部８ｃＲに出力される。同様に、ビデオカメラＶｂで撮影する話者１ｂの映像は、話者１ａの入室している防音ボックスＳａ内の右側の画像出力部８ａＲ及び話者１ｃの入室している防音ボックスＳｃ内の左側の画像出力部８ｃＬに出力され、ビデオカメラＶｃで撮影する話者１ｃの映像は、話者１ａの入室している防音ボックスＳａ内の左側の画像出力部８ｃＬ及び話者１ｂの入室している防音ボックスＳｂ内の右側の画像出力部８ｂＲに出力される。
【００３６】
このように、各防音ボックスＳ内において画像出力部８に表示される他の話者の映像の方向と音声出力ユニットに出力される音声の方向とが一致しているため、不自然さ等を感じさせず自然な会話を促されることとなる。なお、各話者１の両耳に取り付けた音声出力ユニットの音声出力レベルを、前記他の話者が位置する方向の耳に対して大きく前記他の話者が位置しない方向の耳に対して小さくなるようにレベル調整し一の話者の両耳に対して出力すればさらに自然な会話を促すこともできる。より具体的には、例えば、話者１ａの両耳に取り付けた音声出力ユニット４ａＬ及び４ａＲにおいて、話者１ｃの音声Ｃを、この音声出力ユニット４ａＬで大きく音声出力ユニット４ａＲで小さくなるように出力し、同様に話者１ｂの音声Ｂを、この音声出力ユニット４ａＬで小さく音声出力ユニット４ａＲで大きくなるように出力するようにすればよい。
【００３７】
以上に詳述したように、本実施形態の三者会話データ収録装置Ａは、録音部３に組みにして録音した二者毎の組にした話者１間における対話進行を分析でき、さらに、この分析した二者毎の話者１間における対話進行に基づき、三者間における対話進行の過程の分析を好適に行うことができるといった、対話コーパスの作成に有用な三者会話データ収録装置Ａを提供することができる。
【００３８】
また、２チャンネル録音機３ａ、３ｂ、３ｃで異なる二者の音声を各チャンネルに分離して収録しているため、複数の話者が重複して発話した場合でも、収音した各話者の音声の聞き分けを確実に行うこともできる。また、２チャンネル録音機を用いているため、簡単に本システムを構成することもできる。さらに、この録音部３で録音する音声を所定のサンプリング周波数でサンプリングし所定の値で量子化したデジタルデータ化とし、そして、タイムコードによって各音声の録音位置を好適に知ることができるため、例えば、会話コーパス作成のための転記作業を行う際において重複発話箇所の特定を容易に行うことができ、収音した音声データを好適に整理・分析することができる。
【００３９】
そして、音響調整部５を、五台の音響ミキサを適宜接続して構成しているため、本システムを好適に構築することもできる。
【００４０】
また、防音ボックスＳ内に話者１が入ることにより、他の話者の音声が混同しないように構成しているが、その防音ボックスＳ内の話者をビデオカメラＶで撮影し、これを画像出力部８に表示させるとともに、他の防音ボックスＳ内の話者の音声を、この画像出力部８に映った方向と一致するようにして対をなす二つの音声出力ユニットから出力するように構成しているため、各話者に不自然さ等を感じさせず自然な対話コーパスの基となる会話を促すことができる。
【００４１】
さらに、基準信号出力部から正弦波等の基準信号を出力することにより、前記録音部３の録音レベルや前記音声出力部の音声出力レベルを容易に調整できる。
【００４２】
また、会話時の前記各話者の音声と各話者が映った映像とを収録する総合収録部を設けているため、対話コーパス作成時にこれを参照し、会話の全体を好適に把握することができる。
【００４３】
すなわち、このような本発明の三者会話データ収録装置Ａを用いれば、対話コーパスの作成に有用とすることができる。
【００４４】
なお、本実施形態では、各話者１の音声Ａ、Ｂ、Ｃを出力するためにヘッドホンを用いたが、インナホンやニアホンを用いてもよい。
【００４５】
また、防音ボックスＳ内に話者１が入ることにより、他の話者の音声が混同しないように構成していたが、一の話者の音声が他の話者のマイクロホンに収音されなければ、防音ボックスを用いず通常の部屋等で収録するようにしても構わない。
【００４６】
さらに、防音ボックスＳ内の話者をビデオカメラＶで撮影し、これを画像出力部８に表示させるように構成していたが、例えば、防音ボックスＳの一部が遮音ガラスで構成され各話者１同士がこの遮音ガラスを介して視認できる場合等、画像出力部８を使用しない実施態様も考えられる。
【００４７】
また、各防音ボックスＳ内に２つの画像出力部８を配置したが、１つの画像出力部８に他の二者を映した映像を分割表示させる実施態様も考えられる。
【００４８】
なお、本実施形態では、前記２チャンネル録音機３ａ、３ｂ、３ｃの各チャンネルにおいて、各話者１の音声をサンプリング周波数が４８ｋＨｚ、１６ｂｉｔで量子化したデジタルデータで録音するように設定しているが、サンプリング周波数及び量子化レートはこれに限られるものではない。また、２チャンネル録音機をＤＡＴレコーダで構成したが、これに限らず、例えば、ＭＤレコーダやＤＶＤレコーダ等、デジタル録音可能なものであればよい。さらに、コンピュータのハードデスク等に音声を記録するといった実施態様も考えられる。
【００４９】
また、本実施形態では、基準信号出力部６から所定の周波数の正弦波を出力することにより、前記録音部３の録音レベルや音声出力ユニットの音声出力レベルを調整するように設定していたが、基準信号出力部６から発生させる信号は、正弦波に限らず、ホワイトノイズやピンクノイズ等のランダムノイズやその他の信号であっても構わない。
【００５０】
なお、音響調整部５を五台の音響ミキサで構成したが、音響調整部５を構成する台数はこれに限られない。また、音響調整部５を、所定のプログラムによってコンピュータを動作させて音響ミキサとしての機能を発揮するようにして構成するといった実施態様も考えられる。
【００５１】
その他、各部の具体的構成についても上記実施形態に限られるものではなく、本発明の趣旨を逸脱しない範囲で種々変形が可能である。
【００５２】
【発明の効果】
以上に詳述した本発明によれば、録音部に組みにして録音した二者毎の組にした話者間における対話進行を分析でき、さらに、この分析した二者毎の話者間における対話進行に基づき、三者間における対話進行の過程の分析を好適に行うことができるといった、対話コーパスの作成に有用な三者会話データ収録装置を提供することができる。
【図面の簡単な説明】
【図１】本発明の実施形態における三者会話データ収録装置を構成する音声系統図を示す図。
【図２】本発明の実施形態における三者会話データ収録装置を構成する映像系統図を示す図
【図３】同実施形態における三者会話データ収録装置における収録の実施態様を示す図。
【符号の説明】
Ａ・・・三者会話データ収録装置
１（１ａ、１ｂ、１ｃ）・・・話者
２（２ａ、２ｂ、２ｃ）・・・収音部
３・・・録音部
３ａ、３ｂ、３ｃ・・・２チャンネル録音機
４ａＬ、４ａＲ、４ｂＬ、４ｂＲ、４ｃＬ、４ｃＲ・・・音声出力部（音声出力ユニット）
１ｄ・・・第四の話者
６・・・基準信号出力部
７・・・総合収録部
８・・・画像出力部

Claims

三者間における会話を収録する三者会話データ収録装置であって、各話者の音声を各々収音する収音部と、前記収音部で収音する各話者の音声を異なる二者毎の組にして録音する録音部と、前記収音部で収音する他の二者の音声をその収音時に一の話者各々に対して出力する音声出力部とを具備することを特徴とする三者会話データ収録装置。
前記収音部が、各々の話者の音声を他の話者の音声と混同しないように収音することを特徴とする請求項１記載の三者会話データ収録装置。
各話者毎に対をなす二つの音声出力部を備え、この対をなす二つの音声出力部を、各話者の両耳にそれぞれ直接取り付けあるいは近傍に配置していることを特徴とする請求項１又は２記載の三者会話データ収録装置。
前記音声出力部が、前記収音部で収音する他の話者の音声出力レベルを、前記他の話者が位置する方向の耳に対して大きく前記他の話者が位置しない方向の耳に対して小さくなるようにレベル調整し一の話者の両耳に対して出力することを特徴とする請求項３記載の三者会話データ収録装置。
他の話者を映した映像を表示する画像出力部を備え、前記音声出力部が、前記収音部で収音する他の話者の音声出力レベルを、前記画像出力部に表示する他者の映像の位置に合致させて出力することを特徴とする請求項４記載の三者会話データ収録装置。
他の話者を映した映像を表示する画像出力部を備え、前記音声出力部が、前記収音部で収音する他の二者の音声を、前記画像出力部に表示される前記他の二者の話者間における左右の位置関係と一致させて一の話者の両耳に出力することを特徴とする請求項３記載の三者会話データ収録装置。
前記音声出力部を、自分の音声が自分に聞こえるように、前記収音部で収音する話者の音声をその話者へ出力するように構成していることを特徴とする請求項１、２、３、４、５又は６記載の三者会話データ収録装置。
前記音声出力部が、三者間の会話を促す第四の話者の音声を前記各話者に出力することを特徴とする請求項１、２、３、４、５、６又は７記載の三者会話データ収録装置。
前記録音部の録音レベルや前記音声出力部の音声出力レベルを調整可能な正弦波等の基準信号を出力する基準信号出力部を具備することを特徴とする請求項１、２、３、４、５、６、７又は８記載の三者会話データ収録装置。
会話時の前記各話者の音声と各話者が映った映像とを収録する総合収録部を備えていることを特徴とする請求項１、２、３、４、５、６、７、８又は９記載の三者会話データ収録装置。
前記録音部で収録する音声が、所定のサンプリング周波数でサンプリングし所定の値で量子化してデジタルデータ化したものであることを特徴とする請求項１、２、３、４、５、６、７、８、９又は１０記載の三者会話データ収録装置。
前記録音部で収録する音声が、記録媒体における録音位置を絶対的あるいは相対的に指定可能なタイムコードとともに収録したものであることを特徴とする請求項１１記載の三者会話データ収録装置。
前記録音部が、異なる二者の音声を各チャンネルに分離して収録する３台の２チャンネル録音機で構成したものであることを特徴とする請求項１２記載の三者会話データ収録装置。