JP2003060792A - 複数音声録音再生装置 - Google Patents

複数音声録音再生装置

Info

Publication number
JP2003060792A
JP2003060792A JP2001246900A JP2001246900A JP2003060792A JP 2003060792 A JP2003060792 A JP 2003060792A JP 2001246900 A JP2001246900 A JP 2001246900A JP 2001246900 A JP2001246900 A JP 2001246900A JP 2003060792 A JP2003060792 A JP 2003060792A
Authority
JP
Japan
Prior art keywords
voice
output
recording
speaker
voices
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001246900A
Other languages
English (en)
Inventor
Yuji Yamaguchi
裕二 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001246900A priority Critical patent/JP2003060792A/ja
Publication of JP2003060792A publication Critical patent/JP2003060792A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】 【課題】電話会議システム等における発言音声を録音
し、議事録作成時等に発言音声を再生して確認すること
ができる複数音声録音再生装置に関し、同時発言音声を
各人の音声毎に分離して再生可能にし、かつ小型化及び
低コスト化を図る。 【解決手段】会議に参加する加入者A〜Gの音声を自動
利得制御器AGCに通した後にグループ化して音声加算
器1−1,1−2,1−3により混合し、混合音声を各
グループ毎の録音再生部1−4,1−5,1−6に録音
する。録音された音声は会議音声分離再生回路20によ
り1人ずつの発言音声に分離して出力する。会議音声分
離再生回路20は各録音再生部1−4,1−5,1−6
の再生音声そのまま出力する出力端と、その再生音声同
士の差分を出力する出力端とを有し、それらの出力端の
中から選択スイッチにより1つを選択し、同時発言音声
が録音された場合でも、聴取対象発言者のみの音声が分
離された音声を出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数音声録音再生
装置に関し、例えば電話会議システムなどのように、会
議に参加する各参加者の音声が各参加者対応の送話器又
はマイクロホン等から入力され、参加者の発言音声を参
加者全員が受話器又はスピーカにより聴取することがで
きるシステムにおいて、会議の発言音声を録音し、後に
議事録作成などのときに任意に発言者の音声を再生し、
発言内容を確認することができる複数音声録音再生装置
に関する。
【0002】
【従来の技術】従来、会議の発言の録音再生装置として
以下のようなものが実現されている。 (i)全参加者の発言音声を混合してモノラル録音再生
を行う全参加者音声混合モノラル録音再生装置。 (ii)参加者の中から1人の発言者の音声のみを選択し
てモノラル録音再生を行う発言者音声選択モノラル録音
再生装置。 (iii )各参加者の発言を各参加者毎に録音再生する参
加者対応マルチチャンネル録音再生装置。
【0003】上記(ii)の発言者音声選択モノラル録音
再生装置は、常時、会議中の発言をチェックし、1人の
発言者のみを選び出してその音声を録音するので、上記
( i) の全参加者混合モノラル録音再生装置に比べて、
録音雑音を低減することができるが、選択された者以外
の音声は全く録音されず、それらの発言内容を後から確
認することが全くできない。
【0004】これに対して、上記(iii )の参加者対応
マルチチャンネル録音再生装置は、全ての参加者の発言
をそれぞれ個別に録音するため、後に各発言内容を再生
して聴取するとき、各発言者の音声が重なり合うことな
く、各発言内容を明瞭に聴取することができる。
【0005】
【発明が解決しようとする課題】従来の上記( i) の全
参加者混合モノラル録音再生装置は、全参加者の音声を
混合して録音するため、録音再生装置全体の構成が簡素
であるという利点があるが、後に録音内容を再生して聴
取する際、複数の参加者が同時に発言した部分は音声が
重なり合い、個々の発言内容が聴き取り難くなる。
【0006】また、全参加者の音声をミックスして録音
するため、参加者が多くなるにつれて録音雑音が増加す
る。電話会議の場合、基本的には議長や司会者等の進行
役が発言者を指名するなどして会議を進めるため、通常
は2人以上が同時に発言することは少ないが、会議がう
まく進行しない場合や活発に意見交換が行われる場合な
どに、複数の参加者が同時に発言するといったことが頻
繁に発生する。
【0007】また、3者通話程度の小人数の会話であれ
ば、特に進行役等を立てずに会話が始まり、同時に2人
以上が話し出すことが度々発生する。このような場合、
会話の当事者同士は、音声が重なり合ってもこれまでの
話の流れや人間の聴覚の雑音除去作用により、支障なく
発言内容を聴き取ることができるが、その会話に加わっ
ていない者がその録音再生音を聴いた場合、或いはその
会話に加わっていたとしても後日その録音再生音を聴い
た場合、音声の重なり合った部分の会話内容を聴き取れ
ない場合が往々にしてある。
【0008】一方、上記(ii)の発言者音声選択モノラル
録音再生装置は、同時に2人以上が話した場合、最もレ
ベルの大きい音声又は最初に発言された音声のみを選択
して録音するため、他の発言者の音声と混じり合うこと
なく録音され明瞭に再生されるが、同時に発言した他の
者の音声は全く録音されず、後日その発言を聴取するこ
とはできない。
【0009】また、上記(iii) の参加者対応マルチチャ
ンネル録音再生装置は、各参加者の音声を各参加者対応
の別々のチャンネルに録音するので、後日、各参加者の
発言を再生して聴取するとき、各参加者の発言が他の発
言と混じることなく明瞭に聴取することができる。しか
し、参加者数と同じチャンネル数の多チャンネル録音装
置が必要となり、録音再生装置が大型のものとなってし
まうという欠点がある。
【0010】本発明は、同時に複数の参加者が発言した
場合でも、同時発言者のそれぞれの音声について他の発
言音声と重なり合うことなく、個々の発言者の音声のみ
を再生することができ、かつ、参加者数より大幅に少な
い録音チャンネル数の録音再生装置を用い、小型化及び
低コスト化を図ることができる複数音声録音再生装置を
提供することを目的とする。
【0011】
【課題を解決するための手段】本発明の複数音声録音再
生装置は、(1)各音声入力信号が1つ又は複数のグル
ープに帰属するようにし、かつ各グループに帰属する音
声信号入力の組合わせが各グループ毎に異なるように各
音声入力信号を複数のグループにグループ化し、該グル
ープ内の音声入力信号を該グループ毎の録音再生部に混
合して録音する手段と、前記各グループ毎の録音再生部
の再生音声信号を、他のグループの録音再生部の再生音
声信号で減じて相殺し合った音声信号を出力する相殺音
声出力手段と、前記グループ毎の録音再生部の各出力端
と前記相殺音声出力手段の各出力端の何れか1つを選択
して再生音声を出力する再生音声選択出力手段と、を備
えたものである。
【0012】また、(2)前記グループ毎の録音再生部
は、全音声入力信号数がNであるとき、2を底とする
(N+1)の対数の小数部を切上げた整数値とした個数
分設けたものである。
【0013】また、(3)各音声入力信号対応の自動利
得制御器を介して音声が入力される前記各グループ毎の
録音再生部の再生音声信号が無音であるかどうかを判別
する無音判別手段と、各グループ毎の録音再生部の再生
音声信号を他のグループの録音再生部の再生音声信号と
比較し、該比較対象のグループ毎の録音再生部の再生音
声信号同士が同一の音声信号であるかどうかを判別する
同一音声判別手段と、前記各グループ毎の録音再生部の
再生音声出力レベルを自動利得制御器の規定ピークレベ
ルと比較し、該録音再生部の再生音声信号が同時発言の
音声信号であるかどうかを判別する同時発言音声判別手
段と、各グループ毎の録音再生部の再生音声信号を基
に、前記無音判別手段、同一音声判別手段及び同時発言
音声判別手段により、該録音再生装置の再生音声信号が
1人の発言のものか同時発言のものかを判別し、かつど
の音声入力信号であるかを判別する音声入力信号判別手
段と、を備えたものである。
【0014】また、(4)前記再生音声選択出力手段
は、前記グループ毎の録音再生部の各出力端と前記相殺
音声出力手段の各出力端の中から、前記音声入力信号判
別手段により判別された音声入力信号のみが出力される
出力端を選択するものである。
【0015】また、(5)前記再生音声選択出力手段
は、第1の発言者の再生音声信号が出力される出力端を
選択する第1音声出力系統と、第2の発言者の再生音声
信号が出力される出力端を選択する第2音声出力系統と
を備え、発言者の組合わせが変化しても同一発言者の音
声信号が引続き出力される場合、該同一発言者の音声信
号を該変化前に出力していた第1音声出力系統又は第2
音声出力系統から継続して出力するように再生音声信号
の出力端の選択制御を行うものである。
【0016】
【発明の実施の形態】会議の発言者は通常の場合1人で
あり、複数の者が同時に発言することがたまにはある
が、同時発言は2人によるものが殆どであり、3人以上
による同時発言はごく稀にしか発生しない。本発明はこ
の点に着目し、会議の参加者の音声入力信号を或る規則
に従ってグループ化し、各参加者の音声入力信号を1つ
又は複数のグループに帰属させて該グループ内の発言音
声入力信号を混合して録音し、各グループ毎の録音再生
部から出力される再生音声信号に対して、2者同時発言
の音声信号を個々の発言音声信号に分離して出力するよ
うに処理を行うもので、以下に説明するように参加者の
音声入力信号数より大幅に少ないチャンネル数の録音再
生部を用いて同時発言音声信号の分離再生を可能にす
る。なお、本発明において、場合によっては3者の同時
発言音声信号も個々に分離して出力することが可能であ
る。
【0017】まず、参加者の音声入力信号をグループ化
して録音する手段について説明する。複数の参加者の音
声入力信号を何人かずつの集団にグループ化し、各グル
ープ毎に設けた1つの録音再生部に該グループの全発言
を混合して録音する。そうすると最も単純な場合、同時
発言者の音声がそれぞれ別々の録音再生部に録音される
場合がある。
【0018】例えば、A〜Dの4人の会議参加者の場
合、次のようにグループ化して録音したとする。第1の
グループに参加者AとBとを帰属させ、その2者の音声
をミックスして第1の録音再生部に録音する。そして、
第2のグループに参加者CとDとを帰属させ、その2者
の音声をミックスして第2の録音再生部に録音する。
【0019】ここで、第1のグループの参加者Aと第2
グループの参加者Cが同時に発言したとすると、第1の
録音再生部からは参加者Bは無言なので発言者Aのみの
音声が再生され、第2の録音再生部からは参加者Dは無
言なので発言者Cのみの音声が再生される。このよう
に、同時発言者が第1のグループと第2のグループとに
分かれていれば、第1の録音再生部と第2の録音再生部
とを独立に再生することにより、同時発言の音声を分離
して出力することができる。
【0020】次に、各グループ毎の録音再生部に発言を
混合して録音する際の発言の組合わせパターンについて
説明する。前述のグループ化において、参加者の音声信
号が2以上のグループに帰属するようにし、かつ、各グ
ループに帰属する参加者の音声信号が各グループ毎に異
なるようにグループ化し、各グループ毎の録音再生部に
発言を混合して録音する。
【0021】そして、上記のようにグループ化して各グ
ループ内の発言を混合して録音した各グループ毎の録音
再生部の再生音を、他のグループの録音再生部の再生音
により減じて相殺することにより、2つのグループに帰
属する一方の発言者の音声を相殺して消去し、同時発言
の一方の発言音声を消去して聞こえないようにすること
ができる。
【0022】例えば、A〜Cの3人の参加者で会議が行
われる場合、第1のグループに参加者AとBとを帰属さ
せてその2者の音声を混合して第1の録音再生部に録音
し、第2のグループに参加者BとCとを帰属させてその
2者の音声を混合して第2の録音再生部に録音する。
【0023】このように録音した場合、同時発言者が参
加者AとBである場合、第1の録音再生部からは参加者
AとBのミックスした音声が出力される。一方、第2の
録音再生部からは参加者Bのみの音声が出力される。第
1の録音再生部と第2の録音再生部の差分出力は以下の
ようになる。 差分出力=(A+B)−(B+C)=A−C
【0024】ここで、参加者Cは無言なので、この差分
出力は発言者Aのみの音声となる。従って、発言者Aと
発言者Bの同時発言があっても、第2の録音再生部から
発言者Bのみの音声が、差分出力により発言者Aのみの
音声が、それぞれ分離されて出力されることになる。
【0025】また、同時発言者が参加者BとCである場
合、第1の録音再生部からは参加者Bのみの音声が出力
される。一方、第2の録音再生部からは参加者BとCの
ミックスした音声が出力される。第1の録音再生部と第
2の録音再生部の差分出力は(A−C)であるが、ここ
で、参加者Aは無言なので、この差分出力は発言者Cの
みの音声となる。従って、発言者Bと発言者Cの同時発
言があっても、第1の録音再生部から発言者Bのみの音
声が、差分出力により発言者Cのみの音声が、それぞれ
分離されて出力されることになる。
【0026】また、同時発言者が参加者CとAである場
合、第1の録音再生部からは参加者Aのみの音声が出力
される。一方、第2の録音再生部からは参加者Cのみの
音声が出力される。従って、発言者Aと発言者Cの同時
発言があっても、第1の録音再生部から発言者Aのみの
音声が、第2の録音再生部から発言者Cのみの音声が、
それぞれ分離されて出力されることになる。
【0027】一般に、全参加者N人の音声入力信号に対
して前述のグループ化及び混合化を行う場合、以下の規
則に従ってn個のグループに各参加者の音声入力信号を
グループ化する。 (i)各参加者の音声入力信号は少なくとも1つの何れ
かのグループに必ず帰属させる。 (ii)各グループに帰属する会議参加者の音声入力信号
の組合わせが各グループ毎に異なるようにする。つま
り、各参加者の音声入力信号は、1又は複数のグループ
に帰属し、各参加者の音声入力信号が帰属する1又は複
数のグループの組合わせは、各参加者の音声入力信号毎
にそれぞれ異なるようにする。
【0028】以上により、全参加者数Nとグループ数n
との関係は次のようになる。 N=2n −1 ・・・式(1) ここで、上記式(1)の右辺第1項(2n )は、n個の
グループの組合わせ数に相当し、上記規則(ii)の条件
に該当する。また、上記式(1)の右辺第2項は(−
1)は、参加者の音声入力信号は必ず何れかのグループ
に帰属するようにするため、どのグループにも帰属しな
い参加者の音声入力信号を取り除くためのもので、上記
規則(i)の条件に該当する。
【0029】例として、7人の参加者で会議を行う場
合、7=23 −1であることから、7人を3つのグルー
プに分け、従来は7台又は7チャンネルの録音再生部で
録音していたのを、3台又は3チャンネルの録音再生部
で済ませることができる。また、ステレオ録音が可能な
通常のオーディオレコーダのような2チャンネル録音再
生装置を用いた場合、参加者が3人(3=22 −1)の
会議の同時発言音声を分離再生することができる。
【0030】参加者数Nが大幅に増加しても、上記式
(1)に従って録音チャンネル数nを増やすだけでよ
く、会議参加者が増えれば増える程、大きな効果が得ら
れる。但し、実際は参加者が増加すると録音雑音が増大
し、音質が低下するため、参加者の許容数には上限があ
るが、参加者数より遥かに少ない録音チャンネル数で分
離再生が可能となる。
【0031】また、ノイズについて説明すると、参加者
が7人の場合、本発明によるグループ化及び混合化によ
り録音再生する各録音再生部は、4人分の音声を混合し
て録音するだけなので、従来の全参加者音声混合モノラ
ル録音再生装置による7人分の音声を混合して録音する
場合に比べ、録音雑音を低減化することができる。
【0032】本発明による複数音声録音再生装置(以下
会議録音再生装置という。)における会議音声多重録音
回路の構成例を図1に、会議音声分離再生回路の構成例
を図2に示す。本発明の会議音声多重録音回路は、図1
に示すように、例えば、会議電話に参加する7人の電話
加入者A〜Gの音声を、自動利得制御器AGC(Automa
tic Gain Controller )に通した後、同じグループに帰
属する加入者の音声同士を音声加算器1−1,1−2,
1−3により混合し、混合した音声を各グループ毎の録
音再生部1−4,1−5,1−6にそれぞれ録音する。
なお、自動利得制御器AGCを通すことにより、各加入
者A〜Gの音声レベルは略均等に調整され、またピーク
レベルも規定される。
【0033】第1の録音再生部1−4には第1のグルー
プに帰属する加入者A,C,E,Gの混合音声を録音
し、第2の録音再生部1−5には加入者B,C,F,G
の混合音声を録音し、第3の録音再生部1−6には加入
者D,E,F,Gの混合音声を録音する。
【0034】各グループ毎の録音再生部1−4,1−
5,1−6に混合して録音された発言音声は、会議音声
分離再生回路20により1人ずつの発言音声に分離され
て出力される。以下、会議音声分離再生回路20による
同時発言再生音声の分離出力について図2を参照して説
明する。
【0035】会議音声分離再生回路は図2に示すよう
に、図1で説明した会議音声多重録音回路10 (図1
に示す自動利得制御器AGC及び音声加算器1−1,1
−2,1−3により構成される回路)から出力されるグ
ループ毎の混合音声をそれぞれ録音するグループ毎の録
音再生部1−4,1−5,1−6の出力を、そのまま出
力する出力端R1,R2,R3と、各録音再生部1−
4,1−5,1−6の音声出力同士の差分をそれぞれ算
出する音声差分器2−1,2−2,2−3からの出力端
R4,R5,R6と、各録音再生部1−4,1−5,1
−6の出力の全て混合する音声加算器2−4の出力端R
Aとを備える。
【0036】各出力端R1〜R6,RAは、選択スイッ
チ2−5によりその何れか1つが選択され、音声出力装
置2−6に入力される。音声出力装置2−6は、選択さ
れた出力端からの信号を音声に変換し、会議の議事録作
成者等の聴取者が発言音声を聴取し得るように出力す
る。
【0037】次に、参加者が7人の場合における発言音
声の分離再生について具体的に説明する。7人の会議の
場合、前述の式(1)により7=23 −1であることか
ら、必要な録音再生部数nは3となる。そして、3台の
各録音再生部#1〜#3に録音される音声のミックスパ
ターンは、図3の(a)に示す通りとなる。
【0038】なお、以下の図又は説明において、7人の
各加入者A〜GをAsub〜Gsubと表し、各加入者
A〜Gのそれぞれの音声をAsig〜Gsigと表して
いるが、前後の文意から加入者自身か加入者の音声かが
明らかな場合は単にA〜Gと記している。また、加入者
は会議参加者と同義である。
【0039】図3(a)に示すように、第1の録音再生
部#1には加入者A,C,E,Gの音声が録音され、第
2の録音再生部#2には加入者B,C,F,Gの音声が
録音され、第1の録音再生部#3には加入者D,E,
F,Gの音声が録音される。
【0040】各録音再生部から出力される再生音声のミ
ックスパターンは図3(b)に示す通り、第1の録音再
生部の出力端R1からA+C+E+Gのミックスパター
ンが出力され、第2の録音再生部の出力端R2からB+
C+F+Gのミックスパターンが出力され、第3の録音
再生部の出力端R3からD+E+F+Gのミックスパタ
ーンが出力され、第1と第2の録音再生部の差分出力端
R4からA+E−B−Fのミックスパターンが出力さ
れ、第2と第3の録音再生部の差分出力端R5からB+
C−D−Eのミックスパターンが出力され、第3と第1
の録音再生部の差分出力端R6からD+F−A−Cのミ
ックスパターンが出力される。
【0041】ここで2者による同時発言がどのように録
音再生されるかを、加入者Aと他の1人の加入者B〜G
との同時発言を例に挙げて説明する。まず、図4の
(1)に示すように加入者AとBの同時発言の場合、第
1の録音再生部の出力端R1からはAの音声、第2の録
音再生部の出力端R2からはBの音声、第3の録音再生
部の出力端R3からは無音、第1と第2の録音再生部の
差分出力端R4からはA−Bの音声、第2と第3の録音
再生部の差分出力端R5からはBの音声、第3と第1の
録音再生部の差分出力端R6からは−Aの音声が再生出
力される。
【0042】即ち、出力端R1,R6から加入者Aのみ
の音声が再生され、出力端R2,R5から加入者Bのみ
の音声が再生される。出力端R4から加入者Aと加入者
Bの音声が同時に再生され、出力端R3からは無音が再
生されるので、この場合、出力端R4と出力端R3は使
用しない。
【0043】次に図4の(2)に示すように加入者Aと
Cの同時発言の場合、第1の録音再生部の出力端R1か
らはA+Cの音声、第2の録音再生部の出力端R2から
はCの音声、第3の録音再生部の出力端R3から無音、
第1と第2の録音再生部の差分出力端R4からはAの音
声、第2と第3の録音再生部の差分出力端R5からはC
の音声、第3と第1の録音再生部の差分出力端R6から
−A−Cの音声が再生出力される。
【0044】即ち、出力端R4から加入者Aのみの音声
が再生され、出力端R2,R5から加入者Cのみの音声
が再生される。出力端R1,R6から加入者Aと加入者
Cの音声が同時に再生され、出力端R3からは無音が再
生されるので、この場合、出力端R1,R3,R6は使
用しない。
【0045】次に図4の(3)に示すように加入者Aと
Dとの同時発言の場合、第1の録音再生部の出力端R1
からはAの音声、第2の録音再生部の出力端R2からは
無音、第3の録音再生部の出力端R3からDの音声、第
1と第2の録音再生部の差分出力端R4からはAの音
声、第2と第3の録音再生部の差分出力端R5からは−
Dの音声、第3と第1の録音再生部の差分出力端R6か
らはD−Aの音声が再生出力される。
【0046】即ち、出力端R1,R4から加入者Aのみ
の音声が再生され、出力端R3,R5から加入者Dのみ
の音声が再生される。出力端R6から加入者Aと加入者
Dの音声が同時に再生され、出力端R2からは無音が再
生されるので、この場合、出力端R2,R6は使用しな
い。
【0047】次に図4の(4)に示すように加入者Aと
Eとの同時発言の場合、第1の録音再生部の出力端R1
からはA+Eの音声、第2の録音再生部の出力端R2か
らは無音、第3の録音再生部の出力端R3からEの音
声、第1と第2の録音再生部の差分出力端R4からはA
+Eの音声、第2と第3の録音再生部の差分出力端R5
からは−Eの音声、第3と第1の録音再生部の差分出力
端R6からは−Aの音声が再生出力される。
【0048】即ち、出力端R6から加入者Aのみの音声
が再生され、出力端R3,R5から加入者Eのみの音声
が再生される。出力端R1,R4から加入者Aと加入者
Eの音声が同時に再生され、出力端R2からは無音が再
生されるので、この場合、出力端R1,R2,R4は使
用しない。
【0049】次に図5の(5)に示すように加入者Aと
Fとの同時発言の場合、第1の録音再生部の出力端R1
からはAの音声、第2の録音再生部の出力端R2からは
Fの音声、第3の録音再生部の出力端R3からはFの音
声、第1と第2の録音再生部の差分出力端R4からはA
−Fの音声、第2と第3の録音再生部の差分出力端R5
からは無音、第3と第1の録音再生部の差分出力端R6
からはF−Aの音声が再生出力される。
【0050】即ち、出力端R1から加入者Aのみの音声
が再生され、出力端R2,R3から加入者Fのみの音声
が再生される。出力端R4,R6から加入者Aと加入者
Fの音声が同時に再生され、出力端R5からは無音が再
生されるので、この場合、出力端R4,R6,R5は使
用しない。
【0051】次に図5の(6)に示すように加入者Aと
Gとの同時発言の場合、第1の録音再生部の出力端R1
からはA+Gの音声、第2の録音再生部の出力端R2か
らはGの音声、第3の録音再生部の出力端R3からはG
の音声、第1と第2の録音再生部の差分出力端R4から
はAの音声、第2と第3の録音再生部の差分出力端R5
からは無音、第3と第1の録音再生部の差分出力端R6
からは−Aの音声が再生出力される。
【0052】即ち、出力端R4、R6から加入者Aのみ
の音声が再生され、出力端R2,R3から加入者Gのみ
の音声が再生される。出力端R1から加入者Aと加入者
Gの音声が同時に再生され、出力端R5からは無音が再
生されるので、この場合、出力端R1,R5は使用しな
い。
【0053】加入者A以外の同時発言についても同様
に、出力端R1〜R6の少なくとも1つから1人の発言
者のみの再生音声が出力される。次に出力端R1〜R6
の中から1人の発言者のみの音声をどのように選択して
出力するかについて説明する。
【0054】この選択手段としては、再生音を聴取する
聴取者(モニター者)がマニュアル操作で出力端R1〜
R6を適宜切替えながら各出力音声を聴取し、聴取対象
発言者の出力端を探り出すマニュアル選択と、装置で自
動的に同時発言を検出し、聴取対象発言者の出力端を判
別して切替える自動選択の何れも適用することができ
る。以下、これら2つの選択手段について説明する。
【0055】〔I〕マニュアル選択について 聴取者がマニュアル操作によって選択する実施形態で
は、聴取者は通常、図2の選択スイッチ2−5を、全て
のグループの音声が混合される音声加算器2−4の出力
端RAに接続し、会議全体の発言音声を聴取する。音声
加算器2−4の出力端RAからは、A+B+2×C+D
+2×E+2×F+3×Gの音声が出力される。
【0056】ここでGの音声はA、B、Dの音声の3倍
のレベルで出力されるので、進行役等に割り当てると都
合がよい。次にC,E,Fの音声はA,B,Dの音声の
2倍のレベルとなるので、進行役の次に重要人物に割り
当てておくと良い。残りのA,B,Dの音声はレベルが
小さいので、これらの再生出力時には音声出力装置2−
6の出力レベルを上げて聴取すれば良い。
【0057】何れにしろ、聴取者である人間が出力音声
を聴いて、その音声が1人の発言のものか2人同時発言
のものかを判断する。そして同時発言が発生して一方の
発言者の音声が聴き取り難い場合、以下のように選択ス
イッチ2−5を切替える。
【0058】各録音再生部1−4,1−5,1−6の各
出力端R1,R2,R3を順に一つずつ選択して録音音
声を再生し聴取する。前述のように同時発言者がそれぞ
れ別々の録音再生部に録音された場合は、それぞれの録
音再生部から個々の発言者の音声が別々に再生され、1
人ずつ発言音声を聴取することができる。
【0059】上記の出力端R1,R2,R3を選択して
も、1人のみの発言音声を聴取することができない場
合、各音声差分器2−1,2−2,2−3の出力端R
4,R5,R6の何れかを選択して聴取する。同時発言
者の双方の音声が録音された録音再生部と、同時発言者
の一方のみの音声が録音された録音再生部との差分出力
が得られる音声差分器を選択することにより、1人のみ
に分離された発言音声を聴取することができる。
【0060】以上、説明したとおり、発言音声が重なり
合っても、選択スイッチ2−5を切替えながらモニター
することにより、2人の同時発言の音声を分離して聴取
することができる。なお、条件がよければ、更に多くの
同時発言(3者同時発言等)の場合でも分離可能とな
る。例えば、AとBとDとによる3者同時発言が発生し
ても、AとBとDの各音声は、それぞれ第1、第2及び
第3の録音再生部1−4,1−5,1−6に独立に録音
されるため、それぞれ個々に再生出力することができ
る。
【0061】〔II〕自動選択について 次に、1人の発言者の分離再生音声を自動的に選択する
実施形態について説明する。まず、自動的に1人の発言
者の音声を選択して出力する処理を行うに当たって、入
力されたアナログ音声信号を基に、“音声入力(発言)
が有る”又は“同時発言である”というようなデジタル
状態を判別する必要がある。本発明はこの判別を以下の
ように実現する。
【0062】会議は時間とともに発言者が刻々と変化
し、同時発言者の組合わせも刻々と変化する。そこで、
録音された音声を或る単位時間(例えば0.1秒)毎の
音声に分割し、この単位時間毎の音声の比較・判別によ
り、該音声が1人の発言であるのか複数人の同時発言で
あるのか、また、どの加入者の発言音声であるのかを判
別する。以下、この判別手段について詳述する。
【0063】(i)同一音声判別手段について 別々の録音再生部から出力される音声が同一発言者の同
一音声であるかどうかを判別する同一音声判別手段は、
単位時間毎に両者の音声レベルを比較し、両音声レベル
の相違が或る一定の閾値以上の差が無ければ、同一発言
者の音声と判定し、閾値以上の差が有れば、異なる発言
者の音声であると判定する。
【0064】例えば、図6の(a)に示すように、2つ
の録音再生部から入力される音声サンプル入力値をそれ
ぞれ単位時間(0.1秒)に亙って加算した第1の入力
累算値x及び第2の入力累算値yと、2つの録音再生部
から入力される音声サンプル値の差分の絶対値を加算し
た差分累算値wとを算出し、該差分累算値wを全体の入
力レベルの累算値(x+y)で割った値を求め、その値
を閾値と比較し、その値が閾値より小さい場合に同一発
言者の音声と判定し、大きい場合に異なる発言者の音声
であると判定する。
【0065】人間の音声は各個人毎に異なっているの
で、この比較判定に用いる閾値は或る程度大きい値を設
定しても良い。この閾値が小さ過ぎるとノイズ等の要因
により同一発言者の音声でも違う発言者同士の音声と判
定してしまうし、大き過ぎると違う発言者同士の音声で
も同一発言者の音声と判定してしまうので、適切な値を
設定する必要がある。なお、この閾値はコマンド等によ
り書き換えられるようにしておく。
【0066】上記同一音声かどうかを判定する手段をア
ナログ回路で構成する場合、図6の(b)に示すよう
に、2つの録音再生部の各組合わせ(図では第1及び第
2の録音再生部1−4,1−5の組を例示している。)
から出力される再生音声の差分を出力する音声差分器2
−1と、該音声差分器2−1の差分出力を積分する積分
器6−1と、該積分器6−1から出力される積分値と閾
値とを比較し、積分値が閾値以下のとき同一音声である
と判定する比較器6−2とにより構成することができ
る。
【0067】アナログ回路では、録音再生ヘッドのアラ
イメント調整不足により録音再生部間でタイムラグが生
じる場合がるが、このタイムラグによる再生音声のずれ
は一種のノイズとして扱うことができ、上記閾値を適当
な値に設定することにより、タイムラグによる音声のず
れを吸収することができる。
【0068】また、各録音再生部から出力される音声サ
ンプリングデータを保持するメモリと、該音声サンプリ
ングデータの演算処理を行うプロセッサとを設け、該音
声サンプリングデータに対して減算、加算、除算、乗算
等のディジタル処理を行うことにより、同一音声判別手
段を実現することもできる。
【0069】なお、同一音声判別手段の音声レベルの比
較判定において、レベルの正負の符号は意味が無い。即
ち、或る加入者がAという音声を発したとすると、この
音声と−Aの音声とは区別がつかず、同じ音声として聞
こえる。これは単に位相が180度ずれているだけであ
る。
【0070】また、或る発言者がAという音声を発し、
他の発言者がBという音声を発して両者の音声が重なり
合ったとすると、この重なった音声は(A+B)なのか
(A−B)なのか(−A+B)なのか(−A−B)なの
かの聞き分けることができない。これら4つは同じ音声
に聞こえ、区別する必要がない。
【0071】(ii)同時発言音声判別手段について 次に、同時発言により重なり合った音声が発生したこと
を判別する同時発言音声判別手段について説明する。2
人以上が同時に発言し、2人以上の音声が録音再生部に
録音されると、該録音再生部には自動利得制御器AGC
で規定されたピークレベルより高いレベルの音声が録音
される。
【0072】そこで、図7の(a)に示すように、各録
音再生部から入力される音声サンプル値を、例えば1m
s毎に単位時間の0.1秒(100ms)に亙って該ピ
ークレベルと比較し、録音再生部からの入力音声サンプ
ル値が該ピークレベルを超えていれば、同時発言の音声
であると判別することができる。
【0073】また、同時発言音声判別手段をアナログ回
路で構成する場合、図7の(b)に示すように、各々の
録音再生部(図では第1の録音再生部1−4について例
示している。)と自動利得制御器AGCのピークレベル
出力との差分を出力する音声差分器7−1と、該音声差
分器7−1から出力される差分値を単位時間積分する積
分器7−2と、該積分器7−2による積分値を閾値とを
比較し、積分値が閾値を超えたときに同時発言音声と判
定する比較器7−3とにより、構成することができる。
【0074】(iii )無音判別手段について 次に、各録音再生部から出力される再生音声が無音であ
るかどうかを判別する無音判別手段について説明する。
図8に示すように、各録音再生部から入力される音声サ
ンプル入力値を単位時間(0.1秒)に亙って加算した
入力累算値xと所定の閾値とを比較し、該入力累算値x
が閾値より低ければ無音と判定する。
【0075】上記(i)、(ii)及び(iii )の同一音
声判別手段、同時発言音声判別手段及び無音検出手段に
より、各録音再生部1−4,1−5,1−6の各音声出
力を調べ、各録音再生部の出力パターンを判別する。そ
して、この録音再生部の音声出力パターンから、時々刻
々変化する会議の発言パターン、即ち1人だけの発言か
2人による同時発言か、またどの参加者の発言であるか
を判別する。以下、この判別手法について説明する。
【0076】図9は各録音再生部の音声出力パターンを
示している。同図の(a)は発言者が1人の場合の、第
1〜第3の各録音再生部#1〜#3の音声出力パターン
PTN11〜PTN17を示している。また、同図の
(b)は複数の発言が同時に発生した場合の、第1〜第
3の各録音再生部#1〜#3の音声出力パターンPTN
21〜PTN27を示している。
【0077】同図において、“X”、“Y”及び“Z”
は、各録音再生部#1〜#3から出力される再生音声
で、図の表内に書き込まれている“X”同士及び“Y”
同士はそれぞれ同一の音声であるが、“X”と“Y”、
“Y”と“Z”、及び“Z”と“X”は、それぞれ異な
る再生音声である。この音声出力パターンは、同一音声
判別手段によって判別することができる。また、“0”
は無音出力を表している。
【0078】ここで、図9の(a)に示す1人発言の音
声出力パターンPTN11〜PTN17の何れか1つが
特定されれば、該パターンからどの発言者の音声である
かが一義に定まる。即ち、音声出力パターンPTN11
であれば発言者はA、出力パターンPTN12であれば
発言者はB、出力パターンPTN13であれば発言者は
C、出力パターンPTN14であれば発言者はD、出力
パターンPTN15であれば発言者はE、出力パターン
PTN16であれば発言者はF、出力パターンPTN1
7であれば発言者はGであると判別することができる。
【0079】次に、図9の(b)に示す音声出力パター
ンPTN21〜PTN27の場合、同時発言が発生して
いると判別され、更に各音声出力パターンを分析する
と、各音声出力パターンは3つのバリエーションを有す
ることが分かる。
【0080】例えば、第1の録音再生部#1から無音
“0”が出力される第1の同時発言音声出力パターンP
TN21の場合、図10の(1)に示すように、第2の
録音再生部#2から発言者Bの音声が、第3の録音再生
部#3から発言者Dの音声が出力される第1のバリエー
ションV1と、第2の録音再生部#2から発言者B及び
Fの混合音声が、第3の録音再生部#3から発言者Fの
音声が出力される第2のバリエーションV2と、第2の
録音再生部#2から発言者Fの音声が、第3の録音再生
部#3から発言者DとFの混合音声が出力される第3の
バリエーションV3の何れかである。
【0081】ここで、上記第1のバリエーションV1の
場合は、音声B及び音声Dがそれぞれ出力される第2及
び第3の録音再生部の出力レベルが、ともに自動利得制
御器AGCで規定されたピークレベル以下である。これ
に対して、上記第2のバリエーションV2の場合は、混
合音声(B+F)が出力される第2の録音再生部#2の
出力レベルが、自動利得制御器AGCで規定されたピー
クレベルを超え、音声Fが出力される第3の録音再生部
#3の出力レベルは、自動利得制御器AGCで規定され
たピークレベル以下である。
【0082】また、上記第3のバリエーションV3の場
合は、音声Fが出力される第2の録音再生部#2の出力
レベルは、自動利得制御器AGCで規定されたピークレ
ベル以下であり、混合音声(D+F)が出力される第3
の録音再生部#3の出力レベルは、自動利得制御器AG
Cで規定されたピークレベルを超える。
【0083】従って、前述の同時発言音声判別手段によ
り、第2及び第3の録音再生部の各出力レベルを監視す
ることにより、どのバリエーションであるかを特定する
ことができ、バリエーションが特定できれば、再生音声
がどの発言者のものであるかを判別することができる。
【0084】図10の(2)〜(7)には、それぞれ第
2の同時発言音声出力パターンPTN22〜第7の同時
発言音声出力パターンPTN27についてのバリエーシ
ョンを表示しているが、これらの音声出力パターンの場
合でも、前述の第1の同時発言音声出力パターンPTN
21と全く同様に、バリエーションを特定し、特定した
バリエーションから再生音声がどの発言者のものである
かを判別することができる。
【0085】次に、判別された発言者に対して、聴取対
象発言者の音声を選択して出力する手段について説明す
る。分離再生音声を自動的に選択する実施形態の会議録
音再生部は、第1発言者の音声を選択して出力する第1
音声出力系統と、第2の発言者の音声を選択して出力す
る第2音声出力系統とを備え、該第1音声出力系統及び
第2音声出力系統は、発言音声出力パターンが変化した
場合でも、同一発言者の一連の発言音声を継続して出力
するよう、その分離再生音声の出力端を選択する。
【0086】そのため、常時各音声再生装置の音声出力
パターンを監視し、該音声出力パターンからどの発言者
の再生音声であるかを判別し、各発言者の再生音声が第
1音声出力系統又は第2音声出力系統から適切に出力さ
れるよう、第1の発言者の識別情報を記憶保持する第1
発言者レジスタS1と、第2の発言者の識別情報を記憶
保持する第2発言者レジスタS2とを備える。
【0087】また、第1発言者レジスタS1に保持され
た発言者のみの再生音声が出力される出力端を、図2に
示す出力端R1〜R6の中から選択して保持する第1出
力選択レジスタT1と、同じく第2発言者レジスタS2
に保持された発言者のみの再生音声出力端を、出力端R
1〜R6の中から選択して保持する第2出力選択レジス
タT2とを備える。
【0088】そして、第1音声出力系統は、第1出力選
択レジスタT1に保持された出力端の情報に従って、図
2の出力端R1〜R6の1つを選択し、1人のみの分離
再生音声を出力する。また、同様に第2音声出力系統
は、第2出力選択レジスタT2に保持された出力端の情
報に従って、出力端R1〜R6の1つを選択し、1人の
みの分離再生音声を出力する。
【0089】更に、上述の第1音声出力系統及び第2音
声出力系統の外に、全参加者の音声が出力される図2の
出力端RAを選択して出力する第3音声出力系統を備
え、モニター者は通常、この第3音声出力系統から会議
全体の発言音声を聴取し、同時発言が起こった場合、第
1音声出力系統又は第2音声出力系統を選択し、同時発
言の片方の分離再生音声を聴取する。
【0090】勿論、同時発言が確認された時点で該発言
の再生音声は次のものに進んでいるので、プレイバック
(数秒前に戻って再生する所謂巻き戻し再生)の機能を
付加し、モニター者はプレイバックコマンドを送出し、
第1音声出力系統又は第2音声出力系統を選択し、各発
言者の分離音声を聴取する。
【0091】ここで、第1音声出力系統又は第2音声出
力系統が、発言者の分離再生音声をどのように選択して
出力するかは、前回(過去)の発言パターンと今回(現
時点)の発言パターンとの変化のパターンによって異な
る。
【0092】この選択制御の1例を図11に示す。同図
に示すように、この選択制御を行うために、前回の発言
により第1発言者レジスタS1及び第2発言者レジスタ
S2に記憶保持された第1及び第2の発言者情報と、今
回の発言において判別した第1及び第2の発言者Xsu
b及びYsubとが、それぞれ合致するかどうかを、第
1乃至第4の判定#1〜#4によって判定する。
【0093】即ち、第1の判定#1により第1発言者レ
ジスタS1の保持内容と今回の発言者Xsubとが合致
するかどうかを判定し、第2の判定#2により第1発言
者レジスタS1の保持内容と今回の発言者Ysubとが
合致するかどうかを判定し、第3の判定#3により第2
発言者レジスタS2の保持内容と今回の発言者Xsub
とが合致するかどうかを判定し、第4の判定#4により
第2発言者レジスタS2の保持内容と今回の発言者Ys
ubとが合致するかどうかを判定する。
【0094】図11(1)の場合のように、第1発言者
レジスタS1の保持内容と発言者Xsubとが合致し、
第2発言者レジスタS2の保持内容と発言者Ysubと
が合致する場合は、前回の同時発言と今回の同時発言と
で発言者は同一であるので、前回の選択出力を変更する
ことなく、前回の同時発言と同様に第1音声出力系統及
び第2音声出力系統から各発言者の分離再生音声を選択
して出力する。
【0095】図11(2)の場合のように、第1発言者
レジスタS1の保持内容と発言者Xsubとが合致し、
第2発言者レジスタS2の保持内容と発言者Ysubと
が異なる場合は、前回の発言と今回の発言とで、第1の
発言者は同一であるが、第2の発言者が別の発言者に変
化したことになるので、第1音声出力系統は前回のまま
とし、第2発言者レジスタS2に今回判別した発言者Y
subを保持し、第2出力選択レジスタT2に発言者Y
subのみの音声の出力端子の情報を格納し、第2音声
出力系統からは新たな発言者Ysubの音声が出力され
るようにする。
【0096】図11(3)の場合のように、第1発言者
レジスタS1の保持内容と発言者Ysubとが合致し、
第2発言者レジスタS2の保持内容と発言者Xsubと
が合致する場合も、上記(1)の場合と同様に、前回の
同時発言と今回の同時発言とで発言者は同一であるの
で、前回の選択出力を変更することなく、前回の同時発
言と同様に第1音声出力系統及び第2音声出力系統から
各発言者の分離再生音声を選択して出力する。
【0097】図11(4)の場合のように、第1発言者
レジスタS1の保持内容と発言者Ysubとが合致し、
第2発言者レジスタS2の保持内容と発言者Xsubと
が異なる場合は、前回の発言と今回の発言とで、第1の
発言者は同一であるが、第2の発言者が別の発言者に変
化したことになるので、第1音声出力系統は前回のまま
とし、第2発言者レジスタS2に今回判別した発言者X
subを保持し、第2出力選択レジスタT2に発言者X
subのみの音声の出力端子の情報を格納し、第2音声
出力系統からは新たな発言者Xsubの分離再生音声が
出力されるようにする。
【0098】図11(5)の場合のように、第1発言者
レジスタS1の保持内容と発言者Xsub及び発言者Y
subとが異なり、第2発言者レジスタS2の保持内容
と発言者Xsubが合致する場合は、前回の発言と今回
の発言とで、第2の発言者Xsubは同一であるが、第
1の発言者がこれまでと異なる発言者Ysubに変化し
たことになるので、第2音声出力系統は前回のままと
し、第1発言者レジスタS1に今回判別した発言者Ys
ubを保持し、第1出力選択レジスタT1に発言者Ys
ubのみの音声の出力端子の情報を格納し、第1音声出
力系統からは新たな発言者Ysubの分離再生音声が出
力されるようにする。
【0099】図11(6)の場合のように、第1発言者
レジスタS1の保持内容と発言者Xsub及び発言者Y
subとが異なり、第2発言者レジスタS2の保持内容
と発言者Ysubが合致する場合は、前回の発言と今回
の発言とで、第2の発言者Ysubは同一であるが、第
1の発言者が別の発言者Xsubに変化したことになる
ので、第2音声出力系統は前回のままとし、第1発言者
レジスタS1に今回判別した発言者Xsubを保持し、
第1出力選択レジスタT1に発言者Xsubのみの音声
の出力端子の情報を格納し、第1音声出力系統からは新
たな発言者Xsubの分離再生音声が出力されるように
する。
【0100】図11(7)の場合のように、第1発言者
レジスタS1の保持内容と発言者Xsub及び発言者Y
subとが異なり、第2発言者レジスタS2の保持内容
と発言者Xsub及び発言者Ysubとが異なる場合
は、前回の発言と今回の発言とで、第1の発言者及び第
2の発言者がともに別の発言者Xsub及びYsubに
変化したことになるので、第1発言者レジスタS1に今
回判別した発言者Xsubを保持し、第1出力選択レジ
スタT1に発言者Xsubのみの音声の出力端子の情報
を格納し、第1音声出力系統からは新たな発言者Xsu
bの分離再生音声が出力されるようにし、第2発言者レ
ジスタS2に今回判別した発言者Ysubを保持し、第
2出力選択レジスタT2に発言者Ysubのみの音声の
出力端子の情報を格納し、第2音声出力系統からは新た
な発言者Ysubの分離再生音声が出力されるようにす
る。
【0101】上述した処理、即ち、各録音再生部の音声
出力パターンから会議における発言パターンを判別し、
聴取対象者の分離再生音声を出力するための処理のフロ
ーを以下に示す。図12及び図13は録音再生部の出力
端R1,R2,R3の音声出力から音声出力パターンを
特定する処理のフローを示す。
【0102】図12において、「R1=0?」、「R2
=0?」、「R3=0?」の判定は、各録音再生部の出
力端R1,R2,R3の出力が無音であるか否かの判定
を表し、「Yes」は無音であること、「No」は発言
音声が出力されていることを表している。
【0103】また、図12において、(000)は各出
力端R1,R2,R3の出力は無音であることを表し、
この場合は誰も発言していない、即ち全参加者無発言の
状態であると判別される。また、(X00)は出力端R
1のみから発言音声が出力され、出力端R2,R3は無
音出力であることを表し、この場合は発言音声Xが加入
者Aのもので1者発言あると判別される。
【0104】また、(0X0)は出力端R2のみから発
言音声が出力され、出力端R1,R3は無音出力である
ことを表し、この場合は発言音声Xが加入者Bのもので
1者発言あると判別される。また、(00X)は出力端
R3のみから発言音声が出力され、出力端R1,R2は
無音出力であることを表し、この場合は発言音声Xが加
入者Dのもので1者発言あると判別される。
【0105】また、(XY0)は出力端R1,R2から
発言音声が出力され、出力端R3は無音出力であること
を表し、この場合、出力端R1と出力端R2の出力音声
同士が同一であるかどうかを判定し、同一のときは発言
音声Xが加入者Cのもので1者発言あると判別される。
出力端R1と出力端R2の出力音声が異なるときは、図
9のパターンPTN23の2者発言であると判別され
る。
【0106】また、(X0Y)は出力端R1,R3から
発言音声が出力され、出力端R2は無音出力であること
を表し、この場合、出力端R1と出力端R3の出力音声
同士が同一であるかどうかを判定し、同一のときは発言
音声Xが加入者Eのもので1者発言あると判別される。
出力端R1と出力端R3の出力音声が異なるときは、図
9のパターンPTN22の2者発言であると判別され
る。
【0107】また、(0XY)は出力端R2,R3から
発言音声が出力され、出力端R1は無音出力であること
を表し、この場合、出力端R2と出力端R3の出力音声
同士が同一であるかどうかを判定し、同一のときは発言
音声Xが加入者Fのもので1者発言あると判別される。
出力端R2と出力端R3の出力音声が異なるときは、図
9のパターンPTN21の2者発言であると判別され
る。
【0108】また、(XYZ)は各出力端R1,R2,
R3から発言音声が出力されることを表し、この場合、
図13に示すように出力端R1と出力端R2、出力端R
2と出力端R3、出力端R3と出力端R1のそれぞれの
出力音声同士が同一であるかどうかを判定する。
【0109】R2=R3、かつR1=R3の場合、即ち
各出力端R1,R2,R3から出力される発言音声が全
て等しいと判定されたときは、発言音声Xが加入者Gの
もので1者発言あると判別される。R2=R3、かつR
1≠R3の場合、即ち出力端R1の音声出力が他と異な
り、出力端R2と出力端R3の出力音声が同一であると
きは、図9のパターンPTN26の2者発言であると判
別される。
【0110】R2≠R3、かつR1=R3の場合、即ち
出力端R2の音声出力が他と異なり、出力端R1と出力
端R3の出力音声が同一であるときは、図9のパターン
PTN25の2者発言であると判別される。R2≠R
3、R1≠R3、かつR1=R2の場合、即ち出力端R
3の音声出力が他と異なり、出力端R1と出力端R2の
出力音声が同一であるときは、図9のパターンPTN2
4の2者発言であると判別される。R2≠R3、R1≠
R3、かつR1≠R2の場合、即ち各出力端R1,R
2,R3から出力される発言音声が全て異なるとき、図
9のパターンPTN27の2者発言であると判別され
る。
【0111】図14は全参加者無発言時の処理フローを
示し、図12の判定フローにおいて全参加者が無発言で
あると判別された場合、第1発言者レジスタS1の保持
内容をクリアし、第2発言者レジスタS2の保持内容を
クリアし、第1出力選択レジスタT1に無音の出力端R
0を格納し、第2出力選択レジスタT2に無音の出力端
R0を格納する。
【0112】図15は1者発言の場合の出力選択処理フ
ローを示す。図12及び図13の判定フローにより発言
音声が1者の発言音声であり、該発言音声が発言者Aの
ものと判別された場合、助変数OUTに出力端R1の情
報を格納し、該発言音声が発言者B又はCのものと判別
された場合、助変数OUTに出力端R2の情報を格納
し、該発言音声が発言者D,E,F又はGのものと判別
された場合、助変数OUTに出力端R3を示す情報を格
納する。なお、助変数OUTはメモリ上の或る情報格納
領域を表すが、ハードウェアによる記憶回路として構成
したものであっても良い。
【0113】そして、第1発言者レジスタS1に記憶保
持されている前回の発言者と今回の発言者Xとが合致す
るかどうかを判定し、合致する場合、第2発言者レジス
タS2をクリアし、第1出力選択レジスタT1に助変数
OUTの格納情報を設定し、第2出力選択レジスタT2
に無音出力端R0を設定する。こうして前回から引続き
発言し、第1音声出力系統から出力されている発言者の
音声は、今回の1者発言でも第1音声出力系統から継続
して出力される。
【0114】また、第1発言者レジスタS1に記憶保持
されている前回の発言者と今回の発言者Xとが異なる場
合、第2発言者レジスタS2に記憶保持されている前回
の発言者と今回の発言者Xとが合致するかどうかを判定
し、合致する場合、第1発言者レジスタS1をクリア
し、第2出力選択レジスタT2に助変数OUTの格納情
報を設定し、第1出力選択レジスタT1に無音出力端R
0を設定する。こうして前回から引続き発言し、第2音
声出力系統から出力されている発言者の音声は、今回の
1者発言でも第2音声出力系統から継続して出力され
る。
【0115】また、第1発言者レジスタS1及び第2発
言者レジスタS2に記憶保持されている前回の何れの発
言者とも今回の発言者Xとが異なる場合、前回と異なる
発言者が今回発言したことになり、該発言者Xを第1発
言者レジスタS1に保持し、第2発言者レジスタS2を
クリアし、第1出力選択レジスタT1に助変数OUTの
格納情報を設定し、第2出力選択レジスタT2に無音出
力端R0を設定する。こうして、新たな1者の発言者は
第1音声出力系統から出力される。
【0116】図16〜図20は2者発言の場合の発言者
の判別及び出力選択の処理フローを示す。まず、同時発
言音声出力パターンがPTN21〜PTN27の何れで
あるかを判定する。そして同時発言音声出力パターンP
TN21である場合、出力端R2,R3の音声が同時発
言であるか否かを判定する。
【0117】出力端R2の音声が同時発言音声である場
合、助変数SUB1に加入者Bの情報を格納し、助変数
SUB2に加入者Fの情報を格納し、助変数OUT1に
出力端R5の情報を格納し、助変数OUT2に出力端R
3の情報を格納する。
【0118】また、出力端R3の音声が同時発言音声で
ある場合、助変数SUB1に加入者Dの情報を格納し、
助変数SUB2に加入者Fの情報を格納し、助変数OU
T1に出力端R5の情報を格納し、助変数OUT2に出
力端R2の情報を格納する。
【0119】また、出力端R2及び出力端R3の音声が
共に同時発言音声でない場合、助変数SUB1に加入者
Bの情報を格納し、助変数SUB2に加入者Dの情報を
格納し、助変数OUT1に出力端R2の情報を格納し、
助変数OUT2に出力端R3の情報を格納する。
【0120】次に、同時発言音声出力パターンPTN2
2である場合、出力端R3,R1の音声が同時発言であ
るか否かを判定する。出力端R3の音声が同時発言音声
である場合、助変数SUB1に加入者Dの情報を格納
し、助変数SUB2に加入者Eの情報を格納し、助変数
OUT1に出力端R6の情報を格納し、助変数OUT2
に出力端R1の情報を格納する。
【0121】また、出力端R1の音声が同時発言音声で
ある場合、助変数SUB1に加入者Aの情報を格納し、
助変数SUB2に加入者Eの情報を格納し、助変数OU
T1に、出力端R6の反転出力(180度位相をずらし
たもの)を示す情報−R6を格納し、助変数OUT2に
出力端R3の情報を格納する。
【0122】また、出力端R3及び出力端R1の音声が
共に同時発言音声でない場合、助変数SUB1に加入者
Aの情報を格納し、助変数SUB2に加入者Dの情報を
格納し、助変数OUT1に出力端R1の情報を格納し、
助変数OUT2に出力端R3の情報を格納する。
【0123】次に、同時発言音声出力パターンPTN2
3である場合、出力端R1,R2の音声が同時発言であ
るか否かを判定する。出力端R1の音声が同時発言音声
である場合、助変数SUB1に加入者Aの情報を格納
し、助変数SUB2に加入者Cの情報を格納し、助変数
OUT1に出力端R4の情報を格納し、助変数OUT2
に出力端R2の情報を格納する。
【0124】また、出力端R2の音声が同時発言音声で
ある場合、助変数SUB1に加入者Bの情報を格納し、
助変数SUB2に加入者Cの情報を格納し、助変数OU
T1に出力端R4の反転出力−R4の情報を格納し、助
変数OUT2に出力端R1の情報を格納する。
【0125】また、出力端R1及び出力端R2の音声が
共に同時発言音声でない場合、助変数SUB1に加入者
Aの情報を格納し、助変数SUB2に加入者Bの情報を
格納し、助変数OUT1に出力端R1の情報を格納し、
助変数OUT2に出力端R2の情報を格納する。
【0126】次に、同時発言音声出力パターンPTN2
4である場合、出力端R2,R3の音声が同時発言であ
るか否かを判定する。出力端R2の音声が同時発言音声
である場合、助変数SUB1に加入者Cの情報を格納
し、助変数SUB2に加入者Gの情報を格納し、助変数
OUT1に出力端R5の情報を格納し、助変数OUT2
に出力端R3の情報を格納する。
【0127】また、出力端R3の音声が同時発言音声で
ある場合、助変数SUB1に加入者Dの情報を格納し、
助変数SUB2に加入者Gの情報を格納し、助変数OU
T1に出力端R5の反転出力−R5の情報を格納し、助
変数OUT2に出力端R1の情報を格納する。
【0128】また、出力端R2及び出力端R3の音声が
共に同時発言音声でない場合、助変数SUB1に加入者
Cの情報を格納し、助変数SUB2に加入者Dの情報を
格納し、助変数OUT1に出力端R1の情報を格納し、
助変数OUT2に出力端R3の情報を格納する。
【0129】次に、同時発言音声出力パターンPTN2
5である場合、出力端R1,R2の音声が同時発言であ
るか否かを判定する。出力端R1の音声が同時発言音声
である場合、助変数SUB1に加入者Eの情報を格納
し、助変数SUB2に加入者Gの情報を格納し、助変数
OUT1に出力端R4の情報を格納し、助変数OUT2
に出力端R2の情報を格納する。
【0130】また、出力端R2の音声が同時発言音声で
ある場合、助変数SUB1に加入者Bの情報を格納し、
助変数SUB2に加入者Gの情報を格納し、助変数OU
T1に出力端R4の反転出力−R4の情報を格納し、助
変数OUT2に出力端R1の情報を格納する。
【0131】また、出力端R1及び出力端R2の音声が
共に同時発言音声でない場合、助変数SUB1に加入者
Bの情報を格納し、助変数SUB2に加入者Eの情報を
格納し、助変数OUT1に出力端R2の情報を格納し、
助変数OUT2に出力端R1の情報を格納する。
【0132】次に、同時発言音声出力パターンPTN2
6である場合、出力端R1,R2の音声が同時発言であ
るか否かを判定する。出力端R1の音声が同時発言音声
である場合、助変数SUB1に加入者Aの情報を格納
し、助変数SUB2に加入者Gの情報を格納し、助変数
OUT1に出力端R4の情報を格納し、助変数OUT2
に出力端R2の情報を格納する。
【0133】また、出力端R2の音声が同時発言音声で
ある場合、助変数SUB1に加入者Fの情報を格納し、
助変数SUB2に加入者Gの情報を格納し、助変数OU
T1に出力端R4の反転出力−R4の情報を格納し、助
変数OUT2に出力端R1の情報を格納する。
【0134】また、出力端R1及び出力端R2の音声が
共に同時発言音声でない場合、助変数SUB1に加入者
Aの情報を格納し、助変数SUB2に加入者Fの情報を
格納し、助変数OUT1に出力端R1の情報を格納し、
助変数OUT2に出力端R2の情報を格納する。
【0135】次に、同時発言音声出力パターンPTN2
7である場合、出力端R1,R2の音声が同時発言であ
るか否かを判定する。出力端R1の音声が同時発言音声
である場合、助変数SUB1に加入者Cの情報を格納
し、助変数SUB2に加入者Eの情報を格納し、助変数
OUT1に出力端R2の情報を格納し、助変数OUT2
に出力端R3の情報を格納する。
【0136】また、出力端R2の音声が同時発言音声で
ある場合、助変数SUB1に加入者Cの情報を格納し、
助変数SUB2に加入者Fの情報を格納し、助変数OU
T1に出力端R1の情報を格納し、助変数OUT2に出
力端R3の情報を格納する。
【0137】また、出力端R1及び出力端R2の音声が
共に同時発言音声でない場合、助変数SUB1に加入者
Eの情報を格納し、助変数SUB2に加入者Fの情報を
格納し、助変数OUT1に出力端R1の情報を格納し、
助変数OUT2に出力端R2の情報を格納する。
【0138】図20は、図16〜図19の同時発言者の
判別フローにより判別された今回の同時発言者の音声
を、第1音声出力系統又は第2音声出力系統からどのよ
うに選択して出力するかを決定する出力選択の処理フロ
ーを示す。この選択処理の基本的な動作原理は、図11
で説明した選択制御の動作原理と同様である。
【0139】即ち、第1音声出力系統又は第2音声出力
系統が、発言者の分離再生音声をどのように選択して出
力するかは、前回の発言パターンと今回の発言パターン
との変化のパターンに依存し、第1発言者レジスタS1
及び第2発言者レジスタS2に記憶保持された前回の第
1及び第2の発言者情報と、助変数SUB1及びSUB
2として記憶保持された今回の第1及び第2の発言者と
を比較し、それらが一致するかどうかによって出力選択
を制御し、前回と今回とで同一発言者の音声が同一の音
声出力系統から連続して出力されるように制御する。
【0140】従って、図20に示すように、第1発言者
レジスタS1の保持内容と助変数SUB1の内容とが合
致し、第2発言者レジスタS2の保持内容と助変数SU
B2の内容とが合致する場合(1)は、前回の同時発言
と今回の同時発言とで発言者は同一であるので、前回の
選択出力を変更することなく、前回の同時発言と同様に
第1音声出力系統及び第2音声出力系統から各発言者の
分離再生音声を選択して出力する。
【0141】また、第1発言者レジスタS1の保持内容
と助変数SUB1の内容とが合致し、第2発言者レジス
タS2の保持内容と助変数SUB2の内容とが異なる場
合(2)は、前回の発言と今回の発言とで、第1の発言
者は同一であるが、第2の発言者が別の発言者に変化し
たことになるので、第1音声出力系統は前回のままと
し、第2発言者レジスタS2に今回判別した助変数SU
B2の発言者を保持し、第2出力選択レジスタT2に助
変数SUB2の発言者のみの音声の出力端子の情報を格
納し、第2音声出力系統からは新たな助変数SUB2の
発言者音声が出力されるようにする。
【0142】また、第1発言者レジスタS1の保持内容
と助変数SUB2の内容とが合致し、第2発言者レジス
タS2の保持内容と助変数SUB1の内容とが合致する
場合(3)も、上記(1)の場合と同様に、前回の同時
発言と今回の同時発言とで発言者は同一であるので、前
回の選択出力を変更することなく、前回の同時発言と同
様に第1音声出力系統及び第2音声出力系統から各発言
者の分離再生音声を選択して出力する。
【0143】また、第1発言者レジスタS1の保持内容
と助変数SUB2とが合致し、第2発言者レジスタS2
の保持内容と助変数SUB1とが異なる場合(4)は、
前回の発言と今回の発言とで、第1の発言者は同一であ
るが、第2の発言者が別の発言者に変化したことになる
ので、第1音声出力系統は前回のままとし、第2発言者
レジスタS2に今回判別した助変数SUB1の発言者を
保持し、第2出力選択レジスタT2に助変数SUB1の
みの音声の出力端子の情報を格納し、第2音声出力系統
からは新たな助変数SUB1の発言者の分離再生音声が
出力されるようにする。
【0144】また、第1発言者レジスタS1の保持内容
と助変数SUB1及び助変数SUB2の内容とが異な
り、第2発言者レジスタS2の保持内容と助変数SUB
1の内容とが合致する場合(5)は、前回の発言と今回
の発言とで、第2の助変数SUB1の発言者は同一であ
るが、第1の発言者がこれまでと異なる助変数SUB2
の発言者に変化したことになるので、第2音声出力系統
は前回のままとし、第1発言者レジスタS1に今回判別
した助変数SUB2の発言者を保持し、第1出力選択レ
ジスタT1に助変数SUB2の発言者のみの音声の出力
端子の情報を格納し、第1音声出力系統からは新たな助
変数SUB2の発言者の分離再生音声が出力されるよう
にする。
【0145】また、第1発言者レジスタS1の保持内容
と助変数SUB1及び助変数SUB2の内容とが異な
り、第2発言者レジスタS2の保持内容と助変数SUB
2の内容とが合致する場合(6)は、前回の発言と今回
の発言とで、第2の助変数SUB2の発言者は同一であ
るが、第1の発言者が別の助変数SUB1の発言者に変
化したことになるので、第2音声出力系統は前回のまま
とし、第1発言者レジスタS1に今回判別した助変数S
UB1の発言者を保持し、第1出力選択レジスタT1に
助変数SUB1の発言者のみの音声の出力端子の情報を
格納し、第1音声出力系統からは新たな助変数SUB1
の発言者の分離再生音声が出力されるようにする。
【0146】また、第1発言者レジスタS1の保持内容
と助変数SUB1及び助変数SUB2の内容とが異な
り、第2発言者レジスタS2の保持内容と助変数SUB
1及び助変数SUB2の内容とが異なる場合(7)は、
前回の発言と今回の発言とで、第1の発言者及び第2の
発言者がともに別の助変数SUB1及びYsubの発言
者に変化したことになるので、第1発言者レジスタS1
に今回判別した助変数SUB1の発言者を保持し、第1
出力選択レジスタT1に助変数SUB1の発言者のみの
音声の出力端子の情報を格納し、第1音声出力系統から
は新たな助変数SUB1の発言者の分離再生音声が出力
されるようにし、第2発言者レジスタS2に今回判別し
た助変数SUB2の発言者を保持し、第2出力選択レジ
スタT2に助変数SUB2の発言者のみの音声の出力端
子の情報を格納し、第2音声出力系統からは新たな助変
数SUB2の発言者の分離再生音声が出力されるように
する。
【0147】図21はモニター者による音声出力系統の
選択時の処理を示し、モニター者は聴取対象の音声を操
作部により、全参加者(全加入者)の音声か、第1の発
言者のみの音声か、第2の発言者のみの音声か、を選択
する。全参加者の音声が選択されたときは、図2の出力
端RAから出力される全参加者の混合音声の再生音を第
3音声出力系統から出力する。
【0148】また、第1の発言者のみの音声が選択され
たときは、第1音声出力系統により第1出力選択レジス
タT1に設定された出力端(R1〜R6の何れか)から
の再生音を出力する。また、第2の発言者のみの音声が
選択されたときは、第2音声出力系統により第2出力選
択レジスタT2に設定された出力端(R1〜R6の何れ
か)からの再生音を出力する。但し、−R4,−R5,
−R6が設定されている場合は、それぞれ出力端R4,
R5,R6からの再生音を反転させて再生音を出力す
る。
【0149】図22は本発明の会議録音再生装置を適用
したシステム構成例を示し、同図の(a)は、電話回線
を介して会議を行う会議電話システムに適用した構成例
を示し、本発明による会議録音再生装置22−1の制御
は、PB(Push Button )信号により行う。そのため、
PB信号レシーバ22−3を設け、PB信号により受信
した操作信号を制御装置22−3に通知し、制御装置2
2−3により会議録音再生装置22−1の制御を行う。
【0150】一方、同図の(b)は本発明の複数音声録
音再生装置を会議システムにおける独立した装置として
使用する構成例を示している。この構成例における本発
明による会議録音再生装置22−1には会議参加者が直
接ケーブルで又は電話回線を介して接続され、会議録音
再生装置22−1は、キー制御部22−4からのキー操
作信号を基に制御装置22−3は会議録音再生装置22
−1を制御する。
【0151】制御コマンドとしては、通常、第3音声出
力系統からの会議全体の再生音声の出力、第1音声出力
系統からの第1の発言者のみの再生音出力、第2音声出
力系統からの第2の発言者のみの再生音出力、巻き戻
し、再生終了などがある。
【0152】図23は本発明の会議録音再生装置におけ
る録音部までの構成を示す。会議録音再生装置の会議音
声録音回路の前段部には、入力雑音を取除くために、低
レベルフィルタ23−1を備え、また、音声のミキシン
グによる録音レベルの飽和を防ぐために録音レベル減衰
器23−2を備える。
【0153】電話機の送話器又は各会議参加者のマイク
ロホンからの音声を録音する際、該送話器やマイクロホ
ンの周囲の雑音も取り込まれるため、そのまま音声を録
音すると録音雑音が多くなり、発言内容が判別しにくく
なる。そこで、低レベルフィルタ23−1を設け、或る
レベルより入力音のレベルが低い場合は、該入力音を雑
音と見なしてカットし、レベルをゼロとして各グループ
毎の録音再生部の会議音声録音回路に入力する。
【0154】また、各グループ毎の録音再生部の会議音
声録音回路に録音する場合、各会議音声録音回路は
{(N+1)/2}人分の参加者の音声を混合して録音
するため、録音レベルが飽和しないよう録音レベルを最
大許容入力レベルの{2/(N+1)}倍に減衰して録
音する必要がある。そのため、録音レベル減衰器23−
2により録音レベルを減衰させる。
【0155】会議の参加者が7人の場合、4人分の音声
を混合して録音するため、録音レベル減衰器23−2は
各々の入力音声を通常の録音レベルの4分の1に減衰す
る。なお、実際には録音レベル減衰器23−2は、録音
再生部の最大許容入力レベルの{2/(N+1)}にな
るように入力レベル調整するものであり、場合によって
は増幅器となることもある。
【0156】また、本発明の会議録音再生装置では、発
言音声というアナログ信号を基に発言者を特定するディ
ジタル的な処理を行うため、或る決まった周期(例とし
て0.1秒の周期)で各録音再生部の再生音声を比較す
る等の演算を行い、再生音声を評価する。この評価期間
(ここでは0.1秒)中はどの再生音声を出力すべきか
は、評価後でないと判らない。
【0157】そこで図24に示すように、音声出力系統
の前段に評価時間分の音声を蓄積する各出力端R1〜R
6対応の音声出力バッファーB1〜B6を設置すること
により、再生音声を途切れることなく出力することがで
きる。更に、無音出力バッファB0、及び全録音再生部
の出力を加算した音声の全音声出力バッファBAを設置
し、どの音声出力バッファーB1〜B6,B0,BAを
選択するかは、前述したとおり、出力選択制御部24−
1において各録音再生部の音声出力パターンを基に発言
者を判別し、出力バッファーB1〜B6,B0,BAを
選択する指示を出力選択部24−2に通知する。出力選
択部24−2は該指示に従って音声出力バッファーB1
〜B6,B0,BAの1つを選択し、音声出力部に該再
生音声を送出する。出力選択部24−2から音声出力部
に送出された音声信号は、モニター者のスピーカ又は電
話機に送られる。
【0158】本発明の実施形態において、会議参加者が
3人の場合及び7人の場合について説明したが、本発明
はこれに限定されず、更に多数の会議の録音再生にも適
用することができる。図25は会議参加者が15人の場
合の音声出力パターンを示している。参加者15人での
2者同時発言の組み合わせ数は、152 =105通りの
パターンがあり、3バリエーションで割ると35の音声
出力パターンとなる。
【0159】この各音声出力パターンに対して同様に同
時発言の音声を判別することにより、発言パターンを判
別することができ、各録音再生部の出力端又はそれらの
差分出力端のうち、どの出力端から聴取対象の発言者の
音声が分離再生されるかを選別することができる。
【0160】なお、同図において“0”は無音を表し、
“X”,“Y”,“Z”は、第1の発言者の音声をA、
第2の発言者の音声をBとする、(X,X)は(A,
A)又は(B,B)の音声パターンを表し、(X,Y)
は(A,B)、(A,A+B)又は(B,A+B)の音
声組合わせのパターンを表し、(X,Y,Z)は(A,
B,A+B)の音声組合わせのパターンを表している。
【0161】(付記1)各音声入力信号が1つ又は複数
のグループに帰属するようにし、かつ各グループに帰属
する音声信号入力の組合わせが各グループ毎に異なるよ
うに各音声入力信号を複数のグループにグループ化し、
該グループ内の音声入力信号を該グループ毎の録音再生
部に混合して録音する手段と、前記各グループ毎の録音
再生部の再生音声信号を、他のグループの録音再生部の
再生音声信号で減じて相殺し合った音声信号を出力する
相殺音声出力手段と、前記グループ毎の録音再生部の各
出力端と前記相殺音声出力手段の各出力端の何れか1つ
を選択して再生音声を出力する再生音声選択出力手段
と、を備えたことを特徴とする複数音声録音再生装置。 (付記2)前記グループ毎の録音再生部は、全音声入力
信号数がNであるとき、2を底とする(N+1)の対数
の小数部を切上げた整数値とした個数分設けたことを特
徴とする付記1に記載の複数音声録音再生装置。 (付記3)各音声入力信号対応の自動利得制御器を介し
て音声が入力される前記各グループ毎の録音再生部の再
生音声信号が無音であるかどうかを判別する無音判別手
段と、各グループ毎の録音再生部の再生音声信号を他の
グループの録音再生部の再生音声信号と比較し、該比較
対象のグループ毎の録音再生部の再生音声信号同士が同
一の音声信号であるかどうかを判別する同一音声判別手
段と、前記各グループ毎の録音再生部の再生音声出力レ
ベルを自動利得制御器の規定ピークレベルと比較し、該
録音再生部の再生音声信号が同時発言の音声信号である
かどうかを判別する同時発言音声判別手段と、各グルー
プ毎の録音再生部の再生音声信号を基に、前記無音判別
手段、同一音声判別手段及び同時発言音声判別手段によ
り、該録音再生装置の再生音声信号が1人の発言のもの
か同時発言のものかを判別し、かつどの音声入力信号で
あるかを判別する音声入力信号判別手段と、を備えたこ
とを特徴とする付記1又は2に記載の複数音声録音再生
装置。 (付記4)前記再生音声選択出力手段は、前記グループ
毎の録音再生部の各出力端と前記相殺音声出力手段の各
出力端の中から、前記音声入力信号判別手段により判別
された音声入力信号のみが出力される出力端を選択する
ことを特徴とする付記3に記載の複数音声録音再生装
置。 (付記5)前記再生音声選択出力手段は、第1の発言者
の再生音声信号が出力される出力端を選択する第1音声
出力系統と、第2の発言者の再生音声信号が出力される
出力端を選択する第2音声出力系統とを備え、発言者の
組合わせが変化しても同一発言者の音声信号が引続き出
力される場合、該同一発言者の音声信号を該変化前に出
力していた第1音声出力系統又は第2音声出力系統から
継続して出力するように再生音声信号の出力端の選択制
御を行うことを特徴とする付記4に記載の複数音声録音
再生装置。 (付記6)前記無音判別手段、同一音声判別手段及び同
時発言音声判別手段は、所定の単位時間の再生音声毎
に、それぞれ無音であるか、同一音声であるか、同時発
言音声であるかを判別することを特徴とする付記3乃至
5の何れかに記載の複数音声録音再生装置。 (付記7)再生音声選択出力の処理に要する少なくとも
前記所定の単位時間、再生音声を蓄積する音声出力バッ
ファーを備え、該音声出力バッファーから再生音声を途
切れることなく出力することを特徴とする付記6記載の
複数音声録音再生装置。 (付記8)録音部の前段に、発言音声より低レベルの雑
音を除去する低レベルフィルタと、混合音声が最大許容
入力レベルを超えないように各発言者からの入力音声を
減するする録音レベル減衰器と、を備えたことを特徴と
する付記1乃至7の何れかに記載の複数音声録音再生装
置。
【0162】
【発明の効果】以上説明したように、本発明によれば、
会議の参加者を或る規則に従ってグループ化し、各参加
者を1つ又は複数のグループに帰属させて該グループ内
の発言音声を混合して録音し、各グループ毎の録音再生
部から出力される再生音声に対して、2者同時発言の音
声を個々の発言音声に分離して出力することにより、参
加者数より大幅に少ないチャンネル数の録音再生部を使
用して同時発言音声を分離再生することが可能になる。
【0163】また、各グループ毎の録音再生部の音声出
力パターンを基に、発言者を特定し、該発言者のみの分
離再生音声が出力される出力端を選択して再生音声を出
力することにより、自動的に特定の発言者のみの分離再
生音声を出力することが可能となる。
【0164】また、第1の発言者のみの分離再生音声を
出力する音声出力系統及び第2の発言者のみの分離再生
音声を出力する音声出力系統を備えることにより、同時
発言者の組合わせが変化した場合でも、同一発言者の再
生音声を同一の音声出力系統から出力することができ
る。
【0165】また、再生音を一時的に蓄積する音声出力
バッファーを備えることにより、再生音声を途切れるこ
となく出力することができ、更に、録音部の前段に低レ
ベルフィルタ及び録音レベル減衰器を備えることによ
り、録音雑音を低減し、歪の無い音声を録音再生するこ
とができる。
【図面の簡単な説明】
【図1】本発明の会議録音再生装置における多重録音回
路の構成例を示す図である。
【図2】本発明の会議録音再生装置における分離再生回
路の構成例を示す図である。
【図3】各録音再生部の録音・再生出力音声ミックスパ
ターンを示す図である。
【図4】各録音再生部からの同時発言再生音声出力を示
す図である。
【図5】各録音再生部からの同時発言再生音声出力を示
す図である。
【図6】同一音声判別手段の処理フロー及び回路構成を
示す図である。
【図7】同時発言音声判別手段の処理フロー及び回路構
成を示す図である。
【図8】無音判別手段の処理フローを示す図である。
【図9】各録音再生部の音声出力パターンを示す図であ
る。
【図10】各録音再生部の音声出力パターンのバリエー
ションを示す図である。
【図11】第1及び第2音声出力系統の分離再生音声選
択制御の例を示す図である。
【図12】録音再生部の音声出力から音声出力パターン
を特定する処理のフローを示す図である。
【図13】録音再生部の音声出力から音声出力パターン
を特定する処理のフローを示す図である。
【図14】全参加者無発言時の処理フローを示す図であ
る。
【図15】1者発言の場合の出力選択処理フローを示す
図である。
【図16】2者発言の場合の発言者の判別及び出力選択
の処理フローを示す図である。
【図17】2者発言の場合の発言者の判別及び出力選択
の処理フローを示す図である。
【図18】2者発言の場合の発言者の判別及び出力選択
の処理フローを示す図である。
【図19】2者発言の場合の発言者の判別及び出力選択
の処理フローを示す図である。
【図20】2者発言の場合の発言者の判別及び出力選択
の処理フローを示す図である。
【図21】モニター者による音声出力系統の選択時の処
理を示す図である。
【図22】会議録音再生装置を適用したシステム構成例
を示す図である。
【図23】会議録音再生装置における録音部までの構成
を示す図である。
【図24】分離再生音声の出力端に音声出力バッファを
備えた構成例を示す図である。
【図25】会議参加者が15人の場合の音声出力パター
ンを示す図である。
【符号の説明】
1−1,1−2,1−3 音声加算器 1−4,1−5,1−6 録音再生部 2−1,2−2,2−3 音声差分器 2−4 音声加算器 2−5 選択スイッチ 2−6 音声出力装置 10 会議音声多重録音回路 20 会議音声分離再生回路 AGC 自動利得制御器 R1〜R6,RA 出力端

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 各音声入力信号が1つ又は複数のグルー
    プに帰属するようにし、かつ各グループに帰属する音声
    信号入力の組合わせが各グループ毎に異なるように各音
    声入力信号を複数のグループにグループ化し、該グルー
    プ内の音声入力信号を該グループ毎の録音再生部に混合
    して録音する手段と、 前記各グループ毎の録音再生部の再生音声信号を、他の
    グループの録音再生部の再生音声信号で減じて相殺し合
    った音声信号を出力する相殺音声出力手段と、 前記グループ毎の録音再生部の各出力端と前記相殺音声
    出力手段の各出力端の何れか1つを選択して再生音声を
    出力する再生音声選択出力手段と、 を備えたことを特徴とする複数音声録音再生装置。
  2. 【請求項2】 前記グループ毎の録音再生部は、全音声
    入力信号数がNであるとき、2を底とする(N+1)の
    対数の小数部を切上げた整数値とした個数分設けたこと
    を特徴とする請求項1に記載の複数音声録音再生装置。
  3. 【請求項3】 各音声入力信号対応の自動利得制御器を
    介して音声が入力される前記各グループ毎の録音再生部
    の再生音声信号が無音であるかどうかを判別する無音判
    別手段と、 各グループ毎の録音再生部の再生音声信号を他のグルー
    プの録音再生部の再生音声信号と比較し、該比較対象の
    グループ毎の録音再生部の再生音声信号同士が同一の音
    声信号であるかどうかを判別する同一音声判別手段と、 前記各グループ毎の録音再生部の再生音声出力レベルを
    自動利得制御器の規定ピークレベルと比較し、該録音再
    生部の再生音声信号が同時発言の音声信号であるかどう
    かを判別する同時発言音声判別手段と、 各グループ毎の録音再生部の再生音声信号を基に、前記
    無音判別手段、同一音声判別手段及び同時発言音声判別
    手段により、該録音再生装置の再生音声信号が1人の発
    言のものか同時発言のものかを判別し、かつどの音声入
    力信号であるかを判別する音声入力信号判別手段と、 を備えたことを特徴とする請求項1又は2に記載の複数
    音声録音再生装置。
  4. 【請求項4】 前記再生音声選択出力手段は、前記グル
    ープ毎の録音再生部の各出力端と前記相殺音声出力手段
    の各出力端の中から、前記音声入力信号判別手段により
    判別された音声入力信号のみが出力される出力端を選択
    することを特徴とする請求項3に記載の複数音声録音再
    生装置。
  5. 【請求項5】 前記再生音声選択出力手段は、第1の発
    言者の再生音声信号が出力される出力端を選択する第1
    音声出力系統と、第2の発言者の再生音声信号が出力さ
    れる出力端を選択する第2音声出力系統とを備え、発言
    者の組合わせが変化しても同一発言者の音声信号が引続
    き出力される場合、該同一発言者の音声信号を該変化前
    に出力していた第1音声出力系統又は第2音声出力系統
    から継続して出力するように再生音声信号の出力端の選
    択制御を行うことを特徴とする請求項4に記載の複数音
    声録音再生装置。
JP2001246900A 2001-08-16 2001-08-16 複数音声録音再生装置 Withdrawn JP2003060792A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001246900A JP2003060792A (ja) 2001-08-16 2001-08-16 複数音声録音再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001246900A JP2003060792A (ja) 2001-08-16 2001-08-16 複数音声録音再生装置

Publications (1)

Publication Number Publication Date
JP2003060792A true JP2003060792A (ja) 2003-02-28

Family

ID=19076342

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001246900A Withdrawn JP2003060792A (ja) 2001-08-16 2001-08-16 複数音声録音再生装置

Country Status (1)

Country Link
JP (1) JP2003060792A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100418340C (zh) * 2004-12-09 2008-09-10 西安大唐电信有限公司 会议电话语音选择合成的方法
US7599836B2 (en) 2004-05-26 2009-10-06 Nuance Communications, Inc. Voice recording system, recording device, voice analysis device, voice recording method and program
WO2010021154A1 (ja) * 2008-08-22 2010-02-25 ヤマハ株式会社 録音再生装置
KR101328928B1 (ko) 2006-10-26 2013-11-14 엘지전자 주식회사 이동통신 단말기의 회의록 작성 방법
JP2015506126A (ja) * 2011-11-24 2015-02-26 アルカテル−ルーセント 会議システムにおけるエコー・キャンセルのための方法および構成

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7599836B2 (en) 2004-05-26 2009-10-06 Nuance Communications, Inc. Voice recording system, recording device, voice analysis device, voice recording method and program
CN100418340C (zh) * 2004-12-09 2008-09-10 西安大唐电信有限公司 会议电话语音选择合成的方法
KR101328928B1 (ko) 2006-10-26 2013-11-14 엘지전자 주식회사 이동통신 단말기의 회의록 작성 방법
WO2010021154A1 (ja) * 2008-08-22 2010-02-25 ヤマハ株式会社 録音再生装置
US8811626B2 (en) 2008-08-22 2014-08-19 Yamaha Corporation Recording/reproducing apparatus
JP2015506126A (ja) * 2011-11-24 2015-02-26 アルカテル−ルーセント 会議システムにおけるエコー・キャンセルのための方法および構成
US9401995B2 (en) 2011-11-24 2016-07-26 Alcatel Lucent Method and arrangement for echo cancellation in conference systems

Similar Documents

Publication Publication Date Title
US10419619B2 (en) Audio processing for multi-participant communication systems
US8175874B2 (en) Personalized voice activity detection
JP4255461B2 (ja) 電話会議用のステレオ・マイクロフォン処理
EP1622349B1 (en) Teleconference volume level monitoring and feedback on the volume level
US20070263823A1 (en) Automatic participant placement in conferencing
US8121307B2 (en) In-vehicle sound control system
JP3483086B2 (ja) 音声電話会議装置
US8358599B2 (en) System for providing audio highlighting of conference participant playout
US20030129956A1 (en) Teleconferencing arrangement
JP6408020B2 (ja) 遠隔会議における知覚的に連続的な混合
JP2007334968A (ja) 音声切換装置
JP2003060792A (ja) 複数音声録音再生装置
JPH0974446A (ja) 音声通信制御装置
JP2009027239A (ja) 通信会議装置
JP3829485B2 (ja) 音声通話装置、音声通話システム、および音声通話方法
JP2000333150A (ja) テレビ会議システム
JP2011019034A (ja) 録音装置
CN113330514B (zh) 多点控制方法、多点电话连接系统及记录介质
JPH07226930A (ja) 通信会議システム
KR100407934B1 (ko) 교환기에서비밀통화를제공하는다자간통화시스템
JP4138565B2 (ja) 多チャネル音声損失制御装置、方法、及び多チャネル音声損失制御プログラム
JP2023107364A (ja) コミュニケーション装置及びコミュニケーション方法
Phua et al. Spatial speech coding for multi-teleconferencing
JPS61224550A (ja) 音声会議装置における音質劣化防止方式
JPH04290049A (ja) ガイダンス音声作成方法

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20081104