JP3636896B2 - 音声信号加算装置 - Google Patents

音声信号加算装置 Download PDF

Info

Publication number
JP3636896B2
JP3636896B2 JP25064198A JP25064198A JP3636896B2 JP 3636896 B2 JP3636896 B2 JP 3636896B2 JP 25064198 A JP25064198 A JP 25064198A JP 25064198 A JP25064198 A JP 25064198A JP 3636896 B2 JP3636896 B2 JP 3636896B2
Authority
JP
Japan
Prior art keywords
terminals
voiced
addition
terminal
unvoiced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP25064198A
Other languages
English (en)
Other versions
JP2000083106A (ja
Inventor
実 赤松
Original Assignee
日本電気エンジニアリング株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気エンジニアリング株式会社 filed Critical 日本電気エンジニアリング株式会社
Priority to JP25064198A priority Critical patent/JP3636896B2/ja
Publication of JP2000083106A publication Critical patent/JP2000083106A/ja
Application granted granted Critical
Publication of JP3636896B2 publication Critical patent/JP3636896B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は音声信号加算装置及びそれに用いる加算方法並びにその制御プログラムを記録した記録媒体に関し、特に多地点テレビ会議装置や電話会議装置等の複数の端末からの音声データを加算する装置に関する。
【0002】
【従来の技術】
従来、電話会議装置や多地点テレビ会議装置においては、複数の端末間を同時に網接続し、相互に音声データを伝送する機能を有している。この場合、これらの装置では複数の地点からの音声データを加算している。
【0003】
音声データを加算する方式としては、全端末の音声データを単純に加算した場合の雑音重畳を軽減し、明瞭度を向上する手段として、発声している端末の音声データだけを選択して加算する第一の方法や、無声の端末に減衰を加えて加算する第二の方法等が知られている。
【0004】
この加算方式については、「会議電話用中継装置の設計法」(電子情報通信学会通信方式研究会CS84−3,1984)等に述べられている。また、接続する端末数が比較的多い場合(例えば、10地点以上)には、上記の第一の方法や第二の方法等の制御が不可欠となる。
【0005】
多地点間通信等の音声加算に関しては、特開平4−084553号公報(以下、第一の公報とする)に開示された音声ミキシング回路の技術がある。この場合、音声ミキシング回路にはエコー重畳の軽減を目的として有声/無声を判定する手段と、一定時間優先選択する手段とが付加されている。
【0006】
一定時間優先選択する手段は有声が複数の場合に特定のN個の音声を選択するという制御、つまり上記の第一の方法に相当する制御が行われている。このN個を選択する方法としては、単純に有声となった時刻順にN個を選択する方法が用いられている。
【0007】
また、特開平6−292198号公報(以下、第二の公報とする)に記載の話者判定方式では、映像情報を含むテレビ会議端末における音声検出による画像自動切替において、自然度を向上することを目的とし、有声/無声を判定する手段と、有声時間長を記憶する手段とを用いている。
【0008】
この方法では有声が複数の場合に、過去の有声時間長の長い音声を優先選択する方法が用いられ、表示映像が切替えられている。話者判定には「有音頻度」が用いられ、優先判定には前回選択の話者を優先する方式が用いられている。
【0009】
さらに、特開平7−15535号公報(以下、第三の公報とする)に記載の多地点間通信制御装置は、上記の多地点間通信等の音声加算に関するものである。この多地点間通信制御装置では雑音重畳(雑音増大)の軽減を目的とし、音声レベルを検出する手段と、しきい値以下の場合に接続地点数に応じたレベル減衰を加える手段とが用いられている。つまり、多地点間通信制御装置では上記の第二の方法に相当する制御が行われている。
【0010】
【発明が解決しようとする課題】
上述した従来の音声データの加算方法では、第一及び第二の方法や第一の公報記載の技術の場合、雑音の重畳を減らす効果が大きい。しかしながら、会議参加端末数に比べて加算する地点数が少ないため、臨場感に乏しく、発声者が変わる時に周囲雑音も変動するので、自然度が損なわれてしまうという問題がある(図4参照)。
【0011】
また、第二の方法や第三の公報記載の技術では会議参加端末数が少ない場合(例えば、数地点の場合)に臨場感がでるが、端末数が比紋的多い場合(例えば、数十地点の場合)、無声の端末に加える減衰量が接続する端末数に比例するので、減衰量が大きくなり、第一の方法と同様に、発声者が変わる時の周囲雑音の変動が激しくなり、自然度が損なわれてしまうという問題がある。
【0012】
したがって、接続端末数の多いシステム構成の場合には、エコーの重畳やハウリングの発生を防止するために加算数を制限する必要があり、臨場感や自然度を保つためには加算する端末の切替えを極力減らす必要がある。
【0013】
そこで、本発明の目的は上記の問題点を解消し、臨場感や自然度をあまり落とさずにエコーの重畳やハウリングの発生を防止することができる音声信号加算装置及びそれに用いる加算方法並びにその制御プログラムを記録した記録媒体を提供することにある。
【0014】
【課題を解決するための手段】
本発明による音声信号加算装置は、複数の端末の音声信号を加算して雑音重畳を軽減する音声信号加算装置であって、前記複数の端末の音声信号の中から予め設定された加算制限数個の音声信号を選択する加算端末選択手段と、前記加算端末選択手段の選択結果を基に前記複数の端末の音声信号の中から前記加算制限数個の音声信号を選択して常時加算する加算手段とを有し、前記加算端末選択手段は、有声端末の数が前記加算制限数個以下の時にそれらの有声端末を選択しかつ有声端末の数が前記加算制限数個以上の時に過去の発生時間長の長いものから順に前記加算制限数個の端末を選択するよう構成したことを特徴とする。
【0017】
すなわち、本発明の音声信号加算方法は、有声端末が複数の場合に予め決められた端末数Nを常時加算するとともに、有声端末→無声端末の順に優先選択している。また、無声端末の選択方法としては有声状態から無声状態へ移行してからの時間長が短い端末から順に選択している。
【0018】
これによって、加算端末数を制限しつつ、加算端末の切替数を少なくすることが可能となるので、臨場感や自然度をあまり落とさずに、エコーの重畳やハウリングの発生を防止することが可能となる。
【0019】
一般に、電話会議等においては接続する端末数が多い場合でも、数地点の限られた2端末間で会話が進行し、いずれか一方のみが発声する確率が高い。また、発声している端末が無声となっても、再度発声する確率も高い。
【0020】
そこで、本発明の音声信号加算方法では、この特徴に着目し、上記の問題を軽減するために、予め決められた端末数N(例えば、エコーの重畳やハウリングを起こさない最大数)の音声を常時加算するようにしている。この場合、加算端末を選択する方法としては、有声端末→無声端末の順の優先順位で選択している。
【0021】
また、無声端末の加算選択方法としては有声状態から無声状態に移行してからの時間長(以下、無声時間長とする)を比較し、無声時間長が短い端末から順に選択する方法を用いることで、加算端末の切替えを減らし、周囲雑音の変動を減らすとともに、臨場感や自然度を向上させている。
【0022】
上述した方法を採ることで、2端末の対話状態の場合には特に上記の効果が著しいのは明らかである。尚、有声端末の選択方法としては、有声端末の数が端末数N以下の場合にそれらの端末を、有声端末の数が端末数N以上の場合に過去の発生時間長の長いものから順にN台の端末を選択するという従来の第一の方法を用いればよい。
【0023】
さらに、端末数Nの数を極力大きく取りたい場合には加算優先順位の一番高い端末(例えば、過去の有声時間長が最長の端末)以外の加算対象端末(N−1端末)の音声データを減衰させてから加算する方法を用いればよい。
【0024】
さらにまた、端末数N以上の端末が同時に発声している状態の場合、加算されない端末が発生するが、全端末を加算したとしても内容を聞き取ることはできないので問題が生ずることはない。
【0025】
【発明の実施の形態】
次に、本発明の一実施例について図面を参照して説明する。図1は本発明の一実施例による音声信号加算装置の構成を示すブロック図である。図において、本発明の一実施例による音声信号加算装置は音声信号入力端子1−1〜1−Mと、有声/無声判定器2−1〜2−Mと、加算端末選択器3と、M入力選択加算器4と、加算音声出力端子5と、制御メモリ6とから構成されている。
【0026】
Mカ所の端末(図示せず)から送られてくる音声信号[例えば、PCM(Puls Code Modulation)符号化信号]は夫々音声信号入力端子1−1〜1−Mに入力され、有声/無声判定器2−1〜2−Mで有声か無声かが判定される。有声/無声判定器2−1〜2−Mでは、例えば20msec間隔の電力を算出し、算出値をしきい値と比較する等して有声か無声かを判定する。
【0027】
有声/無声判定器2−1〜2−Mの出力であるM個の有声/無声情報信号#1〜#Mは加算端末選択器3に入力される。加算端末選定器3では上記の優先順位にしたがって、M入力選択加算器4で加算されかつ予め決められたN個の端末(以下、加算端末とする)が選択される。
【0028】
M入力選択加算器4は加算端末選択器3からの加算端末情報にしたがってM個の端末からの音声信号#1〜#MのうちのN個の端末からの音声信号を選択して加算する。
【0029】
上記の回路構成は複数のDSP(Digital Signal Processor)(例えば、有声/無声判定を1個/端末、加算端末選択と選択加算とを1個のDSP)で十分実現することができる。また、入力データを時分割にすれば、複数端末の有声/無声判定処理を1個のDSPで実現することができることは言うまでもない。
【0030】
したがって、有声/無声判定、加算端末選択、選択加算の各処理はDSPのプログラムで実現される。制御メモリ6にはこのDSPのプログラムが予め格納されており、ROM(リードオンリメモリ)やフロッピディスク等が使用可能である。
【0031】
図2は本発明の一実施例の処理動作を説明するためのタイムチャートであり、図3は図1の加算端末選択器3の処理動作を示すフローチャートである。これら図1〜図3を参照して本発明の一実施例の処理動作について説明する。
【0032】
尚、図2には端末A〜Dの4個の端末から3個の端末を選択する場合の処理動作を示している。また、図3に示す処理動作は加算端末選択器3が制御メモリ6に格納されたプログラムを実行することで実現される。
【0033】
さらに、図3に示す処理動作において、Mは接続端末数を、Nは加算制限数を、iは有声端末数を、有声カウンタ(n)(図示せず)は有声時間長を、無声カウンタ(n)(図示せず)は無声時間長を夫々示している。
【0034】
加算端末選択器3は有声/無声判定器2−1〜2−Mの出力であるM個の有声/無声情報信号#1〜#Mが入力されると(図3ステップS1)、有声カウンタ(n)及び無声カウンタ(n)を動作させるために検索対象の端末nに初期値1を設定し、有声端末数iを0とする(図3ステップS2)。
【0035】
加算端末選択器3は検索対象の端末nが有声/無声状態に遷移したかを判定し(図3ステップS3)、有声/無声状態に遷移すると、検索対象の端末nの有声カウンタ(n)及び無声カウンタ(n)を0とする(図3ステップS4)。
【0036】
加算端末選択器3は有声状態に遷移したと判定すると、検索対象の端末nの有声カウンタ(n)に1を加算し、有声端末数iに1を加算する(図3ステップS5)。また、加算端末選択器3は無声状態に遷移したと判定すると、検索対象の端末nの無声カウンタ(n)に1を加算する(図3ステップS6)。
【0037】
加算端末選択器3はM個の有声/無声情報信号#1〜#Mに対して上記の処理動作を順次繰返し(図3ステップS3〜S8)、全ての有声/無声情報信号#1〜#Mに対する処理が終了すると、有声端末数iの判定を行う(図3ステップS9)。
【0038】
加算端末選択器3は有声端末数iが加算制限数Nよりも小さければ(i<N)、有声端末(i端末)を全て加算選択するとともに(図3ステップS10)、無声カウンタ(n)の少ない順にN−i端末を選択する(図3ステップS11)。
【0039】
また、加算端末選択器3は有声端末数iが加算制限数Nと同じであれば(i=N)、有声端末(N端末)を全て加算選択し(図3ステップS12)、有声端末数iが加算制限数Nよりも大きければ(i>N)、有声カウンタ(n)の多い端末順にN端末を選択する(図3ステップS13)。
【0040】
上述したように、加算端末選択器3がM入力選択加算器4でN個の加算端末を選択すると、M入力選択加算器4は加算端末選択器3からの加算端末情報にしたがってM個の端末からの音声信号#1〜#MのうちのN個の端末からの音声信号を選択して加算する。
【0041】
例えば、図2に示すように、選択初期値を端末A,B,Cとし、端末Aが有声(t2)→無声(t3)、その後端末Bが有声と遷移した場合、端末A,Bは無声時間長が短いので加算選択される。つまり、2端末間の対話状態では加算端末の切替えが発生しない。
【0042】
t5の時点で端末Dが有声になると、有声端末である端末B,Dと、無声時間長の一番短い端末Aとが選択される。つまり、1個の端末だけ加算端末が切替わる。その後、端末B,Dの順で無声に遷移しても(t6,t7)、加算端末は切替わらない。
【0043】
上述したように、図3に示す本発明の一実施例の処理動作は、図4に示す従来の処理動作の場合と比較して、加算端末の切替えが大幅に削減されることがわかる。
【0044】
このように、加算端末選択器3が有声端末→無声端末の順の優先順位で加算端末を選択し、M入力選択加算器4で予め決められた加算制限数N(例えば、エコーの重畳やハウリングを起こさない最大数)の音声を常時加算するともに、加算端末選択器3が有声状態から無声状態に移行してからの無声時間長を比較し、無声時間長が短い端末から順に選択することによって、加算端末の切替えを減らし、周囲雑音の変動を減らすとともに、臨場感や自然度を向上させることができる。
【0045】
上述した方法を採ることで、2個の端末の対話状態の場合には特に上記の効果が著しいのは明らかである。尚、有声端末の選択方法としては、有声端末の数が加算制限数N以下の場合にそれらの端末を、有声端末の数が加算制限数N以上の場合に過去の発生時間長の長いものから順にN個の端末を選択するという方法を用いればよい。
【0046】
また、加算制限数Nの数を極力大きく取りたい場合には加算優先順位の一番高い端末(例えば、過去の有声時間長が最長の端末)以外の加算対象端末(N−1端末)の音声データを減衰させてから加算する方法を用いればよい。
【0047】
さらに、加算制限数N以上の端末が同時に発声している状態の場合、加算されない端末が発生するが、全端末を加算したとしても内容を聞き取ることはできないので問題が生ずることはない。
【0048】
【発明の効果】
以上説明したように本発明によれば、複数の端末の音声信号を加算して雑音重畳を軽減する音声信号加算装置において、複数の端末の音声信号の中から予め設定された加算制限数個の音声信号を選択し、この選択結果を基に複数の端末の音声信号の中から加算制限数個の音声信号を選択して常時加算することによって、臨場感や自然度をあまり落とさずにエコーの重畳やハウリングの発生を防止することができるという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例による音声信号加算装置の構成を示すブロック図である。
【図2】本発明の一実施例の処理動作を説明するためのタイムチャートである。
【図3】図1の加算端末選択器の処理動作を示すフローチャートである。
【図4】従来例の処理動作を説明するためのタイムチャートである。
【符号の説明】
1−1〜1−M 音声信号入力端子
2−1〜1−M 有声/無声判定器
3 加算端末選択器
4 M入力選択加算器
5 加算音声出力端子
6 制御メモリ

Claims (1)

  1. 複数の端末の音声信号を加算して雑音重畳を軽減する音声信号加算装置であって、前記複数の端末の音声信号の中から予め設定された加算制限数個の音声信号を選択する加算端末選択手段と、前記加算端末選択手段の選択結果を基に前記複数の端末の音声信号の中から前記加算制限数個の音声信号を選択して常時加算する加算手段とを有し、前記加算端末選択手段は、有声端末の数が前記加算制限数個以下の時にそれらの有声端末を選択しかつ有声端末の数が前記加算制限数個以上の時に過去の発生時間長の長いものから順に前記加算制限数個の端末を選択するよう構成したことを特徴とする音声信号加算装置。
JP25064198A 1998-09-04 1998-09-04 音声信号加算装置 Expired - Fee Related JP3636896B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25064198A JP3636896B2 (ja) 1998-09-04 1998-09-04 音声信号加算装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25064198A JP3636896B2 (ja) 1998-09-04 1998-09-04 音声信号加算装置

Publications (2)

Publication Number Publication Date
JP2000083106A JP2000083106A (ja) 2000-03-21
JP3636896B2 true JP3636896B2 (ja) 2005-04-06

Family

ID=17210891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25064198A Expired - Fee Related JP3636896B2 (ja) 1998-09-04 1998-09-04 音声信号加算装置

Country Status (1)

Country Link
JP (1) JP3636896B2 (ja)

Also Published As

Publication number Publication date
JP2000083106A (ja) 2000-03-21

Similar Documents

Publication Publication Date Title
EP0910065B1 (en) Speaking speed changing method and device
US7844454B2 (en) Apparatus and method for providing voice recognition for multiple speakers
US7130404B2 (en) Apparatus and method for providing advanced communication conferencing operations
JPH08146991A (ja) 情報処理装置及びその制御方法
CN113689062B (zh) 智能体协调装置,智能体协调方法以及记录有智能体协调程序的记录介质
EP0817168A1 (en) Reproducing speed changer
CN109243472B (zh) 一种音频处理方法及音频处理系统
JP3636896B2 (ja) 音声信号加算装置
JP2003131686A (ja) 音声と音楽の混合比推定方法及び装置並びにそれを用いたオーディオ装置
JP2001056696A (ja) 音声蓄積再生方法および音声蓄積再生装置
CN113782050B (zh) 声音变调方法、电子设备及存储介质
JPH064088A (ja) 音声音楽判別装置
JP2007096555A (ja) 音声会議システム、端末装置及びそれに用いる話者優先レベル制御方法並びにそのプログラム
JP3081469B2 (ja) 話速変換装置
US5956670A (en) Speech reproducing device capable of reproducing long-time speech with reduced memory
JP2007025039A (ja) 音声再生装置、音声録音再生装置、およびそれらの方法、記録媒体、集積回路
JPH03280699A (ja) 音場効果自動制御装置
JPH1188513A (ja) 多地点間通信制御装置の音声処理装置
JPH09238096A (ja) エコーサプレス方法およびエコーサプレッサ装置
CN114513577A (zh) 数据播放方法及装置
JPH03145698A (ja) 音声合成装置
JP2020086943A (ja) 情報処理装置、情報処理方法、および、プログラム
CN115804108A (zh) 通话环境生成方法、通话环境生成装置、程序
JPS63233645A (ja) 会議演算方式
JP2000267683A (ja) 無音判定方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040921

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050106

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080114

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090114

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090114

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090114

Year of fee payment: 4

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100114

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees