JP2000183962A - 音声会話装置及び方法 - Google Patents

音声会話装置及び方法

Info

Publication number
JP2000183962A
JP2000183962A JP35445998A JP35445998A JP2000183962A JP 2000183962 A JP2000183962 A JP 2000183962A JP 35445998 A JP35445998 A JP 35445998A JP 35445998 A JP35445998 A JP 35445998A JP 2000183962 A JP2000183962 A JP 2000183962A
Authority
JP
Japan
Prior art keywords
voice
delay time
party
unit
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP35445998A
Other languages
English (en)
Inventor
Nobuyuki Washio
信之 鷲尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP35445998A priority Critical patent/JP2000183962A/ja
Publication of JP2000183962A publication Critical patent/JP2000183962A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 対話相手方の状況に応じて遅延時間を調整す
ることで、発話者が話しやすい環境を作り出す音声会話
装置を提供する。 【解決手段】 話者が音声を入力する音声入力部と、入
力された音声を通信プロトコルに合うようにエンコード
するエンコード部と、入力された音声データを相手方に
送信する送信部と、相手方の音声データを受信する受信
部と、受信した相手方の音声データをデコードするデコ
ード部と、相手方の音声を再生出力する音声出力部を備
えた音声会話装置であって、受信部と音声出力部の間に
遅延時間調整バッファの長さを変えることで遅延時間を
調整する遅延時間調整部を備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、有線電話、携帯電
話、無線通信、インターネット電話等の音声会話装置全
般におけるエコー制御に関する。特に、拡声対話システ
ムを用いた音声会話装置におけるエコー制御に関する。
ここで、拡声対話システムとは、ハンドセット/ヘッド
セットを用いずに、マイクロホンとスピーカを用いて通
話する電話機/アプリケーションをいう。なお、ハンド
セットとは電話の受話器のように手で保持する送受話器
を意味し、ヘッドセットとはマイクロホン付きヘッドホ
ンのように手で保持する必要のない送受話器を意味し、
双方ともに話者の口と耳の距離が固定されていることを
特徴とするものである。
【0002】
【従来の技術】近年、通信技術の急速な発達により、通
信可能速度や通信可能なデータ容量は増加の一途をたど
っている。それに伴い、従来は通信レスポンス面から実
用化が困難であると考えられていたインターネットを用
いたテレビ電話等も用いることが可能となってきた。
【0003】ここで、従来の音声会話装置の具体例とし
てパソコンを使ったインターネット電話アプリケーショ
ンについて図1及び図2を参照しながら説明する。図1
はパソコンを使ったインターネット電話アプリケーショ
ンの構成図である。
【0004】図1において、音声入力部はサウンドデバ
イスから入力音声データを取込み、エンコード部へ送
る。エンコード部では受け取った音声データを通信プロ
トコルに合うようにエンコードし、送信部へ送る。送信
部では、受け取ったデータを伝送系のプロトコルに従っ
て発信する。
【0005】受信部は伝送系を伝わってきたデータを受
信しデコード部へ送る。デコード部では、受け取ったデ
ータをデコードし音声出力部へ出力する。音声出力部で
は、受け取ったデータをサウンドデバイスに出力する。
【0006】次に、図2は従来の通話系の概略図であ
る。2台のパソコンPC1とPC2の間では、通話アプ
リケーションが起動されている。ただし、PC1上で起
動されている通話アプリケーションとPC2上で起動さ
れている通話アプリケーションは必ず同一でなければな
らないわけではなく、伝送系のプロトコルが異なる端末
同士であっても、両端末間にプロトコル変換を行うゲー
トウェイを介すれば通話可能であるので、、異なる通話
アプリケーションでも良い。他の音声会話装置である、
有線電話や携帯電話、無線システム等についても、本通
話系と同様に音声入力部、エンコード/デコード部、送
受信部、音声出力部から構成され、異なるのは音声の入
出力デバイス、及び伝送系のプロトコルである。
【0007】
【発明が解決しようとする課題】しかし、従来の音声会
話装置においては、PC2のスピーカから出力された話
者1の音声をPC2のマイクが拾うと、それが発話者側
に採送されることでエコーとなる。この回り込みと呼ば
れる現象によって、遅延時間が一定の範囲内において非
常に話しにくくなるという問題点があった。特に、昨今
の通信技術の発達により、回線速度が上昇したことに伴
って、従来は発生し得なかったエコーによる通話障害が
顕著になってきている。
【0008】かかる問題点を解消するべく、特開昭64
−65936号公報および特開平8―279777号公
報においては、かかるエコーを消去する方法及び装置に
ついて開示されている。
【0009】しかし、実際上エコーを完全に消し去るこ
とは困難であり、エコーによる会話機能の劣化を防止す
るのに十分な性能を得るためには、CPU等の処理負担
が大きくなってしまうという問題点があった。また、本
願発明が問題にしているほどエコーの遅延時間が大きい
場合には、エコーの遅延時間処理のために必要なメモリ
量も膨大となり、他の処理を圧迫するおそれもある。を
正確に把握することが必須の条件となっている。遅延時
間を把握するために、さらに、同時に画像処理等のCP
U等の計算機資源を膨大に必要とするアプリケーション
を動かす必要がある場合等では、音声に対して適正なC
PU処理量を割り振ることも困難となり、エコーを消し
去る処理をCPU負荷の軽いアルゴリズムに変更する必
要が生じるおそれもあり、十分な性能を発揮できる環境
にないことが多いことが予想される。
【0010】本発明は、上記問題点を解消すべく、エコ
ーを消し去るのではなく、エコーが残っていても会話に
支障が出ない程度に遅延時間を調整することで、発話者
が話しやすい環境を作り出す音声会話装置を提供するこ
とを目的とする。
【0011】
【課題を解決するための手段】上記目的を達成するため
に本発明にかかる音声会話装置は、話者が音声を入力す
る音声入力部と、入力された音声データを相手方に送信
する送信部と、相手方の音声データを受信する受信部
と、相手方の音声を再生出力する音声出力部を備えた音
声会話装置であって、音声入力部と送信部の間に入力さ
れた音声を通信プロトコルに合うようにエンコードする
エンコード部を、受信部と音声出力部の間に受信した相
手方の音声データをデコードするデコード部を、受信部
と音声出力部の間に遅延時間を調整する遅延時間調整部
を、それぞれ備えることを特徴とする。
【0012】かかる構成により、話者にとって不確定要
素である相手方の条件に左右されずに、通話系全体とし
てのエコーによる話しにくさを回避するよう、エコーの
遅延時間を調整することができ、話者が話しやすい通話
状態を実現することが可能となる。
【0013】また、本発明にかかる音声会話装置は、遅
延時間調整部において、遅延時間調整バッファの長さを
変えることで遅延時間を調整することが好ましい。バッ
ファの長さで容易に遅延時間を調整することができるか
らである。
【0014】また、本発明にかかる音声会話装置は、遅
延時間を話者が入力することが好ましい。相手方の通話
状況によっては、実際に話者が通話している状況に応じ
て遅延時間を調整する方が効果的な場合も考えられるか
らである。
【0015】また、本発明にかかる音声会話装置は、遅
延時間を自動的に検出する遅延時間検出部を備え、自動
的に遅延時間を調整することが好ましい。遅延時間を的
確に把握することで、より精度良く遅延時間を調整する
ことができるからである。
【0016】また、本発明にかかる音声会話装置は、遅
延時間検出部において、エコーの有無についても自動的
に検出することが好ましい。ハンドセットやヘッドセッ
トでエコーが発生していない場合もあり得るし、拡声通
話でもマイクとスピーカの位置によってはエコーが発生
していない場合もあり得るからである。なお、エコー遅
延時間検出部が相互相関を用いて遅延時間を検出してい
る場合には、相互相関がしきい値より低い場合に相関が
起こっていない、すなわちエコーが発生していないもの
と判断する。
【0017】次に、上記目的を達成するために本発明に
かかる音声を用いた通信方法は、話者が音声を入力する
工程と、入力された音声を相手方に送信する工程と、相
手方の音声を受信する工程と、相手方の音声を再生出力
する工程を含む音声を用いた通信方法であって、話者が
音声を入力する工程と入力された音声を相手方に送信す
る工程の間に入力された音声を通信プロトコルに合うよ
うにエンコードする工程を、相手方の音声を受信する工
程と相手方の音声を再生出力する工程の間に受信した相
手方の音声データをデコードする工程を、相手方の音声
を受信する工程と相手方の音声を再生出力する工程の間
に遅延時間を調整する工程を、それぞれ含むことを特徴
とする。
【0018】かかる構成により、話者にとって不確定要
素である相手方の条件に左右されずに、通話系全体とし
てのエコーによる話しにくさを回避するよう、エコーの
遅延時間を調整することができ、話者が話しやすい通話
状態を実現することが可能となる。
【0019】次に、本発明にかかるコンピュータに実行
させるプログラムを記録したコンピュータ読み取り可能
な記録媒体は、話者が音声を入力するステップと、入力
された音声を相手方に送信するステップと、相手方の音
声を受信するステップと、相手方の音声を再生出力する
ステップを含むコンピュータに実行させるプログラムを
記録したコンピュータ読み取り可能な記録媒体であっ
て、話者が音声を入力するステップと入力された音声を
相手方に送信するステップの間に入力された音声を通信
プロトコルに合うようにエンコードするステップを、相
手方の音声を受信するステップと相手方の音声を再生出
力するステップの間に受信した相手方の音声データをデ
コードするステップを、相手方の音声を受信するステッ
プと相手方の音声を再生出力するステップの間に遅延時
間を調整するステップを、それぞれ含むことを特徴とす
る。
【0020】かかる構成により、コンピュータ上へ当該
プログラムをロードさせ実行することで、話者にとって
不確定要素である相手方の条件に左右されずに、通話系
全体としてのエコーによる話しにくさを回避するよう、
エコーの遅延時間を調整することができ、話者が話しや
すい通話状態を作り出すことのできる音声会話装置が実
現できる。
【0021】
【発明の実施の形態】(実施の形態1)以下、本発明の
実施の形態1にかかる音声会話装置について、図面を参
照しながら説明する。図3は本発明の実施の形態1にか
かる音声会話装置の構成図である。
【0022】図3において、31は音声入力部を、32
はエンコード部を、33は送信部を、34は受信部を、
35はデコード部を、36は遅延時間調整部を、37は
音声出力部を、それぞれ示す。
【0023】遅延時間調整部36は、デコード部35か
ら入力されたデータをFIFOバッファに入れ、遅延さ
せてから音声出力部37へ出力する。このバッファサイ
ズを調整することで、遅延時間の調整をすることができ
る。すなわち、バッファサイズを大きく取ることで、遅
延時間を大きく設定することができ、逆に小さく取るこ
とで、遅延時間を小さく設定することが可能となる。
【0024】図3では、かかる遅延時間調整部36がデ
コード部35と音声出力部37の間に配置されている
が、全体の遅延時間を調整できれば良いので、音声入力
部31とエンコード部32の間、エンコード部32と送
信部33の間、または受信部34とデコード部35の間
等に配置されていても同様の効果が期待できる。
【0025】また、遅延時間調整のためのバッファは独
立した単体である必要はない。したがって、既存の処理
部のバッファを用いて調整することも可能であるし、バ
ッファを複数個有していても良い。
【0026】次に、本実施の形態1の一実施例について
説明する。図4はインターネットを介して通話するパソ
コンを用いたインターネット電話通信アプリケーション
の構成図である。図4において、41は接続処理部を、
42は遅延時間入力部を、43は遅延時間調整バッファ
を、それぞれ示す。
【0027】接続処理部41は、適当なプロトコルに従
って通話相手との接続/切断の処理をする。また、接続
状態になったら、送信部33と受信部34にデータの送
信を開始する命令と通話先の情報を送信する。切断する
ときは、データの送受信を停止する命令を発行する。
【0028】また、遅延時間入力部42では、発話者か
ら希望する遅延時間の入力を受け付ける。ここで、入力
データとしては、既定値に対する相対値やバッファのバ
イト長や時間長といった絶対値のどちらでも良い。受け
付けた入力データに基づいて、これに合うように遅延時
間調整バッファ43のサイズを変更する。
【0029】以上のように本実施の形態1によれば、発
話者はエコーの遅延時間を実際に耳で確認しながら、発
話者にとって話しやすい状況となるように遅延時間を入
力できる。
【0030】(実施の形態2)次に本発明の実施の形態
2にかかる音声会話装置について、図面を参照しながら
説明する。図5は本発明の実施の形態2にかかる音声会
話装置の構成図である。図5において、51は遅延時間
検出部を、52は遅延時間表示部を、それぞれ示す。な
お、サウンドデバイスとしては、サウンドカードを用い
る。
【0031】遅延時間検出部51は、音声入力部31と
音声出力部37の間のエコー遅延時間を、データの相関
を計算する等の方法で検出し、検出結果を遅延時間表示
部52へ通知する。表示された遅延時間を確認して、そ
れに応じた遅延時間を遅延時間入力部42から入力する
ことで、的確に話しやすい環境を構築することが可能と
なる。なお、遅延時間の検出方法は、入力音声信号と受
信部信号との相互相関を計算する方法に限定されるもの
ではなく、他の方法でも良い。さらに、遅延時間検出部
51は、発話者が遅延時間入力の参考値を得るために遅
延時間を知りたい時にスイッチを押すといった手動で作
動させる方法に限定せず、タイマで定期的に割り込みを
かけて作動させる方法やCPUが空いた時間に不定期に
作動させる方法等も含まれる。
【0032】遅延時間表示部52は、遅延時間検出部5
1で検出した遅延時間を表示するが、その表示方法とし
ては、ディスプレイ上のポップアップウィンドウ等を用
いて絶対値を表示する方法だけでなく、スライドバー等
で相対的に表示する方法でも良い。
【0033】また、遅延時間検出部51は、音声入力部
31と音声出力部37の間だけでなく、音声入力部31
と受信部34の間、または送信部33と音声出力部37
の間や送信部33と受信部34の間といった、音声の回
り込みの影響を確認できる箇所であればどこへ配置して
も良い。
【0034】なお、遅延時間は、話者の口からマイクま
での距離、及びスピーカから話者の耳までの距離等によ
っても影響を受けるので、遅延時間検出部51で検出で
きる遅延時間は実際の遅延時間よりも小さく表示される
ものである。
【0035】以上のように本実施の形態2によれば、実
際の遅延時間を発話者が目で確認することができるの
で、実際の遅延時間に応じた調整を適切に行うことが可
能となる。
【0036】(実施の形態3)次に本発明の実施の形態
3にかかる音声会話装置について、図面を参照しながら
説明する。図6は本発明の実施の形態3にかかる音声会
話装置の構成図である。図6において、61は目標遅延
時間記憶部を示す。なお、サウンドデバイスとしては、
サウンドカードを用いる。
【0037】遅延時間調整バッファ43は、目標遅延時
間記憶部61に記憶されている遅延時間と遅延時間検出
部51によって検出された遅延時間とを比較して、検出
結果が目標遅延時間記憶部61に記憶されている目標値
に近づくようにバッファ長を調整する。
【0038】目標遅延時間記憶部61に記憶されている
目標値は、アプリケーション作成段階、いわゆるプログ
ラムのコンパイル時に設定しても良いし、発話者の手に
よって入力できるようにしても良い。
【0039】また、ネットワーク負荷の変動が過大な場
合等には、かかる自動調整機能がうまく作動せず、バッ
ファ長の調整が適正に行われない場合も想定できる。そ
こで、図7に示すように、調整機能作動スイッチ71を
設置し、発話者からの入力に応じてOn/Offの指令
を遅延時間調整バッファ43に発する。遅延時間調整バ
ッファ43は、調整機能作動スイッチ71からの指令が
Onの場合には遅延時間調整を行うが、Offの場合に
は調整を行わない。後者の場合には、バッファを既定の
標準長さに一義的に修正してしまう方法も考えられる
が、Offになった時点でのバッファ長そのままで維持
する方法やバッファを介さずに送受信する等の方法でも
良い。
【0040】さらに、調整機能作動スイッチ71自体が
On/Offの設定値を保存していて、この値を遅延時
間調整バッファ43が参照することで、動作するか否か
を判定して自動的に切り替わる方法も考えられる。
【0041】以上のように、本実施の形態3によれば、
ネットワーク負荷の増加によってパケットの送信に遅れ
が出た場合等に、遅延時間が大きく変化するのに自動的
に対応して、遅延時間を調整することができる。
【0042】(実施の形態4)次に本発明の実施の形態
4にかかる音声会話装置について、図面を参照しながら
説明する。図8は本発明の実施の形態4にかかる音声会
話装置の構成図である。図8において、81は作動判定
部を示す。
【0043】作動判定部81は、遅延時間検出部51の
結果が既定の範囲内にあるか否かによって、遅延時間の
調整が必要か否かを判定し、遅延時間調整バッファ43
に対してOn/Offの指令を発する。
【0044】遅延時間調整バッファは作動判定部81か
らの指令に応じて、指令がOnの場合には遅延時間調整
を行うが、Offの場合には調整を行わない。後者の場
合には、バッファを既定の標準長さに一義的に修正して
しまう方法も考えられるが、Offになった時点でのバ
ッファ長をそのまま維持する方法やバッファを介さずに
送受信する等の方法でも良い。
【0045】なお、遅延時間の既定の範囲の決定方法に
ついては、特に制限は設けない。発話者の経験則に基づ
いて遅延時間の許容範囲を決定しておいても良いし、プ
ログラム等によって自動的に設定される方法でも良い。
【0046】以上のように、本実施の形態4によれば、
遅延時間の調整を行うことが必要と判断された場合には
所定の方法で調整を行うが、必要でないと判断された場
合には何ら調整作業を行わないようにすることができ
る。
【0047】(実施の形態5)次に本発明の実施の形態
5にかかる音声会話装置について、図面を参照しながら
説明する。図9は本発明の実施の形態5にかかる音声会
話装置の構成図である。図9において、91は判定部
を、92は判定結果通知部を、それぞれ示す。
【0048】判定部91は、遅延時間検出部51の検出
結果が遅延時間を調整すべき範囲内に入った場合、すな
わち発話者が話しにくくなる状態にある場合には、その
事実を信号によって判定結果通知部92へ通知する。信
号を受けた判定結果通知部92は、音声/サウンド再生
やダイアログ表示等の手段によって、利用者へその事実
を通知する。
【0049】以上のように、本実施の形態5によれば、
遅延時間調節が必要となった場合や、遅延時間入力部で
入力された値ではエコーの遅延時間がうまく調整されて
いない場合等に、発話者が即座にその事実を知ることが
でき、次の対策を打つことが可能となる。
【0050】(実施の形態6)次に本発明の実施の形態
6にかかる音声会話装置について、図面を参照しながら
説明する。図10は本発明の実施の形態6にかかる音声
会話装置の構成図である。図10において、101はマ
イク・発話者間距離入力部を示す。
【0051】発話者は、マイク・発話者間距離入力部1
01に、マイク等の音声入力機器と発話者の口との距離
を入力する。遅延時間調整バッファ43では、入力され
たマイク・発話者間距離からマイク・発話者間の音の到
達時間を(マイク・発話者間距離/音速)で計算し、か
かる到達時間を目標遅延時間記憶部61に記憶されてい
る目標時間から減算した結果と、遅延時間検出部が検出
した時間が一致するように調整を行う。
【0052】入力されたマイク・発話者間距離からマイ
ク・発話者間の音の到達時間を計算し、目標遅延時間か
ら減算する処理は、遅延時間調整バッファの内部だけで
はなく、外部にあっても良い。また、ここで計算された
減算結果を新たな目標遅延時間とする方法も考えられ
る。
【0053】同様に、図11では、スピーカ・発話者間
距離入力部111を設け、発話者は、スピーカ・発話者
間距離入力部111に、スピーカ等の音声出力機器と発
話者の耳との距離を入力する。遅延時間調整バッファで
は、入力されたスピーカ・発話者間距離からスピーカ・
発話者間の音の到達時間を(距離/音速)で計算し、か
かる到達時間を目標遅延時間記憶部61に記憶されてい
る目標時間から減算した結果と、遅延時間検出部が検出
した時間が一致するように調整を行う。
【0054】入力されたスピーカ・発話者間距離からス
ピーカ・発話者間の音の到達時間を計算し、目標遅延時
間から減算する処理は、遅延時間調整バッファ43の内
部だけではなく、外部にあっても良い。また、ここで計
算された減算結果を新たな目標遅延時間として目標遅延
時間記憶部61に登録する方法も考えられる。
【0055】また、マイク・発話者間距離とスピーカ・
発話者間距離が一致するものと仮定して、入力する値を
一つにすることも考えられる。さらに、マイク・発話者
間距離とスピーカ・発話者間距離を発話者が入力するの
ではなく、センサー等を用いることで、自動的に入力す
ることも考えられる。
【0056】以上のように、本実施の形態6によれば、
遅延時間調節が必要となった場合や、遅延時間入力部4
2で入力された値では、エコーの遅延時間がうまく調整
されない場合等に、発話者が即座にその事実を知ること
ができ、次の対策を打つことが可能となる。
【0057】(実施の形態7)次に本発明の実施の形態
7にかかる音声会話装置について、図面を参照しながら
説明する。図12は本発明の実施の形態7にかかる音声
会話装置の構成図である。図12において、121は遅
延時間調整機能付き音声出力部を示す。
【0058】遅延時間調整機能付き音声出力部121
は、遅延時間入力部42からの入力値に応じて遅延時間
を調整するべく、図13に示すような構成を取る。図1
3において、131はバッファリング部を、132はデ
ータ転送部を、133はタイマを、134はバッファ長
調整部を、それぞれ示す。
【0059】図13において、バッファリング部131
は遅延時間入力部42からの入力値をFIFOバッファ
に一時蓄積する。次にデータ転送部132は、一定時間
ごとにタイマ133から呼び出しを受けて、バッファリ
ング部131のデータをサウンドカード(サウンドドラ
イバ)に転送する。
【0060】バッファリング部131では、サウンドカ
ードへの転送データ長とデコード部からの転送データ長
の差を吸収し、一定時間ごとにサウンドカードを転送す
る必要があるので、まとめてサウンドカードに転送し
て、CPUとサウンドカード間を繋ぐバスによる処理遅
れの軽減を主目的とする。
【0061】そして、バッファ長調整部134は、遅延
時間入力部からの入力に応じて、バッファリング部13
1のバッファ長を調整することで、遅延時間を調整する
ことになる。
【0062】音声出力部37だけでなく、音声入力部3
1、エンコード部32、送信部33、受信部34、デコ
ード部35内に同様のバッファが存在する場合において
も、同様の手段でバッファの長さを調整することで、遅
延時間を調整することが可能となる。
【0063】以上のように、本実施の形態7によれば、
遅延時間調整のために新たなバッファを用意する必要が
ないので、装置としての全体構成が複雑にならないとい
う効果が期待できる。
【0064】(実施の形態8)次に本発明の実施の形態
8にかかる音声会話装置について、図面を参照しながら
説明する。図14は本発明の実施の形態8にかかる音声
会話装置における増幅器の構成図である。図14におい
て、141は調整希望入力部を、142は増幅部を、そ
れぞれ示す。
【0065】バッファリング部131は、遅延時間入力
部42からの入力値を一時蓄積するFIFOバッファで
ある。調整希望入力部141は、発話者が遅延時間調整
の希望を入力する可変抵抗器やスイッチ、テンキー等の
入力媒体である。発話者の入力値としては、遅延時間そ
のものの数値入力や現在の遅延時間に対する増減値等が
考えられるが、これに限定されるものではない。
【0066】バッファ長調整部134は、希望の入力値
に応じてバッファリング部のバッファ長を調整する。増
幅部142はアンプ本来の信号増幅を行う。また、バッ
ファリング部131は、増幅器142の前であろうと後
であろうとどちらに位置しても良い。
【0067】かかる構成を有する増幅器をマイクアンプ
として使用、もしくはスピーカアンプとして使用すれ
ば、遅延時間調整機能を有さない音声会話装置において
も、エコーの遅延時間を調整することが可能となり、話
しやすい通信環境を提供することが可能となる。
【0068】以上のように、本実施の形態8によれば、
遅延時間調整機能がない音声会話装置においても、入力
アンプもしくは出力アンプに遅延時間調整機能を付加さ
せることにより、遅延時間を容易に調整することがで
き、発話者が話しやすい環境を作り出すことが可能とな
る。
【0069】(実施の形態9)次に本発明の実施の形態
9にかかる音声会話装置について、図面を参照しながら
説明する。本実施の形態9は、発話者がヘッドセットを
用いており、通話相手が拡声対話システムを用いている
場合である。図15は本発明の実施の形態9にかかる音
声会話装置の構成図である。図15において、151は
マイク部を、152は第1バッファリング部を、153
は第2バッファリング部を、154はヘッドホン部を、
それぞれ示す。
【0070】図15において、マイク部151は音声波
形をマイクユニットで電気信号に変換し、変換したデー
タを第1バッファリング部152に転送する。ヘッドホ
ン部154は第2バッファリング部153からの入力デ
ータをスピーカユニットから音声波形として出力する。
バッファ長調整部134は、調整希望入力部141から
の入力に応じて、第1バッファリング部152と第2バ
ッファリング部153のそれぞれのバッファ長を同じよ
うに調整する。
【0071】上記構成を有するヘッドセットを用いる
と、遅延時間調整機能を有さない音声会話装置において
も、送信側の遅延と受信側の遅延をバランス良く調整す
ることが可能となる。また、第1バッファリング部15
2と第2バッファリング部153の調整割合について
は、1:1に限定されるものではなく、他の割合に特定
しても良いし、入力手段を設けて任意の割合とする方法
でも良い。さらに、ヘッドセットに限定されるものでは
なく、スピーカとマイクが一体となった他の形状であっ
ても良い。
【0072】以上のように、本実施の形態9によれば、
遅延時間調整機能がない音声会話装置においても、かか
るヘッドセット等を用いることで、遅延時間を調節する
ことができ、発話者が話しやすい環境を生み出すことが
可能となる。
【0073】次に、本発明の実施の形態1にかかる音声
会話装置を実現するプログラムの処理の流れについて説
明する。図16に本発明の実施の形態1にかかる音声会
話装置を実現するプログラムの処理の流れ図を示す。
【0074】図16において、まず話者が自分の音声を
マイク等の音声入力媒体を通じて入力する(ステップS
161)。そして、必要があれば入力された音声を通信
プロトコルに合わせてエンコードし(ステップS16
2)、ネットワーク等の通信回線へ接続した後(ステッ
プS163)エンコードされた音声データを通信の相手
方に送信する(ステップS164)。
【0075】通信の相手方は、これに対して返事を音声
によって入力し、かかる音声データを通信回線経由で受
信する(ステップS165)。受信が完了したら、ネッ
トワーク等の通信回線を切断して(ステップS16
6)、必要があれば受信した音声データをデコードする
(ステップS167)。
【0076】ここで、遅延時間調整バッファの長さを変
える等の方法を用いて、遅延時間を話者が話しやすい範
囲内に調整する(ステップS168)。そして、遅延時
間の調整後に相手方音声を出力することで(ステップS
169)、スムーズな会話が可能となる。
【0077】また、本発明の実施の形態1にかかる音声
会話装置を実現するプログラムを記憶した記録媒体は、
図17に示す記録媒体の例に示すように、CD−ROM
やフロッピーディスク等の可搬型記録媒体だけでなく、
通信回線の先に備えられた他の記憶装置や、コンピュー
タのハードディスクやRAM等の記録媒体のいずれでも
良く、プログラム実行時には、プログラムはローディン
グされ、主メモリ上で実行される。
【0078】さらに、本発明の実施の形態1にかかる音
声会話装置により生成された遅延時間目標値等を記録し
た記録媒体も、図17に示す記録媒体の例に示すよう
に、CD−ROMやフロッピーディスク等の可搬型記録
媒体だけでなく、通信回線の先に備えられた他の記憶装
置や、コンピュータのハードディスクやRAM等の記録
媒体のいずれでも良く、例えば本発明にかかる音声会話
装置を利用する際にコンピュータにより読み取られる。
【0079】
【発明の効果】以上のように本発明にかかる音声会話装
置によれば、エコーの遅延時間を発話のじゃまにならな
い範囲で効果的に調整することができ、発話者が話しや
すい通信装置を実現することが可能となる。
【図面の簡単な説明】
【図1】 従来のインターネット電話アプリケーション
の構成図
【図2】 従来の通話系の概略図
【図3】 本発明の実施の形態1にかかる音声会話装置
の構成図
【図4】 本発明の一実施例にかかる音声会話装置の構
成図
【図5】 本発明の実施の形態2にかかる音声会話装置
の構成図
【図6】 本発明の実施の形態3にかかる音声会話装置
の構成図
【図7】 本発明の一実施例にかかる音声会話装置の構
成図
【図8】 本発明の実施の形態4にかかる音声会話装置
の構成図
【図9】 本発明の実施の形態5にかかる音声会話装置
の構成図
【図10】 本発明の実施の形態6にかかる音声会話装
置の構成図
【図11】 本発明の一実施例にかかる音声会話装置の
構成図
【図12】 本発明の実施の形態7にかかる音声会話装
置の構成図
【図13】 本発明の実施の形態7にかかる音声会話装
置における遅延時間調整機能付き音声出力部の構成図
【図14】 本発明の実施の形態8にかかる音声会話装
置における増幅器の構成図
【図15】 本発明の実施の形態9にかかる音声会話装
置におけるヘッドセットの構成図
【図16】 本発明の実施の形態1にかかる音声会話装
置における処理の流れ図
【図17】 記録媒体の例示図
【符号の説明】
11、31 音声入力部 12、32 エンコード部 13、33 送信部 14、34 受信部 15、35 デコード部 16、37 音声出力部 36 遅延時間調整部 41 接続処理部 42 遅延時間入力部 43 遅延時間調整バッファ 51 遅延時間検出部 52 遅延時間表示部 61 目標遅延時間記憶部 71 調整機能作動スイッチ 81 作動判定部 91 判定部 92 判定結果通知部 101 マイク・発話者間距離入力部 111 スピーカ・発話者間距離入力部 121 遅延時間調整機能付き音声出力部 131 バッファリング部 132 データ転送部 133 タイマ 134 バッファ長調整部 141 調整希望入力部 142 増幅部 151 マイク部 152 第1バッファリング部 153 第2バッファリング部 154 ヘッドホン部 171 回線先の記憶装置 172 CD−ROMやフロッピ(登録商標)ーディス
ク等の可搬型記録媒体 172−1 CD−ROM 172−2 フロッピーディスク 173 コンピュータ 174 コンピュータ上のRAM/ハードディスク等の
記録媒体
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5K027 AA11 BB03 DD10 5K030 GA16 HB01 HC01 JT01 JT03 KA03 KA19 MA13 MB06 MB15 5K046 AA01 AA05 BA05 BB01 BB05 CC23 EE00 HH15 HH79 YY01 YY04

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 話者が音声を入力する音声入力部と、 入力された音声データを相手方に送信する送信部と、 相手方の音声データを受信する受信部と、 相手方の音声を再生出力する音声出力部を備えた音声会
    話装置であって、 前記音声入力部と前記送信部の間に入力された音声を通
    信プロトコルに合うようにエンコードするエンコード部
    を、前記受信部と前記音声出力部の間に受信した相手方
    の音声データをデコードするデコード部を、前記受信部
    と前記音声出力部の間に遅延時間を調整する遅延時間調
    整部を、それぞれ備えることを特徴とした音声会話装
    置。
  2. 【請求項2】 前記遅延時間調整部において、遅延時間
    調整バッファの長さを変えることで前記遅延時間を調整
    する請求項1記載の音声会話装置。
  3. 【請求項3】 前記遅延時間を前記話者が入力する請求
    項1又は2記載の音声会話装置。
  4. 【請求項4】 前記遅延時間を自動的に検出する遅延時
    間検出部を備え、自動的に前記遅延時間を調整する請求
    項1又は2記載の音声会話装置。
  5. 【請求項5】 前記遅延時間検出部において、エコーの
    有無についても自動的に検出する請求項4記載の音声会
    話装置。
  6. 【請求項6】 話者が音声を入力する工程と、 入力された音声を相手方に送信する工程と、 相手方の音声を受信する工程と、 相手方の音声を再生出力する工程を含む音声を用いた通
    信方法であって、 前記話者が音声を入力する工程と前記入力された音声を
    相手方に送信する工程の間に入力された音声を通信プロ
    トコルに合うようにエンコードする工程を、前記相手方
    の音声を受信する工程と前記相手方の音声を再生出力す
    る工程の間に受信した相手方の音声データをデコードす
    る工程を、前記相手方の音声を受信する工程と前記相手
    方の音声を再生出力する工程の間に遅延時間を調整する
    工程を、それぞれ含むことを特徴とする音声会話方法。
  7. 【請求項7】 話者が音声を入力するステップと、 入力された音声を相手方に送信するステップと、 相手方の音声を受信するステップと、 相手方の音声を再生出力するステップを含むコンピュー
    タに実行させるプログラムを記録したコンピュータ読み
    取り可能な記録媒体であって、 前記話者が音声を入力するステップと前記入力された音
    声を相手方に送信するステップの間に入力された音声を
    通信プロトコルに合うようにエンコードするステップ
    を、前記相手方の音声を受信するステップと前記相手方
    の音声を再生出力するステップの間に受信した相手方の
    音声データをデコードするステップを、前記相手方の音
    声を受信するステップと前記相手方の音声を再生出力す
    るステップの間に遅延時間を調整するステップを、それ
    ぞれ含むことを特徴とするコンピュータに実行させるプ
    ログラムを記録したコンピュータ読み取り可能な記録媒
    体。
JP35445998A 1998-12-14 1998-12-14 音声会話装置及び方法 Withdrawn JP2000183962A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP35445998A JP2000183962A (ja) 1998-12-14 1998-12-14 音声会話装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35445998A JP2000183962A (ja) 1998-12-14 1998-12-14 音声会話装置及び方法

Publications (1)

Publication Number Publication Date
JP2000183962A true JP2000183962A (ja) 2000-06-30

Family

ID=18437709

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35445998A Withdrawn JP2000183962A (ja) 1998-12-14 1998-12-14 音声会話装置及び方法

Country Status (1)

Country Link
JP (1) JP2000183962A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100430653B1 (ko) * 2001-12-14 2004-05-10 엘지전자 주식회사 엠에스씨의 아이더블유유 내 보코더 장치의 타임 정렬부
JP2007503795A (ja) * 2003-05-23 2007-02-22 アナログ デバイスズ インコーポレイテッド スパースエコーキャンセラ
JP2013005106A (ja) * 2011-06-14 2013-01-07 Nippon Telegr & Teleph Corp <Ntt> 場内拡声装置、場内拡声方法、及びそのプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100430653B1 (ko) * 2001-12-14 2004-05-10 엘지전자 주식회사 엠에스씨의 아이더블유유 내 보코더 장치의 타임 정렬부
JP2007503795A (ja) * 2003-05-23 2007-02-22 アナログ デバイスズ インコーポレイテッド スパースエコーキャンセラ
JP2013005106A (ja) * 2011-06-14 2013-01-07 Nippon Telegr & Teleph Corp <Ntt> 場内拡声装置、場内拡声方法、及びそのプログラム

Similar Documents

Publication Publication Date Title
US20090253418A1 (en) System for conference call and corresponding devices, method and program products
US8265240B2 (en) Selectively-expandable speakerphone system and method
EP3217638B1 (en) Transferring information from a sender to a recipient during a telephone call under noisy environment
US20140254832A1 (en) Volume adjusting system and method
WO2011153779A1 (zh) 使用双麦克抑制噪声的方法及终端
TWI718367B (zh) 多連接裝置及多連接方法
JPH09233198A (ja) 全二重音声会議電話のためのソフトウエアベースのブリッジ方法及び装置
JP4400490B2 (ja) 拡声通話装置、拡声通話システム
JP2000183962A (ja) 音声会話装置及び方法
KR101820369B1 (ko) 헤드셋에 대한 스마트폰의 블루투스 통신방법
WO2018058875A1 (zh) 一种终端的通话切换方法、系统及终端、计算机存储介质
JP3069547B2 (ja) 話速変換ハンズフリーユニットおよび通話システム
US7480262B2 (en) Telephone terminal, telephone system using telephone terminal and control method of telephone terminal
KR100469568B1 (ko) 버퍼 모니터링을 통한 오디오 잡음 감쇄 제어 장치 및 그방법
JP2868439B2 (ja) Gsm方式携帯電話装置
JP2002368866A (ja) 音声会議システムの送話レベル調整方法
US20200098363A1 (en) Electronic device
JPH10290282A (ja) ハンズフリー制御回路
JP2005086361A (ja) 携帯端末装置
KR20130066146A (ko) 통화 모드를 변경하기 위한 통신 단말기 및 그 제어방법과, 통신망 운영 서버 및 그 제어방법
JP6775162B2 (ja) 通話装置およびそれを利用した通話システム
JP2023141338A (ja) 通信端末及び通信方法
KR20010084447A (ko) 엠피쓰리 복합형 휴대폰
JP5258063B2 (ja) 通話録音システム及びその制御方法
JPH03262239A (ja) コードレス電話装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060307