JP2008211526A - 音声入出力装置及び音声入出力方法 - Google Patents

音声入出力装置及び音声入出力方法 Download PDF

Info

Publication number
JP2008211526A
JP2008211526A JP2007046273A JP2007046273A JP2008211526A JP 2008211526 A JP2008211526 A JP 2008211526A JP 2007046273 A JP2007046273 A JP 2007046273A JP 2007046273 A JP2007046273 A JP 2007046273A JP 2008211526 A JP2008211526 A JP 2008211526A
Authority
JP
Japan
Prior art keywords
sound
acoustic
input
microphone
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007046273A
Other languages
English (en)
Inventor
Kimiko Kimata
喜美子 木俣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007046273A priority Critical patent/JP2008211526A/ja
Publication of JP2008211526A publication Critical patent/JP2008211526A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】音声品質を向上させた音声入出力装置及び音声入出力方法を提供する。
【解決手段】マイク3とスピーカ7を外部に持つ音声入出力装置1において、マイク3からの入力とスピーカ7への出力を音響環境判断部4へ入力する。音響環境判断部でマイク3とスピーカ7の間の音響環境を推定し、推定に基づいて必要な音響処理を選択し、音響処理部5で行う音響処理を決定する。マイク3から入力された音声は、音響処理部5が持つ音響処理機能のうち、選択された機能を実行する。その後、送受信処理などの必要な処理を経て相手端末へ送信する。
【選択図】図1

Description

本発明は、Web会議システムやIP電話システムなどのリアルタイム音声送受信通信システムや、音声録音再生システムに用いられる音声入出力装置及び音声入出力方法に関する。
テレビ会議システム、Web会議システムと呼ばれるシステムでは、会議室のような比較的広い場所同士で通話が行われることがある。このような場合、通話をスムーズに行うため音響処理を実施する場合が多い。例えば、ハンズフリーで通話が行われる場合は音響エコーキャンセラを有効にしたり、雑音が多い場所ではノイズキャンセラを有効にしたり、音量を大きくしたりする、などの音響処理が挙げられる。
これらの音響処理を実現する端末では、スペックがあまり高くない場合や、他のアプリケーションと共存しながら通信を行う場合があり、処理能力をできるだけ必要としないことが望ましいとされる。
さらに、既存の端末では、上記問題を解決するため、ユーザによる手動での音響設定を行うことができる場合もあったが、音響の専門知識が乏しいユーザが設定を行うため、不適切に設定している場合や、不必要な処理を有効にして使用している場合があった。
例えば、多地点間のテレビ会議システムにおいて、機種間における音量送出レベルの大小を送信側端末で調整したり、受信端末の能力に応じて、送信側で音量調節を行ったりする「テレビ会議システムのための音声入力端末および音声入力端末及び音声合成端末」(例えば、特許文献1参照。)、携帯電話端末において、電話機の製造後に音響性能が規格内に収まるようソフトウェア(イコライザ)で調整する「音響特性調整装置、音響特性調整方法及びプログラム」(例えば、特許文献2参照。)、拡声器で、はじめに放置音が鳴っている間にエコーキャンセラの適応制御を行い、通話が始まってからは話頭からエコーを除去する「拡声通話装置」(例えば、特許文献3参照。)。が挙げられる。
この他、音声入出力装置としては特許文献4〜6が挙げられる。
特開平09−149133号公報 特開2006−157574号公報 特開2005−217547号公報 特開2002−330500号公報 特開2005−151403号公報 特開平07−154305号公報
しかしながら、上述した従来技術には以下の問題点がある。
第1の問題点は、不適切または不要な音響処理を行い、ユーザに通話音声品質が悪くなる場合や、処理負荷を不必要にあげる場合がある点である。
その理由は、ユーザによる手動での音響設定が前提となるため、ユーザの専門知識によっては、不適切に設定してかえって通話音声品質が悪くなる場合があった。また、不必要な処理を有効にしたため処理負荷が増え、端末の処理体感速度が遅くなる場合や通話音声品質が悪くなる場合があった。
第2の問題点は、通話の開始時にユーザが手動で音響設定を行う必要がある場合があり、設定に手間がかかり通話などの本来の目的に集中できない場合があった点である。
その理由は、音響処理についてあまり知識のない一般使用者が、独自の判断で音響処理の有無や効果の強弱を設定するため、時間をかけて音響設定して試す、という調整を何度も繰り返すことが必要であったり、適切な設定を行わないまま通話に入ったりすることがあるからである。
音響処理の設定は、ユーザによる手動での音響設定が前提となるため、不適切または不要な音響処理を行う場合があり、通話音声品質が悪くなる場合や、処理負荷を不必要に上げる場合があった。
また、音響処理についてあまり知識のない一般使用者が、独自の判断で音響処理の有無や効果の強弱を設定するため、時間をかけて音響設定して試す、という調整を何度も繰り返すことが必要であったり、適切な設定を行わないまま通話に入ったりすることがあり、通話などの本来の目的に集中できない場合があった。
そこで、本発明の目的は、音声品質を向上させた音声入出力装置及び音声入出力方法を提供することにある。
上記課題を解決するために、請求項1に記載の発明は、スピーカから音声を出力し、マイクで音声を入力する音声入出力装置において、1つ以上の音響処理機能を組み合わせ、前記マイクで入力された音声に音響処理を行う音響処理手段と、前記マイクで入力された音声と前記スピーカから出力される音声とを使用して前記スピーカから前記マイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて、前記音響処理手段へ作用を及ぼす音響環境判断手段とを備えたことを特徴とする。
請求項1に記載の発明によれば、1つ以上の音響処理機能を組み合わせ、マイクで入力された音声に音響処理を行う際に、マイクで入力された音声とスピーカから出力される音声とを使用してスピーカからマイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて前記音響処理を行うことにより、人間系による音響設定のばらつきを排除し、音響処理による処理負荷を必要最小限にとどめるので、音声品質を向上させることができる。
請求項2に記載の発明は、請求項1に記載の発明において、前記音響処理手段は、組み合わせた音響処理機能を各々または全てを有効化または無効化できるようにしたことを特徴とする。
請求項2に記載の発明によれば、音響処理手段は、組み合わせた音響処理機能を各々または全てを有効化または無効化できるようにしたことにより、さらに音声品質を向上させることができる。
請求項3に記載の発明は、請求項1または2に記載の発明において、前記スピーカから出力する音声に音響処理を行う音響処理手段を備えたことを特徴とする。
請求項3に記載の発明によれば、スピーカから出力する音声に音響処理を行う音響処理手段を備えたことにより、さらに音声品質を向上させることができる。
請求項4に記載の発明は、請求項1から3のいずれか1項に記載の発明において、前記マイクで入力された音声と前記スピーカから出力された音声とを使用して前記スピーカから前記マイクへの空間の音響伝達特性を推定し、前記音響伝達特性に合わせて、前記スピーカから出力する音声に音響処理を行う音響処理手段へ作用を及ぼす音響環境判断手段を備えたことを特徴とする。
請求項4に記載の発明によれば、マイクで入力された音声とスピーカから出力された音声とを使用してスピーカからマイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて、スピーカから出力する音声に音響処理を行うことにより、さらに音声品質を向上させることができる。
請求項5に記載の発明は、請求項1から4のいずれか1項に記載の発明において、ネットワークを介して他の音声入出力装置と音声の送受信を行う送受信手段を備えたことを特徴とする。
請求項5に記載の発明によれば、ネットワークを介して他の音声入出力装置と音声の送受信を行う送受信手段を備えたことにより、さらに音声品質を向上させることができる。
請求項6に記載の発明は、請求項1から5のいずれか1項に記載の発明において、他の音声入出力装置との音声の送受信の開始を使用者に示す呼び出し手段と、前記スピーカから出力される呼び出し音と、前記マイクで入力された音声とを使用して前記スピーカから前記マイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて、前記音響処理手段へ作用を及ぼす音響環境判断手段とを備えたことを特徴とする。
請求項6に記載の発明によれば、他の音声入出力装置との音声の送受信の開始を使用者に示し、スピーカから出力される呼び出し音と、マイクで入力された音声とを使用してスピーカからマイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて、音響処理手段へ作用を及ぼすことにより、さらに音声品質を向上させることができる。
請求項7に記載の発明は、請求項6に記載の発明において、他の音声入出力装置との音声の送受信の開始を使用者に示す呼び出し音を使用者が選択することができるようにしたことを特徴とする。
請求項7に記載の発明によれば、他の音声入出力装置との音声の送受信の開始を使用者に示す呼び出し音を使用者が選択することができるようにしたことにより、さらに音声品質を向上させることができる。
請求項8に記載の発明は、請求項7に記載の発明において、他の音声入出力装置との音声の送受信の開始を使用者に示す呼び出し音に、空間の音響伝達特性を推定するための試験音を追加できるようにしたことを特徴とする。
請求項8に記載の発明によれば、他の音声入出力装置との音声の送受信の開始を使用者に示す呼び出し音に、空間の音響伝達特性を推定するための試験音を追加できるようにしたことにより、さらに音声品質を向上させることができる。
請求項9に記載の発明は、請求項1から5のいずれか1項に記載の発明において、使用者が指定したタイミングでスピーカから出力される呼び出し音と、マイクで入力された音声とを使用してスピーカからマイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて、前記音響処理手段へ作用を及ぼす音響環境判断手段を備えたことを特徴とする。
請求項9に記載の発明によれば、使用者が指定したタイミングでスピーカから出力される呼び出し音と、マイクで入力された音声とを使用してスピーカからマイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて、音響処理手段へ作用を及ぼすことにより、さらに音声品質を向上させることができる。
請求項10に記載の発明は、請求項9に記載の発明において、他の音声入出力装置との音声の送受信の開始を使用者を示す呼び出し音を有し、使用者が指定したタイミングで、前記の呼び出し音を使用してスピーカから出力される呼び出し音と、マイクで入力された音声とを使用してスピーカからマイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて、前記音響処理手段へ作用を及ぼす音響環境判断手段を備えたことを特徴とする。
請求項10に記載の発明によれば、他の音声入出力装置との音声の送受信の開始を使用者を示す呼び出し音を有し、使用者が指定したタイミングで、呼び出し音を使用してスピーカから出力される呼び出し音と、マイクで入力された音声とを使用してスピーカからマイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて、音響処理手段へ作用を及ぼすことにより、さらに音声品質を向上させることができる。
請求項11に記載の発明は、請求項10に記載の発明において、他の音声入出力装置との音声の送受信の開始を使用者に示す呼び出し音として使用者が指定した音声を利用するようにしたことを特徴とする。
請求項11に記載の発明によれば、他の音声入出力装置との音声の送受信の開始を使用者に示す呼び出し音として使用者が指定した音声を利用するようにしたことにより、さらに音声品質を向上させることができる。
請求項12に記載の発明は、請求項11に記載の発明において、他の音声入出力装置との音声の送受信の開始を使用者に示す呼び出し音に、空間の音響伝達特性を推定するための試験音を追加できるようにしたことを特徴とする。
請求項12に記載の発明によれば、他の音声入出力装置との音声の送受信の開始を使用者に示す呼び出し音に、空間の音響伝達特性を推定するための試験音を追加できるようにしたことにより、さらに音声品質を向上させることができる。
請求項13に記載の発明は、請求項12に記載の発明において、他の音声入出力装置との音声の送受信の開始を使用者に示す呼び出し音に、空間の音響伝達特性を推定するための試験音を追加できるようにしたことを特徴とする。
請求項13に記載の発明によれば、他の音声入出力装置との音声の送受信の開始を使用者に示す呼び出し音に、空間の音響伝達特性を推定するための試験音を追加できるようにしたことにより、さらに音声品質を向上させることができる。
請求項14に記載の発明は、請求項1から13のいずれか1項に記載の発明において、音声を入力するマイクを2つ以上備えたことを特徴とする。
請求項14に記載の発明によれば、音声を入力するマイクを2つ以上備えたことにより、さらに音声品質を向上させることができる。
請求項15に記載の発明は、請求項1から14のいずれか1項に記載の発明において、音声を出力するスピーカを2つ以上備えたことを特徴とする。
請求項15に記載の発明によれば、音声を出力するスピーカを2つ以上備えたことにより、さらに音声品質を向上させることができる。
請求項16に記載の発明は、請求項1から15のいずれか1項に記載の発明において、マイク以外の外部機器によって空間の音響伝達特性を推定し、音響伝達特性に合わせて、前記音響処理手段へ作用を及ぼす音響処理手段を備えたことを特徴とする。
請求項16に記載の発明によれば、マイク以外の外部機器によって空間の音響伝達特性を推定し、音響伝達特性に合わせて、音響処理手段へ作用を及ぼすことにより、さらに音声品質を向上させることができる。
請求項17に記載の発明は、音楽ファイルを内部に有し、音楽ファイルをスピーカから再生する音声入出力装置において、マイクで音声を入力する音声入力手段と、スピーカから出力する音声に音響処理を行う音響処理手段と、前記マイクで入力される音声と前記スピーカから出力される音声とを使用して前記スピーカから前記マイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて、前記音響処理手段へ作用を及ぼす音響環境判断手段とを備えたことを特徴とする。
請求項17に記載の発明によれば、マイクで音声を入力し、スピーカから出力する音声に音響処理を行う際に、マイクで入力される音声とスピーカから出力される音声とを使用してスピーカからマイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて、音響処理手段へ作用を及ぼすことにより、さらに音声品質を向上させることができる。
請求項18に記載の発明は、請求項17に記載の発明において、前記音響処理手段は、1つ以上の音響処理機能を組み合わせたものであることを特徴とする。
請求項18に記載の発明によれば、音響処理手段は、1つ以上の音響処理機能を組み合わせたものであることにより、さらに音声品質を向上させることができる。
請求項19に記載の発明は、スピーカから音声を出力し、マイクで音声を入力する音声入出力方法において、1つ以上の音響処理機能を組み合わせ、前記マイクで入力された音声に音響処理を行う際に、前記マイクで入力された音声と前記スピーカから出力される音声とを使用して前記スピーカから前記マイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて前記音響処理を行うことを特徴とする。
請求項19に記載の発明によれば、1つ以上の音響処理機能を組み合わせ、マイクで入力された音声に音響処理を行う際に、マイクで入力された音声とスピーカから出力される音声とを使用してスピーカからマイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて音響処理を行うことにより、さらに音声品質を向上させることができる。
請求項20に記載の発明は、音楽ファイルを内部に有し、音楽ファイルをスピーカから再生する音声入出力方法において、マイクで音声を入力し、スピーカから出力する音声に音響処理を行う際に、前記マイクで入力される音声と前記スピーカから出力される音声とを使用して前記スピーカから前記マイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて、前記音響処理を行うことを特徴とする。
請求項20に記載の発明によれば、マイクで音声を入力し、スピーカから出力する音声に音響処理を行う際に、マイクで入力される音声とスピーカから出力される音声とを使用してスピーカからマイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて、音響処理を行うことにより、さらに音声品質を向上させることができる。
すなわち、本発明によれば、第1に通話音声品質を向上することができる。音響処理についてあまり知識のない一般使用者が、独自の判断で音響処理の有無や効果の強弱を設定するのではなく、一定のアルゴリズムを用いて最適な音響処理を設定するので、ユーザによる音響効果のばらつきが少なくなり、全体的な通話音声品質の向上が期待できる。また、時間経過に適応して必要な音響処理を実施することにより、常にそのときの音響系に適した通話品質で通信することができる。
また、本発明によれば、第2に処理負荷を軽減することができる。音響処理についてあまり知識のない一般使用者が、独自の判断で音響処理の有無や効果の強弱を設定するのではなく、一定のアルゴリズムを用いて最適な音響処理を設定するので、不必要な処理を行うことによる処理負荷を軽減できる。
さらに、本発明によれば、第3にユーザビリティを向上することができる。通話の開始時に音響設定を行うなどの手間が省け、通話中、ユーザが通話本来の目的に集中できる。
本発明によれば、1つ以上の音響処理機能を組み合わせ、マイクで入力された音声に音響処理を行う際に、マイクで入力された音声とスピーカから出力される音声とを使用してスピーカからマイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて前記音響処理を行うことにより、人間系による音響設定のばらつきを排除し、音響処理による処理負荷を必要最小限にとどめるので、音声品質を向上させることができる。
〔実施形態1〕
第1の実施形態は、通話中に音響環境の調整を行う音声入出力装置についてである。
図1は、本発明に係る音声入出力装置の一実施の形態を示す構成図である。
本実施形態では、音声入出力装置1と、音声入出力装置Aとがネットワークを介してリアルタイムに音声送受信を行う場合について説明する。また、図1の音声入出力装置1の内部構成については、本発明の原理を簡便に説明するため、本発明に係わる部分のみを機能的に示している。
はじめに音声入出力装置1の構成について説明する。
音声入出力装置1は、外部にマイク3とスピーカ7を持ち、音声の入出力を行う。マイク3は送信すべき音声をキャプチャする。キャプチャした音声は、同時に音声入出力装置1がおかれている音響環境を判断するためにも使用する。マイク3でキャプチャし、送信する音声として音響処理部5に入力し、音響環境の判断のための音声として音響環境判断部4にそれぞれ入力する。また、スピーカ7から出力される音も音響環境判断部4に入力する。
音響環境判断部4では、入力された音声から音声入出力装置1がおかれている環境を判断し、音響処理部5に含まれる各音響機能のON/OFFや強弱の制御パラメータを決定する。
音響処理部5では、入力された音声に音響処理を施す。その後、コーデック処理・送受信処理2を経てネットワーク経由で他の音声入出力装置、例えば音声入出力装置Aへ音声を送信する。
音声入出力装置Aからの音声は、ネットワーク経由でコーデック・送受信処理2で受信処理を行い、デコードする。受信側の音響処理部6にて必要な音響処理を行った後、スピーカ7から出力される。
図2に、図1に示した音声入出力装置の音響処理判断部4と音響処理部5との詳細例を示す。
図2において、図1と同様の部分については同じ数値を用いている。
図2では、音響処理部5に音響エコーキャンセラ(AEC)12、雑音抑圧機能(NS)14、自動音量調整機能(AGC)16、その他の音響機能18を持つ。
はじめに、スイッチ11、AEC12の制御例を説明する。スイッチ11はAECのON/OFFを制御するスイッチである。
音響環境判断部4で、マイク3及びスピーカ7から音声入出力装置1がおかれている音響環境での残響時間を測定する。その後、音響環境判断部4から判断結果をAEC12へ通知してAECの性能の制御を行う。
例えば、反響音が非常に小さい場合は、音響環境判断部4からスイッチ11へ制御を行い、エコーキャンセラ機能そのものを無効にすることで、端末の処理負荷を軽減することが可能である。また、当初エコーキャンセラの対応残響時間が100ミリ秒に設定されていた場合、狭い空間に本端末が置かれており測定した残響時間が50ミリ秒であった場合は、エコーキャンセラの対応残響時間を50ミリ秒に調整して余計な演算処理をしないように設定することができる。
これとは逆に、大きなホール等に端末が置かれており残響時間が200ミリ秒であった場合でも、エコーキャンセラの対応残響時間を200ミリ秒に調整することにより、必要十分なエコーキャンセラの性能を発揮させることができる。
次にスイッチ13、及びNS14の制御例を説明する。
スイッチ13はNSのON/OFFを制御するスイッチである。
音響環境判断部4で、マイク3及びスピーカ7から信号対雑音比(S/N比)を求めることにより、音声入出力装置1がおかれている環境での雑音の大小を測定できる。例えば、S/N比が大きい場合は雑音が小さい環境であるので、スイッチ13に制御してNSの機能を無効にすることで、端末の処理負荷を軽減することができる。また、S/N比は小さいがある程度より大きい場合は、NS14の働きを弱めるよう制御を行う。さらに、S/N比が小さい場合は雑音が大きい環境であるため、NS14が強く働くよう制御を行う。
次にスイッチ15、及びAGC16の制御例を説明する。スイッチ14はAGCのON/OFFを制御するスイッチである。
音響環境判断部4で、マイク3から信号の大きさを測定する。
例えば、信号の大きさが適切でS/N比も大きければAGC16で音量調整する必要がないため、スイッチ15でAGC機能を無効にし、端末の処理負荷を軽減することができる。また、前述のS/N比も判断に使用すると、S/N比が小さい場合は入力信号のほとんどが雑音である可能性が高いので、AGC機能を、全体的に音量を下げる方向に制御することができる。また、S/N比が高い場合でもNS14が有効の場合は雑音が抑圧されるのでAGC機能では雑音がないものとして全体に増幅するように制御することができる。
また、その他の音響機能があれば、図2のその他の音響機能18の部分で示すように、上記と同様に音響環境判断部4で音響機能を制御させてもよい。さらに、AEC、NS、AGC、その他の音響処理は図で示した位置関係になくてもよく、どのような順でもよい。
図3、図4に本発明に係る音声入出力方法のフローの一例を示す。
通話を開始すると図3に示したフローの処理を行う。
処理を開始する(ステップ101)。
音響環境調整モードをONにする(ステップ102)。
ここで、音響環境調整モードとは、音響環境判断部4で現在の音響環境の判断を行うモードであるとする。処理を終了する(ステップ103)。
ステップ103が実行されても通話は継続するものとする。
通話を開始すると図4のフローの処理も開始する(ステップ201)。
まず、音響環境調整モードであるか否かを判断する(ステップ202)。
音響環境調整モードがONである場合(ステップ202/ON)は、音響環境判断部4で必要な音響処理の選択を行う(ステップ203)。
音響環境判断部4では、前述の図2のような構成、方法でマイク3で入力された音声やスピーカ7から出力される音声を使用して、音声入出力装置1の置かれている音響環境を推定する。音響環境の推定時には、一旦音声入出力装置Aからの音声を停止して上記の試験音をスピーカ7から出力させたり、音声入出力装置Aからの受信音声を使用して音響環境の判断を行ったりしてもよい。また、音声入出力装置Aからの受信音を利用して音響環境の推定を行うこともできる。
そして、音響環境判断部4での判定を元に、音響処理部5に対し音響処理の設定変更を行う(ステップ204)。例えば、音響処理を機能ごとにON/OFFしたり、機能の強弱を決定したりする。その後、処理を終了する(ステップ206)。
一方、ステップ202で音響環境調整モードがOFFだった場合(ステップ202/OFF)はステップ205へ進み、音響処理部5の設定変更は行わずに終了処理206へ進む。
上記のような処理(ステップ201〜ステップ206)を行うと、端末が音響環境調整モードに設定されている場合に、音響環境を測定し、必要な音響処理を選択することが可能になる。
上記のようなフローで動作を行うことにより、ユーザが個別に音響処理のON/OFFを決定することなく、自動的に適切な音響処理が選択されるので、操作者の知識やスキルに依存することなく常に適切な音声品質で通話を行うことが可能になる。
また、ユーザの知識不足や、不必要に十分な音響処理機能を有効にすることを防げるので、必要以上に処理負荷を上げることを防ぐことができる。例えば、端末が静かなオフィスに置かれているときにはノイズサプレッサをOFFにしたり、エコーが少ないときはエコーキャンセラをOFFにしたりする、などの使い方ができる。
さらに、ユーザは通信開始時に音響環境調整モードで調整を行うことで、その後の通話では音質を気にすることなく通話本来の目的に集中することができる。
また、音響環境判断部4での判断は1度だけに限らず、複数回繰り返しても良い。例えばステップ204の処理の後、ステップ202に戻り、音響環境調整モードがONである限り何回もステップ203、204を繰り返してもよい。
このようにすると、音声入出力装置1が置かれている音響環境が時間的に変化しても、適応的に音響制御を行うことができる。例えば会議室内の人数が急に増えたために雑音が増えた場合、NSやAGCを有効にすることが可能である。
〔実施形態2〕
実施形態1は、通話開始後から音響環境調整モードを有効にして音響環境の判断を開始するものであるのに対し、本実施形態は通話開始前の呼び出し状態を利用して音響環境の調整を行うものである。
本実施形態では、図3に示した音響環境調整モードを有効にする処理を通話の呼び出しの開始時に行う。また、図4に示した処理も呼び出し開始時から実施することで、呼び出し音を試験音として利用して端末の音響環境を測定する。
図5に本発明に係る音声入出力装置の構成例を示す。
図5に示した構成は、図1に示した構成にユーザ指定呼び出し音18と試験音19とを加えた構成である。
呼び出し音は固定の呼び出し音でもよいが、図5に示すように外部に音源のファイルを持ち、ユーザが指定した音声・音響ファイルを呼び出し音として使用してもよい。その場合、音響環境判断部14であらかじめ当該ファイルの特性を把握しておくことができるので、マイク13から入力された音声と比較時に音声入出力装置11の置かれている音響環境を、音声入出力装置Aからの音声を使用するときよりも的確に把握することが期待できる。
また、固定呼び出し音やユーザ指定呼び出し音に、試験のための音声(試験音19)をミキシングしたり挿入したりすることで、音響環境判断をより容易に行うようにすることもできる。試験音として、人間の可聴領域外の周波数特性を持った音声を使用すれば、ユーザにわからないように試験音を入れることができる。
本実施形態のような処理を行うと、適切な音響処理内容が設定されたあとに通話を開始できるため、通話開始時から快適なコミュニケーションが可能となる。
また、実施形態1に示した方法もあわせて実施すれば、通話中に音響系が変動しても音響処理を追従して実施できる。
〔実施形態3〕
実施形態1、実施形態2では、通話時に自動的に音響環境調整モードを有効にしているが、本実施形態では明示的にユーザが指定した間だけ音響環境調整モードを有効にしてもよい。例えば、外部入力装置やGUIを通してユーザが音響環境調整モードを有効もしくは無効にすることが挙げられる。
このような処理を行うと、端末が通話状態でない場合でも音響処理内容を判断することができる。また、ユーザが音響環境調整モードをある一定時間だけ有効にしたい場合などにも使用できる。
また、本実施形態においても、実施形態2で使用した呼び出し音を音響環境の判断に利用してもよい。また、ユーザが指定する呼び出し音を使用したり、試験音を利用したりしてもよい。
〔実施形態4〕
実施形態1〜3ではマイク入力音声を元に、送信側に音響環境調整機能を入れる例であったが、受信した音声を元に受信側にも音響環境調整機能を持たせ、受信側の音響処理の設定を制御してもよい。
図6に本発明に係る音声入出力装置の他の構成例を示す。
図6は、図5の構成に加え、受信部の音響処理部16に対し音響環境判断部14からの制御を加えた構成例である。音響環境判断部にはマイク23からの入力された音声とスピーカ27へ出力される音声とのほかに、音声入出力装置Aから受信した音声も入力する。これら入力された音声を元に音響環境を判断してスピーカ27から出力する音声も音響処理部(受信側)26によって制御を行う。
図7に音響処理判断部24及び音響処理部25の詳細例を示す。
図7では、音響処理部(送信側)25への制御は、図2に示した処理と同様の処理になるため図を省略している。ここでは、音響処理部(受信側)26と音響環境判断部24との例を詳細に記述した。
スイッチ31、AGC32、スイッチ33、イコライザ(EQ)34の制御例を説明する。スイッチ31はAGCを、スイッチ33はEQをON/OFF制御するスイッチである。
例えば、音響環境判断部24で実施形態1と同様に音響環境を判断し、適切な音量であるときはスイッチ31を操作してAGCを無効にすることで処理負荷を軽減させることができる。また、雑音が多い環境であった場合は、AGC32を制御してスピーカ27から出力される音量を大きくすることができる。また、反響が多い環境であればAGC32を制御してスピーカ27から出力される音量を小さくしてエコーの発生を抑えるなどの制御が可能となる。
また、音響の反響特性を判断し、スイッチ33を操作してEQを無効にすることで処理負荷を軽減させることができる。また、音響特性の判断で反響しやすい周波数帯が分かれば、EQ34を制御して当該周波数帯の音量を小さくする、などの音響効果を与えることができる。また、通常のイコライジング機能として、受信音にユーザの好みの音響効果を付与することも可能である。例えば通信相手からの受信音が音声ではなく音楽ファイルであった場合に、重低音を響かせる、ボーカルを際立たせるなどの音響効果を与えることができる。
音響環境判断部と図6では音響環境判断部24が、音響処理部25への制御と音響処理部26への制御を両方とも行っているが、片方ずつ別々の判断部を持たせる構成でもよい。
本構成の動作フローは実施形態1〜3に示したものと同様となるため、動作フローの説明は省略する。
また、本実施形態のような処理を行うと、通信相手の音声入出力装置Aが高性能な音響処理を持っていない場合でも、音声入出力装置11が持っている受信側の音響処理部16の処理により適切な音響処理を行うことができる。
〔実施形態5〕
実施形態1〜4では音声の送受信端末、音声ファイルの送受信端末を想定しているが、本発明はこれに限定されるものではなく、通信を行わない独立した端末にも適用できる。
図8に本発明に係る音声入出力装置の他の構成例を示す。
音楽ファイル再生装置(端末)41があり、マイク45とスピーカ44とを外部に持つ。端末の内部に音響環境判断部46を持ち、ここにマイク45で入力された音声とスピーカ44から出力される音声とを入力する。音響環境判断部46で端末の外部の音響環境を判断し音響処理部43で外部の音響環境に応じた制御を行う。
例えば、実施形態4で述べたように、雑音が多い環境ではスピーカ44からの音量を大きくしたり、反響が多い環境であれば音量を小さくしたりする制御を行う。また、反響における周波数成分を分析し、イコライザ機能により反響を起こしやすい周波数部のみ音量を小さくする、などの制御も可能である。風呂場で音楽を聴くときなどに応用可能である。
このようにすると、外部の音響環境に合わせて再生音の音響を制御することができる。
〔その他〕
実施形態1〜4に挙げた例でのマイクとスピーカは音声入出力装置1に一つずつの構成であるが、ステレオなどの多チャンネル音声に対応するために複数のマイク・スピーカを接続する構成でもよい。また、音声だけでなく、Hi−Fiオーディオを使って音響環境を判断してもよい。
さらに、音響環境判断部4に、個別に外部機器を接続し、送信する音声であるマイクでの音声とは別の情報を使用して音響環境判断部5での判定を行ってもよい。例えば、カメラや赤外線センサーを利用し、そばに人物がいる場合のみ音声を出力したり、ソナーを利用して部屋の大きさを把握し、音響特性を導くようにしたりすることができる。
通信相手については、図1や図4では音声入出力装置Aのみの1拠点であるが、ネットワークを介して複数拠点と通信を行ってもよい。
以上において、本発明は、従来では存在しなかった音響環境判断手段を持ち、それによって音響処理手段を制御することにより、自端末の置かれている音響環境に応じた音響処理を施した音声を相手端末に送信することができる。
〔発明の効果〕
第1の効果は、人間系による音響設定のばらつきを排除できることである。
その理由は、音響処理についてあまり知識のない一般使用者が、独自の判断で音響処理の有無や効果の強弱を設定するのではなく、一定のアルゴリズムを用いて最適な音響処理を設定するためである。
第2の効果は、音響処理による処理負荷を必要最小限にとどめることができることである。
その理由は、 自端末の置かれている音響環境に応じて必要な音響処理のみ選択して実施できるため、余分な処理を行うことを排除できるからである。
第3の効果は、ユーザの利便性を向上できることである。
その理由は、通話開始時等に端末で自動的に音響処理の実施内容を決定するため、ユーザが明示的に選択する必要がなく、ユーザは本来の装置の目的に集中できるからである。
第4の効果は、時間経過に対し適応的に音響処理を選択することができる点である。
その理由は、自端末の置かれている音響環境の時間経過に適応して必要な音響処理を実施できるため、常にそのときの音響系に適した通話品質で通信することができるからである。
なお、上述した実施の形態は、本発明の好適な実施の形態の一例を示すものであり、本発明はそれに限定されることなく、その要旨を逸脱しない範囲内において、種々変形実施が可能である。
本発明は、電話、IP電話、テレビ会議、Web会議等のリアルタイム送受信通信を行う装置、システム、プログラム等に利用することができ、音楽再生端末、音声出力装置、システム、プログラム等に利用することができる。
本発明に係る音声入出力装置の一実施の形態を示す構成図である。 図1に示した音声入出力装置の音響処理判断部4及び音響処理部5の一例を示す図である。 本発明に係る音声入出力方法のフローの一例である。 本発明に係る音声入出力方法のフローの他の例である。 本発明に係る音声入出力装置の構成例を示す図である。 本発明に係る音声入出力装置の他の構成例を示す図である。 音響処理判断部24及び音響処理部25の詳細例を示す図である。 本発明に係る音声入出力装置の他の構成例を示す図である。
符号の説明
1 音声送受信端末
2 コーデック送受信処理など
3 マイク
4 音響環境判断部
5、6 音響処理部
7 スピーカ
A 音声送受信端末

Claims (20)

  1. スピーカから音声を出力し、マイクで音声を入力する音声入出力装置において、
    1つ以上の音響処理機能を組み合わせ、前記マイクで入力された音声に音響処理を行う音響処理手段と、
    前記マイクで入力された音声と前記スピーカから出力される音声とを使用して前記スピーカから前記マイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて、前記音響処理手段へ作用を及ぼす音響環境判断手段とを備えたことを特徴とする音声入出力装置。
  2. 前記音響処理手段は、組み合わせた音響処理機能を各々または全てを有効化または無効化できるようにしたことを特徴とする請求項1に記載の音声入出力装置。
  3. 前記スピーカから出力する音声に音響処理を行う音響処理手段を備えたことを特徴とする請求項1または2に記載の音声入出力装置。
  4. 前記マイクで入力された音声と前記スピーカから出力された音声とを使用して前記スピーカから前記マイクへの空間の音響伝達特性を推定し、前記音響伝達特性に合わせて、前記スピーカから出力する音声に音響処理を行う音響処理手段へ作用を及ぼす音響環境判断手段を備えたことを特徴とする請求項1から3のいずれか1項記載の音声入出力装置。
  5. ネットワークを介して他の音声入出力装置と音声の送受信を行う送受信手段を備えたことを特徴とする請求項1から4のいずれか1項に記載の音声入出力装置。
  6. 他の音声入出力装置との音声の送受信の開始を使用者に示す呼び出し手段と、
    前記スピーカから出力される呼び出し音と、前記マイクで入力された音声とを使用して前記スピーカから前記マイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて、前記音響処理手段へ作用を及ぼす音響環境判断手段とを備えたことを特徴とする請求項1から5のいずれか1項に記載の音声入出力装置。
  7. 他の音声入出力装置との音声の送受信の開始を使用者に示す呼び出し音を使用者が選択することができるようにしたことを特徴とする請求項6に記載の音声入出力装置。
  8. 他の音声入出力装置との音声の送受信の開始を使用者に示す呼び出し音に、空間の音響伝達特性を推定するための試験音を追加できるようにしたことを特徴とする請求項7に記載の音声入出力装置。
  9. 使用者が指定したタイミングでスピーカから出力される呼び出し音と、マイクで入力された音声とを使用してスピーカからマイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて、前記音響処理手段へ作用を及ぼす音響環境判断手段を備えたことを特徴とする請求項1から5のいずれか1項に記載の音声入出力装置。
  10. 他の音声入出力装置との音声の送受信の開始を使用者を示す呼び出し音を有し、使用者が指定したタイミングで、前記の呼び出し音を使用してスピーカから出力される呼び出し音と、マイクで入力された音声とを使用してスピーカからマイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて、前記音響処理手段へ作用を及ぼす音響環境判断手段を備えたことを特徴とする請求項9に記載の音声入出力装置。
  11. 他の音声入出力装置との音声の送受信の開始を使用者に示す呼び出し音として使用者が指定した音声を利用するようにしたことを特徴とする請求項10に記載の音声入出力装置。
  12. 他の音声入出力装置との音声の送受信の開始を使用者に示す呼び出し音に、空間の音響伝達特性を推定するための試験音を追加できるようにしたことを特徴とする請求項11に記載の音声入出力装置。
  13. 他の音声入出力装置との音声の送受信の開始を使用者に示す呼び出し音に、空間の音響伝達特性を推定するための試験音を追加できるようにしたことを特徴とする請求項12に記載の音声入出力装置。
  14. 音声を入力するマイクを2つ以上備えたことを特徴とする請求項1から13のいずれか1項に記載の音声入出力装置。
  15. 音声を出力するスピーカを2つ以上備えたことを特徴とする請求項1から14のいずれか1項に記載の音声入出力装置。
  16. マイク以外の外部機器によって空間の音響伝達特性を推定し、音響伝達特性に合わせて、前記音響処理手段へ作用を及ぼす音響処理手段を備えたことを特徴とする請求項1から15のいずれか1項に記載の音声入出力装置。
  17. 音楽ファイルを内部に有し、音楽ファイルをスピーカから再生する音声入出力装置において、
    マイクで音声を入力する音声入力手段と、
    スピーカから出力する音声に音響処理を行う音響処理手段と、
    前記マイクで入力される音声と前記スピーカから出力される音声とを使用して前記スピーカから前記マイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて、前記音響処理手段へ作用を及ぼす音響環境判断手段とを備えたことを特徴とする音声入出力装置。
  18. 前記音響処理手段は、1つ以上の音響処理機能を組み合わせたものであることを特徴とする請求項17に記載の音声入出力装置。
  19. スピーカから音声を出力し、マイクで音声を入力する音声入出力方法において、
    1つ以上の音響処理機能を組み合わせ、前記マイクで入力された音声に音響処理を行う際に、
    前記マイクで入力された音声と前記スピーカから出力される音声とを使用して前記スピーカから前記マイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて前記音響処理を行うことを特徴とする音声入出力方法。
  20. 音楽ファイルを内部に有し、音楽ファイルをスピーカから再生する音声入出力方法において、
    マイクで音声を入力し、
    スピーカから出力する音声に音響処理を行う際に、
    前記マイクで入力される音声と前記スピーカから出力される音声とを使用して前記スピーカから前記マイクへの空間の音響伝達特性を推定し、音響伝達特性に合わせて、前記音響処理を行うことを特徴とする音声入出力方法。
JP2007046273A 2007-02-26 2007-02-26 音声入出力装置及び音声入出力方法 Withdrawn JP2008211526A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007046273A JP2008211526A (ja) 2007-02-26 2007-02-26 音声入出力装置及び音声入出力方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007046273A JP2008211526A (ja) 2007-02-26 2007-02-26 音声入出力装置及び音声入出力方法

Publications (1)

Publication Number Publication Date
JP2008211526A true JP2008211526A (ja) 2008-09-11

Family

ID=39787457

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007046273A Withdrawn JP2008211526A (ja) 2007-02-26 2007-02-26 音声入出力装置及び音声入出力方法

Country Status (1)

Country Link
JP (1) JP2008211526A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011028061A (ja) * 2009-07-27 2011-02-10 Canon Inc 音声記録装置及び方法、ならびに撮影装置
JP2011211484A (ja) * 2010-03-30 2011-10-20 Saxa Inc 電話システム、電話システムの音声通話制御方法
WO2012001804A1 (ja) * 2010-07-01 2012-01-05 パイオニア株式会社 通話装置、通話方法、及び通話プログラム
JP2014176043A (ja) * 2013-03-13 2014-09-22 Ricoh Co Ltd 通信装置、エコーキャンセル性能評価方法、及び位置関係適否通知方法
JP2018019396A (ja) * 2016-07-26 2018-02-01 Line株式会社 音質改善方法、音質改善方法を実行させるためのコンピュータプログラム、および電子機器
JP2020116165A (ja) * 2019-01-24 2020-08-06 Toto株式会社 浴室システム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011028061A (ja) * 2009-07-27 2011-02-10 Canon Inc 音声記録装置及び方法、ならびに撮影装置
US8626500B2 (en) 2009-07-27 2014-01-07 Canon Kabushiki Kaisha Apparatus and method for noise reduction and sound recording
JP2011211484A (ja) * 2010-03-30 2011-10-20 Saxa Inc 電話システム、電話システムの音声通話制御方法
WO2012001804A1 (ja) * 2010-07-01 2012-01-05 パイオニア株式会社 通話装置、通話方法、及び通話プログラム
JP2014176043A (ja) * 2013-03-13 2014-09-22 Ricoh Co Ltd 通信装置、エコーキャンセル性能評価方法、及び位置関係適否通知方法
JP2018019396A (ja) * 2016-07-26 2018-02-01 Line株式会社 音質改善方法、音質改善方法を実行させるためのコンピュータプログラム、および電子機器
JP7017873B2 (ja) 2016-07-26 2022-02-09 Line株式会社 音質改善方法、音質改善方法を実行させるためのコンピュータプログラム、および電子機器
JP2020116165A (ja) * 2019-01-24 2020-08-06 Toto株式会社 浴室システム

Similar Documents

Publication Publication Date Title
JP5085556B2 (ja) エコー除去の構成
US8630685B2 (en) Method and apparatus for providing sidetone feedback notification to a user of a communication device with multiple microphones
US9749737B2 (en) Decisions on ambient noise suppression in a mobile communications handset device
CA2560034C (en) System for selectively extracting components of an audio input signal
JP5525508B2 (ja) 周囲ノイズ検出を使用する明瞭度コントロール
US20090253418A1 (en) System for conference call and corresponding devices, method and program products
JP4241831B2 (ja) エコー及び雑音の適応制御の為の方法及び装置
US9749474B2 (en) Matching reverberation in teleconferencing environments
WO2021056999A1 (zh) 语音通话方法、装置、电子设备及计算机可读存储介质
USRE49462E1 (en) Adaptive noise cancellation for multiple audio endpoints in a shared space
JPH09172485A (ja) スピーカホンシステム、およびそこにおける送信および受信信号振幅を調節し、制御するための方法
US9491306B2 (en) Signal processing control in an audio device
US8744524B2 (en) User interface tone echo cancellation
JP2008211526A (ja) 音声入出力装置及び音声入出力方法
EP2700161A2 (en) Processing audio signals
US20120148059A1 (en) Controlling Audio Signals
US20040022394A1 (en) Room acoustics echo meter for voice terminals
JP2007124255A (ja) Ip電話装置およびその制御方法
JP2004235708A (ja) 電話装置
CN114333867A (zh) 音频数据处理方法和装置、通话方法、音频处理芯片、电子设备以及计算机可读存储介质
JP2006270300A (ja) 受話音量制御装置
JP2006108777A (ja) 電話端末及びこの電話端末を使用した電話システム、及び電話端末の制御方法
JP2004320610A (ja) 多チャネル音声損失制御装置、方法、及び多チャネル音声損失制御プログラム

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20100511