JP2006323308A - 音声処理装置、通話装置、およびプログラム - Google Patents

音声処理装置、通話装置、およびプログラム Download PDF

Info

Publication number
JP2006323308A
JP2006323308A JP2005148631A JP2005148631A JP2006323308A JP 2006323308 A JP2006323308 A JP 2006323308A JP 2005148631 A JP2005148631 A JP 2005148631A JP 2005148631 A JP2005148631 A JP 2005148631A JP 2006323308 A JP2006323308 A JP 2006323308A
Authority
JP
Japan
Prior art keywords
peak value
level
volume
signal processing
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005148631A
Other languages
English (en)
Other versions
JP4604836B2 (ja
Inventor
Tomohiro Ito
智浩 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2005148631A priority Critical patent/JP4604836B2/ja
Priority to US11/436,645 priority patent/US20060274731A1/en
Publication of JP2006323308A publication Critical patent/JP2006323308A/ja
Application granted granted Critical
Publication of JP4604836B2 publication Critical patent/JP4604836B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract

【課題】 音量レベルがしばしば変化するような音声であっても、その変化に追従して音声信号に対する信号処理を施すことができる音声処理装置を提供すること。
【解決手段】 複合機が備える音声処理装置は、通信先機器との間で伝送される音声信号の信号レベルLcを測定し(S145)、RAMに格納されたピーク値LpとS145の処理で測定された信号レベルLcとの差の絶対値(|Lp−Lc|)が、あらかじめ定められた閾値Lhより大きく(S150:はい)、且つ、S145の処理で測定された信号レベルLcが−30dBmより大きい場合に(S155:はい)、音響パラメータ群を更新する(S165)。その結果、音量の最適化、音量に応じたノイズ成分のカット、音量に応じたエコーキャンセルなどが施され、通信先機器との間で伝送される音声信号が聞き取りやすい音声に補正される。
【選択図】 図3

Description

本発明は、通信先機器との間で伝送される音声信号に対して、音量や音質などを変更するための信号処理を施す音声処理装置と、この音声処理装置を備えた通話装置、および、コンピュータを音声処理装置として機能させるためのプログラムに関する。
従来、通信先機器との間で伝送される音声を対象にして、音量の変更を実施する装置としては、例えば、下記特許文献1に記載のものが知られている。
この特許文献1に記載の装置は、音声データの回帰性の高さに基づいて音声であるか否かを判断し、音声である場合には、数百ミリ秒程度の期間内に含まれる複数フレームを対象にしてフレームエネルギーの積分を行って、この積分値に基づいて音量レベルの判定を行っていた。
特開平7−177085号公報
しかし、上記特許文献1に記載の技術では、数百ミリ秒程度の期間が経過した後でないと音量レベルの変化を検出することができず、実際に音量レベルが変化するタイミングと、その変化を検出して音量を変更するタイミングとの間には、少なくとも数百ミリ秒程度のずれが生じていた。そのため、例えば、抑揚のある音声など、音量がしばしば変化するような場合には、実際の音量の変化に音量の変更制御がうまく追従できず、必ずしも聞き取りやすい音量にならないことがあった。
また、上記特許文献1に記載の技術の場合、きわめて音量が小さい音声であっても、音声であると判断した場合には音量の変更制御を行ってしまうため、例えば、通話相手の周囲から拾った音声など、通常であれば聞こえなくても構わないようなごく僅かな音量の音声まで音量変更の対象となってしまうことがあった。
本発明は、上記諸問題を解決するためになされたものであり、その第1の目的は、音量レベルがしばしば変化するような音声であっても、その変化に追従して音声信号に対する信号処理を施すことができる音声処理装置を提供することにある。また、第2の目的は、ある程度以上の音量を持つ音声を対象にして、その音量の変化に追従して音声信号に対する信号処理を施すことができる音声処理装置を提供することにある。さらに、上記のような音声処理装置を備えた通話装置、および、コンピュータを上記のような音声処理装置として機能させるためのプログラムを提供することにある。
以下、本発明において採用した特徴的構成について説明する。
本発明の音声処理装置は、通信先機器から送信されてくる音声信号の音量レベルを測定する測定手段と、前記測定手段によって測定された前記音量レベルのピーク値に基づいて、前記通信先機器との間で伝送される音声信号に対し、前記ピーク値に応じて決まる信号処理を施す信号処理手段とを備えたことを特徴とする。
この音声処理装置において、信号処理手段は、通信先機器との間で伝送される音声信号に対して信号処理を施す際に、測定手段によって測定された音量レベルのピーク値に基づいて、ピーク値に応じて決まる信号処理を施す。このような音量レベルのピーク値は、所定の期間にわたる積分値等とは異なり、ほぼ瞬時に測定可能である。
したがって、この音声処理装置であれば、例えば、抑揚のある音声など、音量がしばしば変化するような場合にも、実際の音量の変化に遅れることなく信号処理を施すことができ、より聞き取りやすい音量や音質に補正することができる。
ところで、信号処理手段による信号処理については、具体的な処理内容がいくつか考えられるが、好ましい信号処理の一例を挙げれば、前記信号処理手段は、前記ピーク値に応じて決まる信号処理として、音量レベルを前記ピーク値に応じて決まるレベルに変更する処理、および、エコーキャンセルのレベルを前記ピーク値に応じて決まるレベルに変更する処理のうち、少なくとも1つの処理を、前記通信先機器との間で伝送される音声信号に対して施すように構成されているとよい。
音量レベルを前記ピーク値に応じて決まるレベルに変更する処理を行えば、例えば、ピーク値が大きい場合ほど音量を低減したり、ピーク値が小さい場合ほど音量を増大させたりすることで、音声を聞き取りやすくすることができる。
また、エコーキャンセル処理については、ピーク値が大きい場合ほどエコー(自分の声のはね返り音)も共に増大する傾向があるので、ピーク値が大きい場合にはエコーキャンセルがより強く効く一方、ピーク値が小さい場合にはエコーキャンセルがより弱く効くように、エコーキャンセルのレベル(設定)を変更することで、音声を聞き取りやすくすることができる。ちなみに、エコーが過剰に大きい場合は、通話相手の音声が聞き取りにくくなる傾向があるものの、エコーを完全に消失させても違和感があり、必ずしも聞きやすく話しやすい通話環境にはならない傾向がある。つまり、エコーキャンセルの効き具合は弱すぎても問題であるが、エコーキャンセルの効き具合が強すぎることが理想的な訳ではない。この点、上記のようにピーク値に応じてエコーキャンセルのレベルを変更すれば、音量が大きいときにエコーまで過剰に大きくなることが無く、音量が小さいときにエコーが過剰に小さくなることも無い。
これらの処理は一方を採用するだけでも相応の効果を得られるが、両方とも採用すればさらに効果的である。
また、信号処理手段は、測定手段によって測定された音量レベルのピーク値に変化があった場合に、直ちに変化後のピーク値に応じて決まる信号処理を施してもよいが、ピーク値が頻繁に変化するような場合には、信号処理の内容が頻繁に変化し、その結果、利用者が聴覚上の不自然さを感じるおそれもある。
そこで、このような聴覚上の不自然さを解消したい場合には、前記ピーク値を記憶可能なピーク値記憶手段と、前記ピーク値記憶手段に記憶された前記ピーク値と、前記測定手段によって測定された前記ピーク値とに基づいて、前記ピーク値記憶手段に記憶された前記ピーク値の更新を行うか否かを判定する判定手段と、前記判定手段によって前記ピーク値の更新を行うと判定された場合に、前記ピーク値記憶手段に記憶された前記ピーク値を、前記測定手段によって測定された前記ピーク値で更新する更新手段とを備え、前記信号処理手段は、前記ピーク値記憶手段に記憶された前記ピーク値に基づいて、前記通信先機器との間で伝送される音声信号に対して前記信号処理を施すようにするとよい。
このように構成された音声処理装置によれば、測定手段によって測定された音量レベルのピーク値に変化があったとしても、判定手段がピーク値記憶手段に記憶されたピーク値の更新を行うと判定した場合しか、更新手段がピーク値記憶手段に記憶されたピーク値を更新しない。したがって、ピーク値の変化の程度を考慮して判定条件を適切に設定しておけば、ピーク値が頻繁に変化するような場合でも、信号処理の内容が頻繁に変化するのを抑制することができ、その結果、利用者が聴覚上の不自然さを感じるのを防ぐことができる。
判定手段の用いる判定条件については、いくつかの条件を考え得るが、例えば、前記判定手段は、前記ピーク値記憶手段に記憶された前記ピーク値と、前記測定手段によって測定された前記音量レベルのピーク値に、あらかじめ定められた大きさ以上の差がある場合に、前記ピーク値記憶手段に記憶された前記ピーク値の更新を行うと判定するとよい。
このようにすれば、ピーク値が僅かに変化した程度では、信号処理手段による信号処理の内容は変化しないので、利用者が聴覚上の不自然さを感じるのを防ぐことができる。
また、前記判定手段は、前記測定手段によって測定された前記音量レベルのピーク値が、あらかじめ定められた下限値より大きい場合に、前記ピーク値記憶手段に記憶された前記ピーク値の更新を行うと判定してもよい。
このようにすれば、ピーク値が極端に小さくなったときには、信号処理手段による信号処理の内容は変化しないので、瞬間的な無音状態に合わせて音量の増大が図られるようなことがなく、利用者が聴覚上の不自然さを感じるのを防ぐことができる。
なお、以上説明した本発明の音声処理装置は、電話機やパーソナルコンピュータ等を利用して構成されるIP電話装置などの通話装置に適用すると好適である。
また、電話機に内蔵されるコンピュータやパーソナルコンピュータを、上述した音声処理装置が備える各手段として機能させるためのプログラムがあれば、それらのコンピュータを利用して本発明の音声処理装置を構成することができる。
次に、本発明の実施形態について一例を挙げて説明する。
以下に説明する実施形態は、本発明に係る音声処理装置を、ファクシミリ機能、電話機能、プリンタ機能、スキャナ機能、およびコピー機能等を兼ね備えた複合機(一般にMFP(Multi-Function Product)等と呼ばれる装置)に適用したものである。本発明に係る音声処理装置は、複合機の電話機能を利用したときに通信先機器との間で伝送される音声信号を対象にして、後述する信号処理を行うことになる。
[複合機の構成]
まず、複合機1の構成について説明する。
複合機1には、図1に示すように、CPU11、ROM12、EEPROM13、RAM14、画像メモリ15、回線I/F部19、モデム20、バッファ21、スキャナ22、符号化部23、復号化部24、プリンタ25、操作パネル4、LCD(液晶表示パネル)5、アンプ27、通話用のハンドセット47などが設けられており、これらがバスライン30を介して互いに接続されている。
CPU11は、バスライン30により接続された各部を制御する装置であり、例えば、回線I/F部19を介して音声や画像データの送受信を行うための処理等を実行する。
ROM12は、この複合機1で実行される制御プログラム等を格納した書き換え不能な記憶装置であり、後述する処理をCPU11に実行させるためのプログラムは、このROM12に格納されている。また、ROM12には、ハンドセット音響パラメータテーブル12a(詳細は後述)も格納されている。
EEPROM13は、複合機1の電源が遮断された後も書き込まれたデータを保持することができる書き換え可能な不揮発性の記憶装置である。
RAM14は、複合機1の各動作の実行時に各種のデータや着信履歴等を記憶するための読み込みおよび書き換えが可能な記憶装置であり、後述する処理の中で書き込みおよび更新がなされるハンドセット音響パラメータ14a、およびピーク音声レベル14bなどは、このRAM14に格納されている。
画像メモリ15は、画像データ及び印刷のためのビットイメージを記憶するための記憶装置であり、安価な大容量メモリであるダイナミックRAM(DRAM)により構成されている。そして、受信された画像データは、一旦画像メモリ15に記憶され、プリンタ25によって記録紙に印刷された後に、この画像メモリ15から消去される。また、スキャナ22によって読み取られた画像データも、この画像メモリ15に記憶される。
回線I/F部19は、回線制御を行うためのものであり、電話回線側(例えば、交換機あるいはIP電話アダプタ)から送られてくる呼出信号(リング信号)や相手側装置の電話番号等の発信元識別情報(以下、発信元識別情報をCallerIDという。)を示す信号等の各種信号を受信するとともに、操作パネル4上のキーの操作に応じた発信時のダイヤル信号を電話回線側へ送信する。
モデム20は、画情報及び通信データを変調及び復調して伝送するとともに、伝送制御用の各種手順信号を送受信するためのものである。
バッファ21は、相手側装置との間で送受信される符号化された画情報を含むデータを一時的に記憶するためのものである。
スキャナ22は、原稿挿入口に挿入された原稿を画像データとして読み取るためのものであり、原稿搬送用モータを備えている。
符号化部23は、スキャナ22により読み取られた画像データの符号化を行うものである。
復号化部24は、バッファ21又は画像メモリ15に記憶された画像データを読み出して、これを復号化するものであり、復号化されたデータは、プリンタ25により記録紙に印刷される。
プリンタ25は、記録紙を搬送する記録紙用搬送モータ、印字ヘッドを搭載したキャリッジを移動させるキャリッジモータ、及び記録紙へインクを吐出する印字ヘッド等を備えた、周知のインクジェット方式のプリンタで構成されている。
LCD5は、CPU11から指令信号に基づいて、様々な情報を文字又は画像を通じてユーザに向けて発するものであり、その情報としては、例えば、FAXデータを送受信中である旨、又は発信元の電話番号もしくはファクシミリ番号や発信元の名前もしくは名称等の発信元の情報等が挙げられる。
アンプ27は、そのアンプ27に接続されたスピーカ28を鳴動して、呼出音や音声を出力するためのものである。
ハンドセット47は、通信先機器から送信されてくる音声信号を再生するスピーカと通話者が発する音声を入力するマイクロフォン等とが一体化された通話用の送受話器である。
フックスイッチ48は、利用者がハンドセット47を持ち上げる操作(フックアップ)を行ったときにオンになり、ハンドセット47を元の位置に戻す操作(フックダウン)を行ったときにオフになるスイッチである。フックスイッチ48のオン/オフはCPU11によって監視され、フックスイッチ48がオンになるとCPU11は回線を閉結し、フックスイッチ48がオフになるとCPU11は回線を開放する。また、このフックスイッチ48は、操作パネル4での操作によってもオン/オフを切り替え可能になっており、操作パネル4を利用すれば、ハンドセット47を持ち上げる操作(フックアップ)を実際に行わなくても、複合機1の状態をフックアップ/フックダウンが行われた場合と同等な状態に切り替えることができる。
[ハンドセット音響パラメータテーブル]
次に、ROM12に格納されたハンドセット音響パラメータテーブル12aについて説明する。
ハンドセット音響パラメータテーブル12aは、本実施形態においては、図2に示すようなデータ構造のテーブルとなっている。すなわち、本実施形態において、ハンドセット音響パラメータテーブル12aには、3組分の音響パラメータ群が格納されており、これら3組の音響パラメータ群が、3つの範囲(−20dBm〜−30dBm、−10dBm〜−20dBm、−10dBm以上)に区分された音声信号の信号レベル(=音量レベル)に対して、一対一の関係で対応づけられている。
1組分の音響パラメータ群には、各組とも、送話レベル、受話レベル、フィルター特性値、およびLEC(ラインエコーキャンセラー)設定値、以上4種の音響パラメータが含まれている。これら4種の音響パラメータのうち、送話レベルおよび受話レベルの2種については、操作パネル4で設定可能な3通りの音量設定(大、中、小)それぞれに対応する3対の音響パラメータが格納されている。
3組の音響パラメータ群のうち、−20dBm〜−30dBmに対応する音響パラメータ群は、比較的小さい音声を対象にして信号処理を施すためのパラメータであり、この音響パラメータ群に基づいて信号処理を行うことで、音量の増大、ノイズ成分のカット、エコーキャンセル等が施されて、比較的小さい音声がより聞き取りやすい音量および音質に変換される。
また、−10dBm〜−20dBmに対応する音響パラメータ群は、標準的な音量の音声を対象にして信号処理を施すためのパラメータであり、この音響パラメータ群に基づいて信号処理を行うことで、音量は殆ど変更せず、ノイズ成分のカット、エコーキャンセル等が施されて、標準的な音量の音声がより聞き取りやすい音質に変換される。
さらに、−10dBm以上に対応する音響パラメータ群は、比較的大きい音声を対象にして信号処理を施すためのパラメータであり、この音響パラメータ群に基づいて信号処理を行うことで、音量の低減、ノイズ成分のカット、エコーキャンセル等が施されて、比較的大きい音声が聞き取りやすい音量および音質に変換される。
これら3組の音響パラメータ群は、後述する処理の中で、いずれか1組が択一的に利用されて、通信先機器との間で伝送される音声信号に対する信号処理が施されることになる。このとき、送話レベルおよび受話レベルの2種については、音量設定(大、中、小)に対応する3対が用意された音響パラメータの中から、操作パネル4で設定された音量設定(大、中、小)に応じて、いずれか1対の音響パラメータが利用される。
後述する処理の中では、CPU11が通信先機器から送信されてくる音声信号の信号レベルのピーク値を測定し、所定の更新条件(詳細は後述)を満たした場合に、測定されたピーク値がピーク音声レベル14bに格納される。また、ピーク音声レベル14bに格納されたピーク値が更新された場合には、そのピーク値に対応する1組の音響パラメータ群の中から、操作パネル4での音量設定(大、中、小)も考慮して4種の音響パラメータが読み出され、読み出された4種の音響パラメータがハンドセット音響パラメータ14aに格納される。
CPU11は、通信先機器との間で伝送される音声信号に対し、常にハンドセット音響パラメータ14aを参照して信号処理を行うように構成されており、ピーク音声レベル14bに格納されたピーク値が更新された際には、その更新に伴ってハンドセット音響パラメータ14aが更新されるので、その結果、CPU11は、通信先機器との間で伝送される音声信号に対し、更新後のピーク値に応じて決まる信号処理を施すことになる。
[音声信号に対する信号処理]
次に、音声信号に対する信号処理について、図3に示すフローチャートに基づいて説明する。図3に示すフローチャートは、複合機1においてCPU11によって常時実行される処理の中から、本発明の要部に関連する処理ステップのみを抜粋して示したものである。CPU11は、実際には図3に表れない処理をも実行しているが、本発明の要部に関連しない処理については図示を省略してある。
CPU11によってこの処理が実行されると、まず、フックスイッチ48が監視されて(S105)、利用者がハンドセットをフックアップしたか否かが判断される(S110)。ここで、利用者がハンドセットをフックアップしていない場合は(S110:いいえ)、S105の処理へと戻ってS105〜S110の処理が繰り返され、フックスイッチ48の監視が継続される。なお、S110の処理では、利用者が実際にハンドセット47をフックアップした場合はもちろんのこと、操作パネル4での操作によって複合機1の状態をフックアップした場合と同等な状態に切り替えた場合でも、ハンドセットをフックアップしたと判断される。
そして、S105〜S110の処理が繰り返される間に、利用者がハンドセットをフックアップしたら(S110:はい)、回線が閉結され(S115)、ハンドセット47による通話開始処理が実行され(S120)、利用者は通信先機器を利用する通話相手との通話を行うことができる状態となる。
続いて、ピーク値(Lp)の初期化が行われる(S125)。このピーク値(Lp)は、RAM14のピーク音声レベル14bに格納される値であり、後述する処理の中で、通信先機器との間で伝送される音声信号の信号レベル(音量レベル)を測定した後は、測定された信号レベルのピーク値が格納されることになるが、S125の処理の段階では、通信先機器との間で伝送される音声信号の信号レベルがまだ実測されていないので、S125の処理では、RAM14のピーク音声レベル14bに初期値として0dBmが格納される。
続いて、ハンドセット音響パラメータの初期化が行われる(S130)。このS130の処理では、ピーク値(Lp)の初期値(0dBm)に対応する音響パラメータ群が、ROM12のハンドセット音響パラメータテーブル12aから読み出される。このとき、操作パネル4で設定された音量設定(大、中、小)も参照され、この音量設定に応じた2種の音響パラメータ(送話レベルおよび受話レベル)と、他の2種の音響パラメータ(フィルター特性値およびLEC設定値)が読み出される。そして、読み出された4種の音響パラメータが、RAM14のハンドセット音響パラメータ14aに格納される。既に説明した通り、CPU11は、通信先機器との間で伝送される音声信号に対し、常にハンドセット音響パラメータ14aを参照して信号処理を行っているため、S130の処理を実行した時点では、通信先機器との間で伝送される音声信号の信号レベルのピーク値が0dBmであるとの想定で信号処理が行われることになる。
なお、上述の通り、音声信号の信号レベルのピーク値が0dBmであるとの想定で信号処理を行う理由は、実際に通信先機器との間で伝送される音声信号の信号レベルが比較的過大であった場合には適切に音量を低減することができ、しかも、万一、信号レベルが比較的過小であった場合でもさらに音量が低減されるだけで、少なくともハンドセット47から予期しない大音量の音声を発してしまうことは防止できるからである。仮に、通信先機器との間で伝送される音声信号の信号レベルのピーク値が−30dBmといった想定で信号処理が行われたとすれば、実際に通信先機器との間で伝送される音声信号の信号レベルが比較的過小であった場合には適切に音量の増大を図ることができるかもしれないものの、万一、信号レベルが比較的過大であった場合にはさらに音量が増大してしまい、ハンドセット47から予期しない大音量の音声を発してしまうおそれがある。
さて、以上の処理を終えたら、フックスイッチ48が監視されて(S135)、ハンドセットをフックダウンしたか否かが判断される(S140)。ここで、ハンドセットをフックダウンしていないと判断された場合は(S140:いいえ)、通信先機器との間で伝送される音声信号の信号レベル(Lc)が測定される(S145)。
そして、RAM14のピーク音声レベル14bに格納されたピーク値(Lp)とS145の処理で測定された信号レベル(Lc)との差の絶対値(|Lp−Lc|)が、あらかじめ定められた閾値Lh(本実施形態では5dBm)より大きいか否かが判断され(S150)、|Lp−Lc|>Lhであれば(S150:はい)、S145の処理で測定された信号レベル(Lc)が−30dBmより大きいか否かが判断される(S155)。
ここで、Lc>−30dBmであれば(S155:はい)、ピーク音声レベルが更新される(S160)。具体的には、S145の処理で測定された信号レベル(Lc)をRAM14のピーク音声レベル14bに格納することによりピーク値(Lp)を更新する。そして、この新たなピーク値(Lp)に応じたハンドセット音響パラメータが設定される(S165)。このS165の処理では、新たなピーク値(Lp)に対応する4種の音響パラメータ(送話レベル、受話レベル、フィルター特性値、およびLEC設定値)が、ROM12のハンドセット音響パラメータテーブル12aから読み出され、読み出された音響パラメータ群が、RAM14のハンドセット音響パラメータ14aに格納される。以後、CPU11は、通信先機器との間で伝送される音声信号に対し、ハンドセット音響パラメータ14aを参照して信号処理を行うので、新たな音響パラメータ群に基づく信号処理が行われることになる。S165の処理を終えたら、S135の処理へと戻る。
一方、S150の処理において、|Lp−Lc|≦Lhであった場合は(S150:いいえ)、S160〜S165の処理を実行することなく、S135の処理へと戻る。このような処理を行うことにより、S145の処理で測定された信号レベル(Lc)が、3組の音響パラメータ群に対応づけられた3つの信号レベルの範囲の境界値(本実施形態の場合は−10dBm、−20dBm)付近で変動したときに、音響パラメータ群の更新が過剰に頻繁に行われてしまうのを防止することができる。具体例を挙げれば、例えば、S145の処理で測定された信号レベル(Lc)が、境界値−10dBmを挟んで−9dMm〜−11dBm間で変動しているような場合に、S150の処理を実施していないと、音響パラメータ群の更新が過剰に頻繁に行われ、その結果、音量の低減/低減の停止が頻繁に繰り返されるおそれがあるが、S150の処理を実施すれば、音響パラメータ群の更新は行われないので、音量の低減/低減の停止が頻繁に繰り返されることはないのである。
また、S155の処理において、Lc≦−30dBmであった場合も(S155:いいえ)、S160〜S165の処理を実行することなく、S135の処理へと戻る。このような処理を行うことにより、S145の処理で測定された信号レベル(Lc)が、瞬間的に無音あるいは無音に近い状態となっただけで音響パラメータ群が更新されて無用な音量の増大が図られるのを防止することができる。
このように、S150の処理で否定判断されるか、S155の処理で否定判断されるか、あるいは、S165の処理を終えると、いずれの場合ともS135の処理へと戻ることになり、以降、S140の処理でハンドセットをフックダウンしていないと判断されている限り(S140:いいえ)、S135〜S165の処理が繰り返される。すなわち、通話中は、S135〜S165の処理が繰り返されることになる。そして、このS135〜S165の繰り返し処理の中で、RAM14のピーク音声レベル14bに格納されたピーク値(Lp)とS145の処理で測定された信号レベル(Lc)との差の絶対値(|Lp−Lc|)が、あらかじめ定められた閾値Lhより大きく(S150:はい)、且つ、S145の処理で測定された信号レベル(Lc)が−30dBmより大きい場合には(S155:はい)、音響パラメータ群が更新されて、その結果、音量の最適化、音量に応じたノイズ成分のカット、音量に応じたエコーキャンセルなどが施され、通信先機器との間で伝送される音声信号が聞き取りやすい音声に補正される。
なお、以上のようなS135〜S165の繰り返し処理中に、S140の処理でハンドセットをフックダウンしたと判断された場合は(S140:はい)、回線が開放され(S170)、S105の処理へと戻る。以降は、再びハンドセットをフックアップしたと判断されるまでは、S105〜S110の処理が繰り返されることになる。
以上説明した本発明の実施形態において、上記S145の処理を実行するCPU11は、本発明でいう測定手段に相当し、上記S165の処理によってRAM14のハンドセット音響パラメータ14aに格納される音響パラメータ群を参照して、通信先機器との間で伝送される音声信号に対する信号処理を行うCPU11は、本発明でいう信号処理手段に相当する。また、S160の処理によって信号レベルが格納されることになるRAM14(ピーク音声レベル14b)は、本発明でいうピーク値記憶手段に相当し、S150およびS155の処理を実行するCPU11は、本発明でいう判定手段に相当し、S160の処理を実行するCPU11は、本発明でいう更新手段に相当する。
以上、本発明の実施形態について説明したが、本発明は上記の具体的な一実施形態に限定されず、この他にも種々の形態で実施することができる。
例えば、上記実施形態では、本発明の音声処理装置を複合機1に適用する例を示したが、複合機1以外の通話装置に適用してもよいのはもちろんである。具体的には、ファクシミリ機能等を持たない単機能の電話機において本発明の構成を採用してもよい。また、電話機としては、PSTN網に接続される一般的な電話機の他、IP網に接続される電話機(いわゆるIP電話機)や携帯電話機などもあるが、これらの電話機のどれにでも本発明の構成を採用することができる。さらに、パーソナルコンピュータにマイクロフォンやヘッドフォンを接続するとともに、そのパーソナルコンピュータにIP電話ソフトウェアをインストールすれば、パーソナルコンピュータを利用したIP通話が可能となるが、そのようなパーソナルコンピュータを利用して構成されたIP通話装置においても、本発明の構成を採用することができる。
また、上記実施形態では、音声信号の信号レベルを3つの範囲に区分して、各範囲に対応する3組の音響パラメータ群をハンドセット音響パラメータテーブル12aに格納していたが、音声信号の信号レベルは必ずしも3つの範囲に区分しなくてもよく、例えば、2つの範囲あるいは4つ以上の範囲に区分してもよい。また、各範囲の境界値についても−10dBm、−20dBmに限定されるものではなく、任意に変更可能である。さらに、1組の音響パラメータ群を4種の音響パラメータで構成していたが、この音響パラメータの数も任意である。
また、上記実施形態では、あらかじめ用意されたハンドセット音響パラメータテーブル12aから、音響パラメータ群を読み取るように構成してあったが、音響パラメータ群を得るための方法は、テーブル参照方式に限られるものではなく、例えば、音声信号の信号レベルxを変数とする所定の数式f(x)を用いて、所定の音響パラメータy=f(x)を算出するように構成してもよい。
また、上記実施形態では、S150の処理において、閾値Lhを5dBmに設定していたが、この閾値Lhについては5dBm以外の値を採用してもよく、また、S155の処理においては、信号レベル(Lc)が−30dBmより大きいか否かを判断していたが、この値についても、−30dBm以外の値を採用してもよい。
さらに、通信先機器との間で伝送される音声信号としては、通信先機器へ伝送される音声信号と、通信先機器から伝送されてくる音声信号の2つがあり、これら2つの音声信号の両方を本発明の音声処理装置による処理対象とすれば最も効果的であるが、いずれか一方の音声信号のみを本発明の音声処理装置による処理対象としても相応の効果は得られる。すなわち、本発明の構成は、送話側および受話側の双方に適用してもよいし、送話側のみに適用してもよいし、受話側のみに適用してもよい。送話側に適用した場合は、この通話装置の利用者が発する音声が過小または過大でも適切な音量や音質に補正してから通信先機器へと伝送することができ、受話側に適用した場合は、通信先機器から伝送されてくる音声が過小または過大でも適切な音量や音質に補正してから、補正後の音声をこの通話装置の利用者に聞かせることができる。
本発明の実施形態として説明した通話装置の概略構成を示すブロック図。 ハンドセット音響パラメータテーブルの一例を示す説明図。 音声信号に対する信号処理を示すフローチャート。
符号の説明
1・・・複合機、4・・・操作パネル、5・・・LCD、11・・・CPU、12・・・ROM、12a・・・ハンドセット音響パラメータテーブル、13・・・EEPROM、14・・・RAM、14a・・・ハンドセット音響パラメータ、14b・・・ピーク音声レベル、15・・・画像メモリ、19・・・回線I/F部、20・・・モデム、21・・・バッファ、22・・・スキャナ、23・・・符号化部、24・・・復号化部、25・・・プリンタ、27・・・アンプ、28・・・スピーカ、30・・・バスライン、47・・・ハンドセット、48・・・フックスイッチ。

Claims (7)

  1. 通信先機器から送信されてくる音声信号の音量レベルを測定する測定手段と、
    前記測定手段によって測定された前記音量レベルのピーク値に基づいて、前記通信先機器との間で伝送される音声信号に対し、前記ピーク値に応じて決まる信号処理を施す信号処理手段と
    を備えたことを特徴とする音声処理装置。
  2. 前記信号処理手段は、前記ピーク値に応じて決まる信号処理として、音量レベルを前記ピーク値に応じて決まるレベルに変更する処理、および、エコーキャンセルのレベルを前記ピーク値に応じて決まるレベルに変更する処理のうち、少なくとも1つの処理を、前記通信先機器との間で伝送される音声信号に対して施す
    ことを特徴とする請求項1に記載の音声処理装置。
  3. 前記ピーク値を記憶可能なピーク値記憶手段と、
    前記ピーク値記憶手段に記憶された前記ピーク値と、前記測定手段によって測定された前記ピーク値とに基づいて、前記ピーク値記憶手段に記憶された前記ピーク値の更新を行うか否かを判定する判定手段と、
    前記判定手段によって前記ピーク値の更新を行うと判定された場合に、前記ピーク値記憶手段に記憶された前記ピーク値を、前記測定手段によって測定された前記ピーク値で更新する更新手段とを備え、
    前記信号処理手段は、前記ピーク値記憶手段に記憶された前記ピーク値に基づいて、前記通信先機器との間で伝送される音声信号に対して前記信号処理を施す
    ことを特徴とする請求項1または請求項2に記載の音声処理装置。
  4. 前記判定手段は、前記ピーク値記憶手段に記憶された前記ピーク値と、前記測定手段によって測定された前記音量レベルのピーク値に、あらかじめ定められた大きさ以上の差がある場合に、前記ピーク値記憶手段に記憶された前記ピーク値の更新を行うと判定する
    ことを特徴とする請求項3に記載の音声処理装置。
  5. 前記判定手段は、前記測定手段によって測定された前記音量レベルのピーク値が、あらかじめ定められた下限値より大きい場合に、前記ピーク値記憶手段に記憶された前記ピーク値の更新を行うと判定する
    ことを特徴とする請求項3または請求項4に記載の音声処理装置。
  6. 請求項1〜請求項5のいずれかに記載の音声処理装置を備えた通話装置。
  7. コンピュータを、請求項1〜請求項5のいずれかに記載の音声処理装置が備える各手段として機能させるためのプログラム。
JP2005148631A 2005-05-20 2005-05-20 音声処理装置、通話装置、およびプログラム Expired - Fee Related JP4604836B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005148631A JP4604836B2 (ja) 2005-05-20 2005-05-20 音声処理装置、通話装置、およびプログラム
US11/436,645 US20060274731A1 (en) 2005-05-20 2006-05-19 Voice processing device, communication apparatus and program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005148631A JP4604836B2 (ja) 2005-05-20 2005-05-20 音声処理装置、通話装置、およびプログラム

Publications (2)

Publication Number Publication Date
JP2006323308A true JP2006323308A (ja) 2006-11-30
JP4604836B2 JP4604836B2 (ja) 2011-01-05

Family

ID=37543012

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005148631A Expired - Fee Related JP4604836B2 (ja) 2005-05-20 2005-05-20 音声処理装置、通話装置、およびプログラム

Country Status (1)

Country Link
JP (1) JP4604836B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012199705A (ja) * 2011-03-18 2012-10-18 Fujitsu Ltd 通信装置および受話音量設定プログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11150491A (ja) * 1997-11-19 1999-06-02 Fujitsu Ltd 回線レベル制御装置及びこれを有するエコーキャンセル装置
JP2000022471A (ja) * 1998-06-30 2000-01-21 Matsushita Electric Ind Co Ltd 適応音質音量制御装置
JP2000332557A (ja) * 1999-05-17 2000-11-30 Sony Corp ゲインコントロール回路及びそのホールド時間決定方法
JP2002369281A (ja) * 2001-06-07 2002-12-20 Matsushita Electric Ind Co Ltd 音質音量制御装置
JP2003051879A (ja) * 2001-08-08 2003-02-21 Fujitsu Ltd 通話装置
JP2004014083A (ja) * 2002-06-11 2004-01-15 Yamaha Corp ディジタル楽音データ再生装置における楽音特性調整装置および調整方法
JP2004129187A (ja) * 2002-07-29 2004-04-22 Matsushita Electric Works Ltd 自動利得制御装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11150491A (ja) * 1997-11-19 1999-06-02 Fujitsu Ltd 回線レベル制御装置及びこれを有するエコーキャンセル装置
JP2000022471A (ja) * 1998-06-30 2000-01-21 Matsushita Electric Ind Co Ltd 適応音質音量制御装置
JP2000332557A (ja) * 1999-05-17 2000-11-30 Sony Corp ゲインコントロール回路及びそのホールド時間決定方法
JP2002369281A (ja) * 2001-06-07 2002-12-20 Matsushita Electric Ind Co Ltd 音質音量制御装置
JP2003051879A (ja) * 2001-08-08 2003-02-21 Fujitsu Ltd 通話装置
JP2004014083A (ja) * 2002-06-11 2004-01-15 Yamaha Corp ディジタル楽音データ再生装置における楽音特性調整装置および調整方法
JP2004129187A (ja) * 2002-07-29 2004-04-22 Matsushita Electric Works Ltd 自動利得制御装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012199705A (ja) * 2011-03-18 2012-10-18 Fujitsu Ltd 通信装置および受話音量設定プログラム

Also Published As

Publication number Publication date
JP4604836B2 (ja) 2011-01-05

Similar Documents

Publication Publication Date Title
US20060274731A1 (en) Voice processing device, communication apparatus and program product
JP4604836B2 (ja) 音声処理装置、通話装置、およびプログラム
US7778401B2 (en) Communication apparatus
JP2000151906A (ja) ファクシミリ装置
JP3965543B2 (ja) 通信装置
JP5288500B2 (ja) ハンズフリー電話装置、ハンズフリー通話方法及びハンズフリー通話プログラム
JP4853488B2 (ja) 通信装置
JP3734003B2 (ja) 通信装置
JP6323977B2 (ja) 通信装置及び該装置の制御方法
JP4025940B2 (ja) 通信装置
JP4512066B2 (ja) 電話機
JP2012151712A (ja) 通信装置
JP4572122B2 (ja) ボタン電話装置及びそのゲイン制御方法
KR100678052B1 (ko) 휴대용 단말기의 에코 제어장치 및 방법
JP6855954B2 (ja) ハウリング防止装置および電話装置
JP3796825B2 (ja) ファクシミリ装置
JP2006304023A (ja) 通話装置及び通話方法
JP3692775B2 (ja) 電話装置
KR100837595B1 (ko) 통신단말기의 통화기록 저장방법 및 장치
JP2001268213A (ja) 音声通信装置
JP3996611B2 (ja) コンピュータ端末対応音声通話システム
JP4147357B2 (ja) 通信装置
US20040037416A1 (en) Communication apparatus having one-way speakerphone function and a method of controlling the same
KR20060105968A (ko) 전화기를 포함하는 화상형성장치 및 그의 동작제어방법
JP2000134290A (ja) 通信装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090623

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100511

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100706

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100907

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100920

R150 Certificate of patent or registration of utility model

Ref document number: 4604836

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131015

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees