JP4527654B2 - 音声通信装置 - Google Patents

音声通信装置 Download PDF

Info

Publication number
JP4527654B2
JP4527654B2 JP2005338767A JP2005338767A JP4527654B2 JP 4527654 B2 JP4527654 B2 JP 4527654B2 JP 2005338767 A JP2005338767 A JP 2005338767A JP 2005338767 A JP2005338767 A JP 2005338767A JP 4527654 B2 JP4527654 B2 JP 4527654B2
Authority
JP
Japan
Prior art keywords
noise
voice
sound
data
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005338767A
Other languages
English (en)
Other versions
JP2007147736A (ja
Inventor
和男 遠藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC AccessTechnica Ltd
Original Assignee
NEC AccessTechnica Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC AccessTechnica Ltd filed Critical NEC AccessTechnica Ltd
Priority to JP2005338767A priority Critical patent/JP4527654B2/ja
Publication of JP2007147736A publication Critical patent/JP2007147736A/ja
Application granted granted Critical
Publication of JP4527654B2 publication Critical patent/JP4527654B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、マイクから音声を入力して、その音声を出力装置に出力する音声通信装置に関する。
音声通信装置が音声通信システムのために利用されている。音声通信システムは、例えば、使用者に対する受け付け(無人受付)や監視に利用され、マイクと、出力装置と、音声通信装置とを具備している。音声通信装置は、マイクと出力装置に接続され、マイクから音声を入力して、その音声を出力装置に出力する。出力装置がスピーカである場合、音声通信装置には、スピーカに出力される音声の音量を調整するための音量調節部が設けられている。音量調節部は、ハードウェア又はソフトウェアにより実現される。音声通信装置は、マイクから第1使用者の音声を入力し、その音声を増幅してスピーカに出力する。第2使用者は、スピーカに出力された音声を聞くことができる。第2使用者は、スピーカに出力された音声の音量を、音量調節部により調整し、第2使用者が聞きやすい音量に換える。
しかしながら、音量調節部は一律的に音量を調整するため、使用者が音量調節部により音量を調整しても聞き取りにくい場合がある。マイクから入力される音声は、所望の音声と、所望の音声以外の不要な音声とを含んでいる。この場合、所望の音声は、第1使用者の音声を表していて、不要な音声は、周辺ノイズやパルスノイズを含む音声を表している。周辺ノイズは、マイクの周辺に連続的に発生する音を表し、例えば、マイクの周辺で道路を走る車の音や、マイクの周辺における人の会話などが挙げられる。パルスノイズは、マイクの周辺に瞬時に発生する音を表し、例えば、マイクのハウリング音や、ベルの音などが挙げられる。
人の声には個人差があり、第1使用者の音声が小さい場合、第2使用者は、第1使用者の音声が聞き取りにくい。例えば、第2使用者は、スピーカに出力された音声が小さいので、第1使用者の音声を聞きやすい音量まで音量調節部により上げた場合、第1使用者の音声と共に不要な音声も大きくなるため、不要な音声に邪魔されてしまい、第1使用者の音声が聞き取りにくくなってしまう。一方、第2使用者は、スピーカに出力された音声が大きいので、不要な音声をうるさいと思わない音量まで音量調節部により下げた場合、不要な音声と共に第1使用者の音声も小さくなるため、音量が足りずに第1使用者の音声が聞き取りにくくなってしまう。不要な音声を低減することができる音声通信装置が望まれる。
音声に関連する技術として、特開2003−234707号公報に雑音除去装置が開示されている(特許文献1参照)。この雑音除去装置は、入力信号レベルに対応して、雑音除去特性の異なるフィルタを選択するものであり、入力信号を平滑化する平滑化手段をもち、該平滑化手段で平滑化された信号レベルに応じて、対応するフィルタを選択することを特徴としている。また、平滑化手段は、雑音除去対象の信号と、雑音除去対象の信号よりも時間的に過去の信号と、雑音除去対象の信号よりも未来の信号を平均する手段を用いることを特徴としている。これにより、雑音除去装置によれば、頻繁なフィルタ切替えを提言し、閾値に対応した雑音除去フィルタを選択できる雑音除去回路を実現することができる。
特開2003−255971号公報に音声抽出装置が開示されている(特許文献2参照)。この音声抽出装置は、騒音下で利用される。音声抽出装置は、音声検出手段と、フィルタ手段と、閾値決定手段と、音声区間算出手段と、音声抽出手段とを備えたことを特徴としている。前記音声検出手段は、背景ノイズを含む音声を検出する。前記フィルタ手段は、前記音声検出手段の検出音にバンドレベル分析に基づいたフィルタ特性を作用させる。前記閾値決定手段は、前記フィルタ手段の出力に基づいて閾値を決定する。前記音声区間算出手段は、前記閾値決定手段による閾値以上のレベルの区間を音声区間とする。前記音声抽出手段は、該音声区間から音声を抽出する。前記バンドレベル分析は、オクターブバンドレベル分析であることを特徴としている。前記フィルタの作用は、前記バンドレベル分析による所定帯域に所定の重みを付加して加算する重み付け加算であることを特徴としている。これにより、音声抽出装置によれば、騒音環境から音声を抽出することができる。
特開平7−336290号公報にVOX(Voice Operated Transmitter)制御通信装置が開示されている(特許文献3参照)。このVOX制御通信装置は、アナログ入力音声を符号化する際に現在フレームが有音か無音かを判定し、有音時のみ送信を行うものである。VOX制御通信装置は、変化量算出手段と、予測利得算出手段と、平均算出手段と、第1しきい値算出手段と、第2しきい値算出手段と、第3しきい値算出手段と、第4しきい値算出手段と、第5しきい値算出手段と、第1判定手段と、第2判定手段と、第3判定手段と、更新手段と、を有することを特徴としている。前記変化量算出手段は、無音区間の平均パワーに対する現在フレームの平均パワーの変化量を算出する。前記予測利得算出手段は、少なくとも1次と2次の反射係数に基づき予測利得を算出する。前記平均算出手段は、無音区間の平均予測利得を算出する。前記第1しきい値算出手段は、前記無音区間の平均パワーに基づき第1しきい値を算出する。前記第2しきい値算出手段は、前記現在フレームの予測利得に基づき第2しきい値を算出する。前記第3しきい値算出手段は、前記平均予測利得及び現在フレームの予測利得に基づき第3しきい値を算出する。前記第4しきい値算出手段は、前記第1しきい値及び第2しきい値の重み付け平均により第4しきい値を算出する。前記第5しきい値算出手段は、前記第1しきい値及び第3しきい値の重み付け平均により第5しきい値を算出する。前記第1判定手段は、前記変化量と前記第4しきい値の大小比較により現在フレームが有音か無音かを仮判定する。前記第2判定手段は、前記変化量と前記第5しきい値の大小比較により現在フレームが有音か無音かを仮判定する。前記第3判定手段は、前記第1判定手段と第2判定手段のいずれか一方で有音と仮判定された場合には現在フレームは有音と判定し、前記第1判定手段及び第2判定手段でいずれも無音と仮判定された場合には現在フレームは無音と判定する。前記更新手段は、前記第3判定手段により現在フレームが無音と判定された場合に、前記無音区間の平均パワーと無音と判定された現在フレームの平均パワーの重み付け平均で無音区間の平均パワーを更新するとともに、前記無音区間の平均予測利得と無音と判定された現在フレームの予測利得の重み付け平均で無音区間の平均予測利得を更新する。これにより、VOX制御通信装置によれば、話頭切れを無くし高品質を得ることができる。
特開2003−78627号公報にデジタル構内交換機が開示されている(特許文献4参照)。このデジタル構内交換機は、多者会議通話機能を有している。デジタル構内交換機は、PCM/リニア変換手段と、ノイズ除去手段と、会議通話演算手段と、リニア/PCM変換手段とを有している。前記PCM/リニア変換手段は、PCM信号をリニア信号に変換する。前記ノイズ除去手段は、入力されたリニア信号と閾値レベルを比較し、リニア信号が前記閾値レベルより小さくなるとそのリニア信号について除算処理を行って出力する。前記会議通話演算手段は、会議通話演算を行なう。前記リニア/PCM変換手段は、会議通話演算後のリニア信号をPCM信号に変換する。これにより、デジタル構内交換機によれば、任意な閾値レベルを設定し、会議参加者の音声信号がそのレベルより小さい場合、音声信号にゲイン演算を施すことにより、音声信号に付加される背景雑音の影響を小さくし、聴感上の違和感が生じない会議通話を実現できる。
特開2003−234707号公報(請求項1、2) 特開2003−255971号公報(請求項6〜8) 特開平7−336290号公報(請求項1) 特開2003−78627号公報(請求項1)
本発明の課題は、不要な音声を低減することができる音声通信装置を提供することにある。
以下に、[発明を実施するための最良の形態]で使用する番号・符号を用いて、課題を解決するための手段を説明する。これらの番号・符号は、[特許請求の範囲]の記載と[発明を実施するための最良の形態]の記載との対応関係を明らかにするために付加されたものであるが、[特許請求の範囲]に記載されている発明の技術的範囲の解釈に用いてはならない。
本発明の第1の観点では、音声通信装置(1)は、入力部(10)、ノイズ除去部(20)を具備している。
前記入力部(10)は、マイク(2)から音声を入力する。
前記ノイズ除去部(20)は、前記マイク(2)の周辺に連続的に発生する音を表す周辺ノイズと、前記マイク(2)の周辺に瞬時に発生する音を表すパルスノイズとを前記音声から除去して出力する。
上記第1の観点について説明する。
マイク(2)から入力される音声は、所望の音声と、所望の音声以外の不要な音声とを含んでいる。この場合、所望の音声は、第1使用者の音声を表していて、不要な音声は、周辺ノイズやパルスノイズを含む音声を表している。周辺ノイズは、マイク(2)の周辺に連続的に発生する音を表し、例えば、マイク2の周辺で道路を走る車の音や、マイク2の周辺における人の会話などが挙げられる。パルスノイズは、マイク(2)の周辺に瞬時に発生する音を表し、例えば、マイク2のハウリング音や、ベルの音などが挙げられる。
例えば、出力部(30)は、上記の音声を所定の増幅率により増幅して出力音声としてスピーカ(3)に出力する。この場合、出力部(30)が一定倍率で増幅を行なっても、所望の音声の他に不要な音声まで増幅されてしまい、スピーカ(3)に出力される音声が不明瞭になってしまう可能性がある。
そこで、ノイズ除去部(20)は、周辺ノイズとパルスノイズとを音声から除去して、出力音声として出力部(30)に出力する。出力部(30)は、その出力音声を所定の増幅率により増幅してスピーカ(3)に出力する。第2使用者は、スピーカ3に出力された出力音声から所望の音声を明瞭に聞くことができる。
このように、本発明の音声通信装置(1)によれば、周辺ノイズとパルスノイズとを音声から除去することにより、不要な音声を低減することができる。
本発明の第2の観点では、前記入力部(10)は、前記マイク(2)から入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す音声データを出力する。
前記ノイズ除去部(20)は、前記音声データから、前記周辺ノイズを除去するための閾値である周辺ノイズ閾値データと、前記パルスノイズを除去するための閾値であるパルスノイズ閾値データとを減算する。
上記第2の観点について説明する。上記第1の観点と重複する説明を省略する。
本発明の音声通信装置(1)によれば、ノイズ除去部(20)は、音声データから周辺ノイズ閾値データを減算することにより、マイク(2)から入力される音声から周辺ノイズを除去することができ、音声データからパルスノイズ閾値データを減算することにより、マイク(2)から入力される音声からパルスノイズを除去することができる。
本発明の第3の観点では、前記入力部(10)は、サンプリング部(11)を具備している。
前記サンプリング部(11)は、前記マイク(2)から入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す前記音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力する。
前記ノイズ除去部(20)は、周辺ノイズ除去部(21)と、重み付けデータ出力部(22)と、閾値データ生成部(23)と、パルスノイズ除去部(24)とを具備している。
前記周辺ノイズ除去部(21)は、前記周辺ノイズ閾値データである周辺ノイズ閾値データLを予め保持し、数1により、周辺ノイズ除去音声データ列{DL(i)}(ただし、DL(i)<0のときはDL(i)=0)を生成する。
前記重み付けデータ出力部(22)は、重み付けデータ列{Po(i)|Po(i)=Po(1)、Po(2)、Po(3)、…、Po(n)}を出力する。ここで、前記重み付けデータ列{Po(i)}が示すn個の重み付けデータは、0<Po(i)<1により表され、n番目から1番目までこの順で小さくなる係数である。
前記閾値データ生成部(23)は、数2により、前記パルスノイズ閾値データであるパルスノイズ閾値データPを生成する。
前記パルスノイズ除去部(24)は、数3により、パルスノイズ除去音声データ列{DP(i)}(ただし、DP(i)<0のときはDP(i)=0)を生成し、出力音声として出力する。
Figure 0004527654
Figure 0004527654
Figure 0004527654
上記第3の観点について説明する。上記第1、第2の観点と重複する説明を省略する。
周辺ノイズは、マイク(2)の周辺に連続的に発生していても、マイク(2)からある程度離れているところで発生する音であるため、音声の音量のレベルとしては小さい。このため、周辺ノイズを除去するための閾値として周辺ノイズ閾値データLを決定しておき、周辺ノイズ除去部(21)に設定しておくことができる。例えば、周辺ノイズとして、マイク(2)の周辺で道路を走る車の音や、マイク2の周辺における人の会話などを収集しておき、それを周辺ノイズ閾値データLとして周辺ノイズ除去部(21)に設定しておく。これにより、周辺ノイズ除去部(21)が、音声データ列{D(i)}から、周辺ノイズ閾値データLを減算することにより、マイク(2)から入力される音声から周辺ノイズを除去することができる。
しかしながら、パルスノイズは、マイク(2)のハウリング音や、ベルの音など、マイク(2)の周辺に突発的に発生するため、パルスノイズを除去するための閾値を任意に決定することが困難である。そこで、重み付けデータ出力部(22)と閾値データ生成部(23)により、音声データと重み付けとを用いて、パルスノイズを除去するための閾値としてパルスノイズ閾値データPを生成する。
例えば、nが5であり、重み付けデータ列{Po(i)}は、最新のデータから順に、重み付けデータPo(5)、Po(4)、Po(3)、Po(2)、Po(1)のそれぞれに対して、0.5、0.25、0.125、0.0625、0.03125が重み付けデータ出力部(22)により割り当てられている。また、周辺ノイズ除去音声データ列{DL(i)}が示す音量は、最新のデータから順に、周辺ノイズ除去音声データDL(5)、DL(4)、DL(3)、DL(2)、DL(1)のそれぞれに対して、100、50、100、30、50であるものとする。この場合、閾値データ生成部(23)により、パルスノイズ閾値データPは、100×0.5+50×0.25+100×0.125+30×0.0625+50×0.03125=78.4375となる。これにより、パルスノイズ除去部(24)は、上記の周辺ノイズ除去音声データ列{DL(i)}が示す100、50、100、30、50から、パルスノイズ閾値データPが示す78.4375を減算することにより(DP(i)<0のときはDP(i)=0)、マイク(2)から入力される音声からパルスノイズを除去することができる。即ち、本発明の音声通信装置(1)によれば、マイク(2)から入力される音声から、周辺ノイズとパルスノイズとが除去された音声である所望の音声を取り出すことができる。
本発明の第4の観点では、前記入力部(10)は、サンプリング部(11)を具備している。
前記サンプリング部(11)は、前記マイク(2)から入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す前記音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力する。
前記ノイズ除去部(20)は、重み付けデータ出力部(22)と、閾値データ生成部(23)と、パルスノイズ除去部(24)と、周辺ノイズ除去部(21)とを具備している。
前記重み付けデータ出力部(22)は、重み付けデータ列{Po(i)|Po(i)=Po(1)、Po(2)、Po(3)、…、Po(n)}を出力する。ここで、前記重み付けデータ列{Po(i)}が示すn個の重み付けデータは、0<Po(i)<1により表され、n番目から1番目までこの順で小さくなる係数である。
前記閾値データ生成部(23)は、数4により、前記パルスノイズ閾値データであるパルスノイズ閾値データPを生成する。
前記パルスノイズ除去部(24)は、数5により、パルスノイズ除去音声データ列{DP(i)}(ただし、DP(i)<0のときはDP(i)=0)を生成する。
前記周辺ノイズ除去部(21)は、前記周辺ノイズ閾値データである周辺ノイズ閾値データLを予め保持している。前記周辺ノイズ除去部(21)は、数6により、周辺ノイズ除去音声データ列{DL(i)}(ただし、DL(i)<0のときはDL(i)=0)を生成し、出力音声として出力する。
Figure 0004527654
Figure 0004527654
Figure 0004527654
上記第4の観点について説明する。上記第1〜第3の観点と重複する説明を省略する。
上記第3の観点では、ノイズ除去部(20)は、周辺ノイズ除去部(21)により周辺ノイズを音声から除去した後に、重み付けデータ出力部(22)、閾値データ生成部(23)、パルスノイズ除去部(24)によりパルスノイズを音声から除去している。これに対して、上記第4の観点として、重み付けデータ出力部(22)、閾値データ生成部(23)、パルスノイズ除去部(24)によりパルスノイズを音声から除去した後に、周辺ノイズ除去部(21)により周辺ノイズを音声から除去してもよい。
本発明の第5の観点では、前記入力部(10)は、サンプリング部(11)を具備している。
前記サンプリング部(11)は、前記マイク(2)から入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す前記音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力する。
前記ノイズ除去部(20)は、周辺ノイズ除去部(21)と、選択部(25)と、閾値データ生成部(23)と、パルスノイズ除去部(24)とを具備している。
前記周辺ノイズ除去部(21)は、前記周辺ノイズ閾値データである周辺ノイズ閾値データLを予め保持している。前記周辺ノイズ除去部(21)は、数7により、周辺ノイズ除去音声データ列{DL(i)}(ただし、DL(i)<0のときはDL(i)=0)を生成する。
前記選択部(25)は、前記周辺ノイズ除去音声データ列{DL(i)}が示すn個の周辺ノイズ除去音声データのうちの、m個の周辺ノイズ除去音声データを選択する。ここで、前記m個の周辺ノイズ除去音声データは0<m<nを満たす整数である。前記m個の周辺ノイズ除去音声データのうちの1つは、前記n個の周辺ノイズ除去音声データのうちのn番目の周辺ノイズ除去音声データDL(n)を含んでいる。
前記閾値データ生成部(23)は、前記m個の周辺ノイズ除去音声データの和をmで除算して、前記パルスノイズ閾値データであるパルスノイズ閾値データPを生成する。
前記パルスノイズ除去部(24)は、数8により、パルスノイズ除去音声データ列{DP(i)}(ただし、DP(i)<0のときはDP(i)=0)を生成し、出力音声として出力する。
Figure 0004527654
Figure 0004527654
上記第5の観点について説明する。上記第1〜第4の観点と重複する説明を省略する。
例えば、上記のように、nが5であり、周辺ノイズ除去音声データ列{DL(i)}が示す音量は、最新のデータから順に、周辺ノイズ除去音声データDL(5)、DL(4)、DL(3)、DL(2)、DL(1)のそれぞれに対して、100、50、100、30、50であるものとする。mが3であり、上記設定時間を越える周辺ノイズ除去音声データが3番目の周辺ノイズ除去音声データである場合、選択部(25)により、2番目、4番目、n番目(5番目)の周辺ノイズ除去音声データが示す音量を利用する。閾値データ生成部(23)により、パルスノイズ閾値データPは、100/3+50/3+30/3=60となる。これにより、パルスノイズ除去部(24)は、上記の周辺ノイズ除去音声データ列{DL(i)}が示す100、50、100、30、50から、パルスノイズ閾値データPが示す60を減算することにより(DP(i)<0のときはDP(i)=0)、マイク(2)から入力される音声からパルスノイズを除去することができる。即ち、本発明の音声通信装置(1)によれば、マイク(2)から入力される音声から、周辺ノイズとパルスノイズとが除去された音声である所望の音声を取り出すことができる。
本発明の第6の観点では、前記入力部(10)は、サンプリング部(11)を具備している。
前記サンプリング部(11)は、前記マイク(2)から入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す前記音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力する。
前記ノイズ除去部(20)は、選択部(25)と、閾値データ生成部(23)と、パルスノイズ除去部(24)と、周辺ノイズ除去部(21)とを具備している。
前記選択部(25)は、前記音声データ列{D(i)}が示すn個の音声データのうちの、m個の音声データを選択する。ここで、前記m個の音声データは0<m<nを満たす整数である。前記m個の音声データのうちの1つは、前記n個の音声データのうちのn番目の音声データD(n)を含んでいる。
前記閾値データ生成部(23)は、前記m個の音声データの和をmで除算して、前記パルスノイズ閾値データであるパルスノイズ閾値データPを生成する。
前記パルスノイズ除去部(24)は、数9により、パルスノイズ除去音声データ列{DP(i)}(ただし、DP(i)<0のときはDP(i)=0)を生成する。
前記周辺ノイズ除去部(21)は、前記周辺ノイズ閾値データである周辺ノイズ閾値データLを予め保持している。前記周辺ノイズ除去部(21)は、数10により、周辺ノイズ除去音声データ列{DL(i)}(ただし、DL(i)<0のときはDL(i)=0)を生成し、出力音声として出力する。
Figure 0004527654
Figure 0004527654
上記第6の観点について説明する。上記第1〜第5の観点と重複する説明を省略する。
上記第5の観点では、ノイズ除去部(20)は、周辺ノイズ除去部(21)により周辺ノイズを音声から除去した後に、選択部(25)、閾値データ生成部(23)、パルスノイズ除去部(24)によりパルスノイズを音声から除去している。これに対して、上記第6の観点として、選択部(25)、閾値データ生成部(23)、パルスノイズ除去部(24)によりパルスノイズを音声から除去した後に、周辺ノイズ除去部(21)により周辺ノイズを音声から除去してもよい。
本発明の第7の観点では、音声通信装置(1)は、更に、出力部(30)を具備している。
前記出力部(30)は、音量比較部(31)と、音量調整部(32)と、音量増幅部(33)とを具備している。
前記音量比較部(31)は、前記出力音声の音量と、前記出力音声の大きさを判断するための設定音量とを比較する。
前記音量調整部(32)は、前記出力音声の音量と前記設定音量との比較結果に基づいて前記出力音声の音量を調整する。
前記音量増幅部(33)は、前記出力音声の音量を所定の増幅率により増幅して出力する。
そこで、前記出力音声の音量が前記設定音量よりも大きい場合、前記音量調整部(32)は、前記出力音声の音量から、前記出力音声の音量と前記設定音量との差分を減算する。
前記出力音声の音量が前記設定音量よりも小さい場合、前記音量調整部(32)は、前記出力音声の音量に、前記出力音声の音量と前記設定音量との差分を加算する。
上記第7の観点について説明する。上記第1〜第6の観点と重複する説明を省略する。
本発明の音声通信装置(1)によれば、出力部(30)は、出力音声の音量を決められた音量に自動的に変更する。これにより、第1使用者がマイク(2)を用いるときの第1使用者とマイク(2)との距離にかかわらず、一定の音量で出力音声を再生することができる。
本発明の第8の観点では、音声通信装置(1)は、更に、音声認識部(40)と、ソフトウェア(41)と、動作パターンテーブル(42)とを具備している。
前記動作パターンテーブル(42)には、複数の設定出力音声と、前記ソフトウェア(41)が実行可能な複数の動作とが対応付けられて格納されている。
前記音声認識部(40)は、前記動作パターンテーブル(42)を参照して、前記複数の動作のうちの、前記出力音声に一致する設定出力音声に応じた動作が実行されるように、前記ソフトウェア(41)の制御を行う。
上記第8の観点について説明する。上記第1〜第7の観点と重複する説明を省略する。
本発明の音声通信装置(1)によれば、周辺ノイズとパルスノイズとを音声から除去することにより、ソフトウェア(41)が誤動作することなく、音声認識を行なうことができる。
例えば、音声通信装置1にロボットが設けられ、上記のソフトウェア(41)が実行可能な動作として、そのロボットの腕を振る、頭を振るといった動作のパターンを制御したり、「いらっしゃいませ」といったような言葉を発声するパターンを制御したりすることも可能である。こういった行動をするような手段を設けることで、マイク(2)への話しかけにより、喜怒哀楽を表現させたり、答えを返したりするといったことも可能となる。
また、音声通信装置(1)から、出力装置(4)として他の通信装置に音声を通知し、その音声を聞いたオペレータから音声通信装置(1)の音声認識部(40)に指示を出すことで、音声認識部(40)を用いて多彩な行動を取らせることも可能となる。
本発明の第9の観点では、音声通信装置(1)は、音声通信を行うコンピュータである。上記の入力部(10)、ノイズ除去部(20)、出力部(30)、音声認識部(40)は、そのコンピュータに実行させるコンピュータプログラム(7)である。
以上により、本発明の音声通信装置によれば、周辺ノイズとパルスノイズとを音声から除去することにより、不要な音声を低減することができる。
本発明の音声通信装置によれば、使用者がマイクを用いるときの使用者とマイクとの距離にかかわらず、一定の音量で出力音声を再生することができる。
本発明の音声通信装置によれば、周辺ノイズとパルスノイズとを音声から除去することにより、ソフトウェアが誤動作することなく、音声認識を行なうことができる。
以下に添付図面を参照して、本発明の音声通信装置について詳細に説明する。
(第1実施形態)
図1は、本発明の第1実施形態による音声通信装置1が適用される音声通信システムの構成を示している。音声通信システムは、例えば、使用者に対する受け付け(無人受付)や監視に利用され、マイク2と、出力装置3と、音声通信装置1とを具備している。音声通信装置1は、マイク2と出力装置3に接続され、マイク2から音声を入力して、その音声を出力装置3に出力する。
音声通信装置1は、コンピュータであり、CPU(Central Processing Unit)5、記憶装置6を具備している。記憶装置6には、CPU5が実行するためのコンピュータプログラム7が格納されている。コンピュータプログラム7は、入力部10と、ノイズ除去部20と、出力部30とを含んでいる。出力装置3がスピーカである場合、例えば、音声通信装置1には、スピーカ3に出力される音声の音量を調整するための音量調節部4が設けられている。音量調節部4は、ハードウェア又はソフトウェアにより実現される。
入力部10は、マイク2から第1使用者の音声を入力する。マイク2から入力される音声は、所望の音声と、所望の音声以外の不要な音声とを含んでいる。この場合、所望の音声は、第1使用者の音声を表していて、不要な音声は、周辺ノイズやパルスノイズを含む音声を表している。周辺ノイズは、マイク2の周辺に連続的に発生する音を表し、例えば、マイク2の周辺で道路を走る車の音や、マイク2の周辺における人の会話などが挙げられる。パルスノイズは、マイク2の周辺に瞬時に発生する音を表し、例えば、マイク2のハウリング音や、ベルの音などが挙げられる。
出力部30は、上記の音声を所定の増幅率により増幅して出力音声としてスピーカ3に出力する。この場合、出力部30が一定倍率で増幅を行なっても、所望の音声の他に不要な音声まで増幅されてしまい、スピーカ3に出力される音声が不明瞭になってしまう可能性がある。
そこで、ノイズ除去部20は、周辺ノイズとパルスノイズとを音声から除去して、出力音声として出力部30に出力する。出力部30は、その出力音声を所定の増幅率により増幅してスピーカ3に出力する。第2使用者は、スピーカ3に出力された出力音声から所望の音声を明瞭に聞くことができる。
周辺ノイズとパルスノイズとを音声から除去することについて詳細に説明する。図2は、音声通信装置1の機能ロジックを示している。図3は、音声通信装置1の動作を示すフローチャートである。
入力部10は、サンプリング部11、クロック発生部12を具備し、音声入力処理を実行する(ステップS1)。
クロック発生部12は、クロック信号CLKを生成し、所定の周期によりサンプリング部11、ノイズ除去部20に出力する。
サンプリング部11は、マイク2から入力される音声をクロック信号CLKに応じて所定の周期でサンプリングする。このとき、図4に示されるように、サンプリング部11は、サンプリング時の音声を示す音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力する。
ノイズ除去部20は、周辺ノイズ除去部21、重み付けデータ出力部22、閾値データ生成部23、パルスノイズ除去部24を具備し、ノイズ除去処理を実行する(ステップS2)。
周辺ノイズ除去部21は、周辺ノイズを除去するための閾値である周辺ノイズ閾値データLを予め保持している。図4に示されるように、周辺ノイズ除去部21は、音声データ列{D(i)}から、周辺ノイズ閾値データLを減算する。即ち、周辺ノイズ除去部21は、数11により、周辺ノイズ除去音声データ列{DL(i)}を生成する。ただし、DL(i)<0のときはDL(i)=0である。
Figure 0004527654
このように、本発明の音声通信装置1によれば、ノイズ除去部20は、周辺ノイズを音声から除去することができる。
周辺ノイズは、マイク2の周辺に連続的に発生していても、マイク2からある程度離れているところで発生する音であるため、音声の音量のレベルとしては小さい。このため、周辺ノイズを除去するための閾値として周辺ノイズ閾値データLを決定しておき、周辺ノイズ除去部21に設定しておくことができる。例えば、周辺ノイズとして、マイク2の周辺で道路を走る車の音や、マイク2の周辺における人の会話などを収集しておき、それを周辺ノイズ閾値データLとして周辺ノイズ除去部21に設定しておく。これにより、周辺ノイズ除去部21が、音声データ列{D(i)}から、周辺ノイズ閾値データLを減算することにより、マイク2から入力される音声から周辺ノイズを除去することができる。
しかしながら、パルスノイズは、マイク2のハウリング音や、ベルの音など、マイク2の周辺に突発的に発生するため、パルスノイズを除去するための閾値を任意に決定することが困難である。そこで、重み付けデータ出力部22と閾値データ生成部23により、音声データと重み付けとを用いて、パルスノイズを除去するための閾値としてパルスノイズ閾値データPを生成する。
図4に示されるように、重み付けデータ出力部22は、クロック信号CLKに応じて、重み付けデータ列{Po(i)|Po(i)=Po(1)、Po(2)、Po(3)、…、Po(n)}を出力する。重み付けデータ列{Po(i)}が示すn個の重み付けデータは、0<Po(i)<1により表され、n番目から1番目までこの順で小さくなる係数である。
図4に示されるように、閾値データ生成部23は、数12により、パルスノイズを除去するための閾値であるパルスノイズ閾値データPを生成する。
Figure 0004527654
図4に示されるように、パルスノイズ除去部24は、周辺ノイズ除去音声データ列{DL(i)}から、パルスノイズ閾値データPを減算する。即ち、パルスノイズ除去部24は、数13により、パルスノイズ除去音声データ列{DP(i)}を生成し、出力音声として出力する。ただし、DP(i)<0のときはDP(i)=0である。
Figure 0004527654
このように、本発明の音声通信装置1によれば、ノイズ除去部20は、周辺ノイズを音声から除去する上に、パルスノイズを音声から除去することができる。
例えば、nが5であり、重み付けデータ列{Po(i)}は、最新のデータから順に、重み付けデータPo(5)、Po(4)、Po(3)、Po(2)、Po(1)のそれぞれに対して、0.5、0.25、0.125、0.0625、0.03125が重み付けデータ出力部22により割り当てられている。また、周辺ノイズ除去音声データ列{DL(i)}が示す音量は、最新のデータから順に、周辺ノイズ除去音声データDL(5)、DL(4)、DL(3)、DL(2)、DL(1)のそれぞれに対して、100、50、100、30、50(dB)であるものとする。この場合、閾値データ生成部23により、パルスノイズ閾値データPは、100×0.5+50×0.25+100×0.125+30×0.0625+50×0.03125=78.4375(dB)となる。これにより、パルスノイズ除去部24は、上記の周辺ノイズ除去音声データ列{DL(i)}が示す100、50、100、30、50から、パルスノイズ閾値データPが示す78.4375を減算することにより(DP(i)<0のときはDP(i)=0)、マイク2から入力される音声からパルスノイズを除去することができる。即ち、本発明の音声通信装置1によれば、マイク2から入力される音声から、周辺ノイズとパルスノイズとが除去された音声である所望の音声を取り出すことができる。
出力部30は、音量比較部31、音量調整部32、音量増幅部33を具備し、音声出力処理を実行する(ステップS3)。
音量比較部31は、出力音声の音量と、出力音声の大きさを判断するための設定音量とを比較する。音量調整部32は、出力音声の音量と設定音量との比較結果に基づいて出力音声の音量を調整する。音量増幅部33は、出力音声の音量を増幅するための所定の増幅率であるデータを予め保持している。
例えば、出力音声の音量と設定音量とを比較した結果、出力音声の音量が設定音量よりも大きい。この場合、音量調整部32は、出力音声の音量から、出力音声の音量と設定音量との差分を減算し、音量増幅部33に出力する。音量増幅部33は、この出力音声の音量を所定の増幅率により増幅し、出力装置3に出力する。
例えば、出力音声の音量と設定音量とを比較した結果、出力音声の音量が設定音量よりも小さい。この場合、音量調整部32は、出力音声の音量に、出力音声の音量と設定音量との差分を加算し、音量増幅部33に出力する。音量増幅部33は、この出力音声の音量を所定の増幅率により増幅し、出力装置3に出力する。
このように、本発明の音声通信装置1によれば、出力部30は、出力音声の音量を決められた音量に自動的に変更する。これにより、第1使用者がマイク2を用いるときの第1使用者とマイク2との距離にかかわらず、一定の音量で出力音声を再生することができる。
この場合、第2使用者は、音量調節部4を用いなくても、スピーカ3に出力された出力音声を明瞭に聞くことができるし、音量調節部4により、好みの音量に合わせて、スピーカ3に出力された出力音声を上げたり下げたりすることもできる。
上述では、ノイズ除去部20は、周辺ノイズ除去部21により周辺ノイズを音声から除去した後に、重み付けデータ出力部22、閾値データ生成部23、パルスノイズ除去部24によりパルスノイズを音声から除去しているが、ノイズを除去する順番は上記に限定されない。図5に示されるように、第1実施形態の変形例として、重み付けデータ出力部22、閾値データ生成部23、パルスノイズ除去部24によりパルスノイズを音声から除去した後に、周辺ノイズ除去部21により周辺ノイズを音声から除去してもよい。
この場合、図6に示されるように、閾値データ生成部23は、数14により、パルスノイズを除去するための閾値であるパルスノイズ閾値データPを生成する。
Figure 0004527654
図6に示されるように、パルスノイズ除去部24は、音声データ列{D(i)}から、パルスノイズ閾値データPを減算する。即ち、パルスノイズ除去部24は、数15により、パルスノイズ除去音声データ列{DP(i)}を生成する。ただし、DP(i)<0のときはDP(i)=0である。
Figure 0004527654
図6に示されるように、周辺ノイズ除去部21は、パルスノイズ除去音声データ列{DP(i)}から、周辺ノイズ閾値データLを減算する。即ち、周辺ノイズ除去部21は、数16により、周辺ノイズ除去音声データ列{DL(i)}を生成し、出力音声として出力する。ただし、DL(i)<0のときはDL(i)=0である。
Figure 0004527654
以上の説明により、本発明の第1実施形態による音声通信装置1によれば、周辺ノイズとパルスノイズとを音声から除去することにより、不要な音声を低減することができる。
本発明の第1実施形態による音声通信装置1によれば、使用者がマイク2を用いるときの使用者とマイク2との距離にかかわらず、一定の音量で出力音声を再生することができる。
(第2実施形態)
本発明の第2実施形態による音声通信装置1について説明する。第2実施形態では、第1実施形態と異なる点のみ説明する。
周辺ノイズとパルスノイズとを音声から除去することについて詳細に説明する。図7は、音声通信装置1の機能ロジックを示している。
第2実施形態では、ノイズ除去部20は、重み付けデータ出力部22に代えて、選択部25を具備している。
図8に示されるように、周辺ノイズ除去部21は、音声データ列{D(i)}から、周辺ノイズ閾値データLを減算する。即ち、周辺ノイズ除去部21は、数17により、周辺ノイズ除去音声データ列{DL(i)}を生成する。ただし、DL(i)<0のときはDL(i)=0である。
Figure 0004527654
図8に示されるように、選択部25は、周辺ノイズ除去音声データ列{DL(i)}が示すn個の周辺ノイズ除去音声データのうちの、m個の周辺ノイズ除去音声データを選択する。ここで、m個の周辺ノイズ除去音声データは0<m<nを満たす整数である。m個の周辺ノイズ除去音声データとして、n個の周辺ノイズ除去音声データの中から、時間的に近い周辺ノイズ除去音声データ(サンプリング時における最新のものから、設定時間を越えないものまで)が多く選択され、時間的に遠い周辺ノイズ除去音声データ(サンプリング時における設定時間を越えるもの)が少なく選択される。この場合、m個の周辺ノイズ除去音声データのうちの1つは、n個の周辺ノイズ除去音声データのうちのn番目の周辺ノイズ除去音声データDL(n)を含んでいる。例えば、nが5であり、mが3であり、上記設定時間を越える周辺ノイズ除去音声データが3番目の周辺ノイズ除去音声データである場合、m個の周辺ノイズ除去音声データM1、M2、M3は、それぞれ、n個の周辺ノイズ除去音声データのうちの、2番目、4番目、n番目(5番目)の周辺ノイズ除去音声データである。
図8に示されるように、閾値データ生成部23は、m個の周辺ノイズ除去音声データの和をmで除算する。即ち、閾値データ生成部23は、P=(M1+M2+M3)/3により、パルスノイズを除去するための閾値であるパルスノイズ閾値データPを生成する。
図8に示されるように、パルスノイズ除去部24は、数18により、パルスノイズ除去音声データ列{DP(i)}を生成し、出力音声として出力する。ただし、DP(i)<0のときはDP(i)=0である。
Figure 0004527654
このように、本発明の音声通信装置1によれば、ノイズ除去部20は、周辺ノイズを音声から除去する上に、パルスノイズを音声から除去することができる。
例えば、上記のように、nが5であり、周辺ノイズ除去音声データ列{DL(i)}が示す音量は、最新のデータから順に、周辺ノイズ除去音声データDL(5)、DL(4)、DL(3)、DL(2)、DL(1)のそれぞれに対して、100、50、100、30、50(dB)であるものとする。mが3であり、上記設定時間を越える周辺ノイズ除去音声データが3番目の周辺ノイズ除去音声データである場合、選択部25により、2番目、4番目、n番目(5番目)の周辺ノイズ除去音声データが示す音量を利用する。閾値データ生成部23により、パルスノイズ閾値データPは、100/3+50/3+30/3=60(dB)となる。これにより、パルスノイズ除去部24は、上記の周辺ノイズ除去音声データ列{DL(i)}が示す100、50、100、30、50から、パルスノイズ閾値データPが示す60を減算することにより(DP(i)<0のときはDP(i)=0)、マイク2から入力される音声からパルスノイズを除去することができる。即ち、マイク2から入力される音声から、周辺ノイズとパルスノイズとが除去された音声である所望の音声を取り出すことができる。
上述では、ノイズ除去部20は、周辺ノイズ除去部21により周辺ノイズを音声から除去した後に、選択部25、閾値データ生成部23、パルスノイズ除去部24によりパルスノイズを音声から除去しているが、ノイズを除去する順番は上記に限定されない。図9に示されるように、第2実施形態の変形例として、選択部25、閾値データ生成部23、パルスノイズ除去部24によりパルスノイズを音声から除去した後に、周辺ノイズ除去部21により周辺ノイズを音声から除去してもよい。
この場合、図10に示されるように、選択部25は、音声データ列{DL(i)}が示すn個の音声データのうちの、m個の音声データを選択する。ここで、m個の音声データは0<m<nを満たす整数である。m個の音声データとして、n個の音声データの中から、時間的に近い音声データ(サンプリング時における最新のものから、設定時間を越えないものまで)が多く選択され、時間的に遠い音声データ(サンプリング時における設定時間を越えるもの)が少なく選択される。この場合、m個の音声データのうちの1つは、n個の音声データのうちのn番目の音声データD(n)を含んでいる。例えば、nが5であり、mが3であり、上記設定時間を越える音声データが3番目の音声データである場合、m個の音声データM1、M2、M3は、それぞれ、n個の音声データのうちの、2番目、4番目、n番目(5番目)の音声データである。
図10に示されるように、閾値データ生成部23は、m個の音声データの和をmで除算する。即ち、閾値データ生成部23は、P=(M1+M2+M3)/3により、パルスノイズを除去するための閾値であるパルスノイズ閾値データPを生成する。
図10に示されるように、パルスノイズ除去部24は、音声データ列{D(i)}から、パルスノイズ閾値データPを減算する。即ち、パルスノイズ除去部24は、数19により、パルスノイズ除去音声データ列{DP(i)}を生成する。ただし、DP(i)<0のときはDP(i)=0である。
Figure 0004527654
図11に示されるように、周辺ノイズ除去部21は、パルスノイズ除去音声データ列{DP(i)}から、周辺ノイズ閾値データLを減算する。即ち、周辺ノイズ除去部21は、数20により、周辺ノイズ除去音声データ列{DL(i)}を生成し、出力音声として出力する。ただし、DL(i)<0のときはDL(i)=0である。
Figure 0004527654
(第3実施形態)
本発明の第3実施形態による音声通信装置1について説明する。第3実施形態では、第1、第2実施形態と異なる点のみ説明する。
図11は、本発明の第3実施形態による音声通信装置1が適用される音声通信システムの構成を示している。記憶装置6に格納されているコンピュータプログラム7は、更に、音声認識部40を含んでいる。この場合、入力部10は、マイク2から使用者の音声を入力する。ノイズ除去部20は、周辺ノイズとパルスノイズとを音声から除去して、音声認識部40に出力する。音声認識部40は、その音声により音声認識を行なう。
記憶装置6には、更に、ソフトウェア41と、動作パターンテーブル42とが格納されている。
図12に示されるように、動作パターンテーブル42には、複数の設定出力音声と、ソフトウェア41が実行可能な複数の動作とが対応付けられて格納されている。
図13は、音声通信装置1の動作を示すフローチャートである。
上述のステップS1〜S3が実行された後、音声認識部40は、出力音声を入力し、音声認識処理を実行する(ステップS4)。
この場合、出力音声は、ノイズ除去部20から出力された出力音声でもよいし、出力部30から出力された出力音声でもよい。音声認識部40は、動作パターンテーブル42を参照して、上記の複数の動作のうちの、出力音声に一致する設定出力音声に応じた動作が実行されるように、ソフトウェア41の制御を行う。
本発明の音声通信装置1によれば、周辺ノイズとパルスノイズとを音声から除去することにより、ソフトウェア41が誤動作することなく、音声認識を行なうことができる。
例えば、音声通信装置1にロボットが設けられ、上記のソフトウェア41が実行可能な動作として、そのロボットの腕を振る、頭を振るといった動作のパターンを制御したり、「いらっしゃいませ」といったような言葉を発声するパターンを制御したりすることも可能である。こういった行動をするような手段を設けることで、マイク2への話しかけにより、喜怒哀楽を表現させたり、答えを返したりするといったことも可能となる。
また、音声通信装置1から、出力装置4として他の通信装置に音声を通知し、その音声を聞いたオペレータから音声通信装置1の音声認識部40に指示を出すことで、音声認識部40を用いて多彩な行動を取らせることも可能となる。
以上の説明により、本発明の第3実施形態による音声通信装置1によれば、第1、第2実施形態の効果に加えて、周辺ノイズとパルスノイズとを音声から除去することにより、ソフトウェア41が誤動作することなく、音声認識を行なうことができる。
図1は、本発明の音声通信装置1が適用される音声通信システムの構成を示している。(第1、第2実施形態) 図2は、本発明の音声通信装置1の機能ロジックを示している。(第1実施形態) 図3は、本発明の音声通信装置1の動作を示すフローチャートである。(第1、第2実施形態) 図4は、本発明の音声通信装置1の動作を説明するための図である。(第1実施形態) 図5は、本発明の音声通信装置1の機能ロジックを示している。(第1実施形態の変形例) 図6は、本発明の音声通信装置1の動作を説明するための図である。(第1実施形態の変形例) 図7は、本発明の音声通信装置1の機能ロジックを示している。(第2実施形態) 図8は、本発明の音声通信装置1の動作を説明するための図である。(第2実施形態) 図9は、本発明の音声通信装置1の機能ロジックを示している。(第2実施形態の変形例) 図10は、本発明の音声通信装置1の動作を説明するための図である。(第2実施形態の変形例) 図11は、本発明の音声通信装置1が適用される音声通信システムの構成を示している。(第3実施形態) 図12は、出力音声とソフトウェア41の動作とを対応付ける動作パターンテーブル42を示している。 図13は、本発明の音声通信装置1の動作を示すフローチャートである。(第3実施形態)
符号の説明
1 音声通信装置
2 マイク
3 スピーカ
4 音量調節機能
5 CPU
6 記憶装置
7 コンピュータプログラム
10 入力部
11 サンプリング部
12 クロック発生部
20 ノイズ除去部
21 周辺ノイズ除去部
22 重み付けデータ出力部
23 閾値データ生成部
24 パルスノイズ除去部
25 選択部
30 出力部
31 音量比較部
32 音量調整部
33 音量増幅部
40 音声認識部
41 ソフトウェア
42 動作パターンテーブル

Claims (16)

  1. マイクから音声を入力する入力部と、
    前記マイクの周辺に連続的に発生する音を表す周辺ノイズと、前記マイクの周辺に瞬時に発生する音を表すパルスノイズとを前記音声から除去して出力するノイズ除去部と
    を具備し、
    前記入力部は、
    前記マイクから入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力するサンプリング部
    を具備し、
    前記ノイズ除去部は、
    前記周辺ノイズを除去するための定数である周辺ノイズ閾値データLを予め保持し、
    Figure 0004527654
    により、周辺ノイズ除去音声データ列{DL(i)}(ただし、DL(i)<0のときはDL(i)=0)を生成する周辺ノイズ除去部と、
    重み付けデータ列{Po(i)|Po(i)=Po(1)、Po(2)、Po(3)、…、Po(n)}を出力する重み付けデータ出力部と、ここで、前記重み付けデータ列{Po(i)}が示すn個の重み付けデータは、0<Po(i)<1により表され、n番目から1番目までこの順で小さくなる係数であり、
    Figure 0004527654
    により、前記パルスノイズを除去するための定数であるパルスノイズ閾値データPを生成する閾値データ生成部と、
    Figure 0004527654
    により、パルスノイズ除去音声データ列{DP(i)}(ただし、DP(i)<0のときはDP(i)=0)を生成し、出力音声として出力するパルスノイズ除去部と
    を具備する音声通信装置。
  2. マイクから音声を入力する入力部と、
    前記マイクの周辺に連続的に発生する音を表す周辺ノイズと、前記マイクの周辺に瞬時に発生する音を表すパルスノイズとを前記音声から除去して出力するノイズ除去部と
    を具備し、
    前記入力部は、
    前記マイクから入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力するサンプリング部
    を具備し、
    前記ノイズ除去部は、
    重み付けデータ列{Po(i)|Po(i)=Po(1)、Po(2)、Po(3)、…、Po(n)}を出力する重み付けデータ出力部と、ここで、前記重み付けデータ列{Po(i)}が示すn個の重み付けデータは、0<Po(i)<1により表され、n番目から1番目までこの順で小さくなる係数であり、
    Figure 0004527654
    により、前記パルスノイズを除去するための定数であるパルスノイズ閾値データPを生成する閾値データ生成部と、
    Figure 0004527654
    により、パルスノイズ除去音声データ列{DP(i)}(ただし、DP(i)<0のときはDP(i)=0)を生成するパルスノイズ除去部と、
    前記周辺ノイズを除去するための定数である周辺ノイズ閾値データLを予め保持し、
    Figure 0004527654
    により、周辺ノイズ除去音声データ列{DL(i)}(ただし、DL(i)<0のときはDL(i)=0)を生成し、出力音声として出力する周辺ノイズ除去部と
    を具備する音声通信装置。
  3. マイクから音声を入力する入力部と、
    前記マイクの周辺に連続的に発生する音を表す周辺ノイズと、前記マイクの周辺に瞬時に発生する音を表すパルスノイズとを前記音声から除去して出力するノイズ除去部と
    を具備し、
    前記入力部は、
    前記マイクから入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力するサンプリング部
    を具備し、
    前記ノイズ除去部は、
    前記周辺ノイズを除去するための定数である周辺ノイズ閾値データLを予め保持し、
    Figure 0004527654
    により、周辺ノイズ除去音声データ列{DL(i)}(ただし、DL(i)<0のときはDL(i)=0)を生成する周辺ノイズ除去部と、
    前記周辺ノイズ除去音声データ列{DL(i)}が示すn個の周辺ノイズ除去音声データのうちの、m個の周辺ノイズ除去音声データを選択する選択部と、ここで、前記m個の周辺ノイズ除去音声データは0<m<nを満たす整数であり、前記m個の周辺ノイズ除去音声データのうちの1つは、前記n個の周辺ノイズ除去音声データのうちのn番目の周辺ノイズ除去音声データDL(n)を含み、
    前記m個の周辺ノイズ除去音声データの和をmで除算して、前記パルスノイズを除去するための定数であるパルスノイズ閾値データPを生成する閾値データ生成部と、
    Figure 0004527654
    により、パルスノイズ除去音声データ列{DP(i)}(ただし、DP(i)<0のときはDP(i)=0)を生成し、出力音声として出力するパルスノイズ除去部と
    を具備する音声通信装置。
  4. マイクから音声を入力する入力部と、
    前記マイクの周辺に連続的に発生する音を表す周辺ノイズと、前記マイクの周辺に瞬時に発生する音を表すパルスノイズとを前記音声から除去して出力するノイズ除去部と
    を具備し、
    前記入力部は、
    前記マイクから入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力するサンプリング部
    を具備し、
    前記ノイズ除去部は、
    前記音声データ列{D(i)}が示すn個の音声データのうちの、m個の音声データを選択する選択部と、ここで、前記m個の音声データは0<m<nを満たす整数であり、前記m個の音声データのうちの1つは、前記n個の音声データのうちのn番目の音声データD(n)を含み、
    前記m個の音声データの和をmで除算して、前記パルスノイズを除去するための定数であるパルスノイズ閾値データPを生成する閾値データ生成部と、
    Figure 0004527654
    により、パルスノイズ除去音声データ列{DP(i)}(ただし、DP(i)<0のときはDP(i)=0)を生成するパルスノイズ除去部と、
    前記周辺ノイズを除去するための定数である周辺ノイズ閾値データLを予め保持し、
    Figure 0004527654
    により、周辺ノイズ除去音声データ列{DL(i)}(ただし、DL(i)<0のときはDL(i)=0)を生成し、出力音声として出力する周辺ノイズ除去部と
    を具備する音声通信装置。
  5. に、
    前記出力音声の音量と、前記出力音声の大きさを判断するための設定音量とを比較する音量比較部と、
    前記出力音声の音量と前記設定音量との比較結果に基づいて前記出力音声の音量を調整する音量調整部と、
    前記出力音声の音量を所定の増幅率により増幅して出力する音量増幅部と
    を具備し、
    前記音量調整部は、
    前記出力音声の音量が前記設定音量よりも大きい場合、前記出力音声の音量から、前記出力音声の音量と前記設定音量との差分を減算し、
    前記出力音声の音量が前記設定音量よりも小さい場合、前記出力音声の音量に、前記出力音声の音量と前記設定音量との差分を加算する
    請求項1〜4のいずれかに記載の音声通信装置。
  6. に、
    ソフトウェアと、
    複数の設定出力音声と、前記ソフトウェアが実行可能な複数の動作とが対応付けられた動作パターンテーブルと、
    前記動作パターンテーブルを参照して、前記複数の動作のうちの、前記出力音声に一致する設定出力音声に応じた動作が実行されるように、前記ソフトウェアの制御を行う音声認識部と
    を具備する請求項5に記載の音声通信装置。
  7. 音声通信を行うコンピュータが実行する方法であって、
    マイクから音声を入力するステップと、
    前記マイクの周辺に連続的に発生する音を表す周辺ノイズと、前記マイクの周辺に瞬時に発生する音を表すパルスノイズとを前記音声から除去するステップと
    を具備し、
    前記音声を入力するステップは、
    前記マイクから入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力するステップ
    を具備し、
    前記周辺ノイズと前記パルスノイズとを除去するステップは、
    前記周辺ノイズを除去するための定数である周辺ノイズ閾値データLを予め保持し、
    Figure 0004527654
    により、周辺ノイズ除去音声データ列{DL(i)}(ただし、DL(i)<0のときはDL(i)=0)を生成するステップと、
    重み付けデータ列{Po(i)|Po(i)=Po(1)、Po(2)、Po(3)、…、Po(n)}を出力するステップと、ここで、前記重み付けデータ列{Po(i)}が示すn個の重み付けデータは、0<Po(i)<1により表され、n番目から1番目までこの順で小さくなる係数であり、
    Figure 0004527654
    により、前記パルスノイズを除去するための定数であるパルスノイズ閾値データPを生成するステップと、
    Figure 0004527654
    により、パルスノイズ除去音声データ列{DP(i)}(ただし、DP(i)<0のときはDP(i)=0)を生成し、出力音声として出力するステップと
    を具備する音声通信方法。
  8. 音声通信を行うコンピュータが実行する方法であって、
    マイクから音声を入力するステップと、
    前記マイクの周辺に連続的に発生する音を表す周辺ノイズと、前記マイクの周辺に瞬時に発生する音を表すパルスノイズとを前記音声から除去するステップと
    を具備し、
    前記音声を入力するステップは、
    前記マイクから入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力するステップ
    を具備し、
    前記周辺ノイズと前記パルスノイズとを除去するステップは、
    重み付けデータ列{Po(i)|Po(i)=Po(1)、Po(2)、Po(3)、…、Po(n)}を出力するステップと、ここで、前記重み付けデータ列{Po(i)}が示すn個の重み付けデータは、0<Po(i)<1により表され、n番目から1番目までこの順で小さくなる係数であり、
    Figure 0004527654
    により、前記パルスノイズを除去するための定数であるパルスノイズ閾値データPを生成するステップと、
    Figure 0004527654
    により、パルスノイズ除去音声データ列{DP(i)}(ただし、DP(i)<0のときはDP(i)=0)を生成するステップと、
    前記周辺ノイズを除去するための定数である周辺ノイズ閾値データLを予め保持し、
    Figure 0004527654
    により、周辺ノイズ除去音声データ列{DL(i)}(ただし、DL(i)<0のときはDL(i)=0)を生成し、出力音声として出力するステップと
    を具備する音声通信方法。
  9. 音声通信を行うコンピュータが実行する方法であって、
    マイクから音声を入力するステップと、
    前記マイクの周辺に連続的に発生する音を表す周辺ノイズと、前記マイクの周辺に瞬時に発生する音を表すパルスノイズとを前記音声から除去するステップと
    を具備し、
    前記音声を入力するステップは、
    前記マイクから入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力するステップ
    を具備し、
    前記周辺ノイズと前記パルスノイズとを除去するステップは、
    前記周辺ノイズを除去するための定数である周辺ノイズ閾値データLを予め保持し、
    Figure 0004527654
    により、周辺ノイズ除去音声データ列{DL(i)}(ただし、DL(i)<0のときはDL(i)=0)を生成するステップと、
    前記周辺ノイズ除去音声データ列{DL(i)}が示すn個の周辺ノイズ除去音声データのうちの、m個の周辺ノイズ除去音声データを選択する選択ステップと、ここで、前記m個の周辺ノイズ除去音声データは0<m<nを満たす整数であり、前記m個の周辺ノイズ除去音声データのうちの1つは、前記n個の周辺ノイズ除去音声データのうちのn番目の周辺ノイズ除去音声データDL(n)を含み、
    前記m個の周辺ノイズ除去音声データの和をmで除算して、前記パルスノイズを除去するための定数であるパルスノイズ閾値データPを生成するステップと、
    Figure 0004527654
    により、パルスノイズ除去音声データ列{DP(i)}(ただし、DP(i)<0のときはDP(i)=0)を生成し、出力音声として出力するステップと
    を具備する音声通信方法。
  10. 音声通信を行うコンピュータが実行する方法であって、
    マイクから音声を入力するステップと、
    前記マイクの周辺に連続的に発生する音を表す周辺ノイズと、前記マイクの周辺に瞬時に発生する音を表すパルスノイズとを前記音声から除去するステップと
    を具備し、
    前記音声を入力するステップは、
    前記マイクから入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力するステップ
    を具備し、
    前記周辺ノイズと前記パルスノイズとを除去するステップは、
    前記音声データ列{D(i)}が示すn個の音声データのうちの、m個の音声データを選択する選択ステップと、ここで、前記m個の音声データは0<m<nを満たす整数であり、前記m個の音声データのうちの1つは、前記n個の音声データのうちのn番目の音声データD(n)を含み、
    前記m個の音声データの和をmで除算して、前記パルスノイズを除去するための定数であるパルスノイズ閾値データPを生成するステップと、
    Figure 0004527654
    により、パルスノイズ除去音声データ列{DP(i)}(ただし、DP(i)<0のときはDP(i)=0)を生成するステップと、
    前記周辺ノイズを除去するための定数である周辺ノイズ閾値データLを予め保持し、
    Figure 0004527654
    により、周辺ノイズ除去音声データ列{DL(i)}(ただし、DL(i)<0のときはDL(i)=0)を生成し、出力音声として出力するステップと
    を具備する音声通信方法。
  11. に、
    前記出力音声の音量と、前記出力音声の大きさを判断するための設定音量とを比較するステップと、
    前記出力音声の音量と前記設定音量との比較結果に基づいて前記出力音声の音量を調整するステップと、
    前記出力音声の音量を所定の増幅率により増幅して出力するステップと
    を具備し、
    前記音量調整するステップは、
    前記出力音声の音量が前記設定音量よりも大きい場合、前記出力音声の音量から、前記出力音声の音量と前記設定音量との差分を減算し、
    前記出力音声の音量が前記設定音量よりも小さい場合、前記出力音声の音量に、前記出力音声の音量と前記設定音量との差分を加算する
    請求項7〜10のいずれかに記載の音声通信方法。
  12. に、
    複数の設定出力音声と、ソフトウェアが実行可能な複数の動作とが対応付けられた動作パターンテーブルを参照して、前記複数の動作のうちの、前記出力音声に一致する設定出力音声に応じた動作が実行されるように、前記ソフトウェアの制御を行うステップ
    を具備する請求項11に記載の音声通信方法。
  13. 請求項7、11、12のいずれかに記載の音声通信方法の各ステップを前記コンピュータに実行させるコンピュータプログラム。
  14. 請求項8、11、12のいずれかに記載の音声通信方法の各ステップを前記コンピュータに実行させるコンピュータプログラム。
  15. 請求項9、11、12のいずれかに記載の音声通信方法の各ステップを前記コンピュータに実行させるコンピュータプログラム。
  16. 請求項10〜12のいずれかに記載の音声通信方法の各ステップを前記コンピュータに実行させるコンピュータプログラム。
JP2005338767A 2005-11-24 2005-11-24 音声通信装置 Active JP4527654B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005338767A JP4527654B2 (ja) 2005-11-24 2005-11-24 音声通信装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005338767A JP4527654B2 (ja) 2005-11-24 2005-11-24 音声通信装置

Publications (2)

Publication Number Publication Date
JP2007147736A JP2007147736A (ja) 2007-06-14
JP4527654B2 true JP4527654B2 (ja) 2010-08-18

Family

ID=38209249

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005338767A Active JP4527654B2 (ja) 2005-11-24 2005-11-24 音声通信装置

Country Status (1)

Country Link
JP (1) JP4527654B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4974708B2 (ja) * 2007-02-28 2012-07-11 オンセミコンダクター・トレーディング・リミテッド 雑音抑圧装置、受信装置
US9407989B1 (en) 2015-06-30 2016-08-02 Arthur Woodrow Closed audio circuit
JP6933397B2 (ja) * 2019-11-12 2021-09-08 ティ・アイ・エル株式会社 音声認識装置、管理システム、管理プログラム及び音声認識方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH029286A (ja) * 1988-06-28 1990-01-12 Nec Home Electron Ltd 複合映像信号のy/c分離装置
JPH04238399A (ja) * 1991-01-22 1992-08-26 Ricoh Co Ltd 音声認識装置
JPH04245300A (ja) * 1991-01-30 1992-09-01 Nec Corp 雑音除去装置
JPH05119794A (ja) * 1991-10-25 1993-05-18 Matsushita Electric Ind Co Ltd 収音装置
JPH09326844A (ja) * 1996-06-03 1997-12-16 Mitsubishi Electric Corp 騒音低減通話装置及び騒音低減通話方法
JP2000321080A (ja) * 1999-05-13 2000-11-24 Denso Corp 雑音抑圧装置,音声認識装置及び車両用ナビゲーション装置
JP2002258897A (ja) * 2001-02-27 2002-09-11 Fujitsu Ltd 雑音抑圧装置
JP2002537586A (ja) * 1999-02-18 2002-11-05 アンドレア エレクトロニクス コーポレイション 雑音を消去するためのシステム、方法及び装置
JP2003280686A (ja) * 2002-03-15 2003-10-02 Internatl Business Mach Corp <Ibm> 音声認識装置、その音声認識方法及びプログラム

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH029286A (ja) * 1988-06-28 1990-01-12 Nec Home Electron Ltd 複合映像信号のy/c分離装置
JPH04238399A (ja) * 1991-01-22 1992-08-26 Ricoh Co Ltd 音声認識装置
JPH04245300A (ja) * 1991-01-30 1992-09-01 Nec Corp 雑音除去装置
JPH05119794A (ja) * 1991-10-25 1993-05-18 Matsushita Electric Ind Co Ltd 収音装置
JPH09326844A (ja) * 1996-06-03 1997-12-16 Mitsubishi Electric Corp 騒音低減通話装置及び騒音低減通話方法
JP2002537586A (ja) * 1999-02-18 2002-11-05 アンドレア エレクトロニクス コーポレイション 雑音を消去するためのシステム、方法及び装置
JP2000321080A (ja) * 1999-05-13 2000-11-24 Denso Corp 雑音抑圧装置,音声認識装置及び車両用ナビゲーション装置
JP2002258897A (ja) * 2001-02-27 2002-09-11 Fujitsu Ltd 雑音抑圧装置
JP2003280686A (ja) * 2002-03-15 2003-10-02 Internatl Business Mach Corp <Ibm> 音声認識装置、その音声認識方法及びプログラム

Also Published As

Publication number Publication date
JP2007147736A (ja) 2007-06-14

Similar Documents

Publication Publication Date Title
JP5644359B2 (ja) 音声処理装置
EP2265039B1 (en) Hearing aid
EP2081405A1 (en) A hearing aid adapted to a specific type of voice in an acoustical environment, a method and use
JP2003520469A (ja) 雑音低減装置及び方法
US9343073B1 (en) Robust noise suppression system in adverse echo conditions
US11647344B2 (en) Hearing device with end-to-end neural network
JP5027127B2 (ja) 背景雑音に応じてバイブレータの動作を制御することによる移動通信装置の音声了解度の向上
CN114664322A (zh) 基于蓝牙耳机芯片的单麦克风助听降噪方法及蓝牙耳机
JP4527654B2 (ja) 音声通信装置
JP4536020B2 (ja) 雑音除去機能を有する音声入力装置および方法
JP2007251354A (ja) マイクロホン、音声生成方法
JP2007116585A (ja) ノイズキャンセル装置およびノイズキャンセル方法
JP2007174011A (ja) 収音装置
JP2015136105A (ja) フィードバック抑制
KR20150096090A (ko) 두 개의 마이크로폰을 포함하는 통신장치에서의 잡음제거방법 및 장치
JP5188558B2 (ja) 音声処理装置
JPH09311696A (ja) 自動利得調整装置
JP5249431B2 (ja) 信号経路を分離する方法及び電気喉頭を使用して音声を改良するための使用方法
JP5359744B2 (ja) 音処理装置及びプログラム
RU2589298C1 (ru) Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке
JP2010239458A (ja) 音量調整装置、方法、プログラム及び記録媒体
JP2022025908A (ja) フィルタ処理方法、フィルタ処理装置、およびフィルタ処理プログラム
JP2011002535A (ja) 音声対話システム、音声対話方法、及びプログラム
JP2006126841A (ja) 周期信号増強システム
JP2013005106A (ja) 場内拡声装置、場内拡声方法、及びそのプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091001

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100512

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100603

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130611

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4527654

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350