JP2007147736A - 音声通信装置 - Google Patents
音声通信装置 Download PDFInfo
- Publication number
- JP2007147736A JP2007147736A JP2005338767A JP2005338767A JP2007147736A JP 2007147736 A JP2007147736 A JP 2007147736A JP 2005338767 A JP2005338767 A JP 2005338767A JP 2005338767 A JP2005338767 A JP 2005338767A JP 2007147736 A JP2007147736 A JP 2007147736A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- data
- noise
- sound
- volume
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】本発明の音声通信装置は、音声通信装置(1)は、入力部(10)、ノイズ除去部(20)を具備している。前記入力部(10)は、マイク(2)から音声を入力する。前記ノイズ除去部(20)は、前記マイク(2)の周辺に連続的に発生する音を表す周辺ノイズと、前記マイク(2)の周辺に瞬時に発生する音を表すパルスノイズとを前記音声から除去して出力する。
【選択図】図1
Description
前記入力部(10)は、マイク(2)から音声を入力する。
前記ノイズ除去部(20)は、前記マイク(2)の周辺に連続的に発生する音を表す周辺ノイズと、前記マイク(2)の周辺に瞬時に発生する音を表すパルスノイズとを前記音声から除去して出力する。
マイク(2)から入力される音声は、所望の音声と、所望の音声以外の不要な音声とを含んでいる。この場合、所望の音声は、第1使用者の音声を表していて、不要な音声は、周辺ノイズやパルスノイズを含む音声を表している。周辺ノイズは、マイク(2)の周辺に連続的に発生する音を表し、例えば、マイク2の周辺で道路を走る車の音や、マイク2の周辺における人の会話などが挙げられる。パルスノイズは、マイク(2)の周辺に瞬時に発生する音を表し、例えば、マイク2のハウリング音や、ベルの音などが挙げられる。
例えば、出力部(30)は、上記の音声を所定の増幅率により増幅して出力音声としてスピーカ(3)に出力する。この場合、出力部(30)が一定倍率で増幅を行なっても、所望の音声の他に不要な音声まで増幅されてしまい、スピーカ(3)に出力される音声が不明瞭になってしまう可能性がある。
そこで、ノイズ除去部(20)は、周辺ノイズとパルスノイズとを音声から除去して、出力音声として出力部(30)に出力する。出力部(30)は、その出力音声を所定の増幅率により増幅してスピーカ(3)に出力する。第2使用者は、スピーカ3に出力された出力音声から所望の音声を明瞭に聞くことができる。
このように、本発明の音声通信装置(1)によれば、周辺ノイズとパルスノイズとを音声から除去することにより、不要な音声を低減することができる。
前記ノイズ除去部(20)は、前記音声データから、前記周辺ノイズを除去するための閾値である周辺ノイズ閾値データと、前記パルスノイズを除去するための閾値であるパルスノイズ閾値データとを減算する。
本発明の音声通信装置(1)によれば、ノイズ除去部(20)は、音声データから周辺ノイズ閾値データを減算することにより、マイク(2)から入力される音声から周辺ノイズを除去することができ、音声データからパルスノイズ閾値データを減算することにより、マイク(2)から入力される音声からパルスノイズを除去することができる。
前記サンプリング部(11)は、前記マイク(2)から入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す前記音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力する。
前記ノイズ除去部(20)は、周辺ノイズ除去部(21)と、重み付けデータ出力部(22)と、閾値データ生成部(23)と、パルスノイズ除去部(24)とを具備している。
前記周辺ノイズ除去部(21)は、前記周辺ノイズ閾値データである周辺ノイズ閾値データLを予め保持し、数1により、周辺ノイズ除去音声データ列{DL(i)}(ただし、DL(i)<0のときはDL(i)=0)を生成する。
前記重み付けデータ出力部(22)は、重み付けデータ列{Po(i)|Po(i)=Po(1)、Po(2)、Po(3)、…、Po(n)}を出力する。ここで、前記重み付けデータ列{Po(i)}が示すn個の重み付けデータは、0<Po(i)<1により表され、n番目から1番目までこの順で小さくなる係数である。
前記閾値データ生成部(23)は、数2により、前記パルスノイズ閾値データであるパルスノイズ閾値データPを生成する。
前記パルスノイズ除去部(24)は、数3により、パルスノイズ除去音声データ列{DP(i)}(ただし、DP(i)<0のときはDP(i)=0)を生成し、出力音声として出力する。
周辺ノイズは、マイク(2)の周辺に連続的に発生していても、マイク(2)からある程度離れているところで発生する音であるため、音声の音量のレベルとしては小さい。このため、周辺ノイズを除去するための閾値として周辺ノイズ閾値データLを決定しておき、周辺ノイズ除去部(21)に設定しておくことができる。例えば、周辺ノイズとして、マイク(2)の周辺で道路を走る車の音や、マイク2の周辺における人の会話などを収集しておき、それを周辺ノイズ閾値データLとして周辺ノイズ除去部(21)に設定しておく。これにより、周辺ノイズ除去部(21)が、音声データ列{D(i)}から、周辺ノイズ閾値データLを減算することにより、マイク(2)から入力される音声から周辺ノイズを除去することができる。
しかしながら、パルスノイズは、マイク(2)のハウリング音や、ベルの音など、マイク(2)の周辺に突発的に発生するため、パルスノイズを除去するための閾値を任意に決定することが困難である。そこで、重み付けデータ出力部(22)と閾値データ生成部(23)により、音声データと重み付けとを用いて、パルスノイズを除去するための閾値としてパルスノイズ閾値データPを生成する。
例えば、nが5であり、重み付けデータ列{Po(i)}は、最新のデータから順に、重み付けデータPo(5)、Po(4)、Po(3)、Po(2)、Po(1)のそれぞれに対して、0.5、0.25、0.125、0.0625、0.03125が重み付けデータ出力部(22)により割り当てられている。また、周辺ノイズ除去音声データ列{DL(i)}が示す音量は、最新のデータから順に、周辺ノイズ除去音声データDL(5)、DL(4)、DL(3)、DL(2)、DL(1)のそれぞれに対して、100、50、100、30、50であるものとする。この場合、閾値データ生成部(23)により、パルスノイズ閾値データPは、100×0.5+50×0.25+100×0.125+30×0.0625+50×0.03125=78.4375となる。これにより、パルスノイズ除去部(24)は、上記の周辺ノイズ除去音声データ列{DL(i)}が示す100、50、100、30、50から、パルスノイズ閾値データPが示す78.4375を減算することにより(DP(i)<0のときはDP(i)=0)、マイク(2)から入力される音声からパルスノイズを除去することができる。即ち、本発明の音声通信装置(1)によれば、マイク(2)から入力される音声から、周辺ノイズとパルスノイズとが除去された音声である所望の音声を取り出すことができる。
前記サンプリング部(11)は、前記マイク(2)から入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す前記音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力する。
前記ノイズ除去部(20)は、重み付けデータ出力部(22)と、閾値データ生成部(23)と、パルスノイズ除去部(24)と、周辺ノイズ除去部(21)とを具備している。
前記重み付けデータ出力部(22)は、重み付けデータ列{Po(i)|Po(i)=Po(1)、Po(2)、Po(3)、…、Po(n)}を出力する。ここで、前記重み付けデータ列{Po(i)}が示すn個の重み付けデータは、0<Po(i)<1により表され、n番目から1番目までこの順で小さくなる係数である。
前記閾値データ生成部(23)は、数4により、前記パルスノイズ閾値データであるパルスノイズ閾値データPを生成する。
前記パルスノイズ除去部(24)は、数5により、パルスノイズ除去音声データ列{DP(i)}(ただし、DP(i)<0のときはDP(i)=0)を生成する。
前記周辺ノイズ除去部(21)は、前記周辺ノイズ閾値データである周辺ノイズ閾値データLを予め保持している。前記周辺ノイズ除去部(21)は、数6により、周辺ノイズ除去音声データ列{DL(i)}(ただし、DL(i)<0のときはDL(i)=0)を生成し、出力音声として出力する。
上記第3の観点では、ノイズ除去部(20)は、周辺ノイズ除去部(21)により周辺ノイズを音声から除去した後に、重み付けデータ出力部(22)、閾値データ生成部(23)、パルスノイズ除去部(24)によりパルスノイズを音声から除去している。これに対して、上記第4の観点として、重み付けデータ出力部(22)、閾値データ生成部(23)、パルスノイズ除去部(24)によりパルスノイズを音声から除去した後に、周辺ノイズ除去部(21)により周辺ノイズを音声から除去してもよい。
前記サンプリング部(11)は、前記マイク(2)から入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す前記音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力する。
前記ノイズ除去部(20)は、周辺ノイズ除去部(21)と、選択部(25)と、閾値データ生成部(23)と、パルスノイズ除去部(24)とを具備している。
前記周辺ノイズ除去部(21)は、前記周辺ノイズ閾値データである周辺ノイズ閾値データLを予め保持している。前記周辺ノイズ除去部(21)は、数7により、周辺ノイズ除去音声データ列{DL(i)}(ただし、DL(i)<0のときはDL(i)=0)を生成する。
前記選択部(25)は、前記周辺ノイズ除去音声データ列{DL(i)}が示すn個の周辺ノイズ除去音声データのうちの、m個の周辺ノイズ除去音声データを選択する。ここで、前記m個の周辺ノイズ除去音声データは0<m<nを満たす整数である。前記m個の周辺ノイズ除去音声データのうちの1つは、前記n個の周辺ノイズ除去音声データのうちのn番目の周辺ノイズ除去音声データDL(n)を含んでいる。
前記閾値データ生成部(23)は、前記m個の周辺ノイズ除去音声データの和をmで除算して、前記パルスノイズ閾値データであるパルスノイズ閾値データPを生成する。
前記パルスノイズ除去部(24)は、数8により、パルスノイズ除去音声データ列{DP(i)}(ただし、DP(i)<0のときはDP(i)=0)を生成し、出力音声として出力する。
例えば、上記のように、nが5であり、周辺ノイズ除去音声データ列{DL(i)}が示す音量は、最新のデータから順に、周辺ノイズ除去音声データDL(5)、DL(4)、DL(3)、DL(2)、DL(1)のそれぞれに対して、100、50、100、30、50であるものとする。mが3であり、上記設定時間を越える周辺ノイズ除去音声データが3番目の周辺ノイズ除去音声データである場合、選択部(25)により、2番目、4番目、n番目(5番目)の周辺ノイズ除去音声データが示す音量を利用する。閾値データ生成部(23)により、パルスノイズ閾値データPは、100/3+50/3+30/3=60となる。これにより、パルスノイズ除去部(24)は、上記の周辺ノイズ除去音声データ列{DL(i)}が示す100、50、100、30、50から、パルスノイズ閾値データPが示す60を減算することにより(DP(i)<0のときはDP(i)=0)、マイク(2)から入力される音声からパルスノイズを除去することができる。即ち、本発明の音声通信装置(1)によれば、マイク(2)から入力される音声から、周辺ノイズとパルスノイズとが除去された音声である所望の音声を取り出すことができる。
前記サンプリング部(11)は、前記マイク(2)から入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す前記音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力する。
前記ノイズ除去部(20)は、選択部(25)と、閾値データ生成部(23)と、パルスノイズ除去部(24)と、周辺ノイズ除去部(21)とを具備している。
前記選択部(25)は、前記音声データ列{D(i)}が示すn個の音声データのうちの、m個の音声データを選択する。ここで、前記m個の音声データは0<m<nを満たす整数である。前記m個の音声データのうちの1つは、前記n個の音声データのうちのn番目の音声データD(n)を含んでいる。
前記閾値データ生成部(23)は、前記m個の音声データの和をmで除算して、前記パルスノイズ閾値データであるパルスノイズ閾値データPを生成する。
前記パルスノイズ除去部(24)は、数9により、パルスノイズ除去音声データ列{DP(i)}(ただし、DP(i)<0のときはDP(i)=0)を生成する。
前記周辺ノイズ除去部(21)は、前記周辺ノイズ閾値データである周辺ノイズ閾値データLを予め保持している。前記周辺ノイズ除去部(21)は、数10により、周辺ノイズ除去音声データ列{DL(i)}(ただし、DL(i)<0のときはDL(i)=0)を生成し、出力音声として出力する。
上記第5の観点では、ノイズ除去部(20)は、周辺ノイズ除去部(21)により周辺ノイズを音声から除去した後に、選択部(25)、閾値データ生成部(23)、パルスノイズ除去部(24)によりパルスノイズを音声から除去している。これに対して、上記第6の観点として、選択部(25)、閾値データ生成部(23)、パルスノイズ除去部(24)によりパルスノイズを音声から除去した後に、周辺ノイズ除去部(21)により周辺ノイズを音声から除去してもよい。
前記出力部(30)は、音量比較部(31)と、音量調整部(32)と、音量増幅部(33)とを具備している。
前記音量比較部(31)は、前記出力音声の音量と、前記出力音声の大きさを判断するための設定音量とを比較する。
前記音量調整部(32)は、前記出力音声の音量と前記設定音量との比較結果に基づいて前記出力音声の音量を調整する。
前記音量増幅部(33)は、前記出力音声の音量を所定の増幅率により増幅して出力する。
そこで、前記出力音声の音量が前記設定音量よりも大きい場合、前記音量調整部(32)は、前記出力音声の音量から、前記出力音声の音量と前記設定音量との差分を減算する。
前記出力音声の音量が前記設定音量よりも小さい場合、前記音量調整部(32)は、前記出力音声の音量に、前記出力音声の音量と前記設定音量との差分を加算する。
本発明の音声通信装置(1)によれば、出力部(30)は、出力音声の音量を決められた音量に自動的に変更する。これにより、第1使用者がマイク(2)を用いるときの第1使用者とマイク(2)との距離にかかわらず、一定の音量で出力音声を再生することができる。
前記動作パターンテーブル(42)には、複数の設定出力音声と、前記ソフトウェア(41)が実行可能な複数の動作とが対応付けられて格納されている。
前記音声認識部(40)は、前記動作パターンテーブル(42)を参照して、前記複数の動作のうちの、前記出力音声に一致する設定出力音声に応じた動作が実行されるように、前記ソフトウェア(41)の制御を行う。
本発明の音声通信装置(1)によれば、周辺ノイズとパルスノイズとを音声から除去することにより、ソフトウェア(41)が誤動作することなく、音声認識を行なうことができる。
例えば、音声通信装置1にロボットが設けられ、上記のソフトウェア(41)が実行可能な動作として、そのロボットの腕を振る、頭を振るといった動作のパターンを制御したり、「いらっしゃいませ」といったような言葉を発声するパターンを制御したりすることも可能である。こういった行動をするような手段を設けることで、マイク(2)への話しかけにより、喜怒哀楽を表現させたり、答えを返したりするといったことも可能となる。
また、音声通信装置(1)から、出力装置(4)として他の通信装置に音声を通知し、その音声を聞いたオペレータから音声通信装置(1)の音声認識部(40)に指示を出すことで、音声認識部(40)を用いて多彩な行動を取らせることも可能となる。
本発明の音声通信装置によれば、使用者がマイクを用いるときの使用者とマイクとの距離にかかわらず、一定の音量で出力音声を再生することができる。
本発明の音声通信装置によれば、周辺ノイズとパルスノイズとを音声から除去することにより、ソフトウェアが誤動作することなく、音声認識を行なうことができる。
図1は、本発明の第1実施形態による音声通信装置1が適用される音声通信システムの構成を示している。音声通信システムは、例えば、使用者に対する受け付け(無人受付)や監視に利用され、マイク2と、出力装置3と、音声通信装置1とを具備している。音声通信装置1は、マイク2と出力装置3に接続され、マイク2から音声を入力して、その音声を出力装置3に出力する。
そこで、ノイズ除去部20は、周辺ノイズとパルスノイズとを音声から除去して、出力音声として出力部30に出力する。出力部30は、その出力音声を所定の増幅率により増幅してスピーカ3に出力する。第2使用者は、スピーカ3に出力された出力音声から所望の音声を明瞭に聞くことができる。
サンプリング部11は、マイク2から入力される音声をクロック信号CLKに応じて所定の周期でサンプリングする。このとき、図4に示されるように、サンプリング部11は、サンプリング時の音声を示す音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力する。
周辺ノイズは、マイク2の周辺に連続的に発生していても、マイク2からある程度離れているところで発生する音であるため、音声の音量のレベルとしては小さい。このため、周辺ノイズを除去するための閾値として周辺ノイズ閾値データLを決定しておき、周辺ノイズ除去部21に設定しておくことができる。例えば、周辺ノイズとして、マイク2の周辺で道路を走る車の音や、マイク2の周辺における人の会話などを収集しておき、それを周辺ノイズ閾値データLとして周辺ノイズ除去部21に設定しておく。これにより、周辺ノイズ除去部21が、音声データ列{D(i)}から、周辺ノイズ閾値データLを減算することにより、マイク2から入力される音声から周辺ノイズを除去することができる。
しかしながら、パルスノイズは、マイク2のハウリング音や、ベルの音など、マイク2の周辺に突発的に発生するため、パルスノイズを除去するための閾値を任意に決定することが困難である。そこで、重み付けデータ出力部22と閾値データ生成部23により、音声データと重み付けとを用いて、パルスノイズを除去するための閾値としてパルスノイズ閾値データPを生成する。
例えば、nが5であり、重み付けデータ列{Po(i)}は、最新のデータから順に、重み付けデータPo(5)、Po(4)、Po(3)、Po(2)、Po(1)のそれぞれに対して、0.5、0.25、0.125、0.0625、0.03125が重み付けデータ出力部22により割り当てられている。また、周辺ノイズ除去音声データ列{DL(i)}が示す音量は、最新のデータから順に、周辺ノイズ除去音声データDL(5)、DL(4)、DL(3)、DL(2)、DL(1)のそれぞれに対して、100、50、100、30、50(dB)であるものとする。この場合、閾値データ生成部23により、パルスノイズ閾値データPは、100×0.5+50×0.25+100×0.125+30×0.0625+50×0.03125=78.4375(dB)となる。これにより、パルスノイズ除去部24は、上記の周辺ノイズ除去音声データ列{DL(i)}が示す100、50、100、30、50から、パルスノイズ閾値データPが示す78.4375を減算することにより(DP(i)<0のときはDP(i)=0)、マイク2から入力される音声からパルスノイズを除去することができる。即ち、本発明の音声通信装置1によれば、マイク2から入力される音声から、周辺ノイズとパルスノイズとが除去された音声である所望の音声を取り出すことができる。
例えば、出力音声の音量と設定音量とを比較した結果、出力音声の音量が設定音量よりも大きい。この場合、音量調整部32は、出力音声の音量から、出力音声の音量と設定音量との差分を減算し、音量増幅部33に出力する。音量増幅部33は、この出力音声の音量を所定の増幅率により増幅し、出力装置3に出力する。
例えば、出力音声の音量と設定音量とを比較した結果、出力音声の音量が設定音量よりも小さい。この場合、音量調整部32は、出力音声の音量に、出力音声の音量と設定音量との差分を加算し、音量増幅部33に出力する。音量増幅部33は、この出力音声の音量を所定の増幅率により増幅し、出力装置3に出力する。
この場合、第2使用者は、音量調節部4を用いなくても、スピーカ3に出力された出力音声を明瞭に聞くことができるし、音量調節部4により、好みの音量に合わせて、スピーカ3に出力された出力音声を上げたり下げたりすることもできる。
本発明の第1実施形態による音声通信装置1によれば、使用者がマイク2を用いるときの使用者とマイク2との距離にかかわらず、一定の音量で出力音声を再生することができる。
本発明の第2実施形態による音声通信装置1について説明する。第2実施形態では、第1実施形態と異なる点のみ説明する。
例えば、上記のように、nが5であり、周辺ノイズ除去音声データ列{DL(i)}が示す音量は、最新のデータから順に、周辺ノイズ除去音声データDL(5)、DL(4)、DL(3)、DL(2)、DL(1)のそれぞれに対して、100、50、100、30、50(dB)であるものとする。mが3であり、上記設定時間を越える周辺ノイズ除去音声データが3番目の周辺ノイズ除去音声データである場合、選択部25により、2番目、4番目、n番目(5番目)の周辺ノイズ除去音声データが示す音量を利用する。閾値データ生成部23により、パルスノイズ閾値データPは、100/3+50/3+30/3=60(dB)となる。これにより、パルスノイズ除去部24は、上記の周辺ノイズ除去音声データ列{DL(i)}が示す100、50、100、30、50から、パルスノイズ閾値データPが示す60を減算することにより(DP(i)<0のときはDP(i)=0)、マイク2から入力される音声からパルスノイズを除去することができる。即ち、マイク2から入力される音声から、周辺ノイズとパルスノイズとが除去された音声である所望の音声を取り出すことができる。
本発明の第3実施形態による音声通信装置1について説明する。第3実施形態では、第1、第2実施形態と異なる点のみ説明する。
図12に示されるように、動作パターンテーブル42には、複数の設定出力音声と、ソフトウェア41が実行可能な複数の動作とが対応付けられて格納されている。
この場合、出力音声は、ノイズ除去部20から出力された出力音声でもよいし、出力部30から出力された出力音声でもよい。音声認識部40は、動作パターンテーブル42を参照して、上記の複数の動作のうちの、出力音声に一致する設定出力音声に応じた動作が実行されるように、ソフトウェア41の制御を行う。
例えば、音声通信装置1にロボットが設けられ、上記のソフトウェア41が実行可能な動作として、そのロボットの腕を振る、頭を振るといった動作のパターンを制御したり、「いらっしゃいませ」といったような言葉を発声するパターンを制御したりすることも可能である。こういった行動をするような手段を設けることで、マイク2への話しかけにより、喜怒哀楽を表現させたり、答えを返したりするといったことも可能となる。
また、音声通信装置1から、出力装置4として他の通信装置に音声を通知し、その音声を聞いたオペレータから音声通信装置1の音声認識部40に指示を出すことで、音声認識部40を用いて多彩な行動を取らせることも可能となる。
2 マイク
3 スピーカ
4 音量調節機能
5 CPU
6 記憶装置
7 コンピュータプログラム
10 入力部
11 サンプリング部
12 クロック発生部
20 ノイズ除去部
21 周辺ノイズ除去部
22 重み付けデータ出力部
23 閾値データ生成部
24 パルスノイズ除去部
25 選択部
30 出力部
31 音量比較部
32 音量調整部
33 音量増幅部
40 音声認識部
41 ソフトウェア
42 動作パターンテーブル
Claims (17)
- マイクから音声を入力する入力部と、
前記マイクの周辺に連続的に発生する音を表す周辺ノイズと、前記マイクの周辺に瞬時に発生する音を表すパルスノイズとを前記音声から除去して出力するノイズ除去部と
を具備する音声通信装置。 - 請求項1に記載の音声通信装置において、
前記入力部は、前記マイクから入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す音声データを出力し、
前記ノイズ除去部は、
前記音声データから、前記周辺ノイズを除去するための閾値である周辺ノイズ閾値データと、前記パルスノイズを除去するための閾値であるパルスノイズ閾値データとを減算する
音声通信装置。 - 請求項2に記載の音声通信装置において、
前記入力部は、
前記マイクから入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す前記音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力するサンプリング部
を具備し、
前記ノイズ除去部は、
前記周辺ノイズ閾値データである周辺ノイズ閾値データLを予め保持し、
重み付けデータ列{Po(i)|Po(i)=Po(1)、Po(2)、Po(3)、…、Po(n)}を出力する重み付けデータ出力部と、ここで、前記重み付けデータ列{Po(i)}が示すn個の重み付けデータは、0<Po(i)<1により表され、n番目から1番目までこの順で小さくなる係数であり、
を具備する音声通信装置。 - 請求項2に記載の音声通信装置において、
前記入力部は、
前記マイクから入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す前記音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力するサンプリング部
を具備し、
前記ノイズ除去部は、
重み付けデータ列{Po(i)|Po(i)=Po(1)、Po(2)、Po(3)、…、Po(n)}を出力する重み付けデータ出力部と、ここで、前記重み付けデータ列{Po(i)}が示すn個の重み付けデータは、0<Po(i)<1により表され、n番目から1番目までこの順で小さくなる係数であり、
前記周辺ノイズ閾値データである周辺ノイズ閾値データLを予め保持し、
を具備する音声通信装置。 - 請求項2に記載の音声通信装置において、
前記入力部は、
前記マイクから入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す前記音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力するサンプリング部
を具備し、
前記ノイズ除去部は、
前記周辺ノイズ閾値データである周辺ノイズ閾値データLを予め保持し、
前記周辺ノイズ除去音声データ列{DL(i)}が示すn個の周辺ノイズ除去音声データのうちの、m個の周辺ノイズ除去音声データを選択する選択部と、ここで、前記m個の周辺ノイズ除去音声データは0<m<nを満たす整数であり、前記m個の周辺ノイズ除去音声データのうちの1つは、前記n個の周辺ノイズ除去音声データのうちのn番目の周辺ノイズ除去音声データDL(n)を含み、
前記m個の周辺ノイズ除去音声データの和をmで除算して、前記パルスノイズ閾値データであるパルスノイズ閾値データPを生成する閾値データ生成部と、
を具備する音声通信装置。 - 請求項2に記載の音声通信装置において、
前記入力部は、
前記マイクから入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す前記音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力するサンプリング部
を具備し、
前記ノイズ除去部は、
前記音声データ列{D(i)}が示すn個の音声データのうちの、m個の音声データを選択する選択部と、ここで、前記m個の音声データは0<m<nを満たす整数であり、前記m個の音声データのうちの1つは、前記n個の音声データのうちのn番目の音声データD(n)を含み、
前記m個の音声データの和をmで除算して、前記パルスノイズ閾値データであるパルスノイズ閾値データPを生成する閾値データ生成部と、
前記周辺ノイズ閾値データである周辺ノイズ閾値データLを予め保持し、
を具備する音声通信装置。 - 請求項3〜6のいずれかに記載の音声通信装置において、
更に、
前記出力音声の音量と、前記出力音声の大きさを判断するための設定音量とを比較する音量比較部と、
前記出力音声の音量と前記設定音量との比較結果に基づいて前記出力音声の音量を調整する音量調整部と、
前記出力音声の音量を所定の増幅率により増幅して出力する音量増幅部と
を具備し、
前記音量調整部は、
前記出力音声の音量が前記設定音量よりも大きい場合、前記出力音声の音量から、前記出力音声の音量と前記設定音量との差分を減算し、
前記出力音声の音量が前記設定音量よりも小さい場合、前記出力音声の音量に、前記出力音声の音量と前記設定音量との差分を加算する
音声通信装置。 - 請求項7に記載の音声通信装置において、
更に、
ソフトウェアと、
複数の設定出力音声と、前記ソフトウェアが実行可能な複数の動作とが対応付けられた動作パターンテーブルと、
前記動作パターンテーブルを参照して、前記複数の動作のうちの、前記出力音声に一致する設定出力音声に応じた動作が実行されるように、前記ソフトウェアの制御を行う音声認識部と
を具備する音声通信装置。 - 音声通信を行うコンピュータを用いる方法であって、
マイクから音声を入力する入力ステップと、
前記マイクの周辺に連続的に発生する音を表す周辺ノイズと、前記マイクの周辺に瞬時に発生する音を表すパルスノイズとを前記音声から除去するノイズ除去ステップと
を具備する音声通信方法。 - 請求項9に記載の音声通信方法において、
前記入力ステップは、
前記マイクから入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す音声データを出力し、
前記ノイズ除去ステップは、
前記音声データから、前記周辺ノイズを除去するための閾値である周辺ノイズ閾値データと、前記パルスノイズを除去するための閾値であるパルスノイズ閾値データとを減算する
音声通信方法。 - 請求項10に記載の音声通信方法において、
前記入力ステップは、
前記マイクから入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す前記音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力するサンプリングステップ
を具備し、
前記ノイズ除去ステップは、
前記周辺ノイズ閾値データである周辺ノイズ閾値データLを予め保持し、
重み付けデータ列{Po(i)|Po(i)=Po(1)、Po(2)、Po(3)、…、Po(n)}を出力する重み付けデータ出力ステップと、ここで、前記重み付けデータ列{Po(i)}が示すn個の重み付けデータは、0<Po(i)<1により表され、n番目から1番目までこの順で小さくなる係数であり、
を具備する音声通信方法。 - 請求項10に記載の音声通信方法において、
前記入力ステップは、
前記マイクから入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す前記音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力するサンプリングステップ
を具備し、
前記ノイズ除去ステップは、
重み付けデータ列{Po(i)|Po(i)=Po(1)、Po(2)、Po(3)、…、Po(n)}を出力する重み付けデータ出力ステップと、ここで、前記重み付けデータ列{Po(i)}が示すn個の重み付けデータは、0<Po(i)<1により表され、n番目から1番目までこの順で小さくなる係数であり、
前記周辺ノイズ閾値データである周辺ノイズ閾値データLを予め保持し、
を具備する音声通信方法。 - 請求項10に記載の音声通信方法において、
前記入力ステップは、
前記マイクから入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す前記音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力するサンプリングステップ
を具備し、
前記ノイズ除去ステップは、
前記周辺ノイズ閾値データである周辺ノイズ閾値データLを予め保持し、
前記周辺ノイズ除去音声データ列{DL(i)}が示すn個の周辺ノイズ除去音声データのうちの、m個の周辺ノイズ除去音声データを選択する選択ステップと、ここで、前記m個の周辺ノイズ除去音声データは0<m<nを満たす整数であり、前記m個の周辺ノイズ除去音声データのうちの1つは、前記n個の周辺ノイズ除去音声データのうちのn番目の周辺ノイズ除去音声データDL(n)を含み、
前記m個の周辺ノイズ除去音声データの和をmで除算して、前記パルスノイズ閾値データであるパルスノイズ閾値データPを生成する閾値データ生成ステップと、
を具備する音声通信方法。 - 請求項10に記載の音声通信方法において、
前記入力ステップは、
前記マイクから入力される前記音声を所定の周期でサンプリングし、サンプリング時の前記音声を示す前記音声データである音声データ列{D(i)|D(i)=D(1)、D(2)、D(3)、…、D(n)}(nは2以上の整数)を順次に出力するサンプリングステップ
を具備し、
前記ノイズ除去ステップは、
前記音声データ列{D(i)}が示すn個の音声データのうちの、m個の音声データを選択する選択ステップと、ここで、前記m個の音声データは0<m<nを満たす整数であり、前記m個の音声データのうちの1つは、前記n個の音声データのうちのn番目の音声データD(n)を含み、
前記m個の音声データの和をmで除算して、前記パルスノイズ閾値データであるパルスノイズ閾値データPを生成する閾値データ生成ステップと、
前記周辺ノイズ閾値データである周辺ノイズ閾値データLを予め保持し、
を具備する音声通信方法。 - 請求項11〜14のいずれかに記載の音声通信方法において、
更に、
前記出力音声の音量と、前記出力音声の大きさを判断するための設定音量とを比較する音量比較ステップと、
前記出力音声の音量と前記設定音量との比較結果に基づいて前記出力音声の音量を調整する音量調整ステップと、
前記出力音声の音量を所定の増幅率により増幅して出力する音量増幅ステップと
を具備し、
前記音量調整ステップは、
前記出力音声の音量が前記設定音量よりも大きい場合、前記出力音声の音量から、前記出力音声の音量と前記設定音量との差分を減算し、
前記出力音声の音量が前記設定音量よりも小さい場合、前記出力音声の音量に、前記出力音声の音量と前記設定音量との差分を加算する
音声通信方法。 - 請求項15に記載の音声通信方法において、
更に、
複数の設定出力音声と、ソフトウェアが実行可能な複数の動作とが対応付けられた動作パターンテーブルを参照して、前記複数の動作のうちの、前記出力音声に一致する設定出力音声に応じた動作が実行されるように、前記ソフトウェアの制御を行う音声認識ステップ
を具備する音声通信方法。 - 請求項9〜16のいずれかに記載の音声通信方法の各ステップを前記コンピュータに実行させるコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005338767A JP4527654B2 (ja) | 2005-11-24 | 2005-11-24 | 音声通信装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005338767A JP4527654B2 (ja) | 2005-11-24 | 2005-11-24 | 音声通信装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007147736A true JP2007147736A (ja) | 2007-06-14 |
JP4527654B2 JP4527654B2 (ja) | 2010-08-18 |
Family
ID=38209249
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005338767A Active JP4527654B2 (ja) | 2005-11-24 | 2005-11-24 | 音声通信装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4527654B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008216359A (ja) * | 2007-02-28 | 2008-09-18 | Sanyo Electric Co Ltd | 雑音抑圧装置、受信装置 |
US10362394B2 (en) | 2015-06-30 | 2019-07-23 | Arthur Woodrow | Personalized audio experience management and architecture for use in group audio communication |
JP2021179639A (ja) * | 2019-11-12 | 2021-11-18 | ティ・アイ・エル株式会社 | 音声認識装置、管理システム、管理プログラム及び音声認識方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH029286A (ja) * | 1988-06-28 | 1990-01-12 | Nec Home Electron Ltd | 複合映像信号のy/c分離装置 |
JPH04238399A (ja) * | 1991-01-22 | 1992-08-26 | Ricoh Co Ltd | 音声認識装置 |
JPH04245300A (ja) * | 1991-01-30 | 1992-09-01 | Nec Corp | 雑音除去装置 |
JPH05119794A (ja) * | 1991-10-25 | 1993-05-18 | Matsushita Electric Ind Co Ltd | 収音装置 |
JPH09326844A (ja) * | 1996-06-03 | 1997-12-16 | Mitsubishi Electric Corp | 騒音低減通話装置及び騒音低減通話方法 |
JP2000321080A (ja) * | 1999-05-13 | 2000-11-24 | Denso Corp | 雑音抑圧装置,音声認識装置及び車両用ナビゲーション装置 |
JP2002258897A (ja) * | 2001-02-27 | 2002-09-11 | Fujitsu Ltd | 雑音抑圧装置 |
JP2002537586A (ja) * | 1999-02-18 | 2002-11-05 | アンドレア エレクトロニクス コーポレイション | 雑音を消去するためのシステム、方法及び装置 |
JP2003280686A (ja) * | 2002-03-15 | 2003-10-02 | Internatl Business Mach Corp <Ibm> | 音声認識装置、その音声認識方法及びプログラム |
-
2005
- 2005-11-24 JP JP2005338767A patent/JP4527654B2/ja active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH029286A (ja) * | 1988-06-28 | 1990-01-12 | Nec Home Electron Ltd | 複合映像信号のy/c分離装置 |
JPH04238399A (ja) * | 1991-01-22 | 1992-08-26 | Ricoh Co Ltd | 音声認識装置 |
JPH04245300A (ja) * | 1991-01-30 | 1992-09-01 | Nec Corp | 雑音除去装置 |
JPH05119794A (ja) * | 1991-10-25 | 1993-05-18 | Matsushita Electric Ind Co Ltd | 収音装置 |
JPH09326844A (ja) * | 1996-06-03 | 1997-12-16 | Mitsubishi Electric Corp | 騒音低減通話装置及び騒音低減通話方法 |
JP2002537586A (ja) * | 1999-02-18 | 2002-11-05 | アンドレア エレクトロニクス コーポレイション | 雑音を消去するためのシステム、方法及び装置 |
JP2000321080A (ja) * | 1999-05-13 | 2000-11-24 | Denso Corp | 雑音抑圧装置,音声認識装置及び車両用ナビゲーション装置 |
JP2002258897A (ja) * | 2001-02-27 | 2002-09-11 | Fujitsu Ltd | 雑音抑圧装置 |
JP2003280686A (ja) * | 2002-03-15 | 2003-10-02 | Internatl Business Mach Corp <Ibm> | 音声認識装置、その音声認識方法及びプログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008216359A (ja) * | 2007-02-28 | 2008-09-18 | Sanyo Electric Co Ltd | 雑音抑圧装置、受信装置 |
US10362394B2 (en) | 2015-06-30 | 2019-07-23 | Arthur Woodrow | Personalized audio experience management and architecture for use in group audio communication |
JP2021179639A (ja) * | 2019-11-12 | 2021-11-18 | ティ・アイ・エル株式会社 | 音声認識装置、管理システム、管理プログラム及び音声認識方法 |
JP7288701B2 (ja) | 2019-11-12 | 2023-06-08 | ティ・アイ・エル株式会社 | 音声認識装置 |
Also Published As
Publication number | Publication date |
---|---|
JP4527654B2 (ja) | 2010-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110473567B (zh) | 基于深度神经网络的音频处理方法、装置及存储介质 | |
EP2081405B1 (en) | A hearing aid adapted to a specific type of voice in an acoustical environment, a method and use | |
JP5644359B2 (ja) | 音声処理装置 | |
EP3441969B1 (en) | Synthetic speech for in vehicle communication | |
US20030185411A1 (en) | Single channel sound separation | |
EP2265039B1 (en) | Hearing aid | |
JP2003520469A (ja) | 雑音低減装置及び方法 | |
US9343073B1 (en) | Robust noise suppression system in adverse echo conditions | |
US20220329953A1 (en) | Hearing device with end-to-end neural network | |
EP1913591B1 (en) | Enhancement of speech intelligibility in a mobile communication device by controlling the operation of a vibrator in dependance of the background noise | |
CN114664322A (zh) | 基于蓝牙耳机芯片的单麦克风助听降噪方法及蓝牙耳机 | |
JP4527654B2 (ja) | 音声通信装置 | |
JP2007251354A (ja) | マイクロホン、音声生成方法 | |
JP2007241157A (ja) | 雑音除去機能を有する音声入力装置および方法 | |
JP2007116585A (ja) | ノイズキャンセル装置およびノイズキャンセル方法 | |
JP2015136105A (ja) | フィードバック抑制 | |
KR20150096090A (ko) | 두 개의 마이크로폰을 포함하는 통신장치에서의 잡음제거방법 및 장치 | |
JP5188558B2 (ja) | 音声処理装置 | |
JP5249431B2 (ja) | 信号経路を分離する方法及び電気喉頭を使用して音声を改良するための使用方法 | |
JPH09311696A (ja) | 自動利得調整装置 | |
JP5359744B2 (ja) | 音処理装置及びプログラム | |
RU2589298C1 (ru) | Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке | |
CN114501211A (zh) | 具有丽音通透性的主动降噪电路、方法、设备及存储介质 | |
JP2011002535A (ja) | 音声対話システム、音声対話方法、及びプログラム | |
JP2006126841A (ja) | 周期信号増強システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090924 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091001 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100512 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100603 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130611 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4527654 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |