JP4540600B2 - 音声検出装置および音声検出方法 - Google Patents

音声検出装置および音声検出方法 Download PDF

Info

Publication number
JP4540600B2
JP4540600B2 JP2005366767A JP2005366767A JP4540600B2 JP 4540600 B2 JP4540600 B2 JP 4540600B2 JP 2005366767 A JP2005366767 A JP 2005366767A JP 2005366767 A JP2005366767 A JP 2005366767A JP 4540600 B2 JP4540600 B2 JP 4540600B2
Authority
JP
Japan
Prior art keywords
sound
voice
notification sound
input
response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005366767A
Other languages
English (en)
Other versions
JP2007174088A (ja
Inventor
均 佐々木
理香 西池
千晴 河合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005366767A priority Critical patent/JP4540600B2/ja
Publication of JP2007174088A publication Critical patent/JP2007174088A/ja
Application granted granted Critical
Publication of JP4540600B2 publication Critical patent/JP4540600B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephone Function (AREA)

Description

この発明は、報知音が鳴動している環境において、利用者による応答音声を検出する音声検出装置および音声検出方法に関する。
従来、音声によって着信の応答を行う電話や、音声によって報知中のアラームを停止させるような装置には、音声を検出するための音声検出装置が備えられている。通常、着信音が鳴動中に、電話に内蔵された音声検出装置によって音声による応答(例えば、「ハーイ」など)を検出する際には、スピーカから出力される着信音がマイクへ混入していまい、音響結合が生じ、音声検出の妨害になる。そこで着信音を適応フィルタで構成されたエコーキャンセラで除去する技術が知られている(例えば、下記特許文献1,2参照。)。
図11は、従来の音声検出装置の構成を示す説明図である。図11に示すように、音声検出装置1000は、マイク1001と、適応フィルタ1002と、オフフック音声検出部1003と、切り替えパス1004と、着信音生成部1005と、送受信部1006と、回線接続部1007と、スピーカ1008と、から構成されている。音声検出装置1000は、回線接続部1007を介して送受信部1006が着信を検出すると、着信音生成部1005により着信音を生成する。同時に、切り替えパス1004を、着信音生成部1005側に接続して、スピーカ1008から着信音を出力する。出力した着信音は、音響結合によりマイク1001へ入力されるので、適応フィルタ1002を用いて、入力音から回り込んだ着信音の成分を除去・低減させる。
適応フィルタ1002により着信音の成分が除去・低減された入力音が入力された、オフフック音声検出部1003は、入力音に応じて応答音声を検出する。ここで、応答音声が検出されると、切り替えパス1004を送受信部1006側に切り替えて、受話音をスピーカ1008に出力させる。また、受話音の出力と同時に、着信音生成部1005による着信音の生成を停止し、利用者は、通話を開始する。
特開平4−287549号公報 特開2003−8729号公報
しかしながら、上記の特許文献1,2の技術で利用されているような、出力音のエコー成分のみをキャンセルする適応フィルタでは、音響結合特性の時間変化や、スピーカの非線形特性などの影響に対応して、着信音を完全に除去することは難しい。着信音の消し残があると、応答音声を検出する際の妨害となり、正確に応答音声を検出できないという問題があった。
この発明は、上述した従来技術による問題点を解消するため、利用者による応答音声を確実に検出することができる音声検出装置および音声検出方法を提供することを目的とする。
上述した課題を解決し、目的を達成するため、本発明にかかる音声検出装置は、利用者への通知音を出力する通知音出力手段と、前記通知音に対する前記利用者の応答音声と、当該応答音声とともに混入される前記通知音出力手段により出力された前記通知音と、を入力音として取得する入力音取得手段と、前記通知音出力手段により出力した前記通知音の周波数に応じた減衰特性を有して、前記入力音取得手段により取得した前記入力音を減衰させる減衰手段と、前記減衰手段を透過した前記入力音を用いて前記応答音声を検出する音声検出手段と、を備え、前記音声検出手段が、前記応答音声以外の音声を検出した場合に、前記通知音出力手段は、前記通知音の音量を下げることを特徴とする。
この発明によれば、減衰手段は、通知音の出力にあわせて、通知音と同じ音を除去するように減衰特性が変化する。このような減衰手段に入力音を透過させて、入力音に混入した通知音を取り除くことができる。したがって、音声検出手段は、応答音声のみで構成された入力音を用いて応答音声を検出することができる。また、応答音声以外の音声を検出するまでは十分な音量で通知音を鳴動させて利用者の注意を促すとともに、応答音声以外の音声を抽出すると通知音の音量を下げて応答音声を正確に検出することができる。
本発明によれば、通知音の入り込みなどの妨害要因に影響されることなく、正確に応答音声を検出できるという効果を奏する。
以下に添付図面を参照して、この発明にかかる音声検出装置および音声検出方法の好適な実施の形態を詳細に説明する。以下に説明する実施の形態1〜3では、電話機に内蔵した音声検出装置について説明する。
この音声検出装置は、着信を検出すると、利用者への通知音として着信音を生成し、スピーカから出力する。すると、利用者は、着信音に応答し、声で返事をする。この返事が、いわゆる応答音声であり、音声検出装置は、この応答音声を検出して、利用者の応答を確認する。応答が確認できると、スピーカから通話相手の受話音が出力されるように切り替え、通話を開始する(オフフック応答)。
(実施の形態1)
実施の形態1では、マイクに入力される利用者の応答音声と、応答音声とともに混入する着信音のうち、フィルタを用いて、着信音のみを削除する。したがって、音声検出に用いる音声には、余分な音が含まれておらず、正確に検出することができる。
特に、出力した着信音が単音や、少ない和音で構成されている場合は、周波数特性の狭い帯域に出力レベルの高い音が集中している。したがって、ノッチフィルタやコム(櫛型)フィルタを用いることによって、着信音の除去が容易となり、応答音声の検出の精度を高めることができる。
図1は、本発明の実施の形態1にかかる音声検出装置の構成を示す説明図である。図1に示す音声検出装置100は、入力音取得手段としてのマイク101と、適応フィルタ102と、減衰手段としてのノッチフィルタ103と、音声検出手段としてのオフフック音声検出部104と、着信音生成部105と、送受信部106と、回線接続部107と、通知音出力手段としてのスピーカ108と、切り替えパス109と、から構成される。
マイク101は、音声検出装置100の周辺の音を取得して入力音として、適応フィルタ102へ出力する。音声検出装置100の周辺の音とは、具体的には、利用者による応答音声と、音声検出装置100のスピーカ108から出力された着信音が回り込んだ音を指す。また、利用者が着信に応答すると、マイク101には、利用者の通話音声(送話音)が入力される。
適応フィルタ102は、マイク101から入力された入力音のエコー成分を除去する。
エコー成分を除去された入力音は、ノッチフィルタ103と、送受信部106へ、それぞれ入力される。適応フィルタ102の具体例としては、エコーキャンセルフィルタを利用する。エコーキャンセルフィルタは、応答音声や着信音がマイク101に拾われてエコーやハウリングを起こすのを防止するフィルタである。
ノッチフィルタ103は、適応フィルタ102から入力された入力音を、着信音生成部105から入力された着信音の音階情報に対応して、基本周波数の音を除去するように帯域ごとの減衰量を設定する。また、ノッチフィルタ103に替わり、櫛形の減衰特性をもつコムフィルタを用いてもよい。コムフィルタは、減衰するように設定した帯域の倍数帯域の音も除去・低減する機能をもったフィルタである。また、ノッチフィルタ(コムフィルタ)103による入力音の除去・低減の度合は、音響結合特性の強度に応じて変化させてもよい。具体的には、音響結合が弱い帯域では元々エコーも弱いので、軽く低減する、もしくは、低減しないように設定してもよい。
オフフック音声検出部104は、ノッチフィルタ103から入力された入力音を用いて、所定の音声を検出する。この所定の音声とは、具体的には、「ハーイ」などの、利用者の応答音声である。オフフック音声検出部104には、応答音声の周波数に応じたパターンが設定されている。入力音が設定されたパターンと同じ波形の音であれば、応答音声を検出したと判断する。オフフック音声検出部104の検出結果は、着信音生成部105と、切り替えパス109とに入力される。
また、オフフック音声検出部104で検出される応答音声のパターンは、「ハーイ」という音声を示す波形のなかから、性別や年齢を問わない共通部分の波形を用いている。したがって、音声検出装置100の近くにいる人は、誰でも利用者として応答することができる。このような利用方法の他にも、携帯電話機に組み込まれた音声検出装置など、限定された利用者が利用する、もしくは他の人には利用できないようにしたい場合は、オフフック音声検出部104の音声検出のパターンを利用者ごとに登録してもよい。
着信音生成部105は、送受信部106によって着信が検出されると、利用者に着信を通知するための着信音を生成する。生成した着信音は、切り替えパス109を経由して、スピーカ108へ出力される。また、着信音生成部105は、生成した着信音の音階の情報をノッチフィルタ(コムフィルタ)103へ出力する。なお、着信音生成の動作制御は、オフフック音声検出部104から入力された検出結果に応じて行われる。
送受信部106は、マイク101から入力された利用者の送話音を通信用の信号に変換して回線接続部107に出力する。また、回線接続部107を介して着信を検出し着信音生成部105に着信音生成の指示を行う。また、オフフック音声検出部104によって利用者による応答音声を検出されると、回線接続部107から通話相手からの受話音の信号を受信する。受信した受話音の信号は、音声に変換して、スピーカ108に出力する。
回線接続部107は、電話回線と接続して他の電話機と通話するための接続を行う。なお、回線接続部107が接続する電話回線とは、有線、無線を問わない。さらに、IP(Internet Protocol)電話であれば、インターネット網に接続してもよい。また、回線接続部107は、音声検出装置100の構成として必須な機能部ではなく、電話回線に接続して同様の機能を実現する外部の装置や、接続環境に代替してもよい。
スピーカ108は、切り替えパス109の切り替えに応じて、着信音もしくは受話音を出力音として出力する。スピーカ108から出力される出力音の一部は、エコーとしてマイク101に入力される。
切り替えパス109は、音声検出装置100の着信応答にあわせて、スピーカ108から出力させる出力音を切り替える。具体的には、利用者に対して着信を通知する際には、着信音生成部105に接続して、出力音として着信音をスピーカ108から出力させる。また、利用者が着信に応答して通話を開始する際には、送受信部106に接続して、出力音として回線接続部107から受信した受話音をスピーカ108から出力させる。
続いて、音声検出装置100のノッチフィルタ(コムフィルタ)103の透過特性について説明する。まず、音声検出装置100へ入力される入力音が、同様な音であるかを説明する。図2−1は、音声検出装置に入力される入力音の波形を説明する図表である。
図2−1に示す図表200は、横軸が周波数を表し、縦軸が着信音の出力レベル(power)を表すことによって、着信音の波形を示す。また、図表210は、横軸が周波数を表し、縦軸が着信音のエコーの出力レベル(power)を表すことによって、着信音のエコーの波形を示す。また、図表220は、横軸が周波数を表し、縦軸が応答音声の出力レベル(power)を表すことによって、利用者による応答音声の波形を示す。さらに、図表230は、横軸が周波数を表し、縦軸が入力音の出力レベル(power)を表すことによって、マイク101への入力音を示す。
図表200の波形201は、着信音の音種として正弦波を用いた場合の、ある時刻での着信音の周波数特性を表す正弦波である。着信音生成部105で生成される着信音は、波形201のような正弦波の周波数特性が音符情報にあわせて時間変化する。この波形201の着信音が音響結合してマイク101に回り込んだエコーが、波形211のような周波数特性を表す正弦波となる。音響結合特性は装置や外部状況によって多少の変化は生じるが、ピークの周波数はほとんど変化しない。
一方、利用者からの応答音声は、図表220に示した波形221のような周波数特性をもつ。したがって、オフフック音声検出部104では、波形221のような波形の入力音が入力されると、応答音声として検出する。しかしながら、実施の入力音は、図表210に示した波形211のエコーが含まれている。つまり、図表230に示した、波形231のような周波数特性をもった音声がマイク101に入力音として入力されている。波形231は、着信音のエコーの波形211と、応答音声の波形221とが重なり合った周波数特性をもつ。つまり、波形231のような入力音をそのままオフフック音声検出部104に入力しても、応答音声として検出するのは難しい。
そこで、着信音のエコー対策として、本発明では、入力音からエコーの波形のみを取り除くようなノッチフィルタ103を用いる。図2−2は、ノッチフィルタの特性と、入力音への影響を説明する図表である。図2−2に示す図表240は、横軸が周波数を表し、縦軸がフィルタ透過後の利得(gain)を表すことによって、ノッチフィルタ103の減衰特性を示す。また、図表250は、横軸が周波数を表し、縦軸がノッチフィルタ103を透過した入力音の出力レベル(power)を表すことによって、ノッチフィルタ103を透過した入力音の波形を示す。
図表240に示した波形241は、ノッチフィルタ103の減衰特性を表す。波形241は、図2−1に示した着信音のエコーを表す波形211のピーク部分が最も減衰するよう、着信音の波形に応じて設定されている。したがって、ノッチフィルタ103を透過した入力音は図表250に示した波形251のようにエコー成分を削除され、応答音声の検出が容易となる。
続いて、コムフィルタ103について説明する。図3は、着信音波形と対応するコムフィルタの特性を説明する図表である。図3に示す図表310は、横軸が周波数を表し、縦軸が着信音の出力レベル(power)を表すことによって、三角波の着信音の波形を示す。また、図表320は、横軸が周波数を表し、縦軸がフィルタ透過後の利得(gain)を表すことによって、コムフィルタの減衰特性を示す。図表310に示したような三角波による着信音の波形311は、基本周波数と3倍波、5倍波など奇数倍の成分で形成されている。
したがって、着信音を取り除くコムフィルタ103は、図表320に示した奇数倍の周波数の音声を削除するような減衰特性を示す波形321を有したフィルタを使用する。このコムフィルタ103により入力音に含まれている通知音のエコーを削減することによって、オフフック音声検出部104による応答音声の検出が容易となる。なお、正弦波の場合と同様、除去する帯域は通知音の変化に伴って通知音の各ピークを削除できる帯域に変更して、通知音のエコーが残らないようにする。
つぎに、本発明の実施の形態1にかかる音声検出装置の処理の内容を説明する。図4は、本発明の実施の形態1にかかる音声検出装置の処理の内容を示すフローチャートである。図4に示したフローチャートでは、まず、回線接続部107により、着信を検出したか否かを判断する(ステップS401)。ここで、着信を検出するまで待ち(ステップS401:Noのループ)、検出した場合は(ステップS401:Yes)、続いて、着信音生成部105により、着信音の生成を開始する(ステップS402)。
続いて、同じく着信音生成部105により、ステップS402で生成した着信音の音階・音調を読み出す(ステップS403)。このステップS403の処理は、1音ごとの処理である。つぎに、ノッチフィルタ103により、コムフィルタ103の係数設定を行う(ステップS404)。なお、すでにステップS404の処理が行われ、コムフィルタ103の係数が設定されている場合は、設定した係数を変更する処理に替わる。
コムフィルタ103の係数設定が終了すると、続いて、スピーカ108により、着信音の鳴動を開始する(ステップS405)。このステップS405の処理も、すでに、着信音が鳴動している場合は、着信音のメロディに応じて音階を変更し、鳴動を継続する。
続いて、オフフック音声検出部104により、マイク101から入力された、外部の音声情報からオフフック応答音声を検出したか否かを判断する(ステップS406)。オフフック応答音声を検出した場合は(ステップS406:Yes)は、着信音の鳴動を停止し、通話を開始して(ステップS407)、一連の処理を終了する。
ステップS406によって、オフフック応答音声を検出しなかった場合は(ステップS406:No)、続いて、現在の着信音の鳴動が終了したか否かを判断する(ステップS408)。現在の着信音とは、着信音生成部105によって生成された着信音のメロディを構成する1音を意味する。これらの1音が連続して鳴動することによって、着信音はメロディを構成している。
ステップS408によって、現在の着信音の鳴動が終了したと判断された場合は(ステップS408:Yes)、ステップS403の処理に戻り、つぎの着信音を鳴動させるための処理に移る。また、ステップS408によって、現在の着信音の鳴動が終了していないと判断された場合は(ステップS408:No)、引き続き、音階・音調の同じ着信音を鳴動させ、ステップS406の処理に戻る。以上の処理は、オフフック応答音声が検出されるか、着信が終了するまで継続される。
(タイマー機能に適応した音声検出装置)
また、本発明にかかる音声検出装置は、電話機だけでなく、他の応答音声を用いて操作を行う他の装置についても活用することができる。図5は、タイマー機能に適応した音声検出装置の構成を示す説明図である。
図5に示す音声検出装置500は、タイマーに応じて鳴動した通知音や、警告音を、音声応答を検出して停止させるような使用を想定している。音声検出装置500は、マイク101と、ノッチフィルタ103と、スピーカ108と、停止命令音声検出部501と、時刻管理部502と、ボタン入力部503と、メロディ生成部504と、から構成される。
マイク101と、ノッチフィルタ103とおよびスピーカ108は、音声検出装置100の機能と同じであるため説明を省略する。停止命令音声検出部501は、ノッチフィルタ103から入力されたエコーを取り除かれた入力音から、停止命令に対応する音声を検出する。検出結果つまり、停止情報は、時刻管理部502へ入力される。
時刻管理部502は、ボタン入力部503からの入力情報に応じてメロディを出力するタイマー時刻を設定する。また、時刻管理部502は停止命令音声検出部501から入力された停止情報に応じてメロディ生成部504への鳴動停止制御を行う。
ボタン入力部503は、利用者によるタイマー設定の入力が行われる。入力情報は、時刻管理部502へ入力される。メロディ生成部504は、時刻管理部502からの鳴動停止制御に応じてメロディを生成する。生成したメロディは、スピーカ108へ出力される。また、メロディ生成部504からはノッチフィルタ103へ音階情報を出力する。ノッチフィルタ103は、音階情報に応じて減衰特性を変化させる。
音声検出装置500は、利用者によるタイマー設定に応じて、メロディ生成部504によって生成したメロディをスピーカ108から出力する。メロディ生成部504で生成される通知音や、警告音のメロディは、狭帯域の信号のため、エコーキャンセルフィルタとしての適応フィルタ102が不要な構成となっている。
以上説明したように実施の形態1では、ノッチフィルタ(コムフィルタ)103は、通知音の出力にあわせて、通知音と同じ音を除去するように減衰特性が変化する。このようなノッチフィルタ(コムフィルタ)103に入力音を透過させることによって、入力音に混入した着信音を取り除くことができる。したがって、オフフック音声検出部104は、応答音声のみで構成された入力音を用いて応答音声を検出することができる。
ことができる。
(実施の形態2)
実施の形態2では、応答音声を検出する際に、あらかじめ着信音が混入することを想定して検出を行う。つまり、フィルタを用いて着信音のエコーを取り除くのではなく、応答音声として検出する音声の波形に着信音のエコーを上乗せした波形を検出する。
図6は、本発明の実施の形態2にかかる音声検出装置の構成を示す説明図である。図6に示す音声検出装置600は、実施の形態1の音声検出装置100からノッチフィルタ(コムフィルタ)103を除いた構成であり、オフフック音声検出部104は、実施の形態1とは異なる処理を行う。以下、オフフック音声検出部104の処理について説明し、他の構成は、音声検出装置100と同じ符号を付けて説明を省略する。
オフフック音声検出部104は、適応フィルタ102から入力された入力音を周波数パターン(応答音声の波形)照合して、応答音声を検出する。この、周波数パターンとは、事前登録した、応答音声の周波数パターンに着信音の周波数パターンを重ね合わせた(加算・重畳)周波数パターンである。なお、事前に測定した音響結合特性を加味するとさらに、応答音声の検出の精度が上がる。
また、実施の形態2の音声検出装置600では、オフフック音声検出部104による音声検出中に、適応フィルタ102におけるエコー低減を停止することも考えられる。これは、着信音の周波数パターンの考慮が十分に行われていれば、必ずしも着信音を除去しなくても応答音声の検出が可能となるためである。この場合、オフフック応答後のハンズフリー通話に備えて、適応フィルタ102の係数を適応設定するとよい。
つぎに、本発明の実施の形態2にかかる音声検出装置の処理の内容を説明する。図7は、本発明の実施の形態2にかかる音声検出装置の処理の内容を示すフローチャートである。図7に示したフローチャートでは、まず、回線接続部107により、着信を検出したか否かを判断する(ステップS701)。ここで、着信を検出するまで待ち(ステップS701:Noのループ)、検出した場合は(ステップS701:Yes)、続いて、着信音生成部105により、着信音の生成を開始する(ステップS702)。
続いて、同じく着信音生成部105により、ステップS702で生成した着信音の音階・音調を読み出す(ステップS703)。このステップS703の処理は、1音ごとの処理である。続いて、音声検出用の照合パターンを読み出し(ステップS704)、着信音の鳴動を開始する(ステップS705)。ここでも、すでに着信音の鳴動が開始されている場合は、ステップS703によって読み出した情報に応じて音階を変更する。
ステップS705の処理が終了すると、つぎに、オフフック音声検出部104により、マイク101から入力された、外部の音声情報からオフフック応答音声を検出したか否かを判断する(ステップS706)。オフフック応答音声を検出した場合は(ステップS706:Yes)は、着信音の鳴動を停止し、通話を開始して(ステップS707)、一連の処理を終了する。
ステップS706によって、オフフック応答音声を検出しなかった場合は(ステップS706:No)、続いて、現在の着信音の鳴動が終了したか否かを判断する(ステップS708)。現在の着信音とは、着信音生成部105によって生成された着信音のメロディを構成する1音を意味する。これらの1音が連続して鳴動することによって、着信音はメロディを構成している。
ステップS708によって、現在の着信音の鳴動が終了したと判断された場合は(ステップS708:Yes)、ステップS703の処理に戻り、つぎの着信音を鳴動させるための処理に移る。また、ステップS708によって、現在の着信音の鳴動が終了していないと判断された場合は(ステップS708:No)、引き続き、音階・音調の同じ着信音を鳴動させ、ステップS706の処理に戻る。以上の処理は、オフフック応答音声が検出されるか、着信が終了するまで継続される。
以上説明したように実施の形態2では、音声検出装置600のマイク101によって取得した入力音に着信音が混入するのを考慮して、オフフック音声検出部104では、応答音声として、利用者の応答音声に着信音を重ねた音声を検出するようになっている。したがって、着信音の混入に妨げられることなく応答音声を検出することができる。
(実施の形態3)
実施の形態3では、誤検出のリスクをさらに低減するために、音声応答を検出し始めた場合、つまり応答音声か否かが判別できない場合は、ノッチフィルタ(コムフィルタ)103による着信音を除去し易いように処理を行う。
応答音声を検出し易くする方法としては、以下の3つの方法を用いると効果的である。まず、1つめには、着信音の音量を下げる。2つめには、着信音を周波数の帯域の狭い音に変更する。3つめに、着信音を構成する和音数を減少する。
つぎに、本発明の実施の形態3にかかる音声検出装置の処理の内容を説明する。図8は、本発明の実施の形態3にかかる音声検出装置の構成を示す説明図である。図8に示す音声検出装置800は、実施の形態1に示した音声検出装置100と、同じ構成であるが、ノッチフィルタ(コムフィルタ)103およびオフフック音声検出部104の処理の内容が異なっている。以下、音声検出装置100の処理と異なる部分について説明する。
ノッチフィルタ103は、着信音の変化の情報も加味してフィルタの減衰特性を調整する。オフフック音声検出部104は、ノッチフィルタ103から入力された入力音を用いて応答音声する際に、応答音声を検出したか否かの判断の他に、応答音声以外の音声を検出したか否を判断する。オフフック音声らしい応答音声以外の音声を検出した場合には、着信音生成部105に対して、低音量または狭帯域の信号に変化させる指令を出す。着信音生成部105は、低音量または狭帯域の信号に変化させると同時に、ノッチフィルタ103に出力する音階の情報に信号変化の情報も付加する。
図9は、本発明の実施の形態3にかかる音声検出装置の処理の内容を示すフローチャートである。図9のフローチャートにおいて、まず、回線接続部107により、着信を検出したか否かを判断する(ステップS901)。ここで、着信を検出するまで待ち(ステップS901:Noのループ)、検出した場合は(ステップS901:Yes)、続いて、着信音生成部105により、着信音の生成を開始する(ステップS902)。
続いて、同じく着信音生成部105により、ステップS902で生成した着信音の音階・音調・音量を読み出し、設定する(ステップS903)。このステップS903の処理は、1音ごとの処理である。つぎに、コムフィルタ103により、コムフィルタ103の係数設定を行う(ステップS904)。なお、すでにステップS904の処理が行われ、コムフィルタ103の係数が設定されている場合は、設定した係数を変更する処理に替わる。
コムフィルタ103の係数設定が終了すると、続いて、スピーカ108により、着信音の鳴動を開始する(ステップS905)。このステップS905の処理も、すでに、着信音が鳴動している場合は、着信音のメロディに応じて音階・音調・音量を変更し、鳴動を継続する。
続いて、オフフック音声検出部104によって音声を検出したか否かを判断する(ステップS906)。音声を検出した場合は(ステップS906:Yes)、つぎに、検出した音声がオフフック応答か否かを判断する(ステップS907)。ここで、検出した音声がオフフック応答である場合は(ステップS907:Yes)、着信音の鳴動を停止し、通話を開始し(ステップS908)、一連の処理を終了する。
ステップS906によって音声を検出していない場合は(ステップS906:No)、続いて、現在の着信音の鳴動が終了したか否かを判断する(ステップS909)。現在の着信音とは、実施の形態1,2と同様に、着信音生成部105によって生成された着信音のメロディを構成する1音を意味する。これらの1音が連続して鳴動することによって、着信音はメロディを構成している。
ステップS909によって、現在の着信音の鳴動が終了したと判断された場合は(ステップS909:Yes)、ステップS903の処理に戻り、つぎの着信音を鳴動させるための処理に移る。また、ステップS909によって、現在の着信音の鳴動が終了していないと判断された場合は(ステップS909:No)、引き続き、音階・音調の同じ着信音を鳴動させ、ステップS906の処理に戻る。以上の処理は、オフフック応答音声が検出されるか、着信が終了するまで継続される。
また、ステップS907において検出した音声がオフフック音声ではないと判断された場合は(ステップS907:No)、応答音声を確実に検出するために、オフフック音声検出部104から着信音生成部105へ着信量の音量を減衰するよう設定される(ステップS910)。つまり、オフフック音声検出部104から着信音生成部105へ着信音の音量設定を変更させるための指示が出力される。
ステップS910の処理が終了するとステップS903の処理に移行して、音量が小さくなった状態で、着信音の鳴動を継続する。なお、ステップ910の処理は、音量の減衰設定に限らず、着信音を周波数の帯域の狭い音に変更する、または、着信音を構成する和音数を減少するなどの処理を行ってもよい。
以上説明したように、実施の形態1の音声検出装置100では、マイク101に入力された音声が利用者の応答音声か、応答とは関係のない音声かを判別できない場合は、応答音声を検出できなかった。そこで、実施の形態3の音声検出装置800は、着信音以外の音を検出した場合には、オフフック音声検出部104が応答音声を検出し易いように、着信音を変化させる。したがって、確実に利用者の応答音声を検出することができる。
(和音に対応させた構成)
つぎに、上述した実施の形態1,実施の形態2の音声検出装置100,500,800で、特に和音の着信音を出力する場合のフィルタ構成について説明する。ノッチフィルタ103もしくはコムフィルタ103以下、A音、B音およびC音の3和音の着信音を出力する場合のコムフィルタ103の構成である。
図10は、和音に対応したフィルタ構成の一例を示すブロック図である。ここではコムフィルタ103は、A音対応のコムフィルタ103aと、B音対応のコムフィルタ103bと、C音対応のコムフィルタ103cと、から構成されている。A音対応のコムフィルタ103a、B音対応のコムフィルタ103bおよびC音対応のコムフィルタ103cは、従属接続されている。
上述した実施の形態1,3と同様にコムフィルタ103には、適応フィルタ102から入力音が入力される。入力音は、応答音声と、A音、B音およびC音の3和音によって構成された着信音の漏れ込み音とを含んでいる。入力音は、まず、A音対応のコムフィルタ103aへ入力され、A音の着信音のみが減衰される(取り除かれる)。続いて、入力音は、B音対応のコムフィルタ103bへ入力され、B音の着信音のみが減衰される。最後に、入力音は、C音対応のコムフィルタ103cへ入力され、C音の着信音のみが減衰される。したがって、コムフィルタ103からは、和音の着信音を取り除いた、応答音声のみを含む入力音が出力される。図10に示したフィルタ構成では、3音による和音に対応して3個のコムフィルタ103a〜103cを従属させたが、和音数の増加、減少に応じて、従属させるフィルタの数を変化させる。
また、図10に示したフィルタ構成は、和音への対応に限らず、着信音の残響時間が長く、音符の遷移時に1音前の音と1音後ろの音との両方のエコーが混入する場合にも適している。このような場合は、音符の遷移時に、1音前の音と1音後ろの音との両方音の帯域を除去するようにコムフィルタ103もしくはノッチフィルタ103を従属に接続するとよい。
また、実施の形態2のように、オフフック音声検出部104によって応答音声として検出するパターンを着信音にあわせて変化させる場合には、各和音の波形を重ね合わせた波形と、応答音声の波形とを重ね合わせたパターンを検出している。
以上説明したように、音声検出装置および音声検出方法によれば、通知音の入り込みなどの妨害要因に影響されることなく、正確に応答音声を検出できる。
なお、本実施の形態で説明した音声検出方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーションなどのコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVDなどのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネットなどのネットワークを介して配布することが可能な伝送媒体であってもよい。
(付記1)利用者への通知音を出力する通知音出力手段と、
前記通知音に対する前記利用者の応答音声と、当該応答音声とともに混入される前記通知音出力手段により出力された前記通知音と、を入力音として取得する入力音取得手段と、
前記通知音出力手段により出力した前記通知音の周波数に応じた減衰特性を有して、前記入力音取得手段により取得した前記入力音を減衰させる減衰手段と、
前記減衰手段を透過した前記入力音を用いて前記応答音声を検出する音声検出手段と、
を備えることを特徴とする音声検出装置。
(付記2)前記減衰手段は、前記通知音の出力レベルに比例した減衰量により、前記入力音を減衰することを特徴とする付記1に記載の音声検出装置。
(付記3)前記減衰手段は、前記通知音の音程の変化に応じて前記入力音を減衰することを特徴とする付記1または2に記載の音声検出装置。
(付記4)前記減衰手段の前記減衰特性は、さらに、前記通知音出力手段の出力特性と、前記入力音取得手段の入力特性とに応じて変化することを特徴とする付記1〜3のいずれか一つに記載の音声検出装置。
(付記5)前記音声検出手段が、前記応答音声以外の音声を検出した場合に、
前記通知音出力手段は、前記通知音の音量を下げることを特徴とする付記1〜4のいずれか一つに記載の音声検出装置。
(付記6)前記音声検出手段が、前記応答音声以外の音声を検出した場合に、
前記通知音出力手段は、前記通知音の周波数特性を変化させることを特徴とする付記1〜4のいずれか一つに記載の音声検出装置。
(付記7)前記音声検出手段が、前記応答音声以外の音声を検出した場合に、
前記通知音出力手段は、前記通知音の和音の数を減少させることを特徴とする付記1〜6のいずれか一つに記載の音声検出装置。
(付記8)前記減衰手段は、前記通知音の周波数の音を減衰するノッチフィルタであることを特徴とする付記1〜7のいずれか一つに記載の音声検出装置。
(付記9)前記減衰手段は、前記通知音の周波数の整数倍の音を減衰するコムフィルタであることを特徴とする付記1〜8のいずれか一つに記載の音声検出装置。
(付記10)前記報知音出力手段が出力する前記通知音が和音によって構成されている場合に、
前記減衰手段は、各和音に対応した複数の減衰手段を用意し、前記複数の減衰手段を従属接続することを特徴とする付記1〜9のいずれか一つに記載の音声検出装置。
(付記11)前記検出手段によって検出する前記応答音声は、あらかじめ登録した利用者の応答音声であることを特徴とする付記1〜10のいずれか一つに記載の音声検出装置。
(付記12)利用者への通知音を出力する通知音出力手段と、
前記通知音に対する前記利用者の応答音声と、当該応答音声とともに混入される前記通知音出力手段によって出力された前記通知音と、を入力音として取得する入力音取得手段と、
前記入力音を用いて、前記通知音と、前記応答音声とが重なり合った音声を検出する音声検出手段と、
を備えることを特徴とする音声検出装置。
(付記13)前記音声検出手段は、前記重なり合った音声をさらに、前記通知音出力手段の出力特性と、前記入力音取得手段の入力特性とを用いて調整した音声を検出することを特徴とする付記11に記載の音声検出装置。
(付記14)前記入力音取得手段の後段に、エコーキャンセルフィルタを備えることを特徴とする付記1〜13のいずれか一つに記載の音声検出装置。
(付記15)利用者への通知音を出力する通知音出力工程と、
前記通知音に対する前記利用者の応答音声と、当該応答音声とともに混入される前記通知音出力工程により出力された前記通知音と、を入力音として取得する入力音取得工程と、
前記通知音出力工程により出力した前記通知音の周波数に応じた減衰特性を有して、前記入力音取得工程により取得した前記入力音を減衰させる減衰工程と、
前記減衰工程によって減衰した前記入力音を用いて前記応答音声を検出する音声検出工程と、
を含むことを特徴とする音声検出方法。
(付記16)利用者への通知音を出力する通知音出力工程と、
前記通知音に対する前記利用者の応答音声と、当該応答音声とともに混入される前記通知音出力工程によって出力された前記通知音と、を入力音として取得する入力音取得工程と、
前記入力音を用いて、前記通知音と、前記応答音声とが重なり合った音声を検出する音声検出工程と、
を含むことを特徴とする音声検出方法。
以上のように、本発明にかかる音声検出装置および音声検出方法は、通知音鳴動下の音声による応答操作の検出に有用であり、特に、和音によって構成されている着信音を出力する電話や、タイマーに対する音声による応答の検出に適している。
本発明の実施の形態1にかかる音声検出装置の構成を示す説明図である。 音声検出装置に入力される入力音の波形を説明する図表である。 ノッチフィルタの特性と、入力音への影響を説明する図表である。 着信音波形と対応するコムフィルタの特性を説明する図表である。 本発明の実施の形態1にかかる音声検出装置の処理の内容を示すフローチャートである。 タイマー機能に適応した音声検出装置の構成を示す説明図である。 本発明の実施の形態2にかかる音声検出装置の構成を示す説明図である。 本発明の実施の形態2にかかる音声検出装置の処理の内容を示すフローチャートである。 本発明の実施の形態3にかかる音声検出装置の構成を示す説明図である。 本発明の実施の形態3にかかる音声検出装置の処理の内容を示すフローチャートである。 和音に対応したフィルタ構成の一例を示すブロック図である。 従来の音声検出装置の構成を示す説明図である。
符号の説明
100,500,600,800 音声検出装置
101 マイク
102 適応フィルタ
103 ノッチフィルタ
104 オフフック音声検出部
105 着信音生成部
106 送受信部
107 回線接続部
108 スピーカ
109 切り替えパス

Claims (8)

  1. 利用者への通知音を出力する通知音出力手段と、
    前記通知音に対する前記利用者の応答音声と、当該応答音声とともに混入される前記通知音出力手段により出力された前記通知音と、を入力音として取得する入力音取得手段と、
    前記通知音出力手段により出力した前記通知音の周波数に応じた減衰特性を有して、前記入力音取得手段により取得した前記入力音を減衰させる減衰手段と、
    前記減衰手段を透過した前記入力音を用いて前記応答音声を検出する音声検出手段と、
    を備え、
    前記音声検出手段が、前記応答音声以外の音声を検出した場合に、
    前記通知音出力手段は、前記通知音の音量を下げることを特徴とする音声検出装置。
  2. 前記減衰手段の前記減衰特性は、さらに、前記通知音出力手段の出力特性と、前記入力音取得手段の入力特性とに応じて変化することを特徴とする請求項1に記載の音声検出装置。
  3. 前記音声検出手段が、前記応答音声以外の音声を検出した場合に、
    前記通知音出力手段は、前記通知音の周波数特性を狭くすることを特徴とする請求項1または2に記載の音声検出装置。
  4. 前記音声検出手段が、前記応答音声以外の音声を検出した場合に、
    前記通知音出力手段は、前記通知音の和音の数を減少させることを特徴とする請求項1〜3のいずれか一つに記載の音声検出装置。
  5. 前記減衰手段は、前記通知音の周波数の音を減衰するノッチフィルタであることを特徴とする請求項1〜4のいずれか一つに記載の音声検出装置。
  6. 前記減衰手段は、前記通知音の周波数の整数倍の音を減衰するコムフィルタであることを特徴とする請求項1〜5のいずれか一つに記載の音声検出装置。
  7. 前記報知音出力手段が出力する前記通知音が和音によって構成されている場合に、
    前記減衰手段は、各和音に対応した複数の減衰手段を用意し、前記複数の減衰手段を従属接続することを特徴とする請求項1〜6のいずれか一つに記載の音声検出装置。
  8. 利用者への通知音を出力する通知音出力工程と、
    前記通知音に対する前記利用者の応答音声と、当該応答音声とともに混入される前記通知音出力工程により出力された前記通知音と、を入力音として取得する入力音取得工程と、
    前記通知音出力工程により出力した前記通知音の周波数に応じた減衰特性を有して、前記入力音取得工程により取得した前記入力音を減衰させる減衰工程と、
    前記減衰工程によって減衰した前記入力音を用いて前記応答音声を検出する音声検出工程と、
    を含み、
    前記音声検出工程において前記応答音声以外の音声を検出した場合に、
    前記通知音出力工程は、前記通知音の音量を下げることを特徴とする音声検出方法。
JP2005366767A 2005-12-20 2005-12-20 音声検出装置および音声検出方法 Expired - Fee Related JP4540600B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005366767A JP4540600B2 (ja) 2005-12-20 2005-12-20 音声検出装置および音声検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005366767A JP4540600B2 (ja) 2005-12-20 2005-12-20 音声検出装置および音声検出方法

Publications (2)

Publication Number Publication Date
JP2007174088A JP2007174088A (ja) 2007-07-05
JP4540600B2 true JP4540600B2 (ja) 2010-09-08

Family

ID=38300090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005366767A Expired - Fee Related JP4540600B2 (ja) 2005-12-20 2005-12-20 音声検出装置および音声検出方法

Country Status (1)

Country Link
JP (1) JP4540600B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5156043B2 (ja) * 2010-03-26 2013-03-06 株式会社東芝 音声判別装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0548702A (ja) * 1991-08-19 1993-02-26 Clarion Co Ltd 音声着呼機能付音声ダイヤル装置
JPH09186757A (ja) * 1995-12-27 1997-07-15 Fujitsu Ltd 電話機
JPH1065793A (ja) * 1996-08-21 1998-03-06 Pioneer Electron Corp 自動音声応答機能付き電話機
JPH11331328A (ja) * 1998-05-15 1999-11-30 Anden ハンズフリー電話装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728328B2 (ja) * 1987-06-29 1995-03-29 三洋電機株式会社 音声認識電話機

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0548702A (ja) * 1991-08-19 1993-02-26 Clarion Co Ltd 音声着呼機能付音声ダイヤル装置
JPH09186757A (ja) * 1995-12-27 1997-07-15 Fujitsu Ltd 電話機
JPH1065793A (ja) * 1996-08-21 1998-03-06 Pioneer Electron Corp 自動音声応答機能付き電話機
JPH11331328A (ja) * 1998-05-15 1999-11-30 Anden ハンズフリー電話装置

Also Published As

Publication number Publication date
JP2007174088A (ja) 2007-07-05

Similar Documents

Publication Publication Date Title
CN101212833B (zh) 音频输出设备、方法和系统
EP2396958B1 (en) Controlling an adaptation of a behavior of an audio device to a current acoustic environmental condition
KR102032112B1 (ko) 잡음 제거 개인용 오디오 디바이스에서 2차 경로 적응형 응답의 잡음 버스트 적응
KR102031023B1 (ko) 적응형 잡음 제거 시스템에서 잡음 방지 생성기 응답 및 2차 경로 응답의 시퀀싱된 적응
JP5644359B2 (ja) 音声処理装置
KR20150008471A (ko) 적응형 잡음 제거(anc)를 갖는 개인용 오디오 디바이스들에서 주파수 및 방향 의존 주변의 사운드 조절
CN101621730A (zh) 用于检测声反馈的装置和方法
RU2767297C1 (ru) Устройство эхоподавления, способ эхоподавления и программа эхоподавления
JP4541159B2 (ja) 非線形音響エコーキャンセラ
US7764782B1 (en) Method and apparatus for routing telecommunication calls
JP4540600B2 (ja) 音声検出装置および音声検出方法
JP5970125B2 (ja) 制御装置、制御方法及びプログラム
JP2007512767A (ja) 雑音信号の音響計測基準に基づき呼出信号を生成する方法及びデバイス
CN105681589A (zh) 一种来电提示方法及终端
CN201717926U (zh) 有源消噪系统
KR100279825B1 (ko) 교환기에서 에코 및 측음 현상을 제거하는 회로
CN104184886A (zh) 一种信息处理方法和电子设备
US20080172229A1 (en) Communication apparatus
JP7410109B2 (ja) 電気通信装置、電気通信システム、電気通信装置を動作させる方法、およびコンピュータプログラム
JP4562573B2 (ja) ハウリング防止装置
KR920020873A (ko) 음성통신장치 및 음향에코 캔슬러의 트레이닝 방법
JP3905758B2 (ja) 干渉を避ける方法および装置
JP2003309885A (ja) 自動消音(弱音)システム
CN114866899A (zh) 耳机降噪方法、耳机设备及计算机可读取存储介质
JPH1051516A (ja) 呼出し音生成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080911

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091006

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100615

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100622

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130702

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees