JPH11298382A - ハンズフリー装置 - Google Patents

ハンズフリー装置

Info

Publication number
JPH11298382A
JPH11298382A JP10098897A JP9889798A JPH11298382A JP H11298382 A JPH11298382 A JP H11298382A JP 10098897 A JP10098897 A JP 10098897A JP 9889798 A JP9889798 A JP 9889798A JP H11298382 A JPH11298382 A JP H11298382A
Authority
JP
Japan
Prior art keywords
voice
signal
speaker
hands
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10098897A
Other languages
English (en)
Inventor
Hiroshi Hashimoto
裕志 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe Steel Ltd
Original Assignee
Kobe Steel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe Steel Ltd filed Critical Kobe Steel Ltd
Priority to JP10098897A priority Critical patent/JPH11298382A/ja
Publication of JPH11298382A publication Critical patent/JPH11298382A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 操作者の音声を認識して機器を制御し,音声
合成により操作者へ向けてガイダンスメッセージを発信
する従来のハンズフリー装置では,音響エコー信号によ
る音声認識率の低下を抑制するために高性能のエコーキ
ャンセラが用いられており,そのため装置コストが上昇
した。 【解決手段】 本発明は,マイクから入力されるマイク
入力信号に音声が含まれ,かつスピーカから出力される
スピーカ出力信号に音声合成されたガイダンス音声が含
まれる場合に,上記スピーカ出力信号を減衰させること
により,残差信号をも減衰させ,高性能のエコーキャン
セラを用いずに,音声認識への上記残差信号の影響を低
減させることを図ったものである。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,ハンズフリー装置
に係り,詳しくは,操作者に音声合成によるガイダンス
音声を発信し,使用者の音声を音声認識することによ
り,接続された各種機器に対話型のインターフェースを
提供するハンズフリー装置に関するものである。
【0002】
【従来の技術】近年の携帯用無線端末の急速な普及によ
り,例えば自動車の運転中に携帯電話が使用される場合
も多くなってきた。しかしながら,運転中にステアリン
グから手を離してボタンを操作したり,視線をボタンの
ある操作部に向けたりすると,危急の事態に対処が遅れ
たり,運転に対する注意が散漫になる等,安全上好まし
くなかった。この問題は,もちろん携帯電話に限られる
ものではなく,オーディオ機器やナビゲーション装置等
の他の機器を操作する場合でも同様であるし,運転中以
外でも起こりうる類のものである。そこで,機器操作の
ために視線や手を離す必要を減らす手法の一つとして従
来から音声により機器を操作することが提案されてき
た。即ち,機器に操作者の音声を認識させ,その認識情
報から所定の動作を機器に行わせるのである。音声によ
り機器の操作を行うことができれば,手を用いて操作を
行う必要が減少するため,操作部を小さくして装置を小
型化することができるという利点もある。また,合成音
声を用いて機器から操作者に向けてガイダンスメッセー
ジを送るようにすれば,操作者は動作確認等のために機
器の表示板に視線を向ける必要がなくなり,さらに好適
である。ところで,機器に音声認識をできるだけ正確に
行わせるためには,室内の壁等で反響した残響信号の影
響を使用者が発した入力音声から排除して該入力音声を
明瞭にする必要がある。また,機器のスピーカ等から発
せられた音響信号が機器のマイクに回り込む音響エコー
信号の影響も入力音声から排除しなければならない。例
えば特開平9−261133号公報に記載の技術では,
できるたけ正確な音声認識を行うことを目的として,高
性能なエコーキャンセラにより,上記残響信号等の影響
を入力音声から排除している。
【0003】
【発明が解決しようとする課題】しかしながら,特に走
行中の自動車内等では,走行時の雑音等に抗するために
大きい音量で電話機等の機器からガイダンス音声が発せ
られることになり,エコーキャンセラによって除去しき
れない残差信号が音声認識に影響を与え,誤認識を招く
恐れが高かった。また,高性能のエコーキャンセラは,
複雑で膨大な演算処理が必要となるため,多くのメモリ
や高速処理が可能な高価なディジタルシグナルプロセッ
サを用いることになり,装置コストが増大するという問
題があった。本発明は,このような従来の技術における
課題を解決するために,ハンズフリー装置を改良し,マ
イクから入力されるマイク入力信号に音声が含まれ,か
つスピーカから出力されるスピーカ出力信号に音声合成
されたガイダンス音声が含まれる場合に,上記スピーカ
出力信号を減衰させることにより,残差信号をも減衰さ
せ,高性能のエコーキャンセラを用いずに,音声認識へ
の上記残差信号の影響を低減させることのできるハンズ
フリー装置を提供することを目的とするものである。
【0004】
【課題を解決するための手段】上記第1の目的を達成す
るために,請求項1に係る発明は,マイクと,スピーカ
と,上記スピーカから出力されるスピーカ出力信号を参
照して疑似エコー信号を生成し,上記スピーカから上記
マイクに回り込んだ音響エコー信号から上記疑似エコー
信号を差し引くエコーキャンセラと,上記マイクから入
力されるマイク入力信号に含まれる音声情報を認識する
音声認識部と,操作者に向けたガイダンス音声を合成す
る音声合成部と,上記音声認識部により認識された上記
音声情報に基づいて所定の制御を行う制御部とを具備し
てなるハンズフリー装置において,上記音響エコー信号
と上記疑似エコー信号との残差信号を抑圧するためのエ
コーサプレッサを備え,上記エコーサプレッサが,上記
マイク入力信号に音声が含まれ,かつ,上記音声合成部
により合成された上記ガイダンス音声が上記スピーカ出
力信号に含まれる場合に,上記スピーカ出力信号を減衰
させてなることを特徴とするハンズフリー装置として構
成されている。上記請求項1に係る発明では,マイクか
ら入力されるマイク入力信号に音声が含まれ,かつスピ
ーカから出力されるスピーカ出力信号に音声合成された
ガイダンス音声が含まれる場合に,上記スピーカ出力信
号を減衰させることにより,残差信号をも減衰させるた
め,高性能のエコーキャンセラを用いずに,音声認識へ
の残差信号の影響を低減することができる。また,請求
項2に係る発明は,上記請求項1に記載のハンズフリー
装置において,上記制御部が行う所定の制御に,上記音
声認識部により認識された音声情報に基づいて上記音声
合成部を駆動し,上記音声情報に対する上記ガイダンス
音声を合成し上記スピーカから出力させる制御が含まれ
てなることをその要旨とする。上記請求項2に記載のハ
ンズフリー装置では,残差信号の音声認識への影響を低
減させながら,音声認識結果に基づいて操作者にガイダ
ンス音声を発信する,対話型のインターフェースを各種
機器に提供することができる。また,請求項3に係る発
明は,上記請求項1又は2に記載のハンズフリー装置に
おいて,上記音声認識部により認識された音声情報が,
遠端話者の電話番号に対応するものであって,上記制御
部が行う所定の制御に,上記音声認識部により認識され
た遠端話者の電話番号をダイヤルさせる制御が含まれて
なることをその要旨とする。上記請求項3に記載のハン
ズフリー装置によれば,残差信号の音声認識への影響を
低下させながら,操作者によって発声させた電話番号を
認識し,その結果に基づいてダイヤリングを行わせるこ
とのできる。また,請求項4に係る発明は,上記請求項
1〜3のいずれか1項に記載のハンズフリー装置におい
て,上記音声合成部により合成されスピーカから出力さ
れた所定の合成音声を上記エコーキャンセラのトレーニ
ング信号に用いてなることをその要旨とする。上記請求
項4に記載のハンズフリー装置によれば,例えば装置の
初期動作時に不快な白色雑音的な信号ではなく,より聞
きやすい合成音声を用いて上記エコーキャンセラに学習
を行わせ,残差信号を低減することができる。
【0005】
【発明の実施の形態】以下,添付図面を参照して,本発
明の一実施の形態につき説明し,本発明の理解に供す
る。尚,以下の実施の形態は,本発明の具体的な一例で
あって,本発明の技術的範囲を限定する性格のものでは
ない。まず,図1に本発明の一実施の形態に係るハンズ
フリー装置の概略構成を示す。上記ハンズフリー装置A
1は,操作者に音声合成によるガイダンス音声を発信
し,操作者の音声を音声認識することにより,接続され
た各種機器に対話型のインターフェースを提供する装置
であり,例えば遠端話者と通信するための電話機100
と近端に設置されたスピーカ200及びマイク300と
に接続されて使用される。上記ハンズフリー装置A1
は,スピーカ20から出力されるスピーカ出力信号を参
照して疑似エコー信号を生成し,スピーカ200からマ
イク100に回り込んだ音響エコー信号から上記疑似エ
コー信号を差し引く音響エコーキャンセラ(エコーキャ
ンセラ)10と,上記音響エコー信号と上記疑似信号と
の残差信号を抑圧するためのエコーサプレッサ20と,
マイク100から入力され音響エコーキャンセラ10に
より音響エコー抑制処理が施されたマイク入力信号に含
まれる操作者の発声した単語を認識する音声認識部30
と,上記音声認識部30により音声認識された単語に基
づいて所定の合成音声を生成する音声合成部40とを具
備する。
【0006】上記エコーサプレッサ20は,遠端話者に
送信される送話信号を減衰させる送話減衰器201と,
遠端話者又は音声合成装置40から出力された受話信号
を減衰させる受話減衰器202と,上記送話信号に音声
が含まれているか否かを検出する送話有声検出器203
と,上記受話信号に音声が含まれているか否かを検出す
る受話有声検出器204と,上記送話信号及び受話信号
に基づいて近端話者の通話状態が送話状態であるか受話
状態であるかを判定する送受話判定器205と,上記送
話有声検出器203,受話有声検出器204,及び送受
話判定器205からの判別信号に基づいて上記送話減衰
器201及び受話減衰器202の減衰量を制御する減衰
器制御器206と,後記する音声合成装置401により
合成された合成音声に音声が含まれているか否かを検出
する合成音声有声検出器207とを含む。また,上記音
声認識部30は,音声認識処理を行う音声認識装置30
1と,音声認識装置301により認識された単語に基づ
いて所定の制御を行う状態制御装置302と,上記音声
認識装置301が上記マイク入力信号と比較するのに用
いる音声認識用パターンデータが記憶される音声認識用
パターンデータ記憶メモリ303とを含む。また,上記
音声合成部40は,合成音声を生成する処理を行う音声
合成装置401と,上記音声合成装置401による音声
合成処理の際に用いられる確認,操作方法等のガイダン
スメッセージの音声合成用圧縮音声データが記憶された
音声合成用圧縮音声データ記憶メモリ402とを含む。
【0007】次に,上記ハンズフリー装置の詳細につい
て説明する。操作者が発声した音声はマイク200から
上記ハンズフリー装置A1に入力される。マイク200
から入力されるマイク入力信号には,操作者の発声音声
の他,スピーカ300からマイク200に回り込んだ音
響エコー信号や背景雑音等が含まれる。上記マイク入力
信号は上記ハンズフリー装置A1内の音響エコーキャン
セラ10に供給される。上記音響エコーキャンセラ10
は,スピーカ300から出力されるスピーカ出力信号を
参照信号として適応フィルタにより疑似エコーを生成
し,上記マイク入力信号から上記疑似エコーを差し引く
ことにより,音響エコーを消去するものである。上記音
響エコーキャンセラ10において,上記適応フィルタの
学習程度や性能等により,音響エコーを消去しきれない
場合もある。この場合には,上記音響エコーキャンセラ
10から出力される信号に,音響エコーと疑似エコーと
の残差信号が含まれることになる。上記残差信号は上記
音声認識部30による音声認識精度に影響を与える。こ
のため,上記ハンズフリー装置A1では,例えば初期動
作の際に,上記適応フィルタのトレーニング信号として
不快な白色雑音的な信号ではなく,より聞きやすい所定
の合成音声が上記音声合成装置401により合成されス
ピーカ300から出力される。上記適応フィルタは上記
所定の合成音声を用いて学習を行うことによって上記残
差信号がある程度抑制される。上記音声認識部30の音
声認識装置301は,送話有声検出器20により上記音
響エコーキャンセラ10に音声が含まれていると判定さ
れた場合に,音声認識処理を行う。上記送話有声検出器
20は,例えば信号パワーの最低値をモニターすること
によりノイズのパワーレベルを推定し,ノイズレベルよ
りもある程度パワーが大きくなった区間を有声と判定
し,それ以外の区間を音声が無い無声と判定する。上記
音声認識装置301は,音声認識用パターンデータ記憶
メモリ303に記憶された音声認識用パターンデータと
有声区間の信号との類似度を演算し,類似度が一定以上
のパターンデータの中から例えば最も類似度の大きいパ
ターンデータを認識結果とするものである。上記音声認
識用パターンデータは,例えばダイヤルを自動的に行う
ための「いち」,「に」等の音声に対応するパターンで
ある。上記音声認識用パターンデータとの類似度の演算
による音声認識処理には,例えば不特定の話者に対応し
やすいHMM(隠れマルコフモデル)等を用いることが
可能である。
【0008】上記音声認識装置301の認識結果は,上
記状態制御装置302に出力される。上記状態制御装置
302は,上記音声認識装置301から認識結果が供給
されると,番号リスト検索装置304を動作させる。上
記番号リスト検索装置304は,上記状態制御装置30
2からの動作指令を受けて,電話番号リスト記憶メモリ
305に記憶された電話番号の中から認識結果に適合し
たものを抽出する。上記番号リスト検索装置304によ
り電話番号が抽出されると,そのインデックスガ上記状
態制御装置302へ出力される。上記状態制御装置30
2は,上記番号リスト検索装置304から出力されたイ
ンデックスを基に上記電話番号リスト記憶メモリ305
から電話番号を読み出し,発信装置306に出力する。
上記発信装置306は,上記読み出された電話番号に対
応するトーン信号を生成し,そのトーン信号とダイヤル
指令を上記電話機3へ出力し,電話器にダイヤル動作を
行わせる。また,上記状態制御装置302は,上記音声
認識装置301によって認識された単語が,動作確認や
装置の操作方法を求めるものであったり,復唱を指示す
るものである場合には,それに対応するインデックス,
文字列,数字列等を音声合成部40に出力する。
【0009】上記状態制御装置302から上記インデッ
クス等が供給されると,上記音声合成装置401は,
「ヨロシイデスカ」,「トリヤメマス」等のガイダンス
メッセージに対応する音声合成用圧縮音声データを上記
音声合成用圧縮データ記憶メモリ402から読み出して
合成音声を生成する。このときの音声合成の手法として
は,例えば使用メモリ量の少ないLPC−10等を用い
るのが実用的である。上記音声合成装置401により生
成された合成音声は,遠端話者からの受話信号に加算さ
れエコーサプレッサ20の受話減衰器202に供給され
る。上記エコーサプレッサ20において,送受話判定器
205は,受話信号と送話信号とのレベルが比較され,
その比較結果に基づいて送受話判定フラグL1が減衰器
制御器206に出力される。上記送受話判定フラグL1
が例えば0の場合には,送話信号のレベルが大きい送話
状態であることを示す。他方,上記送受話判定フラグL
1が1の場合には,受話信号のレベルが大きい受話状態
であることを示す。また,送話有声検出器203からも
送話有声検出フラグNtが上記減衰器制御器206へ出
力される。さらに,受話信号に音声が含まれているか否
かは上記受話有声検出器204によって送話有声検出の
場合と同様に判定され,受話有声検出フラグNrが上記
減衰器制御器206へ出力される。尚,上記送話有声検
出フラグNt及び受話有声検出フラグNrは,例えば0
の場合に無声状態であることを示し,1の場合に有声状
態であることを示す。また,上記減衰器制御器206に
は,上記音声合成装置401から出力された合成音声の
有声区間及び無声区間を検出する合成音声有声検出器2
07から音声合成音出力フラグNcも供給される。上記
音声合成音出力フラグNcが,例えば0の場合には合成
音声が無声状態にあることを,1の場合には合成音声が
有声状態にあることを示す。上記減衰器制御器206
は,上記各フラグに基づいて上記送話減衰器201の減
衰量Gtx,受話減衰器202の減衰量Grxの制御を
行う。上記減衰器206は,上記音声合成装置401か
ら合成音声が出力されている場合と,遠端話者からの音
声のみの場合とで,上記状態制御装置302により異な
る動作設定に切り替えられる。
【0010】次に,図2及び図3を参照して,上記減衰
器制御器206の動作の詳細に説明する。ここで,図2
は,合成音声が存在しない場合の減衰量の設定を説明す
るための図表であり,図3は合成音声が存在する場合の
減衰量の設定を説明するための図表である。尚,合成音
声が存在するか否かは,例えば上記状態制御装置302
により上記減衰器制御器206に指示される。 (合成音声が存在せず,遠端話者とは回線が接続されて
いる場合)送話状態であって送話信号が有声状態にある
状態Aの場合には,例えば送話減衰器201の減衰量G
txは0dBに,受話減衰器の減衰量Grxは−6dB
に設定される。この状態Aでは,上記スピーカ出力信号
が半分程度の値まで減衰されるため,通話の同時双方向
性を維持しつつ遠端話者からの音声による音響エコーが
ある程度抑制される。また,送話状態であって送話信号
が無声状態にある状態Bの場合には,例えば送話減衰器
201の減衰量Gtxは−3dBに,受話減衰器の減衰
量Grxは−3dBに設定される。また,受話状態であ
って受話信号が無声状態にある状態Cの場合には,例え
ば送話減衰器201の減衰量Gtxは−3dBに,受話
減衰器の減衰量Grxは−3dBに設定される。上記状
態B,Cはいわゆる中間状態であって,上記マイク入力
信号も上記スピーカ出力信号も減衰がない場合と較べて
70パーセント程度まで値が減衰させられるが,近端話
者及び遠端話者が通話を行っても支障はない。また,受
話状態であって受話信号が有声状態にある状態Dの場合
には,例えば送話減衰器201の減衰量Gtxは−6d
Bに,受話減衰器の減衰量Grxは0dBに設定され
る。 (合成音声が存在し,遠端話者とは回線が接続されてい
ない場合)操作者の音声である送話音声が存在せず,ガ
イダンス音声である受話音声が有声状態である場合,送
受話判定器206は受話状態であると判定し,図3の状
態H’のように減衰器制御器206によって例えば送話
減衰器201の減衰量Gtxは−6dBに設定され,受
話減衰器202の減衰量Grxは0dBに設定される。
また,送話信号が有声状態にあり,ガイダンス音声が無
声状態にある場合,送受話判定器206は送話状態にあ
ると判定し,状態A’のように減衰器制御器206によ
って例えば送話減衰器201の減衰量Gtxは0dBに
設定され,受話減衰器202の減衰量Grxは−6dB
に設定される。また,送話信号が有声状態にあり,ガイ
ダンス音声も有声状態にある,いわゆるダブルトークの
状態B’,G’では,減衰器制御器206によって例え
ば送話減衰器201の減衰量Gtxは0dBに設定さ
れ,受話減衰器202の減衰量Grxは−6dBに設定
される。このダブルトークの状態B’,G’では,送話
信号が有声状態にあるので,音声認識装置301が動作
するが,音声合成装置401から出力されたガイダンス
音声もスピーカ300からマイク200に回り込み入力
される。音響エコーキャンセラ10によってある程度の
ガイダンス音声は消去されるが,上記音響エコーキャン
センラ10のみの場合,エコーの残差信号がある程度生
じてしまうため,音声認識装置301が誤動作してしま
う恐れがある。そこで,本実施の形態に係るハンズフリ
ー装置では,上記ダブルトークの状態B’,G’を検出
すると,受話減衰器202の減衰量Grxを上記のよう
に−6dBに設定して,上記ガイダンス音声がスピーカ
300から出力されるときの音量を低下させる。これに
よって,上記残差信号のレベルも−6dB低下すること
になるため,音声認識装置301の誤動作の確率を低下
させることができる。また,送話状態であるが送話音声
が検出されていない状態C’,D’,及び,受話状態で
あるがガイダンス音声が検出されていない状態E’,
F’については減衰器制御器206では送話状態と受話
状態の中間の状態にあると判定し,送話減衰器201の
減衰量Gtx及び受話減衰器202の減衰量Grxがと
もに中間の値,例えば−3dBに設定される。このよう
に,本実施の形態に係るハンズフリー装置では,マイク
から入力されるマイク入力信号に音声が含まれ,かつス
ピーカから出力されるスピーカ出力信号に音声合成され
たガイダンス音声が含まれる場合に,上記スピーカ出力
信号を減衰させることにより,残差信号をも減衰させる
ため,高性能のエコーキャンセラを用いずに,音声認識
への残差信号の影響を低減することができる。さらに,
残差信号の音声認識への影響を低減させながら,音声認
識結果に基づいて操作者にガイダンス音声を発信する,
対話型のインターフェースを各種機器に提供することが
できる。さらに,残差信号の音声認識への影響を低下さ
せながら,操作者によって発声させた電話番号を認識
し,その結果に基づいてダイヤリングを行わせることの
できる。さらに,例えば装置の初期動作時に不快な白色
雑音的な信号ではなく,より聞きやすい合成音声を用い
て上記エコーキャンセラに学習を行わせ,残差信号を低
減することができる。
【0011】
【実施例】上記実施の形態では,送話有声検出器20
3,受話有声検出器204による送話音声,受話音声に
ついての有声/無声の判定は,ノイズのパワーレベルを
推定し,推定したノイズレベルよりも所定量だけ信号の
パワーが大きいか小さいかによって行ったが,これに限
らず,例えば信号のゼロクロスをカウントしたり,信号
の周期性を求める等他の手法により行ってもよい。この
ようなハンズフリー装置も本発明におけるハンズフリー
装置の一例である。また,上記実施の形態では,音声認
識装置301の音声認識処理にHMMを用いたが,これ
に限らず,複数の連続した単語の発声に対応しやすい2
段DPマッチングやOne Passアルゴリズム等他の手法を
用いてもよい。このようなハンズフリー装置も本発明に
おけるハンズフリー装置の一例である。また,上記実施
の形態では,音声合成装置401の音声合成処理にLP
C−10を用いたが,これに限らず,CELPやADP
CMといった他の符号化・復号化手法を用いてもよい。
このようなハンズフリー装置も本発明におけるハンズフ
リー装置の一例である。また,上記実施の形態では,送
話減衰器201及び受話減衰器202の最大減衰量が−
6dBに設定されていたが,この値に限られるものでは
ない。尚,会話の同時双方向性を維持するためには,−
6dB〜−10dB程度の減衰量が好適である。このよ
うなハンズフリー装置も本発明におけるハンズフリー装
置の一例である。また,上記実施の形態では,受話有声
検出器204と合成音声有声検出器207とを持ちいた
が,上記合成音声有声検出器207を設けず上記受話有
声検出器204により上記音声合成装置401から出力
される合成音声の有声区間と無声区間を検出することも
可能である。このようなハンズフリー装置も本発明にお
けるハンズフリー装置の一例である。また,上記実施の
形態では,電話機100に本発明を適用したが,他の各
種機器に本発明を適用することも可能である。このよう
なハンズフリー装置も本発明におけるハンズフリー装置
の一例である。
【0012】
【発明の効果】このように,上記請求項1に係る発明で
は,マイクから入力されるマイク入力信号に音声が含ま
れ,かつスピーカから出力されるスピーカ出力信号に音
声合成されたガイダンス音声が含まれる場合に,上記ス
ピーカ出力信号を減衰させることにより,残差信号をも
減衰させるため,高性能のエコーキャンセラを用いず
に,音声認識への残差信号の影響を低減することができ
る。さらに,上記請求項2に係る発明では,残差信号の
音声認識への影響を低減させながら,音声認識結果に基
づいて操作者にガイダンス音声を発信する,対話型のイ
ンターフェースを各種機器に提供することができる。さ
らに,上記請求項3に係る発明によれば,残差信号の音
声認識への影響を低下させながら,操作者によって発声
させた電話番号を認識し,その結果に基づいてダイヤリ
ングを行わせることのできる。さらに,上記請求項4に
記載のハンズフリー装置によれば,例えば装置の初期動
作時に不快な白色雑音的な信号ではなく,より聞きやす
い合成音声を用いて上記エコーキャンセラに学習を行わ
せ,残差信号を低減することができる。
【図面の簡単な説明】
【図1】 本発明の一実施の形態に係るハンズフリー装
置の概略構成を示す図。
【図2】 合成音声がない場合の減衰器の設定の一例を
示す図。
【図3】 合成音声が存在する場合の減衰器の設定の一
例を示す図。
【符号の説明】
10…音響エコーキャンセラ 20…エコーサプレッサ 30…音声認識部 40…音声合成部 200…マイク 300…スピーカ

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 マイクと,スピーカと,上記スピーカか
    ら出力されるスピーカ出力信号を参照して疑似エコー信
    号を生成し,上記スピーカから上記マイクに回り込んだ
    音響エコー信号から上記疑似エコー信号を差し引くエコ
    ーキャンセラと,上記マイクから入力されるマイク入力
    信号に含まれる音声情報を認識する音声認識部と,操作
    者に向けたガイダンス音声を合成する音声合成部と,上
    記音声認識部により認識された上記音声情報に基づいて
    所定の制御を行う制御部とを具備してなるハンズフリー
    装置において,上記音響エコー信号と上記疑似エコー信
    号との残差信号を抑圧するためのエコーサプレッサを備
    え,上記エコーサプレッサが,上記マイク入力信号に音
    声が含まれ,かつ,上記音声合成部により合成された上
    記ガイダンス音声が上記スピーカ出力信号に含まれる場
    合に,上記スピーカ出力信号を減衰させてなることを特
    徴とするハンズフリー装置。
  2. 【請求項2】 上記制御部が行う所定の制御に,上記音
    声認識部により認識された音声情報に基づいて上記音声
    合成部を駆動し,上記音声情報に対する上記ガイダンス
    音声を合成し上記スピーカから出力させる制御が含まれ
    てなる請求項1に記載のハンズフリー装置。
  3. 【請求項3】 上記音声認識部により認識された音声情
    報が,遠端話者の電話番号に対応するものであって,上
    記制御部が行う所定の制御に,上記音声認識部により認
    識された遠端話者の電話番号をダイヤルさせる制御が含
    まれてなる請求項1又は2に記載のハンズフリー装置。
  4. 【請求項4】 上記音声合成部により合成されスピーカ
    から出力された所定の合成音声を上記エコーキャンセラ
    のトレーニング信号に用いてなる請求項1〜3のいずれ
    か1項に記載のハンズフリー装置。
JP10098897A 1998-04-10 1998-04-10 ハンズフリー装置 Pending JPH11298382A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10098897A JPH11298382A (ja) 1998-04-10 1998-04-10 ハンズフリー装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10098897A JPH11298382A (ja) 1998-04-10 1998-04-10 ハンズフリー装置

Publications (1)

Publication Number Publication Date
JPH11298382A true JPH11298382A (ja) 1999-10-29

Family

ID=14231932

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10098897A Pending JPH11298382A (ja) 1998-04-10 1998-04-10 ハンズフリー装置

Country Status (1)

Country Link
JP (1) JPH11298382A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008193673A (ja) * 2007-01-12 2008-08-21 Lear Corp 音声でプログラム可能であって音声で作動する車両ベースの電気製品遠隔制御
JP2012073364A (ja) * 2010-09-28 2012-04-12 Toshiba Corp 音声対話装置、方法、プログラム
JP2014232289A (ja) * 2013-05-30 2014-12-11 三菱電機株式会社 誘導音声調整装置、誘導音声調整方法および誘導音声調整プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008193673A (ja) * 2007-01-12 2008-08-21 Lear Corp 音声でプログラム可能であって音声で作動する車両ベースの電気製品遠隔制御
JP2012073364A (ja) * 2010-09-28 2012-04-12 Toshiba Corp 音声対話装置、方法、プログラム
JP2014232289A (ja) * 2013-05-30 2014-12-11 三菱電機株式会社 誘導音声調整装置、誘導音声調整方法および誘導音声調整プログラム

Similar Documents

Publication Publication Date Title
US7392188B2 (en) System and method enabling acoustic barge-in
JP4283212B2 (ja) 雑音除去装置、雑音除去プログラム、及び雑音除去方法
KR100382024B1 (ko) 음성 처리 장치 및 방법
US5619566A (en) Voice activity detector for an echo suppressor and an echo suppressor
EP3002754B1 (en) System and method for processing an audio signal captured from a microphone
US20080249779A1 (en) Speech dialog system
JP2005084253A (ja) 音響処理装置、方法、プログラム及び記憶媒体
JP6545419B2 (ja) 音響信号処理装置、音響信号処理方法、及びハンズフリー通話装置
JP2004226656A (ja) マイクロホンアレイを用いた話者距離検出装置及び方法並びに当該装置を用いた音声入出力装置
JP2005195895A (ja) 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置
JP3869888B2 (ja) 音声認識装置
KR20080107376A (ko) 화자 독립 음성 인식을 구비한 통신 장치
US20030061049A1 (en) Synthesized speech intelligibility enhancement through environment awareness
EP1494208A1 (en) Method for controlling a speech dialog system and speech dialog system
US11089404B2 (en) Sound processing apparatus and sound processing method
US6606595B1 (en) HMM-based echo model for noise cancellation avoiding the problem of false triggers
JP3524370B2 (ja) 音声起動システム
JPH11298382A (ja) ハンズフリー装置
Agaiby et al. Knowing the wheat from the weeds in noisy speech.
JP2001343985A (ja) 音声スイッチ方法及び音声スイッチ
JPH11109987A (ja) 音声認識装置
KR20160066347A (ko) 차량용 음성 인식 장치 및 방법
JP2006343642A (ja) 音声認識方法、音声認識装置、プログラム、記録媒体
JP2003099100A (ja) 音声認識装置およびその方法
Ichikawa et al. Simultaneous adaptation of echo cancellation and spectral subtraction for in-car speech recognition