JP2000227799A - 音声認識装置、音声認識システム及び通信装置 - Google Patents

音声認識装置、音声認識システム及び通信装置

Info

Publication number
JP2000227799A
JP2000227799A JP11028096A JP2809699A JP2000227799A JP 2000227799 A JP2000227799 A JP 2000227799A JP 11028096 A JP11028096 A JP 11028096A JP 2809699 A JP2809699 A JP 2809699A JP 2000227799 A JP2000227799 A JP 2000227799A
Authority
JP
Japan
Prior art keywords
voice
input
unit
microphone
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11028096A
Other languages
English (en)
Inventor
Susumu Senda
進 千田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP11028096A priority Critical patent/JP2000227799A/ja
Publication of JP2000227799A publication Critical patent/JP2000227799A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 人間の音声応答以外の言葉の誤認識を比較的
低コストで防止できる音声認識装置、音声認識システム
及び通信装置を提供する。 【解決手段】 音声再生装置10から再生出力される音
声データが入力される接続部30と、音声が入力される
マイクロホン28と、マイクロホン28にて入力された
音声から、接続部30にて入力された音声データに基づ
いて、音声再生装置10から再生出力されてマイクロホ
ン28に入力された音声を除去する雑音除去部26と、
雑音除去部26から入力された音声を音声認識する音声
認識部24と、を備えたことを特徴とする音声認識装置
10。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識装置、音
声認識システム及び通信装置に関し、特に、人間の音声
応答以外の言葉の誤認識を比較的低コストで防止できる
音声認識装置、音声認識システム及び通信装置を提供す
ることにある。
【0002】
【背景技術】近年、外部から回線を通じて発呼信号を受
信した場合に、受話器等を手で取ることなく、音声応答
により回線を自動的に閉結することができる通信装置が
開発されている。このような通信装置は、一般的に、マ
イクロホンにて入力された言葉を音声認識装置が認識
し、この認識結果に基づいて制御装置が所定の制御動作
を行う仕組みになっている。
【0003】
【発明が解決しようとする課題】しかしながら、人間が
居住する空間内には、例えばテレビ、ラジオ、ステレオ
等のように、言葉を含む音声を発生する装置が設置され
る場合が多い。このため、このような装置が設置された
環境で音声認識装置を備える通信装置が設置されると、
テレビ等の装置から発せられる音声中の言葉を誤認識し
て、通信装置が誤動作してしまう場合が生じ得る。
【0004】この問題を解決するため、人間の肉声と、
機械を通じて発せられる人間の声とを区別し得るほど高
性能な音声認識装置を使用することも考えられる。しか
し、その場合には、音声認識装置自体のコストがかさむ
ため、通信装置がかなり高価なものとなってしまう。
【0005】本発明は、上記課題に鑑みてなされたもの
であり、その目的は、人間の音声応答以外の言葉の誤認
識を比較的低コストで防止できる音声認識装置、音声認
識システム及び通信装置を提供することにある。
【0006】
【課題を解決するための手段】上記課題を解決するた
め、請求項1記載の音声認識装置は、音声再生手段から
再生出力される音声データが入力される第1の入力手段
と、音声が入力される第2の入力手段と、前記第2の入
力手段にて入力された音声から、前記第1の入力手段に
入力された音声データに基づいて、前記音声再生手段か
ら再生出力されて前記第2の入力手段に入力された音声
を除去する除去手段と、前記除去手段から入力された音
声を音声認識する音声認識手段と、を備えるものであ
る。
【0007】また、請求項2記載の音声認識システム
は、音声データに基づいて音声を再生出力する音声再生
手段と、マイクロホンにて入力された音声に含まれる所
定の雑音を除去する雑音除去手段と、前記雑音除去手段
から入力された音声を音声認識する音声認識手段と、を
含み、前記雑音除去手段は、前記音声再生手段に接続さ
れて該音声再生手段から出力される前記音声データを取
得し、この音声データに基づいて、該音声再生手段から
再生出力されて前記マイクロホンに入力された音声を除
去するものである。
【0008】請求項1記載の音声認識装置及び請求項2
記載の音声認識システムによれば、人間の音声応答以外
の言葉の誤認識を比較的低コストで防止することが可能
となる。つまり、第1の入力手段及び除去手段があるこ
とから、音声再生手段にて再生出力された音声が、第2
の入力手段にて入力された音声の中から除去される。そ
して、除去手段から入力された音声が音声認識手段にて
音声認識されることから、音声再生手段から言葉を含む
音声が出力されている場合に、その言葉が誤って音声認
識されることがない。つまり、着信に対し応答する人間
の音声を確実に認識することができるのである。また、
音声再生手段から出力された音声を予め除去した上で音
声認識処理が行われることから、人間の肉声と機械を通
して発せられる人間の声を判別できるほど精密な音声認
識手段を用いる必要がなく、コストを低く押さえること
ができる。
【0009】請求項3記載の通信装置は、マイクロホン
にて入力された外部音声を音声認識手段が音声認識し、
この音声認識結果に基づいて所定の制御動作を自動的に
実行可能な通信装置において、外部の音声出力源からス
ピーカを通して音声出力される前の音声データを取得す
るため、該音声出力源に接続される接続手段と、前記接
続手段を通じて取得した前記音声データに基づいて、前
記マイクロホンにて入力された外部音声から、前記スピ
ーカより出力されて前記マイクロホンに入力された音声
を除去し、除去処理後の外部音声を前記音声認識手段に
入力する雑音除去制御手段と、を有するものである。
【0010】請求項3記載の通信装置によれば、人間の
音声応答以外の言葉を誤認識することにより生ずる通信
装置の誤動作を、比較的低コストで防止することが可能
となる。
【0011】つまり、言葉を含む音声が外部の音声出力
源からスピーカを通して出力された場合でも、その音声
は、雑音除去制御手段によって、マイクロホンに入力さ
れた全外部音声中から除去され、除去処理後の外部音声
が音声認識手段により音声認識される。そのため、外部
の音声出力源から出力される音声を音声応答として誤認
識することがなく、誤認識に基づく誤動作が防止される
と共に、除去処理後の音声の中に応答音声があれば、確
実に認識することができる。特に、接続手段を有し、こ
の接続手段を通じて、音声出力源から音声出力される前
の音声データを取得できることから、雑音除去制御手段
における雑音除去処理の精度を高めることができる。ま
た、音声再生手段から出力された音声を予め除去した上
で音声認識処理が行われることから、人間の肉声と機械
を通して発せられる人間の声を判別できるほど精密な音
声認識手段を用いる必要がなく、コストを低く押さえる
ことができる。
【0012】請求項4記載の通信装置は、マイクロホン
にて入力された外部音声を音声認識手段が音声認識し、
この音声認識結果に基づいて所定の制御動作を自動的に
実行可能な通信装置において、音声メッセージを再生す
るための音声データを記憶する音声データ記憶手段と、
前記音声データを再生してスピーカから出力する音声再
生手段と、前記音声データに基づいて、前記マイクロホ
ンにて入力された外部音声から、前記スピーカより出力
されて前記マイクロホンに入力された音声を除去し、除
去処理後の外部音声を前記音声認識手段に入力する雑音
除去制御手段と、を有するものである。
【0013】請求項4記載の通信装置によれば、自ら出
力した音声メッセージを、マイクロホンにて入力された
外部音声中から除去することができるため、音声メッセ
ージの再生中に、例えば着信があった場合に、該音声メ
ッセージを音声応答と誤認識して誤動作することを防止
することができる。また、人間の肉声と機械を通して発
せられる人間の声を判別できるほど精密な音声認識手段
を用いる必要がないため、コストを低く押さえることが
できる。
【0014】請求項5記載の通信装置は、請求項3また
は請求項4に記載の通信装置において、前記雑音除去制
御手段は、前記音声データを前記マイクロホンにて入力
された外部音声から減算して結果を出力する減算手段
と、前記音声データに基づいて、前記スピーカから出力
された音声が前記マイクロホンに入力されるまでに生ず
る遅延時間及び減衰量の少なくとも一方を計算する計算
手段と、前記計算手段の計算結果に基づいて、前記音声
データを前記減算手段に入力する際のタイミング及び入
力レベルの少なくとも一方を調整する調整手段と、を有
するものである。
【0015】請求項5記載の通信装置によれば、スピー
カから出力された音声がマイクロホンに入力されるまで
の遅延時間・減衰量が計算手段にて自動的に計算され、
この計算手段の計算結果に基づいて、調整手段が、音声
データを減算手段に入力する際のタイミング・入力レベ
ルを自動的に調整することから、ユーザーにとって、精
度の高い除去処理が極めて簡単で、使いやすい通信装置
が得られる。
【0016】請求項6記載の通信装置は、請求項3また
は請求項4に記載の通信装置において、手動入力を可能
とするキー入力手段を有し、前記雑音除去制御手段は、
前記音声データを前記マイクロホンにて入力された外部
音声から減算して結果を出力する減算手段と、前記キー
入力手段からの入力に基づいて、前記音声データを前記
減算手段に入力する際のタイミング及び入力レベルの少
なくとも一方を調整する調整手段と、を有するものであ
る。
【0017】請求項6記載の通信装置によれば、音声デ
ータを減算手段に入力する際のタイミング・入力レベル
を、キー入力部を用いてユーザーが任意に設定できる。
また、構成の一層の簡易化によるコストの低減化を図る
ことが可能となる。
【0018】
【発明の実施の形態】次に、本発明の実施の形態を、図
面を参照して説明する。
【0019】図1は、本発明に係る音声認識装置及び音
声認識システムの概略的構成を示すブロック図である。
【0020】図1において、10は音声再生装置であ
り、音声データを再生出力する音声再生部20と、この
音声再生部20にて再生出力された音声データを実際の
音声として外部に出力するスピーカ22と、を有する。
音声再生部20にて再生出力される音声データは、カセ
ットテープ、レコード、CD、MD、FD、MO、メモ
リ等の情報記憶媒体に記憶されているものでもよいし、
テレビやラジオの音声のように、有線又は無線で随時受
信するものであってもよい。また、音声データの種類
は、アナログデータ、ディジタルデータのいずれでもよ
い。
【0021】一方、12は音声認識装置であって、音声
認識部24と、雑音除去部26と、マイクロホン28
と、接続部30と、を有する。
【0022】ここで、マイクロホン28は、周囲の外部
音声を取り込むためのものであり、接続部30は、雑音
除去部26と音声再生部20を接続して、音声再生手段
20にて再生出力された音声データを雑音除去部26に
入力する。本実施形態では、この接続部30として接続
コードを用い、音声再生部20の図示しない2次外部出
力端子と、雑音除去部26の図示しない外部入力端子を
接続しているが、音声再生手段20にて再生出力される
音声データを雑音除去部26に確実に入力できるもので
あれば、他の構成によることもできる。具体的には、例
えば、無線送受信装置や赤外線送受信装置等によること
が可能である。さらに、雑音除去部26は、マイクロホ
ン28にて入力された外部音声の中から、接続部30を
通じて取得した音声データに基づいて、スピーカ22か
ら出力された音声を除去し、音声認識部24は、入力さ
れた音声中に含まれる言葉を音声認識する。この音声認
識部24及び雑音除去部26は、それぞれ、例えばLS
Iを用いて構成することができる。
【0023】そして、音声認識装置12は、音声再生装
置10のスピーカ22から出力された音声をマイクロホ
ン28で捕捉し得る位置に設置されている。
【0024】なお、Uはユーザーを示す。また、矢印a
は音声再生部20にて再生出力された音声データ(以
下、「音声データa」)、矢印Aは、スピーカ22にて
音声として出力され、マイクロホン28に回りこんで入
力された音声(以下、「音声A」)、矢印Bは、ユーザ
ーUが発した音声(以下「音声B」)を示す。
【0025】このような音声認識装置12及び音声認識
システムにおける音声認識は、図2のフローチャートに
示すような手順で行われる。なお、図2の説明において
は、適宜図1を参照する。
【0026】まず、音声再生部20にて音声データaが
再生出力されると、その音声データaは、接続部30を
通じて雑音除去部26に入力される(S1)。また、マ
イクロホン28にて、周囲の外部音声が入力される(S
1)。この外部音声には、音声A及び音声Bが含まれ
る。
【0027】次いで、雑音除去部26にて、マイクロホ
ン28にて入力された外部音声の中から音声Aが除去さ
れる(S2)。より詳しくは、雑音除去部26は、ま
ず、音声データa及び音声Aに基づいて、音声データa
に基づきスピーカ22から出力された音声がマイクロホ
ン28に到達するまでの回りこみ時間や減衰量を計算
し、この計算結果に基づいて、減算処理を行うタイミン
グや、音声データaを音声Aのレベルに等しくするため
の減衰量・増幅量等を決定する。この減衰量・増幅量等
が、レベル調整量となる。また、この決定作業は、予め
トレーニング工程を設けて、音声Bの入力がない状態で
行っておく。そして、この決定結果に従って、音声デー
タaを減衰又は増幅した後、外部音声から減算する。こ
れにより、マイクロホン28にて入力された外部音声中
から音声Aに相当する分の音声が除去される。
【0028】そして、音声Aが除去された外部音声につ
いて、音声認識部24にて音声認識処理が行われる(S
3)。
【0029】このように、本実施形態の音声認識装置1
2及び音声認識システムでは、マイクロホン28にて入
力された外部音声から音声Aを除去した上で音声認識処
理するため、音声再生装置10にて音声が出力されてい
る場合でも、その音声が誤認識されることがない。よっ
て、音声再生装置10における言葉を含む音声の再生中
に、ユーザーUが発した音声Bを精度よく音声認識する
ことが可能となる。また、音声Aを予め除去してから音
声認識処理を行うため、音声認識部24を、人間の肉声
による言葉と機械を通して発せられる言葉とを判別でき
るほど精密に構成する必要がない。このため、コストを
低く押さえることができる。
【0030】なお、音声再生部20から雑音除去部26
に音声データaを入力する代わりに、雑音除去部26に
接続されるマイクロホンを別途設け、このマイクロホン
をスピーカ22の極近傍に設置して、回りこみや減衰が
生ずる前のスピーカ出力音声を取得し、このスピーカ出
力音声に基づいて、雑音除去部26における処理を行う
ように構成することも可能である。この場合には、回り
こみや減衰が生ずる前のスピーカ出力音声が音声データ
に相当する。
【0031】また、本実施形態では、音声再生装置10
が音声再生手段に相当し、音声認識部24が音声認識手
段に相当する。また、接続部30が第1の入力手段に相
当し、マイクロホン28が第2の入力手段に相当する。
さらに、雑音除去部26が、除去手段及び雑音除去手段
に相当する。
【0032】図3は、本実施形態に係る通信装置を電話
装置に適用した場合の例を示すブロック図である。
【0033】図3において、電話装置100は、外部音
声を取り込むマイクロホン102と、鳴動音や音声メッ
セージを出力するスピーカ104と、外部に設置される
図示しない音声再生装置から再生出力される音声データ
を取得するための音声データ入力端子106と、テンキ
ー及び機能キーを含むキー入力部108と、入力された
音声中に含まれる言葉を音声認識する音声認識部110
と、マイクロホン102にて入力された音声から所定の
雑音を除去し、雑音除去後の外部音声を音声認識部11
0に入力する雑音除去部112と、電話装置100の全
体を制御する全体制御部114と、短縮ダイヤル情報や
音声メッセージデータや制御プログラム等を記憶する記
憶部116と、記憶部116に記憶された音声メッセー
ジデータを再生出力する音声再生部117と、回線との
間でデータの送受信を行うNCU120と、このNCU
120にて送受信されるデータの変調・復調を行うモデ
ム118と、送受話器122と、を含んで構成される。
【0034】また、雑音除去部112は、計算部200
と、調整部202と、減算部204と、を含む。ここ
で、計算部200は、音声データ入力端子106又は音
声再生部117の少なくとも一方から入力された音声デ
ータ(以下「音声データa'」)と、音声再生装置にて
音声データa'に基づいて出力されマイクロホン102
に入力された音声(以下「音声A'」)と、に基づい
て、音声再生装置にて出力された音声がマイクロホン1
02に到達するまでの遅延時間及び減衰量を計算し、計
算結果に基づいて、音声データa'を減算部204に入
力するタイミングと、入力時の音声データa'のレベル
を音声A'のレベルに等しくするための入力レベル調整
量を算出する。具体的には、入力レベルの調整量とし
て、減衰量又は増幅量が算出される。ここで算出された
タイミング及び入力レベル調整量は、タイミングデータ
及び入力レベル調整量データとして、記憶部116に格
納される。
【0035】なお、計算部200における作業は、例え
ばトレーニング作業として、電話装置100の設置時
や、図示しない音声再生装置の設置時等に、独立して行
われることが好ましいが、音声データa'等が雑音除去
部112に入力される度に行うようにしてもよい。
【0036】また、音声再生部117にて再生出力され
た音声メッセージデータに基づいてスピーカ104から
出力されマイクロホン102に入力された音声(以下
「音声A"」)を除去する場合に、音声メッセージデー
タを減算部204に入力するタイミングと、音声メッセ
ージデータのレベルを音声A"に等しくするための入力
レベル調整量は、電話装置100の製造段階で予め求め
られ、既知データとして、予め記憶部116に記憶され
ている。
【0037】調整部202は、記憶部116に格納され
たタイミングデータ、入力レベル調整量データ、あるい
は既知データに基づいて、音声データa'及び音声メッ
セージデータのそれぞれを減算部204に入力する際の
タイミング及び入力レベルを調整する。
【0038】そして、減算部204は、調整部202に
て調整され入力された音声データa'及び音声メッセー
ジデータを、マイクロホン102にて入力された外部音
声から減算処理する。
【0039】この雑音除去部112や音声認識部110
は、ICやLSIにて構成することができる。また、全
体制御部114はCPUで構成することができ、記憶部
116は、ROM、EEPROM、RAM、メモリ等に
より構成することができる。
【0040】このような電話装置100においては、マ
イクロホン102からユーザーが音声を入力することに
より、所定の制御動作を自動的に行わせることができ
る。この場合、図4のフローチャートに示すような手順
で処理が行われる。この図4の説明においては、図3を
適宜参照する。
【0041】つまり、図4において、マイクロホン10
2にて外部音声が入力されると(S10:YES)、音
声データ入力端子106又は音声再生部117の少なく
とも一方から、音声データa'又は音声メッセージデー
タの入力があったか否かが判断される(S11)。この
判断は、雑音除去部112で行うが、全体制御部114
で行ってもよい。なお、音声データ入力端子106に
は、回りこみや減衰が生じる前の音声が入力される。
【0042】ここで、音声データa'及び音声メッセー
ジデータの少なくとも一方の入力があったと判断された
場合には(S11:YES)、雑音除去部112にて雑
音除去処理が行われ、マイクロホン102にて入力され
た外部音声の中から、音声データa'又は音声メッセー
ジデータに基づいて、音声A'又は 音声A"に相当する
分の音声が除去される。
【0043】その後、雑音除去後の外部音声が音声認識
部110に入力されて、音声認識処理が行われる(S1
3)。音声認識処理の結果は、全体制御部114に入力
される。そして、音声認識の結果、外部音声の中から所
定の言葉が音声認識された場合には(S14:YE
S)、記憶部116に格納されたプログラムに基づい
て、所定の制御動作が全体制御部114により自動的に
実行される(S15)。
【0044】例えば、音声再生部117にて再生出力さ
れた音声メッセージがスピーカ104から出力されてい
る間に、ユーザーが、マイクロホン102にて「再生ス
トップ」と音声入力した場合を考えてみる。この場合、
マイクロホン102にて入力された外部音声には(S1
0:YES)、再生中の音声メッセージとユーザーの音
声が含まれている。一方、雑音除去部112には、音声
再生部117から音声メッセージデータが入力されてい
ることから(S11:YES)、音声メッセージデータ
分の音声を外部音声から除去する処理が行われる(S1
2)。その後、音声認識部110にて「再生ストップ」
という言葉が音声認識され(S13,S14:YE
S)、この認識結果に基づいて、全体制御部114によ
り、音声再生部117における再生出力が停止制御され
る(S15)。
【0045】一方、マイクロホン102から外部音声の
入力があったにも拘らず(S10:YES)、音声デー
タa'又は音声メッセージデータのいずれも雑音入力部
112に入力されていない場合には(S11:NO)、
雑音除去処理(S12)を行うことなく、外部音声がそ
のまま音声認識部110に入力されて音声認識処理され
る(S13)。また、音声認識処理(S13)の結果、
所定の言葉が音声認識されなかったと判断された場合に
は(S14:NO)、プログラムが終了する。
【0046】このように、電話装置100では、音声認
識処理前に、マイクロホン102にて入力された外部音
声中から音声A'又は 音声A"に相当する分の音声が除
去されることから、外部の音声再生装置や音声再生部1
17にて音声データa'等を再生出力している最中で
も、ユーザーの発する音声を精度よく音声認識すること
が可能となる。また、音声A'又は 音声A"に言葉が含
まれている場合に、その言葉を音声認識部110が誤認
識する事態の発生を防止することが可能となる。このた
め、音声認識部110の誤認識に基づく電話装置100
の誤動作の発生を確実に防止することができる。
【0047】そして、音声データa'等を減算部204
に入力する際のタイミングや入力レベルの調整量が、自
動的に計算・調整されるため、ユーザーにとって、除去
処理が極めて簡単で、使いやすい電話装置100とな
る。
【0048】さらに、機械を通して発せられた言葉と、
人間が直に発した言葉とを判別できるほど精密な音声認
識部を用いる必要がないことから、コストを低く押さえ
つつ、音声認識精度の高い電話装置100を得ることが
できる。
【0049】なお、電話装置100においては、記憶部
116が音声データ記憶手段に相当し、音声再生部11
7が音声再生手段に相当する。また、雑音除去部112
が雑音除去制御手段に相当し、計算部200、調整部2
02、減算部204が、それぞれ、計算手段、調整手
段、減算手段に相当する。そして、キー入力部108が
キー入力手段に相当し、音声データ入力端子106が接
続手段に相当する。
【0050】また、本発明の実施の形態は、上述の例に
限定されるものではなく、種々の変形が可能である。例
えば、電話装置100において、音声データa'を減算
部204に入力するタイミング及び音声データa'のレ
ベルを音声A'のレベルに等しくするための入力レベル
調整量の少なくとも一方を、計算部200で算出せず、
キー入力部108からの入力によって決定するように構
成することもできる。この場合には、入力タイミングや
入力レベルの調整量を、ユーザーが任意に設定すること
ができる。また、雑音除去部の構成を簡易化できるた
め、構成の簡易化によるコストの一層の低減化を図るこ
とが可能となる。
【0051】
【発明の効果】以上説明したように、請求項1記載の音
声認識装置及び請求項2記載の音声認識システムによれ
ば、人間の音声応答以外の言葉の誤認識を比較的低コス
トで防止することが可能となる。また、請求項3記載の
通信装置によれば、人間の音声応答以外の言葉を誤認識
することにより生ずる通信装置の誤動作を、比較的低コ
ストで防止することが可能となる。
【0052】請求項4記載の通信装置によれば、自ら出
力した音声メッセージを、マイクロホンにて入力された
外部音声中から除去することができるため、音声メッセ
ージの再生中に、該音声メッセージを音声応答と誤認識
して誤動作することを防止することができる。また、人
間の肉声と機械を通して発せられる人間の声を判別でき
るほど精密な音声認識手段を用いる必要がないため、コ
ストを低く押さえることができる。
【0053】請求項5記載の通信装置によれば、スピー
カから出力された音声がマイクロホンに入力されるまで
の遅延時間・減衰量が計算手段にて自動的に計算され、
この計算手段の計算結果に基づいて、調整手段が、音声
データを減算手段に入力する際のタイミング・入力レベ
ルを自動的に調整することから、ユーザーにとって、除
去処理が極めて簡単で、使いやすい通信装置が得られ
る。
【0054】請求項6記載の通信装置によれば、音声デ
ータを減算手段に入力する際のタイミング・入力レベル
を、キー入力部を用いてユーザーが任意に設定できる。
また、構成の一層の簡易化によるコストの低減化を図る
ことが可能となる。
【図面の簡単な説明】
【図1】本発明に係る音声認識装置及び音声認識システ
ムの概略的構成を示すブロック図である。
【図2】音声認識処理手順を示すフローチャートであ
る。
【図3】本実施形態に係る通信装置を電話装置に適用し
た場合の例を示すブロック図である。
【図4】音声入力に基づいて所定の制御動作が行われる
場合の処理手順を示すフローチャートである。
【符号の説明】
10 音声再生装置(音声再生手段) 12 音声認識装置 24 音声認識部(音声認識手段) 26 雑音除去部(除去手段、雑音除去手段) 28 マイクロホン(第2の入力手段) 30 接続部(第1の入力手段) 100 電話装置(通信装置) 102 マイクロホン 104 スピーカ 106 音声データ入力端子(接続手段) 108 キー入力部(キー入力手段) 112 雑音除去部(雑音除去制御手段) 116 記憶部(音声データ記憶手段) 117 音声再生部(音声再生手段) 200 計算部(計算手段) 202 調整部(調整手段) 204 減算部(減算手段)

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 音声再生手段から再生出力される音声デ
    ータが入力される第1の入力手段と、 音声が入力される第2の入力手段と、 前記第2の入力手段にて入力された音声から、前記第1
    の入力手段に入力された音声データに基づいて、前記音
    声再生手段から再生出力されて前記第2の入力手段に入
    力された音声を除去する除去手段と、 前記除去手段から入力された音声を音声認識する音声認
    識手段と、 を備えたことを特徴とする音声認識装置。
  2. 【請求項2】 音声データに基づいて音声を再生出力す
    る音声再生手段と、 マイクロホンにて入力された音声に含まれる所定の雑音
    を除去する雑音除去手段と、 前記雑音除去手段から入力された音声を音声認識する音
    声認識手段と、 を含み、 前記雑音除去手段は、前記音声再生手段に接続されて該
    音声再生手段から出力される前記音声データを取得し、
    この音声データに基づいて、該音声再生手段から再生出
    力されて前記マイクロホンに入力された音声を除去する
    ことを特徴とする音声認識システム。
  3. 【請求項3】 マイクロホンにて入力された外部音声を
    音声認識手段が音声認識し、この音声認識結果に基づい
    て所定の制御動作を自動的に実行可能な通信装置におい
    て、 外部の音声出力源からスピーカを通して音声出力される
    前の音声データを取得するため、該音声出力源に接続さ
    れる接続手段と、 前記接続手段を通じて取得した前記音声データに基づい
    て、前記マイクロホンにて入力された外部音声から、前
    記スピーカより出力されて前記マイクロホンに入力され
    た音声を除去し、除去処理後の外部音声を前記音声認識
    手段に入力する雑音除去制御手段と、 を有することを特徴とする通信装置。
  4. 【請求項4】 マイクロホンにて入力された外部音声を
    音声認識手段が音声認識し、この音声認識結果に基づい
    て所定の制御動作を自動的に実行可能な通信装置におい
    て、 音声メッセージを再生するための音声データを記憶する
    音声データ記憶手段と、 前記音声データを再生してスピーカから出力する音声再
    生手段と、 前記音声データに基づいて、前記マイクロホンにて入力
    された外部音声から、前記スピーカより出力されて前記
    マイクロホンに入力された音声を除去し、除去処理後の
    外部音声を前記音声認識手段に入力する雑音除去制御手
    段と、 を有することを特徴とする通信装置。
  5. 【請求項5】 請求項3または請求項4に記載の通信装
    置において、 前記雑音除去制御手段は、 前記音声データを前記マイクロホンにて入力された外部
    音声から減算して結果を出力する減算手段と、 前記音声データに基づいて、前記スピーカから出力され
    た音声が前記マイクロホンに入力されるまでに生ずる遅
    延時間及び減衰量の少なくとも一方を計算する計算手段
    と、 前記計算手段の計算結果に基づいて、前記音声データを
    前記減算手段に入力する際のタイミング及び入力レベル
    の少なくとも一方を調整する調整手段と、 を有することを特徴とする通信装置。
  6. 【請求項6】 請求項3または請求項4に記載の通信装
    置において、 手動入力を可能とするキー入力手段を有し、 前記雑音除去制御手段は、 前記音声データを前記マイクロホンにて入力された外部
    音声から減算して結果を出力する減算手段と、 前記キー入力手段からの入力に基づいて、前記音声デー
    タを前記減算手段に入力する際のタイミング及び入力レ
    ベルの少なくとも一方を調整する調整手段と、 を有することを特徴とする通信装置。
JP11028096A 1999-02-05 1999-02-05 音声認識装置、音声認識システム及び通信装置 Pending JP2000227799A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11028096A JP2000227799A (ja) 1999-02-05 1999-02-05 音声認識装置、音声認識システム及び通信装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11028096A JP2000227799A (ja) 1999-02-05 1999-02-05 音声認識装置、音声認識システム及び通信装置

Publications (1)

Publication Number Publication Date
JP2000227799A true JP2000227799A (ja) 2000-08-15

Family

ID=12239273

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11028096A Pending JP2000227799A (ja) 1999-02-05 1999-02-05 音声認識装置、音声認識システム及び通信装置

Country Status (1)

Country Link
JP (1) JP2000227799A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016024378A (ja) * 2014-07-22 2016-02-08 Necパーソナルコンピュータ株式会社 情報処理装置、その制御方法及びプログラム
RU2633825C1 (ru) * 2016-07-19 2017-10-18 Александр Валерьевич Погудин Способ повышения активной и пассивной безопасности специальных транспортных средств гражданского назначения

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016024378A (ja) * 2014-07-22 2016-02-08 Necパーソナルコンピュータ株式会社 情報処理装置、その制御方法及びプログラム
RU2633825C1 (ru) * 2016-07-19 2017-10-18 Александр Валерьевич Погудин Способ повышения активной и пассивной безопасности специальных транспортных средств гражданского назначения

Similar Documents

Publication Publication Date Title
US9066167B2 (en) Method and device for personalized voice operated control
US10206032B2 (en) Systems and methods for multi-mode adaptive noise cancellation for audio headsets
JP4520596B2 (ja) 音声認識方法および音声認識装置
US7020292B1 (en) Apparatuses and methods for recognizing an audio input and muting an audio device
KR100382393B1 (ko) 디지털 이동 무선 장치내에서 음성 및 다른 음향을기록하고 재생하기 위한 회로 및 방법
JP3533051B2 (ja) 自動音声応答機能付き電話機
JP2000227799A (ja) 音声認識装置、音声認識システム及び通信装置
WO2022135071A1 (zh) 耳机播放控制方法、装置、电子设备及存储介质
US6327483B1 (en) Mobile radio communication equipment
EP1445760B1 (en) Speaker verifying apparatus
KR101386883B1 (ko) 휴대 단말기 및 그 통화 기능 수행 방법
JPH0256600A (ja) 音声ダイヤリング方式
JP4059059B2 (ja) 情報取得装置および情報提供システム
JPH11194797A (ja) 音声認識作動装置
JPH08172480A (ja) 留守番電話機
JP4299768B2 (ja) 音声認識装置、方法及び音声認識方法を用いた携帯型情報端末装置
JP2929676B2 (ja) 留守番電話装置
JP2020127071A (ja) 電子機器及びその制御方法
JP3325147B2 (ja) 電話機
CN114582362A (zh) 一种处理方法和处理装置
JP2830508B2 (ja) 電話機
JP2848285B2 (ja) エコーキャンセラ回路
JPH0983633A (ja) 受信装置
JP2009077139A (ja) 電話機の通話録音装置
JPS6069945A (ja) 留守番電話装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20051214

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060118

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080709

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090401