JP2000125006A - 音声認識装置、音声認識方法、及び電話自動応答装置 - Google Patents
音声認識装置、音声認識方法、及び電話自動応答装置Info
- Publication number
- JP2000125006A JP2000125006A JP10296297A JP29629798A JP2000125006A JP 2000125006 A JP2000125006 A JP 2000125006A JP 10296297 A JP10296297 A JP 10296297A JP 29629798 A JP29629798 A JP 29629798A JP 2000125006 A JP2000125006 A JP 2000125006A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- dictionary
- telephone
- recognition
- environment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Telephonic Communication Services (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
(57)【要約】
【課題】 認識対象となる音声が限定されることがな
く、且つ、音声の認識性能が低くなることがないように
する。 【解決手段】 主制御部5は、電話回線制御部3からの
着信検出情報及び発信者電話番号情報の通知を受ける
と、電話番号情報を辞書選択部11に通知し、制御部3
に回線接続要求を送る。選択部11から使用すべき辞書
種別の情報が送られると、それを音声認識部7に通知す
る。応答ガイダンス出力部9に応答文の出力要求を送
り、出力部9から公衆用電話回線網1に上記要求に応じ
た応答文を出力した旨のガイダンス出力終了通知が送ら
れると、認識部7に音声認識の実行を要求する。認識部
7から認識結果が通知されると、一連の処理動作を終了
させるか否か判定する。選択部11は電話番号情報が送
られると、電話番号/辞書対応テーブル19により電話
番号情報が携帯、PHS、一般のいずれの電話機のもの
か識別する。識別結果に基づき携帯電話用辞書13、一
般公衆回線用辞書15、PHS回線用辞書17の中から
使用する辞書を選択し主制御部5に通知する。
く、且つ、音声の認識性能が低くなることがないように
する。 【解決手段】 主制御部5は、電話回線制御部3からの
着信検出情報及び発信者電話番号情報の通知を受ける
と、電話番号情報を辞書選択部11に通知し、制御部3
に回線接続要求を送る。選択部11から使用すべき辞書
種別の情報が送られると、それを音声認識部7に通知す
る。応答ガイダンス出力部9に応答文の出力要求を送
り、出力部9から公衆用電話回線網1に上記要求に応じ
た応答文を出力した旨のガイダンス出力終了通知が送ら
れると、認識部7に音声認識の実行を要求する。認識部
7から認識結果が通知されると、一連の処理動作を終了
させるか否か判定する。選択部11は電話番号情報が送
られると、電話番号/辞書対応テーブル19により電話
番号情報が携帯、PHS、一般のいずれの電話機のもの
か識別する。識別結果に基づき携帯電話用辞書13、一
般公衆回線用辞書15、PHS回線用辞書17の中から
使用する辞書を選択し主制御部5に通知する。
Description
【0001】
【発明の属する技術分野】本発明は、音声認識装置、音
声認識方法、及び電話自動応答装置の改良に関するもの
である。以下、音声認識装置を電話自動応答装置に適用
した例について説明する。
声認識方法、及び電話自動応答装置の改良に関するもの
である。以下、音声認識装置を電話自動応答装置に適用
した例について説明する。
【0002】
【従来の技術】一般に、音声認識処理においては、入力
した音声信号をアナログ信号からディジタル信号に変換
し、そのディジタル信号から特徴量を計算し、その特徴
量と認識用辞書との比較結果に基づいて認識結果を取得
する。上記認識用辞書は、音韻モデルや文法モデル等の
音声認識用の基本辞書(基本辞書)を基にして認識語
彙、即ち、認識対象の単語や或いは認識対象の文章を構
成するための単語から構成される。また、音声認識用の
基本辞書は、予め大量の音声データを基に作成される。
音声認識処理において、認識用辞書を用いる理由は、現
状では基本辞書により凡ゆる言葉を認識することが困難
なためである。
した音声信号をアナログ信号からディジタル信号に変換
し、そのディジタル信号から特徴量を計算し、その特徴
量と認識用辞書との比較結果に基づいて認識結果を取得
する。上記認識用辞書は、音韻モデルや文法モデル等の
音声認識用の基本辞書(基本辞書)を基にして認識語
彙、即ち、認識対象の単語や或いは認識対象の文章を構
成するための単語から構成される。また、音声認識用の
基本辞書は、予め大量の音声データを基に作成される。
音声認識処理において、認識用辞書を用いる理由は、現
状では基本辞書により凡ゆる言葉を認識することが困難
なためである。
【0003】
【発明が解決しようとする課題】ところで、音声認識の
性能は、認識すべき音声の環境が基本辞書作成時のそれ
と同一であるときには高く、そうでないときには低くな
ることが知られている。例えば、基本辞書作成用の音声
データが、携帯電話機からのものである場合、その基本
辞書から作成する認識用辞書を用いて携帯電話機から発
せられた音声の認識処理を行うときには高い認識性能が
得られる。しかし、上記認識用辞書では携帯電話機とは
環境が異なる電話機、例えば公衆用電話回線に接続され
る通常の電話機からの音声の認識処理においては低い認
識性能しか得られない。そのため、上記のように各種電
話機からの音声を認識対象にする例では、各々の基本辞
書の作成環境に対応する環境の電話機からの音声のみを
認識対象に限定し、対応する認識用辞書を用いて認識処
理を行う必要がある。一方、上記の例において、認識対
象を敢えて限定しない場合には、環境の違いによる差分
を吸収するために、各種電話機に夫々対応する環境毎の
音声データを基に作成した基本辞書から得られた認識用
辞書を、音声認識に使用することになる。しかし、各々
の環境に適合した認識用辞書を使用して音声認識を行う
場合に比較して、認識性能が低くなるのは避けられな
い。
性能は、認識すべき音声の環境が基本辞書作成時のそれ
と同一であるときには高く、そうでないときには低くな
ることが知られている。例えば、基本辞書作成用の音声
データが、携帯電話機からのものである場合、その基本
辞書から作成する認識用辞書を用いて携帯電話機から発
せられた音声の認識処理を行うときには高い認識性能が
得られる。しかし、上記認識用辞書では携帯電話機とは
環境が異なる電話機、例えば公衆用電話回線に接続され
る通常の電話機からの音声の認識処理においては低い認
識性能しか得られない。そのため、上記のように各種電
話機からの音声を認識対象にする例では、各々の基本辞
書の作成環境に対応する環境の電話機からの音声のみを
認識対象に限定し、対応する認識用辞書を用いて認識処
理を行う必要がある。一方、上記の例において、認識対
象を敢えて限定しない場合には、環境の違いによる差分
を吸収するために、各種電話機に夫々対応する環境毎の
音声データを基に作成した基本辞書から得られた認識用
辞書を、音声認識に使用することになる。しかし、各々
の環境に適合した認識用辞書を使用して音声認識を行う
場合に比較して、認識性能が低くなるのは避けられな
い。
【0004】上述したように、従来においては、認識対
象となる音声の環境を限定し、その環境に対応する認識
用辞書を用いて音声認識を行う方法、又は全ての環境に
対応すべく作成した認識用辞書を用いて音声認識を行う
方法のいずれかが採用されていた。しかし、前者では認
識対象が限定され、後者では認識性能が低くなるという
問題があった。
象となる音声の環境を限定し、その環境に対応する認識
用辞書を用いて音声認識を行う方法、又は全ての環境に
対応すべく作成した認識用辞書を用いて音声認識を行う
方法のいずれかが採用されていた。しかし、前者では認
識対象が限定され、後者では認識性能が低くなるという
問題があった。
【0005】従って本発明の目的は、認識対象となる音
声が限定されることがなく、且つ、音声の認識性能が低
くなることがないようにすることにある。
声が限定されることがなく、且つ、音声の認識性能が低
くなることがないようにすることにある。
【0006】
【課題を解決するための手段】本発明の第1の側面に従
う音声認識装置は、認識対象となる音声の環境毎に設定
した複数の音声認識用辞書と、入力した音声の環境を識
別する手段と、各辞書の中から識別した環境に適合する
辞書を選択する手段とを備え、選択した辞書を用いて入
力した音声の認識処理を行うように構成される。
う音声認識装置は、認識対象となる音声の環境毎に設定
した複数の音声認識用辞書と、入力した音声の環境を識
別する手段と、各辞書の中から識別した環境に適合する
辞書を選択する手段とを備え、選択した辞書を用いて入
力した音声の認識処理を行うように構成される。
【0007】上記構成において、選択手段が選択した音
声認識用辞書を用いて入力した音声の認識処理を行うよ
うにしたので、認識対象となる音声が限定されることが
なく、且つ、音声の認識性能が低くなることがない。
声認識用辞書を用いて入力した音声の認識処理を行うよ
うにしたので、認識対象となる音声が限定されることが
なく、且つ、音声の認識性能が低くなることがない。
【0008】本発明の第1の側面に係る好適な実施形態
では、認識対象となる各音声の環境毎の音声データを基
に作成した基本辞書から得られる音声認識用辞書を更に
備え、識別手段は、入力した音声の環境を識別できなか
ったとき、上述の音声認識用辞書を用いて音声の認識処
理を行う。認識対象となる音声は、携帯電話機、PHS
及び公衆用電話回線網に接続される通常の電話機のいず
れかから発呼されたものである。また、上記複数の音声
認識用辞書は、携帯電話機からの音声、PHSからの音
声、及び通常の電話機からの音声に夫々対応して設定さ
れる音声認識用辞書である。
では、認識対象となる各音声の環境毎の音声データを基
に作成した基本辞書から得られる音声認識用辞書を更に
備え、識別手段は、入力した音声の環境を識別できなか
ったとき、上述の音声認識用辞書を用いて音声の認識処
理を行う。認識対象となる音声は、携帯電話機、PHS
及び公衆用電話回線網に接続される通常の電話機のいず
れかから発呼されたものである。また、上記複数の音声
認識用辞書は、携帯電話機からの音声、PHSからの音
声、及び通常の電話機からの音声に夫々対応して設定さ
れる音声認識用辞書である。
【0009】識別手段は、通知された発信者電話番号に
基づいて認識対象となる音声の環境を識別する。この識
別は、例えば通知された発信者電話番号と、複数の電話
番号が携帯電話機、PHS及び通常の電話機毎に分類さ
れて登録されている電話番号/辞書テーブルとを対照す
ることにより行われる。選択手段は、識別結果に基づい
て各音声認識用辞書の中から対応する辞書を選択する。
基づいて認識対象となる音声の環境を識別する。この識
別は、例えば通知された発信者電話番号と、複数の電話
番号が携帯電話機、PHS及び通常の電話機毎に分類さ
れて登録されている電話番号/辞書テーブルとを対照す
ることにより行われる。選択手段は、識別結果に基づい
て各音声認識用辞書の中から対応する辞書を選択する。
【0010】本発明の第2の側面に従う音声認識方法
は、認識対象となる音声の環境毎に夫々音声認識用辞書
を設定すると共に、入力された音声の環境を識別する第
1の過程と、各辞書の中から識別された環境に適合する
辞書を選択する第2の過程と、選択した辞書を用いて入
力した音声の認識処理を行う第3の過程とを備える。
は、認識対象となる音声の環境毎に夫々音声認識用辞書
を設定すると共に、入力された音声の環境を識別する第
1の過程と、各辞書の中から識別された環境に適合する
辞書を選択する第2の過程と、選択した辞書を用いて入
力した音声の認識処理を行う第3の過程とを備える。
【0011】本発明の第3の側面に従う電話自動応答装
置は、受信した音声に基づいて発呼側電話機に自動応答
するもので、認識対象となる音声の環境毎に設定した複
数の音声認識用辞書と、受信した音声の環境に適合する
辞書を各辞書の中から選択して、音声の認識処理を行う
手段と、認識処理の結果に応じた応答用のメッセージ
を、発呼側電話機に送信する手段とを備える。
置は、受信した音声に基づいて発呼側電話機に自動応答
するもので、認識対象となる音声の環境毎に設定した複
数の音声認識用辞書と、受信した音声の環境に適合する
辞書を各辞書の中から選択して、音声の認識処理を行う
手段と、認識処理の結果に応じた応答用のメッセージ
を、発呼側電話機に送信する手段とを備える。
【0012】本発明の第3の側面に係る好適な実施形態
では、発呼側電話機は、携帯電話機、PHS及び公衆用
電話回線網に接続される通常の電話機のいずれかであ
る。複数の音声認識用辞書は、携帯電話機からの音声、
PHSからの音声、及び通常の電話機からの音声に夫々
対応して設定される音声認識用辞書である。
では、発呼側電話機は、携帯電話機、PHS及び公衆用
電話回線網に接続される通常の電話機のいずれかであ
る。複数の音声認識用辞書は、携帯電話機からの音声、
PHSからの音声、及び通常の電話機からの音声に夫々
対応して設定される音声認識用辞書である。
【0013】上記実施形態に係る変形例では、認識対象
となる各音声の環境毎の音声データを基に作成した基本
辞書から得られる音声認識用辞書を更に備え、音声認識
処理手段は、入力した音声の環境を識別できなかったと
き、上述の音声認識用辞書を用いて音声の認識処理を行
う。また、音声認識処理手段は、通知された発信者電話
番号と、複数の電話番号が携帯電話機、PHS及び通常
の電話機毎に分類されて登録されている電話番号/辞書
テーブルとを対照することにより、音声の環境を識別す
る。
となる各音声の環境毎の音声データを基に作成した基本
辞書から得られる音声認識用辞書を更に備え、音声認識
処理手段は、入力した音声の環境を識別できなかったと
き、上述の音声認識用辞書を用いて音声の認識処理を行
う。また、音声認識処理手段は、通知された発信者電話
番号と、複数の電話番号が携帯電話機、PHS及び通常
の電話機毎に分類されて登録されている電話番号/辞書
テーブルとを対照することにより、音声の環境を識別す
る。
【0014】本発明の第4の側面に従うプログラム媒体
は、認識対象となる音声の環境毎に設定した複数の音声
認識用辞書と、入力された音声の環境を識別する手段
と、各辞書の中から識別された環境に適合する辞書を選
択する手段とを備え、選択した辞書を用いて入力した音
声の認識処理を行う音声認識装置における各手段として
コンピュータを動作させるためのコンピュータプログラ
ムをコンピュータ読取可能に担持する。
は、認識対象となる音声の環境毎に設定した複数の音声
認識用辞書と、入力された音声の環境を識別する手段
と、各辞書の中から識別された環境に適合する辞書を選
択する手段とを備え、選択した辞書を用いて入力した音
声の認識処理を行う音声認識装置における各手段として
コンピュータを動作させるためのコンピュータプログラ
ムをコンピュータ読取可能に担持する。
【0015】
【発明の実施の形態】以下、本発明の実施の形態を、図
面により詳細に説明する。
面により詳細に説明する。
【0016】図1は、本発明の一実施形態が適用される
電話自動応答装置の全体構成を示すブロック図である。
電話自動応答装置の全体構成を示すブロック図である。
【0017】上記装置は、図1に示すように、公衆用電
話回線網(回線)1に接続されるもので、電話回線制御
部(制御部)3と、主制御部5と、音声認識部7と、応
答ガイダンス出力部(出力部)9とを備える。上記装置
は、上記各部に加えて、更に辞書選択部(選択部)11
と、携帯電話用辞書(携帯用辞書)13と、一般公衆回
線用辞書(公衆用辞書)15と、PHS回線用辞書(P
HS用辞書)17と、電話番号/辞書対応テーブル(テ
ーブル)19をも備える。
話回線網(回線)1に接続されるもので、電話回線制御
部(制御部)3と、主制御部5と、音声認識部7と、応
答ガイダンス出力部(出力部)9とを備える。上記装置
は、上記各部に加えて、更に辞書選択部(選択部)11
と、携帯電話用辞書(携帯用辞書)13と、一般公衆回
線用辞書(公衆用辞書)15と、PHS回線用辞書(P
HS用辞書)17と、電話番号/辞書対応テーブル(テ
ーブル)19をも備える。
【0018】制御部3は、回線1からの着信を検出する
と共に、着信検出時に、回線1を通じて送信される発信
者番号通知を受信し、その通知から発信者の電話番号を
検知する。制御部3は、上記着信検出及び発信者電話番
号を、主制御部5に着信検出情報及び発信者電話番号情
報として通知する。制御部3は、また、主制御部5から
の回線接続要求を受付け、その要求に基づいて回線1を
接続し、主制御部5に対し回線1との接続が完了した旨
を通知する。制御部3は、更に、出力部9から応答文が
送られると、それを受付けて回線1に出力する。
と共に、着信検出時に、回線1を通じて送信される発信
者番号通知を受信し、その通知から発信者の電話番号を
検知する。制御部3は、上記着信検出及び発信者電話番
号を、主制御部5に着信検出情報及び発信者電話番号情
報として通知する。制御部3は、また、主制御部5から
の回線接続要求を受付け、その要求に基づいて回線1を
接続し、主制御部5に対し回線1との接続が完了した旨
を通知する。制御部3は、更に、出力部9から応答文が
送られると、それを受付けて回線1に出力する。
【0019】主制御部5は、制御部3からの着信検出情
報及び発信者電話番号情報の通知を受けると、発信者電
話番号情報を選択部11に通知すると共に、制御部3に
対し、回線接続要求を送る。主制御部5は、選択部11
から使用すべき辞書種別に係る情報(辞書種別情報)が
送られると、それを受付け、その情報を音声認識部7に
通知する。
報及び発信者電話番号情報の通知を受けると、発信者電
話番号情報を選択部11に通知すると共に、制御部3に
対し、回線接続要求を送る。主制御部5は、選択部11
から使用すべき辞書種別に係る情報(辞書種別情報)が
送られると、それを受付け、その情報を音声認識部7に
通知する。
【0020】主制御部5は、また、出力部9に対し応答
文の出力要求を送り、出力部9から制御部3を通じて回
線1に上記要求に応じた応答文を出力した旨のガイダン
ス出力終了通知が送られると、それを受付けると共に、
音声認識部7に対して音声認識の実行を要求する。主制
御部5は、更に、音声認識部7から音声認識結果が通知
されると、それを受付けると共に、一連の音声認識処理
の動作を終了させるべきか否かを判定する。そして、終
了させるべきでないと判定したときは、上記音声認識結
果に基づいて応答ガイダンス文を決定し、出力部9に対
し、再度応答文の出力要求を送る。
文の出力要求を送り、出力部9から制御部3を通じて回
線1に上記要求に応じた応答文を出力した旨のガイダン
ス出力終了通知が送られると、それを受付けると共に、
音声認識部7に対して音声認識の実行を要求する。主制
御部5は、更に、音声認識部7から音声認識結果が通知
されると、それを受付けると共に、一連の音声認識処理
の動作を終了させるべきか否かを判定する。そして、終
了させるべきでないと判定したときは、上記音声認識結
果に基づいて応答ガイダンス文を決定し、出力部9に対
し、再度応答文の出力要求を送る。
【0021】音声認識部7は、主制御部5から辞書種別
情報が送られると、それを受付けると共に、上記情報
(辞書種別)で音声認識部7自身の初期化を行う。音声
認識部7は、また、主制御部5から音声認識を実行すべ
き旨の要求が送られると、それを受付けると共に、回線
1から制御部3経由で認識対象となる音声情報を取得
し、音声認識処理を実行する。そして、その音声認識処
理により得られた音声認識結果を主制御部5に通知す
る。
情報が送られると、それを受付けると共に、上記情報
(辞書種別)で音声認識部7自身の初期化を行う。音声
認識部7は、また、主制御部5から音声認識を実行すべ
き旨の要求が送られると、それを受付けると共に、回線
1から制御部3経由で認識対象となる音声情報を取得
し、音声認識処理を実行する。そして、その音声認識処
理により得られた音声認識結果を主制御部5に通知す
る。
【0022】出力部9は、主制御部5から応答文の出力
要求が送られると、それを受付けると共に、その要求に
対応する応答文を制御部3を通じて回線1に出力し、そ
の後、ガイダンス出力終了通知を主制御部5に送る。
要求が送られると、それを受付けると共に、その要求に
対応する応答文を制御部3を通じて回線1に出力し、そ
の後、ガイダンス出力終了通知を主制御部5に送る。
【0023】選択部11は、主制御部5から発信者電話
番号情報が送られると、それを受付けると共に、テーブ
ル19を参照することにより上記電話番号情報が携帯、
PHS、一般のいずれの電話機の電話番号かを識別す
る。そして、その識別結果に基づいて携帯用辞書13、
公衆用辞書15、PHS用辞書17のうちから使用すべ
き辞書を選択し、選択した辞書種別を主制御部5に通知
する。
番号情報が送られると、それを受付けると共に、テーブ
ル19を参照することにより上記電話番号情報が携帯、
PHS、一般のいずれの電話機の電話番号かを識別す
る。そして、その識別結果に基づいて携帯用辞書13、
公衆用辞書15、PHS用辞書17のうちから使用すべ
き辞書を選択し、選択した辞書種別を主制御部5に通知
する。
【0024】携帯用辞書13、公衆用辞書15及びPH
S用辞書17は、いずれも上述した認識用辞書である。
携帯用辞書13には、携帯電話機の電話番号であること
を示す所定の番号情報と、各々の電話番号情報とが夫々
対応付けられて登録されており、公衆用辞書15には、
通常の電話機の電話番号であることを示す所定の番号情
報と、各々の電話番号情報とが夫々対応付けられて登録
されている。更に、PHS用辞書17にも、上記各辞書
13、15におけると同様に、PHSの電話番号である
ことを示す所定の番号情報と、各々の電話番号情報とが
夫々対応付けられて登録されている。
S用辞書17は、いずれも上述した認識用辞書である。
携帯用辞書13には、携帯電話機の電話番号であること
を示す所定の番号情報と、各々の電話番号情報とが夫々
対応付けられて登録されており、公衆用辞書15には、
通常の電話機の電話番号であることを示す所定の番号情
報と、各々の電話番号情報とが夫々対応付けられて登録
されている。更に、PHS用辞書17にも、上記各辞書
13、15におけると同様に、PHSの電話番号である
ことを示す所定の番号情報と、各々の電話番号情報とが
夫々対応付けられて登録されている。
【0025】既述の内容から明らかなように、テーブル
19には、制御部3を通じて主制御部5から選択部11
に送られた発信者電話番号情報が、携帯用辞書13、公
衆用辞書15、PHS用辞書17のうちのいずれに属す
るかを識別するための情報が格納されている。
19には、制御部3を通じて主制御部5から選択部11
に送られた発信者電話番号情報が、携帯用辞書13、公
衆用辞書15、PHS用辞書17のうちのいずれに属す
るかを識別するための情報が格納されている。
【0026】図2は、上述したテーブル19の一例を示
す説明図である。
す説明図である。
【0027】テーブル19は、図2に示すように、携帯
用辞書13、公衆用辞書15及びPHS用辞書17に夫
々割当てられた辞書種別情報格納領域19aと、それら
の分割された各々の格納領域19a毎に割当てられる電
話番号情報格納領域19bとを備えている。
用辞書13、公衆用辞書15及びPHS用辞書17に夫
々割当てられた辞書種別情報格納領域19aと、それら
の分割された各々の格納領域19a毎に割当てられる電
話番号情報格納領域19bとを備えている。
【0028】格納領域19bの、携帯用辞書13に対応
する領域には、携帯電話機の電話番号であることを示す
010、020、030、040及び080の番号情報
と、これらの番号情報毎に対応付けられている各々の電
話番号情報とが登録されている。また、格納領域19b
の、公衆用辞書15に対応する領域には、通常の電話機
の電話番号であることを示す011、0166〜099
の番号情報(つまり市外局番。これらの市外局番から地
域が特定できる)と、これらの番号情報毎に対応付けら
れている各々の電話番号情報とが登録されている。更
に、格納領域19bの、PHS用辞書17に対応する領
域には、PHSの電話番号であることを示す050の番
号情報と、この番号情報毎に対応付けられている電話番
号情報とが登録されている。
する領域には、携帯電話機の電話番号であることを示す
010、020、030、040及び080の番号情報
と、これらの番号情報毎に対応付けられている各々の電
話番号情報とが登録されている。また、格納領域19b
の、公衆用辞書15に対応する領域には、通常の電話機
の電話番号であることを示す011、0166〜099
の番号情報(つまり市外局番。これらの市外局番から地
域が特定できる)と、これらの番号情報毎に対応付けら
れている各々の電話番号情報とが登録されている。更
に、格納領域19bの、PHS用辞書17に対応する領
域には、PHSの電話番号であることを示す050の番
号情報と、この番号情報毎に対応付けられている電話番
号情報とが登録されている。
【0029】図3は、図1に記載した装置各部の処理動
作を示すタイミングチャートである。
作を示すタイミングチャートである。
【0030】図3において、まず、制御部3が回線1か
らの着信を検出すると(ステップS21)、次に、受信
した発信者番号通知から発信者の電話番号を検知し(ス
テップS22)、上記着信検出及び発信者電話番号を主
制御部7に通知する(ステップS23)。上記発信者電
話番号は、主制御部5によって受付けられた後、選択部
11に通知され(ステップS24)、この通知と並行し
て、主制御部5から回線接続要求が制御部3に送られる
(ステップS25)。上記通知を受付けると、選択部1
1では、テーブル19を参照することにより上記電話番
号の属する電話機の種類を識別すると共に、使用すべき
辞書の種別を選択し、選択した辞書種別を主制御部5に
通知する(ステップS26)。
らの着信を検出すると(ステップS21)、次に、受信
した発信者番号通知から発信者の電話番号を検知し(ス
テップS22)、上記着信検出及び発信者電話番号を主
制御部7に通知する(ステップS23)。上記発信者電
話番号は、主制御部5によって受付けられた後、選択部
11に通知され(ステップS24)、この通知と並行し
て、主制御部5から回線接続要求が制御部3に送られる
(ステップS25)。上記通知を受付けると、選択部1
1では、テーブル19を参照することにより上記電話番
号の属する電話機の種類を識別すると共に、使用すべき
辞書の種別を選択し、選択した辞書種別を主制御部5に
通知する(ステップS26)。
【0031】一方、制御部3では、主制御部5からの回
線接続要求に応じて回線1を接続し、主制御部5に対し
回線1との接続が完了した旨を通知する(ステップS2
7)。次に、主制御部5は、選択部11から辞書種別情
報が送られると、それを受付け、その情報を音声認識部
7に通知する(ステップS28)。上記情報を受付ける
と、音声認識部7はそれによって自身の初期化を行う
(ステップS29)。
線接続要求に応じて回線1を接続し、主制御部5に対し
回線1との接続が完了した旨を通知する(ステップS2
7)。次に、主制御部5は、選択部11から辞書種別情
報が送られると、それを受付け、その情報を音声認識部
7に通知する(ステップS28)。上記情報を受付ける
と、音声認識部7はそれによって自身の初期化を行う
(ステップS29)。
【0032】次に、主制御部5は、出力部9に対し、応
答文の出力要求を送る(ステップS30)。その出力要
求を受付けると、出力部9は、その要求に対応する応答
文を制御部3を通じて回線1に出力すると共に(ステッ
プS31)、ガイダンス出力終了通知を主制御部5に送
る(ステップS32)。この通知を受付けると、主制御
部5は、音声認識部7に対し音声認識の実行を要求する
(ステップS33)。音声認識部7では、回線1から制
御部3経由で認識対象である音声情報を取得し、音声認
識処理を実行する(ステップS34)。そして、その音
声認識処理により得られた音声認識結果を主制御部5に
通知する(ステップS35)。
答文の出力要求を送る(ステップS30)。その出力要
求を受付けると、出力部9は、その要求に対応する応答
文を制御部3を通じて回線1に出力すると共に(ステッ
プS31)、ガイダンス出力終了通知を主制御部5に送
る(ステップS32)。この通知を受付けると、主制御
部5は、音声認識部7に対し音声認識の実行を要求する
(ステップS33)。音声認識部7では、回線1から制
御部3経由で認識対象である音声情報を取得し、音声認
識処理を実行する(ステップS34)。そして、その音
声認識処理により得られた音声認識結果を主制御部5に
通知する(ステップS35)。
【0033】主制御部5では、上記音声認識結果を受付
けると、それに基づいて一連の音声認識処理の動作を終
了させるべきか否かを判定する(ステップS36)。こ
の判定の結果、終了させても差支えないと判断したとき
には、一連の処理動作を終了し、制御部3は着信待ちの
状態になる(ステップS37)。一方、終了させるべき
でないと判断したときには、上記音声認識結果に基づい
て応答ガイダンス文を再度決定し、出力部9に対し、再
度応答文の出力要求を送る(ステップS30)。このよ
うに、応答文の出力と音声認識処理とを繰り返し実行す
ることによって一連の処理動作が終了する。
けると、それに基づいて一連の音声認識処理の動作を終
了させるべきか否かを判定する(ステップS36)。こ
の判定の結果、終了させても差支えないと判断したとき
には、一連の処理動作を終了し、制御部3は着信待ちの
状態になる(ステップS37)。一方、終了させるべき
でないと判断したときには、上記音声認識結果に基づい
て応答ガイダンス文を再度決定し、出力部9に対し、再
度応答文の出力要求を送る(ステップS30)。このよ
うに、応答文の出力と音声認識処理とを繰り返し実行す
ることによって一連の処理動作が終了する。
【0034】以上説明したように、本発明の一実施形態
によれば、発信者の使用している電話機が携帯電話機、
PHS、通常の電話機のうちのいずれであるかを示す電
話機種別や発信地域などの環境を特定することができる
ため、受信した音声を認識する際に、各環境用に用意さ
れた音声認識用辞書を使用することができる。そのた
め、認識精度を向上させることができ、これにより、上
記電話自動応答装置を備えるシステム全体の使い易さも
向上させることができる。
によれば、発信者の使用している電話機が携帯電話機、
PHS、通常の電話機のうちのいずれであるかを示す電
話機種別や発信地域などの環境を特定することができる
ため、受信した音声を認識する際に、各環境用に用意さ
れた音声認識用辞書を使用することができる。そのた
め、認識精度を向上させることができ、これにより、上
記電話自動応答装置を備えるシステム全体の使い易さも
向上させることができる。
【0035】なお、上述した内容は、あくまで本発明の
一実施形態に関するものであって、本発明が上記内容の
みに限定されることを意味するものでないのは勿論であ
る。例えば、上記電話自動応答装置において、上記各辞
書13〜17に加えて、認識対象となる各音声の環境毎
の音声データを基に作成した基本辞書から得られる音声
認識用辞書を更に備え、選択部11が、入力した音声の
環境を識別できなかったとき、上記音声認識用辞書を用
いて音声認識処理を行うこともできる。
一実施形態に関するものであって、本発明が上記内容の
みに限定されることを意味するものでないのは勿論であ
る。例えば、上記電話自動応答装置において、上記各辞
書13〜17に加えて、認識対象となる各音声の環境毎
の音声データを基に作成した基本辞書から得られる音声
認識用辞書を更に備え、選択部11が、入力した音声の
環境を識別できなかったとき、上記音声認識用辞書を用
いて音声認識処理を行うこともできる。
【0036】
【発明の効果】以上説明したように、本発明によれば、
認識対象となる音声が限定されることがなく、且つ、音
声の認識性能が低くなることがないようにすることがで
きる。
認識対象となる音声が限定されることがなく、且つ、音
声の認識性能が低くなることがないようにすることがで
きる。
【図1】本発明の一実施形態が適用される電話自動応答
装置の全体構成を示すブロック図。
装置の全体構成を示すブロック図。
【図2】図1の装置が備える電話番号/辞書テーブルの
一例を示す説明図。
一例を示す説明図。
【図3】図1の装置各部の処理動作を示すタイミングチ
ャート。
ャート。
1 公衆用電話回線網(回線) 3 電話回線制御部(制御部) 5 主制御部 7 音声認識部 9 応答ガイダンス出力部(出力部) 11 辞書選択部(選択部) 13 携帯電話用辞書(携帯用辞書) 15 一般公衆回線用辞書(公衆用辞書) 17 PHS回線用辞書(PHS用辞書) 19 電話番号/辞書対応テーブル(テーブル)
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D015 GG01 HH13 KK02 KK04 5K015 AA06 AA07 AF07 GA07 5K024 AA75 AA76 BB01 BB03 BB04 CC01 CC11 DD01 DD02 EE01 EE09 FF06 GG01 GG10 5K067 AA23 BB04 DD54 EE02 FF32 GG13
Claims (14)
- 【請求項1】 認識対象となる音声の環境毎に設定した
複数の音声認識用辞書と、 入力した音声の環境を識別する手段と、 前記各辞書の中から識別した環境に適合する辞書を選択
する手段とを備え、 前記選択した辞書を用いて入力した音声の認識処理を行
う音声認識装置。 - 【請求項2】 請求項1記載の音声認識装置において、 認識対象となる各音声の環境毎の音声データを基に作成
した基本辞書から得られる音声認識用辞書を更に備え、 前記識別手段が、入力した音声の環境を識別できなかっ
たとき、前記音声認識用辞書を用いて前記音声の認識処
理を行うことを特徴とする音声認識装置。 - 【請求項3】 請求項1記載の音声認識装置において、 前記認識対象となる音声が、携帯電話機、PHS及び公
衆用電話回線網に接続される通常の電話機のいずれかか
ら発呼されたものであることを特徴とする音声認識装
置。 - 【請求項4】 請求項1乃至請求項3のいずれか1項記
載の音声認識装置において、 前記複数の音声認識用辞書が、携帯電話機からの音声、
PHSからの音声、及び通常の電話機からの音声に夫々
対応して設定される音声認識用辞書であることを特徴と
する音声認識装置。 - 【請求項5】 請求項1乃至請求項4のいずれか1項記
載の音声認識装置において、 前記識別手段が、通知された発信者電話番号に基づいて
認識対象となる音声の環境を識別することを特徴とする
音声認識装置。 - 【請求項6】 請求項5記載の音声認識装置において、 前記識別手段が、通知された発信者電話番号と、複数の
電話番号が携帯電話機、PHS及び通常の電話機毎に分
類されて登録されている電話番号/辞書テーブルとを対
照することにより、前記音声の環境を識別することを特
徴とする音声認識装置。 - 【請求項7】 請求項6記載の音声認識装置において、 前記選択手段が、前記識別結果に基づいて前記各音声認
識用辞書の中から対応する辞書を選択することを特徴と
する音声認識装置。 - 【請求項8】 認識対象となる音声の環境毎に夫々音声
認識用辞書を設定すると共に、 入力された音声の環境を識別する第1の過程と、 前記各辞書の中から識別された環境に適合する辞書を選
択する第2の過程と、 前記選択した辞書を用いて入力した音声の認識処理を行
う第3の過程と、 を備える音声認識方法。 - 【請求項9】 受信した音声に基づいて発呼側電話機に
自動応答する装置において、 認識対象となる音声の環境毎に設定した複数の音声認識
用辞書と、 前記受信した音声の環境に適合する辞書を前記各辞書の
中から選択して、前記音声の認識処理を行う手段と、 前記認識処理の結果に応じた応答用のメッセージを、前
記発呼側電話機に送信する手段と、 を備えることを特徴とする電話自動応答装置。 - 【請求項10】 請求項9記載の電話自動応答装置にお
いて、 前記発呼側電話機が、携帯電話機、PHS及び公衆用電
話回線網に接続される通常の電話機のいずれかであるこ
とを特徴とする電話自動応答装置。 - 【請求項11】 請求項9記載の電話自動応答装置にお
いて、 前記複数の音声認識用辞書が、携帯電話機からの音声、
PHSからの音声、及び通常の電話機からの音声に夫々
対応して設定される音声認識用辞書であることを特徴と
する電話自動応答装置。 - 【請求項12】 請求項9記載の電話自動応答装置にお
いて、 認識対象となる各音声の環境毎の音声データを基に作成
した基本辞書から得られる音声認識用辞書を更に備え、 前記音声認識処理手段が、入力した音声の環境を識別で
きなかったとき、前記音声認識用辞書を用いて前記音声
の認識処理を行うことを特徴とする電話自動応答装置。 - 【請求項13】 請求項9記載の電話自動応答装置にお
いて、 前記音声認識処理手段が、通知された発信者電話番号
と、複数の電話番号が携帯電話機、PHS及び通常の電
話機毎に分類されて登録されている電話番号/辞書テー
ブルとを対照することにより、前記音声の環境を識別す
ることを特徴とする電話自動応答装置。 - 【請求項14】 認識対象となる音声の環境毎に設定し
た複数の音声認識用辞書と、 入力された音声の環境を識別する手段と、 前記各辞書の中から識別された環境に適合する辞書を選
択する手段とを備え、 前記選択した辞書を用いて入力した音声の認識処理を行
う音声認識装置における前記各手段としてコンピュータ
を動作させるためのコンピュータプログラムを担持した
コンピュータ読取可能なプログラム媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10296297A JP2000125006A (ja) | 1998-10-19 | 1998-10-19 | 音声認識装置、音声認識方法、及び電話自動応答装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10296297A JP2000125006A (ja) | 1998-10-19 | 1998-10-19 | 音声認識装置、音声認識方法、及び電話自動応答装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000125006A true JP2000125006A (ja) | 2000-04-28 |
Family
ID=17831739
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10296297A Withdrawn JP2000125006A (ja) | 1998-10-19 | 1998-10-19 | 音声認識装置、音声認識方法、及び電話自動応答装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000125006A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010175967A (ja) * | 2009-01-30 | 2010-08-12 | Ntt Docomo Inc | 音声認識サーバ、電話機、音声認識システム、および音声認識方法 |
US9165557B2 (en) | 2006-02-06 | 2015-10-20 | Nec Corporation | Voice recognizing apparatus, voice recognizing method, and program for recognizing voice |
-
1998
- 1998-10-19 JP JP10296297A patent/JP2000125006A/ja not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9165557B2 (en) | 2006-02-06 | 2015-10-20 | Nec Corporation | Voice recognizing apparatus, voice recognizing method, and program for recognizing voice |
JP2010175967A (ja) * | 2009-01-30 | 2010-08-12 | Ntt Docomo Inc | 音声認識サーバ、電話機、音声認識システム、および音声認識方法 |
US8238525B2 (en) | 2009-01-30 | 2012-08-07 | Ntt Docomo, Inc. | Voice recognition server, telephone equipment, voice recognition system, and voice recognition method |
EP2219355A3 (en) * | 2009-01-30 | 2014-06-11 | NTT DoCoMo, Inc. | Voice recognition server, telephone equipment, voice recognition system, and voice recognition method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5905773A (en) | Apparatus and method for reducing speech recognition vocabulary perplexity and dynamically selecting acoustic models | |
US6198808B1 (en) | Controller for use with communications systems for converting a voice message to a text message | |
CA2233019C (en) | Speech-responsive voice messaging system and method | |
EP1116373B1 (en) | Method and system of configuring a speech recognition system | |
EP1732295B1 (en) | Device and method for sending and receiving voice call contents via text messages | |
US6629071B1 (en) | Speech recognition system | |
US6381311B2 (en) | Automated message system for a calling party | |
CN102111483B (zh) | 一种在通话过程中查询信息的方法、装置及移动终端 | |
JPH07177229A (ja) | 電話の呼処理方法とその装置 | |
US7120234B1 (en) | Integrated tone-based and voice-based telephone user interface | |
US20050278177A1 (en) | Techniques for interaction with sound-enabled system or service | |
US5719996A (en) | Speech recognition in selective call systems | |
CN109348048B (zh) | 通话留言方法、终端和具有存储功能的装置 | |
KR100369804B1 (ko) | 휴대 전화 단말 시스템의 음성 인식 단문 메시지 전송장치 및 방법 | |
US20040015353A1 (en) | Voice recognition key input wireless terminal, method, and computer readable recording medium therefor | |
US6229881B1 (en) | Method and apparatus to provide enhanced speech recognition in a communication network | |
JP2000125006A (ja) | 音声認識装置、音声認識方法、及び電話自動応答装置 | |
CN111274828B (zh) | 基于留言的语言翻译方法、系统、计算机程序和手持终端 | |
CN109995952B (zh) | Ivr风险应急控制方法及系统 | |
US7203650B2 (en) | Telecommunication system, speech recognizer, and terminal, and method for adjusting capacity for vocal commanding | |
CN1631045A (zh) | 用于基于生成应答呼叫消息的音频信号的方法和装置 | |
US8213966B1 (en) | Text messages provided as a complement to a voice session | |
JPH08242280A (ja) | 音声メール装置 | |
JP2001086243A (ja) | 音声応答方法及び装置及び音声応答プログラムを格納した記憶媒体 | |
JP2815971B2 (ja) | 音声認識データ蓄積システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20040521 |
|
RD05 | Notification of revocation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7425 Effective date: 20040526 |
|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060110 |