JPH0511200U

JPH0511200U - 音声認識装置

Info

Publication number: JPH0511200U
Application number: JP058832U
Authority: JP
Inventors: 志芳長岡
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1991-07-26
Filing date: 1991-07-26
Publication date: 1993-02-12

Abstract

(57)【要約】【構成】特定話者が入力する音声を複数個の周波数帯域
に分割して音声情報信号を出力する特徴抽出部２と、特
定話者によりあらかじめ登録される複数個の音声情報フ
ァイル１と、この音声情報信号と、音声情報パタンのそ
れぞれとの類似度を比較する照合部３と、照合部３の出
力信号とあらかじめ設定されたしきい値レベルとを入力
ししきい値以上かしきい値以下かを判定する判定部４と
を有し、判定部４が少なくとも２個の音声情報パタンと
の照合結果をしきい値以上であると判定した場合に、こ
の少なくとも２個の音声情報パタンのデータを特定話者
に音声通知する手段と、特定話者が再度同じ内容の音声
を入力し判定させる手段とを備えている。【効果】自動車電話における音声ダイアルの認識率を上
げ誤認識を防ぐ効果がある。

Description

【考案の詳細な説明】

【０００１】

【産業上の利用分野】

本考案は、音声認識装置に関し、特に自動車電話等に使用され、音声入力によるダイヤリングを行う機能を有する音声認識装置に関する。

【０００２】

【従来の技術】

従来、この種の自動車電話装置に搭載される音声認識装置は、図３に示すように、特定話者があらかじめ、通話瀕度のある通話相手の氏名、電話番号（短縮ダイアル番号等）等を複数個選択して、それぞれの特定話者による音声特徴の標準パターンを登録しておく複数の音声特徴データファイル１１と、特定話者の通話相手の氏名、電話番号等の音声入力１０と、この入力される音声の特徴抽出部１２と、複数の音声特徴データファイル１１から登録通話相手ごとに標準パターンを読み出し、特徴抽出部１２の抽出信号とのマッチングをとり比較する照合部１３と、この照合部１３の結果を入力し、認識率の程度にしきい値を設けてしきい値以上か以下かの判定を行う判定部１４と、この判定値がしきい値以上の場合には特定話者に判定、すなわち選択した通話相手の氏名等を報知する特定話者への報知部１５と、通話相手へのダイアリング１６の出力部から構成される。一方判定部１４において、すべての登録された標準パターンとの比較結果がしきい値以下の場合には特定話者への報知部１５は該当者なしとして特定話者へ再度音声入力をとくそくする報知を行っていた。

【０００３】上述したように、従来例では、対話者の音声による命令に対し、認識した音声を分析し、装置がもつ情報と比較し、最も近似する音声であると判断されたものを１つ選択し命令として作動させるか、又は、近似する音声がないと判断し動作を初期モードに再設定すると言うような、認識データに対して情報データの選択枝（しきい値）が狭い機能であった。

【０００４】

【考案が解決しようとする課題】上述した従来の音声認識装置では、１命令に対し、装置内の情報データの１情報のみの選択しか許されず、しきい値が狭いので、誤認する確立が高く、その結果誤動作を導き易いという欠点がある。さらに、しきい値以下の場合に対話者が再音声入力をくりかえさなければならない欠点があった。

【０００５】

【課題を解決するための手段】

本考案の音声認識装置は特定話者が入力する音声を複数個の周波数帯域に分割して音声情報信号を出力する特徴抽出部と、前記特定話者によりあらかじめ登録される複数個の登録パタンを記憶する音声情報ファイルと、前記特徴抽出部から出力される音声情報信号と前記音声情報登録パタンのそれぞれとの類似度を比較する照合部と、前記照合部の出力信号とあらかじめ設定されたしきい値レベルとを入力ししきい値以上かしきい値以下かを判定する判定部とを有する音声認識装置において、前記判定部が少なくとも２個の前記音声情報登録パタンとの照合結果をしきい値以上であると判定した場合に、この少なくとも２個の音声情報パタンのデータを前記特定話者に音声通知する手段と、この音声通知する手段の情報にもとずき特定話者が再度同じ内容の音声を入力し判定させる手段とを備えている。

【０００６】

【実施例】

次に本考案について図面を参照して説明する。図１は本考案の一実施例のブロック図、図２は本実施例を説明するフローチャートである。図１の実施例は、登録パタンＡ〜Ｅ（本例では５個）を記憶する音声情報データファイル１、マイクの音声入力を１００〜５００Ｈｚおよび５００〜１ＫＨｚおよび１〜１０ＫＨｚの３つの音声周波数領域に分割するフィルタを有する特徴抽出部２、この３分割された音声のフォルマントを一時保持するラッチ回路７Ａ、この音声の３つのフォルマントを登録パタンＡ〜Ｅまで順次マグニチュードコンパレータ３Ａで比較する照合部３、この照合部４の比較結果に対応する信号を入力し、あらかじめ設定したしきいレベル４Ａより高いか低いかを判定する判定部４、登録パタンＡ〜ＥまでのデータをＲＯＭ８Ａに読み出しラッチ回路７Ｂ経由照合部３に供給するとともに、判定部４による話者にマイクから入力された音声と登録Ａ〜Ｅまでの音声データとの判定結果を入力して、後述する手順にしたがいコーディック９で音声に変換された話者への情報を出力するＣＰＵ５、このＣＰＵ５を図２に示すフローチャートにより手順通りに制御するプログラムを格納しているＲＯＭ８Ｂから構成される。

【０００７】次に図２により本実施例の音声認識装置の動作手順を説明する。まず特定話者はマイクから通話相手の名前（ほかに短縮ダイアル番号等でもよい）を発声する（ステップＳ１）。次にこの名前の音声パタンと登録パタンＡ〜Ｅと総当りに音声認識を行い、例えば認識された登録パタンがＡのみの一つであったか、２つ以上であったかを判定する（ステップＳ２）。一つであった場合にＹＥＳとして、この選択された名前および電話番号等を話者に報知すべく、スピーカから発声される（ステップＳ３）。なお、図示しないが、認識した名前が一つであっても、所望の通話相手が発声されない事もあり得るので、５秒以内の間で話者がダイアルに移行するのを停止させることもできる。５秒後に電話のダイアル操作を実行する（ステップＳ４）。次に説明をＳ２にもどしＮＯの場合には、照合部３での近似度の高い順序に２個から３個の候補の名前を話者に報知すべく発声する（ステップＳ５）。ここで特定話者はこの報知された候補の名前に所望の相手の名前があれば、再度その所望の名前を発声する（ステップＳ６）。照合部３ではマイクから入力された再度の所望の名前を登録パタンＡ〜Ｅと比較し、該当する名前が一つかどうかを判定する（ステップＳ７）。ＹＥＳであれば、所望の通話相手が指定されたとみなし、ステップＳ３に移る。ＮＯであれば、認識失敗とみなし、本実施例で設定した５回まで、このＳ１〜Ｓ７までの動作をくり返す（ステップＳ８，Ｓ９）。認識失敗が５回に達するとＹＥＳとなり、この認識動作をあきらめ通常の待ち状態になる（ステップＳ１０）。

【０００８】

【考案の効果】

以上述べたように本考案は特定話者の発声音に該当するデータの選択数が複数個ある場合に、特定話者にその複数個のデータを音声伝達する手段と、再度特定話者に同じ発声をさせて再照合する手段とをを備えることにより、認識率を上げ誤認識を防ぐ効果がある。

【図面の簡単な説明】

【図１】本考案の一実施例のブロック図である。

【図２】本実施例を説明するフローチャートである。

【図３】従来の音声認識装置のブロック図である。

【符号の説明】

１音声情報データファイル２特徴抽出部３，１３照合部４，１４判定部５ＣＰＵ６コーディック７Ａ，７Ｂラッチ回路８Ａ，８ＢＲＯＭ１０特定話者の音声入力１１複数の音声情報データファイル１５特定話者への報知部１６ダイヤリング

Claims

【実用新案登録請求の範囲】【請求項１】特定話者が入力する音声を複数個の周波
数帯域に分割して音声情報信号を出力する特徴抽出部
と、前記特定話者によりあらかじめ登録される複数個の
登録パタンを記憶する音声情報ファイルと、前記特徴抽
出部から出力される音声情報信号と前記音声情報登録パ
タンのそれぞれとの類似度を比較する照合部と、前記照
合部の出力信号とあらかじめ設定されたしきい値レベル
とを入力ししきい値以上かしきい値以下かを判定する判
定部とを有する音声認識装置において、前記判定部が少
なくとも２個の前記音声情報登録パタンとの照合結果を
しきい値以上であると判定した場合に、この少なくとも
２個の音声情報パタンのデータを前記特定話者に音声通
知する手段と、この音声通知する手段の情報にもとずき
特定話者が再度同じ内容の音声を入力し判定させる手段
とを備えていることを特徴とする音声認識装置。