JPH0511200U - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPH0511200U JPH0511200U JP058832U JP5883291U JPH0511200U JP H0511200 U JPH0511200 U JP H0511200U JP 058832 U JP058832 U JP 058832U JP 5883291 U JP5883291 U JP 5883291U JP H0511200 U JPH0511200 U JP H0511200U
- Authority
- JP
- Japan
- Prior art keywords
- voice
- voice information
- specific speaker
- patterns
- threshold value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【構成】特定話者が入力する音声を複数個の周波数帯域
に分割して音声情報信号を出力する特徴抽出部2と、特
定話者によりあらかじめ登録される複数個の音声情報フ
ァイル1と、この音声情報信号と、音声情報パタンのそ
れぞれとの類似度を比較する照合部3と、照合部3の出
力信号とあらかじめ設定されたしきい値レベルとを入力
ししきい値以上かしきい値以下かを判定する判定部4と
を有し、判定部4が少なくとも2個の音声情報パタンと
の照合結果をしきい値以上であると判定した場合に、こ
の少なくとも2個の音声情報パタンのデータを特定話者
に音声通知する手段と、特定話者が再度同じ内容の音声
を入力し判定させる手段とを備えている。 【効果】自動車電話における音声ダイアルの認識率を上
げ誤認識を防ぐ効果がある。
に分割して音声情報信号を出力する特徴抽出部2と、特
定話者によりあらかじめ登録される複数個の音声情報フ
ァイル1と、この音声情報信号と、音声情報パタンのそ
れぞれとの類似度を比較する照合部3と、照合部3の出
力信号とあらかじめ設定されたしきい値レベルとを入力
ししきい値以上かしきい値以下かを判定する判定部4と
を有し、判定部4が少なくとも2個の音声情報パタンと
の照合結果をしきい値以上であると判定した場合に、こ
の少なくとも2個の音声情報パタンのデータを特定話者
に音声通知する手段と、特定話者が再度同じ内容の音声
を入力し判定させる手段とを備えている。 【効果】自動車電話における音声ダイアルの認識率を上
げ誤認識を防ぐ効果がある。
Description
【0001】
本考案は、音声認識装置に関し、特に自動車電話等に使用され、音声入力によ るダイヤリングを行う機能を有する音声認識装置に関する。
【0002】
従来、この種の自動車電話装置に搭載される音声認識装置は、図3に示すよう に、特定話者があらかじめ、通話瀕度のある通話相手の氏名、電話番号(短縮ダ イアル番号等)等を複数個選択して、それぞれの特定話者による音声特徴の標準 パターンを登録しておく複数の音声特徴データファイル11と、特定話者の通話 相手の氏名、電話番号等の音声入力10と、この入力される音声の特徴抽出部1 2と、複数の音声特徴データファイル11から登録通話相手ごとに標準パターン を読み出し、特徴抽出部12の抽出信号とのマッチングをとり比較する照合部1 3と、この照合部13の結果を入力し、認識率の程度にしきい値を設けてしきい 値以上か以下かの判定を行う判定部14と、この判定値がしきい値以上の場合に は特定話者に判定、すなわち選択した通話相手の氏名等を報知する特定話者への 報知部15と、通話相手へのダイアリング16の出力部から構成される。一方判 定部14において、すべての登録された標準パターンとの比較結果がしきい値以 下の場合には特定話者への報知部15は該当者なしとして特定話者へ再度音声入 力をとくそくする報知を行っていた。
【0003】 上述したように、従来例では、対話者の音声による命令に対し、認識した音声 を分析し、装置がもつ情報と比較し、最も近似する音声であると判断されたもの を1つ選択し命令として作動させるか、又は、近似する音声がないと判断し動作 を初期モードに再設定すると言うような、認識データに対して情報データの選択 枝(しきい値)が狭い機能であった。
【0004】
【考案が解決しようとする課題】 上述した従来の音声認識装置では、1命令に対し、装置内の情報データの1情 報のみの選択しか許されず、しきい値が狭いので、誤認する確立が高く、その結 果誤動作を導き易いという欠点がある。さらに、しきい値以下の場合に対話者が 再音声入力をくりかえさなければならない欠点があった。
【0005】
本考案の音声認識装置は特定話者が入力する音声を複数個の周波数帯域に分割 して音声情報信号を出力する特徴抽出部と、前記特定話者によりあらかじめ登録 される複数個の登録パタンを記憶する音声情報ファイルと、前記特徴抽出部から 出力される音声情報信号と前記音声情報登録パタンのそれぞれとの類似度を比較 する照合部と、前記照合部の出力信号とあらかじめ設定されたしきい値レベルと を入力ししきい値以上かしきい値以下かを判定する判定部とを有する音声認識装 置において、前記判定部が少なくとも2個の前記音声情報登録パタンとの照合結 果をしきい値以上であると判定した場合に、この少なくとも2個の音声情報パタ ンのデータを前記特定話者に音声通知する手段と、この音声通知する手段の情報 にもとずき特定話者が再度同じ内容の音声を入力し判定させる手段とを備えてい る。
【0006】
次に本考案について図面を参照して説明する。図1は本考案の一実施例のブロ ック図、図2は本実施例を説明するフローチャートである。図1の実施例は、登 録パタンA〜E(本例では5個)を記憶する音声情報データファイル1、マイク の音声入力を100〜500Hzおよび500〜1KHzおよび1〜10KHz の3つの音声周波数領域に分割するフィルタを有する特徴抽出部2、この3分割 された音声のフォルマントを一時保持するラッチ回路7A、この音声の3つのフ ォルマントを登録パタンA〜Eまで順次マグニチュードコンパレータ3Aで比較 する照合部3、この照合部4の比較結果に対応する信号を入力し、あらかじめ設 定したしきいレベル4Aより高いか低いかを判定する判定部4、登録パタンA〜 EまでのデータをROM8Aに読み出しラッチ回路7B経由照合部3に供給する とともに、判定部4による話者にマイクから入力された音声と登録A〜Eまでの 音声データとの判定結果を入力して、後述する手順にしたがいコーディック9で 音声に変換された話者への情報を出力するCPU5、このCPU5を図2に示す フローチャートにより手順通りに制御するプログラムを格納しているROM8B から構成される。
【0007】 次に図2により本実施例の音声認識装置の動作手順を説明する。まず特定話者 はマイクから通話相手の名前(ほかに短縮ダイアル番号等でもよい)を発声する (ステップS1)。次にこの名前の音声パタンと登録パタンA〜Eと総当りに音 声認識を行い、例えば認識された登録パタンがAのみの一つであったか、2つ以 上であったかを判定する(ステップS2)。一つであった場合にYESとして、 この選択された名前および電話番号等を話者に報知すべく、スピーカから発声さ れる(ステップS3)。なお、図示しないが、認識した名前が一つであっても、 所望の通話相手が発声されない事もあり得るので、5秒以内の間で話者がダイア ルに移行するのを停止させることもできる。5秒後に電話のダイアル操作を実行 する(ステップS4)。次に説明をS2にもどしNOの場合には、照合部3での 近似度の高い順序に2個から3個の候補の名前を話者に報知すべく発声する(ス テップS5)。ここで特定話者はこの報知された候補の名前に所望の相手の名前 があれば、再度その所望の名前を発声する(ステップS6)。照合部3ではマイ クから入力された再度の所望の名前を登録パタンA〜Eと比較し、該当する名前 が一つかどうかを判定する(ステップS7)。YESであれば、所望の通話相手 が指定されたとみなし、ステップS3に移る。NOであれば、認識失敗とみなし 、本実施例で設定した5回まで、このS1〜S7までの動作をくり返す(ステッ プS8,S9)。認識失敗が5回に達するとYESとなり、この認識動作をあき らめ通常の待ち状態になる(ステップS10)。
【0008】
以上述べたように本考案は特定話者の発声音に該当するデータの選択数が複数 個ある場合に、特定話者にその複数個のデータを音声伝達する手段と、再度特定 話者に同じ発声をさせて再照合する手段とをを備えることにより、認識率を上げ 誤認識を防ぐ効果がある。
【図面の簡単な説明】
【図1】本考案の一実施例のブロック図である。
【図2】本実施例を説明するフローチャートである。
【図3】従来の音声認識装置のブロック図である。
1 音声情報データファイル 2 特徴抽出部 3,13 照合部 4,14 判定部 5 CPU 6 コーディック 7A,7B ラッチ回路 8A,8B ROM 10 特定話者の音声入力 11 複数の音声情報データファイル 15 特定話者への報知部 16 ダイヤリング
Claims (1)
- 【実用新案登録請求の範囲】 【請求項1】 特定話者が入力する音声を複数個の周波
数帯域に分割して音声情報信号を出力する特徴抽出部
と、前記特定話者によりあらかじめ登録される複数個の
登録パタンを記憶する音声情報ファイルと、前記特徴抽
出部から出力される音声情報信号と前記音声情報登録パ
タンのそれぞれとの類似度を比較する照合部と、前記照
合部の出力信号とあらかじめ設定されたしきい値レベル
とを入力ししきい値以上かしきい値以下かを判定する判
定部とを有する音声認識装置において、前記判定部が少
なくとも2個の前記音声情報登録パタンとの照合結果を
しきい値以上であると判定した場合に、この少なくとも
2個の音声情報パタンのデータを前記特定話者に音声通
知する手段と、この音声通知する手段の情報にもとずき
特定話者が再度同じ内容の音声を入力し判定させる手段
とを備えていることを特徴とする音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP058832U JPH0511200U (ja) | 1991-07-26 | 1991-07-26 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP058832U JPH0511200U (ja) | 1991-07-26 | 1991-07-26 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0511200U true JPH0511200U (ja) | 1993-02-12 |
Family
ID=13095625
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP058832U Pending JPH0511200U (ja) | 1991-07-26 | 1991-07-26 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0511200U (ja) |
-
1991
- 1991-07-26 JP JP058832U patent/JPH0511200U/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0757342B1 (en) | User selectable multiple threshold criteria for voice recognition | |
JP3363630B2 (ja) | 音声認識方法 | |
US20060215821A1 (en) | Voice nametag audio feedback for dialing a telephone call | |
EP1876584A2 (en) | Spoken user interface for speech-enabled devices | |
US5842161A (en) | Telecommunications instrument employing variable criteria speech recognition | |
JPH08507392A (ja) | 音声コマンド制御及び検証システム | |
JPWO2003052737A1 (ja) | 音声認識方法、リモートコントロール装置、情報端末装置、電話通信端末及び音声認識装置 | |
EP0762709B1 (en) | Method and system for enrolling addresses in a speech recognition database | |
KR100467593B1 (ko) | 음성인식 키 입력 무선 단말장치, 무선 단말장치에서키입력 대신 음성을 이용하는 방법 및 그 기록매체 | |
JP2000338991A (ja) | 認識率信頼性表示機能付き音声操作電話装置及びその音声認識方法 | |
JP4486235B2 (ja) | 音声認識装置 | |
JPH0511200U (ja) | 音声認識装置 | |
JP2003177788A (ja) | 音声対話システムおよびその方法 | |
JP2000122678A (ja) | 音声認識機器制御装置 | |
JP7079419B2 (ja) | 情報処理方法及び情報処理装置 | |
KR100811554B1 (ko) | 음성 다이얼링 기능을 갖는 통신 단말기 및 음성 다이얼링방법 | |
JPH05210397A (ja) | 音声認識装置 | |
WO1992000586A1 (en) | Keyword-based speaker selection | |
KR100230972B1 (ko) | 전전자교환기의 화자종속 음성인식서비스 장치 및 방법 | |
JPH01293397A (ja) | 音声応答方式 | |
EP1758351B1 (en) | Method and system for enrolling addresses in a speech recognition database | |
KR19990081664A (ko) | 음성 인식 전화기의 음성 인식 방법 | |
JPH098894A (ja) | 音声認識コードレス電話機 | |
JPH05216492A (ja) | 音声起動制御方法 | |
JPH03123253A (ja) | 自動車用電話 |