JPS5946698A - 音声認識方式 - Google Patents
音声認識方式Info
- Publication number
- JPS5946698A JPS5946698A JP57155985A JP15598582A JPS5946698A JP S5946698 A JPS5946698 A JP S5946698A JP 57155985 A JP57155985 A JP 57155985A JP 15598582 A JP15598582 A JP 15598582A JP S5946698 A JPS5946698 A JP S5946698A
- Authority
- JP
- Japan
- Prior art keywords
- word
- similarity
- speech
- words
- stored
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の利用分野〕
本発明は、認識対象の各単語に対応して標準音声パタン
を記憶しておき、上記単語の入力音声に対する類似度が
最上位となる単語′ff:認識結果として出力・表示す
る音声認識装置において、特に特定単語相互間の誤認識
を防正し、その認識率を向上させるための音声認識方式
に関するものである。
を記憶しておき、上記単語の入力音声に対する類似度が
最上位となる単語′ff:認識結果として出力・表示す
る音声認識装置において、特に特定単語相互間の誤認識
を防正し、その認識率を向上させるための音声認識方式
に関するものである。
この種の音声認識装置における従来のTj声認識方式は
、例えば、入力音声と標準音声バタンとの類似度請求め
、その類似度の最」1位のものを認識結果として選びだ
すようにしていたので、特定の2単語相互間の音響的性
質(すなわち、音韻のifmらび力)によっては一方か
ら他方への誤認識が頻出するということがあり、ある限
度以」二に認識率を向上させることが困難であった。
、例えば、入力音声と標準音声バタンとの類似度請求め
、その類似度の最」1位のものを認識結果として選びだ
すようにしていたので、特定の2単語相互間の音響的性
質(すなわち、音韻のifmらび力)によっては一方か
ら他方への誤認識が頻出するということがあり、ある限
度以」二に認識率を向上させることが困難であった。
本発明の目的は、上記した従来技術の欠点を・なりシ、
特に、特定単語相互間における誤認識6−・防止し、認
識率を総合的に向上することができる音声認識方式を提
供することにある。
特に、特定単語相互間における誤認識6−・防止し、認
識率を総合的に向上することができる音声認識方式を提
供することにある。
本発明に係る音声認識方式の構成は、認識対象の各単語
に対応して椰準音疼・バタンデータを記憶しておき、=
L記単語の入力音声の特徴抽出を行い、その特徴データ
と上記標準音声バタンデータとの類似度計算処理を行い
、その類似度が最上位となる単語全認識結果として判定
・出力する機能を翁する音声認識装置において、あらか
じめ、認識対象の各単語について、その他の各単語との
関連に応じて尚該類似度に付加すべき重みを求めて記憶
しておくようにし、入力音声についての類似度計算処理
で得られた当該類似度が上位の2単語を求め、それらの
各a似度に対して当該各重みを付加した後、類似度が最
」1位となる単語の判定をせしめるように1i1) t
tl・処理するものである。
に対応して椰準音疼・バタンデータを記憶しておき、=
L記単語の入力音声の特徴抽出を行い、その特徴データ
と上記標準音声バタンデータとの類似度計算処理を行い
、その類似度が最上位となる単語全認識結果として判定
・出力する機能を翁する音声認識装置において、あらか
じめ、認識対象の各単語について、その他の各単語との
関連に応じて尚該類似度に付加すべき重みを求めて記憶
しておくようにし、入力音声についての類似度計算処理
で得られた当該類似度が上位の2単語を求め、それらの
各a似度に対して当該各重みを付加した後、類似度が最
」1位となる単語の判定をせしめるように1i1) t
tl・処理するものである。
これを要するに、一般に誤認識は音響的性質が相互に類
似した特定単語間で起こりやすいものであり、例えば、
!1テ定単語A、Bについて、単語への発声が!11語
口のものと判定されてし且うということは多いが、その
逆は極めて少ないということがあるので、この前者の場
合には、類似度が第2位のものは当該入力音声に係る単
語Aである場合が多く、得られた」三位2単語の類似度
に身、Jし、経験的に求められた、相手の単語と関連し
た各市みを付加して判定することにより、人力名声がノ
セ語A−によるものであることを認識することができ、
特定単語相互間の誤認識を防止しうるようにしようとす
るものである。
似した特定単語間で起こりやすいものであり、例えば、
!1テ定単語A、Bについて、単語への発声が!11語
口のものと判定されてし且うということは多いが、その
逆は極めて少ないということがあるので、この前者の場
合には、類似度が第2位のものは当該入力音声に係る単
語Aである場合が多く、得られた」三位2単語の類似度
に身、Jし、経験的に求められた、相手の単語と関連し
た各市みを付加して判定することにより、人力名声がノ
セ語A−によるものであることを認識することができ、
特定単語相互間の誤認識を防止しうるようにしようとす
るものである。
以下、本発明の実施例を図に基づいて説明する。
第1図は、本発明に係る音声認識方式の一実施例の方式
(14成図、第2図は、その処理)rl−チャートであ
る。
(14成図、第2図は、その処理)rl−チャートであ
る。
ここで、■は、音声入力に係るマイクロホン、2は、入
力音声信号に対する増幅器、3りJ5、?Z j’−’
区間検出回路、4は、分析部に係る音声特徴抽出回路、
5は、同テストパタンメモ’) 、6 kl’、認17
ib対象の各短語についての標準音声バタンラーーータ
全記憶しておく標準バタンメモIJ、l、1−1識別部
1((、−。
力音声信号に対する増幅器、3りJ5、?Z j’−’
区間検出回路、4は、分析部に係る音声特徴抽出回路、
5は、同テストパタンメモ’) 、6 kl’、認17
ib対象の各短語についての標準音声バタンラーーータ
全記憶しておく標準バタンメモIJ、l、1−1識別部
1((、−。
係る距離計算回路、8は、同圧Nlfメモリ、”NJ、
同重みメモリ、10は、同認識結果’IiJ定回路、]
1は、表示部、12は、制御部である。
同重みメモリ、10は、同認識結果’IiJ定回路、]
1は、表示部、12は、制御部である。
まず、音声認識装置が音声の入力を許される状、軸にな
ると、制御部12ば、増幅器2.音声区間検出回路3を
制御し、所定の陸用区間の検出を行わしめるとともに、
音声信号のみを次段の音声特徴抽出回路4に送出せしめ
る(第2図における処理21)。
ると、制御部12ば、増幅器2.音声区間検出回路3を
制御し、所定の陸用区間の検出を行わしめるとともに、
音声信号のみを次段の音声特徴抽出回路4に送出せしめ
る(第2図における処理21)。
音声特徴抽出回路4では、人力音声の分析、特徴抽出が
行なわれ、結果としてmられる特徴パラメータの時系列
(テストバタン)は、テストバタンメモリ5に順次蓄積
される(第2図の処理22)。
行なわれ、結果としてmられる特徴パラメータの時系列
(テストバタン)は、テストバタンメモリ5に順次蓄積
される(第2図の処理22)。
すへての!1♀徴パラメータがデスドパタンメモリ5に
蓄積されると、制御部12は、あらかじめ標準バタンメ
モリ6の中に蓄積されている各単語の標準バタンを逐次
取出し、距離計算回路7に送る。
蓄積されると、制御部12は、あらかじめ標準バタンメ
モリ6の中に蓄積されている各単語の標準バタンを逐次
取出し、距離計算回路7に送る。
距tuffδ1算回路7は、テストバタンメモリ5中の
!1..7徴パラメータと各単語の標tIl/;バタン
とのバタンマノヂングをとり、両パタン間の距離(類似
度)を・計算し、結果金距〆jffjメモリ8に送る(
同図処理23 )。
!1..7徴パラメータと各単語の標tIl/;バタン
とのバタンマノヂングをとり、両パタン間の距離(類似
度)を・計算し、結果金距〆jffjメモリ8に送る(
同図処理23 )。
認識結果判定回路10は、距離メモリ8中に蓄積された
各単語との類似度の中から、類似度が最」1位のものと
第2位のものとケ見つける(同図処理24)。
各単語との類似度の中から、類似度が最」1位のものと
第2位のものとケ見つける(同図処理24)。
次に、その第1位、第2位の単語の組合ぜに対する重み
ヲ市みメモリ9から求め(同図処JJ、! 25)、そ
の重みを各単語の類似度に付加する(同図処理26)。
ヲ市みメモリ9から求め(同図処JJ、! 25)、そ
の重みを各単語の類似度に付加する(同図処理26)。
その上で、再び、この両単語の類似1及ヲ比較し、最終
的な結果判定全行い、その結果ケ制+1111部1に送
るとともに、表示部11に所定の表示をし、一連の認識
動作を終了する(同図処理27)。
的な結果判定全行い、その結果ケ制+1111部1に送
るとともに、表示部11に所定の表示をし、一連の認識
動作を終了する(同図処理27)。
このように本実施例によれは、認識結果の判定d:、人
力音声と各単語の標準バタンとの類似度に、あらかじめ
各単語間に与えられた重みを加えて行なわれるので、対
象単語ごとに他の各−中n!−’+に対して適VJな重
みを経験的に求めて準備して7j、・くことにより、特
定単語間の誤認識を防1−Lすることがてきる。
力音声と各単語の標準バタンとの類似度に、あらかじめ
各単語間に与えられた重みを加えて行なわれるので、対
象単語ごとに他の各−中n!−’+に対して適VJな重
みを経験的に求めて準備して7j、・くことにより、特
定単語間の誤認識を防1−Lすることがてきる。
以上、詳細に説明したように、本発明によれは、特定単
語相互間における誤認識を防止し、認識率を・総合的に
向」ニすることができるので、音声認識装置における信
頼性向上、ザービス性向−1−に顕著な効果が得られる
。
語相互間における誤認識を防止し、認識率を・総合的に
向」ニすることができるので、音声認識装置における信
頼性向上、ザービス性向−1−に顕著な効果が得られる
。
第1図は、本発明に係る音声認識方式の一実施例の方式
構成図、第2図は、その処理フローデー\・−1・であ
る。 1・・・マイク1−ffホン、2・・・増幅器、3・・
・音声区間検出回路、4・・・音声特徴抽出回路、5・
・・テストバタンメモリ、6・・・標準バタンメモリ、
7・・・距離言」算回路、8・・・距離メモリ、9・・
・重みメモリ、10・・・認識結果判定回路、11・・
・表示部、12・・・制御部。 代理人 弁理士 福田幸作 (ほか1名) 澗1 図
構成図、第2図は、その処理フローデー\・−1・であ
る。 1・・・マイク1−ffホン、2・・・増幅器、3・・
・音声区間検出回路、4・・・音声特徴抽出回路、5・
・・テストバタンメモリ、6・・・標準バタンメモリ、
7・・・距離言」算回路、8・・・距離メモリ、9・・
・重みメモリ、10・・・認識結果判定回路、11・・
・表示部、12・・・制御部。 代理人 弁理士 福田幸作 (ほか1名) 澗1 図
Claims (1)
- ■、認識対象の各単語に対応して標準音声バタンデータ
を記憶しておき、上記11i語の入力音声の特徴抽出ケ
行い、その特徴データと」−記憶準音声バタンデータと
の類似度計算処理を行い、その類似度が最上位となる単
語を認識結果として判定・出力する機能を有する音声認
識装置において、あらかじめ、認識対象の各単語につい
て、その他の各単語との関連に応じて当該類似度に伺加
すべき重み?求めて記憶しておくようにし、入力音声に
ついての類似度計算処理で得られた当該類似度が上位の
2単語を求め、それらの各類似度に対して尚該各型みを
付加した後、類似度が最上位となる単語の判定をぜしめ
るように制御・処理することを!1ヶ徴とする音声認識
装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57155985A JPS5946698A (ja) | 1982-09-09 | 1982-09-09 | 音声認識方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57155985A JPS5946698A (ja) | 1982-09-09 | 1982-09-09 | 音声認識方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS5946698A true JPS5946698A (ja) | 1984-03-16 |
Family
ID=15617827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57155985A Pending JPS5946698A (ja) | 1982-09-09 | 1982-09-09 | 音声認識方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5946698A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60121499A (ja) * | 1983-12-05 | 1985-06-28 | 富士通株式会社 | 音声照合装置 |
JPH1185188A (ja) * | 1997-09-12 | 1999-03-30 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識方法及びそのプログラム記録媒体 |
-
1982
- 1982-09-09 JP JP57155985A patent/JPS5946698A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60121499A (ja) * | 1983-12-05 | 1985-06-28 | 富士通株式会社 | 音声照合装置 |
JPH0585917B2 (ja) * | 1983-12-05 | 1993-12-09 | Fujitsu Ltd | |
JPH1185188A (ja) * | 1997-09-12 | 1999-03-30 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識方法及びそのプログラム記録媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2019522810A (ja) | ニューラルネットワークベースの声紋情報抽出方法及び装置 | |
JPS58130393A (ja) | 音声認識装置 | |
CN104575519B (zh) | 特征提取方法、装置及重音检测的方法、装置 | |
KR101667557B1 (ko) | 실시간 음원 분류 장치 및 방법 | |
CN107886968A (zh) | 语音评测方法及系统 | |
JPS5946698A (ja) | 音声認識方式 | |
CN116844567A (zh) | 一种基于多特征重建融合的深度合成音频检测方法及系统 | |
CN107039046B (zh) | 一种基于特征融合的语音声效模式检测方法 | |
JPS59223498A (ja) | 音素判別法 | |
JP2000148187A (ja) | 話者認識方法、その方法を用いた装置及びそのプログラム記録媒体 | |
JPH02109100A (ja) | 音声入力装置 | |
JPS63221397A (ja) | 単音節音声認識装置 | |
JPS5988800A (ja) | 音声区間検出方式 | |
JPS5859498A (ja) | 音声認識装置 | |
JPS6069694A (ja) | 語頭子音のセグメンテ−ション法 | |
JPS6242200A (ja) | 音声認識装置 | |
JPS59121097A (ja) | 音声認識装置 | |
JPS60115996A (ja) | 音声認識装置 | |
JPS61162098A (ja) | 破裂子音認識装置 | |
JPS63191199A (ja) | 有声破裂子音識別装置 | |
JPS60147797A (ja) | 音声認識装置 | |
JPH0283598A (ja) | 子音認識方法 | |
JPS61249099A (ja) | 音声認識装置 | |
JPS59176793A (ja) | 単語音声認識装置 | |
JPS59138000A (ja) | 音声認識方法 |