JPS63186298A - 単語音声認識装置 - Google Patents

単語音声認識装置

Info

Publication number
JPS63186298A
JPS63186298A JP62018078A JP1807887A JPS63186298A JP S63186298 A JPS63186298 A JP S63186298A JP 62018078 A JP62018078 A JP 62018078A JP 1807887 A JP1807887 A JP 1807887A JP S63186298 A JPS63186298 A JP S63186298A
Authority
JP
Japan
Prior art keywords
word
matching
section
words
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62018078A
Other languages
English (en)
Other versions
JP2589299B2 (ja
Inventor
教幸 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62018078A priority Critical patent/JP2589299B2/ja
Publication of JPS63186298A publication Critical patent/JPS63186298A/ja
Application granted granted Critical
Publication of JP2589299B2 publication Critical patent/JP2589299B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔目 次〕 概要 産業上の利用分野 従来の技術 発明が解決しようとする問題点 問題点を解決するための手段 作用 実施例 ■、実施例と第1図との対応関係 ■、実施例の構成 ■、実施例の動作 ■、実施例のまとめ ■0発明の変形態様 発明の効果 〔概 要〕 単語音声認識装置であって、所定の分類基準に従って複
数に分けられた単語音声の登録パラメータのそれぞれに
ついて、入力単語音声についての入力パラメータを照合
して、両パラメータ間で最小距離もしくは最大類似度と
なる単語音声を求めて、選択的に出力する。単語音声群
はある基準に従って分類されているので、当該基準に沿
った関係上にある単語音声の照合に要する時間が短縮さ
れる。
〔産業上の利用分野〕
本発明は、単語音声認識装置に関し、特に、人が発声す
る言葉を自動認識する技術である音声認識を適応し、登
録されている音声パターンと照合して、発声された単語
に関する情報を得るようにした単語音声認識装置に関す
るものである。
〔従来の技術〕
従来から、このような音声認識に関しての研究が盛んで
あり、また、それを応用した音声認識装置も開発、実用
化されている。
このような音声認識装置の参考文献として、1983年
11月7日発行の「日経エレクトロニクス」の第171
頁〜第208頁「連続発声した単語音声を効率的に認識
する2段DPマツチング」が挙げられる。そこに紹介さ
れている音声認識装置における音声認識処理としては、
第3図に示すような流れとなっている。
図において、先ず、マイクロホン451から入ってくる
音声は、分析部453によって分析され、その音声パタ
ーンの特徴を表す認識パラメータが抽出される。
このシステムにあっては、特定話者用の単語音声認識装
置であるとすると、切換スイッチ455を「登録」の側
に設定して、分析部453で抽出された音声パターンの
特徴を表す認識パラメータを、その特定話者用に標準パ
ターン部457に登録する。これにより、このシステム
によって認識動作を行なう前に、その特定話者の各認識
対象単語の分析結果が、標準パターンとして予め登録さ
れる。
実際に認識動作を行なうときには、切換スイッチ455
を「認識」側に設定しである。各認識対象単語の標準パ
ターン(標準パターン部457に登録済み)と、現入力
音声パターン(分析部453から得られる)の両パラメ
ータを比較して、最も近い(すなわち距離の小さい)認
識対象単語を選択する。つまり、パターンマツチング処
理を行なう。
ここで、パターンマツチング処理は、距離計算部459
により、分析部453から得られる現入力音声パターン
のパラメータと、既に標準パターン部457に登録され
ている各認識対象単語の標準パターンとの距離を演算す
る。また、最小値検出部461は、距離計算部459に
おける計算結果に基づいて、最も距離の小さい標準パタ
ーン認識対象単語を抽出して、r認識結果Jとして出力
する。
なお、パターンマツチング処理方法としては、距離計算
手法の他に類似度計算手法も知られている。「距離の小
さい」ことと、「類似度の大きい」ことは等価である。
〔発明が解決しようとする問題点〕
ところで、上述した従来方式にあっては、現入力音声パ
ターンのパラメータを、標準パターン部457に予め登
録しである認識対象単語の標準パターンと比較する際に
は、該標準パターン部457に登録しである認識対象単
語の全てについて比較する。そのため、認識対象単語群
の全てについて照合を行ない、1位、2位、3位、・・
・・・・を決定し、順番に「認識結果」として出力して
いた。
しかしながら、標準パターン部457に予め登録しであ
る認識対象単語が少ないときには問題ないが、当該認識
対象単語が多いときには、それら認識対象単語の全てに
ついて比較しているので、「認識結果jが得られるまで
に多大の時間がかかる。そのため、認識動作における応
答が遅くなってしまうという問題点があった。
通常、標準パターン部457については、その使用歩頁
度を考慮しないで単語登録は行なわれている。
いま、多項目入力につき、それらについて認識動作を行
なうものとする。
例えば、標準パターン部457に予め登録しである認識
対象単語群での単語数が10000語であり、その内債
用頻度の高い単語は1000語であるものとする。その
場合、第3図に示すようなシステムでの認識性能は、使
用頻度の高い1000語についての「認識率」が90パ
ーセント、また、10000語の全てについての「認識
率」は70パーセントであり、更に、1誘光たりの「照
合時間」は、0.5 maであるものとする。
その場合の実効認識率は、70パーセントであり、また
、応答時間は5秒(=0.5 maX l 0000語
)である。
このように、多項目入力として認識対象単語が多いとき
には、「認識結果」が得られるまでに多大の時間がかか
ってしまう。
本発明は、このような点にかんがみて創作されたもので
あり、実効認識率の向上を図ると共に、単語情報の照合
に要する時間が短縮された単語音声認識装置を提供する
ことを目的としている。
〔問題点を解決するための手段〕
第1図は、本発明の単語音声認識装置の原理ブロック図
である。
図において、複数の単語登録手段111A、B。
C1・・・・・・のそれぞれには、所定の分類基準に従
って複数に分けられた単語音声の各パターンについてそ
の特徴を表すパラメータが登録されている。
照合手段117は入力単語音声のパターンについてその
特徴を表す入力パラメータ113を得、複数の単語登録
手段111A、 B、 C,・・・・・・のそれぞれが
有する登録パラメータと照合し、距離もしくは類似度を
求めて、照合結果115A、B。
C1・・・・・・として出力する。
格納手段119は、照合結果115A、 B、 C。
・・・・・・の情報を格納する。
選択制御手段123は、1つの照合結果115Aが得ら
れた段階で、距離最小もしくは類似度最大の単語を選び
、第1位の認識結果として出力する。ここで、単語登録
手段111Aに含まれる単語を使用頻度の高い少数の単
語としておけば、音声入力から認識結果が得られるまで
の時間が短縮されると共に認識率も向上する。もし、第
1位として出力した認識結果が誤りであった場合には、
使用者もしくは外部装置から次候補要求信号12■が発
せられる。選択制御手段123は、次候補要求信号12
1に応じて、格納手段119にその時点で格納されてい
る照合結果の中から、既に出力済みの単語を除いた上で
距離最小もしくは類似度最大の単語を選択し、認識結果
として出力する。
〔作 用〕
入力単語音声についての入力パラメータ113が与えら
れると、照合手段117は、複数の単語登録手段111
A、B、C,・・・・・・のそれぞれが有する登録パラ
メータのそれぞれと照合し、距離もしくは類似度を求め
て、照合結果115A、B。
C1・・・・・・として出力する。
これら照合結果115A、B、C,・・・・・・で表さ
れる単語毎の距離もしくは類似度の情報が、格納手段1
19に格納される。
選択制御手段123は、1つの照合結果115Aが得ら
れた段階で、距離最小もしくは類似度最大の単語を選び
、第1位の認識結果として出力する。
単語登録手段111Aに含まれる単語を使用額度の高い
少数の単語としておけば、音声入力から認識結果が得ら
れるまでの時間が短縮されると共に、認識率も向上する
もし、第1位として出力した認識結果が誤りであった場
合には、使用者もしくは外部装置から次候補要求信号1
21が発せられる。選択制御手段123は、次候補要求
信号121に応じて、格納手段119にその時点で格納
されている照合結果の中から、既に出力済みの単語を除
いた上で距離最小もしくは類似度最大の単語を選択し、
認識結果として出力する。
〔実施例〕
以下、図面に基づいて本発明の実施例について詳細に説
明する。
第2図は、本発明の一実施例における単語音声認識装置
の構成を示す。
■、    と 1゛との・心 、 ここで、本発明の実施例と第1図との対応関係を示して
おく。
単語登録手段111A、B、C,・・・・・・は、第1
パターン登録部211A、第2パターン登録部211B
に相当する。
入力パラメータ113は、区間検出出力信号213にお
ける入力単語音声パターンの特徴を表す認識パラメータ
に相当する。
照合結果115A、B、C,・・・・・・は、照合結果
出力信号215に相当する。
照合手段117は、第1照合部217A、第2照合部2
17B、判定部218に相当する。
格納手段119は、照合結果格納部219に相当する。
次候補要求信号121は、キーボード241から与えら
れる次候補要求信号に相当する。
選択制御手段123は、判定部218.制御部223に
相当する。
lロ■シ以匪戊 以上のような対応関係があるものとして、以下本発明の
実施例について説明する。
第2図に示す単語音声認識装置としては、特定話者用で
あるものとする。
マイクロホン231は、話者の音声を信号波形に変換す
るものであり、その波′影信号は次のパラメータ抽出部
233に供給されるようになっている。このパラメータ
抽出部233は、それぞれ周波数帯域の異なるバンドパ
スフィルタを複数個設けておき、一定間隔でサンプリン
グするものである。
ここで、第1パターン登録部211Aおよび第2パター
ン登録部211Bとして設けられている2つの標準パタ
ーン登録部には、当該特定話者についての音声パターン
の特徴を表す認識パラメータが、その特定話者用に登録
されている。その登録方法としては、その特定話者がマ
イクロホン231に向かって通常の発声状態で発声する
。その音声パターンの特徴を表す認識パラメータがバラ
メータ抽出部233によって抽出される。その抽出され
た音声パターンの特徴を表す認識パラメータが、当該特
定話者用に第1パターン登録部211Aおよび第2パタ
ーン登録部211Bに登録される。かような登録動作に
より、この単語音声認識装置によって認識動作を行なう
前に、その特定話者の各認識対象単語の分析結果が標準
パターンとして予め登録される。
ここで、第1パターン登録部211Aおよび第2パター
ン登録部211Bの2つに登録単語を分ける基準は、当
該特定話者に対する認識対象単語の使用頻度に従ってい
る。例えば、全体として1oooo語を登録するものと
して、その内の使用頻度の高い1000語を第1パター
ン登録部211Aに登録し、これに対員て使用頻度の高
くない9000語を第2パターン登録部211Bに登録
する。
この単語音声認識装置としては、パラメータ抽出部23
3の後段に区間検出部235を設け、制御部223の制
御の下に所定の区間について、パラメータ抽出部233
で抽出されたパラメータを検出する。
この区間検出部235は、本来「音声」でない部分も音
声波形に含まれているので、パワー等により、一定区間
について区切って、「音声」の部分を取り出している。
その検出されたパラメータを表す区間検出出力信号21
3が、第1照合部217Aおよび第2照合部217Bに
共通に供給される。
この第1照合部217Aには、第1パターン登録部21
1Aに登録されている各認識対象単語の標準パターンが
供給される。また、第2照合部217Bには、第2パタ
ーン登録部211Bに登録されている各認識対象単語の
標準パターンが供給されるようになっている。
第1照合部217Aおよび第2照合部217Bは共に制
御部223の制御に基づいて、区間検出出力信号213
によって表される音声パターンの特徴を表す認識パラメ
ータが、第1パターン登録部211Aに登録されている
各認識対象単語の標準パターンと、また、第2パターン
登録部211Bに登録されている各認識対象単語の標準
パターンとそれぞれ照合されて、単語毎に距離が求めら
れ、その照合結果を表す照合出力信号214A。
照合出力信号214Bが出力されて判定部218に供給
される。
判定部218では、照合出力信号214A、照合出力信
号214Bで表されるそれぞれの照合結果を受は取り、
そのまま、照合結果出力信号215として、照合結果格
納部219に順次格納されるようになっている。また、
判定部218では、照合出力信号214A中の距離最小
の単語を選択した後、出力制御信号216を、制御部2
23に供給すると同時に、第1位の認識結果として上記
距離最小の単語を表す選択結果信号224が制御部22
3に供給される。
キーボード241は、この単語音声認識装置を操作する
ための多数のキーが具わっており、その中には、照合結
果格納部219に格納された複数の認識対象単語を、任
意に選択して制御部223が「認識結果Jとして、利用
装置(図示せず)に与えられるようにするための次候補
要求キー(図示せず)が含まれている。
第1位の認識結果が誤りであった場合には、使用者が、
この次候補要求キーを押下することにより、制御部22
3から判定部218に次候補要求信号が送られる。判定
部218では、照合結果格納部219から既に出力済み
の単語を除いた中から距離最小の単語を選択し、選択結
果信号224を制御部223に供給する。
l−天皇斑皇軌作 上述した構成による実施例の動作について、以下説明す
る。
この単語音声認識装置が対象としている特定話者が、マ
イクロホン231の前で、「認識動作」を行なうために
、特定の単語を発声したものとする。
但し、「単語」は単音節のもの、また、それ以外のもの
も含むものとする。
マイクロホン231によって捕らえられた音声波形は、
パラメータ抽出部233によって、音声パターンの特徴
を表す認識パラメータが抽出される。その抽出された音
声パターンの特徴を表す認識パラメータが区間検出部2
35に供給され、区間検出部235において、時間的に
パワーの変化する特定の区間にてバラメーク検出され、
その検出されたパラメータを表す区間検出出力信号21
3が、第1照合部217Aおよび第2照合部217Bに
共通に供給される。
制御部223から、第1照合部217Aおよび第2照合
部217Bの照合動作を付勢するように制御信号が与え
られる。第1照合部217Aは、第1パターン登録部2
11Aに登録されている「高使用頻度の単語」音声と、
区間検出出力信号213として導入された検出単語音声
パターンと、それらの特徴を表すパラメータに基づいて
比較する。、第1パターン登録部211Aの登録単語は
1000語と少ないので、全部の登録単語についての照
合動作は速く、全ての照合に基づく照合出力信号214
Aが第1照合部217Aから判定部218に供給される
時間は短い。
また、第2照合部217Bも同様にして、第2パターン
登録部211Bに登録されている「低使用頻度の単語」
の標準パターンと、区間検出出力信号213として導入
された単語音声パターンと照合する。ここで、第2パタ
ーン登録部211Bの登録単語は9000語と多いので
、その照合動作は遅く、全てについての照合出力信号2
14Bが、第1照合部217Bから判定部218に供給
される時間は長い。
制御部223によって制御される判定部218は、照合
出力信号214Aおよび照合出力信号214Bを受け、
照合結果出力信号215として、照合結果格納部219
に与えられる。但し、「低使用頻度の単語」について格
納の終了は遅い。
このとき、照合出力信号214Aに対応した「高使用頻
度の単語」に対するr照合結果Jは、その「距離」の小
さい順に、第1位、第2位、第3位、・・・・・・とじ
て、照合結果格納部219に格納される。
また、照合出力信号214Bに対応した「低使用頻度の
単語」に対する「照合結果」も、その「距離」の小さい
順に、第1位、第2位、第3位。
・・・・・・として格納される。但し、「高使用鋲度の
単語」に対する「照合結果1と、「低使用頻度の単語」
に対する「照合結果」とは、それぞれの順に従っている
判定部218からは、出力制御信号216が制御部22
3に与えられ、これによって、少なくとも最初の「照合
結果jが判定部218において得られ、照合結果出力信
号215として照合結果格納部219に格納されたこと
を通知することとなる。これを受けた制御部223は、
先ず、「高使用頻度の単語」に対する第1位の「照合結
果jを照合結果格納部219から取り出すべく、判定部
218に指令する。 ″ 判定部218は、「高使用頻度の単語」に対する第1位
の「照合結果」を格納単語情報信号222として照合結
果格納部219から求める。このようにして得た格納単
語情報信号222に応じて選択結果信号224として制
御部223に供給して、その次段に接続されるべき利用
装置(図示せず)に「認識結果jとして出力する。
仮に、この出力された第1位の「認識結果」が特定話者
の意図した現発声単語でなければ、キーボード241に
具わっている次候補キーを操作する。この次候補要求キ
ーを操作するまでには、第2照合部217Bによっても
照合動作が終了しているので、照合結果格納部219に
は、「高使用頻度の単語」のみならず、「低使用頻度の
単語」の単語も照合結果格納部219に「照合結果」が
格納されている。
従って、次候補キーが操作されれば、「高使用頻度の単
語」に対する第1位の「照合結果」を除外し、その他の
「高使用頻度の単語」および「低使用頻度の単語」の中
から、距離の小さい単語を判定部218は検索して格納
単語情報信号222として得、選択結果信号224とし
て制御部223に供給する。つまり、第2位の「認識結
果」が第1位の「照合結果」を除いて求められる。
但し、第2位の「照合結果」が、特定話者の意図シタ現
発声単語でなければ、再度次候補キーを操作することに
より、第3位の「照合結果」を照合結果格納部219か
ら取り出して、「認識結果、が利用装置に出力される。
以下、同様にして、第4位、第5位、・・・・・・と、
キーボード241の次候補キーを操作することによって
、任意に、照合結果格納部219に格納されている「認
識結果」を取り出して利用装置に出力することができる
このようにして、現に発声した特定話者の単語は、第1
パターン登録部211Aに登録されていた「高使用頻度
の単語」に対して正しい「認識結果」が得られる確立が
高く且つその速度も速くなる。
つまりミ現に発声した特定話者の単語は、第1パターン
登録部211Aに登録されている「高使用頻度の単語」
に対する照合結果、および、第2パターン登録部211
Bに登録されていた[低使用頻度の単語」に対する照合
結果が共に、「認識結果jとして出力可能である。
従って、第1パターン登録部211Aに登録されている
「高使用頻度の単語」は、1000語と少なく、その全
単語の照合に要する時間は少ないので、この単語音声認
識装置での特定話者に対する単語音声認識は素早くでき
ることとなる。
■、   1のまとめ このように、予め利用頻度の相違に着目し、予め登録す
べき単語をグループ分けし、標準パターンとして、第1
パターン登録部211Aおよび第2パターン登録部21
1Bの双方に予め登録している。入力単語音声に基づく
区間検出出力信号213を照合する際、それが使用頻度
の高いものであれば、直ぐに第1パターン登録部211
Aの登録単語との照合結果が得られる。
つまり、略第1パターン登録部211Aに登録されてい
る単語との照合に要する時間だけで、r認識結果jが得
られるので、応答速度が速く且つ  □実効認識率が極
めて高くなる。
ここで、従来との比較を示しておく。この単語音声認識
装置にあっても、その個々の認識性能は同じと仮定する
。つまり、使用頻度の高い1000語および10000
語の全てについてのそれぞれの「認識率」は90パーセ
ントおよび70パーセントであり、また、1誘光たりの
「照合時間」は、0.5msであるものとする。
この単語音声認識装置における実効認識率は、81パー
セント(0,9Xo、9 =0.81)である。また、
応答時間は0.5秒(0,5msX 1000語)とな
る。但し、この時間は第1照合部217Aによって、第
1パターン登録部211Aの登録単語との照合に要する
処理時間であり、キーボード241の次候補キーを使用
しなかった場合である。
このように、実効認識率の向上が図られ且つ単語情報の
照合に要する時間が短縮されることが理解できるであろ
う。特に、入力項目が多くなればなる程この効果は顕著
である。
■ 、     日 の  ・ ノ ピ 。
なお、上述した本発明の実施例にあっては、第1照合部
217Aおよび第2照合部217Bの2つを単語照合手
段として設けたが、これを1つの照合部としてもよい。
その場合、制御部223の制御によって第1パターン登
録部211Aおよび第2パターン登録部211Bをそれ
ぞれ切り換えて、時間的にずれた形で、先ず第1パター
ン登録部211Aに登録されている使用頻度の高い各認
識対象単語と照合する。続いて、第2パターン登録部2
11Bに登録されている使用頻度の低い各認識対象単語
と照合するようにすればよい。「高使用頻度の単語」で
の「照合結果Jが得られ、次候補要求キーを操作してい
る間には、「低使用頻度の単語」の「照合結果」が得ら
れているので、何ら不都合はない。
また、上述実施例にあっては、1回の次候補キーの操作
までに、「低使用頻度の単語」についての照合が完了し
ているものとしたが、必ずしも完了していなくてもよい
。第2照合部217Bによる照合結果を順次受は入れ、
再度の次候補キー操作までに照合の終了している範囲内
の照合結果に基づいて、距離の小さいものを順次「認識
結果」とするようにすればよい。かような例は、「低使
用頻度の単語」として定義した単語が極めて多い場合に
起こり得る。
上述した本発明実施例にあっては、第1パターン登録部
211Aおよび第2パターン登録部211Bに予め登録
する各認識対象単語のグループ分けは、その使用頻度に
基づいて行なうものとしたが、これに限られることはな
い。単語音声認識装置の利用の実情に合わせて、登録単
語のグループ化は行なえばよい。このグループも3つ以
上としてもよく、3つ以上のパターン登録部を設けて登
録し、その全てについて照合するようにしてもよい。
このグループ分けの基準として、「使用頻度」の他にも
各種の基準が考えられる0例えば、「重要度」に基づき
、音声認識装置の使用Li様に応じてグループ分けして
もよい。
但し、例えば「緊急停止1等のような重要度の高い単語
はその使用頻度は低いが、「最重要度の単語」にグルー
プ化しておく必要がある。
上述した実施例では距離計算手法を採用したが、本発明
はこれに限られるものではなく、類似度の大きいものを
求める類似度計算手法を採用することが可能であること
は明らかである。
更に、「1.実施例と第1図との対応関係」において、
第1図と本発明との対応関係を説明しておいたが、これ
に限られることはなく、各種の変形態様があることは当
業者であれば容易に推考できるであろう。
〔発明の効果〕
上述したように、本発明によれば、所定の分類基準に従
って複数に分けられた単語音声の特徴を表す登録パラメ
ータのそれぞれと、入力単語音声についての入力パラメ
ータとを照合し、両バラ人−タ間で最小距離もしくは最
大類似度となる単語音声についての登録パラメータを求
めて当該単語音声での認識結果として得るようにするこ
とにより、単語の分類基準に沿った関係上にある単語音
声の照合に要する時間が短縮されるので、実用的には極
めて有用である。
【図面の簡単な説明】
第1図は本発明の単語音声認識装置の原理ブロック図、 第2図は本発明の一実施例による単語音声認識装置の構
成ブロック図、 第3図は従来から行なわれている音声認識の処理を示す
構成図である。 図において、 111A、B、C,・・・・・・は単語登録手段、11
3は入力パラメータ、 115A、B、C,・・・・・・は照合結果、117は
照合手段、 119は格納手段、 121は次候補要求信号、 123は選択制御手段、 211A、Bはパターン登録部、 213は区間検出出力信号、 21’4A、Bは照合出力信号、 215は照合結果出力信号、 217A、Bは照合部、 218は判定部、 219は照合結果格納部、 222は格納単語情報信号、 223は制御部、 224は選択結果信号、 231はマイクロホン、 233はパラメータ抽出部、 235は区間検出部、 241はキーボード、 453は分析部、 457は標準パターン部、 459は距離計算部、 461は最小値検出部である。

Claims (5)

    【特許請求の範囲】
  1. (1)所定の分類基準に従って複数に分けられた単語音
    声の各パターンについてその特徴を表すパラメータが登
    録されている複数の単語登録手段(111A、B、C、
    ・・・・・・)と、 入力単語音声のパターンについてその特徴を表す入力パ
    ラメータ(113)を得、複数の単語登録手段(111
    A、B、C、・・・・・・)のそれぞれが有する前記登
    録パラメータと照合し、距離もしくは類似度を求めて照
    合結果(115A、B、C、・・・・・・)として順次
    出力する照合手段(117)と、照合結果(115A、
    B、C、・・・・・・)の情報を格納する格納手段(1
    19)と、 最初は照合結果(115A、B、C、・・・・・・)の
    中から一番距離の小さい単語もしくは一番類似度の大き
    い単語を選び第1位の認識結果とし、次候補要求信号(
    121)があった場合には、格納手段(119)にその
    時点で格納されている照合結果の情報から、既に認識結
    果として出力済みの単語を除いた中で距離の一番小さい
    もしくは類似度最大の単語を選択し、認識結果として出
    力する選択制御手段(123)と、 を具えるように構成したことを特徴とする単語音声認識
    装置。
  2. (2)照合手段(117)は、複数の単語登録手段(1
    11A、B、C、・・・・・・)に対応した複数の照合
    回路部から成っており、該複数の照合側路部は入力パラ
    メータ(113)を共通的に受け、各照合回路部は、複
    数の単語登録手段(111A、B、C、・・・・・・)
    のうち対応する単語登録手段が有する単語の前記登録パ
    ラメータと照合して、前記照合結果を出力するように構
    成したことを特徴とする特許請求の範囲第1項記載の単
    語音声認識装置。
  3. (3)照合手段(117)は、1つの照合回路部で成り
    、複数の単語登録手段(111A、B、C、・・・・・
    ・)を順次切り換えて、各単語登録手段が有する前記登
    録パラメータと照合して、照合結果(115A、B、C
    、・・・・・・ )を順次出力するように構成したこと
    を特徴とする特許請求の範囲第1項記載の単語音声認識
    装置。
  4. (4)前記単語音声のパラメータを、複数の単語登録手
    段(111A、B、C、・・・・・・)のいずれに登録
    すべきかを決める前記所定の分類基準は、前記入力単語
    音声として現れる単語の頻度であることを特徴とする特
    許請求の範囲第1項記載の単語音声認識装置。
  5. (5)前記単語音声のパラメータを、複数の単語登録手
    段(111A、B、C、・・・・・・)のいずれに登録
    すべきかを決める前記所定の分類基準は、前記入力単語
    音声として現れる単語の重要度であることを特徴とする
    特許請求の範囲第1項記載の単語音声認識装置。
JP62018078A 1987-01-28 1987-01-28 単語音声認識装置 Expired - Fee Related JP2589299B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62018078A JP2589299B2 (ja) 1987-01-28 1987-01-28 単語音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62018078A JP2589299B2 (ja) 1987-01-28 1987-01-28 単語音声認識装置

Publications (2)

Publication Number Publication Date
JPS63186298A true JPS63186298A (ja) 1988-08-01
JP2589299B2 JP2589299B2 (ja) 1997-03-12

Family

ID=11961616

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62018078A Expired - Fee Related JP2589299B2 (ja) 1987-01-28 1987-01-28 単語音声認識装置

Country Status (1)

Country Link
JP (1) JP2589299B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009107411A1 (ja) * 2008-02-28 2009-09-03 日本電気株式会社 音声認識装置、音声認識方法、及び、音声認識プログラムが記録された記録媒体
US10138454B2 (en) 2014-06-24 2018-11-27 Nissha Printing Co., Ltd. Culture container
JP2020160118A (ja) * 2019-03-25 2020-10-01 株式会社エヌ・ティ・ティ・データ 情報処理装置、情報処理方法およびプログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3530109B2 (ja) * 1999-05-31 2004-05-24 日本電信電話株式会社 大規模情報データベースに対する音声対話型情報検索方法、装置および記録媒体
WO2006137245A1 (ja) * 2005-06-21 2006-12-28 Pioneer Corporation 音声認識装置、情報処理装置、音声認識方法、音声認識プログラムおよび記録媒体
DE112006002988T5 (de) * 2005-12-14 2009-01-29 Mitsubishi Electric Corp. Spracherkennungsvorrichtung

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57150895A (en) * 1981-03-12 1982-09-17 Nippon Electric Co Voice input unit
JPS6127200U (ja) * 1984-07-24 1986-02-18 日本信号株式会社 音声認識入力装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57150895A (en) * 1981-03-12 1982-09-17 Nippon Electric Co Voice input unit
JPS6127200U (ja) * 1984-07-24 1986-02-18 日本信号株式会社 音声認識入力装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009107411A1 (ja) * 2008-02-28 2009-09-03 日本電気株式会社 音声認識装置、音声認識方法、及び、音声認識プログラムが記録された記録媒体
JP5381973B2 (ja) * 2008-02-28 2014-01-08 日本電気株式会社 音声認識装置、音声認識方法、及び、音声認識プログラムが記録された記録媒体
US10138454B2 (en) 2014-06-24 2018-11-27 Nissha Printing Co., Ltd. Culture container
JP2020160118A (ja) * 2019-03-25 2020-10-01 株式会社エヌ・ティ・ティ・データ 情報処理装置、情報処理方法およびプログラム

Also Published As

Publication number Publication date
JP2589299B2 (ja) 1997-03-12

Similar Documents

Publication Publication Date Title
US7769588B2 (en) Spoken man-machine interface with speaker identification
US6751595B2 (en) Multi-stage large vocabulary speech recognition system and method
JP3284832B2 (ja) 音声認識対話処理方法および音声認識対話装置
US8145486B2 (en) Indexing apparatus, indexing method, and computer program product
JPH10319988A (ja) 話者識別方法および話者認識装置
US20220262345A1 (en) Training Keyword Spotters
WO2021030918A1 (en) User-defined keyword spotting
TW201926324A (zh) 語音情緒辨識系統與方法以及使用其之智慧型機器人
US11081115B2 (en) Speaker recognition
JPS63186298A (ja) 単語音声認識装置
JP2589300B2 (ja) 単語音声認識装置
JP4475380B2 (ja) 音声認識装置及び音声認識プログラム
JP3708747B2 (ja) 音声認識方法
WO2004012184A1 (en) Spoken man-machine interface with speaker identification
JPH02300800A (ja) 音声認識装置
JPH03180897A (ja) 音声認識装置
JP2006039383A (ja) 音声認識装置
JPS59212900A (ja) 音声認識装置
JPS58159599A (ja) 単音節音声認識方式
JP2000137495A (ja) 音声認識装置および音声認識方法
JPS6175982A (ja) パタン認識装置
JPH0380299A (ja) 単語音声予備選択方式
JPH0784590A (ja) パターン追加登録装置
JP2001109492A5 (ja) 音声認識方法および装置
JPS62111295A (ja) 音声認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees