JPH0792675B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0792675B2
JPH0792675B2 JP61061725A JP6172586A JPH0792675B2 JP H0792675 B2 JPH0792675 B2 JP H0792675B2 JP 61061725 A JP61061725 A JP 61061725A JP 6172586 A JP6172586 A JP 6172586A JP H0792675 B2 JPH0792675 B2 JP H0792675B2
Authority
JP
Japan
Prior art keywords
dictionary
word
similarity
recognition
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP61061725A
Other languages
English (en)
Other versions
JPS62217298A (ja
Inventor
晴剛 安田
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61061725A priority Critical patent/JPH0792675B2/ja
Publication of JPS62217298A publication Critical patent/JPS62217298A/ja
Publication of JPH0792675B2 publication Critical patent/JPH0792675B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 技術分野 本発明は、音声認識装置,より詳細には、音声認識装置
の認識処理及び辞書作成処理に関する。
従来技術 音声認識装置における音声区間検出において、100%完
璧な入力を得ることは難しく、特に、騒音下の場合など
は可変閾値方式を構じているものが多いため、語頭,語
尾の子音ブロックなどが検出されないことがたびたび生
じる。又、不特定話者認識方式などにおいては個人間の
バラツキがあり、子音ブロックのパワーの強弱や時間幅
が極端に違う場合がある。このような場合、ある特定の
ブロックが欠落し、まず、辞書作成を行う場合や認識時
にその差異のために正常な辞書が作れなかったり、誤認
識を起こしてしまうことになる。而して、従来において
は、ある音声ブロックが話者によって欠落したりしなか
ったりした場合、あらかじめその単語を認識しにくい単
語として欠落している単語と欠落していない単語の両方
の辞書を有するマルチプレート処理を行っていた。又、
辞書作成時にはそのまま加算していたため、その辞書の
精度が悪くなることが多かった。
なお、本発明に係る従来技術を記載した公知文献として
は、例えば、「不特定話者単語音声認識−部分的な線形
伸縮と加重平均辞書を用いる方法−」(室井哲也外3名
電子通信学会論文誌‘86/1 Vol.J69−A No.1,P150−15
7)がある。この文献のものは、破裂音の前や促音とし
て生じる無音区間に着目し、これを規準点としてその前
後を線形に伸縮し、演算量の増加をなくし、認識率の向
上を図るものである。しかしながら、本発明が、語尾が
欠落しやすい言語に着目しているのに対し、上記文献の
ものは語尾の欠落については意識せずに、単に無音区間
の前後を伸縮するものである。
目的 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声認識装置における認識率を向上させる。こと
を目的としてなされたものである。
構成 本発明は、上記目的を達成するために、マイクから入力
された音声の特徴量を抽出する特徴抽出部と、音声区間
を検出する音声区間検出部と、一単語内の有音区間と無
音区間を切り分け、その無音区間に基づいてブロック単
位で加算辞書を登録する辞書作成部と、無音区間に基づ
いて認識処理を行う認識処理部と、単語にあらかじめつ
けられた識別子をチェックする識別子チェック部と、辞
書作成時に、欠落しやすいブロックを有する単語をあら
かじめ指定しておく単語辞書とを有し、認識時に、入力
パターンに対してそのブロックが欠落した場合とそうで
ない場合の両方の類似度を算出し、類似度の高い方をそ
の単語の類似度とするパターン照合を行うことを特徴と
したものである。以下、本発明の実施例に基づいて説明
する。
第1図は、本発明の一実施例を説明するための電気的ブ
ロック線図で、図中、1はマイク,2は前処理部,3は特徴
抽出部,4は音声区間検出部,5は認識処理及び辞書作成
部,6は識別子チェック部,7は単語辞書で、以下、一例と
して、BTSP方式を用いた無音区間に着目した不特定話者
認識装置に適用した場合について説明する。
第2図は、無音区間に着目した認識方法の一例を説明す
るための図で、この無音区間に着目した認識方法は、音
声区間A中に生じる無音区間Bを節としてその両側の有
音ブロックC同志を対応づけてパターン照合を行うもの
である。ところが、例えば、図示の‘ストップ’という
単語は、話者によっては、第3図に示すように‘プ’が
欠落する場合がある。例えば入力時に‘プ’が欠落した
場合、入力の‘スト’と辞書の‘ストップ’とを認識す
ることになり、誤認識の原因となる。
本発明は、上述のごとき誤認識を防止するためになされ
たもので、本発明においては、上述のごとき、単語にあ
らかじめ、辞書作成時に識別子をつけておき、この識別
子のついているものに関しては、辞書の語尾のブロック
についている場合と、ついていない場合の2回の認識演
算を行い、その類似度の大きい方をその単語の類似度と
するようにしたものである。このような語尾の欠落は、
特に日本語の「スキップ」「アップ」等や、英語、独語
などの外国語に多くみられる。又、語尾が欠落する場合
や、語頭の場合、その場合に応じて識別子を変化させれ
ば認識時のこの2回の設定の仕方は容易に判断ができ
る。
次に、辞書作成時に本発明を適用する場合について述べ
る。認識時と同様に無音区間に着目して辞書作成するた
め、語中の有音ブロックが欠落すると、作成された辞書
の質が低下する。また、辞書作成時に例えば3回の加算
辞書を作る場合、その類似度を求めてチェックしながら
行う方法がある。従って、その類似度を求める際にブロ
ックが欠落している場合としていない場合とを想定し
て、2回の類似度演算を用い、その類似度の大きい方が
正しい対応づけとなり、ブロックが欠落しているとして
そのブロックを除外して他ブロックのみを辞書加算する
ことにより正確な辞書を作成することが可能となる。
第4図は、その場合の一例を示す図で、が1回目の照
合、が2回目の照合である。また、前述のあらかじめ
識別子をつけておくのは、例えば辞書別のもので作成し
て供給する場合は容易に供給する事ができるが、その装
置で作成する場合は識別子を自動的に作成しなくてはな
らない。そのためには上記の2回の類似度を求める演算
を行った結果、ブロックが欠落した方が類似度が高かっ
た場合、そのように入力が欠落する場合があり得るの
で、その単語にその識別子を付加させればよいことにな
る。この様にして、辞書作成時に識別子に応じて認識時
にその類似度演算を数回行い、その最も高い類似度のも
のを認識結果とすればよい。
効果 以上の説明から明らかなように、本発明によると、たび
たびブロックが欠落する様な単語でも正確に辞書を作
り、認識することが可能となる。また、語頭、頭尾の欠
落に対し、比較的欠落の生じ易い単語を単語辞書に予め
指定しておき、語頭、語尾ブロックを有する場合と有し
ない場合の2つの類似性を求めて音声認識することによ
り、音声認識精度の向上を図ることができる。
【図面の簡単な説明】
第1図は、本発明による音声認識装置の一実施例を説明
するための電気的ブロック線図、第2図は、無音区間に
着目した認識方法の一例を説明するための図、第3図
は、従来の認識方法の欠点を説明するための図、第4図
は、辞書作成の一方法を説明するための図である。 1……マイク,2……前処理部,3……特徴抽出部,4……音
声区間検出部,5……認識処理及び辞書作成部,6……識別
子チェック部,7……単語辞書。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】マイクから入力された音声の特徴量を抽出
    する特徴抽出部と、音声区間を検出する音声区間検出部
    と、一単語内の有音区間と無音区間を切り分け、その無
    音区間に基づいてブロック単位で加算辞書を登録する辞
    書作成部と、無音区間に基づいて認識処理を行う認識処
    理部と、単語にあらかじめつけられた識別子をチェック
    する識別子チェック部と、辞書作成時に、欠落しやすい
    ブロックを有する単語をあらかじめ指定しておく単語辞
    書とを有し、認識時に、入力パターンに対してそのブロ
    ックが欠落した場合とそうでない場合の両方の類似度を
    算出し、類似度の高い方をその単語の類似度とするパタ
    ーン照合を行うことを特徴とする音声認識装置。
  2. 【請求項2】前記辞書作成時に、類似度を求めながら辞
    書加算を行うことを特徴とする特許請求の範囲第(1)
    項記載の音声認識装置。
JP61061725A 1986-03-19 1986-03-19 音声認識装置 Expired - Fee Related JPH0792675B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61061725A JPH0792675B2 (ja) 1986-03-19 1986-03-19 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61061725A JPH0792675B2 (ja) 1986-03-19 1986-03-19 音声認識装置

Publications (2)

Publication Number Publication Date
JPS62217298A JPS62217298A (ja) 1987-09-24
JPH0792675B2 true JPH0792675B2 (ja) 1995-10-09

Family

ID=13179480

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61061725A Expired - Fee Related JPH0792675B2 (ja) 1986-03-19 1986-03-19 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0792675B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4655184B2 (ja) * 2001-08-01 2011-03-23 ソニー株式会社 音声認識装置および方法、記録媒体、並びにプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0632006B2 (ja) * 1985-11-08 1994-04-27 松下電器産業株式会社 音声認識装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
電子通信学会論文誌(昭和61年1月)J69−A,No.1,P.150−158

Also Published As

Publication number Publication date
JPS62217298A (ja) 1987-09-24

Similar Documents

Publication Publication Date Title
US20040024585A1 (en) Linguistic segmentation of speech
JP3069531B2 (ja) 音声認識方法
KR102324829B1 (ko) 음성 인식 오류 보정 장치 및 방법
JP5342629B2 (ja) 男女声識別方法、男女声識別装置及びプログラム
JPH0792675B2 (ja) 音声認識装置
JP2838848B2 (ja) 標準パターン登録方式
US6438521B1 (en) Speech recognition method and apparatus and computer-readable memory
JP2966002B2 (ja) 音声認識装置
JP3039453B2 (ja) 音声認識装置
JPH08314490A (ja) ワードスポッティング型音声認識方法と装置
JP3110025B2 (ja) 発声変形検出装置
JP3031081B2 (ja) 音声認識装置
JP3020999B2 (ja) パターン登録方法
KR20050001684A (ko) 미등록어 처리를 지원하는 음성 인식 시스템과 방법 및이를 저장한 컴퓨터 판독 가능 기록매체
JPS62245295A (ja) 特定話者音声認識装置
JP2996977B2 (ja) 音声認識装置
JPH0376471B2 (ja)
JP2712586B2 (ja) 単語音声認識装置用パターンマッチング方式
JP3011984B2 (ja) パターン照合方法
JPS60159798A (ja) 音声認識装置
JPH0640274B2 (ja) 音声認識装置
JPS63173100A (ja) キ−ワ−ド抽出装置
JPH0534677B2 (ja)
JPS63142395A (ja) 標準パターン作成方法
JPS6344698A (ja) 単語検出方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees