JP2665543B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2665543B2
JP2665543B2 JP62250451A JP25045187A JP2665543B2 JP 2665543 B2 JP2665543 B2 JP 2665543B2 JP 62250451 A JP62250451 A JP 62250451A JP 25045187 A JP25045187 A JP 25045187A JP 2665543 B2 JP2665543 B2 JP 2665543B2
Authority
JP
Japan
Prior art keywords
word
suffix
recognition
output
vowel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62250451A
Other languages
English (en)
Other versions
JPH0192799A (ja
Inventor
敏雄 西山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP62250451A priority Critical patent/JP2665543B2/ja
Publication of JPH0192799A publication Critical patent/JPH0192799A/ja
Application granted granted Critical
Publication of JP2665543B2 publication Critical patent/JP2665543B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 「産業上の利用分野」 この発明は余剰語付きの単語発声を許容することによ
り、発声条件を緩和した離散単語音声認識装置に関する
ものである。 「従来の技術の問題点」 現在の離散単語音声認識は、特定話者、小語彙の条件
の元では、かなりの認識率が得られるが、単語以外の余
剰語が付加されると著しく認識率が低下するという欠点
があった。 従って、不特定の利用者による離散単語音声認識装置
の利用を想定すると、特に、発生に不慣れな利用者の場
合、単語の前に「えーっと」や「あのー」などの接頭語
や、氏名の発声においては「さん」「君」などの接尾語
が発生しやすいことから(例えば、有田他:「メデイア
に依存する会話の様式」,情処学会,自然言語処理研究
会資料61−5(1987.5.22)他)、これが余剰語となり
実用化に必要な認識性能が得られない。 そのため従来は、「えーっと、×××さん」のような
連続的な発声は全て受け付けず、発声者は常に音声入力
であることを意識し、一般の利用者にとって取り付き難
いと言う欠点があった。 一方、これらを一種の連続音声中からの単語検出と捕
らえワードスポッティング法の適用が考えられる。しか
し、従来のワードスポッティング法は、文章の朗読のよ
うな音声中に複数の単語を含む連続発声からの単語検出
を処理の対照としており、アルゴリズムが複雑で処理時
間も大きいため、上記のような単語を一つしか含まない
短い発声には経済的でないという欠点があった。 この発明は、余剰語付き単語発声に対する離散単語音
声認識装置の認識率の低下という欠点、そのことから生
じる利用者の使いがっての悪さという欠点、及びワード
スポッティング法の処理時間増加という欠点に対し、音
声中でパワーが大きく定常的であるという母音の特徴を
用いた母音部検出による接頭語の除去、及び接尾語の接
続長の統計的特徴を用いた接尾語の除去を行うという簡
便な新しいワードスポッティング法による余剰語除去を
行い、音声入力の熟練者以外も含めた実用サービスに対
し、十分な認識率が得られる離散単語音声認識装置を提
供することにある。 「問題点を解決するための手段」 この発明は、従来の離散単語音声認識装置では取り扱
うことのできなかった接頭・接尾語付きの連続的な単語
発声に対し、接頭語の母音検出と接尾語の継続長の統計
値として平均値と分散を用い、これら余剰語の除去を行
うことを最も主要な特徴とする。 従来装置とは以下の2点が異なる。 接頭語除去 発声される単語の前に検出される接頭語は「えーっ
と」や「あのー」のように母音を含むことが多く、これ
らの母音はパワーが大きくしかも定常的な継続長も長い
ため、従来から用いられている母音認識法によってかな
りの認識率が得られる。そこで、母音認識の適用による
母音部の検出と、その検出された母音部の後端からパワ
ーディップの検出を行い、そこを単語部の先頭として認
識処理を開始することにより接頭語の除去を行う。 接尾語除去 発声された単語後に連続して現れる接尾語は、発声単
語により頻出する接尾語の種類が限定される場合がある
(例えば氏名の場合の「さん」や「君」等)。そこで、
これらの代表的な接尾語の継続長の平均値と分散を予め
求めておき、これと単語の認識処理後に残っている音声
信号の継続長とを比較し、接尾語に対する区間推定を行
って、接尾語があると推定できる場合にはその区間の前
端を単語部の終端として認識処理を打ち切ることにより
接尾語の除去を行う。 「実施例」 第1図はこの発明の実施例を説明する図であって、1
は入力端子、2はA/D変換器、3は特徴抽出部、4は時
系列メモリ、5は接尾語メモリ、6は認識処理部、7は
出力端子である。 次にこの発明の動作について説明する。まず、入力端
子1より入力された音声信号は、A/D変換器2によりデ
ィジタル信号に変換され、次に特徴抽出部3で特徴パラ
メータ時系列に変換される。この特徴抽出部の出力は時
系列メモリ4に格納される。また、予め統計的に求めら
れた接尾語の継続長の平均値と分散を接尾語メモリ5に
格納しておく。 続いて、認識処理部6では、第2図に示すように以下
の手順により処理を行う。 時系列メモリの内容に沿って母音部検出手段によりボ
トムアップ母音認識を行い、音声信号中の母音部(複
数)を抽出する。 母音部終端検出手段により抽出した母音区間毎の終端
が出力され、更に抽出された母音部の後端を起点とし
て、予め設定したしきい値以下となるパワーディップを
検出する。 単語認識手段によりパワーの最低値をとる時点を単語
部の最初の先頭候補とし先頭候補から単語の認識処理を
行う。 認識処理が終了した時点で、残っている音声信号の継
続長(1r)を求め、残りの音声信号の継続長と接尾語
メモリに格納されている接尾語の継続長の平均値(1s)
とを比較し、以下の式を満たしている場合は、単語が正
常認識されたものとし認識処理を打ち切る。また、満た
していない場合は、その先頭候補を除外する(統計値と
の比較手段、接尾語判定手段)。 |1r−1s|≦c・σ ・・・・・(1) σs:接尾語の継続長の分散,c:定数 ここで、cは統計的な信頼区間を設定するものであり、
利用者数、使用される接尾語の種類が多い場合は大き
く、そうでない場合は小さくすることで、認識性能を調
整できる。 単語部の全ての先頭候補について〜の処理を繰り
返し、正常認識された先頭候補が残っている場合は、そ
の先頭候補を単語部の前端、認識処理終了点を単語部の
後端として単語部区間と認識単語を、また先頭候補が一
つも残っていない場合は認識失敗として認識結果を出力
端子7より出力する。 第3図は、この装置の認識処理部で余剰語付き氏名単語
が処理される様子を模式的に図示したものである。 まず、入力音声「えーっと、西山さん」に対し母音認
識を適用した結果、7ケ所の母音区間が得られる。次
に、これらの母音区間の後端を認識すべき単語部(「西
山」)の先頭候補として、単語の認識処理を開始する。
その結果、本来の単語部の先頭でない先頭候補(図では
候補1)から認識処理を行ったものについては、認識に
失敗し、単語のラベリング(単語のカナ表記と音声信号
との対応付け)途中でリジェクトされ、先頭候補から外
す。最後に、認識処理の終了した先頭候補(図では候補
2)の終了点以降にラベリングされずに残されている音
声信号の継続長(1r)に対し、これを接尾語と考え、単
語部が氏名単語であることがわかっている場合には、代
表的な接尾語である「さん」もしくは「君」などの継続
長の平均値(1s)との比較による区間推定により、ラベ
リング終了位置の単語部後端としての正当性を統計的に
評価する。その結果、予め想定した信頼確率に対し十分
な場合は正常認識が完了したとして受理し、認識結果と
して単語部区間とその単語を出力する。ここで、この他
の例では認識ミスにより候補1においてもラベリングが
終了することが考えられるが、最後の区間推定により誤
った単語部区間の選択が回避できる。 以上の結果から明らかなように、従来技術に比べこの
発明装置によれば、接頭・接尾語付きの氏名単語に対し
ても高い認識率を得ることができると共に、接尾語除去
に接尾語の継続長の統計値を用いており、氏名単語以外
の単語の接尾語についても容易に統計値を求めることが
できることから、一般の単語についても同様にこの装置
が利用できる。 「発明の効果」 以上説明したように、これまで利用者は単語音声認識
装置への単語のみの入力を意識した発声を強要されてい
たのに対し、余剰語の付加を許容することにより、入力
に不慣れなより多くの利用者への単語音声認識装置の適
用を可能にするという利点がある。 氏名単語50、成人男性2名の条件でこの発明を適用し
た結果、余剰語無し離散単語認識の認識率に対し、接頭
語・接尾語のどちらか一方が付いた単語発声では平均約
9割、両方がついた単語発声では平均約8割の認識率が
得られた。これは、連続音声に対するワードスポッティ
ング法の適用と同程度以上であり、一つの単語先頭当り
の処理時間の増加は数%に抑えることができた。
【図面の簡単な説明】 第1図はこの発明の実施例を示すブロック図、第2図は
認識処理部の動作の流れを示す流れ図、第3図はこの発
明によって接頭・接尾語付きの単語発声が認識処理され
る様子を示す図である。

Claims (1)

  1. (57)【特許請求の範囲】 1.入力された音声信号をその特徴パラメータの時系列
    として格納する時系列メモリと、 認識すべき単語に付けられる接尾語の継続長の統計値を
    格納する接尾語メモリと、 上記音声信号中からの母音部を検出する母音部検出手段
    と、 その母音部検出手段の出力から母音部の終端を検出する
    終端検出手段と、 その終端検出手段の出力から上記時系列メモリに格納さ
    れている特徴パラメータを元にした単語のラベリング
    (単語のカナ表記と音声信号との対応付け)を行って単
    語音声を認識する認識手段と、 その認識手段の出力に対して、ラベリングされずに残さ
    れている未処理の音声信号の継続長の統計値と上記接尾
    語メモリに格納されている接尾語の継続長の統計値とを
    比較する比較手段と、 その比較手段からの出力に応じて、接尾語の付加を判定
    する接尾語判定手段と、 その接尾語判定手段からの出力により単語認識が音声信
    号の正しい区間で行われていることを判定する判定手段
    とを有する認識処理部と、 からなる音声認識装置。
JP62250451A 1987-10-02 1987-10-02 音声認識装置 Expired - Fee Related JP2665543B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62250451A JP2665543B2 (ja) 1987-10-02 1987-10-02 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62250451A JP2665543B2 (ja) 1987-10-02 1987-10-02 音声認識装置

Publications (2)

Publication Number Publication Date
JPH0192799A JPH0192799A (ja) 1989-04-12
JP2665543B2 true JP2665543B2 (ja) 1997-10-22

Family

ID=17208074

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62250451A Expired - Fee Related JP2665543B2 (ja) 1987-10-02 1987-10-02 音声認識装置

Country Status (1)

Country Link
JP (1) JP2665543B2 (ja)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
西山敏雄"余剰語特徴を用いた単語音声認識の余剰語除去手法"信学会情報システム部門全国大会 S62,No1,PP175.

Also Published As

Publication number Publication date
JPH0192799A (ja) 1989-04-12

Similar Documents

Publication Publication Date Title
US7974843B2 (en) Operating method for an automated language recognizer intended for the speaker-independent language recognition of words in different languages and automated language recognizer
US4903305A (en) Method for representing word models for use in speech recognition
US8145486B2 (en) Indexing apparatus, indexing method, and computer program product
US6374219B1 (en) System for using silence in speech recognition
US20060009965A1 (en) Method and apparatus for distribution-based language model adaptation
EP0533491A2 (en) Wordspotting using two hidden Markov models (HMM)
US20030093263A1 (en) Method and apparatus for adapting a class entity dictionary used with language models
JP3834169B2 (ja) 連続音声認識装置および記録媒体
JP2007512608A (ja) テキストフォーマッティング及びスピーチ認識のためのトピック特有のモデル
JP2003515778A (ja) 別々の言語モデルによる音声認識方法及び装置
JP2002215187A (ja) 音声認識方法及びその装置
CN112466287A (zh) 一种语音分割方法、装置以及计算机可读存储介质
US5974381A (en) Method and system for efficiently avoiding partial matching in voice recognition
JP2665543B2 (ja) 音声認識装置
JP4666129B2 (ja) 発声速度正規化分析を用いた音声認識装置
JPS6138479B2 (ja)
JP2004534275A (ja) 音声認識における高速検索
JPH11259088A (ja) 音声認識方法及び音声認識装置並びに記録媒体
JP3148322B2 (ja) 音声認識装置
WO2021181451A1 (ja) 音声認識装置、制御方法、及びプログラム
JP3583930B2 (ja) 音声認識装置及びその方法
JPH06118988A (ja) 音声対話処理装置
JPS6225796A (ja) 音声認識装置
JPS62255999A (ja) 単語音声認識装置
JPH10111697A (ja) 音声反応装置と音声認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees