JPS61208095A - 音声認識方式 - Google Patents
音声認識方式Info
- Publication number
- JPS61208095A JPS61208095A JP60047894A JP4789485A JPS61208095A JP S61208095 A JPS61208095 A JP S61208095A JP 60047894 A JP60047894 A JP 60047894A JP 4789485 A JP4789485 A JP 4789485A JP S61208095 A JPS61208095 A JP S61208095A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- word
- monosyllable
- speech
- results
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
五豊公互
本発明は、音声認識方式、より詳細には、会話調に近い
音声の認識が可能な音声認識方式に関する。
音声の認識が可能な音声認識方式に関する。
盗IL権
音声認識において、現状では会話音声の認識は困難であ
るので単語音声認識と単音節認識を用いて会話調に近い
認識をする方法が用いられている。
るので単語音声認識と単音節認識を用いて会話調に近い
認識をする方法が用いられている。
第3図は、上記従来の音声認識法の一例を説明するため
の図で1図中、lは音声入力部、2は単音節/単語判別
部、3は単音節認識部、4は単語認識部、5は結果出力
部で、この方法は、音声入力が単音節/単語判別部によ
り単語節単位か単語単位であるかが判別され、次段の単
音節認識部又は単語認識部で識別されて出力結果が出力
されるものである。この結果、第4図のように単語単位
Aの認識が可能となり単音節単位Bのみより会話調に近
い発声の認識が可能となるものであるが、この方法では
単音節/単語判別部の性能に認識精度が左右される欠点
を有していた。
の図で1図中、lは音声入力部、2は単音節/単語判別
部、3は単音節認識部、4は単語認識部、5は結果出力
部で、この方法は、音声入力が単音節/単語判別部によ
り単語節単位か単語単位であるかが判別され、次段の単
音節認識部又は単語認識部で識別されて出力結果が出力
されるものである。この結果、第4図のように単語単位
Aの認識が可能となり単音節単位Bのみより会話調に近
い発声の認識が可能となるものであるが、この方法では
単音節/単語判別部の性能に認識精度が左右される欠点
を有していた。
■−−煎
本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声認識装置において、単音節認識機能と単語認
識機能を併用することにより、特に、単語認識精度を向
上させることを目的としてなされたものである。
特に、音声認識装置において、単音節認識機能と単語認
識機能を併用することにより、特に、単語認識精度を向
上させることを目的としてなされたものである。
1−一腹
本発明は、上記目的を達成するため、単音節認識部と単
語認識部とを備えて音声を認識する音声認識装置におい
て、語頭の一定フレームを用いて夫々予備選択を行ない
互いに一方の認識結果を検認し合って認識率を向上させ
るようにしたことを特徴としたものである。以下、本発
明の実施例に基づいて説明する。
語認識部とを備えて音声を認識する音声認識装置におい
て、語頭の一定フレームを用いて夫々予備選択を行ない
互いに一方の認識結果を検認し合って認識率を向上させ
るようにしたことを特徴としたものである。以下、本発
明の実施例に基づいて説明する。
第1図は1本発明による音声認識方式の一実施例を説明
するための構成図で、図中、1は音声入力部、5は出力
部、6は単音節認識部、7は単語認識部、8は判定部で
、本発明は、単音節と単語の判別をしてから認識するの
ではなく、互いの認識結果を検認しながら認識精度を上
げる方法を提供しようとするものである。
するための構成図で、図中、1は音声入力部、5は出力
部、6は単音節認識部、7は単語認識部、8は判定部で
、本発明は、単音節と単語の判別をしてから認識するの
ではなく、互いの認識結果を検認しながら認識精度を上
げる方法を提供しようとするものである。
第1図において、音声入力は単音節認識部6及び単語認
識部7に同時に入力されて並列に夫々のルーチンに従っ
て識別操作が実施される。この結果は判定部8において
、どちらの結果が妥当であるかが判別されて8力に結果
を出す。ここで単音節認識部6と単語認識部7の大きな
違いは単音節認識部6は単位がICV(子音−母音)で
あり、単語認識部7は複数のCvから辞書が構成されて
おり、音声長が単音節の方が短い点がある。また、現状
では単語中のセグメンテーション技術が不完全であるか
ら単語中から単音節Cvを正しく切出すことはできない
。そこで1本発明では、単語認識の結果を検認するため
に単音節認識部において単語の語頭の単音節部を認識し
てその結果から単語の語頭が一致するものを選択するよ
うにしている。従って、単音節認識部は夫々語頭の一定
フレームのみで予備選択する。この一定フレーム長は通
常ICVより短く次のCVにかからないよう100〜3
00m5程度とする。この短区間の特徴パラメータから
単語の最初のC■候補を選択するのであるから候補を1
つに絞ることはできない。そこで複数個の候補を選択し
てその中で最も多いCVを候補とする。一方、単語認識
は同じく語頭一定フレーム長の予備選択により候補単語
を絞り、その中から本選択により類似度の大きい順に複
数個の候補を選別する。このとき先のCv候補と候補単
語の先頭Cvを比較し、両者が一致しておればその1位
の候補単語を結果として出力する。しかし1両者の一致
が得られないときは。
識部7に同時に入力されて並列に夫々のルーチンに従っ
て識別操作が実施される。この結果は判定部8において
、どちらの結果が妥当であるかが判別されて8力に結果
を出す。ここで単音節認識部6と単語認識部7の大きな
違いは単音節認識部6は単位がICV(子音−母音)で
あり、単語認識部7は複数のCvから辞書が構成されて
おり、音声長が単音節の方が短い点がある。また、現状
では単語中のセグメンテーション技術が不完全であるか
ら単語中から単音節Cvを正しく切出すことはできない
。そこで1本発明では、単語認識の結果を検認するため
に単音節認識部において単語の語頭の単音節部を認識し
てその結果から単語の語頭が一致するものを選択するよ
うにしている。従って、単音節認識部は夫々語頭の一定
フレームのみで予備選択する。この一定フレーム長は通
常ICVより短く次のCVにかからないよう100〜3
00m5程度とする。この短区間の特徴パラメータから
単語の最初のC■候補を選択するのであるから候補を1
つに絞ることはできない。そこで複数個の候補を選択し
てその中で最も多いCVを候補とする。一方、単語認識
は同じく語頭一定フレーム長の予備選択により候補単語
を絞り、その中から本選択により類似度の大きい順に複
数個の候補を選別する。このとき先のCv候補と候補単
語の先頭Cvを比較し、両者が一致しておればその1位
の候補単語を結果として出力する。しかし1両者の一致
が得られないときは。
(イ)、1位と2位の候補単語の類似度の得点比が大き
いときには単語認識を優先する。
いときには単語認識を優先する。
(ロ)、単音節の候補を決定するとき最も多いCvを選
択するが、このときの選択比が一定の値より大きいとき
は単音節認識を優先する。
択するが、このときの選択比が一定の値より大きいとき
は単音節認識を優先する。
の一方のカテゴリーを採用する。
以上は単語認識結果の検認法であるが、同様に単音節認
識結果の検認も逆の構成で実行できる。
識結果の検認も逆の構成で実行できる。
単語認識において、語頭の一定フレームで予備選択して
語頭のCVを推定する方法は単音節の場合と同様である
。
語頭のCVを推定する方法は単音節の場合と同様である
。
第2図は、前記単音節と単語の両方の認識結果を検認し
会う場合の例を説明するための図で、図中、6a、7a
は語頭の一定フレームで予備選択して候補を複数個に絞
り込む予備選択部であり、6b、7bはその候補につい
て本選択により順位づけする本選択部であり、6e、7
cは夫々7a。
会う場合の例を説明するための図で、図中、6a、7a
は語頭の一定フレームで予備選択して候補を複数個に絞
り込む予備選択部であり、6b、7bはその候補につい
て本選択により順位づけする本選択部であり、6e、7
cは夫々7a。
6aの予備選択結果との論理選択する後処理部であり、
判定部8で最終出力を判定するものである。
判定部8で最終出力を判定するものである。
なお、これは前記(イ)、(ロ)のカテゴリーに基づい
て片方づつの構成にしても良いことは言うまでもない。
て片方づつの構成にしても良いことは言うまでもない。
勿−一一艮
以上の説明から明らかなように、本発明によると、会話
調に近い発声の音声入力を単音節と単語認識を同時処理
することにより、互いの認識結果を予備選択結果で検認
して認識率を向上することができる。
調に近い発声の音声入力を単音節と単語認識を同時処理
することにより、互いの認識結果を予備選択結果で検認
して認識率を向上することができる。
第1図及び第2図は、それぞれ本発明による音声認識方
式を説明するための構成図、第3図は、従来の音声認識
方式を説明するための構成図、第4図は、音声認識の一
例を説明するための図である。 1・・・音声入力部、5・・・結果出力部、6・・・単
音節認識部、7・・・単語認識部、8・・・判定部、6
a。 7q・・・予備選択部、6b、7b・・・本選択部、6
c。 7c・・・後処理部。 第 1 図 第 2 図
式を説明するための構成図、第3図は、従来の音声認識
方式を説明するための構成図、第4図は、音声認識の一
例を説明するための図である。 1・・・音声入力部、5・・・結果出力部、6・・・単
音節認識部、7・・・単語認識部、8・・・判定部、6
a。 7q・・・予備選択部、6b、7b・・・本選択部、6
c。 7c・・・後処理部。 第 1 図 第 2 図
Claims (4)
- (1)、単音節認識部と単語認識部とを備えて音声を認
識する音声認識方式において、語頭の一定フレームを用
いて夫々予備選択を行ない互いに一方の認識結果を検認
し合つて認識率を向上させるようにしたことを特徴とす
る音声認識方式。 - (2)、単語認識の1位と2位の類似度得点比がある一
定値より大きいときは単語認識結果を優先することを特
徴とする特許請求の範囲第(1)項に記載の音声認識方
式。 - (3)、単音節の候補を決定するとき候補単音節の中で
同じC(子音)又はV(母音)が一定値より多いとき、
その単音節認識結果から単語を判定することを特徴とす
る特許請求の範囲第(1)項に記載の音声認識方式。 - (4)、単語認識の予備選択結果より、その候補単語の
中で一定値より多くしかも最も多い先頭C(子音)又は
V(母音)を判定して単音節認識結果を判定することを
特徴とする特許請求の範囲第(1)項に記載の音声認識
方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60047894A JPS61208095A (ja) | 1985-03-11 | 1985-03-11 | 音声認識方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60047894A JPS61208095A (ja) | 1985-03-11 | 1985-03-11 | 音声認識方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61208095A true JPS61208095A (ja) | 1986-09-16 |
Family
ID=12788108
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60047894A Pending JPS61208095A (ja) | 1985-03-11 | 1985-03-11 | 音声認識方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61208095A (ja) |
-
1985
- 1985-03-11 JP JP60047894A patent/JPS61208095A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4910782A (en) | Speaker verification system | |
JPS62232691A (ja) | 音声認識装置 | |
JP2014182270A (ja) | 情報処理装置及び方法 | |
JP3444108B2 (ja) | 音声認識装置 | |
JPS61208095A (ja) | 音声認識方式 | |
JP2000214879A (ja) | 音声認識装置の適応化方法 | |
KR20000025827A (ko) | 음성인식시스템에서의 반음소모델 구축방법및 그를 이용한 발화 검증방법 | |
JP3919314B2 (ja) | 話者認識装置及びその方法 | |
JPS5887599A (ja) | 音声単語認識装置 | |
JP3100208B2 (ja) | 音声認識装置 | |
JPH09212189A (ja) | 音声認識方法及び装置 | |
KR100281581B1 (ko) | 동시 조음 모델을 이용한 한국어 연속 숫자 음성인식 방법 | |
JPH0344316B2 (ja) | ||
JPS5934595A (ja) | 音声認識処理方式 | |
KR20040092572A (ko) | 연속 음성인식 시스템에서의 묵음 모델 처리를 통한음성인식 방법 | |
KR20010018532A (ko) | 동시에 병렬적으로 문자인식 및 음성인식을 사용한 컴퓨터 사용자 인터페이스 방법 | |
JPS58159598A (ja) | 単音節音声認識方式 | |
JPS6075893A (ja) | 音素セグメンテ−シヨン方法 | |
JP2000250594A (ja) | 話者認識装置 | |
JPS61259299A (ja) | 音声パタ−ン照合方式 | |
JPS6287997A (ja) | 音声認識装置 | |
JPH04260100A (ja) | 音声認識装置 | |
JPS63106698A (ja) | 音声入力かな漢字変換装置 | |
Logan et al. | A real time speaker verification system using hidden Markov models | |
JPS62166400A (ja) | 音声ワ−ドプロセツサ装置 |