JPS62164097A - 音声判別方式 - Google Patents

音声判別方式

Info

Publication number
JPS62164097A
JPS62164097A JP61005613A JP561386A JPS62164097A JP S62164097 A JPS62164097 A JP S62164097A JP 61005613 A JP61005613 A JP 61005613A JP 561386 A JP561386 A JP 561386A JP S62164097 A JPS62164097 A JP S62164097A
Authority
JP
Japan
Prior art keywords
recognition
section
speech
word
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61005613A
Other languages
English (en)
Inventor
潤一郎 藤本
中谷 奉文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61005613A priority Critical patent/JPS62164097A/ja
Publication of JPS62164097A publication Critical patent/JPS62164097A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 且J野辷訪 本発明は、音声判別方式、より詳細には、音声認識装置
に入力された音声の自動分類に関する。
血米挟亙 音声認識を用いて音声によって日本文を機械へ入力する
試みがさかんに行われるようになってきた。日本語が単
音節で構成されているという特徴を生かし、100余り
の単音節音声の認識ができれば全ての日本文が入力でき
るため、単音節入力の研究が活発である。しかしながら
離散単音節入力という不自然な発声が必要となり、でき
るだけ自然な発声がのぞまれている。これを解決する一
つの手段として単語と単音節の両認識を利用するという
試みがなされている(画像電子学会予稿84−01−2
.単語/単音節認識を併用した音声入力による文字放送
用画面制作装置)。このような場合、入力する人間が単
音節を入力するか、単語を入力するかをスイッチで選択
するようになっているため面倒でもあり、また、スイッ
チの押し違いによるミスが増して来る。特に、一つの文
章中に単語がいくつか分散して存在するような場合、極
端な場合には単音節と単語のスイッチの押し方を逆にし
てしまうという結果にもなりかねない。一方、単語単音
節の分離は例えば特開昭56−116148号公報に示
されるような方法がある。この方法は1発声された音声
中の単音節やアルファベットを認識する単音認識部と、
前記音声中の単語を認識する単語認識部と、前記音声の
時間長および音節数をカウントする音声カウント部と、
前記2つの認識部がそれぞれ出力する類似度信号と音声
カウント部が出力する時間長信号および音節数信号との
4種の信号のうちの少なくとも1種以上の信号を用いて
前記2つの認識部の認識結果からどちらがより確からし
いかを判断し選択する選択部とを有し、この選択部によ
って選択された方の認識結果を装置の認識結果として出
力するものであるが、この方法では、例えば「8」/ 
h a t s i /の場合、最後の/ i /は無
声化されて短くなり、音声長では単音単音節の判定は無
理である。又、前記公報には音節数のカウント方法は明
示されていないが、特に母音が連続している場合などや
母音と撥音が連続している場合等にはこのカウントは難
しく、また、精度よく行うためにはかなりの演算量が必
要である。更に、音声の類似度信号によって判定するに
は、入力音声が単音節認識部と単語認識部の両方での認
識が終わるまで待たねばならず、早い応答が出来ない欠
点がある。
目     的 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、少ない演算量で、入力された音声が単語であるか
単音節であるかを迅速に自動的に判別することを目的と
してなされたものである。
構   成 本発明は、上記目的を達成するために、音声入力部と1
分析部と、単語音声認識部と、単音節音声認識部と、入
力された音声が単語であるか単音節であるかを判定する
判定部と、判定結果を出力する出力部とを具備して成り
、入力された音声を前記単語音声認識部と単音節音声認
識部の両認識部へ印加せしめ、前記判定部出判定された
方の認識結果の類似度が定められた値よりも低い場合に
は、他方の認識結果を前記出力部へ転送すること、或い
は、音声入力部と1分析部と、単語音声認識部と、単音
節音声認識部と、入力された音声が単語であるか単音節
であるかを判定する判定部と、判定結果を出力する出力
部とを具備して成り、入力された音声を前記単語音声認
識部と単音節音声認識部の両認識部へ印加せしめ、前記
判定部で判定された方の認識結果の類似度が定められた
値よりも低い場合には他方の認識結果を参照し、前記類
似度が定められた値より大なる時は認識結果を前記出力
部へ転送し、小なる時は再び最初の認識結果に戻りこれ
を前記出力部へ転送すること、或いは、音声入力部と、
分析部と、単語音声認識部と、単音節音声認識部と、入
力された音声が単語であるか単音節であるかを判定する
判定部と、判定結果を出力する出力部とを具備して成り
、前記単語音声認識部と単音節音声認識部で各々異なる
二つの類似度閾値を設定し、入力された音声を前記両認
識部へ印加せしぬ、判定部で判定された認識結果の類似
度が第1の閾値より大なる時出力し、第2の閾値より小
なる時他方の認識結果を出力し。
第2の閾値より大なる時他方の認識結果を参照し。
この認識部における認識結果の類似度が第2の閾値より
大なる時この認識結果を出力部へ転送し、小なるとき、
最初の認識結果を出力部へ転送する、  ようにしたこ
とを特徴としたものである。以下、本発明の実施例に基
づいて説明する。
第1図は1本発明の一実施例を説明するための電気的全
体ブロック線図で、図中、1は音声入力部、2は分析部
、3は単音節Lgm部、4は判定部、5は単語認識部、
6は判定部、7は出力部で、入力された音声を単音節認
識部と単語認識部の両認識部へ印加せしめ、判定部で判
定された方の認識結果の類似度が定められた値よりも低
い場合には他方の認識結果を出力部へ転送するようにし
たもので、音声入力部1より入力された入力音声は分析
部2で特徴量に変換されて単音節認識部3と単語認識部
5へ入力されると共に判定部4へ入力される。判定部4
では通常知られている方法で単音節であるか単語である
かを判定し、その結果を判定部6へ送る。判定部6では
判定部4で指定された認識部の演算が終了するのを待ち
、その類似度が一定値より上かどうかを確かめ、上なら
ばそのまま結果を出力部7へ転送するが、下ならば他方
の認識部の結果が出るのを待ってそちらの結果を出力部
7へ転送する。
第2図は、第1図に示した判定部6の詳細電気的ブロッ
ク線図で、判定部4から出力される単語か、単音節かの
情報に従い、単音節ならばあらかじめ類似度閾値として
定められたt2と計算されたs2とを比べ、t2より大
きい時はその単音部名を出力し、s2の方が小さい時は
単語認識結果である単語各Wを出力部7へ転送する。閾
値の決め方は単語の認識、単音節の認識を単独で行い誤
認識と正解のボーダーラインを求めて閾値とする。
通常、単語と単音節は情報量が異なるため、異なる認識
部を持ち、閾値も異なるのが普通である。
又、これらの認識部は独特の予備的な選択が行われるた
め、当然、演算量に差が出来る。そのため、一方の演算
は他方より早く終了することが一般的である。判定部で
判定された種類の例えば単語の演算が早く終了すれば単
音節認識部の演算の終了を待たずに結果が出力できるこ
とになる。このようにこの方式に従うと高速に認識結果
が出力できるが、たまたま正解でありながら類似度が低
くなってしまったような場合、判定誤りを引き起こすこ
ととなる。
そこで、入力された音声を単音節認識部と単語認識部の
両認識部へ印加せしめ1判定部で判定された方の認識結
果の類似度が定められた値よりも低い場合には他方の認
識結果を参照し、この類似度が定められた値より大なる
時認識結果を出力部へ転送し、小なる時は再び最初の認
識結果に戻ってこれを結果出力部へ転送するようにした
6第3図は、その場合の一例を示す図で、以下、第2図
に示した実施例との相違についてのみ説明すると、単語
単音節判定部で単音節と判定された場合、単音節認識部
の認識結果の類似度s2が閾値t2より大なるかどうか
を比較し、大なる時はそのまま結果を出力するが、小な
る時は、そのまま単語認識結果を出力するのではなく、
単語認識結果の類似度SLと閾値t1の比較に移る。S
□≧t1の時は、入力された音声は単語だったとして単
語認識の結果を出力する。しかし、逆にst<ttの時
は入力音声が単語であったとも断定できないので、この
ような場合には、判定部4の結果を重視して判定部4の
結果である単音節認識結果を出力部へ転送するようにす
る。言うまでもなく、判定部4での判定結果が単語の場
合は前記の逆である。
この方法では、単語音声が判定部4で正しく単語と判定
され正しく認識されたが類似度がt、よりやや低いとい
った場合、一度は単音節のL!2識結果を参照しに行く
が、単語を単音節認識部で認識すると類似度が大きくな
らないため再び単語の結果を出力するので正しい結果が
出力できることになる。従って、このようにすると、第
2図に示した方法より精度良く入力音声が単語であるか
単音節であるかを判定できる。
第4図は、他の実施例を説明するための図で、この実施
例は、単語音声認識部と単音節音声認識部で各々異なる
二つの類似度閾値を設定し、入力された音声を両し!2
,11部へ印加せしめ1判定部で判定された認識結果の
類似度が第1の閾値より大なる時出力し、第2の閾値よ
り小なる時は他方の認識結果を出力し、第1の閾値より
小さく第2の閾値より大なる時は他方の認識結果を参照
し、この認識部における認識結果の類似度が第2の閾値
より大なる時はこの認識結果を出力部へ転送し、小なる
時は最初の認識結果を出力部へ転送するようにしたもの
で、この場合、各々の認識結果を比較するための閾値を
2つ持ち、t xl> t xt 、t□〉シ22と設
定しておく。ここで、判定部4の判定結果が単音節であ
った場合を例にとって説明すると、単音節の認識結果の
類似度s2とtxtとを比較し。
s2≧txtの時は正しい判定がなされていたものとし
てそのままの単音節認識結果を出力するが、Stくt2
.のときは更にtzzと比較するej2gより小さい場
合は判定部4の判定結果が誤ったために単音節認識部で
得られる類似度が極端に低くなったものとし、そのまま
、単語認識部の結果を出力するが、t2□> S v 
> j 2mの時は怪しい判定範囲であるとして単語の
認識結果を参照しに行く。ここではt12とだけ比較し
、S□<t12であれば極端に低い類似度であるとして
単音節の認識結果を出力し、そうでない時は、Yas2
の破線に従ってそのまま単語認識結果を出力する。この
ようにt121 t2□の値は極端に低い値を設定して
おくことが望ましい。又、他方を参照しに行く場合、t
X2e j!□ではなく tx1+ jttでも良いこ
とは言うまでもない。
効   果 以上の説明から明らかなように、本発明によると、入力
された音声が単語であるか、単音節であるかを、少ない
演算量で迅速にかつ自動的に判別することができる。
【図面の簡単な説明】
第1図は1本発明による音声判別方式を説明するための
全体電気的ブロック線図、第2図乃至第4図は、それぞ
れ第1図に示した判定部6の詳細電気的ブロック線図で
ある。 1・・・音声入力部、2・・・分析部、3・・・単音節
認識部、4・・・判定部、5・・・単語認識部、6・・
・判定部、7・・・出力部。 特許出願人  株式会社 リコー 第1図 第2ffl 第3図 第4図

Claims (3)

    【特許請求の範囲】
  1. (1)、音声入力部と、分析部と、単語音声認識部と、
    単音節音声認識部と、入力された音声が単語であるか単
    音節であるかを判定する判定部と、判定結果を出力する
    出力部とを具備して成り、入力された音声を前記単語音
    声認識部と単音節音声認識部の両認識部へ印加せしめ、
    前記判定部で判定された方の認識結果の類似度が定めら
    れた値よりも低い場合には、他方の認識結果を前記出力
    部へ転送することを特徴とする音声判別方式。
  2. (2)、音声入力部と、分析部と、単語音声認識部と、
    単音節音声認識部と、入力された音声が単語であるか単
    音節であるかを判定する判定部と、判定結果を出力する
    出力部とを具備して成り、入力された音声を前記単語音
    声認識部と単音節音声認識部の両認識部へ印加せしめ、
    前記判定部で判定された方の認識結果の類似度が定めら
    れた値よりも低い場合には他方の認識結果を参照し、前
    記類似度が定められた値より大なる時は認識結果を前記
    出力部へ転送し、小なる時は再び最初の認識結果に戻り
    これを前記出力部へ転送することを特徴とする音声判別
    方式。
  3. (3)、音声入力部と、分析部と、単語音声認識部と、
    単音節音声認識部と、入力された音声が単語であるか単
    音節であるかを判定する判定部と、判定結果を出力する
    出力部とを具備して成り、前記単語音声認識部と単音節
    音声認識部で各々異なる二つの類似度閾値を設定し、入
    力された音声を前記両認識部へ印加せしめ、判定部で判
    定された認識結果の類似度が第1の閾値より大なる時出
    力し、第2の閾値より小なる時他方の認識結果を出力し
    、第2の閾値より大なる時他方の認識結果を参照し、こ
    の認識部における認識結果の類似度が第2の閾値より大
    なる時この認識結果を出力部へ転送し、小なるとき、最
    初の認識結果を出力部へ転送するようにしたことを特徴
    とする音声判別方式。
JP61005613A 1986-01-14 1986-01-14 音声判別方式 Pending JPS62164097A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61005613A JPS62164097A (ja) 1986-01-14 1986-01-14 音声判別方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61005613A JPS62164097A (ja) 1986-01-14 1986-01-14 音声判別方式

Publications (1)

Publication Number Publication Date
JPS62164097A true JPS62164097A (ja) 1987-07-20

Family

ID=11616039

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61005613A Pending JPS62164097A (ja) 1986-01-14 1986-01-14 音声判別方式

Country Status (1)

Country Link
JP (1) JPS62164097A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008176155A (ja) * 2007-01-19 2008-07-31 Kddi Corp 音声認識装置およびその発声判定方法、発声判定プログラムならびにその記憶媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008176155A (ja) * 2007-01-19 2008-07-31 Kddi Corp 音声認識装置およびその発声判定方法、発声判定プログラムならびにその記憶媒体

Similar Documents

Publication Publication Date Title
CA2001164C (en) Text-processing system
KR19980070329A (ko) 사용자 정의 문구의 화자 독립 인식을 위한 방법 및 시스템
JPS62164097A (ja) 音声判別方式
JP2000206987A (ja) 音声認識装置
JP2006039382A (ja) 音声認識装置
JP2002175095A (ja) 発音学習システム
JP3039453B2 (ja) 音声認識装置
JPH09230889A (ja) 音声認識応答装置
JPH0130167B2 (ja)
JPS6070497A (ja) 音声認識装置
JPS59195300A (ja) 音声認識装置
JPS63254498A (ja) 音声認識応答装置
JPS6239899A (ja) 会話音声理解方法
JPS60205600A (ja) 音声認識装置
JPS62165700A (ja) 音声判定装置
JPS5962900A (ja) 音声認識方式
JPH0535441A (ja) 文書自動作成装置
JPS63106698A (ja) 音声入力かな漢字変換装置
JPH07210186A (ja) 音声登録装置
JPS5957298A (ja) 音声入力方式
JPH02166554A (ja) 文書読み上げ制御装置および文書読み上げ方法
JPS6147994A (ja) 音声認識方式
JPS59111697A (ja) 音声認識方式
JP2002175003A (ja) 発音学習システム
JPS62295100A (ja) 音声認識装置