JPS5962897A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPS5962897A
JPS5962897A JP57173175A JP17317582A JPS5962897A JP S5962897 A JPS5962897 A JP S5962897A JP 57173175 A JP57173175 A JP 57173175A JP 17317582 A JP17317582 A JP 17317582A JP S5962897 A JPS5962897 A JP S5962897A
Authority
JP
Japan
Prior art keywords
voice
input
level
speech
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57173175A
Other languages
English (en)
Inventor
徳子 松井
俊宏 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP57173175A priority Critical patent/JPS5962897A/ja
Publication of JPS5962897A publication Critical patent/JPS5962897A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、標準音声パタンについて入力音声に対する類
似度が最−1−位のものを判定・出力する音−声認識装
置において、その人力音声分析を適正レベルで行って認
識率を向上させるだめの音声認識方式に関するものであ
る。
〔従来技術〕
一股に、音声認識装置バに対する入カバー声しベルは、
発声者の特質(例えば、性別1発声特性)、入力回線の
状態(例えは、電話回線の伝送損失)などによって大き
く変動する。
これに対して、従来の音声認識方式tよ、−例として、
あらかじめ入力陛声に対する利得を最適と考えられる所
定値に設定]〜でおき、その固定利得で全認識処理を行
っていた。−まだ、’R’ /”入力の際に発声者に対
して適正なIA声レしベで発声するように特別なガイダ
ンスも行っていなかった。
したがって、大きな変動のある入力音声レベルのま寸で
人力音声分(Jiがriわれ、誤認識、リンエクトの発
生が不可避であり、認識率を一定限度以1−に同上ぜし
めることが困難であった。
〔発明の1]的J 本発明の目的は、」二詑した従来技術の欠点をなくシ、
入力音声分析を適正レベルで行わしめて認識率を向上ぜ
しめる゛ことかできる音声認識方式を捉供することにあ
る。
〔発明の概要〕
本発明の音声認識方式に係る第1の発明の構成は、認識
対象の各単語−文に対応して各複数組の標準g7声バク
/テータを記憶しておき、入力出用の!111′徴抽出
を行い、その時徴データと−1−記各標i(7音声バタ
ンデータとのバタンマソヂング処理を行い、その類似度
が最」二位となるものをd1召識結果と17て判定・出
力する機能を有する14声認識装置において、入力音声
の特徴抽出を所定の適正レベルて行いうるように、一連
の音声認識処J、jijの最明にのみ、まだは各音声入
力の都度もり、 < i、J−所定回数ことに入力音声
のレベルチェック・利H44調整を行い、その入力音声
利得で各入力音声の特徴抽出を行わしめるように制御・
処理するものである。
なお、上記において、一連の音声認識処理の最初にのみ
入力音声のレベルチェック・利得調整を行う場合、チェ
ック川のiイ声人力は、所定内容の中詰・文によること
と17、音声認識処理の効率向上、ザービス性向上を図
ろうとするものである。
これは、一連の発声(入力音声)が必ずしも大きなレベ
ル変動を伴なうものではないことを利用したものである
寸だ、同様に第2の発明の構成は、認識対象の各単語・
文に対応して各複数組の標q−音声パタップ−タを記憶
(7ておき、入り月4声の特徴抽出を11い、その特徴
ブータと」−記者標準音声バタンデータとのバタンマツ
ヂング処」ljを行い、その類似度が最」−位となるも
のを認識結果として判定・出力する機能を有する音声認
識装置において、入力音声の![Y徴抽出を所定の適市
レベルで行いつるように、一連の名声認識処理の各音声
入力の都度その人力レベルのヂエツクを行い、それがj
r、い[レベルであるときに1、その1′+、rり声認
識処理を続行せしめ、それが適正レベルでないときは、
その人力レベルに応じ−C発声音声レベルを−1−下し
て内入力すべき旨の情報の表示斗だは送出をぜ(〜め、
これに基づいだ1−11入力音声について音声認識処理
を行わしめるように制御・処理するものである。
これをυするに、入力レベルが適正化されるように、例
えば、発声者に対する情報としてメツセージ音声送出に
よるガイダンスを行うものである。
〔発明の実施例〕
以下、本発明の実施例を図に基ついて説明する。
最初に、第1図は、第1の発明に係る音声Mu 5!r
i力式の一実施例の方式構成図、第2図は、その帆用1
ノローヂャ−1・である。
ここで、■は、音声入力に係るマイクロフォン、2は、
入力音声信号について利得調整・帯域側σI11を行つ
メξ後、そのディジタル変換をする人力部、3←し、入
力されたディジタル音声信号から入力音声のJjqi、
徴データを抽出する分析部、4は、入力音声のt:!1
73’区間の検出処理をして独立した単語を判定する音
声区間検出部、5は、入力音声と標((f1音声バタン
とのバタンマノチンク処理を行う−B声認識部、6は、
そのバタンマノヂング処理(炉似度記算処理)結果によ
り、入力音声に対する類似度が最−に位の標準音声バタ
ンの組を判定する判定部、7 frjl、認識対象の各
1119語・文(複数の単語の集合、すなわら11つ語
列)について各複数組の標q′名声・;タンデータを格
納(記憶)している標準音声・ζタンメモリ、8は、そ
の選択制御をする標イq・音声・(タノ選択部、9は、
認識結果表示、音声人力指示に係る音声合成部、10は
、同スピーカ、11は、認識結果の確認および繰返し音
声入力の指示に係る=1ノノール部、1.:111、上
記各部に対する制御その他所安の処理を行う制御部、1
3は、認識結果に基づいて所望のザーヒス処理を行うホ
スl:装置である。
まず、音声認識処理に先立ち、制(n11部12シ」1
、i等辺人力に対するイl;It、 0fjjを人力部
27分4月部3.音声認識部5に指示するどどもに、そ
の時の認識対象となるべき語I鼾(例えば、数字、物品
名、地名等の分類別)についで、その標準音声パタンの
全相を標準音声バタンメ七り7から選択するように標/
v、盲声バタ7選1尺部8に指示する(第2図の処J甲
 21 )。
これらの準備が完了すると、発声者に対して音声入力を
促すべき入力催告メツセージを出力するよう合声合成部
9に指示するので、スピーノJL Oから上記人力催告
メツセーフか放声される(同処理22)。
これより、発声者がマイクロフォン1かう音声を人力す
る(同処理23)。
その音声入力が一連の認識処理の第1回[]であれは、
人力部2は、その入力音−声のレベルチェノクをし、入
力レベルが適正範囲よりも低い場合には利イ;)を」―
げ、逆に人力レベルか適正範囲よりも高い場合には利得
を下げるように利得調整をする(同処理31)。
続いて、発声者に対(〜て同一内容の音声入力を内庭行
うように促すべき111人)月11′告メノセ−/を1
4声合成部9紅山でスピーノJLOから1ノ(声せしめ
る(同処理32)。
−1−記の動作を人力レベルが適正範囲内に入る捷て繰
り返す。
ここで、人力レベルを適正範囲内(すなわち適正レー\
ル)に入るようにすることとt、、11、入力部2にお
ける利得調整(増幅)処理の結果、分(11部3への人
力レベルが、その特徴抽出を最適:I)、、、態で行っ
て正確な!hi徴j゛−タが得られる範囲内にあるよう
にすることである。
一例どして、分用部3の入力レベルについて、各I)′
1語の音声パワーのピーク値のうち最大のものの振幅が
所定の1′[ψ大値(例えは、」−5■)から最小値(
例えば、±3V)の範囲内に入るように設定される。
入力レベルか適正範囲内に入ると、分」11部3は、そ
の入力音声利得で固定・入力されメこ適iロレベルの音
声信号を分411シ、その特徴データを抽出する(同処
理24 ) 。
次に、γτ小声認識5に1−1その特徴データと既選択
の標II(、発声バタンデータとの間てパタンマツチン
クを行い、人力音声と各組の標準音声パタ/との類似度
を判定部6へ云える(同処理25)。
判定部6は、類似度が最」1位の(最も確からしい)組
の標/v(音声バタンを認識結果として制御部12へ云
える(同処理2G)。
人力音声に対して最も確からしいづ追似度の値かfls
: < 、それを認識結果とするのシ、l、疑わしいと
才へきり/エクトの場合には、′1Ii111i1i1
部12は、標?((γX7!+ハタ7選択部8に対して
今までと同一のパタンを選択するように指示するととも
に(同処理29)、音7を合成部9に対して発声者の再
発声(111人力)を促すべきメノセー ジを出力する
ように指示する(同処理30)。
寸だ、リンエクトでない場合には、制御部12ば、その
認識結果が正しいものであるか否かを発声者に確認さぜ
るための表示として、確認要求メソセー/を音声合成部
9から出力させ、それをスビーノノ10から放声させる
(同処理27)。なお、上記表示はコンソール部11に
おけるランプ表示等によってもよい。
発声者は、これを聴取17て、人力音声が正しく認識さ
れたのか、誤認識されたのかを知り、その旨をコンノー
ル部11から制旬11部12へ人力する(同処理28)
制御部[2への認識結果の正否の確認入力は、必ずしも
コンソール部11における操作による必侠はなく、マイ
クロフォン1からの確認用音声の入力によってもよいが
、その内容は音声認識が確実に行われるようにf7i′
iil’で誤認識をしにくいものであることが望捷しい
制御部12は、−1−記確認情報により、上述の認識候
補が正17いものであるときは、それを認識結果とし−
ごポスト装置13へ送出し、1つの音声人力に対する処
理を終j′せしめて次の入力に備える。
一方、誤認識であったという確認情報を受けだときには
、制御部12は、リジェクトの場合ど同様に、標準音声
バタノ選択部8に対して今神でと同一の標準11声バタ
ノ充選択するよう指示するとともに(同処理29)、内
入力の催告メソ七=−ジを出力するよう音声合成部9に
指示する(同処理30 ) 、、 以にの動作を正しい認識結果が得られるまで繰り返して
行い、正(〜い認識結果が得られたときにV、1、そt
]を上述のごとくホスト装置13へ送出(〜て処理を終
了ノーる。
寸だ、第2回目以降の音声人力の認識時には、人力音声
のノベルチェック・利得調整を行わず、人力されたg声
を分析部3へ直接に送出する。
このようにして人力14声を適正レベルにしてから当該
特徴抽出を行うので1.iJE確な特徴テークがイ:す
られて認識率の向」二に寄−t5することができる。
」1記実施例において、入力音声のレベルヂエノク・利
得調整は、一連の1−1声認識処理の最初の音声入力に
ついてのみ行うように説明しているが、本発明Qよ、こ
れに限定されるものではなく、以後の音声人力の都度ま
たは実用上の都合による所定回数(例えは、2,3回)
ことに行うようにしても、これを妨げるものてないこと
は明らかである。
まだ、上記実施例において、一連の音声認識処理の最初
のヂエノク用の名声入力は、所定内容の単語・文によっ
て行い、そのチェック・調整処理を簡易化・効率化する
とともに、認識対象のΦ語・文の発声との区別によって
発声者に対するザービス性向りを図ることもできる。
次に、第3図は、第2の発明に係る音声認識方式の一実
論例の処理フローチャー1・てあって、その方式+i−
f成図&、I1、その1斗前述の第1図を用いることが
できるので、以下、第1図、第3図に基づい−C1−記
実施例の説明をするが、前述の第1の発明の実施例と異
なる部分のみとし、同様な部分(第2図の処理21〜3
0に191するもの)につい−Cは省略する。
1ず、発声者がマイクロフォンIから音声を人力すると
(第3図の処理23)、入力部2は、その入力?二千−
声のレベルヂエツクをする。
この結果に基づき、制萌1部12 &;1.、r)iJ
述の適正レベルについての説明と同様に、人力レベルが
適iE範囲よりも1氏い」場合には、更に高レベルで丙
発声するように、寸たシ士人カレベルが適iF−範囲よ
りも高い場合には、史に低レベルで発声するように発声
者に知らせる情報−:しで、内入ノ月(ド告メン上−ジ
を一音声合成部9紅山でスピーカ10から放声さぜ(同
処理31A)、発声者に111音声入力をぜしめる。こ
の動作を入力レベルが適正範囲内に入る」で繰り返し、
適正レベルになると処理24以降の処理が行われる。
なお、最初から入力レベルが適正範囲内にあるときCま
、直ちに」1記処理24以降の処理が行わ)Lる。
寸/こ、」−記メッセージに代え、その旨の情報を・コ
ンノール部11に表示するようにし−Cもよい7、以後
、前述の第1の発明の実施例と同様に第3図に示すごと
く所定の1声認識処理か行われるが、発声者に対する適
切なガイタンスを行うことに」、す、入力音声を適旧し
ベルにせしめてから当該!Iテ徴油抽出行うので、正確
な![〒徴テータがmられて認識率の向−1−に寄Jj
することができる。
〔発明の効果〕
見、七、詳iii+11に説明したように、本発明によ
れば、人JJ音声分析を常に適正レベルで行い、正確な
特C改ブー タによる音声認識処理か川面となるので、
認識率を向」二することができ、この種の音声認識/ス
デj・における信頼性、す°−ビス性、効率の向上に顕
著な効果が得られる。
【図面の簡単な説明】
第1図は、第1の発明に係るi′1声認識方式の一実施
例の方式構成図、第2図は、その処理フローデー)’−
1−、第3図は、第2の発明に係る音声認識力式の一実
施例の処理フロー=ヂャートである。 ■・・・マイクロフォン、2・・人力部、3・・・分析
部、4・・1(テ声区間検出部、5 音声認識部、6 
・判定部、7・・標/V−音、jn /’、タノメモリ
、8・・・標檗音声パタノ選択部、9・・音声合成部、
10・・スピーカ、11・・・1ンノ一ル部、12・−
・制御部、13・・・ポスト装置。 代理人 弁理1− 福l]幸作 (ほか1名) 茅1 口 茅2 目 $3 巴

Claims (1)

  1. 【特許請求の範囲】 1、認識対象の各単語・文に対応j〜で各複数組の標準
    音声バタンテークを記憶しておき、入力音声の!1テ徴
    拍出を行いその!1イ徴テ−タと一1ユ記各標べC?′
    1j11パタノテー タどのバタンマツチング処理4行
    イ、その類似度が最上位となるものを認識結果として判
    定・出力する機能を有する音声認識装置において、入力
    音声の特徴抽出を所定の適正レベルで行いつるように、
    一連の音−声認識処理の最初にのみ、1だは各音声人力
    の都度もしくは所定回数ことに人力音声のレヘルヂエノ
    ク・利得調整を行い、その入力音声利得で各人力音声の
    特徴抽出を行わしめるように1間11・処I里すること
    を!時機とする音声認識方式。 2、特許請求の範囲第1項記載のものにおいで、一連の
    iイ声認識処理の最初にのみ人力音声のレベルチェック
    ・利得調整を行う場合、チェック用の音声入力は、所定
    内容の単語・文によるようにしたものである音声認識方
    式。 3、認識対象の各単語・文に対応して各V数組の標rv
    音声パタノデータを記憶1〜でおき、人力1゛1声の特
    徴抽出を行い、その特徴テークと一]−記各標イy・音
    声バタンデータとのバタンマツチング処理を行い、その
    類似度が最」二位となるものを認識結果として判定・出
    力する機能を有する音声認識装置において、入力音声の
    特徴抽出を所定の適正レールて行いうるように、一連の
    音声認識処理の各音声人力の都度その入力レベルのチェ
    ックを行い、それが適iEレベルであるときは、そのま
    ま音声認識処理を続行ぜしめ、それが適正レベルでない
    ときは、その入力レベルに応じて発声す声レベルを」下
    して[f]′入力すべき旨の情報の表示まだは送出をぜ
    しめ、これに基づいた再入力音声について音声認識処理
    を行わしめるように制御・処理することを!1¥徴とす
    るi音声認識方式。
JP57173175A 1982-10-04 1982-10-04 音声認識方式 Pending JPS5962897A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57173175A JPS5962897A (ja) 1982-10-04 1982-10-04 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57173175A JPS5962897A (ja) 1982-10-04 1982-10-04 音声認識方式

Publications (1)

Publication Number Publication Date
JPS5962897A true JPS5962897A (ja) 1984-04-10

Family

ID=15955477

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57173175A Pending JPS5962897A (ja) 1982-10-04 1982-10-04 音声認識方式

Country Status (1)

Country Link
JP (1) JPS5962897A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6355600A (ja) * 1986-08-26 1988-03-10 松下電器産業株式会社 音声認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6355600A (ja) * 1986-08-26 1988-03-10 松下電器産業株式会社 音声認識装置

Similar Documents

Publication Publication Date Title
JP4867804B2 (ja) 音声認識装置及び会議システム
JP4241376B2 (ja) 認識されたテキスト中の音声シーケンスと手動入力される補正ワードの音声転写との比較を通した音声認識により認識されたテキストの補正
JPS5944639B2 (ja) 音声による異同認識方式における標準パタ−ン更新方法
JPH10507536A (ja) 言語認識
JP2002040926A (ja) インターネット上での自動発音比較方法を用いた外国語発音学習及び口頭テスト方法
Liao et al. A prototype of an adaptive Chinese pronunciation training system
Zetterholm et al. A comparison between human perception and a speaker verification system score of a voice imitation
JP2001249679A (ja) 外国語自律学習システム
JPS5962897A (ja) 音声認識方式
WO2013035293A1 (ja) 音声認識装置
JP2001282098A (ja) 外国語学習装置、外国語学習方法および媒体
CN112951208B (zh) 语音识别的方法和装置
JPH0736481A (ja) 補完音声認識装置
JPS59147397A (ja) 音声認識制御方式
JPS5895399A (ja) 音声メッセージ識別方法
WO2021064886A1 (ja) 情報処理装置、プログラム及び情報処理方法
JP2022171538A (ja) 外国語スピーキング学習システム
JPS5962900A (ja) 音声認識方式
JPH08110790A (ja) 音声認識装置
JPS59212900A (ja) 音声認識装置
JP2022181361A (ja) 学習支援システム
JPS58134696A (ja) 発声訓練装置
JPH01161296A (ja) 音声認識システム
JPS5962898A (ja) 音声認識方式
JPS59147396A (ja) 音声認識制御方式