JPS60179798A - Voice recognition equipment - Google Patents

Voice recognition equipment

Info

Publication number
JPS60179798A
JPS60179798A JP59036446A JP3644684A JPS60179798A JP S60179798 A JPS60179798 A JP S60179798A JP 59036446 A JP59036446 A JP 59036446A JP 3644684 A JP3644684 A JP 3644684A JP S60179798 A JPS60179798 A JP S60179798A
Authority
JP
Japan
Prior art keywords
pattern
power
standard pattern
level
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59036446A
Other languages
Japanese (ja)
Other versions
JPH0449955B2 (en
Inventor
文雄 前原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59036446A priority Critical patent/JPS60179798A/en
Publication of JPS60179798A publication Critical patent/JPS60179798A/en
Publication of JPH0449955B2 publication Critical patent/JPH0449955B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音声認識装置に関する。[Detailed description of the invention] Industrial applications The present invention relates to a speech recognition device.

従来例の構成とその問題点 従来、音声認識装置では、入力音声信号を分析すること
によって得られる特徴ベクトル系列に対し、辞書として
、あらかじめ装置内に登録しである複数個の標準パター
ンベタ1ニル列の中からこれと距離の最も近いものをも
って認識結果としているが、その際、標準パターン作成
のための音声パラメータ登録時の発声レベルと認識時の
発声レベルに差異が生じることに起因した誤認識が生じ
る。
Conventional configuration and its problems Conventionally, in a speech recognition device, for a feature vector series obtained by analyzing an input speech signal, a plurality of standard patterns are registered in advance as a dictionary in the device. The recognition result is the one closest to this in the row, but in this case, there may be erroneous recognition due to a difference between the utterance level at the time of registering the voice parameters for standard pattern creation and the utterance level at the time of recognition. occurs.

これに対して従来の音声認識装置では、入力音声のレベ
ルを、レベルメータあるいはLEDアレイ等を用いて表
示する方法が一般である。
In contrast, conventional speech recognition devices generally display the level of input speech using a level meter, an LED array, or the like.

しかし、この表示方法では操作者が登録時のレベルメー
タの指示をいちいち記憶しておく必要が有り、有効なレ
ベル合せ法とは言えなかった。
However, this display method requires the operator to memorize each level meter instruction at the time of registration, and cannot be said to be an effective level matching method.

発明の目的 本発明は、上記欠点に震み、音声認識装置における、登
録時と認識時の発声レベルを均一化することができ、認
識率の改善を図る音声認識装置を提供することを目的と
する。
Purpose of the Invention The present invention has been made in view of the above-mentioned drawbacks, and an object of the present invention is to provide a speech recognition device that can equalize the utterance level at the time of registration and recognition, and improve the recognition rate. do.

発明の構成 前記目的を達成するため本発明は、入力音声のレベルを
表示する。表示手段と、入力音声を分析するパラメータ
分析手段と、あらかじめ分析されたパラメータを標準パ
ターンとして記憶する記憶手段と、前記パラメータ分析
手段で分析された入力音声のパラメータと、前記記憶手
段内の標準パラメータとの距離を計算し、距離最小を与
える標準パターンをもって認識結果とするパターン比較
手段と、標準パターン登録時に、各標準パターンの電力
を計算する電力計算手段を設け、登録時の標準パターン
の電力の最大値と最小値もしくは平均値を入力レベル表
示手段の近傍に表示せしめるように構成している。
Structure of the Invention To achieve the above object, the present invention displays the level of input audio. a display means, a parameter analysis means for analyzing input speech, a storage means for storing parameters analyzed in advance as a standard pattern, parameters of the input speech analyzed by the parameter analysis means, and standard parameters in the storage means. A pattern comparison means calculates the distance between the standard pattern and the standard pattern giving the minimum distance as the recognition result, and a power calculation means calculates the power of each standard pattern when registering the standard pattern. The maximum value and the minimum value or the average value are displayed near the input level display means.

実施例の説明 以下、本発明の一実施例について図面を参照しながら説
明する。
DESCRIPTION OF EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings.

図は本発明の一実施例における音声認識装置のブロック
図である。同図において、1は入力信号、2は入力音声
のレベルを表示するレベル表示部、、3は入力音声をパ
ラメータ分析して、パラメータベクトル列に遂次変換す
るパラメータ分析部で、フィルタバンク、フーリエ変換
器、線形予測係数型分析器などを用いるのが一般である
。4はスイッチで、標準パターン作成時にはB側に、パ
ターン比較時にはA側に切シ換る。5はパターン記憶部
で、パラメータ分析部3によシ作成されたパラメータベ
クトル列を標準パターンとして記憶する。
The figure is a block diagram of a speech recognition device according to an embodiment of the present invention. In the figure, 1 is an input signal, 2 is a level display unit that displays the level of the input audio, and 3 is a parameter analysis unit that performs parameter analysis of the input audio and sequentially converts it into a parameter vector sequence. Generally, a converter, linear prediction coefficient type analyzer, etc. are used. 4 is a switch which is switched to the B side when creating a standard pattern and to the A side when comparing patterns. Reference numeral 5 denotes a pattern storage unit that stores the parameter vector sequence created by the parameter analysis unit 3 as a standard pattern.

6はパターン比較部で、パターン記憶部5に記憶されて
いる標準パターンと入カバターンとの間でパターン比較
を行い、標準パターンのうち距離最小を与えるものを認
識結果として信号線7に出力する。8は電力計算部で、
標準パターンの作成に際して各々の平均電力を計算し、
その最大値、最小値をめる。9は範囲表示部で、電力計
算部8でめた標準パターン平均電力の最大値、最小値も
しくは平均値を、レベル表示部の該当する箇所に、もし
くは数値の形で表示する。
Reference numeral 6 denotes a pattern comparison section which performs pattern comparison between the standard pattern stored in the pattern storage section 5 and the input cover pattern, and outputs the standard pattern that provides the minimum distance to the signal line 7 as a recognition result. 8 is the power calculation section,
Calculate the average power of each when creating the standard pattern,
Calculate the maximum and minimum values. Reference numeral 9 denotes a range display section that displays the maximum value, minimum value, or average value of the standard pattern average power determined by the power calculation section 8 at a corresponding location on the level display section or in the form of a numerical value.

次に上記のように構成された装置の動作について、標準
パターン作成時、パターン比較時とに分けて各々説明す
る。
Next, the operation of the apparatus configured as described above will be explained separately for the time of standard pattern creation and the time of pattern comparison.

先づ標準パターン作成時にはスイッチ4をB側に接続し
、入力した音声信号をパラメータ分析部3により、パラ
メータベクトルの列に遂次変換した後、パターン記憶部
5に記憶させる。この動作を繰り返すことによりパター
ン記憶部5内に標準パターンベクトル列が記憶される。
First, when creating a standard pattern, the switch 4 is connected to the B side, and the input audio signal is sequentially converted into a string of parameter vectors by the parameter analysis section 3, and then stored in the pattern storage section 5. By repeating this operation, a standard pattern vector sequence is stored in the pattern storage section 5.

電力計算部8では標準パターンが入力される毎に、該当
パターンの平均電力もしくはピーク電力を計算する。全
標準パターンの記憶が終了した段階で、電力計算部8は
電力の最大値、最小値を範囲表示部9に出力し、標準パ
ターンの電力の範囲をレベル表示部2の近傍に表示する
Every time a standard pattern is input, the power calculation unit 8 calculates the average power or peak power of the corresponding pattern. When all standard patterns have been stored, the power calculation section 8 outputs the maximum and minimum values of power to the range display section 9, and displays the power range of the standard pattern near the level display section 2.

次にパターン比較の場合について説明する。Next, the case of pattern comparison will be explained.

パターン比較に際しては、スイッチ4をA側に接続する
。パラメータ分析部1は、標準パターン登録の場合と同
様に、入力音声をパラメータベクトル列に変換する0分
析された入力パラメータベクトル列はスイッチ4を介し
て、パターン比較部6の一方の入力端に入力される。パ
ターン記憶部5は、標準パターンベクトル列の1つをパ
ターン比較部の他の入力端に入力し、入力パラメータベ
クトル列と標準パターンベクトル列との間で距離計算を
行う。以上の動作をパターン記憶部5のすべての標準パ
ターンについて行い、入力パラメータベクトル列との距
離が最小となる標準パターンをもって認識結果として出
力信号線7に出力する。
For pattern comparison, switch 4 is connected to the A side. The parameter analysis section 1 converts the input voice into a parameter vector string as in the case of standard pattern registration.The analyzed input parameter vector string is input to one input end of the pattern comparison section 6 via the switch 4. be done. The pattern storage unit 5 inputs one of the standard pattern vector sequences to the other input terminal of the pattern comparison unit, and performs distance calculation between the input parameter vector sequence and the standard pattern vector sequence. The above operation is performed for all standard patterns in the pattern storage section 5, and the standard pattern with the minimum distance from the input parameter vector sequence is output to the output signal line 7 as a recognition result.

以上の認識動作に先立って、範囲表示部9には標準パタ
ーン作成時に計算されたレベル範囲が表示されている。
Prior to the above recognition operation, the range display section 9 displays the level range calculated at the time of creating the standard pattern.

従って利用者は発声に際して、レベル表示部2の指示を
参照しながら、自分の発声が標準パターンのレベル範囲
におさまるようにコントロールすることが容易となる。
Therefore, when making a speech, the user can easily control his/her speech so that it falls within the level range of the standard pattern while referring to the instructions on the level display section 2.

以上のように、本実施例によれば、レベル表示部2の近
傍に、範囲表示部9を設け、電力計算部8で計算した登
録標準パターンの最大値、最小値もしくは平均値を前記
、範囲表示部9に表示することにより、認識に際して話
者の発声レベルを標準パターンの許容範囲内におさえる
様に指示でき、認識率の改善が得られる。
As described above, according to this embodiment, the range display section 9 is provided near the level display section 2, and the maximum value, minimum value, or average value of the registered standard pattern calculated by the power calculation section 8 is displayed within the range. By displaying this on the display unit 9, it is possible to instruct the speaker to keep the utterance level within the allowable range of the standard pattern during recognition, thereby improving the recognition rate.

なお、本文中のレベル表示部2.範囲表示部9け数字表
示器、メータとLEDの絹合せ2発光素子の組合せ等に
よっても実現できる。
In addition, the level display section 2 in the main text. It can also be realized by a range display unit, a nine-digit numeric display, a combination of a meter and an LED, and two light-emitting elements.

又、本実施例では使用に先立ってパターイを登録する登
録型の認識装置を用いて説明したが、あらかじめ別装置
で標準パターンを分析しておく型のものでも分析に際し
て電力を計算しておくことにより応用が可能である。
Furthermore, although this embodiment has been explained using a registration type recognition device that registers the pattern before use, even if the recognition device is of the type in which the standard pattern is analyzed in advance with a separate device, the power can be calculated at the time of analysis. It can be applied by

又電力計算部8における電力としては、平均電力、ピー
ク電力の他、母音定常部の電力を用いる方法がある。
As the power in the power calculation section 8, there is a method of using the power of the vowel stationary part in addition to the average power and the peak power.

又、本実施例は、コンピュータ並びに表示器を用いその
動作をプログラム的に行うことが可能である。
Further, in this embodiment, the operation can be performed programmatically using a computer and a display.

発明の効果 以上のように、本発明の音声認識装置は、入力音声の入
力1/ベルを表示する表示手段と合せて、標準パターン
の電力の最大値、最小値もしくは平均値を表示する表示
手段を設けることにより、話者の発声レベルの変動を許
容範囲におさめる様に話者に指示を与えることにより認
識率の向上を図ることかでき、その工業的価値は犬なる
ものがある。
Effects of the Invention As described above, the speech recognition device of the present invention includes display means for displaying the input 1/bell of the input voice as well as display means for displaying the maximum value, minimum value, or average value of the power of the standard pattern. By providing this, it is possible to improve the recognition rate by giving instructions to the speaker to keep fluctuations in the speaker's utterance level within an allowable range, and this has great industrial value.

【図面の簡単な説明】[Brief explanation of the drawing]

図は本発明の一実殉例における音声認識装置のブロック
図である。 2・・・・・レベル表示部、3・・・・・・パラメータ
分析部、4・・・・・・スイッチ、5・・・・・パター
ン記憶部、6・・・・・・パターン比較部、8・・・・
・・電力計算部、9・・・・・・範囲表示部。
The figure is a block diagram of a speech recognition device in a practical example of the present invention. 2: Level display section, 3: Parameter analysis section, 4: Switch, 5: Pattern storage section, 6: Pattern comparison section , 8...
... Power calculation section, 9... Range display section.

Claims (3)

【特許請求の範囲】[Claims] (1)入力音声のレベルを表示するレベル表示手段と、
前記入力音声を標準パターンとして登録するに際してそ
の平均電力を計算する電力計算手段と、前記電力計算手
段における最大値、最小値もしくは平均値を表示する範
囲表示手段とを具備する音声認識装置。
(1) Level display means for displaying the level of input audio;
A speech recognition device comprising: power calculation means for calculating the average power of the input speech when registering it as a standard pattern; and range display means for displaying the maximum value, minimum value, or average value of the power calculation means.
(2)レベル表示手段または範囲指示手段が並列配置さ
れた複数個の発光素子からなる特許請求の範囲第1項記
載の音声認識装置。
(2) The speech recognition device according to claim 1, wherein the level display means or the range indication means comprises a plurality of light emitting elements arranged in parallel.
(3)電力計算手段が母音定常部の電力をもって該当標
準パターンの平均電力となす特許請求の範囲第1項記載
の音声認識装置。
(3) The speech recognition device according to claim 1, wherein the power calculation means uses the power of the vowel stationary part as the average power of the corresponding standard pattern.
JP59036446A 1984-02-27 1984-02-27 Voice recognition equipment Granted JPS60179798A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59036446A JPS60179798A (en) 1984-02-27 1984-02-27 Voice recognition equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59036446A JPS60179798A (en) 1984-02-27 1984-02-27 Voice recognition equipment

Publications (2)

Publication Number Publication Date
JPS60179798A true JPS60179798A (en) 1985-09-13
JPH0449955B2 JPH0449955B2 (en) 1992-08-12

Family

ID=12470035

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59036446A Granted JPS60179798A (en) 1984-02-27 1984-02-27 Voice recognition equipment

Country Status (1)

Country Link
JP (1) JPS60179798A (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200301460A (en) * 2001-12-17 2003-07-01 Asahi Chemicl Ind Voice recognition method, remote control, data terminal device, telephone communication terminal, and voice recognition device
JP4652441B2 (en) * 2008-12-04 2011-03-16 株式会社三共 Game machine
JP4652464B2 (en) * 2009-05-07 2011-03-16 株式会社三共 Game machine
JP4652463B2 (en) * 2009-05-07 2011-03-16 株式会社三共 Game machine
JP4652465B2 (en) * 2009-05-07 2011-03-16 株式会社三共 Game machine

Also Published As

Publication number Publication date
JPH0449955B2 (en) 1992-08-12

Similar Documents

Publication Publication Date Title
EP0085543B1 (en) Speech recognition apparatus
CN101266792A (en) Speech recognition system and method for speech recognition
EP0559415A2 (en) A pattern matching method, a pattern recognition apparatus and speech recognition apparatus
JPS60179798A (en) Voice recognition equipment
JPS5755649A (en) Telephone set for deaf and dumb person
JPS59101700A (en) Method and apparatus for spoken voice recognition
US4888806A (en) Computer speech system
JPH07129158A (en) Instrument playing information analyzing device
JPS63261400A (en) Voice recognition system
JPS6151799B2 (en)
JP2606443B2 (en) Voice recognition device
US5237124A (en) Transmission sound developing system with pcm data
JPH096379A (en) Device and method for synthesizing voice
JP2708771B2 (en) Voice recognition method
JPS6010298A (en) Voice message length forecasting system
JPH01290031A (en) Processor capable of voice input
JPS61246823A (en) Input device
JPH07120253B2 (en) Text input device by voice
JP2005017620A (en) Language specifying method, program for language specification, and machine translation system using language specifying method
JPS61230198A (en) Voice recognition equipment
JPS6010299A (en) Voice message length forecaster
JPH03501788A (en) Method and device for performing arithmetic operations using the functions of an electronic computer
JPH0668677B2 (en) Speech recognition method and apparatus using vector division quantization
JPS5773467A (en) Electronic register
JPS5759226A (en) Information input equipment

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term