JPS6031196A - Voice pattern generator - Google Patents

Voice pattern generator

Info

Publication number
JPS6031196A
JPS6031196A JP14007783A JP14007783A JPS6031196A JP S6031196 A JPS6031196 A JP S6031196A JP 14007783 A JP14007783 A JP 14007783A JP 14007783 A JP14007783 A JP 14007783A JP S6031196 A JPS6031196 A JP S6031196A
Authority
JP
Japan
Prior art keywords
voice
voice pattern
sampling
pattern generator
consonants
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP14007783A
Other languages
Japanese (ja)
Inventor
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP14007783A priority Critical patent/JPS6031196A/en
Publication of JPS6031196A publication Critical patent/JPS6031196A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 肢」しヂM= 本発明は、音声パターン作成装置、より詳細には、音声
認識装置における音声の特徴パターンを作成するための
装置に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a voice pattern creation device, and more particularly to a device for creating voice characteristic patterns in a voice recognition device.

災来皮4 第1図は、従来の音声認識装置の一例を説明するための
図で、図中、1はマイク、2はフィルター群、3はサン
プリング回路、4は音声区間検出回路、5はレジスター
、6は認識部で、周知のように、マイクl°から入力さ
れた音声はバンドパスフィルター群2によって周波数分
析され、一定の周期でサンプリングされた後、音声と雑
音を判別して音声区間のみがレジスター5に記録される
。或いは、サンプル数が多い場合はデータ圧縮された後
レジスター5に記録され認識部6でそのデータを利用す
る。ところが語頭の音の違いによって意味の異なる単語
、例えば6/roku/と億10ku/の如きものの区
別がつけにくいという欠点がある。このような欠点を解
決するために音声の立ち上り状態にあることを検出する
検出回路を設け、これによってす□ンプリング回路3の
サンプリング周期を変化させる方法が提案されているが
(特開昭57−191000)、この方法は子音が音声
の立ち上り部に位置することが多いことを利用して、変
化の速い子音を母音よりも短い一定周期でサンプルし、
子音の特徴を十分にとり出そうとするものである。第2
図は、上記方法によって数字音声42/5htjyun
i/と発声した時の音声信号とそのサンプル周期を示し
たもので、図示のように、音声の立−トリ時にはサンプ
リング周期を11とし、それ以外の時にはサンプリング
周期を12とし、t+ <t2となるようにしているが
、実際には音声のエネルギーはこのようにならないこと
が多く、先例6と億については第3図(a)、(b)に
示すようになる。このように子音のエネルギーは母音に
比べて小さく母音が発声される際にエネルギーは立ち上
り状態になる。又、子音も後半ではエネルギーが小さく
なることが多く特に/r五k 1+ /、/ o k 
u /の/ u /は発声されないのが普通である。こ
のような場合/ r /、/に/は共にエネルギーが立
ち上り状態にある前半部だけが短い周期でサンプリング
され後半は長い周期となってしまう。しかも経続時間の
長い母音の立ち」−り部も細かいサンプルとなるため、
子音の特徴だけを十分とり出すことができない。
Figure 1 is a diagram for explaining an example of a conventional speech recognition device.In the figure, 1 is a microphone, 2 is a filter group, 3 is a sampling circuit, 4 is a speech section detection circuit, and 5 is a diagram for explaining an example of a conventional speech recognition device. The register 6 is a recognition unit, and as is well known, the voice input from the microphone 1° is frequency-analyzed by a group of band-pass filters 2, sampled at a constant cycle, and then distinguished between voice and noise to determine the voice interval. only is recorded in register 5. Alternatively, if the number of samples is large, the data is compressed and recorded in the register 5, and the recognition unit 6 uses the data. However, it has the disadvantage that it is difficult to distinguish between words that have different meanings depending on the sound at the beginning of the word, such as 6/roku/ and 1010ku/. In order to solve these drawbacks, a method has been proposed in which a detection circuit is provided to detect that the voice is in the rising state, and the sampling period of the sampling circuit 3 is thereby changed (Japanese Unexamined Patent Publication No. 1986-57). 191000), this method takes advantage of the fact that consonants are often located at the rising edge of speech, and samples rapidly changing consonants at a constant period shorter than vowels.
The aim is to fully extract the characteristics of consonants. Second
The figure shows the number sound 42/5htjyun by the above method.
This shows the audio signal and its sampling period when uttering "i/".As shown in the figure, the sampling period is 11 when the voice is starting, and the sampling period is 12 at other times, and t+ < t2. However, in reality, the energy of the voice is often not like this, and the example 6 and 10 million is shown in Figures 3 (a) and (b). In this way, the energy of a consonant is smaller than that of a vowel, and when a vowel is uttered, the energy rises. Also, the energy of consonants often decreases in the latter half, especially /r5k 1+ /, /o k
The /u/ of u/ is usually not uttered. In such a case, only the first half of /r/ and /ni/, where the energy is in a rising state, is sampled at a short period, and the second half is sampled at a long period. In addition, the final parts of vowels with long durations are also sampled in detail, so
It is not possible to fully extract the characteristics of consonants.

」−一眞 本発明は、−上述のごとき従来技術の欠点を解消するた
めになされたもので、特に、子音の特徴を強調して音声
パターンを作成する装置を提供することを目的としてな
されたものである。
- Kazuma The present invention was made in order to eliminate the drawbacks of the prior art as described above, and in particular, it was made for the purpose of providing a device that creates a speech pattern by emphasizing the characteristics of consonants. It is.

棗−一爪 本発明の構成について、以下、−実施例に基づいて説明
する。
Jujube - One Claw The structure of the present invention will be described below based on Examples.

本発明は、無声子音が母音に比べて高い周波数成分によ
って成り立っていることに着目し、音声の高い周波数成
分が低域より大きい時はサンプリング周期を細かくする
ようにしたものである。
The present invention focuses on the fact that voiceless consonants are made up of higher frequency components than vowels, and the sampling period is made finer when the high frequency components of the voice are larger than the low frequency components.

第4図は、本発明の一実施例を説明するための電気的ブ
ロック線図で、図中、7は比較器で、その他、第1図と
同様の作用をする部分には、第1図の場合と同一の参照
番号が付しである。而して、第4図に示した音声認識装
置において、マイク1から入力された音声はバンドパス
フィルター群2を通過するが、本発明においては、その
際バンドパスフィルター群2の最高帯域フィルターと最
低帯域フィルターの出力を比較器7で比較し、最高帯域
フィルターの出力が大なる時に、フィルター群の出力を
サンプルするサンプレンゲ回路3のサ3− ンプリング周期を短くし、その後信号から音声の区間だ
けをとり出してレジスター5へ納めるようにしている。
FIG. 4 is an electrical block diagram for explaining one embodiment of the present invention. In the figure, 7 is a comparator, and other parts having the same functions as those in FIG. The same reference numbers as in the case are given. In the speech recognition device shown in FIG. 4, the voice input from the microphone 1 passes through the band-pass filter group 2, but in the present invention, the highest band filter of the band-pass filter group 2 and The output of the lowest band filter is compared with the comparator 7, and when the output of the highest band filter is large, the sampling period of the sampling circuit 3 which samples the output of the filter group is shortened, and then only the section from the signal to the voice is sampled. I take it out and put it in register 5.

なお、上記実施例では最高、最低帯域フィルター出力を
比較するようにしているが、これは最高、最低近傍の出
力であれば良い。また、言うまでもないことであるが第
4図の各部の順序を入れ替えても同等の効果が得られる
ことは容易に理解できよう。
In the above embodiment, the highest and lowest band filter outputs are compared, but it is sufficient if the outputs are near the highest and lowest. It goes without saying that it is easy to understand that the same effect can be obtained even if the order of the parts in FIG. 4 is changed.

羞−一部 以上の説明から明らかなように、本発明によると、従来
強調され難かった単語中の子音部に重みづけした音声パ
ラメータを作成することができ。
Shyness - As is clear from the above description, according to the present invention, it is possible to create voice parameters that weight consonant parts in words, which have traditionally been difficult to emphasize.

その結果音声認識装置の認識率を向上させることができ
る。
As a result, the recognition rate of the speech recognition device can be improved.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は、従来の音声パターン作成装置の一例を説明す
るための要部構成図、第2図及び第3図は、第1図に示
した従来装置の動作を説明するための信号波形図、第4
図は、本発明による音声パターン作成装置の一実施例を
説明するための要部4− 構成図である。 1・・・マイク、2・・・フィルター群、3・・・サン
プリング回路、4・・・音声区間検出回路、5・・・レ
ジスター、6・・・音声認識装置部、7・・・比較器。
FIG. 1 is a main part configuration diagram for explaining an example of a conventional voice pattern creation device, and FIGS. 2 and 3 are signal waveform diagrams for explaining the operation of the conventional device shown in FIG. , 4th
The figure is a configuration diagram of a main part 4 for explaining an embodiment of the voice pattern creation device according to the present invention. DESCRIPTION OF SYMBOLS 1... Microphone, 2... Filter group, 3... Sampling circuit, 4... Voice section detection circuit, 5... Register, 6... Speech recognition unit, 7... Comparator .

Claims (1)

【特許請求の範囲】[Claims] 音声信号を周波数分析する手段と、周波数分析された信
号をサンプリングする手段と、周波数成分の大小を比較
する手段とを有し、低周波数成分に比べ高周波数成分が
同等以上の大きさの時、前記サンプリング手段のサンプ
リング周期を短くするようにしたことを特徴とする音声
パターン作成装置。
It has a means for frequency analyzing an audio signal, a means for sampling the frequency-analyzed signal, and a means for comparing the magnitude of the frequency components, and when the high frequency component is equal or larger in magnitude than the low frequency component, A voice pattern creation device characterized in that the sampling period of the sampling means is shortened.
JP14007783A 1983-07-30 1983-07-30 Voice pattern generator Pending JPS6031196A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14007783A JPS6031196A (en) 1983-07-30 1983-07-30 Voice pattern generator

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14007783A JPS6031196A (en) 1983-07-30 1983-07-30 Voice pattern generator

Publications (1)

Publication Number Publication Date
JPS6031196A true JPS6031196A (en) 1985-02-16

Family

ID=15260423

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14007783A Pending JPS6031196A (en) 1983-07-30 1983-07-30 Voice pattern generator

Country Status (1)

Country Link
JP (1) JPS6031196A (en)

Similar Documents

Publication Publication Date Title
US5884260A (en) Method and system for detecting and generating transient conditions in auditory signals
EP1293961B1 (en) A signal processing method to analyse transients of a speech signal
JPS6031196A (en) Voice pattern generator
WO2009055718A1 (en) Producing phonitos based on feature vectors
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
JPS6031193A (en) Voice pattern generator
JPS62238599A (en) Voice section detecting system
KR0180651B1 (en) Voice recognition device
JPS59228300A (en) Voice section detecting system
JPS62244100A (en) Voice section detecting system
JPS5995597A (en) Voice feature parameter preparation system
JPH01158499A (en) Standing noise eliminaton system
JPS62172400A (en) Voice recognition equipment
JPH07104675B2 (en) Speech recognition method
JPS62141597A (en) Voiced plosive consonant identifying system
JPS6260720B2 (en)
JPS6257000A (en) Voice recognition equipment
JPS6151196A (en) Voice recognition equipment
JPS6334479B2 (en)
JPS61124998A (en) Voice analyzer
JPS63221397A (en) Monosyllable voice recognition equipment
JP2000250599A (en) Acoustic feature extracting method and device
JPS6240496A (en) Voice pattern sorting system
JPS63300295A (en) Voice recognition equipment
JPS61277998A (en) Voice recognition circuit