JPS63223693A - Phoneme pattern registration - Google Patents

Phoneme pattern registration

Info

Publication number
JPS63223693A
JPS63223693A JP62057776A JP5777687A JPS63223693A JP S63223693 A JPS63223693 A JP S63223693A JP 62057776 A JP62057776 A JP 62057776A JP 5777687 A JP5777687 A JP 5777687A JP S63223693 A JPS63223693 A JP S63223693A
Authority
JP
Japan
Prior art keywords
phoneme
word
phonemes
registered
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62057776A
Other languages
Japanese (ja)
Other versions
JP2635575B2 (en
Inventor
宏 田中
奈良 泰弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62057776A priority Critical patent/JP2635575B2/en
Publication of JPS63223693A publication Critical patent/JPS63223693A/en
Application granted granted Critical
Publication of JP2635575B2 publication Critical patent/JP2635575B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 〔目 次〕 概要 産業上の利用分野 従来の技術(第5図) 発明が解決しようとする問題点 問題点を解決するだめの手段(第1図)作用 実施例 (a)  一実施例の説明(第2図、第3図、第4図)
由)他の実施例の説明 発明の効果 〔概 要〕 連続音声認識に用いる音韻パターンを話者の音声から抽
出して登録する音韻パターン登録方法において、登録さ
れた音韻の数の分布に応じて次に読み上げるべき単語を
変化させることによシ、登録された音韻分布をコントロ
ールするものである。
[Detailed description of the invention] [Table of contents] Overview Industrial field of application Prior art (Fig. 5) Problems to be solved by the invention Means for solving the problems (Fig. 1) Working examples ( a) Description of one embodiment (Figures 2, 3, and 4)
Description of other embodiments Effects of the invention [Summary] In a phonological pattern registration method for extracting and registering phonological patterns used for continuous speech recognition from a speaker's speech, By changing the word to be read out next, the registered phoneme distribution is controlled.

〔産業上の利用分野〕[Industrial application field]

本発明は、音韻認識をベースとする連続音声認識におい
て必要とされる音韻発声パターンを登録する音韻パター
ン登録方法に関し、特に、登録された音韻の出現頻度を
制御することのできる音韻パターン登録方法に関する。
The present invention relates to a phonological pattern registration method for registering phonological utterance patterns required in continuous speech recognition based on phonological recognition, and particularly relates to a phonological pattern registration method capable of controlling the appearance frequency of registered phonemes. .

音声認識技術の1つとして音韻認識が注目を浴びており
、音韻認識においては、辞書として多量の音韻学習パタ
ーンを特徴とする 特に連続音声認識のためには1人間の発声した連続音声
から切り出したパターンが求められている。
Phonological recognition is attracting attention as one of the speech recognition technologies, and in phonological recognition, it is characterized by a large number of phonological learning patterns as a dictionary.In particular, for continuous speech recognition, it is necessary to extract continuous speech uttered by one person. A pattern is needed.

このためKは、単語発声から自動的に音韻区間を切シ出
して、音韻パターンを登録する方法が有効であシ、少な
い音声入力数で各音韻のパターンが得られることが望ま
れている。
For this reason, it is effective for K to automatically extract phoneme sections from word utterances and register phoneme patterns, and it is desired that patterns for each phoneme can be obtained with a small number of voice inputs.

〔従来の技術〕[Conventional technology]

第5図は従来技術の説明図である。 FIG. 5 is an explanatory diagram of the prior art.

話者Sは、指示部9で示された予じめ定められた単語リ
ストを参照しながら、各単語をマイクロホンMPに発声
する。
The speaker S speaks each word into the microphone MP while referring to a predetermined word list shown on the instruction section 9.

発声された音声は2分析部1においてスペクトル及びパ
ワーの時系列に変換され、セグメンテーション部2によ
って、パワーディップやスペクトル変化点を参考にして
音韻単位にセグメンテーションされ、辞書参照部3へ送
られる。
The uttered speech is converted into a time series of spectrum and power in the second analysis section 1, segmented into phoneme units by the segmentation section 2 with reference to power dips and spectral change points, and sent to the dictionary reference section 3.

辞書参照部3では、セグメンテーションの結果を各単語
の音韻数や音韻の標準長が格納された単語辞書4と照合
し、単語の各音韻が正しく発声され且つセグメンテーシ
ョンが正常に行なわれたかを確認する。
The dictionary reference unit 3 compares the segmentation results with a word dictionary 4 that stores the number of phonemes and the standard length of phonemes for each word, and confirms whether each phoneme of the word has been uttered correctly and whether the segmentation has been performed normally. .

正常にセグメンテーションされた場合は、単語音声から
音韻が抽出されたことになシ、単語中の音韻パターンと
音韻基が音韻登録部5へ与えられ。
If the segmentation is successful, the phoneme has been extracted from the word speech, and the phoneme pattern and base of the word are given to the phoneme registration unit 5.

メモリに音韻パターンの登録が行なわれる。The phoneme pattern is registered in memory.

逆に、正常にセグメンテーションされなかった場合には
、その単語の音韻パターンの登録は行なわない。
Conversely, if the segmentation is not successful, the phonological pattern of the word is not registered.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

従来の音韻パターン登録方法では、予じめ作成された単
語リスト順に単語発声し、不良音韻パターンが登録され
ない様にするため、正常にセグメンテーションできなか
った単語からは、音韻パターンの登録を行なわないよう
Kしていた。
In the conventional phonological pattern registration method, words are uttered in the order of a word list created in advance, and in order to prevent defective phonological patterns from being registered, phonological patterns are not registered from words that cannot be successfully segmented. I was playing K.

単語リストは各音韻パターンを登録すべく、各音韻全て
を含むように作成されているが9話者Sの発声パターン
は一定マなく1種々のためセグメンテーションに失敗す
ることがアシ、これによって不良音韻パターンが発生す
る。
The word list is created to include all phonemes in order to register each phoneme pattern, but since the speech patterns of the nine speakers S are all different, there are times when segmentation fails. A pattern emerges.

このように不良音韻パターンが発生した場合。When a bad phonological pattern occurs like this.

従来は同一話者にその単語を再発声させるようにしてい
たが、再びセグメンテーシヨンに失敗することが多く、
特定の音韻パターンが十分登録できないという問題が生
じていた。
Previously, we had the same speaker repeat the word, but segmentation often failed again.
A problem has arisen in that certain phonological patterns cannot be registered sufficiently.

又、このようなことを考慮して2話者に多様多数の単語
を発声入力させることも考えられるが。
Also, taking this into consideration, it is conceivable to have two speakers input a wide variety of words aloud.

登録の効率が悪いという問題がめった。The problem of inefficient registration was common.

本発明は、比較的少ない単語数で十分な音韻パターンを
登録することのできる音韻パターン登録方法を提供する
ことを目的とする。
An object of the present invention is to provide a phoneme pattern registration method that can register sufficient phoneme patterns with a relatively small number of words.

〔問題点を解決するための手段〕[Means for solving problems]

第1図は本発明の原理説明図である。 FIG. 1 is a diagram explaining the principle of the present invention.

本発明は、示された単語リストを読み上げたマ痩 イクロホンMPの入力音声から音韻を分@、、i 、セ
グメンテーシロン部2.辞書参照部3で抽出し。
The present invention separates phonemes from the input speech of the microphone MP that reads out the indicated word list. Extracted by dictionary reference section 3.

音韻登録部5で抽出した音韻パターンを登録する音韻パ
ターンの登録において、音韻出現頻度部6で登録された
音韻の出現頻度分布(登録音韻の数の分布)を求め、求
めた音韻出現頻度を参照して単語リスト作成部7が次に
発声すべき単語リストを生成し、指示部8にこの生成し
た単語リストを示すようにしたものである。
In the registration of the phoneme pattern in which the phoneme pattern extracted by the phoneme registration unit 5 is registered, the appearance frequency distribution (distribution of the number of registered phonemes) of the phonemes registered in the phoneme appearance frequency unit 6 is obtained, and the obtained phoneme appearance frequency is referred to. Then, the word list creation section 7 generates a list of words to be uttered next, and the generated word list is displayed on the instruction section 8.

〔作 用〕[For production]

本発明では、登録された音韻の出現頻度分布を監視し、
出現頻度分布に評価基準を設けて、音韻登録中にすでに
登録されている音韻の評価値が増加する様な単語を1次
の登録用単語として選び。
In the present invention, the appearance frequency distribution of registered phonemes is monitored,
An evaluation standard is set for the appearance frequency distribution, and words that increase the evaluation value of already registered phonemes during phoneme registration are selected as words for primary registration.

その単語を表示して1話者に発声をうながす様にしたも
のである。
The word is displayed and one speaker is prompted to say it.

即ち、登録された音韻の出現頻度分布によって音韻の登
録状態を監視し1次単語リストを出現頻度分布に応じて
生成することによって、登録される音韻の出現頻度をコ
ントロールできるようにしたものである。
That is, by monitoring the registration status of phonemes based on the frequency distribution of registered phonemes and generating a primary word list according to the frequency distribution, it is possible to control the frequency of appearance of registered phonemes. .

〔実施例〕〔Example〕

(a)  一実施例の説明 第2図は本発明の詳細な説明図であり、音韻パターン登
録装置の機能ブロック図を示している。
(a) Description of one embodiment FIG. 2 is a detailed explanatory diagram of the present invention, and shows a functional block diagram of a phoneme pattern registration device.

図中、第1図及び第5図で示したものと同一のものは同
一の記号で示してあり、COMPはコンピュータであり
、ブロック1〜7の機能を演算により実行するもの、1
1はスペクトル分析部であり。
In the figure, the same components as those shown in FIGS. 1 and 5 are indicated by the same symbols, and COMP is a computer that executes the functions of blocks 1 to 7 by calculation;
1 is a spectrum analysis section.

マイクロホンMPを介して入力される音声のスペクトル
分析を行ない、スペクトルパターン時系列を出力するも
の、12はパワー抽出部であシ、スペクトルパターン時
系列をパワーの時系列に変換するもの、21はディップ
抽出部であり、パワーの時系列パターンからその時系列
パターンのディップの存在する区間(ディップの位置と
ディップの長さ)を抽出し、辞書参照部3へ与えるもの
A device that performs spectrum analysis of the audio input through the microphone MP and outputs a spectrum pattern time series; 12 is a power extractor; a component that converts the spectrum pattern time series into a power time series; 21 is a dip unit; This is an extraction section that extracts from the power time series pattern the section in which a dip exists (the position of the dip and the length of the dip) and provides it to the dictionary reference section 3.

61は音韻カウンタであり、格納部62の音韻出現頻度
分布Piに登録された音韻を加え、音韻出現頻度分布P
iを更新するもの、71は単語リスト作成部であシ、後
述する単語リスト作成フローに従って、後述する未使用
単語リスト部より所望の音韻出現頻度分布となるように
単語リストを作成するもの、72は未使用単語リスト部
であり。
61 is a phoneme counter which adds the registered phoneme to the phoneme appearance frequency distribution Pi of the storage unit 62 and calculates the phoneme appearance frequency distribution P.
i is updated, 71 is a word list creation section, which creates a word list from the unused word list section described below so as to have a desired phoneme appearance frequency distribution according to the word list creation flow described below; 72; is the unused word list part.

未使用の単語を格納しておくものである。It stores unused words.

尚、指示部8は表示部で構成され9発声すべき単語リス
トが表示される。
Incidentally, the instruction section 8 is constituted by a display section, and a list of words to be uttered is displayed.

第3図は第2図における単語リスト作成部71の単語リ
スト作成フロー図、第4図は動作説明図である。
FIG. 3 is a word list creation flowchart of the word list creation section 71 in FIG. 2, and FIG. 4 is an operation explanatory diagram.

先づ9発声すべき単語リストが表示部8に表示され1話
者Sは表示された単語リストの単語を順次発声する。
First, a list of nine words to be uttered is displayed on the display section 8, and one speaker S sequentially utters the words in the displayed word list.

発声単語は分析部1に入力し、スペクトル分析部llで
スペクトルパターン時系列を得、パワー抽出部12でパ
ワーの時系列パターンに変換される0 この実施例では、パワーの時系列パター゛ンのディップ
の大きさく即ち、ディップの長さ及び深さ)数及び形を
単語辞書4中のデータと比較することによって、セグメ
ンテーションが正常に行なわれたか否かの評価を行って
いる。
The uttered word is input to the analysis unit 1, the spectrum analysis unit ll obtains a spectral pattern time series, and the power extraction unit 12 converts it into a power time series pattern. In this embodiment, the power time series pattern is By comparing the size of the dips, that is, the length, depth, number and shape of the dips, with the data in the word dictionary 4, it is evaluated whether the segmentation has been performed normally.

このためセグメンテーション部2に、ディップ抽出部2
1が設けられておシ、パワーの時系列パターンからディ
ップの存在する区間(位置、長さ)を抽出して、セグメ
ンテーションしている。
For this reason, the segmentation unit 2 includes the dip extraction unit 2.
1 is provided to extract the section (position, length) where the dip exists from the power time series pattern and perform segmentation.

単語辞書4には、各単語毎にディップ区間の数。The word dictionary 4 contains the number of dip intervals for each word.

形及び大きさが格納されている。Shape and size are stored.

辞書参照部3は、ディップ抽出部21で抽出されたディ
ップ区間と、単語辞書4に格納されたディップ区間の数
、形と大きさの照合を行う。
The dictionary reference section 3 compares the dip sections extracted by the dip extraction section 21 with the number, shape, and size of the dip sections stored in the word dictionary 4.

この照合の結果によって、最終的にセグメンテーション
結果の評価が行われて、正しいセグメンテーションが行
なわれたかどうかが判断される。
Based on the results of this verification, the segmentation results are finally evaluated to determine whether correct segmentation has been performed.

正しくセグメンテーションされたと判断された単語につ
いては、音韻登録部5に音韻名と音mlパターンが与え
られ、音韻名に対応して音韻パターンが登録される。
For words determined to have been correctly segmented, the phoneme name and phoneme pattern are given to the phoneme registration unit 5, and the phoneme pattern is registered in correspondence with the phoneme name.

一方、セグメンテーションが誤っていると判断された単
語からは、音韻パターンの登録は行わない0 次に、登録された音韻は音韻カラ/り61に渡され、格
納部62の音韻出現頻度分布Piに加えられて更新され
る。
On the other hand, phoneme patterns are not registered for words whose segmentation has been determined to be incorrect.Next, the registered phonemes are passed to the phoneme color/retrieval unit 61 and added to the phoneme appearance frequency distribution Pi in the storage unit 62. added and updated.

このようにして1表示部8へ表示された全ての単語の発
声が終了すると、単語リスト作成部7は次に読上げるべ
き単語リストの作成に入る。
When all the words displayed on display section 1 8 have been uttered in this way, word list creation section 7 starts creating a list of words to be read out next.

リスト作成部7は、登録された音韻の数の分布の評価値
が増加するような単語リストを作成し。
The list creation unit 7 creates a word list that increases the evaluation value of the distribution of the number of registered phonemes.

音韻カウンタ61を介する音韻出現頻度分布Piから次
の登録の際に読み上げられる単語リストを作成する。
A word list to be read aloud at the next registration is created from the phoneme appearance frequency distribution Pi via the phoneme counter 61.

ここで、既に読まれた単語を再び読み上げることを避け
るため1次単語リストは、未だ読まれていない単語のリ
ストである未使用単語リスト部72の中から選ばれる。
Here, in order to avoid rereading words that have already been read, the primary word list is selected from the unused word list section 72, which is a list of words that have not yet been read.

この単語リストの生成について、第3図及び第4図を用
いて説明する。
Generation of this word list will be explained using FIGS. 3 and 4.

第3図において、未使用単語リスト部72中から単語を
とシ出すことを「単語を入力する」と呼び、入力した単
語を次単語リストに入れる単語として選び出すことを「
単語を採択する」と呼ぶことにする。
In FIG. 3, selecting a word from the unused word list section 72 is called "inputting a word", and selecting an input word as a word to be added to the next word list is called "inputting a word".
We will call it "Adopt a word".

又、iは音韻番号でi = l・・・Nとし、nPiは
Piに採択した単語リストに含まれる音韻分布を加えた
もの、wpiは入力した単語に含まれる音韻の分布、X
iは入力単語を採択した場合 nPiがとる分布、81
.82は音韻分布の評価値である0 尚、評価値81.82は値が大きい程評価が高い0 ■ 先づリスト作成部71は、音韻出現頻度部6から実
際の音韻出現頻度分布Pi を得、これをnPi  と
する。
Also, i is the phoneme number i = l...N, nPi is Pi plus the phoneme distribution included in the selected word list, wpi is the phoneme distribution included in the input word, and X
i is the distribution that nPi takes when the input word is adopted, 81
.. 82 is the evaluation value of the phoneme distribution 0. Note that the evaluation value 81.82 indicates that the larger the value, the higher the evaluation 0. First, the list creation section 71 obtains the actual phoneme appearance frequency distribution Pi from the phoneme appearance frequency section 6. , this is set as nPi.

音韻出現頻度分布P1は第4図に示す如く、各音韻毎の
登録(出現)数を格納したものである。
As shown in FIG. 4, the phoneme appearance frequency distribution P1 stores the number of registrations (occurrences) of each phoneme.

■ リスト作成部71は、単語リスト部72から全ての
単語を入力したかを調べ、全ての単語を入力したら、ス
テップ■へ進む。
(2) The list creation section 71 checks whether all the words have been input from the word list section 72, and when all the words have been input, the process proceeds to step (2).

一方、全ての単語を入力していなければ、単語リスト部
72から1単語入力する。
On the other hand, if all words have not been input, one word is input from the word list section 72.

■ 次に、リスト作成部71は入力した単語中の音韻分
布wPi (i=1・・・N)を生成する。
(2) Next, the list creation unit 71 creates a phoneme distribution wPi (i=1...N) in the input word.

リスト作成部71は音韻出現頻度分布npiにwPiを
加えて、Xiを得る。
The list creation unit 71 adds wPi to the phoneme appearance frequency distribution npi to obtain Xi.

登録される音韻の出現頻度分布を、全音韻が均等の分布
になるように制御するには、評価関数(分散) val
(Xi)を次の様に定義する。
To control the appearance frequency distribution of registered phonemes so that all phonemes have an equal distribution, use the evaluation function (variance) val
(Xi) is defined as follows.

上式より、  val(Xi)を求め、これを81とす
る0 次に、評価関数val(np’)を求める。
From the above equation, find val(Xi) and set it to 81.0 Next, find the evaluation function val(np').

そして、これを82とする。And let this be 82.

■ リスト作成部71は、81と82とを比較し、81
>82であれば、全音韻が均等となるような方向の単語
のため、入力された単語を採択し。
■ The list creation unit 71 compares 81 and 82, and
If >82, the input word is selected because it is a word with equal phonemes.

ステップ■へ戻る。Return to step ■.

逆に81≦82であれば、入力した単語によって全音韻
が均等となる方向でないため、入力単語を採択せず、ス
テップ■へ戻る。
On the other hand, if 81≦82, all the phonemes are not equal depending on the input word, so the input word is not selected and the process returns to step (2).

■ このようにして、単語リスト部72について採択す
るか否かを調べ終ると、採択した単語を次単語リストと
して表示部8へ出力する。
(2) When the word list section 72 is checked as to whether or not to be adopted in this manner, the selected words are outputted to the display section 8 as the next word list.

従って、第4図に示す様に、ある単語リストを読み終え
た時点で実際に登録された音韻分布Piの如く、ばらつ
きがあるとすると、  val(Xi)の値は最大値で
ない。ここで、このばらつきを打ち消す様な音韻分布を
持った単語リストが第4図の如く生成され、ここで得ら
れた単語中の音韻が全て登録されれば、登録された音韻
の出現頻度分布は、nPiの如くなシ、音韻分布は均一
となってval(Xi)の値は増加する。
Therefore, as shown in FIG. 4, if there are variations in the phoneme distribution Pi actually registered at the time when a certain word list is finished reading, the value of val(Xi) is not the maximum value. Here, if a word list with a phoneme distribution that cancels out this variation is generated as shown in Figure 4, and all the phonemes in the word obtained here are registered, the appearance frequency distribution of the registered phonemes will be , nPi, etc., the phoneme distribution becomes uniform and the value of val(Xi) increases.

このようにして、登録される音韻分布を制御できる。In this way, the registered phoneme distribution can be controlled.

(b)  他の実施例の説明 上述の実施例では、登録される音韻分布が均一となるよ
う1分散val(Xi) を(1)弐〜(2)式によっ
て行っているが、音韻分布を意図した分布Ri に制御
するには、関数を次のように定めればよい。
(b) Description of other embodiments In the embodiments described above, 1 variance val(Xi) is performed using equations (1)2 to (2) so that the registered phoneme distribution is uniform. In order to control the intended distribution Ri, the function may be determined as follows.

val(Xi)=−1/(N−z’)、Σ(Zt −Z
)”Zi = Xi /Ri           )
・・・・・・・・・(3)Z=(1ハ)ΣZi 尚、  val(nPi)  についても同様である。
val(Xi)=-1/(N-z'), Σ(Zt-Z
)”Zi = Xi /Ri)
(3) Z=(1c)ΣZi The same applies to val(nPi).

又、音韻分布を全ての音韻が最低1回出現するように制
御するには、関数を次のように定めればよい。
Furthermore, in order to control the phoneme distribution so that all phonemes appear at least once, a function may be determined as follows.

val(Xi)=Σval 2 (Xi )とする。Let val(Xi)=Σval2(Xi).

尚、  val(nPi)も同様である。Note that the same applies to val(nPi).

更に、単語リスト中の単語の数は任意に選択でき、1度
の読み上げ量を定め、その数の単語を示せばよく2話者
に示す方法も表示によって行なっているがプリンタで用
紙に印刷して示してもよい。
Furthermore, the number of words in the word list can be selected arbitrarily, and the number of words to be read at one time is determined, and the number of words can be shown to two speakers. It may also be shown as

以上本発明を実施例により説明したが9本発明は本発明
の主旨に従い種々の変形が可能であシ。
Although the present invention has been described above with reference to embodiments, the present invention can be modified in various ways according to the gist of the present invention.

本発明からこれらを排除するものではない。These are not excluded from the present invention.

〔発明の効果〕〔Effect of the invention〕

以上説明した様に1本発明によれば、単語発声から自動
的に音韻を抽出し、音韻パターンを登録する際に、登録
される音韻分布を制御できるという効果を奏し、所望の
音韻分布をもつ音韻パターン辞書が得られる。
As explained above, according to the present invention, when automatically extracting phonemes from word utterances and registering phoneme patterns, it is possible to control the registered phoneme distribution, thereby achieving a desired phoneme distribution. A phonological pattern dictionary is obtained.

又、登録に用いる単語数を減らすこともでき。It is also possible to reduce the number of words used for registration.

登録の効率が向上するという効果を奏し、更に音韻パタ
ーンの信頼度向上に役立つ。
This has the effect of improving the efficiency of registration, and is also useful for improving the reliability of phoneme patterns.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の原理説明図。 第2図は本発明の詳細な説明図。 第3図は第2図における単語リスト作成フロー図。 第4図は本発明の一実施例動作説明図。 第5図は従来技術の説明図である。 図中、′1・・・分析部。 2・・・セグメンテーション部。 3・・・辞書参照部。 5・・・音韻登録部。 6・・・音韻出現頻度部。 7・・・単語リスト作成部。 FIG. 1 is a diagram explaining the principle of the present invention. FIG. 2 is a detailed explanatory diagram of the present invention. FIG. 3 is a flowchart for creating a word list in FIG. 2. FIG. 4 is an explanatory diagram of the operation of one embodiment of the present invention. FIG. 5 is an explanatory diagram of the prior art. In the figure, '1... analysis section. 2...Segmentation section. 3...Dictionary reference section. 5... Phonological registration section. 6...Phonological appearance frequency part. 7...Word list creation section.

Claims (4)

【特許請求の範囲】[Claims] (1)示された単語リストを読み上げた入力音声から音
韻を抽出し、抽出した音韻パターンを登録する音韻パタ
ーン登録方法において、 該登録された音韻の出現頻度を求め、 該音韻の出現頻度を参照して次に発声すべき単語リスト
を生成し、 該生成した単語リストを示すようにしたことを特徴とす
る音韻パターン登録方法。
(1) In a phoneme pattern registration method that extracts phonemes from input speech that reads out a list of words and registers the extracted phoneme pattern, the frequency of appearance of the registered phoneme is determined, and the frequency of appearance of the phoneme is referred to. 1. A phoneme pattern registration method comprising: generating a list of words to be uttered next; and displaying the generated word list.
(2)上記単語リストの生成は、登録される音韻の出現
頻度分布を意図した分布に近づける様に生成することを 特徴とする特許請求の範囲第(1)項記載の音韻パター
ン登録方法。
(2) The phoneme pattern registration method according to claim (1), wherein the word list is generated so that the frequency distribution of the phonemes to be registered approaches an intended distribution.
(3)上記単語リストの生成は、登録される音韻の出現
頻度分布が、全音韻が均等の分布となる様に生成するこ
とを 特徴とする特許請求の範囲第(1)項記載の音韻パター
ン登録方法。
(3) The phoneme pattern according to claim (1), wherein the word list is generated such that the appearance frequency distribution of the phonemes to be registered is an even distribution for all phonemes. How to register.
(4)上記単語リストの生成は、登録される音韻の出現
頻度分布が、全ての音韻が最低1回は出現するように生
成することを 特徴とする特許請求の範囲第(1)項記載の音韻パター
ン登録方法。
(4) The word list is generated such that the frequency distribution of registered phonemes is such that all phonemes appear at least once. Phonological pattern registration method.
JP62057776A 1987-03-12 1987-03-12 Phoneme pattern registration method Expired - Fee Related JP2635575B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62057776A JP2635575B2 (en) 1987-03-12 1987-03-12 Phoneme pattern registration method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62057776A JP2635575B2 (en) 1987-03-12 1987-03-12 Phoneme pattern registration method

Publications (2)

Publication Number Publication Date
JPS63223693A true JPS63223693A (en) 1988-09-19
JP2635575B2 JP2635575B2 (en) 1997-07-30

Family

ID=13065267

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62057776A Expired - Fee Related JP2635575B2 (en) 1987-03-12 1987-03-12 Phoneme pattern registration method

Country Status (1)

Country Link
JP (1) JP2635575B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012511730A (en) * 2008-12-09 2012-05-24 ノキア コーポレイション Fit automatic speech recognition acoustic model

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61249182A (en) * 1985-04-27 1986-11-06 Toshiba Corp Pattern recognizing and learning device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61249182A (en) * 1985-04-27 1986-11-06 Toshiba Corp Pattern recognizing and learning device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012511730A (en) * 2008-12-09 2012-05-24 ノキア コーポレイション Fit automatic speech recognition acoustic model

Also Published As

Publication number Publication date
JP2635575B2 (en) 1997-07-30

Similar Documents

Publication Publication Date Title
US8731928B2 (en) Speaker adaptation of vocabulary for speech recognition
DE69327188T2 (en) Automatic speech recognition facility
JP4632384B2 (en) Audio information processing apparatus and method and storage medium
JP2001282278A (en) Voice information processor, and its method and storage medium
US20010029454A1 (en) Speech synthesizing method and apparatus
JPS63223693A (en) Phoneme pattern registration
JP3344487B2 (en) Sound fundamental frequency pattern generator
Martens et al. Word Segmentation in the Spoken Dutch Corpus.
JP2000148187A (en) Speaker recognizing method, device using the method and program recording medium therefor
JP2001282098A (en) Foreign language learning device, foreign language learning method and medium
JPS61239358A (en) Documentation system by voice input
JPH04181298A (en) Reference vector update system
KR20240060961A (en) Method for generating voice data, apparatus for generating voice data and computer-readable recording medium
JPS62121499A (en) Voice recognition equipment
JPS63218999A (en) Voice recognition equipment
JPS6287993A (en) Voice recognition equipment
JP2004309654A (en) Speech recognition apparatus
JP2005017620A (en) Language specifying method, program for language specification, and machine translation system using language specifying method
CN114267331A (en) Speaker coding method, device and multi-speaker voice synthesis system
JPS63155195A (en) Voice recognition equipment
JP2000315095A (en) Device and method for voice recognition and recording medium in which voice recognition control program is stored
JPH045697A (en) Word accent registering method
JPS60241097A (en) Voice recognition applying equipment
JPS6140686A (en) Registration system for standard pattern
JPS62113196A (en) Voice recognition learning system

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees