JP4662139B2 - Data output device, data output method, and program - Google Patents

Data output device, data output method, and program Download PDF

Info

Publication number
JP4662139B2
JP4662139B2 JP2005194907A JP2005194907A JP4662139B2 JP 4662139 B2 JP4662139 B2 JP 4662139B2 JP 2005194907 A JP2005194907 A JP 2005194907A JP 2005194907 A JP2005194907 A JP 2005194907A JP 4662139 B2 JP4662139 B2 JP 4662139B2
Authority
JP
Japan
Prior art keywords
state
probability
hmm
time
transition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005194907A
Other languages
Japanese (ja)
Other versions
JP2007011203A (en
Inventor
活樹 南野
一美 青山
洋貴 鈴木
秀樹 下村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2005194907A priority Critical patent/JP4662139B2/en
Publication of JP2007011203A publication Critical patent/JP2007011203A/en
Application granted granted Critical
Publication of JP4662139B2 publication Critical patent/JP4662139B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Complex Calculations (AREA)

Description

本発明は、データ出力装置、データ出力方法、およびプログラムに関し、特に、状態遷移確率モデルを用いて、滑らかに変化する時系列のベクトル等のデータを、容易に得ることができるようにするデータ出力装置、データ出力方法、およびプログラムに関する。   The present invention relates to a data output device, a data output method, and a program, and in particular, a data output that makes it possible to easily obtain data such as a time-series vector that changes smoothly using a state transition probability model. The present invention relates to an apparatus, a data output method, and a program.

音声(信号)、さらには、音声から抽出される音声パラメータは、時系列のデータ(時系列データ)であり、時系列データをモデル化するモデルとしては、例えば、HMM(Hidden Markov Model)がある。   Voice (signal), and further, a voice parameter extracted from the voice is time-series data (time-series data). As a model for modeling the time-series data, for example, there is an HMM (Hidden Markov Model). .

近年、HMMは、音声認識に広く利用されている。HMMは、状態の遷移に応じてデータが出力される状態遷移確率モデルの1種であり、状態Siから状態Sjに遷移する確率である状態遷移確率aijと、状態が遷移したときに遷移先の状態Sjがデータ(観測値)xを出力する確率分布を表す出力確率密度関数bj(x)で定義される。 In recent years, HMM has been widely used for speech recognition. The HMM is a kind of state transition probability model in which data is output according to state transitions. When the state transitions, the state transition probability a ij which is the probability of transition from the state S i to the state S j The transition destination state S j is defined by an output probability density function b j (x) representing a probability distribution for outputting data (observed value) x.

なお、出力確率密度関数としては、例えば、混合正規分布などが仮定される。また、出力確率密度関数は、状態Siから状態Sjに遷移したときにデータ(観測値)xが出力される確率分布を表す関数であるとして、遷移前の状態Siのサフィックスiと遷移後の状態Sjのサフィックスjとを用いて、bij(x)と表されることがある。 As the output probability density function, for example, a mixed normal distribution is assumed. Further, the output probability density function, as a function representing a probability distribution data (observed values) x is output when a transition from the state S i to state S j, and the suffix i in the state S i before transition Transition It may be expressed as b ij (x) using the suffix j of the later state S j .

HMMによれば、学習すべき時系列データの統計的な特性がモデル化される。HMMの学習、即ち、HMMを定義する状態遷移確率aijと出力確率密度関数bj(x)の推定方法としては、Baum-Welch 法が広く使われている。ここで、HMMについては、非特許文献1に記載されている。 According to the HMM, statistical characteristics of time series data to be learned are modeled. The Baum-Welch method is widely used as an HMM learning method, that is, an estimation method of the state transition probability a ij and the output probability density function b j (x) that defines the HMM. Here, the HMM is described in Non-Patent Document 1.

現在、HMMは、孤立単語音声認識から大語彙連続音声認識にまで幅広く用いられ、そのような音声認識を行う音声認識装置が実用化されている。   Currently, HMMs are widely used from isolated word speech recognition to large vocabulary continuous speech recognition, and speech recognition devices that perform such speech recognition have been put into practical use.

ところで、近年においては、音声合成にHMMを用いる方法が提案されている。   Incidentally, in recent years, a method using an HMM for speech synthesis has been proposed.

HMMを用いた音声合成では、時系列のピッチやスペクトルなどの音声パラメータ(の時系列)をHMMによってモデル化し、HMMから音声パラメータを生成して、その音声パラメータから、音声信号が合成(生成)される。音声パラメータから音声信号を合成するにあたっては、音声信号からスペクトルなどの音声パラメータを抽出する処理と逆向きの処理を行う逆フィルタが用いられる。   In speech synthesis using HMM, speech parameters such as time series pitch and spectrum (time series) are modeled by HMM, speech parameters are generated from HMM, and speech signals are synthesized (generated) from the speech parameters. Is done. In synthesizing an audio signal from an audio parameter, an inverse filter that performs a process opposite to the process of extracting an audio parameter such as a spectrum from the audio signal is used.

例えば、音声パラメータの一種であるメルケプストラム係数から音声信号を合成するフィルタとしては、MLSAフィルタ(メル対数スペクトル近似フィルタ)などがある。ここで、MLSAフィルタについては、例えば、非特許文献2や3に記載されている。   For example, a filter that synthesizes a speech signal from a mel cepstrum coefficient, which is a kind of speech parameter, includes an MLSA filter (Mel logarithmic spectrum approximation filter). Here, the MLSA filter is described in Non-Patent Documents 2 and 3, for example.

HMMから音声合成に用いる時系列データである音声パラメータを生成する方法としては、例えば、動的特徴量を用いたHMMによって音声パラメータを生成する方法がある。ここで、動的特徴量を用いたHMMについては、非特許文献4や5に記載されている。   As a method for generating a speech parameter that is time-series data used for speech synthesis from an HMM, for example, there is a method for generating a speech parameter by an HMM using a dynamic feature amount. Here, HMMs using dynamic feature quantities are described in Non-Patent Documents 4 and 5.

ここで、音声パラメータは、音声の特徴を表し、一般に、ベクトルであるので、以下、適宜、特徴ベクトルともいう。   Here, the speech parameter represents a feature of speech and is generally a vector, and hence is also referred to as a feature vector as appropriate.

動的特徴量を用いたHMMによって特徴ベクトルを生成する場合、HMMの状態遷移確率aijに基づき、各状態について、同一の状態に遷移し続ける(自己遷移している)時間である継続時間(継続時間長)が尤度最大化に基づいて推定され、その継続時間に基づき、最適状態系列、つまり、HMMにおいて、最も確からしい状態の遷移のしていき方が求められる。そして、その最適状態系列にしたがった順番で状態を遷移しながら、各状態から、尤度最大化に基づいて特徴ベクトルが生成される。 When a feature vector is generated by an HMM using dynamic features, a duration (which is a self-transition) time for each state continues (self-transition) based on the state transition probability a ij of the HMM. Based on the maximization of likelihood, the most probable state transition is determined in the optimum state sequence, that is, the HMM. Then, a feature vector is generated from each state based on the likelihood maximization while changing the state in the order according to the optimum state series.

状態Sjでの特徴ベクトルxの生成は、その状態Sjの出力確率密度関数bj(x)を用いて行われるが、特徴ベクトルxの生成に、何の制約も与えない場合、尤度最大化によれば、出力確率密度関数bj(x)の平均ベクトルが、特徴ベクトルxとして生成される。従って、この場合、状態Sjが決まれば、その状態Sjから生成される特徴ベクトルxも、状態Sjの出力確率密度関数bj(x)の平均ベクトルに一意に決まってしまい、その結果、滑らかに変化する時系列の特徴ベクトルを得ることが困難となる。 If generation of a feature vector x in the state S j is performed using the output probability density function b j of that state S j (x), that the generation of a feature vector x, give no constraint, the likelihood According to the maximization, an average vector of the output probability density function b j (x) is generated as the feature vector x. Therefore, in this case, once the state S j, also feature vector x generated from the state S j, would uniquely determined on an average vector of the state S j of the output probability density function b j (x), as a result It is difficult to obtain a time-series feature vector that changes smoothly.

そこで、動的特徴量を用いたHMMでは、滑らかに変化する時系列の特徴ベクトルを得るために、動的特徴量が利用される。   Therefore, in an HMM using dynamic feature amounts, dynamic feature amounts are used to obtain time-series feature vectors that change smoothly.

即ち、いま、時刻tにおける特徴ベクトルを、ctと表すこととすると、長さTの時系列の特徴ベクトルは、c1,c2,・・・,cTと表すことができる。この場合、動的特徴量としては、式(1)のdtや、式(2)のatが用いられる。 That is, now, a feature vector at time t, if it is assumed that expressed the c t, the feature vector time series of length T is, c 1, c 2, can be expressed., And c T. In this case, the dynamic features, and d t of formula (1), is a t of formula (2) is used.

Figure 0004662139
・・・(1)
Figure 0004662139
... (1)

Figure 0004662139
・・・(2)
Figure 0004662139
... (2)

式(1)の動的特徴量dtは、特徴ベクトルct の変化量をあらわすベクトルであり、デルタパラメータと呼ばれる。式(2)の動的特徴量at は、デルタパラメータdt の変化量を表すベクトルであり、デルタデルタパラメータと呼ばれる。 The dynamic feature quantity d t in equation (1) is a vector that represents the amount of change in the feature vector c t and is called a delta parameter. Dynamic features a t of formula (2) is a vector representing a change amount of the delta parameters d t, called delta delta parameters.

いま、特徴ベクトルctと、動的特徴量(ベクトル)dtおよびatとをコンポーネントとするベクトルotを、式(3)のように表す。 Now, a vector ot whose components are a feature vector c t and dynamic feature quantities (vectors) d t and a t is expressed as in Expression (3).

Figure 0004662139
・・・(3)
Figure 0004662139
... (3)

動的特徴量を用いたHMMでは、時系列のベクトルo1,o2,o3,・・・,oT を用いて、HMMの学習が行われ、学習後のHMMを用いて、時系列のベクトルo1,o2,o3,・・・,oT が生成される。そして、時系列のベクトルo1,o2,o3,・・・,oT を生成するにあたっては、式(1)と式(2)とが考慮される。その結果、HMMの状態Sjから出力されるベクトルotは、単なる出力確率密度関数bj(ot)の平均ベクトルにならず、ベクトルotのコンポーネントとなっている特徴ベクトルctは、滑らかに変化する時系列のベクトル(時系列ベクトル)となる。 In an HMM using dynamic features, HMM learning is performed using time series vectors o 1 , o 2 , o 3 ,..., O T , and time series are used using the learned HMM. Vector o 1 , o 2 , o 3 ,..., O T are generated. Then, when generating the time-series vectors o 1 , o 2 , o 3 ,..., O T , the equations (1) and (2) are considered. As a result, the vector o t is output from the state S j of the HMM, not the average vector of just the output probability density function b j (o t), the feature vector c t which is a component of the vector o t, It becomes a time-series vector (time-series vector) that changes smoothly.

動的特徴量を用いたHMMによれば、滑らかに変化する特徴ベクトルc1,c2,・・・,cTを得て、自然な合成音を生成することができる。 According to the HMM using the dynamic feature amount, it is possible to obtain smoothly synthesized feature vectors c 1 , c 2 ,..., C T and generate a natural synthesized sound.

しかしながら、動的特徴量を用いたHMMでは、特徴ベクトルctの他に、動的特徴量としてデルタパラメータdtやデルタデルタパラメータatを用いるため、動的特徴量として、デルタパラメータdtだけを用いることとしても、HMMが学習するベクトルotの次元数が2倍に増加し、さらに、動的特徴量として、デルタデルタパラメータatをも用いる場合には、HMMが学習するベクトルotの次元数が3倍に増加する。 However, the HMM using the dynamic features, in addition to the feature vector c t, for using the delta parameter d t and delta delta parameters a t as dynamic features as dynamic features, only the delta parameters d t even the use of, dimensionality of vector o t of the HMM learning is increased two times, more, as the dynamic features, in the case of using also the delta delta parameters a t, the vector o t where HMM learns The number of dimensions increases three times.

そして、このようなベクトルotの次元数の増加に起因して、HMMの学習や、HMMからのベクトルの生成に必要となる処理量が大になり、さらには、HMMのパラメータ、即ち、HMMを定義する状態遷移確率aijと出力確率密度関数bj(x)のうちの、出力確率密度関数bj(x)を規定する平均ベクトル等のデータ量も大になる。 Further, due to the increase in the number of dimensions of the vector o t , the amount of processing required for learning the HMM and generating a vector from the HMM increases, and furthermore, the parameters of the HMM, that is, the HMM of probability and state transition probability a ij to define the power density function b j (x), the data amount such as average vector defining the output probability density function b j (x) also becomes large.

一方、HMMからの時系列の特徴ベクトルの生成の確率的試行を繰り返し、その確率的試行の結果の平均をとることで、滑らかに変化する特徴ベクトルを生成する方法が提案されている。ここで、かかる確率的試行に基づく特徴ベクトルの生成の方法については、例えば、特許文献1や非特許文献6に記載されている。   On the other hand, a method of generating a smoothly changing feature vector by repeating probabilistic trials of generating time-series feature vectors from the HMM and averaging the results of the probabilistic trials has been proposed. Here, a method of generating a feature vector based on such a probabilistic trial is described in, for example, Patent Document 1 and Non-Patent Document 6.

確率的試行に基づく特徴ベクトルの生成では、HMMの状態遷移確率aijにしたがって確率的に複数の状態の系列(遷移する状態の系列(状態遷移系列))を求め、その複数の状態遷移系列の平均的な状態遷移系列を決定し、さらに、その平均的な状態遷移系列から出力確率密度関数bj(x)に基づき、時系列の特徴ベクトルを生成するという試行が多数回行われる。そして、その多数回の試行によって生成された時系列の特徴ベクトルを平均化することで、最終的な時系列の特徴ベクトルが求められる。 In the generation of feature vectors based on probabilistic trials, a sequence of a plurality of states (sequence of transition states (state transition sequence)) is obtained probabilistically according to the state transition probability a ij of the HMM. An average state transition sequence is determined, and further, a trial of generating a time-series feature vector based on the output probability density function b j (x) from the average state transition sequence is performed many times. Then, by averaging the time series feature vectors generated by the numerous trials, a final time series feature vector is obtained.

確率的試行に基づく特徴ベクトルの生成では、動的特徴量を用いたHMMによる特徴ベクトルの生成と異なり、尤度最大化という基準で時系列の特徴ベクトルが生成されるのではなく、特徴ベクトルの生成の確率的試行の結果の平均的な時系列の特徴ベクトルが生成される。   In the generation of feature vectors based on probabilistic trials, unlike the generation of feature vectors by HMM using dynamic features, time-series feature vectors are not generated on the basis of likelihood maximization. An average time series feature vector resulting from the probabilistic trial of generation is generated.

従って、確率的試行に基づく特徴ベクトルの生成によれば、時系列の特徴ベクトルを生成する処理を多数回試行する必要があるため、処理量が大になる。   Therefore, according to the generation of the feature vector based on the probabilistic trial, it is necessary to try the process of generating the time-series feature vector many times, which increases the processing amount.

特開2004-330361号公報JP 2004-330361 A Laurence Rabiner, Biing-Hwang Juang 、「音声認識の基礎(上・下)」、NTTアドバンステクノロジ株式会社Laurence Rabiner, Biing-Hwang Juang, “Basics of Speech Recognition (Up / Down)”, NTT Advanced Technology Corporation 今井聖、住田一男、古市千恵子、「音声合成のためのメル対数スペクトル近似(MLSA)フィルタ」、電子情報通信学会論文誌(A)、J66-A, 2, pp.122-129, 1983Sei Imai, Kazuo Sumita, Chieko Furuichi, "Mel Log Spectrum Approximation (MLSA) Filter for Speech Synthesis", IEICE Transactions (A), J66-A, 2, pp.122-129, 1983 徳田恵一、小林隆夫、斉藤博徳、深田俊明、今井聖、「メルケプストラムをパラメータとする音声のスペクトル推定」、電子情報通信学会論文誌(A)、J74-A, 8, pp.1240-1248, 1991Keiichi Tokuda, Takao Kobayashi, Hironori Saito, Toshiaki Fukada, Kiyoshi Imai, "Spectrum estimation of speech using mel cepstrum as a parameter", IEICE Transactions (A), J74-A, 8, pp.1240-1248, 1991 K. Tokuda, T. Yoshimura, T. Masuko, T. Kobayashi, T. Kitamura, "SPEECH PARAMETER GENERATION ALGORITHMS FOR HMM-BASED SPEECH SYNTHESIS", Proc. of ICASSP 2000, vol.3, pp.1315-1318, June 2000K. Tokuda, T. Yoshimura, T. Masuko, T. Kobayashi, T. Kitamura, "SPEECH PARAMETER GENERATION ALGORITHMS FOR HMM-BASED SPEECH SYNTHESIS", Proc. Of ICASSP 2000, vol.3, pp.1315-1318, June 2000 徳田 恵一、「HMMによる音声合成の基礎」、電子情報通信学会技術研究報告, SP2000-74, pp.43--50, Oct. 2000.Tokuda Keiichi, “Basics of Speech Synthesis with HMM”, IEICE Technical Report, SP2000-74, pp.43--50, Oct. 2000. 稲邑哲也、谷江博昭、中村仁彦、「連続分布型隠れマルコフモデルを用いた時系列データのキーフレーム抽出とその復元」、日本機械学会ロボティクス・メカトロニクス講演会2003講演論文集、2P1-3F-C6,2003Tetsuya Inagi, Hiroaki Tanie, Yoshihiko Nakamura, "Keyframe Extraction and Restoration of Time Series Data Using Continuously Distributed Hidden Markov Model", Proc. Of Robotics and Mechatronics Lecture 2003, 2P1-3F-C6 , 2003

本発明は、このような状況に鑑みてなされたものであり、動的特徴量を用いることなく、かつ、時系列データの生成を繰り返し試行することなく、滑らかに変化する時系列データを得ることができるようにするものである。   The present invention has been made in view of such a situation, and obtains time-series data that changes smoothly without using dynamic feature values and without repeatedly trying to generate time-series data. Is to be able to.

本発明の一側面のデータ出力装置、又は、プログラムは、時系列のデータを出力するデータ出力装置において、状態が遷移する状態遷移確率と、各状態が出力するデータの確率分布とで定義されるHMMの各状態について、所定の間隔の時刻ごとの、状態がデータを出力する状態確率を推定する状態確率推定手段と、前記状態確率と、前記確率分布に従うデータの平均値とに基づいて、HMMが出力する所定の間隔の時刻ごとのデータを求め、時系列のデータとして出力する時系列データ生成手段とを備え、前記状態確率推定手段は、前記HMMの各状態について、自己遷移の状態遷移確率を用いて、自己遷移が生じる回数の期待値に対応する値を、自己遷移が継続する継続時間の期待値として求め、ある状態から他の状態に遷移する遷移時刻が、前記継続時間の期待値の加算によって求められる期待遷移時刻を平均値とする正規分布に従うことを仮定して、前記正規分布を用いた漸化式により求められる、各時刻に、状態から状態遷移が始まる確率に対応する値を、各時刻の前記状態確率として求め、前記時系列データ生成手段は、各状態の状態確率を重みとする前記データの平均値の線形結合により、各時刻にHMMが出力するデータを求めるデータ出力装置、又は、データ出力装置として、コンピュータを機能させるためのプログラムである。A data output device or program according to one aspect of the present invention is defined by a state transition probability of state transition and a probability distribution of data output by each state in a data output device that outputs time-series data. For each state of the HMM, based on the state probability estimation means for estimating the state probability that the state outputs data for each time at a predetermined interval, the state probability, and the average value of the data according to the probability distribution, Time-series data generating means for obtaining data for each time of a predetermined interval output from the time-series data, and outputting the data as time-series data, the state probability estimating means for each state of the HMM, the state transition probability of self-transition Is used to obtain the value corresponding to the expected value of the number of times that self-transition occurs as the expected value of the duration of the self-transition, and the transition time for transitioning from one state to another is The probability that a state transition starts from a state at each time, obtained by a recurrence formula using the normal distribution, assuming that it follows a normal distribution whose average value is the expected transition time obtained by adding expected values of time Is obtained as the state probability at each time, and the time-series data generating means outputs data output by the HMM at each time by linear combination of the average values of the data weighted by the state probability of each state. Is a program for causing a computer to function as a data output device or a data output device.
本発明の一側面のデータ出力方法は、時系列のデータを出力するデータ出力方法において、状態が遷移する状態遷移確率と、各状態が出力するデータの確率分布とで定義されるHMMの各状態について、所定の間隔の時刻ごとの、状態がデータを出力する状態確率を推定する状態確率推定ステップと、前記状態確率と、前記確率分布に従うデータの平均値とに基づいて、HMMが出力する所定の間隔の時刻ごとのデータを求め、時系列のデータとして出力する時系列データ生成ステップとを含み、前記状態確率推定ステップは、前記HMMの各状態について、自己遷移の状態遷移確率を用いて、自己遷移が生じる回数の期待値に対応する値を、自己遷移が継続する継続時間の期待値として求め、ある状態から他の状態に遷移する遷移時刻が、前記継続時間の期待値の加算によって求められる期待遷移時刻を平均値とする正規分布に従うことを仮定して、前記正規分布を用いた漸化式により求められる、各時刻に、状態から状態遷移が始まる確率に対応する値を、各時刻の前記状態確率として求め、前記時系列データ生成ステップは、各状態の状態確率を重みとする前記データの平均値の線形結合により、各時刻にHMMが出力するデータを求めるデータ出力方法である。A data output method according to one aspect of the present invention is a data output method for outputting time-series data, wherein each state of the HMM defined by a state transition probability of state transition and a probability distribution of data output by each state A state probability estimation step for estimating a state probability that the state outputs data at a predetermined interval of time, a predetermined value output by the HMM based on the state probability and an average value of data according to the probability distribution A time series data generation step for obtaining data for each time of the interval and outputting as time series data, wherein the state probability estimation step uses a state transition probability of self transition for each state of the HMM, A value corresponding to the expected value of the number of times self-transition occurs is obtained as an expected value of the duration for which the self-transition continues, and the transition time for transitioning from one state to another is the duration Corresponds to the probability that a state transition starts from a state at each time, obtained by a recurrence formula using the normal distribution, assuming that it follows a normal distribution with the expected transition time obtained by adding expected values as an average value. The time series data generation step obtains data output by the HMM at each time by linear combination of the average values of the data weighted by the state probabilities of each state. Data output method.

本発明の一側面においては、状態が遷移する状態遷移確率と、各状態が出力するデータの確率分布とで定義されるHMMの各状態について、所定の間隔の時刻ごとの、状態がデータを出力する状態確率が推定され、前記状態確率と、前記確率分布に従うデータの平均値とに基づいて、HMMが出力する所定の間隔の時刻ごとのデータが求められ、時系列のデータとして出力される。具体的には、前記HMMの各状態について、自己遷移の状態遷移確率を用いて、自己遷移が生じる回数の期待値に対応する値が、自己遷移が継続する継続時間の期待値として求められ、ある状態から他の状態に遷移する遷移時刻が、前記継続時間の期待値の加算によって求められる期待遷移時刻を平均値とする正規分布に従うことを仮定して、前記正規分布を用いた漸化式により求められる、各時刻に、状態から状態遷移が始まる確率に対応する値が、各時刻の前記状態確率として求められる。そして、各状態の状態確率を重みとする前記データの平均値の線形結合により、各時刻にHMMが出力するデータが求められる。In one aspect of the present invention, for each state of the HMM defined by the state transition probability that the state transitions and the probability distribution of the data output by each state, the state outputs data at a predetermined interval of time. Based on the state probability and the average value of the data according to the probability distribution, data at a predetermined interval output by the HMM is obtained and output as time-series data. Specifically, for each state of the HMM, using the state transition probability of self-transition, a value corresponding to the expected value of the number of times that self-transition occurs is obtained as the expected value of the duration for which the self-transition continues, A recurrence formula using the normal distribution, assuming that the transition time of transition from one state to another state follows a normal distribution whose average value is the expected transition time obtained by adding the expected value of the duration. The value corresponding to the probability that the state transition starts from the state at each time is obtained as the state probability at each time. Then, data output by the HMM at each time is obtained by linear combination of the average values of the data weighted by the state probabilities of the respective states.

本発明によれば、滑らかに変化する時系列データを得ることができる。   According to the present invention, it is possible to obtain time-series data that changes smoothly.

以下、図面を参照して、本発明の実施の形態について説明する。   Embodiments of the present invention will be described below with reference to the drawings.

図1は、本発明を適用した音声合成装置の一実施の形態の構成例を示している。   FIG. 1 shows a configuration example of an embodiment of a speech synthesizer to which the present invention is applied.

図1において、音声合成装置は、HMM記憶部1、選択部2、逆フィルタ5、およびベクトル時系列出力部10から構成されている。そして、ベクトル時系列出力部10は、状態確率推定部3とベクトル時系列生成部4とから構成されている。   In FIG. 1, the speech synthesizer includes an HMM storage unit 1, a selection unit 2, an inverse filter 5, and a vector time series output unit 10. The vector time series output unit 10 includes a state probability estimation unit 3 and a vector time series generation unit 4.

HMM記憶部1は、音声合成に用いられる複数のHMMを記憶している。   The HMM storage unit 1 stores a plurality of HMMs used for speech synthesis.

選択部2は、HMM記憶部1に記憶されたHMMの中から、音声合成に用いるHMMを選択し、状態確率推定部3とベクトル時系列生成部4に供給する。   The selection unit 2 selects an HMM used for speech synthesis from the HMMs stored in the HMM storage unit 1 and supplies the selected HMM to the state probability estimation unit 3 and the vector time series generation unit 4.

状態確率推定部3は、選択部2から供給されるHMMの各状態について、所定の間隔の時刻ごとの、状態がベクトルを出力する状態確率を推定し、ベクトル時系列生成部4に供給する。   The state probability estimation unit 3 estimates a state probability that the state outputs a vector for each state of the HMM supplied from the selection unit 2 at a predetermined interval, and supplies the state probability to the vector time series generation unit 4.

ベクトル時系列生成部4は、状態確率推定部3から供給される状態確率と、選択部2から供給されるHMMの状態が出力する代表的なベクトルとに基づいて、所定の間隔の時刻ごとのベクトルを求め、時系列のベクトル(ベクトルの時系列)として出力する。   The vector time series generation unit 4 generates a time interval at a predetermined interval based on the state probability supplied from the state probability estimation unit 3 and the representative vector output from the state of the HMM supplied from the selection unit 2. A vector is obtained and output as a time series vector (vector time series).

逆フィルタ5は、ベクトル時系列生成部4が出力する時系列のベクトルをフィルタリングすることにより、音声信号(合成音)を得て出力する。   The inverse filter 5 obtains and outputs a speech signal (synthetic sound) by filtering the time-series vector output from the vector time-series generation unit 4.

ここで、ベクトル時系列生成部4が出力するベクトルが、例えば、メルケプストラム係数をコンポーネントとする特徴ベクトルである場合には、逆フィルタ5としては、例えば、MLSAフィルタを採用することができる。さらに、ベクトル時系列生成部4が出力するベクトルが、例えば、メルケプストラム係数をコンポーネントとする特徴ベクトルである場合には、HMM記憶部1には、メルケプストラム係数をコンポーネントとする特徴ベクトルを、HMMの学習用の学習データとして用い、例えば、学習データが出力される尤度を最大化する学習の方法であるBaum-Welch 法により学習が行われたHMMが記憶されている。   Here, when the vector output from the vector time series generation unit 4 is, for example, a feature vector having a mel cepstrum coefficient as a component, for example, an MLSA filter can be employed as the inverse filter 5. Further, when the vector output from the vector time series generation unit 4 is, for example, a feature vector having a mel cepstrum coefficient as a component, the HMM storage unit 1 stores a feature vector having a mel cepstrum coefficient as a component in the HMM. For example, an HMM learned by the Baum-Welch method, which is a learning method for maximizing the likelihood that the learning data is output, is stored.

次に、図2は、図1のHMM記憶部1に記憶されているHMMの例を示している。   Next, FIG. 2 shows an example of the HMM stored in the HMM storage unit 1 of FIG.

HMMは、状態遷移確率と出力確率密度関数とをモデルのパラメータ(モデルパラメータ)として定義される確率モデルである。   The HMM is a probability model in which a state transition probability and an output probability density function are defined as model parameters (model parameters).

図2のHMMは、left-to-right型と呼ばれるHMMで、図中○印で示すN+2個の状態S0,S1,・・・,SN-1,SN,SN+1が、左から右方向に並んでいる。状態S0乃至SN+1のうちの、最も左の状態S0は初期状態と呼ばれ、最も右の状態SN+1は終了状態と呼ばれる。図2のleft-to-right型と呼ばれるHMMでは、初期状態S0と終了状態SN+1を除く状態Si(i=1,2,・・・,N)において、自身への状態の遷移(自己遷移)と、自身の右隣への状態の遷移とだけが許されている。ここで、図2では、矢印が状態の遷移を表している。 The HMM in FIG. 2 is an HMM called a left-to-right type, and N + 2 states S 0 , S 1 ,..., S N−1 , S N , S N + indicated by ○ in the figure. 1 are lined up from left to right. State S 0 to one of the S N + 1, the left-most state S 0 is called the initial state, the rightmost state S N + 1 is referred to as the end state. In the HMM called the left-to-right type in FIG. 2, in the state S i (i = 1, 2,..., N) excluding the initial state S 0 and the end state S N + 1 , Only transitions (self-transitions) and state transitions to the right of themselves are allowed. Here, in FIG. 2, an arrow represents a state transition.

また、図2のHMMでは、初期状態S0から、その右隣の状態S1に状態遷移するようになっている。従って、状態S0から状態S1への状態遷移確率a01は、1である。さらに、終了状態SN+1では、状態遷移が生じないようになっている。そして、状態遷移は、初期状態S0から始まって、終了状態SN+1に到達して終了する。 Further, in the HMM of FIG. 2, the state transition is made from the initial state S 0 to the state S 1 on the right side thereof. Therefore, the state transition probability a 01 from the state S 0 to the state S 1 is 1. Further, state transition does not occur in the end state S N + 1 . Then, the state transition starts from the initial state S 0 , reaches the end state S N + 1 and ends.

さらに、図2のHMMでは、初期状態S0と終了状態SN+1を除く状態Si(i=1,2,・・・,N)において、ベクトルxが出力される確率密度(確率分布)を表す出力確率密度関数bi(x)が定義されている。ここでは、出力確率密度関数bi(x)は、例えば、平均ベクトルμi と共分散行列Σi によって定義される正規分布を表す式(4)で与えられることとする。 Further, in the HMM of FIG. 2, the probability density (probability distribution) in which the vector x is output in the states S i (i = 1, 2,..., N) excluding the initial state S 0 and the end state S N + 1. ) Representing the output probability density function b i (x). Here, the output probability density function b i (x) is given by, for example, Expression (4) representing a normal distribution defined by the mean vector μ i and the covariance matrix Σ i .

Figure 0004662139
・・・(4)
Figure 0004662139
... (4)

ここで、式(4)において、Kは、確率変数であるベクトルxの次元数を表し、上付のT は行列の転置を表す。   Here, in Equation (4), K represents the number of dimensions of the vector x that is a random variable, and the superscript T represents the transpose of the matrix.

なお、図2では、自己遷移と、自身の右隣への状態の遷移とだけが許されているHMMを採用することとしたが、その他、さらに、右側の他の状態への遷移も許されているHMMを採用することが可能である。また、left-to-right型でないHMMを採用することも可能である。   In FIG. 2, an HMM that allows only self-transition and state transition to the right side of the self is adopted. However, in addition, transition to another state on the right side is also permitted. It is possible to adopt an HMM. It is also possible to adopt an HMM that is not a left-to-right type.

次に、図3のフローチャートを参照して、図1の音声合成装置の処理について説明する。   Next, processing of the speech synthesizer of FIG. 1 will be described with reference to the flowchart of FIG.

まず最初に、ステップS1において、選択部2は、HMM記憶部1に記憶されたHMMの中から、音声合成に用いるHMMを選択し、状態確率推定部3とベクトル時系列生成部4に供給して、ステップS2に進む。   First, in step S1, the selection unit 2 selects an HMM used for speech synthesis from the HMMs stored in the HMM storage unit 1, and supplies the selected HMM to the state probability estimation unit 3 and the vector time series generation unit 4. Then, the process proceeds to step S2.

ステップS2では、状態確率推定部3は、選択部2から供給されるHMMの各状態について、所定の間隔の時刻ごとの、状態がベクトルを出力する状態確率を推定する状態確率推定処理を行い、その結果得られる状態確率を、ベクトル時系列生成部4に供給して、ステップS3に進む。   In step S2, the state probability estimation unit 3 performs state probability estimation processing for estimating the state probability that the state outputs a vector for each state of the HMM supplied from the selection unit 2, at a predetermined interval time, The state probability obtained as a result is supplied to the vector time series generation unit 4, and the process proceeds to step S3.

ステップS3では、ベクトル時系列生成部4は、状態確率推定部3から供給される状態確率と、選択部2から供給されるHMMの状態が出力する代表的なベクトルとに基づいて、所定の間隔の時刻ごとのベクトルを求めるベクトル時系列生成処理を行い、その結果得られる時系列のベクトル(ベクトルの時系列)を出力して、ステップS4に進む。   In step S3, the vector time series generation unit 4 determines a predetermined interval based on the state probability supplied from the state probability estimation unit 3 and the representative vector output from the state of the HMM supplied from the selection unit 2. Vector time series generation processing for obtaining a vector for each time is performed, a time series vector (vector time series) obtained as a result is output, and the process proceeds to step S4.

ステップS4では、逆フィルタ5が、ベクトル時系列生成部4が出力する時系列のベクトルをフィルタリングすることにより、音声信号を得て出力し、処理を終了する。   In step S4, the inverse filter 5 obtains and outputs an audio signal by filtering the time-series vector output from the vector time-series generation unit 4, and ends the process.

次に、図1の状態確率推定部3が図3のステップS2で行う状態確率推定処理について説明する。   Next, the state probability estimation process performed by the state probability estimation unit 3 in FIG. 1 in step S2 in FIG. 3 will be described.

状態確率推定処理では、HMMの状態確率が推定される。HMMの状態確率とは、HMMの各状態についての、所定の間隔の時刻ごとの、状態がベクトルを出力する確率であり、時刻tにおいて、状態Siがベクトルxを出力する状態確率をPi(t)と表す。 In the state probability estimation process, the state probability of the HMM is estimated. The state probability of the HMM is the probability that the state outputs a vector at each predetermined time interval for each state of the HMM, and the state probability that the state S i outputs the vector x at time t is defined as Pi This is expressed as (t).

状態確率Pi(t)は、時刻tに、ベクトルxを出力する状態Siを確率的に与える。 The state probability P i (t) probabilistically gives a state S i that outputs a vector x at time t.

ここで、上述したように、HMMでは、初期状態S0と終了状態SN+1を除く状態S1乃至SNに出力確率密度関数bi(x)が定義されており、初期状態S0と終了状態SN+1からは、ベクトルが出力されず、他のN個の状態S1乃至SNからベクトルxが出力される可能性がある。 Here, as described above, in the HMM, the output probability density function b i (x) is defined in the states S 1 to S N excluding the initial state S 0 and the end state S N + 1 , and the initial state S 0 From the end state S N + 1 , the vector may not be output, and the vector x may be output from the other N states S 1 to S N.

また、時刻t=0 において初期状態S0 から状態遷移が始まり、その後、適宜、自己遷移をしながら、状態S1, S2, S3,・・・,SNと遷移し、最終時刻t=T+1において状態 SN+1 に到達することとすると、状態S1から状態SNまでの状態遷移においてベクトルxが出力される。つまり、時刻t=1から時刻t=Tまでの、時間幅が1の時間間隔の各時刻tでベクトルxが出力される。時刻t=1から時刻t=Tまでの、時間幅が1の時間間隔の各時刻でベクトルxが出力されることによって得られるベクトルxの時系列の長さはTで表される。この、時系列の長さがTの、ベクトルxの時系列(時系列のベクトルx)を、x1,x2,x3,・・・,xTで表す。 The state transition from the initial state S 0 starts at time t = 0, then, as appropriate, while the self-transition, the state S 1, S 2, S 3 , ···, transitions S N, the last time t Assuming that the state S N + 1 is reached at = T + 1, the vector x is output in the state transition from the state S 1 to the state S N. That is, the vector x is output at each time t in a time interval with a time width of 1 from time t = 1 to time t = T. The length of the time series of the vector x obtained by outputting the vector x at each time interval with a time width of 1 from time t = 1 to time t = T is represented by T. This, of the length of the time series T, when the vector x series (vector x time series), x 1, x 2, x 3, · · ·, represented by x T.

状態確率推定処理では、時系列のベクトルx1,x2,x3,・・・,xTを求めるために必要となるHMMの状態確率Pi(t)を、t=1,2,・・・,Tの各時刻tについて、出力確率密度関数bi(x)が定義されたすべての状態S1,S2,・・・,SNに対して推定する。 In the state probability estimation process, the state probability P i (t) of the HMM necessary for obtaining the time series vectors x 1 , x 2 , x 3 ,..., X T is expressed as t = 1, 2,. ..., T is estimated for all states S 1 , S 2 ,..., S N for which the output probability density function b i (x) is defined.

なお、t=1,2,・・・,Tのうちのいずれかの時刻tでは、HMMのある状態が、ベクトルxtを、必ず出力する。従って、式(5)に示すように、ベクトルxを出力しうる状態S1, S2, S3,・・・,SNのすべてに関して、時刻tにおける状態確率Pi(t)のサメーションをとると1になる。 Incidentally, t = 1,2, ···, in any of the time t of T, then the states of HMM, the vector x t, always output. Thus, summation of the formula as shown in (5), the state S 1 which can output a vector x, S 2, S 3, ···, for all S N, state probability at time t P i (t) Take 1 to get 1.

Figure 0004662139
・・・(5)
Figure 0004662139
... (5)

状態確率Pi(t)は、上述したように、時刻tにおいて、状態Siがベクトルxを出力する確率(状態Siへの状態遷移によって状態Siからベクトルxが出力される確率)であるので、状態確率Pi(t)を求めるにあたり、まず、HMMにおいて、状態Siに留まっている時間(状態Siで自己遷移している時間)を考える。 State probability P i (t), as described above, at time t, with a probability state S i outputs a vector x (a probability that the state vector x from the state S i by the state transition to the S i is output) Therefore, in obtaining the state probability P i (t), first, the time spent in the state S i in the HMM (the time during which self-transition occurs in the state S i ) is considered.

ここで、図4は、図2のleft-to-right型のHMMにおける状態遷移の仕方の例を示している。   Here, FIG. 4 shows an example of a state transition method in the left-to-right type HMM of FIG.

図4では、時刻t=0において、初期状態S0 から状態遷移が始まり、時刻t=1において、状態(初期状態)S0から右隣の状態S1に遷移している。その後、時刻t=2,3,4それぞれにおいて、状態S1から状態S1に遷移(自己遷移)し、時刻t=5において、状態S1から右隣の状態S2に遷移している。さらに、時刻t=6,7それぞれにおいて、状態S2から状態S2に自己遷移し、時刻t=8において、状態S2から右隣の状態S3に遷移している。その後、順次、自己遷移または右隣の状態に遷移し、時刻t=T-2において、状態SN-1から右隣の状態SNに遷移している。そして、時刻t=T-1,Tそれぞれにおいて、状態SNから状態SNに自己遷移し、最終時刻t=T+1において、状態SNから右隣の終了状態SN+1に遷移している。 In FIG. 4, state transition starts from the initial state S 0 at time t = 0, and transitions from the state (initial state) S 0 to the state S 1 on the right side at time t = 1. Thereafter, at time t = 2, 3, 4 respectively, the state transitions from state S 1 to state S 1 (self-transition), and at time t = 5, transition from state S 1 to right adjacent state S 2 occurs. Further, at time t = 6, 7, respectively, to self-transition from the state S 2 to state S 2, at time t = 8, it is transitioning from state S 2 to state S 3 to the right. Thereafter, the state transits sequentially to the self-transition or the state on the right, and at time t = T-2, the state transitions from the state S N-1 to the state S N on the right. Then, at each time t = T−1, T, the state S N self-transitions to the state S N, and at the final time t = T + 1, the state SN transitions to the right adjacent end state S N + 1. ing.

いま、ある時刻tにおいて、状態Si-1から右隣の状態Siに遷移し、その後、自己遷移をn-1回だけ繰り返し、さらにその後に右隣の状態Si+1に遷移した場合、状態Siには、時間nだけ留まる。この、状態Siに留まる時間nを、継続時間(または継続時間長)と呼ぶこととすると、状態Siの継続時間が時間nになる確率は、状態Siから状態Siに自己遷移する確率である状態遷移確率aiiを用いて、式(6)で与えられる。 Now, at a certain time t, when the state S i-1 transits to the right neighboring state S i , then the self-transition is repeated n-1 times, and then the right neighboring state S i + 1 transits , Stays in state S i for time n. This, the time n stay in state S i, when referred to as a duration (or duration), the probability that the duration of the state S i is time n is self-transition to the state S i from the state S i Using the state transition probability a ii that is a probability, it is given by equation (6).

Figure 0004662139
・・・(6)
Figure 0004662139
... (6)

ここで、式(6)において、状態遷移確率aiiは、状態Siから状態Siに自己遷移する確率であるから、1-aiiは、状態Siから他の状態に遷移する確率である。 Here, in Expression (6), since the state transition probability a ii is a probability of self-transition from the state S i to the state S i , 1-a ii is a probability of transition from the state S i to another state. is there.

状態Siの継続時間nの期待値E[n]は、式(6)を用いると、式(7)で表される。 The expected value E [n] of the duration n of the state S i is expressed by equation (7) using equation (6).

Figure 0004662139
・・・(7)
Figure 0004662139
... (7)

式(7)の継続時間nの期待値E[n]は、状態S1,S2,・・・,SNすべてについて求めることができ、いま、状態Siの継続時間nの期待値E[n]を、diと表すこととする。ここで、状態Siの継続時間nの期待値diは、図4に示すように、状態Siにおいて自己遷移が生じる回数(の期待値)に対応する。 The expected value E [n] of the duration n in the equation (7) can be obtained for all the states S 1 , S 2 ,..., S N , and now the expected value E of the duration n of the state S i Let [n] be expressed as d i . Here, the expected value d i of duration n states S i, as shown in FIG. 4, corresponding to the number of times the self-transition occurs (expected value) of the state S i.

状態S1,S2,・・・,SNそれぞれの継続時間の期待値d1,d2,・・・,dNを、式(8)に示すように累積することで、初期状態S0から終了状態SN+1に遷移するまでの全体の継続時間(全体継続時間)Tを求めることができる。 By accumulating the expected values d 1 , d 2 ,..., D N of the durations of the states S 1 , S 2 ,..., S N as shown in the equation (8), the initial state S The total duration T (total duration) T from 0 to the transition to the end state S N + 1 can be obtained.

Figure 0004662139
・・・(8)
Figure 0004662139
... (8)

式(8)で表される全体継続時間Tが、HMMから出力されるベクトル時系列x1,x2,x3,...,xTの長さとなる。 The total duration T expressed by Equation (8) is the length of the vector time series x 1 , x 2 , x 3 ,..., X T output from the HMM.

なお、式(8)の全体継続時間Tは、HMMから出力されるベクトル時系列x1,x2,x3,...,xTの長さ、つまり、ベクトル時系列x1,x2,x3,...,xTにおけるベクトルの個数であり、従って、整数値であるため、全体継続時間Tを求めるのに用いられる式(7)の継続時間の期待値di(=E[n])は、例えば、小数点以下を切り上げるなどして整数化することとする。 Note that the total duration T in Expression (8) is the length of the vector time series x 1 , x 2 , x 3 ,..., X T output from the HMM, that is, the vector time series x 1 , x 2. , x 3 ,..., x T is the number of vectors, and is therefore an integer value, and therefore the expected duration d i (= E of equation (7) used to determine the overall duration T. [n]) is converted to an integer by, for example, rounding up after the decimal point.

HMMにおいて、状態が、式(7)によって求められる状態Siの継続時間の期待値diにしたがって遷移していった場合の、状態の系列(状態遷移系列)において、状態Si-1から右隣の状態Siに遷移する時刻tを、tiと表すことにする。 In the HMM, in the state sequence (state transition sequence) when the state transitions according to the expected value d i of the duration time of the state S i obtained by the equation (7), the state S i-1 The time t at which the transition to the state S i on the right side will be expressed as t i .

ここで、図4では、上述したように、状態S1から右隣の状態S2に遷移する時刻t2が5になっており、状態S2から右隣の状態S3に遷移する時刻t3が8になっている。また、状態SN-1から右隣の状態SNに遷移する時刻tNはT-2になっている。 In FIG. 4, as described above, time t 2 to transition from the state S 1 to state S 2 of the right side are turned 5, the time the transition from state S 2 to state S 3 to the right t 3 becomes 8. In addition, the time t N at which the state S N-1 transits to the state S N on the right is T-2.

なお、図2のHMMでは、状態遷移は、必ず、初期状態S0から状態遷移は始まり、初期状態S0からは、必ず、右隣の状態S1に遷移するから、状態S0から右隣の状態S1に遷移する時刻t1は、必ず1である。 In HMM of FIG. 2, the state transition is always the state transition from the initial state S 0 starts from the initial state S 0, always, because a transition to a state S 1 to the right, right from the state S 0 time t 1 to transition to the state S 1 is always 1.

さらに、図2のHMMでは、状態の遷移は、最後に、状態SNから終了状態SN+1に遷移して終了し、状態SNから終了状態SN+1に遷移する直前の遷移の時刻tは、全体継続時間Tに等しいから、状態SNから右隣の状態SN+1に遷移する時刻tN+1は、必ずT+1である。 Furthermore, in HMM of FIG. 2, the transition state, finally, to finish the transition from the state S N to the end state S N + 1, the state S N transition prior to the transition to the end state S N + 1 time t, equal to the entire duration T, the time t N + 1 that the transition from state S N to the state S N + 1 to the right is always T + 1.

以上のように、初期状態S0から状態S1に遷移する時刻t1は必ず1であり、さらに、
状態SNから終了状態SN+1に遷移する時刻tN+1は必ずT+1である。また、状態Siの継続時間の期待値diは、式(7)で求めることができる。
As described above, the time t 1 a transition from the initial state S 0 to state S 1 is always 1, further
Time t N + 1 to transition from the state S N to the end state S N + 1 is always T + 1. Also, the expected value d i of the duration of the state S i may be calculated by Equation (7).

従って、初期状態S0から状態S1に遷移する時刻t1(=1)を初期値とし、ある状態Si-1から他の状態Siに遷移する時刻tiに対して、状態Siの継続時間の期待値diを加算することにより、状態遷移が初期状態S0から始まって終了状態SN+1で終了する状態遷移系列において、状態Siから他の状態Si+1に遷移する時刻ti+1を求めることができる。 Therefore, the time t 1 (= 1) at which the state transitions from the initial state S 0 to the state S 1 is set as the initial value, and the state S i with respect to the time t i at which the transition from the certain state S i-1 to the other state S i is performed. by adding the expected value d i of the duration of, in the state transition sequence of a state transition ends at end state S N + 1, starting from the initial state S 0, the state S i to another state S i + 1 The transition time t i + 1 can be obtained.

ここで、以下、適宜、状態Si-1から他の状態(右隣の状態)Siに遷移する時刻tを、遷移時刻tといい、上述のように、状態Siの継続時間の期待値diを用いた加算を行うことにより求められる遷移時刻tiを、期待遷移時刻tiという。 Here, hereinafter, the time t at which the state S i-1 transits to another state (right adjacent state) S i will be referred to as a transition time t, and the duration of the state S i is expected as described above. The transition time t i obtained by performing addition using the value d i is referred to as an expected transition time t i .

いま、遷移時刻tが、所定の確率分布にしたがうとし、その所定の確率分布として、例えば、正規分布(ガウシアン)を仮定すると、状態Si-1から他の状態Siに遷移する遷移時刻tの確率密度(確率分布)を表す確率密度関数qi(t)は、式(9)で与えられる。 Now, assuming that the transition time t follows a predetermined probability distribution and, for example, a normal distribution (Gaussian) is assumed as the predetermined probability distribution, the transition time for transition from the state S i-1 to another state S i A probability density function q i (t) representing the probability density (probability distribution) of t is given by equation (9).

Figure 0004662139
・・・(9)
Figure 0004662139
... (9)

式(9)の確率密度関数qi(t)によれば、図5に示すように、状態Si-1から他の状態Siに遷移する遷移時刻tは、平均値が期待遷移時刻tiで、分散がσ2の正規分布にしたがう。また、式(9)の確率密度関数qi(t)によれば、分散σ2が非常に小さいと、状態Siに遷移する遷移時刻tが確定的な値tiになり、分散σ2が大きくなるにしたがって、状態Siに遷移する遷移時刻tが確率的な値になる。 According to the probability density function q i (t) of equation (9), as shown in FIG. 5, the transition time t from the state S i-1 to another state S i has an average value of the expected transition time t. i follows a normal distribution with variance σ 2 . Further, according to the probability density function q i (t) of the equation (9), when the variance σ 2 is very small, the transition time t at which the transition to the state S i becomes a definite value t i , and the variance σ 2 As becomes larger, the transition time t for transitioning to the state S i becomes a stochastic value.

ここで、以下、適宜、式(9)の確率密度関数(によって与えられる確率)qi(t)を、前向き遷移確率と呼ぶこととする。 Here, hereinafter, the probability density function (probability given by) q i (t) of Equation (9) will be referred to as a forward transition probability as appropriate.

図6は、前向き遷移確率qi(t)とHMMの状態との関係を示している。 FIG. 6 shows the relationship between the forward transition probability q i (t) and the state of the HMM.

前向き遷移確率qi(t)は、時刻tにおいて、状態Si-1から他の状態Siに遷移する遷移確率を与える。同様に、前向き遷移確率qi+1(t)は、時刻tにおいて、状態Siから他の状態Si+1に遷移する遷移確率を与える。 Forward transition probability q i (t) at time t, gives the transition probability of transition from state S i-1 to another state S i. Similarly, the forward transition probability q i + 1 (t) gives the transition probability of transition from state S i to another state S i + 1 at time t.

さらに、時刻tにおいて、状態Siで自己遷移をする確率は、前向き遷移確率qi+1(t)を用いた式1-qi+1(t)で与えられる。 Further, the probability of self-transition in state S i at time t is given by Equation 1-q i + 1 (t) using the forward transition probability q i + 1 (t).

一方、以上の式(9)の前向き遷移確率qi(t)を求めた場合と同様に、状態遷移が終了状態SN+1から始まって初期状態S0で終了する状態遷移系列を考えると、その状態遷移系列については、状態Si+1から他の状態Siに遡って遷移する時刻tを求めることができる。この、状態Si+1から他の状態Siに遡って遷移する時刻tは、終了状態SN+1から状態SNに遡って遷移する時刻tN'(=T)を初期値とし、ある状態Si+2から他の状態Si+1に遡って遷移する時刻ti+1'に対して、状態Siの継続時間の期待値diを加算することにより求めることができる。 On the other hand, as in the case of obtaining the forward transition probability q i (t) in the above equation (9), consider a state transition sequence starting from the end state S N + 1 and ending at the initial state S 0. With respect to the state transition sequence, it is possible to obtain a time t at which the state S i + 1 makes a transition back to another state S i . The time t a transition back from the state S i + 1 to another state S i, the time t N to transition back from the end state S N + 1 to the state S N 'a (= T) as an initial value, It can be obtained by adding the expected value d i of the duration of the state S i to the time t i + 1 ′, which transitions from one state S i + 2 back to the other state S i + 1 .

ここで、以下、適宜、状態Si+1から他の状態(左隣の状態)Siに遡って遷移する時刻tを、逆遷移時刻tといいい、上述のように、状態Siの継続時間の期待値diを用いた加算を行うことにより求められる逆遷移時刻ti'を、逆期待遷移時刻ti'という。 Here, hereinafter, the time t at which the state S i + 1 transits from the state S i + 1 to the other state (the adjacent state on the left) S i is referred to as a reverse transition time t. As described above, the state S i is continued. The reverse transition time t i ′ obtained by performing addition using the expected value d i of time is referred to as the reverse expected transition time t i ′.

いま、逆遷移時刻tが、遷移時刻tと同様に、所定の確率分布にしたがうとし、その所定の確率分布として、例えば、正規分布を仮定すると、状態Si+1から他の状態Siに遷移する逆遷移時刻tの確率密度を表す確率密度関数ri(t)は、式(9)と同様の式(10)で与えられる。 Assuming that the reverse transition time t follows a predetermined probability distribution in the same manner as the transition time t, assuming that a normal distribution is assumed as the predetermined probability distribution, for example, from the state S i + 1 to another state S i The probability density function r i (t) representing the probability density at the reverse transition time t when transitioning to is given by Expression (10) similar to Expression (9).

Figure 0004662139
・・・(10)
Figure 0004662139
... (10)

式(10)の確率密度関数ri(t)によれば、図5に示した確率密度関数(前向き遷移確率)qi(t)と同様に、状態Si+1から他の状態Siに遡って逆遷移する逆遷移時刻tは、平均値が逆期待遷移時刻ti'で、分散がσ'2の正規分布にしたがう。また、式(10)の確率密度関数ri(t)によれば、分散σ'2が非常に小さいと、状態Siに遷移する遷移時刻tが確定的な値tiになり、分散σ'2が大きくなるにしたがって、状態Siに遷移する逆遷移時刻tが確率的な値になる。 According to the probability density function r i (t) of formula (10), the probability density function (forward transition probability) shown in FIG. 5 q i in the same manner as in (t), the state S i + 1 from the other states S i The reverse transition time t that makes a reverse transition retroactively follows a normal distribution in which the average value is the reverse expected transition time t i ′ and the variance is σ ′ 2 . Further, according to the probability density function r i (t) of the equation (10), when the variance σ ′ 2 is very small, the transition time t at which the transition to the state S i becomes a definite value t i , and the variance σ 'As 2 increases, the reverse transition time t for transitioning to the state S i becomes a stochastic value.

ここで、以下、適宜、式(10)の確率密度関数(によって与えられる確率)ri(t)を、後ろ向き遷移確率と呼ぶこととする。 Here, hereinafter, the probability density function (probability given by) r i (t) in Expression (10) will be referred to as a backward transition probability.

図7は、後ろ向き遷移確率ri(t)とHMMの状態との関係を示している。 FIG. 7 shows the relationship between the backward transition probability r i (t) and the state of the HMM.

なお、図7では、後ろ向きの状態遷移(状態を遡る遷移)を表すために、状態遷移を表す矢印の向きを、図6とは逆向きに図示してある。   In FIG. 7, in order to represent a backward state transition (transition going back in the state), the direction of an arrow representing the state transition is illustrated in the reverse direction to FIG.

後ろ向き遷移確率ri(t)は、時刻tにおいて、状態Si+1から他の状態Siに遡って遷移する遷移確率を与える。同様に、後ろ向き遷移確率ri-1(t)は、時刻tにおいて、状態Siから他の状態Si-1に遡って遷移する遷移確率を与える。 The backward transition probability r i (t) gives a transition probability that makes a transition from the state S i + 1 to another state S i at time t. Similarly, the backward transition probability r i-1 (t) gives the transition probability of transitioning back from the state S i to another state S i-1 at time t.

さらに、時刻tにおいて、状態Siで自己遷移をする確率は、後ろ向き遷移確率ri-1(t)を用いた式1-ri-1(t)で与えられる。 Further, at time t, the probability of self-transitions in the state S i is given by the formula 1-r i-1 (t ) with backward transition probability r i-1 (t).

次に、状態遷移が初期状態S0から始まって終了状態SN+1で終了する状態遷移系列について、時刻t=0において、状態Siから遷移が始まる確率を、Pfi(0)と表すこととすると、図2のHMMでは、時刻t=0に初期状態S0から必ず遷移が始まるので、時刻t=0において、状態S0から遷移が始まる確率Pf0(0)は、式(11)に示すように1となる。 Next, for the state transition sequence in which the state transition starts from the initial state S 0 and ends at the end state S N + 1 , the probability that the transition starts from the state S i at time t = 0 is expressed as Pf i (0). Therefore, in the HMM of FIG. 2, since the transition always starts from the initial state S 0 at the time t = 0, the probability Pf 0 (0) that the transition starts from the state S 0 at the time t = 0 is expressed by the equation (11). ) Is 1 as shown.

Figure 0004662139
・・・(11)
Figure 0004662139
(11)

また、時刻t=0において、状態S0から必ず遷移が始まるということは、時刻t=0において、状態S0以外の状態S1,S2,・・・,SN,SN+1から遷移が始まることはあり得ないので、時刻t=0において、状態S0以外の状態Siから遷移が始まる確率Pfi(0)は、式(12)に示すように0となる。 In addition, the transition always starts from the state S 0 at time t = 0 means that the state S 1 , S 2 ,..., S N , S N + 1 other than the state S 0 at time t = 0. because there can be no possible transition begins at time t = 0, a probability transition from the state S i of the other state S 0 begins Pf i (0) becomes 0 as shown in equation (12).

Figure 0004662139
・・・(12)
Figure 0004662139
(12)

図2のleft-to-right型のHMMについては、時刻tに状態Siに存在する(いる)確率Pfi(t)、つまり、時刻tにおいて、状態Siから遷移が始まる確率Pfi(t)は、式(11)の確率Pf0(0)と、式(12)の確率Pfi(0)とを初期値とする、式(9)の前向き遷移確率qi(t)を用いた、式(13)の漸化式を用いて計算することができる。 For left-to-right type HMM in FIG 2, present in the state S i at time t (are) probability Pf i (t), i.e., at time t, the probability transition from the state S i starts Pf i ( t) uses the forward transition probability q i (t) of equation (9), with initial values of the probability Pf 0 (0) of equation (11) and the probability Pf i (0) of equation (12). It can be calculated using the recurrence formula of equation (13).

Figure 0004662139
・・・(13)
Figure 0004662139
... (13)

ここで、式(13)の右辺の第1項Pfi-1(t-1)qi(t)は、時刻t-1に状態Si-1にいて、次の時刻tに状態Siに遷移する確率を表す。また、式(13)の右辺の第2項Pfi(t-1)(1-qi+1(t)は、時刻t-1に状態Siにいて、次に時刻tに状態Siに自己遷移する確率を表す。 Here, equation the first term Pf i-1 (t-1) qi (t) on the right side of (13), the time t-1 to the state S i-1 Niite, the state S i to the next time t Represents the probability of transition. Further, equation (13) second term Pf i of the right side of the (t-1) (1- q i + 1 (t) , the time t-1 to the state S i Niite, then the time t to the state S i Represents the probability of self-transition.

なお、時刻t=0以外の時刻では、初期状態S0から遷移が始まることはあり得ないため、時刻t=0以外の時刻において、初期状態S0から遷移が始まる確率Pf0(t)は、式(14)に示すように0である。 Since the transition cannot start from the initial state S 0 at a time other than time t = 0, the probability Pf 0 (t) that the transition starts from the initial state S 0 at a time other than time t = 0 is , 0 as shown in equation (14).

Figure 0004662139
・・・(14)
Figure 0004662139
(14)

以下、適宜、以上のようにして求められる、時刻tにおいて、状態Siから遷移が始まる確率Pfi(t)を、前向き状態確率Pfi(t)と呼ぶ。 Hereinafter, as appropriate, determined as described above, at time t, the probability transition from the state S i starts Pf i (t), referred to as a forward state probability Pf i (t).

ここで、図8は、前向き状態確率Pfi(t)を模式的に示した表である。 Here, FIG. 8 is a table schematically showing the forward state probability Pf i (t).

図8の表において、横軸は状態Siを表し、縦軸は時刻tを表している。そして、横軸のある状態Siの列と、縦軸のある時刻tの行とが交差する欄に、時刻tにおいて、状態Siから遷移が始まる前向き状態確率Pfi(t)が記述されている。 In the table of FIG. 8, the horizontal axis represents the state S i, the vertical axis represents the time t. Then, in the column where the column of the state S i with the horizontal axis and the row of the time t with the vertical axis intersect, the forward state probability Pf i (t) at which the transition starts from the state S i at the time t is described. ing.

図8の表の欄のうちの、時刻tが0の欄は、式(11)および式(12)にしたがって記述されていき、状態Siが初期状態S0の欄は、式(11)および式(14)にしたがって記述されていく。そして、以下、他の欄には、式(13)の漸化式を計算することにより得られる前向き状態確率Pfi(t)が順次記述されていく。 Of the columns in the table of FIG. 8, the column where the time t is 0 is described according to the equations (11) and (12), and the column where the state S i is the initial state S 0 is the equation (11). And is described according to equation (14). In the following sections, forward state probabilities Pf i (t) obtained by calculating the recurrence formula of Expression (13) are sequentially described.

次に、時刻tにおいて、状態Siから遷移が始まる確率は、状態遷移が、終了状態SN+1から始まって初期状態S0で終了する状態遷移系列についても考えることができる。 Next, the probability that the transition starts from the state S i at time t can be considered for a state transition sequence in which the state transition starts from the end state S N + 1 and ends in the initial state S 0 .

そこで、いま、時刻t=T+1において、状態Siから遡る遷移(後ろ向きの遷移)が始まる確率を、Pbi(T+1)と表すこととすると、図2のHMMでは、時刻t=T+1に最終状態SN+1から必ず後ろ向きの遷移が始まるので、時刻t=T+1において、状態SN+1から後ろ向きの遷移が始まる確率PbN+1(T+1)は、式(15)に示すように1となる。 Therefore, if the probability that a transition (backward transition) starting from the state S i starts at time t = T + 1 is represented as Pb i (T + 1), in the HMM of FIG. Since a backward transition always starts from the final state S N + 1 at T + 1, the probability Pb N + 1 (T + 1) of starting a backward transition from the state S N + 1 at time t = T + 1 is It becomes 1 as shown in Expression (15).

Figure 0004662139
・・・(15)
Figure 0004662139
... (15)

また、時刻t=T+1において、状態SN+1から必ず後ろ向きの遷移が始まるということは、時刻t=T+1において、状態SN+1以外の状態SN,SN-1,・・・,S1,S0から遷移が始まることはあり得ないので、時刻t=T+1において、状態SN+1以外の状態Siから遷移が始まる確率Pbi(T+1)は、式(16)に示すように0となる。 In addition, at time t = T + 1, the backward transition always starts from state S N + 1, which means that at time t = T + 1, states S N , S N−1 , other than state S N + 1 ..., since transition cannot start from S 1 , S 0 , probability Pb i (T + 1) that transition starts from state S i other than state S N + 1 at time t = T + 1 Becomes 0 as shown in Expression (16).

Figure 0004662139
・・・(16)
Figure 0004662139
... (16)

図2のleft-to-right型のHMMについては、時刻tに状態Siに存在する(いる)確率Pbi(t)、つまり、時刻tにおいて、状態Siから後ろ向きの遷移が始まる確率Pbi(t)は、式(15)の確率PbN+1(T+1)と、式(16)の確率Pbi(T+1)とを初期値とする、式(10)の後ろ向き遷移確率ri(t)を用いた、式(17)の漸化式を用いて計算することができる。 For left-to-right type HMM in FIG 2, present in the state S i at time t (have) a probability Pb i (t), i.e., at time t, the probability transition backward from the state S i starts Pb i (t) is a backward transition of the equation (10) in which the probability Pb N + 1 (T + 1) of the equation (15) and the probability Pb i (T + 1) of the equation (16) are initial values. It is possible to calculate using the recurrence formula of Expression (17) using the probability r i (t).

Figure 0004662139
・・・(17)
Figure 0004662139
... (17)

なお、時刻t=T+1以外の時刻では、終了状態SN+1から後ろ向きの遷移が始まることはあり得ないため、時刻t=T+1以外の時刻において、終了状態SN+1から遷移が始まる確率PbN+1(t)は、式(18)に示すように0である。 At times other than time t = T + 1, a backward transition cannot start from the end state S N + 1. Therefore, at times other than time t = T + 1, the end state S N + 1 The probability Pb N + 1 (t) at which the transition starts is 0 as shown in Expression (18).

Figure 0004662139
・・・(18)
Figure 0004662139
... (18)

以下、適宜、以上のようにして求められる、時刻tにおいて、状態Siから後ろ向きの遷移が始まる確率Pbi(t)を、後ろ向き状態確率Pbi(t)と呼ぶ。 Hereinafter, the probability Pb i (t) of the backward transition starting from the state S i at time t, which is obtained as described above, is referred to as the backward state probability Pb i (t).

ここで、図9は、後ろ向き状態確率Pbi(t)を模式的に示した表である。 Here, FIG. 9 is a table schematically showing the backward state probability Pb i (t).

図9の表において、横軸は状態Siを表し、縦軸は時刻tを表している。そして、横軸のある状態Siの列と、縦軸のある時刻tの行とが交差する欄に、時刻tにおいて、状態Siから後ろ向き遷移が始まる後ろ向き状態確率Pbi(t)が記述されている。 In the table of FIG. 9, the horizontal axis represents the state S i, the vertical axis represents the time t. Then, in the column where the column of the state S i with the horizontal axis and the row of the time t with the vertical axis intersect, the backward state probability Pb i (t) at which the backward transition starts from the state S i at time t is described Has been.

図9の表の欄のうちの、時刻tがT+1の欄は、式(15)および式(16)にしたがって記述されていき、状態Siが終了状態SN+1の欄は、式(15)および式(18)にしたがって記述されていく。そして、以下、他の欄には、式(17)の漸化式を計算することにより得られる後ろ向き状態確率Pbi(t)が順次記述されていく。 Of the columns in the table of FIG. 9, the column where the time t is T + 1 is described according to the equations (15) and (16), and the column where the state S i is the end state S N + 1 is The description is made according to the equations (15) and (18). In the following, the backward state probability Pb i (t) obtained by calculating the recurrence formula of Expression (17) is sequentially described in the other columns.

式(13)の前向き状態確率Pfi(t)は、状態遷移が初期状態S0から始まって終了状態SN+1で終了する状態遷移系列について、時刻tにおいて、状態Siから遷移が始まる確率であり、式(17)の後ろ向き状態確率Pbi(t)は、状態遷移が終了状態SN+1から始まって初期状態S0で終了する状態遷移系列について、時刻tにおいて、状態Siから遷移が始まる確率であるから、これらの前向き状態確率Pfi(t)と、後ろ向き状態確率Pbi(t)を掛け合わせることにより、時刻tに状態Siに存在する(居る)確率、つまり、状態Siがベクトルxを出力する状態確率(ベクトルxを出力する状態が状態Siである確率)Pi(t)を求めることができる。 Wherein forward state probability Pf i (t) of (13), the state transition sequence of a state transition ends at end state S N + 1, starting from the initial state S 0, at time t, the transition begins from the state S i The backward state probability Pb i (t) of equation (17) is the state S i at time t for a state transition sequence starting from the end state S N + 1 and ending at the initial state S 0. The probability that a transition will start from is multiplied by these forward state probabilities Pf i (t) and backward state probabilities Pb i (t), that is, the probability of being in state S i at time t, that is, , the state S i can be obtained state probability of outputting the vector x (probability state for a vector x is the state S i) P i (t) .

そこで、状態確率Pi(t)を、式(19)で定義することとする。 Therefore, state probability P i (t) is defined by equation (19).

Figure 0004662139
・・・(19)
Figure 0004662139
... (19)

なお、式(19)の状態確率Pi(t)は、前向き状態確率Pfi(t)と、後ろ向き状態確率Pbi(t)との乗算値を、その乗算値の、状態S1乃至SNについてのサメーション(Σ)で正規化しているので、上述の式(5)を満たす。 The state probability P i (t) in the equation (19) is obtained by multiplying the forward state probability Pf i (t) and the backward state probability Pb i (t) by the state S 1 to S of the multiplication value. Since normalization is performed by the summation (Σ) for N , the above equation (5) is satisfied.

式(19)の状態確率Pi(t)は、出力確率密度関数bi(x)が定義されたすべての状態S1,S2,・・・,SNについて、状態遷移時に何らかのベクトルが出力される各時刻t=1,2,・・・,Tごとに計算することができる。 The state probability P i (t) in the equation (19) indicates that any vector at the time of state transition is present for all the states S 1 , S 2 ,..., S N for which the output probability density function b i (x) is defined. It can be calculated for each output time t = 1, 2,.

ここで、図10は、状態確率Pi(t)を模式的に示した表である。 Here, FIG. 10 is a table schematically showing the state probability P i (t).

図10の表において、横軸は状態Siを表し、縦軸は時刻tを表している。そして、横軸のある状態Siの列と、縦軸のある時刻tの行とが交差する欄に、時刻tにおいて、状態Siからベクトルが出力される確率である状態確率Pi(t)が記述されている。 In the table of FIG. 10, the horizontal axis represents the state S i, the vertical axis represents the time t. Then, a sequence of states S i with a horizontal axis, in the column and row of the time t with a vertical axis intersect at time t, state probability is the probability that the vector is output from the state S i P i (t ) Is described.

図10の表の各欄には、図8の表の前向き状態確率Pfi(t)と、図9の表の後ろ向き状態確率Pbi(t)とを用いて、式(19)を計算することにより得られる状態確率Pi(t)が記述される。 In each column of the table of FIG. 10, the formula (19) is calculated using the forward state probability Pf i (t) of the table of FIG. 8 and the backward state probability Pb i (t) of the table of FIG. State probability P i (t) obtained by this is described.

次に、図11は、以上のようにして状態確率Pi(t)を推定する状態確率推定処理を行う図1の状態確率推定部3の構成例を示している。 Next, FIG. 11 shows a configuration example of the state probability estimation unit 3 of FIG. 1 that performs the state probability estimation process for estimating the state probability P i (t) as described above.

状態確率推定部3は、継続時間長算出部21、期待遷移時刻算出部22、前向き遷移確率決定部23Fおよび後ろ向き遷移確率決定部23B、前向き状態確率算出部24Fおよび後ろ向き状態確率算出部24B、並びに状態確率算出部25から構成されている。   The state probability estimator 3 includes a duration length calculator 21, an expected transition time calculator 22, a forward transition probability determiner 23F and a backward transition probability determiner 23B, a forward state probability calculator 24F and a backward state probability calculator 24B, and The state probability calculation unit 25 is configured.

継続時間長算出部21には、選択部2(図1)からHMM(の状態遷移確率aij)が供給される。 The duration time calculation unit 21 is supplied with the HMM (the state transition probability a ij ) from the selection unit 2 (FIG. 1).

継続時間長算出部21は、選択部2から供給されるHMMの状態遷移確率aijを用いて、式(7)で表される状態Siの継続時間nの期待値di(=E[n])を、状態S1,S2,・・・,SNすべてについて算出し、期待遷移時刻算出部22に供給する。 Duration calculator 21 uses the state transition probability a ij of the HMM supplied from the selection unit 2, the expected value of the duration n of states S i represented by the formula (7) d i (= E [ n]) are calculated for all the states S 1 , S 2 ,..., S N and supplied to the expected transition time calculation unit 22.

さらに、継続時間長算出部21は、状態S1,S2,・・・,SNそれぞれの継続時間の期待値d1,d2,・・・,dNを用いて、式(8)の全体継続時間Tを求める。そして、継続時間長算出部21は、全体継続時間Tを必要なブロックに供給する。 Furthermore, duration calculator 21, the state S 1, S 2, · · ·, the expected value of S N respective durations d 1, d 2, · · ·, with d N, equation (8) Determine the total duration T of. Then, the duration time calculator 21 supplies the total duration T to the necessary blocks.

期待遷移時刻算出部22は、継続時間長算出部21から供給される、状態S1,S2,・・・,SNそれぞれの継続時間の期待値d1,d2,・・・,dNを用いて、期待遷移時刻tiと、逆期待遷移時刻ti'とを求め、期待遷移時刻tiを、前向き遷移確率決定部23Fに供給するとともに、逆期待遷移時刻ti'を、後ろ向き遷移確率決定部23Bに供給する。 Expected transition time calculation unit 22 is supplied from the duration calculator 21, the state S 1, S 2, ···, S N expected values d 1 of each duration, d 2, · · ·, d N is used to obtain an expected transition time t i and a reverse expected transition time t i ′, supply the expected transition time t i to the forward transition probability determination unit 23F, and the reverse expected transition time t i ′ This is supplied to the backward transition probability determination unit 23B.

前向き遷移確率決定部23Fは、期待遷移時刻算出部22から供給される期待遷移時刻tiを用い、式(9)の前向き遷移確率qi(t)を求め、前向き状態確率算出部24Fに供給する。なお、式(9)の前向き遷移確率qi(t)の分散σ2としては、例えば、あらかじめ定められた固定値を採用することもできるし、後述するようにして求められる値を採用することもできる。 The forward transition probability determination unit 23F uses the expected transition time t i supplied from the expected transition time calculation unit 22 to obtain the forward transition probability q i (t) of Expression (9) and supplies it to the forward state probability calculation unit 24F. To do. As the variance σ 2 of the forward transition probability q i (t) in equation (9), for example, a predetermined fixed value can be adopted, or a value obtained as described later can be adopted. You can also.

後ろ向き遷移確率決定部23Bは、期待遷移時刻算出部22から供給される逆期待遷移時刻ti'を用い、式(10)の後ろ向き遷移確率ri(t)を求め、後ろ向き状態確率算出部24Bに供給する。なお、式(10)の後ろ向き遷移確率ri(t)の分散σ'2としては、例えば、あらかじめ定められた固定値を採用することもできるし、後述するようにして求められる値を採用することもできる。 The backward transition probability determination unit 23B uses the reverse expected transition time t i ′ supplied from the expected transition time calculation unit 22 to obtain the backward transition probability r i (t) of Expression (10), and the backward state probability calculation unit 24B. To supply. As the variance σ ′ 2 of the backward transition probability r i (t) in equation (10), for example, a predetermined fixed value can be adopted, or a value obtained as described later is adopted. You can also.

前向き状態確率算出部24Fは、前向き遷移確率決定部23Fから供給される式(9)の前向き遷移確率qi(t)を用いて、式(13)の漸化式を計算することにより前向き状態確率Pfi(t)を求め、状態確率算出部25に供給する。 The forward state probability calculation unit 24F uses the forward transition probability q i (t) of Equation (9) supplied from the forward transition probability determination unit 23F to calculate the recurrence formula of Equation (13), thereby The probability Pf i (t) is obtained and supplied to the state probability calculation unit 25.

後ろ向き状態確率算出部24Bは、後ろ向き遷移確率決定部23Bから供給される式(10)の後ろ向き遷移確率ri(t)を用いて、式(17)の漸化式を計算することにより後ろ向き状態確率Pbi(t)を求め、状態確率算出部25に供給する。 The backward state probability calculation unit 24B calculates the recurrence formula of the equation (17) by using the backward transition probability r i (t) of the equation (10) supplied from the backward transition probability determination unit 23B. The probability Pb i (t) is obtained and supplied to the state probability calculation unit 25.

状態確率算出部25は、前向き状態確率算出部24Fから供給される前向き状態確率Pfi(t)と、後ろ向き状態確率算出部24Bから供給される後ろ向き状態確率Pbi(t)とを用いて、式(19)の状態確率Pi(t)を求め、後段のベクトル時系列生成部4(図1)に供給する。 The state probability calculation unit 25 uses the forward state probability Pf i (t) supplied from the forward state probability calculation unit 24F and the backward state probability Pb i (t) supplied from the backward state probability calculation unit 24B. The state probability P i (t) of Expression (19) is obtained and supplied to the vector time series generation unit 4 (FIG. 1) at the subsequent stage.

次に、図12のフローチャートを参照して、図11の状態確率推定部3が図3のステップS2で行う状態確率推定処理について説明する。   Next, the state probability estimation process performed by the state probability estimation unit 3 of FIG. 11 in step S2 of FIG. 3 will be described with reference to the flowchart of FIG.

継続時間長算出部21は、選択部2(図1)からHMMの供給を受け、ステップS21において、選択部2からのHMMの状態遷移確率aijを用いて、式(7)で表されるHMMの各状態Siの継続時間nの期待値di(=E[n])を算出し、期待遷移時刻算出部22に供給して、ステップS22に進む。 The duration time calculation unit 21 receives the supply of the HMM from the selection unit 2 (FIG. 1), and is expressed by Equation (7) using the state transition probability a ij of the HMM from the selection unit 2 in step S21. The expected value d i (= E [n]) of the duration n of each state S i of the HMM is calculated and supplied to the expected transition time calculation unit 22, and the process proceeds to step S22.

ステップS22では、期待遷移時刻算出部22は、継続時間長算出部21からの継続時間の期待値d1,d2,・・・,dNを用いて、期待遷移時刻tiと、逆期待遷移時刻ti'とを求め、期待遷移時刻tiを、前向き遷移確率決定部23Fに供給するとともに、逆期待遷移時刻ti'を、後ろ向き遷移確率決定部23Bに供給して、ステップS23に進む。 In step S22, the expected transition time calculation unit 22 uses the expected duration values d 1 , d 2 ,..., D N from the duration length calculation unit 21 and the expected transition time t i and the reverse expectation. The transition time t i ′ is obtained, and the expected transition time t i is supplied to the forward transition probability determining unit 23F, and the reverse expected transition time t i ′ is supplied to the backward transition probability determining unit 23B, and the process goes to step S23. move on.

ステップS23では、前向き遷移確率決定部23Fが、期待遷移時刻算出部22からの期待遷移時刻tiを用い、式(9)の前向き遷移確率qi(t)を求め、前向き状態確率算出部24Fに供給するとともに、後ろ向き遷移確率決定部23Bが、期待遷移時刻算出部22からの逆期待遷移時刻ti'を用い、式(10)の後ろ向き遷移確率ri(t)を求め、後ろ向き状態確率算出部24Bに供給して、ステップS24に進む。 In step S23, the forward transition probability determining unit 23F uses the expected transition time t i from the expected transition time calculating unit 22 to obtain the forward transition probability q i (t) of Equation (9), and the forward state probability calculating unit 24F. , The backward transition probability determination unit 23B obtains the backward transition probability r i (t) of Equation (10) using the reverse expected transition time t i ′ from the expected transition time calculation unit 22, and the backward state probability The calculation unit 24B is supplied and the process proceeds to step S24.

ステップS24では、前向き状態確率算出部24Fが、前向き遷移確率決定部23Fからの前向き遷移確率qi(t)を用い、式(13)の前向き状態確率Pfi(t)を求めて、状態確率算出部25に供給するとともに、後ろ向き状態確率算出部24Bが、後ろ向き遷移確率決定部23Bからの後ろ向き遷移確率ri(t)を用いて、式(17)の後ろ向き状態確率Pbi(t)を求めて、状態確率算出部25に供給して、ステップS25に進む。 In step S24, the forward state probability calculation unit 24F uses the forward transition probability q i (t) from the forward transition probability determination unit 23F to obtain the forward state probability Pf i (t) of Expression (13), and the state probability The backward state probability calculation unit 24B supplies the backward state probability Pb i (t) of Expression (17) using the backward transition probability r i (t) from the backward transition probability determination unit 23B. It is obtained and supplied to the state probability calculation unit 25, and the process proceeds to step S25.

ステップS25では、状態確率算出部25が、前向き状態確率算出部24Fからの前向き状態確率Pfi(t)と、後ろ向き状態確率算出部24Bからの後ろ向き状態確率Pbi(t)とを用いて、式(19)の状態確率Pi(t)を求め、後段のベクトル時系列生成部4(図1)に供給して、状態確率推定処理を終了する。 In step S25, the state probability calculation unit 25 uses the forward state probability Pf i (t) from the forward state probability calculation unit 24F and the backward state probability Pb i (t) from the backward state probability calculation unit 24B. The state probability P i (t) of Equation (19) is obtained and supplied to the subsequent vector time series generation unit 4 (FIG. 1), and the state probability estimation process is terminated.

次に、図1のベクトル時系列生成部4が図3のステップS3で行うベクトル時系列生成処理について説明する。   Next, the vector time series generation process performed by the vector time series generation unit 4 of FIG. 1 in step S3 of FIG. 3 will be described.

ベクトル時系列生成処理では、状態確率推定部3で得られる状態確率Pi(t)と、HMMの状態Siに定義されている出力確率密度関数bi(x)に基づき、ベクトル時系列 x1,x2,x3,・・・,xTが生成される。 In the vector time series generation process, based on the state probability P i (t) obtained by the state probability estimation unit 3 and the output probability density function b i (x) defined in the state S i of the HMM, the vector time series x 1 , x 2 , x 3 ,..., X T are generated.

いま、HMMから時刻tにベクトルxが出力(観測)される確率分布(確率密度)を表す確率密度関数を、Ft(x)と表すこととする。 Now, a probability density function representing a probability distribution (probability density) in which a vector x is output (observed) at time t from the HMM is represented as F t (x).

状態確率Pi(t)は、時刻tに、状態Siから何らかのベクトルが出力される確率であり、出力確率密度関数bi(x)は、状態Siからベクトルxが出力される確率密度であるから、時刻tにおいて、HMMからベクトルxが出力される確率密度、即ち、HMMのいずれかの状態Siからベクトルxが出力される確率密度を表す確率密度関数Ft(x)は、式(20)で与えられる。 The state probability P i (t) is the probability that some vector is output from the state S i at time t, and the output probability density function b i (x) is the probability density that the vector x is output from the state S i. Therefore, the probability density function F t (x) representing the probability density at which the vector x is output from the HMM at time t, that is, the probability density at which the vector x is output from any state S i of the HMM is It is given by equation (20).

Figure 0004662139
・・・(20)
Figure 0004662139
... (20)

ここで、出力確率密度関数bi(x)が、式(4)に示した正規分布で与えられ、状態確率Pi(t)が、式(5)を満たす確率であることを考慮すれば、確率密度関数Ft(x)は、複数の正規分布(ガウシアン)を混合して得られる混合正規分布にしたがう。 Here, considering that the output probability density function b i (x) is given by the normal distribution shown in the equation (4) and the state probability P i (t) is a probability satisfying the equation (5). The probability density function F t (x) follows a mixed normal distribution obtained by mixing a plurality of normal distributions (Gaussian).

即ち、式(20)の確率密度関数Ft(x)における状態確率Pi(t)は、式(4)に示した正規分布(出力確率密度関数bi(x))に対して与えられる混合重みに相当する。但し、式(20)において、混合重みである状態確率Pi(t)は、時刻tとともに変化する。 That is, the state probability P i (t) in the probability density function F t (x) of Expression (20) is given to the normal distribution (output probability density function b i (x)) shown in Expression (4). It corresponds to the mixing weight. However, in Equation (20), the state probability P i (t), which is a mixture weight, changes with time t.

式(20)の確率密度関数Ft(x)によって、時刻tにHMMからベクトルxが出力される確率密度が与えられる場合、時刻tにHMMから出力されるベクトルxの期待値E[x]は、式(21)で与えられる。 When the probability density function F t (x) in Expression (20) gives the probability density that the vector x is output from the HMM at time t, the expected value E [x] of the vector x output from the HMM at time t Is given by equation (21).

Figure 0004662139
・・・(21)
Figure 0004662139
... (21)

式(21)に、式(20)を代入することにより、時刻tにHMMから出力されるベクトルxの期待値E[x]は、式(22)で求めることができる。   By substituting equation (20) into equation (21), the expected value E [x] of vector x output from the HMM at time t can be obtained by equation (22).

Figure 0004662139
・・・(22)
Figure 0004662139
(22)

ここで、式(22)の上から2行目におけるbi(x)・xの、ベクトルxに関する-∞から+∞に亘る積分∫(bi(x)・x)dxは、出力確率密度関数bi(x)で確率密度が与えられるベクトルxの代表的なベクトルとしての、ベクトルxの期待値となるが、出力確率密度関数bi(x)が式(4)に示した正規分布で与えられる場合には、式(22)の上から3行目に示すように、式(4)の正規分布を規定する平均ベクトルμiとなる。 Here, the integral ∫ (b i (x) · x) dx from −∞ to + ∞ of the vector x of b i (x) · x in the second row from the top of the equation (22) is the output probability density The expected value of the vector x as a representative vector of the vector x given the probability density by the function b i (x), but the output probability density function b i (x) is a normal distribution shown in Equation (4) Is given by the average vector μ i that defines the normal distribution of equation (4) as shown in the third line from the top of equation (22).

式(22)によれば、時刻tに出力されるベクトルxの期待値E[x]は、HMMの各状態S1,S2,・・・,SNにおいて定義される出力確率密度関数b1(x),b2(x),・・・,bN(x)がしたがう正規分布を規定する平均ベクトルμ1,μ2,・・・,μNを、混合重みP1(t),P2(t),・・・,PN(t)で線形結合することで計算されることになる。 According to equation (22), the expected value of the vector x to be output at time t E [x] is, each state of the HMM S 1, S 2, ··· , the output probability density function is defined in the S N b 1 (x), b 2 ( x), ···, average vector mu 1 to b N (x) defines a normal distribution according, μ 2, ···, a mu N, mixture weight P 1 (t) , P 2 (t),..., P N (t) are calculated by linear combination.

ベクトル時系列生成処理では、式(22)により求められるベクトルxの期待値E[x]が、時刻t=1,2,・・・,Tについてそれぞれ求められ、ベクトル時系列x1,x2,・・・,xTとして出力される。 In the vector time series generation process, the expected value E [x] of the vector x obtained by the equation (22) is obtained for each time t = 1, 2,..., T, and the vector time series x 1 , x 2 ,..., it is output as x T.

次に、図13は、以上のようにして、所定の間隔の時刻t=1,2,・・・,Tごとのベクトルを求め、ベクトル時系列x1,x2,・・・,xTとして出力するベクトル時系列生成処理を行う図1のベクトル時系列生成部4の構成例を示している。 Next, in FIG. 13, as described above, vectors at predetermined intervals of time t = 1, 2,..., T are obtained, and vector time series x 1 , x 2 ,. 1 shows a configuration example of the vector time series generation unit 4 of FIG.

ベクトル時系列生成部4は、期待値取得部31と期待値算出部32とから構成される。   The vector time series generation unit 4 includes an expected value acquisition unit 31 and an expected value calculation unit 32.

期待値取得部31には、選択部2(図1)からHMM(の出力確率密度関数bi(x))が供給される。期待値取得部31は、選択部2から供給されるHMMの出力確率密度関数bi(x)から、その出力確率密度関数bi(x)が表す確率分布にしたがうベクトルxの期待値を求め、即ち、式(22)の上から2行目におけるbi(x)・xの、ベクトルxに関する-∞から+∞に亘る積分∫(bi(x)・x)dxの演算結果を求め、期待値算出部32に供給する。 The expected value acquisition unit 31 is supplied with an HMM (output probability density function b i (x)) from the selection unit 2 (FIG. 1). Expected value obtaining unit 31 obtains from the output probability density function b i of the HMM supplied from the selection section 2 (x), the expected value of the output probability density function b i (x) a vector x according to a probability distribution represented by That is, the calculation result of the integral ∫ (b i (x) · x) dx from −∞ to + ∞ of the vector x of b i (x) · x in the second row from the top of the equation (22) is obtained. To the expected value calculation unit 32.

ここでは、上述したように、出力確率密度関数bi(x)は正規分布であるため、期待値取得部31では、その正規分布を規定する平均ベクトルμiが、ベクトルxの期待値として求められる。 Here, as described above, since the output probability density function b i (x) is a normal distribution, the expectation value acquisition unit 31 obtains an average vector μ i that defines the normal distribution as an expectation value of the vector x. It is done.

期待値算出部32には、期待値取得部31からベクトルxの期待値としての平均ベクトルμiが供給される他、状態確率推定部3(図1)から状態確率Pi(t)が供給される。期待値算出部32は、期待値取得部31から供給される平均ベクトルμiと、状態確率推定部3から供給される状態確率Pi(t)とを用いて、式(22)の上から3行目の演算を行うことにより、HMMの各状態S1,S2,・・・,SNにおいて定義される出力確率密度関数b1(x),b2(x),・・・,bN(x)がしたがう正規分布を規定する平均ベクトルμ1,μ2,・・・,μNを、混合重みP1(t),P2(t),・・・,PN(t)で線形結合した線形結合結果、つまり、時刻tにHMMから出力されるベクトルxの期待値E[x]を、時刻t=1,2,・・・,Tごとに求め、その結果得られるベクトル時系列x1,x2,・・・,xTを出力する。 The expected value calculation unit 32 is supplied with an average vector μ i as an expected value of the vector x from the expected value acquisition unit 31 and with a state probability P i (t) from the state probability estimation unit 3 (FIG. 1). Is done. The expected value calculation unit 32 uses the average vector μ i supplied from the expected value acquisition unit 31 and the state probability P i (t) supplied from the state probability estimation unit 3 to calculate the expected value from the above equation (22). by performing the calculation of the third row, each state of the HMM S 1, S 2, ··· , the output probability density function b 1 as defined in S N (x), b 2 (x), ···, average vector mu 1 defining a normal distribution b N (x) is followed, μ 2, ···, a mu N, mixture weight P 1 (t), P 2 (t), ···, P N (t ), That is, the expected result E [x] of the vector x output from the HMM at time t is obtained at each time t = 1, 2,... Output vector time series x 1 , x 2 ,..., X T.

次に、図14のフローチャートを参照して、図13のベクトル時系列生成部4が行う図3のステップS3のベクトル時系列生成処理について説明する。   Next, the vector time series generation process in step S3 of FIG. 3 performed by the vector time series generation unit 4 of FIG. 13 will be described with reference to the flowchart of FIG.

期待値取得部31は、選択部2(図1)からHMMの供給を受け、ステップS31において、選択部2から供給されるHMMの出力確率密度関数bi(x)から、その出力確率密度関数bi(x)が表す確率分布にしたがうベクトルxの期待値を、選択部2からのHMMにおいて出力確率密度関数b1(x),b2(x),・・・,bN(x)が定義されている各状態S1,S2,・・・,SNについて求め、期待値算出部32に供給する。 The expected value acquisition unit 31 receives the supply of the HMM from the selection unit 2 (FIG. 1), and outputs the output probability density function from the output probability density function b i (x) of the HMM supplied from the selection unit 2 in step S31. The expected value of the vector x according to the probability distribution represented by b i (x) is output from the output probability density function b 1 (x), b 2 (x),..., b N (x) in the HMM from the selector 2. There defined each state S 1 is, S 2, ···, obtained for S N, and supplies the expected value calculation unit 32.

即ち、期待値取得部31は、選択部2からのHMMにおいて出力確率密度関数b1(x),b2(x),・・・,bN(x)が定義されている各状態S1,S2,・・・,SNについて、出力確率密度関数b1(x),b2(x),・・・,bN(x)が表す正規分布を規定する平均ベクトルμ1,μ2,・・・,μNを求め(取得し)、期待値算出部32に供給する。 That is, the expectation value acquisition unit 31 defines each state S 1 in which output probability density functions b 1 (x), b 2 (x),..., B N (x) are defined in the HMM from the selection unit 2. , S 2 ,..., S N , mean vectors μ 1 , μ defining the normal distribution represented by the output probability density functions b 1 (x), b 2 (x), ..., b N (x) 2 ,..., Μ N are obtained (obtained) and supplied to the expected value calculation unit 32.

そして、ステップS31からステップS32に進み、期待値算出部32は、期待値取得部31から供給される平均ベクトルμ1,μ2,・・・,μNと、状態確率推定部3から供給される時刻tについての状態確率P1(t),P2(t),・・・,PN(t)との積和演算を行い、その積和演算結果ΣPi(t)・μiを、時刻tにHMMから出力されるベクトルxの期待値xt(=E[x])として求める。 Then, the process proceeds from step S31 to step S32. The expected value calculation unit 32 is supplied from the average vectors μ 1 , μ 2 ,..., Μ N supplied from the expected value acquisition unit 31 and the state probability estimation unit 3. , P N (t), and the product-sum operation result ΣP i (t) · μ i is calculated from the state probabilities P 1 (t), P 2 (t),. The expected value x t (= E [x]) of the vector x output from the HMM at time t is obtained.

期待値算出部32は、ステップS32において、時刻t=1,2,・・・,Tごとに、HMMから出力されるベクトルxの期待値x1,x2,・・・,xTを求めて、ステップS33に進み、そのベクトルxの期待値x1,x2,・・・,xTを、全体継続時間がTのベクトル時系列x1,x2,・・・,xTとして出力して、ベクトル時系列生成処理を終了する。 In step S32, the expected value calculation unit 32 obtains the expected values x 1 , x 2 ,..., X T of the vector x output from the HMM at each time t = 1, 2,. Te, the process proceeds to step S33, the expected value x 1, x 2 of the vector x, ..., a x T, a vector time series x 1 for the entire duration T, x 2 outputs, ..., as x T Then, the vector time series generation process ends.

以上のように、状態の遷移に応じてベクトルxが出力されるHMMの各状態Siについて、所定の間隔の時刻tごとの、状態Siがベクトルxを出力する状態確率Pi(t)を推定し、その状態確率Pi(t)と、状態Siが出力する代表的なベクトルとしての、例えば、平均ベクトルμiとに基づいて、HMMが出力する所定の間隔の時刻tごとのベクトルx1,x2,・・・,xTを求めるようにしたので、即ち、ベクトルxを出力するべきHMMの状態を確定せずに、状態確率Pi(t)によって確率的に表し、その状態確率Pi(t)に基づいて、HMMが出力するベクトルxの期待値を解析的に計算することで、ベクトル時系列x1,x2,・・・,xTを生成するようにしたので、動的特徴量を用いることなく、かつ、ベクトル時系列の生成を繰り返し試行することもなく、効率的に、滑らかに変化するベクトル時系列を生成することができる。 As described above, for each state S i of the HMM in which the vector x is output according to the state transition, the state probability P i (t) at which the state S i outputs the vector x at every time t at a predetermined interval And the state probability P i (t) and the representative vector output by the state S i , for example, based on the average vector μ i for each time t at a predetermined interval output by the HMM. Since the vectors x 1 , x 2 ,..., X T are obtained, that is, without determining the state of the HMM to which the vector x is to be output, it is represented stochastically by the state probability P i (t), Based on the state probability P i (t), the vector time series x 1 , x 2 , ..., x T is generated by analytically calculating the expected value of the vector x output by the HMM. As a result, there is no need to use dynamic features, and without repeatedly trying to generate a vector time series, it is possible to change smoothly and efficiently. It is possible to generate a torque time series.

即ち、ある状態Siから他の状態Si+1に遷移する遷移時刻t(および逆遷移時刻t')が確率分布にしたがうとして、その遷移時刻tが、状態Siの自己遷移が継続する継続時間diを用いて求められ、さらに、その遷移時刻tを用いて、時刻tにおいて状態Siがベクトルxを出力する状態である確率を表す状態確率Pi(t)が求められる。従って、状態確率Pi(t)が高くなる状態Siが、時刻tの進行に伴い、状態S1から状態SNへと移行するように、状態確率Pi(t)は滑らかに変化し、この状態確率Pi(t)の滑らかな変化に応じて、状態確率Pi(t)を用いて生成されるベクトル時系列は滑らかに変化する。 That is, assuming that the transition time t (and reverse transition time t ′) from one state S i to another state S i + 1 follows the probability distribution, the self-transition of the state S i continues at that transition time t. The state probability P i (t) representing the probability that the state S i is in the state of outputting the vector x at the time t is obtained using the duration time d i . Therefore, the state S i to state probability P i (t) becomes higher, with the progress of time t, to transition from state S 1 to state S N, state probability P i (t) changes smoothly , depending on the smooth change of the state probability P i (t), a vector time series is generated by using the state probability P i (t) is smoothly changed.

ここで、状態確率Pi(t)が時刻tに応じて変化することが、最終的に得られるベクトル時系列x1,x2,・・・,xTの時間的な変化の特性を大きく左右する。 Here, the state probability P i (t) that varies in accordance with the time t, the vector time series x 1 finally obtained, x 2, · · ·, the characteristics of temporal changes in x T larger It depends on you.

即ち、例えば、全ての状態Siにおいて、状態確率Pi(t)が時刻tに依存しない一定値とすると、時間的に変化しないベクトル時系列x1,x2,・・・,xTが得られる。 That is, for example, in all states S i, when a constant value state probability P i (t) does not depend on time t, the vector time series x 1 unchanged temporally, x 2, · · ·, is x T can get.

また、例えば、各時刻tにおいて、ある1つの状態の状態確率Pi(t)だけが1となり、その他の状態の状態確率Pi(t)が0となるとすると、各時刻tにおいてベクトルxを出力する状態が1つの状態に固定(確定)され、その結果、ベクトル時系列が出力されるときの状態遷移系列が固定される。この場合、その固定された状態遷移系列の各状態から出力される平均ベクトルを並べたベクトル時系列が得られる。 Further, for example, at each time t, the only state probability P i of a one state (t) is the next 1, the other states of the state probability P i (t) becomes 0, the vector x at each time t The state to be output is fixed (determined) to one state, and as a result, the state transition sequence when the vector time series is output is fixed. In this case, a vector time series in which average vectors output from the states of the fixed state transition series are arranged is obtained.

なお、上述の場合には、HMMの各状態Siにおいて定義される出力確率密度関数bi(x)が正規分布にしたがうこととしたが、出力確率密度関数bi(x)としては、正規分布以外の、例えば、混合正規分布などの、平均ベクトルを計算することができる確率分布を表す関数を採用することができる。 In the above case, the output probability density function b i (x) defined in each state S i of the HMM follows a normal distribution, but the output probability density function b i (x) Other than the distribution, for example, a function representing a probability distribution capable of calculating an average vector, such as a mixed normal distribution, can be employed.

さらに、出力確率密度関数bi(x)としては、平均ベクトルを厳密(正確に)に求めることができない確率分布であっても、平均ベクトルを近似的に求めることができる確率分布を表す関数を採用することが可能である。 Furthermore, the output probability density function b i (x) is a function that represents a probability distribution that can approximately determine the average vector even if the average vector cannot be determined precisely (exactly). It is possible to adopt.

即ち、出力確率密度関数bi(x)としては、式(22)の上から2行目におけるbi(x)・xの、ベクトルxに関する-∞から+∞に亘る積分∫(bi(x)・x)dxの演算、つまり、状態Siから出力される尤度が最大のベクトルx(状態Siから出力されるベクトルxの期待値E[x])を求める演算を、厳密にまたは近似的に行うことができる関数を採用することができる。 That is, the output probability density function b i (x), the b i (x) · x in the second row from the top of the equation (22), the integral ∫ over + ∞ from -∞ about vector x (b i ( x) · x) dx operation, that is, the operation to find the vector x with the maximum likelihood output from the state S i (the expected value E [x] of the vector x output from the state S i ) is strictly Alternatively, a function that can be performed approximately can be employed.

なお、式(22)の上から2行目におけるbi(x)・xの、ベクトルxに関する-∞から+∞に亘る積分∫(bi(x)・x)dxの演算結果としては、上述した平均ベクトルμiなどの他、例えば、出力確率密度関数bi(x)の最大値を与えるベクトルxなどの、状態Siが出力確率密度関数bi(x)が表す確率分布にしたがって出力するベクトルxのうちの、いわば代表的なベクトルを採用することができる。 The calculation result of the integral ∫ (b i (x) · x) dx from −∞ to + ∞ with respect to the vector x of b i (x) · x in the second line from the top of the equation (22) is as follows: In addition to the average vector μ i described above, for example, a vector x that gives the maximum value of the output probability density function b i (x), the state S i follows a probability distribution represented by the output probability density function b i (x). Of the vectors x to be output, so-called representative vectors can be adopted.

また、上述の場合には、状態遷移確率モデルとして、left-to-right型のHMMを採用することとしたが、HMMは、left-to-right型に限定されるものではなく、例えば、状態のスキップを伴う状態遷移を持つHMMや、後ろ向きの状態遷移を持つHMM、さらには、全ての状態間の遷移が定義されたHMMであっても良い。   In the above case, the left-to-right type HMM is adopted as the state transition probability model. However, the HMM is not limited to the left-to-right type. It may be an HMM having a state transition with skipping, an HMM having a backward state transition, or an HMM in which transitions between all states are defined.

さらに、状態遷移確率モデルとしては、HMM以外の状態遷移確率モデルを採用することが可能である。HMM以外の状態遷移確率モデルとしては、例えば、ベイジアンネットワークなどの、状態確率Pi(t)を推定することができる状態遷移確率モデルがある。 Furthermore, it is possible to employ a state transition probability model other than the HMM as the state transition probability model. As the state transition probability model other than the HMM, for example, there is a state transition probability model that can estimate the state probability P i (t), such as a Bayesian network.

ベイジアンネットワークでは、変数間の依存関係をグラフ構造で表し、各ノードに条件付き確率を割り当てることで、時系列データのモデル化が行われる。   In a Bayesian network, time-series data is modeled by representing dependency relationships between variables in a graph structure and assigning conditional probabilities to each node.

なお、ベイジアンネットワークのグラフ構造の決定は、例えば、学習に用いられる学習データの尤度とグラフ構造の複雑さとを考慮したモデルを選択することにより行われ、条件付き確率の推定には、例えば、最尤推定法やEM(Expectation Maximaization)アルゴリズムなどが利用される。ここで、ベイジアンネットワークの詳細については、例えば、本村陽一、「不確実性モデリングのための情報表現:ベイジアンネット」、2001年、ベイジアンネットチュートリアルなどに記載されている。   Note that the determination of the graph structure of the Bayesian network is performed, for example, by selecting a model that takes into account the likelihood of the learning data used for learning and the complexity of the graph structure. A maximum likelihood estimation method or an EM (Expectation Maximaization) algorithm is used. Here, details of the Bayesian network are described in, for example, Yoichi Motomura, “Information Representation for Uncertainty Modeling: Bayesian Network”, 2001, Bayesian Network Tutorial.

また、上述したように、状態確率Pi(t)が時刻tに応じて変化することが、最終的に得られるベクトル時系列x1,x2,・・・,xTの時間的な変化の特性を大きく左右することから、ベクトル時系列x1,x2,・・・,xTの特性は、状態確率Pi(t)、ひいては、状態確率Pi(t)を求めるのに用いられる式(9)の前向き遷移確率qi(t)の分散σ2や、式(10)の後ろ向き遷移確率ri(t)の分散σ'2を調整することにより変化させることが可能である。 Further, as described above, the state probability P i (t) changes according to the time t. The temporal change in the finally obtained vector time series x 1 , x 2 ,..., X T The characteristics of the vector time series x 1 , x 2 , ..., x T are used to determine the state probability P i (t) and hence the state probability P i (t). It is possible to change by adjusting the variance σ 2 of the forward transition probability q i (t) in Equation (9) and the variance σ ′ 2 of the backward transition probability r i (t) in Equation (10). .

例えば、分散σ2やσ'2を小さくすると、状態Si-1から状態Siに遷移する時刻が確定的な値に近づき、その結果、HMMがベクトル時系列を出力するときの状態の遷移の仕方、つまり、状態遷移系列も確定的になっていくので、そのような確定的な状態遷移系列の各状態から、各状態に定義されている出力確率密度関数bi(x)の平均ベクトルを順に出力したようなベクトル時系列が得られる。 For example, if the variance σ 2 or σ ' 2 is reduced, the transition time from the state S i-1 to the state S i approaches a deterministic value, and as a result, the state transition when the HMM outputs a vector time series In other words, since the state transition sequence becomes deterministic, the average vector of the output probability density function b i (x) defined for each state from each state of such a definite state transition sequence Can be obtained as a vector time series.

一方、分散σ2やσ'2を大きくすると、状態確率Pi(t)が高くなる状態Siが、時刻tの進行に伴い、状態S1から状態SNへと移行するように、状態確率pi(t)が滑らかに変化し、この状態確率Pi(t)の滑らかな変化に応じて、滑らかに変化するベクトル時系列が得られる。 On the other hand, when the variance σ 2 or σ ′ 2 is increased, the state S i in which the state probability P i (t) increases is changed from the state S 1 to the state S N as the time t progresses. The probability p i (t) changes smoothly, and a vector time series that changes smoothly according to the smooth change of the state probability P i (t) is obtained.

図15および図16は、分散σ2およびσ'2を変えて、ベクトル時系列を求めたシミュレーションの内容を説明する図である。 FIG. 15 and FIG. 16 are diagrams for explaining the contents of a simulation for obtaining a vector time series by changing the variances σ 2 and σ ′ 2 .

即ち、図15は、HMMの学習に用いた学習データを示している。   That is, FIG. 15 shows learning data used for HMM learning.

シミュレーションでは、長さ(全体継続時間)Tが100の1次元のベクトルの時系列、つまり、長さTが100の、スカラーのデータの時系列を、HMMの学習データとして用いた。   In the simulation, a time series of one-dimensional vectors having a length (total duration) T of 100, that is, a time series of scalar data having a length T of 100, was used as learning data for the HMM.

図15においては、横軸を時刻tとするとともに、縦軸をデータの値として、学習データが示されている。   In FIG. 15, learning data is shown with the horizontal axis as time t and the vertical axis as the data value.

図15の学習データは、時刻t=0において、0であり、時刻tの進行とともに滑らかに減少して、時刻t=50付近で最小値となっている。さらに、図15の学習データは、最小値となった後、時刻tの進行とともに滑らかに増加して、時刻t=100において、再び0となっている。   The learning data in FIG. 15 is 0 at time t = 0, and decreases smoothly with the progress of time t, and has a minimum value near time t = 50. Furthermore, the learning data in FIG. 15 increases smoothly with the progress of time t after reaching the minimum value, and becomes 0 again at time t = 100.

HMMの学習は、図15の学習データを用いて、Baum-Welch法により行った。また、HMMとしては、状態数が10のleft-to-right型のHMMを用い、出力確率密度関数は正規分布に従うものとして学習を行った。   HMM learning was performed by the Baum-Welch method using the learning data of FIG. As the HMM, a left-to-right HMM with 10 states was used, and learning was performed assuming that the output probability density function follows a normal distribution.

図16は、ベクトル時系列出力部10(図1)において、上述のような学習によって得られたHMMから生成された1次元のベクトル(スカラーのデータ)の時系列を示している。   FIG. 16 shows a time series of one-dimensional vectors (scalar data) generated from the HMM obtained by learning as described above in the vector time series output unit 10 (FIG. 1).

図16においては、図15と同様に、横軸は時刻tを表し、縦軸はデータの値を表す。   In FIG. 16, as in FIG. 15, the horizontal axis represents time t, and the vertical axis represents data values.

なお、HMMから1次元のベクトルの時系列を生成するシミュレーションでは、状態確率Pi(t)を求めるのに用いられる式(9)の前向き遷移確率qi(t)の分散σ2と、式(10)の後ろ向き遷移確率ri(t)の分散σ'2とを、HMMのすべての状態で同一の値に固定した。そして、その固定の分散σ2およびσ'2の値としては、0.0001,36.0,400の3種類の値を用いた。 In the simulation for generating a time series of one-dimensional vectors from the HMM, the variance σ 2 of the forward transition probability q i (t) of the equation (9) used for obtaining the state probability P i (t) and the equation The variance σ ′ 2 of the backward transition probability r i (t) in (10) is fixed to the same value in all states of the HMM. As the fixed variances σ 2 and σ ′ 2 , three values of 0.0001, 36.0, and 400 were used.

図16は、分散σ2およびσ'2の値として、0.0001,36.0,400の3種類の値を用いた場合のそれぞれにおいて得られたベクトル時系列を示している。 FIG. 16 shows vector time series obtained when three types of values of 0.0001, 36.0, and 400 are used as the values of variances σ 2 and σ ′ 2 .

図16によれば、分散σ2およびσ'2の値として、0.0001という非常に小さな値を採用した場合には、上述したように、HMMがベクトル時系列を出力するときの状態遷移系列が確定的になり、その確定的な状態遷移系列の各状態から出力確率密度関数を表す正規分布を規定する平均ベクトル(平均値)が並んだような、いわば変化が段階的なベクトル時系列が出力されることを確認することができる。 According to FIG. 16, when a very small value of 0.0001 is adopted as the values of variances σ 2 and σ ′ 2 , the state transition sequence when the HMM outputs a vector time series is determined as described above. As a result, a vector time series with a stepwise change is output, such as an average vector (average value) defining a normal distribution representing the output probability density function from each state of the definite state transition sequence. Can be confirmed.

また、図16によれば、分散σ2およびσ'2の値として、36.0という大きな値を採用した場合には、滑らかに変化するベクトル時系列が出力されることを確認することができる。さらに、図16によれば、分散σ2およびσ'2の値として、400というより大きな値を採用した場合には、ベクトル時系列を時間に応じて変化する波形として見たときに、その波形が、いわば怠けたベクトル時系列が出力されることを確認することができる。 Further, according to FIG. 16, when a large value of 36.0 is adopted as the values of the variances σ 2 and σ ′ 2 , it can be confirmed that a vector time series that changes smoothly is output. Further, according to FIG. 16, when a larger value of 400 is adopted as the values of the variances σ 2 and σ ′ 2 , when the vector time series is viewed as a waveform that changes with time, the waveform However, it can be confirmed that a lazy vector time series is output.

以上のように、分散σ2およびσ'2の値を調整することにより、HMMから出力されるベクトル時系列の特性を変化させることができる。 As described above, the characteristics of the vector time series output from the HMM can be changed by adjusting the values of the variances σ 2 and σ ′ 2 .

なお、図16においては、分散σ2およびσ'2の値を36.0にした場合に得られるベクトル時系列が、図15の学習データに近いものとなっている。このことから、分散σ2およびσ'2の値を適切に調整することで、学習データと近い特性のベクトル時系列を生成することができることが分かる。 In FIG. 16, the vector time series obtained when the values of variances σ 2 and σ ′ 2 are 36.0 is close to the learning data of FIG. From this, it can be seen that a vector time series having characteristics close to the learning data can be generated by appropriately adjusting the values of the variances σ 2 and σ ′ 2 .

また、分散σ2およびσ'2(の値)の調整は、例えば、ユーザによる、図示せぬ操作部の操作や、図1の状態確率推定部3およびベクトル時系列生成部4から構成されるベクトル時系列出力部10を使用するアプリケーション(図1では、音声合成装置)からの要求などに応じて行うことができる。 Further, the adjustment of the variances σ 2 and σ ′ 2 (values thereof) is configured by, for example, an operation of an operation unit (not shown) by the user, a state probability estimation unit 3 and a vector time series generation unit 4 in FIG. This can be performed in response to a request from an application that uses the vector time series output unit 10 (speech synthesizer in FIG. 1).

さらに、分散σ2およびσ'2(の値)の調整(決定)は、その他、例えば、式(7)で求められる各状態Siの継続時間の期待値di(=E[n])に基づいて行うこともできる。 Further, the adjustment (determination) of the variances σ 2 and σ ′ 2 (values) is, for example, the expected value d i (= E [n]) of the duration of each state S i obtained by the equation (7). It can also be performed based on.

即ち、式(9)の前向き遷移確率qi(t)の分散σ2は、時刻tに状態Si-1から状態Siへの遷移(前向きの遷移)が行われる直前の、状態Si-1での自己遷移が連続する継続時間の期待値di-1に基づいて、例えば、式(23)により決定することができる。 That is, immediately before the transition of the variance sigma 2 of forward transition probability q i of Equation (9) (t) is the time t from the state S i-1 to the state S i (forward transition) is performed, the state S i Based on the expected value d i-1 of the continuous duration in which self-transition at -1 continues, it can be determined by, for example, Expression (23).

Figure 0004662139
・・・(23)
Figure 0004662139
(23)

式(23)において、cfは定数であり、例えばcf=0.5が用いられる。 In Expression (23), cf is a constant, and for example, cf = 0.5 is used.

式(23)によれば、式(9)の前向き遷移確率qi(t)の分散σ2が、状態Siに前向きの遷移が行われる直前の状態Si-1の継続時間の期待値di-1に基づき、その継続時間の期待値di-1が長ければ大きな値に決定され、継続時間の期待値di-1が短ければ小さな値に決定される。 According to equation (23), wherein the dispersion sigma 2 (9) of the forward transition probability q i (t) is the state S i-1 of the duration expected value immediately before the forward transition is made to the state S i based on the d i-1, is determined to a large value the longer the expected value d i-1 of its duration, is determined to a small value is shorter expected value d i-1 duration.

同様に、式(10)の後ろ向き遷移確率ri(t)の分散σ'2は、時刻tに状態Si+1から状態Siに遡る遷移(後ろ向きの遷移)が行われる直前の、状態Si+1での自己遷移が連続する継続時間の期待値di+1に基づいて、例えば、式(24)により決定することができる。 Similarly, the variance σ ′ 2 of the backward transition probability r i (t) in Expression (10) is the state immediately before the transition (backward transition) going back from the state S i + 1 to the state S i at time t. Based on the expected value d i + 1 of the duration of continuous self-transition at S i + 1 , it can be determined by, for example, Expression (24).

Figure 0004662139
・・・(24)
Figure 0004662139
... (24)

式(24)において、cbは定数であり、例えばcb=0.5が用いられる。 In Expression (24), c b is a constant, and for example, c b = 0.5 is used.

式(24)によれば、式(10)の後ろ向き遷移確率ri(t)の分散σ'2が、状態Siに後ろ向きの遷移が行われる直前の状態Si+1の継続時間の期待値di+1に基づき、その継続時間の期待値di+1が長ければ大きな値に決定され、継続時間の期待値di+1が短ければ小さな値に決定される。 According to equation (24), backward transition probability variance sigma '2 of r i (t) is the expected state S i + 1 duration immediately before the backward transition is performed to a state S i of formula (10) Based on the value d i + 1 , a larger value is determined if the expected value d i + 1 of the duration is longer, and a smaller value is determined if the expected value d i + 1 of the duration is shorter.

次に、上述の場合には、式(7)の継続時間の期待値di(=E[n])を、例えば、小数点以下を切り上げるなどして、整数化して用いることとしたが、この整数化に起因して、HMMから出力されるベクトル時系列には、整数化をしない場合に対して誤差が生じる。 Next, in the above-described case, the expected value d i (= E [n]) of the duration of Expression (7) is used as an integer, for example, by rounding up after the decimal point. Due to the integerization, an error occurs in the vector time series output from the HMM as compared with the case where the integerization is not performed.

この誤差は、継続時間の期待値diとして、小数点以下を含む値を用いるようにすることで低減することができる。 This error can be reduced by using a value including a decimal point as the expected value d i of the duration.

即ち、上述の場合には、明示的な説明は省略したが、HMMの学習に用いられる学習データの時間間隔が1であることを前提として、HMMからは、時間幅が1の時間間隔の各時刻tでベクトルxが出力されることとしたため、時刻tは整数値のみをとり、従って、継続時間の期待値diも整数値のみをとることとしたが、HMMからベクトルxが出力される時刻として、小数点以下を含む値を想定することにより、継続時間の期待値diも、小数点以下を含む値を用いることができ、これにより、HMMから出力されるベクトル時系列に生じる誤差を低減することができる。 That is, in the above-described case, although an explicit explanation is omitted, assuming that the time interval of the learning data used for learning of the HMM is 1, the HMM starts from each time interval having a time width of 1. Since the vector x is output at the time t, the time t takes only an integer value, and therefore the expected duration d i also takes only the integer value, but the vector x is output from the HMM. By assuming a value including the decimal point as the time, the expected duration d i can also be a value including the decimal point, thereby reducing errors in the vector time series output from the HMM. can do.

即ち、状態確率推定部3(図1)において、式(7)の継続時間の期待値diを、例えば、小数点以下第2位以下を切り上げるなどして、小数第1位まで求める。さらに、状態確率推定部3において、小数第1位まで求めた継続時間の期待値diを用いて、式(9)の前向き遷移確率qi(t)と、式(10)の後ろ向き遷移確率ri(t)とを求め、さらには、式(9)の前向き遷移確率qi(t)を用いて、式(13)の漸化式で表される前向き状態確率Pfi(t)を求めるとともに、式(10)の後ろ向き遷移確率ri(t)を用いて、式(17)の漸化式で表される後ろ向き状態確率Pbi(t)を求める。 That is, in the state probability estimation unit 3 (FIG. 1), the expected value d i of the duration of the equation (7) is obtained to the first decimal place, for example, by rounding up the second decimal place. Further, the state probability estimation unit 3 uses the expected value d i of the duration calculated to the first decimal place, and the forward transition probability q i (t) of Equation (9) and the backward transition probability of Equation (10). r i (t) is obtained, and further, the forward state probability Pf i (t) represented by the recurrence formula of Expression (13) is obtained using the forward transition probability q i (t) of Expression (9). In addition, the backward state probability Pb i (t) represented by the recurrence formula of Expression (17) is obtained using the backward transition probability r i (t) of Expression (10).

但し、式(13)の漸化式で表される前向き状態確率Pfi(t)と、式(17)の漸化式で表される後ろ向き状態確率Pbi(t)とは、時刻tの刻み幅(時間間隔)を0.1として求める。 However, the forward state probability Pf i (t) represented by the recurrence formula of Expression (13) and the backward state probability Pb i (t) represented by the recurrence expression of Expression (17) are Obtain the step size (time interval) as 0.1.

そして、状態確率推定部3では、時刻tの刻み幅を0.1として求められた前向き状態確率Pfi(t)と後ろ向き状態確率Pbi(t)とを用い、時刻tの刻み幅を0.1とする式(19)の状態確率Pi(t)、即ち、Pi(0.0),Pi(0.1),Pi(0.2),Pi(0.3),・・・,Pi(T+0.8),Pi(T+0.9),Pi(T+1.0)を求める。 Then, the state probability estimation unit 3 uses the forward state probability Pf i (t) and the backward state probability Pb i (t) obtained by setting the step size at time t to 0.1, and sets the step size at time t to 0.1. State probability P i (t) in equation (19), that is, P i (0.0), P i (0.1), P i (0.2), P i (0.3),..., P i (T + 0.8) , P i (T + 0.9) and P i (T + 1.0) are obtained.

ここで、図17は、時刻tの刻み幅を1として求められる状態確率Pi(t)(図17上側)と、時刻tの刻み幅を0.1として求められる状態確率Pi(t)(図17下側)とを示している。 Here, FIG. 17 shows a state probability P i (t) obtained when the step size at time t is 1 (upper side in FIG. 17) and a state probability P i (t) obtained when the step size at time t is 0.1 (see FIG. 17). 17 lower side).

時刻tの刻み幅が0.1の状態確率Pi(t)が求められた後は、ベクトル時系列生成部4(図1)において、時刻tの刻み幅を0.1とする状態確率Pi(t)のうちの、時刻t=1,2,3,・・・,Tにおける値を用い、式(22)の演算を行うことにより、時刻tの刻み幅が1のベクトル時系列を得ることができる。 After step size at time t is obtained 0.1 state probability P i (t) is the vector time series generating unit 4 (FIG. 1), the state probability of the step size of the time t and 0.1 P i (t) .., T using the values at time t = 1, 2, 3,..., T, and calculating the equation (22), it is possible to obtain a vector time series with time t increment of 1. .

以上のように、状態確率Pi(t)を計算する時刻tの刻み幅を小さくすることで、全体の処理量は大きくなるが、継続時間の期待値diの整数化によりベクトル時系列に生じる誤差を低減することができる。 As described above, by reducing the step size at time t for calculating the state probability P i (t), the overall processing amount is increased, but by making the expected value d i of the duration into an integer, it becomes a vector time series. The error that occurs can be reduced.

なお、時刻tの刻み幅は、処理量と誤差とをバランスさせて決定することが望ましい。   Note that the step size at time t is desirably determined by balancing the processing amount and the error.

さらに、ここでは、時刻tの刻み幅を1から0.1に変更して状態確率Pi(t)を計算することとしたが、時刻tの刻み幅は、その他、例えば、0.5や0.01その他の値を採用することが可能であり、この時刻tの刻み幅によって、HMMから出力されるベクトル時系列に生じる誤差(HMMから出力されるベクトル時系列の精度)と、全体の処理量とを調整することができる。 Further, here, the step probability at time t is changed from 1 to 0.1 to calculate the state probability P i (t), but the step size at time t is other values, for example, 0.5 or 0.01. The error that occurs in the vector time series output from the HMM (the accuracy of the vector time series output from the HMM) and the overall processing amount are adjusted according to the step size at time t. be able to.

また、HMMから出力されるベクトル時系列の時間間隔は、状態確率Pi(t)を求める時刻tの刻み幅を最小値として調整することができる。即ち、上述のように、時刻tの刻み幅を0.1として状態確率Pi(t)を求めた場合には、HMMから出力されるベクトル時系列の時間間隔は、上述のように、1とすることもできるし、その他、例えば、0.5や0.1などとすることもできる。 Further, the time interval of the vector time series output from the HMM can be adjusted with the step size of the time t for obtaining the state probability P i (t) as the minimum value. That is, as described above, when the state probability P i (t) is obtained by setting the step size of time t to 0.1, the time interval of the vector time series output from the HMM is set to 1 as described above. For example, 0.5 or 0.1 can be used.

状態確率Pi(t)を求める時刻tの刻み幅や、HMMから出力されるベクトル時系列の時間間隔の調整は、例えば、ユーザによる、図示せぬ操作部の操作や、図1のベクトル時系列出力部10を使用するアプリケーションからの要求などに応じて行うことができる。 The adjustment of the step size of the time t for obtaining the state probability P i (t) and the time interval of the vector time series output from the HMM are performed by, for example, the operation of the operation unit (not shown) by the user or the vector time of FIG. This can be performed in response to a request from an application that uses the series output unit 10.

次に、上述の場合には、1つのHMMからベクトル時系列を生成したが、ベクトル時系列は、複数のHMMを結合して得られるHMM(以下、適宜、結合HMMという)から生成することも可能である。   Next, in the above-described case, a vector time series is generated from one HMM. However, a vector time series may be generated from an HMM obtained by combining a plurality of HMMs (hereinafter referred to as a combined HMM as appropriate). Is possible.

図18は、left-to-right型の2つのHMM#1と#2とを結合した結合HMMを示している。   FIG. 18 shows a combined HMM in which two left-to-right type HMMs # 1 and # 2 are combined.

図18では、状態S0乃至SN1+1を有するleft-to-right型のHMM#1と、状態S'0乃至S'N2+1を有するleft-to-right型のHMM#2とが、その順番で結合され、1つの結合HMMとなっている。 In FIG. 18, left-to-right type HMM # 1 having states S 0 to S N1 + 1 and left-to-right type HMM # 2 having states S ′ 0 to S ′ N2 + 1 are represented. Are combined in that order to form one combined HMM.

即ち、図18では、HMM#1の終了状態SN1+1と、HMM#2の初期状態S'0とが削除され、HMM#1の状態SN1と、HMM#2の状態S'1とが接続されることにより、HMM#1と#2とが結合されている。 That is, in FIG. 18, the end state S N1 + 1 of HMM # 1, 'is deleted and 0, the state S N1 of HMM # 1, the state S of the HMM # 2' initial state S of HMM # 2 and 1 Are connected, HMM # 1 and # 2 are coupled.

結合HMMも、1つのHMMと同様に扱うことができ、従って、ベクトル時系列出力部10は、上述した、1つのHMMからベクトル時系列を生成する場合と同様に、結合HMMからベクトル時系列を生成することができる。   The combined HMM can also be handled in the same way as one HMM, and therefore the vector time series output unit 10 generates a vector time series from the combined HMM in the same manner as when generating a vector time series from one HMM described above. Can be generated.

なお、結合HMMでは、HMM#1の状態SN1から、HMM#1の終了状態SN1+1に代えて、HMM#2の状態S'1に遷移するようになっており、結合HMMにおいて、HMM#1の状態SN1からHMM#2の状態S'1に遷移するときも、滑らかに変化するベクトル時系列を得ることができる。 In the combined HMM, the state S N1 of the HMM # 1 is changed to the state S′1 of the HMM # 2 instead of the end state S N1 + 1 of the HMM # 1 , and in the combined HMM, also the transition from the state S N1 of HMM # 1 to the state S '1 of HMM # 2, it is possible to obtain a vector time series changes smoothly.

また、上述の場合には、2つのHMM#1と#2を結合したが、3以上のHMMを結合することも可能である。   In the above case, two HMMs # 1 and # 2 are combined, but three or more HMMs can be combined.

次に、図19のフローチャートを参照して、上述のように、HMMを結合して、ベクトル時系列を生成する場合の図1の音声合成装置の処理について説明する。   Next, processing of the speech synthesizer of FIG. 1 when generating a vector time series by combining HMMs as described above will be described with reference to the flowchart of FIG.

ステップS51において、図1の選択部2は、HMM記憶部1に記憶されたHMMの中から、音声合成に用いる複数のHMMを選択して、ステップS52に進み、その複数のHMMを、図18で説明したように結合して、結合HMMを得る。そして、選択部2は、結合HMMを、状態確率推定部3とベクトル時系列生成部4に供給して、ステップS52からステップS53に進む。   In step S51, the selection unit 2 in FIG. 1 selects a plurality of HMMs used for speech synthesis from the HMMs stored in the HMM storage unit 1, and proceeds to step S52. To obtain the combined HMM. Then, the selection unit 2 supplies the combined HMM to the state probability estimation unit 3 and the vector time series generation unit 4, and proceeds from step S52 to step S53.

ステップS53では、状態確率推定部3は、選択部2から供給される結合HMMの各状態Siについて、所定の間隔の時刻tごとの状態確率Pi(t)を推定する状態確率推定処理を行い、その結果得られる状態確率Pi(t)を、ベクトル時系列生成部4に供給して、ステップS54に進む。 In step S53, the state probability estimation unit 3 performs state probability estimation processing for estimating the state probability P i (t) for each time t at a predetermined interval for each state S i of the combined HMM supplied from the selection unit 2. Then, the state probability P i (t) obtained as a result is supplied to the vector time series generation unit 4, and the process proceeds to step S54.

ステップS54では、ベクトル時系列生成部4は、状態確率推定部3から供給される状態確率Pi(t)と、選択部2から供給される結合HMMの状態Siが出力する代表的なベクトルとしての、例えば平均ベクトルμiとに基づいて、所定の間隔の時刻tごとのベクトルを求めるベクトル時系列生成処理を行い、その結果得られるベクトル時系列を出力して、ステップS55に進む。 In step S54, the vector time series generation unit 4 outputs a representative vector output by the state probability P i (t) supplied from the state probability estimation unit 3 and the state S i of the combined HMM supplied from the selection unit 2. For example, based on the average vector μ i , vector time series generation processing for obtaining a vector for each time t at a predetermined interval is performed, and the vector time series obtained as a result is output, and the process proceeds to step S55.

ステップS55では、逆フィルタ5が、ベクトル時系列生成部4が出力するベクトル時系列をフィルタリングすることにより、音声信号を得て出力し、処理を終了する。   In step S55, the inverse filter 5 obtains and outputs an audio signal by filtering the vector time series output from the vector time series generation unit 4, and the process ends.

次に、図2に示したようなleft-to-right型のHMMは、ベクトル時系列のあるパターン(時系列パターン)を表現する(モデル化する)のに適している。   Next, the left-to-right type HMM as shown in FIG. 2 is suitable for expressing (modeling) a certain vector time-series pattern (time-series pattern).

従って、図20に示すような、left-to-right型のHMMに対して、その終了状態SN+1の直前の状態SNから、初期状態S0の直後の状態S1に戻るような遷移を与えたHMMを考えた場合、状態SNから状態S1への遷移が行われることによって、元のHMMが表現する時系列パターンが繰り返されるような、いわば周期的な軌道のベクトル時系列(波形が周期的なベクトル時系列)を生成することが可能となる。 Accordingly, for a left-to-right type HMM as shown in FIG. 20, the state returns from the state S N immediately before the end state S N + 1 to the state S 1 immediately after the initial state S 0. Considering the HMM that gave the transition, a vector time series of periodic orbits, in which the time series pattern represented by the original HMM is repeated by the transition from state S N to state S 1 It is possible to generate a vector time series having a periodic waveform.

図20に示した、状態SNから状態S1への遷移が与えられたHMMから出力される周期的な軌道のベクトル時系列は、上述した結合HMMを利用することにより生成することができる。 The vector time series of the periodic trajectory output from the HMM given the transition from the state S N to the state S 1 shown in FIG. 20 can be generated by using the above-described combined HMM.

即ち、周期的な軌道のベクトル時系列の、例えば、1周期分のベクトル時系列に対応する時系列パターンを表現するHMMをコピーして3つ用意する。ここで、この3つのHMMを、HMM#1,#2,#3と呼ぶこととする。   That is, three HMMs representing a time series pattern corresponding to a vector time series of one period, for example, a vector time series of a periodic trajectory are prepared. Here, these three HMMs are referred to as HMM # 1, # 2, and # 3.

そして、図21に示すように、同一の3つのHMM#1,#2,#3を、その順で、図18の場合と同様に結合して、結合HMMとする。いま、同一の3つのHMM#1,#2,#3の1つが、状態S0乃至SN+1を有する場合、結合HMMは、図21に示すように、HMM#1の状態SNに、HMM#2の状態S1が接続され、さらに、HMM#2の状態SNに、HMM#3の状態S1が接続された、状態S1乃至SNが3回繰り返して並ぶHMMとなる。そして、この結合HMMは、周期的な軌道のベクトル時系列の、3周期分のベクトル時系列に対応する時系列パターンを表現する。 Then, as shown in FIG. 21, the same three HMMs # 1, # 2, and # 3 are combined in that order in the same manner as in FIG. Now, if one of the same three HMMs # 1, # 2, and # 3 has states S 0 to S N + 1 , the combined HMM enters state S N of HMM # 1 as shown in FIG. the state S 1 of the HMM # 2 is connected, further, a state S N of the HMM # 2, the state S 1 of HMM # 3 is connected, an HMM state S 1 to S N are arranged repeated 3 times . The combined HMM expresses a time series pattern corresponding to a vector time series for three periods of a vector time series of periodic orbits.

以上のような、同一の3つのHMM#1,#2,#3が結合された結合HMMも、図18の場合と同様に、1つのHMMと同様に扱うことができ、従って、ベクトル時系列出力部10は、上述した、1つのHMMからベクトル時系列を生成する場合と同様に、結合HMMからベクトル時系列を生成することができる。   The combined HMM in which the same three HMMs # 1, # 2, and # 3 are combined as described above can be handled in the same manner as one HMM as in the case of FIG. The output unit 10 can generate a vector time series from the combined HMM, as in the case of generating a vector time series from one HMM described above.

図21の結合HMMからベクトル時系列を生成した場合、周期的な軌道のベクトル時系列の、3周期分のベクトル時系列が得られることとなるが、以下のようにすることで、任意の周期分のベクトル時系列を得ることが可能となる。   When the vector time series is generated from the combined HMM of FIG. 21, a vector time series of three periods of the vector time series of the periodic trajectory can be obtained. It is possible to obtain a minute vector time series.

即ち、状態確率推定部3(図3)において、図21の結合HMMについて、状態確率Pi(t)を求めた後、その状態確率Pi(t)の中で、HMM#2の状態S1乃至SNに対応する分の状態確率Pi'(t)だけを取り出す。そして、ベクトル時系列生成部4において、その状態確率Pi'(t)から求まるベクトル時系列を1周期分として出力し、これを繰り返すことで周期的な軌道のベクトル時系列を生成することが可能となる。 That is, after the state probability P i (t) is obtained for the combined HMM in FIG. 21 in the state probability estimation unit 3 (FIG. 3), the state S of HMM # 2 is included in the state probability P i (t). Only the state probabilities P i ′ (t) corresponding to 1 to S N are extracted. Then, the vector time series generation unit 4 outputs a vector time series obtained from the state probability P i ′ (t) as one period, and generates a periodic orbit vector time series by repeating this. It becomes possible.

ここで、図21の結合HMMにおいては、HMM#2の左側のHMM#1と、HMM#2の右側のHMM#3との影響により、HMM#1の状態SNからHMM#2の状態S1に亘って得られるベクトル時系列と、HMM#2の状態SNからHMM#3の状態S1に亘って得られるベクトル時系列は滑らかに変化するものとなることから、HMM#2の状態S1乃至SNに対応する分の状態確率Pi'(t)から求まるベクトル時系列を1周期分として出力することを繰り返すことで得られるベクトル時系列においても、HMM#2の状態SNから状態S1に亘って得られる部分は滑らかに変化することになる。 Here, in the coupled HMM of FIG. 21, the state S N of HMM # 1 to the state S of HMM # 2 are affected by the influence of HMM # 1 on the left side of HMM # 2 and HMM # 3 on the right side of HMM # 2. Since the vector time series obtained over 1 and the vector time series obtained from state S N of HMM # 2 to state S 1 of HMM # 3 change smoothly, the state of HMM # 2 Even in a vector time series obtained by repeating outputting a vector time series obtained from the state probabilities P i ′ (t) corresponding to S 1 to S N as one period, the state S N of HMM # 2 The portion obtained from state to state S 1 changes smoothly.

次に、図22のフローチャートを参照して、上述のように、HMMを結合して、周期的な軌道のベクトル時系列を生成する場合の図1の音声合成装置の処理について説明する。   Next, the processing of the speech synthesizer in FIG. 1 in the case where the HMMs are combined to generate a periodic trajectory vector time series will be described with reference to the flowchart in FIG.

ステップS61において、図1の選択部2は、HMM記憶部1に記憶されたHMMの中から、音声合成に用いる1つのHMMを選択して、ステップS62に進み、その1つのHMMをコピーし、同一の3つのHMM#1,#2,#3を得る。さらに、選択部2は、3つのHMM#1,#2,#3をその順に結合し、これにより、図21に示した結合HMMを得る。そして、選択部2は、結合HMMを、状態確率推定部3とベクトル時系列生成部4に供給して、ステップS62からステップS63に進む。   In step S61, the selection unit 2 in FIG. 1 selects one HMM used for speech synthesis from the HMMs stored in the HMM storage unit 1, proceeds to step S62, and copies the one HMM. The same three HMMs # 1, # 2, and # 3 are obtained. Further, the selection unit 2 combines the three HMMs # 1, # 2, and # 3 in that order, thereby obtaining the combined HMM shown in FIG. Then, the selection unit 2 supplies the combined HMM to the state probability estimation unit 3 and the vector time series generation unit 4, and proceeds from step S62 to step S63.

ステップS63では、状態確率推定部3は、選択部2から供給される結合HMMの各状態Siについて、所定の間隔の時刻tごとの状態確率Pi(t)を推定する状態確率推定処理を行って、ステップS64に進み、状態確率推定処理の結果得られる状態確率Pi(t)から、HMM#2の状態S1乃至SNに対応する分の状態確率Pi'(t)だけを取り出し、ベクトル時系列生成部4に供給して、ステップS65に進む。 In step S63, the state probability estimation unit 3 performs state probability estimation processing for estimating the state probability P i (t) for each time t at a predetermined interval for each state S i of the combined HMM supplied from the selection unit 2. Then, the process proceeds to step S64, and only the state probabilities P i ′ (t) corresponding to the states S 1 to S N of HMM # 2 are obtained from the state probabilities P i (t) obtained as a result of the state probability estimation process. The extracted time is supplied to the vector time series generation unit 4 and the process proceeds to step S65.

ステップS65では、ベクトル時系列生成部4は、ベクトル時系列生成処理を、状態確率推定部3からの状態確率Pi'(t)と、選択部2から供給される結合HMMのうちのHMM#2の部分とを用いて行い、その結果得られる1周期分のベクトル時系列を出力して、ステップS66に進む。 In step S65, the vector time series generation unit 4 performs the vector time series generation process with the state probability P i ′ (t) from the state probability estimation unit 3 and the HMM # of the combined HMMs supplied from the selection unit 2. 2 and outputting a vector time series for one period obtained as a result, and the process proceeds to step S66.

ステップS66では、逆フィルタ5が、ベクトル時系列生成部4が出力するベクトル時系列をフィルタリングすることにより、音声信号を得て出力し、ステップS67に進む。   In step S66, the inverse filter 5 obtains and outputs an audio signal by filtering the vector time series output from the vector time series generation unit 4, and the process proceeds to step S67.

ステップS67では、ベクトル時系列生成部4が、ベクトル時系列の出力を、例えば、あらかじめ定められた回数などの所定の回数だけ繰り返して行ったかどうかを判定し、まだ、所定の回数だけ繰り返し行っていないと判定した場合、ステップS65に戻り、以下、同様の処理が繰り返される。なお、2回目以降のステップS65では、ベクトル時系列生成処理を再度行っても良いが、ベクトル時系列生成処理を行わずに、1回目のステップS65で出力したベクトル時系列を記憶しておき、そのベクトル時系列を出力しても良い。   In step S67, the vector time series generation unit 4 determines whether or not the vector time series output has been repeated a predetermined number of times, for example, a predetermined number of times, and has been repeatedly performed a predetermined number of times. If it is determined that there is not, the process returns to step S65, and the same processing is repeated thereafter. In the second and subsequent steps S65, the vector time series generation process may be performed again, but the vector time series output in the first step S65 is stored without performing the vector time series generation process. The vector time series may be output.

一方、ステップS67において、ベクトル時系列の出力を所定の回数だけ繰り返し行ったと判定された場合、処理を終了する。   On the other hand, if it is determined in step S67 that the vector time-series output has been repeated a predetermined number of times, the process ends.

なお、図21では、同一の3つのHMM#1,#2,#3を結合するようにしたが、同一の4以上のHMMを結合しても良い。この場合、その4以上のHMMを結合した結合HMMから得られる状態確率Pi(t)から、先頭のHMMと最後のHMMとを除く1以上のHMMに対応する分の状態確率Pi'(t)だけを取り出し(抽出し)、その状態確率Pi'(t)を用いて、ベクトル時系列を生成すれば良い。 In FIG. 21, the same three HMMs # 1, # 2, and # 3 are combined, but the same four or more HMMs may be combined. In this case, state probabilities P i ′ (corresponding to one or more HMMs excluding the first HMM and the last HMM are obtained from the state probabilities P i (t) obtained by combining the four or more HMMs. It is only necessary to extract (extract) t) and generate a vector time series using the state probability P i ′ (t).

次に、上述の場合には、HMMの各状態Siの継続時間の期待値diの総和である式(8)の全体継続時間Tを、HMMから出力されるベクトル時系列の長さ(ベクトル時系列のベクトルの個数)としたが、HMMから出力されるベクトル時系列の長さは、例えば、ユーザによる、図示せぬ操作部の操作や、図1のベクトル時系列出力部10を使用するアプリケーションからの要求などに応じて調整することができる。 Next, in the above-described case, the total duration T of Equation (8), which is the sum of the expected durations d i of the states S i of the HMM, is expressed as the length of the vector time series output from the HMM ( The number of vectors in the vector time series) is used. The length of the vector time series output from the HMM is, for example, the operation of the operation unit (not shown) by the user or the vector time series output unit 10 in FIG. It can be adjusted according to the request from the application.

HMMから出力されるベクトル時系列の長さの調整は、例えば、期待遷移時刻ti(および逆期待遷移時刻ti')を求めるときに用いられる継続時間の期待値diを、例えば、式(25)にしたがって調整することによって行うことができる。 The adjustment of the length of the vector time series output from the HMM is performed by, for example, calculating the expected value d i of the duration used when obtaining the expected transition time t i (and the inverse expected transition time t i ′) This can be done by adjusting according to (25).

Figure 0004662139
・・・(25)
Figure 0004662139
... (25)

式(25)において、係数αを1.0とした場合、継続時間の期待値diは、式(7)で求められる値(E[n])のままとなる。また、式(25)において、係数αを1.0よりも大の値とした場合、継続時間の期待値diは、式(7)で求められる値よりも大となり、逆に、係数αを1.0よりも小の値とした場合、継続時間の期待値diは、式(7)で求められる値よりも小となる。 In the equation (25), when the coefficient α is 1.0, the expected value d i of the duration time remains the value (E [n]) obtained by the equation (7). Further, in the equation (25), when the coefficient α is set to a value larger than 1.0, the expected duration d i is larger than the value obtained in the equation (7), and conversely, the coefficient α is set to 1.0. If the value is smaller than the expected value d i , the expected duration d i is smaller than the value obtained by equation (7).

継続時間の期待値diを、例えば、式(25)にしたがって調整することにより、式(8)で求められる全体継続時間T、つまり、HMMから出力されるベクトル時系列の長さは、調整をしない場合(αが1.0の場合)のα倍となる。 By adjusting the expected value d i of the duration according to, for example, Equation (25), the total duration T obtained by Equation (8), that is, the length of the vector time series output from the HMM is adjusted. It will be α times the case where α is not performed (when α is 1.0).

なお、式(25)における係数αは、HMMの状態Siすべてについて同一の値とすることもできるし、状態Siごとに変えることもできる。即ち、状態S1の継続時間の期待値d1の調整には、例えば、α=0.7を用い、状態SNの継続時間の期待値dNの調整には、例えば、α=1.5を用いること等が可能である。式(25)における係数αを、HMMの状態Siごとに変えた場合、HMMから出力されるベクトル時系列の長さを部分的に調整することが可能となる。 The coefficient α in the equation (25) can be the same value for all the states S i of the HMM or can be changed for each state S i . That is, for example, α = 0.7 is used to adjust the expected value d 1 of the duration of state S 1 , and α = 1.5 is used to adjust the expected value d N of the duration of state S N , for example. Etc. are possible. When the coefficient α in Expression (25) is changed for each state S i of the HMM, the length of the vector time series output from the HMM can be partially adjusted.

次に、以上においては、図1のベクトル時系列出力部10において、1つのHMM(結合HMMを含む)を用いて、そのHMMから出力されるベクトル時系列を生成するようにしたが、その他、例えば、複数のHMMを用いて、その複数のHMMそれぞれから出力されるベクトル時系列を混合(合成)したベクトル時系列、即ち、複数のHMMそれぞれから出力されるベクトル時系列の、いわば中間的なベクトル時系列を生成することが可能である。   Next, in the above, the vector time series output unit 10 in FIG. 1 uses one HMM (including the combined HMM) to generate a vector time series output from the HMM. For example, using a plurality of HMMs, a vector time series obtained by mixing (synthesizing) vector time series output from each of the plurality of HMMs, that is, a vector time series output from each of the plurality of HMMs, It is possible to generate a vector time series.

ここで、複数のHMMそれぞれから出力されるベクトル時系列を混合したベクトル時系列は、その複数のHMMを、1つのHMMに混合(合成)し、そのHMM(以下、適宜、合成HMMという)から出力されるベクトル時系列であると考えることができる。   Here, the vector time series obtained by mixing the vector time series output from each of the plurality of HMMs is obtained by mixing (combining) the plurality of HMMs into one HMM, and then from the HMM (hereinafter referred to as a combined HMM as appropriate). It can be considered to be an output vector time series.

なお、合成HMMは、結合HMMのような、単純に、複数のHMMの状態どうしを接続(結合)したHMMとは異なる。即ち、仮に、HMMを、xy座標系上の点で表すことができるとすると、合成HMMは、直感的には、例えば、xy座標系上の2点が与えられたときに、その2点を使って、その2点を通る直線上の任意の点を表現することができるが如く、2つのHMMを表す2点を通る直線上の任意の点で表されるHMMである。   Note that a synthetic HMM is different from an HMM that simply connects (couples) the states of a plurality of HMMs, such as a coupled HMM. That is, if the HMM can be represented by a point on the xy coordinate system, the synthetic HMM intuitively, for example, when two points on the xy coordinate system are given, the two points are It is an HMM represented by an arbitrary point on a straight line passing through two points representing two HMMs, as can be used to represent an arbitrary point on the straight line passing through the two points.

図23は、2つのHMM#1と#2を用いて、そのHMM#1から出力されるベクトル時系列とHMM#2から出力されるベクトル時系列とを混合した中間的なベクトル時系列を生成する方法を説明する図である。   FIG. 23 uses two HMM # 1 and # 2 to generate an intermediate vector time series that is a mixture of the vector time series output from HMM # 1 and the vector time series output from HMM # 2. It is a figure explaining the method to do.

図23において、HMM#1は、N+2個の状態S0,S1,S2,・・・,SN,SN+1からなるleft-to-right型のHMMであり、HMM#2は、M+2個の状態S'0,S'1,S'2,・・・,S'M,S'M+1からなるleft-to-right型のHMMである。 In FIG. 23, HMM # 1 is a left-to-right type HMM composed of N + 2 states S 0 , S 1 , S 2 ,..., S N , S N + 1. Reference numeral 2 denotes a left-to-right type HMM composed of M + 2 states S ′ 0 , S ′ 1 , S ′ 2 ,..., S ′ M , S ′ M + 1 .

いま、HMM#1(から出力されるベクトル時系列)と、HMM#2(から出力されるベクトル時系列)とを、β:1−βの比率で混合することとする。   Now, HMM # 1 (vector time series output from) and HMM # 2 (vector time series output from) are mixed at a ratio of β: 1−β.

ここで、以下、適宜、βを、混合係数という。また、混合係数βは、0.0<=β<=1.0の範囲の値であるとする。   Here, β is appropriately referred to as a mixing coefficient hereinafter. Further, the mixing coefficient β is a value in the range of 0.0 <= β <= 1.0.

混合係数β=1.0の場合には、HMM#1だけを用いて生成されるベクトル時系列と同一のベクトル時系列が生成されなければならず、混合係数β=0.0の場合、HMM#2だけを用いて生成されるベクトル時系列と同一のベクトル時系列が生成されなければならない。そして、混合係数βが、0より大で1より小さい値である場合、その混合係数βの値に応じて、HMM#1を用いて生成されるベクトル時系列とHMM#2を用いて生成されるベクトル時系列とを混合した中間的なベクトル時系列が生成されなければならない。   When the mixing coefficient β = 1.0, the same vector time series as that generated using only HMM # 1 must be generated. When the mixing coefficient β = 0.0, only HMM # 2 is generated. A vector time series identical to the vector time series generated by using must be generated. If the mixing coefficient β is greater than 0 and less than 1, it is generated using the vector time series generated using HMM # 1 and HMM # 2 according to the value of the mixing coefficient β. An intermediate vector time series that is mixed with the vector time series must be generated.

そこで、まず、HMM#1の各状態Siの継続時間の期待値d1,d2,・・・,dNを、式(7)により求めるとともに、HMM#2の各状態S'jの継続時間の期待値d'1,d'2,・・・,dMを、式(7)により求める。 Therefore, first, HMM # we expected value d 1 of the duration of each state S i of 1, d 2, · · ·, a d N, wherein together determined by (7), the HMM # 2 of each state S 'j Expected values d ′ 1 , d ′ 2 ,..., D M of the duration time are obtained by Expression (7).

HMM#1の全体継続時間(HMM#1を用いて生成されるベクトル時系列の長さ)Tは、式(26)に示すように、HMM#1の各状態Siの継続時間の期待値d1,d2,・・・,dNの総和となる。 The overall duration of HMM # 1 (the length of the vector time series generated using HMM # 1) T is the expected value of the duration of each state S i of HMM # 1 as shown in Equation (26). This is the sum of d 1 , d 2 ,..., d N.

Figure 0004662139
・・・(26)
Figure 0004662139
... (26)

同様に、HMM#2の全体継続時間(HMM#2を用いて生成されるベクトル時系列の長さ)T'は、式(27)に示すように、HMM#2の各状態S'jの継続時間の期待値d'1,d'2,・・・,dMの総和となる。 Similarly, (vector time series is generated by using the HMM # 2 length) total duration of HMM # 2 T ', as shown in equation (27), the HMM # 2 each state S' of the j the duration of the expected value d '1, d' 2, ···, the sum of d M.

Figure 0004662139
・・・(27)
Figure 0004662139
... (27)

式(26)のHMM#1の全体継続時間Tと、式(27)のHMM#2の全体継続時間T'とは、必ずしも一致するとは限らない。そこで、HMM#1を用いて生成される長さがTのベクトル時系列と、HMM#2を用いて生成される長さがT'のベクトル時系列とを混合した中間的なベクトル時系列(以下、適宜、混合ベクトル時系列という)の長さT''を、どのようにするかが問題となるが、例えば、混合係数βに基づき、式(28)にしたがって決定することとする。   The total duration T of HMM # 1 in equation (26) and the total duration T ′ of HMM # 2 in equation (27) do not necessarily match. Therefore, an intermediate vector time series in which a vector time series of length T generated using HMM # 1 and a vector time series of length T ′ generated using HMM # 2 is mixed ( Hereinafter, it will be a problem how to determine the length T ″ of the mixed vector time series as appropriate. For example, the length T ″ is determined according to the equation (28) based on the mixing coefficient β.

Figure 0004662139
・・・(28)
Figure 0004662139
... (28)

HMM#1を用いて生成される長さがTのベクトル時系列と、HMM#2を用いて生成される長さがT'のベクトル時系列との長さを、式(28)で求められる混合ベクトル時系列の長さT''に調整する(一致させる)ため、HMM#1を用いて生成されるベクトル時系列の長さを調整する係数γと、HMM#2を用いて生成されるベクトル時系列の長さを調整する係数γ'とを、それぞれ、式(29)と式(30)とにより求める。   The length of the vector time series having a length of T generated using HMM # 1 and the vector time series having a length of T ′ generated using HMM # 2 is obtained by Expression (28). To adjust (match) to the mixed vector time series length T ″, the coefficient is generated using HMM # 2 and the coefficient γ that adjusts the length of the vector time series generated using HMM # 1. A coefficient γ ′ for adjusting the length of the vector time series is obtained by Expression (29) and Expression (30), respectively.

Figure 0004662139
・・・(29)
Figure 0004662139
... (29)

Figure 0004662139
・・・(30)
Figure 0004662139
... (30)

そして、HMM#1の各状態Siの継続時間の期待値d1,d2,・・・,dNを、係数γを用いて、γ×d1,γ×d2,・・・,γ×dNに調整する。同様に、HMM#2の各状態S'jの継続時間の期待値d'1,d'2,・・・,dMも、係数γ'を用いて、γ'×d'1,γ'×d'2,・・・,γ'×d'Mに調整する。 Then, the expected values d 1 , d 2 ,..., D N of the durations of the respective states S i of HMM # 1 are expressed as γ × d 1 , γ × d 2 ,. adjusted to γ × d N. Similarly, the expected values d ′ 1 , d ′ 2 ,..., D M of the respective states S ′ j of HMM # 2 are also expressed as γ ′ × d ′ 1 , γ ′ using the coefficient γ ′. × d ′ 2 ,..., Γ ′ × d ′ M

以上の結果、HMM#1の全体継続時間はγ×T(=T'')となり、HMM#2の全体継続時間はγ'×T'(=T'')となって、いずれも、式(28)の混合ベクトル時系列の長さT''となる。   As a result of the above, the overall duration of HMM # 1 is γ × T (= T ''), and the overall duration of HMM # 2 is γ '× T' (= T ''). The length T ″ of the mixed vector time series of (28) is obtained.

以上のように、HMM#1の全体継続時間と、HMM#2の全体継続時間とが、式(28)の混合ベクトル時系列の長さT''となるように、HMM#1の各状態Siの継続時間の期待値d1,d2,・・・,dNを、それぞれγ×d1,γ×d2,・・・,γ×dNに調整するとともに、HMM#2の各状態S'jの継続時間の期待値d'1,d'2,・・・,dMを、それぞれγ'×d'1,γ'×d'2,・・・,γ'×d'Mに調整した後、HMM#1について、調整後の継続時間の期待値γ×diを用いて、状態確率を求めるとともに、HMM#2についても、調整後の継続時間の期待値γ×d'jを用いて、状態確率を求める。 As described above, each state of HMM # 1 is set such that the total duration of HMM # 1 and the total duration of HMM # 2 are the length T ″ of the mixed vector time series of Equation (28). expected value d 1 of the duration of S i, d 2, ···, a d N, respectively γ × d 1, γ × d 2, ···, while adjusting the gamma × d N, of HMM # 2 The expected values d ′ 1 , d ′ 2 ,..., D M of the states S ′ j are respectively expressed as γ ′ × d ′ 1 , γ ′ × d ′ 2 ,. 'After adjusting to M , for HMM # 1, use the expected duration value after adjustment γ × d i to obtain the state probability, and for HMM # 2, also after adjusting the expected duration value γ × The state probability is obtained using d' j .

ここで、HMM#1について求められる状態確率を、Pi(t)と表し、HMM#2について求められる状態確率を、P'j(t)と表す。 Here, the state probability obtained for HMM # 1 is represented as P i (t), and the state probability obtained for HMM # 2 is represented as P ′ j (t).

HMM#1については、各状態Si(i=1,2,・・・,N)に対して時刻t=1,2,・・・,T''の状態確率Pi(t)が求められ、HMM#2については、各状態S'j(j=1,2,・・・,M)に対して時刻t=1,2,・・・,T''の状態確率P'j(t)が求められる。 For HMM # 1, the state probability P i (t) at time t = 1, 2,..., T '' is obtained for each state S i (i = 1, 2,..., N). For HMM # 2, for each state S ′ j (j = 1, 2,..., M), the state probability P ′ j ( t) is required.

HMM#1の状態確率Pi(t)は、時刻tにおいて、HMM#1の状態S1, S2, S3,・・・,SNがベクトルを出力する確率を表し、HMM#2の状態確率P'j(t)は、時刻tにおいて、HMM#2の状態S'1, S'2, S'3,・・・,S'Mがベクトルを出力する確率を表す。 The state probability P i (t) of HMM # 1 represents the probability that the states S 1 , S 2 , S 3 ,..., S N of HMM # 1 output a vector at time t. The state probability P ′ j (t) represents the probability that the states S ′ 1 , S ′ 2 , S ′ 3 ,..., S ′ M of the HMM # 2 output a vector at time t.

即ち、時刻tにおいて、HMM#1の状態S1, S2, S3,・・・,SNがベクトルを出力する確率は、それぞれ、P1(t),P2(t),P3(t),・・・,PN(t)であり、HMM#2の状態S'1, S'2, S'3,・・・,S'Mがベクトルを出力する確率は、それぞれ、P'1(t),P'2(t),P'3(t),・・・,P'M(t)である。 That is, the probability that the state S 1 , S 2 , S 3 ,..., S N of HMM # 1 outputs a vector at time t is P 1 (t), P 2 (t), P 3, respectively. (t), · · ·, a P N (t), the probability of HMM # 2 states S '1, S' 2, S '3, ···, S' M outputs a vector, respectively, P ′ 1 (t), P ′ 2 (t), P ′ 3 (t),..., P ′ M (t).

混合ベクトル時系列の時刻tのベクトルxtは、時刻tにおいて、HMM#1から出力されるベクトルと、HMM#2から出力されるベクトルとを、混合係数βにしたがった比率β:1−βで混合したベクトルであり、式(31)で与えられる。 The vector x t at time t of the mixed vector time series is a ratio β: 1−β according to the mixing coefficient β between the vector output from the HMM # 1 and the vector output from the HMM # 2 at the time t. And is given by equation (31).

Figure 0004662139
・・・(31)
Figure 0004662139
... (31)

ここで、式(31)において、μiは、HMM#1の状態Siに定義された出力確率密度関数から求められる平均ベクトルであり、μ'jは、HMM#2の状態S'jに定義された出力確率密度関数から求められる平均ベクトルである。 Here, in Expression (31), μ i is an average vector obtained from the output probability density function defined in the state S i of HMM # 1, and μ ′ j is the state S ′ j of HMM # 2. An average vector obtained from a defined output probability density function.

式(31)にしたがい、ベクトルxtを、時刻t=1,2,・・・.,T''それぞれに対して求めることにより、長さがT''のベクトル時系列x1,x2,・・・,xT''を得ることができる。 According to the equation (31), the vector x t is obtained for each of the times t = 1, 2,..., T ″, so that the vector time series x 1 , x 2 of length T ″ is obtained. , ..., x T '' can be obtained.

なお、式(5)から、HMM#1の状態S1乃至SNに亘る状態確率Pi(t)のサメーションΣPi(t)と、HMM#2の状態S1乃至SMに亘る状態確率P'j(t)のサメーションΣP'j(t)とは、いずれも1であり、従って、式(31)の混合係数β、状態確率Pi(t)、P'j(t)については、式(32)が成立する。 From equation (5), the summation ΣP i (t) of the state probability P i (t) over the states S 1 to S N of the HMM # 1 and the state over the states S 1 to S M of the HMM # 2 The summation ΣP′j (t) of the probability P ′ j (t) is 1, and therefore, the mixing coefficient β, the state probability P i (t), P ′ j (t) in the equation (31). With respect to, equation (32) holds.

Figure 0004662139
・・・(32)
Figure 0004662139
... (32)

式(31)および式(32)によれば、混合ベクトル時系列の時刻tのベクトルxtは、HMM#1とHMM#2のすべての状態から出力される平均ベクトルを線形結合したベクトルとなっており、その線形結合に用いられる重みが混合係数β、状態確率Pi(t)、および状態確率P'j(t)によって調整されることになる。 According to Expression (31) and Expression (32), the vector x t at the time t of the mixed vector time series is a vector obtained by linearly combining the average vectors output from all the states of HMM # 1 and HMM # 2. The weight used for the linear combination is adjusted by the mixing coefficient β, the state probability P i (t), and the state probability P ′ j (t).

また、上述の場合には、混合係数βが、式0.0<=β<=1.0を満たすものとして説明を行ったが、混合係数βの値が負の場合であっても、1.0より大きい場合であっても、式(32)は成立する。従って、任意の値の混合係数βを採用して、式(31)によりベクトルxtを求めることができる。混合係数βが、式0.0<=β<=1.0を満たす値である場合には、HMM#1と#2との、いわば内分点に相当する合成HMMから出力されるベクトル時系列を求めることができる。また、混合係数βが、例えば、-1.0のような負の値である場合や、例えば、1.5のような1.0より大きい値である場合には、HMM#1と#2との、いわば外分点に相当する合成HMMから出力されるベクトル時系列を求めることができる。 In the above case, the description has been made assuming that the mixing coefficient β satisfies the expression 0.0 <= β <= 1.0. However, even when the value of the mixing coefficient β is negative, the mixing coefficient β is larger than 1.0. Even if it exists, Formula (32) is materialized. Therefore, the vector x t can be obtained from the equation (31) by adopting an arbitrary value of the mixing coefficient β. When the mixing coefficient β is a value satisfying the expression 0.0 <= β <= 1.0, the vector time series output from the combined HMM corresponding to the inner dividing point of HMM # 1 and # 2 is obtained. Can do. Further, when the mixing coefficient β is a negative value such as −1.0, for example, or a value larger than 1.0 such as 1.5, for example, the external division of HMM # 1 and # 2 A vector time series output from the combined HMM corresponding to the points can be obtained.

ここで、上述のような混合ベクトル時系列の生成は、HMM#1の状態数NとHMM#2の状態数Mが一致する場合であっても、一致しない場合であっても行うことができる。   Here, the generation of the mixed vector time series as described above can be performed regardless of whether the number of states N of HMM # 1 and the number of states M of HMM # 2 match or not. .

また、上述の場合には、継続時間の期待値をそのまま用いて求められる式(26)のHMM#1の全体継続時間Tと、式(27)のHMM#2の全体継続時間T'とを用い、式(28)にしたがって、混合ベクトル時系列の長さT"を決定するようにしたが、混合ベクトル時系列の長さT"は、その他、例えば、式(25)によって、HMM#1や#2の継続時間の期待値を調整し、その調整後の継続時間の期待値を用いて求められるHMM#1と#2の全体継続時間を用いて決定することも可能である。   Further, in the above-described case, the total duration T of HMM # 1 in Expression (26) obtained using the expected value of the duration as it is and the total duration T ′ of HMM # 2 in Expression (27) are obtained. The length T ″ of the mixed vector time series is determined according to the equation (28). The length T ″ of the mixed vector time series is determined by, for example, the HMM # 1 according to the equation (25), for example. It is also possible to adjust the expected value of the duration time of # 2 and # 2 and determine using the total duration time of HMM # 1 and # 2 obtained using the expected value of the duration time after the adjustment.

また、上述の場合には、2つのHMM#1と#2を混合するようにしたが(HMM#1から出力されるベクトル時系列とHMM#2から出力されるベクトル時系列とを混合するようにしたが)、その他、3以上のHMMを混合することも可能である。   In the above case, the two HMM # 1 and # 2 are mixed (the vector time series output from HMM # 1 and the vector time series output from HMM # 2 are mixed). It is also possible to mix three or more HMMs.

次に、図24のフローチャートを参照して、上述のように、HMMを混合する場合に、図11の状態確率推定部3で行われる状態確率推定処理について説明する。なお、ここでは、2つのHMM#1と#2を混合することとし、その2つのHMM#1と#2が、選択部2(図1)によって、HMM記憶部1から読み出され、状態確率推定部3に供給されることとする。   Next, with reference to the flowchart of FIG. 24, the state probability estimation process performed in the state probability estimation part 3 of FIG. 11 when mixing HMM as mentioned above is demonstrated. Here, it is assumed that two HMM # 1 and # 2 are mixed, and the two HMM # 1 and # 2 are read from the HMM storage unit 1 by the selection unit 2 (FIG. 1), and the state probability It is assumed that it is supplied to the estimation unit 3.

継続時間長算出部21は、選択部2(図1)からHMM#1と#2の供給を受け、ステップS71において、選択部2からのHMM#1の状態遷移確率aijを用いて、式(7)で表されるHMM#1の各状態Siの継続時間nの期待値di(=E[n])を算出するとともに、選択部2からのHMM#2の状態遷移確率a'ijを用いて、式(7)で表されるHMM#2の各状態S'jの継続時間nの期待値d'j(=E[n])を算出して、ステップS72に進む。 The duration length calculation unit 21 receives the supply of HMM # 1 and # 2 from the selection unit 2 (FIG. 1), and uses the state transition probability a ij of the HMM # 1 from the selection unit 2 in step S71. The expected value d i (= E [n]) of the duration n of each state S i of HMM # 1 represented by (7) is calculated, and the state transition probability a ′ of HMM # 2 from the selection unit 2 Using ij , the expected value d ′ j (= E [n]) of the duration n of each state S ′ j of HMM # 2 represented by Expression (7) is calculated, and the process proceeds to step S72.

ステップS72では、継続時間長算出部21は、HMM#1の各状態Siの継続時間nの期待値diと、HMM#2の各状態S'jの継続時間nの期待値d'jとを調整する。 At step S72, the duration calculator 21, HMM expected value d i of duration n of each state S i of the # 1, HMM # 2 'of the expected value d duration n of j' j each state S And adjust.

即ち、継続時間長算出部21は、HMM#1の全体継続時間(HMM#1を用いて生成されるベクトル時系列の長さ)Tを、式(26)にしたがい、HMM#1の各状態Siの継続時間の期待値d1,d2,・・・,dNの総和をとることによって求めるとともに、HMM#2の全体継続時間(HMM#2を用いて生成されるベクトル時系列の長さ)T'を、式(27)にしたがい、HMM#2の各状態S'jの継続時間の期待値d'1,d'2,・・・,dMの総和をとることによって求める。 In other words, the duration calculation unit 21 determines the total duration of the HMM # 1 (the length of the vector time series generated using the HMM # 1) T according to the equation (26), The sum of expected values d 1 , d 2 ,..., D N of the duration of S i is obtained , and the total duration of HMM # 2 (the vector time series generated using HMM # 2 Length) T ′ is obtained by taking the sum of expected values d ′ 1 , d ′ 2 ,..., D M of the durations of the states S ′ j of HMM # 2 in accordance with equation (27). .

さらに、継続時間長算出部21は、HMM#1の全体継続時間T、HMM#2の全体継続時間T'、および混合係数βを用い、式(28)にしたがって、HMM#1と#2とを混合した合成HMMから出力される混合ベクトル時系列の長さT''を求める。   Further, the duration calculation unit 21 uses the total duration T of HMM # 1, the total duration T ′ of HMM # 2, and the mixing coefficient β, and HMM # 1 and # 2 according to Expression (28). The length T ″ of the mixed vector time series output from the combined HMM obtained by mixing is obtained.

ここで、混合係数βは、例えば、あらかじめ設定しておくことができる。また、混合係数βは、例えば、ユーザが、図示せぬ操作部を操作することにより、あるいは、図1の状態確率推定部3およびベクトル時系列生成部4から構成されるベクトル時系列出力部10を使用するアプリケーションから与えることができる。   Here, the mixing coefficient β can be set in advance, for example. Further, the mixing coefficient β is obtained by, for example, operating the operation unit (not shown) by the user, or the vector time series output unit 10 configured by the state probability estimation unit 3 and the vector time series generation unit 4 of FIG. Can be given from the application to use.

継続時間長算出部21は、混合ベクトル時系列の長さT''を求めると、その長さT''に基づき、HMM#1を用いて生成されるベクトル時系列の長さを調整する係数γを、式(29)にしたがって求めるとともに、HMM#2を用いて生成されるベクトル時系列の長さを調整する係数γ'を、式(30)にしたがって求める。   When the duration time calculating unit 21 obtains the length T ″ of the mixed vector time series, a coefficient for adjusting the length of the vector time series generated using the HMM # 1 based on the length T ″. γ is obtained according to Equation (29), and a coefficient γ ′ for adjusting the length of the vector time series generated using HMM # 2 is obtained according to Equation (30).

そして、継続時間長算出部21は、HMM#1の各状態Siの継続時間の期待値d1,d2,・・・,dNを、係数γを用いて、γ×d1,γ×d2,・・・,γ×dNに調整するとともに、HMM#2の各状態S'jの継続時間の期待値d'1,d'2,・・・,dMも、係数γ'を用いて、γ'×d'1,γ'×d'2,・・・,γ'×d'Mに調整する。 Then, the duration calculation unit 21 uses the coefficient γ to calculate γ × d 1 , γ using the expected values d 1 , d 2 ,..., D N of the durations of the states S i of the HMM # 1. × d 2, · · ·, as well as adjusting the γ × d N, HMM # 'expected value d of the duration of j' 1 each state S of 2, d '2, · · ·, d M also, the coefficient gamma To adjust to γ ′ × d ′ 1 , γ ′ × d ′ 2 ,..., Γ ′ × d ′ M.

その後、継続時間長算出部21は、HMM#1の各状態Siの継続時間の期待値の調整後の値γ×d1,γ×d2,・・・,γ×dNと、HMM#2の各状態S'jの継続時間の期待値の調整後の値γ'×d'1,γ'×d'2,・・・,γ'×d'Mを、期待遷移時刻算出部22に供給して、ステップS72からステップS73に進む。 Thereafter, the duration length calculator 21 adjusts the expected value of the duration of each state S i of the HMM # 1 after adjustment γ × d 1 , γ × d 2 ,..., Γ × d N and the HMM The value γ ′ × d ′ 1 , γ ′ × d ′ 2 ,..., Γ ′ × d ′ M after adjustment of the expected value of the duration of each state S ′ j in # 2 is calculated as an expected transition time calculation unit. 22 and proceeds from step S72 to step S73.

ステップS73では、期待遷移時刻算出部22は、継続時間長算出部21からのHMM#1の各状態Siの継続時間の期待値の調整後の値γ×d1,γ×d2,・・・,γ×dNを用いて、期待遷移時刻tiと、逆期待遷移時刻ti'とを求め、期待遷移時刻tiを、前向き遷移確率決定部23Fに供給するとともに、逆期待遷移時刻ti'を、後ろ向き遷移確率決定部23Bに供給して、ステップS74に進む。 In step S73, the expected transition time calculation unit 22 adjusts the expected values of the durations of the states S i of the HMM # 1 from the duration length calculation unit 21 γ × d 1 , γ × d 2 ,. ..., using a gamma × d N, the expected transition time t i, obtains an inverse expected transition time t i ', the expected transition time t i, and supplies the forward transition probability determining unit 23F, reverse expected transition The time t i ′ is supplied to the backward transition probability determining unit 23B, and the process proceeds to step S74.

ステップS74では、前向き遷移確率決定部23Fが、期待遷移時刻算出部22からの期待遷移時刻tiを用い、式(9)の前向き遷移確率qi(t)を求め、前向き状態確率算出部24Fに供給するとともに、後ろ向き遷移確率決定部23Bが、期待遷移時刻算出部22からの逆期待遷移時刻ti'を用い、式(10)の後ろ向き遷移確率ri(t)を求め、後ろ向き状態確率算出部24Bに供給して、ステップS75に進む。 In step S74, the forward transition probability determining unit 23F uses the expected transition time t i from the expected transition time calculating unit 22 to obtain the forward transition probability q i (t) of Expression (9), and the forward state probability calculating unit 24F. , The backward transition probability determination unit 23B obtains the backward transition probability r i (t) of Equation (10) using the reverse expected transition time t i ′ from the expected transition time calculation unit 22, and the backward state probability The voltage is supplied to the calculation unit 24B and proceeds to step S75.

ステップS75では、前向き状態確率算出部24Fが、前向き遷移確率決定部23Fからの前向き遷移確率qi(t)を用い、式(13)の前向き状態確率Pfi(t)を求めて、状態確率算出部25に供給するとともに、後ろ向き状態確率算出部24Bが、後ろ向き遷移確率決定部23Bからの後ろ向き遷移確率ri(t)を用いて、式(17)の後ろ向き状態確率Pbi(t)を求めて、状態確率算出部25に供給して、ステップS76に進む。 In step S75, the forward state probability calculation unit 24F uses the forward transition probability q i (t) from the forward transition probability determination unit 23F to obtain the forward state probability Pf i (t) of Expression (13), and the state probability The backward state probability calculation unit 24B supplies the backward state probability Pb i (t) of Expression (17) using the backward transition probability r i (t) from the backward transition probability determination unit 23B. Obtained and supplied to the state probability calculation unit 25, the process proceeds to step S76.

ステップS76では、状態確率算出部25が、前向き状態確率算出部24Fからの前向き状態確率Pfi(t)と、後ろ向き状態確率算出部24Bからの後ろ向き状態確率Pbi(t)とを用いて、式(19)の状態確率Pi(t)、即ち、HMM#1の各状態Si(i=1,2,・・・,N)が各時刻t(=1,2,・・・,T''(=γ×T))においてベクトルを出力する確率である状態確率Pi(t)を求める。 In step S76, the state probability calculation unit 25 uses the forward state probability Pf i (t) from the forward state probability calculation unit 24F and the backward state probability Pb i (t) from the backward state probability calculation unit 24B. The state probability P i (t) of equation (19), that is, each state S i (i = 1, 2,..., N) of HMM # 1 is changed to each time t (= 1, 2,. A state probability P i (t) that is a probability of outputting a vector at T ″ (= γ × T)) is obtained.

ステップS73乃至S76の処理は、HMM#2についても同様にして行われ、これにより、状態確率算出部25では、HMM#2についての式(19)の状態確率Pi(t)、即ち、HMM#2の各状態Sj(j=1,2,・・・,N)が各時刻t(=1,2,・・・,T''(=γ'×T'))においてベクトルを出力する確率である状態確率P'j(t)も求められる。 The processing in steps S73 to S76 is performed in the same manner for HMM # 2, and thus the state probability calculation unit 25 causes the state probability P i (t) of Expression (19) for HMM # 2, ie, the HMM. Each state S j (j = 1,2, ..., N) of # 2 outputs a vector at each time t (= 1,2, ..., T '' (= γ '× T')) The state probability P ′ j (t), which is the probability of

そして、状態確率算出部25は、HMM#1についての状態確率Pi(t)と、HMM#2についての状態確率P'j(t)とを、後段のベクトル時系列生成部4(図1)に供給して、状態確率推定処理を終了する。 Then, the state probability calculation unit 25 uses the state probability P i (t) for HMM # 1 and the state probability P ′ j (t) for HMM # 2 as the vector time-series generation unit 4 (FIG. 1). ) To finish the state probability estimation process.

次に、図25のフローチャートを参照して、上述のように、HMMを混合する場合に、図13のベクトル時系列生成部4で行われるベクトル時系列生成処理について説明する。なお、ここでは、図24の場合と同様に、2つのHMM#1と#2を混合することとし、その2つのHMM#1と#2が、選択部2(図1)によって、HMM記憶部1から読み出され、ベクトル時系列生成部4に供給されることとする。   Next, a vector time series generation process performed by the vector time series generation unit 4 in FIG. 13 when mixing HMMs as described above will be described with reference to the flowchart in FIG. Here, similarly to the case of FIG. 24, two HMM # 1 and # 2 are mixed, and the two HMM # 1 and # 2 are mixed by the selection unit 2 (FIG. 1) by the HMM storage unit. 1 and is supplied to the vector time series generation unit 4.

ベクトル時系列生成部4には、選択部2(図1)からHMM#1と#2が供給されるとともに、状態確率推定部3(図1)から、図24の状態確率推定処理が行われることにより得られるHMM#1についての状態確率Pi(t)と、HMM#2についての状態確率P'j(t)とが供給される。 The vector time series generation unit 4 is supplied with HMM # 1 and # 2 from the selection unit 2 (FIG. 1), and the state probability estimation unit 3 (FIG. 1) performs the state probability estimation process of FIG. Thus, the state probability P i (t) for HMM # 1 and the state probability P ′ j (t) for HMM # 2 are supplied.

期待値取得部31は、選択部2(図1)からHMM#1と#2の供給を受け、ステップS81において、選択部2から供給されるHMM#1の出力確率密度関数bi(x)から、その出力確率密度関数bi(x)が表す確率分布にしたがうベクトルxの期待値を、選択部2からのHMM#1において出力確率密度関数b1(x),b2(x),・・・,bN(x)が定義されている各状態S1,S2,・・・,SNについて求め、期待値算出部32に供給する。 The expected value acquisition unit 31 receives the supply of HMM # 1 and # 2 from the selection unit 2 (FIG. 1), and outputs the probability probability function b i (x) of the HMM # 1 supplied from the selection unit 2 in step S81. From the expected value of the vector x according to the probability distribution represented by the output probability density function b i (x) in the HMM # 1 from the selection unit 2, the output probability density function b 1 (x), b 2 (x), .., B N (x) are defined for each state S 1 , S 2 ,..., S N and supplied to the expected value calculation unit 32.

即ち、期待値取得部31は、選択部2からのHMM#1において出力確率密度関数b1(x),b2(x),・・・,bN(x)が定義されている各状態S1,S2,・・・,SNについて、出力確率密度関数b1(x),b2(x),・・・,bN(x)が表す正規分布を規定する平均ベクトルμ1,μ2,・・・,μNを求め、期待値算出部32に供給する。 That is, the expectation value acquisition unit 31 has each state in which the output probability density functions b 1 (x), b 2 (x),..., B N (x) are defined in the HMM # 1 from the selection unit 2. For S 1 , S 2 ,..., S N , the mean vector μ 1 that defines the normal distribution represented by the output probability density function b 1 (x), b 2 (x), ..., b N (x) , Μ 2 ,..., Μ N are obtained and supplied to the expected value calculation unit 32.

同様に、期待値取得部31は、選択部2からのHMM#2についても、HMM#2において出力確率密度関数b'1(x),b'2(x),・・・,b'M(x)が定義されている各状態S'1,S'2,・・・,S'Mについて、出力確率密度関数b'1(x),b'2(x),・・・,b'M(x)が表す正規分布を規定する平均ベクトルμ'1,μ'2,・・・,μ'Mを求め、期待値算出部32に供給する。 Similarly, the expected value acquisition unit 31 also outputs the output probability density functions b ′ 1 (x), b ′ 2 (x),..., B ′ M for the HMM # 2 from the selection unit 2 in the HMM # 2. For each state S ′ 1 , S ′ 2 ,..., S ′ M in which (x) is defined, output probability density functions b ′ 1 (x), b ′ 2 (x),. Mean vectors μ ′ 1 , μ ′ 2 ,..., Μ ′ M that define the normal distribution represented by “ M (x) are obtained and supplied to the expected value calculation unit 32.

そして、ステップS81からステップS82に進み、期待値算出部32は、状態確率推定部3(図1)からのHMM#1についての状態確率Pi(t)と、HMM#2についての状態確率P'j(t)との供給を受け、期待値取得部31から供給されるHMM#1についての平均ベクトルμ1,μ2,・・・,μNと、状態確率推定部3から供給される時刻tについてのHMM#1の状態確率P1(t),P2(t),・・・,PN(t)との積和演算、つまり、式(31)の右辺第1項の括弧内のサメーションの演算を行い、その積和演算結果ΣPi(t)・μiを、時刻tにHMM#1から出力されるベクトルの期待値として求める。 Then, the process proceeds from step S81 to step S82, where the expected value calculation unit 32 determines the state probability P i (t) for HMM # 1 from the state probability estimation unit 3 (FIG. 1) and the state probability P for HMM # 2. ' j (t) and the mean vector μ 1 , μ 2 ,..., μ N for HMM # 1 supplied from the expected value acquisition unit 31 and the state probability estimation unit 3 HMM # 1 state probabilities P 1 (t), P 2 (t),..., P N (t) at time t, that is, parentheses in the first term on the right side of equation (31) The summation calculation result ΣP i (t) · μ i is obtained as the expected value of the vector output from the HMM # 1 at time t.

同様に、期待値算出部32は、期待値取得部31から供給されるHMM#2についての平均ベクトルμ'1,μ'2,・・・,μ'Mと、状態確率推定部3から供給される時刻tについてのHMM#2の状態確率P'1(t),P'2(t),・・・,P'M(t)との積和演算、つまり、式(31)の右辺第2項の括弧内のサメーションの演算を行い、その積和演算結果ΣP'j(t)・μ'jを、時刻tにHMM#2から出力されるベクトルの期待値として求める。 Similarly, the expected value calculation unit 32 supplies the average vectors μ ′ 1 , μ ′ 2 ,..., Μ ′ M for HMM # 2 supplied from the expected value acquisition unit 31 and the state probability estimation unit 3. Product-sum operation with the state probabilities P ′ 1 (t), P ′ 2 (t),..., P ′ M (t) of the HMM # 2 at the time t to be performed, that is, the right side of the expression (31) Summation calculation in parentheses in the second term is performed, and the product-sum operation result ΣP ′ j (t) · μ ′ j is obtained as an expected value of the vector output from HMM # 2 at time t.

期待値算出部32は、ステップS82において、時刻t=1,2,・・・,T''ごとの、HMM#1から出力されるベクトルxの期待値ΣPi(t)・μiと、HMM#2から出力されるベクトルxの期待値ΣP'j(t)・μ'jとを求めると、ステップS83に進み、式(31)にしたがい、時刻tごとに、HMM#1から出力されるベクトルxの期待値ΣPi(t)・μiと、HMM#2から出力されるベクトルxの期待値ΣP'j(t)・μ'jとを、混合係数βに基づく比率β:1-βで混合し、全体継続時間がT''の混合ベクトル時系列x1,x2,・・・,xTを求める。そして、期待値算出部32は、ステップS83からステップS84に進み、混合ベクトル時系列x1,x2,・・・,xTを出力して、ベクトル時系列生成処理を終了する。 In step S82, the expected value calculation unit 32 calculates the expected value ΣP i (t) · μ i of the vector x output from the HMM # 1 for each time t = 1, 2,. When the expected value ΣP ′ j (t) · μ ′ j of the vector x output from HMM # 2 is obtained, the process proceeds to step S83, and is output from HMM # 1 at time t according to equation (31). The ratio of the expected value ΣP i (t) · μ i of the vector x and the expected value ΣP ' j (t) · μ' j of the vector x output from the HMM # 2 to the ratio β: 1 The mixed vector time series x 1 , x 2 ,..., x T is obtained by mixing at −β and the total duration T ″. Then, the expected value calculation unit 32 proceeds from step S83 to step S84, outputs the mixed vector time series x 1 , x 2 ,..., X T and ends the vector time series generation process.

以上のように、各時刻tにおいて、HMMの各状態Siがベクトルを出力する確率である状態確率Pi(t)を導入し、その状態確率Pi(t)に基づき、HMMが出力するベクトルxの期待値を解析的に計算することで、ベクトル時系列x1,x2,・・・,xTを生成するようにしたので、滑らかに変化する時系列データを容易に得ることができる他、状態確率Pi(t)を求める時刻tの時間間隔の調整等によって、HMMから出力されるベクトル時系列の長さや時間間隔その他の特性の調整を容易に行うことが可能となる。 As described above, at each time t, the state probability P i (t) that is the probability that each state S i of the HMM outputs a vector is introduced, and the HMM outputs based on the state probability P i (t) By calculating the expected value of the vector x analytically, the vector time series x 1 , x 2 , ..., x T is generated, so that time series data that changes smoothly can be easily obtained. In addition, it is possible to easily adjust the length of the vector time series output from the HMM, the time interval, and other characteristics by adjusting the time interval for obtaining the state probability P i (t).

また、複数のHMMどうしを結合した結合HMMからのベクトル時系列の生成や、周期的なベクトル時系列の生成、さらには、複数のHMMを混合した合成HMMからのベクトル時系列(混合ベクトル時系列)の生成なども容易に行うことが可能となる。   Also, generation of vector time series from combined HMMs that combine multiple HMMs, generation of periodic vector time series, and vector time series from combined HMMs that mix multiple HMMs (mixed vector time series) ) Can be easily generated.

即ち、例えば、1の状態から他の1の状態に遷移する時刻(期待遷移時刻ti、逆期待遷移時刻t'i)が所定の確率分布としての、例えば、正規分布にしたがうこととして、状態確率Pi(t)が推定されるが、その正規分布の分散(式(9)の分散σ2や式(10)の分散σ'2)を調整可能としたので、その調整によって、HMMから出力されるベクトル時系列の特性を、容易に調整することができる。 That is, for example, the time when transition from one state to another state (expected transition time t i , reverse expected transition time t ′ i ) is a predetermined probability distribution, for example, according to a normal distribution, The probability P i (t) is estimated, but since the variance of the normal distribution (the variance σ 2 in equation (9) and the variance σ ′ 2 in equation (10)) can be adjusted, The characteristics of the output vector time series can be easily adjusted.

さらに、例えば、状態確率Pi(t)を推定する時刻の間隔も、1だけでなく、0.1等に調整可能としたので、その調整によって、HMMから出力されるベクトル時系列のベクトル間の時間間隔を、容易に調整することができる。 Furthermore, for example, the time interval for estimating the state probability P i (t) can be adjusted not only to 1 but also to 0.1 etc., so that the time between vectors in the vector time series output from the HMM can be adjusted by the adjustment. The interval can be easily adjusted.

また、例えば、複数のHMMを結合することにより得られる新たな状態遷移確率モデルとしての結合HMMの各状態について、状態確率Pi(t)を推定することにより、複数のHMMそれぞれから出力されるベクトル時系列を並べたベクトル時系列であって、滑らかに変化するベクトル時系列を、容易に生成することができる。 In addition, for example, by estimating the state probability P i (t) for each state of the combined HMM as a new state transition probability model obtained by combining a plurality of HMMs, it is output from each of the plurality of HMMs. A vector time series in which vector time series are arranged can be easily generated.

さらに、例えば、同一の3つのHMM#1,#2,#3を結合した結合HMMについて、状態確率Pi(t)を推定して、その状態確率Pi(t)のうちの、HMM#2の各状態に対応する分の状態確率Pi'(t)だけを取り出し、その状態確率Pi'(t)に基づいて、ベクトル時系列を生成することにより、周期的なベクトル時系列を、容易に生成することができる。 Furthermore, for example, the same three HMM # 1, # 2, for binding HMM that combines # 3, to estimate the state probabilities P i (t), of its state probability P i (t), HMM # By extracting only the state probabilities P i ′ (t) corresponding to each state of 2 and generating a vector time series based on the state probabilities P i ′ (t), a periodic vector time series is obtained. Can be easily generated.

また、例えば、HMM#1の状態確率Pi(t)と、HMM#2の状態確率P'j(t)とを、HMM#1が出力するベクトル時系列の長さと、HMM#2が出力するベクトル時系列の長さとが同一になるように調整をして推定し、HMM#1の状態確率Pi(t)とHMM#1の状態が出力する代表的なデータとしての平均ベクトルμi、および、HMM#2の状態確率P'j(t)とHMM#2の状態が出力する代表的なデータとしての平均ベクトルμ'jに基づいて、ベクトル時系列を生成することにより、HMM#1とHMM#2とを混合した合成HMMが出力する混合ベクトル時系列を、容易に得ることができる。即ち、HMM#1および#2のいずれでもない合成HMMが出力するベクトル時系列を、容易に得ることができる。 Also, for example, the state probability P i (t) of HMM # 1 and the state probability P ′ j (t) of HMM # 2, the length of the vector time series output by HMM # 1, and the output of HMM # 2 HMM # 1 state probability P i (t) and HMM # 1 state output as average data μ i HMM # 2 by generating a vector time series based on the state probability P ′ j (t) of HMM # 2 and the average vector μ ′ j as representative data output by the state of HMM # 2. It is possible to easily obtain a mixed vector time series output by the combined HMM obtained by mixing 1 and HMM # 2. That is, it is possible to easily obtain the vector time series output by the combined HMM that is neither HMM # 1 nor # 2.

次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。   Next, the series of processes described above can be performed by hardware or software. When a series of processing is performed by software, a program constituting the software is installed in a general-purpose computer or the like.

そこで、図26は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。   Therefore, FIG. 26 shows a configuration example of an embodiment of a computer in which a program for executing the series of processes described above is installed.

プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク105やROM103に予め記録しておくことができる。   The program can be recorded in advance in a hard disk 105 or a ROM 103 as a recording medium built in the computer.

あるいはまた、プログラムは、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory),MO(Magneto Optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体111に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体111は、いわゆるパッケージソフトウエアとして提供することができる。   Alternatively, the program is stored temporarily on a removable recording medium 111 such as a flexible disk, a CD-ROM (Compact Disc Read Only Memory), a MO (Magneto Optical) disk, a DVD (Digital Versatile Disc), a magnetic disk, or a semiconductor memory. It can be stored permanently (recorded). Such a removable recording medium 111 can be provided as so-called package software.

なお、プログラムは、上述したようなリムーバブル記録媒体111からコンピュータにインストールする他、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを、通信部108で受信し、内蔵するハードディスク105にインストールすることができる。   The program is installed in the computer from the removable recording medium 111 as described above, or transferred from the download site to the computer wirelessly via a digital satellite broadcasting artificial satellite, LAN (Local Area Network), The program can be transferred to a computer via a network such as the Internet, and the computer can receive the program transferred in this way by the communication unit 108 and install it in the built-in hard disk 105.

コンピュータは、CPU(Central Processing Unit)102を内蔵している。CPU102には、バス101を介して、入出力インタフェース110が接続されており、CPU102は、入出力インタフェース110を介して、ユーザによって、キーボードや、マウス、マイク等で構成される入力部107が操作等されることにより指令が入力されると、それにしたがって、ROM(Read Only Memory)103に格納されているプログラムを実行する。あるいは、また、CPU102は、ハードディスク105に格納されているプログラム、衛星若しくはネットワークから転送され、通信部108で受信されてハードディスク105にインストールされたプログラム、またはドライブ109に装着されたリムーバブル記録媒体111から読み出されてハードディスク105にインストールされたプログラムを、RAM(Random Access Memory)104にロードして実行する。これにより、CPU102は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU102は、その処理結果を、必要に応じて、例えば、入出力インタフェース110を介して、LCD(Liquid Crystal Display)やスピーカ等で構成される出力部106から出力、あるいは、通信部108から送信、さらには、ハードディスク105に記録等させる。   The computer includes a CPU (Central Processing Unit) 102. An input / output interface 110 is connected to the CPU 102 via the bus 101, and the CPU 102 operates an input unit 107 including a keyboard, a mouse, a microphone, and the like by the user via the input / output interface 110. When a command is input as a result, the program stored in a ROM (Read Only Memory) 103 is executed accordingly. Alternatively, the CPU 102 also transfers from a program stored in the hard disk 105, a program transferred from a satellite or a network, received by the communication unit 108 and installed in the hard disk 105, or a removable recording medium 111 attached to the drive 109. The program read and installed in the hard disk 105 is loaded into a RAM (Random Access Memory) 104 and executed. Thus, the CPU 102 performs processing according to the above-described flowchart or processing performed by the configuration of the above-described block diagram. Then, the CPU 102 outputs the processing result from the output unit 106 configured with an LCD (Liquid Crystal Display), a speaker, or the like, for example, via the input / output interface 110, or from the communication unit 108 as necessary. Transmission and further recording on the hard disk 105 are performed.

ここで、本明細書において、コンピュータに各種の処理を行わせるためのプログラムを記述する処理ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含むものである。   Here, in this specification, the processing steps for describing a program for causing a computer to perform various types of processing do not necessarily have to be processed in time series according to the order described in the flowchart, but in parallel or individually. This includes processing to be executed (for example, parallel processing or processing by an object).

また、プログラムは、1のコンピュータにより処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。   Further, the program may be processed by a single computer, or may be processed in a distributed manner by a plurality of computers. Furthermore, the program may be transferred to a remote computer and executed.

なお、本実施の形態では、ベクトル時系列を出力するベクトル時系列出力部10を、音声合成装置に適用した場合について説明したが、ベクトル時系列出力部10は、音声合成装置の他、ベクトル時系列、つまり、時系列の信号を入力として、その時系列の信号にしたがって処理を行う各種のシステム、即ち、例えば、時系列の信号であるモータ信号にしたがってアクチュエータ(モータ)を駆動することにより、腕や脚に対応する部分を動かすロボットなどに適用することができる。   In the present embodiment, the case where the vector time series output unit 10 that outputs a vector time series is applied to a speech synthesizer has been described. Various systems that take time series signals as input and perform processing according to the time series signals, for example, by driving an actuator (motor) according to a motor signal that is a time series signal, It can be applied to a robot that moves a part corresponding to a leg.

また、本実施の形態における「ベクトル」には、1次元のベクトル、つまり、スカラー量も含まれる。   The “vector” in the present embodiment includes a one-dimensional vector, that is, a scalar quantity.

さらに、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。   Furthermore, the embodiments of the present invention are not limited to the above-described embodiments, and various modifications can be made without departing from the gist of the present invention.

本発明を適用した音声合成装置の一実施の形態の構成例を示すブロック図である。It is a block diagram which shows the structural example of one Embodiment of the speech synthesizer to which this invention is applied. left-to-right型のHMMの例を示す図である。It is a figure which shows the example of left-to-right type HMM. 音声合成装置の処理を説明するフローチャートである。It is a flowchart explaining the process of a speech synthesizer. left-to-right型のHMMにおける状態遷移の仕方の例を示す図である。It is a figure which shows the example of the method of the state transition in left-to-right type HMM. 遷移時刻tがしたがう、平均値が期待遷移時刻tiで、分散がσ2の正規分布を示す図である。FIG. 10 is a diagram showing a normal distribution in which an average value is an expected transition time t i and a variance is σ 2 according to a transition time t. 前向き遷移確率qi(t)とHMMの状態との関係を示す図である。It is a figure which shows the relationship between forward transition probability q i (t) and the state of HMM. 後ろ向き遷移確率ri(t)とHMMの状態との関係を示す図である。It is a figure which shows the relationship between backward transition probability r i (t) and the state of HMM. 前向き状態確率Pfi(t)を模式的に示した図である。It is the figure which showed the forward state probability Pf i (t) typically. 後ろ向き状態確率Pbi(t)を模式的に示した図である。It is the figure which showed backward state probability Pb i (t) typically. 状態確率Pi(t)を模式的に示した図である。FIG. 6 is a diagram schematically showing a state probability P i (t). 状態確率推定部3の構成例を示すブロック図である。3 is a block diagram illustrating a configuration example of a state probability estimation unit 3. FIG. 状態確率推定処理を説明するフローチャートである。It is a flowchart explaining a state probability estimation process. ベクトル時系列生成部4の構成例を示すブロック図である。FIG. 3 is a block diagram illustrating a configuration example of a vector time series generation unit 4. ベクトル時系列生成処理を説明するフローチャートである。It is a flowchart explaining a vector time series production | generation process. シミュレーションでのHMMの学習に用いた学習データを示す図である。It is a figure which shows the learning data used for the learning of HMM in simulation. シミュレーションによってHMMから生成された1次元のベクトル時系列を示す図である。It is a figure which shows the one-dimensional vector time series produced | generated from HMM by simulation. 時刻tの刻み幅を1として求められる状態確率Pi(t)と、時刻tの刻み幅を0.1として求められる状態確率Pi(t)とを示す図である。FIG. 6 is a diagram showing a state probability P i (t) obtained when the step size at time t is 1 and a state probability P i (t) obtained when the step size at time t is 0.1. 2つのHMM#1と#2とを結合した結合HMMを示す図である。It is a figure which shows the joint HMM which couple | bonded two HMM # 1 and # 2. HMMを結合して、ベクトル時系列を生成する場合の音声合成装置の処理を説明するフローチャートである。It is a flowchart explaining the process of the speech synthesizer when combining HMMs to generate a vector time series. 終了状態SN+1の直前の状態SNから、初期状態S0の直後の状態S1に戻る遷移を与えたHMMを示す図である。FIG. 10 is a diagram showing an HMM that has given a transition from a state S N immediately before the end state S N + 1 to a state S 1 immediately after the initial state S 0 . 同一の3つのHMM#1,#2,#3を、その順で結合した結合HMMを示す図である。It is a figure which shows the coupling | bonding HMM which couple | bonded the same three HMM # 1, # 2, # 3 in the order. 周期的な軌道のベクトル時系列を生成する場合の音声合成装置の処理を説明するフローチャートである。It is a flowchart explaining the process of the speech synthesizer when generating a vector time series of a periodic trajectory. HMM#1から出力されるベクトル時系列とHMM#2から出力されるベクトル時系列とを混合した中間的なベクトル時系列を生成する方法を説明する図である。It is a figure explaining the method to produce | generate the intermediate | middle vector time series which mixed the vector time series output from HMM # 1, and the vector time series output from HMM # 2. HMMを混合する場合の、状態確率推定部3で行われる状態確率推定処理を説明するフローチャートである。It is a flowchart explaining the state probability estimation process performed in the state probability estimation part 3 in the case of mixing HMM. HMMを混合する場合の、ベクトル時系列生成部4で行われるベクトル時系列生成処理を説明するフローチャートである。It is a flowchart explaining the vector time series production | generation process performed in the vector time series production | generation part 4 in the case of mixing HMM. 本発明を適用したコンピュータの一実施の形態の構成例を示すブロック図である。It is a block diagram which shows the structural example of one Embodiment of the computer to which this invention is applied.

符号の説明Explanation of symbols

1 HMM記憶部, 2 選択部, 3 状態確率推定部, 4 ベクトル時系列生成部, 5 逆フィルタ, 10 ベクトル時系列出力部, 21 継続時間長算出部, 22 期待遷移時刻算出部, 23F 前向き遷移確率決定部, 23B 後ろ向き遷移確率決定部, 24F 前向き状態確率算出部, 24B 後ろ向き状態確率算出部, 25 状態確率算出部, 31 期待値取得部, 32 期待値算出部, 101 バス, 102 CPU, 103 ROM, 104 RAM, 105 ハードディスク, 106 出力部, 107 入力部, 108 通信部, 109 ドライブ, 110 入出力インタフェース, 111 リムーバブル記録媒体   1 HMM storage unit, 2 selection unit, 3 state probability estimation unit, 4 vector time series generation unit, 5 inverse filter, 10 vector time series output unit, 21 duration length calculation unit, 22 expected transition time calculation unit, 23F forward transition Probability determining unit, 23B backward transition probability determining unit, 24F forward state probability calculating unit, 24B backward state probability calculating unit, 25 state probability calculating unit, 31 expected value acquiring unit, 32 expected value calculating unit, 101 bus, 102 CPU, 103 ROM, 104 RAM, 105 hard disk, 106 output unit, 107 input unit, 108 communication unit, 109 drive, 110 input / output interface, 111 removable recording medium

Claims (11)

時系列のデータを出力するデータ出力装置において、
状態が遷移する状態遷移確率と、各状態が出力するデータの確率分布とで定義されるHMMの各状態について、所定の間隔の時刻ごとの、状態がデータを出力する状態確率を推定する状態確率推定手段と、
前記状態確率と、前記確率分布に従うデータの平均値とに基づいて、HMMが出力する所定の間隔の時刻ごとのデータを求め、時系列のデータとして出力する時系列データ生成手段と
を備え
前記状態確率推定手段は、前記HMMの各状態について、
自己遷移の状態遷移確率を用いて、自己遷移が生じる回数の期待値に対応する値を、自己遷移が継続する継続時間の期待値として求め、
ある状態から他の状態に遷移する遷移時刻が、前記継続時間の期待値の加算によって求められる期待遷移時刻を平均値とする正規分布に従うことを仮定して、前記正規分布を用いた漸化式により求められる、各時刻に、状態から状態遷移が始まる確率に対応する値を、各時刻の前記状態確率として求め、
前記時系列データ生成手段は、各状態の状態確率を重みとする前記データの平均値の線形結合により、各時刻にHMMが出力するデータを求める
データ出力装置。
In a data output device that outputs time-series data,
State probability that estimates the state probability that the state outputs data for each time of a predetermined interval for each state of the HMM defined by the state transition probability that the state transitions and the probability distribution of the data that each state outputs An estimation means;
Based on the state probability and the average value of the data according to the probability distribution, time-series data generating means for obtaining data for each time of a predetermined interval output by the HMM and outputting as time-series data ,
The state probability estimation means, for each state of the HMM,
Using the state transition probability of self-transition, find the value corresponding to the expected value of the number of times that self-transition occurs as the expected value of the duration of self-transition,
A recurrence formula using the normal distribution, assuming that the transition time of transition from one state to another state follows a normal distribution whose average value is the expected transition time obtained by adding the expected value of the duration. The value corresponding to the probability that the state transition starts from the state at each time is obtained as the state probability at each time,
The time series data generation means is a data output device for obtaining data output by the HMM at each time by linear combination of the average values of the data weighted by the state probabilities of the respective states .
請求項に記載のデータ出力装置において、
前記規分布の分散は、前記自己遷移が継続する継続時間の期待値に基づいて決定される
データ出力装置。
The data output device according to claim 1 , wherein
The dispersion of normal distribution, the data output device is determined based on the expected value of the duration in which the self-transition continues.
請求項に記載のデータ出力装置において、
前記規分布の分散調整
データ出力装置。
The data output device according to claim 1 , wherein
Data output device that adjust the variance of the normal distribution.
請求項1に記載のデータ出力装置において、
前記状態確率推定手段が前記状態確率を推定する時刻の間隔を決定する
データ出力装置。
The data output device according to claim 1, wherein
A data output device for determining an interval of time at which the state probability estimating means estimates the state probability.
請求項1に記載のデータ出力装置において、
前記状態確率推定手段は、複数のHMMを結合することにより得られる新たなHMMの各状態について、前記状態確率を推定する
データ出力装置。
The data output device according to claim 1, wherein
It said state probability estimation means, for each state of a new HMM obtained by combining a plurality of HMM, the data output apparatus for estimating the state probability.
請求項1に記載のデータ出力装置において、
前記状態確率推定手段は、3つの同一のHMMである第1、第2、および第3のHMMを結合することにより得られる新たなHMMの各状態について、前記状態確率を推定し、
前記時系列データ生成手段は、前記状態確率推定手段において推定された前記状態確率のうちの、前記第2のHMMの各状態についての状態確率と、前記確率分布に従うデータの平均値とに基づいて、HMMが出力する所定の間隔の時刻ごとのデータを求める
データ出力装置。
The data output device according to claim 1, wherein
It said state probability estimating means, first the three identical HMM, for each state of the new HMM obtained by combining the second and third HMM, estimates the state probability,
The time-series data generation means is based on the state probability for each state of the second HMM out of the state probabilities estimated by the state probability estimation means, and an average value of data according to the probability distribution A data output device for obtaining data for each time of a predetermined interval output by the HMM .
請求項1に記載のデータ出力装置において、
前記状態確率推定手段は、
第1及び第2のHMMそれぞれについて、前記継続時間の期待値の総和を同一の所定の時間に調整する第1及び第2の係数を求め、
前記第1のHMMの前記継続時間の期待値を、前記第1の係数によって調整するとともに、前記第2のHMMの前記継続時間の期待値を、前記第2の係数によって調整し、
前記第1及び第2のHMMそれぞれについて、調整後の前記継続時間の期待値を用いて、各時刻の前記状態確率を求め、
前記時系列データ生成手段は、前記第1のHMMの前記状態確率と前記第1のHMM前記確率分布に従うデータの平均値、および、前記第2のHMMの前記状態確率と前記第2のHMM前記確率分布に従うデータの平均値に基づいて、前記時系列のデータを求める
データ出力装置。
The data output device according to claim 1, wherein
The state probability estimating means includes
For each of the first and second HMMs, first and second coefficients for adjusting the sum of the expected values of the duration time to the same predetermined time are obtained.
Adjusting the expected value of the duration of the first HMM by the first coefficient, and adjusting the expected value of the duration of the second HMM by the second coefficient;
For each of the first and second HMMs, using the expected value of the duration after adjustment, obtain the state probability at each time;
The time-series data generating means, said probability mean value of the data according to the distribution of the said state probability of the first HMM first HMM, and wherein said state probability of the second HMM second HMM A data output device for obtaining the time-series data based on an average value of data according to the probability distribution .
請求項に記載のデータ出力装置において、
前記状態確率推定手段は、前記第1と第2のHMMを混合する混合比率に基づいて、前記第1のHMMの前記継続時間の期待値の総和と、前記第2のHMMの前記継続時間の期待値の総和とを、前記混合比率に従って加算した加算値を、前記所定の時間として、前記第1及び第2の係数を求める
データ出力装置。
The data output device according to claim 7 , wherein
The state probability estimation means is configured to calculate a sum of expected values of the durations of the first HMM and the durations of the second HMM based on a mixing ratio of the first and second HMMs. A data output device for obtaining the first and second coefficients using an addition value obtained by adding the sum of expected values according to the mixing ratio as the predetermined time .
請求項1に記載のデータ出力装置において、
前記時系列のデータは、時系列のベクトルである
データ出力装置。
The data output device according to claim 1, wherein
The time-series data is a time-series vector.
時系列のデータを出力するデータ出力方法において、
状態が遷移する状態遷移確率と、各状態が出力するデータの確率分布とで定義されるHMMの各状態について、所定の間隔の時刻ごとの、状態がデータを出力する状態確率を推定する状態確率推定ステップと、
前記状態確率と、前記確率分布に従うデータの平均値とに基づいて、HMMが出力する所定の間隔の時刻ごとのデータを求め、時系列のデータとして出力する時系列データ生成ステップと
を含み、
前記状態確率推定ステップは、前記HMMの各状態について、
自己遷移の状態遷移確率を用いて、自己遷移が生じる回数の期待値に対応する値を、自己遷移が継続する継続時間の期待値として求め、
ある状態から他の状態に遷移する遷移時刻が、前記継続時間の期待値の加算によって求められる期待遷移時刻を平均値とする正規分布に従うことを仮定して、前記正規分布を用いた漸化式により求められる、各時刻に、状態から状態遷移が始まる確率に対応する値を、各時刻の前記状態確率として求め、
前記時系列データ生成ステップは、各状態の状態確率を重みとする前記データの平均値の線形結合により、各時刻にHMMが出力するデータを求める
データ出力方法。
In the data output method for outputting time series data,
State probability that estimates the state probability that the state outputs data for each time of a predetermined interval for each state of the HMM defined by the state transition probability that the state transitions and the probability distribution of the data that each state outputs An estimation step;
Said state probability, on the basis of the average value of the data according to the probability distribution, obtains the data for each time of a predetermined interval HMM outputs, viewed contains a series data generating step when outputting a data of the time series,
In the state probability estimation step, for each state of the HMM,
Using the state transition probability of self-transition, find the value corresponding to the expected value of the number of times that self-transition occurs as the expected value of the duration of self-transition,
A recurrence formula using the normal distribution, assuming that the transition time of transition from one state to another state follows a normal distribution whose average value is the expected transition time obtained by adding the expected value of the duration. The value corresponding to the probability that the state transition starts from the state at each time is obtained as the state probability at each time,
The time series data generation step is a data output method for obtaining data output by the HMM at each time by linear combination of the average values of the data weighted by the state probabilities of the respective states .
時系列のデータを出力するデータ出力処理を、コンピュータに実行させるプログラムにおいて、
状態が遷移する状態遷移確率と、各状態が出力するデータの確率分布とで定義されるHMMの各状態について、所定の間隔の時刻ごとの、状態がデータを出力する状態確率を推定する状態確率推定手段と、
前記状態確率と、前記確率分布に従うデータの平均値とに基づいて、HMMが出力する所定の間隔の時刻ごとのデータを求め、時系列のデータとして出力する時系列データ生成手段
して、コンピュータを機能させるためのプログラムであり、
前記状態確率推定手段は、前記HMMの各状態について、
自己遷移の状態遷移確率を用いて、自己遷移が生じる回数の期待値に対応する値を、自己遷移が継続する継続時間の期待値として求め、
ある状態から他の状態に遷移する遷移時刻が、前記継続時間の期待値の加算によって求められる期待遷移時刻を平均値とする正規分布に従うことを仮定して、前記正規分布を用いた漸化式により求められる、各時刻に、状態から状態遷移が始まる確率に対応する値を、各時刻の前記状態確率として求め、
前記時系列データ生成手段は、各状態の状態確率を重みとする前記データの平均値の線形結合により、各時刻にHMMが出力するデータを求める
プログラム。
In a program for causing a computer to execute data output processing for outputting time-series data,
State probability that estimates the state probability that the state outputs data for each time of a predetermined interval for each state of the HMM defined by the state transition probability that the state transitions and the probability distribution of the data that each state outputs An estimation means ;
Time-series data generating means for obtaining data for each time of a predetermined interval output by the HMM based on the state probability and the average value of the data according to the probability distribution, and outputting as time-series data
And a program to make the computer function,
The state probability estimation means, for each state of the HMM,
Using the state transition probability of self-transition, find the value corresponding to the expected value of the number of times that self-transition occurs as the expected value of the duration of self-transition,
A recurrence formula using the normal distribution, assuming that the transition time of transition from one state to another state follows a normal distribution whose average value is the expected transition time obtained by adding the expected value of the duration. The value corresponding to the probability that the state transition starts from the state at each time is obtained as the state probability at each time,
The time-series data generation means is a program for obtaining data output by the HMM at each time by linear combination of the average values of the data weighted by the state probabilities of the respective states .
JP2005194907A 2005-07-04 2005-07-04 Data output device, data output method, and program Expired - Fee Related JP4662139B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005194907A JP4662139B2 (en) 2005-07-04 2005-07-04 Data output device, data output method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005194907A JP4662139B2 (en) 2005-07-04 2005-07-04 Data output device, data output method, and program

Publications (2)

Publication Number Publication Date
JP2007011203A JP2007011203A (en) 2007-01-18
JP4662139B2 true JP4662139B2 (en) 2011-03-30

Family

ID=37749768

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005194907A Expired - Fee Related JP4662139B2 (en) 2005-07-04 2005-07-04 Data output device, data output method, and program

Country Status (1)

Country Link
JP (1) JP4662139B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4939239B2 (en) 2007-01-22 2012-05-23 三菱重工業株式会社 Crankshaft
WO2012063424A1 (en) * 2010-11-08 2012-05-18 日本電気株式会社 Feature quantity series generation device, feature quantity series generation method, and feature quantity series generation program
WO2013014858A1 (en) * 2011-07-25 2013-01-31 日本電気株式会社 Pitch pattern generation method, pitch pattern generation device, audio synthesizing device, and pitch pattern generation program
CN102270449A (en) * 2011-08-10 2011-12-07 歌尔声学股份有限公司 Method and system for synthesising parameter speech
JP6091938B2 (en) * 2013-03-07 2017-03-08 株式会社東芝 Speech synthesis dictionary editing apparatus, speech synthesis dictionary editing method, and speech synthesis dictionary editing program

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002062890A (en) * 2000-08-18 2002-02-28 Seiko Epson Corp Method and device for speech synthesis and recording medium which records voice synthesis processing program
JP2002244689A (en) * 2001-02-22 2002-08-30 Rikogaku Shinkokai Synthesizing method for averaged voice and method for synthesizing arbitrary-speaker's voice from averaged voice
JP2004012584A (en) * 2002-06-04 2004-01-15 Nippon Telegr & Teleph Corp <Ntt> Method for creating information for voice recognition, method for creating acoustic model, voice recognition method, method for creating information for voice synthesis, voice synthesis method, apparatus therefor, program, and recording medium with program recorded thereon
JP2004233774A (en) * 2003-01-31 2004-08-19 Nippon Telegr & Teleph Corp <Ntt> Speech synthesizing method, speech synthesizing device and speech synthesizing program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002062890A (en) * 2000-08-18 2002-02-28 Seiko Epson Corp Method and device for speech synthesis and recording medium which records voice synthesis processing program
JP2002244689A (en) * 2001-02-22 2002-08-30 Rikogaku Shinkokai Synthesizing method for averaged voice and method for synthesizing arbitrary-speaker's voice from averaged voice
JP2004012584A (en) * 2002-06-04 2004-01-15 Nippon Telegr & Teleph Corp <Ntt> Method for creating information for voice recognition, method for creating acoustic model, voice recognition method, method for creating information for voice synthesis, voice synthesis method, apparatus therefor, program, and recording medium with program recorded thereon
JP2004233774A (en) * 2003-01-31 2004-08-19 Nippon Telegr & Teleph Corp <Ntt> Speech synthesizing method, speech synthesizing device and speech synthesizing program

Also Published As

Publication number Publication date
JP2007011203A (en) 2007-01-18

Similar Documents

Publication Publication Date Title
Howard et al. Searching for mobilenetv3
CN107615308B (en) Learning method for recurrent neural network, computer program for learning method, and sound recognition device
Bilmes Buried Markov models for speech recognition
JP4662139B2 (en) Data output device, data output method, and program
US20080215299A1 (en) Asynchronous Hidden Markov Model Method and System
CN105719643A (en) VOICE RETRIEVAL APPARATUS and VOICE RETRIEVAL METHOD
Shahshahani A Markov random field approach to Bayesian speaker adaptation
JP4069715B2 (en) Acoustic model creation method and speech recognition apparatus
JP7109071B2 (en) Learning device, learning method, speech synthesizer, speech synthesis method and program
JP4442211B2 (en) Acoustic model creation method
JP4950600B2 (en) Acoustic model creation apparatus, speech recognition apparatus using the apparatus, these methods, these programs, and these recording media
JP2012058343A (en) Voice synthesizing apparatus, voice synthesizing method and voice synthesizing program
JP2010054588A (en) Sound model preparing device, voice recognition device using the same, these method, these program and these recording medium
Sung et al. Maximum conditional likelihood linear regression and maximum a posteriori for hidden conditional random fields speaker adaptation
JP2005156593A (en) Method for creating acoustic model, device for creating the acoustic model, program for creating acoustic model, and voice-recognition device
JP5763414B2 (en) Feature parameter generation device, feature parameter generation method, and feature parameter generation program
Jon et al. EMAP-based speaker adaptation with robust correlation estimation
JP2010224418A (en) Voice synthesizer, method, and program
JP4004368B2 (en) Speech recognition system
JP5345967B2 (en) Speech synthesis apparatus, speech synthesis method, and speech synthesis program
JP2011164124A (en) Acoustic model parameter learning method based on linear classification model and device, method and device for creating finite state converter with phoneme weighting, and program therefor
Koriyama et al. Statistical nonparametric speech synthesis using sparse Gaussian
JP2705537B2 (en) Speaker learning device
Siohan et al. Structural bayesian predictive adaptation of hidden markov models
JP2010204391A (en) Voice signal modeling method, signal recognition device and method, parameter learning device and method, and feature value generating device, method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080627

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101005

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101012

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101209

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101222

R151 Written notification of patent or utility model registration

Ref document number: 4662139

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140114

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees