JP2007066237A - Symbol string conversion method, voice recognition method, voice paraphrase method, symbol string conversion device, program and storage medium - Google Patents

Symbol string conversion method, voice recognition method, voice paraphrase method, symbol string conversion device, program and storage medium Download PDF

Info

Publication number
JP2007066237A
JP2007066237A JP2005254697A JP2005254697A JP2007066237A JP 2007066237 A JP2007066237 A JP 2007066237A JP 2005254697 A JP2005254697 A JP 2005254697A JP 2005254697 A JP2005254697 A JP 2005254697A JP 2007066237 A JP2007066237 A JP 2007066237A
Authority
JP
Japan
Prior art keywords
hypothesis
symbol string
symbol
unit
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005254697A
Other languages
Japanese (ja)
Other versions
JP4478088B2 (en
Inventor
Takaaki Hori
貴明 堀
Atsushi Nakamura
篤 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005254697A priority Critical patent/JP4478088B2/en
Publication of JP2007066237A publication Critical patent/JP2007066237A/en
Application granted granted Critical
Publication of JP4478088B2 publication Critical patent/JP4478088B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a symbol string conversion method and device, in which a conversion designation can be easily changed. <P>SOLUTION: Hypothesis generation units for converting an input symbol string to a hypothesis that is a candidate of a target symbol string are cascade-connected in multistage, so that the conversion destination can be freely changed by properly changing the number of stages of the hypothesis generation units. The procedure of extracting a hypothesis whose accumulate weight shows a specific value from hypotheses generated by the hypothesis generation unit of the final stage of the multistage cascade-connected hypothesis generation units and correcting the weight of hypotheses generated by the hypothesis generation unit of the previous stage using the accumulated weight of hypothesis is repeated to the hypothesis generation unit of the first stage. When all input symbol strings are read, the procedure of extracting a hypothesis whose corrected accumulate weight shows the specific value from hypotheses generated by the hypothesis generation unit of the first stage, inputting this hypothesis to the next stage and extracting a hypothesis whose accumulated weight shows the specific value from hypotheses generated in the next stage is repeated to the hypothesis generation unit of the final stage. A hypothesis whose accumulated weight shows the specific value among the hypotheses generated in the final stage is outputted as a conversion result. According to this, conversion accuracy can be improved. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、重み付き有限状態変換器によって表現された記号列変換規則によって、入力された記号列に対して生成可能な数多くの出力記号列から、適用される変換規則の重みの累積値が最小または最大の特異値を呈する出力記号列を効率的に見つけることを可能とする記号列変換方法、及びそれを用いた音声認識方法並びに音声言い換え方法、記号列変換装置とプログラム及び記録媒体に関する。   The present invention minimizes the cumulative value of the weights of conversion rules to be applied from a large number of output symbol strings that can be generated for an input symbol string by a symbol string conversion rule expressed by a weighted finite state converter. The present invention also relates to a symbol string conversion method capable of efficiently finding an output symbol string exhibiting the maximum singular value, a speech recognition method using the same, a speech paraphrase method, a symbol string conversion device, a program, and a recording medium.

重み付き有限状態変換器(英訳Weighted Finite-State Transducer:WFST)とは、記号列を別の記号列に変換するための規則を、状態と状態遷移の図に表現する方式を言う。重み付き有限状態変換器については、例えば、非特許文献1に開示されている。以下、この重み付き有限状態変換器を仮説生成規則と称し、この仮説生成規則を実行する部分を仮説生成部と称する。   Weighted Finite-State Transducer (WFST) is a method for expressing rules for converting a symbol string into another symbol string in a state and state transition diagram. The weighted finite state converter is disclosed in Non-Patent Document 1, for example. Hereinafter, this weighted finite state converter is referred to as a hypothesis generation rule, and a portion that executes this hypothesis generation rule is referred to as a hypothesis generation unit.

仮説生成規則は、状態と、状態から状態へと遷移できることを表す状態遷移、および、状態遷移において受理される入力記号と、その際に出力される出力記号、および、その状態遷移の重みの集合によって定義される。仮説生成規則は、ある入力記号列が与えられたときに、初期状態からその入力記号列の記号を順に受理する状態遷移に従って出力記号を出力しながら状態遷移を繰り返し、終了状態に達すると終了する計算モデルである。形式的には、仮説生成規則は次の8つの組(Q,Σ,Δ,i,F,E,λ,ρ)によって定義される。
1.Qは有限の状態の集合。
2.Σは入力記号の有限の集合。
3.Δは出力記号の有限の集合。
4.i∈Qは初期状態。
5.F∈Qは終了状態の集合。
6.E∈Q×Σ×Δ×Qは、現状態から入力記号により、出力記号を出力して次状態に遷移する状態遷移の集合。
7.Λは初期重み。
8.p(q)は終了状態qの終了重み。q∈F。
The hypothesis generation rule is a set of a state, a state transition indicating that the transition from the state to the state can be performed, an input symbol accepted in the state transition, an output symbol output at that time, and a weight of the state transition Defined by The hypothesis generation rule repeats a state transition while outputting an output symbol according to a state transition that sequentially accepts the symbols of the input symbol sequence from an initial state when a certain input symbol sequence is given, and ends when the end state is reached. It is a calculation model. Formally, the hypothesis generation rule is defined by the following eight sets (Q, Σ, Δ, i, F, E, λ, ρ).
1. Q is a set of finite states.
2. Σ is a finite set of input symbols.
3. Δ is a finite set of output symbols.
4). iεQ is the initial state.
5. FεQ is a set of end states.
6). EεQ × Σ × Δ × Q is a set of state transitions in which an output symbol is output from the current state according to an input symbol to transition to the next state.
7). Λ is the initial weight.
8). p (q) is the end weight of the end state q. qεF.

仮説生成規則の一例を図1に示す。図1において、10はマル(“○”)で表された状態を示しており、そのマルの中の数字はその状態の番号を表している。11は二重マル(“◎”)で表された終了状態を示しており、その二重マルの中の数字は、その終了状態の番号と状態遷移が終了して最後に累積される終了重みが“(状態番号)/(終了重み)”のように表されている。以後、状態の番号を用いて状態を指し示す場合は、単に状態とその番号を用いて“状態0”や“状態3”のように称す。
12は各状態を結ぶ矢印(“→”)で表された状態遷移を示しており、各々の状態遷移に付与された記号や数字は、その状態遷移に関連付けられた入力記号、出力記号、重みを“(入力記号):(出力記号)/(重み)”のように表したものである。
An example of a hypothesis generation rule is shown in FIG. In FIG. 1, 10 indicates a state represented by a circle (“◯”), and the number in the circle represents the state number. Reference numeral 11 denotes an end state represented by a double circle (“◎”), and the number in the double circle is the number of the end state and the end weight accumulated at the end of the state transition. Is expressed as “(state number) / (end weight)”. Hereinafter, when the state is indicated using the state number, the state and the number are simply referred to as “state 0” or “state 3”.
Reference numeral 12 denotes a state transition represented by an arrow (“→”) connecting each state, and a symbol or a number given to each state transition is an input symbol, an output symbol, or a weight associated with the state transition. Is expressed as “(input symbol) :( output symbol) / (weight)”.

図1の仮説生成規則を表によって定義することもできる。図2は、各行が一つの状態遷移を表し、その状態遷移における遷移元の状態番号と遷移先の状態番号、入力記号、出力記号、重みが記されている。最終状態(図1では状態3)は、遷移先、入力記号、出力記号を空とし、状態遷移終了時に累積される重み(終了重み)を記入する書式となっている。一般に、仮説生成規則の初期状態は状態0とされ、初期重みΛも省略されることが多い。そのため、本特許でも初期状態は状態0とし、初期重みは省略して明記しないこととする。   The hypothesis generation rule of FIG. 1 can also be defined by a table. In FIG. 2, each row represents one state transition, and the state number of the transition source, the state number of the transition destination, the input symbol, the output symbol, and the weight in the state transition are described. The final state (state 3 in FIG. 1) has a format in which the transition destination, the input symbol, and the output symbol are empty, and the weight (end weight) accumulated at the end of the state transition is entered. In general, the initial state of the hypothesis generation rule is state 0, and the initial weight Λ is often omitted. Therefore, in this patent, the initial state is set to state 0, and the initial weight is omitted and not specified.

図1の仮説生成規則は、例えば、入力記号列a,a,b,cを出力記号列d,d,c,bに変換することができ、その際の状態遷移過程は、状態番号の系列を用いて表すと0,0,1,3であり、重みの累積値(以下「累積重み」)と称す)は0.5+0.5+0.3+1+0.5=2.8となる。しかし、図1の仮説生成規則では、a,a,b,cという入力記号列に対しては、0,0,1,3と0,0,2,3の2通りの状態遷移過程が考えられる。一般に、ある入力記号列に対して複数の状態遷移の可能性がある場合(これを非決定性という)は、状態遷移過程における累積重みが特異値である最小(または最大)になる状態遷移過程を選択し、その累積重み最小(または最大)の状態遷移過程に対応する出力記号列を選択する。累積重みが最小の状態遷移過程を選ぶか最大の状態遷移過程を選ぶかは重みの性質と目的による。   The hypothesis generation rule of FIG. 1 can convert, for example, the input symbol string a, a, b, c into the output symbol string d, d, c, b, and the state transition process at that time is a series of state numbers. Is expressed as 0, 0, 1, 3, and the cumulative weight value (hereinafter referred to as “cumulative weight”) is 0.5 + 0.5 + 0.3 + 1 + 0.5 = 2.8. However, in the hypothesis generation rule of FIG. 1, two state transition processes of 0, 0, 1, 3 and 0, 0, 2, 3 are considered for the input symbol strings a, a, b, and c. It is done. In general, when there is a possibility of multiple state transitions for an input symbol string (this is called nondeterminism), the state transition process in which the cumulative weight in the state transition process is the minimum (or maximum) singular value is used. An output symbol string corresponding to the state transition process with the minimum (or maximum) cumulative weight is selected. Whether to choose the state transition process with the smallest cumulative weight or the largest state transition process depends on the nature and purpose of the weight.

図1の例においても、a,a,b,cという入力記号列に対して累積重みが最も小さい状態遷移過程0,0,1,3を選んで、変換結果をd,d,c,bとする。
ある仮説生成規則(これをTとする)があり、このTに対して記号列Xが入力記号列として与えられたとき、累積重みが最小となる出力記号列(すなわち記号列変換結果)を求めるには、次の累積重みの最小値W(X)を計算する必要がある。

Figure 2007066237
ここで、W(X→Y,T)は、仮説生成規則Tによって記号列Xが記号列Yに変換されるときの状態遷移過程における累積重みを表す。この累積重みW(X→Y,T)の最小値W(X)を求めて、その最小値を与えるYが記号列変換結果となる。
このW(X)を効率的に求めるには、一般にグラフのコスト最小探索の技術の一つである横型探索法を利用する。例えば、グラフの横型探索法の手順は、非特許文献2に開示されている。 Also in the example of FIG. 1, the state transition processes 0, 0, 1, 3 having the smallest cumulative weight are selected for the input symbol strings a, a, b, c, and the conversion results are d, d, c, b. And
When there is a certain hypothesis generation rule (this is assumed to be T) and a symbol string X is given as an input symbol string for this T, an output symbol string (that is, a symbol string conversion result) having a minimum cumulative weight is obtained. Therefore, it is necessary to calculate the minimum value W (X) of the next cumulative weight.
Figure 2007066237
Here, W (X → Y, T) represents the cumulative weight in the state transition process when the symbol string X is converted to the symbol string Y by the hypothesis generation rule T. The minimum value W (X) of the cumulative weight W (X → Y, T) is obtained, and Y giving the minimum value is the symbol string conversion result.
In order to efficiently obtain W (X), a horizontal search method, which is one of the techniques for searching a graph with a minimum cost, is generally used. For example, the procedure of the horizontal search method of the graph is disclosed in Non-Patent Document 2.

仮説生成規則による記号列変換は、入力記号列によって初期状態から終了状態に至るコスト(累積重み)最小の状態遷移過程を探し出すことによって行われる。
重み付き有限状態変換器は、出力記号を定義しない重み付き有限状態受理器(英訳:Weighted Finite-State Acceptor:WFSA)や、入力記号も出力記号も定義しない有向グラフも包含している。WFSAであれば各状態遷移における入力記号と出力記号を同一にする、有向グラフであればすべての入力記号と出力記号を一つの記号と仮定することで表現できる。従って、本発明で扱う仮説生成規則のための各方法は、すべてWFSAや有向グラフにも適用することが可能である。
The symbol string conversion based on the hypothesis generation rule is performed by searching for a state transition process with the minimum cost (cumulative weight) from the initial state to the end state by the input symbol string.
The weighted finite state converter includes a weighted finite state acceptor (WFSA) that does not define an output symbol and a directed graph that defines neither an input symbol nor an output symbol. In the case of WFSA, the input symbol and output symbol in each state transition are made the same, and in the case of a directed graph, it can be expressed by assuming that all input symbols and output symbols are one symbol. Therefore, all the methods for hypothesis generation rules handled in the present invention can be applied to WFSA and directed graphs.

一つの仮説生成規則を用いた記号列変換の一実施例を図3に示す。まず、本明細書において“仮説”とは、ある記号列が順に入力され、現時点までに読み込まれた入力記号列に対して、仮説生成規則において初期状態からその入力記号列によって状態遷移を繰り返した場合の可能性のある一つの状態遷移過程を表すものとする。
記号列変換部102は仮説生成規則格納部100と仮説生成部200と仮説絞込み部400とを備えて構成される。仮説生成部200は仮説生成規則格納部100から仮説生成規則を読み込んでその仮説生成規則に従って仮説の生成動作を実行する。仮説生成部200は記号列入力部103から受け取った記号を仮説生成規則に従って、これまで読み込んだ記号列に対する仮説の集合を新たに受け取った記号を用いて各仮説の状態遷移過程を更新することにより新たな仮説を生成する。仮説生成部200で生成された全ての仮説は仮説絞込み部400に送り込まれる。
An example of symbol string conversion using one hypothesis generation rule is shown in FIG. First, in this specification, “hypothesis” means that a certain symbol string is input in order, and the state transition is repeated from the initial state in the hypothesis generation rule for the input symbol string read up to the present time from the initial state. It represents one possible state transition process.
The symbol string conversion unit 102 includes a hypothesis generation rule storage unit 100, a hypothesis generation unit 200, and a hypothesis narrowing unit 400. The hypothesis generation unit 200 reads the hypothesis generation rule from the hypothesis generation rule storage unit 100 and executes a hypothesis generation operation according to the hypothesis generation rule. The hypothesis generation unit 200 updates the state transition process of each hypothesis using the symbol newly received from the symbol string input unit 103 according to the hypothesis generation rule and the newly received set of hypotheses for the symbol string read so far. Generate new hypotheses. All hypotheses generated by the hypothesis generation unit 200 are sent to the hypothesis narrowing unit 400.

仮説絞込み部400では、仮説生成部200から受け取った仮説の集合に対し、同じ状態に到達している仮説の中で累積重みが例えば最小の仮説以外の仮説を削除することにより仮説を絞り込む。入力記号列が最後まで読み込まれていれば、累積重み最小の仮説に対応する出力記号列を記号列出力部106に送る。入力記号列が最後まで読み込まれていなければ、仮説を仮説生成部200に送る。記号列出力部106では、仮説絞込み部400から受け取った出力記号列を出力する。   The hypothesis narrowing unit 400 narrows down hypotheses by deleting hypotheses other than the hypothesis having the smallest cumulative weight among hypotheses reaching the same state from the hypothesis set received from the hypothesis generation unit 200. If the input symbol string has been read to the end, the output symbol string corresponding to the hypothesis with the smallest cumulative weight is sent to the symbol string output unit 106. If the input symbol string has not been read to the end, the hypothesis is sent to the hypothesis generation unit 200. The symbol string output unit 106 outputs the output symbol string received from the hypothesis narrowing unit 400.

次に、この実施の形態に基づいて記号列を変換する手順の一例を示す。
まず、仮説生成規則のある状態遷移をeと表すとき、n[e]を遷移先の状態(次状態)、i[e]を入力記号、o[e]を出力記号、w[e]を重みと定義する。また、ある仮説をhと表すとき、s[h]を到達している状態、W[h]をその状態遷移過程における累積重み、O[h]をその状態遷移過程において出力される記号列とする。
この手順において、仮説は仮説のリスト(以後これを仮説リストと呼ぶ)を用いて管理する。仮説リストに対し、仮説を挿入したり、仮説を取り出したりすることができる。但し、仮説リストに仮説を挿入する場合に、仮説リスト内に同じ状態に到達している仮説があれば、累積重みの小さい方だけを仮説リストに残し、仮説を絞り込む。
Next, an example of a procedure for converting a symbol string based on this embodiment will be described.
First, when a state transition having a hypothesis generation rule is represented as e, n [e] is a transition destination state (next state), i [e] is an input symbol, o [e] is an output symbol, and w [e] is Define as weight. In addition, when a certain hypothesis is expressed as h, a state in which s [h] is reached, W [h] is a cumulative weight in the state transition process, and O [h] is a symbol string output in the state transition process. To do.
In this procedure, hypotheses are managed using a list of hypotheses (hereinafter referred to as a hypothesis list). Hypotheses can be inserted into and extracted from the hypothesis list. However, when a hypothesis is inserted into the hypothesis list, if there is a hypothesis that reaches the same state in the hypothesis list, only the smaller cumulative weight is left in the hypothesis list to narrow down the hypotheses.

仮説生成規則を用いた記号列変換手順を図4に示す。
以下、図4の手順を、仮説生成規則を備えた記号列変換方法の一実施例(図3)と対比して説明する。
ステップS101より開始し、初期設定として、ステップS102において空の仮説リストHとH’を生成する。初期の仮説hを生成し、s[h]=0(仮説生成規則の初期状態)、W[h]=0、O[h]=φ(空の記号列)とし、仮説リストHに挿入する。
ステップS102では、記号列入力部103において記号を一つ読み込み、その記号をxに代入する。次のステップS105からステップS108は、仮説生成部104において実行される。
The symbol string conversion procedure using the hypothesis generation rule is shown in FIG.
Hereinafter, the procedure of FIG. 4 will be described in comparison with an embodiment (FIG. 3) of a symbol string conversion method provided with a hypothesis generation rule.
Starting from step S101, as an initial setting, empty hypothesis lists H and H ′ are generated in step S102. An initial hypothesis h is generated, and s [h] = 0 (initial state of the hypothesis generation rule), W [h] = 0, and O [h] = φ (empty symbol string) are inserted into the hypothesis list H. .
In step S102, the symbol string input unit 103 reads one symbol and substitutes the symbol for x. The following steps S105 to S108 are executed in the hypothesis generation unit 104.

ステップS105では、仮説リストHから仮説を一つ取り出し仮説hに代入し、状態s[h]から入力記号がxに等しい状態遷移のリストEを用意する。
ステップS106でE=φ(空のリスト)であればステップS110に進む。そうでなければ、ステップS107に進み状態遷移リストEから状態遷移を一つ取り出し、状態遷移eに代入する。
ステップS108で新たな仮説fを生成し、s[f]=n[e]、W[f]=W[f]+w[e]、O[f]=O[h]・o[e]とする。ここで、“・”は二つの記号または記号列を接続し、一つの記号列にする演算を表す。
In step S105, one hypothesis is extracted from the hypothesis list H and substituted into the hypothesis h, and a list E of state transitions whose input symbol is equal to x is prepared from the state s [h].
If E = φ (empty list) in step S106, the process proceeds to step S110. Otherwise, the process proceeds to step S107, and one state transition is extracted from the state transition list E and substituted into the state transition e.
In step S108, a new hypothesis f is generated, and s [f] = n [e], W [f] = W [f] + w [e], O [f] = O [h] · o [e] To do. Here, “·” represents an operation of connecting two symbols or a symbol string into one symbol string.

ステップS109は、仮説絞込み部105で実行され、仮説fを仮説リストH’に挿入することにより仮説を絞り込む。
ステップS109からステップS106に戻り、次の状態遷移について仮説を展開する。
ステップS110では、仮説リストH=φ(すべての仮説を展開済み)であればステップS111に進む。そうでなければステップS105に戻り、次の仮説を展開する。
ステップS111では、新たに生成された仮説のリストH’の要素を、すでに空となった仮説リストHにすべて移し、ステップS112に進む。
Step S109 is executed by the hypothesis narrowing unit 105 to narrow down the hypotheses by inserting the hypothesis f into the hypothesis list H ′.
Returning from step S109 to step S106, a hypothesis is developed for the next state transition.
In step S110, if the hypothesis list H = φ (all hypotheses have been expanded), the process proceeds to step S111. Otherwise, the process returns to step S105, and the next hypothesis is developed.
In step S111, all the elements of the newly generated hypothesis list H ′ are moved to the already empty hypothesis list H, and the process proceeds to step S112.

ステップS112では、記号列入力部103において次の入力記号が存在するならばステップS104に戻り、そうでなければ、入力記号列がすべて読み込まれたと判断しステップS113に進む。
ステップS113では、仮説リストHの中で終了状態に到達している仮説の累積重みにその終了状態の終了重みを加えた後で、その終了状態に到達している仮説の中から累積重み(W[h])が最小となる仮説hを選び、その出力記号列O[h]を記号列変換結果として、記号列出力部106において出力する。
In step S112, if the next input symbol exists in the symbol string input unit 103, the process returns to step S104. Otherwise, it is determined that all the input symbol strings have been read, and the process proceeds to step S113.
In step S113, after adding the end weight of the end state to the cumulative weight of the hypothesis reaching the end state in the hypothesis list H, the cumulative weight (W The hypothesis h that minimizes [h]) is selected, and the output symbol string O [h] is output as a symbol string conversion result in the symbol string output unit 106.

ステップS114にて仮説生成規則を用いる記号列変換手順を終了する。
この記号列変換手順に従って、図1の仮説生成規則に入力記号列a,a,b,cが与えられた場合の出力記号列を求める過程を順を追って説明する。但し、ある仮説(現状態番号s、出力記号列O、累積重みW)がある場合、その仮説を(s,O,W)のように表すものとする。また、仮説生成規則のある状態遷移(現状態番号s、次状態番号n、入力記号x、出力記号y、重みw)を<s→n,x:y/w>と表すものとする。
In step S114, the symbol string conversion procedure using the hypothesis generation rule is terminated.
The process of obtaining the output symbol string when the input symbol strings a, a, b, and c are given to the hypothesis generation rule of FIG. 1 according to this symbol string conversion procedure will be described in order. However, if there is a certain hypothesis (current state number s, output symbol string O, cumulative weight W), the hypothesis is represented as (s, O, W). Further, a state transition with a hypothesis generation rule (current state number s, next state number n, input symbol x, output symbol y, weight w) is represented as <s → n, x: y / w>.

ステップS101から開始し、ステップS102で空の仮説リストHとH’を作る。
ステップS103により仮説リストHの中に仮説(0,φ,0)を挿入する。
ステップS104で記号aを読み込み、ステップS105において仮説リストHから仮説(0,φ,0)を取り出す。この仮説の現状態0から入力記号がaに等しい状態遷移<0→0,a:d/0.5>を含む状態遷移リストEを作る。
ステップS106でE=φではないのでステップS107に進み、状態遷移<0→0,a:d/0.5>を取り出し、ステップS108で新たな仮説(0,d,0.5)を生成し、ステップS109で仮説リストH’に挿入する。
Starting from step S101, empty hypothesis lists H and H ′ are created in step S102.
In step S103, a hypothesis (0, φ, 0) is inserted into the hypothesis list H.
The symbol a is read in step S104, and a hypothesis (0, φ, 0) is extracted from the hypothesis list H in step S105. A state transition list E including a state transition <0 → 0, a: d / 0.5> whose input symbol is equal to a is created from the current state 0 of this hypothesis.
Since E = φ is not satisfied in step S106, the process proceeds to step S107, the state transition <0 → 0, a: d / 0.5> is extracted, and a new hypothesis (0, d, 0.5) is generated in step S108. In step S109, it is inserted into the hypothesis list H ′.

ステップS106に戻りE=φであるためステップS110に進み、仮説リストH=φであるためステップS111に進む。H’の要素(0,d,0.5)をHに移し、ステップS112で次の入力記号が存在するのでステップS104に戻る。
続いて、ステップS104で記号aを読み込み、ステップS105において仮説リストHから仮説(0,d,0.5)を取り出す。この仮説の現状態0から入力記号がaに等しい状態遷移<0→0,a:d/0.5>を含む状態遷移リストEを生成する。
ステップS106でE=φではないのでステップS107に進み、状態遷移リストEから状態遷移<0→0,a:d/0.5>を取り出す。ステップS108で新たな仮説(0,dd,1)を生成し、ステップS109でH’に挿入する。
Returning to step S106, since E = φ, the process proceeds to step S110, and since hypothesis list H = φ, the process proceeds to step S111. The element (0, d, 0.5) of H ′ is moved to H, and since the next input symbol exists in step S112, the process returns to step S104.
Subsequently, the symbol a is read in step S104, and a hypothesis (0, d, 0.5) is extracted from the hypothesis list H in step S105. A state transition list E including a state transition <0 → 0, a: d / 0.5> whose input symbol is equal to a is generated from the current state 0 of this hypothesis.
Since E = φ is not satisfied in step S106, the process proceeds to step S107, and the state transition <0 → 0, a: d / 0.5> is extracted from the state transition list E. A new hypothesis (0, dd, 1) is generated in step S108, and inserted into H ′ in step S109.

ステップS106に戻り状態遷移リストE=φであるためステップS110に進み、H=φであるためステップS111に進む。仮説リストH’の要素(0,dd,1)を仮説リストHに移し、ステップS112で次の入力記号が存在するのでステップS104に戻る。
続いて、ステップS104で記号bを読み込み、ステップS105において仮説リストHから仮説(0,dd,1)を取り出す。この仮説の現状態0から入力記号がbに等しい状態遷移<0→1,b:c/0.3>と<0→2,b:b/1>を含む状態遷移リストEを作る。
Returning to step S106, since the state transition list E = φ, the process proceeds to step S110, and since H = φ, the process proceeds to step S111. The element (0, dd, 1) of the hypothesis list H ′ is moved to the hypothesis list H. Since the next input symbol exists in step S112, the process returns to step S104.
Subsequently, the symbol b is read in step S104, and a hypothesis (0, dd, 1) is extracted from the hypothesis list H in step S105. A state transition list E including state transitions <0 → 1, b: c / 0.3> and <0 → 2, b: b / 1> whose input symbol is equal to b is created from the current state 0 of this hypothesis.

ステップS106でE=φではないのでステップS107に進み、状態遷移リストEから状態遷移<0→1,b:c/0.3>を取り出す。ステップS108で新たな仮説(1,ddc,1.3)を生成し、ステップS109でH’に挿入する。
ステップS106に戻りE=φではないのでステップS107に進み、状態遷移リストEから状態遷移<0→2,b:b/1>を取り出す。ステップS108で新たな仮説(2,ddb,2)を生成して、ステップS109でH’に挿入する。
ステップS106に戻りE=φであるためステップS110に進み、H=φであるためステップS111に進み、H’の要素(1,ddc,1.3)と(2,ddb,2)は仮説リストHに移され、ステップS112で次の入力記号が存在するのでステップS104に戻る。
Since E = φ is not satisfied in step S106, the process proceeds to step S107, and the state transition <0 → 1, b: c / 0.3> is extracted from the state transition list E. A new hypothesis (1, ddc, 1.3) is generated in step S108, and inserted into H ′ in step S109.
Returning to step S106, since E = φ is not true, the process proceeds to step S107, and the state transition <0 → 2, b: b / 1> is extracted from the state transition list E. A new hypothesis (2, ddb, 2) is generated in step S108, and inserted into H ′ in step S109.
Returning to step S106, since E = φ, the process proceeds to step S110, and since H = φ, the process proceeds to step S111. Elements (1, ddc, 1.3) and (2, ddb, 2) of H ′ are hypothesis lists. Since the next input symbol exists in step S112, the process returns to step S104.

続いて、ステップS104で記号cを読み込み、ステップS105において仮説リストHから仮説(1,ddc,1.3)を取り出す。この仮説の現状態1から入力記号がcに等しい状態遷移<1→3,c:b/1>を含む状態遷移リストEを作る。
ステップS106でE=φではないのでステップS107に進み、状態遷移リストEから状態遷移<1→3,c:b/1>を取り出す。ステップS108で新たな仮説(1,ddcb,2.3)を生成し、ステップS109でH’に挿入する。
ステップS106に戻りE=φであるためステップS110に進み、H≠φであるためステップS105に戻り、仮説リストHから仮説(2,ddb,2)を取り出す。この仮説の現状態2から入力記号がcに等しい状態遷移<2→3,c:a/0.6>を含む状態遷移リストEを作る。
Subsequently, the symbol c is read in step S104, and a hypothesis (1, ddc, 1.3) is extracted from the hypothesis list H in step S105. A state transition list E including a state transition <1 → 3, c: b / 1> whose input symbol is equal to c is created from the current state 1 of this hypothesis.
Since E = φ is not satisfied in step S106, the process proceeds to step S107, and the state transition <1 → 3, c: b / 1> is extracted from the state transition list E. A new hypothesis (1, ddcb, 2.3) is generated in step S108, and inserted into H ′ in step S109.
Returning to step S106, since E = φ, the process proceeds to step S110. Since H ≠ φ, the process returns to step S105, and a hypothesis (2, ddb, 2) is extracted from the hypothesis list H. A state transition list E including a state transition <2 → 3, c: a / 0.6> whose input symbol is equal to c is created from the current state 2 of this hypothesis.

ステップS106でE=φではないのでステップS107に進み、状態遷移リストEから状態遷移<2→3,c:a/0.6>を取り出す。ステップS108で新たな仮説(3,ddba,2.6)を生成し、ステップS109で仮説リストH’に挿入する。このとき、仮説リストH’の中には既に仮説(3,ddcb,2.3)が含まれており、仮説(3,ddba,2.6)は同じ状態3に到達しているので、累積重みの小さい仮説(3,ddcb,2.3)を残し、仮説(3,ddba,2.6)はリストから削除する。   Since E = φ is not satisfied in step S106, the process proceeds to step S107, and the state transition <2 → 3, c: a / 0.6> is extracted from the state transition list E. In step S108, a new hypothesis (3, ddba, 2.6) is generated and inserted in the hypothesis list H 'in step S109. At this time, the hypothesis list H ′ already includes the hypothesis (3, ddcb, 2.3), and the hypothesis (3, ddba, 2.6) has reached the same state 3, so The hypothesis (3, ddcb, 2.3) with a small weight is left, and the hypothesis (3, ddba, 2.6) is deleted from the list.

ステップS106に戻りE=φであるためステップS110に進み、仮説リストH=φであるためステップS111に進み、仮説リストH’の要素(3,ddcb,2.3)をHに移し、ステップS112で次の入力記号が存在しないのでステップS113に進む。
ステップS113で、仮説リストH内の仮説(3,ddcb,2.3)の到達状態3は終了状態であるため、終了重みを加えて(3,ddcb,2.8)とし、この仮説が終了状態に到達した唯一の仮説であり、累積重み最小となるので、その出力記号列ddcbを変換結果として出力し、ステップS114で記号列変換処理を終了する。
Returning to step S106, since E = φ, the process proceeds to step S110, and since hypothesis list H = φ, the process proceeds to step S111, the element (3, ddcb, 2.3) of the hypothesis list H ′ is moved to H, and step S112 is performed. In step S113, the next input symbol does not exist.
In step S113, since the arrival state 3 of the hypothesis (3, ddcb, 2.3) in the hypothesis list H is an end state, the end weight is added to (3, ddcb, 2.8), and this hypothesis ends. Since this is the only hypothesis that has reached the state and the accumulated weight is minimum, the output symbol string ddcb is output as a conversion result, and the symbol string conversion process is terminated in step S114.

次に、二つの仮説生成規則があって、順に記号列の変換を行う問題を考える。つまり、二つの仮説生成規則、TとTがあって、入力記号列Xが与えられたときに、初めにTを用いて記号列Xを記号列Yに変換し、その記号列YをTの入力記号列として、更に変換して出力記号列Zを得ることを意味する。仮説生成規則の理論では、この問題は、TによってXを変換する際にその出力記号列となり得るすべてのYをTの入力記号列として考慮し、それら入力記号列に対して可能性のあるTの出力記号列Zの集合の中から、Tにおける状態遷移過程の累積重みとTにおける状態遷移過程の累積重みの和が最小となる変換結果を得る問題となる。従って、

Figure 2007066237
を計算し、このW(X)を与えるYとZの組のうちZを記号列変換結果とする。 Next, there are two hypothesis generation rules, and consider the problem of converting a symbol string in order. That is, when there are two hypothesis generation rules, T 1 and T 2 and an input symbol string X is given, the symbol string X is first converted to the symbol string Y using T 1 , and the symbol string Y as an input symbol string of T 2, further it means that the conversion to obtain an output symbol sequence Z. In the theory of hypothesis generation rules, the problem is that all Y that can be the output symbol string when transforming X by T 1 is considered as an input symbol string of T 2 , and there is a possibility for these input symbol strings. From a set of output symbol strings Z of a certain T 2 , there is a problem of obtaining a conversion result that minimizes the sum of the accumulated weight of the state transition process at T 1 and the accumulated weight of the state transition process at T 2 . Therefore,
Figure 2007066237
And Z in the set of Y and Z that gives W (X) is the symbol string conversion result.

例として、図5と図6に示す二つの仮説生成規則を考える。図5は、仮名の記号列を漢字の記号列に変換する仮説生成規則の一例である。ただし、図5に現れる“ε”の記号は、“:”の左側にある場合は入力記号なしで状態遷移し、右側にある場合はその状態遷移において何も出力しないことを表す。   As an example, consider the two hypothesis generation rules shown in FIGS. FIG. 5 is an example of a hypothesis generation rule for converting a kana symbol string into a kanji symbol string. However, the symbol “ε” appearing in FIG. 5 indicates that a state transition is made without an input symbol when it is on the left side of “:”, and nothing is output in the state transition when it is on the right side.

この仮説生成規則は、例えば、記号列“あ,め”を状態遷移過程0,1,5(累積重み1)によって“雨”に変換し、“あ,め,だ,ま”は状態遷移過程0,1,5,0,4,5(累積重み3)によって“雨,玉”に変換する。しかし、日本語では一般に“あめだま”に対応する漢字は“雨玉”よりも“飴玉”の方が一般的であるが、図5の仮説生成規則では、記号列“飴,玉”を出力する状態遷移過程0,2,5,0,4,5の累積重みは4であるのに対し、“雨,玉”に変換する累積重みが3であることから、累積重みが小さい場合の“雨,玉”という変換結果になる。   In this hypothesis generation rule, for example, the symbol string “A, ME” is converted to “rain” by the state transition processes 0, 1, 5 (cumulative weight 1), and “A, ME, DA, MA” is the state transition process. It is converted into “rain, ball” by 0, 1, 5, 0, 4, 5 (cumulative weight 3). However, in Japanese, the kanji corresponding to “Amedama” is generally “Kamatama” rather than “Amatama”, but the hypothesis generation rule of FIG. Since the cumulative weight of the state transition processes 0, 2, 5, 0, 4, and 5 to be output is 4 while the cumulative weight to be converted to “rain, ball” is 3, the cumulative weight is small. The conversion result is “rain, ball”.

一方、図6は漢字の連接に重みを与える仮説生成規則である。この仮説生成規則では、すべての状態遷移において入力記号と出力記号が同じ、つまり記号列を変換せずにそのまま出力するが、状態遷移過程において入力記号列(漢字列)の記号の連接が日本語としてもっともらしい場合には重みが小さく、もっともらしくない場合には重みが大きくなっている。例えば、入力記号列“雨,降り”を受理する状態遷移過程0,1,3の累積重みは0となり、入力記号列“飴,降り”を受理する状態遷移過程0,2,3の累積重みは3となり、入力記号列“雨,降り”の方が日本語としてもっともらしく連接された記号列であることを示している。   On the other hand, FIG. 6 shows a hypothesis generation rule that gives weight to kanji concatenation. In this hypothesis generation rule, the input symbol and the output symbol are the same in all state transitions, that is, the symbol string is output as it is without conversion, but the symbol concatenation of the input symbol string (Kanji string) is Japanese in the state transition process. The weight is small when it is plausible, and the weight is large when it is not plausible. For example, the cumulative weights of the state transition processes 0, 1, and 3 that accept the input symbol string “rain, descend” are 0, and the cumulative weights of the state transition processes 0, 2, and 3 that accept the input symbol string “飴, descend” Is 3, indicating that the input symbol string “rain, rain” is the most likely connected symbol string in Japanese.

そして、この図5と図6の仮説生成規則を用いて記号列を変換する場合、例えば、仮名の記号列“あ,め,だ,ま”を入力すると、図5の仮説生成規則から得られる出力記号列は、“雨,玉”で累積重みが3と“飴,玉”で累積重みが4の場合がある。これら出力記号列をそれぞれ図6の仮説生成規則に入力した場合、“雨,玉”に対する累積重み5が、“飴,玉”に対する累積重みが1となり、図5と図6の二つの仮説生成規則による累積重みの和を計算すると次のようになる。
“あ,め,だ,ま”→“雨,玉”における累積重み 3+5=8
“あ,め,だ,ま”→“飴,玉”における累積重み 4+1=5
これらの累積重みを比較した結果、より累積重みの小さい出力記号列は“飴,玉”となる。このような変換結果を得るには、漢字の連接に関する重みを持つ図6の仮説生成規則が不可欠である。
When the symbol string is converted using the hypothesis generation rules of FIGS. 5 and 6, for example, when the kana symbol string “A, ME, DA, MA” is input, the hypothesis generation rule of FIG. 5 is obtained. The output symbol string may be “rain, ball” with a cumulative weight of 3 and “carp, ball” with a cumulative weight of 4. When these output symbol strings are respectively input to the hypothesis generation rule of FIG. 6, the cumulative weight 5 for “rain, ball” becomes 1, and the cumulative weight for “carp, ball” becomes 1, and the two hypothesis generations of FIG. 5 and FIG. The sum of the cumulative weights according to the rules is calculated as follows.
Cumulative weight in “A, Me, Da, Ma” → “Rain, Jade” 3 + 5 = 8
Cumulative weight in “A, Me, Da, Ma” → “Aoi, Jade” 4 + 1 = 5
As a result of comparing these accumulated weights, an output symbol string having a smaller accumulated weight is “飴, ball”. In order to obtain such a conversion result, the hypothesis generation rule of FIG. 6 having a weight related to kanji connection is indispensable.

二つの仮説生成規則を用いた従来の記号列変換の一実施例を図7に示す。まず、二つの仮説生成規則を用いて2段階の記号列変換を行う場合の前段に用いられる仮説生成規則を実行する部分を前段仮説生成部、後段に用いられる仮説生成規則を実行する部分を後段仮説生成部と呼ぶことにする。また、二つの仮説生成規則を用いる場合の“仮説”とは、ある記号列が順に入力され、現時点までに読み込まれた入力記号列に対して、前段仮説生成部において初期状態からその入力記号列によって状態遷移を繰り返した場合の可能性のある一つの状態遷移過程と、その前段仮説生成部の状態遷移過程に対応する出力記号列を後段仮説生成部の入力記号列としたときの、ある一つの状態遷移過程の組を表すものとする。   FIG. 7 shows an example of conventional symbol string conversion using two hypothesis generation rules. First, when performing two-stage symbol string conversion using two hypothesis generation rules, the part that executes the hypothesis generation rule used in the previous stage is the preceding hypothesis generation part, and the part that executes the hypothesis generation rule used in the subsequent stage is the subsequent stage. It will be called a hypothesis generation unit. The “hypothesis” in the case of using two hypothesis generation rules means that a certain symbol string is input in order and the input symbol string read from the initial state in the previous hypothesis generation unit with respect to the input symbol string read so far. One state transition process that may occur when the state transition is repeated by, and an output symbol string corresponding to the state transition process of the preceding hypothesis generation unit as an input symbol string of the subsequent hypothesis generation unit Let us denote a set of two state transition processes.

二つの仮説生成規則を用いて記号列を変換する別の手段として、二つの仮説生成規則を事前に合成して一つの仮説生成規則とし、一つの仮説生成規則に対する記号列変換手順を適用する方法がある。仮説生成規則の合成方法に関しては、例えば、非特許文献3に開示されている。しかし、仮説生成規則を合成すると、二つの状態遷移の組合せに対して状態や状態遷移ができることから、仮説生成規則の状態数や状態遷移数が非常に大きくなってしまうことがある。そのためコンピュータで仮説生成規則を扱う場合に、メモリサイズ等の制約から、記号列変換を実行するのが難しい場合がある。   As another means of converting a symbol string using two hypothesis generation rules, a method of combining two hypothesis generation rules in advance into one hypothesis generation rule and applying the symbol string conversion procedure for one hypothesis generation rule There is. For example, Non-Patent Document 3 discloses a method for synthesizing a hypothesis generation rule. However, when a hypothesis generation rule is synthesized, states and state transitions can be made with respect to a combination of two state transitions, so the number of hypotheses generation rules and the number of state transitions may become very large. Therefore, when handling hypothesis generation rules in a computer, it may be difficult to execute symbol string conversion due to restrictions such as memory size.

一方、二つの仮説生成規則を用いて最小コスト探索を行う標準的な手法では、各々の仮説を更新して新たな仮説を生成する際に、前段の仮説生成規則において可能な状態遷移と、後段の仮説生成規則において可能な状態遷移のすべての組合せに対して新たな仮説を生成することから、仮説の数が多くなり計算量が大きくなるという問題があった。それを解決する二つの仮説生成規則を用いた効率的な記号列変換方法が提案されている。この方法は、二つの仮説生成規則を用いる場合に最小コスト探索に基づく標準的な記号列変換方法と、効率的な記号列変換方法の両方に関する説明がある。そして、これらの方法を音声認識に適用した際、その標準的な記号列変換方法に対する効率的な記号列変換方法の変換処理時間が約3分の1に短縮されることが示されている。   On the other hand, in the standard method of performing the minimum cost search using two hypothesis generation rules, when each hypothesis is updated and a new hypothesis is generated, possible state transitions in the previous hypothesis generation rule, Since new hypotheses are generated for all combinations of possible state transitions in the hypothesis generation rule, there is a problem that the number of hypotheses increases and the amount of calculation increases. An efficient symbol string conversion method using two hypothesis generation rules to solve this has been proposed. This method is described with respect to both a standard symbol string conversion method based on a minimum cost search and an efficient symbol string conversion method when two hypothesis generation rules are used. It is shown that when these methods are applied to speech recognition, the conversion time of the efficient symbol string conversion method relative to the standard symbol string conversion method is reduced to about one third.

以下、先に提案された二つの仮説生成規則を用いた効率的な記号列変換方法について述べる。
記号列を順に読み込む記号列入力部と、状態遷移によって記号列を変換する二つの仮説生成規則を用いて記号列を2段階で変換するための前段に用いる前段仮説生成部と後段に用いる後段仮説生成部とを用いて記号列を変換する記号列変換部と、後段仮説生成部による変換結果を出力する記号列出力部とを有し、
記号列入力部から記号を順に読み込んで、入力記号列を読み終えた時点で、前記記号列変換部において前段と後段の仮説生成部においてそれぞれ適用される状態遷移に対する重みの累積値(累積重み)が最小となる後段の仮説生成部の状態遷移過程に対応する出力記号列を記号列出力部から出力する記号列変換方法において、
記号を順に読み込みながら、前段仮説生成部の一つの状態遷移過程を表す仮説に対する累積重みを、その仮説の状態遷移過程における出力記号列を後段仮説生成部の入力記号列としたときの後段仮説生成部において可能な状態遷移過程の中で累積重みが最小となる状態遷移過程を求め、その累積重みを仮説の累積重みに加算することで補正する。
Hereinafter, an efficient symbol string conversion method using the two previously proposed hypothesis generation rules will be described.
A symbol string input unit for reading a symbol string in order, a preceding hypothesis generation unit used in the previous stage for converting the symbol string in two stages using two hypothesis generation rules for converting the symbol string by state transition, and a subsequent hypothesis used in the subsequent stage A symbol string conversion unit that converts the symbol string using the generation unit, and a symbol string output unit that outputs a conversion result by the latter-stage hypothesis generation unit,
When symbols are read in order from the symbol string input unit and the input symbol string is read, cumulative values of weights (cumulative weights) for state transitions applied respectively in the preceding and succeeding hypothesis generation units in the symbol string conversion unit In the symbol string conversion method for outputting the output symbol string corresponding to the state transition process of the subsequent hypothesis generation unit that minimizes from the symbol string output unit,
While reading the symbols in order, the post-stage hypothesis generation when the output symbol string in the hypothesis state transition process is the input symbol string of the post-hypothesis generation section is the cumulative weight for the hypothesis representing one state transition process of the pre-stage hypothesis generation section The state transition process that minimizes the cumulative weight among the possible state transition processes in the unit is obtained, and the cumulative weight is corrected by adding the cumulative weight to the hypothetical cumulative weight.

入力記号列がすべて読み込まれた時点で、累積重み最小または最大の仮説とその仮説の状態遷移過程に対応する出力記号列を後段仮説生成部の入力記号列としたときに後段仮説生成部において可能な状態遷移過程の中で累積重みが最小となる状態遷移過程に対する出力記号列をもって記号列変換結果とすることを特徴とする記号列変換方法を構成し、この記号列変換方法によって効率的に記号列を変換する。   When the input symbol string is completely read, it is possible in the latter hypothesis generator when the hypothesis with the minimum or maximum accumulated weight and the output symbol string corresponding to the state transition process of that hypothesis are used as the input symbol string of the latter hypothesis generator. The symbol string conversion method is characterized in that an output symbol string corresponding to the state transition process having the smallest cumulative weight among the various state transition processes is used as a symbol string conversion result. Convert the column.

以下、図面を用いて二つの仮説生成部による効率的な記号列変換方法について図7を用いて説明する。記号列入力部103では、記号を順に読み込み、記号列変換部102に送る。記号変換部102はこの例では仮説生成部201−1、201−2及び仮説補正部301−1、301−2と、仮説絞込み部401−1、401−2とによって構成した場合を示す。仮説生成部201−1と201−2では、前段の仮説生成部201−1は記号列入力部103から受け取った記号を前段仮説生成規則格納部101−1から読み込んだ前段仮説生成規則に従って仮説を生成する。後段の仮説生成部201−2は後段仮説生成規則格納部101−2から読み込んだ後段仮説生成規則に従って前段の仮説生成部201−1が生成した仮説を新たに受け取った記号を用いて更新することにより新たな仮説を生成し、仮説補正部301−1と301−2に送る。仮説補正部301−1と301−2では、仮説の状態遷移過程における出力記号列を後段の仮説生成部201−2の入力記号列としたときの後段の仮説生成部において可能な状態遷移過程の中で累積重みが最小となる状態遷移過程を求め、その累積重みを仮説の累積重みに加えることで補正し、仮説絞込み部401−1と401−2に送る。   Hereinafter, an efficient symbol string conversion method using two hypothesis generation units will be described with reference to FIG. The symbol string input unit 103 reads the symbols in order and sends them to the symbol string converter 102. In this example, the symbol conversion unit 102 includes a hypothesis generation unit 201-1 and 201-2, a hypothesis correction unit 301-1 and 301-2, and a hypothesis narrowing unit 401-1 and 401-2. In the hypothesis generation units 201-1 and 201-2, the preceding hypothesis generation unit 201-1 determines the hypothesis according to the preceding hypothesis generation rule read from the preceding hypothesis generation rule storage unit 101-1 of the symbol received from the symbol string input unit 103. Generate. The subsequent hypothesis generation unit 201-2 updates the hypothesis generated by the previous hypothesis generation unit 201-1 with the newly received symbol in accordance with the subsequent hypothesis generation rule read from the subsequent hypothesis generation rule storage unit 101-2. To generate new hypotheses and send them to hypothesis correction units 301-1 and 301-2. In the hypothesis correction units 301-1 and 301-2, possible state transition processes in the subsequent hypothesis generation unit when the output symbol string in the hypothesis state transition process is the input symbol string of the subsequent hypothesis generation unit 201-2. The state transition process in which the cumulative weight is the minimum is obtained, and the cumulative weight is corrected by adding it to the hypothetical cumulative weight, and is sent to the hypothesis narrowing down sections 401-1 and 401-2.

仮説絞込み部401−1と401−2では、仮説補正部301−1と301−2から受け取った仮説に対し、状態遷移過程が重複している仮説の中で累積重みが最小の仮説だけを残し、その他の仮説を削除することにより仮説を絞り込む。入力記号列が最後まで読み込まれていれば、累積重み最小の仮説とその仮説の状態遷移過程に対応する出力記号列を後段の仮説生成部201−2の入力記号列としたときに後段の仮説生成部201−2において可能な状態遷移過程の中で累積重みが最小となる状態遷移過程に対する出力記号列を記号列出力部106に送る。入力記号列が最後まで読み込まれていなければ、残った仮説を仮説生成部201−1に送る。記号列出力部106では、仮説絞込み部401−2から受け取った出力記号列を出力する。   Hypothesis narrowing-down sections 401-1 and 401-2 leave only hypotheses having the smallest cumulative weight among hypotheses with overlapping state transition processes from the hypotheses received from hypothesis correction sections 301-1 and 301-2. Refine the hypotheses by deleting other hypotheses. If the input symbol string has been read to the end, the subsequent hypothesis when the hypothesis having the smallest cumulative weight and the output symbol string corresponding to the state transition process of the hypothesis are used as the input symbol string of the subsequent hypothesis generation unit 201-2. An output symbol string for a state transition process having a minimum accumulated weight among the possible state transition processes in the generation unit 201-2 is sent to the symbol string output unit 106. If the input symbol string has not been read to the end, the remaining hypotheses are sent to the hypothesis generation unit 201-1. The symbol string output unit 106 outputs the output symbol string received from the hypothesis narrowing unit 401-2.

図8に、二つの仮説生成部201−1と201−2による効率的な記号列変換方法の具体的な手順を示す。
まず、前段の仮説生成部201−1における“仮説”と、その仮説の状態遷移過程から出力される記号列を後段の仮説生成部201−2の入力記号列とした場合に、後段の仮説生成部201−2の可能な一つの状態遷移過程を、“仮説”と区別して“補助仮説”と呼ぶことにする。一つの仮説に対して必ず一つ以上の補助仮説が存在するので、本実施の形態では、仮説hに対する補助仮説の集合を補助仮説リストL[h]で表す。
FIG. 8 shows a specific procedure of an efficient symbol string conversion method by the two hypothesis generation units 201-1 and 201-2.
First, when the “hypothesis” in the preceding hypothesis generation unit 201-1 and the symbol string output from the state transition process of the hypothesis are used as the input symbol string of the subsequent hypothesis generation unit 201-2, the subsequent hypothesis generation is performed. One possible state transition process of the unit 201-2 is distinguished from the “hypothesis” and is referred to as an “auxiliary hypothesis”. Since at least one auxiliary hypothesis always exists for one hypothesis, in this embodiment, a set of auxiliary hypotheses for the hypothesis h is represented by an auxiliary hypothesis list L [h].

また、仮説hがあるとき、s[h]を仮説hの状態遷移過程において最後に到達した状態、W[h]を仮説hの状態遷移過程における(補正された)累積重みとする。一方、仮説hに対して補助仮説g(g∈L[h])があるとき、s[g]を補助仮説gの状態遷移過程において最後に到達した状態、W[g]を仮説hの状態遷移過程における累積重みと補助仮説gの状態遷移過程における累積重みの和、O[g]を補助仮説gの状態遷移過程において出力される記号列とする。それから、仮説生成部201−1,201−2の終了状態の集合をそれぞれF,Fとする。 Further, when there is a hypothesis h, s 1 [h] is the state reached last in the state transition process of hypothesis h, and W [h] is the (corrected) cumulative weight in the state transition process of hypothesis h. On the other hand, when there is an auxiliary hypothesis g (gεL [h]) with respect to hypothesis h, s 2 [g] is the last state reached in the state transition process of auxiliary hypothesis g, and W [g] is the hypothesis h. The sum of the cumulative weight in the state transition process and the cumulative weight in the state transition process of the auxiliary hypothesis g, O [g], is a symbol string output in the state transition process of the auxiliary hypothesis g. Then, the sets of end states of the hypothesis generation units 201-1 and 201-2 are set as F 1 and F 2 , respectively.

以下、図8及び図9の手順を図7の実施の形態と対比して説明する。
ステップS201より開始し、初期設定として、ステップS202で空の仮説リストHとH’を生成し、初期の仮説hを生成し、s[h]=0、W[h]=0、L[h]=φ(空のリスト)とし、仮説リストHに挿入する。また、補助仮説gを生成し、s[g]=0、W[g]=0、O[g]=φ(空の記号列)とし、仮説hの補助仮説リストL[h]に挿入する。
ステップS204では、記号列入力部103において記号を一つ読み込み、その記号をxに代入する。次のステップS205からステップS208は、仮説生成部201において実行される。
Hereinafter, the procedure of FIGS. 8 and 9 will be described in comparison with the embodiment of FIG.
Starting from step S201, as an initial setting, empty hypothesis lists H and H ′ are generated in step S202, an initial hypothesis h is generated, and s 1 [h] = 0, W [h] = 0, L [ h] = φ (empty list) and insert into hypothesis list H. Also, an auxiliary hypothesis g is generated, and s 2 [g] = 0, W [g] = 0, O [g] = φ (empty symbol string) is inserted into the auxiliary hypothesis list L [h] of hypothesis h To do.
In step S204, the symbol string input unit 103 reads one symbol and substitutes the symbol for x. The following steps S205 to S208 are executed in the hypothesis generation unit 201.

ステップS205では、仮説リストHから仮説を一つ取り出し仮説hに代入し、状態s[h]から入力記号xで遷移可能な状態遷移のリストEを生成する。
ステップS206で、E=φ(空のリスト)ならばステップS211に進む。そうでなければステップS207に進む。
ステップS207では、Eから状態遷移を一つ取り出して、eに代入し、ステップS208で新たな仮説fを生成し、s[f]=n[e]、W[f]=W[h]+w[e]、L[f]=L[h]とする。
In step S205, substituted hypothesis taken out one hypothesis from hypothesis list H h, to generate a list E 1 transition possible state transitions in the input symbol x from the state s 1 [h].
If E 1 = φ (empty list) in step S206, the process proceeds to step S211. Otherwise, the process proceeds to step S207.
In step S207, fetches one state transition from E 1, is substituted into e 1, generates new hypotheses f at step S208, s 1 [f] = n [e 1], W [f] = W [h] + w [e 1 ], L [f] = L [h].

ステップS209は、仮説補正部301において、もしo[e]=εならば仮説fを補正する手段(この手順の説明の後に別途説明する)を実行する。
ステップS210は、仮説絞込み部401において、仮説fを仮説リストH’に挿入することにより仮説を絞り込む。
ステップS211では、H=φ(すべての仮説を展開済み)であればステップS212に進む。そうでなければステップS305に戻り、次の仮説を生成する。
ステップS212では、新たに生成された仮説のリストH’の要素を、既に空となった仮説リストHにすべて移し、ステップS213に進む。
In step S209, in the hypothesis correction unit 301, if o [e 1 ] = ε, means for correcting the hypothesis f (described separately after the description of this procedure) is executed.
In step S210, the hypothesis narrowing unit 401 narrows down the hypotheses by inserting the hypothesis f into the hypothesis list H ′.
In step S211, if H = φ (all hypotheses have been developed), the process proceeds to step S212. Otherwise, the process returns to step S305 to generate the next hypothesis.
In step S212, all the elements of the newly generated hypothesis list H ′ are moved to the already empty hypothesis list H, and the process proceeds to step S213.

ステップS213では、記号列入力部103において次の入力記号が存在するならばステップS204に戻り、そうでなければ、入力記号列がすべて読み込まれたと判断しステップS214に進む。
ステップS214では、仮説リストHの中から終了状態に到達しているすべての仮説h(s[h]∈F)について累積重みW[h]に終了重みρ(s[h])を加え、補助仮説hの補助仮説リストL[h]の中で終了状態に到達している補助仮説g(s[g]∈F)について

Figure 2007066237
を計算し、gの累積重みW[g]が最小の補助仮説g’を選び、その出力記号列O[g’]を変換結果として記号列出力部106において出力する。
ステップS215にて二つの仮説生成部201−1と201−2を用いた記号列変換手順を終了する。 In step S213, if there is a next input symbol in the symbol string input unit 103, the process returns to step S204. Otherwise, it is determined that all the input symbol strings have been read, and the process proceeds to step S214.
In step S214, the end weight ρ (s 1 [h]) is set to the cumulative weight W [h] for all hypotheses h (s 1 [h] εF 1 ) that have reached the end state from the hypothesis list H. In addition, the auxiliary hypothesis g (s 2 [g] ∈F 2 ) that has reached the end state in the auxiliary hypothesis list L [h] of the auxiliary hypothesis h
Figure 2007066237
The auxiliary hypothesis g ′ having the smallest accumulated weight W [g] of g is selected, and the output symbol string O [g ′] is output as a conversion result in the symbol string output unit 106.
In step S215, the symbol string conversion procedure using the two hypothesis generation units 201-1 and 201-2 is terminated.

次に仮説補正部301−1と301−2における仮説補正手順について説明する。
仮説の補正は、前段仮説生成部201−1における仮説の状態遷移過程に対する累積重みを、その仮説の状態遷移過程における出力記号列を後段仮説生成部201−2の入力記号列としたときの後段仮説生成部201−2において可能な状態遷移過程の中で累積重みが最小となる状態遷移過程を求め、その累積重みを仮説の累積重みに加算することを意味する。入力記号列Xが読み込まれた時点でその記号列Xを受理して記号列Yを出力する仮説の補正された累積重みは、

Figure 2007066237
となり、その補正累積重みが最小である仮説の補正累積重みは
Figure 2007066237
となり、先に述べた式(2)における二つの仮説生成部の累積重みの和の最小値と一致する。 Next, a hypothesis correction procedure in the hypothesis correction units 301-1 and 301-2 will be described.
The correction of the hypothesis is a subsequent stage when the cumulative weight for the state transition process of the hypothesis in the preceding hypothesis generation unit 201-1 is used as the output symbol string in the state transition process of the hypothesis as the input symbol string of the subsequent hypothesis generation unit 201-2. This means that the hypothesis generation unit 201-2 obtains a state transition process having the smallest cumulative weight among the possible state transition processes, and adds the cumulative weight to the hypothetical cumulative weight. When the input symbol string X is read, the corrected cumulative weight of the hypothesis that accepts the symbol string X and outputs the symbol string Y is:
Figure 2007066237
The corrected cumulative weight of the hypothesis with the minimum corrected cumulative weight is
Figure 2007066237
Thus, the value coincides with the minimum value of the sum of the cumulative weights of the two hypothesis generation units in the above-described equation (2).

従って、補正された累積重みを用いて、それを最小とする前段仮説生成部の出力記号列Yを求めて、そのYを後段仮説生成部の入力記号列としたときの可能な状態遷移過程の中で累積重みが最小となる状態遷移過程に対応する出力記号列が記号列変換結果となる。
この記号列変換方法では、各仮説に対応付けられた補助仮説リストを利用して仮説の補正を効率的に行う。補正される仮説をfとし、その補助仮説リストをL[f]、仮説fの最後の状態遷移における出力記号をyとする。
Therefore, by using the corrected cumulative weight, the output symbol string Y of the preceding hypothesis generation unit that minimizes it is obtained, and the possible state transition process when Y is used as the input symbol string of the subsequent hypothesis generation unit Among them, the output symbol string corresponding to the state transition process with the smallest cumulative weight is the symbol string conversion result.
In this symbol string conversion method, correction of hypotheses is efficiently performed using an auxiliary hypothesis list associated with each hypothesis. The hypothesis to be corrected is f, the auxiliary hypothesis list is L [f], and the output symbol in the last state transition of the hypothesis f is y.

後段仮説生成部201−2の状態s[g](gはL[f]に含まれる一つの補助仮説を表す)から、入力記号yによる状態遷移eを経て次状態n[e]に至る補助仮説jを生成し、その到達状態をs[j]=n[e]とする。また、仮説fの状態遷移過程において、仮説fの最後の状態遷移(e)よりも前にあって出力記号がεではない最も新しい状態遷移をtとする。
このとき、補助仮説jの累積重みW[j]は、次の3つの要素を加算することにより計算できる。
From the state s 2 [g] (g represents one auxiliary hypothesis included in L [f]) of the post-stage hypothesis generation unit 201-2, the state n [e 2 ] is passed through the state transition e 2 by the input symbol y. An auxiliary hypothesis j that reaches is generated, and its arrival state is s [j] = n [e 2 ]. In the state transition process of hypothesis f, the latest state transition before the last state transition (e 1 ) of hypothesis f and whose output symbol is not ε is denoted by t.
At this time, the cumulative weight W [j] of the auxiliary hypothesis j can be calculated by adding the following three elements.

(A1)仮説fの状態遷移過程における状態n[t]において生成された補助仮説gの累積重み:
この値はW[g]に等しい。つまり、出力記号がεであった状態遷移過程では、補助仮説リストはそのまま後に続く状態遷移過程の仮説に引き継がれるので、状態n[t]において生成された補助仮説リストはL[f]に等しく、補助仮説リストL[f]の個々の補助仮説の累積重みW[g]をそのまま用いる。
(A1) Cumulative weight of auxiliary hypothesis g generated in state n [t] in the state transition process of hypothesis f:
This value is equal to W [g]. That is, in the state transition process in which the output symbol is ε, the auxiliary hypothesis list is directly inherited by the hypothesis of the subsequent state transition process, so that the auxiliary hypothesis list generated in the state n [t] is equal to L [f]. The cumulative weight W [g] of each auxiliary hypothesis in the auxiliary hypothesis list L [f] is used as it is.

(A2)状態n[t]から状態s[f]までの間に累積された重み:
但し、出力記号がεであった状態遷移過程では、補助仮説リストはそのまま新たに生成された仮説に引き継がれるので、状態n[t]に至った仮説の補正された累積重みは、現在の補助仮説リストL[f]の中で最小の累積重み

Figure 2007066237
に等しく、これを現在の仮説fの累積重みW[f]から差し引くことにより、状態n[t]から状態s[f]までの間の累積重みが求まる。すなわち、
Figure 2007066237
である。 (A2) Weights accumulated from state n [t] to state s 1 [f]:
However, in the state transition process in which the output symbol is ε, the auxiliary hypothesis list is carried over to the newly generated hypothesis as it is, so the corrected cumulative weight of the hypothesis that has reached the state n [t] is the current auxiliary hypothesis. Minimum cumulative weight in hypothesis list L [f]
Figure 2007066237
And subtracting this from the cumulative weight W [f] of the current hypothesis f, the cumulative weight between state n [t] and state s 1 [f] is obtained. That is,
Figure 2007066237
It is.

(A3)後段仮説生成部201−2の状態s[g]からs[j]への状態遷移eにおける重み:w[e]
従って、補助仮説jの累積重みはW[j]=W[g]+AW[f]+w[e]のように計算する。
そして、仮説fの補正は、W[f]を新たに生成された補助仮説jの累積重みW[j]の中での最小値

Figure 2007066237
を代入することにより行われる。 (A3) Weight in state transition e 2 from state s 2 [g] to state s 2 [j] of post-stage hypothesis generation unit 201-2: w [e 2 ]
Therefore, the cumulative weight of the auxiliary hypothesis j is calculated as W [j] = W [g] + AW [f] + w [e 2 ].
Then, the correction of the hypothesis f is performed by the minimum value of the cumulative weights W [j] of the auxiliary hypothesis j newly generated as W [f].
Figure 2007066237
This is done by substituting

以下、仮説の補正手順を図10を用いて説明する。この仮説補正手順は、図8及び図9に示したステップS208において実行される。この手順において補正される仮説をf、前段仮説生成部からの出力記号をy(=o[e])とする。
ステップS301では、仮説fを補正する手順を開始する。
ステップS302では、空の補助仮説リストL’を生成する。
ステップS303では、重みの補正項AW[f]をAW[f]=W[f]−W[g’]として求める。但し、g’は、仮説fの補助仮説リストL[f]の中で累積重みが最小の補助仮説を指す。
ステップS304では、L[f]から補助仮説を一つ取り出し、gに代入する。状態s[g]から入力記号yで遷移可能な状態遷移のリストEを生成し、ステップS305に進む。
The hypothesis correction procedure will be described below with reference to FIG. This hypothesis correction procedure is executed in step S208 shown in FIGS. The hypothesis corrected in this procedure is f, and the output symbol from the previous hypothesis generation unit is y (= o [e 1 ]).
In step S301, a procedure for correcting hypothesis f is started.
In step S302, an empty auxiliary hypothesis list L ′ is generated.
In step S303, the weight correction term AW [f] is obtained as AW [f] = W [f] −W [g ′]. However, g ′ indicates an auxiliary hypothesis having the smallest cumulative weight in the auxiliary hypothesis list L [f] of the hypothesis f.
In step S304, one auxiliary hypothesis is extracted from L [f] and substituted into g. A list E 2 of state transitions that can be transitioned with the input symbol y is generated from the state s 2 [g], and the process proceeds to step S305.

ステップS305では、リストEから状態遷移を一つ取り出し、eに代入する。
ステップS306では、補助仮説jを生成し、s[j]=n[e]、W[j]=W[g]+AW[f]+w[e]、O[j]=O[g]・o[e]とする。
ステップS307では、補助仮説jを補助仮説リストL’に挿入する。
ステップS308では、Eが空(s[g]からのすべての状態遷移に対して補助仮説を展開済み)であればステップS309に進む。そうでなければステップS305に戻り、次の状態遷移を調べる。
In step S305, taken out one state transition from the list E 2, it is substituted into e 2.
In step S306, an auxiliary hypothesis j is generated, and s 2 [j] = n [e 2 ], W [j] = W [g] + AW [f] + w [e 2 ], O [j] = O [g ] · O [e 2 ].
In step S307, the auxiliary hypothesis j is inserted into the auxiliary hypothesis list L ′.
In step S308, if E 2 is empty (the auxiliary hypothesis has been expanded for all state transitions from s 2 [g]), the process proceeds to step S309. Otherwise, the process returns to step S305 to check the next state transition.

ステップS309では、L[f]が空(すべての補助仮説を展開済み)であればステップS310に進む。そうでなければステップS304に戻り、次の補助仮説を展開する。
ステップS310では、新たに生成された補助仮説のリストL’の要素を、すでに空となった補助仮説リストL’[f]にすべて移し、ステップS311に進む。
ステップS311では、補助仮説リストL[f]の中で累積重み最小の補助仮説g’’に対してW[f]=W[g’’]とする。
ステップS312にて仮説補正手順を終了する。
In step S309, if L [f] is empty (all auxiliary hypotheses have been expanded), the process proceeds to step S310. Otherwise, the process returns to step S304 to develop the next auxiliary hypothesis.
In step S310, all the elements of the newly generated auxiliary hypothesis list L ′ are moved to the already empty auxiliary hypothesis list L ′ [f], and the process proceeds to step S311.
In step S311, W [f] = W [g ″] is set for the auxiliary hypothesis g ″ having the smallest cumulative weight in the auxiliary hypothesis list L [f].
In step S312, the hypothesis correction procedure ends.

また、この二つの仮説生成部を用いた記号列変換方法では、仮説リストに仮説を挿入する場合、一つの仮説生成部を用いる記号列変換方法と同様に、仮説リスト内に前段仮説生成部の同じ状態に到達している仮説が存在していれば、累積重みの小さい方を仮説リストに残し、仮説を絞り込む。但し、この仮説絞込みによって補助仮説が失われることがあるので、絞り込まれた仮説の補助仮説リストを、残った仮説の補助仮説リストに連結する。その際、補助仮説リスト内の補助仮説の累積重みを補正する必要がある。これは、仮説hと仮説fが前段仮説生成部の同じ状態に到達しているとき、補助仮説の累積重みを

Figure 2007066237
のように補正する。この補正は、先に示した仮説の補正手順における(A1)と(A2)の項を加えたものに等しい。そして、
W[h]<W[f] ならば L[h]=L[h]+L[f]、fを削除
W[h]>W[f] ならば L[f]=L[h]+L[f]、hを削除
のように補助仮説リストを連結する。 Further, in the symbol string conversion method using these two hypothesis generation units, when a hypothesis is inserted into the hypothesis list, as in the symbol string conversion method using one hypothesis generation unit, the preceding hypothesis generation unit includes If there is a hypothesis that reaches the same state, the hypothesis is narrowed down by leaving the smaller cumulative weight in the hypothesis list. However, since the auxiliary hypotheses may be lost by this hypothesis narrowing down, the auxiliary hypothesis list of the narrowed down hypotheses is connected to the auxiliary hypothesis list of the remaining hypotheses. At that time, it is necessary to correct the cumulative weight of the auxiliary hypotheses in the auxiliary hypothesis list. This means that when hypothesis h and hypothesis f have reached the same state in the previous hypothesis generator, the cumulative weight of the auxiliary hypothesis is
Figure 2007066237
Correct as follows. This correction is equivalent to the addition of the terms (A1) and (A2) in the hypothesis correction procedure described above. And
If W [h] <W [f] L [h] = L [h] + L [f], delete f If W [h]> W [f] L [f] = L [h] + L [ f], concatenate the auxiliary hypothesis lists like h is deleted.

記号列変換手順(図8及び図9)は、仮説補正手順(ステップS209)を除けば前段の仮説生成部だけを用いて探索する手順(図4)とほぼ同じ計算手順となり、従来の記号列変換手順と比べて計算量を少なく抑えることができる。仮説補正手順における計算の負荷はあるが、前段の仮説生成部の状態遷移において出力記号がεでない場合においてのみ仮説補正手順が実行されるので、前段の仮説生成部の出力記号がεである割合が多いほど、処理量削減の効果は大きくなる。   The symbol string conversion procedure (FIGS. 8 and 9) is substantially the same calculation procedure as the procedure (FIG. 4) for searching using only the preceding hypothesis generation unit except for the hypothesis correction procedure (step S209). Compared with the conversion procedure, the amount of calculation can be reduced. Although there is a calculation load in the hypothesis correction procedure, since the hypothesis correction procedure is executed only when the output symbol is not ε in the state transition of the preceding hypothesis generation unit, the rate at which the output symbol of the previous hypothesis generation unit is ε The greater the amount, the greater the effect of processing volume reduction.

次に、二つの仮説生成部を用いる図8及び図9の記号列変換手順に従って、図5の仮説生成規則をT、図6の仮説生成規則をTとして、入力記号列“あ,め,だ,ま”が与えられた場合の出力記号列を求める過程を順を追って説明する。但し、仮説(仮説生成規則Tの現状態番号s、出力記号列O、累積重みW、補助仮説リストL)は(s,O,W,L)のように表し、補助仮説(仮説生成規則Tの現状態番号s、出力記号列O、累積重みW)は(s,O,W)のように表す。また、補助仮説リストLは{(s,O,W),(s’,O’,W’),…}のように表す。 Next, according to the symbol string conversion procedure of FIGS. 8 and 9 using two hypothesis generation units, the hypothesis generation rule of FIG. 5 is T 1 and the hypothesis generation rule of FIG. 6 is T 2. The process of obtaining the output symbol string when, da, “is given will be explained step by step. However, the hypothesis (current state number s 1 hypothesis generation rule T 1, the output symbol sequence O, cumulative weight W, auxiliary hypothesis list L) is expressed as (s 1, O, W, L), the auxiliary hypothesis (hypothesis The current state number s 2 , the output symbol string O, and the cumulative weight W) of the generation rule T 2 are expressed as (s 2 , O, W). The auxiliary hypothesis list L is expressed as {(s 2 , O, W), (s 2 ′, O ′, W ′),.

〔二つの仮説生成規則を用いる記号列変換手順を開始〕
ステップS201から開始し、ステップS202で空の仮説リストHとH’を作る。
ステップS203により仮説リストHの中に仮説(0,φ,0,{(0,φ,0)})を挿入する。
[Start the symbol conversion procedure using two hypothesis generation rules]
Starting from step S201, empty hypothesis lists H and H ′ are created in step S202.
In step S203, the hypothesis (0, φ, 0, {(0, φ, 0)}) is inserted into the hypothesis list H.

〔入力記号“あ”の処理〕
ステップS204で記号“あ”を読み込み、ステップS205において仮説リストHから仮説(0,φ,0,{(0,φ,0)})を取り出す。
この仮説の仮説生成規則Tの現状態0から入力記号が“あ”の状態遷移
<0→1,あ:雨/0>,
<0→2,あ:飴/0>
を含むリストEを作る。
ステップS206でE=φではないのでステップS207に進み、状態遷移過程リストEから状態遷移<0→1,あ:雨/0>を取り出し、ステップS208で新たな仮説f=(1,雨,0,{(0,φ,0)})を生成する。ステップS209で状態遷移<0→1,あ:雨/0>の出力記号はεではないので、仮説f=(1,雨,0,{(0,φ,0)})を補正するステップS301(図10)に進む。
[Processing of input symbol “A”]
In step S204, the symbol “a” is read, and in step S205, a hypothesis (0, φ, 0, {(0, φ, 0)}) is extracted from the hypothesis list H.
State transition <0 → 1, a: rain / 0> from the current state 0 of the hypothesis generation rule T 1 of this hypothesis with the input symbol “a”
<0 → 2, A: 飴 / 0>
Make a list E 1, including.
Since E 1 = not at φ at step S206 proceeds to step S207, the state transition from the state transition process list E 1 <0 → 1, Ah: Rain / 0> was removed, a new hypothesis in step S208 f = (1, rain , 0, {(0, φ, 0)}). Since the output symbol of the state transition <0 → 1, a: rain / 0> is not ε in step S209, the hypothesis f = (1, rain, 0, {(0, φ, 0)}) is corrected. Proceed to (FIG. 10).

ステップS302で空の補助仮説リストL’を生成する。
ステップS303でAW[f]=0となる。
ステップS304で補助仮説リストL={(0,φ,0)}から補助仮説(0,φ,0)を取り出し、仮説生成規則Tの状態0から入力記号“雨”で遷移可能な状態遷移
<0→1,雨:雨/0>,
<0→3,雨:雨/0>
を含む状態遷移過程リストEを作る。
ステップS305で状態遷移過程リストE=φではないのでステップS306に進む。状態遷移過程リストEから状態遷移<0→1,雨:雨/0>を取り出し、ステップS307で補助仮説(1,雨,0)を生成し、ステップS308で補助仮説(1,雨,0)をL’に挿入する。
In step S302, an empty auxiliary hypothesis list L ′ is generated.
In step S303, AW [f] = 0.
Auxiliary hypothesis list in step S304 L = {(0, φ , 0)} from the auxiliary hypotheses (0, phi, 0) was taken out, transition possible state transitions in the input symbol "rain" from the state 0 of hypothesis generation rule T 2 <0 → 1, rain: rain / 0>,
<0 → 3, rain: rain / 0>
Make a state transition process list E 2, including.
Since the state transition process list E 2 = φ is not satisfied in step S305, the process proceeds to step S306. State transition from the state transition process list E 2 <0 → 1, rain: Rain / 0> was removed, auxiliary hypotheses in step S307 (1, rain, 0) generates the auxiliary hypotheses (1 in step S308, rain, 0 ) Is inserted into L ′.

ステップS305に戻り状態遷移過程リストE=φではないのでステップS306に進む。状態遷移過程リストEから状態遷移<0→3,雨:雨/0>を取り出し、ステップS307で補助仮説(3,雨,0)を生成し、ステップS308で補助仮説(3,雨,0)をL’に挿入する。
ステップS305に戻り状態遷移過程リストE=φであるため、ステップS309に進む。補助仮説リストL=φなのでステップS310に進み、補助仮説リストL’の要素(1,雨,0),(3,雨,0)をLに移す。
ステップS311において仮説の累積重みは0となり、ステップS312で仮説の補正を終了する。この結果、仮説は(1,雨,0,{(1,雨,0),(3,雨,0)})となる。
Returning to step S305, since the state transition process list E 2 = φ is not satisfied, the process proceeds to step S306. State transition process list E 2 state transition from <0 → 3, rain: Rain / 0> was removed, step S307 in the auxiliary hypothesis (3, rain, 0) to generate a step S308 in the auxiliary hypothesis (3, rain, 0 ) Is inserted into L ′.
Returning to step S305, since the state transition process list E 2 = φ, the process proceeds to step S309. Since the auxiliary hypothesis list L = φ, the process proceeds to step S310, and the elements (1, rain, 0) and (3, rain, 0) of the auxiliary hypothesis list L ′ are moved to L.
In step S311, the hypothesis cumulative weight becomes 0, and the hypothesis correction is terminated in step S312. As a result, the hypothesis is (1, rain, 0, {(1, rain, 0), (3, rain, 0)}).

ステップS210に戻り、仮説(1,0,{(1,雨,0),(3,雨,0)})を仮説リストH’に挿入する。
ステップS206に戻り状態遷移過程リストE=φではないのでステップS207に進み、状態遷移過程リストEから状態遷移<0→2,あ:飴/0>を取り出し、ステップS208で新たな仮説f=(2,飴,0,{0,φ,0})を生成し、ステップS209で状態遷移<0→2,あ:飴/0>の出力記号はεではないので、仮説f=(2,飴,0,{(0,φ,0)})を補正するためステップS301に進む。
ステップS302で空の補助仮説リストL’を生成する。
ステップS303で累積重みAW[f]=0となる。
Returning to step S210, the hypothesis (1, 0, {(1, rain, 0), (3, rain, 0)}) is inserted into the hypothesis list H ′.
Because it is not a state transition process list E 1 = phi returns to step S206 proceeds to step S207, the state transition from the state transition process list E 1 <0 → 2, Ah: candy / 0> was removed, new hypotheses in step S208 f = (2, 飴, 0, {0, φ, 0}), and since the output symbol of the state transition <0 → 2, a: < / 0> is not ε in step S209, the hypothesis f = (2 , 飴, 0, {(0, φ, 0)}), the process proceeds to step S301.
In step S302, an empty auxiliary hypothesis list L ′ is generated.
In step S303, the cumulative weight AW [f] = 0.

ステップS304で補助仮説リストL={(0,φ,0)}から補助仮説(0,φ,0)を取り出し、仮説生成規則Tの状態0から入力記号“雨”で遷移可能な状態遷移
<0→2,飴:飴/0>,
<0→4,飴:飴/0>
を含むリストEを作る。
ステップS305でリストE=φではないのでステップS306に進む。リストEから状態遷移<0→2,飴:飴/0>を取り出し、ステップS307で補助仮説(2,飴,0)を生成し、ステップS308で補助仮説(2,飴,0)を補助仮説リストL’に挿入する。
Auxiliary hypothesis list in step S304 L = {(0, φ , 0)} from the auxiliary hypotheses (0, phi, 0) was taken out, transition possible state transitions in the input symbol "rain" from the state 0 of hypothesis generation rule T 2 <0 → 2, 飴: 飴 / 0>,
<0 → 4, 飴: 飴 / 0>
Make a list E 2, including.
Since the list E 2 = φ is not satisfied in step S305, the process proceeds to step S306. State transition from the list E 2 <0 → 2, candy: candy / 0> was removed, auxiliary hypotheses in step S307 (2, candy, 0) generates the auxiliary hypotheses in step S308 (2, candy, 0) auxiliary Insert into hypothesis list L ′.

ステップS305に戻り状態遷移過程リストE=φではないのでステップS306に進む。Eから状態遷移<0→4,飴:飴/0>を取り出し、ステップS307で補助仮説(4,飴,0)を生成し、ステップS308で補助仮説(4,飴,0)を補助仮説リストL’に挿入する。
ステップS305に戻り状態遷移過程リストE=φであるため、ステップS309に進む。補助仮説リストL=φなのでステップS310に進み、補助仮説リストL’の要素(2,飴,0),(4,飴,0)をLに移す。
ステップS311において仮説の累積重みは0となり、ステップS312で仮説の補正を終了する。この結果、仮説は(2,0,{(2,飴,0),(4,飴,0)})となっている。
Returning to step S305, since the state transition process list E 2 = φ is not satisfied, the process proceeds to step S306. E 2 state transition from <0 → 4, candy: candy / 0> was removed, step S307 in the auxiliary hypothesis (4, candy, 0) generates the auxiliary hypothesis (4, candy, 0) at step S308 auxiliary hypothesis Insert into list L '.
Returning to step S305, since the state transition process list E 2 = φ, the process proceeds to step S309. Since the auxiliary hypothesis list L = φ, the process proceeds to step S310, and the elements (2, 飴, 0) and (4, 飴, 0) of the auxiliary hypothesis list L ′ are moved to L.
In step S311, the hypothesis cumulative weight becomes 0, and the hypothesis correction is terminated in step S312. As a result, the hypothesis is (2, 0, {(2, 飴, 0), (4, 飴, 0)}).

ステップS210に戻り、仮説(2,飴,0,{(2,飴,0),(4,飴,0)})を仮説リストH’に挿入する。
ステップS206に戻りE=φであるためステップS211に進む。仮説リストH=φであるためステップS212に進み仮説リストH’内の仮説(1,雨,0,{(1,雨,0),(3,雨,0)})と(2,飴,0,{(2,飴,0),(4,飴,0)})を仮説リストHに移し、ステップS213で次の入力記号が存在するのでステップS204に戻る。
Returning to step S210, the hypothesis (2, 飴, 0, {(2, 飴, 0), (4, 飴, 0)}) is inserted into the hypothesis list H ′.
Returning to step S206, since E 1 = φ, the process proceeds to step S211. Since the hypothesis list H = φ, the process proceeds to step S212 and the hypotheses (1, rain, 0, {(1, rain, 0), (3, rain, 0)}) and (2, 飴, 0) in the hypothesis list H ′. 0, {(2, 飴, 0), (4, 飴, 0)}) are moved to the hypothesis list H, and since the next input symbol exists in step S213, the process returns to step S204.

〔入力記号“め”の処理〕
続いて、ステップS204で記号“め”を読み込み、ステップS205において仮説リストHから仮説(1,雨,0,{(1,雨,0),(1,1,雨,0)})を取り出す。この仮説の仮説生成規則Tの現状態1から入力記号が“め”の状態遷移
<1→5,め:ε/1>
を含む状態遷移過程リストEを作る。
ステップS206で状態遷移過程リストE=φではないのでステップS207に進み、状態遷移過程リストEから状態遷移<1→5,め:ε/1>を取り出し、ステップS208で新たな仮説(5,雨,1,{(1,雨,0),(3,雨,0)})を生成し、ステップS209に進む。
[Processing of input symbol “me”]
Subsequently, the symbol “me” is read in step S204, and a hypothesis (1, rain, 0, {(1, rain, 0), (1, 1, rain, 0)}) is extracted from the hypothesis list H in step S205. . State transition of the input symbol is "because" from the current state 1 of hypothesis generation rule T 1 of this hypothesis <1 → 5, because: ε / 1>
Make a state transition process list E 1, including.
Because it is not a state transition process list E 1 = phi at step S206 proceeds to step S207, the state transition from the state transition process list E 1 <1 → 5, because: epsilon / 1> was removed, a new hypothesis in step S208 (5 , Rain, 1, {(1, rain, 0), (3, rain, 0)}), and the process proceeds to step S209.

状態遷移<1→5,め:ε/1>の出力記号はεであるため、次のステップS210に進み仮説(5,雨,1,{(1,雨,0),(3,雨,0)})を仮説リストH’に挿入する。
ステップS206に戻り状態遷移過程リストE=φであるためステップS211に進む。仮説リストH≠φであるためステップS205に戻り、仮説リストHから仮説(2,飴,0,{(2,飴,0),(4,飴,0)})を取り出す。この仮説の現状態2から入力記号が“め”の状態遷移
(<2→5,め:ε/2>,φ)
を含む状態遷移過程リストEを作る。
Since the output symbol of the state transition <1 → 5, ε / 1> is ε, the process proceeds to the next step S210 and the hypothesis (5, rain, 1, {(1, rain, 0), (3, rain, 0)}) is inserted into the hypothesis list H ′.
Returning to step S206, since the state transition process list E 1 = φ, the process proceeds to step S211. Since the hypothesis list H ≠ φ, the process returns to step S205, and the hypothesis (2, 飴, 0, {(2, 飴, 0), (4, 飴, 0)}) is extracted from the hypothesis list H. State transition from the current state 2 of this hypothesis to the input symbol “M” (<2 → 5, M: ε / 2>, φ)
Make a state transition process list E 1, including.

ステップS206で状態遷移過程リストE=φではないのでステップS207に進み、状態遷移過程リストEから状態遷移<2→5,め:ε/2>を取り出し、ステップS208で新たな仮説(5,飴,2,{(2,飴,0),(4,飴,0)})を生成し、ステップS209に進む。
状態遷移<2→5,め:ε/2>の出力記号はεであるため、次のステップS210に進み仮説(5,飴,2,{(2,飴,0),(4,飴,0)})を仮説リストH’に挿入する。
Since the state transition process list E 1 = not at φ at step S206 proceeds to step S207, the state transition from the state transition process list E 1 <2 → 5, because: epsilon / 2> was removed, a new hypothesis in step S208 (5 , 飴, 2, {(2, 飴, 0), (4, 飴, 0)}), and the process proceeds to step S209.
Since the output symbol of the state transition <2 → 5: ε / 2> is ε, the process proceeds to the next step S210 and the hypothesis (5, 飴, 2, {(2, 飴, 0), (4, 飴, 0)}) is inserted into the hypothesis list H ′.

但し、仮説リストH’には既に仮説(5,雨,1,{(1,雨,0),(3,雨,0)})が存在し、仮説生成規則Tにおける到達状態が5であるため、累積重みの小さい仮説(5,雨,1,{(1,雨,0),(3,雨,0)})を残し、仮説(5,飴,2,{(2,飴,0),(4,飴,0)})は削除するが、補助仮説リストは連結させて、仮説を(5,雨,1,{(1,雨,1),(3,雨,1),(2,飴,2),(4,飴,2)})のようにする。
ステップS206に戻り状態遷移過程リストE=φであるためステップS211に進む。仮説リストH=φであるためステップS212に進み仮説リストH’内の仮説(5,雨,1,{(1,雨,1),(1,雨,1),(2,飴,2),(4,飴,2)})を仮説リストHに移し、ステップS213で次の入力記号が存在するのでステップS204に戻る。
However, a hypothesis (5, rain, 1, {(1, rain, 0), (3, rain, 0)}) already exists in the hypothesis list H ′, and the arrival state in the hypothesis generation rule T 1 is 5. Therefore, the hypothesis (5, rain, 1, {(1, rain, 0), (3, rain, 0)}) with a small cumulative weight remains, and the hypothesis (5, 飴, 2, {(2, 飴, 0), (4, 飴, 0)}) are deleted, but the auxiliary hypothesis lists are linked and the hypotheses are (5, rain, 1, {(1, rain, 1), (3, rain, 1) , (2, 飴, 2), (4, 飴, 2)}).
Returning to step S206, since the state transition process list E 1 = φ, the process proceeds to step S211. Since the hypothesis list H = φ, the process proceeds to step S212, and the hypotheses in the hypothesis list H ′ (5, rain, 1, {(1, rain, 1), (1, rain, 1), (2, 飴, 2) , (4, 飴, 2)}) is moved to the hypothesis list H, and since the next input symbol exists in step S213, the process returns to step S204.

〔入力記号“だ”の処理〕
続いて、ステップS204で記号“だ”を読み込み、ステップS205において仮説リストHから仮説(5,雨,1,{(1,雨,1),(1,雨,1),(2,飴,2),(4,飴,2)})を作り出す。この仮説の仮説生成規則Tの現状態5から入力記号が“だ”の状態遷移
<0→4,だ:玉/1>
を含む状態遷移過程リストEを作る。ここで、仮説生成規則Tの現状態5から状態0へは入力記号なしで遷移できるので、Eに含まれる仮説生成規則Tの状態遷移は<0→4,だ:玉/1>となっている。
[Processing of input symbol “da”]
Subsequently, in step S204, the symbol “da” is read, and in step S205, the hypothesis (5, rain, 1, {(1, rain, 1), (1, rain, 1), (2, hail, 2), (4, 2)}). State transition in which the input symbol is “da” from the current state 5 of the hypothesis generation rule T 1 of this hypothesis <0 → 4: ball / 1>
Make a state transition process list E 1, including. Here, since the transition from the current state 5 of the hypothesis generation rule T 1 to the state 0 can be made without an input symbol, the state transition of the hypothesis generation rule T 1 included in E 1 is <0 → 4: ball / 1>. It has become.

ステップS206で状態遷移過程リストE=φではないのでステップS207に進み、状態遷移過程リストEから状態遷移<0→4,だ:玉/1>を取り出し、ステップS208で新たな仮説f=(4,雨玉,2,{(1,雨,1),(3,雨,1),(2,飴,2),(4,飴,2)})を生成し、ステップS209で状態遷移<0→4,だ:玉/1>の出力記号はεではないので、仮説f=(4,雨玉,2,{(1,雨,1),(3,雨,1),(2,飴,2),(4,飴,2)})を補正するためステップS301に進む。
ステップS302で空の補助仮説リストL’を生成する。
ステップS303で累積重みAW[f]=2−min(1,1,2,2)=1となる。
Because it is not a state transition process list E 1 = phi at step S206 proceeds to step S207, the state transition from the state transition process list E 1 <0 → 4, but: Ball / 1> was removed, a new hypothesis in step S208 f = (4, rainball, 2, {(1, rain, 1), (3, rain, 1), (2, 飴, 2), (4, 飴, 2)}) are generated, and the state is determined in step S209. Since the output symbol of transition <0 → 4: ball / 1> is not ε, hypothesis f = (4, rainball, 2, {(1, rain, 1), (3, rain, 1), ( 2, 飴, 2), (4, 飴, 2)}) is corrected to step S301.
In step S302, an empty auxiliary hypothesis list L ′ is generated.
In step S303, the cumulative weight AW [f] = 2−min (1, 1, 2, 2) = 1.

ステップS304で補助仮説リストL={(1,雨,1),(3,雨,1),(2,飴,2),(4,飴,2)}から補助仮説(1,雨,1)を取り出し、仮説生成規則Tの状態1から入力記号“玉”で遷移可能な状態遷移
<1→4,玉:玉/5>
を含む状態遷移過程リストEを作る。
ステップS305でE=φではないのでステップS306に進む。状態遷移過程リストEから状態遷移<1→4,玉:玉/5>を取り出し、ステップS307で補助仮説(4,雨玉,7)を生成する。ここで、補助仮説の累積重みは
W[g]+AW[f]+w[e]=1+1+5=7
のように計算されている。そして、ステップS308で補助仮説(4,雨玉,7)をL’に挿入する。
In step S304, the auxiliary hypothesis list L = {(1, rain, 1), (3, rain, 1), (2, 飴, 2), (4, 飴, 2)} is used as the auxiliary hypothesis (1, rain, 1). ) And a state transition that can be transitioned from the state 1 of the hypothesis generation rule T 2 with the input symbol “ball” <1 → 4, ball: ball / 5>
Make a state transition process list E 2, including.
Since E 2 = φ is not satisfied in step S305, the process proceeds to step S306. State transition from the state transition process list E 2 <1 → 4, Ball: Ball / 5> was removed, the auxiliary hypothesis (4, candy, 7) at step S307 to generate. Here, the cumulative weight of the auxiliary hypothesis is W [g] + AW [f] + w [e 2 ] = 1 + 1 + 5 = 7
It is calculated as follows. In step S308, the auxiliary hypothesis (4, raindrop, 7) is inserted into L ′.

ステップS305に戻りE=φであるため、ステップS309に進む。
補助仮説リストL=φではないのでステップS304に進み、補助仮説(3,雨,1)を取り出し、仮説生成規則Tの状態3から入力記号“玉”で遷移可能な状態遷移は存在しないので状態遷移過程リストE=φとする。
ステップS305に戻りE=φであるため、ステップS309に進む。補助仮説リストL=φではないのでステップS304に進み、補助仮説(2,飴,2)を取り出し、仮説生成規則Tの状態2から入力記号“玉”で遷移可能な状態遷移
<2→4,玉:玉/1>
を含むリストEを作る。
Returning to step S305, since E 2 = φ, the process proceeds to step S309.
Is not a supplementary hypothesis list L = phi proceeds to step S304, auxiliary hypotheses (3, rain, 1) was taken out, and the state transition does not exist possible transitions in the input symbol "ball" from the state 3 of hypothesis generation rule T 2 State transition process list E 2 = φ.
Returning to step S305, since E 2 = φ, the process proceeds to step S309. Is not a supplementary hypothesis list L = phi proceeds to step S304, auxiliary hypothesis (2, candy, 2) is removed and transition possible state transitions in the input symbol "ball" from the state 2 of hypothesis generation rule T 2 <2 → 4 , Jade: Jade / 1>
Make a list E 2, including.

ステップS305でE=φではないのでステップS306に進む。状態遷移過程リストEから状態遷移<2→4,玉:玉/1>を取り出し、ステップS307で補助仮説(4,飴玉,4)を生成する。ここで、補助仮説の累積重みは
W[g]+AW[f]+w[e]=2+1+1=4
のように計算されている。
ステップS308で補助仮説(4,飴玉,4)を補助仮説リストL’に挿入する。このとき補助仮説リストL’には補助仮説(4,雨玉,7)が存在するので累積重みの小さい補助仮説(4,飴玉,4)を残し、(4,雨玉,7)は削除する。
Since E 2 = φ is not satisfied in step S305, the process proceeds to step S306. State transition from the state transition process list E 2 <2 → 4, Ball: Ball / 1> was removed, the auxiliary hypothesis (4, hard candy, 4) in step S307 to generate. Here, the cumulative weight of the auxiliary hypothesis is W [g] + AW [f] + w [e 2 ] = 2 + 1 + 1 = 4
It is calculated as follows.
In step S308, the auxiliary hypothesis (4, jasper, 4) is inserted into the auxiliary hypothesis list L ′. At this time, there is an auxiliary hypothesis (4, rainball, 7) in the auxiliary hypothesis list L ′, so the auxiliary hypothesis (4, jasper, 4) with a small cumulative weight is left and (4, rainball, 7) is deleted. To do.

ステップS305に戻りE=φであるため、ステップS309に進む。
L=φではないのでステップS404に進み、補助仮説(4,飴,2)を取り出し、仮説生成規則Tの状態4から入力記号“玉”で遷移可能な状態遷移は存在しないので状態遷移過程リストE=φとする。
ステップS305に戻りE=φであるため、ステップS309に進む。補助仮説リストL=φなのでステップS310に進み、補助仮説リストL’の要素(4,飴玉,3)をLに移す。
Returning to step S305, since E 2 = φ, the process proceeds to step S309.
Is not a L = phi proceeds to step S404, the auxiliary hypothesis (4, candy, 2) is removed and hypothesis generation rule transitions possible state transitions from the state 4 in the input symbol "ball" of T 2 are nonexistent and the state transition process Let list E 2 = φ.
Returning to step S305, since E 2 = φ, the process proceeds to step S309. Since the auxiliary hypothesis list L = φ, the process proceeds to step S310, and the element (4, jasper, 3) of the auxiliary hypothesis list L ′ is moved to L.

ステップS311において仮説の累積重みは4となり、ステップS312で仮説の補正を終了し、結果として、仮説は(4,雨玉,4,{(4,飴玉,4)})となる。
ステップS210に戻って仮説(4,雨玉,4,{(4,飴玉,4)})をH’に挿入する。
ステップS206に戻りE=φであるためステップS211に進む。H=φであるためステップS212に進みH’内の仮説(4,雨玉,4,{(4,飴玉,4)})をHに移し、ステップS213で次の入力記号が存在するのでステップS204に戻る。
In step S311, the cumulative weight of the hypothesis is 4, and the correction of the hypothesis is ended in step S312, and as a result, the hypothesis is (4, rainball, 4, {(4, jasper, 4)}).
Returning to step S210, the hypothesis (4, rainball, 4, {(4, jasper, 4)}) is inserted into H ′.
Returning to step S206, since E 1 = φ, the process proceeds to step S211. Since H = φ, the process proceeds to step S212, and the hypothesis (4, rainball, 4, {(4, jasper, 4)}) in H ′ is moved to H, and the next input symbol exists in step S213. The process returns to step S204.

〔入力記号“ま”の処理〕
続いて、ステップS204で記号“ま”を読み込み、ステップS205において仮説リストHから仮説(4,雨玉,4,{(4,飴玉,4)})を取り出す。この仮説の仮説生成規則Tの現状態1から入力記号が“ま”の状態遷移
<4→5,ま:ε/1>
を含む状態遷移過程リストEを作る。
ステップS206でE=φではないのでステップS207に進み、状態遷移過程リストEから状態遷移<4→5,ま:ε/1>を取り出し、ステップS208で新たな仮説f=(5,雨玉,5,{(4,飴玉,4)})を生成し、ステップS209に進む。
状態遷移<4→5,ま:ε/1>の出力記号はεであるため、次のステップS210に進み仮説f=(5,雨玉,5,{(4,飴玉,4)})を仮説リストH’に挿入する。
[Processing of input symbol “MA”]
Subsequently, the symbol “ma” is read in step S204, and a hypothesis (4, rainball, 4, {(4, jasper, 4)}) is extracted from the hypothesis list H in step S205. State transition from the current state 1 of the hypothesis generation rule T 1 of this hypothesis to the input symbol “MA” <4 → 5, MA: ε / 1>
Make a state transition process list E 1, including.
Since E 1 = not at φ at step S206 proceeds to step S207, the state transition from the state transition process list E 2 <4 → 5, or: epsilon / 1> was removed, a new hypothesis in step S208 f = (5, rain Ball, 5, {(4, jade ball, 4)}), and the process proceeds to step S209.
Since the output symbol of the state transition <4 → 5 or ε / 1> is ε, the process proceeds to the next step S210 and the hypothesis f = (5, rainball, 5, {(4, jasper, 4)}). Is inserted into the hypothesis list H ′.

ステップS206に戻りE=φであるためステップS211に進む。仮説リストH=φであるためステップS212に進み仮説リストH’内の仮説(5,雨玉,5,{(4,飴玉,4)})を仮説リストHに移し、ステップS213で次の入力記号が存在しないのでステップS214に進む。
ステップS214で、仮説リストH内の仮説h=(5,雨玉,5,{(4,飴玉,4)})が終了状態に到達した唯一の仮説であり、補助仮説リストL[h]に含まれる補助仮説g=(4,飴玉,4)について累積重みW[g]=4+(5−1)+0=5を計算し、その補助仮説の出力記号列“飴玉”を変換結果として出力し、ステップS215で記号列変換処理を終了する。
E.Roche and Y.Schabes著、“Finite-State Language Processing”,MIT Press.1997 長尾真著“岩波講座ソフトウエア14;知識と推論”、岩波書店109〜113頁 E.Roche and Y.Schabes著、“Finite-State Language Processing”,MIT Press,1997の15章“Speech Recognition by Composition of Weighted Finite Automata”
Returning to step S206, since E 1 = φ, the process proceeds to step S211. Since the hypothesis list H = φ, the process proceeds to step S212, and the hypothesis (5, rainball, 5, {(4, jasper, 4)}) in the hypothesis list H ′ is moved to the hypothesis list H. Since there is no input symbol, the process proceeds to step S214.
In step S214, the hypothesis h = (5, rainball, 5, {(4, jasper, 4)}) in the hypothesis list H is the only hypothesis that has reached the end state, and the auxiliary hypothesis list L [h] The cumulative weight W [g] = 4 + (5-1) + 0 = 5 is calculated for the auxiliary hypothesis g = (4, jasper, 4) included in the sub-hypothesis, and the output symbol string “Kotama” of the auxiliary hypothesis is converted. And the symbol string conversion process ends in step S215.
E. Roche and Y. Schabes, “Finite-State Language Processing”, MIT Press. 1997 Nagao Makoto "Iwanami Lecture Software 14; Knowledge and Reasoning", Iwanami Shoten, 109-113 E. Roche and Y. Schabes, “Finite-State Language Processing”, MIT Press, 1997, Chapter 15 “Speech Recognition by Composition of Weighted Finite Automata”

従来は2つの仮説生成部を用いて記号列を変換する記号列変換方法はあったが、2つの仮説生成部を用いて複雑な変換過程を必要とする記号列変換を行なわせるためには2つの仮説生成部に要求される変換機能は高度となり、その作成に多くの人手とコストが要求される。
本発明では3個以上の仮説生成部を組合せて高度の変換機能を得ることができる記号列変換方法及び装置を提供しようとするものである。つまり、各個々の仮説生成部の機能は簡素でありながら、それらを多段に組合せることにより高度の変換機能を得ようとするものである。
Conventionally, there has been a symbol string conversion method for converting a symbol string using two hypothesis generation units. However, in order to perform symbol string conversion that requires a complex conversion process using two hypothesis generation units, 2 is used. The conversion function required for one hypothesis generation unit is sophisticated, and a lot of manpower and cost are required for its creation.
The present invention intends to provide a symbol string conversion method and apparatus capable of obtaining a high-level conversion function by combining three or more hypothesis generation units. That is, the function of each individual hypothesis generation unit is simple, but an advanced conversion function is obtained by combining them in multiple stages.

本発明による記号列変換方法の特徴はコンピュータによって、記号列を順に読み込む記号列入力部と、仮説生成規則によって入力された記号列を他の記号列の候補となる仮説に変換する3個以上M個の仮説生成部を備えた記号列変換部と、この記号列変換部が出力する変換結果を取り込む記号列出力部とを構成し、記号列変換部はM個の各仮説生成部のそれぞれに入力される入力記号列に対して状態遷移が可能な過程で求められる記号列で構成される仮説を生成する仮説生成処理と、生成された仮説に付与された累積重み値を、各後段の仮説生成部が生成する仮説に付与された累積重みの中の特異値により補正する仮説補正処理と、補正された累積重みを用いて不要な仮説を除去し、尤度の高い仮説に絞り込む仮説絞り込処理とを実行する点である。   The symbol string conversion method according to the present invention is characterized by a symbol string input unit that sequentially reads a symbol string by a computer, and three or more M that convert a symbol string input by a hypothesis generation rule into hypotheses that are candidates for other symbol strings. A symbol string conversion unit including a plurality of hypothesis generation units, and a symbol string output unit that captures a conversion result output by the symbol string conversion unit. The symbol string conversion unit is provided for each of the M hypothesis generation units. A hypothesis generation process for generating a hypothesis composed of symbol strings obtained in a process in which a state transition can be performed with respect to an input symbol string to be input, and a cumulative weight value assigned to the generated hypothesis Hypothesis correction processing that corrects by the singular value among the cumulative weights assigned to the hypotheses generated by the generation unit, and the hypothesis narrowing down that eliminates unnecessary hypotheses using the corrected cumulative weights and narrows down to the high likelihood hypotheses Points to perform processing A.

本発明による記号列変換方法の更に他の特徴は上記記号列変換方法において、
仮説補正処理は、各仮説生成部が生成した仮説に付与される累積重みを、次段の仮説生成部において生成される仮説のそれぞれに付与される累積重み乃至は補正された累積重みの中の特異値を呈する累積重みを用いて補正する仮説補正処理を含み、この仮説補正処理を記号列入力部から1段目の仮説生成部へ記号が入力される毎にM−1段目の仮説生成部が生成した仮説の累積重みから1段目の仮説生成部が生成した仮説の累積重みの全てに渡って適用することを特徴とする。
Still another feature of the symbol string conversion method according to the present invention is the symbol string conversion method,
In the hypothesis correction process, the cumulative weight given to the hypothesis generated by each hypothesis generation unit is calculated from the cumulative weight given to each hypothesis generated in the hypothesis generation unit in the next stage or the corrected cumulative weight. This includes a hypothesis correction process that corrects using cumulative weights that exhibit singular values, and this hypothesis correction process is performed every time a symbol is input from the symbol string input unit to the first hypothesis generation unit. This is applied to all the cumulative weights of hypotheses generated by the first-stage hypothesis generator from the cumulative weights of hypotheses generated by the first section.

本発明による記号列変換方法の更に他の特徴は前記の何れかに記載の記号列変換方法において、
仮説絞り込処理は、入力信号列が全て読み込まれた時点で、1段目の仮説生成部が生成した仮説の補正された累積重みの中の特異値を呈する累積重みを持つ仮説を抽出する仮説抽出処理と、この仮説抽出処理で抽出した仮説を次段の仮説生成部の入力記号列として入力する入力処理とを含み、これら仮説抽出処理と入力処理とを各仮説生成部に対して実行させて1段目の仮説生成部が生成した仮説からM段目の仮説生成部が生成した仮説の全ての中から補正された累積重みによって指定される仮説を選択し、M段目の仮説生成部が生成した仮説の中から仮説抽出処理で抽出した仮説をもって記号列変換結果として出力することを特徴とする。
Still another feature of the symbol string conversion method according to the present invention is the symbol string conversion method according to any one of the above,
Hypothesis narrowing-down processing is a hypothesis that extracts hypotheses having cumulative weights that exhibit singular values among the corrected cumulative weights of hypotheses generated by the first-stage hypothesis generation unit when all input signal sequences are read. Including an extraction process and an input process for inputting the hypothesis extracted in this hypothesis extraction process as an input symbol string of the hypothesis generation part in the next stage, and causing each hypothesis generation part to execute the hypothesis extraction process and the input process. From the hypotheses generated by the first-stage hypothesis generation unit, a hypothesis specified by the corrected cumulative weight is selected from all hypotheses generated by the M-th hypothesis generation unit, and the M-th hypothesis generation unit The hypothesis extracted by the hypothesis extraction process from the hypotheses generated by is output as a symbol string conversion result.

本発明では更に上記した記号列変換方法を用いた音声認識方法を提案するものであり、その特徴は入力音声信号からその音響特徴を表わす記号列を抽出する音響特徴記号列変換処理ステップを備え、この音響特徴記号列変換処理ステップで変換された音響特徴を表わす記号列を前記した記号列変換方法の何れかにより入力音声信号に対応する記号列に変換することを特徴とする。   The present invention further proposes a speech recognition method using the above-described symbol string conversion method, and the feature includes an acoustic feature symbol string conversion processing step for extracting a symbol string representing the acoustic feature from an input speech signal, The symbol string representing the acoustic feature converted in the acoustic feature symbol string conversion processing step is converted into a symbol string corresponding to the input voice signal by any of the symbol string conversion methods described above.

本発明では更に音声認識方法を用いた音声言い換え方法を提案するものであり、その特徴は入力音声信号をその音響特徴を表す音響特徴記号列に変換し、その音響特徴を表す記号列から単語の系列に変換する音声認識方法と、この音声認識方法で得られた単語の系列が文としてもっともらしい場合により小さな重みを与える第1仮説生成処理と、前記音声認識方法で得られた単語の系列を別の言語や様式の単語の系列に置き換える第2仮説生成処理と、その別の言語や様式の単語の系列が、その別の言語や様式の文としてもっともらしい場合により小さな重みを与える。第3仮説生成処理とから成る3回以上の仮説生成処理を用いて音声信号を別の言語や様式の文に変換して記号列出力部から出力することを特徴とする。   The present invention further proposes a speech paraphrasing method using a speech recognition method, the feature of which is to convert an input speech signal into an acoustic feature symbol string representing the acoustic feature, and from the symbol string representing the acoustic feature to the word A speech recognition method for converting into a sequence, a first hypothesis generation process that gives a smaller weight when a sequence of words obtained by the speech recognition method is plausible, and a sequence of words obtained by the speech recognition method. The second hypothesis generation process to be replaced with a sequence of words in another language or style, and the sequence of words in the other language or style give a smaller weight when it is plausible as a sentence in the other language or style. The speech signal is converted into a sentence in another language or style using at least three hypothesis generation processes including the third hypothesis generation process, and is output from the symbol string output unit.

本発明によれば3個以上の仮説生成部を用いて記号列を変換できるから、各個々の仮説生成部の変換機能は簡素であっても、全体として高度の変換機能を得ることができる。因みに、例えば2ケ国語用の変換機能を持つ仮説生成部は比較的簡素に作成することができる。日本語から英語への変換機能を持つ第1仮説生成部、英語からフランス語への変換機能を持つ第2仮説生成部、フランス語からドイツ語への変換機能を持つ第3仮説生成部等である。これらの仮説生成部が存在する状況下にあって本発明を適用することにより、第1仮説生成部と第2仮説生成部を組合せて日本語からフランス語への変換機能を持つ記号変換装置を得ることができる。また第1仮説生成部と第2仮説生成部と第3仮説生成部を組合せて日本語からドイツ語への変換機能を持つ記号変換装置を簡単に得ることができる点が本発明の大きな特徴である。   According to the present invention, since a symbol string can be converted using three or more hypothesis generation units, even if the conversion function of each individual hypothesis generation unit is simple, an advanced conversion function can be obtained as a whole. Incidentally, for example, a hypothesis generator having a conversion function for two languages can be created relatively simply. A first hypothesis generator having a function of converting Japanese to English, a second hypothesis generator having a function of converting English to French, a third hypothesis generator having a function of converting French to German, and the like. By applying the present invention in a situation where these hypothesis generation units exist, a symbol conversion device having a conversion function from Japanese to French is obtained by combining the first hypothesis generation unit and the second hypothesis generation unit. be able to. A major feature of the present invention is that a symbol conversion device having a function of converting from Japanese to German can be easily obtained by combining the first hypothesis generator, the second hypothesis generator, and the third hypothesis generator. is there.

本発明による記号列変換装置はハードウエアによって構成することができるが、それよりも、本発明による記号列変換プログラムをコンピュータにインストールし、コンピュータに記号列変換装置として機能させる実施形態が最良の実施形態である。   The symbol string conversion apparatus according to the present invention can be configured by hardware, but the embodiment in which the symbol string conversion program according to the present invention is installed in a computer and causes the computer to function as the symbol string conversion apparatus is the best implementation. It is a form.

コンピュータを本発明による記号列変換装置として機能させるには、コンピュータには記号列を順に読み込む記号列入力部と、状態遷移過程によって記号列を他の記号列の候補となる仮説を生成するM段の仮説生成部と、このM段の仮説生成部で生成した各仮説に付与された重みをそれぞれ後段側の仮説生成部で生成された仮説に付与されている重みを用いて補正する仮説補正部と、この仮説補正部で補正された重みを用いて尤度の高い仮説を選択し仮説を絞り込む仮説絞込み部と、この仮説絞込み部が絞り込んだ仮説を出力記号列として出力する記号列出力部とを構築し記号列変換装置として機能させる。   In order for the computer to function as the symbol string conversion device according to the present invention, the computer has a symbol string input unit for sequentially reading the symbol strings, and M stages for generating a hypothesis that becomes a candidate for another symbol string through the state transition process. Hypothesis generation unit and a hypothesis correction unit that corrects the weights assigned to each hypothesis generated by the M-stage hypothesis generation unit using the weights assigned to the hypotheses generated by the hypothesis generation unit on the subsequent stage side. A hypothesis narrowing unit that selects a hypothesis having a high likelihood using the weight corrected by the hypothesis correction unit and narrows down the hypothesis, a symbol string output unit that outputs the hypothesis narrowed down by the hypothesis narrowing unit as an output symbol string, To function as a symbol string converter.

つまり、記号入力部は他の記号列に変換すべき記号列を1記号ずつ読み込んで初段の仮説生成部に引き渡す。初段の仮説生成部は記号が入力される毎に自己に与えられている重み付き有限状態変換機能(例えば日本語を英語に変換する機能)により状態遷移が可能な組合せに基づいて変換先の記号列の候補記号列となる仮説を生成する。仮説は1個に限らず複数生成される場合が多く、各仮説には重みが付与される。   That is, the symbol input unit reads a symbol string to be converted into another symbol string one by one and passes it to the first-stage hypothesis generation unit. The first-stage hypothesis generator generates a symbol to be converted based on a combination that allows state transition by a weighted finite state conversion function (for example, a function that converts Japanese to English) given to the symbol each time it is input. A hypothesis that is a candidate symbol string of the column is generated. The number of hypotheses is not limited to one and is often generated, and each hypothesis is given a weight.

1段目の仮説生成部で生成した仮説は全て2段目の仮説生成部に入力記号列として入力される。2段目の仮説生成部はこの2段目の仮説生成部に与えられている重み付き有限状態変換機能により更に他の記号列の候補記号列となる仮説を生成する。2段目の仮説生成部で生成される仮説には1段目の仮説生成部で付与された重みと2段目の仮説生成部で付与される重みが累積される。2段目の仮説生成部において可能な状態遷移過程の各々で生成される仮説を更に3段目の仮説生成部の入力記号列として受渡す手順をM段目の仮説生成部まで繰返す。   All hypotheses generated by the first-stage hypothesis generator are input as input symbol strings to the second-stage hypothesis generator. The second-stage hypothesis generation unit generates a hypothesis that becomes a candidate symbol string of another symbol string by the weighted finite state conversion function given to the second-stage hypothesis generation unit. In the hypothesis generated by the second-stage hypothesis generation unit, the weight given by the first-stage hypothesis generation unit and the weight given by the second-stage hypothesis generation unit are accumulated. The procedure for delivering hypotheses generated in each of the possible state transition processes in the second-stage hypothesis generation section as an input symbol string of the third-stage hypothesis generation section is repeated until the M-th hypothesis generation section.

仮説補正部は前記仮説生成過程をM段目の仮説生成部まで受渡す手順によって求められたM−1段目の仮説生成部の個々の仮説生成過程で付与された累積重みを、その個々の仮説生成過程で生成された候補記号列をM段目の仮説生成部の入力記号列としたときのM段目の仮説生成部において可能な仮説生成過程の中で最小又は最大の累積重みを用いて補正する。つまり、この補正はM段目の仮説生成部で生成した仮説に付与されている累積重みの最小又は最大を選択し、その選択した重みを前段の仮説生成部で生成された仮説の累積重みに加算することにより行なわれる。   The hypothesis correction unit calculates the cumulative weights assigned in the individual hypothesis generation processes of the M-1 stage hypothesis generation unit obtained by the procedure of delivering the hypothesis generation process to the M stage hypothesis generation unit. When the candidate symbol string generated in the hypothesis generation process is used as the input symbol string of the M-th hypothesis generation unit, the minimum or maximum cumulative weight is used in the hypothesis generation process possible in the M-th hypothesis generation unit. To correct. In other words, this correction selects the minimum or maximum cumulative weight given to the hypothesis generated by the M-th level hypothesis generation unit, and the selected weight is used as the cumulative weight of the hypothesis generated by the previous hypothesis generation unit. This is done by adding.

M−1段目の仮説生成部で生成した仮説に付与されている重みの補正後の重みの中から最小又は最大となる特異値を選択し、その選択した重みを用いてM−2段目の仮説生成部で生成した各仮説の累積重みを補正する。この補正手順を1段目の仮説生成部が生成した仮説まで繰返す。以上説明した仮説生成部と仮説補正部の動作は1段目の仮説生成部に記号が1個入力される毎に実行される。   A singular value that is minimum or maximum is selected from the weights after correction of the weights assigned to the hypothesis generated by the hypothesis generation unit in the M-1 stage, and the M-2 stage is used by using the selected weight. The accumulated weight of each hypothesis generated by the hypothesis generator is corrected. This correction procedure is repeated until the hypothesis generated by the first-stage hypothesis generation unit. The operations of the hypothesis generation unit and the hypothesis correction unit described above are executed every time one symbol is input to the first-stage hypothesis generation unit.

仮説絞込み部は入力記号列が全て読み込まれた時点で、1段目の仮説生成部で生成した仮説の中で最小又は最大の補正された累積重みを持つ仮説を2段目の仮説生成部の入力記号列として絞り、その仮説を2段目の仮説生成部に入力したときの2段目の仮説生成部で生成する仮説の中の補正された累積重みが最小又は最大の仮説を3段目の仮説生成部の入力記号列として絞り込みを行なう。この絞り込み手順をM段目の仮説生成部まで繰返し、M段目の仮説生成部で生成された仮説の中の累積重みが最小又は最大を呈する仮説を記号列出力部に出力し、この出力記号列をもって記号列変換結果とする。   The hypothesis narrowing-down unit reads the hypothesis having the minimum or maximum corrected cumulative weight among the hypotheses generated by the first-stage hypothesis generation unit at the time when all the input symbol strings are read. When the hypothesis is narrowed down as an input symbol string and the hypothesis is input to the second-stage hypothesis generator, the hypothesis with the smallest or maximum corrected cumulative weight among the hypotheses generated by the second-stage hypothesis generator Are narrowed down as input symbol strings of the hypothesis generation unit. This narrowing-down procedure is repeated up to the M-th level hypothesis generation unit, and a hypothesis having a minimum or maximum cumulative weight among the hypotheses generated by the M-th level hypothesis generation unit is output to the symbol string output unit. Let the sequence be the symbol string conversion result.

以上の動作を要約すると、M個(Mは3以上)の仮説生成部T,T,…,Tがあって、入力記号列Xが与えられたときに、初めにTを用いて記号列Xを仮説となる記号列Oに変換し、その記号列Oを2段目の仮説生成部Tの入力記号列として更に変換して出力記号列Oを得て、更にこれを3段目の仮説生成部Tの入力記号列として変換を行い、これをM番目の仮説生成部まで繰り返し、最終的にTの出力記号列Oを得ることを意味する。最終的な出力記号列Oを求めるには、仮説生成部が二つの場合と同様に、Xを1番目の仮説生成部の入力記号列とするときのM個の仮説生成部によるあらゆる状態遷移過程の組み合わせの中から、すべての仮説生成部における状態遷移過程の累積重みの総和が最小となる変換結果を得ることとなる。つまり、

Figure 2007066237
を計算し、このW(X)を与えるO,O,…,Oの組のうちOを記号列変換結果とする。
本発明では、式(5)を次の式(6)
Figure 2007066237
のように考える。 To summarize the above operation, when there are M hypothesis generation units T 1 , T 2 ,..., T M (M is 3 or more) and an input symbol string X is given, T 1 is used first . the symbol string X into a symbol string O 1 as a hypothesis Te, the symbol string O 1 further converted to generate an output symbol sequence O 2 as an input symbol string of hypothesis generation portion T 2 of the second stage, further this was subject to conversion as 3 stage hypotheses input symbol string generating unit T 3, this is repeated until the M-th hypothesis generator means to obtain an output symbol string O M ultimately T M. To determine the final output symbol string O M, as with the hypothesis generator is two, all the state transitions according to the M hypothesis generation portion when an input symbol string of the first hypothesis generating unit X From the combination of processes, a conversion result that minimizes the sum of the cumulative weights of the state transition processes in all hypothesis generation units is obtained. That means
Figure 2007066237
Was calculated, O 1, O 2 to give the W (X), ..., and symbol string conversion result O M of the set of O M.
In the present invention, the equation (5) is replaced by the following equation (6):
Figure 2007066237
Think like this.

以下図面を用いて本発明の一実施例を説明する。
図11は本発明の一実施例を示す。本発明による記号列変換部102はM段に縦続接続された仮説生成部201−1〜201−Mと、これらM個の各仮説生成部201−2からM段目の仮説生成部201−Mのそれぞれに付随して設けたM個の仮説生成規則格納部101−1〜101−Mと、仮説補正部301−1〜301−Mと、各仮説補正部301−1〜301−Mのそれぞれに付随して設けたM個の仮説絞込み部401−1〜401−Mとによって構成される。各仮説補正部301−1〜301−Mには後段の仮説生成部が生成した仮説の中の累積重みが最大又は最小となる特異値を呈する仮説の値で前段の仮説生成部が生成した仮説の累積重みを補正する重み補正手段301Aと、この補正動作をM−1段目から1段目の仮説補正部まで繰返し実行させる繰返し制御手段301Bとを備える。また仮説絞込み部401−1〜401−Mは記号列が全て読み込まれた時点で、各仮説生成部201−1〜201−Mが生成した各仮説の補正された仮説中から累積重みが例えば最小となる仮説を抽出し、その仮説を次段の仮説生成部に入力する処理を実行する仮説抽出手段401Aと、この仮説抽出手段401Aが抽出した仮説を次段の入力とする入力処理部401Bとを備える。
An embodiment of the present invention will be described below with reference to the drawings.
FIG. 11 shows an embodiment of the present invention. The symbol string conversion unit 102 according to the present invention includes hypothesis generation units 201-1 to 201-M cascaded in M stages, and the M-th hypothesis generation unit 201-M from the M hypothesis generation units 201-2. Each of M hypothesis generation rule storage units 101-1 to 101-M, hypothesis correction units 301-1 to 301-M, and hypothesis correction units 301-1 to 301-M provided to each of the hypothesis generation rule storage units 101-1 to 101-M. Are formed by M hypothesis narrowing-down units 401-1 to 401 -M. Each hypothesis correction unit 301-1 to 301 -M has a hypothesis generated by the previous hypothesis generation unit with a hypothesis value that exhibits a singular value with the maximum or minimum cumulative weight among the hypotheses generated by the subsequent hypothesis generation unit. The weight correction means 301A for correcting the cumulative weight of No. 1 and the repetition control means 301B for repeatedly executing this correction operation from the (M−1) -th stage to the first-stage hypothesis correction unit. The hypothesis narrowing-down units 401-1 to 401-M have, for example, the smallest cumulative weight among the corrected hypotheses generated by the respective hypothesis generation units 201-1 to 201-M at the time when all the symbol strings are read. A hypothesis extraction unit 401A that executes a process of inputting the hypothesis to be input to the hypothesis generation unit of the next stage, and an input processing unit 401B that uses the hypothesis extracted by the hypothesis extraction unit 401A as an input of the next stage; Is provided.

初段の仮説生成部201−1には記号入力部103から記号が1個ずつ入力される。また終段の仮説絞込み部401−Mには補正された累積重みに応じて絞り込まれた仮説が記号列出力部106に出力される。
以下に各部の動作を詳細に説明する。
初期の仮説生成部201−1は常に1個の記号入力に対して自己に与えられた仮説生成規則に基づいて仮説を生成する。これに対して2段目以後の仮説生成部201−2〜201−Mには前段の仮説生成手段が生成した仮説(候補記号列)が入力される。従って、ここでは初段の仮説生成部201−1が出力する仮説と、2段目以後の仮説生成部201−2〜201−Mが出力する仮説とを区別するために、2段目以後の仮説生成部201−2〜201−Mが生成する仮説をm段目補助仮説或は単に補助仮説と称することにする。
One symbol is input from the symbol input unit 103 to the first hypothesis generation unit 201-1. Further, hypotheses narrowed down in accordance with the corrected cumulative weight are output to the symbol string output unit 106 in the final stage hypothesis narrowing-down unit 401 -M.
The operation of each part will be described in detail below.
The initial hypothesis generation unit 201-1 always generates a hypothesis based on a hypothesis generation rule given to itself for one symbol input. On the other hand, the hypotheses (candidate symbol strings) generated by the hypothesis generation means in the previous stage are input to the hypothesis generation units 201-2 to 201-M in the second and subsequent stages. Therefore, here, in order to distinguish the hypotheses output from the first-stage hypothesis generation unit 201-1 from the hypotheses output from the second-stage and later hypothesis generation units 201-2 to 201-M, the second-stage and later hypotheses are distinguished. The hypothesis generated by the generation units 201-2 to 201-M will be referred to as an m-th stage auxiliary hypothesis or simply an auxiliary hypothesis.

各仮説生成部201−1〜201−Mで生成される仮説は背景技術の項で説明したように重み付き有限状態遷移過程を経て生成され、遷移過程の可能性に基づいて複数の仮説が生成される。更に、各仮説には重み付き有限状態遷移過程に付された条件に従って重みが付与される。重みは初段の仮説生成部201−1から終段の仮説生成部201−Mまでの状態遷移に従って累積される。   The hypotheses generated by the respective hypothesis generation units 201-1 to 201-M are generated through the weighted finite state transition process as described in the background section, and a plurality of hypotheses are generated based on the possibility of the transition process. Is done. Furthermore, each hypothesis is given a weight according to the conditions attached to the weighted finite state transition process. The weight is accumulated according to the state transition from the first-stage hypothesis generation unit 201-1 to the final-stage hypothesis generation unit 201-M.

終段の仮説生成部201−Mが生成する仮説に空でない中身が存在する仮説が生成され始まると、仮説補正部301−1〜301−Mが動作を始める。終段の仮説生成部201−Mが生成する仮説に中身が存在する仮説が生成され始まると、仮説補正部301−Mは仮説生成部201−Mが生成した仮説の中から、例えば累積重みが最小値を呈する仮説を抽出し、この仮説の累積重みを用いて前段のM−1段目の仮説生成部201−(M−1)が生成する仮説の累積重みを補正する。この補正は終段で抽出した最小の累積重みを前段の仮説生成部201−(M−1)が生成した仮説の全ての累積重みに加算することで行なわれる。この補正手順を初段の仮説生成部201−1が出力する仮説を補正するまで繰返す。   When a hypothesis in which a non-empty content exists in the hypothesis generated by the final hypothesis generation unit 201-M starts to be generated, the hypothesis correction units 301-1 to 301-M start operating. When a hypothesis whose contents are included in the hypothesis generated by the final hypothesis generation unit 201-M starts to be generated, the hypothesis correction unit 301-M, for example, has a cumulative weight among the hypotheses generated by the hypothesis generation unit 201-M. The hypothesis that exhibits the minimum value is extracted, and the cumulative weight of the hypothesis generated by the hypothesis generation unit 201- (M-1) of the previous M-1 stage is corrected using the cumulative weight of the hypothesis. This correction is performed by adding the minimum cumulative weight extracted in the final stage to all the cumulative weights of the hypotheses generated by the hypothesis generation unit 201- (M-1) in the previous stage. This correction procedure is repeated until the hypothesis output by the first-stage hypothesis generation unit 201-1 is corrected.

全ての記号列が読み込まれた時点で仮説絞込み部401−1〜401−Mは各仮説生成部201−1〜201−Mが生成した全ての仮説の中から尤度の高い(もっともらしい)仮説を選択し、仮説を絞り込む。その絞り込み動作は以下の如くして行なわれる。つまり、初段の仮説絞込み部401−1は初段の仮説生成部201−1が生成した仮説の中から累積重みが例えば最も小さい仮説を抽出し、この仮説を2段目の仮説生成部201−2に入力記号列として与え、2段目の仮説生成部201−2でこの入力記号列で可能な有限状態遷移過程に従って補助仮説を生成する。   At the time when all the symbol strings are read, the hypothesis narrowing-down units 401-1 to 401-M have a high likelihood (likely) hypothesis among all the hypotheses generated by the respective hypothesis generation units 201-1 to 201-M. Select and refine the hypothesis. The narrowing-down operation is performed as follows. That is, the first-stage hypothesis narrowing-down unit 401-1 extracts the hypothesis having the smallest cumulative weight, for example, from the hypotheses generated by the first-stage hypothesis generation unit 201-1, and uses this hypothesis as the second-stage hypothesis generation unit 201-2. As an input symbol string, the second hypothesis generation unit 201-2 generates an auxiliary hypothesis in accordance with a finite state transition process possible with this input symbol string.

2段目仮説補正部301−2は2段目仮説生成部201−2が生成した補助仮説の中から累積重みが例えば最も小さい仮説を抽出し、この補助仮説を3段目の仮説生成部201−3の入力記号列とする手順を終段の仮説生成部201−Mが出力する補助仮説まで繰返す。終段の仮説絞込み部401−Mが終段の仮説生成部201−Mが生成した補助仮説の中から抽出した補助仮説が記号列出力部106に出力され、記号列の変換が終了する。   The second-stage hypothesis correction unit 301-2 extracts a hypothesis having the smallest cumulative weight, for example, from the auxiliary hypotheses generated by the second-stage hypothesis generation unit 201-2, and uses this auxiliary hypothesis as the third-stage hypothesis generation unit 201. -3 is repeated until the auxiliary hypothesis output by the final-stage hypothesis generation unit 201-M. The auxiliary hypotheses extracted from the auxiliary hypotheses generated by the final-stage hypothesis narrowing-down section 401-M from the auxiliary hypothesis generation section 201-M are output to the symbol string output section 106, and the conversion of the symbol strings is completed.

図12及び図13に本発明の一実施の形態における、記号列を変換する具体的な手順を示す。まず、各仮説生成部では一つの仮説に対して必ず一つ以上の2段目補助仮説が存在し、また、m段目補助仮説に対して必ず一つ以上のm+1段目補助仮説が存在するので、本実施の形態では、仮説hに対する2段目補助仮説の集合を2段目補助仮説リストL[h]、m段目補助仮説gに対するm+1段目補助仮説の集合をm段目補助仮説リストL[g]で表す。 12 and 13 show a specific procedure for converting a symbol string according to an embodiment of the present invention. First, in each hypothesis generation unit, one or more second stage auxiliary hypotheses always exist for one hypothesis, and one or more m + 1 stage auxiliary hypotheses always exist for the m stage auxiliary hypothesis. Therefore, in this embodiment, the set of the second stage auxiliary hypothesis for the hypothesis h is the second stage auxiliary hypothesis list L [h], and the set of the m + 1 stage auxiliary hypothesis for the m stage auxiliary hypothesis g m is the mth stage auxiliary. This is represented by a hypothesis list L [g m ].

また、仮説hがあるときs[h]を仮説hの状態遷移過程において最後に到達した状態、m段目補助仮説gがあるときs[g]をm段目補助仮説gの状態遷移過程において最後に到達した状態、W[h]を仮説hの状態遷移過程における(補正された)累積重み、W[g]をm段目補助仮説gの状態遷移過程における(補正された)累積重みとする。また、O[g]をm段目補助仮説gの状態遷移過程において出力される記号列とする。 Further, s m [g m] the m-th stage auxiliary hypothesis g m when s 1 [h] a state that has reached the end in the state transition process of hypothesis h, the m-th auxiliary hypothesis g m is when there is a hypothesis h The state reached last in the state transition process of W, W [h] is the (corrected) cumulative weight in the state transition process of hypothesis h, and W [g m ] is the state transition process of the m-th stage auxiliary hypothesis g m ( Corrected cumulative weight. Further, O [g m ] is a symbol string output in the state transition process of the m-th stage auxiliary hypothesis g m .

以下、図12及び図13の手順を図11の実施の形態と対比して説明する。
基本的な手順は図8及び図9と同様であるが、ステップS203とステップS403、ステップS209とステップS409、ステップS214とステップS414の処理が異なる。ステップS401より開始し、初期設定として、ステップS402で空の仮説リストHとH’を生成する。ステップS403では初期の仮説hを生成し、s[h]=0、W[h]=0、L[h]=φ(空のリスト)とし、仮説リストHに挿入する。また、m=2〜Mに対して初期のm段目補助仮説gを生成し、最後の状態s[g]=0、W[g]=0、O[g]=φ(空の記号列)とし、2段目補助仮説gを2段目補助仮説リストL[h]に挿入し、m=3〜Mに対してgをm−1段目補助仮説リストL[gm−1]に挿入する。
The procedure shown in FIGS. 12 and 13 will be described below in comparison with the embodiment shown in FIG.
The basic procedure is the same as that shown in FIGS. 8 and 9, but the processes in steps S203 and S403, steps S209 and S409, and steps S214 and S414 are different. Starting from step S401, as an initial setting, empty hypothesis lists H and H ′ are generated in step S402. In step S403, an initial hypothesis h is generated, and s 1 [h] = 0, W [h] = 0, and L [h] = φ (empty list) are inserted into the hypothesis list H. In addition, an initial m-th stage auxiliary hypothesis g m is generated for m = 2 to M, and the last state s m [g m ] = 0, W [g m ] = 0, O [g m ] = φ and (empty symbol string), a second stage auxiliary hypothesis g 2 is inserted into the second stage auxiliary hypothesis list L [h], m = m -1 stage and g m against 3~M auxiliary hypothesis list L Insert into [g m-1 ].

ステップS404では、記号列入力部103において記号を一つ読み込み、その記号をxに代入する。
次のステップS405からステップS408は、仮説生成部201において実行される。
ステップS405では、仮説リストHから仮説を一つ取り出しhに代入し、状態s[h]から入力記号xで遷移可能な状態遷移のリストEを生成する。
ステップS406で、リストE=φ(空のリスト)ならばステップS411に進む。そうでなければステップS407に進む。
In step S404, the symbol string input unit 103 reads one symbol and substitutes the symbol for x.
The following steps S405 to S408 are executed in the hypothesis generation unit 201.
In step S405, one hypothesis is extracted from the hypothesis list H and substituted into h, and a state transition list E 1 that can be transitioned with the input symbol x is generated from the state s 1 [h].
In step S406, if the list E 1 = φ (empty list), the process proceeds to step S411. Otherwise, the process proceeds to step S407.

ステップS407では、リストEから状態遷移を一つ取り出して、eに代入し、ステップS408で新たな仮説fを生成し、s[f]=n[e]、W[f]=W[h]+w[e]、L[f]=L[h]とする。
ステップS409は、仮説補正部301−1〜301−Mにおいて、もし出力記号列o[e]≠ε(空でなければ)仮説fを補正する手段(図14、図15のステップS501からステップS512、この手順の説明の後に別途説明する)を実行する。
ステップS410は、仮説絞込み部401−1〜401−Mにおいて、仮説fを仮説リストH’に挿入することにより仮説を絞り込む。
In step S407, fetches one state transition from the list E 1, is substituted into e 1, generates a new hypotheses f 1 in the step S408, s 1 [f 1] = n [e 1], W [f 1 ] = W [h] + w [e 1 ] and L [f 1 ] = L [h].
Step S409 is a means for correcting the output symbol string o [e 1 ] ≠ ε (if not empty) hypothesis f 1 in hypothesis correction units 301-1 to 301-M (from step S501 in FIGS. 14 and 15). Step S512, which will be described separately after the description of this procedure) is executed.
Step S410, in the hypothesis refining unit 401-1 to 401-M, refine the hypothesis by inserting the hypothesis f 1 to the hypothesis list H '.

ステップS411では、H=φ(すべての仮説を展開済み)であればステップS412に進む。そうでなければステップS405に戻り、次の仮説を展開する。
ステップS412では、新たに生成された仮説リストH’の要素を、既に空となった仮説リストHにすべて移し、ステップS413に進む。
ステップS413では、記号列入力部103において次の入力記号が存在するならばステップS404に戻り、そうでなければ、入力記号列がすべて読み込まれたと判断しステップS414に進む。
In step S411, if H = φ (all hypotheses have been expanded), the process proceeds to step S412. Otherwise, the process returns to step S405 to develop the next hypothesis.
In step S412, all the elements of the newly generated hypothesis list H ′ are moved to the already empty hypothesis list H, and the process proceeds to step S413.
In step S413, if there is a next input symbol in the symbol string input unit 103, the process returns to step S404. Otherwise, it is determined that all the input symbol strings have been read, and the process proceeds to step S414.

ステップS414では、仮説リストHの中から終了状態に到達している仮説(s[h]∈F)で、かつ累積重み(W[h])に状態s[h]の終了重みρ(s[h])を加え、更にm=2〜Mについて、s[h]∈Fかつh∈L[hm−1]である場合の

Figure 2007066237
をすべてのhについて求め、s[h]∈FかつW[h]が最小のhを選び、O[h]を変換結果として記号列出力部106において出力する。 In step S414, the hypothesis (s 1 [h 1 ] εF 1 ) that has reached the end state from the hypothesis list H and the cumulative weight (W [h 1 ]) of the state s 1 [h 1 ] Add end weight ρ (s 1 [h 1 ]), and for m = 2 to M, when s m [h m ] ∈F m and h m ∈L [h m−1 ]
Figure 2007066237
Asking for all h m, select s M [h M] ∈F M and W [h M] is smallest h M, and outputs the symbol sequence output unit 106 O [h M] as a conversion result.

ステップS415にて本発明の一実施の形態における記号列変換手順を終了する。
仮に仮説補正部301−1〜301−Mにおける仮説補正手順について説明する。
本発明における仮説の補正は、m段目の仮説生成部における仮説の状態遷移過程に対する累積重みを、その仮説の状態遷移過程における仮説をm+1段目の仮説生成部の入力記号列としたときのm+1段目の仮説生成部において可能な状態遷移過程の中で累積重みが最小となる状態遷移過程を求め、その累積重みを仮説の累積重みに加算することを意味する。
In step S415, the symbol string conversion procedure in one embodiment of the present invention is terminated.
A hypothesis correction procedure in the hypothesis correction units 301-1 to 301 -M will be described.
In the present invention, the hypothesis correction is performed when the cumulative weight for the state transition process of the hypothesis in the m-th stage hypothesis generation unit is set as the input symbol string of the m + 1-stage hypothesis generation unit as the hypothesis in the state transition process of the hypothesis. This means that a state transition process having a minimum cumulative weight among the possible state transition processes in the m + 1 stage hypothesis generation unit is obtained and the cumulative weight is added to the hypothetical cumulative weight.

例えばM=3の場合、入力記号列Xが読み込まれた時点でその記号列Xを受理して記号列Yを出力する仮説の補正された累積重みは、

Figure 2007066237
となり、その補正累積重みが最小である仮説の補正累積重みは
Figure 2007066237
となり、先に述べた式(4)でM=3の場合における仮説生成部の累積重みの和の最小値と一致する。従って、補正された累積重みを用いて、1段目の仮説生成部の出力記号列Yを求めて、そのYを2段目の仮説生成部の入力記号列としたときの可能な状態遷移過程の中で累積重みが最小となる出力記号列Zを求めて、そのZを3段目の仮説生成部の入力記号列としたときの可能な状態遷移過程の中で累積重みが最小となる状態遷移過程に対応する出力記号列が記号列変換結果となる。 For example, when M = 3, the corrected cumulative weight of the hypothesis that accepts the symbol string X and outputs the symbol string Y when the input symbol string X is read is:
Figure 2007066237
The corrected cumulative weight of the hypothesis with the minimum corrected cumulative weight is
Figure 2007066237
Thus, the value coincides with the minimum value of the sum of the cumulative weights of the hypothesis generation unit in the case of M = 3 in Equation (4) described above. Accordingly, a possible state transition process when the output symbol string Y of the first-stage hypothesis generation unit is obtained using the corrected cumulative weight and the Y is used as the input symbol string of the second-stage hypothesis generation unit. The output symbol string Z having the smallest cumulative weight is obtained, and the state in which the cumulative weight is the smallest in the possible state transition process when Z is used as the input symbol string of the third-stage hypothesis generator The output symbol string corresponding to the transition process becomes the symbol string conversion result.

本発明では、各仮説に対応付けられたm段目補助仮説リストを利用して仮説の補正を効率的に行う。補正される仮説をfm−1(m−1段目補助仮説)とし、fm−1の入力記号列から派生するm段目補助仮説を含むm−1段目補助仮説リストをL[fm−1]とする。
m段目の仮説生成部の状態s[g](gはL[fm−1]に含まれる一つのm段目補助仮説を表す)から、入力記号o[em−1]による状態遷移eを経て次状態n[e]に至るm段目補助仮説fを生成し、その到達状態をs[f]=n[e]とする。また、m−1段目補助仮説fm−1の状態遷移過程において、fm−1の最後の状態遷移(em−1)よりも前にあって出力記号がεではない最も新しい状態遷移をtm−1とする。このとき、m段目補助仮説fの累積重みW[f]は、次の3つの要素を加算することにより計算できる。
In the present invention, correction of hypotheses is efficiently performed using an m-th stage auxiliary hypothesis list associated with each hypothesis. The hypothesis to be corrected is f m−1 (m−1 stage auxiliary hypothesis), and the m−1 stage auxiliary hypothesis list including the m stage auxiliary hypothesis derived from the input symbol string of f m−1 is L [f. m−1 ].
From the state s m [g m ] of the m-th hypothesis generation unit (g m represents one m-th auxiliary hypothesis included in L [f m-1 ]), the input symbol o [e m-1 ]. via the state transition e m by generating a m-th stage auxiliary hypothesis f m to reach the next state n [e m], and its arrival state s m [f m] = n [e m]. Also, in the state transition process of the m−1 stage auxiliary hypothesis f m−1 , the latest state transition before the last state transition (e m−1 ) of f m−1 and whose output symbol is not ε. Is t m−1 . In this case, the cumulative weight W for m-th auxiliary hypothesis f m [f m] can be calculated by adding the following three elements.

(A1)m−1段目補助仮説fm−1の状態遷移過程における状態n[tm−1]において生成されたm段目補助仮説fの累積重み:
この値はW[f]に等しい。つまり、出力記号がεであった状態遷移過程では、補助仮説リストはそのまま後に続く状態遷移過程の仮説に引き継がれるので、状態n[tm−1]において生成されたm−1段目補助仮説リストは現在のL[fm−1]にそのものであり、m−1段目補助仮説リストL[fm−1]の個々のm段目補助仮説の累積重みW[f]に等しい。
(A1) Cumulative weight of the m-th stage auxiliary hypothesis f m generated in the state n [t m-1 ] in the state transition process of the m-1 stage auxiliary hypothesis f m-1 :
This value is equal to W [f m]. That is, in the state transition process in which the output symbol is ε, the auxiliary hypothesis list is directly inherited by the hypothesis of the subsequent state transition process, and therefore the m−1 stage auxiliary hypothesis generated in the state n [t m−1 ]. The list itself is in the current L [f m-1 ] and is equal to the cumulative weight W [f m ] of each m-th stage auxiliary hypothesis in the m-1 stage auxiliary hypothesis list L [f m-1 ].

(A2)状態n[tm−1]から状態sm−1[fm−1]までの間に累積された重み:
但し、出力記号がεであった状態遷移過程では、m段目補助仮説リストはそのまま新たに生成された仮説に引き継がれるので、状態n[tm−1]に至った仮説の補正された累積重みは、現在のm−1段目補助仮説リストL[fm−1]の中で最小の累積重み

Figure 2007066237
に等しく、これを現在のm−1段目補助仮説fm−1の累積重みW[fm−1]から差し引くことにより、状態n[tm−1]から状態sm−1[fm−1]までの間の累積重みが求まる。すなわち、
Figure 2007066237
である。 (A2) Weights accumulated from state n [t m-1 ] to state s m-1 [f m-1 ]:
However, in the state transition process in which the output symbol is ε, the m-th stage auxiliary hypothesis list is directly inherited by the newly generated hypothesis, so that the corrected accumulation of the hypothesis that has reached the state n [t m−1 ] is performed. The weight is the smallest cumulative weight in the current m-1 stage auxiliary hypothesis list L [f m-1 ].
Figure 2007066237
Equally, by subtracting this from the current m-1 stage auxiliary hypothesis f m-1 of the cumulative weight W [f m-1], from one state n [t m-1] s m-1 [f m -1 ] until the cumulative weight is obtained. That is,
Figure 2007066237
It is.

(A3)m段目の仮説生成部の状態s[g]からs[f]への状態遷移eにおける重み:w[e]
従って、m段目補助仮説fの累積重みはW[f]=W[g]+AW[fm−1]+w[e]のように計算する。但し、m<Mの場合は、W[f]は更にm+1段目の仮説生成部を用いて補正されるものとする。その後、m−1段目補助仮説リストL[fm−1]に挿入される。
そして、m−1段目補助仮説fm−1の補正は、W[fm−1]を新たに生成されたm段目補助仮説g(但し、g∈L[fm−1])の累積重みW[g]の中での最小値

Figure 2007066237
を代入することにより行われる。 (A3) the weight in the state transition e m of m from a state s m th stage of hypothesis generation unit [g m] to s m [f m]: w [e m]
Therefore, the cumulative weight of the m-th stage auxiliary hypothesis f m is calculated as W [f m] = W [ g m] + AW [f m-1] + w [e m]. However, when m <M, W [f m ] is further corrected using the hypothesis generation unit in the (m + 1) th stage. After that, it is inserted into the m−1 stage auxiliary hypothesis list L [f m−1 ].
Then, the m-1 stage auxiliary hypothesis f m-1 correction, W of [f m-1] is the newly generated the m-th auxiliary hypothesis g (however, g∈L [f m-1] ) Minimum value in cumulative weight W [g]
Figure 2007066237
This is done by substituting

以下、仮説の補正手順を図14、図15を用いて説明する。この仮説補正手順は、図12及び図13に示したステップS409において実行される。この手順において補正される仮説または補助仮説をfm−1、m−1段目の仮説生成部からの出力記号をo[em−1]とする。
ステップS501では、仮説または補助仮説fm−1を補正する手順を開始する。
ステップS502では、空の補助仮説リストLを生成する。
ステップS503では、重みの補正項AW[fm−1]をAW[fm−1]=W[fm−1]−W[g’]として求める。但し、g’は、fm−1の補助仮説リストL[fm−1]の中で累積重みが最小の補助仮説を指す。
The hypothesis correction procedure will be described below with reference to FIGS. This hypothesis correction procedure is executed in step S409 shown in FIGS. Assume that the hypothesis or auxiliary hypothesis corrected in this procedure is f m−1 , and the output symbol from the m−1 stage hypothesis generation unit is o [e m−1 ].
In step S501, a procedure for correcting the hypothesis or auxiliary hypothesis f m−1 is started.
In step S502, an empty auxiliary hypothesis list Lm is generated.
In step S503, the weight correction term AW [fm -1 ] is obtained as AW [fm -1 ] = W [fm -1 ] -W [g ']. However, g 'is the cumulative weight in f m-1 of the auxiliary hypothesis list L [f m-1] refers to the minimum of the auxiliary hypothesis.

ステップS504では、L[fm−1]から補助仮説を一つ取り出し、gに代入する。状態s[g]から入力記号o[em−1]で遷移可能な状態遷移のリストEを生成し、ステップS405に進む。
ステップS505では、Eが空(s[g]からのすべての状態遷移に対して補助仮説を展開済み)であればステップS510に進む。そうでなければステップS506に進む。
ステップS506では、リストEから状態遷移を一つ取り出し、eに代入する。
ステップS507では、補助仮説fを生成し、s[f]=n[e]、W[f]=W[g]+AW[fm−1]+w[e]、O[f]=O[g]・o[e]とする。
In step S504, one auxiliary hypothesis is extracted from L [f m−1 ] and substituted into g m . A list E m of state transitions that can be transitioned from the state s m [g m ] with the input symbol o [e m−1 ] is generated, and the process proceeds to step S405.
In step S505, if E m is empty (auxiliary hypotheses have been expanded for all state transitions from s m [g m ]), the process proceeds to step S510. Otherwise, the process proceeds to step S506.
In step S506, extract a single state transition from the list E m, it is substituted into e m.
At step S507, the generated auxiliary hypothesis f m, s m [f m ] = n [e m], W [f m] = W [g m] + AW [f m-1] + w [e m], O [f m] = and O [g m] · o [ e m].

ステップS508では、o[e]がεではなく、かつm<Mならば、fを補正する。ここでは、mを一増やして、同じ手順、ステップS501からステップS513を実行することにより行われ、補正後mを一減らして次のステップS509に進む。
ステップS509では、補助仮説fを補助仮説リストLに挿入し、ステップS505に進む。
ステップS510では、L[fm−1]がφ(すべての補助仮説を展開済み)であればステップS511に進む。そうでなければステップS504に戻り、次の補助仮説を展開する。
ステップS511では、新たに生成された補助仮説のリストLの要素を、すでに空となった補助仮説リストL[fm−1]にすべて移し、ステップS512に進む。
In step S508, o [e m] is not the epsilon, and if m <M, to correct the f m. Here, m is incremented by one, and the same procedure is performed by executing steps S501 to S513. After the correction, m is decremented by one and the process proceeds to the next step S509.
In step S509, the auxiliary hypothesis f m is inserted into the auxiliary hypothesis list L m , and the process proceeds to step S505.
In step S510, if L [f m-1 ] is φ (all auxiliary hypotheses have been expanded), the process proceeds to step S511. Otherwise, the process returns to step S504 to develop the next auxiliary hypothesis.
In step S511, new elements of the list L m of generated auxiliary hypothesis, already transferred all vacant and became auxiliary hypothesis list L [f m-1], the process proceeds to step S512.

ステップS512では、補助仮説リストL[fm−1]の中で累積重み最小の補助仮説g’’に対してW[fm−1]=W[g’’]とする。
ステップS513にて本発明の一実施の形態における仮説補正手順を終了する。
本発明による記号列変換手順(図12及び図13)は、仮説補正ステップS409を除けば一段目の仮説生成部だけを用いて探索する手順(図4)とほぼ同じ計算手順となる。また、仮説補正手順(図14及び図15)においても、ステップS508を除けば、従来の仮説補正手順(図10)とほぼ同じ手順となり、計算量を少なく抑えることができる。仮説生成部の状態遷移において出力記号がεでない場合においてのみ仮説補正手順が実行されるので、仮説生成部の出力記号がεである割合が多いほど、処理量削減の効果は大きくなる。
In step S512, W [f m−1 ] = W [g ″] is set for the auxiliary hypothesis g ″ having the smallest cumulative weight in the auxiliary hypothesis list L [f m−1 ].
In step S513, the hypothesis correction procedure in the embodiment of the present invention is terminated.
The symbol string conversion procedure (FIGS. 12 and 13) according to the present invention is almost the same calculation procedure as the procedure (FIG. 4) for searching using only the first-stage hypothesis generator except for the hypothesis correction step S409. Also in the hypothesis correction procedure (FIGS. 14 and 15), except for step S508, the procedure is almost the same as the conventional hypothesis correction procedure (FIG. 10), and the amount of calculation can be reduced. Since the hypothesis correction procedure is executed only when the output symbol is not ε in the state transition of the hypothesis generation unit, the larger the ratio that the output symbol of the hypothesis generation unit is ε, the greater the effect of reducing the processing amount.

例として、図16と、図5及び図6に示す三つの仮説生成規則による変換(M=3の場合)を考える。
図16は、ローマ字の記号列から仮名に変換する仮説生成規則を表している。これら3つの仮説生成規則によって、ローマ字入力された記号列を、対応する漢字の記号列に変換する場合を考える。
As an example, consider the conversion (in the case of M = 3) based on the three hypothesis generation rules shown in FIG. 16 and FIGS.
FIG. 16 shows a hypothesis generation rule for converting a Roman character string into a kana. Consider a case where a symbol string input in Roman characters is converted into a corresponding Kanji character string by these three hypothesis generation rules.

次に、本発明の記号列変換手順に従って、図16を仮説生成規則T、図5を仮説生成規則T、図6を仮説生成規則Tとして、入力記号列“a,m,e,d,a,m,a”が与えられた場合の出力記号列を求める過程を順を追って説明する。但し、仮説(仮説生成規則Tの現状態番号s、出力記号列O、累積重みW、補助仮説リストL)は(s,O,W,L)のように表し、m段目補助仮説(仮説生成規則Tの現状態番号s、出力記号列O、累積重みW、m段目補助仮説リストL)は(s,O,W,L)のように表す。また、m段目補助仮説リストは{(s,O,W,L),(s’,O’,W’,L’),…}のように表す。 Next, according to the symbol string conversion procedure of the present invention, the input symbol string “a, m, e, FIG. 16 is assumed as the hypothesis generation rule T 1 , FIG. 5 as the hypothesis generation rule T 2 , and FIG. 6 as the hypothesis generation rule T 3 . A process for obtaining an output symbol string when d, a, m, a ″ is given will be described step by step. However, the hypothesis (hypothesis generation rule current state number s 1 of T 1, the output symbol sequence O, cumulative weight W, auxiliary hypothesis list L) is expressed as (s 1, O, W, L), m-th auxiliary hypothesis (current state number s m of hypothesis generation rule T m, the output symbol string O, cumulative weight W, m-th auxiliary hypothesis list L m) is expressed as (s m, O, W, L m). The m-th stage auxiliary hypothesis list is represented as {(s m , O, W, L m ), (s m ′, O ′, W ′, L m ′),.

〔本発明による記号列変換手順を開始〕
ステップS401から開始し、ステップS402で空の仮説リストHとH’を作る。
ステップS403により仮説リストHの中に仮説h=(0,φ,0,{(0,φ,0,{(0,φ,0,φ)})})を挿入する。
[Start the symbol string conversion procedure according to the present invention]
Starting from step S401, empty hypothesis lists H and H ′ are created in step S402.
In step S403, a hypothesis h = (0, φ, 0, {(0, φ, 0, {(0, φ, 0, φ)})}) is inserted into the hypothesis list H.

〔入力記号“a”の処理〕
ステップS404で記号“a”を読み込み、ステップS405において仮説リストHから仮説(0,φ,0,{(0,φ,0,{(0,φ,0,φ)})})を取り出す。この仮説の仮説生成規則Tの現状態0から入力記号が“a”の状態遷移
<0→0,a:あ/0>
を含むリストEを作る。
ステップS406でリストE=φではないのでステップS407に進み、リストEから状態遷移<0→0,a:あ/0>を取り出しリストeとし、ステップS408で新たな仮説f=(0,あ,0,{(0,φ,0,{(0,φ,0,φ)})})を生成する。ステップS409でo[e]はεではないので、仮説f=(0,あ,0,{(0,φ,0,{(0,φ,0,φ)})})を補正するステップS501に進む。このときm=2に設定する。
[Processing of input symbol “a”]
In step S404, the symbol “a” is read, and in step S405, a hypothesis (0, φ, 0, {(0, φ, 0, {(0, φ, 0, φ)})}) is extracted from the hypothesis list H. State transition of input symbol “a” from current state 0 of hypothesis generation rule T 1 of this hypothesis <0 → 0, a: a / 0>
Make a list E 1, including.
Because it is not in the list E 1 = φ in step S406 proceeds to the step S407, the state transition from the list E 1 <0 → 0, a : Oh / 0> and list e 1 taken out, a new hypothesis in step S408 f 1 = ( 0, a, 0, {(0, φ, 0, {(0, φ, 0, φ)})}). In step S409, since o [e 1 ] is not ε, the hypothesis f 1 = (0, a, 0, {(0, φ, 0, {(0, φ, 0, φ)})}) is corrected. The process proceeds to step S501. At this time, m = 2 is set.

ステップS502で空の補助仮説リストLを生成する。
ステップ503でAW[f]=0となる。
ステップS504で補助仮説リストL[f]={(0,φ,0,{(0,φ,0,φ)})}から補助仮説g=(0,φ,0,{(0,φ,0,φ)})を取り出し、仮説生成規則Tの状態0から入力記号“あ”で遷移可能な状態遷移
<0→1,あ:雨/0>,
<0→2,あ:飴/0>
を含むリストEを作る。
ステップS505でE=φではないのでステップS506に進む。リストEから状態遷移<0→1,あ:雨/0>を取り出しリストeとし、ステップS507で補助仮説f=(1,雨,0,{(0,φ,0,φ)})を生成する。
To generate an empty auxiliary hypothesis list L 2 in step S502.
In step 503, AW [f 1 ] = 0.
In step S504, from the auxiliary hypothesis list L [f 1 ] = {(0, φ, 0, {(0, φ, 0, φ)})}, the auxiliary hypothesis g 2 = (0, φ, 0, {(0, φ, 0, φ)}), and the state transition <0 → 1, a: rain / 0>, which can be transitioned from the state 0 of the hypothesis generation rule T 2 with the input symbol “a”
<0 → 2, A: 飴 / 0>
Make a list E 2, including.
Since E 2 = φ is not satisfied in step S505, the process proceeds to step S506. State transition from the list E 2 <0 → 1, Ah: Rain / 0> and List e 2 removed, auxiliary hypothesis f 2 = (1 in step S507, the rain, 0, {(0, φ , 0, φ)} ) Is generated.

ステップS508でo[e]はεではなく、かつ、m=2でM=3なのでm<Mであることから、補助仮説fを補正するステップS501に進む。このときmを1増やして、m=3に設定する。
ステップS502で空の補助仮説リストLを生成する。
ステップS503でAW[f]=0となる。
ステップS504で補助仮説リストL[f]={(0,φ,0,φ)}から補助仮説g=(0,φ,0,φ)を取り出し、仮説生成規則Tの状態0から入力記号“雨”で遷移可能な状態遷移
<0→1,雨:雨/0>,
<0→3,雨:雨/0>
を含むリストEを作る。
In o [e 2] rather than ε step S508, the and, since at m = 2 is M = 3 Since m <M, the process proceeds to step S501 to correct the auxiliary hypothesis f 2. At this time, m is increased by 1, and m = 3 is set.
To generate an empty auxiliary hypothesis list L 3 in step S502.
In step S503, AW [f 2 ] = 0.
In step S504, the auxiliary hypothesis g 3 = (0, φ, 0, φ) is extracted from the auxiliary hypothesis list L [f 2 ] = {(0, φ, 0, φ)}, and from the state 0 of the hypothesis generation rule T 3. State transitions that can be transitioned with the input symbol “rain” <0 → 1, rain: rain / 0>,
<0 → 3, rain: rain / 0>
Make a list E 3, including.

ステップS505でE=φではないのでステップS506に進む。Eから状態遷移<0→1,雨:雨/0>を取り出しeとし、ステップS507で補助仮説f=(1,雨,0,φ)を生成する。
ステップS508でm=3かつM=3なのでm<Mではないから、ステップS509に進み、補助仮説fをリストLに挿入する。
ステップS505に戻り、E=φではないのでステップS506に進む。Eから状態遷移<0→3,雨:雨/0>を取り出しeとし、ステップS507で補助仮説f=(3,雨,0,φ)を生成する。
ステップS508でm=3かつM=3なのでm<Mではないから、ステップS509に進み、仮説fをリストLに挿入する。
ステップS505に戻り、リストE=φなので、ステップS510に進む。
Since E 3 = φ is not satisfied in step S505, the process proceeds to step S506. State transition from E 3 <0 → 1, rain: Rain / 0> and e 3 removed, auxiliary hypothesis f 3 = in Step S507 (1, rain, 0, phi) to produce a.
Not a m = 3 and M = 3 Since m <M at step S508, the process proceeds to step S509, the inserting auxiliary hypothesis f 3 Listing L 3.
Returning to step S505, since E 3 = φ is not satisfied, the process proceeds to step S506. State transition from E 3 <0 → 3, rain: Rain / 0> and e 3 removed, auxiliary in step S507 hypothesis f 3 = (3, rain, 0, phi) to produce a.
Not a m = 3 and M = 3 Since m <M at step S508, the process proceeds to step S509, the inserting the hypothesis f 3 Listing L 3.
Returning to step S505, since the list E 3 = φ, the process proceeds to step S510.

ステップS510で、補助仮説リストL[f]=φなので、ステップS511に進む。
ステップS511で、補助仮説リストLの要素{(1,雨,0,φ),(3,雨,0,φ)}をすべて補助仮説リストL[f]に移す。
ステップS512で、L[f]の補助仮説の累積重みはどちらも0なのでW[f]=0とする。
ステップS513で補助仮説fの補正を終了し、mを1減らしてm=2とし、ステップS508に戻る。
ステップS508における補助仮説fの補正手順の後、ステップS509に進む。
ステップS509では、補助仮説fを補助仮説リストLに挿入し、ステップS505に戻る。
In step S510, since auxiliary hypothesis list L [f 2 ] = φ, the process proceeds to step S511.
In step S511, the elements of the auxiliary hypothesis list L 3 {(1, rain, 0, φ), (3 , rain, 0, φ)} transferred to all the auxiliary hypothesis list L [f 2].
In step S512, since the cumulative weights of the auxiliary hypotheses of L [f 2 ] are both 0, W [f 2 ] = 0 is set.
Step S513 In Exit correction auxiliary hypothesis f 2, and m = 2 in the m reduced by one, the flow returns to step S508.
After the correction procedure auxiliary hypothesis f 2 at step S508, the process proceeds to step S509.
At step S509, the inserted auxiliary hypothesis f 2 to the auxiliary hypothesis list L 2, the flow returns to step S505.

ステップS505でリストE=φではないのでステップS506に進む。リストEから状態遷移<0→2,あ:飴/0>を取り出しeとし、ステップS507で補助仮説f=(2,飴,0,{(0,φ,0,φ)})を生成する。
ステップS508でo[e]はεではなく、かつ、m=2でM=3なのでm<Mであることから、補助仮説fを補正するステップS501に進む。このときmを1増やして、m=3に設定する。
ステップS502で空の補助仮説リストLを生成する。
ステップS503でAW[f]=0となる。
Since the list E 2 = φ is not satisfied in step S505, the process proceeds to step S506. State transition <0 → 2, a: 飴 / 0> is extracted from list E 2 and set as e 2, and auxiliary hypothesis f 2 = (2, 飴, 0, {(0, φ, 0, φ)}) in step S507. Is generated.
In o [e 2] rather than ε step S508, the and, since at m = 2 is M = 3 Since m <M, the process proceeds to step S501 to correct the auxiliary hypothesis f 2. At this time, m is increased by 1, and m = 3 is set.
To generate an empty auxiliary hypothesis list L 3 in step S502.
In step S503, AW [f 2 ] = 0.

ステップS504で補助仮説リストL[f]={(0,φ,0,φ)}から補助仮説g=(0,φ,0,φ)を取り出し、仮説生成規則Tの状態0から入力記号“飴”で遷移可能な状態遷移
<0→2,飴:飴/0>,
<0→4,飴:飴/0>
を含むリストEを作る。
ステップS505でリストE=φではないのでステップS506に進む。リストEから状態遷移<0→2,飴:飴/0>を取り出しリストeとし、ステップS507で補助仮説f=(2,飴,0,φ)を生成する。
In step S504, an auxiliary hypothesis g 3 = (0, φ, 0, φ) is extracted from the auxiliary hypothesis list L [f 2 ] = {(0, φ, 0, φ)}, and from the state 0 of the hypothesis generation rule T 3. Possible state transitions with input symbol “飴” <0 → 2, <: 飴 / 0>,
<0 → 4, 飴: 飴 / 0>
Make a list E 3, including.
Since list E 3 = φ is not satisfied in step S505, the process proceeds to step S506. State transition from the list E 3 <0 → 2, candy: candy / 0> and List e 3 removed, auxiliary hypothesis f 3 = in Step S507 (2, candy, 0, phi) to produce a.

ステップS508でm=3かつM=3なのでm<Mではないから、ステップS509に進み、補助仮説fを補助仮説リストLに挿入する。
ステップS505に戻り、E=φではないのでステップS506に進む。Eから状態遷移<0→4,飴:飴/0>を取り出しeとし、ステップS507で補助仮説f=(4,飴,0,φ)を生成する。
ステップS508でm=3かつM=3なのでm<Mではないから、ステップS509に進み、補助仮説fを補助仮説リストLに挿入する。
ステップS505に戻り、E=φなので、ステップS510に進む。
ステップS510で、補助仮説リストL[f]=φなので、ステップS511に進む。
Not a m = 3 and M = 3 Since m <M at step S508, the process proceeds to step S509, the inserting auxiliary hypothesis f 3 to the auxiliary hypothesis list L 3.
Returning to step S505, since E 3 = φ is not satisfied, the process proceeds to step S506. State transition from E 3 <0 → 4, candy: candy / 0> and e 3 removed, auxiliary in step S507 hypothesis f 3 = (4, candy, 0, phi) to produce a.
Not a m = 3 and M = 3 Since m <M at step S508, the process proceeds to step S509, the inserting auxiliary hypothesis f 3 to the auxiliary hypothesis list L 3.
Returning to step S505, since E 3 = φ, the process proceeds to step S510.
In step S510, since auxiliary hypothesis list L [f 2 ] = φ, the process proceeds to step S511.

ステップS511で、リストLの要素{(2,飴,0,φ),(4,飴,0,φ)}をすべて補助仮説リストL[f]に移す。
ステップS512で、L[f]の補助仮説の累積重みはどちらも0なのでW[f]=0とする。
ステップS513で補助仮説fの補正を終了し、mを1減らしてm=2とし、ステップS508に戻る。
ステップS508におけるfの補正手順の後、ステップS509に進む。
ステップS509では、fをLに挿入し、ステップS505に戻る。
ステップS505でE=φであるため、ステップS510に進む。
In step S511, elements of the list L 3 {(2, candy, 0, φ), (4 , candy, 0, φ)} transferred to all the auxiliary hypothesis list L [f 2].
In step S512, since the cumulative weights of the auxiliary hypotheses of L [f 2 ] are both 0, W [f 2 ] = 0 is set.
Step S513 In Exit correction auxiliary hypothesis f 2, and m = 2 in the m reduced by one, the flow returns to step S508.
After the correction procedure f 2 at step S508, the process proceeds to step S509.
At step S509, the inserting the f 2 to L 2, the flow returns to step S505.
Since E 2 = φ in step S505, the process proceeds to step S510.

ステップS510で、L[f]=φなので、ステップS511に進む。
ステップS511で、Lの要素をすべてL[f]に移す。
ステップS512で、L[f]={(1,雨,0,{(1,雨,0,φ),(3,雨,0,φ)}),(2,飴,0,{(2,飴,0,φ),(4,飴,0,φ)})}の補助仮説の累積重みはどちらも0なのでW[f]=0とする。
ステップS513で補助仮説fの補正を終了し、ステップS409に戻る。
ステップS409における仮説fの補正手順の後、ステップS410に進む。
In step S510, since L [f 1 ] = φ, the process proceeds to step S511.
In step S511, transferred all the elements of the L 2 to L [f 1].
In step S512, L [f 1 ] = {(1, rain, 0, {(1, rain, 0, φ), (3, rain, 0, φ)}), (2, 飴, 0, {( 2, 重 み, 0, φ), (4, 飴, 0, φ)})} are both 0, so W [f 1 ] = 0.
Exit correction auxiliary hypothesis f 1 at step S513, the flow returns to step S409.
After correction procedure hypothesis f 1 at step S409, the process proceeds to step S410.

ステップS410では、仮説fを仮説リストH’に挿入し、ステップS406に戻る。
ステップS406で状態遷移リストE=φなので、ステップS411に進む。
ステップS411で仮説リストH=φなので、ステップS412に進み、H’の要素
{(0,あ,0,{(1,雨,0,{(1,雨,0,φ),(3,雨,0,φ)}),(2,飴,0,{(2,飴,0,φ),(4,飴,0,φ)})})}
を仮説リストHに移す。
ステップS413に進み、次の入力記号が存在するので、ステップS404に戻る。
In step S410, insert the hypothesis f 1 to the hypothesis list H ', the flow returns to step S406.
Since the state transition list E 1 = φ in step S406, the process proceeds to step S411.
Since the hypothesis list H = φ in step S411, the process proceeds to step S412 and the element of H ′ {(0, ah, 0, {(1, rain, 0, {(1, rain, 0, φ), (3, rain) , 0, φ)}), (2, 飴, 0, {(2, 飴, 0, φ), (4, 飴, 0, φ)})})}
Is moved to the hypothesis list H.
Proceeding to step S413, since the next input symbol exists, the process returns to step S404.

〔入力記号“m”の処理〕
ステップS404で記号“m”を読み込み、ステップS405において仮説リストHから仮説
h={(0,あ,0,{(1,雨,0,{(1,雨,0,φ),(3,雨,0,φ)}),(2,飴,0,{(2,飴,0,φ),(4,飴,0,φ)})})}
を取り出す。この仮説の仮説生成規則Tの現状態0から入力記号が“m”の状態遷移
<0→1,m:ε/0>
を含むリストEを作る。
[Processing of input symbol “m”]
In step S404, the symbol “m” is read, and in step S405, the hypothesis h = {(0, ah, 0, {(1, rain, 0, {(1, rain, 0, φ), (3, Rain, 0, φ)}), (2, 飴, 0, {(2, 飴, 0, φ), (4, 飴, 0, φ)})})}
Take out. State transition of input symbol “m” from current state 0 of hypothesis generation rule T 1 of this hypothesis <0 → 1, m: ε / 0>
Make a list E 1, including.

ステップS406でE=φではないのでステップS407に進み、状態遷移リストEから状態遷移<0→0,m:ε/0>を取り出しeとし、ステップS408で新たな仮説
=(1,あ,0,{(1,雨,0,{(1,雨,0,φ),(3,雨,0,φ)}),(2,飴,0,{(2,飴,0,φ),(4,飴,0,φ)})})
を生成する。ステップS409でo[e]=εなので、ステップS410に進む。
ステップS410では仮説fを仮説リストH’に挿入し、ステップS406に進む。
Since E 1 = not at φ at step S406 proceeds to step S407, the state transition list state transition from E 1 <0 → 0, m : ε / 0> and e 1 removed, new hypotheses in step S408 f 1 = ( 1, a, 0, {(1, rain, 0, {(1, rain, 0, φ), (3, rain, 0, φ)}), (2, 飴, 0, {(2, 飴, 0, φ), (4, 飴, 0, φ)})})
Is generated. Since o [e 1 ] = ε in step S409, the process proceeds to step S410.
In step S410 inserts the hypothesis f 1 to the hypothesis list H ', processing proceeds to step S406.

ステップS406では状態遷移リストE=φなのでステップS411に進み、仮説リストH=φなのでステップS412に進む。
ステップS412では仮説リストH’の要素
{(1,あ,0,{(1,雨,0,{(1,雨,0,φ),(3,雨,0,φ)}),(2,飴,0,{(2,飴,0,φ),(4,飴,0,φ)})})}
をすべて仮説リストHに移す。
ステップS413に進み、次の入力記号が存在するので、ステップS404に戻る。
In step S406, since the state transition list E 1 = φ, the process proceeds to step S411, and since the hypothesis list H = φ, the process proceeds to step S412.
In step S412, the elements of the hypothesis list H ′ {(1, A, 0, {(1, Rain, 0, {(1, Rain, 0, φ), (3, Rain, 0, φ)}), (2 , 飴, 0, {(2, 飴, 0, φ), (4, 飴, 0, φ)})})}
Are all moved to the hypothesis list H.
Proceeding to step S413, since the next input symbol exists, the process returns to step S404.

〔入力記号“e”の処理〕
ステップS404で記号“e”に読み込み、ステップS405において仮説リストHから仮説
h=(1,あ,0,{(1,雨,0,{(1,雨,0,φ),(3,雨,0,φ)}),(2,飴,0,{(2,飴,0,φ),(4,飴,0,φ)})})
を取り出す。この仮説の仮説生成規則Tの現状態0から入力記号が“e”の状態遷移
<1→0,e:め/0>
を含む状態遷移リストEを作る。
[Processing of input symbol “e”]
In step S404, the symbol “e” is read, and in step S405, a hypothesis h = (1, ah, 0, {(1, rain, 0, {(1, rain, 0, φ), (3, rain) , 0, φ)}), (2, 飴, 0, {(2, 飴, 0, φ), (4, 飴, 0, φ)})})
Take out. State transition of input symbol “e” from current state 0 of hypothesis generation rule T 1 of this hypothesis <1 → 0, e: me / 0>
Make a state transition list E 1, including.

ステップS406でE=φではないのでステップS407に進み、Eから状態遷移<1→0,e:め/0>を取り出しeとし、ステップS408で新たな仮説
=(0,あめ,0,{(1,雨,0,{(1,雨,0,φ),(3,雨,0,φ)}),(2,飴,0,{(2,飴,0,φ),(4,飴,0,φ)})})
を生成する。ステップS409でo[e]はεではないので、仮説fを補正するステップS501に進む。このときm=2に設定する。
ステップS502で空の補助仮説リストLを生成する。
Since E 1 = not a φ in step S406 proceeds to the step S407, the state transition from E 1: the e 1 Remove the <1 → 0, e because / 0>, a new hypothesis in step S408 f 1 = (0, rain , 0, {(1, rain, 0, {(1, rain, 0, φ), (3, rain, 0, φ)}), (2, 飴, 0, {(2, 飴, 0, φ ), (4, 飴, 0, φ)})})
Is generated. Since step S409 o [e 1] is not a ε, the process proceeds to step S501 to correct the hypothesis f 1. At this time, m = 2 is set.
To generate an empty auxiliary hypothesis list L 2 in step S502.

ステップS503でAW[f]=0となる。
ステップS504で補助仮説リスト
L[f]={(1,雨,0,{(1,雨,0,φ),(3,雨,0,φ)}),(2,飴,0,{(2,飴,0,φ),(4,飴,0,φ)})}
から補助仮説
=(1,雨,0,{(1,雨,0,φ),(3,雨,0,φ)})
を取り出し、仮説生成規則Tの状態1から入力記号“め”で遷移可能な状態遷移
<1→5,め:ε/1>
を含む状態遷移リストEを作る。
In step S503, AW [f 1 ] = 0.
In step S504, the auxiliary hypothesis list L [f 1 ] = {(1, rain, 0, {(1, rain, 0, φ), (3, rain, 0, φ)}), (2, 飴, 0, {(2, 飴, 0, φ), (4, 飴, 0, φ)})}
From the auxiliary hypothesis g 2 = (1, rain, 0, {(1, rain, 0, φ), (3, rain, 0, φ)})
State transition that can be transitioned from the state 1 of the hypothesis generation rule T 2 by the input symbol “M” <1 → 5, M: ε / 1>
Make a state transition list E 2, including.

ステップS505で状態遷移E=φではないのでステップS506に進む。状態遷移リストEから状態遷移<1→5,あ:ε/1>を取り出しeとし、ステップS507で補助仮説f=(5,雨,1,{(1,雨,0,φ),(3,雨,0,φ)})を生成する。
ステップS508でo[e]はεであるため、ステップS509に進む。
ステップS509ではfをLに挿入し、ステップS505に戻る。
ステップS505ではE=φなのでステップS510に進み、ステップS510では、L[f]がφではないので、ステップS504に戻る。
Since the state transition E 2 = φ is not satisfied in step S505, the process proceeds to step S506. State transition list E 2 state transition from <1 → 5, Oh: epsilon / 1> and e 2 removed, auxiliary hypothesis f 2 = (5, rain in step S507, 1, {(1, rain, 0, phi) , (3, rain, 0, φ)}).
Since o [e 2 ] is ε in step S508, the process proceeds to step S509.
In step S509 the f 2 is inserted into L 2, the flow returns to step S505.
Since E 2 = φ in step S505, the process proceeds to step S510. In step S510, L [f 1 ] is not φ, and the process returns to step S504.

ステップS504で補助仮説リスト
L[f]={(2,飴,0,{(2,飴,0,φ),(4,飴,0,φ)})}
から補助仮説
=(2,飴,0,{(2,飴,0,φ),(4,飴,0,φ)})
を取り出し、仮説生成規則Tの状態1から入力記号“め”で遷移可能な状態遷移
<2→5,め:ε/2>
を含む状態遷移リストEを作る。
In step S504, auxiliary hypothesis list L [f 1 ] = {(2, 飴, 0, {(2, 飴, 0, φ), (4, 飴, 0, φ)})}
From the auxiliary hypothesis g 2 = (2, 飴, 0, {(2, 飴, 0, φ), (4, 飴, 0, φ)})
State transition that can be transitioned from the state 1 of the hypothesis generation rule T 2 with the input symbol “M” <2 → 5, M: ε / 2>
Make a state transition list E 2, including.

ステップS505でE=φではないのでステップS506に進む。Eから状態遷移<2→5,め:ε/2>を取り出しeとし、ステップS507で補助仮説f=(5,飴,2,{(2,飴,0,φ),(4,飴,0,φ)})を生成する。
ステップS508でo[e]はεであるため、ステップS509に進む。
ステップS509ではfをLに挿入し、ステップS505に戻る。
但し、補助仮説リストLには既に補助仮説(5,雨,1,{(1,雨,0,φ),(3,雨,0,φ)})が存在し、仮説生成規則Tにおける到達状態が5であるため、累積重みの小さい補助仮説、(5,雨,1,{(1,雨,0,φ),(3,雨,0,φ)})を残し、(5,飴,2,{(2,飴,0,φ),(4,飴,0,φ)})は削除する。このとき、それぞれの補助仮説の補助仮説リストは累積重みを修正して連結させ、(5,雨,1,{(1,雨,1,φ),(3,雨,1,φ),(2,飴,2,φ),(4,飴,2,φ)})とする。また、状態5に到達した補助仮説は、状態遷移<5→0,ε:ε/0>経由して、入力記号なしで状態0に到達するので、補助仮説リストLには補助仮説、
(0,雨,1,{(1,雨,1,φ),(3,雨,1,φ),(2,飴,2,φ),(4,飴,2,φ)})
が残る。
Since E 2 = φ is not satisfied in step S505, the process proceeds to step S506. State transition from E 2 <2 → 5, because: epsilon / 2> and e 2 removed, auxiliary hypothesis f 2 = (5 in step S507, the candy, 2, {(2, candy, 0, phi), (4 , 飴, 0, φ)}).
Since o [e 2 ] is ε in step S508, the process proceeds to step S509.
In step S509 the f 2 is inserted into L 2, the flow returns to step S505.
However, an auxiliary hypothesis (5, rain, 1, {(1, rain, 0, φ), (3, rain, 0, φ)}) already exists in the auxiliary hypothesis list L 2 , and the hypothesis generation rule T 2 Since the arrival state at 5 is 5, an auxiliary hypothesis with a small cumulative weight (5, rain, 1, {(1, rain, 0, φ), (3, rain, 0, φ)}) remains, and (5 , 飴, 2, {(2, 飴, 0, φ), (4, 飴, 0, φ)}) are deleted. At this time, the auxiliary hypothesis list of each auxiliary hypothesis is connected by correcting the cumulative weight, and (5, rain, 1, {(1, rain, 1, φ), (3, rain, 1, φ), ( 2, 飴, 2, φ), (4, 飴, 2, φ)}). In addition, auxiliary hypothesis that has reached the state 5, state transition <5 → 0, ε: ε / 0> through, because to reach the state 0 with no input symbol, the auxiliary hypothesis list L 2 auxiliary hypothesis,
(0, rain, 1, {(1, rain, 1, φ), (3, rain, 1, φ), (2, hail, 2, φ), (4, hail, 2, φ)})
Remains.

ステップS505ではE=φなのでステップS510に進み、ステップS510ではL[f]がφなので、ステップS511に進む。
ステップS511ではLの要素をすべてL[f]に移す。
ステップS512では、L[f]={(0,雨,1,{(1,雨,1,φ),(3,雨,1,φ),(2,飴,2,φ),(4,飴,2,φ)})}の補助仮説の中で累積重みの最小値は1であるため、W[f]=1とする。
ステップS513で補助仮説fの補正を終了し、ステップS409に戻る。
Since E 2 = φ in step S505, the process proceeds to step S510. In step S510, L [f 1 ] is φ, and therefore, the process proceeds to step S511.
Step S511 In all elements of the L 2 transferred to L [f 1].
In step S512, L [f 1 ] = {(0, rain, 1, {(1, rain, 1, φ), (3, rain, 1, φ), (2, hail, 2, φ), ( In the auxiliary hypothesis of 4, 1, 2, φ)})}, the minimum value of the cumulative weight is 1, so W [f 1 ] = 1.
Exit correction auxiliary hypothesis f 1 at step S513, the flow returns to step S409.

ステップS409における仮説fの補正手順の後、ステップS410に進む。
ステップS410では、仮説fを仮説リストH’に挿入し、ステップS406に戻る。
ステップS406で仮説遷移リストE=φなので、ステップS411に進む。
ステップS411でH=φなので、ステップS412に進み、H’の要素
{(0,あめ,1,{(0,雨,1,{(1,雨,1,φ),(3,雨,1,φ),(0,飴,2,{(2,飴,2,φ),(4,飴,2,φ)})}
を仮説リストHに移す。
After correction procedure hypothesis f 1 at step S409, the process proceeds to step S410.
In step S410, insert the hypothesis f 1 to the hypothesis list H ', the flow returns to step S406.
Since the hypothesis transition list E 1 = φ in step S406, the process proceeds to step S411.
Since H = φ in step S411, the process proceeds to step S412 and the element of H ′ {(0, rain, 1, {(0, rain, 1, {(1, rain, 1, φ), (3, rain, 1 , Φ), (0, 飴, 2, {(2, 飴, 2, φ), (4, 飴, 2, φ)})}
Is moved to the hypothesis list H.

ステップS413に進み、次の入力記号が存在するので、ステップS404に戻る。
〔入力記号“d”の処理〕
ステップS404で記号“d”を読み込み、ステップS405において仮説リストHから仮説
h={(0,あめ,1,{(0,雨,1,{(1,雨,1,φ),(3,雨,1,φ),(2,飴,2,φ),(4,飴,2,φ)})}
を取り出す。この仮説の仮説生成規則Tの現状態0から入力記号が“d”の状態遷移
<0→3,d:ε/0>
を含む仮説遷移リストEを作る。
Proceeding to step S413, since the next input symbol exists, the process returns to step S404.
[Processing of input symbol “d”]
In step S404, the symbol “d” is read, and in step S405, the hypothesis h = {(0, rain, 1, {(0, rain, 1, {(1, rain, 1, φ), (3, Rain, 1, φ), (2, 飴, 2, φ), (4, 飴, 2, φ)})}
Take out. State transition of input symbol “d” from current state 0 of hypothesis generation rule T 1 of this hypothesis <0 → 3, d: ε / 0>
Make a hypothesis transition list E 1, including.

ステップS406でE=φではないのでステップS407に進み、Eから状態遷移<0→3,d:ε/0>を取り出しeとし、ステップS408で新たな仮説
=(3,あめ,1,{(0,雨,1,{(1,雨,0,φ),(3,雨,0,φ)}),(0,飴,2,{(2,飴,0,φ),(4,飴,0,φ)})})
を生成する。ステップS409でo[e]=εなので、ステップS410に進む。
ステップS410ではfをH’に挿入し、ステップS406に進む。
ステップS406ではE=φなのでステップS411に進み、H=φなのでステップS412に進む。
Since E 1 = not at φ at step S406 proceeds to step S407, the state transition from E 1: a e 1 removed <0 → 3, d ε / 0>, a new hypothesis in step S408 f 1 = (3, rain , 1, {(0, rain, 1, {(1, rain, 0, φ), (3, rain, 0, φ)}), (0, 飴, 2, {(2, 飴, 0, φ ), (4, 飴, 0, φ)})})
Is generated. Since o [e 1 ] = ε in step S409, the process proceeds to step S410.
In step S410 the f 1 is inserted into H ', processing proceeds to step S406.
In step S406, since E 1 = φ, the process proceeds to step S411, and since H = φ, the process proceeds to step S412.

ステップS412では仮説リストH’の要素
{(3,あめ,1,{(0,雨,1,{(1,雨,1,φ),(3,雨,1,φ),(2,飴,2,φ),(4,飴,2,φ)})})}
をすべて仮説リストHに移す。
ステップS413に進み、次の入力記号が存在するので、ステップS404に戻る。
〔入力記号“a”の処理〕
ステップS404で記号“a”を読み込み、ステップS405において仮説リストHから仮説
h=(3,あめ,1,{(0,雨,1,{(1,雨,0,φ),(3,雨,0,φ),(2,飴,0,φ),(4,飴,0,φ)})})
を取り出す。この仮説の仮説生成規則Tの現状態0から入力記号が“e”の状態遷移
<3→0,a:だ/0>
を含むリストEを作る。
In step S412, the elements of the hypothesis list H ′ {(3, candy, 1, {(0, rain, 1, {(1, rain, 1, φ), (3, rain, 1, φ), (2, 飴, 2, φ), (4, 飴, 2, φ)})})}
Are all moved to the hypothesis list H.
Proceeding to step S413, since the next input symbol exists, the process returns to step S404.
[Processing of input symbol “a”]
In step S404, the symbol “a” is read, and in step S405, the hypothesis h = (3, candy, 1, {(0, rain, 1, {(1, rain, 0, φ), (3, rain) , 0, φ), (2, 飴, 0, φ), (4, 飴, 0, φ)})})
Take out. State transition of input symbol “e” from current state 0 of hypothesis generation rule T 1 of this hypothesis <3 → 0, a: da / 0>
Make a list E 1, including.

ステップS406でE=φではないのでステップS407に進み、Eから状態遷移<1→0,e:め/0>を取り出しeとし、ステップS408で新たな仮説
=(0,あめだ,1,{(0,雨,1,{(1,雨,1,φ),(3,雨,1,φ),(2,飴,2,φ),(4,飴,2,φ)})})
を生成する。ステップS409でo[e]はεではないので、仮説fを補正するステップS501に進む。このときm=2に設定する。
ステップS502で空の補助仮説リストLを生成する。
Since E 1 = not a φ in step S406 proceeds to the step S407, the state transition from E 1: the e 1 Remove the <1 → 0, e because / 0>, a new hypothesis in step S408 f 1 = (0, rain 1, {(0, rain, 1, {(1, rain, 1, φ), (3, rain, 1, φ), (2, 飴, 2, φ), (4, 飴, 2, φ)})})
Is generated. Since step S409 o [e 1] is not a ε, the process proceeds to step S501 to correct the hypothesis f 1. At this time, m = 2 is set.
To generate an empty auxiliary hypothesis list L 2 in step S502.

ステップS503でAW[f]=0となる。
ステップS504で補助仮説リスト
L[f]={(0,雨,1,{(1,雨,1,φ),(3,雨,1,φ),(2,飴,2,φ),(4,飴,2,φ)})}
から補助仮説
=(0,雨,1,{(1,雨,1,φ),(3,雨,1,φ),(2,飴,2,φ),(4,飴,2,φ)})
を取り出し、仮説生成規則Tの状態0から入力記号“だ”で遷移可能な状態遷移
<0→4,だ:玉/1>
を含むリストEを作る。
In step S503, AW [f 1 ] = 0.
In step S504, auxiliary hypothesis list L [f 1 ] = {(0, rain, 1, {(1, rain, 1, φ), (3, rain, 1, φ), (2, 飴, 2, φ) , (4, 飴, 2, φ)})}
From the auxiliary hypothesis g 2 = (0, rain, 1, {(1, rain, 1, φ), (3, rain, 1, φ), (2, 飴, 2, φ), (4, 飴, 2 , Φ)})
State transition that can be transitioned from the state 0 of the hypothesis generation rule T 2 with the input symbol “da” <0 → 4, ball: ball / 1>
Make a list E 2, including.

ステップS505でE=φではないのでステップS506に進む。Eから状態遷移<0→4,だ:玉/1>を取り出しeとし、ステップS507で補助仮説f=(4,雨玉,2,{(1,雨,1,φ),(3,雨,1,φ),(2,飴,2,φ),(4,飴,2,φ)})を生成する。
ステップS508でo[e]はεではなく、かつ、m=2でM=3なのでm<Mであることから、fを補正するステップS501に進む。このときmを1増やして、m=3に設定する。
Since E 2 = φ is not satisfied in step S505, the process proceeds to step S506. State transition from E 2: and e 2 removed <0 → 4, but the ball / 1>, auxiliary hypothesis f 2 = (4 in step S507, the rain ball, 2, {(1, rain, 1, phi), ( 3, rain, 1, φ), (2, 飴, 2, φ), (4, 飴, 2, φ)}).
In o [e 2] rather than ε step S508, the and, since at m = 2 is M = 3 Since m <M, the process proceeds to step S501 of correcting the f 2. At this time, m is increased by 1, and m = 3 is set.

ステップS502で空の補助仮説リストLを生成する。
ステップS503でAW[f]=2−1=1となる。
ステップS504で補助仮説リストL[f]={(1,雨,1,φ),(3,雨,1,φ),(2,飴,2,φ),(4,飴,2,φ)}から補助仮説g=(1,雨,1,φ)を取り出し、仮説生成規則Tの状態1から入力記号“玉”で遷移可能な状態遷移
<1→4,玉:玉/5>
を含むリストEを作る。
To generate an empty auxiliary hypothesis list L 3 in step S502.
In step S503, AW [f 2 ] = 2−1 = 1.
In step S504, auxiliary hypothesis list L [f 2 ] = {(1, rain, 1, φ), (3, rain, 1, φ), (2, 飴, 2, φ), (4, 飴, 2, φ)} is extracted from auxiliary hypothesis g 3 = (1, rain, 1, φ), and state transition that can be transitioned from input 1 “ball” from state 1 of hypothesis generation rule T 3 <1 → 4, ball: ball / 5>
Make a list E 3, including.

ステップS505でE=φではないのでステップS506に進む。Eから状態遷移<1→4,玉:玉/5>を取り出しeとし、ステップS507で補助仮説f=(4,雨玉,7,φ)を生成する。ここで、W[f]=W[g]+AW[f]+w[e]=1+1+5=7として計算されている。
ステップS508でm=3かつM=3なのでm<Mではないから、ステップS509に進み、fをLに挿入する。
ステップS505に戻り、E=φなので、ステップS510に進む。
Since E 3 = φ is not satisfied in step S505, the process proceeds to step S506. State transition from E 3 <1 → 4, Ball: Ball / 5> and e 3 removed, auxiliary hypothesis f 3 = in Step S507 (4, candy, 7, phi) to produce a. Here, it is calculated as W [f 3 ] = W [g 3 ] + AW [f 2 ] + w [e 3 ] = 1 + 1 + 5 = 7.
Not a m = 3 and M = 3 Since m <M at step S508, the process proceeds to step S509, the inserting the f 3 to L 3.
Returning to step S505, since E 3 = φ, the process proceeds to step S510.

ステップS510で、L[f]はφではないので、ステップS504に戻る。
ステップS504でL[f]={(3,雨,1,φ),(2,飴,2,φ),(4,飴,2,φ)}から補助仮説g=(3,雨,1,φ)を取り出し、仮説生成規則Tの状態3から入力記号“玉”で遷移可能な状態遷移は存在しないのでE=φとする。
ステップS505に進んで、Eがφなので、ステップS510に進む。
ステップS510ではL[f]はφではないのでステップS504に戻る。
ステップS504で補助仮説リストL[f]={(2,飴,2,φ),(4,飴,2,φ)}から補助仮説g=(2,飴,2,φ)を取り出し、仮説生成規則Tの状態2から入力記号“玉”で遷移可能な状態遷移
<2→4,玉:玉/1>
を含むリストEを作る。
In step S510, since L [f 2 ] is not φ, the process returns to step S504.
In step S504, the auxiliary hypothesis g 3 = (3, rain) from L [f 2 ] = {(3, rain, 1, φ), (2, 飴, 2, φ), (4, 飴, 2, φ)}. , 1, φ), and since there is no state transition that can be transitioned from the state 3 of the hypothesis generation rule T 3 with the input symbol “ball”, E 3 = φ.
The process proceeds to step S505, because the E 3 is φ, the process proceeds to step S510.
In step S510, since L [f 2 ] is not φ, the process returns to step S504.
In step S504, the auxiliary hypothesis g 3 = (2, 飴, 2, φ) is extracted from the auxiliary hypothesis list L [f 2 ] = {(2, 飴, 2, φ), (4, 飴, 2, φ)}. State transition that can be transitioned from the state 2 of the hypothesis generation rule T 3 with the input symbol “ball” <2 → 4, ball: ball / 1>
Make a list E 3, including.

ステップS505でE=φではないのでステップS506に進む。Eから状態遷移<2→4,玉:玉/1>を取り出しeとし、ステップS507で補助仮説f=(4,飴玉,4,φ)を生成する。ここで、W[f]=W[g]+AW[f]+w[e]=2+1+1=4として計算されている。
ステップS508でm=3かつM=3なのでm<Mではないから、ステップS509に進み、fをLに挿入する。
ここで、Lには既に仮説生成規則Tの同じ状態4に到達している補助仮説(4,雨玉,7,φ)が存在するので、累積重みの小さい(4,飴玉,4,φ)だけを残し、(4,雨玉,7,φ)は削除する。
Since E 3 = φ is not satisfied in step S505, the process proceeds to step S506. State transition from E 3 <2 → 4, Ball: Ball / 1> and e 3 removed, auxiliary in step S507 hypothesis f 3 = (4, hard candy, 4, phi) to produce a. Here, it is calculated as W [f 3 ] = W [g 3 ] + AW [f 2 ] + w [e 3 ] = 2 + 1 + 1 = 4.
Not a m = 3 and M = 3 Since m <M at step S508, the process proceeds to step S509, the inserting the f 3 to L 3.
Here, the auxiliary hypothesis has already reached the same state 4 of hypothesis generation rule T 3 to L 3 (4, candy, 7, phi) because there, small cumulative weight (4, hard candy, 4 , Φ) only, and delete (4, rainball, 7, φ).

ステップS505に戻り、E=φなので、ステップS510に進む。
ステップS510で、L[f]はφではないので、ステップS504に戻る。
ステップS504でL[f]={(4,飴,2,φ)}から補助仮説g=(4,飴,2,φ)を取り出し、仮説生成規則Tの状態4から入力記号“玉”で遷移可能な状態遷移は存在しないのでE=φとする。
ステップS505に進んで、Eがφなので、ステップS510に進む。
ステップS510ではL[f]がφなのでステップS511に進む。
Returning to step S505, since E 3 = φ, the process proceeds to step S510.
In step S510, since L [f 2 ] is not φ, the process returns to step S504.
In step S504, the auxiliary hypothesis g 3 = (4, 飴, 2, φ) is extracted from L [f 2 ] = {(4, 飴, 2, φ)}, and the input symbol “ 3 ” is input from state 4 of the hypothesis generation rule T 3. Since there is no state transition that can be transitioned by the “ball”, E 3 = φ.
The process proceeds to step S505, because the E 3 is φ, the process proceeds to step S510.
In step S510, since L [f 2 ] is φ, the process proceeds to step S511.

ステップS511ではLの要素をすべてL[f]に移し、ステップS512に進む。
ステップS512では、L[f]={(4,飴玉,4,φ)}の中で最小の累積重みは4なので、W[f]=4とする。
ステップS513で補助仮説fの補正を終了し、mを1減らしてm=2とし、ステップS508に戻る。
ステップS508におけるfの補正の後、ステップS509に進む。
ステップS509では、fをLに挿入し、ステップS505に進む。
Step S511 In all the elements of L 3 were transferred to L [f 2], the process proceeds to step S512.
In step S512, the minimum cumulative weight among L [f 2 ] = {(4, jade ball, 4, φ)} is 4, so W [f 2 ] = 4.
Step S513 In Exit correction auxiliary hypothesis f 2, and m = 2 in the m reduced by one, the flow returns to step S508.
After correction of f 2 at step S508, the process proceeds to step S509.
At step S509, the inserting the f 2 to L 2, the process proceeds to step S505.

ステップS505ではEはφなので、ステップS510に進む。
ステップS510でL[f]はφなので、ステップS511に進む。
ステップS511ではLの要素
{(4,雨玉,4,{(4,飴玉,4,φ)})}
をL[f]に移し、ステップS512に進む。
ステップS512では、L[f]の中で最小の累積重みは4なので、W[f]=4とする。
In step S505 E 2 is so φ, the process proceeds to step S510.
Since L [f 2 ] is φ in step S510, the process proceeds to step S511.
Step S511 In L 2 elements {(4, candy, 4, {(4, hard candy, 4, phi)})}
Is moved to L [f 1 ], and the process proceeds to step S512.
In step S512, the minimum cumulative weight in L [f 1 ] is 4, so W [f 1 ] = 4.

ステップS513で補助仮説fの補正を終了し、ステップS409に戻る。
ステップS409におけるfの補正手順の後、ステップS410に進む。
ステップS410では、fをH’に挿入し、ステップS406に戻る。
ステップS406でE=φなので、ステップS411に進む。
ステップS411でH=φなので、ステップS412に進み、H’の要素
{(3,あめだ,4,{(4,雨玉,4,{(4,飴玉,4,φ)})})}
をHに移す。
Exit correction auxiliary hypothesis f 1 at step S513, the flow returns to step S409.
After the correction procedure f 1 at step S409, the process proceeds to step S410.
In step S410, insert the f 1 to H ', the flow returns to step S406.
Since E 1 = φ in step S406, the process proceeds to step S411.
Since H = φ in step S411, the process proceeds to step S412 and the element of H ′ {(3, candy, 4, {(4, rainball, 4, {(4, jade ball, 4, φ)})}) }
To H.

ステップS413に進み、次の入力記号が存在するので、ステップS404に戻る。
〔入力記号“m”の処理〕
ステップS404で記号“m”を読み込み、ステップS405において仮説リストHから仮説
h={(0,あめだ,4,{(4,雨玉,4,{(4,飴玉,4,φ)})})}
を取り出す。この仮説の仮説生成規則Tの現状態3から入力記号が“m”の状態遷移
<0→1,m:ε/0>
を含むリストEを作る。
Proceeding to step S413, since the next input symbol exists, the process returns to step S404.
[Processing of input symbol “m”]
In step S404, the symbol “m” is read, and in step S405, the hypothesis h = {(0, candy, 4, {(4, rainball, 4, {(4, jade ball, 4, φ)}. )})}
Take out. State transition of input symbol “m” from current state 3 of hypothesis generation rule T 1 of this hypothesis <0 → 1, m: ε / 0>
Make a list E 1, including.

ステップS406でE=φではないのでステップS407に進み、Eから状態遷移<0→1,m:ε/0>を取り出しリストeとし、ステップS408で新たな仮説
=(0,あめだ,4,{(4,雨玉,4,{(4,飴玉,4,φ)})})
を生成する。ステップS409でo[e]=εなので、ステップS410に進む。
ステップS410ではfをH’に挿入し、ステップS406に進む。
ステップS406ではE=φなのでステップS411に進み、H=φなのでステップS412に進む。
Since E 1 = not at φ at step S406 proceeds to step S407, the state transition from E 1 <0 → 1, m : ε / 0> is a list e 1 removed, new hypothesis f 1 = (0 at step S408, Ameda, 4, {(4, rainball, 4, {(4, jade ball, 4, φ)})})
Is generated. Since o [e 1 ] = ε in step S409, the process proceeds to step S410.
In step S410 the f 1 is inserted into H ', processing proceeds to step S406.
In step S406, since E 1 = φ, the process proceeds to step S411, and since H = φ, the process proceeds to step S412.

ステップS412ではH’の要素
{(1,あめだ,1,{(4,雨玉,4,{(4,飴玉,4,φ)})})}
をすべてHに移す。
ステップS413に進み、次の入力記号が存在するので、ステップS404に戻る。
〔入力記号“a”の処理〕
ステップS404で記号“a”を読み込み、ステップS405において仮説リストHから仮説
h=(1,あめだ,4,{(4,雨玉,4,{(4,飴玉,4,φ)})})
を取り出す。この仮説の仮説生成規則Tの現状態0から入力記号が“a”の状態遷移
<1→0,a:ま/0>
を含むリストEを作る。
In step S412, the element of H ′ {(1, Ameda, 1, {(4, rainball, 4, {(4, jade ball, 4, φ)})})}
Move all to H.
Proceeding to step S413, since the next input symbol exists, the process returns to step S404.
[Processing of input symbol “a”]
In step S404, the symbol “a” is read, and in step S405, a hypothesis h = (1, Ameda, 4, {(4, rainball, 4, {(4, amatama, 4, φ)}) })
Take out. State transition of input symbol “a” from current state 0 of hypothesis generation rule T 1 of this hypothesis <1 → 0, a: ma / 0>
Make a list E 1, including.

ステップS406でE=φではないのでステップS407に進み、リストEから状態遷移<1→0,a:ま/0>を取り出しeとし、ステップS408で新たな仮説
=(0,あめだま,4,{(4,雨玉,4,{(4,飴玉,4,φ)})})
を生成する。ステップS409でo[e]はεではないので、仮説fを補正するステップS501に進む。このときm=2に設定する。
ステップS502で空の補助仮説リストLを生成する。
ステップS503でAW[f]=0となる。
Step S406 because E 1 = not a φ in the procedure proceeds to step S407, the state transition from the list E 1 <1 → 0, a : or / 0> and e 1 taken out, new hypothesis f 1 = (0 in step S408, Amedama, 4, {(4, rainball, 4, {(4, jade ball, 4, φ)})})
Is generated. Since step S409 o [e 1] is not a ε, the process proceeds to step S501 to correct the hypothesis f 1. At this time, m = 2 is set.
To generate an empty auxiliary hypothesis list L 2 in step S502.
In step S503, AW [f 1 ] = 0.

ステップS504で補助仮説リスト
L[f]={(4,雨玉,4,{(4,飴玉,4,φ)})}
から補助仮説
=(4,雨玉,4,{(4,飴玉,4,φ)})
を取り出し、仮説生成規則Tの状態4から入力記号“ま”で遷移可能な状態遷移
<4→5,ま:ε/1>
を含むリストEを作る。
In step S504, auxiliary hypothesis list L [f 1 ] = {(4, rainball, 4, {(4, jade ball, 4, φ)})}
From the auxiliary hypothesis g 2 = (4, rainball, 4, {(4, jade ball, 4, φ)})
, And state transition that can be transitioned from the state 4 of the hypothesis generation rule T 2 with the input symbol “MA” <4 → 5, MA: ε / 1>
Make a list E 2, including.

ステップS505でE=φではないのでステップS506に進む。リストEから状態遷移<4→5,ま:ε/1>を取り出しeとし、ステップS507で補助仮説f=(5,雨玉,5,{(4,飴玉,4,φ)})を生成する。
ステップS508でo[e]はεであるため、ステップS509に進む。
ステップS509では、fをLに挿入し、ステップS505に進む。
ステップS505ではEはφなので、ステップS510に進む。
ステップS510でL[f]はφなので、ステップS511に進む。
ステップS511ではLの要素
{(5,雨玉,5,{(4,飴玉,4,φ)})}
をL[f]に移し、ステップS512に進む。
Since E 2 = φ is not satisfied in step S505, the process proceeds to step S506. State transition <4 → 5 or ε / 1> is extracted from list E 2 and set as e 2, and auxiliary hypothesis f 2 = (5, rainball, 5, {(4, jasper, 4, φ) in step S507. }).
Since o [e 2 ] is ε in step S508, the process proceeds to step S509.
At step S509, the inserting the f 2 to L 2, the process proceeds to step S505.
In step S505 E 2 is so φ, the process proceeds to step S510.
Since L [f 2 ] is φ in step S510, the process proceeds to step S511.
Step S511 In L 2 elements {(5, rain ball, 5, {(4, hard candy, 4, phi)})}
Is moved to L [f 1 ], and the process proceeds to step S512.

ステップS512では、L[f]の中で最小の累積重みは5なので、W[f]=5とする。
ステップS513で補助仮説fの補正を終了し、ステップS409に戻る。
ステップS409におけるfの補正手順の後、ステップS410に進む。
ステップS410では、fをH’に挿入し、ステップS406に戻る。
ステップS406でE=φなので、ステップS411に進む。
ステップS411でH=φなので、ステップS412に進み、H’の要素
{(0,あめだま,5,{(5,雨玉,5,{(4,飴玉,4,φ)})})}
をHに移す。
In step S512, since the minimum cumulative weight in L [f 1 ] is 5, W [f 1 ] = 5.
Exit correction auxiliary hypothesis f 1 at step S513, the flow returns to step S409.
After the correction procedure f 1 at step S409, the process proceeds to step S410.
In step S410, insert the f 1 to H ', the flow returns to step S406.
Since E 1 = φ in step S406, the process proceeds to step S411.
Since H = φ in step S411, the process proceeds to step S412 and the element of H ′ {(0, candy, 5, {(5, rainball, 5, {(4, jade ball, 4, φ)})}) }
To H.

ステップS413に進み、次の入力記号が存在しないので、ステップS414に進む。
ステップS414で、H内の仮説h=(0,あめだま,5,{(5,雨玉,5,{(4,飴玉,4,φ)})})が終了状態に到達した唯一の仮説であり、その補助仮説h=(5,雨玉,5,{(4,飴玉,4,φ)})、およびその補助仮説h=(4,飴玉,4,φ)とすると、累積重み

Figure 2007066237
となり、その補助仮説hの出力記号列“飴玉”を変換結果として出力し、ステップS415で記号列変換処理を終了する。 Proceeding to step S413, since there is no next input symbol, the process proceeds to step S414.
In step S414, the hypothesis h 1 in H is equal to (0, candy, 5, {(5, rainball, 5, {(4, jade ball, 4, φ)})}) has reached the end state. And its auxiliary hypothesis h 2 = (5, rainball, 5, {(4, jasper, 4, φ)}) and its auxiliary hypothesis h 3 = (4, jasper, 4, φ) The cumulative weight
Figure 2007066237
Next, and it outputs the output symbol string "candy" auxiliary hypothesis h 3 as the conversion result, and terminates the symbol string conversion processing in step S415.

この変換結果は、従来の2つの仮説生成部を用いた記号列変換手順において、入力記号列を“あ,め,だ,ま”とした場合の結果と同一になっている。本発明では、ローマ字入力された記号列“a,m,e,d,a,m,a”を記号列“あ,め,だ,ま”に変換する仮説生成規則を新たに加えて、結果的にローマ字入力を漢字に変換する処理を実現している。つまり、本発明によればローマ字入力を平仮名文字に変換する仮説生成規則を付加するか除去するかの選択で、ローマ字入力から漢字に変換する記号列変換装置と、平仮名入力を漢字に変換する記号列変換装置を簡単に得ることができ、変換先を簡単に変更できる利点が得られる。   This conversion result is the same as the result when the input symbol string is “A, A, D, D” in the conventional symbol string conversion procedure using the two hypothesis generation units. In the present invention, a new hypothesis generation rule for converting a symbol string “a, m, e, d, a, m, a” input in Roman letters into a symbol string “A, M, D, M” is added to the result. Realize the process of converting Roman input to Kanji. That is, according to the present invention, by selecting whether to add or remove a hypothesis generation rule for converting a Roman character input into a Hiragana character, a symbol string conversion device that converts a Roman character input into a Kanji character, and a symbol that converts a Hiragana input into a Kanji character The column conversion device can be easily obtained, and the advantage that the conversion destination can be easily changed is obtained.

図17に本発明の第2の実施例を示す。この実施例は3つの仮説生成部201−1,201−2,201−3を用いて音声認識を行なう構成とした場合を示す。
音声信号を入力する音声信号入力部505から入力された音声信号を音声特徴記号列抽出部506で音声の短時間音響パターンの時系列を音響特徴記号列として抽出する。抽出した音響特徴記号列を本発明による記号列変換部102を構成する初段の仮説生成部201−1に入力し、この初段の仮説生成部201−1において、音響特徴記号列を単語系の記号列を目標とする仮説に変換する。このために初段の仮説生成部201−1は音響モデル用仮説生成規則格納部105−1に格納され、音声固定単位(例えば要素)の標準的特徴を音声信号をある短い時間(例えば10ミリ秒)ごとに分析して得られる音響パターンを備えた音響モデル用仮説生成規則と、単語辞書用仮説生成規則格納部105−2に格納され、種々の単語の発音を前記音声固定単位の系列に対応させる単語発音辞書用仮説生成用規則を読み込み、音響特徴記号列を単語系の記号列を候補とする仮説を生成する。初段の仮説生成部201−1で生成された仮説はこの例では2段目と3段目の仮説生成部201−2と201−3で言語モデル1と2用仮説生成用規則を読み込み、言語としての尤度を高めるための有限状態遷移過程を経てそれぞれ仮説を生成し、各仮説群の累積重みを仮説補正部301−1〜301−Mで補正し、仮説絞込み部401−1〜401−Mで仮説を絞り込んで記号列出力部106に音声認識結果を出力する構成とした場合を示す。
FIG. 17 shows a second embodiment of the present invention. This embodiment shows a case where speech recognition is performed using three hypothesis generation units 201-1, 201-2, and 201-3.
A voice feature symbol string extraction unit 506 extracts a time series of a short time acoustic pattern of a voice as an acoustic feature symbol string from the voice signal input unit 505 that inputs a voice signal. The extracted acoustic feature symbol string is input to the first-stage hypothesis generation unit 201-1 constituting the symbol string conversion unit 102 according to the present invention, and the first-stage hypothesis generation unit 201-1 converts the acoustic feature symbol string into a word-based symbol. Convert a column to a target hypothesis. For this purpose, the first-stage hypothesis generation unit 201-1 is stored in the acoustic model hypothesis generation rule storage unit 105-1, and the standard feature of the sound fixed unit (for example, element) is used for a short time (for example, 10 milliseconds). ) Stored in the acoustic model hypothesis generation rule having the acoustic pattern obtained by analysis and the word dictionary hypothesis generation rule storage unit 105-2 and corresponding to the pronunciation of various words A rule for generating a hypothesis for a word pronunciation dictionary to be read is read, and a hypothesis with an acoustic feature symbol string as a candidate for a word-based symbol string is generated. In this example, the hypothesis generated by the first-stage hypothesis generation unit 201-1 is that the second and third-stage hypothesis generation units 201-2 and 201-3 read the rules for generating the hypothesis generation for the language model 1 and 2, and the language Hypotheses are generated through a finite state transition process for increasing the likelihood of each of the hypotheses, the accumulated weight of each hypothesis group is corrected by the hypothesis correction units 301-1 to 301-M, and the hypothesis narrowing units 401-1 to 401- A case in which hypotheses are narrowed down by M and a speech recognition result is output to the symbol string output unit 106 is shown.

ここで言語モデル1は例えば一般的な単語の連接のしやすさを与える言語モデルとすることができ、また言語モデル2は特定分野で用いられる文章の特化した単語の連接のしやすさを与える言語モデルとすることができる。このように一般的な単語の連接のしやすさを与える言語モデル1と、特定分野で用いられる文章に特化した単語の連結のしやすさを与える言語モデル2とを組み合せることで、その特定分野における文章に対する高い音声認識精度を与えるだけでなく、その特定分野以外の文章に対しても、ある一定の音声認識精度を保つような音声認識が可能となる。   Here, the language model 1 can be, for example, a language model that gives ease of general word connection, and the language model 2 shows easy word connection of sentences used in a specific field. It can be a language model to give. In this way, by combining the language model 1 that gives ease of general word connection and the language model 2 that gives ease of word connection specialized in sentences used in a specific field, In addition to providing high speech recognition accuracy for text in a specific field, speech recognition that maintains a certain level of speech recognition accuracy for text outside the specific field is also possible.

音声認識用の単語発音辞書や言語モデルを重み付き有限状態遷移規則によって記述する方法は、例えば、国際会議ASR2000における、M.Mohri,F.Pereira,M.Riley著“Weighted finite-state transducers in speech recognition”,Proceeding of ASR2000, pp.97-106,2000に開示されている。
種々の音声固定単位(例えば音素)の標準的な音響パターン系列の集合を表す音響モデルとしては、例えば、それら音響パターンの系列の集合を確率・統計理論に基づいてモデル化する隠れマルコフモデル法(Hidden Markov Model、以後HMMと呼ぶ)が主流である。このHMM法の詳細は、例えば、社団法人電子情報通信学会編、中川聖一著「確率モデルによる音声認識」に開示されている。
A method of describing a word pronunciation dictionary and a language model for speech recognition using weighted finite state transition rules is described in, for example, “Weighted finite-state transducers in speech” by M. Mohri, F. Pereira, M. Riley at the international conference ASR2000. recognition ", Proceeding of ASR2000, pp.97-106,2000.
As an acoustic model that represents a set of standard acoustic pattern sequences of various speech fixed units (for example, phonemes), for example, a hidden Markov model method that models a set of these acoustic pattern sequences based on probability / statistical theory ( Hidden Markov Model (hereinafter referred to as HMM) is the mainstream. Details of the HMM method are disclosed in, for example, “Recognition of Speech by Stochastic Model” by Seiichi Nakagawa, edited by the Institute of Electronics, Information and Communication Engineers.

音声認識の場合は、初段の仮説生成部の重みとして、音響モデルによって計算される音響特徴記号(音響パターン)のスコアを用いる。ただし、このスコアは、大きいほど入力音響パターンが音響モデルによって表される音声固定単位に近いことを表すので、マイナスの音響スコアをもって重みとする。隠れマルコフモデルによる音響スコアの計算では、例えばガウス分布に基づく確率値が用いられる。
音声認識に用いる音響パターンには、短い時間(例えば10ミリ秒)ごとに音声信号を分析することにより得られるメルケプストラム(mel-frequency cepstral coefficients、MFCCと呼ばれる)、デルタMFCC、LPCケプストラム、対数パワーなどがある。
In the case of speech recognition, the score of the acoustic feature symbol (acoustic pattern) calculated by the acoustic model is used as the weight of the first-stage hypothesis generation unit. However, the larger the score, the closer the input acoustic pattern is to the sound fixed unit represented by the acoustic model, so a negative acoustic score is used as the weight. In the calculation of the acoustic score by the hidden Markov model, for example, a probability value based on a Gaussian distribution is used.
Acoustic patterns used for speech recognition include mel-frequency cepstral coefficients (referred to as MFCC), delta MFCC, LPC cepstrum, logarithmic power obtained by analyzing speech signals every short time (eg, 10 milliseconds). and so on.

音声認識率の実証
先に述べたように、本発明により3つの仮説生成処理を用いて記号列を変換する手順では、仮説補正部を除けば初段の仮説生成処理だけを用いて探索する手順(図4)とほぼ同じ計算手順となり、効率的な音声認識を行うことができる。
As described in the verification destination of the speech recognition rate, according to the present invention, in the procedure for converting the symbol string using the three hypothesis generation processes, a search process using only the first hypothesis generation process except for the hypothesis correction unit ( The calculation procedure is almost the same as in FIG. 4), and efficient speech recognition can be performed.

本発明による音声認識方法を用いて、男性10名による学術講演10講演分の音声を入力したときの、音声認識処理に要した処理時間と音声認識精度を表1に示す。ただし、処理時間は、実際に発話された時間を音声認識処理に要した処理時間で割った値(実時間比)とする。単語発音辞書の語彙サイズは3万である。実験には、クロック数2.8GHz相当の計算機を使用した。従来法では、二つの仮説生成部(単語辞書用仮説生成器と一般的な文章用仮説生成部)だけを用いており、本発明では、前記二つの仮説生成部に加え、その学術講演の技術分野の文章に特化した言語モデル2を参照して動作する仮説生成部を用いている。

Figure 2007066237
Table 1 shows the processing time and speech recognition accuracy required for speech recognition processing when speech for 10 academic lectures by 10 men is input using the speech recognition method according to the present invention. However, the processing time is a value (actual time ratio) obtained by dividing the actual utterance time by the processing time required for the speech recognition processing. The vocabulary size of the word pronunciation dictionary is 30,000. In the experiment, a computer corresponding to a clock number of 2.8 GHz was used. In the conventional method, only two hypothesis generators (a word dictionary hypothesis generator and a general sentence hypothesis generator) are used. In the present invention, in addition to the above two hypothesis generators, the technology of the academic lecture is used. It uses a hypothesis generator that operates with reference to a language model 2 specialized in the field text.
Figure 2007066237

従来の二つの仮説生成部を用いた記号列変換方法に比べて、本発明による三つの仮説生成部を用いた記号列変換方法は、ほぼ同じ実時間比でありながら単語認識率においてより高い値を示した。このような結果が得られたのは、学術講演の技術分野に特化した言語モデル2を用いたことの効果である。本発明は、このように三つ以上の仮説生成部を同時に用いることができるため、二つの仮説生成部を用いる場合に比べて処理時間をほとんど増加させることなく、様々な仮説生成部の組み合わせにより音声認識の精度を向上させることができる。   Compared to the conventional symbol string conversion method using two hypothesis generation units, the symbol string conversion method using three hypothesis generation units according to the present invention has a higher value in word recognition rate while maintaining substantially the same real-time ratio. showed that. Such a result was obtained by using the language model 2 specialized in the technical field of academic lectures. Since the present invention can use three or more hypothesis generators at the same time as described above, by combining various hypothesis generators with almost no increase in processing time compared to the case of using two hypothesis generators. The accuracy of voice recognition can be improved.

一方、本発明を音声言い換え処理に適用し、4つの仮説生成部を用いて効率的に効率的な音声言い換え処理を行うこともできる。ここで、音声言い換え処理とは、音声認識を行いながら、その発話内容を別の文章スタイルに変換することを表す。例えば、話し言葉の文を、書き言葉のようなスタイルに書き換える処理がある。   On the other hand, the present invention can be applied to speech paraphrase processing, and efficient speech paraphrase processing can be performed efficiently using four hypothesis generation units. Here, the voice paraphrasing process represents converting the utterance content into another sentence style while performing voice recognition. For example, there is a process of rewriting a spoken sentence into a style like written language.

図18は、その音声言い換え装置600の実施例を示す。音声を入力する音声信号入力部505から送られた音声信号をその音声の短時間音響パターンの時系列を記号列として抽出する音声特徴記号列抽出部506において音響特徴記号列に変換し、その音響特徴記号列を入力として本発明による記号列変換を行う記号列変換部102に送る。続いて、記号列変換部102では、音響モデル用仮説生成規則格納部105−1から音声固定単位(例えば音素)の標準的特徴を音声信号をある短い時間(例えば10ミリ秒)ごとに分析して得られる音響パターンの系列の照合により与える音響モデルを、単語発話辞書用仮説生成規則格納部105−2からは種々の単語の発音を前記音声固定単位の系列によって与える単語発音辞書用仮説生成規則を、言語モデル用仮説生成規則格納部105−3からは発話される単語の連接のしやすさを与える言語モデル用の仮説生成規則を、言い換え用の仮説生成規則格納部105−5からは、文章中の単語や単語列を書き換える言い換え用仮説生成規則を、言い換え先言語モデル用仮説生成規則格納部105−6からは言い換えられた文章における単語の連接のしやすさを与える言い換え先言語モデル仮説生成規則を読み出し、音響特徴記号列抽出部506から送られた音響特徴記号列を読み込み、累積重み最小の出力記号列を求め、記号列出力部106に送る。記号列出力部106では、受け取った出力記号列を音声認識結果として出力する。   FIG. 18 shows an embodiment of the speech paraphrasing device 600. The voice signal sent from the voice signal input unit 505 that inputs voice is converted into an acoustic feature symbol string by a voice feature symbol string extraction unit 506 that extracts the time series of the short-time acoustic pattern of the voice as a symbol string, and the sound The feature symbol string is input and sent to the symbol string converter 102 which performs symbol string conversion according to the present invention. Subsequently, the symbol string conversion unit 102 analyzes the standard features of the speech fixed unit (for example, phonemes) from the acoustic model hypothesis generation rule storage unit 105-1 for each short time (for example, 10 milliseconds). A word pronunciation dictionary hypothesis generation rule that gives an acoustic model given by collating a series of acoustic patterns obtained from the word utterance dictionary hypothesis generation rule storage unit 105-2 with the pronunciation of various words as a series of fixed speech units. From the language model hypothesis generation rule storage unit 105-3, a language model hypothesis generation rule that gives ease of concatenation of spoken words, and from the paraphrase hypothesis generation rule storage unit 105-5, A paraphrase hypothesis generation rule that rewrites a word or a word string in a sentence is changed from a paraphrase destination language model hypothesis generation rule storage unit 105-6 to a simple phrase in the rephrased sentence. Read the paraphrase language model hypothesis generation rule that gives the ease of concatenation, read the acoustic feature symbol string sent from the acoustic feature symbol string extraction unit 506, obtain the output symbol string with the minimum cumulative weight, and obtain the symbol string output unit 106. The symbol string output unit 106 outputs the received output symbol string as a speech recognition result.

音声を認識しながら同時に文のスタイルを変換して出力するために用いる個々の仮説生成部に関する説明は、例えば、特開2004−110673号公報「文章スタイル変換方法,文章スタイル変換装置,文章スタイル変換プログラム,文章スタイル変換プログラムを格納した記憶媒体」に開示されている。   For example, Japanese Unexamined Patent Application Publication No. 2004-110673 “Sentence Style Conversion Method, Sentence Style Conversion Device, Sentence Style Conversion” describes an individual hypothesis generation unit used to simultaneously convert and output a sentence style while recognizing speech. A storage medium storing a program and a sentence style conversion program ".

上述した本発明による記号列変換装置は本発明による記号列変換プログラムをコンピュータにインストールすることにより、コンピュータによって記号列変換装置として機能させることができる。本発明による記号列変換プログラムはコンピュータが解読可能なプログラム言語によって記述され、コンピュータが読み取り可能な磁気ディスク或いはCD−ROMのような記録媒体に記録される。コンピュータにはこれらの記録媒体或いは通信回線を通じてインストールされる。   The above-described symbol string conversion apparatus according to the present invention can be made to function as a symbol string conversion apparatus by a computer by installing the symbol string conversion program according to the present invention in the computer. The symbol string conversion program according to the present invention is written in a computer-readable program language, and is recorded on a recording medium such as a magnetic disk or CD-ROM that can be read by the computer. The computer is installed through these recording media or communication lines.

仮説生成に用いる重み付き有限状態変換規則の一例を表す図。The figure showing an example of the weighted finite state conversion rule used for hypothesis generation. 図1の重み付き有限状態変換規則を表によって定義した図。The figure which defined the weighted finite state conversion rule of FIG. 1 with the table | surface. 重み付き有限状態変換規則による仮説生成方法の実施の形態を表すブロック図。The block diagram showing embodiment of the hypothesis generation method by a weighted finite state conversion rule. 重み付き有限状態変換規則による仮説生成方法の手順を説明するフローチャート。The flowchart explaining the procedure of the hypothesis generation method by a weighted finite state conversion rule. 仮名の系列を表す記号列を、その仮名に対応する漢字の系列に変換する重み付き有限状態変換規則の一例を表す図。The figure showing an example of the weighted finite state conversion rule which converts the symbol string showing the series of kana into the kanji series corresponding to the kana. 日本語における漢字の系列の接続の可能性を重みによって与える重み付き有限状態変換規則の一例を表す図。The figure showing an example of the weighted finite state conversion rule which gives the possibility of the connection of the kanji series in Japanese by weight. 二つの仮説生成部を用いた従来の記号列変換方法の実施の形態を表すブロック図。The block diagram showing embodiment of the conventional symbol sequence conversion method using two hypothesis generation parts. 二つの仮説生成部を用いた従来の記号列変換方法の手順を説明するフローチャート。The flowchart explaining the procedure of the conventional symbol sequence conversion method using two hypothesis generation parts. 図8の続きを説明するためのフローチャート。9 is a flowchart for explaining the continuation of FIG. 二つの仮説生成部を用いた従来の記号列変換方法における仮説の補正方法を説明するフローチャート。The flowchart explaining the correction method of the hypothesis in the conventional symbol sequence conversion method using two hypothesis generation parts. 本発明による三つ以上の仮説生成部を用いた記号列変換方法の実施の形態を表すブロック図。The block diagram showing embodiment of the symbol sequence conversion method using three or more hypothesis generation parts by this invention. 本発明における三つ以上の仮説生成部を用いた記号列変換方法の手順を説明するフローチャート。The flowchart explaining the procedure of the symbol sequence conversion method using the 3 or more hypothesis generation part in this invention. 図12の続きを説明するためのフローチャート。The flowchart for demonstrating the continuation of FIG. 本発明における三つ以上の重み付き有限状態変換器による記号列変換方法における仮説または補助仮説の補正方法を説明する図。The figure explaining the correction | amendment method of the hypothesis or auxiliary hypothesis in the symbol sequence conversion method by the 3 or more weighted finite state converter in this invention. ローマ字で表される記号列を、対応する平仮名の記号列に変換する重み付き有限状態変換規則の一例を表す図。The figure showing an example of the weighted finite state conversion rule which converts the symbol string represented by a Roman character into the symbol string of corresponding Hiragana. 図15の続きを説明するためのフローチャート。The flowchart for demonstrating the continuation of FIG. 本発明による音声認識方法の一実施の形態を表すブロック図。The block diagram showing one Embodiment of the speech recognition method by this invention. 本発明による音声言い換え方法の一実施の形態を表すブロック図。The block diagram showing one Embodiment of the voice paraphrasing method by this invention.

符号の説明Explanation of symbols

10 状態
11 終了状態
12 状態遷移
101 仮説生成規則格納部
102 記号列変換部
103 記号列入力部
101−1 前段仮説生成規則格納部
101−2 後段仮説生成規則格納部
104−1 1段目仮説生成規則格納部
104−M M段目仮説生成規則格納部
105−1 音響モデル用仮説生成規則格納部
105−2 単語発話辞書用仮説生成規則格納部
105−3 言語モデル1用仮説生成規則格納部
105−4 言語モデル2用仮説生成規則格納部
105−5 言い換え用仮説生成規則格納部
105−6 言い換え先言語モデル用仮説生成規則格納部
106 記号列出力部
201−1〜201−M 仮説生成部
301−1〜301−M 仮説補正部
401−1〜401−M 仮説絞込み部
10 states
11 End state
12 State transition
101 Hypothesis generation rule storage
102 Symbol string converter
103 Symbol string input section
101-1. First stage hypothesis generation rule storage unit
101-2 latter-stage hypothesis generation rule storage unit
104-1 First-stage hypothesis generation rule storage unit
104-M M-th stage hypothesis generation rule storage unit
105-1 Hypothesis generation rule storage unit for acoustic model
105-2 Hypothesis generation rule storage unit for word utterance dictionary
105-3 Hypothesis Generation Rule Storage for Language Model 1
105-4 Hypothesis Generation Rule Storage for Language Model 2
105-5 Paraphrase Hypothesis Generation Rule Storage
105-6 Hypothesis Generation Rule Storage Unit for Paraphrase Destination Language Model
106 Symbol string output unit 201-1 to 201-M Hypothesis generation unit 301-1 to 301-M Hypothesis correction unit 401-1 to 401-M Hypothesis narrowing unit

Claims (10)

コンピュータによって、記号列を順に読み込む記号列入力部と、状態遷移規則によって入力された記号列を他の記号列の候補となる仮説に変換する3個以上M個の仮説生成部を備えた記号列変換部と、この記号列変換部が出力する変換結果を取り込む記号列出力部とを構成し、
前記記号列変換部はM個の各仮説生成部のそれぞれに入力される入力記号列に対して状態遷移が可能な過程で求められる記号列で構成される仮説を生成する仮説生成処理と、
生成された仮説に付与された累積重み値を、各後段の仮説生成部が生成する仮説に付与された累積重みの中の特異値により補正する仮説補正処理と、
補正された累積重みを用いて不要な仮説を除去し、尤度の高い仮説に絞り込む仮説絞り込処理と、
を実行することを特徴とする記号列変換方法。
A symbol string input unit that sequentially reads a symbol string by a computer, and a symbol string that includes three or more M hypothesis generation units that convert a symbol string input according to a state transition rule into a hypothesis that is a candidate for another symbol string A conversion unit and a symbol string output unit that captures a conversion result output by the symbol string conversion unit are configured.
A hypothesis generation process in which the symbol string conversion unit generates a hypothesis including symbol strings obtained in a process in which state transition is possible with respect to an input symbol string input to each of the M hypothesis generation units;
A hypothesis correction process for correcting the cumulative weight value assigned to the generated hypothesis by a singular value in the cumulative weight assigned to the hypothesis generated by each hypothesis generation unit;
A hypothesis narrowing process that removes unnecessary hypotheses using the corrected cumulative weights and narrows down to a high likelihood hypothesis,
The symbol string conversion method characterized by performing this.
請求項1記載の記号列変換方法において、
前記仮説補正処理は、前記仮説生成部が生成した仮説に付与される累積重みを、次段の仮説生成器において生成される仮説のそれぞれに付与される累積重み乃至は補正された累積重みの中の特異値を呈する累積重みを用いて補正する仮説補正処理を前記記号列入力部から前記1段目の仮説生成部へ記号が入力される毎にM−1段目の仮説生成部が生成した仮説の累積重みから1段目の仮説生成部が生成した仮説の累積重みの全てに渡って適用することを特徴とする記号列変換方法。
The symbol string conversion method according to claim 1,
In the hypothesis correction process, the cumulative weight given to the hypothesis generated by the hypothesis generation unit is selected from the cumulative weight given to each hypothesis generated in the hypothesis generator in the next stage or the corrected cumulative weight. Each time a symbol is input from the symbol string input unit to the first-stage hypothesis generation unit, a hypothesis correction process for correcting using a cumulative weight exhibiting a singular value is generated by the M-1th-stage hypothesis generation unit. A symbol string conversion method, which is applied to all hypothetical cumulative weights generated by a first-stage hypothesis generating unit from hypothetical cumulative weights.
請求項1又は2の何れかに記載の記号列変換方法において、
前記仮説絞り込処理は、入力信号列が全て読み込まれた時点で、1段目の仮説生成部が生成した仮説の補正された累積重みの中の特異値を呈する累積重みを持つ仮説を抽出する仮説抽出処理と、この仮説抽出処理で抽出した仮説を次段の仮説生成部の入力記号列として入力する入力処理とを含み、これら仮説抽出処理と入力処理とを各仮説生成部に対して実行して前記1段目の仮説生成部が生成した仮説からM段目の仮説生成部が生成した仮説の全ての中から補正された累積重みの特異値によって指定される仮説を選択し、M段目の仮説生成手段が生成した仮説の中から前記仮説抽出処理で抽出した仮説をもって記号列変換結果として出力することを特徴とする記号列変換方法。
In the symbol string conversion method according to claim 1 or 2,
The hypothesis narrowing-down process extracts hypotheses having cumulative weights exhibiting singular values among the corrected cumulative weights of hypotheses generated by the first-stage hypothesis generation unit when all input signal sequences are read. It includes a hypothesis extraction process and an input process that inputs the hypothesis extracted by this hypothesis extraction process as an input symbol string of the hypothesis generation section in the next stage, and executes these hypothesis extraction processes and input processes for each hypothesis generation section The hypothesis designated by the singular value of the accumulated weight corrected from the hypotheses generated by the M-th hypothesis generation unit is selected from the hypotheses generated by the first-stage hypothesis generation unit. A symbol string conversion method characterized in that a hypothesis extracted by the hypothesis extraction process is output as a symbol string conversion result from the hypotheses generated by the eye hypothesis generation means.
記号列を順に読み込む記号列入力部と、状態遷移規則によって入力された記号列を他の記号列の候補となる仮説に変換する3個以上M個の縦続接続された仮説生成部を備えた記号列変換部と、この記号列変換部が出力する変換結果を取り込む記号列出力部とを備えて構成される記号列変換装置であって、
前記M個の縦続接続された仮説生成部のそれぞれに対応して、各仮説生成部で生成した各々の仮説に付与された累積重みを各後段の仮説生成部が生成する仮説のそれぞれに付与された累積重みの中の特異値により補正する仮説補正部と、仮説補正部で補正された累積重みを用いて不要な仮説を除去し、尤度の高い仮説に絞り込む仮説絞込み部とを備えることを特徴とする記号列変換装置。
A symbol having a symbol string input unit for sequentially reading symbol strings, and three or more cascaded hypothesis generation units that convert symbol strings input according to state transition rules into hypotheses that are candidates for other symbol strings A symbol string conversion device configured to include a string conversion unit and a symbol string output unit that captures a conversion result output from the symbol string conversion unit,
Corresponding to each of the M cascaded hypothesis generators, the cumulative weight assigned to each hypothesis generated by each hypothesis generator is assigned to each hypothesis generated by each subsequent hypothesis generator. A hypothesis correction unit that corrects by a singular value in the accumulated weight, and a hypothesis narrowing unit that removes unnecessary hypotheses using the accumulated weight corrected by the hypothesis correction unit and narrows down to a high likelihood hypothesis. Characteristic symbol string conversion device.
請求項4記載の記号列変換装置において、
上記仮説補正部は、各仮説生成部が生成した仮説に付与された累積重みを、次段の仮説生成部において生成される仮説のそれぞれに付与される累積重み乃至は補正された累積重みの中の特異値を呈する累積重みを用いて補正する重み補正手段と、この重み補正手段を前記記号列入力部から前記1段目の仮説生成部へ記号が入力される毎にM−1段目の仮説生成部が生成した仮説の累積重みから1段目の仮説生成部が生成した仮説の累積重みの全てに渡って補正させる繰返し制御手段とを備えることを特徴とする記号列変換装置。
In the symbol string conversion device according to claim 4,
The hypothesis correction unit includes the cumulative weight assigned to the hypothesis generated by each hypothesis generation unit, among the cumulative weights assigned to the hypotheses generated by the hypothesis generation unit in the next stage or the corrected cumulative weights. A weight correction unit that corrects using a cumulative weight that exhibits a singular value, and the weight correction unit performs the M-1 stage at each time a symbol is input from the symbol string input unit to the first stage hypothesis generation unit. A symbol string conversion device comprising: an iterative control unit that corrects over all of the cumulative weights of hypotheses generated by the first hypothesis generator from the cumulative weights of hypotheses generated by the hypothesis generator.
請求項4又は5の何れかに記載の記号列変換装置の何れかにおいて、
前記仮説絞込み部は、入力記号列が全て読み込まれた時点で、各仮説生成部が生成した仮説の補正された累積重みの中の特異値を呈する累積重みを持つ仮説を抽出する仮説抽出手段と、この仮説抽出手段が抽出した仮説を次段の仮説生成部の入力記号列として入力する入力処理手段とを備え、これら仮説抽出手段と入力処理手段とを1段目の仮説生成部からM段目の仮説生成部で動作させて前記1段目の仮説生成部が生成した仮説からM段目の仮説生成部が生成した仮説の全ての中から補正された累積重みの特異値によって指定される仮説を選択し、M段目の仮説生成部が生成した仮説の中から前記仮説抽出手段が抽出した仮説をもって記号列変換結果として出力することを特徴とする記号列変換装置。
In any of the symbol string conversion devices according to claim 4 or 5,
The hypothesis narrowing down unit is a hypothesis extracting unit that extracts a hypothesis having a cumulative weight that exhibits a singular value among the corrected cumulative weights of the hypotheses generated by each hypothesis generation unit when all of the input symbol strings are read. Input processing means for inputting the hypothesis extracted by the hypothesis extraction means as an input symbol string of the hypothesis generation section of the next stage, and these hypothesis extraction means and input processing means are connected to M stages from the hypothesis generation section of the first stage. It is specified by the singular value of the accumulated weight corrected from all hypotheses generated by the M-th hypothesis generation unit from the hypotheses generated by the first-stage hypothesis generation unit by operating in the hypothesis generation unit. A symbol string conversion device, wherein a hypothesis is selected, and a hypothesis extracted by the hypothesis extraction means is output as a symbol string conversion result from hypotheses generated by an M-th stage hypothesis generation unit.
入力音声信号からその音響特徴を表わす記号列を抽出する音響特徴記号列変換処理ステップを備え、この音響特徴記号列変換処理ステップで変換された音響特徴を表わす記号列を請求項1乃至3の何れかに記載の記号列変換方法により入力音声信号に対応する記号列に変換することを特徴とする音声認識方法。   4. An acoustic feature symbol string conversion processing step for extracting a symbol string representing the acoustic feature from the input speech signal, and the symbol string representing the acoustic feature converted in the acoustic feature symbol string conversion processing step. A speech recognition method, wherein the symbol sequence corresponding to the input speech signal is converted by the symbol sequence conversion method according to claim 1. 入力音声信号をその音響特徴を表す音響特徴記号列に変換し、その音響特徴を表す記号列から単語の系列に変換する請求項7記載の音声認識方法と、この音声認識方法で得られた単語の系列が文としてもっともらしい場合により小さな重みを与える第1仮説生成処理と、前記音声認識方法で得られた単語の系列を別の言語や様式の単語の系列に置き換える第2仮説生成処理と、その別の言語や様式の単語の系列が、その別の言語や様式の文としてもっともらしい場合により小さな重みを与える第3仮説生成処理とから成る3個以上の仮説生成処理を用いて音声信号を別の言語や様式の文に変換して記号列出力部から出力することを特徴とする音声言い換え方法。   8. A speech recognition method according to claim 7, wherein an input speech signal is converted into an acoustic feature symbol string representing the acoustic feature, and the symbol string representing the acoustic feature is converted into a sequence of words, and a word obtained by the speech recognition method. A first hypothesis generation process that gives a smaller weight when the sequence of words is plausible as a sentence, a second hypothesis generation process that replaces the word sequence obtained by the speech recognition method with a sequence of words in another language or style, The speech signal is generated using three or more hypothesis generation processes, in which the sequence of words in the other language or style is composed of a third hypothesis generation process that gives a smaller weight to a case that is likely to be a sentence of the other language or style. A speech paraphrasing method characterized by converting to a sentence in another language or style and outputting it from a symbol string output unit. コンピュータが解読可能なプログラム言語によって記述され、コンピュータに請求項4乃至6の何れかに記載の装置として機能させるプログラム。   A program that is described in a program language that can be read by a computer, and that causes the computer to function as the device according to any one of claims 4 to 6. コンピュータが読み取り可能な記録媒体によって構成され、この記録媒体に請求項9記載のプログラムを記録した記録媒体。   A recording medium comprising a computer-readable recording medium, wherein the program according to claim 9 is recorded on the recording medium.
JP2005254697A 2005-09-02 2005-09-02 Symbol string conversion method, speech recognition method, symbol string converter and program, and recording medium Active JP4478088B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005254697A JP4478088B2 (en) 2005-09-02 2005-09-02 Symbol string conversion method, speech recognition method, symbol string converter and program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005254697A JP4478088B2 (en) 2005-09-02 2005-09-02 Symbol string conversion method, speech recognition method, symbol string converter and program, and recording medium

Publications (2)

Publication Number Publication Date
JP2007066237A true JP2007066237A (en) 2007-03-15
JP4478088B2 JP4478088B2 (en) 2010-06-09

Family

ID=37928305

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005254697A Active JP4478088B2 (en) 2005-09-02 2005-09-02 Symbol string conversion method, speech recognition method, symbol string converter and program, and recording medium

Country Status (1)

Country Link
JP (1) JP4478088B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014081516A (en) * 2012-10-17 2014-05-08 Nippon Telegr & Teleph Corp <Ntt> Symbol string conversion method, voice recognition method using the same, device of symbol string conversion and voice recognition and program, and recording medium for the same
JP2015040864A (en) * 2013-08-20 2015-03-02 日本電信電話株式会社 Symbol string conversion method, speech recognition method, device therefor, and program
JP2015152661A (en) * 2014-02-12 2015-08-24 日本電信電話株式会社 Weighted finite state automaton creation device, symbol string conversion device, voice recognition device, methods thereof and programs

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014081516A (en) * 2012-10-17 2014-05-08 Nippon Telegr & Teleph Corp <Ntt> Symbol string conversion method, voice recognition method using the same, device of symbol string conversion and voice recognition and program, and recording medium for the same
JP2015040864A (en) * 2013-08-20 2015-03-02 日本電信電話株式会社 Symbol string conversion method, speech recognition method, device therefor, and program
JP2015152661A (en) * 2014-02-12 2015-08-24 日本電信電話株式会社 Weighted finite state automaton creation device, symbol string conversion device, voice recognition device, methods thereof and programs

Also Published As

Publication number Publication date
JP4478088B2 (en) 2010-06-09

Similar Documents

Publication Publication Date Title
JP4737990B2 (en) Vocabulary stress prediction
US10319373B2 (en) Information processing device, information processing method, computer program product, and recognition system
JP4769223B2 (en) Text phonetic symbol conversion dictionary creation device, recognition vocabulary dictionary creation device, and speech recognition device
JP5310563B2 (en) Speech recognition system, speech recognition method, and speech recognition program
JP4930379B2 (en) Similar sentence search method, similar sentence search system, and similar sentence search program
JP6580882B2 (en) Speech recognition result output device, speech recognition result output method, and speech recognition result output program
JP6453631B2 (en) Recognition system, recognition method and program
KR20200026295A (en) Syllable-based Automatic Speech Recognition
JP4289715B2 (en) Speech recognition apparatus, speech recognition method, and tree structure dictionary creation method used in the method
US20170270923A1 (en) Voice processing device and voice processing method
JP2010139745A (en) Recording medium storing statistical pronunciation variation model, automatic voice recognition system, and computer program
JP4478088B2 (en) Symbol string conversion method, speech recognition method, symbol string converter and program, and recording medium
JP2010164918A (en) Speech translation device and method
JP4595415B2 (en) Voice search system, method and program
JP4430964B2 (en) Symbol sequence conversion method, speech recognition method using the symbol sequence conversion method, symbol sequence conversion device, and speech recognition device using the symbol sequence conversion device
JP6235922B2 (en) Weighted finite state automaton creation device, symbol string conversion device, speech recognition device, method and program thereof
US8200478B2 (en) Voice recognition device which recognizes contents of speech
JP6023543B2 (en) Symbol string conversion method, speech recognition method using the same, apparatus and program thereof, and recording medium thereof
JP4733436B2 (en) Word / semantic expression group database creation method, speech understanding method, word / semantic expression group database creation device, speech understanding device, program, and storage medium
JP6568429B2 (en) Pronunciation sequence expansion device and program thereof
JP3950957B2 (en) Language processing apparatus and method
JP3440840B2 (en) Voice recognition method and apparatus
JP6300596B2 (en) Dictionary device, morpheme analyzer, data structure, morpheme analysis method and program
JP4379050B2 (en) Speech recognition apparatus, speech recognition speed-up method, and program
JP3369121B2 (en) Voice recognition method and voice recognition device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100302

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100312

R150 Certificate of patent or registration of utility model

Ref document number: 4478088

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130319

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350