JPS6365499A - Syntax recognition system - Google Patents

Syntax recognition system

Info

Publication number
JPS6365499A
JPS6365499A JP61211169A JP21116986A JPS6365499A JP S6365499 A JPS6365499 A JP S6365499A JP 61211169 A JP61211169 A JP 61211169A JP 21116986 A JP21116986 A JP 21116986A JP S6365499 A JPS6365499 A JP S6365499A
Authority
JP
Japan
Prior art keywords
syntax
keyword
syntactic
word spotting
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61211169A
Other languages
Japanese (ja)
Inventor
藤原 祥隆
菊池 英夫
修 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP61211169A priority Critical patent/JPS6365499A/en
Publication of JPS6365499A publication Critical patent/JPS6365499A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Abstract] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、構文認識方式に係り、詳しくは音声により入
力された自然言語文(例えば日本語文)の構文を、音声
パラメータ系列(特徴パラメータ系列)から直接認識す
る方式に関する。
[Detailed Description of the Invention] [Field of Industrial Application] The present invention relates to a syntax recognition method, and more specifically, the present invention relates to a syntax recognition method, and more specifically, the syntax of a natural language sentence (for example, a Japanese sentence) inputted by voice is recognized by a voice parameter series (feature parameter series). ).

〔従来の技術〕[Conventional technology]

従来、音声パラメータ列の段階で、入力された構文がな
にかを認識する手法としてキーワードスポツティング手
法が知られている。本手法は、構文候補を特徴づける単
語(キーワード)の音声パラメータ列(例えば、一定時
間間隔毎に入力音声信号をサンプリングして得た相関係
数の列)をあらかじめ辞書に登録しておき、入力された
音声パラメータ列とこれらのキーワードの音声パラメー
タ列を比較して評価点づけ(スコアリングという)を行
うことにより、入力音声パラメータ列中に着目するキー
ワードが存在するか否かを判定し、入力された構文を認
識するというものである。これについては、例えば、W
、A、Lec氏が”The Value of 5pe
ech Recognition Systems”と
題してTRENDS  IN 5PEECHRECOG
NITION、1980.PRENTICE−1−IA
LL、INC,pp、10−11で論じている。
Conventionally, a keyword spotting method is known as a method for recognizing input syntax at the stage of a speech parameter string. In this method, a string of audio parameters (for example, a string of correlation coefficients obtained by sampling the input audio signal at regular time intervals) of words (keywords) that characterize syntactic candidates is registered in advance in a dictionary, and the input By comparing the input voice parameter string with the voice parameter string of these keywords and performing evaluation points (scoring), it is determined whether or not the keyword of interest exists in the input voice parameter string, and the input voice parameter string is evaluated. It recognizes the syntax that is used. Regarding this, for example, W
, A. Lec wrote “The Value of 5pe”
ech Recognition Systems” TRENDS IN 5PEECHRECOG
NITION, 1980. PRENTICE-1-IA
Discussed in LL, INC, pp. 10-11.

以下に日本語による切符予約質問応答システムを想定し
て、キーワードスポツティング(以後。
The following is a keyword spotting (hereinafter referred to as ``keyword spotting'') assuming a ticket reservation question and answer system in Japanese.

単にワードスポツティングと記す)を用いた従来の構文
認識方式について説明する。
A conventional syntax recognition method using word spotting (simply referred to as word spotting) will be explained below.

第4図は従来の構文認識方式を適用した切符予約質問応
答システムを示したもので、こ\では説明の簡単化のた
め構文候補は“′切符予約希望″と″値段照合”の二つ
としている。システムはキーワー辞書1とワードスポツ
ティング部2と構文判定部:3からなる。キーワード辞
書1には各構文候補を特徴づけるキーワードに対応する
音声パラメータ列を予め登録しておく。ワードスポツテ
ィング部2は入力音声パラメータ列にふくまれているキ
ーワードの抽出を行う。構文判定部3はワードスポツテ
ィング部2で抽出したキーワードにもとづいて構文候補
を決定する。入力音声パラメータ列は、例えば入力音声
を一定周期でサンプリングして得た相関係数、LPGケ
プストラム等の列で示される。以下ワードスポツティン
グ部2を中心に第4図の動作を説明する。
Figure 4 shows a ticket reservation question-and-answer system that applies the conventional syntax recognition method.To simplify the explanation, we will assume that the two syntax candidates are "'ticket reservation request" and "price verification." There is. The system consists of a keyword dictionary 1, a word spotting section 2, and a syntax determining section 3. In the keyword dictionary 1, speech parameter strings corresponding to keywords characterizing each syntactic candidate are registered in advance. The word spotting section 2 extracts keywords included in the input speech parameter string. The syntax determining section 3 determines syntax candidates based on the keywords extracted by the word spotting section 2. The input audio parameter string is represented by a string of correlation coefficients, LPG cepstrum, etc. obtained by sampling the input audio at regular intervals, for example. The operation of FIG. 4 will be explained below, focusing on the word spotting section 2.

■ キーワード辞書1から、あるキーワードの音声パラ
メータ列を取り出しキーワードレジスタ23に設定する
(2) Take out the voice parameter string of a certain keyword from the keyword dictionary 1 and set it in the keyword register 23.

■ 対象とする入力音声パラメータ列の先頭からキーワ
ードレジスタ23に設定された音声パラメータ列の長さ
に等しい長さの音声パラメータ部分列を入力レジスタ2
2に設定し、キーワードスコアリング部24で両者の間
の照合を行い、類似度に対応したスコア(通常、距離計
算と呼ぶ計算により求めた値)を求め、その値を保持で
示される。R3は入力レジスタ22の位置jにあるパラ
メータ値、S、はキーワードレジスタ23の位置jにあ
るパラメータ値である。
■ An audio parameter partial string whose length is equal to the length of the audio parameter string set in the keyword register 23 from the beginning of the target input audio parameter string is input to the input register 2.
2, the keyword scoring unit 24 performs a comparison between the two, obtains a score corresponding to the degree of similarity (usually a value obtained by a calculation called distance calculation), and indicates that the value is retained. R3 is the parameter value at position j of the input register 22, and S is the parameter value at position j of the keyword register 23.

■ 上記■の操作を入力音声パラメータ列の部分列の開
始位置を一つずつずらしながら繰り返して実行し、入力
音声パラメータ列の全ての部分列と着目しているキーワ
ードの音声パラメータ列の間の類似度に関するスコアを
求め、その中の最良のスコアがある基準を満足するとき
に着目するキーワードが存在すると判定する。
■ Repeat the operation in ■ above while shifting the start position of the subsequences of the input audio parameter string one by one, and compare the similarities between all the subsequences of the input audio parameter string and the audio parameter string of the keyword of interest. A keyword of interest is determined to exist when the best score among them satisfies a certain criterion.

■ 上記■〜■の操作をキーワード辞書1に登録された
すべてのキーワードについて行い、入力音声パラメータ
列にふくまれているとみなされるキーワード候補を検出
する。
(2) The above operations (2) to (2) are performed for all keywords registered in the keyword dictionary 1 to detect keyword candidates that are considered to be included in the input voice parameter string.

■ 構文判定部3では構文毎にその構文を特徴づけるも
のとして予め与えられたキーワードセットの情報とワー
ドスポツティング部2により検出されたキーワードのセ
ットを比較し、予め指定された基準(例えば、指定され
たキーワードの50%が存在する等)を満足する構文候
補を選択し出力する。
■ The syntax determination unit 3 compares the keyword set information given in advance to characterize each syntax with the set of keywords detected by the word spotting unit 2, and uses prespecified criteria (for example, specified 50% of the specified keywords exist) are selected and output.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

上記従来の構文認識方式においては、着目する構文候補
の数が多くなると辞書に9.録するキーワード数が増し
、これに伴い類似の特徴パラメータをもつキーワードが
増す。このため、キーワードスコアリング部では、対象
とする入力文中に着目する単語が存在しないのに存在す
ると検出したり、或いはある単語を他の単Jiと取り違
えて認識するなどの誤りが増加するとNもに、これらの
誤りは構文間にまたがって起こるため、構文を正しく認
識する確率(こへではこれを構文認識性能と呼ぶ)が低
下する欠点がある。
In the conventional syntax recognition method described above, when the number of target syntax candidates increases, 9. The number of keywords to be recorded increases, and the number of keywords with similar characteristic parameters increases accordingly. For this reason, the keyword scoring unit may increase the number of errors such as detecting that a word of interest exists in the target input sentence when it does not exist, or mistaking a word for another simple word and recognizing it. Moreover, since these errors occur across syntax, the probability of correctly recognizing the syntax (herein referred to as syntax recognition performance) decreases.

また、上述した構文認識方式は、 ■基本的にはキーワ
ードの有無を問題とするディジタル的検出方法をとるた
め、着目している構文候補がどの程度入力文に似ている
かという類似の程度を扱えない、 ■キーワードの出現
位置、或いはキーワードの出現順序等の構文を特徴づけ
る情報に着目していないことにより、キーワードは同じ
であるがその順序が異なる構文候補間の区別がつかない
(例  ・並を飢したい、  ・ゴ」ケした左目王を取
消したい)等のため、類似な表現を含む多数の構文候補
の中から正解構文を精度良く同定することは困難と考え
られる。実際、本技術を構文の予備的選択手段として位
置付けている文献がある。
In addition, the syntax recognition method described above basically uses a digital detection method that deals with the presence or absence of keywords, so it cannot deal with the degree of similarity of the syntax candidate being focused on to the input sentence. No, ■By not focusing on information that characterizes the syntax, such as the position of the keywords or the order in which the keywords appear, it is difficult to distinguish between syntactic candidates that have the same keywords but different orders (e.g., It is considered difficult to accurately identify the correct sentence from a large number of sentence candidates including similar expressions. In fact, there are documents that position the present technique as a means for preliminary selection of syntax.

(例えば、新見著、″音声認識″、共立出版、p本発明
の目的は、構文候補の多少によらず一定水準の構文認識
性能を維持でき、しかも類似な表現を含む多数の構文候
補の中から正解構文候補を精度良く検出することを可能
とする新しい構文認識方式を提供することにある。
(For example, Niimi, "Speech Recognition," Kyoritsu Shuppan, p.) The purpose of the present invention is to maintain a certain level of syntactic recognition performance regardless of the number of syntactic candidates, and to recognize a large number of syntactic candidates including similar expressions. The purpose of this invention is to provide a new syntax recognition method that enables accurate detection of correct syntax candidates from among them.

〔問題点を解決するための手段及び作用〕本発明の構文
認識方式の主要構成要素は、キーワード辞書と、当該辞
書を用いるワードスポツティング部と、入力文と構文候
補の類似性を数量的に評価するスコアリング部とからな
る。
[Means and effects for solving the problem] The main components of the syntax recognition method of the present invention are a keyword dictionary, a word spotting unit that uses the dictionary, and a quantitative method for determining the similarity between an input sentence and syntactic candidates. It consists of a scoring section that performs evaluation.

キーワード辞書は構文候補単位に排他的に、かつ同じ構
文候補内においても該構文候補を特徴づけるキーワード
カテゴリ単位に排他的に分割して構成される。ワードス
ポツティング部は、当該キーワードカテゴリ単位に、そ
のカテゴリに登録されたキーワードと入力音声パラメー
タ列との間でワードスポツティングを行う。その結果、
ワードスポツティングで使用する辞書の規模は構文候補
の数とは無関係にはシ一定となるため、これにより一定
水準の構文認識性能が維持される。さらにキーワード辞
書は上記のような排他性を有するため、ワードスポツテ
ィングにおける誤りの影響は、ある特定のキーワード辞
書内すなわち構文候補を特徴とする特定キーワードカテ
ゴリの範囲内に限定され、その結果、誤りは高々その構
文のスコアの多少に反映されるだけに局所化される。
The keyword dictionary is constructed by dividing it exclusively into syntax candidate units, and even within the same syntax candidate, into keyword categories that characterize the syntax candidate. The word spotting section performs word spotting for each keyword category between the keyword registered in that category and the input voice parameter string. the result,
Since the size of the dictionary used in word spotting remains constant regardless of the number of syntactic candidates, a certain level of syntactic recognition performance is maintained. Moreover, because keyword dictionaries have the above-mentioned exclusivity, the impact of errors in word spotting is limited to a specific keyword dictionary, i.e., within a specific keyword category characterized by syntactic candidates; At most, it is localized to the extent that it is reflected in the score of that construct.

また、構文スコアリング部は、各構文候補に関し、どの
キーワードがあるべきか、各キーワードはどの範囲にあ
るべきか、各キーワードの出現順序はどうあるべきか、
といった構文知識が予め与えられており、これらの知識
に基づいてワードスポツティング部で計算されたキーワ
ードのスコア値(アナログ値)を加重加算する。さらに
構文候補の違いによるキーワード個数の違いを考慮し、
得られたスコア値と当該構文について到達可能なスコア
の上限値との相対比(正規化されたスコア値)をとり、
これを着目する構文候補のスコア値とする。このような
特徴を持った構文スコアリング法を導入することにより
、類似な表現を含む多数の構文候補の中から正解を精度
良く検出することが可能となる。
In addition, the syntax scoring unit determines which keywords should be included in each syntactic candidate, what range each keyword should be in, what order the keywords should appear in,
Syntactic knowledge such as this is given in advance, and the keyword score values (analog values) calculated by the word spotting unit are weighted and added based on this knowledge. Furthermore, considering the difference in the number of keywords due to differences in syntax candidates,
Take the relative ratio (normalized score value) between the obtained score value and the upper limit of the score that can be achieved for the relevant construct,
This is taken as the score value of the syntax candidate of interest. By introducing a syntactic scoring method with such characteristics, it becomes possible to accurately detect the correct answer from among a large number of syntactic candidates containing similar expressions.

〔実施例〕〔Example〕

以下、本発明の一実施例について図面により説明する。 An embodiment of the present invention will be described below with reference to the drawings.

なお、以下の実施例でも日本語による切符予約質問応答
システムを想定して、構文候補は゛′切切符予約希望上
″値段照会″の二つとし、第4図と同じ例を使用するこ
とにする。
In addition, in the following example, assuming a ticket reservation question and answer system in Japanese, the two syntax candidates are ``ticket reservation request'' and ``price inquiry'', and the same example as in Fig. 4 will be used. .

第1図は本発明の一実施例のシステム構成を示す。本構
文認識システムは、キーワードが登録されたキーワード
辞書部1、ワードスポツティングを行うワードスポツテ
ィング部2、各構文候補のスコアを計算し、最良スコア
の構文候補を選択する構文スコアリング・判定部3より
構成される。
FIG. 1 shows a system configuration of an embodiment of the present invention. This syntax recognition system consists of a keyword dictionary section 1 in which keywords are registered, a word spotting section 2 that performs word spotting, and a syntax scoring/judgment section that calculates the score of each syntax candidate and selects the syntax candidate with the best score. Consists of 3.

キーワード辞書1は第2図に示すように、構文候補毎に
、また構文候補内ではその構文を特徴付けるキーワード
カテゴリ毎に相互に排他的に構成される。即ち、第1図
の実施例では、切符予約を希望する構文候補に関しては
、予約希望の意思表示を表すキーワードを集めた゛′予
約希望″′カテゴリと、切符を意味するキーワードをあ
つめた″切符″カテゴリの2種類のキーワード辞書11
,12が構成される。これは、例えば「チケットを予約
したい」という構文の入力を想定している。同様にして
、値段を照会する構文候補に関しては、値段照会の意思
表示を表すキーワードをあつめた゛′照会″カテゴリと
、値段を表すキーワードをあつめた″値段″カテゴリの
2種類のキーワード辞書1.3.14が構成される。こ
れは、例えば「A席の値段を知りたい」という構文の検
出を想定したものである。
As shown in FIG. 2, the keyword dictionary 1 is constructed mutually exclusively for each syntax candidate and, within a syntax candidate, for each keyword category that characterizes the syntax. That is, in the embodiment shown in FIG. 1, regarding the syntactic candidates for requesting ticket reservation, there are two categories: ``reservation request'' which is a collection of keywords representing the intention to reserve a ticket, and ``ticket'' which is a collection of keywords meaning tickets. Two categories of keyword dictionaries 11
, 12 are configured. This assumes that, for example, the syntax "I would like to reserve a ticket" is input. Similarly, regarding syntactic candidates for price inquiries, there are two types of keyword dictionaries: the ``inquiry'' category, which collects keywords expressing the intention to inquire about prices, and the ``price'' category, which collects keywords expressing prices.1.3 .14 is constructed.This is intended to detect, for example, the sentence "I want to know the price of seat A."

ワードスポツティング部2は、ワードスポツティングの
単位であるキーワードカテゴリを選択する選択回路21
、入力音声パラメータ列の部分列を設定する入力レジス
タ22、辞書1に登録されているキーワードの音声パラ
メータ列を設定するキーワードレジスタ23、キーワー
ドレジスタ23に設定されたキーワードに対し、最も類
似した部分列を入力音声パラメータ列からみつけ、その
スコアを保持するキーワードスコアリグ部24よりなる
。このワードスポツティング部2では、選択回路21が
順次キーワードカテゴリを一つずつ選択し、キーワード
スコアリグ部24が当該カテゴリに登録されている全て
のキーワードに関しワードスポツティングを行い、それ
らのスコアを保持する。なお、ワードスポツティングの
方法は第4図の従来技術で説明したと同じ方法を使用す
る。
The word spotting unit 2 includes a selection circuit 21 that selects a keyword category, which is a unit of word spotting.
, an input register 22 that sets a subsequence of an input voice parameter string, a keyword register 23 that sets a voice parameter string of keywords registered in the dictionary 1, and a subsequence most similar to the keyword set in the keyword register 23. It consists of a keyword score rig unit 24 that finds the keyword from the input voice parameter string and holds the score. In this word spotting section 2, a selection circuit 21 sequentially selects keyword categories one by one, and a keyword scoring section 24 performs word spotting on all keywords registered in the category and holds their scores. do. Note that the word spotting method is the same as that described in connection with the prior art shown in FIG.

構文スコアリング・判定部3は、上述のように各構文毎
に、どのキーワードがあるべきか、各キーワードはどの
範囲に存在すべきか、各キーワードの出現順序はどうあ
るべきか、といった構文を特徴付ける情報(構文知識)
が予め与えられており、その動作は以下のようになる。
As described above, the syntax scoring/judgment unit 3 characterizes the syntax for each syntax, such as which keyword should exist, in what range should each keyword exist, and what order should each keyword appear in? Information (syntax knowledge)
is given in advance, and its operation is as follows.

まず最初の構文候補(この場合は、切符予約希望)に着
目し、指定されたキーワードカテゴリ(予約希望、切符
)に関し計算されたスコア値をキーワードスコアリグ部
24より読み取る。つぎに、与えられた構文知識にノ、
(づき、これらのスコア値を加重加算する。
First, focusing on the first syntax candidate (in this case, ticket reservation request), the keyword score rig unit 24 reads the score value calculated for the specified keyword category (reservation request, ticket). Next, given syntactic knowledge,
(Then, these score values are weighted and added.

例えば、(ΣW1j−w2j−Aj)  ・W3のよう
な加重計算を行う。こ−で、Ajはキーワードカテゴリ
jのスコア、Wljはキーワードカテゴリjが構文決定
要因としてもつ重み(例えば、Wl 1 = 1 、 
Wl 2=0.5)、W2jはキーワードカテゴリjが
検出された位置に関する重み(例えば、指定範囲で検出
されたときはw2j=1、指定範囲外のときはW2j=
0.3)、W3はキーワードの順序に関する重み(例え
ば、検出されたキーワードが指定順序にあるときW3=
1、指定順序にないときW3=0.2)である。さらに
得られた加重加算結果と当該構文候補に関する加重加算
結果の到達可能な上限値との相対比をとり、これを当該
構文候補の構文スコアとするにれらの操作をすべての構
文候補について実行し、各構文候補の構文スコアを求め
る。最後にこれらの構文スコアの中で最良のスコアを持
つ構文候補を選び、正解構文候補として出力する。
For example, a weighted calculation such as (ΣW1j-w2j-Aj)/W3 is performed. Here, Aj is the score of keyword category j, and Wlj is the weight that keyword category j has as a syntactic determining factor (for example, Wl 1 = 1,
Wl 2 = 0.5), W2j is the weight related to the position where keyword category j is detected (for example, w2j = 1 when detected within the specified range, W2j = when outside the specified range
0.3), W3 is the weight related to the order of keywords (for example, when the detected keywords are in the specified order, W3=
1, when it is not in the designated order, W3 = 0.2). Furthermore, calculate the relative ratio between the obtained weighted addition result and the reachable upper limit of the weighted addition result for the relevant syntax candidate, and use this as the syntactic score of the relevant syntax candidate. Perform these operations for all syntax candidates. Then, calculate the syntactic score for each syntactic candidate. Finally, the syntax candidate with the best score among these syntax scores is selected and output as the correct syntax candidate.

第3図に本発明の他の実施例のシステム構成を示す。上
記第1図の構成の場合、計算時間ははシワ−トスボッテ
ィング処理で支配される。第3図は、このワードスポツ
ティング処理の高速化を図ったものである。即ち、第3
図は第1図のワードスポツティング処理をキーワードカ
テゴリ単位に並列化したものであり、これにともない第
1図の選択回路21が除去されている。また、構文スコ
アリングを構文候補について並列に行うことを目的に、
第1−図の構文スコアリング・判定部3は構文スコアリ
ング部61.62と構文判定部7に機能を分割している
FIG. 3 shows a system configuration of another embodiment of the present invention. In the case of the configuration shown in FIG. 1, the calculation time is dominated by the wrinkle botting process. FIG. 3 shows an attempt to speed up this word spotting process. That is, the third
The figure shows the word spotting process of FIG. 1 parallelized for each keyword category, and the selection circuit 21 of FIG. 1 has been removed accordingly. In addition, with the aim of performing syntactic scoring on syntactic candidates in parallel,
The syntax scoring/judgment unit 3 shown in FIG. 1 has functions divided into a syntax scoring unit 61, 62 and a syntax determination unit 7.

第3図において、ワードスポツティングおよび構文スコ
アリングは第1図と同様に行うが、入力音声パラメータ
列に対して、ワードスポツティング51〜54では割当
られたキーワードカテゴリに関してそれぞれ並列にワー
ドスポツティング処理を行い、得られたキーワードのス
コアをそれぞれキーワードスコアリング部に保持する。
In FIG. 3, word spotting and syntactic scoring are performed in the same manner as in FIG. The obtained keyword scores are stored in the keyword scoring section.

次に構文スコアリング部61.62はそれぞれ並列に、
指定されたキーワードカテゴリに関するスコア値を対応
するキーワードスコアリング部より読みだし、加重加算
、正規化処理を行い構文スコアを求める。最後に構文判
定部7は各構文候補について得られた構文スコアの中の
最良スコアを示す構文候補を選択し、これを正解として
出力する。
Next, the syntax scoring units 61 and 62 respectively perform in parallel,
The score value related to the specified keyword category is read from the corresponding keyword scoring section, weighted addition and normalization processing are performed to obtain the syntax score. Finally, the syntax determining unit 7 selects the syntax candidate with the best score among the syntax scores obtained for each syntax candidate, and outputs this as the correct answer.

なお、第3図の考えを発展させることにより、ワードス
ポツティング部は最大、各ワードスポツティング部がキ
ーワード1個を分担する個数まで並列化可能であり、ワ
ードスポツティング処理をさらに高速化することが可能
になる。
Furthermore, by developing the idea shown in Figure 3, it is possible to parallelize the word spotting sections up to the maximum number of word spotting sections in which each word spotting section shares one keyword, further speeding up the word spotting process. becomes possible.

〔発明の効果〕〔Effect of the invention〕

以上説明したように、本発明によれば、排他的に分割し
構成したキーワード辞書を用することによ、ワードスポ
ツティングで使用する辞書の規模は構文候補の数とは無
関係にはシ一定となり、これにより一定水準の構文認識
性能が維持される。
As explained above, according to the present invention, by using a keyword dictionary that is exclusively divided and configured, the size of the dictionary used in word spotting remains constant regardless of the number of syntactic candidates. , this maintains a certain level of syntactic recognition performance.

さらにキーワード辞書の排他性により、ワードスポツテ
ィングにおける誤りの影響が特定のキーワードカテゴリ
の範囲内に限定されるため、誤りが高々その構文のスコ
アの多少に反映されるだけに局所化され、誤りに対しフ
ェールセーフなシステムとなる。
Furthermore, the exclusivity of keyword dictionaries limits the impact of errors in word spotting to within a particular keyword category, making errors more or less localized and more or less reflected in the syntax score. It becomes a fail-safe system.

また、構文知識に基づくキーワードのスコア値の加重加
算と、構文候補毎のスコア上限値による加重加算結果の
正規化により、類似な表現を含む多数の構文候補から正
解構文を精度良く検出することが可能となる。さらに、
このように精度の良い構文認識が可能となると、構文解
析、意味解析等の自然言語処理技術の利用を著しく簡略
化でき或いは不要とすることができるため、情報処理装
置の音声を用いるマンマシンインターフェイスを経済的
にかつ能率良く(構文認識の高速化)構成できる。
In addition, by weighted addition of keyword score values based on syntactic knowledge and normalization of the weighted addition results using the upper limit of the score for each syntax candidate, it is possible to accurately detect the correct syntax from a large number of syntax candidates including similar expressions. It becomes possible. moreover,
If highly accurate syntax recognition becomes possible in this way, the use of natural language processing techniques such as syntactic analysis and semantic analysis can be significantly simplified or even made unnecessary. can be configured economically and efficiently (speeding up syntax recognition).

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の構文認識方式の一実施例を示す図、第
2図は本発明によるキーワード辞書構成を説明するため
の図、第3図は本発明の構文J、2識方式の他の実施例
を示す図、第4図はワードスポツティングを用いた従来
の構文認識方式を説明するための図である。 1・・・キーワード辞書、  2・・・ワードスポツテ
ィング部、  3・・・構文スコアリング・判定部、5
1〜54・・・ワードスポツティング部。 61.62・・・構文スコアリング部。 7・・・構文判定部。 第2図 キーワードカテゴリ
FIG. 1 is a diagram showing an embodiment of the syntax recognition method of the present invention, FIG. 2 is a diagram for explaining the keyword dictionary structure according to the present invention, and FIG. 3 is a diagram showing an embodiment of the syntax recognition method of the present invention. FIG. 4 is a diagram for explaining a conventional syntax recognition method using word spotting. 1...Keyword dictionary, 2...Word spotting section, 3...Syntax scoring/judgment section, 5
1-54...Word spotting section. 61.62...Syntax scoring section. 7...Syntax determination section. Figure 2 Keyword categories

Claims (4)

【特許請求の範囲】[Claims] (1)音声により入力された自然言語文の構文を、音声
パラメータ列から直接認識する方式において、キーワー
ドを特徴づける音声パラメータ列を格納したキーワード
辞書部と、入力音声パラメータ列と当該キーワード辞書
に格納された音声パラメータ列を照合し、該音声パラメ
ータ列が存在する確からしさを表すスコアを計算するワ
ードスポッティング部と、該ワードスポッティング部に
より計算された各キーワードのスコアと認識対象とする
構文候補について予め指定されたキーワードとに基づき
構文候補が存在するか否かを評価する構文スコアリング
部とを備え、前記キーワード辞書部は、構文候補を特徴
づけるキーワードカテゴリ単位に分割し構成するとゝも
に、各々のキーワードカテゴリにはそのカテゴリの属す
るキーワードの音声パラメータ列を格納し、前記ワード
スポッティング部は、該キーワードカテゴリを単位にワ
ードスポッティング処理を行うことを特徴とする構文認
識方式。
(1) In a method that directly recognizes the syntax of a natural language sentence input by voice from a voice parameter string, a keyword dictionary section stores a voice parameter string characterizing the keyword, and the input voice parameter string and the keyword dictionary are stored. A word spotting unit that collates the voice parameter strings and calculates a score representing the probability that the voice parameter string exists; and a syntactic scoring unit that evaluates whether or not a syntactic candidate exists based on a specified keyword, and the keyword dictionary unit divides and configures the syntactic candidates into keyword categories that characterize the syntactic candidates. A syntax recognition method characterized in that a keyword category stores a voice parameter string of a keyword to which the category belongs, and the word spotting section performs word spotting processing for each keyword category.
(2)前記構文スコアリング部は、キーワードカテゴリ
の種別、出現順序ならびに出現範囲に関する構文知識に
基づき、構文候補を特徴づけるキーワードカテゴリのス
コアを加重加算することにより構文候補の存在の確から
しさを表す構文スコアを求めることを特徴とする特許請
求の範囲第1項記載の構文認識方式。
(2) The syntactic scoring unit expresses the probability of the existence of the syntactic candidate by adding weighted scores of keyword categories that characterize the syntactic candidate, based on syntactic knowledge regarding the type of keyword category, order of appearance, and range of appearance. The syntax recognition method according to claim 1, characterized in that a syntax score is determined.
(3)前記構文スコアリング部は、構文候補を特徴づけ
るキーワードカテゴリのスコアに基づき求めた構文候補
の存在の確からしさを表す構文スコアを、該構文スコア
の到達可能な上限値により正規化した相対値を、該構文
の構文スコアとすることを特徴とする特許請求の範囲第
1項記載の構文認識方式。
(3) The syntax scoring unit calculates a syntax score representing the probability of the existence of the syntax candidate obtained based on the score of a keyword category characterizing the syntax candidate, and calculates the relative 2. The syntax recognition method according to claim 1, wherein the value is a syntax score of the syntax.
(4)前記ワードスポッティング部は、構文候補を特徴
づける前記キーワードカテゴリ単位に少なくとも1個を
備え、着目する入力音声パラメータ列に対して、並列に
ワードスポッティング処理を行うことを特徴とする特許
請求の範囲第1項記載の構文認識方式。
(4) The word spotting unit is provided with at least one word spotting unit for each of the keyword categories characterizing syntactic candidates, and performs word spotting processing in parallel on input speech parameter sequences of interest. The syntax recognition method described in Scope 1.
JP61211169A 1986-09-08 1986-09-08 Syntax recognition system Pending JPS6365499A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61211169A JPS6365499A (en) 1986-09-08 1986-09-08 Syntax recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61211169A JPS6365499A (en) 1986-09-08 1986-09-08 Syntax recognition system

Publications (1)

Publication Number Publication Date
JPS6365499A true JPS6365499A (en) 1988-03-24

Family

ID=16601552

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61211169A Pending JPS6365499A (en) 1986-09-08 1986-09-08 Syntax recognition system

Country Status (1)

Country Link
JP (1) JPS6365499A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04167176A (en) * 1990-10-31 1992-06-15 Nec Corp Speech recognition device
WO2000054180A1 (en) * 1999-03-05 2000-09-14 Cai Co., Ltd. System and method for creating formatted document on the basis of conversational speech recognition
JP2007057844A (en) * 2005-08-24 2007-03-08 Fujitsu Ltd Speech recognition system and speech processing system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04167176A (en) * 1990-10-31 1992-06-15 Nec Corp Speech recognition device
WO2000054180A1 (en) * 1999-03-05 2000-09-14 Cai Co., Ltd. System and method for creating formatted document on the basis of conversational speech recognition
JP2007057844A (en) * 2005-08-24 2007-03-08 Fujitsu Ltd Speech recognition system and speech processing system

Similar Documents

Publication Publication Date Title
CN108711422B (en) Speech recognition method, speech recognition device, computer-readable storage medium and computer equipment
CN105723449B (en) speech content analysis system and speech content analysis method
JP3488174B2 (en) Method and apparatus for retrieving speech information using content information and speaker information
US8321218B2 (en) Searching in audio speech
CN112256845B (en) Intention recognition method, apparatus, electronic device, and computer-readable storage medium
US20230069935A1 (en) Dialog system answering method based on sentence paraphrase recognition
KR20170088164A (en) Self-learning based dialogue apparatus for incremental dialogue knowledge, and method thereof
US20070185712A1 (en) Method, apparatus, and medium for measuring confidence about speech recognition in speech recognizer
US20100217596A1 (en) Word spotting false alarm phrases
US20130289987A1 (en) Negative Example (Anti-Word) Based Performance Improvement For Speech Recognition
CN101650886A (en) Method for automatically detecting reading errors of language learners
JPWO2010044123A1 (en) Search device, search index creation device, and search system
CN115457966B (en) Pig cough sound identification method based on improved DS evidence theory multi-classifier fusion
Gandhe et al. Using web text to improve keyword spotting in speech
CN109189907A (en) A kind of search method and device based on semantic matches
JP5897718B2 (en) Voice search device, computer-readable storage medium, and voice search method
JP5099367B2 (en) Request content identification system, request content identification method and program in natural language
JPS6365499A (en) Syntax recognition system
JP2002278579A (en) Voice data retrieving device
JP4244423B2 (en) Proper word string estimation device
JP2005275348A (en) Speech recognition method, device, program and recording medium for executing the method
KR100298177B1 (en) Method for construction anti-phone model and method for utterance verification based on anti-phone medel
US11551666B1 (en) Natural language processing
Shah et al. Cross-lingual and multilingual spoken term detection for low-resource Indian languages
JP2003308094A (en) Method for correcting recognition error place in speech recognition