JPH04112269A - Lattice searching system using difference of similarity between recognitive candidate - Google Patents

Lattice searching system using difference of similarity between recognitive candidate

Info

Publication number
JPH04112269A
JPH04112269A JP2231499A JP23149990A JPH04112269A JP H04112269 A JPH04112269 A JP H04112269A JP 2231499 A JP2231499 A JP 2231499A JP 23149990 A JP23149990 A JP 23149990A JP H04112269 A JPH04112269 A JP H04112269A
Authority
JP
Japan
Prior art keywords
candidate
search
lattice
difference
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2231499A
Other languages
Japanese (ja)
Inventor
Kimu Kiyun Ho Rooken
ローケン・キム・キュン・ホ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2231499A priority Critical patent/JPH04112269A/en
Publication of JPH04112269A publication Critical patent/JPH04112269A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To search a correct word from a candidate lattice at a short time by using a lattice searching system using the difference of the similarity between the recognitive candidates. CONSTITUTION:When the difference of the similarity between the first candidate and the second candidate is more than 150, the recognitive candidates are divided into two groups 2 and 3 of the first candidate and the second candidate. When the difference of the similarity is less than 150, the candidates are divided into two groups 1 and 4 of the first candidate, and the second candidate, and the third candidate. Then, a vertical search or a horizontal search are executed in the groups, and when the candidates of input sentences can not be searched, a candidate lattice 5 to be searched is put from the next group 3 into the group whose difference is the minimum among the groups 2. Thus, correct candidate sentences or the correct words can be searched in the short time from the candidate lattice prepared by a recognizing device.

Description

【発明の詳細な説明】 〔概要〕 音声認識装置、或いは、文字認識装置が認識結果として
生成する、例えば、候補単語ラティス。
DETAILED DESCRIPTION OF THE INVENTION [Summary] For example, a candidate word lattice is generated as a recognition result by a speech recognition device or a character recognition device.

或いは、候補文字ラティス等から、候補文、或いは、候
補単語を順次生成する為の探索方式に関し、正解候補文
、或いは、正解単語を候補ラティスから短時間で探索す
ることができる候補探索方式を提供することを目的とし
、 入力単語、或いは、入力文に対して、認識装置が認識結
果とする候補単語、或いは、候補文字の第一位と第二位
の類似度の差を計算し、その差がある特定の数(例えば
、150)より大きい場合は、認識候補の第一候補と、
それ以外との二つのグループ■、■に分け、その差が上
記特定の数より小さい場合は、認識候補を第一、第二候
補と、第三候補以下の二つのグループ■、■に分け、上
記グルー10〜0間、及びグループ内において、縦型探
索、或いは、横型探索を実行し、上記探索処理で、入力
単語、或いは、入力文に対する候補単語。
Alternatively, regarding a search method for sequentially generating candidate sentences or candidate words from a candidate character lattice, etc., the present invention provides a candidate search method that can search for correct candidate sentences or words from a candidate lattice in a short time. With the aim of If the number is larger than a certain number (for example, 150), the first recognition candidate,
Divide the recognition candidates into two groups ■ and ■ with other candidates, and if the difference is smaller than the above specified number, divide the recognition candidates into the first and second candidates and two groups below the third candidate ■ and ■. A vertical search or a horizontal search is performed between the glues 10 and 0 and within the group, and the search process finds candidate words for the input word or input sentence.

或いは、候補文が探索できない場合には、上記第一候補
と、第二候補の類似度の差が、上記特定数以下のグルー
プ■の内、一番手さいグループ■に、次のグループ■か
ら候補ラティス■を探索対象に組み入れて、入力単語、
或いは、入力文を探索するように構成する。
Alternatively, if a candidate sentence cannot be searched, a candidate from the next group ■ is selected from among the groups ■ in which the difference in similarity between the first candidate and the second candidate is less than or equal to the specified number. Incorporating the lattice■ into the search target, input words,
Alternatively, it is configured to search for input sentences.

〔産業上の利用分野] 本発明は、音声認識装置、或いは、文字認識装置が認識
結果として生成する、例えば、候補単語ラティス、或い
は、候補文字ラティス等から、候補文、或いは、候補単
語を順次生成する為の探索方式に関する。
[Industrial Application Field] The present invention is a method for sequentially generating candidate sentences or candidate words from, for example, a candidate word lattice or a candidate character lattice generated as a recognition result by a speech recognition device or a character recognition device. Regarding the search method for generation.

従来から実用化が図られている音声認識装置や文字認識
装置は、人間と機械とのインタフェースを、人間にとっ
て親しみ易いものにするものであるが、その場合には、
認識精度を向上させて、人間が認識誤りを訂正する手間
を少なくすることが必要とされる。
Speech recognition devices and character recognition devices, which have been put into practical use for a long time, make the interface between humans and machines more familiar to humans, but in that case,
It is necessary to improve recognition accuracy and reduce the effort required by humans to correct recognition errors.

これまでの、例えば、音声認識装置においては、登録で
きる音声としては、′0゛ 〜゛9“迄の数字と、数百
側の単語程度であったが、最近の計算機システムの処理
能力の向上に伴い、該音声認識装置の認識性能が向上し
、登録できる単語等の数が多くなってきた為、該音声認
識装置が出力するラティスを構成する候補(要素ともい
う)の数も多くなってきたことから、該音声認識システ
ムにおいては、効率よく候補文、或いは、候補単語を生
成して表示することが要求される。
In the past, for example, in voice recognition devices, the voices that could be registered were numbers from '0゛ to '9'' and words in the hundreds, but with the improvement in the processing power of recent computer systems. Along with this, the recognition performance of the speech recognition device has improved and the number of words that can be registered has increased, so the number of candidates (also called elements) that make up the lattice output by the speech recognition device has also increased. Therefore, the speech recognition system is required to efficiently generate and display candidate sentences or candidate words.

又、該音声認識装置、或いは、文字認識装置が認識結果
として生成する候補単語ラティス、或いは、候補文字ラ
ティス等から、候補文、或いは、候補単語を順次生成す
る探索方式は、音声入力ワードプロセッサや1手書き文
字入力ワードプロセッサの要素技術となるものである為
、そのマンマシンインタフェースを向上させる為にも、
上記の如く、効率よく候補文、或いは、候補単語を生成
して表示することが必要とされる。
Furthermore, a search method for sequentially generating candidate sentences or candidate words from a candidate word lattice or a candidate character lattice generated as a recognition result by the speech recognition device or character recognition device is a method using a voice input word processor or a Since it is an elemental technology of handwritten character input word processor, in order to improve its man-machine interface,
As mentioned above, it is necessary to efficiently generate and display candidate sentences or candidate words.

〔従来の技術と発明が解決しようとする課題〕第3図は
従来の音声認識/文字認識用の候補探索方式を説明する
図であり、(a)は文節単位のラティスの例を示し、(
b)は文字単位のラティスの例を示し、(c)は縦形優
先法による候補探索方式を示し、(d)は横形優先法に
よる候補探索方式を示している。
[Prior art and problems to be solved by the invention] FIG. 3 is a diagram explaining a conventional candidate search method for speech recognition/character recognition, in which (a) shows an example of a lattice in units of phrases;
b) shows an example of a character-by-character lattice, (c) shows a candidate search method based on the vertical format priority method, and (d) shows a candidate search method using the horizontal format priority method.

図示していない音声認識システム、或いは、文字認識シ
ステムでの認識装置では、例えば、辞書中に登録されて
いる単語1文字等との認識距離(類似度)を算出して、
最も距離の短いものから候補を選択し、入力された音声
、或いは、文字に対する認識結果として、(a) 、 
(b)図に示したようなラティスを出力する。ここで、
()内は各要素と入力との認識距離(類似度)である。
In a recognition device for a voice recognition system or a character recognition system (not shown), for example, the recognition distance (similarity) with a single character of a word registered in a dictionary is calculated,
The candidates with the shortest distance are selected, and the recognition results for the input speech or characters are (a);
(b) Output a lattice as shown in the figure. here,
The number in parentheses is the recognition distance (similarity) between each element and the input.

ラティスは、その区切りの単位から、文字単位のラティ
ス、単語単位のラティス、文節単位のラティス等がある
が、(a)図は、文節単位のラティスの例を示し、(b
)は文字単位のラティスの例を示している。
Depending on the unit of separation, there are lattices for characters, words, phrases, etc. Figure (a) shows an example of a lattice for phrases, and (b)
) shows an example of a character-based lattice.

このラティスでは、横方向が左から右に時間の経過を表
しており、縦方向が上から下に候補の順位を表している
In this lattice, the horizontal direction represents the passage of time from left to right, and the vertical direction represents the ranking of candidates from top to bottom.

つまり、(a)図の例では、「あなたは」という入力に
対して、認識装置が「あなたと」である確度が一番高く
、次いで「あなたは」である確度が高い(以下、同様)
という認識結果を出力した結果を示している。同様に、
「本を」という入力に対して、認識装置が「本を」であ
る確度が一番高く、次いで「本も」である確度が高い(
以下、同様)という認識結果を出力した結果を示してい
る。
In other words, in the example shown in (a), for the input "you are", the recognition device has the highest probability of saying "with you", and the second highest probability of saying "you are" (the same applies hereafter).
This shows the result of outputting the recognition result. Similarly,
In response to the input "book," the recognition device has the highest probability of saying "book", followed by "book too" (
The same applies hereafter) is shown.

即ち、認識装置は、候補順位の一位に、必ずしも、正解
を含めているとは限らない、  ((a) 、 (b)
図で、正解を“*″で示しである) そこで、該認識システムの候補文選択部(探索機構)で
は、該ラティスにおける候補をつなぎ合わせて、候補文
、或いは、候補単語を生成する。
That is, the recognition device does not necessarily include the correct answer in the first place in the candidate ranking ((a), (b)
In the figure, the correct answer is indicated by "*") Therefore, the candidate sentence selection unit (search mechanism) of the recognition system connects the candidates in the lattice to generate a candidate sentence or a candidate word.

このとき、候補順に関して、どのような順で選択するか
については、例えば、縦形探索方式がある。
At this time, regarding the order in which candidates are selected, for example, there is a vertical search method.

例えば、(b)図に示した文字単位ラティスについての
、縦形優先で候補を探索する方式を(c)図に示してい
る。
For example, Figure (c) shows a method of searching for candidates with priority given to the vertical format for the character unit lattice shown in Figure (b).

入力単語「類似度」を(b)図に示した候補文字ラティ
スから探索するのに、該縦形優先による探索方式では、
23回の探索が必要であった。
To search for the input word "similarity" from the candidate character lattice shown in figure (b), the vertical priority search method
Twenty-three searches were required.

即ち、(b)図において、「願・僚・唐」という候補単
語を“111” (1位・1位・1位)、「類・以・慶
ゴを“222″(2位・2位・2位)、・・・というよ
うに表記すると、正解の「類、似・度」は“213”と
表記されることになる。
In other words, in figure (b), the candidate words "gan, li, tang" are given "111" (1st place, 1st place, 1st place), and the candidate words "similar, i, keigo" are given "222" (2nd place, 2nd place).・2nd place), etc., the correct answer "similarity, similarity, degree" will be written as "213".

上記縦型探索(深さ優先ともいう)による探索順序は、
上記の表記法で示すと、ラティスの深さが(b)図に示
した如くに4位迄の場合、(c)図に示した探索方法(
探索順番(1)→(2)→(3)→(4))をとるので
、 111.112,113,114゜ 121、 122. 123. 124゜131.13
2,133,134゜ 141.142,143,144゜ 211 212.213,214゜ 221.222,213゜ となる。
The search order using the above vertical search (also called depth-first) is:
Using the above notation, if the depth of the lattice is up to the fourth position as shown in figure (b), then the search method shown in figure (c) is
Since the search order is (1) → (2) → (3) → (4)), 111.112,113,114°121, 122. 123. 124°131.13
2,133,134°141.142,143,144°211 212.213,214°221.222,213°.

従って、上記正解の「213」は、23回目の探索で見
つかることになる。
Therefore, the above correct answer "213" will be found in the 23rd search.

又、横形探索法(広さ優先ともいう)による探索順序は
、上記の表記法で示すと、(d)図に示した探索方法、
即ち、該表記方法で、“111”を最上位の候補として
選ぶと、次は、護選ばれた候補の3つの要素の内の何れ
か一つの要素の順位が変化(増加)したものを選ぶ操作
を繰り返して探索する方法となるので、重複して選択さ
れたものを除いて表示すると、 111゜ 112.121,211゜ 113.122,212゜ 131.221゜ 311゜ 114.123,213.  ・・・ となる。
In addition, the search order by the horizontal search method (also called breadth priority) is shown in the above notation as the search method shown in Figure (d),
That is, if "111" is selected as the top candidate using this notation method, the next step is to select the one in which the rank of any one of the three elements of the selected candidate has changed (increased). Since this is a method of searching by repeating operations, if the duplicate selections are removed and displayed, the following will be displayed: 111°112.121,211°113.122,212°131.221°311°114.123,213. ... becomes.

従って、上記正解の’213Jは、13回目の探索で見
つかることになる。
Therefore, the above correct answer '213J' will be found in the 13th search.

実際には、上記のようにして探索した候補に対して、例
えば、辞書照合機構で辞書照合を行い、該候補単語が辞
書に存在するかどうかを調べ、該辞書に存在する候補単
語のみを出力することになる。又、(a)図に示した文
節ラティスに対して探索を行った場合には、例えば、構
文解析機構で、該候補文の一つ一つについて、構文解析
を行い、該候補文が文法的に正しいもののみを、構文解
析に成功したものとして出力することになる。
In reality, for the candidates searched as above, for example, a dictionary matching mechanism performs dictionary matching, checks whether the candidate word exists in the dictionary, and outputs only the candidate words that exist in the dictionary. I will do it. In addition, when a search is performed on the clause lattice shown in (a), for example, a parsing mechanism parses each of the candidate sentences to determine if the candidate sentence is grammatical. Only those that are correct will be output as those that have been successfully parsed.

上記従来の縦形優先探索法や横形優先探索法の欠点を以
下に述べる。
The drawbacks of the conventional vertical-first search method and horizontal-first search method described above will be described below.

音声認識装置、或いは、文字認識装置が生成するラティ
スにおいて、上位から下位の候補順序における隣同志の
要素について、各々の認識距離の値が近い場合は、各々
が正解である確度が近いことになる0例えば、第3図(
b)において、「願」とr類」ノ認識距離、a4s1度
は各* r2458」r2497Jであり、その差は「
39」であるのに対して、「4g、」「以」の差はr3
89 Jもある。
In a lattice generated by a speech recognition device or a character recognition device, if the recognition distance values of adjacent elements in the candidate order from top to bottom are close, the probability that each is correct is close. 0 For example, Figure 3 (
In b), the recognition distance between "request" and "r class", a4s1 degree, is each *r2458"r2497J, and the difference is "
39'', while the difference between ``4g'' and ``or'' is r3.
89 J is also available.

従来の縦形優先探索や横形優先探索では、僚でいる候補
同志を一体化して考えることがなく、r 1’ 11 
Jを探索してからr213Jを探索する迄に、縦形優先
探索で23回、−横形優先探索で13回の探索が必要に
なる。然し、該rl 11Jからr213Jまでの探索
回数は少ないことが望ましい。
In conventional vertical-first search and horizontal-first search, candidates who are colleagues are not considered as one, and r 1' 11
From searching for J to searching for r213J, 23 searches are required in the vertical-first search and 13 searches are required in the -horizontal-first search. However, it is desirable that the number of searches from rl 11J to r213J is small.

本発明は上記従来の欠点に鑑み、音声認識装置。In view of the above-mentioned conventional drawbacks, the present invention provides a speech recognition device.

或いは、文字認識装置が認識結果として生成する候補単
語ラティス、或いは、候補文字ラティス等から、候補文
、或いは、候補単語を順次生成するのに、認識候補間の
類似度の差が小さい要素同志をまとめで、即ち、グルー
プ化して、検索の機会を近づけ、結果的に正解単語を候
補ラティスから短時間で探索することができる候補探索
方式を提供することを目的とするものである。
Alternatively, in order to sequentially generate candidate sentences or candidate words from a candidate word lattice or a candidate character lattice generated as a recognition result by a character recognition device, elements with small differences in similarity between recognition candidates may be selected. The object of the present invention is to provide a candidate search method that allows search opportunities to be brought closer together, that is, by grouping, and as a result, correct words can be searched from a candidate lattice in a short time.

〔課題を解決するための手段〕[Means to solve the problem]

第1図は本発明の原理を示した図であり、(al)は、
例えば、入力単語が第一候補として認識された場合の第
一候補と第二候補、〜間の類似度の差を20単語宛分析
した場合を示し、(a2)は、入力単語が第二候補と弟
子候補の間に認識された場合の第一候補と第二候補、〜
間の類似度の差を20単語宛分析した場合を示し、(b
)は上記分析結果を図で表したものであり、(cl)〜
(c3)は本発明のグループ分けの例と、縦形探索方式
の例を示している。
FIG. 1 is a diagram showing the principle of the present invention, and (al) is a diagram showing the principle of the present invention.
For example, when the input word is recognized as the first candidate, the difference in similarity between the first candidate and the second candidate is analyzed for 20 words, and (a2) shows that the input word is recognized as the second candidate. and the first and second candidates when recognized between disciple candidates, ~
The difference in similarity between 20 words is analyzed, (b
) is a graphical representation of the above analysis results, and (cl) ~
(c3) shows an example of grouping according to the present invention and an example of the vertical search method.

上記の問題点は、下記の如くに構成された認識候補間類
似度の差を利用したラティス探索方式によって解決され
る。
The above problem can be solved by a lattice search method that utilizes the difference in similarity between recognition candidates configured as follows.

(1)入力単語、或いは、入力文に対して、認識装置2
が認識結果とする候補単語、或いは、候補文字の第一位
と第二位の類似度の差を計算し、その差がある特定の数
、例えば、150より大きい場合は、認識候補の第一候
補と、それ以外との二つのグループ■、■に分け、その
差が上記特定の数より小さい場合は、認識候補を第一、
第二候補と、第三候補以下の二つのグループ■、■に分
け、上記グルー10〜0間、及び、グループ内において
、縦型探索、或いは、横型探索を実行し、上記探索処理
で、入力単語、或いは、入力文に対する候補単語、或い
は、候補文が探索できない場合には、上記第一候補と、
第二候補の類似度の差が、上記特定数以下のグループ■
の内、一番手さいグループ■に、次のグループ■から候
補ラティス■を探索対象に組み入れて、入力単語、或い
は、入力文を探索するように構成する。
(1) For the input word or input sentence, the recognition device 2
calculates the difference in similarity between the first and second candidate words or candidate characters as recognition results, and if the difference is greater than a certain number, for example 150, the first recognition candidate Divide into two groups, ■ and ■, candidates and others, and if the difference between them is smaller than the specified number above, select the recognition candidates as the first group,
Divide the second candidate into two groups ■ and ■ below the third candidate, perform vertical search or horizontal search between the groups 10 to 0 and within the groups, and in the above search process, input If a word or candidate word or candidate sentence for the input sentence cannot be searched, the first candidate and
Groups where the difference in similarity between second candidates is less than or equal to the above specified number ■
The candidate lattice (2) from the next group (2) is incorporated into the earliest group (2) as a search target, and the input word or input sentence is searched.

(2)上記項1に記載のラティス探索方式において、′
認識装置2が音声認識装置であるように・構成する。
(2) In the lattice search method described in item 1 above, ′
The recognition device 2 is configured to be a speech recognition device.

(3)上記項1に記載のラティス探索方式において、認
識装置2が文字認識装置であるように構成する。
(3) In the lattice search method described in item 1 above, the recognition device 2 is configured to be a character recognition device.

〔作用〕[Effect]

即ち、音声認識装置、或いは、文字認識装置が認−結果
として生成する候補単語ラティス、或いは、候補文字ラ
ティス等から、候補文、或いは、候補単語等を順次生成
する場合、音声、認識装置。
That is, when candidate sentences or candidate words are sequentially generated from a candidate word lattice or a candidate character lattice generated as a recognition result by a voice recognition device or a character recognition device, the voice recognition device is used.

或いは、文字認識装置が生成する候補ラティスには、一
般に、 入力単語が第一位として認識された場合と、該入力単語
が第二位か第二位以下に認識された場合の候補間の11
1度の差を、各々20単語ずつ分析した結果、認識候補
の類似度の差には1、以下のような属性のあることが分
かった。
Alternatively, the candidate lattice generated by the character recognition device generally includes 11 points between the candidates when the input word is recognized as the first place and the candidates when the input word is recognized as the second place or below.
As a result of analyzing the 1 degree difference for 20 words each, it was found that the difference in similarity between recognition candidates was 1 and had the following attributes.

1)入力単語が第一候補として認識された場合は、第一
候補と第二候補の類似度の差の平均値が、例えば、24
4である。  ((al)図参照)2)入力単語が第二
候補と弟子候補の間に認識された場合は、第一候補と第
二候補の類イ以度の差の平均値が50.9である( (
a2)図参照)第1図の(b)は上記(al) 、 (
a2)図に示した類似度の平均値の差をグラフ化したも
のである。
1) When the input word is recognized as the first candidate, the average value of the difference in similarity between the first candidate and the second candidate is, for example, 24
It is 4. (See figure (al)) 2) If the input word is recognized between the second candidate and the disciple candidate, the average value of the differences of class A or higher between the first candidate and the second candidate is 50.9. ( (
a2) (See figure)) (b) in Figure 1 is the same as (al) above, (
a2) This is a graph of the difference in the average similarity values shown in the figure.

本発明は、上記の属性を利用して、以下の手段により、
入力分を認識装置が生成した候補単語ラティス、或いは
、候補文字ラティスの中から探索するようにしたもので
ある。
The present invention utilizes the above attributes to achieve the following:
The input is searched from among the candidate word lattice or candidate character lattice generated by the recognition device.

(1)先ず、第一候補と第二候補の類似度の差を計算し
、その差が、例えば、150以上の場合は、該認識候補
を第一候補と第二候補以下の二つのグループ■、■に分
ける。
(1) First, calculate the difference in similarity between the first candidate and the second candidate, and if the difference is, for example, 150 or more, divide the recognition candidate into two groups: the first candidate and the second candidate. , divided into ■.

上記計算した、第一候補と第二候補の類似度の差が15
0以下の場合には、第一候補と第二候補と。
The difference in similarity between the first candidate and the second candidate calculated above is 15
If it is 0 or less, the first candidate and the second candidate.

第三候補以下の二つのグループ■、■に分ける。Divide into two groups ■ and ■ below the third candidate.

(2) (1)を繰り返し、候補単語ラティス、或いは
、候補文字ラティスの全部を幾つかのグループに分ける
。 −((cl)図参照) (3)上記のようにして分けられたグループ間において
、縦形探索、或いは、横形探索を実行する。
(2) Repeat (1) to divide all candidate word lattices or candidate character lattices into several groups. - (See figure (cl)) (3) Execute vertical search or horizontal search between the groups divided as described above.

(4)上記の探索で、入力文の候補が探索できない場合
には、上記第一候補と第二候補の類似度の差が150以
下のグループ■の中で、一番差が小さいグループに、次
のグループ■から探索対象の候補ラティス■を入れる。
(4) If no candidate for the input sentence can be found in the above search, select the group with the smallest difference among the groups ■ in which the difference in similarity between the first candidate and the second candidate is 150 or less. Insert candidate lattice ■ to be searched from the next group ■.

((c3)図参照)(5)入力文の候補が探索できる迄
、上記(3)。
(See figure (c3)) (5) Repeat step (3) above until candidates for the input sentence can be searched.

(4)の処理を繰り返す。Repeat the process in (4).

本探索方式では、入力単語を候補文字ラティスから、認
識候補間の類似度の差を利用し、類似要素をまとめなが
ら探索することによって、短時間で探索を行える可能性
を持っている。
This search method has the potential to perform a search in a short time by searching for an input word from a candidate character lattice, using the difference in similarity between recognition candidates, and grouping similar elements together.

例えば、本発明を、グループ間、グループ内で縦形優先
探索を行うように適用すると、前述のrl12Jを探索
してからr213Jを探索するまでの探索回数は5回、
又は、3回となる。
For example, if the present invention is applied to perform a vertical priority search between groups and within a group, the number of searches from the above-mentioned search for rl12J to the search for r213J is 5,
Or three times.

このように、本発明による候補探索方式では、正解候補
文、或いは、正解単語を、認識装置が生成した候補ラテ
ィスから短時間で検索できるという効果がある。
As described above, the candidate search method according to the present invention has the advantage that correct candidate sentences or correct words can be searched for in a short time from the candidate lattice generated by the recognition device.

(実施例〕 以下本発明の実施例を図面によって詳述する。(Example〕 Embodiments of the present invention will be described in detail below with reference to the drawings.

前述の第1図が本発明の詳細な説明する図であり、第2
図は本発明の一実施例を示した図であり、(a)は音声
認識システムに適用して文節単位のラティスから候補文
を探索する場合を示し、(b)は文字認識システムに適
用して文節単位のラティスから候補文を探索する場合を
示し、(C)は文字単位のラティスから候補単語を探索
する場合を示しており、認識装置が認識結果として生成
する文字単位のラティス、単語単位のラティス、文節単
位のラティスから、候補単語、或いは、候補文を探索す
るのに4、例えば、候補順位の第一候補と第二候補の差
を計算し、その差が、例えば、150以上の場合は、該
認識候補を第一候補と第二候補以下の二つのグループ■
、■に分け、その差が上記150以下の場合には、第一
候補、第二候補と、第三″候補以下の二つのグループ■
、■に分け、グループ間。
The above-mentioned FIG. 1 is a diagram explaining the present invention in detail, and FIG.
The figures show an embodiment of the present invention, in which (a) shows a case where the present invention is applied to a speech recognition system to search for candidate sentences from a lattice of phrases, and (b) shows a case where the present invention is applied to a character recognition system. (C) shows the case where candidate sentences are searched from the lattice of phrase units, and (C) shows the case of searching for candidate words from the lattice of character units. To search for candidate words or candidate sentences from the lattice of the lattice or the lattice of the bunsetsu unit, for example, the difference between the first candidate and the second candidate in the candidate ranking is calculated, and if the difference is, for example, 150 or more, In this case, the recognition candidates are divided into two groups: the first candidate and the second candidate ■
, ■, and if the difference is less than 150, then the first candidate, second candidate, and two groups below the third candidate ■
, ■ between groups.

グループ内で縦形優先探索、或いは、横形優先探索を実
行し、上記の探索処理で候補が探索できないときには、
上記第一候補と第二候補の類似度の差が上記150以下
のグループ■の中で、一番差の小さいグループ■に、次
のグループ■から候補ラティス■を探索対象に入れる手
段が本発明を実施するのに必要な手段である。尚、全図
を通して同じ符号は同じ対象物を示している。
If a vertical priority search or horizontal priority search is executed within a group, and candidates cannot be found in the above search process,
The present invention provides means for including candidate lattice ■ from the next group ■ into the group ■ having the smallest difference among the groups ■ in which the difference in similarity between the first candidate and the second candidate is 150 or less as a search target. It is a necessary means to carry out. Note that the same reference numerals indicate the same objects throughout the figures.

以下、第1図を参照しながら、第2図によって、本発明
の認識候補間I!位度の差を利用したラティス探索方式
を説明する。
Hereinafter, while referring to FIG. 1, the I! between recognition candidates of the present invention will be explained using FIG. 2. A lattice search method using degree differences will be explained.

本発明を実施しても、認識装置での認識手段。Even if the present invention is implemented, the recognition means in the recognition device.

及び、該認識装置2が出力したラティスから、例えば、
縦形優先の探索を行う場合の基本的な動作は特に変わる
ことはないので詳細は省略し、ここでは、認識候補間の
11億度の差を利用したラティス探索方式によって、候
補文、又は候補単語を生成する手段を中心にして説明す
る。
And from the lattice output by the recognition device 2, for example,
The basic operation when performing vertical-first search does not change in particular, so the details are omitted.Here, candidate sentences or candidate words are The explanation will focus on the means for generating .

先ず、第2図(a)の例は音声認識システムに本発明を
適用したもので、音声入力用マイク1から入力された音
声は、音声認識装置2において、図示していない音声パ
ターン登録辞書を検索して、認識距離(l!似度)の計
算を行い、距離の短いものから、例えば、文節単位ラテ
ィス、或いは、単語単位ラティスを出力する。
First, the example shown in FIG. 2(a) is an example in which the present invention is applied to a voice recognition system, in which the voice input from the voice input microphone 1 is passed through a voice pattern registration dictionary (not shown) in the voice recognition device 2. After searching, the recognition distance (l! similarity) is calculated, and, for example, a phrase unit lattice or a word unit lattice is output in descending order of distance.

該音声認識装置2から出力されたラティスについて、パ
ソコン3内で、図示していないマイクロプロセッサ(M
PU)が特定の探索ルーチン(探索)4を実行すること
により、例えば、第1図(cl) 。
The lattice output from the speech recognition device 2 is processed by a microprocessor (not shown) in the personal computer 3.
1 (cl) by executing a specific search routine (search) 4.

(c3)に示した探索手順に基づいた探索、即ち、例え
ば、候補順位の第一候補と第二候補の差を計算し、その
差が、例えば、150以上の場合は、該認識候補を第一
候補と第二候補以下の二つのグループ■、■に分け、そ
の差が上記150以下の場合には、第一候補、第二候補
と、第三候補以下の二つのグループ■、■に分け、グル
ープ間、グループ内で縦形優先探索、或いは、横形優先
探索を実行し、上記の探索処理で候補が探索できないと
きには、上記第一候補と第二候補の!!僚度の差が上記
150以下のグループ■の中で、一番差の小さいグルー
プ■に、次のグループ■から候補ラティス■を探索対象
に入れて、縦形探索を行う。
Search based on the search procedure shown in (c3), that is, for example, calculate the difference between the first candidate and the second candidate in the candidate ranking, and if the difference is, for example, 150 or more, select the recognition candidate as the first candidate. Divide into two groups ■, ■ below the first candidate and second candidate, and if the difference between them is less than 150, divide into two groups ■, ■ below the first candidate, second candidate, and third candidate. , vertical-first search or horizontal-first search is performed between groups or within groups, and if no candidates can be found in the above search process, the first and second candidates are searched! ! Among the groups (2) with a difference in efficiency of 150 or less, candidate lattice (2) from the next group (2) is included in the search target for the group (2) with the smallest difference, and a vertical search is performed.

即ち、グル−10,0間で縦形優先探索を行い、続いて
、グループ■、■内で縦形優先探索を行って、候補文、
又は、候補単語を生成する。
That is, a vertical-first search is performed between groups 10 and 0, and then a vertical-first search is performed within groups ■ and ■ to find candidate sentences,
Or, generate candidate words.

次に、該マイクロプロセッサ(MPU)が言語処理ルー
チン(言語処理)5を実行することにより、該候補文の
一つ一つに対して、構文解析を行い、該候補文について
文法的に正しいもののみを出力して、デイスプレィ6に
表示する。
Next, the microprocessor (MPU) executes a language processing routine (language processing) 5 to parse the syntax of each of the candidate sentences, and determines which sentences are grammatically correct. only is output and displayed on the display 6.

該表示された候補文から、ユーザ、即ち、人間が正しい
文を選択することで一1従来方式に比較して短時間で正
解候補文を検索することができる。
By selecting the correct sentence from the displayed candidate sentences, the user, that is, a human being, can search for the correct candidate sentence in a shorter time than in the conventional method.

(b)図に示した文字認識システムについても、入力さ
れる文が入力用タブレット1がら入力される他は、(a
)図の音声認識システムと同じ構成であるので、該音声
認識の場合と同じ手順で、該入力用タブレット1から入
力された文について、文字認識装22で、例えば、単語
単位のラティスが出力され、パソコン3のマイクロプロ
セッサ(1’1PU)が実行する探索ルーチン(探索)
4によって、該単語単位のラティスについて、グループ
分け。
(b) Regarding the character recognition system shown in the figure, except that the input sentence is input from the input tablet 1, (a
) Since it has the same configuration as the speech recognition system shown in the figure, the character recognition device 22 outputs, for example, a word-by-word lattice for the sentence input from the input tablet 1 using the same procedure as in the case of speech recognition. , a search routine (search) executed by the microprocessor (1'1PU) of the personal computer 3
4, the word unit lattice is grouped.

グループ■間の縦形優先探索、グループ■内での縦形優
先探索が行われることにより候補文が生成され、続いて
、言語処理ルーチン(言語処理)5において、構文解析
が行われ、該構文解析に成功した候補文がデイスプレィ
6に表示される。
Candidate sentences are generated by performing a vertical-first search between groups ■ and a vertical-first search within group ■.Next, a syntactic analysis is performed in a language processing routine (language processing) 5. Successful candidate sentences are displayed on the display 6.

(c)図に示した実施例は、上記文字認識システムの他
の例であり、入力用タブレット1から入力された単語に
ついて、文字認識装置2で、例えば、文字単位のラティ
スを出力した場合を示している。
(c) The embodiment shown in the figure is another example of the above-mentioned character recognition system, in which the character recognition device 2 outputs, for example, a lattice of characters for a word input from the input tablet 1. It shows.

この場合、パソコン3のマイクロプロセッサ(MPU)
が実行する探索ルーチン(探索)4によって、候補単語
が探索されると、辞書照合ルーチン(辞書照合)−5a
によって、図示されていない辞書に登録されている単語
との照合が行われ、照合が成功した候補単語について、
デイスプレィ6に表示するように動作する。
In this case, the microprocessor (MPU) of PC 3
When a candidate word is searched for by the search routine (search) 4 executed by the dictionary matching routine (dictionary matching)-5a
The candidate words that are successfully matched are compared with words registered in a dictionary (not shown).
It operates to display on the display 6.

このように、本発明は、認識装置が認識結果として生成
する文字単位のラティス、単語単位のラティス、文節単
位のラティスから、候補単語、或いは、候補文を探索す
るのに、候補順位の第一候補と第二候補の差を計算し、
その差が、例えば、150以上の場合は、該認識候補を
第一候補と第二候補以下の二つのグループ■、■に分け
、その差が上記150以下の場合には、第一候補、第二
候補と、第三候補以下の二つのグループ■、■に分け、
グループ間、グループ内で縦形優先探索、或いは、横形
優先探索を実行し、上記の探索処理で候補が探索できな
いときには、上記第一候補と第二候補のII位度の差が
上記150以下のグループ■の中で、一番差の小さいグ
ループ■に、次のグループ■から候補ラティス■を探索
対象に入れて、上記候補探索を行うようにした所に特徴
がある。
As described above, the present invention searches for candidate words or candidate sentences from the character-based lattice, word-based lattice, and phrase-based lattice generated by the recognition device as a recognition result. Calculate the difference between the candidate and the second candidate,
If the difference is, for example, 150 or more, the recognition candidates are divided into two groups, ■ and ■, the first candidate and the second candidate. Divide into two groups: the second candidate and the third candidate ■, ■.
If a vertical priority search or a horizontal priority search is performed between groups or within a group, and a candidate cannot be found in the above search process, the group in which the difference in II rank between the first candidate and the second candidate is 150 or less is Among (2), the candidate lattice (2) from the next group (2) is included in the search target for the group (2) with the smallest difference, and the above candidate search is performed.

〔発明の効果〕〔Effect of the invention〕

以上、詳細に説明したように、本発明の音声認識用/文
字認識用の候補探索方式は、入力単語。
As described above in detail, the candidate search method for speech recognition/character recognition of the present invention uses an input word.

或いは、入力文に対して、認識装置が認識結果とする候
補単語、或いは、候補文字の第一位と第二位の類似度の
差を計算し、その差がある特定の数、例えば、150よ
り大きい場合は、認識候補の第一候補と、それ以外との
二つのグループ■、■に分け、その差が上記特定の数よ
り小さい場合は、認識候補を第一、第二候補と、第三候
補以下の二つのグループ■、■に分け、上記グループ■
〜■内において、縦型探索、或いは、横型探索を実行し
、上記探索処理で、入力単語、或いは、入力文に対する
候補単語、或いは、候補文が探索できない場合には、上
記第一候補と、第二候補の類似度の差が、上記特定数以
下のグループ■の内、一番手さいグループ■に、次のグ
ループ■から候補ラティス■を探索対象に組み入れて、
入力単語、或いは、入力文を探索するようにしたもので
あるので、正解候補文、或いは、正解単語を候補ラティ
スから短時間で検索でき、当該、音声/文字認識システ
ムでのマンマシンインタフェースを向上させる効果があ
る。
Alternatively, the recognition device calculates the difference in similarity between the first and second candidate words or candidate characters as a recognition result for the input sentence, and sets the difference to a specific number, for example, 150. If the difference is smaller than the above specific number, divide the recognition candidates into two groups ■, ■, the first candidate and the others, and if the difference is smaller than the above specific number, divide the recognition candidates into the first, second, and Divide into two groups of three candidates or less■,■, and the above group■
In ~■, a vertical search or a horizontal search is performed, and if a candidate word or candidate sentence for the input word or input sentence cannot be searched in the above search process, the above first candidate and, The candidate lattice ■ is included in the search target from the next group ■ to the group ■ with the lowest similarity among the groups ■ in which the difference in similarity of the second candidate is less than or equal to the above specified number,
Since the input word or input sentence is searched, the correct answer candidate sentence or correct answer word can be searched from the candidate lattice in a short time, and the man-machine interface of the speech/character recognition system is improved. It has the effect of

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の詳細な説明する図。 第2図は本発明の一実施例を示した図。 第3図は従来の音声認識/文字認識用の候補探索方式を
説明する図。 である。 下の二つのグループ。 ■は組入れる候補ラティス。 をそれぞれ示す。 図面において、 1は入力用マイク、又は、入力用タブレット。 2は音声認識装置、又は、文字認識装置、又は、認識装
置。 3はパソコン。 4は探索処理ルーチン(探索)。 5は言語処理ルーチン(言語処理)。 5aは辞書照合ルーチン(辞書照合)。 6はデイスプレィ。 ■、■は第一候補と第二候補の類似度の差が150以上
の二つのグループ。 ■、■は第一候補と第二候補の類似度の差が150以下
の場合の第一候補、第二候補と、第三候補以第 1 図
 (その1) 第1図 (その2) 第 図 (その3) 第 図 (その1) 第 図 (その4) 第 図 (その2) 例: 入力文:あなたは 本を 読んでいますか。 (a) 例: 入力単語:類似度 認識結果 (*は正解を示す) 第 図 (その1) (C) +23 横型探索順番:(lH2H3)べ4ト (d) を説明するV 第 図 (その2)
FIG. 1 is a diagram explaining the present invention in detail. FIG. 2 is a diagram showing an embodiment of the present invention. FIG. 3 is a diagram explaining a conventional candidate search method for speech recognition/character recognition. It is. the bottom two groups. ■ is a candidate lattice to be incorporated. are shown respectively. In the drawing, 1 is an input microphone or an input tablet. 2 is a voice recognition device, a character recognition device, or a recognition device. 3 is a computer. 4 is a search processing routine (search). 5 is a language processing routine (language processing). 5a is a dictionary matching routine (dictionary matching); 6 is the display. ■ and ■ are two groups in which the difference in similarity between the first candidate and the second candidate is 150 or more. ■, ■ are the first candidate, second candidate, and third candidate when the difference in similarity between the first candidate and the second candidate is 150 or less. Figure 1 (Part 1) Figure 1 (Part 2) Figure (Part 3) Figure (Part 1) Figure (Part 4) Figure (Part 2) Example: Input sentence: Are you reading a book? (a) Example: Input word: Similarity recognition result (* indicates correct answer) Figure (Part 1) (C) +23 Horizontal search order: (lH2H3)Bet(d) V to explain Figure (Part 1) 2)

Claims (3)

【特許請求の範囲】[Claims] (1)入力単語、或いは、入力文に対して、認識装置(
2)が認識結果とする候補単語、或いは、候補文字の第
一位と第二位の類似度の差を計算し、その差がある特定
の数より大きい場合は、認識候補の第一候補と、それ以
外との二つのグループ(〔1〕、〔4〕)に分け、その
差が上記特定の数より小さい場合は、認識候補を第一、
第二候補と、第三候補以下の二つのグループ(〔2〕、
〔3〕)に分け、上記グループ(〔1〕、〔4〕)間、
及び、グループ内において、縦型探索、或いは、横型探
索を実行し、上記探索処理で、入力単語、或いは、入力
文に対する候補単語、或いは、候補文が探索できない場
合には、上記第一候補と、第二候補の類似度の差が、上
記特定数以下のグループ(〔2〕)の内、一番小さいグ
ループ(〔2〕)に、次のグループ(〔3〕)から候補
ラティス(〔5〕)を探索対象に組み入れて、入力単語
、或いは、入力文を探索することを特徴とする認識候補
間類似度の差を利用したラティス探索方式。
(1) The recognition device (
2) calculates the difference in similarity between the first and second candidate words or candidate characters that are the recognition results, and if the difference is greater than a certain number, , and the others ([1], [4]), and if the difference between them is smaller than the specified number above, the recognition candidates are divided into the first,
The second candidate and the two groups below the third candidate ([2],
[3]), between the above groups ([1], [4]),
Then, a vertical search or a horizontal search is performed within the group, and if a candidate word or a candidate sentence for the input word or input sentence cannot be found in the above search process, the above first candidate is used. , the candidate lattice ([5]) from the next group ([3]) is assigned to the smallest group ([2]) among the groups ([2]) in which the difference in similarity between the second candidates is less than or equal to the specified number. ]) as a search target and searches for input words or sentences.
(2)上記請求項1に記載のラティス探索方式において
、認識装置(2)が、音声認識装置であることを特徴と
する認識候補間類似度の差を利用したラティス探索方式
(2) The lattice search method according to claim 1, wherein the recognition device (2) is a speech recognition device, using a difference in similarity between recognition candidates.
(3)上記請求項1に記載のラティス探索方式において
、認識装置(2)が文字認識装置であることを特徴とす
る認識候補間類似度の差を利用したラティス探索方式。
(3) The lattice search method according to claim 1, wherein the recognition device (2) is a character recognition device, using a difference in similarity between recognition candidates.
JP2231499A 1990-08-31 1990-08-31 Lattice searching system using difference of similarity between recognitive candidate Pending JPH04112269A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2231499A JPH04112269A (en) 1990-08-31 1990-08-31 Lattice searching system using difference of similarity between recognitive candidate

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2231499A JPH04112269A (en) 1990-08-31 1990-08-31 Lattice searching system using difference of similarity between recognitive candidate

Publications (1)

Publication Number Publication Date
JPH04112269A true JPH04112269A (en) 1992-04-14

Family

ID=16924452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2231499A Pending JPH04112269A (en) 1990-08-31 1990-08-31 Lattice searching system using difference of similarity between recognitive candidate

Country Status (1)

Country Link
JP (1) JPH04112269A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100482313B1 (en) * 1996-12-30 2005-07-21 엘지전자 주식회사 Speech Recognition Method Using Dual Similarity Comparison
JP5621777B2 (en) * 2009-09-24 2014-11-12 日本電気株式会社 Non-transitory computer-readable medium storing word recognition device, method and program, and shipment sorting device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100482313B1 (en) * 1996-12-30 2005-07-21 엘지전자 주식회사 Speech Recognition Method Using Dual Similarity Comparison
JP5621777B2 (en) * 2009-09-24 2014-11-12 日本電気株式会社 Non-transitory computer-readable medium storing word recognition device, method and program, and shipment sorting device

Similar Documents

Publication Publication Date Title
JP6618735B2 (en) Question answering system training apparatus and computer program therefor
US10210245B2 (en) Natural language question answering method and apparatus
US6223150B1 (en) Method and apparatus for parsing in a spoken language translation system
JP2000112938A5 (en)
US6278968B1 (en) Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
KR101309042B1 (en) Apparatus for multi domain sound communication and method for multi domain sound communication using the same
JPH03257596A (en) Highest preference search processing method applying difference of recognized distance
JPWO2016067418A1 (en) Dialog control apparatus and dialog control method
JP2005084681A (en) Method and system for semantic language modeling and reliability measurement
Sang et al. Applying system combination to base noun phrase identification
JP5544575B2 (en) Spoken language evaluation apparatus, method, and program
KR20200073524A (en) Apparatus and method for extracting key-phrase from patent documents
Liang et al. An efficient error correction interface for speech recognition on mobile touchscreen devices
JPH04112269A (en) Lattice searching system using difference of similarity between recognitive candidate
KR950013128B1 (en) Apparatus and method of machine translation
JP2000267693A (en) Voice processor and index preparation device
JP3952964B2 (en) Reading information determination method, apparatus and program
Varges Overgeneration and ranking for spoken dialogue systems
JPS6229796B2 (en)
JPH0371285A (en) Double searching system utilizing difference between recognized distances
Milon et al. A Comprehensive Dialect Conversion Approach from Chittagonian to Standard Bangla
JPH06186994A (en) Speech recognizing device
JP2017208049A (en) Language analysis device, language analysis method, and program
JP2002297592A (en) Apparatus, method and program of matching for natural text
JPH04115383A (en) Character recognizing system for on-line handwritten character recognizing device