JP3001334B2 - Language processor for recognition - Google Patents

Language processor for recognition

Info

Publication number
JP3001334B2
JP3001334B2 JP4180937A JP18093792A JP3001334B2 JP 3001334 B2 JP3001334 B2 JP 3001334B2 JP 4180937 A JP4180937 A JP 4180937A JP 18093792 A JP18093792 A JP 18093792A JP 3001334 B2 JP3001334 B2 JP 3001334B2
Authority
JP
Japan
Prior art keywords
recognition
notation
candidate
language processing
syllable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4180937A
Other languages
Japanese (ja)
Other versions
JPH0627990A (en
Inventor
徹 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP4180937A priority Critical patent/JP3001334B2/en
Publication of JPH0627990A publication Critical patent/JPH0627990A/en
Application granted granted Critical
Publication of JP3001334B2 publication Critical patent/JP3001334B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】この発明は、音声認識や文字認識
等の際に用いられる認識用言語処理装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a recognition language processing apparatus used for voice recognition, character recognition, and the like.

【0002】[0002]

【従来の技術】従来、認識装置によって、入力された音
声や文字列による文章や単語等を認識する際には、例え
ば次のようにしている。予め作成されてメモリに格納さ
れている音声信号による音節や画像信号による文字等の
標準パターンと、マイクロホンや画像読取装置から入力
された音声信号や画像信号から抽出された音節や文字の
特徴パターンとのマッチングを行って、複数の認識候補
を得る。そして、得られた複数の認識候補を類似度順に
展開して文節候補列や単語候補列を作成し、作成した総
ての文節候補や単語候補に対して言語処理を行う。
2. Description of the Related Art Conventionally, when recognizing a sentence or a word by an input voice or character string by a recognition device, for example, the following is performed. Standard patterns such as syllables by voice signals and image signals generated in advance and stored in memory, and characteristic patterns of syllables and characters extracted from voice and image signals input from microphones and image reading devices. To obtain a plurality of recognition candidates. Then, the obtained plurality of recognition candidates are developed in the order of similarity to create a phrase candidate sequence or a word candidate sequence, and language processing is performed on all the created phrase candidates or word candidates.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、上記従
来の認識方法においては、認識候補数が少ない場合には
問題は無い。ところが、認識候補数が増加すると展開し
て得られる文節候補や単語候補の数が爆発的に増加する
という問題がある。
However, the above-described conventional recognition method has no problem when the number of recognition candidates is small. However, when the number of recognition candidates increases, the number of phrase candidates and word candidates obtained by expansion increases explosively.

【0004】例えば、音節毎に認識を行う音声認識装置
の場合には、6音節を認識して夫々の音節に対して8つ
の認識候補が得られたとすると、その組み合わせによっ
て得られる単語/文節候補数は86≒26万となる。こ
の単語/文節候補夫々に対して言語処理を実施する場合
には、例えば一つの単語/文節候補に対する言語処理が
1msの時間でできたとしても260秒かかることにな
り、現実的なシステムが構築できない。
For example, in the case of a speech recognition device that recognizes each syllable, if six syllables are recognized and eight recognition candidates are obtained for each syllable, a word / syllable candidate obtained by a combination thereof is obtained. The number will be 86 ≒ 260,000. When linguistic processing is performed on each of the word / phrase candidates, it takes 260 seconds even if the linguistic processing for one word / phrase candidate is completed in 1 ms, for example. Can not.

【0005】そこで、この発明の目的は、認識候補に対
して高速に言語処理を実施できる認識用言語処理方法を
提供することにある。
An object of the present invention is to provide a recognition language processing method capable of performing high-speed language processing on recognition candidates.

【0006】[0006]

【課題を解決するための手段】上記目的を達成するた
め、第1の発明の認識用言語処理装置は、入力された音
声信号あるいは画像信号に基づいて音声あるいは文字を
認識する認識装置からの認識結果に言語処理を施して認
識候補を得る認識用言語処理装置において、上記認識装
置からの認識結果の表記を所定のルールに従って上記認
識結果の表記が属するカテゴリ数より少ないカテゴリ数
の表記に変換する表記変換部と、上記言語処理を実施す
る際に用いられる言語処理辞書の見出し語の表記が上記
ルールに従って変換されて上記見出し語の表記の属する
カテゴリ数が圧縮されて成る圧縮辞書と、上記表記変換
部によって表記が変換された上記認識結果に対して上記
圧縮辞書を用いて言語処理を行って上記認識候補の予備
選択を行う認識候補予備選択部と、上記認識候補予備選
択部によって得られた予備選択認識候補を上記言語処理
辞書の見出し語の連鎖に復元して上記認識候補を得る認
識候補生成部と、上記認識装置からの認識結果を参照し
て上記認識候補生成部によって得られた認識候補の重み
をトップダウン的に算出して最終的な上記認識候補を得
るトップダウン処理部を備えたことを特徴としている。
According to a first aspect of the present invention, there is provided a recognition language processing apparatus for recognizing speech or characters based on an input speech signal or image signal. In a recognition language processing apparatus that obtains a recognition candidate by performing language processing on a result, a notation of a recognition result from the recognition apparatus is converted into a notation of a smaller number of categories than the number of categories to which the notation of the recognition result belongs according to a predetermined rule. A notation conversion unit, a compression dictionary in which the notation of the headword of the language processing dictionary used when performing the above-described language processing is converted according to the above rules, and the number of categories to which the notation of the headword belongs is compressed; A recognition candidate for performing a preliminary selection of the recognition candidate by performing language processing on the recognition result whose notation is converted by the conversion unit using the compression dictionary A preparatory selection unit, a recognition candidate generating unit that restores the preselection recognition candidates obtained by the recognition candidate preselection unit into a chain of headwords of the language processing dictionary to obtain the recognition candidates, and a recognition from the recognition device. A top-down processing unit that calculates the weight of the recognition candidate obtained by the recognition candidate generation unit in a top-down manner with reference to the result and obtains the final recognition candidate is provided.

【0007】また、第2の発明の認識用言語処理装置
は、第1の発明の認識用言語処理装置において、上記認
識装置からの認識結果は夫々に重み付けされた認識単位
群から成ると共に、上記トップダウン処理部によって上
記認識候補の重みを算出するに際して上記認識候補を構
成する複数の認識単位中に上記認識結果に無い認識単位
がある場合には、当該認識単位に所定の重みを付加して
上記認識結果に自動的に追加する認識結果追加部を備え
たことを特徴としている。
A recognition language processing apparatus according to a second aspect of the present invention is the recognition language processing apparatus according to the first aspect, wherein the recognition result from the recognition apparatus includes a weighted recognition unit group, and When calculating the weight of the recognition candidate by the top-down processing unit, if there is a recognition unit not included in the recognition result among a plurality of recognition units constituting the recognition candidate, a predetermined weight is added to the recognition unit. A recognition result adding unit that automatically adds the recognition result to the recognition result is provided.

【0008】また、第3の発明の認識用言語処理装置
は、第1あるいは第2の発明の認識用言語処理装置にお
いて、上記表記変換部が上記認識装置からの認識結果の
表記を変換する際に使用する上記所定のルールは、上記
認識装置による認識に誤認識のパターンが存在する場合
には当該パターンに当て嵌まる認識結果の表記を変換し
た際に1つのカテゴリに属するような表記に変換される
ルールであることを特徴としている。
The recognition language processing apparatus according to a third aspect of the present invention is the recognition language processing apparatus according to the first or second aspect, wherein the notation conversion unit converts the notation of the recognition result from the recognition apparatus. The above-mentioned predetermined rule is converted to a notation that belongs to one category when a notation of a recognition result applicable to the pattern is converted when an erroneous recognition pattern exists in the recognition by the recognition device. The rule is that it is a rule.

【0009】[0009]

【作用】第1の発明では、認識装置に音声信号あるいは
画像信号が入力されると、この音声信号あるいは画像信
号に基づいて音声あるいは文字が認識されて認識結果が
出力される。そして、上記認識装置から出力された認識
結果の表記が、所定のルールに従って上記認識結果の表
記が属するカテゴリ数より少ないカテゴリ数の表記に表
記変換部によって変換される。
According to the first aspect of the invention, when a voice signal or an image signal is input to the recognition device, a voice or a character is recognized based on the voice signal or the image signal, and a recognition result is output. Then, the notation of the recognition result output from the recognition device is converted by the notation conversion unit into a notation of a smaller number of categories than the number of categories to which the notation of the recognition result belongs according to a predetermined rule.

【0010】そうすると、上記表記変換部によって表記
が変換された後の上記認識結果に対して、認識候補予備
選択部によって、言語処理を実施する際に用いられる言
語処理辞書の見出し語が上記所定のルールに従って変換
されて成る圧縮辞書を用いて言語処理が行われる。こう
して、上記認識候補の予備選択が行われて予備選択認識
候補が得られる。
Then, with respect to the recognition result after the notation conversion by the notation conversion unit, the recognition candidate preliminary selection unit sets the headword of the language processing dictionary used when performing the language processing to the predetermined word. Language processing is performed using a compression dictionary converted according to the rules. Thus, the preliminary selection of the recognition candidate is performed, and the preliminary selection recognition candidate is obtained.

【0011】その後、認識候補生成部によって、上記予
備選択認識候補が上記言語処理辞書の見出し語の連鎖に
復元されて認識候補が生成される。そして、トップダウ
ン処理部によって、上記認識結果が参照されて、上記生
成された認識候補の重みがトップダウン的に算出されて
最終的な認識候補が得られる。
[0011] Thereafter, the recognition candidate generating section restores the preselected recognition candidates to a chain of headwords in the language processing dictionary to generate recognition candidates. Then, the top-down processing unit refers to the recognition result, calculates the weight of the generated recognition candidate in a top-down manner, and obtains a final recognition candidate.

【0012】このように、上記言語処理辞書および認識
結果をより少ないカテゴリ数の表記に予め変換すること
によって、この表記変換後の認識結果に対する上記圧縮
辞書を用いた言語処理が非常に短時間に実施される。以
後は、こうして得られた予備選択認識候補に基づいて生
成された上記認識候補の重みがトップダウン的に算出さ
れるだけであるから、ボトムアップ的な言語処理を必要
とはせず。最終的な認識候補が非常に短時間に得られ
る。
As described above, the language processing dictionary and the recognition result are converted in advance into a notation of a smaller number of categories, so that the language processing using the compression dictionary for the recognition result after the notation conversion can be performed in a very short time. Will be implemented. Thereafter, since the weights of the recognition candidates generated based on the thus-obtained preliminary selection recognition candidates are simply calculated from the top down, the bottom-up language processing is not required. The final recognition candidate is obtained in a very short time.

【0013】また、第2の発明では、上記認識装置から
夫々に重み付けされた認識単位群から成る認識結果が出
力される。そして、上記トップダウン処理部によって上
記認識候補の重みが算出されるに際して上記認識候補を
構成する複数の認識単位中に上記認識結果に無い認識単
位がある場合には、認識結果追加部によって当該認識単
位に所定の重みが付加されて上記認識結果に自動的に追
加される。こうすることによって、上記認識候補がリジ
ェクトされる場合がなく、上記認識候補生成部によって
生成された総ての認識候補の重みがトップダウン的に算
出される。
Further, in the second invention, a recognition result composed of a weighted recognition unit group is output from the recognition device. When the weight of the recognition candidate is calculated by the top-down processing unit, if there is a recognition unit not included in the recognition result among the plurality of recognition units constituting the recognition candidate, the recognition result adding unit performs the recognition. A predetermined weight is added to the unit and automatically added to the recognition result. By doing so, there is no case where the recognition candidate is rejected, and the weights of all the recognition candidates generated by the recognition candidate generator are calculated from the top down.

【0014】また、第3の発明では、上記認識装置によ
る認識に存在する誤認識のパターンに当て嵌まる認識結
果の表記が1つのカテゴリに属するような表記に変換さ
れるルールに基づいて、上記表記変換部によって上記認
識装置からの認識結果の表記が変換される。こうして、
上記認識結果が、認識装置による認識誤りの傾向に応じ
て効率良く表記変換される。
[0014] In the third invention, the notation based on the recognition result applicable to the erroneous recognition pattern existing in the recognition by the recognition device is converted into a notation that belongs to one category. The notation of the recognition result from the recognition device is converted by the conversion unit. Thus,
The above-mentioned recognition result is efficiently transcribed according to the tendency of recognition errors by the recognition device.

【0015】[0015]

【実施例】以下、この発明を図示の実施例により詳細に
説明する。本実施例においては、音節を認識単位とし、
文節を単位として言語処理を行う場合に基づいて説明す
る。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, the present invention will be described in detail with reference to the illustrated embodiments. In this embodiment, syllables are used as recognition units,
A description will be given based on a case where language processing is performed in units of phrases.

【0016】<第1実施例> 図1は本実施例における認識用言語処理装置のブロック
図を示す。入出力部2は、入力された音声信号を音声認
識装置10に送出する一方、音声認識装置10からの音
節単位の認識結果である音節候補を受け取ってラティス
作成部3に出力する。ラティス作成部3は入力された音
節候補から音節ラティスを作成する。
<First Embodiment> FIG. 1 is a block diagram of a recognition language processing apparatus according to this embodiment. The input / output unit 2 sends the input speech signal to the speech recognition device 10, receives a syllable candidate that is a recognition result in syllable units from the speech recognition device 10, and outputs the syllable candidate to the lattice creation unit 3. The lattice creation unit 3 creates a syllable lattice from the input syllable candidates.

【0017】縮小表記変換部4は、ラティス作成部3か
らの音節ラティスを受け取り、音節ラティスを構成する
各音節候補の表記を所定のルールに従って縮小表記に変
換して縮小表記音節ラティスを得る。上記ルールは、音
節ラティスを構成する音節候補の表記(以下、この表記
を元表記と言う)を後に詳述するような母音を表す表記
(以下、この表記を縮小表記と言う)に変換するルールで
ある。尚、この場合のルールは、元表記と縮小表記との
関係を表すテーブルにテーブル化して、メモリに格納し
ておいてもよい。
The reduced notation conversion unit 4 receives the syllable lattice from the lattice creation unit 3 and converts the notation of each syllable candidate constituting the syllable lattice into reduced notation according to a predetermined rule to obtain a reduced notation syllable lattice. The above rule is a notation representing a vowel as described in detail later on the notation of syllable candidates constituting the syllable lattice (hereinafter this notation is called the original notation).
(Hereinafter, this notation is referred to as reduced notation.) Note that the rules in this case may be tabulated in a table representing the relationship between the original notation and the reduced notation and stored in a memory.

【0018】縮小表記言語処理部5は、上記縮小表記変
換部4によって得られた縮小表記音節ラティスを展開
し、縮小表記辞書6を用いて縮小表記言語処理を実施す
る。そして、候補削除部7は、縮小表記言語処理部5か
らの縮小表記言語処理の結果を参照して、ラティス作成
部3で作成された音節ラティスを構成する音節候補のう
ちから在り得ない音節候補を削除する。以後、元表記言
語処理部8は、この在り得ない音節候補が削除されて構
成要素が少なくなった音節ラティスを展開して文節候補
列を作成し、元表記辞書9を用いて元表記言語処理を実
施するのである。
The reduced notation language processing unit 5 expands the reduced notation syllable lattice obtained by the reduced notation conversion unit 4 and performs reduced notation language processing using the reduced notation dictionary 6. Then, the candidate deleting unit 7 refers to the result of the reduced notation language processing from the reduced notation language processing unit 5, and selects an impossible syllable candidate from the syllable candidates constituting the syllable lattice created by the lattice creating unit 3. Remove. Thereafter, the original notation language processing unit 8 develops the syllable lattice in which the impossible syllable candidates are deleted and the number of constituent elements is reduced to create a phrase candidate sequence, and uses the original notation dictionary 9 to perform the original notation language processing. Is implemented.

【0019】こうして元表記言語処理に成功した文節候
補列は、入出力部2を介して外部装置(図示しない認識
結果を得ようとする装置)に出力される。
The phrase candidate sequence successfully processed in the original notation language is output to an external device (a device for obtaining a recognition result, not shown) via the input / output unit 2.

【0020】次に、上記元表記辞書9および縮小表記辞
書6の内容、上記ラティス作成部3で作成される音節ラ
ティスの内容、上記縮小表記変換部4,縮小表記言語処
理部5,候補削除部7および元表記言語処理部8によっ
て実施される各処理について詳細に説明する。
Next, the contents of the original notation dictionary 9 and the reduced notation dictionary 6, the contents of the syllable lattice created by the lattice creation unit 3, the reduced notation conversion unit 4, the reduced notation language processing unit 5, and the candidate deletion unit 7 and each processing performed by the original notation language processing unit 8 will be described in detail.

【0021】図2は、本実施例において扱う上記言語処
理辞書としての元表記辞書9の内容を示す。この元表記
辞書9には3つの接頭語,5つの自立語および3つの付
属語が登録されている。そして、総ての自立語はその前
に接頭語が付く可能性を有する一方、その後ろには付属
語が付く可能性を有しているものとする。
FIG. 2 shows the contents of the original notation dictionary 9 as the language processing dictionary handled in this embodiment. In the original notation dictionary 9, three prefixes, five independent words, and three attached words are registered. Then, it is assumed that all independent words have a possibility of being prefixed with a prefix, while others have a possibility of having an attached word.

【0022】図3は、5音節「国民の」の発声を認識した
結果、ラティス作成部3によって得られる音節ラティス
を示す。但し、括弧内の数字は各音節候補のマッチング
距離(以下、単に距離と言う)を示す。この例において
は、各音節に対して3〜5の音節候補が存在し、それら
の音節候補を言語処理のために展開すると合計720の
文節候補列が得られる。
FIG. 3 shows a syllable lattice obtained by the lattice creation unit 3 as a result of recognizing the utterance of the five-syllable "national". However, the numbers in parentheses indicate the matching distance of each syllable candidate (hereinafter simply referred to as distance). In this example, there are 3 to 5 syllable candidates for each syllable, and when these syllable candidates are expanded for language processing, a total of 720 syllable candidate sequences are obtained.

【0023】図4は、図3に示す音節ラティスを展開し
て得られる上記720の文節候補列に対して、図2に示
す元表記辞書9を用いて元表記言語処理を実施した場合
に得られる認識結果列を示す。ここで言う元表記言語処
理とは一般的な仮名漢字変換の処理を指しており、仮名
漢字変換に失敗した認識結果列はリジェクトされる。
尚、図4においては、仮名漢字変換に成功した認識結果
列を距離の小さい順に並べてある。この距離は、認識結
果列を構成する各音節候補の距離(図3参照)の合計値で
ある。
FIG. 4 shows a case where the original spelling language processing is performed using the original spelling dictionary 9 shown in FIG. 2 with respect to the above 720 candidate phrase strings obtained by expanding the syllable lattice shown in FIG. FIG. The original notation language processing here refers to general kana-kanji conversion processing, and a recognition result sequence in which kana-kanji conversion has failed is rejected.
In FIG. 4, recognition result strings that have been successfully converted into kana-kanji characters are arranged in ascending order of distance. This distance is the total value of the distances (see FIG. 3) of each syllable candidate constituting the recognition result sequence.

【0024】この発明は、図3に示す音節ラティス(認
識結果)から図2に示す元表記辞書9を用いて図4に示
す認識結果列を如何に早く得るかに関するものである。
The present invention relates to how to obtain the recognition result sequence shown in FIG. 4 from the syllable lattice (recognition result) shown in FIG. 3 using the original notation dictionary 9 shown in FIG.

【0025】図5は、この発明の特徴である上記圧縮辞
書としての縮小表記辞書6の内容を示す。ここで言う縮
小表記とは、認識結果として得られる音節候補をより少
ない表記に変換したものを言う。すなわち、本実施例で
は、「あ/か/さ/た/な/...」の合計111種類の音節を母
音が同じ音節毎にグループ化し、母音/あ/のグループに
属する音節には縮小表記/A/を与える。以下同様にし
て、母音/い/のグループには縮小表記/I/を与え、母音
/う/のグループには縮小表記/U/を与え、母音/え/のグ
ループには縮小表記/E/を与え、母音/お/のグループに
は縮小表記/O/を与える。また、撥音/ん/には縮小表記
/X/を与える。こうして、111種類の音節は/A/,/I
/,/U/,/E/,/O/および/X/の6種類の縮小表記で表さ
れて、元表記のカテゴリ数“111"が“6"に圧縮され
る。
FIG. 5 shows the contents of the reduced notation dictionary 6 as the compression dictionary, which is a feature of the present invention. Here, the reduced notation refers to a syllable candidate obtained as a result of recognition converted to a lesser notation. That is, in the present embodiment, a total of 111 syllables “a / ka / sa / ta / na / ...” are grouped for each syllable having the same vowel, and reduced to syllables belonging to the vowel / a / group. Give the notation / A /. Similarly, the vowel / i / group is given a reduced notation / I /
The / u / group is given reduced notation / U /, the vowel / e / group is given reduced notation / E /, and the vowel / o / group is given reduced notation / O /. In addition, sound-repellent / n / reduced notation
Give / X /. Thus, the 111 syllables are / A /, / I
Expressed in six types of reduced notation of /, / U /, / E /, / O / and / X /, the number of categories “111” in the original notation is compressed to “6”.

【0026】上記縮小表記辞書6は、図2に示す元表記
辞書9における各見出し語をより少ない縮小表記(本実
施例の場合には母音列と発音を表す上記6種類の縮小表
記)で表したものである。例えば、図2における元表記
辞書9の自立語辞書には5種類の見出し語「こくみん」,
「こうみん」,「とうみん」,「ふにん」及び「ふみん」が登録さ
れているが、縮小表記に置き換えた段階で「こくみん」,
「こうみん」及び「とうみん」は同じ表記「OUIN」とな
り、「ふにん」及び「ふみん」は同じ表記「UIX」となる。
その結果、縮小表記辞書6における自立語辞書の見出し
語は2種類に減少する。
In the reduced notation dictionary 6, each headword in the original notation dictionary 9 shown in FIG. 2 is represented by a smaller reduced notation (in the case of the present embodiment, the above-described six reduced notations representing vowel strings and pronunciation). It was done. For example, in the independent word dictionary of the original notation dictionary 9 in FIG. 2, five types of headwords “Kokumin”,
"Komin", "Tomin", "Funin" and "Fumin" are registered, but when they are replaced with reduced notation, "Kokumin",
"Komin" and "Tomin" have the same notation "OUIN", and "Fuin" and "Fumin" have the same notation "UX".
As a result, the number of entry words of the independent word dictionary in the reduced notation dictionary 6 is reduced to two types.

【0027】実際には、上記元表記辞書9の各項目には
接続関係や活用種類等を示す各種フラグが付いているた
めに、単に縮小表記が同じであるというだけで見出しを
統合することはできない。そのような場合であっても新
たなフラグを新設したり、一つの見出し語に対して複数
のフラグ領域を持たせるなどの操作を行うことによっ
て、同様の見出し語の統合は可能である。
Actually, since each item of the original notation dictionary 9 has various flags indicating a connection relation, a utilization type, and the like, it is not possible to integrate headings simply because the reduced notation is the same. Can not. Even in such a case, similar headwords can be integrated by performing operations such as newly setting a new flag or providing a plurality of flag areas for one headword.

【0028】図6は、図3に示す音節ラティスに対し
て、縮小表記変換部4によって縮小表記変換を行った結
果得られる縮小表記音節ラティスである。括弧内には、
同一縮小表記になった元の音節が有する距離のうち最小
の距離を記述する。
FIG. 6 shows a reduced syllable lattice obtained by performing a reduced notation conversion by the reduced notation conversion unit 4 on the syllable lattice shown in FIG. In parentheses,
Describe the minimum distance among the distances of the original syllable in the same reduced notation.

【0029】図7は、図6に示す縮小表記音節ラティス
に対して、図5に示す縮小表記辞書6を用いて縮小表記
言語処理部5によって縮小表記言語処理を実施して得ら
れる結果である。図7においては、図6に示す縮小表記
音節ラティスの総ての組み合わせから得られる縮小表記
文節候補列を列記し、縮小表記言語処理に成功した縮小
表記文節候補列には○を付す一方、縮小表記言語処理に
失敗してリジェクトされる縮小表記文節候補列には×を
付している。
FIG. 7 shows a result obtained by performing reduced notation language processing on the reduced notation syllable lattice shown in FIG. 6 by the reduced notation language processing unit 5 using the reduced notation dictionary 6 shown in FIG. . In FIG. 7, reduced notation phrase candidate strings obtained from all combinations of the reduced notation syllable lattices shown in FIG. 6 are listed, and the reduced notation phrase candidate strings that have been successfully subjected to the reduced notation language processing are marked with a circle. The reduced notation phrase candidate sequence that is rejected due to failure in the notation language processing is marked with x.

【0030】ここで、本実施例の場合には、図6に示す
ように、縮小表記音節ラティスを構成する音節候補数
は、第1音節は“1",第2音節は“2",第3音節は
“1",第4音節は“2"および第5音節は“2"であるか
ら、縮小表記音節ラティスの総ての組み合わせから得ら
れる縮小表記文節候補列数は“8(=1×2×1×2×
2)"であり、図3に示す音節ラティスを展開して得られ
る文節候補列数“720(=4×4×3×3×5)"に比
較して大幅に減少されている。したがって、上記縮小表
記辞書6に登録されている見出し語が少なくなっている
ことと相俟って、上記縮小表記文節候補列に対して縮小
表記言語処理を実施する際の処理回数も大幅に縮小でき
るのである。また、縮小表記言語処理に成功した文節候
補列数は“2"であり、図4に示す縮小表記処理に因ら
ない場合の文節候補列数“9"よりも少なく、以後の処
理を容易にする。
Here, in the case of this embodiment, as shown in FIG. 6, the number of syllable candidates constituting the reduced notation syllable lattice is "1" for the first syllable, "2" for the second syllable, and "2" for the second syllable. Since the third syllable is “1”, the fourth syllable is “2”, and the fifth syllable is “2”, the number of reduced notation syllable candidate columns obtained from all combinations of reduced notation syllable lattices is “8 (= 1 × 2 × 1 × 2 ×
2) ", which is much smaller than the number of phrase candidate strings" 720 (= 4 × 4 × 3 × 3 × 5) ”obtained by expanding the syllable lattice shown in FIG. In combination with the fact that the number of headwords registered in the reduced notation dictionary 6 is reduced, the number of times of performing the reduced notation language processing on the reduced notation phrase candidate sequence can be greatly reduced. In addition, the number of phrase candidate columns that succeeded in the reduced notation language processing is “2”, which is smaller than the number of phrase candidate columns “9” that is not related to the reduced notation processing shown in FIG. make it easier.

【0031】図8は、上記縮小表記言語処理に成功した
2つの縮小表記文節候補「OUIXO」および「OUIX
E」に対応する元表記辞書(図2参照)9の見出し語の組
み合わせを示す。括弧内に列挙した文節がその左側に記
載した縮小表記文節から得られる総ての文節である。
FIG. 8 shows two reduced notation phrase candidates "OUIXO" and "OUIX" which succeeded in the above-described reduced notation language processing.
A combination of headwords of the original notation dictionary (see FIG. 2) 9 corresponding to "E" is shown. The clauses listed in parentheses are all the clauses obtained from the reduced notation clause described on the left side.

【0032】次に、上述のようにして得られた2つの縮
小表記文節候補から元表記による文節候補を求めるので
あるが、この処理は次のようにして行う。すなわち、先
ず図3に示す音節ラティスを構成する音節候補の中か
ら、図7に示す縮小表記文節候補を作成することができ
ない音節候補を候補削除部7によって削除する。そし
て、残った音節候補から成る音節ラティスを展開して文
節候補を得ることによって行うのである。換言すれば、
上記縮小表記文節候補を作成することは文節候補列の予
備選択を行うことを意味し、縮小表記言語処理部5は上
記認識候補予備選択部である。
Next, a phrase candidate in the original notation is obtained from the two reduced phrase clause candidates obtained as described above. This process is performed as follows. That is, first, from the syllable candidates forming the syllable lattice shown in FIG. 3, the syllable candidates for which the reduced notation syllable candidates shown in FIG. 7 cannot be created are deleted by the candidate deleting unit 7. Then, the syllable lattice composed of the remaining syllable candidates is expanded to obtain syllable candidates. In other words,
Creating the reduced notation phrase candidate means performing preliminary selection of a phrase candidate sequence, and the reduced notation language processing unit 5 is the recognition candidate preliminary selection unit.

【0033】図9は、図3に示す音節ラティスから図7
に示す縮小表記言語処理後の縮小表記文節候補を作成で
きない(すなわち、在り得ない)音節候補を削除した結果
を示す。この在り得ない音節候補の削除は、次のように
して行われる。図3(図9)に示す音節ラティスにおける
第1音節の第1位音節候補は/こ/であるからその縮小表
記は/O/である。一方、図7に示す縮小表記文節候補列
における第1音節の縮小表記は/O/であり、両縮小表記
は一致する。したがって、上記音節候補/こ/は在り得る
音節候補であるとして採択する(図9においては○を付
加)。以下同様に、第1音節の第2位音節候補以降の総
ての音節候補の縮小表記と縮小表記文節候補列の対応す
る音節の縮小表記とを順次比較する。
FIG. 9 shows the syllable lattice shown in FIG.
7 shows the result of deleting the syllable candidates that cannot be created (that is, cannot exist) after the reduced notation phrase processing after the reduced notation language processing shown in FIG. The deletion of this impossible syllable candidate is performed as follows. Since the first syllable candidate of the first syllable in the syllable lattice shown in FIG. 3 (FIG. 9) is / ko /, its reduced notation is / O /. On the other hand, the reduced notation of the first syllable in the reduced notation phrase candidate string shown in FIG. 7 is / O /, and both reduced notations match. Therefore, the syllable candidate / this / is adopted as a possible syllable candidate (in FIG. 9, a circle is added). Similarly, the reduced notation of all syllable candidates after the second syllable candidate of the first syllable and the reduced notation of the corresponding syllable in the reduced notation syllable candidate sequence are sequentially compared.

【0034】その際に、上記音節ラティスの音節候補と
縮小表記文節候補列の対応する音節との縮小表記が異な
る場合には、その音節候補は在り得ない音節候補である
としてリジェクトする(図9においては×を付加)。但
し、上記縮小表記文節候補列における第5音節の場合に
は、その縮小表記が/O/と/E/の2通り許されるから、
音節ラティスにおける第5音節の縮小表記が/O/あるい
は/E/であればその音節候補は在り得ると判定する。
At this time, if the syllable candidates of the syllable lattice and the corresponding syllables of the reduced syllable syllable candidate sequence are different, the syllable candidate is rejected as an impossible syllable candidate (FIG. 9). Is added with x). However, in the case of the fifth syllable in the reduced notation phrase candidate sequence, two reduced notations, / O / and / E /, are allowed.
If the reduced notation of the fifth syllable in the syllable lattice is / O / or / E /, it is determined that there is a syllable candidate.

【0035】ここで、図9に示すように、上記得られた
2つの縮小表記文節候補「OUIXO」および「OUIX
E」に寄与しない音節候補を削除した後の音節ラティス
を構成する音節候補数は、第1音節は“4",第2音節は
“3",第3音節は“3",第4音節は“1"および第5音
節は“5"であるから、図9に示す音節ラティスの総て
の組み合わせから得られる文節候補列数は“180(=
4×3×3×1×5)"であり、図3に示す音節ラティス
を展開して得られる文節候補列数“720"に比較して
1/4に減少されている。したがって、上記元表記言語
処理部8によって実施される元表記言語処理回数も大幅
に縮小できるのである。
Here, as shown in FIG. 9, the two reduced notation phrase candidates “OUIXO” and “OUIX” obtained above are obtained.
The number of syllable candidates constituting the syllable lattice after deleting syllable candidates that do not contribute to "E" is "4" for the first syllable, "3" for the second syllable, "3" for the third syllable, and "4" for the fourth syllable. Since “1” and the fifth syllable are “5”, the number of phrase candidate strings obtained from all combinations of the syllable lattices shown in FIG. 9 is “180 (=
4 × 3 × 3 × 1 × 5) ", which is reduced to 1/4 of the number of phrase candidate strings“ 720 ”obtained by expanding the syllable lattice shown in FIG. The number of times of the original notation language processing performed by the notation language processing unit 8 can be greatly reduced.

【0036】図10は、図9に示す音節ラティスを展開
して得られた文節候補列に、図2に示す元表記辞書9を
用いて元表記言語処理部8によって元表記言語処理を行
った結果を形態素解析結果をも含めて表記したものであ
る。尚、この発明と直接は関係ないので詳述は避ける
が、上記形態素解析も一般的な仮名漢字変換処理(言語
処理)内で実施される。図中に示す“//"の部分は、接頭
語−自立語連鎖における接頭語と自立語との境界あるい
は自立語−接尾語連鎖における自立語と接尾語との境界
を示す。
FIG. 10 shows an original notation language process performed by the original notation language processing unit 8 on the phrase candidate sequence obtained by expanding the syllable lattice shown in FIG. 9 using the original notation dictionary 9 shown in FIG. The results are shown including the morphological analysis results. Although not directly related to the present invention, detailed description is omitted, but the morphological analysis is also performed in a general kana-kanji conversion process (language process). The "//" part shown in the figure indicates the boundary between the prefix and the independent word in the prefix-independent word chain or the boundary between the independent word and the suffix in the independent word-suffix chain.

【0037】以後は、図10に示すように得られた文節
候補列が、距離の近い順に表示されて目的とする文節候
補がオペレータによって指示選択されることになる。
Thereafter, the phrase candidate strings obtained as shown in FIG. 10 are displayed in the order of shortest distance, and the target phrase candidate is designated and selected by the operator.

【0038】次に、本実施例による言語処理時間を従来
法による言語処理時間と比較してみる。ここで、言語処
理速度の仮定として、1つの文節候補を処理する速度を
1単位/候補とする一方、文字を処理する速度を0.1単
位/文字として、処理時間を“単位"で表すものとする。
また、使用する言語辞書は図2に示す元表記辞書9およ
び図5に示す縮小表記辞書6であり、認識の結果得られ
た音節ラティスは図3に示す音節ラティスであるとす
る。
Next, the language processing time according to the present embodiment will be compared with the language processing time according to the conventional method. Here, assuming the language processing speed, the processing speed of one phrase candidate is set to 1 unit / candidate, while the processing speed of characters is set to 0.1 unit / character, and the processing time is expressed in "units". And
The language dictionaries used are the original notation dictionary 9 shown in FIG. 2 and the reduced notation dictionary 6 shown in FIG. 5, and the syllable lattice obtained as a result of recognition is the syllable lattice shown in FIG.

【0039】〔従来法(音節ラティスを総て展開して言
語処理を行う)〕 言語処理=1単位/候補×720候補 =720単位 合計=720単位 〔本実施例〕 音節ラティスの縮小表記 =0.1単位/文字×19文字 =1.9単位 縮小表記言語処理 =1単位/候補×8候補 =8単位 音節ラティスから在り得ない音節候補を削除 =0.1単位/文字×19文字 =1.9単位 言語処理=1単位/候補×180候補 =180単位 合計=191.8単位 すなわち、本実施例によれば、言語処理時間を従来法の
1/4強に短縮できるのである。
[Conventional Method (Language processing is performed by expanding all syllable lattices)] Linguistic processing = 1 unit / candidate × 720 candidate = 720 units Total = 720 units [Example] Reduced notation of syllable lattice = 0 .1 unit / character x 19 characters = 1.9 unit Reduced notation language processing = 1 unit / candidate x 8 candidates = 8 units Delete impossible syllable candidates from syllable lattice = 0.1 unit / character x 19 characters = 1 .9 units Language processing = 1 unit / candidate × 180 candidates = 180 units Total = 191.8 units That is, according to the present embodiment, the language processing time can be reduced to just over a quarter of the conventional method.

【0040】図11は、上記音声認識装置10および認
識用言語処理装置1によって実施される音声認識/言語
処理動作のフローチャートである。以下、図1および図
11に従って、音声認識/言語処理動作について順を追
って説明する。
FIG. 11 is a flowchart of a voice recognition / language processing operation performed by the voice recognition device 10 and the language processing device 1 for recognition. Hereinafter, the speech recognition / language processing operation will be described step by step with reference to FIGS.

【0041】ステップS1で、上記入出力部2から入力
された音声信号に対して音声認識装置10によって認識
処理が実施されて、音節単位で認識される。ステップS
2で、上記ステップS1における認識結果に基づいて、ラ
ティス作成部3によって、図3に示すような音節ラティ
スが作成される。
In step S 1, the speech signal input from the input / output unit 2 is subjected to recognition processing by the speech recognition device 10, and is recognized in syllable units. Step S
In 2, the syllable lattice as shown in FIG. 3 is created by the lattice creating unit 3 based on the recognition result in step S1.

【0042】ステップS3で、上記ステップS2において
得られた音節ラティスが縮小表記変換部4によって縮小
表記変換されて、図6に示すような縮小表記音節ラティ
スが作成される。ステップS4で、上記ステップS3にお
いて作成された縮小表記音節ラティスが縮小表記言語処
理部5によって展開され、さらに得られた縮小表記文節
候補列に対して縮小表記辞書6を用いて縮小表記言語処
理が実施される。
In step S3, the syllabic lattice obtained in step S2 is subjected to reduced notation conversion by the reduced notation conversion unit 4, and a reduced notation syllable lattice as shown in FIG. 6 is created. In step S4, the reduced notation syllable lattice created in step S3 is expanded by the reduced notation language processing unit 5, and the obtained reduced notation phrase candidate sequence is subjected to reduced notation language processing by using the reduced notation dictionary 6. Will be implemented.

【0043】ステップS5で、上記候補削除部7によっ
て、上記ステップS4において縮小表記言語処理に成功
した縮小表記文節候補(図7において、○印が付記され
た縮小表記文節候補列)を参照して、上記ステップS2に
おいて作成された音節ラティスの中から在り得ない音節
候補が削除される。ステップS6で、上記ステップS5に
おいて在り得ない音節候補が削除された音節ラティスが
元表記言語処理部8によって展開され、さらに得られた
文節候補列に対して元表記辞書9を用いて元表記言語処
理が実施される。こうして、多くの音節候補の組合せか
らなる文節候補列の中から少ない時間で確からしい文節
候補列を得ることができる。
In step S5, the candidate deletion unit 7 refers to the reduced notation phrase candidate (reduced notation phrase candidate sequence marked with a circle in FIG. 7) that has been successfully processed in the reduced notation language processing in step S4. Then, impossible syllable candidates are deleted from the syllable lattice created in step S2. In step S6, the syllable lattice from which the syllable candidates that cannot exist in step S5 are deleted is expanded by the original notation language processing unit 8, and the obtained syllable candidate sequence is converted to the original notation language using the original notation dictionary 9 Processing is performed. In this way, a reliable phrase candidate sequence can be obtained in a short time from a phrase candidate sequence composed of many combinations of syllable candidates.

【0044】上述のように、本実施例においては、縮小
表記変換部4によって音節ラティスを縮小表記に変換
し、得られた縮小表記音節ラティスに基づいて縮小表記
言語処理部5によって縮小表記言語処理を実施して縮小
表記文節候補列を得る。このように、認識結果を縮小表
記によって一旦少ない表記で表して少ない時間で言語処
理(縮小表記言語処理)を行う。そして、縮小表記言語処
置に成功した縮小表記文節候補列を参考にして、元表記
による音節ラティスの中から在り得ない音節候補を候補
削除部7によって削除して音節ラティスを構成する音節
候補数を少なくする。
As described above, in the present embodiment, the syllabic lattice is converted into the reduced notation by the reduced notation conversion unit 4 and the reduced notation language processing unit 5 executes the reduced notation language processing unit 5 based on the obtained reduced notation syllable lattice. To obtain a reduced notation clause candidate sequence. As described above, the recognition result is once represented by the reduced notation by the reduced notation, and the language processing (reduced notation language processing) is performed in a short time. Then, with reference to the reduced notation syllable candidate sequence that has been successfully subjected to the reduced notation linguistic treatment, the candidate deleting unit 7 deletes impossible syllable candidates from the syllabic lattice in the original notation, and calculates the number of syllable candidates constituting the syllable lattice Reduce.

【0045】したがって、以後、上記元表記言語処理部
8によって実施される音節ラティスの展開および元表記
言語処理が、少ない音節候補から成る音節ラティスによ
って短時間に実行できるのである。
Therefore, thereafter, the expansion of the syllabic lattice and the processing of the original syllabic language performed by the original syllabic language processing section 8 can be executed in a short time by the syllable lattice composed of a small number of syllable candidates.

【0046】<第2実施例> 図12は本実施例における認識用言語処理装置のブロッ
ク図を示す。入出力部,ラティス作成部,縮小表記変換
部,縮小表記言語処理部および縮小表記辞書は、図1に
示す認識用言後処理装置1と同じであるから図1と同じ
番号を付して簡単に説明する。入出力部2は音声認識装
置10からの音節候補をラティス作成部3に送出し、ラ
ティス作成部3は入力された音節候補からラティスを作
成する。縮小表記変換部4はラティス作成部3からの音
節ラティスの表記を所定のルールに従って縮小表記に変
換する。縮小表記言語処理部5は、縮小表記変換部4に
よって得られた縮小表記音節ラティスを展開して縮小表
記言語処理を実施する。
<Second Embodiment> FIG. 12 is a block diagram of a recognition language processing apparatus according to this embodiment. The input / output unit, lattice creation unit, reduced notation conversion unit, reduced notation language processing unit, and reduced notation dictionary are the same as those of the recognition word post-processing device 1 shown in FIG. Will be described. The input / output unit 2 sends syllable candidates from the speech recognition device 10 to the lattice creation unit 3, and the lattice creation unit 3 creates a lattice from the input syllable candidates. The reduced notation conversion unit 4 converts the notation of the syllable lattice from the lattice creation unit 3 into reduced notation according to a predetermined rule. The reduced notation language processing unit 5 expands the reduced notation syllable lattice obtained by the reduced notation conversion unit 4 and performs reduced notation language processing.

【0047】解析部12は、縮小表記言語処理部5から
の縮小表記文節候補列に基づいて文節候補列の構造を解
析し、縮小表記による単語連鎖を作成する。元表記変換
部13は、解析部12によって作成された縮小表記によ
る単語連鎖を、その縮小表記見出し語に該当する元表記
単語に変換する。トップダウン処理部14は、上記ラテ
ィス作成部3によって作成された音節ラティスと元表記
変換部13によって得られた元表記単語とに基づいて、
後に詳述するようにしてトップダウン評価を行う。
The analysis unit 12 analyzes the structure of the phrase candidate sequence based on the reduced phrase candidate sequence from the reduced notation language processing unit 5 and creates a word chain using the reduced notation. The original notation conversion unit 13 converts the word chain based on the reduced notation created by the analysis unit 12 into the original notation word corresponding to the reduced notation headword. The top-down processing unit 14 calculates the syllable lattice created by the lattice creation unit 3 and the original notation word obtained by the original notation conversion unit 13,
Top-down evaluation is performed as described in detail below.

【0048】スコア計算部15は、上記トップダウン処
理部14によるトップダウン評価結果および解析部12
からの解析結果に基づいて、文節候補単位でのスコアを
算出する。そうすると、ソーティング部16は、スコア
計算部15からのスコアが付加された文節候補列をスコ
アの低い順にソーティングする。
The score calculation unit 15 calculates the top-down evaluation result by the top-down processing unit 14 and the analysis unit 12
Then, a score is calculated for each phrase candidate based on the analysis result from. Then, sorting section 16 sorts the phrase candidate strings to which the scores from score calculation section 15 have been added in ascending order of the scores.

【0049】こうしてスコアの低い順に並べられた文節
候補列は、入出力部2を介して外部装置(図示しない認
識結果を得ようとする装置)に出力される。
The phrase candidate strings arranged in ascending order of the scores are output via the input / output unit 2 to an external device (device not shown for obtaining a recognition result).

【0050】次に、上記解析部12,元表記変換部13,
トップダウン処理部14およびスコア計算部15によっ
て実施される各処理について詳細に説明する。尚、縮小
表記辞書6の内容、上記ラティス作成部3で作成される
音節ラティスの内容、上記縮小表記変換部4および縮小
表記言語処理部5によって実施される各処理について
は、既に第1実施例において詳細に説明したので省略す
る。
Next, the analysis unit 12, the original notation conversion unit 13,
Each process performed by the top-down processing unit 14 and the score calculation unit 15 will be described in detail. Note that the contents of the reduced notation dictionary 6, the contents of the syllable lattice created by the lattice creation unit 3, and the processes performed by the reduced notation conversion unit 4 and the reduced notation language processing unit 5 have already been described in the first embodiment. Are described in detail above, and a description thereof will be omitted.

【0051】図13は、上記縮小表記言語処理部5での
縮小表記言語処理の結果図7に示すように得られた縮小
表記文節候補列を解析部12によって解析した結果に、
元表記変換部13によって変換した元表記単語候補を併
せて表示した図である。すなわち、解析部12および元
表記変換部13によって上記認識候補生成部を構成する
のである。
FIG. 13 shows a result of the analysis unit 12 analyzing the reduced notation phrase candidate string obtained as a result of the reduced notation language processing in the reduced notation language processing unit 5 as shown in FIG.
FIG. 6 is a diagram also showing original notation word candidates converted by the original notation conversion unit 13. That is, the analysis unit 12 and the original notation conversion unit 13 constitute the recognition candidate generation unit.

【0052】図14および図15は、上記トップダウン
処理部14によるトップダウン評価結果を示す。図14
は図13に示す自立語「OUIX」の部分に対するトップ
ダウン評価結果である。トップダウン評価とは、例えば
縮小表記「OUIX」に該当する元表記単語候補「こくみ
ん」,「こうみん」および「とうみん」に対して言語処理をト
ップダウン的に行うのである。これに対して従来から実
施されている言語処理はボトムアップ的言語処理であ
り、音節候補の総ての組合せから得られる総ての文節候
補に対して言語処理を実施するのである。
FIGS. 14 and 15 show the results of the top-down evaluation performed by the top-down processing unit 14. FIG. FIG.
Is a top-down evaluation result for the part of the independent word "OUIX" shown in FIG. The top-down evaluation is to perform top-down linguistic processing on the original notation word candidates “Kokumin”, “Koumin”, and “Toumin” corresponding to, for example, the reduced notation “OUIX”. On the other hand, the linguistic processing conventionally performed is a bottom-up linguistic processing in which linguistic processing is performed on all syllable candidates obtained from all combinations of syllable candidates.

【0053】上記トップダウン評価を詳しく述べれば、
先ず、図14(a)に示す「こくみん」の場合には、第1音
節は「こ」であり、図3に示す音節ラティスにおける第1
音節の音節候補から、第1音節の距離は“1.0"である
と求められる。以下同様にして、第2音節,第3音節お
よび第4音節の距離が求められる。そして、このように
して求められた第1音節〜第4音節の距離を加算して単
語候補「こくみん」の距離“4.2"を得る。同様にして、
単語候補「こうみん」及び「とうみん」に対するトップダウ
ン評価を実施する。但し、図14(b)に示す単語候補「こ
うみん」の場合には第2音節「う」が図3に示す音節ラテ
ィスに存在せず、また、図14(c)に示す単語候補「とう
みん」の場合には第1音節「と」および第2音節「う」が音
節ラティスに存在しない。したがって、上記距離が算出
できないのでリジェクトされる。
The above-mentioned top-down evaluation will be described in detail.
First, in the case of “Kokumin” shown in FIG. 14A, the first syllable is “Ko”, and the first syllable in the syllable lattice shown in FIG.
From the syllable candidates, the distance of the first syllable is determined to be “1.0”. Similarly, the distances between the second syllable, the third syllable, and the fourth syllable are obtained. Then, the distances of the first to fourth syllables thus obtained are added to obtain the distance “4.2” of the word candidate “Kokumin”. Similarly,
A top-down evaluation is performed on the word candidates “Komin” and “Tomin”. However, in the case of the word candidate “Komin” shown in FIG. 14B, the second syllable “U” does not exist in the syllable lattice shown in FIG. 3, and the word candidate “Tou” shown in FIG. In the case of "min", the first syllable "to" and the second syllable "u" do not exist in the syllable lattice. Therefore, since the distance cannot be calculated, it is rejected.

【0054】図15は図13における他の部分に対する
トップダウン評価結果を示し、図15(a)は接頭語「O」
の部分に対するトップダウン評価結果であり、図15
(b)は自立語「UIX」の部分に対するトップダウン評価
結果であり、図15(c)は接尾語「O」および「E」の部分
に対するトップダウン評価結果である。
FIG. 15 shows a top-down evaluation result with respect to other parts in FIG. 13, and FIG. 15 (a) shows a prefix "O".
15 is a top-down evaluation result for the portion of FIG.
FIG. 15B shows a top-down evaluation result for the independent word “UX”, and FIG. 15C shows a top-down evaluation result for the suffixes “O” and “E”.

【0055】図16は、上記解析部12による文節候補
の構造解析結果,元表記変換部13による元表記変換結
果およびトップダウン処理部14によるトップダウン評
価結果をまとめて表記した図である。
FIG. 16 is a diagram collectively showing the result of the structural analysis of the phrase candidate by the analysis unit 12, the result of the original notation conversion by the original notation conversion unit 13, and the result of the top-down evaluation by the top-down processing unit 14.

【0056】図17は、上記スコア計算部15によっ
て、図16に示す各単語候補を組合せて作成した各文節
候補を構成する単語候補の距離を加算してスコアを算出
し、上記ソーティング部16によって、各スコアの小さ
い順にソーティングした結果の文節候補を示す。
FIG. 17 shows a score calculated by the score calculation unit 15 by adding the distances of the word candidates constituting each phrase candidate created by combining the word candidates shown in FIG. And phrase candidates as a result of sorting in ascending order of each score.

【0057】次に、本実施例による言語処理時間を従来
法による言語処理時間と比較してみる。ここで、言語処
理速度の仮定は上述の第1実施例の場合と同じである。
さらに、使用する言語辞書は図6に示す縮小表記辞書6
であり、認識の結果得られた音節ラティスは図3に示す
音節ラティスであるとする。
Next, the language processing time according to the present embodiment will be compared with the language processing time according to the conventional method. Here, the assumption of the language processing speed is the same as that of the first embodiment.
Further, a language dictionary to be used is a reduced notation dictionary 6 shown in FIG.
And the syllable lattice obtained as a result of the recognition is the syllable lattice shown in FIG.

【0058】〔従来法(音節ラティスを総て展開して言
語処理を行う)〕 言語処理=1単位/候補×720候補 =720単位 合計=720単位 〔本実施例〕 音節ラティスの縮小表記 =0.1単位/文字×19文字 =1.9単位 縮小表記言語処理 =1単位/候補×8候補 =8単位 トップダウン処理 =1単位/候補×10候補 =10単位 スコア計算 =1単位/候補×9候補 =9単位 合計=28.9単位 すなわち、本実施例によれば、言語処理時間を従来法の
1/25強に短縮できるのである。
[Conventional method (to perform language processing by expanding all syllable lattices)] Language processing = 1 unit / candidate × 720 candidate = 720 units Total = 720 units [Example] Reduced notation of syllable lattice = 0 .1 unit / character x 19 characters = 1.9 unit Reduced notation language processing = 1 unit / candidate x 8 candidates = 8 units Top-down processing = 1 unit / candidate x 10 candidates = 10 units Score calculation = 1 unit / candidate x 9 candidates = 9 units Total = 28.9 units That is, according to the present embodiment, the language processing time can be reduced to a little more than 1/25 of the conventional method.

【0059】図18は、上記音声認識装置10および認
識用言語処理装置11によって実施される音声認識/言
語処理動作のフローチャートである。以下、図12およ
び図18に従って、音声認識/言語処理動作について順
を追って説明する。
FIG. 18 is a flowchart of a speech recognition / language processing operation performed by the speech recognition device 10 and the recognition language processing device 11. Hereinafter, the speech recognition / language processing operation will be described step by step with reference to FIGS.

【0060】ステップS11で、上記入出力部2から入力
された音声信号に対して音声認識装置10によって認識
処理が実施されて、音節単位で認識される。ステップS
12で、上記ステップS11における認識結果に基づいて、
ラティス作成部3によって、図3に示すような音節ラテ
ィスが作成される。
In step S11, the speech signal input from the input / output unit 2 is subjected to recognition processing by the speech recognition device 10 to be recognized in syllable units. Step S
At 12, based on the recognition result at step S11,
The syllable lattice as shown in FIG.

【0061】ステップS13で、上記ステップS12におい
て得られた音節ラティスが縮小表記変換部4によって縮
小表記変換されて、図6に示すような縮小表記音節ラテ
ィスが作成される。ステップS14で、上記ステップS13
において作成された縮小表記音節ラティスが縮小表記言
語処理部5によって展開され、さらに得られた縮小表記
文節候補列に対して縮小表記辞書6を用いて縮小表記言
語処理が実施される。
In step S13, the syllabic lattice obtained in step S12 is subjected to reduced-notation conversion by the reduced-notation conversion unit 4 to create a reduced-notation syllable lattice as shown in FIG. In step S14, the above step S13
The reduced notation syllable lattice created in step 2 is expanded by the reduced notation language processing unit 5, and the reduced notation phrase candidate sequence obtained is subjected to reduced notation language processing using the reduced notation dictionary 6.

【0062】ステップS15で、上記解析部12によって
解析処理が実施される。すなわち、上記ステップS14に
おいて縮小表記言語処理に成功した縮小表記文節候補に
おける同一構造の部分がまとめられて共通化され、縮小
表記による単語連鎖が得られる。ステップS16で、上記
元表記変換部13によって、上記ステップS15において
得られた縮小表記による単語連鎖が元表記による単語連
鎖に変換される。尚、この元表記変換は縮小表記による
単語連鎖と元表記単語連鎖とを対応付けた復元辞書(図
示せず)を用いて行われる。
At step S15, the analyzing unit 12 performs an analyzing process. That is, the parts having the same structure in the reduced notation phrase candidates that have been successfully processed in the reduced notation language processing in step S14 are put together and shared, and a word chain based on the reduced notation is obtained. In step S16, the original notation conversion unit 13 converts the word chain in reduced notation obtained in step S15 into a word chain in original notation. Note that this original notation conversion is performed using a restoration dictionary (not shown) in which word chains in reduced notation and original word word chains are associated with each other.

【0063】ステップS17で、上記トップダウン処理部
14によって、上記ステップS12において求められた音
節ラティスを参照して、上記ステップS16において得ら
れた元表記による各単語に対してトップダウン的に言語
処理が実施される。そして、成立する元表記単語の距離
が求められる。ステップS18で、上記ステップS15にお
いて求められた縮小表記による単語連鎖と上記ステップ
S17において求められた各元表記単語の距離とに基づい
て、上記スコア計算部15によって元表記文節候補のス
コアが計算される。ステップS19で、上記ソーティング
部16によって、上記ステップS18において得られたス
コアが付加された縮小表記文節候補をスコアの小さい順
に並べ変えて、最終的な認識結果が得られる。こうし
て、多くの音節候補の組合せからなる文節候補列の中か
ら少ない時間で正しい認識結果を得ることができる。
In step S17, the top-down processing unit 14 refers to the syllable lattice obtained in step S12, and performs top-down linguistic processing on each word in the original notation obtained in step S16. Is performed. Then, the distance between the established original written words is obtained. In step S18, the score of the original notation phrase candidate is calculated by the score calculation unit 15 based on the word chain based on the reduced notation obtained in step S15 and the distance between each of the original notation words obtained in step S17. You. In step S19, the sorting unit 16 rearranges the reduced notation phrase candidates to which the scores obtained in step S18 are added in ascending order of the scores, and obtains the final recognition result. In this manner, a correct recognition result can be obtained in a short time from a phrase candidate sequence composed of a combination of many syllable candidates.

【0064】上述のように、本実施例においては、縮小
表記変換部4によって音節ラティスを縮小表記に変換
し、得られた縮小表記音節ラティスに基づいて縮小表記
言語処理部5によって縮小表記言語処理を実施して縮小
表記文節候補列を得る。このように、認識結果を縮小表
記によって一旦少ない表記で表して少ない時間で言語処
理(縮小表記言語処理)を行う。そして、上記解析部12
によって、縮小表記言語処置に成功した縮小表記文節候
補列の構造を解析し、この解析結果を元表記変換部13
によって元表記に変換する。こうして、言語処理を実施
する元表記単語候補列を予め特定する。
As described above, in the present embodiment, the syllabic lattice is converted into the reduced notation by the reduced notation conversion unit 4, and the reduced notation language processing unit 5 executes the reduced notation language processing unit 5 based on the obtained reduced notation syllable lattice. To obtain a reduced notation clause candidate sequence. As described above, the recognition result is once represented by the reduced notation by the reduced notation, and the language processing (reduced notation language processing) is performed in a short time. Then, the analysis unit 12
In this way, the structure of the reduced notation phrase candidate sequence that has been successfully processed in the reduced notation language processing is analyzed, and this analysis result is used as the original notation conversion unit 13.
To the original notation. In this way, the original written word candidate string to be subjected to the language processing is specified in advance.

【0065】したがって、以後、上記元表記単語候補に
対する言語処理は、上記トップダウン処理部14によっ
てトップダウン的に少ない処理で短時間に実施できるの
である。
Therefore, after that, the language processing for the original written word candidate can be performed in a short time by the top-down processing section 14 with a small number of processes in a top-down manner.

【0066】上述の第1実施例および第2実施例におい
ては、上記音声認識装置10による音声認識結果に基づ
いてラティス作成部3によって作成された音節ラティス
を、縮小表記変換部4によって縮小表記音節ラティスに
変換するようにしている。ここで、上記縮小表記に変換
するということは、元表記をこの元表記よりも少ないカ
テゴリ数の表記に変換するということである。
In the first and second embodiments, the syllable lattice created by the lattice creation unit 3 based on the speech recognition result by the speech recognition device 10 is reduced by the reduced notation syllable by the reduced notation conversion unit 4. I try to convert it to lattice. Here, converting into the reduced notation means converting the original notation into a notation having a smaller number of categories than the original notation.

【0067】したがって、変形例として、最初に粗い認
識を行うことでおおざっぱな認識結果(すなわち、縮小
表記のような少ないカテゴリ数での認識結果)を得て、
その結果を言語処理することによって上記縮小表記言語
処理部5による縮小表記言語処理と同じ効果を得ること
も可能である。この場合には、その後に詳細な認識処理
を行う必要があり、2段階の認識方式となる。
Therefore, as a modified example, a rough recognition result is obtained first by performing rough recognition (that is, a recognition result with a small number of categories such as reduced notation).
By performing language processing on the result, the same effect as the reduced notation language processing by the reduced notation language processing unit 5 can be obtained. In this case, it is necessary to perform a detailed recognition process thereafter, and a two-stage recognition method is used.

【0068】<第3実施例> この実施例は、第2実施例におけるトップダウン評価の
結果リジェクトされる単語候補が存在する場合には、こ
の単語候補がリジェクトされるのを防止するものであ
る。
<Third Embodiment> In this embodiment, if there is a word candidate to be rejected as a result of the top-down evaluation in the second embodiment, this word candidate is prevented from being rejected. .

【0069】上述の第2実施例においては、上記トップ
ダウン処理部14によって単語候補「こうみん」に対する
トップダウン処理を実施した際に、第2音節「う」は図3
に示す音節ラティスに存在しない。そこで、本実施例に
おいては、図19に示すように、上記音節ラティスにお
ける第2音節に音節候補「う」を予め定められた距離
“3.0"を付加して登録するのである。こうして、単語
候補「こうみん」を含む文節候補が認識候補から漏れるこ
とを防止するのである。
In the above-described second embodiment, when the top-down processing section 14 performs the top-down processing on the word candidate "Komin", the second syllable "U"
Does not exist in the syllable lattice shown in. Therefore, in the present embodiment, as shown in FIG. 19, a syllable candidate "U" is registered with a predetermined distance "3.0" added to the second syllable in the syllable lattice. In this way, the phrase candidate including the word candidate “Komin” is prevented from leaking out of the recognition candidate.

【0070】上記新たな音節候補に付加する予め定め得
られた距離としては、単純に大きな値を与えたり、総て
の音節を第1位の音節候補とした場合の類似音節との間
の距離を表す距離テーブルを予め用意し、音節ラティス
の該当する音節位置における第1位の音節候補と新たに
付加したい音節候補との距離を上記距離テーブルから得
たりする方法がある。
As the predetermined distance to be added to the new syllable candidate, a large value is simply given, or the distance between similar syllables when all syllables are the first syllable candidate. Is prepared in advance, and the distance between the first syllable candidate at the corresponding syllable position of the syllable lattice and the syllable candidate to be newly added is obtained from the distance table.

【0071】<第4実施例> 本実施例は、上記縮小表記に変換する際に、同じ音節の
認識候補として現れ易い音節が同一の縮小表記となるよ
うに縮小表記に変換することによって、以後の言語処理
の処理時間の軽減を図るものである。
<Fourth Embodiment> In the present embodiment, when converting into the reduced notation, syllables that are likely to appear as recognition candidates for the same syllable are converted into the reduced notation so as to have the same reduced notation. The processing time of the language processing is reduced.

【0072】例えば、図20(a)に示すように、“さ"
行,“ざ"行および“ちゃ"行の元表記には縮小表記/S/
を与え、縮小表記/S/に変換される元表記以外の元表記
における“あ"段には縮小表記/A*/を与え、“い"段に
縮小表記/I*/を与え、“う"段には縮小表記/U*/を
与え、“え"段には縮小表記/E*/を与え、“お"段には
縮小表記/O*/を与え、“ん"には縮小表記/X/を与え
るように、縮小表記付与ルールを設定する。このような
縮小表記付与ルールは、音節/さ/を認識した際に得られ
る音節候補には/し/や/す/が現れることが多いという誤
認識傾向から作成された縮小表記付与ルールである。
For example, as shown in FIG.
Line, “Za” line and “Cha” line have reduced notation / S /
In the original notation other than the original notation converted into the reduced notation / S /, the reduced notation / A * / is given to the “A” stage, the reduced notation / I * / is given to the “I” stage, and "U" is given a reduced notation / U * /, "E" is given a reduced notation / E * /, "O" is given a reduced notation / O * /, and "n" is a reduced notation The reduced notation assignment rule is set so as to give / X /. Such a reduced notation assignment rule is a reduced notation assignment rule created from the tendency of misrecognition that syllable candidates obtained when recognizing syllables / sa / often include / shi / ya / su /. .

【0073】そうすることによって、例えば音声認識の
結果得られたある音節の音節候補が図21(a)に示すよ
うに/さ/,/ざ/,/す/,/せ/,/そ/,/ちゃ/および/だ/であ
る場合には、図20(b)に示すような第1実施例〜第3
実施例における縮小表記による縮小表記変換によれば図
21(c)に示すように4つの縮小表記/A/,/U/,/E/お
よび/O/に変換される。これに対して、上記本実施例に
おける縮小表記による縮小表記変換によれば、図21
(b)に示すように2つの縮小表記/S/および/A*/に減
少できる。こうして、本実施例によれば効率よい縮小表
記変換が可能となる。
By doing so, for example, the syllable candidates of a certain syllable obtained as a result of speech recognition are, as shown in FIG. 21 (a), / sa /, / za /, / su /, / set /, / so / , / Cha / and / da /, the first to third embodiments as shown in FIG.
According to the reduced notation conversion based on the reduced notation in the embodiment, as shown in FIG. 21C, it is converted into four reduced notations / A /, / U /, / E / and / O /. On the other hand, according to the reduced notation conversion by the reduced notation in the present embodiment, FIG.
As shown in (b), it can be reduced to two reduced notations / S / and / A * /. Thus, according to the present embodiment, efficient reduced notation conversion is possible.

【0074】尚、従来から行われている前処理として、
認識結果ラティスを展開して文節候補や単語候補等を作
成する際に、予め求められている2音節間や3音節間の
遷移確率を使用して、ほとんど在り得ない認識候補の組
み合わせを除去する処理がある。このような前処理をこ
の発明に利用しても何等差し支えない
Incidentally, as the preprocessing conventionally performed,
When developing a recognition result lattice to generate a phrase candidate or a word candidate, a transition probability between two syllables or three syllables that has been obtained in advance is used to remove a combination of almost impossible recognition candidates. There is processing. There is no problem if such a pretreatment is used in the present invention.

【0075】また、この発明における音声認識/言語処
理動作のアルゴリズムは図11あるいは図18に示すア
ルゴリズムに限定されるものではない。また、上記各実
施例においては文節候補単位で言語処理を実施している
が、この発明はこれに限定されるものではなく、単語や
文章単位であっても何等差し支えない。また、上記各実
施例においては音声信号を音節単位で認識する際を例に
説明しているが、この発明はこれに限定されるもではな
い。例えば、HMM(ヒドンマルコフモデル)を用いた音
素認識等を用いて音素単位で認識してもよい。
The algorithm of the speech recognition / language processing operation in the present invention is not limited to the algorithm shown in FIG. 11 or FIG. In each of the above embodiments, the linguistic processing is performed in units of phrase candidates. However, the present invention is not limited to this, and there is no problem even in units of words or sentences. Further, in each of the above embodiments, the case where the audio signal is recognized in units of syllables has been described as an example, but the present invention is not limited to this. For example, recognition may be performed in phoneme units using phoneme recognition using an HMM (Hidden Markov Model).

【0076】また、上記各実施例においては音声信号を
認識して文節候補列を得る際を例に説明している。しか
しながら、この発明は、画像信号を文字/記号単位で認
識して文節候補列や単語候補列を作成する場合にも適応
できる。
In each of the above embodiments, the case where a speech signal is recognized to obtain a phrase candidate sequence is described as an example. However, the present invention can also be applied to a case where a phrase candidate sequence or a word candidate sequence is created by recognizing an image signal in units of characters / symbols.

【0077】[0077]

【発明の効果】以上より明らかなように、第1の発明の
認識用言語処理装置は、表記変換部によって、認識装置
からの認識結果の表記をこの表記が属するカテゴリ数よ
り少ないカテゴリ数の表記に所定のルールに従って変換
し、認識候補予備選択部によって、上記表記変換部で表
記が変換された上記認識結果に対して、言語処理を実施
する際に用いられる言語処理辞書の見出し語が上記所定
のルールに従って変換されて成る圧縮辞書を用いて言語
処理を行って予備選択認識候補を得、認識候補生成部に
よって、上記予備選択認識候補を上記言語処理辞書の見
出し語の連鎖に復元して認識候補を生成し、トップダウ
ン処理部によって、上記認識結果を参照して上記生成さ
れた認識候補の重みをトップダウン的に算出することに
よって最終的な認識候補を得るようにしたので、上記圧
縮辞書を用いた言語処理部は少ないカテゴリ数の表記に
変換することで短時間に実施できる。さらに、上記予備
選択認識候補に基づいて生成された認識候補の重みはト
ップダウン的に算出できるのでボトムアップ的な言語処
理を必要とはせず、最終的な認識候補を非常に短時間に
得ることができる。
As is clear from the above, in the recognition language processing apparatus of the first invention, the notation conversion unit converts the notation of the recognition result from the recognition apparatus into a notation of a smaller number of categories than the number of categories to which the notation belongs. Is converted according to a predetermined rule, and the recognition candidate preliminary selection unit converts the notation converted by the notation conversion unit into a headword of a language processing dictionary used when performing language processing. The language processing is performed using the compressed dictionary converted according to the rules of the above, to obtain the pre-selection recognition candidates, and the pre-selection recognition candidates are reconstructed into the chain of the headwords of the language processing dictionary by the recognition candidate generation unit for recognition. A candidate is generated, and a top-down processing unit calculates the weight of the generated recognition candidate in a top-down manner with reference to the recognition result, thereby performing final recognition. Since to obtain a candidate can be performed in a short time by converting the language processing section representation of a small number of categories using the compression dictionary. Furthermore, since the weights of the recognition candidates generated based on the preliminary selection recognition candidates can be calculated top-down, bottom-up language processing is not required, and the final recognition candidates are obtained in a very short time. be able to.

【0078】したがって、この発明によれば、認識結果
に対して高速に言語処理を実施できる認識用言語処理装
置を提供できる。
Therefore, according to the present invention, it is possible to provide a recognition language processing apparatus capable of performing high-speed language processing on a recognition result.

【0079】また、第2の発明の認識用言語処理装置
は、上記認識装置からの認識結果は夫々に重み付けされ
た認識単位群から成り、上記トップダウン処理部で上記
認識候補の重みを算出するに際して上記認識候補を構成
する複数の認識単位中に上記認識結果に無い認識単位が
ある場合には、認識結果追加部によって、当該認識単位
に所定の重みを付加して上記認識結果に自動的に追加す
るようにしたので、正しい認識候補がリジェクトされる
場合がなく、上記認識候補生成部によって生成された総
ての認識候補の重みがトップダウン的に算出できる。
Further, in the recognition language processing apparatus according to the second invention, the recognition result from the recognition apparatus is composed of recognition unit groups each weighted, and the top-down processing unit calculates the weight of the recognition candidate. When there is a recognition unit not included in the recognition result among the plurality of recognition units constituting the recognition candidate, the recognition result adding unit adds a predetermined weight to the recognition unit and automatically adds the recognition unit to the recognition result. Since the addition is performed, correct recognition candidates are not rejected, and the weights of all the recognition candidates generated by the recognition candidate generation unit can be calculated from the top down.

【0080】したがって、この発明によれば、認識結果
に対してより高速に且つ正しい言語処理を実施できる認
識用言語処理装置を提供できる。
Therefore, according to the present invention, it is possible to provide a recognition language processing apparatus capable of performing correct language processing on a recognition result at higher speed.

【0081】また、第3の発明の認識用言語処理装置
は、上記表記変換部が上記認識装置からの認識結果の表
記を変換する際に使用する上記所定のルールは、上記認
識装置による認識に存在する誤認識のパターンに当て嵌
まる認識結果の表記が1つのカテゴリに属するような表
記に変換されるルールであるので、上記認識結果は認識
装置による認識誤りの傾向に応じてよりカテゴリ数の少
ない表記に効率良く変換される。
Further, in the recognition language processing apparatus according to a third aspect of the present invention, the predetermined rule used when the notation conversion unit converts the notation of the recognition result from the recognizing apparatus includes the following: Since the notation of the recognition result applicable to the existing pattern of erroneous recognition is a rule that is converted into a notation that belongs to one category, the recognition result has a smaller number of categories according to the tendency of recognition errors by the recognition device. It is efficiently converted to notation.

【0082】したがって、この発明によれば、認識結果
に対して更に高速に言語処理を実施できる認識用言語処
理装置を提供できる。
Therefore, according to the present invention, it is possible to provide a recognition language processing apparatus capable of performing language processing on a recognition result at higher speed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】この発明の認識用言語処理装置におけるブロッ
ク図である。
FIG. 1 is a block diagram of a recognition language processing apparatus according to the present invention.

【図2】図1における元表記辞書の内容の説明図であ
る。
FIG. 2 is an explanatory diagram of contents of an original notation dictionary in FIG. 1;

【図3】図1におけるラテイス作成部によって作成され
る音節ラティスの一例を示す図である。
FIG. 3 is a diagram illustrating an example of a syllable lattice created by a lattice creating unit in FIG. 1;

【図4】図3に示す音節ラティスを展開して得られた文
節候補列に図2に示す元表記辞書を用いた元表記言語処
理を実施した際に得られる文節候補列の一例を示す図で
ある。
FIG. 4 is a diagram showing an example of a syllable candidate sequence obtained when the syllable candidate sequence obtained by expanding the syllable lattice shown in FIG. 3 is subjected to the original notation language processing using the original notation dictionary shown in FIG. 2; It is.

【図5】図1における縮小表記辞書の内容の説明図であ
る。
FIG. 5 is an explanatory diagram of the contents of a reduced notation dictionary in FIG. 1;

【図6】図3に示す音節ラティスを縮小表記変換して得
られる縮小表記音節ラティスの一例を示す図である。
6 is a diagram showing an example of a reduced syllable lattice obtained by performing a reduced notation conversion on the syllable lattice shown in FIG. 3;

【図7】図6に示す縮小表記音節ラティスを展開して得
られた縮小表記文節候補列に図5に示す縮小表記辞書を
用いた縮小表記言語処理を実施した際に得られる縮小表
記文節候補列の一例を示す図である。
7 is a reduced notation phrase candidate obtained by performing reduced notation language processing using the reduced notation dictionary shown in FIG. 5 on a reduced notation phrase candidate string obtained by expanding the reduced notation syllable lattice shown in FIG. 6; It is a figure showing an example of a column.

【図8】縮小表記言語処理の結果得られた縮小表記文節
候補と元表記文節候補との対応図である。
FIG. 8 is a correspondence diagram between reduced notation phrase candidates obtained as a result of reduced notation language processing and original notation phrase candidates.

【図9】図3に示す音節ラティスの中から在り得ない音
節候補を除去した結果の説明図である。
FIG. 9 is an explanatory diagram of the result of removing impossible syllable candidates from the syllable lattice shown in FIG. 3;

【図10】図9に示す音節ラティスを展開して得られた
文節候補列に図2に示す元表記辞書を用いた元表記言語
処理を実施して形態素解析を実施した際に得られる文節
候補列の一例を示す図である。
10 is a syllable candidate sequence obtained by expanding a syllable lattice shown in FIG. 9 and performing a morphological analysis by performing an original notation language process using the original notation dictionary shown in FIG. It is a figure showing an example of a column.

【図11】図1における音声認識装置および認識用言語
処理装置によって実施される音声認識/言語処理動作の
フローチャートである。
FIG. 11 is a flowchart of a voice recognition / language processing operation performed by the voice recognition device and the recognition language processing device in FIG. 1;

【図12】図1とは異なる認識用言語処理装置のブロッ
ク図である。
FIG. 12 is a block diagram of a recognition language processing device different from FIG. 1;

【図13】図7に示す縮小表記文節候補列に対する図1
2における解析部による解析結果を示す図である。
FIG. 13 is a diagram illustrating a reduced notation phrase candidate sequence shown in FIG. 7;
FIG. 6 is a diagram illustrating an analysis result by an analysis unit in FIG.

【図14】元表記単語候補に対する図12におけるトッ
プダウン処理部によるトップダウン評価結果の一例を示
す図である。
FIG. 14 is a diagram illustrating an example of a top-down evaluation result of the original notation word candidate by the top-down processing unit in FIG. 12;

【図15】図14とは異なるトップダウン評価結果の一
例を示す図である。
FIG. 15 is a diagram illustrating an example of a top-down evaluation result different from that of FIG. 14;

【図16】文節候補の構造解析結果,元表記変換結果お
よびトップダウン評価結果をまとめて表記した図であ
る。
FIG. 16 is a diagram collectively showing a result of a structural analysis of a phrase candidate, a result of an original notation conversion, and a result of a top-down evaluation.

【図17】図12におけるスコア計算部によってスコア
を算出した後にソーティング部によってスコアをソーテ
ィングした文節候補列の一例を示す図である。
17 is a diagram illustrating an example of a phrase candidate sequence in which scores are sorted by a sorting unit after scores are calculated by a score calculating unit in FIG. 12;

【図18】図12における音声認識装置および認識用言
語処理装置によって実施される音声認識/言語処理動作
のフローチャートである。
FIG. 18 is a flowchart of a voice recognition / language processing operation performed by the voice recognition device and the recognition language processing device in FIG. 12;

【図19】図12におけるトップダウン処理部によるト
ップダウン評価の際に音節ラティス中に音節候補が存在
しない場合に、新たに音節候補を登録する際の説明図で
ある。
19 is an explanatory diagram of registering a new syllable candidate when no syllable candidate exists in the syllable lattice at the time of the top-down evaluation by the top-down processing unit in FIG. 12;

【図20】異なる2つの縮小表記付与ルールの説明図で
ある。
FIG. 20 is an explanatory diagram of two different reduced notation provision rules.

【図21】図20に示す2つの縮小表記付与ルールに基
づく縮小表記変換結果の説明図である。
FIG. 21 is an explanatory diagram of a reduced notation conversion result based on the two reduced notation provision rules shown in FIG. 20;

【符号の説明】[Explanation of symbols]

1,11…認識用言語処理装置、 3…ラティス作成
部、 4…縮小表記変換部、 5…縮小表記言語
処理部、 6…縮小表記辞書、 7…候補削除部、 8…元表記言語処理部、 9…元表記辞書、 10…音声認識装置、 12…解析部、 13…元表記変換部、 14…トップダウ
ン処理部、 15…スコア計算部、 16…ソーティン
グ部。
Reference numerals 1, 11: recognition language processing unit, 3: lattice creation unit, 4: reduced notation conversion unit, 5: reduced notation language processing unit, 6: reduced notation dictionary, 7: candidate deletion unit, 8: original notation language processing unit Reference numeral 9: Original notation dictionary, 10: Voice recognition device, 12: Analysis unit, 13: Original notation conversion unit, 14: Top-down processing unit, 15: Score calculation unit, 16: Sorting unit.

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平2−297598(JP,A) 特開 昭58−87599(JP,A) 特開 昭63−265299(JP,A) 特開 平2−186400(JP,A) 特開 昭51−136208(JP,A) 特許2815579(JP,B2) 特公 平5−67040(JP,B2) 特公 平7−66276(JP,B2) 電子情報通信学会論文誌 Vol.J 67−D No.8「単語中の音素系列の 指定による語彙の減少効果」p.869− 876(1984/8) (58)調査した分野(Int.Cl.7,DB名) G10L 3/00 - 9/20 JICSTファイル(JOIS)──────────────────────────────────────────────────続 き Continuation of the front page (56) References JP-A-2-297598 (JP, A) JP-A-58-87599 (JP, A) JP-A-63-265299 (JP, A) JP-A-2-297 186400 (JP, A) JP-A-51-136208 (JP, A) Patent 2815579 (JP, B2) JP-B 5-67040 (JP, B2) JP-B 7-66276 (JP, B2) The Institute of Electronics, Information and Communication Engineers Transactions Vol. J 67-D No. 8 “Vocabulary reduction effect by specifying phoneme sequences in words” p. 869-876 (1984/8) (58) Field surveyed (Int. Cl. 7 , DB name) G10L 3/00-9/20 JICST file (JOIS)

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 入力された音声信号あるいは画像信号に
基づいて音声あるいは文字を認識する認識装置からの認
識結果に言語処理を施して認識候補を得る認識用言語処
理装置において、 上記認識装置からの認識結果の表記を、所定のルールに
従って上記認識結果の表記が属するカテゴリ数より少な
いカテゴリ数の表記に変換する表記変換部と、 上記言語処理を実施する際に用いられる言語処理辞書の
見出し語の表記が上記所定のルールに従って変換され
て、上記見出し語の表記の属するカテゴリ数が圧縮され
て成る圧縮辞書と、 上記表記変換部によって表記が変換された上記認識結果
に対して、上記圧縮辞書を用いて言語処理を行って上記
認識候補の予備選択を行う認識候補予備選択部と、 上記認識候補予備選択部によって得られた予備選択認識
候補を上記言語処理辞書の見出し語の連鎖に復元して上
記認識候補を得る認識候補生成部と、 上記認識装置からの認識結果を参照して、上記認識候補
生成部によって得られた認識候補の重みをトップダウン
的に算出して、最終的な上記認識候補を得るトップダウ
ン処理部を備えたことを特徴とする認識用言語処理装
置。
1. A recognition language processing apparatus for obtaining a recognition candidate by performing language processing on a recognition result from a recognition apparatus for recognizing speech or characters based on an input speech signal or image signal, comprising the steps of: A notation conversion unit that converts the notation of the recognition result into a notation having a smaller number of categories than the number of categories to which the notation of the recognition result belongs according to a predetermined rule; and a headword of a language processing dictionary used when performing the language processing. The notation is converted according to the predetermined rule, the number of categories to which the notation of the headword belongs is compressed, and the compression dictionary is used for the recognition result whose notation is converted by the notation conversion unit. A recognition candidate preliminary selection section for performing language processing using the recognition candidate preliminary selection section, and a preliminary selection section obtained by the recognition candidate preliminary selection section. A recognition candidate generation unit that obtains the recognition candidate by restoring the recognition candidate into a chain of headwords of the language processing dictionary; and a recognition candidate obtained by the recognition candidate generation unit with reference to a recognition result from the recognition device. A top-down processing unit that calculates the weight of the top-down and obtains the final recognition candidate.
【請求項2】 請求項1に記載の認識用言語処理装置に
おいて、 上記認識装置からの認識結果は夫々に重み付けされた認
識単位群から成ると共に、 上記トップダウン処理部によって上記認識候補の距離を
算出するに際して、上記認識候補を構成する複数の認識
単位中に上記認識結果に無い認識単位がある場合には、
当該認識単位に所定の重みを付加して上記認識結果に自
動的に追加する認識結果追加部を備えたことを特徴とす
る認識用言語処理装置。
2. The recognition language processing device according to claim 1, wherein the recognition result from the recognition device includes a recognition unit group each weighted, and a distance of the recognition candidate is determined by the top-down processing unit. When calculating, if there is a recognition unit not included in the recognition result among a plurality of recognition units constituting the recognition candidate,
A recognition language processing apparatus comprising: a recognition result adding unit that adds a predetermined weight to the recognition unit and automatically adds the recognition result to the recognition result.
【請求項3】 請求項1あるいは請求項2に記載された
認識用言語処理装置において、 上記表記変換部が上記認識装置からの認識結果の表記を
変換する際に使用する上記所定のルールは、上記認識装
置による認識に誤認識のパターンが存在する場合には、
当該パターンに当て嵌まる認識結果の表記を変換した際
に1つのカテゴリに属するような表記に変換されるルー
ルであることを特徴とする認識用言語処理装置。
3. The recognition language processing device according to claim 1, wherein the predetermined rule used when the notation conversion unit converts a notation of a recognition result from the recognition device includes: If there is an erroneous recognition pattern in the recognition by the recognition device,
A language processing device for recognition, characterized in that the rule is converted into a notation that belongs to one category when the notation of a recognition result that fits the pattern is converted.
JP4180937A 1992-07-08 1992-07-08 Language processor for recognition Expired - Fee Related JP3001334B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4180937A JP3001334B2 (en) 1992-07-08 1992-07-08 Language processor for recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4180937A JP3001334B2 (en) 1992-07-08 1992-07-08 Language processor for recognition

Publications (2)

Publication Number Publication Date
JPH0627990A JPH0627990A (en) 1994-02-04
JP3001334B2 true JP3001334B2 (en) 2000-01-24

Family

ID=16091888

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4180937A Expired - Fee Related JP3001334B2 (en) 1992-07-08 1992-07-08 Language processor for recognition

Country Status (1)

Country Link
JP (1) JP3001334B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102341843B (en) * 2009-03-03 2014-01-29 三菱电机株式会社 Voice recognition device

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2815579B2 (en) 1987-03-10 1998-10-27 富士通株式会社 Word candidate reduction device in speech recognition

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2815579B2 (en) 1987-03-10 1998-10-27 富士通株式会社 Word candidate reduction device in speech recognition

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
電子情報通信学会論文誌 Vol.J67−D No.8「単語中の音素系列の指定による語彙の減少効果」p.869−876(1984/8)

Also Published As

Publication number Publication date
JPH0627990A (en) 1994-02-04

Similar Documents

Publication Publication Date Title
US8185376B2 (en) Identifying language origin of words
US20020095289A1 (en) Method and apparatus for identifying prosodic word boundaries
JP3481497B2 (en) Method and apparatus using a decision tree to generate and evaluate multiple pronunciations for spelled words
JPH03224055A (en) Method and device for input of translation text
KR101424193B1 (en) System And Method of Pronunciation Variation Modeling Based on Indirect data-driven method for Foreign Speech Recognition
JP5231698B2 (en) How to predict how to read Japanese ideograms
JPWO2010044123A1 (en) Search device, search index creation device, and search system
JP4595415B2 (en) Voice search system, method and program
JP3001334B2 (en) Language processor for recognition
JP3441400B2 (en) Language conversion rule creation device and program recording medium
JP2965529B2 (en) Voice recognition device
JP3378547B2 (en) Voice recognition method and apparatus
JP4733436B2 (en) Word / semantic expression group database creation method, speech understanding method, word / semantic expression group database creation device, speech understanding device, program, and storage medium
JP2950823B1 (en) Speech recognition error correction device
JP2966002B2 (en) Voice recognition device
JP3240691B2 (en) Voice recognition method
JPH0210957B2 (en)
JP3818154B2 (en) Speech recognition method
JP2660998B2 (en) Japanese language processor
JP3009709B2 (en) Japanese speech recognition method
JPH0552507B2 (en)
CN117711370A (en) Phonetic notation method and device, voice synthesis system, storage medium and electronic equipment
JP3430265B2 (en) Japanese speech recognition method
JPH0916575A (en) Pronunciation dictionary device
KR100932643B1 (en) Method of grapheme-to-phoneme conversion for Korean TTS system without a morphological and syntactic analysis and device thereof

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees