JP3033132B2 - Language processor - Google Patents
Language processorInfo
- Publication number
- JP3033132B2 JP3033132B2 JP2146828A JP14682890A JP3033132B2 JP 3033132 B2 JP3033132 B2 JP 3033132B2 JP 2146828 A JP2146828 A JP 2146828A JP 14682890 A JP14682890 A JP 14682890A JP 3033132 B2 JP3033132 B2 JP 3033132B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- phoneme
- phonemes
- extracted
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
【発明の詳細な説明】 [産業上の利用分野] 本発明は、DPマッチングによる辞書検索方法を用いた
言語処理装置に関する。Description: TECHNICAL FIELD The present invention relates to a language processing apparatus using a dictionary search method by DP matching.
[従来の技術] 従来、音声入力等の曖昧性を含んだ音素認識結果か
ら、辞書検索を行なう方法の一つとして、DPマッチング
による辞書検索方法があり、このDPマッチングによる辞
書検索方法を用いた言語処理装置は、音素表記された辞
書と、単語抽出手段とを備えている。そして、単語抽出
手段は、辞書内の各単語に対してDPマッチングにより単
語抽出を行い単語候補を出力していた。[Prior Art] Conventionally, as one method of performing a dictionary search from phoneme recognition results including ambiguity such as voice input, there is a dictionary search method by DP matching, and this dictionary search method by DP matching is used. The language processing device includes a dictionary in which phonemes are written, and word extracting means. The word extracting means extracts words by DP matching for each word in the dictionary and outputs word candidates.
[発明が解決しようとする課題] しかしながら、従来のDPマッチングによる辞書検索方
法においては、辞書内の全単語とマッチングを行なうた
め、例えば、ワープロ用の4万語程度の大語彙辞書を使
った場合、処理時間が長くなるという問題点があった。[Problems to be Solved by the Invention] However, in the conventional dictionary search method using DP matching, a large vocabulary dictionary of about 40,000 words for a word processor is used in order to match all words in the dictionary. However, there is a problem that the processing time becomes long.
本発明は上述した問題点を解決するためになされたも
のであり、処理時間の短い言語処理装置を提供すること
を目的としている。The present invention has been made to solve the above-described problems, and has as its object to provide a language processing apparatus with a short processing time.
[課題を解決するための手段] この目的を達成するために本発明の言語処理装置で
は、音声による言語情報を入力する入力手段と、入力さ
れた言語情報を分析し、分析結果に基づいて音素認識を
行う音素認識手段と、前記音素認識手段により認識され
た音素列に基づいて、音素表記された辞書から単語候補
を検索する検索手段と、前記検索手段により検索された
単語候補に基づいて文章を出力する出力処理手段とを備
えた言語処理装置において、前記検索手段により検索さ
れた単語候補が所定数未満の音素から構成されている単
語か、所定数以上の音素から構成されている単語かを判
断する音素数判断手段と、前記音素数判断手段によって
所定数未満の音素から構成されていると判断された単語
候補に対しDPマッチングにより単語抽出を行う第1の音
素単語抽出手段と、前記音素数判断手段によって所定数
以上の音素から構成されていると判断された単語候補の
中に存在する前記所定数未満の音素から構成されている
部分単語が前記第1の音素単語抽出手段により単語抽出
されているか否かを判断する単語抽出判断手段と、前記
単語抽出判断手段により前記部分単語が単語抽出されて
いると判断された場合には、前記部分単語を含む単語候
補に対しDPマッチングにより単語抽出を行う第2の音素
単語抽出手段とを備え、前記単語抽出判断手段により前
記部分単語が単語抽出されていると判断されない場合に
は、前記部分単語を含む単語候補に対し前記第2の音素
単語抽出手段によりDPマッチングを行わないことを特徴
とする構成になっている。Means for Solving the Problems In order to achieve this object, a language processing apparatus according to the present invention uses an input means for inputting linguistic information by voice, analyzes the input linguistic information, and outputs a phoneme based on the analysis result. Phoneme recognition means for performing recognition; search means for searching for a word candidate from a phonemic notation dictionary based on the phoneme sequence recognized by the phoneme recognition means; and text based on the word candidate searched for by the search means. The word candidate searched by the search means is a word composed of less than a predetermined number of phonemes or a word composed of more than a predetermined number of phonemes. And a word extraction by DP matching is performed on the word candidates determined to be composed of less than a predetermined number of phonemes by the phoneme number determination means. The phonetic word extracting means and the phoneme number determining means determine that the partial word composed of less than the predetermined number of phonemes present in the word candidate determined to be composed of the predetermined number or more of the phonemes is Word extraction determining means for determining whether or not a word has been extracted by the first phoneme word extracting means; and if the partial word has been determined to have been extracted by the word extraction determining means, the partial word And a second phoneme word extraction unit that performs word extraction by DP matching on a word candidate including the word candidate. If the word extraction determination unit does not determine that the partial word has been extracted, the partial word is extracted. The second phoneme word extracting means does not perform DP matching on the included word candidates.
[作用] 上記の構成を有する本発明の言語処理装置において、
入力手段により音声による言語情報が入力され、入力さ
れた言語情報が音素認識手段により分析され、分析結果
に基づいて音素認識が行われ、前記音素認識手段により
認識された音素列に基づいて、検索手段により音素表記
された辞書から単語候補が検索される。音素数判断手段
により、前記検索手段により検索された単語候補が所定
数未満の音素から構成されている単語か、所定数以上の
音素から構成されている単語かが判断され、前記音素数
判断手段によって所定数未満の音素から構成されている
と判断された単語候補に対し第1の音素単語抽出手段が
DPマッチングにより単語抽出を行う。単語抽出判断手段
は、前記音素数判断手段によって所定数以上の音素から
構成されていると判断された単語候補の中に存在する前
記所定数未満の音素から構成されている部分単語が前記
第1の音素単語抽出手段により単語抽出されているか否
かを判断し、前記単語抽出判断手段により前記部分単語
が単語抽出されていると判断された場合には、第2の音
素単語抽出手段は前記部分単語を含む単語候補に対しDP
マッチングにより単語抽出を行い、前記単語抽出判断手
段により前記部分単語が単語抽出されていると判断され
ない場合には、前記部分単語を含む単語候補に対し前記
第2の音素単語抽出手段によりDPマッチングを行わな
い。そして検索された単語候補から出力処理手段が文章
を出力する。[Operation] In the language processing apparatus of the present invention having the above configuration,
Linguistic information by voice is input by the input unit, the input linguistic information is analyzed by the phoneme recognition unit, phoneme recognition is performed based on the analysis result, and retrieval is performed based on the phoneme sequence recognized by the phoneme recognition unit. A word candidate is searched from the dictionary in which the phoneme is written by the means. The phoneme number determination means determines whether the word candidate searched by the search means is a word composed of less than a predetermined number of phonemes or a word composed of a predetermined number or more of phonemes. The first phoneme word extracting means selects a word candidate determined to be composed of less than a predetermined number of phonemes.
Extract words by DP matching. The word extraction determining means is configured to determine whether the partial word composed of less than the predetermined number of phonemes present in the word candidates determined to be composed of the predetermined number or more of the phonemes by the phoneme number determining means is the first word. It is determined whether or not the word has been extracted by the phoneme word extracting means. If the word extraction determining means determines that the partial word has been word extracted, the second phoneme word extracting means DP for word candidates containing words
If word extraction is performed by matching, and the word extraction determining means does not determine that the partial word has been word extracted, DP matching is performed on the word candidate including the partial word by the second phoneme word extracting means. Not performed. Then, the output processing means outputs a sentence from the searched word candidates.
[実施例] 以下、本発明を具体化した一実施例を図面を参照して
説明する。[Embodiment] An embodiment of the present invention will be described below with reference to the drawings.
まず第2図を参照して本発明を適用した言語処理装置
の構成を説明する。First, the configuration of a language processing apparatus to which the present invention is applied will be described with reference to FIG.
CPU26にはRAM27、ROM28、I/Oポート25、がそれぞれ接
続され、I/Oポート25にはディスプレイ29が設けられ
る。更にI/Oポート25にはマイク21、オーディオ・アン
プ22、ローパス・フィルター23、A/D変換装置24が連続
して設けられている。A RAM 27, a ROM 28, and an I / O port 25 are connected to the CPU 26, respectively, and a display 29 is provided on the I / O port 25. Further, the I / O port 25 is provided with a microphone 21, an audio amplifier 22, a low-pass filter 23, and an A / D converter 24 continuously.
次に第3図を用いて本実施例の言語処理装置の動作を
説明する。Next, the operation of the language processing apparatus of this embodiment will be described with reference to FIG.
ステップS1(以下、単にS1とし、他のステップについ
ても同様とする)において、入力された連続音声はマイ
ク21により電気信号に変換され、オーディオ・アンプ22
により増幅される。この増幅された信号は、ローパス・
フィルタ23に入力され、5.5kHz以下の成分のみが通過
し、標本化時の折返し歪を抑えている。この出力信号は
A/D変換装置24により12kHz、16bitで標本化される。標
本化されたデータはI/Oポート25を介し、CPU26に取り込
まれ、RAM27に記憶される(音声取り込み部)。In step S1 (hereinafter simply referred to as S1 and the same applies to other steps), the input continuous sound is converted into an electric signal by the microphone 21, and the audio amplifier 22
Amplified by This amplified signal is a low-pass
Only the components of 5.5 kHz or less are input to the filter 23 and pass therethrough, thereby suppressing aliasing at the time of sampling. This output signal is
The A / D converter 24 samples the data at 12 kHz and 16 bits. The sampled data is captured by the CPU 26 via the I / O port 25 and stored in the RAM 27 (voice capturing unit).
S2において、CPU26がRAM27より前記データを読みだ
し、1−Z−1の伝達関数をもつデジタル・フィルタに
よりプリエンファシスを行なう。この出力データに対し
て、4msecを1フレームとし、1フレーム毎に21.3msec
長のハミング窓を掛け、LPC分析により16次のLPCケプス
トラム、及びパワーが算出される(分析部)。In S2, the CPU 26 reads the data from the RAM 27, and performs pre-emphasis by a digital filter having a 1-Z-1 transfer function. For this output data, 4 msec is regarded as one frame, and 21.3 msec per frame.
A long Hamming window is applied, and the 16th-order LPC cepstrum and power are calculated by LPC analysis (analysis unit).
S3において、CPU26により、分析部S2で算出されたLPC
ケプストラム及びパワーを入力とし、音素切り出しが行
なわれる。次に、切り出された音素に対して一般によく
知られているマハラノビス距離などの音楽認識方法を使
い音素認識が行なわれ音素列が出力される。出力された
音素列には、付加・脱落・誤認識等のあいまい性が含ま
れている(音素認識部)。In S3, the LPC calculated by the analysis unit S2 by the CPU 26
With the cepstrum and power as inputs, phoneme extraction is performed. Next, phoneme recognition is performed on the cut-out phoneme using a generally well-known music recognition method such as Mahalanobis distance, and a phoneme sequence is output. The output phoneme sequence includes ambiguities such as addition, omission, and misrecognition (phoneme recognition unit).
S4において、CPU26により、前記出力されたあいまい
性を含んだ音素列を入力とし、DPマッチングにより辞書
検索が行なわれ単語候補が出力される。本実施例で使用
するDPマッチングは、各音素間の類似度として第4図の
様なものを使用することにより音素認識結果のあいまい
性を考慮している。又、傾斜制限は第5図に示すものを
使用している(辞書検索部)。In S4, the CPU 26 receives the output phoneme string including the ambiguity as input, performs a dictionary search by DP matching, and outputs word candidates. In the DP matching used in this embodiment, the ambiguity of the phoneme recognition result is taken into consideration by using the similarity between phonemes as shown in FIG. Also, the inclination limit shown in FIG. 5 is used (dictionary search unit).
S5では抽出された単語候補から接続チェック、意味チ
ェック等の処理を行い文節候補を出力し、処理を終了す
る。(言語処理部) 次に第1図を参照してS4の辞書検索処理について詳述
する。In S5, processing such as connection check and meaning check is performed from the extracted word candidates to output phrase candidates, and the processing ends. (Language Processing Unit) Next, the dictionary search processing in S4 will be described in detail with reference to FIG.
CPU26は、まずROM28に記憶された辞書から1単語ずつ
単語を読み込む(S11)。単語を読み込む順番は第6図
の様な五十音昇順で行なわれる。次に読み込まれた単語
が4以下の音素から構成されている単語(以下、少数音
素単語)か、5以上の音素から構成されている単語(以
後、多数音素単語)かが判定される(S12)。S12におい
て少数音素単語と判定された場合、少数音素単語抽出部
S13に於いて、一般によく知られるDPマッチングによる
単語抽出が行なわれ類似度が高い単語が抽出される。単
語が抽出された場合、その単語名と抽出された音素位置
がS5に送られる。また1から4音素までの各音素数単語
ごとにRAM27上に第7図の様なテーブルが1つずつ用意
されている。このテーブルには、最近単語抽出を行なっ
た単語名と、その単語が抽出されたかどうかが(1、
0)で記憶されており、そのテーブルの更新が行なわれ
る。その後、処理はS11に戻る。次に、多数音素単語が
読み込まれた場合を考える。S11に於いて読み込まれた
多数音素単語は、S12に於いて多数音素単語と判定され
る。次に、多数音素単語抽出制御部S14に於いて、前記
テーブルに記憶された各音素数単語を参照し、各単語が
入力された多数音素単語の部分単語であるかどうかが判
定される。もしテーブル内のいずれかの単語が、入力さ
れた単語の部分単語であると判断され、その単語が少数
音素単語抽出部S13において抽出されていなかった場
合、その多数音素単語も単語抽出されることはないと判
断され多数音素単語抽出処理をスキップしS11に戻る。
それ以外の場合には多数音素単語抽出処理を行なう。多
数音素単語抽出部(S15)では、少数音素単語抽出部同
様に一般によく知られたDPマッチングによる単語抽出が
行なわれ、類似度が高いものが抽出される。単語が抽出
された場合、その単語名と抽出された音素位置がS5に送
られる。その後処理はS11に戻る。First, the CPU 26 reads words one by one from the dictionary stored in the ROM 28 (S11). Words are read in ascending alphabetical order as shown in FIG. Next, it is determined whether the read word is a word composed of four or less phonemes (hereinafter, a few phoneme words) or a word composed of five or more phonemes (hereinafter, a multiple phoneme word) (S12). ). If determined to be a minor phoneme word in S12, the minority phoneme word extraction unit
In S13, a word is extracted by generally well-known DP matching, and a word having a high degree of similarity is extracted. When a word is extracted, the word name and the extracted phoneme position are sent to S5. Also, one table as shown in FIG. 7 is prepared on the RAM 27 for each phoneme number word from 1 to 4 phonemes. In this table, the name of the word whose word has been extracted recently, and whether or not the word has been extracted (1, 1,
0), and the table is updated. Thereafter, the process returns to S11. Next, consider the case where a large number of phoneme words are read. The multiple phoneme word read in S11 is determined as a multiple phoneme word in S12. Next, in the majority phoneme word extraction control unit S14, it is determined whether each word is a partial word of the input majority phoneme word by referring to each phoneme number word stored in the table. If any of the words in the table is determined to be a partial word of the input word, and the word has not been extracted by the minority phoneme word extraction unit S13, the majority phoneme word is also extracted. It is determined that there is no word phoneme, and the multiple phoneme word extraction process is skipped, and the process returns to S11.
Otherwise, a multiple phoneme word extraction process is performed. In the majority phoneme word extraction unit (S15), similarly to the minority phoneme word extraction unit, word extraction is performed by generally well-known DP matching, and words having high similarity are extracted. When a word is extracted, the word name and the extracted phoneme position are sent to S5. Thereafter, the process returns to S11.
具体的な例を用いて説明する。例として「海外に」と
話者が発声し、S3における出力が“kaikaini"であった
場合を考える。この出力は4音素目に誤認識を含んでい
る。CPU26はまずS11において、辞書(第6図参照)から
“ka"を読み込む。“ka"は、2音素から構成されている
単語であるためS12において少数音素単語と判定され
る。少数音素単語抽出部S13では、DPマッチングによ
り、“ka"の単語抽出が行なわれ、“ka"は1〜2音素目
と4〜5音素目で抽出されS5に結果が送られる。次に前
記2音素単語用のテーブル(第7図参照)に“ka"が単
語抽出されたことを記憶し、処理はS11に戻る。同様に
“kai"及び“kaio"といった少数音素単語抽出処理が行
なわれる。“kai"は1〜3音素目と4〜6音素目で抽出
され、“kaio"は単語抽出されず、前記3音素単語用テ
ーブル(第7図参照)に“kai"が単語抽出されたこと
が、4音素単語用テーブルに“kaio"が抽出されなかっ
たことが記憶される。次にS11に於て辞書から“kaigai"
が読み込まれたとする。“kaigai"は、6音素から構成
されている単語であるため、S12において、多数音素単
語と判定される。次に多数音素単語抽出制御部S14にお
いて、前記テーブル内に“kaigai"の部分単語があるか
調べられる。テーブル内には“ka"及び“kai"という“k
aigai"の部分単語があり、両方共に単語抽出されている
ことが記憶されている。このため、処理を多数音素単語
抽出部S15に移す。多数音素単語抽出部S15では、DPマッ
チングにより、“kaigai"のワード・スッポティングが
行なわれ、“kaigai"は1〜6音素目で抽出され、結果
がS5に送られた後、処理はS11に戻る。This will be described using a specific example. As an example, consider a case where the speaker utters “overseas” and the output in S3 is “kaikaini”. This output contains misrecognition in the fourth phoneme. First, in S11, the CPU 26 reads "ka" from the dictionary (see FIG. 6). Since "ka" is a word composed of two phonemes, it is determined as a minority phoneme word in S12. In the minority phoneme word extraction unit S13, the word "ka" is extracted by DP matching, and "ka" is extracted in the first and second phonemes and the fourth and fifth phonemes, and the result is sent to S5. Next, the fact that "ka" has been extracted is stored in the diphone word table (see FIG. 7), and the process returns to S11. Similarly, a minority phoneme word extraction process such as “kai” and “kaio” is performed. “Kai” was extracted in the first to third phonemes and fourth to sixth phonemes, “kaio” was not extracted, and “kai” was extracted in the three-phoneme word table (see FIG. 7). However, it is stored that “kaio” was not extracted in the 4-phoneme word table. Next, in S11, "kaigai" from the dictionary
Is read. Since “kaigai” is a word composed of six phonemes, it is determined in S12 as a multiple phoneme word. Next, the multiple phoneme word extraction control unit S14 checks whether there is a partial word of “kaigai” in the table. In the table, “ka” and “kai” “k”
It is stored that there is a partial word of "aigai", and both words are extracted. Therefore, the process is transferred to the multiple phoneme word extraction unit S15. The multiple phoneme word extraction unit S15 performs "kaigai" The word spotting of "" is performed, and "kaigai" is extracted in the first to sixth phonemes. The result is sent to S5, and then the process returns to S11.
別の例を考える。「我国の」と話者が発声し、S3の出
力が“wagakunino"であったとする。CPU26は、まずS11
において、辞書(第6図参照)から“ka"を読み込む。
“ka"は、2音素から構成されている単語であるためS12
において少数音素単語と判定される。少数音素単語抽出
部S13では、DPマッチングにより、“ka"の単語抽出が行
なわれ、“ka"は3〜4音素目で抽出され、S5に結果が
送られる。次に前記2音素単語用のテーブルに“ka"が
単語抽出されたことが記憶され、処理はS11に戻る。同
様に“kai"及び“kaio"といった少数音素単語抽出処理
が行なわれるが両単語とも抽出されず、前記3音素単語
用テーブルに“kai"が単語抽出されなかったことが、4
音素単語用テーブルに“kaio"が抽出されなかったこと
が記憶される。次にS11に於て辞書から“kaigai"が読み
込まれたとする。“kaigai"は、6音素から構成されて
いる単語であるため、S12において、多数音素単語と判
定される。次に多数音素単語抽出制御部S14において、
前記テーブル内に“kaigai"の部分単語があるか調べら
れる。テーブル内には“ka"及び“kai"という“kaigai"
の部分単語があり、“kai"が単語抽出されていないこと
が記憶されている。このため、“kaigai"に対しても単
語抽出されないと判断され、多数音素単語抽出部S15を
スキップしS11に戻る。同様に“kaigara"、“kaigi"等
の単語抽出処理もスキップされる。Consider another example. Suppose that the speaker uttered "Japan" and the output of S3 was "wagakunino". CPU26 first starts with S11
Reads "ka" from the dictionary (see FIG. 6).
Since "ka" is a word composed of two phonemes,
Is determined to be a minority phoneme word. In the minority phoneme word extraction unit S13, the word "ka" is extracted by DP matching, "ka" is extracted in the third and fourth phonemes, and the result is sent to S5. Next, the fact that “ka” has been extracted is stored in the diphone word table, and the process returns to S11. Similarly, minority phoneme word extraction processing such as “kai” and “kaio” is performed, but neither word is extracted, and “kai” is not extracted in the triphoneme word table.
It is stored in the phoneme word table that “kaio” was not extracted. Next, it is assumed that “kaigai” is read from the dictionary in S11. Since “kaigai” is a word composed of six phonemes, it is determined in S12 as a multiple phoneme word. Next, in the multiple phoneme word extraction control unit S14,
It is checked whether there is a partial word "kaigai" in the table. “Ka” and “kai” in the table are “kaigai”
, And that "kai" has not been extracted. Therefore, it is determined that no word is extracted for “kaigai”, and the multiple phoneme word extraction unit S15 is skipped and the process returns to S11. Similarly, word extraction processing such as "kaigara" and "kaigi" is also skipped.
辞書内の全ての単語に対してこの処理を行なった後、
辞書検索処理を終了する。本発明は以上詳述した実施例
に限定されるものではなく、その趣旨を逸脱しない範囲
において種々の変更を加えることができる。After performing this process for every word in the dictionary,
The dictionary search process ends. The present invention is not limited to the embodiments described in detail above, and various changes can be made without departing from the gist of the present invention.
例えば、S3において出力される音素認識結果中に脱落
音素が多い場合には、少数音素単語抽出部S13に於い
て、1音素単語及び2音素単語は単語抽出されにくいこ
とがある。そのため、多数音素単語抽出制御部S13にお
いては、1音素単語及び2音素単語用テーブルは参照し
ない方が良い場合もあり、3音素単語及び4音素単語の
みを参照するように変更する事も可能である。For example, if there are many dropped phonemes in the phoneme recognition result output in S3, the one-phoneme word and the two-phoneme word may not be easily extracted in the minority phoneme word extraction unit S13. For this reason, in the multiple phoneme word extraction control unit S13, it may be better not to refer to the one-phoneme word and two-phoneme word tables, and it may be changed to refer to only the three-phoneme word and the four-phoneme word. is there.
また本実施例においては少数音素単語と多数音素単語
とは4音素で区分したがそれに限定されるものではなく
4音素以外で区分しても良い。Further, in the present embodiment, the minority phoneme word and the majority phoneme word are divided by four phonemes, but the invention is not limited thereto, and may be classified by other than four phonemes.
[発明の効果] 以上、詳述したことから明らかなように本発明の言語
処理装置においては、音素数判断手段により、前記検索
手段により検索された単語候補が所定数未満の音素から
構成されている単語か、所定数以上の音素から構成され
ている単語かが判断され、前記音素数判断手段によって
所定数未満の音素から構成されていると判断された単語
候補に対し第1の音素単語抽出手段がDPマッチングによ
り単語抽出を行い、単語抽出判断手段は、前記音素数判
断手段によって所定数以上の音素から構成されていると
判断された単語候補の中に存在する前記所定数未満の音
素から構成されている部分単語が前記第1の音素単語抽
出手段により単語抽出されているか否かを判断し、前記
単語抽出判断手段により前記部分単語が単語抽出されて
いると判断された場合には、第2の音素単語抽出手段は
前記部分単語を含む単語候補に対しDPマッチングにより
単語抽出を行い、前記単語抽出判断手段により前記部分
単語が単語抽出されていると判断されない場合には、前
記部分単語を含む単語候補に対し前記第2の音素単語抽
出手段によりDPマッチングを行わないので、DPマッチン
グを行なう単語数を効率よく減らすことができ、辞書検
索の高速化が可能となる。[Effects of the Invention] As is clear from the above description, in the language processing apparatus of the present invention, the word candidate searched by the search means is constituted by less than a predetermined number of phonemes by the phoneme number determination means. The first phoneme word extraction is performed on a word candidate determined to be composed of less than a predetermined number of phonemes by the phoneme number determination unit. The means performs word extraction by DP matching, and the word extraction determination means determines from the phonemes less than the predetermined number present in the word candidates determined to be composed of the predetermined number or more phonemes by the phoneme number determination means. It is determined whether or not the composed partial words have been extracted by the first phoneme word extracting means, and the partial words have been extracted by the word extraction determining means. If it is determined, the second phoneme word extraction unit extracts a word from the word candidate including the partial word by DP matching, and the word extraction determination unit does not determine that the partial word has been extracted. In this case, since the second phoneme word extracting unit does not perform DP matching on the word candidate including the partial word, the number of words for performing DP matching can be efficiently reduced, and the dictionary search can be speeded up. Becomes
第1図から第7図までは本発明を具体化した実施例を示
すもので、第1図は本実施例の言語処理装置における辞
書検索の動作の流れを示すフローチャート、第2図は言
語処理装置の構成を示すブロック図、第3図は言語処理
装置の動作の流れを示すフローチャート、第4図は、DP
マッチング時に使用する音素間の類似度を示す表、第5
図は、DPマッチング時に使用する傾斜制限を示した説明
図、第6図は、辞書の一部分を抜粋した説明図、第7図
は、辞書検索部が使用するテーブルの説明図である。 図中、21はマイク、23はローパスフィルタ、24はA/D変
換装置、26はCPUである。1 to 7 show an embodiment embodying the present invention. FIG. 1 is a flowchart showing the flow of a dictionary search operation in the language processing apparatus of the present embodiment. FIG. FIG. 3 is a block diagram showing a configuration of the apparatus, FIG. 3 is a flowchart showing an operation flow of the language processing apparatus, and FIG.
Table showing similarity between phonemes used in matching, fifth
FIG. 6 is an explanatory diagram showing a tilt limit used in DP matching, FIG. 6 is an explanatory diagram showing a part of a dictionary, and FIG. 7 is an explanatory diagram of a table used by a dictionary search unit. In the figure, 21 is a microphone, 23 is a low-pass filter, 24 is an A / D converter, and 26 is a CPU.
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭60−73596(JP,A) 特開 昭60−73596(JP,A) 特開 昭58−195895(JP,A) 特開 昭57−86899(JP,A) 特開 昭63−292197(JP,A) 古井「ディジタル音声処理」(1985− 9−25)東海大学出版会 p.160−172 (58)調査した分野(Int.Cl.7,DB名) G10L 15/28 G06F 3/16 340 G10L 15/12 JICSTファイル(JOIS)──────────────────────────────────────────────────続 き Continuation of the front page (56) References JP-A-60-73596 (JP, A) JP-A-60-73596 (JP, A) JP-A-58-195895 (JP, A) JP-A-57-1995 86899 (JP, A) JP-A-63-292197 (JP, A) Furui, "Digital Speech Processing" (1985-9-25) Tokai University Press, p. 160-172 (58) Field surveyed (Int. Cl. 7 , DB name) G10L 15/28 G06F 3/16 340 G10L 15/12 JICST file (JOIS)
Claims (1)
と、入力された言語情報を分析し、分析結果に基づいて
音素認識を行う音素認識手段と、前記音素認識手段によ
り認識された音素列に基づいて、音素表記された辞書か
ら単語候補を検索する検索手段と、前記検索手段により
検索された単語候補に基づいて文章を出力する出力処理
手段とを備えた言語処理装置において、 前記検索手段により検索された単語候補が所定数未満の
音素から構成されている単語か、所定数以上の音素から
構成されている単語かを判断する音素数判断手段と、 前記音素数判断手段によって所定数未満の音素から構成
されていると判断された単語候補に対しDPマッチングに
より単語抽出を行う第1の音素単語抽出手段と、 前記音素数判断手段によって所定数以上の音素から構成
されていると判断された単語候補の中に存在する前記所
定数未満の音素から構成されている部分単語が前記第1
の音素単語抽出手段により単語抽出されているか否かを
判断する単語抽出判断手段と、 前記単語抽出判断手段により前記部分単語が単語抽出さ
れていると判断された場合には、前記部分単語を含む単
語候補に対しDPマッチングにより単語抽出を行う第2の
音素単語抽出手段とを備え、 前記単語抽出判断手段により前記部分単語が単語抽出さ
れていると判断されない場合には、前記部分単語を含む
単語候補に対し前記第2の音素単語抽出手段によりDPマ
ッチングを行わないこと を特徴とする言語処理装置。An input means for inputting linguistic information by voice, a phoneme recognizing means for analyzing the input linguistic information and performing phoneme recognition based on the analysis result, and a phoneme sequence recognized by the phoneme recognizing means. A language processing apparatus comprising: a search unit that searches for a word candidate from a phoneme-based dictionary based on the search result; and an output processing unit that outputs a sentence based on the word candidate searched by the search unit. A phoneme number determining means for determining whether the searched word candidate is a word composed of less than a predetermined number of phonemes or a word composed of a predetermined number or more of phonemes, First phoneme word extraction means for performing word extraction by DP matching on a word candidate determined to be composed of phonemes; Wherein the partial word which is composed of phonemes of less than the predetermined number present in the by-word candidate determined as being constituted by a prime first
A word extraction judging means for judging whether or not a word has been extracted by the phoneme word extracting means, and including the partial word when the word extraction judging means judges that the partial word has been extracted. A second phoneme word extracting means for extracting a word from the word candidate by DP matching, and a word including the partial word when the word extraction determining means does not determine that the partial word has been extracted. A language processing apparatus, wherein DP matching is not performed on a candidate by the second phoneme word extracting means.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2146828A JP3033132B2 (en) | 1990-06-05 | 1990-06-05 | Language processor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2146828A JP3033132B2 (en) | 1990-06-05 | 1990-06-05 | Language processor |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0439700A JPH0439700A (en) | 1992-02-10 |
JP3033132B2 true JP3033132B2 (en) | 2000-04-17 |
Family
ID=15416440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2146828A Expired - Fee Related JP3033132B2 (en) | 1990-06-05 | 1990-06-05 | Language processor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3033132B2 (en) |
-
1990
- 1990-06-05 JP JP2146828A patent/JP3033132B2/en not_active Expired - Fee Related
Non-Patent Citations (1)
Title |
---|
古井「ディジタル音声処理」(1985−9−25)東海大学出版会 p.160−172 |
Also Published As
Publication number | Publication date |
---|---|
JPH0439700A (en) | 1992-02-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zissman et al. | Automatic language identification | |
US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
US20050033575A1 (en) | Operating method for an automated language recognizer intended for the speaker-independent language recognition of words in different languages and automated language recognizer | |
JPH10501078A (en) | Method and apparatus for adapting the size of a language model of a speech recognition system | |
JPWO2008114811A1 (en) | Information search system, information search method, and information search program | |
JPH06214587A (en) | Predesignated word spotting subsystem and previous word spotting method | |
Hanani et al. | Spoken Arabic dialect recognition using X-vectors | |
JP2955297B2 (en) | Speech recognition system | |
JP4115723B2 (en) | Text search device by voice input | |
US6963832B2 (en) | Meaning token dictionary for automatic speech recognition | |
JP2005148342A (en) | Method for speech recognition, device, and program and recording medium for implementing the same method | |
JP3444108B2 (en) | Voice recognition device | |
KR20130126570A (en) | Apparatus for discriminative training acoustic model considering error of phonemes in keyword and computer recordable medium storing the method thereof | |
JP2002278579A (en) | Voice data retrieving device | |
JP3033132B2 (en) | Language processor | |
Shafieian | Hidden Markov model and Persian speech recognition | |
JP2813209B2 (en) | Large vocabulary speech recognition device | |
JP2003271183A (en) | Device, method and program for preparing voice recognition dictionary, device and system for recognizing voice, portable terminal device and program recording medium | |
Hunt | Speaker adaptation for word‐based speech recognition systems | |
JP3039453B2 (en) | Voice recognition device | |
JP3240691B2 (en) | Voice recognition method | |
JP2905686B2 (en) | Voice recognition device | |
JP3110025B2 (en) | Utterance deformation detection device | |
JPH0233200A (en) | Data base retrieving system | |
Chiang et al. | CCLMDS'96: Towards a speaker-independent large-vocabulary Mandarin dictation system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080218 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090218 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |