JPH0421899A - Voice recognizing device - Google Patents
Voice recognizing deviceInfo
- Publication number
- JPH0421899A JPH0421899A JP2127280A JP12728090A JPH0421899A JP H0421899 A JPH0421899 A JP H0421899A JP 2127280 A JP2127280 A JP 2127280A JP 12728090 A JP12728090 A JP 12728090A JP H0421899 A JPH0421899 A JP H0421899A
- Authority
- JP
- Japan
- Prior art keywords
- circuit
- word
- candidates
- sorting
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 description 5
- 238000007796 conventional method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 241000282412 Homo Species 0.000 description 1
Abstract
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、人間の発生した単語音声または文音声を認識
する音声認識装置に関する。DETAILED DESCRIPTION OF THE INVENTION Field of the Invention The present invention relates to a speech recognition device that recognizes word speech or sentence speech produced by humans.
従来の技術
従来、人間の発生した音声を認識する装置を実現する技
術としては種々の方法が存在している。BACKGROUND OF THE INVENTION Conventionally, there have been various techniques for realizing a device that recognizes human-generated speech.
その−例として、音響パラメータパターンのマツチング
に基づく方法がある。以下、従来技術として、単語認識
の場合について、音響パラメータパターンマツチングに
基づく方法について説明する。An example is a method based on matching acoustic parameter patterns. Hereinafter, as a conventional technique, a method based on acoustic parameter pattern matching will be described in the case of word recognition.
第3図は、従来の音声認識システムの典型的な構成例を
示したものである。FIG. 3 shows a typical configuration example of a conventional speech recognition system.
第3図において、入力音声は音声分析口fI8Llに入
力される。音声分析回路11は入力音声を分析し、音声
の特徴を表わす特徴パラメータの時系列をパターン照合
回路12に出力する。In FIG. 3, the input voice is input to the voice analysis port fI8Ll. The speech analysis circuit 11 analyzes the input speech and outputs a time series of feature parameters representing the characteristics of the speech to the pattern matching circuit 12.
パターン照合回路12には、標準パターン格納回路16
からもパラメータ時系列が供給される。The pattern matching circuit 12 includes a standard pattern storage circuit 16.
Also provides parameter time series.
標準パターン格納回路16には、標準パターンとして利
用される単語毎に用意されたパラメータ時系列が格納さ
れている。パターン照合回路12は、音声分析回路11
で得られた特徴パラメータ時系列と、標準パターン格納
回路16から供給される標準パターンパラメータ時系列
とを、所定の単語集団について照合し、照合の結果を単
語毎に認識結果判定回路13に出力する。認識結果判定
回路13は、パターン照合回路12で照合した結果を入
力し、最も良い照合結果を与える単語を判定して、音声
認識装置の認識結果として外部に出力する。The standard pattern storage circuit 16 stores a parameter time series prepared for each word used as a standard pattern. The pattern matching circuit 12 is the voice analysis circuit 11
The characteristic parameter time series obtained in step 1 and the standard pattern parameter time series supplied from the standard pattern storage circuit 16 are compared for a predetermined group of words, and the results of the comparison are outputted to the recognition result determination circuit 13 for each word. . The recognition result determination circuit 13 inputs the results of the matching performed by the pattern matching circuit 12, determines the word that gives the best matching result, and outputs the word to the outside as the recognition result of the speech recognition device.
発明が解決しようとする課題
従来の音声認識装置では、入カバターンと標準パターン
のそれぞれの時系列パラメータを照合し、最も良い照合
結果を与える単語を認識結果として得ている。しかし々
から、音声認識の場合には、話者が意図した内容と異な
る認識結果が得られる、いわゆる認識誤りが、ある頻度
で生じる。この認識誤りが生じた場合、同じ単語を再入
力する等の対応が必要と々るが、第3図の従来例で示し
たような認識結果を1個だけ得る方法では、認識誤りが
生じた場合に、話者が意図している単語にアクセスする
のに手間および時間がかかるという操作性の面での問題
がある。Problems to be Solved by the Invention In conventional speech recognition devices, the time-series parameters of each input pattern and standard pattern are compared, and the word that gives the best matching result is obtained as a recognition result. However, in the case of speech recognition, so-called recognition errors, in which a recognition result different from the content intended by the speaker is obtained, occur with a certain frequency. If this recognition error occurs, it may be necessary to take measures such as re-entering the same word, but with the method of obtaining only one recognition result as shown in the conventional example in Figure 3, recognition errors occur. In some cases, there is a problem in terms of operability in that it takes time and effort to access the word that the speaker intends.
本発明は」−記課題に鑑み、認識誤りが生じた場合に、
話者が意図している単語に短時間でアクセスできる音声
認識装置を提供することを目的とする。In view of the problems described above, the present invention provides the following:
It is an object of the present invention to provide a speech recognition device that can access words intended by a speaker in a short time.
課題を解決するだめの手段
この目的を達成するために、本発明では、複数個の単語
候補または文候補を認識結果と]−2て出力する音声認
識手段と、音声認識手段が出力した複数個の単語候補ま
たは文候補を分類項目別に分類する候補分類手段と、候
補分類手段が分類した結果に基づいて複数個の単語候補
または文候補を分類項目別に出力表示する画面表示装置
とを設けるように構成されている。Means for Solving the Problem In order to achieve this object, the present invention provides a speech recognition means for outputting a plurality of word candidates or sentence candidates as recognition results, and a speech recognition means for outputting a plurality of word candidates or sentence candidates as recognition results, and A candidate classification means for classifying word candidates or sentence candidates according to classification items, and a screen display device for outputting and displaying a plurality of word candidates or sentence candidates according to classification items based on the classification results by the candidate classification means. It is configured.
作 111
本発明は、上記構成により、認識結果を候補として分類
項目別に複数個表示することで、複数個の候補の中に正
しい単語が含壕れていれば、表示された候補の中から正
しい単語を選び出す操作によって、1回の発声で話者の
意図している中1語にアクセスできるように作用する。111 With the above configuration, the present invention displays a plurality of recognition results as candidates for each classification item, and if a correct word is included in the plurality of candidates, the correct word is selected from among the displayed candidates. By selecting a word, it is possible to access one of the words intended by the speaker with a single utterance.
実施例 以下、実施例により本発明の説明を行う。Example The present invention will be explained below with reference to Examples.
第1図は、本発明の一実施例の構成を示すブロック図で
ある。FIG. 1 is a block diagram showing the configuration of an embodiment of the present invention.
第1図において、人力音声は音声分析回路1に入力され
る。音声分析回路1は人力音声を分析し、音声の特徴と
表わす特徴パラメータの時系列をパターン照合回路2に
出力する。In FIG. 1, human voice is input to a voice analysis circuit 1. In FIG. A speech analysis circuit 1 analyzes human speech and outputs a time series of feature parameters representing speech characteristics to a pattern matching circuit 2.
パターン照合回路2には、標準パターン格納回路6から
もパラメータ時系列が供給される。標準パターン格納回
路6には、標準パターンとして利用される単語毎に用意
されたパラメータ時系列が格納されている。パターン照
合回路2は、音声分析回路1で得られた特徴パラメータ
時系列と、標準パターン格納回路6から供給される標準
パターンとして利用されるパラメータ時系列とを、所定
の単語集団について照合し、照合の結果を単語毎に候補
選別回路3に出力する。The pattern matching circuit 2 is also supplied with parameter time series from the standard pattern storage circuit 6. The standard pattern storage circuit 6 stores a parameter time series prepared for each word used as a standard pattern. The pattern matching circuit 2 matches the feature parameter time series obtained by the speech analysis circuit 1 and the parameter time series used as a standard pattern supplied from the standard pattern storage circuit 6 for a predetermined word group, and performs matching. The results are output to the candidate selection circuit 3 for each word.
候補選別回路3は、パターン照合回路2の照合結果を入
力し、照合結果の良いものから複数個の単語候補を選別
して候補分類回路4に供給する。The candidate selection circuit 3 inputs the matching results of the pattern matching circuit 2, selects a plurality of word candidates based on the best matching results, and supplies them to the candidate classification circuit 4.
候補分類回路4は、候補選別回路3から供給される単語
候補を入力し、分類項目情報格納回路7に格納されてい
る分類項目を照合することにより、単語候補を分類項目
別に分類する。候補分類回路4で分類された内容は、終
段の画面表示装置5に入力され、分類項目別に表示され
る。The candidate classification circuit 4 receives the word candidates supplied from the candidate selection circuit 3, and classifies the word candidates by classification item by comparing the word candidates with the classification items stored in the classification item information storage circuit 7. The contents classified by the candidate classification circuit 4 are input to the screen display device 5 at the final stage, and are displayed for each classification item.
第2図に画面表示装置5における画面表示の例を示す。FIG. 2 shows an example of a screen display on the screen display device 5.
なお、この例では、単語「−発明」ならば、1−は段」
、単語「音声」ならば[あ段」のように、単語分類の基
準として単語の最初の音節が属する50音の1段」を設
定することで分類した表示を行っている。In addition, in this example, if the word ``-invention'', 1- is ``dan''.
, for the word ``speech'', the word is displayed as classified by setting the first syllable of the 50 sounds to which the first syllable of the word belongs as a standard for word classification, such as ``a-dan''.
第2図は、「発明」という入力音声を認識した際の認識
結果の候補を、画面表示装置5に表示した例を示してい
る。この例では、第1位の候補として単語[−シつれい
」が認識され、正解の1はつめい」は、第2位の候補と
して認識されている。FIG. 2 shows an example in which recognition result candidates are displayed on the screen display device 5 when the input voice "invention" is recognized. In this example, the word "-shitsurei" is recognized as the first candidate, and the correct answer "1 is Tsumei" is recognized as the second candidate.
即ち、第1位の候補は2重アンダーラインを付して表示
され、第2位の候補はアンダーラインを付して表示され
る。That is, the first-place candidate is displayed with a double underline, and the second-place candidate is displayed with an underline.
第3図で示した従来の音声認識装置では、第1位の結果
のみを得るようにしているので、認識誤りが生じた場合
、同じ単語を再発声することが必要となるが、第1図に
示す本発明の音声認識装置により、ば、K声認識装置の
使用者は、第2図のように表示された情報から、画面表
示装置5の画面」−の夕yチパイ・ルやキー人力もしく
はマウス等の入力手段により、意図する単語を選び出す
ことにより、使用者が意図している単語に短時間でアク
セスすることが可能となシ、操作性の向上を図ることが
できる。In the conventional speech recognition device shown in Fig. 3, only the first result is obtained, so if a recognition error occurs, it is necessary to re-speak the same word. With the voice recognition device of the present invention shown in FIG. Alternatively, by selecting the desired word using an input means such as a mouse, the user can access the desired word in a short time, thereby improving operability.
丑た、情報検索等の入力として音声認識を利用する場合
等では、実際の音声認識性能の限界を越える語常数が必
要となる場合が生じ得る。このような場合でも、本発明
の音声認識装置によれば、得られた候補の中に話者が意
図している単語が含まれている確率が、従来の単数の認
識結果を表示する方法に比べて高くなるので、取シ扱う
語粟数を従来に比べて大きく設定することが可能となる
。Furthermore, when speech recognition is used as an input for information retrieval, etc., a word constant that exceeds the limit of actual speech recognition performance may be required. Even in such a case, according to the speech recognition device of the present invention, the probability that the obtained candidates include the word intended by the speaker is lower than the conventional method of displaying singular recognition results. Since the cost is higher than that of conventional methods, it is possible to set the number of words to be handled larger than in the past.
発明の詳細
な説明したように、本発明によれば、複数個の単語候補
または文候補を認識結果として出力する音声認識手段と
、音声認識手段が出力した複数個の単語候補または文候
補を分類項目別に分類する候補分類手段と、候補分類手
段が分類した結果に基づいて複数個の単語候補または文
候補を分類項目別に出力表示する画面表示装置とを設け
るように構成されている。DETAILED DESCRIPTION OF THE INVENTION According to the present invention, there is provided a speech recognition means for outputting a plurality of word candidates or sentence candidates as recognition results, and a method for classifying the plurality of word candidates or sentence candidates outputted by the speech recognition means. The present invention is configured to include a candidate classification means for classifying by item, and a screen display device for outputting and displaying a plurality of word candidates or sentence candidates for each classification item based on the results of classification by the candidate classification means.
この構成によシ認識結果を候補として分類項目別に複数
個表示することで、複数個の候補の中に正しい単語が含
まれていれば、表示された候補の中から正しい単語を選
び出す操作によって、話者が意図している単語に短時間
でアクセスすることが可能となる。With this configuration, by displaying multiple recognition results as candidates for each classification item, if the correct word is included in the multiple candidates, the correct word can be selected from the displayed candidates. It becomes possible to access the words intended by the speaker in a short time.
第1図は、本発明の一実施例における音声認識装置を示
すブロック図、第2図は、本発明の一実施例における音
声認識装置の動作を説明する画面表示装置の正面図、第
3図は、従来の音声認識装置を示すブロック図である。
1・・・音声分析回路、、2・・・パターン照合回路、
3・候補選別回路、4 候補分類回路、5・・・画面表
示装置、6・・・標準パターン格納回路、7・・・分類
項目情報格納回路。FIG. 1 is a block diagram showing a speech recognition device in an embodiment of the present invention, FIG. 2 is a front view of a screen display device for explaining the operation of the speech recognition device in an embodiment of the invention, and FIG. 3 1 is a block diagram showing a conventional speech recognition device. 1...Speech analysis circuit, 2...Pattern matching circuit,
3. Candidate selection circuit, 4. Candidate classification circuit, 5. Screen display device, 6. Standard pattern storage circuit, 7. Classification item information storage circuit.
Claims (1)
る音声認識手段と、上記音声認識手段が出力した複数個
の単語候補または文候補を分類項目別に分類する候補分
類手段と、上記候補分類手段が分類した結果に基づいて
上記複数個の単語候補または文候補を上記分類項目別に
出力表示する画面表示装置とを具備する音声認識装置。a speech recognition means for outputting a plurality of word candidates or sentence candidates as recognition results; a candidate classification means for classifying the plurality of word candidates or sentence candidates outputted by the speech recognition means according to classification items; A speech recognition device comprising: a screen display device that outputs and displays the plurality of word candidates or sentence candidates for each of the classification items based on the classification results.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2127280A JPH0421899A (en) | 1990-05-16 | 1990-05-16 | Voice recognizing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2127280A JPH0421899A (en) | 1990-05-16 | 1990-05-16 | Voice recognizing device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0421899A true JPH0421899A (en) | 1992-01-24 |
Family
ID=14956072
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2127280A Pending JPH0421899A (en) | 1990-05-16 | 1990-05-16 | Voice recognizing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0421899A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0486800A (en) * | 1990-07-31 | 1992-03-19 | Fujitsu Ltd | Voice recognition system by displaying plural candidates |
KR100441181B1 (en) * | 1995-04-07 | 2005-04-06 | 소니 가부시끼 가이샤 | Voice recognition method and device |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61184683A (en) * | 1985-02-12 | 1986-08-18 | Nec Corp | Recognition-result selecting system |
-
1990
- 1990-05-16 JP JP2127280A patent/JPH0421899A/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61184683A (en) * | 1985-02-12 | 1986-08-18 | Nec Corp | Recognition-result selecting system |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0486800A (en) * | 1990-07-31 | 1992-03-19 | Fujitsu Ltd | Voice recognition system by displaying plural candidates |
KR100441181B1 (en) * | 1995-04-07 | 2005-04-06 | 소니 가부시끼 가이샤 | Voice recognition method and device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Noroozi et al. | Vocal-based emotion recognition using random forests and decision tree | |
KR970006403B1 (en) | Interactive computer system recognizing spoken commands | |
US5329609A (en) | Recognition apparatus with function of displaying plural recognition candidates | |
US5689716A (en) | Automatic method of generating thematic summaries | |
EP1300831B1 (en) | Method for detecting emotions involving subspace specialists | |
US7580835B2 (en) | Question-answering method, system, and program for answering question input by speech | |
US4769845A (en) | Method of recognizing speech using a lip image | |
US5257314A (en) | Voice recognition system having word frequency and intermediate result display features | |
EP0380297A2 (en) | Method and apparatus for speech recognition | |
EP0109190A1 (en) | Monosyllable recognition apparatus | |
US6038535A (en) | Speech classifier and method using delay elements | |
US7742918B1 (en) | Active learning for spoken language understanding | |
CN110168527B (en) | Information processing device, information processing method, and information processing program | |
US6243695B1 (en) | Access control system and method therefor | |
US6131089A (en) | Pattern classifier with training system and methods of operation therefor | |
Li et al. | An Empirical comparison of machine learning algorithms for classification of software requirements | |
JPH0421899A (en) | Voice recognizing device | |
US6192353B1 (en) | Multiresolutional classifier with training system and method | |
JPS6151799B2 (en) | ||
Helander et al. | Systems design for automated speech recognition | |
CN108922542B (en) | Sample triplet acquisition method and device, computer equipment and storage medium | |
Lin et al. | Binary attribute embeddings for zero-shot sound event classification | |
JPS63186299A (en) | Word voice recognition equipment | |
JPS6151798B2 (en) | ||
JPS63186298A (en) | Word voice recognition equipment |