JP3377684B2 - Search device by voice recognition - Google Patents

Search device by voice recognition

Info

Publication number
JP3377684B2
JP3377684B2 JP16563896A JP16563896A JP3377684B2 JP 3377684 B2 JP3377684 B2 JP 3377684B2 JP 16563896 A JP16563896 A JP 16563896A JP 16563896 A JP16563896 A JP 16563896A JP 3377684 B2 JP3377684 B2 JP 3377684B2
Authority
JP
Japan
Prior art keywords
search
candidate
keyword
candidate keywords
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP16563896A
Other languages
Japanese (ja)
Other versions
JPH1011461A (en
Inventor
清治 濱口
耕市 山口
浩幸 勘座
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP16563896A priority Critical patent/JP3377684B2/en
Publication of JPH1011461A publication Critical patent/JPH1011461A/en
Application granted granted Critical
Publication of JP3377684B2 publication Critical patent/JP3377684B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、音声認識により得
られたキーワードを用いた検索装置に関するものであ
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a search device using a keyword obtained by voice recognition.

【0002】[0002]

【従来の技術】ワープロで手紙などを書こうとする場
合、時候挨拶などの定型文を入力するために文章を打ち
込むのは面倒である。ワープロのようにキーボードがあ
って入力しやすい短い文章の入力は比較的容易だが、長
い文章を入力するのは時間がかかる。また、手書き認識
装置のように効率的に文章入力ができない装置では、同
様に、長い文章を入力するのに時間がかかる。そこで、
ファイル化されている挨拶用の例文データベースに対し
て適当なキーワードを入力し、そのキーワードに関連の
ある例文を検索出力し、得られた例文を手直しした方が
効率が良いことがある。
2. Description of the Related Art When writing a letter or the like in a word processor, it is troublesome to type a sentence to input a fixed phrase such as a greeting. It is relatively easy to enter short sentences that are easy to enter with a keyboard like a word processor, but it takes time to enter long sentences. Further, in a device such as a handwriting recognition device that cannot efficiently input a sentence, similarly, it takes time to input a long sentence. Therefore,
It may be more efficient to input an appropriate keyword into the filed example sentence database for greetings, retrieve and output the example sentence related to the keyword, and revise the obtained example sentence.

【0003】例えば、キーワードを入力することによっ
て、それに関連のある例文を検索する検索装置は、特開
平6‐325072号公報がある。しかし、このような
検索装置では、表示パネルの大きさの制約などもあり、
入力するキーワードはメニューを何度か選択して見つけ
ださねばならないようになっていて、利用者がキーワー
ドを入力するには何段階かの手順を踏まねばならない。
For example, Japanese Patent Laid-Open Publication No. 6-325072 discloses a search device for searching a related example sentence by inputting a keyword. However, in such a search device, there are restrictions on the size of the display panel,
The keywords to be entered have to be found by selecting the menu several times, and the user has to go through several steps to enter the keywords.

【0004】例文に限らず、情報検索を効率良く行なう
には、検索のためのキーワードの入力と検索処理とを高
速に行うことが必要である。
In order to efficiently perform information retrieval, not limited to example sentences, it is necessary to perform keyword input for retrieval and retrieval processing at high speed.

【0005】音声認識は高速な入力手段の一つとして研
究されている。しかし、人間の発声する文を認識させる
のは容易なことではない。現状では単語認識などは比較
的高い認識率で動作するようになってきているものの、
文音声認識のように難しいタスクは認識率、処理速度の
面からみてまだまだ実用レベルに到達していない。そこ
で、単語単位の音声認識結果を検索装置のキーワードと
して使用するというアイデアが考えられ、音声認識によ
るキーワードを用いた検索装置として、特開平6‐45
98号公報がある。
Speech recognition has been studied as one of high-speed input means. However, it is not easy to make a human voice recognize. At present, word recognition is operating at a relatively high recognition rate,
Difficult tasks like sentence speech recognition have not yet reached a practical level in terms of recognition rate and processing speed. Therefore, the idea of using the voice recognition result in word units as a keyword of the search device is considered, and as a search device using a keyword by voice recognition, Japanese Patent Laid-Open No. 6-45
There is a publication No. 98.

【0006】[0006]

【発明が解決しようとする課題】検索装置のキーワード
入力手段として音声認識を用いた場合、音声認識は認識
率が100%ではないので、認識結果の中から利用者が
正解の検索用キーワードを選択する方法が考えられる
が、利用者の手間を増やさずに情報を検索するには、認
識結果である候補キーワードの上位すべてを検索に用い
る方法がある。しかし、この方法では、不必要な候補キ
ーワードも検索に用いるため、検索に時間がかかるとい
う問題がある。
When voice recognition is used as the keyword input means of the search device, the recognition rate of voice recognition is not 100%, so the user selects the correct search keyword from the recognition results. However, in order to search for information without increasing the user's time and effort, there is a method of using all of the high-ranked candidate keywords, which are recognition results, for the search. However, in this method, since unnecessary candidate keywords are also used in the search, there is a problem that the search takes time.

【0007】また、検索用キーワードが一つでなく、複
数の検索用キーワードの組み合わせを用いる検索装置の
場合、各発声に対する認識結果である候補キーワードを
10個とした場合、発声数が3回ならその組み合わせ数
は1000個にもなる。これでは検索に時間がかかり過
ぎてしまうという問題がある。
Further, in the case of a search device which uses a combination of a plurality of search keywords instead of one search keyword, if the number of utterances is three when the number of candidate keywords that are recognition results for each utterance is ten The number of combinations is 1000. This has the problem that the search takes too long.

【0008】ところで、音声認識において、正解が認識
結果の第何位までに含まれるかという累積認識率の統計
をとると、一般的に、図1のようになる。第1位から第
2位、第3位と下がっていくにつれ、累積認識率は次第
に飽和してゆく。図1では、正解が認識結果の第5位ま
でに含まれる確率は97%、第10位までに含まれる確
率は99%になっている。第5位までと第10位までと
の差は2%しかない。
By the way, in the speech recognition, generally, as shown in FIG. 1, when the statistics of the cumulative recognition rate of the correct answer is included in the recognition result. The cumulative recognition rate gradually saturates as it goes down from the first place to the second place and the third place. In FIG. 1, the probability that the correct answer is included in the 5th place of the recognition result is 97%, and the probability that the correct answer is included in the 10th place is 99%. The difference between the 5th place and the 10th place is only 2%.

【0009】従って、3個の候補キーワードの組み合わ
せを情報検索に用いる場合、利用者が希望する候補キー
ワードの組み合わせで検索が行なわれる確率は、各々第
5位までとした場合には0.973=0.913、各々第
10位までとした場合には0.993=0.970とな
る。一方、候補キーワードの組み合わせ個数は各々第5
位までとした場合には53=125、各々第10位まで
とした場合には103=1000となる。検索に用いる
認識候補数を第5位から第10位までに変更すると、検
索に必要な処理量は8倍になるにも拘わらず、利用者の
希望する候補キーワードの組み合わせで検索が行なわれ
る確率は0.057しか改善されない。つまり、このよ
うな装置で最初から認識結果を第10位まで使って検索
を行なうのは無駄が多いといえる。
Accordingly, when using a combination of three candidate keyword information retrieval, the probability that the user is performed searching for a candidate keyword you wish, in case of a respectively to # 5 0.97 3 = 0.913, and if each is ranked up to the 10th place, 0.99 3 = 0.970. On the other hand, the number of combinations of candidate keywords is the fifth each.
In the case of up to the 5th place, 5 3 = 125, and in the case of up to the 10th place, 10 3 = 1000. If the number of recognition candidates used in the search is changed from 5th to 10th, the probability that the combination of candidate keywords desired by the user will be used for the search although the amount of processing required for the search will be eight times larger. Is improved by only 0.057. That is, it can be said that it is wasteful to perform a search by using the recognition result up to the tenth place from the beginning with such a device.

【0010】しかし、図1の累積認識率は、第1位から
第2位、第3位と下がっていくにつれ、飽和していく点
で一般的であるものの、その飽和の度合は各話者や環境
毎に異なるので、検索用キーワードとして第何位までの
候補キーワードの組み合わせを作成するかは、最悪のケ
ースを想定して設定するのが普通であり、そのため第5
位までで十分な話者でも第10位までの候補を用いて検
索するため、処理時間を無駄に消費せざるを得なかっ
た。
However, the cumulative recognition rate in FIG. 1 is generally saturated as it goes down from the first place to the second place and the third place, but the degree of saturation is different for each speaker. Since it varies depending on the environment and the environment, it is common to set the maximum number of candidate keyword combinations to be used as search keywords in the worst case.
Even a speaker who has sufficient rank up to 10th rank is required to waste processing time because he / she searches using candidates up to 10th rank rank.

【0011】本発明の目的は、上記問題点を解決するた
め、利用者に負担を与えずに、効率的に検索を行うこと
のできる音声認識による検索装置を提供するものであ
る。
SUMMARY OF THE INVENTION It is an object of the present invention to provide a retrieval device by voice recognition which can efficiently perform retrieval without burdening the user in order to solve the above problems.

【0012】[0012]

【課題を解決するための手段】請求項1に記載の音声認
識による検索装置は、第1の検索用キーワードと第2の
検索用キーワードを含む音声を入力する音声入力手段
と、入力された検索用キーワードごとに音声認識結果と
して候補キーワードを順位付けて複数生成する音声認識
手段と、検索実行を指示する指示手段と、キーワードの
組み合わせに対応する情報を記憶する記憶手段と、候補
キーワードの組み合わせに対応する情報を表示する表示
手段と、上記指示手段の指示に従って、第1の検索用キ
ーワードにより得られた所定数の第1の候補キーワード
と第2の検索用キーワードにより得られた所定数の第2
の候補キーワードとの第1の組み合せを作成し、第1の
組み合わせに対応する情報を上記記憶手段から検索して
上記表示手段に表示し、第1の候補キーワードを含む第
3の候補キーワードと第2の候補キーワードを含む第4
の候補キーワードとの第2の組み合せを第1の組み合わ
せを除いて作成し、第2の組み合わせに対応する情報を
上記記憶手段から検索して上記表示手段に表示する検索
手段と、を備えたことを特徴とする。
According to another aspect of the present invention, there is provided a voice recognition search apparatus, wherein voice input means for inputting voice including a first search keyword and a second search keyword, and an input search. a speech recognition means for a plurality generate ranked candidate keywords as the speech recognition result for each use keyword, and instruction means for instructing the search execution, and a storage means for storing information corresponding to a combination of keywords, a combination of candidate keywords And a predetermined number of first candidate keywords obtained by the first search keyword and a predetermined number of second candidate keywords obtained by the first search keyword according to the instruction of the instruction means. Second
Of the third candidate keyword including the first candidate keyword and the third candidate keyword including the first candidate keyword are displayed on the display unit by searching the storage unit for information corresponding to the first combination. 4th including 2 candidate keywords
A second combination with the candidate keyword of No. 1 except the first combination, and a search unit for searching the storage unit for information corresponding to the second combination and displaying the information on the display unit. Is characterized by.

【0013】請求項2に記載の音声認識による検索装置
は、請求項1に記載の音声認識による検索装置におい
て、第1及び第3の候補キーワードまたは第2及び第4
の候補キーワードに、上記音声認識手段により得られた
認識スコアが所定のしきい値以上の候補キーワードを用
いることを特徴とする。
A search device based on voice recognition according to a second aspect is the search device based on voice recognition according to the first aspect, wherein the first and third candidate keywords or the second and fourth candidate keywords are used.
As the candidate keyword, the candidate keyword whose recognition score obtained by the voice recognition means is equal to or higher than a predetermined threshold is used.

【0014】つまり、検索実行の際には、検索済みの候
補キーワードの組み合わせを除いた候補キーワードの組
み合わせを用いて、段階的に検索に用いる候補キーワー
ドの組み合わせを変更することにより、検索効率を向上
させることができる。
In other words, when executing the search, the combination of candidate keywords excluding the combination of already searched candidate keywords is used to gradually change the combination of candidate keywords used for the search, thereby improving the search efficiency. Can be made.

【0015】[0015]

【発明の実施の形態】以下、図2、図3を用いて、例文
検索を実行する場合について本発明を説明する。図2
は、本発明の音声認識による検索装置の構成ブロック図
であり、マイクロホン21、音声認識部22、制御部2
3、入力操作部24、検索部25、例文データベース2
6、表示部27、及びエディタ28からなり、処理部2
9は、各部の制御を行なう中央処理部の制御部23を含
み、通常のコンピュータ利用と対応のアルゴリズムによ
り実現される。なお、本実施の形態では、音声認識部2
2は、制御部23と同じ処理部29で実現したが、別処
理部にしてもよい。図3は、例文検索の手順を示すフロ
ーチャートである。
BEST MODE FOR CARRYING OUT THE INVENTION The present invention will be described below with reference to FIG. 2 and FIG. Figure 2
FIG. 3 is a block diagram showing a configuration of a search device by voice recognition according to the present invention, which includes a microphone 21, a voice recognition unit 22, and a control unit 2.
3, input operation unit 24, search unit 25, example sentence database 2
6, a display unit 27, and an editor 28, and the processing unit 2
9 includes a control unit 23 of a central processing unit that controls each unit, and is realized by an algorithm corresponding to normal computer use. In this embodiment, the voice recognition unit 2
2 is realized by the same processing unit 29 as the control unit 23, but may be a separate processing unit. FIG. 3 is a flow chart showing the procedure of the example sentence search.

【0016】まず、利用者はマイクロホン21に向かっ
て検索用キーワードを含む音声を発声する(ステップS
1)。
First, the user speaks a voice including a search keyword into the microphone 21 (step S).
1).

【0017】次に、音声認識部22は入力された音声を
音響分析し、音声認識部22内の認識辞書を参照してマ
ッチング処理等により単語単位で音声認識を行い、その
認識結果として得られた候補キーワードとその認識スコ
アを求め、候補キーワードを認識スコアの高い順に順位
付けて求める(ステップS2)。
Next, the voice recognition unit 22 acoustically analyzes the input voice, refers to the recognition dictionary in the voice recognition unit 22 to perform voice recognition on a word-by-word basis by a matching process, and obtains the recognition result. The candidate keywords and their recognition scores are obtained, and the candidate keywords are ranked in descending order of recognition score (step S2).

【0018】次に、利用者が入力操作部24の検索ボタ
ンを押せば(ステップS3)、予め図示しないレジスタ等
に設定されている順位までの候補キーワードの設定(ス
テップS4)がされて検索部25に入力され、検索部2
5は、候補キーワードに対応させた例文が格納された例
文データベース26にアクセスし、候補キーワードまた
は候補キーワードの組み合わせに対応する例文検索を行
なう(ステップS5)。候補キーワードと例文とは、関連
度を距離にした関係で対応付けている。検索された例文
は表示部27に表示され(ステップS6)、利用者に対し
て所望する例文の選択を促す。利用者は所望の例文が存
在する場合、入力操作部24の選択ボタンを使って例文
を選択し(ステップS7,S8)、選択された例文は入力
操作部24の指示によりエディタ28により加工して用
いる。
Next, when the user presses the search button of the input operation unit 24 (step S3), candidate keywords up to the order set in advance in a register (not shown) are set (step S4) and the search unit is searched. 25, the search unit 2
5 accesses the example sentence database 26 in which the example sentences corresponding to the candidate keywords are stored, and performs an example sentence search corresponding to the candidate keyword or the combination of the candidate keywords (step S5). The candidate keyword and the example sentence are associated with each other in a relationship in which the degree of association is a distance. The retrieved example sentence is displayed on the display unit 27 (step S6), and prompts the user to select the desired example sentence. If the desired example sentence exists, the user selects the example sentence by using the selection button of the input operation unit 24 (steps S7 and S8), and the selected example sentence is processed by the editor 28 according to the instruction of the input operation unit 24. To use.

【0019】表示された例文中に利用者の所望する例文
が存在しない場合(ステップS7)、利用者は二つの行動
をとることができる。一つの行動は、もう一度検索ボタ
ンを押すことである(ステップS3)。この場合、再度例
文検索が行なわれるが、最初に得られた候補キーワード
よりもさらに下位順位までの候補キーワードを用い、ま
たは候補キーワードが複数種ある場合は、より下位順位
の候補キーワード同士の組み合わせを用いて検索が行わ
れる。例えば、最初の検索は第3位までの候補キーワー
ドで行われたとすると、次の検索時は第4位、第5位の
候補キーワードを使用し、さらに次の検索時は第6位、
第7位といった具合である。
When there is no example sentence desired by the user in the displayed example sentences (step S7), the user can take two actions. One action is to press the search button again (step S3). In this case, the example sentence search is performed again, but the candidate keywords that are lower in rank than the first obtained candidate keyword are used, or if there are multiple types of candidate keywords, combinations of candidate keywords in lower ranks are combined. A search is performed using. For example, if the first search is performed with the candidate keywords up to the third place, the fourth and fifth candidate keywords are used during the next search, and the sixth place during the next search.
7th place.

【0020】また、候補キーワード同士の共起度合など
に応じた検索結果に検索スコアが算出される場合には、
利用者が検索ボタンを押すのを待つまでもなく、この検
索スコアを用いて自動的に2回目以降の検索を行なうこ
ともできる。つまり、検索して得られた例文の中に検索
スコアが十分高いものが存在しないときは、検索に使用
された候補キーワードの組み合わせの中に、利用者が発
声した通りのものが含まれていない可能性が高い。従っ
て、このように利用者の指示を待たずに自動的に二段階
目の検索を行なうことにより、より自動化を進めること
ができる。
When a search score is calculated for the search result according to the degree of co-occurrence between candidate keywords,
It is possible to automatically perform the second and subsequent searches using this search score without waiting for the user to press the search button. In other words, if there is no sentence with a sufficiently high search score among the example sentences obtained by searching, the combination of candidate keywords used in the search does not include the one that the user uttered. Probability is high. Therefore, the automation can be further promoted by automatically performing the second-stage search without waiting for the user's instruction.

【0021】表示された例文中に利用者の所望する例文
が存在しない場合(ステップS7)、利用者がとるべき、
もう一つの行動は、次の検索用キーワードを発声して検
索範囲を変更することである(ステップS3,S1)。つ
まり、必ずしも、発声毎に検索を行う必要がないので、
検索用キーワードを発声した直後に検索ボタンを押さず
に次の検索用キーワードの発声に移るのである。次の検
索用キーワードを発声し、各々の発声に対する候補キー
ワードが出力されてから検索ボタンを押すと、第1発声
に対応する候補キーワードと第2発声に対応する候補キ
ーワードの組み合わせが作られ(ステップS4)、これが
検索部25に入力される。検索部25は、各検索用キー
ワードの候補キーワード同士の組み合わせに対応する例
文を格納した例文データベース26にアクセスし、所定
順位までの候補キーワードの組み合わせに対応する例文
検索を行なう(ステップS5)。後は、上述したのと同様
にして例文表示や選択が行われる。つまり、各発声に対
して最初は各々第3位までの候補キーワードを用いて9
個の組み合わせをつくって検索し、さらに検索ボタンを
押した2回目の検索では、各々第5位までの候補キーワ
ードの組み合わせ25のうち、1回目に検索済みの9個
を除いた17個で検索を行なう。最初の検索に用いた候
補キーワードの組み合わせは重複すると無駄であるた
め、検索済みの候補キーワード同士の組み合わせは除か
れている。これは、検索済みの候補キーワードの組み合
わせを記憶しておけば容易に実現できる。
If there is no example sentence desired by the user in the displayed example sentences (step S7), the user should take it.
Another action is to say the next search keyword and change the search range (steps S3 and S1). In other words, since it is not necessary to search for each utterance,
Immediately after the search keyword is uttered, the next search keyword is uttered without pressing the search button. When the next search keyword is uttered, and the candidate keyword for each utterance is output and the search button is pressed, a combination of the candidate keyword corresponding to the first utterance and the candidate keyword corresponding to the second utterance is created (step S4), which is input to the search unit 25. The search unit 25 accesses the example sentence database 26 that stores example sentences corresponding to combinations of candidate keywords of the respective search keywords, and performs an example sentence search corresponding to combinations of candidate keywords up to a predetermined rank (step S5). After that, the example sentences are displayed and selected in the same manner as described above. That is, for each utterance, at first, the candidate keywords up to the third place are used, and
In the second search, in which a combination of individual keywords was created and the search button was pressed, 17 of the 25 combinations of candidate keywords up to the fifth place were excluded, except for the 9 already searched for the first time. Do. Since the combination of candidate keywords used in the first search is redundant, it is useless, so the combination of candidate keywords that have already been searched is excluded. This can be easily realized by storing a combination of searched candidate keywords.

【0022】この様子は、表示部27に表示され、図4
に示すようになる。上段の図は、利用者が検索用キーワ
ードを2回発声し、検索ボタンを押す前の状態を示して
いる。各々の発声に対する候補キーワードが第5位まで
表示されている。中段の図は、検索ボタンを一度押した
直後の状態を示している。ここでは第3位までの候補キ
ーワードの組み合わせ9個を使って検索された例文が3
つ表示されている。検索に用いられた候補キーワードが
鍵括弧で示され、入力操作部24の指示により異なる組
み合わせに対応する他の例文を表示させることもでき
る。各例文の最後に括弧内に表示されているのは、各例
文がどういう候補キーワードの組み合わせによって引き
出されたかを示す情報であり、例文選択に便利である。
下段の図は、さらにもう一度検索ボタンを押した直後の
状態を示している。ここでは第5位までの候補キーワー
ドの組み合わせ25個から、先ほど検索に用いた9個の
候補キーワードの組み合わせを除いた17個の候補キー
ワードの組み合わせを使用して検索された例文3つが下
欄に表示されている。
This state is displayed on the display unit 27 and is shown in FIG.
As shown in. The upper diagram shows the state before the user utters the search keyword twice and presses the search button. The candidate keywords for each utterance are displayed up to the fifth place. The middle figure shows the state immediately after pressing the search button once. Here, there are 3 example sentences retrieved using 9 combinations of candidate keywords up to the 3rd place.
Is displayed. The candidate keywords used for the search are shown in brackets, and another example sentence corresponding to a different combination can be displayed according to an instruction from the input operation unit 24. What is displayed in parentheses at the end of each example sentence is information indicating by which combination of candidate keywords each example sentence is extracted, which is convenient for example sentence selection.
The lower diagram shows the state immediately after pressing the search button again. Here, three example sentences searched using 17 candidate keyword combinations excluding the 9 candidate keyword combinations used in the search from the 25 candidate keyword combinations up to the fifth place are shown in the lower column. It is displayed.

【0023】この実施の形態では検索一段階目は第3位
までの候補キーワード、検索二段階目は第5位までの候
補キーワードを用いたが、もちろんこれは一例であっ
て、各段階で何位までの候補キーワードを用いるか、何
段階まで行なうかに制限されない。
In this embodiment, the candidate keywords up to the third rank are used in the first step of the search, and the candidate keywords up to the fifth rank are used in the second step of the search. Of course, this is just an example, and There is no limitation on how many candidate keywords are used or how many steps are performed.

【0024】ところで、検索に用いる候補キーワードを
上記の例のように検索一段階目には第3位まで、検索二
段階目には第5位までというように個数を固定すること
もできるが、認識スコアがあるしきい値以上になった候
補キーワードを全て用いるという方法も考えられる。発
声した検索用キーワードの類似語が認識語彙として多く
含まれている場合、上位の認識スコアの差が小さくな
り、わずかなスコアの差で認識順位が大きくダウンする
可能性がある。従って、検索に用いる候補キーワードを
第5位までと固定的に決めておくと、このような場合に
は利用者が発声した検索用キーワードが正解の候補キー
ワードからもれてしまう危険性が高い。一方、類似語の
少ない検索用キーワードを発声した場合、正解の候補キ
ーワードの認識スコアだけが高く、他の候補キーワード
のスコアはそれよりずっと小さくなることが多い。この
ような場合には、しきい値以下のスコアになった認識候
補はたとえ順位が上位であっても検索には用いない方が
時間の節約になる。ただし、この方法では、検索に用い
られる候補キーワードの数は発声毎に変動するので、候
補キーワード数のばらつきが大きくなるため、上限や下
限の数を決めておく方が良い。このしきい値の設定は、
例えば第1位の認識スコアの何%まで、あるいは第1位
の認識スコアとの差がある値以内である等の方法があ
る。なお、この認識スコアによる認識候補を用いる方法
と上述した固定順位までの認識候補を用いる方法とを併
用してもよい。
By the way, the number of candidate keywords used for the search can be fixed up to the third rank in the first search step and up to the fifth rank in the second search step, as in the above example. A method of using all candidate keywords whose recognition scores are above a certain threshold is also conceivable. When many similar words of the uttered search keyword are included in the recognition vocabulary, the difference in the upper recognition scores becomes small, and the recognition rank may be greatly lowered by the slight difference in the scores. Therefore, if the candidate keywords used for the search are fixedly set to the fifth rank, in such a case, there is a high risk that the search keyword uttered by the user will be missed from the correct candidate keywords. On the other hand, when a search keyword having few similar words is uttered, only the recognition score of the correct candidate keyword is high, and the scores of other candidate keywords are much smaller than that. In such a case, it is more time-saving not to use the recognition candidates whose scores are less than or equal to the threshold value even if the recognition candidates have higher ranks. However, in this method, the number of candidate keywords used for the search varies with each utterance, and the variation in the number of candidate keywords becomes large. Therefore, it is better to determine the upper limit and the lower limit. This threshold setting is
For example, there is a method such as up to what percentage of the first-ranked recognition score, or a difference from the first-ranked recognition score is within a certain value. The method of using the recognition candidates based on the recognition score and the method of using the recognition candidates up to the fixed rank described above may be used together.

【0025】図5に、第1位との認識スコアの差がある
値以内である場合の例を示す。この例では検索一段階目
の候補キーワードの組み合わせは、3×2=6個、検索
二段階目の候補キーワードの組み合わせは、5×3−6
=9個になる。
FIG. 5 shows an example in which the difference in recognition score from the first place is within a certain value. In this example, the combination of candidate keywords in the first search stage is 3 × 2 = 6, and the combination of candidate keywords in the second search stage is 5 × 3-6.
= 9

【0026】上記実施の形態では、例文を取り上げた
が、データベースにキーワードに対応させて画像、映
画、人物、辞書、記事など様々な情報をいれておき、こ
れらの情報を音声認識により検索する検索装置に適用す
ることも可能である。
In the above embodiment, the example sentences are taken up, but various information such as images, movies, people, dictionaries, articles, etc. are stored in the database in correspondence with the keywords, and the information is searched by voice recognition. It can also be applied to a device.

【0027】[0027]

【発明の効果】本発明によれば、利用者が音声認識結果
の候補キーワードから正解を選ばなくても効率的に情報
検索を行って所望の情報を得ることができ、また、利用
者の手間を軽減すると共に検索処理にかかる時間をあま
り増やさなくできる。
According to the present invention, even if the user does not select the correct answer from the candidate keywords of the voice recognition result, the information can be efficiently searched and desired information can be obtained, and the labor of the user is reduced. And the time required for the search process can be reduced.

【図面の簡単な説明】[Brief description of drawings]

【図1】 音声の累積認識率を示した図である。FIG. 1 is a diagram showing a cumulative recognition rate of voice.

【図2】 本発明に係る音声認識による検索装置を示し
た図である。
FIG. 2 is a diagram showing a search device by voice recognition according to the present invention.

【図3】 本発明に係る例文検索の動作のフローチャー
トである。
FIG. 3 is a flowchart of an example sentence search operation according to the present invention.

【図4】 本発明に係る検索表示例を示す図である。FIG. 4 is a diagram showing a search display example according to the present invention.

【図5】 検索に用いる候補キーワードを認識スコアに
より決定する様子を説明するための図である。
FIG. 5 is a diagram for explaining how a candidate keyword used for a search is determined by a recognition score.

【符号の説明】[Explanation of symbols]

21 マイクロホン 22 音声認識部 23 制御部 24 入力操作部 25 検索部 26 例文データベース 27 表示部 28 エディタ 21 microphone 22 Speech recognition unit 23 Control unit 24 Input operation section 25 Search Department 26 example sentence database 27 Display 28 Editor

フロントページの続き (56)参考文献 特開 平1−255925(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 G06F 3/16 Continuation of front page (56) Reference JP-A-1-255925 (JP, A) (58) Fields investigated (Int.Cl. 7 , DB name) G06F 17/30 G06F 3/16

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 第1の検索用キーワードと第2の検索用
キーワードを含む音声を入力する音声入力手段と、 入力された検索用キーワードごとに音声認識結果として
候補キーワードを順位付けて複数生成する音声認識手段
と、 検索実行を指示する指示手段と、 ーワードの組み合わせに対応する情報を記憶する記憶
手段と、 候補キーワードの組み合わせに対応する情報を表示する
表示手段と、 上記指示手段の指示に従って、第1の検索用キーワード
により得られた所定数の第1の候補キーワードと第2の
検索用キーワードにより得られた所定数の第2の候補キ
ーワードとの第1の組み合せを作成し、第1の組み合わ
せに対応する情報を上記記憶手段から検索して上記表示
手段に表示し、第1の候補キーワードを含む第3の候補
キーワードと第2の候補キーワードを含む第4の候補キ
ーワードとの第2の組み合せを第1の組み合わせを除い
て作成し、第2の組み合わせに対応する情報を上記記憶
手段から検索して上記表示手段に表示する検索手段と、 を備えたことを特徴とする音声認識による検索装置。
1. A first search keyword and a second search keyword
Voice input means for inputting voice including a keyword, As a voice recognition result for each entered search keyword
Speech recognition means for ranking and generating a plurality of candidate keywords
When, Instructing means for instructing search executionWhen, Ki Memory to store information corresponding to word combinations
Means and Display information corresponding to a combination of candidate keywords
Display means, According to the instruction of the instruction means, the first search keyword
A predetermined number of first candidate keywords and second
A predetermined number of second candidate keys obtained by the search keyword
Create the first combination with the word
The information corresponding to the case is retrieved from the storage means and displayed.
A third candidate displayed on the means and including the first candidate keyword
A fourth candidate key that includes the keyword and the second candidate keyword.
The second combination with the word except the first combination
Created and stored the information corresponding to the second combination above
Search means for searching from the means and displaying on the display means, A search device using voice recognition, comprising:
【請求項2】 第1及び第3の候補キーワードまたは第
2及び第4の候補キーワードに、上記音声認識手段によ
り得られた認識スコアが所定のしきい値以上の候補キー
ワードを用いることを特徴とする請求項1に記載の音声
認識による検索装置。
2. The first and third candidate keywords or the second and fourth candidate keywords are candidate keywords whose recognition score obtained by the voice recognition means is equal to or higher than a predetermined threshold value. The search device by voice recognition according to claim 1.
JP16563896A 1996-06-26 1996-06-26 Search device by voice recognition Expired - Fee Related JP3377684B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16563896A JP3377684B2 (en) 1996-06-26 1996-06-26 Search device by voice recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16563896A JP3377684B2 (en) 1996-06-26 1996-06-26 Search device by voice recognition

Publications (2)

Publication Number Publication Date
JPH1011461A JPH1011461A (en) 1998-01-16
JP3377684B2 true JP3377684B2 (en) 2003-02-17

Family

ID=15816171

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16563896A Expired - Fee Related JP3377684B2 (en) 1996-06-26 1996-06-26 Search device by voice recognition

Country Status (1)

Country Link
JP (1) JP3377684B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3646783B2 (en) * 2000-03-03 2005-05-11 日本電信電話株式会社 Request confirmation type information provision device
JP2001306461A (en) * 2000-04-17 2001-11-02 Kenichi Omae Transmitter, transmitting method, receiver, and receiving method for voice document, manufacturing method for the transmitter and the receiver, and repeater, repeating method and recording medium, for voice document
JP2006039954A (en) * 2004-07-27 2006-02-09 Denso Corp Database retrieval system, program, and navigation system

Also Published As

Publication number Publication date
JPH1011461A (en) 1998-01-16

Similar Documents

Publication Publication Date Title
JP3414735B2 (en) Speech recognizer for languages with compound words
US6363347B1 (en) Method and system for displaying a variable number of alternative words during speech recognition
US4829576A (en) Voice recognition system
JP3426176B2 (en) Speech recognition device, method, computer system and storage medium
JP2011254553A (en) Japanese language input mechanism for small keypad
JP2002091492A (en) Device and method for supplementing voice and recording medium
US20020091520A1 (en) Method and apparatus for text input utilizing speech recognition
WO2003085550A1 (en) Conversation control system and conversation control method
JP2005174325A (en) System and method for semantic stenography
JP3377684B2 (en) Search device by voice recognition
JP2010055307A (en) Conference support system and conference support method
JP2002221989A (en) Method and apparatus for text input
JP3499658B2 (en) Dialogue support device
JP4153843B2 (en) Natural sentence search device, natural sentence search method, natural sentence search program, and natural sentence search program storage medium
JP3059504B2 (en) Part of speech selection system
JP3846896B2 (en) Search device, search method and database for compound nouns input by speech
JP2003108566A (en) Information retrieving method and information retrieving device using agent
JP2002366543A (en) Document generation system
JP3758241B2 (en) Voice information retrieval device
JPH06175698A (en) Voice retrieving device
JP3663012B2 (en) Voice input device
JP2003085197A (en) Retrieving device for compound noun inputted by voice, retrieving method and database
JP3498635B2 (en) Information retrieval method and apparatus, and computer-readable recording medium
JP4056546B2 (en) Search device, search method and database for compound nouns input by speech
JPH04290158A (en) Document creation device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071206

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081206

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091206

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees