JP2001282285A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2001282285A5 JP2001282285A5 JP2000097336A JP2000097336A JP2001282285A5 JP 2001282285 A5 JP2001282285 A5 JP 2001282285A5 JP 2000097336 A JP2000097336 A JP 2000097336A JP 2000097336 A JP2000097336 A JP 2000097336A JP 2001282285 A5 JP2001282285 A5 JP 2001282285A5
- Authority
- JP
- Japan
- Prior art keywords
- user
- recognition
- program
- preference information
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Description
【0003】
図5に従来の音声認識装置の構成図を示し、以下に説明する。
音声認識を開始する前に、音声認識の対象となる複数の単語を予め定義された複数のジャンルに分けて単語セット50として記憶し、辞書生成部51により複数の単語セット50の音声特徴を抽出して辞書ファイル52に記憶させ、音声入力の前に辞書ロード部53は辞書ロード指示部54の指示された辞書ファイル52を辞書メモリ55にロードする。0003
FIG. 5 shows a configuration diagram of a conventional voice recognition device, which will be described below.
Before starting voice recognition, a plurality of words to be voice recognition are divided into a plurality of predefined genres and stored as a word set 50, and the dictionary generation unit 51 extracts the voice features of the plurality of word sets 50. Then, it is stored in the dictionary file 52, and the dictionary loading unit 53 loads the instructed dictionary file 52 of the dictionary loading instruction unit 54 into the dictionary memory 55 before voice input.
【0005】
【発明が解決しようとする課題】
しかしながら、これらの従来技術を用いても認識対象語彙は、予め定めたジャンルに従って作成されるためにユーザーの意図としたものとは限らず、さらに定められたジャンルが変わるたびに辞書ファイルのロードを繰り返すことが必要となり、ユーザーの意図に合った音声認識結果を得るためにはユーザー操作が増えるなどの課題があった。0005
[Problems to be Solved by the Invention]
However, even if these conventional techniques are used, the vocabulary to be recognized is not always intended by the user because it is created according to a predetermined genre, and the dictionary file is loaded every time the predetermined genre changes. It is necessary to repeat the above, and there are problems such as an increase in user operations in order to obtain a voice recognition result that matches the user's intention.
【0006】
本発明は、ユーザーの嗜好に合わせて認識対象語彙を少ないユーザー操作で絞り込むことにより、音声認識性能の向上を図ることを目的とする。0006
An object of the present invention is to improve the speech recognition performance by narrowing down the recognition target vocabulary according to the user's preference with a small number of user operations.
【0010】
【発明の実施の形態】
本発明の請求項1に記載の発明は、音声認識の対象とすべき全単語を格納した認識対象候補語彙から予め取得したユーザーの嗜好情報に基づいた認識対象語彙を予め作成し、入力される音声と認識対象語彙とから単語を認識することを特徴とするもので、ユーザーの嗜好に合わせて認識対象語彙を絞り込むことにより音声認識性能を向上させるという作用を有する。また、認識対象候補となりうる全語彙を対象に音声認識を行うよりも処理が簡便で早くなる方法である。
請求項2に記載の発明は、入力された音声と音声認識の対象の単語である認識対象語彙とから前記単語を認識する音声認識によって得られる認識得点と、予め取得したユーザーの嗜好情報に基づいた前記認識対象語彙の嗜好得点とを使用して、認識結果を決定することを特徴とする音声認識方法とするものであり、認識得点に嗜好得点も加味することにより、ユーザーがより発声しそうな内容に重みをつけて結果を出力して、ユーザーの全く意図しない結果を出現させるケースを大幅に低減すると同時に、意図する結果を高い確率で出現させるという作用を有する。0010
BEST MODE FOR CARRYING OUT THE INVENTION [Embodiments of the Invention]
In the invention according to claim 1 of the present invention, a recognition target vocabulary based on user preference information acquired in advance from a recognition target candidate vocabulary storing all words to be voice recognition is created and input in advance. It is characterized by recognizing a word from a voice and a recognition target vocabulary, and has an effect of improving the voice recognition performance by narrowing down the recognition target vocabulary according to the user's preference. In addition, it is a method that is simpler and faster than performing speech recognition for all vocabularies that can be recognition target candidates.
The invention according to claim 2 is based on a recognition score obtained by voice recognition for recognizing the word from a input voice and a recognition target vocabulary which is a word to be voice-recognized, and a user's preference information acquired in advance. The voice recognition method is characterized in that the recognition result is determined by using the preference score of the recognition target vocabulary, and by adding the preference score to the recognition score, the user is more likely to speak. It has the effect of weighting the content and outputting the result, greatly reducing the cases where the user's completely unintended result appears, and at the same time, causing the intended result to appear with a high probability.
【0011】
請求項3に記載の発明は、請求項1又は2記載の音声認識方法において、ユーザーの嗜好情報は、ユーザーが入力するユーザー識別記号、ユーザーの発声、ユーザーの画像又は前記ユーザーの嗜好情報を選択する時間から選択された少なくとも一つの情報である音声認識方法とするもので、本発明の嗜好情報の学習に関わるものであり、好きまたは嫌いの単純択一を使用することにより、ユーザーに負担をかけずに嗜好を学習することができるという作用を有する。さらに、好きまたは嫌いを利用した学習を用いることにより、音声操作の即動性、取り扱いの簡便性を損なうことなく嗜好情報を学習することができる。[0011]
The invention according to claim 3 is the voice recognition method according to claim 1 or 2 , wherein the user's preference information selects a user identification symbol, a user's voice, a user's image, or the user's preference information input by the user. It is a voice recognition method that is at least one piece of information selected from the time to be performed, and is related to learning the preference information of the present invention. It has the effect of being able to learn tastes without spending time. Furthermore, by using learning using likes or dislikes, it is possible to learn preference information without impairing the promptness of voice operation and the ease of handling.
【0012】
請求項4に記載の発明は、請求項1ないし3のいずれか記載の音声認識方法を用いて、番組指定をする番組指定方法としたものであり、デジタルテレビ放送や、オン・デ・マンド映画/カラオケ配信サービスを利用に適用したもので、ユーザーの嗜好にあった番組選択ができるという作用を有する。
請求項5に記載の発明は、ユーザーの嗜好情報は、番組の視聴側による中断時、番組の配信側による中断時又は番組終了時に、学習される情報である請求項4記載の番組指定方法としたものであり、番組内容を視聴した後にユーザーの嗜好情報が学習されることにより、よりユーザーの嗜好にあった番組選択ができるという作用を有する。
請求項6に記載の発明は、ユーザーの嗜好情報は、番組の視聴履歴を用いて学習した情報である請求項4又は5記載の番組指定方法としたものであり、番組の視聴履歴を用いてユーザーの嗜好情報を学習するため、ユーザーの手間を省略し、容易にユーザーの嗜好に
あった学習ができるという作用を有する。
請求項7に記載の発明は、番組の視聴履歴は、電子番組ガイドで提供される時間帯、ジャンル、出演者、出演グループ名、番組名、番組内容、テーマ、音楽、内容キーワード、ユーザー名の少なくとも1つを構成要素として持つ情報である請求項6記載の番組指定方法としたものであり、ユーザーの嗜好情報の内容を指定することにより、よりユーザーの嗜好にあった番組選択ができるという作用を有する。
請求項8に記載の発明は、ユーザーの発声する音声を入力する音声入力部と、ユーザーの嗜好情報に基づいて音声認識の対象とすべき全単語を格納した認識対象候補語彙から認識対象語彙を作成する認識対象語彙作成部と、前記音声入力部から入力される音声と前記認識対象語彙とから単語を認識する認識部とを含む音声認識装置としたものであり、ユーザーの嗜好に合わせて認識対象語彙を絞り込むことにより音声認識性能を向上させるという作用を有する。 [0012]
The invention according to claim 4 is a program designation method for designating a program by using the voice recognition method according to any one of claims 1 to 3, and is used for digital television broadcasting and on-de-mand movies. / It is applied to the use of the karaoke distribution service, and has the effect of being able to select a program that suits the user's taste.
The invention according to claim 5 is the program designation method according to claim 4, wherein the user's preference information is information to be learned when the program is interrupted by the viewing side, when the program is interrupted by the distribution side, or when the program ends. By learning the user's preference information after viewing the program content, it has the effect of being able to select a program that better suits the user's preference.
The invention according to claim 6 is the program designation method according to claim 4 or 5, wherein the user's preference information is information learned by using the viewing history of the program, and the viewing history of the program is used. Since the user's preference information is learned, the user's trouble is saved and the user's preference can be easily adjusted.
It has the effect of being able to learn properly.
According to the invention of claim 7, the viewing history of the program is the time zone, genre, performer, appearance group name, program name, program content, theme, music, content keyword, and user name provided by the electronic program guide. The program designation method according to claim 6, which is information having at least one as a component, is used, and by designating the content of the user's preference information, the program can be selected more according to the user's preference. Has.
The invention according to claim 8 is to obtain a recognition target vocabulary from a voice input unit for inputting a voice uttered by a user and a recognition target candidate vocabulary storing all words to be voice recognition based on the user's preference information. It is a voice recognition device including a recognition target vocabulary creation unit to be created, a recognition unit that recognizes a word from the voice input from the voice input unit and the recognition target vocabulary, and recognizes according to the user's preference. It has the effect of improving speech recognition performance by narrowing down the target vocabulary.
【0013】
請求項9記載の発明は、ユーザーの発声する音声を入力する音声入力部と、ユーザーの嗜好情報に基づいて音声認識の対象とすべき全単語を格納した認識対象候補語彙から認識対象語彙を作成する認識対象語彙作成部と、前記ユーザーの嗜好情報に基づいた前記認識対象語彙の嗜好得点を算出する嗜好得点計算部と、前記音声入力部から入力される音声と前記認識対象語彙とから単語の認識得点を計算する認識部と、前記嗜好得点と前記認識得点とを使用して、認識結果を決定し出力する認識結果決定部とを含む音声認識装置としたものであり、ユーザーの嗜好に合わせて認識対象語彙を絞り込むことにより音声認識性能を向上させるという作用を有する。0013
The invention according to claim 9 creates a recognition target vocabulary from a voice input unit for inputting a voice uttered by the user and a recognition target candidate vocabulary storing all words to be voice recognition based on the user's preference information. A recognition target vocabulary creation unit, a preference score calculation unit that calculates a preference score of the recognition target vocabulary based on the user's preference information, a voice input from the voice input unit, and a word from the recognition target vocabulary. It is a voice recognition device including a recognition unit for calculating a recognition score and a recognition result determination unit for determining and outputting a recognition result using the preference score and the recognition score, according to the user's preference. It has the effect of improving speech recognition performance by narrowing down the vocabulary to be recognized.
【0014】
請求項10記載の発明は、一つまたは複数のユーザーの嗜好情報を保持する嗜好情報記憶部を、更に、含み、前記ユーザーの嗜好情報は、ユーザーが入力するユーザー識別記号、ユーザーの発声、ユーザーの画像又は前記ユーザーの嗜好情報を選択する時間の少なくとも1つによって選択される情報である請求項8又は9記載の音声認識装置とするものであり、1つまたは複数の嗜好情報から認識対象語彙選択に使用する嗜好情報を選択することにより、ユーザーの嗜好に合わせて認識対象語彙を絞り込むことにより音声認識性能を向上させるという作用を有する。0014.
The invention according to claim 10 further includes a preference information storage unit that holds preference information of one or more users, and the user preference information includes a user identification symbol input by the user, a user's voice, and a user. The voice recognition device according to claim 8 or 9, which is information selected by at least one of the time to select the image or the user's preference information, and is a recognition target vocabulary from one or more preference information. By selecting the preference information used for selection, it has the effect of improving the speech recognition performance by narrowing down the recognition target vocabulary according to the user's preference.
【0019】
請求項11に記載の発明は、請求項8ないし10のいずれか記載の音声認識装置を用いて、番組指定をすることを特徴とする番組指定装置としたものであり、デジタルテレビ放送や、オン・デ・マンド映画/カラオケ配信サービスを利用する時の番組指定装置に適用したもので、ユーザーの嗜好にあった番組選択ができるという作用を有する。[0019]
The invention according to claim 11 is a program designation device characterized in that a program is designated by using the voice recognition device according to any one of claims 8 to 10, and is used for digital television broadcasting and on. -It is applied to the program designation device when using the de Mand movie / karaoke distribution service, and has the effect of being able to select a program that suits the user 's taste.
【0020】
請求項12に記載の発明は、番組の視聴側による中断時、番組の配信側による中断時又は番組終了時に、ユーザーの嗜好情報の入力を促す嗜好情報作成部を更に含む請求項11記載の番組指定装置としたものであり、番組指定装置がユーザーから嗜好情報を学習する場合に、番組の切れ目などを狙って、積極的に嗜好を尋ねることにより、よりユーザーの嗜好にあった番組選択ができるという作用を有する。
請求項13に記載の発明は、ユーザーの嗜好情報は、番組の視聴履歴を用いて学習した情報である請求項11又は12記載の番組指定装置とするもので、番組の視聴履歴を用いて嗜好情報の学習するため、ユーザーの手間を省略し、容易にユーザーの嗜好にあった学習ができるという作用を有する。0020
The program according to claim 12 , further comprising a preference information creating unit that prompts the user to input preference information at the time of interruption by the viewing side of the program, interruption by the distribution side of the program, or the end of the program. It is a designated device, and when the program designation device learns preference information from the user, it is possible to select a program that better suits the user's preference by actively asking for the preference, aiming at the break of the program. It has the effect of.
The invention according to claim 13 is the program designation device according to claim 11 or 12, wherein the user's preference information is information learned by using the viewing history of the program, and the preference is obtained by using the viewing history of the program. Since information is learned, it saves the user 's time and effort and has the effect of easily learning according to the user's taste.
【0021】
請求項14に記載の発明は、番組の視聴履歴は、電子番組ガイドで提供される時間帯、ジャンル、出演者、出演グループ名、番組名、番組内容、テーマ、音楽、内容キーワード、ユーザー名の少なくとも1つを構成要素として持つ情報である請求項13記載の番組指定装置とするものであり、嗜好情報の内容を指定することにより、よりユーザーの嗜好にあった番組選択ができるという作用を有する。0021.
According to the invention of claim 14 , the viewing history of the program is the time zone, genre, performer , appearance group name, program name, program content, theme, music, content keyword, user name provided by the electronic program guide. The program designation device according to claim 13, which is information having at least one of the above as a component, and by designating the content of the preference information, it is possible to select a program more suitable for the user 's preference. It has the effect of.
【0022】
請求項15に記載の発明は、音声認識の対象とすべき全単語を格納した認識対象候補語彙から予め取得したユーザーの嗜好情報に基づいた認識対象語彙を予め作成し、入力される音声と認識対象語彙とから単語を認識することを特徴とする音声認識方法をコンピュータに実行させるためのプログラムユーザーの嗜好に合わせて認識対象語彙を絞り込むことにより音声認識性能を向上させるという作用を有する。また、認識対象候補となりうる全語彙を対象に音声認識を行うよりも処理が簡便で早くなる方法である。
請求項16に記載の発明は、入力された音声と音声認識の対象の単語である認識対象語彙とから前記単語を認識する音声認識によって得られる認識得点と、予め取得したユーザーの嗜好情報に基づいた前記認識対象語彙の嗜好得点とを使用して、認識結果を決定することを特徴とする音声認識方法をコンピュータに実行させるためのプログラムとしたものであり、認識得点に嗜好得点も加味することにより、ユーザーがより発声しそうな内容に重みをつけて結果を出力して、ユーザーの全く意図しない結果を出現させるケースを大幅に低減すると同時に、意図する結果を高い確率で出現させるという作用を有する。 [0022]
The invention according to claim 15 creates a recognition target vocabulary based on user preference information acquired in advance from a recognition target candidate vocabulary storing all words to be voice recognition, and recognizes the input voice. A program for causing a computer to execute a voice recognition method characterized by recognizing a word from a target vocabulary. It has an effect of improving voice recognition performance by narrowing down the recognition target vocabulary according to the user's preference. In addition, it is a method that is simpler and faster than performing speech recognition for all vocabularies that can be recognition target candidates.
The invention according to claim 16 is based on a recognition score obtained by voice recognition for recognizing the word from a input voice and a recognition target vocabulary which is a word to be voice-recognized, and a user's preference information acquired in advance. It is a program for causing a computer to execute a voice recognition method characterized by determining a recognition result by using the preference score of the recognition target vocabulary, and the preference score is also added to the recognition score. As a result, the content that is more likely to be spoken by the user is weighted and the result is output, which greatly reduces the cases where the user's completely unintended result appears, and at the same time, has the effect of causing the intended result to appear with a high probability. ..
【符号の説明】
1 音声入力部
2 嗜好情報作成部
3 嗜好情報記憶部
4 認識対象候補語彙記憶部
5 認識対象語彙作成部
6 認識部
7 認識結果決定部
8 セットトップボックス
9 デジタルテレビ放送
10 オン・デ・マンド映画/カラオケ配信サービス
11 ビデオ
12 ディスプレイモニタ
13 音響テンプレート記憶部
14 音響テンプレート選択部
15 嗜好選択情報入力部
16 番号決定部
17 嗜好得点計算部[Explanation of code]
1 Voice input unit 2 Preference information creation unit 3 Preference information storage unit 4 Recognition target candidate vocabulary storage unit 5 Recognition target vocabulary creation unit 6 Recognition unit 7 Recognition result determination unit 8 Set top box 9 Digital TV broadcast 10 On-de-mand movie / Karaoke distribution service 11 Video 12 Display monitor 13 Sound template storage unit 14 Sound template selection unit 15 Preference selection information input unit 16 Number determination unit 17 Preference score calculation unit
Claims (16)
ーの発声、ユーザーの画像又は前記ユーザーの嗜好情報を選択する時間の少なくとも1つによって選択される情報である請求項8又は9記載の音声認識装置。 The information processing apparatus further includes a preference information storage unit holding preference information of one or more users, wherein the user preference information is a user identification symbol input by the user, the user
The speech recognition apparatus according to claim 8 or 9, wherein the information is selected by at least one of an utterance of-, an image of a user, and a time of selecting preference information of the user .
請求項11記載の番組指定装置。Time of the interruption by the program viewing聴側, when interruption or when the program ends by the distribution side of the program, further comprising <br/> claim 11 program designation device according to the preference information creating unit that prompts the input of the user preference information.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000097336A JP3525855B2 (en) | 2000-03-31 | 2000-03-31 | Voice recognition method and voice recognition device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000097336A JP3525855B2 (en) | 2000-03-31 | 2000-03-31 | Voice recognition method and voice recognition device |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003337213A Division JP2004120767A (en) | 2003-09-29 | 2003-09-29 | Program designation method and program designation apparatus |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2001282285A JP2001282285A (en) | 2001-10-12 |
JP3525855B2 JP3525855B2 (en) | 2004-05-10 |
JP2001282285A5 true JP2001282285A5 (en) | 2004-08-19 |
Family
ID=18611970
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000097336A Expired - Lifetime JP3525855B2 (en) | 2000-03-31 | 2000-03-31 | Voice recognition method and voice recognition device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3525855B2 (en) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004194108A (en) | 2002-12-12 | 2004-07-08 | Sony Corp | Information processor and information processing method, recording medium, and program |
JP4986301B2 (en) * | 2008-09-30 | 2012-07-25 | Kddi株式会社 | Content search apparatus, program, and method using voice recognition processing function |
US20110320464A1 (en) * | 2009-04-06 | 2011-12-29 | Mitsubishi Electric Corporation | Retrieval device |
JP5694102B2 (en) | 2011-09-22 | 2015-04-01 | 株式会社東芝 | Speech recognition apparatus, speech recognition method and program |
BR112015004288B1 (en) | 2012-08-31 | 2021-05-04 | Dolby Laboratories Licensing Corporation | system for rendering sound using reflected sound elements |
CN113614713A (en) * | 2021-06-29 | 2021-11-05 | 华为技术有限公司 | Human-computer interaction method, device, equipment and vehicle |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62262898A (en) * | 1986-05-09 | 1987-11-14 | 株式会社リコー | Voice recognition equipment |
JP2833995B2 (en) * | 1994-05-23 | 1998-12-09 | 日本電気ロボットエンジニアリング株式会社 | Large vocabulary speech recognition device |
JP3244005B2 (en) * | 1995-09-04 | 2002-01-07 | 松下電器産業株式会社 | Information filtering apparatus and information filtering method |
JPH09292896A (en) * | 1996-04-24 | 1997-11-11 | Denso Corp | Vehicle navigation device |
JPH11305790A (en) * | 1998-04-23 | 1999-11-05 | Denso Corp | Voice recognition device |
JP2002523828A (en) * | 1998-08-24 | 2002-07-30 | ビーシーエル コンピューターズ, インコーポレイテッド | Adaptive natural language interface |
JP4538954B2 (en) * | 1999-02-19 | 2010-09-08 | ソニー株式会社 | Speech translation apparatus, speech translation method, and recording medium recording speech translation control program |
US6901366B1 (en) * | 1999-08-26 | 2005-05-31 | Matsushita Electric Industrial Co., Ltd. | System and method for assessing TV-related information over the internet |
EP1079615A3 (en) * | 1999-08-26 | 2002-09-25 | Matsushita Electric Industrial Co., Ltd. | System for identifying and adapting a TV-user profile by means of speech technology |
-
2000
- 2000-03-31 JP JP2000097336A patent/JP3525855B2/en not_active Expired - Lifetime
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107577385B (en) | Intelligent automated assistant in a media environment | |
US4829576A (en) | Voice recognition system | |
US10056078B1 (en) | Output of content based on speech-based searching and browsing requests | |
US6415257B1 (en) | System for identifying and adapting a TV-user profile by means of speech technology | |
US7949532B2 (en) | Conversation controller | |
US20070094003A1 (en) | Conversation controller | |
JP4987682B2 (en) | Voice chat system, information processing apparatus, voice recognition method and program | |
US20090234854A1 (en) | Search system and search method for speech database | |
JP5149107B2 (en) | Sound processing apparatus and program | |
JPH10133684A (en) | Method and system for selecting alternative word during speech recognition | |
JPWO2011068170A1 (en) | SEARCH DEVICE, SEARCH METHOD, AND PROGRAM | |
JP2010154397A (en) | Data processor, data processing method, and program | |
US6591236B2 (en) | Method and system for determining available and alternative speech commands | |
US20080262843A1 (en) | Speech recognition apparatus and method | |
JP3639776B2 (en) | Speech recognition dictionary creation device, speech recognition dictionary creation method, speech recognition device, portable terminal device, and program recording medium | |
US11837221B2 (en) | Age-sensitive automatic speech recognition | |
US20030191629A1 (en) | Interface apparatus and task control method for assisting in the operation of a device using recognition technology | |
WO2003085550A1 (en) | Conversation control system and conversation control method | |
US11967248B2 (en) | Conversation-based foreign language learning method using reciprocal speech transmission through speech recognition function and TTS function of terminal | |
JPWO2019155717A1 (en) | Information processing equipment, information processing systems, information processing methods, and programs | |
EP4352725A1 (en) | Error correction in speech recognition | |
JP2001282285A5 (en) | ||
JP6772916B2 (en) | Dialogue device and dialogue method | |
JP2006343941A (en) | Content retrieval/reproduction method, device, program, and recording medium | |
JP7131077B2 (en) | CONVERSATION DEVICE, ROBOT, CONVERSATION DEVICE CONTROL METHOD AND PROGRAM |