JP2006106451A - Speech input method of television broadcast receiver - Google Patents
Speech input method of television broadcast receiver Download PDFInfo
- Publication number
- JP2006106451A JP2006106451A JP2004294429A JP2004294429A JP2006106451A JP 2006106451 A JP2006106451 A JP 2006106451A JP 2004294429 A JP2004294429 A JP 2004294429A JP 2004294429 A JP2004294429 A JP 2004294429A JP 2006106451 A JP2006106451 A JP 2006106451A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- input
- dictionary
- user
- keywords
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は,テレビ放送受信機における音声入力方法に関するものである。 The present invention relates to an audio input method in a television broadcast receiver.
テレビ放送のデジタル化に伴い,EPG(電子番組表)配信サービスが普及し,EPGを用いた番組検索や録画予約機能を備えたテレビ放送受信機が一般的になりつつある。 With the digitalization of television broadcasts, EPG (electronic program guide) distribution services have become widespread, and television broadcast receivers equipped with EPG-based program search and recording reservation functions are becoming common.
EPGを用いた番組検索や録画予約は,ユーザが入力したジャンル,出演者,キーワード等を基に行われる。ユーザが検索や録画に必要な情報を入力する際,サブジャンルを含むジャンル名や出演者名については,予め機器側が用意した単語群から選択することで入力が可能であるが,ジャンルや出演者以外のキーワードを入力する場合には,リモコンのボタンを用いて一文字ずつ入力して変換する方法が一般的である。しかし,そのような入力方法は操作が複雑であり,不慣れなユーザにとっては非常に使いにくい。 Program search and recording reservation using EPG are performed based on a genre, a performer, a keyword, and the like input by the user. When a user inputs information necessary for searching or recording, a genre name including a sub-genre and a performer name can be input by selecting from a group of words prepared in advance by the device side. When a keyword other than is input, a method of inputting and converting character by character using a button on the remote control is generally used. However, such an input method is complicated in operation and is very difficult to use for an unfamiliar user.
特許文献1はEPGからキーワードを抽出し音声認識用辞書を生成し,ユーザが音声によりキーワードを入力する方法を提案している。
しかし,登録される語彙数が大量であるため,十分な音声認識率が確保できず,番組検索や録画予約時のキーワード入力が容易かつ確実に行えないという課題があった。 However, since there are a large number of registered vocabularies, there is a problem that a sufficient speech recognition rate cannot be secured, and keywords cannot be easily and reliably input when searching for programs or recording recordings.
本発明は,番組検索や録画予約時のキーワード入力を容易に行えるようにするため,EPGからキーワードを抽出し,音声認識情報を含む辞書をキーワードの属するジャンルごと,五十音順などで適当な数ずつ含む部分辞書の集合として生成し,部分辞書ごとにその部分辞書に含まれるキーワードを画面表示してユーザに提示し,ユーザは提示された中からキーワードを選択して音声入力ができるようにすることを最も主要な特徴とする。 In the present invention, keywords are extracted from the EPG so that keywords can be easily input when searching for programs or recording reservations. Generated as a set of partial dictionaries that contain a number, and displays the keywords contained in the partial dictionaries on the screen for each partial dictionary and presents them to the user so that the user can select a keyword from the presented words and input speech Doing is the main feature.
本発明のキーワード入力手段は,提示された中からキーワードを選択できるため,キーワードを音声入力するときの入力発話が確実であり,なおかつ提示するキーワードの基となっている,対象語彙数の少ない部分辞書を用いて入力判定を行うため,ユーザの音声入力に対して高い認識率が確保される。従って,ユーザが面倒な操作を行うことなく,容易かつ確実にキーワードの入力ができるという利点がある。 Since the keyword input means of the present invention can select a keyword from the presented words, the input utterance when inputting the keyword by voice is reliable, and the part of the target vocabulary with a small number of target words is the basis of the presented keyword Since input determination is performed using a dictionary, a high recognition rate is ensured for a user's voice input. Therefore, there is an advantage that keywords can be input easily and reliably without troublesome operations by the user.
以下,実施するための最良の形態について実施例を以って説明する。 Hereinafter, the best mode for carrying out the invention will be described by way of examples.
以下,本発明の実施例を図1〜図7を参照して説明する。 Embodiments of the present invention will be described below with reference to FIGS.
図1は本実施例の構成を説明する図である。全体構成は音声認識用辞書生成部101とキーワード音声入力部107から成る。全体構成は音声認識用辞書生成部101とキーワード音声入力部107とは、別個の計算機に具備されても、同一の計算機に具備されてもよい。
FIG. 1 is a diagram for explaining the configuration of this embodiment. The overall configuration includes a voice recognition
音声認識用辞書生成部101は,番組情報102を入力とし,番組情報格納部103,キーワード抽出部104,辞書登録部105から構成される。番組情報格納部103,キーワード抽出部104,辞書登録部105は、音声認識用辞書生成部101を構成する計算機の処理装置において、予め格納された専用プログラムを実行することにより実現される。番組情報格納部103は入力された番組情報102に含まれる情報を格納する。番組情報102は、例えば、音声認識用辞書生成部101がネットワークを介して接続されるサーバから文字列を含む電子データとして入力される。あるいは、CD−ROMなどの記憶媒体から読み込まれてもよい。キーワード抽出部104は格納された番組情報から形態素解析等の技術を用いてキーワードの抽出を行う。テキスト情報からのキーワード抽出技術に関しては,「Excelで学ぶテキストマイニング入門」(日経BP企画)他,一般的に広く知られている。辞書登録部105は抽出されたキーワードを読み仮名等の音声認識に必要な情報と共に音声認識用辞書106(記憶装置)に登録する。
The speech recognition
一方,キーワード音声入力部107は,音声入力手段を持つ入力部108と,キーワード表示・入力判定部109(計算機の処理装置で実行される)により構成され,ユーザの音声によるキーワードの入力に対し,音声認識辞書生成部101が生成した音声認識辞書106の参照により,ユーザのキーワード入力と合致する音声認識辞書内のキーワードを検出し,検出したキーワードを表すテキストやコードナンバーなどの電子データであるキーワード情報110を番組検索や録画予約を行うための制御部へ出力する。
On the other hand, the keyword
図2は,音声認識用辞書(図1の106)の構造について説明する図である。ジャンル名をインデックスとし,各ジャンルに対し,ある個数(図2においてはN個)ごとの部分辞書にキーワードが登録されている。図2の201,202,203,204は部分辞書の例である。
FIG. 2 is a diagram for explaining the structure of the speech recognition dictionary (106 in FIG. 1). A genre name is used as an index, and keywords are registered in a partial dictionary for each certain genre (N in FIG. 2).
以下,図3〜7を用いて処理手順を説明する。
図3は,音声認識用辞書生成部の処理方式について説明する図である。配信された番組情報(図1の102)に対し,ステップ301において番組名,ジャンル名,出演者,放送日時,放送局,番組内容等の番組に関する情報を格納する。配信される番組情報には、番組名,ジャンル名,出演者,放送日時,放送局,番組内容等の番組に関する情報が、共通のフォーマットで含まれているものとする。ステップ301の処理は図1の番組情報格納部103における処理を表す。ステップ301の後,キーワード抽出処理302及び辞書登録処理303を行う。
Hereinafter, a processing procedure will be described with reference to FIGS.
FIG. 3 is a diagram for explaining the processing method of the speech recognition dictionary generation unit. For the distributed program information (102 in FIG. 1), information relating to the program such as program name, genre name, performer, broadcast date and time, broadcast station, program content is stored in
図4は図3におけるキーワード抽出処理302の処理方法について説明する図である。図3のステップ301において格納された各番組情報に対し,ステップ401において,形態素解析によるテキスト分析を行い、テキストに含まれる全ての単語のリストを出力する。形態素解析によるテキスト分析については,前述の特許文献1にある方法等が知られている。ステップ402ではステップ401の分析結果である単語リストから,出演者名,スポーツ等のチーム名,番組名,その他一般的な名詞等,キーワードとなる単語を選択する。ステップ403においてはステップ402で選択した全てのキーワードと,キーワード選択元である番組の番組情報を参照して得られるジャンル名とからなる,キーワードのリストとジャンル名の組を出力する。
FIG. 4 is a diagram for explaining the processing method of the
図5は図3における辞書登録処理303の処理方法について説明する図である。ステップ501において,図3のキーワード抽出処理302によって得られたキーワードのリストに含まれる全てのキーワードに対し,キーワード抽出処理302で得られたジャンル(ジャンル名Aとする)の部分辞書の集合を探索する。音声認識用辞書は,ジャンルごとに五十音順などで適当な個数ずつ分割したキーワードの部分集合から成る部分辞書の集合として構成されている(図2参照)。即ち,各ジャンルに対して部分辞書の集合が対応付けられる。各ジャンルの部分辞書には順序付けがされている。各キーワードはそのキーワードの読み仮名情報と共に部分辞書に登録されている。ステップ502における探索の結果,対象キーワードがジャンルAの全ての部分辞書に存在しない場合,ステップ502において,ジャンルA以外のジャンルの部分辞書を探索する。探索の結果,ジャンルA以外のジャンル(Bとする)の部分辞書にキーワードが含まれている場合,ステップ503において,ジャンルBの部分辞書にそのキーワードと共に登録されている読み仮名情報とキーワードをジャンルAの部分辞書に登録する。対象キーワードがジャンルA以外のあらゆるジャンルの全ての部分辞書にも含まれていない場合,ステップ504において,キーワードに対する読み仮名情報を生成する。テキストからの読み仮名生成は,特開平8−30287号公報、特開平8−95597号公報等に記載の、テキストを読み上げるテキストツースピーチ(TTS;Text To Speech)の技術を用いて、認識する対象を表すテキストから自動的に、当該対象を発音した発音データを生成する方法等を用いることができる。ステップ505において,キーワードとステップ504で生成した読み仮名情報をジャンルAの部分辞書に登録する。
FIG. 5 is a diagram for explaining the processing method of the
図6はキーワード音声入力部の処理方式について説明する図である。処理は入力部(図1の108)からユーザの入力があった場合にその入力に応じて行う。ユーザの入力はキーワード入力をしたいことを伝える入力要求指示の入力,入力したいキーワードが属するジャンルを決定するための入力,画面の切り替えを要求する指示のための入力(ここまでの入力は、音声入力に限らず、ボタンなどによる入力でもよい),キーワードの音声による入力に大別される(図6の606)。ユーザから検索キーとしてや録画予約のためのキーワード入力を要求する入力があった場合,ステップ601においてジャンル選択指示画面を表示する。ここでは、部分辞書の分類の名前であるジャンル名を表示して、そのなかからユーザに選択させるようにする。ユーザからジャンルを指定する入力があった場合,ステップ602において指定されたジャンルに対する第一の部分辞書に含まれるキーワードを画面に表示する。ジャンルを指定する入力は音声入力でなくてもよいが、音声入力とする場合には、ステップ601で表示するジャンル名とその読み仮名情報を格納したジャンル辞書を記録媒体に保持しておき,画面表示されたジャンル名を読み上げることでユーザが音声入力したジャンル名とジャンル辞書を照合し,入力されたジャンルを判定する。各ジャンルに対応する部分辞書の集合に対しては,集合内の部分辞書に対し順序付けがなされているため,ステップ602においては,対象となるジャンルの部分辞書のうち,第一番目の部分辞書に含まれるキーワードを表示する。図2の201はジャンルXの第一の辞書を示している。ユーザから画面のスクロールやジャンル選択画面等への画面切り替え指示入力があった場合,処理603において適切な画面への切り替えを行い、キーワードの音声入力の待ち受けに入る。ユーザがキーワードの発声を終えて、キーワードを決定する入力があった場合,ステップ604においては,決定するキーワードを含む画面表示の基である部分辞書を用いて入力されたキーワードの判定を行う。キーワードの判定では,ユーザが入力したキーワードと入力の基である部分辞書内のキーワードの読み仮名情報とを照合し,それらが合致するキーワードの抽出を行う。ステップ605において,ステップ604で判定された結果得られたキーワードの情報を出力する。
FIG. 6 is a diagram for explaining the processing method of the keyword voice input unit. The processing is performed in response to a user input from the input unit (108 in FIG. 1). The user's input is an input request instruction indicating that the user wants to input a keyword, an input for determining a genre to which the keyword to be input belongs, an input for an instruction for requesting a screen change (the input up to this point is a voice input) The input is not limited to the above but may be input by a button or the like), and input by keyword voice (606 in FIG. 6). If there is an input from the user as a search key or a keyword input request for recording reservation, in
図7は図6における画面表示処理603の処理を説明する図である。処理は図6の606の画面切替指示における切替後の画面の表示指示内容に従って行われる。表示指示された画面が前のキーワード表示画面である場合には,ステップ701において対象ジャンルの一つ前の部分辞書に含まれるキーワードを表示する。例えば,現在表示しているキーワード表示画面の基になっている部分辞書が図2における203である場合,部分辞書202のキーワードを表示する。表示指示された画面が次のキーワード表示画面である場合には,ステップ702において対象ジャンルの一つ後の部分辞書に含まれるキーワードを表示する。例えば,現在表示しているキーワード表示画面が図203の部分辞書を基としている場合には,部分辞書204のキーワードを表示する。表示指示された画面が上記のどちらでもない場合は,ステップ703において指示に従った画面を表示する。
FIG. 7 is a diagram for explaining the
図8はキーワード表示画面例を説明する図である。指定されたジャンルに属するキーワードを部分辞書ごとに表示する。部分辞書をユーザプロファイルからユーザの嗜好する順番でキーワードを登録するよう生成することにより,ユーザ嗜好順にキーワードを表示することもできる。ユーザは表示されたキーワードの中から入力したいキーワードを選択し,音声により入力を行う。 FIG. 8 is a diagram for explaining an example of a keyword display screen. The keywords belonging to the specified genre are displayed for each partial dictionary. By generating the partial dictionary so that keywords are registered in the order of user preference from the user profile, the keywords can be displayed in the order of user preference. The user selects a keyword to be input from the displayed keywords, and inputs by voice.
101 音声認識用辞書生成部、102 番組情報、103 番組情報格納部、104 キーワード抽出部、105 辞書登録部、106 音声認識用辞書、107 キーワード音声入力部、108 入力部、109 キーワード表示・入力判定部、110 キーワード情報、
201,202,203,204 音声認識用辞書の部分辞書
302 キーワード抽出処理、303 辞書登録処理、603 画面切替処理。
101 speech recognition dictionary generation unit, 102 program information, 103 program information storage unit, 104 keyword extraction unit, 105 dictionary registration unit, 106 speech recognition dictionary, 107 keyword speech input unit, 108 input unit, 109 keyword display / input determination Part, 110 keyword information,
201, 202, 203, 204 Voice recognition dictionary
Claims (3)
処理装置において、入力された番組情報からキーワードを抽出するステップと、該抽出されたキーワードを、そのキーワードと関連付けられたジャンルに基づいて分類し、音声認識情報と共に、ジャンルごとに設けられる部分辞書を生成して記憶装置に格納される音声認識用辞書に登録するステップとを有することを特徴とする音声認識用部分辞書生成方法。 The method includes a step of displaying a keyword included in the partial dictionary of the speech recognition dictionary and determining the user input using the partial dictionary, and the user inputs the keyword by voice by selecting the keyword displayed on the screen. A method for generating a speech recognition partial dictionary used in a television program selection method for selecting a program,
In the processing device, a step of extracting a keyword from the input program information, classifying the extracted keyword based on a genre associated with the keyword, and a partial dictionary provided for each genre together with voice recognition information A method for generating a partial dictionary for speech recognition, comprising the steps of: registering in a dictionary for speech recognition generated and stored in a storage device.
前記ユーザの入力を判定するステップは、音声入力部からユーザによる音声入力を受け付けるステップと、前記画面表示したキーワードと前記ユーザによる音声入力とを照合することにより、前記ユーザの入力を判定することを特徴とするテレビ放送受信機のための音声入力方法。 A partial dictionary provided for each genre and including keywords related to program information is read from the storage device, the keywords included in the partial dictionary are displayed on the screen, the processing device determines the user's input using the partial dictionary, and the user A program search or recording reservation based on the input of
The step of determining the user's input includes determining the user's input by comparing the step of accepting the voice input by the user from the voice input unit and the keyword displayed on the screen and the voice input by the user. An audio input method for a television broadcast receiver.
The method for displaying the keywords according to claim 1 or 2 by referring to the user profile and displaying the keywords in an order that the user likes.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004294429A JP2006106451A (en) | 2004-10-07 | 2004-10-07 | Speech input method of television broadcast receiver |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004294429A JP2006106451A (en) | 2004-10-07 | 2004-10-07 | Speech input method of television broadcast receiver |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006106451A true JP2006106451A (en) | 2006-04-20 |
Family
ID=36376256
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004294429A Pending JP2006106451A (en) | 2004-10-07 | 2004-10-07 | Speech input method of television broadcast receiver |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006106451A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008278400A (en) * | 2007-05-07 | 2008-11-13 | Sharp Corp | Keyword setting method |
WO2013102954A1 (en) * | 2012-01-06 | 2013-07-11 | パナソニック株式会社 | Broadcast receiving device and voice dictionary construction processing method |
-
2004
- 2004-10-07 JP JP2004294429A patent/JP2006106451A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008278400A (en) * | 2007-05-07 | 2008-11-13 | Sharp Corp | Keyword setting method |
WO2013102954A1 (en) * | 2012-01-06 | 2013-07-11 | パナソニック株式会社 | Broadcast receiving device and voice dictionary construction processing method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5178109B2 (en) | Search device, method and program | |
DK179111B1 (en) | INTELLIGENT AUTOMATED ASSISTANT IN A MEDIUM ENVIRONMENT | |
JP4459267B2 (en) | Dictionary data generation apparatus and electronic device | |
EP2477186B1 (en) | Information retrieving apparatus, information retrieving method and navigation system | |
US20140067402A1 (en) | Displaying additional data about outputted media data by a display device for a speech search command | |
CN101422041A (en) | Internet search-based television | |
KR20120113717A (en) | Search device, search method, and program | |
JP2010072507A (en) | Speech recognition search system and speech recognition search method | |
JP3799280B2 (en) | Dialog system and control method thereof | |
JP2009042968A (en) | Information selection system, information selection method, and program for information selection | |
JP4064902B2 (en) | Meta information generation method, meta information generation device, search method, and search device | |
JP4601306B2 (en) | Information search apparatus, information search method, and program | |
US20120013805A1 (en) | Apparatus and method for displaying content | |
JP2007334429A (en) | Keyword generating method, document retrieval method, topic range estimating method, topic boundary estimating method, and device therefor, its program, and its recording medium | |
JP2009080576A (en) | Retrieving apparatus, method, and program | |
KR20060100646A (en) | Method and system for searching the position of an image thing | |
JP2007199315A (en) | Content providing apparatus | |
JP2004289530A (en) | Recording and reproducing apparatus | |
US20050125224A1 (en) | Method and apparatus for fusion of recognition results from multiple types of data sources | |
JP2005227545A (en) | Dictionary creation system, program guide system and dictionary creation method | |
JP5231130B2 (en) | Key phrase extraction device, scene division device, and program | |
JP2006106451A (en) | Speech input method of television broadcast receiver | |
WO2008044669A1 (en) | Audio information search program and its recording medium, audio information search system, and audio information search method | |
JP2008225676A (en) | Dictionary retrieving device and its control program | |
JP2007140194A (en) | Program retrieval device and morphemic dictionary control server |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060425 |