JP2013068783A - 音声認識装置、音声認識方法およびプログラム - Google Patents
音声認識装置、音声認識方法およびプログラム Download PDFInfo
- Publication number
- JP2013068783A JP2013068783A JP2011207038A JP2011207038A JP2013068783A JP 2013068783 A JP2013068783 A JP 2013068783A JP 2011207038 A JP2011207038 A JP 2011207038A JP 2011207038 A JP2011207038 A JP 2011207038A JP 2013068783 A JP2013068783 A JP 2013068783A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- score
- unit
- program
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4668—Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/47214—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for content reservation or setting reminders; for requesting event notification, e.g. of sport results or stock market
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/475—End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data
- H04N21/4755—End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data for defining user preferences, e.g. favourite actors or genre
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
【解決手段】音声認識装置は、番組情報記憶部と、辞書記憶部と、算出部と、更新部と、認識部と、操作制御部とを備える。番組情報記憶部は、放送番組のメタデータとユーザの視聴状態とを記憶する。辞書記憶部は、音声認識の対象となる認識語と優先度とを含む認識辞書を記憶する。算出部は、メタデータと視聴状態とに基づいて、放送番組の特徴語と特徴語に対するユーザの嗜好の度合いを表す第1スコアとを算出する。更新部は、特徴語を含む認識語の優先度を第1スコアに応じて更新する。認識部は、認識辞書を用いて音声を認識する。操作制御部は、認識結果に基づいて放送番組に対する操作を制御する。
【選択図】図1
Description
12 算出部
13 嗜好情報記憶部
14 更新部
15 辞書記憶部
16 認識部
17 受信部
18 操作制御部
19 表示制御部
20 推薦状態記憶部
21 表示部
Claims (9)
- 放送番組のメタデータとユーザの視聴状態とを対応づけて記憶する番組情報記憶部と、
音声認識の対象となる認識語と、前記認識語の優先度とを含む認識辞書を記憶する辞書記憶部と、
前記メタデータと前記視聴状態とに基づいて、前記放送番組の特徴を表す特徴語と、前記特徴語に対する前記ユーザの嗜好の度合いを表す第1スコアと、を算出する算出部と、
前記特徴語を含む前記認識語の前記優先度を、前記第1スコアに応じて更新する更新部と、
音声を受信する受信部と、
前記認識辞書を用いて前記音声を認識する認識部と、
前記認識部による認識結果に基づいて、前記放送番組に対する操作を制御する操作制御部と、
を備えることを特徴とする音声認識装置。 - 前記操作を指示する入力の候補を表す入力候補として、前記第1スコアが高い前記特徴語を優先して選択し、選択した前記入力候補を表示部に表示する表示制御部をさらに備えること、
を特徴とする請求項1に記載の音声認識装置。 - 前記算出部は、さらに、前記放送番組に対する前記ユーザの嗜好の度合いを表すスコアであって、前記第1スコアが高い前記特徴語を含む前記放送番組ほど値が高い第2スコアを算出し、
前記表示制御部は、前記第1スコアに基づく選択が指定された場合に、前記第1スコアが高い前記特徴語を優先して選択し、前記第2スコアに基づく選択が指定された場合に、前記第2スコアが高い前記特徴語を優先して選択し、選択した前記入力候補を前記表示部に表示すること、
を特徴とする請求項2に記載の音声認識装置。 - 前記算出部は、さらに、前記放送番組に対する前記ユーザの嗜好の度合いを表すスコアであって、前記第1スコアが高い前記特徴語を含む前記放送番組ほど値が高い第2スコアを算出し、
前記更新部は、さらに、前記放送番組を特定する特定情報を含む前記認識語の前記優先度を、前記第2スコアに応じて更新すること、
を特徴とする請求項1に記載の音声認識装置。 - 前記更新部は、前記第1スコアに基づく更新が指定された場合に、前記特徴語を含む前記認識語の前記優先度を、前記第1スコアに応じて更新し、前記第2スコアに基づく更新が指定された場合に、前記特定情報を含む前記認識語の前記優先度を、前記第2スコアに応じて更新すること、
を特徴とする請求項4に記載の音声認識装置。 - 前記算出部は、前記ユーザが視聴した前記放送番組に含まれる前記特徴語ほど値が高い前記第1スコアを算出すること、
を特徴とする請求項1に記載の音声認識装置。 - 前記番組情報記憶部は、複数の前記ユーザごとに、前記メタデータと前記視聴状態とを対応づけて記憶し、
前記辞書記憶部は、複数の前記ユーザごとに前記認識辞書を記憶し、
前記算出部は、複数の前記ユーザごとに、前記メタデータと該ユーザの前記視聴状態とに基づいて、前記特徴語と前記第1スコアとを算出し、
前記認識部は、さらに、受信された前記音声に基づいて該音声を発声した前記ユーザを判定し、判定した前記ユーザの前記認識辞書を用いて前記音声を認識すること、
を特徴とする請求項1に記載の音声認識装置。 - 音声認識装置で実行される音声認識方法であって、
前記音声認識装置は、
放送番組のメタデータとユーザの視聴状態とを対応づけて記憶する番組情報記憶部と、
音声認識の対象となる認識語と、前記認識語の優先度とを含む認識辞書を記憶する辞書記憶部と、を備え、
前記メタデータと前記視聴状態とに基づいて、前記放送番組の特徴を表す特徴語と、前記特徴語に対する前記ユーザの嗜好の度合いを表す第1スコアと、を算出する算出ステップと、
前記特徴語を含む前記認識語の前記優先度を、前記第1スコアに応じて更新する更新ステップと、
音声を受信する音声受信ステップと、
前記認識辞書を用いて前記音声を認識する音声認識ステップと、
前記音声認識ステップによる認識結果に基づいて、前記放送番組に対する操作を制御する操作制御ステップと、
を含むことを特徴とする音声認識方法。 - コンピュータを、
放送番組のメタデータとユーザの視聴状態とを対応づけて記憶する番組情報記憶部と、
音声認識の対象となる認識語と、前記認識語の優先度とを含む認識辞書を記憶する辞書記憶部と、
前記メタデータと前記視聴状態とに基づいて、前記放送番組の特徴を表す特徴語と、前記特徴語に対する前記ユーザの嗜好の度合いを表す第1スコアと、を算出する算出部と、
前記特徴語を含む前記認識語の前記優先度を、前記第1スコアに応じて更新する更新部と、
音声を受信する受信部と、
前記認識辞書を用いて前記音声を認識する認識部と、
前記認識部による認識結果に基づいて、前記放送番組に対する操作を制御する操作制御部、
として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011207038A JP5694102B2 (ja) | 2011-09-22 | 2011-09-22 | 音声認識装置、音声認識方法およびプログラム |
US13/535,798 US8983847B2 (en) | 2011-09-22 | 2012-06-28 | Voice recognition apparatus, method, and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011207038A JP5694102B2 (ja) | 2011-09-22 | 2011-09-22 | 音声認識装置、音声認識方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013068783A true JP2013068783A (ja) | 2013-04-18 |
JP5694102B2 JP5694102B2 (ja) | 2015-04-01 |
Family
ID=47912236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011207038A Expired - Fee Related JP5694102B2 (ja) | 2011-09-22 | 2011-09-22 | 音声認識装置、音声認識方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8983847B2 (ja) |
JP (1) | JP5694102B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018531404A (ja) * | 2015-10-05 | 2018-10-25 | サバント システムズ エルエルシーSavant Systems LLC | ホームオートメーションシステムの音声制御のための履歴ベースのキーフレーズの提案 |
JP2019135529A (ja) * | 2018-02-05 | 2019-08-15 | 株式会社東芝 | 編集支援装置、編集支援方法及びプログラム |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150150029A1 (en) * | 2013-11-26 | 2015-05-28 | Piksel, Inc. | Controlling Access to Content |
TWI506458B (zh) | 2013-12-24 | 2015-11-01 | Ind Tech Res Inst | 辨識網路產生裝置及其方法 |
CN109547854A (zh) * | 2019-01-23 | 2019-03-29 | 深圳市酷开网络科技有限公司 | 一种基于声纹识别的电视推送方法、智能电视及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001282285A (ja) * | 2000-03-31 | 2001-10-12 | Matsushita Electric Ind Co Ltd | 音声認識方法及び音声認識装置、並びにそれを用いた番組指定装置 |
JP2002142160A (ja) * | 2000-11-02 | 2002-05-17 | Nec Corp | 番組推薦装置、番組推薦方法およびそのプログラムを記録した記録媒体 |
JP2004295102A (ja) * | 2003-03-13 | 2004-10-21 | Matsushita Electric Ind Co Ltd | 音声認識辞書作成装置及び情報検索装置 |
WO2005022914A1 (ja) * | 2003-08-28 | 2005-03-10 | Sony Corporation | 情報提供装置及び情報提供方法、並びにコンピュータ・プログラム |
WO2005064928A1 (ja) * | 2003-12-26 | 2005-07-14 | Matsushita Electric Industrial Co., Ltd. | 推薦番組通知方法および推薦番組通知装置 |
JP2006041662A (ja) * | 2004-07-23 | 2006-02-09 | Matsushita Electric Ind Co Ltd | 番組推薦装置 |
JP2006094018A (ja) * | 2004-09-22 | 2006-04-06 | Sharp Corp | 番組推薦装置、番組推薦方法、プログラムおよびそのプログラムを記録した記録媒体 |
JP2007178927A (ja) * | 2005-12-28 | 2007-07-12 | Canon Inc | 情報検索装置および方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6314398B1 (en) | 1999-03-01 | 2001-11-06 | Matsushita Electric Industrial Co., Ltd. | Apparatus and method using speech understanding for automatic channel selection in interactive television |
US7437296B2 (en) * | 2003-03-13 | 2008-10-14 | Matsushita Electric Industrial Co., Ltd. | Speech recognition dictionary creation apparatus and information search apparatus |
US8175885B2 (en) * | 2007-07-23 | 2012-05-08 | Verizon Patent And Licensing Inc. | Controlling a set-top box via remote speech recognition |
-
2011
- 2011-09-22 JP JP2011207038A patent/JP5694102B2/ja not_active Expired - Fee Related
-
2012
- 2012-06-28 US US13/535,798 patent/US8983847B2/en not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001282285A (ja) * | 2000-03-31 | 2001-10-12 | Matsushita Electric Ind Co Ltd | 音声認識方法及び音声認識装置、並びにそれを用いた番組指定装置 |
JP2002142160A (ja) * | 2000-11-02 | 2002-05-17 | Nec Corp | 番組推薦装置、番組推薦方法およびそのプログラムを記録した記録媒体 |
JP2004295102A (ja) * | 2003-03-13 | 2004-10-21 | Matsushita Electric Ind Co Ltd | 音声認識辞書作成装置及び情報検索装置 |
WO2005022914A1 (ja) * | 2003-08-28 | 2005-03-10 | Sony Corporation | 情報提供装置及び情報提供方法、並びにコンピュータ・プログラム |
WO2005064928A1 (ja) * | 2003-12-26 | 2005-07-14 | Matsushita Electric Industrial Co., Ltd. | 推薦番組通知方法および推薦番組通知装置 |
JP2006041662A (ja) * | 2004-07-23 | 2006-02-09 | Matsushita Electric Ind Co Ltd | 番組推薦装置 |
JP2006094018A (ja) * | 2004-09-22 | 2006-04-06 | Sharp Corp | 番組推薦装置、番組推薦方法、プログラムおよびそのプログラムを記録した記録媒体 |
JP2007178927A (ja) * | 2005-12-28 | 2007-07-12 | Canon Inc | 情報検索装置および方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018531404A (ja) * | 2015-10-05 | 2018-10-25 | サバント システムズ エルエルシーSavant Systems LLC | ホームオートメーションシステムの音声制御のための履歴ベースのキーフレーズの提案 |
JP2019135529A (ja) * | 2018-02-05 | 2019-08-15 | 株式会社東芝 | 編集支援装置、編集支援方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20130080156A1 (en) | 2013-03-28 |
JP5694102B2 (ja) | 2015-04-01 |
US8983847B2 (en) | 2015-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10410627B2 (en) | Automatic language model update | |
US11182122B2 (en) | Voice control of computing devices | |
US10056078B1 (en) | Output of content based on speech-based searching and browsing requests | |
US10283111B1 (en) | Disambiguation in speech recognition | |
US10448115B1 (en) | Speech recognition for localized content | |
US10503468B2 (en) | Voice enabling applications | |
US9934777B1 (en) | Customized speech processing language models | |
US10210862B1 (en) | Lattice decoding and result confirmation using recurrent neural networks | |
CN106463113B (zh) | 在语音辨识中预测发音 | |
JP6003972B2 (ja) | 音声検索装置、音声検索方法及びプログラム | |
US11501764B2 (en) | Apparatus for media entity pronunciation using deep learning | |
JP7230806B2 (ja) | 情報処理装置、及び情報処理方法 | |
JP5694102B2 (ja) | 音声認識装置、音声認識方法およびプログラム | |
JP5326169B2 (ja) | 音声データ検索システム及び音声データ検索方法 | |
JP4634156B2 (ja) | 音声対話方法および音声対話装置 | |
US11978445B1 (en) | Confidence scoring for selecting tones and text of voice browsing conversations | |
US11328713B1 (en) | On-device contextual understanding | |
US11626106B1 (en) | Error attribution in natural language processing systems | |
CN111712790B (zh) | 计算设备的语音控制 | |
JP2011118775A (ja) | 検索装置、検索方法、及び、プログラム | |
JP2010085522A (ja) | 音声認識処理機能を用いたコンテンツ検索装置、プログラム及び方法 | |
JP2017015847A (ja) | 音声検索装置、音声検索方法及びプログラム | |
JP2011118774A (ja) | 検索装置、検索方法、及び、プログラム | |
JP2017026792A (ja) | 音声検索装置、音声検索方法及びプログラム | |
JP2024015818A (ja) | 音声認識装置、音声認識方法、および音声認識プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131001 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140417 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140430 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140627 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150204 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5694102 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |