JP6713034B2 - スマートテレビの音声インタラクティブフィードバック方法、システム及びコンピュータプログラム - Google Patents
スマートテレビの音声インタラクティブフィードバック方法、システム及びコンピュータプログラム Download PDFInfo
- Publication number
- JP6713034B2 JP6713034B2 JP2018219135A JP2018219135A JP6713034B2 JP 6713034 B2 JP6713034 B2 JP 6713034B2 JP 2018219135 A JP2018219135 A JP 2018219135A JP 2018219135 A JP2018219135 A JP 2018219135A JP 6713034 B2 JP6713034 B2 JP 6713034B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- current interface
- smart
- audio stream
- target element
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 63
- 230000002452 interceptive effect Effects 0.000 title claims description 56
- 238000004590 computer program Methods 0.000 title claims description 6
- 230000004044 response Effects 0.000 claims description 67
- 230000000694 effects Effects 0.000 claims description 38
- 238000012545 processing Methods 0.000 claims description 11
- 238000010586 diagram Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000000644 propagated effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 230000004397 blinking Effects 0.000 description 2
- 108091027981 Response element Proteins 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/431—Generation of visual interfaces for content selection or interaction; Content or additional data rendering
- H04N21/4312—Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/24—Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
- H04N21/2401—Monitoring of the client buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/433—Content storage operation, e.g. storage operation in response to a pause request, caching operations
- H04N21/4331—Caching operations, e.g. of an advertisement for later insertion during playback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- User Interface Of Digital Computer (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
ユーザが音声指令を発したオーディオストリーム及びスマートテレビの現在インタフェースにおける要素の情報を採集すること、
クラウドエンドサーバが上記オーディオストリーム及び上記現在インタフェースにおける要素の情報に基づいて、目標要素を含む情報応答メッセージを生成するように、上記クラウドエンドサーバへ上記オーディオストリーム及び上記現在インタフェースにおける要素の情報を送信すること、
上記クラウドエンドサーバによって返送された上記応答メッセージを受信すること、
上記応答メッセージに含まれた上記目標要素の情報に基づいて、上記現在インタフェースにおいて対応する上記目標要素に関して予め設定された効果展示を実行し、上記音声指令のインタラクティブフィードバックとすること、を含み、
ただし、上記目標要素は、上記オーディオストリームに対応する上記音声指令の意図がヒットした上記現在インタフェースにおける要素である。
上記応答メッセージに含まれた上記目標要素の情報に基づいて、上記現在インタフェースにおいて対応する上記目標要素に関して予め設定された効果展示を実行することは、具体的に、
上記応答メッセージに含まれた上記目標要素の情報に基づいて、上記キャッシュに記憶された上記現在インタフェースにおける要素の情報から対応する上記目標要素を捜索すること、
上記現在インタフェースにおいて対応する上記目標要素に関して予め設定された効果展示を実行すること、を含む。
スマートテレビによって送信された、ユーザの音声指令に対応するオーディオストリーム及び上記スマートテレビの現在インタフェースにおける要素の情報を受信すること、
上記オーディオストリーム及び上記現在インタフェースにおける要素の情報に基づいて、目標要素を含む情報応答メッセージを生成すること、
上記スマートテレビが上記応答メッセージに含まれた上記目標要素の情報に基づいて、上記現在インタフェースにおいて対応する上記目標要素に関して予め設定された効果展示を実行し、上記音声指令のインタラクティブフィードバックとするように、上記スマートテレビへ上記応答メッセージを返送すること、を含み、
ただし、上記目標要素は、上記オーディオストリームに対応する上記音声指令の意図がヒットした上記現在インタフェースにおける要素である。
上記オーディオストリーム及び上記現在インタフェースにおける要素の情報に基づいて、上記オーディオストリームに対応する上記音声指令の意図がヒットした上記現在インタフェースにおける目標要素を識別すること、
上記目標要素の情報に基づいて応答メッセージを生成すること、を含む。
上記オーディオストリームに対して音声識別を行い、上記オーディオストリームに対応する上記音声指令に対応する文字指令を取得すること、
上記文字指令に対して自然言語理解処理を行い、上記音声指令の意図を識別すること、
上記音声指令の意図と上記現在インタフェースにおける要素の情報とを比較して、上記音声指令の意図がヒットした上記現在インタフェースにおける目標要素を識別すること、を含む。
ユーザが音声指令を発したオーディオストリーム及びスマートテレビの現在インタフェースにおける要素の情報を採集するための採集モジュールと、
クラウドエンドサーバが上記オーディオストリーム及び上記現在インタフェースにおける要素の情報に基づいて、目標要素を含む情報応答メッセージを生成するように、上記クラウドエンドサーバへ上記オーディオストリーム及び上記現在インタフェースにおける要素の情報を送信し、且つ、上記クラウドエンドサーバによって返送された上記応答メッセージも受信するための送受信モジュールと、
上記応答メッセージに含まれた上記目標要素の情報に基づいて、上記現在インタフェースにおいて対応する上記目標要素に関して予め設定された効果展示を実行し、上記音声指令のインタラクティブフィードバックとするための実行モジュールと、を含み、
ただし、上記目標要素は、上記オーディオストリームに対応する上記音声指令の意図がヒットした上記現在インタフェースにおける要素である。
キャッシュには上記現在インタフェースにおける要素の情報を記憶するための記憶モジュールを更に含み、
上記実行モジュールは、具体的に
上記応答メッセージに含まれた上記目標要素の情報に基づいて、上記キャッシュに記憶された上記現在インタフェースにおける要素の情報から対応する上記目標要素を捜索すること、
上記現在インタフェースにおいて対応する上記目標要素に関して予め設定された効果展示を実行するために用いられる。
スマートテレビによって送信された、ユーザの音声指令に対応するオーディオストリーム及び上記スマートテレビの現在インタフェースにおける要素の情報を受信するための送受信モジュールと、
上記オーディオストリーム及び上記現在インタフェースにおける要素の情報に基づいて、目標要素を含む情報応答メッセージを生成するための生成モジュールと、を含み、
上記送受信モジュールは、上記スマートテレビが上記応答メッセージに含まれた上記目標要素の情報に基づいて、上記現在インタフェースにおいて対応する上記目標要素に関して予め設定された効果展示を実行し、上記音声指令のインタラクティブフィードバックとするように、上記スマートテレビへ上記応答メッセージを返送することにも用いられ、
ただし、上記目標要素は、上記オーディオストリームに対応する上記音声指令の意図がヒットした上記現在インタフェースにおける要素である。
上記オーディオストリーム及び上記現在インタフェースにおける要素の情報に基づいて、上記オーディオストリームに対応する上記音声指令の意図がヒットした上記現在インタフェースにおける目標要素を識別するための識別手段と、
上記目標要素の情報に基づいて応答メッセージを生成するための生成手段と、を含む。
上記オーディオストリームに対して音声識別を行い、上記オーディオストリームに対応する上記音声指令に対応する文字指令を取得し、
上記文字指令に対して自然言語理解処理を行い、上記音声指令の意図を識別し、
上記音声指令の意図と上記現在インタフェースにおける要素の情報とを比較して、上記音声指令の意図がヒットした上記現在インタフェースにおける目標要素を識別することに用いられる。
1つ或いは複数のプロセッサと、
1つ或いは複数のプログラムを記憶するためのメモリと、を含み、
上記1つ或いは複数のプログラムが上記1つ或いは複数のプロセッサによって実行される時、上記1つ或いは複数のプロセッサに上記スマートテレビの音声インタラクティブフィードバック方法を実現させる。
この場合、相応的に、実行モジュール12は、具体的に、送受信モジュール11によって受信された応答メッセージに含まれた目標要素の情報に基づいて、記憶モジュール13によってキャッシュに記憶された現在インタフェースにおける要素の情報から対応する目標要素を捜索すること、現在インタフェースにおいて対応する目標要素に関して予め設定された効果展示を実行することに用いられる。
Claims (17)
- スマートテレビの音声インタラクティブフィードバック方法であって、
ユーザが音声指令を発したオーディオストリーム及びスマートテレビの現在インタフェースにおける要素の情報を採集すること、
クラウドエンドサーバが前記オーディオストリーム及び前記現在インタフェースにおける要素の情報に基づいて、目標要素を含む情報応答メッセージを生成するように、前記クラウドエンドサーバへ前記オーディオストリーム及び前記現在インタフェースにおける要素の情報を送信すること、
前記クラウドエンドサーバによって返送された前記応答メッセージを受信すること、
前記応答メッセージに含まれた前記目標要素の情報に基づいて、前記現在インタフェースにおいて対応する前記目標要素に関して予め設定された効果展示を実行し、前記音声指令のインタラクティブフィードバックとすること、を含み、
ただし、前記目標要素は、前記オーディオストリームに対応する前記音声指令の意図がヒットした前記現在インタフェースにおける要素である
スマートテレビの音声インタラクティブフィードバック方法。 - ユーザが音声指令を発したオーディオストリーム及びスマートテレビの現在インタフェースにおける要素の情報を採集した後、前記現在インタフェースにおける要素の情報をキャッシュに記憶すること、を更に含み、
前記応答メッセージに含まれた前記目標要素の情報に基づいて、前記現在インタフェースにおいて対応する前記目標要素に関して予め設定された効果展示を実行することは、具体的に、
前記応答メッセージに含まれた前記目標要素の情報に基づいて、前記キャッシュに記憶された前記現在インタフェースにおける要素の情報から対応する前記目標要素を捜索すること、
前記現在インタフェースにおいて対応する前記目標要素に関して予め設定された効果展示を実行すること、を含む
請求項1に記載されたスマートテレビの音声インタラクティブフィードバック方法。 - 前記現在インタフェースにおける要素の情報は、前記現在インタフェースにおける前記要素の位置、表示された文字及び階層結構情報を含む
請求項1または2に記載されたスマートテレビの音声インタラクティブフィードバック方法。 - スマートテレビの音声インタラクティブフィードバック方法であって、
スマートテレビによって送信された、ユーザの音声指令に対応するオーディオストリーム及び前記スマートテレビの現在インタフェースにおける要素の情報を受信すること、
前記オーディオストリーム及び前記現在インタフェースにおける要素の情報に基づいて、目標要素を含む情報応答メッセージを生成すること、
前記スマートテレビが前記応答メッセージに含まれた前記目標要素の情報に基づいて、前記現在インタフェースにおいて対応する前記目標要素に関して予め設定された効果展示を実行し、前記音声指令のインタラクティブフィードバックとするように、前記スマートテレビへ前記応答メッセージを返送すること、を含み、
ただし、前記目標要素は、前記オーディオストリームに対応する前記音声指令の意図がヒットした前記現在インタフェースにおける要素である
スマートテレビの音声インタラクティブフィードバック方法。 - 前記オーディオストリーム及び前記現在インタフェースにおける要素の情報に基づいて、目標要素を含む情報応答メッセージを生成することは、具体的に
前記オーディオストリーム及び前記現在インタフェースにおける要素の情報に基づいて、前記オーディオストリームに対応する前記音声指令の意図がヒットした前記現在インタフェースにおける目標要素を識別すること、
前記目標要素の情報に基づいて応答メッセージを生成すること、を含む
請求項4に記載されたスマートテレビの音声インタラクティブフィードバック方法。 - 前記オーディオストリーム及び前記現在インタフェースにおける要素の情報に基づいて、前記オーディオストリームに対応する前記音声指令の意図がヒットした前記現在インタフェースにおける目標要素を識別することは、具体的に
前記オーディオストリームに対して音声識別を行い、前記オーディオストリームに対応する前記音声指令に対応する文字指令を取得すること、
前記文字指令に対して自然言語理解処理を行い、前記音声指令の意図を識別すること、
前記音声指令の意図と前記現在インタフェースにおける要素の情報とを比較して、前記音声指令の意図がヒットした前記現在インタフェースにおける目標要素を識別すること、を含む
請求項5に記載されたスマートテレビの音声インタラクティブフィードバック方法。 - 前記現在インタフェースにおける要素の情報は、前記現在インタフェースにおける前記要素の位置、表示された文字及び階層結構情報を含む
請求項4〜6のいずれか1項に記載されたスマートテレビの音声インタラクティブフィードバック方法。 - スマートテレビ装置であって、
ユーザが音声指令を発したオーディオストリーム及びスマートテレビの現在インタフェースにおける要素の情報を採集するための採集モジュールと、
クラウドエンドサーバが前記オーディオストリーム及び前記現在インタフェースにおける要素の情報に基づいて、目標要素を含む情報応答メッセージを生成するように、前記クラウドエンドサーバへ前記オーディオストリーム及び前記現在インタフェースにおける要素の情報を送信し、且つ、前記クラウドエンドサーバによって返送された前記応答メッセージも受信するための送受信モジュールと、
前記応答メッセージに含まれた前記目標要素の情報に基づいて、前記現在インタフェースにおいて対応する前記目標要素に関して予め設定された効果展示を実行し、前記音声指令のインタラクティブフィードバックとするための実行モジュールと、を含み、
ただし、前記目標要素は、前記オーディオストリームに対応する前記音声指令の意図がヒットした前記現在インタフェースにおける要素である
スマートテレビ装置。 - スマートテレビ装置のキャッシュには前記現在インタフェースにおける要素の情報を記憶するための記憶モジュールを更に含み、
前記実行モジュールは、具体的に
前記応答メッセージに含まれた前記目標要素の情報に基づいて、前記キャッシュに記された前記現在インタフェースにおける要素の情報から対応する前記目標要素を捜索すること、
前記現在インタフェースにおいて対応する前記目標要素に関して予め設定された効果展示を実行するために用いられる
請求項8に記載されたスマートテレビ装置。 - 前記現在インタフェースにおける要素の情報は、前記現在インタフェースにおける前記要素の位置、表示された文字及び階層結構情報を含む
請求項8または9に記載されたスマートテレビ装置。 - クラウドエンドサーバであって、
スマートテレビによって送信された、ユーザの音声指令に対応するオーディオストリーム及び前記スマートテレビの現在インタフェースにおける要素の情報を受信するための送受信モジュールと、
前記オーディオストリーム及び前記現在インタフェースにおける要素の情報に基づいて、目標要素を含む情報応答メッセージを生成するための生成モジュールと、を含み、
前記送受信モジュールは、前記スマートテレビが前記応答メッセージに含まれた前記目標要素の情報に基づいて、前記現在インタフェースにおいて対応する前記目標要素に関して予め設定された効果展示を実行し、前記音声指令のインタラクティブフィードバックとするように、前記スマートテレビへ前記応答メッセージを返送することにも用いられ、
ただし、前記目標要素は、前記オーディオストリームに対応する前記音声指令の意図がヒットした前記現在インタフェースにおける要素である
クラウドエンドサーバ。 - 前記生成モジュールは、
前記オーディオストリーム及び前記現在インタフェースにおける要素の情報に基づいて、前記オーディオストリームに対応する前記音声指令の意図がヒットした前記現在インタフェースにおける目標要素を識別するための識別手段と、
前記目標要素の情報に基づいて応答メッセージを生成するための生成手段と、を含む
請求項11に記載されたクラウドエンドサーバ。 - 前記識別手段は、具体的に
前記オーディオストリームに対して音声識別を行い、前記オーディオストリームに対応する前記音声指令に対応する文字指令を取得し、
前記文字指令に対して自然言語理解処理を行い、前記音声指令の意図を識別し、
前記音声指令の意図と前記現在インタフェースにおける要素の情報とを比較して、前記音声指令の意図がヒットした前記現在インタフェースにおける目標要素を識別することに用いられる
請求項12に記載されたクラウドエンドサーバ。 - 前記現在インタフェースにおける要素の情報は、前記現在インタフェースにおける前記要素の位置、表示された文字及び階層結構情報を含む
請求項11〜13のいずれか1項に記載されたクラウドエンドサーバ。 - スマートテレビの音声インタラクティブシステムであって、
スマートテレビ装置とクラウドエンドサーバとを含み、
前記スマートテレビ装置と前記クラウドエンドサーバとを通信可能に接続し、
前記スマートテレビ装置に請求項8〜10のいずれか1項に記載されたスマートテレビ装置を採用し、
前記クラウドエンドサーバに請求項11〜14のいずれか1項に記載されたクラウドエンドサーバを採用する
スマートテレビの音声インタラクティブシステム。 - コンピュータ設備であって、
1つ或いは複数のプロセッサと、
1つ或いは複数のプログラムを記憶するためのメモリと、を含み、
前記1つ或いは複数のプログラムが前記1つ或いは複数のプロセッサによって実行される時、前記1つ或いは複数のプロセッサに請求項1〜3のいずれか1項に記載された方法、或いは請求項4〜7のいずれか1項に記載された方法を実現させる
コンピュータ設備。 - プロセッサによって実行される時、請求項1〜3のいずれか1項に記載された方法、或いは請求項4〜7のいずれか1項に記載された方法を実現する
コンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810195553.5 | 2018-03-09 | ||
CN201810195553.5A CN108683937B (zh) | 2018-03-09 | 2018-03-09 | 智能电视的语音交互反馈方法、系统及计算机可读介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019161636A JP2019161636A (ja) | 2019-09-19 |
JP6713034B2 true JP6713034B2 (ja) | 2020-06-24 |
Family
ID=63799410
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018219135A Active JP6713034B2 (ja) | 2018-03-09 | 2018-11-22 | スマートテレビの音声インタラクティブフィードバック方法、システム及びコンピュータプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10971145B2 (ja) |
JP (1) | JP6713034B2 (ja) |
CN (1) | CN108683937B (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109584870A (zh) * | 2018-12-04 | 2019-04-05 | 安徽精英智能科技有限公司 | 一种智能语音交互服务方法及系统 |
CN111696534B (zh) * | 2019-03-15 | 2023-05-23 | 阿里巴巴集团控股有限公司 | 语音交互设备和系统、设备控制方法、计算设备以及介质 |
CN110085224B (zh) * | 2019-04-10 | 2021-06-01 | 深圳康佳电子科技有限公司 | 智能终端全程语音操控处理方法、智能终端及存储介质 |
CN112201230A (zh) * | 2019-07-08 | 2021-01-08 | 安徽华米信息科技有限公司 | 语音响应方法、装置、设备以及存储介质 |
CN115145529B (zh) * | 2019-08-09 | 2023-05-09 | 华为技术有限公司 | 语音控制设备的方法及电子设备 |
US11782976B2 (en) * | 2019-09-27 | 2023-10-10 | Boe Technology Group Co., Ltd. | Method for querying information and display device |
CN110660391A (zh) * | 2019-09-29 | 2020-01-07 | 苏州思必驰信息科技有限公司 | 基于rpa接口实现大屏终端语音控制的定制方法及系统 |
CN111263236B (zh) * | 2020-02-21 | 2022-04-12 | 广州欢网科技有限责任公司 | 电视机应用的语音适配方法和装置及语音控制方法 |
CN112309388A (zh) * | 2020-03-02 | 2021-02-02 | 北京字节跳动网络技术有限公司 | 用于处理信息的方法和装置 |
CN113497980A (zh) * | 2020-03-20 | 2021-10-12 | 佛山市云米电器科技有限公司 | 界面模式显示方法、云服务器、电视机、系统和存储介质 |
CN112051748A (zh) * | 2020-09-15 | 2020-12-08 | 北京百度网讯科技有限公司 | 智能家居车载控制方法、装置、设备以及存储介质 |
CN112351097A (zh) * | 2020-11-05 | 2021-02-09 | 深圳Tcl新技术有限公司 | 设备控制方法、装置、发送端以及存储介质 |
CN112581941A (zh) * | 2020-11-17 | 2021-03-30 | 北京百度网讯科技有限公司 | 音频识别方法、装置、电子设备及存储介质 |
CN114679614B (zh) * | 2020-12-25 | 2024-02-06 | 深圳Tcl新技术有限公司 | 一种语音查询方法、智能电视及计算机可读存储介质 |
CN112869676B (zh) * | 2021-01-11 | 2022-04-26 | 佛山市顺德区美的洗涤电器制造有限公司 | 用于洗碗机的控制方法、控制装置、显示装置及洗碗机 |
CN112885354B (zh) * | 2021-01-25 | 2022-09-23 | 海信视像科技股份有限公司 | 一种显示设备、服务器及基于语音的显示控制方法 |
CN113889108B (zh) * | 2021-10-19 | 2024-06-25 | 清华大学 | 一种语音操作的纠错方法及系统 |
CN114286183A (zh) * | 2021-12-24 | 2022-04-05 | 深圳创维-Rgb电子有限公司 | 智能电视人机交互方法、智能电视及计算机可读存储介质 |
CN114415875B (zh) * | 2022-01-20 | 2024-08-13 | 京东方科技集团股份有限公司 | 智慧交互平板及其功能设置方法、外接pc设备 |
CN114898746A (zh) * | 2022-04-12 | 2022-08-12 | 青岛海尔科技有限公司 | 交互方法和装置、存储介质及电子装置 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6499015B2 (en) * | 1999-08-12 | 2002-12-24 | International Business Machines Corporation | Voice interaction method for a computer graphical user interface |
FR2820872B1 (fr) * | 2001-02-13 | 2003-05-16 | Thomson Multimedia Sa | Procede, module, dispositif et serveur de reconnaissance vocale |
US20060206339A1 (en) * | 2005-03-11 | 2006-09-14 | Silvera Marja M | System and method for voice-enabled media content selection on mobile devices |
JP2006330576A (ja) * | 2005-05-30 | 2006-12-07 | Sharp Corp | 機器操作システム、音声認識装置、電子機器、情報処理装置、プログラム、及び記録媒体 |
US7940338B2 (en) * | 2006-10-31 | 2011-05-10 | Inventec Corporation | Voice-controlled TV set |
CA2717992C (en) * | 2008-03-12 | 2018-01-16 | E-Lane Systems Inc. | Speech understanding method and system |
US10540976B2 (en) * | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
JP4811507B2 (ja) * | 2009-08-25 | 2011-11-09 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理システム、画像処理装置及び情報処理装置 |
US10013976B2 (en) * | 2010-09-20 | 2018-07-03 | Kopin Corporation | Context sensitive overlays in voice controlled headset computer displays |
WO2013022218A2 (en) * | 2011-08-05 | 2013-02-14 | Samsung Electronics Co., Ltd. | Electronic apparatus and method for providing user interface thereof |
US8793136B2 (en) * | 2012-02-17 | 2014-07-29 | Lg Electronics Inc. | Method and apparatus for smart voice recognition |
KR102056461B1 (ko) * | 2012-06-15 | 2019-12-16 | 삼성전자주식회사 | 디스플레이 장치 및 디스플레이 장치의 제어 방법 |
US9575720B2 (en) * | 2013-07-31 | 2017-02-21 | Google Inc. | Visual confirmation for a recognized voice-initiated action |
JP6440513B2 (ja) * | 2014-05-13 | 2018-12-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声認識機能を用いた情報提供方法および機器の制御方法 |
JP2016014967A (ja) * | 2014-07-01 | 2016-01-28 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 情報管理方法 |
KR102298767B1 (ko) * | 2014-11-17 | 2021-09-06 | 삼성전자주식회사 | 음성 인식 시스템, 서버, 디스플레이 장치 및 그 제어 방법 |
US20170047063A1 (en) * | 2015-03-31 | 2017-02-16 | Sony Corporation | Information processing apparatus, control method, and program |
CN105988915A (zh) * | 2015-06-03 | 2016-10-05 | 乐卡汽车智能科技(北京)有限公司 | 一种应用程序运行状态的展示方法及装置 |
CN105681829A (zh) * | 2016-01-12 | 2016-06-15 | 深圳市茁壮网络股份有限公司 | 一种面向电视终端的消息处理方法及装置 |
CN107369446A (zh) * | 2017-06-28 | 2017-11-21 | 北京小米移动软件有限公司 | 处理状态提示方法、装置以及计算机可读存储介质 |
CN107608652B (zh) * | 2017-08-28 | 2020-05-22 | 三星电子(中国)研发中心 | 一种语音控制图形界面的方法和装置 |
-
2018
- 2018-03-09 CN CN201810195553.5A patent/CN108683937B/zh active Active
- 2018-11-02 US US16/179,436 patent/US10971145B2/en active Active
- 2018-11-22 JP JP2018219135A patent/JP6713034B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US10971145B2 (en) | 2021-04-06 |
CN108683937B (zh) | 2020-01-21 |
JP2019161636A (ja) | 2019-09-19 |
CN108683937A (zh) | 2018-10-19 |
US20190279628A1 (en) | 2019-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6713034B2 (ja) | スマートテレビの音声インタラクティブフィードバック方法、システム及びコンピュータプログラム | |
JP6999594B2 (ja) | 映像再生方法及び装置 | |
US10249301B2 (en) | Method and system for speech recognition processing | |
CN109658932B (zh) | 一种设备控制方法、装置、设备及介质 | |
CN108012173B (zh) | 一种内容识别方法、装置、设备和计算机存储介质 | |
JP2019046468A (ja) | インターフェイススマートインタラクティブ制御方法、装置、システム及びプログラム | |
WO2020078300A1 (zh) | 一种终端投屏的控制方法和终端 | |
JP2020527753A (ja) | ビューに基づく音声インタラクション方法、装置、サーバ、端末及び媒体 | |
CN111327910A (zh) | 应用程序的操作控制方法、装置、设备及存储介质 | |
CN111539217B (zh) | 一种用于自然语言内容标题消歧的方法、设备和系统 | |
WO2019184498A1 (zh) | 视频交互方法、计算机设备及存储介质 | |
CN113157241A (zh) | 交互设备、交互装置及交互系统 | |
JP6944920B2 (ja) | スマートインタラクティブの処理方法、装置、設備及びコンピュータ記憶媒体 | |
JP6715307B2 (ja) | 設備の発見方法、装置、設備及びプログラム | |
WO2020007083A1 (zh) | 视频关联信息的处理方法、装置、电子设备及存储介质 | |
US20210193144A1 (en) | Electronic apparatus and control method thereof | |
CN117615172A (zh) | 视频流识别方法、装置、计算机设备及存储介质 | |
CN112450116A (zh) | 一种宠物管理方法、装置、系统、设备及存储介质 | |
KR20190115839A (ko) | 영상 콘텐츠 연동형 서비스 제공 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200413 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200518 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200602 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6713034 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |