JP6999594B2 - 映像再生方法及び装置 - Google Patents

映像再生方法及び装置 Download PDF

Info

Publication number
JP6999594B2
JP6999594B2 JP2019048239A JP2019048239A JP6999594B2 JP 6999594 B2 JP6999594 B2 JP 6999594B2 JP 2019048239 A JP2019048239 A JP 2019048239A JP 2019048239 A JP2019048239 A JP 2019048239A JP 6999594 B2 JP6999594 B2 JP 6999594B2
Authority
JP
Japan
Prior art keywords
video
time node
natural language
voice
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019048239A
Other languages
English (en)
Other versions
JP2020005248A (ja
Inventor
タン,ファン
ユェン,ポン
ユェン,ハイグァン
ウー,リィァンチォン
Original Assignee
バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
シャンハイ シャオドゥ テクノロジー カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド, シャンハイ シャオドゥ テクノロジー カンパニー リミテッド filed Critical バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
Publication of JP2020005248A publication Critical patent/JP2020005248A/ja
Application granted granted Critical
Publication of JP6999594B2 publication Critical patent/JP6999594B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8545Content authoring for generating interactive applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4333Processing operations in response to a pause request
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/239Interfacing the upstream path of the transmission network, e.g. prioritizing client content requests
    • H04N21/2393Interfacing the upstream path of the transmission network, e.g. prioritizing client content requests involving handling client requests
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4722End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6581Reference data, e.g. a movie identifier for ordering a movie or a product identifier in a home shopping application
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8547Content authoring involving timestamps for synchronizing content

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Transfer Between Computers (AREA)

Description

本発明の実施例は、コンピュータ技術の分野に関し、特に映像再生方法及び装置に関する。
人工知能(Artificial Intelligence)とは、英語ではAIと略される。それは、人間の知能をシミュレート、拡張、展開するための理論、方法、技術、及び応用システムを研究開発する新しい技術科学である。人工知能は、知能の本質を理解し、人間の知能と同じように反応できる新しいタイプの知能機械(スマートデバイスともいう)を生み出すことを試みるコンピュータサイエンスの一分野であり、ロボット、言語認識、画像認識、自然言語処理、及びエキスパートシステムなどの研究を含む。
スマートデバイスは、自然言語による対話でユーザと対話し、ユーザの音声入力を取得してサーバに報告し、サーバによって返された命令を受信して、映像再生、天気照会、日常管理などの対応する動作を実行することができる。
従来のスマートデバイスは、映像再生中において、ほとんど早送り、早戻し、再生、一時停止などの一般的な操作をサポートすることができる。
本発明の実施例は、映像再生方法及び装置を開示する。
第1の態様では、本発明の実施例は、スマートデバイスのための映像再生方法であって、タイムノードに関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、対象映像の再生を一時停止するステップであって、対象映像はスマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものであるステップと、タイムノードに対応する音声対話コンテンツを取得するための要求をサーバに送信するステップと、サーバから返された音声対話コンテンツを受信するステップと、受信した音声対話コンテンツを再生するステップと、を含むスマートデバイスのための映像再生方法を提供した。
いくつかの実施例では、該方法は、再生された音声対話コンテンツに対するユーザの音声フィードバック情報を受信するステップと、音声フィードバック情報が事前設定条件を満たすか否かを判定するステップと、音声フィードバック情報が事前設定条件を満たすと判定したことに応答して、対象映像を引き続き再生するステップと、を更に含む。
いくつかの実施例では、該方法は、音声フィードバック情報が事前設定条件を満たしていないと判定したことに応答して、事前設定動作を実行するステップを更に含む。
いくつかの実施例では、音声フィードバック情報が事前設定条件を満たすか否かを判定するステップは、音声フィードバック情報をサーバに送信して、サーバは音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置されることと、サーバから返された判定結果を受信することと、を含む。
いくつかの実施例では、サーバには映像集合が記憶され、映像集合内の映像は、タイムノードが関連付けられた少なくとも1つの画像フレームを含み、映像集合内の映像は、コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するステップと、オリジナル映像についてコンテンツプロバイダによって提出された少なくとも1つのタイムノード記述情報を取得するステップであって、タイムノード記述情報は、画像フレーム識別子と音声対話コンテンツとを含むステップと、少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付けて、該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作をトリガーするステップと、タイムノードが関連付けられたオリジナル映像を、映像集合内の映像として映像集合内に追加するステップと、によって生成される。
第2の態様では、本発明の実施例は、サーバのための映像再生方法であって、該方法は、スマートデバイスによって送信された音声対話コンテンツ取得要求を受信するステップであって、音声対話コンテンツ取得要求は、スマートデバイスによって、タイムノードに関連付けられた画像フレームまで対象映像が再生されたことを検出して、対象映像の再生を一時停止する場合に送信されたものであり、音声対話コンテンツ取得要求はタイムノードの識別子を含み、対象映像はスマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものであるステップと、タイムノードの識別子に対応する音声対話コンテンツを確定するステップと、スマートデバイスが受信された音声対話コンテンツを再生するように、確定された音声対話コンテンツをスマートデバイスに送信するステップと、を含むサーバのための映像再生方法を提供した。
いくつかの実施例では、該方法は、スマートデバイスが再生された音声対話コンテンツに対して送信した音声フィードバック情報を受信するステップと、
音声フィードバック情報が事前設定条件を満たすか否かを判定するステップと、判定結果をスマートデバイスに送信するステップと、を更に含む。
いくつかの実施例では、サーバには映像集合が記憶され、映像集合内の映像は、タイムノードが関連付けられた少なくとも1つの画像フレームを含み、方法は、更に、コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するステップと、オリジナル映像についてコンテンツプロバイダによって提出された少なくとも1つのタイムノード記述情報を取得するステップであって、タイムノード記述情報は、画像フレーム識別子と音声対話コンテンツとを含むステップと、少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付け、該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作を作動させるステップと、タイムノードが関連付けられたオリジナル映像を映像集合内に追加するステップと、を更に含む。
第3の態様では、本発明の実施例は、スマートデバイスのための映像再生装置であって、タイムノードに関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、対象映像の再生を一時停止するように配置される映像一時停止ユニットであって、対象映像はスマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものである映像一時停止ユニットと、タイムノードに対応する音声対話コンテンツ取得要求をサーバに送信するように配置される要求送信ユニットと、サーバから返された音声対話コンテンツを受信するように配置されるコンテンツ受信ユニットと、受信された音声対話コンテンツを再生するように配置されるコンテンツ再生ユニットと、を含むスマートデバイスのための映像再生装置を提供した。
いくつかの実施例では、装置は、再生された音声対話コンテンツに対するユーザの音声フィードバック情報を受信するように配置されるフィードバック情報受信ユニットと、音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置される条件判定ユニットと、音声フィードバック情報が事前設定条件を満たすと判定したことに応答して、対象映像を連続再生するように配置される映像再生ユニットと、を更に備える。
いくつかの実施例では、装置は、音声フィードバック情報が事前設定条件を満たしていないと判定したことに応答して、予め設定された動作を実行するように配置される動作実行ユニットを更に備える。
いくつかの実施例では、条件判定ユニットは、音声フィードバック情報をサーバに送信するように配置される情報送信モジュールであって、サーバは音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置される情報送信モジュールと、サーバから返された判定結果を受信する結果受信モジュールと、を備える。
いくつかの実施例では、サーバには映像集合が記憶され、映像集合内の映像は、タイムノードが関連付けられた少なくとも1つの画像フレームを含む。該映像集合の映像は、コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するステップと、オリジナル映像についてコンテンツプロバイダによって提出された少なくとも1つのタイムノード記述情報を取得するステップであって、タイムノード記述情報は、画像フレーム識別子と音声対話コンテンツとを含むステップと、少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付け、該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作を作動させるステップと、タイムノードが関連付けられたオリジナル映像を、映像集合内の映像として映像集合内に追加するステップと、によって生成される。
第4の態様では、本発明の実施例は、サーバのための映像再生装置であって、該装置は、スマートデバイスによって送信された音声対話コンテンツ取得要求を受信するように配置される要求受信ユニットであって、音声対話コンテンツ取得要求は、スマートデバイスによって、タイムノードと関連付けられた画像フレームまで対象映像が再生されたことを検出して、対象映像の再生を一時停止する場合に送信されたものであり、音声対話コンテンツ取得要求はタイムノードの識別子を含み、対象映像はスマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものである要求受信ユニットと、タイムノードの識別子に対応する音声対話コンテンツを確定するように配置されるコンテンツ確定ユニットと、スマートデバイスが受信された音声対話コンテンツを再生するように、確定された音声対話コンテンツをスマートデバイスに送信するように配置されるコンテンツ送信ユニットと、を備えるサーバのための映像再生装置を提供した。
いくつかの実施例では、装置は、再生された音声対話コンテンツについてスマートデバイスによって送信された音声フィードバック情報を受信するように配置される情報受信ユニットと、音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置される条件判定ユニットと、判定結果をマートデバイスに送信するように配置される結果送信ユニットと、を更に備える。
いくつかの実施例では、サーバには映像集合が記憶され、映像集合内の映像は、タイムノードが関連付けられた少なくとも1つの画像フレームを含む。装置は、コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するように配置される映像取得ユニットと、オリジナル映像についてコンテンツプロバイダによって提出された少なくとも1つのタイムノード記述情報を取得するノード情報取得ユニットであって、タイムノード記述情報は、画像フレーム識別子と音声対話コンテンツとを含むように配置されるノード情報取得ユニットと、少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付けて、該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作を作動させるように配置される関連付けユニットと、タイムノードが関連付けられたオリジナル映像を映像集合内に追加するように配置される映像追加ユニットと、更に備える。
第5の態様では、本発明の実施例は、電子機器であって、一つ以上のプロセッサと、一つ以上のプログラムが記憶される記憶装置と、を備え、一つ以上のプログラムが一つ以上のプロセッサによって実行されると、一つ以上のプロセッサに第1態様のいずれかの実施形態に記載の方法、又は第2態様のいずれかの実施形態に記載の方法を実現させる、電子機器を提供した。
第6の態様では、本発明の実施例は、コンピュータプログラムが記憶されるコンピュータ可読媒体であって、該コンピュータプログラムがプロセッサによって実行されると、第1態様のいずれかの実施形態に記載の方法、又は第2態様のいずれかの実施形態に記載の方法を実現する、コンピュータ可読媒体を提供した。
本発明の実施例によって提供される映像再生方法及び装置では、スマートデバイスは、タイムノードと関連付けられた画像フレームまで対象映像が再生されたことを検出して対象映像の再生を一時停止し、その後、音声対話コンテンツ取得要求をサーバに送信し、サーバから返された音声対話コンテンツを受信し、対話コンテンツを再生することにより、映像再生中におけるユーザとの対話型インタラクションが実現される。
本発明の他の特徴、目的及び利点は、以下の図面を参照してなされる非限定的な実施例に係る詳細な説明を読むことにより、より明らかになる。
本発明の一実施例を適用可能な例示的なシステムアーキテクチャを示す図である。 本発明に係るスマートデバイスに用いられる映像再生方法の一実施例を示すフローチャートである。 本発明に係るスマートデバイスに用いられる映像再生方法の一つの応用シナリオを示す概略図である。 本発明に係るスマートデバイスに用いられる映像再生方法の一つの応用シナリオを示す概略図である。 本発明に係るサーバに用いられる映像再生方法の一実施例を示すフローチャートである。 本発明に係るスマートデバイスに用いられる映像再生装置の一実施例を示す構造概略図である。 本発明に係るサーバに用いられる映像再生装置の一実施例を示す構造概略図である。 本発明の実施例を達成するための電子機器に適用されるコンピュータシステムの構造概略図である。
以下、図面及び実施形態を参照しながら本発明をより詳細に説明する。理解すべきことは、ここで説明する具体的な実施例は、関連する発明を説明するためのものに過ぎず、当該発明を限定するものではない。更に、説明の便宜上、図面には発明に関連する部分のみが示されている。
なお、本発明の実施例及び実施例における特徴は、矛盾を生じない限り、相互に組み合わせることができる。以下、図面及び実施例を参照しながら本発明を詳細に説明する。
図1は、本発明に係るスマートデバイスに用いられる映像再生方法、サーバに用いられる映像再生方法、スマートデバイスに用いられる映像再生装置又はサーバに用いられる映像再生装置を適用可能な実施例の例示的なシステムアーキテクチャ100を示している。
図1に示すように、システムアーキテクチャ100は、スマートデバイス101、102、103、ネットワーク104、及びサーバ105を含んでもよい。ネットワーク104は、スマートデバイス101、102、103及びサーバ105の間で通信リンクの媒体を提供するために使用される。ネットワーク104は、有線、無線通信リンク又は光ファイバケーブルなどの様々なタイプの接続を含んでもよい。
ユーザは、自然言語対話を通じてスマートデバイス101、102、103を操作して、ネットワーク104を介してサーバ105と対話して、メッセージなどを送受信することができる。スマートデバイス101、102、103には、映像再生アプリケーション、ウェブブラウザアプリケーション、ショッピングアプリケーション、検索アプリケーション、インスタントコミュニケーションツール、メールボックスクライアント、ソーシャルプラットフォームソフトウェアなどの様々な通信クライアントアプリケーションをインストールすることができる。
スマートデバイス101、102、103は、ハードウェアでもソフトウェアでもよい。スマートデバイス101、102、103がハードウェアである場合、ディスプレイを有するとともに対話型インタラクション及び映像再生をサポートする様々な電子機器であってもよく、スマートフォン、タブレットコンピュータ、スマートエアコン、スマート冷蔵庫、スマートテレビなどを含むが、これらに限定されない。スマートデバイス101、102、103がソフトウェアである場合、上記の電子機器に搭載されてもよい。それは、複数のソフトウェア又はソフトウェアモジュール(例えば、分散サービスを提供するためのもの)として実現されてもよく、又は単一のソフトウェア若しくはソフトウェアモジュールとして実現されてもよい。ここでは特に限定されない。
サーバ105は、様々なサービスを提供するサーバ、例えば、スマートデバイス101、102、103で再生される映像をサポートするバックエンドサーバであってもよい。バックエンドサーバは、受信した音声コンテンツ取得要求などのデータを解析処理し、その処理結果(例えば、音声対話コンテンツ)をスマートデバイスにフィードバックすることができる。
なお、本発明の実施例によって提供されるスマートデバイスに用いられる映像再生方法は、通常にスマートデバイス101、102、103によって実行され、これに応じて、スマートデバイスに用いられる映像再生装置は、通常にスマートデバイス101、102、103に配置される。 本発明の実施例によって提供されるサーバに用いられる映像再生方法は、通常にサーバ105によって実行され、これに応じて、サーバのための映像再生装置は、通常にサーバ105に配置される。
サーバ105は、ハードウェアでもソフトウェアでもよいことに留意されたい。サーバ105がハードウェアである場合、複数のサーバから構成される分散サーバクラスターとしても、単一のサーバとしても実現可能である。サーバがソフトウェアである場合、複数のソフトウェア又はソフトウェアモジュール(例えば、分散サービスを提供するためのもの)として実現されてもよく、又は単一のソフトウェア若しくはソフトウェアモジュールとして実現されてもよい。ここでは特に限定されない。
理解すべきことは、図1におけるスマートデバイス、ネットワーク及びサーバの数は例示的なものに過ぎない。必要に応じて、スマートデバイス、ネットワーク及びサーバの数を任意にかつ適切に加減してもよい。
次に、図2を参照し、本発明に係るスマートデバイスのための映像再生方法の一実施例のフロー200を示している。スマートデバイスのための映像再生方法は、次のステップを含む。
ステップ201:タイムノードに関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、対象映像の再生を一時停止する。
この実施例では、スマートデバイスに用いられる映像再生方法の実行主体(例えば、図1のスマートデバイス101、102、103)は、スマートデバイスで再生される対象映像がタイムノードに関連付けられる画像フレームまで再生されたか否かを検出することができる。もし肯定であれば、対象映像の再生を一時停止する。ただし、対象映像とは、スマートデバイスによって音声形式の映像再生音声命令(例えば、「消防車の手作りに関する映像を再生する」)が受信されたことに応答してサーバ(例えば、図1のサーバ105)から取得したものである。ここで、タイムノードは、ユーザとの音声対話を必要とする対象映像内の時刻(又は該時刻に対応する画像フレーム)を示すためのタグ又はマークであってもよい。音声対話は、例えば自然言語方式で対話することなど、スマート端末が音声の形でユーザと対話することを指してもよい。
一例として、対象映像である「消防車の手作りに関する映像」は、100個の画像フレームを含み、対象映像の第1の画像フレームから第35の画像フレームがヘッド部を作るためのデモンストレーションであり、対象映像のコンテンツプロバイダは、ユーザがヘッド部の製作を把握したか否かを確定するためには、対象映像の第35の画像フレームで音声対話をトリガーするためのタイムノードを設ける必要がある。タイムノードに関連付けられた画像フレーム(すなわち、第35の画像フレーム)まで対象映像が再生されると、スマートデバイスは、後述する音声対話動作をトリガし、対象映像である「消防車の手作りに関する映像」の再生を一時停止することができる。
ステップ202:タイムノードに対応する音声対話コンテンツの取得要求をサーバに送信する。
本実施例では、前記実行主体は、前記タイムノードに対応する音声対話コンテンツを取得するために、有線接続方式又は無線接続方式によって音声対話コンテンツ取得要求をサーバに送信することができる。ただし、音声対話コンテンツ取得要求は、前記タイムノードの識別子を含んでもよい。ここで、音声対話コンテンツとは、スマート端末がユーザと音声対話するコンテンツを意味し、例えば、「今言ったことを理解しましたか?」、「ヘッド部の作りにはいくつのステップが含まれますか?」などが挙げられる。
なお、前記無線接続方式は、3G(the 3rd generation)/4G(the 4th generation)/5G(the 5th generation)の通信接続、Wi-Fi(Wireless-Fidelity)接続、ブルートゥース接続、WiMAX(Worldwide Interoperability for Microwave Access)接続、Zigbee(Zigbeeプロトコルともいう)接続、UWB(Ultra Wideband)接続、及び現在知られているか又は将来開発される他の無線接続を含むことができるが、これらに限定されない。
ステップ203:サーバから返信された音声対話コンテンツを受信する。
本実施例では、前記実行主体は、サーバから返された音声対話コンテンツを受信することができる。ここで、音声対話コンテンツは、音声対話コンテンツ取得要求におけるタイムノードの識別子に従ってサーバによってローカルに又はリモートに取得されるものである。
ステップ204:受信した音声対話コンテンツを再生する。
本実施例では、前記実行主体は、ステップ203で受信した音声対話コンテンツを音声で再生することができる。例えば、スマートデバイスは、自然言語で会話するようにユーザに「今言ったことを理解しましたか?」と尋ねることができる。
本実施例のいくつかの所望による実施態様では、このスマートデバイスに用いられる映像再生方法は、更に以下のステップを含んでもよい。
先ずは、前記実行主体は、スマートデバイスのためにユーザによって再生された音声対話コンテンツの音声フィードバック情報を受信することができる。例えば、スマートデバイスは、音声対話コンテンツである「今言ったことを理解しましたか?」ということを再生する。ユーザは、「理解しました」と音声でフィードバックすることができる。
次に、前記実行主体は、受信した音声フィードバック情報が事前設定条件を満たすか否かを判定することができる。ここで、事前設定条件は、ユーザの音声フィードバック情報が所望の効果を達成したか否かを判定するために予め設定された条件をいう。「消防車の手作りに関する映像」である対象映像を例として、第35の画像フレームにおける音声対話について、事前設定条件とは、音声フィードバック情報において「理解」又は類似の意味を含む情報であってもよい。受信した音声フィードバック情報が「理解しました」であれば、受信した音声フィードバック情報が事前設定条件を満たすと判定することができる。受信した音声フィードバック情報が「理解していません」であれば、受信した音声フィードバック情報が事前設定条件を満たさないと判定することができる。
最後に、前記実行主体は、受信した音声フィードバック情報が事前設定条件を満たすか否かの判定結果に応じて対応する動作を実行することができる。
いくつかの例では、受信された音声情報(例えば、「理解しました」)が事前設定条件を満たす場合、前記実行本体は対象映像を連続再生することができる。
他のいくつかの例では、受信された音声情報(例えば、「理解していません」)が事前設定条件を満たさない場合に、前記実行主体は予め設定された動作を実行することができる。ここで、予め設定された動作は、ユーザの音声フィードバック情報が所望の効果を達成していない場合にスマートデバイスによって実行される動作を含んでもよい。例えば、ヘッド部を作るデモンストレーションなどを再び再生する。
上記実施形態では、受信された音声フィードバック情報が条件を満たすか否かをスマートデバイスによって判定することを説明したが、本発明はこれに限定されない。
本実施例のいくつかの所望による実施態様では、音声フィードバック情報が事前設定条件を満たすか否かを判定するステップは、音声フィードバック情報をサーバに送信して、サーバは音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置されることと、サーバから返された判定結果を受信することと、を含んでもよい。
本実施例のいくつかの所望による実施態様では、サーバには映像集合が記憶されてもよい。ここで、映像集合における映像のそれぞれは、タイムノードが関連付けられた少なくとも1つの画像フレームを含んでもよい。該映像集合の映像は、次のステップによって生成される。
先ずは、コンテンツプロバイダ(開発者ともいう)によってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得する。
次に、オリジナル映像についてコンテンツプロバイダによって提出された少なくとも1つのタイムノード記述情報を取得し、タイムノード記述情報は、画像フレーム識別子と音声対話コンテンツとを含む。一例として、オリジナル映像がアップロードされた後、コンテンツプロバイダに対してオリジナル映像編集インターフェースを提供してもよく、コンテンツプロバイダは、提供されたインターフェースを通じて、スマートデバイスがユーザと対話するために必要な画像フレームを選択して音声対話コンテンツを提供することが可能である。
そして、少なくとも1つのタイムノード記述情報内の各タイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し(例えば、タイムタグやタイムマークを作成する)、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付け、該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作をトリガーする。ここで、タイムノードと画像フレームとの関連付けは、タイムノードを画像フレーム(又は画像フレームの属性)に追加することでもよく、スマートデバイスが該画像フレームを通して対応するタイムノードを検出できる限り、画像フレームを実質的に変更しなくてもよい。本発明は、関連付けの方法について、特に限定しない。
最後に、タイムノードが関連付けられたオリジナル映像を、映像集合に追加して映像集合内の映像とする。
なお、上述した映像集合の映像生成ステップの実行主体は、音声対話コンテンツ取得要求を受信するサーバであってもよいし、他のサーバ(例えば、他のサーバによって前記映像集合を生成して、音声対話コンテンツ取得要求を受信するサーバに記憶する)であってもよい。
次に、図3A及び図3Bを参照し、本発明に係るスマートデバイスのための映像再生方法の一つの応用シナリオを示している。図3Aにおいて、先ずは、ユーザ301が「車の手作りに関する映像を再生する」という音声命令を発し、次に、スマートテレビ302がサーバ303に映像取得要求を送信し、サーバ303から返信された映像である「車の手作りに関する映像」を受信して再生する。図3Bにおいて、スマートデバイス302は、「車の手作りに関する映像」がタイムノードに関連付けられた画像フレーム304まで再生されたことが検出されると、「車の手作りに関する映像」の再生を一時停止し、音声対話コンテンツ取得要求をサーバ303に送信し、次に、スマートデバイス302は、サーバ303から返信された音声対話コンテンツを受信し、「子供たち、車のヘッド部の作りにはいくつのステップが含まれていますか?」という音声対話コンテンツをユーザ301に再生する。ユーザ301が上記の質問を聞いた後、「3つのステップがある。第1ステップ...、第2ステップ...、第3ステップ...」と答えることができ、ユーザの回答が事前設定されたステップポイントを含む場合、スマートデバイス302は、「素晴らしい答えです。引き続きご覧になってください」という音声ヒントを発することができ、「車の手作りに関する映像」を連続再生し、それによって映像再生中のスマートデバイスとユーザとの間の音声対話が実現される。
本発明の上述した実施例によって提供されたスマートデバイスに用いられる映像再生方法では、スマートデバイスは、タイムノードに関連付けられた画像フレームまで対象映像が再生されたことを検出して対象映像の再生を一時停止し、その後、音声対話コンテンツ取得要求をサーバに送信し、サーバから返された音声対話コンテンツを受信し、対話コンテンツを再生することにより、映像再生中におけるユーザとの対話型インタラクションが実現された。
次に、図4を参照し、本発明に係るサーバのための映像再生方法の一実施例のフロー400を示している。このサーバのための映像再生方法は、次のステップを含む。
ステップ401:スマートデバイスによって送信された音声対話コンテンツ取得要求を受信する。
本実施例では、サーバに用いられる映像再生方法の実行主体(例えば、図1のサーバ105)は、有線接続方式又は無線接続方式でスマートデバイス(例えば、図1のスマートデバイス101、102、103)によって送信された音声対話コンテンツ取得要求を受信することができる。音声対話コンテンツ取得要求は、スマートデバイスによってタイムノードと関連付けられた画像フレームまで対象映像が再生されたことを検出して、対象映像の再生を一時停止する場合に送信されたものである。音声対話コンテンツ取得要求は、タイムノードの識別子を含んでもよい。ここで、タイムノードは、ユーザとの音声対話を必要とする対象映像内の時刻(又は該時刻に対応する画像フレーム)を示すためのタグ又はマークであってもよい。対象映像とは、スマートデバイスによって音声形式の映像再生音声命令(例えば、「消防車の手作りに関する映像を再生する」)が受信されたことに応答してサーバから取得したものである。
ステップ402:タイムノードの識別子に対応する音声対話コンテンツを確定する。
本実施例では、前記実行主体は、ステップ401で受信した音声対話コンテンツ取得要求内の識別子に対応する音声対話コンテンツをローカル又はリモートで取得することができる。ここで、音声対話コンテンツとは、スマート端末がユーザと音声対話するコンテンツを意味し、例えば、「今言ったことを理解しましたか?」、「ヘッド部の作りにはいくつのステップが含まれていますか?」などが挙げられる。
ステップ403:確定された音声対話コンテンツをスマートデバイスに送信する。
本実施例では、前記実行主体は、ステップ402で確定された音声対話コンテンツをスマートデバイスに送信し、それによってスマートデバイスは受信した音声対話コンテンツを自然言語会話方式で再生できる。
本実施例のいくつかの所望による実施態様では、このサーバのための映像再生方法は、更に以下のステップを含んでもよい。
先ずは、前記実行主体は、再生された音声対話コンテンツについてスマートデバイスによって送信された音声フィードバック情報を受信することができる。ここで、音声フィードバック情報とは、ユーザがスマート端末によって再生された音声対話コンテンツについてフィードバックしたものである。例えば、スマートデバイスは、音声対話コンテンツである「今言ったことを理解しましたか?」ということを再生する。ユーザは、「理解しました」と音声でフィードバックすることができる。
次に、前記実行主体は、音声フィードバック情報が事前設定条件を満たすか否かを判定することができる。ここで、事前設定条件は、ユーザの音声フィードバック情報が所望の効果を達成したか否かを判定するために予め設定された条件をいう。例えば、事前設定条件は、「理解しました」又は同様の意味の情報であってもよい。受信した音声フィードバック情報が「理解しました」であれば、受信した音声フィードバック情報が事前設定条件を満たすと判定することができる。受信した音声フィードバック情報が「理解していません」であれば、受信した音声フィードバック情報が事前設定条件を満たさないと判定することができる。
最後に、前記実行主体は、判定結果をスマートデバイスに送信することができ、それによってスマートデバイスは、前記判定結果に従って対応する動作を実行することができる(例えば、対象映像を連続再生する)。
本実施例のいくつかの所望による実施態様では、サーバには映像集合が記憶されてもよい。ここで、映像集合における映像のそれぞれは、タイムノードが関連付けられた少なくとも1つの画像フレームを含んでもよい。このサーバのための映像再生方法は、次のステップを含んでもよい。
先ずは、前記実行主体は、コンテンツプロバイダ(開発者ともいう)によってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得することが可能である。
次に、前記実行主体は、オリジナル映像についてコンテンツプロバイダによって提出された、画像フレーム識別子と音声対話コンテンツとを含む少なくとも1つのタイムノード記述情報を取得することが可能である。一例として、オリジナル映像がアップロードされた後、コンテンツプロバイダに対してオリジナル映像編集インターフェースを提供してもよく、コンテンツプロバイダは、提供されたインターフェースを通じて、スマートデバイスがユーザと対話するために必要な画像フレームを選択して音声対話コンテンツを提供することが可能である。
そして、少なくとも1つのタイムノード記述情報内の各タイムノード記述情報について、前記実行主体は、そのタイムノード記述情報に対応するタイムノードを生成し(例えば、タイムタグやタイムマークを作成する)、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付けることが可能であり、それによって該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作がトリガーされる。
最後に、前記実行主体は、タイムノードが関連付けられたオリジナル映像を、映像集合内に追加することが可能である。
本発明の上述した実施例によって提供されたサーバのための映像再生方法によれば、スマートデバイスは、タイムノードと関連付けられた画像フレームまで対象映像が再生されたことを検出して対象映像の再生を一時停止した場合に送信された音声対話コンテンツ取得要求を受信し、その後、音声対話コンテンツ取得要求内のタイムノードの識別子に対応する音声対話コンテンツを確定し、確定された音声対話コンテンツをスマートデバイスに送信することによって、映像再生中におけるスマートデバイスとユーザとの対話型インタラクションが実現された。
更に図5を参照すると、図2に示された方法の実施態様として、本発明は、スマートデバイスのための映像再生装置の一実施例を提供し、この装置の実施例は、図2に示された方法の実施例に対応しており、該装置は、具体的にスマートデバイスに適用することができる。
図5に示すように、本実施例のスマートデバイスのための映像再生装置500は、映像一時停止ユニット501、要求送信ユニット502、コンテンツ受信ユニット503、及びコンテンツ再生ユニット504を含んでもよい。ここで、映像一時停止ユニット501は、タイムノードと関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、対象映像の再生を一時停止するように配置される映像一時停止ユニットであって、対象映像はスマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものである。要求送信ユニット502は、タイムノードに対応する音声対話コンテンツ取得要求をサーバに送信するように配置される。コンテンツ受信ユニット503は、サーバから返信された音声対話コンテンツを受信するように配置される。コンテンツ再生ユニット504は、受信された音声対話コンテンツを再生するように配置される。
本実施例では、スマートデバイスのための映像再生装置500の前記映像一時停止ユニット501は、スマートデバイス(例えば、図1のスマートデバイス101、102、103)で再生される対象映像がタイムノードに関連付けられる画像フレームまで再生されたか否かを検出することができる。もしそうであれば、対象映像の再生を一時停止する。ただし、対象映像とは、スマートデバイスによって音声形式の映像再生音声命令(例えば、「消防車の手作りに関する映像を再生する」)が受信されたことに応答してサーバ(例えば、図1のサーバ105)から取得したものである。ここで、タイムノードは、ユーザとの音声対話を必要とする対象映像内の時刻(又は該時刻に対応する画像フレーム)を示すためのタグ又はマークであってもよい。
本実施例では、前記要求送信ユニット502は、前記タイムノードに対応する音声対話コンテンツを取得するために、有線接続方式又は無線接続方式によって音声対話コンテンツ取得要求をサーバに送信することができる。ただし、音声対話コンテンツ取得要求は、前記タイムノードの識別子を含んでもよい。ここで、音声対話コンテンツとは、スマート端末がユーザと音声対話するコンテンツを意味し、例えば、「今言ったことを理解しましたか?」、「ヘッド部の作りにはいくつのステップが含まれますか?」などが挙げられる。
本実施例では、前記コンテンツ受信ユニット503は、サーバから返信された音声対話コンテンツを受信することができる。ここで、音声対話コンテンツは、音声対話コンテンツ取得要求の識別子に従ってサーバによってローカル又はリモートに取得されるものである。
本実施例では、前記コンテンツ再生ユニット504は、前記コンテンツ受信ユニット503によって受信された音声対話コンテンツを音声の形式で再生することができる。例えば、スマートデバイスは、自然言語で会話するようにユーザに「今言ったことを理解しましたか?」と尋ねることができる。
本実施例のいくつかの所望による実施態様では、該装置500は、フィードバック情報受信ユニット、条件判定ユニット、及び映像再生ユニットを更に含んでもよい。ここで、フィードバック情報受信ユニットは、再生された音声対話コンテンツに対するユーザの音声フィードバック情報を受信するように配置される。条件判定ユニットは、音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置される。映像再生ユニットは、音声フィードバック情報が事前設定条件を満たすと判定したことに応答して、対象映像を連続再生するように配置される。
本実施例のいくつかの所望による実施態様では、該装置500は、動作実行ユニットを更に含んでもよい。ここで、動作実行ユニットは、音声フィードバック情報が事前設定条件を満たしていないと判定したことに応答して、予め設定された動作を実行するように配置される。
本実施例のいくつかの所望による実施態様では、前記条件判定ユニットは情報送信モジュール及び結果受信モジュールを含んでもよい。ここで、情報送信モジュールは、音声フィードバック情報をサーバに送信するように配置される。サーバは、音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置される。結果受信モジュールは、サーバから返された判定結果を受信する。
本実施例のいくつかの所望による実施態様では、サーバには映像集合が記憶されてもよく、映像集合内のそれぞれの映像は、タイムノードが関連付けられた少なくとも1つの画像フレームを含んでもよい。該映像集合のそれぞれの映像は、コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するステップと、オリジナル映像についてコンテンツプロバイダによって提出された、画像フレーム識別子と音声対話コンテンツとを含む少なくとも1つのタイムノード記述情報を取得するステップと、少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付け、それによって該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作がトリガされるステップと、タイムノードが関連付けられたオリジナル映像を、映像集合内の映像として映像集合内に追加するステップと、によって生成されることができる。
本発明の上述した実施例によって提供されたスマートデバイスのための映像再生装置によれば、スマートデバイスは、タイムノードと関連付けられた画像フレームまで対象映像が再生されたことを検出したときに対象映像の再生を一時停止し、その後、音声対話コンテンツ取得要求をサーバに送信し、サーバから返された音声対話コンテンツを受信し、最後に対話コンテンツを再生することにより、映像再生中におけるユーザとの対話型インタラクションが実現された。
更に図6を参照すると、図4に示された方法の実施態様として、本発明は、サーバのための映像再生装置の一実施例を提供し、該装置の実施例は、図4に示された方法の実施例に対応しており、該装置は、具体的にサーバに適用することができる。
図6に示すように、本実施例のサーバに用いられる映像再生装置600は、要求受信ユニット601、コンテンツ確定ユニット602及びコンテンツ送信ユニット603を備える。要求受信ユニット601は、スマートデバイスによって送信された音声対話コンテンツ取得要求を受信するように配置される。音声対話コンテンツ取得要求は、スマートデバイスによって、タイムノードに関連付けられた画像フレームまで対象映像が再生されたことを検出して対象映像の再生を一時停止する場合に送信されたものであり、音声対話コンテンツ取得要求はタイムノードの識別子を含み、対象映像はスマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものである。コンテンツ確定ユニット602は、タイムノードの識別子に対応する音声対話コンテンツを確定するように配置される。コンテンツ送信ユニット603は、受信された音声対話コンテンツをスマートデバイスによって再生するように、確定された音声対話コンテンツをスマートデバイスに送信するように配置される。
本実施例では、サーバに用いられる映像再生装置600の前記要求受信ユニット601は、有線接続方式又は無線接続方式でスマートデバイス(例えば、図1のスマートデバイス101、102、103)によって送信された音声対話コンテンツ取得要求を受信することができる。ここで、音声対話コンテンツ取得要求は、スマートデバイスによってタイムノードと関連付けられた画像フレームまで対象映像が再生されたことを検出して対象映像の再生を一時停止する場合に送信されたものである。音声対話コンテンツ取得要求は、タイムノードの識別子を含んでもよい。ここで、タイムノードは、ユーザとの音声対話を必要とする対象映像内の時刻(又は該時刻に対応する画像フレーム)を示すためのタグ又はマークであってもよい。対象映像とは、スマートデバイスによって音声形式の映像再生音声命令(例えば、「消防車の手作りに関する映像を再生する」)が受信されたことに応答してサーバ(例えば、図1のサーバ105)から取得したものである。
本実施例では、サーバのための映像再生装置600の前記コンテンツ確定ユニット602は、前記要求受信ユニット601によって受信された音声対話コンテンツ取得要求内の識別子に対応する音声対話コンテンツをローカル又はリモートで取得することができる。ここで、音声対話コンテンツとは、スマート端末がユーザと音声対話するコンテンツを意味し、例えば、「今言ったことを理解しましたか?」、「ヘッド部の作りにはいくつのステップが含まれていますか?」などが挙げられる。
本実施例では、サーバのための映像再生装置600の前記コンテンツ送信ユニット603は、前記コンテンツ確定ユニット602によって確定された音声対話コンテンツをスマートデバイスに送信し、それによってスマートデバイスは受信した音声対話コンテンツを自然言語会話方式で再生できる。
本実施例のいくつかの所望による実施態様では、当該サーバのための映像再生装置600は、情報受信ユニット、条件判定ユニット、及び結果送信ユニットを更に含んでもよい。ここで、情報受信ユニットは、再生された音声対話コンテンツについてスマートデバイスによって送信された音声フィードバック情報を受信するように配置される。条件判定ユニットは、音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置される。結果送信ユニットは、判定結果をマートデバイスに送信するように配置される。
本実施例のいくつかの所望による実施態様では、サーバには映像集合が記憶されてもよく、映像集合内の映像は、タイムノードと関連付けられた少なくとも1つの画像フレームを含んでもよい。当該サーバのための映像再生装置600は、映像取得ユニットと、ノード情報取得ユニットと、関連付けユニットと、映像追加ユニットと、を更に備えてもよい。ここで、映像取得ユニットは、コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するように配置される。ノード情報取得ユニットは、オリジナル映像についてコンテンツプロバイダによって提出された、画像フレーム識別子と音声対話コンテンツとを含む少なくとも1つのタイムノード記述情報を取得するように配置される。関連付けユニットは、少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付け、それによって該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作をトリガするように配置される。映像追加ユニットは、タイムノードと関連付けられたオリジナル映像を映像集合内に追加するように配置される。
本発明の上述した実施例によって提供されたサーバのための映像再生装置によれば、スマートデバイスは、タイムノードと関連付けられた画像フレームまで対象映像が再生されたことを検出して対象映像の再生を一時停止した場合に送信された音声対話コンテンツ取得要求を受信し、その後、音声対話コンテンツ取得要求内のタイムノードの識別子に対応する音声対話コンテンツを確定し、確定された音声対話コンテンツをスマートデバイスに送信することによって、映像再生中におけるスマートデバイスとユーザとの対話型インタラクションが実現された。
以下、本発明の実施例を実現するための電子機器(例えば、図1に示すスマートデバイス101、102、103又はサーバ105)に適用されるコンピュータシステム700を示す構造概略図である図7を参照する。図7に示す電子機器は、一例に過ぎず、本発明の実施例の機能及び使用範囲を限定するものではない。
図7に示すように、コンピュータシステム700は、読み出し専用メモリ(ROM)702に記憶されているプログラム又は記憶部708からランダムアクセスメモリ(RAM)703にロードされたプログラムによって様々な適当な動作及び処理を実行することができる中央処理装置(CPU)701を一つ以上備える。RAM703には、システム700の動作に必要な様々なプログラム及びデータが更に記憶されている。CPU701、ROM702及びRAM703は、バス704を介して互いに接続されている。入力/出力(I/O)インターフェース705もバス704に接続されている。
マイクロホンなどを含む入力部706、有機発光ダイオード(OLED)ディスプレイ、液晶ディスプレイ(LCD)など、及びスピーカなどを含む出力部707、ハードディスクなどを含む記憶部708、並びにLANカード、モデムなどを含むネットワークインターフェースカードの通信部709は、I/Oインターフェース705に接続されている。通信部709は、例えばインターネットのようなネットワークを介して通信処理を実行する。ドライバ710は、必要に応じてI/Oインターフェース705に接続される。リムーバブルメディア711は、例えば、マグネチックディスク、光ディスク、光磁気ディスク、半導体メモリなどのようなものであり、必要に応じてドライバ710に取り付けられ、したがって、リムーバブルメディア711から読み出されたコンピュータプログラムが必要に応じて記憶部708にインストールされる。
特に、本発明の実施例によれば、上記のフローチャートを参照しながら記載されたプロセスは、コンピュータのソフトウェアプログラムとして実現されてもよい。例えば、本発明の実施例は、コンピュータ可読媒体に具現化されるコンピュータプログラムを含むコンピュータプログラム製品を備え、該コンピュータプログラムは、フローチャートで示される方法を実行するためのプログラムコードを含む。このような実施例では、該コンピュータプログラムは、通信部709を介してネットワークからダウンロードされてインストールされてもよく、及び/又はリムーバブルメディア711からインストールされてもよい。該コンピュータプログラムが中央処理装置(CPU)701によって実行されるとき、本発明の方法で限定された上記の機能が実行される。
注意すべきのは、本発明の前記コンピュータ可読媒体は、コンピュータ可読信号媒体又はコンピュータ可読記憶媒体、又はこれらの任意の組み合わせであってもよい。コンピュータ可読記憶媒体は、例えば、電子、磁気、光学、電磁気、赤外線、又は半導体システム、装置又はデバイス、又はこれらの任意の組み合わせであることができるが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例は、一本以上の導線を有する電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能プログラマブル読み出し専用メモリ(EPROM又はフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスク読み出し専用メモリ(CD-ROM)、光メモリ、磁気メモリ、又はこれらの任意の適切な組み合わせを含むことができるが、これらに限定されない。本発明において、コンピュータ可読記憶媒体は、命令実行システム、装置又はデバイスによって使用可能な、又はそれらに組み込まれて使用可能なプログラムを包含又は記憶する任意の有形の媒体であってもよい。本発明において、コンピュータ可読信号媒体は、ベースバンド内で、又はキャリアの一部として伝搬される、コンピュータ可読プログラムコードが担持されたデータ信号を含んでもよい。このような伝搬されたデータ信号は、様々な形態をとることができ、電磁信号、光信号、又はこれらの任意の適切な組み合わせを含むことができるがこれらに限定されない。コンピュータ可読信号媒体は、更にコンピュータ可読記憶媒体以外の任意のコンピュータ可読媒体であってもよい。該コンピュータ可読媒体は、命令実行システム、装置、又はデバイスによって使用されるか、又はそれらに組み込まれて使用されるプログラムを、送信、伝搬又は転送することができる。コンピュータ可読媒体に含まれるプログラムコードは任意の適切な媒体で送信することができ、無線、有線、光ケーブル、RFなど、又はこれらの任意の適切な組み合わせを含むがこれらに限定されない。
本発明の動作を実行するためのコンピュータプログラムコードは、1種以上のプログラミング言語、又はそれらの組み合わせで作成されることができ、前記プログラミング言語は、Java、Smalltalk、C++などのオブジェクト指向プログラミング言語と、「C」言語又は同様のプログラミング言語などの従来の手続き型プログラミング言語とを含む。プログラムコードは、完全にユーザのコンピュータ上で実行され、部分的にユーザのコンピュータ上で実行され、独立したソフトウェアパッケージとして実行され、一部がユーザのコンピュータ上で一部がリモートコンピュータ上で実行され、又は完全にリモートコンピュータ又はサーバ上で実行されてもよい。リモートコンピュータに関わる場合、リモートコンピュータは、ローカルエリアネットワーク(LAN)又はワイドエリアネットワーク(WAN)を含む任意の種類のネットワークを介してユーザのコンピュータに接続されることができ、又は外部のコンピュータに接続されることができる(例えばインターネットサービスプロバイダによりインターネットで接続される)。
図面におけるフローチャート及びブロック図は、本発明の各実施例に係るシステム、方法及びコンピュータプログラム製品により実現可能なアーキテクチャ、機能及び操作を示す。ここで、フローチャート又はブロック図における各枠は、1つのモジュール、プログラムセグメント又はコードの一部を表してもよく、該モジュール、プログラムセグメント、又はコードの一部は、規定されたロジック機能を達成するための1つ以上の実行可能な命令を含む。なお、いくつかの代替実施態様において、枠内に示された機能は、図面に示された順番とは異なるもので実行されてもよい。例えば、連続して示された2つの枠は、実際には関連する機能に応じて、ほぼ並行に実行されてもよく、逆の順番で実行されてもよい。なお、ブロック図及び/又はフローチャートにおける各枠、並びに、ブロック図及び/又はフローチャートにおける枠の組み合わせは、規定された機能又は動作を実行する、ハードウェアに基づく専用システムで実現されてもよく、又は、専用ハードウェアとコンピュータ命令との組み合わせで実行されてもよい。
本発明の実施例に記載されたユニットは、ソフトウェアで実現されてもよく、ハードウェアで実現されてもよい。記載されたユニットは、プロセッサに設定されてもよく、例えば、「プロセッサは、映像一時停止ユニットと、要求送信ユニットと、コンテンツ受信ユニットと、コンテンツ再生ユニットとを備える」ように記載されてもよい。ここで、これらのユニットの名称は、ある場合において当該ユニット自体を限定するものではなく、例えば、映像一時停止ユニットは、「タイムノードと関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、対象映像の再生を一時停止するユニット」として記載されてもよい。
一方、本発明は、コンピュータ可読媒体を更に提供し、該コンピュータ可読媒体は、前記実施例に記載されたスマート端末又はサーバに含まれるものであってもよく、独立に存在して該スマート端末又はサーバに組み立てられていないものであってもよい。前記コンピュータ可読媒体には一つ以上のプログラムが担持され、上述した一つ以上のプログラムが該スマート端末によって実行されると、該スマート端末は、タイムノードと関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、対象映像の再生を一時停止するステップであって、対象映像はスマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものであるステップと、タイムノードに対応する音声対話コンテンツを取得するための要求をサーバに送信するステップと、サーバから返された音声対話コンテンツを受信するステップと、受信した音声対話コンテンツを再生するステップと、を行う。上述した一つ以上のプログラムが該サーバによって実行されると、該サーバは、スマートデバイスによって送信された音声対話コンテンツ取得要求を受信するステップであって、音声対話コンテンツ取得要求は、スマートデバイスによって、タイムノードと関連付けられた画像フレームまで対象映像が再生されたことを検出して、対象映像の再生を一時停止する場合に送信されたものであり、音声対話コンテンツ取得要求はタイムノードの識別子を含み、対象映像はスマートデバイスによって音声形式の映像再生音声命令の受信に応答してサーバから取得したものであるステップと、タイムノードの識別子に対応する音声対話コンテンツを確定するステップと、受信された音声対話コンテンツをスマートデバイスによって再生するように、確定された音声対話コンテンツをスマートデバイスに送信するステップと、を行う。
以上の記載は、本発明の好ましい実施例、及び使用された技術的原理の説明に過ぎない。本発明に係る発明の範囲が、上記の技術的特徴の特定な組み合わせからなる技術案に限定されることではなく、上記の本発明の趣旨を逸脱しない範囲で、上記の技術的特徴又はそれらの同等の特徴を任意に組み合わせたものからなる他の技術案も含むべきであることを、当業者は理解すべきである。例えば、上記の特徴と、本発明に開示された類似の機能を持っている技術的特徴(これらに限定されていない)とを互いに置き換えてなる技術案が挙げられる。
なお、出願当初の特許請求の範囲の記載は以下の通りである。
請求項1:
スマートデバイスに用いられる映像再生方法であって、
タイムノードに関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、前記対象映像の再生を一時停止するステップであって、前記対象映像は、前記スマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものであるステップと、
前記タイムノードに対応する音声対話コンテンツを取得するための要求を前記サーバに送信するステップと、
前記サーバから返された音声対話コンテンツを受信するステップと、
受信した音声対話コンテンツを再生するステップと、を含む、
スマートデバイスに用いられる映像再生方法。
請求項2:
前記方法は、
再生された音声対話コンテンツに対するユーザの音声フィードバック情報を受信するステップと、
前記音声フィードバック情報が事前設定条件を満たすか否かを判定するステップと、
前記音声フィードバック情報が前記事前設定条件を満たすと判定したことに応答して、前記対象映像を引き続き再生するステップと、を更に含む、
請求項1に記載の方法。
請求項3:
前記方法は、前記音声フィードバック情報が前記事前設定条件を満たしていないと判定したことに応答して、事前設定動作を実行するステップを更に含む、
請求項2に記載の方法。
請求項4:
前記音声フィードバック情報が事前設定条件を満たすか否かを判定するステップは、
前記音声フィードバック情報を前記サーバに送信して、前記サーバは前記音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置されることと、
前記サーバから返された判定結果を受信することと、を含む、
請求項2に記載の方法。
請求項5:
前記サーバには映像集合が記憶され、映像集合内の映像は、タイムノードが関連付けられた少なくとも1つの画像フレームを含み、映像集合の映像は、
コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するステップと、
前記オリジナル映像について前記コンテンツプロバイダによって提出された少なくとも1つのタイムノード記述情報を取得するステップであって、タイムノード記述情報は、画像フレーム識別子と音声対話コンテンツとを含むステップと、
前記少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付けて、該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作をトリガーするステップと、
タイムノードが関連付けられたオリジナル映像を、映像集合に映像集合内の映像として追加するステップと、によって生成される、
請求項1~4のいずれか1項に記載の方法。
請求項6:
サーバに用いられる映像再生方法であって、
スマートデバイスによって送信された音声対話コンテンツ取得要求を受信するステップであって、前記音声対話コンテンツ取得要求は、前記スマートデバイスによって、タイムノードに関連付けられる画像フレームまで対象映像が再生されたことを検出して前記対象映像の再生を一時停止する場合に送信されたものであり、前記音声対話コンテンツ取得要求は前記タイムノードの識別子を含み、前記対象映像は前記スマートデバイスによって音声形式の映像再生音声命令の受信に応答して前記サーバから取得したものであるステップと、
前記タイムノードの識別子に対応する音声対話コンテンツを確定するステップと、
前記スマートデバイスが受信された音声対話コンテンツを再生するように、確定された音声対話コンテンツを前記スマートデバイスに送信するステップと、を含む、
サーバに用いられる映像再生方法。
請求項7:
前記方法は、
前記スマートデバイスが再生された音声対話コンテンツに対して送信した音声フィードバック情報を受信するステップと、
前記音声フィードバック情報が事前設定条件を満たすか否かを判定するステップと、
判定結果を前記スマートデバイスに送信するステップと、を更に含む、
請求項6に記載の方法。
請求項8:
前記サーバには映像集合が記憶され、映像集合内の映像は、タイムノードが関連付けられた少なくとも1つの画像フレームを含み、
前記方法は、更に、
コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するステップと、
前記オリジナル映像について前記コンテンツプロバイダによって提出された少なくとも1つのタイムノード記述情報を取得するステップであって、タイムノード記述情報は、画像フレーム識別子と音声対話コンテンツとを含むステップと、
前記少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付けて、該画像フレームが再生されるときに、該タイムノード記述情報内の音声対話コンテンツを取得するための動作をトリガーするステップと、
タイムノードが関連付けられたオリジナル映像を、映像集合内に追加するステップと、を含む、
請求項6~7のいずれか1項に記載の方法。
請求項9:
スマートデバイスのための映像再生装置であって、
タイムノードに関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、前記対象映像の再生を一時停止するように配置される映像一時停止ユニットであって、前記対象映像は前記スマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものである映像一時停止ユニットと、
前記タイムノードに対応する音声対話コンテンツを取得するための要求を前記サーバに送信するように配置される要求送信ユニットと、
前記サーバから返された音声対話コンテンツを受信するように配置されるコンテンツ受信ユニットと、
受信された音声対話コンテンツを再生するように配置されるコンテンツ再生ユニットと、を含む、
スマートデバイスのための映像再生装置。
請求項10:
サーバに用いられる映像再生装置であって、
スマートデバイスによって送信された音声対話コンテンツ取得要求を受信するように配置される要求受信ユニットであって、前記音声対話コンテンツ取得要求は、前記スマートデバイスによって、タイムノードに関連付けられた画像フレームまで対象映像が再生されたことを検出して、前記対象映像の再生を一時停止する場合に送信されたものであり、前記音声対話コンテンツ取得要求は前記タイムノードの識別子を含み、前記対象映像は前記スマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答して前記サーバから取得したものである要求受信ユニットと、
前記タイムノードの識別子に対応する音声対話コンテンツを確定するように配置されるコンテンツ確定ユニットと、
前記スマートデバイスが受信された音声対話コンテンツを再生するように、確定された音声対話コンテンツを前記スマートデバイスに送信するように配置されるコンテンツ送信ユニットと、を含む、
サーバに用いられる映像再生装置。
請求項11:
電子機器であって、
一つ以上のプロセッサと、
一つ以上のプログラムが記憶される記憶装置と、を備え、
前記一つ以上のプログラムが前記一つ以上のプロセッサによって実行されると、前記一つ以上のプロセッサに請求項1~5のいずれか一項に記載の方法、又は請求項6~8のいずれか一項に記載の方法を実現させる、
電子機器。
請求項12:
コンピュータプログラムが記憶されるコンピュータ可読媒体であって、
前記コンピュータプログラムがプロセッサによって実行されると、請求項1~5のいずれか一項に記載の方法、又は請求項6~8のいずれか一項に記載の方法を実現する、
コンピュータ可読媒体。

Claims (12)

  1. スマートデバイスに用いられる映像再生方法であって、
    タイムノードに関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、前記対象映像の再生を一時停止するステップであって、前記対象映像は、前記スマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものであるステップと、
    前記タイムノードに対応する自然言語による音声対話コンテンツを取得するための要求を前記サーバに送信するステップと、
    前記サーバから返された自然言語による音声対話コンテンツを受信するステップと、
    受信した自然言語による音声対話コンテンツを再生するステップと、
    再生された自然言語による音声対話コンテンツに対するユーザの自然言語による音声フィードバック情報を受信するステップと、
    前記自然言語による音声フィードバック情報が事前設定条件を満たすか否かを判定するステップであって、前記事前設定条件は、前記自然言語による音声フィードバック情報の結果がユーザの予期した効果に達したものであるか否かを判定するためのキーワードを含む、判定するステップと、
    前記自然言語による音声フィードバック情報の結果が前記事前設定条件を満たしていないと判定したことに応答して、前記対象映像における前記音声対話コンテンツに対応する映像セグメント再び再生するステップと
    を含む、スマートデバイスに用いられる映像再生方法。
  2. 記自然言語による音声フィードバック情報の結果が前記事前設定条件を満たしていと判定したことに応答して、前記対象映像を引き続き再生するステップを更に含む、請求項1に記載の方法。
  3. 前記自然言語による音声フィードバック情報が事前設定条件を満たすか否かを判定するステップは、
    前記自然言語による音声フィードバック情報を前記サーバに送信して、前記サーバは前記自然言語による音声フィードバック情報が事前設定条件を満たすか否かを判定するように配置されることと、
    前記サーバから返された判定結果を受信することと
    を含む、請求項1に記載の方法。
  4. 前記サーバには映像集合が記憶され、前記映像集合内の映像は、タイムノードが関連付けられた少なくとも1つの画像フレームを含み、
    前記映像集合の映像は、
    コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するステップと、
    前記オリジナル映像について前記コンテンツプロバイダによって提出された少なくとも1つのタイムノード記述情報を取得するステップであって、タイムノード記述情報は、画像フレーム識別子と、自然言語による音声対話コンテンツとを含むステップと、
    前記少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付けて、該画像フレームが再生されるときに、該タイムノード記述情報内の自然言語による音声対話コンテンツを取得するための動作をトリガーするステップと、
    タイムノードが関連付けられたオリジナル映像を、映像集合に映像集合内の映像として追加するステップと
    によって生成される、請求項1~3のいずれか1項に記載の方法。
  5. サーバに用いられる映像再生方法であって、
    スマートデバイスによって送信された音声対話コンテンツ取得要求を受信するステップであって、前記音声対話コンテンツ取得要求は、前記スマートデバイスによって、タイムノードに関連付けられる画像フレームまで対象映像が再生されたことを検出して前記対象映像の再生を一時停止する場合に送信されたものであり、前記音声対話コンテンツ取得要求は前記タイムノードの識別子を含み、前記対象映像は前記スマートデバイスによって音声形式の映像再生音声命令の受信に応答して前記サーバから取得したものであるステップと、
    前記タイムノードの識別子に対応する自然言語による音声対話コンテンツを確定するステップと、
    前記スマートデバイスが受信された自然言語による音声対話コンテンツを再生するように、確定された自然言語による音声対話コンテンツを前記スマートデバイスに送信するステップと、
    前記スマートデバイスが再生された自然言語による音声対話コンテンツに対して送信した自然言語による音声フィードバック情報を受信するステップと、
    前記自然言語による音声フィードバック情報が事前設定条件を満たすか否かを判定するステップであって、前記事前設定条件は、前記自然言語による音声フィードバック情報の結果がユーザの予期した効果に達したものであるか否かを判定するためのキーワードを含む、判定するステップと、
    判定結果を前記スマートデバイスに送信して、前記スマートデバイスは、前記自然言語による音声フィードバック情報が前記事前設定条件を満たしていないと判定したことに応答して、前記対象映像における前記音声対話コンテンツに対応する映像セグメントを再び再生するようにするステップと
    を含む、サーバに用いられる映像再生方法。
  6. 前記サーバには映像集合が記憶され、前記映像集合内の映像は、タイムノードが関連付けられた少なくとも1つの画像フレームを含み、
    前記方法は、
    コンテンツプロバイダによってアップロードされた、少なくとも1つの画像フレームを含むオリジナル映像を取得するステップと、
    前記オリジナル映像について前記コンテンツプロバイダによって提出された少なくとも1つのタイムノード記述情報を取得するステップであって、タイムノード記述情報は、画像フレーム識別子と、自然言語による音声対話コンテンツとを含むステップと、
    前記少なくとも1つのタイムノード記述情報内のタイムノード記述情報について、そのタイムノード記述情報に対応するタイムノードを生成し、生成されたタイムノードを該タイムノード記述情報内の画像フレーム識別子によって表される画像フレームに関連付けて、該画像フレームが再生されるときに、該タイムノード記述情報内の自然言語による音声対話コンテンツを取得するための動作をトリガーするステップと、
    タイムノードが関連付けられたオリジナル映像を、映像集合内に追加するステップと
    を更に含む、請求項5に記載の方法。
  7. スマートデバイスのための映像再生装置であって、
    タイムノードに関連付けられた画像フレームまで対象映像が再生されたことの検出に応答して、前記対象映像の再生を一時停止するように配置される映像一時停止ユニットであって、前記対象映像は前記スマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答してサーバから取得したものである映像一時停止ユニットと、
    前記タイムノードに対応する自然言語による音声対話コンテンツを取得するための要求を前記サーバに送信するように配置される要求送信ユニットと、
    前記サーバから返された自然言語による音声対話コンテンツを受信するように配置されるコンテンツ受信ユニットと、
    受信された自然言語による音声対話コンテンツを再生するように配置されるコンテンツ再生ユニットと、
    再生された自然言語による音声対話コンテンツに対するユーザの自然言語による音声フィードバック情報を受信するフィードバック情報受信ユニットと、
    前記自然言語による音声フィードバック情報が事前設定条件を満たすか否かを判定する条件判定ユニットであって、前記事前設定条件は、前記自然言語による音声フィードバック情報の結果がユーザの予期した効果に達したものであるか否かを判定するためのキーワードを含む、条件判定ユニットと、
    前記自然言語による音声フィードバック情報の結果が前記事前設定条件を満たしていないと判定したことに応答して、前記対象映像における前記音声対話コンテンツに対応する映像セグメント再び再生する映像再生ユニットと
    を含む、スマートデバイスのための映像再生装置。
  8. 前記映像再生ユニットはさらに、前記自然言語による音声フィードバック情報の結果が前記事前設定条件を満たしていると判定したことに応答して、前記対象映像を引き続き再生するように構成される、請求項7に記載の装置。
  9. 前記条件判定ユニットは、
    前記自然言語による音声フィードバック情報をサーバに送信し、前記サーバにより前記自然言語による音声フィードバック情報が前記事前設定条件を満たすか否かを判定させる、情報送信モジュールと、
    前記サーバから、前記自然言語による音声フィードバック情報が前記事前設定条件を満たすか否かの判定結果を受信する結果受信モジュールと
    を含む、請求項7に記載の装置。
  10. サーバに用いられる映像再生装置であって、
    スマートデバイスによって送信された音声対話コンテンツ取得要求を受信するように配置される要求受信ユニットであって、前記音声対話コンテンツ取得要求は、前記スマートデバイスによって、タイムノードに関連付けられた画像フレームまで対象映像が再生されたことを検出して、前記対象映像の再生を一時停止する場合に送信されたものであり、前記音声対話コンテンツ取得要求は前記タイムノードの識別子を含み、前記対象映像は前記スマートデバイスによって音声形式の映像再生音声命令が受信されたことに応答して前記サーバから取得したものである要求受信ユニットと、
    前記タイムノードの識別子に対応する自然言語による音声対話コンテンツを確定するように配置されるコンテンツ確定ユニットと、
    前記スマートデバイスが受信された自然言語による音声対話コンテンツを再生するように、確定された自然言語による音声対話コンテンツを前記スマートデバイスに送信するように配置されるコンテンツ送信ユニットと、
    再生された自然言語による音声対話コンテンツについて前記スマートデバイスによって送信されたユーザの自然言語による音声フィードバック情報を受信する情報受信ユニットと、
    前記自然言語による音声フィードバック情報が事前設定条件を満たすか否かを判定する条件判定ユニットであって、前記事前設定条件は、前記自然言語による音声フィードバック情報の結果がユーザの予期した効果に達したものであるか否かを判定するためのキーワードを含む、条件判定ユニットと、
    前記自然言語による音声フィードバック情報が前記事前設定条件を満たすか否かについての判定結果を前記スマートデバイスに送信して、前記スマートデバイスは、前記自然言語による音声フィードバック情報が前記事前設定条件を満たしていないと判定したことに応答して、前記対象映像における前記音声対話コンテンツに対応する映像セグメントを再び再生するようにする結果送信ユニットと
    を含む、サーバに用いられる映像再生装置。
  11. 電子機器であって、
    一つ以上のプロセッサと、
    一つ以上のプログラムが記憶される記憶装置と
    を備え、
    前記一つ以上のプログラムが前記一つ以上のプロセッサによって実行されると、前記一つ以上のプロセッサに請求項1~6のいずれか一項に記載の方法を実現させる、電子機器。
  12. コンピュータプログラムが記憶されるコンピュータ可読媒体であって、
    前記コンピュータプログラムがプロセッサによって実行されると、請求項1~6のいずれか一項に記載の方法を実現する、コンピュータ可読媒体。
JP2019048239A 2018-06-29 2019-03-15 映像再生方法及び装置 Active JP6999594B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810714342.8A CN108769745A (zh) 2018-06-29 2018-06-29 视频播放方法和装置
CN201810714342.8 2018-06-29

Publications (2)

Publication Number Publication Date
JP2020005248A JP2020005248A (ja) 2020-01-09
JP6999594B2 true JP6999594B2 (ja) 2022-01-18

Family

ID=63975671

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019048239A Active JP6999594B2 (ja) 2018-06-29 2019-03-15 映像再生方法及び装置

Country Status (3)

Country Link
US (1) US20200007926A1 (ja)
JP (1) JP6999594B2 (ja)
CN (1) CN108769745A (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109951743A (zh) * 2019-03-29 2019-06-28 上海哔哩哔哩科技有限公司 弹幕信息处理方法、系统及计算机设备
CN109889921B (zh) * 2019-04-02 2022-03-01 杭州蓦然认知科技有限公司 一种具备交互功能的音视频创建、播放方法及装置
CN110297940A (zh) * 2019-06-13 2019-10-01 百度在线网络技术(北京)有限公司 播放处理方法、装置、设备和存储介质
US11204737B2 (en) 2019-11-11 2021-12-21 Sonos, Inc. Playback queues for shared experiences
US11636855B2 (en) 2019-11-11 2023-04-25 Sonos, Inc. Media content based on operational data
CN111177453B (zh) * 2020-01-07 2023-11-14 百度在线网络技术(北京)有限公司 控制音频播放的方法、装置、设备及计算机可读存储介质
CN111212311A (zh) * 2020-01-13 2020-05-29 四川长虹电器股份有限公司 一种语音交互视频的生成及播放方法
CN111464861B (zh) * 2020-03-06 2022-06-17 深圳千舟云格科技有限公司 一种交互方法及交互系统
CN111462744B (zh) * 2020-04-02 2024-01-30 深圳创维-Rgb电子有限公司 一种语音交互方法、装置、电子设备及存储介质
CA3176129C (en) 2020-04-21 2023-10-31 Ryan Taylor Priority media content
CN111818388A (zh) * 2020-05-27 2020-10-23 深圳壹账通智能科技有限公司 多进程访问的视频播放方法、装置、设备及存储介质
CN111698566A (zh) * 2020-06-04 2020-09-22 北京奇艺世纪科技有限公司 视频播放方法、装置、电子设备及存储介质
CN112040263A (zh) * 2020-08-31 2020-12-04 腾讯科技(深圳)有限公司 视频处理方法、视频播放方法、装置、存储介质和设备
CN112102449B (zh) * 2020-09-14 2024-05-03 北京百度网讯科技有限公司 虚拟人物的生成方法、展示方法及装置、设备和介质
CN113542797A (zh) * 2020-09-18 2021-10-22 腾讯科技(深圳)有限公司 视频播放中的互动方法、装置及计算机可读存储介质
CN113301395B (zh) * 2021-04-30 2023-07-07 当趣网络科技(杭州)有限公司 在视频播放状态下结合用户等级的语音搜索方法
CN115499697B (zh) * 2021-06-17 2023-07-07 福建省天奕网络科技有限公司 一种视频轮播切换方法及终端
CN113873278B (zh) * 2021-09-26 2024-01-23 北京奇艺世纪科技有限公司 播放内容审核方法、装置及电子设备
CN114191824A (zh) * 2021-11-30 2022-03-18 上海乐畅信息技术有限公司 一种向用户发送好友召回信息的方法与设备
CN114245227B (zh) * 2021-12-24 2023-12-15 阿维塔科技(重庆)有限公司 一种车辆环境控制方法、装置及计算机可读存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001249609A (ja) 2000-03-06 2001-09-14 Sony Corp 教育・訓練装置
JP2005284181A (ja) 2004-03-30 2005-10-13 Toshiba Corp 学習支援方法、学習支援システムおよび学習支援プログラム
US20080162471A1 (en) 2005-01-24 2008-07-03 Bernard David E Multimodal natural language query system for processing and analyzing voice and proximity-based queries
JP2008533505A (ja) 2005-01-28 2008-08-21 ブレイクスルー パフォーマンス テクノロジーズ エルエルシー コンピュータ制御の双方向トレーニングのためのシステムおよび方法
US20140026048A1 (en) 2012-07-16 2014-01-23 Questionmine, LLC Apparatus, method, and computer program product for synchronizing interactive content with multimedia
CN104134334A (zh) 2014-08-04 2014-11-05 张慧燕 测试装置及测试系统
CN104216990A (zh) 2014-09-09 2014-12-17 科大讯飞股份有限公司 视频广告播放方法及系统
US20150331665A1 (en) 2014-05-13 2015-11-19 Panasonic Intellectual Property Corporation Of America Information provision method using voice recognition function and control method for device
US20170329572A1 (en) 2016-05-10 2017-11-16 Google Inc. Media Transfer Among Media Output Devices
US20180070143A1 (en) 2016-09-02 2018-03-08 Sony Corporation System and method for optimized and efficient interactive experience
CN108024139A (zh) 2017-12-08 2018-05-11 广州视源电子科技股份有限公司 网络视频课件的播放方法、装置、终端设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100083324A1 (en) * 2008-09-30 2010-04-01 Microsoft Corporation Synchronized Video Playback Among Multiple Users Across A Network
CN106200886A (zh) * 2015-04-30 2016-12-07 包伯瑜 一种基于语言交互操控的移动智能玩具及玩具使用方法
CN105139701A (zh) * 2015-09-16 2015-12-09 华中师范大学 一种互动式幼儿教学系统
CN105847998A (zh) * 2016-03-28 2016-08-10 乐视控股(北京)有限公司 一种视频播放方法、播放终端及媒体服务器
CN106375828A (zh) * 2016-08-30 2017-02-01 胡峰 一种基于人工智能的人机互动方法
CN107945596A (zh) * 2017-12-25 2018-04-20 成都福润得科技有限责任公司 一种便于灵活教学的交互式教学方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001249609A (ja) 2000-03-06 2001-09-14 Sony Corp 教育・訓練装置
JP2005284181A (ja) 2004-03-30 2005-10-13 Toshiba Corp 学習支援方法、学習支援システムおよび学習支援プログラム
US20080162471A1 (en) 2005-01-24 2008-07-03 Bernard David E Multimodal natural language query system for processing and analyzing voice and proximity-based queries
JP2008533505A (ja) 2005-01-28 2008-08-21 ブレイクスルー パフォーマンス テクノロジーズ エルエルシー コンピュータ制御の双方向トレーニングのためのシステムおよび方法
US20140026048A1 (en) 2012-07-16 2014-01-23 Questionmine, LLC Apparatus, method, and computer program product for synchronizing interactive content with multimedia
US20150331665A1 (en) 2014-05-13 2015-11-19 Panasonic Intellectual Property Corporation Of America Information provision method using voice recognition function and control method for device
CN104134334A (zh) 2014-08-04 2014-11-05 张慧燕 测试装置及测试系统
CN104216990A (zh) 2014-09-09 2014-12-17 科大讯飞股份有限公司 视频广告播放方法及系统
US20170329572A1 (en) 2016-05-10 2017-11-16 Google Inc. Media Transfer Among Media Output Devices
US20180070143A1 (en) 2016-09-02 2018-03-08 Sony Corporation System and method for optimized and efficient interactive experience
CN108024139A (zh) 2017-12-08 2018-05-11 广州视源电子科技股份有限公司 网络视频课件的播放方法、装置、终端设备及存储介质

Also Published As

Publication number Publication date
US20200007926A1 (en) 2020-01-02
JP2020005248A (ja) 2020-01-09
CN108769745A (zh) 2018-11-06

Similar Documents

Publication Publication Date Title
JP6999594B2 (ja) 映像再生方法及び装置
JP6713034B2 (ja) スマートテレビの音声インタラクティブフィードバック方法、システム及びコンピュータプログラム
JP6867441B2 (ja) 音声要求を処理するための方法および装置
US9767195B2 (en) Virtualized hosting and displaying of content using a swappable media player
US11350184B2 (en) Providing advanced playback and control functionality to video client
US8095552B2 (en) Data tag descriptor
US20220174346A1 (en) Video playing method and apparatus
WO2019084959A1 (zh) 无人机的移动终端和云端平台的交互方法及装置
KR101813918B1 (ko) 클라이언트 디바이스에 미디어 에셋을 제공하기 위한 방법
WO2019128829A1 (zh) 动作执行方法、装置、存储介质及电子装置
CN109474843A (zh) 语音操控终端的方法、客户端、服务器
CN103945284B (zh) 信息处理方法和信息处理装置
JP2019091423A (ja) マルチメディア再生リストを更新する方法及び装置
KR20070008146A (ko) 셋탑박스 및 상기 셋탑박스에서의 멀티미디어 컨텐츠 제공방법
US9667748B2 (en) Client device, information processing method, and information processing system
KR20140029877A (ko) 사용자가 클라우드 서비스를 이용하여 대상 장비를 제어할 수 있도록 하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
CN108881978B (zh) 用于智能设备的资源播放方法和装置
CN113329237B (zh) 一种呈现事件标签信息的方法与设备
JP2007516550A (ja) 再生装置、再生方法及び前記再生方法を行うプログラムが記録されたコンピュータで読み取り可能な記録媒体
TW503663B (en) Method and apparatus for managing streaming data
US11785314B2 (en) Systems and methods to enhance segment during trick play
US20230262292A1 (en) Content playing method and system
KR100985605B1 (ko) 리치 미디어 재생 시스템 및 그 제어방법
KR101607084B1 (ko) 정지 이미지를 이용한 스마트 tv 용 동영상 제공 장치 및 방법
FR3095563A1 (fr) Commande d’un service utilisant le traitement d’un flux comprenant des données multimédias

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190606

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200618

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200728

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210402

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20210531

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210624

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211222

R150 Certificate of patent or registration of utility model

Ref document number: 6999594

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150