JP6916167B2 - 音声及びビデオ通話のためのインタラクティブ制御方法及び装置 - Google Patents
音声及びビデオ通話のためのインタラクティブ制御方法及び装置 Download PDFInfo
- Publication number
- JP6916167B2 JP6916167B2 JP2018510102A JP2018510102A JP6916167B2 JP 6916167 B2 JP6916167 B2 JP 6916167B2 JP 2018510102 A JP2018510102 A JP 2018510102A JP 2018510102 A JP2018510102 A JP 2018510102A JP 6916167 B2 JP6916167 B2 JP 6916167B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- determined
- behavior data
- predetermined
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 157
- 230000002452 interceptive effect Effects 0.000 title claims description 76
- 230000006399 behavior Effects 0.000 claims description 110
- 230000009471 action Effects 0.000 claims description 45
- 238000012545 processing Methods 0.000 claims description 23
- 230000008569 process Effects 0.000 description 50
- 238000012790 confirmation Methods 0.000 description 27
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/002—Specific input/output arrangements not covered by G06F3/01 - G06F3/16
- G06F3/005—Input arrangements through a video camera
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/03—Arrangements for converting the position or the displacement of a member into a coded form
- G06F3/0304—Detection arrangements using opto-electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- User Interface Of Digital Computer (AREA)
- Telephonic Communication Services (AREA)
Description
(付記1)
ユーザにより音声方式及び/又はジェスチャ方式を含む所定の方式で入力されたユーザ行動データを取得するステップと、
前記ユーザ行動データに所定のトリガ情報が含まれているか否かを決定するステップと、
前記トリガ情報が含まれていると判断・通知された場合、所定の操作命令セットのうち前記トリガ情報に対応する操作命令を決定し、前記操作命令に対応するイベントを実行するステップと、を含む、
ことを特徴とする音声及びビデオ通話のためのインタラクティブ制御方法。
前記トリガ情報は、トリガ語と動作操作語とを含み、
前記ユーザ行動データに所定のトリガ情報が含まれているか否かを決定するステップは、
前記ユーザ行動データに所定の前記トリガ語が含まれているか否かを判断するステップと、
前記トリガ語が含まれていると判断・通知された場合、前記ユーザ行動データに所定の前記動作操作語が含まれているか否かをさらに判断するステップと、を含み、
前記トリガ情報が含まれていると判断・通知された場合、所定の操作命令セットのうち前記トリガ情報に対応する操作命令を決定し、前記操作命令に対応するイベントを実行するステップは、
前記動作操作語が含まれていると判断・通知された場合、前記所定の操作命令セットに基づいて前記動作操作語に対応する操作命令を決定し、前記操作語に対応する操作命令に対応するイベントを実行するステップを含む、
ことを特徴とする付記1に記載の音声及びビデオ通話のためのインタラクティブ制御方法。
前記トリガ情報は、トリガジェスチャ動作とジェスチャ操作とを含み、
ユーザにより所定の方式で入力されたユーザ行動データを取得するステップは、
カメラによって前記ユーザにより入力されたユーザ行動データを取得するステップを含み、
前記ユーザ行動データに所定のトリガ情報が含まれているか否かを決定するステップは、
前記ユーザ行動データに所定の前記トリガジェスチャ動作が含まれているか否かを判断するステップと、
前記トリガジェスチャ動作が含まれていると判断・通知された場合、前記ユーザ行動データに所定のジェスチャ操作が含まれているか否かをさらに判断するステップと、を含み、
前記トリガ情報が含まれていると判断・通知された場合、所定の操作命令セットのうち前記トリガ情報に対応する操作命令を決定し、前記操作命令に対応するイベントを実行するステップは、
前記ジェスチャ動作が含まれていると判断・通知された場合、前記所定の操作命令セットに基づいて前記ジェスチャ動作に対応する操作命令を決定し、前記ジェスチャ動作に対応する操作命令に従って対応するイベントを実行するステップを含む、
ことを特徴とする付記1に記載の音声及びビデオ通話のためのインタラクティブ制御方法。
前記トリガ情報は、キーワードを含み、
前記ユーザ行動データに所定のトリガ情報が含まれているか否かを決定するステップは、
前記ユーザ行動データに所定の前記キーワードが含まれているか否かを判断するステップを含み、
前記キーワードが含まれていると判断・通知された場合、所定の操作命令セットのうち前記トリガ情報に対応する操作命令を決定し、前記操作命令に対応するイベントを実行するステップは、
前記キーワードが含まれていると判断・通知された場合、サーバが前記キーワードに対応する推薦情報を取得するように、前記キーワードを前記サーバに送信するステップと、
前記サーバから返信された前記推薦情報を受信し、前記推薦情報をユーザに提供するステップと、を含む、
ことを特徴とする付記1に記載の音声及びビデオ通話のためのインタラクティブ制御方法。
前記トリガ情報は、キーワードを含み、
ユーザにより所定の方式で入力されたユーザ行動データを取得するステップは、
カメラにより採取されたビデオ情報を取得するステップと、
ビデオ認識アルゴリズムに基づいて前記ビデオ情報を認識して、前記ビデオ情報の認識結果を生成するステップと、を含み、
前記ユーザ行動データに所定のトリガ情報が含まれているか否かを決定するステップは、
前記認識結果に所定の前記キーワードが含まれているか否かを判断するステップを含み、
前記トリガ情報が含まれていると判断・通知された場合、所定の操作命令セットのうち前記トリガ情報に対応する操作命令を決定し、前記操作命令に対応するイベントを実行するステップは、
前記キーワードが含まれていると判断・通知された場合、サーバが前記キーワードに対応する推薦情報を取得するように、前記キーワードを前記サーバに送信するステップと、
前記サーバから返信された前記推薦情報を受信し、前記推薦情報を前記ユーザに提供するステップと、を含む、
ことを特徴とする付記1に記載の音声及びビデオ通話のためのインタラクティブ制御方法。
ユーザにより音声方式及び/又はジェスチャ方式を含む所定の方式で入力されたユーザ行動データを取得する取得モジュールと、
前記ユーザ行動データに所定のトリガ情報が含まれているか否かを決定する判断モジュールと、
前記トリガ情報が含まれていると判断・通知された場合、所定の操作命令セットのうち前記トリガ情報に対応する操作命令を決定し、前記操作命令に対応するイベントを実行する処理モジュールと、を含む、
ことを特徴とする音声及びビデオ通話のためのインタラクティブ制御装置。
前記トリガ情報は、トリガ語と動作操作語とを含み、
前記判断モジュールは、
前記ユーザ行動データに所定の前記トリガ語が含まれているか否かを判断し、
前記トリガ語が含まれていると判断・通知された場合、前記ユーザ行動データに所定の前記動作操作語が含まれているか否かをさらに判断し、
前記処理モジュールは、
前記動作操作語が含まれていると判断・通知された場合、前記所定の操作命令セットに基づいて前記動作操作語に対応する操作命令を決定し、前記操作語に対応する操作命令に対応するイベントを実行する、
ことを特徴とする付記6に記載の音声及びビデオ通話のためのインタラクティブ制御装置。
前記トリガ情報は、トリガジェスチャ動作とジェスチャ操作とを含み、
前記取得モジュールは、
カメラによって前記ユーザにより入力されたユーザ行動データを取得し、
前記判断モジュールは、
前記ユーザ行動データに所定の前記トリガジェスチャ動作が含まれているか否かを判断し、
前記トリガジェスチャ動作が含まれていると判断・通知された場合、前記ユーザ行動データに所定のジェスチャ操作が含まれているか否かをさらに判断し、
前記処理モジュールは、
前記ジェスチャ動作が含まれていると判断・通知された場合、前記所定の操作命令セットに基づいて前記ジェスチャ動作に対応する操作命令を決定し、前記ジェスチャ動作に対応する操作命令に従って対応するイベントを実行する、
ことを特徴とする付記6に記載の音声及びビデオ通話のためのインタラクティブ制御装置。
前記トリガ情報は、キーワードを含み、
前記判断モジュールは、
前記ユーザ行動データに所定の前記キーワードが含まれているか否かを判断し、
前記処理モジュールは、
前記キーワードが含まれていると判断・通知された場合、サーバが前記キーワードに対応する推薦情報を取得するように、前記キーワードを前記サーバに送信し、
前記サーバから返信された前記推薦情報を受信し、前記推薦情報をユーザに提供する、
ことを特徴とする付記6に記載の音声及びビデオ通話のためのインタラクティブ制御装置。
前記トリガ情報は、キーワードを含み、
前記取得モジュールは、
カメラにより採取されたビデオ情報を取得し、
ビデオ認識アルゴリズムに基づいて前記ビデオ情報を認識して、前記ビデオ情報の認識結果を生成し、
前記判断モジュールは、
前記認識結果に所定の前記キーワードが含まれているか否かを判断し、
前記処理モジュールは、
前記キーワードが含まれていると判断・通知された場合、サーバが前記キーワードに対応する推薦情報を取得するように、前記キーワードを前記サーバに送信し、
前記サーバから返信された前記推薦情報を受信し、前記推薦情報を前記ユーザに提供する、
ことを特徴とする付記6に記載の音声及びビデオ通話のためのインタラクティブ制御装置。
一つ又は複数のプロセッサと、
メモリと、
一つ又は複数のモジュールと、を含み、
前記一つ又は複数のモジュールは、前記メモリに格納され、前記一つ又は複数のプロセッサによって実行される場合に、
ユーザにより音声方式及び/又はジェスチャ方式を含む所定の方式で入力されたユーザ行動データを取得する操作と、
前記ユーザ行動データに所定のトリガ情報が含まれているか否かを決定する操作と、
前記トリガ情報が含まれていると判断・通知された場合、所定の操作命令セットのうち前記トリガ情報に対応する操作命令を決定し、前記操作命令に対応するイベントを実行する操作と、を行う、
ことを特徴とする音声及びビデオ通話のためのインタラクティブ制御装置。
付記1〜5のいずれか1つに記載の音声及びビデオ通話のためのインタラクティブ制御方法を実行するためのアプリケーションプログラムが記憶されている、
ことを特徴とする記憶媒体。
Claims (8)
- ユーザと1つ又は複数の他のユーザとの音声通話及びビデオ通話の経過において、ユーザの入力されたユーザ行動データをモニタリングし、ユーザにより音声方式及びジェスチャ方式を含む所定の方式で入力されたユーザ行動データを取得するステップと、
前記ユーザ行動データに所定のトリガ情報が含まれているか否かを決定するステップと、
前記トリガ情報が含まれていると判断・通知された場合、所定の操作命令セットのうち前記トリガ情報に対応する操作命令を決定し、前記操作命令に対応するイベントを実行するステップと、を含み、
前記トリガ情報は、キーワードを含み、
ユーザにより所定の方式で入力されたユーザ行動データを取得するステップは、
カメラにより採取されたビデオ情報を取得するステップと、
ビデオ認識アルゴリズムに基づいて前記ビデオ情報を認識して、前記ビデオ情報の認識結果を前記ユーザ行動データとして生成するステップであって、前記認識結果は、前記ビデオ情報における物の特徴情報を含むステップと、を含み、
前記ユーザ行動データに所定のトリガ情報が含まれているか否かを決定するステップは、
前記ユーザ行動データに前記物の特徴情報により決定された所定の前記キーワードが含まれているか否かを判断するステップを含み、
前記キーワードが含まれていると判断・通知された場合、所定の操作命令セットのうち前記トリガ情報に対応する操作命令を決定し、前記操作命令に対応するイベントを実行するステップは、
前記キーワードが含まれていると判断・通知された場合、サーバが前記キーワードに対応する推薦情報を取得するように、前記キーワードを前記サーバに送信し、前記サーバから返信された前記推薦情報を受信し、前記推薦情報をユーザに提供するという前記キーワードに対応する操作命令を決定し、前記キーワードに対応する操作命令に従ってイベントを実行すること、を含む、
ことを特徴とする音声及びビデオ通話のためのインタラクティブ制御方法。 - 前記トリガ情報は、トリガ語と動作操作語とを含み、
前記ユーザ行動データに所定のトリガ情報が含まれているか否かを決定するステップは、
前記ユーザ行動データに所定の前記トリガ語が含まれているか否かを判断するステップと、
前記トリガ語が含まれていると判断・通知された場合、前記ユーザ行動データに所定の前記動作操作語が含まれているか否かをさらに判断するステップと、を含み、
前記トリガ情報が含まれていると判断・通知された場合、所定の操作命令セットのうち前記トリガ情報に対応する操作命令を決定し、前記操作命令に対応するイベントを実行するステップは、
前記動作操作語が含まれていると判断・通知された場合、前記所定の操作命令セットに基づいて前記動作操作語に対応する操作命令を決定し、前記操作語に対応する操作命令に対応するイベントを実行するステップを含む、
ことを特徴とする請求項1に記載の音声及びビデオ通話のためのインタラクティブ制御方法。 - 前記トリガ情報は、トリガジェスチャ動作とジェスチャ操作とを含み、
ユーザにより所定の方式で入力されたユーザ行動データを取得するステップは、
カメラによって前記ユーザにより入力されたユーザ行動データを取得するステップを含み、
前記ユーザ行動データに所定のトリガ情報が含まれているか否かを決定するステップは、
前記ユーザ行動データに所定の前記トリガジェスチャ動作が含まれているか否かを判断するステップと、
前記トリガジェスチャ動作が含まれていると判断・通知された場合、前記ユーザ行動データに所定のジェスチャ操作が含まれているか否かをさらに判断するステップと、を含み、
前記トリガ情報が含まれていると判断・通知された場合、所定の操作命令セットのうち前記トリガ情報に対応する操作命令を決定し、前記操作命令に対応するイベントを実行するステップは、
前記ジェスチャ動作が含まれていると判断・通知された場合、前記所定の操作命令セットに基づいて前記ジェスチャ動作に対応する操作命令を決定し、前記ジェスチャ動作に対応する操作命令に従って対応するイベントを実行するステップを含む、
ことを特徴とする請求項1に記載の音声及びビデオ通話のためのインタラクティブ制御方法。 - ユーザと1つ又は複数の他のユーザとの音声通話及びビデオ通話の経過において、ユーザの入力されたユーザ行動データをモニタリングし、ユーザにより音声方式及びジェスチャ方式を含む所定の方式で入力されたユーザ行動データを取得する取得モジュールと、
前記ユーザ行動データに所定のトリガ情報が含まれているか否かを決定する判断モジュールと、
前記トリガ情報が含まれていると判断・通知された場合、所定の操作命令セットのうち前記トリガ情報に対応する操作命令を決定し、前記操作命令に対応するイベントを実行する処理モジュールと、を含み、
前記トリガ情報は、キーワードを含み、
前記取得モジュールは、
カメラにより採取されたビデオ情報を取得し、
ビデオ認識アルゴリズムに基づいて前記ビデオ情報を認識して、前記ビデオ情報の認識結果を前記ユーザ行動データとして生成し、前記認識結果は、前記ビデオ情報における物の特徴情報を含み、
前記判断モジュールは、
前記ユーザ行動データに前記物の特徴情報により決定された所定の前記キーワードが含まれているか否かを判断し、
前記処理モジュールは、
前記キーワードが含まれていると判断・通知された場合、サーバが前記キーワードに対応する推薦情報を取得するように、前記キーワードを前記サーバに送信し、前記サーバから返信された前記推薦情報を受信し、前記推薦情報をユーザに提供するという前記キーワードに対応する操作命令を決定し、前記キーワードに対応する操作命令に従ってイベントを実行する、
ことを特徴とする音声及びビデオ通話のためのインタラクティブ制御装置。 - 前記トリガ情報は、トリガ語と動作操作語とを含み、
前記判断モジュールは、
前記ユーザ行動データに所定の前記トリガ語が含まれているか否かを判断し、
前記トリガ語が含まれていると判断・通知された場合、前記ユーザ行動データに所定の前記動作操作語が含まれているか否かをさらに判断し、
前記処理モジュールは、
前記動作操作語が含まれていると判断・通知された場合、前記所定の操作命令セットに基づいて前記動作操作語に対応する操作命令を決定し、前記操作語に対応する操作命令に対応するイベントを実行する、
ことを特徴とする請求項4に記載の音声及びビデオ通話のためのインタラクティブ制御装置。 - 前記トリガ情報は、トリガジェスチャ動作とジェスチャ操作とを含み、
前記取得モジュールは、
カメラによって前記ユーザにより入力されたユーザ行動データを取得し、
前記判断モジュールは、
前記ユーザ行動データに所定の前記トリガジェスチャ動作が含まれているか否かを判断し、
前記トリガジェスチャ動作が含まれていると判断・通知された場合、前記ユーザ行動データに所定のジェスチャ操作が含まれているか否かをさらに判断し、
前記処理モジュールは、
前記ジェスチャ動作が含まれていると判断・通知された場合、前記所定の操作命令セットに基づいて前記ジェスチャ動作に対応する操作命令を決定し、前記ジェスチャ動作に対応する操作命令に従って対応するイベントを実行する、
ことを特徴とする請求項4に記載の音声及びビデオ通話のためのインタラクティブ制御装置。 - 一つ又は複数のプロセッサと、
メモリと、
一つ又は複数のモジュールと、を含み、
前記一つ又は複数のモジュールは、前記メモリに格納され、前記一つ又は複数のプロセッサによって実行される場合に、
ユーザと1つ又は複数の他のユーザとの音声通話及びビデオ通話の経過において、ユーザの入力されたユーザ行動データをモニタリングし、ユーザにより音声方式及びジェスチャ方式を含む所定の方式で入力されたユーザ行動データを取得する操作と、
前記ユーザ行動データに所定のトリガ情報が含まれているか否かを決定する操作と、
前記トリガ情報が含まれていると判断・通知された場合、所定の操作命令セットのうち前記トリガ情報に対応する操作命令を決定し、前記操作命令に対応するイベントを実行する操作と、を行い、
前記トリガ情報は、キーワードを含み、
前記取得する操作は、
カメラにより採取されたビデオ情報を取得し、
ビデオ認識アルゴリズムに基づいて前記ビデオ情報を認識して、前記ビデオ情報の認識結果を前記ユーザ行動データとして生成し、前記認識結果は、前記ビデオ情報における物の特徴情報を含み、
前記決定する操作は、
前記ユーザ行動データに前記物の特徴情報により決定された所定の前記キーワードが含まれているか否かを判断し、
前記イベントを実行する操作は、
前記キーワードが含まれていると判断・通知された場合、サーバが前記キーワードに対応する推薦情報を取得するように、前記キーワードを前記サーバに送信し、前記サーバから返信された前記推薦情報を受信し、前記推薦情報をユーザに提供するという前記キーワードに対応する操作命令を決定し、前記キーワードに対応する操作命令に従ってイベントを実行する、
ことを特徴とする音声及びビデオ通話のためのインタラクティブ制御装置。 - 請求項1〜3のいずれか1項に記載の音声及びビデオ通話のためのインタラクティブ制御方法を実行するためのアプリケーションプログラムが記憶されている、
ことを特徴とする記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510629549.1 | 2015-09-28 | ||
CN201510629549.1A CN105204743A (zh) | 2015-09-28 | 2015-09-28 | 用于语音和视频通讯的交互控制方法及装置 |
PCT/CN2015/096340 WO2017054309A1 (zh) | 2015-09-28 | 2015-12-03 | 用于语音和视频通讯的交互控制方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018525751A JP2018525751A (ja) | 2018-09-06 |
JP6916167B2 true JP6916167B2 (ja) | 2021-08-11 |
Family
ID=54952466
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018510102A Active JP6916167B2 (ja) | 2015-09-28 | 2015-12-03 | 音声及びビデオ通話のためのインタラクティブ制御方法及び装置 |
Country Status (4)
Country | Link |
---|---|
US (2) | US10719293B2 (ja) |
JP (1) | JP6916167B2 (ja) |
CN (1) | CN105204743A (ja) |
WO (1) | WO2017054309A1 (ja) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105204743A (zh) * | 2015-09-28 | 2015-12-30 | 百度在线网络技术(北京)有限公司 | 用于语音和视频通讯的交互控制方法及装置 |
WO2017128227A1 (zh) * | 2016-01-28 | 2017-08-03 | 陈学良 | 一种应用程序的调用方法及移动终端 |
CN105690385B (zh) * | 2016-03-18 | 2019-04-26 | 北京光年无限科技有限公司 | 基于智能机器人的应用调用方法与装置 |
KR20180049787A (ko) * | 2016-11-03 | 2018-05-11 | 삼성전자주식회사 | 전자 장치, 그의 제어 방법 |
WO2018084576A1 (en) | 2016-11-03 | 2018-05-11 | Samsung Electronics Co., Ltd. | Electronic device and controlling method thereof |
CN106791921B (zh) * | 2016-12-09 | 2020-03-03 | 北京小米移动软件有限公司 | 视频直播的处理方法、装置及存储介质 |
CN106777099A (zh) * | 2016-12-14 | 2017-05-31 | 掌阅科技股份有限公司 | 业务语音数据的处理方法、装置及终端设备 |
CN106791071A (zh) * | 2016-12-15 | 2017-05-31 | 珠海市魅族科技有限公司 | 通话控制方法及系统 |
CN108073273A (zh) * | 2016-12-27 | 2018-05-25 | 北京市商汤科技开发有限公司 | 业务对象的操作方法、装置和电子设备 |
CN108076392A (zh) * | 2017-03-31 | 2018-05-25 | 北京市商汤科技开发有限公司 | 直播互动方法、装置和电子设备 |
CN109992095A (zh) * | 2017-12-29 | 2019-07-09 | 青岛有屋科技有限公司 | 一种智能厨房的语音和手势结合的控制方法及控制装置 |
CN108449487A (zh) * | 2018-01-26 | 2018-08-24 | 珠海市魅族科技有限公司 | 彩蛋触发方法及装置、计算机装置和计算机可读存储介质 |
KR20200013162A (ko) | 2018-07-19 | 2020-02-06 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
CN112272846A (zh) * | 2018-08-21 | 2021-01-26 | 谷歌有限责任公司 | 用于调用自动助理的动态的和/或特定于场境的热词 |
EP4036910A1 (en) | 2018-08-21 | 2022-08-03 | Google LLC | Dynamic and/or context-specific hot words to invoke automated assistant |
WO2020051893A1 (zh) * | 2018-09-14 | 2020-03-19 | 郑永利 | 互动系统、方法及处理装置 |
US10991364B1 (en) * | 2018-09-18 | 2021-04-27 | Amazon Technologies, Inc. | Obtaining context data |
CN110928977A (zh) * | 2018-09-19 | 2020-03-27 | 上海擎感智能科技有限公司 | 语音信息的分享方法、系统、可读存储介质、服务端 |
CN110971747A (zh) * | 2018-09-30 | 2020-04-07 | 华为技术有限公司 | 一种媒体展示的控制方法及相关产品 |
KR20200074635A (ko) * | 2018-12-17 | 2020-06-25 | 삼성전자주식회사 | 디스플레이장치 및 그 제어방법 |
CN109828660B (zh) * | 2018-12-29 | 2022-05-17 | 深圳云天励飞技术有限公司 | 一种基于增强现实的控制应用操作的方法及装置 |
CN111435981B (zh) * | 2019-01-11 | 2021-06-08 | 华为技术有限公司 | 通话处理方法及装置 |
CN110058835A (zh) * | 2019-02-26 | 2019-07-26 | 百度国际科技(深圳)有限公司 | 设备控制方法、装置及设备 |
CN110311945B (zh) * | 2019-04-30 | 2022-11-08 | 上海掌门科技有限公司 | 一种用于在实时视频流中呈现资源推送信息的方法与设备 |
US11308284B2 (en) | 2019-10-18 | 2022-04-19 | Facebook Technologies, Llc. | Smart cameras enabled by assistant systems |
US11567788B1 (en) | 2019-10-18 | 2023-01-31 | Meta Platforms, Inc. | Generating proactive reminders for assistant systems |
CN111273990A (zh) * | 2020-01-21 | 2020-06-12 | 腾讯科技(深圳)有限公司 | 信息交互方法、装置、计算机设备和存储介质 |
JP7001241B2 (ja) * | 2020-02-18 | 2022-01-19 | Necプラットフォームズ株式会社 | パケット監視装置、構内交換機、バーチャルアシスタント呼び出し方法、及びプログラム |
CN113467604A (zh) * | 2020-05-28 | 2021-10-01 | 海信集团有限公司 | 一种数据交互方法以及相关设备 |
CN111913630B (zh) * | 2020-06-30 | 2022-10-18 | 维沃移动通信有限公司 | 视频会话方法、装置和电子设备 |
WO2022070352A1 (ja) * | 2020-09-30 | 2022-04-07 | 株式会社Pfu | 情報処理装置、コンテンツ提供方法、及びプログラム |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11203295A (ja) * | 1998-01-08 | 1999-07-30 | Ntt Data Corp | 情報提供装置および方法 |
CN1351459A (zh) * | 2000-10-26 | 2002-05-29 | 安捷伦科技有限公司 | 手持式通信和处理装置及其操作方法 |
JP2002271507A (ja) | 2001-03-08 | 2002-09-20 | Matsushita Electric Ind Co Ltd | テレビ電話端末を用いた広告提供方法及び該広告提供方法に用いるテレビ電話端末、並びにプログラムを格納した媒体 |
JP2003032388A (ja) * | 2001-07-12 | 2003-01-31 | Denso Corp | 通信端末装置及び処理システム |
JP4376525B2 (ja) | 2003-02-17 | 2009-12-02 | 株式会社メガチップス | 多地点通信システム |
JP2007018456A (ja) | 2005-07-11 | 2007-01-25 | Nikon Corp | 情報表示装置及び情報表示方法 |
JP2008269174A (ja) | 2007-04-18 | 2008-11-06 | Fujifilm Corp | 制御装置、方法およびプログラム |
US9268404B2 (en) * | 2010-01-08 | 2016-02-23 | Microsoft Technology Licensing, Llc | Application gesture interpretation |
JP2011205238A (ja) * | 2010-03-24 | 2011-10-13 | Ntt Docomo Inc | 通信端末及び情報検索方法 |
WO2012017525A1 (ja) | 2010-08-04 | 2012-02-09 | パイオニア株式会社 | 処理装置及びコマンド入力支援方法 |
CN102170617A (zh) * | 2011-04-07 | 2011-08-31 | 中兴通讯股份有限公司 | 移动终端及其远程控制方法 |
US9026441B2 (en) * | 2012-02-29 | 2015-05-05 | Nant Holdings Ip, Llc | Spoken control for user construction of complex behaviors |
CN103513752B (zh) | 2012-06-18 | 2017-02-22 | 华为技术有限公司 | 一种手势操作的方法、装置及系统 |
CN103576839B (zh) * | 2012-07-24 | 2019-03-12 | 广州三星通信技术研究有限公司 | 基于面部识别来控制终端操作的设备和方法 |
CN103020047A (zh) * | 2012-12-31 | 2013-04-03 | 威盛电子股份有限公司 | 修正语音应答的方法及自然语言对话系统 |
CN103152244B (zh) * | 2013-01-30 | 2015-12-02 | 歌尔声学股份有限公司 | 一种控制即时通信平台通信的方法、装置和通信系统 |
CN104010154B (zh) * | 2013-02-27 | 2019-03-08 | 联想(北京)有限公司 | 信息处理方法及电子设备 |
US10395651B2 (en) * | 2013-02-28 | 2019-08-27 | Sony Corporation | Device and method for activating with voice input |
WO2014171144A1 (ja) * | 2013-04-19 | 2014-10-23 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 家電機器の制御方法、家電機器制御システム、及びゲートウェイ |
US9697831B2 (en) * | 2013-06-26 | 2017-07-04 | Cirrus Logic, Inc. | Speech recognition |
US9525811B2 (en) | 2013-07-01 | 2016-12-20 | Qualcomm Incorporated | Display device configured as an illumination source |
CN105531671A (zh) | 2013-09-13 | 2016-04-27 | 高通股份有限公司 | 对用户界面的前台访问具有确定性控制的无线通信设备 |
US10134395B2 (en) | 2013-09-25 | 2018-11-20 | Amazon Technologies, Inc. | In-call virtual assistants |
CN111984165B (zh) | 2013-09-29 | 2022-07-08 | 小米科技有限责任公司 | 一种显示消息的方法、装置及终端设备 |
US20150095856A1 (en) * | 2013-09-29 | 2015-04-02 | Xiaomi Inc. | Method and terminal device for displaying messages |
JP6851133B2 (ja) * | 2014-01-03 | 2021-03-31 | ハーマン インターナショナル インダストリーズ インコーポレイテッド | ユーザに方向付けられた個人情報アシスタント |
CN104618220A (zh) | 2014-12-31 | 2015-05-13 | 北京国创富盛通信股份有限公司 | 一种基于蓝牙技术的im双向交互系统 |
CN105204743A (zh) * | 2015-09-28 | 2015-12-30 | 百度在线网络技术(北京)有限公司 | 用于语音和视频通讯的交互控制方法及装置 |
-
2015
- 2015-09-28 CN CN201510629549.1A patent/CN105204743A/zh active Pending
- 2015-12-03 JP JP2018510102A patent/JP6916167B2/ja active Active
- 2015-12-03 WO PCT/CN2015/096340 patent/WO2017054309A1/zh active Application Filing
- 2015-12-03 US US15/752,489 patent/US10719293B2/en active Active
-
2020
- 2020-06-11 US US16/899,050 patent/US11487503B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018525751A (ja) | 2018-09-06 |
US10719293B2 (en) | 2020-07-21 |
CN105204743A (zh) | 2015-12-30 |
US20200301663A1 (en) | 2020-09-24 |
US20180260189A1 (en) | 2018-09-13 |
WO2017054309A1 (zh) | 2017-04-06 |
US11487503B2 (en) | 2022-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6916167B2 (ja) | 音声及びビデオ通話のためのインタラクティブ制御方法及び装置 | |
CN109844717B (zh) | 用于移动应用程序的实时远程控制的系统和方法 | |
US20190306277A1 (en) | Interaction between devices displaying application status information | |
US11194448B2 (en) | Apparatus for vision and language-assisted smartphone task automation and method thereof | |
EP2977926A1 (en) | Method and device for verification using verification code | |
RU2643486C2 (ru) | Способ и устройство сбора информации | |
KR20210134675A (ko) | 사용자 시연을 통하여 명령들을 학습하고 실행 가능하게 하기 위한 방법 및 시스템 | |
US20210352059A1 (en) | Message Display Method, Apparatus, and Device | |
EP2811400A1 (en) | Method for executing program and electronic device thereof | |
US11140534B2 (en) | Non-intrusive proximity based advertising and message delivery | |
JP2018504657A (ja) | タブベースのブラウザコンテンツ共有 | |
JP2017191602A5 (ja) | ||
KR102415607B1 (ko) | 사용자 단말의 메신저 프로그램과 클라우드 서버의 연동 방법 및 시스템 | |
CN106796605A (zh) | 分段数据录入的验证 | |
CN116762055A (zh) | 同步虚拟现实通知 | |
KR101720747B1 (ko) | 채팅창 제공 방법 및 사용자 단말 | |
US20160077795A1 (en) | Display apparatus and method of controlling thereof | |
CN112579032A (zh) | 智能设备引导的方法及装置 | |
CN111385409A (zh) | 一种通信输入的方法、装置、设备和介质 | |
CN110865853A (zh) | 云服务的智能操作方法和装置以及电子设备 | |
KR101546502B1 (ko) | 페이지의 텍스트를 활용한 키워드 검색시스템 및 검색방법 | |
KR20170079283A (ko) | 클립의 제목을 자동으로 선정하는 컨텐츠 클립핑 방법 | |
CN109062422A (zh) | 快捷输入方法、客户端及服务器 | |
CN113359978A (zh) | 多媒体设备的控制方法及装置、电子设备和存储介质 | |
CN110531952A (zh) | 语音技能的处理方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180222 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190408 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20191001 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200129 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20200129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20200129 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20200218 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20200225 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20200410 |
|
C211 | Notice of termination of reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C211 Effective date: 20200414 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20201006 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20201215 |
|
C13 | Notice of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: C13 Effective date: 20210126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210426 |
|
C23 | Notice of termination of proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C23 Effective date: 20210518 |
|
C03 | Trial/appeal decision taken |
Free format text: JAPANESE INTERMEDIATE CODE: C03 Effective date: 20210622 |
|
C30A | Notification sent |
Free format text: JAPANESE INTERMEDIATE CODE: C3012 Effective date: 20210622 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210715 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6916167 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |