JP7104683B2 - 情報を生成する方法および装置 - Google Patents
情報を生成する方法および装置 Download PDFInfo
- Publication number
- JP7104683B2 JP7104683B2 JP2019227932A JP2019227932A JP7104683B2 JP 7104683 B2 JP7104683 B2 JP 7104683B2 JP 2019227932 A JP2019227932 A JP 2019227932A JP 2019227932 A JP2019227932 A JP 2019227932A JP 7104683 B2 JP7104683 B2 JP 7104683B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- target
- feedback information
- text
- portrait
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000008921 facial expression Effects 0.000 claims description 50
- 238000000034 method Methods 0.000 claims description 43
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 11
- 238000013145 classification model Methods 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 239000000835 fiber Substances 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
- H04N7/157—Conference systems defining a virtual conference space and using avatars or agents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T13/00—Animation
- G06T13/20—3D [Three Dimensional] animation
- G06T13/205—3D [Three Dimensional] animation driven by audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T13/00—Animation
- G06T13/20—3D [Three Dimensional] animation
- G06T13/40—3D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
- G10L13/047—Architecture of speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- Primary Health Care (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- Processing Or Creating Images (AREA)
- User Interface Of Digital Computer (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
本実施例のいくつかの代替的な実施形態では、上記装置500は、三次元仮想ポートレートの外観を決定するための情報を含む三次元仮想ポートレートのカスタムリクエストを受信するように構成されたリクエスト受信ユニット(図示せず)と、上記カスタムリクエストに基づいて、三次元仮想ポートレートの外観を決定するように構成された決定ユニット(図示せず)と、をさらに含む。
Claims (13)
- クライアントから送信されたユーザのビデオおよびオーディオを受信するステップと、
前記ビデオを認識してユーザ特徴情報を得るとともに、前記オーディオを認識して当該オーディオの対応するテキスト情報を得、得られたユーザ特徴情報及びテキスト情報に対して、単語の分割を実行して、少なくとも1つの単語セグメントを得、得られた前記少なくとも1つの単語セグメントを事前に確立された意図分類モデルに入力することにより、前記ユーザの意図カテゴリを決定するステップであって、前記意図カテゴリは、クライアントに適用されるサービスシナリオに基づいて事前に設定された複数の意図カテゴリに含まれ、前記ユーザ特徴情報は、前記ユーザの身元、表情、ジェスチャ、姿勢のうちの少なくとも1つを示すテキスト情報であり、前記意図分類モデルは、単語セグメントセットと意図カテゴリとの対応関係を示すために使用される、ステップと、
前記決定されたユーザの意図カテゴリにより、クライアントが適用されるサービスシナリオに関連する複数のサービス情報を含む所定のサービス情報セットから、当該意図カテゴリの関連情報を取得し、取得された関連情報に基づいてフィードバック情報を生成するステップと、
前記フィードバック情報に基づいて、アニメーションエンジンを介して、事前に確立された三次元仮想ポートレートのビデオを生成するステップと、
前記クライアントが前記ユーザに表示するように、前記三次元仮想ポートレートのビデオを前記クライアントに送信するステップと、を含む、
情報を生成する方法。 - 前記フィードバック情報は、テキストフィードバック情報であり、
前記フィードバック情報に基づいて、アニメーションエンジンを介して、事前に確立された三次元仮想ポートレートのビデオを生成する前記ステップは、
前記テキストフィードバック情報に基づいて、音声フィードバック情報を生成するステップと、
前記テキストフィードバック情報に基づいて、所定のポートレート情報セットから、ターゲット表情情報、ターゲット口形情報、およびターゲット動作情報を含むターゲットポートレート情報を取得するステップと、
前記音声フィードバック情報、ターゲット表情情報、ターゲット口形情報、およびターゲット動作情報に基づいて、アニメーションエンジンを介して三次元仮想ポートレートのビデオを生成するステップと、を含む、
請求項1に記載の方法。 - 前記ポートレート情報セットは、表情情報セット、口形情報セット、および動作情報セットを含み、
前記テキストフィードバック情報に基づいて、所定のポートレート情報セットから、ターゲットポートレート情報を取得する前記ステップは、
前記テキストフィードバック情報に基づいて、前記表情情報セットから、ターゲット表情情報を決定するステップと、
前記テキストフィードバック情報に基づいて、前記口形情報セットから、ターゲット口形情報を決定するステップと、
前記テキストフィードバック情報に基づいて、前記動作情報セットから、ターゲット動作情報を決定するステップと、
前記ターゲット表情情報、ターゲット口形情報、およびターゲット動作情報をターゲットポートレート情報として設定するステップと、を含む、
請求項2に記載の方法。 - 前記テキストフィードバック情報に基づいて、音声フィードバック情報を生成する前記ステップは、
前記テキストフィードバック情報をテキストと音声との対応関係を特徴付けるために使用される、実在の人物の音声に基づいてトレーニングして得られた、事前に確立された音声生成モデルに入力し、音声フィードバック情報を生成するステップと、を含む、
請求項2に記載の方法。 - 前記方法は、
三次元仮想ポートレートの外観を決定するための情報を含む三次元仮想ポートレートのカスタムリクエストを受信するステップと、
前記カスタムリクエストに基づいて、三次元仮想ポートレートの外観を決定するステップと、をさらに含む、
請求項1に記載の方法。 - クライアントから送信されたユーザのビデオおよびオーディオを受信するように構成された受信ユニットと、
前記ビデオを認識してユーザ特徴情報を得るとともに、前記オーディオを認識して当該オーディオの対応するテキスト情報を得、得られたユーザ特徴情報及びテキスト情報に対して、単語の分割を実行して、少なくとも1つの単語セグメントを得、得られた前記少なくとも1つの単語セグメントを事前に確立された意図分類モデルに入力することにより、前記ユーザの意図カテゴリを決定するように構成された分析ユニットであって、前記意図カテゴリは、クライアントに適用されるサービスシナリオに基づいて事前に設定された複数の意図カテゴリに含まれ、前記ユーザ特徴情報は、前記ユーザの身元、表情、ジェスチャ、姿勢のうちの少なくとも1つを示すテキスト情報であり、前記意図分類モデルは、単語セグメントセットと意図カテゴリとの対応関係を示すために使用される、分析ユニットと、
前記決定されたユーザの意図カテゴリにより、クライアントが適用されるサービスシナリオに関連する複数のサービス情報を含む所定のサービス情報セットから、当該意図カテゴリの関連情報を取得し、取得された関連情報に基づいてフィードバック情報を生成するように構成された第一生成ユニットと、
前記フィードバック情報に基づいて、アニメーションエンジンを介して、事前に確立された三次元仮想ポートレートのビデオを生成するように構成された第二生成ユニットと、
前記クライアントが前記ユーザに表示するように、前記三次元仮想ポートレートのビデオを前記クライアントに送信するように構成された送信ユニットと、を含む、
情報を生成する装置。 - 前記フィードバック情報は、テキストフィードバック情報であり、
前記第二生成ユニットは、
前記テキストフィードバック情報に基づいて、音声フィードバック情報を生成するように構成された音声生成ユニットと、
前記テキストフィードバック情報に基づいて、所定のポートレート情報セットから、ターゲット表情情報、ターゲット口形情報、およびターゲット動作情報を含むターゲットポートレート情報を取得するように構成された取得ユニットと、
前記音声フィードバック情報、ターゲット表情情報、ターゲット口形情報、およびターゲット動作情報に基づいて、アニメーションエンジンを介して三次元仮想ポートレートのビデオを生成するように構成されたビデオ生成ユニットと、を含む、
請求項6に記載の装置。 - 前記ポートレート情報セットは、表情情報セット、口形情報セット、および動作情報セットを含み、
前記取得ユニットは、さらに、
前記テキストフィードバック情報に基づいて、前記表情情報セットから、ターゲット表情情報を決定し、
前記テキストフィードバック情報に基づいて、前記口形情報セットから、ターゲット口形情報を決定し、
前記テキストフィードバック情報に基づいて、前記動作情報セットから、ターゲット動作情報を決定し、
前記ターゲット表情情報、ターゲット口形情報、およびターゲット動作情報をターゲットポートレート情報として設定する
ように構成されている、請求項7に記載の装置。 - 前記音声生成ユニットは、さらに
前記テキストフィードバック情報をテキストと音声との対応関係を特徴付けるために使用される、実在の人物の音声に基づいてトレーニングして得られた、事前に確立された音声生成モデルに入力し、音声フィードバック情報を生成するように構成されている、請求項7に記載の装置。 - 前記装置は、
三次元仮想ポートレートの外観を決定するための情報を含む三次元仮想ポートレートのカスタムリクエストを受信するように構成されたリクエスト受信ユニットと、
前記カスタムリクエストに基づいて、三次元仮想ポートレートの外観を決定するように構成された決定ユニットと、をさらに含む、
請求項6に記載の装置。 - 1つまたは複数のプロセッサと、
1つまたは複数のプログラムを記憶した記憶装置と、を含み、
前記1つまたは複数のプログラムは、1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに請求項1~5のいずれか一項に記載の方法を実行させる、サーバ。 - コンピュータプログラムを記憶したコンピュータ可読媒体であって、
前記コンピュータプログラムがプロセッサによって実行されると、請求項1~5のいずれか一項に記載の方法を実行させるコンピュータ可読媒体。 - コンピュータプログラムであって、
プロセッサによって実行されると、請求項1~5のいずれか一項に記載の方法を実行させるコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910573150.4A CN110298906B (zh) | 2019-06-28 | 2019-06-28 | 用于生成信息的方法和装置 |
CN201910573150.4 | 2019-06-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021010156A JP2021010156A (ja) | 2021-01-28 |
JP7104683B2 true JP7104683B2 (ja) | 2022-07-21 |
Family
ID=68029203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019227932A Active JP7104683B2 (ja) | 2019-06-28 | 2019-12-18 | 情報を生成する方法および装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11151765B2 (ja) |
JP (1) | JP7104683B2 (ja) |
KR (2) | KR20210001857A (ja) |
CN (1) | CN110298906B (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110767220B (zh) * | 2019-10-16 | 2024-05-28 | 腾讯科技(深圳)有限公司 | 一种智能语音助手的交互方法、装置、设备及存储介质 |
CN111063339A (zh) * | 2019-11-11 | 2020-04-24 | 珠海格力电器股份有限公司 | 智能交互方法、装置、设备及计算机可读介质 |
CN112929253B (zh) * | 2019-12-05 | 2023-08-08 | 北京沃东天骏信息技术有限公司 | 一种虚拟形象交互方法和装置 |
CN111541908A (zh) * | 2020-02-27 | 2020-08-14 | 北京市商汤科技开发有限公司 | 交互方法、装置、设备以及存储介质 |
CN111400441A (zh) * | 2020-02-28 | 2020-07-10 | 东莞市易联交互信息科技有限责任公司 | 一种应用于虚拟影院的虚拟交互方法及系统 |
CN111340920B (zh) * | 2020-03-02 | 2024-04-09 | 长沙千博信息技术有限公司 | 一种语义驱动的二维动画自动生成方法 |
CN111401921B (zh) * | 2020-03-05 | 2023-04-18 | 成都威爱新经济技术研究院有限公司 | 一种基于虚拟人的远程客服方法 |
CN111523981A (zh) * | 2020-04-29 | 2020-08-11 | 深圳追一科技有限公司 | 虚拟试用方法、装置、电子设备及存储介质 |
CN111627440A (zh) * | 2020-05-25 | 2020-09-04 | 红船科技(广州)有限公司 | 一种基于三维虚拟人物和语音识别实现交互的学习系统 |
CN112543342B (zh) | 2020-11-26 | 2023-03-14 | 腾讯科技(深圳)有限公司 | 虚拟视频直播处理方法及装置、存储介质、电子设备 |
CN112906546A (zh) * | 2021-02-09 | 2021-06-04 | 中国工商银行股份有限公司 | 虚拟数字人外形、音效以及服务模型的个性化生成方法 |
CN113822967A (zh) * | 2021-02-09 | 2021-12-21 | 北京沃东天骏信息技术有限公司 | 人机交互方法、装置、系统、电子设备以及计算机介质 |
CN112925898B (zh) * | 2021-04-13 | 2023-07-18 | 平安科技(深圳)有限公司 | 基于人工智能的问答方法、装置、服务器及存储介质 |
CN113194350B (zh) * | 2021-04-30 | 2022-08-19 | 百度在线网络技术(北京)有限公司 | 推送待播报数据、播报数据的方法和装置 |
CN114221940B (zh) * | 2021-12-13 | 2023-12-29 | 北京百度网讯科技有限公司 | 音频数据处理方法、系统、装置、设备以及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003248841A (ja) | 2001-12-20 | 2003-09-05 | Matsushita Electric Ind Co Ltd | バーチャルテレビ通話装置 |
JP2011237795A (ja) | 2010-05-07 | 2011-11-24 | Toshiba Corp | 音声処理方法及び装置 |
JP2013243646A (ja) | 2012-05-22 | 2013-12-05 | Commonwealth Scientific & Industrial Research Organization | ビデオを生成するためのシステムおよび方法 |
WO2017085992A1 (ja) | 2015-11-17 | 2017-05-26 | 株式会社ソニー・インタラクティブエンタテインメント | 情報処理装置 |
US20190095775A1 (en) | 2017-09-25 | 2019-03-28 | Ventana 3D, Llc | Artificial intelligence (ai) character system capable of natural verbal and visual interactions with a human |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102196300A (zh) * | 2010-03-18 | 2011-09-21 | 国际商业机器公司 | 虚拟世界场景的图像的提供方法和设备及处理方法和设备 |
US10824310B2 (en) * | 2012-12-20 | 2020-11-03 | Sri International | Augmented reality virtual personal assistant for external representation |
KR102616172B1 (ko) * | 2016-08-12 | 2023-12-19 | 주식회사 케이티 | 캐릭터 제공 시스템 및 이를 이용한 정보 수집 방법 |
US20180350155A1 (en) * | 2017-05-31 | 2018-12-06 | L'oreal | System for manipulating a 3d simulation of a person by adjusting physical characteristics |
KR102078627B1 (ko) * | 2017-11-14 | 2020-02-19 | 네이버 주식회사 | 사용자-입력 컨텐츠와 연관된 실시간 피드백 정보 제공 방법 및 시스템 |
CN109599113A (zh) * | 2019-01-22 | 2019-04-09 | 北京百度网讯科技有限公司 | 用于处理信息的方法和装置 |
-
2019
- 2019-06-28 CN CN201910573150.4A patent/CN110298906B/zh active Active
- 2019-12-10 US US16/708,902 patent/US11151765B2/en active Active
- 2019-12-13 KR KR1020190166709A patent/KR20210001857A/ko not_active IP Right Cessation
- 2019-12-18 JP JP2019227932A patent/JP7104683B2/ja active Active
-
2021
- 2021-12-10 KR KR1020210176319A patent/KR102471202B1/ko active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003248841A (ja) | 2001-12-20 | 2003-09-05 | Matsushita Electric Ind Co Ltd | バーチャルテレビ通話装置 |
JP2011237795A (ja) | 2010-05-07 | 2011-11-24 | Toshiba Corp | 音声処理方法及び装置 |
JP2013243646A (ja) | 2012-05-22 | 2013-12-05 | Commonwealth Scientific & Industrial Research Organization | ビデオを生成するためのシステムおよび方法 |
WO2017085992A1 (ja) | 2015-11-17 | 2017-05-26 | 株式会社ソニー・インタラクティブエンタテインメント | 情報処理装置 |
US20190095775A1 (en) | 2017-09-25 | 2019-03-28 | Ventana 3D, Llc | Artificial intelligence (ai) character system capable of natural verbal and visual interactions with a human |
Also Published As
Publication number | Publication date |
---|---|
KR20220002820A (ko) | 2022-01-07 |
US20200410732A1 (en) | 2020-12-31 |
US11151765B2 (en) | 2021-10-19 |
CN110298906A (zh) | 2019-10-01 |
CN110298906B (zh) | 2023-08-11 |
JP2021010156A (ja) | 2021-01-28 |
KR102471202B1 (ko) | 2022-11-25 |
KR20210001857A (ko) | 2021-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7104683B2 (ja) | 情報を生成する方法および装置 | |
US11158102B2 (en) | Method and apparatus for processing information | |
KR102346046B1 (ko) | 3차원 가상 인물 입모양 변화 제어 방법 및 장치 | |
CN111476871B (zh) | 用于生成视频的方法和装置 | |
US20210201550A1 (en) | Method, apparatus, device and storage medium for animation interaction | |
JP7208952B2 (ja) | 対話モデルを生成するための方法及び装置 | |
CN111813910B (zh) | 客服问题的更新方法、系统、终端设备及计算机存储介质 | |
JP6971292B2 (ja) | 段落と映像を整列させるための方法、装置、サーバー、コンピュータ可読記憶媒体およびコンピュータプログラム | |
US20240070397A1 (en) | Human-computer interaction method, apparatus and system, electronic device and computer medium | |
WO2020211573A1 (zh) | 用于处理图像的方法和装置 | |
JP6949931B2 (ja) | 情報を生成するための方法および装置 | |
CN112182255A (zh) | 用于存储媒体文件和用于检索媒体文件的方法和装置 | |
CN117951723A (zh) | 任务数据的构建方法及装置、计算设备、可读存储介质 | |
CN114064943A (zh) | 会议管理方法、装置、存储介质及电子设备 | |
CN117632109A (zh) | 虚拟数字助手构建方法、装置、电子设备以及存储介质 | |
JP2023551169A (ja) | 何らかの音声コマンドを実行する間にar(拡張現実)ベースで周囲からの音を選択的に包含すること | |
CN118212935A (zh) | 信息处理方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200403 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200403 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210513 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210811 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211224 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220705 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220708 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7104683 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |