JP2018014094A - 仮想ロボットのインタラクション方法、システム及びロボット - Google Patents
仮想ロボットのインタラクション方法、システム及びロボット Download PDFInfo
- Publication number
- JP2018014094A JP2018014094A JP2017133166A JP2017133166A JP2018014094A JP 2018014094 A JP2018014094 A JP 2018014094A JP 2017133166 A JP2017133166 A JP 2017133166A JP 2017133166 A JP2017133166 A JP 2017133166A JP 2018014094 A JP2018014094 A JP 2018014094A
- Authority
- JP
- Japan
- Prior art keywords
- information
- interaction
- content
- user
- intention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J11/00—Manipulators not otherwise provided for
- B25J11/0005—Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24564—Applying rules; Deductive queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
Abstract
Description
仮想ロボットのインタラクション方法は、
ユーザのマルチモード情報の取得、
マルチモード情報の前処理とユーザ意図の識別、
前記マルチモード情報とユーザ意図に基づく内容情報の生成と生成テンプレートの選択、
前記内容情報と生成テンプレートをデフォルトルールによって組み合わせた後にインタラクション内容の生成、
インタラクション内容をイメージングシステムに送信し、イメージングシステムがそれに基づいて仮想3D映像の生成、
ロボットの前記インタラクション内容に基づく評価内容の生成を含む、ことを特徴とする。
ユーザのマルチモード情報を取得する取得モジュール、
前記マルチモード情報を前処理し、ユーザ意図を識別する意図識別モジュール、
前記マルチモード情報とユーザ意図に基づいて内容情報を生成して生成テンプレートを選択する処理モジュール、
前記内容情報と生成テンプレートをデフォルトルールによって組み合わせた後にインタラクション内容を生成する生成モジュール、
インタラクション内容をイメージングシステムに送信し、イメージングシステムはそれに基づいて仮想3D映像を生成する送信モジュール、
ロボットは前記インタラクション内容に基づいて評価情報を生成する評価モジュールを含む、ことを特徴とする仮想ロボットのインタラクションシステムを開示する。
前記マイク、前記アナログデジタルコンバータ、前記音声識別プロセッサと前記意図識別プロセッサは順次に接続され、前記画像取得装置、前記顔認識プロセッサと前記意図識別プロセッサは順次に接続され、前記意図識別プロセッサは前記インタラクション内容プロセッサと接続され、前記インタラクション内容プロセッサは前記メモリと接続され、前記音声合成装置、前記パワーアンプと前記スピーカーは順次に接続され、前記イメージングシステムは前記インタラクション内容プロセッサと接続され、
前記マイクはユーザとロボットが対話する際にユーザの音声信号の取得に用い、前記アナログデジタルコンバータは前記音声信号の音声デジタル情報への転換に用い、前記音声識別プロセッサは前記音声デジタル情報を文字情報に転化する上で前記意図識別プロセッサへの入力に用い、
前記画像取得装置はユーザを含む画像の取得に用い、前記顔認識プロセッサはユーザを含む画像からユーザの表情情報を識別し取得して前記意図識別プロセッサへの入力に用い、
前記意図識別プロセッサは前記文字情報と表情情報に基づくユーザ意図の識別に用い、
前記インタラクション内容プロセッサは前記文字情報、前記表情情報と前記ユーザ意図に基づいて内容情報を生成して生成テンプレートを選択し、前記内容情報と生成テンプレートをデフォルトルールによって組み合わせた後にインタラクション内容を生成し、前記インタラクション内容を前記イメージングシステムとスピーカーに送信し、且つ前記インタラクション内容に基づいて評価情報を生成し、前記インタラクション内容と評価情報をメモリに記憶することに用い、
前記イメージングシステムは前記インタラクション内容に基づいて仮想3D映像を生成し、スピーカーがインタラクション内容に基づいて音声信号を再生する、ことを特徴とする仮想ロボットのインタラクションシステム。
前記意図識別プロセッサは前記文字情報、前記表情情報と前記生理パラメータに基づくユーザ意図の識別に用い、
前記インタラクション内容プロセッサは前記文字情報、前記表情情報、前記生理パラメータ及び前記ユーザ意図に基づいて内容情報を生成して生成テンプレートを選択し、前記内容情報と生成テンプレートをデフォルトルールによって組み合わせた後にインタラクション内容を生成し、前記インタラクション内容を前記イメージングシステムとスピーカーに送信し、且つ前記インタラクション内容に基づいて評価情報を生成した後、前記インタラクション内容と評価情報をメモリに記憶することに用いる、ことを特徴する請求項12に記載のインタラクションシステム。
前記インタラクション内容プロセッサは前記文字情報、前記表情情報及び前記作画意図に基づいて画像情報を生成して画像スタイルテンプレートを選択し、選択した画像スタイルテンプレートと画像情報を組み合わせた後にインタラクション内容を生成し、前記インタラクション内容を前記イメージングシステムとスピーカーに送信し、前記インタラクション内容に基づいて評価情報を生成した後、前記インタラクション内容と前記評価情報を前記メモリに記憶する。
前記インタラクション内容プロセッサは前記文字情報、前記表情情報及び前記作曲意図に基づいて作曲スタイルテンプレートと作曲内容を選択し、前記作曲スタイルテンプレートと前記作曲内容に基づいてインタラクション内容を生成し、前記インタラクション内容を前記イメージングシステムとスピーカーに送信し、且つ前記インタラクション内容に基づいて評価情報を生成した後、前記インタラクション内容と評価情報をメモリに記憶する。
前記インタラクション内容プロセッサは前記文字情報、前記表情情報及び前記詩作意図に基づいて詩作スタイルテンプレートと詩作内容を選択し、前記詩作スタイルテンプレートと前記詩作内容に基づいてインタラクション内容を生成し、前記インタラクション内容を前記イメージングシステムとスピーカーに送信し、且つ前記インタラクション内容に基づいて評価情報を生成した後、前記インタラクション内容と評価情報をメモリに記憶する。
前記インタラクション内容プロセッサは前記文字情報、前記表情情報及び前記朗読意図に基づいて朗読内容と朗読背景を選択し、前記朗読内容と前記朗読背景に基づいてインタラクション内容を生成し、前記インタラクション内容を前記イメージングシステムとスピーカーに送信し、且つ前記インタラクション内容に基づいて評価情報を生成した後、前記インタラクション内容と評価情報をメモリに記憶する。
図1に示すように、本実施例は仮想ロボットのインタラクション方法を開示し、それは、
ユーザのマルチモード情報を取得するステップS101、
前記マルチモード情報を前処理し、ユーザ意図を識別するステップS102、
前記マルチモード情報とユーザ意図に基づいて内容情報を生成して生成テンプレートを選択するステップS103、
前記内容情報と生成テンプレートをデフォルトルールによって組み合わせた後にインタラクション内容を生成するステップS104、
インタラクション内容をイメージングシステムに送信し、イメージングシステムはそれに基づいて仮想3D映像を生成するステップS105、
ロボットは前記インタラクション内容に基づいて評価情報を生成するステップS106を含む。
前記マルチモード情報とユーザ意図に基づいて内容情報を生成して生成テンプレートを選択するステップはマルチモード情報とユーザ意図に基づいて画像情報を生成して画像スタイルテンプレートを選択することを含み、
前記内容情報と生成テンプレートをデフォルトルールによって組み合わせた後にインタラクション内容を生成するステップは選択した画像スタイルテンプレートと画像情報を組み合わせた後にインタラクション情報を生成することを含み、
前記イメージングシステムがインタラクション情報に基づいて仮想3D映像を生成するステップは、イメージングシステムがインタラクション内容に基づいて作画動作の3D映像を生成し、対応の音声を追加することを含む。
前記マルチモード情報とユーザ意図に基づいて内容情報を生成して生成テンプレートを選択するステップはマルチモード情報とユーザ意図に基づいて作曲スタイルテンプレートと作曲内容を選択することを含み、
前記内容情報と生成テンプレートをデフォルトルールによって組み合わせた後にインタラクション内容を生成するステップは前記作曲スタイルテンプレートと作曲内容に基づいてインタラクション内容を生成することを含み、
前記イメージングシステムがインタラクション情報に基づいて仮想3D映像を生成するステップは、イメージングシステムがインタラクション内容に基づいて作曲動作の3D映像を生成し、対応の音声を追加することを含む。
前記マルチモード情報とユーザ意図に基づいて内容情報を生成して生成テンプレートを選択するステップはマルチモード情報とユーザ意図に基づいて詩作スタイルテンプレートと詩作内容を選択することを含み、
前記内容情報と生成テンプレートをデフォルトルールによって組み合わせた後にインタラクション内容を生成するステップは前記詩作スタイルテンプレートと詩作内容に基づいてインタラクション内容を生成することを含み、
前記イメージングシステムがインタラクション情報に基づいて仮想3D映像を生成するステップは、イメージングシステムがインタラクション内容に基づいて詩作音声を生成した後、詩作動作の3D映像を追加することを含む。
前記マルチモード情報とユーザ意図に基づいて内容情報を生成して生成テンプレートを選択するステップは、マルチモード情報とユーザ意図に基づいて朗読内容と朗読背景を選択することを含み、
前記内容情報と生成テンプレートをデフォルトルールによって組み合わせた後インタラクション内容を生成するステップは、朗読内容と朗読背景に基づいてインタラクション内容を生成することを含み、
前記イメージングシステムがインタラクション情報に基づいて仮想3D映像を生成するステップは、イメージングシステムがインタラクション内容に基づいて朗読音声を生成し、且つ朗読動作の3D映像を追加することを含む。
図2に示すように、本実施例は、
ユーザのマルチモード情報を取得する取得モジュール201、
前記マルチモード情報を前処理し、ユーザ意図を識別する意図識別モジュール202、
前記マルチモード情報とユーザ意図に基づいて内容情報を生成して生成テンプレートを選択する処理モジュール203、
前記内容情報と生成テンプレートをデフォルトルールによって組み合わせた後にインタラクション内容を生成する生成モジュール204、
インタラクション内容をイメージングシステムに送信し、イメージングシステムはそれに基づいて仮想3D映像を生成する送信モジュール205、
ロボットは前記インタラクション内容に基づいて評価情報を生成するための評価モジュール206を含む。
その中における一つの実施例によっては、前記評価モジュールはまたユーザがインタラクション内容に対する評価を取得し、且つユーザの評価を相応のインタラクション内容カタログに記憶することに用いる。
前記処理モジュールはマルチモード情報とユーザ意図に基づいて画像情報を生成して画像スタイルテンプレートを選択することに用い、
前記生成モジュールが選択した画像スタイルテンプレートと画像情報を組み合わせた後にインタラクション内容を生成することに用い、
前記送信モジュールはイメージングシステムがインタラクション内容に基づいて作画動作の3D映像を生成し、且つ対応の音声の追加に用いる。
前記処理モジュールはマルチモード情報とユーザ意図に基づいて作曲スタイルテンプレートと作曲内容を選択することに用い、
前記生成モジュールが選択した作曲スタイルテンプレートと作曲内容によってインタラクション内容を生成することに用い、
前記送信モジュールはイメージングシステムがインタラクション内容に基づいて作曲動作の3D映像を生成し、且つ対応の音声を追加することに用いる。
前記処理モジュールはマルチモード情報とユーザ意図に基づいて詩作スタイルテンプレートと詩作内容を選択することに用い、
前記生成モジュールは選択された詩作スタイルテンプレートと詩作内容によってインタラクション内容を生成することに用い、
前記送信モジュールはイメージングシステムがインタラクション内容に基づいて詩作音声を生成し、且つ詩作動作の3D映像を追加することに用いる。
前記処理モジュールはマルチモード情報とユーザ意図に基づいて朗読内容と朗読背景を選択することに用い、
前記生成モジュールは朗読内容と朗読背景によってインタラクション内容を生成することに用い、
前記送信モジュールはイメージングシステムがインタラクション内容に基づいて朗読音声を生成し、且つ朗読動作の3D映像を追加することに用いる。
図3に示すように、本実施例はマイク301、アナログデジタルコンバータ302、音声識別プロセッサ303、画像取得装置304、顔認識プロセッサ305、意図識別プロセッサ306、音声合成装置307、パワーアンプ308、スピーカー309、イメージングシステム310、インタラクション内容プロセッサ311、メモリ312を含む仮想ロボットのインタラクションシステム300を開示する。
Claims (20)
- 仮想ロボットのインタラクション方法であって、
ユーザのマルチモード情報の取得、
マルチモード情報の前処理とユーザ意図の識別、
前記マルチモード情報とユーザ意図に基づく内容情報の生成と生成テンプレートの選択、
前記内容情報と生成テンプレートをデフォルトルールによって組み合わせた後にインタラクション内容の生成、
インタラクション内容をイメージングシステムに送信し、イメージングシステムがそれに基づいて仮想3D映像の生成、
ロボットからの前記インタラクション内容に基づく評価内容の生成を含む、
ことを特徴とする仮想ロボットのインタラクション方法。 - インタラクション内容を生成するステップに続いて、また、前記インタラクション内容を移動端末に送信し、前記移動端末がそれに基づいて画像、音声、文字の一種や多種類を生成し、且つ表示することを含む、
ことを特徴とする請求項1に記載のインタラクション方法。 - インタラクション内容をイメージングシステムと移動端末に送信するステップに続いて、また、ユーザのインタラクションに対する評価を取得し、且つユーザの評価を相応のインタラクション内容カタログに記憶することを含む、
ことを特徴とする請求項2に記載のインタラクション方法。 - 前記マルチモード情報を前処理し、ユーザ意図を識別するステップは、具体的に、マルチモード情報を前処理し、ユーザがロボットを制御して作画する意図を識別することを含み、
前記マルチモード情報とユーザ意図に基づいて内容情報を生成して生成テンプレートを選択するステップは、マルチモード情報とユーザ意図に基づいて画像情報を生成して画像スタイルテンプレートを選択することを含み、
前記内容情報と生成テンプレートをデフォルトルールによって組み合わせた後にインタラクション内容を生成するステップは、選択した画像スタイルテンプレートと画像情報を組み合わせた後にインタラクション情報を生成することを含み、
前記イメージングシステムがインタラクション情報に基づいて仮想3D映像を生成するステップは、イメージングシステムがインタラクション内容に基づいて作画動作の3D映像を生成し、且つ対応する音声の追加を含む、
ことを特徴とする請求項1に記載のインタラクション方法。 - 前記画像情報は、ロボットデータベースやユーザギャラリーから取得される、
ことを特徴とする請求項4に記載のインタラクション方法。 - 前記マルチモード情報を前処理し、ユーザ意図を識別するステップは、マルチモード情報を前処理し、ユーザがロボットを制御して作曲する意図を識別することを含み、
前記マルチモード情報とユーザ意図に基づいて内容情報を生成して生成テンプレートを選択するステップは、マルチモード情報とユーザ意図に基づいて作曲スタイルテンプレートと作曲内容を選択することを含み、
前記内容情報と生成テンプレートをデフォルトルールによって組み合わせた後にインタラクション内容を生成するステップは、選択された作曲スタイルテンプレートと作曲内容に基づいてインタラクション内容を生成することを含み、
前記イメージングシステムがインタラクション情報に基づいて仮想3D映像を生成するステップは、イメージングシステムがインタラクション内容に基づいて作曲動作の3D映像を生成し、且つ対応する音声の追加を含む、
ことを特徴とする請求項1に記載のインタラクション方法。 - 前記マルチモード情報を前処理し、ユーザ意図を識別するステップは、マルチモード情報を前処理し、ユーザがロボットを制御して詩作する意図を識別することを含み、
前記マルチモード情報とユーザ意図に基づいて内容情報を生成して生成テンプレートを選択するステップは、マルチモード情報とユーザ意図に基づいて詩作スタイルテンプレートと詩作内容を選択することを含み、
前記内容情報と生成テンプレートをデフォルトルールによって組み合わせた後にインタラクション内容を生成するステップは、選択された詩作スタイルテンプレートと詩作内容に基づいてインタラクション内容を生成することを含み、
前記イメージングシステムがインタラクション情報に基づいて仮想3D映像を生成するステップは、イメージングシステムがインタラクション内容に基づいて詩作音声を生成し、且つ詩作動作の3D映像の追加を含む、
ことを特徴とする請求項1に記載のインタラクション方法。 - 前記マルチモード情報を前処理し、ユーザ意図を識別するステップは、マルチモード情報を前処理し、ユーザがロボットを制御して朗読する意図を識別することを含み、
前記マルチモード情報とユーザ意図に基づいて内容情報を生成して生成テンプレートを選択するステップは、マルチモード情報とユーザ意図に基づいて朗読内容と朗読背景を選択することを含み、
前記内容情報と生成テンプレートをデフォルトルールによって組み合わせた後にインタラクション内容を生成するステップは、朗読内容と朗読背景に基づいてインタラクション内容を生成することを含み、
前記イメージングシステムがインタラクション情報に基づいて仮想3D映像を生成するステップは、イメージングシステムがインタラクション内容に基づいて朗読する音声を生成し、且つ朗読動作の3D映像の追加を含む、
ことを特徴とする請求項1に記載のインタラクション方法。 - 仮想ロボットのインタラクションシステムであって、
ユーザのマルチモード情報を取得する取得モジュール、
前記マルチモード情報を前処理し、ユーザ意図を識別する意図識別モジュール、
前記マルチモード情報とユーザ意図に基づいて内容情報を生成して生成テンプレートを選択する処理モジュール、
前記内容情報と生成テンプレートをデフォルトルールによって組み合わせた後にインタラクション内容を生成する生成モジュール、
インタラクション内容をイメージングシステムに送信し、イメージングシステムがそれに基づいて仮想3D映像を生成する送信モジュール、
ロボットが前記インタラクション内容に基づいて評価情報を生成する評価モジュールを備える、
ことを特徴とするインタラクションシステム。 - 前記送信モジュールはまた、インタラクション内容を移動端末に送信し、移動端末がそれに基づいて画像、音声、文字の一種や多種類を生成し、且つ表示することに用いられる、
ことを特徴とする請求項9に記載のインタラクションシステム。 - ロボットであって、請求項9から10までのいずれかに記載の仮想ロボットのインタラクションシステムを含む
ことを特徴とするロボット。 - 仮想ロボットのインタラクションシステムであって、マイク、アナログデジタルコンバータ、音声識別プロセッサ、画像取得装置、顔認識プロセッサ、意図識別プロセッサ、音声合成装置、パワーアンプ、スピーカー、イメージングシステム、インタラクション内容プロセッサ、メモリを含み、
前記マイク、前記アナログデジタルコンバータ、前記音声識別プロセッサと前記意図識別プロセッサは順次に接続され、前記画像取得装置、前記顔認識プロセッサと前記意図識別プロセッサは順次に接続され、前記意図識別プロセッサは前記インタラクション内容プロセッサと接続され、前記インタラクション内容プロセッサは前記メモリと接続され、前記音声合成装置、前記パワーアンプと前記スピーカーは順次に接続され、前記イメージングシステムは前記インタラクション内容プロセッサと接続され、
前記マイクは、ユーザとロボットが対話する際にユーザの音声信号の取得に用い、前記アナログデジタルコンバータは前記音声信号の音声デジタル情報への転換に用い、前記音声識別プロセッサは前記音声デジタル情報を文字情報に転化する上で前記意図識別プロセッサへの入力に用い、
前記画像取得装置は、ユーザがいる画像の取得に用い、前記顔認識プロセッサはユーザがいる画像からユーザの表情情報を識別し取得して前記意図識別プロセッサへの入力に用い、
前記意図識別プロセッサは、前記文字情報と表情情報に基づくユーザ意図の識別に用い、
前記インタラクション内容プロセッサは、前記文字情報、前記表情情報と前記ユーザ意図に基づいて内容情報を生成して生成テンプレートを選択し、前記内容情報と生成テンプレートをデフォルトルールによって組み合わせた後にインタラクション内容を生成し、前記インタラクション内容を前記イメージングシステムとスピーカーに送信し、且つ前記インタラクション内容に基づいて評価情報を生成し、前記インタラクション内容と評価情報をメモリに記憶することに用い、
前記イメージングシステムは、前記インタラクション内容に基づいて仮想3D映像を生成し、スピーカーはインタラクション内容に基づいて音声信号を同時に再生する、
ことを特徴とする仮想ロボットのインタラクションシステム。 - またユーザの複数の生理信号を取得し、信号プリプロセッサによって前記生理信号を前処理した後に生理パラメータを得、且つ前記生理パラメータを意図識別プロセッサに送信することに用いる複数のセンサーを含み、
前記意図識別プロセッサは前記文字情報、前記表情情報と前記生理パラメータに基づくユーザ意図の識別に用い、
前記インタラクション内容プロセッサは前記文字情報、前記表情情報、前記生理パラメータ及び前記ユーザ意図に基づいて内容情報を生成して生成テンプレートを選択し、前記内容情報と生成テンプレートをデフォルトルールによって組み合わせた後にインタラクション内容を生成し、前記インタラクション内容を前記イメージングシステムとスピーカーに送信し、且つ前記インタラクション内容に基づいて評価情報を生成した後、前記インタラクション内容と評価情報をメモリに記憶することに用いる、
ことを特徴する請求項12に記載のインタラクションシステム。 - また前記インタラクションプロセッサと接続される無線通信装置を含み、前記インタラクション内容プロセッサはまたインタラクション内容を移動端末に送信し、前記移動端末はそれに基づいて画像、音声、文字の一種や多種類を生成し、且つ表示する、
ことを特徴とする請求項12に記載のインタラクションシステム。 - 前記システムはまたユーザが前記移動端末によって返事するインタラクション内容に対する評価を受信し、且つユーザの評価を前記メモリに対応するインタラクション内容カタログに記憶する、
ことを特徴とする請求項14に記載のインタラクションシステム。 - 前記意図識別プロセッサは前記文字情報と表情情報に基づいてユーザがロボットを制御して作画する意図の識別に用い、
前記インタラクション内容プロセッサは前記文字情報、前記表情情報及び前記作画意図に基づいて画像情報を生成して画像スタイルテンプレートを選択し、選択した画像スタイルテンプレートと画像情報を組み合わせた後にインタラクション内容を生成し、前記インタラクション内容を前記イメージングシステムとスピーカーに送信し、前記インタラクション内容に基づいて評価情報を生成した後、前記インタラクション内容と評価情報を前記メモリに記憶することに用いる、
ことを特徴とする請求項12に記載のインタラクションシステム。 - 前記画像情報はロボットデータベースやユーザギャラリーから取得される、
ことを特徴とする請求項16に記載のインタラクションシステム。 - 前記意図識別プロセッサは前記文字情報と表情情報に基づいてユーザがロボットを制御して作曲する意図の識別に用い、
前記インタラクション内容プロセッサは前記文字情報、前記表情情報及び前記ユーザの作曲意図に基づいて作曲スタイルテンプレートと作曲内容を選択し、作曲スタイルテンプレートと作曲内容に基づいてインタラクション内容を生成し、前記インタラクション内容を前記イメージングシステムとスピーカーに送信し、且つ前記インタラクション内容に基づいて評価情報を生成した後、前記インタラクション内容と評価情報をメモリに記憶する、
ことを特徴とする請求項12に記載のインタラクションシステム。 - 前記意図識別プロセッサは前記文字情報と表情情報に基づいてユーザがロボットを制御し詩作する意図の識別に用い、
前記インタラクション内容プロセッサは前記文字情報、前記表情情報及び前記詩作意図に基づいて詩作スタイルテンプレートと詩作内容を選択し、詩作スタイルテンプレートと詩作内容に基づいてインタラクション内容を生成し、前記インタラクション内容を前記イメージングシステムとスピーカーに送信し、且つ前記インタラクション内容に基づいて評価情報を生成した後、前記インタラクション内容と評価情報をメモリに記憶する、
ことを特徴とする請求項12に記載のインタラクションシステム。 - 前記意図識別プロセッサは前記文字情報と表情情報に基づいてユーザがロボットを制御して朗読する意図の識別に用い、
前記インタラクション内容プロセッサは前記文字情報、前記表情情報及び前記朗読意図に基づいて朗読内容と朗読背景を選択し、朗読内容と朗読背景に基づいてインタラクション内容を生成し、前記インタラクション内容を前記イメージングシステムとスピーカーに送信し、且つ前記インタラクション内容に基づいて評価情報を生成した後、前記インタラクション内容と評価情報をメモリに記憶する、
ことを特徴とする請求項12に記載のインタラクションシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNPCT/CN2016/089219 | 2016-07-07 | ||
PCT/CN2016/089219 WO2018006375A1 (zh) | 2016-07-07 | 2016-07-07 | 一种虚拟机器人的交互方法、系统及机器人 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018014094A true JP2018014094A (ja) | 2018-01-25 |
Family
ID=58838971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017133166A Pending JP2018014094A (ja) | 2016-07-07 | 2017-07-06 | 仮想ロボットのインタラクション方法、システム及びロボット |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP2018014094A (ja) |
CN (1) | CN106663127A (ja) |
WO (1) | WO2018006375A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7469211B2 (ja) | 2020-10-21 | 2024-04-16 | 東京瓦斯株式会社 | 対話型コミュニケーション装置、コミュニケーションシステム及びプログラム |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107678617A (zh) * | 2017-09-14 | 2018-02-09 | 北京光年无限科技有限公司 | 面向虚拟机器人的数据交互方法和系统 |
CN107728780B (zh) * | 2017-09-18 | 2021-04-27 | 北京光年无限科技有限公司 | 一种基于虚拟机器人的人机交互方法及装置 |
CN107748621A (zh) * | 2017-11-06 | 2018-03-02 | 潘柏霖 | 一种智能交互机器人 |
CN108133259A (zh) * | 2017-12-14 | 2018-06-08 | 深圳狗尾草智能科技有限公司 | 人工虚拟生命与外界交互的系统及方法 |
CN108043025A (zh) * | 2017-12-29 | 2018-05-18 | 江苏名通信息科技有限公司 | 一种用于网络游戏的人机交互方法 |
CN108356832B (zh) * | 2018-03-07 | 2021-04-20 | 佛山融芯智感科技有限公司 | 一种室内机器人人机互动系统 |
CN110576433B (zh) * | 2018-06-08 | 2021-05-18 | 香港商女娲创造股份有限公司 | 机器人动作生成方法 |
CN108958050A (zh) * | 2018-07-12 | 2018-12-07 | 李星仪 | 用于智能生活应用的展示平台系统 |
CN109379350A (zh) * | 2018-09-30 | 2019-02-22 | 北京猎户星空科技有限公司 | 日程表生成方法、装置、设备及计算机可读存储介质 |
CN112529992B (zh) * | 2019-08-30 | 2022-08-19 | 阿里巴巴集团控股有限公司 | 虚拟形象的对话处理方法、装置、设备及存储介质 |
CN110868635B (zh) * | 2019-12-04 | 2021-01-12 | 深圳追一科技有限公司 | 视频处理方法、装置、电子设备及存储介质 |
CN111327772B (zh) * | 2020-02-25 | 2021-09-17 | 广州腾讯科技有限公司 | 进行自动语音应答处理的方法、装置、设备及存储介质 |
CN113012300A (zh) * | 2021-04-02 | 2021-06-22 | 北京隐虚等贤科技有限公司 | 沉浸式互动内容的创建方法、装置以及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11219195A (ja) * | 1998-02-04 | 1999-08-10 | Atr Chino Eizo Tsushin Kenkyusho:Kk | 対話型詩朗読システム |
JP2003296604A (ja) * | 2002-04-03 | 2003-10-17 | Yozo Watanabe | 曲提供装置、方法及びコンピュータプログラム |
JP2006123136A (ja) * | 2004-11-01 | 2006-05-18 | Advanced Telecommunication Research Institute International | コミュニケーションロボット |
JP2007219393A (ja) * | 2006-02-20 | 2007-08-30 | Doshisha | 画像から音楽を生成する音楽生成装置 |
JP2007241764A (ja) * | 2006-03-09 | 2007-09-20 | Fujitsu Ltd | 構文解析プログラム、構文解析方法、構文解析装置、及び構文解析プログラムが記録されたコンピュータ読み取り可能な記録媒体 |
JP2015138147A (ja) * | 2014-01-22 | 2015-07-30 | シャープ株式会社 | サーバ、対話装置、対話システム、対話方法および対話プログラム |
JP2015206878A (ja) * | 2014-04-18 | 2015-11-19 | ソニー株式会社 | 情報処理装置および情報処理方法 |
JP2015211403A (ja) * | 2014-04-28 | 2015-11-24 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | 応答システム、応答方法及びコンピュータプログラム |
JP2016510452A (ja) * | 2013-01-09 | 2016-04-07 | マイクロソフト テクノロジー ライセンシング,エルエルシー | アクションを決定する際の非言語コミュニケーションの使用 |
JP2016099444A (ja) * | 2014-11-20 | 2016-05-30 | カシオ計算機株式会社 | 自動作曲装置、方法、およびプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2530515A (en) * | 2014-09-24 | 2016-03-30 | Sony Comp Entertainment Europe | Apparatus and method of user interaction |
CN104951077A (zh) * | 2015-06-24 | 2015-09-30 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法、装置和终端设备 |
CN104965592A (zh) * | 2015-07-08 | 2015-10-07 | 苏州思必驰信息科技有限公司 | 基于语音和手势识别的多模态非触摸人机交互方法及系统 |
-
2016
- 2016-07-07 CN CN201680001715.6A patent/CN106663127A/zh active Pending
- 2016-07-07 WO PCT/CN2016/089219 patent/WO2018006375A1/zh active Application Filing
-
2017
- 2017-07-06 JP JP2017133166A patent/JP2018014094A/ja active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11219195A (ja) * | 1998-02-04 | 1999-08-10 | Atr Chino Eizo Tsushin Kenkyusho:Kk | 対話型詩朗読システム |
JP2003296604A (ja) * | 2002-04-03 | 2003-10-17 | Yozo Watanabe | 曲提供装置、方法及びコンピュータプログラム |
JP2006123136A (ja) * | 2004-11-01 | 2006-05-18 | Advanced Telecommunication Research Institute International | コミュニケーションロボット |
JP2007219393A (ja) * | 2006-02-20 | 2007-08-30 | Doshisha | 画像から音楽を生成する音楽生成装置 |
JP2007241764A (ja) * | 2006-03-09 | 2007-09-20 | Fujitsu Ltd | 構文解析プログラム、構文解析方法、構文解析装置、及び構文解析プログラムが記録されたコンピュータ読み取り可能な記録媒体 |
JP2016510452A (ja) * | 2013-01-09 | 2016-04-07 | マイクロソフト テクノロジー ライセンシング,エルエルシー | アクションを決定する際の非言語コミュニケーションの使用 |
JP2015138147A (ja) * | 2014-01-22 | 2015-07-30 | シャープ株式会社 | サーバ、対話装置、対話システム、対話方法および対話プログラム |
JP2015206878A (ja) * | 2014-04-18 | 2015-11-19 | ソニー株式会社 | 情報処理装置および情報処理方法 |
JP2015211403A (ja) * | 2014-04-28 | 2015-11-24 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | 応答システム、応答方法及びコンピュータプログラム |
JP2016099444A (ja) * | 2014-11-20 | 2016-05-30 | カシオ計算機株式会社 | 自動作曲装置、方法、およびプログラム |
Non-Patent Citations (2)
Title |
---|
山本 大介 外: "スマートフォン単体で動作する音声対話3Dエージェント「スマートメイちゃん」の開発", インタラクション2013 情報処理学会 シンポジウムシリーズ VOL.2013 NO.1 [CD−R, JPN6020003740, 21 February 2013 (2013-02-21), JP, pages 675 - 680, ISSN: 0004206459 * |
山本 大介: "スマートフォン単体で動作する音声対話3Dエージェント「スマートメイちゃん」の開発", インタラクション2013 情報処理学会 シンポジウムシリーズ VOL.2013 NO.1 [CD−R, JPN6018031098, 21 February 2013 (2013-02-21), JP, pages 675 - 680, ISSN: 0004206460 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7469211B2 (ja) | 2020-10-21 | 2024-04-16 | 東京瓦斯株式会社 | 対話型コミュニケーション装置、コミュニケーションシステム及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN106663127A (zh) | 2017-05-10 |
WO2018006375A1 (zh) | 2018-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2018014094A (ja) | 仮想ロボットのインタラクション方法、システム及びロボット | |
US11226673B2 (en) | Affective interaction systems, devices, and methods based on affective computing user interface | |
CN110688911B (zh) | 视频处理方法、装置、系统、终端设备及存储介质 | |
US11423909B2 (en) | Word flow annotation | |
US11511436B2 (en) | Robot control method and companion robot | |
TWI430189B (zh) | 訊息擬真處理系統、裝置及方法 | |
CN112162628A (zh) | 基于虚拟角色的多模态交互方法、装置及系统、存储介质、终端 | |
CN108326855A (zh) | 一种机器人的交互方法、装置、设备以及存储介质 | |
TWI486904B (zh) | 律動影像化方法、系統以及電腦可讀取記錄媒體 | |
Scherer et al. | A generic framework for the inference of user states in human computer interaction: How patterns of low level behavioral cues support complex user states in HCI | |
CN111414506B (zh) | 基于人工智能情绪处理方法、装置、电子设备及存储介质 | |
CN110598576A (zh) | 一种手语交互方法、装置及计算机介质 | |
Oliveira et al. | Automatic sign language translation to improve communication | |
Kabani et al. | Emotion based music player | |
KR20190089451A (ko) | 텍스트와 연관된 이미지를 제공하는 전자 장치 및 그 동작 방법 | |
CN110825164A (zh) | 基于儿童专用穿戴智能设备的交互方法及系统 | |
KR20200059112A (ko) | 로봇 상호작용 시스템 및 그를 위한 프로그램 | |
Liu | Analysis of gender differences in speech and hand gesture coordination for the design of multimodal interface systems | |
CN113205569A (zh) | 图像绘制方法及装置、计算机可读介质和电子设备 | |
WO2023246163A1 (zh) | 一种虚拟数字人驱动方法、装置、设备和介质 | |
CN111949773A (zh) | 一种阅读设备、服务器以及数据处理的方法 | |
JP7130290B2 (ja) | 情報抽出装置 | |
Feldman et al. | Engagement with artificial intelligence through natural interaction models | |
JP7096626B2 (ja) | 情報抽出装置 | |
Park et al. | Music-aided affective interaction between human and service robot |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170706 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180814 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190514 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190809 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20200204 |