JP2021043435A - 音声スキル作成方法、音声スキル作成装置、電子機器及び記憶媒体 - Google Patents

音声スキル作成方法、音声スキル作成装置、電子機器及び記憶媒体 Download PDF

Info

Publication number
JP2021043435A
JP2021043435A JP2020069176A JP2020069176A JP2021043435A JP 2021043435 A JP2021043435 A JP 2021043435A JP 2020069176 A JP2020069176 A JP 2020069176A JP 2020069176 A JP2020069176 A JP 2020069176A JP 2021043435 A JP2021043435 A JP 2021043435A
Authority
JP
Japan
Prior art keywords
voice
plot
voice skill
speech
skill
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020069176A
Other languages
English (en)
Other versions
JP6986590B2 (ja
Inventor
チィー,ヤオウェン
Yaowen Qi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Original Assignee
Baidu Online Network Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu Online Network Technology Beijing Co Ltd filed Critical Baidu Online Network Technology Beijing Co Ltd
Publication of JP2021043435A publication Critical patent/JP2021043435A/ja
Application granted granted Critical
Publication of JP6986590B2 publication Critical patent/JP6986590B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/33Intelligent editors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/38Creation or generation of source code for implementing user interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0638Interactive procedures

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】プロの開発能力を有していないユーザーがスマートデバイスのために音声スキルを作成し、音声スキルの作成とメンテナンスの効率を向上させる音声スキル作成方法、音声スキル作成装置、電子機器及び記憶媒体を提供する。【解決手段】音声スキル作成方法は、音声スキルの作成要求に応答して、少なくともプロット構成サブインターフェースを含む編集インターフェースを表示し、ユーザーがプロット構成サブインターフェースを介して構成されたプロットインタラクティブテキストを取得し、プロットインタラクティブテキストで音声インタラクティブ話術を生成し、音声インタラクティブ話術に基づいて音声スキルを作成する。【選択図】図1a

Description

本願実施例はインターネット技術分野に関し、特に音声スキル技術分野、具体的に、音声スキル作成方法、音声スキル作成装置、電子機器及び記憶媒体に関する。
人工知能技術の発展に伴い、例えばスマートスピーカーなどのスマートデバイスがますます広範囲になり、そして人々の日常生活にあふれている。音声スキルはスマートデバイスの基礎機能として、ユーザーに会話型インタラクティブサービスを提供し、ユーザーの実際の生活でのインタラクティブ場面をシミュレーションすることができる。ここで、スキルは極めて重要な分枝であり、ユーザー音声インタラクション可能なインタラクティブ場面を実現させることができ、ユーザーは音声のみを通じてとのインタラクションを完成させることができ、人とインタラクションするように自然である。
現在、音声スキルはプロの開発者のみがコードを編纂することによって作成させされ、プロの開発能力を有していないユーザーにとっては、自発的に音声スキルを作成及びメンテナンスすることができない。したがって、音声スキルの作成とメンテナンスについては、効率が低い。
本願実施例は、プロの開発能力を有していないユーザーがスマートデバイスのために音声スキルを作成し、音声スキルの作成とメンテナンスの効率を上昇させる音声スキル作成方法、音声スキル作成装置、電子機器及び記憶媒体を提供している。
第1態様において、本願の実施例では音声スキル作成方法を提供し、上記音声スキル作成方法は、音声スキルの作成要求に応答して、編集インターフェースを表示するステップであって、前記編集インターフェースには少なくともプロット構成サブインターフェースを含むステップと、ユーザーが前記プロット構成サブインターフェースを介して構成されたプロットインタラクティブテキストを取得するステップと、前記プロットインタラクティブテキストで音声インタラクティブ話術を生成し、前記音声インタラクティブ話術に基づいて音声スキルを作成するステップと、を含む。
上記出願での一つの実施例は具体的には、ユーザーがプロットを構成するために一つの編集インターフェースを提供し、またユーザーが構成したプロットを音声インタラクティブ話術を生成して、さらに音声インタラクティブ話術に基づいて音声スキルを作成し、これによりプロの開発能力を有していないユーザーがスマートデバイスが作成した音声スキルのために、音声スキルの作成とメンテナンスの効率を上昇させることができるとの利点または有益な効果を有している。
選択可能に、前記プロット構成サブインターフェースは、前記プロットにおけるステップと、各ステップに関する質問と、各質問に関する異なる選択コンテンツと、異なる選択コンテンツのジャンプステップ番号と、を構成する。
上記出願での一つの実施例は、プロット構成サブインターフェースを提供することにより、ユーザーがプロットを構成する効率を上昇させるとの利点または有益な効果を有している。
選択可能に、前記プロットインタラクティブテキストで音声インタラクティブ話術を生成し、また前記音声インタラクティブ話術に基づいて音声スキルを作成するステップは、前記プロットにおける各ステップに関する質問と、各質問に関する異なる選択コンテンツに基づいて、音声インタラクティブ話術を生成するステップと、前記音声インタラクティブ話術と、前記プロットにおけるステップと異なる選択コンテンツのジャンプステップ番号とに基づいて、音声スキルを生成するステップと、を含む。
上記出願での一つの実施例は、プロットステップに関する質問及び選択に基づいてインタラクション話術を生成して、異なるステップの間のジャンプステップ番号を合わせて、音声スキルを作成し、これにより音声スキルを作成する効率を上昇させることができるとの利点または有益な効果を有している。
選択可能に、前記編集インターフェースは、音声スキルに入る場合に放送される歓迎メッセージを構成する歓迎メッセージ構成サブインターフェースをさらに含む。
選択可能に、前記編集インターフェースは、音声スキルを終了する場合に放送される終了メッセージを構成する終了メッセージ構成サブインターフェースをさらに含む。
選択可能に、前記編集インターフェースは、案内メッセージを構成する意図理解不能な構成サブインターフェースをさらに含み、ユーザーの音声認識結果が音声スキル内のプロットの音声インタラクティブ場面設定に中ってない場合に、前記案内メッセージを放送して、ユーザーがプロット内の設定命令でインタラクトすることを提示しかつ案内する。
選択可能に、前記編集インターフェースは、カスタム返信コンテンツを構成するカスタム返信構成サブインターフェースをさらに含む。前記カスタム返信コンテンツは、少なくとも、意図と、表現と、返信コンテンツとを含み、ユーザーによって現在表現されている音声認識結果が前記意図に中った後、前記返信コンテンツを放送することに用いられる。
上記出願での一つの実施例は、編集インターフェースは歓迎メッセージ構成サブインターフェース、終了メッセージ構成サブインターフェース、意図理解不能な構成サブインターフェース、カスタム返信構成サブインターフェースを提供し、相応な構成によってユーザーが音声インタラクトすることを案内または助けることで、インタラクションコンテンツを豊富にし、インタラクションの効率を上昇させることができるとの利点または有益な効果を有している。
選択可能に、前記編集インターフェースは、前記プロット内の任意の位置で放送される音響効果を構成する音響効果挿入サブインターフェースをさらに含む。
上記出願での一つの実施例は、音響効果を挿入することにより、作成した音声スキルの豊富性を高めるとの利点または有益な効果を有している。
前記方法は、前記編集インターフェースのコードエクスポートコントロールのトリガ操作に応答して、現在作成された音声スキルをコード形式でエクスポートし、音声スキルのコードファイルを取得するステップをさらに含む。
上記出願での一つの実施例は、現在作成した音声スキルをコードの形式でエクスポートすることにより、ユーザーがコードに対して再編集を行うことができ、スキルがさらに豊富になるとの利点または有益な効果を有している。
第二態様において、本願実施例は音声スキル作成装置を提供し、前記音声スキル作成装置は、音声スキルの作成要求に応答して、編集インターフェースを表示する編集インターフェース表示モジュールであって、前記編集インターフェースに少なくともプロット構成サブインターフェースを含む編集インターフェース表示モジュールと、ユーザーが前記プロット構成サブインターフェースによって構成したプロットインタラクティブテキストを取得するプロット取得モジュールと、前記プロットインタラクティブテキストで音声インタラクティブ話術を生成し、前記音声インタラクティブ話術に基づいて音声スキルを作成するスキル作成モジュールと、を含む。
第三態様において、本願実施例は電子機器を提供し、前記電子機器は、少なくとも一つのプロセッサと、前記少なくとも一つのプロセッサと通信接続するメモリと、を含み、
前記メモリには前記少なくとも一つのプロセッサによって実行可能な命令が記憶され、前記命令は前記少なくとも一つのプロセッサが本願任意の実施例が述べる音声スキル作成方法を実行できるように、前記少なくとも一つのプロセッサに実行される。
第4態様において、本願の実施例は、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体をさらに提供し、前記コンピュータ命令は、前記コンピュータに本願の任意の実施例に係る音声スキル作成方法を実行させる。
上記出願の一つの実施例は、以下の利点または有益な効果を有する。ユーザーがプロットを構成するために編集インターフェースを提供し、またユーザーが構成したプロットを音声インタラクティブ話術を生成して、さらに音声インタラクティブ話術に基づいて音声スキルを作成し、これによりプロの開発能力を有していないユーザーがスマートデバイスが作成した音声スキルのために、音声スキルの作成とメンテナンスの効率を上昇させることができる。また編集インターフェースは歓迎メッセージ構成サブインターフェースと、終了メッセージ構成サブインターフェースと、意図理解不能な構成サブインターフェースと、カスタム返信構成サブインターフェースとをさらに提供し、相応な構成によってユーザーが音声インタラクトすることを案内または助けることで、インタラクションコンテンツを豊富にし、インタラクションの効率を上昇させることができる。同時に、ユーザーがコードに対して再編集できるように、現在作成した音声スキルをコードの形式でエクスポートし、スキルをさらに豊富にする。
上記の選択可能な態様が有する他の効果については、具体的な実施例と併せて以下に説明する。
図面は、本願の構成をより良く理解するためのものであり、本願を限定するものではない。
本発明の実施例による音声スキル作成方法の概略フロチャートである。 本発明の実施例によるプロットを構成済みのプロット構成サブインターフェースの効果概略図である。 本発明の実施例による編集インターフェースの効果概略図である。 本発明の実施例によるもう一つの音声スキル作成方法の概略フロチャートである。 本発明の実施例による音声スキル作成装置の概略構成図である。 本発明の実施例の音声スキル作成方法を実現させるための電子機器のブロック図である。
本願の例示的な実施例について、図面を参照して以下に説明する。理解を容易にするために、その中に本願の実施例の様々な詳細が含まれ、それらは単なる例示と見なされるべきである。したがって、当業者は、本願の範囲および精神から逸脱する必要がなく、本明細書に記載の実施例に様々な変更および修正を加えることができることを認識すべきである。また、明確さおよび簡潔さのために、周知の機能および構成の説明は、以下の説明では省略される。
図1aは本発明の実施例による音声スキル作成方法の概略フロチャートである。本実施例は音声認識能力を有するスマートデバイスのために音声スキルを開発する状況に適用してよく、例えばスマートデバイスのためにストーリ系音声スキルを開発することができる。当該方法は音声スキル作成装置によって実行されることができる。当該装置はソフトウェア及び/またはハードウェアを採用する方式で実現し、電子機器の中に構成することが好ましい。例えば、スマートスピーカーなどのスマートデバイス、またはスマートデバイスのために音声スキルを作成するサーバーに用いられる。如図1aに示すように、当該方法は、具体的に、以下のS101〜S103を含むことができる。
S101、音声スキルの作成要求に応答して、編集インターフェースを表示する。
前記編集インターフェースには少なくともプロット構成サブインターフェースを含み、前記プロット構成サブインターフェースは、プロットにおけるステップと、各ステップに関する質問と、各質問に関する異なる選択コンテンツと、異なる選択コンテンツのジャンプステップ番号と、を構成する。
プロット構成サブインターフェースは、「新しいステップを増やす」コントロールを提供し、ユーザーは当該コントロールをクリックすることにより、一つの新しいステップを増やすことができ、同時にプロットで当該ステップに関する質問、各質問に関する異なる選択コンテンツ及び異なる選択コンテンツのジャンプステップ番号を編纂する。なお、ユーザーは直接文字入力の方式で編纂を行うことができ、コードを編纂することによって実現させることなく、素人でも簡単で迅速にプロット構成サブインターフェースを利用してプロットの編纂を完成させることができると保証する。例示的に、図1bを参照して、それはプロットを構成済みのプロット構成サブインターフェースの効果概略図である。
S102、ユーザーが前記プロット構成サブインターフェースによって構成したプロットインタラクティブテキストを取得する。
なお、図1bに示すように、ストーリ系音声スキルを作成することを例として、プロット構成サブインターフェースにストーリプロットを加え、ユーザーがプロットを編集した後、システムは裏でプロットの全てのステップ、及び各ステップに関する質問、各質問に関する異なる選択コンテンツ及び異なる選択コンテンツのジャンプステップ番号を取得することができ、そして取得したデータコンテンツをプロットインタラクティブテキストとすることができる。
S103、前記プロットインタラクティブテキストで音声インタラクティブ話術を生成し、前記音声インタラクティブ話術に基づいて音声スキルを作成する。
選択可能に、以下のようなステップで音声スキルを作成することができる。
S1、プロットで各ステップに関する質問と、各質問に関する異なる選択コンテンツとで、音声インタラクティブ話術を生成する。
例示的に、図1bにおけるステップ1に対応するコンテンツについて、生成した音声インタラクティブ話術は「現在あなたは不思議な世界に来ています。あなたはどこに行きますか?一番目:博物館、二番目:銀行、三番目:美容室。あなたは私に一番目、二番目、または三番目と言ってもよいです」。
S2、前記音声インタラクティブ話術と、前記プロットにおけるステップと異なる選択コンテンツのジャンプステップ番号とに基づいて、音声スキルを作成する。
プロットにおけるステップと異なる選択コンテンツのジャンプステップ番号に基づいて、複数の異なるステップの音声インタラクティブ話術を組み合わせて、音声スキルを生成する。例えば、図1bにおけるプロットに基づいて、ストーリ系音声スキルを生成することができる。後でスマートデバイスは音声スキルに基づいてユーザーとの音声インタラクションを完成させることができる。具体的に、本願のスマートデバイスには、ユーザーの音声を認識し、プロットで認識結果に基づいて音声インタラクションを完成させるように各ステップのジャンプを行うことに用いられる音声認識モジュールをさらに含む。例示的に、音声インタラクションのプロセスは以下のようである。
スマートデバイス:「現在あなたは不思議な世界に来ています。あなたはどこに行きますか?一番目:博物館、二番目:銀行、三番目:美容室。あなたは私に一番目、二番目、または三番目と言ってもよいです」。
ユーザー:「一番目」。
スマートデバイス:「あなたは博物館に来ています。チケットを購入しますか?一番目:はい、二番目:いいえ」。
本願実施例の技術案は、ユーザーがプロットを構成するために編集インターフェースを提供し、またユーザーが構成したプロットで、音声インタラクティブ話術を生成して、さらに音声インタラクティブ話術に基づいて音声スキルを作成し、これによりプロの開発能力を有していないユーザーがスマートデバイスが作成した音声スキルのために、音声スキルの作成とメンテナンスの効率を上昇させることができる。
図1cを参照すると、編集インターフェースの効果概略図を示している。編集インターフェースは上記プロット構成サブインターフェースのほかに、歓迎メッセージ構成サブインターフェースと、終了メッセージ構成サブインターフェースと、意図理解不能な構成サブインターフェースと、カスタム返信構成サブインターフェースと音響効果挿入サブインターフェースとをさらに含む。
歓迎メッセージ構成サブインターフェースは、完全なスキルの案内とするように、音声スキルに入る場合に放送される歓迎メッセージを構成する。歓迎メッセージは複数追加することができ、放送される場合にはランダムで一つを抽出して放送することができる。
終了メッセージ構成サブインターフェースは、音声スキルにログアウトする場合に放送される終了メッセージを構成する。同様に、終了メッセージも複数追加することができ、放送される場合にはランダムで一つを抽出して放送することができる。
意図理解不能な構成サブインターフェースは、案内メッセージを構成し、ユーザーの音声認識結果が音声スキル内のプロットの音声インタラクティブ場面設定に中ってない場合に、前記案内メッセージを放送して、ユーザーがプロット内の設定命令でインタラクトするように提示し案内する。案内メッセージも複数追加することができ、放送される場合にはランダムで一つを抽出して放送することができる。
カスタム返信構成サブインターフェースは、カスタム返信コンテンツを構成する。前記カスタム返信コンテンツは、少なくとも、意図と、表現と、返信コンテンツとを含み、ユーザーによって現在表現されている音声認識結果が前記意図に中った後、ユーザーのためにインタラクトするように、前記返信コンテンツを放送する。
音響効果挿入サブインターフェースは、プロットの中の任意の位置の放送すべき音響効果を構成する。音響効果は、ユーザーが加えた標準フォーマット仕様の擬似コードオーディオとリンクであってもよい。擬似コードオーディオは直接文字に挿入してよく、スマートデバイスはユーザーの挿入に従ってオーディオを放送する。
本願実施例の技術案において、編集インターフェースはエディタのインターフェースであってよく、エディタの可視化、便利な操作によって音声スキルを作成することができる。編集インターフェースは歓迎メッセージ構成サブインターフェースと、終了メッセージ構成サブインターフェースと、意図理解不能な構成サブインターフェースと、カスタム返信構成サブインターフェースとをさらに提供し、相応な構成によってユーザーが音声インタラクトするように案内しまたは助けることができ、さらに音声インタラクション体験を上昇させることができる。音響効果構成サブインターフェースによって、擬似コードオーディオ挿入を支持し、音声スキルの豊富性を上昇させる。
図2は本発明の実施例によるもう一つの音声スキル作成方法の概略フロチャートである。本実施例は上記実施例に基づいてさらに最適化を行い、コードをエクスポートするステップを増やした。図2に示すように、当該方法は具体的に以下のようなS201〜S204を含む。
S201、音声スキルの作成要求に応答して、編集インターフェースを表示する。
前記編集インターフェースは、少なくとも、プロット構成サブインターフェースと、歓迎メッセージ構成サブインターフェースと、終了メッセージ構成サブインターフェースと、意図理解不能な構成サブインターフェースと、カスタム返信構成サブインターフェースと、音響効果挿入サブインターフェースと、コードエクスポートコントロールとを含む。
S202、ユーザーが前記プロット構成サブインターフェースによって構成したプロットインタラクティブテキストを取得する。
S203、前記プロットインタラクティブテキストで音声インタラクティブ話術を生成し、前記音声インタラクティブ話術に基づいて音声スキルを作成する。
S204、前記編集インターフェースのコードエクスポートコントロールのトリガ操作に応答して、現在作成された音声スキルをコード形式でエクスポートして、音声スキルのコードファイルを取得する。
トリガ操作はシングルアクションまたはダブルアクションであってもよい。
本願実施例の技術案は、ユーザーのトリガ操作に応答することにより、現在作成した音声スキルをコードの形式でエクスポートすることができ、ユーザーがコードに対して再編集することができ、音声スキルがさらに豊富になる。
図3は本発明の実施例による音声スキル作成装置の概略構成図である。音声インタラクションの機能を有するデバイスでデバイスのために音声スキルを開発する状況に適用する。当該装置は本願の任意の実施例が述べる音声スキル作成方法を実現させることができる。図3に示すように、当該装置300は、具体的に、音声スキルの作成要求に応答に用いられ、編集インターフェースを表示する編集インターフェース表示モジュール301であって、前記編集インターフェースには少なくともプロット構成サブインターフェースを含む編集インターフェース表示モジュール301と、ユーザーが前記プロット構成サブインターフェースによって構成したプロットインタラクティブテキストを取得するプロット取得モジュール302と、前記プロットインタラクティブテキストで音声インタラクティブ話術を生成し、そして前記音声インタラクティブ話術に基づいて音声スキルを作成するスキル作成モジュール303と、を含む。
選択可能に、前記プロット構成サブインターフェースは、プロットにおけるステップと、各ステップに関する質問と、各質問に関する異なる選択コンテンツと、異なる選択コンテンツのジャンプステップ番号と、を構成する。
選択可能に、前記スキル作成モジュールは、前記プロットにおける各ステップに関する質問と、各質問に関する異なる選択コンテンツとで、音声インタラクティブ話術を生成する音声インタラクティブ話術生成ユニットと、前記音声インタラクティブ話術と、前記プロットにおけるステップと異なる選択コンテンツのジャンプステップ番号とに基づいて、音声スキルを生成することに用いられるスキル作成ユニットと、を含む。
選択可能に、前記編集インターフェースは、音声スキルに入る場合に放送される歓迎メッセージを構成する歓迎メッセージ構成サブインターフェースをさらに含む。
選択可能に、前記編集インターフェースは、音声スキルに入る場合に放送される終了メッセージを構成する終了メッセージ構成サブインターフェースをさらに含む。
選択可能に、前記編集インターフェースは、案内メッセージを構成する意図理解不能な構成サブインターフェースをさらに含む。ユーザーの音声認識結果が音声スキル内のプロットの音声インタラクティブ場面設定に中ってない場合に、前記案内メッセージを放送して、ユーザーがプロット内の設定命令でインタラクトするように提示し案内する。
選択可能に、前記編集インターフェースは、カスタム返信コンテンツを構成するカスタム返信構成サブインターフェースをさらに含み、前記カスタム返信コンテンツは、少なくとも、意図と、表現と、返信コンテンツとを含み、ユーザーによって現在表現されている音声認識結果が前記意図に中った後、ユーザーのためにインタラクトするように、前記返信コンテンツを放送することに用いられる。
選択可能に、前記編集インターフェースは、プロットでの任意の位置の放送すべき音響効果を構成する音響効果挿入サブインターフェースをさらに含む。
選択可能に、前記装置は、前記編集インターフェースのコードエクスポートコントロールのトリガ操作に応答して、現在作成された音声スキルをコード形式でエクスポートして、音声スキルのコードファイルを取得するコードファイル生成モジュールをさらに含む。
本願実施例が提供している音声スキル作成装置は本願の任意の実施例が提供している音声スキル作成方法を実行することができ、実行方法相応の機能モジュールと有益な効果を備えている。本実施例で詳しく説明していない内容は本願の任意の方法の実施例での説明を参照してもよい。
本願の実施例により、本願は電子機器及び読み取り可能な記憶媒体をさらに提供している。
図4に示すように、本願の実施例による音声スキル作成方法の電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークベンチ、携帯情報端末、サーバ、ブレードサーバ、メインフレームコンピュータ、およびその他の適切なコンピュータなど、さまざまな形式のデジタルコンピュータを表すことを目的としている。電子機器は、パーソナルデジタル処理、携帯電話、スマートフォン、ウェアラブルデバイス、その他の同様のコンピューティングデバイスなど、さまざまな形態のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続および関係、およびそれらの機能は単なる例であり、本明細書で説明および/または必要とされる本願の実現を限定することを意図するものではない。
図4に示すように、当該電子機器は、一つまたは複数のプロセッサ401、メモリ402、および高速インターフェースおよび低速インターフェースを含む様々なコンポーネントを接続するためのインターフェースを含む。さまざまなコンポーネントは、異なるバスを使用して相互接続され、共通のマザーボードに取り付けられるか、必要に応じて取り付けられてもよい。プロセッサは、外部入力/出力デバイス(例えば、インターフェースに結合されたディスプレイデバイス)にGUIのグラフィカル情報を表示するためにメモリに記憶されている命令を含む、電子機器内で実行される命令を処理することができる。他の実施例では、必要に応じて、複数のプロセッサおよび/または複数のバスを複数のメモリとともに使用することができる。同様に、複数の電子機器を接続し、それぞれの電子機器が必要な操作(例えば、サーバアレイ、1グループのブレードサーバ、マルチプロセッサシステム)の一部を提供できます。図7では、一つのプロセッサ701を例に挙げている。
メモリ402は、本願によって提供される非一時的なコンピュータ読み取り可能な記憶媒体である。前記メモリは、少なくとも一つのプロセッサによって実行可能な命令を記憶し、その結果、前記少なくとも一つのプロセッサは、本願に係る音声制御方法を実行する。本願の非一時的なコンピュータ読み取り可能な記憶媒体は、本願によって提供される音声スキル作成方法をコンピュータに実行させるためのコンピュータ命令を記憶する。
メモリ402は、非一時的なコンピュータ読み取り可能な記憶媒体として、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能プログラム、および本願の実施例の音声制御方法に対応するプログラム命令/モジュール(例えば、図3に示される編集インターフェース表示301、プロット取得モジュール302、スキル作成モジュール303)を記憶することができる。プロセッサ401は、メモリ402に記憶されている非一時的なソフトウェアプログラム、命令、およびモジュールを実行することにより、サーバの様々な機能的アプリケーションおよびデータ処理を実行し、すなわち、前述の方法の実施例における音声制御方法を実現する。
メモリ402は、ストレージプログラム領域およびストレージデータ領域を含むことができ、ストレージプログラム領域は、少なくとも一つの機能に必要なオペレーティングシステムおよびアプリケーションプログラムを記憶することができる。ストレージデータ領域は、音声スキル作成方法を実現する電子機器の使用に基づいて作成されたデータを記憶することができる。また、メモリ402は、高速ランダムアクセスメモリを含むことができるし、少なくとも一つの磁気ディスク記憶装置、フラッシュメモリ装置、または他の非一時的な固体記憶装置などの非一時的なメモリも含むことができる。いくつかの実施例では、メモリ402は、プロセッサ401に対して遠隔に構成されたメモリを選択可能に含むことができ、これらの遠隔メモリは、ネットワークを介して音声スキル作成方法を実現する電子機器に接続され得る。上記のネットワークの例としては、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、およびそれらの組み合わせを含むが、これらに限定されない。
音声スキル作成方法を実現する電子機器は、入力装置403と出力装置404とをさらに含むことができる。プロセッサ401と、メモリ402と、入力装置403と、出力装置404とは、バスまたは他の方式を介して接続することができ、図4では、バスを介した接続を例に挙げている。
入力装置403は、入力された数字または文字情報を受信し、音声スキル作成方法を実現する電子機器のユーザー設定および機能制御に関するキー信号入力を生成することができる。例えば、タッチスクリーン、キーパッド、マウス、トラックパネル、タッチパネル、ポインティングスティック、一つまたは複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置404は、表示装置、補助照明装置(例えば、LED)、触覚フィードバック装置(例えば、振動モータ)などを含んでもよい。当該表示装置は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、およびプラズマディスプレイを含んでもよいが、これらに限定されない。いくつかの実施例では、表示装置はタッチスクリーンであってもよい。
本明細書で説明されるシステムおよび技術の様々な実施例は、デジタル電子回路、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組み合わせで実現され得る。これらの様々な実施例は、少なくとも一つのプログラマブルプロセッサを含むプログラマブルシステム上で実行可能および/または解釈可能な一つまたは複数のコンピュータプログラムで実装されてもよく、当プログラマブルプロセッサは、ストレージシステム、少なくとも一つの入力装置、および少なくとも一つの出力装置からデータおよび命令を受信し、データおよび命令を当該ストレージシステム、当該少なくとも一つの入力装置、および当該少なくとも一つの出力装置に送信することができる専用または汎用のプログラマブルプロセッサであってもよい。
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードともいう)は、プログラマブルプロセッサの機械命令を含み、されに高レベルの手続き型および/またはオブジェクト指向プログラミング言語、および/またはアセンブリ/機械言語を用いてこれらのンピューティングプログラムを実施することができる。本明細書で使用される「機械読み取り可能な媒体」および「コンピュータ読み取り可能な媒体」という用語は、機械命令および/またはデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、デバイス、および/または装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD)を指し、機械読み取り可能な信号としての機械命令を受信する機械読み取り可能な媒体を含む、「機械読み取り可能な信号」という用語は、機械命令および/またはデータをプログラマブルプロセッサに提供するための信号を指す。
ユーザーとのインタラクションを提供するために、本明細書に記載のシステムおよび技術は、ユーザーに情報を表示するための表示装置(例えば、CRT(陰極線管)またはLCD(液晶ディスプレイ)モニター)と、キーボードおよびポインティング装置(例えば、マウスまたはトラックボール)とを有するコンピュータで実施されてもよく、ユーザーは当該キーボードおよび当該ポインティング装置を介してコンピュータに入力を提供できる。他の種類の装置を使用してユーザーとのインタラクションを提供することもできる。例えば、ユーザーに提供されるフィードバックは、任意の形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック)であってもよく、任意の形式(例えば、音響入力、音声入力、または触覚入力)を用いてユーザーからの入力を受信することができるあってもよい。
本明細書に記載のシステムおよび技術の各実施例は、バックエンドコンポーネントを含むコンピューティングシステム(例えば、データサーバとして)、またはミドルコンポーネントを含むコンピューティングシステム(例えば、アプリケーションサーバ)、またはフロントエンドコンポーネントを含むコンピューティングシステム(例えば、グラフィカルユーザーインターフェースまたはWebブラウザを備えたユーザーコンピュータ。ユーザーは、当該グラフィカルユーザーインターフェースまたは当該Webブラウザを介して、ここで説明されるシステムおよび技術の実施例とインタラクションできる)、またはこのようなバックエンドコンポーネント、ミドルコンポーネント、またはフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施することができる。デジタルデータ通信の任意の形式または媒体(例えば、通信ネットワーク)によってシステムのコンポーネントを相互接続してもよい。通信ネットワークの例は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、およびインターネットを含む。
コンピュータシステムは、クライアントとサーバとを含むことができる。通常、クライアントとサーバとは互いにリモートであり、通常は通信ネットワークを介してインタラクションする。それぞれのコンピュータで実行され、互いにクライアントとサーバとの関係を持つコンピュータプログラムによってクライアントとサーバとの関係を生成する。
本願実施例の技術案によって、ユーザーがプロットを構成するために編集インターフェースを提供し、またユーザーが構成したプロットを音声インタラクティブ話術を生成して、さらに音声インタラクティブ話術に基づいて音声スキルを作成し、これによりプロの開発能力を有していないユーザーがスマートデバイスが作成した音声スキルのために、音声スキルの作成とメンテナンスの効率を上昇させることができる。また編集インターフェースは歓迎メッセージ構成サブインターフェースと、終了メッセージ構成サブインターフェースと、意図理解不能な構成サブインターフェースと、カスタム返信構成サブインターフェースとさらにを提供し、相応な構成によってユーザーが音声インタラクトすることを案内または助けることで、インタラクションコンテンツを豊富にし、インタラクションの効率を上昇させることができる。同時に、ユーザーがコードに対して再編集できるように、現在作成した音声スキルをコードの形式でエクスポートし、スキルをさらに豊富にする。
なお、上記のさまざまな形態のプロセスを使用して、ステップを並べ替え、追加、または削除できることを理解されたい。例えば、本願で説明されている各ステップは、並列、順次、または異なる順序で実行できる。本願で開示された技術的解決策の望ましい結果が達成できれば、本明細書は、ここで限定しない。
前述した具体的な実施例は、本願の保護範囲を制限しない。設計要件および他の要因に応じて、さまざまな修正、組み合わせ、サブ組み合わせ、および置き換えを行うことができることを当業者は理解するべきである。本願の思想および原則の範囲内で行われた修正、同等の置き換え、および改善は、いずれも本願の保護範囲に含まれるものとする。

Claims (15)

  1. 音声スキルの作成要求に応答して、編集インターフェースを表示するステップであって、前記編集インターフェースは少なくともプロット構成サブインターフェースを含むステップと、
    ユーザーが前記プロット構成サブインターフェースを介して構成されたプロットインタラクティブテキストを取得するステップと、
    前記プロットインタラクティブテキストで音声インタラクティブ話術を生成し、前記音声インタラクティブ話術に基づいて音声スキルを作成するステップと、を含む、
    ことを特徴とする音声スキル作成方法。
  2. 前記プロット構成サブインターフェースは、前記プロットにおけるステップと、各ステップに関する質問と、各質問に関する異なる選択コンテンツと、異なる選択コンテンツのジャンプステップ番号と、を構成する、
    ことを特徴とする請求項1に記載の音声スキル作成方法。
  3. 前記プロットインタラクティブテキストで音声インタラクティブ話術を生成し、前記音声インタラクティブ話術に基づいて音声スキルを作成するステップは、
    前記プロットにおける各ステップに関する質問と、各質問に関する異なる選択コンテンツとで、音声インタラクティブ話術を生成するステップと、
    前記音声インタラクティブ話術と、前記プロットにおけるステップと、異なる選択コンテンツのジャンプステップ番号とに基づいて、音声スキルを生成するステップと、を含む、
    ことを特徴とする請求項2に記載の音声スキル作成方法。
  4. 前記編集インターフェースは、音声スキルに入る場合に放送される歓迎メッセージを構成する歓迎メッセージ構成サブインターフェースをさらに含む、
    ことを特徴とする請求項1に記載の音声スキル作成方法。
  5. 前記編集インターフェースは、音声スキルを終了する場合に放送される終了メッセージを構成する終了メッセージ構成サブインターフェースをさらに含む、
    ことを特徴とする請求項1に記載の音声スキル作成方法。
  6. 前記編集インターフェースは、案内メッセージを構成する意図理解不能な構成サブインターフェースをさらに含み、ユーザーの音声認識結果が音声スキル内のプロットの音声インタラクティブ場面設定に中っていない場合に、前記案内メッセージを放送して、ユーザーがプロット内の設定命令でインタラクトするように提示し案内する、
    ことを特徴とする請求項1に記載の音声スキル作成方法。
  7. 前記編集インターフェースは、カスタム返信コンテンツを構成するカスタム返信構成サブインターフェースをさらに含み、前記カスタム返信コンテンツは、少なくとも、意図と、表現と、返信コンテンツとを含み、ユーザーによって現在表現されている音声認識結果が前記意図に中った後、前記返信コンテンツを放送する、
    ことを特徴とする請求項1に記載の音声スキル作成方法。
  8. 前記編集インターフェースは、前記プロット内の任意の位置で放送される音響効果を構成する音響効果挿入サブインターフェースをさらに含む、
    ことを特徴とする請求項1に記載の音声スキル作成方法。
  9. 前記音声スキル作成方法は、
    前記編集インターフェースのコードエクスポートコントロールのトリガ操作に応答して、現在作成された音声スキルをコード形式でエクスポートし、音声スキルのコードファイルを取得するステップをさらに含む、
    ことを特徴とする請求項1に記載の音声スキル作成方法。
  10. 音声スキル作成装置であって、
    音声スキルの作成要求に応答して、編集インターフェースを表示する編集インターフェース表示モジュールであって、前記編集インターフェースは少なくともプロット構成サブインターフェースを含む編集インターフェース表示モジュールと、
    ユーザーが前記プロット構成サブインターフェースによって構成したプロットインタラクティブテキストを取得するプロット取得モジュールと、
    前記プロットインタラクティブテキストで音声インタラクティブ話術を生成し、前記音声インタラクティブ話術に基づいて音声スキルを作成するスキル作成モジュールと、を含む、
    ことを特徴とする音声スキル作成装置。
  11. 前記プロット構成サブインターフェースは、前記プロットにおけるステップと、各ステップに関する質問と、各質問に関する異なる選択コンテンツと、異なる選択コンテンツのジャンプステップ番号と、を構成する、
    ことを特徴とする請求項10に記載の音声スキル作成装置。
  12. 前記スキル作成モジュールは、
    前記プロットにおける各ステップに関する質問と、各質問に関する異なる選択コンテンツとで、音声インタラクティブ話術を生成する話術生成ユニットと、
    前記音声インタラクティブ話術と、前記プロットにおけるステップと、異なる選択コンテンツのジャンプステップ番号とに基づいて、音声スキルを生成するスキル作成ユニットと、を含む、
    ことを特徴とする請求項11に記載の音声スキル作成装置。
  13. 前記音声スキル作成装置は、前記編集インターフェースのコードエクスポートコントロールのトリガ操作に応答して、現在作成された音声スキルをコード形式でエクスポートして、音声スキルのコードファイルを取得するコードファイル生成モジュールをさらに含む、
    ことを特徴とする請求項10に記載の音声スキル作成装置。
  14. 電子機器であって、
    少なくとも一つのプロセッサと、
    前記少なくとも一つのプロセッサに通信可能に接続されるメモリと、を含み、
    前記メモリには、前記少なくとも一つのプロセッサによって実行可能な命令が記憶され、前記命令が前記少なくとも一つのプロセッサによって実行される場合、前記少なくとも一つのプロセッサが請求項1〜9のいずれかに記載の音声スキル作成方法を実行する、
    ことを特徴とする電子機器。
  15. コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータ命令は、前記コンピュータに請求項1〜9のいずれかに記載の音声スキル作成方法を実行させる、
    ことを特徴とする非一時的なコンピュータ読み取り可能な記憶媒体。
JP2020069176A 2019-09-11 2020-04-07 音声スキル作成方法、音声スキル作成装置、電子機器及び記憶媒体 Active JP6986590B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910859374.1A CN110570866A (zh) 2019-09-11 2019-09-11 语音技能创建方法、装置、电子设备和介质
CN201910859374.1 2019-09-11

Publications (2)

Publication Number Publication Date
JP2021043435A true JP2021043435A (ja) 2021-03-18
JP6986590B2 JP6986590B2 (ja) 2021-12-22

Family

ID=68779299

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020069176A Active JP6986590B2 (ja) 2019-09-11 2020-04-07 音声スキル作成方法、音声スキル作成装置、電子機器及び記憶媒体

Country Status (3)

Country Link
US (1) US20210074265A1 (ja)
JP (1) JP6986590B2 (ja)
CN (1) CN110570866A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111142833B (zh) * 2019-12-26 2022-07-08 思必驰科技股份有限公司 基于情景模式开发语音交互产品的方法及系统
CN111161382A (zh) * 2019-12-31 2020-05-15 安徽必果科技有限公司 图形化非线性语音互动剧情编辑方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003241795A (ja) * 2002-02-18 2003-08-29 Hitachi Ltd 音声入力を用いた情報取得方法及び情報取得システム
JP2005190192A (ja) * 2003-12-25 2005-07-14 Equos Research Co Ltd 車載装置
JP2010073192A (ja) * 2008-08-20 2010-04-02 Universal Entertainment Corp 会話シナリオ編集装置、ユーザ端末装置、並びに電話取り次ぎシステム
WO2017175351A1 (ja) * 2016-04-07 2017-10-12 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2989209B1 (fr) * 2012-04-04 2015-01-23 Aldebaran Robotics Robot apte a integrer des dialogues naturels avec un utilisateur dans ses comportements, procedes de programmation et d'utilisation dudit robot
US10223636B2 (en) * 2012-07-25 2019-03-05 Pullstring, Inc. Artificial intelligence script tool
CN106951703B (zh) * 2017-03-15 2020-01-10 长沙富格伦信息科技有限公司 一种生成电子病历的系统及方法
CN108090177B (zh) * 2017-12-15 2020-05-05 上海智臻智能网络科技股份有限公司 多轮问答系统的生成方法、设备、介质及多轮问答系统
CN108984157B (zh) * 2018-07-27 2022-01-11 思必驰科技股份有限公司 用于语音对话平台的技能配置和调用方法及系统
CN109697979B (zh) * 2018-12-25 2021-02-19 Oppo广东移动通信有限公司 语音助手技能添加方法、装置、存储介质及服务器
CN109901899A (zh) * 2019-01-28 2019-06-18 百度在线网络技术(北京)有限公司 视频语音技能处理方法、装置、设备及可读存储介质
CN109948151A (zh) * 2019-03-05 2019-06-28 苏州思必驰信息科技有限公司 构建语音助手的方法
CN110234032B (zh) * 2019-05-07 2022-02-25 百度在线网络技术(北京)有限公司 一种语音技能创建方法及系统
CN110227267B (zh) * 2019-06-28 2023-02-28 百度在线网络技术(北京)有限公司 语音技能游戏编辑方法、装置、设备及可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003241795A (ja) * 2002-02-18 2003-08-29 Hitachi Ltd 音声入力を用いた情報取得方法及び情報取得システム
JP2005190192A (ja) * 2003-12-25 2005-07-14 Equos Research Co Ltd 車載装置
JP2010073192A (ja) * 2008-08-20 2010-04-02 Universal Entertainment Corp 会話シナリオ編集装置、ユーザ端末装置、並びに電話取り次ぎシステム
WO2017175351A1 (ja) * 2016-04-07 2017-10-12 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置

Also Published As

Publication number Publication date
CN110570866A (zh) 2019-12-13
US20210074265A1 (en) 2021-03-11
JP6986590B2 (ja) 2021-12-22

Similar Documents

Publication Publication Date Title
US11527233B2 (en) Method, apparatus, device and computer storage medium for generating speech packet
JP7091430B2 (ja) インタラクション情報推薦方法及び装置
CN110597959B (zh) 文本信息抽取方法、装置以及电子设备
JP2021047835A (ja) ビデオ再生方法、ビデオ再生装置、電子デバイス及び読み取り可能な記憶媒体
US10248441B2 (en) Remote technology assistance through dynamic flows of visual and auditory instructions
JP7200277B2 (ja) ワードスロットを識別するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
US20200312299A1 (en) Method and system for semantic intelligent task learning and adaptive execution
KR20210068333A (ko) 응용 프로그램의 조작 안내 방법, 장치, 기기 및 판독 가능 저장 매체
JP7247442B2 (ja) ユーザ対話における情報処理方法、装置、電子デバイス及び記憶媒体
JP6986590B2 (ja) 音声スキル作成方法、音声スキル作成装置、電子機器及び記憶媒体
WO2020216310A1 (zh) 用于生成应用的方法、终端设备和计算机可读介质
CN113778419B (zh) 多媒体数据的生成方法、装置、可读介质及电子设备
JP7337172B2 (ja) 音声パケット推薦方法、装置、電子機器およびプログラム
CN111935551A (zh) 视频处理方法、装置、电子设备和存储介质
JP2021182159A (ja) 歌のマルチメディアの合成方法、合成装置、電子機器及び記憶媒体
JP2023502815A (ja) 放送音声を生成する方法、装置、機器、およびコンピュータ記憶媒体
KR20210038278A (ko) 음성 제어 방법, 장치, 전자 기기 및 판독 가능 저장 매체
US20210098012A1 (en) Voice Skill Recommendation Method, Apparatus, Device and Storage Medium
WO2023169193A1 (zh) 用于生成智能合约的方法和装置
CN111736799A (zh) 基于人机交互的语音交互方法、装置、设备和介质
US20210392394A1 (en) Method and apparatus for processing video, electronic device and storage medium
JP2022020063A (ja) 対話処理方法、装置、電子機器及び記憶媒体
JP2024508412A (ja) グラフィックユーザインタフェースからの自然言語インタフェースの生成
CN111723343B (zh) 电子设备的交互控制方法、装置以及电子设备
Giunchi et al. DreamCodeVR: Towards Democratizing Behavior Design in Virtual Reality with Speech-Driven Programming

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200407

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210525

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20210531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211129

R150 Certificate of patent or registration of utility model

Ref document number: 6986590

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150