JP7135010B2 - インテリジェント・チューターのための向上した視覚的ダイアログ・システム - Google Patents

インテリジェント・チューターのための向上した視覚的ダイアログ・システム Download PDF

Info

Publication number
JP7135010B2
JP7135010B2 JP2019570913A JP2019570913A JP7135010B2 JP 7135010 B2 JP7135010 B2 JP 7135010B2 JP 2019570913 A JP2019570913 A JP 2019570913A JP 2019570913 A JP2019570913 A JP 2019570913A JP 7135010 B2 JP7135010 B2 JP 7135010B2
Authority
JP
Japan
Prior art keywords
statements
interface
program code
user
code statements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019570913A
Other languages
English (en)
Other versions
JP2020525827A5 (ja
JP2020525827A (ja
Inventor
ワトソン、パトリック
アン、ジェウク
チャン、マリア
サンダララジャン、シャラード、チャンドラ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2020525827A publication Critical patent/JP2020525827A/ja
Publication of JP2020525827A5 publication Critical patent/JP2020525827A5/ja
Application granted granted Critical
Publication of JP7135010B2 publication Critical patent/JP7135010B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/06Electrically-operated teaching apparatus or devices working with questions and answers of the multiple-choice answer-type, i.e. where a given question is provided with a series of answers and a choice has to be made from the answers
    • G09B7/08Electrically-operated teaching apparatus or devices working with questions and answers of the multiple-choice answer-type, i.e. where a given question is provided with a series of answers and a choice has to be made from the answers characterised by modifying the teaching programme in response to a wrong answer, e.g. repeating the question, supplying further information

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Educational Technology (AREA)
  • Operations Research (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Image Analysis (AREA)

Description

本発明は、コンピュータ・ソフトウェアに関し、より詳細には、インテリジェント・チューターのための向上した視覚的ダイアログ・インターフェースを提供するコンピュータ・ソフトウェアに関する。
インテリジェント・チューター・システムは、人間の教師による介入を必要とすることなくユーザに学習体験を提供する。インテリジェント・チューターには、テキストを介してユーザがインテリジェント・チューターとチャットすること(また逆も可)ができる、テキスト・ベースのコミュニケーション・インターフェースを提供するものがある。しかしながら、(グラフィカル学習インターフェース(graphical learning interface)のような)インテリジェント・チューター・システムの他のコンポーネントは、テキスト・ベースのユーザ・コミュニケーションからは孤立している。同様に、ユーザがシステムの他のコンポーネントと対話するとき、テキスト・ベースのコミュニケーション・インターフェースはその対話から孤立している。
インテリジェント・チューターのための向上した視覚的ダイアログ・インターフェースを提供する方法、コンピュータ・プログラム、コンピュータ可読ストレージ媒体およびシステムを提供する。
本発明の一実施形態において、方法は、チューター・アプリケーションのチャット・インターフェースを介してテキスト入力を受け取ること、テキスト入力に適用された少なくとも1つの分類器によって、テキスト入力における概念を特定すること、テキスト入力における概念を視覚的行動および第1の視覚的オブジェクトのうちの少なくとも1つにマッピングすること、第1の機械学習(ML)モデルに基づいて、視覚的行動および第1の視覚的オブジェクトのうちの少なくとも1つに対応する第1のプログラム・コード・ステートメントを生成すること、ならびにチャット・インターフェースを介して受け取ったテキスト入力に基づいてチューター・アプリケーションの視覚化インターフェース(visualization interface)を修正するための第1のプログラム・コード・ステートメントを実行すること、を含む。
本発明の別の実施形態において、システムは、プロセッサ、および命令を保存するメモリを含み、この命令は、プロセッサによって実行されたとき、チューター・アプリケーションのチャット・インターフェースを介してテキスト入力を受け取ること、テキスト入力に適用された少なくとも1つの分類器によって、テキスト入力における概念を特定すること、テキスト入力における概念を視覚的行動および第1の視覚的オブジェクトのうちの少なくとも1つにマッピングすること、第1の機械学習(ML)モデルに基づいて、視覚的行動および第1の視覚的オブジェクトのうちの少なくとも1つに対応する第1のプログラム・コード・ステートメントを生成すること、ならびにチャット・インターフェースを介して受け取ったテキスト入力に基づいてチューター・アプリケーションの視覚化インターフェースを修正するための第1のプログラム・コード・ステートメントを実行すること、を含む動作を行う。
本発明の別の実施形態において、コンピュータ可読ストレージ媒体には、コンピュータ可読プログラム・コードが具体化されており、コンピュータ可読プログラム・コードは、チューター・アプリケーションのチャット・インターフェースを介してテキスト入力を受け取ること、テキスト入力に適用された少なくとも1つの分類器によって、テキスト入力における概念を特定すること、テキスト入力における概念を視覚的行動および第1の視覚的オブジェクトのうちの少なくとも1つにマッピングすること、第1の機械学習(ML)モデルに基づいて、視覚的行動および第1の視覚的オブジェクトのうちの少なくとも1つに対応する第1のプログラム・コード・ステートメントを生成すること、ならびにチャット・インターフェースを介して受け取ったテキスト入力に基づいてチューター・アプリケーションの視覚化インターフェースを修正するための第1のプログラム・コード・ステートメントを実行すること、を含む動作を行うようにプロセッサによって実行可能である。
本発明の一実施形態による、向上した視覚的ダイアログ・インターフェースを提供するインテリジェント・チューター・システムのコンポーネントの例を例示する図である。 本発明の様々な実施形態による、インテリジェント・チューターのための向上した視覚的ダイアログ・インターフェースの例を描写する図である。 本発明の様々な実施形態による、インテリジェント・チューターのための向上した視覚的ダイアログ・インターフェースの例を描写する図である。 本発明の様々な実施形態による、インテリジェント・チューターのための向上した視覚的ダイアログ・インターフェースの例を描写する図である。 本発明の様々な実施形態による、インテリジェント・チューターのための向上した視覚的ダイアログ・インターフェースの例を描写する図である。 本発明の一実施形態による、インテリジェント・チューターのための向上した視覚的ダイアログ・インターフェースを提供する方法の例を例示するフローチャートである。 本発明の一実施形態による、分類器をトレーニングする方法の例を例示するフローチャートである。 本発明の一実施形態による、テキスト入力を翻訳して、視覚化を修正するためのステートメントを生成する方法の例を例示するフローチャートである。 本発明の一実施形態による、視覚化インターフェースで受け取ったユーザの入力を翻訳して自然言語のステートメントを作成する方法の例を例示するフローチャートである。 本発明の一実施形態による、インテリジェント・チューターのための向上した視覚的ダイアログ・インターフェースを提供するシステムの例を例示するブロック図である。
本明細書に開示される本発明の実施形態は、ユーザとインテリジェント・チューターの異なるコンポーネントとの間のコミュニケーションを改善する、向上したインテリジェント・チューター・システムを提供する。例えば、ユーザが、インテリジェント・チューターのテキスト・ベースのコミュニケーション・インターフェースを介してテキスト・ベースのステートメントを出したとき、本明細書に開示される実施形態は、それに対応するインテリジェント・チューターの視覚化インターフェースを修正するステートメントを動的に生成する。同様に、ユーザが視覚化インターフェースのグラフィカル要素を修正した場合、本明細書に開示される本発明の実施形態は、インテリジェント・チューターのテキスト・ベースのコミュニケーション・インターフェースに提供される自然言語のステートメントを生成する。
図1は、向上した視覚的ダイアログ・インターフェースを提供するインテリジェント・チューター・システム100のコンポーネントの例を例示する。一般に、インテリジェント・チューターは、ユーザに仮想学習環境を提供するよう構成されたアプリケーションである。示されるとおり、インテリジェント・チューター100は、テキスト・インターフェース101、翻訳コンポーネント102、および視覚化コンポーネント103を含む。テキスト・インターフェース101は、ユーザとチャット・エンジン110との間のテキスト・ベースのコミュニケーション・チャネルを提供する。一般に、チャット・エンジン110は、テキスト、顔文字、アイコンなどを介してユーザと会話する「ボット」である。例えば、チャット・エンジン110は、多項選択式問題をユーザに出力し得る。ユーザは、次に、答えを指定するユーザ入力111を提供し得る。チャット・エンジン110は、次に、ユーザ入力111で提供された答えを確認し、確認の結果(例えば、ユーザの答えが正しいかまたは正しくないか)を戻す。このようにして、ユーザがインテリジェント・チューター100から学習指導を受け取りながら、チャット・エンジン110とユーザとが会話することができる。
視覚化コンポーネント103は、表示のために、グラフィカル学習要素(graphicallearning element)131~135の例のような、グラフィカル学習要素を出力するよう構成される。グラフィカル学習要素の例には、図、グラフ、模式図、クリック可能な概念ノードなどのような、いかなるタイプのグラフィカル・オブジェクトも含まれる。示されるとおり、ユーザは、ユーザ入力136を介して、グラフィカル学習要素131~135と対話し得る。例えば、ユーザは、1つまたは複数のグラフィカル学習要素131~135の色を変更して、各グラフィカル学習要素131~135のそれぞれに関連する主題についての自分の自信の度合いを反映することができる。
翻訳コンポーネント102は、一般にテキスト・インターフェース101および視覚化コンポーネント103を向上させるように構成されている。例えば、テキスト・インターフェース101のユーザ入力111が、「緑色の円を表示して」と指定した場合、翻訳コンポーネント102は、視覚化コンポーネント103によって処理されたときに、要求された緑色の円を生成し、描画し、出力するプログラム・コード・ステートメントを生成する。別の例として、ユーザ入力136が、グラフィカル学習要素131~135のうちの1つを新しい位置に動かした場合、翻訳コンポーネント102は、その動きを記述するプログラム・コード・ステートメントを受け取り、その動きを反映する自然言語のステートメント(例えば、「あなたはオブジェクトを動かしました」)を生成し、自然言語のステートメントは、次に、テキスト・インターフェース101を介して出力される。
示されるとおり、翻訳コンポーネント102は、イベント・マッパー(event mapper)120、1つまたは複数の分類器121、エンティティからテキストへのマッパー(entity-to-text mapper)122、分類されたデータ・モデル123、および視覚的コマンド124のデータストアを含む。イベント・マッパー120は、チャット・エンジン110によって出力されたテキストを、イベントまたは概念あるいはその両方にマッピングする。一般に、チャット・エンジン110とユーザとの間の会話は、複数の段階(例えば、質問、答え、検索、提案、比較など)を含んでよい。イベント・マッパー120は、テキストをこのようなイベントにマッピングする。例えば、ユーザが、質問に対する正しい答えをテキスト・インターフェースに提供した場合、イベント・マッパーは、チャット・エンジン110からの応答を「正しい答え」の概念の例にマッピングする。分類器121は、自然言語分類器、自然言語処理アルゴリズムおよび、ユーザの命令(またはコマンド)を特定するパーサなどの言語パーサの代表である。一般に、分類器121は、ユーザ入力111のテキストを分析して会話のテキストを分類し、会話のテキスト中のあらゆるエンティティ(例えば、人、場所、もの、学習概念など)を特定する。分類器121は、次に、分類されたデータを、分類されたデータに基づいて視覚的コマンド124を生成する機械学習モデルである分類されたデータ・モデル123に提供する。視覚的コマンド124は、視覚化コンポーネント103によって実行可能な、ユーザ・インターフェースを適宜修正するためのコード・ステートメントである。コード・ステートメントは、R(例えば、ggplot2)、Java(登録商標)Script(登録商標)、MATLAB(登録商標)またはグラフィックスの文法に基づく他の任意の言語のような、視覚的出力のために設計されたいかなるタイプのプログラミング言語によるものであってもよい。グラフに散布プロットを生成するためのコード・ステートメントの例は、「ggplot(data, aes(x=my_x, y=my_y)) + geom_point(shape=1)」である。従って、より一般的には、分類器121は、このようなステートメントの例でトレーニングされ、無制限の数の入力クエリに対する応答についての分類を作り出す。
視覚化コンポーネント103によってユーザ入力136が受け取られたとき、ユーザ入力136を記述し、実施するために視覚的コマンド124(例えば、コード・ステートメント)が生成される。例えば、ユーザが円131の形を四角形に変更した場合、視覚的コマンド124のコード・ステートメントが、視覚化コンポーネント103によって生成され、それが実行されたとき、円131の形を四角形に変更する。このようなコード・ステートメントはまた、R(例えば、ggplot2)、Java(登録商標)Script(登録商標)、MATLAB(登録商標)またはグラフィックスの文法に基づく他の任意の言語のような、いかなるタイプのプログラミング言語によるものであってもよい。視覚的コマンド124は、次に、翻訳コンポーネント102に提供されて、翻訳コンポーネント102は次に、エンティティからテキストへのマッパー122を、受け取った視覚的コマンド124に適用する。エンティティからテキストへのマッパー122は、受け取った視覚的コマンド124に基づいて自然言語のステートメントを生成する機械学習モデルである。例えば、エンティティからテキストへのマッパー122は、円131を四角形に変更したコード・ステートメントに応答して「あなたは円を四角形に変更しました」という自然言語のステートメントを生成し得る。エンティティからテキストへのマッパー122は、次に、チャット・エンジン110に、自然言語のステートメントを提供し、チャット・エンジン110はユーザにテキスト・インターフェース101を介して自然言語のステートメントを出力する。
図2は、一実施形態による、インテリジェント・チューター100によって提供される向上した視覚的ダイアログを含む、グラフィカル・ユーザ・インターフェース(GUI)200の例を示している。示されるとおり、GUI200は、チャット・インターフェース201および視覚化インターフェース202を含む。テキスト・インターフェース101の出力の例であるチャット・インターフェース201は、ユーザとチャット・エンジン110とがテキストおよび他の記号を介してコミュニケーションすることができるGUIである。視覚化インターフェース202は、ユーザの学習を促進するために使用されるグラフィックス・オブジェクト(graphics object)を出力する視覚化コンポーネント103によって生成されたGUIである。
示されるとおり、チャット・エンジン110は、チャット・インターフェース201を介して多項選択式問題をユーザの例「student1」に提示した。多項選択式問題は、長期記憶に関する。さらに、示されるとおり、視覚化インターフェース202は、人間の記憶に関する複数の概念ノード203~207をユーザに提示する。ユーザは、概念ノード203~207のうちの1つをクリックして、チュートリアル、図表などのような、各概念に関する情報を受け取ってもよい。示されるとおり、ユーザ「student1」は、チャット・インターフェース201を介して多項選択式問題に対する応答を提出した。
図3は、インテリジェント・チューター100が、ユーザ「student1」によって提供された多項選択の応答が正しくないと判断した後のGUI200の出力の例を示している。示されるとおり、チャット・インターフェース201は、応答が正しくないことを示すチャット・エンジン110からのテキストの応答を含む。一方、示されるとおり、GUI202は、概念ノード205がチャット・インターフェース201での会話のトピックである「長期記憶」の概念に対応するので、この概念ノード205を強調表示するよう更新した。先に示したように、チャット・インターフェース201のテキストは、自然言語分類器、自然言語プロセッサ、および他のタイプのパーサを含む、分類器121によって分析される。同様に、チャット・エンジン110は、イベント・マッパー120に会話のテキストを提供し、イベント・マッパー120は、テキストを対応するイベントにマッピングする。図3に描写される例において、イベント・マッパー120は、ユーザが多項選択式問題に対し正しくない答えを提供したので、会話のテキストを「正しくない答え」のイベントにマッピングしてもよい。同様に、分類器121は、このユーザは「長期記憶」の概念をよりよく理解する必要があるということを判断するために、ユーザによって提供された入力を分類してもよい。このようにして、分類されたデータ・モデル123は、概念ノード205を強調表示することを指定するチャット・インターフェース201のテキストに基づいてコード・ステートメント(例えば、視覚的コマンド124)を生成し得る。コード・ステートメントは、視覚化コンポーネント103によって実行されたとき、GUI202の概念ノード105を強調表示する。
図4は、ユーザ「student1」がGUI202を修正した、本発明の実施形態を示している。具体的には、例えば、ユーザが対応するチュートリアルを復習して長期記憶の概念についてより自信を持っていることを反映して、ユーザ「student1」は、概念ノード205の色(または陰影)を変更した。変更を実施するために、視覚化コンポーネント103は、概念ノード205の外観を修正するコード・ステートメントを生成し、実行する。視覚化コンポーネント103は、コード・ステートメントを翻訳コンポーネント102に提供する。視覚的コマンド124は、次に、コード・ステートメントをエンティティからテキストへのマッパー122に提供し、エンティティからテキストへのマッパー122はコード・ステートメントに対応する自然言語のステートメントを生成する。自然言語のステートメントは、次に、チャット・インターフェース201に出力される。従って、示されるとおり、チャット・インターフェース201は、チャット・エンジン110が「ユーザstudent1が長期記憶の概念ノードの色を変更した」という自然言語のステートメントの例を出力する様子を描写する。概念ノード205の色を変更することは、ユーザ入力がGUI202を操作する一例であるが、任意のタイプのユーザの対話が、同様に処理される。例えば、ユーザが概念ノード203を異なる位置に移動した場合、翻訳コンポーネント102は、「ユーザstudent1が宣言的記憶に関連する概念ノードを移動した」という自然言語のステートメントの例を生成し得る。
図5は、ユーザが、GUI201を介してチャット・エンジン110に命令ステートメントを提出する、本発明の実施形態を示している。具体的には、示されるとおり、ユーザは、「短期記憶について何らかの情報を表示してください」と述べた。翻訳コンポーネント102のコンポーネントは、ステートメントを分析し、ユーザがチャット・エンジン110に何らかの行動を行うように命令したことを判断する。それに応じて、翻訳コンポーネント102は、視覚化コンポーネント103によって実行されたとき、GUI202に反映されるように、短期記憶に対応する概念ノード204を強調表示するコード・ステートメントを生成する。
概念ノード204を強調表示することに加えて、翻訳コンポーネント102は、GUI202を介してユーザにヒントを提供するステートメントを生成してもよい。さらに、翻訳コンポーネント102は、GUI201,202のレイアウトを修正してもよい(例えば、並列、GUI201をGUI202に組み込むなど)。さらに、翻訳コンポーネント102は、ユーザが理解する主題に対応する概念ノードから、グラフ内の答えの概念への経路のように、GUI202の1つの視覚的エンティティから別の視覚的エンティティへの経路を強調表示するステートメントを生成し得る。さらに、翻訳コンポーネント102は、ユーザに短期記憶と長期記憶との違いを表示するために概念ノード204~205を強調するなど、GUI202の2つ以上のエンティティを強調表示するステートメントを生成してもよい。さらに、インテリジェント・チューター100は、ユーザが大量のテキストを読む/取り入れることを可能にする、または事前トレーニングするには組合せの数が非実際的に多くなるであろう、長い項目リスト上の要素の組合せの比較を提供することを可能にする、概念ノードを生成し得る。テキストを読むことの他に、インテリジェント・チューター100は、テキストにおける概念を特定し、GUI202に表示する概念ノードのグラフを作成することによって、テキストに含まれる知識的エンティティについての視覚的ガイドをもたらす。概念ノードのグラフによって、ユーザは所与のノードを選択することにより関連する各トピックについて学習することができる。
図6は、インテリジェント・チューターのための向上した視覚的ダイアログ・システムを提供する方法300の例を例示するフローチャートである。示されるとおり、方法300は、図7を参照してより詳細に説明されるブロック310から始まるが、ここで分類器121がトレーニングされる。一般に、分類器をトレーニングするためには、分類器が所望の結果を計算することができるようラベル付けされた入力が提供される。例えば、トレーニングは、同様の概念(例えば、「緑色の円を表示して」、「緑色の円はどこですか」、「緑色の円を見よう」、など)を有する異なる自然言語のステートメントを提供し得る。別の例として、トレーニングは、対応する自然言語のステートメントを生成するためにラベル付けされた異なるプログラム・コード・ステートメント(例えば、視覚化インターフェース202を修正するステートメント)を提供し得る。分類器112のトレーニングは、視覚化インターフェース202の要素を修正するためのコード・ステートメントに自然言語をマッピングするために使用される1つまたは複数の機械学習(ML)モデル、およびユーザと視覚化インターフェース202との対話に基づいて生成されたコード・ステートメントを自然言語ステートメントにマッピングするMLモデルを作り出し得る。
ブロック320で、チャット・エンジン110は、チャット・インターフェース201を介してユーザにテキストによるコミュニケーションを出力し得る。テキストによるコミュニケーションは、質問、学習教材などのような、どのようなタイプの学習ベースのコミュニケーションでもよい。ブロック330で、インテリジェント・チューター100は、ユーザ入力を受け取る。ユーザ入力は、チャット・インターフェース201または視覚化インターフェース202あるいはその両方を介して受け取られ得る。例えば、ユーザは、チャット・インターフェース201を介して応答をタイプすること、または視覚化インターフェース202を介して表示のために出力されるグラフィカル・オブジェクトを操作すること、あるいはその両方を行い得る。ブロック340で、入力が、チャット・インターフェースを介して受け取られたテキスト・ベースの入力であることを判断すると、翻訳コンポーネント102は、テキスト入力を視覚化インターフェース201を修正するためのコード・ステートメントに翻訳する。例えば、ユーザが「私は特許について理解していません」と述べるメッセージをタイプした場合、翻訳コンポーネント102は、視覚化インターフェース201によって実行可能なコード・ステートメントを生成して、特許についてのチュートリアルを出力し得る。
ブロック350では、視覚化インターフェース202を介して入力が受け取られたことを判断すると、翻訳コンポーネント102は、ユーザ入力に基づいて生成されたコード・ステートメントに基づいて自然言語のステートメントを生成する。例えば、ユーザ入力が特許に関するチュートリアルを開くことを指定した場合、視覚化インターフェース202は、視覚化インターフェース202に特許についてのチュートリアルを出力するコード・ステートメントを生成する。コード・ステートメントは、次に、翻訳コンポーネント102によって、「あなたは特許についてのチュートリアルを開きました」のような自然言語のステートメントに翻訳される。ブロック360では、GUI200は、翻訳された入力に基づいて修正される。例えば、自然言語のステートメント「あなたは特許についてのチュートリアルを開きました」が、チャット・インターフェース101を介して出力され得る。別の例として、視覚化コンポーネント103は、翻訳コンポーネント102によって生成されたコード・ステートメントを実行して視覚化インターフェース202を修正(例えば、特許についてのチュートリアルを出力)してもよい。ブロック370では、翻訳コンポーネント102は、現在のユーザのための機械学習モデルを更新し得る。ユーザのMLモデルは、ユーザによって提供された入力、ユーザの対話履歴を反映したあらゆる行動の履歴、およびユーザの学習の進捗を考慮する。ユーザのMLモデルは、次に、翻訳コンポーネント102によって、引き続き視覚化インターフェース202またはチャット・インターフェース201あるいはその両方を修正するために使用される。
図7は、ブロック310に対応する、分類器をトレーニングするための方法400の例を例示するフローチャートである。示されるとおり、方法400は、ブロック410から始まるが、ここで翻訳コンポーネント410は、任意選択でユーザ履歴またはユーザ・データあるいはその両方を含み得るトレーニング用データセットを受け取る。ブロック420では、トレーニング用データセットは、分類器121をトレーニングするために使用される。一般に、トレーニング用データセットは、「正しい」応答の指標を含むラベル付けされた入力データを含む。例えば、トレーニング用データセットは、複数の異なるコマンド、および対応する各ユーザ・コマンドのタイプの指標を含み得る。トレーニング用データセットはまた、各ユーザ・コマンドのタイプに基づいて視覚化インターフェース103を修正するために生成される適切なコード・ステートメントの指標を含み得る。同様に、トレーニング用データは、ユーザの視覚化インターフェース103のグラフィカル要素との対話に基づいて生成されたコード・ステートメント、対話に関連するイベント、およびイベントまたは対話あるいはその両方に関連する自然言語のステートメントを含んでもよい。トレーニング用データに基づいて、分類器121は、ブロック430でテキストから視覚化へのMLモデルを生成する。ブロック440で、分類器121は、視覚化からテキストへのMLモデルを生成する。
図8は、一実施形態による、テキスト入力を翻訳して視覚化を修正するためのステートメントを生成するブロック340に対応する、方法500の例を例示するフローチャートである。示されるとおり、方法500はブロック510から始まるが、ここで分類器121は、受け取ったテキスト入力における概念を特定するためにこのテキスト入力を処理する。ブロック520で、翻訳コンポーネント102は、例えば、ブロック430で生成されたテキストから視覚化へのMLモデルに基づいて、概念を視覚的な同等物にマッピングする。ブロック530で、翻訳コンポーネント102は、ブロック520で判断されたマッピングに基づいてプログラム・コード・ステートメントを生成してもよい。ブロック540で、翻訳コンポーネント102は、生成されたコード・ステートメントを視覚化コンポーネント103に伝送する。ブロック550で、視覚化コンポーネント103は、受け取ったコード・ステートメントを実行して視覚化インターフェース202を修正する。
図9は、視覚化インターフェースで受け取ったユーザ入力を翻訳して自然言語のステートメントを作成するブロック350に対応する、方法600の例を例示するフローチャートである。示されるとおり、方法600は、ブロック610で始まるが、ここで翻訳コンポーネント102は、視覚化インターフェース202を介して受け取られたユーザ入力を記述するプログラム・コード・ステートメントを視覚化コンポーネント103から受け取る。ブロック620で、翻訳コンポーネント102は、プログラム・コード・ステートメントを分類するためにMLモデルを使用する。ブロック630で、翻訳コンポーネント102は、分類されたプログラム・コード・ステートメントを自然言語のステートメントに翻訳する。ブロック640で、チャット・エンジン110は、チャット・インターフェース201を介して自然言語のステートメントを出力する。
図10は、インテリジェント・チューターのための向上した視覚的ダイアログ・システムを提供するシステム700の例を例示するブロック図である。ネットワーク化されたシステム700は、コンピュータ702を含む。コンピュータ702はまた、ネットワーク730を介して、他のコンピュータ(例えば、クライアント・システム750)に接続されてよい。一般に、ネットワーク730は、電気通信ネットワークまたは広域ネットワーク(WAN)あるいはその両方であってよい。特定の実施形態において、ネットワーク730はインターネットである。
コンピュータ702は、一般に、バス720を介してメモリ706またはストレージ708あるいはその両方から命令およびデータを取得するプロセッサ704を含む。コンピュータ702はまた、バス720に接続された1つまたは複数のネットワーク・インターフェース・デバイス718、入力デバイス722、および出力デバイス724を含んでもよい。コンピュータ702は、一般に、オペレーティング・システム(図示せず)の制御下にある。オペレーティング・システムの例には、UNIXオペレーティング・システム、Microsoft(登録商標) Windows(登録商標)オペレーティング・システムのバージョン、およびLinux(登録商標)オペレーティング・システムのディストリビューションが含まれる。(UNIXは、The Open Groupの、米国およびその他の国における、登録商標である。MicrosoftおよびWindowsは、マイクロソフトコーポレーションの、米国およびその他の国または両者における、商標である。Linuxは、Linus Torvaldsの、米国およびその他の国または両者における、登録商標である。)より一般には、本明細書で開示される機能をサポートするいかなるオペレーティング・システムが使用されてもよい。プロセッサ704は、命令、ロジック、および数学的処理を行うプログラマブル論理デバイスであり、1つまたは複数のCPUの代表であり得る。ネットワーク・インターフェース・デバイス718は、コンピュータ702がネットワーク730を介して他のコンピュータと通信することを可能にするどのようなタイプのネットワーク通信デバイスであってもよい。
ストレージ708は、ハードディスク・ドライブ、ソリッド・ステート・ドライブ、フラッシュメモリ・デバイス、光学式媒体などの代表である。一般に、ストレージ708は、コンピュータ702によって使用されるアプリケーション・プログラムおよびデータを保存する。加えて、メモリ706およびストレージ708は、物理的に他の場所に位置するメモリを含むと見なされ得る、例えばそれは、バス720を介してコンピュータ702に結合された別のコンピュータ上である。
入力デバイス722は、コンピュータ702に入力を提供する任意のデバイスであり得る。例えば、キーボードまたはマウスあるいはその両方が使用されてよい。入力デバイス722は、キーボード、マウス、コントローラなどを含む、多様な入力デバイスを代表する。さらに、入力デバイス722は、コンピュータ702を制御するための、ボタンのセット、スイッチ、または他の物理的デバイス機構を含み得る。出力デバイス724は、モニタ、タッチスクリーン・ディスプレイなどのような出力デバイスを含み得る。
示されるとおり、メモリ706は、上でより詳細に説明された、インテリジェント・チューター10を含む。示されるとおり、ストレージ708は、上で説明された任意のMLモデルを保存するMLモデル715を含む。一般に、システム700は、図1~図9を参照して上で説明されたすべての機能を実施するように構成される。クライアント・システム750は、インテリジェント・チューター100のユーザ・インスタンスを含むユーザ・システムである。ユーザは、クライアント・システム750のディスプレイ・デバイス(図示せず)上に提示された少なくともGUI200~202を介してインテリジェント・チューター100の機能にアクセスする。
有利なことに、本明細書に開示される本発明の実施形態は、インテリジェント・チューター・システムの異なるコンポーネントをより緊密に統合するための技術を提供する。より詳細には、本明細書に開示された本発明の実施形態は、ユーザのテキストおよびチャット・インターフェースでチャット・ボットによって生成されたテキストをインテリジェント・チューターの視覚化インターフェースを修正するプログラム・コード・ステートメントに翻訳する。加えて、本明細書に開示された本発明の実施形態は、視覚化インターフェースを修正するユーザ入力に応答して生成されたコード・ステートメントに基づいて自然言語のステートメントを生成する。このようにすることで、インテリジェント・チューター・システムの機能が改善し、ユーザにより卓越した学習体験が提供される。このようにすることでまた、視空間的要素および自然言語を含むユーザ対話のモデルが作り出され、データ取り込みおよび非空間領域での機械学習モデルのトレーニングが可能になる。
本発明の様々な実施形態の説明は、例示を目的として提示されたが、包括的であることまたは開示される実施形態に限定することは意図しない。本発明の範囲から逸脱することなく、多くの修正形態および変形形態が、当業者には明らかとなろう。本明細書で使用される用語は、本発明の原理、市場で見出される技術に対する実際的な適用または技術的な改良を最もよく説明するため、または他の当業者が本明細書で開示される実施形態を理解することを可能にするために選択された。
前述において、本明細書に提示された本発明の実施形態への参照が行われた。しかしながら、本発明の範囲は、特定の説明された実施形態に限定されない。むしろ、記載された特徴および要素のいかなる組合せも、異なる実施形態に関するか否かにかかわらず、本発明を実施および実践することが企図される。さらに、本明細書に開示された本発明の実施形態は、他の可能な解決策または従来技術を上まわる利点を達成し得るが、特定の利点が所与の実施形態によって達成されるかどうかは、本発明の範囲を限定するものではない。従って、記載された態様、特徴、実施形態、および利点は単に例示的なものであり、特許請求の範囲において明示的に記載される場合を除いて、添付の特許請求の範囲の要素または限定とは見なされない。同様に、「本発明」への参照は、本明細書に開示された発明のいかなる主題の一般化としても解釈されるべきでなく、かつ、特許請求の範囲で明示的に記載される場合を除いて、添付の特許請求の範囲の要素または限定とは見なされるべきではない。
本発明の態様は、完全にハードウェアの実施形態、完全にソフトウェア(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)の実施形態、または本明細書においてすべて全般的に「回路」、「モジュール」、または「システム」と呼ばれ得るソフトウェアの態様およびハードウェアの態様を組み合わせた実施形態の形を取り得る。
本発明は、システム、方法、またはコンピュータ・プログラム製品あるいはその組合せとして具体化され得る。コンピュータ・プログラム製品は、プロセッサに本発明の態様を遂行させるためのコンピュータ可読プログラム命令を有するコンピュータ可読ストレージ媒体を含んでもよい。
コンピュータ可読ストレージ媒体は、命令実行デバイスによって使用される命令を保持し、保存することができる有形のデバイスであってよい。コンピュータ可読ストレージ媒体は、例えば、非限定的に、電子ストレージ・デバイス、磁気ストレージ・デバイス、光学ストレージ・デバイス、電磁ストレージ・デバイス、半導体ストレージ・デバイスまたは前述のものの任意の適切な組合せであってよい。より具体的なコンピュータ可読ストレージ媒体の例の非網羅的一覧には、以下の、ポータブル・コンピュータ・ディスケット、ハードディスク、ランダム・アクセス・メモリ(RAM)、読み出し専用メモリ(ROM)、消去可能なプログラマブル読み出し専用メモリ(EPROMまたはフラッシュメモリ)、スタティック・ランダム・アクセス・メモリ(SRAM)、ポータブル・コンパクト・ディスク読み出し専用メモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリ・スティック、フロッピーディスク、パンチ・カードまたは命令が記録された溝中の隆起構造のような機械的に符号化されたデバイス、および前述のものの任意の適切な組合せが含まれる。本明細書で使用されるコンピュータ可読ストレージ媒体は、電波または他の自由に伝播する電磁波、導波管または他の伝送媒体を通じて伝播する電磁波(例えば、光ファイバ・ケーブルを通る光パルス)、またはケーブルを通じて伝送される電気信号のような、一時的な信号それ自体として解釈されるべきではない。
本明細書で説明されるコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体からそれぞれの計算/処理デバイスへと、またはネットワーク、例えば、インターネット、ローカル・エリア・ネットワーク、広域ネットワークまたはワイヤレス・ネットワークあるいはその組合せを介して外部コンピュータまたは外部ストレージ・デバイスにダウンロードされ得る。ネットワークは、銅伝送ケーブル、光学伝送ファイバ、ワイヤレス伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータまたはエッジ・サーバあるいはその組合せを含み得る。各計算/処理デバイスのネットワーク・アダプタ・カードまたはネットワーク・インターフェースは、ネットワークからコンピュータ可読プログラム命令を受け取り、コンピュータ可読プログラム命令を、それぞれの計算/処理デバイスの中のコンピュータ可読ストレージ媒体に保存のために転送する。
本開示の動作を遂行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはSmalltalk(登録商標)、C++などのようなオブジェクト指向プログラミング言語、および「C」プログラミング言語もしくは同様のプログラミング言語のような、従来の手続き型プログラミング言語を含む1つまたは複数のプログラミング言語の任意の組合せで書かれたソース・コードもしくはオブジェクト・コードのいずれかであってよい。コンピュータ可読プログラム命令は、スタンド・アロン型ソフトウェア・パッケージとして、全体的にユーザのコンピュータ上で、部分的にユーザのコンピュータ上で、部分的にユーザのコンピュータ上でかつ部分的にリモート・コンピュータ上で、または全体的にリモート・コンピュータ上もしくはサーバ上で実行され得る。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク(LAN)または広域ネットワーク(WAN)を含む任意のタイプのネットワークを通じてユーザのコンピュータと接続されてよく、あるいは接続は、(例えば、インターネット・サービス・プロバイダを使用してインターネットを通じて)外部コンピュータとなされてもよい。いくつかの実施形態において、例えば、プログラマブル論理回路、フィールド・プログラマブル・ゲート・アレイ(FPGA)またはプログラマブル・ロジック・アレイ(PLA)を含む電子回路は、本開示の態様を行うために、コンピュータ可読プログラム命令の状態情報を利用することによって電子回路をカスタマイズするためのコンピュータ可読プログラム命令を実行し得る。
本発明の態様が、本発明の実施形態による方法、装置(システム)およびコンピュータ・プログラム製品についてのフローチャート図またはブロック図あるいはその両方を参照して、本明細書において説明される。フローチャート図またはブロック図あるいはその両方の各ブロック、およびフローチャート図またはブロック図あるいはその両方におけるブロックの組合せは、コンピュータ可読プログラム命令によって実施され得るということが理解されよう。
これらのコンピュータ可読プログラム命令は、コンピュータまたは他のプログラマブル・データ処理装置のプロセッサを介して実行される命令が、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックに指定される機能/動作を実施する手段を作り出すべく、汎用コンピュータ、専用コンピュータ、または他のプログラマブル・データ処理装置のプロセッサに提供されて機械を作り出すものであってよい。これらのコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体に保存された命令により、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックに指定される機能/動作の態様を実施する命令を含んだ製品を含むべく、コンピュータ可読ストレージ媒体に保存され、コンピュータ、プログラマブル・データ処理装置、または他のデバイスあるいはその組合せに特定の方式で機能するように指示するものであってもよい。
コンピュータ可読プログラム命令は、コンピュータ、他のプログラマブル装置または他のデバイスで実行される命令が、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックに指定される機能/動作を実施するように、コンピュータによって実施されるプロセスを作り出すべくコンピュータ、他のプログラマブル・データ処理装置、または他のデバイスにロードされ、コンピュータ、他のプログラマブル装置、または他のデバイス上で一連の演算ステップを行わせるものであってもよい。
図中のフローチャートおよびブロック図は、本発明の様々な実施形態による、アーキテクチャ、機能性ならびにシステム、方法およびコンピュータ・プログラム製品の可能的な実施の動作を例示する。この点に関し、フローチャートまたはブロック図の各ブロックは、指定された論理関数を実施するための1つまたは複数の実行可能な命令を含むモジュール、セグメント、または命令の一部分を代表し得る。いくつかの代替的実施では、ブロックに記された機能は、図に記された順とは異なって生じ得る。例えば、連続して表示された2つのブロックは、実際には、含まれる機能性によって、実質的に同時に実行されてよく、または、ブロックは、ときには逆順で実行されてよい。ブロック図またはフローチャート説明図あるいはその両方の各ブロックおよびブロック図またはフローチャート図あるいはその両方におけるブロックの組合せは、特定の機能もしくは動作を行う、または、専用ハードウェアおよびコンピュータ命令の組合せを遂行する専用ハードウェア・ベースのシステムによって実施され得るということにも注意されたい。
本発明の実施形態は、クラウド・コンピューティング・インフラストラクチャを通じてエンド・ユーザに提供され得る。クラウド・コンピューティングとは、一般に、ネットワーク上のサービスとしてのスケーラブルなコンピューティング・リソースの提供を意味する。より正式には、クラウド・コンピューティングは、コンピューティング・リソースとその基盤となる技術アーキテクチャ(例えば、サーバ、ストレージ、ネットワーク)との間の抽象化を提供するコンピューティング能力として定義されてよく、最小限の管理作業またはサービス・プロバイダとの対話で、迅速にプロビジョニングおよびリリースされ得る構成可能なコンピューティング・リソースの共有プールへの便利でオンデマンドのネットワーク・アクセスを可能にするものである。従って、クラウド・コンピューティングにより、ユーザは、コンピューティング・リソースを提供するために使用される基盤となる物理的システム(またはこれらシステムの設置場所)を気にすることなく、「クラウド」における仮想コンピューティング・リソース(例えば、ストレージ、データ、アプリケーション、およびさらには完全に仮想化されたコンピューティング・システム)にアクセスできる。
一般的に、クラウド・コンピューティング・リソースは、ユーザに従量制で提供され、ユーザは、実際に使用されたコンピューティング・リソース(例えば、ユーザによって消費されたストレージ容量、またはユーザによってインスタンス化された仮想化システムの数)に対してのみ課金される。ユーザはクラウドにある任意のリソースに、いつでも、またインターネットのどこからでもアクセスすることができる。本発明の文脈において、ユーザは、クラウドで利用できるアプリケーションまたは関連するデータにアクセスし得る。例えば、インテリジェント・チューター100は、クラウドのコンピューティング・システム上で実行し得る。この場合、インテリジェント・チューター100は、クラウドにおけるストレージの場所でMLモデル715を生成し、保存し得る。このようにすることで、ユーザは、クラウドに接続されたネットワーク(例えば、インターネット)に取り付けられた任意のコンピューティング・システムからこの情報にアクセスすることができる。
前述の文では本発明の実施形態を対象とするが、本発明の他のおよびさらなる実施形態が、本発明の基本的な範囲から逸脱することなく考案され得、その範囲は、以下の特許請求の範囲によって決定される。

Claims (11)

  1. プロセッサが、
    チューター・アプリケーションのチャット・インターフェースを介してテキスト入力を受け取ることと、
    前記テキスト入力に適用される少なくとも1つの分類器によって、前記テキスト入力における概念を特定することと、
    前記テキスト入力における前記概念を現在表示されている視覚的オブジェクトにマッピングすることと、
    第1の機械学習モデルを用いて、前記視覚的オブジェクトに対応する第1のプログラム・コード・ステートメントを生成することと、
    前記チャット・インターフェースを介して受け取った前記テキスト入力に基づいて前記チューター・アプリケーションの視覚化インターフェースを修正するための前記第1のプログラム・コード・ステートメントを実行して、前記視覚的オブジェクトの表示を変更することと、
    を実行する、方法。
  2. 前記視覚的オブジェクトの修正を要求する入力を受け取ることと、
    前記入力に基づいて前記視覚的オブジェクトを修正するための第2のプログラム・コード・ステートメントを生成することと、
    第2の機械学習モデルを用いて前記第2のプログラム・コード・ステートメントを処理することによって、自然言語のステートメントを生成することと
    をさらに含む、請求項1に記載の方法。
  3. 前記第1のプログラム・コード・ステートメントは、グラフィックス・ステートメントの文法を含み、前記方法は、
    表示のために前記視覚化インターフェースを出力することをさらに含み、前記視覚化インターフェースは、複数の記視覚的オブジェクトを含み、前記第1のプログラム・コード・ステートメントは、前記複数の視覚的オブジェクトのうちの第1の視覚的オブジェクトを修正する、請求項に記載の方法。
  4. 前記視覚的オブジェクトの修正を要求する入力は、前記複数の視覚的オブジェクトのうちの第2の視覚的オブジェクトの修正を要求する入力である、請求項3に記載の方法。
  5. 前記テキスト入力を受け取ることの前に、
    トレーニング用データに基づいて前記第1の機械学習モデルおよび前記第2の機械学習モデルを生成するために前記少なくとも1つの分類器をトレーニングすること、
    をさらに含む、請求項2から4のいずれか一項に記載の方法。
  6. 前記トレーニング用データは、(i)自然言語のステートメントを生成するために使用される複数のラベル付けされたプログラム・コード・ステートメント、および(ii)プログラム・コード・ステートメントを生成するために使用される複数のラベル付けされた自然言語のステートメントを含む、請求項に記載の方法。
  7. チャット・エンジンによって、前記チャット・インターフェースを介して第1のメッセージを出力することと、
    前記第1のメッセージに適用される前記少なくとも1つの分類器によって、前記第1のメッセージにおける概念を分類することと、
    前記第1のメッセージにおける前記概念を前記第1のメッセージにおける前記概念に関連するイベントにマッピングすることと、
    前記第1のメッセージにおける前記概念に関連する前記イベントに対応する第2のプログラム・コード・ステートメントを生成することと、
    前記チャット・エンジンによって出力された前記第1のメッセージに基づいて前記チューター・アプリケーションの前記視覚化インターフェースを修正するための前記第2のプログラム・コード・ステートメントを実行することと、
    をさらに含む、請求項1に記載の方法。
  8. 前記テキスト入力は、前記チャット・インターフェースを介して出力された質問への応答を含む、請求項1から請求項のいずれか一項に記載の方法。
  9. 請求項1から請求項のいずれか一項に記載の方法における各ステップをプロセッサに実行させるためのコンピュータ・プログラム。
  10. 請求項に記載のコンピュータ・プログラムを記録した、コンピュータ可読ストレージ媒体。
  11. プロセッサと、
    1つまたは複数の命令を保存するメモリと、
    を備えるシステムであって、
    前記1つまたは複数の命令は、前記プロセッサに、請求項1から請求項のいずれか一項に記載の方法における各ステップを実行させる、システム。
JP2019570913A 2017-06-27 2018-06-06 インテリジェント・チューターのための向上した視覚的ダイアログ・システム Active JP7135010B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/634,451 2017-06-27
US15/634,451 US11144810B2 (en) 2017-06-27 2017-06-27 Enhanced visual dialog system for intelligent tutors
PCT/IB2018/054034 WO2019002996A1 (en) 2017-06-27 2018-06-06 IMPROVED VISUAL DIALOGUE SYSTEM FOR INTELLIGENT TAKERS

Publications (3)

Publication Number Publication Date
JP2020525827A JP2020525827A (ja) 2020-08-27
JP2020525827A5 JP2020525827A5 (ja) 2020-10-08
JP7135010B2 true JP7135010B2 (ja) 2022-09-12

Family

ID=64693390

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019570913A Active JP7135010B2 (ja) 2017-06-27 2018-06-06 インテリジェント・チューターのための向上した視覚的ダイアログ・システム

Country Status (6)

Country Link
US (1) US11144810B2 (ja)
JP (1) JP7135010B2 (ja)
CN (1) CN110709831B (ja)
DE (1) DE112018001952T5 (ja)
GB (1) GB2577465A (ja)
WO (1) WO2019002996A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102449875B1 (ko) * 2017-10-18 2022-09-30 삼성전자주식회사 음성 신호 번역 방법 및 그에 따른 전자 장치
US11854530B1 (en) * 2019-04-25 2023-12-26 Educational Testing Service Automated content feedback generation system for non-native spontaneous speech
US20230342117A1 (en) * 2020-02-12 2023-10-26 Nippon Telegraph And Telephone Corporation Program generation apparatus, program generation method and program
US11605187B1 (en) * 2020-08-18 2023-03-14 Corel Corporation Drawing function identification in graphics applications
WO2023081634A1 (en) * 2021-11-05 2023-05-11 Swarm Engineering, Inc. Method of creating self-assembling, transient analytic and learning agents in a message-driven architecture

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016151928A (ja) 2015-02-18 2016-08-22 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
US20180247549A1 (en) 2017-02-21 2018-08-30 Scriyb LLC Deep academic learning intelligence and deep neural language network system and interfaces

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3005537B1 (ja) * 1998-09-01 2000-01-31 ミツビシ・エレクトリック・インフォメイション・テクノロジー・センター・アメリカ・インコーポレイテッド 建設的対話型学習の方法、教育方法、教育用ゲームおよび教育用装置
US20040111272A1 (en) 2002-12-10 2004-06-10 International Business Machines Corporation Multimodal speech-to-speech language translation and display
US8750782B2 (en) 2003-04-02 2014-06-10 Joseph M. Scandura Building and delivering highly adaptive and configurable tutoring systems
US7640162B2 (en) * 2004-12-14 2009-12-29 Microsoft Corporation Semantic canvas
US7627466B2 (en) * 2005-11-09 2009-12-01 Microsoft Corporation Natural language interface for driving adaptive scenarios
US8602793B1 (en) 2006-07-11 2013-12-10 Erwin Ernest Sniedzins Real time learning and self improvement educational system and method
GB2472731A (en) 2008-05-30 2011-02-16 Sandeep Srivastava A self managed intelligent learning system
US20150169285A1 (en) * 2013-12-18 2015-06-18 Microsoft Corporation Intent-based user experience
US9892208B2 (en) 2014-04-02 2018-02-13 Microsoft Technology Licensing, Llc Entity and attribute resolution in conversational applications
US20170132528A1 (en) 2015-11-06 2017-05-11 Microsoft Technology Licensing, Llc Joint model training
US20180054523A1 (en) * 2016-08-16 2018-02-22 Rulai, Inc. Method and system for context sensitive intelligent virtual agents
CN106506213B (zh) 2016-11-09 2019-11-05 深圳华远云联数据科技有限公司 一种物联网设备可视化界面显示方法及系统
CN106648705A (zh) * 2017-01-06 2017-05-10 吴晓栋 基于视觉元素的应用程序开发与运行系统及其方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016151928A (ja) 2015-02-18 2016-08-22 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
US20180247549A1 (en) 2017-02-21 2018-08-30 Scriyb LLC Deep academic learning intelligence and deep neural language network system and interfaces

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吉根 勝美,統計データ処理実習を促進するための会話プログラムの試作,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2011年06月10日,Vol.111 No.85,第33~38頁

Also Published As

Publication number Publication date
WO2019002996A1 (en) 2019-01-03
CN110709831B (zh) 2023-05-30
GB2577465A (en) 2020-03-25
CN110709831A (zh) 2020-01-17
DE112018001952T5 (de) 2020-02-20
GB202000289D0 (en) 2020-02-26
US11144810B2 (en) 2021-10-12
JP2020525827A (ja) 2020-08-27
US20180373974A1 (en) 2018-12-27

Similar Documents

Publication Publication Date Title
JP7135010B2 (ja) インテリジェント・チューターのための向上した視覚的ダイアログ・システム
KR102484617B1 (ko) 이종 그래프 노드를 표현하는 모델 생성 방법, 장치, 전자 기기, 저장 매체 및 프로그램
Norouzi et al. A systematic review of the convergence of augmented reality, intelligent virtual agents, and the internet of things
JP7208952B2 (ja) 対話モデルを生成するための方法及び装置
KR102653312B1 (ko) 이벤트 아규먼트 추출 방법, 장치 및 전자 기기
US10248441B2 (en) Remote technology assistance through dynamic flows of visual and auditory instructions
US10394437B2 (en) Custom widgets based on graphical user interfaces of applications
US20190087780A1 (en) System and method to extract and enrich slide presentations from multimodal content through cognitive computing
CN112541060B (zh) 一种基于对抗训练的端到端任务型对话学习框架和方法
Singh et al. Mobile Deep Learning with TensorFlow Lite, ML Kit and Flutter: Build scalable real-world projects to implement end-to-end neural networks on Android and iOS
JP7395553B2 (ja) 文章翻訳方法、装置、電子機器及び記憶媒体
JP7247442B2 (ja) ユーザ対話における情報処理方法、装置、電子デバイス及び記憶媒体
JP2021522612A (ja) ヒューマンマシン会話方法、クライアント、電子デバイス、およびプログラム
US20190213900A1 (en) Generating selectable control items for a learner
Alexandersson et al. Metalogue: a multiperspective multimodal dialogue system with metacognitive abilities for highly adaptive and flexible dialogue management
US10386985B2 (en) User interface pattern mapping
TWI814394B (zh) 電子系統、電腦實施方法及電腦程式產品
US10956239B1 (en) Utilizing source context and classification in a copy operation
JP2022028889A (ja) 対話生成方法、装置、電子機器及び記憶媒体
Lee et al. What if we have meta GPT? From content singularity to human-metaverse interaction in AIGC era
US20220208018A1 (en) Artificial intelligence for learning path recommendations
Yaremchenko et al. Virtual Environment for Internet of Things Technologies Studying.
US20220207384A1 (en) Extracting Facts from Unstructured Text
US11340763B2 (en) Non-linear navigation of videos
US20190213899A1 (en) Generating selectable control items for a learner

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200722

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201130

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211124

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20211210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220418

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20220502

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220818

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220831

R150 Certificate of patent or registration of utility model

Ref document number: 7135010

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150