JP2019185748A - インタラクティブ言語習得のシステム、及び方法 - Google Patents
インタラクティブ言語習得のシステム、及び方法 Download PDFInfo
- Publication number
- JP2019185748A JP2019185748A JP2019026738A JP2019026738A JP2019185748A JP 2019185748 A JP2019185748 A JP 2019185748A JP 2019026738 A JP2019026738 A JP 2019026738A JP 2019026738 A JP2019026738 A JP 2019026738A JP 2019185748 A JP2019185748 A JP 2019185748A
- Authority
- JP
- Japan
- Prior art keywords
- visual
- natural language
- language input
- neural network
- computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B19/00—Teaching not covered by other main groups of this subclass
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B19/00—Teaching not covered by other main groups of this subclass
- G09B19/06—Foreign languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B5/00—Electrically-operated educational appliances
- G09B5/08—Electrically-operated educational appliances providing for individual presentation of information to a plurality of student stations
- G09B5/14—Electrically-operated educational appliances providing for individual presentation of information to a plurality of student stations with provision for individual teacher-student communication
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B7/00—Electrically-operated teaching apparatus or devices working with questions and answers
- G09B7/02—Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student
- G09B7/04—Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student characterised by modifying the teaching programme in response to a wrong answer, e.g. repeating the question, supplying a further explanation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Entrepreneurship & Innovation (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Machine Translation (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
Description
[A.はじめに]
[B.いくつかの関連作業]
[C.会話ゲームの実施形態]
[D.共同模倣及び強化によるインタラクティブ言語習得の実施形態]
[1.反響行動のための記憶拡張ニューラルネットワークによる模倣の実施形態]
[2.強化学習によるコンテクスト適応行動シェーピングの実施形態]
[E.いくつかの実験]
[1.単語レベルのタスク]
[2.画像変化がある学習]
[3.センテンスレベルタスク]
[F.データベースの実施形態と例文]
[G.ネットワーク詳細の実施形態]
[1.視覚エンコーダ]
[2.インタープリタとスピーカ]
[3.フュージョンゲート]
[4.コントローラ]
[5.バリューネットワーク]
[6.信頼度スコア]
[H.センテンスコンテンツ抽出及び重要性ゲートの実施形態]
[1.コンテンツ抽出]
[2.重要性ゲート]
[I.訓練詳細の実施形態]
[J.新規データに関する対話例]
[K.いくつかの結論]
[I.システム実施形態]
時間ステップで、視覚画像を含む入力と、前記視覚画像に関連するゼロ以上の単語を含む自然言語入力とを受信するステップと、
視覚エンコーダを使用して前記視覚画像を視覚的特徴表現に符号化するステップと、
注意機構を使用して前記自然言語入力を自然言語入力表現に符号化するステップと、
第1のニューラルネットワークにおいて少なくとも前記自然言語入力及び先の状態ベクトルに基づいて状態ベクトルを生成するステップと、
前記第1のニューラルネットワークを介して前記視覚的特徴表現と前記自然言語入力表現とを、視覚モダリティとセンテンスモダリティのペアとしてメモリに記憶するステップと、
前記状態ベクトルを剰余構造化ネットワークに通過させて制御ベクトルを生成し、状態入力として第2のニューラルネットワークの挙動を変調するステップと、
少なくとも前記制御ベクトルを使用して、学習された注意及びコンテンツの重要性を使用して、前記第2のニューラルネットワークによって指示される提案された応答部分と、前記メモリから検索された自然言語入力表現の少なくとも一部を用いて指示される提案された応答部分との間で、適応的に選択するステップであって、前記視覚的特徴表現を視覚キーとして使用して前記自然言語入力表現を検索することにより、前記入力に対応する応答を形成するステップと、を含む。
視覚画像を含む入力と、前記視覚画像に関連するゼロ以上の単語を含む自然言語入力とを受信するステップと、
視覚エンコーダを使用して前記視覚画像を視覚キーに符号化するステップと、
注意機構を使用して前記自然言語入力を自然言語入力表現に符号化するステップと、
第1のニューラルネットワークにおいて少なくとも前記自然言語入力及び先の状態ベクトルに基づいて状態ベクトルを生成するステップと、
前記状態ベクトルに基づいて制御ベクトルを生成して第2のニューラルネットワークの挙動を変調するステップと、
少なくとも部分的に前記制御ベクトルによって制御されるフュージョンゲートを使用して、前記第2のニューラルネットワークによって指示される提案された応答部分と、メモリから検索された自然言語入力表現の少なくとも一部を用いて指示される提案された応答部分との間で適応的に選択するステップであって、前記視覚キーを使用して前記自然言語入力表現を検索することにより、前記入力に対応する応答を形成し、前記メモリには、少なくとも一つの視覚モダリティとセンテンスモダリティのペアが記憶されており、視覚モダリティとセンテンスモダリティのペアのそれぞれは、記憶された視覚的特徴表現と記憶された自然言語入力表現とを含むステップと、を含む。
視覚画像を視覚的特徴表現に符号化するための視覚エンコーダと、
少なくとも、前記視覚画像に関連するゼロ以上の単語を含む自然言語入力と、過去の情報を用いた先の状態ベクトルとに基づいて、状態ベクトルを生成するための第1のニューラルネットワークと、
視覚的特徴表現と自然言語入力表現とを含む、視覚モダリティとセンテンスモダリティのペアを少なくとも一つ記憶するメモリと、
前記状態ベクトルを受信して制御ベクトルを生成する剰余構造化ネットワークと、
挙動変調のための前記制御ベクトルを受信する第2のニューラルネットワークであって、前記第2のニューラルネットワークによって指示される提案された応答部分と、前記メモリから検索された自然言語入力表現の少なくとも一部を使用して指示される提案された応答部分との間で適応的に選択し、前記視覚的特徴表現を視覚キーとして使用して前記自然言語入力表現を検索することにより、前記入力に対応する応答を形成する第2のニューラルネットワークと、を備える。
Claims (20)
- 複数の時間ステップを含むセッションにおいてインタラクティブ言語学習に基づくコンピュータ実施方法であって、
時間ステップで、視覚画像を含む入力と、前記視覚画像に関連するゼロ以上の単語を含む自然言語入力とを受信するステップと、
視覚エンコーダを使用して前記視覚画像を視覚的特徴表現に符号化するステップと、
注意機構を使用して前記自然言語入力を自然言語入力表現に符号化するステップと、
第1のニューラルネットワークにおいて少なくとも前記自然言語入力及び先の状態ベクトルに基づいて状態ベクトルを生成するステップと、
前記第1のニューラルネットワークを介して前記視覚的特徴表現と前記自然言語入力表現とを、視覚モダリティとセンテンスモダリティのペアとしてメモリに記憶するステップと、
前記状態ベクトルを剰余構造化ネットワークに通過させて制御ベクトルを生成し、状態入力として第2のニューラルネットワークの挙動を変調するステップと、
少なくとも前記制御ベクトルを使用して、学習された注意及びコンテンツの重要性を使用して、前記第2のニューラルネットワークによって指示される提案された応答部分と、前記メモリから検索された自然言語入力表現の少なくとも一部を用いて指示される提案された応答部分との間で、適応的に選択するステップであって、前記視覚的特徴表現を視覚キーとして使用して前記自然言語入力表現を検索することにより、前記入力に対応する応答を形成するステップと、を含む、
コンピュータ実施方法。 - 前記第2のニューラルネットワークの前記時間ステップにおける最終状態を、次の時間ステップにおける前記第1のニューラルネットワークへの入力として使用するステップを更に含む、
請求項1に記載のコンピュータ実施方法。 - 前記応答が正しい応答である場合、又はインタラクションステップの最大数に達した場合には、前記セッションを終了する、
請求項1に記載のコンピュータ実施方法。 - 前記剰余構造化ネットワークは、学習可能なコントローラを有する恒等写像拡張ネットワークである、
請求項1に記載のコンピュータ実施方法。 - 前記学習可能なコントローラは、前記状態ベクトルを受信して出力を生成し、前記制御ベクトルは、前記コントローラの出力と前記状態ベクトルとを組み合わせることで得られる、
請求項4に記載のコンピュータ実施方法。 - 前記自然言語入力、前記視覚入力、及び前記生成された応答に応じて、教師により、フィードバック及び報酬を生成することを更に含む、
請求項1に記載のコンピュータ実施方法。 - 前記報酬は、スカラー値フィードバックであり、前記応答の正確さに応じて、正の値で励ましとして、負の値で反対とする、
請求項6に記載のコンピュータ実施方法。 - 強化コスト関数によって表されるように予想される将来の報酬を最大化することにより、前記報酬を利用して応答を生成する際の行動ポリシーを調整する、
請求項6に記載のコンピュータ実施方法。 - 前記第1のニューラルネットワークにおいて模倣コスト関数によって前記自然言語入力を予測する際の誤差を最小化し、前記第1のニューラルネットワークと前記第2のニューラルネットワークとの間にパラメータを共有することにより、前記行動ポリシーを同時に最適化する、
請求項8に記載のコンピュータ実施方法。 - メモリ書き込み動作では、コンテンツ重要性ゲートは前記自然言語入力の関数として算出されて、前記自然言語入力のコンテンツを前記メモリに書き込むか否かを適応的に制御する、
請求項1に記載のコンピュータ実施方法。 - 訓練されたエージェントが習得した言語能力と発達したワンショット学習能力とを使用するためのコンピュータ実施方法であって、
視覚画像を含む入力と、前記視覚画像に関連するゼロ以上の単語を含む自然言語入力とを受信するステップと、
視覚エンコーダを使用して前記視覚画像を視覚キーに符号化するステップと、
注意機構を使用して前記自然言語入力を自然言語入力表現に符号化するステップと、
第1のニューラルネットワークにおいて少なくとも前記自然言語入力及び先の状態ベクトルに基づいて状態ベクトルを生成するステップと、
前記状態ベクトルに基づいて制御ベクトルを生成して第2のニューラルネットワークの挙動を変調するステップと、
少なくとも部分的に前記制御ベクトルによって制御されるフュージョンゲートを使用して、前記第2のニューラルネットワークによって指示される提案された応答部分と、メモリから検索された自然言語入力表現の少なくとも一部を用いて指示される提案された応答部分との間で適応的に選択するステップであって、前記視覚キーを使用して前記自然言語入力表現を検索することにより、前記入力に対応する応答を形成し、前記メモリには、少なくとも一つの視覚モダリティとセンテンスモダリティのペアが記憶されており、視覚モダリティとセンテンスモダリティのペアのそれぞれは、記憶された視覚的特徴表現と記憶された自然言語入力表現とを含むステップと、を含む、
コンピュータ実施方法。 - 前記少なくとも一つの視覚モダリティとセンテンスモダリティのペアは、前記第1のニューラルネットワークを介して、過去の自然言語入力及び関連する視覚入力を使用して、学習されたコンテンツ重要性に基づいて記憶される、
請求項11に記載のコンピュータ実施方法。 - 記憶された自然言語入力表現は、行列及び正規化された注意ベクトルに基づいて得られ、ここで、前記行列の列は、関連する過去の自然言語入力からのすべての単語の埋め込みベクトルであり、前記正規化された注意ベクトルは、前記関連する過去の自然言語入力における各単語の相対的重要性を示す、
請求項12に記載のコンピュータ実施方法。 - 前記第2のニューラルネットワークによって指示される提案された応答部分は、単語レベル注意とコンテンツ重要性を介して前記自然言語入力から共同で抽出される、
請求項11に記載のコンピュータ実施方法。 - クロスモダリティ検索により前記メモリから前記自然言語入力表現を検索し、前記クロスモダリティ検索は、前記視覚キーを使用してソフトリーディングウェイトを取得することで実施される、
請求項11に記載のコンピュータ実施方法。 - 前記ソフトリーディングウェイトは、前記視覚キーと記憶された視覚的特徴表現とのコサイン類似度を算出することで得られ、得られたソフトリーディングウェイトと前記記憶された自然言語入力表現との積を実施することで、前記自然言語入力表現の少なくとも一部を、前記視覚画像に関連するラベル単語に対応する埋め込みベクトルとして検索する、
請求項15に記載のコンピュータ実施方法。 - ワンショット視覚概念学習によるインタラクティブ言語習得のためのシステムであって、
視覚画像を視覚的特徴表現に符号化するための視覚エンコーダと、
少なくとも、前記視覚画像に関連するゼロ以上の単語を含む自然言語入力と、過去の情報を用いた先の状態ベクトルとに基づいて、状態ベクトルを生成するための第1のニューラルネットワークと、
視覚的特徴表現と自然言語入力表現とを含む、視覚モダリティとセンテンスモダリティのペアを少なくとも一つ記憶するメモリと、
前記状態ベクトルを受信して制御ベクトルを生成する剰余構造化ネットワークと、
挙動変調のための前記制御ベクトルを受信する第2のニューラルネットワークであって、前記第2のニューラルネットワークによって指示される提案された応答部分と、前記メモリから検索された自然言語入力表現の少なくとも一部を使用して指示される提案された応答部分との間で適応的に選択し、前記視覚的特徴表現を視覚キーとして使用して前記自然言語入力表現を検索することにより、前記入力に対応する応答を形成する第2のニューラルネットワークと、を備える、
システム。 - 前記第1のニューラルネットワークと前記第2のニューラルネットワークは、いずれもリカレントニューラルネットワークであり、且つパラメータを共有する、
請求項17に記載のシステム。 - 前記剰余構造化ネットワークは、前記状態ベクトルを受信し出力を生成するための学習可能なコントローラを含み、前記制御ベクトルは、前記コントローラの出力を前記状態ベクトルに結合することで得られる、
請求項17に記載のシステム。 - 前記第2のニューラルネットワークは、少なくとも部分的に学習した注意とコンテンツ重要性とに基づいて、前記第2のニューラルネットワークによって指示される提案された応答部分と、前記メモリから検索された提案された応答部分との間で、適応的に切り替えるための一つ又は複数のフュージョンゲートを含む、
請求項17に記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/951,905 | 2018-04-12 | ||
US15/951,905 US11074829B2 (en) | 2018-04-12 | 2018-04-12 | Systems and methods for interactive language acquisition with one-shot visual concept learning through a conversational game |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019185748A true JP2019185748A (ja) | 2019-10-24 |
JP6722789B2 JP6722789B2 (ja) | 2020-07-15 |
Family
ID=68162075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019026738A Active JP6722789B2 (ja) | 2018-04-12 | 2019-02-18 | インタラクティブ言語習得のシステム、及び方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11074829B2 (ja) |
JP (1) | JP6722789B2 (ja) |
CN (1) | CN110379225B (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021235866A1 (ko) * | 2020-05-20 | 2021-11-25 | 서울대학교병원 | 병원 리소스에 대한 환자 니즈 예측 방법 및 시스템 |
DE112020004868T5 (de) | 2019-10-09 | 2022-06-30 | Alps Alpine Co., Ltd. | Bedienungseingabevorrichtung |
WO2024042707A1 (ja) * | 2022-08-26 | 2024-02-29 | 日本電信電話株式会社 | メタ学習方法、メタ学習装置及びプログラム |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8577671B1 (en) | 2012-07-20 | 2013-11-05 | Veveo, Inc. | Method of and system for using conversation state information in a conversational interaction system |
US9465833B2 (en) | 2012-07-31 | 2016-10-11 | Veveo, Inc. | Disambiguating user intent in conversational interaction system for large corpus information retrieval |
US9852136B2 (en) | 2014-12-23 | 2017-12-26 | Rovi Guides, Inc. | Systems and methods for determining whether a negation statement applies to a current or past query |
US9854049B2 (en) | 2015-01-30 | 2017-12-26 | Rovi Guides, Inc. | Systems and methods for resolving ambiguous terms in social chatter based on a user profile |
US11417235B2 (en) * | 2017-05-25 | 2022-08-16 | Baidu Usa Llc | Listen, interact, and talk: learning to speak via interaction |
US10824909B2 (en) * | 2018-05-15 | 2020-11-03 | Toyota Research Institute, Inc. | Systems and methods for conditional image translation |
US11347966B2 (en) * | 2018-07-20 | 2022-05-31 | Samsung Electronics Co., Ltd. | Electronic apparatus and learning method of electronic apparatus |
US12080187B1 (en) * | 2018-07-27 | 2024-09-03 | Elemental Cognition Inc. | Information and dialog models for education |
US11188797B2 (en) * | 2018-10-30 | 2021-11-30 | International Business Machines Corporation | Implementing artificial intelligence agents to perform machine learning tasks using predictive analytics to leverage ensemble policies for maximizing long-term returns |
WO2020163801A1 (en) * | 2019-02-08 | 2020-08-13 | Warner Bros. Entertainment Inc. | Intra-vehicle games |
US11798029B2 (en) * | 2019-06-14 | 2023-10-24 | Microsoft Technology Licensing, Llc | System for effective use of data for personalization |
CN110309289B (zh) * | 2019-08-23 | 2019-12-06 | 深圳市优必选科技股份有限公司 | 一种句子生成方法、句子生成装置及智能设备 |
KR102302137B1 (ko) * | 2019-10-31 | 2021-09-15 | 주식회사 엘지씨엔에스 | 외국어 학습장치 및 이를 이용하는 외국어 학습서비스 제공방법 |
CN110956617A (zh) * | 2019-11-18 | 2020-04-03 | 湖北工业大学 | 基于循环注意力模型的大脑核磁共振异常图像可视化方法 |
WO2021121576A1 (en) * | 2019-12-18 | 2021-06-24 | Telefonaktiebolaget Lm Ericsson (Publ) | A computer software module arrangement, a circuitry arrangement, an arrangement and a method for improved software execution monitoring |
US11741371B2 (en) * | 2020-03-20 | 2023-08-29 | International Business Machines Corporation | Automatically generating diverse text |
CN111291015B (zh) * | 2020-04-28 | 2020-08-07 | 国网电子商务有限公司 | 一种用户行为异常检测方法及装置 |
CN111967272B (zh) * | 2020-06-23 | 2023-10-31 | 合肥工业大学 | 基于语义对齐的视觉对话生成系统 |
CN112069199B (zh) * | 2020-08-20 | 2022-08-05 | 浙江大学 | 一种基于中间语法树的多轮自然语言转sql方法 |
US11883746B2 (en) * | 2021-02-23 | 2024-01-30 | Electronic Arts Inc. | Adversarial reinforcement learning for procedural content generation and improved generalization |
CN112989977B (zh) * | 2021-03-03 | 2022-09-06 | 复旦大学 | 一种基于跨模态注意力机制的视听事件定位方法及装置 |
CN112989017B (zh) * | 2021-05-17 | 2021-08-10 | 南湖实验室 | 用于生成对话策略学习用高质量模拟经验的方法 |
CN113468364B (zh) * | 2021-07-21 | 2024-04-09 | 京东科技信息技术有限公司 | 一种图像处理方法及装置 |
CN113673773B (zh) * | 2021-08-25 | 2024-01-23 | 山东科技大学 | 一种融合知识背景和学习时间预测的学习路径推荐方法 |
US11875699B2 (en) | 2022-04-21 | 2024-01-16 | Columbia College | Methods for online language learning using artificial intelligence and avatar technologies |
CN115082915B (zh) * | 2022-05-27 | 2024-03-29 | 华南理工大学 | 一种基于多模态特征的移动机器人视觉-语言导航方法 |
CN114913403B (zh) * | 2022-07-18 | 2022-09-20 | 南京信息工程大学 | 基于度量学习的视觉问答方法 |
US20240221725A1 (en) * | 2022-12-30 | 2024-07-04 | Pearson Education, Inc. | System and method for artificial intelligence-based language skill assessment and development |
CN116680201B (zh) * | 2023-07-31 | 2023-10-17 | 南京争锋信息科技有限公司 | 一种基于机器学习的系统压力测试方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05204399A (ja) * | 1992-01-29 | 1993-08-13 | Meidensha Corp | 不特定話者音素認識方法 |
JP2017091525A (ja) * | 2015-11-03 | 2017-05-25 | バイドゥ・ユーエスエイ・リミテッド・ライアビリティ・カンパニーBaidu USA LLC | 視覚質問応答用の注目に基づく設定可能な畳み込みニューラルネットワーク(abc−cnn)のシステム及び方法 |
JP2017534956A (ja) * | 2015-05-21 | 2017-11-24 | バイドゥ ユーエスエイ エルエルシーBaidu USA LLC | 多言語画像質問応答 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7152051B1 (en) | 2002-09-30 | 2006-12-19 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
US9679258B2 (en) | 2013-10-08 | 2017-06-13 | Google Inc. | Methods and apparatus for reinforcement learning |
US10445641B2 (en) * | 2015-02-06 | 2019-10-15 | Deepmind Technologies Limited | Distributed training of reinforcement learning systems |
CN105700526B (zh) * | 2016-01-13 | 2018-07-27 | 华北理工大学 | 具有自主学习能力的在线序列极限学习机方法 |
US11645444B2 (en) | 2016-05-10 | 2023-05-09 | Trustees Of Tufts College | Systems and methods enabling online one-shot learning and generalization by intelligent systems of task-relevant features and transfer to a cohort of intelligent systems |
US10546066B2 (en) | 2016-08-31 | 2020-01-28 | Microsoft Technology Licensing, Llc | End-to-end learning of dialogue agents for information access |
DE202017106132U1 (de) | 2016-10-10 | 2017-11-13 | Google Llc | Neuronale Netze zum Auswählen von durch einen Roboteragenten auszuführenden Aktionen |
CN106951512A (zh) | 2017-03-17 | 2017-07-14 | 深圳市唯特视科技有限公司 | 一种基于混合编码网络的端到端对话控制方法 |
CN107480206B (zh) | 2017-07-25 | 2020-06-12 | 杭州电子科技大学 | 一种基于多模态低秩双线性池化的图像内容问答方法 |
CN107506823B (zh) | 2017-08-22 | 2020-11-13 | 南京大学 | 一种用于对话生成的混合神经网络模型的构建方法 |
-
2018
- 2018-04-12 US US15/951,905 patent/US11074829B2/en active Active
-
2019
- 2019-01-18 CN CN201910046948.3A patent/CN110379225B/zh active Active
- 2019-02-18 JP JP2019026738A patent/JP6722789B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05204399A (ja) * | 1992-01-29 | 1993-08-13 | Meidensha Corp | 不特定話者音素認識方法 |
JP2017534956A (ja) * | 2015-05-21 | 2017-11-24 | バイドゥ ユーエスエイ エルエルシーBaidu USA LLC | 多言語画像質問応答 |
JP2017091525A (ja) * | 2015-11-03 | 2017-05-25 | バイドゥ・ユーエスエイ・リミテッド・ライアビリティ・カンパニーBaidu USA LLC | 視覚質問応答用の注目に基づく設定可能な畳み込みニューラルネットワーク(abc−cnn)のシステム及び方法 |
Non-Patent Citations (3)
Title |
---|
ADAM SANTORO, ET AL.: "Meta-learning with memory-augmented neural networks", [ONLINE], vol. 48, JPN6020008107, 2016, US, pages 1842 - 1850, XP055357768, ISSN: 0004224898 * |
海野 裕也: "人と機械の言語獲得", 認知科学, vol. 第24巻,第1号, JPN6020008106, 1 March 2017 (2017-03-01), JP, pages 16 - 22, ISSN: 0004224897 * |
石橋 陽一、外1名: "連想対話モデル:発話文から連想した視覚情報を用いた応答文生成", 第10回データ工学と情報マネジメントに関するフォーラム (第16回日本データベース学会年次大会) [, JPN6020008104, 6 March 2018 (2018-03-06), JP, pages 1 - 8, ISSN: 0004224896 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112020004868T5 (de) | 2019-10-09 | 2022-06-30 | Alps Alpine Co., Ltd. | Bedienungseingabevorrichtung |
WO2021235866A1 (ko) * | 2020-05-20 | 2021-11-25 | 서울대학교병원 | 병원 리소스에 대한 환자 니즈 예측 방법 및 시스템 |
KR20210143635A (ko) * | 2020-05-20 | 2021-11-29 | 서울대학교병원 | 병원 리소스에 대한 환자 니즈 예측 방법 및 시스템 |
KR102429319B1 (ko) | 2020-05-20 | 2022-08-04 | 서울대학교병원 | 병원 리소스에 대한 환자 니즈 예측 방법 및 시스템 |
WO2024042707A1 (ja) * | 2022-08-26 | 2024-02-29 | 日本電信電話株式会社 | メタ学習方法、メタ学習装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN110379225A (zh) | 2019-10-25 |
US20190318648A1 (en) | 2019-10-17 |
CN110379225B (zh) | 2021-08-31 |
US11074829B2 (en) | 2021-07-27 |
JP6722789B2 (ja) | 2020-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6722789B2 (ja) | インタラクティブ言語習得のシステム、及び方法 | |
US11860969B2 (en) | Universal transformers | |
CN112487182B (zh) | 文本处理模型的训练方法、文本处理方法及装置 | |
US11514330B2 (en) | Systems and methods for continual updating of response generation by an artificial intelligence chatbot | |
JP6952201B2 (ja) | 質問応答としてのマルチタスク学習 | |
Li et al. | Learning through dialogue interactions by asking questions | |
JP2021524623A (ja) | 質問応答としてのマルチタスク学習 | |
CN113656570A (zh) | 基于深度学习模型的视觉问答方法及装置、介质、设备 | |
JP2019023717A (ja) | 傾聴、インタラクト、及びトーク:インタラクションを介するスピーキング学習 | |
KR102040400B1 (ko) | 머신러닝을 이용한 사용자 맞춤형 문제 제공 시스템 및 방법 | |
KR20190125154A (ko) | 심리 상담 데이터를 기계 학습한 자동 대화 장치 및 그 방법 | |
Wahde et al. | Conversational agents: Theory and applications | |
CN110770759A (zh) | 神经网络系统 | |
CN112115246A (zh) | 基于对话的内容推荐方法、装置、计算机设备及存储介质 | |
US12050983B2 (en) | Attention neural networks with parallel attention and feed-forward layers | |
Bansal et al. | Transforming conversations with AI—a comprehensive study of ChatGPT | |
Doering et al. | Curiosity did not kill the robot: A curiosity-based learning system for a shopkeeper robot | |
CN115408502A (zh) | 在同步会议中认知学习以生成模拟现场代理动作的脚本 | |
Zhou et al. | Building task-oriented visual dialog systems through alternative optimization between dialog policy and language generation | |
JP2024506580A (ja) | 適応勾配クリッピングを用いるニューラルネットワーク | |
US20230178076A1 (en) | Controlling interactive agents using multi-modal inputs | |
WO2023158881A1 (en) | Computationally efficient distillation using generative neural networks | |
Zhang et al. | Interactive language acquisition with one-shot visual concept learning through a conversational game | |
Jawahar | Personalized ECA Tutoring with Self-Adjusted POMDP Policies and User Clustering | |
Caron et al. | TacticalGPT: uncovering the potential of LLMs for predicting tactical decisions in professional football |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190227 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190227 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200303 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200603 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200616 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200622 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6722789 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |