JP7273108B2 - モデルトレーニング方法、装置、電子デバイス、記憶媒体、プログラム - Google Patents
モデルトレーニング方法、装置、電子デバイス、記憶媒体、プログラム Download PDFInfo
- Publication number
- JP7273108B2 JP7273108B2 JP2021104044A JP2021104044A JP7273108B2 JP 7273108 B2 JP7273108 B2 JP 7273108B2 JP 2021104044 A JP2021104044 A JP 2021104044A JP 2021104044 A JP2021104044 A JP 2021104044A JP 7273108 B2 JP7273108 B2 JP 7273108B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- model
- training
- machine
- action
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
第1の意図認識モデルに対して最適化トレーニングを実行する場合、第1の意図認識モデルの完全接続層に対して最適化トレーニングを実行することと、
第1の行為決定モデルに対して最適化トレーニングを実行する場合、第1の行為決定モデルの完全接続層に対して最適化トレーニングを実行することと、のうちの少なくとも1つをさらに含み得る。
対話情報に基づいて、第1の意図認識モデルを使用して、ユーザの意図の確率分布を取得することと、
対話情報に基づいて、第1の循環ニューラルネットワークを使用して、対話状態の確率分布を取得することと、
対話情報に基づいて、第1の名前付きエンティティ認識モデルを使用して、対応するエンティティベクトルを取得することと、のうちの少なくとも1つを含む。
Claims (13)
- ヒューマンマシンインタラクションプロセス中にユーザによって入力された対話情報を取得することと、
前記対話情報に基づいて、第1の意図認識モデル、第1の循環ニューラルネットワークおよび第1の名前付きエンティティ認識モデルを使用して、ユーザ意図情報、対話状態情報、およびエンティティ情報を含む対応する予測情報を取得することと、
機械がヒューマンマシンインタラクションプロセスに機械行為情報に基づいて対応する機械行為を行うように、前記予測情報に基づいて、第1の行為決定モデルを使用して、対応する前記機械行為情報を取得することと、
ユーザが前記機械行為に対して入力されたフィードバック情報を取得することと、
前記予測情報、前記機械行為情報および前記フィードバック情報のうちの少なくとも1つをトレーニングデータとしてデータベースに格納することと、
前記データベース内のトレーニングデータが予め設定されたデータ量に達することに応答して、前記データベース内のトレーニングデータに基づいて、強化学習アルゴリズムを使用してオンラインでモデル最適化トレーニングを実行することと、を含み、
前記予測情報に基づいて第1の行為決定モデルを使用して対応する機械行為情報を取得することは、
前記予測情報に基づいて前記第1の行為決定モデルを使用して対応する機械行為の確率分布を取得することを含む
モデルトレーニング方法。 - 前記データベース内のトレーニングデータに基づいて、強化学習アルゴリズムを使用してオンラインでモデル最適化トレーニングを実行することは、
前記データベースからトレーニングデータをランダムに選択することと、
ランダムに選択されたトレーニングデータに基づいて、強化学習アルゴリズムを使用してオンラインでモデル最適化トレーニングを実行することと、を含む
請求項1に記載の方法。 - 前記データベース内のトレーニングデータに基づいて、強化学習アルゴリズムを使用してオンラインでモデル最適化トレーニングを実行することは、
前記データベースのトレーニングデータに基づき、強化学習アルゴリズムを使用して、前記第1の意図認識モデル、前記第1の循環ニューラルネットワーク、前記第1の名前付きエンティティ認識モデル、および前記第1の行為決定モデルの少なくとも1つのモデルに対してオンラインでモデル最適化トレーニングを実行する
請求項1に記載の方法。 - 前記第1の意図認識モデルに対して最適化トレーニングを実行する場合、前記第1の意図認識モデルの完全接続層に対して最適化トレーニングを実行することと、
前記第1の行為決定モデルに対して最適化トレーニングを実行する場合、前記第1の行為決定モデルの完全接続層に対して最適化トレーニングを実行することと、のうちの少なくとも1つをさらに含む
請求項3に記載の方法。 - 前記対話情報に基づいて、第1の意図認識モデル、第1の循環ニューラルネットワークおよび第1の名前付きエンティティ認識モデルを使用して対応する予測情報を取得することは、
前記対話情報に基づいて、前記第1の意図認識モデルを使用して、ユーザの意図の確率分布を取得することと、
前記対話情報に基づいて、前記第1の循環ニューラルネットワークを使用して、対話状態の確率分布を取得することと、
前記対話情報に基づいて、前記第1の名前付きエンティティ認識モデルを使用して、対応するエンティティベクトルを取得することと、のうちの少なくとも1つを含む
請求項1に記載の方法。 - ヒューマンマシンインタラクションプロセス中にユーザによって入力された対話情報を取得する第1の取得モジュールと、
前記対話情報に基づいて、第1の意図認識モデル、第1の循環ニューラルネットワークおよび第1の名前付きエンティティ認識モデルを使用して、ユーザ意図情報、対話状態情報、およびエンティティ情報を含む対応する予測情報を取得する第1の予測モジュールと、
機械がヒューマンマシンインタラクションプロセスに機械行為情報に基づいて対応する機械行為を行うように、前記予測情報に基づいて、第1の行為決定モデルを使用して、対応する前記機械行為情報を取得する第2の予測モジュールと、
ユーザが前記機械行為に対して入力されたフィードバック情報を取得する第2の取得モジュールと、
前記予測情報、前記機械行為情報および前記フィードバック情報のうちの少なくとも1つをトレーニングデータとしてデータベースに格納する記憶モジュールと、
前記データベース内のトレーニングデータが予め設定されたデータ量に達することに応答して、前記データベース内のトレーニングデータに基づいて、強化学習アルゴリズムを使用してオンラインでモデル最適化トレーニングを実行する最適化トレーニングモジュールと、を含み、
前記第2の予測モジュールは、
前記予測情報に基づいて前記第1の行為決定モデルを使用して対応する機械行為の確率分布を取得する
モデルトレーニング装置。 - 前記最適化トレーニングモジュールは、
前記データベースからトレーニングデータをランダムに選択する選択ユニットと、
ランダムに選択されたトレーニングデータに基づいて、強化学習アルゴリズムを使用してオンラインでモデル最適化トレーニングを実行する第1の最適化トレーニングユニットと、を含む
請求項6に記載の装置。 - 前記最適化トレーニングモジュールは、
前記データベースのトレーニングデータに基づき、強化学習アルゴリズムを使用して、前記第1の意図認識モデル、前記第1の循環ニューラルネットワーク、前記第1の名前付きエンティティ認識モデルおよび前記第1の行為決定モデルの少なくとも1つのモデルに対してオンラインでモデル最適化トレーニングを実行することに用いられる
請求項6に記載の装置。 - 前記最適化トレーニングモジュールは、
前記第1の意図認識モデルに対して最適化トレーニングを実行する場合、前記第1の意図認識モデルの完全接続層に対して最適化トレーニングを実行する第2の最適化トレーニングユニットと、
前記第1の行為決定モデルに対して最適化トレーニングを実行する場合、前記第1の行為決定モデルの完全接続層に対して最適化トレーニングを実行する第3の最適化トレーニングユニットと、のうちの少なくとも1つを含む
請求項8に記載の装置。 - 前記第1の予測モジュールは、
前記対話情報に基づいて、前記第1の意図認識モデルを使用して、ユーザの意図の確率分布を取得する第1の予測ユニットと、
前記対話情報に基づいて、前記第1の循環ニューラルネットワークを使用して、対話状態の確率分布を取得する第2の予測ユニットと、
前記対話情報に基づいて、前記第1の名前付きエンティティ認識モデルを使用して、対応するエンティティベクトルを取得する第3の予測ユニットと、のうちの少なくとも1つを含む
請求項6に記載の装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信可能に接続されたメモリとを含み、
前記メモリは、前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに請求項1~5のいずれか一項に記載の方法を実行させる前記少なくとも1つのプロセッサが実行される命令を記憶する
電子デバイス。 - コンピュータに請求項1~5のいずれか一項に記載の方法を実行させるコンピュータ命令を記憶する
非一時的なコンピュータ読み取り可能な記憶媒体。 - プロセッサによって実行される際に、請求項1~5のいずれか一項に記載の方法を実現するコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011573205.0A CN112579758B (zh) | 2020-12-25 | 2020-12-25 | 模型训练方法、装置、设备、存储介质和程序产品 |
CN202011573205.0 | 2020-12-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021152961A JP2021152961A (ja) | 2021-09-30 |
JP7273108B2 true JP7273108B2 (ja) | 2023-05-12 |
Family
ID=75140115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021104044A Active JP7273108B2 (ja) | 2020-12-25 | 2021-06-23 | モデルトレーニング方法、装置、電子デバイス、記憶媒体、プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220114343A1 (ja) |
EP (1) | EP4020326A1 (ja) |
JP (1) | JP7273108B2 (ja) |
CN (1) | CN112579758B (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113255769B (zh) * | 2021-05-26 | 2024-03-29 | 北京百度网讯科技有限公司 | 化合物属性预测模型训练方法和化合物属性预测方法 |
CN113360618B (zh) * | 2021-06-07 | 2022-03-11 | 暨南大学 | 一种基于离线强化学习的智能机器人对话方法及系统 |
CN113553413A (zh) * | 2021-06-30 | 2021-10-26 | 北京百度网讯科技有限公司 | 对话状态的生成方法、装置、电子设备和存储介质 |
CN114661899A (zh) * | 2022-02-15 | 2022-06-24 | 北京结慧科技有限公司 | 一种任务创建方法、装置、计算机设备和存储介质 |
CN114580543B (zh) * | 2022-03-07 | 2023-09-29 | 北京百度网讯科技有限公司 | 模型训练方法、交互日志解析方法、装置、设备及介质 |
CN114841338B (zh) * | 2022-04-06 | 2023-08-18 | 北京百度网讯科技有限公司 | 训练模型参数的方法、决策确定方法、装置及电子设备 |
CN114912537B (zh) * | 2022-05-26 | 2024-08-02 | 中国平安人寿保险股份有限公司 | 模型训练方法和装置、行为预测方法和装置、设备、介质 |
CN114969290A (zh) * | 2022-05-31 | 2022-08-30 | 中国电信股份有限公司 | 对话信息处理方法、装置、电子设备及存储介质 |
CN115169549B (zh) | 2022-06-24 | 2023-08-22 | 北京百度网讯科技有限公司 | 人工智能模型更新方法、装置、电子设备及存储介质 |
CN116029379B (zh) * | 2022-12-31 | 2024-01-02 | 中国电子科技集团公司信息科学研究院 | 空中目标意图识别模型构建方法 |
CN116186644B (zh) * | 2023-02-17 | 2024-04-19 | 飞算数智科技(深圳)有限公司 | 人机交互开发方法、装置、存储介质及电子设备 |
CN115964115B (zh) * | 2023-03-17 | 2023-06-02 | 中科航迈数控软件(深圳)有限公司 | 基于预训练强化学习的数控机床交互方法及相关设备 |
CN116468071B (zh) * | 2023-04-24 | 2024-04-05 | 北京百度网讯科技有限公司 | 模型训练方法、装置、设备及存储介质 |
CN116759077A (zh) * | 2023-08-18 | 2023-09-15 | 北方健康医疗大数据科技有限公司 | 一种基于智能体的医疗对话意图识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015528956A (ja) | 2012-07-20 | 2015-10-01 | ベベオ, インコーポレイテッド | 会話型相互作用システムの検索入力におけるユーザ意図を推定する方法およびそのためのシステム |
JP2019164626A (ja) | 2018-03-20 | 2019-09-26 | 日本電気株式会社 | 障害物認識支援装置、障害物認識支援方法、プログラム |
WO2020105302A1 (ja) | 2018-11-22 | 2020-05-28 | ソニー株式会社 | 応答生成装置、応答生成方法及び応答生成プログラム |
JP2020140210A (ja) | 2019-02-28 | 2020-09-03 | ネイバー コーポレーションNAVER Corporation | 会話システムにおいて意図が不明確なクエリを処理する方法およびシステム |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009025538A (ja) * | 2007-07-19 | 2009-02-05 | Nissan Motor Co Ltd | 音声対話装置 |
US10884503B2 (en) * | 2015-12-07 | 2021-01-05 | Sri International | VPA with integrated object recognition and facial expression recognition |
US10176800B2 (en) * | 2017-02-10 | 2019-01-08 | International Business Machines Corporation | Procedure dialogs using reinforcement learning |
JP6805112B2 (ja) * | 2017-11-08 | 2020-12-23 | 株式会社東芝 | 対話システム、対話方法および対話プログラム |
CN108363690A (zh) * | 2018-02-08 | 2018-08-03 | 北京十三科技有限公司 | 基于神经网络的对话语义意图预测方法及学习训练方法 |
US11397888B2 (en) * | 2018-06-14 | 2022-07-26 | Accenture Global Solutions Limited | Virtual agent with a dialogue management system and method of training a dialogue management system |
CN110046221B (zh) * | 2019-03-01 | 2023-12-22 | 平安科技(深圳)有限公司 | 一种机器对话方法、装置、计算机设备及存储介质 |
CN110211573A (zh) * | 2019-05-28 | 2019-09-06 | 重庆邮电大学 | 一种基于神经网络模型的任务驱动型对话决策方法 |
CN110321418B (zh) * | 2019-06-06 | 2021-06-15 | 华中师范大学 | 一种基于深度学习的领域、意图识别和槽填充方法 |
CN110554774B (zh) * | 2019-07-22 | 2022-11-04 | 济南大学 | 一种面向ar的导航式交互范式系统 |
CN110390108B (zh) * | 2019-07-29 | 2023-11-21 | 中国工商银行股份有限公司 | 基于深度强化学习的任务型交互方法和系统 |
CN110796495A (zh) * | 2019-10-31 | 2020-02-14 | 北京明略软件系统有限公司 | 一种实现信息处理的方法、装置、计算机存储介质及终端 |
CN114625878A (zh) * | 2022-03-22 | 2022-06-14 | 中国平安人寿保险股份有限公司 | 意图识别方法、交互系统及设备 |
-
2020
- 2020-12-25 CN CN202011573205.0A patent/CN112579758B/zh active Active
-
2021
- 2021-06-23 JP JP2021104044A patent/JP7273108B2/ja active Active
- 2021-12-22 EP EP21216758.9A patent/EP4020326A1/en not_active Withdrawn
- 2021-12-22 US US17/559,623 patent/US20220114343A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015528956A (ja) | 2012-07-20 | 2015-10-01 | ベベオ, インコーポレイテッド | 会話型相互作用システムの検索入力におけるユーザ意図を推定する方法およびそのためのシステム |
JP2019164626A (ja) | 2018-03-20 | 2019-09-26 | 日本電気株式会社 | 障害物認識支援装置、障害物認識支援方法、プログラム |
WO2020105302A1 (ja) | 2018-11-22 | 2020-05-28 | ソニー株式会社 | 応答生成装置、応答生成方法及び応答生成プログラム |
JP2020140210A (ja) | 2019-02-28 | 2020-09-03 | ネイバー コーポレーションNAVER Corporation | 会話システムにおいて意図が不明確なクエリを処理する方法およびシステム |
Also Published As
Publication number | Publication date |
---|---|
CN112579758A (zh) | 2021-03-30 |
EP4020326A1 (en) | 2022-06-29 |
US20220114343A1 (en) | 2022-04-14 |
JP2021152961A (ja) | 2021-09-30 |
CN112579758B (zh) | 2024-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7273108B2 (ja) | モデルトレーニング方法、装置、電子デバイス、記憶媒体、プログラム | |
EP3568852B1 (en) | Training and/or using an encoder model to determine responsive action(s) for natural language input | |
CN110852438B (zh) | 模型生成方法和装置 | |
JP6789303B2 (ja) | ニューラルネットワークを用いたテキストセグメントの係り受け解析の生成 | |
US20230048031A1 (en) | Data processing method and apparatus | |
US11227581B2 (en) | Systems and methods for generating a response based on task-independent conversational responses or task-specific responses | |
CN113361285B (zh) | 自然语言处理模型的训练方法、自然语言处理方法及装置 | |
JP7079311B2 (ja) | 機械読解モデルのトレーニング方法、装置、電子機器及び記憶媒体 | |
KR20210029785A (ko) | 활성화 희소화를 포함하는 신경 네트워크 가속 및 임베딩 압축 시스템 및 방법 | |
CN110766142A (zh) | 模型生成方法和装置 | |
CN111386537A (zh) | 基于注意力的仅解码器的序列转换神经网络 | |
US20230196202A1 (en) | System and method for automatic building of learning machines using learning machines | |
US20200134471A1 (en) | Method for Generating Neural Network and Electronic Device | |
JP2021106016A (ja) | 対話生成方法、装置、電子機器及び媒体 | |
CN115552417A (zh) | 具有稀疏注意力机制的注意力神经网络 | |
JP2023062080A (ja) | アミノ酸における原子座標の決定、トレーニング方法、装置、機器及び媒体 | |
CN114202076A (zh) | 深度学习模型的训练方法、自然语言处理方法和装置 | |
CN114492759A (zh) | 稀疏注意力神经网络 | |
CN113961679A (zh) | 智能问答的处理方法、系统、电子设备及存储介质 | |
CN114358257A (zh) | 神经网络剪枝方法及装置、可读介质和电子设备 | |
CN111667069A (zh) | 预训练模型压缩方法、装置和电子设备 | |
CN114528387A (zh) | 基于对话流自举的深度学习对话策略模型构建方法和系统 | |
CN116842155B (zh) | 文本生成方法、文本生成模型的训练方法及装置 | |
JP7462206B2 (ja) | 学習装置、学習方法、及び学習プログラム | |
CN113361712B (zh) | 特征确定模型的训练方法、语义分析方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210623 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220727 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221028 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230404 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230427 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7273108 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |