JP7414907B2 - 事前訓練済みモデルの決定方法及びその決定装置、電子機器並びに記憶媒体 - Google Patents
事前訓練済みモデルの決定方法及びその決定装置、電子機器並びに記憶媒体 Download PDFInfo
- Publication number
- JP7414907B2 JP7414907B2 JP2022125621A JP2022125621A JP7414907B2 JP 7414907 B2 JP7414907 B2 JP 7414907B2 JP 2022125621 A JP2022125621 A JP 2022125621A JP 2022125621 A JP2022125621 A JP 2022125621A JP 7414907 B2 JP7414907 B2 JP 7414907B2
- Authority
- JP
- Japan
- Prior art keywords
- model
- candidate
- trained
- code
- models
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 61
- 238000012549 training Methods 0.000 claims description 71
- 238000012545 processing Methods 0.000 claims description 27
- 238000005314 correlation function Methods 0.000 claims description 24
- 238000013507 mapping Methods 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 10
- 238000013473 artificial intelligence Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000013135 deep learning Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Image Analysis (AREA)
Description
図面は本解決案をよりよく理解するためのものであり、本開示を限定するものではない。
コーディングモジュール402は、複数の候補モデルのモデル構造に基づいて構造コーディングを行って、各候補モデルの構造コードを取得するように構成される。
マッピングモジュール403は、訓練済みエンコーダを用いて各候補モデルの構造コードをマッピングして、各前記候補モデルの周波数領域コードを取得するように構成される。
予測モジュール404は、各候補モデルの周波数領域コードに基づいて、各候補モデルのモデル性能パラメータを予測するように構成される。
決定モジュール405は、各候補モデルのモデル性能パラメータに基づいて、事前訓練済みモデルとして複数の候補モデルからターゲットモデルを決定するように構成される。
Claims (11)
- 複数の候補モデルを取得するステップと、
前記複数の候補モデルのモデル構造に基づいて構造コーディングを行って、各前記候補モデルの構造コードを取得するステップと、
訓練済みエンコーダを用いて各前記候補モデルの構造コードをマッピングして、各前記候補モデルの周波数領域コードを取得するステップと、
各前記候補モデルの周波数領域コードに基づいて、各前記候補モデルのモデル性能パラメータを予測するステップと、
各前記候補モデルのモデル性能パラメータに基づいて、事前訓練済みモデルとして複数の前記候補モデルからターゲットモデルを決定するステップと、
を含み、
各前記候補モデルの周波数領域コードに基づいて、各前記候補モデルのモデル性能パラメータを予測するステップが、
実行するタスクに基づいて、ターゲット相関関数を決定するステップと、
各前記候補モデルの周波数領域コードを前記ターゲット相関関数にそれぞれ代入して、各前記候補モデルのモデル性能パラメータを取得するステップと、
を含む、事前訓練済みモデルの決定方法。 - 訓練サンプルとして構成されたサンプル構造コードをエンコーダに入力して、前記エンコーダによって出力された予測周波数領域コードを取得するステップと、
前記予測周波数領域コードをデコーダに入力するステップと、
前記デコーダの出力と前記サンプル構造コードとの違いに基づいて、前記エンコーダと前記デコーダとを訓練するステップと、
を含む請求項1に記載の事前訓練済みモデルの決定方法。 - 訓練サンプルとして構成されたサンプル構造コードを前記エンコーダに入力して、前記エンコーダによって出力された予測周波数領域コードを取得するステップが、
前記訓練サンプルとして構成されたサンプル構造コードを前記エンコーダに入力して少なくとも2次元のコーディングを行って、前記エンコーダによって出力された少なくとも2次元の予測周波数領域コードを取得するステップを含む請求項2に記載の事前訓練済みモデルの決定方法。 - 複数の候補モデルを取得するステップが、
モデルセット内の特徴抽出モデルを組み合わせて、前記複数の候補モデルを取得するステップを含む請求項1に記載の事前訓練済みモデルの決定方法。 - 複数の候補モデルを取得するように構成される取得モジュールと、
前記複数の候補モデルのモデル構造に基づいて構造コーディングを行って、各前記候補モデルの構造コードを取得するように構成されるコーディングモジュールと、
訓練済みエンコーダを用いて各前記候補モデルの構造コードをマッピングして、各前記候補モデルの周波数領域コードを取得するように構成されるマッピングモジュールと、
各前記候補モデルの周波数領域コードに基づいて、各前記候補モデルのモデル性能パラメータを予測するように構成される予測モジュールと、
各前記候補モデルのモデル性能パラメータに基づいて、事前訓練済みモデルとして複数の前記候補モデルからターゲットモデルを決定するように構成される決定モジュールと、
を備え、
前記予測モジュールが、
実行するタスクに基づいて、ターゲット相関関数を決定するように構成される決定ユニットと、
各前記候補モデルの周波数領域コードを前記ターゲット相関関数にそれぞれ代入して、各前記候補モデルのモデル性能パラメータを取得するように構成される取得ユニットと、
を備える、事前訓練済みモデルの決定装置。 - 訓練サンプルとして構成されたサンプル構造コードをエンコーダに入力して、前記エンコーダによって出力された予測周波数領域コードを取得するように構成される第1の処理モジュールと、
前記予測周波数領域コードをデコーダに入力するように構成される第2の処理モジュールと、
前記デコーダの出力と前記サンプル構造コードとの違いに基づいて、前記エンコーダと前記デコーダとを訓練するように構成される訓練モジュールと、
を備える請求項5に記載の事前訓練済みモデルの決定装置。 - 前記第1の処理モジュールが、
前記訓練サンプルとして構成されたサンプル構造コードを前記エンコーダに入力して少なくとも2次元のコーディングを行って、前記エンコーダによって出力された少なくとも2次元の予測周波数領域コードを取得するように構成される処理ユニットを備える請求項6に記載の事前訓練済みモデルの決定装置。 - 前記取得モジュールが、
モデルセット内の特徴抽出モデルを組み合わせて、前記複数の候補モデルを取得するように構成される組み合せユニットを備える請求項5から7のいずれか一項に記載の事前訓練済みモデルの決定装置。 - 少なくとも1つのプロセッサと、
該少なくとも1つのプロセッサと通信可能に接続されるメモリと、
を備え、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記命令が前記少なくとも1つのプロセッサによって実行される場合、前記少なくとも1つのプロセッサが請求項1から4のいずれか一項に記載の事前訓練済みモデルの決定方法を実行できる電子機器。 - コンピュータに請求項1から4のいずれか一項に記載の事前訓練済みモデルの決定方法を実行させるためのコンピュータ命令を記憶した非一時的コンピュータ読み取り可能な記憶媒体。
- プロセッサによって実行される場合、請求項1から4のいずれか一項に記載の事前訓練済みモデルの決定方法を実現するコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110903956.2A CN113705628B (zh) | 2021-08-06 | 2021-08-06 | 预训练模型的确定方法、装置、电子设备以及存储介质 |
CN202110903956.2 | 2021-08-06 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022160590A JP2022160590A (ja) | 2022-10-19 |
JP7414907B2 true JP7414907B2 (ja) | 2024-01-16 |
Family
ID=78651846
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022125621A Active JP7414907B2 (ja) | 2021-08-06 | 2022-08-05 | 事前訓練済みモデルの決定方法及びその決定装置、電子機器並びに記憶媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220374678A1 (ja) |
JP (1) | JP7414907B2 (ja) |
KR (1) | KR20220116395A (ja) |
CN (1) | CN113705628B (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114297946B (zh) * | 2022-02-08 | 2023-03-24 | 无锡雪浪数制科技有限公司 | 一种实现多学科仿真模型降阶的工业互联网平台 |
CN114757630B (zh) * | 2022-06-16 | 2022-10-14 | 阿里健康科技(杭州)有限公司 | 仓储管理模型确定方法、装置及计算机设备 |
CN116109914B (zh) * | 2023-04-07 | 2023-06-27 | 平安银行股份有限公司 | 银行流水图像的鉴别真伪方法、装置、电子设备及介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021064342A (ja) | 2019-10-15 | 2021-04-22 | 北京小米智能科技有限公司Beijing Xiaomi Intelligent Technology Co.,Ltd. | ニューラルネットワーク構造モデルを検索する方法、装置及び記録媒体 |
JP2021081793A (ja) | 2019-11-14 | 2021-05-27 | キヤノン株式会社 | 情報処理装置、情報処理装置の制御方法およびプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111406267B (zh) * | 2017-11-30 | 2024-06-04 | 谷歌有限责任公司 | 使用性能预测神经网络的神经架构搜索 |
CN109286825B (zh) * | 2018-12-14 | 2021-04-30 | 北京百度网讯科技有限公司 | 用于处理视频的方法和装置 |
CN110457545B (zh) * | 2019-08-16 | 2022-12-27 | 第四范式(北京)技术有限公司 | 一种确定推荐系统中排序模型的参数的方法及装置 |
CN111079938B (zh) * | 2019-11-28 | 2020-11-03 | 百度在线网络技术(北京)有限公司 | 问答阅读理解模型获取方法、装置、电子设备及存储介质 |
CN111625635B (zh) * | 2020-05-27 | 2023-09-29 | 北京百度网讯科技有限公司 | 问答处理方法、装置、设备及存储介质 |
CN111859995B (zh) * | 2020-06-16 | 2024-01-23 | 北京百度网讯科技有限公司 | 机器翻译模型的训练方法、装置、电子设备及存储介质 |
CN112559885B (zh) * | 2020-12-25 | 2024-01-12 | 北京百度网讯科技有限公司 | 地图兴趣点的训练模型确定方法、装置及电子设备 |
CN112784778B (zh) * | 2021-01-28 | 2024-04-09 | 北京百度网讯科技有限公司 | 生成模型并识别年龄和性别的方法、装置、设备和介质 |
CN112766288B (zh) * | 2021-03-03 | 2024-01-23 | 重庆赛迪奇智人工智能科技有限公司 | 图像处理模型构建方法、装置、电子设备和可读存储介质 |
-
2021
- 2021-08-06 CN CN202110903956.2A patent/CN113705628B/zh active Active
-
2022
- 2022-08-04 KR KR1020220097212A patent/KR20220116395A/ko unknown
- 2022-08-04 US US17/817,449 patent/US20220374678A1/en active Pending
- 2022-08-05 JP JP2022125621A patent/JP7414907B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021064342A (ja) | 2019-10-15 | 2021-04-22 | 北京小米智能科技有限公司Beijing Xiaomi Intelligent Technology Co.,Ltd. | ニューラルネットワーク構造モデルを検索する方法、装置及び記録媒体 |
JP2021081793A (ja) | 2019-11-14 | 2021-05-27 | キヤノン株式会社 | 情報処理装置、情報処理装置の制御方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
KR20220116395A (ko) | 2022-08-23 |
US20220374678A1 (en) | 2022-11-24 |
JP2022160590A (ja) | 2022-10-19 |
CN113705628B (zh) | 2024-02-06 |
CN113705628A (zh) | 2021-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7414907B2 (ja) | 事前訓練済みモデルの決定方法及びその決定装置、電子機器並びに記憶媒体 | |
CA3004885C (en) | Asynchronous deep reinforcement learning | |
KR20220113881A (ko) | 사전 훈련 모델의 생성 방법, 장치, 전자 기기 및 저장 매체 | |
JP2023531132A (ja) | ビデオ認識モデルをトレーニングする方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
JP7297038B2 (ja) | ニューラルネットワークモデルの事前トレーニング方法、装置、電子機器及び媒体 | |
US11416760B2 (en) | Machine learning based user interface controller | |
CN112784778A (zh) | 生成模型并识别年龄和性别的方法、装置、设备和介质 | |
CN112949433B (zh) | 视频分类模型的生成方法、装置、设备和存储介质 | |
JP7351942B2 (ja) | 分野フレーズマイニング方法、装置及び電子機器 | |
KR20230139296A (ko) | 포인트 클라우드 처리 모델의 훈련과 포인트 클라우드 인스턴스 분할 방법 및 장치 | |
CN114424215A (zh) | 多任务适配器神经网络 | |
JP2023025126A (ja) | 深層学習モデルのトレーニング方法及び装置、テキストデータ処理方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム | |
CN112966744A (zh) | 模型训练方法、图像处理方法、装置和电子设备 | |
CN118095209B (zh) | 针对大语言模型的动态猜测解码方法、装置、设备及介质 | |
JP7446359B2 (ja) | 交通データ予測方法、交通データ予測装置、電子機器、記憶媒体、コンピュータプログラム製品及びコンピュータプログラム | |
CN112634880A (zh) | 话者识别的方法、装置、设备、存储介质以及程序产品 | |
CN113657466A (zh) | 预训练模型的生成方法、装置、电子设备和存储介质 | |
CN114186681A (zh) | 用于生成模型簇的方法、装置及计算机程序产品 | |
JP7314330B2 (ja) | 送電網システムディスパッチングモデルのトレーニング方法、装置、機器及び記憶媒体 | |
KR20220078538A (ko) | 생체 감지 모델 트레이닝 방법, 장치, 전자 기기 및 저장 매체 | |
CN113657468A (zh) | 预训练模型的生成方法、装置、电子设备和存储介质 | |
CN114220163A (zh) | 人体姿态估计方法、装置、电子设备及存储介质 | |
CN117351299A (zh) | 图像生成及模型训练方法、装置、设备和存储介质 | |
CN113361621B (zh) | 用于训练模型的方法和装置 | |
CN115081630A (zh) | 多任务模型的训练方法、信息推荐方法、装置和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220805 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230607 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230711 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231010 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231228 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7414907 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |