CN110851566A - 一种改进的可微分网络结构搜索的方法 - Google Patents
一种改进的可微分网络结构搜索的方法 Download PDFInfo
- Publication number
- CN110851566A CN110851566A CN201911067765.6A CN201911067765A CN110851566A CN 110851566 A CN110851566 A CN 110851566A CN 201911067765 A CN201911067765 A CN 201911067765A CN 110851566 A CN110851566 A CN 110851566A
- Authority
- CN
- China
- Prior art keywords
- training
- network
- parameters
- meta
- differentiable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 104
- 238000012549 training Methods 0.000 claims abstract description 90
- 230000008569 process Effects 0.000 claims abstract description 34
- 238000005457 optimization Methods 0.000 claims abstract description 31
- 238000010606 normalization Methods 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000013528 artificial neural network Methods 0.000 claims description 26
- 238000009826 distribution Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000012795 verification Methods 0.000 claims description 7
- 238000013215 result calculation Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 description 9
- 230000002787 reinforcement Effects 0.000 description 8
- 230000000306 recurrent effect Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 230000001537 neural effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 125000004122 cyclic group Chemical group 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000011478 gradient descent method Methods 0.000 description 3
- 238000013441 quality evaluation Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 238000009827 uniform distribution Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011423 initialization method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/374—Thesaurus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (6)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911067765.6A CN110851566B (zh) | 2019-11-04 | 2019-11-04 | 一种应用于命名实体识别的可微分网络结构搜索的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911067765.6A CN110851566B (zh) | 2019-11-04 | 2019-11-04 | 一种应用于命名实体识别的可微分网络结构搜索的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110851566A true CN110851566A (zh) | 2020-02-28 |
CN110851566B CN110851566B (zh) | 2022-04-29 |
Family
ID=69599697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911067765.6A Active CN110851566B (zh) | 2019-11-04 | 2019-11-04 | 一种应用于命名实体识别的可微分网络结构搜索的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110851566B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111651989A (zh) * | 2020-04-13 | 2020-09-11 | 上海明略人工智能(集团)有限公司 | 命名实体识别方法和装置、存储介质及电子装置 |
CN111666763A (zh) * | 2020-05-28 | 2020-09-15 | 平安科技(深圳)有限公司 | 用于多任务场景的网络结构构建方法和装置 |
CN111860495A (zh) * | 2020-06-19 | 2020-10-30 | 上海交通大学 | 一种层级化网络结构搜索方法、设备及可读存储介质 |
CN112270194A (zh) * | 2020-11-03 | 2021-01-26 | 沈阳雅译网络技术有限公司 | 一种基于梯度神经网络结构搜索的命名实体识别方法 |
CN112801264A (zh) * | 2020-11-13 | 2021-05-14 | 中国科学院计算技术研究所 | 一种动态可微分的空间架构搜索方法与系统 |
CN113033784A (zh) * | 2021-04-18 | 2021-06-25 | 沈阳雅译网络技术有限公司 | 一种针对cpu和gpu设备搜索神经网络结构的方法 |
CN113094504A (zh) * | 2021-03-24 | 2021-07-09 | 北京邮电大学 | 基于自动机器学习的自适应文本分类方法及装置 |
CN113111668A (zh) * | 2021-04-18 | 2021-07-13 | 沈阳雅译网络技术有限公司 | 一种用于翻译任务的语言建模系统结构搜索方法 |
CN113361575A (zh) * | 2021-05-28 | 2021-09-07 | 北京百度网讯科技有限公司 | 模型训练方法、装置和电子设备 |
CN114722304A (zh) * | 2022-04-15 | 2022-07-08 | 南开大学 | 异质信息网络上基于主题的社区搜索方法 |
CN115605862A (zh) * | 2020-03-04 | 2023-01-13 | 西门子工业软件有限公司(Us) | 训练用于3d模型数据库查询的可微分渲染器和神经网络 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109919299A (zh) * | 2019-02-19 | 2019-06-21 | 西安交通大学 | 一种基于元学习器逐步梯度校正的元学习算法 |
CN109978142A (zh) * | 2019-03-29 | 2019-07-05 | 腾讯科技(深圳)有限公司 | 神经网络模型的压缩方法和装置 |
CN110020667A (zh) * | 2019-02-21 | 2019-07-16 | 广州视源电子科技股份有限公司 | 神经网络结构的搜索方法、系统、存储介质以及设备 |
DE202019102260U1 (de) * | 2019-04-18 | 2019-07-31 | Albert-Ludwigs-Universität Freiburg | Vorrichtung zum Erstellen eines neuronalen Netzes |
CN110175671A (zh) * | 2019-04-28 | 2019-08-27 | 华为技术有限公司 | 神经网络的构建方法、图像处理方法及装置 |
-
2019
- 2019-11-04 CN CN201911067765.6A patent/CN110851566B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109919299A (zh) * | 2019-02-19 | 2019-06-21 | 西安交通大学 | 一种基于元学习器逐步梯度校正的元学习算法 |
CN110020667A (zh) * | 2019-02-21 | 2019-07-16 | 广州视源电子科技股份有限公司 | 神经网络结构的搜索方法、系统、存储介质以及设备 |
CN109978142A (zh) * | 2019-03-29 | 2019-07-05 | 腾讯科技(深圳)有限公司 | 神经网络模型的压缩方法和装置 |
DE202019102260U1 (de) * | 2019-04-18 | 2019-07-31 | Albert-Ludwigs-Universität Freiburg | Vorrichtung zum Erstellen eines neuronalen Netzes |
CN110175671A (zh) * | 2019-04-28 | 2019-08-27 | 华为技术有限公司 | 神经网络的构建方法、图像处理方法及装置 |
Non-Patent Citations (2)
Title |
---|
HANXIAO LIU: "DARTS:Differentiable Architecture Search", 《CORNELL UNIVERSITY EXPORT.ARVIX.ORG>CS>MACHINE LEARNING》 * |
WU, BICHEN,ETC: "FBNet: Hardware-Aware Efficient ConvNet Design via Differentiable Neural Architecture Search", 《2019 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR 2019)》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115605862B (zh) * | 2020-03-04 | 2025-04-25 | 西门子工业软件有限公司 | 训练用于3d模型数据库查询的可微分渲染器和神经网络 |
CN115605862A (zh) * | 2020-03-04 | 2023-01-13 | 西门子工业软件有限公司(Us) | 训练用于3d模型数据库查询的可微分渲染器和神经网络 |
CN111651989A (zh) * | 2020-04-13 | 2020-09-11 | 上海明略人工智能(集团)有限公司 | 命名实体识别方法和装置、存储介质及电子装置 |
CN111651989B (zh) * | 2020-04-13 | 2024-04-02 | 上海明略人工智能(集团)有限公司 | 命名实体识别方法和装置、存储介质及电子装置 |
CN111666763A (zh) * | 2020-05-28 | 2020-09-15 | 平安科技(深圳)有限公司 | 用于多任务场景的网络结构构建方法和装置 |
WO2021114625A1 (zh) * | 2020-05-28 | 2021-06-17 | 平安科技(深圳)有限公司 | 用于多任务场景的网络结构构建方法和装置 |
CN111860495B (zh) * | 2020-06-19 | 2022-05-17 | 上海交通大学 | 一种层级化网络结构搜索方法、设备及可读存储介质 |
CN111860495A (zh) * | 2020-06-19 | 2020-10-30 | 上海交通大学 | 一种层级化网络结构搜索方法、设备及可读存储介质 |
CN112270194A (zh) * | 2020-11-03 | 2021-01-26 | 沈阳雅译网络技术有限公司 | 一种基于梯度神经网络结构搜索的命名实体识别方法 |
CN112270194B (zh) * | 2020-11-03 | 2023-07-18 | 沈阳雅译网络技术有限公司 | 一种基于梯度神经网络结构搜索的命名实体识别方法 |
CN112801264A (zh) * | 2020-11-13 | 2021-05-14 | 中国科学院计算技术研究所 | 一种动态可微分的空间架构搜索方法与系统 |
CN112801264B (zh) * | 2020-11-13 | 2023-06-13 | 中国科学院计算技术研究所 | 一种动态可微分的空间架构搜索方法与系统 |
CN113094504A (zh) * | 2021-03-24 | 2021-07-09 | 北京邮电大学 | 基于自动机器学习的自适应文本分类方法及装置 |
CN113111668A (zh) * | 2021-04-18 | 2021-07-13 | 沈阳雅译网络技术有限公司 | 一种用于翻译任务的语言建模系统结构搜索方法 |
CN113033784A (zh) * | 2021-04-18 | 2021-06-25 | 沈阳雅译网络技术有限公司 | 一种针对cpu和gpu设备搜索神经网络结构的方法 |
CN113361575A (zh) * | 2021-05-28 | 2021-09-07 | 北京百度网讯科技有限公司 | 模型训练方法、装置和电子设备 |
CN113361575B (zh) * | 2021-05-28 | 2023-10-20 | 北京百度网讯科技有限公司 | 模型训练方法、装置和电子设备 |
CN114722304A (zh) * | 2022-04-15 | 2022-07-08 | 南开大学 | 异质信息网络上基于主题的社区搜索方法 |
CN114722304B (zh) * | 2022-04-15 | 2025-03-28 | 南开大学 | 异质信息网络上基于主题的社区搜索方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110851566B (zh) | 2022-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110851566B (zh) | 一种应用于命名实体识别的可微分网络结构搜索的方法 | |
CN111310438B (zh) | 基于多粒度融合模型的中文句子语义智能匹配方法及装置 | |
CN110377686B (zh) | 一种基于深度神经网络模型的地址信息特征抽取方法 | |
CN112633010B (zh) | 基于多头注意力和图卷积网络的方面级情感分析方法及系统 | |
CN109614471B (zh) | 一种基于生成式对抗网络的开放式问题自动生成方法 | |
CN118779438B (zh) | 融合领域知识的数据智能问答方法及系统 | |
CN110232434A (zh) | 一种基于属性图优化的神经网络架构评估方法 | |
CN106529818B (zh) | 基于模糊小波神经网络的水质评价预测方法 | |
CN110781319B (zh) | 跨媒体大数据的公共语义表示、搜索方法和装置 | |
CN109447261B (zh) | 一种基于多阶邻近相似度的网络表示学习的方法 | |
CN118095445B (zh) | 一种基于知识图谱的少样本多跳推理优化方法 | |
CN113204674A (zh) | 基于局部-整体图推理网络的视频-段落检索方法及系统 | |
CN110264372A (zh) | 一种基于节点表示的主题社团发现方法 | |
CN112464611A (zh) | 一种基于云端协同智能处理的pcb自动布线系统 | |
CN112200208B (zh) | 基于多维度特征融合的云工作流任务执行时间预测方法 | |
CN110691000B (zh) | 基于FAHP与规划图融合的Web服务组合方法 | |
CN114596473B (zh) | 一种基于图神经网络分层损失函数的网络嵌入预训练方法 | |
CN113033218B (zh) | 一种基于神经网络结构搜索的机器翻译译文质量评估方法 | |
CN118332101B (zh) | 一种基于分层迭代的长文本抽取式摘要生成方法和装置 | |
CN119003769A (zh) | 一种基于双大模型的网民观点分析方法 | |
CN114579605B (zh) | 表格问答数据处理方法、电子设备及计算机存储介质 | |
CN112905599B (zh) | 基于端到端的分布式深度哈希检索方法 | |
CN117010373A (zh) | 一种电力设备资产管理数据所属类别和组的推荐方法 | |
CN108959467A (zh) | 一种基于强化学习的问句和答案句相关度的计算方法 | |
CN114969279A (zh) | 一种基于层次图神经网络的表格文本问答方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information |
Inventor after: Du Quan Inventor after: Xu Nuo Inventor before: Du Quan Inventor before: Xu Nuo Inventor before: Zhu Jingbo Inventor before: Xiao Tong Inventor before: Zhang Chunliang |
|
CB03 | Change of inventor or designer information | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A Differentiable Network Structure Search Method Applied to Named Entity Recognition Effective date of registration: 20230508 Granted publication date: 20220429 Pledgee: China Construction Bank Shenyang Hunnan sub branch Pledgor: SHENYANG YAYI NETWORK TECHNOLOGY CO.,LTD. Registration number: Y2023210000101 |
|
PE01 | Entry into force of the registration of the contract for pledge of patent right |