CN108021983A - 神经架构搜索 - Google Patents

神经架构搜索 Download PDF

Info

Publication number
CN108021983A
CN108021983A CN201711037649.0A CN201711037649A CN108021983A CN 108021983 A CN108021983 A CN 108021983A CN 201711037649 A CN201711037649 A CN 201711037649A CN 108021983 A CN108021983 A CN 108021983A
Authority
CN
China
Prior art keywords
neural network
sub
output
time step
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711037649.0A
Other languages
English (en)
Chinese (zh)
Inventor
巴雷特·佐福
国·V·勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN108021983A publication Critical patent/CN108021983A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/0985Hyperparameter optimisation; Meta-learning; Learning-to-learn
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/092Reinforcement learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/098Distributed learning, e.g. federated learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Feedback Control In General (AREA)
CN201711037649.0A 2016-10-28 2017-10-30 神经架构搜索 Pending CN108021983A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201662414300P 2016-10-28 2016-10-28
US62/414,300 2016-10-28

Publications (1)

Publication Number Publication Date
CN108021983A true CN108021983A (zh) 2018-05-11

Family

ID=60473590

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711037649.0A Pending CN108021983A (zh) 2016-10-28 2017-10-30 神经架构搜索

Country Status (6)

Country Link
US (3) US11030523B2 (https=)
JP (3) JP6817431B2 (https=)
KR (2) KR102532658B1 (https=)
CN (1) CN108021983A (https=)
DE (2) DE202017106532U1 (https=)
WO (1) WO2018081563A1 (https=)

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109065076A (zh) * 2018-09-05 2018-12-21 深圳追科技有限公司 音频标签的设置方法、装置、设备和存储介质
CN109189973A (zh) * 2018-08-30 2019-01-11 清华大学 基于策略梯度的大规模图像检索方法及装置
CN109255374A (zh) * 2018-08-27 2019-01-22 中共中央办公厅电子科技学院 一种基于密集卷积网络和多任务网络的美学属性评价方法
CN109615073A (zh) * 2018-12-03 2019-04-12 郑州云海信息技术有限公司 一种神经网络模型的构建方法、设备以及存储介质
CN110110861A (zh) * 2019-05-09 2019-08-09 北京市商汤科技开发有限公司 确定模型超参数及模型训练的方法和装置、存储介质
CN110490320A (zh) * 2019-07-30 2019-11-22 西北工业大学 基于预测机制和遗传算法融合的深度神经网络结构优化方法
CN110503192A (zh) * 2018-05-18 2019-11-26 百度(美国)有限责任公司 资源有效的神经架构
CN110598629A (zh) * 2019-09-11 2019-12-20 北京百度网讯科技有限公司 超网络的搜索空间构建方法、装置以及电子设备
CN110826686A (zh) * 2018-08-07 2020-02-21 艾玛迪斯简易股份公司 有属性序列的机器学习系统和方法
CN110889487A (zh) * 2018-09-10 2020-03-17 富士通株式会社 神经网络架构搜索装置和方法及计算机可读记录介质
CN110956260A (zh) * 2018-09-27 2020-04-03 瑞士电信公司 神经架构搜索的系统和方法
CN111033535A (zh) * 2018-06-05 2020-04-17 北京嘀嘀无限科技发展有限公司 用于乘车订单调度的系统和方法
CN111144561A (zh) * 2018-11-05 2020-05-12 杭州海康威视数字技术股份有限公司 一种神经网络模型确定方法及装置
CN111325311A (zh) * 2018-12-14 2020-06-23 深圳云天励飞技术有限公司 神经网络模型生成方法、装置、电子设备及存储介质
CN111516700A (zh) * 2020-05-11 2020-08-11 安徽大学 一种驾驶员分心细粒度监测方法和系统
CN111819580A (zh) * 2018-05-29 2020-10-23 谷歌有限责任公司 用于密集图像预测任务的神经架构搜索
WO2020237687A1 (zh) * 2019-05-31 2020-12-03 深圳市大疆创新科技有限公司 网络结构搜索的方法及装置、计算机存储介质和计算机程序产品
CN112513886A (zh) * 2018-08-03 2021-03-16 索尼公司 信息处理方法、信息处理装置和信息处理程序
CN112639833A (zh) * 2018-08-30 2021-04-09 皇家飞利浦有限公司 可自适应神经网络
CN112771543A (zh) * 2018-09-28 2021-05-07 赛灵思公司 通过包括实现成本作为目标来训练神经网络
CN112836787A (zh) * 2019-11-04 2021-05-25 百度(美国)有限责任公司 通过高效混合并行化减少深度神经网络训练次数
WO2021103977A1 (zh) * 2019-11-30 2021-06-03 华为技术有限公司 神经网络的搜索方法、装置及设备
CN113039562A (zh) * 2018-11-02 2021-06-25 微软技术许可有限责任公司 概率神经网络架构生成
CN113614747A (zh) * 2019-04-09 2021-11-05 罗伯特·博世有限公司 用于运行深度神经网络的方法、设备和计算机程序
CN113811893A (zh) * 2019-05-23 2021-12-17 谷歌有限责任公司 用于引导架构演进的连接权重学习
CN114341880A (zh) * 2019-07-08 2022-04-12 维亚奈系统公司 用于使神经网络的操作可视化的技术
CN114417960A (zh) * 2020-12-04 2022-04-29 谷歌有限责任公司 用于时间序列预测的自动的机器学习
CN114503121A (zh) * 2019-08-23 2022-05-13 谷歌有限责任公司 资源约束的神经网络架构搜索
CN115066690A (zh) * 2020-02-07 2022-09-16 谷歌有限责任公司 搜索归一化-激活层架构
CN115329140A (zh) * 2019-01-11 2022-11-11 谷歌有限责任公司 动态小批量大小
CN115398446A (zh) * 2020-06-05 2022-11-25 谷歌有限责任公司 使用符号编程的机器学习算法搜索
CN116210263A (zh) * 2020-08-18 2023-06-02 高通股份有限公司 针对ue处基于神经网络的处理的报告配置
CN116324807A (zh) * 2020-10-02 2023-06-23 谷歌有限责任公司 神经架构和硬件加速器搜索
US12032571B2 (en) 2019-09-17 2024-07-09 Huawei Cloud Computing Technologies Co., Ltd. AI model optimization method and apparatus
US12086718B2 (en) 2018-08-07 2024-09-10 Amadeus S.A.S. Machine learning systems and methods for attributed sequences
WO2025153048A1 (zh) * 2024-01-17 2025-07-24 中国移动通信有限公司研究院 对话生成模型的训练方法、对话生成方法及装置

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10565493B2 (en) * 2016-09-22 2020-02-18 Salesforce.Com, Inc. Pointer sentinel mixture architecture
DE202017106532U1 (de) * 2016-10-28 2018-02-05 Google Llc Suche nach einer neuronalen Architektur
EP3602316A4 (en) * 2017-03-24 2020-12-30 D5A1 Llc LEARNING COACH FOR AUTOMATIC LEARNING SYSTEM
US12014257B2 (en) * 2017-05-19 2024-06-18 Salesforce, Inc. Domain specific language for generation of recurrent neural network architectures
CN111406264B (zh) 2017-10-27 2024-10-18 谷歌有限责任公司 神经架构搜索
KR20200023238A (ko) 2018-08-23 2020-03-04 삼성전자주식회사 딥러닝 모델을 생성하는 방법 및 시스템
US11334791B2 (en) * 2018-09-05 2022-05-17 Siemens Healthcare Gmbh Learning to search deep network architectures
KR102066009B1 (ko) * 2018-09-14 2020-01-14 가천대학교 산학협력단 순환신경망을 사용한 의료영상기기의 영상복원 시스템
US11645509B2 (en) * 2018-09-27 2023-05-09 Salesforce.Com, Inc. Continual neural network learning via explicit structure learning
US11775812B2 (en) 2018-11-30 2023-10-03 Samsung Electronics Co., Ltd. Multi-task based lifelong learning
US11556778B2 (en) * 2018-12-07 2023-01-17 Microsoft Technology Licensing, Llc Automated generation of machine learning models
US11114103B2 (en) * 2018-12-28 2021-09-07 Alibaba Group Holding Limited Systems, methods, and computer-readable storage media for audio signal processing
US10909457B2 (en) 2019-01-23 2021-02-02 Google Llc Compound model scaling for neural networks
US11790212B2 (en) * 2019-03-18 2023-10-17 Microsoft Technology Licensing, Llc Quantization-aware neural architecture search
US12050979B2 (en) 2019-03-19 2024-07-30 Cisco Technology, Inc. Budgeted neural network architecture search system and method
US11630990B2 (en) 2019-03-19 2023-04-18 Cisco Technology, Inc. Systems and methods for auto machine learning and neural architecture search
DE102019204136A1 (de) * 2019-03-26 2020-10-01 Robert Bosch Gmbh Verfahren und Vorrichtung für Training und Herstellung eines künstlichen neuronalen Netzes
CN110288084A (zh) * 2019-06-06 2019-09-27 北京小米智能科技有限公司 超网络训练方法和装置
DE102019210167A1 (de) * 2019-07-10 2021-01-14 Robert Bosch Gmbh Robusteres Training für künstliche neuronale Netzwerke
CN110428046B (zh) * 2019-08-28 2023-12-15 腾讯科技(深圳)有限公司 神经网络结构的获取方法及装置、存储介质
CN110598852A (zh) * 2019-08-29 2019-12-20 北京小米移动软件有限公司 子网络采样方法、构建超网络拓扑结构的方法及装置
CN110543944B (zh) * 2019-09-11 2022-08-02 北京百度网讯科技有限公司 神经网络结构搜索方法、装置、电子设备和介质
IL291346B2 (en) * 2019-09-25 2026-01-01 Deepmind Tech Ltd Augmenting attention-based neural networks for selective processing of past inputs
CN110956262A (zh) * 2019-11-12 2020-04-03 北京小米智能科技有限公司 超网络训练方法及装置、电子设备、存储介质
CN112990461B (zh) * 2019-12-16 2023-09-19 杭州海康威视数字技术股份有限公司 构建神经网络模型的方法、装置、计算机设备和存储介质
CN113128678B (zh) * 2020-01-15 2025-05-09 华为技术有限公司 神经网络的自适应搜索方法及装置
WO2021154722A1 (en) * 2020-01-27 2021-08-05 Akkio, Inc. Methods and systems for dynamically generating a plurality of machine learning systems during processing of a user data set
US11521028B2 (en) 2020-04-10 2022-12-06 Toyota Research Institute, Inc. Meta-learning neural architecture search via graph networks on search space lattices
TWI831016B (zh) 2020-06-05 2024-02-01 宏達國際電子股份有限公司 機器學習方法、機器學習系統以及非暫態電腦可讀取媒體
US11436498B2 (en) * 2020-06-09 2022-09-06 Toyota Research Institute, Inc. Neural architecture search system for generating a neural network architecture
CN113837374B (zh) * 2020-06-23 2026-01-02 中兴通讯股份有限公司 神经网络的生成方法、设备及计算机可读存储介质
CN111782398B (zh) * 2020-06-29 2024-12-13 上海商汤智能科技有限公司 数据处理的方法、装置、系统及相关设备
JP6885553B1 (ja) * 2020-07-14 2021-06-16 エッジコーティックス ピーティーイー. リミテッド ハードウェアとニューラルアーキテクチャとの共同探索
DE102020208828A1 (de) * 2020-07-15 2022-01-20 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren und Vorrichtung zum Erstellen eines maschinellen Lernsystems
EP3975060A1 (en) * 2020-09-29 2022-03-30 Samsung Electronics Co., Ltd. Method and apparatus for analysing neural network performance
US20220101063A1 (en) * 2020-09-29 2022-03-31 Samsung Electronics Co., Ltd. Method and apparatus for analyzing neural network performance
KR102264571B1 (ko) * 2020-10-30 2021-06-15 주식회사 애자일소다 계층 구조를 갖는 의사결정 에이전트
US20220198260A1 (en) * 2020-12-22 2022-06-23 International Business Machines Corporation Multi-level multi-objective automated machine learning
US12498908B2 (en) 2021-01-26 2025-12-16 Akkio Inc. Methods and systems for automatically generating and executing computer code using a natural language description of a data manipulation to be performed on a data set
CN116868204A (zh) 2021-02-04 2023-10-10 谷歌有限责任公司 用于机器学习模型的渐进学习以优化训练速度的系统和方法
CN115393662A (zh) * 2021-05-08 2022-11-25 Oppo广东移动通信有限公司 图像处理方法、装置、计算机设备及存储介质
US12028188B2 (en) 2021-05-12 2024-07-02 Analog Devices, Inc. Digital predistortion with hybrid basis-function-based actuator and neural network
US12003261B2 (en) 2021-05-12 2024-06-04 Analog Devices, Inc. Model architecture search and optimization for hardware
CN113469078B (zh) * 2021-07-07 2023-07-04 西安电子科技大学 基于自动设计长短时记忆网络的高光谱图像分类方法
WO2023009766A1 (en) * 2021-07-28 2023-02-02 Google Llc Evaluating output sequences using an auto-regressive language model neural network
DE102021208197A1 (de) * 2021-07-29 2023-02-02 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren und Vorrichtung zum Erstellen eines maschinellen Lernsystems
KR102610429B1 (ko) * 2021-09-13 2023-12-06 연세대학교 산학협력단 인공신경망과 연산 가속기 구조 통합 탐색 장치 및 방법
KR20230100914A (ko) 2021-12-29 2023-07-06 경희대학교 산학협력단 인공신경망 탐색 방법 및 이를 수행하기 위한 컴퓨팅 장치
US12346665B2 (en) 2022-02-14 2025-07-01 International Business Machines Corporation Neural architecture search of language models using knowledge distillation
KR20230152448A (ko) * 2022-04-27 2023-11-03 현대자동차주식회사 Enas를 적용한 소음 및 진동 데이터 기반 이상상태 진단을 위한 ai 진단모델 자동생성 방법
KR102782300B1 (ko) 2022-05-16 2025-03-17 주식회사 뷰노 생체 신호 분석 방법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6553357B2 (en) * 1999-09-01 2003-04-22 Koninklijke Philips Electronics N.V. Method for improving neural network architectures using evolutionary algorithms
CN102402712B (zh) 2011-08-31 2014-03-05 山东大学 基于神经网络的机器人强化学习初始化方法
US10275719B2 (en) * 2015-01-29 2019-04-30 Qualcomm Incorporated Hyper-parameter selection for deep convolutional networks
JP2017102906A (ja) * 2015-11-25 2017-06-08 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
JP6470165B2 (ja) * 2015-12-15 2019-02-13 株式会社東芝 サーバ、システム及び探索方法
US9899672B2 (en) 2016-05-17 2018-02-20 Nanotek Instruments, Inc. Chemical-free production of graphene-encapsulated electrode active material particles for battery applications
DE202017106532U1 (de) * 2016-10-28 2018-02-05 Google Llc Suche nach einer neuronalen Architektur

Cited By (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110503192B (zh) * 2018-05-18 2023-09-19 百度(美国)有限责任公司 资源有效的神经架构
CN110503192A (zh) * 2018-05-18 2019-11-26 百度(美国)有限责任公司 资源有效的神经架构
CN111819580A (zh) * 2018-05-29 2020-10-23 谷歌有限责任公司 用于密集图像预测任务的神经架构搜索
CN111033535A (zh) * 2018-06-05 2020-04-17 北京嘀嘀无限科技发展有限公司 用于乘车订单调度的系统和方法
CN111033535B (zh) * 2018-06-05 2024-03-26 北京嘀嘀无限科技发展有限公司 用于乘车订单调度的系统和方法
CN112513886A (zh) * 2018-08-03 2021-03-16 索尼公司 信息处理方法、信息处理装置和信息处理程序
US12462160B2 (en) 2018-08-03 2025-11-04 Sony Corporation Performing distributed processing using layers of a neural network divided between a first device and a second device
CN112513886B (zh) * 2018-08-03 2024-03-22 索尼公司 信息处理方法、信息处理装置和信息处理程序
CN110826686A (zh) * 2018-08-07 2020-02-21 艾玛迪斯简易股份公司 有属性序列的机器学习系统和方法
US12086718B2 (en) 2018-08-07 2024-09-10 Amadeus S.A.S. Machine learning systems and methods for attributed sequences
CN109255374A (zh) * 2018-08-27 2019-01-22 中共中央办公厅电子科技学院 一种基于密集卷积网络和多任务网络的美学属性评价方法
CN109189973B (zh) * 2018-08-30 2021-07-30 清华大学 基于策略梯度的大规模图像检索方法及装置
CN112639833A (zh) * 2018-08-30 2021-04-09 皇家飞利浦有限公司 可自适应神经网络
CN109189973A (zh) * 2018-08-30 2019-01-11 清华大学 基于策略梯度的大规模图像检索方法及装置
CN109065076A (zh) * 2018-09-05 2018-12-21 深圳追科技有限公司 音频标签的设置方法、装置、设备和存储介质
CN110889487A (zh) * 2018-09-10 2020-03-17 富士通株式会社 神经网络架构搜索装置和方法及计算机可读记录介质
CN110956260A (zh) * 2018-09-27 2020-04-03 瑞士电信公司 神经架构搜索的系统和方法
CN112771543A (zh) * 2018-09-28 2021-05-07 赛灵思公司 通过包括实现成本作为目标来训练神经网络
CN113039562A (zh) * 2018-11-02 2021-06-25 微软技术许可有限责任公司 概率神经网络架构生成
US12079726B2 (en) 2018-11-02 2024-09-03 Microsoft Technology Licensing, Llc Probabilistic neural network architecture generation
CN111144561A (zh) * 2018-11-05 2020-05-12 杭州海康威视数字技术股份有限公司 一种神经网络模型确定方法及装置
CN111144561B (zh) * 2018-11-05 2023-05-02 杭州海康威视数字技术股份有限公司 一种神经网络模型确定方法及装置
CN109615073B (zh) * 2018-12-03 2021-06-04 郑州云海信息技术有限公司 一种神经网络模型的构建方法、设备以及存储介质
CN109615073A (zh) * 2018-12-03 2019-04-12 郑州云海信息技术有限公司 一种神经网络模型的构建方法、设备以及存储介质
CN111325311B (zh) * 2018-12-14 2024-03-29 深圳云天励飞技术有限公司 用于图像识别的神经网络模型生成方法及相关设备
CN111325311A (zh) * 2018-12-14 2020-06-23 深圳云天励飞技术有限公司 神经网络模型生成方法、装置、电子设备及存储介质
CN115329140B (zh) * 2019-01-11 2025-10-21 谷歌有限责任公司 动态小批量大小
CN115329140A (zh) * 2019-01-11 2022-11-11 谷歌有限责任公司 动态小批量大小
CN113614747A (zh) * 2019-04-09 2021-11-05 罗伯特·博世有限公司 用于运行深度神经网络的方法、设备和计算机程序
CN110110861A (zh) * 2019-05-09 2019-08-09 北京市商汤科技开发有限公司 确定模型超参数及模型训练的方法和装置、存储介质
CN110110861B (zh) * 2019-05-09 2021-11-26 北京市商汤科技开发有限公司 确定模型超参数及模型训练的方法和装置、存储介质
CN113811893A (zh) * 2019-05-23 2021-12-17 谷歌有限责任公司 用于引导架构演进的连接权重学习
CN113811893B (zh) * 2019-05-23 2025-03-28 谷歌有限责任公司 用于引导架构演进的连接权重学习
WO2020237687A1 (zh) * 2019-05-31 2020-12-03 深圳市大疆创新科技有限公司 网络结构搜索的方法及装置、计算机存储介质和计算机程序产品
CN114341880A (zh) * 2019-07-08 2022-04-12 维亚奈系统公司 用于使神经网络的操作可视化的技术
CN110490320B (zh) * 2019-07-30 2022-08-23 西北工业大学 基于预测机制和遗传算法融合的深度神经网络结构优化方法
CN110490320A (zh) * 2019-07-30 2019-11-22 西北工业大学 基于预测机制和遗传算法融合的深度神经网络结构优化方法
CN114503121A (zh) * 2019-08-23 2022-05-13 谷歌有限责任公司 资源约束的神经网络架构搜索
CN110598629B (zh) * 2019-09-11 2023-06-06 北京百度网讯科技有限公司 超网络的搜索空间构建方法、装置以及电子设备
CN110598629A (zh) * 2019-09-11 2019-12-20 北京百度网讯科技有限公司 超网络的搜索空间构建方法、装置以及电子设备
US12032571B2 (en) 2019-09-17 2024-07-09 Huawei Cloud Computing Technologies Co., Ltd. AI model optimization method and apparatus
CN112836787A (zh) * 2019-11-04 2021-05-25 百度(美国)有限责任公司 通过高效混合并行化减少深度神经网络训练次数
WO2021103977A1 (zh) * 2019-11-30 2021-06-03 华为技术有限公司 神经网络的搜索方法、装置及设备
CN115066690A (zh) * 2020-02-07 2022-09-16 谷歌有限责任公司 搜索归一化-激活层架构
CN111516700A (zh) * 2020-05-11 2020-08-11 安徽大学 一种驾驶员分心细粒度监测方法和系统
CN115398446A (zh) * 2020-06-05 2022-11-25 谷歌有限责任公司 使用符号编程的机器学习算法搜索
CN116210263A (zh) * 2020-08-18 2023-06-02 高通股份有限公司 针对ue处基于神经网络的处理的报告配置
CN116324807A (zh) * 2020-10-02 2023-06-23 谷歌有限责任公司 神经架构和硬件加速器搜索
CN114417960A (zh) * 2020-12-04 2022-04-29 谷歌有限责任公司 用于时间序列预测的自动的机器学习
WO2025153048A1 (zh) * 2024-01-17 2025-07-24 中国移动通信有限公司研究院 对话生成模型的训练方法、对话生成方法及装置

Also Published As

Publication number Publication date
JP2021064390A (ja) 2021-04-22
DE202017106532U1 (de) 2018-02-05
KR102532658B1 (ko) 2023-05-15
JP2019533257A (ja) 2019-11-14
JP7516482B2 (ja) 2024-07-16
US11829874B2 (en) 2023-11-28
US20190251439A1 (en) 2019-08-15
KR20220047688A (ko) 2022-04-18
JP2023024993A (ja) 2023-02-21
US20230368024A1 (en) 2023-11-16
KR102386806B1 (ko) 2022-04-14
DE102017125256A1 (de) 2018-05-03
JP6817431B2 (ja) 2021-01-20
WO2018081563A9 (en) 2019-03-07
JP7210531B2 (ja) 2023-01-23
KR20190052143A (ko) 2019-05-15
WO2018081563A1 (en) 2018-05-03
US11030523B2 (en) 2021-06-08
US20210295163A1 (en) 2021-09-23

Similar Documents

Publication Publication Date Title
JP7516482B2 (ja) ニューラルアーキテクチャ検索
US12361305B2 (en) Neural architecture search for convolutional neural networks
US12346817B2 (en) Neural architecture search
US12400121B2 (en) Regularized neural network architecture search
CN110366734B (zh) 优化神经网络架构

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination