KR20220096456A - 인공 신경망 모델을 경량화하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체 - Google Patents
인공 신경망 모델을 경량화하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체 Download PDFInfo
- Publication number
- KR20220096456A KR20220096456A KR1020200188895A KR20200188895A KR20220096456A KR 20220096456 A KR20220096456 A KR 20220096456A KR 1020200188895 A KR1020200188895 A KR 1020200188895A KR 20200188895 A KR20200188895 A KR 20200188895A KR 20220096456 A KR20220096456 A KR 20220096456A
- Authority
- KR
- South Korea
- Prior art keywords
- pruning
- neural network
- artificial neural
- unit
- network model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 108
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000013138 pruning Methods 0.000 claims abstract description 214
- 238000004590 computer program Methods 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 31
- 230000006870 function Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000013585 weight reducing agent Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Feedback Control In General (AREA)
Abstract
Description
도 2는 본 발명의 일 실시예에 따른 인공 신경망 모델 경량화 시스템의 내부 구성을 상세하게 도시하는 도면이다.
도 3 내지 도 4는 프루닝이 진행되는 과정을 예시적으로 나타내는 도면이다.
도 5는 본 발명의 일 실시예에 따른 인공 신경망 모델의 추론 과정을 예시적으로 나타내는 도면이다.
도 6은 ResNet의 구조를 나타내는 도면이다.
도 7 및 도 8은 복수의 컨볼루션 레이어 사이에서 가중치가 공유되는 과정을 예시적으로 나타내는 도면이다.
200: 인공 신경망 경량화 시스템
210: 프루닝 인자 학습부
220: 인공 신경망 모델 관리부
230: 통신부
240: 제어부
300: 디바이스
Claims (6)
- 인공 신경망 모델을 경량화하기 위한 방법으로서,
인공 신경망 모델에 포함되는 복수의 커널(Kernel) 각각에 대하여 채널 방향으로 적용되는 1 x 1 프루닝(Pruning) 단위의 채널 길이에 기초하여, 상기 프루닝 단위 각각에 관한 프루닝 인자 및 상기 프루닝 단위 각각에 관한 가중치를 학습하는 단계, 및
상기 학습되는 프루닝 인자 및 가중치 중 적어도 하나에 기초하여 상기 프루닝 단위 중에서 상기 인공 신경망 모델에서 제거될 프루닝 단위를 결정하는 단계를 포함하고,
상기 프루닝 단위의 채널 길이는 상기 복수의 커널 중 적어도 일부의 커널의 채널 길이보다 짧은
방법. - 제1항에 있어서,
상기 프루닝 단위의 채널 길이는 상기 인공 신경망 모델에 포함되는 복수의 컨볼루션 레이어(Convolution Layer)에 공통적으로 적용되는
방법. - 제2항에 있어서,
상기 복수의 컨볼루션 레이어에는 제1 컨볼루션 레이어 및 상기 제1 컨볼루션 레이어와 채널 길이가 다른 제2 컨볼루션 레이어가 포함되고,
상기 결정 단계에서, 상기 제1 컨볼루션 레이어 및 상기 제2 컨볼루션 레이어에서 상기 제거될 프루닝 단위가 공유되도록 하는
방법. - 제1항에 있어서,
상기 프루닝 단위의 채널 길이는 2의 멱수인
방법. - 제1항에 따른 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 비일시성의 컴퓨터 판독 가능 기록 매체.
- 인공 신경망 모델을 경량화하기 위한 시스템으로서,
복수의 커널(Kernel) 각각에 대하여 채널 방향으로 적용되는 1 x 1 프루닝(Pruning) 단위의 채널 길이에 기초하여, 상기 프루닝 단위 각각에 관한 프루닝 인자 및 상기 프루닝 단위 각각에 관한 가중치를 학습하는 프루닝 인자 학습부, 및
상기 학습되는 프루닝 인자 및 가중치 중 적어도 하나에 기초하여 상기 프루닝 단위 중에서 인공 신경망 모델에서 제거될 프루닝 단위를 결정하는 인공 신경망 모델 관리부를 포함하고,
상기 프루닝 단위의 채널 길이는 상기 복수의 커널 중 적어도 일부의 커널의 채널 길이보다 짧은
시스템.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200188895A KR102464508B1 (ko) | 2020-12-31 | 2020-12-31 | 인공 신경망 모델을 경량화하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체 |
PCT/KR2021/016656 WO2022145713A1 (ko) | 2020-12-31 | 2021-11-15 | 인공 신경망 모델을 경량화하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체 |
US18/270,416 US20240104375A1 (en) | 2020-12-31 | 2021-11-15 | Method and system for lightweighting artificial neural network model, and non-transitory computer-readable recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200188895A KR102464508B1 (ko) | 2020-12-31 | 2020-12-31 | 인공 신경망 모델을 경량화하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220096456A true KR20220096456A (ko) | 2022-07-07 |
KR102464508B1 KR102464508B1 (ko) | 2022-11-09 |
Family
ID=82260486
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200188895A Active KR102464508B1 (ko) | 2020-12-31 | 2020-12-31 | 인공 신경망 모델을 경량화하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20240104375A1 (ko) |
KR (1) | KR102464508B1 (ko) |
WO (1) | WO2022145713A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024135860A1 (ko) * | 2022-12-19 | 2024-06-27 | 한국전자기술연구원 | 경량 딥러닝 하드웨어 장치를 위한 데이터 프루닝 방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190062225A (ko) | 2017-11-28 | 2019-06-05 | 주식회사 날비컴퍼니 | 컨볼루션 신경망 내 필터 프루닝 장치 및 방법 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108701236B (zh) * | 2016-01-29 | 2022-01-21 | 快图有限公司 | 卷积神经网络 |
AU2018352201B2 (en) * | 2017-10-16 | 2021-12-09 | Illumina, Inc. | Deep convolutional neural networks for variant classification |
JP7349438B2 (ja) * | 2018-02-16 | 2023-09-22 | 三星電子株式会社 | ニューラル・ネットワーク・アクセラレータ |
US11449756B2 (en) * | 2018-09-24 | 2022-09-20 | Samsung Electronics Co., Ltd. | Method to balance sparsity for efficient inference of deep neural networks |
-
2020
- 2020-12-31 KR KR1020200188895A patent/KR102464508B1/ko active Active
-
2021
- 2021-11-15 WO PCT/KR2021/016656 patent/WO2022145713A1/ko active Application Filing
- 2021-11-15 US US18/270,416 patent/US20240104375A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190062225A (ko) | 2017-11-28 | 2019-06-05 | 주식회사 날비컴퍼니 | 컨볼루션 신경망 내 필터 프루닝 장치 및 방법 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024135860A1 (ko) * | 2022-12-19 | 2024-06-27 | 한국전자기술연구원 | 경량 딥러닝 하드웨어 장치를 위한 데이터 프루닝 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR102464508B1 (ko) | 2022-11-09 |
US20240104375A1 (en) | 2024-03-28 |
WO2022145713A1 (ko) | 2022-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115099399B (zh) | 神经网络模型部署方法、装置、电子设备及存储介质 | |
CN111738401A (zh) | 模型优化方法、分组压缩方法、相应的装置、设备 | |
US11928599B2 (en) | Method and device for model compression of neural network | |
KR20180073118A (ko) | 컨볼루션 신경망 처리 방법 및 장치 | |
KR20180050928A (ko) | 컨볼루션 신경망 처리 방법 및 장치 | |
CN118821876A (zh) | 用于提高卷积效率的方法、系统和装置 | |
US20230252294A1 (en) | Data processing method, apparatus, and device, and computer-readable storage medium | |
CN106909449B (zh) | 一种移动终端程序的计算迁移方法与装置 | |
CN107766292A (zh) | 一种神经网络处理方法及处理系统 | |
JP2019197445A (ja) | 画像認識装置、画像認識方法、およびプログラム | |
CN111406263A (zh) | 神经网络架构搜索的方法与装置 | |
KR102432809B1 (ko) | 자원 효율적 추론을 위한 인공 신경망 장치 | |
CN117196000A (zh) | 一种容器化部署的边缘侧模型推理加速方法 | |
KR102464508B1 (ko) | 인공 신경망 모델을 경량화하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체 | |
Yu et al. | Heterogeneous federated learning using dynamic model pruning and adaptive gradient | |
KR20230123309A (ko) | 프루닝 방법 및 장치 | |
CN119583270A (zh) | 一种基于卷积神经网络的调制格式识别方法及系统 | |
Zhang et al. | A locally distributed mobile computing framework for DNN based android applications | |
KR20220039313A (ko) | 뉴럴 네트워크 연산 처리 방법 및 장치 | |
KR20200024433A (ko) | 시간 가변적 예측(anytime prediction)을 위한 얇은 하위 네트워크를 활용하는 방법 및 시스템 | |
KR102760381B1 (ko) | 연사 영상 기반의 영상 복원 방법 및 장치 | |
CN110782017B (zh) | 用于自适应调整学习率的方法和装置 | |
CN115511693A (zh) | 一种神经网络模型处理方法和装置 | |
KR20230020856A (ko) | 신경망 파라미터의 양자화 방법 및 장치 | |
KR102424538B1 (ko) | 영상 복원 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20201231 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20220221 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20220810 |
|
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20221103 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20221103 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |