CN108415888A - 用于神经网络语言模型的压缩方法和系统 - Google Patents
用于神经网络语言模型的压缩方法和系统 Download PDFInfo
- Publication number
- CN108415888A CN108415888A CN201810145363.2A CN201810145363A CN108415888A CN 108415888 A CN108415888 A CN 108415888A CN 201810145363 A CN201810145363 A CN 201810145363A CN 108415888 A CN108415888 A CN 108415888A
- Authority
- CN
- China
- Prior art keywords
- language model
- term vector
- vector matrix
- neural network
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Abstract
Description
Claims (9)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810145363.2A CN108415888A (zh) | 2018-02-12 | 2018-02-12 | 用于神经网络语言模型的压缩方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810145363.2A CN108415888A (zh) | 2018-02-12 | 2018-02-12 | 用于神经网络语言模型的压缩方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108415888A true CN108415888A (zh) | 2018-08-17 |
Family
ID=63128487
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810145363.2A Pending CN108415888A (zh) | 2018-02-12 | 2018-02-12 | 用于神经网络语言模型的压缩方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108415888A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109978144A (zh) * | 2019-03-29 | 2019-07-05 | 联想(北京)有限公司 | 一种模型压缩方法和系统 |
CN110096697A (zh) * | 2019-03-15 | 2019-08-06 | 华为技术有限公司 | 词向量矩阵压缩方法和装置、及获取词向量的方法和装置 |
CN110347860A (zh) * | 2019-07-01 | 2019-10-18 | 南京航空航天大学 | 基于卷积神经网络的深度图像描述方法 |
CN111274816A (zh) * | 2020-01-15 | 2020-06-12 | 湖北亿咖通科技有限公司 | 一种基于神经网络的命名实体识别方法和车机 |
CN111352926A (zh) * | 2018-12-20 | 2020-06-30 | 北京沃东天骏信息技术有限公司 | 数据处理的方法、装置、设备及可读存储介质 |
CN111667069A (zh) * | 2020-06-10 | 2020-09-15 | 中国工商银行股份有限公司 | 预训练模型压缩方法、装置和电子设备 |
CN111814448A (zh) * | 2020-07-03 | 2020-10-23 | 苏州思必驰信息科技有限公司 | 预训练语言模型量化方法和装置 |
CN113037482A (zh) * | 2021-04-13 | 2021-06-25 | 山东新一代信息产业技术研究院有限公司 | 一种基于rnn的模型压缩加密方法 |
CN114118085A (zh) * | 2022-01-26 | 2022-03-01 | 云智慧(北京)科技有限公司 | 一种文本信息的处理方法、装置及设备 |
US11620435B2 (en) | 2019-10-10 | 2023-04-04 | International Business Machines Corporation | Domain specific model compression |
CN117033641A (zh) * | 2023-10-07 | 2023-11-10 | 江苏微皓智能科技有限公司 | 一种大型预训练语言模型的网络结构优化微调方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105184362A (zh) * | 2015-08-21 | 2015-12-23 | 中国科学院自动化研究所 | 基于参数量化的深度卷积神经网络的加速与压缩方法 |
CN105578183A (zh) * | 2015-12-16 | 2016-05-11 | 西安交通大学 | 一种基于高斯混合模型的压缩传感视频编解码方法 |
CN107004157A (zh) * | 2015-01-22 | 2017-08-01 | 高通股份有限公司 | 模型压缩和微调 |
-
2018
- 2018-02-12 CN CN201810145363.2A patent/CN108415888A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107004157A (zh) * | 2015-01-22 | 2017-08-01 | 高通股份有限公司 | 模型压缩和微调 |
CN105184362A (zh) * | 2015-08-21 | 2015-12-23 | 中国科学院自动化研究所 | 基于参数量化的深度卷积神经网络的加速与压缩方法 |
CN105578183A (zh) * | 2015-12-16 | 2016-05-11 | 西安交通大学 | 一种基于高斯混合模型的压缩传感视频编解码方法 |
Non-Patent Citations (1)
Title |
---|
百度NLP: ""神经网络模型压缩技术"", 《HTTPS://BAIJIAHAO.BAIDU.COM/S?ID=1571422806169703&WFR=SPIDER&FOR=PC》 * |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111352926A (zh) * | 2018-12-20 | 2020-06-30 | 北京沃东天骏信息技术有限公司 | 数据处理的方法、装置、设备及可读存储介质 |
CN111352926B (zh) * | 2018-12-20 | 2024-03-08 | 北京沃东天骏信息技术有限公司 | 数据处理的方法、装置、设备及可读存储介质 |
CN110096697A (zh) * | 2019-03-15 | 2019-08-06 | 华为技术有限公司 | 词向量矩阵压缩方法和装置、及获取词向量的方法和装置 |
CN110096697B (zh) * | 2019-03-15 | 2022-04-12 | 华为技术有限公司 | 词向量矩阵压缩方法和装置、及获取词向量的方法和装置 |
CN109978144B (zh) * | 2019-03-29 | 2021-04-13 | 联想(北京)有限公司 | 一种模型压缩方法和系统 |
CN109978144A (zh) * | 2019-03-29 | 2019-07-05 | 联想(北京)有限公司 | 一种模型压缩方法和系统 |
CN110347860B (zh) * | 2019-07-01 | 2021-07-09 | 南京航空航天大学 | 基于卷积神经网络的深度图像描述方法 |
CN110347860A (zh) * | 2019-07-01 | 2019-10-18 | 南京航空航天大学 | 基于卷积神经网络的深度图像描述方法 |
US11620435B2 (en) | 2019-10-10 | 2023-04-04 | International Business Machines Corporation | Domain specific model compression |
CN111274816A (zh) * | 2020-01-15 | 2020-06-12 | 湖北亿咖通科技有限公司 | 一种基于神经网络的命名实体识别方法和车机 |
CN111667069A (zh) * | 2020-06-10 | 2020-09-15 | 中国工商银行股份有限公司 | 预训练模型压缩方法、装置和电子设备 |
CN111667069B (zh) * | 2020-06-10 | 2023-08-04 | 中国工商银行股份有限公司 | 预训练模型压缩方法、装置和电子设备 |
CN111814448A (zh) * | 2020-07-03 | 2020-10-23 | 苏州思必驰信息科技有限公司 | 预训练语言模型量化方法和装置 |
CN111814448B (zh) * | 2020-07-03 | 2024-01-16 | 思必驰科技股份有限公司 | 预训练语言模型量化方法和装置 |
CN113037482A (zh) * | 2021-04-13 | 2021-06-25 | 山东新一代信息产业技术研究院有限公司 | 一种基于rnn的模型压缩加密方法 |
CN114118085B (zh) * | 2022-01-26 | 2022-04-19 | 云智慧(北京)科技有限公司 | 一种文本信息的处理方法、装置及设备 |
CN114118085A (zh) * | 2022-01-26 | 2022-03-01 | 云智慧(北京)科技有限公司 | 一种文本信息的处理方法、装置及设备 |
CN117033641A (zh) * | 2023-10-07 | 2023-11-10 | 江苏微皓智能科技有限公司 | 一种大型预训练语言模型的网络结构优化微调方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108415888A (zh) | 用于神经网络语言模型的压缩方法和系统 | |
Wang et al. | Wide compression: Tensor ring nets | |
Nakkiran et al. | Compressing deep neural networks using a rank-constrained topology | |
Wang et al. | Cnnpack: Packing convolutional neural networks in the frequency domain | |
Hrinchuk et al. | Tensorized embedding layers for efficient model compression | |
CN111712836A (zh) | 作为问答的多任务学习 | |
EP3794469A1 (en) | Multitask learning as question answering | |
CN110263913A (zh) | 一种深度神经网络压缩方法及相关设备 | |
Robert et al. | Hybridnet: Classification and reconstruction cooperation for semi-supervised learning | |
CN104951791B (zh) | 数据分类方法和装置 | |
US10515301B2 (en) | Small-footprint deep neural network | |
CN110298446B (zh) | 面向嵌入式系统的深度神经网络压缩和加速方法及系统 | |
CN109977250A (zh) | 融合语义信息和多级相似性的深度哈希图像检索方法 | |
CN110288029A (zh) | 基于Tri-LSTMs模型的图像描述方法 | |
CN109448706A (zh) | 神经网络语言模型压缩方法及系统 | |
Wei et al. | Compact MQDF classifiers using sparse coding for handwritten Chinese character recognition | |
CN113407663B (zh) | 基于人工智能的图文内容质量识别方法和装置 | |
Chen et al. | Distilled binary neural network for monaural speech separation | |
CN111767697B (zh) | 文本处理方法、装置、计算机设备以及存储介质 | |
CN110992943B (zh) | 基于词混淆网络的语义理解方法及系统 | |
Moriya et al. | Evolution-strategy-based automation of system development for high-performance speech recognition | |
Thakker et al. | Rank and run-time aware compression of NLP applications | |
KR20210058059A (ko) | 문장 임베딩 기반의 비지도 학습 문서 요약 방법 및 이를 이용한 문서 요약용 디바이스 | |
CN105260736A (zh) | 基于归一化非负稀疏编码器的图像快速特征表示方法 | |
Xie et al. | A residual network of water scene recognition based on optimized inception module and convolutional block attention module |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200624 Address after: 215123 14 Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou, Jiangsu. Applicant after: AI SPEECH Co.,Ltd. Applicant after: Shanghai Jiaotong University Intellectual Property Management Co.,Ltd. Address before: 215123 14 Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou, Jiangsu. Applicant before: AI SPEECH Co.,Ltd. Applicant before: SHANGHAI JIAO TONG University |
|
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20201027 Address after: 215123 14 Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou, Jiangsu. Applicant after: AI SPEECH Co.,Ltd. Address before: 215123 14 Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou, Jiangsu. Applicant before: AI SPEECH Co.,Ltd. Applicant before: Shanghai Jiaotong University Intellectual Property Management Co.,Ltd. |
|
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province Applicant after: Sipic Technology Co.,Ltd. Address before: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province Applicant before: AI SPEECH Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180817 |