CN113505774B - 一种保单识别模型尺寸压缩方法 - Google Patents
一种保单识别模型尺寸压缩方法 Download PDFInfo
- Publication number
- CN113505774B CN113505774B CN202110795950.8A CN202110795950A CN113505774B CN 113505774 B CN113505774 B CN 113505774B CN 202110795950 A CN202110795950 A CN 202110795950A CN 113505774 B CN113505774 B CN 113505774B
- Authority
- CN
- China
- Prior art keywords
- layer
- policy
- network
- network layer
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000006835 compression Effects 0.000 title claims abstract description 18
- 238000007906 compression Methods 0.000 title claims abstract description 18
- 238000013528 artificial neural network Methods 0.000 claims abstract description 29
- 238000004364 calculation method Methods 0.000 claims abstract description 15
- 230000008569 process Effects 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 20
- 239000011159 matrix material Substances 0.000 claims description 12
- 230000000694 effects Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Accounting & Taxation (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供一种保单识别模型尺寸压缩方法,通过对20万份保单OCR识别结果分析,在保证精度不变的前提下,计算速度提升了187%。新型保单识别模型尺寸压缩方法QSlim主要包含两个部分,一是基于保单OCR神经网络的计算过程特性,将float型转化为int型,并在每一层尾部添加误差函数bias,极大降低了运算量。二是基于保单OCR神经网络结构特性,发明了网络结构拟合方法,找出结构类似的网络,使用拟合的方法消减结构相近的网格,极大减少了模型体积。
Description
技术领域
本发明涉及保险业保单识别(OCR)模型尺寸压缩技术领域,具体涉及一种新型保单识别模型尺寸压缩方法QSlim(QuanZhangGui Slim)。
背景技术
保单识别是指将纸质保单通过OCR技术转化为无结构纯文本的技术方案,供保险业的其他业务流程调用。随着我国经济的快速发展,国民收入水平的大幅提高,民众的保单持有量也在快速飙升,对保险业的数字化管理水平提出了更高的要求。截止到2020年,我国各类保单共计16.7亿张,人均1.19张。其中,数字化保单不足1.9亿张,绝大部分保单依旧是纸质保单,没有实现数字化,造成了客户在理赔、核保、预核保等诸多环节的不便。
目前保单识别的OCR技术是通过先进的神经网络模型,如使用神经网络Faster R-CNN对纸质保单做OCR处理,将模型结构和权重一并存储为h5文件,体积约270M,适合在服务器上运行。但是由于移动端的CPU性能限制,模型无法在移动端流畅运行,降低了客户的用户体验。
鉴于当前保单识别模型尺寸的问题,本发明基于保单OCR神经网络的计算过程特性和结构特性,提出了一种新型保单识别模型尺寸压缩方法QSlim,通过对20万份保单OCR识别结果分析,在保证精度不变的前提下,计算速度提升了187%。新型保单识别模型尺寸压缩方法QSlim主要包含两个部分,一是基于保单OCR神经网络的计算过程特性,将float型转化为int型,并在每一层尾部添加误差函数bias,极大降低了运算量。二是基于保单OCR神经网络结构特性,发明了网络结构拟合方法,极大减少了模型体积。
发明内容
本发明的目的是:针对背景技术描述的问题,本发明提出了一种新型保单识别模型尺寸压缩方法QSlim,在保证精度不变的前提下,计算速度提升了187%,体积减少26%。
为了解决上述问题,本发明所采用的技术方案是:
一种保单识别模型尺寸压缩方法,其特征在于,包括如下步骤:
(1)基于保单OCR神经网络的计算过程特性,将float型转化为int型,并在每一层尾部添加误差函数bias;具体为:
设某一层神经网络共计有个系数,第i个系数为ai,所有系数中的最大值为maxai;
将所有的系数组成一个矩阵T
δ的计算方式为
δ=r(T) (3)
其中,T是的矩阵,r是线性代数中求解矩阵的秩的意思,矩阵T中
(2)基于保单OCR神经网络结构特性,采用网络结构拟合方法,对每一层网络结构进行分析,找出结构类似的网络,使用拟合的方法消减结构相近的网格;如果存在两个网络层A和网络层B,其结构相似,则删除网络层B,并在网络层A的输出结构的基础上添加拟合函数f(A),具体为:
设某一层神经网络层A共计有个系数,第i个系数为ai,另一个网格层B同样拥有个系数,则B与A计算相似度;
将神经网络层A的系数由小到大排列:
将神经网络层B的系数由小到大排列:
则B与A计算相似度ω:
如果ω≥ln2,则删除B,并在网络层A的输出结构的基础上添加拟合函数f(A),否则认为网络层A和网络层B是独立的,无法拟合;
f(A)=eω (8)
其中e为自然常数;
所述保单OCR神经网络的输入数据为纸质保单。
进一步的,所述方法整体流程如下:
Step1:展开网络模型的所有网络层,并记录总层数N;
Step2:i=0;
Step3:i<N,为真转Step4,为否转Step16;
Step4:针对网络层i,根据公式(2)和公式(4)将所有的系数组成一个矩阵T;
Step5:根据公式(3)计算δ;
Step6:根据公式(1)计算bias函数,并将本层的所有float转化为int,添加bias;
Step7:j=i;
Step8:j<N+1,为真转Step9,为否转Step14;
Step9:根据公式(5)到公式(7)计算网络层i和网络层j的相似度ω;
Step10:ω≥ln2,为真转Step11,为否转Step14;
Step11:根据公式(8)计算f(A);
Step12:删除网络层j,并把f(A)添加到网络层i;
Step13:N=N-1;
Step14:i=i+1;
Step15:转Step3;
Step16:结束。
本发明实施例提供的上述技术方案的有益效果至少包括:鉴于当前保单识别模型尺寸的问题,本发明基于保单OCR神经网络的计算过程特性和结构特性,提出了一种新型保单识别模型尺寸压缩方法QSlim,通过对20万份保单OCR识别结果分析,在保证精度不变的前提下,计算速度提升了187%,模型体积减少26%。新型保单识别模型尺寸压缩方法QSlim主要包含两个部分,一是基于保单OCR神经网络的计算过程特性,将float型转化为int型,并在每一层尾部添加误差函数bias,极大降低了运算量。二是基于保单OCR神经网络结构特性,发明了网络结构拟合方法,找出结构类似的网络,使用拟合的方法消减结构相近的网格,极大减少了模型体积。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例公开的保单识别模型尺寸压缩方法的流程图。
具体实施例
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明提出了一种新型保单识别模型尺寸压缩方法QSlim,在保证精度不变的前提下,计算速度提升了187%,体积减少26%。
本发明的第一个核心创新点是基于保单OCR神经网络的计算过程特性,将float型转化为int型,并在每一层尾部添加误差函数bias,降低了运算量。
将float型转化为int型是当前通用的模型尺寸压缩方法,但是降低模型体积的同时也伴随着精度的损失,换言之,当前通用的将float型转化为int型的模型尺寸压缩方法是用精度换取速度。本发明在每一层尾部添加bias函数,在获取了较好的模型压缩效果的同时,并没有牺牲精度。
设某一层神经网络共计有个系数,第i个系数为ai,所有系数中的最大值为maxai。
将所有的系数组成一个矩阵T
δ的计算方式为
δ=r(T) (11)
其中,T是的矩阵,r是线性代数中求解矩阵的秩的意思。矩阵T中
公式(1)为经验公式,是对20万份保单OCR结果分析总结而来。假设模型为压缩之前的精度为100,将float型转化为int型后的精度为精度A,将float型转化为int型并且添加bias函数的精度为精度B,效果如下:
表中,“其他”表示不在众安、平安、中国人寿、长城、信泰、阳光、泰康、中英、中国人保、新华、光大永明、华夏、太平洋中的保险公司,因数量较少,故而归为一类。可见,单纯将将float型转化为int型,精度平均值从100降低为62.21,下降了37.79%,最大下降87%。加入bias函数之后,平均精度几乎无任何变化(平均值从100降低为99.36),反而最大上升了21%。对比精度A和精度B,可见bias函数将平均精度由62.21提升到99.36,提升了59.72%。
本发明的第二个核心创新点是基于保单OCR神经网络结构特性,发明了网络结构拟合方法,极大减少了模型体积。
因为OCR的网格结构直接决定了模型的体积,减少网格层数是降低模型体积、内存消耗最直接、有效的方法。但是网格结构同时直接决定了计算的精度,以通用缩减模型结构的方法SqueezeNet为例,SqueezeNet在缩减模型结构的同时,也伴随着精度的损失,换言之,SqueezeNet也是用精度换取速度。
本发明对每一层网络结构进行分析,找出结构类似的网络,使用拟合的方法消减结构相近的网格。比如存在两个网络层A和网络层B,其结构相似,则可以删除网络层B,并在网络层A的输出结构的基础上添加拟合函数f(A)。具体拟合方式如下:
设某一层神经网络层A共计有个系数,第i个系数为ai。另一个网格层B同样拥有个系数,则B可以与A计算相似度
将神经网络层A的系数由小到大排列
将神经网络层B的系数由小到大排列
则B可以与A计算相似度ω
如果ω≥ln2,则可以删除B,并在网络层A的输出结构的基础上添加拟合函数f(A),否则认为网络层A和网络层B是独立的,无法拟合。
f(A)=eω (16)
公式(8)为经验公式,是对20万份保单OCR结果分析总结而来,其中e为自然常数。假设模型为压缩之前的精度为100,SqueezeNet的精度为精度C,本方法拟合精度为精度D,效果如下:
表中,“其他”表示不在众安、平安、中国人寿、长城、信泰、阳光、泰康、中英、中国人保、新华、光大永明、华夏、太平洋中的保险公司,因数量较少,故而归为一类。可见,使用SqueezeNet方法,精度平均值从100降低为83.46,下降了16.54%,最大下降45.20%。使用本方法,平均精度反而上升(平均值从100降低为101.77),反而最大上升了25.96%。对比精度C和精度D,可见本方法将平均精度从83.46提升到101.77,提升了21.94%。
从中国保协中随机抽取5000份保单,分别使用原始模型和本方法压缩后的模型,本方法模型在保证精度不变的前提下,计算速度提升了187%,模型体积减少26%。
以下具体实施例中以众安2020年某团险保单为例。
Step1:展开网络模型的所有网络层,并记录总层数N;
Step2:i=0;
Step3:i<N,为真转Step4,为否转Step16;
Step4:针对网络层i,根据公式(2)和公式(4)将所有的系数组成一个矩阵T;
Step5:根据公式(3)计算δ;
Step6:根据公式(1)计算bias函数,并将本层的所有float转化为int,添加bias;
Step7:j=i;
Step8:j<N+1,为真转Step9,为否转Step14;
Step9:根据公式(5)到公式(7)计算网络层i和网络层j的相似度ω;
Step10:ω≥ln2,为真转Step11,为否转Step14;
Step11:根据公式(8)计算f(A);
Step12:删除网络层j,并把f(A)添加到网络层i;
Step13:N=N-1;
Step14:i=i+1;
Step15:转Step3;
Step16:结束。
应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。
在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。
本领域技术人员还应当理解,结合本文的实施例描述的各种说明性的逻辑框、模块、电路和算法步骤均可以实现成电子硬件、计算机软件或其组合。为了清楚地说明硬件和软件之间的可交换性,上面对各种说明性的部件、框、模块、电路和步骤均围绕其功能进行了一般地描述。至于这种功能是实现成硬件还是实现成软件,取决于特定的应用和对整个系统所施加的设计约束条件。熟练的技术人员可以针对每个特定应用,以变通的方式实现所描述的功能,但是,这种实现决策不应解释为背离本公开的保护范围。
结合本文的实施例所描述的方法或者算法的步骤可直接体现为硬件、由处理器执行的软件模块或其组合。软件模块可以位于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动磁盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质连接至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。该ASIC可以位于用户终端中。当然,处理器和存储介质也可以作为分立组件存在于用户终端中。
对于软件实现,本申请中描述的技术可用执行本申请所述功能的模块(例如,过程、函数等)来实现。这些软件代码可以存储在存储器单元并由处理器执行。存储器单元可以实现在处理器内,也可以实现在处理器外,在后一种情况下,它经由各种手段以通信方式耦合到处理器,这些都是本领域中所公知的。
上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。
Claims (2)
1.一种保单识别模型尺寸压缩方法,其特征在于,包括如下步骤:
(1)基于保单OCR神经网络的计算过程特性,将float型转化为int型,并在每一层尾部添加误差函数bias;具体为:
设某一层神经网络共计有个系数,第i个系数为ai,所有系数中的最大值为maxai;
将所有的系数组成一个矩阵T
δ的计算方式为
δ=r(T) (3)
其中,T是的矩阵,r是线性代数中求解矩阵的秩的意思,矩阵T中
(2)基于保单OCR神经网络结构特性,采用网络结构拟合方法,对每一层网络结构进行分析,找出结构类似的网络,使用拟合的方法消减结构相近的网格;如果存在两个网络层A和网络层B,其结构相似,则删除网络层B,并在网络层A的输出结构的基础上添加拟合函数f(A),具体为:
设某一层神经网络层A共计有个系数,第i个系数为ai,另一个网格层B同样拥有/>个系数,则B与A计算相似度;
将神经网络层A的系数由小到大排列:
将神经网络层B的系数由小到大排列:
则B与A计算相似度ω:
如果ω≥ln2,则删除B,并在网络层A的输出结构的基础上添加拟合函数f(A),否则认为网络层A和网络层B是独立的,无法拟合;
f(A)=eω (8)
其中e为自然常数;
所述保单OCR神经网络的输入数据为纸质保单。
2.如权利要求1所述的一种保单识别模型尺寸压缩方法,其特征在于,所述方法整体流程如下:
Step1:展开网络模型的所有网络层,并记录总层数N;
Step2:i=0;
Step3:i<N,为真转Step4,为否转Step16;
Step4:针对网络层i,根据公式(2)和公式(4)将所有的系数组成一个矩阵T;
Step5:根据公式(3)计算δ;
Step6:根据公式(1)计算bias函数,并将本层的所有float转化为int,添加bias;
Step7:j=i;
Step8:j<N+1,为真转Step9,为否转Step14;
Step9:根据公式(5)到公式(7)计算网络层i和网络层j的相似度ω;
Step10:ω≥ln2,为真转Step11,为否转Step14;
Step11:根据公式(8)计算f(A);
Step12:删除网络层j,并把f(A)添加到网络层i;
Step13:N=N-1;
Step14:i=i+1;
Step15:转Step3;
Step16:结束。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110795950.8A CN113505774B (zh) | 2021-07-14 | 2021-07-14 | 一种保单识别模型尺寸压缩方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110795950.8A CN113505774B (zh) | 2021-07-14 | 2021-07-14 | 一种保单识别模型尺寸压缩方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113505774A CN113505774A (zh) | 2021-10-15 |
CN113505774B true CN113505774B (zh) | 2023-11-10 |
Family
ID=78013165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110795950.8A Active CN113505774B (zh) | 2021-07-14 | 2021-07-14 | 一种保单识别模型尺寸压缩方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113505774B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101795138A (zh) * | 2010-01-19 | 2010-08-04 | 北京四方继保自动化股份有限公司 | 电力系统广域测量系统高密度时间序列数据的压缩处理方法 |
CN102867316A (zh) * | 2012-07-19 | 2013-01-09 | 中国人民解放军第二炮兵工程大学 | 一种热波动态图像序列拟合重构方法 |
CN106570559A (zh) * | 2015-10-09 | 2017-04-19 | 阿里巴巴集团控股有限公司 | 一种基于神经网络的数据处理方法和装置 |
CN108510083A (zh) * | 2018-03-29 | 2018-09-07 | 国信优易数据有限公司 | 一种神经网络模型压缩方法以及装置 |
CN108764458A (zh) * | 2018-05-15 | 2018-11-06 | 武汉环宇智行科技有限公司 | 一种非均匀量化的模型压缩方法及系统 |
CN109784474A (zh) * | 2018-12-24 | 2019-05-21 | 宜通世纪物联网研究院(广州)有限公司 | 一种深度学习模型压缩方法、装置、存储介质及终端设备 |
CN110909733A (zh) * | 2019-10-28 | 2020-03-24 | 世纪保众(北京)网络科技有限公司 | 基于ocr图片识别的模版定位方法、装置和计算机设备 |
CN111340901A (zh) * | 2020-02-19 | 2020-06-26 | 国网浙江省电力有限公司 | 基于生成式对抗网络的复杂环境下输电网图片的压缩方法 |
CN112257858A (zh) * | 2020-09-21 | 2021-01-22 | 华为技术有限公司 | 一种模型压缩方法及装置 |
CN112287968A (zh) * | 2020-09-23 | 2021-01-29 | 深圳云天励飞技术股份有限公司 | 图像模型训练、图像处理方法、芯片、设备及介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004098066A1 (ja) * | 2003-04-28 | 2004-11-11 | Nippon Telegraph And Telephone Corporation | 浮動小数点形式ディジタル信号可逆符号化方法、及び復号化方法と、その各装置、その各プログラム |
US10659805B2 (en) * | 2015-01-29 | 2020-05-19 | Ecole De Technologie Superieure | Method and apparatus for video intermodal transcoding |
US11676003B2 (en) * | 2018-12-18 | 2023-06-13 | Microsoft Technology Licensing, Llc | Training neural network accelerators using mixed precision data formats |
CN114372565B (zh) * | 2022-01-13 | 2024-10-15 | 华中科技大学 | 一种用于边缘设备的目标检测网络压缩方法 |
-
2021
- 2021-07-14 CN CN202110795950.8A patent/CN113505774B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101795138A (zh) * | 2010-01-19 | 2010-08-04 | 北京四方继保自动化股份有限公司 | 电力系统广域测量系统高密度时间序列数据的压缩处理方法 |
CN102867316A (zh) * | 2012-07-19 | 2013-01-09 | 中国人民解放军第二炮兵工程大学 | 一种热波动态图像序列拟合重构方法 |
CN106570559A (zh) * | 2015-10-09 | 2017-04-19 | 阿里巴巴集团控股有限公司 | 一种基于神经网络的数据处理方法和装置 |
CN108510083A (zh) * | 2018-03-29 | 2018-09-07 | 国信优易数据有限公司 | 一种神经网络模型压缩方法以及装置 |
CN108764458A (zh) * | 2018-05-15 | 2018-11-06 | 武汉环宇智行科技有限公司 | 一种非均匀量化的模型压缩方法及系统 |
CN109784474A (zh) * | 2018-12-24 | 2019-05-21 | 宜通世纪物联网研究院(广州)有限公司 | 一种深度学习模型压缩方法、装置、存储介质及终端设备 |
CN110909733A (zh) * | 2019-10-28 | 2020-03-24 | 世纪保众(北京)网络科技有限公司 | 基于ocr图片识别的模版定位方法、装置和计算机设备 |
CN111340901A (zh) * | 2020-02-19 | 2020-06-26 | 国网浙江省电力有限公司 | 基于生成式对抗网络的复杂环境下输电网图片的压缩方法 |
CN112257858A (zh) * | 2020-09-21 | 2021-01-22 | 华为技术有限公司 | 一种模型压缩方法及装置 |
CN112287968A (zh) * | 2020-09-23 | 2021-01-29 | 深圳云天励飞技术股份有限公司 | 图像模型训练、图像处理方法、芯片、设备及介质 |
Non-Patent Citations (5)
Title |
---|
On proportionate-type NLMS algorithms for fast decay of output error at all times;Kevin T. W等;《2009 Conference Record of the Forty-Third Asilomar Conference on Signals, Systems and Computers》;第1-4页 * |
WebGIS矢量空间数据压缩方法探讨;李青元, 刘晓东, 曹代勇;中国图象图形学报(第12期);第81-85页 * |
基于数据类型转换的点云快速有损压缩算法;律帅;达飞鹏;黄源;;图学学报(第02期);第59-65页 * |
数字图像相关技术的一些进展;苏勇;张青川;伍小平;;中国科学:物理学 力学 天文学(第09期);第29-53页 * |
深度神经网络的加速与压缩及评价方法研究;陈阵;《中国优秀硕士学位论文全文数据库 信息科技辑》(第8期);I140-36 * |
Also Published As
Publication number | Publication date |
---|---|
CN113505774A (zh) | 2021-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8892542B2 (en) | Contextual weighting and efficient re-ranking for vocabulary tree based image retrieval | |
US7925602B2 (en) | Maximum entropy model classfier that uses gaussian mean values | |
WO2023279964A1 (zh) | 数据压缩方法、装置、计算设备及存储系统 | |
CN109711412A (zh) | 一种基于字典的光学字符识别纠错方法 | |
Van Opdenbosch et al. | Camera-based indoor positioning using scalable streaming of compressed binary image signatures | |
CN104199923B (zh) | 基于最优k均值哈希算法的大规模图像库检索方法 | |
CN110297879B (zh) | 一种基于大数据的数据去重的方法、装置及存储介质 | |
Duan et al. | Weighted component hashing of binary aggregated descriptors for fast visual search | |
CN114281989B (zh) | 基于文本相似度的数据去重方法、装置及存储介质和服务器 | |
WO2023065697A1 (zh) | 一种乘积量化搜索方法、装置、终端和存储介质 | |
Zhang et al. | Autoencoder-based unsupervised clustering and hashing | |
WO2021143016A1 (zh) | 近似数据处理方法、装置、介质及电子设备 | |
CN113505774B (zh) | 一种保单识别模型尺寸压缩方法 | |
CN112347246A (zh) | 一种基于谱分解的自适应文档聚类方法及系统 | |
CN107527058B (zh) | 一种基于加权局部特征聚合描述符的图像检索方法 | |
CN112085154A (zh) | 用于神经网络的压缩和推断加速的非对称量化 | |
CN110598122B (zh) | 社交群体挖掘方法、装置、设备及存储介质 | |
CN114255381A (zh) | 图像识别模型的训练方法、图像识别方法、装置及介质 | |
CN116701411B (zh) | 一种多领域数据归档方法、装置、介质及设备 | |
CN109344259B (zh) | 一种基于多层划分框架的rdf分布式存储方法 | |
WO2017157038A1 (zh) | 数据处理的方法、装置和设备 | |
Wu et al. | A feature-based intelligent deduplication compression system with extreme resemblance detection | |
CN113656453A (zh) | 一种服务供需双边模式关联矩阵构造与更新方法 | |
Chu et al. | Remote sensing image retrieval by multi-scale attention-based CNN and product quantization | |
CN112380852A (zh) | 一种舆情数据处理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: No.187 Jinshui Road, Licang District, Qingdao City, Shandong Province 266000 Applicant after: Qingdao Quanzhanggui Technology Co.,Ltd. Address before: No.187 Jinshui Road, Licang District, Qingdao City, Shandong Province 266000 Applicant before: Qingdao quanshopkeeper Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |