CN110070665B - 一种基于深度学习的保险票据分类方法 - Google Patents

一种基于深度学习的保险票据分类方法 Download PDF

Info

Publication number
CN110070665B
CN110070665B CN201910333742.9A CN201910333742A CN110070665B CN 110070665 B CN110070665 B CN 110070665B CN 201910333742 A CN201910333742 A CN 201910333742A CN 110070665 B CN110070665 B CN 110070665B
Authority
CN
China
Prior art keywords
insurance
bills
bill
data
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910333742.9A
Other languages
English (en)
Other versions
CN110070665A (zh
Inventor
李榕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Huachuangxinwang Science & Technology Co ltd
Original Assignee
Wuhan Huachuangxinwang Science & Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Huachuangxinwang Science & Technology Co ltd filed Critical Wuhan Huachuangxinwang Science & Technology Co ltd
Priority to CN201910333742.9A priority Critical patent/CN110070665B/zh
Publication of CN110070665A publication Critical patent/CN110070665A/zh
Application granted granted Critical
Publication of CN110070665B publication Critical patent/CN110070665B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07DHANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
    • G07D11/00Devices accepting coins; Devices accepting, dispensing, sorting or counting valuable papers
    • G07D11/50Sorting or counting valuable papers

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种基于深度学习的保险票据分类方法,包括如下步骤:初始化票据库,清空票据库内存储的保险票据,并建立多个子数据存储库,将OCR数据扫描装置与计算机相连,建立数据传递通道,将保险票据放入OCR数据扫描装置中,对保险票据进行扫描,在接到命令后,OCR数据扫描装置将存储器内的保险票据上传至计算机,计算机对上传票据进行标号处理,标号处理采用数字进行标号,对同种类别的保险票据进行重合比对,删掉相同的保险票据,对剩下的保险票据重新排序,生成新的序号,对每一种保险票据上的特征信息进行提取,将提取的特征信息标号,生成序号编码,存储到数据库内。

Description

一种基于深度学习的保险票据分类方法
技术领域
本发明涉及票据分类技术领域,尤其涉及一种基于深度学习的保险票据分类方法。
背景技术
保险单的主要内容包括双方对有关保险标的事项的说明,包括被保险人名称,保险标的名称及其存放地点或所处状态、保险金额、保险期限、保险费等,双方的权利和义务,如承担责任和不予承担的责任等。附注条件,指保险条款或双方约定的其他条件以及保单变更、转让和注销等事项。
在传统票据管理中,常依赖人工对票据进行分类,因为待分类的票据往往数目巨大,所以需要花费大量的人力物力去完成,因此票据自动分类系统应运而生,以机器视觉为技术背景解决这类简单重复的分类工作。现今的票据自动分类系统都需要首先采集较多各类票据图像作为训练样本,这种分类系统需要收集大量训练样本和花费大量精力人工设计票据特征才能保证训练得到的模型的分类性能,故存在一定的局限性。现有的票据分类方法中,在对票据分类后,难以从数据库内寻找。
发明内容
本发明提出了一种基于深度学习的保险票据分类方法,以解决上述背景技术中提出的问题。
本发明提出了一种基于深度学习的保险票据分类方法,包括如下步骤:
S1:初始化票据库,清空票据库内存储的保险票据,并建立多个子数据存储库,子数据存储库建立在票据库内,对每个子数据存储库进行功能标注,显示数据库内数据的内容,方便对存储的保险票据进行查找;
S2:将OCR数据扫描装置与计算机相连,建立数据传递通道,将保险票据放入OCR数据扫描装置中,对保险票据进行扫描,在接到命令后,OCR数据扫描装置将存储器内的保险票据上传至计算机,计算机对上传票据进行标号处理,标号处理采用数字进行标号,使得每张保险票据上存在唯一的标号,标号处理步骤为:
A、计算机将上传的保险票据移动至编辑模块内,对保险票据进行编辑;
B、再对上传的保险票据进行标记信息的创建;
C、根据保险票据上传的顺序依次自动生成数字标号;
S3:对计算机内的保险票据进行扫描分类,对保险票据进行整合,便于对保险票据进行处理;
S4:对同种类别的保险票据进行重合比对,删掉相同的保险票据,对剩下的保险票据重新排序,生成新的序号;
S5:对每一种保险票据上的特征信息进行提取,将提取的特征信息标号,生成序号编码,存储到数据库内,在学习时,可从数据库内调出,方便对保险票据的了解,特征信息编码与原始票据编码相对应,特征信息提取的过程为扫描系统对票据进行扫描,首先对保险票据的外形大小特征进行提取,获得票据的基础大小特征,然后对票据上的公章信息进行提取,获得公章所处的位置信息,最后对票据上填写的文字内容进行提取,得到票据的填写方式,保险票据的查找只需要在数据库内的检索框中输入保险票据的特征信息,根据输入的特征信息,即可快速的查找到所需要的保险票据信息,查找快捷简单。
优选的,所述S1中,子数据存储库放置在同一个大数据库内,子数据存储库独立依存,相互之间互不干扰,单个的子数据存储库可独立工作,子数据存储库根据所要放置的票据信息进行命名,对存储的数据信息进行概括,方便之后的学习中对保险票据的查找。
优选的,所述S2中,险票据上传的步骤为计算机通过导线与OCR数据扫描装置连接,在计算机上输入数据采集命令,数据采集命令通过电信号的形式传递给OCR数据扫描装置,OCR数据扫描装置将接收的电信号转化为数据信号,OCR数据扫描装置在接收到数据信号后,OCR数据扫描装置将内部存储的保险票据信息传输给计算机,完成保险票据的上传。
优选的,所述S3中,扫描分类步骤为将上传的保险票据导入计算机数据识别系统,识别模块通过对保险票据的名称进行识别,判定保险票据的种类,别系统根据保险票据名称,将保险票识别,将同种名称的保险票存储到同一数据库内,完成对保险票的分类。
优选的,所述S4中,重合比对的步骤为根据保险票据的标号,首先挑选序号靠前的数据与其余的保险票据进行对比,比对保险票据上的特征点,特征点相同的保险票据即为相同的保险票据,删除相同的保险票据,根据序号的排列循序,依次对保险票进行比对,直到所有的保险票据均比对完毕,剩余的保险票据重新排列,生成新的排列序号。
本发明提出的一种基于深度学习的保险票据分类方法,有益效果在于:
1、根据序号的排列循序,依次对保险票进行比对,直到所有的保险票据均比对完毕,剩余的保险票据重新排列,生成新的排列序号,确保无相同票据,票据按序号排列,便于查找。
2、通过建立多个子数据存储库,子数据存储库建立在票据库内,对每个子数据存储库进行功能标注,根据功能标注可进行快速查找。
具体实施方式
下面结合具体实施例来对本发明做进一步说明。
本发明提出了一种基于深度学习的保险票据分类方法,包括如下步骤:
S1:初始化票据库,清空票据库内存储的保险票据,并建立多个子数据存储库,子数据存储库建立在票据库内,对每个子数据存储库进行功能标注,显示数据库内数据的内容,方便对存储的保险票据进行查找,子数据存储库放置在同一个大数据库内,子数据存储库独立依存,相互之间互不干扰,单个的子数据存储库可独立工作,子数据存储库根据所要放置的票据信息进行命名,对存储的数据信息进行概括,方便之后的学习中对保险票据的查找;
S2:将OCR数据扫描装置与计算机相连,建立数据传递通道,将保险票据放入OCR数据扫描装置中,对保险票据进行扫描,在接到命令后,OCR数据扫描装置将存储器内的保险票据上传至计算机,计算机对上传票据进行标号处理,标号处理采用数字进行标号,使得每张保险票据上存在唯一的标号,险票据上传的步骤为计算机通过导线与OCR数据扫描装置连接,在计算机上输入数据采集命令,数据采集命令通过电信号的形式传递给OCR数据扫描装置,OCR数据扫描装置将接收的电信号转化为数据信号,OCR数据扫描装置在接收到数据信号后,OCR数据扫描装置将内部存储的保险票据信息传输给计算机,完成保险票据的上传,标号处理步骤为:
A、计算机将上传的保险票据移动至编辑模块内,对保险票据进行编辑;
B、再对上传的保险票据进行标记信息的创建;
C、根据保险票据上传的顺序依次自动生成数字标号;
S3:对计算机内的保险票据进行扫描分类,对保险票据进行整合,便于对保险票据进行处理,扫描分类步骤为将上传的保险票据导入计算机数据识别系统,识别模块通过对保险票据的名称进行识别,判定保险票据的种类,别系统根据保险票据名称,将保险票识别,将同种名称的保险票存储到同一数据库内,完成对保险票的分类;
S4:对同种类别的保险票据进行重合比对,删掉相同的保险票据,对剩下的保险票据重新排序,生成新的序号,重合比对的步骤为根据保险票据的标号,首先挑选序号靠前的数据与其余的保险票据进行对比,比对保险票据上的特征点,特征点相同的保险票据即为相同的保险票据,删除相同的保险票据,根据序号的排列循序,依次对保险票进行比对,直到所有的保险票据均比对完毕,剩余的保险票据重新排列,生成新的排列序号;
S5:对每一种保险票据上的特征信息进行提取,特征信息提取的过程为扫描系统对票据进行扫描,首先对保险票据的外形大小特征进行提取,获得票据的基础大小特征,然后对票据上的公章信息进行提取,获得公章所处的位置信息,最后对票据上填写的文字内容进行提取,得到票据的填写方式,将提取的特征信息标号,生成序号编码,存储到数据库内,在学习时,可从数据库内调出,方便对保险票据的了解,特征信息编码与原始票据编码相对应,保险票据的查找只需要在数据库内的检索框中输入保险票据的特征信息,根据输入的特征信息,即可快速的查找到所需要的保险票据信息,查找快捷简单。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (5)

1.一种基于深度学习的保险票据分类方法,其特征在于,包括以下步骤:
S1:初始化票据库,清空票据库内存储的保险票据,并建立多个子数据存储库,子数据存储库建立在票据库内,对每个子数据存储库进行功能标注,显示数据库内数据的内容,方便对存储的保险票据进行查找;
S2:将OCR数据扫描装置与计算机相连,建立数据传递通道,将保险票据放入OCR数据扫描装置中,对保险票据进行扫描,在接到命令后,OCR数据扫描装置将存储器内的保险票据上传至计算机,计算机对上传票据进行标号处理,标号处理采用数字进行标号,使得每张保险票据上存在唯一的标号,标号处理步骤为:
A、计算机将上传的保险票据移动至编辑模块内,对保险票据进行编辑;
B、再对上传的保险票据进行标记信息的创建;
C、根据保险票据上传的顺序依次自动生成数字标号;
S3:对计算机内的保险票据进行扫描分类,对保险票据进行整合,便于对保险票据进行处理;
S4:对同种类别的保险票据进行重合比对,删掉相同的保险票据,对剩下的保险票据重新排序,生成新的序号;
S5:对每一种保险票据上的特征信息进行提取,将提取的特征信息标号,生成序号编码,存储到数据库内,在学习时,可从数据库内调出,方便对保险票据的了解,特征信息编码与原始票据编码相对应,特征信息提取的过程为扫描系统对票据进行扫描,首先对保险票据的外形大小特征进行提取,获得票据的基础大小特征,然后对票据上的公章信息进行提取,获得公章所处的位置信息,最后对票据上填写的文字内容进行提取,得到票据的填写方式,保险票据的查找只需要在数据库内的检索框中输入保险票据的特征信息,根据输入的特征信息,即可快速的查找到所需要的保险票据信息,查找快捷简单。
2.根据权利要求1所述的一种基于深度学习的保险票据分类方法,其特征在于,所述S1中,子数据存储库放置在同一个大数据库内,子数据存储库独立依存,相互之间互不干扰,单个的子数据存储库可独立工作,子数据存储库根据所要放置的票据信息进行命名,对存储的数据信息进行概括,方便之后的学习中对保险票据的查找。
3.根据权利要求1所述的一种基于深度学习的保险票据分类方法,其特征在于,所述S2中,险票据上传的步骤为计算机通过导线与OCR数据扫描装置连接,在计算机上输入数据采集命令,数据采集命令通过电信号的形式传递给OCR数据扫描装置,OCR数据扫描装置将接收的电信号转化为数据信号,OCR数据扫描装置在接收到数据信号后,OCR数据扫描装置将内部存储的保险票据信息传输给计算机,完成保险票据的上传。
4.根据权利要求1所述的一种基于深度学习的保险票据分类方法,其特征在于,所述S3中,扫描分类步骤为将上传的保险票据导入计算机数据识别系统,识别模块通过对保险票据的名称进行识别,判定保险票据的种类,别系统根据保险票据名称,将保险票识别,将同种名称的保险票存储到同一数据库内,完成对保险票的分类。
5.根据权利要求1所述的一种基于深度学习的保险票据分类方法,其特征在于,所述S4中,重合比对的步骤为根据保险票据的标号,首先挑选序号靠前的数据与其余的保险票据进行对比,比对保险票据上的特征点,特征点相同的保险票据即为相同的保险票据,删除相同的保险票据,根据序号的排列循序,依次对保险票进行比对,直到所有的保险票据均比对完毕,剩余的保险票据重新排列,生成新的排列序号。
CN201910333742.9A 2019-04-24 2019-04-24 一种基于深度学习的保险票据分类方法 Active CN110070665B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910333742.9A CN110070665B (zh) 2019-04-24 2019-04-24 一种基于深度学习的保险票据分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910333742.9A CN110070665B (zh) 2019-04-24 2019-04-24 一种基于深度学习的保险票据分类方法

Publications (2)

Publication Number Publication Date
CN110070665A CN110070665A (zh) 2019-07-30
CN110070665B true CN110070665B (zh) 2021-05-28

Family

ID=67368607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910333742.9A Active CN110070665B (zh) 2019-04-24 2019-04-24 一种基于深度学习的保险票据分类方法

Country Status (1)

Country Link
CN (1) CN110070665B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110490267B (zh) * 2019-08-23 2022-03-01 四川长虹电器股份有限公司 一种基于深度学习的票据分拣方法
US11972489B1 (en) 2020-04-24 2024-04-30 State Farm Mutual Automobile Insurance Company Claims process assistance using models

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106022364A (zh) * 2016-05-13 2016-10-12 邓昌顺 一种新的票据分类方法
EP3174017A1 (en) * 2011-06-07 2017-05-31 Glory Ltd. Paper sheet handling machine and paper sheet handling method
CN107480681A (zh) * 2017-08-02 2017-12-15 四川长虹电器股份有限公司 基于深度学习的高并发票据识别系统与方法
CN107633239A (zh) * 2017-10-18 2018-01-26 江苏鸿信系统集成有限公司 基于深度学习和ocr的票据分类及票据字段提取方法
CN109308476A (zh) * 2018-09-06 2019-02-05 邬国锐 票据信息处理方法、系统及计算机可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3174017A1 (en) * 2011-06-07 2017-05-31 Glory Ltd. Paper sheet handling machine and paper sheet handling method
CN106022364A (zh) * 2016-05-13 2016-10-12 邓昌顺 一种新的票据分类方法
CN107480681A (zh) * 2017-08-02 2017-12-15 四川长虹电器股份有限公司 基于深度学习的高并发票据识别系统与方法
CN107633239A (zh) * 2017-10-18 2018-01-26 江苏鸿信系统集成有限公司 基于深度学习和ocr的票据分类及票据字段提取方法
CN109308476A (zh) * 2018-09-06 2019-02-05 邬国锐 票据信息处理方法、系统及计算机可读存储介质

Also Published As

Publication number Publication date
CN110070665A (zh) 2019-07-30

Similar Documents

Publication Publication Date Title
CN110070665B (zh) 一种基于深度学习的保险票据分类方法
CN107656960B (zh) 地铁遗失物品管理的自动匹配系统
CN110209828A (zh) 案件查询方法及案件查询装置、计算机设备和存储介质
WO2016186137A1 (ja) 会計支援システム
CN106874411A (zh) 一种表格的搜索方法及搜索平台
CN108304530A (zh) 知识库词条分类方法和装置、模型训练方法和装置
CN107291949A (zh) 信息搜索方法及装置
CN110610169A (zh) 图片标注方法和装置、存储介质及电子装置
CN116409575A (zh) 一种智能仓储货架进出库管控系统
CN117115569B (zh) 基于机器学习的物像自动识别分类方法及系统
CN116644031B (zh) 不同格式的煤矿水害数据统一标准化的方法及系统
CN117669510A (zh) 一种基于图片序列识别的法院材料电子目录编排方法
CN110414497A (zh) 对象电子化的方法、装置、服务器及存储介质
CN112256909A (zh) 一种图形商标检索方法、系统、设备及可读存储介质
CN115661834A (zh) 一种多功能数据检索系统及方法
CN112052652B (zh) 一种电子课件脚本自动生成方法及装置
CN113920343A (zh) 一种信息录入扫描装置
CN114997884A (zh) 一种基于茶饼图像和信息码的双重防伪认证系统
CN112016515A (zh) 一种档案柜空位检测方法及装置
CN114202767A (zh) 一种智能表格数据自动录入方法
CN117033308B (zh) 一种基于特定范围的多模态检索方法及装置
CN117171418B (zh) 一种多数据形态的实时的可联合的查询系统
CN112132063B (zh) 一种基于聚类量化实时匹配的食物识别方法
CN114356746B (zh) 文档信息维护方法
CN116052183A (zh) 一种基于ocr技术的患者数据识别与采集系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant