CN112464957A - 基于非结构化投标文件内容的结构化数据获取方法及装置 - Google Patents

基于非结构化投标文件内容的结构化数据获取方法及装置 Download PDF

Info

Publication number
CN112464957A
CN112464957A CN202011453567.6A CN202011453567A CN112464957A CN 112464957 A CN112464957 A CN 112464957A CN 202011453567 A CN202011453567 A CN 202011453567A CN 112464957 A CN112464957 A CN 112464957A
Authority
CN
China
Prior art keywords
image
reward
information
bid
unstructured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011453567.6A
Other languages
English (en)
Inventor
杨灿魁
谢化安
谢志武
李�根
陈剑光
李志�
佟忠正
雷璟
王栋
肖琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Co Ltd
Priority to CN202011453567.6A priority Critical patent/CN112464957A/zh
Publication of CN112464957A publication Critical patent/CN112464957A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及招标采购管理技术领域,提供一种基于非结构化投标文件内容的结构化数据获取方法及装置,用于解决非结构化数据的转化问题。本发明提供的基于非结构化投标文件内容的结构化数据获取方法,包括:获取投标文件的图像;将所述图像分割为多个子图像;采用神经网络模型对多个所述子图像进行特征提取,并对提取的特征进行分析以得到目标信息,所述目标信息包括财务信息、资质信息和业绩信息。提高了非结构化数据向结构化数据转化的效率。

Description

基于非结构化投标文件内容的结构化数据获取方法及装置
技术领域
本发明涉及招标采购管理技术领域,具体涉及基于非结构化投标文件内容的结构化数据获取方法。
背景技术
按照广电企【2019】8号文《关于印发公司深化招标管理改革任务分解表的通知》整体要求,通过利用供应商数据重构等技术实现客观分智能计算、投标文件自动定位、智能辅助验真,减轻专家评标时客观分评审工作量、减少专家机械工作内容、对投标文件所提供资料进行验真。
投标文件收集后,目前大多是以非结构化的数据形式存储的,例如以扫描图片的形式进行电子化存储。非结构化的数据难以有效利用。
发明内容
本发明解决的技术问题为非结构化数据的转化问题,提供基于非结构化投标文件内容的结构化数据获取方法。
为了解决上述技术问题,本发明提供的技术方案为:
基于非结构化投标文件内容的结构化数据获取方法,包括:
获取投标文件的图像;
将所述图像分割为多个子图像;
采用神经网络模型对多个所述子图像进行特征提取,并对提取的特征进行分析以得到目标信息,所述目标信息包括财务信息、资质信息和业绩信息。
从非结构化的投标文件图像上抽取出结构化的目标信息,利用神经网络可以从不同格式的投标文件中快速准确的抽取出目标信息。
提高了非结构化数据向结构化数据转化的效率。
优选地,所述神经网络模型包括深度卷积神经网络,所述深度卷积网络用于进行特征提取,采用人工标注的投标文件图像数据集为训练集,对训练集中图像进行切割,得到只有背景的负样本图像和含有文本的正样本图像,深度卷积网络模型的训练方法包括:
对图像进行再切割,得到包含文本的正样本图像和只含背景的负样本图像。利用人工标注后的投标文件图像数据训练神经网络,可以得到分类准确,有效提取特征的神经网络。
优选地,所述神经网络模型包括决策网络,所述决策网络对提取的特征进行分析以得到目标信息,所述决策网络的训练方法包括:
构建决策网络的强化学习环境;所述强化学习环境包括状态空间、动作空间和奖励函数;所述状态空间中包含图像被当前选定的区域和最终被选定的区域具有的信息;所述动作空间中动作包括选择图像中另一个区域替换当前被选定的区域;所述奖励函数包括最终奖励和中间奖励,所述中间奖励是如果命中则加1,最终奖励为最终的命中率;
选择图像上某一区域,采集数据,训练决策网络。决策网络可以从上一神经网络的输出中提取出具有目标信息的图片,在从相应图片中提取出目标信息。
优选地,所述训练决策网络的过程中,记录{状态,动作,下一状态,奖励}元组。
优选地,获取投标文本图像时,获取投标文本的格式、标题。投标文本的格式、标题作为神经网络的输入也有助于提供数据抽取效率。
基于非结构化投标文件内容的结构化数据获取装置,包括:
原图像获取模块,所述原图像获取模块获取投标文件的图像;
子图像获取模块,所述子图像获取模块将所述图像分割为多个子图像;
处理模块,所述处理模块采用神经网络模型对多个所述子图像进行特征提取,并对提取的特征进行分析以得到目标信息,所述目标信息包括财务信息、资质信息和业绩信息。
优选地,所述处理模块包括第一处理模块,所述第一处理模块采用深度卷积神经网络进行特征提取,采用人工标注的投标文件图像数据集为训练集,对训练集中图像进行切割,得到只有背景的负样本图像和含有文本的正样本图像,深度卷积网络模型的训练方法包括:
对图像进行再切割,得到包含文本的正样本图像和只含背景的负样本图像。
优选地,所述处理模块包括第二处理模块,所述第二处理模块采用决策网络对提取的特征进行分析以得到目标信息,所述决策网络的学习方法为:
构建决策网络的强化学习环境;所述强化学习环境包括状态空间、动作空间和奖励函数;所述状态空间中包含图像被当前选定的区域和最终被选定的区域具有的信息;所述动作空间中动作包括选择图像中另一个区域替换当前被选定的区域;所述奖励函数包括最终奖励和中间奖励,所述中间奖励是如果命中则加1,最终奖励为最终的命中率;
所述第二处理模块选择图像上某一区域,采集数据,训练决策网络。
优选地,所述第二处理模块包括记录模块,所述记录模块在所述训练决策网络的过程中,记录{状态,动作,下一状态,奖励}元组。
优选地,还包括图像信息获取模块,所述图像信息获取模块获取投标文本图像时,获取投标文本的格式、标题。
与现有技术相比,本发明具有的有益效果为:提高了非结构化数据向结构化数据转化的效率。
专家评标通常重点关注供应商的某些指标,例如财务、资质和业绩。这些信息在不同的招标文件中位置不同,专家寻找这些数据浪费了较多的时间,影响了评标效率。尤其是相同版本的招标文件,由于填写字体、文字数量的不同,导致直接OCR后抽取目标信息的效率也不高。利用神经网络进行抽取可以显著提高抽取效率,进而提高评标效率,加快招标采购进程。
附图说明
图1为基于非结构化投标文件内容的结构化数据获取方法的示意图。
图2为基于非结构化投标文件内容的结构化数据获取装置的示意图。
具体实施方式
以下实施例是对本发明的进一步说明,不是对本发明的限制。
基于非结构化投标文件内容的结构化数据获取方法,在本申请的一些实施例中,包括:
S100.获取投标文件的图像;
S200.将所述图像分割为多个子图像;
S300.采用神经网络模型对多个所述子图像进行特征提取,并对提取的特征进行分析以得到目标信息,所述目标信息包括财务信息、资质信息和业绩信息。
从非结构化的投标文件图像上抽取出结构化的目标信息,利用神经网络可以从不同格式的投标文件中快速准确的抽取出目标信息。
提高了非结构化数据向结构化数据转化的效率。
专家评标通常重点关注供应商的某些指标,例如财务、资质和业绩。这些信息在不同的招标文件中位置不同,专家寻找这些数据浪费了较多的时间,影响了评标效率。尤其是相同版本的招标文件,由于填写字体、文字数量的不同,导致直接OCR后抽取目标信息的效率也不高。
发明人在尝试了多种方式后,发现采用神经网络来进行结构化数据的抽取可以大幅提高抽取效率,进而提高了专家评标的效率,显著提高了招标采购的效率。
在本申请的一些实施例中,所述神经网络模型包括深度卷积神经网络,所述深度卷积网络用于进行特征提取,采用人工标注的投标文件图像数据集为训练集,对训练集中图像进行切割,得到只有背景的负样本图像和含有文本的正样本图像,深度卷积网络模型的训练方法包括:
对图像进行再切割,得到包含文本的正样本图像和只含背景的负样本图像。
利用人工标注后的投标文件图像数据训练神经网络,可以得到分类准确,有效提取特征的神经网络。
在本申请的一些实施例中,所述神经网络模型包括决策网络,所述决策网络对提取的特征进行分析以得到目标信息,所述决策网络的训练方法包括:
构建决策网络的强化学习环境;所述强化学习环境包括状态空间、动作空间和奖励函数;所述状态空间中包含图像被当前选定的区域和最终被选定的区域具有的信息;所述动作空间中动作包括选择图像中另一个区域替换当前被选定的区域;所述奖励函数包括最终奖励和中间奖励,所述中间奖励是如果命中则加1,最终奖励为最终的命中率;
选择图像上某一区域,采集数据,训练决策网络。
决策网络可以从上一神经网络的输出中提取出具有目标信息的图片,在从相应图片中提取出目标信息。
在本申请的一些实施例中,所述训练决策网络的过程中,记录{状态,动作,下一状态,奖励}元组。
在本申请的一些实施例中,获取投标文本图像时,获取投标文本的格式、标题。
投标文本的格式、标题作为神经网络的输入也有助于提供数据抽取效率。
基于非结构化投标文件内容的结构化数据获取装置,在本申请的一些实施例中,包括:
原图像获取模块100,所述原图像获取模块100获取投标文件的图像;
子图像获取模块200,所述子图像获取模块200将所述图像分割为多个子图像;
处理模块300,所述处理模块300采用神经网络模型对多个所述子图像进行特征提取,并对提取的特征进行分析以得到目标信息,所述目标信息包括财务信息、资质信息和业绩信息。
在本申请的一些实施例中,所述处理模块包括第一处理模块,所述第一处理模块采用深度卷积神经网络进行特征提取,采用人工标注的投标文件图像数据集为训练集,对训练集中图像进行切割,得到只有背景的负样本图像和含有文本的正样本图像,深度卷积网络模型的训练方法包括:
对图像进行再切割,得到包含文本的正样本图像和只含背景的负样本图像。
在本申请的一些实施例中,所述处理模块包括第二处理模块,所述第二处理模块采用决策网络对提取的特征进行分析以得到目标信息,所述决策网络的学习方法为:
构建决策网络的强化学习环境;所述强化学习环境包括状态空间、动作空间和奖励函数;所述状态空间中包含图像被当前选定的区域和最终被选定的区域具有的信息;所述动作空间中动作包括选择图像中另一个区域替换当前被选定的区域;所述奖励函数包括最终奖励和中间奖励,所述中间奖励是如果命中则加1,最终奖励为最终的命中率;
所述第二处理模块选择图像上某一区域,采集数据,训练决策网络。
在本申请的一些实施例中,所述第二处理模块包括记录模块,所述记录模块在所述训练决策网络的过程中,记录{状态,动作,下一状态,奖励}元组。
在本申请的一些实施例中,还包括图像信息获取模块,所述图像信息获取模块获取投标文本图像时,获取投标文本的格式、标题。
上列详细说明是针对本发明可行实施例的具体说明,以上实施例并非用以限制本发明的专利范围,凡未脱离本发明所为的等效实施或变更,均应包含于本案的专利范围中。

Claims (10)

1.基于非结构化投标文件内容的结构化数据获取方法,其特征在于,包括:
获取投标文件的图像;
将所述图像分割为多个子图像;
采用神经网络模型对多个所述子图像进行特征提取,并对提取的特征进行分析以得到目标信息,所述目标信息包括财务信息、资质信息和业绩信息。
2.根据权利要求1所述的基于非结构化投标文件内容的结构化数据获取方法,其特征在于,所述神经网络模型包括深度卷积神经网络,所述深度卷积网络用于进行特征提取,采用人工标注的投标文件图像数据集为训练集,对训练集中图像进行切割,得到只有背景的负样本图像和含有文本的正样本图像,深度卷积网络模型的训练方法包括:
对图像进行再切割,得到包含文本的正样本图像和只含背景的负样本图像。
3.根据权利要求2所述的基于非结构化投标文件内容的结构化数据获取方法,其特征在于,所述神经网络模型包括决策网络,所述决策网络对提取的特征进行分析以得到目标信息,所述决策网络的训练方法包括:
构建决策网络的强化学习环境;所述强化学习环境包括状态空间、动作空间和奖励函数;所述状态空间中包含图像被当前选定的区域和最终被选定的区域具有的信息;所述动作空间中动作包括选择图像中另一个区域替换当前被选定的区域;所述奖励函数包括最终奖励和中间奖励,所述中间奖励是如果命中则加1,最终奖励为最终的命中率;
选择图像上某一区域,采集数据,训练决策网络。
4.根据权利要求1所述的基于非结构化投标文件内容的结构化数据获取方法,其特征在于,所述训练决策网络的过程中,记录{状态,动作,下一状态,奖励}元组。
5.根据权利要求1所述的基于非结构化投标文件内容的结构化数据获取方法,其特征在于,获取投标文本图像时,获取投标文本的格式、标题。
6.基于非结构化投标文件内容的结构化数据获取装置,其特征在于,包括:
原图像获取模块,所述原图像获取模块获取投标文件的图像;
子图像获取模块,所述子图像获取模块将所述图像分割为多个子图像;
处理模块,所述处理模块采用神经网络模型对多个所述子图像进行特征提取,并对提取的特征进行分析以得到目标信息,所述目标信息包括财务信息、资质信息和业绩信息。
7.根据权利要求6所述的基于非结构化投标文件内容的结构化数据获取装置,其特征在于,所述处理模块包括第一处理模块,所述第一处理模块采用深度卷积神经网络进行特征提取,采用人工标注的投标文件图像数据集为训练集,对训练集中图像进行切割,得到只有背景的负样本图像和含有文本的正样本图像,深度卷积网络模型的训练方法包括:
对图像进行再切割,得到包含文本的正样本图像和只含背景的负样本图像。
8.根据权利要求6所述的基于非结构化投标文件内容的结构化数据获取装置,其特征在于,所述处理模块包括第二处理模块,所述第二处理模块采用决策网络对提取的特征进行分析以得到目标信息,所述决策网络的学习方法为:
构建决策网络的强化学习环境;所述强化学习环境包括状态空间、动作空间和奖励函数;所述状态空间中包含图像被当前选定的区域和最终被选定的区域具有的信息;所述动作空间中动作包括选择图像中另一个区域替换当前被选定的区域;所述奖励函数包括最终奖励和中间奖励,所述中间奖励是如果命中则加1,最终奖励为最终的命中率;
所述第二处理模块选择图像上某一区域,采集数据,训练决策网络。
9.根据权利要求6所述的基于非结构化投标文件内容的结构化数据获取装置,其特征在于,所述第二处理模块包括记录模块,所述记录模块在所述训练决策网络的过程中,记录{状态,动作,下一状态,奖励}元组。
10.根据权利要求6所述的基于非结构化投标文件内容的结构化数据获取装置,其特征在于,还包括图像信息获取模块,所述图像信息获取模块获取投标文本图像时,获取投标文本的格式、标题。
CN202011453567.6A 2020-12-12 2020-12-12 基于非结构化投标文件内容的结构化数据获取方法及装置 Pending CN112464957A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011453567.6A CN112464957A (zh) 2020-12-12 2020-12-12 基于非结构化投标文件内容的结构化数据获取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011453567.6A CN112464957A (zh) 2020-12-12 2020-12-12 基于非结构化投标文件内容的结构化数据获取方法及装置

Publications (1)

Publication Number Publication Date
CN112464957A true CN112464957A (zh) 2021-03-09

Family

ID=74801357

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011453567.6A Pending CN112464957A (zh) 2020-12-12 2020-12-12 基于非结构化投标文件内容的结构化数据获取方法及装置

Country Status (1)

Country Link
CN (1) CN112464957A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113407613A (zh) * 2021-08-20 2021-09-17 北京国电通网络技术有限公司 文件解析方法、装置、电子设备和计算机可读介质
US20220198186A1 (en) * 2020-12-18 2022-06-23 International Business Machines Corporation Synthesizing hard-negative text training data

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109784754A (zh) * 2019-01-29 2019-05-21 国网物资有限公司 基于招标要求及核实证明的评标资质审核系统
US20200193226A1 (en) * 2018-12-17 2020-06-18 King Fahd University Of Petroleum And Minerals Enhanced deep reinforcement learning deep q-network models
CN111695385A (zh) * 2019-03-15 2020-09-22 杭州海康威视数字技术股份有限公司 文本识别方法、装置及设备
CN112016547A (zh) * 2020-08-20 2020-12-01 上海天壤智能科技有限公司 基于深度学习的图像文字识别方法、系统及介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200193226A1 (en) * 2018-12-17 2020-06-18 King Fahd University Of Petroleum And Minerals Enhanced deep reinforcement learning deep q-network models
CN109784754A (zh) * 2019-01-29 2019-05-21 国网物资有限公司 基于招标要求及核实证明的评标资质审核系统
CN111695385A (zh) * 2019-03-15 2020-09-22 杭州海康威视数字技术股份有限公司 文本识别方法、装置及设备
CN112016547A (zh) * 2020-08-20 2020-12-01 上海天壤智能科技有限公司 基于深度学习的图像文字识别方法、系统及介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220198186A1 (en) * 2020-12-18 2022-06-23 International Business Machines Corporation Synthesizing hard-negative text training data
US11948382B2 (en) * 2020-12-18 2024-04-02 International Business Machines Corporation Synthesizing hard-negative text training data
CN113407613A (zh) * 2021-08-20 2021-09-17 北京国电通网络技术有限公司 文件解析方法、装置、电子设备和计算机可读介质
CN113407613B (zh) * 2021-08-20 2021-11-09 北京国电通网络技术有限公司 文件解析方法、装置、电子设备和计算机可读介质

Similar Documents

Publication Publication Date Title
CN111709349B (zh) 一种针对带表格合同的ocr识别方法
CN112464957A (zh) 基于非结构化投标文件内容的结构化数据获取方法及装置
CN111444793A (zh) 基于ocr的票据识别方法、设备、存储介质及装置
CN112927783B (zh) 图像检索方法及装置
CN111026870A (zh) 一种综合文本分类和图像识别的ict系统故障分析方法
CN115630843A (zh) 合同条款自动审核方法及系统
CN112434970A (zh) 一种基于智能数据采集的资质数据验证方法、装置
CN109886257A (zh) 一种ocr系统中采用深度学习矫正发票图片分割结果的方法
CN116681997B (zh) 一种不良场景图像的分类方法、系统、介质及设备
CN117593244A (zh) 一种基于改进注意力机制的膜产品缺陷检测方法
CN116644228A (zh) 多模态全文信息检索方法、系统及存储介质
CN114579796B (zh) 机器阅读理解方法及装置
CN110728240A (zh) 一种对电子卷宗的标题自动识别的方法及装置
CN115565193A (zh) 问卷信息录入方法、装置、电子设备及存储介质
CN114417820A (zh) 目标对象用内容过滤方法
CN112364790B (zh) 基于卷积神经网络的机场工作单信息识别方法及系统
CN112800219A (zh) 客服日志反馈回流数据库的方法及系统
CN115375936A (zh) 一种人工智能核验监测方法、系统及存储介质
CN114756617A (zh) 一种工程档案结构化数据提取方法、系统、设备和存介质
CN113657373A (zh) 一种文书自动编目方法
CN113033536A (zh) 工作笔记生成方法及装置
CN110633754A (zh) 一种基于神经网络的智能病案文字识别的方法
CN111651960A (zh) 一种从合同简体迁移到繁体的光学字符联合训练及识别方法
Vafaie et al. Improvements in Handwritten and Printed Text Separation in Historical Archival Documents
CN109325557A (zh) 基于计算机视觉图像识别的数据智能采集方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination