CN112883980B - 一种数据处理方法及系统 - Google Patents

一种数据处理方法及系统 Download PDF

Info

Publication number
CN112883980B
CN112883980B CN202110463485.8A CN202110463485A CN112883980B CN 112883980 B CN112883980 B CN 112883980B CN 202110463485 A CN202110463485 A CN 202110463485A CN 112883980 B CN112883980 B CN 112883980B
Authority
CN
China
Prior art keywords
result
updating
semantic
text
inputting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110463485.8A
Other languages
English (en)
Other versions
CN112883980A (zh
Inventor
姚娟娟
钟南山
陈君石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Mingping Medical Data Technology Co ltd
Original Assignee
Mingpinyun Beijing Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mingpinyun Beijing Data Technology Co Ltd filed Critical Mingpinyun Beijing Data Technology Co Ltd
Priority to CN202110463485.8A priority Critical patent/CN112883980B/zh
Publication of CN112883980A publication Critical patent/CN112883980A/zh
Application granted granted Critical
Publication of CN112883980B publication Critical patent/CN112883980B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Character Discrimination (AREA)

Abstract

本发明提供一种数据处理方法及系统,方法包括:获取原始图像集;将原始图像集输入第一卷积神经网络进行训练,获取文字识别模型;获取待识别图像;将待识别图像输入文字识别模型进行文字识别,获取识别结果;将识别结果输入语义标签提取模型进行语义标签提取,获取识别结果中的文本向量的语义标签;根据语义标签,对识别结果进行一次更新,进而进行文字协同编辑;本发明中的数据处理方法,通过对待识别图像进行文字识别,并将识别结果输入语义标签提取模型进行语义标签提取,根据提取出的语义标签,对识别结果进行一次更新,进而进行多端文字协同编辑,实现对图像中的文本数据的快速提取与协同编辑,文本识别精确度较高。

Description

一种数据处理方法及系统
技术领域
本发明涉及数据处理领域,尤其涉及一种数据处理方法及系统。
背景技术
随着数据处理技术的发展,对图像数据处理的应用也越来越广泛,例如在医学会诊等场景中,存在很多打印或者手写的医学文件,如体检报告,医学病历、图像影像、CT检查、医学处方、诊断思路、医学要点等,目前,上述医学文件只能通过图片或PDF等格式进行传输与查看,不能较好地支持数据的快速提取和编辑,且文字识别精确度较低。
发明内容
本发明提供一种数据处理方法及系统,以解决现有技术中不能较好地对图像中的文本数据进行快速提取和编辑,且文字识别精确度较低的问题。
本发明提供的数据处理方法,包括:
获取原始图像集;
将所述原始图像集输入第一卷积神经网络进行训练,获取文字识别模型;
获取待识别图像;
将所述待识别图像输入所述文字识别模型进行文字识别,获取识别结果;
将所述识别结果输入语义标签提取模型进行语义标签提取,获取识别结果中的文本向量的语义标签;
根据所述语义标签,对所述识别结果进行一次更新,进而进行文字协同编辑;
根据所述语义标签,对所述识别结果进行一次更新的步骤包括:
构建分类数据库;
将所述语义标签与所述分类数据库中词集的分类标签进行匹配,获取匹配结果;
若所述匹配结果超出预设的匹配阈值,则将所述分类标签对应的词集确定为目标词集;
将所述识别结果与所述目标词集中的目标词汇进行相似度对比,获取相似度对比结果;
根据所述相似度对比结果,对所述识别结果进行一次更新,获取一次更新结果;
根据所述相似度对比结果,对所述识别结果进行一次更新的步骤包括:当识别结果与目标词集中的目标词汇的相似度超出预设的相似度阈值时,则将目标词汇更新至识别结果;
所述语义标签提取模型的获取步骤包括:
获取原始文本集,所述原始文本集包括:语义标签标注;
将所述原始文本集输入第一长短期记忆网络进行训练,获取所述语义标签提取模型,训练步骤包括:文本特征去噪、分布式向量转换、语义特征提取及反馈优化;
所述反馈优化的步骤包括:根据预设的损失函数,获取语义标签的真实值和预测值之间的差值,进而进行迭代训练,所述损失函数的数学表达为:
Y(t)=c(t)+Y(t+1)
Figure DEST_PATH_IMAGE001
其中,Y(t)为t时刻总的损失函数,c(t)为t时刻的损失函数,Y(t+1)为t+1时刻总的损失函数,ω为预设的第一权重值,σ为预设的第二权重值,ki为语义标签的真实值,
Figure 209809DEST_PATH_IMAGE002
为语义标签的预测值,1≤i≤t,λ为语义标签的真实值的权值,m为函数参数,b为语义标签的预测值的权值。
可选的,将所述原始图像集输入第一卷积神经网络进行训练的步骤包括:
将所述原始图像集输入所述第一卷积神经网络进行文字特征提取,文字特征提取的步骤至少包括以下之一:分布特征提取、结构形态特征提取,获取分布特征向量和/或结构形态特征向量;
将所述分布特征向量与预设数据库中对应的文字特征进行第一对比,获取第一对比结果;
将所述结构形态特征向量与预设数据库中对应的文字特征进行第二对比,获取第二对比结果;
根据所述第一对比结果和/或所述第二对比结果,获取识别结果并进行迭代训练,进而获取文字识别模型。
可选的,进行文字特征提取的步骤包括:
根据所述原始图像集中的原始图像和预设的区域划分原则,获取一个或多个文字区域;
对所述文字区域进行二值化处理,获取二值化区域;
根据所述二值化区域中的黑色像素点及白色像素点的集合,获取所述原始图像中的像素点的分布特征向量;
对所述原始图像集中的原始图像进行细线化,获取细线化图像;
获取所述细线化图像的结构形态特征,进而获取所述结构形态特征向量,所述结构形态特征至少包括以下之一:笔划端点、交叉点、笔划段。
可选的,构建分类数据库的步骤包括:
获取原始数据集;
对所述原始数据集进行分词处理,获取原始数据词集;
将所述原始数据词集输入第二卷积神经网络进行训练,获取分类模型;
将所述原始数据集输入所述分类模型进行分类,获取一个或多个词集,所述词集包括一个或多个分类标签,完成所述分类数据库的构建。
可选的,对所述识别结果进行一次更新的步骤之后包括:
将一次更新结果输入文本预测模型进行文本预测,获取文本预测结果;
根据所述文本预测结果,对所述一次更新结果进行二次更新,获取二次更新结果,进而进行文字协同编辑;
其中,所述文本预测模型的获取步骤包括:
获取原始数据集;
将所述原始数据集输入第二长短期记忆网络,根据原始数据集中的上下文信息,进行文本预测,获取文本预测模型。
可选的,将所述原始图像集输入第一卷积神经网络进行训练的步骤之前包括:
根据预设的邻域像素判断原则,对所述原始图像集中的原始图像进行噪声判断,获取判断结果;
根据所述判断结果,对所述原始图像集中的原始图像进行降噪处理,获取降噪图像,降噪处理的步骤至少包括以下之一:高斯滤波、中值滤波和双边滤波;
对所述降噪图像进行清洗及校正,获取预处理图像;
将所述预处理图像输入所述第一卷积神经网络进行训练,获取文字识别模型。
可选的,进行文字协同编辑的步骤包括:
将二次更新结果传输至云端;
当终端发出传输请求时,根据传输请求中的用户关联信息,对用户的权限进行认证,获取认证结果,所述用户关联信息至少包括以下之一:用户ID、身份证号码、手机号码;
根据认证结果,建立终端与云端的连接,并将对应的所述二次更新结果传输至所述终端,进行文字协同编辑;
根据预设的更新时间,将协同编辑的文本传输至云端并将编辑操作写入日志。
可选的,所述原始图像集包括:原始医学图像集,所述原始医学图像集至少包括以下之一:病例、体检报告、医学分析报告、医学处方。
本发明还提供一种数据处理系统,包括:
第一图像获取模块,用于获取原始图像集;
模型获取模块,用于将所述原始图像集输入第一卷积神经网络进行训练,获取文字识别模型;
第二图像获取模块,用于获取待识别图像;
识别模块,用于将所述待识别图像输入所述文字识别模型进行文字识别,获取识别结果;
语义标签提取模块,用于将所述识别结果输入语义标签提取模型进行语义标签提取,获取识别结果中的文本向量的语义标签;
所述语义标签提取模型的获取步骤包括:
获取原始文本集,所述原始文本集包括:语义标签标注;
将所述原始文本集输入第一长短期记忆网络进行训练,获取所述语义标签提取模型,训练步骤包括:文本特征去噪、分布式向量转换、语义特征提取及反馈优化;
所述反馈优化的步骤包括:根据预设的损失函数,获取语义标签的真实值和预测值之间的差值,进而进行迭代训练,所述损失函数的数学表达为:
Y(t)=c(t)+Y(t+1)
Figure 484933DEST_PATH_IMAGE001
其中,Y(t)为t时刻总的损失函数,c(t)为t时刻的损失函数,Y(t+1)为t+1时刻总的损失函数,ω为预设的第一权重值,σ为预设的第二权重值,ki为语义标签的真实值,
Figure 128404DEST_PATH_IMAGE002
为语义标签的预测值,1≤i≤t,λ为语义标签的真实值的权值,m为函数参数,b为语义标签的预测值的权值;
第一更新模块,用于根据所述语义标签,对所述识别结果进行一次更新,进而进行文字协同编辑;所述第一图像获取模块、模型获取模块、第二图像获取模块、识别模块、语义标签提取模块和第一更新模块连接;
根据所述语义标签,对所述识别结果进行一次更新的步骤包括:
构建分类数据库;
将所述语义标签与所述分类数据库中词集的分类标签进行匹配,获取匹配结果;
若所述匹配结果超出预设的匹配阈值,则将所述分类标签对应的词集确定为目标词集;
将所述识别结果与所述目标词集中的目标词汇进行相似度对比,获取相似度对比结果;
根据所述相似度对比结果,对所述识别结果进行一次更新,获取一次更新结果;
根据所述相似度对比结果,对所述识别结果进行一次更新的步骤包括:当识别结果与目标词集中的目标词汇的相似度超出预设的相似度阈值时,则将目标词汇更新至识别结果。
本发明的有益效果:本发明中的数据处理方法,通过将待识别图像输入文字识别模型进行文字识别,获取识别结果,并将识别结果输入语义标签提取模型进行语义标签提取,获取识别结果中的文本向量的语义标签,根据语义标签,对所述识别结果进行一次更新,进而进行多端文字协同编辑,实现对图像中的文本数据的快速提取与协同编辑,文本识别精确度较高。
附图说明
图1是本发明实施例中数据处理方法的一流程示意图。
图2是本发明实施例中数据处理方法的另一流程示意图。
图3是本发明实施例中数据处理系统的结构示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
发明人发现,随着数据处理技术的发展,对图像数据处理的应用也越来越广泛,例如在医学会诊等场景中,存在很多打印或者手写的医学文件,如体检报告,医学病历、图像影像、CT检查、医学处方、诊断思路、医学要点等,目前,上述医学文件只能通过图片或PDF等格式进行传输与查看,不能较好地支持数据的快速提取和编辑,且文字识别精确度较低,因此,本发明提出一种数据处理方法及系统,通过将原始图像集输入第一卷积神经网络进行训练,获取文字识别模型,将待识别图像输入文字识别模型进行文字识别,获取识别结果,并将识别结果输入语义标签提取模型进行语义标签提取,获取识别结果中的文本向量的语义标签,根据语义标签,对所述识别结果进行一次更新,进而进行多端文字协同编辑,实现对图像中的文本数据的快速提取与协同编辑,文本识别精确度较高,可实施性较强,成本较低。
如图1所示,本实施例中的数据处理方法,包括:
S1:获取原始图像集;所述原始图像集包括:原始医学图像集,例如:采集一个或多个原始医学图像,所述原始医学图像包括:图像文本信息,将所述一个或多个原始医学图像作为原始医学图像集,为第一卷积神经网络提供训练基础。
S2:将所述原始图像集输入第一卷积神经网络进行训练,获取文字识别模型。
S3:获取待识别图像;例如:采用摄像机或扫描仪等,采集待识别图像,所述待识别图像可以为病例、体检报告等医学文件。
S4:将所述待识别图像输入所述文字识别模型进行文字识别,获取识别结果。
S5:将所述识别结果输入语义标签提取模型进行语义标签提取,获取识别结果中的文本向量的语义标签。
S6:根据所述语义标签,对所述识别结果进行一次更新,进而进行文字协同编辑;通过将原始图像集输入第一卷积神经网络进行训练,获取文字识别模型,通过调整梯度下降的速度、迭代学习率、学习次数及迭代次数,获得较优的文字识别模型,将待识别图像输入文字识别模型进行文字识别,获取识别结果,并将识别结果输入语义标签提取模型进行语义标签提取,获取识别结果中的文本向量的语义标签,根据语义标签,对所述识别结果进行一次更新,进而进行多端文字协同编辑,实现对图像中的文本数据的快速提取与协同编辑,文本识别精确度较高,可实施性较强,成本较低。
如图2所示,在一些实施例中,数据处理方法包括:
S101:获取原始图像集;在一些实施例中,所述原始图像集包括:原始医学图像集,所述原始医学图像集至少包括以下之一:病例、体检报告、医学分析报告、医学处方。
S102:对所述原始图像集中的原始图像进行预处理,获取预处理图像,在一些实施例中,获取预处理图像的步骤包括:
根据预设的邻域像素判断原则,对所述原始图像集中的原始图像进行噪声判断,获取判断结果;例如:将大于主体内容色值的邻域像素,判定为背景色,如果一个像素上下左右4个像素值有超过2个像素属于背景色,则定义该像素为噪声。
根据所述判断结果,对所述原始图像集中的原始图像进行降噪处理,获取降噪图像,降噪处理的步骤至少包括以下之一:高斯滤波、中值滤波和双边滤波;
对所述降噪图像进行清洗及校正,获取预处理图像。通过对原始图像集中的原始图像进行预处理,能够降低后续文字识别的处理难度,提高文字识别的精确度。
S201:将所述预处理图像输入所述第一卷积神经网络进行训练,获取文字识别模型,在一些实施例中,将所述原始图像集输入第一卷积神经网络进行训练的步骤包括:
将所述预处理图像输入所述第一卷积神经网络进行文字特征提取,文字特征提取的步骤至少包括以下之一:分布特征提取、结构形态特征提取,获取分布特征向量和/或结构形态特征向量;
将所述分布特征向量与预设数据库中对应的文字特征进行第一对比,获取第一对比结果;
将所述结构形态特征向量与预设数据库中对应的文字特征进行第二对比,获取第二对比结果;
根据所述第一对比结果和/或所述第二对比结果,获取识别结果并进行迭代训练,进而获取文字识别模型。通过提取预处理图像的分布特征和/或结构形态特征,能够较好地实现对预处理图像中的文字特征的提取,提高特征提取精度,例如:当第一对比结果和第二对比结果不同时,则根据预设的权重参数,确定识别结果,并进行迭代训练,进而获取文字识别模型。
在一些实施例中,所述分布特征提取的步骤包括:
根据所述原始图像集中的原始图像和预设的区域划分原则,获取一个或多个文字区域;
对所述文字区域进行二值化处理,获取二值化区域;
根据所述二值化区域中的黑色像素点及白色像素点的集合,获取所述原始图像中的像素点的分布特征向量。可以理解的,通过获取二值化区域中黑白像素点的集合,能够较好地得到原始图像中的分布特征向量。
在一些实施例中,所述结构形态特征提取的步骤包括:
对所述原始图像集中的原始图像进行细线化,获取细线化图像;
获取所述细线化图像的结构形态特征,进而获取所述结构形态特征向量,所述结构形态特征至少包括以下之一:笔划端点、交叉点、笔划段。通过将细线化图像的结构形态特征转换为结构形态特征向量,能够较好地对预处理图像进行特征提取,提高特征提取的精确度。
S301:获取待识别图像;可以理解的,所述待识别图像可以为医学图像,如病例、体检报告等。
S401:将所述待识别图像输入所述文字识别模型进行文字识别,获取识别结果;通过将所述待识别图像输入所述文字识别模型进行文字识别,能够较好地提取出待识别图像中的文字,识别精确度较高。
S501:将所述识别结果输入语义标签提取模型进行语义标签提取,获取识别结果中的文本向量的语义标签;通过将识别结果输入语义标签提取模型进行语义标签提取,能够获取识别结果中文本向量或词向量的语义标签。
在一些实施例中,所述语义标签提取模型的获取步骤包括:
获取原始文本集,所述原始文本集包括:语义标签标注;
将所述原始文本集输入第一长短期记忆网络进行训练,获取所述语义标签提取模型,训练步骤包括:文本特征去噪、分布式向量转换、语义特征提取及反馈优化;
所述反馈优化的步骤包括:根据预设的损失函数,获取语义标签的真实值和预测值之间的差值,进而进行迭代训练,所述损失函数的数学表达为:
Y(t)=c(t)+Y(t+1)
Figure 401253DEST_PATH_IMAGE001
其中,Y(t)为t时刻总的损失函数,c(t)为t时刻的损失函数,Y(t+1)为t+1时刻总的损失函数,ω为预设的第一权重值,σ为预设的第二权重值,ki为语义标签的真实值,
Figure 130175DEST_PATH_IMAGE002
为语义标签的预测值,1≤i≤t,λ为语义标签的真实值的权值,m为函数参数,b为语义标签的预测值的权值。
其中,文本向量去噪可以采用统计排序的方法,将文本向量序列约束成预设长度的词汇序列,分布式向量转换即将词汇序列转换为分布式向量表示。所述第一长短期记忆网络包括:输入门、输出门和遗忘门,通过将原始文本集输入第一长短期记忆网络进行训练,能够较好地提取原始文本集中的原始文本语义标签,提高语义标签提取模型的精确度。
S601:根据所述语义标签,对所述识别结果进行一次更新,获取一次更新结果;
在一些实施例中,根据所述语义标签,对所述识别结果进行一次更新的步骤包括:
将所述语义标签与预先构建的分类数据库中词集的分类标签进行匹配,获取匹配结果;
若所述匹配结果超出预设的匹配阈值,则将所述分类标签对应的词集确定为目标词集;
将所述识别结果与所述目标词集中的目标词汇进行相似度对比,获取相似度对比结果;
根据所述相似度对比结果,对所述识别结果进行一次更新,获取一次更新结果。通过将语义标签与分类数据库中词集的分类标签进行匹配,能够较快地获取与该语义标签相匹配的分类标签所对应的词集,提高匹配速度,将该词集确定为目标词集,并将识别结果与目标词集中的目标词汇进行相似度对比,根据对比结果,对识别结果进行更新,如当识别结果与目标词集中的目标词汇的相似度超出预设的相似度阈值时,则将目标词汇更新至识别结果中,提高识别结果的更新效率及精确度。在一些实施例中,构建分类数据库的步骤包括:
获取原始数据集;
对所述原始数据集进行分词处理,获取原始数据词集;
将所述原始数据词集输入第二卷积神经网络进行训练,获取分类模型;
将所述原始数据集输入所述分类模型进行分类,获取一个或多个词集,所述词集包括一个或多个分类标签,完成所述分类数据库的构建。通过构建分类数据库,并在分类数据库中构建一个或多个带有分类标签的词集,能够加快对识别结果的更新速度,成本较低。
S602:将所述一次更新结果输入文本预测模型进行文本预测,获取文本预测结果;
S603:根据所述文本预测结果,对所述一次更新结果进行二次更新,获取二次更新结果,进而进行文字协同编辑;例如当文本预测结果与一次更新结果不同时,则根据预设的预测权重比值,对所述一次更新结果进行二次更新,获取二次更新结果,完成二次更新,提高文字识别精确度。
其中,所述文本预测模型的获取步骤包括:
获取原始数据集;
将所述原始数据集输入第二长短期记忆网络,根据原始数据集中的上下文信息,进行文本预测,获取文本预测模型。通过将一次更新结果输入文本预测模型进行预测,能够较好地获取一次更新结果中词的概率的分布,根据文本预测结果,对一次更新结果进行二次更新,能够有效提高文本识别的精确度。例如:将原始数据集中的原始词汇输入第二长短期记忆网络,根据时序处理,获取状态向量,所述状态向量包括原始数据集中的上下文信息,进而确定对于下一个词的预测概率,根据所述预测概率,对文本进行预测,并进行迭代训练,获取文本预测模型。
在一些实施例中,进行文字协同编辑的步骤包括:
将二次更新结果传输至云端;
当终端发出传输请求时,根据传输请求中的用户关联信息,对用户的权限进行认证,获取认证结果,所述用户关联信息至少包括以下之一:用户ID、身份证号码、手机号码;通过对用户的权限进行认证,使得不同用户的权限不同,提高了信息传输的安全性,如不同医生、不同患者之间设置的权限不同;
根据认证结果,建立终端与云端的连接,并将对应的所述二次更新结果传输至所述终端,进行文字协同编辑;
根据预设的更新时间,将协同编辑的文本传输至云端并将编辑操作写入日志。通过设置固定的更新时间或更新周期,根据所述更新时间或更新周期,定期将正在编辑的文本数据传输至云端,实现对文本的实时更新,便于对进行文字协同编辑,避免出现多端修改造成信息冗余或矛盾,且通过将编辑操作定期写入日志,能够查询日志中的修改记录,查看历史文本信息,避免修改不可逆,造成不必要的损失,成本较低。
在一些实施例中,当终端发出传输请求时,采集用户的当前生物特征信息,所述生物特征信息至少包括以下之一:人脸特征、指纹特征、声音特征;
根据传输请求中的用户关联信息,获取云端中与所述用户关联信息相对应的历史生物特征信息;
将所述当前生物特征信息与所述历史生物特征信息进行比较,获取特征比较结果;
根据所述特征比较结果,对用户进行真实性认证,例如:当所述比较结果超出预设的特征比较阈值时,则判定用户为真实,当所述比较结果未超出所述特征比较阈值时,则向终端发送重新认证通知,以此保证用户的真实性,进一步地,提高数据的安全性。
在一些实施例中,还包括:将原始数据集输入第三卷积神经网络进行训练,获取文本分类模型;
将所述二次更新结果输入文本分类模型进行文本分类,获取文本分类结果,所述文本分类结果与终端具有关联关系;
根据所述文本分类结果和所述关联关系,将所述二次更新结果传输至对应的终端;通过对二次更新结果进行分类,并建立文本分类结果和终端之间的关联关系,能够将二次更新结果针对性地自动传输至对应的终端,如:根据文本分类结果和终端之间的关联关系,将二次更新结果传输至对应科室的终端或对应医生的终端,可以理解的,终端可以为电脑、手机以及其它显示器件等,便于将二次更新结果针对性地传输至对应的终端,同时,专家或医生等相关人员可以及时接收到二次更新结果,并及时反馈,提高信息传输效率和反馈速度,自动化程度较高。
如图3所示,本实施例还提供一种数据处理系统,包括:
第一图像获取模块,用于获取原始图像集;
模型获取模块,用于将所述原始图像集输入第一卷积神经网络进行训练,获取文字识别模型;
第二图像获取模块,用于获取待识别图像;
识别模块,用于将所述待识别图像输入所述文字识别模型进行文字识别,获取识别结果;
语义标签提取模块,用于将所述识别结果输入语义标签提取模型进行语义标签提取,获取识别结果中的文本向量的语义标签;
第一更新模块,用于根据所述语义标签,对所述识别结果进行一次更新,进而进行文字协同编辑;所述第一图像获取模块、模型获取模块、第二图像获取模块、识别模块、语义标签提取模块和第一更新模块依次连接;通过将原始图像集输入第一卷积神经网络进行训练,获取文字识别模型,将待识别图像输入文字识别模型进行文字识别,获取识别结果,并将识别结果输入语义标签提取模型进行语义标签提取,获取识别结果中的文本向量的语义标签,根据语义标签,对所述识别结果进行一次更新,进而进行多端文字协同编辑,实现对图像中的文本数据的快速提取与协同编辑,文本识别精确度较高,可实施性较强,成本较低。
在一些实施例中,还包括:预处理模块,用于根据预设的邻域像素判断原则,对所述原始图像集中的原始图像进行噪声判断,获取判断结果;
根据所述判断结果,对所述原始图像集中的原始图像进行降噪处理,获取降噪图像,降噪处理的步骤至少包括以下之一:高斯滤波、中值滤波和双边滤波;
对所述降噪图像进行清洗及校正,获取预处理图像。
在一些实施例中,所述模型获取模块将所述原始图像集输入第一卷积神经网络进行训练的步骤包括:
将所述预处理图像输入所述第一卷积神经网络进行文字特征提取,文字特征提取的步骤至少包括以下之一:分布特征提取、结构形态特征提取,获取分布特征向量和/或结构形态特征向量;
将所述分布特征向量与预设数据库中对应的文字特征进行第一对比,获取第一对比结果;
将所述结构形态特征向量与预设数据库中对应的文字特征进行第二对比,获取第二对比结果;
根据所述第一对比结果和/或所述第二对比结果,获取识别结果并进行迭代训练,进而获取文字识别模型。
在一些实施例中,所述分布特征提取的步骤包括:
根据所述原始图像集中的原始图像和预设的区域划分原则,获取一个或多个文字区域;
对所述文字区域进行二值化处理,获取二值化区域;
根据所述二值化区域中的黑色像素点及白色像素点的集合,获取所述原始图像中的像素点的分布特征向量。
在一些实施例中,所述结构形态特征提取的步骤包括:
对所述原始图像集中的原始图像进行细线化,获取细线化图像;
获取所述细线化图像的结构形态特征,进而获取所述结构形态特征向量,所述结构形态特征至少包括以下之一:笔划端点、交叉点、笔划段。
在一些实施例中,所述语义标签提取模型的获取步骤包括:
获取原始文本集,所述原始文本集包括:语义标签标注;
将所述原始文本集输入第一长短期记忆网络进行训练,获取所述语义标签提取模型,训练步骤包括:文本特征去噪、分布式向量转换、语义特征提取及反馈优化;
所述反馈优化的步骤包括:根据预设的损失函数,获取语义标签的真实值和预测值之间的差值,进而进行迭代训练,所述损失函数的数学表达为:
Y(t)=c(t)+Y(t+1)
Figure 208989DEST_PATH_IMAGE001
其中,Y(t)为t时刻总的损失函数,c(t)为t时刻的损失函数,Y(t+1)为t+1时刻总的损失函数,ω为预设的第一权重值,σ为预设的第二权重值,ki为语义标签的真实值,
Figure 706967DEST_PATH_IMAGE002
为语义标签的预测值,1≤i≤t,λ为语义标签的真实值的权值,m为函数参数,b为语义标签的预测值的权值。
在一些实施例中,所述第一更新模块根据所述语义标签,对所述识别结果进行一次更新的步骤包括:
构建分类数据库;
将所述语义标签与所述分类数据库中词集的分类标签进行匹配,获取匹配结果;
若所述匹配结果超出预设的匹配阈值,则将所述分类标签对应的词集确定为目标词集;
将所述识别结果与所述目标词集中的目标词汇进行相似度对比,获取相似度对比结果;
根据所述相似度对比结果,对所述识别结果进行一次更新,获取一次更新结果。
在一些实施例中,构建分类数据库的步骤包括:
获取原始数据集;
对所述原始数据集进行分词处理,获取原始数据词集;
将所述原始数据词集输入第二卷积神经网络进行训练,获取分类模型;
将所述原始数据集输入所述分类模型进行分类,获取一个或多个词集,所述词集包括一个或多个分类标签,完成所述分类数据库的构建。
在一些实施例中,还包括:第二更新模块,用于将所述一次更新结果输入文本预测模型进行文本预测,获取文本预测结果;
根据所述文本预测结果,对所述一次更新结果进行二次更新,获取二次更新结果,进而进行文字协同编辑;所述第二更新模块与所述第一更新模块连接;
其中,所述文本预测模型的获取步骤包括:
获取原始数据集;
将所述原始数据集输入第二长短期记忆网络,根据原始数据集中的上下文信息,进行文本预测,获取文本预测模型。
在一些实施例中,还包括:协同编辑模块,用于将二次更新结果传输至云端;
当终端发出传输请求时,根据传输请求中的用户关联信息,对用户的权限进行认证,获取认证结果,所述用户关联信息至少包括以下之一:用户ID、身份证号码、手机号码;
根据认证结果,建立终端与云端的连接,并将对应的所述二次更新结果传输至所述终端,进行文字协同编辑;
根据预设的更新时间,将协同编辑的文本传输至云端并将编辑操作写入日志;所述协同编辑模块与所述第二更新模块连接。
在一些实施例中,所述原始图像集包括:原始医学图像集,所述原始医学图像集至少包括以下之一:病例、体检报告、医学分析报告、医学处方。通过本实施例中的方法或系统,能够较好地将医学图像转换为可编辑的文本,且便于进行协同编辑,可实施性较强,成本较低,精确度较高。
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本实施例中的任一项方法。
本实施例还提供一种电子终端,包括:处理器及存储器;
所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行本实施例中任一项方法。
本实施例中的计算机可读存储介质,本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
本实施例提供的电子终端,包括处理器、存储器、收发器和通信接口,存储器和通信接口与处理器和收发器连接并完成相互间的通信,存储器用于存储计算机程序,通信接口用于进行通信,处理器和收发器用于运行计算机程序,使电子终端执行如上方法的各个步骤。
在本实施例中,存储器可能包含随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (8)

1.一种数据处理方法,其特征在于,包括:
获取原始图像集;
将所述原始图像集输入第一卷积神经网络进行训练,获取文字识别模型;
获取待识别图像;
将所述待识别图像输入所述文字识别模型进行文字识别,获取识别结果;
将所述识别结果输入语义标签提取模型进行语义标签提取,获取识别结果中的文本向量的语义标签;
根据所述语义标签,对所述识别结果进行一次更新,进而进行文字协同编辑;
根据所述语义标签,对所述识别结果进行一次更新的步骤包括:
构建分类数据库;
将所述语义标签与所述分类数据库中词集的分类标签进行匹配,获取匹配结果;
若所述匹配结果超出预设的匹配阈值,则将所述分类标签对应的词集确定为目标词集;
将所述识别结果与所述目标词集中的目标词汇进行相似度对比,获取相似度对比结果;
根据所述相似度对比结果,对所述识别结果进行一次更新,获取一次更新结果;
根据所述相似度对比结果,对所述识别结果进行一次更新的步骤包括:当识别结果与目标词集中的目标词汇的相似度超出预设的相似度阈值时,则将目标词汇更新至识别结果;
所述语义标签提取模型的获取步骤包括:
获取原始文本集,所述原始文本集包括:语义标签标注;
将所述原始文本集输入第一长短期记忆网络进行训练,获取所述语义标签提取模型,训练步骤包括:文本特征去噪、分布式向量转换、语义特征提取及反馈优化;
所述反馈优化的步骤包括:根据预设的损失函数,获取语义标签的真实值和预测值之间的差值,进而进行迭代训练,所述损失函数的数学表达为:
Y(t)=c(t)+Y(t+1)
Figure 334156DEST_PATH_IMAGE001
其中,Y(t)为t时刻总的损失函数,c(t)为t时刻的损失函数,Y(t+1)为t+1时刻总的损失函数,ω为预设的第一权重值,σ为预设的第二权重值,ki为语义标签的真实值,
Figure 71168DEST_PATH_IMAGE002
为语义标签的预测值,1≤i≤t,λ为语义标签的真实值的权值,m为函数参数,b为语义标签的预测值的权值。
2.根据权利要求1所述的数据处理方法,其特征在于,将所述原始图像集输入第一卷积神经网络进行训练的步骤包括:
将所述原始图像集输入所述第一卷积神经网络进行文字特征提取,文字特征提取的步骤至少包括以下之一:分布特征提取、结构形态特征提取,获取分布特征向量和/或结构形态特征向量;
将所述分布特征向量与预设数据库中对应的文字特征进行第一对比,获取第一对比结果;
将所述结构形态特征向量与预设数据库中对应的文字特征进行第二对比,获取第二对比结果;
根据所述第一对比结果和/或所述第二对比结果,获取识别结果并进行迭代训练,进而获取文字识别模型。
3.根据权利要求2所述的数据处理方法,其特征在于,进行文字特征提取的步骤包括:
根据所述原始图像集中的原始图像和预设的区域划分原则,获取一个或多个文字区域;
对所述文字区域进行二值化处理,获取二值化区域;
根据所述二值化区域中的黑色像素点及白色像素点的集合,获取所述原始图像中的像素点的分布特征向量;
对所述原始图像集中的原始图像进行细线化,获取细线化图像;
获取所述细线化图像的结构形态特征,进而获取所述结构形态特征向量,所述结构形态特征至少包括以下之一:笔划端点、交叉点、笔划段。
4.根据权利要求1所述的数据处理方法,其特征在于,构建分类数据库的步骤包括:
获取原始数据集;
对所述原始数据集进行分词处理,获取原始数据词集;
将所述原始数据词集输入第二卷积神经网络进行训练,获取分类模型;
将所述原始数据集输入所述分类模型进行分类,获取一个或多个词集,所述词集包括一个或多个分类标签,完成所述分类数据库的构建。
5.根据权利要求1所述的数据处理方法,其特征在于,对所述识别结果进行一次更新的步骤之后包括:
将一次更新结果输入文本预测模型进行文本预测,获取文本预测结果;
根据所述文本预测结果,对所述一次更新结果进行二次更新,获取二次更新结果,进而进行文字协同编辑;
其中,所述文本预测模型的获取步骤包括:
获取原始数据集;
将所述原始数据集输入第二长短期记忆网络,根据原始数据集中的上下文信息,进行文本预测,获取文本预测模型。
6.根据权利要求1所述的数据处理方法,其特征在于,将所述原始图像集输入第一卷积神经网络进行训练的步骤之前包括:
根据预设的邻域像素判断原则,对所述原始图像集中的原始图像进行噪声判断,获取判断结果;
根据所述判断结果,对所述原始图像集中的原始图像进行降噪处理,获取降噪图像,降噪处理的步骤至少包括以下之一:高斯滤波、中值滤波和双边滤波;
对所述降噪图像进行清洗及校正,获取预处理图像;
将所述预处理图像输入所述第一卷积神经网络进行训练,获取文字识别模型。
7.根据权利要求1所述的数据处理方法,其特征在于,进行文字协同编辑的步骤包括:
将二次更新结果传输至云端;
当终端发出传输请求时,根据传输请求中的用户关联信息,对用户的权限进行认证,获取认证结果,所述用户关联信息至少包括以下之一:用户ID、身份证号码、手机号码;
根据认证结果,建立终端与云端的连接,并将对应的所述二次更新结果传输至所述终端,进行文字协同编辑;
根据预设的更新时间,将协同编辑的文本传输至云端并将编辑操作写入日志。
8.一种数据处理系统,其特征在于,包括:
第一图像获取模块,用于获取原始图像集;
模型获取模块,用于将所述原始图像集输入第一卷积神经网络进行训练,获取文字识别模型;
第二图像获取模块,用于获取待识别图像;
识别模块,用于将所述待识别图像输入所述文字识别模型进行文字识别,获取识别结果;
语义标签提取模块,用于将所述识别结果输入语义标签提取模型进行语义标签提取,获取识别结果中的文本向量的语义标签;
所述语义标签提取模型的获取步骤包括:
获取原始文本集,所述原始文本集包括:语义标签标注;
将所述原始文本集输入第一长短期记忆网络进行训练,获取所述语义标签提取模型,训练步骤包括:文本特征去噪、分布式向量转换、语义特征提取及反馈优化;
所述反馈优化的步骤包括:根据预设的损失函数,获取语义标签的真实值和预测值之间的差值,进而进行迭代训练,所述损失函数的数学表达为:
Y(t)=c(t)+Y(t+1)
Figure 532236DEST_PATH_IMAGE001
其中,Y(t)为t时刻总的损失函数,c(t)为t时刻的损失函数,Y(t+1)为t+1时刻总的损失函数,ω为预设的第一权重值,σ为预设的第二权重值,ki为语义标签的真实值,
Figure 962080DEST_PATH_IMAGE002
为语义标签的预测值,1≤i≤t,λ为语义标签的真实值的权值,m为函数参数,b为语义标签的预测值的权值;
第一更新模块,用于根据所述语义标签,对所述识别结果进行一次更新,进而进行文字协同编辑;所述第一图像获取模块、模型获取模块、第二图像获取模块、识别模块、语义标签提取模块和第一更新模块连接;
根据所述语义标签,对所述识别结果进行一次更新的步骤包括:
构建分类数据库;
将所述语义标签与所述分类数据库中词集的分类标签进行匹配,获取匹配结果;
若所述匹配结果超出预设的匹配阈值,则将所述分类标签对应的词集确定为目标词集;
将所述识别结果与所述目标词集中的目标词汇进行相似度对比,获取相似度对比结果;
根据所述相似度对比结果,对所述识别结果进行一次更新,获取一次更新结果;
根据所述相似度对比结果,对所述识别结果进行一次更新的步骤包括:当识别结果与目标词集中的目标词汇的相似度超出预设的相似度阈值时,则将目标词汇更新至识别结果。
CN202110463485.8A 2021-04-28 2021-04-28 一种数据处理方法及系统 Active CN112883980B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110463485.8A CN112883980B (zh) 2021-04-28 2021-04-28 一种数据处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110463485.8A CN112883980B (zh) 2021-04-28 2021-04-28 一种数据处理方法及系统

Publications (2)

Publication Number Publication Date
CN112883980A CN112883980A (zh) 2021-06-01
CN112883980B true CN112883980B (zh) 2021-09-21

Family

ID=76040764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110463485.8A Active CN112883980B (zh) 2021-04-28 2021-04-28 一种数据处理方法及系统

Country Status (1)

Country Link
CN (1) CN112883980B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113255665B (zh) * 2021-06-04 2021-12-21 明品云(北京)数据科技有限公司 一种目标文本提取方法及系统
CN113254654B (zh) * 2021-07-05 2021-09-21 北京世纪好未来教育科技有限公司 模型训练、文本识别方法、装置、设备和介质
CN116912845B (zh) * 2023-06-16 2024-03-19 广东电网有限责任公司佛山供电局 一种基于nlp与ai的智能内容识别与分析方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105023028B (zh) * 2015-07-17 2018-07-06 华中科技大学 基于hmm和决策树的阿拉伯语光学字母识别方法
CN109376658B (zh) * 2018-10-26 2022-03-08 信雅达科技股份有限公司 一种基于深度学习的ocr方法
CN110738201B (zh) * 2019-04-25 2024-04-19 上海海事大学 基于融合形态特征的自适应多卷积神经网络文字识别方法
CN110909725B (zh) * 2019-10-18 2023-09-19 平安科技(深圳)有限公司 识别文本的方法、装置、设备及存储介质
CN111275038A (zh) * 2020-01-17 2020-06-12 平安医疗健康管理股份有限公司 图像文本识别方法、装置、计算机设备及计算机存储介质

Also Published As

Publication number Publication date
CN112883980A (zh) 2021-06-01

Similar Documents

Publication Publication Date Title
CN112883980B (zh) 一种数据处理方法及系统
CN111931664B (zh) 混贴票据图像的处理方法、装置、计算机设备及存储介质
CN109993160B (zh) 一种图像矫正及文本与位置识别方法及系统
US11455525B2 (en) Method and apparatus of open set recognition and a computer readable storage medium
CN112862024B (zh) 一种文本识别方法及系统
CN111275038A (zh) 图像文本识别方法、装置、计算机设备及计算机存储介质
CN109858333B (zh) 图像处理方法、装置、电子设备及计算机可读介质
CN110598019B (zh) 重复图像识别方法及装置
CN113159013B (zh) 基于机器学习的段落识别方法、装置、计算机设备和介质
CN114092938B (zh) 图像的识别处理方法、装置、电子设备及存储介质
CN113569840A (zh) 基于自注意力机制的表单识别方法、装置及存储介质
US20230410544A1 (en) Classifying pharmacovigilance documents using image analysis
CN113420690A (zh) 基于感兴趣区域的静脉识别方法、装置、设备及存储介质
CN113947773A (zh) 文字识别模型的训练方法及装置
Viedma et al. Relevant features for gender classification in NIR periocular images
CN113705468A (zh) 基于人工智能的数字图像识别方法及相关设备
CN117076455A (zh) 一种基于智能识别的保单结构化存储方法、介质及系统
CN115880702A (zh) 数据处理方法、装置、设备、程序产品及存储介质
CN112200216A (zh) 汉字识别方法、装置、计算机设备和存储介质
CN112287723A (zh) 基于深度学习的活体检测方法、装置及存储介质
Lateef et al. Facial Recognition Technology-Based Attendance Management System Application in Smart Classroom
US11789990B1 (en) Automated splitting of document packages and identification of relevant documents
CN115497112B (zh) 表单识别方法、装置、设备以及存储介质
WO2022156088A1 (zh) 指纹签名生成方法、装置、电子设备及计算机存储介质
CN113569738A (zh) 制表信息提取处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220707

Address after: 201615 room 1904, G60 Kechuang building, No. 650, Xinzhuan Road, Songjiang District, Shanghai

Patentee after: Shanghai Mingping Medical Data Technology Co.,Ltd.

Address before: 102400 no.86-n3557, Wanxing Road, Changyang, Fangshan District, Beijing

Patentee before: Mingpinyun (Beijing) data Technology Co.,Ltd.

TR01 Transfer of patent right