CN111695371B - 一种表格识别的方法、装置、电子设备及存储介质 - Google Patents

一种表格识别的方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111695371B
CN111695371B CN201910183542.XA CN201910183542A CN111695371B CN 111695371 B CN111695371 B CN 111695371B CN 201910183542 A CN201910183542 A CN 201910183542A CN 111695371 B CN111695371 B CN 111695371B
Authority
CN
China
Prior art keywords
document
neural network
network model
user
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910183542.XA
Other languages
English (en)
Other versions
CN111695371A (zh
Inventor
邓斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Guangzhou Kingsoft Mobile Technology Co Ltd
Original Assignee
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Guangzhou Kingsoft Mobile Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Office Software Inc, Zhuhai Kingsoft Office Software Co Ltd, Guangzhou Kingsoft Mobile Technology Co Ltd filed Critical Beijing Kingsoft Office Software Inc
Priority to CN201910183542.XA priority Critical patent/CN111695371B/zh
Publication of CN111695371A publication Critical patent/CN111695371A/zh
Application granted granted Critical
Publication of CN111695371B publication Critical patent/CN111695371B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Facsimiles In General (AREA)

Abstract

本发明实施例提供了一种表格识别的方法、装置、电子设备及存储介质,包括:获取用户打开的文档;将每一页文档转换成图片;将每一张图片输入到预先训练好的神经网络模型,对所述每一张图片进行识别;根据神经网络模型输出的识别结果,判断所述文档中是否有表格;如果所述文档中有表格,则显示表格操作提示信息。可见,应用本发明实施例,可以识别文档中的表格,对表格相关的操作进行提示,提高用户体验。

Description

一种表格识别的方法、装置、电子设备及存储介质
技术领域
本发明涉及文档中的表格进行处理的技术领域,特别是涉及一种表格识别的方法、装置、电子设备及存储介质。
背景技术
很多文档都包含表格。例如:有的PDF(Portable Document Format,便携式文档格式)文档中包含表格。
目前,文档处理软件都不能识别文档中是否有表格,也就不能在文档中有表格时提示用户,用户体验不够高。
发明内容
本发明实施例的目的在于提供一种表格识别的方法、装置、电子设备及存储介质,以提高用户体验。具体技术方案如下:
第一方面,本发明提供了一种表格识别的方法,所述方法包括:
获取用户打开的F文档;
将每一页文档转换成图片;
将每一张图片输入到预先训练好的神经网络模型,对所述每一张图片进行识别;
根据神经网络模型输出的识别结果,判断所述文档中是否有表格;
如果所述文档中有表格,则显示表格操作提示信息。
可选的,所述获取用户打开的文档的步骤,包括:
判断是否检测到表格识别指令;
如果是,则获取用户打开的文档。
可选的,所述判断是否检测到表格识别指令的步骤之前,还包括:
判断文档显示界面中预设的表格识别按钮是否被用户按下;
如果是,则生成表格识别指令。
可选的,所述获取用户打开的文档的步骤,包括:
判断是否执行打开文档的操作;
如果是,则在打开所述文档后,获取用户打开的文档。
可选的,所述神经网络模型,是预先将多个包含表格的文档转换图片和多个不包含表格的文档转换图片作为样本,进行训练获得的。
可选的,所述表格操作提示信息中包含:文档中有表格,且表格能够进行操作的提示信息。
可选的,
所述表格操作提示信息中还包含:是否对表格进行操作的选项;
在所述如果所述文档中有表格,则显示表格操作提示信息的步骤之后,还包括:
如果接收到用户选择对表格进行操作的指令,则将页面切换到所述文档中包含表格的页面;或以预设的方式突出显示文档中的表格。
可选的,所述文档为PDF文档。
第二方面,本发明提供了一种表格识别的装置,所述装置包括:
文档获取模块,用于获取用户打开的文档;
图片转换模块,用于将每一页文档转换成图片;
图片识别模块,用于将每一张图片输入到预先训练好的神经网络模型,对所述每一张图片进行识别;
第一判断模块,用于根据神经网络模型输出的识别结果,判断所述文档中是否有表格;
信息显示模块,用于如果所述文档中有表格,则显示表格操作提示信息。
可选的,所述文档获取模块,具体用于:
判断是否检测到表格识别指令;
如果是,则获取用户打开的文档。
可选的,所述装置还包括:
第二判断模块,用于在所述文档获取模块判断是否检测到表格识别指令之前,判断文档显示界面中预设的表格识别按钮是否被用户按下;如果是,则生成表格识别指令。
可选的,所述文档获取模块,具体用于:
判断是否执行打开文档的操作;
如果是,则在打开所述文档后,获取用户打开的文档。
可选的,所述神经网络模型,是预先将多个包含表格的文档转换图片和多个不包含表格的文档转换图片作为样本,进行训练获得的。
可选的,所述表格操作提示信息中包含:文档中有表格,且表格能够进行操作的提示信息。
可选的,
所述表格操作提示信息中还包含:是否对表格进行操作的选项;
所述装置还包括:
表格操作模块,用于在所述信息显示模块显示表格操作提示信息之后,如果接收到用户选择对表格进行操作的指令,将页面切换到所述文档中包含表格的页面;或以预设的方式突出显示文档中的表格。
可选的,所述文档为PDF文档。
第三方面,本发明提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求任一所述表格识别的方法步骤。
第四方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求任一所述表格识别的方法步骤。
本发明实施例提供的表格识别的方法、装置、电子设备及存储介质,可以获取用户打开的文档;将每一页文档转换成图片;将每一张图片输入到预先训练好的神经网络模型,对所述每一张图片进行识别;根据神经网络模型输出的识别结果,判断所述文档中是否有表格;如果所述文档中有表格,则显示表格操作提示信息。可见,应用本发明实施例,可以识别文档中的表格,对表格相关的操作进行提示,提高用户体验。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的表格识别的方法的一种流程图;
图2为本发明实施例提供的表格识别的方法的另一种流程图;
图3为本发明实施例提供的表格识别的方法的再一种流程图;
图4为本发明实施例提供的表格识别的装置的结构示意图;
图5为本发明实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有技术中,文档处理软件都不能识别文档中是否有表格,也就不能在文档中有表格时提示用户,降低了用户体验。
为了解决上述问题,本发明实施例提供了一种表格识别的方法和装置。
本发明实施例所提供的一种表格识别的方法可以应用于任意需要对表格识别的电子设备,在此不做具体限定。为了描述方便,以下简称电子设备。
本发明实施例提供的一种表格识别的方法,如图1所示,该方法的具体处理流程包括:
步骤S101,获取用户打开的文档。
本发明实施例可以应用于各种电子设备中,如:电脑或移动终端等。
可实施的,电子设备可以获取用户打开的文档。可实施的,所述文档可以为PDF文档。
步骤S102,将每一页文档转换成图片。
可实施的,电子设备可以将每一页文档转换成图片。在一种实施方式中,可以将文档中每一页页面中的元素,例如文字、图像、路径和阴影等渲染到一张空的图片中,循环处理所有的页面。
步骤S103,将每一张图片输入到预先训练好的神经网络模型,对所述每一张图片进行识别。
可实施的,所述预先训练好的神经网络模型,是预先将多个包含表格的文档转换图片和多个不包含表格的文档转换图片作为样本,进行训练获得的。
具体的在一种实施方式中可以采用TensorFlow这一神经网络模型来对表格进行识别。
实施的,预先训练好的神经网络模型可以为预先对神经网络进行训练得到的二分类模型。将待识别的所述图片输入该预先训练好的神经网络模型后,如果所述神经网络模型的输出为1,则表示所述图片中有表格;如果所述神经网络模型的输出为0,则表示所述图片中无表格。
所述神经网络模型,采用如下步骤训练获得:
获取多个包含表格的文档转换图片和多个不包含表格的文档转换图片作为训练样本,如果样本中有表格,则真实的结果为1,如果无表格则真实的结果为0。
将多个训练样本输入待训练的神经网络模型;
所述待训练的神经网络模型输出所述样本中是否有表格的预测结果;预测结果为1或0;
使用该训练样本中是否有表格的真实结果、输出的是否有表格的预测结果和预设的损失函数计算损失值;
根据损失值判断待训练的神经网络模型是否收敛;如果收敛,则待训练的神经网络模型为训练完成的神经网络模型;
如果未收敛,则调整待训练的神经网络模型的网络参数,返回所述将多个训练样本输入待训练的神经网络模型的步骤。
步骤S104,根据神经网络模型输出的识别结果,判断所述文档中是否有表格。
可实施的,可以根据神经网络模型输出的识别结果,判断所述文档中是否有表格。在一种具体的实施方式中,如果神经网络模型输出的识别结果为1,则图片中有表格;如果神经网络模型输出的识别结果为0,则图片中无表格。
如果判断的结果为是,即文档中有表格,则执行步骤S105;如果判断的结果为否,即文档中没有表格,则结束本次操作。
步骤S105,显示表格操作提示信息。
可实施的,可以在文档显示界面中显示包含表格操作提示信息的提示框。具体的,在一种实施方式中,所述表格操作提示信息中可以包含:文档中有表格,且表格能够进行操作的提示信息。
可见,应用本发明实施例,可以识别文档中的表格,提醒用户可以对表格进行相关的操作,提高了用户体验。
本发明实施例中的文档可以是PDF文档,以下以对PDF文件进行表格识别为例进行详细说明。
本发明实施例提供的表格识别的方法的另一种流程图,如图2所示,包括:
步骤S201,判断是否执行打开PDF文档的操作。
可实施的,电子设备可以先判断用户是否进行打开PDF文档的操作;
如果是,即执行打开PDF文档的操作,则可以生成PDF文档打开指令,并可以根据所述文档打开指令执行打开所述PDF文档的操作,执行步骤S202;如果判断结果为否,即不执行打开PDF文档的操作,则结束本次操作。
步骤S202,在打开所述PDF文档后,获取用户打开的PDF文档。
步骤S203,将每一页PDF文档转换成图片。
步骤S204,将每一张图片输入到预先训练好的神经网络模型,对所述每一张图片进行识别。
实际应用中,步骤S204可以与步骤S103相同,这里不再赘述。
步骤S205,根据神经网络模型输出的识别结果,判断所述PDF文档中是否有表格。
实际应用中,步骤S205可以与步骤S104相同,这里不再赘述。
如果判断的结果为是,即PDF文档中有表格,则执行步骤S206;如果判断的结果为否,即PDF文档中没有表格,则结束本次操作。
步骤S206,显示表格操作提示信息。
实际应用中,步骤S205可以与步骤S105相同。
可见,应用本发明实施例,在打开文档时可以识别文档中的表格,提醒用户可以对表格进行相关的操作,可以提高用户体验。
本发明实施例提供的表格识别的方法的再一种流程图,如图3所示,包括:
步骤S301,判断文档显示界面中预设的表格识别按钮是否被用户按下。
在一种实施方式中,电子设备可以判断文档显示界面中预设的表格识别按钮是否被用户按下,其中文档显示界面中预设的表格识别按钮可以显示在文档显示界面的工具栏中,表格识别按钮可以预先设置。
如果判断的结果为是,即文档显示界面中预设的表格识别按钮被用户按下,则执行步骤S302;如果判断的结果为否,即文档显示界面中预设的表格识别按钮没被用户按下,则结束本次操作。
步骤S302,生成表格识别指令。
可实施的,如果文档显示界面中预设的表格识别按钮被用户按下,则可以生成表格识别指令。
S303,判断是否检测到表格识别指令。
如果判断的结果为是,即检测到表格识别指令,则执行步骤S304;如果判断的结果为否,即没检测到表格识别指令,则结束本次操作。
步骤S304,获取用户打开的PDF文档。
步骤S305,将每一页PDF文档转换成图片。
实际应用中,步骤S305可以与步骤S102相同。
步骤S306,将每一张图片输入到预先训练好的神经网络模型,对所述每一张图片进行识别。
实际应用中,步骤S306可以与步骤S103相同。
步骤S307,根据神经网络模型输出的识别结果,判断所述PDF文档中是否有表格。
实际应用中,步骤S307可以与步骤S104相同。
如果判断的结果为是,即PDF文档中有表格,则执行步骤S308;如果判断的结果为否,即PDF文档中没有表格,则结束本次操作。
步骤S308,显示表格操作提示信息。
可实施的,可以在文档显示界面中显示包含表格操作提示信息的提示框。具体的,在一种实施方式中,所述表格操作提示信息中可以包含:文档中有表格,且表格能够进行编辑操作的提示信息;所述表格操作提示信息中还可以包含:是否对表格进行操作的选项。
目前,刚加入可以对PDF文档中的表格进行编辑的操作功能时间较短,一些用户并不知道PDF文档中的表格是可以对其进行编辑操作,应用本实施例可以提醒用户可以对表格进行操作,进一步提高用户体验。
而且,用户可以选择是否对表格进行操作,如果用户选择了对表格进行操作,则执行步骤S309;如果用户选择不对表格进行操作,则结束本次操作。
步骤S309,如果接收到用户选择对表格进行操作的指令,则将页面切换到所述PDF文档中包含表格的页面;或以预设的方式突出显示PDF文档中的表格。
可实施的,当用户浏览表格操作提示信息时,如果接收到用户选择对表格进行操作的指令,则可以将页面切换到所述PDF文档中包含表格的页面,也可以以预设的方式突出显示PDF文档中的表格。
具体的,电子设备可以以预设的颜色,标记PDF文档中的表格,也可以为PDF文档中的表格添加边框,以突出显示PDF文档中的表格,在实际操作中,以预设的方式突出显示PDF文档中的表格的方法并不限于此。
可见,应用本发明实施例,在打开文档时可以识别文档中的表格,可以提醒用户可以对表格进行相关的操作,可以提高用户体验。
而且,基于本发明实施例,如果文档中有表格,除了可以显示文档中有表格,且表格能够进行操作的提示信息之外,还可以根据用户的选择,将页面切换到所述PDF文档中包含表格的页面,也可以以预设的方式突出显示PDF文档中的表格,能够提高用户体验。
本发明实施例提供的表格识别的装置的结构示意图,如图4所示,所述装置包括:
文档获取模块401,用于获取用户打开的文档;
图片转换模块402,用于将每一页文档转换成图片;
图片识别模块403,用于将每一张图片输入到预先训练好的神经网络模型,对所述每一张图片进行识别;
第一判断模块404,用于根据神经网络模型输出的识别结果,判断所述文档中是否有表格;
信息显示模块405,用于如果所述文档中有表格,则显示表格操作提示信息。
可选的,所述文档获取模块,具体用于:
判断是否检测到表格识别指令;
如果是,则获取用户打开的文档。
可选的,所述装置还包括:
第二判断模块,用于在所述文档获取模块判断是否检测到表格识别指令之前,判断文档显示界面中预设的表格识别按钮是否被用户按下;如果是,则生成表格识别指令。
可选的,所述文档获取模块,具体用于:
判断是否执行打开文档的操作;
如果是,则在打开所述文档后,获取用户打开的文档。
可选的,所述神经网络模型,是预先将多个包含表格的文档转换图片和多个不包含表格的文档转换图片作为样本,进行训练获得的。
可选的,所述表格操作提示信息中包含:文档中有表格,且表格能够进行操作的提示信息。
可选的,
所述表格操作提示信息中还包含:是否对表格进行操作的选项;
所述装置还包括:
表格操作模块,用于在所述信息显示模块显示表格操作提示信息之后,如果接收到用户选择对表格进行操作的指令,将页面切换到所述文档中包含表格的页面;或以预设的方式突出显示文档中的表格。
可选的,所述文档为PDF文档。
可见,应用本发明实施例,可以识别文档中的表格,对表格相关的操作进行提示,可以提高用户体验。
本发明实施例还提供了一种电子设备,如图5所示,包括处理器501、通信接口502、存储器503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信,
存储器503,用于存放计算机程序;
处理器501,用于执行存储器503上所存放的程序时,实现如下步骤:
获取用户打开的文档;
将每一页文档转换成图片;
将每一张图片输入到预先训练好的神经网络模型,对所述每一张图片进行识别;
根据神经网络模型输出的识别结果,判断所述文档中是否有表格;
如果所述文档中有表格,则显示表格操作提示信息。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一表格识别的方法的步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一表格识别的方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质及计算机程序产品等实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (16)

1.一种表格识别的方法,其特征在于,包括:
获取用户打开的文档;
将每一页文档转换成图片;
将每一张图片输入到预先训练好的神经网络模型,对所述每一张图片进行识别;
根据神经网络模型输出的识别结果,判断所述文档中是否有表格;其中,针对每一张图片,所述神经网络模型输出的识别结果表示:该图片中是否有表格;
如果所述文档中有表格,则显示表格操作提示信息;
所述神经网络模型,是预先将多个包含表格的文档转换图片和多个不包含表格的文档转换图片作为样本,进行训练获得的;
所述神经网络模型的训练过程包括:使用所述样本中是否有表格的真实结果、输出的是否有表格的预测结果和预设的损失函数计算损失值;根据损失值判断待训练的神经网络模型是否收敛;当收敛时,确定待训练的神经网络模型为训练完成的神经网络模型;当未收敛时,调整待训练的神经网络模型的网络参数,返回将所述样本输入待训练的神经网络模型的步骤。
2.根据权利要求1所述的方法,其特征在于,所述获取用户打开的文档的步骤,包括:
判断是否检测到表格识别指令;
如果是,则获取用户打开的文档。
3.根据权利要求2所述的方法,其特征在于,所述判断是否检测到表格识别指令的步骤之前,还包括:
判断文档显示界面中预设的表格识别按钮是否被用户按下;
如果是,则生成表格识别指令。
4.根据权利要求1所述的方法,其特征在于,所述获取用户打开的文档的步骤,包括:
判断是否执行打开文档的操作;
如果是,则在打开所述文档后,获取用户打开的文档。
5.根据权利要求1所述的方法,其特征在于,
所述表格操作提示信息中包含:文档中有表格,且表格能够进行操作的提示信息。
6.根据权利要求5所述的方法,其特征在于,
所述表格操作提示信息中还包含:是否对表格进行操作的选项;
在所述如果所述文档中有表格,则显示表格操作提示信息的步骤之后,还包括:
如果接收到用户选择对表格进行操作的指令,则将页面切换到所述文档中包含表格的页面;或以预设的方式突出显示文档中的表格。
7.根据权利要求1所述的方法,其特征在于,所述文档为PDF文档。
8.一种表格识别的装置,其特征在于,所述装置包括:
文档获取模块,用于获取用户打开的文档;
图片转换模块,用于将每一页文档转换成图片;
图片识别模块,用于将每一张图片输入到预先训练好的神经网络模型,对所述每一张图片进行识别;
第一判断模块,用于根据神经网络模型输出的识别结果,判断所述文档中是否有表格;其中,针对每一张图片,所述神经网络模型输出的识别结果表示:该图片中是否有表格;
信息显示模块,用于如果所述文档中有表格,则显示表格操作提示信息;
所述神经网络模型,是预先将多个包含表格的文档转换图片和多个不包含表格的文档转换图片作为样本,进行训练获得的;
所述神经网络模型的训练过程包括:使用所述样本中是否有表格的真实结果、输出的是否有表格的预测结果和预设的损失函数计算损失值;根据损失值判断待训练的神经网络模型是否收敛;当收敛时,确定待训练的神经网络模型为训练完成的神经网络模型;当未收敛时,调整待训练的神经网络模型的网络参数,返回将所述样本输入待训练的神经网络模型的步骤。
9.根据权利要求8所述的装置,其特征在于,所述文档获取模块,具体用于:
判断是否检测到表格识别指令;
如果是,则获取用户打开的文档。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二判断模块,用于在所述文档获取模块判断是否检测到表格识别指令之前,判断文档显示界面中预设的表格识别按钮是否被用户按下;如果是,则生成表格识别指令。
11.根据权利要求8所述的装置,其特征在于,所述文档获取模块,具体用于:
判断是否执行打开文档的操作;
如果是,则在打开所述文档后,获取用户打开的文档。
12.根据权利要求8所述的装置,其特征在于,
所述表格操作提示信息中包含:文档中有表格,且表格能够进行操作的提示信息。
13.根据权利要求12所述的装置,其特征在于,
所述表格操作提示信息中还包含:是否对表格进行操作的选项;
所述装置还包括:
表格操作模块,用于在所述信息显示模块显示表格操作提示信息之后,如果接收到用户选择对表格进行操作的指令,将页面切换到所述文档中包含表格的页面;或以预设的方式突出显示文档中的表格。
14.根据权利要求8所述的装置,其特征在于,所述文档为PDF文档。
15.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一所述表格识别的方法步骤。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一所述表格识别的方法步骤。
CN201910183542.XA 2019-03-12 2019-03-12 一种表格识别的方法、装置、电子设备及存储介质 Active CN111695371B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910183542.XA CN111695371B (zh) 2019-03-12 2019-03-12 一种表格识别的方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910183542.XA CN111695371B (zh) 2019-03-12 2019-03-12 一种表格识别的方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111695371A CN111695371A (zh) 2020-09-22
CN111695371B true CN111695371B (zh) 2024-05-03

Family

ID=72475281

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910183542.XA Active CN111695371B (zh) 2019-03-12 2019-03-12 一种表格识别的方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111695371B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258198A (zh) * 2013-04-26 2013-08-21 四川大学 一种表格文档图像中字符提取方法
CN104517112A (zh) * 2013-09-29 2015-04-15 北大方正集团有限公司 一种表格识别方法与系统
CN108846385A (zh) * 2018-07-10 2018-11-20 浪潮通用软件有限公司 基于卷积-反卷积神经网络的图像识别、校正方法和装置
CN109086714A (zh) * 2018-07-31 2018-12-25 国科赛思(北京)科技有限公司 表格识别方法、识别系统及计算机装置
CN109446487A (zh) * 2018-11-01 2019-03-08 北京神州泰岳软件股份有限公司 一种解析便携式文档格式文档表格的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9679198B2 (en) * 2015-11-05 2017-06-13 International Business Machines Corporation Ingestion plan based on table uniqueness

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258198A (zh) * 2013-04-26 2013-08-21 四川大学 一种表格文档图像中字符提取方法
CN104517112A (zh) * 2013-09-29 2015-04-15 北大方正集团有限公司 一种表格识别方法与系统
CN108846385A (zh) * 2018-07-10 2018-11-20 浪潮通用软件有限公司 基于卷积-反卷积神经网络的图像识别、校正方法和装置
CN109086714A (zh) * 2018-07-31 2018-12-25 国科赛思(北京)科技有限公司 表格识别方法、识别系统及计算机装置
CN109446487A (zh) * 2018-11-01 2019-03-08 北京神州泰岳软件股份有限公司 一种解析便携式文档格式文档表格的方法及装置

Also Published As

Publication number Publication date
CN111695371A (zh) 2020-09-22

Similar Documents

Publication Publication Date Title
CN111444750B (zh) 一种pdf文档识别方法、装置及电子设备
CN109410932B (zh) 基于html5网页的语音操作方法和装置
CN111476863B (zh) 一种黑白漫画上色的方法、装置、电子设备及存储介质
CN111414727B (zh) 一种pdf文档页眉页脚的编辑方法、装置及电子设备
CN110956016B (zh) 一种文档内容格式的调整方法、装置及电子设备
CN105868166A (zh) 一种正则表达式的生成方法及系统
CN105809162B (zh) 获取wifi热点、图片关联信息的方法和装置
CN110968374A (zh) 一种文档信息的显示方法、装置、电子设备及存储介质
CN111222368A (zh) 一种识别文档段落的方法、装置及电子设备
CN110569924A (zh) 图标处理方法、装置、可读存储介质及计算机设备
US20190295532A1 (en) Remote Generation of Executable Code for a Client Application Based on Natural Language Commands Captured at a Client Device
CN111695371B (zh) 一种表格识别的方法、装置、电子设备及存储介质
CN112329409B (zh) 一种单元格颜色转换方法、装置及电子设备
CN110363189B (zh) 一种文档内容修复方法、装置、电子设备及可读存储介质
CN110633457A (zh) 一种内容替换方法、装置、电子设备及可读存储介质
CN110895924B (zh) 一种文档内容朗读方法、装置、电子设备及可读存储介质
CN109992749A (zh) 一种文字显示方法、装置、电子设备及可读存储介质
CN110827815B (zh) 一种语音识别方法、终端、系统以及计算机存储介质
KR101587353B1 (ko) 디스플레이 장치 및 그의 동작 방법
CN111563364B (zh) 一种章节标题样式转换方法、装置、电子设备及存储介质
CN112784527A (zh) 一种文档合并方法、装置及电子设备
CN112394857B (zh) 一种幻灯片ppt文档的格式转换方法、装置及电子设备
CN111949184A (zh) 一种新建文档的方法及装置
CN111414627A (zh) 文件打开模式转换方法、装置、电子设备及存储介质
CN112162711B (zh) 图像文件转换方法、装置、电子设备和计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant