CN116127927B - 一种网页表格转pdf文件的方法 - Google Patents

一种网页表格转pdf文件的方法 Download PDF

Info

Publication number
CN116127927B
CN116127927B CN202310348400.0A CN202310348400A CN116127927B CN 116127927 B CN116127927 B CN 116127927B CN 202310348400 A CN202310348400 A CN 202310348400A CN 116127927 B CN116127927 B CN 116127927B
Authority
CN
China
Prior art keywords
coordinate
coordinates
inter
continuity
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310348400.0A
Other languages
English (en)
Other versions
CN116127927A (zh
Inventor
王心安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhilin Technology Co ltd
Beijing Zhilin Technology Co ltd
Original Assignee
Zhilin Technology Co ltd
Beijing Zhilin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhilin Technology Co ltd, Beijing Zhilin Technology Co ltd filed Critical Zhilin Technology Co ltd
Priority to CN202310348400.0A priority Critical patent/CN116127927B/zh
Publication of CN116127927A publication Critical patent/CN116127927A/zh
Application granted granted Critical
Publication of CN116127927B publication Critical patent/CN116127927B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/157Transformation using dictionaries or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及网页内容转换技术领域,尤其涉及一种网页表格转PDF文件的方法,根据网页表格的表格线交点坐标的数量确定的网页表格的结构复杂度计算选取表格线交点坐标的坐标数量占比,根据结构复杂度和坐标数量占比确定的坐标间连线的连贯度检测参量选取合适的检测步长,以及根据坐标数量占比选取相邻的表格线交点坐标的检测交点坐标范围,提取检测交点坐标范围的表格线交点坐标的坐标间连线,并根据检测步长对坐标间连线进行检测,获得网页表格的坐标间连线的连贯度,并根据坐标间连线的连贯度确定的等比例缩放系数对网页表格进行等比例缩放,避免了网页浏览器不兼容导致的网页表格显示异常问题,从而提高了网页表格转PDF文件的格式准确率。

Description

一种网页表格转PDF文件的方法
技术领域
本发明涉及网页内容转换技术领域,尤其涉及一种网页表格转PDF文件的方法。
背景技术
在当前的网络环境中,许多网络平台会收录并展示论文、报表、花名册等附带大量的表格数据信息,用户往往会选择将这些网页表格转为PDF文件以方便作为表格模板进而方便日后直接使用,但是不同的浏览器对网页的兼容性不同,浏览器打印的效果不尽相同,表格格式的准确性更是难以保证。
发明内容
本发明旨在至少解决相关技术中存在的技术问题之一。为此,本发明提供一种网页表格转PDF文件的方法,包括以下步骤:
步骤S1,获取网页表格的表格线交点坐标,根据所述表格线交点坐标的数量确定所述网页表格的结构复杂度G,并根据所述结构复杂度G与预设结构复杂度的对比结果确定选取所述表格线交点坐标的坐标数量占比;
步骤S2,根据所述结构复杂度G和坐标数量占比确定坐标间连线的连贯度检测参量W,根据所述坐标间连线的连贯度检测参量W与预设坐标间连线的连贯度检测参量的对比结果确定检测步长;
步骤S3,根据所述坐标数量占比选取相邻的所述表格线交点坐标的检测交点坐标范围;
步骤S4,提取所述检测交点坐标范围的所述表格线交点坐标的坐标间连线,根据所述检测步长对所述坐标间连线进行检测,获得所述网页表格的坐标间连线的连贯度C;
步骤S5,根据所述坐标间连线的连贯度C确定所述网页表格的等比例缩放系数,并根据所述等比例缩放系数对所述网页表格进行等比例缩放;
步骤S6,将调整后的所述网页表格转为PDF文件。
进一步地,在所述步骤S1中,所述表格线交点坐标包括单向垂直交点坐标、双向垂直交点坐标以及十字交叉垂直交点坐标。
进一步地,在所述步骤S1中,通过公式(1)计算所述结构复杂度G,
Figure SMS_1
其中,Na表示所述单向垂直交点坐标数量,Na0表示单向垂直交点坐标数量的对比参量,Nb表示所述双向垂直交点坐标数量,Nb0表示双向垂直交点坐标数量的对比参量,Nc表示十字交叉垂直交点坐标数量,Nc0表示十字交叉垂直交点数量的对比参量。
进一步地,在所述步骤S1中,所述坐标数量占比包括第一坐标数量占比P1、第二坐标数量占比P2以及第三坐标数量占比P3,所述预设结构复杂度包括第一预设结构复杂度G1和第二预设结构复杂度G2,设定P1<P2<P3且G1<G2,
若G<G1,确定所述坐标数量占比为P1;
若G1≤G<G2,确定所述坐标数量占比为P2;
若G2≤G,确定所述坐标数量占比为P3。
进一步地,在所述步骤S2中,通过公式(2)计算所述坐标间连线的连贯度检测参量W,
Figure SMS_2
其中i=1,2,3。
进一步地,在所述步骤S2中,所述预设坐标间连线的连贯度检测参量包括第一预设坐标间连线的连贯度检测参量W1和第二预设坐标间连线的连贯度检测参量W2,所述检测步长包括第一检测步长L1、第二检测步长L2以及第三检测步长L3,设定W1<W2且L1>L2>L3,
若W<W1,确定所述检测步长为L1;
若W1≤W<W2,确定所述检测步长为L2;
若W2≤W,确定所述检测步长为L3。
进一步地,在所述步骤S4中,通过公式(3)计算所述坐标间连线的连贯度C,
Figure SMS_3
其中,
Figure SMS_4
表示第k个所述坐标间连线的不连贯位置数量,/>
Figure SMS_5
表示第k个所述坐标间连线的长度,/>
Figure SMS_6
表示第k个所述坐标间连线的检测步长,j=1,2,3;/>
Figure SMS_7
表示所述坐标间连线的数量。
进一步地,在所述步骤S5中,根据所述坐标间连线的连贯度C与预设坐标间连线的连贯度的对比结果确定所述网页表格的等比例缩放系数,并根据所述等比例缩放系数对所述网页表格进行等比例缩放。
进一步地,所述预设坐标间连线的连贯度包括第一预设坐标间连线的连贯度C1和第二预设坐标间连线的连贯度C2,所述等比例缩放系数包括第一等比例缩放系数K1和第二等比例缩放系数K2,设定C1<C2且110%<K1<K2<120%,
若C1≤C≤C2,确定所述等比例缩放系数为K1;
若C<C1,确定所述等比例缩放系数为K2;
若C>C2,确定不对所述网页表格进行等比例缩放。
本发明实施例中的上述一个或多个技术方案,至少具有如下技术效果之一:
获取网页表格的表格线交点坐标,根据所述表格线交点坐标的数量确定所述网页表格的结构复杂度,并根据所述结构复杂度与预设结构复杂度的对比结果确定选取所述表格线交点坐标的坐标数量占比,提高了对网页表格调整分析的准确性。
进一步地,根据所述结构复杂度和坐标数量占比确定坐标间连线的连贯度检测参量,根据所述坐标间连线的连贯度检测参量与预设坐标间连线的连贯度检测参量的对比结果确定检测步长,进一步提高了对网页表格调整分析的准确性。
进一步地,根据所述坐标数量占比选取相邻的所述表格线交点坐标的检测交点坐标范围,提高了所述检测交点坐标范围选取的精准度,从而进一步提高了对网页表格调整分析的准确性。
进一步地,提取所述检测交点坐标范围的所述表格线交点坐标的坐标间连线,根据所述检测步长对所述坐标间连线进行检测,获得所述网页表格的坐标间连线的连贯度,避免了网页浏览器不兼容导致的网页表格显示异常问题,保证了网页表格能够以正常表格形式导出成PDF,从而提高了网页表格转PDF文件的格式准确率。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的网页表格转PDF文件的方法的步骤流程图。
图2是本发明提供的网表格转PDF文件的方法中所述的表格线交点坐标位置示意图。
附图标记:1-单向垂直交点坐标,2-双向垂直交点坐标,3-十字交叉垂直交点坐标。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。以下实施例用于说明本发明,但不能用来限制本发明的范围。
在本发明实施例的描述中,需要说明的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明实施例和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明实施例的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明实施例的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明实施例中的具体含义。
在本发明实施例中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明实施例的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
请参阅图1至图2,本发明实施例提供的网页表格转PDF文件的方法,包括以下步骤:
步骤S1,获取网页表格的表格线交点坐标,根据表格线交点坐标的数量确定网页表格的结构复杂度G,并根据结构复杂度G与预设结构复杂度的对比结果确定选取表格线交点坐标的坐标数量占比。
具体而言,获取网页表格的表格线交点坐标的方式有多种,一种优选的方案,可抓取网页表格的图像,通过图像识别获取表格线交点坐标。
具体而言,结构复杂度G为网页表格转PDF过程难度的评价参量,通过表格线交点坐标的数量确定网页表格的结构复杂度G的原理是,表格线交点越多,表明网页表格的行列数量越多,单元格内填写的文字内容越密集,网页表格转PDF过程难度越大,即结构复杂度G的数值越大,此时需要考虑选取表格线交点坐标参数的坐标数量占比越大。
具体而言,预设结构复杂度为利用结构复杂度G评价网页表格转PDF过程难度的数值评价区间,通常结构复杂度G应包含在预设结构复杂度数值范围内。
具体而言,在步骤S1中,表格线交点坐标包括单向垂直交点坐标1双向垂直交点坐标2以及十字交叉垂直交点坐标3。
具体而言,坐标数量占比包括第一坐标数量占比P1、第二坐标数量占比P2以及第三坐标数量占比P3,预设结构复杂度包括第一预设结构复杂度G1和第二预设结构复杂度G2,设定P1<P2<P3且G1<G2,
若G<G1,确定坐标数量占比为P1;
若G1≤G<G2,确定坐标数量占比为P2;
若G2≤G,确定坐标数量占比为P3。
一种优选的方案,在步骤S1中可通过公式(1)计算结构复杂度G,
Figure SMS_8
其中,Na表示单向垂直交点坐标数量,Na0表示单向垂直交点坐标数量的对比参量,Nb表示双向垂直交点坐标数量,Nb0表示双向垂直交点坐标数量的对比参量,Nc表示十字交叉垂直交点坐标数量,Nc0表示十字交叉垂直交点数量的对比参量。
步骤S2,根据结构复杂度G和坐标数量占比确定坐标间连线的连贯度检测参量W,根据坐标间连线的连贯度检测参量W与预设坐标间连线的连贯度检测参量的对比结果确定检测步长。
具体而言,预设坐标间连线的连贯度检测参量为利用坐标间连线的连贯度检测参量W评价检测坐标间连线的连贯度的工作精准度的数值评价区间,通常坐标间连线的连贯度检测参量W应包含在预设坐标间连线的连贯度检测参量内,坐标间连线的连贯度检测参量W数值越大,坐标间连线的平均距离越短,此时,检测步长的数值越小。
具体而言,在步骤S2中,预设坐标间连线的连贯度检测参量包括第一预设坐标间连线的连贯度检测参量W1和第二预设坐标间连线的连贯度检测参量W2,检测步长包括第一检测步长L1、第二检测步长L2以及第三检测步长L3,设定W1<W2且L1>L2>L3,
若W<W1,确定检测步长为L1;
若W1≤W<W2,确定检测步长为L2;
若W2≤W,确定检测步长为L3。
一种优选的方式,步骤S2中可通过公式(2)计算坐标间连线的连贯度检测参量W,
Figure SMS_9
其中i=1,2,3。
步骤S3,根据坐标数量占比选取相邻的表格线交点坐标的检测交点坐标范围。
步骤S4,提取检测交点坐标范围的表格线交点坐标的坐标间连线,根据检测步长对坐标间连线进行检测,获得网页表格的坐标间连线的连贯度C。
一种优选的方案,通过公式(3)计算坐标间连线的连贯度C,
Figure SMS_10
其中,
Figure SMS_11
表示第k个坐标间连线的不连贯位置数量,/>
Figure SMS_12
表示第k坐标间连线的长度,/>
Figure SMS_13
表示第k个坐标间连线的检测步长,j=1,2,3;/>
Figure SMS_14
表示坐标间连线的数量。
步骤S5,根据坐标间连线的连贯度C确定网页表格的等比例缩放系数,并根据等比例缩放系数对网页表格进行等比例缩放。
具体而言,预设坐标间连线的连贯度包括第一预设坐标间连线的连贯度C1和第二预设坐标间连线的连贯度C2,等比例缩放系数包括第一等比例缩放系数K1和第二等比例缩放系数K2,设定C1<C2且110%<K1<K2<120%,
若C1≤C≤C2,确定等比例缩放系数为K1;
若C<C1,确定等比例缩放系数为K2;
若C>C2,确定不对网页表格进行等比例缩放。
一种优选的方案,在步骤S5中,根据坐标间连线的连贯度C与预设坐标间连线的连贯度的对比结果确定网页表格的等比例缩放系数,并根据等比例缩放系数对网页表格进行等比例缩放。
具体而言,坐标间连线的连贯度C数值越大,网页表格的行表线或列表线存在遮挡或模糊的可能性越大,为了保证网页表格转为PDF时行表线和列表线的清晰度,在等比例缩放时按等比例缩放系数对表格线交点坐标进行调整,并根据调整后的表格线交点坐标进行连线处理以达到对网页表格进行等比例缩放重绘的目的,进而保证了网页表格转PDF文件的效果质量。
步骤S6,将调整后的网页表格转为PDF文件。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (7)

1.一种网页表格转PDF文件的方法,其特征在于,包括以下步骤:
步骤S1,获取网页表格的表格线交点坐标,根据所述表格线交点坐标的数量确定所述网页表格的结构复杂度G,并根据所述结构复杂度G与预设结构复杂度的对比结果确定选取所述表格线交点坐标的坐标数量占比;
步骤S2,根据所述结构复杂度G和坐标数量占比确定坐标间连线的连贯度检测参量W,根据所述坐标间连线的连贯度检测参量W与预设坐标间连线的连贯度检测参量的对比结果确定检测步长;
步骤S3,根据所述坐标数量占比选取相邻的所述表格线交点坐标的检测交点坐标范围;
步骤S4,提取所述检测交点坐标范围的所述表格线交点坐标的坐标间连线,根据所述检测步长对所述坐标间连线进行检测,获得所述网页表格的坐标间连线的连贯度C;
步骤S5,根据所述坐标间连线的连贯度C确定所述网页表格的等比例缩放系数,并根据所述等比例缩放系数对所述网页表格进行等比例缩放;
步骤S6,将调整后的所述网页表格转为PDF文件;
在所述步骤S4中,通过公式(3)计算所述坐标间连线的连贯度C,
Figure QLYQS_1
其中,
Figure QLYQS_2
表示第k个所述坐标间连线的不连贯位置数量,/>
Figure QLYQS_3
表示第k个所述坐标间连线的长度,/>
Figure QLYQS_4
表示第k个所述坐标间连线的检测步长,j=1,2,3;/>
Figure QLYQS_5
表示所述坐标间连线的数量;
在所述步骤S5中,根据所述坐标间连线的连贯度C与预设坐标间连线的连贯度的对比结果确定所述网页表格的等比例缩放系数。
2.根据权利要求1所述的网页表格转PDF文件的方法,其特征在于,在所述步骤S1中,所述表格线交点坐标包括单向垂直交点坐标、双向垂直交点坐标以及十字交叉垂直交点坐标。
3.根据权利要求2所述的网页表格转PDF文件的方法,其特征在于,在所述步骤S1中,通过公式(1)计算所述结构复杂度G,
Figure QLYQS_6
其中,Na表示所述单向垂直交点坐标数量,Na0表示单向垂直交点坐标数量的对比参量,Nb表示所述双向垂直交点坐标数量,Nb0表示双向垂直交点坐标数量的对比参量,Nc表示十字交叉垂直交点坐标数量,Nc0表示十字交叉垂直交点数量的对比参量。
4.根据权利要求3所述的网页表格转PDF文件的方法,其特征在于,在所述步骤S1中,所述坐标数量占比包括第一坐标数量占比P1、第二坐标数量占比P2以及第三坐标数量占比P3,所述预设结构复杂度包括第一预设结构复杂度G1和第二预设结构复杂度G2,设定P1<P2<P3且G1<G2,
若G<G1,确定所述坐标数量占比为P1;
若G1≤G<G2,确定所述坐标数量占比为P2;
若G2≤G,确定所述坐标数量占比为P3。
5.根据权利要求4所述的网页表格转PDF文件的方法,其特征在于,在所述步骤S2中,通过公式(2)计算所述坐标间连线的连贯度检测参量W,
Figure QLYQS_7
其中i=1,2,3。
6.根据权利要求5所述的网页表格转PDF文件的方法,其特征在于,在所述步骤S2中,所述预设坐标间连线的连贯度检测参量包括第一预设坐标间连线的连贯度检测参量W1和第二预设坐标间连线的连贯度检测参量W2,所述检测步长包括第一检测步长L1、第二检测步长L2以及第三检测步长L3,设定W1<W2且L1>L2>L3,
若W<W1,确定所述检测步长为L1;
若W1≤W<W2,确定所述检测步长为L2;
若W2≤W,确定所述检测步长为L3。
7.根据权利要求6所述的网页表格转PDF文件的方法,其特征在于,所述预设坐标间连线的连贯度包括第一预设坐标间连线的连贯度C1和第二预设坐标间连线的连贯度C2,所述等比例缩放系数包括第一等比例缩放系数K1和第二等比例缩放系数K2,设定C1<C2且110%<K1<K2<120%,
若C1≤C≤C2,确定所述等比例缩放系数为K1;
若C<C1,确定所述等比例缩放系数为K2;
若C>C2,确定不对所述网页表格进行等比例缩放。
CN202310348400.0A 2023-04-04 2023-04-04 一种网页表格转pdf文件的方法 Active CN116127927B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310348400.0A CN116127927B (zh) 2023-04-04 2023-04-04 一种网页表格转pdf文件的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310348400.0A CN116127927B (zh) 2023-04-04 2023-04-04 一种网页表格转pdf文件的方法

Publications (2)

Publication Number Publication Date
CN116127927A CN116127927A (zh) 2023-05-16
CN116127927B true CN116127927B (zh) 2023-06-16

Family

ID=86295810

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310348400.0A Active CN116127927B (zh) 2023-04-04 2023-04-04 一种网页表格转pdf文件的方法

Country Status (1)

Country Link
CN (1) CN116127927B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115457581A (zh) * 2022-09-30 2022-12-09 南京燧坤智能科技有限公司 表格提取方法、装置及计算机设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11048867B2 (en) * 2019-09-06 2021-06-29 Wipro Limited System and method for extracting tabular data from a document
CN111368695B (zh) * 2020-02-28 2023-06-20 上海汇航捷讯网络科技有限公司 一种表格结构提取方法
CN112949443B (zh) * 2021-02-24 2023-07-25 平安科技(深圳)有限公司 表格结构识别方法、装置、电子设备及存储介质
CN115186205A (zh) * 2022-06-21 2022-10-14 广东艾矽易信息科技有限公司 网页表格数据提取方法、装置及终端设备
CN114782970B (zh) * 2022-06-22 2022-09-16 广州市新文溯科技有限公司 一种表格提取方法、系统及可读介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115457581A (zh) * 2022-09-30 2022-12-09 南京燧坤智能科技有限公司 表格提取方法、装置及计算机设备

Also Published As

Publication number Publication date
CN116127927A (zh) 2023-05-16

Similar Documents

Publication Publication Date Title
CN110390269B (zh) Pdf文档表格提取方法、装置、设备及计算机可读存储介质
US7231599B2 (en) Template production system, layout system, template production program, layout program, layout template data structure, template production method, and layout method
CN109657221B (zh) 一种文档段落排序方法、排序装置、电子设备及存储介质
CN102855232B (zh) 一种表格分析编改加工方法
CN111914805A (zh) 表格结构化方法、装置、电子设备及存储介质
CN116127927B (zh) 一种网页表格转pdf文件的方法
CN111368695A (zh) 一种表格结构提取方法
CN111597941A (zh) 一种面向大坝缺陷图像的目标检测方法
CN107038199B (zh) 一种绘图方法和装置
US8600175B2 (en) Apparatus and method of processing image including character string
CN115620141A (zh) 一种基于加权可变形卷积目标检测方法和装置
CN111125592B (zh) 应用程序的热力图渲染方法及其装置
Jaklič et al. Automatic digitization of pluviograph strip charts
CN116229236A (zh) 一种基于改进YOLO v5模型的结核杆菌检测方法
CN115830302A (zh) 一种多尺度特征提取融合配电网设备定位识别方法
CN116245810A (zh) 排线焊点缺陷检测方法、设备、存储介质及装置
CN114494240A (zh) 基于多尺度协作深度学习的无砟轨道板裂缝测量方法
CN114676989A (zh) 一种变压器容量校核与评估方法、系统、设备及存储介质
CN114596433A (zh) 一种绝缘子识别方法
US8700995B2 (en) Content conversion system and recording medium storing computer program
CN117591766B (zh) 一种将网页转为可分页的pdf的方法
CN113657214B (zh) 一种基于Mask RCNN的建筑损伤评估方法
CN108563987A (zh) 一种智能移动终端
CN114973299B (zh) 建筑图纸构件识别方法、装置、电子设备及存储介质
CN109145266B (zh) 一种从图片快速生成动态pdf文件的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant