CN101976232B - 一种识别文档中数据表格的方法及装置 - Google Patents
一种识别文档中数据表格的方法及装置 Download PDFInfo
- Publication number
- CN101976232B CN101976232B CN2010102937364A CN201010293736A CN101976232B CN 101976232 B CN101976232 B CN 101976232B CN 2010102937364 A CN2010102937364 A CN 2010102937364A CN 201010293736 A CN201010293736 A CN 201010293736A CN 101976232 B CN101976232 B CN 101976232B
- Authority
- CN
- China
- Prior art keywords
- text
- text block
- module
- data form
- divided
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
Description
Claims (2)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102937364A CN101976232B (zh) | 2010-09-19 | 2010-09-19 | 一种识别文档中数据表格的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102937364A CN101976232B (zh) | 2010-09-19 | 2010-09-19 | 一种识别文档中数据表格的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101976232A CN101976232A (zh) | 2011-02-16 |
CN101976232B true CN101976232B (zh) | 2012-06-20 |
Family
ID=43576118
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010102937364A Expired - Fee Related CN101976232B (zh) | 2010-09-19 | 2010-09-19 | 一种识别文档中数据表格的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101976232B (zh) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722475A (zh) * | 2012-05-09 | 2012-10-10 | 深圳市万兴软件有限公司 | 一种PDF文档中的表格转换成Excel表格的方法 |
CN104063364A (zh) | 2013-03-19 | 2014-09-24 | 福建福昕软件开发股份有限公司北京分公司 | 一种pdf文档识别方法 |
CN105589841B (zh) * | 2016-01-15 | 2018-03-30 | 同方知网(北京)技术有限公司 | 一种pdf文档表格识别的方法 |
CN105912516B (zh) * | 2016-04-01 | 2019-02-05 | 朗坤智慧科技股份有限公司 | 一种从AutoCAD文件中一键式提取表格数据的方法 |
CN108664458B (zh) * | 2017-03-28 | 2022-06-14 | 中科云投科技股份有限公司 | 一种pdf文件表格解析方法及系统 |
CN107679024B (zh) * | 2017-09-11 | 2023-04-18 | 畅捷通信息技术股份有限公司 | 识别表格的方法、系统、计算机设备、可读存储介质 |
CN107977346B (zh) * | 2017-11-23 | 2021-06-15 | 深圳市亿图软件有限公司 | 一种pdf文档编辑方法及终端设备 |
CN108197216A (zh) * | 2017-12-28 | 2018-06-22 | 深圳市巨鼎医疗设备有限公司 | 一种信息处理的方法 |
CN110147537A (zh) * | 2018-02-11 | 2019-08-20 | 鼎复数据科技(北京)有限公司 | 一种基于位置关系的pdf表格抽取方法 |
CN110147697A (zh) * | 2018-02-11 | 2019-08-20 | 鼎复数据科技(北京)有限公司 | 一种基于人机互助的pdf表格提取方法 |
CN108470021B (zh) * | 2018-03-26 | 2022-06-03 | 阿博茨德(北京)科技有限公司 | Pdf文档中表格的定位方法及装置 |
CN108446264B (zh) * | 2018-03-26 | 2022-02-15 | 阿博茨德(北京)科技有限公司 | Pdf文档中的表格矢量解析方法及装置 |
CN109062874B (zh) * | 2018-06-12 | 2022-03-04 | 平安科技(深圳)有限公司 | 财政数据的获取方法、终端设备及介质 |
CN109284495B (zh) * | 2018-11-03 | 2023-02-07 | 上海犀语科技有限公司 | 一种对文本进行无表格线切表的方法及装置 |
CN109558379A (zh) * | 2018-12-03 | 2019-04-02 | 北京中网易企秀科技有限公司 | 一种数据审核方法及装置 |
CN109670461A (zh) * | 2018-12-24 | 2019-04-23 | 广东亿迅科技有限公司 | Pdf文字提取方法、装置、计算机设备和存储介质 |
CN109635172B (zh) * | 2018-12-28 | 2020-06-19 | 北京字节跳动网络技术有限公司 | 在线文档检索方法、装置和电子设备 |
CN110096682B (zh) * | 2019-04-17 | 2023-03-24 | 武汉初心科技有限公司 | 基于modoc数据结构来实现文档中数据的实时协作处理方法 |
CN110287785A (zh) * | 2019-05-20 | 2019-09-27 | 深圳壹账通智能科技有限公司 | 文本结构化信息提取方法、服务器及存储介质 |
CN110210440B (zh) * | 2019-06-11 | 2021-04-27 | 中国农业银行股份有限公司 | 一种表格图像版面分析方法及系统 |
CN110390269B (zh) * | 2019-06-26 | 2023-08-01 | 平安科技(深圳)有限公司 | Pdf文档表格提取方法、装置、设备及计算机可读存储介质 |
CN115828874A (zh) * | 2019-08-05 | 2023-03-21 | 金税桥大数据科技股份有限公司 | 基于图像识别技术的行业表格数字化处理方法 |
CN111160234B (zh) * | 2019-12-27 | 2020-12-08 | 掌阅科技股份有限公司 | 表格识别方法、电子设备及计算机存储介质 |
CN111325110B (zh) * | 2020-01-22 | 2024-04-05 | 平安科技(深圳)有限公司 | 基于ocr的表格版式恢复方法、装置及存储介质 |
CN111626030A (zh) * | 2020-07-28 | 2020-09-04 | 浙江明度智控科技有限公司 | 一种用于医药行业的表格差异化内容分析方法、系统和存储介质 |
CN115618836B (zh) * | 2022-12-15 | 2023-03-31 | 杭州恒生聚源信息技术有限公司 | 无线表格的结构还原方法、装置、计算机设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1732012B1 (en) * | 2005-06-09 | 2007-10-10 | PDFlib GmbH | Method of identifying redundant text in an electronic document |
CN101770446A (zh) * | 2008-12-26 | 2010-07-07 | 北大方正集团有限公司 | 一种版式文件中表格识别方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8056001B2 (en) * | 2003-04-10 | 2011-11-08 | Hewlett-Packard Development Company, L.P. | Method and apparatus for classifying elements of a document |
-
2010
- 2010-09-19 CN CN2010102937364A patent/CN101976232B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1732012B1 (en) * | 2005-06-09 | 2007-10-10 | PDFlib GmbH | Method of identifying redundant text in an electronic document |
CN101770446A (zh) * | 2008-12-26 | 2010-07-07 | 北大方正集团有限公司 | 一种版式文件中表格识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN101976232A (zh) | 2011-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101976232B (zh) | 一种识别文档中数据表格的方法及装置 | |
CN101968783B (zh) | 一种XML文档转换为Excel文档的方法及装置 | |
CN101770446B (zh) | 一种版式文件中表格识别方法及系统 | |
CN108415887A (zh) | 一种pdf文件向ofd文件转化的方法 | |
CN102043762B (zh) | 一种版面比对的方法及装置 | |
US20130181995A1 (en) | Handwritten character font library | |
CN101989256A (zh) | 一种文书文件的排版方法及装置 | |
CN101206639A (zh) | 一种基于pdf的复杂版面的标引方法 | |
CN102722475A (zh) | 一种PDF文档中的表格转换成Excel表格的方法 | |
CN101231665A (zh) | 将数据库中数据导出成Excel文件的装置及其方法 | |
CN101963954A (zh) | 一种文字显示的方法及装置 | |
CN111062186B (zh) | 文本处理方法、装置、计算机设备和存储介质 | |
CN103970723A (zh) | 基于图像检测和切割的电子文档屏幕显示方法 | |
CN101686309B (zh) | 一种图像路径生成陷印的方法及装置 | |
CN112861485A (zh) | 核电dcs控制逻辑图纸的处理方法、装置及设备 | |
CN112528599B (zh) | 基于xml的多页文档处理方法、装置、计算机设备及介质 | |
CN113962193A (zh) | 表格排版方法、装置、电子设备及存储介质 | |
Shyshkova et al. | Electronic money: the essence and problems of use in Ukraine | |
Pimonenko | Determinants of improving the efficiency of green investment management | |
CN117217172B (zh) | 表格信息获取方法、装置、计算机设备、存储介质 | |
CN110188326A (zh) | 富文本生成方法、装置、计算机设备和存储介质 | |
CN102298572A (zh) | 电子文档生成设备及电子文档生成方法 | |
CN110147537A (zh) | 一种基于位置关系的pdf表格抽取方法 | |
CN110020419B (zh) | 排版方法及装置 | |
Chao | Graphics extraction in a PDF document |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C56 | Change in the name or address of the patentee |
Owner name: SHENZHEN WONDERSHARE INFORMATION TECHNOLOGY CO., L Free format text: FORMER NAME: SHENZHEN WONDERSHARE SOFTWARE CO., LTD. |
|
CP01 | Change in the name or title of a patent holder |
Address after: 518057 Guangdong city of Shenzhen province Nanshan District Gao Xin Road TCL A building block 901 Patentee after: SHENZHEN WONDERSHARE INFORMATION TECHNOLOGY Co.,Ltd. Address before: 518057 Guangdong city of Shenzhen province Nanshan District Gao Xin Road TCL A building block 901 Patentee before: WONDERSHARE SOFTWARE Co.,Ltd. |
|
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: 850000 Tibet autonomous region, Lhasa City, New District, west of the East Ring Road, 1-4 road to the north, south of 1-3 Road, Liu Dong building, east of the 8 unit 6, floor 2, No. Patentee after: WONDERSHARE TECHNOLOGY CO.,LTD. Address before: 518057 Guangdong city of Shenzhen province Nanshan District Gao Xin Road TCL A building block 901 Patentee before: SHENZHEN WONDERSHARE INFORMATION TECHNOLOGY Co.,Ltd. |
|
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120620 |