CN110968604A - 一种自动检索互联网经营企业违规经营的方法 - Google Patents

一种自动检索互联网经营企业违规经营的方法 Download PDF

Info

Publication number
CN110968604A
CN110968604A CN201911232234.8A CN201911232234A CN110968604A CN 110968604 A CN110968604 A CN 110968604A CN 201911232234 A CN201911232234 A CN 201911232234A CN 110968604 A CN110968604 A CN 110968604A
Authority
CN
China
Prior art keywords
rule
enterprise
information
internet
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911232234.8A
Other languages
English (en)
Inventor
陈艳
郑淳滢
宫嘉晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changchun Jiacheng Information Technology Co ltd
Original Assignee
Changchun Jiacheng Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changchun Jiacheng Information Technology Co ltd filed Critical Changchun Jiacheng Information Technology Co ltd
Priority to CN201911232234.8A priority Critical patent/CN110968604A/zh
Publication of CN110968604A publication Critical patent/CN110968604A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种自动检索互联网经营企业违规经营的方法,整体步骤如下:结合监管内容进行业务建模,按照业务建模在互联网中进行数据采集,数据采集后进行结构化存储,结构化储存的数据通过规则处理的规则匹配和处理后将清洗后的数据输入到分析判别中,分析判断最终将互联网经营企业中违规经营的公司名称、网站域名、行政区划、违法事实、法律依据及证据内容进行输出,等待动作处理。本发明通过自动检索判定互联网经营企业的违规行为,不仅检索效率高,而且发现违规行为快、判定违规行为简单,可广泛应用于检察机关或行政执法单位对互联网经营企业的监管领域。

Description

一种自动检索互联网经营企业违规经营的方法
技术领域
本发明涉及一种检索违规经营的方法,尤其涉及一种自动检索互联网经营企业违规经营的方法。
背景技术
在互联网经营企业中,存在着不按照国家法律法规要求违规经营的行为,检察机关或行政执法单位需要对其进行监管。目前判别互联网经营企业违规经营的方法主要通过人工手动输入互联网经营企业网址、进行浏览、发现并判定违规行为。但是因为互联网经营企业多、经营范围广、经营内容杂,导致检索效率低、发现违规行为慢、判定违规行为难。
发明内容
为了解决上述技术所存在的不足之处,本发明提供了一种自动检索互联网经营企业违规经营的方法。
为了解决以上技术问题,本发明采用的技术方案是:一种自动检索互联网经营企业违规经营的方法,整体步骤如下:
结合监管内容进行业务建模,按照业务建模在互联网中进行数据采集,数据采集后进行结构化存储,结构化储存的数据通过规则处理的规则匹配和处理后将清洗后的数据输入到分析判别中,分析判断最终将互联网经营企业中违规经营的公司名称、网站域名、行政区划、违法事实、法律依据及证据内容进行输出,等待动作处理。
进一步地,业务建模包括以下步骤:
I、属性配置:在数据资源的管理平台对需要存储的关键信息进行基础属性配置;
II、采集配置:在互联网数据采集平台进行采集关键词、采集网站的采集配置,一般情况下采集的信息包括企业基本信息、企业的网站域名、企业的经营许可证信息、企业的信息服务资格证书、交易服务证书电子证照信息;
III、规则配置:在规则管理平台即规则引擎,对数据处理进行规则配置,平台间通过接口协议的方式进行规则调用。
进一步地,互联网数据采集系统采集的内容包括文字和图片两种格式,如果是图片信息则需要通过文本识别工具进行信息抽取,具体步骤如下:
S1、文本采集:通过预先配置好的采集模板,有目的性的、定向的采集在经营企业的网页中与模板配置相关的文本内容,并按照属性配置进行文本的存储;
S2、证照采集:将经营企业网页中公布的图片格式的证照信息存储到FTP服务器的固定位置,并且支持JPG、PNG、BMP、GIF多种图片格式的文件存储;
S21、文本识别:通过调用OCR文字识别接口服务,将步骤S2中已采集并存储图片上的文字信息,智能识别成可编辑和存储的文本内容,并按照预先配置好的属性字段进行识别信息的存储;文字识别的过程包含图像的输入、预处理、版面分析、字符切割、字符识别、校对步骤。
进一步地,规则处理包括以下步骤:
自动检索互联网经营企业违规的方法需要通过规则处理模块完成一系列信息处理操作,以实现违规行为判别前的数据清洗工作;
规则处理模块是一个相对独立的规则引擎架构,规则处理不仅能够提供常规的数据处理,也提供了规则库和函数库的管理;规则处理对整个业务流程的业务逻辑进行了定义、解释和运行;
I、规则仓库:提供规则信息的数据管理,可以快速实现规则的定义、版本控制、维护和发布功能,一般情况下针对业务的规则库建立都是在业务建模1阶段完成;
II、规则处理:分为基本数据处理、逻辑控制、函数处理、文本处理、文本解析多种方式,其中:数据处理包括四则运算、比较运算、逻辑运算;逻辑控制为While、if、FOR控制;函数处理包括系统函数、内置函数、自定义函数处理;文本处理包括字符串处理、替换和转换;文本解析包括正则表达式匹配,字符串查找多种方式;
III、规则执行:规则引擎根据规则处理时传递的规则名称,取得规则编译文件,同时将其以参数的形式传递到规则包执行的上下文中,然后开始执行规则包;
IV、结果返回:规则执行完毕后,会将执行后数据,传递给调用规则包的下游应用程序。
进一步地,分析判别包括以下步骤:
互联网经营企业违规经营的分析判别是通过调用规则处理模块的接口协议,对采集到企业信息进行违规行为的特征提取,再将提取到的信息按照规则进行匹配和结果的输出,是违规经营行为确定的核心;
一般情况下互联网企业经营的违规行为特征分为:企业经营内容包含违规文字、企业证照信息有效性判别规则、企业证照信息有无情况规则、企业证照信息公示情况规则、企业证照信息真假判别规则;
I、信息输入:规则处理后的经营企业信息传输至分析判别模块中;
II、分析判别:分析判别利用规则处理后的企业信息进行违规行为的确认,并按照规则分类进行违规行为的赋值;
III、行为输出:将违规行为赋值后的企业信息以接口的形式进行输出到业务系统中。
进一步地,动作处理是将违规经营的互联网经营企业,将其企业基本信息、违法事实、违法证据、所依据的法律法规内容以可视化的方式展示给检察官或行政执法单位的过程。
本发明针对互联网经营企业多、经营范围广、经营内容杂的特点,通过自动检索判定互联网经营企业的违规行为,不仅检索效率高,而且发现违规行为快、判定违规行为简单。本发明能够摆脱人工判别,通过自动判别有效提高检索效率,提升发现违规行为的速度,并能够快速、准确判定违规行为,可广泛应用于检察机关或行政执法单位对互联网经营企业的监管领域。
附图说明
图1为本发明的整体流程图。
图2为业务建模的流程图。
图3为数据采集的流程图。
图4为规则处理的流程图。
图5为分析判断的流程图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示的一种自动检索互联网经营企业违规经营的方法,整体步骤如下:结合监管内容进行业务建模,按照业务建模在互联网中进行数据采集,数据采集后进行结构化存储,结构化储存的数据通过规则处理的规则匹配和处理后将清洗后的数据输入到分析判别中,分析判断最终将互联网经营企业中违规经营的公司名称、网站域名、行政区划、违法事实、法律依据及证据内容等进行输出,等待动作处理。
自动检索方法总体架构如图1所示,具体包括:业务建模、数据采集、结构化存储、规则处理、分析判别、动作处理。
如图2所示,业务建模包括以下步骤:
I、属性配置:在数据资源的管理平台对需要存储的关键信息进行基础属性配置;
II、采集配置:在互联网数据采集平台进行采集关键词、采集网站等采集配置,一般情况下采集的信息包括企业基本信息、企业的网站域名、企业的经营许可证信息、企业的信息服务资格证书、交易服务证书等电子证照信息;
III、规则配置:在规则管理平台即规则引擎,对数据处理进行规则配置,平台间通过接口协议的方式进行规则调用。
如图3所示,互联网数据采集系统采集的内容包括文字和图片两种格式,如果是图片信息则需要通过文本识别工具进行信息抽取,具体步骤如下:
S1、文本采集:通过预先配置好的采集模板,有目的性的、定向的采集在经营企业的网页中与模板配置相关的文本内容,并按照属性配置进行文本的存储;
S2、证照采集:将经营企业网页中公布的图片格式的证照信息存储到FTP服务器的固定位置,并且支持JPG、PNG、BMP、GIF等多种图片格式的文件存储;
S21、文本识别:通过调用OCR文字识别接口服务,将步骤S2中已采集并存储图片上的文字信息,智能识别成可编辑和存储的文本内容,并按照预先配置好的属性字段进行识别信息的存储;文字识别的过程包含图像的输入、预处理、版面分析、字符切割、字符识别、校对等步骤。
OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
互联网经营企业的数据采集是将采集到的互联网经营企业信息按照规则设定,向所述业务系统输入互联网经营企业违规经营的公司名称、网站域名、服务性质、行政区划、证书名称、发证机关、有效期限等内容。
如图4所示,规则处理包括以下步骤:
自动检索互联网经营企业违规的方法需要通过规则处理模块完成一系列信息处理操作,以实现违规行为判别前的数据清洗工作;
规则处理模块是一个相对独立的规则引擎架构,规则处理不仅能够提供常规的数据处理,也提供了规则库和函数库的管理(同业务建模的步骤III);规则处理对整个业务流程的业务逻辑进行了定义、解释和运行;
I、规则仓库:提供规则信息的数据管理,可以快速实现规则的定义、版本控制、维护和发布等功能,一般情况下针对业务的规则库建立都是在业务建模阶段完成;
II、规则处理:分为基本数据处理、逻辑控制、函数处理、文本处理、文本解析等多种方式,其中:数据处理包括四则运算、比较运算、逻辑运算等;逻辑控制为While、if、FOR控制;函数处理包括系统函数、内置函数、自定义函数处理等;文本处理包括字符串处理、替换和转换;文本解析包括正则表达式匹配,字符串查找等多种方式。
III、规则执行:规则引擎根据规则处理时传递的规则名称,取得规则编译文件,同时将其以参数的形式传递到规则包执行的上下文中,然后开始执行规则包;
IV、结果返回:规则执行完毕后,会将执行后数据,传递给调用规则包的下游应用程序。
规则处理中规则的制定依赖于国家法律法规对互联网经营企业的约束要求。其中,企业违规经营的行为一般分为:
1)经营网站是否包含“XXX”违规文字,如赌博、影院、服饰等经营范围外的违规文字;
2)经营网站是否在经营资质超出有效期的状态下仍然进行经营行为;
3)经营网站是否在经营资质已注销的状态下仍然进行经营行为;
4)经营网站是否在无证情况下进行经营行为;
5)经营网站是否未按照国家规定在网站上公示资质信息;
6)经营网站是否公布虚假的资质信息。
除以上的一般情况外,企业经营行为还可以按照详细的监管规章制度进行规则上的扩充。规则的制定可以分为三类:
1)判别规则的“或”、“且”、“非”、“NEAR”、循环、嵌套等功能;
2)提取规则的提取范围定位(如文本边界、起始结束位置等)、数据提取;
3)处理规则的替换、删除、切分等。
如图5所示,分析判别包括以下步骤:
互联网经营企业违规经营的分析判别是通过调用规则处理模块的接口协议,对采集到企业信息进行违规行为的特征提取,再将提取到的信息按照规则进行匹配和结果的输出,是违规经营行为确定的核心;
一般情况下互联网企业经营的违规行为特征分为:企业经营内容包含违规文字、企业证照信息有效性判别规则、企业证照信息有无情况规则、企业证照信息公示情况规则、企业证照信息真假判别规则等其他违规行为判别规则;
I、信息输入:规则处理后的经营企业信息传输至分析判别模块中;
II、分析判别:分析判别利用规则处理后的企业信息进行违规行为的确认,并按照规则分类进行违规行为的赋值;
III、行为输出:将违规行为赋值后的企业信息以接口的形式进行输出到业务系统或其他对接项目中。
数据处理平台调用属性判别特征规则接口协议,对采集到企业信息进行违规行为的特征提取,再将提取到的信息按照规则进行匹配、赋值和结果输出。
动作处理是将违规经营的互联网经营企业,将其企业基本信息、违法事实、违法证据、所依据的法律法规等内容以可视化的方式展示给检察官或行政执法单位的过程;也是互联网经营企业违规经营的判别规则经过后台规则引擎与采集数据的整合加工后,将判别后的违法情形及其所依据的法律法规以可视化的方式展示过程。
上述实施方式并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的技术方案范围内所做出的变化、改型、添加或替换,也均属于本发明的保护范围。

Claims (6)

1.一种自动检索互联网经营企业违规经营的方法,其特征在于:所述方法的整体步骤如下:
结合监管内容进行业务建模,按照业务建模在互联网中进行数据采集,数据采集后进行结构化存储,结构化储存的数据通过规则处理的规则匹配和处理后将清洗后的数据输入到分析判别中,分析判断最终将互联网经营企业中违规经营的公司名称、网站域名、行政区划、违法事实、法律依据及证据内容进行输出,等待动作处理。
2.根据权利要求1所述的自动检索互联网经营企业违规经营的方法,其特征在于:所述业务建模包括以下步骤:
I、属性配置:在数据资源的管理平台对需要存储的关键信息进行基础属性配置;
II、采集配置:在互联网数据采集平台进行采集关键词、采集网站的采集配置,一般情况下采集的信息包括企业基本信息、企业的网站域名、企业的经营许可证信息、企业的信息服务资格证书、交易服务证书电子证照信息;
III、规则配置:在规则管理平台即规则引擎,对数据处理进行规则配置,平台间通过接口协议的方式进行规则调用。
3.根据权利要求1所述的自动检索互联网经营企业违规经营的方法,其特征在于:所述互联网数据采集系统采集的内容包括文字和图片两种格式,如果是图片信息则需要通过文本识别工具进行信息抽取,具体步骤如下:
S1、文本采集:通过预先配置好的采集模板,有目的性的、定向的采集在经营企业的网页中与模板配置相关的文本内容,并按照属性配置进行文本的存储;
S2、证照采集:将经营企业网页中公布的图片格式的证照信息存储到FTP服务器的固定位置,并且支持JPG、PNG、BMP、GIF多种图片格式的文件存储;
S21、文本识别:通过调用OCR文字识别接口服务,将步骤S2中已采集并存储图片上的文字信息,智能识别成可编辑和存储的文本内容,并按照预先配置好的属性字段进行识别信息的存储;文字识别的过程包含图像的输入、预处理、版面分析、字符切割、字符识别、校对步骤。
4.根据权利要求1所述的自动检索互联网经营企业违规经营的方法,其特征在于:所述规则处理包括以下步骤:
自动检索互联网经营企业违规的方法需要通过规则处理模块完成一系列信息处理操作,以实现违规行为判别前的数据清洗工作;
规则处理模块是一个相对独立的规则引擎架构,规则处理不仅能够提供常规的数据处理,也提供了规则库和函数库的管理;规则处理对整个业务流程的业务逻辑进行了定义、解释和运行;
I、规则仓库:提供规则信息的数据管理,可以快速实现规则的定义、版本控制、维护和发布功能,一般情况下针对业务的规则库建立都是在业务建模1阶段完成;
II、规则处理:分为基本数据处理、逻辑控制、函数处理、文本处理、文本解析多种方式,其中:数据处理包括四则运算、比较运算、逻辑运算;逻辑控制为While、if、FOR控制;函数处理包括系统函数、内置函数、自定义函数处理;文本处理包括字符串处理、替换和转换;文本解析包括正则表达式匹配,字符串查找多种方式;
III、规则执行:规则引擎根据规则处理时传递的规则名称,取得规则编译文件,同时将其以参数的形式传递到规则包执行的上下文中,然后开始执行规则包;
IV、结果返回:规则执行完毕后,会将执行后数据,传递给调用规则包的下游应用程序。
5.根据权利要求1所述的自动检索互联网经营企业违规经营的方法,其特征在于:所述分析判别包括以下步骤:
互联网经营企业违规经营的分析判别是通过调用规则处理模块的接口协议,对采集到企业信息进行违规行为的特征提取,再将提取到的信息按照规则进行匹配和结果的输出,是违规经营行为确定的核心;
一般情况下互联网企业经营的违规行为特征分为:企业经营内容包含违规文字、企业证照信息有效性判别规则、企业证照信息有无情况规则、企业证照信息公示情况规则、企业证照信息真假判别规则;
I、信息输入:规则处理后的经营企业信息传输至分析判别模块中;
II、分析判别:分析判别利用规则处理后的企业信息进行违规行为的确认,并按照规则分类进行违规行为的赋值;
III、行为输出:将违规行为赋值后的企业信息以接口的形式进行输出到业务系统中。
6.根据权利要求1所述的自动检索互联网经营企业违规经营的方法,其特征在于:所述动作处理是将违规经营的互联网经营企业,将其企业基本信息、违法事实、违法证据、所依据的法律法规内容以可视化的方式展示给检察官或行政执法单位的过程。
CN201911232234.8A 2019-12-05 2019-12-05 一种自动检索互联网经营企业违规经营的方法 Pending CN110968604A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911232234.8A CN110968604A (zh) 2019-12-05 2019-12-05 一种自动检索互联网经营企业违规经营的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911232234.8A CN110968604A (zh) 2019-12-05 2019-12-05 一种自动检索互联网经营企业违规经营的方法

Publications (1)

Publication Number Publication Date
CN110968604A true CN110968604A (zh) 2020-04-07

Family

ID=70033093

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911232234.8A Pending CN110968604A (zh) 2019-12-05 2019-12-05 一种自动检索互联网经营企业违规经营的方法

Country Status (1)

Country Link
CN (1) CN110968604A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114172871A (zh) * 2021-12-13 2022-03-11 以萨技术股份有限公司 一种基于视频违法检测的数据处理系统、方法及存储介质
CN116702950A (zh) * 2023-05-06 2023-09-05 中国安全生产科学研究院 基于电力大数据对煤炭行业企业违规生产行为的预测方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663025A (zh) * 2012-03-22 2012-09-12 浙江盘石信息技术有限公司 一种违规在线商品检测方法
CN104392297A (zh) * 2014-10-27 2015-03-04 普元信息技术股份有限公司 大数据环境下实现非业务流程违规行为检测的方法及系统
CN105069686A (zh) * 2015-08-13 2015-11-18 凯泰铭科技(北京)有限公司 案件自动检测方法和系统
CN107181620A (zh) * 2017-06-09 2017-09-19 安徽博约信息科技股份有限公司 一种属地网站监管系统
CN107609807A (zh) * 2017-11-08 2018-01-19 厦门美亚商鼎信息科技有限公司 一种网络餐饮风险识别方法及系统
CN108038490A (zh) * 2017-10-30 2018-05-15 上海思贤信息技术股份有限公司 一种基于互联网数据的p2p企业自动识别方法与系统
CN109063612A (zh) * 2018-07-19 2018-12-21 中智城信息技术有限公司 城市智能红线管理方法及机器可读存储介质
CN110334214A (zh) * 2019-07-09 2019-10-15 四川省广安市人民检察院 一种自动识别案件中虚假诉讼的方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663025A (zh) * 2012-03-22 2012-09-12 浙江盘石信息技术有限公司 一种违规在线商品检测方法
CN104392297A (zh) * 2014-10-27 2015-03-04 普元信息技术股份有限公司 大数据环境下实现非业务流程违规行为检测的方法及系统
CN105069686A (zh) * 2015-08-13 2015-11-18 凯泰铭科技(北京)有限公司 案件自动检测方法和系统
CN107181620A (zh) * 2017-06-09 2017-09-19 安徽博约信息科技股份有限公司 一种属地网站监管系统
CN108038490A (zh) * 2017-10-30 2018-05-15 上海思贤信息技术股份有限公司 一种基于互联网数据的p2p企业自动识别方法与系统
CN107609807A (zh) * 2017-11-08 2018-01-19 厦门美亚商鼎信息科技有限公司 一种网络餐饮风险识别方法及系统
CN109063612A (zh) * 2018-07-19 2018-12-21 中智城信息技术有限公司 城市智能红线管理方法及机器可读存储介质
CN110334214A (zh) * 2019-07-09 2019-10-15 四川省广安市人民检察院 一种自动识别案件中虚假诉讼的方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114172871A (zh) * 2021-12-13 2022-03-11 以萨技术股份有限公司 一种基于视频违法检测的数据处理系统、方法及存储介质
CN116702950A (zh) * 2023-05-06 2023-09-05 中国安全生产科学研究院 基于电力大数据对煤炭行业企业违规生产行为的预测方法
CN116702950B (zh) * 2023-05-06 2024-01-23 中国安全生产科学研究院 基于电力大数据对煤炭行业企业违规生产行为的预测方法

Similar Documents

Publication Publication Date Title
JP4366108B2 (ja) 文書検索装置、文書検索方法及びコンピュータプログラム
JP2007042106A (ja) 文書処理方法、文書処理メディア、文書管理方法、文書処理システム及び文書管理システム
CN101523413A (zh) 根据硬拷贝表单自动生成表单定义
CN103678109A (zh) 一种转储文件分析方法、装置和系统
CN111291572B (zh) 一种文字排版方法、装置及计算机可读存储介质
Karasneh et al. Img2uml: A system for extracting uml models from images
CN110968604A (zh) 一种自动检索互联网经营企业违规经营的方法
US20070116363A1 (en) Image processing device, image processing method, and storage medium storing image processing program
CN112328936A (zh) 一种网站识别方法、装置、设备及计算机可读存储介质
US20190258629A1 (en) Data mining method based on mixed-type data
CN110851630A (zh) 一种深度学习标注样本的管理系统及方法
CN113076961B (zh) 一种图像特征库更新方法、图像检测方法和装置
CN115828874A (zh) 基于图像识别技术的行业表格数字化处理方法
JP2005151127A5 (zh)
CN112036843A (zh) 基于rpa及ai的流程元素定位方法、装置、设备和介质
JP4811133B2 (ja) 画像形成装置及び画像処理装置
CN114155547B (zh) 一种图表识别方法、装置、设备及存储介质
JP2007041709A (ja) 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
CN114610844A (zh) 一种敏感信息检测方法、装置、存储介质及终端
CN112861861B (zh) 识别数码管文本的方法、装置及电子设备
TWI793432B (zh) 工程專案文件管理方法與系統
WO2021018016A1 (zh) 一种专利信息展示方法、装置、设备及存储介质
CN109739981B (zh) 一种pdf文件类别判定方法及文字提取方法
CN114579796A (zh) 机器阅读理解方法及装置
JP5445740B2 (ja) 画像処理装置、画像処理システムおよび処理プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200407