CN110674091A - 基于人工智能的文件上传方法、系统及存储介质 - Google Patents
基于人工智能的文件上传方法、系统及存储介质 Download PDFInfo
- Publication number
- CN110674091A CN110674091A CN201910945173.3A CN201910945173A CN110674091A CN 110674091 A CN110674091 A CN 110674091A CN 201910945173 A CN201910945173 A CN 201910945173A CN 110674091 A CN110674091 A CN 110674091A
- Authority
- CN
- China
- Prior art keywords
- service
- file
- system server
- artificial intelligence
- service file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 140
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012545 processing Methods 0.000 claims abstract description 57
- 238000004590 computer program Methods 0.000 claims description 29
- 238000012805 post-processing Methods 0.000 claims description 19
- 230000009467 reduction Effects 0.000 claims description 17
- 230000015654 memory Effects 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 12
- 238000007781 pre-processing Methods 0.000 description 8
- 230000004044 response Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/06—Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种基于人工智能的文件上传方法、系统及存储介质。该方法包括:若检测到预设的待上传文件夹中存入业务文件,终端将业务文件发送给业务系统服务器;业务系统服务器将业务文件发送给AI系统服务器;AI系统服务器接收业务文件,识别业务文件的业务编号,并将业务文件的业务编号发送给业务系统服务器;业务系统服务器接收业务文件的业务编号,并根据业务文件的业务编号将业务文本上传到与业务编号对应的文件系统服务器中。通过文件监控和AI技术文本识别,减少人工对文件进行操作的节点,避免了人工的操作失误。业务人员只需要扫描纸质文件成电子文档,保存相应的监控文件夹即可,从而大大提高了业务人员的业务处理效率,降低了人力成本。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于人工智能的文件上传方法、系统及存储介质。
背景技术
目前,在企业中,为了便于对业务进行更好的管理,需要将大量的文本扫描成电子文档,然后上传到业务文件系统中进行电子文本存档。现有的技术都是通过人工扫描出电子文档,将电子文档进行关键的业务编号命名标志,然后压缩文档成压缩包进行系统上传。
现有的技术缺点操作繁琐,流程多杂并且出现人工错误,当业务量大的时候,人力成本高,处理效率低,耗费时间多。
发明内容
本发明实施例提供了一种基于人工智能的文件上传方法、系统及存储介质,旨在解决现有文件上传方法人工易出错、人力成本高,处理效率低以及耗费时间多的问题。
第一方面,本发明实施例提供了一种基于人工智能的文件上传方法,其包括:
若检测到预设的待上传文件夹中存入业务文件,终端将所述业务文件发送给业务系统服务器,所述业务文件是通过对业务文本进行扫描后得到的图片文件,所述业务文件中包含业务编号;
业务系统服务器将所述业务文件发送给AI系统服务器;
AI系统服务器接收所述业务文件,识别所述业务文件的业务编号,并将所述业务文件的业务编号发送给所述业务系统服务器;
业务系统服务器接收所述业务文件的业务编号,并根据所述业务文件的业务编号将所述业务文本上传到与所述业务编号对应的文件系统服务器中。
其进一步的技术方案为,所述AI系统服务器识别所述业务文件的业务编号,包括:
AI系统服务器对所述业务文件进行预处理;
AI系统服务器提取所述业务文件的文字图像特征,并对提取到的文字图像特征进行降维处理;
AI系统服务器将降维处理后的文字图像特征输入到预设的分类器中;
AI系统服务器对所述分类器的分类结果进行后处理。
其进一步的技术方案为,所述AI系统服务器对所述业务文件进行预处理,包括:
AI系统服务器对所述业务文件进行灰度化处理、去除噪声处理、二值化处理、字符切分处理和以及归一化处理。
其进一步的技术方案为,所述AI系统服务器对所述分类器的分类结果进行后处理,包括:
通过预设的语言模型来对所述分类器的分类结果进行校正。
其进一步的技术方案为,所述业务系统服务器将所述业务文件发送给AI系统服务器,包括:业务系统服务器向预设的RabbitMQ消息队列发送第一消息;
所述AI系统服务器接收所述业务文件,包括:AI系统服务器从所述RabbitMQ消息队列接收所述第一消息,并根据所述第一消息获取所述业务文件。
其进一步的技术方案为,所述AI系统服务器将所述业务文件的业务编号发送给所述业务系统服务器,包括:AI系统服务器向所述RabbitMQ消息队列发送第二消息;
所述业务系统服务器接收所述业务文件的业务编号,包括:业务系统服务器从所述RabbitMQ消息队列接收所述第二消息,并根据所述第二消息获取所述业务文件的业务编号。
其进一步的技术方案为,在终端将所述业务文件发送给业务系统服务器之后,所述方法还包括:
终端将所述业务文件从所述待上传文件夹转存到预设的已完成文件夹中。
第二方面,本发明实施例还提供了一种基于人工智能的文件上传系统,所述基于人工智能的文件上传系统包括终端、业务系统服务器以及AI系统服务器,所述终端包括第一发送单元,所述业务系统服务器包括第二发送单元以及上传单元,所述AI系统服务器包括识别单元。
第一发送单元,用于若检测到预设的待上传文件夹中存入业务文件,将所述业务文件发送给业务系统服务器,所述业务文件是通过对业务文本进行扫描后得到的图片文件,所述业务文件中包含业务编号;
第二发送单元,用于将所述业务文件发送给AI系统服务器;
识别单元,用于接收所述业务文件,识别所述业务文件的业务编号,并将所述业务文件的业务编号发送给所述业务系统服务器;
上传单元,用于接收所述业务文件的业务编号,并根据所述业务文件的业务编号将所述业务文本上传到与所述业务编号对应的文件系统服务器中。
第三方面,本发明实施例还提供了一种基于人工智能的文件上传系统,所述基于人工智能的文件上传系统包括终端、业务系统服务器以及AI系统服务器,所述终端、业务系统服务器以及AI系统服务器均包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述终端、业务系统服务器以及AI系统服务器的处理器执行相应的计算机程序时共同实现上述方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述存储介质存储有第一计算机程序、第二计算机程序以及第三计算机程序,所述第一计算机程序、第二计算机程序以及第三计算机程序当分别被终端的处理器、业务系统服务器的处理器以及AI系统服务器的处理器执行时可实现上述方法。
本发明的技术方案,通过文件监控和AI技术文本识别,减少人工对文件进行操作的节点,避免了人工的操作失误。业务人员只需要扫描纸质文件成电子文档,保存相应的监控文件夹即可,大大提高了业务人员的业务处理效率,降低了人力成本。为企业的业务流程,提供了相对更加便利的操作流程。此外,业务人员还可以通过业务系统实时观察扫描文件的自动识别和上传系统的结果。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于人工智能的文件上传方法的应用场景示意图;
图2为本发明实施例提供的一种基于人工智能的文件上传方法的流程示意图;
图3为本发明实施例提供的一种基于人工智能的文件上传方法的子流程示意图;
图4为本发明实施例提供的一种基于人工智能的文件上传系统的示意性框图;
图5为本发明实施例提供的基于人工智能的文件上传系统的识别单元的示意性框图;
图6为本发明实施例提供的基于人工智能的文件上传系统的预处理单元的示意性框图;
图7为本发明实施例提供的基于人工智能的文件上传系统的后处理单元的示意性框图;
图8为本发明实施例提供的基于人工智能的文件上传系统的第二发送单元的示意性框图;
图9为本发明实施例提供的基于人工智能的文件上传系统的识别单元的另一示意性框图;
图10为本发明实施例提供的基于人工智能的文件上传系统的上传单元的示意性框图;
图11为本发明实施例提供的基于人工智能的文件上传系统的终端的示意性框图;
图12为本发明实施例提供的一种计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
请参阅图1和图2,图1为本发明实施例提供的基于人工智能的文件上传方法的应用场景示意图。图2为本发明实施例提供的基于人工智能的文件上传方法的示意性流程图。在本发明实施例中,若检测到预设的待上传文件夹中存入业务文件,终端1将所述业务文件发送给业务系统服务器2,所述业务文件是通过对业务文本进行扫描后得到的图片文件,所述业务文件中包含业务编号;业务系统服务器2将所述业务文件发送给AI系统服务器3;AI系统服务器3接收所述业务文件,识别所述业务文件的业务编号,并将所述业务文件的业务编号发送给所述业务系统服务器2;业务系统服务器2接收所述业务文件的业务编号,并根据所述业务文件的业务编号将所述业务文本上传到与所述业务编号对应的文件系统服务器4中。业务系统服务器2是指业务系统的服务器。AI系统服务器3是指AI系统的服务器。业务系统以及AI系统均有本领域技术人员预先搭建。
图2是本发明实施例提供的一种基于人工智能的文件上传方法的流程示意图。如图所示,该方法包括以下步骤S1-S4。
S1,若检测到预设的待上传文件夹中存入业务文件,终端将所述业务文件发送给业务系统服务器。
其中,所述业务文件是通过对业务文本(纸质文件)进行扫描后得到的图片文件(电子文件),所述业务文件中包含业务编号。
本发明实施例中,业务人员需要扫描纸质的业务文本扫描成电子档的业务文件,并保存在相应的待上传文件夹中。
具体实施中,如果检测到预设的待上传文件夹中存入业务文件,终端将所述业务文件发送给业务系统服务器。
在一实施例中,在终端将所述业务文件发送给业务系统服务器之后,所述方法还包括:终端将所述业务文件从所述待上传文件夹转存到预设的已完成文件夹中。由此,业务人员可清晰的知道哪些业务文件以及上传了,便于对业务文件的管理。
S2,业务系统服务器将所述业务文件发送给AI系统服务器。
具体实施中,业务系统服务器在接收到业务文件之后,将所述业务文件发送给AI系统服务器,以由所述AI系统服务器识别所述业务文件的业务编号
S3,AI系统服务器接收所述业务文件,识别所述业务文件的业务编号,并将所述业务文件的业务编号发送给所述业务系统服务器。
具体实施中,AI(Artificial Intelligence,人工智能)系统服务器接收所述业务文件,识别所述业务文件的业务编号,并将所述业务文件的业务编号发送给所述业务系统服务器。
参见图3,在一实施例中,以上步骤所述AI系统服务器识别所述业务文件的业务编号,包括如下步骤S31-S34。
S31,AI系统服务器对所述业务文件进行预处理。
具体实施中,AI系统服务器对所述业务文件进行预处理。
在一实施例中,以上步骤所述AI系统服务器对所述业务文件进行预处理,包括:AI系统服务器对所述业务文件进行灰度化处理、去除噪声处理、二值化处理、字符切分处理和以及归一化处理。
经过图像的二值化之后,文本图像(业务文件)只会剩下黑与白的两种颜色,白色为图像背景,黑色则为文字。图像在数字化和传输的过程中会受到成像设备和外部环境噪声的影响,因此使用降噪算法对文本图像进行噪声去除。字符切分是将文本图像中的文字分割成单个文字,便于一个一个字识别,且要进行字体校正。将单个文字的图像规整到同样的尺寸操作为归一化操作。
S32,AI系统服务器提取所述业务文件的文字图像特征,并对提取到的文字图像特征进行降维处理。
具体实施中,AI系统服务器提取所述业务文件的文字图像特征,并对提取到的文字图像特征进行降维处理。
文字图像特征用一个向量表示,而维数则是该向量的分量数。特征提取是指使用计算机提取文字图像中属于特征性的信息的方法及过程;降维,通过单幅图像数据的高维化,将单幅图像转化为高维空间中的数据集合,对其进行非线性降维。文字图像特征是每个文字的关键信息,每个不同的文字都能通过文字图像特征来和其他文字进行区分,相对于汉字来说,数字和英文字母的文字图像特征提取会比较容易,属于小字符集。汉字结构比较复杂,对汉字确定文字图像特征后,根据情况进行降维,以此来提高分类器的效率和识别效率,并且要保留足够的信息量以区分不同的文字。
S33,AI系统服务器将降维处理后的文字图像特征输入到预设的分类器中。
具体实施中,AI系统服务器将降维处理后的文字图像特征输入到预设的分类器中。
分类器即是在已有数据的基础上学会的一个分类函数或构造出的一个分类模型。分类器对特征进行识别分类,得出一个结果文字。
S34,AI系统服务器对所述分类器的分类结果进行后处理。
具体实施中,AI系统服务器对所述分类器的分类结果进行后处理。
在一实施例中,所述AI系统服务器对所述分类器的分类结果进行后处理,包括:通过预设的语言模型来对所述分类器的分类结果进行校正。
由于汉字中形近字的存在,所以识别出来的汉字有可能识别成形近字。后处理的其中一个方法是通过预设的语言模型来校正分类结果,以此来提高识别结果准确度。
S4,业务系统服务器接收所述业务文件的业务编号,并根据所述业务文件的业务编号将所述业务文本上传到与所述业务编号对应的文件系统服务器中。
具体实施中,业务系统服务器接收所述业务文件的业务编号,并根据所述业务文件的业务编号将所述业务文本上传到与所述业务编号对应的文件系统服务器中。业务系统服务器根据业务编号,匹配业务系统的数据编号,并上传相应文件系统。
在一实施例中,以上步骤所述业务系统服务器将所述业务文件发送给AI系统服务器,包括:业务系统服务器向预设的RabbitMQ消息队列发送第一消息。
以上步骤所述AI系统服务器接收所述业务文件,包括:AI系统服务器从所述RabbitMQ消息队列接收所述第一消息,并根据所述第一消息获取所述业务文件。
具体实施中,RabbitMQ是一个消息代理和队列服务器。首先业务系统服务器上传完需要识别的业务文件之后,作为生产者,给约定好的RabbitMQ消息队列发送第一消息。AI系统服务器从RabbitMQ消息队列中拿到要处理的第一消息,进行相应的AI识别处理,处理完则会发送一个回执给RabbitMQ,RabbitMQ收到回执后将该第一消息从队列中移除,以免重复被消费者消费。
在一实施例中,以上步骤所述AI系统服务器将所述业务文件的业务编号发送给所述业务系统服务器,包括:AI系统服务器向所述RabbitMQ消息队列发送第二消息。以上步骤所述业务系统服务器接收所述业务文件的业务编号,包括业务系统服务器从所述RabbitMQ消息队列接收所述第二消息,并根据所述第二消息获取所述业务文件的业务编号。
具体实施中,AI识别的结果由AI系统服务器包装为第二信息发送给RabbitMQ消息队列,由业务系统服务器消费处理。业务系统消费第二信息进行相应业务系统操作,将识别的文件按照编号上传到系统和业务对应起来。这样的异步处理将不会占用大量资源,保证了业务系统服务器的正常的业务处理。
本发明的技术方案,通过文件监控和AI技术文本识别,减少人工对文件进行操作的节点,避免了人工的操作失误。业务人员只需要扫描纸质文件成电子文档,保存相应的监控文件夹即可,大大提高了业务人员的业务处理效率,降低了人力成本。为企业的业务流程,提供了相对更加便利的操作流程。此外,业务人员还可以通过业务系统实时观察扫描文件的自动识别和上传系统的结果。
参见图4,本发明实施例提供一种基于人工智能的文件上传系统100,所述基于人工智能的文件上传系统100包括终端50、业务系统服务器60以及AI系统服务器70,所述终端50包括第一发送单元51,所述业务系统服务器60包括第二发送单元61以及上传单元62,所述AI系统服务器70包括识别单元71,其中:
第一发送单元51,用于若检测到预设的待上传文件夹中存入业务文件,将所述业务文件发送给业务系统服务器,所述业务文件是通过对业务文本进行扫描后得到的图片文件,所述业务文件中包含业务编号。
第二发送单元61,用于将所述业务文件发送给AI系统服务器。
识别单元62,用于接收所述业务文件,识别所述业务文件的业务编号,并将所述业务文件的业务编号发送给所述业务系统服务器。
上传单元71,用于接收所述业务文件的业务编号,并根据所述业务文件的业务编号将所述业务文本上传到与所述业务编号对应的文件系统服务器中。
在一实施例中,如图5所示,所述识别单元71包括预处理单元711、提取单元712、输入单元713以及后处理单元714。
预处理单元711,用于对所述业务文件进行预处理。
提取单元712,用于提取所述业务文件的文字图像特征,并对提取到的文字图像特征进行降维处理。
输入单元713,用于将降维处理后的文字图像特征输入到预设的分类器中。
后处理单元714,用于对所述分类器的分类结果进行后处理。
在一实施例中,如图6所示,所述预处理单元711包括处理单元7111。
处理单元7111,用于对所述业务文件进行灰度化处理、去除噪声处理、二值化处理、字符切分处理和以及归一化处理。
在一实施例中,如图7所示,所述后处理单元714包括校正单元7141。
校正单元7141,用于通过预设的语言模型来对所述分类器的分类结果进行校正。
在一实施例中,如图8所示,所述第二发送单元61包括第三发送单元611。
第三发送单元611,用于向预设的RabbitMQ消息队列发送第一消息。
在一实施例中,如图9所示,所述识别单元还71包括第一接收单元715以及第四发送单元716。
第一接收单元715,用于从所述RabbitMQ消息队列接收所述第一消息,并根据所述第一消息获取所述业务文件。
第四发送单元716,用于向所述RabbitMQ消息队列发送第二消息。
在一实施例中,如图10所示,所述上传单元62包括第二接收单元621。
第二接收单元621,用于从所述RabbitMQ消息队列接收所述第二消息,并根据所述第二消息获取所述业务文件的业务编号。
在一实施例中,如图11所示,所述终端50还包括转存单元52。
转存单元52,用于将所述业务文件从所述待上传文件夹转存到预设的已完成文件夹中。
本发明实施例还提出一种基于人工智能的文件上传系统,所述基于人工智能的文件上传系统包括至少三台计算机设备,其中包括一台终端、一台业务系统服务器和一台AI系统服务器。请参阅图12,图12是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是上述终端、业务系统服务器以及AI系统服务器。
参阅图12,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行一种标书管理方法。
该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种标书管理方法。
该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述终端、业务系统服务器以及AI系统服务器的处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:
若检测到预设的待上传文件夹中存入业务文件,终端将所述业务文件发送给业务系统服务器,所述业务文件是通过对业务文本进行扫描后得到的图片文件,所述业务文件中包含业务编号;
业务系统服务器将所述业务文件发送给AI系统服务器;
AI系统服务器接收所述业务文件,识别所述业务文件的业务编号,并将所述业务文件的业务编号发送给所述业务系统服务器;
业务系统服务器接收所述业务文件的业务编号,并根据所述业务文件的业务编号将所述业务文本上传到与所述业务编号对应的文件系统服务器中。
在一实施例中,AI系统服务器的处理器502在实现所述AI系统服务器识别所述业务文件的业务编号步骤时,具体实现如下步骤:
AI系统服务器对所述业务文件进行预处理;
AI系统服务器提取所述业务文件的文字图像特征,并对提取到的文字图像特征进行降维处理;
AI系统服务器将降维处理后的文字图像特征输入到预设的分类器中;
AI系统服务器对所述分类器的分类结果进行后处理。
在一实施例中,AI系统服务器的处理器502在实现所述AI系统服务器对所述业务文件进行预处理步骤时,具体实现如下步骤:
AI系统服务器对所述业务文件进行灰度化处理、去除噪声处理、二值化处理、字符切分处理和以及归一化处理。
在一实施例中,AI系统服务器的处理器502在实现所述AI系统服务器对所述分类器的分类结果进行后处理步骤时,具体实现如下步骤:
通过预设的语言模型来对所述分类器的分类结果进行校正。
在一实施例中,业务系统服务器的处理器502在实现所述业务系统服务器将所述业务文件发送给AI系统服务器步骤时,具体实现如下步骤:
业务系统服务器向预设的RabbitMQ消息队列发送第一消息。
在一实施例中,AI系统服务器的处理器502在实现所述AI系统服务器接收所述业务文件步骤时,具体实现如下步骤:
AI系统服务器从所述RabbitMQ消息队列接收所述第一消息,并根据所述第一消息获取所述业务文件。
在一实施例中,AI系统服务器的处理器502在实现所述AI系统服务器将所述业务文件的业务编号发送给所述业务系统服务器步骤时,具体实现如下步骤:
AI系统服务器向所述RabbitMQ消息队列发送第二消息。
在一实施例中,业务系统服务器的处理器502在实现所述业务系统服务器接收所述业务文件的业务编号步骤时,具体实现如下步骤:业务系统服务器从所述RabbitMQ消息队列接收所述第二消息,并根据所述第二消息获取所述业务文件的业务编号。
在一实施例中,终端的处理器502在实现所述将所述业务文件发送给业务系统服务器步骤之后,还实现如下步骤:
终端将所述业务文件从所述待上传文件夹转存到预设的已完成文件夹中。
应当理解,在本申请实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该计算机程序被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本发明还提供一种计算机可读存储介质,所述存储介质存储有第一计算机程序、第二计算机程序以及第三计算机程序,所述第一计算机程序、第二计算机程序以及第三计算机程序当分别被终端的处理器、业务系统服务器的处理器以及AI系统服务器的处理器执行时实现如下步骤:
若检测到预设的待上传文件夹中存入业务文件,终端将所述业务文件发送给业务系统服务器,所述业务文件是通过对业务文本进行扫描后得到的图片文件,所述业务文件中包含业务编号;
业务系统服务器将所述业务文件发送给AI系统服务器;
AI系统服务器接收所述业务文件,识别所述业务文件的业务编号,并将所述业务文件的业务编号发送给所述业务系统服务器;
业务系统服务器接收所述业务文件的业务编号,并根据所述业务文件的业务编号将所述业务文本上传到与所述业务编号对应的文件系统服务器中。
在一实施例中,AI系统服务器的处理器在执行所述第三计算机程序而实现所述AI系统服务器识别所述业务文件的业务编号步骤时,具体实现如下步骤:
AI系统服务器对所述业务文件进行预处理;
AI系统服务器提取所述业务文件的文字图像特征,并对提取到的文字图像特征进行降维处理;
AI系统服务器将降维处理后的文字图像特征输入到预设的分类器中;
AI系统服务器对所述分类器的分类结果进行后处理。
在一实施例中,AI系统服务器的处理器在执行所述第三计算机程序而实现所述AI系统服务器对所述业务文件进行预处理步骤时,具体实现如下步骤:
AI系统服务器对所述业务文件进行灰度化处理、去除噪声处理、二值化处理、字符切分处理和以及归一化处理。
在一实施例中,AI系统服务器的处理器在执行所述第三计算机程序而实现所述AI系统服务器对所述分类器的分类结果进行后处理步骤时,具体实现如下步骤:
通过预设的语言模型来对所述分类器的分类结果进行校正。
在一实施例中,业务系统服务器的处理器在执行所述第二计算机程序而实现所述业务系统服务器将所述业务文件发送给AI系统服务器步骤时,具体实现如下步骤:
业务系统服务器向预设的RabbitMQ消息队列发送第一消息。
在一实施例中,AI系统服务器的处理器在执行所述第三计算机程序而实现所述AI系统服务器接收所述业务文件步骤时,具体实现如下步骤:
AI系统服务器从所述RabbitMQ消息队列接收所述第一消息,并根据所述第一消息获取所述业务文件。
在一实施例中,AI系统服务器的处理器在执行所述第三计算机程序而实现所述AI系统服务器将所述业务文件的业务编号发送给所述业务系统服务器步骤时,具体实现如下步骤:
AI系统服务器向所述RabbitMQ消息队列发送第二消息。
在一实施例中,业务系统服务器的处理器在执行所述第二计算机程序而实现所述业务系统服务器接收所述业务文件的业务编号步骤时,具体实现如下步骤:业务系统服务器从所述RabbitMQ消息队列接收所述第二消息,并根据所述第二消息获取所述业务文件的业务编号。
在一实施例中,终端的处理器在执行所述第一计算机程序而实现所述将所述业务文件发送给业务系统服务器步骤之后,还实现如下步骤:
终端将所述业务文件从所述待上传文件夹转存到预设的已完成文件夹中。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例系统中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,尚且本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于人工智能的文件上传方法,其特征在于,包括:
若检测到预设的待上传文件夹中存入业务文件,终端将所述业务文件发送给业务系统服务器,所述业务文件是通过对业务文本进行扫描后得到的图片文件,所述业务文件中包含业务编号;
业务系统服务器将所述业务文件发送给AI系统服务器;
AI系统服务器接收所述业务文件,识别所述业务文件的业务编号,并将所述业务文件的业务编号发送给所述业务系统服务器;
业务系统服务器接收所述业务文件的业务编号,并根据所述业务文件的业务编号将所述业务文本上传到与所述业务编号对应的文件系统服务器中。
2.根据权利要求1所述的基于人工智能的文件上传方法,其特征在于,所述AI系统服务器识别所述业务文件的业务编号,包括:
AI系统服务器对所述业务文件进行预处理;
AI系统服务器提取所述业务文件的文字图像特征,并对提取到的文字图像特征进行降维处理;
AI系统服务器将降维处理后的文字图像特征输入到预设的分类器中;
AI系统服务器对所述分类器的分类结果进行后处理。
3.根据权利要求2所述的基于人工智能的文件上传方法,其特征在于,所述AI系统服务器对所述业务文件进行预处理,包括:
AI系统服务器对所述业务文件进行灰度化处理、去除噪声处理、二值化处理、字符切分处理和以及归一化处理。
4.根据权利要求2所述的基于人工智能的文件上传方法,其特征在于,所述AI系统服务器对所述分类器的分类结果进行后处理,包括:
通过预设的语言模型来对所述分类器的分类结果进行校正。
5.根据权利要求1所述的基于人工智能的文件上传方法,其特征在于,所述业务系统服务器将所述业务文件发送给AI系统服务器,包括:业务系统服务器向预设的RabbitMQ消息队列发送第一消息;
所述AI系统服务器接收所述业务文件,包括:AI系统服务器从所述RabbitMQ消息队列接收所述第一消息,并根据所述第一消息获取所述业务文件。
6.根据权利要求5所述的基于人工智能的文件上传方法,其特征在于,所述AI系统服务器将所述业务文件的业务编号发送给所述业务系统服务器,包括:AI系统服务器向所述RabbitMQ消息队列发送第二消息;
所述业务系统服务器接收所述业务文件的业务编号,包括:业务系统服务器从所述RabbitMQ消息队列接收所述第二消息,并根据所述第二消息获取所述业务文件的业务编号。
7.根据权利要求1所述的基于人工智能的文件上传方法,其特征在于,在终端将所述业务文件发送给业务系统服务器之后,所述方法还包括:
终端将所述业务文件从所述待上传文件夹转存到预设的已完成文件夹中。
8.一种基于人工智能的文件上传系统,其特征在于,所述基于人工智能的文件上传系统包括终端、业务系统服务器以及AI系统服务器,所述终端包括第一发送单元,所述业务系统服务器包括第二发送单元以及上传单元,所述AI系统服务器包括识别单元。
第一发送单元,用于若检测到预设的待上传文件夹中存入业务文件,将所述业务文件发送给业务系统服务器,所述业务文件是通过对业务文本进行扫描后得到的图片文件,所述业务文件中包含业务编号;
第二发送单元,用于将所述业务文件发送给AI系统服务器;
识别单元,用于接收所述业务文件,识别所述业务文件的业务编号,并将所述业务文件的业务编号发送给所述业务系统服务器;
上传单元,用于接收所述业务文件的业务编号,并根据所述业务文件的业务编号将所述业务文本上传到与所述业务编号对应的文件系统服务器中。
9.一种基于人工智能的文件上传系统,其特征在于,所述基于人工智能的文件上传系统包括终端、业务系统服务器以及AI系统服务器,所述终端、业务系统服务器以及AI系统服务器均包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述终端、业务系统服务器以及AI系统服务器的处理器执行相应的计算机程序时共同实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有第一计算机程序、第二计算机程序以及第三计算机程序,所述第一计算机程序、第二计算机程序以及第三计算机程序当分别被终端的处理器、业务系统服务器的处理器以及AI系统服务器的处理器执行时可实现如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910945173.3A CN110674091A (zh) | 2019-09-30 | 2019-09-30 | 基于人工智能的文件上传方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910945173.3A CN110674091A (zh) | 2019-09-30 | 2019-09-30 | 基于人工智能的文件上传方法、系统及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110674091A true CN110674091A (zh) | 2020-01-10 |
Family
ID=69080699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910945173.3A Pending CN110674091A (zh) | 2019-09-30 | 2019-09-30 | 基于人工智能的文件上传方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110674091A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112561480A (zh) * | 2020-12-16 | 2021-03-26 | 中国平安人寿保险股份有限公司 | 智能推动工作流方法、设备及计算机存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006331274A (ja) * | 2005-05-30 | 2006-12-07 | Canon Inc | ネットワーク文書管理システム、及びその制御方法、並びに記憶媒体 |
US20080117472A1 (en) * | 2006-11-17 | 2008-05-22 | Nohtomi Kazufumi | Document management system, a document management method, and a document management program |
CN101814168A (zh) * | 2010-04-12 | 2010-08-25 | 福建伊时代信息科技股份有限公司 | 图像数据的动态交互式管理系统及方法 |
CN103870826A (zh) * | 2014-03-31 | 2014-06-18 | 深圳市远行科技有限公司 | 一种电子档案扫描识别建档的方法及系统 |
CN104090983A (zh) * | 2014-07-24 | 2014-10-08 | 羊志伦 | 一种扫描数据处理方法 |
CN105740418A (zh) * | 2016-01-29 | 2016-07-06 | 杭州亿方云网络科技有限公司 | 一种基于文件监控和消息推送的实时同步系统 |
CN107341331A (zh) * | 2016-11-18 | 2017-11-10 | 张益群 | 一种医疗信息处理系统及医疗信息处理方法 |
CN108156238A (zh) * | 2017-12-23 | 2018-06-12 | 贵阳朗玛信息技术股份有限公司 | 一种资料自动化上传的方法及装置 |
CN109446997A (zh) * | 2018-10-31 | 2019-03-08 | 国网山东省电力公司淄博供电公司 | 文档编号自动识别方法 |
JP2019117622A (ja) * | 2017-12-27 | 2019-07-18 | セイコーエプソン株式会社 | 画像処理装置および画像処理プログラム |
CN110049074A (zh) * | 2018-01-13 | 2019-07-23 | 阿里巴巴集团控股有限公司 | 数据上传的方法、系统及存储介质和计算机设备 |
-
2019
- 2019-09-30 CN CN201910945173.3A patent/CN110674091A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006331274A (ja) * | 2005-05-30 | 2006-12-07 | Canon Inc | ネットワーク文書管理システム、及びその制御方法、並びに記憶媒体 |
US20080117472A1 (en) * | 2006-11-17 | 2008-05-22 | Nohtomi Kazufumi | Document management system, a document management method, and a document management program |
CN101814168A (zh) * | 2010-04-12 | 2010-08-25 | 福建伊时代信息科技股份有限公司 | 图像数据的动态交互式管理系统及方法 |
CN103870826A (zh) * | 2014-03-31 | 2014-06-18 | 深圳市远行科技有限公司 | 一种电子档案扫描识别建档的方法及系统 |
CN104090983A (zh) * | 2014-07-24 | 2014-10-08 | 羊志伦 | 一种扫描数据处理方法 |
CN105740418A (zh) * | 2016-01-29 | 2016-07-06 | 杭州亿方云网络科技有限公司 | 一种基于文件监控和消息推送的实时同步系统 |
CN107341331A (zh) * | 2016-11-18 | 2017-11-10 | 张益群 | 一种医疗信息处理系统及医疗信息处理方法 |
CN108156238A (zh) * | 2017-12-23 | 2018-06-12 | 贵阳朗玛信息技术股份有限公司 | 一种资料自动化上传的方法及装置 |
JP2019117622A (ja) * | 2017-12-27 | 2019-07-18 | セイコーエプソン株式会社 | 画像処理装置および画像処理プログラム |
CN110049074A (zh) * | 2018-01-13 | 2019-07-23 | 阿里巴巴集团控股有限公司 | 数据上传的方法、系统及存储介质和计算机设备 |
CN109446997A (zh) * | 2018-10-31 | 2019-03-08 | 国网山东省电力公司淄博供电公司 | 文档编号自动识别方法 |
Non-Patent Citations (1)
Title |
---|
马记等: "《邮政技术设备与管理》", 31 August 2018, 北京邮电大学出版社 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112561480A (zh) * | 2020-12-16 | 2021-03-26 | 中国平安人寿保险股份有限公司 | 智能推动工作流方法、设备及计算机存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10706320B2 (en) | Determining a document type of a digital document | |
CN110008809B (zh) | 表格数据的获取方法、装置和服务器 | |
EP3869385B1 (en) | Method for extracting structural data from image, apparatus and device | |
US8792682B2 (en) | Method and system for identifying a license plate | |
US8873840B2 (en) | Reducing false detection rate using local pattern based post-filter | |
CN110569341B (zh) | 配置聊天机器人的方法、装置、计算机设备和存储介质 | |
CN113160257B (zh) | 图像数据标注方法、装置、电子设备及存储介质 | |
US20150339526A1 (en) | Systems and methods for classifying objects in digital images captured using mobile devices | |
US7734092B2 (en) | Multiple image input for optical character recognition processing systems and methods | |
WO2022121218A1 (zh) | 智能图像识别方法、装置、计算机设备及存储介质 | |
US9870420B2 (en) | Classification and storage of documents | |
US10140510B2 (en) | Machine print, hand print, and signature discrimination | |
CN110942074A (zh) | 字符切分识别方法、装置、电子设备、存储介质 | |
WO2021072876A1 (zh) | 证件图像分类方法、装置、计算机设备及可读存储介质 | |
CN111583180B (zh) | 一种图像的篡改识别方法、装置、计算机设备及存储介质 | |
US20230215125A1 (en) | Data identification method and apparatus | |
WO2022103564A1 (en) | Fraud detection via automated handwriting clustering | |
CN110796210A (zh) | 一种标签信息的识别方法及装置 | |
CN110781811A (zh) | 异常工单识别方法、装置、可读存储介质和计算机设备 | |
CN110674091A (zh) | 基于人工智能的文件上传方法、系统及存储介质 | |
CN114067335A (zh) | 电子档案文本识别方法、系统、计算机设备和存储介质 | |
CN111325207A (zh) | 基于预处理的票据识别方法及装置 | |
EP3639203B1 (en) | Out-of-bounds detection of a document in a live camera feed | |
CN113065619A (zh) | 数据处理方法、装置、计算机可读存储介质及设备 | |
CN115082938A (zh) | 一种文本识别方法、存储介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200110 |