CN111177509A - 一种基于多种方式对信息进行判断的方法及系统 - Google Patents

一种基于多种方式对信息进行判断的方法及系统 Download PDF

Info

Publication number
CN111177509A
CN111177509A CN201911300016.3A CN201911300016A CN111177509A CN 111177509 A CN111177509 A CN 111177509A CN 201911300016 A CN201911300016 A CN 201911300016A CN 111177509 A CN111177509 A CN 111177509A
Authority
CN
China
Prior art keywords
information
similarity
dimensional code
basic data
target object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911300016.3A
Other languages
English (en)
Inventor
刘哲浩
左庆文
汪博
常海兵
王旭航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisino Corp
Original Assignee
Aisino Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisino Corp filed Critical Aisino Corp
Priority to CN201911300016.3A priority Critical patent/CN111177509A/zh
Publication of CN111177509A publication Critical patent/CN111177509A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/14Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
    • G06K7/1404Methods for optical code recognition
    • G06K7/1408Methods for optical code recognition the method being specifically adapted for the type of code
    • G06K7/14172D bar codes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Toxicology (AREA)
  • Electromagnetism (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种基于多种方式对信息进行判断的方法及系统,其中方法包括:通过网络爬虫技术获取用于标识目标对象的基础数据,基础数据包括文本信息和图片信息;当图片信息附加有二维码时,对二维码进行解析,获取目标对象的文本信息,将文本信息添加到基础数据;当图片信息没有附加二维码或二维码无法识别时,通过光学字符识别技术对图片信息中的文字进行解析,确定解析出文本信息的信息项对比图片信息中的信息项的相似度,将文本信息中信息项相似度高于预定阈值的文本信息添加到基础数据;将目标对象的基础数据与目标对象认证过的标准数据进行对比,根据对比结果对目标对象的基础数据进行评价。

Description

一种基于多种方式对信息进行判断的方法及系统
技术领域
本发明涉及网络信息处理技术领域,更具体地,涉及一种基于多种方式对信息进行判断的方法及系统。
背景技术
2017年9月5日,《网络餐饮服务食品安全监督管理办法》由食品药品监管总局局务会议审议通过,自2018年1月1日起施行。统计数据显示,2019年第3季度中国互联网餐饮外卖市场整体交易规模预计将达1952.9亿元人民币,环比上涨11%。与去年同期相比,同比增长35%。从2015年行业交易规模进入高速增长,至今连续5年以来,依然维持全行业规模稳定扩大。
由天第三方平台责任落实不到位,对入网餐饮店把关不严,导致一些“三无”餐饮店在网上“开张”。并且,现有网络餐饮企业数量庞大,一个省份约有十余万商户进行网络餐饮活动,仅靠现有人力几乎无法进行对网络餐饮企业进行有效的监管。现有技术需要在信息化的辅助下,结合人力完成更精准的执法,人力资源投入较大。
网络订餐智能监管云平台是以网络智能搜索技术应用为基础,运用大数据采集分析、人工智能分析等技术,构建的支持食品安全监管部门对网络订餐违法行为进行监督管理的综合业务系统。
网络餐饮监管平台的监管整体方案为:获取商户数据、解析资质信息、获取市场局准入与许可信息、将解析后的商户资质信息与市场局准入、许可数据进行比对分析、输出违规商户信息。其中,解析资质信息是核心关键技术之一。目前,主流的技术分为光学字符识别(OCR)技术与二维码解析两种。
OCR根据证照识别证照内文字;
根据二维码解析,读取该证照内二维码的信息。
使用二维码解析时,信息的准确性虽然高,但是由于二维码只存在于新颁发的证照,如“餐饮服务许可证”、“食品流通许可证”等旧证照没有二维码导致无法识别,或由于因二维码被遮挡、不清晰等问题导致无法识别证照。不仅如此,使用二维码识别等于放弃旧版证照的解析,导致未来几年内无法获取超过有效期的证照信息;然而只使用文字识别对证照解析,对于清晰程度低的图片识别效果及其不理想,导致识别的信息几乎为错误数据,根本无法满足监管要求。
然而只使用文字识别对证照解析,对于清晰程度低的图片识别效果及其不理想,导致识别的信息几乎为错误数据,根本无法满足监管要求。
因此,需要一种技术,以实现基于多种方式对信息进行判断的方法。
发明内容
本发明技术方案提供了一种基于多种方式对信息进行判断的方法及系统,以解决如何基于多种方式对信息进行判断的问题。
为了解决上述问题,本发明提供了一种基于多种方式对信息进行判断的方法,所述方法包括:
通过网络爬虫技术获取用于标识目标对象的基础数据,所述基础数据包括文本信息和图片信息,将所述基础数据进行记录;
判断所述图片信息是否附加有二维码,当所述图片信息附加有二维码时,对所述二维码进行解析,获取所述目标对象的文本信息,将所述文本信息添加到所述基础数据;当所述基础数据中有与解析出文本信息的信息项重复的信息项时,重复部分的信息项只保存一份;
当所述图片信息没有附加二维码或二维码无法识别时,通过光学字符识别技术对所述图片信息中的文字进行解析,确定解析出文本信息的信息项对比图片信息中的信息项的相似度,将所述文本信息中信息项相似度高于预定阈值的文本信息添加到所述基础数据;
将所述目标对象的基础数据与所述目标对象认证过的标准数据进行对比,根据对比结果对所述目标对象的基础数据进行评价。
优选地,所述判断所述图片信息是否附有二维码,当所述图片信息附加有二维码时,对所述二维码进行解析,获取所述目标对象的文本信息,将所述文本信息添加到所述基础数据,还包括:
通过所述二维码直接解析出文本信息;
当所述二维码解析出的内容的为网址链接时,通过所述网址链接,获取所述网址下的文本信息。
优选地,所述确定解析出文本信息的信息项与图片信息中的信息项的相似度,包括:
设置所述信息项的相似度范围为0%至100%,其中:
相似度100%为完全吻合;
相似度90%至99%为基本吻合;
相似度89%到80%为部分吻合;
相似度79%到70%为少数吻合;
相似度69%到60%为极少数吻合;
相似度59%以下为不吻合。
优选地,当所述信息项的相似度低于70%时,将所述信息项标记为无效数据。
优选地,所述图片信息,包括:
所述目标对象的营业执照图片信息、许可证图片信息。
基于本发明的另一方面,提供一种基于多种方式对信息进行判断的系统,所述系统包括:
获取单元,用于通过网络爬虫技术获取用于标识目标对象的基础数据,所述基础数据包括文本信息和图片信息,将所述基础数据进行记录;
第一解析单元,用于判断所述图片信息是否附加有二维码,当所述图片信息附加有二维码时,对所述二维码进行解析,获取所述目标对象的文本信息,将所述文本信息添加到所述基础数据;当所述基础数据中有与解析出文本信息的信息项重复的信息项时,重复部分的信息项只保存一份;
第二解析单元,用于当所述图片信息没有附加二维码或二维码无法识别时,通过光学字符识别技术对所述图片信息中的文字进行解析,确定解析出文本信息的信息项对比图片信息中的信息项的相似度,将所述文本信息中信息项相似度高于预定阈值的文本信息添加到所述基础数据;
评价单元,用于将所述目标对象的基础数据与所述目标对象认证过的标准数据进行对比,根据对比结果对所述目标对象的基础数据进行评价。
优选地,所述第一解析单元用于判断所述图片信息是否附有二维码,当所述图片信息附加有二维码时,对所述二维码进行解析,获取所述目标对象的文本信息,将所述文本信息添加到所述基础数据,还用于:
通过所述二维码直接解析出文本信息;
当所述二维码解析出的内容的为网址链接时,通过所述网址链接,获取所述网址下的文本信息。
优选地,所述第二解析单元用于确定解析出文本信息的信息项与图片信息中的信息项的相似度,还用于:
设置所述信息项的相似度范围为0%至100%,其中:
相似度100%为完全吻合;
相似度90%至99%为基本吻合;
相似度89%到80%为部分吻合;
相似度79%到70%为少数吻合;
相似度69%到60%为极少数吻合;
相似度59%以下为不吻合。
优选地,所述第二解析单元还用于:当所述信息项的相似度低于70%时,将所述信息项标记为无效数据。
优选地,所述图片信息,包括:
所述目标对象的营业执照图片信息、许可证图片信息。
本发明技术方案提供一种基于多种方式对信息进行判断的方法及系统,其中方法包括:通过网络爬虫技术获取用于标识目标对象的基础数据,基础数据包括文本信息和图片信息,将基础数据进行记录;判断图片信息是否附加有二维码,当图片信息附加有二维码时,对二维码进行解析,获取目标对象的文本信息,将文本信息添加到基础数据;当基础数据中有与解析出文本信息的信息项重复的信息项时,重复部分的信息项只保存一份;当图片信息没有附加二维码或二维码无法识别时,通过光学字符识别技术对图片信息中的文字进行解析,确定解析出文本信息的信息项对比图片信息中的信息项的相似度,将文本信息中信息项相似度高于预定阈值的文本信息添加到基础数据;将目标对象的基础数据与目标对象认证过的标准数据进行对比,根据对比结果对目标对象的基础数据进行评价。本发明技术方案提供的一种综合的解决方案,即爬虫、OCR、二维码解析三种技术同时使用,取长补短,解决了无法获取二维码、无二维码、文字解析不清晰或识别错误等多个问题,为网络餐饮企业资格的监管提供最为准确的证照信息。
附图说明
通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:
图1为根据本发明优选实施方式的一种基于多种方式对信息进行判断的方法流程图;
图2为根据本发明优选实施方式的一种基于多种方式对信息进行判断的方法流程图;以及
图3为根据本发明优选实施方式的一种基于多种方式对信息进行判断的系统结构图。
具体实施方式
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
图1为根据本发明优选实施方式的一种基于多种方式对信息进行判断的方法流程图。本申请实施方式综合利用网络爬虫、二维码解析、文字解析等综合手段对经营网络餐饮的商户信息及证照进行识别,提高证照类型的识别率与证照信息的准确性,能进一步排查商家数据,从而能够有效提高监管效率以及监管效果。如图1所示,本申请提供一种基于多种方式对信息进行判断的方法,方法包括:
优选地,在步骤101:通过网络爬虫技术获取用于标识目标对象的基础数据,基础数据包括文本信息和图片信息,将基础数据进行记录。优选地,图片信息,包括:目标对象的营业执照图片信息、许可证图片信息。
如图2所示,本申请首先需要使用网络爬虫技术获取外卖平台商户基本信息、商户资质信息与证照图片信息,其中商户基本信息的资质是外卖平台对商户进行验证后,显示的营业执照与许可证准确信息,但是并非所有商户都会显示资质信息,绝大多数商户仅仅展示证照图片。程序会记录该商户获取的所有信息,并进行保存,此数据作为此商户的基础数据,基础数据包括:基本信息、资质信息、证照图片。
商户基础数据包含以下内容:
商户基本信息:商户名称、商户地址、商户电话、行政区划、所属平台、评分、评价、月售等等;
营业执照:统一社会信用代码或注册号、法定代表人、营业执照经营者名称、住所、成立日期、经营范围、营业期限、发证日期等等;
许可证:证照类型、经营者名称、许可证类型、法人、住所、经营场所、主体业态、业态类别、经营项目、有效期至、许可证编号、发证机关、日常监管机构等等;
营业执照图片、许可证图片、其他图片;
营业执照来源、许可证来源、营业执照相似度、许可证相似度。
优选地,在步骤102:判断图片信息是否附加有二维码,当图片信息附加有二维码时,对二维码进行解析,获取目标对象的文本信息,将文本信息添加到基础数据;当基础数据中有与解析出文本信息的信息项重复的信息项时,重复部分的信息项只保存一份。优选地,判断图片信息是否附有二维码,当图片信息附加有二维码时,对二维码进行解析,获取目标对象的文本信息,将文本信息添加到基础数据,还包括:通过二维码直接解析出文本信息;当二维码解析出的内容的为网址链接时,通过网址链接,获取网址下的文本信息。
本申请对餐饮商户的营业执照图片信息、许可证图片信息等图片信息进行解析,如果该商户营业执照图片信息或者许可证图片信息的有二维码,优先使用二维码对该商户营业执照图片信息或者许可证图片信息进行解析。解析后,可获得证照类型以及证照的详细信息。对于二维码解析图片信息,可分为两种解析结果:
二维码可以直接解析出餐饮商户的资质信息;
二维码解析的内容为URL。
对于第二种解析结果,需要打开此URL链接,并且获取该URL下的商户的资质信息。解析后的资质信息,将补全该商户的基础数据,假设此商户已经存在相同的资质信息,将进行覆盖。
优选地,在步骤103:当图片信息没有附加二维码或二维码无法识别时,通过光学字符识别技术对图片信息中的文字进行解析,确定解析出文本信息的信息项对比图片信息中的信息项的相似度,将文本信息中信息项相似度高于预定阈值的文本信息添加到基础数据。优选地,确定解析出文本信息的信息项与图片信息中的信息项的相似度,包括:
设置信息项的相似度范围为0%至100%,其中:
相似度100%为完全吻合;
相似度90%至99%为基本吻合;
相似度89%到80%为部分吻合;
相似度79%到70%为少数吻合;
相似度69%到60%为极少数吻合;
相似度59%以下为不吻合。优选地,当信息项的相似度低于70%时,将信息项标记为无效数据。
本申请对于无法使用二维码解析的证照图片,使用光学字符识别技术OCR进行解析,考虑到光学字符识别技术OCR解析的准确度不高,所以为了提高数据的可用性,每个字段使用相似度进行划分,从100%到0%,由质量最高到最低。
(1)100%解析出的文字与图片进行校验,完全吻合;
(2)99%到90%为基本吻合;
(3)89%到80%为部分吻合;
(4)79%到70%为少数吻合;
(5)69%到60%为极少数吻合;
(6)59%以下为几乎不吻合,此类数据仅可以作为参考,不能作为有效数据来使用。
光学字符识别技术OCR解析后的信息将补充到商户基础数据内,如果已有数据将不进行覆盖。
优选地,在步骤104:将目标对象的基础数据与目标对象认证过的标准数据进行对比,根据对比结果对目标对象的基础数据进行评价。
本申请将商户基础数据中将记录资质信息的来源进行分类。第一类为“爬虫”、第二位为“二维码”、第三类为“OCR”,根据此来源可对监管数据进行等级划分。此数据将于市场局准入与许可数据进行比对,分析结果也同样带有“来源”与“相似度”。如果数据可信度不高,可将此类数据加以标注,降低无效数据带来的监管效率低的问题。
图3为根据本发明优选实施方式的一种基于多种方式对信息进行判断的系统结构图。如图3所示,本申请提供一种基于多种方式对信息进行判断的系统,系统包括:
获取单元301,用于通过网络爬虫技术获取用于标识目标对象的基础数据,基础数据包括文本信息和图片信息,将基础数据进行记录。优选地,图片信息,包括:目标对象的营业执照图片信息、许可证图片信息。
如图2所示,本申请首先需要使用网络爬虫技术获取外卖平台商户基本信息、商户资质信息与证照图片信息,其中商户基本信息的资质是外卖平台对商户进行验证后,显示的营业执照与许可证准确信息,但是并非所有商户都会显示资质信息,绝大多数商户仅仅展示证照图片。程序会记录该商户获取的所有信息,并进行保存,此数据作为此商户的基础数据,基础数据包括:基本信息、资质信息、证照图片。
商户基础数据包含以下内容:
商户基本信息:商户名称、商户地址、商户电话、行政区划、所属平台、评分、评价、月售等等;
营业执照:统一社会信用代码或注册号、法定代表人、营业执照经营者名称、住所、成立日期、经营范围、营业期限、发证日期等等;
许可证:证照类型、经营者名称、许可证类型、法人、住所、经营场所、主体业态、业态类别、经营项目、有效期至、许可证编号、发证机关、日常监管机构等等;
营业执照图片、许可证图片、其他图片;
营业执照来源、许可证来源、营业执照相似度、许可证相似度。
第一解析单元302,用于判断图片信息是否附加有二维码,当图片信息附加有二维码时,对二维码进行解析,获取目标对象的文本信息,将文本信息添加到基础数据;当基础数据中有与解析出文本信息的信息项重复的信息项时,重复部分的信息项只保存一份。优选地,第一解析单元302用于判断图片信息是否附有二维码,当图片信息附加有二维码时,对二维码进行解析,获取目标对象的文本信息,将文本信息添加到基础数据,还用于:通过二维码直接解析出文本信息;当二维码解析出的内容的为网址链接时,通过网址链接,获取网址下的文本信息。
本申请对餐饮商户的营业执照图片信息、许可证图片信息等图片信息进行解析,如果该商户营业执照图片信息或者许可证图片信息的有二维码,优先使用二维码对该商户营业执照图片信息或者许可证图片信息进行解析。解析后,可获得证照类型以及证照的详细信息。对于二维码解析图片信息,可分为两种解析结果:
二维码可以直接解析出餐饮商户的资质信息;
二维码解析的内容为URL。
对于第二种解析结果,需要打开此URL链接,并且获取该URL下的商户的资质信息。解析后的资质信息,将补全该商户的基础数据,假设此商户已经存在相同的资质信息,将进行覆盖。
第二解析单元303,用于当图片信息没有附加二维码或二维码无法识别时,通过光学字符识别技术对图片信息中的文字进行解析,确定解析出文本信息的信息项对比图片信息中的信息项的相似度,将文本信息中信息项相似度高于预定阈值的文本信息添加到基础数据。
优选地,第二解析单元303用于确定解析出文本信息的信息项与图片信息中的信息项的相似度,还用于:
设置信息项的相似度范围为0%至100%,其中:
相似度100%为完全吻合;
相似度90%至99%为基本吻合;
相似度89%到80%为部分吻合;
相似度79%到70%为少数吻合;
相似度69%到60%为极少数吻合;
相似度59%以下为不吻合。
优选地,第二解析单元303还用于:当信息项的相似度低于70%时,将信息项标记为无效数据。
本申请对于无法使用二维码解析的证照图片,使用光学字符识别技术OCR进行解析,考虑到光学字符识别技术OCR解析的准确度不高,所以为了提高数据的可用性,每个字段使用相似度进行划分,从100%到0%,由质量最高到最低。
(1)100%解析出的文字与图片进行校验,完全吻合;
(2)99%到90%为基本吻合;
(3)89%到80%为部分吻合;
(4)79%到70%为少数吻合;
(5)69%到60%为极少数吻合;
(6)59%以下为几乎不吻合,此类数据仅可以作为参考,不能作为有效数据来使用。
光学字符识别技术OCR解析后的信息将补充到商户基础数据内,如果已有数据将不进行覆盖。
评价单元304,用于将目标对象的基础数据与目标对象认证过的标准数据进行对比,根据对比结果对目标对象的基础数据进行评价。
本申请将商户基础数据中将记录资质信息的来源进行分类。第一类为“爬虫”、第二位为“二维码”、第三类为“OCR”,根据此来源可对监管数据进行等级划分。此数据将于市场局准入与许可数据进行比对,分析结果也同样带有“来源”与“相似度”。如果数据可信度不高,可将此类数据加以标注,降低无效数据带来的监管效率低的问题。
已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。
通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该[装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。

Claims (10)

1.一种基于多种方式对信息进行判断的方法,所述方法包括:
通过网络爬虫技术获取用于标识目标对象的基础数据,所述基础数据包括文本信息和图片信息,将所述基础数据进行记录;
判断所述图片信息是否附加有二维码,当所述图片信息附加有二维码时,对所述二维码进行解析,获取所述目标对象的文本信息,将所述文本信息添加到所述基础数据;当所述基础数据中有与解析出文本信息的信息项重复的信息项时,重复部分的信息项只保存一份;
当所述图片信息没有附加二维码或二维码无法识别时,通过光学字符识别技术对所述图片信息中的文字进行解析,确定解析出文本信息的信息项对比图片信息中的信息项的相似度,将所述文本信息中信息项相似度高于预定阈值的文本信息添加到所述基础数据;
将所述目标对象的基础数据与所述目标对象认证过的标准数据进行对比,根据对比结果对所述目标对象的基础数据进行评价。
2.根据权利要求1所述的方法,所述判断所述图片信息是否附有二维码,当所述图片信息附加有二维码时,对所述二维码进行解析,获取所述目标对象的文本信息,将所述文本信息添加到所述基础数据,还包括:
通过所述二维码直接解析出文本信息;
当所述二维码解析出的内容的为网址链接时,通过所述网址链接,获取所述网址下的文本信息。
3.根据权利要求1所述的方法,所述确定解析出文本信息的信息项与图片信息中的信息项的相似度,包括:
设置所述信息项的相似度范围为0%至100%,其中:
相似度100%为完全吻合;
相似度90%至99%为基本吻合;
相似度89%到80%为部分吻合;
相似度79%到70%为少数吻合;
相似度69%到60%为极少数吻合;
相似度59%以下为不吻合。
4.根据权利要求3所述的方法,当所述信息项的相似度低于70%时,将所述信息项标记为无效数据。
5.根据权利要求1所述的方法,所述图片信息,包括:
所述目标对象的营业执照图片信息、许可证图片信息。
6.一种基于多种方式对信息进行判断的系统,所述系统包括:
获取单元,用于通过网络爬虫技术获取用于标识目标对象的基础数据,所述基础数据包括文本信息和图片信息,将所述基础数据进行记录;
第一解析单元,用于判断所述图片信息是否附加有二维码,当所述图片信息附加有二维码时,对所述二维码进行解析,获取所述目标对象的文本信息,将所述文本信息添加到所述基础数据;当所述基础数据中有与解析出文本信息的信息项重复的信息项时,重复部分的信息项只保存一份;
第二解析单元,用于当所述图片信息没有附加二维码或二维码无法识别时,通过光学字符识别技术对所述图片信息中的文字进行解析,确定解析出文本信息的信息项对比图片信息中的信息项的相似度,将所述文本信息中信息项相似度高于预定阈值的文本信息添加到所述基础数据;
评价单元,用于将所述目标对象的基础数据与所述目标对象认证过的标准数据进行对比,根据对比结果对所述目标对象的基础数据进行评价。
7.根据权利要求6所述的系统,所述第一解析单元用于判断所述图片信息是否附有二维码,当所述图片信息附加有二维码时,对所述二维码进行解析,获取所述目标对象的文本信息,将所述文本信息添加到所述基础数据,还用于:
通过所述二维码直接解析出文本信息;
当所述二维码解析出的内容的为网址链接时,通过所述网址链接,获取所述网址下的文本信息。
8.根据权利要求6所述的系统,所述第二解析单元用于确定解析出文本信息的信息项与图片信息中的信息项的相似度,还用于:
设置所述信息项的相似度范围为0%至100%,其中:
相似度100%为完全吻合;
相似度90%至99%为基本吻合;
相似度89%到80%为部分吻合;
相似度79%到70%为少数吻合;
相似度69%到60%为极少数吻合;
相似度59%以下为不吻合。
9.根据权利要求8所述的系统,所述第二解析单元还用于:当所述信息项的相似度低于70%时,将所述信息项标记为无效数据。
10.根据权利要求6所述的系统,所述图片信息,包括:
所述目标对象的营业执照图片信息、许可证图片信息。
CN201911300016.3A 2019-12-16 2019-12-16 一种基于多种方式对信息进行判断的方法及系统 Pending CN111177509A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911300016.3A CN111177509A (zh) 2019-12-16 2019-12-16 一种基于多种方式对信息进行判断的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911300016.3A CN111177509A (zh) 2019-12-16 2019-12-16 一种基于多种方式对信息进行判断的方法及系统

Publications (1)

Publication Number Publication Date
CN111177509A true CN111177509A (zh) 2020-05-19

Family

ID=70653898

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911300016.3A Pending CN111177509A (zh) 2019-12-16 2019-12-16 一种基于多种方式对信息进行判断的方法及系统

Country Status (1)

Country Link
CN (1) CN111177509A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6385992A (ja) * 1986-09-30 1988-04-16 Tokyo Electric Co Ltd コ−ド読取装置
US20080279455A1 (en) * 2007-05-11 2008-11-13 Symcor, Inc. Machine character recognition verification
CN107609807A (zh) * 2017-11-08 2018-01-19 厦门美亚商鼎信息科技有限公司 一种网络餐饮风险识别方法及系统
CN108053545A (zh) * 2017-12-29 2018-05-18 百度在线网络技术(北京)有限公司 证件验真方法和装置、服务器、存储介质
CN109815765A (zh) * 2019-01-21 2019-05-28 东南大学 一种提取含有二维码的营业执照信息的方法及装置
CN110059705A (zh) * 2019-04-22 2019-07-26 厦门商集网络科技有限责任公司 一种基于建模的ocr识别结果判决方法和设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6385992A (ja) * 1986-09-30 1988-04-16 Tokyo Electric Co Ltd コ−ド読取装置
US20080279455A1 (en) * 2007-05-11 2008-11-13 Symcor, Inc. Machine character recognition verification
CN107609807A (zh) * 2017-11-08 2018-01-19 厦门美亚商鼎信息科技有限公司 一种网络餐饮风险识别方法及系统
CN108053545A (zh) * 2017-12-29 2018-05-18 百度在线网络技术(北京)有限公司 证件验真方法和装置、服务器、存储介质
CN109815765A (zh) * 2019-01-21 2019-05-28 东南大学 一种提取含有二维码的营业执照信息的方法及装置
CN110059705A (zh) * 2019-04-22 2019-07-26 厦门商集网络科技有限责任公司 一种基于建模的ocr识别结果判决方法和设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
冉迅;袁建华;刘玉国;胡杨;: "基于负载均衡的移动发票管理系统研究", 计算机与现代化, no. 10, pages 121 - 126 *

Similar Documents

Publication Publication Date Title
US7693767B2 (en) Method for generating predictive models for a business problem via supervised learning
CN111782835B (zh) 一种面向人脸识别设备检测的人脸测试数据库管理系统及方法
CN111190881A (zh) 一种数据治理方法和系统
US9152620B2 (en) System, method, and computer-readable medium for plagiarism detection
CN107798541B (zh) 一种用于在线业务的监控方法及系统
US20110055072A1 (en) Event processing for detection of suspicious financial activity
CN111241367A (zh) 一种基于自定义规则对网络餐饮平台进行监管的方法及系统
CN112446555B (zh) 一种风险识别方法、装置及设备
CN112765565B (zh) 基于区块链的版权保护方法及系统
CN111291331B (zh) 混源文件许可冲突检测方法
Singh et al. Design and implementation of continuous monitoring and auditing in SAP enterprise resource planning
CN110930205A (zh) 一种发票数据分析方法
CN110796553A (zh) 业务请求处理方法、装置、终端及存储介质
CN111126844A (zh) 涉众型风险企业的评估方法、装置、设备及存储介质
Beltzung et al. Real-time detection of fake-shops through machine learning
KR102682907B1 (ko) 계층 구조를 이용한 컴플라이언스 관리 체계 지원 시스템 및 그 방법
CN109284978B (zh) 一种精准识别贫困户的系统及识别方法
CN113642975A (zh) 基于区块链的氢能监管方法和系统
CN109544179B (zh) 基于重要产品追溯数据服务的运行支撑系统
CN111177509A (zh) 一种基于多种方式对信息进行判断的方法及系统
CN111222033A (zh) 一种基于海量数据监管网络餐饮企业的方法和系统
KR101178998B1 (ko) 데이터 인증 방법 및 시스템
CN115952186A (zh) 一种问题数据及其链路追溯方法及装置
Beg et al. Data quality-A problem and An Approach
KR102221520B1 (ko) 블록체인 기반의 경찰 인력 통합인사관리 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination