CN111241367A - 一种基于自定义规则对网络餐饮平台进行监管的方法及系统 - Google Patents

一种基于自定义规则对网络餐饮平台进行监管的方法及系统 Download PDF

Info

Publication number
CN111241367A
CN111241367A CN201911372628.3A CN201911372628A CN111241367A CN 111241367 A CN111241367 A CN 111241367A CN 201911372628 A CN201911372628 A CN 201911372628A CN 111241367 A CN111241367 A CN 111241367A
Authority
CN
China
Prior art keywords
business
information
merchant
certificate
comment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911372628.3A
Other languages
English (en)
Inventor
王旭航
刘哲浩
左庆文
谢志虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisino Corp
Original Assignee
Aisino Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisino Corp filed Critical Aisino Corp
Priority to CN201911372628.3A priority Critical patent/CN111241367A/zh
Publication of CN111241367A publication Critical patent/CN111241367A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/14Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
    • G06K7/1404Methods for optical code recognition
    • G06K7/1408Methods for optical code recognition the method being specifically adapted for the type of code
    • G06K7/14172D bar codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Electromagnetism (AREA)
  • General Health & Medical Sciences (AREA)
  • Toxicology (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于自定义规则对网络餐饮平台进行监管的方法及系统,包括:获取网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息;对获取的营业证件图像数据进行信息识别,以获取每个商户的营业证件文字信息;根据网络餐饮监管范围及标准确定自定义的违规营业行为判断规则,并基于所述违规营业行为判断规则,将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,对每个商户的每条评论信息进行差评分析,并根据获取的比对结果和差评分析结果确定商户是否存在违规营业行为;当确定存在违规营业行为的商户时,对商户标识,并按照预设的告警方式推送存在违规营业行为的商户的商户信息至监管部门。

Description

一种基于自定义规则对网络餐饮平台进行监管的方法及系统
技术领域
本发明涉及数据分析技术领域,并且更具体地,涉及一种基于自定义规则对网络餐饮平台进行监管的方法及系统。
背景技术
目前,越来越多的商家通过互联网提供外卖服务,然而,对于网上餐饮服务的监管存在着以下问题:1、第三方平台责任落实不到位,对入网餐饮店把关不严,导致一些“三无”餐饮店在网上“开张”;2、部分入网餐饮企业经营管理水平有限,经营条件简陋,食品安全存在隐患;3、网络餐饮企业数量庞大,仅靠现有人力几乎无法进行有效监管。需要在信息化的辅助下,结合人力完成更精准的执法;4、不同地区的网络餐饮监管有不同的监管标准,并且同一地区也会有不同类型的监管任务。
网络订餐的监管是食品安全管理信息化的重要组成部分。因此,食品安全监督部门对网络订餐行业的监管已经刻不容缓,需要一种基于自定义规则对网络餐饮平台进行监管的方法。
发明内容
本发明提出一种基于自定义规则对网络餐饮平台进行监管的方法及系统,以解决如何对网络餐饮平台进行监管的问题。
为了解决上述问题,根据本发明的一个方面,提供了一种基于自定义规则对网络餐饮平台进行监管的方法,所述方法包括:
获取网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息;
利用光学字符识别技术和二维码解析技术,对获取的营业证件图像数据进行信息识别,以获取每个商户的营业证件文字信息;
根据网络餐饮监管范围及标准确定自定义的违规营业行为判断规则,并基于所述违规营业行为判断规则,将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,对每个商户的每条评论信息进行差评分析,并根据获取的比对结果和差评分析结果确定商户是否存在违规营业行为;
当确定存在违规营业行为的商户时,根据具体的违规营业行为的违规等级对商户标识,并按照预设的告警方式推送存在违规营业行为的商户的商户信息至监管部门。
优选地,其中所述获取网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息,包括:
利用网络爬虫软件,启动多个搜索引擎爬虫以多线程的方式模拟浏览器对网络餐饮平台上的商户的信息进行请求,自动采集网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息。
优选地,其中所述利用光学字符识别技术和二维码解析技术,对获取的营业证件图像数据进行信息识别,以获取每个商户的营业证件文字信息,包括:
对获取的营业证件图像数据进行二值化、噪声去除及倾斜较正处理,以获取经过处理的营业证件图像数据;
利用光学字符识别技术和二维码解析技术对经过处理的营业证件图像数据进行信息识别,以获取文字识别信息;
按照预设的校正规则对获取的文字识别信息进行校正,以获取营业证件文字信息。
优选地,其中所述将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,对每个商户的每条评论信息进行差评分析,并根据获取的比对结果和差评分析结果确定商户是否存在违规营业行为,包括:
将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,若比对结果指示商户的营业证件信息不存在;或营业证件信息与所述已建立的商户证件信息库中的信息不一致,或营业证件信息已超过有效期,则确定商户存在营业证件信息有误的违规营业行为;
对每个商户的每条评论信息进行分词处理,根据预设的差评词库提取评论信息中的差评关键词数量,并计算差评率,若所述差评率大于等于预设的差评概率阈值,则确定商户存在差评率过高的违规营业行为。
优选地,其中所述方法还包括:
判断每个商户的营业证件是否完整,若不完整,则确定商户存在缺少营业证件信息的违规营业行为;
判断每个商户的经营菜品是否超过已登记的营业范围,若是,则确定商户存在超营业范围的违规营业行为。
根据本发明的另一个方面,提供了一种基于自定义规则对网络餐饮平台进行监管的系统,其特征在于,所述系统包括:
数据获取单元,用于获取网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息;
信息识别单元,用于利用光学字符识别技术和二维码解析技术,对获取的营业证件图像数据进行信息识别,以获取每个商户的营业证件文字信息;
营业行为分析单元,用于根据网络餐饮监管范围及标准确定自定义的违规营业行为判断规则,并基于所述违规营业行为判断规则,将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,对每个商户的每条评论信息进行差评分析,并根据获取的比对结果和差评分析结果确定商户是否存在违规营业行为;
告警单元,用于当确定存在违规营业行为的商户时,根据具体的违规营业行为的违规等级对商户标识,并按照预设的告警方式推送存在违规营业行为的商户的商户信息至监管部门。
优选地,其中所述数据获取单元,获取网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息,包括:
利用网络爬虫软件,启动多个搜索引擎爬虫以多线程的方式模拟浏览器对网络餐饮平台上的商户的信息进行请求,自动采集网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息。
优选地,其中所述信息识别单元,利用光学字符识别技术和二维码解析技术,对获取的营业证件图像数据进行信息识别,以获取每个商户的营业证件文字信息,包括:
对获取的营业证件图像数据进行二值化、噪声去除及倾斜较正处理,以获取经过处理的营业证件图像数据;
利用光学字符识别技术和二维码解析技术对经过处理的营业证件图像数据进行信息识别,以获取文字识别信息;
按照预设的校正规则对获取的文字识别信息进行校正,以获取营业证件文字信息。
优选地,其中所述营业行为分析单元,将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,对每个商户的每条评论信息进行差评分析,并根据获取的比对结果和差评分析结果确定商户是否存在违规营业行为,包括:
将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,若比对结果指示商户的营业证件信息不存在;或营业证件信息与所述已建立的商户证件信息库中的信息不一致,或营业证件信息已超过有效期,则确定商户存在营业证件信息有误的违规营业行为;
对每个商户的每条评论信息进行分词处理,根据预设的差评词库提取评论信息中的差评关键词数量,并计算差评率,若所述差评率大于等于预设的差评概率阈值,则确定商户存在差评率过高的违规营业行为。
优选地,其中所述营业行为分析单元,还包括:
判断每个商户的营业证件是否完整,若不完整,则确定商户存在缺少营业证件信息的违规营业行为;
判断每个商户的经营菜品是否超过已登记的营业范围,若是,则确定商户存在超营业范围的违规营业行为。
本发明提供了一种基于自定义规则对网络餐饮平台进行监管的方法及系统,可以根据预设的违规营业行为判断规则确定商户是否存在营业证件信息有误、差评率过高、缺少营业证件信息和超营业范围等违规营业行为,并且可以根据监管场景的不同设置不同的判断规则,使网络餐饮监管方法更加灵活,对于保障网络订餐食品安全,提升监管部门对网络送餐风险的监测及识别能力具有特别重要的意义。
附图说明
通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:
图1为根据本发明实施方式的基于自定义规则对网络餐饮平台进行监管的方法100的流程图;
图2为根据本发明实施方式对网络餐饮平台进行监管的示意图;
图3为根据本发明实施方式的比对规则的示意图;以及
图4为根据本发明实施方式的基于自定义规则对网络餐饮平台进行监管的系统400的结构示意图。
具体实施方式
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
图1为根据本发明实施方式的基于自定义规则对网络餐饮平台进行监管的方法100的流程图。如图1所示,本发明实施方式提供的基于自定义规则对网络餐饮平台进行监管的方法,,可以根据预设的违规营业行为判断规则确定商户是否存在营业证件信息有误、差评率过高、缺少营业证件信息和超营业范围等违规营业行为,并且可以根据监管场景的不同设置不同的判断规则,使网络餐饮监管方法更加灵活,对于保障网络订餐食品安全,提升监管部门对网络送餐风险的监测及识别能力具有特别重要的意义。本发明实施方式提供的基于自定义规则对网络餐饮平台进行监管的方法100,从步骤101处开始,在步骤101获取网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息。
优选地,其中所述获取网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息,包括:
利用网络爬虫软件,启动多个搜索引擎爬虫以多线程的方式模拟浏览器对网络餐饮平台上的商户的信息进行请求,自动采集网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息。
在本发明的实施方式中,利用网络爬虫软件,启动多个搜索引擎爬虫以多线程的方式模拟浏览器对网络餐饮平台上的商户的信息进行请求,自动采集网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息;其中,营业证件包括:营业执照证和营业许可证等;商户信息包括:餐厅名称、营业地址、餐厅电话、负责人信息等。另外,在获取信息前,对搜索引擎下载分页的解析结果,经过URL排重分析、排除广告等无关内容等优化选择处理。
在步骤102,利用光学字符识别技术和二维码解析技术,对获取的营业证件图像数据进行信息识别,以获取每个商户的营业证件文字信息。
优选地,其中所述利用光学字符识别技术和二维码解析技术,对获取的营业证件图像数据进行信息识别,以获取每个商户的营业证件文字信息,包括:
对获取的营业证件图像数据进行二值化、噪声去除及倾斜较正处理,以获取经过处理的营业证件图像数据;
利用光学字符识别技术和二维码解析技术对经过处理的营业证件图像数据进行信息识别,以获取文字识别信息;
按照预设的校正规则对获取的文字识别信息进行校正,以获取营业证件文字信息。
在本发明的实施方式中,通过光学字符识别OCR)与二维码解析技术,把流获取到的营业证件图像数据进行分析,并进行校正和格式整理后输出营业证件文字信息。
在步骤103,根据网络餐饮监管范围及标准确定自定义的违规营业行为判断规则,并基于所述违规营业行为判断规则,将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,对每个商户的每条评论信息进行差评分析,并根据获取的比对结果和差评分析结果确定商户是否存在违规营业行为。
优选地,其中所述将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,对每个商户的每条评论信息进行差评分析,并根据获取的比对结果和差评分析结果确定商户是否存在违规营业行为,包括:
将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,若比对结果指示商户的营业证件信息不存在;或营业证件信息与所述已建立的商户证件信息库中的信息不一致,或营业证件信息已超过有效期,则确定商户存在营业证件信息有误的违规营业行为;
对每个商户的每条评论信息进行分词处理,根据预设的差评词库提取评论信息中的差评关键词数量,并计算差评率,若所述差评率大于等于预设的差评概率阈值,则确定商户存在差评率过高的违规营业行为。
优选地,其中所述方法还包括:
判断每个商户的营业证件是否完整,若不完整,则确定商户存在缺少营业证件信息的违规营业行为;
判断每个商户的经营菜品是否超过已登记的营业范围,若是,则确定商户存在超营业范围的违规营业行为。
在本发明的实施方式中,基于自定义的违规营业行为判断规则建立算法模型,并把识别出的营业证件文字信息与监管部门持有的证照信息进行比对;通过自定义差评关键词数据库,根据商户对应点评价信息,对问题商家进行过滤等。其中,对于自定义的违规营业行为判断规则,可以是通用模板,也可以继承上级模板。例如:市级规则创建时默认跟随上级省级自定义的规则,当然,也可以选择使用通用模板。对于上级机构,也可以能够选择是否重置下级机构的规则模板。例如:重置省级规则模板时选择重置下级机构模板,那么此省份下级的市级、区级模板都会重置为默认的规则。
图2为根据本发明实施方式对网络餐饮平台进行监管的示意图。如图2所示,包括:通网络爬取商户信息;识别出证件照信息;将识别出的证件照信息和监管部门持有的商户信息进行,基于自定义的比对规则进行比对,获取比对结果,并展示。
图3为根据本发明实施方式的比对规则的示意图。如图3所示,比对规则包括:营业执照规则、许可证规则、两证比对规则、评论关键词规则和经营范围规则。
在本发明的实施方式中,自定义的比对规则即为违规营业行为判断规则,包括:
1、营业执照未公示:未上传营业执照,即上传的附件中无法识别为营业执照(包括类型营业执照);
2、许可证未公示:未上传餐饮服务许可证、食品经营许可证、小餐饮(根据不同省市规则可选择);
(1)小餐饮许可证是否可以进行网上订餐;
(2)食品经营许可证>主体业态:食品销售经营者>经营项目:包含哪些信息可以进行网上订餐。如:包含热食类食品制售、冷食类食品制售、糕点类食品制售、自制饮品制售等“制售”字样时,可进行上网订餐,未包含时,列为未公示许可证。
3、虚假营业执照:通过OCR识别的统一社会信用代码,在数据库进行查询,存在时视为“真实”,不存在视为“虚假”;
(1)优先识别二维码;
(2)二维码无法识别或不存在二维码时识别文字信息;
(3)相似度低于60%时,视为识别失败(可设置)。
4、虚假许可证:通过OCR识别的许可证号码,在数据库进行查询,存在时视为“真实”,不存在视为“虚假”;
(1)优先识别二维码;
(2)二维码无法识别或不存在二维码时识别文字信息;
(3)相似度低于60%时,视为识别失败(可设置)。
5、营业执照虚假地址:通过OCR识别的营业执照住所与该统一社会信用代码关联的数据库中住所信息不符;
(1)优先识别二维码;
(2)二维码无法识别或不存在二维码时识别文字信息;
(3)相似度低于60%时,视为识别失败(可设置)。
6、许可证虚假地址:通过OCR识别的许可证经营场所与该许可证编号所关联的数据库中经营场所信息不符;
(1)优先识别二维码;
(2)二维码无法识别或不存在二维码时识别文字信息;
(3)相似度低于60%时,视为识别失败(可设置)。
7、营业执照有效期:通过OCR识别的有效期至与当前时间进行对比,分为“超有效期”“近有效期“”有效期内“;
(1)优先识别二维码;
(2)二维码无法识别或不存在二维码时识别文字信息;
(3)相似度低于60%时,视为识别失败(可设置)。
8、许可证有效期:通过OCR识别的有效期至与当前时间进行对比,分为“超有效期”“近有效期”“有效期内”;
(1)优先识别二维码;
(2)二维码无法识别或不存在二维码时识别文字信息;
(3)相似度低于60%时,视为识别失败(可设置)。
9、两证比对:营业执照与许可证进行比对,比对法人、住所(可设置);
(1)两证匹配:识别后的营业执照信息与许可证信息匹配;
(2)信息不符:识别后的营业执照信息与许可证信息不符;
(3)不可比对:因其中一个证件或两个证件未公示而无法对比;
(4)无法识别:两证齐全,但因无法识别等问题不能进行对比;
10、学校食堂:食品经营许可证编号“JY3“开头,可设置;
(1)优先识别二维码;
(2)二维码无法识别或不存在二维码时识别文字信息;
(3)相似度低于60%时,视为识别失败(可设置)。
11、美食广场:根据许可证名称与经营场所判断(可设置);
12、商户经营状况:未在平台注册、月销售0(可设置);
13、套用营业执照:同一个统一社会信用代码被使用2次以上;
14、套用许可证:同一个许可证号码被使用2次以上;
15、地址重复:许可证经营地址重复或商户登记地址重复(可设置)。
16、评论筛选关键词:首先录入关键词库,其次对同一商家的评论中差评关键词出现的概率进行定义,超过此概率的商家在比对结果中进行体现。
17、经营范围:首先录入菜品库,其次对同一商家的经营菜品进行判断,若超出了商家的经营范围,在结果中进行体现。
具体地,将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,若比对结果指示商户的营业证件信息不存在;或营业证件信息与所述已建立的商户证件信息库中的信息不一致,或营业证件信息已超过有效期,则确定商户存在营业证件信息有误的违规营业行为。对每个商户的每条评论信息进行分词处理,根据预设的差评词库提取评论信息中的差评关键词数量,并计算差评率,若所述差评率大于等于预设的差评概率阈值,则确定商户存在差评率过高的违规营业行为。判断每个商户的营业证件是否完整,若不完整,则确定商户存在缺少营业证件信息的违规营业行为。判断每个商户的经营菜品是否超过已登记的营业范围,若是,则确定商户存在超营业范围的违规营业行为。
在步骤104,当确定存在违规营业行为的商户时,根据具体的违规营业行为的违规等级对商户标识,并按照预设的告警方式推送存在违规营业行为的商户的商户信息至监管部门。
在本发明的实施方式中,当确定存在违规营业行为的商户时,对其进行标识。例如:为商户增加超营业范围标识、缺少营业证件信息标识或营业证件信息有误标识等。然后,根据确定的具体的违规营业行为确定告警方式,并推送商户信息至监管部门,以提醒监管部门需要对该商户进行检查。
图4为根据本发明实施方式的基于自定义规则对网络餐饮平台进行监管的系统400的结构示意图。如图4所示,本发明实施方式提供的基于自定义规则对网络餐饮平台进行监管的系统400,包括:数据获取单元401、信息识别单元402、营业行为分析单元403和告警单元404。
优选地,所述数据获取单元401,用于获取网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息。
优选地,其中所述数据获取单元401,获取网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息,包括:
利用网络爬虫软件,启动多个搜索引擎爬虫以多线程的方式模拟浏览器对网络餐饮平台上的商户的信息进行请求,自动采集网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息。
优选地,所述信息识别单元402,用于利用光学字符识别技术和二维码解析技术,对获取的营业证件图像数据进行信息识别,以获取每个商户的营业证件文字信息。
优选地,其中所述信息识别单元402,利用光学字符识别技术和二维码解析技术,对获取的营业证件图像数据进行信息识别,以获取每个商户的营业证件文字信息,包括:
对获取的营业证件图像数据进行二值化、噪声去除及倾斜较正处理,以获取经过处理的营业证件图像数据;
利用光学字符识别技术和二维码解析技术对经过处理的营业证件图像数据进行信息识别,以获取文字识别信息;
按照预设的校正规则对获取的文字识别信息进行校正,以获取营业证件文字信息。
优选地,所述营业行为分析单元403,用于根据网络餐饮监管范围及标准确定自定义的违规营业行为判断规则,并基于所述违规营业行为判断规则,将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,对每个商户的每条评论信息进行差评分析,并根据获取的比对结果和差评分析结果确定商户是否存在违规营业行为。
优选地,其中所述营业行为分析单元403,将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,对每个商户的每条评论信息进行差评分析,并根据获取的比对结果和差评分析结果确定商户是否存在违规营业行为,包括:
将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,若比对结果指示商户的营业证件信息不存在;或营业证件信息与所述已建立的商户证件信息库中的信息不一致,或营业证件信息已超过有效期,则确定商户存在营业证件信息有误的违规营业行为;
对每个商户的每条评论信息进行分词处理,根据预设的差评词库提取评论信息中的差评关键词数量,并计算差评率,若所述差评率大于等于预设的差评概率阈值,则确定商户存在差评率过高的违规营业行为。
优选地,其中所述营业行为分析单元403,还包括:
判断每个商户的营业证件是否完整,若不完整,则确定商户存在缺少营业证件信息的违规营业行为;
判断每个商户的经营菜品是否超过已登记的营业范围,若是,则确定商户存在超营业范围的违规营业行为。
优选地,所述告警单元404,用于当确定存在违规营业行为的商户时,根据具体的违规营业行为的违规等级对商户标识,并按照预设的告警方式推送存在违规营业行为的商户的商户信息至监管部门。
本发明的实施例的基于自定义规则对网络餐饮平台进行监管的系统400与本发明的另一个实施例的基于自定义规则对网络餐饮平台进行监管的方法100相对应,在此不再赘述。
已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。
通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该[装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (10)

1.一种基于自定义规则对网络餐饮平台进行监管的方法,其特征在于,所述方法包括:
获取网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息;
利用光学字符识别技术和二维码解析技术,对获取的营业证件图像数据进行信息识别,以获取每个商户的营业证件文字信息;
根据网络餐饮监管范围及标准确定自定义的违规营业行为判断规则,并基于所述违规营业行为判断规则,将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,对每个商户的每条评论信息进行差评分析,并根据获取的比对结果和差评分析结果确定商户是否存在违规营业行为;
当确定存在违规营业行为的商户时,根据具体的违规营业行为的违规等级对商户标识,并按照预设的告警方式推送存在违规营业行为的商户的商户信息至监管部门。
2.根据权利要求1所述的方法,其特征在于,所述获取网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息,包括:
利用网络爬虫软件,启动多个搜索引擎爬虫以多线程的方式模拟浏览器对网络餐饮平台上的商户的信息进行请求,自动采集网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息。
3.根据权利要求1所述的方法,其特征在于,所述利用光学字符识别技术和二维码解析技术,对获取的营业证件图像数据进行信息识别,以获取每个商户的营业证件文字信息,包括:
对获取的营业证件图像数据进行二值化、噪声去除及倾斜较正处理,以获取经过处理的营业证件图像数据;
利用光学字符识别技术和二维码解析技术对经过处理的营业证件图像数据进行信息识别,以获取文字识别信息;
按照预设的校正规则对获取的文字识别信息进行校正,以获取营业证件文字信息。
4.根据权利要求1所述的方法,其特征在于,所述将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,对每个商户的每条评论信息进行差评分析,并根据获取的比对结果和差评分析结果确定商户是否存在违规营业行为,包括:
将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,若比对结果指示商户的营业证件信息不存在;或营业证件信息与所述已建立的商户证件信息库中的信息不一致,或营业证件信息已超过有效期,则确定商户存在营业证件信息有误的违规营业行为;
对每个商户的每条评论信息进行分词处理,根据预设的差评词库提取评论信息中的差评关键词数量,并计算差评率,若所述差评率大于等于预设的差评概率阈值,则确定商户存在差评率过高的违规营业行为。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
判断每个商户的营业证件是否完整,若不完整,则确定商户存在缺少营业证件信息的违规营业行为;
判断每个商户的经营菜品是否超过已登记的营业范围,若是,则确定商户存在超营业范围的违规营业行为。
6.一种基于自定义规则对网络餐饮平台进行监管的系统,其特征在于,所述系统包括:
数据获取单元,用于获取网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息;
信息识别单元,用于利用光学字符识别技术和二维码解析技术,对获取的营业证件图像数据进行信息识别,以获取每个商户的营业证件文字信息;
营业行为分析单元,用于根据网络餐饮监管范围及标准确定自定义的违规营业行为判断规则,并基于所述违规营业行为判断规则,将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,对每个商户的每条评论信息进行差评分析,并根据获取的比对结果和差评分析结果确定商户是否存在违规营业行为;
告警单元,用于当确定存在违规营业行为的商户时,根据具体的违规营业行为的违规等级对商户标识,并按照预设的告警方式推送存在违规营业行为的商户的商户信息至监管部门。
7.根据权利要求6所述的系统,其特征在于,所述数据获取单元,获取网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息,包括:
利用网络爬虫软件,启动多个搜索引擎爬虫以多线程的方式模拟浏览器对网络餐饮平台上的商户的信息进行请求,自动采集网络餐饮平台中每个商户的商户信息、营业证件图像数据和评论信息。
8.根据权利要求6所述的系统,其特征在于,所述信息识别单元,利用光学字符识别技术和二维码解析技术,对获取的营业证件图像数据进行信息识别,以获取每个商户的营业证件文字信息,包括:
对获取的营业证件图像数据进行二值化、噪声去除及倾斜较正处理,以获取经过处理的营业证件图像数据;
利用光学字符识别技术和二维码解析技术对经过处理的营业证件图像数据进行信息识别,以获取文字识别信息;
按照预设的校正规则对获取的文字识别信息进行校正,以获取营业证件文字信息。
9.根据权利要求6所述的系统,其特征在于,所述营业行为分析单元,将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,对每个商户的每条评论信息进行差评分析,并根据获取的比对结果和差评分析结果确定商户是否存在违规营业行为,包括:
将获取的每个商户的营业证件信息和已建立的商户证件信息库中的数据进行比对,若比对结果指示商户的营业证件信息不存在;或营业证件信息与所述已建立的商户证件信息库中的信息不一致,或营业证件信息已超过有效期,则确定商户存在营业证件信息有误的违规营业行为;
对每个商户的每条评论信息进行分词处理,根据预设的差评词库提取评论信息中的差评关键词数量,并计算差评率,若所述差评率大于等于预设的差评概率阈值,则确定商户存在差评率过高的违规营业行为。
10.根据权利要求6所述的系统,其特征在于,所述营业行为分析单元,还包括:
判断每个商户的营业证件是否完整,若不完整,则确定商户存在缺少营业证件信息的违规营业行为;
判断每个商户的经营菜品是否超过已登记的营业范围,若是,则确定商户存在超营业范围的违规营业行为。
CN201911372628.3A 2019-12-27 2019-12-27 一种基于自定义规则对网络餐饮平台进行监管的方法及系统 Pending CN111241367A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911372628.3A CN111241367A (zh) 2019-12-27 2019-12-27 一种基于自定义规则对网络餐饮平台进行监管的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911372628.3A CN111241367A (zh) 2019-12-27 2019-12-27 一种基于自定义规则对网络餐饮平台进行监管的方法及系统

Publications (1)

Publication Number Publication Date
CN111241367A true CN111241367A (zh) 2020-06-05

Family

ID=70874106

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911372628.3A Pending CN111241367A (zh) 2019-12-27 2019-12-27 一种基于自定义规则对网络餐饮平台进行监管的方法及系统

Country Status (1)

Country Link
CN (1) CN111241367A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111563806A (zh) * 2020-07-20 2020-08-21 平安国际智慧城市科技股份有限公司 网络平台中商家合规性识别方法、装置、介质及电子设备
CN111861507A (zh) * 2020-06-30 2020-10-30 成都数之联科技有限公司 一种用于实时分析网络餐饮店铺风险的识别方法及系统
CN111985935A (zh) * 2020-08-17 2020-11-24 支付宝(杭州)信息技术有限公司 一种商户信息的检验方法、装置及设备
CN111985936A (zh) * 2020-08-17 2020-11-24 支付宝(杭州)信息技术有限公司 一种商户证件信息的检验方法、装置及设备
CN112001662A (zh) * 2020-09-14 2020-11-27 支付宝(杭州)信息技术有限公司 一种商户图像的风险检验方法、装置及设备
CN112464818A (zh) * 2020-11-27 2021-03-09 北京软通智慧城市科技有限公司 后厨监管方法、装置、设备及存储介质
CN113159911A (zh) * 2021-02-25 2021-07-23 华夏方圆信用评估有限公司 基于大数据平台的智能招投标主体履约监控及系统
CN115187065A (zh) * 2022-07-11 2022-10-14 湖北帅锐服装贸易有限公司 一种基于电子商务平台的服装类商品质量分析系统
CN116611614A (zh) * 2023-05-17 2023-08-18 南京邮电大学 一种基于大数据平台的商户出餐管理方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609807A (zh) * 2017-11-08 2018-01-19 厦门美亚商鼎信息科技有限公司 一种网络餐饮风险识别方法及系统
CN108510411A (zh) * 2018-04-12 2018-09-07 陈静 一种基于大数据的餐饮信息安全监管系统
CN108717636A (zh) * 2018-03-19 2018-10-30 杭州祐全科技发展有限公司 一种网络订餐智能监管方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609807A (zh) * 2017-11-08 2018-01-19 厦门美亚商鼎信息科技有限公司 一种网络餐饮风险识别方法及系统
CN108717636A (zh) * 2018-03-19 2018-10-30 杭州祐全科技发展有限公司 一种网络订餐智能监管方法
CN108510411A (zh) * 2018-04-12 2018-09-07 陈静 一种基于大数据的餐饮信息安全监管系统

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111861507A (zh) * 2020-06-30 2020-10-30 成都数之联科技有限公司 一种用于实时分析网络餐饮店铺风险的识别方法及系统
CN111861507B (zh) * 2020-06-30 2023-10-24 成都数之联科技股份有限公司 一种用于实时分析网络餐饮店铺风险的识别方法及系统
CN111563806A (zh) * 2020-07-20 2020-08-21 平安国际智慧城市科技股份有限公司 网络平台中商家合规性识别方法、装置、介质及电子设备
CN111985935A (zh) * 2020-08-17 2020-11-24 支付宝(杭州)信息技术有限公司 一种商户信息的检验方法、装置及设备
CN111985936A (zh) * 2020-08-17 2020-11-24 支付宝(杭州)信息技术有限公司 一种商户证件信息的检验方法、装置及设备
CN112001662A (zh) * 2020-09-14 2020-11-27 支付宝(杭州)信息技术有限公司 一种商户图像的风险检验方法、装置及设备
CN112464818A (zh) * 2020-11-27 2021-03-09 北京软通智慧城市科技有限公司 后厨监管方法、装置、设备及存储介质
CN112464818B (zh) * 2020-11-27 2024-04-16 北京软通智慧科技有限公司 后厨监管方法、装置、设备及存储介质
CN113159911A (zh) * 2021-02-25 2021-07-23 华夏方圆信用评估有限公司 基于大数据平台的智能招投标主体履约监控及系统
CN115187065A (zh) * 2022-07-11 2022-10-14 湖北帅锐服装贸易有限公司 一种基于电子商务平台的服装类商品质量分析系统
CN116611614A (zh) * 2023-05-17 2023-08-18 南京邮电大学 一种基于大数据平台的商户出餐管理方法及系统
CN116611614B (zh) * 2023-05-17 2023-10-13 南京邮电大学 一种基于大数据平台的商户出餐管理方法及系统

Similar Documents

Publication Publication Date Title
CN111241367A (zh) 一种基于自定义规则对网络餐饮平台进行监管的方法及系统
CN108734184B (zh) 一种对敏感图像进行分析的方法及装置
US10915748B2 (en) Automatic document source identification systems
CN108038696B (zh) 基于设备标识码和社交群组信息的刷单检测方法及系统
TW201812689A (zh) 惡意地址/惡意訂單的識別系統、方法及裝置
CN110689438A (zh) 企业类金融风险评分方法、装置、计算机设备及存储介质
JP2013502000A (ja) ウェブページコンテンツフィルタリングのための方法およびシステム
CN105740415B (zh) 基于标签位置权重与自学习的招投标好友推荐系统
CN111861507B (zh) 一种用于实时分析网络餐饮店铺风险的识别方法及系统
TW201642195A (zh) 商品相關網路文章之自動圖文摘要方法及系統
CN105654277A (zh) 交易操作的识别方法及服务器
CN106875595B (zh) 一种pos终端使用地点的确定方法及装置
CN112511632B (zh) 基于多源数据的对象推送方法、装置、设备及存储介质
CN112801806A (zh) 一种基于知识图谱的理赔方法及系统
CN107305615A (zh) 数据表识别方法和系统
US8606648B1 (en) System and method for determining potential for curbstoning and generating an advisory
CN115797020B (zh) 基于图数据库的数据处理的零售推荐方法、系统和介质
KR102482969B1 (ko) 인공지능 기반 온라인 위조상품 단속 시스템 및 방법
CN109636627B (zh) 基于区块链的保险产品管理方法、装置、介质及电子设备
KR102539036B1 (ko) 상품 대량 등록이 가능한 구매대행 시스템
CN111222033A (zh) 一种基于海量数据监管网络餐饮企业的方法和系统
CN105225116A (zh) 交易操作的识别方法及服务器
TW201539217A (zh) 文件分析系統、文件分析方法、以及文件分析程式
CN112085553A (zh) 一种特定商品检测方法及装置
CN116934418B (zh) 一种异常订单的检测预警方法、系统、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination