CN111861507B - 一种用于实时分析网络餐饮店铺风险的识别方法及系统 - Google Patents

一种用于实时分析网络餐饮店铺风险的识别方法及系统 Download PDF

Info

Publication number
CN111861507B
CN111861507B CN202010612340.5A CN202010612340A CN111861507B CN 111861507 B CN111861507 B CN 111861507B CN 202010612340 A CN202010612340 A CN 202010612340A CN 111861507 B CN111861507 B CN 111861507B
Authority
CN
China
Prior art keywords
risk
platform
address
comment
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010612340.5A
Other languages
English (en)
Other versions
CN111861507A (zh
Inventor
请求不公布姓名
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Shuzhilian Technology Co Ltd
Original Assignee
Chengdu Shuzhilian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Shuzhilian Technology Co Ltd filed Critical Chengdu Shuzhilian Technology Co Ltd
Priority to CN202010612340.5A priority Critical patent/CN111861507B/zh
Publication of CN111861507A publication Critical patent/CN111861507A/zh
Application granted granted Critical
Publication of CN111861507B publication Critical patent/CN111861507B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/12Hotels or restaurants
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Databases & Information Systems (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Computer Security & Cryptography (AREA)
  • Accounting & Taxation (AREA)
  • Remote Sensing (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用于实时分析网络餐饮店铺风险的识别方法,涉及食品安全、大数据分析技术领域,其技术方案要点是:采集网络平台上的餐饮数据,根据餐饮数据计算店铺的公示风险值、评论风险值、地址风险值以及平台风险指数,并进行多维度统计。该方法运用大数据流式计算、AI图像识别、自然语言处理(NLP)等技术针对新兴网络餐饮业态进行智慧监管,计算速度快、准确性高,能够为监管人员提供有效的执法依据;解决了有效监管资源和多元复杂的监管对象之间的矛盾,实现高效的靶向性抽检工作;显著提高靶向抽检有效率,辅助监管,及时发现存在假证、一证多用、食品安全等网络餐饮经营问题。

Description

一种用于实时分析网络餐饮店铺风险的识别方法及系统
技术领域
本发明涉及食品安全、大数据分析技术领域,更具体地说,它涉及一种用于实时分析网络餐饮店铺风险的识别方法及系统。
背景技术
随着移动互联网迅速发展,点外卖已成为日常行为。而网餐商家套证、假证等资质问题屡见不鲜,超范围经营频频发生;不少网络餐饮商家卫生状况堪忧,网民评价低,存在食源性隐患;餐饮环节动态变化,风险难以把控。餐饮商家规模不一,量大而广;人工全面核查商家资质难以实现。现有技术无法做到实时采集数据并进行分析和处理,最终客观呈现网络餐饮店铺存在的风险。
因此,如何研究设计一种用于实时分析网络餐饮店铺风险的识别方法及系统是我们目前迫切需要解决的问题。
发明内容
本发明的目的是提供一种用于实时分析网络餐饮店铺风险的识别方法,该方法运用大数据流式计算、AI图像识别、自然语言处理(NLP)等技术针对新兴网络餐饮业态进行智慧监管,计算速度快、准确性高,能够为监管人员提供有效的执法依据。
本发明的上述技术目的是通过以下技术方案得以实现的:一种用于实时分析网络餐饮店铺风险的识别方法,包括以下步骤:
S1:采集网络平台的餐饮数据,并进行数据处理,餐饮数据包括主体公示信息、评论信息以及地址信息;
S2:根据所述主体公示信息在FDA许可证数据库中进行匹配、识别与判断,并结合预设的公示信息分类权重计算匹配识别与判断结果的风险值以及对各个风险类型的风险值求和得到公示风险值;
S3:根据风险关键词对所述评论信息进行风险判断,并根据店铺规模和风险评论条数计算得到评论风险值;
S4:在S2中所述主体公示信息匹配成功后,在所述FDA许可证数据库中匹配所述地址信息,并根据匹配结果计算得到地址风险值;
S5:根据风险值权重对所述公示风险值、评论风险值、地址风险值进行权重计算后得到相应的单平台风险指数;
S6:根据时间、地区维度对风险指数进行统计与输出。
优选的,步骤S1所述餐饮数据的数据处理包括过滤、清洗、融合以及经纬度解析;
过滤:定义店铺名称、商品名称关键字,若店铺不匹配关键字,则过滤;
清洗:业态清洗过程,定义业态关键字,若店铺名称满足关键字,则设置为对应业态;名称和地址清洗过程,过滤掉特殊符号;
融合:通过评论所属店铺的唯一标志查找所属店铺,并合并到店铺评论信息中;
经纬度分析:通过地图API“地址逆向解析接口”对店铺地址进行解析,解析出城市、区县、经纬度。
优选的,在步骤S2中,采用CBAM算法分类所述主体公示信息中的店铺证照图片,分类类别包括营业执照、食品流通许可证、餐饮服务许可证、食品经营许可证、三小备案以及其它证件。
优选的,所述风险类型包括证件模糊、假证、一证多用、超经营范围、证件超期;
通过调用百度OCR识别算法对证件图片的人眼模糊进行识别,判断是否属于证件模糊;
采用目标检测算法检测图片上的二维码,解码二维码后提取出证照编号、营业期限、经营范围,并根据证照编号、营业期限、经营范围在证照库中匹配;若不匹配,则判断为相应的假证、超经营范围、证件超期;
通过搜索不同店铺是否存在相同编号的证照,判断相应店铺是否存在一证多用。
优选的,所述地址匹配具体为:将地址信息以行政级别划分进行分解,获取相同的行政级别后组成最长公共子序列,并根据最长公共子序列进行识别判断。
优选的,所述单平台风险指数的计算公式具体为:
Rn=Bn×40%+Cn×40%+An×20%
其中,Rn为单平台风险指数,Bn为公示风险值,Cn为评论风险值,An为地址风险值。
优选的,当目标店铺存在多个网络平台时,对多个所述单平台风险指数进行计算得到多平台综合评估风险指数,多平台综合评估风险指数计算公式具体为:
(1)平台变异系数Vn其中,Pn为平台平均风险值,Mn为风险值标准差;
(2)全平台变异系数Vs其中,K为平台数量;
(3)平台风险权重Wn
(4)多平台综合评估风险指数RS
本发明的另一目的是提供一种用于实时分析网络餐饮店铺风险的识别系统,包括FDA许可证数据库、数据采集模块、公示风险评估模块、评论风险评估模块、地址风险评估模块、风险指数计算模块以及显示模块;
所述FDA许可证数据库,存储有店铺网络经营的食品生产经营许可备案数据;
所述数据采集模块,用于采集网络平台的餐饮数据,并进行数据处理,餐饮数据包括主体公示信息、评论信息以及地址信息;
所述公示风险评估模块,用于根据所述主体公示信息在FDA许可证数据库中进行匹配、识别与判断,并结合预设的公示信息分类权重对匹配、识别与判断结果的风险值进行计算,以及对各个风险类型的风险值求和得到公示风险值;
所述评论风险评估模块,用于根据风险关键词对所述评论信息进行风险判断,并根据店铺规模和风险评论条数计算得到评论风险值;
所述地址风险评估模块,用于在所述主体公示信息匹配成功后,在所述FDA许可证数据库中对所述地址信息进行匹配,并根据匹配结果计算得到地址风险值;
所述风险指数计算模块,用于根据风险值权重对所述公示风险值、评论风险值、地址风险值进行权重计算后得到相应的单平台风险指数;
所述显示模块,根据时间、地区维度对风险指数进行统计与输出。
优选的,所述数据采集模块包括采集单元、过滤单元、清洗单元、融合单元以及经纬度分析单元;
所述采集单元,用于采集网络平台的餐饮数据;
所述过滤单元,定义店铺名称、商品名称关键字,若判断店铺不匹配关键字,则过滤;
所述清洗单元,用于进行业态清洗过程,定义业态关键字,若店铺名称满足关键字,则设置为对应业态;以及,用于进行名称和地址清洗过程,过滤掉特殊符号;
所述融合单元,用于通过评论所属店铺的唯一标志查找所属店铺,并合并到店铺评论信息中;
所述经纬度分析单元,用于通过地图API“地址逆向解析接口”对店铺地址进行解析,解析出城市、区县、经纬度。
与现有技术相比,本发明具有以下有益效果:
1、通过流式分析地理区域的网络餐饮店铺风险指数,计算速度快且准确度高,能够为监管人员提供有效的执法依据;
2、解决了有效监管资源和多元复杂的监管对象之间的矛盾,实现高效的靶向性抽检工作;
3、显著提高靶向抽检有效率,辅助监管及时发现存在假证、一证多用、食品安全等网络餐饮经营问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例1中的流程图;
图2是本发明实施例1公示风险值计算模型图;
图3是本发明实施例1主体公示信息判定流程图;
图4是本发明实施例1评论风险值计算模型图;
图5是本发明实施例2的整体结构框图。
图中:1、数据采集模块;11、采集单元;12、过滤单元;13、清洗单元;14、融合单元;15、经纬度分析单元;2、FDA许可证数据库;3、公示风险评估模块;4、评论风险评估模块;5、地址风险评估模块;6、风险指数计算模块;7、显示模块。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图1-5及实施例1-2,对本发明进行进一步详细说明。
在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
实施例1:一种用于实时分析网络餐饮店铺风险的识别方法
一、数据采集与处理
如图1所示,采集网络平台的餐饮数据,并进行数据处理,餐饮数据包括主体公示信息、评论信息以及地址信息。其中,主体公示信息包括但不限于店铺基础信息、店铺证照照片、店铺主题信息、店铺售卖产品信息,店铺售卖产品信息包括但不限于产品名称、产品照片、产品描述、产品价格。
餐饮数据的数据处理包括过滤、清洗、融合以及经纬度解析。其中,过滤为:定义店铺名称、商品名称关键字,若店铺不匹配关键字,则过滤。清洗为:业态清洗过程,定义业态关键字,若店铺名称满足关键字,则设置为对应业态;以及名称和地址清洗过程,过滤掉特殊符号。融合为:通过评论所属店铺的唯一标志查找所属店铺,并合并到店铺评论信息中。经纬度分析为:通过高德地图API“地址逆向解析接口”对店铺地址进行解析,解析出城市、区县、经纬度。
二、主体公示信息风险判定
如图1所示,根据主体公示信息在FDA许可证数据库中进行匹配、识别与判断,并结合预设的公示信息分类权重对匹配、识别与判断结果的风险值进行计算,以及对各个风险类型的风险值求和得到公示风险值。
如图2与图3所示,在本实施例中,采用CBAM算法对主体公示信息中的店铺证照图片进行分类,分类类别包括营业执照、食品流通许可证、餐饮服务许可证、食品经营许可证、三小备案以及其它证件。
风险类型包括证件模糊、假证、一证多用、超经营范围、证件超期。通过调用百度OCR识别算法对证件图片的人眼模糊进行识别,判断是否属于证件模糊。采用目标检测算法检测图片上的二维码,对二维码解码后提取出证照编号、营业期限、经营范围,并根据证照编号、营业期限、经营范围在证照库中进行匹配;若不匹配,则判断为相应的假证、超经营范围、证件超期。通过搜索不同店铺是否存在相同编号的证照,判断相应店铺是否存在一证多用。
如图3搜索,在本市实例中,风险类型判断流程如下:(1)对于新上商家依次判断是否有照片、照片分类、是否有许可证、证件是否模糊、是否能深度识别、二维码是否能识别、对比FDA数据库是否匹配(完整匹配)、一证多用、对比经营范围与菜品信息、超出有效期。其中,一证多用、对比经营范围与菜品信息、超出有效期是在对比FDA数据库是否匹配(完整匹配)成功判定证件为真后同级进行。(2)对于复查商家依次判断是否有照片、照片是否更新;若更新,则采用新上商家规则分类后判断;若未更新,则采用新上商家规则直接开始判断是否有许可证。
在本市实例中,公示信息风险总分值为40。若店铺未公示任何主体信息,则得分40。公示许可信息的总分值为40,包括证件模糊、疑似假证、一证多用、超经营范围、证件超期;其中,证件模糊为:(1-识别值/阈值)×证件模糊权重。公示非许可信息分值为30,包括食品流通许可证、营业证照、地方政策性非许可证证件以及其他,计算方法为:30×(1-非许可信息类别的权重之和)。
三、评论信息风险判定
如图1与图4所示,根据风险关键词对评论信息进行风险判断,并根据店铺规模和风险评论条数计算得到评论风险值。
在本市实例中,店铺规模分为小型评论商家、中型评论商家以及大型评论商家。其中,小型评论商家为10-30分值,若总评论数中的风险评论条数为0条,则分值为10;若总评论数全是风险评论,则分值为30。中型评论商家分值为5-35分值,若总评论数中的风险评论条数为0条,则分值为5;若总评论数全是风险评论,则分值为35。大型评论商家分值为0-40分值,若总评论数中的风险评论条数为0条,则分值为0;若总评论数全是风险评论,则分值为40。风险计算模型输出为0到100的评估风险值,具体计算为:以实际得分值与评论风险总分值的比值乘以100作为评估风险值。在本市实例中,评论风险总分值为40。
四、地址信息风险判定
在主体公示信息匹配成功后,在FDA许可证数据库中对地址信息进行匹配,并根据匹配结果计算得到地址风险值。
地址匹配具体为:将地址信息以行政级别划分进行分解,获取相同的行政级别后组成最长公共子序列,并根据最长公共子序列进行识别判断。
五、平台风险指数计算
如图1所示,根据风险值权重对公示风险值、评论风险值、地址风险值进行权重计算后得到相应的单平台风险指数。
单平台风险指数的计算公式具体为:
Rn=Bn×40%+Cn×40%+An×20%
其中,Rn为单平台风险指数,Bn为公示风险值,Cn为评论风险值,An为地址风险值。
六、多平台综合评估风险指数计算
当目标店铺存在多个网络平台时,对多个单平台风险指数进行计算得到多平台综合评估风险指数,多平台综合评估风险指数计算公式具体为:
(1)平台变异系数Vn其中,Pn为平台平均风险值,Mn为风险值标准差。
(2)全平台变异系数Vs其中,K为平台数量。
(3)平台风险权重Wn
(4)多平台综合评估风险指数RS
需要注意的是:店铺未入驻一个平台和在一个平台上入驻风险指数为0,意义不同。店铺在一个平台入驻,综合评估风险指标等于单平台风险指数。店铺在两个及以上平台入驻,变异系数总和等于两个及以上平台的变异系数相加,再计算权重。
通过对店铺风险评分、相同店铺风险评分、平台整体风险评分,按照时间、地区维度对风险指数进行统计,可输出作为餐饮监管人员市场监控管理的参考数据。
实施例2:一种用于实时分析网络餐饮店铺风险的识别系统,如图5所示,包括数据采集模块1、公示风险评估模块3、评论风险评估模块4、地址风险评估模块5、风险指数计算模块6以及显示模块7。
数据采集模块1,用于采集网络平台的餐饮数据,并进行数据处理,餐饮数据包括主体公示信息、评论信息以及地址信息。
公示风险评估模块3,用于根据主体公示信息在FDA许可证数据库2中进行匹配、识别与判断,并结合预设的公示信息分类权重对匹配、识别与判断结果的风险值进行计算,以及对各个风险类型的风险值求和得到公示风险值。
评论风险评估模块4,用于根据风险关键词对评论信息进行风险判断,并根据店铺规模和风险评论条数计算得到评论风险值。
地址风险评估模块5,用于在主体公示信息匹配成功后,在FDA许可证数据库2中对地址信息进行匹配,并根据匹配结果计算得到地址风险值。
风险指数计算模块6,用于根据风险值权重对公示风险值、评论风险值、地址风险值进行权重计算后得到相应的单平台风险指数。
显示模块7,根据时间、地区维度对风险指数进行统计与输出。
作为优选的一种实施方式,如图5所示,数据采集模块1包括采集单元11、过滤单元12、清洗单元13、融合单元14以及经纬度分析单元15。
采集单元11用于采集网络平台的餐饮数据。
过滤单元12,先定义店铺名称、商品名称关键字,若判断店铺不匹配关键字,则过滤。
清洗单元13用于进行业态清洗过程,定义业态关键字,若店铺名称满足关键字,则设置为对应业态;以及,用于进行名称和地址清洗过程,过滤掉特殊符号。
融合单元14用于通过评论所属店铺的唯一标志查找所属店铺,并合并到店铺评论信息中。
经纬度分析单元15用于通过地图API“地址逆向解析接口”对店铺地址进行解析,解析出城市、区县、经纬度。
本具体实施例仅仅是对本发明的解释,其并不是对本发明的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本发明的权利要求范围内都受到专利法的保护。

Claims (8)

1.一种用于实时分析网络餐饮店铺风险的识别方法,其特征是,包括以下步骤:
S1:采集网络平台的餐饮数据,并进行数据处理,餐饮数据包括主体公示信息、评论信息以及地址信息;
S2:根据所述主体公示信息在FDA许可证数据库中进行匹配、识别与判断,并结合预设的公示信息分类权重计算匹配、识别与判断结果的风险值,以及对各个风险类型的风险值求和得到公示风险值;
S3:根据风险关键词对所述评论信息进行风险判断,并根据店铺规模和风险评论条数计算得到评论风险值;
S4:在S2中所述主体公示信息匹配成功后,在所述FDA许可证数据库中匹配所述地址信息,并根据匹配结果计算得到地址风险值;
S5:根据风险值权重对所述公示风险值、评论风险值、地址风险值进行权重计算后得到相应的单平台风险指数;
S6:根据时间、地区维度对风险指数进行统计与输出;
当目标店铺存在多个网络平台时,对多个所述单平台风险指数进行计算得到多平台综合评估风险指数,多平台综合评估风险指数计算公式具体为:
(1)平台变异系数Vn其中,Pn为平台平均风险值,Mn为风险值标准差;
(2)全平台变异系数Vs其中,K为平台数量;
(3)平台风险权重Wn
(4)多平台综合评估风险指数RS
2.根据权利要求1所述的一种用于实时分析网络餐饮店铺风险的识别方法,其特征是,步骤S1所述餐饮数据的数据处理包括过滤、清洗、融合以及经纬度解析;
过滤:定义店铺名称、商品名称关键字,若店铺不匹配关键字,则过滤;
清洗:业态清洗过程,定义业态关键字,若店铺名称满足关键字,则设置为对应业态;名称和地址清洗过程,过滤掉特殊符号;
融合:通过评论所属店铺的唯一标志查找所属店铺,并合并到店铺评论信息中;
经纬度分析:通过地图API“地址逆向解析接口”对店铺地址进行解析,解析出城市、区县、经纬度。
3.根据权利要求1所述的一种用于实时分析网络餐饮店铺风险的识别方法,其特征是,在步骤S2中,采用CBAM算法分类所述主体公示信息中的店铺证照图片,分类类别包括营业执照、食品流通许可证、餐饮服务许可证、食品经营许可证、三小备案以及其它证件。
4.根据权利要求1所述的一种用于实时分析网络餐饮店铺风险的识别方法,其特征是,所述风险类型包括证件模糊、假证、一证多用、超经营范围、证件超期;
通过调用百度OCR识别算法对证件图片的人眼模糊进行识别,判断是否属于证件模糊;
采用目标检测算法检测图片上的二维码,解码二维码后提取出证照编号、营业期限、经营范围,并根据证照编号、营业期限、经营范围在证照库中匹配;若不匹配,则判断为相应的假证、超经营范围、证件超期;
通过搜索不同店铺是否存在相同编号的证照,判断相应店铺是否存在一证多用。
5.根据权利要求1所述的一种用于实时分析网络餐饮店铺风险的识别方法,其特征是,所述地址匹配具体为:将地址信息以行政级别划分进行分解,获取相同的行政级别后组成最长公共子序列,并根据最长公共子序列进行识别判断。
6.根据权利要求1所述的一种用于实时分析网络餐饮店铺风险的识别方法,其特征是,所述单平台风险指数的计算公式具体为:
Rn=Bn×40%+Cn×40%+An×20%
其中,Rn为单平台风险指数,Bn为公示风险值,Cn为评论风险值,An为地址风险值。
7.一种用于实时分析网络餐饮店铺风险的识别系统,其特征是,包括FDA许可证数据库(2)、数据采集模块(1)、公示风险评估模块(3)、评论风险评估模块(4)、地址风险评估模块(5)、风险指数计算模块(6)以及显示模块(7);
所述FDA许可证数据库(2),存储有店铺网络经营的食品生产经营许可备案数据;
所述数据采集模块(1),用于采集网络平台的餐饮数据,并进行数据处理,餐饮数据包括主体公示信息、评论信息以及地址信息;
所述公示风险评估模块(3),用于根据所述主体公示信息在FDA许可证数据库(2)中进行匹配、识别与判断,并结合预设的公示信息分类权重对匹配、识别与判断结果的风险值进行计算,以及对各个风险类型的风险值求和得到公示风险值;
所述评论风险评估模块(4),用于根据风险关键词对所述评论信息进行风险判断,并根据店铺规模和风险评论条数计算得到评论风险值;
所述地址风险评估模块(5),用于在所述主体公示信息匹配成功后,在所述FDA许可证数据库(2)中对所述地址信息进行匹配,并根据匹配结果计算得到地址风险值;
所述风险指数计算模块(6),用于根据风险值权重对所述公示风险值、评论风险值、地址风险值进行权重计算后得到相应的单平台风险指数;
所述显示模块(7),根据时间、地区维度对风险指数进行统计与输出;
当目标店铺存在多个网络平台时,对多个所述单平台风险指数进行计算得到多平台综合评估风险指数,多平台综合评估风险指数计算公式具体为:
(1)平台变异系数Vn其中,Pn为平台平均风险值,Mn为风险值标准差;
(2)全平台变异系数Vs其中,K为平台数量;
(3)平台风险权重Wn
(4)多平台综合评估风险指数RS
8.根据权利要求7所述的一种用于实时分析网络餐饮店铺风险的识别系统,其特征是,所述数据采集模块(1)包括采集单元(11)、过滤单元(12)、清洗单元(13)、融合单元(14)以及经纬度分析单元(15);
所述采集单元(11),用于采集网络平台的餐饮数据;
所述过滤单元(12),定义店铺名称、商品名称关键字,若判断店铺不匹配关键字,则过滤;
所述清洗单元(13),用于进行业态清洗过程,定义业态关键字,若店铺名称满足关键字,则设置为对应业态;以及,用于进行名称和地址清洗过程,过滤掉特殊符号;
所述融合单元(14),用于通过评论所属店铺的唯一标志查找所属店铺,并合并到店铺评论信息中;
所述经纬度分析单元(15),用于通过地图API“地址逆向解析接口”对店铺地址进行解析,解析出城市、区县、经纬度。
CN202010612340.5A 2020-06-30 2020-06-30 一种用于实时分析网络餐饮店铺风险的识别方法及系统 Active CN111861507B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010612340.5A CN111861507B (zh) 2020-06-30 2020-06-30 一种用于实时分析网络餐饮店铺风险的识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010612340.5A CN111861507B (zh) 2020-06-30 2020-06-30 一种用于实时分析网络餐饮店铺风险的识别方法及系统

Publications (2)

Publication Number Publication Date
CN111861507A CN111861507A (zh) 2020-10-30
CN111861507B true CN111861507B (zh) 2023-10-24

Family

ID=72988933

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010612340.5A Active CN111861507B (zh) 2020-06-30 2020-06-30 一种用于实时分析网络餐饮店铺风险的识别方法及系统

Country Status (1)

Country Link
CN (1) CN111861507B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112669070A (zh) * 2020-12-29 2021-04-16 上海小零网络科技有限公司 一种预测门店销售量进行拓店的方法
CN113962514A (zh) * 2021-09-09 2022-01-21 浪潮卓数大数据产业发展有限公司 一种经营风险识别的方法
CN114694843A (zh) * 2022-03-29 2022-07-01 数字浙江技术运营有限公司 风险预警方法、装置和电子设备

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105844424A (zh) * 2016-05-30 2016-08-10 中国计量学院 基于网络评论的产品质量问题发现及风险评估方法
CN106777150A (zh) * 2016-12-19 2017-05-31 国网山东省电力公司电力科学研究院 一种融合电网运行环境及设备信息的跨系统数据转换方法
CN106844546A (zh) * 2016-12-30 2017-06-13 江苏号百信息服务有限公司 基于Spark集群的多数据源位置信息融合方法及系统
CN106874381A (zh) * 2017-01-09 2017-06-20 重庆邮电大学 一种基于Hadoop的无线电环境地图数据处理系统
CN107609807A (zh) * 2017-11-08 2018-01-19 厦门美亚商鼎信息科技有限公司 一种网络餐饮风险识别方法及系统
CN107977798A (zh) * 2017-12-21 2018-05-01 中国计量大学 一种电子商务产品质量的风险评价方法
CN108346096A (zh) * 2018-02-23 2018-07-31 岭尚(上海)科技发展有限公司 风控系统及风控方法
CN108470275A (zh) * 2018-04-12 2018-08-31 陈静 一种基于大数据的餐饮信息安全监管方法
CN108959609A (zh) * 2018-07-16 2018-12-07 阿里巴巴集团控股有限公司 店铺地址的更新方法及装置
CN109345272A (zh) * 2018-11-28 2019-02-15 中国计量大学 一种基于改进马尔科夫链的店铺信用风险预测方法
CN109657949A (zh) * 2018-12-07 2019-04-19 铂森(苏州)投资咨询有限公司 一种量化风险管理系统
CN109840676A (zh) * 2018-12-13 2019-06-04 平安科技(深圳)有限公司 基于大数据的风控方法、装置、计算机设备及存储介质
CN110119882A (zh) * 2019-04-12 2019-08-13 国家计算机网络与信息安全管理中心 一种平台风险监控方法、装置、设备及存储介质
CN110163532A (zh) * 2019-05-30 2019-08-23 深圳前海微众银行股份有限公司 风险评估方法、风险管理方法、装置、设备及存储介质
CN110245841A (zh) * 2019-05-21 2019-09-17 平安科技(深圳)有限公司 一种网约车风险控制方法及相关装置
CN111210377A (zh) * 2019-12-30 2020-05-29 航天信息股份有限公司 一种基于云计算的网络订餐监管系统及方法
CN111241367A (zh) * 2019-12-27 2020-06-05 航天信息股份有限公司 一种基于自定义规则对网络餐饮平台进行监管的方法及系统
CN111311439A (zh) * 2019-07-10 2020-06-19 浙江商安信息科技有限公司 基于网络订餐平台筛选订餐商铺的方法、系统及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7900259B2 (en) * 2007-03-16 2011-03-01 Prevari Predictive assessment of network risks
US20140279682A1 (en) * 2013-03-14 2014-09-18 Aleksandr Feldman System and method for managing crowdfunding platform information
US10838982B2 (en) * 2015-10-23 2020-11-17 Oracle International Corporation System and method for aggregating values through risk dimension hierarchies in a multidimensional database environment
US11948113B2 (en) * 2017-11-22 2024-04-02 International Business Machines Corporation Generating risk assessment software

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105844424A (zh) * 2016-05-30 2016-08-10 中国计量学院 基于网络评论的产品质量问题发现及风险评估方法
CN106777150A (zh) * 2016-12-19 2017-05-31 国网山东省电力公司电力科学研究院 一种融合电网运行环境及设备信息的跨系统数据转换方法
CN106844546A (zh) * 2016-12-30 2017-06-13 江苏号百信息服务有限公司 基于Spark集群的多数据源位置信息融合方法及系统
CN106874381A (zh) * 2017-01-09 2017-06-20 重庆邮电大学 一种基于Hadoop的无线电环境地图数据处理系统
CN107609807A (zh) * 2017-11-08 2018-01-19 厦门美亚商鼎信息科技有限公司 一种网络餐饮风险识别方法及系统
CN107977798A (zh) * 2017-12-21 2018-05-01 中国计量大学 一种电子商务产品质量的风险评价方法
CN108346096A (zh) * 2018-02-23 2018-07-31 岭尚(上海)科技发展有限公司 风控系统及风控方法
CN108470275A (zh) * 2018-04-12 2018-08-31 陈静 一种基于大数据的餐饮信息安全监管方法
CN108959609A (zh) * 2018-07-16 2018-12-07 阿里巴巴集团控股有限公司 店铺地址的更新方法及装置
CN109345272A (zh) * 2018-11-28 2019-02-15 中国计量大学 一种基于改进马尔科夫链的店铺信用风险预测方法
CN109657949A (zh) * 2018-12-07 2019-04-19 铂森(苏州)投资咨询有限公司 一种量化风险管理系统
CN109840676A (zh) * 2018-12-13 2019-06-04 平安科技(深圳)有限公司 基于大数据的风控方法、装置、计算机设备及存储介质
CN110119882A (zh) * 2019-04-12 2019-08-13 国家计算机网络与信息安全管理中心 一种平台风险监控方法、装置、设备及存储介质
CN110245841A (zh) * 2019-05-21 2019-09-17 平安科技(深圳)有限公司 一种网约车风险控制方法及相关装置
CN110163532A (zh) * 2019-05-30 2019-08-23 深圳前海微众银行股份有限公司 风险评估方法、风险管理方法、装置、设备及存储介质
CN111311439A (zh) * 2019-07-10 2020-06-19 浙江商安信息科技有限公司 基于网络订餐平台筛选订餐商铺的方法、系统及存储介质
CN111241367A (zh) * 2019-12-27 2020-06-05 航天信息股份有限公司 一种基于自定义规则对网络餐饮平台进行监管的方法及系统
CN111210377A (zh) * 2019-12-30 2020-05-29 航天信息股份有限公司 一种基于云计算的网络订餐监管系统及方法

Also Published As

Publication number Publication date
CN111861507A (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
CN111861507B (zh) 一种用于实时分析网络餐饮店铺风险的识别方法及系统
CN105184574B (zh) 一种套用商户类别码欺诈行为的检测方法
TWI772673B (zh) 行業識別模型確定方法和裝置
CN108038696B (zh) 基于设备标识码和社交群组信息的刷单检测方法及系统
Zhang et al. Applying data mining in investigating money laundering crimes
CN113139857B (zh) 电子商务平台商家店铺智能管理方法、系统、设备和计算机存储介质
CN114066242A (zh) 一种企业风险的预警方法及装置
CN107690657A (zh) 根据影像发现商户
CN103577988A (zh) 一种识别特定用户的方法和装置
CN110689438A (zh) 企业类金融风险评分方法、装置、计算机设备及存储介质
CN110288259B (zh) 一种智慧城市监督服务方法及其平台
AU2004224885A1 (en) System, method and computer product to detect behavioral patterns related to the financial health of a business entity
CN111241367A (zh) 一种基于自定义规则对网络餐饮平台进行监管的方法及系统
CN103678659A (zh) 一种基于随机森林算法的电子商务网站欺诈用户识别方法及系统
Ku et al. Artificial intelligence and visual analytics: a deep-learning approach to analyze hotel reviews & responses
CN112102076A (zh) 一种平台综合风险预警系统
CN112801498A (zh) 风险识别模型的训练方法、风险识别方法、装置及设备
CN116028870B (zh) 一种数据检测的方法、装置、电子设备及存储介质
CN109685670A (zh) 社保违规检测方法、装置、设备及计算机可读存储介质
CN114297447B (zh) 基于防疫大数据的电子证件标记方法、系统及可读存储介质
CN114692593B (zh) 一种网络信息安全监测预警方法
CN109408634A (zh) 一种基于派系过滤的意见垃圾用户群检测方法
CN115759640A (zh) 一种智慧城市的公共服务信息处理系统及方法
CN113962514A (zh) 一种经营风险识别的方法
CN110414753A (zh) 一种知识产权价值评估系统及其方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 610000 No. 270, floor 2, No. 8, Jinxiu street, Wuhou District, Chengdu, Sichuan

Applicant after: Chengdu shuzhilian Technology Co.,Ltd.

Address before: 610000 No.2, 4th floor, building 1, Jule Road intersection, West 1st section of 1st ring road, Wuhou District, Chengdu City, Sichuan Province

Applicant before: CHENGDU SHUZHILIAN TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant