CN111861507A - 一种用于实时分析网络餐饮店铺风险的识别方法及系统 - Google Patents
一种用于实时分析网络餐饮店铺风险的识别方法及系统 Download PDFInfo
- Publication number
- CN111861507A CN111861507A CN202010612340.5A CN202010612340A CN111861507A CN 111861507 A CN111861507 A CN 111861507A CN 202010612340 A CN202010612340 A CN 202010612340A CN 111861507 A CN111861507 A CN 111861507A
- Authority
- CN
- China
- Prior art keywords
- risk
- address
- shop
- platform
- catering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000004364 calculation method Methods 0.000 claims abstract description 29
- 235000013305 food Nutrition 0.000 claims abstract description 17
- 238000004140 cleaning Methods 0.000 claims description 23
- 238000011156 evaluation Methods 0.000 claims description 22
- 238000001914 filtration Methods 0.000 claims description 20
- 238000012502 risk assessment Methods 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 9
- 230000004927 fusion Effects 0.000 claims description 8
- 238000001514 detection method Methods 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 238000005406 washing Methods 0.000 claims description 2
- 238000010223 real-time analysis Methods 0.000 claims 3
- 238000007689 inspection Methods 0.000 abstract description 4
- 238000003058 natural language processing Methods 0.000 abstract description 4
- 238000007405 data analysis Methods 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000005070 sampling Methods 0.000 abstract description 2
- 238000012552 review Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/12—Hotels or restaurants
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Databases & Information Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Remote Sensing (AREA)
- Computer Security & Cryptography (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种用于实时分析网络餐饮店铺风险的识别方法,涉及食品安全、大数据分析技术领域,其技术方案要点是:采集网络平台上的餐饮数据,根据餐饮数据计算店铺的公示风险值、评论风险值、地址风险值以及平台风险指数,并进行多维度统计。该方法运用大数据流式计算、AI图像识别、自然语言处理(NLP)等技术针对新兴网络餐饮业态进行智慧监管,计算速度快、准确性高,能够为监管人员提供有效的执法依据;解决了有效监管资源和多元复杂的监管对象之间的矛盾,实现高效的靶向性抽检工作;显著提高靶向抽检有效率,辅助监管,及时发现存在假证、一证多用、食品安全等网络餐饮经营问题。
Description
技术领域
本发明涉及食品安全、大数据分析技术领域,更具体地说,它涉及一种用于实时分析网络餐饮店铺风险的识别方法及系统。
背景技术
随着移动互联网迅速发展,点外卖已成为日常行为。而网餐商家套证、假证等资质问题屡见不鲜,超范围经营频频发生;不少网络餐饮商家卫生状况堪忧,网民评价低,存在食源性隐患;餐饮环节动态变化,风险难以把控。餐饮商家规模不一,量大而广;人工全面核查商家资质难以实现。现有技术无法做到实时采集数据并进行分析和处理,最终客观呈现网络餐饮店铺存在的风险。
因此,如何研究设计一种用于实时分析网络餐饮店铺风险的识别方法及系统是我们目前迫切需要解决的问题。
发明内容
本发明的目的是提供一种用于实时分析网络餐饮店铺风险的识别方法,该方法运用大数据流式计算、AI图像识别、自然语言处理(NLP)等技术针对新兴网络餐饮业态进行智慧监管,计算速度快、准确性高,能够为监管人员提供有效的执法依据。
本发明的上述技术目的是通过以下技术方案得以实现的:一种用于实时分析网络餐饮店铺风险的识别方法,包括以下步骤:
S1:采集网络平台的餐饮数据,并进行数据处理,餐饮数据包括主体公示信息、评论信息以及地址信息;
S2:根据所述主体公示信息在FDA许可证数据库中进行匹配、识别与判断,并结合预设的公示信息分类权重计算匹配识别与判断结果的风险值以及对各个风险类型的风险值求和得到公示风险值;
S3:根据风险关键词对所述评论信息进行风险判断,并根据店铺规模和风险评论条数计算得到评论风险值;
S4:在S2中所述主体公示信息匹配成功后,在所述FDA许可证数据库中匹配所述地址信息,并根据匹配结果计算得到地址风险值;
S5:根据风险值权重对所述公示风险值、评论风险值、地址风险值进行权重计算后得到相应的单平台风险指数;
S6:根据时间、地区维度对风险指数进行统计与输出。
优选的,步骤S1所述餐饮数据的数据处理包括过滤、清洗、融合以及经纬度解析;
过滤:定义店铺名称、商品名称关键字,若店铺不匹配关键字,则过滤;
清洗:业态清洗过程,定义业态关键字,若店铺名称满足关键字,则设置为对应业态;名称和地址清洗过程,过滤掉特殊符号;
融合:通过评论所属店铺的唯一标志查找所属店铺,并合并到店铺评论信息中;
经纬度分析:通过地图API“地址逆向解析接口”对店铺地址进行解析,解析出城市、区县、经纬度。
优选的,在步骤S2中,采用CBAM算法分类所述主体公示信息中的店铺证照图片,分类类别包括营业执照、食品流通许可证、餐饮服务许可证、食品经营许可证、三小备案以及其它证件。
优选的,所述风险类型包括证件模糊、假证、一证多用、超经营范围、证件超期;
通过调用百度OCR识别算法对证件图片的人眼模糊进行识别,判断是否属于证件模糊;
采用目标检测算法检测图片上的二维码,解码二维码后提取出证照编号、营业期限、经营范围,并根据证照编号、营业期限、经营范围在证照库中匹配;若不匹配,则判断为相应的假证、超经营范围、证件超期;
通过搜索不同店铺是否存在相同编号的证照,判断相应店铺是否存在一证多用。
优选的,所述地址匹配具体为:将地址信息以行政级别划分进行分解,获取相同的行政级别后组成最长公共子序列,并根据最长公共子序列进行识别判断。
优选的,所述单平台风险指数的计算公式具体为:
Rn=Bn×40%+Cn×40%+An×20%
其中,Rn为单平台风险指数,Bn为公示风险值,Cn为评论风险值,An为地址风险值。
优选的,当目标店铺存在多个网络平台时,对多个所述单平台风险指数进行计算得到多平台综合评估风险指数,多平台综合评估风险指数计算公式具体为:
本发明的另一目的是提供一种用于实时分析网络餐饮店铺风险的识别系统,包括FDA许可证数据库、数据采集模块、公示风险评估模块、评论风险评估模块、地址风险评估模块、风险指数计算模块以及显示模块;
所述FDA许可证数据库,存储有店铺网络经营的食品生产经营许可备案数据;
所述数据采集模块,用于采集网络平台的餐饮数据,并进行数据处理,餐饮数据包括主体公示信息、评论信息以及地址信息;
所述公示风险评估模块,用于根据所述主体公示信息在FDA许可证数据库中进行匹配、识别与判断,并结合预设的公示信息分类权重对匹配、识别与判断结果的风险值进行计算,以及对各个风险类型的风险值求和得到公示风险值;
所述评论风险评估模块,用于根据风险关键词对所述评论信息进行风险判断,并根据店铺规模和风险评论条数计算得到评论风险值;
所述地址风险评估模块,用于在所述主体公示信息匹配成功后,在所述FDA许可证数据库中对所述地址信息进行匹配,并根据匹配结果计算得到地址风险值;
所述风险指数计算模块,用于根据风险值权重对所述公示风险值、评论风险值、地址风险值进行权重计算后得到相应的单平台风险指数;
所述显示模块,根据时间、地区维度对风险指数进行统计与输出。
优选的,所述数据采集模块包括采集单元、过滤单元、清洗单元、融合单元以及经纬度分析单元;
所述采集单元,用于采集网络平台的餐饮数据;
所述过滤单元,定义店铺名称、商品名称关键字,若判断店铺不匹配关键字,则过滤;
所述清洗单元,用于进行业态清洗过程,定义业态关键字,若店铺名称满足关键字,则设置为对应业态;以及,用于进行名称和地址清洗过程,过滤掉特殊符号;
所述融合单元,用于通过评论所属店铺的唯一标志查找所属店铺,并合并到店铺评论信息中;
所述经纬度分析单元,用于通过地图API“地址逆向解析接口”对店铺地址进行解析,解析出城市、区县、经纬度。
与现有技术相比,本发明具有以下有益效果:
1、通过流式分析地理区域的网络餐饮店铺风险指数,计算速度快且准确度高,能够为监管人员提供有效的执法依据;
2、解决了有效监管资源和多元复杂的监管对象之间的矛盾,实现高效的靶向性抽检工作;
3、显著提高靶向抽检有效率,辅助监管及时发现存在假证、一证多用、食品安全等网络餐饮经营问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例1中的流程图;
图2是本发明实施例1公示风险值计算模型图;
图3是本发明实施例1主体公示信息判定流程图;
图4是本发明实施例1评论风险值计算模型图;
图5是本发明实施例2的整体结构框图。
图中:1、数据采集模块;11、采集单元;12、过滤单元;13、清洗单元;14、融合单元;15、经纬度分析单元;2、FDA许可证数据库;3、公示风险评估模块;4、评论风险评估模块;5、地址风险评估模块;6、风险指数计算模块;7、显示模块。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图1-5及实施例1-2,对本发明进行进一步详细说明。
在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
实施例1:一种用于实时分析网络餐饮店铺风险的识别方法
一、数据采集与处理
如图1所示,采集网络平台的餐饮数据,并进行数据处理,餐饮数据包括主体公示信息、评论信息以及地址信息。其中,主体公示信息包括但不限于店铺基础信息、店铺证照照片、店铺主题信息、店铺售卖产品信息,店铺售卖产品信息包括但不限于产品名称、产品照片、产品描述、产品价格。
餐饮数据的数据处理包括过滤、清洗、融合以及经纬度解析。其中,过滤为:定义店铺名称、商品名称关键字,若店铺不匹配关键字,则过滤。清洗为:业态清洗过程,定义业态关键字,若店铺名称满足关键字,则设置为对应业态;以及名称和地址清洗过程,过滤掉特殊符号。融合为:通过评论所属店铺的唯一标志查找所属店铺,并合并到店铺评论信息中。经纬度分析为:通过高德地图API“地址逆向解析接口”对店铺地址进行解析,解析出城市、区县、经纬度。
二、主体公示信息风险判定
如图1所示,根据主体公示信息在FDA许可证数据库中进行匹配、识别与判断,并结合预设的公示信息分类权重对匹配、识别与判断结果的风险值进行计算,以及对各个风险类型的风险值求和得到公示风险值。
如图2与图3所示,在本实施例中,采用CBAM算法对主体公示信息中的店铺证照图片进行分类,分类类别包括营业执照、食品流通许可证、餐饮服务许可证、食品经营许可证、三小备案以及其它证件。
风险类型包括证件模糊、假证、一证多用、超经营范围、证件超期。通过调用百度OCR识别算法对证件图片的人眼模糊进行识别,判断是否属于证件模糊。采用目标检测算法检测图片上的二维码,对二维码解码后提取出证照编号、营业期限、经营范围,并根据证照编号、营业期限、经营范围在证照库中进行匹配;若不匹配,则判断为相应的假证、超经营范围、证件超期。通过搜索不同店铺是否存在相同编号的证照,判断相应店铺是否存在一证多用。
如图3搜索,在本市实例中,风险类型判断流程如下:(1)对于新上商家依次判断是否有照片、照片分类、是否有许可证、证件是否模糊、是否能深度识别、二维码是否能识别、对比FDA数据库是否匹配(完整匹配)、一证多用、对比经营范围与菜品信息、超出有效期。其中,一证多用、对比经营范围与菜品信息、超出有效期是在对比FDA数据库是否匹配(完整匹配)成功判定证件为真后同级进行。(2)对于复查商家依次判断是否有照片、照片是否更新;若更新,则采用新上商家规则分类后判断;若未更新,则采用新上商家规则直接开始判断是否有许可证。
在本市实例中,公示信息风险总分值为40。若店铺未公示任何主体信息,则得分40。公示许可信息的总分值为40,包括证件模糊、疑似假证、一证多用、超经营范围、证件超期;其中,证件模糊为:(1-识别值/阈值)×证件模糊权重。公示非许可信息分值为30,包括食品流通许可证、营业证照、地方政策性非许可证证件以及其他,计算方法为:30×(1-非许可信息类别的权重之和)。
三、评论信息风险判定
如图1与图4所示,根据风险关键词对评论信息进行风险判断,并根据店铺规模和风险评论条数计算得到评论风险值。
在本市实例中,店铺规模分为小型评论商家、中型评论商家以及大型评论商家。其中,小型评论商家为10-30分值,若总评论数中的风险评论条数为0条,则分值为10;若总评论数全是风险评论,则分值为30。中型评论商家分值为5-35分值,若总评论数中的风险评论条数为0条,则分值为5;若总评论数全是风险评论,则分值为35。大型评论商家分值为0-40分值,若总评论数中的风险评论条数为0条,则分值为0;若总评论数全是风险评论,则分值为40。风险计算模型输出为0到100的评估风险值,具体计算为:以实际得分值与评论风险总分值的比值乘以100作为评估风险值。在本市实例中,评论风险总分值为40。
四、地址信息风险判定
在主体公示信息匹配成功后,在FDA许可证数据库中对地址信息进行匹配,并根据匹配结果计算得到地址风险值。
地址匹配具体为:将地址信息以行政级别划分进行分解,获取相同的行政级别后组成最长公共子序列,并根据最长公共子序列进行识别判断。
五、平台风险指数计算
如图1所示,根据风险值权重对公示风险值、评论风险值、地址风险值进行权重计算后得到相应的单平台风险指数。
单平台风险指数的计算公式具体为:
Rn=Bn×40%+Cn×40%+An×20%
其中,Rn为单平台风险指数,Bn为公示风险值,Cn为评论风险值,An为地址风险值。
六、多平台综合评估风险指数计算
当目标店铺存在多个网络平台时,对多个单平台风险指数进行计算得到多平台综合评估风险指数,多平台综合评估风险指数计算公式具体为:
需要注意的是:店铺未入驻一个平台和在一个平台上入驻风险指数为0,意义不同。店铺在一个平台入驻,综合评估风险指标等于单平台风险指数。店铺在两个及以上平台入驻,变异系数总和等于两个及以上平台的变异系数相加,再计算权重。
通过对店铺风险评分、相同店铺风险评分、平台整体风险评分,按照时间、地区维度对风险指数进行统计,可输出作为餐饮监管人员市场监控管理的参考数据。
实施例2:一种用于实时分析网络餐饮店铺风险的识别系统,如图5所示,包括数据采集模块1、公示风险评估模块3、评论风险评估模块4、地址风险评估模块5、风险指数计算模块6以及显示模块7。
数据采集模块1,用于采集网络平台的餐饮数据,并进行数据处理,餐饮数据包括主体公示信息、评论信息以及地址信息。
公示风险评估模块3,用于根据主体公示信息在FDA许可证数据库2中进行匹配、识别与判断,并结合预设的公示信息分类权重对匹配、识别与判断结果的风险值进行计算,以及对各个风险类型的风险值求和得到公示风险值。
评论风险评估模块4,用于根据风险关键词对评论信息进行风险判断,并根据店铺规模和风险评论条数计算得到评论风险值。
地址风险评估模块5,用于在主体公示信息匹配成功后,在FDA许可证数据库2中对地址信息进行匹配,并根据匹配结果计算得到地址风险值。
风险指数计算模块6,用于根据风险值权重对公示风险值、评论风险值、地址风险值进行权重计算后得到相应的单平台风险指数。
显示模块7,根据时间、地区维度对风险指数进行统计与输出。
作为优选的一种实施方式,如图5所示,数据采集模块1包括采集单元11、过滤单元12、清洗单元13、融合单元14以及经纬度分析单元15。
采集单元11用于采集网络平台的餐饮数据。
过滤单元12,先定义店铺名称、商品名称关键字,若判断店铺不匹配关键字,则过滤。
清洗单元13用于进行业态清洗过程,定义业态关键字,若店铺名称满足关键字,则设置为对应业态;以及,用于进行名称和地址清洗过程,过滤掉特殊符号。
融合单元14用于通过评论所属店铺的唯一标志查找所属店铺,并合并到店铺评论信息中。
经纬度分析单元15用于通过地图API“地址逆向解析接口”对店铺地址进行解析,解析出城市、区县、经纬度。
本具体实施例仅仅是对本发明的解释,其并不是对本发明的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本发明的权利要求范围内都受到专利法的保护。
Claims (9)
1.一种用于实时分析网络餐饮店铺风险的识别方法,其特征是,包括以下步骤:
S1:采集网络平台的餐饮数据,并进行数据处理,餐饮数据包括主体公示信息、评论信息以及地址信息;
S2:根据所述主体公示信息在FDA许可证数据库中进行匹配、识别与判断,并结合预设的公示信息分类权重计算匹配、识别与判断结果的风险值,以及对各个风险类型的风险值求和得到公示风险值;
S3:根据风险关键词对所述评论信息进行风险判断,并根据店铺规模和风险评论条数计算得到评论风险值;
S4:在S2中所述主体公示信息匹配成功后,在所述FDA许可证数据库中匹配所述地址信息,并根据匹配结果计算得到地址风险值;
S5:根据风险值权重对所述公示风险值、评论风险值、地址风险值进行权重计算后得到相应的单平台风险指数;
S6:根据时间、地区维度对风险指数进行统计与输出。
2.根据权利要求1所述的一种用于实时分析网络餐饮店铺风险的识别方法,其特征是,步骤S1所述餐饮数据的数据处理包括过滤、清洗、融合以及经纬度解析;
过滤:定义店铺名称、商品名称关键字,若店铺不匹配关键字,则过滤;
清洗:业态清洗过程,定义业态关键字,若店铺名称满足关键字,则设置为对应业态;名称和地址清洗过程,过滤掉特殊符号;
融合:通过评论所属店铺的唯一标志查找所属店铺,并合并到店铺评论信息中;
经纬度分析:通过地图API“地址逆向解析接口”对店铺地址进行解析,解析出城市、区县、经纬度。
3.根据权利要求1所述的一种用于实时分析网络餐饮店铺风险的识别方法,其特征是,在步骤S2中,采用CBAM算法分类所述主体公示信息中的店铺证照图片,分类类别包括营业执照、食品流通许可证、餐饮服务许可证、食品经营许可证、三小备案以及其它证件。
4.根据权利要求1所述的一种用于实时分析网络餐饮店铺风险的识别方法,其特征是,所述风险类型包括证件模糊、假证、一证多用、超经营范围、证件超期;
通过调用百度OCR识别算法对证件图片的人眼模糊进行识别,判断是否属于证件模糊;
采用目标检测算法检测图片上的二维码,解码二维码后提取出证照编号、营业期限、经营范围,并根据证照编号、营业期限、经营范围在证照库中匹配;若不匹配,则判断为相应的假证、超经营范围、证件超期;
通过搜索不同店铺是否存在相同编号的证照,判断相应店铺是否存在一证多用。
5.根据权利要求1所述的一种用于实时分析网络餐饮店铺风险的识别方法,其特征是,所述地址匹配具体为:将地址信息以行政级别划分进行分解,获取相同的行政级别后组成最长公共子序列,并根据最长公共子序列进行识别判断。
6.根据权利要求1所述的一种用于实时分析网络餐饮店铺风险的识别方法,其特征是,所述单平台风险指数的计算公式具体为:
Rn=Bn×40%+Cn×40%+An×20%
其中,Rn为单平台风险指数,Bn为公示风险值,Cn为评论风险值,An为地址风险值。
8.一种用于实时分析网络餐饮店铺风险的识别系统,其特征是,包括FDA许可证数据库(2)、数据采集模块(1)、公示风险评估模块(3)、评论风险评估模块(4)、地址风险评估模块(5)、风险指数计算模块(6)以及显示模块(7);
所述FDA许可证数据库(2),存储有店铺网络经营的食品生产经营许可备案数据;
所述数据采集模块(1),用于采集网络平台的餐饮数据,并进行数据处理,餐饮数据包括主体公示信息、评论信息以及地址信息;
所述公示风险评估模块(3),用于根据所述主体公示信息在FDA许可证数据库(2)中进行匹配、识别与判断,并结合预设的公示信息分类权重对匹配、识别与判断结果的风险值进行计算,以及对各个风险类型的风险值求和得到公示风险值;
所述评论风险评估模块(4),用于根据风险关键词对所述评论信息进行风险判断,并根据店铺规模和风险评论条数计算得到评论风险值;
所述地址风险评估模块(5),用于在所述主体公示信息匹配成功后,在所述FDA许可证数据库(2)中对所述地址信息进行匹配,并根据匹配结果计算得到地址风险值;
所述风险指数计算模块(6),用于根据风险值权重对所述公示风险值、评论风险值、地址风险值进行权重计算后得到相应的单平台风险指数;
所述显示模块(7),根据时间、地区维度对风险指数进行统计与输出。
9.根据权利要求8所述的一种用于实时分析网络餐饮店铺风险的识别系统,其特征是,所述数据采集模块(1)包括采集单元(11)、过滤单元(12)、清洗单元(13)、融合单元(14)以及经纬度分析单元(15);
所述采集单元(11),用于采集网络平台的餐饮数据;
所述过滤单元(12),定义店铺名称、商品名称关键字,若判断店铺不匹配关键字,则过滤;
所述清洗单元(13),用于进行业态清洗过程,定义业态关键字,若店铺名称满足关键字,则设置为对应业态;以及,用于进行名称和地址清洗过程,过滤掉特殊符号;
所述融合单元(14),用于通过评论所属店铺的唯一标志查找所属店铺,并合并到店铺评论信息中;
所述经纬度分析单元(15),用于通过地图API“地址逆向解析接口”对店铺地址进行解析,解析出城市、区县、经纬度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010612340.5A CN111861507B (zh) | 2020-06-30 | 2020-06-30 | 一种用于实时分析网络餐饮店铺风险的识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010612340.5A CN111861507B (zh) | 2020-06-30 | 2020-06-30 | 一种用于实时分析网络餐饮店铺风险的识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111861507A true CN111861507A (zh) | 2020-10-30 |
CN111861507B CN111861507B (zh) | 2023-10-24 |
Family
ID=72988933
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010612340.5A Active CN111861507B (zh) | 2020-06-30 | 2020-06-30 | 一种用于实时分析网络餐饮店铺风险的识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111861507B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112669070A (zh) * | 2020-12-29 | 2021-04-16 | 上海小零网络科技有限公司 | 一种预测门店销售量进行拓店的方法 |
CN113962514A (zh) * | 2021-09-09 | 2022-01-21 | 浪潮卓数大数据产业发展有限公司 | 一种经营风险识别的方法 |
CN114581107A (zh) * | 2022-03-04 | 2022-06-03 | 拉扎斯网络科技(上海)有限公司 | 一种潜在商户证件的检验方法、装置、存储介质及设备 |
CN114694843A (zh) * | 2022-03-29 | 2022-07-01 | 数字浙江技术运营有限公司 | 风险预警方法、装置和电子设备 |
Citations (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080229420A1 (en) * | 2007-03-16 | 2008-09-18 | Jeschke Konikaye | Predictive Assessment of Network Risks |
US20140279682A1 (en) * | 2013-03-14 | 2014-09-18 | Aleksandr Feldman | System and method for managing crowdfunding platform information |
CN105844424A (zh) * | 2016-05-30 | 2016-08-10 | 中国计量学院 | 基于网络评论的产品质量问题发现及风险评估方法 |
US20170116308A1 (en) * | 2015-10-23 | 2017-04-27 | Oracle International Corporation | System and method for aggregating values through risk dimension hierarchies in a multidimensional database environment |
CN106777150A (zh) * | 2016-12-19 | 2017-05-31 | 国网山东省电力公司电力科学研究院 | 一种融合电网运行环境及设备信息的跨系统数据转换方法 |
CN106844546A (zh) * | 2016-12-30 | 2017-06-13 | 江苏号百信息服务有限公司 | 基于Spark集群的多数据源位置信息融合方法及系统 |
CN106874381A (zh) * | 2017-01-09 | 2017-06-20 | 重庆邮电大学 | 一种基于Hadoop的无线电环境地图数据处理系统 |
CN107609807A (zh) * | 2017-11-08 | 2018-01-19 | 厦门美亚商鼎信息科技有限公司 | 一种网络餐饮风险识别方法及系统 |
CN107977798A (zh) * | 2017-12-21 | 2018-05-01 | 中国计量大学 | 一种电子商务产品质量的风险评价方法 |
CN108346096A (zh) * | 2018-02-23 | 2018-07-31 | 岭尚(上海)科技发展有限公司 | 风控系统及风控方法 |
CN108470275A (zh) * | 2018-04-12 | 2018-08-31 | 陈静 | 一种基于大数据的餐饮信息安全监管方法 |
CN108959609A (zh) * | 2018-07-16 | 2018-12-07 | 阿里巴巴集团控股有限公司 | 店铺地址的更新方法及装置 |
CN109345272A (zh) * | 2018-11-28 | 2019-02-15 | 中国计量大学 | 一种基于改进马尔科夫链的店铺信用风险预测方法 |
CN109657949A (zh) * | 2018-12-07 | 2019-04-19 | 铂森(苏州)投资咨询有限公司 | 一种量化风险管理系统 |
US20190156256A1 (en) * | 2017-11-22 | 2019-05-23 | International Business Machines Corporation | Generating risk assessment software |
CN109840676A (zh) * | 2018-12-13 | 2019-06-04 | 平安科技(深圳)有限公司 | 基于大数据的风控方法、装置、计算机设备及存储介质 |
CN110119882A (zh) * | 2019-04-12 | 2019-08-13 | 国家计算机网络与信息安全管理中心 | 一种平台风险监控方法、装置、设备及存储介质 |
CN110163532A (zh) * | 2019-05-30 | 2019-08-23 | 深圳前海微众银行股份有限公司 | 风险评估方法、风险管理方法、装置、设备及存储介质 |
CN110245841A (zh) * | 2019-05-21 | 2019-09-17 | 平安科技(深圳)有限公司 | 一种网约车风险控制方法及相关装置 |
CN111210377A (zh) * | 2019-12-30 | 2020-05-29 | 航天信息股份有限公司 | 一种基于云计算的网络订餐监管系统及方法 |
CN111241367A (zh) * | 2019-12-27 | 2020-06-05 | 航天信息股份有限公司 | 一种基于自定义规则对网络餐饮平台进行监管的方法及系统 |
CN111311439A (zh) * | 2019-07-10 | 2020-06-19 | 浙江商安信息科技有限公司 | 基于网络订餐平台筛选订餐商铺的方法、系统及存储介质 |
-
2020
- 2020-06-30 CN CN202010612340.5A patent/CN111861507B/zh active Active
Patent Citations (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080229420A1 (en) * | 2007-03-16 | 2008-09-18 | Jeschke Konikaye | Predictive Assessment of Network Risks |
US20140279682A1 (en) * | 2013-03-14 | 2014-09-18 | Aleksandr Feldman | System and method for managing crowdfunding platform information |
US20170116308A1 (en) * | 2015-10-23 | 2017-04-27 | Oracle International Corporation | System and method for aggregating values through risk dimension hierarchies in a multidimensional database environment |
CN105844424A (zh) * | 2016-05-30 | 2016-08-10 | 中国计量学院 | 基于网络评论的产品质量问题发现及风险评估方法 |
CN106777150A (zh) * | 2016-12-19 | 2017-05-31 | 国网山东省电力公司电力科学研究院 | 一种融合电网运行环境及设备信息的跨系统数据转换方法 |
CN106844546A (zh) * | 2016-12-30 | 2017-06-13 | 江苏号百信息服务有限公司 | 基于Spark集群的多数据源位置信息融合方法及系统 |
CN106874381A (zh) * | 2017-01-09 | 2017-06-20 | 重庆邮电大学 | 一种基于Hadoop的无线电环境地图数据处理系统 |
CN107609807A (zh) * | 2017-11-08 | 2018-01-19 | 厦门美亚商鼎信息科技有限公司 | 一种网络餐饮风险识别方法及系统 |
US20190156256A1 (en) * | 2017-11-22 | 2019-05-23 | International Business Machines Corporation | Generating risk assessment software |
CN107977798A (zh) * | 2017-12-21 | 2018-05-01 | 中国计量大学 | 一种电子商务产品质量的风险评价方法 |
CN108346096A (zh) * | 2018-02-23 | 2018-07-31 | 岭尚(上海)科技发展有限公司 | 风控系统及风控方法 |
CN108470275A (zh) * | 2018-04-12 | 2018-08-31 | 陈静 | 一种基于大数据的餐饮信息安全监管方法 |
CN108959609A (zh) * | 2018-07-16 | 2018-12-07 | 阿里巴巴集团控股有限公司 | 店铺地址的更新方法及装置 |
CN109345272A (zh) * | 2018-11-28 | 2019-02-15 | 中国计量大学 | 一种基于改进马尔科夫链的店铺信用风险预测方法 |
CN109657949A (zh) * | 2018-12-07 | 2019-04-19 | 铂森(苏州)投资咨询有限公司 | 一种量化风险管理系统 |
CN109840676A (zh) * | 2018-12-13 | 2019-06-04 | 平安科技(深圳)有限公司 | 基于大数据的风控方法、装置、计算机设备及存储介质 |
CN110119882A (zh) * | 2019-04-12 | 2019-08-13 | 国家计算机网络与信息安全管理中心 | 一种平台风险监控方法、装置、设备及存储介质 |
CN110245841A (zh) * | 2019-05-21 | 2019-09-17 | 平安科技(深圳)有限公司 | 一种网约车风险控制方法及相关装置 |
CN110163532A (zh) * | 2019-05-30 | 2019-08-23 | 深圳前海微众银行股份有限公司 | 风险评估方法、风险管理方法、装置、设备及存储介质 |
CN111311439A (zh) * | 2019-07-10 | 2020-06-19 | 浙江商安信息科技有限公司 | 基于网络订餐平台筛选订餐商铺的方法、系统及存储介质 |
CN111241367A (zh) * | 2019-12-27 | 2020-06-05 | 航天信息股份有限公司 | 一种基于自定义规则对网络餐饮平台进行监管的方法及系统 |
CN111210377A (zh) * | 2019-12-30 | 2020-05-29 | 航天信息股份有限公司 | 一种基于云计算的网络订餐监管系统及方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112669070A (zh) * | 2020-12-29 | 2021-04-16 | 上海小零网络科技有限公司 | 一种预测门店销售量进行拓店的方法 |
CN113962514A (zh) * | 2021-09-09 | 2022-01-21 | 浪潮卓数大数据产业发展有限公司 | 一种经营风险识别的方法 |
CN114581107A (zh) * | 2022-03-04 | 2022-06-03 | 拉扎斯网络科技(上海)有限公司 | 一种潜在商户证件的检验方法、装置、存储介质及设备 |
CN114694843A (zh) * | 2022-03-29 | 2022-07-01 | 数字浙江技术运营有限公司 | 风险预警方法、装置和电子设备 |
CN114694843B (zh) * | 2022-03-29 | 2024-07-23 | 数字浙江技术运营有限公司 | 风险预警方法、装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111861507B (zh) | 2023-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111861507B (zh) | 一种用于实时分析网络餐饮店铺风险的识别方法及系统 | |
CN107657267B (zh) | 产品潜在用户挖掘方法及装置 | |
CN110046984A (zh) | 企业信用评级系统及评价方法 | |
CN107993143A (zh) | 一种信贷风险评估方法及系统 | |
CN114066242A (zh) | 一种企业风险的预警方法及装置 | |
CN109360089A (zh) | 贷款风险预测方法及装置 | |
CN108932291B (zh) | 电网舆情评价方法、存储介质及计算机 | |
CN109472075B (zh) | 一种基站性能分析方法及系统 | |
CN113989019A (zh) | 识别风险的方法、装置、设备及存储介质 | |
CN115759640A (zh) | 一种智慧城市的公共服务信息处理系统及方法 | |
CN113642867A (zh) | 评估风险的方法及系统 | |
CN110992111A (zh) | 基于大数据的投保人用户画像挖掘方法 | |
CN115204995B (zh) | 一种税务数据采集分析方法、系统及计算机存储介质 | |
CN114692593A (zh) | 一种网络信息安全监测预警方法 | |
CN110033191B (zh) | 一种商业人工智能的分析方法及系统 | |
CN112132368A (zh) | 信息处理方法以及装置、计算设备、存储介质 | |
CN113962514A (zh) | 一种经营风险识别的方法 | |
CN108428156A (zh) | 网购用户买假指数模型的生成方法及系统 | |
CN112184297A (zh) | 一种电力市场辅助决策系统 | |
CN111415081A (zh) | 企业数据处理方法及装置 | |
CN114398562B (zh) | 一种店铺数据管理方法、装置、设备及存储介质 | |
CN112785462B (zh) | 基于大数据的景区客流量统计评估系统 | |
CN114266594A (zh) | 一种基于东南亚跨境电商平台的大数据分析方法 | |
CN111461876A (zh) | 一种基于大数据的电商信用体系管理系统及方法 | |
CN113379211A (zh) | 基于区块链的物流信息平台违约风险管控系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 610000 No. 270, floor 2, No. 8, Jinxiu street, Wuhou District, Chengdu, Sichuan Applicant after: Chengdu shuzhilian Technology Co.,Ltd. Address before: 610000 No.2, 4th floor, building 1, Jule Road intersection, West 1st section of 1st ring road, Wuhou District, Chengdu City, Sichuan Province Applicant before: CHENGDU SHUZHILIAN TECHNOLOGY Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |