CN110110275B - 一种浏览资源的分析方法及分析装置 - Google Patents

一种浏览资源的分析方法及分析装置 Download PDF

Info

Publication number
CN110110275B
CN110110275B CN201910422856.0A CN201910422856A CN110110275B CN 110110275 B CN110110275 B CN 110110275B CN 201910422856 A CN201910422856 A CN 201910422856A CN 110110275 B CN110110275 B CN 110110275B
Authority
CN
China
Prior art keywords
product
information
browsing
characteristic information
resources
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910422856.0A
Other languages
English (en)
Other versions
CN110110275A (zh
Inventor
崔小珊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Miaozhen Information Technology Co Ltd
Original Assignee
Miaozhen Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Miaozhen Information Technology Co Ltd filed Critical Miaozhen Information Technology Co Ltd
Priority to CN201910422856.0A priority Critical patent/CN110110275B/zh
Publication of CN110110275A publication Critical patent/CN110110275A/zh
Application granted granted Critical
Publication of CN110110275B publication Critical patent/CN110110275B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种浏览资源的分析方法及分析装置,获取目标浏览资源中展示产品的至少一个维度特征信息;根据获取到的产品属性信息库以及展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;基于展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的目标浏览资源的曝光信息;基于每个产品特征信息相应的目标浏览资源的曝光信息,确定目标浏览资源的至少一个影响力指数;基于至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告,有助于减少网络资源的占有率,减少网络资源的浪费。

Description

一种浏览资源的分析方法及分析装置
技术领域
本申请涉及浏览资源分析技术领域,尤其是涉及一种浏览资源的分析方法及分析装置。
背景技术
随着互联网技术的不断发展,很多信息公布于互联网之中,信息传递速度快且传播的范围广,网络中大量的网络资源,也对人们的日常生活产生了越来越大的影响。但不是所有的互联网中的网络资源都是用户所需要的,例如网络资源中的用于对信息或者产品等进行推荐的浏览资源,对于不同的用户来讲,感兴趣的浏览资源不同,或者说需要的浏览资源不同,而不同的浏览资源对于信息或者产品的推荐作用也不同。
目前对于网络中的推荐资源,大多是粗放型投放,而且在投放后,不能对投放的浏览资源进行及时的跟进和调查,没有有效的对浏览资源的过滤和筛选,使得网络中推荐信息和推荐产品等的浏览资源数量庞大,用户兴趣低和不需要的浏览资源大量留存,使得网络资源占有率高,极易造成网络资源浪费。
发明内容
有鉴于此,本申请的目的在于提供一种浏览资源的分析方法及分析装置,通过浏览资源中展示产品的维度特征信息和产品特征信息,获取到浏览资源的曝光信息,从而完成对浏览资源的分析,得到浏览资源的影响力分析报告以方便人们能够更快速的在互联网的大量信息中找到自己所需要的浏览资源,方便对浏览资源的统计,并对浏览资源进行分析有助于对浏览资源的过滤和筛选,并有助于减少网络资源的占有率,减少网络资源的浪费。
本申请实施例提供了一种浏览资源的分析方法,所述方法包括:
获取目标浏览资源中展示产品的至少一个维度特征信息,其中,每个维度特征信息中包括至少一个产品特征信息;
根据获取到的产品属性信息库以及所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;
基于所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量;
基于每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数;
基于所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告。
进一步的,所述获取目标浏览资源中展示产品的至少一个维度特征信息之前,包括:
从网络资源中爬取多个样本产品,以及每个样本产品的至少一个维度特征信息和每个样本产品的标识信息;
将每个样本产品的至少一个维度特征信息进行规格统一化处理,其中,所述规格统一化处理是指,将每个样本产品的至少一个维度特征信息中的规格信息转换至等值规格范围内;
提取规格统一化处理后的每个维度特征信息的关键字信息,基于所述样本产品的标识信息以及关键字信息建立产品属性信息库。
进一步的,所述分析方法通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的影响力指数:
Figure BDA0002066556570000031
其中,In为与第n个产品特征信息相应的目标浏览资源的影响力指数,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ien为与第n个产品特征信息相应的同类型产品浏览资源的日均曝光量。
进一步的,所述分析还通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的日均曝光量:
Figure BDA0002066556570000032
其中,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ten为与第n个产品特征信息相应的目标浏览资源的总曝光量,Dn为与第n个产品特征信息相应的目标浏览资源的曝光时间。
进一步的,基于所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告,包括:
将确定的每个维度下的至少一个影响力指数进行排序,并确定排序后影响力指数对比信息;
基于所述影响力指数对比信息以及所述产品属性信息库中的关键字信息,生成浏览资源影响力分析报告。
本申请实施例还提供了一种浏览资源的分析装置,所述分析装置包括:
获取模块,用于获取目标浏览资源中展示产品的至少一个维度特征信息,其中,每个维度特征信息中包括至少一个产品特征信息;
第一确定模块,用于根据获取到的产品属性信息库以及所述获取模块获取的所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;
匹配模块,用于基于所述第一确定模块确定的所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量;
第二确定模块,用于基于所述匹配模块匹配出的每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数;
生成模块,用于基于所述第二确定模块确定的所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告。
进一步的,所述分析装置还包括建立模块,所述建立模块包括:
爬取单元,用于从网络资源中爬取多个样本产品,以及每个样本产品的至少一个维度特征信息和每个样本产品的标识信息;
处理单元,用于将每个样本产品的至少一个维度特征信息进行规格统一化处理,其中,所述规格统一化处理是指,将每个样本产品的至少一个维度特征信息中的规格信息转换至等值规格范围内;
建立单元,用于提取规格统一化处理后每个维度特征信息的关键字信息,基于所述样本产品的标识信息以及关键字信息建立产品属性信息库。
进一步的,所述第二确定模块通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的影响力指数:
Figure BDA0002066556570000041
其中,In为与第n个产品特征信息相应的目标浏览资源的影响力指数,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ien为与第n个产品特征信息相应的同类型产品浏览资源的日均曝光量。
进一步的,所述第二确定模块还通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的日均曝光量:
Figure BDA0002066556570000051
其中,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ten为与第n个产品特征信息相应的目标浏览资源的总曝光量,Dn为与第n个产品特征信息相应的目标浏览资源的曝光时间。
进一步的,所述生成模块包括:
排序单元,用于将所述第二确定模块确定的每个维度下的至少一个影响力指数进行排序,并确定排序后影响力指数对比信息;
生成单元,用于基于所述影响力指数对比信息以及所述产品属性信息库中的关键字信息,生成浏览资源影响力分析报告。
本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的一种浏览资源的分析方法的步骤。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的一种浏览资源的分析方法的步骤。
本申请实施例提供的一种浏览资源的分析方法及分析装置,获取目标浏览资源中展示产品的至少一个维度特征信息,其中,每个维度特征信息中包括至少一个产品特征信息;根据获取到的产品属性信息库以及所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;基于所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量;基于每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数;基于所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告。
这样,本申请通过获取目标浏览资源中展示产品的至少一个维度特征信息的至少一个产品特征信息,能够在浏览资源检测库中匹配出目标浏览资源的曝光信息,通过目标浏览资源的曝光信息计算得到浏览资源的影响力指数,基于浏览资源的影响力指数,生成浏览资源影响力分析报告,以方便人们能够更快速的在互联网的大量信息中找到自己所需要的浏览资源,方便对浏览资源的统计,并对浏览资源进行分析有助于对浏览资源的过滤和筛选,并有助于进减少网络资源的占有率,减少网络资源的浪费。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为一种可能的应用场景下的系统架构图;
图2为本申请一实施例提供的一种浏览资源的分析方法的流程图;
图3为本申请另一实施例提供的一种浏览资源的分析方法的流程图;
图4为本申请一实施例提供的一种浏览资源的分析装置的结构图之一;
图5为本申请一实施例提供的一种浏览资源的分析装置的结构图之二;
图6为图5中所示的建立模块的结构图;
图7为图4中所示的生成模块的结构图;
图8为本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
首先,对本申请可适用的应用场景进行介绍。本申请可应用于浏览资源分析技术领域,通过获取目标浏览资源中展示产品的维度特征信息,生成目标浏览资源影响力分析报告,以便人们对浏览资源中展示产品进行分析与比较。请参阅图1,图1为一种在该应用场景下的系统构图。如图1中所示,所述系统包括浏览装置和分析装置,所述浏览装置用与对互联网中的浏览资源进行浏览,所述分析装置根据浏览装置中的浏览记录或者是存储内容,从所述浏览装置中确定需要进行分析的目标浏览资源,并获取目标浏览资源中展示产品的至少一个维度特征信息,根据维度特征信息中的产品特征信息,匹配出与每个产品特征信息相应的浏览资源的曝光信息,根据所述曝光信息确定出浏览资源的影响力指数,生成浏览资源影响力分析报告。
经研究发现,目前人们想要对浏览资源中的产品进行分析和比较,必须通过对互联网中的大量浏览资源进行筛选得到自己想要的浏览资源,根据浏览资源的影响力分析出各个浏览资源所展示的产品的好坏,这就使得人们需要浏览大量的互联网中的浏览资源,浪费了人们大量的时间。
基于此,本申请实施例提供了一种浏览资源的分析方法,通过获取目标浏览资源中展示产品的维度特征信息,生成浏览资源影响力分析报告,以方便人们能够更快速的在互联网的大量信息中找到自己所需要的浏览资源,方便对浏览资源的统计,并对浏览资源进行分析有助于对浏览资源的过滤和筛选,并有助于减少网络资源的占有率,减少网络资源的浪费。
请参阅图2,图2为本申请实施例所提供的一种浏览资源的分析方法的流程图。如图2中所示,本申请实施例提供的一种浏览资源的分析方法,包括:
步骤201、获取目标浏览资源中展示产品的至少一个维度特征信息,其中,每个维度特征信息中包括至少一个产品特征信息。
该步骤中,当对一个目标浏览资源进行分析时,获取目标浏览资源中展示产品的至少一个维度特征信息,其中,在每一个维度特征中包括至少一个产品特征信息。
举例来说,有一个需要分析的浏览资源,假设从浏览资源中获取到展示产品的“类别”为“面霜”,其中“类别”就是一个维度特征信息,首先获取这个面霜的其他的维度特征信息,如:功效、质地、产地等,在功效这个维度中包括至少一个产品特征信息,所述产品特征信息包括:美白、保湿以及抗衰老等。
步骤202、根据获取到的产品属性信息库以及所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息。
该步骤中,获取到展示产品的至少一个维度特征信息后,获取产品属性信息库的信息,将获取到的展示产品的维度特征信息,在所述产品属性信息库中进行匹配,确定出与获取到的展示产品的维度特征信息相对应的产品的标识信息,用于后续的匹配工作。
其中,所述展示产品的标识信息包括:产品的品牌、产品的名称、或者是产品的简称等。
对应与上述实施例,获取到产品的类别为“面霜”,功效信息为:“美白”、“保湿”以及“抗衰老”,那么能够根据上述特征信息“面霜”、“美白”、“保湿”以及“抗衰老”确定出符合以上特征的产品的标识信息为“产品A”或者“产品AX系列”。
步骤203、基于所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量。
该步骤中,确定出所述浏览资源中展示产品的标识信息后,根据确定出的所述浏览资源中展示产品的标识信息,在浏览资源监测数据库中进行匹配,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,其中,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量。
对应于上述实施例,在确定出产品的标识信息为“产品A”之后,在浏览资源监测数据库中分别匹配出名称为“产品A”的“面霜”在“美白面霜”产品中的所述目标浏览资源的曝光信息,在“保湿面霜”产品中的所述目标浏览资源的曝光信息,在“抗衰老面霜”产品中的所述目标浏览资源的曝光信息。
其中,所述同类型产品浏览资源的日均曝光量是指,具有相同产品特征信息的所有产品的浏览资源的日均曝光量。
对应于上述实施例,也就是说“产品A”的产品特征信息为“面霜”、“美白”,所述同类型产品浏览资源的日均曝光量就是所有的功效为“美白”的“面霜”的产品浏览资源的日均曝光量。
步骤204、基于每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数。
该步骤中,基于匹配出的每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,计算所述目标浏览资源的影响力指数,其中影响力指数的个数与产品特征信息的个数相同。
步骤205、基于所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告。
该步骤中,将计算出的至少一个影响力指数以及所述目标浏览资源中展示产品在产品属性信息库中对应的信息显示在同一个界面之中,生成关于目标浏览资源的浏览资源影响力分析报告。
本申请实施例提供的一种浏览资源的分析方法,获取目标浏览资源中展示产品的至少一个维度特征信息,其中,所述维度特征信息中包括至少一个产品特征信息;根据获取到的产品属性信息库以及所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;基于所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量;基于每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数;基于所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告。
这样,本申请通过获取目标浏览资源中展示产品的至少一个维度特征信息的至少一个产品特征信息,能够在浏览资源检测库中匹配出目标浏览资源的曝光信息,通过目标浏览资源的曝光信息计算得到浏览资源的影响力指数,基于浏览资源的影响力指数,生成浏览资源影响力分析报告,以方便人们能够更快速的在互联网的大量信息中找到自己所需要的浏览资源,方便对浏览资源的统计,并对浏览资源进行分析有助于对浏览资源的过滤和筛选,并有助于减少网络资源的占有率,减少网络资源的浪费。
请参阅图3,图3为本申请另一实施例提供的一种浏览资源的分析方法的流程图。如图3中所示,本申请实施例提供的一种浏览资源的分析方法,包括:
步骤301、获取目标浏览资源中展示产品的至少一个维度特征信息,其中,所述维度特征信息中包括至少一个产品特征信息。
步骤302、根据获取到的产品属性信息库以及所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息。
步骤303、基于所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量。
步骤304、基于每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数。
其中,步骤301至步骤304的描述可以参照步骤201至步骤204的描述,并且能达到相同的技术效果,对此不做赘述。
步骤305、将确定的每个维度下的至少一个影响力指数进行排序,并确定排序后影响力指数对比信息。
该步骤中,计算获得所述目标浏览资源的至少一个影响力指数后,将确定了的每个维度下的至少一个影响力指数的值进行排序,获得影响力指数对比信息,用于后续生成浏览资源影响力分析报告。
对应于上述实施例,在获得了“产品A面霜”的浏览资源在所有“美白面霜”浏览资源中的影响里指数为0.9、“产品A面霜”的浏览资源在所有“保湿面霜”浏览资源中的影响里指数为0.8以及“产品A面霜”的浏览资源在所有“抗衰老面霜”浏览资源中的影响里指数为0.7之后,将三个不同的影响力指数只进行排序,获得影响力指数对比信息“美白面霜(0.9)>保湿面霜(0.8)>抗衰老面霜(0.7)”,将“美白面霜(0.9)>保湿面霜(0.8)>抗衰老面霜(0.7)”用于后续生成浏览资源影响力分析报告。
在本实施例中,对于影响力指数的排序方法为降序排列,但不仅局限于此,在其他实施例中还能够通过升序的方法进行排序。
步骤306、基于所述影响力指数对比信息以及所述产品属性信息库中的关键字信息,生成浏览资源影响力分析报告。
该步骤中,根据获取到的目标浏览资源中展示产品的维度特征信息,从产品属性信息库匹配出符合维度特征信息的产品的全部关键字信息,将全部的关键字信息显示在浏览资源影响力分析报告中,同时还将获得影响力指数对比信息显示在浏览资源影响力分析报告中。
进一步的,步骤301之前还包括:从网络资源中爬取多个样本产品,以及每个样本产品的至少一个维度特征信息和每个样本产品的标识信息;将每个样本产品的至少一个维度特征信息进行规格统一化处理,其中,所述规格统一化处理是指,将每个样本产品的至少一个维度特征信息中的规格信息转换至等值规格范围内;提取规格统一化处理后的每个维度特征信息的关键字信息,基于所述样本产品的标识信息以及关键字信息建立产品属性信息库。
该步骤中,通过爬虫的方式,从网络资源中爬取多个样本产品,以及每个样本产品的至少一个维度特征信息和每个样本产品的标识信息,由于在不同的网络资源中每个样本产品的维度特征信息中的规格信息的范围不同,为了方便后续进行比较,将相同类型的产品的规格信息转换至等值规格范围内,如“面霜A”的规格为“100元50ml”、“面霜B”的规格为“600元100ml”,此时就需要将两个面霜的规格进行统一,将“面霜B”的规格信息转化为“300元50ml”;并提取规格统一后的样本产品的每个维度特征信息的关键字信息,对应于上述实施例,所述关键字信息为“100元50ml”、“300元50ml”、“面霜”、“美白”等;基于获取到的所述样本产品的标识信息以及提取到的样本产品的关键字信息建立产品属性信息库。
其中,所述关键字信息是对样本产品的维度特征信息进行描述的信息,如:维度特征信息为“功效”,关键字信息为“美白”、“保湿”等;维度特征信息为“价格”,关键字信息为“100元50ml”、“300元50ml”等。
进一步的,步骤304还包括:通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的影响力指数:
Figure BDA0002066556570000131
其中,In为与第n个产品特征信息相应的目标浏览资源的影响力指数,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ien为与第n个产品特征信息相应的同类型产品浏览资源的日均曝光量。
该步骤中,从所述浏览资源监测数据库中获取与第n个产品特征信息相应的同类型产品浏览资源的日均曝光量Ien,用与第n个产品特征信息相应的目标浏览资源的日均曝光量Den除以获取到的与第n个产品特征信息相应的同类型产品浏览资源的日均曝光量Ien,计算得到与第n个产品特征信息相应的目标浏览资源的影响力指数In
进一步的,步骤304还包括:还通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的日均曝光量:
Figure BDA0002066556570000141
其中,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ten为与第n个产品特征信息相应的目标浏览资源的总曝光量,Dn为与第n个产品特征信息相应的目标浏览资源的曝光时间。
该步骤中,从所述浏览资源监测数据库中获取与第n个产品特征信息相应的目标浏览资源的总曝光量Ten以及目标浏览资源的曝光时间Dn,用目标浏览资源的总曝光量Ten除以目标浏览资源的曝光时间Dn,计算得到与第n个产品特征信息相应的目标浏览资源的日均曝光量Den,将目标浏览资源的日均曝光量Den用于计算与第n个产品特征信息相应的目标浏览资源的影响力指数。
本申请实施例提供的一种浏览资源的分析方法,获取目标浏览资源中展示产品的至少一个维度特征信息,其中,所述维度特征信息中包括至少一个产品特征信息;根据获取到的产品属性信息库以及所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;基于所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量;基于每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数;将确定的每个维度下的至少一个影响力指数进行排序,并确定排序后影响力指数对比信息;基于所述影响力指数对比信息以及所述产品属性信息库中的关键字信息,生成浏览资源影响力分析报告。
这样,本申请通过获取目标浏览资源中展示产品的至少一个维度特征信息的至少一个产品特征信息,能够在浏览资源检测库中匹配出目标浏览资源的曝光信息,通过目标浏览资源的曝光信息计算得到浏览资源的影响力指数,基于浏览资源的影响力指数,将计算得到的浏览资源的不同的影响力指数进行排序,生成影响力指数对比信息,基于影响力指数对比信息以及所述产品属性信息库中的关键字信息,生成浏览资源影响力分析报告,以方便人们能够更快速的在互联网的大量信息中找到自己所需要的浏览资源,方便对浏览资源的统计,并对浏览资源进行分析有助于对浏览资源的过滤和筛选,并有助于减少网络资源的占有率,减少网络资源的浪费。
请参阅图4,图4为本申请实施例所提供的一种浏览资源的分析装置的结构示意图之一,图5为本申请实施例所提供的一种浏览资源的分析装置的结构示意图之二,图6为图5中所示的生成模块的结构图,图7为图4中所示的生成模块的结构图。如图4中所示,所述一种浏览资源的分析装置400包括:
获取模块410,用于获取目标浏览资源中展示产品的至少一个维度特征信息,其中,每个维度特征信息中包括至少一个产品特征信息;
第一确定模块420,用于根据获取到的产品属性信息库以及所述获取模块410获取的所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;
匹配模块430,用于基于所述第一确定模块420确定的所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量;
第二确定模块440,用于基于所述匹配模块430匹配出的每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数;
生成模块450,用于基于所述第二确定模块440确定的所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告。
进一步的,如图5、图6所示,所述分析装置400还包括建立模块460,所述建立模块460包括:
爬取单元461,用于从网络资源中爬取多个样本产品,以及每个样本产品的至少一个维度特征信息和每个样本产品的标识信息;
处理单元462,用于将爬取单元461爬取的每个样本产品的至少一个维度特征信息进行规格统一化处理,其中,所述规格统一化处理是指,将每个样本产品的至少一个维度特征信息中的规格信息转换至等值规格范围内;
建立单元463,用于提取处理单元462规格统一化处理后每个维度特征信息的关键字信息,基于所述样本产品的标识信息以及关键字信息建立产品属性信息库。
进一步的,所述第二确定模块440通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的影响力指数:
Figure BDA0002066556570000161
其中,In为与第n个产品特征信息相应的目标浏览资源的影响力指数,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ien为与第n个产品特征信息相应的同类型产品浏览资源的日均曝光量。
进一步的,所述第二确定模块440还通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的日均曝光量:
Figure BDA0002066556570000162
其中,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ten为与第n个产品特征信息相应的目标浏览资源的总曝光量,Dn为与第n个产品特征信息相应的目标浏览资源的曝光时间。
进一步的,如图7所示所述生成模块450包括:
排序单元451,用于将所述第二确定模块440确定的每个维度下的至少一个影响力指数进行排序,并确定排序后影响力指数对比信息;
生成单元452,用于基于所述排序单元453所述影响力指数对比信息以及所述产品属性信息库中的关键字信息,生成浏览资源影响力分析报告。
本申请实施例提供的一种浏览资源的分析装置,获取目标浏览资源中展示产品的至少一个维度特征信息,其中,所述维度特征信息中包括至少一个产品特征信息;根据获取到的产品属性信息库以及所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;基于所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量;基于每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数;基于所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告。
这样,本申请通过获取目标浏览资源中展示产品的至少一个维度特征信息的至少一个产品特征信息,能够在浏览资源检测库中匹配出目标浏览资源的曝光信息,通过目标浏览资源的曝光信息计算得到浏览资源的影响力指数,基于浏览资源的影响力指数,生成浏览资源影响力分析报告,以方便人们能够更快速的在互联网的大量信息中找到自己所需要的浏览资源,方便对浏览资源的统计,并对浏览资源进行分析有助于对浏览资源的过滤和筛选,并有助于减少网络资源的占有率,减少网络资源的浪费。
请参阅图8,图8为本申请实施例所提供的一种电子设备的结构示意图。如图8中所示,所述电子设备800包括处理器810、存储器820和总线830。
所述存储器820存储有所述处理器810可执行的机器可读指令,当电子设备800运行时,所述处理器810与所述存储器820之间通过总线830通信,所述机器可读指令被所述处理器810执行时,可以执行如上述图2以及图3所示方法实施例中的一种浏览资源的分析方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图2以及图3所示方法实施例中的一种浏览资源的分析方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (8)

1.一种浏览资源的分析方法,其特征在于,所述分析方法包括:
获取目标浏览资源中展示产品的至少一个维度特征信息,其中,每个维度特征信息中包括至少一个产品特征信息;
根据获取到的产品属性信息库以及所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;
基于所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量;
基于每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数;
基于所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告;
其中,通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的影响力指数:
Figure FDA0002977932810000011
其中,In为与第n个产品特征信息相应的目标浏览资源的影响力指数,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ien为与第n个产品特征信息相应的同类型产品浏览资源的日均曝光量。
2.如权利要求1所述的分析方法,其特征在于,所述获取目标浏览资源中展示产品的至少一个维度特征信息之前,包括:
从网络资源中爬取多个样本产品,以及每个样本产品的至少一个维度特征信息和每个样本产品的标识信息;
将每个样本产品的至少一个维度特征信息进行规格统一化处理,其中,所述规格统一化处理是指,将每个样本产品的至少一个维度特征信息中的规格信息转换至等值规格范围内;
提取规格统一化处理后的每个维度特征信息的关键字信息,基于所述样本产品的标识信息以及关键字信息建立产品属性信息库。
3.如权利要求1所述的分析方法,其特征在于,通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的日均曝光量:
Figure FDA0002977932810000021
其中,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ten为与第n个产品特征信息相应的目标浏览资源的总曝光量,Dn为与第n个产品特征信息相应的目标浏览资源的曝光时间。
4.如权利要求2所述的分析方法,其特征在于,基于所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告,包括:
将确定的每个维度下的至少一个影响力指数进行排序,并确定排序后影响力指数对比信息;
基于所述影响力指数对比信息以及所述产品属性信息库中的关键字信息,生成浏览资源影响力分析报告。
5.一种产品属性的分析装置,其特征在于,所述分析装置包括:
获取模块,用于获取目标浏览资源中展示产品的至少一个维度特征信息,其中,每个维度特征信息中包括至少一个产品特征信息;
第一确定模块,用于根据获取到的产品属性信息库以及所述获取模块获取的所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;
匹配模块,用于基于所述第一确定模块确定的所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量;
第二确定模块,用于基于所述匹配模块匹配出的每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数;
生成模块,用于基于所述第二确定模块确定的所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告;
其中,所述第二确定模块通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的影响力指数:
Figure FDA0002977932810000031
其中,In为与第n个产品特征信息相应的目标浏览资源的影响力指数,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ien为与第n个产品特征信息相应的同类型产品浏览资源的日均曝光量。
6.如权利要求5所述的分析装置,其特征在于,所述分析装置还包括建立模块,所述建立模块包括:
爬取单元,用于从网络资源中爬取多个样本产品,以及每个样本产品的至少一个维度特征信息和每个样本产品的标识信息;
处理单元,用于将爬取单元爬取的每个样本产品的至少一个维度特征信息进行规格统一化处理,其中,所述规格统一化处理是指,将每个样本产品的至少一个维度特征信息中的规格信息转换至等值规格范围内;
建立单元,用于提取处理单元规格统一化处理后每个维度特征信息的关键字信息,基于所述样本产品的标识信息以及关键字信息建立产品属性信息库。
7.如权利要求5所述的分析装置,其特征在于,所述第二确定模块还通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的日均曝光量:
Figure FDA0002977932810000041
其中,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ten为与第n个产品特征信息相应的目标浏览资源的总曝光量,Dn为与第n个产品特征信息相应的目标浏览资源的曝光时间。
8.如权利要求6所述的分析装置,其特征在于,所述生成模块包括:
排序单元,用于将所述第二确定模块确定的每个维度下的至少一个影响力指数进行排序,并确定排序后影响力指数对比信息;
生成单元,用于基于所述排序单元确定的所述影响力指数对比信息以及所述产品属性信息库中的关键字信息,生成浏览资源影响力分析报告。
CN201910422856.0A 2019-05-21 2019-05-21 一种浏览资源的分析方法及分析装置 Active CN110110275B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910422856.0A CN110110275B (zh) 2019-05-21 2019-05-21 一种浏览资源的分析方法及分析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910422856.0A CN110110275B (zh) 2019-05-21 2019-05-21 一种浏览资源的分析方法及分析装置

Publications (2)

Publication Number Publication Date
CN110110275A CN110110275A (zh) 2019-08-09
CN110110275B true CN110110275B (zh) 2021-07-06

Family

ID=67491393

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910422856.0A Active CN110110275B (zh) 2019-05-21 2019-05-21 一种浏览资源的分析方法及分析装置

Country Status (1)

Country Link
CN (1) CN110110275B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446180A (zh) * 2010-10-09 2012-05-09 腾讯科技(深圳)有限公司 一种商品搜索方法及其装置
CN104021163A (zh) * 2014-05-28 2014-09-03 深圳市盛讯达科技股份有限公司 产品推荐系统及方法
CN104731876A (zh) * 2007-04-02 2015-06-24 北京奇虎科技有限公司 一种评价网络资源价值的方法及其在搜索引擎领域的应用
CN105389328A (zh) * 2015-09-21 2016-03-09 中国人民解放军国防科学技术大学 一种大规模开源软件搜索排序优化方法
CN105956131A (zh) * 2016-05-10 2016-09-21 乐视控股(北京)有限公司 资源搜索方法及装置
CN106407349A (zh) * 2016-09-06 2017-02-15 北京三快在线科技有限公司 一种产品推荐方法及装置
CN108510375A (zh) * 2018-04-20 2018-09-07 重庆凯务电子商务有限公司 在线商品选购分析系统
CN108694174A (zh) * 2017-04-05 2018-10-23 腾讯科技(深圳)有限公司 内容投放数据的分析方法及装置
JP2019028872A (ja) * 2017-08-02 2019-02-21 株式会社平賀 販売商品情報の報告システム及び該報告システム用プログラム
CN109684583A (zh) * 2018-11-12 2019-04-26 深圳壹账通智能科技有限公司 页面用户行为的分析方法、装置、终端及可读存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10693743B2 (en) * 2015-09-21 2020-06-23 Splunk Inc. Displaying interactive topology maps of cloud computing resources
US10091224B2 (en) * 2015-10-31 2018-10-02 Mcafee, Llc Implicit crowdsourcing for untracked correction or verification of categorization information

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104731876A (zh) * 2007-04-02 2015-06-24 北京奇虎科技有限公司 一种评价网络资源价值的方法及其在搜索引擎领域的应用
CN102446180A (zh) * 2010-10-09 2012-05-09 腾讯科技(深圳)有限公司 一种商品搜索方法及其装置
CN104021163A (zh) * 2014-05-28 2014-09-03 深圳市盛讯达科技股份有限公司 产品推荐系统及方法
CN105389328A (zh) * 2015-09-21 2016-03-09 中国人民解放军国防科学技术大学 一种大规模开源软件搜索排序优化方法
CN105956131A (zh) * 2016-05-10 2016-09-21 乐视控股(北京)有限公司 资源搜索方法及装置
CN106407349A (zh) * 2016-09-06 2017-02-15 北京三快在线科技有限公司 一种产品推荐方法及装置
CN108694174A (zh) * 2017-04-05 2018-10-23 腾讯科技(深圳)有限公司 内容投放数据的分析方法及装置
JP2019028872A (ja) * 2017-08-02 2019-02-21 株式会社平賀 販売商品情報の報告システム及び該報告システム用プログラム
CN108510375A (zh) * 2018-04-20 2018-09-07 重庆凯务电子商务有限公司 在线商品选购分析系统
CN109684583A (zh) * 2018-11-12 2019-04-26 深圳壹账通智能科技有限公司 页面用户行为的分析方法、装置、终端及可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《产品竞争力分析及营销预警》;邵妍等;《北京工业大学学报》;20001230;全文 *

Also Published As

Publication number Publication date
CN110110275A (zh) 2019-08-09

Similar Documents

Publication Publication Date Title
US20210035126A1 (en) Data processing method, system and computer device based on electronic payment behaviors
CN108021651B (zh) 一种网络舆情风险评估方法及装置
US9245035B2 (en) Information processing system, information processing method, program, and non-transitory information storage medium
CN110706026A (zh) 一种异常用户的识别方法、识别装置及可读存储介质
CN107918618B (zh) 数据处理方法及装置
CN109784736A (zh) 一种基于大数据的分析决策系统
CN113688310B (zh) 一种内容推荐方法、装置、设备及存储介质
CN115391669B (zh) 一种智能推荐方法、装置、电子设备
CN111242318B (zh) 基于异构特征库的业务模型训练方法及装置
CN110717097A (zh) 业务推荐方法、装置、计算机设备和存储介质
CN112559923A (zh) 网址资源推荐方法、装置、电子设备及计算机存储介质
JP6695987B2 (ja) 広告生成方法、コンピュータ読み取り可能な記憶媒体及びシステム
CN110782232A (zh) 业务流程可视化配置方法、装置、电子设备及存储介质
CN108959289B (zh) 网站类别获取方法和装置
CN106941419B (zh) 网络体系结构和网络通信模式的可视分析方法及系统
CN110110275B (zh) 一种浏览资源的分析方法及分析装置
CN112487021A (zh) 业务数据的关联分析方法、装置及设备
CN112214663A (zh) 获取舆情声量的方法、系统、装置、存储介质及移动终端
CN116910102A (zh) 一种基于用户反馈的企业查询方法、装置及电子设备
CN109949090B (zh) 客户推荐方法、装置、电子设备及介质
CN106919603B (zh) 计算查询词模式中分词权重的方法和装置
CN111667018A (zh) 一种对象聚类的方法、装置、计算机可读介质及电子设备
KR20210029006A (ko) 제품 평가 마이닝 방법 및 이를 수행하는 장치
CN115965439A (zh) 数据召回方法、数据召回装置、电子设备及存储介质
CN110069691A (zh) 用于处理点击行为数据的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant