CN110110275A - 一种浏览资源的分析方法及分析装置 - Google Patents

一种浏览资源的分析方法及分析装置 Download PDF

Info

Publication number
CN110110275A
CN110110275A CN201910422856.0A CN201910422856A CN110110275A CN 110110275 A CN110110275 A CN 110110275A CN 201910422856 A CN201910422856 A CN 201910422856A CN 110110275 A CN110110275 A CN 110110275A
Authority
CN
China
Prior art keywords
product
information
resource
browsing
browsing resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910422856.0A
Other languages
English (en)
Other versions
CN110110275B (zh
Inventor
崔小珊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Miaozhen Information Technology Co Ltd
Miaozhen Systems Information Technology Co Ltd
Original Assignee
Miaozhen Systems Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Miaozhen Systems Information Technology Co Ltd filed Critical Miaozhen Systems Information Technology Co Ltd
Priority to CN201910422856.0A priority Critical patent/CN110110275B/zh
Publication of CN110110275A publication Critical patent/CN110110275A/zh
Application granted granted Critical
Publication of CN110110275B publication Critical patent/CN110110275B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种浏览资源的分析方法及分析装置,获取目标浏览资源中展示产品的至少一个维度特征信息;根据获取到的产品属性信息库以及展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;基于展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的目标浏览资源的曝光信息;基于每个产品特征信息相应的目标浏览资源的曝光信息,确定目标浏览资源的至少一个影响力指数;基于至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告,有助于减少网络资源的占有率,减少网络资源的浪费。

Description

一种浏览资源的分析方法及分析装置
技术领域
本申请涉及浏览资源分析技术领域,尤其是涉及一种浏览资源的分析方法及分析装置。
背景技术
随着互联网技术的不断发展,很多信息公布于互联网之中,信息传递速度快且传播的范围广,网络中大量的网络资源,也对人们的日常生活产生了越来越大的影响。但不是所有的互联网中的网络资源都是用户所需要的,例如网络资源中的用于对信息或者产品等进行推荐的浏览资源,对于不同的用户来讲,感兴趣的浏览资源不同,或者说需要的浏览资源不同,而不同的浏览资源对于信息或者产品的推荐作用也不同。
目前对于网络中的推荐资源,大多是粗放型投放,而且在投放后,不能对投放的浏览资源进行及时的跟进和调查,没有有效的对浏览资源的过滤和筛选,使得网络中推荐信息和推荐产品等的浏览资源数量庞大,用户兴趣低和不需要的浏览资源大量留存,使得网络资源占有率高,极易造成网络资源浪费。
发明内容
有鉴于此,本申请的目的在于提供一种浏览资源的分析方法及分析装置,通过浏览资源中展示产品的维度特征信息和产品特征信息,获取到浏览资源的曝光信息,从而完成对浏览资源的分析,得到浏览资源的影响力分析报告以方便人们能够更快速的在互联网的大量信息中找到自己所需要的浏览资源,方便对浏览资源的统计,并对浏览资源进行分析有助于对浏览资源的过滤和筛选,并有助于减少网络资源的占有率,减少网络资源的浪费。
本申请实施例提供了一种浏览资源的分析方法,所述方法包括:
获取目标浏览资源中展示产品的至少一个维度特征信息,其中,每个维度特征信息中包括至少一个产品特征信息;
根据获取到的产品属性信息库以及所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;
基于所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量;
基于每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数;
基于所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告。
进一步的,所述获取目标浏览资源中展示产品的至少一个维度特征信息之前,包括:
从网络资源中爬取多个样本产品,以及每个样本产品的至少一个维度特征信息和每个样本产品的标识信息;
将每个样本产品的至少一个维度特征信息进行规格统一化处理,其中,所述规格统一化处理是指,将每个样本产品的至少一个维度特征信息中的规格信息转换至等值规格范围内;
提取规格统一化处理后的每个维度特征信息的关键字信息,基于所述样本产品的标识信息以及关键字信息建立产品属性信息库。
进一步的,所述分析方法通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的影响力指数:
其中,In为与第n个产品特征信息相应的目标浏览资源的影响力指数,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ien为与第n个产品特征信息相应的同类型产品浏览资源的日均曝光量。
进一步的,所述分析还通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的日均曝光量:
其中,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ten为与第n个产品特征信息相应的目标浏览资源的总曝光量,Dn为与第n个产品特征信息相应的目标浏览资源的曝光时间。
进一步的,基于所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告,包括:
将确定的每个维度下的至少一个影响力指数进行排序,并确定排序后影响力指数对比信息;
基于所述影响力指数对比信息以及所述产品属性信息库中的关键字信息,生成浏览资源影响力分析报告。
本申请实施例还提供了一种浏览资源的分析装置,所述分析装置包括:
获取模块,用于获取目标浏览资源中展示产品的至少一个维度特征信息,其中,每个维度特征信息中包括至少一个产品特征信息;
第一确定模块,用于根据获取到的产品属性信息库以及所述获取模块获取的所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;
匹配模块,用于基于所述第一确定模块确定的所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量;
第二确定模块,用于基于所述匹配模块匹配出的每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数;
生成模块,用于基于所述第二确定模块确定的所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告。
进一步的,所述分析装置还包括建立模块,所述建立模块包括:
爬取单元,用于从网络资源中爬取多个样本产品,以及每个样本产品的至少一个维度特征信息和每个样本产品的标识信息;
处理单元,用于将每个样本产品的至少一个维度特征信息进行规格统一化处理,其中,所述规格统一化处理是指,将每个样本产品的至少一个维度特征信息中的规格信息转换至等值规格范围内;
建立单元,用于提取规格统一化处理后每个维度特征信息的关键字信息,基于所述样本产品的标识信息以及关键字信息建立产品属性信息库。
进一步的,所述第二确定模块通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的影响力指数:
其中,In为与第n个产品特征信息相应的目标浏览资源的影响力指数,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ien为与第n个产品特征信息相应的同类型产品浏览资源的日均曝光量。
进一步的,所述第二确定模块还通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的日均曝光量:
其中,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ten为与第n个产品特征信息相应的目标浏览资源的总曝光量,Dn为与第n个产品特征信息相应的目标浏览资源的曝光时间。
进一步的,所述生成模块包括:
排序单元,用于将所述第二确定模块确定的每个维度下的至少一个影响力指数进行排序,并确定排序后影响力指数对比信息;
生成单元,用于基于所述影响力指数对比信息以及所述产品属性信息库中的关键字信息,生成浏览资源影响力分析报告。
本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的一种浏览资源的分析方法的步骤。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的一种浏览资源的分析方法的步骤。
本申请实施例提供的一种浏览资源的分析方法及分析装置,获取目标浏览资源中展示产品的至少一个维度特征信息,其中,每个维度特征信息中包括至少一个产品特征信息;根据获取到的产品属性信息库以及所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;基于所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量;基于每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数;基于所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告。
这样,本申请通过获取目标浏览资源中展示产品的至少一个维度特征信息的至少一个产品特征信息,能够在浏览资源检测库中匹配出目标浏览资源的曝光信息,通过目标浏览资源的曝光信息计算得到浏览资源的影响力指数,基于浏览资源的影响力指数,生成浏览资源影响力分析报告,以方便人们能够更快速的在互联网的大量信息中找到自己所需要的浏览资源,方便对浏览资源的统计,并对浏览资源进行分析有助于对浏览资源的过滤和筛选,并有助于进减少网络资源的占有率,减少网络资源的浪费。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为一种可能的应用场景下的系统架构图;
图2为本申请一实施例提供的一种浏览资源的分析方法的流程图;
图3为本申请另一实施例提供的一种浏览资源的分析方法的流程图;
图4为本申请一实施例提供的一种浏览资源的分析装置的结构图之一;
图5为本申请一实施例提供的一种浏览资源的分析装置的结构图之二;
图6为图5中所示的建立模块的结构图;
图7为图4中所示的生成模块的结构图;
图8为本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
首先,对本申请可适用的应用场景进行介绍。本申请可应用于浏览资源分析技术领域,通过获取目标浏览资源中展示产品的维度特征信息,生成目标浏览资源影响力分析报告,以便人们对浏览资源中展示产品进行分析与比较。请参阅图1,图1为一种在该应用场景下的系统构图。如图1中所示,所述系统包括浏览装置和分析装置,所述浏览装置用与对互联网中的浏览资源进行浏览,所述分析装置根据浏览装置中的浏览记录或者是存储内容,从所述浏览装置中确定需要进行分析的目标浏览资源,并获取目标浏览资源中展示产品的至少一个维度特征信息,根据维度特征信息中的产品特征信息,匹配出与每个产品特征信息相应的浏览资源的曝光信息,根据所述曝光信息确定出浏览资源的影响力指数,生成浏览资源影响力分析报告。
经研究发现,目前人们想要对浏览资源中的产品进行分析和比较,必须通过对互联网中的大量浏览资源进行筛选得到自己想要的浏览资源,根据浏览资源的影响力分析出各个浏览资源所展示的产品的好坏,这就使得人们需要浏览大量的互联网中的浏览资源,浪费了人们大量的时间。
基于此,本申请实施例提供了一种浏览资源的分析方法,通过获取目标浏览资源中展示产品的维度特征信息,生成浏览资源影响力分析报告,以方便人们能够更快速的在互联网的大量信息中找到自己所需要的浏览资源,方便对浏览资源的统计,并对浏览资源进行分析有助于对浏览资源的过滤和筛选,并有助于减少网络资源的占有率,减少网络资源的浪费。
请参阅图2,图2为本申请实施例所提供的一种浏览资源的分析方法的流程图。如图2中所示,本申请实施例提供的一种浏览资源的分析方法,包括:
步骤201、获取目标浏览资源中展示产品的至少一个维度特征信息,其中,每个维度特征信息中包括至少一个产品特征信息。
该步骤中,当对一个目标浏览资源进行分析时,获取目标浏览资源中展示产品的至少一个维度特征信息,其中,在每一个维度特征中包括至少一个产品特征信息。
举例来说,有一个需要分析的浏览资源,假设从浏览资源中获取到展示产品的“类别”为“面霜”,其中“类别”就是一个维度特征信息,首先获取这个面霜的其他的维度特征信息,如:功效、质地、产地等,在功效这个维度中包括至少一个产品特征信息,所述产品特征信息包括:美白、保湿以及抗衰老等。
步骤202、根据获取到的产品属性信息库以及所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息。
该步骤中,获取到展示产品的至少一个维度特征信息后,获取产品属性信息库的信息,将获取到的展示产品的维度特征信息,在所述产品属性信息库中进行匹配,确定出与获取到的展示产品的维度特征信息相对应的产品的标识信息,用于后续的匹配工作。
其中,所述展示产品的标识信息包括:产品的品牌、产品的名称、或者是产品的简称等。
对应与上述实施例,获取到产品的类别为“面霜”,功效信息为:“美白”、“保湿”以及“抗衰老”,那么能够根据上述特征信息“面霜”、“美白”、“保湿”以及“抗衰老”确定出符合以上特征的产品的标识信息为“产品A”或者“产品AX系列”。
步骤203、基于所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量。
该步骤中,确定出所述浏览资源中展示产品的标识信息后,根据确定出的所述浏览资源中展示产品的标识信息,在浏览资源监测数据库中进行匹配,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,其中,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量。
对应于上述实施例,在确定出产品的标识信息为“产品A”之后,在浏览资源监测数据库中分别匹配出名称为“产品A”的“面霜”在“美白面霜”产品中的所述目标浏览资源的曝光信息,在“保湿面霜”产品中的所述目标浏览资源的曝光信息,在“抗衰老面霜”产品中的所述目标浏览资源的曝光信息。
其中,所述同类型产品浏览资源的日均曝光量是指,具有相同产品特征信息的所有产品的浏览资源的日均曝光量。
对应于上述实施例,也就是说“产品A”的产品特征信息为“面霜”、“美白”,所述同类型产品浏览资源的日均曝光量就是所有的功效为“美白”的“面霜”的产品浏览资源的日均曝光量。
步骤204、基于每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数。
该步骤中,基于匹配出的每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,计算所述目标浏览资源的影响力指数,其中影响力指数的个数与产品特征信息的个数相同。
步骤205、基于所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告。
该步骤中,将计算出的至少一个影响力指数以及所述目标浏览资源中展示产品在产品属性信息库中对应的信息显示在同一个界面之中,生成关于目标浏览资源的浏览资源影响力分析报告。
本申请实施例提供的一种浏览资源的分析方法,获取目标浏览资源中展示产品的至少一个维度特征信息,其中,所述维度特征信息中包括至少一个产品特征信息;根据获取到的产品属性信息库以及所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;基于所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量;基于每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数;基于所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告。
这样,本申请通过获取目标浏览资源中展示产品的至少一个维度特征信息的至少一个产品特征信息,能够在浏览资源检测库中匹配出目标浏览资源的曝光信息,通过目标浏览资源的曝光信息计算得到浏览资源的影响力指数,基于浏览资源的影响力指数,生成浏览资源影响力分析报告,以方便人们能够更快速的在互联网的大量信息中找到自己所需要的浏览资源,方便对浏览资源的统计,并对浏览资源进行分析有助于对浏览资源的过滤和筛选,并有助于减少网络资源的占有率,减少网络资源的浪费。
请参阅图3,图3为本申请另一实施例提供的一种浏览资源的分析方法的流程图。如图3中所示,本申请实施例提供的一种浏览资源的分析方法,包括:
步骤301、获取目标浏览资源中展示产品的至少一个维度特征信息,其中,所述维度特征信息中包括至少一个产品特征信息。
步骤302、根据获取到的产品属性信息库以及所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息。
步骤303、基于所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量。
步骤304、基于每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数。
其中,步骤301至步骤304的描述可以参照步骤201至步骤204的描述,并且能达到相同的技术效果,对此不做赘述。
步骤305、将确定的每个维度下的至少一个影响力指数进行排序,并确定排序后影响力指数对比信息。
该步骤中,计算获得所述目标浏览资源的至少一个影响力指数后,将确定了的每个维度下的至少一个影响力指数的值进行排序,获得影响力指数对比信息,用于后续生成浏览资源影响力分析报告。
对应于上述实施例,在获得了“产品A面霜”的浏览资源在所有“美白面霜”浏览资源中的影响里指数为0.9、“产品A面霜”的浏览资源在所有“保湿面霜”浏览资源中的影响里指数为0.8以及“产品A面霜”的浏览资源在所有“抗衰老面霜”浏览资源中的影响里指数为0.7之后,将三个不同的影响力指数只进行排序,获得影响力指数对比信息“美白面霜(0.9)>保湿面霜(0.8)>抗衰老面霜(0.7)”,将“美白面霜(0.9)>保湿面霜(0.8)>抗衰老面霜(0.7)”用于后续生成浏览资源影响力分析报告。
在本实施例中,对于影响力指数的排序方法为降序排列,但不仅局限于此,在其他实施例中还能够通过升序的方法进行排序。
步骤306、基于所述影响力指数对比信息以及所述产品属性信息库中的关键字信息,生成浏览资源影响力分析报告。
该步骤中,根据获取到的目标浏览资源中展示产品的维度特征信息,从产品属性信息库匹配出符合维度特征信息的产品的全部关键字信息,将全部的关键字信息显示在浏览资源影响力分析报告中,同时还将获得影响力指数对比信息显示在浏览资源影响力分析报告中。
进一步的,步骤301之前还包括:从网络资源中爬取多个样本产品,以及每个样本产品的至少一个维度特征信息和每个样本产品的标识信息;将每个样本产品的至少一个维度特征信息进行规格统一化处理,其中,所述规格统一化处理是指,将每个样本产品的至少一个维度特征信息中的规格信息转换至等值规格范围内;提取规格统一化处理后的每个维度特征信息的关键字信息,基于所述样本产品的标识信息以及关键字信息建立产品属性信息库。
该步骤中,通过爬虫的方式,从网络资源中爬取多个样本产品,以及每个样本产品的至少一个维度特征信息和每个样本产品的标识信息,由于在不同的网络资源中每个样本产品的维度特征信息中的规格信息的范围不同,为了方便后续进行比较,将相同类型的产品的规格信息转换至等值规格范围内,如“面霜A”的规格为“100元50ml”、“面霜B”的规格为“600元100ml”,此时就需要将两个面霜的规格进行统一,将“面霜B”的规格信息转化为“300元50ml”;并提取规格统一后的样本产品的每个维度特征信息的关键字信息,对应于上述实施例,所述关键字信息为“100元50ml”、“300元50ml”、“面霜”、“美白”等;基于获取到的所述样本产品的标识信息以及提取到的样本产品的关键字信息建立产品属性信息库。
其中,所述关键字信息是对样本产品的维度特征信息进行描述的信息,如:维度特征信息为“功效”,关键字信息为“美白”、“保湿”等;维度特征信息为“价格”,关键字信息为“100元50ml”、“300元50ml”等。
进一步的,步骤304还包括:通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的影响力指数:
其中,In为与第n个产品特征信息相应的目标浏览资源的影响力指数,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ien为与第n个产品特征信息相应的同类型产品浏览资源的日均曝光量。
该步骤中,从所述浏览资源监测数据库中获取与第n个产品特征信息相应的同类型产品浏览资源的日均曝光量Ien,用与第n个产品特征信息相应的目标浏览资源的日均曝光量Den除以获取到的与第n个产品特征信息相应的同类型产品浏览资源的日均曝光量Ien,计算得到与第n个产品特征信息相应的目标浏览资源的影响力指数In
进一步的,步骤304还包括:还通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的日均曝光量:
其中,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ten为与第n个产品特征信息相应的目标浏览资源的总曝光量,Dn为与第n个产品特征信息相应的目标浏览资源的曝光时间。
该步骤中,从所述浏览资源监测数据库中获取与第n个产品特征信息相应的目标浏览资源的总曝光量Ten以及目标浏览资源的曝光时间Dn,用目标浏览资源的总曝光量Ten除以目标浏览资源的曝光时间Dn,计算得到与第n个产品特征信息相应的目标浏览资源的日均曝光量Den,将目标浏览资源的日均曝光量Den用于计算与第n个产品特征信息相应的目标浏览资源的影响力指数。
本申请实施例提供的一种浏览资源的分析方法,获取目标浏览资源中展示产品的至少一个维度特征信息,其中,所述维度特征信息中包括至少一个产品特征信息;根据获取到的产品属性信息库以及所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;基于所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量;基于每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数;将确定的每个维度下的至少一个影响力指数进行排序,并确定排序后影响力指数对比信息;基于所述影响力指数对比信息以及所述产品属性信息库中的关键字信息,生成浏览资源影响力分析报告。
这样,本申请通过获取目标浏览资源中展示产品的至少一个维度特征信息的至少一个产品特征信息,能够在浏览资源检测库中匹配出目标浏览资源的曝光信息,通过目标浏览资源的曝光信息计算得到浏览资源的影响力指数,基于浏览资源的影响力指数,将计算得到的浏览资源的不同的影响力指数进行排序,生成影响力指数对比信息,基于影响力指数对比信息以及所述产品属性信息库中的关键字信息,生成浏览资源影响力分析报告,以方便人们能够更快速的在互联网的大量信息中找到自己所需要的浏览资源,方便对浏览资源的统计,并对浏览资源进行分析有助于对浏览资源的过滤和筛选,并有助于减少网络资源的占有率,减少网络资源的浪费。
请参阅图4,图4为本申请实施例所提供的一种浏览资源的分析装置的结构示意图之一,图5为本申请实施例所提供的一种浏览资源的分析装置的结构示意图之二,图6为图5中所示的生成模块的结构图,图7为图4中所示的生成模块的结构图。如图4中所示,所述一种浏览资源的分析装置400包括:
获取模块410,用于获取目标浏览资源中展示产品的至少一个维度特征信息,其中,每个维度特征信息中包括至少一个产品特征信息;
第一确定模块420,用于根据获取到的产品属性信息库以及所述获取模块410获取的所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;
匹配模块430,用于基于所述第一确定模块420确定的所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量;
第二确定模块440,用于基于所述匹配模块430匹配出的每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数;
生成模块450,用于基于所述第二确定模块440确定的所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告。
进一步的,如图5、图6所示,所述分析装置400还包括建立模块460,所述建立模块460包括:
爬取单元461,用于从网络资源中爬取多个样本产品,以及每个样本产品的至少一个维度特征信息和每个样本产品的标识信息;
处理单元462,用于将爬取单元461爬取的每个样本产品的至少一个维度特征信息进行规格统一化处理,其中,所述规格统一化处理是指,将每个样本产品的至少一个维度特征信息中的规格信息转换至等值规格范围内;
建立单元463,用于提取处理单元462规格统一化处理后每个维度特征信息的关键字信息,基于所述样本产品的标识信息以及关键字信息建立产品属性信息库。
进一步的,所述第二确定模块440通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的影响力指数:
其中,In为与第n个产品特征信息相应的目标浏览资源的影响力指数,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ien为与第n个产品特征信息相应的同类型产品浏览资源的日均曝光量。
进一步的,所述第二确定模块440还通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的日均曝光量:
其中,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ten为与第n个产品特征信息相应的目标浏览资源的总曝光量,Dn为与第n个产品特征信息相应的目标浏览资源的曝光时间。
进一步的,如图7所示所述生成模块450包括:
排序单元451,用于将所述第二确定模块440确定的每个维度下的至少一个影响力指数进行排序,并确定排序后影响力指数对比信息;
生成单元452,用于基于所述排序单元453所述影响力指数对比信息以及所述产品属性信息库中的关键字信息,生成浏览资源影响力分析报告。
本申请实施例提供的一种浏览资源的分析装置,获取目标浏览资源中展示产品的至少一个维度特征信息,其中,所述维度特征信息中包括至少一个产品特征信息;根据获取到的产品属性信息库以及所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;基于所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量;基于每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数;基于所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告。
这样,本申请通过获取目标浏览资源中展示产品的至少一个维度特征信息的至少一个产品特征信息,能够在浏览资源检测库中匹配出目标浏览资源的曝光信息,通过目标浏览资源的曝光信息计算得到浏览资源的影响力指数,基于浏览资源的影响力指数,生成浏览资源影响力分析报告,以方便人们能够更快速的在互联网的大量信息中找到自己所需要的浏览资源,方便对浏览资源的统计,并对浏览资源进行分析有助于对浏览资源的过滤和筛选,并有助于减少网络资源的占有率,减少网络资源的浪费。
请参阅图8,图8为本申请实施例所提供的一种电子设备的结构示意图。如图8中所示,所述电子设备800包括处理器810、存储器820和总线830。
所述存储器820存储有所述处理器810可执行的机器可读指令,当电子设备800运行时,所述处理器810与所述存储器820之间通过总线830通信,所述机器可读指令被所述处理器810执行时,可以执行如上述图2以及图3所示方法实施例中的一种浏览资源的分析方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图2以及图3所示方法实施例中的一种浏览资源的分析方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种浏览资源的分析方法,其特征在于,所述分析方法包括:
获取目标浏览资源中展示产品的至少一个维度特征信息,其中,每个维度特征信息中包括至少一个产品特征信息;
根据获取到的产品属性信息库以及所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;
基于所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量;
基于每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数;
基于所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告。
2.如权利要求1所述的分析方法,其特征在于,所述获取目标浏览资源中展示产品的至少一个维度特征信息之前,包括:
从网络资源中爬取多个样本产品,以及每个样本产品的至少一个维度特征信息和每个样本产品的标识信息;
将每个样本产品的至少一个维度特征信息进行规格统一化处理,其中,所述规格统一化处理是指,将每个样本产品的至少一个维度特征信息中的规格信息转换至等值规格范围内;
提取规格统一化处理后的每个维度特征信息的关键字信息,基于所述样本产品的标识信息以及关键字信息建立产品属性信息库。
3.如权利要求1所述的分析方法,其特征在于,通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的影响力指数:
其中,In为与第n个产品特征信息相应的目标浏览资源的影响力指数,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ien为与第n个产品特征信息相应的同类型产品浏览资源的日均曝光量。
4.如权利要求3所述的分析方法,其特征在于,通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的日均曝光量:
其中,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ten为与第n个产品特征信息相应的目标浏览资源的总曝光量,Dn为与第n个产品特征信息相应的目标浏览资源的曝光时间。
5.如权利要求2所述的分析方法,其特征在于,基于所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告,包括:
将确定的每个维度下的至少一个影响力指数进行排序,并确定排序后影响力指数对比信息;
基于所述影响力指数对比信息以及所述产品属性信息库中的关键字信息,生成浏览资源影响力分析报告。
6.一种产品属性的分析装置,其特征在于,所述分析装置包括:
获取模块,用于获取目标浏览资源中展示产品的至少一个维度特征信息,其中,每个维度特征信息中包括至少一个产品特征信息;
第一确定模块,用于根据获取到的产品属性信息库以及所述获取模块获取的所述展示产品的至少一个维度特征信息,确定所述浏览资源中展示产品的标识信息;
匹配模块,用于基于所述第一确定模块确定的所述展示产品的标识信息以及浏览资源监测数据库,匹配出与每个产品特征信息相应的所述目标浏览资源的曝光信息,所述曝光信息包括:目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量;
第二确定模块,用于基于所述匹配模块匹配出的每个产品特征信息相应的目标浏览资源的总曝光量、目标浏览资源的曝光时间以及同类型产品浏览资源的日均曝光量,确定所述目标浏览资源的至少一个影响力指数;
生成模块,用于基于所述第二确定模块确定的所述至少一个影响力指数以及所述产品属性信息库,生成浏览资源影响力分析报告。
7.如权利要求6所述的分析装置,其特征在于,所述分析装置还包括建立模块,所述建立模块包括:
爬取单元,用于从网络资源中爬取多个样本产品,以及每个样本产品的至少一个维度特征信息和每个样本产品的标识信息;
处理单元,用于将爬取单元爬取的每个样本产品的至少一个维度特征信息进行规格统一化处理,其中,所述规格统一化处理是指,将每个样本产品的至少一个维度特征信息中的规格信息转换至等值规格范围内;
建立单元,用于提取处理单元规格统一化处理后每个维度特征信息的关键字信息,基于所述样本产品的标识信息以及关键字信息建立产品属性信息库。
8.如权利要求6所述的分析装置,其特征在于,所述第二确定模块通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的影响力指数:
其中,In为与第n个产品特征信息相应的目标浏览资源的影响力指数,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ien为与第n个产品特征信息相应的同类型产品浏览资源的日均曝光量。
9.如权利要求8所述的分析装置,其特征在于,所述第二确定模块还通过以下公式计算得到与第n个产品特征信息相应的目标浏览资源的日均曝光量:
其中,Den为与第n个产品特征信息相应的目标浏览资源的日均曝光量,Ten为与第n个产品特征信息相应的目标浏览资源的总曝光量,Dn为与第n个产品特征信息相应的目标浏览资源的曝光时间。
10.如权利要求7所述的分析装置,其特征在于,所述生成模块包括:
排序单元,用于将所述第二确定模块确定的每个维度下的至少一个影响力指数进行排序,并确定排序后影响力指数对比信息;
生成单元,用于基于所述排序单元确定的所述影响力指数对比信息以及所述产品属性信息库中的关键字信息,生成浏览资源影响力分析报告。
CN201910422856.0A 2019-05-21 2019-05-21 一种浏览资源的分析方法及分析装置 Active CN110110275B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910422856.0A CN110110275B (zh) 2019-05-21 2019-05-21 一种浏览资源的分析方法及分析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910422856.0A CN110110275B (zh) 2019-05-21 2019-05-21 一种浏览资源的分析方法及分析装置

Publications (2)

Publication Number Publication Date
CN110110275A true CN110110275A (zh) 2019-08-09
CN110110275B CN110110275B (zh) 2021-07-06

Family

ID=67491393

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910422856.0A Active CN110110275B (zh) 2019-05-21 2019-05-21 一种浏览资源的分析方法及分析装置

Country Status (1)

Country Link
CN (1) CN110110275B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446180A (zh) * 2010-10-09 2012-05-09 腾讯科技(深圳)有限公司 一种商品搜索方法及其装置
CN104021163A (zh) * 2014-05-28 2014-09-03 深圳市盛讯达科技股份有限公司 产品推荐系统及方法
CN104731876A (zh) * 2007-04-02 2015-06-24 北京奇虎科技有限公司 一种评价网络资源价值的方法及其在搜索引擎领域的应用
CN105389328A (zh) * 2015-09-21 2016-03-09 中国人民解放军国防科学技术大学 一种大规模开源软件搜索排序优化方法
CN105956131A (zh) * 2016-05-10 2016-09-21 乐视控股(北京)有限公司 资源搜索方法及装置
CN106407349A (zh) * 2016-09-06 2017-02-15 北京三快在线科技有限公司 一种产品推荐方法及装置
US20170093645A1 (en) * 2015-09-21 2017-03-30 Splunk Inc. Displaying Interactive Topology Maps Of Cloud Computing Resources
CN108510375A (zh) * 2018-04-20 2018-09-07 重庆凯务电子商务有限公司 在线商品选购分析系统
CN108694174A (zh) * 2017-04-05 2018-10-23 腾讯科技(深圳)有限公司 内容投放数据的分析方法及装置
US20180367559A1 (en) * 2015-10-31 2018-12-20 Mcafee, Llc Implicit crowdsourcing for untracked correction or verification of categorization information
JP2019028872A (ja) * 2017-08-02 2019-02-21 株式会社平賀 販売商品情報の報告システム及び該報告システム用プログラム
CN109684583A (zh) * 2018-11-12 2019-04-26 深圳壹账通智能科技有限公司 页面用户行为的分析方法、装置、终端及可读存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104731876A (zh) * 2007-04-02 2015-06-24 北京奇虎科技有限公司 一种评价网络资源价值的方法及其在搜索引擎领域的应用
CN102446180A (zh) * 2010-10-09 2012-05-09 腾讯科技(深圳)有限公司 一种商品搜索方法及其装置
CN104021163A (zh) * 2014-05-28 2014-09-03 深圳市盛讯达科技股份有限公司 产品推荐系统及方法
CN105389328A (zh) * 2015-09-21 2016-03-09 中国人民解放军国防科学技术大学 一种大规模开源软件搜索排序优化方法
US20170093645A1 (en) * 2015-09-21 2017-03-30 Splunk Inc. Displaying Interactive Topology Maps Of Cloud Computing Resources
US20180367559A1 (en) * 2015-10-31 2018-12-20 Mcafee, Llc Implicit crowdsourcing for untracked correction or verification of categorization information
CN105956131A (zh) * 2016-05-10 2016-09-21 乐视控股(北京)有限公司 资源搜索方法及装置
CN106407349A (zh) * 2016-09-06 2017-02-15 北京三快在线科技有限公司 一种产品推荐方法及装置
CN108694174A (zh) * 2017-04-05 2018-10-23 腾讯科技(深圳)有限公司 内容投放数据的分析方法及装置
JP2019028872A (ja) * 2017-08-02 2019-02-21 株式会社平賀 販売商品情報の報告システム及び該報告システム用プログラム
CN108510375A (zh) * 2018-04-20 2018-09-07 重庆凯务电子商务有限公司 在线商品选购分析系统
CN109684583A (zh) * 2018-11-12 2019-04-26 深圳壹账通智能科技有限公司 页面用户行为的分析方法、装置、终端及可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邵妍等: "《产品竞争力分析及营销预警》", 《北京工业大学学报》 *

Also Published As

Publication number Publication date
CN110110275B (zh) 2021-07-06

Similar Documents

Publication Publication Date Title
US10409367B2 (en) Predictive graph selection
CN103189836B (zh) 用于对图数据流中的对象分类的方法
McKelvey et al. Truthy: Enabling the study of online social networks
CN106407425A (zh) 基于人工智能的推送信息的方法和装置
CN104462553A (zh) 问答页面相关问题推荐方法及装置
CN108446964B (zh) 一种基于移动流量dpi数据的用户推荐方法
Pessa et al. ordpy: A Python package for data analysis with permutation entropy and ordinal network methods
CN112052387A (zh) 一种内容推荐方法、装置和计算机可读存储介质
CN109977312A (zh) 一种基于内容标签的知识库推荐系统
CN111932308A (zh) 数据推荐方法、装置和设备
Danisch et al. Towards multi-ego-centred communities: a node similarity approach
CN104572757A (zh) 微博群体处理方法及装置
CN104809218A (zh) 一种ugc视频分类方法及装置
CN111291191A (zh) 一种广电知识图谱构建方法及装置
Rai et al. Using open source intelligence as a tool for reliable web searching
CN106406985A (zh) 分布式计算框架和分布式计算方法
Kolomeets et al. Social networks analysis by graph algorithms on the example of the VKontakte social network.
Ahmed et al. An efficient technique for network traffic summarization using multiview clustering and statistical sampling
Kunegis On the spectral evolution of large networks
CN109829033A (zh) 数据展示方法和终端设备
CN116955817A (zh) 内容推荐方法、装置、电子设备以及存储介质
TW201627880A (zh) 服務搜索系統及方法
CN110110275A (zh) 一种浏览资源的分析方法及分析装置
Maivizhi et al. A survey of tools for community detection and mining in social networks
CN110457387A (zh) 一种应用于网络中用户标签确定的方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant