CN106446059A - 一种基于大数据的页面定制化方法 - Google Patents

一种基于大数据的页面定制化方法 Download PDF

Info

Publication number
CN106446059A
CN106446059A CN201610804385.6A CN201610804385A CN106446059A CN 106446059 A CN106446059 A CN 106446059A CN 201610804385 A CN201610804385 A CN 201610804385A CN 106446059 A CN106446059 A CN 106446059A
Authority
CN
China
Prior art keywords
user
information
data
webpage
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610804385.6A
Other languages
English (en)
Inventor
颜臣
李易业
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Julian E-Commerce Co Ltd
Original Assignee
Guangdong Julian E-Commerce Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Julian E-Commerce Co Ltd filed Critical Guangdong Julian E-Commerce Co Ltd
Priority to CN201610804385.6A priority Critical patent/CN106446059A/zh
Publication of CN106446059A publication Critical patent/CN106446059A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于大数据的页面定制化方法,包括以下步骤;步骤1,用户信息采集,步骤2,用户数据分析;步骤3,推送信息,在用户浏览网页时,根据信息匹配模型向用户推送信息;步骤4,查看信息;本发明具有如下的有益效果:通过分析用户数据获得用户的需求,提高用户获取所需信息和信息推送的效率,避免了电子商务中用户搜索所需商品所产生的浏览中的大量无关信息,大大改善了用户的使用体验,能有效的引导用户购物,满足用户购物体验,同时,在用户浏览新闻网页时,根据信息匹配模型以及阀值,向用户推送感兴趣的新闻;在用户搜索网页时,根据信息匹配模型以及阀值,向用户推送可能会搜索的关键词,增加了用户体验。

Description

一种基于大数据的页面定制化方法
技术领域
本发明是一种基于大数据的页面定制化方法,属于大数据信息处理领域。
背景技术
互联网犹如一把双刃剑,虽然很大程度上它推动了电子商务的迅猛发展,使商家能够通过电子商务平台将自己的商品展示给消费者,消费者足不出户便可对商品信息完全掌握,并与商家达成交易,双方各取所需,但是随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。
这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。同时随着电子商务系统正处在不断的扩大化,系统结构不断的复杂化,用户及商品的数量几乎呈直线上身,然而现阶段很多推荐算法由于自身的条件限制,存在两个方面的问题:稀疏性问题与扩展性问题,这严重的影响了推荐的质量。
同时随着互联网的发展及普及,信息爆炸性增长使用户难以及时准确地发现有用的数据源,导致人们在获取丰富的数据源过程中受到信息过载的困扰。如何帮助用户从激增的海量信息中获取有效的数据源,主动地为用户提供更丰富、全面并符合其潜在需求的数据源,给电子商务领域技术带来了极大的挑战。然而,当前技术中忽略了具体环境对用户数据的影响。另一方面,面对众多资源,现有的方案根据用户对资源的评价信息产生的推送,这种基于页面记分的推送只能体现用户对页面整体的兴趣情况。然而实际上用户对页面资源的评价往往是根据它所具有的属性特征产生的,因此根据仅仅根据用户对资源的整体记分而产生的推送结果往往具有片面性。
发明内容
针对现有技术存在的不足,本发明目的是提供一种基于大数据的页面定制化方法,以解决上述背景技术中提出的问题。
为了实现上述目的,本发明是通过如下的技术方案来实现:一种基于大数据的页面定制化方法,包括以下步骤;
步骤1,用户信息采集,利用多个大数据的小型数据库来接收发自客户端的数据,这个客户端数据是指用户在网上浏览信息时,所留下来的操作记录;
步骤2,用户数据分析,通过多个大数据的小型数据库将分析后的数据进行修剪,得到需要记录和储存的数据,通过数据清洗、数据转换、数据整合及数据加载中一种或者多种操作将基础数据转换为预处理后的数据,然后多个大数据的小型数据库将处理后的数据统一发送至一个大型数据库中,在大型数据库中,大型数据库通过云计算平台将处理后的数据提取特征值,并对这些信息进行分类和汇总,构成一信息匹配模型,然后设定一阀值;
步骤3,推送信息,在用户浏览网页时,根据信息匹配模型向用户推送信息;
步骤4,查看信息,在用户浏览推送的信息时,根据用户的操作,网页进行相应的操作,当用户的点击推送的信息时,网页弹出一个新页面,用于显示用户所点击信息的详细介绍,当用户的鼠标指针悬停在推送的信息上时,网页在现有页面的基础上,弹出一预览页面,用于显示用户所点击信息的详细介绍。
进一步地,在步骤1中,用户的操作记录包括:在用户在购物网页时,用户的购物记录,用户点击商品的记录以及用户在所点击商品中的停留时间;在用户浏览新闻网页时,网页的关键词记录,网页的类型记录以及网页内容记录;在用户搜索网页时,搜索的关键词记录以及搜索的历史记录。
进一步地,在步骤2中,阀值指信息的最小匹配度。
进一步地,在步骤3中,推送的信息具体指:在用户在购物网页时,根据信息匹配模型以及阀值,推送的信息为用户感兴趣的商品;在用户浏览新闻网页时,根据信息匹配模型以及阀值,推送的信息为用户感兴趣的新闻;在用户搜索网页时,根据信息匹配模型以及阀值,推送的信息为用户可能会搜索的关键词。
进一步地,在步骤4中,当用户的鼠标指针悬停在推送的信息上超过五秒时,网页在现有页面的基础上,弹出一预览页面,用于显示用户所点击信息的详细介绍,若用户的鼠标指针悬停在推送的信息上小于五秒时,网页不做操作。
本发明的有益效果:本发明的一种基于大数据的页面定制化方法,通过分析用户数据获得用户的需求,提高用户获取所需信息和信息推送的效率,不仅避免了电子商务中用户搜索所需商品所产生的浏览中的大量无关信息,大大提高了电子商务的效率,同时大大改善了用户的使用体验,能有效的引导用户购物,满足用户购物体验,同时,在用户浏览新闻网页时,根据信息匹配模型以及阀值,向用户推送感兴趣的新闻;在用户搜索网页时,根据信息匹配模型以及阀值,向用户推送可能会搜索的关键词,增加了用户体验,同时在用户浏览推送的信息时,根据用户的操作,网页可进行相应的操作,当用户的点击推送的信息时,网页弹会出一个新页面,用于显示用户所点击信息的详细介绍,当用户的鼠标指针悬停在推送的信息上时,网页会在现有页面的基础上,弹出一预览页面,用于显示用户所点击信息的详细介绍。
具体实施方式
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
本发明提供一种技术方案:一种基于大数据的页面定制化方法,包括以下步骤;
步骤1,用户信息采集,利用多个大数据的小型数据库来接收发自客户端的数据,这个客户端数据是指用户在网上浏览信息时,所留下来的操作记录;
步骤2,用户数据分析,通过多个大数据的小型数据库将分析后的数据进行修剪,得到需要记录和储存的数据,通过数据清洗、数据转换、数据整合及数据加载中一种或者多种操作将基础数据转换为预处理后的数据,然后多个大数据的小型数据库将处理后的数据统一发送至一个大型数据库中,在大型数据库中,大型数据库通过云计算平台将处理后的数据提取特征值,并对这些信息进行分类和汇总,构成一信息匹配模型,然后设定一阀值;
步骤3,推送信息,在用户浏览网页时,根据信息匹配模型向用户推送信息;
步骤4,查看信息,在用户浏览推送的信息时,根据用户的操作,网页进行相应的操作,当用户的点击推送的信息时,网页弹出一个新页面,用于显示用户所点击信息的详细介绍,当用户的鼠标指针悬停在推送的信息上时,网页在现有页面的基础上,弹出一预览页面,用于显示用户所点击信息的详细介绍。
在步骤1中,用户的操作记录包括:在用户在购物网页时,用户的购物记录,用户点击商品的记录以及用户在所点击商品中的停留时间;在用户浏览新闻网页时,网页的关键词记录,网页的类型记录以及网页内容记录;在用户搜索网页时,搜索的关键词记录以及搜索的历史记录。
在步骤2中,阀值指信息的最小匹配度。
在步骤3中,推送的信息具体指:在用户在购物网页时,根据信息匹配模型以及阀值,推送的信息为用户感兴趣的商品;在用户浏览新闻网页时,根据信息匹配模型以及阀值,推送的信息为用户感兴趣的新闻;在用户搜索网页时,根据信息匹配模型以及阀值,推送的信息为用户可能会搜索的关键词。
在步骤4中,当用户的鼠标指针悬停在推送的信息上超过五秒时,网页在现有页面的基础上,弹出一预览页面,用于显示用户所点击信息的详细介绍,若用户的鼠标指针悬停在推送的信息上小于五秒时,网页不做操作。
做为本发明的一个实施例:通过分析用户数据获得用户的需求,提高用户获取所需信息和信息推送的效率,不仅避免了电子商务中用户搜索所需商品所产生的浏览中的大量无关信息,大大提高了电子商务的效率,同时大大改善了用户的使用体验,能有效的引导用户购物,满足用户购物体验,同时,在用户浏览新闻网页时,根据信息匹配模型以及阀值,向用户推送感兴趣的新闻;在用户搜索网页时,根据信息匹配模型以及阀值,向用户推送可能会搜索的关键词,增加了用户体验,同时在用户浏览推送的信息时,根据用户的操作,网页可进行相应的操作,当用户的点击推送的信息时,网页弹会出一个新页面,用于显示用户所点击信息的详细介绍,当用户的鼠标指针悬停在推送的信息上时,网页会在现有页面的基础上,弹出一预览页面,用于显示用户所点击信息的详细介绍。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点,对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (5)

1.一种基于大数据的页面定制化方法,其特征在于:包括以下步骤;
步骤1,用户信息采集,利用多个大数据的小型数据库来接收发自客户端的数据,这个客户端数据是指用户在网上浏览信息时,所留下来的操作记录;
步骤2,用户数据分析,通过多个大数据的小型数据库将分析后的数据进行修剪,得到需要记录和储存的数据,通过数据清洗、数据转换、数据整合及数据加载中一种或者多种操作将基础数据转换为预处理后的数据,然后多个大数据的小型数据库将处理后的数据统一发送至一个大型数据库中,在大型数据库中,大型数据库通过云计算平台将处理后的数据提取特征值,并对这些信息进行分类和汇总,构成一信息匹配模型,然后设定一阀值;
步骤3,推送信息,在用户浏览网页时,根据信息匹配模型向用户推送信息;
步骤4,查看信息,在用户浏览推送的信息时,根据用户的操作,网页进行相应的操作,当用户的点击推送的信息时,网页弹出一个新页面,用于显示用户所点击信息的详细介绍,当用户的鼠标指针悬停在推送的信息上时,网页在现有页面的基础上,弹出一预览页面,用于显示用户所点击信息的详细介绍。
2.根据权利要求1所述的一种基于大数据的页面定制化方法,其特征在于:在步骤1中,用户的操作记录包括:
在用户在购物网页时,用户的购物记录,用户点击商品的记录以及用户在所点击商品中的停留时间;
在用户浏览新闻网页时,网页的关键词记录,网页的类型记录以及网页内容记录;
在用户搜索网页时,搜索的关键词记录以及搜索的历史记录。
3.根据权利要求1所述的一种基于大数据的页面定制化方法,其特征在于:在步骤2中,阀值指信息的最小匹配度。
4.根据权利要求1所述的一种基于大数据的页面定制化方法,其特征在于:在步骤3中,推送的信息具体指:
在用户在购物网页时,根据信息匹配模型以及阀值,推送的信息为用户感兴趣的商品;
在用户浏览新闻网页时,根据信息匹配模型以及阀值,推送的信息为用户感兴趣的新闻;
在用户搜索网页时,根据信息匹配模型以及阀值,推送的信息为用户可能会搜索的关键词。
5.根据权利要求1所述的一种基于大数据的页面定制化方法,其特征在于:在步骤4中,当用户的鼠标指针悬停在推送的信息上超过五秒时,网页在现有页面的基础上,弹出一预览页面,用于显示用户所点击信息的详细介绍,若用户的鼠标指针悬停在推送的信息上小于五秒时,网页不做操作。
CN201610804385.6A 2016-09-02 2016-09-02 一种基于大数据的页面定制化方法 Pending CN106446059A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610804385.6A CN106446059A (zh) 2016-09-02 2016-09-02 一种基于大数据的页面定制化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610804385.6A CN106446059A (zh) 2016-09-02 2016-09-02 一种基于大数据的页面定制化方法

Publications (1)

Publication Number Publication Date
CN106446059A true CN106446059A (zh) 2017-02-22

Family

ID=58164357

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610804385.6A Pending CN106446059A (zh) 2016-09-02 2016-09-02 一种基于大数据的页面定制化方法

Country Status (1)

Country Link
CN (1) CN106446059A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679170A (zh) * 2017-09-29 2018-02-09 肖丽媛 一种基于用户行为分析的网站优化方法及系统
CN109308633A (zh) * 2018-08-20 2019-02-05 国政通科技有限公司 精准命中潜在用户的方法
CN113177156A (zh) * 2021-04-22 2021-07-27 上海博色信息科技有限公司 一种手机浏览器网页信息推送系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102298615A (zh) * 2011-07-29 2011-12-28 百度在线网络技术(北京)有限公司 一种计算机实现的用于展示搜索结果的方法与设备
CN102831234A (zh) * 2012-08-31 2012-12-19 北京邮电大学 基于新闻内容和主题特征的个性化新闻推荐装置和方法
CN103914550A (zh) * 2014-04-11 2014-07-09 百度在线网络技术(北京)有限公司 展现推荐内容的方法和装置
CN104008109A (zh) * 2013-02-26 2014-08-27 南京邮电大学 基于用户兴趣的Web信息推送服务系统
CN104615779A (zh) * 2015-02-28 2015-05-13 云南大学 一种Web文本个性化推荐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102298615A (zh) * 2011-07-29 2011-12-28 百度在线网络技术(北京)有限公司 一种计算机实现的用于展示搜索结果的方法与设备
CN102831234A (zh) * 2012-08-31 2012-12-19 北京邮电大学 基于新闻内容和主题特征的个性化新闻推荐装置和方法
CN104008109A (zh) * 2013-02-26 2014-08-27 南京邮电大学 基于用户兴趣的Web信息推送服务系统
CN103914550A (zh) * 2014-04-11 2014-07-09 百度在线网络技术(北京)有限公司 展现推荐内容的方法和装置
CN104615779A (zh) * 2015-02-28 2015-05-13 云南大学 一种Web文本个性化推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谢创丰: "基于兴趣模型的个性化信息推荐系统研究与设计", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679170A (zh) * 2017-09-29 2018-02-09 肖丽媛 一种基于用户行为分析的网站优化方法及系统
CN109308633A (zh) * 2018-08-20 2019-02-05 国政通科技有限公司 精准命中潜在用户的方法
CN113177156A (zh) * 2021-04-22 2021-07-27 上海博色信息科技有限公司 一种手机浏览器网页信息推送系统

Similar Documents

Publication Publication Date Title
CN108830416B (zh) 基于用户行为的广告点击率预测方法
CN103365867B (zh) 一种对用户评价进行情感分析的方法和装置
CN102831184B (zh) 根据对社会事件的文字描述来预测社会情感的方法及系统
US10417301B2 (en) Analytics based on scalable hierarchical categorization of web content
CN102902691B (zh) 推荐方法及系统
US10095782B2 (en) Summarization of short comments
US9798820B1 (en) Classification of keywords
CN106339502A (zh) 一种基于用户行为数据分片聚类的建模推荐方法
TW201423450A (zh) 基於電子資訊的關鍵字提取的資訊推送、搜尋方法及裝置
CN105426528A (zh) 一种商品数据的检索排序方法及系统
CN105868255A (zh) 查询推荐方法及装置
CN111242679A (zh) 一种基于产品评论观点挖掘的销量预测方法
CN107133282B (zh) 一种改进的基于双向传播的评价对象识别方法
CN104111941A (zh) 信息展示的方法及设备
CN104268130B (zh) 一种面向Twitter的社交广告可投放性分析方法
CN105677857B (zh) 一种关键词与营销落地页的精准匹配方法和装置
CN104899229A (zh) 基于群体智能的行为聚类系统
CN103886486A (zh) 一种基于支持向量机svm的电子商务推荐方法
CN103324708A (zh) 一种长文本到短文本的迁移学习方法
CN104391883A (zh) 一种基于迁移学习的在线广告受众排序方法
CN109670909A (zh) 一种基于概率矩阵分解和特征融合的旅游产品推荐方法
CN112749330A (zh) 信息推送方法、装置、计算机设备和存储介质
CN106446059A (zh) 一种基于大数据的页面定制化方法
CN105046274A (zh) 一种电子商务商品类别自动标注方法
Rani et al. Study and comparision of vectorization techniques used in text classification

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170222

WD01 Invention patent application deemed withdrawn after publication