CN104036002A - 一种智能推荐数据的技术方法 - Google Patents

一种智能推荐数据的技术方法 Download PDF

Info

Publication number
CN104036002A
CN104036002A CN201410266630.3A CN201410266630A CN104036002A CN 104036002 A CN104036002 A CN 104036002A CN 201410266630 A CN201410266630 A CN 201410266630A CN 104036002 A CN104036002 A CN 104036002A
Authority
CN
China
Prior art keywords
user
information
users
algorithm
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410266630.3A
Other languages
English (en)
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ying Weinuo Science And Technology Ltd Of Shenzhen
Original Assignee
Ying Weinuo Science And Technology Ltd Of Shenzhen
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ying Weinuo Science And Technology Ltd Of Shenzhen filed Critical Ying Weinuo Science And Technology Ltd Of Shenzhen
Priority to CN201410266630.3A priority Critical patent/CN104036002A/zh
Publication of CN104036002A publication Critical patent/CN104036002A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明主要提供了一种终端用户能够快速获取信息的一种解决方法,以解决现有技术中用户在运用互联网的过程中需要从众多的信息中去搜索、寻找自己喜欢的或需要的资讯所带来的不便。此项技术解决方法可以改变用户被动获取信息和花时间搜索信息的模式,让互联网真正改变我们人类的生活习惯。首先要使用爬虫获得大量的信息,然后使用提取关键字算法和主题算法,建立海量的信息源,其次需要构建用户数据模型,并根据数据模型采集用户的浏览信息,点击信息,智能设备的基本情况和使用行为,以及位置变化的轨迹等行为数据,然后使用模型算法不停的完善用户的特征画像。再次当一个用户在使用智能设备时,服务器会根据该用户的特征画像,判断该用户在该时刻需要什么信息,并给用户推荐什么信息。

Description

一种智能推荐数据的技术方法
技术领域:
本发明涉及移动终端智能推送的技术方法,特别地涉及一种移动互联网大数据量下根据用户喜好和需求推送数据的技术实现方法。
背景技术:
随着互联网的发展,特别是智能手机的普及和移动互联网到来,使越来越多的人能够随时随地的接触到互联网,从多人共用一台手机,到人手一台智能手机,使连接互联网的终端,越来越能体现一个人的特征,但是人类获取信息的方式却没有太多变化,还是遵循在输入框中输入关键字,然后点击查询,然后从大量的查询结果中找到自己想要的信息。在信息爆炸的今天这是一件很繁琐和费时的事情。而目前市场上根据用户喜好和需求推送信息(以下简称智能推荐)还未有先例。
智能推荐是根据用户的喜好和需求给用户推送信息,不是简单的根据某一类别推送,也不是简单的相关类别的推荐,而是根据人的喜好和需求,如喜欢美食、爱打篮球、关注时政、爱玩游戏、经常出差、出去旅游等等。智能推荐将达到一种效果:当用户想去吃饭的时候,就会得到他附近的符合他饮食习惯的餐厅;当用户出差时,可实时提供当地的酒店、餐饮等相关信息给客户;同时还能够根据用户喜好变化而变化,如:用户浏览汽车方面的信息时,用户可以看到更多汽车方面的信息,当用户的想看体育方面的信息时,随着用户点击的增多,体育方面的信息就会增多,而汽车方面的信息就会相应减少,除此之外我们还会有场景识别等,通过场景识别来为客户推送相应的信息。
目前实现智能推荐的方法是:根据用户在智能终端使用习惯和浏览并点击信息的习惯,再通过长期属性算法和实时熟悉算法,算出用户的长期属性和短期属性,并根据这些属性给每个用户绘制特征画像,根据特征画像给用户推送数据,并且能够根据用户的实时属性实时的递增或衰减相应的信息数据。
发明内容:
本发明的主要目的是提供一种用户能够快速获取信息的解决方法,以解决现有技术中用户在运用互联网的过程中需要从众多的信息中去搜索、寻找自己喜欢的或需要的资讯所带来的不便。此项技术解决方法可以改变用户被动获取信息和花时间搜索信息的模式,让互联网正在改变我们人类的生活习惯。
为解决上述问题本发明提供如下技术方案:
1、要使用爬虫获得大量的信息,然后使用提取关键字算法和主题算法,建立海量的信息源。
2、构建用户数据模型,并根据数据模型采集用户的浏览信息,点击信息,智能设备的基本情况和使用行为,以及位置变化的轨迹等行为数据,然后使用模型算法不停的完善用户的特征画像。
3、当一个用户在使用智能设备时,服务器会根据该用户的特征画像,判断该用户在该时刻需要什么信息,并给用户什么信息。
具体实施方式:
、首先要搭建爬虫系统,该系统要实时抓取大量的各种丰富的类型的数据,以保证服务器有足够丰富的数据,这样服务器才能满足更多的用户群体,还要抓取数据的原始热度,以保证数据的起初热度。
二、 要搭建数据处理系统,关键字提取算法很重要,要能通过自主学习不停的丰富自己的关键字库,类型的划分很重要,不能完全根据互联网的分类来分类,必须要有人工干预,因为互联网的分类杂乱无章,往往词不同意同,同时分的类别层级高低不一,如有的网站是"体育--篮球” 有的网站是”体育--NBA“。在类型划分很重要,对实时算法会有影响,因此类型的划分要足够的细致与合理,如:“可以是体育--篮球--NBA--乔丹”。主题算法,要对信息进行主题的提取,这更能得到用户喜欢什么类型的主题。数据的处理结束后的灌库很重要,海量数据的存储,查找,更新是处理大数据量的能力,很好的处理掉这些数据,是能否快速响应用户的信息需求的根本,本系统使用了google的一个分布式多层级的海量数据存储的框架技术leveldb。这个框架能高效的完成海量数据的存储,查找,计算的工作。
三、构建用户模型和采集机制,一个真实的用户,包含着用户的基本属性,如性别、年龄的区分等,用户的数据模型,其中还包含用户的唯一标识符,就像我们的身份证号码一样,具有唯一性。根据真实用户的特性,用户数据模型按变化性分为长期属性和实时属性,长期属性如:性别、居住地、工作地、爱好、主题、关键字。短期属性如:pv、点击、多级类别、关键字。长期属性每隔一段时间(可配置)绘制用户特征画像,用于当用户没有实时属性可根据长期属性给用户推荐信息。短期属性会随着用户在智能终端的操作实时发生变化,并根据变化实时给用户推送信息
四、当用户使用智能终端时,会将该用户的唯一标识发送到推荐服务器,推荐服务器会根据用户的标识,得到该用户的特征画像,然后依次根据关键字、主题、多级类别、pv、点击、分享、收藏、评论以及场景变化得到该用户的推荐信息列表,并根据特征总权重分数排序,根据智能终端请求信息的条数给用户推荐信息。

Claims (4)

1. 一种智能推荐信息的一种方法,应用于在使用互联网软件时分析用户喜好和需求并进行智能推荐信息的一种方法,其特征在于:
要使用爬虫获得大量的信息,然后使用提取关键字算法和主题算法,建立海量的信息源,构建用户数据模型,并根据数据模型采集用户的浏览信息,点击信息,智能设备的基本情况和使用行为,以及位置变化的轨迹等行为数据,然后使用模型算法不停的完善用户的特征画像,当一个用户在使用智能设备时,服务器会根据该用户的特征画像,判断该用户在该时刻需要什么信息,并给用户什么信息。
2.根据权利要求1所述的方法,其特征在于,还包括:
搭建数据处理系统,抓取用户数据,根据用户的兴趣点,推荐服务器做更细分的多层级计算,如:体育--篮球—NBA-乔丹等,并推荐信息给用户。
3. 根据权利要求1所述的方法,其特征在于,还包括:
构建用户模型和采集机制,根据用户的属性特征,唯一性,喜好,活动轨迹等结合场景算法,形成一个特定的场景,引导用户,为用户提供智能服务。
4.根据权利要求3所述的方法,其特征在于,还包括:
根据关键字、主题、多级类别、pv、点击、分享、收藏、评论以及场景变化得到该用户的推荐信息列表,并根据特征总权重分数排序,根据智能终端请求信息的条数给用户推荐信息。
CN201410266630.3A 2014-06-16 2014-06-16 一种智能推荐数据的技术方法 Pending CN104036002A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410266630.3A CN104036002A (zh) 2014-06-16 2014-06-16 一种智能推荐数据的技术方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410266630.3A CN104036002A (zh) 2014-06-16 2014-06-16 一种智能推荐数据的技术方法

Publications (1)

Publication Number Publication Date
CN104036002A true CN104036002A (zh) 2014-09-10

Family

ID=51466772

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410266630.3A Pending CN104036002A (zh) 2014-06-16 2014-06-16 一种智能推荐数据的技术方法

Country Status (1)

Country Link
CN (1) CN104036002A (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104382327A (zh) * 2014-12-03 2015-03-04 曹乃承 美甲装置和美甲、健康管理、信息推送方法
CN104462407A (zh) * 2014-12-12 2015-03-25 南京大学 基于地图轨迹的场景感知模型的前端数据动态集成方法
CN106649509A (zh) * 2016-10-12 2017-05-10 腾讯科技(北京)有限公司 用户特征提取方法及装置
CN106777067A (zh) * 2016-11-16 2017-05-31 中国科学院上海高等研究院 信息推荐方法及系统
CN107133323A (zh) * 2017-05-04 2017-09-05 山东浪潮云服务信息科技有限公司 数据模型构建方法、政务服务业务的实现方法及装置
CN107222570A (zh) * 2017-07-10 2017-09-29 江西博瑞彤芸科技有限公司 一种基于用户使用状况的健康资讯推送方法
CN107562940A (zh) * 2017-09-22 2018-01-09 四川省艾普网络股份有限公司 大数据信息获取方法及系统
CN107645535A (zh) * 2016-07-21 2018-01-30 丰田自动车株式会社 信息提供装置
CN107895015A (zh) * 2017-11-14 2018-04-10 江苏电力信息技术有限公司 基于层次分析法的电力用户特征标签权重体系构建方法
CN108463817A (zh) * 2015-10-22 2018-08-28 谷歌有限责任公司 个性化实体库
CN108876517A (zh) * 2018-05-31 2018-11-23 周国俊 基于人工智能的用户喜好分析方法及系统
WO2018223772A1 (zh) * 2017-06-09 2018-12-13 华为技术有限公司 内容推荐方法和系统
CN109615416A (zh) * 2018-11-07 2019-04-12 爱保科技(横琴)有限公司 基于用户购买行为的商业服务推荐方法及系统
CN109753521A (zh) * 2018-12-12 2019-05-14 北京世纪互联宽带数据中心有限公司 用户模型建立方法及其装置、电子设备、计算机可读介质
WO2019134348A1 (en) * 2018-01-02 2019-07-11 Guangdong Grandeur International Exhibition Group Co., Ltd. Artificial intelligence based display systems and methods
CN110957020A (zh) * 2018-09-27 2020-04-03 上海博泰悦臻网络技术服务有限公司 健康管理方法及其系统
CN111950574A (zh) * 2019-05-15 2020-11-17 北京荣森利泰科贸有限公司 一种基于可穿戴设备的礼仪培训信息推送方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1295294A (zh) * 1999-09-22 2001-05-16 Lg电子株式会社 有多层结构的用户优选信息结构及用其提供多媒体信息的方法
JP2001357045A (ja) * 2000-06-13 2001-12-26 Nippon Telegr & Teleph Corp <Ntt> 画像管理装置,画像管理方法および画像管理プログラムの記録媒体
US6839724B2 (en) * 2003-04-17 2005-01-04 Oracle International Corporation Metamodel-based metadata change management
CN101256589A (zh) * 2008-03-31 2008-09-03 腾讯科技(深圳)有限公司 一种服务信息的推送方法及推送系统
CN103428076A (zh) * 2013-08-22 2013-12-04 北京奇虎科技有限公司 向多类型终端或应用发送信息的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1295294A (zh) * 1999-09-22 2001-05-16 Lg电子株式会社 有多层结构的用户优选信息结构及用其提供多媒体信息的方法
JP2001357045A (ja) * 2000-06-13 2001-12-26 Nippon Telegr & Teleph Corp <Ntt> 画像管理装置,画像管理方法および画像管理プログラムの記録媒体
US6839724B2 (en) * 2003-04-17 2005-01-04 Oracle International Corporation Metamodel-based metadata change management
CN101256589A (zh) * 2008-03-31 2008-09-03 腾讯科技(深圳)有限公司 一种服务信息的推送方法及推送系统
CN103428076A (zh) * 2013-08-22 2013-12-04 北京奇虎科技有限公司 向多类型终端或应用发送信息的方法和装置

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104382327A (zh) * 2014-12-03 2015-03-04 曹乃承 美甲装置和美甲、健康管理、信息推送方法
CN104462407A (zh) * 2014-12-12 2015-03-25 南京大学 基于地图轨迹的场景感知模型的前端数据动态集成方法
CN104462407B (zh) * 2014-12-12 2017-10-13 南京大学 基于地图轨迹的场景感知模型的前端数据动态集成方法
US11716600B2 (en) 2015-10-22 2023-08-01 Google Llc Personalized entity repository
CN108463817B (zh) * 2015-10-22 2022-04-08 谷歌有限责任公司 个性化实体库
US11089457B2 (en) 2015-10-22 2021-08-10 Google Llc Personalized entity repository
CN108463817A (zh) * 2015-10-22 2018-08-28 谷歌有限责任公司 个性化实体库
CN107645535A (zh) * 2016-07-21 2018-01-30 丰田自动车株式会社 信息提供装置
CN106649509A (zh) * 2016-10-12 2017-05-10 腾讯科技(北京)有限公司 用户特征提取方法及装置
CN106649509B (zh) * 2016-10-12 2020-04-07 腾讯科技(北京)有限公司 用户特征提取方法及装置
CN106777067A (zh) * 2016-11-16 2017-05-31 中国科学院上海高等研究院 信息推荐方法及系统
CN107133323A (zh) * 2017-05-04 2017-09-05 山东浪潮云服务信息科技有限公司 数据模型构建方法、政务服务业务的实现方法及装置
WO2018223772A1 (zh) * 2017-06-09 2018-12-13 华为技术有限公司 内容推荐方法和系统
CN107222570B (zh) * 2017-07-10 2022-04-26 北京博瑞彤芸科技股份有限公司 一种基于用户使用状况的健康资讯推送方法
CN107222570A (zh) * 2017-07-10 2017-09-29 江西博瑞彤芸科技有限公司 一种基于用户使用状况的健康资讯推送方法
CN107562940A (zh) * 2017-09-22 2018-01-09 四川省艾普网络股份有限公司 大数据信息获取方法及系统
CN107895015A (zh) * 2017-11-14 2018-04-10 江苏电力信息技术有限公司 基于层次分析法的电力用户特征标签权重体系构建方法
WO2019134348A1 (en) * 2018-01-02 2019-07-11 Guangdong Grandeur International Exhibition Group Co., Ltd. Artificial intelligence based display systems and methods
CN108876517A (zh) * 2018-05-31 2018-11-23 周国俊 基于人工智能的用户喜好分析方法及系统
CN108876517B (zh) * 2018-05-31 2022-06-17 周国俊 基于人工智能的用户喜好分析方法及系统
CN110957020A (zh) * 2018-09-27 2020-04-03 上海博泰悦臻网络技术服务有限公司 健康管理方法及其系统
CN109615416A (zh) * 2018-11-07 2019-04-12 爱保科技(横琴)有限公司 基于用户购买行为的商业服务推荐方法及系统
CN109753521A (zh) * 2018-12-12 2019-05-14 北京世纪互联宽带数据中心有限公司 用户模型建立方法及其装置、电子设备、计算机可读介质
CN111950574A (zh) * 2019-05-15 2020-11-17 北京荣森利泰科贸有限公司 一种基于可穿戴设备的礼仪培训信息推送方法及装置

Similar Documents

Publication Publication Date Title
CN104036002A (zh) 一种智能推荐数据的技术方法
CN104809154B (zh) 用于资讯推荐的方法及装置
US10410125B1 (en) Artificial intelligence based identification of negative user sentiment in event data
US9600499B2 (en) System for collecting interest graph by relevance search incorporating image recognition system
US10180979B2 (en) System and method for generating suggestions by a search engine in response to search queries
WO2017181612A1 (zh) 个性化视频推荐方法及装置
WO2019056661A1 (zh) 一种搜索词推送方法、装置及终端
US11042590B2 (en) Methods, systems and techniques for personalized search query suggestions
CN103617230B (zh) 一种基于微博的广告推荐方法及系统
US11675824B2 (en) Method and system for entity extraction and disambiguation
WO2017040224A1 (en) Recommending a content curator
CN103455487B (zh) 一种搜索词的提取方法及装置
CN104021150A (zh) 带有社交网络辅助的面部识别
CN105718184A (zh) 一种数据处理方法和装置
WO2021160119A1 (zh) 一种信息展示方法及装置
CN104866554B (zh) 一种基于社会化标注的个性化搜索方法及系统
KR20160057475A (ko) 소셜 데이터를 능동적으로 획득하기 위한 시스템 및 방법
CN106294500B (zh) 内容项目的推送方法、装置及系统
CN103778260A (zh) 一种个性化微博信息推荐系统和方法
CN107918622A (zh) 内容推荐、展示方法、客户端、服务器和系统
CN108959323B (zh) 视频分类方法和装置
US20170098012A1 (en) Methods, systems and techniques for ranking personalized and generic search query suggestions
US11836169B2 (en) Methods, systems and techniques for providing search query suggestions based on non-personal data and user personal data according to availability of user personal data
CN111400609B (zh) 用户推荐方法、装置、存储介质及服务器
CN111259257A (zh) 一种信息展示方法、系统、装置、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 518000 Guangdong city of Shenzhen province Nanshan District South Road four No. 18 SKYWORTH semiconductor design building no.5003 6 floor unit 605-610

Applicant after: Ying Weinuo Science and Technology Ltd. of Shenzhen

Address before: 518000 Guangdong city of Shenzhen province Nanshan District South Road four building 6 floor 605-610 SKYWORTH semiconductor

Applicant before: Ying Weinuo Science and Technology Ltd. of Shenzhen

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20140910

RJ01 Rejection of invention patent application after publication