CN111815413A - 一种基于热点事件的大数据商品预测系统及方法 - Google Patents
一种基于热点事件的大数据商品预测系统及方法 Download PDFInfo
- Publication number
- CN111815413A CN111815413A CN202010655956.0A CN202010655956A CN111815413A CN 111815413 A CN111815413 A CN 111815413A CN 202010655956 A CN202010655956 A CN 202010655956A CN 111815413 A CN111815413 A CN 111815413A
- Authority
- CN
- China
- Prior art keywords
- commodity
- commodities
- hot
- articles
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Abstract
本发明公开的一种基于热点事件的大数据商品预测系统及方法,包括以下步骤:S1、获取全网热门排行文章的公开数据;S2、定时查询最新得到的文章,按热门程度从高到低进行排序和分析;S3、利用TF‑IDF对文章进行筛选,提取文章中设定的相关属性词;S4、将相关属性词与商品库进行匹配,搜索到相关商品;S5、分析相关商品属性,对相关商品进行分析,按分析结果对相关商品进行排序和推荐,本发明能够节约人力筛选时间,通过分析得到的预测推荐商品并快速调整运营方向;提取文章热点精准度高,提取的关键词准确,通过关键词筛选出商品相关度高,预测到的热门商品能够更精准的知道市场运营。
Description
技术领域
本发明属于大数据分析应用技术领域,具体涉及一种基于热点事件的大数据商品预测系统及方法。
背景技术
近年来互联网技术不断发展,各种网络事件已经逐渐成为民众了解社会的一种途径,并且民众对事件中出现的人或物都有着很高的兴趣,从这一点出发联系到电商,通过分析网络热门事件得到民众感兴趣的商品,从而进一步指导电商平台运营。
而现有的技术提取的关键词不准确,提取效率低,得到的结果不准确,在多平台数据量极大的情况下,不能快速响应精准的预测热门商品。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供一种基于热点事件的大数据商品预测系统及方法,能够实现快速准确的提取热点事件中的关键词,并精准的预测热门商品。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种基于热点事件的大数据商品预测方法,包括以下步骤:
S1、获取全网热门排行文章的公开数据;
S2、定时查询最新得到的文章,按热门程度从高到低进行排序和分析;
S3、利用TF-IDF对文章进行筛选,提取文章中设定的相关属性词;
S4、将相关属性词与商品库进行匹配,搜索到相关商品;
S5、分析相关商品属性,对相关商品进行分析,按分析结果对相关商品进行排序和推荐。
进一步的,所述步骤S1中,全网包括新闻客户端、论坛、博客、微博以及贴吧,公开数据包括文章内容、点赞数、评论数、收藏数以及分享数。
进一步的,所述步骤S2中,按照热度排名、点赞数、评论数、收藏数以及分享数从高至低排序,优先对排序在前的文章进行分析。
进一步的,所述步骤S3中,利用结巴分词对文章中的信息进行基于TF-IDF筛选,抽取文章中的人或物相关属性词。
进一步的,所述步骤S4中,商品库中与相关属性词相匹配的商品属性包括标题、链接、价格、排名、评论、评分、销量、上架时间、配送方式、类目名称、重量、体积、卖家数量、产品标签。
进一步的,所述步骤S5中,按照排名高低、评论高低、评分高低、销量高低、上架时间对商品进行排序推荐,并分析相关商品的关联性数据可视化。
一种基于热点事件的大数据商品预测系统,包括:
数据搜集模块,用于定时获取全网热点文章的公开数据,并按照热度排名、点赞数、评论数、收藏数以及分享数从高至低排序:
数据筛选模块,利用机器学习提取文章中设定的相关属性词;
数据匹配模块,将相关属性词语商品库进行匹配,并按排名高低、评论高低、评分高低、销量高低、上架时间对商品进行排序推荐;
数据可视化模块,对相关商品的关联性数据可视化进行分析。
(三)有益效果
本发明提供了一种基于热点事件的大数据商品预测系统及方法。具备以下益效果:本发明能够节约人力筛选时间,通过分析得到的预测推荐商品并快速调整运营方向;
本发明提取文章热点精准度高,提取的关键词准确,通过关键词筛选出商品相关度高,预测到的热门商品能够更精准的知道市场运营。
附图说明
图1为本发明提供的一种基于热点事件的大数据商品预测方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例一提供的一种基于热点事件的大数据商品预测方法的流程示意图,如图1所示,一种基于热点事件的大数据商品预测方法,包括以下步骤:
S1、获取全网热门排行文章的公开数据,全网包括新闻客户端、论坛、博客、微博以及贴吧,公开数据包括文章内容、点赞数、评论数、收藏数以及分享数;
S2、定时查询最新得到的文章,按照热度排名、点赞数、评论数、收藏数以及分享数从高至低排序,优先对排序在前的文章进行分析;
S3、利用结巴分词对文章中的信息基于TF-IDF(机械学习)进行筛选,提取文章中设定的人或物相关属性词,利用结巴分词对每一篇文章信息做关键词抽取(基于TF-IDF),如此能在生成大文档时剔除掉部分常见词;
TF-IDF:即词频-逆向文件频率,是常用的对文档或句子中的词语进行打分的方法,可更具需求和实际数据的不同调整词频或词稀有度所占权重。
S4、将相关属性词与商品库进行匹配,搜索到相关商品,商品库中与相关属性词相匹配的商品属性包括标题、链接、价格、排名、评论、评分、销量、上架时间、配送方式、类目名称、重量、体积、卖家数量、产品标签,选用人相关属性词可匹配商品库搜索该“人”代言的商品,选用物相关属性词则直接匹配商品库搜索该“物”所表示的商品;
S5、分析相关商品属性,对相关商品进行分析,按分析结果对相关商品进行排序和推荐,按照排名高低、评论高低、评分高低、销量高低、上架时间对商品进行排序推荐,并分析相关商品的关联性数据可视化。
一种基于热点事件的大数据商品预测系统,包括:
数据搜集模块,用于定时获取全网热点文章的公开数据,并按照热度排名、点赞数、评论数、收藏数以及分享数从高至低排序:
数据筛选模块,利用机器学习提取文章中设定的相关属性词,相关属性词可由词典、以及有影响力的人名构成;
数据匹配模块,将相关属性词语商品库进行匹配,并按排名高低、评论高低、评分高低、销量高低、上架时间对商品进行排序推荐;
数据可视化模块,对相关商品的关联性数据可视化进行分析。
本发明通过采集热点事件与机器学习相结合分析从而得到商品相关属性词(关键词),通过关键词匹配商品库搜索商品对热门商品进行预测。
本发明可根据热点文章中得到的关键词数据,给出未来热门商品预测建议,首先对热门事件设置采集周期,根据一个周期内得到的数据进行分析,然后利用机器学习提取筛选文章中关键词组,最后根据关键词组筛选出相关的商品数据,分析商品数据的属性得到最终的推荐商品数据,为电商卖家提供了指导意见。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (7)
1.一种基于热点事件的大数据商品预测方法,其特征在于,包括以下步骤:
S1、获取全网热门排行文章的公开数据;
S2、定时查询最新得到的文章,按热门程度从高到低进行排序和分析;
S3、利用TF-IDF对文章进行筛选,提取文章中设定的相关属性词;
S4、将相关属性词与商品库进行匹配,搜索到相关商品;
S5、分析相关商品属性,对相关商品进行分析,按分析结果对相关商品进行排序和推荐。
2.一种根据权利要求1所述的基于热点事件的大数据商品预测方法,其特征在于,所述步骤S1中,全网包括新闻客户端、论坛、博客、微博以及贴吧,公开数据包括文章内容、点赞数、评论数、收藏数以及分享数。
3.根据权利要求1所述的一种基于热点事件的大数据商品预测方法,其特征在于,所述步骤S2中,按照热度排名、点赞数、评论数、收藏数以及分享数从高至低排序,优先对排序在前的文章进行分析。
4.根据权利要求1所述的一种基于热点事件的大数据商品预测方法,其特征在于,所述步骤S3中,利用结巴分词对文章中的信息进行基于TF-IDF筛选,抽取文章中的人或物相关属性词。
5.根据权利要求1所述的一种基于热点事件的大数据商品预测方法,其特征在于,所述步骤S4中,商品库中与相关属性词相匹配的商品属性包括标题、链接、价格、排名、评论、评分、销量、上架时间、配送方式、类目名称、重量、体积、卖家数量、产品标签。
6.根据权利要求1所述的一种基于热点事件的大数据商品预测方法,其特征在于,所述步骤S5中,按照排名高低、评论高低、评分高低、销量高低、上架时间对商品进行排序推荐,并分析相关商品的关联性数据可视化。
7.一种基于热点事件的大数据商品预测系统,包括:
数据搜集模块,用于定时获取全网热点文章的公开数据,并按照热度排名、点赞数、评论数、收藏数以及分享数从高至低排序:
数据筛选模块,利用机器学习提取文章中设定的相关属性词;
数据匹配模块,将相关属性词语商品库进行匹配,并按排名高低、评论高低、评分高低、销量高低、上架时间对商品进行排序推荐;
数据可视化模块,对相关商品的关联性数据可视化进行分析。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010655956.0A CN111815413A (zh) | 2020-07-09 | 2020-07-09 | 一种基于热点事件的大数据商品预测系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010655956.0A CN111815413A (zh) | 2020-07-09 | 2020-07-09 | 一种基于热点事件的大数据商品预测系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111815413A true CN111815413A (zh) | 2020-10-23 |
Family
ID=72843234
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010655956.0A Pending CN111815413A (zh) | 2020-07-09 | 2020-07-09 | 一种基于热点事件的大数据商品预测系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111815413A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112801743A (zh) * | 2020-12-23 | 2021-05-14 | 珠海必要工业科技股份有限公司 | 一种商品推荐方法、装置、电子设备及存储介质 |
CN112819533A (zh) * | 2021-01-29 | 2021-05-18 | 深圳脉腾科技有限公司 | 信息推送方法、装置、电子设备及存储介质 |
CN113836442A (zh) * | 2021-09-26 | 2021-12-24 | 广州华多网络科技有限公司 | 趋势商品查询方法及其装置、设备、介质、产品 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440286A (zh) * | 2013-08-14 | 2013-12-11 | 北京百度网讯科技有限公司 | 一种基于搜索结果来提供推荐信息的方法及装置 |
CN105117466A (zh) * | 2015-08-27 | 2015-12-02 | 中国电信股份有限公司湖北号百信息服务分公司 | 一种互联网信息筛选系统及方法 |
CN106021562A (zh) * | 2016-05-31 | 2016-10-12 | 北京京拍档科技有限公司 | 用于电商平台的基于主题相关的推荐方法 |
CN106294425A (zh) * | 2015-05-26 | 2017-01-04 | 富泰华工业(深圳)有限公司 | 商品相关网络文章之自动图文摘要方法及系统 |
CN106776841A (zh) * | 2016-11-28 | 2017-05-31 | 福建亿榕信息技术有限公司 | 一种互联网舆情事件传播指数的获取方法和系统 |
CN108346075A (zh) * | 2017-01-24 | 2018-07-31 | 北京京东尚科信息技术有限公司 | 信息推荐方法和装置 |
US20190197122A1 (en) * | 2017-12-27 | 2019-06-27 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and device for generating review article of hot news, and terminal device |
CN110825958A (zh) * | 2019-09-24 | 2020-02-21 | 广州数知科技有限公司 | 一种基于网络热度的热点事件智能排序算法 |
CN111047412A (zh) * | 2019-12-16 | 2020-04-21 | 武汉智领云科技有限公司 | 一种大数据电商运营平台 |
CN111061957A (zh) * | 2019-12-26 | 2020-04-24 | 广东电网有限责任公司 | 一种文章相似度推荐方法和装置 |
-
2020
- 2020-07-09 CN CN202010655956.0A patent/CN111815413A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440286A (zh) * | 2013-08-14 | 2013-12-11 | 北京百度网讯科技有限公司 | 一种基于搜索结果来提供推荐信息的方法及装置 |
CN106294425A (zh) * | 2015-05-26 | 2017-01-04 | 富泰华工业(深圳)有限公司 | 商品相关网络文章之自动图文摘要方法及系统 |
CN105117466A (zh) * | 2015-08-27 | 2015-12-02 | 中国电信股份有限公司湖北号百信息服务分公司 | 一种互联网信息筛选系统及方法 |
CN106021562A (zh) * | 2016-05-31 | 2016-10-12 | 北京京拍档科技有限公司 | 用于电商平台的基于主题相关的推荐方法 |
CN106776841A (zh) * | 2016-11-28 | 2017-05-31 | 福建亿榕信息技术有限公司 | 一种互联网舆情事件传播指数的获取方法和系统 |
CN108346075A (zh) * | 2017-01-24 | 2018-07-31 | 北京京东尚科信息技术有限公司 | 信息推荐方法和装置 |
US20190197122A1 (en) * | 2017-12-27 | 2019-06-27 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and device for generating review article of hot news, and terminal device |
CN110825958A (zh) * | 2019-09-24 | 2020-02-21 | 广州数知科技有限公司 | 一种基于网络热度的热点事件智能排序算法 |
CN111047412A (zh) * | 2019-12-16 | 2020-04-21 | 武汉智领云科技有限公司 | 一种大数据电商运营平台 |
CN111061957A (zh) * | 2019-12-26 | 2020-04-24 | 广东电网有限责任公司 | 一种文章相似度推荐方法和装置 |
Non-Patent Citations (2)
Title |
---|
孙怡然;徐李立;贾鑫;: "大数据下基于数据挖掘的商品热门程度预测研究", 科学中国人, no. 08, pages 169 * |
郭莹光;陈启买;: "关注时事新闻的商品推荐模型", 计算机应用与软件, no. 10 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112801743A (zh) * | 2020-12-23 | 2021-05-14 | 珠海必要工业科技股份有限公司 | 一种商品推荐方法、装置、电子设备及存储介质 |
CN112801743B (zh) * | 2020-12-23 | 2022-05-31 | 珠海必要工业科技股份有限公司 | 一种商品推荐方法、装置、电子设备及存储介质 |
CN112819533A (zh) * | 2021-01-29 | 2021-05-18 | 深圳脉腾科技有限公司 | 信息推送方法、装置、电子设备及存储介质 |
CN113836442A (zh) * | 2021-09-26 | 2021-12-24 | 广州华多网络科技有限公司 | 趋势商品查询方法及其装置、设备、介质、产品 |
CN113836442B (zh) * | 2021-09-26 | 2024-04-05 | 广州华多网络科技有限公司 | 趋势商品查询方法及其装置、设备、介质、产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Sentiment-aspect extraction based on restricted boltzmann machines | |
CN103870973B (zh) | 基于电子信息的关键词提取的信息推送、搜索方法及装置 | |
CN110059271B (zh) | 运用标签知识网络的搜索方法及装置 | |
CN111815413A (zh) | 一种基于热点事件的大数据商品预测系统及方法 | |
US8214363B2 (en) | Recognizing domain specific entities in search queries | |
CN104199833B (zh) | 一种网络搜索词的聚类方法和聚类装置 | |
CN106339502A (zh) | 一种基于用户行为数据分片聚类的建模推荐方法 | |
KR20190108838A (ko) | 미술 작품 추천 큐레이션 방법 및 시스템 | |
CN103186550A (zh) | 一种视频的相关视频列表的生成方法及系统 | |
CN102411754A (zh) | 一种基于商品属性熵值的个性化推荐方法 | |
JP2011154668A (ja) | ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法 | |
CN101350027B (zh) | 内容检索设备和内容检索方法 | |
CN112991017A (zh) | 基于用户评论解析的标签体系精准推荐方法 | |
CN105468649B (zh) | 一种待展示对象匹配的判断方法及其装置 | |
CN111191112A (zh) | 一种电子读物数据处理方法、装置及存储介质 | |
CN112597398B (zh) | 药品推荐模型应用方法及系统 | |
CN114611010A (zh) | 一种商品搜索推荐方法及系统 | |
Rani et al. | Study and comparision of vectorization techniques used in text classification | |
CN108009726B (zh) | 一种结合用户评论的事物评价系统 | |
CN116561291A (zh) | 基于自然语言智能转化模型的智能推荐方法和系统 | |
CN111159400A (zh) | 一种产品评论情感分类方法和系统 | |
CN116431895A (zh) | 安全生产知识个性化推荐方法及系统 | |
CN107679121B (zh) | 分类体系的映射方法及装置、存储介质、计算设备 | |
Hoiriyah et al. | Lexicon-Based and Naive Bayes Sentiment Analysis for Recommending the Best Marketplace Selection as a Marketing Strategy for MSMEs | |
CN114155057A (zh) | 一种用于电子商务平台的商品推荐系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |