CN106909635B - 基于多媒体数字影像评论的数据挖掘与处理方法及系统 - Google Patents
基于多媒体数字影像评论的数据挖掘与处理方法及系统 Download PDFInfo
- Publication number
- CN106909635B CN106909635B CN201710071573.7A CN201710071573A CN106909635B CN 106909635 B CN106909635 B CN 106909635B CN 201710071573 A CN201710071573 A CN 201710071573A CN 106909635 B CN106909635 B CN 106909635B
- Authority
- CN
- China
- Prior art keywords
- data
- mining
- user page
- user
- page data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007418 data mining Methods 0.000 title claims abstract description 31
- 238000003672 processing method Methods 0.000 title claims abstract description 15
- 238000011156 evaluation Methods 0.000 claims abstract description 67
- 238000005065 mining Methods 0.000 claims abstract description 48
- 238000013507 mapping Methods 0.000 claims abstract description 15
- 238000005516 engineering process Methods 0.000 claims abstract description 14
- 230000004931 aggregating effect Effects 0.000 claims abstract description 9
- 238000000034 method Methods 0.000 claims description 16
- 238000004458 analytical method Methods 0.000 claims description 12
- 238000001514 detection method Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 7
- 230000002776 aggregation Effects 0.000 claims description 4
- 238000004220 aggregation Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 5
- 230000002349 favourable effect Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 241000233805 Phoenix Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Human Resources & Organizations (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于多媒体数字影像评论的数据挖掘与处理方法,包括:利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘;建立影评数据与用户页面数据之间的映射关系;对用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集。本发明使用户找到对于自己有价值的信息更加方便快捷。
Description
技术领域
本发明涉及数据挖掘技术领域,特别涉及一种基于多媒体数字影像评论的数据挖掘与处理方法及系统。
背景技术
随着多媒体技术的发展,人们接触的数据形式不断地丰富,多媒体数据库的日益增多,原有的数据库技术已经满足不了应用的需求,人们希望从这些媒体数据中得到一些高层的概念和模式,找出蕴含于其中的有价值的知识。这种将数字挖掘技术与多媒体信息处理技术有机结合起来形成的在多媒体数据中进行知识发现的信息处理方法就是多媒体数据挖掘。但是从现有的多媒体技术中找出有价值的知识既费时又繁琐。鉴于以上现有技术存在的问题,本发明希望找到一种基于多媒体数字影像评论的数据挖掘与处理方法及系统。
发明内容
发明目的:对上述情况,为了克服背景技术中的缺点,本发明实施例提供了一种基于多媒体数字影像评论的数据挖掘与处理方法及系统,能够有效解决上述背景技术中涉及的问题。
技术方案:一种基于多媒体数字影像评论的数据挖掘与处理方法,所述方法包括:
利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;
建立所述影评数据与所述用户页面数据之间的映射关系;
对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集,并获取分类聚合后的与各用户页面数据集相互映射的影评数据集;
侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集,并将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。
作为本发明的一种优选方式,兴趣属性分析并依次得出兴趣属性点,包括:
按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点。
作为本发明的一种优选方式,兴趣属性分析并依次得出兴趣属性点,包括:
按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。
作为本发明的一种优选方式,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:
从社交网络上挖掘与影片相关的非影评数据,分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。
作为本发明的一种优选方式,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:
从影片购票网站上获取基于影片的检索和/或购票操作事件,获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。
一种基于多媒体数字影像评论的数据挖掘与处理系统,所述系统包括:
第一数据挖掘模块,用于利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;
映射建立模块,用于建立所述影评数据与所述用户页面数据之间的映射关系;
兴趣属性分析模块,用于对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点;
分类聚合模块,用于将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;
数据集获取模块,用于获取分类聚合后的与各用户页面数据集相互映射的影评数据集;
事件侦测模块,用于侦测待观影操作事件;
第二数据挖掘模块,用于挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点;
数据集查找模块,用于查找与其兴趣属性点相符量超出第二预设量的用户页面数据集;
数据集推送模块,用于将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。
作为本发明的一种优选方式,所述兴趣属性分析模块进一步用于按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点。
作为本发明的一种优选方式,所述兴趣属性分析模块进一步用于按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。
作为本发明的一种优选方式,所述事件侦测模块进一步用于从社交网络上挖掘与影片相关的非影评数据;所述第二数据挖掘模块进一步用于分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。
作为本发明的一种优选方式,所述事件侦测模块进一步用于从影片购票网站上获取基于影片的检索和/或购票操作事件;所述第二数据挖掘模块进一步用于获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。
本发明实现以下有益效果:
利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘;建立影评数据与所述用户页面数据之间的映射关系;对用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集。使用户找到对自己有价值的数据更加方便快捷,避免了繁琐的数据搜集。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并于说明书一起用于解释本公开的原理。
图1为本发明提供了一种基于多媒体数字影像评论的数据挖掘与处理方法流映射关系图;
图2为本发明提供了一种基于多媒体数字影像评论的数据挖掘与处理方法流程示意图;
图3为本发明提供一种基于多媒体数字影像评论的数据挖掘与处理系统构架示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
实施例一
请参考图1,图2,图1为本发明提供了一种基于多媒体数字影像评论的数据挖掘与处理方法映射关系图;图2为本发明提供了一种基于多媒体数字影像评论的数据挖掘与处理方法流程示意图;
具体的,本实施例提供一种基于多媒体数字影像评论的数据挖掘与处理方法,所述方法包括以下步骤:
Step101:利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘;
Step102:建立所述影评数据与所述用户页面数据之间的映射关系;
Step103:对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;
Step104:侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集。
具体的,在实际的实施过程中,利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘。
例如,在本实施例中对如下几部电影的影评数据进行挖掘:
将上述表格所述的影评数据与用户页面数据建立映射关系。
对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集,并获取分类聚合后的与各用户页面数据集相互映射的影评数据集;在本实施例中,兴趣点相符的预设量为三个以上,如上述表格所述,张华与李江、王梅与赵四、孙红与吴名兴趣点相符的预设量为三个以上,则将兴趣属性点相符的用户页面数据进行分类聚合,形成若干用户页面数据集,并获取分类聚合后的与各用户页面数据集相互映射的影评数据集。
另外,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集,并将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。
作为本发明的一种优选方式,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:
从社交网络上挖掘与影片相关的非影评数据,分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。
作为本发明的一种优选方式,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:
从影片购票网站上获取基于影片的检索和/或购票操作事件,获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。
在本实施例中,社交网络可以包括微博、微信等;例如,某用户在微博上转发了杨洋主演的电影从你的全世界路过并附上了期待上映等关键词,侦测待观影操作事件挖掘出用户在微博上的用户页面数据。另外一种获取用户页面数据的方式,例如,某用户在美团上搜索了这部电影或者正在购买电影票,侦测待观影操作事件并获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。
假设侦测到针对电影《28岁未成年》的待观影操作事件,则挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集,并将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。
实施例二
请参考图1,图2,图1为本发明提供了一种基于多媒体数字影像评论的数据挖掘与处理方法映射关系图;图2为本发明提供了一种基于多媒体数字影像评论的数据挖掘与处理方法流程示意图;
实施例二所提供基于多媒体数字影像评论的数据挖掘与处理方法,与实施例一中所述大体类似,不同之处在于:兴趣属性分析并依次得出兴趣属性点,包括:
按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点。
兴趣属性分析并依次得出兴趣属性点,包括:
按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。
例如,在本实施例中对以下的数据进行分析:
关键词 | 评价意向 |
电影:复仇者联盟 | 好莱坞的影片不是浪得虚名。 |
食物:糖酷排骨 | 偏南方口味,很可口。 |
旅游地:杭州西湖 | 旅游旺季,人太多,不想再体会了。 |
游乐场:上海迪士尼 | 下次有机会再去一次。 |
如上述表格所述,在四个关键词中,该用户对旅游地的评价意向表示不想,对电影、食物、游乐场的评价意向表现出了喜爱,则将评价意向为喜爱的关键词列为兴趣属性点。
另外一种兴趣属性分析并依次得出兴趣属性点的方法,例如,在本实施例中,某用户使用的社交网络是微博,对该用户微博关注的人群进行了一下划分:
行业 | 下位代名词 |
经济金融 | 凤凰传奇 |
企业管理 | SHE |
法律法规 | BigBang |
社会民生 | SNH48 |
如上述表格所述,该用户对乐队团体比较感兴趣,则将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。
实施例三
请参考图3,图3为本发明提供一种基于多媒体数字影像评论的数据挖掘与处理系统构架示意图。
具体的,本实施例提供一种基于多媒体数字影像评论的数据挖掘与处理系统,包括:
第一数据挖掘模块,用于利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;
映射建立模块,用于建立所述影评数据与所述用户页面数据之间的映射关系;
兴趣属性分析模块,用于对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点;
分类聚合模块,用于将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;
数据集获取模块,用于获取分类聚合后的与各用户页面数据集相互映射的影评数据集;
事件侦测模块,用于侦测待观影操作事件;
第二数据挖掘模块,用于挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点;
数据集查找模块,用于查找与其兴趣属性点相符量超出第二预设量的用户页面数据集;
数据集推送模块,用于将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。
作为本发明的一种优选方式,所述兴趣属性分析模块进一步用于按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点。
作为本发明的一种优选方式,所述兴趣属性分析模块进一步用于按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。
作为本发明的一种优选方式,所述事件侦测模块进一步用于从社交网络上挖掘与影片相关的非影评数据;所述第二数据挖掘模块进一步用于分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。
作为本发明的一种优选方式,所述事件侦测模块进一步用于从影片购票网站上获取基于影片的检索和/或购票操作事件;所述第二数据挖掘模块进一步用于获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。
应理解实施例三具体实现的过程可与实施例一、实施例二的描述相对应,此处不再详细描述。
上述实施例只为说明本发明的技术构思及特点,其目的是让熟悉该技术领域的技术人员能够了解本发明的内容并据以实施,并不能以此来限制本发明的保护范围。凡根据本发明精神实质所作出的等同变换或修饰,都应涵盖在本发明的保护范围之内。
Claims (4)
1.一种基于多媒体数字影像评论的数据挖掘与处理方法,其特征在于,所述方法包括:
利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;
建立所述影评数据与所述用户页面数据之间的映射关系;
对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集,并获取分类聚合后的与各用户页面数据集相互映射的影评数据集;
侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集,并将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户;
其中,兴趣属性分析并依次得出兴趣属性点,包括:
按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点;
或者,按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点;
其中,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:
从社交网络上挖掘与影片相关的非影评数据,分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。
2.根据权利要求1所述的一种基于多媒体数字影像评论的数据挖掘与处理方法,其特征在于,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:
从影片购票网站上获取基于影片的检索和/或购票操作事件,获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。
3.一种基于多媒体数字影像评论的数据挖掘与处理系统,其特征在于,所述系统包括:
第一数据挖掘模块,用于利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;
映射建立模块,用于建立所述影评数据与所述用户页面数据之间的映射关系;
兴趣属性分析模块,用于对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点;
分类聚合模块,用于将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;
数据集获取模块,用于获取分类聚合后的与各用户页面数据集相互映射的影评数据集;
事件侦测模块,用于侦测待观影操作事件;
第二数据挖掘模块,用于挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点;
数据集查找模块,用于查找与其兴趣属性点相符量超出第二预设量的用户页面数据集;
数据集推送模块,用于将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户;
其中,所述兴趣属性分析模块进一步用于按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点;
或者,用于按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点;
其中,所述事件侦测模块进一步用于从社交网络上挖掘与影片相关的非影评数据;所述第二数据挖掘模块进一步用于分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。
4.根据权利要求3所述的一种基于多媒体数字影像评论的数据挖掘与处理系统,其特征在于,所述事件侦测模块进一步用于从影片购票网站上获取基于影片的检索和/或购票操作事件;所述第二数据挖掘模块进一步用于获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710071573.7A CN106909635B (zh) | 2017-02-09 | 2017-02-09 | 基于多媒体数字影像评论的数据挖掘与处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710071573.7A CN106909635B (zh) | 2017-02-09 | 2017-02-09 | 基于多媒体数字影像评论的数据挖掘与处理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106909635A CN106909635A (zh) | 2017-06-30 |
CN106909635B true CN106909635B (zh) | 2020-05-19 |
Family
ID=59208318
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710071573.7A Active CN106909635B (zh) | 2017-02-09 | 2017-02-09 | 基于多媒体数字影像评论的数据挖掘与处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106909635B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103886081A (zh) * | 2014-03-26 | 2014-06-25 | 海信集团有限公司 | 一种信息发送方法及系统 |
CN104899232A (zh) * | 2014-03-07 | 2015-09-09 | 华为技术有限公司 | 协同聚类的方法和设备 |
CN105224576A (zh) * | 2014-07-01 | 2016-01-06 | 上海视畅信息科技有限公司 | 一种影视智能推荐方法 |
CN105763637A (zh) * | 2016-04-18 | 2016-07-13 | 苏州寅初信息科技有限公司 | 一种基于大数据的影评获取方法 |
CN105824923A (zh) * | 2016-03-17 | 2016-08-03 | 海信集团有限公司 | 影视资源推荐方法及装置 |
CN106227866A (zh) * | 2016-07-29 | 2016-12-14 | 武汉理工大学 | 一种基于数据挖掘的混合过滤电影推荐方法 |
-
2017
- 2017-02-09 CN CN201710071573.7A patent/CN106909635B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104899232A (zh) * | 2014-03-07 | 2015-09-09 | 华为技术有限公司 | 协同聚类的方法和设备 |
CN103886081A (zh) * | 2014-03-26 | 2014-06-25 | 海信集团有限公司 | 一种信息发送方法及系统 |
CN105224576A (zh) * | 2014-07-01 | 2016-01-06 | 上海视畅信息科技有限公司 | 一种影视智能推荐方法 |
CN105824923A (zh) * | 2016-03-17 | 2016-08-03 | 海信集团有限公司 | 影视资源推荐方法及装置 |
CN105763637A (zh) * | 2016-04-18 | 2016-07-13 | 苏州寅初信息科技有限公司 | 一种基于大数据的影评获取方法 |
CN106227866A (zh) * | 2016-07-29 | 2016-12-14 | 武汉理工大学 | 一种基于数据挖掘的混合过滤电影推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106909635A (zh) | 2017-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10289700B2 (en) | Method for dynamically matching images with content items based on keywords in response to search queries | |
CN101364239B (zh) | 一种分类目录自动构建方法及相关系统 | |
US20140358911A1 (en) | Search and discovery system | |
CN102054003B (zh) | 网络信息推荐、建立网络资源索引的方法及系统 | |
CN111008321A (zh) | 基于逻辑回归推荐方法、装置、计算设备、可读存储介质 | |
CN110232126B (zh) | 热点挖掘方法及服务器和计算机可读存储介质 | |
Hauff et al. | Placing images on the world map: a microblog-based enrichment approach | |
CN110633406B (zh) | 事件专题的生成方法、装置、存储介质和终端设备 | |
US20170255653A1 (en) | Method for categorizing images to be associated with content items based on keywords of search queries | |
US9424338B2 (en) | Clustering queries for image search | |
Seah et al. | Prism: Concept-preserving social image search results summarization | |
Choi et al. | Multimodal location estimation of consumer media: Dealing with sparse training data | |
Zaharieva et al. | Retrieving Diverse Social Images at MediaEval 2017: Challenges, Dataset and Evaluation. | |
CN106909635B (zh) | 基于多媒体数字影像评论的数据挖掘与处理方法及系统 | |
Rehman et al. | Understanding the spatio-temporal scope of multi-scale social events | |
Mehta et al. | Coverage and diversity aware top-k query for spatio-temporal posts | |
Moreira et al. | Analysis of structured data on Wikipedia | |
Marinho et al. | Improving location recommendations with temporal pattern extraction | |
Setty et al. | Inzeit: efficiently identifying insightful time points | |
Koesten et al. | Searching data portals-More complex than we thought? | |
Wang et al. | News Insider: Innovating News Understanding to Improve the Quality of Reading Experience | |
Shekhar et al. | A WEBIR crawling framework for retrieving highly relevant web documents: evaluation based on rank aggregation and result merging algorithms | |
Liu et al. | Review of the development of digital earth research during 1998–2015 based on a bibliometric analysis | |
Paniagua et al. | Indexing media by personal events | |
Spyrou et al. | A survey of geo-tagged multimedia content analysis within flickr |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200403 Address after: B305, floor 3, building 3, Nigang water base, No. 1008, Nigang West Road, Qingshuihe street, Luohu District, Shenzhen City, Guangdong Province Applicant after: SHENZHEN READY INTELLECTUAL TECHNOLOGY Co.,Ltd. Address before: Room H501, 77 East Beijing Road, Taicang Economic Development Zone, Suzhou City, Jiangsu Province Applicant before: SUZHOU LIANGLEI INTELLECTUAL PROPERTY OPERATIONS Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |