CN106909635B - 基于多媒体数字影像评论的数据挖掘与处理方法及系统 - Google Patents

基于多媒体数字影像评论的数据挖掘与处理方法及系统 Download PDF

Info

Publication number
CN106909635B
CN106909635B CN201710071573.7A CN201710071573A CN106909635B CN 106909635 B CN106909635 B CN 106909635B CN 201710071573 A CN201710071573 A CN 201710071573A CN 106909635 B CN106909635 B CN 106909635B
Authority
CN
China
Prior art keywords
data
mining
user page
user
page data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710071573.7A
Other languages
English (en)
Other versions
CN106909635A (zh
Inventor
蔡璟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN READY INTELLECTUAL TECHNOLOGY Co.,Ltd.
Original Assignee
Shenzhen Ready Intellectual Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Ready Intellectual Technology Co ltd filed Critical Shenzhen Ready Intellectual Technology Co ltd
Priority to CN201710071573.7A priority Critical patent/CN106909635B/zh
Publication of CN106909635A publication Critical patent/CN106909635A/zh
Application granted granted Critical
Publication of CN106909635B publication Critical patent/CN106909635B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于多媒体数字影像评论的数据挖掘与处理方法,包括:利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘;建立影评数据与用户页面数据之间的映射关系;对用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集。本发明使用户找到对于自己有价值的信息更加方便快捷。

Description

基于多媒体数字影像评论的数据挖掘与处理方法及系统
技术领域
本发明涉及数据挖掘技术领域,特别涉及一种基于多媒体数字影像评论的数据挖掘与处理方法及系统。
背景技术
随着多媒体技术的发展,人们接触的数据形式不断地丰富,多媒体数据库的日益增多,原有的数据库技术已经满足不了应用的需求,人们希望从这些媒体数据中得到一些高层的概念和模式,找出蕴含于其中的有价值的知识。这种将数字挖掘技术与多媒体信息处理技术有机结合起来形成的在多媒体数据中进行知识发现的信息处理方法就是多媒体数据挖掘。但是从现有的多媒体技术中找出有价值的知识既费时又繁琐。鉴于以上现有技术存在的问题,本发明希望找到一种基于多媒体数字影像评论的数据挖掘与处理方法及系统。
发明内容
发明目的:对上述情况,为了克服背景技术中的缺点,本发明实施例提供了一种基于多媒体数字影像评论的数据挖掘与处理方法及系统,能够有效解决上述背景技术中涉及的问题。
技术方案:一种基于多媒体数字影像评论的数据挖掘与处理方法,所述方法包括:
利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;
建立所述影评数据与所述用户页面数据之间的映射关系;
对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集,并获取分类聚合后的与各用户页面数据集相互映射的影评数据集;
侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集,并将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。
作为本发明的一种优选方式,兴趣属性分析并依次得出兴趣属性点,包括:
按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点。
作为本发明的一种优选方式,兴趣属性分析并依次得出兴趣属性点,包括:
按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。
作为本发明的一种优选方式,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:
从社交网络上挖掘与影片相关的非影评数据,分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。
作为本发明的一种优选方式,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:
从影片购票网站上获取基于影片的检索和/或购票操作事件,获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。
一种基于多媒体数字影像评论的数据挖掘与处理系统,所述系统包括:
第一数据挖掘模块,用于利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;
映射建立模块,用于建立所述影评数据与所述用户页面数据之间的映射关系;
兴趣属性分析模块,用于对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点;
分类聚合模块,用于将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;
数据集获取模块,用于获取分类聚合后的与各用户页面数据集相互映射的影评数据集;
事件侦测模块,用于侦测待观影操作事件;
第二数据挖掘模块,用于挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点;
数据集查找模块,用于查找与其兴趣属性点相符量超出第二预设量的用户页面数据集;
数据集推送模块,用于将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。
作为本发明的一种优选方式,所述兴趣属性分析模块进一步用于按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点。
作为本发明的一种优选方式,所述兴趣属性分析模块进一步用于按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。
作为本发明的一种优选方式,所述事件侦测模块进一步用于从社交网络上挖掘与影片相关的非影评数据;所述第二数据挖掘模块进一步用于分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。
作为本发明的一种优选方式,所述事件侦测模块进一步用于从影片购票网站上获取基于影片的检索和/或购票操作事件;所述第二数据挖掘模块进一步用于获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。
本发明实现以下有益效果:
利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘;建立影评数据与所述用户页面数据之间的映射关系;对用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集。使用户找到对自己有价值的数据更加方便快捷,避免了繁琐的数据搜集。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并于说明书一起用于解释本公开的原理。
图1为本发明提供了一种基于多媒体数字影像评论的数据挖掘与处理方法流映射关系图;
图2为本发明提供了一种基于多媒体数字影像评论的数据挖掘与处理方法流程示意图;
图3为本发明提供一种基于多媒体数字影像评论的数据挖掘与处理系统构架示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
实施例一
请参考图1,图2,图1为本发明提供了一种基于多媒体数字影像评论的数据挖掘与处理方法映射关系图;图2为本发明提供了一种基于多媒体数字影像评论的数据挖掘与处理方法流程示意图;
具体的,本实施例提供一种基于多媒体数字影像评论的数据挖掘与处理方法,所述方法包括以下步骤:
Step101:利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘;
Step102:建立所述影评数据与所述用户页面数据之间的映射关系;
Step103:对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;
Step104:侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集。
具体的,在实际的实施过程中,利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘。
例如,在本实施例中对如下几部电影的影评数据进行挖掘:
Figure DEST_PATH_IMAGE002
将上述表格所述的影评数据与用户页面数据建立映射关系。
对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集,并获取分类聚合后的与各用户页面数据集相互映射的影评数据集;在本实施例中,兴趣点相符的预设量为三个以上,如上述表格所述,张华与李江、王梅与赵四、孙红与吴名兴趣点相符的预设量为三个以上,则将兴趣属性点相符的用户页面数据进行分类聚合,形成若干用户页面数据集,并获取分类聚合后的与各用户页面数据集相互映射的影评数据集。
另外,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集,并将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。
作为本发明的一种优选方式,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:
从社交网络上挖掘与影片相关的非影评数据,分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。
作为本发明的一种优选方式,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:
从影片购票网站上获取基于影片的检索和/或购票操作事件,获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。
在本实施例中,社交网络可以包括微博、微信等;例如,某用户在微博上转发了杨洋主演的电影从你的全世界路过并附上了期待上映等关键词,侦测待观影操作事件挖掘出用户在微博上的用户页面数据。另外一种获取用户页面数据的方式,例如,某用户在美团上搜索了这部电影或者正在购买电影票,侦测待观影操作事件并获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。
假设侦测到针对电影《28岁未成年》的待观影操作事件,则挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集,并将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。
实施例二
请参考图1,图2,图1为本发明提供了一种基于多媒体数字影像评论的数据挖掘与处理方法映射关系图;图2为本发明提供了一种基于多媒体数字影像评论的数据挖掘与处理方法流程示意图;
实施例二所提供基于多媒体数字影像评论的数据挖掘与处理方法,与实施例一中所述大体类似,不同之处在于:兴趣属性分析并依次得出兴趣属性点,包括:
按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点。
兴趣属性分析并依次得出兴趣属性点,包括:
按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。
例如,在本实施例中对以下的数据进行分析:
关键词 评价意向
电影:复仇者联盟 好莱坞的影片不是浪得虚名。
食物:糖酷排骨 偏南方口味,很可口。
旅游地:杭州西湖 旅游旺季,人太多,不想再体会了。
游乐场:上海迪士尼 下次有机会再去一次。
如上述表格所述,在四个关键词中,该用户对旅游地的评价意向表示不想,对电影、食物、游乐场的评价意向表现出了喜爱,则将评价意向为喜爱的关键词列为兴趣属性点。
另外一种兴趣属性分析并依次得出兴趣属性点的方法,例如,在本实施例中,某用户使用的社交网络是微博,对该用户微博关注的人群进行了一下划分:
行业 下位代名词
经济金融 凤凰传奇
企业管理 SHE
法律法规 BigBang
社会民生 SNH48
如上述表格所述,该用户对乐队团体比较感兴趣,则将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。
实施例三
请参考图3,图3为本发明提供一种基于多媒体数字影像评论的数据挖掘与处理系统构架示意图。
具体的,本实施例提供一种基于多媒体数字影像评论的数据挖掘与处理系统,包括:
第一数据挖掘模块,用于利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;
映射建立模块,用于建立所述影评数据与所述用户页面数据之间的映射关系;
兴趣属性分析模块,用于对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点;
分类聚合模块,用于将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;
数据集获取模块,用于获取分类聚合后的与各用户页面数据集相互映射的影评数据集;
事件侦测模块,用于侦测待观影操作事件;
第二数据挖掘模块,用于挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点;
数据集查找模块,用于查找与其兴趣属性点相符量超出第二预设量的用户页面数据集;
数据集推送模块,用于将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。
作为本发明的一种优选方式,所述兴趣属性分析模块进一步用于按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点。
作为本发明的一种优选方式,所述兴趣属性分析模块进一步用于按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。
作为本发明的一种优选方式,所述事件侦测模块进一步用于从社交网络上挖掘与影片相关的非影评数据;所述第二数据挖掘模块进一步用于分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。
作为本发明的一种优选方式,所述事件侦测模块进一步用于从影片购票网站上获取基于影片的检索和/或购票操作事件;所述第二数据挖掘模块进一步用于获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。
应理解实施例三具体实现的过程可与实施例一、实施例二的描述相对应,此处不再详细描述。
上述实施例只为说明本发明的技术构思及特点,其目的是让熟悉该技术领域的技术人员能够了解本发明的内容并据以实施,并不能以此来限制本发明的保护范围。凡根据本发明精神实质所作出的等同变换或修饰,都应涵盖在本发明的保护范围之内。

Claims (4)

1.一种基于多媒体数字影像评论的数据挖掘与处理方法,其特征在于,所述方法包括:
利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;
建立所述影评数据与所述用户页面数据之间的映射关系;
对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集,并获取分类聚合后的与各用户页面数据集相互映射的影评数据集;
侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集,并将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户;
其中,兴趣属性分析并依次得出兴趣属性点,包括:
按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点;
或者,按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点;
其中,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:
从社交网络上挖掘与影片相关的非影评数据,分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。
2.根据权利要求1所述的一种基于多媒体数字影像评论的数据挖掘与处理方法,其特征在于,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:
从影片购票网站上获取基于影片的检索和/或购票操作事件,获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。
3.一种基于多媒体数字影像评论的数据挖掘与处理系统,其特征在于,所述系统包括:
第一数据挖掘模块,用于利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;
映射建立模块,用于建立所述影评数据与所述用户页面数据之间的映射关系;
兴趣属性分析模块,用于对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点;
分类聚合模块,用于将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;
数据集获取模块,用于获取分类聚合后的与各用户页面数据集相互映射的影评数据集;
事件侦测模块,用于侦测待观影操作事件;
第二数据挖掘模块,用于挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点;
数据集查找模块,用于查找与其兴趣属性点相符量超出第二预设量的用户页面数据集;
数据集推送模块,用于将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户;
其中,所述兴趣属性分析模块进一步用于按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点;
或者,用于按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点;
其中,所述事件侦测模块进一步用于从社交网络上挖掘与影片相关的非影评数据;所述第二数据挖掘模块进一步用于分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。
4.根据权利要求3所述的一种基于多媒体数字影像评论的数据挖掘与处理系统,其特征在于,所述事件侦测模块进一步用于从影片购票网站上获取基于影片的检索和/或购票操作事件;所述第二数据挖掘模块进一步用于获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。
CN201710071573.7A 2017-02-09 2017-02-09 基于多媒体数字影像评论的数据挖掘与处理方法及系统 Active CN106909635B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710071573.7A CN106909635B (zh) 2017-02-09 2017-02-09 基于多媒体数字影像评论的数据挖掘与处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710071573.7A CN106909635B (zh) 2017-02-09 2017-02-09 基于多媒体数字影像评论的数据挖掘与处理方法及系统

Publications (2)

Publication Number Publication Date
CN106909635A CN106909635A (zh) 2017-06-30
CN106909635B true CN106909635B (zh) 2020-05-19

Family

ID=59208318

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710071573.7A Active CN106909635B (zh) 2017-02-09 2017-02-09 基于多媒体数字影像评论的数据挖掘与处理方法及系统

Country Status (1)

Country Link
CN (1) CN106909635B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886081A (zh) * 2014-03-26 2014-06-25 海信集团有限公司 一种信息发送方法及系统
CN104899232A (zh) * 2014-03-07 2015-09-09 华为技术有限公司 协同聚类的方法和设备
CN105224576A (zh) * 2014-07-01 2016-01-06 上海视畅信息科技有限公司 一种影视智能推荐方法
CN105763637A (zh) * 2016-04-18 2016-07-13 苏州寅初信息科技有限公司 一种基于大数据的影评获取方法
CN105824923A (zh) * 2016-03-17 2016-08-03 海信集团有限公司 影视资源推荐方法及装置
CN106227866A (zh) * 2016-07-29 2016-12-14 武汉理工大学 一种基于数据挖掘的混合过滤电影推荐方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899232A (zh) * 2014-03-07 2015-09-09 华为技术有限公司 协同聚类的方法和设备
CN103886081A (zh) * 2014-03-26 2014-06-25 海信集团有限公司 一种信息发送方法及系统
CN105224576A (zh) * 2014-07-01 2016-01-06 上海视畅信息科技有限公司 一种影视智能推荐方法
CN105824923A (zh) * 2016-03-17 2016-08-03 海信集团有限公司 影视资源推荐方法及装置
CN105763637A (zh) * 2016-04-18 2016-07-13 苏州寅初信息科技有限公司 一种基于大数据的影评获取方法
CN106227866A (zh) * 2016-07-29 2016-12-14 武汉理工大学 一种基于数据挖掘的混合过滤电影推荐方法

Also Published As

Publication number Publication date
CN106909635A (zh) 2017-06-30

Similar Documents

Publication Publication Date Title
US10289700B2 (en) Method for dynamically matching images with content items based on keywords in response to search queries
CN101364239B (zh) 一种分类目录自动构建方法及相关系统
US20140358911A1 (en) Search and discovery system
CN102054003B (zh) 网络信息推荐、建立网络资源索引的方法及系统
CN111008321A (zh) 基于逻辑回归推荐方法、装置、计算设备、可读存储介质
CN110232126B (zh) 热点挖掘方法及服务器和计算机可读存储介质
Hauff et al. Placing images on the world map: a microblog-based enrichment approach
CN110633406B (zh) 事件专题的生成方法、装置、存储介质和终端设备
US20170255653A1 (en) Method for categorizing images to be associated with content items based on keywords of search queries
US9424338B2 (en) Clustering queries for image search
Seah et al. Prism: Concept-preserving social image search results summarization
Choi et al. Multimodal location estimation of consumer media: Dealing with sparse training data
Zaharieva et al. Retrieving Diverse Social Images at MediaEval 2017: Challenges, Dataset and Evaluation.
CN106909635B (zh) 基于多媒体数字影像评论的数据挖掘与处理方法及系统
Rehman et al. Understanding the spatio-temporal scope of multi-scale social events
Mehta et al. Coverage and diversity aware top-k query for spatio-temporal posts
Moreira et al. Analysis of structured data on Wikipedia
Marinho et al. Improving location recommendations with temporal pattern extraction
Setty et al. Inzeit: efficiently identifying insightful time points
Koesten et al. Searching data portals-More complex than we thought?
Wang et al. News Insider: Innovating News Understanding to Improve the Quality of Reading Experience
Shekhar et al. A WEBIR crawling framework for retrieving highly relevant web documents: evaluation based on rank aggregation and result merging algorithms
Liu et al. Review of the development of digital earth research during 1998–2015 based on a bibliometric analysis
Paniagua et al. Indexing media by personal events
Spyrou et al. A survey of geo-tagged multimedia content analysis within flickr

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200403

Address after: B305, floor 3, building 3, Nigang water base, No. 1008, Nigang West Road, Qingshuihe street, Luohu District, Shenzhen City, Guangdong Province

Applicant after: SHENZHEN READY INTELLECTUAL TECHNOLOGY Co.,Ltd.

Address before: Room H501, 77 East Beijing Road, Taicang Economic Development Zone, Suzhou City, Jiangsu Province

Applicant before: SUZHOU LIANGLEI INTELLECTUAL PROPERTY OPERATIONS Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant