CN109118270A - 一种数据提取方法及装置 - Google Patents

一种数据提取方法及装置 Download PDF

Info

Publication number
CN109118270A
CN109118270A CN201810766349.4A CN201810766349A CN109118270A CN 109118270 A CN109118270 A CN 109118270A CN 201810766349 A CN201810766349 A CN 201810766349A CN 109118270 A CN109118270 A CN 109118270A
Authority
CN
China
Prior art keywords
data
user
film
movie theatre
interbehavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810766349.4A
Other languages
English (en)
Other versions
CN109118270B (zh
Inventor
张蒙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Maoyan Cultural Media Co Ltd
Original Assignee
Beijing Maoyan Cultural Media Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Maoyan Cultural Media Co Ltd filed Critical Beijing Maoyan Cultural Media Co Ltd
Priority to CN201810766349.4A priority Critical patent/CN109118270B/zh
Publication of CN109118270A publication Critical patent/CN109118270A/zh
Application granted granted Critical
Publication of CN109118270B publication Critical patent/CN109118270B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种数据提取方法及装置,所述方法包括:获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各用户基础数据对应的第二用户交互行为数据;依据各用户基础数据和各第一用户交互行为数据,生成各部电影对应的电影画像数据;依据各用户基础数据和各第二用户交互行为数据生成各影院对应的影院画像数据;接收用户输入的查找关键词,依据查找关键词从电影画像数据或影院画像数据中提取目标数据。能够依据电影画像数据和影院画像数据提取出精确的数据,方便对电影或影院用户进行运营管理。

Description

一种数据提取方法及装置
技术领域
本发明实施例涉及数据提取技术领域,特别是涉及一种数据提取方法及装置。
背景技术
用户画像是指对于用户基础特征的描述集合。针对电影行业的需求,需要依据用户画像的划分,来查看不同目标(电影、影院等)的受众群体的属性,即不同目标对应不同用户的用户画像。
电影行业经常需要对比两部电影对应的用户画像之间的差别来分析影片反响和票房的结果差别。另外,影院侧也经常需要对自己的用户群体进行更细致的分析和精细化运营。
然而,传统的用户画像仅对于单个维度进行分析预测,即用户的基本属性进行统计分析和预测,由于用户画像的维度单一,使得无法提取精确的数据。
发明内容
本发明提供了一种数据提取方法及装置,以解决现有技术中由于数据总和的维度单一,使得无法提取精确的数据的问题。
为了解决上述问题,本发明公开了一种数据提取方法,所述方法包括:获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据,其中,所述第一用户交互行为数据为用户对电影的行为操作数据,所述第二用户交互行为数据为用户对影院的行为操作数据;依据各所述用户基础数据和各所述第一用户交互行为数据,生成各部电影对应的电影画像数据;依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据;接收所述用户输入的查找关键词,依据所述查找关键词从所述电影画像数据或所述影院画像数据中提取目标数据。
优选地,所述依据各所述用户基础数据和各所述第一用户交互行为数据,生成各部电影对应的电影画像数据的步骤,包括:针对每条所述第一用户交互行为数据,确定所述第一用户交互行为数据对应的电影和第一交互行为操作;其中,第一交互操作行为包括以下任意之一:购票、浏览、评论以及收藏;针对各电影,确定所述电影对应的各第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据;建立所述电影、各所述第一目标用户基础数据以及各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据三者之间的对应关系,生成电影画像数据。
优选地,所述依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据的步骤,包括:针对每条所述第二用户交互行为数据,确定所述第二用户交互行为数据对应的影院和第二交互行为操作;其中,第二交互行为操作包括以下任意之一:购票、购买商品以及浏览;针对各影院,确定所述影院对应的各第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据;建立所述影院、各所述第二目标用户基础数据以及各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据三者之间的对应关系,生成影院画像数据。
优选地,所述查找关键词包括:年龄范围、性别、职业、爱好、电影名称以及影院名称中的至少之一。
优选地,在所述获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据的步骤之前,所述方法还包括:接收用户输入的账号登录信息;将所述账号登录信息确定为所述用户的用户基础数据;检测并记录所述用户的交互行为数据,建立所述用户基础数据与所述用户的交互行为数据之间的对应关系。
本发明还公开了一种数据提取装置,所述装置包括:获取模块,用于获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据,其中所述第一用户交互行为数据为用户对电影的行为操作数据,所述第二用户交互行为数据为用户对影院的行为操作数据;第一生成模块,用于依据各所述用户基础数据和各所述第一用户交互行为数据,生成各部电影对应的电影画像数据;第二生成模块,用于依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据;第一接收模块,用于接收所述用户输入的查找关键词,依据所述查找关键词从所述电影画像数据或所述影院画像数据中提取目标数据。
优选地,所述第一生成模块包括:第一确定子模块,用于针对每条所述第一用户交互行为数据,确定所述第一用户交互行为数据对应的电影和第一交互行为操作;其中,第一交互操作行为包括以下任意之一:购票、浏览、评论以及收藏;第二确定子模块,用于针对各电影,确定所述电影对应的各第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据;第一建立子模块,用于建立所述电影、各所述第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据三者之间的对应关系,生成电影画像数据。
优选地,所述第二生成模块包括:第三确定子模块,用于针对每条所述第二用户交互行为数据,确定所述第二用户交互行为数据对应的影院和第二交互行为操作;其中,第二交互行为操作包括以下任意之一:购票、购买商品以及浏览;第四确定子模块,用于针对各影院,确定所述影院对应的各第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据;第二建立子模块,用于建立所述影院、各所述第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据三者之间的对应关系,生成影院画像数据。
优选地,所述查找关键词包括:年龄范围、性别、职业、爱好、电影名称以及影院名称中的至少之一。
优选地,所述装置还包括:第二接收模块,用于在所述获取模块获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据之前,接收用户输入的账号登录信息;确定模块,用于将所述账号登录信息确定为所述用户的用户基础数据;检测模块,用于检测并记录所述用户的交互行为数据,建立所述用户基础数据与所述用户的交互行为数据之间的对应关系
与现有技术相比,本发明具有以下优点:通过获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各用户基础数据对应的第二用户交互行为数据;依据各用户基础数据和各第一用户交互行为数据,生成各部电影对应的电影画像数据,依据各用户基础数据和各第二用户交互行为数据,生成各影院对应的影院画像数据;接收用户输入的查找关键词,依据查找关键词从电影画像数据或影院画像数据中提取目标数据,基于两个维度,用户基础数据和用户基础数据对应的第一用户交互行为数据和第二用户交互行为数据,生成各部电影对应的电影画像数据和各影院对应的影院画像数据,能够依据电影画像数据和影院画像数据提取出精确的数据,方便对电影或影院用户进行运营管理。
附图说明
图1是本发明实施例一的一种数据提取方法的步骤流程图;
图2是本发明实施例二的一种数据提取方法的步骤流程图;
图3是本发明实施例三的一种数据提取装置的结构框图;
图4是本发明实施例四的一种数据提取装置的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例一
参照图1,示出了本发明实施例一的一种数据提取方法的步骤流程图。
本发明实施例提供的数据提取方法包括以下步骤:
步骤101:获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各用户基础数据对应的第二用户交互行为数据。
其中,第一用户交互行为数据为用户对电影的行为操作数据,第二用户交互行为数据为用户对影院的行为操作数据。
获取基于电影应用程序的用户基础数据以及用户在影院购票时所提供的数据,作为用户基础数据,其中,用户基础数据包括以下至少之一:用户年龄、用户所在城市、用户职业以及用户爱好等。
第一用户交互行为数据可以为用户对某电影的浏览操作、购买操作、评分操作以及收藏操作等。
第二用户交互行为数据可以为用户对某影院的浏览操作,用户在该影院下的购票操作,用户在该影院下购买商品的操作以及购票是距离影院的距离等。
步骤102:依据各用户基础数据和各第一用户交互行为数据,生成各部电影对应的电影画像数据。
例如:获取A用户和B用户的用户基础数据、A用户对1号电影的预览操作、B用户对1号电影的收藏操作,生成的各部电影对应的电影画像数据为1号电影对应A用户和B用户,且A用户对1号电影的第一用户交互行为数据为预览,B用户对1号电影的第一用户交互行为数据为收藏。
步骤103:依据各用户基础数据和各第二用户交互行为数据生成各影院对应的影院画像数据。
例如:获取A用户和B用户的用户基础数据,A用户在C影院进行购票,B用户在C影院购买商品,则C影院对应的影院画像数据为:C影院对应A用户和B用户,且A用户对C影院的第二用户交互行为数据为购票,B用户对C影院的第二用户交互行为数据为购买商品。
步骤104:接收用户输入的查找关键词,依据查找关键词从电影画像数据或影院画像数据中提取目标数据。
针对电影画像数据或影院画像数据,接收用户输入的查找关键词,例如:用户输入对于1号电影的收藏,即如步骤102中,则目标数据为B用户。
与现有技术相比,本发明具有以下优点:通过获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各用户基础数据对应的第二用户交互行为数据;依据各用户基础数据和各第一用户交互行为数据,生成各部电影对应的电影画像数据,依据各用户基础数据和各第二用户交互行为数据,生成各影院对应的影院画像数据;接收用户输入的查找关键词,依据查找关键词从电影画像数据或影院画像数据中提取目标数据,基于两个维度,用户基础数据和用户基础数据对应的第一用户交互行为数据以及第二用户交互行为数据,生成各部电影对应的电影画像数据和各影院对应的影院画像数据,能够依据电影画像数据和影院画像数据提取出精确的数据,方便对电影或影院用户进行运营管理。
实施例二
参照图2,示出本发明实施例二的一种数据提取方法的步骤流程图。
本发明实施例提供的数据提取方法包括以下步骤:
步骤201:接收用户输入的账号登录信息。
步骤202:将账号登录信息确定为用户的用户基础数据。
接收各用户在电影应用程序上的账号登陆信息,依据各用户的账号登陆信息,获取各账号信息对应的用户基础数据,其中,用户基础数据包括但不限于用户年龄、用户所在城市、用户职业以及用户爱好等。
步骤203:检测并记录用户的交互行为数据,建立用户基础数据与用户的交互行为数据之间的对应关系。
在预设时长内,检测并记录用户的交互行为数据,并建立用户基础数据和用户的交互行为数据之间的对应关系。例如:在一个月之内,检测用户对各影院下各电影的交互行为数据,其中交互行为数据包括但不限于:对应的电影选择操作、对电影的预览操作、电影的购票操作、电影的收藏操作、对电影的评分操作以及对电影的评论操作等。
需要说明的是,本领域技术人员可以根据实际情况对预设时长进行设置,可以设置为一周、一个月、两个月等,本发明实施例对预设时长不作具体限制。
步骤204:获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各用户基础数据对应的第二用户交互行为数据。
其中,第一用户交互行为数据为用户对电影的行为操作数据,第二用户交互行为数据为用户对影院的行为操作数据。
获取基于电影应用程序的用户基础数据以及用户在影院购票时所提供的数据,作为用户基础数据,其中,用户基础数据包括以下至少之一:用户年龄、用户所在城市、用户职业以及用户爱好等。
第一用户交互行为数据可以为用户对某电影的浏览操作、购买操作、评分操作以及收藏操作等。
第二用户交互行为数据可以为用户对某影院的浏览操作,用户在该影院下的购票操作,用户在该影院下购买商品的操作以及购票是距离影院的距离等。
步骤205:针对每条第一用户交互行为数据,确定第一用户交互行为数据对应的电影和第一交互行为操作。
其中,第一交互操作行为包括以下任意之一:对电影的购票操作、对电影的浏览操作、对电影的评论操作以及对电影的收藏操作。
步骤206:针对各电影,确定电影对应的各第一目标用户基础数据、和各第一目标用户基础数据对应的电影的第一用户交互行为数据。
步骤207:建立电影、各第一目标用户基础数据以及各第一目标用户基础数据对应的电影的第一用户交互行为数据三者之间的对应关系,生成电影画像数据。
例如:获取A用户和B用户的用户基础数据、A用户对1号电影的预览操作、B用户对1号电影的收藏操作,生成的各部电影对应的电影画像数据为1号电影对应A用户和B用户,且A用户对1号电影的第一用户交互行为数据为预览,B用户对1号电影的第一用户交互行为数据为收藏。
步骤208:针对每条第二用户交互行为数据,确定第二用户交互行为数据对应的影院和第二交互行为操作。
其中,第二交互行为操作包括以下任意之一:在影院的购票操作、在影院的购买商品操作以及对影院的浏览操作。
步骤209:针对各影院,确定影院对应的各第二目标用户基础数据、和各第二目标用户基础数据对应的影院的第二用户交互行为数据。
步骤210:建立影院、各第二目标用户基础数据以及各第二目标用户基础数据对应的影院的第二用户交互行为数据三者之间的对应关系,生成影院画像数据。
例如:获取A用户和B用户的用户基础数据,A用户在C影院进行购票,B用户在C影院购买商品,则C影院对应的影院画像数据为:C影院对应A用户和B用户,且A用户对C影院的第二用户交互行为数据为购票,B用户对C影院的第二用户交互行为数据为购买商品。
步骤211:接收用户输入的查找关键词,依据查找关键词从电影画像数据或影院画像数据中提取目标数据。
查找关键词包括:年龄范围、性别、职业、爱好、电影名称以及影院名称中的至少之一。
与现有技术相比,本发明具有以下优点:通过获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各用户基础数据对应的第二用户交互行为数据;依据各用户基础数据和各第一用户交互行为数据,生成各部电影对应的电影画像数据,依据各用户基础数据和各第二用户交互行为数据,生成各影院对应的影院画像数据;接收用户输入的查找关键词,依据查找关键词从电影画像数据或影院画像数据中提取目标数据,基于两个维度,用户基础数据和用户基础数据对应的第一用户交互行为数据以及第二用户交互行为数据,生成各部电影对应的电影画像数据和各影院对应的影院画像数据,能够依据电影画像数据和影院画像数据提取出精确的数据,方便对电影或影院用户进行运营管理。
实施例三
参照图3,示出本发明实施例三的一种数据提取装置的结构框图。
本发明实施例提供的数据提取装置包括:获取模块301,用于获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据,其中所述第一用户交互行为数据为用户对电影的行为操作数据,所述第二用户交互行为数据为用户对影院的行为操作数据;第一生成模块302,用于依据各所述用户基础数据和各所述第一用户交互行为数据,生成各部电影对应的电影画像数据;第二生成模块303,用于依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据;第一接收模块304,用于接收所述用户输入的查找关键词,依据所述查找关键词从所述电影画像数据或所述影院画像数据中提取目标数据。
与现有技术相比,本发明具有以下优点:通过获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各用户基础数据对应的第二用户交互行为数据;依据各用户基础数据和各第一用户交互行为数据,生成各部电影对应的电影画像数据,依据各用户基础数据和各第二用户交互行为数据,生成各影院对应的影院画像数据;接收用户输入的查找关键词,依据查找关键词从电影画像数据或影院画像数据中提取目标数据,基于两个维度,用户基础数据和用户基础数据对应的第一用户交互行为数据以及第二用户交互行为数据,生成各部电影对应的电影画像数据和各影院对应的影院画像数据,能够依据电影画像数据和影院画像数据提取出精确的数据,方便对电影或影院用户进行运营管理。
实施例四
参照图4,示出本发明实施例四的一种数据提取装置的结构框图。
本发明实施例提供的数据提取装置包括:获取模块401,用于获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据,其中所述第一用户交互行为数据为用户对电影的行为操作数据,所述第二用户交互行为数据为用户对影院的行为操作数据;第一生成模块402,用于依据各所述用户基础数据和各所述第一用户交互行为数据,生成各部电影对应的电影画像数据;第二生成模块403,用于依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据;第一接收模块404,用于接收所述用户输入的查找关键词,依据所述查找关键词从所述电影画像数据或所述影院画像数据中提取目标数据。
优选地,所述第一生成模块402包括:第一确定子模块4021,用于针对每条所述第一用户交互行为数据,确定所述第一用户交互行为数据对应的电影和第一交互行为操作;其中,第一交互操作行为包括以下任意之一:购票、浏览、评论以及收藏;第二确定子模块4022,用于针对各电影,确定所述电影对应的各第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据;第一建立子模块4023,用于建立所述电影、各所述第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据三者之间的对应关系,生成电影画像数据。
优选地,所述第二生成模块403包括:第三确定子模块4031,用于针对每条所述第二用户交互行为数据,确定所述第二用户交互行为数据对应的影院和第二交互行为操作;其中,第二交互行为操作包括以下任意之一:购票、购买商品以及浏览;第四确定子模块4032,用于针对各影院,确定所述影院对应的各第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据;第二建立子模块4033,用于建立所述影院、各所述第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据三者之间的对应关系,生成影院画像数据。
优选地,所述查找关键词包括:年龄范围、性别、职业、爱好、电影名称以及影院名称中的至少之一。
优选地,所述装置还包括:第二接收模块405,用于在所述获取模块401获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据之前,接收用户输入的账号登录信息;确定模块406,用于将所述账号登录信息确定为所述用户的用户基础数据;检测模块407,用于检测并记录所述用户的交互行为数据,建立所述用户基础数据与所述用户的交互行为数据之间的对应关系。
与现有技术相比,本发明具有以下优点:通过获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各用户基础数据对应的第二用户交互行为数据;依据各用户基础数据和各第一用户交互行为数据,生成各部电影对应的电影画像数据,依据各用户基础数据和各第二用户交互行为数据,生成各影院对应的影院画像数据;接收用户输入的查找关键词,依据查找关键词从电影画像数据或影院画像数据中提取目标数据,基于两个维度,用户基础数据和用户基础数据对应的第一用户交互行为数据以及第二用户交互行为数据,生成各部电影对应的电影画像数据和各影院对应的影院画像数据,能够依据电影画像数据和影院画像数据提取出精确的数据,方便对电影或影院用户进行运营管理。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本发明所提供的一种数据提取方法和装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种数据提取方法,其特征在于,所述方法包括:
获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据,其中,所述第一用户交互行为数据为用户对电影的行为操作数据,所述第二用户交互行为数据为用户对影院的行为操作数据;
依据各所述用户基础数据和各所述第一用户交互行为数据,生成各部电影对应的电影画像数据;
依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据;
接收所述用户输入的查找关键词,依据所述查找关键词从所述电影画像数据或所述影院画像数据中提取目标数据。
2.根据权利要求1所述的方法,其特征在于,所述依据各所述用户基础数据和各所述第一用户交互行为数据,生成各部电影对应的电影画像数据的步骤,包括:
针对每条所述第一用户交互行为数据,确定所述第一用户交互行为数据对应的电影和第一交互行为操作;其中,第一交互操作行为包括以下任意之一:购票、浏览、评论以及收藏;
针对各电影,确定所述电影对应的各第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据;
建立所述电影、各所述第一目标用户基础数据以及各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据三者之间的对应关系,生成电影画像数据。
3.根据权利要求1所述的方法,其特征在于,所述依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据的步骤,包括:
针对每条所述第二用户交互行为数据,确定所述第二用户交互行为数据对应的影院和第二交互行为操作;其中,第二交互行为操作包括以下任意之一:购票、购买商品以及浏览;
针对各影院,确定所述影院对应的各第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据;
建立所述影院、各所述第二目标用户基础数据以及各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据三者之间的对应关系,生成影院画像数据。
4.根据权利要求1所述的方法,其特征在于,所述查找关键词包括:年龄范围、性别、职业、爱好、电影名称以及影院名称中的至少之一。
5.根据权利要求1所述的方法,其特征在于,在所述获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据的步骤之前,所述方法还包括:
接收用户输入的账号登录信息;
将所述账号登录信息确定为所述用户的用户基础数据;
检测并记录所述用户的交互行为数据,建立所述用户基础数据与所述用户的交互行为数据之间的对应关系。
6.一种数据提取装置,其特征在于,所述装置包括:
获取模块,用于获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据,其中所述第一用户交互行为数据为用户对电影的行为操作数据,所述第二用户交互行为数据为用户对影院的行为操作数据;
第一生成模块,用于依据各所述用户基础数据和各所述第一用户交互行为数据,生成各部电影对应的电影画像数据;
第二生成模块,用于依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据;
第一接收模块,用于接收所述用户输入的查找关键词,依据所述查找关键词从所述电影画像数据或所述影院画像数据中提取目标数据。
7.根据权利要求6所述的装置,其特征在于,所述第一生成模块包括:
第一确定子模块,用于针对每条所述第一用户交互行为数据,确定所述第一用户交互行为数据对应的电影和第一交互行为操作;其中,第一交互操作行为包括以下任意之一:购票、浏览、评论以及收藏;
第二确定子模块,用于针对各电影,确定所述电影对应的各第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据;
第一建立子模块,用于建立所述电影、各所述第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据三者之间的对应关系,生成电影画像数据。
8.根据权利要求6所述的装置,其特征在于,所述第二生成模块包括:
第三确定子模块,用于针对每条所述第二用户交互行为数据,确定所述第二用户交互行为数据对应的影院和第二交互行为操作;其中,第二交互行为操作包括以下任意之一:购票、购买商品以及浏览;
第四确定子模块,用于针对各影院,确定所述影院对应的各第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据;
第二建立子模块,用于建立所述影院、各所述第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据三者之间的对应关系,生成影院画像数据。
9.根据权利要求6所述的装置,其特征在于,所述查找关键词包括:年龄范围、性别、职业、爱好、电影名称以及影院名称中的至少之一。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二接收模块,用于在所述获取模块获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据之前,接收用户输入的账号登录信息;
确定模块,用于将所述账号登录信息确定为所述用户的用户基础数据;
检测模块,用于检测并记录所述用户的交互行为数据,建立所述用户基础数据与所述用户的交互行为数据之间的对应关系。
CN201810766349.4A 2018-07-12 2018-07-12 一种数据提取方法及装置 Active CN109118270B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810766349.4A CN109118270B (zh) 2018-07-12 2018-07-12 一种数据提取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810766349.4A CN109118270B (zh) 2018-07-12 2018-07-12 一种数据提取方法及装置

Publications (2)

Publication Number Publication Date
CN109118270A true CN109118270A (zh) 2019-01-01
CN109118270B CN109118270B (zh) 2021-04-06

Family

ID=64862692

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810766349.4A Active CN109118270B (zh) 2018-07-12 2018-07-12 一种数据提取方法及装置

Country Status (1)

Country Link
CN (1) CN109118270B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462383A (zh) * 2014-12-10 2015-03-25 山东科技大学 一种基于用户多种行为反馈的电影推荐方法
CN106095839A (zh) * 2016-06-03 2016-11-09 北京网智天元科技股份有限公司 特定观影群体数据的提取及其处理方法
CN106874266A (zh) * 2015-12-10 2017-06-20 中国电信股份有限公司 用户画像方法和用于用户画像的装置
CN106933630A (zh) * 2017-03-09 2017-07-07 百度在线网络技术(北京)有限公司 一种客户端升级方法、装置、设备及存储介质
CN107103485A (zh) * 2017-01-05 2017-08-29 李汉洙 一种根据影院访客信息的自动广告推荐方法和系统
CN107305667A (zh) * 2016-04-18 2017-10-31 滴滴(中国)科技有限公司 基于出行习惯的用户画像获取方法及装置
US20180032621A1 (en) * 2016-08-01 2018-02-01 Yuppr, Inc. Location and social aware, multi-dimensional, dynamic, positive recommendations
CN108021700A (zh) * 2017-12-25 2018-05-11 暴风集团股份有限公司 一种用户标签生成方法、装置及服务器
CN108154401A (zh) * 2018-01-15 2018-06-12 网易无尾熊(杭州)科技有限公司 用户画像刻画方法、装置、介质和计算设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462383A (zh) * 2014-12-10 2015-03-25 山东科技大学 一种基于用户多种行为反馈的电影推荐方法
CN106874266A (zh) * 2015-12-10 2017-06-20 中国电信股份有限公司 用户画像方法和用于用户画像的装置
CN107305667A (zh) * 2016-04-18 2017-10-31 滴滴(中国)科技有限公司 基于出行习惯的用户画像获取方法及装置
CN106095839A (zh) * 2016-06-03 2016-11-09 北京网智天元科技股份有限公司 特定观影群体数据的提取及其处理方法
US20180032621A1 (en) * 2016-08-01 2018-02-01 Yuppr, Inc. Location and social aware, multi-dimensional, dynamic, positive recommendations
CN107103485A (zh) * 2017-01-05 2017-08-29 李汉洙 一种根据影院访客信息的自动广告推荐方法和系统
CN106933630A (zh) * 2017-03-09 2017-07-07 百度在线网络技术(北京)有限公司 一种客户端升级方法、装置、设备及存储介质
CN108021700A (zh) * 2017-12-25 2018-05-11 暴风集团股份有限公司 一种用户标签生成方法、装置及服务器
CN108154401A (zh) * 2018-01-15 2018-06-12 网易无尾熊(杭州)科技有限公司 用户画像刻画方法、装置、介质和计算设备

Also Published As

Publication number Publication date
CN109118270B (zh) 2021-04-06

Similar Documents

Publication Publication Date Title
US20180341907A1 (en) Crowdsourcing techniques for processing product content
US10394841B2 (en) Generating contextual search presentations
CN107315824B (zh) 用于生成热力图的方法和装置
CN103995848B (zh) 图片搜索方法及装置
US20140189476A1 (en) Image manipulation for web content
CN106407210B (zh) 一种业务对象的展示方法和装置
US20080201734A1 (en) Association of Ads With Tagged Audiovisual Content
CN113111026A (zh) 具有共享兴趣的消息的图库
CN104991906B (zh) 信息获取方法、服务器、终端及数据库构建方法、装置
US10685406B1 (en) Systems and methods for providing context to customer activity through a visual representation
US20190303499A1 (en) Systems and methods for determining video content relevance
CN109325179A (zh) 一种内容推广的方法及装置
CN105023178B (zh) 一种基于本体的电子商务推荐方法
US20170308939A1 (en) Digitization of a catalog of retail products
TW201826188A (zh) 資料處理方法及系統
CN102959539B (zh) 一种业务交叉时的项目推荐方法及系统
US20130246166A1 (en) Method for determining an area within a multimedia content element over which an advertisement can be displayed
CN104462590A (zh) 信息搜索方法及装置
CN104185041A (zh) 视频交互广告的自动生成方法和系统
CN108255961A (zh) 街景视频的图像标注方法、终端设备及存储介质
US20120095825A1 (en) Incentive Selection of Region-of-Interest and Advertisements for Image Advertising
CN108460131B (zh) 一种分类标签处理方法及装置
CN109784987A (zh) 一种图片版权收益方法及装置
US20150227970A1 (en) System and method for providing movie file embedded with advertisement movie
CN106250466B (zh) 一种用于提供推荐搜索序列的方法与装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant