CN109118270A

CN109118270A - 一种数据提取方法及装置

Info

Publication number: CN109118270A
Application number: CN201810766349.4A
Authority: CN
Inventors: 张蒙
Original assignee: Beijing Maoyan Cultural Media Co Ltd
Current assignee: Beijing Maoyan Cultural Media Co Ltd
Priority date: 2018-07-12
Filing date: 2018-07-12
Publication date: 2019-01-01
Anticipated expiration: 2038-07-12
Also published as: CN109118270B

Abstract

本发明实施例提供了一种数据提取方法及装置，所述方法包括：获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各用户基础数据对应的第二用户交互行为数据；依据各用户基础数据和各第一用户交互行为数据，生成各部电影对应的电影画像数据；依据各用户基础数据和各第二用户交互行为数据生成各影院对应的影院画像数据；接收用户输入的查找关键词，依据查找关键词从电影画像数据或影院画像数据中提取目标数据。能够依据电影画像数据和影院画像数据提取出精确的数据，方便对电影或影院用户进行运营管理。

Description

一种数据提取方法及装置

技术领域

本发明实施例涉及数据提取技术领域，特别是涉及一种数据提取方法及装置。

背景技术

用户画像是指对于用户基础特征的描述集合。针对电影行业的需求，需要依据用户画像的划分，来查看不同目标(电影、影院等)的受众群体的属性，即不同目标对应不同用户的用户画像。

电影行业经常需要对比两部电影对应的用户画像之间的差别来分析影片反响和票房的结果差别。另外，影院侧也经常需要对自己的用户群体进行更细致的分析和精细化运营。

然而，传统的用户画像仅对于单个维度进行分析预测，即用户的基本属性进行统计分析和预测，由于用户画像的维度单一，使得无法提取精确的数据。

发明内容

本发明提供了一种数据提取方法及装置，以解决现有技术中由于数据总和的维度单一，使得无法提取精确的数据的问题。

为了解决上述问题，本发明公开了一种数据提取方法，所述方法包括：获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据，其中，所述第一用户交互行为数据为用户对电影的行为操作数据，所述第二用户交互行为数据为用户对影院的行为操作数据；依据各所述用户基础数据和各所述第一用户交互行为数据，生成各部电影对应的电影画像数据；依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据；接收所述用户输入的查找关键词，依据所述查找关键词从所述电影画像数据或所述影院画像数据中提取目标数据。

优选地，所述依据各所述用户基础数据和各所述第一用户交互行为数据，生成各部电影对应的电影画像数据的步骤，包括：针对每条所述第一用户交互行为数据，确定所述第一用户交互行为数据对应的电影和第一交互行为操作；其中，第一交互操作行为包括以下任意之一：购票、浏览、评论以及收藏；针对各电影，确定所述电影对应的各第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据；建立所述电影、各所述第一目标用户基础数据以及各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据三者之间的对应关系，生成电影画像数据。

优选地，所述依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据的步骤，包括：针对每条所述第二用户交互行为数据，确定所述第二用户交互行为数据对应的影院和第二交互行为操作；其中，第二交互行为操作包括以下任意之一：购票、购买商品以及浏览；针对各影院，确定所述影院对应的各第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据；建立所述影院、各所述第二目标用户基础数据以及各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据三者之间的对应关系，生成影院画像数据。

优选地，所述查找关键词包括：年龄范围、性别、职业、爱好、电影名称以及影院名称中的至少之一。

优选地，在所述获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据的步骤之前，所述方法还包括：接收用户输入的账号登录信息；将所述账号登录信息确定为所述用户的用户基础数据；检测并记录所述用户的交互行为数据，建立所述用户基础数据与所述用户的交互行为数据之间的对应关系。

本发明还公开了一种数据提取装置，所述装置包括：获取模块，用于获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据，其中所述第一用户交互行为数据为用户对电影的行为操作数据，所述第二用户交互行为数据为用户对影院的行为操作数据；第一生成模块，用于依据各所述用户基础数据和各所述第一用户交互行为数据，生成各部电影对应的电影画像数据；第二生成模块，用于依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据；第一接收模块，用于接收所述用户输入的查找关键词，依据所述查找关键词从所述电影画像数据或所述影院画像数据中提取目标数据。

优选地，所述第一生成模块包括：第一确定子模块，用于针对每条所述第一用户交互行为数据，确定所述第一用户交互行为数据对应的电影和第一交互行为操作；其中，第一交互操作行为包括以下任意之一：购票、浏览、评论以及收藏；第二确定子模块，用于针对各电影，确定所述电影对应的各第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据；第一建立子模块，用于建立所述电影、各所述第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据三者之间的对应关系，生成电影画像数据。

优选地，所述第二生成模块包括：第三确定子模块，用于针对每条所述第二用户交互行为数据，确定所述第二用户交互行为数据对应的影院和第二交互行为操作；其中，第二交互行为操作包括以下任意之一：购票、购买商品以及浏览；第四确定子模块，用于针对各影院，确定所述影院对应的各第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据；第二建立子模块，用于建立所述影院、各所述第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据三者之间的对应关系，生成影院画像数据。

优选地，所述装置还包括：第二接收模块，用于在所述获取模块获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据之前，接收用户输入的账号登录信息；确定模块，用于将所述账号登录信息确定为所述用户的用户基础数据；检测模块，用于检测并记录所述用户的交互行为数据，建立所述用户基础数据与所述用户的交互行为数据之间的对应关系

与现有技术相比，本发明具有以下优点：通过获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各用户基础数据对应的第二用户交互行为数据；依据各用户基础数据和各第一用户交互行为数据，生成各部电影对应的电影画像数据，依据各用户基础数据和各第二用户交互行为数据，生成各影院对应的影院画像数据；接收用户输入的查找关键词，依据查找关键词从电影画像数据或影院画像数据中提取目标数据，基于两个维度，用户基础数据和用户基础数据对应的第一用户交互行为数据和第二用户交互行为数据，生成各部电影对应的电影画像数据和各影院对应的影院画像数据，能够依据电影画像数据和影院画像数据提取出精确的数据，方便对电影或影院用户进行运营管理。

附图说明

图1是本发明实施例一的一种数据提取方法的步骤流程图；

图2是本发明实施例二的一种数据提取方法的步骤流程图；

图3是本发明实施例三的一种数据提取装置的结构框图；

图4是本发明实施例四的一种数据提取装置的结构框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例一

参照图1，示出了本发明实施例一的一种数据提取方法的步骤流程图。

本发明实施例提供的数据提取方法包括以下步骤：

步骤101：获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各用户基础数据对应的第二用户交互行为数据。

其中，第一用户交互行为数据为用户对电影的行为操作数据，第二用户交互行为数据为用户对影院的行为操作数据。

获取基于电影应用程序的用户基础数据以及用户在影院购票时所提供的数据，作为用户基础数据，其中，用户基础数据包括以下至少之一：用户年龄、用户所在城市、用户职业以及用户爱好等。

第一用户交互行为数据可以为用户对某电影的浏览操作、购买操作、评分操作以及收藏操作等。

第二用户交互行为数据可以为用户对某影院的浏览操作，用户在该影院下的购票操作，用户在该影院下购买商品的操作以及购票是距离影院的距离等。

步骤102：依据各用户基础数据和各第一用户交互行为数据，生成各部电影对应的电影画像数据。

例如：获取A用户和B用户的用户基础数据、A用户对1号电影的预览操作、B用户对1号电影的收藏操作，生成的各部电影对应的电影画像数据为1号电影对应A用户和B用户，且A用户对1号电影的第一用户交互行为数据为预览，B用户对1号电影的第一用户交互行为数据为收藏。

步骤103：依据各用户基础数据和各第二用户交互行为数据生成各影院对应的影院画像数据。

例如：获取A用户和B用户的用户基础数据，A用户在C影院进行购票，B用户在C影院购买商品，则C影院对应的影院画像数据为：C影院对应A用户和B用户，且A用户对C影院的第二用户交互行为数据为购票，B用户对C影院的第二用户交互行为数据为购买商品。

步骤104：接收用户输入的查找关键词，依据查找关键词从电影画像数据或影院画像数据中提取目标数据。

针对电影画像数据或影院画像数据，接收用户输入的查找关键词，例如：用户输入对于1号电影的收藏，即如步骤102中，则目标数据为B用户。

与现有技术相比，本发明具有以下优点：通过获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各用户基础数据对应的第二用户交互行为数据；依据各用户基础数据和各第一用户交互行为数据，生成各部电影对应的电影画像数据，依据各用户基础数据和各第二用户交互行为数据，生成各影院对应的影院画像数据；接收用户输入的查找关键词，依据查找关键词从电影画像数据或影院画像数据中提取目标数据，基于两个维度，用户基础数据和用户基础数据对应的第一用户交互行为数据以及第二用户交互行为数据，生成各部电影对应的电影画像数据和各影院对应的影院画像数据，能够依据电影画像数据和影院画像数据提取出精确的数据，方便对电影或影院用户进行运营管理。

实施例二

参照图2，示出本发明实施例二的一种数据提取方法的步骤流程图。

本发明实施例提供的数据提取方法包括以下步骤：

步骤201：接收用户输入的账号登录信息。

步骤202：将账号登录信息确定为用户的用户基础数据。

接收各用户在电影应用程序上的账号登陆信息，依据各用户的账号登陆信息，获取各账号信息对应的用户基础数据，其中，用户基础数据包括但不限于用户年龄、用户所在城市、用户职业以及用户爱好等。

步骤203：检测并记录用户的交互行为数据，建立用户基础数据与用户的交互行为数据之间的对应关系。

在预设时长内，检测并记录用户的交互行为数据，并建立用户基础数据和用户的交互行为数据之间的对应关系。例如：在一个月之内，检测用户对各影院下各电影的交互行为数据，其中交互行为数据包括但不限于：对应的电影选择操作、对电影的预览操作、电影的购票操作、电影的收藏操作、对电影的评分操作以及对电影的评论操作等。

需要说明的是，本领域技术人员可以根据实际情况对预设时长进行设置，可以设置为一周、一个月、两个月等，本发明实施例对预设时长不作具体限制。

步骤204：获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各用户基础数据对应的第二用户交互行为数据。

步骤205：针对每条第一用户交互行为数据，确定第一用户交互行为数据对应的电影和第一交互行为操作。

其中，第一交互操作行为包括以下任意之一：对电影的购票操作、对电影的浏览操作、对电影的评论操作以及对电影的收藏操作。

步骤206：针对各电影，确定电影对应的各第一目标用户基础数据、和各第一目标用户基础数据对应的电影的第一用户交互行为数据。

步骤207：建立电影、各第一目标用户基础数据以及各第一目标用户基础数据对应的电影的第一用户交互行为数据三者之间的对应关系，生成电影画像数据。

步骤208：针对每条第二用户交互行为数据，确定第二用户交互行为数据对应的影院和第二交互行为操作。

其中，第二交互行为操作包括以下任意之一：在影院的购票操作、在影院的购买商品操作以及对影院的浏览操作。

步骤209：针对各影院，确定影院对应的各第二目标用户基础数据、和各第二目标用户基础数据对应的影院的第二用户交互行为数据。

步骤210：建立影院、各第二目标用户基础数据以及各第二目标用户基础数据对应的影院的第二用户交互行为数据三者之间的对应关系，生成影院画像数据。

步骤211：接收用户输入的查找关键词，依据查找关键词从电影画像数据或影院画像数据中提取目标数据。

查找关键词包括：年龄范围、性别、职业、爱好、电影名称以及影院名称中的至少之一。

实施例三

参照图3，示出本发明实施例三的一种数据提取装置的结构框图。

本发明实施例提供的数据提取装置包括：获取模块301，用于获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据，其中所述第一用户交互行为数据为用户对电影的行为操作数据，所述第二用户交互行为数据为用户对影院的行为操作数据；第一生成模块302，用于依据各所述用户基础数据和各所述第一用户交互行为数据，生成各部电影对应的电影画像数据；第二生成模块303，用于依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据；第一接收模块304，用于接收所述用户输入的查找关键词，依据所述查找关键词从所述电影画像数据或所述影院画像数据中提取目标数据。

实施例四

参照图4，示出本发明实施例四的一种数据提取装置的结构框图。

本发明实施例提供的数据提取装置包括：获取模块401，用于获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据，其中所述第一用户交互行为数据为用户对电影的行为操作数据，所述第二用户交互行为数据为用户对影院的行为操作数据；第一生成模块402，用于依据各所述用户基础数据和各所述第一用户交互行为数据，生成各部电影对应的电影画像数据；第二生成模块403，用于依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据；第一接收模块404，用于接收所述用户输入的查找关键词，依据所述查找关键词从所述电影画像数据或所述影院画像数据中提取目标数据。

优选地，所述第一生成模块402包括：第一确定子模块4021，用于针对每条所述第一用户交互行为数据，确定所述第一用户交互行为数据对应的电影和第一交互行为操作；其中，第一交互操作行为包括以下任意之一：购票、浏览、评论以及收藏；第二确定子模块4022，用于针对各电影，确定所述电影对应的各第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据；第一建立子模块4023，用于建立所述电影、各所述第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据三者之间的对应关系，生成电影画像数据。

优选地，所述第二生成模块403包括：第三确定子模块4031，用于针对每条所述第二用户交互行为数据，确定所述第二用户交互行为数据对应的影院和第二交互行为操作；其中，第二交互行为操作包括以下任意之一：购票、购买商品以及浏览；第四确定子模块4032，用于针对各影院，确定所述影院对应的各第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据；第二建立子模块4033，用于建立所述影院、各所述第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据三者之间的对应关系，生成影院画像数据。

优选地，所述装置还包括：第二接收模块405，用于在所述获取模块401获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据之前，接收用户输入的账号登录信息；确定模块406，用于将所述账号登录信息确定为所述用户的用户基础数据；检测模块407，用于检测并记录所述用户的交互行为数据，建立所述用户基础数据与所述用户的交互行为数据之间的对应关系。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于系统实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上对本发明所提供的一种数据提取方法和装置，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种数据提取方法，其特征在于，所述方法包括：

获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据，其中，所述第一用户交互行为数据为用户对电影的行为操作数据，所述第二用户交互行为数据为用户对影院的行为操作数据；

依据各所述用户基础数据和各所述第一用户交互行为数据，生成各部电影对应的电影画像数据；

依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据；

接收所述用户输入的查找关键词，依据所述查找关键词从所述电影画像数据或所述影院画像数据中提取目标数据。

2.根据权利要求1所述的方法，其特征在于，所述依据各所述用户基础数据和各所述第一用户交互行为数据，生成各部电影对应的电影画像数据的步骤，包括：

针对每条所述第一用户交互行为数据，确定所述第一用户交互行为数据对应的电影和第一交互行为操作；其中，第一交互操作行为包括以下任意之一：购票、浏览、评论以及收藏；

针对各电影，确定所述电影对应的各第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据；

建立所述电影、各所述第一目标用户基础数据以及各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据三者之间的对应关系，生成电影画像数据。

3.根据权利要求1所述的方法，其特征在于，所述依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据的步骤，包括：

针对每条所述第二用户交互行为数据，确定所述第二用户交互行为数据对应的影院和第二交互行为操作；其中，第二交互行为操作包括以下任意之一：购票、购买商品以及浏览；

针对各影院，确定所述影院对应的各第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据；

建立所述影院、各所述第二目标用户基础数据以及各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据三者之间的对应关系，生成影院画像数据。

4.根据权利要求1所述的方法，其特征在于，所述查找关键词包括：年龄范围、性别、职业、爱好、电影名称以及影院名称中的至少之一。

5.根据权利要求1所述的方法，其特征在于，在所述获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据的步骤之前，所述方法还包括：

接收用户输入的账号登录信息；

将所述账号登录信息确定为所述用户的用户基础数据；

检测并记录所述用户的交互行为数据，建立所述用户基础数据与所述用户的交互行为数据之间的对应关系。

6.一种数据提取装置，其特征在于，所述装置包括：

获取模块，用于获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据，其中所述第一用户交互行为数据为用户对电影的行为操作数据，所述第二用户交互行为数据为用户对影院的行为操作数据；

第一生成模块，用于依据各所述用户基础数据和各所述第一用户交互行为数据，生成各部电影对应的电影画像数据；

第二生成模块，用于依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据；

第一接收模块，用于接收所述用户输入的查找关键词，依据所述查找关键词从所述电影画像数据或所述影院画像数据中提取目标数据。

7.根据权利要求6所述的装置，其特征在于，所述第一生成模块包括：

第一确定子模块，用于针对每条所述第一用户交互行为数据，确定所述第一用户交互行为数据对应的电影和第一交互行为操作；其中，第一交互操作行为包括以下任意之一：购票、浏览、评论以及收藏；

第二确定子模块，用于针对各电影，确定所述电影对应的各第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据；

第一建立子模块，用于建立所述电影、各所述第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据三者之间的对应关系，生成电影画像数据。

8.根据权利要求6所述的装置，其特征在于，所述第二生成模块包括：

第三确定子模块，用于针对每条所述第二用户交互行为数据，确定所述第二用户交互行为数据对应的影院和第二交互行为操作；其中，第二交互行为操作包括以下任意之一：购票、购买商品以及浏览；

第四确定子模块，用于针对各影院，确定所述影院对应的各第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据；

第二建立子模块，用于建立所述影院、各所述第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据三者之间的对应关系，生成影院画像数据。

9.根据权利要求6所述的装置，其特征在于，所述查找关键词包括：年龄范围、性别、职业、爱好、电影名称以及影院名称中的至少之一。

10.根据权利要求6所述的装置，其特征在于，所述装置还包括：

第二接收模块，用于在所述获取模块获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据之前，接收用户输入的账号登录信息；

确定模块，用于将所述账号登录信息确定为所述用户的用户基础数据；

检测模块，用于检测并记录所述用户的交互行为数据，建立所述用户基础数据与所述用户的交互行为数据之间的对应关系。