CN110287255A - 基于用户行为的数据共享方法、装置及计算机设备 - Google Patents
基于用户行为的数据共享方法、装置及计算机设备 Download PDFInfo
- Publication number
- CN110287255A CN110287255A CN201910433478.6A CN201910433478A CN110287255A CN 110287255 A CN110287255 A CN 110287255A CN 201910433478 A CN201910433478 A CN 201910433478A CN 110287255 A CN110287255 A CN 110287255A
- Authority
- CN
- China
- Prior art keywords
- keyword
- data
- value
- user behavior
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于用户行为的数据共享方法、装置、计算机设备及存储介质。该方法包括:接收用户业务数据,对用户业务数据进行解析,得到解析数据;获取解析数据中的用户行为字段值和共享控制字段值;若共享控制字段值为表示允许共享的数值,获取用户行为字段值,并获取用户行为字段值对应的关键词组合;获取关键词组合中的各关键词,根据预设的关键词转化策略,获取与关键词组合中每一关键词对应的分发对象;以及将解析数据对应的用户业务数据发送至与关键词组合中每一关键词对应的分发对象。该方法采用用户行为画像技术,实现了根据用户行为数据有效的将用户信息在同一平台的数据共享,提高数据的利用率,避免数据孤岛现象。
Description
技术领域
本发明涉及用户行为分析技术领域,尤其涉及一种基于用户行为的数据共享方法、装置及计算机设备。
背景技术
目前,针对某一APP应用程序的用户进行行为分析时,一般是基于该APP应用程序采集到的用户数据和行为数据。但是一个企业若开发了多款APP应用程序,相互之间的用户数据是未实现有效共享,这就导致数据的利用率低下。
发明内容
本发明实施例提供了一种基于用户行为的数据共享方法、装置、计算机设备及存储介质,旨在解决现有技术中同一企业若开发了多款APP应用程序,相互之间的用户数据是未实现有效共享,这就导致数据的利用率低下的问题。
第一方面,本发明实施例提供了一种基于用户行为的数据共享方法,其包括:
接收用户业务数据,对所述用户业务数据进行解析,得到解析数据;
获取所述解析数据中的用户行为字段值和共享控制字段值;
若所述共享控制字段值为表示允许共享的数值,获取所述用户行为字段值,并获取所述用户行为字段值对应的关键词组合;
获取关键词组合中的各关键词,根据预设的关键词转化策略,获取与所述关键词组合中每一关键词对应的分发对象;以及
将所述解析数据对应的用户业务数据发送至与所述关键词组合中每一关键词对应的分发对象。
第二方面,本发明实施例提供了一种基于用户行为的数据共享装置,其包括:
业务数据解析单元,用于接收用户业务数据,对所述用户业务数据进行解析,得到解析数据;
指定字段值获取单元,用于获取所述解析数据中的用户行为字段值和共享控制字段值;
关键词组合获取单元,用于若所述共享控制字段值为表示允许共享的数值,获取所述用户行为字段值,并获取所述用户行为字段值对应的关键词组合;
分发对象获取单元,用于获取关键词组合中的各关键词,根据预设的关键词转化策略,获取与所述关键词组合中每一关键词对应的分发对象;以及
分发单元,用于将所述解析数据对应的用户业务数据发送至与所述关键词组合中每一关键词对应的分发对象。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于用户行为的数据共享方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于用户行为的数据共享方法。
本发明实施例提供了一种基于用户行为的数据共享方法、装置、计算机设备及存储介质。该方法包括接收用户业务数据,对所述用户业务数据进行解析,得到解析数据;获取所述解析数据中的用户行为字段值和共享控制字段值;若所述共享控制字段值为表示允许共享的数值,获取所述用户行为字段值,并获取所述用户行为字段值对应的关键词组合;获取关键词组合中的各关键词,根据预设的关键词转化策略,获取与所述关键词组合中每一关键词对应的分发对象;以及将所述解析数据对应的用户业务数据发送至与所述关键词组合中每一关键词对应的分发对象。该方法采用用户行为画像技术,实现了根据用户行为数据有效的将用户信息在同一平台的数据共享,提高数据的利用率,避免数据孤岛现象。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于用户行为的数据共享方法的应用场景示意图;
图2为本发明实施例提供的基于用户行为的数据共享方法的流程示意图;
图3为本发明实施例提供的基于用户行为的数据共享方法的子流程示意图;
图4为本发明实施例提供的基于用户行为的数据共享方法的另一子流程示意图;
图5为本发明实施例提供的基于用户行为的数据共享方法的另一子流程示意图;
图6为本发明实施例提供的基于用户行为的数据共享装置的示意性框图;
图7为本发明实施例提供的基于用户行为的数据共享装置的子单元示意性框图;
图8为本发明实施例提供的基于用户行为的数据共享装置的另一子单元示意性框图;
图9为本发明实施例提供的基于用户行为的数据共享装置的另一子单元示意性框图;
图10为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本发明实施例提供的基于用户行为的数据共享方法的应用场景示意图,图2为本发明实施例提供的基于用户行为的数据共享方法的流程示意图,该基于用户行为的数据共享方法应用于服务器中,该方法通过安装于服务器中的应用软件进行执行。
如图2所示,该方法包括步骤S110~S150。
S110、接收用户业务数据,对所述用户业务数据进行解析,得到解析数据。
在本实施例中,是站在服务器的角度描述技术方案。服务器可以理解为一数据共享平台,该数据共享平台用来接收各业务服务器上传的业务数据,例如一个集团公司包括多个业务子公司,各业务子公司开发了各自的APP应用程序,用户在使用这些APP应用程序时会产生大量用户业务数据,这些用户业务数据是先上传至对应的业务服务器,再由各业务服务器上传至服务器。
目前,各业务子公司的用户业务数据是相互孤立的,只是在本业务子公司内部进行用户行为分析使用,而未有效的挖掘出能对其他业务子公司产生新业务的用户业务数据,在合法合规的前提下未能充分实现用户信息的共享。为了实现对各业务子公司的用户业务数据的共享,可由服务器接收用户业务数据,对所述用户业务数据进行解析,得到解析数据,通过对解析数据进行分析后,确定是否可以挖掘出共享数据。
在本实施例中,如图3所示,步骤S110包括:
S111、识别所述用户业务数据中用于标识用户身份识别的第一字段、用于表示用户行为的第二字段、用于共享控制的第三字段;
S112、获取所述第一字段对应的第一取值、获取所述第二字段对应的第二取值、及获取所述第三字段对应的第三取值,由所述第一取值、第二取值及第三取值组成解析数据。
在本实施例中,当数据共享平台采集了各业务子公司的数据库上传的用户业务数据后,需对用户业务数据进行解析,获取其中的关键信息。
对所述用户业务数据进行解析,主要是对所述用户业务数据中的用户身份标识字段(可抽象为第一字段)、及用户行为字段(可抽象为第二字段)、及数据是否可共享的共享控制字段(可抽象为第三字段)进行提取,以得到解析数据。
例如,各业务服务器上传至服务器的用户业务数据表1:
表1
服务器中通过对每一条用户业务数据均能实现有效解析,以得到由所述第一取值、第二取值及第三取值组成解析数据。
在一实施例中,如图4所示,步骤S112包括:
S1121、获取与所述第二字段对应的业务操作轨迹日志,将所述业务操作轨迹日志通过基于概率统计分词模型进行分词,得到与业务操作轨迹日志对应的分词结果;
S1122、通过词频-逆文本频率指数模型,抽取所述分词结果中位于预设的第一排名值之前的关键词,组成关键词组合以作为业务操作轨迹日志对应的用户行为字段值。
在本实施例中,用户行为这一字段具体取值的产生,可以是数据共享平台采集了某条用户业务数据后,根据用户的业务操作轨迹日志提取关键词而得到。
例如,用户1(张三)登录了APP应用程序后,进行的业务操作轨迹日志为:1、转账给用户31万元;2、查看基金产品。此时,数据共享平台在对该业务操作轨迹日志进行关键词提取后,即可获取用户行为字段值。
更具体的,由业务操作轨迹日志获取用户行为字段值时,可以先将业务操作轨迹日志通过基于概率统计分词模型进行分词,得到与业务操作轨迹日志对应的分词结果,然后采用词频-逆文本频率指数模型(即TF-IDF模型,TF-IDF是Term Frequency–InverseDocument Frequency的简写)抽取所述分词结果中位于所述第一排名值之前的关键词信息,以作为业务操作轨迹对应的用户行为字段值。
通过TF-IDF模型抽取所述分词结果中位于预设的排名值之前的关键词信息,具体如下:
a)计算分词结果中每一分词i的词频,记为TFi;
b)计算分词结果中每一分词i的逆文档频率IDFi;
在计算每一分词i的逆文档频率IDFi时,需要一个语料库(与分词过程中的字典类似),用来模拟语言的使用环境;
逆文档频率IDFi=lg[语料库的文档总数/(包含该分词的文档数+1)];
如果一个词越常见,那么分母就越大,逆文档频率就越小越接近0。分母之所以要加1,是为了避免分母为0(即所有文档都不包含该词)。
c)根据TFi*IDFi计算分词结果中每一分词i对应的词频-逆文本频率指数TF-IDFi;
显然,TF-IDF与一个词在文档中的出现次数成正比,与该词在整个语言中的出现次数成反比。所以,自动提取关键词即是计算出文档的每个分词的TF-IDF值,然后按降序排列,取排在前N位的词作为对应的用户行为字段值。
d)将分词结果中每一分词对应的词频-逆文本频率指数按降序排序,取排名位于预设的第一排名值之前(例如预设的第一排名值为4)的分词组成用户行为字段值。
S120、获取所述解析数据中的用户行为字段值和共享控制字段值。
在本实施例中,当数据共享平台获取了用户业务数据并解析得到了对应的解析数据后,需先判断其中的共享控制字段是否为表示允许共享的数值(例如,共享控制字段取值为1时表示数据可共享,共享控制字段取值为0时表示数据不可共享),若共享控制字段值是表示允许共享的数值,则可继续分析用户行为字段值。
S130、若所述共享控制字段值为表示允许共享的数值,获取所述用户行为字段值,并获取所述用户行为字段值对应的关键词组合。
在本实施例中,例如数据共享平台获取了表1中序号1对应张三的用户业务数据,其中共享控制字段为1,表示张三的用户业务数据可以共享至其他业务子公司,为了精准的将该用户业务数据分享至相关性较强的业务子公司,此时可以分析所述用户行为字段值,具体获取所述用户行为字段值对应的关键词组合,例如转账+基金组成的关键词组合,此时对该条用户业务数据进行共享时,需分析转账对应哪一业务子公司,基金对应哪一业务子公司;当分析完成时,即可根据该关键词组合确定该条用户业务数据对应的分发对象。
S140、获取关键词组合中的各关键词,根据预设的关键词转化策略,获取与所述关键词组合中每一关键词对应的分发对象。
在一实施例中,如图5所示,步骤S140包括:
S141、依序获取所述关键词组合中每一关键词;
S142、若各关键词在所述关键词转化策略中存在对应的转化项,获取每一关键词对应的转化项中对应的分发对象。
在本实施例中,预先设置的关键词转化策略是查询与关键词对应的分发对象(业务子公司名称)的策略表,具体如下表2:
关键词 | 分发对象 |
转账 | 子公司1 |
查询余额 | 子公司1 |
基金 | 子公司2 |
…… | …… |
车险 | 子公司3 |
表2
当获知了某一用户业务数据对应的关键词组合后,即可判断该关键词组合中每一关键词在所述关键词转化策略中是否存在对应的转化项,若有关键词在所述关键词转化策略中存在对应的转化项,获取该关键词对应的转化项中对应的分发对象,即实现了根据关键词组合中的关键词确定该条用户业务数据对应的分发对象,实现了分发对象的自动获取。
S150、将所述解析数据对应的用户业务数据发送至与所述关键词组合中每一关键词对应的分发对象。
在本实施例中,当确定了所述用户业务数据的分发对象后,即可将所述用户业务数据发送至与所述关键词组合中每一关键词对应的分发对象,当分发对象接收了用户业务数据后,即可根据其中用户的电话号码与用户建立联系,提高了用户业务数据的利用率。
在一实施例中,步骤S150之前还包括:
创建与所述分发对象一一对应的数据表,将所述用户业务数据写入与所述分发对象一一对应的数据表。
在本实施例中,当服务器确定了某一条用户业务数据对应的分发对象后,可创建与所述分发对象个数相同且一一对应的数据表,然后将该用户业务数据写入到每一分发对象的用户的数据表中。当服务器完成了对多条用户业务数据(例如1万条用户业务数据)的分发对象的确定后,即可将每一用户业务数据写入对应的分发对象的数据表,之后将各分发对象一一对应的数据表发送至对应的分发对象即可。
该方法实现了根据用户行为数据有效的将用户信息在同一平台的数据共享,提高数据的利用率,避免数据孤岛现象。
本发明实施例还提供一种基于用户行为的数据共享装置,该基于用户行为的数据共享装置用于执行前述基于用户行为的数据共享方法的任一实施例。具体地,请参阅图6,图6是本发明实施例提供的基于用户行为的数据共享装置的示意性框图。该基于用户行为的数据共享装置100可以配置于服务器中。
如图6所示,基于用户行为的数据共享装置100包括业务数据解析单元110、指定字段值获取单元120、关键词组合获取单元130、分发对象获取单元140、分发单元150。
业务数据解析单元110,用于接收用户业务数据,对所述用户业务数据进行解析,得到解析数据。
在本实施例中,是站在服务器的角度描述技术方案。服务器可以理解为一数据共享平台,该数据共享平台用来接收各业务服务器上传的业务数据,例如一个集团公司包括多个业务子公司,各业务子公司开发了各自的APP应用程序,用户在使用这些APP应用程序时会产生大量用户业务数据,这些用户业务数据是先上传至对应的业务服务器,再由各业务服务器上传至服务器。
目前,各业务子公司的用户业务数据是相互孤立的,只是在本业务子公司内部进行用户行为分析使用,而未有效的挖掘出能对其他业务子公司产生新业务的用户业务数据,在合法合规的前提下未能充分实现用户信息的共享。为了实现对各业务子公司的用户业务数据的共享,可由服务器接收用户业务数据,对所述用户业务数据进行解析,得到解析数据,通过对解析数据进行分析后,确定是否可以挖掘出共享数据。
在本实施例中,如图7所示,业务数据解析单元110包括:
字段定位单元111,用于识别所述用户业务数据中用于标识用户身份识别的第一字段、用于表示用户行为的第二字段、用于共享控制的第三字段;
字段取值获取单元112,用于获取所述第一字段对应的第一取值、获取所述第二字段对应的第二取值、及获取所述第三字段对应的第三取值,由所述第一取值、第二取值及第三取值组成解析数据。
在本实施例中,当数据共享平台采集了各业务子公司的数据库上传的用户业务数据后,需对用户业务数据进行解析,获取其中的关键信息。
对所述用户业务数据进行解析,主要是对所述用户业务数据中的用户身份标识字段(可抽象为第一字段)、及用户行为字段(可抽象为第二字段)、及数据是否可共享的共享控制字段(可抽象为第三字段)进行提取,以得到解析数据。服务器中通过对每一条用户业务数据均能实现有效解析,以得到由所述第一取值、第二取值及第三取值组成解析数据。
在一实施例中,如图8所示,字段取值获取单元112包括:
分词单元1121,用于获取与所述第二字段对应的业务操作轨迹日志,将所述业务操作轨迹日志通过基于概率统计分词模型进行分词,得到与业务操作轨迹日志对应的分词结果;
关键词组合获取单元1122,用于通过词频-逆文本频率指数模型,抽取所述分词结果中位于预设的第一排名值之前的关键词,组成关键词组合以作为业务操作轨迹日志对应的用户行为字段值。
在本实施例中,用户行为这一字段具体取值的产生,可以是数据共享平台采集了某条用户业务数据后,根据用户的业务操作轨迹日志提取关键词而得到。
例如,用户1(张三)登录了APP应用程序后,进行的业务操作轨迹日志为:1、转账给用户31万元;2、查看基金产品。此时,数据共享平台在对该业务操作轨迹日志进行关键词提取后,即可获取用户行为字段值。
更具体的,由业务操作轨迹日志获取用户行为字段值时,可以先将业务操作轨迹日志通过基于概率统计分词模型进行分词,得到与业务操作轨迹日志对应的分词结果,然后采用词频-逆文本频率指数模型(即TF-IDF模型,TF-IDF是Term Frequency–InverseDocument Frequency的简写)抽取所述分词结果中位于所述第一排名值之前的关键词信息,以作为业务操作轨迹对应的用户行为字段值。
指定字段值获取单元120,用于获取所述解析数据中的用户行为字段值和共享控制字段值。
在本实施例中,当数据共享平台获取了用户业务数据并解析得到了对应的解析数据后,需先判断其中的共享控制字段是否为表示允许共享的数值(例如,共享控制字段取值为1时表示数据可共享,共享控制字段取值为0时表示数据不可共享),若共享控制字段值是表示允许共享的数值,则可继续分析用户行为字段值。
关键词组合获取单元130,用于若所述共享控制字段值为表示允许共享的数值,获取所述用户行为字段值,并获取所述用户行为字段值对应的关键词组合。
在本实施例中,例如数据共享平台获取了表1中序号1对应张三的用户业务数据,其中共享控制字段为1,表示张三的用户业务数据可以共享至其他业务子公司,为了精准的将该用户业务数据分享至相关性较强的业务子公司,此时可以分析所述用户行为字段值,具体获取所述用户行为字段值对应的关键词组合,例如转账+基金组成的关键词组合,此时对该条用户业务数据进行共享时,需分析转账对应哪一业务子公司,基金对应哪一业务子公司;当分析完成时,即可根据该关键词组合确定该条用户业务数据对应的分发对象。
分发对象获取单元140,用于获取关键词组合中的各关键词,根据预设的关键词转化策略,获取与所述关键词组合中每一关键词对应的分发对象。
在一实施例中,如图9所示,分发对象获取单元140包括:
转化项获取单元141,用于依序获取所述关键词组合中每一关键词;
转化项解析单元142,用于若各关键词在所述关键词转化策略中存在对应的转化项,获取每一关键词对应的转化项中对应的分发对象。
在本实施例中,预先设置的关键词转化策略是查询与关键词对应的分发对象(业务子公司名称)的策略表。当获知了某一用户业务数据对应的关键词组合后,即可判断该关键词组合中每一关键词在所述关键词转化策略中是否存在对应的转化项,若有关键词在所述关键词转化策略中存在对应的转化项,获取该关键词对应的转化项中对应的分发对象,即实现了根据关键词组合中的关键词确定该条用户业务数据对应的分发对象,实现了分发对象的自动获取。
分发单元150,用于将所述解析数据对应的用户业务数据发送至与所述关键词组合中每一关键词对应的分发对象。
在本实施例中,当确定了所述用户业务数据的分发对象后,即可将所述用户业务数据发送至与所述关键词组合中每一关键词对应的分发对象,当分发对象接收了用户业务数据后,即可根据其中用户的电话号码与用户建立联系,提高了用户业务数据的利用率。
在一实施例中,基于用户行为的数据共享装置100还包括:
数据表写入单元,用于创建与所述分发对象一一对应的数据表,将所述用户业务数据写入与所述分发对象一一对应的数据表。
在本实施例中,当服务器确定了某一条用户业务数据对应的分发对象后,可创建与所述分发对象个数相同且一一对应的数据表,然后将该用户业务数据写入到每一分发对象的用户的数据表中。当服务器完成了对多条用户业务数据(例如1万条用户业务数据)的分发对象的确定后,即可将每一用户业务数据写入对应的分发对象的数据表,之后将各分发对象一一对应的数据表发送至对应的分发对象即可。
该装置实现了根据用户行为数据有效的将用户信息在同一平台的数据共享,提高数据的利用率,避免数据孤岛现象。
上述基于用户行为的数据共享装置可以实现为计算机程序的形式,该计算机程序可以在如图10所示的计算机设备上运行。
请参阅图10,图10是本发明实施例提供的计算机设备的示意性框图。该计算机设备500是服务器,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图10,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行基于用户行为的数据共享方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行基于用户行为的数据共享方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图10中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下功能:接收用户业务数据,对所述用户业务数据进行解析,得到解析数据;获取所述解析数据中的用户行为字段值和共享控制字段值;若所述共享控制字段值为表示允许共享的数值,获取所述用户行为字段值,并获取所述用户行为字段值对应的关键词组合;获取关键词组合中的各关键词,根据预设的关键词转化策略,获取与所述关键词组合中每一关键词对应的分发对象;以及将所述解析数据对应的用户业务数据发送至与所述关键词组合中每一关键词对应的分发对象。
在一实施例中,处理器502在执行所述对所述用户业务数据进行解析,得到解析数据的步骤时,执行如下操作:识别所述用户业务数据中用于标识用户身份识别的第一字段、用于表示用户行为的第二字段、用于共享控制的第三字段;获取所述第一字段对应的第一取值、获取所述第二字段对应的第二取值、及获取所述第三字段对应的第三取值,由所述第一取值、第二取值及第三取值组成解析数据。
在一实施例中,处理器502在执行所述获取所述第二字段对应的第二取值的步骤时,执行如下操作:获取与所述第二字段对应的业务操作轨迹日志,将所述业务操作轨迹日志通过基于概率统计分词模型进行分词,得到与业务操作轨迹日志对应的分词结果;通过词频-逆文本频率指数模型,抽取所述分词结果中位于预设的第一排名值之前的关键词,组成关键词组合以作为业务操作轨迹日志对应的用户行为字段值。
在一实施例中,处理器502在执行所述根据预设的关键词转化策略,获取与所述关键词组合中每一关键词对应的分发对象的步骤时,执行如下操作:依序获取所述关键词组合中每一关键词;若各关键词在所述关键词转化策略中存在对应的转化项,获取每一关键词对应的转化项中对应的分发对象。
在一实施例中,处理器502在执行所述将所述解析数据对应的用户业务数据发送至与所述关键词组合中每一关键词对应的分发对象的步骤之前,还执行如下操作:创建与所述分发对象一一对应的数据表,将所述用户业务数据写入与所述分发对象一一对应的数据表。
本领域技术人员可以理解,图10中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图10所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现以下步骤:接收用户业务数据,对所述用户业务数据进行解析,得到解析数据;获取所述解析数据中的用户行为字段值和共享控制字段值;若所述共享控制字段值为表示允许共享的数值,获取所述用户行为字段值,并获取所述用户行为字段值对应的关键词组合;获取关键词组合中的各关键词,根据预设的关键词转化策略,获取与所述关键词组合中每一关键词对应的分发对象;以及将所述解析数据对应的用户业务数据发送至与所述关键词组合中每一关键词对应的分发对象。
在一实施例中,所述对所述用户业务数据进行解析,得到解析数据,包括:识别所述用户业务数据中用于标识用户身份识别的第一字段、用于表示用户行为的第二字段、用于共享控制的第三字段;获取所述第一字段对应的第一取值、获取所述第二字段对应的第二取值、及获取所述第三字段对应的第三取值,由所述第一取值、第二取值及第三取值组成解析数据。
在一实施例中,所述获取所述第二字段对应的第二取值,包括:获取与所述第二字段对应的业务操作轨迹日志,将所述业务操作轨迹日志通过基于概率统计分词模型进行分词,得到与业务操作轨迹日志对应的分词结果;通过词频-逆文本频率指数模型,抽取所述分词结果中位于预设的第一排名值之前的关键词,组成关键词组合以作为业务操作轨迹日志对应的用户行为字段值。
在一实施例中,所述根据预设的关键词转化策略,获取与所述关键词组合中每一关键词对应的分发对象,包括:依序获取所述关键词组合中每一关键词;若各关键词在所述关键词转化策略中存在对应的转化项,获取每一关键词对应的转化项中对应的分发对象。
在一实施例中,所述将所述解析数据对应的用户业务数据发送至与所述关键词组合中每一关键词对应的分发对象之前,还包括:创建与所述分发对象一一对应的数据表,将所述用户业务数据写入与所述分发对象一一对应的数据表。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于用户行为的数据共享方法,其特征在于,包括:
接收用户业务数据,对所述用户业务数据进行解析,得到解析数据;
获取所述解析数据中的用户行为字段值和共享控制字段值;
若所述共享控制字段值为表示允许共享的数值,获取所述用户行为字段值,并获取所述用户行为字段值对应的关键词组合;
获取关键词组合中的各关键词,根据预设的关键词转化策略,获取与所述关键词组合中每一关键词对应的分发对象;以及
将所述解析数据对应的用户业务数据发送至与所述关键词组合中每一关键词对应的分发对象。
2.根据权利要求1所述的基于用户行为的数据共享方法,其特征在于,所述对所述用户业务数据进行解析,得到解析数据,包括:
识别所述用户业务数据中用于标识用户身份识别的第一字段、用于表示用户行为的第二字段、用于共享控制的第三字段;
获取所述第一字段对应的第一取值、获取所述第二字段对应的第二取值、及获取所述第三字段对应的第三取值,由所述第一取值、第二取值及第三取值组成解析数据。
3.根据权利要求2所述的基于用户行为的数据共享方法,其特征在于,所述获取所述第二字段对应的第二取值,包括:
获取与所述第二字段对应的业务操作轨迹日志,将所述业务操作轨迹日志通过基于概率统计分词模型进行分词,得到与业务操作轨迹日志对应的分词结果;
通过词频-逆文本频率指数模型,抽取所述分词结果中位于预设的第一排名值之前的关键词,组成关键词组合以作为业务操作轨迹日志对应的用户行为字段值。
4.根据权利要求1所述的基于用户行为的数据共享方法,其特征在于,所述根据预设的关键词转化策略,获取与所述关键词组合中每一关键词对应的分发对象,包括:
依序获取所述关键词组合中每一关键词;
若各关键词在所述关键词转化策略中存在对应的转化项,获取每一关键词对应的转化项中对应的分发对象。
5.根据权利要求1所述的基于用户行为的数据共享方法,其特征在于,所述将所述解析数据对应的用户业务数据发送至与所述关键词组合中每一关键词对应的分发对象之前,还包括:
创建与所述分发对象一一对应的数据表,将所述用户业务数据写入与所述分发对象一一对应的数据表。
6.一种基于用户行为的数据共享装置,其特征在于,包括:
业务数据解析单元,用于接收用户业务数据,对所述用户业务数据进行解析,得到解析数据;
指定字段值获取单元,用于获取所述解析数据中的用户行为字段值和共享控制字段值;
关键词组合获取单元,用于若所述共享控制字段值为表示允许共享的数值,获取所述用户行为字段值,并获取所述用户行为字段值对应的关键词组合;
分发对象获取单元,用于获取关键词组合中的各关键词,根据预设的关键词转化策略,获取与所述关键词组合中每一关键词对应的分发对象;以及
分发单元,用于将所述解析数据对应的用户业务数据发送至与所述关键词组合中每一关键词对应的分发对象。
7.根据权利要求6所述的基于用户行为的数据共享装置,其特征在于,所述业务数据解析单元,包括:
字段定位单元,用于识别所述用户业务数据中用于标识用户身份识别的第一字段、用于表示用户行为的第二字段、用于共享控制的第三字段;
字段取值获取单元,用于获取所述第一字段对应的第一取值、获取所述第二字段对应的第二取值、及获取所述第三字段对应的第三取值,由所述第一取值、第二取值及第三取值组成解析数据。
8.根据权利要求7所述的基于用户行为的数据共享装置,其特征在于,所述字段取值获取单元,包括:
分词单元,用于获取与所述第二字段对应的业务操作轨迹日志,将所述业务操作轨迹日志通过基于概率统计分词模型进行分词,得到与业务操作轨迹日志对应的分词结果;
关键词组合获取单元,用于通过词频-逆文本频率指数模型,抽取所述分词结果中位于预设的第一排名值之前的关键词,组成关键词组合以作为业务操作轨迹日志对应的用户行为字段值。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的基于用户行为的数据共享方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至5任一项所述的基于用户行为的数据共享方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910433478.6A CN110287255A (zh) | 2019-05-23 | 2019-05-23 | 基于用户行为的数据共享方法、装置及计算机设备 |
PCT/CN2019/121700 WO2020233067A1 (zh) | 2019-05-23 | 2019-11-28 | 基于用户行为的数据共享方法、装置及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910433478.6A CN110287255A (zh) | 2019-05-23 | 2019-05-23 | 基于用户行为的数据共享方法、装置及计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110287255A true CN110287255A (zh) | 2019-09-27 |
Family
ID=68002311
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910433478.6A Pending CN110287255A (zh) | 2019-05-23 | 2019-05-23 | 基于用户行为的数据共享方法、装置及计算机设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110287255A (zh) |
WO (1) | WO2020233067A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110908575A (zh) * | 2019-12-05 | 2020-03-24 | 上海凯京信达科技集团有限公司 | 数据处理方法、计算机存储介质及电子设备 |
WO2020233067A1 (zh) * | 2019-05-23 | 2020-11-26 | 深圳壹账通智能科技有限公司 | 基于用户行为的数据共享方法、装置及计算机设备 |
CN113609427A (zh) * | 2021-08-06 | 2021-11-05 | 山东鸿业信息科技有限公司 | 一种无接口情况下的系统数据资源提取方法及系统 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009009555A1 (en) * | 2007-07-11 | 2009-01-15 | Calpont Corporation | Method and system for processing a database query |
CN101916291A (zh) * | 2010-08-26 | 2010-12-15 | 北京大学 | 一种eDonkey网络共享文件及客户端信息爬取方法 |
JP2011154648A (ja) * | 2010-01-28 | 2011-08-11 | Kddi Corp | 共用対象物に対する予約管理装置、システム、プログラム及び方法 |
WO2012126381A1 (zh) * | 2011-03-22 | 2012-09-27 | 百度在线网络技术(北京)有限公司 | 一种用于获取与现实场景相关的共享对象的设备和方法 |
WO2013044313A2 (en) * | 2011-09-29 | 2013-04-04 | Skaffold Pty Limited | Systems and methods for providing share assessment data with plain language interpretation |
CN105407076A (zh) * | 2014-09-15 | 2016-03-16 | 上海天脉聚源文化传媒有限公司 | 一种媒体桥实现方法及系统 |
CN105786950A (zh) * | 2015-12-30 | 2016-07-20 | 北京锐安科技有限公司 | 一种处理数据的方法及装置 |
CN107357791A (zh) * | 2016-05-10 | 2017-11-17 | 中兴通讯股份有限公司 | 一种数据共享方法及装置 |
CN107871198A (zh) * | 2017-06-22 | 2018-04-03 | 好家联电子科技(上海)有限公司 | 一种家政员和业务共享的智能化家政服务平台 |
KR20180058126A (ko) * | 2016-11-23 | 2018-05-31 | 김종우 | 슬레이브 서버를 이용하여 맞춤형 정보를 제공하는 데이터 센터 시스템 |
CN108241732A (zh) * | 2017-10-23 | 2018-07-03 | 深圳壹账通智能科技有限公司 | 电子装置、信息处理的方法及存储介质 |
CN108595614A (zh) * | 2018-04-20 | 2018-09-28 | 成都智信电子技术有限公司 | 应用于his系统的数据表映射方法 |
CN108733706A (zh) * | 2017-04-20 | 2018-11-02 | 腾讯科技(深圳)有限公司 | 热度信息的生成方法和装置 |
CN108876310A (zh) * | 2018-07-11 | 2018-11-23 | 国云科技股份有限公司 | 用于业务数据按需获取按需收费的数据共享交换系统及方法 |
CN109087191A (zh) * | 2018-06-21 | 2018-12-25 | 深圳壹账通智能科技有限公司 | 银行客户资源共享方法、装置、服务器及系统 |
WO2019019493A1 (zh) * | 2017-07-28 | 2019-01-31 | 平安科技(深圳)有限公司 | 数据共享方法、装置及计算机可读存储介质 |
CN109600349A (zh) * | 2018-07-27 | 2019-04-09 | 北京字节跳动网络技术有限公司 | 一种业务数据的共享实现方法、装置、设备和介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4645728B2 (ja) * | 2008-11-25 | 2011-03-09 | ソニー株式会社 | 履歴表示装置、履歴表示システム、履歴表示方法、およびプログラム |
CN102831253B (zh) * | 2012-09-25 | 2015-01-21 | 北京科东电力控制系统有限责任公司 | 一种分布式全文检索系统 |
CN108171075A (zh) * | 2017-12-14 | 2018-06-15 | 北京金风科创风电设备有限公司 | 一种数据查询权限管理、查询方法及装置 |
CN110287255A (zh) * | 2019-05-23 | 2019-09-27 | 深圳壹账通智能科技有限公司 | 基于用户行为的数据共享方法、装置及计算机设备 |
-
2019
- 2019-05-23 CN CN201910433478.6A patent/CN110287255A/zh active Pending
- 2019-11-28 WO PCT/CN2019/121700 patent/WO2020233067A1/zh active Application Filing
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009009555A1 (en) * | 2007-07-11 | 2009-01-15 | Calpont Corporation | Method and system for processing a database query |
JP2011154648A (ja) * | 2010-01-28 | 2011-08-11 | Kddi Corp | 共用対象物に対する予約管理装置、システム、プログラム及び方法 |
CN101916291A (zh) * | 2010-08-26 | 2010-12-15 | 北京大学 | 一种eDonkey网络共享文件及客户端信息爬取方法 |
WO2012126381A1 (zh) * | 2011-03-22 | 2012-09-27 | 百度在线网络技术(北京)有限公司 | 一种用于获取与现实场景相关的共享对象的设备和方法 |
WO2013044313A2 (en) * | 2011-09-29 | 2013-04-04 | Skaffold Pty Limited | Systems and methods for providing share assessment data with plain language interpretation |
CN105407076A (zh) * | 2014-09-15 | 2016-03-16 | 上海天脉聚源文化传媒有限公司 | 一种媒体桥实现方法及系统 |
CN105786950A (zh) * | 2015-12-30 | 2016-07-20 | 北京锐安科技有限公司 | 一种处理数据的方法及装置 |
CN107357791A (zh) * | 2016-05-10 | 2017-11-17 | 中兴通讯股份有限公司 | 一种数据共享方法及装置 |
KR20180058126A (ko) * | 2016-11-23 | 2018-05-31 | 김종우 | 슬레이브 서버를 이용하여 맞춤형 정보를 제공하는 데이터 센터 시스템 |
CN108733706A (zh) * | 2017-04-20 | 2018-11-02 | 腾讯科技(深圳)有限公司 | 热度信息的生成方法和装置 |
CN107871198A (zh) * | 2017-06-22 | 2018-04-03 | 好家联电子科技(上海)有限公司 | 一种家政员和业务共享的智能化家政服务平台 |
WO2019019493A1 (zh) * | 2017-07-28 | 2019-01-31 | 平安科技(深圳)有限公司 | 数据共享方法、装置及计算机可读存储介质 |
CN108241732A (zh) * | 2017-10-23 | 2018-07-03 | 深圳壹账通智能科技有限公司 | 电子装置、信息处理的方法及存储介质 |
CN108595614A (zh) * | 2018-04-20 | 2018-09-28 | 成都智信电子技术有限公司 | 应用于his系统的数据表映射方法 |
CN109087191A (zh) * | 2018-06-21 | 2018-12-25 | 深圳壹账通智能科技有限公司 | 银行客户资源共享方法、装置、服务器及系统 |
CN108876310A (zh) * | 2018-07-11 | 2018-11-23 | 国云科技股份有限公司 | 用于业务数据按需获取按需收费的数据共享交换系统及方法 |
CN109600349A (zh) * | 2018-07-27 | 2019-04-09 | 北京字节跳动网络技术有限公司 | 一种业务数据的共享实现方法、装置、设备和介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020233067A1 (zh) * | 2019-05-23 | 2020-11-26 | 深圳壹账通智能科技有限公司 | 基于用户行为的数据共享方法、装置及计算机设备 |
CN110908575A (zh) * | 2019-12-05 | 2020-03-24 | 上海凯京信达科技集团有限公司 | 数据处理方法、计算机存储介质及电子设备 |
CN113609427A (zh) * | 2021-08-06 | 2021-11-05 | 山东鸿业信息科技有限公司 | 一种无接口情况下的系统数据资源提取方法及系统 |
CN113609427B (zh) * | 2021-08-06 | 2023-09-08 | 山东鸿业信息科技有限公司 | 一种无接口情况下的系统数据资源提取方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2020233067A1 (zh) | 2020-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10459888B2 (en) | Method, apparatus and system for data analysis | |
US10289541B2 (en) | Source code flow analysis using information retrieval | |
CN110292775B (zh) | 获取差异数据的方法及装置 | |
CN110287255A (zh) | 基于用户行为的数据共享方法、装置及计算机设备 | |
CN109034993A (zh) | 对账方法、设备、系统及计算机可读存储介质 | |
CN110502516A (zh) | 表格数据解析方法、装置、计算机设备及存储介质 | |
CN109325132A (zh) | 专家知识推荐方法、装置、计算机设备及存储介质 | |
CN113127746B (zh) | 基于用户聊天内容分析的信息推送方法及其相关设备 | |
CN103744889B (zh) | 一种用于对问题进行聚类处理的方法与装置 | |
CN110263155B (zh) | 数据分类方法、数据分类模型的训练方法及系统 | |
CN109740129B (zh) | 基于区块链的报表生成方法、装置、设备及可读存储介质 | |
CN105512156B (zh) | 点击模型生成方法和装置 | |
CN110490444A (zh) | 标注任务分配方法、装置、系统及存储介质 | |
CN109165975A (zh) | 标签推荐方法、装置、计算机设备及存储介质 | |
CN108733644A (zh) | 一种文本情感分析方法、计算机可读存储介质及终端设备 | |
CN110781183A (zh) | Hive数据库中增量数据的处理方法、装置以及计算机设备 | |
CN109614599A (zh) | 报表生成方法、装置、计算机设备及存储介质 | |
CN109272402A (zh) | 评分卡的建模方法、装置、计算机设备及存储介质 | |
CN111475494A (zh) | 一种海量数据处理方法、系统、终端及存储介质 | |
CN109558531A (zh) | 新闻信息推送方法、装置以及计算机设备 | |
CN109614982A (zh) | 产品分析方法、装置、计算机设备以及存储介质 | |
CN110968664A (zh) | 一种文书检索方法、装置、设备及介质 | |
CN110543426A (zh) | 一种软件性能风险检测方法及装置 | |
CN113886419A (zh) | Sql语句处理方法、装置、计算机设备及存储介质 | |
CN109597948A (zh) | 访问url链接的方法、系统及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |