CN106489159A - 一种基于深度神经网络的用户画像表示学习系统及方法 - Google Patents
一种基于深度神经网络的用户画像表示学习系统及方法 Download PDFInfo
- Publication number
- CN106489159A CN106489159A CN201680001741.9A CN201680001741A CN106489159A CN 106489159 A CN106489159 A CN 106489159A CN 201680001741 A CN201680001741 A CN 201680001741A CN 106489159 A CN106489159 A CN 106489159A
- Authority
- CN
- China
- Prior art keywords
- user
- portrait
- neural network
- deep neural
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Abstract
本发明公开了一种基于深度神经网络的用户画像表示学习系统,其中包括:意图识别模块,用于根据接收的语句识别用户的使用功能;特征向量提取模块,通过深度学习对文本的上下文关系或实体之间的关系进行建模,再通过用户输入文本信息提取到用户的特征信息;以及用户画像学习模块,用于通过特征信息和监督信息迭代训练,来不断更新用户画像。通过深度学习的方式来学习用户画像,可以对用户画像特征进行抽象提炼,特征表示更简洁更精准,也能提取到更深层次的隐含信息。
Description
技术领域
本发明涉及大数据、人工智能、机器学习,特别涉及一种基于深度神经网络的用户画像表示学习系统及方法。
背景技术
近年来,社交网络迅速发展,用户人数呈爆炸式增长。通过社交网络服务,人们除了进行社交行为,则更多的是将社交网络当成公共的媒体平台,满足社交需求和特定兴趣获取需求。对于用户的专业信息及特定兴趣获取需求,而当前社交网络产品则不能很好的满足该需求,各类用户发表的信息混杂在一起,用户需要自己去甄别其中自己感兴趣的信息。如果对社交网络特定领域中信息走向及分布特点进行深度学习提取特征,则更有利于获取用户的信息特征。
目前用户画像主要通过统计的方式来实现,这种方式往往忽略了用户的一些隐含的一些信息。通过深度学习的方式来学习用户画像,可以对特征进行抽象提炼,特征表示更简洁更精准,也能提取到更深层次的隐含信息。
发明内容
本发明公开一种基于深度神经网络的用户画像表示学习系统,其中包括:意图识别模块,用于根据接收的语句识别用户的使用功能;特征向量提取模块,用于通过深度学习对输入语句文本的上下文关系进行建模,提取到用户使用功能的特征信息;以及用户画像学习模块,用于通过特征信息和监督信息迭代训练,来不断更新用户画像。
优选的,还包括语句接收模块,用于接收用户输入的语句。
优选的,用户输入的语句包含有做非结构化数据处理的语句以及可转为结构化数据的语句。
优选的,所述非结构化数据是指用户输入的语句文本。
优选的,所述结构化数据是指把输入语句转化为实体和关系后的数据。
优选的,所述识别用户的使用功能中包含有多个功能。
本发明还公开了一种基于深度神经网络的用户画像表示学习方法,其中包。括:识别用户的使用功能;提取使用功能的特征信息;以及通过特征信息和监督信息迭代训练,来不断更新用户画像。
优选的,还包括接收用户输入的语句。
优选的,用户输入的语句包含做非结构化数据处理的语句以及可转为结构化数据的语句。
优选的,所述非结构化数据是指用户输入的语句文本。
优选的,所述结构化数据是指把输入语句转化为实体和关系后的数据。
优选的,更新用户画像时要结合监督信息。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的实施例基于深度神经网络的用户画像表示学习系统的模块图;
图2是本发明的实施例基于深度神经网络的用户画像表示学习的方法流程图。
具体实施例
下面结合附图和具体实施例对本发明的技术方案作进一步更详细的描述。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
如图1所示为根据本发明的实施例基于深度神经网络的用户画像表示学习系统的模块图100。如图1所示,用户画像表示学习系统100中包括有语句接收模块101、意图识别模块102、特征向量提取模块103以及用户画像学习模块104。其中语句接收模块用于接收用户输入的语句,接收到用户的语句后发送至意图识别模块102,意图识别模块102用于根据用户的语句识别用户想要使用的功能,比如用户希望闲聊、点播或是调教等等功能,可以是众多功能中的一个或者多个。针对每一种不同的功能需求,可以按结构化数据和非结构化数据进行区分。具体地,结构化数据是指把输入语句转化为实体和关系后的数据。而比如闲聊输入的语句,调教的语句可以作为非结构化数据,点播输入的语句数据可以提取出对应的点播实体。其中用户输入的语句包含有做非结构化数据处理的语句以及可转为结构化数据的语句。
在一个实施例中,用户输入的语句文本设定为非结构化数据。当意图识别模块102获取到用户想要使用的功能后,特征向量提取模块103根据非结构化数据,通过深度学习对输入语句文本的上下文关系进行建模,提取到用户使用功能的特征信息值。在获取到特征信息值后,用户画像学习模块104通过特征信息和监督信息迭代训练,来不断更新用户画像。而对于结构化数据,使用深度学习对实体之间的关系进行建模,再通过少量监督信息更新用户画像,最终获取高质量的用户画像。具体地,结构化数据是指把输入语句转化为实体和关系后的数据。
图2是本发明的实施例基于深度神经网络的用户画像表示学习的方法流程图。图2将结合图1进行描述。如图2所示,步骤S201,用户输入语句文本;根据用于输入的语句文本判断用户的意图。步骤S202,获取到用户的意图信息,比如用户输入的是闲聊语句、点播语句或者调教语句等。对获取到的用户意图信息进行特征提取,主要是通过深度学习提取特征向量。步骤S203,提取到用户意图信息的特征向量,比如闲聊向量、点播向量或者调教向量等等。步骤S204,用户画像更新,通过特征信息和监督信息迭代训练,来不断更新用户画像。
图2中所示以三种意图判断为实施例来描述本发明,但应该理解的是本发明并不局限于这三种意图的输入(即闲聊意图、点播意图或调教意图),也可以是其他类型的意图输入。
在一个实施例中,用户输入的语句文本设定为非结构化数据。获取到用户想要使用的功能后,根据非结构化数据,通过深度学习对输入语句文本的上下文关系进行建模,提取到用户使用功能的特征信息。在获取到特征信息值后,结合少量的监督信息,更新用户画像。而对于结构化数据,使用深度学习对实体之间的关系进行建模,再通过少量监督信息更新用户画像,最终获取高质量的用户画像。具体地,结构化数据是指把输入语句转化为实体和关系后的数据。
综上所述,本发明提出了一种深度神经网络的用户画像表示学习系统及方法,通过分析用户的特征,更新用户画像,从而获取高质量的用户画像。
显然,本领域的技术人员应该理解,上述的本发明的各模块或各步骤可以用通用的计算系统来实现,它们可以集中在单个的计算系统上,或者分布在多个计算系统所组成的网络上,可选地,它们可以用计算系统可执行的程序代码来实现,从而,可以将它们存储在存储系统中由计算系统来执行。这样,本发明不限制于任何特定的硬件和软件结合。
以上所揭露的仅为本发明实施例中的较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (12)
1.一种基于深度神经网络的用户画像表示学习系统,其中包括:
意图识别模块,用于根据接收语句识别用户的使用功能;
特征向量提取模块,用于通过深度学习对输入语句文本的上下文关系进行建模,提取到用户使用功能的特征信息;以及
用户画像学习模块,用于通过特征信息和监督信息迭代训练,来不断更新用户画像。
2.根据权利要求1所述的基于深度神经网络的用户画像表示学习系统,其特征在于,还包括:语句接收模块,用于接收用户输入的语句。
3.根据权利要求2所述的基于深度神经网络的用户画像表示学习系统,其特征在于,其中用户输入的语句包含做非结构化数据处理的语句以及可转为结构化数据的语句。
4.根据权利要求3所述的基于深度神经网络的用户画像表示学习系统,其特征在于,所述非结构化数据是指用户输入的语句文本。
5.根据权利要求3所述的基于深度神经网络的用户画像表示学习系统,其特征在于,所述结构化数据是指把输入语句转化为实体和关系后的数据。
6.根据权利要求1所述的基于深度神经网络的用户画像表示学习系统,其特征在于,所述识别用户的使用功能中包含有多个功能。
7.一种基于深度神经网络的用户画像表示学习方法,其中包括:
识别用户的使用功能;
提取使用功能的特征信息;以及
通过特征信息和监督信息迭代训练,来不断更新用户画像。
8.根据权利要求7所述的基于深度神经网络的用户画像表示学习方法,其特征在于,还包括:接收用户输入的语句。
9.根据权利要求8所述的基于深度神经网络的用户画像表示学习方法,其特征在于,用户输入的语句包含有做非结构化数据处理的语句以及可转为结构化数据的语句。
10.根据权利要求9所述的基于深度神经网络的用户画像表示学习方法,其特征在于,所述非结构化数据是指用户输入的语句文本。
11.根据权利要求9所述的基于深度神经网络的用户画像表示学习方法,其特征在于,所述结构化数据是指把输入语句转化为实体和关系后的数据。
12.根据权利要求7所述的基于深度神经网络的用户画像表示学习方法,其特征在于,更新用户画像时要结合监督信息。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2016/087773 WO2018000281A1 (zh) | 2016-06-29 | 2016-06-29 | 一种基于深度神经网络的用户画像表示学习系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106489159A true CN106489159A (zh) | 2017-03-08 |
Family
ID=58286097
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680001741.9A Pending CN106489159A (zh) | 2016-06-29 | 2016-06-29 | 一种基于深度神经网络的用户画像表示学习系统及方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN106489159A (zh) |
WO (1) | WO2018000281A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106934068A (zh) * | 2017-04-10 | 2017-07-07 | 江苏东方金钰智能机器人有限公司 | 机器人基于环境上下文的语义理解的方法 |
CN108804704A (zh) * | 2018-06-19 | 2018-11-13 | 北京顶象技术有限公司 | 一种用户深度画像方法及装置 |
CN109783733A (zh) * | 2019-01-15 | 2019-05-21 | 三角兽(北京)科技有限公司 | 用户画像生成装置及方法、信息处理装置及存储介质 |
CN112464084A (zh) * | 2020-11-17 | 2021-03-09 | 崔海燕 | 基于大数据定位和人工智能的业务优化方法及云计算中心 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108828948B (zh) * | 2018-07-15 | 2021-06-18 | 大国创新智能科技(东莞)有限公司 | 基于深度学习的人工智能作战方法和机器人系统 |
CN109918162B (zh) * | 2019-02-28 | 2021-11-02 | 集智学园(北京)科技有限公司 | 一种可学习的海量信息高维图形交互式展示方法 |
CN112364008A (zh) * | 2020-11-20 | 2021-02-12 | 国网江苏省电力有限公司营销服务中心 | 一种面向电力物联网智能终端的设备画像构建方法 |
CN112908481B (zh) * | 2021-03-18 | 2024-04-16 | 马尚斌 | 一种自动化个人健康评估及管理方法及系统 |
CN113609851A (zh) * | 2021-07-09 | 2021-11-05 | 浙江连信科技有限公司 | 心理学上想法认知偏差的识别方法、装置及电子设备 |
CN113282757A (zh) * | 2021-07-14 | 2021-08-20 | 国网电子商务有限公司 | 基于电商领域表示模型的端到端三元组提取方法及系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101076061A (zh) * | 2007-03-30 | 2007-11-21 | 腾讯科技(深圳)有限公司 | 一种机器人服务器及自动聊天方法 |
CN104750731A (zh) * | 2013-12-30 | 2015-07-01 | 华为技术有限公司 | 一种获取完整用户画像的方法及装置 |
CN104850662A (zh) * | 2015-06-08 | 2015-08-19 | 浙江每日互动网络科技有限公司 | 一种基于用户画像的移动终端智能消息推送方法、服务器和系统 |
CN104881594A (zh) * | 2015-05-06 | 2015-09-02 | 镇江乐游网络科技有限公司 | 一种基于精准画像的智能手机拥有权检测方法 |
CN105005587A (zh) * | 2015-06-26 | 2015-10-28 | 深圳市腾讯计算机系统有限公司 | 一种用户画像的更新方法、装置和系统 |
CN105068661A (zh) * | 2015-09-07 | 2015-11-18 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
CN105446973A (zh) * | 2014-06-20 | 2016-03-30 | 华为技术有限公司 | 社交网络中用户推荐模型的建立及应用方法和装置 |
CN105574159A (zh) * | 2015-12-16 | 2016-05-11 | 浙江汉鼎宇佑金融服务有限公司 | 一种基于大数据的用户画像建立方法和用户画像管理系统 |
CN105589956A (zh) * | 2015-12-21 | 2016-05-18 | 东软集团股份有限公司 | 一种用户画像的方法及装置 |
CN105608171A (zh) * | 2015-12-22 | 2016-05-25 | 青岛海贝易通信息技术有限公司 | 用户画像构建方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104933049B (zh) * | 2014-03-17 | 2019-02-19 | 华为技术有限公司 | 生成数字人的方法及系统 |
US9928463B2 (en) * | 2014-03-25 | 2018-03-27 | Nany Ang Technological University | Episodic and semantic memory based remembrance agent modeling method and system for virtual companions |
CN105183848A (zh) * | 2015-09-07 | 2015-12-23 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机聊天方法和装置 |
CN105096170A (zh) * | 2015-09-18 | 2015-11-25 | 车智互联(北京)科技有限公司 | 基于bbd或/和rf模型获取潜客级别的方法和系统 |
-
2016
- 2016-06-29 WO PCT/CN2016/087773 patent/WO2018000281A1/zh active Application Filing
- 2016-06-29 CN CN201680001741.9A patent/CN106489159A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101076061A (zh) * | 2007-03-30 | 2007-11-21 | 腾讯科技(深圳)有限公司 | 一种机器人服务器及自动聊天方法 |
CN104750731A (zh) * | 2013-12-30 | 2015-07-01 | 华为技术有限公司 | 一种获取完整用户画像的方法及装置 |
CN105446973A (zh) * | 2014-06-20 | 2016-03-30 | 华为技术有限公司 | 社交网络中用户推荐模型的建立及应用方法和装置 |
CN104881594A (zh) * | 2015-05-06 | 2015-09-02 | 镇江乐游网络科技有限公司 | 一种基于精准画像的智能手机拥有权检测方法 |
CN104850662A (zh) * | 2015-06-08 | 2015-08-19 | 浙江每日互动网络科技有限公司 | 一种基于用户画像的移动终端智能消息推送方法、服务器和系统 |
CN105005587A (zh) * | 2015-06-26 | 2015-10-28 | 深圳市腾讯计算机系统有限公司 | 一种用户画像的更新方法、装置和系统 |
CN105068661A (zh) * | 2015-09-07 | 2015-11-18 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
CN105574159A (zh) * | 2015-12-16 | 2016-05-11 | 浙江汉鼎宇佑金融服务有限公司 | 一种基于大数据的用户画像建立方法和用户画像管理系统 |
CN105589956A (zh) * | 2015-12-21 | 2016-05-18 | 东软集团股份有限公司 | 一种用户画像的方法及装置 |
CN105608171A (zh) * | 2015-12-22 | 2016-05-25 | 青岛海贝易通信息技术有限公司 | 用户画像构建方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106934068A (zh) * | 2017-04-10 | 2017-07-07 | 江苏东方金钰智能机器人有限公司 | 机器人基于环境上下文的语义理解的方法 |
CN108804704A (zh) * | 2018-06-19 | 2018-11-13 | 北京顶象技术有限公司 | 一种用户深度画像方法及装置 |
CN109783733A (zh) * | 2019-01-15 | 2019-05-21 | 三角兽(北京)科技有限公司 | 用户画像生成装置及方法、信息处理装置及存储介质 |
CN109783733B (zh) * | 2019-01-15 | 2020-11-06 | 腾讯科技(深圳)有限公司 | 用户画像生成装置及方法、信息处理装置及存储介质 |
CN112464084A (zh) * | 2020-11-17 | 2021-03-09 | 崔海燕 | 基于大数据定位和人工智能的业务优化方法及云计算中心 |
Also Published As
Publication number | Publication date |
---|---|
WO2018000281A1 (zh) | 2018-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106489159A (zh) | 一种基于深度神经网络的用户画像表示学习系统及方法 | |
CN111190939B (zh) | 一种用户画像构建方法及装置 | |
CN109308357B (zh) | 一种用于获得答案信息的方法、装置和设备 | |
CN108984650B (zh) | 计算机可读记录介质及计算机设备 | |
CN103984775A (zh) | 一种推荐好友的方法和设备 | |
US9369418B2 (en) | Determining additional information associated with geographic location information | |
CN104462064A (zh) | 一种移动终端信息通讯提示输入内容的方法和系统 | |
CN107592255B (zh) | 信息展示方法和设备 | |
CN112507139B (zh) | 基于知识图谱的问答方法、系统、设备及存储介质 | |
CN112417121A (zh) | 客户意图识别方法、装置、计算机设备及存储介质 | |
CN112152901A (zh) | 一种虚拟形象控制方法、装置及电子设备 | |
CN106326338A (zh) | 基于搜索引擎的服务提供方法和装置 | |
CN110727782A (zh) | 问答语料生成方法及系统 | |
CN108306813B (zh) | 会话消息的处理方法、服务器及客户端 | |
CN113703585A (zh) | 交互方法、装置、电子设备及存储介质 | |
CN113962199B (zh) | 文本识别方法、装置、设备、存储介质及程序产品 | |
CN113626624B (zh) | 一种资源识别方法和相关装置 | |
CN113010255B (zh) | 基于捆绑会话组的交互方法、装置和计算机设备 | |
CN116881427B (zh) | 问答处理方法、装置、电子设备及存储介质 | |
CN114390011B (zh) | 一种消息处理方法、装置以及可读存储介质 | |
CN109829033A (zh) | 数据展示方法和终端设备 | |
CN107066567B (zh) | 文字对话中基于话题侦测的用户画像建模方法及系统 | |
WO2020124444A1 (zh) | 一种信息处理的方法及相关装置 | |
CN112487817A (zh) | 命名实体识别模型训练方法、样本标注方法、装置及设备 | |
CN112487164A (zh) | 一种人工智能交互方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: Room 301, Building 39, 239 Renmin Road, Gusu District, Suzhou City, Jiangsu Province, 215000 Applicant after: Suzhou Dogweed Intelligent Technology Co., Ltd. Address before: 518000 Dongfang Science and Technology Building 1307-09, 16 Keyuan Road, Yuehai Street, Nanshan District, Shenzhen City, Guangdong Province Applicant before: Shenzhen green bristlegrass intelligence Science and Technology Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170308 |