CN104144392B - 信息处理方法、设备和系统 - Google Patents
信息处理方法、设备和系统 Download PDFInfo
- Publication number
- CN104144392B CN104144392B CN201310166626.5A CN201310166626A CN104144392B CN 104144392 B CN104144392 B CN 104144392B CN 201310166626 A CN201310166626 A CN 201310166626A CN 104144392 B CN104144392 B CN 104144392B
- Authority
- CN
- China
- Prior art keywords
- information
- user
- model
- user property
- social media
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例涉及一种信息处理方法、设备和系统,该方法包括:终端设备获取终端用户的用户标识,并将用户标识发送至系统设备,使得系统设备获取与用户标识对应的社交媒体数据,抽取社交媒体数据中的上下文信息,并对上下文信息进行聚类处理,聚类处理后得到用户属性模型;终端设备从系统设备接收终端用户的用户属性模型和信息回复模型,并根据用户属性模型确定终端用户的所有联系人的用户属性;当接收到联系人发送的待回复信息时,抽取待回复信息的上下文信息,并根据待回复信息的上下文信息、联系人的用户属性、以及信息回复模型生成回复信息,并将回复信息发送至联系人。因此,本发明实现了具有用户语言偏好和风格的信息自动回复。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种信息处理方法、设备和系统。
背景技术
随着移动互联网的普及,手机信息业务依然是目前手机用户最常使用的业务之一,若能为手机用户提供出色的信息操作体验是手机制造商赢得用户的重要途径,因此,手机制造商为了给手机用户带来更好的体验,帮助用户自动回复信息则是改善用户体验的一个非常重要方面,同时也给手机用户带来了很大的方便。
目前,短信自动回复系统采用的是基于规则的短信自动回复系统或者单纯基于历史信息作为训练语料的短信自动回复系统。对于基于规则的短信自动回复系统,其待回复的信息通常是系统内置的或者用户预先定义的,比如,当短信回复系统接收到待回复信息后,根据预先定义好的规则(如开会、开车等)回复设置好的信息。对于单纯基于历史信息作为训练语料的短信自动回复系统,一般采用用户的历史信息作为训练语料生成回复模型,并对接收的信息进行回复。
但是,对于基于规则的短信自动回复系统,其回复的内容基本固定而不会根据用户的语言偏好和风格回复信息。对于单纯基于历史信息作为训练语料的短信自动回复系统,其用来作为训练语料的历史信息相对较少,很难获取更大范围的训练语料。
发明内容
本发明提供了一种信息处理方法、设备和系统,以解决现有技术中对于基于规则的短信自动回复系统,其回复的内容基本固定而不会根据用户的语言偏好和风格回复信息,以及对于单纯基于历史信息作为训练语料的短信自动回复系统,其用来作为训练语料的历史信息相对较少,很难获取更大范围的训练语料的问题。
在第一方面,本发明提供了一种信息处理方法,所述方法包括:终端设备获取终端用户的用户标识,并将所述用户标识发送至系统设备,使得所述系统设备获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型;所述终端设备从所述系统设备接收所述终端用户的所述用户属性模型和信息回复模型,并根据所述用户属性模型确定所述终端用户的所有联系人的用户属性;当接收到所述联系人发送的待回复信息时,抽取所述待回复信息的上下文信息,并根据所述待回复信息的上下文信息、所述联系人的用户属性、以及所述信息回复模型生成回复信息,并将所述回复信息发送至所述联系人。
在第一种可能的实现方式中,所述获取终端用户的用户标识具体为:获取所述终端用户在社交媒体上的用户标识,所述用户标识为所述终端用户在所述社交媒体上注册的标识信息。
结合第一方面或结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述根据所述待回复信息的上下文信息、所述联系人的用户属性、以及所述信息回复模型生成回复信息具体为:根据所述待回复信息的上下文信息、所述联系人的用户属性、所述联系人的历史信息、以及所述信息回复模型生成回复信息。
在第二方面,本发明提供了一种信息处理方法,所述方法包括:系统设备接收终端设备发送的终端用户的用户标识;获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型;对所述社交媒体数据、所述上下文信息和所述用户属性模型进行训练,所述训练后得到信息回复模型;向所述终端设备发送所述用户属性模型和所述信息回复模型,以使所述终端设备根据所述用户属性模型和所述信息回复模型对所述终端用户接收到的待回复信息进行处理。
在第一种可能的实现方式中,接收所述终端设备在社交媒体上的用户标识,所述用户标识为所述终端用户在所述社交媒体上注册的标识信息。
结合第二方面或结合第二方面的第一种可能的实现方式,在第二种可能的实现方式中,所述上下文信息包括时间类、地点类、事件类和人物属性类信息,所述抽取所述社交媒体数据中的上下文信息,并对所述上下文进行聚类处理,所述聚类处理后得到用户属性模型具体为:抽取所述社交媒体数据中的时间类、地点类、事件类和人物属性类信息,将所述人物属性类信息进行聚类并训练,所述训练后得到所述用户属性模型。
在第三方面,本发明提供了一种终端设备,所述设备包括:获取单元,用于获取终端用户的用户标识,并将所述用户标识发送至系统设备,使得所述系统设备获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型;接收单元,用于接收所述系统设备发送的与所述终端用户相对应的所述用户属性模型和信息回复模型,并根据所述用户属性模型确定所述终端用户的所有联系人的用户属性,以及将所述所有联系人的用户属性和所述信息回复模型传输给信息处理单元;信息处理单元,用于从所述接收单元接收所述所有联系人的用户属性和所述信息回复模型,当接收到所述联系人发送的待回复信息时,抽取所述待回复信息的上下文信息,并根据所述待回复信息的上下文信息、所述联系人的用户属性、以及所述信息回复模型生成回复信息,并将所述回复信息发送至所述联系人。
在第一种可能的实现方式中,所述获取单元还用于获取所述终端用户在社交媒体上的用户标识,所述用户标识为所述终端用户在所述社交媒体上注册的标识信息。
结合第三方面或结合第三方面的第一种可能的实现方式,在第二种可能的实现方式中,所述接收单元还用于根据所述待回复信息的上下文信息、所述联系人的用户属性、所述联系人的历史信息、以及所述信息回复模型生成回复信息。
在第四方面,本发明提供了一种系统设备,所述设备包括:接收单元,用于接收终端设备发送的终端用户的用户标识,以及将所述用户标识传输给用户属性模型生成单元;用户属性模型生成单元,用于从所述接收单元接收所述用户标识,获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型,及将所述社交媒体数据、所述上下文信息和所述用户属性模型传输给信息回复模型生成单元,以及将所述用户属性模型传输给发送单元;信息回复模型生成单元,用于从所述用户属性模型生成单元接收所述社交媒体数据、所述上下文信息和所述用户属性模型,对所述社交媒体数据、所述上下文信息和所述用户属性模型进行训练,所述训练后得到信息回复模型,以及将所述信息回复模型传输给发送单元;发送单元,用于从所述用户属性模型生成单元接收所述用户属性模型,从所述信息回复模型生成单元接收所述信息回复模型,向所述终端设备发送所述用户属性模型和所述信息回复模型,以使所述终端设备根据所述用户属性模型和所述信息回复模型对所述终端用户接收到的待回复信息进行处理。
在第一种可能的实现方式中,所述接收单元还用于接收所述终端设备在社交媒体上的用户标识,所述用户标识为所述终端用户在所述社交媒体上注册的标识信息。
结合第四方面或结合第四方面的第一种可能的实现方式,在第二种可能的实现方式中,所述上下文信息包括时间类、地点类、事件类和人物属性类信息,所述用户属性模型生成单元还用于抽取所述社交媒体数据中的时间类、地点类、事件类和人物属性类信息,将所述人物属性类信息进行聚类并训练,所述训练后得到所述用户属性模型。
在第五方面,本发明提供了一种信息处理系统,所述系统包括:在第三方面提供的终端设备和在第四方面提供的系统设备。
通过应用本发明公开的信息处理方法、设备和系统,终端设备获取终端用户的用户标识,并将所述用户标识发送至系统设备;当系统设备接收终端设备发送的终端用户的用户标识后,获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型,以及对所述社交媒体数据、所述上下文信息和所述用户属性模型进行训练,所述训练后得到信息回复模型,并向所述终端设备发送所述用户属性模型和所述信息回复模型;当终端设备接收所述系统设备发送的与所述终端用户相对应的用户属性模型和信息回复模型后,根据所述用户属性模型确定所述终端用户的所有联系人的用户属性,当接收到所述联系人发送的待回复信息时,抽取所述待回复信息的上下文信息,并根据所述待回复信息的上下文信息、所述联系人的用户属性、以及所述信息回复模型生成回复信息,并将所述回复信息发送至所述联系人,从而使得系统端利用社交媒体数据作为训练语料进行建模,从而扩大了语料采集的范围,并降低了采集成本,同时,上下文信息作为信息回复模型训练参数,使得回复内容更具有针对性,还有,引入用户属性模型作为上下文参数,可以将在社交媒体对不同对象的回复风格、方式引入信息回复;同时,终端设备根据接收到的信息和已训练好的信息回复模型自动生成回复内容,实现了具有用户语言偏好和风格的信息自动回复。
附图说明
图1为本发明实施例一提供的信息处理方法的流程图;
图2为本发明实施例二提供的信息处理方法的流程图;
图3为本发明实施例三提供的终端设备的示意图;
图4为本发明实施例四提供的系统设备的示意图;
图5为本发明实施例五提供的终端设备的示意图;
图6为本发明实施例六提供的系统设备的示意图;
图7为本发明实施例七提供的信息处理系统的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明公开了一种信息处理方法、设备和系统,利用终端设备获取终端用户的用户标识,并将所述用户标识发送至系统设备;当系统设备接收终端设备发送的终端用户的用户标识后,获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型,以及对所述社交媒体数据、所述上下文信息和所述用户属性模型进行训练,所述训练后得到信息回复模型,并向所述终端设备发送所述用户属性模型和所述信息回复模型;当终端设备接收所述系统设备发送的与所述终端用户相对应的用户属性模型和信息回复模型后,根据所述用户属性模型确定所述终端用户的所有联系人的用户属性,当接收到所述联系人发送的待回复信息时,抽取所述待回复信息的上下文信息,并根据所述待回复信息的上下文信息、所述联系人的用户属性、以及所述信息回复模型生成回复信息,并将所述回复信息发送至所述联系人,从而使得系统端利用社交媒体数据作为训练语料进行建模,从而扩大了语料采集的范围,并降低了采集成本,同时,上下文信息作为信息回复模型训练参数,使得回复内容更具有针对性,还有,引入用户属性模型作为上下文参数,可以将在社交媒体对不同对象的回复风格、方式引入信息回复;同时,终端设备根据接收到的信息和已训练好的信息回复模型自动生成回复内容,实现了具有用户语言偏好和风格的信息自动回复。
图1为本发明实施例一提供的信息处理方法的流程图。如图所示,本实施例具体包括以下步骤:
步骤110,终端设备获取终端用户的用户标识,并将所述用户标识发送至系统设备,使得系统设备接收到用户标识后,获取与该用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型。其中,终端用户的用户标识是其在社交媒体上的用户标识,该用户标识为终端用户在社交媒体上注册的标识信息。其中,社交媒体包括微博、博客和社交网络等。
具体地,社交媒体(Social Media)指的是允许人们撰写、分享、评价、讨论、相互沟通的网站和技术。在当今的网络时代,脸谱(facebook)、推特(twitter)、微博等新兴社交媒体成为人们沟通的重要渠道。据统计,2012年,互联网用户超过20%的上网时间用于社交媒体,而目前全球有超过10亿人在使用社交媒体,占网民人数的大约70%。超过6亿用户每天使用社交媒体。因此,很多用户在社交媒体上留下了大量的社交媒体数据,并且这些数据是公开的,从而使得花费很小的代价就能获取这些数据。终端设备将终端用户在社交媒体上的用户标识发送至系统设备,目的是使得系统设备根据用户标识在社交媒体上获取终端用户的社交媒体数据,并抽取这些社交媒体数据的上下文(context)信息,根据这些社交媒体数据和抽取出的上下文信息建立用户属性模型和信息回复模型。
其中,用户属性模型vi如公式(1)所示。
u(m)→vi 公式(1)
在公式(1)中,m是上下文信息。
信息回复模型yi如公式(2)所示。
f(m,t,l,e,u(m))→yi 公式(2)
在公式(2)中,m是上下文信息,t是时间类信息,l是地点类信息,e是事件类信息。
在本发明实施例中,使用用户属性模型vi作为信息回复模型yi中的一个参数。用户属性模型代表一类用户属性,如亲人、同事、亲密好友等,而用户模型在社交媒体数据和信息数据中都可以进行学习,并可以进行替换。
步骤120,终端设备接收所述系统设备发送的与所述终端用户相对应的用户属性模型和信息回复模型,并根据所述用户属性模型确定所述终端用户的所有联系人的用户属性。
具体地,当终端设备接收到系统设备发送的用户属性模型即用户属性集合或者聚类结果后,会为终端用户的通讯簿中的每一个联系人确定其用户属性。其确定过程具体为:根据某一联系人的历史信息数据和每一个用户属性(可以用聚类的聚类中心)计算相似度,以相似度最高的属性作为该联系人的用户属性,比如,将一个联系人的历史信息数据,与亲人、同事、亲密好友等用户属性计算相似度,最后计算出相似度最高的用户属性为亲人,则该联系人的用户属性为终端用户的亲人。
步骤130,当终端设备接收到所述联系人发送的待回复信息时,抽取所述待回复信息的上下文信息,并根据所述待回复信息的上下文信息、所述联系人的用户属性、以及所述信息回复模型生成回复信息,并将所述回复信息发送至所述联系人。其中,待回复信息的上下文信息包括时间类、地点类和事件类信息。
具体地,在本发明实施例中引入了“上下文”,该上下文包括时间、地点、事件、对话人物属性等。当终端用于回复某个联系人发送的待回复信息时,在不同的上下文场景中,其回复信息的表述会有很大的不同。比如,当回复信息为“很忙,现在没时间”这个意思,对于联系人是客户时可能表述成“我现在有事,稍后会联系您”,而对于联系人是好友时可能表述成“忙死了,回头打给您哈”,这里造成回复内容的表述不同的原因是对话人物属性不同即联系人的用户属性不同。
进一步地,步骤130中回复信息的生成不仅根据待回复信息的上下文信息、联系人的用户属性、以及信息回复模型,还要参考联系人的历史信息。
进一步地,步骤130之后还包括:将生成的回复信息进行语言修饰,并将所述语言修饰后的信息发送至所述联系人。
因此,本发明公开了一种信息处理方法,利用终端设备获取终端用户的用户标识,并将所述用户标识发送至系统设备,接收所述系统设备发送的与所述终端用户相对应的用户属性模型和信息回复模型,根据所述用户属性模型确定所述终端用户的所有联系人的用户属性,当接收到所述联系人发送的待回复信息时,抽取所述待回复信息的上下文信息,并根据所述待回复信息的上下文信息、所述联系人的用户属性、以及所述信息回复模型生成回复信息,并将所述回复信息发送至所述联系人,从而使得终端设备根据接收到的信息和已训练好的信息回复模型自动生成回复内容,实现了具有用户语言偏好和风格的信息自动回复。
图2为本发明实施例二提供的信息处理方法的流程图。如图所示,本实施例具体包括以下步骤:
步骤210,系统设备接收终端设备发送的终端用户的用户标识。其中,终端用户的用户标识是终端用户在社交媒体上的用户标识,该用户标识包括微博、博客和社交网络。
步骤220,系统设备获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息,并对所述上下文进行聚类处理,所述聚类处理后得到用户属性模型。
进一步地,步骤220中的上下文信息包括时间类、地点类、事件类和人物属性类信息。步骤220具体为:系统设备抽取所述社交媒体数据中的时间类、地点类、事件类和人物属性类信息,将所述人物属性类信息进行聚类并训练,所述训练后得到所述用户属性模型。
具体地,系统设备在社交媒体上获取与所述用户标识对应的社交媒体数据,比如,终端用户的回复信息。当获取到社交媒体数据后,抽取这些社交媒体数据中的上下文信息即上下文关键词,其包括时间类、地点类、事件类和人物属性类信息,将上下文信息中的人物属性类信息进行聚类并训练,所述训练后得到用户属性模型,该用户属性模型vi如公式(1)所示。其中,人物属性类信息包括语气词、称呼、习惯用语等。另外,还要将抽取的上下文信息和社交媒体数据写入数据库。
其中,用户属性模型的建立方式一般为:系统设备对终端用户按照和终端用户的用户属性相关的关键词进行聚类,比如,称呼、口头禅,训练得到用户模型,并将用户属性模型分别存入数据库和发送给终端设备块。
步骤230,系统设备对所述社交媒体数据、所述上下文信息和所述用户属性模型进行训练,所述训练后得到信息回复模型;
具体地,信息回复模型yi如公式(2)所示。
步骤240,系统设备向所述终端设备发送所述用户属性模型和所述信息回复模型,以使所述终端设备根据所述用户属性模型和所述信息回复模型对所述终端用户接收到的待回复信息进行处理。
另外,系统会周期性执行步骤220至步骤240,周期可以较长,比如,7天执行一次。其目的是及时获取终端用户最新的社交媒体数据,并根据用户最新后社交媒体数据得到用户属性模型和信息回复模型,并将重新得到的用户属性模型和信息回复模型发送给终端设备,用以终端设备根据系统设备重新得到的用户属性模型和信息回复模型更新自身保存的用户属性模型和信息回复模型。
因此,本发明实施例提供的信息处理方法,系统设备接收终端设备发送的终端用户的用户标识,获取与用户标识对应的社交媒体数据,抽取该社交媒体数据中的上下文信息,并对抽取到的上下文信息进行聚类处理,其聚类处理后得到用户属性模型,以及对社交媒体数据、上下文信息和用户属性模型进行训练,训练后得到信息回复模型,并向终端设备发送用户属性模型和信息回复模型,以使终端设备根据用户属性模型和信息回复模型对终端用户接收到的待回复信息进行处理,从而使得系统端利用社交媒体数据作为训练语料进行建模,从而扩大了语料采集的范围,并降低了采集成本,同时,上下文信息作为信息回复模型训练参数,使得回复内容更具有针对性,还有,引入用户属性模型作为上下文参数,可以将在社交媒体对不同对象的回复风格、方式引入信息回复。
图3为本发明实施例三提供的终端设备的示意图。该终端设备用于执行本发明实施例一提供的信息处理方法。如图所示,本实施例具体包括:获取单元31、接收单元32和信息处理单元33。
获取单元31用于获取终端用户的用户标识,并将所述用户标识发送至系统设备,使得所述系统设备获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型;接收单元32用于接收所述系统设备发送的与所述终端用户相对应的用户属性模型和信息回复模型,并根据所述用户属性模型确定所述终端用户的所有联系人的用户属性,以及将所述所有联系人的用户属性和所述信息回复模型传输给信息处理单元33;信息处理单元33用于从所述接收单元32接收所述所有联系人的用户属性和所述信息回复模型,当接收到所述联系人发送的待回复信息时,抽取所述待回复信息的上下文信息,并根据所述待回复信息的上下文信息、所述联系人的用户属性、以及所述信息回复模型生成回复信息,并将所述回复信息发送至所述联系人。
其中,所述待回复信息的上下文信息包括时间类、地点类和事件类信息。
进一步地,所述获取单元31还用于获取所述终端用户在社交媒体上的用户标识,所述用户标识为所述终端用户在所述社交媒体上注册的标识信息。其中,社交媒体包括微博、博客和社交网络等。
进一步地,所述接收单元32还用于根据所述待回复信息的上下文信息、所述发信人的用户属性、所述发信人的历史信息、以及所述信息回复模型生成回复信息。
另外,本发明实施例提供的终端设备还包括:语言修饰单元34。
语言修饰单元34用于将所述回复信息进行语言修饰,并将所述语言修饰后的信息发送至所述联系人。
因此,本发明公开了一种终端设备,通过获取终端用户的用户标识,并将所述用户标识发送至系统设备,接收所述系统设备发送的与所述终端用户相对应的用户属性模型和信息回复模型,根据所述用户属性模型确定所述终端用户的所有联系人的用户属性,当接收到所述联系人发送的待回复信息时,抽取所述待回复信息的上下文信息,并根据所述待回复信息的上下文信息、所述联系人的用户属性、以及所述信息回复模型生成回复信息,并将所述回复信息发送至所述联系人,从而使得终端设备根据接收到的信息和已训练好的信息回复模型自动生成回复内容,实现了具有用户语言偏好和风格的信息自动回复。
图4为本发明实施例四提供的系统设备的示意图。该系统设备用于执行本发明实施例二提供的信息处理方法。如图所示,本实施例具体包括:接收单元41、用户属性模型生成单元42、信息回复模型生成单元43和发送单元44。
接收单元41用于接收终端设备发送的终端用户的用户标识,以及将所述用户标识传输给用户属性模型生成单元42;用户属性模型生成单元42用于从所述接收单元41接收所述用户标识,获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型,及将所述社交媒体数据、所述上下文信息和所述用户属性模型传输给信息回复模型生成单元43,以及将所述用户属性模型传输给发送单元44;信息回复模型生成单元43用于从所述用户属性模型生成单元42接收所述社交媒体数据、所述上下文信息和所述用户属性模型,对所述社交媒体数据、所述上下文信息和所述用户属性模型进行训练,所述训练后得到信息回复模型,以及将所述信息回复模型传输给发送单元44;发送单元44用于从所述用户属性模型生成单元42接收所述用户属性模型,从所述信息回复模型生成单元43接收所述信息回复模型,向所述终端设备发送所述用户属性模型和所述信息回复模型,以使所述终端设备根据所述用户属性模型和所述信息回复模型对所述终端用户接收到的待回复信息进行处理。其中,所述上下文信息包括时间类、地点类、事件类和人物属性类信息。
进一步地,所述接收单元41还用于接收所述终端设备在社交媒体上的用户标识,所述用户标识为所述终端用户在所述社交媒体上注册的标识信息。其中,社交媒体包括微博、博客和社交网络等。
进一步地,所述用户属性模型生成单元42还用于抽取所述社交媒体数据中的时间类、地点类、事件类和人物属性类信息,将所述人物属性类信息进行聚类并训练,所述训练后得到所述用户属性模型。
因此,本发明实施例提供的系统设备,通过接收终端设备发送的终端用户的用户标识,获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型,以及对所述社交媒体数据、所述上下文信息和所述用户属性模型进行训练,所述训练后得到信息回复模型,并向所述终端设备发送所述用户属性模型和所述信息回复模型,以使所述终端设备根据所述用户属性模型和所述信息回复模型对所述终端用户接收到的待回复信息进行处理,从而使得系统端利用社交媒体数据作为训练语料进行建模,从而扩大了语料采集的范围,并降低了采集成本,同时,上下文信息作为信息回复模型训练参数,使得回复内容更具有针对性,还有,引入用户属性模型作为上下文参数,可以将在社交媒体对不同对象的回复风格、方式引入信息回复。
图5为本发明实施例五提供的终端设备的示意图。该终端设备用于执行本发明实施例一提供的信息处理方法。如图所示,本发明实施例包括:设备端口51、处理器52和存储器53。设备总线54用于连接设备端口51、处理器52和存储器53。
设备端口51用于与系统设备相连接。
存储器53可以是永久存储器,例如硬盘驱动器和闪存,存储器53中具有软件模块和设备驱动程序。软件模块能够执行本发明上述方法的各种功能模块;设备驱动程序可以是网络和接口驱动程序。
在启动时,这些软件组件被加载到存储器53中,然后被处理器52访问并执行如图1所示的方法。
图6为本发明实施例六提供的系统设备的示意图。该系统设备用于执行本发明实施例二提供的信息处理方法。如图所示,本发明实施例包括:设备端口61、处理器62和存储器63。设备总线64用于连接设备端口61、处理器62和存储器63。
设备端口61用于与终端设备相连接。
存储器63可以是永久存储器,例如硬盘驱动器和闪存,存储器63中具有软件模块和设备驱动程序。软件模块能够执行本发明上述方法的各种功能模块;设备驱动程序可以是网络和接口驱动程序。
在启动时,这些软件组件被加载到存储器63中,然后被处理器62访问并执行如图2所示的方法。
图7为本发明实施例七提供的信息处理系统的示意图。如图所示,本实施例具体包括:本发明实施例三提供的终端设备71和本发明实施例四提供的系统设备72,或者本发明实施例五提供的终端设备71和本发明实施例六提供的系统设备72。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (17)
1.一种信息处理方法,其特征在于,所述方法包括:
终端设备获取终端用户的用户标识,并将所述用户标识发送至系统设备,使得所述系统设备获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型;
所述终端设备从所述系统设备接收所述终端用户的所述用户属性模型和信息回复模型,并根据所述用户属性模型确定所述终端用户的所有联系人的用户属性;
当接收到所述联系人发送的待回复信息时,抽取所述待回复信息的上下文信息,并根据所述待回复信息的上下文信息、所述联系人的用户属性、以及所述信息回复模型生成回复信息,并将所述回复信息发送至所述联系人。
2.根据权利要求1所述的信息处理方法,其特征在于,所述获取终端用户的用户标识具体为:
获取所述终端用户在社交媒体上的用户标识,所述用户标识为所述终端用户在所述社交媒体上注册的标识信息。
3.根据权利要求1或2所述的信息处理方法,其特征在于,所述根据所述待回复信息的上下文信息、所述联系人的用户属性、以及所述信息回复模型生成回复信息具体为:
根据所述待回复信息的上下文信息、所述联系人的用户属性、所述联系人的历史信息、以及所述信息回复模型生成回复信息。
4.根据权利要求1或2所述的信息处理方法,其特征在于,所述根据所述待回复信息的上下文信息、所述联系人的用户属性、以及所述信息回复模型生成回复信息之后,还包括:
将所述回复信息进行语言修饰,并将所述语言修饰后的信息发送至所述联系人。
5.根据权利要求1或2所述的信息处理方法,其特征在于,所述待回复信息的上下文信息包括时间类、地点类和事件类信息。
6.一种信息处理方法,其特征在于,所述方法包括:
系统设备接收终端设备发送的终端用户的用户标识;
获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型;
对所述社交媒体数据、所述上下文信息和所述用户属性模型进行训练,所述训练后得到信息回复模型;
向所述终端设备发送所述用户属性模型和所述信息回复模型,以使所述终端设备根据所述用户属性模型和所述信息回复模型对所述终端用户接收到的待回复信息进行处理。
7.根据权利要求6所述的信息处理方法,其特征在于,所述接收终端设备发送的终端用户的用户名信息具体为:
接收所述终端设备在社交媒体上的用户标识,所述用户标识为所述终端用户在所述社交媒体上注册的标识信息。
8.根据权利要求6或7所述的信息处理方法,其特征在于,所述上下文信息包括时间类、地点类、事件类和人物属性类信息,所述抽取所述社交媒体数据中的上下文信息,并对所述上下文进行聚类处理,所述聚类处理后得到用户属性模型具体为:
抽取所述社交媒体数据中的时间类、地点类、事件类和人物属性类信息,将所述人物属性类信息进行聚类并训练,所述训练后得到所述用户属性模型。
9.一种终端设备,其特征在于,所述设备包括:
获取单元,用于获取终端用户的用户标识,并将所述用户标识发送至系统设备,使得所述系统设备获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型;
接收单元,用于接收所述系统设备发送的与所述终端用户相对应的所述用户属性模型和信息回复模型,并根据所述用户属性模型确定所述终端用户的所有联系人的用户属性,以及将所述所有联系人的用户属性和所述信息回复模型传输给信息处理单元;
信息处理单元,用于从所述接收单元接收所述所有联系人的用户属性和所述信息回复模型,当接收到所述联系人发送的待回复信息时,抽取所述待回复信息的上下文信息,并根据所述待回复信息的上下文信息、所述联系人的用户属性、以及所述信息回复模型生成回复信息,并将所述回复信息发送至所述联系人。
10.根据权利要求9所述的终端设备,其特征在于,所述获取单元还用于获取所述终端用户在社交媒体上的用户标识,所述用户标识为所述终端用户在所述社交媒体上注册的标识信息。
11.根据权利要求9或10所述的终端设备,其特征在于,所述接收单元还用于根据所述待回复信息的上下文信息、所述联系人的用户属性、所述联系人的历史信息、以及所述信息回复模型生成回复信息。
12.根据权利要求9或10所述的终端设备,其特征在于,所述设备还包括:
语言修饰单元,用于将所述回复信息进行语言修饰,并将所述语言修饰后的信息发送至所述联系人。
13.根据权利要求9或10所述的终端设备,其特征在于,所述待回复信息的上下文信息包括时间类、地点类和事件类信息。
14.一种信息处理设备,其特征在于,所述设备包括:
接收单元,用于接收终端设备发送的终端用户的用户标识,以及将所述用户标识传输给用户属性模型生成单元;
用户属性模型生成单元,用于从所述接收单元接收所述用户标识,获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型,及将所述社交媒体数据、所述上下文信息和所述用户属性模型传输给信息回复模型生成单元,以及将所述用户属性模型传输给发送单元;
信息回复模型生成单元,用于从所述用户属性模型生成单元接收所述社交媒体数据、所述上下文信息和所述用户属性模型,对所述社交媒体数据、所述上下文信息和所述用户属性模型进行训练,所述训练后得到信息回复模型,以及将所述信息回复模型传输给发送单元;
发送单元,用于从所述用户属性模型生成单元接收所述用户属性模型,从所述信息回复模型生成单元接收所述信息回复模型,向所述终端设备发送所述用户属性模型和所述信息回复模型,以使所述终端设备根据所述用户属性模型和所述信息回复模型对所述终端用户接收到的待回复信息进行处理。
15.根据权利要求14所述的信息处理设备,其特征在于,所述接收单元还用于接收所述终端设备在社交媒体上的用户标识,所述用户标识为所述终端用户在所述社交媒体上注册的标识信息。
16.根据权利要求14或15所述的信息处理设备,其特征在于,所述上下文信息包括时间类、地点类、事件类和人物属性类信息,所述用户属性模型生成单元还用于抽取所述社交媒体数据中的时间类、地点类、事件类和人物属性类信息,将所述人物属性类信息进行聚类并训练,所述训练后得到所述用户属性模型。
17.一种信息处理系统,其特征在于,所述系统包括:根据权利要求9至13任一项所述的终端设备和根据权利要求14至16任一项所述的信息处理设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310166626.5A CN104144392B (zh) | 2013-05-08 | 2013-05-08 | 信息处理方法、设备和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310166626.5A CN104144392B (zh) | 2013-05-08 | 2013-05-08 | 信息处理方法、设备和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104144392A CN104144392A (zh) | 2014-11-12 |
CN104144392B true CN104144392B (zh) | 2018-01-16 |
Family
ID=51853443
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310166626.5A Active CN104144392B (zh) | 2013-05-08 | 2013-05-08 | 信息处理方法、设备和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104144392B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104991779A (zh) * | 2015-07-17 | 2015-10-21 | 小米科技有限责任公司 | 提示方法及装置 |
CN105471713A (zh) * | 2015-12-02 | 2016-04-06 | 小米科技有限责任公司 | 信息提示方法及装置 |
CN108021572B (zh) * | 2016-11-02 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 回复信息推荐方法和装置 |
CN108270661B (zh) * | 2017-01-04 | 2022-05-06 | 北京搜狗科技发展有限公司 | 一种信息回复的方法、装置和设备 |
CN109995642A (zh) * | 2017-12-29 | 2019-07-09 | Tcl集团股份有限公司 | 一种自动生成快捷回复的方法及装置、即时通讯系统 |
CN110417635B (zh) * | 2018-04-28 | 2021-08-24 | 北京金山安全软件有限公司 | 信息自动回复方法、装置及设备 |
CN108829896B (zh) * | 2018-06-29 | 2022-03-25 | 北京百度网讯科技有限公司 | 回复信息反馈方法和装置 |
CN109547320B (zh) * | 2018-09-29 | 2022-08-30 | 创新先进技术有限公司 | 社交方法、装置及设备 |
CN110045898A (zh) * | 2019-03-29 | 2019-07-23 | 东莞市步步高通信软件有限公司 | 一种显示方法及终端设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101247366A (zh) * | 2008-03-31 | 2008-08-20 | 腾讯科技(深圳)有限公司 | 自动回复方法及即时通信客户端 |
CN101262494A (zh) * | 2008-01-23 | 2008-09-10 | 华为技术有限公司 | 对发布信息进行处理的方法、客户端、服务器和系统 |
CN101345717A (zh) * | 2007-07-12 | 2009-01-14 | 英业达股份有限公司 | 可自动回应的即时通讯系统及其方法 |
CN101500206A (zh) * | 2008-01-29 | 2009-08-05 | 中国移动通信集团重庆有限公司 | 移动通信终端短消息智能回复方法 |
CN101500207A (zh) * | 2008-01-29 | 2009-08-05 | 中国移动通信集团重庆有限公司 | 移动通信网络中短消息自动回复方法 |
CN102469037A (zh) * | 2010-11-16 | 2012-05-23 | 中国电信股份有限公司 | 基于即时消息的多微博间信息交互的方法及系统 |
CN102932454A (zh) * | 2012-10-31 | 2013-02-13 | 陈业 | 多维信息组织结构的社交网络 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8862102B2 (en) * | 2010-02-15 | 2014-10-14 | TTSL IITB Center for Excellence in Telecom (TICET) | Method for facilitating and analyzing social interactions and context for targeted recommendations in a network of a telecom service provider |
-
2013
- 2013-05-08 CN CN201310166626.5A patent/CN104144392B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101345717A (zh) * | 2007-07-12 | 2009-01-14 | 英业达股份有限公司 | 可自动回应的即时通讯系统及其方法 |
CN101262494A (zh) * | 2008-01-23 | 2008-09-10 | 华为技术有限公司 | 对发布信息进行处理的方法、客户端、服务器和系统 |
CN101500206A (zh) * | 2008-01-29 | 2009-08-05 | 中国移动通信集团重庆有限公司 | 移动通信终端短消息智能回复方法 |
CN101500207A (zh) * | 2008-01-29 | 2009-08-05 | 中国移动通信集团重庆有限公司 | 移动通信网络中短消息自动回复方法 |
CN101247366A (zh) * | 2008-03-31 | 2008-08-20 | 腾讯科技(深圳)有限公司 | 自动回复方法及即时通信客户端 |
CN102469037A (zh) * | 2010-11-16 | 2012-05-23 | 中国电信股份有限公司 | 基于即时消息的多微博间信息交互的方法及系统 |
CN102932454A (zh) * | 2012-10-31 | 2013-02-13 | 陈业 | 多维信息组织结构的社交网络 |
Also Published As
Publication number | Publication date |
---|---|
CN104144392A (zh) | 2014-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104144392B (zh) | 信息处理方法、设备和系统 | |
KR102363006B1 (ko) | 대화 예제를 기초로 자연어 기계 학습을 사용하여 사용자 요청에 응답하는 방법 | |
CN104731842B (zh) | 用于使用电子通信数据来映射关系的方法和系统 | |
CN106796682B (zh) | 填充用户联系人条目 | |
CN110383297A (zh) | 合作地训练和/或使用单独的输入神经网络模型和响应神经网络模型以用于确定针对电子通信的响应 | |
CN103916436B (zh) | 信息推送方法、装置、终端及服务器 | |
WO2014101425A1 (zh) | 处理消息的方法、终端和系统 | |
CN107733984A (zh) | 一种推送锁屏信息的方法、终端及计算机可读存储介质 | |
CN102622696B (zh) | 一种客服回访的方法和装置 | |
CN103179245B (zh) | 来电电话号码辨识系统和方法 | |
CN101119209A (zh) | 虚拟宠物系统和虚拟宠物聊天方法、装置 | |
CN107977928A (zh) | 表情生成方法、装置、终端及存储介质 | |
CN107193476A (zh) | 信息输入方法及装置、计算机设备与可读介质 | |
CN109040329A (zh) | 联系人标签的确定方法、终端设备及介质 | |
CN106886296A (zh) | 输入法的词库的处理方法和装置 | |
CN108847229A (zh) | 一种基于语音助手的信息交互方法及终端 | |
CN107370661A (zh) | 基于联系人列表的消息发送方法、装置及电子设备 | |
EP2988229A1 (en) | Information retrieval method and device | |
CN106570167A (zh) | 基于融合知识的主题模型的微博话题发现方法 | |
CN103905661B (zh) | 信息转发的方法和云服务器 | |
CN107623620B (zh) | 随机性交互数据的处理方法、网络服务器及智能对话系统 | |
CN109359298A (zh) | 表情符推荐方法、系统及电子设备 | |
CN103593397B (zh) | 一种采集微博内容的方法及设备 | |
CN105376143B (zh) | 一种识别发送者身份的方法及装置 | |
CN109167883A (zh) | 一种基于社交内容的智能屏蔽方法、系统及智能终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |