CN111368214B - 信息推荐方法、装置、计算机设备和存储介质 - Google Patents

信息推荐方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN111368214B
CN111368214B CN202010149764.2A CN202010149764A CN111368214B CN 111368214 B CN111368214 B CN 111368214B CN 202010149764 A CN202010149764 A CN 202010149764A CN 111368214 B CN111368214 B CN 111368214B
Authority
CN
China
Prior art keywords
text
target objects
text data
input
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010149764.2A
Other languages
English (en)
Other versions
CN111368214A (zh
Inventor
俞一鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010149764.2A priority Critical patent/CN111368214B/zh
Publication of CN111368214A publication Critical patent/CN111368214A/zh
Application granted granted Critical
Publication of CN111368214B publication Critical patent/CN111368214B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种信息推荐方法、装置、计算机设备和存储介质。所述方法包括:获取信息推荐请求;查找信息推荐请求对应的目标对象,获取目标对象输入的文本数据以及文本数据的输入时间;根据文本数据以及文本数据的输入时间,获取目标对象之间的联系属性,其中联系属性包括时间联系属性和文本联系属性;根据时间联系属性和文本联系属性,获取目标对象之间的社交关系;而后根据所述目标对象之间的社交关系对所述目标对象进行信息推荐。本申请通过目标对象输入的文本数据,获取目标对象间的时间联系属性与文本联系属性,进而确定目标对象之间的社交关系,并根据目标对象之间的社交关系来进行信息的推荐,仅通过输入的文本数据就可以分析确定社交关系,社交关系的分析不会受到社交软件平台的限制,具备更强的灵活性,从而可以更灵活地进行信息推荐。

Description

信息推荐方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种信息推荐方法、装置、计算机设备和存储介质。
背景技术
随着大数据技术的发展,出现了社交关系挖掘技术,社交关系是社交网络中人与人连接和交互的纽带,也是社交网络中信息传播的基础。而社交关系挖掘则是指通过社交关系挖掘方法来查询确认各个社交用户间的社交关系的过程,社交关系挖掘一般被用于进行信息推荐领域。
传统技术中,一般是通过收集社交网络平台上的原始数据,而后基于这些原始数据与相应的检测模型与算法来预设社交网络上用户间的社交关系,之后根据这些社交关系来进行信息推荐。
然而,目前的这些信息推荐方法,在社交关系挖掘的过程中,大多都是基于通讯平台、网络社区平台或者社交软件平台进行社交关系的分析,而后进行推荐,其中社交关系的分析过程缺乏灵活性。
发明内容
基于此,有必要针对上述技术问题,提供一种灵活性更强的信息推荐方法、装置、计算机设备和存储介质。
一种信息推荐方法,所述方法包括:
获取信息推荐请求;
查找所述信息推荐请求对应的目标对象,获取所述目标对象输入的文本数据以及所述文本数据的输入时间;
根据所述文本数据以及所述文本数据的输入时间,获取所述目标对象之间的联系属性,其中所述联系属性包括时间联系属性和文本联系属性;
根据所述时间联系属性和所述文本联系属性,获取所述目标对象之间的社交关系;
根据所述目标对象之间的社交关系对所述目标对象进行信息推荐。
一种信息推荐装置,所述装置包括:
请求接收模块,用于获取信息推荐请求;
信息查找模块,用于查找所述信息推荐请求对应的目标对象,获取所述目标对象输入的文本数据以及所述文本数据的输入时间;
联系属性获取模块,用于根据所述文本数据以及所述文本数据的输入时间,获取所述目标对象之间的联系属性,其中所述联系属性包括时间联系属性和文本联系属性;
社交关系分析模块,用于根据所述时间联系属性和所述文本联系属性,获取所述目标对象之间的社交关系;
信息推荐模块,用于根据目标对象之间的社交关系对所述目标对象进行信息推荐。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取信息推荐请求;
查找所述信息推荐请求对应的目标对象,获取所述目标对象输入的文本数据以及所述文本数据的输入时间;
根据所述文本数据以及所述文本数据的输入时间,获取所述目标对象之间的联系属性,其中所述联系属性包括时间联系属性和文本联系属性;
根据所述时间联系属性和所述文本联系属性,获取所述目标对象之间的社交关系;
根据所述目标对象之间的社交关系对所述目标对象进行信息推荐。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取信息推荐请求;
查找所述信息推荐请求对应的目标对象,获取所述目标对象输入的文本数据以及所述文本数据的输入时间;
根据所述文本数据以及所述文本数据的输入时间,获取所述目标对象之间的联系属性,其中所述联系属性包括时间联系属性和文本联系属性;
根据所述时间联系属性和所述文本联系属性,获取所述目标对象之间的社交关系;
根据所述目标对象之间的社交关系对所述目标对象进行信息推荐。
上述信息推荐方法、装置、计算机设备和存储介质,通过首先获取信息推荐请求;查找信息推荐请求对应的目标对象,获取目标对象输入的文本数据以及文本数据的输入时间;根据文本数据以及文本数据的输入时间,获取目标对象之间的联系属性,其中联系属性包括时间联系属性和文本联系属性;根据时间联系属性和文本联系属性,获取目标对象之间的社交关系;而后根据所述目标对象之间的社交关系对所述目标对象进行信息推荐。本申请通过目标对象输入的文本数据,获取目标对象间的时间联系属性与文本联系属性,进而确定目标对象之间的社交关系,并根据目标对象之间的社交关系来进行信息的推荐,仅通过输入的文本数据就可以分析确定社交关系,社交关系的分析不会受到社交软件平台的限制,具备更强的灵活性,从而可以更灵活地进行信息推荐。
附图说明
图1为一个实施例中信息推荐方法的应用环境图;
图2为一个实施例中信息推荐方法的流程示意图;
图3为一个实施例中查找目标对象步骤的流程示意图;
图4为一个实施例中获取时间联系属性步骤的流程示意图;
图5为一个实施例中获取文本联系属性步骤的流程示意图;
图6为另一个实施例中获取文本联系属性步骤的流程示意图;
图7为一个实施例中信息推荐步骤的流程示意图;
图8为一个实施例中的无边双向连接图;
图9为另一个实施例中信息推荐方法的应用环境图;
图10为一个实施例中信息推荐方法应用于多种输入法的流程示意图;
图11为一个实施例中信息推荐方法的流程示意图;
图12为一个实施例中信息推荐装置的结构框图;
图13为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的信息推荐方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与信息推荐服务器104通过网络进行通信。信息推荐服务器104包括有文本数据数据库,文本数据数据库里面包含了用户的身份信息,用户通过智能终端上的输入法向终端输入的文本数据,以及这些文本数据对应的输入时间。当终端102希望分析用户间的社交关系时,可以向信息推荐服务器104发送信息推荐请求,信息推荐服务器104获取信息推荐请求;查找信息推荐请求对应的目标对象,获取目标对象输入的文本数据以及文本数据的输入时间;根据文本数据以及文本数据的输入时间,获取目标对象之间的联系属性,其中联系属性包括时间联系属性和文本联系属性;根据时间联系属性和文本联系属性,获取目标对象之间的社交关系;而后根据目标对象之间的社交关系对目标对象进行信息推荐。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,信息推荐服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种信息推荐方法,以该方法应用于图1中的信息推荐服务器104为例进行说明,包括以下步骤:
步骤201,获取信息推荐请求。
其中,社交关系指社会上人与人的交际往来,是人们运用一定的方式传递信息、交流思想的意识,以达到某种目的的社会各项活动。信息推荐的目的是通过分析,获取人与人之间社交关系的强弱。信息推荐请求的目的在于向信息推荐服务器104请求目标目标对象之间社交关系的强弱。
具体地,当终端对应的用户需要进行广告投放、内容推荐、游戏推荐以及用户拉新等行为时,需要通过指定的目标用户间的社交关系来进行精准的信息推荐,此时可以通过本申请的信息推荐方法来先分析各个目标用户之间的社交关系,而后基于目标对象之间的社交关系来进行信息推荐,从而提高信息推荐的成功率。具体,用户可以通过向信息推荐服务器104发送信息推荐请求,来请求信息推荐服务器104分析这些目标目标对象,即本申请的目标目标对象间的社交关系。信息推荐请求中包括了用于确定目标目标对象的用户信息。在其中一个实施例中,用户信息具体可以为用户标识,信息推荐服务器104可以通过用户标识在数据库内进行查找,得到包含有该用户标识的所有用户,而后将其作为信息推荐请求的目标对象。特别的,当信息推荐请求不包含任何目标对象的用户信息时,则可以默认为是对数据库内包含的所有用户执行信息推荐的操作。
步骤203,查找信息推荐请求对应的目标对象,获取目标对象输入的文本数据以及文本数据的输入时间。
其中,查找到的目标对象就是信息推荐请求对应的目标用户,目标对象的文本数据是指这些目标对象通过各种终端上的输入法向终端输入的文本数据。具体还包含有在设置完输入法后,通过输入法在终端打字以及手写等方式输入的文字内容,此外,文本数据还包括用户选取的表情之类可以转化为文本的信息。而文本数据对应的输入时间则指的是目标分析通过输入法输入这些文本数据到终端上的具体时间。本申请主要通过收集不同目标对象在终端的输入法客户端输入的文本数据以及这些文本数据对应的输入时间,来建立不同目标对象之间的联系,即通过输入法用户以及好友通过终端输入法输入的内容来判断他们之间的社交关系,从而在进行精准的广告投放、内容推荐、游戏推荐以及用户拉新等行为。
具体地,当信息推荐服务器104接收到信息推荐请求时,首先会根据信息推荐请求查找信息推荐请求对应的目标目标对象,其中社交分析请求中携带有信息推荐的目标对象的身份信息,信息推荐服务器104可以根据该身份信息在与服务器连接的数据库内进行查找,确定信息推荐请求对应的目标对象,同时确定查找确定这些分析输入的文本数据内容以及这些文本数据对应的具体输入时间。
步骤205,根据文本数据以及文本数据的输入时间,获取目标对象之间的联系属性,其中联系属性包括时间联系属性和文本联系属性。
其中时间联系属性是指各个目标对象在时间维度上的连接性,由于当目标对象在进行社交交流的时候,在相同时间段内通过社交软件、短信或者邮件等方式的文本内容来进行交流是一种主流的社交方式,当两个不同的用户在相同的时间都进行打字操作时,即可建立两者间的时间联系属性。本申请可以从时间维度来各个目标对象之间的社交关系。文本联系属性是指不同用户之间输入的文字内容是否具备关联性,能否视为同一段对话,如果能视为同一段对话,则能视为两个目标对象可能在进行一次会话,可以建立这两个目标对象之间的一个文本联系。此外,对于文本联系而言,由于处于相同时间段内的输入文本数据也可能属于同一会话,而处于不同时间段内的文本数据也可能构成同一会话,但是文本数据对应的输入时间也是辅助判断两个输入文本数据是否能构成一个会话的辅助因素,比如,可以根据输入的文本数据对应的输入时间判断文字内容的先后顺序,进而获得会话的文本,而后判断这段文本是否可以构成一个会话,进而获得各个目标对象之间的文本联系。
具体地,信息推荐服务器104可以根据查找到的目标对象输入的文本内容对应的输入时间,确定有哪些目标对象是在相同的时间段内都执行了文字内容的输入操作,进而确定不同的目标对象之间的时间联系属性。在其中一个实施例中,可以预设一些时间窗口,当两个目标对象都在同一个时间窗口内输入文字内容时,则可以建立这两个目标对象的一个时间联系属性。同时信息推荐服务器104可以根据查找到的目标对象输入的文本数据,以及这些文字内容对应的输入时间,对用户间输入的文字内容是否具备关联性进行判断,确定有哪些目标对象输入的文本数据可以构成一段会话,进而确定不同的目标对象之间的文本联系属性。在其中一个实施例中,可以将目标对象输入的文字内容进行分段处理,然后将两个用户间输入的文字内容根据输入时间的重组为一段文本,并判断这段文本能否视为一段会话,当可以视为一段会话时,则建立这两个目标对象的一个文本联系属性。
步骤207,根据时间联系属性和文本联系属性,获取目标对象之间的社交关系。
获得目标对象之间的社交关系具体是指通过时间联系属性与文本联系属性判断目标对象之间的社交关系。具体的,目标对象之间的社交关系的强弱可以通过连接度来进行表示,可以基于两个目标对象之间的时间联系属性与文本联系属性获得他们之间的连接度,连接度越高,则两个目标对象之间的社交关系越强。
具体地,当得到全量的时间联系属性与文本联系属性后,当需要得到目标对象对应的社交关系时,可以获取与他具有时间联系与文本联系的其他目标对象,并赋予时间联系和文本联系各自的权重,基于时间联系属性与时间联系权重以及文本联系属性与文本联系权重,计算目标对象之间社交关系的连接度。而后可以根据某个目标对象与其他所有目标对象的连接度进行降序排序,可以得到该目标对象与目标对象的社交关系的强弱,得到社交关系分析的结果。
步骤209,根据目标对象之间的社交关系对目标对象进行信息推荐。
具体地,得到的目标对象之间的社交关系具体是指某个目标对象与其他所有目标对象的连接度进行降序排序结果,即各个目标对象之间社交关系强弱的排序结果。连接度越高的两个目标对象之间的社交关系越强,当进行推荐时,可以基于这些社交关系来进行信息的推荐,比如在进行游戏推荐的时候,当目标对象A与目标对象B之间的社交关系较强时,如果通过分析发现目标对象A是当前待推荐游戏的用户,则可以优先向目标对象B进行游戏推荐,通过目标对象A与目标对象B之间的社交关系来达到精准推荐的效果。
上述信息推荐方法,通过首先获取信息推荐请求;查找信息推荐请求对应的目标对象,获取目标对象输入的文本数据以及文本数据的输入时间;根据文本数据以及文本数据的输入时间,获取目标对象之间的联系属性,其中联系属性包括时间联系属性和文本联系属性;根据时间联系属性和文本联系属性,获取目标对象之间的社交关系;而后根据目标对象之间的社交关系对目标对象进行信息推荐。本申请通过目标对象输入的文本数据,获取目标对象间的时间联系属性与文本联系属性,进而确定目标对象之间的社交关系,并根据目标对象之间的社交关系来进行信息的推荐,在社交关系的确定过程中,仅通过输入的文本数据就可以分析确定社交关系,社交关系的分析不会受到社交软件平台的限制,具备更强的灵活性,从而可以更灵活地进行信息推荐。
在一个实施例中,如图3所示,步骤203包括:
步骤302,提取信息推荐请求中的用户标识。
步骤304,根据用户标识在预设文本数据库内查找信息推荐请求对应的目标对象。
步骤306,获取目标对象输入的文本数据以及文本数据的输入时间。
其中,用户标识是指用于区分目标对象群体的标识,比如有的目标对象可以包含有年龄的标签,性别的标签等,也可以是信息推荐服务器内的目标对象对应的用户编号。终端102需要分析特定人群间的社交关系时,可以通过提交对应的标签到信息推荐服务器104,有信息推荐服务器进行相应的分析。预设文本数据库具体可以是指用户输入的文本数据内容所在数据库,具体的,预设文本数据库可以基于输入法的日志构建。输入法可以从各个不同的终端获取用户在不同应用平台上输入的文字内容。输入法可以是一种输入法,也可以是指多种不同的输入法。输入法的日志内包含有用户登录输入法的账号信息,对应目标对象的身份信息,还包含有目标对象通过输入法向设备输入的文本数据以及文本数据对应的输入时间。对于没有登录账号的用户,则可以通过IP地址或者是用户所用的输入终端对应的硬件识别码来进行判断。特别地,对于没有附带用户标识的信息推荐请求,可以默认为是对预设文本数据库内所有目标对象间的社交关系进行分析。
具体地,当信息推荐服务器104接收到信息推荐请求后,信息推荐服务器首先会提取信息推荐请求中的用户标识,以确定该信息推荐请求对应的目标目标对象,当得到用户标识后,则可以根据该用户标识在预设文本数据库内查找该信息推荐请求对应的目标对象。同时从该数据库内提取得到各个目标对象输入的文字内容和这些文字内容的输入时间。本实施例中,通过预设的用户标识来确定目标对象,能够达到高效确定信息推荐请求对应的目标目标对象群体的效果。
在一个实施例中,如图4所示,步骤205包括:
步骤401,根据输入时间,将目标对象输入的内容填写至相应的预设时间窗口。
步骤403,识别属于同一预设时间窗口内的目标对象。
步骤405,获取属于同一预设时间窗口内的目标对象之间的时间联系属性。
其中预设时间窗口具体是指一个特定的时间段,比如可以以10分钟为间隔,将20分钟作为一个时间窗口聚集在一起。如6点0分到6点20分可以作为一个时间窗口,6点10分到6点30分视为另一个时间窗口。当目标对象在时间窗口内存在输入的文本数据内容时,则可以将该目标对象填入该预设时间窗口。
具体地,目标对象的各个文字内容都有其对应的输入时间,可以根据这些输入时间将目标对象填充入各个预设的时间窗口之内,当两个目标对象处在一个预设时间窗口内时,则可以视为他们之间建立了一个时间联系属性,以此类推,就可以获得所有的目标对象之间的时间联系属性。本实施例中,通过预设的时间窗口可以有效地确定各个目标对象间的时间联系属性关系。
在一个实施例中,如图5所示,步骤205包括:
步骤502,建立目标对象之间的配对关系。
步骤504,根据文本数据对应的输入时间对文本数据进行分段处理,获得目标对象对应的文本段落。
步骤506,根据配对关系以及文本数据对应的输入时间,将不同目标对象之间的文本段落进行两两组合,获得关系文本。
步骤508,根据关系文本,获取目标对象之间的文本联系属性。
其中,建立目标对象之间的配对关系是指建立所有的目标对象之间的配对关系,比如在其中一个实施例中,目标对象包括用户A、用户B以及用户C,则可以建立三个配对关系,即用户A和用户B,用户A和用户C,用户B和用户C。分段处理具体是指可以将预设分段时间间隔内,目标对象输入的所有文本数据视为一个文本段落。该预设的分段时间间隔可以根据实际情况进行选取,比如预设的时间间隔为25分钟,用户A在10点10分输入了一句话,10点20分输入2句话。10点50输入了1句话,则10点10分和10点20分的可以视为是同一个文本段落,而10点50的视为另一个文本段落。而将不同目标对象之间的文本段落进行两两组合,获得关系文本的过程。则具体是指根据匹配到的两个文本段落中文字内容对应的输入时间的前后关系,将文本段落进行组合。如图用户A与用户B进行匹配之后,用户A的文本数据A1中包含有10点20输入的文本数据a1,10点25输入的文本数据a2,10点30输入的文本数据a3。,用户B的文本数据B1中包含有10点23输入的文本数据b1,10点26输入的文本数据b2。在将A1与B1组合后得到的关系文本则由a1、b1、a2、b2以及a3按顺序组成的。
具体地,当需要得到两个目标对象之间文本联系属性时,可以先对目标对象进行配对,而后将他们输入的文字内容分段,得到目标对象对应的各个文本段落。而后将不同用户间的文本段落组合起来,并根据组合后的关系文本来获得两个用户间的文本联系属性。其中,可以通过判断两个目标对象间文本段落组合后的关系文本是否属于同一个会话来获取两个目标对象间的文本联系属性,当它们属于同一个会话时,则可以判断两个目标对象进行了一次对话。他们之间的文本联系数增加。以此类推,就可获得所有的目标对象之间的文本联系属性。本实施例中,通过对目标对象输入的文本数据进行分段,而后进行组合可以有效地确定各个目标对象间的文本联系属性。
在一个实施例中,如图6所示,步骤508包括:
步骤601,将关系文本输入预设文本分类模型,获取关系文本分类结果,预设文本分类模型用于判断关系文本是否属于相同会话。
步骤603,根据配对后的目标对象之间的关系文本分类结果,获取目标对象之间的文本联系属性。
其中预设文本分类模型具体是指一个分类模型,用于判断输入的一段文字内容是否可以构成一个会话。
具体地,可以具体地,可以采取人工标注的方式给大量的对话打上标签(如标签1代表1段文本属于1次对话,标签0代表1段文本不是1次对话)。而后使用BERT(Bidirectional Encoder Representations from Transformers,双向编码器)模型或者CNN RNN Attention(深度学习)模型对这些带标注的数据进行学习和训练。当训练完毕,可以得到预设文本分类模型。该模型可用于判断一段文本是否属于一次对话或者一次交流。而后在得到关系文本后,将关系文本输入到该模型内,得到相应的文本分类结果,通过文本分类结果可以判断当前的关系文本是否属于一个会话,当属于一个会话时,则该关系文本对应的两个目标对象间的文本联系属性相应增加。本实施例中,通过预先训练好的人工智能模型来判断,可以有效地确定各个目标对象间的文本联系属性。
在一个实施例中,如图7所示,步骤207包括:
步骤702,根据时间联系属性与文本联系属性构建目标对象之间的无边双向连接图。
步骤704,根据预设时间联系属性权重、预设文本联系属性权重以及无边双向连接图获取目标对象之间连接度。
步骤706,根据连接度获取目标对象之间的社交关系。
其中无边双向连接图是将用户视为节点,文本联系属性与时间联系属性视为用户之间的连接线建立起来的图形。预设文本联系权重用于体现文本联系对于社交关系重要程度,预设时间联系属性权重用于体现时间联系属性对于社交关系重要程度。在其中一个实施例中,预设文本联系权重与预设时间联系属性权重均为0.5,在另一个实施例中,可以通过使用带标记的训练数据来对预设文本联系权重与预设时间联系属性权重进行调整,提高信息推荐的准确率。连接度用于体现目标对象之间社交关系强弱。根据预设文本联系权重、预设时间联系属性权重以及无边双向连接图获取目标对象之间连接度则具体是指,基于目标对象之间的文本联系数与预设文本联系权重的乘积,时间联系属性数与预设时间联系属性权重的乘积获取两个目标对象之间的连接度。比如,在无边双向连接图中,用户A与用户B的文本联系数为3,时间联系属性数为2,预设文本联系权重、预设时间联系属性权重都为0.5,则用户A与用户B之间的连接度则为(3*0.5+2*0.5)=2.5。
具体地,可以先根据得到的文本联系与时间联系属性来构建所有的文本联系用户之间的无边双向连接图,而后通过文本联系与时间联系属性各自的权重,获得各个目标对象之间连接度。而后连接度获取目标对象之间的社交关系。其中根据连接度获取目标对象之间的社交关系则具体和指,对于一个目标对象E,将他与其他目标对象之间的连接度进行降序排列,连接度越高的目标对象排越前面,则排越前面的目标对象与目标对象E的社交关系越强,而排越后面的则与用户E的社交关系越弱。具体的,无边双向连接图具体可以参照图8,如图8所示,在其中一个实施例中,目标对象可以用无边双向连接图的节点表示,节点之间的连接线则表示时间联系属性与文本联系,边对应的数字则表示对应的时间联系属性数或文本联系数,其中实线表示时间联系属性,虚线表示文本联系。图中设置时间联系属性和文本联系各自的权重为0.5,那么目标对象1和目标对象2之间的连接度为3x(0.5)+2x(0.5)=2.5,目标对象1和目标对象3之间的连接度为1x(0.5)+1x(0.5)=1,那么目标对象1和目标对象2的社交关系强于目标对象1与目标对象3的社交关系(2.5>1)。根据某个节点与其他所有节点的连接程度进行降序排序,可以得到该节点目标对象与其他节点目标对象的社交关系的强弱。通过无边双向连接图与权重的设置,可以提高社交关系分析的准确率,从而提高信息推荐的准确率。
在一个实施例中,步骤203之前,还包括:对目标对象的身份信息进行数字化处理,对目标对象输入的文本数据进行文本向量化处理。
其中,对目标对象的身份信息进行数字化处理具体是指通过目标对象对应的用户编号来表示用户的身份信息,防止信息推荐过程中用户的具体身份暴露造成的隐私问题。而对目标对象输入的文字内容进行文本向量化处理则是用户输入的内容转化为文本特征向量表示,进一步保护目标对象的隐私安全。
具体地,在将目标对象的身份信息以及目标对象对应的输入法日志导入到预设文本数据库时,就可以将目标对象的身份信息进行数字化处理,同时对导入到预设文本数据库中的输入内容进行文本向量化处理,从而目标对象对应的身份信息是数字化处理后的身份信息,目标对象输入的文字内容也是文本向量化处理后的文字内容。本实施例中,通过对目标对象的数字化处理以及对内容文本的文本向量化处理,可以有效保护目标对象的隐私安全。
本申请还提供一种应用场景,该应用场景应用上述的信息推荐方法。具体地,该信息推荐方法在该应用场景的应用如下:如图9所示,用户A与用户B可以在电脑端发邮件,用户C可以在电脑端通过社交平台1发送消息,用户D则可以在手机端通过社交平台1发送消息。他们都是通过终端上的输入法客户端来输入文字内容,虽然用户可以在不同的平台通过输入法发送内容,输入法客户端也不知道用户的打字内容是发给谁,但是通过本发明方案可以分析得到用户A和用户B的社交关系可能比较紧密,用户C和用户D的社交关系比较紧密,从而可以根据各个用户之间的社交关系来进行信息的推荐。如图10所示,上述的输入法可以是指多种输入法,如对于输入法A以及输入法B,用户1、用户2以及用户3使用输入法A,而用户4、用户5以及用户6使用输入法B。通过本申请的信息推荐方法,还是可以分析得到各个用户之间的社交关系。例如,当某个广告商在希望得到上述用户之间的社交关系,以进行广告投放时,可以向执行本申请信息推荐方法的信息推荐服务器提交信息推荐请求。服务器接收信息推荐请求,而后提取信息推荐请求中的用户标识;根据用户标识在预设文本数据库内查找信息推荐请求对应的目标对象,确定指定的目标对象为上述用户;同时获取目标对象输入的文字内容以及文字内容对应的输入时间。而后根据输入时间将目标对象填入预设时间窗口;识别属于同一预设时间窗口内的目标对象;获取属于同一预设时间窗口内的目标对象之间的时间联系属性。同时建立目标对象之间的配对关系;根据文字内容对应的输入时间对文字内容进行分段处理,获得目标对象对应的文本段落;根据配对关系以及文字内容对应的输入时间,将不同目标对象之间的文本段落进行两两组合,获得关系文本;并将关系文本输入预设文本分类模型,获取关系文本分类结果,预设文本分类模型用于判断关系文本是否属于相同会话;根据配对后的目标对象之间的关系文本分类结果,获取目标对象之间的文本联系。根据时间联系属性与文本联系构建目标对象之间的无边双向连接图;根据预设文本联系权重、预设时间联系属性权重以及无边双向连接图获取目标对象之间连接度;根据连接度获取目标对象之间的社交关系。而后通过获得的社交关系来进行精准的广告信息投放推荐。
图11为一个实施例中信息推荐方法的流程示意图。应该理解的是,虽然图11的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图11中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图12所示,提供了一种信息推荐装置,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:请求接收模块801、信息查找模块803、联系属性获取模块805、社交关系分析模块807和信息推荐模块809,其中:
请求接收模块801,用于获取信息推荐请求;
信息查找模块803,用于查找信息推荐请求对应的目标对象,获取目标对象输入的文本数据以及文本数据的输入时间;
联系属性获取模块805,用于根据文本数据以及文本数据的输入时间,获取目标对象之间的联系属性,其中联系属性包括时间联系属性和文本联系属性;
社交关系分析模块807,用于根据时间联系属性和文本联系属性,获取目标对象之间的社交关系;
信息推荐模块809,用于根据目标对象之间的社交关系对目标对象进行信息推荐。在其中一个实施例中,信息查找模块803具体用于:提取信息推荐请求中的用户标识;根据用户标识在预设文本数据库内查找信息推荐请求对应的目标对象;获取目标对象输入的文本数据以及文本数据的输入时间。
在其中一个实施例中,联系属性获取模块805具体用于:根据输入时间,将目标对象分割填写至不同的预设时间窗口;识别属于同一预设时间窗口内的目标对象;获取属于同一预设时间窗口内的目标对象之间的时间联系属性。
在其中一个实施例中,联系属性获取模块805还具体用于:建立目标对象之间的配对关系;根据文本数据对应的输入时间对文本数据进行分段处理,获得目标对象对应的文本段落;根据配对关系以及文本数据对应的输入时间,将不同目标对象之间的文本段落进行两两组合,获得关系文本;根据关系文本,获取目标对象之间的文本联系属性。
在其中一个实施例中,联系属性获取模块805还用于:将关系文本输入预设文本分类模型,获取关系文本分类结果,预设文本分类模型用于判断关系文本是否属于相同会话;根据配对后的目标对象之间的关系文本分类结果,获取目标对象之间的文本联系属性。
在其中一个实施例中,社交关系分析模块807具体用于:根据时间联系属性和文本联系属性构建目标对象之间的无边双向连接图;根据预设时间联系属性权重、预设文本联系属性权重以及无边双向连接图获取目标对象之间连接度;根据连接度获取目标对象之间的社交关系。
在其中一个实施例中,还包括信息加密模块,用于:对目标对象的身份信息进行数字化处理,对目标对象输入的文本数据进行文本向量化处理。
关于信息推荐装置的具体限定可以参见上文中对于信息推荐方法的限定,在此不再赘述。上述信息推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图13所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储信息推荐数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信息推荐方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图13所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种信息推荐方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图13中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种信息推荐方法,所述方法包括:
获取信息推荐请求;
查找所述信息推荐请求对应的目标对象,获取所述目标对象输入的文本数据以及所述文本数据的输入时间;
根据所述文本数据以及所述文本数据的输入时间,获取所述目标对象之间的联系属性,其中所述联系属性包括时间联系属性和文本联系属性;
根据所述时间联系属性和所述文本联系属性,获取所述目标对象之间的社交关系;
根据所述目标对象之间的社交关系对所述目标对象进行信息推荐。
2.根据权利要求1所述的方法,其特征在于,所述查找所述信息推荐请求对应的目标对象,获取所述目标对象输入的文本数据以及所述文本数据的输入时间包括:
提取所述信息推荐请求中的用户标识;
根据所述用户标识在预设文本数据库内查找所述信息推荐请求对应的目标对象;
获取所述目标对象输入的文本数据以及所述文本数据的输入时间。
3.根据权利要求1所述的方法,其特征在于,所述根据所述文本数据以及所述文本数据的输入时间,获取所述目标对象之间的联系属性包括:
根据所述输入时间,将所述目标对象分割填写至不同的预设时间窗口;
识别属于同一预设时间窗口内的所述目标对象;
获取属于同一预设时间窗口内的所述目标对象之间的时间联系属性。
4.根据权利要求1所述的方法,其特征在于,所述根据所述文本数据以及所述文本数据的输入时间,获取所述目标对象之间的联系属性包括:
建立所述目标对象之间的配对关系;
根据所述文本数据对应的输入时间对所述文本数据进行分段处理,获得目标对象对应的文本段落;
根据所述配对关系以及所述文本数据对应的输入时间,将不同目标对象之间的所述文本段落进行两两组合,获得关系文本;
根据所述关系文本,获取所述目标对象之间的文本联系属性。
5.根据权利要求4所述的方法,其特征在于,所述根据所述关系文本,获取所述目标对象之间的文本联系属性包括:
将所述关系文本输入预设文本分类模型,获取所述关系文本分类结果,所述预设文本分类模型用于判断所述关系文本是否属于相同会话;
根据配对后的所述目标对象之间的关系文本分类结果,获取所述目标对象之间的文本联系属性。
6.根据权利要求1所述的方法,其特征在于,所述根据所述时间联系属性和所述文本联系属性,获取所述目标对象之间的社交关系包括:
根据所述时间联系属性和所述文本联系属性构建所述目标对象之间的无边双向连接图;
根据预设时间联系属性权重、预设文本联系属性权重以及所述无边双向连接图获取所述目标对象之间连接度;
根据所述连接度获取所述目标对象之间的社交关系。
7.根据权利要求1所述的方法,其特征在于,所述查找所述信息推荐请求对应的目标对象,获取所述目标对象输入的文本数据以及所述文本数据的输入时间之前,还包括:
对目标对象的身份信息进行数字化处理,对目标对象输入的文本数据进行文本向量化处理。
8.一种信息推荐装置,其特征在于,所述装置包括:
请求接收模块,用于获取信息推荐请求;
信息查找模块,用于查找所述信息推荐请求对应的目标对象,获取所述目标对象输入的文本数据以及所述文本数据的输入时间;
联系属性获取模块,用于根据所述文本数据以及所述文本数据的输入时间,获取所述目标对象之间的联系属性,其中所述联系属性包括时间联系属性和文本联系属性;
社交关系分析模块,用于根据所述时间联系属性和所述文本联系属性,获取所述目标对象之间的社交关系;
信息推荐模块,用于根据目标对象之间的社交关系对所述目标对象进行信息推荐。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202010149764.2A 2020-03-06 2020-03-06 信息推荐方法、装置、计算机设备和存储介质 Active CN111368214B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010149764.2A CN111368214B (zh) 2020-03-06 2020-03-06 信息推荐方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010149764.2A CN111368214B (zh) 2020-03-06 2020-03-06 信息推荐方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN111368214A CN111368214A (zh) 2020-07-03
CN111368214B true CN111368214B (zh) 2023-03-21

Family

ID=71207045

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010149764.2A Active CN111368214B (zh) 2020-03-06 2020-03-06 信息推荐方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN111368214B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112231567A (zh) * 2020-10-20 2021-01-15 王明烨 一种精确推送信息的方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239298A (zh) * 2013-06-06 2014-12-24 腾讯科技(深圳)有限公司 文本信息推荐方法、服务器、浏览器及系统
CN107145545A (zh) * 2017-04-18 2017-09-08 东北大学 一种基于位置的社交网络中Top‑k区域用户文本数据推荐方法
CN107783948A (zh) * 2017-10-10 2018-03-09 湖北文理学院 一种基于社交网络原理的词汇社交网络分析方法
CN110298029A (zh) * 2019-05-22 2019-10-01 平安科技(深圳)有限公司 基于用户语料的好友推荐方法、装置、设备及介质
CN110347915A (zh) * 2019-06-10 2019-10-18 贝壳技术有限公司 一种信息推送方法和装置
CN110659395A (zh) * 2019-08-14 2020-01-07 平安科技(深圳)有限公司 关系网络图谱构建方法、装置、计算机设备和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8117281B2 (en) * 2006-11-02 2012-02-14 Addnclick, Inc. Using internet content as a means to establish live social networks by linking internet users to each other who are simultaneously engaged in the same and/or similar content

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239298A (zh) * 2013-06-06 2014-12-24 腾讯科技(深圳)有限公司 文本信息推荐方法、服务器、浏览器及系统
CN107145545A (zh) * 2017-04-18 2017-09-08 东北大学 一种基于位置的社交网络中Top‑k区域用户文本数据推荐方法
CN107783948A (zh) * 2017-10-10 2018-03-09 湖北文理学院 一种基于社交网络原理的词汇社交网络分析方法
CN110298029A (zh) * 2019-05-22 2019-10-01 平安科技(深圳)有限公司 基于用户语料的好友推荐方法、装置、设备及介质
CN110347915A (zh) * 2019-06-10 2019-10-18 贝壳技术有限公司 一种信息推送方法和装置
CN110659395A (zh) * 2019-08-14 2020-01-07 平安科技(深圳)有限公司 关系网络图谱构建方法、装置、计算机设备和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Deep Learning Based Recommender System: A Survey and New Perspectives;Shuai Zhang等;《ACM Computing Survey》(第5期);第1-38页 *
基于社交关系和时序主题的微博好友推荐算法研究;程转丽;《中国优秀硕士学位论文全文数据库信息科技辑》(第01期);I138-2110 *

Also Published As

Publication number Publication date
CN111368214A (zh) 2020-07-03

Similar Documents

Publication Publication Date Title
CN108280115B (zh) 识别用户关系的方法及装置
CN110569377B (zh) 一种媒体文件的处理方法和装置
US10404629B2 (en) Automatic reply method, device, apparatus, and storage medium
US20170289619A1 (en) Method for positioning video, terminal apparatus and cloud server
CN111932144B (zh) 一种客服坐席分配方法、装置、服务器及存储介质
CN108369709B (zh) 用于基于网络的广告数据业务时延减小的系统和方法
CN112350923B (zh) 会话消息展示方法、装置、计算机设备和存储介质
US10572778B1 (en) Machine-learning-based systems and methods for quality detection of digital input
CN110401545B (zh) 聊天群组创建方法、装置、计算机设备和存储介质
CN106874253A (zh) 识别敏感信息的方法及装置
US20230091110A1 (en) Joint embedding content neural networks
CN111159570B (zh) 一种信息推荐方法及服务器
US9619780B2 (en) Information exchange in the social network environment
CN110022399B (zh) 消息展示方法、装置、用户终端及可读存储介质
US11323404B2 (en) System and method for displaying message or user lists
CN112989065A (zh) 应用于大数据用户画像分析的信息处理方法和云计算平台
CN111368214B (zh) 信息推荐方法、装置、计算机设备和存储介质
CN114357278A (zh) 一种话题推荐方法、装置及设备
CN108401005B (zh) 一种表情推荐方法和装置
CN113411246B (zh) 一种回复处理方法、装置和用于回复处理的装置
CN111506718A (zh) 会话消息确定方法、装置、计算机设备和存储介质
JP6937707B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN110717094A (zh) 信息推荐方法、装置、计算机设备和存储介质
CN111787042A (zh) 用于推送信息的方法和装置
CN107357562A (zh) 一种信息填充方法、装置及客户端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant