CN106411683A - 一种关键社交信息的确定方法及装置 - Google Patents

一种关键社交信息的确定方法及装置 Download PDF

Info

Publication number
CN106411683A
CN106411683A CN201510458735.3A CN201510458735A CN106411683A CN 106411683 A CN106411683 A CN 106411683A CN 201510458735 A CN201510458735 A CN 201510458735A CN 106411683 A CN106411683 A CN 106411683A
Authority
CN
China
Prior art keywords
social information
forwarding
information
social
candidate key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510458735.3A
Other languages
English (en)
Other versions
CN106411683B (zh
Inventor
尚利峰
李菁
黄锦辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201510458735.3A priority Critical patent/CN106411683B/zh
Priority to US15/223,836 priority patent/US20170034111A1/en
Publication of CN106411683A publication Critical patent/CN106411683A/zh
Application granted granted Critical
Publication of CN106411683B publication Critical patent/CN106411683B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/322Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/154Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种关键社交信息的确定方法及装置,方法为,获取原始社交信息的直接转发社交信息和间接转发社交信息,建立社交信息转发树;并获取该社交信息转发树上的每一个转发社交信息的信息特征;根据每一个转发社交信息的信息特征,确定该转发社交信息的特征向量;将得到的特征向量输入预设的筛选模型,获取候选关键社交信息;根据每一个候选关键社交信息的关键性评估值,从所有候选关键社交信息中选取最终的关键社交信息。采用本发明技术方案,综合考虑直接转发社交信息和间接转发社交信息,从原始社交信息的所有转发社交信息中选取关键社交信息,提高了选取结果的准确率。

Description

一种关键社交信息的确定方法及装置
技术领域
本发明涉及互联网技术领域和计算机技术领域,尤其涉及一种关键社交信息的确定方法及装置。
背景技术
在现有的互联网应用中,社交网络得到了广泛的应用和快速的发展,如微博等。在社交网络中,社交对象(即用户)可以发布各种媒体形式的信息,如文字、图片、视频等,也可以浏览其他社交对象发布的信息。为了便于各社交对象之间的交流,社交对象之间可以建立关注和被关注的关系,社交对象之间可以互相浏览对方展示的社交信息,并转发以及评论该社交信息。
一条社交信息被发布以后,能够得到其他社交用户的转发,该转发过程可以仅仅转发上述社交信息,还可以在转发上述社交信息的同时,针对该社交信息发表自身的观点。由此可见,一条原始社交信息可以拥有大量的转发社交信息,该转发社交信息包含直接转发社交信息和间接转发社交信息,其中,直接转发社交信息即为转发原始社交信息的信息,间接转发社交信息即为转发直接转发社交信息的信息。在统计一个原始社交信息所造成的影响力时,通常需要从大量的转发社交信息中选取最具代表性的转发社交信息(即关键转发社交信息),该最具代表性的转发社交信息能够表征广大社交对象对原始社交信息中所描述信息的反映。
目前,从转发社交信息中确定最具代表性的转发社交信息的方法为:从所有直接转发社交信息中提取转发次数最多的直接转发社交信息,将提取得到的直接转发社交信息作为最具代表性的转发社交信息;或者,获取所有直接转发社交信息的社交对象,从获取的所有社交对象中提取知名度最高的社交对象,将该知名度最高的社交对象的直接转发社交信息作为最具代表性的转发社交信息。采用该技术方案,仅考虑直接转发社交信息的特性,导致最终获取的最具代表性的转发社交信息较为片面。
由此可见,目前在从转发社交信息中选取关键转发社交信息的过程中,存在选取结果准确率低的问题。
发明内容
本发明实施例提供一种关键社交信息的确定方法及装置,用以解决目前在从转发社交信息中选取关键转发社交信息的过程中,存在选取结果准确率低的问题。
本发明实施例提供的具体技术方案如下:
第一方面,本发明提供一种关键社交信息的确定方法,包括:根据待确定的原始社交信息以及所述原始社交信息的转发社交信息,生成社交信息转发树;其中,所述转发社交信息为包含直接或间接转发所述原始社交信息的信息;所述社交信息转发树为树状结构,所述原始社交信息为所述树状结构的根节点,所述转发社交信息为所述树状结构的叶子节点和所述根节点和叶子节点之间的中间节点;分别根据每一个转发社交信息的信息特征,获取所述每一个转发社交信息的特征向量;其中,所述信息特征包括文本特征和与所述社交信息转发树关联的特征;每一个转发社交信息的特征向量中包含表征该转发社交信息的文本特征的向量,以及表征该转发社交信息的与社交信息转发树关联的特征的向量;分别将所述每一个转发社交信息的特征向量输入预设的筛选模型,获取所有转发社交信息中包含的候选关键社交信息;分别计算每一个候选关键社交信息对应的关键性评估值;从所有候选关键社交信息中,选取关键性评估值从高到低的预设数目个候选关键社交信息,将选取的候选关键社交信息确定为关键社交信息。
结合第一方面,在第一方面第一种可能的实现方式中,分别根据每一个转发社交信息的信息特征,获取所述每一个转发社交信息的特征向量,具体包括:
针对所述社交信息转发树中的任意一转发社交信息,执行如下操作:从所述任意一转发社交信息的内容中,提取所述任意一转发社交信息的文本特征;采用预设算法,分别将所述任意一转发社交信息的文本特征中包含的各个特征量转换为数值形式的特征量,并根据所有数值形式的特征量,获取所述任意一转发社交信息对应的文本特征向量;根据在所述社交信息转发树中,所述任意一转发社交信息所代表的节点的位置信息,和/或在所述社交信息转发树中,与所述任意一转发社交信息所代表的节点互为兄弟节点的节点数目,获取所述任意一转发社交信息对应的与社交信息转发树关联的特征向量;将所述文本特征向量和所述与社交信息转发树关联的特征向量进行合并处理,获取所述任意一个转发社交信息的特征向量;所述合并处理为将所述文本特征向量和所述与社交信息转发树关联的特征向量进行上下合并;或者,将所述文本特征向量和所述与社交信息转发树关联的特征向量进行左右合并。
结合第一方面,或者第一方面第一种可能的实现方式,在第二种可能的实现方式中,所述筛选模型的生成方法,包括:从历史数据中,获取任意一训练原始社交信息的训练转发社交信息;分别根据每一个训练转发社交信息的信息特征,生成所述每一个训练转发社交信息的特征向量;其中,每一个训练转发社交信息的特征向量中包含表征该训练转发社交信息的文本特征的向量,以及表征该训练转发社交信息的与社交信息转发树关联的特征的向量;采用预设的筛选算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;根据所述筛选参数,生成筛选模型。
结合第一方面第一种可能的实现方式或者第二种可能的实现方式,在第三种可能的实现方式中,采用预设的筛选算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数,具体包括:采用支持向量机算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,采用感知机神经网络算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,分别根据所述每一个训练转发社交信息的特征向量,以及所述每一个训练转发社交信息之间的转发关系,生成输入序列;并根据所述已知的每一个训练转发社交信息的筛选分类结果,生成输出序列;建立所述输入序列和所述输出序列之间的相关性函数;根据所述已知的每一个训练转发社交信息的筛选分类结果,确定所述相关性函数的参数;将所述参数确定为所述筛选参数。
结合第一方面第三种可能的实现方式,在第四种可能的实现方式中,建立所述输入序列和所述输出序列之间的相关性函数,具体包括:根据所述输入序列中包含的每一个训练特征向量之间的转发关系,以及所述输入序列中包含的每一个训练特征向量和输出序列中包含的每一个筛选分类结果之间的关系,建立所述输入序列和所述输出序列之间的链路关系表;针对所述输入序列中的任意一训练特征向量,执行如下操作:采用预设宽度的窗口,对所述链路关系表进行扫描;其中,当前扫描的窗口包含所述任意一向量;根据当前扫描的窗口中包含的输出序列中的筛选分类结果和所述任意一训练特征向量,生成第一局部相关性函数;并根据当前扫描的窗口中包含的输出序列中的筛选分类结果,生成第二局部相关性函数;分别根据所述输入序列中包含的每一个向量对应的第一局部相关性函数和第二局部相关性函数,建立所述输入序列和所述输出序列之间的相关性函数。
结合第一方面,第一方面第一种可能的实现方式至第四种可能的实现方式中的任意一项,在第五种可能的实现方式中,分别计算每一个候选关键社交信息对应的关键性评估值,具体包括:根据所述候选关键社交信息,构建候选关键社交信息图;其中,所述关键社交信息图中包含所有候选关键社交信息,且每两个候选关键社交信息之间互相连接;针对所述候选关键社交信息图中的任意一候选关键社交信息,分别获取所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值;根据所述候选关键社交信息图中所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值,确定所述任意一候选关键社交信息对应的关键性评估值。
结合第一方面第五种可能的实现方式,在第六种可能的实现方式中,所述关键性评估值满足如下公式:其中,Rt(v)为第t次迭代后得到的关键性评估值;λ为预设系数;R0(v)为候选关键社交信息v被转发的次数;n为在所述候选关键社交信息图中,与所述候选关键社交信息v存在关联的候选关键社交信息的数目;Rt-1(v)为第t次迭代后得到的关键性评估值;p(ui→v)为与所述候选关键社交信息v存在关联的候选关键社交信息ui和所述候选关键社交信息v之间的相关性值;
第二方面,提供一种关键社交信息的确定装置,包括:社交信息转发树生成单元,用于根据待确定的原始社交信息以及所述原始社交信息的转发社交信息,生成社交信息转发树;其中,所述转发社交信息为包含直接或间接转发所述原始社交信息的信息;所述社交信息转发树为树状结构,所述原始社交信息为所述树状结构的根节点,所述转发社交信息为所述树状结构的叶子节点和所述根节点和叶子节点之间的中间节点;特征向量获取单元,用于分别根据每一个转发社交信息的信息特征,获取所述每一个转发社交信息的特征向量;其中,所述信息特征包括文本特征和与所述社交信息转发树关联的特征;每一个转发社交信息的特征向量中包含表征该转发社交信息的文本特征的向量,以及表征该转发社交信息的与社交信息转发树关联的特征的向量;候选关键社交信息获取单元,用于分别将所述特征向量获取单元获取的每一个转发社交信息的特征向量输入预设的筛选模型,获取所有转发社交信息中包含的候选关键社交信息;关键性评估值计算单元,用于分别计算所述候选关键社交信息获取单元获取的每一个候选关键社交信息对应的关键性评估值;关键社交信息确定单元,用于根据所述关键性评估值计算单元计算得到的每一个候选关键社交信息对应的关键性评估值,从所有候选关键社交信息中,选取关键性评估值从高到低的预设数目个候选关键社交信息,将选取的候选关键社交信息确定为关键社交信息。
结合第二方面,在第一种可能的实现方式中,所述特征向量获取单元,用于:针对所述社交信息转发树中的任意一转发社交信息,执行如下操作:从所述任意一转发社交信息的内容中,提取所述任意一转发社交信息的文本特征;采用预设算法,分别将所述任意一转发社交信息的文本特征中包含的各个特征量转换为数值形式的特征量,并根据所有数值形式的特征量,获取所述任意一转发社交信息对应的文本特征向量;根据在所述社交信息转发树中,所述任意一转发社交信息所代表的节点的位置信息,和/或在所述社交信息转发树中,与所述任意一转发社交信息所代表的节点互为兄弟节点的节点数目,获取所述任意一转发社交信息对应的与社交信息转发树关联的特征向量;将所述文本特征向量和所述与社交信息转发树关联的特征向量进行合并处理,获取所述任意一个转发社交信息的特征向量;所述合并处理为将所述文本特征向量和所述与社交信息转发树关联的特征向量进行上下合并;或者,将所述文本特征向量和所述与社交信息转发树关联的特征向量进行左右合并。
结合第二方面,或者第二方面第一种可能的实现方式,在第二种可能的实现方式中,还包括筛选模型生成单元,用于:从历史数据中,获取任意一训练原始社交信息的训练转发社交信息;分别根据每一个训练转发社交信息的信息特征,生成所述每一个训练转发社交信息的特征向量;其中,每一个训练转发社交信息的特征向量中包含表征该训练转发社交信息的文本特征的向量,以及表征该训练转发社交信息的与社交信息转发树关联的特征的向量;采用预设的筛选算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;根据所述筛选参数,生成筛选模型。
结合第二方面第一种可能的实现方式或者第二种可能的实现方式,在第三种可能的实现方式中,筛选模型生成单元采用预设的筛选算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数,具体包括:
采用支持向量机算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,采用感知机神经网络算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,分别根据所述每一个训练转发社交信息的特征向量,以及所述每一个训练转发社交信息之间的转发关系,生成输入序列;并根据所述已知的每一个训练转发社交信息的筛选分类结果,生成输出序列;建立所述输入序列和所述输出序列之间的相关性函数;根据所述已知的每一个训练转发社交信息的筛选分类结果,确定所述相关性函数的参数;将所述参数确定为所述筛选参数。
结合第二方面第三种可能的实现方式,在第四种可能的实现方式中,所述筛选模型生成单元建立所述输入序列和所述输出序列之间的相关性函数,具体包括:根据所述输入序列中包含的每一个特征向量之间的转发关系,以及所述输入序列中包含的每一个特征向量和输出序列中包含的每一个筛选分类结果之间的关系,建立所述输入序列和所述输出序列之间的链路关系表;针对所述输入序列中的任意一特征向量,执行如下操作:采用预设宽度的窗口,对所述链路关系表进行扫描;其中,当前扫描的窗口包含所述任意一向量;根据当前扫描的窗口中包含的输出序列中的筛选分类结果和所述任意一特征向量,生成第一局部相关性函数;并根据当前扫描的窗口中包含的输出序列中的筛选分类结果,生成第二局部相关性函数;分别根据所述输入序列中包含的每一个向量对应的第一局部相关性函数和第二局部相关性函数,建立所述输入序列和所述输出序列之间的相关性函数。
结合第二方面,第二方面第一种可能的实现方式至第四种可能的实现方式中的任意一项,在第五种可能的实现方式中,所述关键性评估值计算单元,具体用于:根据所述候选关键社交信息,构建候选关键社交信息图;其中,所述关键社交信息图中包含所有候选关键社交信息,且每两个候选关键社交信息之间互相连接;针对所述候选关键社交信息图中的任意一候选关键社交信息,分别获取所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值;根据所述候选关键社交信息图中所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值,确定所述任意一候选关键社交信息对应的关键性评估值。
结合第二方面第五种可能的实现方式,在第六种可能的实现方式中,所述关键性评估值计算单元计算得到的关键性评估值满足如下公式:
其中,Rt(v)为第t次迭代后得到的关键性评估值;λ为预设系数;R0(v)为候选关键社交信息v被转发的次数;n为在所述候选关键社交信息图中,与所述候选关键社交信息v存在关联的候选关键社交信息的数目;Rt-1(v)为第t次迭代后得到的关键性评估值;p(ui→v)为与所述候选关键社交信息v存在关联的候选关键社交信息ui和所述候选关键社交信息v之间的相关性值;
本发明实施例中,获取原始社交信息的直接转发社交信息和间接转发社交信息,建立社交信息转发树;并获取该社交信息转发树上的每一个转发社交信息的信息特征;根据每一个转发社交信息的信息特征,确定该转发社交信息的特征向量;将得到的特征向量输入预设的筛选模型,获取候选关键社交信息;根据每一个候选关键社交信息的关键性评估值,从所有候选关键社交信息中选取最终的关键社交信息。采用本发明技术方案,综合考虑直接转发社交信息和间接转发社交信息,从原始社交信息的所有转发社交信息中选取关键社交信息,避免了仅从直接转发社交信息中选取关键社交信息时造成的选取结果片面的问题,提高了选取结果的准确率;并且,在关键社交信息的选取过程中,以转发社交信息的内容和与社交信息转发树关联的特征作为选取关键社交信息的参考因素,进一步提高了最终选取结果的准确率。
附图说明
图1为本发明实施例中确定关键社交信息的流程图;
图2为本发明实施例中社交信息转发树示意图;
图3为本发明实施例中生成筛选模型流程图;
图4a为本发明实施例中链路关系表示意图;
图4b为本发明实施例中第二局部相关性函数的预设特征取值关系表;
图5为本发明实施例中候选关键社交信息图;
图6为本发明实施例中关键社交信息的确定装置结构示意图;
图7为本发明实施例中关键社交信息的确定设备结构示意图。
具体实施方式
为了解决目前在从转发社交信息中选取关键转发社交信息的过程中,存在选取结果准确率低的问题。本发明实施例中,获取原始社交信息的直接转发社交信息和间接转发社交信息,建立社交信息转发树;并获取该社交信息转发树上的每一个转发社交信息的信息特征;根据每一个转发社交信息的信息特征,确定该转发社交信息的特征向量;将得到的特征向量输入预设的筛选模型,获取候选关键社交信息;根据每一个候选关键社交信息的关键性评估值,从所有候选关键社交信息中选取最终的关键社交信息。采用本发明技术方案,综合考虑直接转发社交信息和间接转发社交信息,从原始社交信息的所有转发社交信息中选取关键社交信息,避免了仅从直接转发社交信息中选取关键社交信息时造成的选取结果片面的问题,提高了选取结果的准确率;并且,在关键社交信息的选取过程中,以转发社交信息的内容和与社交信息转发树关联的特征作为选取关键社交信息的参考因素,进一步提高了最终选取结果的准确率。
本发明实施例中,可以由任意一具备数据处理能力的终端执行关键社交信息的确定操作,如该终端为服务器,或者,该终端为计算机等。
下面结合说明书附图,对本发明实施例作进一步详细描述。
参阅图1所示,本发明实施例中,关键社交信息的确定方法,包括:
步骤100:根据待确定的原始社交信息以及所述原始社交信息的转发社交信息,生成社交信息转发树;其中,所述转发社交信息为包含直接或间接转发所述原始社交信息的信息;所述社交信息转发树为树状结构,所述原始社交信息为所述树状结构的根节点,所述转发社交信息为所述树状结构的叶子节点和所述根节点和叶子节点之间的中间节点。
本发明实施例中,终端获取待确定的原始社交信息,以及直接或间接转发该原始社交信息的转发社交信息;根据该原始社交信息,以及各个转发社交信息之间的转发关系,生成社交信息转发树。
在生成的社交信息转发树中,以原始社交信息为根节点,以各个转发社交信息为叶子节点和中间节点,其中,当存在任意一转发社交信息,不存在任何社交用户转发该任意一转发社交信息时,该任意一转发社交信息即作为社交信息转发树上的叶子节点,否则,任意一转发社交信息即作为在社交信息转发树上的中间节点;并且,每一个转发社交信息所代表的节点在该社交信息转发树上的位置,根据各个转发社交信息之间的转发关系确定。例如,参阅图2所示,为社交信息转发树示意图,原始社交信息A的转发社交信息为转发社交信息1,转发社交信息11,转发社交信息12,转发社交信息2,转发社交信息21,其中,转发社交信息1和转发社交信息2为直接转发社交信息,转发社交信息11,转发社交信息12和转发社交信息21为间接转发社交信息,根据该社交信息转发树可知,转发社交信息1被转发了两次,即转发所述转发社交信息1的转发社交信息11和转发社交信息12;转发社交信息2被转发了一次,即转发所述转发社交信息2的转发社交信息21。可选的,上述社交信息转发树中还可以记录每一个转发社交信息的评论数。
由此可见,根据该社交信息转发树,能够更为直观地确定每一个转发社交信息在信息转发过程中的位置、兄弟节点和子节点,以及每一个转发社交信息被转发的次数和评论数。
采用上述技术方案,终端根据原始社交信息的转发社交信息,生成社交信息转发树,终端能够根据该社交信息转发树更为快捷地确定每一个转发社交信息的与所述社交信息转发树关联的特征,便于更加快速地确定关键社交信息,提高了数据处理速度。
步骤110:分别根据所述社交信息转发树中每一个转发社交信息的信息特征,获取所述每一个转发社交信息的特征向量;其中,所述信息特征包括文本特征和与所述社交信息转发树关联的特征;每一个转发社交信息的特征向量中包含表征该转发社交信息的文本特征的向量,以及表征该转发社交信息的与社交信息转发树关联的特征的向量。
本发明实施例中,终端获取社交信息转发树中包含的每一个转发社交信息的信息特征,其中,该信息特征包含文本特征和与社交信息转发树关联的特征,该文本特征由转发社交信息的内容确定,与社交信息转发树关联的特征由转发社交信息在社交信息转发树上的位置确定;终端根据获取的每一个转发社交信息的信息特征,生成该转发社交信息的特征向量。
具体的,终端生成所述每一个转发社交信息的特征向量的过程,包括:针对所述社交信息转发树中的任意一转发社交信息,执行如下操作,根据所述任意一转发社交信息的内容,提取所述任意一转发社交信息的文本特征,其中,该文本特征可以为任意一转发社交信息包含的词,二元语法,词性,表情符号,地址链接等;以及根据所述任意一转发社交信息在所述社交信息转发树上的位置信息,和/或在所述社交信息转发树中,与所述任意一转发社交信息所代表的节点互为兄弟节点的节点数目,获取所述与社交信息转发树关联的特征,其中,与社交信息转发树关联的特征可以为任意一转发社交信息的转发次数,评论数等;采用预设算法,对所述文本特征进行运算,获取所述任意一转发社交信息对应的文本特征向量;以及获取所述任意一转发社交信息对应的与社交信息转发树关联的特征向量;将所述文本特征向量和所述与社交信息转发树关联的特征向量进行合并处理,获取所述任意一转发社交信息的特征向量。
可选的,在上述过程中,当文本特征为任意一转发社交信息包含的词,二元语法,词性时,终端可以首先对该任意一转发社交信息中包含的文字内容进行分词划分,并根据分词划分结果,确定该任意一转发社交信息包含的词,每一个词的词性,以及该任意一转发社交信息对应的二元语法等。当文本特征为表情符号,地址链接等时,终端可以将该任意一转发社交信息中包含的文字内容进行分词划分,并将划分后的分词分别与预设的表情符号集合和地址链接关键字进行匹配,当划分后的分词与表情符号集合中的任意一表情符号相同时,确定该划分后的分词为表情符号;提取划分后的分词中的关键字,当提取的关键字与地址链接关键字匹配成功时,确定该划分后的分词为地址链接。
可选的,采用预设算法,对所述文本特征进行运算,生成所述任意一转发社交信息对应的文本特征向量,具体包括:基于最大熵的马尔科夫模型(maximum entropy markov model),或者采用条件随机场(Conditional RandomField)等方法,对所述文本特征进行运算,生成所述任意以转发社交信息对应的文本特征向量。其中,生成的文本特征向量为多维向量,每一个维度代表的含义与文本特征向量的计算算法相关。例如,转发社交信息为“公司发布新手机”,对该转发社交信息进行分词划分,该划分后的分词为“公司”、“发布”,“新”、“手机”;引入索引词典,该索引词典中包含每一个分词的索引号,该索引词典中包含的分词的数目即为该索引词典的维度,亦即生成的文本特征向量的维度,如该索引词典中包含100个分词,则该索引词典的维度即为100,且生成的文本特征向量的维度为100;在索引词典中查找上述划分后的分词的索引号,如分词“公司”的索引号为1,那么将文本特征向量的第一个维度上的元素值设置为1,分词“发布”的索引号为20,那么将文本特征向量的第20个维度上的元素值设置为1,分词“新”的索引号为34,那么将文本特征向量的第34个维度上的元素值设置为1,分词“手机”的索引号为54,那么将文本特征向量的第54个维度上的元素值设置为1,并将该特征向量所有维度中,除第1、20、34、54维度之外其他维度上的元素值设置为0。
由于文本特征通常为文字形式,采用上述技术方案,将文本特征进行量化,即将文本特征转化为数值形式,并将该数值形式的文本特征确定为获取文本特征向量,便于后续对关键社交信息的选取。
可选的,生成所述任意一转发社交信息对应的与社交信息转发树关联的特征向量,具体包括:根据在所述社交信息转发树中,所述任意一转发社交信息所代表的节点的位置信息,和/或在所述社交信息转发树中,与所述任意一转发社交信息所代表的节点互为兄弟节点的节点数目,获取所述任意一转发社交信息对应的与社交信息转发树关联的特征向量。其中,生成的与社交信息转发树关联的特征向量即为多维向量,每一个维度代表的含义设置情况相关。例如,转发社交信息T,其在社交信息转发树上所代表的节点t包含4个兄弟节点,节点t距离根节点的距离为6,节点t的子节点数目为2个,转发社交信息T的评论数为378,当将与社交信息转发树关联的特征向量设置为第一维度表示距离根节点的距离,第二唯独表示子节点数目,第三维度表示评论数,第四维度表示兄弟节点数目时,生成的与社交信息转发树关联的特征向量为4维向量,可以表示为{6,2,387,6}。
可选的,根据所述任意一转发社交信息的文本特征向量和所述与社交信息转发树关联的特征向量,生成所述任意一转发社交信息的特征向量,具体包括:将获取的文本特征向量和与社交信息转发树关联的特征向量进行合并处理,生成该任意一转发社交信息的特征向量;其中,上述合并处理方式可以根据具体情况预先设置,如所述合并处理为将所述文本特征向量和所述与社交信息转发树关联的特征向量进行上下合并;或者,将所述文本特征向量和所述与社交信息转发树关联的特征向量进行左右合并。例如,所述任意一转发社交信息的文本特征向量a={a1,a2},所述任意一转发社交信息的与社交信息转发树关联的特征向量b={b1,b2},则任意一转发社交信息的特征向量c={a1,a2,b1,b2}。
采用上述技术方案,根据转发社交信息的内容,生成文本特征向量,根据转发社交信息在社交信息转发树中的位置,和/或在所述社交信息转发树中,与所述任意一转发社交信息所代表的节点互为兄弟节点的节点数目,生成所述任意一转发社交信息对应的与社交信息转发树关联的特征向量;生成的特征向量的过程中,综合考虑转发社交信息的内容和转发社交信息在社交信息转发树中的位置,使得确定关键转发社交信息的过程中,既考虑了转发社交信息内容对选取结果的影响,也考虑了转发社交信息的影响力对选取结果的影响,从而保证了选取结果的准确性。
步骤120:分别将所述每一个转发社交信息的特征向量输入预设的筛选模型,获取所有转发社交信息中包含的候选关键社交信息。
本发明实施例中,终端将获取到的每一个转发社交信息的特征向量输入预设的筛选模型,并获取该筛选模型输出的候选社交信息。基于上述过程,筛选模型输出的候选社交信息均为内容具有代表性,且转发数量和评论数最多的转发社交信息。
可选的,参阅图3所示,所述筛选模型的生成方法,包括:
步骤a1:终端从历史数据中,获取任意一训练原始社交信息,以及所述任意一训练原始社交信息的训练转发社交信息。
本发明实施例中,上述训练转发社交信息对应的筛选分类结果为已知,即每一个训练转发社交信息是否为候选关键社交信息为已知,终端可以通过文字形式对训练转发社交信息进行标记(记为yi,i为转发社交信息标识,如该i为编号),如yi=候选关键社交信息,也可以通过二值形式对训练转发社交信息进行标记,如yi=1表示训练转发社交信息为候选关键社交信息,yi=0表示训练转发社交信息不是候选关键社交信息。
步骤a2:分别根据每一个训练转发社交信息的信息特征,生成所述每一个训练转发社交信息的特征向量。
本发明实施例中,所述每一个训练转发社交信息的特征向量记为xi,i为转发社交信息标识,如该i为编号。
进一步的,终端在获取所述任意一训练原始社交信息,以及所述任意一训练原始社交信息的训练转发社交信息之后,根据该任意一训练原始社交信息,以及所述训练原始社交信息的训练转发社交信息,生成训练社交信息转发树;终端根据该训练社交信息转发树,以及每一个训练转发社交信息的文本内容,生成所述每一个训练转发社交信息的信息特征;终端根据每一个训练转发社交信息的信息特征,生成所述每一个训练转发社交信息的特征向量。
在上述步骤中,针对任意一训练转发社交信息,终端按照预设规则,从该任意一训练转发社交信息的文本内容中进行提取,获取相应的分词,二元语法,词性,地址链接,表情符号等信息,并采用预设算法对获取的信息进行运算,得到任意一训练转发社交信息的文本特征向量;
进一步的,针对任意一训练转发社交信息,终端根据该任意一训练转发社交信息所代表的节点的位置信息,和/或在所述训练社交信息转发树中,与所述任意一训练转发社交信息所代表的节点互为兄弟节点的节点数目,获取所述任意一训练转发社交信息对应的与训练社交信息转发树关联的特征向量;
进一步的,针对所述任意一训练转发社交信息,终端将上述获得的文本特征向量和与训练社交信息转发树关联的特征向量进行合并处理,生成所述任意一训练转发社交信息的特征向量。
步骤a3:采用预设的筛选算法,根分别据所述每一个训练转发社交信息的特征向量以及已知的每一个训练转发社交信息的筛选分类结果,获取筛选参数。
本发明实施例中,终端可以采用如下三种方式,获取筛选参数:
第一种方式:采用支持向量机算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的每一个训练转发社交信息的筛选分类结果,获取筛选参数;
第二种方式:采用感知机神经网络算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的每一个训练转发社交信息的筛选分类结果,获取筛选参数;
在上述第一种方式和第二种方式直接根据已知的筛选分类结果获取筛选参数,不考虑不同训练转发社交信息的特征向量之间的转发关系,计算得到筛选参数的速度更快。
第三种方式:分别根据所述每一个训练转发社交信息的特征向量,以及所述每一个训练转发社交信息之间的转发关系,生成输入序列,其中,输入序列可以表示为x1,x2,…,xn,且该n个特征向量属于训练社交信息转发树中同一个转发链路;根据所述已知的每一个训练转发社交信息的筛选分类结果,生成输出序列,其中,生成的输出序列中每一个筛选分类结果的排列顺序由所述输入序列中每一个特征向量决定,如任意一特征向量在输入序列中的位置编号为i,则该任意一特征向量对应的筛选分类结果在输出序列中的位置编号也为i;建立所述输入序列和所述输出序列之间的相关性函数,其中,该相关性函数为用于表征特征向量和筛选分类结果之间的关联性的函数;根据所述已知的每一个训练转发社交信息的筛选分类结果,确定所述相关性函数的参数;将所述参数确定为所述筛选参数。
可选的,终端建立所述输入序列和所述输出序列之间的相关性函数的过程,具体包括:根据所述输入序列中包含的每一个特征向量之间的转发关系,以及所述输入序列中包含的每一个特征向量和输出序列中包含的每一个筛选分类结果之间的关系,建立所述输入序列和所述输出序列之间的链路关系表,其中,所述链路关系表包含两行,第一行表示输入序列,第二行表示输出序列;针对所述输入序列中的任意一特征向量,执行如下操作:采用预设宽度(记为k)的窗口,对所述链路关系表进行扫描;其中,当前扫描的窗口仅包含所述任意一向量和多个筛选分类结果;根据当前扫描的窗口中包含的输出序列中的筛选分类结果和所述任意一特征向量,生成第一局部相关性函数,其中,所述第一局部相关性函数为用于表征所述任意一特征向量以及所述当前扫描窗口中包含的筛选分类结果之间关联性的函数;并根据当前扫描的窗口中包含的输出序列中的筛选分类结果,生成第二局部相关性函数,其中,所述第二局部相关性函数为用于表征所述任意一向量对应的筛选分类结果与所述当前扫描窗口中包含的其他筛选分类结果之间关联性的函数;根据所述输入序列中包含的每一个向量对应的第一局部相关性函数和第二局部相关性函数,建立所述输入序列和所述输出序列之间的相关性函数。其中,上述窗口的预设宽度k可以根据具体应用场景预先设置,可选的,该k的取值范围为3~5。
例如,参阅图4a所示,为本发明实施例中的链路关系表和预设宽度的窗口;其中,输入序列为{x1,x2,…,xn},输出序列为{y1,y2,…,yn},输入序列中包含的特征向量的数目必定与输出序列中包含的筛选分类结果的数目相等。在图3中,以xi为任意一特征向量,该任意一特征向量xi的第一局部相关性函数记为f(xi,yi,yi-1,yi-2),该任意一特征向量xi的第二局部相关性函数记为g(yi,yi-1,yi-2)。
可选的,当窗口的预设宽度k为3时,任意一特征向量xi的第一局部相关性函数满足如下公式:
其中,xi为任意一特征向量;为第一局部相关性函数的参数,为一个高维向量,且该的维数与所述任意一特征向量xi的维数相同;yi,yi-1,yi-2表示的索引。
本发明实施例中,由于yi,yi-1,yi-2表示的索引,如当yi=0,yi-1=1,yi-2=1时,则取值为ω0,1,1。基于此可知,当k=3时,第一局部相关性函数的参数的取值包含八种情况。
可选的,任意一特征向量xi的第二局部相关性函数满足如下公式:
g(yi,yi-1,yi-2)=φ(yi,yi-1,yi-2)×ωtr
其中,φ(yi,yi-1,yi-2)表示根据yi,yi-1,yi-2的取值,得到的预设特征取值,yi,yi-1,yi-2和预设特征取值的对应关系参阅图4b所示;ωtr为第二局部相关性函数的参数,为一个高维向量,且该ωtr的维数与所述φ(yi,yi-1,yi-2)的维数相同。
可选的,基于上述第一局部相关性函数f(xi,yi,yi-1,yi-2)和第二局部相关性函数g(yi,yi-1,yi-2),生成的输入序列和输出序列之间的相关性函数f(x1,x2,…,xn,y1,y2,…,yn)满足如下公式:
其中,xi为任意一特征向量;为第一局部相关性函数的参数;φ(yi,yi-1,yi-2)表示根据yi,yi-1,yi-2的取值,得到的预设特征取值;ωtr为第二局部相关性函数的参数。
在所述第三种方式中,终端综合考虑训练社交信息转发树中不同训练转发社交信息之间的转发关系,得到筛选模型的参数,保证了得到的筛选模型以不同转发社交信息之间的转发关系,进一步提高了最终选取结果的准确率。
步骤a4:根据所述筛选参数,生成筛选模型。
本发明实施例中,终端根据所述筛选参数,以及输入序列和输出之间的相关性函数,生成筛选模型。
采用上述技术方案,终端在建立筛选模型的过程中,除了考虑直接转发社交信息的特性之外,还引入间接转发社交信息,保证了最终生成的筛选模型输出结果的全面性;并且,终端不仅以转发社交信息的文本内容为参考因素,还综合考虑转发社交信息之间的转发关系,以及转发社交信息的转发次数,评论情况等参考因素,进一步提高了筛选模型输出结果的准确性。
基于上述已经生成的筛选模型,终端根据每一个转发社交信息的特征向量,即可获取该筛选模型输出的结果;终端将该筛选模型输出的结果作为候选关键社交信息。
步骤130:分别计算每一个候选关键社交信息对应的关键性评估值。
本发明实施例中,终端根据所述候选关键社交信息,构建候选关键社交信息图;针对所述候选关键社交信息图中的任意一候选关键社交信息,根据所述候选关键社交信息图中所述任意一候选关键社交信息与其他所有候选关键社交信息之间的相关性值,确定所述任意一候选关键社交信息对应的关键性评估值。
例如,参阅图5所示,为本发明实施例中候选关键社交信息图;该候选关键社交信息图中包含所有候选关键社交信息(u1,u2,u3,u4,v),且每一个候选关键社交信息均与除自身之外的其他候选关键社交信息相连接;此外,该候选信息图中包含的每一个候选关键社交信息均对应一个值R0(v),R0(v)为任意一候选关键社交信息v被转发的次数;每两个候选关键社交信息(如ui和v)之间的连线用于表示该两个候选关键社交信息之间存在相关性(其相关性值记为p(ui→v))。
可选的,针对所述候选关键社交信息图中的任意一候选关键社交信息,分别获取所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值;根据所述候选关键社交信息图中所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值,确定所述任意一候选关键社交信息对应的关键性评估值。所述关键性评估值满足如下公式:
其中,Rt(v)为第t次迭代后得到的关键性评估值;λ为预设系数;R0(v)为候选关键社交信息v被转发的次数;n为在所述候选关键社交信息图中,与所述候选关键社交信息v存在关联的候选关键社交信息的数目;Rt-1(v)为第t次迭代后得到的关键性评估值;p(ui→v)为与所述候选关键社交信息v存在关联的候选关键社交信息ui和所述候选关键社交信息v之间的相关性值,该相关性值初始化为候选关键社交信息ui的特征向量和所述候选关键社交信息v的特征向量之间的点乘积;
步骤140:从所有候选关键社交信息中,选取关键性评估值从高到低的预设数目个候选关键社交信息,将选取的候选关键社交信息确定为关键社交信息。
本发明实施例中,终端从上述迭代过程获取的所有候选关键社交信息中,选取关键性评估值最高的预设数目个候选关键社交信息,并将选取的候选关键社交信息作为关键社交信息;其中,预设数目可以根据具体应用场景预先设置得到。
进一步的,当需要将多个相关社交信息转发树进行合并,并获取合并后的所有转发社交信息中的关键社交信息时,终端可以采用步骤100至步骤120,分别获取每一个社交信息转发树对应的候选关键社交信息;采用步骤130,根据所有社交信息转发树对应的候选关键社交信息,生成候选关键社交信息图,以及计算每一个候选关键社交信息的关键性评估值;终端采用步骤140,从所有候选关键社交信息中,选取关键性评估值最高的预设数目个候选关键社交信息,将选取的候选关键社交信息确定为关键社交信息。相较于现有技术中,针对多个相关社交信息转发树,仅分别计算每一个社交信息转发树对应的关键社交信息的过程,得到的关键社交信息不具备关联性,采用本发明技术方案,能够结合各个社交信息转发树之间的关联性,得到所有社交信息转发树对应的关键社交信息,获取的社交信息更加可靠。
基于上述技术方案,参阅图6所示,本发明实施例提供一种关键社交信息的确定装置,包括社交信息转发树生成单元60,特征向量获取单元61,候选关键社交信息获取单元62,关键性评估值计算单元63,关键性信息确定单元64,其中:
社交信息转发树生成单元60,用于根据待确定的原始社交信息以及所述原始社交信息的转发社交信息,生成社交信息转发树;其中,所述转发社交信息为包含直接或间接转发所述原始社交信息的信息;所述社交信息转发树为树状结构,所述原始社交信息为所述树状结构的根节点,所述转发社交信息为所述树状结构的叶子节点和所述根节点和叶子节点之间的中间节点;
特征向量获取单元61,用于分别根据每一个转发社交信息的信息特征,获取所述每一个转发社交信息的特征向量;其中,所述信息特征包括文本特征和与所述社交信息转发树关联的特征;每一个转发社交信息的特征向量中包含表征该转发社交信息的文本特征的向量,以及表征该转发社交信息的与社交信息转发树关联的特征的向量;
候选关键社交信息获取单元62,用于分别将所述特征向量获取单元61获取的每一个转发社交信息的特征向量输入预设的筛选模型,获取所有转发社交信息中包含的候选关键社交信息;
关键性评估值计算单元63,用于分别计算所述候选关键社交信息获取单元62获取的每一个候选关键社交信息对应的关键性评估值;
关键社交信息确定单元64,用于根据所述关键性评估值计算单元63计算得到的每一个候选关键社交信息对应的关键性评估值,从所有候选关键社交信息中,选取关键性评估值从高到低的预设数目个候选关键社交信息,将选取的候选关键社交信息确定为关键社交信息。
可选的,所述特征向量获取单元61,用于:针对所述社交信息转发树中的任意一转发社交信息,执行如下操作:从所述任意一转发社交信息的内容中,提取所述任意一转发社交信息的文本特征;采用预设算法,分别将所述任意一转发社交信息的文本特征中包含的各个特征量转换为数值形式的特征量,并根据所有数值形式的特征量,获取所述任意一转发社交信息对应的文本特征向量;根据在所述社交信息转发树中,所述任意一转发社交信息所代表的节点的位置信息,和/或在所述社交信息转发树中,与所述任意一转发社交信息所代表的节点互为兄弟节点的节点数目,获取所述任意一转发社交信息对应的与社交信息转发树关联的特征向量;将所述文本特征向量和所述与社交信息转发树关联的特征向量进行合并处理,获取所述任意一个转发社交信息的特征向量;所述合并处理为将所述文本特征向量和所述与社交信息转发树关联的特征向量进行上下合并;或者,将所述文本特征向量和所述与社交信息转发树关联的特征向量进行左右合并。
进一步的,还包括筛选模型生成单元65,用于:从历史数据中,获取任意一训练原始社交信息的训练转发社交信息;分别根据每一个训练转发社交信息的信息特征,生成所述每一个训练转发社交信息的特征向量;其中,每一个训练转发社交信息的特征向量中包含表征该训练转发社交信息的文本特征的向量,以及表征该训练转发社交信息的与社交信息转发树关联的特征的向量;采用预设的筛选算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;根据所述筛选参数,生成筛选模型。
可选的,筛选模型生成单元65采用预设的筛选算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数,具体包括:采用支持向量机算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,采用感知机神经网络算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,分别根据所述每一个训练转发社交信息的特征向量,以及所述每一个训练转发社交信息之间的转发关系,生成输入序列;并根据所述已知的每一个训练转发社交信息的筛选分类结果,生成输出序列;建立所述输入序列和所述输出序列之间的相关性函数;根据所述已知的每一个训练转发社交信息的筛选分类结果,确定所述相关性函数的参数;将所述参数确定为所述筛选参数。
可选的,所述筛选模型生成单元65建立所述输入序列和所述输出序列之间的相关性函数,具体包括:根据所述输入序列中包含的每一个特征向量之间的转发关系,以及所述输入序列中包含的每一个特征向量和输出序列中包含的每一个筛选分类结果之间的关系,建立所述输入序列和所述输出序列之间的链路关系表;针对所述输入序列中的任意一特征向量,执行如下操作:采用预设宽度的窗口,对所述链路关系表进行扫描;其中,当前扫描的窗口包含所述任意一向量;根据当前扫描的窗口中包含的输出序列中的筛选分类结果和所述任意一特征向量,生成第一局部相关性函数;并根据当前扫描的窗口中包含的输出序列中的筛选分类结果,生成第二局部相关性函数;分别根据所述输入序列中包含的每一个向量对应的第一局部相关性函数和第二局部相关性函数,建立所述输入序列和所述输出序列之间的相关性函数。
可选的,所述关键性评估值计算单元63,具体用于:根据所述候选关键社交信息,构建候选关键社交信息图;其中,所述关键社交信息图中包含所有候选关键社交信息,且每两个候选关键社交信息之间互相连接;针对所述候选关键社交信息图中的任意一候选关键社交信息,分别获取所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值;根据所述候选关键社交信息图中所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值,确定所述任意一候选关键社交信息对应的关键性评估值。
可选的,所述关键性评估值计算单元63计算得到的关键性评估值满足如下公式:
其中,Rt(v)为第t次迭代后得到的关键性评估值;λ为预设系数;R0(v)为候选关键社交信息v被转发的次数;n为在所述候选关键社交信息图中,与所述候选关键社交信息v存在关联的候选关键社交信息的数目;Rt-1(v)为第t次迭代后得到的关键性评估值;p(ui→v)为与所述候选关键社交信息v存在关联的候选关键社交信息ui和所述候选关键社交信息v之间的相关性值;
基于上述技术方案,参阅图7所示,本发明实施例提供一种关键社交信息的确定设备,包括存储器70,以及处理器71,其中:
所述存储器70,用于存储应用程序;
所述处理器71,用于运行所述存储器70中存储的应用程序,执行如下操作:
根据待确定的原始社交信息以及所述原始社交信息的转发社交信息,生成社交信息转发树;其中,所述转发社交信息为包含直接或间接转发所述原始社交信息的信息;所述社交信息转发树为树状结构,所述原始社交信息为所述树状结构的根节点,所述转发社交信息为所述树状结构的叶子节点和所述根节点和叶子节点之间的中间节点;根据每一个转发社交信息的信息特征,获取所述每一个转发社交信息的特征向量;其中,所述信息特征包括文本特征和与所述社交信息转发树关联的特征;每一个转发社交信息的特征向量中包含表征该转发社交信息的文本特征的向量,以及表征该转发社交信息的与社交信息转发树关联的特征的向量;分别将获取的每一个转发社交信息的特征向量输入预设的筛选模型,获取所有转发社交信息中包含的候选关键社交信息;分别计算获取的每一个候选关键社交信息对应的关键性评估值;从计算得到的所有候选关键社交信息中,选取关键性评估值从高到低的预设数目个候选关键社交信息,将选取的候选关键社交信息确定为关键社交信息。
可选的,所述处理器71,用于:针对所述社交信息转发树中的任意一转发社交信息,执行如下操作:从所述任意一转发社交信息的内容中,提取所述任意一转发社交信息的文本特征;采用预设算法,分别将所述任意一转发社交信息的文本特征中包含的各个特征量转换为数值形式的特征量,并根据所有数值形式的特征量,获取所述任意一转发社交信息对应的文本特征向量;根据在所述社交信息转发树中,所述任意一转发社交信息所代表的节点的位置信息,和/或在所述社交信息转发树中,与所述任意一转发社交信息所代表的节点互为兄弟节点的节点数目,获取所述任意一转发社交信息对应的与社交信息转发树关联的特征向量;将所述文本特征向量和所述与社交信息转发树关联的特征向量进行合并处理,获取所述任意一个转发社交信息的特征向量;所述合并处理为将所述文本特征向量和所述与社交信息转发树关联的特征向量进行上下合并;或者,将所述文本特征向量和所述与社交信息转发树关联的特征向量进行左右合并。
进一步的,所述处理器71,还用于:从历史数据中,获取任意一训练原始社交信息的训练转发社交信息;分别根据每一个训练转发社交信息的信息特征,生成所述每一个训练转发社交信息的特征向量;其中,每一个训练转发社交信息的特征向量中包含表征该训练转发社交信息的文本特征的向量,以及表征该训练转发社交信息的与社交信息转发树关联的特征的向量;采用预设的筛选算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;根据所述筛选参数,生成筛选模型。
进一步的,所述处理器71,用于:采用支持向量机算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,采用感知机神经网络算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,分别根据所述每一个训练转发社交信息的特征向量,以及所述每一个训练转发社交信息之间的转发关系,生成输入序列;并根据所述已知的每一个训练转发社交信息的筛选分类结果,生成输出序列;建立所述输入序列和所述输出序列之间的相关性函数;根据所述已知的每一个训练转发社交信息的筛选分类结果,确定所述相关性函数的参数;将所述参数确定为所述筛选参数。
可选的,所述处理器71,用于:根据所述输入序列中包含的每一个特征向量之间的转发关系,以及所述输入序列中包含的每一个特征向量和输出序列中包含的每一个筛选分类结果之间的关系,建立所述输入序列和所述输出序列之间的链路关系表;针对所述输入序列中的任意一特征向量,执行如下操作:采用预设宽度的窗口,对所述链路关系表进行扫描;其中,当前扫描的窗口包含所述任意一向量;根据当前扫描的窗口中包含的输出序列中的筛选分类结果和所述任意一特征向量,生成第一局部相关性函数;并根据当前扫描的窗口中包含的输出序列中的筛选分类结果,生成第二局部相关性函数;分别根据所述输入序列中包含的每一个向量对应的第一局部相关性函数和第二局部相关性函数,建立所述输入序列和所述输出序列之间的相关性函数。
可选的,所述处理器71,具体用于:根据所述候选关键社交信息,构建候选关键社交信息图;其中,所述关键社交信息图中包含所有候选关键社交信息,且每两个候选关键社交信息之间互相连接;针对所述候选关键社交信息图中的任意一候选关键社交信息,分别获取所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值;根据所述候选关键社交信息图中所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值,确定所述任意一候选关键社交信息对应的关键性评估值。
可选的,所述处理器71计算得到的关键性评估值满足如下公式:
其中,Rt(v)为第t次迭代后得到的关键性评估值;λ为预设系数;R0(v)为候选关键社交信息v被转发的次数;n为在所述候选关键社交信息图中,与所述候选关键社交信息v存在关联的候选关键社交信息的数目;Rt-1(v)为第t次迭代后得到的关键性评估值;p(ui→v)为与所述候选关键社交信息v存在关联的候选关键社交信息ui和所述候选关键社交信息v之间的相关性值;
综上所述,根据待测试的原始社交信息以及所述原始社交信息的转发社交信息,生成社交信息转发树;其中,所述转发社交信息为包含直接或间接转发所述原始社交信息的信息;所述社交信息转发树为树状结构,所述原始社交信息为所述树状结构的根节点,所述转发社交信息为所述树状结构的叶子节点和中间节点;分别根据所述社交信息转发树中每一个转发社交信息的信息特征,获取所述每一个转发社交信息的特征向量;其中,所述信息特征包括文本特征和与所述社交信息转发树关联的特征;分别将所述每一个转发社交信息的特征向量输入预设的筛选模型,获取所有转发社交信息中包含的候选关键社交信息;分别计算每一个候选关键社交信息对应的关键性评估值;从所有候选关键社交信息中,选取关键性评估值从高到低的预设数目个候选关键社交信息,将选取的候选关键社交信息确定为关键社交信息。采用本发明技术方案,综合考虑直接转发社交信息和间接转发社交信息,从原始社交信息的所有转发社交信息中选取关键社交信息,避免了仅从直接转发社交信息中选取关键社交信息时造成的选取结果片面的问题,提高了选取结果的准确率;并且,在关键社交信息的选取过程中,以转发社交信息的内容和与社交信息转发树关联的特征为参考因素,进一步提高了最终选取结果的准确率。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (14)

1.一种关键社交信息的确定方法,其特征在于,包括:
根据待确定的原始社交信息以及所述原始社交信息的转发社交信息,生成社交信息转发树;其中,所述转发社交信息为包含直接或间接转发所述原始社交信息的信息;所述社交信息转发树为树状结构,所述原始社交信息为所述树状结构的根节点,所述转发社交信息为所述树状结构的叶子节点和所述根节点和叶子节点之间的中间节点;
分别根据每一个转发社交信息的信息特征,获取所述每一个转发社交信息的特征向量;其中,所述信息特征包括文本特征和与所述社交信息转发树关联的特征;每一个转发社交信息的特征向量中包含表征该转发社交信息的文本特征的向量,以及表征该转发社交信息的与社交信息转发树关联的特征的向量;
分别将所述每一个转发社交信息的特征向量输入预设的筛选模型,获取所有转发社交信息中包含的候选关键社交信息;
分别计算每一个候选关键社交信息对应的关键性评估值;
从所有候选关键社交信息中,选取关键性评估值从高到低的预设数目个候选关键社交信息,将选取的候选关键社交信息确定为关键社交信息。
2.如权利要求1所述的方法,其特征在于,分别根据每一个转发社交信息的信息特征,获取所述每一个转发社交信息的特征向量,具体包括:
针对所述社交信息转发树中的任意一转发社交信息,执行如下操作:
从所述任意一转发社交信息的内容中,提取所述任意一转发社交信息的文本特征;采用预设算法,分别将所述任意一转发社交信息的文本特征中包含的各个特征量转换为数值形式的特征量,并根据所有数值形式的特征量,获取所述任意一转发社交信息对应的文本特征向量;
根据在所述社交信息转发树中,所述任意一转发社交信息所代表的节点的位置信息,和/或在所述社交信息转发树中,与所述任意一转发社交信息所代表的节点互为兄弟节点的节点数目,获取所述任意一转发社交信息对应的与社交信息转发树关联的特征向量;
将所述文本特征向量和所述与社交信息转发树关联的特征向量进行合并处理,获取所述任意一个转发社交信息的特征向量;所述合并处理为将所述文本特征向量和所述与社交信息转发树关联的特征向量进行上下合并;或者,将所述文本特征向量和所述与社交信息转发树关联的特征向量进行左右合并。
3.如权利要求1或2所述的方法,其特征在于,所述筛选模型的生成方法,包括:
从历史数据中,获取任意一训练原始社交信息的训练转发社交信息;
分别根据每一个训练转发社交信息的信息特征,生成所述每一个训练转发社交信息的特征向量;其中,每一个训练转发社交信息的特征向量中包含表征该训练转发社交信息的文本特征的向量,以及表征该训练转发社交信息的与社交信息转发树关联的特征的向量;
采用预设的筛选算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;
根据所述筛选参数,生成筛选模型。
4.如权利要求2或3所述的方法,其特征在于,采用预设的筛选算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数,具体包括:
采用支持向量机算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,
采用感知机神经网络算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,
分别根据所述每一个训练转发社交信息的特征向量,以及所述每一个训练转发社交信息之间的转发关系,生成输入序列;并根据所述已知的每一个训练转发社交信息的筛选分类结果,生成输出序列;建立所述输入序列和所述输出序列之间的相关性函数;根据所述已知的每一个训练转发社交信息的筛选分类结果,确定所述相关性函数的参数;将所述参数确定为所述筛选参数。
5.如权利要求4所述的方法,其特征在于,建立所述输入序列和所述输出序列之间的相关性函数,具体包括:
根据所述输入序列中包含的每一个特征向量之间的转发关系,以及所述输入序列中包含的每一个特征向量和输出序列中包含的每一个筛选分类结果之间的关系,建立所述输入序列和所述输出序列之间的链路关系表;
针对所述输入序列中的任意一特征向量,执行如下操作:采用预设宽度的窗口,对所述链路关系表进行扫描;其中,当前扫描的窗口包含所述任意一向量;根据当前扫描的窗口中包含的输出序列中的筛选分类结果和所述任意一特征向量,生成第一局部相关性函数;并根据当前扫描的窗口中包含的输出序列中的筛选分类结果,生成第二局部相关性函数;
分别根据所述输入序列中包含的每一个向量对应的第一局部相关性函数和第二局部相关性函数,建立所述输入序列和所述输出序列之间的相关性函数。
6.如权利要求1-5任一项所述的方法,其特征在于,分别计算每一个候选关键社交信息对应的关键性评估值,具体包括:
根据所述候选关键社交信息,构建候选关键社交信息图;其中,所述关键社交信息图中包含所有候选关键社交信息,且每两个候选关键社交信息之间互相连接;
针对所述候选关键社交信息图中的任意一候选关键社交信息,分别获取所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值;根据所述候选关键社交信息图中所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值,确定所述任意一候选关键社交信息对应的关键性评估值。
7.如权利要求6所述的方法,其特征在于,所述关键性评估值满足如下公式:
R t ( v ) = λR 0 ( v ) + ( 1 - λ ) Σ i = 0 i = n p ( u i → v ) R t - 1 ( v ) Z t - 1 ( u )
其中,Rt(v)为第t次迭代后得到的关键性评估值;λ为预设系数;R0(v)为候选关键社交信息v被转发的次数;n为在所述候选关键社交信息图中,与所述候选关键社交信息v存在关联的候选关键社交信息的数目;Rt-1(v)为第t次迭代后得到的关键性评估值;p(ui→v)为与所述候选关键社交信息v存在关联的候选关键社交信息ui和所述候选关键社交信息v之间的相关性值; Z t - 1 ( u ) = Σ i = 0 i = n p ( u i → v ) R t - 1 ( v ) .
8.一种关键社交信息的确定装置,其特征在于,包括:
社交信息转发树生成单元,用于根据待确定的原始社交信息以及所述原始社交信息的转发社交信息,生成社交信息转发树;其中,所述转发社交信息为包含直接或间接转发所述原始社交信息的信息;所述社交信息转发树为树状结构,所述原始社交信息为所述树状结构的根节点,所述转发社交信息为所述树状结构的叶子节点和所述根节点和叶子节点之间的中间节点;
特征向量获取单元,用于分别根据每一个转发社交信息的信息特征,获取所述每一个转发社交信息的特征向量;其中,所述信息特征包括文本特征和与所述社交信息转发树关联的特征;每一个转发社交信息的特征向量中包含表征该转发社交信息的文本特征的向量,以及表征该转发社交信息的与社交信息转发树关联的特征的向量;
候选关键社交信息获取单元,用于分别将所述特征向量获取单元获取的每一个转发社交信息的特征向量输入预设的筛选模型,获取所有转发社交信息中包含的候选关键社交信息;
关键性评估值计算单元,用于分别计算所述候选关键社交信息获取单元获取的每一个候选关键社交信息对应的关键性评估值;
关键社交信息确定单元,用于根据所述关键性评估值计算单元计算得到的每一个候选关键社交信息对应的关键性评估值,从所有候选关键社交信息中,选取关键性评估值从高到低的预设数目个候选关键社交信息,将选取的候选关键社交信息确定为关键社交信息。
9.如权利要求8所述的装置,其特征在于,所述特征向量获取单元,用于:
针对所述社交信息转发树中的任意一转发社交信息,执行如下操作:从所述任意一转发社交信息的内容中,提取所述任意一转发社交信息的文本特征;采用预设算法,分别将所述任意一转发社交信息的文本特征中包含的各个特征量转换为数值形式的特征量,并根据所有数值形式的特征量,获取所述任意一转发社交信息对应的文本特征向量;根据在所述社交信息转发树中,所述任意一转发社交信息所代表的节点的位置信息,和/或在所述社交信息转发树中,与所述任意一转发社交信息所代表的节点互为兄弟节点的节点数目,获取所述任意一转发社交信息对应的与社交信息转发树关联的特征向量;将所述文本特征向量和所述与社交信息转发树关联的特征向量进行合并处理,获取所述任意一个转发社交信息的特征向量;所述合并处理为将所述文本特征向量和所述与社交信息转发树关联的特征向量进行上下合并;或者,将所述文本特征向量和所述与社交信息转发树关联的特征向量进行左右合并。
10.如权利要求8或9所述的装置,其特征在于,还包括筛选模型生成单元,用于:
从历史数据中,获取任意一训练原始社交信息的训练转发社交信息;分别根据每一个训练转发社交信息的信息特征,生成所述每一个训练转发社交信息的特征向量;其中,每一个训练转发社交信息的特征向量中包含表征该训练转发社交信息的文本特征的向量,以及表征该训练转发社交信息的与社交信息转发树关联的特征的向量;采用预设的筛选算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;根据所述筛选参数,生成筛选模型。
11.如权利要求9或10所述的装置,其特征在于,筛选模型生成单元采用预设的筛选算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数,具体包括:
采用支持向量机算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,采用感知机神经网络算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,分别根据所述每一个训练转发社交信息的特征向量,以及所述每一个训练转发社交信息之间的转发关系,生成输入序列;并根据所述已知的每一个训练转发社交信息的筛选分类结果,生成输出序列;建立所述输入序列和所述输出序列之间的相关性函数;根据所述已知的每一个训练转发社交信息的筛选分类结果,确定所述相关性函数的参数;将所述参数确定为所述筛选参数。
12.如权利要求11所述的装置,其特征在于,所述筛选模型生成单元建立所述输入序列和所述输出序列之间的相关性函数,具体包括:
根据所述输入序列中包含的每一个特征向量之间的转发关系,以及所述输入序列中包含的每一个特征向量和输出序列中包含的每一个筛选分类结果之间的关系,建立所述输入序列和所述输出序列之间的链路关系表;针对所述输入序列中的任意一特征向量,执行如下操作:采用预设宽度的窗口,对所述链路关系表进行扫描;其中,当前扫描的窗口包含所述任意一向量;根据当前扫描的窗口中包含的输出序列中的筛选分类结果和所述任意一特征向量,生成第一局部相关性函数;并根据当前扫描的窗口中包含的输出序列中的筛选分类结果,生成第二局部相关性函数;分别根据所述输入序列中包含的每一个向量对应的第一局部相关性函数和第二局部相关性函数,建立所述输入序列和所述输出序列之间的相关性函数。
13.如权利要求8-12任一项所述的装置,其特征在于,所述关键性评估值计算单元,具体用于:
根据所述候选关键社交信息,构建候选关键社交信息图;其中,所述关键社交信息图中包含所有候选关键社交信息,且每两个候选关键社交信息之间互相连接;针对所述候选关键社交信息图中的任意一候选关键社交信息,分别获取所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值;根据所述候选关键社交信息图中所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值,确定所述任意一候选关键社交信息对应的关键性评估值。
14.如权利要求13所述的装置,其特征在于,所述关键性评估值计算单元计算得到的关键性评估值满足如下公式:
R t ( v ) = λR 0 ( v ) + ( 1 - λ ) Σ i = 0 i = n p ( u i → v ) R t - 1 ( v ) Z t - 1 ( u )
其中,Rt(v)为第t次迭代后得到的关键性评估值;λ为预设系数;R0(v)为候选关键社交信息v被转发的次数;n为在所述候选关键社交信息图中,与所述候选关键社交信息v存在关联的候选关键社交信息的数目;Rt-1(v)为第t次迭代后得到的关键性评估值;p(ui→v)为与所述候选关键社交信息v存在关联的候选关键社交信息ui和所述候选关键社交信息v之间的相关性值; Z t - 1 ( u ) = Σ i = 0 i = n p ( u i → v ) R t - 1 ( v ) .
CN201510458735.3A 2015-07-30 2015-07-30 一种关键社交信息的确定方法及装置 Active CN106411683B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510458735.3A CN106411683B (zh) 2015-07-30 2015-07-30 一种关键社交信息的确定方法及装置
US15/223,836 US20170034111A1 (en) 2015-07-30 2016-07-29 Method and Apparatus for Determining Key Social Information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510458735.3A CN106411683B (zh) 2015-07-30 2015-07-30 一种关键社交信息的确定方法及装置

Publications (2)

Publication Number Publication Date
CN106411683A true CN106411683A (zh) 2017-02-15
CN106411683B CN106411683B (zh) 2019-07-12

Family

ID=57883119

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510458735.3A Active CN106411683B (zh) 2015-07-30 2015-07-30 一种关键社交信息的确定方法及装置

Country Status (2)

Country Link
US (1) US20170034111A1 (zh)
CN (1) CN106411683B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109242545A (zh) * 2018-08-20 2019-01-18 中国平安人寿保险股份有限公司 转发链接的评分方法、装置、计算机设备和存储介质
CN111046283A (zh) * 2019-12-04 2020-04-21 深圳前海微众银行股份有限公司 特征选择方法、装置、设备及存储介质
CN113111269A (zh) * 2021-05-10 2021-07-13 网易(杭州)网络有限公司 数据处理方法、装置、计算机可读存储介质及电子设备

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6721241B2 (ja) * 2017-03-01 2020-07-08 株式会社イシダ 物品振分システム
CN109299379B (zh) * 2018-10-30 2021-02-05 东软集团股份有限公司 文章推荐方法、装置、存储介质和电子设备
CN114932928B (zh) * 2022-05-24 2023-12-01 卡斯柯信号有限公司 一种基于北斗卫星定位的列车运行方向计算方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572757A (zh) * 2013-10-24 2015-04-29 中兴通讯股份有限公司 微博群体处理方法及装置
CN104778210A (zh) * 2015-03-13 2015-07-15 国家计算机网络与信息安全管理中心 一种微博转发树和转发森林构建方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572757A (zh) * 2013-10-24 2015-04-29 中兴通讯股份有限公司 微博群体处理方法及装置
CN104778210A (zh) * 2015-03-13 2015-07-15 国家计算机网络与信息安全管理中心 一种微博转发树和转发森林构建方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
QING LIAO等: "Analyzing the Influential People in Sina Weibo", 《IEEE》 *
李英乐等: "基于SVM的微博转发规模预测方法", 《计算机应用研究》 *
洪丹: "微博及中文微博信息处理研究综述", 《佳木斯职业学院学报》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109242545A (zh) * 2018-08-20 2019-01-18 中国平安人寿保险股份有限公司 转发链接的评分方法、装置、计算机设备和存储介质
CN111046283A (zh) * 2019-12-04 2020-04-21 深圳前海微众银行股份有限公司 特征选择方法、装置、设备及存储介质
CN113111269A (zh) * 2021-05-10 2021-07-13 网易(杭州)网络有限公司 数据处理方法、装置、计算机可读存储介质及电子设备

Also Published As

Publication number Publication date
US20170034111A1 (en) 2017-02-02
CN106411683B (zh) 2019-07-12

Similar Documents

Publication Publication Date Title
CN106411683A (zh) 一种关键社交信息的确定方法及装置
US11687728B2 (en) Text sentiment analysis method based on multi-level graph pooling
CN107330115A (zh) 一种信息推荐方法及装置
CN107832432A (zh) 一种搜索结果排序方法、装置、服务器和存储介质
CN108269110A (zh) 基于社区问答的物品推荐方法、系统及用户设备
CN106326484A (zh) 搜索词纠错方法及装置
CN104077417B (zh) 社交网络中的人物标签推荐方法和系统
CN108287864A (zh) 一种兴趣群组划分方法、装置、介质及计算设备
CN110348462A (zh) 一种图像特征确定、视觉问答方法、装置、设备及介质
CN109829775A (zh) 一种物品推荐方法、装置、设备及可读存储介质
CN106527757A (zh) 一种输入纠错方法及装置
CN107770783B (zh) 一种基站扩容改造方案设计方法及相关设备
CN110472067B (zh) 知识图谱表示学习方法、装置、计算机设备及存储介质
CN105022754A (zh) 基于社交网络的对象分类方法及装置
CN109213859A (zh) 一种文本检测方法、装置及系统
CN110083729A (zh) 一种图像搜索的方法及系统
Aronshtam et al. The threshold for d‐collapsibility in random complexes
CN113761359B (zh) 数据包推荐方法、装置、电子设备和存储介质
CN110321473A (zh) 基于多模态注意力的多样性偏好信息推送方法、系统、介质及设备
CN110489574A (zh) 一种多媒体信息推荐方法、装置和相关设备
CN101655803A (zh) 数学模型仿真的实现方法、移动终端
CN110245984A (zh) 一种基于因果推断的网络购物行为分析方法和系统
CN109784365A (zh) 一种特征选择方法、终端、可读介质及计算机程序
CN108376354A (zh) 一种基于网络图结构的推荐方法及装置
CN107256224A (zh) 一种要素知识结构的生成方法,搜索方法,装置及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant