CN109978016A - 一种网络用户身份识别方法 - Google Patents

一种网络用户身份识别方法 Download PDF

Info

Publication number
CN109978016A
CN109978016A CN201910168675.XA CN201910168675A CN109978016A CN 109978016 A CN109978016 A CN 109978016A CN 201910168675 A CN201910168675 A CN 201910168675A CN 109978016 A CN109978016 A CN 109978016A
Authority
CN
China
Prior art keywords
identity
information
network
user
true
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910168675.XA
Other languages
English (en)
Other versions
CN109978016B (zh
Inventor
陈龙
郁鸣辰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201910168675.XA priority Critical patent/CN109978016B/zh
Publication of CN109978016A publication Critical patent/CN109978016A/zh
Application granted granted Critical
Publication of CN109978016B publication Critical patent/CN109978016B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明请求保护一种网络身份与真实身份之间的身份识别方法,首先,收集特定对象在现实中的真实身份数据,以及指定网络用户数据。然后,对获取的用户身份数据,进行格式化处理,提取其中所需信息。再然后,挖掘分析虚拟身份与真实身份之间的关联性,进行基本身份信息的相似性分析。接着,通过用户在网络上发布的内容信息,挖掘分析用户的虚拟身份描述信息,并结合知识库,建立虚拟身份描述信息与现实身份描述信息的关联关系,进行身份描述信息的相关性分析。最后,融合基本身份信息相似性和身份描述信息相关性的计算结果,对指定的虚拟身份与真实身份之间的关系做出推断。本发明有助于案件中对特定用户身份的取证调查,提高舆情监管效率。

Description

一种网络用户身份识别方法
技术领域
本发明属于算机技术领域,尤其是涉及一种建立网络用户的虚拟网络身份与现实生活中真实身份之间关联关系的身份识别方法。
背景技术
网络是人类借用计算技术和信息技术进行信息交流、建立人际交互关系等社会活动的一种主要工具。现如今,它已经成为网民获取新闻时事、人际交往、自我表达、社会分享以及社会参与的重要媒介以及社会公共舆论的重要平台。网络中大量的活跃用户和流动信息,成为一种重要的、广泛应用的信息载体和传输媒介,对我们的日常工作和生活所产生的影响也越来越大。然而,网络中信息的快速发布和传播,使其成为一把双刃剑,在提供便利服务的同时,也带来了谣言传播、传统犯罪网络化等社会问题。在实际案件中,聊天记录、微博等社交网络信息作为电子证据频繁出现。网络账户与涉案人员的身份关联经常成为取证调查中的关键点和法庭辩护中的争论点。因此,开展识别网络用户虚拟身份对应的真实身份的研究对于数字取证调查、维护网络治安具有积极的社会意义。
目前,针对网络中用户身份识别的研究主要是通过网络用户公开的信息推测用户群体的信息或倾向。通过挖掘用户特征推测个体用户所属群体,将用户按兴趣爱好分类,为用户提供个性化的产品营销和广告投递等服务;将用户按社交关系分类,可以应用于用户群推荐和用户群检测等服务。当前研究主要着眼于挖掘用户群体的信息和倾向,并没有对个体用户的特征属性作深入分析;对于网络中的信息利用不够全面,着重于用户个人信息和社交关系,没有对用户在网络中发布内容中的身份特征进行深入挖掘;在分析用户群体特征属性时粒度不够细化,难以推测个体用户的真实身份,对于取证调查场景下的真实身份识别需求缺乏考虑。
发明内容
本发明旨在解决以上现有技术的问题。提出了一种有效对网络中用户的虚拟身份和真实身份进行关联识别的网络用户身份识别方法。本发明的技术方案如下:
一种网络用户身份识别方法,其包括以下步骤:
1)、首先,获取网络用户在现实中的真实身份数据,以及获取待识别网络用户数据;
2)、其次,对获取的用户网络身份数据进行格式化处理,提取其中所需的基本身份属性以及发布的文字内容信息;
3)、然后,利用用户在网络中的基本身份信息和待识别的真实身份数据的基本身份信息,挖掘分析虚拟身份与真实身份之间的关联性,进行基本身份信息的相似性分析,即计算网络身份和真实身份的部分基本属性的相似度;
4)、接着,通过用户在网络上发布的内容信息,挖掘分析用户的虚拟身份描述信息,并结合知识库,建立虚拟身份描述信息与现实身份描述信息的关联关系,进行身份描述信息的相关性分析;
5)、最后,通过设定基本身份信息相似性和身份描述信息相关性的权重值,融合步骤3)基本身份信息相似性和步骤4)身份描述信息相关性的计算结果,对虚拟身份与真实身份之间的关系做出推断。
进一步的,所述步骤1)中,一个人的身份信息包含有两类信息:一是基本身份信息,另一个是身份描述信息,基本身份信息包含性别,出生日期,籍贯,工作地,感情状况,教育背景,工作单位这七个属性信息;真实身份信息的身份描述信息包括知识背景、兴趣、爱好、技能在内的与个人身份相关的信息,依此进行相关真实身份信息的收集;
用户身份分为真实身份T与虚拟身份V,对于这两种身份,都由基本身份信息和身份描述信息组成,用一个二元组<B,D>来描述,B表示基本身份信息集合,包含性别,出生日期,籍贯,工作地,感情状况,教育背景,工作单位这七个属性信息,D代表身份描述信息的集合,为了方便分析,将真实身份信息表示为T=<Bt,Dt>,虚拟身份信息表示为V=<Bv,Dv>。
进一步的,所述步骤1)获取网络中指定用户的信息,具体包括:从网络中按照基本身份信息类别提取个人信息,同时,提取用户在网络中发布的内容用于挖掘用户虚拟身份的身份描述信息。
进一步的,所述步骤2)对获取的用户网络身份数据进行格式化处理,具体包括:对收集到的网络用户的信息进行数据清洗,去除发布内容中长度过短或者仅有图片的信息。
进一步的,所述步骤3)基本身份属性的相似度分析是计算网络身份和真实身份的部分基本属性的相似度;具体步骤为:首先,获取用户在网络中登记的属性信息;然后,格式化信息,并记录未缺失信息;再然后,根据属性类别,确定网络身份与真实身份的各类对应属性间的相似度;最后,统合所有未缺失属性相似度,确定网络身份与真实身份之间的基本身份属性相似性。
进一步的,当网络中出现用户个人信息缺失的情况,仅计算虚拟身份与真实身份中未缺失的共同属性的相似度,并将其所占比重作为基本身份信息相似度的权重,身份共有属性相似度的计算公式为:
其中Pv,Pt分别代表网络身份和真实身份中未缺失的基本身份信息集合Sim(Pv,Pt)是共有属性的平均相似度。
进一步的,所述步骤3)对于日期信息的相似度计算,出生日期是按年月日的格式记录的8位数字,采用编辑距离方法来计算相似度,取值范围为[0,1],数值大小直接反映了两个字符串的绝对差异;
对于籍贯、工作地的地址信息,采用“国家-省份-地市”三段数据结构来表示地址信息,通过分层比较计算转换次数的方式来计算地址相似度,而对于其他字符串类型数据则将中文字符串转化为拼音序列后,采用最长公共子序列算法LCS进行相似度计算。
进一步的,所述步骤4)身份描述信息相关性分析通过知识库找出真实身份描述信息与虚拟身份描述信息的相关性,具体步骤为:首先,通过TF-IDF算法提取用户在网络中发布内容的特征作为网络身份的身份描述信息;然后,逐对计算网络身份与真实身份之间的身份描述特征词的相关度;再然后依据相关度,去除描述信息中的无效特征词;最后,确定网络上身份与真实身份之间的相关度。
进一步的,两个特征词的相关度计算方式为:
其中,Ri(a,b)表示两个特征词语a、b在第i篇文档中的相关度,na、nb分别表示a、b在文档中出现的频数;
在计算了知识库中所有文档中的特征词相关度之后,去除其中计算值过低的无效相关度,计算平均相关度作为两个特征词的综合相关度,计算公式如下:
其中I={i|Ri≥β},β为最低有效相关度,i为知识库中文档的编号,最低有效相关度限定了一篇文档中特征词之间的相关度结果必须超过的数,如果计算结果小于最低有效相关度,则该文档的对应结果无效;
对存在相关性关系的虚实身份特征词计算其总体的加权平均数作为身份描述信息的相关性结果;
其中w为权重,以真实身份描述信息为基准,每个真实身份描述词关联的虚拟身份描述特征词的数量,作为该描述词的权重。
进一步的,所述步骤5)具体包括:基本身份信息相似性分析覆盖个人信息健全的用户,身份描述信息相关性分析覆盖发布内容丰富的用户,通过对网络身份与真实身份之间的相似性和相关性分析结果,确定真实身份T与网络身份V之间的相似度Sim(T,V);
Sim(T,V)=αSim(Bt,Bv)+(1-α)R(Dt,Dv)
其中,其中α为权重。
本发明的优点及有益效果如下:
本发明充分考虑用户在网络中发布的内容,通过知识库建立用户虚拟身份信息与真实身份信息的关联关系,判断用户虚拟身份信息与真实身份信息是否匹配,最后结合用户个人信息相似性度量,提高模型精确度。通过实验证明该方法能够有效对网络中用户的虚拟身份和真实身份进行关联识别,从而有利于网上用户实体的关联识别和行为差异性分析,有助于案件中对特定用户身份的取证调查,提高舆情监管效率。
网络中发布的文字内容信息作为用户的主要活动痕迹包含着丰富的信息。在步骤4)中,创新地通过自然语言处理方法以及知识库,提取出其中能够表明个人身份的相关信息,并将这些信息与待识别的真实身份信息联系起来,细化识别粒度并在仅分析网络身份属性的基础上进一步扩大识别依据,提高识别方法的准确性,使其更加适应网络安全监管和数字取证调查等应用场景的实际需求。
附图说明
图1是本发明提供优选实施例方法流程示意图;
图2为身份信息内容组成图;
图3为基本身份属性相似性分析流程示意图;
图4为身份描述信息相关性分析流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
本发明解决上述技术问题的技术方案是:
如图1所示,一种网络用户的身份识别方法的具体步骤:
步骤11:获取指定对象的现实身份信息。
如图1所示,一个人的身份信息包含有两类信息:一是基本身份信息,另一个是身份描述信息。基本身份信息包含性别,出生日期,籍贯,工作地,感情状况,教育背景,工作单位这七个属性信息。真实身份信息的身份描述信息包含但不限于知识背景、兴趣、爱好、技能等等与个人身份相关的信息。依此进行相关真实身份信息的收集。
用户身份分为真实身份T与虚拟身份V,对于这两种身份,都由基本身份信息和身份描述信息组成,可用一个二元组<B,D>来描述。B表示基本身份信息集合,包含性别,出生日期,籍贯,工作地,感情状况,教育背景,工作单位这九个属性信息。D代表身份描述信息的集合。为了方便分析,将真实身份信息表示为T=<Bt,Dt>,虚拟身份信息表示为V=<Bv,Dv>。
步骤12:获取网络中指定用户的信息。
从网络中按照基本身份信息类别提取个人信息。同时,提取用户在网络中发布的内容用于挖掘用户虚拟身份的身份描述信息。
步骤13:对收集到的网络用户的信息进行数据清洗。
去除发布内容中长度过短或者仅有图片的信息。
步骤14:网络身份与现实身份之间基本身份属性的相似性分析。
如图3所示,基本身份属性的相似度分析是计算网络身份和真实身份的部分基本属性的相似度;具体步骤为:首先,获取用户在网络中登记的属性信息;然后,格式化信息,并记录未缺失信息;再然后,根据属性类别,确定网络身份与真实身份的各类对应属性间的相似度;最后,统合所有未缺失属性相似度,确定网络身份与真实身份之间的基本身份属性相似性。
网络中常常出现用户个人信息缺失的情况。对此,仅计算虚拟身份与真实身份中未缺失的共同属性的相似度,并将其所占比重作为基本身份信息相似度的权重。
具体地,身份共有属性相似度的计算公式为:
其中Pv,Pt分别代表网络身份和真实身份中未缺失的基本身份信息集合Sim(Pv,Pt)是共有属性的平均相似度。
具体地,对于日期信息的相似度计算,出生日期是按年月日(YYYYMMDD)的格式记录的8位数字。采用编辑距离方法来计算相似度,取值范围为[0,1],数值大小直接反映了两个字符串的绝对差异,数值越大,相似度越高。
具体地,对于籍贯、工作地的地址信息,采用“国家-省份-地市”三段数据结构来表示地址信息。通过分层比较计算转换次数的方式来计算地址相似度。而对于其他字符串类型数据则将中文字符串转化为拼音序列后,采用最长公共子序列算法(LCS)进行相似度计算。
步骤15:计算网络身份与现实身份之间身份描述信息的相关度分析。
如图4所示,身份描述信息相关性分析通过知识库找出真实身份描述信息与虚拟身份描述信息的相关性;具体步骤为:首先,通过TF-IDF算法提取用户在网络中发布内容的特征作为网络身份的身份描述信息;然后,逐对计算网络身份与真实身份之间的身份描述特征词的相关度;再然后依据相关度,去除描述信息中的无效特征词;最后,确定网络上身份与真实身份之间的相关度。
具体地,相关度是描述两个特征词语之间的相关程度,用R表示。通过计算一篇文档中两个词语的共现比例来表示他们在该文档中的之间的相关性。
具体地,两个特征词的相关度计算方式为:
其中,Ri(a,b)表示两个特征词语a、b在第i篇文档中的相关度,na、nb分别表示a、b在文档中出现的频数。
具体地,在计算了知识库中所有文档中的特征词相关度之后,去除其中计算值过低的无效相关度,计算平均相关度作为两个特征词的综合相关度。计算公式如下:
其中I={i|Ri≥β},β为最低有效相关度,i为知识库中文档的编号。最低有效相关度限定了一篇文档中特征词之间的相关度结果必须超过的数,如果计算结果小于最低有效相关度,则该文档的对应结果无效。经实验分析,β可以取0.4。β的取值受到具体采用的知识库的影响,根据具体情况可以变化。
具体地,对存在相关性关系的虚实身份特征词计算其总体的加权平均数作为身份描述信息的相关性结果。
其中w为权重。以真实身份描述信息为基准,每个真实身份描述词关联的虚拟身份描述特征词的数量,作为该描述词的权重。
步骤16:融合两部分的分析结果,确定网络身份与现实身份之间的关联性;
基本身份信息相似性分析覆盖个人信息健全的用户,身份描述信息相关性分析覆盖发布内容丰富的用户。通过对网络身份与真实身份之间的相似性和相关性分析结果,确定真实身份T与网络身份V之间的相似度Sim(T,V)。
Sim(T,V)=αSim(Bt,Bv)+(1-α)R(Dt,Dv)
其中,其中α为权重。经实验分析,α可以取0.3。α的取值受到具体网络中用户个人信息缺失的平均水平的影响,根据具体情况可以变化。
本发明中,获取指定的真实身份信息和网络身份信息之后,会基于身份数据并通过知识库,建立真实身份和网络身份之间的关联关系,并计算出真实身份和网络身份的基本属性相似度和描述信息相关度,最后汇总得到真实身份和网络身份的身份信息相似度。通过本发明,可以判断真实身份和网络身份的相似度,进而找到指定真实身份在网络上对应的虚拟身份,或者,通过知道网络上的虚拟身份,知道该虚拟身份对应的真实身份。
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。

Claims (10)

1.一种网络用户身份识别方法,其特征在于,包括以下步骤:
1)、首先,获取网络用户在现实中的真实身份数据,以及获取网络中指定用户的信息;
2)、其次,对获取的用户网络身份数据进行格式化处理,提取其中所需的基本身份属性以及发布的文字内容信息;
3)、然后,利用用户在网络中的基本身份信息和待识别的真实身份数据的基本身份信息,挖掘分析虚拟身份与真实身份之间的关联性,进行基本身份信息的相似性分析,即计算网络身份和真实身份的部分基本属性的相似度;
4)、接着,通过用户在网络上发布的内容信息,挖掘分析用户的虚拟身份描述信息,并结合知识库,建立虚拟身份描述信息与现实身份描述信息的关联关系,进行身份描述信息的相关性分析;
5)、最后,通过设定基本身份信息相似性和身份描述信息相关性的权重值,融合步骤3)基本身份信息相似性和步骤4)身份描述信息相关性的计算结果,对虚拟身份与真实身份之间的关系做出推断。
2.根据权利要求1所述的一种网络用户身份识别方法,其特征在于,
所述步骤1)中,一个人的身份信息包含有两类信息:一是基本身份信息,另一个是身份描述信息,基本身份信息包含性别,出生日期,籍贯,工作地,感情状况,教育背景,工作单位这七个属性信息;真实身份信息的身份描述信息包括知识背景、兴趣、爱好、技能在内的与个人身份相关的信息,依此进行相关真实身份信息的收集;
用户身份分为真实身份T与虚拟身份V,对于这两种身份,都由基本身份信息和身份描述信息组成,用一个二元组<B,D>来描述,B表示基本身份信息集合,包含性别,出生日期,籍贯,工作地,感情状况,教育背景,工作单位这七个属性信息,D代表身份描述信息的集合,为了方便分析,将真实身份信息表示为T=<Bt,Dt>,虚拟身份信息表示为V=<Bv,Dv>。
3.根据权利要求1所述的一种网络用户身份识别方法,其特征在于,
所述步骤1)获取网络中指定用户的信息,具体包括:从网络中按照基本身份信息类别提取个人信息,同时,提取用户在网络中发布的内容用于挖掘用户虚拟身份的身份描述信息。
4.根据权利要求1所述的一种网络用户身份识别方法,其特征在于,所述步骤2)对获取的用户网络身份数据进行格式化处理,具体包括:对收集到的网络用户的信息进行数据清洗,去除发布内容中长度过短或者仅有图片的信息。
5.根据权利要求1所述的一种网络用户身份识别方法,其特征在于,所述步骤3)基本身份属性的相似度分析是计算网络身份和真实身份的部分基本属性的相似度;具体步骤为:首先,获取用户在网络中登记的属性信息;然后,格式化信息,并记录未缺失信息;再然后,根据属性类别,确定网络身份与真实身份的各类对应属性间的相似度;最后,统合所有未缺失属性相似度,确定网络身份与真实身份之间的基本身份属性相似性。
6.根据权利要求5所述的一种网络用户身份识别方法,其特征在于,当网络中出现用户个人信息缺失的情况,仅计算虚拟身份与真实身份中未缺失的共同属性的相似度,并将其所占比重作为基本身份信息相似度的权重,身份共有属性相似度的计算公式为:
其中Pv,Pt分别代表网络身份和真实身份中未缺失的基本身份信息集合Sim(Pv,Pt)是共有属性的平均相似度。
7.根据权利要求5所述的一种网络用户身份识别方法,其特征在于,
所述步骤3)对于日期信息的相似度计算,出生日期是按年月日的格式记录的8位数字,采用编辑距离方法来计算相似度,取值范围为[0,1],数值大小直接反映了两个字符串的绝对差异;
对于籍贯、工作地的地址信息,采用“国家-省份-地市”三段数据结构来表示地址信息,将地址信息表示为三维向量,再通过余弦相似度来计算地址相似度。而对于其他字符串类型数据则将中文字符串转化为拼音序列后,采用最长公共子序列算法LCS进行相似度计算。
8.根据权利要求1所述的一种网络用户身份识别方法,其特征在于,所述步骤4)身份描述信息相关性分析通过知识库找出真实身份描述信息与虚拟身份描述信息的相关性,具体步骤为:首先,通过TF-IDF算法提取用户在网络中发布内容的特征作为网络身份的身份描述信息;然后,逐对计算网络身份与真实身份之间的身份描述特征词的相关度;再然后依据相关度,去除描述信息中的无效特征词;最后,确定网络上身份与真实身份之间的相关度。
9.根据权利要求8所述的一种网络用户身份识别方法,其特征在于,两个特征词的相关度计算方式为:
其中,Ri(a,b)表示两个特征词语a、b在第i篇文档中的相关度,na、nb分别表示a、b在文档中出现的频数;
在计算了知识库中所有文档中的特征词相关度之后,去除其中计算值过低的无效相关度,计算平均相关度作为两个特征词的综合相关度,计算公式如下:
其中I={i|Ri≥β},β为最低有效相关度,i为知识库中文档的编号,最低有效相关度限定了一篇文档中特征词之间的相关度结果必须超过的数,如果计算结果小于最低有效相关度,则该文档的对应结果无效;
对存在相关性关系的虚实身份特征词计算其总体的加权平均数作为身份描述信息的相关性结果;
其中w为权重,以真实身份描述信息为基准,每个真实身份描述词关联的虚拟身份描述特征词的数量,作为该描述词的权重。
10.根据权利要求8所述的一种网络用户身份识别方法,其特征在于,
所述步骤5)具体包括:基本身份信息相似性分析覆盖个人信息健全的用户,身份描述信息相关性分析覆盖发布内容丰富的用户,通过对网络身份与真实身份之间的相似性和相关性分析结果,确定真实身份T与网络身份V之间的相似度Sim(T,V);
Sim(T,V)=αSim(Bt,Bv)+(1-α)R(Dt,Dv)
其中,其中α为权重。
CN201910168675.XA 2019-03-06 2019-03-06 一种网络用户身份识别方法 Active CN109978016B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910168675.XA CN109978016B (zh) 2019-03-06 2019-03-06 一种网络用户身份识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910168675.XA CN109978016B (zh) 2019-03-06 2019-03-06 一种网络用户身份识别方法

Publications (2)

Publication Number Publication Date
CN109978016A true CN109978016A (zh) 2019-07-05
CN109978016B CN109978016B (zh) 2022-08-23

Family

ID=67078049

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910168675.XA Active CN109978016B (zh) 2019-03-06 2019-03-06 一种网络用户身份识别方法

Country Status (1)

Country Link
CN (1) CN109978016B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111143627A (zh) * 2019-12-27 2020-05-12 北京百度网讯科技有限公司 用户身份数据确定方法、装置、设备和介质
CN111160130A (zh) * 2019-12-12 2020-05-15 中国电子科技网络信息安全有限公司 一种多平台虚拟身份账号的多维碰撞识别方法
CN111866023A (zh) * 2020-08-04 2020-10-30 深圳供电局有限公司 一种异常用户行为审计方法和装置
CN112367663A (zh) * 2019-07-23 2021-02-12 中国移动通信集团广东有限公司 一种确定宽带接入用户号码的方法、装置及设备
CN112990446A (zh) * 2021-05-19 2021-06-18 神威超算(北京)科技有限公司 一种异常团体识别方法、装置和智能芯片
CN113055386A (zh) * 2021-03-12 2021-06-29 哈尔滨安天科技集团股份有限公司 一种攻击组织的识别分析方法和装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286163A (zh) * 2008-05-15 2008-10-15 深圳先进技术研究院 一种基于识别知识库的识别方法
US20090112864A1 (en) * 2005-10-26 2009-04-30 Cortica, Ltd. Methods for Identifying Relevant Metadata for Multimedia Data of a Large-Scale Matching System
US20100274815A1 (en) * 2007-01-30 2010-10-28 Jonathan Brian Vanasco System and method for indexing, correlating, managing, referencing and syndicating identities and relationships across systems
CN103746905A (zh) * 2013-12-31 2014-04-23 广州网易计算机系统有限公司 一种交互式消息的处理方法、设备及系统
CN103745014A (zh) * 2014-01-29 2014-04-23 中国科学院计算技术研究所 一种社交网络用户虚实映射方法和系统
CN105376223A (zh) * 2015-11-02 2016-03-02 北京锐安科技有限公司 网络身份关系的可靠度计算方法
CN105871869A (zh) * 2016-04-28 2016-08-17 湖南科技学院 移动社交网络中基于单项散列函数和伪身份匿名双向认证方法
CN106126521A (zh) * 2016-06-06 2016-11-16 腾讯科技(深圳)有限公司 目标对象的社交账号挖掘方法及服务器
CN106815566A (zh) * 2016-12-29 2017-06-09 天津中科智能识别产业技术研究院有限公司 一种基于多任务卷积神经网络的人脸检索方法
CN107480549A (zh) * 2017-06-28 2017-12-15 银江股份有限公司 一种面向数据共享的敏感信息脱敏方法及系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090112864A1 (en) * 2005-10-26 2009-04-30 Cortica, Ltd. Methods for Identifying Relevant Metadata for Multimedia Data of a Large-Scale Matching System
US20100274815A1 (en) * 2007-01-30 2010-10-28 Jonathan Brian Vanasco System and method for indexing, correlating, managing, referencing and syndicating identities and relationships across systems
CN101286163A (zh) * 2008-05-15 2008-10-15 深圳先进技术研究院 一种基于识别知识库的识别方法
CN103746905A (zh) * 2013-12-31 2014-04-23 广州网易计算机系统有限公司 一种交互式消息的处理方法、设备及系统
CN103745014A (zh) * 2014-01-29 2014-04-23 中国科学院计算技术研究所 一种社交网络用户虚实映射方法和系统
CN105376223A (zh) * 2015-11-02 2016-03-02 北京锐安科技有限公司 网络身份关系的可靠度计算方法
CN105871869A (zh) * 2016-04-28 2016-08-17 湖南科技学院 移动社交网络中基于单项散列函数和伪身份匿名双向认证方法
CN106126521A (zh) * 2016-06-06 2016-11-16 腾讯科技(深圳)有限公司 目标对象的社交账号挖掘方法及服务器
CN106815566A (zh) * 2016-12-29 2017-06-09 天津中科智能识别产业技术研究院有限公司 一种基于多任务卷积神经网络的人脸检索方法
CN107480549A (zh) * 2017-06-28 2017-12-15 银江股份有限公司 一种面向数据共享的敏感信息脱敏方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张树森 等: "社会网络角色识别方法综述", 《计算机学报》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112367663A (zh) * 2019-07-23 2021-02-12 中国移动通信集团广东有限公司 一种确定宽带接入用户号码的方法、装置及设备
CN112367663B (zh) * 2019-07-23 2023-04-07 中国移动通信集团广东有限公司 一种确定宽带接入用户号码的方法、装置及设备
CN111160130A (zh) * 2019-12-12 2020-05-15 中国电子科技网络信息安全有限公司 一种多平台虚拟身份账号的多维碰撞识别方法
CN111160130B (zh) * 2019-12-12 2022-04-01 中国电子科技网络信息安全有限公司 一种多平台虚拟身份账号的多维碰撞识别方法
CN111143627A (zh) * 2019-12-27 2020-05-12 北京百度网讯科技有限公司 用户身份数据确定方法、装置、设备和介质
CN111143627B (zh) * 2019-12-27 2023-08-15 北京百度网讯科技有限公司 用户身份数据确定方法、装置、设备和介质
CN111866023A (zh) * 2020-08-04 2020-10-30 深圳供电局有限公司 一种异常用户行为审计方法和装置
CN113055386A (zh) * 2021-03-12 2021-06-29 哈尔滨安天科技集团股份有限公司 一种攻击组织的识别分析方法和装置
CN113055386B (zh) * 2021-03-12 2023-03-24 安天科技集团股份有限公司 一种攻击组织的识别分析方法和装置
CN112990446A (zh) * 2021-05-19 2021-06-18 神威超算(北京)科技有限公司 一种异常团体识别方法、装置和智能芯片
CN112990446B (zh) * 2021-05-19 2021-09-24 神威超算(北京)科技有限公司 一种异常团体识别方法、装置和智能芯片

Also Published As

Publication number Publication date
CN109978016B (zh) 2022-08-23

Similar Documents

Publication Publication Date Title
CN109978016A (zh) 一种网络用户身份识别方法
CN110619568A (zh) 风险评估报告的生成方法、装置、设备及存储介质
CN105095211B (zh) 多媒体数据的获取方法和装置
CN108549647B (zh) 基于SinglePass算法实现无标注语料主动预测移动客服领域中突发事件的方法
WO2021208601A1 (zh) 基于人工智能的图像处理方法、装置、设备及存储介质
CN106960006A (zh) 一种不同轨迹间相似度度量系统及其度量方法
CN110647632B (zh) 基于机器学习的图像与文本映射技术
CN111723784A (zh) 一种风险视频识别方法、装置和电子设备
CN109086355A (zh) 基于新闻主题词的热点关联关系分析方法及系统
CN103077207A (zh) 一种微博开心指数分析方法及系统
Pham et al. Towards integrating real-world spatiotemporal data with social networks
CN112036659B (zh) 基于组合策略的社交网络媒体信息流行度预测方法
EP4357939A1 (en) Picture processing method and system based on picture-text combination, and readable storage medium
CN112270579A (zh) 一种基于大数据的智能广告系统
CN112328833A (zh) 标签处理方法、装置及计算机可读存储介质
CN110378190B (zh) 基于主题识别的视频内容检测系统及检测方法
Yen et al. Ten questions in lifelog mining and information recall
CN113591853A (zh) 关键词提取方法、装置及电子设备
CN117036833A (zh) 一种视频分类方法、装置、设备和计算机可读存储介质
CN112463922A (zh) 一种风险用户识别方法及存储介质
CN116977992A (zh) 文本信息识别方法、装置、计算机设备和存储介质
CN114781348B (zh) 一种基于词袋模型的文本相似度计算方法及系统
CN114443930A (zh) 一种新闻舆情智能监测分析方法、系统及计算机存储介质
CN104850606B (zh) 一种移动群智感知中社会事件的总结方法
CN114329050A (zh) 视觉媒体数据去重处理方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant