CN111339441A - 用户信息的获取方法及装置 - Google Patents

用户信息的获取方法及装置 Download PDF

Info

Publication number
CN111339441A
CN111339441A CN202010108691.2A CN202010108691A CN111339441A CN 111339441 A CN111339441 A CN 111339441A CN 202010108691 A CN202010108691 A CN 202010108691A CN 111339441 A CN111339441 A CN 111339441A
Authority
CN
China
Prior art keywords
information
user
designated area
user information
acquiring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010108691.2A
Other languages
English (en)
Inventor
齐中祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Womin High New Science & Technology Beijing Co ltd
Original Assignee
Womin High New Science & Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Womin High New Science & Technology Beijing Co ltd filed Critical Womin High New Science & Technology Beijing Co ltd
Priority to CN202010108691.2A priority Critical patent/CN111339441A/zh
Publication of CN111339441A publication Critical patent/CN111339441A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种用户信息的获取方法及装置。其中,该方法包括:获取与指定区域有关联的用户信息;根据用户信息中的过滤信息对用户信息进行过滤,其中,过滤信息包括下列至少之一:居住信息、家乡信息、教育信息、工作信息。本发明解决了相关技术中的获取用户信息的方式,容易产生信息遗漏,准确率低的技术问题。

Description

用户信息的获取方法及装置
技术领域
本发明涉及网络数据处理领域,具体而言,涉及一种用户信息的获取方法及装置。
背景技术
用户在网络上可以发表言论进行交流沟通,但是社交媒体用户发表言论大部分不会注明自己所在的区域,导致无法根据言论确定该用户所在的真实地址范围,无法满足一些场景下的需求,例如,发表违法言论,无法确定发表言论的用户所在的真实区域。导致无法满足使用需求的问题。
相关技术中,需要提前收集一些指定区域的信息(如地名,学校名等等),收集不全可能会产生遗漏。另外,用户在填写个人信息时千奇百怪,过滤采用上述个人信息难以保证准确性。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种用户信息的获取方法及装置,以至少解决相关技术中的获取用户信息的方式,容易产生信息遗漏,准确率低的技术问题。
根据本发明实施例的一个方面,提供了一种用户信息的获取方法,包括:获取与指定区域有关联的用户信息;根据所述用户信息中的过滤信息对所述用户信息进行过滤,其中,所述过滤信息包括下列至少之一:居住信息、家乡信息、教育信息、工作信息。
可选的,获取与指定区域有关联的用户信息包括:获取所述指定区域的任意一个用户在社交软件中的所有好友的用户信息;判断所述用户信息是否已经采集过,将未采集过的用户信息输入队列循环采集好友列表;通过所述队列循环采集好友列表采集所述队列循环采集好友列表中的每个用户的好友的用户信息。
可选的,获取与指定区域有关联的用户信息包括:获取已有的所述指定区域的用户建立的用户群组;判断所述用户群组的成员的用户信息是否被采集过,将所述用户群组的未采集过的成员的用户信息进行采集。
可选的,获取与指定区域有关联的用户信息包括:获取互联网中所述用户信息对应用户执行的第一行为信息,其中,所述第一行为信息为文本信息,所述第一行为信息包含所述指定区域的标识文本;判断所述第一行为信息中是否包括所述指定区域的关键词,获取具有所述关键词的所述第一行为信息的执行者的用户信息。
可选的,获取与指定区域有关联的用户信息包括:获取互联网中所述用户信息对应用户执行的第二行为信息,其中,所述第一行为信息包括位置信息;判断所述第二行为信息中是否包括所述指定区域的位置信息,在所述第二行为信息包括所述指定区域的位置信息的情况下,获取所述第二行为信息的执行者的用户信息。
可选的,通过所述用户信息中的过滤信息进行过滤包括:确定所述用户信息的所述居住信息是否为所述指定区域,在所述居住信息位于所述指定区域的情况下,确定所述用户信息对应的用户为所述指定区域的用户;和/或,在所述居住信息不位于所述指定区域的情况下,确定所述用户信息的所述家乡信息是否为所述指定区域,在所述家乡信息位于所述指定区域的情况下,确定所述用户信息对应的用户为所述指定区域的用户;和/或,在所述家乡信息不位于所述指定区域的情况下,确定所述用户信息的所述教育信息是否为所述指定区域的学校,在所述教育信息为所述指定区域的学校的情况下,确定所述用户信息对应的用户为所述指定区域的用户;和/或,在所述教育信息不是所述指定区域的学校的情况下,确定所述用户信息的所述工作信息是否为所述指定区域的公司,在所述工作信息为所述指定区域的公司的情况下,确定所述用户信息对应的用户为所述指定区域的用户。
根据本发明实施例的另一方面,还提供了一种用户信息的获取装置,包括:获取模块,用于获取与指定区域有关联的用户信息;过滤模块,用于根据所述用户信息中的过滤信息对所述用户信息进行过滤,其中,所述过滤信息包括下列至少之一:居住信息、家乡信息、教育信息、工作信息。
可选的,所述过滤模块包括:第一确定单元,用于确定所述用户信息的所述居住信息是否为所述指定区域,在所述居住信息位于所述指定区域的情况下,确定所述用户信息对应的用户为所述指定区域的用户;和/或,第二确定单元,用于在所述居住信息不位于所述指定区域的情况下,确定所述用户信息的所述家乡信息是否为所述指定区域,在所述家乡信息位于所述指定区域的情况下,确定所述用户信息对应的用户为所述指定区域的用户;和/或,第三确定单元,用于在所述家乡信息不位于所述指定区域的情况下,确定所述用户信息的所述教育信息是否为所述指定区域的学校,在所述教育信息为所述指定区域的学校的情况下,确定所述用户信息对应的用户为所述指定区域的用户;和/或,第四确定单元,用于在所述教育信息不是所述指定区域的学校的情况下,确定所述用户信息的所述工作信息是否为所述指定区域的公司,在所述工作信息为所述指定区域的公司的情况下,确定所述用户信息对应的用户为所述指定区域的用户。
根据本发明实施例的另一方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述中任意一项所述的用户获取方法。
根据本发明实施例的另一方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述中任意一项所述的用户获取方法。
在本发明实施例中,采用获取与指定区域有关联的用户信息;根据所述用户信息中的过滤信息对所述用户信息进行过滤,其中,所述过滤信息包括下列至少之一:居住信息、家乡信息、教育信息、工作信息的方式,通过多种过滤信息对用户信息进行过滤,达到了对用户信息进行准确获取的目的,从而实现了提高准确率的技术效果,进而解决了相关技术中的获取用户信息的方式,容易产生信息遗漏,准确率低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种用户信息的获取方法的流程图;
图2是根据本发明实施方式的通过好友关系获取社交媒体指定区域的账户的流程图;
图3是根据本发明实施方式的通过群组获取指定区域的账号的流程图;
图4是根据本发明实施方式的通过用户账号获取指定区域的账号的流程图;
图5是根据本发明实施例的一种用户信息的获取装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种用户信息的获取方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种用户信息的获取方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取与指定区域有关联的用户信息;
步骤S104,根据用户信息中的过滤信息对用户信息进行过滤,其中,过滤信息包括下列至少之一:居住信息、家乡信息、教育信息、工作信息。
通过上述步骤,采用获取与指定区域有关联的用户信息;根据用户信息中的过滤信息对用户信息进行过滤,其中,过滤信息包括下列至少之一:居住信息、家乡信息、教育信息、工作信息的方式,通过多种过滤信息对用户信息进行过滤,达到了对用户信息进行准确获取的目的,从而实现了提高准确率的技术效果,进而解决了相关技术中的获取用户信息的方式,容易产生信息遗漏,准确率低的技术问题。
上述指定区域可以是指定的地区范围,例如,北京市,朝阳区,例如,高新区,例如,某学校等。与上述指定区域有关联的用户信息,可以是出生地位于上述指定区域的用户的用户信息,也可以是居住地位于上述指定区域的用户的用户信息,还可以是学生上学的学校位于上述指定区域的用户的用户信息,还可以是到上述指定区域旅游过的用户的用户信息等。
获取到上述指定区域有关联的用户信息之后,通过过滤信息对上述用户信息进行过滤,以找到指定区域内,满足过滤信息对应的过滤条件的用户,从而实现了通过多种过滤信息对用户信息进行过滤,达到了对用户信息进行准确获取的目的,从而实现了提高准确率的技术效果,进而解决了相关技术中的获取用户信息的方式,容易产生信息遗漏,准确率低的技术问题。
上述获取与上述指定区域有关联的用户信息可以是多种方式,具体如下:
可以通过社交软件获取与指定区域有关联的用户信息,具体包括:获取指定区域的任意一个用户在社交软件中的所有好友的用户信息;判断用户信息是否已经采集过,将未采集过的用户信息输入队列循环采集好友列表;通过队列循环采集好友列表采集队列循环采集好友列表中的每个用户的好友的用户信息。
还可以通过用户群组获取与指定区域有关联的用户信息包括:获取已有的指定区域的用户建立的用户群组;判断用户群组的成员的用户信息是否被采集过,将用户群组的未采集过的成员的用户信息进行采集。
还可以根据文本信息获取与指定区域有关联的用户信息包括:获取互联网中用户信息对应用户执行的第一行为信息,其中,第一行为信息为文本信息,第一行为信息包含指定区域的标识文本;判断第一行为信息中是否包括指定区域的关键词,获取具有关键词的第一行为信息的执行者的用户信息。
上述第一行为信息可以是在媒体网站,或者论坛上发帖或者留言的行为信息,上述文本信息,为上述帖子,或者留言的信息,可以根据上述帖子或者留言的信息中的关键词,例如,与上述指定区域有关的地名别称,小吃名称,著名人物名称等,确定对应的用户是否与上述指定区域有关联。
还可以根据用户信息是否包括指定区域的位置信息,来获取与指定区域有关联的用户信息包括:获取互联网中用户信息对应用户执行的第二行为信息,其中,第一行为信息包括位置信息;判断第二行为信息中是否包括指定区域的位置信息,在第二行为信息包括指定区域的位置信息的情况下,获取第二行为信息的执行者的用户信息。
上述第二行为信息可以是用户在社交媒体上的打卡签到的行为信息,上述打卡签到可以保留打卡的足迹,包括每次打卡的时间和所处位置,从而根据上述打卡的所处位置是否包括上述指定区域内的位置。
可选的,通过用户信息中的过滤信息进行过滤包括:确定用户信息的居住信息是否为指定区域,在居住信息位于指定区域的情况下,确定用户信息对应的用户为指定区域的用户;和/或,在居住信息不位于指定区域的情况下,确定用户信息的家乡信息是否为指定区域,在家乡信息位于指定区域的情况下,确定用户信息对应的用户为指定区域的用户;和/或,在家乡信息不位于指定区域的情况下,确定用户信息的教育信息是否为指定区域的学校,在教育信息为指定区域的学校的情况下,确定用户信息对应的用户为指定区域的用户;和/或,在教育信息不是指定区域的学校的情况下,确定用户信息的工作信息是否为指定区域的公司,在工作信息为指定区域的公司的情况下,确定用户信息对应的用户为指定区域的用户。
上述居住信息,家乡信息,教育信息,工作信息,可以是一个或者任意数量,上述居住信息,家乡信息,教育信息和工作信息可以一定顺序进行过滤,也可以随机顺序进行过滤。
需要说明的是,本实施例还提供了一种可选的实施方式,下面对该实施方式进行详细说明。
本实施方式提供了一种识别社交媒体中指定区域用户的技术。包括通过多种维度的对未知用户的粗粒度查找,已有数据集的分析提取,社交媒体公开信息的采集,指定区域的用户的细粒度过滤。
相关技术需要提前收集一些指定区域的信息(如地名,学校名等等),收集不全可能会产生遗漏。用户在填写个人信息时千奇百怪,过滤达不到100%准确。好友关系网越到后面关系越大,但也是越到后面与该地区相关的用户越少。群组关系网到后面会有一个瓶颈,采集的重复数据会越来越多。
本实施方式可以根据多种维度的关系网来找出指定区域的用户。对于不同社交媒体的公开信息采集的能力。历史数据进行的检索与分析的速度。指定区域用户过滤的策略。准确找出社交媒体中指定区域内的用户。
本实施方式的技术方案可分为两个部分;第一部分为获取与指定区域有关联的用户,此部分可通过一些关系裙带来获取。通过第一部分将会获取到大量的用户群体,这些用户与预想的结果还有很大差别,便需要通过第二部分来过滤出与指定区域强相关的用户。这些过滤条件可以根据不同社交媒体给出的信息进行不同的过滤选择,例如可选择居住信息、家乡信息、教育信息、工作信息等来做为过滤条件。
一、在本实施方式粗粒度的用户扩展中,主要有四个功能来实现。
1、通过好友关系拓展用户:
有一理论是“只要通过六个人就能认识全世界的任意一个人”,所以这种方法为先拿到指定区域内某个用户的好友列表,然后通过这些好友再去拿上述好友的好友列表,类似于一个树型结构。
图2是根据本发明实施方式的通过好友关系获取社交媒体指定区域的账户的流程图,如图2所示,本实施方式的实现方案如下:
a)获取指定区域某个用户所有好友的账号
b)判断好友账号是否已经采集过
c)未采集过的账号打入队列循环采集好友列表
2、通过小组或者群拓展用户:
在社交媒体中,每一个地区都会产生大量该地区的小组或者群,有生活相关的、爱好相关的等等;往往加入这些小组或者群的成员,就是该区域生活或居住的人。通过查找或从已经确定区域的账号来获取该成员加入的小组或群,再拿到这些小组或群的成员便可获取到更多该区域的用户账号。
图3是根据本发明实施方式的通过群组获取指定区域的账号的流程图,如图3所示,本实施方式的实现方案如下:
a)获取已有某地区用户的小组或群信息
b)判断小组或群是否已经采集过群内成员
c)未采集过的进行采集新的成员信息
3、通过发帖信息拓展用户:
现在各大社交媒体,都能够进行发帖或者留言。便可通过用户的发帖或留言信息进行分析,看这些信息中是否包含了指定的区域内的一些关键词汇,这些词汇可以是地名、小吃、著名人物等;若存在指定的关键词,那便认为发帖者与指定区域有所关联。
其具体的实现方案如下:
a)扫描检索数据库中已存在的帖子或留言
b)找出与设定的关键词有关联的帖子
c)根据帖子获得发帖者的信息
4、通过地理位置信息拓展用户:
某些社交媒体有打卡签到功能,可根据用户的足迹来认为用户是与指定区域相关联的。
其具体的实现方案如下:
a)扫描检索数据库中已存在的用户
b)找出与指定区域相关联的足迹用户账号
二、在指定区域的细粒度用户过滤上,本实施方式主要是通过文本的匹配与相识度来实现。当用户个人信息中的语句为固定的是,例如官方地名,人名等可进行直接匹配过滤;但某些语句为不固定的,例如地名的别称、学校的简称等可进行相识度对比来过滤。
其具体的实现方案如下:
1、采集已有账号的个人信息
2、通过个人信息中的居住信息、家乡信息、教育信息、工作信息进行过滤
图4是根据本发明实施方式的通过用户账号获取指定区域的账号的流程图,如图4所示,本实施方式通过社交群更能准确找出指定区域的用户。在获取大量用户前的起始基数可以更小。用户关系的扩张前期更加迅速。过滤条件可以更加的广泛。与第一条所述的现有技术相比,无论是好友推荐还是社区划分,其扩张限度都比较小。如果需要通过好友推荐或社区划分的技术来实现识别较大的指定区域用户,那么也需要更大的基础数据来提供支持。而本实施方式只需更小的基数,一个用户或者一个群;通过了第一次广泛的扩张,第二次细粒度的过滤,将大大增加正确识别的用户量。
经试验,利用本实施方式针对FaceBook社交媒体中的香港地区用户进行了查找,首先通过人工查找到了五个香港地区的群组,通过这五个群组进行了群员采集,同时也对历史数据进行了分析,查找出了一部分相关的账号。这样基础数据达到了1万个,然后通过本发明对着1万个账号进行扩张,半个月之内便识别出了100万个香港地区用户。
图5是根据本发明实施例的一种用户信息的获取装置的示意图,如图5所示,根据本发明实施例的另一方面,还提供了一种用户信息的获取装置,包括:获取模块52和过滤模块54,下面对该装置进行详细说明。
获取模块52,用于获取与指定区域有关联的用户信息;过滤模块54,与上述获取模块52相连,用于根据用户信息中的过滤信息对用户信息进行过滤,其中,过滤信息包括下列至少之一:居住信息、家乡信息、教育信息、工作信息。
通过上述装置,采用获取模块52获取与指定区域有关联的用户信息;过滤模块54根据所述用户信息中的过滤信息对所述用户信息进行过滤,其中,所述过滤信息包括下列至少之一:居住信息、家乡信息、教育信息、工作信息的方式,通过多种过滤信息对用户信息进行过滤,达到了对用户信息进行准确获取的目的,从而实现了提高准确率的技术效果,进而解决了相关技术中的获取用户信息的方式,容易产生信息遗漏,准确率低的技术问题。
可选的,过滤模块包括:第一确定单元,用于确定用户信息的居住信息是否为指定区域,在居住信息位于指定区域的情况下,确定用户信息对应的用户为指定区域的用户;和/或,第二确定单元,用于在居住信息不位于指定区域的情况下,确定用户信息的家乡信息是否为指定区域,在家乡信息位于指定区域的情况下,确定用户信息对应的用户为指定区域的用户;和/或,第三确定单元,用于在家乡信息不位于指定区域的情况下,确定用户信息的教育信息是否为指定区域的学校,在教育信息为指定区域的学校的情况下,确定用户信息对应的用户为指定区域的用户;和/或,第四确定单元,用于在教育信息不是指定区域的学校的情况下,确定用户信息的工作信息是否为指定区域的公司,在工作信息为指定区域的公司的情况下,确定用户信息对应的用户为指定区域的用户。
根据本发明实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述中任意一项的用户获取方法。
根据本发明实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述中任意一项的用户获取方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种用户信息的获取方法,其特征在于,包括:
获取与指定区域有关联的用户信息;
根据所述用户信息中的过滤信息对所述用户信息进行过滤,其中,所述过滤信息包括下列至少之一:居住信息、家乡信息、教育信息、工作信息。
2.根据权利要求1所述的方法,其特征在于,获取与指定区域有关联的用户信息包括:
获取所述指定区域的任意一个用户在社交软件中的所有好友的用户信息;
判断所述用户信息是否已经采集过,将未采集过的用户信息输入队列循环采集好友列表;
通过所述队列循环采集好友列表采集所述队列循环采集好友列表中的每个用户的好友的用户信息。
3.根据权利要求1所述的方法,其特征在于,获取与指定区域有关联的用户信息包括:
获取已有的所述指定区域的用户建立的用户群组;
判断所述用户群组的成员的用户信息是否被采集过,将所述用户群组的未采集过的成员的用户信息进行采集。
4.根据权利要求1所述的方法,其特征在于,获取与指定区域有关联的用户信息包括:
获取互联网中所述用户信息对应用户执行的第一行为信息,其中,所述第一行为信息为文本信息,所述第一行为信息包含所述指定区域的标识文本;
判断所述第一行为信息中是否包括所述指定区域的关键词,获取具有所述关键词的所述第一行为信息的执行者的用户信息。
5.根据权利要求1所述的方法,其特征在于,获取与指定区域有关联的用户信息包括:
获取互联网中所述用户信息对应用户执行的第二行为信息,其中,所述第二行为信息包括位置信息;
判断所述第二行为信息中是否包括所述指定区域的位置信息,在所述第二行为信息包括所述指定区域的位置信息的情况下,获取所述第二行为信息的执行者的用户信息。
6.根据权利要求1所述的方法,其特征在于,通过所述用户信息中的过滤信息进行过滤包括:
确定所述用户信息的所述居住信息是否为所述指定区域,在所述居住信息位于所述指定区域的情况下,确定所述用户信息对应的用户为所述指定区域的用户;
和/或,在所述居住信息不位于所述指定区域的情况下,确定所述用户信息的所述家乡信息是否为所述指定区域,在所述家乡信息位于所述指定区域的情况下,确定所述用户信息对应的用户为所述指定区域的用户;
和/或,在所述家乡信息不位于所述指定区域的情况下,确定所述用户信息的所述教育信息是否为所述指定区域的学校,在所述教育信息为所述指定区域的学校的情况下,确定所述用户信息对应的用户为所述指定区域的用户;
和/或,在所述教育信息不是所述指定区域的学校的情况下,确定所述用户信息的所述工作信息是否为所述指定区域的公司,在所述工作信息为所述指定区域的公司的情况下,确定所述用户信息对应的用户为所述指定区域的用户。
7.一种用户信息的获取装置,其特征在于,包括:
获取模块,用于获取与指定区域有关联的用户信息;
过滤模块,用于根据所述用户信息中的过滤信息对所述用户信息进行过滤,其中,所述过滤信息包括下列至少之一:居住信息、家乡信息、教育信息、工作信息。
8.根据权利要求7所述的装置,其特征在于,所述过滤模块包括:
第一确定单元,用于确定所述用户信息的所述居住信息是否为所述指定区域,在所述居住信息位于所述指定区域的情况下,确定所述用户信息对应的用户为所述指定区域的用户;
和/或,第二确定单元,用于在所述居住信息不位于所述指定区域的情况下,确定所述用户信息的所述家乡信息是否为所述指定区域,在所述家乡信息位于所述指定区域的情况下,确定所述用户信息对应的用户为所述指定区域的用户;
和/或,第三确定单元,用于在所述家乡信息不位于所述指定区域的情况下,确定所述用户信息的所述教育信息是否为所述指定区域的学校,在所述教育信息为所述指定区域的学校的情况下,确定所述用户信息对应的用户为所述指定区域的用户;
和/或,第四确定单元,用于在所述教育信息不是所述指定区域的学校的情况下,确定所述用户信息的所述工作信息是否为所述指定区域的公司,在所述工作信息为所述指定区域的公司的情况下,确定所述用户信息对应的用户为所述指定区域的用户。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至6中任意一项所述的用户获取方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至6中任意一项所述的用户获取方法。
CN202010108691.2A 2020-02-21 2020-02-21 用户信息的获取方法及装置 Pending CN111339441A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010108691.2A CN111339441A (zh) 2020-02-21 2020-02-21 用户信息的获取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010108691.2A CN111339441A (zh) 2020-02-21 2020-02-21 用户信息的获取方法及装置

Publications (1)

Publication Number Publication Date
CN111339441A true CN111339441A (zh) 2020-06-26

Family

ID=71184653

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010108691.2A Pending CN111339441A (zh) 2020-02-21 2020-02-21 用户信息的获取方法及装置

Country Status (1)

Country Link
CN (1) CN111339441A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150253965A1 (en) * 2012-11-23 2015-09-10 Tencent Technology (Shenzhen) Company Limited Buddy List Presentation Control Method and System, and Computer Storage Medium
CN105634854A (zh) * 2014-11-07 2016-06-01 中兴通讯股份有限公司 用户属性分析方法及装置
CN109145227A (zh) * 2018-08-30 2019-01-04 努比亚技术有限公司 一种地图信息显示方法、终端及计算机可读存储介质
CN109255080A (zh) * 2018-07-31 2019-01-22 平安科技(深圳)有限公司 一种信息处理方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150253965A1 (en) * 2012-11-23 2015-09-10 Tencent Technology (Shenzhen) Company Limited Buddy List Presentation Control Method and System, and Computer Storage Medium
CN105634854A (zh) * 2014-11-07 2016-06-01 中兴通讯股份有限公司 用户属性分析方法及装置
CN109255080A (zh) * 2018-07-31 2019-01-22 平安科技(深圳)有限公司 一种信息处理方法及装置
CN109145227A (zh) * 2018-08-30 2019-01-04 努比亚技术有限公司 一种地图信息显示方法、终端及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN105302810B (zh) 一种信息搜索方法和装置
CN109299271B (zh) 训练样本生成、文本数据、舆情事件分类方法及相关设备
CN105760439B (zh) 一种基于特定行为共现网络的人物共现关系图谱构建方法
CN109739997B (zh) 地址对比方法、装置及系统
Keßler et al. Bottom-up gazetteers: Learning from the implicit semantics of geotags
CN109033200A (zh) 事件抽取的方法、装置、设备及计算机可读介质
CN106383887A (zh) 一种环保新闻数据采集和推荐展示的方法及系统
CN110309432B (zh) 基于兴趣点的同义词确定方法、地图兴趣点处理方法
CN110298039B (zh) 事件地的识别方法、系统、设备及计算机可读存储介质
Christen et al. A probabilistic geocoding system based on a national address file
CN109145161A (zh) 中文地名查询方法、装置及设备
Han et al. Linking social network accounts by modeling user spatiotemporal habits
CN112836146B (zh) 一种基于网络消息的地理空间坐标信息获取方法及装置
US20170235835A1 (en) Information identification and extraction
CN112363996B (zh) 用于建立电网知识图谱的物理模型的方法及系统和介质
Rizzo et al. Shaping city neighborhoods leveraging crowd sensors
CN110232160B (zh) 兴趣点变迁事件检测方法、装置及存储介质
CN111339441A (zh) 用户信息的获取方法及装置
Heravi et al. Tweet location detection
CN110175219A (zh) 一种k12阶段重复学校识别方法、装置、设备及存储介质
Asadi et al. Pattern-based extraction of addresses from web page content
CN115185986A (zh) 省市区地址信息匹配方法、装置、计算机设备及存储介质
CN112597772A (zh) 一种热点信息确定方法、计算机设备以及装置
CN114863525A (zh) 一种人脸数据集的构建方法及系统
Ardizzone et al. Extracting touristic information from online image collections

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200626