CN107665442A - 获取目标用户的方法及装置 - Google Patents
获取目标用户的方法及装置 Download PDFInfo
- Publication number
- CN107665442A CN107665442A CN201710326107.9A CN201710326107A CN107665442A CN 107665442 A CN107665442 A CN 107665442A CN 201710326107 A CN201710326107 A CN 201710326107A CN 107665442 A CN107665442 A CN 107665442A
- Authority
- CN
- China
- Prior art keywords
- information
- target signature
- target
- user
- signature information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000000605 extraction Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 11
- 230000010365 information processing Effects 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000003860 storage Methods 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 3
- 239000010931 gold Substances 0.000 description 3
- 229910052737 gold Inorganic materials 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Computing Systems (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明适用于信息处理技术领域,提供了一种获取目标用户的方法及装置。该获取目标用户的方法包括:通过社交平台获取分类列表信息,并根据所述分类列表信息生成目标特征信息;获取用户的社交账号发布的公开信息,并根据所述目标特征信息和各条所述公开信息确定与所述目标特征信息相关的公开信息;根据所确定的与所述目标特征信息相关的各条公开信息,确定所述用户是否为目标用户。该获取目标用户的方法能够快速准确地定位潜在目标用户,从而提高产品销量。
Description
技术领域
本发明属于信息处理技术领域,尤其涉及一种获取目标用户的方法及装置。
背景技术
商家在推广业务前,首先需要确定目标客户,传统获取目标客户是通过问卷调查等形式完成的,而这种方式难以获得准确的用户反馈信息。随着互联网技术的发展,出现了通过网络中的用户行为分析用户关注点的方式,但对用户行为的分析比较固定,只能分析用户信息中特定的标识,因此具有一定的局限性,只能基于少量符合该数据格式的用户数据进行分析。
发明内容
有鉴于此,本发明实施例提供了一种获取目标用户的方法及装置,以解决现有技术中只能分析用户信息中特定的标识,因此具有一定的局限性,只能基于少量符合该数据格式的用户数据进行分析的问题。
本发明实施例的第一方面,提供了一种获取目标用户的方法,包括:
通过社交平台获取分类列表信息,并根据所述分类列表信息生成目标特征信息;
获取用户的社交账号发布的公开信息,并根据所述目标特征信息和各条所述公开信息确定与所述目标特征信息相关的公开信息;
根据所确定的与所述目标特征信息相关的各条公开信息,确定所述用户是否为目标用户。
本发明实施例的第二方面,提供了一种获取目标用户的装置,包括:
特征生成模块,用于通过社交平台获取分类列表信息,并根据所述分类列表信息生成目标特征信息;
信息获取模块,用于获取用户的社交账号发布的公开信息;
确定模块,用于根据所述目标特征信息和各条所述公开信息确定与所述目标特征信息相关的公开信息;
处理模块,用于根据所述确定模块所确定的与所述目标特征信息相关的各条公开信息,确定所述用户是否为目标用户。
本发明实施例相对于现有技术所具有的有益效果:本发明实施例,通过社交平台获取分类列表信息,并根据所述分类列表信息生成目标特征信息;然后获取用户的社交账号发布的公开信息,并根据所述目标特征信息和各条所述公开信息确定与所述目标特征信息相关的公开信息;再根据所确定的与所述目标特征信息相关的各条公开信息,确定所述用户是否为目标用户,由于该获取目标用户的方法能够通过社交平台获取各种分类列表信息以生成多个目标特征信息,然后能够根据用户发布的公开信息确定用户是否为与各个目标特征信息对应的目标用户,因此能够快速准确地定位潜在目标用户,从而提高产品的销量。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的获取目标用户的方法的流程图;
图2是图1中步骤S101的实现流程图;
图3是图1中步骤S102的实现流程图;
图4是本发明实施例提供的获取目标用户的方法的具体流程图;
图5是图4中步骤S404的实现流程图;
图6是本发明实施例提供的获取目标用户的装置的结构框图;
图7是本发明实施例提供的获取目标用户的装置的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1示出了本发明实施例提供的获取目标用户的方法的实现流程,详述如下:
步骤S101,通过社交平台获取分类列表信息,并根据所述分类列表信息生成目标特征信息。
其中,可以通过社交平台中获取的分类列表信息构造“实体字典”,然后对所构造的“实体字典”进行一定的扩展等处理,生成目标特征信息。例如,可以通过爬虫软件抓取社交平台中的分类列表信息。社交平台可以为网站平台,例如大众点评等网站,但并不以此为限。
目标特征信息用于确定用户中的目标用户,例如目标特征信息包括但不限于金融、体育和娱乐等领域。
具体的,参见图2,一个实施例中,步骤S101中的所述根据所述分类列表信息生成目标特征信息可以通过以下过程实现:
步骤S201,提取所述分类列表信息中的词句。
具体的,分类列表可以包括多个方面的信息,例如酒店、旅行、餐饮等,以下以酒店为例进行说明,但并不以此为限。例如,分类列表信息中为王府井希尔顿大酒店,则从该分类列表信息中提取出的词句可以为“王府井希尔顿大酒店”。
步骤S202,根据向量空间模型对提取的词句进行扩展,生成所述目标特征信息。
可以理解的,依据大众普遍的社交账号使用习惯,发布的公开信息中包含“王府井希尔顿大酒店”这样的公开信息并不多,从而造成查全率不高的现象,因此可以利用词向量空间模型,计算词与词之间的距离(相似度)来对提取的词句进行扩展,以生成目标特征信息。
具体的,可以利用路径的距离进行词句扩展,例如基于上位词层次结构中相互连接的概念之间的最短路径的打分。同义词集与自身比较将返回最大值。
可选的,在步骤S202中所述根据向量空间模型对提取的词句进行扩展之后,还可以包括:步骤S203,通过文本深度表示模型对扩展后的词句再次进行扩展,生成所述目标特征信息。
具体的,词向量具有良好的语义特性,是表示词语特征的常用方式,因此,可以使用Word2Vector(文本深度表示模型)产生更多关联词来扩充实体字典,从而生产目标特征信息。例如,对于王府井希尔顿大酒店可以扩展为Hilton、王府井、四季酒店、希尔顿等。即,目标特征信息可以为Hilton、王府井、四季酒店、希尔顿等。
其中,字词的向量空间模型依靠将语意相近的词语聚在一起来提高自然语言处理的表现。例如,训练集中可能会有句子1“狗在行走”和句子2“猫在行走”。因为狗和猫的上下文的概率分布很相似,出现狗的句子中,将狗换成猫也很有可能得到一个合法的句子,而将狗换成一个和狗上下文概率分布不相似的词,就可能得到一个不合法的句子。
步骤S102,获取用户的社交账号发布的公开信息,并根据所述目标特征信息和各条所述公开信息确定与所述目标特征信息相关的公开信息。
其中,社交账号包括但不限于微博账号和即时通信平台账号。用户的社交账号发布的公开信息可以为用户发布的与爱好、生活、工作等方面相关的公开信息,能够表征用户所关心的各个方面。
目标特征信息用于确定用户中的目标用户,例如目标特征信息包括但不限于金融、体育和娱乐等。具体的,若目标特征信息为金融,而用户的社交账号发布的公开信息中包括金融信息,则该用户可能为目标账户。
参见图3,一个实施例中,步骤S102可以通过以下过程实现:
步骤S301,对各条所述公开信息的文本内容进行分词,形成多个词组。
其中,用户所发布的公开信息的文本内容一定程度上能够反映用户的兴趣所在,因此可被用于提取用户所关注的主题。本步骤中对公开信息的文本内容进行分词,从而能够平滑带有歧义性质词语对字典产生的影响。
步骤S302,根据所述目标特征信息,对每条所述公开信息的各个词组进行分类。
本步骤中,根据所述目标特征信息,可以采用智能快速排查法,对每条所述公开信息文本中的各个词组进行分类。此处仅以一条文本W为例,分类之后得到n个词W(l)={w1,w2,…,wn},利用排查法对W(l)进行检索,判断这条文本是否与标签l相关,以此循环,对所有用户的全部公开信息的文本进行分类,得到每个用户U对于标签集合L的所有公开信息集U={Tl1,Tl2,…,Tln},其中l∈L。其中,标签l表征该用户发布的公开信息对应的特征信息,例如金融、体育或娱乐等。
步骤S303,根据分类结果确定与所述目标特征信息相关的公开信息。
本步骤中,可以根据步骤S302中的分类结果确定与所述目标特征信息相关的公开信息。具体的,若所述目标特征信息包括Hilton、王府井、四季酒店和希尔顿等,而用户的社交账号发布的公开信息中包括Hilton、王府井、四季酒店和希尔顿中的至少一种,则该用户可能为目标用户。
另外,还可以通过提取各条所述公开信息的第一分类特征信息的方式,根据各条所述公开信息的第一分类特征信息和所述目标特征信息,确定各条所述公开信息与所述目标特征信息是否相关。其中,所述第一分类特征信息包括关键词和/标识符。
可以理解的,用户通过社交账号发布的公开信息中会包含用户的爱好、生活、工作等方面的分类特征信息,因此可以从用户发布的公开信息中提取包括关键词和/标识符的第一分类特征信息,以对各条公开信息进行分类。其中,关键词包括但不限于与用户的爱好、生活、工作等方面相关的词语,标识符包括但不限于与用户的爱好、生活、工作等方面相关的图片、表情等标示符。
目标特征信息可以包括至少一个关键词和至少一个标识符。具体的,提取出第一分类特征信息以后,可以将第一分类特征信息与目标特征信息进行匹配,若第一分类特征信息与目标特征信息匹配度大于第一阈值时,则判定该公开信息与目标特征信息相关,否则,判定该公开信息与目标特征信息不相关。
例如,第一分类特征信息为关键词时,可以将第一分类特征信息与目标特征信息中的各个关键词进行匹配,若匹配成功,则判定该公开信息与目标特征信息相关,否则,判定该公开信息与目标特征信息不相关。
又例如,第一分类特征信息为标识符时,可以将第一分类特征信息与目标特征信息中的标识符进行匹配,若匹配度大于第一阈值,则判定该公开信息与目标特征信息相关,否则,判定该公开信息与目标特征信息不相关。
又例如,第一分类特征信息同时包括关键词和标识符时,可以对关键词或标识符设置优先级,按照优先级将第一分类特征信息与目标特征信息进行匹配。
步骤S103,根据所确定的与所述目标特征信息相关的各条公开信息,确定所述用户是否为目标用户。
其中,可以对所确定的与所述目标特征信息相关的各条公开信息与目标特征信息的相关度大小,确定所述用户是否为目标用户。具体的,可以对与所述目标特征信息相关的各条公开信息与目标特征信息的相关度大小取平均值,然后根据平均值与第二阈值的大小关系,确定所述用户是否为目标用户。
参见图4示出了该获取目标用户的方法的具体流程图,重复之处不再赘述。
步骤S401,通过社交平台获取分类列表信息,并根据所述分类列表信息生成目标特征信息。
步骤S402,获取用户的社交账号发布的公开信息,所述公开信息包括信息内容和发布时间,并根据所述目标特征信息和各条所述公开信息确定与所述目标特征信息相关的公开信息。
步骤S403,获取用户的社交账号关注的目标账号信息,所述目标账号信息包括目标账号的分类信息和目标账号的排位信息,并根据所述目标特征信息和各个所述目标账号信息确定与所述目标特征信息相关的各条目标账号信息。
其中,用户的社交账号关注的目标账号信息可以为与用户的爱好、生活、工作等方面相关的账号信息,能够表征用户所关心的各个方面。可以理解的,若目标特征信息为金融,而用户的社交账号发布的关注的目标账号信息中的目标账号的分类信息包括金融信息,则该用户可能为目标账户。
步骤S404,根据所确定的与所述目标特征信息相关的各条公开信息和各条目标账号信息,确定所述用户是否为目标用户。
其中,可以对所确定的与所述目标特征信息相关的各条公开信息与目标特征信息的信心值大小,以及各条目标账号信息与目标特征信息的信心值大小,综合考虑以确定所述用户是否为目标用户。
参见图5,一个实施例中步骤S404可以通过以下过程实现:
步骤S501,根据所确定的与所述目标特征信息相关的公开信息和目标账号信息,建立所述用户的信心值模型。
具体的,以单个目标特征信息l和用户ui为例,用户ui所有公开信息的文本属于目标特征信息l的公开信息条数为TN(l),并综合考虑用户ui的关注目标账号中,关注的属于目标特征信息l的账号的个数为GN(l),则用户ui对目标特征信息l的信心值模型为:
S(ui,l)=α*∑TN(l)+(1-α)*∑GN(l)
其中,α∈[0,1]。可以调整用户ui发布的公开信息和关注的目标账号信息两种视角的权值,以反映不同的侧重点。例如,α取值为0.5,均衡考虑用户ui发布的公开信息和关注的目标账号信息的作用。如此重复,可以得到所有用户的每个目标特征信息的信心值。
步骤S502,根据所述用户的信心值模型判定所述用户是否为目标用户。
具体的,通过上述过程,可以给所有用户打上一些特征非常细的标签并得到这些标签的信心值。通过这些用户画像,可以帮助金融企业业务人员,快速准确地为每一位客户提供个性化的服务和推销适合每一位客户的金融产品,从而大大提高了企业的效率,从而也能够帮助企业进行经营分析,制定发展战略。
上述获取目标用户的方法,首先通过社交平台获取分类列表信息,并根据所述分类列表信息生成目标特征信息;然后获取用户的社交账号发布的公开信息,并根据所述目标特征信息和各条所述公开信息确定与所述目标特征信息相关的公开信息;再根据所确定的与所述目标特征信息相关的各条公开信息,确定所述用户是否为目标用户,由于该获取目标用户的方法能够通过社交平台获取各种分类列表信息以生成多个目标特征信息,然后根据用户发布的公开信息和关注的目标账号信息确定用户是否为多个目标特征信息对应的目标用户,因此能够快速准确地定位潜在目标用户,从而提高产品的销量。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
对应于上文实施例所述的获取目标用户方法,图6示出了本发明实施例提供的获取目标用户装置的结构框图。为了便于说明,仅示出了与本实施例相关的部分。
参照图6,该装置包括特征生成模块101、信息获取模块102、确定模块103和处理模块104。其中,特征生成模块101,用于通过社交平台获取分类列表信息,并根据所述分类列表信息生成目标特征信息。信息获取模块102,用于获取用户的社交账号发布的公开信息。确定模块103,用于根据所述目标特征信息和各条所述公开信息确定与所述目标特征信息相关的公开信息。处理模块104,用于根据所述确定模块所确定的与所述目标特征信息相关的各条公开信息,确定所述用户是否为目标用户。
可选的,特征生成模块101可以包括获取单元201、提取单元202和扩展单元203。其中,获取单元201,用于通过社交平台获取分类列表信息。提取单元202,用于提取所述分类列表信息中的词句。扩展单元203,用于根据向量空间模型对提取的词句进行扩展,生成所述目标特征信息。
可选的,扩展单元203在根据向量空间模型对提取的词句进行扩展之后,还用于通过文本深度表示模型对扩展后的词句再次进行扩展,生成所述目标特征信息。
可选的,确定模块104可以包括分词单元301、分类单元302和确定单元303。其中,分词单元301,用于对各条所述公开信息的文本内容进行分词,形成多个词组。分类单元302,用于根据所述目标特征信息,对每条所述公开信息的各个词组进行分类。确定单元303,用于根据所述分类单元的分类结果,确定与所述目标特征信息相关的公开信息。
可选的,信息获取模块102,还用于获取用户的社交账号关注的目标账号信息。确定模块103,还用于根据所述目标特征信息和各个所述目标账号信息确定与所述目标特征信息相关的各条目标账号信息。处理模块104具体用于:根据所确定的与所述目标特征信息相关的各条公开信息和各条目标账号信息,确定所述用户是否为目标用户。
图7示出了本发明实施例提供的获取目标用户的装置的结构示意图。参见图7,该获取目标用户的装置可以包括:一个或多个输入设备402,一个或多个输出设备403,一个或多个处理器401和存储器404。处理器401、输入设备402、输出设备403和存储器404通过总线405连接。
处理器401,用于通过输入设备402通过社交平台获取分类列表信息,并根据所述分类列表信息生成目标特征信息。处理器401,还用于通过输入设备402获取用户的社交账号发布的公开信息。处理器401,还用于根据目标特征信息和各条所述公开信息确定与所述目标特征信息相关的公开信息。处理器401,还用于根据所确定的与所述目标特征信息相关的各条公开信息,确定所述用户是否为目标用户。
可选的,处理器401,还用于通过输入设备402通过社交平台获取分类列表信息,提取所述分类列表信息中的词句,并根据向量空间模型对提取的词句进行扩展,生成所述目标特征信息。
可选的,处理器401,在根据向量空间模型对提取的词句进行扩展之后,还用于通过文本深度表示模型对扩展后的词句再次进行扩展,生成所述目标特征信息。
可选的,处理器401还用于对各条所述公开信息的文本内容进行分词,形成多个词组;并根据所述目标特征信息,对每条所述公开信息的各个词组进行分类;以及根据所述分类单元的分类结果,确定与所述目标特征信息相关的公开信息。
可选的,处理器401还用于通过输入设备402获取用户的社交账号关注的目标账号信息;根据所述目标特征信息和各个所述目标账号信息确定与所述目标特征信息相关的目标账号信息;以及根据所述确定模块所确定的与所述目标特征信息相关的各条公开信息和各条目标账号信息,确定所述用户是否为目标用户。
所述存储器404,用于存储软件程序、模块和所述网络交互数据,所述处理器401通过运行存储在所述存储器404的软件程序以及单元,从而执行各种功能应用以及数据处理,实现终端的信息交互功能。
应当理解,在本发明实施例中,所称处理器401可以是中央处理单元(CentralProcessing Unit,CPU),该处理器401还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
输入设备402可以包括触控板、指纹采传感器(用于采集用户的指纹信息和指纹的方向信息)、麦克风等,输出设备403可以包括显示器(LCD等)、扬声器等。
存储器404可以包括只读存储器和随机存取存储器,并向处理器401提供指令和数据。存储器404的一部分还可以包括非易失性随机存取存储器。例如,存储器404还可以存储设备类型的信息。
综上所述,该获取目标用户的装置,首先通过社交平台获取分类列表信息,并根据所述分类列表信息生成目标特征信息;然后获取用户的社交账号发布的公开信息,并根据所述目标特征信息和各条所述公开信息确定与所述目标特征信息相关的公开信息;再根据所确定的与所述目标特征信息相关的各条公开信息,确定所述用户是否为目标用户,由于该获取目标用户的方法能够通过社交平台获取各种分类列表信息以生成多个目标特征信息,然后根据用户发布的公开信息和关注的目标账号信息确定用户是否为多个目标特征信息对应的目标用户,因此能够快速准确地定位潜在目标用户,从而提高产品的销量。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明实施例各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种获取目标用户的方法,其特征在于,包括:
通过社交平台获取分类列表信息,并根据所述分类列表信息生成目标特征信息;
获取用户的社交账号发布的公开信息,并根据所述目标特征信息和各条所述公开信息确定与所述目标特征信息相关的公开信息;
根据所确定的与所述目标特征信息相关的各条公开信息,确定所述用户是否为目标用户。
2.根据权利要求1所述的获取目标用户的方法,其特征在于,所述根据所述分类列表信息生成目标特征信息具体为:
提取所述分类列表信息中的词句;
根据向量空间模型对提取的词句进行扩展,生成所述目标特征信息。
3.根据权利要求2所述的获取目标用户的方法,其特征在于,在所述根据向量空间模型对提取的词句进行扩展之后,还包括:
通过文本深度表示模型对扩展后的词句再次进行扩展,生成所述目标特征信息。
4.根据权利要求1所述的获取目标用户的方法,其特征在于,所述根据所述目标特征信息和各条所述公开信息确定与所述目标特征信息相关的公开信息包括:
对各条所述公开信息的文本内容进行分词,形成多个词组;
根据所述目标特征信息,对每条所述公开信息的各个词组进行分类;
根据分类结果确定与所述目标特征信息相关的公开信息。
5.根据权利要求1所述的获取目标用户的方法,其特征在于,还包括:
获取用户的社交账号关注的目标账号信息,并根据所述目标特征信息和各个所述目标账号信息确定与所述目标特征信息相关的各条目标账号信息;
所述根据所确定的与所述目标特征信息相关的各条公开信息,确定所述用户是否为目标用户具体为:
根据所确定的与所述目标特征信息相关的各条公开信息和各条目标账号信息,确定所述用户是否为目标用户。
6.一种获取目标用户的装置,其特征在于,包括:
特征生成模块,用于通过社交平台获取分类列表信息,并根据所述分类列表信息生成目标特征信息;
信息获取模块,用于获取用户的社交账号发布的公开信息;
确定模块,用于根据所述目标特征信息和各条所述公开信息确定与所述目标特征信息相关的公开信息;
处理模块,用于根据所述确定模块所确定的与所述目标特征信息相关的各条公开信息,确定所述用户是否为目标用户。
7.根据权利要求6所述的获取目标用户的装置,其特征在于,所述特征生成模块包括:
获取单元,用于通过社交平台获取分类列表信息;
提取单元,用于提取所述分类列表信息中的词句;
扩展单元,用于根据向量空间模型对提取的词句进行扩展,生成所述目标特征信息。
8.根据权利要求7所述的获取目标用户的装置,其特征在于,所述扩展单元在根据向量空间模型对提取的词句进行扩展之后,还用于通过文本深度表示模型对扩展后的词句再次进行扩展,生成所述目标特征信息。
9.根据权利要求6所述的获取目标用户的装置,其特征在于,所述确定模块包括:
分词单元,用于对各条所述公开信息的文本内容进行分词,形成多个词组;
分类单元,用于根据所述目标特征信息,对每条所述公开信息的各个词组进行分类;
确定单元,用于根据所述分类单元的分类结果,确定与所述目标特征信息相关的公开信息。
10.根据权利要求6所述的获取目标用户的装置,其特征在于,所述信息获取模块,还用于获取用户的社交账号关注的目标账号信息;
所述确定模块,还用于根据所述目标特征信息和各个所述目标账号信息确定与所述目标特征信息相关的各条目标账号信息;
所述处理模块具体用于:根据所确定的与所述目标特征信息相关的各条公开信息和各条目标账号信息,确定所述用户是否为目标用户。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710326107.9A CN107665442B (zh) | 2017-05-10 | 2017-05-10 | 获取目标用户的方法及装置 |
PCT/CN2017/099701 WO2018205459A1 (zh) | 2017-05-10 | 2017-08-30 | 获取目标用户的方法、装置、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710326107.9A CN107665442B (zh) | 2017-05-10 | 2017-05-10 | 获取目标用户的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107665442A true CN107665442A (zh) | 2018-02-06 |
CN107665442B CN107665442B (zh) | 2020-03-27 |
Family
ID=61122337
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710326107.9A Active CN107665442B (zh) | 2017-05-10 | 2017-05-10 | 获取目标用户的方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN107665442B (zh) |
WO (1) | WO2018205459A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110059498A (zh) * | 2019-03-21 | 2019-07-26 | 中国科学院计算技术研究所 | 一种用于社交网络的隐私控制自动设置方法及系统 |
CN111385136A (zh) * | 2018-12-29 | 2020-07-07 | 华为技术服务有限公司 | 一种用户通信标识的确定方法和装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111292136B (zh) * | 2020-03-09 | 2021-03-16 | 广东万唯计算机服务有限公司 | 移动广告筛选投放方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7716198B2 (en) * | 2004-12-21 | 2010-05-11 | Microsoft Corporation | Ranking search results using feature extraction |
CN104156450A (zh) * | 2014-08-15 | 2014-11-19 | 同济大学 | 一种基于用户网络数据的物品信息推荐方法 |
CN105488154A (zh) * | 2015-11-28 | 2016-04-13 | 小米科技有限责任公司 | 主题应用推荐方法及装置 |
CN106033415A (zh) * | 2015-03-09 | 2016-10-19 | 深圳市腾讯计算机系统有限公司 | 文本内容推荐方法及装置 |
CN106528688A (zh) * | 2016-10-25 | 2017-03-22 | 公安部第三研究所 | 一种针对Twitter的分析取证方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9466071B2 (en) * | 2011-11-16 | 2016-10-11 | Yahoo! Inc. | Social media user recommendation system and method |
CN103514192B (zh) * | 2012-06-21 | 2017-03-01 | 富士通株式会社 | 数据处理方法和数据处理设备 |
CN106529983A (zh) * | 2015-09-10 | 2017-03-22 | 李学迁 | 一种微博意见领袖定向广告投放系统 |
-
2017
- 2017-05-10 CN CN201710326107.9A patent/CN107665442B/zh active Active
- 2017-08-30 WO PCT/CN2017/099701 patent/WO2018205459A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7716198B2 (en) * | 2004-12-21 | 2010-05-11 | Microsoft Corporation | Ranking search results using feature extraction |
CN104156450A (zh) * | 2014-08-15 | 2014-11-19 | 同济大学 | 一种基于用户网络数据的物品信息推荐方法 |
CN106033415A (zh) * | 2015-03-09 | 2016-10-19 | 深圳市腾讯计算机系统有限公司 | 文本内容推荐方法及装置 |
CN105488154A (zh) * | 2015-11-28 | 2016-04-13 | 小米科技有限责任公司 | 主题应用推荐方法及装置 |
CN106528688A (zh) * | 2016-10-25 | 2017-03-22 | 公安部第三研究所 | 一种针对Twitter的分析取证方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111385136A (zh) * | 2018-12-29 | 2020-07-07 | 华为技术服务有限公司 | 一种用户通信标识的确定方法和装置 |
CN110059498A (zh) * | 2019-03-21 | 2019-07-26 | 中国科学院计算技术研究所 | 一种用于社交网络的隐私控制自动设置方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107665442B (zh) | 2020-03-27 |
WO2018205459A1 (zh) | 2018-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11663411B2 (en) | Ontology expansion using entity-association rules and abstract relations | |
CN107315759B (zh) | 归类关键字的方法、装置和处理系统、分类模型生成方法 | |
JP6661790B2 (ja) | テキストタイプを識別する方法、装置及びデバイス | |
US20190377788A1 (en) | Methods and systems for language-agnostic machine learning in natural language processing using feature extraction | |
US10073834B2 (en) | Systems and methods for language feature generation over multi-layered word representation | |
CN111177569A (zh) | 基于人工智能的推荐处理方法、装置及设备 | |
Rain | Sentiment analysis in amazon reviews using probabilistic machine learning | |
CN111615706A (zh) | 基于子流形稀疏卷积神经网络分析空间稀疏数据 | |
US20200134398A1 (en) | Determining intent from multimodal content embedded in a common geometric space | |
CN106940705A (zh) | 一种用于构建用户画像的方法与设备 | |
US9665551B2 (en) | Leveraging annotation bias to improve annotations | |
US9483740B1 (en) | Automated data classification | |
JP2019519019A5 (zh) | ||
CN110325986A (zh) | 文章处理方法、装置、服务器及存储介质 | |
KR101565957B1 (ko) | 제품 피드 유사성을 사용하는 스팸 상인 발견 | |
WO2021142719A1 (zh) | 画像生成方法、装置、服务器及存储介质 | |
WO2019128311A1 (zh) | 广告的相似度处理方法和装置、计算设备及存储介质 | |
CN114357117A (zh) | 事务信息查询方法、装置、计算机设备及存储介质 | |
US20120046937A1 (en) | Semantic classification of variable data campaign information | |
JP2020524833A (ja) | テキスト情報を表示する方法および装置 | |
CN107665442A (zh) | 获取目标用户的方法及装置 | |
CN112632950A (zh) | Ppt生成方法、装置、设备及计算机可读存储介质 | |
CN113434755A (zh) | 页面的生成方法、装置、电子设备及存储介质 | |
US9516089B1 (en) | Identifying and processing a number of features identified in a document to determine a type of the document | |
KR101652433B1 (ko) | Sns 문서에서 추출된 토픽을 기반으로 파악된 감정에 따른 개인화 광고 제공 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |