CN110020117A - 一种兴趣信息获取方法、装置及电子设备 - Google Patents
一种兴趣信息获取方法、装置及电子设备 Download PDFInfo
- Publication number
- CN110020117A CN110020117A CN201710909089.7A CN201710909089A CN110020117A CN 110020117 A CN110020117 A CN 110020117A CN 201710909089 A CN201710909089 A CN 201710909089A CN 110020117 A CN110020117 A CN 110020117A
- Authority
- CN
- China
- Prior art keywords
- information
- interest
- registration information
- account
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000012549 training Methods 0.000 claims abstract description 24
- 230000006399 behavior Effects 0.000 claims description 14
- 230000002441 reversible effect Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 10
- 238000013507 mapping Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种兴趣信息获取方法、装置及电子设备,该方法包括:获取N个参考用户,每个参考用户均具有账号注册信息和兴趣信息;基于账号注册信息与兴趣信息之间的对应关系,对所述账号注册信息和所述兴趣信息进行分类训练建立目标分类器;获取目标用户的目标账号注册信息;基于所述目标账号注册信息和目标分类器,获得与所述目标账号注册信息匹配的候选兴趣信息,将所述候选兴趣信息作为所述目标用户的当前兴趣。通过上述技术方案,提高了新用户的兴趣信息获取的准确度。
Description
技术领域
本发明涉及软件技术领域,特别涉及一种兴趣信息获取方法、装置及电子 设备。
背景技术
随着移动互联网技术的不断发展,手机不仅仅作为通讯的工具,而且作为 一个移动信息终端,在生活中扮演者越来越重要的角色。随着用户习惯的悄然 改变,个性化推荐引擎的个性化客户端,如:今日头条、一点资讯、天天快报、 等等被越来越多的用户所青睐。
个性化客户端的核心是个性化推荐技术,而个性化推荐技术的核心是用户 画像的建立。现有技术中,有两种方式来建立用户画像:第一种是根据用户在 客户端的历史行为,来抽象出用户的兴趣,这种方法仅仅适用于已经使用了客 户端一段时间的用户即‘老用户’;第二种是抓取用户在互联网上的注册信息, 如:用户在社交网络上的注册信息(QQ注册信息、新浪微博注册信息、等等), 并把这些信息作为用户的兴趣。第一种方法,需要用户的历史行为,不适用于 新用户,第二种方法虽然使用于新用户但获取的兴趣准确度极低,用户的注册 信息(如:性别)并不一定能直接对应上用户的兴趣(如:互联网兴趣、时尚兴趣、等等)。
可见,现有技术中存在新用户的兴趣信息获取准确度较低的技术问题。
发明内容
本发明实施例提供一种兴趣信息获取方法、装置及电子设备,用于解决现 有技术中新用户的兴趣信息获取准确度较低的技术问题,提高兴趣信息获取的 准确度。
本发明实施例提供一种兴趣信息获取方法,该方法包括:
获取N个参考用户,每个参考用户均具有账号注册信息和兴趣信息;
基于账号注册信息与兴趣信息之间的对应关系,对所述账号注册信息和所 述兴趣信息进行分类训练建立目标分类器;
获取目标用户的目标账号注册信息;
基于所述目标账号注册信息和目标分类器,获得与所述目标账号注册信息 匹配的候选兴趣信息,将所述候选兴趣信息作为所述目标用户的当前兴趣。
可选的,所述基于账号注册信息与兴趣信息之间的对应关系,对所述账号 注册信息和所述兴趣信息进行分类训练建立目标分类器,包括:
基于账号注册信息与兴趣信息之间的对应关系,通过主题模型或者逆向文 件频率对所述账号注册信息和所述兴趣信息进行分类训练建立目标分类器。
可选的,所述获取N个参考用户,包括:
获取具有历史行为日志的第一用户群,并根据所述历史行为日志提取所述 第一用户群中各个第一用户的兴趣词;
获取具有第一账号信息的第二用户群;
获取所述第一用户群与所述第二用户群中共有的用户作为所述N个参考 用户。
可选的,所述方法还包括:
获取与所述参考用户的第一账号信息关联的第二账号信息;获得所述第一 账号信息和所述第二账号信息对应的注册信息作为所述参考用户的账号注册 信息;获得所述第一账号信息和所述第二账号信息对应的所有兴趣词作为所述 参考用户的兴趣信息。
可选的,所述获得所述第一账号信息和所述第二账号信息对应的注册信息 作为所述参考用户的账号注册信息,包括:
获得所述第一账号信息和所述第二账号信息对应的所有注册信息作为所 述参考用户的账号注册信息;或者,
获得所述第一账号信息和所述第二账号信息对应的所有注册信息,并去除 所述所有注册信息中预设类型的注册信息获得筛选后的注册信息,将所述筛选 后的注册信息作为所述参考用户的账号注册信息。
可选的,所述方法还包括:
判断所述目标账号信息是否存在与所述目标账号关联的第三账号信息;若 是,获取所述第三账号信息对应的兴趣信息作为参考兴趣,将所述参考兴趣作 为所述目标用户的当前兴趣。
本申请实施例还提供一种兴趣信息获取装置,包括:
第一获取单元,用于获取N个参考用户,每个参考用户均具有账号注册信 息和兴趣信息;
训练单元,用于基于账号注册信息与兴趣信息之间的对应关系,对所述账 号注册信息和所述兴趣信息进行分类训练建立目标分类器;
第二获取单元,用于获取目标用户的目标账号注册信息;
分类单元,用于基于所述目标账号注册信息和目标分类器,获得与所述目 标账号注册信息匹配的候选兴趣信息,将所述候选兴趣信息作为所述目标用户 的当前兴趣。
可选的,所述训练单元用于:基于账号注册信息与兴趣信息之间的对应关 系,通过主题模型或者逆向文件频率对所述账号注册信息和所述兴趣信息进行 分类训练建立目标分类器。
可选的,所述第一获取单元用于:
获取具有历史行为日志的第一用户群,并根据所述历史行为日志提取所述 第一用户群中各个第一用户的兴趣词;获取具有第一账号信息的第二用户群; 获取所述第一用户群与所述第二用户群中共有的用户作为所述N个参考用户。
可选的,所述装置还包括:
第三获取单元,用于获取与所述参考用户的第一账号信息关联的第二账号 信息;获得所述第一账号信息和所述第二账号信息对应的注册信息作为所述参 考用户的账号注册信息;获得所述第一账号信息和所述第二账号信息对应的所 有兴趣词作为所述参考用户的兴趣信息。
可选的,所述第三获取单元还用于:
获得所述第一账号信息和所述第二账号信息对应的所有注册信息作为所 述参考用户的账号注册信息;或者,
获得所述第一账号信息和所述第二账号信息对应的所有注册信息,并去除 所述所有注册信息中预设类型的注册信息获得筛选后的注册信息,将所述筛选 后的注册信息作为所述参考用户的账号注册信息。
可选的,所述装置还包括:
判断单元,用于判断所述目标账号信息是否存在与所述目标账号关联的第 三账号信息;若是,获取所述第三账号信息对应的兴趣信息作为参考兴趣,将 所述参考兴趣作为所述目标用户的当前兴趣。
本申请实施例还提供一种电子设备,包括有存储器,以及一个或者一个以 上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或 者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的 指令:
获取N个参考用户,每个参考用户均具有账号注册信息和兴趣信息;
基于账号注册信息与兴趣信息之间的对应关系,对所述账号注册信息和所 述兴趣信息进行分类训练建立目标分类器;
获取目标用户的目标账号注册信息;
基于所述目标账号注册信息和目标分类器,获得与所述目标账号注册信息 匹配的候选兴趣信息,将所述候选兴趣信息作为所述目标用户的当前兴趣。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序, 该程序被处理器执行时实现以下步骤:
获取N个参考用户,每个参考用户均具有账号注册信息和兴趣信息;
基于账号注册信息与兴趣信息之间的对应关系,对所述账号注册信息和所 述兴趣信息进行分类训练建立目标分类器;
获取目标用户的目标账号注册信息;
基于所述目标账号注册信息和目标分类器,获得与所述目标账号注册信息 匹配的候选兴趣信息,将所述候选兴趣信息作为所述目标用户的当前兴趣。
本申请实施例中的上述一个或多个技术方案,至少具有如下技术效果:
本申请实施例提供一种兴趣性获取方法,获取N个参考用户,每个参考用 户均具有账号注册信息和兴趣信息;基于账号注册信息与兴趣信息之间的对应 关系,对账号注册信息和兴趣信息进行分类训练建立目标分类器;获取目标用 户的目标账号注册信息;基于目标账号注册信息和目标分类器,获得与目标账 号注册信息匹配的候选兴趣信息,将候选兴趣信息作为目标用户的当前兴趣, 即通过分类的方式将注册信息经目标分类器转换为对应的兴趣信息,而该目标 分类器是根据多个用户训练建立的,注册信息与兴趣信息的分类准确可靠从而 能够获取更为准确的兴趣信息,同时由于该兴趣信息获取方法不依赖于指定用 户的历史行为新老用户均适用,解决了现有技术中新用户的兴趣信息获取准确 度较低的技术问题,提高了兴趣信息获取的准确度。
附图说明
图1为本申请实施例提供的一种兴趣信息获取方法的流程示意图;
图2为本申请实施例提供的一种兴趣信息获取装置的方框图;
图3为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
在本申请实施例提供的技术方案中,通过提供一种兴趣信息获取方法,通 过分类的方式将注册信息与兴趣信息进行准确关联,实现注册信息到兴趣信息 的映射,从而实现根据用户注册信息获取到对应兴趣信息,以解决现有技术中 新用户的兴趣信息获取准确度较低的技术问题,提高兴趣信息获取的准确度。
下面结合附图对本申请实施例技术方案的主要实现原理、具体实施方式及 其对应能够达到的有益效果进行详细的阐述。
实施例
请参考图1,本申请实施例提供一种兴趣信息获取方法,该方法包括:
S11:获取N个参考用户,每个参考用户均具有账号注册信息和兴趣信息;
S12:基于账号注册信息与兴趣信息之间的对应关系,对账号注册信息和 兴趣信息进行分类训练建立目标分类器;
S13:获取目标用户的目标账号注册信息;
S14:基于目标账号注册信息和目标分类器,获得与目标账号注册信息匹 配的候选兴趣信息,将候选兴趣信息作为目标用户的当前兴趣。
在具体实施过程中,用户互联网上存在各种各样的用户,每个用户都有自 己的注册信息,如:性别、年龄、行业、爱好等等。在用户使用客户端一段时 间之后,客户端会根据用户的使用行为给用户建立用户画像,包含用户兴趣信 息、身份信息等。一个用户的注册信息可能与其兴趣信息存在一定的关联关系, 如:一个注册信息为“IT”的用户,其感兴趣的兴趣信息则可能包含与“IT” 相关的“王者荣耀”、“阴阳师”等。一群用户的注册信息和兴趣信息也可能存 在某种关联关系,例如:注册信息包括“IT”的用户90%都对“王者荣耀”感兴趣,那么另一个注册信息为“IT”的用户也既有可能对“王者荣耀”感兴趣。 因此,本申请实施例为了利用这种关联关系,执行S11和S12。
S11获取N个参考用户,作为训练样本。这N个参考用户中每个参考用户 均同时具有各自的注册信息和兴趣信息。N为自然数,N的取值越大,依据N 个参考用户获得的目标分类器就越精准,但由此建立目标分类器的计算量就越 大。为了提高效率,可以获得N个同样类型的参考用户,例如:可以都获得视 频软件中注册的参考用户、新闻软件中注册的参考用户、浏览器中注册的参考 用户,相应的,获得目标分类器应用于对应类型的注册用户,这样既提高了目 标分类器的建立效率,又提高了用户兴趣信息获取的准确度。
N个参考用户的获取,可以先获取具有历史行为日志的第一用户群,并根 据第一用户群中各个第一用户的历史行为日志提取各个第一用户的兴趣词;进 一步的,获取具有账号注册信息的第二用户群;获取第一用户群与第二用户群 中共有的用户作为参考用户,使得参考用户既具有兴趣信息又具有账号注册信 息。其中,可以针对某一客户端,也可以针对互联网上,来获取第一用户群。 针对某一客户端获取该客户端如新闻客户端上的第一用户群,其兴趣词的提取 可采用针对该客户端的特点如新闻客户端的时效性特点来进行提取,提高兴趣 词获取的准确性。第二用户群则可以选择从客户端和互联网上抓取,互联网上 抓取到的与客户端上的用户的第一账号信息相关联(如相互绑定、注册邮箱相 同、注册手机号相同等)的第二账号信息可归属于同一用户。
为了完善参考用户的注册信息和兴趣信息,本申请实施例还可以获取与参 考用户的第一账号信息相关联的第二账号信息;获得该第一账号信息和第二账 号信息对应的注册信息作为参考用户的账号注册信息;获得该第一账号信息和 第二账号信息对应的所有兴趣词作为所述参考用户的兴趣信息。例如:一个用 户A的QQ账号信息为A1,A1所包含的注册信息为{性别、年龄、毕业院 校……},但与A1关联的微信账号A2所包含的注册信息为{北京、旅游、 IT……},为了使参考用户的注册信息更完善,可将注册账号信息A1和A2对应的注册信息一起作为该用户A的账号注册信息,同理,也可以将注册账号信 息A1和A2对应的兴趣词一起作为该用户A的兴趣信息。
在完善参考用户的注册信息时,可以将其第一账号信息和与其关联的所有 第二账号信息对应的注册信息作为参考用户的账号注册信息。也可以对第一账 号信息和与其关联的第二账号信息对应的所有注册信息进行筛选,去除所有注 册信息中预设类型的注册信息获得筛选后的注册信息,将该筛选后的注册信息 作为参考用户的账号注册信息。其中,预设类型的注册信息为与用户兴趣信息 关联度相对较低的信息,如:“性别”、“国籍”等。当然,不同类型的参考用 户,其预设类型的注册信息不同,如对于旅游类的参考用户其预设类型的注册 信息可能就不包含“国籍”而包含“毕业院校”。将预设类型的注册信息去除, 减少干扰信息,有助于提高目标分类器的准确率。
S11之后建立目标分类器的准备工作完成,接下来执行S12基于账号注册 信息与兴趣信息之间的对应关系,对N个参考用户的账号注册信息和兴趣信息 进行分类建立目标分类器,即对N个参考用户的账号注册信息和兴趣信息进行 训练获得账号注册信息与兴趣信息之间的映射关系。其中,账号注册信息与兴 趣信息之间的对应关系是指由同一参考用户建立起来的账号注册信息与兴趣 信息之间的对应关系,如:一个参考用户具有账号注册信息“XX”,同时该参 考用户具有兴趣信息“YY”,那么“XX”与“YY”之间具有对应关系,在分类时,可以将“XX”与“YY”分为一类。
具体实施过程中,对账号注册信息和兴趣信息进行分类建立目标分类器可 以通过如下任一方式进行:
方式一、通过主题模型。将账号注册信息和兴趣信息输入主题模型,通过 主题模型统计获得任一账号注册信息与任一兴趣信息同时出现的频率,频率越 高表明两者之前的关联度越高,具有该账号注册信息的用户对关联度较高的兴 趣信息感兴趣的可能性就越大。选取账号注册信息与兴趣信息同时出现的频率 最高的前几位与之建立映射关系。
方式二、通过逆向文件频率(term frequency–inverse document frequency,TF-IDF)。通过统计任一账号注册信息与任一兴趣信息同时出现的频率,选取 与一注册信息同时出现频率高,但与其它注册信息同时出现频率低的兴趣词来 与该账号注册信息建立映射关系。
无论是通过方式一还是方式二建立的目标分类器,均建立了兴趣词与注册 信息的映射关系,为此,在获得一个新的用户的账号注册信息时,将该账号注 册信息输入目标分类器,目标分类器则可以获得该账号注册信息具有上述映射 关系的兴趣词,并将该兴趣词作为候选兴趣信息输出或者将与该账号注册信息 具有上述映射关系且同时出现的概率较高的前几位兴趣词作为候选兴趣信息 输出。
通过S12建立好目标分类器之后,执行S13和S14。S13获取目标用户即 待建立用户画像的用户的目标账号注册信息。具体的,可以对获取到的目标账 号注册信息进行筛选,去除预设类型的注册信息,获得筛选后的目标账号注册 信息,以筛选后的目标账号注册信息来获取目标用户的当前兴趣。
S14基于目标用户的目标账号注册信息和目标分类器,获得与目标账号注 册信息匹配的候选兴趣信息,将候选兴趣信息作为目标用户的当前兴趣。具体 的,将目标用户的目标注销信息或者筛选后的目标账号注册信息作为分类参数 输入目标分类器,目标分类器根据已建立的映射关系输出与账号注册信息匹配 的(即具有映射关系的)候选兴趣信息。目标分类器输出候选兴趣信息之后可 以将该候选兴趣信息作为目标用户的当前兴趣。后续使用过程中,可以根据用 户的使用行为来对当前兴趣进行修正、完善。
具体实施过程中,为了进一步完善用户画像,本申请实施例还进一步判断 目标账号信息是否存在与目标账号信息关联的第三账号信息级关联账号信息; 若是,获取第三账号信息对应的兴趣信息作为参考兴趣,将参考兴趣也作为目 标用户的当前兴趣,来完善目标用户的用户画像。反之,若目标账号信息不存 在关联账号信息,则将目标分类器对目标账号信息的账号注册信息进行分类输 出的候选兴趣信息作为目标用户的当前兴趣。
上述实施例中,通过提取同时具备兴趣信息和账号注销信息的用户群作为 训练样本,并生成兴趣分类器即目标分类器,只需简单的用户基本账号注册信 息(不限于用户是新用户还是老用户,尤其适用于新用户)就可以得到该用户 的精准兴趣信息,解决了如何对不具备使用记录以及兴趣标签的“纯新用户” 给出精确兴趣信息的问题。
针对上述实施例提供一种兴趣信息获取方法,本申请实施例还对应提供一 种兴趣信息获取装置,请参考图2,该装置包括:
第一获取单元21,用于获取N个参考用户,每个参考用户均具有账号注 册信息和兴趣信息;
训练单元22,用于基于账号注册信息与兴趣信息之间的对应关系,对所述 账号注册信息和所述兴趣信息进行分类训练建立目标分类器;
第二获取单元23,用于获取目标用户的目标账号注册信息;
分类单元24,用于基于所述目标账号注册信息和目标分类器,获得与所述 目标账号注册信息匹配的候选兴趣信息,将所述候选兴趣信息作为所述目标用 户的当前兴趣。
作为一种可选的实施方式,所述训练单元22用于:基于账号注册信息与 兴趣信息之间的对应关系,通过主题模型或者逆向文件频率对所述账号注册信 息和所述兴趣信息进行分类训练建立目标分类器。
作为一种可选的实施方式,所述第一获取单元21用于:获取具有历史行 为日志的第一用户群,并根据所述历史行为日志提取所述第一用户群中各个第 一用户的兴趣词;获取具有第一账号信息的第二用户群;获取所述第一用户群 与所述第二用户群中共有的用户作为所述N个参考用户。
在具体实施过程中,所述装置还可以包括:第三获取单元25。第三获取单 元25用于:获取与所述参考用户的第一账号信息关联的第二账号信息;获得 所述第一账号信息和所述第二账号信息对应的注册信息作为所述参考用户的 账号注册信息;获得所述第一账号信息和所述第二账号信息对应的所有兴趣词 作为所述参考用户的兴趣信息。可选的,所述第三获取单元25在获取参考用 户的账号注册信息时,具体用于:获得所述第一账号信息和所述第二账号信息 对应的所有注册信息作为所述参考用户的账号注册信息;或者,获得所述第一 账号信息和所述第二账号信息对应的所有注册信息,并去除所述所有注册信息中预设类型的注册信息获得筛选后的注册信息,将所述筛选后的注册信息作为 所述参考用户的账号注册信息。
在具体实施过程中,所述装置还包括:判断单元26。该判断单元26用于: 判断所述目标账号信息是否存在与所述目标账号关联的第三账号信息;若是, 获取所述第三账号信息对应的兴趣信息作为参考兴趣,将所述参考兴趣作为所 述目标用户的当前兴趣。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关 该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图3是根据一示例性实施例示出的一种用于实现兴趣信息获取方法的电子 设备800的框图。例如,电子设备800可以是移动电话,计算机,数字广播终 端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字 助理等。
参照图3,电子设备800可以包括以下一个或多个组件:处理组件802, 存储器804,电源组件806,多媒体组件808,音频组件810,输入/展现(I/O) 的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫, 数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或 多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处 理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交 互。例如,处理部件802可以包括多媒体模块,以方便多媒体组件808和处理 组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些 数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联 系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的 易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器 (SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储 器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器, 快闪存储器,磁盘或光盘。
电源组件806为电子设备800的各种组件提供电力。电源组件806可以包 括电源管理系统,一个或多个电源,及其他与为电子设备800生成、管理和分 配电力相关联的组件。
多媒体组件808包括在所述电子设备800和用户之间的提供一个展现接口 的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。 如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信 号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手 势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述 触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包 括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或 视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前 置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变 焦能力。
音频组件810被配置为展现和/或输入音频信号。例如,音频组件810包括 一个麦克风(MIC),当电子设备800处于操作模式,如呼叫模式、记录模式 和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可 以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音 频组件810还包括一个扬声器,用于展现音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接 口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、 音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方 面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态, 组件的相对定位,例如所述组件为电子设备800的显示器和小键盘,传感器组 件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与 电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备 800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任 何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器, 如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该 传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传 感器或温度传感器。
通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式 的通信。电子设备800可以接入基于通信标准的无线网络,如WiFi,2G或3G, 或它们的组合。在一个示例性实施例中,通信部件816经由广播信道接收来自 外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述 通信部件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC 模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB) 技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路 (ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑 器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或 其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介 质,例如包括指令的存储器804,上述指令可由电子设备800的处理器820执 行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、 随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端 的处理器执行时,使得移动终端能够执行一种兴趣信息获取方法,所述方法包 括:获取N个参考用户,每个参考用户均具有账号注册信息和兴趣信息;基于 账号注册信息与兴趣信息之间的对应关系,对所述账号注册信息和所述兴趣信 息进行分类训练建立目标分类器;获取目标用户的目标账号注册信息;基于所 述目标账号注册信息和目标分类器,获得与所述目标账号注册信息匹配的候选 兴趣信息,将所述候选兴趣信息作为所述目标用户的当前兴趣。
图3是本发明实施例中服务器的结构示意图。该服务器1900可因配置或 性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1922(例如,一个或一个以上处理器)和存储器1932, 一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或 一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存 储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图 示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地, 中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存 储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线 或无线网络接口1950,一个或一个以上输入展现接口1958,一个或一个以上 键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM, Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发 明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化, 这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开 的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性 的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结 构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的 权利要求来限制
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的 精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的 保护范围之内。
Claims (10)
1.一种兴趣信息获取方法,其特征在于,所述方法包括:
获取N个参考用户,每个参考用户均具有账号注册信息和兴趣信息;
基于账号注册信息与兴趣信息之间的对应关系,对所述账号注册信息和所述兴趣信息进行分类训练建立目标分类器;
获取目标用户的目标账号注册信息;
基于所述目标账号注册信息和目标分类器,获得与所述目标账号注册信息匹配的候选兴趣信息,将所述候选兴趣信息作为所述目标用户的当前兴趣。
2.如权利要求1所述的方法,其特征在于,所述基于账号注册信息与兴趣信息之间的对应关系,对所述账号注册信息和所述兴趣信息进行分类训练建立目标分类器,包括:
基于账号注册信息与兴趣信息之间的对应关系,通过主题模型或者逆向文件频率对所述账号注册信息和所述兴趣信息进行分类训练建立目标分类器。
3.如权利要求1所述的方法,其特征在于,所述获取N个参考用户,包括:
获取具有历史行为日志的第一用户群,并根据所述历史行为日志提取所述第一用户群中各个第一用户的兴趣词;
获取具有所述账号注册信息的第二用户群;
获取所述第一用户群与所述第二用户群中共有的用户作为所述N个参考用户。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取与所述参考用户的第一账号信息关联的第二账号信息;
获得所述第一账号信息和所述第二账号信息对应的注册信息作为所述参考用户的账号注册信息;
获得所述第一账号信息和所述第二账号信息对应的所有兴趣词作为所述参考用户的兴趣信息。
5.如权利要求4所述的方法,其特征在于,所述获得所述第一账号信息和所述第二账号信息对应的注册信息作为所述参考用户的账号注册信息,包括:
获得所述第一账号信息和所述第二账号信息对应的所有注册信息作为所述参考用户的账号注册信息;或者
获得所述第一账号信息和所述第二账号信息对应的所有注册信息,并去除所述所有注册信息中预设类型的注册信息获得筛选后的注册信息,将所述筛选后的注册信息作为所述参考用户的账号注册信息。
6.如权利要1~5任一所述的方法,其特征在于,所述方法还包括:
判断所述目标账号信息是否存在与所述目标账号关联的第三账号信息;
若是,获取所述第三账号信息对应的兴趣信息作为参考兴趣,将所述参考兴趣作为所述目标用户的当前兴趣。
7.一种兴趣信息获取装置,其特征在于,包括:
第一获取单元,用于获取N个参考用户,每个参考用户均具有账号注册信息和兴趣信息;
训练单元,用于基于账号注册信息与兴趣信息之间的对应关系,对所述账号注册信息和所述兴趣信息进行分类训练建立目标分类器;
第二获取单元,用于获取目标用户的目标账号注册信息;
分类单元,用于基于所述目标账号注册信息和目标分类器,获得与所述目标账号注册信息匹配的候选兴趣信息,将所述候选兴趣信息作为所述目标用户的当前兴趣。
8.如权利要求7所述的装置,其特征在于,所述训练单元用于:
基于账号注册信息与兴趣信息之间的对应关系,通过主题模型或者逆向文件频率对所述账号注册信息和所述兴趣信息进行分类训练建立目标分类器。
9.一种电子设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取N个参考用户,每个参考用户均具有账号注册信息和兴趣信息;
基于账号注册信息与兴趣信息之间的对应关系,对所述账号注册信息和所述兴趣信息进行分类训练建立目标分类器;
获取目标用户的目标账号注册信息;
基于所述目标账号注册信息和目标分类器,获得与所述目标账号注册信息匹配的候选兴趣信息,将所述候选兴趣信息作为所述目标用户的当前兴趣。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现以下步骤:
获取N个参考用户,每个参考用户均具有账号注册信息和兴趣信息;
基于账号注册信息与兴趣信息之间的对应关系,对所述账号注册信息和所述兴趣信息进行分类训练建立目标分类器;
获取目标用户的目标账号注册信息;
基于所述目标账号注册信息和目标分类器,获得与所述目标账号注册信息匹配的候选兴趣信息,将所述候选兴趣信息作为所述目标用户的当前兴趣。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710909089.7A CN110020117B (zh) | 2017-09-29 | 2017-09-29 | 一种兴趣信息获取方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710909089.7A CN110020117B (zh) | 2017-09-29 | 2017-09-29 | 一种兴趣信息获取方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110020117A true CN110020117A (zh) | 2019-07-16 |
CN110020117B CN110020117B (zh) | 2022-05-03 |
Family
ID=67186337
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710909089.7A Active CN110020117B (zh) | 2017-09-29 | 2017-09-29 | 一种兴趣信息获取方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110020117B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110852338A (zh) * | 2019-07-26 | 2020-02-28 | 平安科技(深圳)有限公司 | 用户画像的构建方法及装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110295780A1 (en) * | 2010-05-28 | 2011-12-01 | Tyson Mabry W | Apparatus and Method for Personalized Delivery of Content from Multiple Data Sources |
CN104317959A (zh) * | 2014-11-10 | 2015-01-28 | 北京字节跳动网络技术有限公司 | 基于社交平台的数据挖掘方法及装置 |
CN104580385A (zh) * | 2014-12-16 | 2015-04-29 | 腾讯科技(深圳)有限公司 | 一种拓展用户关系链的方法及装置 |
CN104834674A (zh) * | 2015-03-31 | 2015-08-12 | 北京奇艺世纪科技有限公司 | 收集用户行为数据、信息推荐方法及装置 |
CN105187508A (zh) * | 2015-08-12 | 2015-12-23 | 南京钱宝信息传媒有限公司 | 用户关系处理方法及系统 |
CN105391796A (zh) * | 2015-12-01 | 2016-03-09 | 小米科技有限责任公司 | 基于社交平台的信息推送方法、装置和服务器 |
CN105740366A (zh) * | 2016-01-26 | 2016-07-06 | 哈尔滨工业大学深圳研究生院 | 微博用户兴趣推理方法及装置 |
CN106503014A (zh) * | 2015-09-08 | 2017-03-15 | 腾讯科技(深圳)有限公司 | 一种实时信息的推荐方法、装置和系统 |
CN106649659A (zh) * | 2016-12-13 | 2017-05-10 | 重庆邮电大学 | 一种面向社交网络的链接预测系统及方法 |
US20170149719A1 (en) * | 2015-11-19 | 2017-05-25 | Sungyoung Yeh | Method for providing social network service with dual accounts of interest and identification |
CN106997397A (zh) * | 2017-04-17 | 2017-08-01 | 山东辰华科技信息有限公司 | 基于大数据的科技信息个性化定制推送系统 |
CN107104875A (zh) * | 2016-02-22 | 2017-08-29 | 腾讯科技(深圳)有限公司 | 信息推送的方法和装置 |
-
2017
- 2017-09-29 CN CN201710909089.7A patent/CN110020117B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110295780A1 (en) * | 2010-05-28 | 2011-12-01 | Tyson Mabry W | Apparatus and Method for Personalized Delivery of Content from Multiple Data Sources |
CN104317959A (zh) * | 2014-11-10 | 2015-01-28 | 北京字节跳动网络技术有限公司 | 基于社交平台的数据挖掘方法及装置 |
CN104580385A (zh) * | 2014-12-16 | 2015-04-29 | 腾讯科技(深圳)有限公司 | 一种拓展用户关系链的方法及装置 |
CN104834674A (zh) * | 2015-03-31 | 2015-08-12 | 北京奇艺世纪科技有限公司 | 收集用户行为数据、信息推荐方法及装置 |
CN105187508A (zh) * | 2015-08-12 | 2015-12-23 | 南京钱宝信息传媒有限公司 | 用户关系处理方法及系统 |
CN106503014A (zh) * | 2015-09-08 | 2017-03-15 | 腾讯科技(深圳)有限公司 | 一种实时信息的推荐方法、装置和系统 |
US20170149719A1 (en) * | 2015-11-19 | 2017-05-25 | Sungyoung Yeh | Method for providing social network service with dual accounts of interest and identification |
CN105391796A (zh) * | 2015-12-01 | 2016-03-09 | 小米科技有限责任公司 | 基于社交平台的信息推送方法、装置和服务器 |
CN105740366A (zh) * | 2016-01-26 | 2016-07-06 | 哈尔滨工业大学深圳研究生院 | 微博用户兴趣推理方法及装置 |
CN107104875A (zh) * | 2016-02-22 | 2017-08-29 | 腾讯科技(深圳)有限公司 | 信息推送的方法和装置 |
CN106649659A (zh) * | 2016-12-13 | 2017-05-10 | 重庆邮电大学 | 一种面向社交网络的链接预测系统及方法 |
CN106997397A (zh) * | 2017-04-17 | 2017-08-01 | 山东辰华科技信息有限公司 | 基于大数据的科技信息个性化定制推送系统 |
Non-Patent Citations (4)
Title |
---|
ZHEN ZHU 等: "《Research of personalized information retrieval system based on multi-agent and user interest model》", 《IEEE》 * |
李政伟等: "基于SSPISIA数据收集的个人兴趣增量挖掘算法", 《计算机应用研究》 * |
束宇: "《基于网厅用户隐私行为的个性化推荐系统的设计和研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
蒋翀: "基于云计算的用户兴趣建模", 《教师》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110852338A (zh) * | 2019-07-26 | 2020-02-28 | 平安科技(深圳)有限公司 | 用户画像的构建方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110020117B (zh) | 2022-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10013600B2 (en) | Digital image processing method and apparatus, and storage medium | |
CN111539443B (zh) | 一种图像识别模型训练方法及装置、存储介质 | |
CN104615655B (zh) | 信息推荐方法和装置 | |
US20170118298A1 (en) | Method, device, and computer-readable medium for pushing information | |
CN110781813B (zh) | 图像识别方法及装置、电子设备和存储介质 | |
CN107666536B (zh) | 一种寻找终端的方法和装置、一种用于寻找终端的装置 | |
CN110717399A (zh) | 人脸识别方法和电子终端设备 | |
CN106777016B (zh) | 基于即时通信进行信息推荐的方法及装置 | |
CN111259967A (zh) | 图像分类及神经网络训练方法、装置、设备及存储介质 | |
CN106547850B (zh) | 表情注释方法及装置 | |
CN110941727A (zh) | 一种资源推荐方法、装置、电子设备及存储介质 | |
US11546663B2 (en) | Video recommendation method and apparatus | |
CN109213942A (zh) | 一种搜索结果展示方法及装置 | |
CN113850275A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN111797746B (zh) | 人脸识别方法、装置及计算机可读存储介质 | |
CN110213062B (zh) | 处理消息的方法及装置 | |
CN105653623B (zh) | 图片收集方法及装置 | |
CN104219360A (zh) | 信息处理方法和装置 | |
CN109145151B (zh) | 一种视频的情感分类获取方法及装置 | |
CN112784151A (zh) | 一种确定推荐信息的方法及相关装置 | |
CN107122801B (zh) | 图像分类的方法和装置 | |
CN110020117B (zh) | 一种兴趣信息获取方法、装置及电子设备 | |
CN111241284B (zh) | 文章内容识别方法、装置及计算机存储介质 | |
CN112784858B (zh) | 一种图像数据的处理方法、装置及电子设备 | |
CN114189719A (zh) | 视频信息提取方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |