CN111143441A - 性别确定方法、装置、设备及存储介质 - Google Patents

性别确定方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111143441A
CN111143441A CN201911404522.7A CN201911404522A CN111143441A CN 111143441 A CN111143441 A CN 111143441A CN 201911404522 A CN201911404522 A CN 201911404522A CN 111143441 A CN111143441 A CN 111143441A
Authority
CN
China
Prior art keywords
gender
user
information
identity
identity information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911404522.7A
Other languages
English (en)
Inventor
莫国龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Missfresh Ecommerce Co Ltd
Original Assignee
Beijing Missfresh Ecommerce Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Missfresh Ecommerce Co Ltd filed Critical Beijing Missfresh Ecommerce Co Ltd
Priority to CN201911404522.7A priority Critical patent/CN111143441A/zh
Publication of CN111143441A publication Critical patent/CN111143441A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种性别确定方法、装置、设备及存储介质,属于计算机技术领域。本实施例提供了一种基于用户的身份信息的性别确定方法,通过用户的身份信息,根据身份信息对应的身份特征与性别关键字进行匹配,从而确定用户的性别,该身份信息包括所述身份信息包括所述用户的收货人信息、账号标识、联系方式或姓名中至少一项和所述用户的标识信息,能够在无性别信息的情况下,通过用户的身份信息与性别关键字进行匹配来确定用户性别,提供了一种方便快捷的性别确定方式,扩展了性别确定方式的适用场景,提高了性别确定方式的适用性。

Description

性别确定方法、装置、设备及存储介质
技术领域
本申请涉及计算机技术领域,特别涉及一种性别确定方法、装置、设备及存储介质。
背景技术
随着计算机技术的发展,通常需要对用户进行性别预测,从而根据预测的用户对该用户进行画像数据维护,或者进行资源推荐。
目前,性别确定方法通常是抓取用户APP的标签作为样本,人工为样本标注,通过样本对模型进行训练,从而训练好的模型可以根据用户的APP列表,预测用户的性别。
上述方法中需要基于已有的明确用户性别的标签的基础上构建模型进行预测,在一些无法抓住到明确用户性别的标签的情况下,则无法对用户进行性别预测,适用场景单一,局限性较大。
发明内容
本申请实施例提供了一种性别确定方法、装置、设备及存储介质,提供了一种方便快捷的性别确定方式,扩展了性别确定方式的适用场景,提高了性别确定方式的适用性。。所述技术方案如下:
一方面,提供了一种性别确定方法,所述方法包括:
获取用户的身份信息,所述身份信息包括所述用户的收货人信息、账号标识、联系方式、姓名中或所述用户的标识信息至少一项;
对所述身份信息进行特征提取,得到所述用户的身份特征;
对所述用户的身份特征与性别关键字进行匹配;
响应于所述身份特征与目标性别关键字的匹配成功指令,将所述目标性别关键字对应的性别确定为所述用户的性别。
在一种可能实现方式中,所述方法还包括:
响应于所述身份特征与性别关键字均匹配失败的指令,获取所述用户对商品的操作行为信息;
将所述用户的身份信息与所述对商品的操作行为信息输入性别确定模型中,由所述性别确定模型对所述身份信息和所述商品的操作行为信息进行特征提取,根据提取到的特征,预测所述用户的性别,输出所述用户的性别。
在一种可能实现方式中,所述性别确定模型的获取过程包括:
获取多个样本用户的身份信息、对商品的操作行为信息以及目标性别;
基于所述多个样本用户的身份信息、对商品的操作行为信息和所述目标性别,对初始模型进行训练,得到所述性别确定模型。
在一种可能实现方式中,所述获取多个样本用户的身份信息、对商品的操作行为信息以及目标性别,包括:
获取多个用户的身份信息;
执行所述特征提取和基于身份特征匹配的步骤,将匹配成功的用户作为样本用户,匹配成功的用户的性别作为所述样本用户的目标性别;
根据多个样本用户的身份信息,获取所述多个样本用户对商品的操作行为信息。
在一种可能实现方式中,所述由所述性别确定模型对所述身份信息和所述商品的操作行为信息进行特征提取,根据提取到的特征,预测所述用户的性别,输出所述用户的性别,包括:
由所述性别确定模型对所述身份信息进行归一化处理,得到身份特征;
对所述对商品的操作行为信息中同类型操作行为进行统计,得到统计特征,将所述对商品的操作行为信息和所述统计特征作为行为特征;
根据所述用户的身份特征和行为特征,预测所述用户的性别,输出所述用户的性别。
在一种可能实现方式中,所述获取用户的身份信息,包括:
获取所述用户的历史订单信息;
从所述历史订单信息中提取所述用户的身份信息。
在一种可能实现方式中,所述方法还包括:
获取目标时间段内处理的多个历史订单信息;
从所述多个历史订单信息中提取多个用户的身份信息;
对所述多个用户的身份信息进行去重处理,对去重处理后的每个用户,执行性别确定的步骤,得到每个用户的性别。
另一方面,提供了一种性别确定装置,所述装置包括:
获取模块,用于获取用户的身份信息,所述身份信息包括所述用户的收货人信息、账号标识、联系方式、姓名中或所述用户的标识信息至少一项;
提取模块,用于对所述身份信息进行特征提取,得到所述用户的身份特征;
匹配模块,用于对所述用户的身份特征与性别关键字进行匹配;
确定模块,用于响应于所述身份特征与目标性别关键字的匹配成功指令,将所述目标性别关键字对应的性别确定为所述用户的性别。
在一种可能实现方式中,所述获取模块,还用于响应于所述身份特征与性别关键字均匹配失败的指令,获取所述用户对商品的操作行为信息;
所述确定模块,还用于将所述用户的身份信息与所述对商品的操作行为信息输入性别确定模型中,由所述性别确定模型对所述身份信息和所述商品的操作行为信息进行特征提取,根据提取到的特征,预测所述用户的性别,输出所述用户的性别。
在一种可能实现方式中,所述装置还包括训练模块,所述训练模块用于:
获取多个样本用户的身份信息、对商品的操作行为信息以及目标性别;
基于所述多个样本用户的身份信息、对商品的操作行为信息和所述目标性别,对初始模型进行训练,得到所述性别确定模型。
在一种可能实现方式中,所述训练模块用于:
获取多个用户的身份信息;
执行所述特征提取和基于身份特征匹配的步骤,将匹配成功的用户作为样本用户,匹配成功的用户的性别作为所述样本用户的目标性别;
根据多个样本用户的身份信息,获取所述多个样本用户对商品的操作行为信息。
在一种可能实现方式中,所述确定模块用于:
由所述性别确定模型对所述身份信息进行归一化处理,得到身份特征;
对所述对商品的操作行为信息中同类型操作行为进行统计,得到统计特征,将所述对商品的操作行为信息和所述统计特征作为行为特征;
根据所述用户的身份特征和行为特征,预测所述用户的性别,输出所述用户的性别。
在一种可能实现方式中,所述获取模块用于:
获取所述用户的历史订单信息;
从所述历史订单信息中提取所述用户的身份信息。
在一种可能实现方式中,所述获取模块还用于:
获取目标时间段内处理的多个历史订单信息;
从所述多个历史订单信息中提取多个用户的身份信息;
对所述多个用户的身份信息进行去重处理,对去重处理后的每个用户,执行性别确定的步骤,得到每个用户的性别。
另一方面,提供了一种电子设备,所述电子设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条指令,所述至少一条指令由所述一个或多个处理器加载并执行以实现上述性别确定方法所执行的操作。
另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现上述性别确定方法所执行的操作。
本申请实施例提供的技术方案带来的有益效果至少包括:
本实施例提供了一种基于用户的身份信息的性别确定方法,通过用户的身份信息,根据身份信息对应的身份特征与性别关键字进行匹配,从而确定用户的性别,该身份信息包括所述身份信息包括所述用户的收货人信息、账号标识、联系方式或姓名中至少一项和所述用户的标识信息,能够在无性别信息的情况下,通过用户的身份信息与性别关键字进行匹配来确定用户性别,提供了一种方便快捷的性别确定方式,扩展了性别确定方式的适用场景,提高了性别确定方式的适用性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种性别确定方法的实施环境的示意图;
图2是本申请实施例提供的一种性别确定方法的流程图;
图3是本申请实施例提供的一种性别确定方法的流程图;
图4是本申请实施例提供的一种身份信息获取过程的流程图;
图5是本申请实施例提供的一种身份信息匹配过程的示意图;
图6是本申请实施例提供的一种特征处理过程的示意图;
图7是本申请实施例提供的一种特征处理过程的示意图;
图8是本申请实施例提供的一种模型训练过程的示意图;
图9是本申请实施例提供的一种性别预测过程的示意图;
图10是本申请实施例提供的一种性别预测装置的结构示意图;
图11是本申请实施例提供的一种终端的结构示意图;
图12是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本申请中的字符“/”,一般表示前后关联对象是一种“或”的关系。
本申请中术语“多个”的含义是指两个或两个以上,例如,多个数据包是指两个或两个以上的数据包。
本申请中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分,应理解,“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系,也不对数量和执行顺序进行限定。
以下,对本申请实施例的实施环境进行介绍。
图1是本申请实施例提供的一种性别确定方法的实施环境的示意图。该实施环境包括:终端101和平台102。终端101通过无线网络或有线网络与平台102相连。
终端101可以是智能手机、游戏主机、台式计算机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器或MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器和膝上型便携计算机中的至少一种。终端101安装和运行有应用程序,该应用程序可以通过浏览器运行,也可以通过独立的客户端运行。
平台102包括一台服务器、多台服务器、云计算平台和虚拟化中心中的至少一种。平台102包括:多个服务器1021、服务器1022以及数据库1023。每个服务器1021上可以运行业务系统,实现相同或不同的业务服务。
通过终端101,可以访问服务器1021上部署的业务系统。数据库1023可以提供为数据中心,可以用于存储业务数据以及文件。
本领域技术人员可以知晓,上述终端101、服务器1021的数量可以更多或更少。比如上述终端101、服务器1021、服务器1022以及数据库1023可以仅为一个,或者上述终端101、服务器1021、服务器1022以及数据库1023为几十个或几百个,或者更多数量,此时上述实施环境还包括其他终端、其他服务器或其他数据库。本申请实施例对终端、服务器或数据库的数量和设备类型不加以限定。
图2是本申请实施例提供的一种性别确定方法的流程图,参见图2,该方法应用于电子设备,该方法包括:
201、获取用户的身份信息,该身份信息包括该用户的收货人信息、账号标识、联系方式或姓名中至少一项和该用户的标识信息。
202、对该身份信息进行特征提取,得到该用户的身份特征。
203、对该用户的身份特征与性别关键字进行匹配。
204、响应于该身份特征与目标性别关键字的匹配成功指令,将该目标性别关键字对应的性别确定为该用户的性别。
在一种可能实现方式中,该方法还包括:
响应于该身份特征与性别关键字均匹配失败的指令,获取该用户对商品的操作行为信息;
将该用户的身份信息与该对商品的操作行为信息输入性别确定模型中,由该性别确定模型对该身份信息和该商品的操作行为信息进行特征提取,根据提取到的特征,预测该用户的性别,输出该用户的性别。
在一种可能实现方式中,该性别确定模型的获取过程包括:
获取多个样本用户的身份信息、对商品的操作行为信息以及目标性别;
基于该多个样本用户的身份信息、对商品的操作行为信息和该目标性别,对初始模型进行训练,得到该性别确定模型。
在一种可能实现方式中,该获取多个样本用户的身份信息、对商品的操作行为信息以及目标性别,包括:
获取多个用户的身份信息;
执行该特征提取和基于身份特征匹配的步骤,将匹配成功的用户作为样本用户,匹配成功的用户的性别作为该样本用户的目标性别;
根据多个样本用户的身份信息,获取该多个样本用户对商品的操作行为信息。
在一种可能实现方式中,该由该性别确定模型对该身份信息和该商品的操作行为信息进行特征提取,根据提取到的特征,预测该用户的性别,输出该用户的性别,包括:
由该性别确定模型对该身份信息进行归一化处理,得到身份特征;
对该对商品的操作行为信息中同类型操作行为进行统计,得到统计特征,将该对商品的操作行为信息和该统计特征作为行为特征;
根据该用户的身份特征和行为特征,预测该用户的性别,输出该用户的性别。
在一种可能实现方式中,该获取用户的身份信息,包括:
获取该用户的历史订单信息;
从该历史订单信息中提取该用户的身份信息。
在一种可能实现方式中,该方法还包括:
获取目标时间段内处理的多个历史订单信息;
从该多个历史订单信息中提取多个用户的身份信息;
对该多个用户的身份信息进行去重处理,对去重处理后的每个用户,执行性别确定的步骤,得到每个用户的性别。
图3是本申请实施例提供的一种性别确定方法的流程图,参见图3,该方法包括:
301、电子设备获取该用户的历史订单信息。
在本申请实施例中,电子设备可以获取用户的身份信息,预测用户的性别。具体地,在一种可能场景中,电子设备可以获取历史订单信息,将该信息作为性别确定的依据。
其中,该历史订单信息可以存储于该电子设备中,也可以由其他电子设备发送至该电子设备,对此不作限定。
302、电子设备从该历史订单信息中提取该用户的身份信息。
其中,该身份信息包括该用户的收货人信息、账号标识、联系方式、姓名中或该用户的标识信息至少一项。
例如,该身份信息包括用户的标识信息和收货人信息。电子设备可以基于这两种信息对该用户的性别进行预测。具体地,电子设备可以将该两种信息进行关联作为该用户的身份信息。
例如,该电子设备可以为电商平台的服务器,该服务器在处理用户的订单后,可以从该订单的信息中提取用户的标识信息和用户的收货人信息,以此来对该用户进行性别预测。当然,该身份信息也可以包括其他信息,例如,手机号码、用户的真实姓名或者用户昵称等。
在此仅以对单个用户进行性别确定的过程为例进行说明,在一种可能实现方式中,上述过程可以为:电子设备获取目标时间段内处理的多个历史订单信息,从该多个历史订单信息中提取多个用户的身份信息,对该多个用户的身份信息进行去重处理,对去重处理后的每个用户,执行性别确定的步骤,得到每个用户的性别。
例如,如图4所示,以身份信息包括用户的标识信息(用户的身份标识码(Identification,ID))和收货人信息为例,可以输入用户ID,根据用户收获历史订单,将用户ID与收货人名称关联,再对关联后的数据进行去重,输出去重结果。目标时间段内处理的多个历史订单信息可能包括同一个用户的多个历史订单信息,因而,可以进行去重处理,对一个用户进行一次处理即可。
该步骤301和步骤302为获取用户的身份信息的过程,当然,也可以通过其他方式获取用户的身份信息,对此不作限定。
303、电子设备对该身份信息进行特征提取,得到该用户的身份特征。
电子设备得到身份信息后,可以对其进行特征提取,得到身份特征,该身份特征即为用于预测。例如,该特征提取的过程可以为关键词提取过程,电子设备提取身份信息中的关键词,得到身份特征,以进行后续的性别确定步骤。
304、电子设备对该用户的身份特征与性别关键字进行匹配。
在本申请实施例中,可以提供两种性别确定方式,如果该身份特征中包括有性别关键字,则通过该身份信息即可获知该用户的性别,而如果不包括,则可以提供,具体参见步骤306和步骤307。
其中,该根据对商品的操作行为信息预测用户性别的方式中可以通过模型实现,因而,需要训练样本对模型进行训练,从而可以基于训练好的模型进行性别确定。其中,该训练样本可以由电子设备获取预设的样本,也可以通过该性别关键字匹配的方式,来获取训练样本,用于模型训练,这样该性别确定过程形成闭环,能够自动完成模型训练以及性别确定过程。
对于通过性别关键字确定的方式,可以设置有多个性别关键字,每个性别关键字对应一种性别,例如,性别关键字“女士”或“小姐”对应女性。性别关键字“先生”对应男性。
例如,如图5所示,电子设备去重后将用户名称输入,该用户名称为身份信息,在上述示例中指的是关联的用户的标识信息与收货人信息。通过该名称内容进行模糊识别,如果包含“先生”字样,则输出男性。如果包含“女士”或“小姐”字样,则输出女性。在一种可能实现方式中,可以通过该性别关键字匹配的方式,获取训练样本。则输出结果时可以打标,并将打标结果与用户ID匹配后输出,该打标为添加标签的过程,该标签即为样本的真实值。
305、电子设备响应于该身份特征与目标性别关键字的匹配成功指令,将该目标性别关键字对应的性别确定为该用户的性别。
如果匹配成功,则电子设备即可将匹配的性别关键字对应的性别确定为该用户的性别。例如,如果通过该名称内容进行模糊识别,如果包含“先生”字样,则该用户为男性。如果匹配失败,电子设备可以执行步骤306和步骤307。
306、电子设备响应于该身份特征与性别关键字均匹配失败的指令,获取该用户对商品的操作行为信息。
其中,用户对商品的操作行为信息可以为用户点击商品的行为信息、用户购买商品的行为信息或者将商品添加到待购买列表中的行为信息中至少一种行为信息。从该用户对商品的操作行为信息中,可以获知用户的购买的商品情况,根据用户的喜好来预测用户的性别。例如,用户喜欢购买化妆品,则该用户为女性的可能性更大一些。
其中,该用户对商品的操作行为信息可以存储于数据库中,电子设备可以从数据库中提取该用户对商品的操作行为信息。用户对商品的操作行为信息也可以为对用户的历史订单信息进行提取得到,本申请对此不作限定。
307、电子设备将该用户的身份信息与该对商品的操作行为信息输入性别确定模型中,由该性别确定模型对该身份信息和该商品的操作行为信息进行特征提取,根据提取到的特征,预测该用户的性别,输出该用户的性别。
如果步骤305中匹配的方式失败,还可以提供一种模型预测方式,电子设备可以通过性别确定模型基于用户的身份信息和对商品的操作行为信息预测用户的性别。其中,该性别确定模型可以基于样本训练得到。该样本可以为公开样本,也可以为通过性别关键字匹配的方式得到的样本,本申请实施例对此不作限定。
在一种可能实现方式中,该性别确定模型的获取过程可以通过下述步骤实现:
步骤一、电子设备获取多个样本用户的身份信息、对商品的操作行为信息以及目标性别。其中,该目标性别可以采用上述标签的方式与用户关联。
步骤二、电子设备基于该多个样本用户的身份信息、对商品的操作行为信息和该目标性别,对初始模型进行训练,得到该性别确定模型。
其中,该模型训练过程可以为:由初始模型对多个样本用户的身份信息、对商品的操作行为信息进行特征提取,对提取到的特征进行预测,得到预测性别,根据预测性别和目标性别之间的相似度,对初始模型的参数进行调整,直到符合条件时停止。
在一种可能实现方式中,该样本的来源可以为上述性别关键字匹配的方式得到,则该获取样本的过程可以为:电子设备获取多个用户的身份信息,执行该特征提取和基于身份特征匹配的步骤,将匹配成功的用户作为样本用户,匹配成功的用户的性别作为该样本用户的目标性别,根据多个样本用户的身份信息,获取该多个样本用户对商品的操作行为信息。
在一种可能实现方式中,该模型在对用户的性别进行预测时,可以先提取特征,再对特征进行处理,从而进行预测。在一种可能实现方式中,该过程可以为:由该性别确定模型对该身份信息进行归一化处理,得到身份特征,对该对商品的操作行为信息中同类型操作行为进行统计,得到统计特征,将该对商品的操作行为信息和该统计特征作为行为特征,根据该用户的身份特征和行为特征,预测该用户的性别,输出该用户的性别。
例如,如图6所示,基于上述匹配方式确定了性别的样本后,可以提取两部分特征:身份特征和用户对商品的操作行为信息的特征,进行特征融合,该特征融合即为将两个特征均作为该用户的特征。如图7所示,上述特征处理过程可以包括对基础特征(即为身份特征)进行归一化处理和对行为特征进行特征扩充的过程。其中,该身份信息中可能包括多种类别的特征,例如,数值型:手机号码、用户的编号等。类别型:收货人信息、用户昵称等。通过对数值型进行归一化处理,对类别型则可以进行标准化和数值化处理,从而将类别转化为数值进行表示。其中,该归一化处理过程可以采用下述公式一实现:
公式一:
Figure BDA0002348274330000111
其中,x*为归一化的数值,x为待归一化处理的数值,min为待进行归一化的多个数值中的最小值,max为待进行归一化的多个数值中的最大值。
在一种可能实现方式中,电子设备获取到用户的多个维度的信息,可以采用同一表示格式,来表示该多个维度的信息。也即是,可以设置有目标格式,电子设备通过上述特征处理过程,将该多个维度的信息均转化为该目标格式。
在一种可能实现方式中,性别确定模型可以为二分类模型,上述模型训练过程可以如图8所示,进行特征处理后,将特征输入二分类模型中,对模型进行训练,模型结果输出打分,在模型确定性能达到预期时,可以将模型文件存储,以备后续基于模型进行性别确定。
基于该模型进行识别确定的过程可以参见图9,匹配方式无法确定性别的用户,将用户ID输入,获取用户的特征,该用户的特征包括身份信息和对商品的操作行为信息,并加载训练好的模型文件,通过模型对用户性别进行预测,输出预测结果,该预测结果用于指示该用户的性别。
在一种可能实现方式中,上述模型训练过程还可以为训练得到候选性别确定模型后,对该候选性别确定模型进行优化,得到性别确定模型。该优化过程可以采用提升树模型的方式实现,也即是,通过样本进行模型训练,得到候选性别确定模型,基于下述提升树模型调整候选性别确定模型的参数,再基于样本对调整后的候选性别确定模型进行模型训练,得到性别确定模型。
其中,提升树模型可以表示如下:
Figure BDA0002348274330000121
T(x;φm)表示决策树;φm为决策树参数;M为树个数。
本申请实施例通过上述基于身份信息进行匹配的方式获取样本,在完全无用户性别样本的情况下也可以进行用户性别预测,且提供了两种方式,打破了相关技术中性别确定方式的局限性。
针对上述步骤307,在考虑该用户的多种信息时,电子设备可以对每种信息进行处理,得到每种信息的预测性别,再基于每种信息的权重,对多种信息的预测性别进行加权,得到该用户的性别。
在一种可能实现方式中,该每种信息的权重可以为一种自适应权重,该权重可以在该性别确定模型训练时确定,该性别确定模型对样本进行处理时,可以得到每种信息的预测性别再加权求和得到用户的性别,基于电子设备可以基于该用户的性别、每种信息的预测性别与样本的目标性别,对每种信息的权重进行调整,直至每种信息的预测性别与目标性别之间的相似度收敛或者综合多种信息后该用户的性别与目标性别之间的相似度收敛,或者迭代次数达到目标次数。
在一种可能实现方式中,在考虑该用户的多种信息时,还可以先考虑该多种信息中的一种或几种信息,从而基于该一种或几种信息的预测结果判断是否进行其他信息的预测。
具体地,电子设备可以对该多种信息中的第一信息进行处理,得到该第一信息的预测性别,需要说明的是,该对该多种信息中的至少一种信息进行处理,得到该第一信息的预测性别的过程可以为:电子设备对该多种信息中的第一信息进行处理,得到该第一信息为两种性别中每种性别的概率,将概率大的性别作为该第一信息的预测性别,或者将概率大于概率阈值的性别作为该第一信息的预测性别。
在一种可能实现方式中,当该第一信息的性别预测过程中得到的概率小于目标数值时,电子设备可以对第二信息进行处理,得到该第二信息的预测性别,从而将该第二信息的预测性别作为该用户的性别,或者对第一信息和第二信息的预测性别进行加权求和,得到该用户的性别,本申请实施例对此不作限定。而如果第一信息的性别预测过程中得到的概率大于目标数值时,电子设备可以无需对第二信息进行处理,直接将第一信息的预测性别作为该用户的性别。
本实施例提供了一种基于用户的身份信息的性别确定方法,通过用户的身份信息,根据身份信息对应的身份特征与性别关键字进行匹配,从而确定用户的性别,该身份信息包括该身份信息包括该用户的收货人信息、账号标识、联系方式或姓名中至少一项和该用户的标识信息,能够在无性别信息的情况下,通过用户的身份信息与性别关键字进行匹配来确定用户性别,提供了一种方便快捷的性别确定方式,扩展了性别确定方式的适用场景,提高了性别确定方式的适用性。
图10是本申请实施例提供的一种性别确定装置的结构示意图。参见图10,该装置包括:
获取模块1001,用于获取用户的身份信息,该身份信息包括该用户的收货人信息、账号标识、联系方式、姓名中或该用户的标识信息至少一项;
提取模块1002,用于对该身份信息进行特征提取,得到该用户的身份特征;
匹配模块1003,用于对该用户的身份特征与性别关键字进行匹配;
确定模块1004,用于响应于该身份特征与目标性别关键字的匹配成功指令,将该目标性别关键字对应的性别确定为该用户的性别。
在一种可能实现方式中,该获取模块1001,还用于响应于该身份特征与性别关键字均匹配失败的指令,获取该用户对商品的操作行为信息;
该确定模块1004,还用于将该用户的身份信息与该对商品的操作行为信息输入性别确定模型中,由该性别确定模型对该身份信息和该商品的操作行为信息进行特征提取,根据提取到的特征,预测该用户的性别,输出该用户的性别。
在一种可能实现方式中,该装置还包括训练模块,该训练模块用于:
获取多个样本用户的身份信息、对商品的操作行为信息以及目标性别;
基于该多个样本用户的身份信息、对商品的操作行为信息和该目标性别,对初始模型进行训练,得到该性别确定模型。
在一种可能实现方式中,该训练模块用于:
获取多个用户的身份信息;
执行该特征提取和基于身份特征匹配的步骤,将匹配成功的用户作为样本用户,匹配成功的用户的性别作为该样本用户的目标性别;
根据多个样本用户的身份信息,获取该多个样本用户对商品的操作行为信息。
在一种可能实现方式中,该确定模块1004用于:
由该性别确定模型对该身份信息进行归一化处理,得到身份特征;
对该对商品的操作行为信息中同类型操作行为进行统计,得到统计特征,将该对商品的操作行为信息和该统计特征作为行为特征;
根据该用户的身份特征和行为特征,预测该用户的性别,输出该用户的性别。
在一种可能实现方式中,该获取模块1001用于:
获取该用户的历史订单信息;
从该历史订单信息中提取该用户的身份信息。
在一种可能实现方式中,该获取模块1001还用于:
获取目标时间段内处理的多个历史订单信息;
从该多个历史订单信息中提取多个用户的身份信息;
对该多个用户的身份信息进行去重处理,对去重处理后的每个用户,执行性别确定的步骤,得到每个用户的性别。
需要说明的是:上述实施例提供的性别确定装置在确定性别时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将性别确定装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的性别确定装置与性别确定方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
上述方法实施例中的电子设备可以实现为终端。例如,图11是本申请实施例提供的一种终端的结构示意图。该终端1100可以是:智能手机、平板电脑、MP3(Moving PictureExperts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(MovingPicture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1100还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端1100包括有:一个或多个处理器1101和一个或多个存储器1102。
处理器1101可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1101可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1101也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1101可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1101还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1102可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1102还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1102中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1101所执行以实现本申请中方法实施例提供的性别确定方法。
在一些实施例中,终端1100还可选包括有:外围设备接口1103和至少一个外围设备。处理器1101、存储器1102和外围设备接口1103之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1103相连。具体地,外围设备包括:射频电路1104、显示屏1105、摄像头组件1106、音频电路1107、定位组件1108和电源1109中的至少一种。
外围设备接口1103可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器1101和存储器1102。在一些实施例中,处理器1101、存储器1102和外围设备接口1103被集成在同一芯片或电路板上;在一些其他实施例中,处理器1101、存储器1102和外围设备接口1103中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1104用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1104通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1104将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1104包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1104可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1104还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏1105用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1105是触摸显示屏时,显示屏1105还具有采集在显示屏1105的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1101进行处理。此时,显示屏1105还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1105可以为一个,设置终端1100的前面板;在另一些实施例中,显示屏1105可以为至少两个,分别设置在终端1100的不同表面或呈折叠设计;在再一些实施例中,显示屏1105可以是柔性显示屏,设置在终端1100的弯曲表面上或折叠面上。甚至,显示屏1105还可以设置成非矩形的不规则图形,也即异形屏。显示屏1105可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件1106用于采集图像或视频。可选地,摄像头组件1106包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1106还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路1107可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1101进行处理,或者输入至射频电路1104以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端1100的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1101或射频电路1104的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1107还可以包括耳机插孔。
定位组件1108用于定位终端1100的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件1108可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
电源1109用于为终端1100中的各个组件进行供电。电源1109可以是交流电、直流电、一次性电池或可充电电池。当电源1109包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端1100还包括有一个或多个传感器1110。该一个或多个传感器1110包括但不限于:加速度传感器1111、陀螺仪传感器1112、压力传感器1113、指纹传感器1114、光学传感器1115以及接近传感器1116。
加速度传感器1111可以检测以终端1100建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1111可以用于检测重力加速度在三个坐标轴上的分量。处理器1101可以根据加速度传感器1111采集的重力加速度信号,控制显示屏1105以横向视图或纵向视图进行用户界面的显示。加速度传感器1111还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器1112可以检测终端1100的机体方向及转动角度,陀螺仪传感器1112可以与加速度传感器1111协同采集用户对终端1100的3D动作。处理器1101根据陀螺仪传感器1112采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器1113可以设置在终端1100的侧边框和/或显示屏1105的下层。当压力传感器1113设置在终端1100的侧边框时,可以检测用户对终端1100的握持信号,由处理器1101根据压力传感器1113采集的握持信号进行左右手识别或快捷操作。当压力传感器1113设置在显示屏1105的下层时,由处理器1101根据用户对显示屏1105的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器1114用于采集用户的指纹,由处理器1101根据指纹传感器1114采集到的指纹识别用户的身份,或者,由指纹传感器1114根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器1101授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1114可以被设置终端1100的正面、背面或侧面。当终端1100上设置有物理按键或厂商Logo时,指纹传感器1114可以与物理按键或厂商Logo集成在一起。
光学传感器1115用于采集环境光强度。在一个实施例中,处理器1101可以根据光学传感器1115采集的环境光强度,控制显示屏1105的显示亮度。具体地,当环境光强度较高时,调高显示屏1105的显示亮度;当环境光强度较低时,调低显示屏1105的显示亮度。在另一个实施例中,处理器1101还可以根据光学传感器1115采集的环境光强度,动态调整摄像头组件1106的拍摄参数。
接近传感器1116,也称距离传感器,通常设置在终端1100的前面板。接近传感器1116用于采集用户与终端1100的正面之间的距离。在一个实施例中,当接近传感器1116检测到用户与终端1100的正面之间的距离逐渐变小时,由处理器1101控制显示屏1105从亮屏状态切换为息屏状态;当接近传感器1116检测到用户与终端1100的正面之间的距离逐渐变大时,由处理器1101控制显示屏1105从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图11中示出的结构并不构成对终端1100的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
上述方法实施例中的电子设备可以实现为服务器。例如,图12是本申请实施例提供的一种服务器的结构示意图,该服务器1200可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器(Central Processing Units,CPU)1201和一个或多个的存储器1202,其中,该一个或多个存储器1202中存储有至少一条指令,该至少一条指令由该一个或多个处理器1201加载并执行以实现上述各个方法实施例提供的性别确定方法。当然,该服务器1200还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器1200还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括至少一条指令的存储器,上述至少一条指令由可由处理器执行以完成上述实施例中的性别确定方法。例如,计算机可读存储介质可以是只读存储器(Read-Only Memory,简称:ROM)、随机存取存储器(Random Access Memory,简称:RAM)、只读光盘(Compact Disc Read-Only Memory,简称:CD-ROM)、磁带、软盘和光数据存储设备等。
应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其它信息确定B。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上描述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种性别确定方法,其特征在于,所述方法包括:
获取用户的身份信息,所述身份信息包括所述用户的收货人信息、账号标识、联系方式、姓名中或所述用户的标识信息至少一项;
对所述身份信息进行特征提取,得到所述用户的身份特征;
对所述用户的身份特征与性别关键字进行匹配;
响应于所述身份特征与目标性别关键字的匹配成功指令,将所述目标性别关键字对应的性别确定为所述用户的性别。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于所述身份特征与性别关键字均匹配失败的指令,获取所述用户对商品的操作行为信息;
将所述用户的身份信息与所述对商品的操作行为信息输入性别确定模型中,由所述性别确定模型对所述身份信息和所述商品的操作行为信息进行特征提取,根据提取到的特征,预测所述用户的性别,输出所述用户的性别。
3.根据权利要求2所述的方法,其特征在于,所述性别确定模型的获取过程包括:
获取多个样本用户的身份信息、对商品的操作行为信息以及目标性别;
基于所述多个样本用户的身份信息、对商品的操作行为信息和所述目标性别,对初始模型进行训练,得到所述性别确定模型。
4.根据权利要求3所述的方法,其特征在于,所述获取多个样本用户的身份信息、对商品的操作行为信息以及目标性别,包括:
获取多个用户的身份信息;
执行所述特征提取和基于身份特征匹配的步骤,将匹配成功的用户作为样本用户,匹配成功的用户的性别作为所述样本用户的目标性别;
根据多个样本用户的身份信息,获取所述多个样本用户对商品的操作行为信息。
5.根据权利要求2所述的方法,其特征在于,所述由所述性别确定模型对所述身份信息和所述商品的操作行为信息进行特征提取,根据提取到的特征,预测所述用户的性别,输出所述用户的性别,包括:
由所述性别确定模型对所述身份信息进行归一化处理,得到身份特征;
对所述对商品的操作行为信息中同类型操作行为进行统计,得到统计特征,将所述对商品的操作行为信息和所述统计特征作为行为特征;
根据所述用户的身份特征和行为特征,预测所述用户的性别,输出所述用户的性别。
6.根据权利要求1所述的方法,其特征在于,所述获取用户的身份信息,包括:
获取所述用户的历史订单信息;
从所述历史订单信息中提取所述用户的身份信息。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
获取目标时间段内处理的多个历史订单信息;
从所述多个历史订单信息中提取多个用户的身份信息;
对所述多个用户的身份信息进行去重处理,对去重处理后的每个用户,执行性别确定的步骤,得到每个用户的性别。
8.一种性别预测装置,其特征在于,所述装置包括:
获取模块,用于获取用户的身份信息,所述身份信息包括所述用户的收货人信息、账号标识、联系方式、姓名中或所述用户的标识信息至少一项;
提取模块,用于对所述身份信息进行特征提取,得到所述用户的身份特征;
匹配模块,用于对所述用户的身份特征与性别关键字进行匹配;
确定模块,用于响应于所述身份特征与目标性别关键字的匹配成功指令,将所述目标性别关键字对应的性别确定为所述用户的性别。
9.一种电子设备,其特征在于,所述电子设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条指令,所述至少一条指令由所述一个或多个处理器加载并执行以实现如权利要求1至权利要求7任一项所述的性别预测方法所执行的操作。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至权利要求7任一项所述的性别预测方法所执行的操作。
CN201911404522.7A 2019-12-30 2019-12-30 性别确定方法、装置、设备及存储介质 Pending CN111143441A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911404522.7A CN111143441A (zh) 2019-12-30 2019-12-30 性别确定方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911404522.7A CN111143441A (zh) 2019-12-30 2019-12-30 性别确定方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN111143441A true CN111143441A (zh) 2020-05-12

Family

ID=70522328

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911404522.7A Pending CN111143441A (zh) 2019-12-30 2019-12-30 性别确定方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111143441A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111652432A (zh) * 2020-06-01 2020-09-11 北京达佳互联信息技术有限公司 用户属性信息的确定方法、装置、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105809557A (zh) * 2016-03-15 2016-07-27 微梦创科网络科技(中国)有限公司 一种挖掘社交网络中用户性别的方法和装置
CN108256537A (zh) * 2016-12-28 2018-07-06 北京酷我科技有限公司 一种用户性别预测方法和系统
CN109145932A (zh) * 2017-06-28 2019-01-04 中兴通讯股份有限公司 用户性别预测方法、装置及设备
CN109948633A (zh) * 2017-12-20 2019-06-28 广东欧珀移动通信有限公司 用户性别预测方法、装置、存储介质及电子设备
CN109961077A (zh) * 2017-12-22 2019-07-02 广东欧珀移动通信有限公司 性别预测方法、装置、存储介质及电子设备
CN110096526A (zh) * 2019-04-30 2019-08-06 秒针信息技术有限公司 一种用户属性标签的预测方法及预测装置
CN110119433A (zh) * 2019-05-13 2019-08-13 上海连尚网络科技有限公司 用于预测性别的方法和设备
US20190373332A1 (en) * 2018-06-04 2019-12-05 Samsung Electronics Co., Ltd. Machine learning-based approach to demographic attribute inference using time-sensitive features

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105809557A (zh) * 2016-03-15 2016-07-27 微梦创科网络科技(中国)有限公司 一种挖掘社交网络中用户性别的方法和装置
CN108256537A (zh) * 2016-12-28 2018-07-06 北京酷我科技有限公司 一种用户性别预测方法和系统
CN109145932A (zh) * 2017-06-28 2019-01-04 中兴通讯股份有限公司 用户性别预测方法、装置及设备
CN109948633A (zh) * 2017-12-20 2019-06-28 广东欧珀移动通信有限公司 用户性别预测方法、装置、存储介质及电子设备
CN109961077A (zh) * 2017-12-22 2019-07-02 广东欧珀移动通信有限公司 性别预测方法、装置、存储介质及电子设备
US20190373332A1 (en) * 2018-06-04 2019-12-05 Samsung Electronics Co., Ltd. Machine learning-based approach to demographic attribute inference using time-sensitive features
CN110096526A (zh) * 2019-04-30 2019-08-06 秒针信息技术有限公司 一种用户属性标签的预测方法及预测装置
CN110119433A (zh) * 2019-05-13 2019-08-13 上海连尚网络科技有限公司 用于预测性别的方法和设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
朱鹏军: "基于用户行为特征的性别预测研究", 《电脑知识与技术》 *
钱铁云 等: "基于兴趣标签的缄默用户性别预测研究", 《华中科技大学学报(自然科学版)》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111652432A (zh) * 2020-06-01 2020-09-11 北京达佳互联信息技术有限公司 用户属性信息的确定方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN111476306B (zh) 基于人工智能的物体检测方法、装置、设备及存储介质
CN111091132B (zh) 基于人工智能的图像识别方法、装置、计算机设备及介质
CN110222789B (zh) 图像识别方法及存储介质
CN110471858B (zh) 应用程序测试方法、装置及存储介质
CN110807361A (zh) 人体识别方法、装置、计算机设备及存储介质
CN112733970B (zh) 图像分类模型处理方法、图像分类方法及装置
CN111127509B (zh) 目标跟踪方法、装置和计算机可读存储介质
CN111897996A (zh) 话题标签推荐方法、装置、设备及存储介质
CN111104980B (zh) 确定分类结果的方法、装置、设备及存储介质
CN111339737B (zh) 实体链接方法、装置、设备及存储介质
CN110942046B (zh) 图像检索方法、装置、设备及存储介质
CN111738365B (zh) 图像分类模型训练方法、装置、计算机设备及存储介质
CN111027490A (zh) 人脸属性识别方法及装置、存储介质
CN113918767A (zh) 视频片段定位方法、装置、设备及存储介质
CN113987326B (zh) 资源推荐方法、装置、计算机设备及介质
CN112766406A (zh) 物品图像的处理方法、装置、计算机设备及存储介质
CN111639639B (zh) 检测文本区域的方法、装置、设备及存储介质
CN111353513B (zh) 一种目标人群筛选的方法、装置、终端和存储介质
CN111143441A (zh) 性别确定方法、装置、设备及存储介质
CN113343709B (zh) 意图识别模型的训练方法、意图识别方法、装置及设备
CN112001442B (zh) 特征检测方法、装置、计算机设备及存储介质
CN115221888A (zh) 实体提及的识别方法、装置、设备及存储介质
CN111897709A (zh) 监控用户的方法、装置、电子设备及介质
CN111652432A (zh) 用户属性信息的确定方法、装置、电子设备及存储介质
CN112116480A (zh) 虚拟资源确定方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200512

WD01 Invention patent application deemed withdrawn after publication