CN106844687A - 一种基于游戏日志确定用户性别的方法及系统 - Google Patents

一种基于游戏日志确定用户性别的方法及系统 Download PDF

Info

Publication number
CN106844687A
CN106844687A CN201710058275.4A CN201710058275A CN106844687A CN 106844687 A CN106844687 A CN 106844687A CN 201710058275 A CN201710058275 A CN 201710058275A CN 106844687 A CN106844687 A CN 106844687A
Authority
CN
China
Prior art keywords
user
sex
game
data
unknown
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710058275.4A
Other languages
English (en)
Other versions
CN106844687B (zh
Inventor
吴远沈
唐勇
丁圣勇
苏洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xuan Cai Interactive Network Science And Technology Ltd
Original Assignee
Xuan Cai Interactive Network Science And Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xuan Cai Interactive Network Science And Technology Ltd filed Critical Xuan Cai Interactive Network Science And Technology Ltd
Priority to CN201710058275.4A priority Critical patent/CN106844687B/zh
Publication of CN106844687A publication Critical patent/CN106844687A/zh
Application granted granted Critical
Publication of CN106844687B publication Critical patent/CN106844687B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本发明提供一种基于游戏日志确定用户性别的方法。与现有方法不同,本发明引入游戏性别极性并通过加权方法推测出用户性别。本方法中的游戏性别极性可以通过统计用户使用游戏的具体名称直接得出,且以此为依据预测出的用户性别准确度很高。本方法无需对现有用户信息构数据挖掘模型,也无需对模型进行特殊训练,仅通过简单统计以及运算即可比较准确的获知对应用户的性别,可避免使用复杂的模型,避免过多的系统开销。通过本方法,游戏运营商可通过自身日志信息,仅花费很小的成本即可对用户进行准确的用户群定位,从而有针对性地进行游戏推送,运营成本大大降低,而同时,用户体验却可以有所提升。

Description

一种基于游戏日志确定用户性别的方法及系统
技术领域
本发明涉及用户群分析领域,尤其涉及一种基于游戏日志确定用户性别的方法及对应系统。
背景技术
用户群定位是游戏设计的重要环节,而性别则是其中一个重要的群体划分标准。不同的游戏分类,如角色扮演、动作游戏、策略战棋、益智休闲、赛车游戏、飞行游戏、养成游戏、体育运动、冒险游戏、射击游戏、棋牌游戏、模拟经营、格斗游戏,等,往往都有各自所针对的用户群体。一款游戏面世后,往往男女比例有严重的不均衡性。例如,男性更喜欢积极激烈的活动,他们喜欢寻求刺激,喜欢占主导地位,喜欢冒险;而女性则喜欢多愁善感,喜欢保守,他们喜欢寻求稳定而不是刺激,他们喜欢被主导,喜欢‘小鸟依人’。由此男性相对更爱玩动作冒险类游戏,女性则相对更喜欢趣味类游戏。为了提高游戏推荐的效果,应当向不同性别的用户推荐不同类型的游戏。比如战争类游戏多为男性所偏爱,如果向女性用户推荐则会往往没有效果。如果能够针对用户性别进行精准的游戏推送,往往能够优化用户体验,并同时提高推送的成功率。
现有的游戏平台通常只能够通过用户填写的注册信息直接获得用户性别。但实际进行游戏推送时,如果用户没有提供性别信息,或者用户是异网用户,现有的技术往往无法获得用户性别,进而无法有针对性地对用户进行有效的推送。
目前,针对用户性别,在用户群体数据分析领域通常需要先通过构建数据挖掘模型进行训练,再使用训练得到的模型对用户数据分析才能实现对用户性别的预测。这种方式的计算量消耗非常大,且需要分布式编程才能够实现精确建模,增加了程序开发、运作的成本。因而目前急需一种通过简单的运算即可实现用户性别数据挖掘的方法,从而摆脱传统数据挖掘方法而给推送系统带来的运算负荷。
发明内容
为了解决现有技术存在的不足,本发明的目的在于提供一种基于游戏日志确定用户性别的方法及系统。
首先,为实现上述目的,提出一种基于游戏日志确定用户性别的方法,包括以下步骤:
数据预处理:筛选游戏日志数据,对筛选出的有效数据建立统计表,所述统计表包括已知性别用户分表以及未知性别用户分表,所述已知性别用户分表和未知性别用户分表内均包括用户的IMSI(国际移动用户识别码,International Mobile SubscriberIdentification Number)数据以及每一位用户所使用的游戏名称;
统计游戏性别极性:统计所述已知性别分表中各款游戏出现的比例,得到各款游戏的性别极性G(game_i);
预测未知用户性别:遍历所述未知性别用户分表,统计每一位未知性别用户使用每一款游戏的频率P(game_i),并根据如下公式计算每一位用户的性别概率其中,n为统计表中游戏的总数量,根据所述每一位用户的性别概率Pgender预测对应用户的性别。
进一步,上述方法中,所述筛选游戏日志数据的步骤包括:通过业务口径,由正则表达式判断数据是否有效,筛选掉被判断为无效的数据。所述无效的数据包含空数据、乱码数据或非460开头且长度不等于15位的数据。
进一步,上述方法中,所述统计表中的数据还包括:每一位用户使用每一款游戏的次数或频率。
进一步,上述方法中,所述已知性别用户分表仅包括男性用户的有效数据,或仅包括女性用户的有效数据。尤其,由于游戏日志数据中男性用户所占比例大约有70%,因而着重对男性用户数据进行处理,即可直接根据男性用户的概率推知女性用户。
进一步,上述方法中,所述统计游戏性别极性的步骤包括:
第一步,将所述已知性别分表中的用户随机分为两组,统计其中第一组中各款游戏出现的比例,得到各款游戏的性别极性预测值G′(game_i);其中,第一组中用户的数目占所述已知性别分表中用户总数的70%;
第二步,使用所述性别极性预测值G′(game_i)按照所述预测未知用户性别的方法,预测第二组中各用户的性别,并将预测的性别与所述第二组中各用户标记的性别进行比较,评估预测未知用户性别的准确度。
进一步,上述方法中,所述用户使用每一款游戏的频率P(game_i)为所述未知性别用户分表中标记的每一位用户使用每一款游戏的次数占该用户使用游戏总次数的比例,或者为所述未知性别用户分表中标记的每一位用户使用每一款游戏的频率,或者为所述未知性别用户分表中每一位用户使用游戏的总数量的倒数。
其次,为实现精确推送游戏的目的,还在上述方法中增加根据用户性别推荐游戏的步骤,具体方法为:遍历所述统计表,根据所述统计表中标记的用户性别或根据预测得到的用户性别,查询游戏目录,推送性别极性G(game_i)与对应用户相匹配的游戏。
其中,所述根据用户性别推荐游戏的步骤中,推送所述游戏的顺序还根据用户使用每一种类游戏的频率进行排序,用户使用频率高的游戏种类推送时排序靠前,用户使用频率低的游戏种类推送时排序靠后。
同时,为实现精确推送游戏的目的,还提出一种基于游戏日志确定用户性别的系统,包括依次顺序连接的:游戏日志数据接口模块、数据预处理模块、统计表存储单元、游戏性别极性统计单元、未知用户性别预测模块;
所述游戏日志数据接口模块用于读取游戏日志数据;
所述数据预处理模块用于筛选游戏日志数据接口所读取的游戏日志数据,并对筛选出的有效数据建立统计表,将所述统计表存储于所述统计表存储单元;
所述统计表存储单元用于存储所述统计表内的数据;所述统计表包括已知性别用户分表以及未知性别用户分表,所述已知性别用户分表和未知性别用户分表内均包括用户的IMSI数据以及每一位用户所使用的游戏名称;
所述游戏性别极性统计单元用于统计所述已知性别分表中各款游戏出现的比例,并将所述比例存储为各款游戏对应的性别极性G(game_i)数据;
所述未知用户性别预测模块用于遍历所述未知性别用户分表,统计每一位未知性别用户使用每一款游戏的频率P(game_i),并根据如下公式计算每一位用户的性别概率其中,n为统计表中游戏的总数量,最后根据所述每一位用户的性别概率Pgender预测对应用户的性别。
进一步,所述系统,在所述未知用户性别预测模块后还连接有推荐系统,所述推荐系统遍历所述统计表,根据所述统计表中标记的用户性别或根据预测得到的用户性别,查询游戏目录,推送性别极性G(game_i)与对应用户相匹配的游戏。
有益效果
本发明针对游戏日志内静态存储的数据类别数据进行统计分析。由于仅针对静态数据进行分析,而减轻了对用户行为数据(如访问内容、访问频次、行为时间、行为载体)进行分析时所产生的非必要的额外运算负荷。此外,本方法主要运用全概率公式的思想,并对根据游戏日志数据的特点,对全概率公式的计算进行了简化。具体而言,通过对已知性别用户的有效数据进行统计,得到各款游戏的性别极性G(game_i),用以取代全概率公式中的条件概率。本方法在进行未知用户性别预测时,计算方法简单高效,运算资源消耗更少,无需对系统程序进行大范围的改进,即可使性别预测的准确率至少达到71.4%。若同时结合模型融合方法,加入其它模型,即可将预测准确率提升至81.2%以上。
为进一步简化运算,本方法中的已知性别用户分表仅包括男性(或仅包括女性)用户的有效数据,通过设置0.5的阈值对计算得到的用户的性别概率Pgender进行判断。这样,在根据男性用户数据判断用户性别为男性的概率Pgender后,即可得出相应的性别为女性的概率(1-Pgender)。根据女性用户数据进行计算也类似,可通过简单运算得到相应的性别为男性的概率。尤其,由于游戏日志数据中男性用户所占比例更大,因而着重对男性用户数据进行处理。这样,由于样本本身更大,由此得到的男性用户的概率也会更为准确。
同时,为了能够方便地评估本方法预测未知用户性别的准确度,本方法在统计游戏性别极性的步骤中优先利用70%的已知性别分表中用户数据进行训练,并通过剩下的30%的已知性别分表中的用户数据来评估模型效果。
进一步,本方法所统计的各款游戏的性别极性G(game_i)还为现有游戏推送系统所利用,称为选择推送游戏时的一个考核维度。推送性别极性G(game_i)与对应用户相匹配的游戏(例如,计算或统计得到某用户为男性的概率为Pgender,则向该用户推送性别极性G(game_i)在接近Pgender数值的游戏),这样推送更加符合用户使用游戏的倾向,推送游戏的成功率会更高,同时,用户接受程度也会更高。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,并与本发明的实施例一起,用于解释本发明,并不构成对本发明的限制。在附图中:
图1为根据本发明实施例的基于游戏日志确定用户性别的系统结构图;
图2为根据本发明实施例的游戏极性示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1为基于游戏日志确定用户性别的系统结构图,包括以下步骤:
依次顺序连接的:游戏日志数据接口模块、数据预处理模块、统计表存储单元、游戏性别极性统计单元、未知用户性别预测模块;
所述游戏日志数据接口模块用于读取游戏日志数据;
所述数据预处理模块用于筛选游戏日志数据接口所读取的游戏日志数据,并对筛选出的有效数据建立统计表,将所述统计表存储于所述统计表存储单元;
所述统计表存储单元用于存储所述统计表内的数据;所述统计表包括已知性别用户分表以及未知性别用户分表,所述已知性别用户分表和未知性别用户分表内均包括用户的IMSI数据以及每一位用户所使用的游戏名称;
所述游戏性别极性统计单元用于统计所述已知性别分表中各款游戏出现的比例,并将所述比例存储为各款游戏对应的性别极性G(game_i)数据;
所述未知用户性别预测模块用于遍历所述未知性别用户分表,统计每一位未知性别用户使用每一款游戏的频率P(game_i),并根据如下公式计算每一位用户的性别概率其中,n为统计表中游戏的总数量,最后根据所述每一位用户的性别概率Pgender预测对应用户的性别。
本实施例中,为实现精确推送游戏的目的,上述系统在在所述未知用户性别预测模块后还连接有推荐系统,所述推荐系统遍历所述统计表,根据所述统计表中标记的用户性别或根据预测得到的用户性别,查询游戏目录,推送性别极性G(game_i)与对应用户相匹配的游戏。
所述系统按照如下方法进行工作:
步骤一,数据预处理:筛选游戏日志数据,对筛选出的有效数据建立统计表,所述统计表包括已知性别用户分表以及未知性别用户分表,所述已知性别用户分表和未知性别用户分表内均包括用户的IMSI(国际移动用户识别码,International Mobile SubscriberIdentification Number)数据以及每一位用户所使用的游戏名称;
步骤二,统计游戏性别极性:统计所述已知性别分表中各款游戏出现的比例,得到各款游戏的性别极性G(game_i);
步骤三,预测未知用户性别:遍历所述未知性别用户分表,统计每一位未知性别用户使用每一款游戏的频率P(game_i),并根据如下公式计算每一位用户的性别概率其中,n为统计表中游戏的总数量,根据所述每一位用户的性别概率Pgender预测对应用户的性别。例如,以男性用户数据为例,如果计算得到的某一位用户的性别概率Pgender不小于0.5,则判断该用户为男性;否则,判断该用户为女性。
其中,上述方法的步骤一中,所述筛选游戏日志数据的步骤包括:通过业务口径,由正则表达式判断数据是否有效,筛选掉被判断为无效的数据。所述无效的数据包含空数据、乱码数据或非460开头且长度不等于15位的数据,例如imsi是0000000000000,或者13456778等。
独立使用上述步骤即可得到用户的性别概率Pgender。进一步,为简化计算,上述方法的步骤一中,所述已知性别用户分表仅包括男性用户的有效数据,或仅包括女性用户的有效数据。尤其,由于游戏日志数据中男性用户所占比例大约有70%,因而着重对男性用户数据进行处理,即可直接根据男性用户的概率推知女性用户。
若方法中的已知性别用户分表仅包括男性用户的有效数据,通过设置0.5的阈值对计算得到的用户的性别概率Pgender进行判断:当用户性别为男性的概率Pgender≥0.5时,即可判断对应用户为男性。这样,在根据男性用户数据判断用户性别为男性的概率Pgender后,即可得出相应的性别为女性的概率(1-Pgender)。
对应的,若方法中的已知性别用户分表仅包括女性用户的有效数据,通过设置0.5的阈值对计算得到的用户的性别概率Pgender进行判断:当用户性别为女性的概率Pgender≥0.5时,即可判断对应用户为女性。这样,在根据男性用户数据判断用户性别为女性的概率Pgender后,即可得出相应的性别为男性的概率(1-Pgender)。不过,由于游戏日志数据中男性用户的样本更多,以男性用户作为基准进行统计、计算,得到的结果会更为准确。
进一步,为增加计算的准确度,上述方法的步骤一中,所述统计表中的数据还可以包括:每一位用户使用每一款游戏的次数或频率。这样在步骤三的计算中可通过所述每一位用户使用每一款游戏的次数或频率,通过简单处理,得到用户使用每一款游戏的频率P(game_i)。
进一步,为量化用户性别预测的准确度,上述方法的步骤二,统计游戏性别极性的步骤包括:
第一步,将所述已知性别分表中的用户随机分为两组,统计其中第一组中各款游戏出现的比例,得到各款游戏的性别极性预测值G′(game_i);其中,第一组中用户的数目占所述已知性别分表中用户总数的70%;
第二步,使用所述性别极性预测值G′(game_i)按照所述预测未知用户性别的方法,预测第二组中各用户的性别,并将预测的性别与所述第二组中各用户标记的性别进行比较,评估预测未知用户性别的准确度。
进一步,为简化计算,上述方法的步骤三中,所述用户使用每一款游戏的频率P(game_i)为所述未知性别用户分表中标记的每一位用户使用每一款游戏的次数占该用户使用游戏总次数的比例,或者为所述未知性别用户分表中标记的每一位用户使用每一款游戏的频率,或者为所述未知性别用户分表中每一位用户使用游戏的总数量的倒数。
其次,为实现精确推送游戏的目的,还在上述方法中增加根据用户性别推荐游戏的步骤,具体方法为:遍历所述统计表,根据所述统计表中标记的用户性别或根据预测得到的用户性别,查询游戏目录,推送性别极性G(game_i)与对应用户相匹配的游戏。
其中,所述根据用户性别推荐游戏的步骤中,推送所述游戏的顺序还根据用户使用每一种类游戏的频率进行排序,用户使用频率高的游戏种类推送时排序靠前,用户使用频率低的游戏种类推送时排序靠后。
使用中,具体计算实例如下:
步骤二中,通过已有性别标签的游戏日志数据计算各款游戏的性别极性G(game_i)的过程中,假设日志数据筛选出标签为'男'的用户如下:
用户 游戏 游戏 游戏 游戏 游戏 性别
user1 爱情女神 中国象棋 极品飞车 连连看
user2 中国象棋 爱情女神 极品飞车 连连看
user3 大富翁 爱情女神 王牌飞行
user4 爱情女神 王牌飞行 中国象棋 连连看
user5 王牌飞行 爱情女神 连连看 极品飞车
user6 爱情女神 极品飞车 中国象棋 王牌飞行
user7 中国象棋 爱情女神 大富翁 极品飞车
user8 中国象棋
user9 大富翁 王牌飞行 极品飞车 爱情女神
user10 大富翁 爱情女神 连连看 极品飞车 中国象棋
G(game_'大富翁')=0.4,G(game_'连连看')=0.5
G(game_'爱情女神')=0.9,G(game_'极品飞车')=0.7
可计算得到G(game_'中国象棋')=0.7,G(game_'王牌飞行')=0.9
则,根据公式得到user1....user10每个用户为男的概率分别为0.7,0.7,0.6,0.65,0.65,0.7,0.675,0.7,0.625,0.64。
以user10为例,具体计算过程为:
游戏日志表中每个用户使用游戏的数量,表示一段时间内用户使用游戏的次数。游戏日志表中统计的时间的长短越长越好,越长越准确,实际应用中,一般能够统计用户7天内的数据。
本发明可以通过图2的数据图直观地对用户的性别进行判断。以用户B为例,其使用的“极品飞车”、“中国象棋”和“王牌飞行”都具备明显的性别极性,因而,可通过上述公式预测其为男性。与其实际性别对比,即可判断所述性别极性数据是否可靠,是否需要进行修正。
本发明技术方案的优点主要体现在于:
本发明应用全概率公式的思想,直接对游戏用户的日志数据进行筛选统计,通过简单计算即可准确推测出用户性别。本方法无需对现有用户信息构数据挖掘模型,也无需对模型进行特殊训练,仅通过简单统计以及运算即可准确获知对应用户的性别,从而降低了因构造分布式方程训练而造成的额外的运算成本,并同时提高了运算效率。通过本方法,游戏运营商可通过自身日志信息,仅花费很小的成本即可对用户进行准确的用户群定位,从而有针对性地进行游戏推送,运营成本大大降低,而同时,用户体验却可以有所提升。具体而言:
1)本方法所用数据简单,可以直接从运营日志获取,这类数据在每一个游戏公司应该都有,是最初级的日志数据。
2)本方法实现相对容易
本专利预测出来的用户性别准确度为71.4%,再结合模型融合方法加入其它模型,最后提升到81.2%计算量成本较低,一般数据挖掘模型先通过构建数据挖掘模型来训练得到模型再根据模型来对数据进行男女预测,计算量消耗非常大,且需要分布式编程增加了编程难度,这种方法只需要简单的公式即可实现,没有因传统的数据挖掘方法而有所约束。
3)本方法的数据模型容易理解,尤其相比较于传统的数据挖掘算法而言,本方法更为简单,很好理解,系统实现难度也更小。
本领域普通技术人员可以理解:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于游戏日志确定用户性别的方法,其特征在于,步骤包括:数据预处理:筛选游戏日志数据,对筛选出的有效数据建立统计表,所述统计表包括已知性别用户分表以及未知性别用户分表,所述已知性别用户分表和未知性别用户分表内均包括用户的IMSI数据以及每一位用户所使用的游戏名称;
统计游戏性别极性:统计所述已知性别分表中各款游戏出现的比例,得到各款游戏的性别极性G(game_i);
预测未知用户性别:遍历所述未知性别用户分表,统计每一位未知性别用户使用每一款游戏的频率P(game_i),并根据如下公式计算每一位用户的性别概率其中,n为统计表中游戏的总数量,最后根据所述每一位用户的性别概率Pgender预测对应用户的性别。
2.根据权利要求1所述基于游戏日志确定用户性别的方法,其特征在于,所述筛选游戏日志数据的步骤包括:通过业务口径,由正则表达式判断数据是否有效,筛选掉被判断为无效的数据。
3.根据权利要求1所述基于游戏日志确定用户性别的方法,其特征在于,所述统计表中的数据还包括:每一位用户使用每一款游戏的次数或频率。
4.根据权利要求1所述基于游戏日志确定用户性别的方法,其特征在于,所述已知性别用户分表仅包括男性用户的有效数据,或仅包括女性用户的有效数据。
5.根据权利要求1至4任一所述基于游戏日志确定用户性别的方法,其特征在于,所述统计游戏性别极性的步骤包括:
第一步,将所述已知性别分表中的用户随机分为两组,统计其中第一组中各款游戏出现的比例,得到各款游戏的性别极性预测值G′(game_i);
第二步,使用所述性别极性预测值G′(game_i)按照所述预测未知用户性别的方法,预测第二组中各用户的性别,并将预测的性别与所述第二组中各用户标记的性别进行比较,评估预测未知用户性别的准确度。
6.根据权利要求1至5任一所述基于游戏日志确定用户性别的方法,其特征在于,所述用户使用每一款游戏的频率P(game_i)为所述未知性别用户分表中标记的每一位用户使用每一款游戏的次数占该用户使用游戏总次数的比例。
7.根据权利要求1至6任一所述基于游戏日志确定用户性别的方法,其特征在于,还包括根据用户性别推荐游戏的步骤,具体方法为:遍历所述统计表,根据所述统计表中标记的用户性别或根据预测得到的用户性别,查询游戏目录,推送性别极性G(game_i)与对应用户相匹配的游戏。
8.根据权利要求7所述基于游戏日志确定用户性别的方法,其特征在于,所述根据用户性别推荐游戏的步骤中,推送所述游戏的顺序还根据用户使用每一种类游戏的频率进行排序,用户使用频率高的游戏种类推送时排序靠前,用户使用频率低的游戏种类推送时排序靠后。
9.一种基于游戏日志确定用户性别的系统,包括:依次顺序连接的游戏日志数据接口模块、数据预处理模块、统计表存储单元、游戏性别极性统计单元、未知用户性别预测模块;
所述游戏日志数据接口模块用于读取游戏日志数据;
所述数据预处理模块用于筛选游戏日志数据接口所读取的游戏日志数据,并对筛选出的有效数据建立统计表,将所述统计表存储于所述统计表存储单元;
所述统计表存储单元用于存储所述统计表内的数据;所述统计表包括已知性别用户分表以及未知性别用户分表,所述已知性别用户分表和未知性别用户分表内均包括用户的IMSI数据以及每一位用户所使用的游戏名称;
所述游戏性别极性统计单元用于统计所述已知性别分表中各款游戏出现的比例,并将所述比例存储为各款游戏对应的性别极性G(game_i)数据;
所述未知用户性别预测模块用于遍历所述未知性别用户分表,统计每一位未知性别用户使用每一款游戏的频率P(game_i),并根据如下公式计算每一位用户的性别概率 其中,n为统计表中游戏的总数量,最后根据所述每一位用户的性别概率Pgender预测对应用户的性别。
CN201710058275.4A 2017-01-23 2017-01-23 一种基于游戏日志确定用户性别的方法及系统 Active CN106844687B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710058275.4A CN106844687B (zh) 2017-01-23 2017-01-23 一种基于游戏日志确定用户性别的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710058275.4A CN106844687B (zh) 2017-01-23 2017-01-23 一种基于游戏日志确定用户性别的方法及系统

Publications (2)

Publication Number Publication Date
CN106844687A true CN106844687A (zh) 2017-06-13
CN106844687B CN106844687B (zh) 2021-01-01

Family

ID=59121710

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710058275.4A Active CN106844687B (zh) 2017-01-23 2017-01-23 一种基于游戏日志确定用户性别的方法及系统

Country Status (1)

Country Link
CN (1) CN106844687B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832304A (zh) * 2017-11-23 2018-03-23 珠海金山网络游戏科技有限公司 一种基于消息文本判断用户性别的方法和系统
CN109766955A (zh) * 2019-02-12 2019-05-17 深圳乐信软件技术有限公司 性别识别方法、装置、设备及存储介质
CN110895721A (zh) * 2018-09-12 2020-03-20 珠海格力电器股份有限公司 电器功能的预测方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090043720A1 (en) * 2007-08-10 2009-02-12 Microsoft Corporation Domain name statistical classification using character-based n-grams
CN102541590A (zh) * 2011-12-14 2012-07-04 奇智软件(北京)有限公司 一种软件推荐方法及推荐系统
CN104598452A (zh) * 2013-10-30 2015-05-06 北京思博途信息技术有限公司 用户性别分析方法和装置
CN104869529A (zh) * 2015-04-22 2015-08-26 惠州Tcl移动通信有限公司 一种移动终端、服务器及其信息管理方法
CN105095401A (zh) * 2015-07-07 2015-11-25 北京嘀嘀无限科技发展有限公司 一种性别识别的方法及装置
CN106203473A (zh) * 2016-06-24 2016-12-07 有米科技股份有限公司 一种基于安装包列表的移动用户性别预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090043720A1 (en) * 2007-08-10 2009-02-12 Microsoft Corporation Domain name statistical classification using character-based n-grams
CN102541590A (zh) * 2011-12-14 2012-07-04 奇智软件(北京)有限公司 一种软件推荐方法及推荐系统
CN104598452A (zh) * 2013-10-30 2015-05-06 北京思博途信息技术有限公司 用户性别分析方法和装置
CN104869529A (zh) * 2015-04-22 2015-08-26 惠州Tcl移动通信有限公司 一种移动终端、服务器及其信息管理方法
CN105095401A (zh) * 2015-07-07 2015-11-25 北京嘀嘀无限科技发展有限公司 一种性别识别的方法及装置
CN106203473A (zh) * 2016-06-24 2016-12-07 有米科技股份有限公司 一种基于安装包列表的移动用户性别预测方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832304A (zh) * 2017-11-23 2018-03-23 珠海金山网络游戏科技有限公司 一种基于消息文本判断用户性别的方法和系统
CN110895721A (zh) * 2018-09-12 2020-03-20 珠海格力电器股份有限公司 电器功能的预测方法及装置
CN109766955A (zh) * 2019-02-12 2019-05-17 深圳乐信软件技术有限公司 性别识别方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN106844687B (zh) 2021-01-01

Similar Documents

Publication Publication Date Title
KR101733458B1 (ko) 게임 로그 분석 방법
Lee et al. Game data mining competition on churn prediction and survival analysis using commercial game log data
Charles et al. Dynamic player modeling: A framework for player-centered digital games
CN108499108A (zh) 视频游戏应用程序内玩游戏参数的实时动态修改和优化
CN106844687A (zh) 一种基于游戏日志确定用户性别的方法及系统
CN108122127A (zh) 预测在线游戏服务的运行结果的方法及装置
Chen et al. Eomm: An engagement optimized matchmaking framework
CN106649396B (zh) 游戏等级数据的排序方法、系统及装置
CN106557938A (zh) 一种游戏中虚拟物品的推送方法
CN110175619A (zh) 基于机器学习模型的出牌牌组确定方法、设备及存储介质
CN107807943A (zh) 应用程序推荐方法及装置
CN110175299A (zh) 一种推荐信息确定的方法及服务器
US20210165757A1 (en) Generating segmented notifications in a virtual space
US11351464B2 (en) Automated coaching for online gaming
Banerjee et al. Joint modeling of playing time and purchase propensity in massively multiplayer online role-playing games using crossed random effects
US11642597B2 (en) Apparatus for recommending game contents based on the psychology of a game user and an operation thereof
KR101962269B1 (ko) 게임 평가 장치 및 방법
KR102186412B1 (ko) 게임 컨텐츠 제공 방법
Tyagi et al. Enhanced predictive modeling of cricket game duration using multiple machine learning algorithms
Guitart et al. Understanding player engagement and in-game purchasing behavior with ensemble learning
CN109871493A (zh) 交友匹配方法、装置、计算机设备及可读存储介质
CN110210884A (zh) 确定用户特征数据的方法、装置、计算机设备及存储介质
CN115809906A (zh) 虚拟活动推荐方法及装置
CN107832304A (zh) 一种基于消息文本判断用户性别的方法和系统
Haruna et al. Predicting the outcomes of football matches using machine learning approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant