CN116186628A - App应用自动打标方法和系统 - Google Patents

App应用自动打标方法和系统 Download PDF

Info

Publication number
CN116186628A
CN116186628A CN202310437371.5A CN202310437371A CN116186628A CN 116186628 A CN116186628 A CN 116186628A CN 202310437371 A CN202310437371 A CN 202310437371A CN 116186628 A CN116186628 A CN 116186628A
Authority
CN
China
Prior art keywords
level
decision
random forest
class
tag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310437371.5A
Other languages
English (en)
Other versions
CN116186628B (zh
Inventor
陈琪钛
朱凉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Tidong Technology Co ltd
Original Assignee
Guangzhou Tidong Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Tidong Technology Co ltd filed Critical Guangzhou Tidong Technology Co ltd
Priority to CN202310437371.5A priority Critical patent/CN116186628B/zh
Publication of CN116186628A publication Critical patent/CN116186628A/zh
Application granted granted Critical
Publication of CN116186628B publication Critical patent/CN116186628B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种APP应用自动打标方法和系统,其充分考虑APP标签各部分从笼统到精细的渐变特点,结合决策树和随机森林算法,以嵌套递进式的思路有效解决了现有技术中存在的诸多问题和麻烦,最大限度地节约了运算量,大大降低了决策失误的风险,同时还有效解决了众口难调的麻烦。

Description

APP应用自动打标方法和系统
技术领域
本发明涉及广告数据处理领域,更具体地,涉及一种APP应用自动打标方法和系统。
背景技术
现代互联网的四通八达对于广告投放而言却引发了一个重要课题,即,如何将广告标签精准投放于目标用户,从而增强广告投放的效率。
因此,现在的广告投放注重于与用户兴趣进行契合。商家往往会利用大数据来搜集用户的历史观看或点击数据,由此总结特定用户群体的兴趣爱好或关注领域,再向用户进行相关或相近内容的广告推荐,由此增加投放广告的用户点击率,从而增强商业宣传的营销效果。在广告的个性化投放过程中,广泛使用广告标签给所投放的广告进行记录,并按此获取相应的广告进行投放。
对于APP应用的推广而言,其广告标签更是在广告的个性化投放中扮演着重要的角色。精准的广告标签设定能够精确引导用户选择适合自身需求的APP应用,同时也能够让厂商迅速锁定有对应需求的客户。
然而,在APP应用如雨后春笋涌现的当今时代,如果仅靠人力对成千上万的存量APP应用进行打标,则相当费时费力。进一步,随着新推出的APP应用应接不暇,纯靠人力很难对新增APP应用做到及时和可持续地打标。同时还需要考虑到,一个APP应用的广告标签往往需要做到层次化和立体化,但纯靠人力打标很难满足这一要求。同时还需要注意到,众口难调!不同的人往往对于同一APP应用的市场定位和功能定位理解不尽相同,这就导致个人对于APP应用与标签匹配度的认知不尽一致,其设计结果也很难达成共识。在实践中,由于打标不精确、打标过于笼统、打标过于精细导致设计出的APP应用广告标签被业务方否定的案例比比皆是。
发明内容
本发明所提供的应用类产品自动打标方法巧妙利用决策树和随机森林算法,同时考虑到APP标签各部分从笼统到精细的渐变特点,有效解决了上述技术问题。
具体而言,本发明提供一种APP应用自动打标系统,所述系统包括:采样模块,该采样模块通过APP应用商店采集多个样本形成总采样样本集合,所述总采样样本集合根据样本特征进行N级分类,N≥2,所述总采样样本集合分类成多个第一级子集,每个第一级子集再分成多个第二级子集,以此类推,直至每个第N-1级子集分成多个第N级子集;决策模块,针对新APP应用执行第一级随机森林决策,在所述多个第一级子集中,确定所述新APP应用的第一级标签,并获取第一级标签词向量;比较模块,将来自新APP应用的业务方的标签描述提炼成标签描述词向量,将第一级标签词向量与标签描述词向量匹配来计算第一级向量内积值,如第一级向量内积值大于第一满意值,则所述系统终止运行;如第一级向量内积值小于第二满意值,则系统重新调用决策模块执行第一级随机森林决策; 如第一级向量内积值处于第一满意值和第二满意值之间,则调用决策模块针对第一级标签所限定的第二级子集执行第二级随机森林决策,再调用比较模块求出第二级随机森林决策下的第二级向量内积值并将其与第一满意值和第二满意值分别比较,一旦第二级向量内积值处于第一满意值和第二满意值之间,则针对下一级子集执行下一级随机森林决策,以此类推,直至在第k级随机森林决策下的第k级向量内积值大于第一满意值,则所述系统终结运行,其中,2≤k≤N。
优选地,在对所述新APP应用执行第一级随机森林决策时,针对每个第一级子集形成第一级决策树,所有第一级决策树共同构成第一级随机森林,每棵第一级决策树根据各自的决策参数进行裂解,在第一级随机森林下,按照多棵树分类器投票决定分类结果,由此确定所述新APP应用的第一级标签。
优选地,在对所述新APP应用执行第二级随机森林决策时,针对所述第一级标签所限定的每个第二级子集形成第二级决策树,所有第二级决策树共同构成第二级随机森林,每棵第二级决策树根据各自的决策参数进行裂解,在第二级随机森林下,按照多棵树分类器投票决定分类结果,由此确定所述新APP应用的第二级标签。
优选地,所述样本特征包括样本描述文本中的词汇和句子结构、受众群体年龄、评分发布。
优选地,所述第一级子集至第N级子集中的每一个子集进一步被划分为一层分类或多层分类。
优选地,所述新APP应用为一款名为“答题闯关王”的游戏益智类APP应用。
优选地,第一级子集被划分为两层分类,上层分类包括“休闲”类、“生活”类、“工具”类,其中“休闲”类在下层分类中被进一步分类为“游戏”类、“论坛”类、“旅游”类,通过第一级随机森林决策的执行,“答题闯关王”被赋予“休闲-游戏”的第一级标签。
优选地,第二级子集只有一层,该层分类为“格斗”类、“益智类”、“桌游类”,通过第二级碎浆机森林决策的执行,“答题闯关王”被赋予“休闲-游戏-益智”的第二级标签。
本发明还提供一种利用如上文所述的APP应用自动打标系统来执行的APP应用自动打标方法。
本发明所提供的应用类产品自动打标方法和系统考虑到APP标签各部分从笼统到精细的渐变特点,结合决策树和随机森林算法,以嵌套递进式的思路有效解决了现有技术中存在的诸多问题和麻烦,最大限度地节约了运算量,大大降低了决策失误的风险,同时还有效解决了众口难调的麻烦。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,以下将对实施例或现有技术描述中所需要使用的附图进行论述,显然,在结合附图进行描述的技术方案仅仅是本发明的一些实施例,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图所示实施例得到其它的实施例及其附图。
图1示出了根据本发明实施例的APP应用自动打标系统的流程图。
图2示出了根据本发明实施例中的总采样样本集合的一个案例的表格示意图。
图3示出了图2所示案例中的一个子集的分布。
图4示出了图2所示案例中的另一子集的分布。
图5示出了图2所示案例中又一子集的分布。
具体实施方式
以下将结合附图对本发明各实施例的技术方案进行清楚完整描述,显然,所描述的实施例仅为本发明的一部分实施例,而不是全部实施例。基于本发明中所述的实施例,本领域普通技术人员在不需要创造性劳动的前提下所得到的所有其它实施例,都在本发明所保护的范围内。
本发明所提供的APP应用自动打标方法和系统考虑到APP标签各部分从笼统到精细的渐变特点,结合决策树和随机森林算法,以嵌套递进式的思路有效解决了现有技术中存在的诸多问题和麻烦。
下文将结合附图详细描述根据本发明实施例的应用类产品自动打标方法。
图1示出了根据本发明实施例的APP应用自动打标系统的流程图。
图1中的流程图开始启动之后,首先进入样本采集步骤,在采样模块中通过已有APP应用商店(例如,AppMagic、Google应用商店等等)选取多个典型样本形成总采样样本集合,该集合中样本特征数为M,可包括样本各自对应的描述文本中的词汇和句子结构、受众群体年龄、评分发布等等。
举例而言,总采样样本集合可分布归类如图2所示。图2示出了根据本发明实施例中的总采样样本集合的一个案例的表格示意图。
以图2为例,总采样样本集合中所包含的多个采样样本可多级分类,每一级分类又可包括一层或多层分类。例如,如图2所示,第一级分类包括两层分类,而第二级和第三级均只有一层分类。
需要说明的是,此处为了节约篇幅以及描述方便,总采样样本集合仅仅分为了三类,即,“休闲”类、“生活”类、“工具”类。然而,鉴于当今APP应用层出不穷,实际上的类别将远不止上述三类。
另外,上表中引号内的每个词不仅可以理解为类别名,还可以理解为所考察的APP应用中的标签的一部分。可以提前剧透的是,在整篇说明书的示例中,我们列举了一款名为“答题闯关王”的APP应用,通过本发明的打标方法,其最终的标签设定为“休闲-游戏-益智-智力问答”。
接下来,利用系统中的决策模块执行第一级随机森林决策,其中,总采样样本集合在第一级中第划分成多个第一级子集,每一个第一级子集根据第一级中的层级关系生成对应的训练集,每一个训练集形成对应的决策树模型。换言之,第一级中分出多少种类,就意味着形成了多少棵决策树模型。这些决策树模型共同构成了第一级随机森林。
承接上例,在实例中,总采样样本集合根据第一级中第一层分类划分成“休闲”类子集、“生活”类子集、“工具”类子集,每一个子集均根据第一级中的层级关系生成对应的训练集,每一个训练集形成对应的决策树模型。换言之,由此生成了“休闲”类决策树、“生活”类决策树、“工具”类决策树这三种决策树模型。这三棵决策树共同组成了第一级随机森林。
其中,“休闲”类子集所构成的“休闲”类决策树结构如图3所示。图3示出了图2所示案例中的子集分布。
当然,图3所示仅是示例,实际中的休闲类APP绝不止分为上述三类,此处分为三类仅为描述方便并节约篇幅。
类似地,“生活”类子集所构成的“生活”类决策树结构如图4所示。
还类似地,“工具”类子集所构成的“工具”类决策树结构如图5所示。
对于第一级中每一个决策树模型,各自分裂时根据各自的最优信息增益或者最优信息增益比或者最优基尼系数等参数选择各自的特征进行裂解。
由此,第一级随机森林下的每棵决策树均可进行决策运行。在对新APP应用执行第一级随机森林决策时,在第一级随机森林下,按照多棵树分类器投票决定分类结果,即,所述新APP应用的第一级标签,进而基于该第一级标签获取第一级标签词向量。
在上述示例中,新APP应用为“答题闯关王”APP应用,上述第一级随机森林下最终多棵树分类器投票决定,其分类应该在“休闲”类的决策树下,对应的第一级标签应为“休闲-游戏”。
随后,将第一级随机森林下决定的第一级标签(例如上述“答题闯关王”APP应用的第一级标签“休闲-游戏”)发送给业务方评判。正如“背景技术”章节所言,众口难调,业务方对于该第一级标签的态度可能存在三种可能:
1、如果业务方满意该第一级标签(例如认为“休闲-游戏”这一标签已足够满足当前APP应用所需),则针对该APP应用的打标流程终止,该APP应用被正式赋予该第一级标签;
2、如果业务方不认同第一级标签,坚持认为该标签存在打标错误(例如认为“休闲-游戏”这一标签完全不适合于“答题闯关王”APP应用),则重新设定新的信息增益、信息增益比、基尼系数等决策参数对于第一级随机森林的各个决策树进行重新裂解,进而由多棵树分类器进行重新投票决定新的第一级标签;
3、如果业务方认同第一级标签,但认为该标签的精确度不够,则进入下一级随机森林(即,第二级随机森林),如下文所述。
上述判断可以在比较模块中得以技术性地实现。业务方可以对所述新APP应用进行标签描述,由此将这种标签描述提炼成标签描述词向量。由此,考察标签描述词向量与上述第一级标签词向量之间的向量距离(用两个向量的运算内积值表示),就可以从数据上反映出业务方对于第一级标签的认同度。
在上文中可见,业务方对于第一级标签可能存在三种不同的认同度,即,完全认同、认同但精确度不足、完全不认同,由此就可以在数学上设定针对向量内积值的两个满意值指标,第一满意值代表业务方完全认同的临界值,第二满意值代表业务方完全不认同的临界值。而“认同但精确度不足”则是“完全认同”和“完全不认同”的中间态,因此处于第一满意值和第二满意值之间。
因此,比较模块在计算求出第一级标签词向量与标签描述词向量匹配所得的第一级向量内积值之后,可以将该第一级向量内积值与第一满意值和第二满意值分别比较,如若第一级向量内积值大于第一满意值,则表明业务方高度认同,系统就此终止,以第一级标签作为新APP应用的最终标签。如若第一级向量内积值小于第二满意值,则系统重新调用决策模块执行第一级随机森林决策。如若第一级向量内积值处于第一满意值和第二满意值之间,则决策模块针对下一级子集执行下一级随机森林决策,此处的下一级随机森林决策自然为第二级随机森林决策。
第二级随机森林决策所考察的第二级子集由第一级标签所限定。因此,在上述示例中,第二级子集是总采样样本集合中处于“休闲”类-“游戏”类限定下分出的原采样样本的集合。
第二级子集仍可进一步进行自身的层级分类,形成多个第二级决策树。这些第二级决策树共同构成了第二级随机森林。
承接上述示例,在第一级标签限定下,第二级子集为“休闲-游戏”类下的样本集合。由此,第二级随机森林例如包含三个第二级决策树:
1、游戏类à格斗类;
2、游戏类à益智类;
3、游戏类à桌游类。
接下来执行与第一级随机森林决策在操作步骤上完全相同的第二级随机森林决策。换言之,第二级随机森林决策仅仅是在决策对象上与上述第一级随机森林决策不同,即,第二级随机森林决策的决策对象是第二级决策树,而第一级随机森林决策的决策对象是第一级决策树。
承接上例,“答题闯关王”APP应用在第二级随机森林决策下决定的第二级标签为“休闲-游戏-益智”。第二级标签再次由业务方来评判,与上文所述的针对第一级标签的态度类似,无非如下三种情况:
1、完全满意,打标流程终止,该APP应用被正式赋予该第二级标签;
2、完全不认同,则在第二级随机森林决策中重新调整决策参数,重新选定新的第二级标签;
3、如果业务方认同第一级标签,但认为该标签的精确度不够,则进入下一级随机森林(即,第三级随机森林),如下文所述。
与上文在第一级随机森林决策向第二级随机森林决策过渡类似,在第二级随机森林决策向第三级随机森林决策过渡时,再次调用比较模块,第二级随机森林决策下的第二级向量内积值与第一满意值和第二满意值分别比较,一旦第二级向量内积值大于第一满意值,则表明业务方高度认同,系统就此终止,以第二级标签作为新APP应用的最终标签。如若第二级向量内积值小于第二满意值,则系统重新调用决策模块执行第二级随机森林决策。如若第二级向量内积值处于第一满意值和第二满意值之间,则决策模块针对下一级子集执行下一级随机森林决策,此处的下一级随机森林决策为第三级随机森林决策。
如果业务方最终接受了第三级随机森林的决策,则上例中“答题闯关王”APP应用最终确定的标签为“休闲-游戏-益智-智力问答”(如图2所列)。
当然,如果业务方依然认为第三级随机森立的决策不够精确,则仍然可以求助于更低一级随机森林决策,逐级递进,最终终能在随后的某一级随机森立决策中获得业务方满意的标签。
如上文所述,本发明所提供的应用类产品自动打标方法,考虑到APP标签各部分从笼统到精细的渐变特点,结合决策树和随机森林算法,以嵌套递进式的思路进行最终标签的确定。
或许有人有疑问,何以上述方案需要考虑分级嵌套递进的思路来实现标签确定?如果不考虑分级,而是将决策树逐级全部展开,在判定标签时,在全面的随机森林决策中,休闲类、生活类、工具类三个方向均要全面展开直至最低级,各自形成繁杂的决策树,在对任何一个APP应用进行打标时,就需要遍历这些决策树的所有节点,其运算量很可能是海量的。更何况,实际操作中,很可能需要遍历的远不止休闲类、生活类、工具类这三大类,面对种类繁多的决策树,其运算量更可能是天文数字。
而本发明的分级嵌套思路则不同,在上文示例中,第一级随机森林决策就已经迅速排除了生活类和工具类这两个旁支(而不需要再深究这两个旁支的下级决策树),其后在第二级随机森林决策中在“休闲类”下又排除了“论坛类”和“旅游类”两个旁支,只考察“游戏类”,这又大大减少了潜在的第三级随机森林决策的运算量。换言之,在本发明中,上级随机森林决策的推进均为潜在的下级随机森林决策节约了大量的运算量。
同时还需要注意到,本发明的这种分级随机森林决策可大大降低决策失误引发的不利影响。在进入第二级随机森林决策后,就意味着业务方实际已经认可了第一级随机森林决策所判定的标签,于是,即使第二级随机森林决策判定的标签“益智”得不到业务方的认可,也只需要调整第二级随机森林决策的判定参数,而无须调整第一级随机森林决策获得的标签—“休闲-游戏”。同样的道理,如果第三级随机森林决策得不到业务方认可,也无需改变第一级和第二级随机森林决策所判定的标签。
进一步,本发明在极大节约运算量且降低决策失误风险的情况下,还有效地解决了“背景技术”章节所言的对于标签的众口难调的麻烦。如上文所述,每一级随机森林决策结束之后均留给了业务方三个选项供其选择,完全满意则结束,完全反对则本级调整,不够精确则进入下一级,如此一来,业务方总能在某一级随机森林决策结束后获得最终满意的标签。
以上所述仅为本发明的示例性实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (9)

1.一种APP应用自动打标系统,其特征在于,所述系统包括:
采样模块,该采样模块通过APP应用商店采集多个样本形成总采样样本集合,所述总采样样本集合根据样本特征进行N级分类,N≥2,所述总采样样本集合分类成多个第一级子集,每个第一级子集再分成多个第二级子集,以此类推,直至每个第N-1级子集分成多个第N级子集;
决策模块,针对新APP应用执行第一级随机森林决策,在所述多个第一级子集中,确定所述新APP应用的第一级标签,并获取第一级标签词向量;
比较模块,将来自新APP应用的业务方的标签描述提炼成标签描述词向量,将第一级标签词向量与标签描述词向量匹配来计算第一级向量内积值,
如第一级向量内积值大于第一满意值,则所述系统终止运行;如第一级向量内积值小于第二满意值,则系统重新调用决策模块执行第一级随机森林决策;
如第一级向量内积值处于第一满意值和第二满意值之间,则调用决策模块针对第一级标签所限定的第二级子集执行第二级随机森林决策,
再调用比较模块求出第二级随机森林决策下的第二级向量内积值并将其与第一满意值和第二满意值分别比较,一旦第二级向量内积值处于第一满意值和第二满意值之间,则针对下一级子集执行下一级随机森林决策,以此类推,直至在第k级随机森林决策下的第k级向量内积值大于第一满意值,则所述系统终结运行,其中,2≤k≤N。
2.根据权利要求1所述的系统,其特征在于,在对所述新APP应用执行第一级随机森林决策时,针对每个第一级子集形成第一级决策树,所有第一级决策树共同构成第一级随机森林,每棵第一级决策树根据各自的决策参数进行裂解,在第一级随机森林下,按照多棵树分类器投票决定分类结果,由此确定所述新APP应用的第一级标签。
3.根据权利要求1或2所述的系统,其特征在于,在对所述新APP应用执行第二级随机森林决策时,针对所述第一级标签所限定的每个第二级子集形成第二级决策树,所有第二级决策树共同构成第二级随机森林,每棵第二级决策树根据各自的决策参数进行裂解,在第二级随机森林下,按照多棵树分类器投票决定分类结果,由此确定所述新APP应用的第二级标签。
4.根据权利要求1所述的系统,其特征在于,所述样本特征包括样本描述文本中的词汇和句子结构、受众群体年龄、评分发布。
5.根据权利要求1所述的系统,其特征在于,所述第一级子集至第N级子集中的每一个子集进一步被划分为一层分类或多层分类。
6.根据权利要求1所述的系统,其特征在于,所述新APP应用为一款名为“答题闯关王”的游戏益智类APP应用。
7.根据权利要求6所述的系统,其特征在于,第一级子集被划分为两层分类,上层分类包括“休闲”类、“生活”类、“工具”类,其中“休闲”类在下层分类中被进一步分类为“游戏”类、“论坛”类、“旅游”类,通过第一级随机森林决策的执行,“答题闯关王”被赋予“休闲-游戏”的第一级标签。
8.根据权利要求7所述的系统,其特征在于,第二级子集只有一层,该层分类为“格斗”类、“益智类”、“桌游类”,通过第二级碎浆机森林决策的执行,“答题闯关王”被赋予“休闲-游戏-益智”的第二级标签。
9.一种利用如权利要求1-8中任一项所述的APP应用自动打标系统来执行的APP应用自动打标方法。
CN202310437371.5A 2023-04-23 2023-04-23 App应用自动打标方法和系统 Active CN116186628B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310437371.5A CN116186628B (zh) 2023-04-23 2023-04-23 App应用自动打标方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310437371.5A CN116186628B (zh) 2023-04-23 2023-04-23 App应用自动打标方法和系统

Publications (2)

Publication Number Publication Date
CN116186628A true CN116186628A (zh) 2023-05-30
CN116186628B CN116186628B (zh) 2023-07-07

Family

ID=86434756

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310437371.5A Active CN116186628B (zh) 2023-04-23 2023-04-23 App应用自动打标方法和系统

Country Status (1)

Country Link
CN (1) CN116186628B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180176242A1 (en) * 2015-06-02 2018-06-21 Nippon Telegraph And Telephone Corporation Access classifying device, access classifying method, and access classifying program
US20180268015A1 (en) * 2015-09-02 2018-09-20 Sasha Sugaberry Method and apparatus for locating errors in documents via database queries, similarity-based information retrieval and modeling the errors for error resolution
CN108647829A (zh) * 2018-05-16 2018-10-12 河海大学 一种基于随机森林的梯级水电站群联合调度规则提取方法
CN108875781A (zh) * 2018-05-07 2018-11-23 腾讯科技(深圳)有限公司 一种标签分类方法、装置、电子设备及存储介质
US20190034834A1 (en) * 2016-03-31 2019-01-31 Alibaba Group Holding Limited Method and apparatus for training model based on random forest
US20190102337A1 (en) * 2017-10-02 2019-04-04 Cisco Technology, Inc. Scalable training of random forests for high precise malware detection
CN109670182A (zh) * 2018-12-21 2019-04-23 合肥工业大学 一种基于文本哈希向量化表示的海量极短文本分类方法
US20190297092A1 (en) * 2016-06-17 2019-09-26 Nippon Telegraph And Telephone Corporation Access classification device, access classification method, and recording medium
CN110727864A (zh) * 2019-09-27 2020-01-24 浙江大学 一种基于手机App安装列表的用户画像方法
CN110737811A (zh) * 2019-10-25 2020-01-31 腾讯科技(深圳)有限公司 应用分类方法、装置以及相关设备
CN114297393A (zh) * 2022-01-13 2022-04-08 东北电力大学 融合多元文本信息和报告意图的软件缺陷报告分类方法
CN114595451A (zh) * 2022-02-22 2022-06-07 北京亚鸿世纪科技发展有限公司 基于图卷积的安卓恶意应用分类方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180176242A1 (en) * 2015-06-02 2018-06-21 Nippon Telegraph And Telephone Corporation Access classifying device, access classifying method, and access classifying program
US20180268015A1 (en) * 2015-09-02 2018-09-20 Sasha Sugaberry Method and apparatus for locating errors in documents via database queries, similarity-based information retrieval and modeling the errors for error resolution
US20190034834A1 (en) * 2016-03-31 2019-01-31 Alibaba Group Holding Limited Method and apparatus for training model based on random forest
US20190297092A1 (en) * 2016-06-17 2019-09-26 Nippon Telegraph And Telephone Corporation Access classification device, access classification method, and recording medium
US20190102337A1 (en) * 2017-10-02 2019-04-04 Cisco Technology, Inc. Scalable training of random forests for high precise malware detection
CN108875781A (zh) * 2018-05-07 2018-11-23 腾讯科技(深圳)有限公司 一种标签分类方法、装置、电子设备及存储介质
CN108647829A (zh) * 2018-05-16 2018-10-12 河海大学 一种基于随机森林的梯级水电站群联合调度规则提取方法
CN109670182A (zh) * 2018-12-21 2019-04-23 合肥工业大学 一种基于文本哈希向量化表示的海量极短文本分类方法
CN110727864A (zh) * 2019-09-27 2020-01-24 浙江大学 一种基于手机App安装列表的用户画像方法
CN110737811A (zh) * 2019-10-25 2020-01-31 腾讯科技(深圳)有限公司 应用分类方法、装置以及相关设备
CN114297393A (zh) * 2022-01-13 2022-04-08 东北电力大学 融合多元文本信息和报告意图的软件缺陷报告分类方法
CN114595451A (zh) * 2022-02-22 2022-06-07 北京亚鸿世纪科技发展有限公司 基于图卷积的安卓恶意应用分类方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
MASOUD REYHANI HAMEDANI,ET AL: "AndroClass: An Effective Method to Classify Android Applications by Applying Deep Neural Networks to Comprehensive Features", WIRELESS COMMUNICATIONS AND MOBILE COMPUTING 19, pages 1 - 22 *
姜海涛,等: "一种混合的Android恶意应用检测方法", 计算机应用研究, no. 06, pages 192 - 194 *
戴春博,等: "基于分类算法的软件缺陷原因分析", 计算机工程与设计, no. 12, pages 191 - 196 *
陈铁明,等: "一种基于多视图协同学习的App分类方法", 浙江工业大学学报, no. 06, pages 5 - 11 *
齐林,等: "基于静态分析的虚假安卓APP分析与检测", 通信技术, no. 12, pages 204 - 209 *

Also Published As

Publication number Publication date
CN116186628B (zh) 2023-07-07

Similar Documents

Publication Publication Date Title
Dieber et al. Why model why? Assessing the strengths and limitations of LIME
CN106503805B (zh) 一种基于机器学习的双模态人人对话情感分析方法
CN110532379B (zh) 一种基于lstm的用户评论情感分析的电子资讯推荐方法
CN110175227B (zh) 一种基于组队学习和层级推理的对话辅助系统
CN109189901B (zh) 一种智能客服系统中自动发现新分类以及对应语料的方法
CN112346567B (zh) 基于ai的虚拟交互模型生成方法、装置及计算机设备
CN109165294B (zh) 一种基于贝叶斯分类的短文本分类方法
CN108920544A (zh) 一种基于知识图谱的个性化职位推荐方法
CN109308319B (zh) 文本分类方法、文本分类装置和计算机可读存储介质
CN109492101A (zh) 基于标签信息与文本特征的文本分类方法、系统及介质
CN112100383A (zh) 一种面向多任务语言模型的元-知识微调方法及平台
CN111368075A (zh) 文章质量预测方法、装置、电子设备及存储介质
CN110990683B (zh) 一种基于地域与情感特征的微博谣言集成识别方法及装置
CN107368521B (zh) 一种基于大数据和深度学习的知识推介方法及系统
CN110377727A (zh) 一种基于多任务学习的多标签文本分类方法和装置
CN110717090A (zh) 一种旅游景点网络口碑评价方法、系统及电子设备
CN115630843A (zh) 合同条款自动审核方法及系统
CN110765266A (zh) 一种裁判文书相似争议焦点合并方法及系统
CN117474507A (zh) 一种基于大数据应用技术的智能招聘匹配方法及系统
CN116882414B (zh) 基于大规模语言模型的评语自动生成方法及相关装置
CN111583363B (zh) 一种图文新闻的视觉自动生成方法及系统
CN116186628B (zh) App应用自动打标方法和系统
CN114586038A (zh) 事件抽取和抽取模型训练的方法和装置、设备、介质
CN112101559B (zh) 一种基于机器学习的案件罪名推断方法
CN114372148A (zh) 一种基于知识图谱技术的数据处理方法及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant