CN110223042B - 面向海量数据的评估方法 - Google Patents

面向海量数据的评估方法 Download PDF

Info

Publication number
CN110223042B
CN110223042B CN201910497722.5A CN201910497722A CN110223042B CN 110223042 B CN110223042 B CN 110223042B CN 201910497722 A CN201910497722 A CN 201910497722A CN 110223042 B CN110223042 B CN 110223042B
Authority
CN
China
Prior art keywords
model
quality
evaluation
models
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910497722.5A
Other languages
English (en)
Other versions
CN110223042A (zh
Inventor
徐兴军
吴又
杨宇航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Cloud Hollywood Culture Media Co Ltd
Original Assignee
Beijing Cloud Hollywood Culture Media Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Cloud Hollywood Culture Media Co Ltd filed Critical Beijing Cloud Hollywood Culture Media Co Ltd
Priority to CN201910497722.5A priority Critical patent/CN110223042B/zh
Publication of CN110223042A publication Critical patent/CN110223042A/zh
Application granted granted Critical
Publication of CN110223042B publication Critical patent/CN110223042B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services; Handling legal documents
    • G06Q50/184Intellectual property management

Abstract

本申请属于人工智能技术领域,进一步地,是涉及面向海量数据的评估方法,包括用于评估海量数据的多个特征、用于评估所述特征的模型和模型使用策略,所述多个特征包括用于评估的所述海量数据的多个不同方面,所述模型使用策略包括:并联模型和级联模型。本申请可有效解决专业人员审核的成本极高,且相对于千万量级的新版权,专业人员能够处理的数量极为有限;此外千万量级的新版权分配至用户试读,会造成极大的用户伤害,即无法在千万量级的正文发现优质的新版权,从而无法发现优质作者等问题。

Description

面向海量数据的评估方法
技术领域
本申请属于人工智能技术领域,进一步地,是涉及面向海量数据的评估方法。
背景技术
目前发现优质版权的主要路径为:成名作者的新版权;专业人员的人工评审,如出版公司的图书策划人员、影视公司的项目开发人员,有相当一部分精力放在发现优质版权上;海量用户的试读,如各种网文站点,会分配一部分流量给新网文,再根据后继的阅读深度、口碑等决定该版权的流量分配额度。但专业人员审核的成本极高,且相对于千万量级的新版权,专业人员能够处理的数量极为有限;此外千万量级的新版权分配至用户试读,会造成极大的用户伤害,即无法在千万量级的正文发现优质的新版权,从而无法发现优质作者。
发明内容
本申请解决的主要问题是提供版权的多粒度拆分及其商业价值的挖掘方法,以解决专业人员审核的成本极高,且相对于千万量级的新版权,专业人员能够处理的数量极为有限;此外千万量级的新版权分配至用户试读,会造成极大的用户伤害,即无法在千万量级的正文发现优质的新版权,从而无法发现优质作者等问题。
面向海量数据的评估方法,包括用于评估海量数据的多个特征、用于评估所述特征的模型和模型使用策略,所述多个特征包括用于评估的所述海量数据的多个不同方面,所述模型使用策略包括:并联模型,使用多个所述模型的运算简单和耗时少的简单模型对多个特征进行评估,综合多个简单模型的优缺点得出对所述多个特征的初步评估结果;级联模型,根据所述并联模型得出的所述初步评估结果进行筛选,删除明显不符合规定的版权,然后使用多个所述模型的运算复杂和耗时多的复杂模型对筛选后的特征进行细致计算得出最终的精确结论和针对所述用于评估的海量数据的多个特征的多个不同方面的实时的评估报告。
进一步地,所述模型包括底层模型和综合判定模型。
进一步地,所述底层模型包括语言模型、场景模型、人物模型和关系模型。
进一步地,所述语言模型负责对整体的文字质量打分,其输出分值作为综合判定模型的输入。
进一步地,所述场景模型负责对版权中各个场景质量进行打分,将所述场景模型的输出作为综合判定模型的输入。
进一步地,所述人物模型负责对版权中主要人物进行打分,将所述人物模型的输出作为综合判定模型的输入。
进一步地,所述关系模型负责对版权中主要人物关系进行打分,将所述关系模型的输出作为综合判定模型的输入。
进一步地,所述综合判定模型根据底层模型输入制定质量判断规则。
进一步地,所述综合判定模型基于机器学习模型学习质量判断模型。
本申请的有益效果:
(1)可以实现面向千万量级的正文发现优质的新版权。本申请中的并联模型使用较为运算简单耗时短的模型来进行快速的版权质量判断,筛选出明显不符合规定要求的版权,从而筛选出较为符合规定要求的版权,并联模型中使用到的运算简单耗时短的模型更加适合运用到粗筛选中,因此在对筛选出来的较为符合规定要求的版权实施级联模型。因为级联模型使用到的用于评估的模型计算较为全面,所以运算较为复杂,耗时久,与此同时得出的结果也较并联模型中计算出的结果准确,因此如果直接用于千万量级的文章一方面会出现计算过程较长,另一方面对一些明显不符合规范要求的版权进行运算复杂耗时久的运算不仅浪费资源还加长了运算时间,因此选用并联模型后进行级联模型可以节省运算资源,缩短运算时间,从而使得本申请可以运用到千万量级的版权中。
(2)可以在发现优质的新版权后发现优质的新作者。现有技术中专业人员审核的成本极高,且相对于千万量级的新版权,专业人员能够处理的数量极为有限;此外千万量级的新版权分配至用户试读,会造成极大的用户伤害,因为本申请可以做到千万量级的正文发现优质的新版权,因此可以实现通过所发现的优质新版权发现优质的新作者,从而弥补本领域中缺少优质作者的缺点。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面对本发明的具体实施方式做详细的说明、在下面的描述中阐述了很多具体细节以便与充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。
面向海量数据的评估方法,包括用于评估海量数据的多个特征、用于评估所述特征的模型和模型使用策略,所述多个特征包括用于评估的所述海量数据的多个不同方面,所述模型使用策略包括:并联模型,使用多个所述模型的运算简单和耗时少的简单模型对多个特征进行评估,综合多个简单模型的优缺点得出对所述多个特征的初步评估结果;级联模型,根据所述并联模型得出的所述初步评估结果进行筛选,删除明显不符合规定的版权,然后使用多个所述模型的运算复杂和耗时多的复杂模型对筛选后的特征进行细致计算得出最终的精确结论和针对所述用于评估的海量数据的多个特征的多个不同方面的实时的评估报告。
进一步地,所述模型包括底层模型和综合判定模型。
进一步地,所述底层模型包括语言模型、场景模型、人物模型和关系模型。
进一步地,所述语言模型负责对整体的文字质量打分,其输出分值作为综合判定模型的输入。
进一步地,所述场景模型负责对版权中各个场景质量进行打分,将所述场景模型的输出作为综合判定模型的输入。
进一步地,所述人物模型负责对版权中主要人物进行打分,将所述人物模型的输出作为综合判定模型的输入。
进一步地,所述关系模型负责对版权中主要人物关系进行打分,将所述关系模型的输出作为综合判定模型的输入。
进一步地,所述综合判定模型根据底层模型输入制定质量判断规则。
进一步地,所述综合判定模型基于机器学习模型学习质量判断模型。

Claims (3)

1.面向海量数据的评估方法,包括用于评估海量版权数据的多个特征、用于评估所述特征的模型和模型使用策略,其特征在于,所述多个特征包括用于评估的所述海量版权数据的多个不同方面;
所述模型包括底层模型和综合判定模型,所述底层模型包括语言模型、场景模型、人物模型和关系模型;所述语言模型负责对整体的文字质量打分,其输出分值作为综合判定模型的输入;所述场景模型负责对版权中各个场景质量进行打分,将所述场景模型的输出作为综合判定模型的输入;所述人物模型负责对版权中主要人物进行打分,将所述人物模型的输出作为综合判定模型的输入;所述关系模型负责对版权中主要人物关系进行打分,将所述关系模型的输出作为综合判定模型的输入;
所述模型使用策略包括:
并联模型,使用多个所述模型的运算简单和耗时少的简单模型对多个特征进行评估,综合多个简单模型的优缺点得出对所述多个特征的初步评估结果;
级联模型,根据所述并联模型得出的所述初步评估结果进行筛选,删除明显不符合规定的版权,然后使用多个所述模型的运算复杂和耗时多的复杂模型对筛选后的特征进行细致计算得出最终的精确结论和针对所述用于评估的海量版权数据的多个特征的多个不同方面的实时的评估报告。
2.根据权利要求1所述的面向海量数据的评估方法,其特征在于,所述综合判定模型根据底层模型输入制定质量判断规则。
3.根据权利要求1所述的面向海量数据的评估方法,其特征在于,所述综合判定模型基于机器学习模型学习质量判断模型。
CN201910497722.5A 2019-06-10 2019-06-10 面向海量数据的评估方法 Expired - Fee Related CN110223042B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910497722.5A CN110223042B (zh) 2019-06-10 2019-06-10 面向海量数据的评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910497722.5A CN110223042B (zh) 2019-06-10 2019-06-10 面向海量数据的评估方法

Publications (2)

Publication Number Publication Date
CN110223042A CN110223042A (zh) 2019-09-10
CN110223042B true CN110223042B (zh) 2020-01-14

Family

ID=67816207

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910497722.5A Expired - Fee Related CN110223042B (zh) 2019-06-10 2019-06-10 面向海量数据的评估方法

Country Status (1)

Country Link
CN (1) CN110223042B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314453A (zh) * 2010-06-30 2012-01-11 百度在线网络技术(北京)有限公司 高质量版本的筛选方法及系统
CN103544170A (zh) * 2012-07-12 2014-01-29 百度在线网络技术(北京)有限公司 浏览质量的评估方法及装置
CN109829907A (zh) * 2019-01-31 2019-05-31 浙江工业大学 一种基于深度学习的金属轴表面缺陷识别方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9697562B2 (en) * 2013-06-07 2017-07-04 International Business Machines Corporation Resource provisioning for electronic books
CN104166716B (zh) * 2014-08-15 2018-12-07 华为技术有限公司 一种评估媒体文件的方法及装置
CN107292775A (zh) * 2016-06-08 2017-10-24 北京知果科技有限公司 一种知识产权服务系统及其实现方法
CN108074115A (zh) * 2016-11-11 2018-05-25 上海文化广播影视集团有限公司 一种电视节目版权价值评估系统及其评估方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314453A (zh) * 2010-06-30 2012-01-11 百度在线网络技术(北京)有限公司 高质量版本的筛选方法及系统
CN103544170A (zh) * 2012-07-12 2014-01-29 百度在线网络技术(北京)有限公司 浏览质量的评估方法及装置
CN109829907A (zh) * 2019-01-31 2019-05-31 浙江工业大学 一种基于深度学习的金属轴表面缺陷识别方法

Also Published As

Publication number Publication date
CN110223042A (zh) 2019-09-10

Similar Documents

Publication Publication Date Title
Lombardi et al. The digital transformation of corporate reporting–a systematic literature review and avenues for future research
Long et al. Co-evolutionary simulation study of multiple stakeholders in the take-out waste recycling industry chain
Ervasti et al. A global, comprehensive review of literature related to paper recycling: A pressing need for a uniform system of terms and definitions
CN111967721A (zh) 一种综合能源系统绿色化水平评价方法及系统
Wang et al. Does green financial reform pilot policy promote green technology innovation? Empirical evidence from China
CN106156257A (zh) 一种微博舆情事件的态势预测方法
CN103246603A (zh) 一种缺陷跟踪系统的软件缺陷报告自动分发方法
Walther New public management: the right way to modernize and improve public services?
CN107885714A (zh) 一种基于大数据的在线备课的方法
Huang et al. Assessing the impact of energy-saving R&D on China’s energy consumption: evidence from dynamic spatial panel model
Weijie Research and application of mechanical product design process based on QFD and TRIZ integration
CN110223042B (zh) 面向海量数据的评估方法
Li et al. Urban weight and its driving forces: A case study of Beijing
Shinkevich et al. A dynamic model of the impact of engineering services on the parameters of the economic system
Keena et al. Circular Economy Design towards Zero Waste: Laying the foundation for constructive stakeholder engagement on improving construction, renovation, and demolition (CRD) waste management
Yahyaoui Does the interaction between ICT diffusion and economic growth reduce CO2 emissions? An ARDL approach
CN109670760A (zh) 一种大数据人力资源管理方法
Isaac et al. Application of house of quality matrix to material selection for engineering designs
Hao et al. The supervision mechanism of residents’ waste separation behavior: analysis using a tripartite evolutionary game model
Nambiar et al. Performance evaluation and benchmarking, traditional to big data to Internet of Things
Nicolescu Guide for the international transfer of managerial know-how
Mol Environmental reform in modernizing China
Loizidou et al. DeCyDe: a participatory method for “measuring” sustainability through a friendly, flexible and adjustable [self-assessment?] tool
Li Data mining model of english translation teaching based on virtual reality technology
Li et al. Research on the applications of information technology in sport management

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200114

CF01 Termination of patent right due to non-payment of annual fee