CN110223042B - 面向海量数据的评估方法 - Google Patents
面向海量数据的评估方法 Download PDFInfo
- Publication number
- CN110223042B CN110223042B CN201910497722.5A CN201910497722A CN110223042B CN 110223042 B CN110223042 B CN 110223042B CN 201910497722 A CN201910497722 A CN 201910497722A CN 110223042 B CN110223042 B CN 110223042B
- Authority
- CN
- China
- Prior art keywords
- model
- quality
- evaluation
- models
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services; Handling legal documents
- G06Q50/184—Intellectual property management
Abstract
本申请属于人工智能技术领域,进一步地,是涉及面向海量数据的评估方法,包括用于评估海量数据的多个特征、用于评估所述特征的模型和模型使用策略,所述多个特征包括用于评估的所述海量数据的多个不同方面,所述模型使用策略包括:并联模型和级联模型。本申请可有效解决专业人员审核的成本极高,且相对于千万量级的新版权,专业人员能够处理的数量极为有限;此外千万量级的新版权分配至用户试读,会造成极大的用户伤害,即无法在千万量级的正文发现优质的新版权,从而无法发现优质作者等问题。
Description
技术领域
本申请属于人工智能技术领域,进一步地,是涉及面向海量数据的评估方法。
背景技术
目前发现优质版权的主要路径为:成名作者的新版权;专业人员的人工评审,如出版公司的图书策划人员、影视公司的项目开发人员,有相当一部分精力放在发现优质版权上;海量用户的试读,如各种网文站点,会分配一部分流量给新网文,再根据后继的阅读深度、口碑等决定该版权的流量分配额度。但专业人员审核的成本极高,且相对于千万量级的新版权,专业人员能够处理的数量极为有限;此外千万量级的新版权分配至用户试读,会造成极大的用户伤害,即无法在千万量级的正文发现优质的新版权,从而无法发现优质作者。
发明内容
本申请解决的主要问题是提供版权的多粒度拆分及其商业价值的挖掘方法,以解决专业人员审核的成本极高,且相对于千万量级的新版权,专业人员能够处理的数量极为有限;此外千万量级的新版权分配至用户试读,会造成极大的用户伤害,即无法在千万量级的正文发现优质的新版权,从而无法发现优质作者等问题。
面向海量数据的评估方法,包括用于评估海量数据的多个特征、用于评估所述特征的模型和模型使用策略,所述多个特征包括用于评估的所述海量数据的多个不同方面,所述模型使用策略包括:并联模型,使用多个所述模型的运算简单和耗时少的简单模型对多个特征进行评估,综合多个简单模型的优缺点得出对所述多个特征的初步评估结果;级联模型,根据所述并联模型得出的所述初步评估结果进行筛选,删除明显不符合规定的版权,然后使用多个所述模型的运算复杂和耗时多的复杂模型对筛选后的特征进行细致计算得出最终的精确结论和针对所述用于评估的海量数据的多个特征的多个不同方面的实时的评估报告。
进一步地,所述模型包括底层模型和综合判定模型。
进一步地,所述底层模型包括语言模型、场景模型、人物模型和关系模型。
进一步地,所述语言模型负责对整体的文字质量打分,其输出分值作为综合判定模型的输入。
进一步地,所述场景模型负责对版权中各个场景质量进行打分,将所述场景模型的输出作为综合判定模型的输入。
进一步地,所述人物模型负责对版权中主要人物进行打分,将所述人物模型的输出作为综合判定模型的输入。
进一步地,所述关系模型负责对版权中主要人物关系进行打分,将所述关系模型的输出作为综合判定模型的输入。
进一步地,所述综合判定模型根据底层模型输入制定质量判断规则。
进一步地,所述综合判定模型基于机器学习模型学习质量判断模型。
本申请的有益效果:
(1)可以实现面向千万量级的正文发现优质的新版权。本申请中的并联模型使用较为运算简单耗时短的模型来进行快速的版权质量判断,筛选出明显不符合规定要求的版权,从而筛选出较为符合规定要求的版权,并联模型中使用到的运算简单耗时短的模型更加适合运用到粗筛选中,因此在对筛选出来的较为符合规定要求的版权实施级联模型。因为级联模型使用到的用于评估的模型计算较为全面,所以运算较为复杂,耗时久,与此同时得出的结果也较并联模型中计算出的结果准确,因此如果直接用于千万量级的文章一方面会出现计算过程较长,另一方面对一些明显不符合规范要求的版权进行运算复杂耗时久的运算不仅浪费资源还加长了运算时间,因此选用并联模型后进行级联模型可以节省运算资源,缩短运算时间,从而使得本申请可以运用到千万量级的版权中。
(2)可以在发现优质的新版权后发现优质的新作者。现有技术中专业人员审核的成本极高,且相对于千万量级的新版权,专业人员能够处理的数量极为有限;此外千万量级的新版权分配至用户试读,会造成极大的用户伤害,因为本申请可以做到千万量级的正文发现优质的新版权,因此可以实现通过所发现的优质新版权发现优质的新作者,从而弥补本领域中缺少优质作者的缺点。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面对本发明的具体实施方式做详细的说明、在下面的描述中阐述了很多具体细节以便与充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。
面向海量数据的评估方法,包括用于评估海量数据的多个特征、用于评估所述特征的模型和模型使用策略,所述多个特征包括用于评估的所述海量数据的多个不同方面,所述模型使用策略包括:并联模型,使用多个所述模型的运算简单和耗时少的简单模型对多个特征进行评估,综合多个简单模型的优缺点得出对所述多个特征的初步评估结果;级联模型,根据所述并联模型得出的所述初步评估结果进行筛选,删除明显不符合规定的版权,然后使用多个所述模型的运算复杂和耗时多的复杂模型对筛选后的特征进行细致计算得出最终的精确结论和针对所述用于评估的海量数据的多个特征的多个不同方面的实时的评估报告。
进一步地,所述模型包括底层模型和综合判定模型。
进一步地,所述底层模型包括语言模型、场景模型、人物模型和关系模型。
进一步地,所述语言模型负责对整体的文字质量打分,其输出分值作为综合判定模型的输入。
进一步地,所述场景模型负责对版权中各个场景质量进行打分,将所述场景模型的输出作为综合判定模型的输入。
进一步地,所述人物模型负责对版权中主要人物进行打分,将所述人物模型的输出作为综合判定模型的输入。
进一步地,所述关系模型负责对版权中主要人物关系进行打分,将所述关系模型的输出作为综合判定模型的输入。
进一步地,所述综合判定模型根据底层模型输入制定质量判断规则。
进一步地,所述综合判定模型基于机器学习模型学习质量判断模型。
Claims (3)
1.面向海量数据的评估方法,包括用于评估海量版权数据的多个特征、用于评估所述特征的模型和模型使用策略,其特征在于,所述多个特征包括用于评估的所述海量版权数据的多个不同方面;
所述模型包括底层模型和综合判定模型,所述底层模型包括语言模型、场景模型、人物模型和关系模型;所述语言模型负责对整体的文字质量打分,其输出分值作为综合判定模型的输入;所述场景模型负责对版权中各个场景质量进行打分,将所述场景模型的输出作为综合判定模型的输入;所述人物模型负责对版权中主要人物进行打分,将所述人物模型的输出作为综合判定模型的输入;所述关系模型负责对版权中主要人物关系进行打分,将所述关系模型的输出作为综合判定模型的输入;
所述模型使用策略包括:
并联模型,使用多个所述模型的运算简单和耗时少的简单模型对多个特征进行评估,综合多个简单模型的优缺点得出对所述多个特征的初步评估结果;
级联模型,根据所述并联模型得出的所述初步评估结果进行筛选,删除明显不符合规定的版权,然后使用多个所述模型的运算复杂和耗时多的复杂模型对筛选后的特征进行细致计算得出最终的精确结论和针对所述用于评估的海量版权数据的多个特征的多个不同方面的实时的评估报告。
2.根据权利要求1所述的面向海量数据的评估方法,其特征在于,所述综合判定模型根据底层模型输入制定质量判断规则。
3.根据权利要求1所述的面向海量数据的评估方法,其特征在于,所述综合判定模型基于机器学习模型学习质量判断模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910497722.5A CN110223042B (zh) | 2019-06-10 | 2019-06-10 | 面向海量数据的评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910497722.5A CN110223042B (zh) | 2019-06-10 | 2019-06-10 | 面向海量数据的评估方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110223042A CN110223042A (zh) | 2019-09-10 |
CN110223042B true CN110223042B (zh) | 2020-01-14 |
Family
ID=67816207
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910497722.5A Expired - Fee Related CN110223042B (zh) | 2019-06-10 | 2019-06-10 | 面向海量数据的评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110223042B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102314453A (zh) * | 2010-06-30 | 2012-01-11 | 百度在线网络技术(北京)有限公司 | 高质量版本的筛选方法及系统 |
CN103544170A (zh) * | 2012-07-12 | 2014-01-29 | 百度在线网络技术(北京)有限公司 | 浏览质量的评估方法及装置 |
CN109829907A (zh) * | 2019-01-31 | 2019-05-31 | 浙江工业大学 | 一种基于深度学习的金属轴表面缺陷识别方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9697562B2 (en) * | 2013-06-07 | 2017-07-04 | International Business Machines Corporation | Resource provisioning for electronic books |
CN104166716B (zh) * | 2014-08-15 | 2018-12-07 | 华为技术有限公司 | 一种评估媒体文件的方法及装置 |
CN107292775A (zh) * | 2016-06-08 | 2017-10-24 | 北京知果科技有限公司 | 一种知识产权服务系统及其实现方法 |
CN108074115A (zh) * | 2016-11-11 | 2018-05-25 | 上海文化广播影视集团有限公司 | 一种电视节目版权价值评估系统及其评估方法 |
-
2019
- 2019-06-10 CN CN201910497722.5A patent/CN110223042B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102314453A (zh) * | 2010-06-30 | 2012-01-11 | 百度在线网络技术(北京)有限公司 | 高质量版本的筛选方法及系统 |
CN103544170A (zh) * | 2012-07-12 | 2014-01-29 | 百度在线网络技术(北京)有限公司 | 浏览质量的评估方法及装置 |
CN109829907A (zh) * | 2019-01-31 | 2019-05-31 | 浙江工业大学 | 一种基于深度学习的金属轴表面缺陷识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110223042A (zh) | 2019-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lombardi et al. | The digital transformation of corporate reporting–a systematic literature review and avenues for future research | |
Long et al. | Co-evolutionary simulation study of multiple stakeholders in the take-out waste recycling industry chain | |
Ervasti et al. | A global, comprehensive review of literature related to paper recycling: A pressing need for a uniform system of terms and definitions | |
CN111967721A (zh) | 一种综合能源系统绿色化水平评价方法及系统 | |
Wang et al. | Does green financial reform pilot policy promote green technology innovation? Empirical evidence from China | |
CN106156257A (zh) | 一种微博舆情事件的态势预测方法 | |
CN103246603A (zh) | 一种缺陷跟踪系统的软件缺陷报告自动分发方法 | |
Walther | New public management: the right way to modernize and improve public services? | |
CN107885714A (zh) | 一种基于大数据的在线备课的方法 | |
Huang et al. | Assessing the impact of energy-saving R&D on China’s energy consumption: evidence from dynamic spatial panel model | |
Weijie | Research and application of mechanical product design process based on QFD and TRIZ integration | |
CN110223042B (zh) | 面向海量数据的评估方法 | |
Li et al. | Urban weight and its driving forces: A case study of Beijing | |
Shinkevich et al. | A dynamic model of the impact of engineering services on the parameters of the economic system | |
Keena et al. | Circular Economy Design towards Zero Waste: Laying the foundation for constructive stakeholder engagement on improving construction, renovation, and demolition (CRD) waste management | |
Yahyaoui | Does the interaction between ICT diffusion and economic growth reduce CO2 emissions? An ARDL approach | |
CN109670760A (zh) | 一种大数据人力资源管理方法 | |
Isaac et al. | Application of house of quality matrix to material selection for engineering designs | |
Hao et al. | The supervision mechanism of residents’ waste separation behavior: analysis using a tripartite evolutionary game model | |
Nambiar et al. | Performance evaluation and benchmarking, traditional to big data to Internet of Things | |
Nicolescu | Guide for the international transfer of managerial know-how | |
Mol | Environmental reform in modernizing China | |
Loizidou et al. | DeCyDe: a participatory method for “measuring” sustainability through a friendly, flexible and adjustable [self-assessment?] tool | |
Li | Data mining model of english translation teaching based on virtual reality technology | |
Li et al. | Research on the applications of information technology in sport management |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200114 |
|
CF01 | Termination of patent right due to non-payment of annual fee |