CN111931022A - Ai热点内容智能编辑系统 - Google Patents
Ai热点内容智能编辑系统 Download PDFInfo
- Publication number
- CN111931022A CN111931022A CN202010510979.2A CN202010510979A CN111931022A CN 111931022 A CN111931022 A CN 111931022A CN 202010510979 A CN202010510979 A CN 202010510979A CN 111931022 A CN111931022 A CN 111931022A
- Authority
- CN
- China
- Prior art keywords
- content
- hot
- hotspot
- intelligent
- crawler
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000463 material Substances 0.000 claims abstract description 54
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 23
- 238000005516 engineering process Methods 0.000 claims abstract description 17
- 239000002994 raw material Substances 0.000 claims abstract description 7
- 238000000034 method Methods 0.000 claims description 28
- 238000004458 analytical method Methods 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 6
- 230000004048 modification Effects 0.000 claims description 6
- 238000012986 modification Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 5
- 238000013135 deep learning Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 4
- 238000010801 machine learning Methods 0.000 claims description 4
- 238000004519 manufacturing process Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 238000012550 audit Methods 0.000 claims description 2
- 230000006399 behavior Effects 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 claims description 2
- 239000003990 capacitor Substances 0.000 claims description 2
- 238000012790 confirmation Methods 0.000 claims description 2
- 230000009193 crawling Effects 0.000 claims description 2
- 238000005474 detonation Methods 0.000 claims description 2
- 238000009826 distribution Methods 0.000 claims description 2
- 230000002708 enhancing effect Effects 0.000 claims description 2
- 238000011156 evaluation Methods 0.000 claims description 2
- 239000012634 fragment Substances 0.000 claims description 2
- 238000007726 management method Methods 0.000 claims description 2
- 238000005065 mining Methods 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 claims description 2
- 239000002245 particle Substances 0.000 claims description 2
- 238000013439 planning Methods 0.000 claims description 2
- 238000012216 screening Methods 0.000 claims description 2
- 238000007405 data analysis Methods 0.000 claims 1
- 238000012384 transportation and delivery Methods 0.000 abstract description 8
- 238000011161 development Methods 0.000 abstract description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000009429 distress Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开的AI热点内容智能编辑平台,属于计算机技术领域。该系统旨在让AI算法像人一样能够进行表达和创作是人工智能其中一项重要愿景,而智能创作正是这一愿景的核心技术之一,从AI技术发展应用和市场需求角度出发,结合多年项目业务经验,创新研发该系统平台,致力于形成品牌内容分发商网络投放热点物料的原料库,解决内容分发商缺乏专业原创人员的业务窘境,用Ai为优质内容赋能,用算法为高效产出驱动,为内容分发商提供高品质热点借势营销内容,最快捷原创内容编辑和投放方案,实现网络投放物料原创周期由天缩小到时,并提升网络物料流量由个位数到万位数转变,并与内部其他投放传播工具联动,对接现有用户数字化触点,支持广告等精准营销场景。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一套AI热点内容算法模型体系。
背景技术
随着各行业移动媒介、互联网发展及全球市场竞争,实现高效用户内容交互展示体验已成为新的趋势。在信息爆炸的今天,用户每日从不同渠道平台获得大量的信息,如何有针对性地从繁杂的信息中挑选出最热的时事热点、行业热点和地域热点,成为了各新闻媒体、自媒体等领域工作者的难题,这就对用户内容交互系统提出新的挑战,以应用于汽车的用户内容交互系统为例,现有系统缺乏创新,首先不能规范系统的为各汽车企业及内容分发商提供互联网和移动端跨平台数字营销方案,同时缺少技术和运营服务整合,并且无法精准及大力度的进行跨平台客户信息培育、获取、转化,甚至相对于内容分发商缺乏专业内容原创人员,无法借助于E时代网络媒体发展,也无法创新数字化智能服务。
综上,现有场景下,部分内容分发商投入大量相关专业人力资源,产出网络物料进行投放,甚于2-3天编辑一篇网络物料,内容枯燥毫无新意,网络投放效果平平。同时伴随人力成本不断增加,内容分发商资源投入压力增大,入不敷出,得不偿失,无法成为企业数字营销借势的有力支点。现有技术中,缺少垂直于汽车行业内容物料产出系统,无法针对不同汽车品牌特性提供专业高效的网络物料,并且相对于时下网络热搜,如何获知热搜内容,如何分析热搜质量,如何快速获取优质热点物料并借势营销,如何提升网络内容广度深度,如何持续保持数字营销持续领先,也是多数内容分发商亟待解决的一个业务需求问题。
发明内容
为了解决此业务需求和弥补现有系统平台中存在的缺陷,本发明提出了搭建一个AI热点内容智能编辑平台,基于让AI算法像人一样能够进行表达和创作是人工智能其中一项重要愿景,而智能创作正是这一愿景的核心技术之一,从AI技术发展应用和市场需求角度出发,结合多年项目业务经验,创新研发该系统平台,致力于形成品牌内容分发商网络投放热点物料的原料库,解决内容分发商缺乏专业原创人员的业务窘境,用Ai为优质内容赋能,用算法为高效产出驱动,为内容分发商提供高品质热点借势营销内容,最快捷原创内容编辑和投放方案,实现网络投放物料原创周期由天缩小到时,并提升网络物料流量由个位数到万位数转变,并与内部其他投放传播工具联动,对接现有用户数字化触点,支持广告等精准营销场景。
本系统提供的AI热点内容智能编辑平台,包含爬虫渠道推荐模型模块、多模态数据维度分析模块和实时热点文章智能编辑模块。
所述爬虫渠道推荐模型模块,基于渠道权重算法体系,获取PC、移动端、微信微博、APP等用户触点分析评价100+优质爬虫渠道,以24小时内高效提供物料服务,满足各种热点内容素材需求,汇聚全网最新热点资讯和1000万级海量品牌编选素材,快速成稿,帮助内容创作流畅,完善创作成果。
优选的,上述爬虫渠道推荐模型模块,基于系统功能爬虫工具,分布式引擎与实时处理架构满足渠道高效分析.致力于将人力从繁杂的热点物料采集、编辑、整理流程中解放出来,素材获取时间由4.5小时缩短至0.5小时,效率提升80%,并且能够创作出更有深度、观点性、创新性的热点内容,保证内容高质量、高效率产出。为创建优质AI热点物料平台,打下基础,构筑AI热点物料创作模式新标杆。
所述多模态数据维度分析模块,基于用户使用习惯和热点物料需求,对用户轨迹和热点业态进行深度洞察多模态分析,构建全面精准的多维度用户标签体系和热点物料图谱,提供丰富的用户画像数据以及实时的场景识别能力,包括事件、逻辑、知识图谱、文本库、图片库、视频库、模板库等10+模态内容,涵盖汽车热点、社会热点、股市热点、体育热点和娱乐热点等500+热点业态维度,创作过程中,基于用户使用轨迹通过智能语义关联将热点物料标签和品牌内容标签进行匹配。率先实现了系统资源利用的效率领先性和操作便捷性。
优选的,上述多模态数据维度获取模块,基于属性标签、兴趣标签、行业标签以及定制化标签等多模态分析数据技术。通过百万级(300万以上)关联策略对千万级(900万左右)内容库进行过程组装,根据用户需求将文章生产模式进行工业及智能化改造。为创建优质AI热点物料平台,承接智能算法核心,颠覆传统人工创作模式。
所述实时热点文章智能编辑模块,基于时下热搜,分析热搜质量及趋势,并结合本品物料,智能生成相关文章,供内容分发商提高发文传播性提高集客效率。该系统平台全面完善内容的选、写、改、编、发等十多项功能,具体包括创作前的内容选题、创作中的模板选择、创作底稿的输出、确认主题后文章素材的推荐、文章图片的选择替换、文章的润色修改等6大创作流程。
优选的,上述实时热点文章智能编辑模块,基于内外部数据等进行清理分析,语义表征,CV处理满足整个体系的精细化标签基础,打通营销经验与策略全流程,形成整套的系统能力。同时在文章创作完成后,能够帮助用户进行云端审核、一键推送等操作,简化创作模式,让内容输出更智慧高效,一键分发,多渠道引爆传播,改变当下社会文章创作生产效率低、质量不稳定的市场现状,让创作更简单。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本申请实施例提供的爬虫渠道推荐模型技术方案图
图2是本申请实施例提供的多模态数据维度获取模型方案图
图3是本申请实施例提供的多模态数据维度分析技术方案图
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本申请实施例提供AI热点内容智能编辑平台的爬虫渠道推荐模型模块,以爬虫技术为基础,以内容平台的下载量及各大新闻媒体的露出量为标准,进行爬虫渠道的选择及获取,请参考图1,爬虫渠道推荐模型基于热点洞察和数据获取两部分实现。
第一步是热点洞察,基于指数爬虫技术,快速准确获取多种渠道热点指数,通过“网络传播热度指数”这一客观指标的变化,迅速呈现出热点事件排行,以及在短周期内各事件的热度变化情况。利用这一功能,自媒体从业人员、企业营销部门均可迅速地发现热点、跟踪热点,从而大大增强网络物料选题、策划活动的精准性和便捷性。热点洞察排行榜还进行了多维度细分,如从时间维度分为24小时热点排行和72小时热点排行;按地域可以细分为到每个省;按行业则细分为政务、经济、法治、民生、商业、交通、教育、医疗、文娱等多个行业。通过监测互联网大数据提取的热文推荐,能够看到最新热文的关联话题以及智能提取出文章中的核心词标签。
第二步是数据获取,基于内容爬虫技术,通过热点洞察确认关键词,快速准确获取多种渠道热点内容作为原始物料素材。数据获取爬虫工具通过Web网络爬取网页数据提供数据来源。在网络爬虫系统框架中,主过程由控制器,解析器,资源库三部分组成。控制器的主要工作负责给多线程中的各个爬虫线程分配工作任务。解析器主要工作是下载网页,进行页面处理,主要是将一些JS脚本标签、CSS代码内容、空格字符、HTML标签等内容处理掉,爬虫基本工作是由解析器完成。解析完成数据会由运营人员进行纠正,通过初试内容物料使用数据判断优质热点渠道。
场景说明一,以适用于内容分发商的热点物料爬虫渠道推荐模型示例,当爬虫工具获取微博出现热搜事件A,但是经过获取解析比对,百度未出现热搜事件A,则爬虫算法判断热搜事件A非有效热搜关键词,反馈权重分数较低,并且不会全网进行数据获取。当爬虫工具又获取微博出现热搜事件B(如澳门回归19周年热搜),经获取解析比对,百度也出现了出现热搜事件B(如澳门回归19周年热搜),以此类推,第三个媒体如同样出现热搜事件B(如澳门回归19周年热搜),则爬虫算法判断热搜事件B(如澳门回归19周年热搜)为有效热搜关键词,反馈权重分数较高,并且全网进行数据获取。全网今日头条/腾讯新闻/网易新闻等媒体栏目首先进行爬虫规则解析,然后精准捕获热搜事件B关键词网络原始物料,获取之后进行数据库存储并进行格式清洗转义,并根据自媒体人员选用数据分析不同渠道栏目获取的网络原始物料质量,并进行权重考核,优质物料使用率高的来源渠道栏目渠道权重分数较高,则判断为优质渠道进行推荐,后续则以此为重点渠道优先获取网络原始内容,并进行首页推荐自媒体人员使用,并基于自媒体人员使用数据不断进行权重算法纠正推荐结果。
实施例二
本申请实施例提供AI热点内容智能编辑平台的多模态数据维度分析模型模块,以语义分析算法为基础,通过上层词频统计、检索、分词、深度特征、机器学习的方式,进行热点文章片段的多模态数据计算,请参考图2,多模态数据维度获取模型基于智能分割和标签体系两部分实现。
第一步是智能分割,基于最新深度学习技术和神经网络,让平台具备阅读能力,提取海量文本数据的潜在特征,帮助用户自动化处理海量文本数据,可通过“文章”、“段落”、“高频词”全方位深入了解相关资讯,提升文字处理效率和文本挖掘深度,使用优化特征提取,进行段落技术分割,计算段落主题贡献程度,形成段落等级体系、初步加工原始素材。
第二步是标签体系,每段落标签标注,综合描述信息,进行有效分级,更精确快速查找,建立初级知识图谱。全面覆盖属性、行业、行为、场景等各维度细分标签,帮助用户360度勾勒内容标签体系。初期人工及算法相结合运营标签体系,后期算法学习标签管理。
场景说明二,以适用于内容分发商的热点物料多模态数据维度分析模型示例,延续场景说明一,获取热搜事件B(如澳门回归19周年热搜)相关内容后,平台进行智能分割,通过语义理解分析爬取过来的热搜事件B(如澳门回归19周年热搜)内容,进行总结提炼语义,并且将热搜事件B(如澳门回归19周年热搜)内容进行不同段落划分,及段落大意及段落内容作为推荐模块。智能分割后的热点段落模块会进行相应的标签备注,提供支持类继承、属性多态的面向对象描述AI标签体系,扩展定义适合AI热点内容的词汇体系。结构化数据交换,以及作为AI热点图谱构建、知识计算的核心数据结构。
实施例三
本申请实施例提供AI热点内容智能编辑平台的实时热点文章智能编辑模块,基于AI智能创新操作,一键操作快捷输出,大大提升创作效率,让内容创作更轻松高效高质。请参考图3,实时热点文章智能编辑模型基于主题模型、热度回馈和智能生成三部分实现。
第一步是主题模型,基于文档语义模型进行相关主题文章搜索,完成文章构建层预料获取,为文章生成筛选备选素材。初级语义模型进行相关文章搜索,完善热点/品牌颗粒关联,提升属性价值,初期内容分发商依据本品主题,手动选择关联热点。
第二步是热度回馈,基于强大推荐规则体系,捕获各段落引用价值,文章生成综合利用价值,结合基于机器学习计分机制,对于每基础素材进行能效打分,生成推荐生态,推荐更精准热点文章。
第三步是智能生成,基于初级阶段数据算法深度学习形成核心AI体系,满足内容分发商依据本品主题,AI编辑生成借势文章。
场景说明三,以适用于内容分发商的热点物料实时热点文章智能编辑模型示例,延续场景说明三,搭建完成初级的AI热点内容语义模型,将AI热点文章和本品文章进行初级弱关联,当内容分发商需要发布凯迪XT4主题活动网络文章,平台系统基于推荐算法策略推荐热搜事件B(如澳门回归19周年热搜)相关热点文章,匹配推荐策略“澳门回归体现爱国情怀和自豪感,驾驶XT4方可诠释回家路上的安全感和抒发中西方结合的舒适感”,智能匹配生成一篇AI热点文章,供自媒体人员参考使用。优先保证内容分发商使用起来,提升热点文章的时效性,因每天热点瞬息万变,需适应时代步伐。基于一定内容分发商使用数据之后,后续进行第二阶段工作,通过一定量级数据进行算法深度学习,形成积分机制,完善推荐生态,最终实现基于用户使用习惯,预判热点趋势,AI智能生成热点网络物料文章,实时供内容分发商参考使用。
需要说明的是,本说明书中的实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。以上所描述的系统和方法实施例仅仅是示意性的,可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。
Claims (7)
1.AI热点内容智能编辑平台,包含爬虫渠道推荐模型模块、多模态数据维度分析模块和实时热点文章智能编辑模块。
所述爬虫渠道推荐模型模块,基于渠道权重算法体系,获取PC、移动端、微信微博、APP等用户触点分析评价100+优质爬虫渠道,以24小时内高效提供物料服务,满足各种热点内容素材需求,汇聚全网最新热点资讯和1000万级海量品牌编选素材,快速成稿,帮助内容创作流畅,完善创作成果;
所述多模态数据维度分析模块,基于用户使用习惯和热点物料需求,对用户轨迹和热点业态进行深度洞察多模态分析,构建全面精准的多维度用户标签体系和热点物料图谱,提供丰富的用户画像数据以及实时的场景识别能力,包括事件、逻辑、知识图谱、文本库、图片库、视频库、模板库等10+模态内容,涵盖汽车热点、社会热点、股市热点、体育热点和娱乐热点等500+热点业态维度,创作过程中,基于用户使用轨迹通过智能语义关联将热点物料标签和品牌内容标签进行匹配。率先实现了系统资源利用的效率领先性和操作便捷性;
所述实时热点文章智能编辑模块,基于时下热搜,分析热搜质量及趋势,并结合本品物料,智能生成相关文章,供内容分发商提高发文传播性提高集客效率。该系统平台全面完善内容的选、写、改、编、发等十多项功能,具体包括创作前的内容选题、创作中的模板选择、创作底稿的输出、确认主题后文章素材的推荐、文章图片的选择替换、文章的润色修改等6大创作流程。
2.根据权利要求1所述的AI热点内容智能编辑平台,其特征在于:上述爬虫渠道推荐模型模块,基于系统功能爬虫工具,分布式引擎与实时处理架构满足渠道高效分析.致力于将人力从繁杂的热点物料采集、编辑、整理流程中解放出来,素材获取时间由4.5小时缩短至0.5小时,效率提升80%,并且能够创作出更有深度、观点性、创新性的热点内容,保证内容高质量、高效率产出。为创建优质AI热点物料平台,打下基础,构筑AI热点物料创作模式新标杆。
3.根据权利要求2所述的AI热点内容智能编辑平台,其特征在于:上述爬虫渠道推荐模型模块,以爬虫技术为基础,以内容平台的下载量及各大新闻媒体的露出量为标准,进行爬虫渠道的选择及获取,爬虫渠道推荐模型基于热点洞察和数据获取两部分实现。
第一步是热点洞察,基于指数爬虫技术,快速准确获取多种渠道热点指数,通过“网络传播热度指数”这一客观指标的变化,迅速呈现出热点事件排行,以及在短周期内各事件的热度变化情况。利用这一功能,自媒体从业人员、企业营销部门均可迅速地发现热点、跟踪热点,从而大大增强网络物料选题、策划活动的精准性和便捷性。热点洞察排行榜还进行了多维度细分,如从时间维度分为24小时热点排行和72小时热点排行;按地域可以细分为到每个省;按行业则细分为政务、经济、法治、民生、商业、交通、教育、医疗、文娱等多个行业。通过监测互联网大数据提取的热文推荐,能够看到最新热文的关联话题以及智能提取出文章中的核心词标签。
第二步是数据获取,基于内容爬虫技术,通过热点洞察确认关键词,快速准确获取多种渠道热点内容作为原始物料素材。数据获取爬虫工具通过Web网络爬取网页数据提供数据来源。在网络爬虫系统框架中,主过程由控制器,解析器,资源库三部分组成。控制器的主要工作负责给多线程中的各个爬虫线程分配工作任务。解析器主要工作是下载网页,进行页面处理,主要是将一些JS脚本标签、CSS代码内容、空格字符、HTML标签等内容处理掉,爬虫基本工作是由解析器完成。解析完成数据会由运营人员进行纠正,通过初试内容物料使用数据判断优质热点渠道。
4.根据权利要求1所述的AI热点内容智能编辑平台,其特征在于:上述多模态数据维度获取模块,基于属性标签、兴趣标签、行业标签以及定制化标签等多模态分析数据技术。通过百万级(300万以上)关联策略对千万级(900万左右)内容库进行过程组装,根据用户需求将文章生产模式进行工业及智能化改造。为创建优质AI热点物料平台,承接智能算法核心,颠覆传统人工创作模式。
5.根据权利要求4所述的AI热点内容智能编辑平台,其特征在于:上述多模态数据维度分析模型模块,以语义分析算法为基础,通过上层词频统计、检索、分词、深度特征、机器学习的方式,进行热点文章片段的多模态数据计算,多模态数据维度获取模型基于智能分割和标签体系两部分实现。
第一步是智能分割,基于最新深度学习技术和神经网络,让平台具备阅读能力,提取海量文本数据的潜在特征,帮助用户自动化处理海量文本数据,可通过“文章”、“段落”、“高频词”全方位深入了解相关资讯,提升文字处理效率和文本挖掘深度,使用优化特征提取,进行段落技术分割,计算段落主题贡献程度,形成段落等级体系、初步加工原始素材。
第二步是标签体系,每段落标签标注,综合描述信息,进行有效分级,更精确快速查找,建立初级知识图谱。全面覆盖属性、行业、行为、场景等各维度细分标签,帮助用户360度勾勒内容标签体系。初期人工及算法相结合运营标签体系,后期算法学习标签管理。
6.根据权利要求1所述的AI热点内容智能编辑平台,其特征在于:上述实时热点文章智能编辑模块,基于内外部数据等进行清理分析,语义表征,CV处理满足整个体系的精细化标签基础,打通营销经验与策略全流程,形成整套的系统能力。同时在文章创作完成后,能够帮助用户进行云端审核、一键推送等操作,简化创作模式,让内容输出更智慧高效,一键分发,多渠道引爆传播,改变当下社会文章创作生产效率低、质量不稳定的市场现状,让创作更简单。
7.根据权利要求6所述的AI热点内容智能编辑平台,其特征在于:上述实时热点文章智能编辑模块,基于AI智能创新操作,一键操作快捷输出,大大提升创作效率,让内容创作更轻松高效高质。实时热点文章智能编辑模型基于主题模型、热度回馈和智能生成三部分实现。
第一步是主题模型,基于文档语义模型进行相关主题文章搜索,完成文章构建层预料获取,为文章生成筛选备选素材。初级语义模型进行相关文章搜索,完善热点/品牌颗粒关联,提升属性价值,初期内容分发商依据本品主题,手动选择关联热点。
第二步是热度回馈,基于强大推荐规则体系,捕获各段落引用价值,文章生成综合利用价值,结合基于机器学习计分机制,对于每基础素材进行能效打分,生成推荐生态,推荐更精准热点文章。
第三步是智能生成,基于初级阶段数据算法深度学习形成核心AI体系,满足内容分发商依据本品主题,AI编辑生成借势文章。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010510979.2A CN111931022A (zh) | 2020-06-10 | 2020-06-10 | Ai热点内容智能编辑系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010510979.2A CN111931022A (zh) | 2020-06-10 | 2020-06-10 | Ai热点内容智能编辑系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111931022A true CN111931022A (zh) | 2020-11-13 |
Family
ID=73317151
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010510979.2A Pending CN111931022A (zh) | 2020-06-10 | 2020-06-10 | Ai热点内容智能编辑系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111931022A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113360661A (zh) * | 2021-08-11 | 2021-09-07 | 太极计算机股份有限公司 | 多租户的媒体大数据应用云服务平台 |
CN113706664A (zh) * | 2021-08-31 | 2021-11-26 | 重庆杰夫与友文化创意有限公司 | 基于智能场景识别的营销内容生成方法、系统及存储介质 |
CN113780885A (zh) * | 2021-09-27 | 2021-12-10 | 江西省影票文化传媒有限公司 | 一种本地生活服务用智能动态实时管理系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150294337A1 (en) * | 2012-08-08 | 2015-10-15 | Qbeats Inc. | Content creation and distribution system that dynamically prices access based on user behavior |
CN106874248A (zh) * | 2017-01-22 | 2017-06-20 | 百度在线网络技术(北京)有限公司 | 基于人工智能的文章生成方法和装置 |
US20180046712A1 (en) * | 2016-08-11 | 2018-02-15 | NewsRx, LLC | Artificial intelligence content detection system |
US20180174684A1 (en) * | 2016-12-21 | 2018-06-21 | Disco Health, LLC | Artificial intelligence expert system |
US20180352043A1 (en) * | 2017-06-02 | 2018-12-06 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Artificial Intelligence Based Method and Apparatus for Pushing News |
US20180357317A1 (en) * | 2017-06-07 | 2018-12-13 | Centurylink Intellectual Property Llc | Scene aware searching |
CN110060029A (zh) * | 2019-04-18 | 2019-07-26 | 浩鲸云计算科技股份有限公司 | 一种ai赋能创意设计方法 |
US20190272322A1 (en) * | 2018-03-01 | 2019-09-05 | Edgy Labs, LLC | Content editing using AI-based content modeling |
WO2019227710A1 (zh) * | 2018-05-31 | 2019-12-05 | 平安科技(深圳)有限公司 | 网络舆情的分析方法、装置及计算机可读存储介质 |
CN110674410A (zh) * | 2019-10-08 | 2020-01-10 | 北京物灵科技有限公司 | 用户画像构建、内容推荐方法、装置及设备 |
-
2020
- 2020-06-10 CN CN202010510979.2A patent/CN111931022A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150294337A1 (en) * | 2012-08-08 | 2015-10-15 | Qbeats Inc. | Content creation and distribution system that dynamically prices access based on user behavior |
US20180046712A1 (en) * | 2016-08-11 | 2018-02-15 | NewsRx, LLC | Artificial intelligence content detection system |
US20180174684A1 (en) * | 2016-12-21 | 2018-06-21 | Disco Health, LLC | Artificial intelligence expert system |
CN106874248A (zh) * | 2017-01-22 | 2017-06-20 | 百度在线网络技术(北京)有限公司 | 基于人工智能的文章生成方法和装置 |
US20180352043A1 (en) * | 2017-06-02 | 2018-12-06 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Artificial Intelligence Based Method and Apparatus for Pushing News |
US20180357317A1 (en) * | 2017-06-07 | 2018-12-13 | Centurylink Intellectual Property Llc | Scene aware searching |
US20190272322A1 (en) * | 2018-03-01 | 2019-09-05 | Edgy Labs, LLC | Content editing using AI-based content modeling |
WO2019227710A1 (zh) * | 2018-05-31 | 2019-12-05 | 平安科技(深圳)有限公司 | 网络舆情的分析方法、装置及计算机可读存储介质 |
CN110060029A (zh) * | 2019-04-18 | 2019-07-26 | 浩鲸云计算科技股份有限公司 | 一种ai赋能创意设计方法 |
CN110674410A (zh) * | 2019-10-08 | 2020-01-10 | 北京物灵科技有限公司 | 用户画像构建、内容推荐方法、装置及设备 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113360661A (zh) * | 2021-08-11 | 2021-09-07 | 太极计算机股份有限公司 | 多租户的媒体大数据应用云服务平台 |
CN113360661B (zh) * | 2021-08-11 | 2021-11-12 | 太极计算机股份有限公司 | 多租户的媒体大数据应用云服务平台 |
CN113706664A (zh) * | 2021-08-31 | 2021-11-26 | 重庆杰夫与友文化创意有限公司 | 基于智能场景识别的营销内容生成方法、系统及存储介质 |
CN113706664B (zh) * | 2021-08-31 | 2023-11-10 | 重庆杰夫与友文化创意有限公司 | 基于智能场景识别的营销内容生成方法、系统及存储介质 |
CN113780885A (zh) * | 2021-09-27 | 2021-12-10 | 江西省影票文化传媒有限公司 | 一种本地生活服务用智能动态实时管理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103339597B (zh) | 转换搜索引擎查询 | |
CN111931022A (zh) | Ai热点内容智能编辑系统 | |
US20110231416A1 (en) | Analyzing script for scanning mass internet content | |
CN102279851A (zh) | 一种智能导航方法、装置和系统 | |
CN103955873A (zh) | 创新资源信息整合服务平台 | |
CN104835014A (zh) | 一种企业科研信息服务平台 | |
US9069880B2 (en) | Prediction and isolation of patterns across datasets | |
CN103049440A (zh) | 一种相关文章的推荐处理方法和处理系统 | |
CN109800249B (zh) | 基于工业服务云平台用户行为感知的知识服务方法和系统 | |
CN105518661A (zh) | 经由挖掘的超链接文本的片段来浏览图像 | |
CN112015962A (zh) | 一种政务智能大数据中心体系架构 | |
CN106354860A (zh) | 基于标签集的信息资源自动贴标签并自动推送的方法 | |
CN105335506A (zh) | 一种电子档案编研方法及系统 | |
CN109918626A (zh) | 一种创业投融资服务系统 | |
JP5309543B2 (ja) | 情報検索サーバ、情報検索方法及びプログラム | |
CN111859108A (zh) | 一种舆情系统搜索词推荐系统 | |
CN104598549A (zh) | 数据分析方法和系统 | |
Lee | Algorithms and Big Data: Surplus Value of Codes and Flows | |
EP3729259B1 (en) | Assessing applications for delivery via an application delivery server | |
KR20220079029A (ko) | 문서 기반 멀티 미디어 콘텐츠 자동 제작 서비스 제공 방법 | |
Chen et al. | Transitions in daily search tactics: during the cross-app interaction search process | |
Su et al. | KaitoroCap: A document navigation capture and visualisation tool | |
Sharma et al. | Design of back-end of recommendation systems using collective intelligence social tagging | |
Yang | A study on visualization of user reviews | |
Wang et al. | Research on How the US Artificial Intelligence Expands the Chinese Media Market |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |