CN106933808A - 基于人工智能的文章标题生成方法、装置、设备及介质 - Google Patents

基于人工智能的文章标题生成方法、装置、设备及介质 Download PDF

Info

Publication number
CN106933808A
CN106933808A CN201710166238.5A CN201710166238A CN106933808A CN 106933808 A CN106933808 A CN 106933808A CN 201710166238 A CN201710166238 A CN 201710166238A CN 106933808 A CN106933808 A CN 106933808A
Authority
CN
China
Prior art keywords
title
article
candidate
template
generated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710166238.5A
Other languages
English (en)
Inventor
袁洁
陈翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710166238.5A priority Critical patent/CN106933808A/zh
Publication of CN106933808A publication Critical patent/CN106933808A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例公开了基于人工智能的文章标题生成方法、装置、设备及存储介质。其中方法包括:根据待生成标题的文章与标题模板确定至少一个候选标题;根据标题质量筛选参数对各所述候选标题进行筛选,确定目标标题;将所述目标标题与所述待生成标题文章组合;其中,所述标题模板和/或标题质量筛选参数根据历史标题数据的用户反馈信息确定。本发明实施例解决了普通机器文章标题质量差、吸引力低的问题,实现了自动生成高质量的文章标题。

Description

基于人工智能的文章标题生成方法、装置、设备及介质
技术领域
本发明实施例涉及标题自动生成技术,尤其涉及基于人工智能的文章标题生成方法、装置、设备及存储介质。
背景技术
随着互联网技术与大数据技术的不断发展,人们可通过互联网获取各种新闻信息,文章标题成为人们获取文章核心内容的一种重要方式,文章标题是否具有吸引力成为影响人们是否阅读文章的一个重要因素。
目前,文章标题的拟定方式重要有以下两种:人工拟定标题与普通机器拟定标题。其中,人工拟定标题对用户的吸引力高,但受限于人力成本高,生产量小,且只能由标题拟定人员进行经验性优化,无法根据用户数据进行有效调整。普通机器拟定标题一般采用简单字段结合文本规则生成,例如普通机器拟定文章标题可以是“10月份用户最喜欢的十个桂林的景点”或者“公牛队对火箭队比赛结果”等,普通机器拟定文章标题阅读体验较差,对用户的吸引力不高,且易出现多篇文章标题重复的情况,导致用户错看、漏看或者无法直观地确定文章重点,用户体验差。
人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
如何能够结合人工智能技术实现文章标题的智能生成,是现有技术的研究热点之一。
发明内容
本发明提供基于人工智能的文章标题生成方法、装置、设备及存储介质,以实现自动生成吸引力高的文章标题。
第一方面,本发明实施例提供了基于人工智能的文章标题生成方法,该方法包括:
根据待生成标题的文章与标题模板确定至少一个候选标题;
根据标题质量筛选参数对各所述候选标题进行筛选,确定目标标题;
将所述目标标题与所述待生成标题文章组合;
其中,所述标题模板和/或标题质量筛选参数根据历史标题数据的用户反馈信息确定。
第二方面,本发明实施例还提供了基于人工智能的文章标题生成装置,该装置包括:
候选标题确定模块,用于根据待生成标题的文章与标题模板确定至少一个候选标题;
目标标题确定模块,用于根据标题质量筛选参数对各所述候选标题进行筛选,确定目标标题;
组合模块,用于将所述目标标题与所述待生成标题文章组合;
其中,所述标题模板和/或标题质量筛选参数根据历史标题数据的用户反馈信息确定。
第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序所述处理器执行所述程序时实现如本发明实施例中任一所述的基于人工智能的文章标题生成方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的基于人工智能的文章标题生成方法。
本发明实施例通过根据历史标题数据的用户反馈信息确定的标题模板和标题质量筛选参数,结合待生成标题的文章生成并筛选出高质量的满足用户需求的目标标题,替代了现有技术中仅通过待生成标题的文章与文本规则生成标题的方法,解决了普通机器文章标题质量差、吸引力低的问题,实现了自动生成高质量的文章标题。
附图说明
图1A是本发明实施例一提供的基于人工智能的文章标题生成方法的流程图;
图1B是本发明实施例一提供的历史标题数据的用户反馈信息的示意图;
图2是本发明实施例二提供的基于人工智能的文章标题生成方法的流程图;
图3是本发明实施例三提供的基于人工智能的文章标题生成方法的流程图;
图4是本发明实施例四提供的基于人工智能的文章标题生成方法的流程图;
图5是本发明实施例五提供的基于人工智能的文章标题生成方法的流程图;
图6是本发明实施例六提供的基于人工智能的文章标题生成装置的结构示意图;
图7为本发明实施例七提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1A为本发明实施例一提供的基于人工智能的文章标题生成方法的流程图,本实施例可适用于自动生成文章标题的情况,该方法可以由本发明实施例提供的文章标题生成装置来执行,该装置可由软件和/或硬件来实现,并一般可集成于用于自动生成文章标题的终端或者服务器中,该方法具体包括:
S110、根据待生成标题的文章与标题模板确定至少一个候选标题。
其中,标题模板指的是符合文本规则的不含有实体词汇的待补充标题语句,示例性的,标题模板可以是XX击败XX获得XX连胜,其中“XX”为待补充的实体词汇,该实体词汇根据待生成标题的文章确定,待生成标题的文章指的是只包含文章内容,不包含文章标题的文章。标题模板可通过海量历史文章标题确定,海量历史文章标题包括各种类型的文章标题,可选的,通过待生成标题的文章的类型确定符合待生成标题的文章类型的标题模板,示例性的,待生成标题的文章的类型可以是历史、旅游、美食、体验竞赛、影视或者娱乐等。根据文章类型筛选的标题模板至少为一个,结合待生成标题的文章可确定至少一个候选标题。本实施例中,通过待生成标题的文章的类型筛选标题模板,提高了标题模板的准确度,提高了候选模板的质量,减少了候选模板的后续筛选的工作量。
本实施例中,标题模板根据历史标题数据的用户反馈信息确定。
其中,历史标题数据指的是历史文章对应的标题数据,用户反馈信息指的是用户对历史文章的响应信息,示例性的,用户反馈信息可以是用户点击阅读该文章或者对文章的评论或者转发分享等,参见图1B,图1B是本发明实施例一提供的历史标题数据的用户反馈信息的示意图。
可选的,历史标题数据的用户反馈信息包括用户对历史标题所对应文章的点击量数据。
其中,用户在未点击阅读文章内容时,文章标题是用户获得文章核心内容的主要因素,文章的点击量数据直观的反映了文章标题对用户的吸引程度。文章的点击量数据指的是文章从发布到当前时间长度内被点击阅读的次数统计,示例性的,点击量数据越大,表明文章标题对用户的吸引程度越高,反之,表明文章标题对用户的吸引程度越低。参见图1B,可知标题“肝调养调理,怎么办?膳食调理,来这里”的阅读量最大,表明该标题对用户的吸引程度最高。
本实施例中,通过用户反馈信息筛选历史文章,示例性的,根据历史文章的点击量数据进行筛选,选择点击量数据大于预设点击数量的历史文章,根据筛选的历史文章的标题确定标题模板,提高了标题模板质量,以及根据标题模板确定的候选标题的质量。
本实施例中,通过标题模板可快速的自动生成文章的候选标题,提高生成文章标题的效率。
S120、根据标题质量筛选参数对各候选标题进行筛选,确定目标标题。
其中,标题质量筛选参数指的是候选标题的质量量化参数,示例性的,标题质量筛选参数越高,候选标题的质量越好,候选标题对用户的吸引程度越高;反之,候选标题的质量越差,候选标题对用户的吸引程度越低。
本实施例中,根据候选标题的标题质量筛选参数对候选标题进行排序和筛选,并根据筛选结果确定目标标题,其中,目标标题指的是待生成标题文章的最终标题。示例性的,可以将标题质量筛选参数最高的候选标题确定为目标标题。
其中,标题质量筛选参数根据历史标题数据的用户反馈信息确定。
本实施例中,为了提高目标标题的质量,根据标题质量筛选参数对候选标题进行筛选,由于候选标题尚未发布,无法获取候选标题的实际的用户反馈信息,则根据历史标题数据的用户反馈信息确定。示例性的,可以是将生成候选标题的标题模板对应的历史文章的用户反馈信息确定为候选标题的用户反馈信息,并依据该用户反馈信息确定候选标题的标题质量筛选参数。可选的,历史标题数据的用户反馈信息包括用户对历史标题所对应文章的点击量数据。
本实施例中,通过标题质量筛选参数筛选候选标题,确定目标标题,提高了目标标题的质量,提高了目标标题对用户的吸引程度。
S130、将目标标题与待生成标题文章组合。
本实施例中,通过将目标标题与待生成标题文章组合形成完整的文章,可将该文章发布,供用户阅读,并实时记录该文章的用户反馈信息,便于对标题模板的更新,以及提高后续自动生成标题的质量。
本实施例的技术方案,通过根据历史标题数据的用户反馈信息确定的标题模板和标题质量筛选参数,结合待生成标题的文章生成并筛选出高质量的满足用户需求的目标标题,替代了现有技术中仅通过待生成标题的文章与文本规则生成标题的方法,解决了普通机器文章标题质量差、吸引力低的问题,实现了自动生成高质量的文章标题。
在上述实施例的基础上,步骤S110之后还可以包括:
根据语言模型的过滤规则对候选标题进行过滤。
其中,语言模型的过滤规则指的是用于滤除语句成分不合理或者语句含义不清晰的候选标题的规则。可选的,语言模型的过滤规则是对存在双关语或者主谓宾等句子成分不匹配的候选标题进行滤除。其中,双关语指的是在一定的语言环境中,利用词的多义和/或同音的条件,有意使语句具有双重意义。示例性的,候选标题为“A队大败B队获得胜利”,上述候选标题可有两种含义:A队胜利B队失败,或者A队失败B队胜利,则该候选标题表达不清晰,将该候选标题滤除。主谓宾等句子成分不匹配指的是候选标题中主谓宾等句子成分缺失、重复或者搭配不当。示例性的,候选标题可以是“[事件A]引发大盘震荡,[关联事件B]或成关键因素”,其中[事件A]可能是X公司开盘震荡,则候选标题中存在句子成分的重复,将该候选标题滤除。
本实施例中,根据语言模型的过滤规则对候选标题进行过滤,滤除语句含义不清晰、句子成分不匹配的候选标题,提高了待生成标题的质量。
实施例二
图2是本发明实施例二提供的基于人工智能的文章标题生成方法的流程图,在上述实施例的基础上,进一步的在根据待生成标题的文章与标题模板确定至少一个候选标题之前,提供了标题模板的确定方法。相应的,该方法包括:
S210、获取至少一个自然语义的非结构化文章,根据非结构化文章的用户反馈信息进行筛选。
其中,自然语义的非结构化文章指的是通过人自然撰写的文章,而非通过文章模板形成的具有固定结构的文章。示例性的,可通过大数据获得批量非结构化历史文章,并根据用户反馈信息进行筛选。例如可以是,筛选用户反馈良好,点击量数据大的非结构化的历史文章。
S220、从筛选后的非结构化文章中提取原始文章标题。
其中,原始文章标题指的是非结构化文章的标题。
S230、将原始文章标题进行聚类,根据聚类结果确定至少一个标题模板。
其中,聚类指的是将物理或抽象对象的集合分成由类似的对象组成的多个类的过程,示例性的,通过聚类可将原始文章标题根据标题类型划分为多个组合,形成不同类型的标题模板,便于后续根据待生成标题的文章确定候选标题,提高了自动生成标题的效率。
可选的,通过聚类确定的标题模板可以包括如下至少一种:时间格式标题模板、地点格式标题模板或者热点信息格式标题模板。
示例性的,“[月份][地点]旅游景点推荐”的相关标题模板可以是:“[月份]美景哪里寻”、“[地点]体验[景点1][特征1]、[景点2][特征2]”等。“[影视剧名]曾经出演的演员现状”的相关标题模板可以是:“[影视剧名]唤醒童年回忆”,“[演员1][演员-剧1]再秀演技,[演员2]却[状态2]”等。
S240、根据待生成标题的文章与标题模板确定至少一个候选标题。
S250、根据标题质量筛选参数对各候选标题进行筛选,确定目标标题。
其中,标题模板和/或标题质量筛选参数根据历史标题数据的用户反馈信息确定。
S260、将目标标题与待生成标题文章组合。
本实施例的技术方案,通过获取根据非结构化文章的用户反馈信息筛选的自然语义的非结构化文章标题,将原始文章标题进行聚类确定至少一个标题模板,提高了标题模板的质量,通过高质量的标题模板替代了现有技术的简单文本规则,提高了待生成标题的质量与吸引力。
实施例三
图3是本发明实施例三提供的基于人工智能的文章标题生成方法的流程图,在上述实施例的基础上进行了优化,对标题模板的确定方法进行了细化。相应的,该方法具体包括:
S310、获取至少一个自然语义的非结构化文章,根据非结构化文章的用户反馈信息进行筛选。
S320、获取至少一个结构化数据生成的文章,提取结构化数据文章的核心内容,根据核心内容确定预设基准标题。
其中,结构化数据生成的文章指的是依据文章模板生成的具有标准结构的文章,根据相同文章模板生成的不同文章的区别在于文章的核心内容不同,根据结构化数据文章的核心内容确定的标题作为预设基准标题,预设基准标题可准确对应结构化文章的核心内容。
可选的,结构化数据文章可通过用户反馈信息进行筛选,提高了筛选的预设基准标题的质量。
S330、从筛选后的非结构化文章中提取原始文章标题。
S340、以预设基准标题作为聚类核心,对原始文章标题进行聚类,根据聚类结果确定至少一个标题模板。
其中,由于预设基准标题与结构化数据文章核心内容的对应的准确度高,在对原始文章标题进行聚类时,将预设基准标题作为聚类核心,可提高标题聚类的效率以及聚类的精度,提高标题模板的准确度。
S350、根据待生成标题的文章与标题模板确定至少一个候选标题。
S360、根据标题质量筛选参数对各候选标题进行筛选,确定目标标题。
其中,标题模板和/或标题质量筛选参数根据历史标题数据的用户反馈信息确定。
S370、将目标标题与待生成标题文章组合。
本实施例的技术方案,通过基于结构化数据生成的文章的核心内容,确定预设基准标题,将预设基准标题作为聚类核心,对原始文章标题进行聚类,确定至少一个标题模板,提高了标题聚类的效率以及聚类的精度,提高了标题模板的准确度。
实施例四
图4是本发明实施例四提供的基于人工智能的文章标题生成方法的流程图,在上述实施例的基础上进行了优化,分别对标题模板的确定方法以及“根据待生成标题的文章与标题模板确定至少一个候选标题”进行了细化。相应的,该方法具体包括:
S410、获取至少一个自然语义的非结构化文章,根据非结构化文章的用户反馈信息进行筛选。
S420、提取原始文章标题的实体词汇和实体词汇的描述词汇,并对应记录。
其中,实体词汇指的是具有实际含义的词汇,一般指名词或者代词。示例性的,实体词汇一般可以是人物名称、地点名称、影视名称或者体育项目等名词。例如可以是“桂林”、“鹿晗”、“XX公司”或者“XX队”等。描述词汇指的是不具有实际含义的用于描述实体词汇,一般指形容词或者具有形容含义的名称,示例性的,描述词汇可以是“男神”、“当红花旦”、“天下第一村”或者“全球首款”等。
本实施例中,将提取原始文章标题的实体词汇和实体词汇的描述词汇进行对应记录,在随后生成文章标题时,当使用实体词汇时可以相应也提取描述词汇来填充模板。
S430、从筛选后的非结构化文章中提取原始文章标题。
S440、将原始文章标题进行聚类,根据聚类结果确定至少一个标题模板。
S450、根据至少一个标题模板,提取待生成标题文章的核心实体词汇以及核心实体词汇的描述词汇。
本实施例中,确定至少一个标题模板中待补充词语,提取从待生成标题文章中的核心内容,并进一步的提取核心内容中的核心实体词汇,以及用于限定描述核心实体词汇的描述词汇。
示例性的,可将提取待生成标题文章的核心实体词汇与描述词汇与原始文章标题中对应记录的实体词汇和描述词汇进行相似度比对,判断待生成标题文章的核心实体词汇与描述词汇的对应关系是否正确。
S460、将核心实体词汇与描述词汇组合,生成描述型实体词汇。
示例性的,描述型实体词汇可以是“小鲜肉鹿晗”、“当红花旦赵丽颖”以及“实力影帝刘青云”等。
本实施例中,将核心实体词汇与描述词汇组合,使得核心实体词汇更加丰满,提高了实体词汇对用户吸引程度。
S470、将描述型实体词汇与至少一个标题模板结合,形成至少一个候选标题。
本实施例中,将描述型实体词汇与至少一个标题模板结合确定候选标题,避免了仅在标题模板中添加实体词汇导致标题枯燥无味或者内容干瘪的问题,提高了候选标题对用户吸引程度。
S480、根据标题质量筛选参数对各候选标题进行筛选,确定目标标题。
其中,标题模板和/或标题质量筛选参数根据历史标题数据的用户反馈信息确定。
S490、将目标标题与待生成标题文章组合。
本实施例的技术方案,通过提取待生成标题文章的核心实体词汇以及核心实体词汇的描述词汇,形成描述型实体词汇,结合至少一个标题模板形成至少一个候选标题,替代了现有技术中普通机器标题中仅包含实体词汇的情况,包含描述型实体词汇的标题内容丰满,提高了待生成标题对用户吸引程度。
实施例五
图5是本发明实施例五提供的基于人工智能的文章标题生成方法的流程图,在上述实施例的基础上进行了优化,进一步的在根据标题质量筛选参数对各候选标题进行筛选,确定目标标题之前提供了标题质量筛选参数的确定方法。相应的,该方法具体包括:
S510、根据待生成标题的文章与标题模板确定至少一个候选标题。
S520、将候选标题与历史文章标题中的非实体因素进行相似度计算。
其中,非实体因素指的是候选标题与历史文章标题中去除实体词汇或者描述性实体词汇的部分。相似度的比较维度可以是标题的格式、标题中各类型实体字段的组合方式、以及非实体词汇等。相似度指的是个体间的相似程度,示例性的,根据相似度计算,若候选标题与历史文章标题中的非实体因素相似度值越大,则表明候选标题与历史文章标题中的非实体因素相似度越高,差异越小,反之,表明候选标题与历史文章标题中的非实体因素相似度越低,差异越大。
S530、获取满足相似度要求的历史文章的用户反馈信息,作为候选标题的标题质量筛选参数。
本实施例中,将满足相似度要求的历史文章的用户反馈信息作为候选标题的标题质量筛选参数。示例性的,若候选标题与历史文章标题的非实体因素的相似度值大于预设相似度时,可将历史文章标题的用户反馈信息作为候选标题的标题质量筛选参数。或者将不同历史文章根据相似度值进行排序,将相似度值最大的历史文章的用户反馈信息作为候选标题的标题质量筛选参数。
示例性的,去除满足相似度要求的历史文章标题的实体因素,确定标题文字本身对用户的吸引程度。满足相似度要求的历史文章标题例如可以是:
“A队击败B队获得X连胜,X球员取得本赛季第X个两双”;
“C队主场轻取D队,B队或将错失季后赛最后一张门票”;
“E队主场复仇F队,X球员最后X分钟绝杀成功”。
对上述标题进行计算,排除球队、球员本身带来的影响后,获得用户实际点击倾向的标题模板和关注点,示例性的,“两双”对于点击率增益较低,而“绝杀”的点击率增益较高;“轻取”对于点击率增益较低,而“X连胜”点击率增益较高。
本实施例中,通过根据历史文章标题的点击率增益确定候选标题对应的标题模板的对用户的吸引程度,并进一步确定候选标题的标题质量筛选参数,提高了候选标题的标题质量筛选参数的准确度,提高了后续对候选标题筛选的精度。
S540、根据标题质量筛选参数对各候选标题进行筛选,确定目标标题。
其中,标题模板和/或标题质量筛选参数根据历史标题数据的用户反馈信息确定。
S550、将目标标题与待生成标题文章组合。
本实施例中,通过计算候选标题与历史文章标题中的非实体因素相似度,排除实体因素影响,将满足相似度要求的历史文章的用户反馈信息作为候选标题的标题质量筛选参数,对候选模板进行筛选,确定质量最高的候选标题作为目标标题,提高了候选标题的标题质量筛选参数的准确度,提高了目标标题的质量以及对用户的吸引程度。
实施例六
图6是本发明实施例六提供的基于人工智能的文章标题生成装置的结构示意图,该装置适用于执行本发明实施例提供的基于人工智能的文章标题生成方法,该装置具体包括:
候选标题确定模块610,用于根据待生成标题的文章与标题模板确定至少一个候选标题;
目标标题确定模块620,用于根据标题质量筛选参数对各候选标题进行筛选,确定目标标题;
组合模块630,用于将目标标题与待生成标题文章组合;
其中,所述标题模板和/或标题质量筛选参数根据历史标题数据的用户反馈信息确定。
进一步的,装置还包括:
文章筛选模块,用于在根据待生成标题的文章与标题模板确定至少一个候选标题之前,获取至少一个自然语义的非结构化文章,根据非结构化文章的用户反馈信息进行筛选;
文章标题提取模块,用于从筛选后的非结构化文章中提取原始文章标题;
标题模板确定模块,用于将原始文章标题进行聚类,根据聚类结果确定至少一个标题模板。
进一步的,装置还包括:
预设基准标题确定模块,用于在从筛选后的非结构化文章中提取原始文章标题之前,获取至少一个结构化数据生成的文章,提取结构化数据文章的核心内容,根据核心内容确定预设基准标题;
相应的,标题模板确定模块具体用于:
以预设基准标题作为聚类核心,对原始文章标题进行聚类。
进一步的,装置还包括:
词汇提取模块,用于在获取至少一个自然语义的非结构化文章之后,提取原始文章标题的实体词汇和实体词汇的描述词汇,并对应记录;
相应的,候选标题确定模块610具体用于:
根据至少一个标题模板,提取待生成标题文章的核心实体词汇以及核心实体词汇的描述词汇;
将核心实体词汇与描述词汇组合,生成描述型实体词汇;
将描述型实体词汇与至少一个标题模板结合,形成至少一个候选标题。
进一步的,历史标题数据的用户反馈信息包括用户对历史标题所对应文章的点击量数据。
进一步的,装置还包括:
标题过滤模块,用于在根据待生成标题的文章与标题模板确定至少一个候选标题之后,根据语言模型的过滤规则对候选标题进行过滤。
进一步的,装置还包括:
相似度计算模块,用于在根据标题质量筛选参数对各候选标题进行筛选,确定目标标题之前,将候选标题与历史文章标题中的非实体因素进行相似度计算;
质量筛选参数获取模块,用于获取满足相似度要求的历史文章的用户反馈信息,作为候选标题的标题质量筛选参数。
本发明实施例提供的基于人工智能的文章标题生成装置可执行本发明任意实施例所提供的基于人工智能的文章标题生成方法,具备执行基于人工智能的文章标题生成方法相应的功能模块和有益效果。
实施例七
图7为本发明实施例七提供的一种计算机设备的结构示意图。图7示出了适于用来实现本发明实施方式的示例性计算机设备700的框图。图7显示的计算机设备700仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,计算机设备700以通用计算设备的形式表现。计算机设备700的组件可以包括但不限于:一个或者多个处理器或者处理单元701,系统存储器702,连接不同系统组件(包括系统存储器702和处理单元701)的总线703。
总线703表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设备700典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备700访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器702可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)704和/或高速缓存存储器705。计算机设备700可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统706可以用于读写不可移动的、非易失性磁介质(图7未显示,通常称为“硬盘驱动器”)。尽管图7中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线703相连。存储器702可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块707的程序/实用工具708,可以存储在例如存储器702中,这样的程序模块707包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块707通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备700也可以与一个或多个外部设备709(例如键盘、指向设备、显示器712等)通信,还可与一个或者多个使得用户能与该计算机设备700交互的设备通信,和/或与使得该计算机设备700能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口710进行。并且,计算机设备700还可以通过网络适配器711与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器711通过总线703与计算机设备700的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备700使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元701通过运行存储在系统存储器702中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的基于人工智能的文章标题生成方法。
所述方法包括:
根据待生成标题的文章与标题模板确定至少一个候选标题;
根据标题质量筛选参数对各所述候选标题进行筛选,确定目标标题;
将所述目标标题与所述待生成标题文章组合;
其中,所述标题模板和/或标题质量筛选参数根据历史标题数据的用户反馈信息确定。
实施例八
本发明实施例八提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请所有发明实施例提供的基于人工智能的文章标题生成方法。所述方法包括:
根据待生成标题的文章与标题模板确定至少一个候选标题;
根据标题质量筛选参数对各所述候选标题进行筛选,确定目标标题;
将所述目标标题与所述待生成标题文章组合;
其中,所述标题模板和/或标题质量筛选参数根据历史标题数据的用户反馈信息确定。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (16)

1.基于人工智能的文章标题生成方法,其特征在于,包括:
根据待生成标题的文章与标题模板确定至少一个候选标题;
根据标题质量筛选参数对各所述候选标题进行筛选,确定目标标题;
将所述目标标题与所述待生成标题文章组合;
其中,所述标题模板和/或标题质量筛选参数根据历史标题数据的用户反馈信息确定。
2.根据权利要求1所述的方法,其特征在于,在根据待生成标题的文章与标题模板确定至少一个候选标题之前,还包括:
获取至少一个自然语义的非结构化文章,根据非结构化文章的用户反馈信息进行筛选;
从筛选后的非结构化文章中提取原始文章标题;
将所述原始文章标题进行聚类,根据聚类结果确定至少一个标题模板。
3.根据权利要求2所述的方法,其特征在于,所述从筛选后的非结构化文章中提取原始文章标题之前,还包括:
获取至少一个结构化数据生成的文章,提取所述结构化数据文章的核心内容,根据所述核心内容确定预设基准标题;
相应的,将所述原始文章标题进行聚类包括:
以所述预设基准标题作为聚类核心,对所述原始文章标题进行聚类。
4.根据权利要求2所述的方法,其特征在于,在获取至少一个自然语义的非结构化文章之后,所述方法还包括:
提取所述原始文章标题的实体词汇和所述实体词汇的描述词汇,并对应记录;
相应的,根据待生成标题的文章与标题模板确定至少一个候选标题,包括:
根据至少一个标题模板,提取所述待生成标题文章的核心实体词汇以及所述核心实体词汇的描述词汇;
将所述核心实体词汇与所述描述词汇组合,生成描述型实体词汇;
将所述描述型实体词汇与所述至少一个标题模板结合,形成所述至少一个候选标题。
5.根据权利要求1-4任一所述的方法,其特征在于,所述历史标题数据的用户反馈信息包括用户对历史标题所对应文章的点击量数据。
6.根据权利要求1所述的方法,其特征在于,在根据待生成标题的文章与标题模板确定至少一个候选标题之后,所述方法还包括:
根据语言模型的过滤规则对所述候选标题进行过滤。
7.根据权利要求1所述的方法,其特征在于,根据标题质量筛选参数对各所述候选标题进行筛选,确定目标标题之前,还包括:
将候选标题与历史文章标题中的非实体因素进行相似度计算;
获取满足相似度要求的历史文章的用户反馈信息,作为候选标题的标题质量筛选参数。
8.基于人工智能的文章标题生成装置,其特征在于,包括:
候选标题确定模块,用于根据待生成标题的文章与标题模板确定至少一个候选标题;
目标标题确定模块,用于根据标题质量筛选参数对各所述候选标题进行筛选,确定目标标题;
组合模块,用于将所述目标标题与所述待生成标题文章组合;
其中,所述标题模板和/或标题质量筛选参数根据历史标题数据的用户反馈信息确定。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
文章筛选模块,用于在根据待生成标题的文章与标题模板确定至少一个候选标题之前,获取至少一个自然语义的非结构化文章,根据非结构化文章的用户反馈信息进行筛选;
文章标题提取模块,用于从筛选后的非结构化文章中提取原始文章标题;
标题模板确定模块,用于将所述原始文章标题进行聚类,根据聚类结果确定至少一个标题模板。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
预设基准标题确定模块,用于在从筛选后的非结构化文章中提取原始文章标题之前,获取至少一个结构化数据生成的文章,提取所述结构化数据文章的核心内容,根据所述核心内容确定预设基准标题;
相应的,标题模板确定模块具体用于:
以所述预设基准标题作为聚类核心,对所述原始文章标题进行聚类。
11.根据权利要求9所述的装置,其特征在于,所述装置还包括:
词汇提取模块,用于在获取至少一个自然语义的非结构化文章之后,提取所述原始文章标题的实体词汇和所述实体词汇的描述词汇,并对应记录;
相应的,所述候选标题确定模块具体用于:
根据至少一个标题模板,提取所述待生成标题文章的核心实体词汇以及所述核心实体词汇的描述词汇;
将所述核心实体词汇与所述描述词汇组合,生成描述型实体词汇;
将所述描述型实体词汇与所述至少一个标题模板结合,形成所述至少一个候选标题。
12.根据权利要求8-11任一所述的装置,其特征在于,所述历史标题数据的用户反馈信息包括用户对历史标题所对应文章的点击量数据。
13.根据权利要求8所述的装置,其特征在于,所述装置还包括:
标题过滤模块,用于在根据待生成标题的文章与标题模板确定至少一个候选标题之后,根据语言模型的过滤规则对所述候选标题进行过滤。
14.根据权利要求8所述的装置,其特征在于,所述装置还包括:
相似度计算模块,用于在根据标题质量筛选参数对各所述候选标题进行筛选,确定目标标题之前,将候选标题与历史文章标题中的非实体因素进行相似度计算;
质量筛选参数获取模块,用于获取满足相似度要求的历史文章的用户反馈信息,作为候选标题的标题质量筛选参数。
15.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一所述的方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN201710166238.5A 2017-03-20 2017-03-20 基于人工智能的文章标题生成方法、装置、设备及介质 Pending CN106933808A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710166238.5A CN106933808A (zh) 2017-03-20 2017-03-20 基于人工智能的文章标题生成方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710166238.5A CN106933808A (zh) 2017-03-20 2017-03-20 基于人工智能的文章标题生成方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN106933808A true CN106933808A (zh) 2017-07-07

Family

ID=59432446

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710166238.5A Pending CN106933808A (zh) 2017-03-20 2017-03-20 基于人工智能的文章标题生成方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN106933808A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832299A (zh) * 2017-11-17 2018-03-23 北京百度网讯科技有限公司 基于人工智能的标题的改写处理方法、装置及可读介质
CN108509417A (zh) * 2018-03-20 2018-09-07 腾讯科技(深圳)有限公司 标题生成方法及设备、存储介质、服务器
CN108932220A (zh) * 2018-06-29 2018-12-04 北京百度网讯科技有限公司 文章生成方法和装置
CN109657223A (zh) * 2018-12-18 2019-04-19 安徽省泰岳祥升软件有限公司 一种公文自动写作方法及装置
CN110134931A (zh) * 2019-05-14 2019-08-16 北京字节跳动网络技术有限公司 媒介标题生成方法、装置、电子设备及可读介质
CN110555199A (zh) * 2018-06-01 2019-12-10 北京百度网讯科技有限公司 基于热点素材的文章生成方法、装置、设备及存储介质
CN110555198A (zh) * 2018-05-31 2019-12-10 北京百度网讯科技有限公司 用于生成文章的方法、装置、设备和计算机可读存储介质
CN110555196A (zh) * 2018-05-30 2019-12-10 北京百度网讯科技有限公司 用于自动生成文章的方法、装置、设备和存储介质
CN111191049A (zh) * 2020-01-03 2020-05-22 北京明略软件系统有限公司 信息推送方法、装置、计算机设备和存储介质
CN111274799A (zh) * 2020-01-09 2020-06-12 天津车之家数据信息技术有限公司 一种文章标题生成方法、装置及存储介质
CN111353070A (zh) * 2020-02-18 2020-06-30 北京百度网讯科技有限公司 视频标题的处理方法、装置、电子设备及可读存储介质
CN111401044A (zh) * 2018-12-27 2020-07-10 北京字节跳动网络技术有限公司 一种标题生成方法、装置、终端设备及存储介质
CN111680482A (zh) * 2020-05-07 2020-09-18 车智互联(北京)科技有限公司 一种标题图文生成方法及计算设备
CN111723295A (zh) * 2020-06-30 2020-09-29 腾讯科技(深圳)有限公司 一种内容分发方法、装置和存储介质
CN111753533A (zh) * 2019-04-25 2020-10-09 北京沃东天骏信息技术有限公司 标题文本生成方法、装置、计算机存储介质和电子设备
CN111898369A (zh) * 2020-08-17 2020-11-06 腾讯科技(深圳)有限公司 文章标题生成方法、模型的训练方法、装置和电子设备
CN112016307A (zh) * 2020-08-13 2020-12-01 深圳市欢太科技有限公司 一种文本信息的标题生成方法、电子设备和存储介质
CN112540964A (zh) * 2019-09-23 2021-03-23 北京国双科技有限公司 文书文号生成方法及相关装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104035991A (zh) * 2014-06-09 2014-09-10 贝壳网际(北京)安全技术有限公司 一种新闻标题的显示方法及用于提供新闻页面的服务器
CN105765566A (zh) * 2013-06-27 2016-07-13 谷歌公司 标题的自动生成

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105765566A (zh) * 2013-06-27 2016-07-13 谷歌公司 标题的自动生成
CN104035991A (zh) * 2014-06-09 2014-09-10 贝壳网际(北京)安全技术有限公司 一种新闻标题的显示方法及用于提供新闻页面的服务器

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832299B (zh) * 2017-11-17 2021-11-23 北京百度网讯科技有限公司 基于人工智能的标题的改写处理方法、装置及可读介质
CN107832299A (zh) * 2017-11-17 2018-03-23 北京百度网讯科技有限公司 基于人工智能的标题的改写处理方法、装置及可读介质
CN108509417A (zh) * 2018-03-20 2018-09-07 腾讯科技(深圳)有限公司 标题生成方法及设备、存储介质、服务器
CN110555196B (zh) * 2018-05-30 2023-07-18 北京百度网讯科技有限公司 用于自动生成文章的方法、装置、设备和存储介质
CN110555196A (zh) * 2018-05-30 2019-12-10 北京百度网讯科技有限公司 用于自动生成文章的方法、装置、设备和存储介质
CN110555198A (zh) * 2018-05-31 2019-12-10 北京百度网讯科技有限公司 用于生成文章的方法、装置、设备和计算机可读存储介质
CN110555198B (zh) * 2018-05-31 2023-05-23 北京百度网讯科技有限公司 用于生成文章的方法、装置、设备和计算机可读存储介质
CN110555199A (zh) * 2018-06-01 2019-12-10 北京百度网讯科技有限公司 基于热点素材的文章生成方法、装置、设备及存储介质
CN108932220A (zh) * 2018-06-29 2018-12-04 北京百度网讯科技有限公司 文章生成方法和装置
CN109657223B (zh) * 2018-12-18 2023-06-09 安徽省泰岳祥升软件有限公司 一种公文自动写作方法及装置
CN109657223A (zh) * 2018-12-18 2019-04-19 安徽省泰岳祥升软件有限公司 一种公文自动写作方法及装置
CN111401044A (zh) * 2018-12-27 2020-07-10 北京字节跳动网络技术有限公司 一种标题生成方法、装置、终端设备及存储介质
CN111753533B (zh) * 2019-04-25 2024-04-05 北京沃东天骏信息技术有限公司 标题文本生成方法、装置、计算机存储介质和电子设备
CN111753533A (zh) * 2019-04-25 2020-10-09 北京沃东天骏信息技术有限公司 标题文本生成方法、装置、计算机存储介质和电子设备
CN110134931B (zh) * 2019-05-14 2023-09-22 北京字节跳动网络技术有限公司 媒介标题生成方法、装置、电子设备及可读介质
CN110134931A (zh) * 2019-05-14 2019-08-16 北京字节跳动网络技术有限公司 媒介标题生成方法、装置、电子设备及可读介质
CN112540964A (zh) * 2019-09-23 2021-03-23 北京国双科技有限公司 文书文号生成方法及相关装置
CN111191049A (zh) * 2020-01-03 2020-05-22 北京明略软件系统有限公司 信息推送方法、装置、计算机设备和存储介质
CN111191049B (zh) * 2020-01-03 2023-04-07 北京明略软件系统有限公司 信息推送方法、装置、计算机设备和存储介质
CN111274799A (zh) * 2020-01-09 2020-06-12 天津车之家数据信息技术有限公司 一种文章标题生成方法、装置及存储介质
CN111274799B (zh) * 2020-01-09 2023-06-23 天津车之家数据信息技术有限公司 一种文章标题生成方法、装置及存储介质
CN111353070A (zh) * 2020-02-18 2020-06-30 北京百度网讯科技有限公司 视频标题的处理方法、装置、电子设备及可读存储介质
CN111353070B (zh) * 2020-02-18 2023-08-18 北京百度网讯科技有限公司 视频标题的处理方法、装置、电子设备及可读存储介质
CN111680482A (zh) * 2020-05-07 2020-09-18 车智互联(北京)科技有限公司 一种标题图文生成方法及计算设备
CN111680482B (zh) * 2020-05-07 2024-04-12 车智互联(北京)科技有限公司 一种标题图文生成方法及计算设备
CN111723295A (zh) * 2020-06-30 2020-09-29 腾讯科技(深圳)有限公司 一种内容分发方法、装置和存储介质
CN111723295B (zh) * 2020-06-30 2023-10-17 腾讯科技(深圳)有限公司 一种内容分发方法、装置和存储介质
CN112016307A (zh) * 2020-08-13 2020-12-01 深圳市欢太科技有限公司 一种文本信息的标题生成方法、电子设备和存储介质
CN111898369A (zh) * 2020-08-17 2020-11-06 腾讯科技(深圳)有限公司 文章标题生成方法、模型的训练方法、装置和电子设备
CN111898369B (zh) * 2020-08-17 2024-03-08 腾讯科技(深圳)有限公司 文章标题生成方法、模型的训练方法、装置和电子设备

Similar Documents

Publication Publication Date Title
CN106933808A (zh) 基于人工智能的文章标题生成方法、装置、设备及介质
Nan et al. Improving factual consistency of abstractive summarization via question answering
US10949744B2 (en) Recurrent neural network architectures which provide text describing images
Xu et al. Towards accurate text-based image captioning with content diversity exploration
Wang et al. Scene graph parsing as dependency parsing
CN108491443B (zh) 由计算机实施的与用户对话的方法和计算机系统
US20240070457A1 (en) System to detect, assess and counter disinformation
CN111143610A (zh) 一种内容推荐方法、装置、电子设备和存储介质
CN109657054A (zh) 摘要生成方法、装置、服务器及存储介质
Heller et al. Interactive video retrieval evaluation at a distance: comparing sixteen interactive video search systems in a remote setting at the 10th Video Browser Showdown
CN105824923A (zh) 影视资源推荐方法及装置
US11521149B2 (en) Generating sentiment metrics using emoji selections
CN111159414B (zh) 文本分类方法及系统、电子设备、计算机可读存储介质
CN109947993A (zh) 基于语音识别的情节跳转方法、装置及计算机设备
Müller et al. Findings of the first wmt shared task on sign language translation (wmt-slt22)
CN109815482B (zh) 一种新闻交互的方法、装置、设备和计算机存储介质
Lokoć et al. A W2VV++ case study with automated and interactive text-to-video retrieval
Han et al. Humour and TikTok memes during the 2020 pandemic lockdown: Tensions of gender and care faced by Chinese mothers working from home
US20180239750A1 (en) Method and device for generating live text broadcasting content using historical broadcasting text
CN112163560A (zh) 一种视频信息处理方法、装置、电子设备及存储介质
CN107391524A (zh) 增强消息交换话题
Liang et al. ISIA at the ImageCLEF 2017 Image Caption Task.
CN108959412A (zh) 标注数据的生成方法、装置、设备及存储介质
Dessì et al. Communication breakdown: On the low mutual intelligibility between human and neural captioning
CN116541114A (zh) 一种信息展示方法、装置、计算机设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170707

RJ01 Rejection of invention patent application after publication