CN106874248A - 基于人工智能的文章生成方法和装置 - Google Patents

基于人工智能的文章生成方法和装置 Download PDF

Info

Publication number
CN106874248A
CN106874248A CN201710047782.8A CN201710047782A CN106874248A CN 106874248 A CN106874248 A CN 106874248A CN 201710047782 A CN201710047782 A CN 201710047782A CN 106874248 A CN106874248 A CN 106874248A
Authority
CN
China
Prior art keywords
article
main body
basic framework
paragraph
search word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710047782.8A
Other languages
English (en)
Other versions
CN106874248B (zh
Inventor
袁洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710047782.8A priority Critical patent/CN106874248B/zh
Publication of CN106874248A publication Critical patent/CN106874248A/zh
Application granted granted Critical
Publication of CN106874248B publication Critical patent/CN106874248B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种基于人工智能的文章生成方法和装置,其中,方法包括:通过根据文章语料,预先建立模板库之后,选取模板库中的目标基础框架,进而在预设数据库中,根据目标基础框架中各段落所描述的对象和所涉及的字段进行搜索,得到对象对应的各字段内容,并在目标基础框架中的每一段落位置,分别对应填充搜索到的各字段内容,得到文章主体,最后根据在标题库中匹配得到的文章主体的目标标题,以及该文章主体,拼接生成文章。由于基础框架用于指示对应类别的文章中,各段落所描述的对象,以及所述段落所涉及的字段,从而根据预设数据库中的字段内容对基础框架进行填充后能够自动生成文章,避免了人工编辑,解决了现有技术中人工编写文章效率较低的技术问题。

Description

基于人工智能的文章生成方法和装置
技术领域
本发明涉及信息处理技术领域,尤其涉及一种基于人工智能的文章生成方法和装置。
背景技术
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。
在现有技术中,对于期刊、文献、新闻等文章,通常都是由人工进行编写。但这种人工编写的方式,不仅需要消耗大量的时间才能够完成有限数量的文章编写工作,而且所编写的文章质量与人员经验水平密切相关,导致文章质量不易控制。可见,现有技术中,这种由人工编写文章的方式,效率较低。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种基于人工智能的文章生成方法,以提高文章编写的效率。
本发明的第二个目的在于提出一种基于人工智能的文章生成装置。
本发明的第三个目的在于提出另一种基于人工智能的文章生成装置。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了一种基于人工智能的文章生成方法,包括:
根据文章语料,预先建立模板库;所述模板库包括各类别的基础框架,所述基础框架用于指示对应类别的文章中,各段落所描述的对象,以及所述段落所涉及的字段;
选取所述模板库中的目标基础框架;
在预设数据库中,根据所述目标基础框架中各段落所描述的对象和所涉及的字段进行搜索,得到对象对应的各字段内容;
在所述目标基础框架中的每一段落位置,分别对应填充搜索到的各字段内容,得到文章主体;
根据在标题库中匹配得到的所述文章主体的目标标题,以及所述文章主体,拼接生成文章。
本发明实施例的基于人工智能的文章生成方法,通过根据文章语料,预先建立模板库之后,选取模板库中的目标基础框架,进而在预设数据库中,根据目标基础框架中各段落所描述的对象和所涉及的字段进行搜索,得到对象对应的各字段内容,并在目标基础框架中的每一段落位置,分别对应填充搜索到的各字段内容,得到文章主体,最后根据在标题库中匹配得到的文章主体的目标标题,以及该文章主体,拼接生成文章。由于基础框架用于指示对应类别的文章中,各段落所描述的对象,以及所述段落所涉及的字段,从而根据预设数据库中的字段内容对基础框架进行填充后能够自动生成文章,避免了人工编辑,解决了现有技术中人工编写文章效率较低的技术问题。
为达上述目的,本发明第二方面实施例提出了一种基于人工智能的文章生成装置,包括:
建立模块,用于根据文章语料,预先建立模板库;所述模板库包括各类别的基础框架,所述基础框架用于指示对应类别的文章中,各段落所描述的对象,以及所述段落所涉及的字段;
选取模块,用于选取所述模板库中的目标基础框架;
查询模块,用于在预设数据库中,根据所述目标基础框架中各段落所描述的对象和所涉及的字段进行搜索,得到对象对应的各字段内容;
填充模块,用于在所述目标基础框架中的每一段落位置,分别对应填充搜索到的各字段内容,得到文章主体;
生成模块,用于根据在标题库中匹配得到的所述文章主体的目标标题,以及所述文章主体,拼接生成文章。
本发明实施例的基于人工智能的文章生成装置,通过根据文章语料,预先建立模板库之后,选取模板库中的目标基础框架,进而在预设数据库中,根据目标基础框架中各段落所描述的对象和所涉及的字段进行搜索,得到对象对应的各字段内容,并在目标基础框架中的每一段落位置,分别对应填充搜索到的各字段内容,得到文章主体,最后根据在标题库中匹配得到的文章主体的目标标题,以及该文章主体,拼接生成文章。由于基础框架用于指示对应类别的文章中,各段落所描述的对象,以及所述段落所涉及的字段,从而根据预设数据库中的字段内容对基础框架进行填充后能够自动生成文章,避免了人工编辑,解决了现有技术中人工编写文章效率较低的技术问题。
为达上述目的,本发明第三方面实施例提出了另一种基于人工智能的文章生成装置,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现第一方面所述的文章生成方法。
为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述的文章生成方法。
为了实现上述目的,本发明第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行第一方面所述的文章生成方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例所提供的基于人工智能的文章生成方法的流程示意图;
图2为本发明实施例提供的另一种基于人工智能的文章生成方法的流程示意图;
图3为所生成的文章的示意;
图4为本发明实施例提供的一种文章生成装置的结构示意图;以及
图5为本发明实施例所提供的另一种文章生成装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的基于人工智能的文章生成方法和装置。
图1为本发明实施例所提供的基于人工智能的文章生成方法的流程示意图。
本发明实施例提供了基于人工智能的文章生成方法,以实现自动生成期刊文章,如图1所示,该方法包括以下步骤:
步骤101,根据文章语料,预先建立模板库。
其中,模板库包括各类别的基础框架,基础框架用于指示对应类别的文章中,各段落所描述的对象,以及各段落所涉及的字段。
具体地,基础框架中包括了多个段落,各个段落均有各自所描述的对象和所涉及的字段。具体来说,这里的对象是该段落中各句子沿着某一主线进行描述时所涉及的元素,也可以称为主干元素,例如:野生动物园介绍、北京的气候特点等等;而段落所涉及的字段,是该段落中各句子沿着该一主线进行描述时,会提及的高频字段,例如:在描述的对象为野生动物园介绍时,会提及的高频字段可以包括“门票价格”和“开放时间”等等。
步骤102,选取模板库中的目标基础框架。
具体地,由于模板库包括各类别的基础框架,因此,可以针对所需生成文章的类别,对应选取模板库中的目标基础框架。
步骤103,在预设数据库中,根据目标基础框架中各段落所描述的对象和所涉及的字段进行搜索,得到对象对应的各字段内容。
具体地,这里的预设数据库,包括了基于各字段描述同一对象时的不同描述内容,这里的描述内容就是字段内容,具体可以记载对象、字段及字段内容之间的对应关系。
步骤104,在目标基础框架中的每一段落位置,分别对应填充搜索到的各字段内容,得到文章主体。
进一步,模板库还包括评价性语句表。其中,评价性语句表用于指示用户针对各对象的属性取值的评价结论,从而在目标基础框架中的每一段落位置,分别对应填充搜索到的各字段内容之后,还包括:当所述目标基础框架各段落所描述的对象中,包括用于记载所述评价结论的评价对象时,针对字段内容中所记载的对象的属性取值,查询所述评价性语句表,得到所述字段内容的评价结论;将字段内容的评价结论插入到所述文章主体中,使得生成的文章主体不仅包括描述性内容,而且还可以自动生成符合用户评价标准的评价结论。
进一步,模板库还包括润色语句集,所述润色语句集用于指示属于同一语义的短语集合,从而在得到文章主体之后,还可以利用所述润色语句集中的各短语,对所述文章主体中属于同一语义的短语进行随机替换。使得生成的文章用词更加灵活。
步骤105,根据在标题库中匹配得到的文章主体的目标标题,以及文章主体,拼接生成文章。
本实施例中,通过根据文章语料,预先建立模板库之后,根据所需类别,选取模板库中的目标基础框架,进而在预设数据库中,根据目标基础框架中各段落所描述的对象和所涉及的字段进行搜索,得到对象对应的各字段内容,并在目标基础框架中的每一段落位置,分别对应填充搜索到的各字段内容,得到文章主体,最后根据在标题库中匹配得到的文章主体的目标标题,以及该文章主体,拼接生成文章。由于基础框架用于指示对应类别的文章中,各段落所描述的对象,以及所述段落所涉及的字段,从而根据预设数据库中的字段内容对基础框架进行填充后能够自动生成文章,避免了人工编辑,解决了现有技术中人工编写文章效率较低的技术问题。
为了清楚说明上一实施例,本实施例提供了另一种基于人工智能的文章生成方法,图2为本发明实施例提供的另一种基于人工智能的文章生成方法的流程示意图,如图2所示,该方法可以包括以下步骤:
步骤201,抽取语料库中文章语料作为训练集。
具体地,可以抽取特定类别的文章语料,例如文章语料可以包括每月景点推荐、十大热门千元机、运动型轿车关注榜等等。针对各类别的文章语料,采用人工标注或者自动识别的方式确定出各段落的段落大意和各段落所描述的对象,将文章语料,以及针对文章语料标注的段落大意和对象作为训练集。
步骤202,根据训练集,挖掘生成模板库。
其中,模板库包括各类别的基础框架、评价性语句表和润色语句集。
具体来说,第一方面,需要生成模板库中的各基础框架,该基础框架用于指示对应类别的文章中,各段落所描述的对象,以及所述段落所涉及的字段。在生成基础框架时,采用文本训练方法,对某一类别的训练集进行训练,挖掘得到该类别的文章通常划分的段落,针对每一段落确定出描述的对象和该段落常提及的字段。由各段落所描述的对象和所涉及的字段,构成对应类别的基础框架。从而根据基础框架能够确定出各段落所需描述的内容。
例如:针对旅游类,基础框架可以包括至少两个段落,第一段落所描述的对象可以为地理介绍,所涉及的字段可以包括“面积”、“地理位置”和“称誉”等;第二段落所描述的对象可以为景观介绍,所涉及的字段可以包括“开放时间”和“门票价格”等等。
第二方面,需要生成模板库中的评价性语句表。其中,评价性语句表用于指示用户针对各对象的属性取值的评价结论。这里的评价结论可以包括“性价比高”还是“性价比低”等等。评价性语句表可以包括多个列,各列分别对应指示对象、属性、属性取值和评价结论之间的对应关系。
第三方面,需要生成模板库中的润色语句集,润色语句集用于指示属于同一语义的短语集合,从而在得到文章主体之后,还可以利用所述润色语句集中的各短语,对所述文章主体中属于同一语义的短语进行随机替换。
步骤203,周期性或者定时查询用户历史输入的搜索词的热度,将热度最高的搜索词确定为目标搜索词,根据目标搜索词,查询搜索词与类别的对应关系,确定所属的类别。
其中,热度是根据用户的点击次数、搜索次数和/或浏览时长确定的。
步骤204,根据确定出的类别,选取模板库中的目标基础框架,在预设数据库中,根据该目标基础框架中各段落所描述的对象和所涉及的字段进行搜索,得到对象对应的各字段内容。
其中,这里的预设数据库可以存储有对象、字段和字段内容,以及这三者之间的对应关系,在具体实现上,该数据库可以为知识图谱数据库,通过数据接口获取知识图谱数据库中的相关内容。
步骤205,在目标基础框架中的每一段落位置,分别对应填充搜索到的各字段内容,得到文章主体。
具体地,当目标基础框架各段落所描述的对象中,包括用于记载所述评价结论的评价对象时,针对所述字段内容中所记载的对象的属性取值,查询所述评价性语句表,得到所述字段内容的评价结论,将所述字段内容的评价结论插入到所述文章主体中。
步骤206,利用润色语句集中的各短语,对文章主体中属于同一语义的短语进行随机替换。
其中,在得到文章主体之后,还可以利用润色语句集中的各短语,对文章主体中属于同一语义的短语进行随机替换。使得生成的文章用词更加灵活。这是由于,在预设数据库中是根据该目标基础框架中各段落所描述的对象和所涉及的字段进行搜索,因此,所得到的各字段内容通常是包含搜索所采用的字段。例如,采用“开放时间”这一字段进行搜索时,填充到文章主体中的字段内容通常也是包含“开放时间”的,可以将“开放时间”替换为“游览时段”或“在某某时间内可以入园游览”等等表达相同含义的短语。
步骤207,对生成的文章主体进行质检。
具体地,针对包含字符数量低于第一阈值的文章主体,进行删除或重新生成;和/或,针对与历史文章重复率高于第二阈值的文章主体,进行删除或重新生成;和/或,针对各段落之间语义相关性低于第三阈值的文章主体,进行删除或重新生成。其中,第一阈值、所述第二阈值和所述第三阈值是根据用户对历史文章的操作行为所确定出的,从而对文章主体的质量控制能够更加贴合用户的阅读需求。
步骤208,根据在标题库中匹配得到的文章主体的目标标题,以及文章主体,拼接生成文章。
图3为所生成的文章的示意,如图3所示,包括有标题、文章主体。其中,文章主体部分划分为两个段落,第一个段落所描述的对象为地理介绍,所涉及的字段可以包括“面积”和“称誉”等;第二段落所描述的对象可以为景观介绍,后续所涉及的字段可以包括“开放时间”和“门票价格”等等(图中未标出)。如图3所示,在文章主体内,不仅可以包括文字,还可以包括图片,也就是说,本实施例中的字段内容可以包括文字,还可以包括图片。
本实施例中,通过根据文章语料,预先建立模板库之后,根据所需类别,选取模板库中的目标基础框架,进而在预设数据库中,根据目标基础框架中各段落所描述的对象和所涉及的字段进行搜索,得到对象对应的各字段内容,并在目标基础框架中的每一段落位置,分别对应填充搜索到的各字段内容,得到文章主体,最后根据在标题库中匹配得到的文章主体的目标标题,以及该文章主体,拼接生成文章。由于基础框架用于指示对应类别的文章中,各段落所描述的对象,以及所述段落所涉及的字段,从而根据预设数据库中的字段内容对基础框架进行填充后能够自动生成文章,避免了人工编辑,解决了现有技术中人工编写文章效率较低的技术问题。
为了实现上述实施例,本发明还提出一种文章生成装置。
图4为本发明实施例提供的一种文章生成装置的结构示意图。
如图4所示,该文章生成装置包括:建立模块41、选取模块42、查询模块43、填充模块44和生成模块45。
建立模块41,用于根据文章语料,预先建立模板库。
其中,模板库包括各类别的基础框架,所述基础框架用于指示对应类别的文章中,各段落所描述的对象,以及所述段落所涉及的字段。
选取模块42,用于选取所述模板库中的目标基础框架。
查询模块43,用于在预设数据库中,根据所述目标基础框架中各段落所描述的对象和所涉及的字段进行搜索,得到对象对应的各字段内容。
填充模块44,用于在所述目标基础框架中的每一段落位置,分别对应填充搜索到的各字段内容,得到文章主体。
生成模块45,用于根据在标题库中匹配得到的所述文章主体的目标标题,以及所述文章主体,拼接生成文章。
进一步地,本发明实施例还提供了另一种可能的实现方式,图5为本发明实施例所提供的另一种文章生成装置的结构示意图,如图5所示,文章生成装置,还包括:搜索模块46和质检模块47。
搜索模块46,用于在用户输入的搜索词中,根据搜索词的热度,选取出目标搜索词;根据所述目标搜索词,查询搜索词与类别的对应关系,确定所属的类别。
具体地,搜索模块46,具体用于:周期性或者定时查询用户历史输入的搜索词的热度;将热度最高的搜索词确定为所述目标搜索词。根据所述目标搜索词,查询搜索词与类别的对应关系,确定所属的类别。其中,热度是根据用户的点击次数、搜索次数和/或浏览时长确定的。
基于此,选取模块42,具体用于根据确定出的类别,选取所述类别对应的目标基础框架。
质检模块47,用于针对包含字符数量低于第一阈值的文章主体,进行删除或重新生成;和/或,针对与历史文章重复率高于第二阈值的文章主体,进行删除或重新生成;和/或,针对各段落之间语义相关性低于第三阈值的文章主体,进行删除或重新生成。其中,第一阈值、第二阈值和第三阈值是根据用户对历史文章的操作行为所确定出的。
进一步,模板库还包括润色语句集,所述润色语句集用于指示属于同一语义的短语集合。作为一种可能的实现方式,润色语句集是对所述文章语料,结合上下文进行语义分析所得到的。基于此,文章生成装置,还包括:润色模块48。
润色模块48,用于利用所述润色语句集中的各短语,对所述文章主体中属于同一语义的短语进行随机替换。
更进一步,模板库还包括评价性语句表,所述评价性语句表用于指示用户针对各对象的属性取值的评价结论。基于此,文章生成装置,还包括:评价模块49。
评价模块49,用于针对所述字段内容中所记载的对象的属性取值,查询所述评价性语句表,得到所述字段内容的评价结论;将所述字段内容的评价结论插入到所述文章主体中。
具体地,评价模块49,具体用于:当所述目标基础框架各段落所描述的对象中,包括用于记载所述评价结论的评价对象时,针对所述字段内容中所记载的对象的属性取值,查询所述评价性语句表。
需要说明的是,前述对方法实施例的解释说明也适用于该实施例的装置,此处不再赘述。
本发明实施例中,通过根据文章语料,预先建立模板库之后,根据所需类别,选取模板库中的目标基础框架,进而在预设数据库中,根据目标基础框架中各段落所描述的对象和所涉及的字段进行搜索,得到对象对应的各字段内容,并在目标基础框架中的每一段落位置,分别对应填充搜索到的各字段内容,得到文章主体,最后根据在标题库中匹配得到的文章主体的目标标题,以及该文章主体,拼接生成文章。由于基础框架用于指示对应类别的文章中,各段落所描述的对象,以及所述段落所涉及的字段,从而根据预设数据库中的字段内容对基础框架进行填充后能够自动生成文章,避免了人工编辑,解决了现有技术中人工编写文章效率较低的技术问题。
为了实现上述实施例,本发明还提出另一种基于人工智能的文章生成装置,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现前述实施例所提供的文章生成方法。
为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述实施例所提供的文章生成方法。
为了实现上述实施例,本发明还提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行前述实施例所提供的基于人工智能的文章生成方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (22)

1.一种基于人工智能的文章生成方法,其特征在于,包括以下步骤:
根据文章语料,预先建立模板库;所述模板库包括各类别的基础框架,所述基础框架用于指示对应类别的文章中,各段落所描述的对象,以及所述段落所涉及的字段;
选取所述模板库中的目标基础框架;
在预设数据库中,根据所述目标基础框架中各段落所描述的对象和所涉及的字段进行搜索,得到对象对应的各字段内容;
在所述目标基础框架中的每一段落位置,分别对应填充搜索到的各字段内容,得到文章主体;
根据在标题库中匹配得到的所述文章主体的目标标题,以及所述文章主体,拼接生成文章。
2.根据权利要求1所述的文章生成方法,其特征在于,所述选取所述模板库中的目标基础框架之前,还包括:
在用户输入的搜索词中,根据搜索词的热度,选取出目标搜索词;
根据所述目标搜索词,查询搜索词与类别的对应关系,确定所属的类别;
所述选取所述模板库中的目标基础框架,包括:
根据确定出的类别,选取所述类别对应的目标基础框架。
3.根据权利要求2所述的文章生成方法,其特征在于,所述在用户输入的搜索词中,根据搜索词的热度,选取出目标搜索词,包括:
周期性或者定时查询用户历史输入的搜索词的热度;
将热度最高的搜索词确定为所述目标搜索词。
4.根据权利要求2所述的文章生成方法,其特征在于,所述热度是根据用户的点击次数、搜索次数和/或浏览时长确定的。
5.根据权利要求1-4任一项所述的文章生成方法,其特征在于,所述模板库还包括润色语句集,所述润色语句集用于指示属于同一语义的短语集合;所述得到文章主体之后,还包括:
利用所述润色语句集中的各短语,对所述文章主体中属于同一语义的短语进行随机替换。
6.根据权利要求5所述的文章生成方法,其特征在于,所述润色语句集是对所述文章语料,结合上下文进行语义分析所得到的。
7.根据权利要求1-4任一项所述的文章生成方法,其特征在于,所述模板库还包括评价性语句表,所述评价性语句表用于指示用户针对各对象的属性取值的评价结论;所述在所述目标基础框架中的每一段落位置,分别对应填充搜索到的各字段内容之后,还包括:
针对所述字段内容中所记载的对象的属性取值,查询所述评价性语句表,得到所述字段内容的评价结论;
将所述字段内容的评价结论插入到所述文章主体中。
8.根据权利要求7所述的文章生成方法,其特征在于,所述针对所述字段内容中所记载的对象的属性取值,查询所述评价性语句表,包括:
当所述目标基础框架各段落所描述的对象中,包括用于记载所述评价结论的评价对象时,针对所述字段内容中所记载的对象的属性取值,查询所述评价性语句表。
9.根据权利要求1-4任一项所述的文章生成方法,其特征在于,所述得到文章主体之后,还包括:
针对包含字符数量低于第一阈值的文章主体,进行删除或重新生成;
和/或,针对与历史文章重复率高于第二阈值的文章主体,进行删除或重新生成;
和/或,针对各段落之间语义相关性低于第三阈值的文章主体,进行删除或重新生成。
10.根据权利要求9所述的文章生成方法,其特征在于,所述第一阈值、所述第二阈值和所述第三阈值是根据用户对历史文章的操作行为所确定出的。
11.一种基于人工智能的文章生成装置,其特征在于,包括:
建立模块,用于根据文章语料,预先建立模板库;所述模板库包括各类别的基础框架,所述基础框架用于指示对应类别的文章中,各段落所描述的对象,以及所述段落所涉及的字段;
选取模块,用于选取所述模板库中的目标基础框架;
查询模块,用于在预设数据库中,根据所述目标基础框架中各段落所描述的对象和所涉及的字段进行搜索,得到对象对应的各字段内容;
填充模块,用于在所述目标基础框架中的每一段落位置,分别对应填充搜索到的各字段内容,得到文章主体;
生成模块,用于根据在标题库中匹配得到的所述文章主体的目标标题,以及所述文章主体,拼接生成文章。
12.根据权利要求11所述的文章生成装置,其特征在于,所述装置,还包括:
搜索模块,用于在用户输入的搜索词中,根据搜索词的热度,选取出目标搜索词;根据所述目标搜索词,查询搜索词与类别的对应关系,确定所属的类别;
所述选取模块,具体用于根据确定出的类别,选取所述类别对应的目标基础框架。
13.根据权利要求12所述的文章生成装置,其特征在于,所述搜索模块,具体用于:
周期性或者定时查询用户历史输入的搜索词的热度;将热度最高的搜索词确定为所述目标搜索词。
14.根据权利要求12所述的文章生成装置,其特征在于,所述热度是根据用户的点击次数、搜索次数和/或浏览时长确定的。
15.根据权利要求11-14任一项所述的文章生成装置,其特征在于,所述模板库还包括润色语句集,所述润色语句集用于指示属于同一语义的短语集合;所述装置,还包括:
润色模块,用于利用所述润色语句集中的各短语,对所述文章主体中属于同一语义的短语进行随机替换。
16.根据权利要求15所述的文章生成装置,其特征在于,所述润色语句集是对所述文章语料,结合上下文进行语义分析所得到的。
17.根据权利要求11-14任一项所述的文章生成装置,其特征在于,所述模板库还包括评价性语句表,所述评价性语句表用于指示用户针对各对象的属性取值的评价结论;所述装置,还包括:
评价模块,用于针对所述字段内容中所记载的对象的属性取值,查询所述评价性语句表,得到所述字段内容的评价结论;将所述字段内容的评价结论插入到所述文章主体中。
18.根据权利要求17所述的文章生成装置,其特征在于,所述评价模块,具体用于:
当所述目标基础框架各段落所描述的对象中,包括用于记载所述评价结论的评价对象时,针对所述字段内容中所记载的对象的属性取值,查询所述评价性语句表。
19.根据权利要求11-14任一项所述的文章生成装置,其特征在于,所述装置,还包括:
质检模块,用于针对包含字符数量低于第一阈值的文章主体,进行删除或重新生成;和/或,针对与历史文章重复率高于第二阈值的文章主体,进行删除或重新生成;和/或,针对各段落之间语义相关性低于第三阈值的文章主体,进行删除或重新生成。
20.根据权利要求19所述的文章生成装置,其特征在于,所述第一阈值、所述第二阈值和所述第三阈值是根据用户对历史文章的操作行为所确定出的。
21.一种基于人工智能的文章生成装置,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时,实现如权利要求1-10中任一项所述的文章生成方法。
22.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-10中任一项所述的文章生成方法。
CN201710047782.8A 2017-01-22 2017-01-22 基于人工智能的文章生成方法和装置 Active CN106874248B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710047782.8A CN106874248B (zh) 2017-01-22 2017-01-22 基于人工智能的文章生成方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710047782.8A CN106874248B (zh) 2017-01-22 2017-01-22 基于人工智能的文章生成方法和装置

Publications (2)

Publication Number Publication Date
CN106874248A true CN106874248A (zh) 2017-06-20
CN106874248B CN106874248B (zh) 2020-11-24

Family

ID=59158962

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710047782.8A Active CN106874248B (zh) 2017-01-22 2017-01-22 基于人工智能的文章生成方法和装置

Country Status (1)

Country Link
CN (1) CN106874248B (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832395A (zh) * 2017-10-30 2018-03-23 山东浪潮通软信息科技有限公司 一种数据处理方法、装置、可读介质及存储控制器
CN108470064A (zh) * 2018-03-26 2018-08-31 黑龙江省经济管理干部学院 一种基于智能机器人的新闻稿生成方法
CN108595403A (zh) * 2018-04-28 2018-09-28 掌阅科技股份有限公司 用于辅助撰写的处理方法、计算设备及存储介质
CN108717403A (zh) * 2018-05-11 2018-10-30 北京搜狗科技发展有限公司 一种处理方法、装置和用于处理的装置
CN108763516A (zh) * 2018-05-31 2018-11-06 悦未来科技(深圳)有限公司 写作交互方法、装置及计算机可读存储介质
CN108932220A (zh) * 2018-06-29 2018-12-04 北京百度网讯科技有限公司 文章生成方法和装置
CN109388745A (zh) * 2018-06-15 2019-02-26 云天弈(北京)信息技术有限公司 一种批量文章自动写作系统
CN109635260A (zh) * 2018-11-09 2019-04-16 北京百度网讯科技有限公司 用于生成文章模板的方法、装置、设备和存储介质
CN109783798A (zh) * 2018-12-12 2019-05-21 平安科技(深圳)有限公司 文本信息添加图片的方法、装置、终端及存储介质
CN109815363A (zh) * 2018-12-12 2019-05-28 平安科技(深圳)有限公司 歌词内容的生成方法、装置、终端及存储介质
CN109885821A (zh) * 2019-03-05 2019-06-14 中国联合网络通信集团有限公司 基于人工智能的文章撰写方法及装置、计算机存储介质
CN110377891A (zh) * 2019-06-19 2019-10-25 北京百度网讯科技有限公司 事件分析文章的生成方法、装置、设备及计算机可读存储介质
CN110555196A (zh) * 2018-05-30 2019-12-10 北京百度网讯科技有限公司 用于自动生成文章的方法、装置、设备和存储介质
CN110555199A (zh) * 2018-06-01 2019-12-10 北京百度网讯科技有限公司 基于热点素材的文章生成方法、装置、设备及存储介质
CN110555198A (zh) * 2018-05-31 2019-12-10 北京百度网讯科技有限公司 用于生成文章的方法、装置、设备和计算机可读存储介质
CN110705244A (zh) * 2019-10-12 2020-01-17 武汉灯塔之光科技有限公司 一种基于模板自动生成文章的方法和装置
CN111008522A (zh) * 2019-12-11 2020-04-14 浙江大搜车软件技术有限公司 文章自动撰写方法、装置、计算机设备和存储介质
CN111046645A (zh) * 2019-12-11 2020-04-21 浙江大搜车软件技术有限公司 生成文章的方法、装置、计算机设备和存储介质
CN111144084A (zh) * 2019-12-10 2020-05-12 贝壳技术有限公司 文章模板的配置方法与配置系统及生成文章的方法与系统
CN111832284A (zh) * 2020-06-23 2020-10-27 北京数智管家科技有限公司 一种稿件自动化裂变方法
CN111883136A (zh) * 2020-07-30 2020-11-03 潘忠鸿 一种基于人工智能的快速写作方法和装置
CN111931022A (zh) * 2020-06-10 2020-11-13 北京雅邦网络技术发展有限公司 Ai热点内容智能编辑系统
CN113609263A (zh) * 2021-09-30 2021-11-05 网娱互动科技(北京)股份有限公司 一种文章自动生成方法和系统
CN113836301A (zh) * 2021-09-26 2021-12-24 北京凤凰天博网络技术有限公司 房产类文章自动生成方法
CN116611417A (zh) * 2023-05-26 2023-08-18 浙江兴旺宝明通网络有限公司 一种文章自动生成方法、系统、计算机设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9164982B1 (en) * 2008-11-25 2015-10-20 Yseop Sa Methods and apparatus for automatically generating text
CN105653509A (zh) * 2015-12-24 2016-06-08 北京经纬恒润科技有限公司 一种文档处理方法及装置
CN105956149A (zh) * 2016-05-12 2016-09-21 北京奇艺世纪科技有限公司 默认搜索词的推荐方法和装置
CN105975466A (zh) * 2015-11-04 2016-09-28 新华通讯社 一种面向短新闻的机器写稿方法及装置
CN106021389A (zh) * 2016-05-12 2016-10-12 新华通讯社 基于模板自动生成新闻的系统和方法
CN106055528A (zh) * 2013-07-02 2016-10-26 福建榕基软件股份有限公司 文书自动生成方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9164982B1 (en) * 2008-11-25 2015-10-20 Yseop Sa Methods and apparatus for automatically generating text
CN106055528A (zh) * 2013-07-02 2016-10-26 福建榕基软件股份有限公司 文书自动生成方法及装置
CN105975466A (zh) * 2015-11-04 2016-09-28 新华通讯社 一种面向短新闻的机器写稿方法及装置
CN105653509A (zh) * 2015-12-24 2016-06-08 北京经纬恒润科技有限公司 一种文档处理方法及装置
CN105956149A (zh) * 2016-05-12 2016-09-21 北京奇艺世纪科技有限公司 默认搜索词的推荐方法和装置
CN106021389A (zh) * 2016-05-12 2016-10-12 新华通讯社 基于模板自动生成新闻的系统和方法

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832395A (zh) * 2017-10-30 2018-03-23 山东浪潮通软信息科技有限公司 一种数据处理方法、装置、可读介质及存储控制器
CN108470064A (zh) * 2018-03-26 2018-08-31 黑龙江省经济管理干部学院 一种基于智能机器人的新闻稿生成方法
CN108595403A (zh) * 2018-04-28 2018-09-28 掌阅科技股份有限公司 用于辅助撰写的处理方法、计算设备及存储介质
CN108717403A (zh) * 2018-05-11 2018-10-30 北京搜狗科技发展有限公司 一种处理方法、装置和用于处理的装置
CN108717403B (zh) * 2018-05-11 2022-07-08 北京搜狗科技发展有限公司 一种处理方法、装置和用于处理的装置
CN110555196A (zh) * 2018-05-30 2019-12-10 北京百度网讯科技有限公司 用于自动生成文章的方法、装置、设备和存储介质
CN110555196B (zh) * 2018-05-30 2023-07-18 北京百度网讯科技有限公司 用于自动生成文章的方法、装置、设备和存储介质
CN110555198B (zh) * 2018-05-31 2023-05-23 北京百度网讯科技有限公司 用于生成文章的方法、装置、设备和计算机可读存储介质
CN108763516A (zh) * 2018-05-31 2018-11-06 悦未来科技(深圳)有限公司 写作交互方法、装置及计算机可读存储介质
CN110555198A (zh) * 2018-05-31 2019-12-10 北京百度网讯科技有限公司 用于生成文章的方法、装置、设备和计算机可读存储介质
CN110555199B (zh) * 2018-06-01 2023-07-04 北京百度网讯科技有限公司 基于热点素材的文章生成方法、装置、设备及存储介质
CN110555199A (zh) * 2018-06-01 2019-12-10 北京百度网讯科技有限公司 基于热点素材的文章生成方法、装置、设备及存储介质
CN109388745A (zh) * 2018-06-15 2019-02-26 云天弈(北京)信息技术有限公司 一种批量文章自动写作系统
CN108932220A (zh) * 2018-06-29 2018-12-04 北京百度网讯科技有限公司 文章生成方法和装置
CN109635260A (zh) * 2018-11-09 2019-04-16 北京百度网讯科技有限公司 用于生成文章模板的方法、装置、设备和存储介质
CN109635260B (zh) * 2018-11-09 2022-07-12 北京百度网讯科技有限公司 用于生成文章模板的方法、装置、设备和存储介质
CN109783798A (zh) * 2018-12-12 2019-05-21 平安科技(深圳)有限公司 文本信息添加图片的方法、装置、终端及存储介质
CN109815363A (zh) * 2018-12-12 2019-05-28 平安科技(深圳)有限公司 歌词内容的生成方法、装置、终端及存储介质
CN109885821A (zh) * 2019-03-05 2019-06-14 中国联合网络通信集团有限公司 基于人工智能的文章撰写方法及装置、计算机存储介质
CN110377891A (zh) * 2019-06-19 2019-10-25 北京百度网讯科技有限公司 事件分析文章的生成方法、装置、设备及计算机可读存储介质
CN110705244A (zh) * 2019-10-12 2020-01-17 武汉灯塔之光科技有限公司 一种基于模板自动生成文章的方法和装置
CN110705244B (zh) * 2019-10-12 2022-12-23 武汉灯塔之光科技有限公司 一种基于模板自动生成文章的方法和装置
CN111144084A (zh) * 2019-12-10 2020-05-12 贝壳技术有限公司 文章模板的配置方法与配置系统及生成文章的方法与系统
CN111144084B (zh) * 2019-12-10 2024-05-10 贝壳技术有限公司 文章模板的配置方法与配置系统及生成文章的方法与系统
CN111008522A (zh) * 2019-12-11 2020-04-14 浙江大搜车软件技术有限公司 文章自动撰写方法、装置、计算机设备和存储介质
CN111046645A (zh) * 2019-12-11 2020-04-21 浙江大搜车软件技术有限公司 生成文章的方法、装置、计算机设备和存储介质
CN111931022A (zh) * 2020-06-10 2020-11-13 北京雅邦网络技术发展有限公司 Ai热点内容智能编辑系统
CN111832284A (zh) * 2020-06-23 2020-10-27 北京数智管家科技有限公司 一种稿件自动化裂变方法
CN111883136A (zh) * 2020-07-30 2020-11-03 潘忠鸿 一种基于人工智能的快速写作方法和装置
CN113836301A (zh) * 2021-09-26 2021-12-24 北京凤凰天博网络技术有限公司 房产类文章自动生成方法
CN113609263A (zh) * 2021-09-30 2021-11-05 网娱互动科技(北京)股份有限公司 一种文章自动生成方法和系统
CN116611417A (zh) * 2023-05-26 2023-08-18 浙江兴旺宝明通网络有限公司 一种文章自动生成方法、系统、计算机设备和存储介质
CN116611417B (zh) * 2023-05-26 2023-11-21 浙江兴旺宝明通网络有限公司 一种文章自动生成方法、系统、计算机设备和存储介质

Also Published As

Publication number Publication date
CN106874248B (zh) 2020-11-24

Similar Documents

Publication Publication Date Title
CN106874248A (zh) 基于人工智能的文章生成方法和装置
CN106682192B (zh) 一种基于搜索关键词训练回答意图分类模型的方法和装置
CN104794212B (zh) 基于用户评论文本的上下文情感分类方法及分类系统
CN109492229B (zh) 一种跨领域情感分类方法和相关装置
CN103098051B (zh) 搜索引擎优化助理
JP2019523927A (ja) ウェブサイト構築システムおよび方法
CN109165350A (zh) 一种基于深度知识感知的信息推荐方法和系统
CN107133345A (zh) 基于人工智能的交互方法和装置
CN108897871B (zh) 文档推荐方法、装置、设备及计算机可读介质
CN106462626A (zh) 利用深度神经网络对兴趣度建模
CN109543022A (zh) 文本纠错方法和装置
CN106294635A (zh) 应用程序搜索方法、深度神经网络模型的训练方法及装置
CN105989056A (zh) 一种汉语新闻推荐系统
CN108268439B (zh) 文本情感的处理方法及装置
CN106776808A (zh) 基于人工智能的资讯数据提供方法及装置
CN108876470A (zh) 标签用户扩展方法、计算机设备及存储介质
CN105975639A (zh) 搜索结果排序方法和装置
CN110019660A (zh) 一种相似文本检测方法及装置
CN107357830A (zh) 基于人工智能的检索语句语义片段获取方法、装置及终端
CN110059307A (zh) 写作方法、装置和服务器
CN104809195A (zh) 搜索结果的推荐方法和装置
CN107273883A (zh) 决策树模型训练方法、确定ocr结果中数据属性方法及装置
CN110348919A (zh) 物品推荐方法、装置和计算机可读存储介质
CN109960721A (zh) 基于源内容的多重压缩构造内容
CN104462272B (zh) 搜索需求分析方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant