CN116611417A - 一种文章自动生成方法、系统、计算机设备和存储介质 - Google Patents
一种文章自动生成方法、系统、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN116611417A CN116611417A CN202310615917.1A CN202310615917A CN116611417A CN 116611417 A CN116611417 A CN 116611417A CN 202310615917 A CN202310615917 A CN 202310615917A CN 116611417 A CN116611417 A CN 116611417A
- Authority
- CN
- China
- Prior art keywords
- article
- text
- paragraph
- generating
- paragraphs
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000000605 extraction Methods 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 5
- 230000014509 gene expression Effects 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 2
- 239000000047 product Substances 0.000 description 26
- 238000003058 natural language processing Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 239000010865 sewage Substances 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 2
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Abstract
本申请涉及文章自动生成技术领域,尤其是涉及一种文章自动生成方法、系统、计算机设备和存储介质,包括S1、文章生成模板库数据初始化;S2、输入主关键词,并在所述文章生成模板库中选取模板;S3、根据选择的所述模板选择所需生成的段落,并进行实时网页搜索,获取网页内容;S4、根据获取的所述网页内容,提取所需的内容主体,生成文本;S5、根据生成的所述文本,拆分所述文本段落,随机选择拆分的段落组合生成文章,段落生成结束;S6、重新执行步骤S3—S5,对下一个段落进行生成,直至完成所有段落的生成。本申请具有根据相关关键词自动生成内容丰富多样的文章,减少人力成本和时间成本,提升文章质量的效果。
Description
技术领域
本申请涉及文章自动生成技术领域,尤其是涉及一种文章自动生成方法、系统、计算机设备和存储介质。
背景技术
人工智能(AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。
文章生成领域也逐渐趋于人工智能化,文章生成的方法包括多媒体转写自动生成文章和人工编辑文章。多媒体转写自动生成的文章大多是根据结构化的文本数据来生成文章,这种方法数据来源单一,使得生成的文章内容不够丰富、题材不够广泛,而人工编辑多媒体文章的过程十分复杂,非常耗时和繁琐,造成不必要的人力、财力的开销。在现有技术中,在文章自动生成领域存在根据关键词生成文章的情况,而对于期刊、文献、新闻等文章,通常都是由人工进行编写,但这种人工编写的方式,不仅需要消耗大量的时间才能够完成有限数量的文章编写工作,而且所编写的文章质量与人员经验水平密切相关,导致文章质量不易控制。
发明内容
为了根据相关关键词自动生成内容丰富多样的文章,减少人力成本和时间成本,提升文章质量,本申请提供一种文章自动生成方法、系统、计算机设备和存储介质。
第一方面,本申请提供的一种文章自动生成方法,采用如下技术方案:一种文章自动生成方法,包括:
S1、文章生成模板库数据初始化;
S2、输入主关键词,并在所述文章生成模板库中选取模板;
S3、根据选择的所述模板选择所需生成的段落,并进行实时网页搜索,获取网页内容;
S4、根据获取的所述网页内容,提取所需的内容主体,生成文本;
S5、根据生成的所述文本,拆分所述文本段落,随机选择拆分的段落组合生成文章,段落生成结束;
S6、重新执行步骤S3—S5,对下一个段落进行生成,直至完成所有段落的生成。
通过采用上述技术方案,通过预先建立的各类别文章生成模板,丰富模板库,使用户有更多的选择,用户可以根据实际需要结合主关键词选择合适的模板,根据用户的选择进行实时网页搜索、文章主体内容提取、段落拆分以及随机组合生成的操作,最终生成文章,全网实时网页搜索可以不限制文章获取的途径,使生成的文本内容不受模板的限制,实时搜索可以使获取到的文本内容始终涵盖最新内容,从而生成内容丰富多样的文章,且该文章自动生成的方法不仅确保了生成文章的质量不会受不同撰写人经验水平的影响,提升了文章质量,也在一定程度上减少了人工操作,简化了文章生成操作的步骤。
优选的,所述根据选择的所述模板选择所需生成的段落,并进行实时网页搜索,获取网页内容还包括以下步骤:
根据选择段落确定辅助关键词,组合主关键词和辅助关键词进行实时网页搜索。
通过采用上述技术方案,组合主关键词和辅助关键词,可以在进行实时网页搜索时,更加精准的搜索到用户所需要的文章内容,使得获取文章的内容更丰富、多样,使内容来源更广泛,不限制辅助关键词的内容,从而使生成的文章具有更广的内容覆盖度。
优选的,所述根据获取的所述网页内容,提取所需的内容主体,生成文本还包括以下步骤:
定义一个提取段落主体内容的函数,定义搜索到的网页为一个标签,并利用函数寻找标签下的子节点;
遍历各个所述子节点,判断该所述子节点是否为用户所需要的段落主体内容,若是,则提取该所述子节点下的所有文字内容;若否,则直接去除该所述子节点下的文字内容。
通过采用上述技术方案,通过对搜索到的网页内容进行文章主体的提取,将网页中除主要文本之外的无用信息剔除掉,从而确保生成的文章不会乱码。
优选的,所述根据生成的所述文本,拆分所述文本段落,随机选择拆分的段落组合生成文章,段落生成结束还包括以下步骤:
根据生成的文章进行日常用语的替换,形成新的文章文本。
通过采用上述技术方案,对生成的文章进行语句的替换,确保生成的文章与现有的文章不会存在大篇幅重复,且在替换的过程也可对语序进行调整,提升文章质量。
第二方面,本申请提供一种文章自动生成系统,采用如下技术方案:
一种文章自动生成系统,包括:
控制模块,用于控制文章自动生成系统的输入和输出;
输入选择模块,与所述控制模块连接,用于接收所述控制模块的控制信号,进行关键词的输入,并根据输入的关键词进行模板选择以及段落选择;
模板库模块,与所述控制模块连接,用于接收所述控制模块的控制信号,建立并存储各类别文章生成模板的段落构成和核心方向,提供给用户进行选择,并将用户选择的模板传输至所述控制模块中;
文章生成模块,与所述控制模块连接,用于根据所述控制模块传输的模板生成文章。
通过采用上述技术方案,通过控制模块、输入选择模块、模板库模块和文章生成模块的配合,以实现文章自动生成的工作,通过在模板库模块中建立各类别的模板供用户进行选择,用户通过输入选择模块进行关键词的输入、模板选择和段落选择,控制模块控制文章生成模块结合用户选择的模板进行文章的生成工作。
优选的,所述输入选择模块包括:
关键词输入单元,用于供用户进行主关键词的输入以及辅助关键词的修改或替换;
模板选择单元,与所述关键词输入单元连接,用于根据用户输入的关键词进行文章生成模板的选择;
段落选择单元,与所述模板选择单元连接,用于根据所选择的文章生成模板选择所需生成的段落。
通过采用上述技术方案,通过关键词输入单元进行主关键词的输入和辅助关键词的修改或替换,在确定主关键词和辅助关键词后通过模板选择单元选择所需要生成文章的模板,由于每个模板的段落构成不同,所以在确定模板后通过段落选择单元,结合所选择的模板选择所需要生成的段落。
优选的,所述文章生成模块包括:
搜索单元,用于根据所述文章生成模块接收到的模板,进行全网搜索并获取实时网页内容;
提取生成单元,与所述搜索单元连接,用于提取网页内容中的文本主体,并组合生成文章;
传输单元,与所述提取生成单元连接,用于将所述提取生成单元生成的文章文本传输至所述控制模块。
通过采用上述技术方案,搜索单元可以结合确定的主关键词和辅助关键词进行网页搜索,提取生成单元根据搜索到的网页内容进行文章主体的提取和组合生成,从而将无用的信息和文字剔除掉,使生成的文章不会出现乱码的情况,再由传输单元将生成的文章传输至控制模块。
优选的,所述提取生成单元包括:
拆分组合子单元,用于对所述提取生成单元生成的文章进行段落拆分,并将拆分后的段落进行随机组合,生成文章;
替换子单元,与所述拆分组合子单元连接,用于对所述拆分组合子单元生成的文章进行语句替换,生成新的文章文本。
通过采用上述技术方案,由于提取生成单元生成的文章为未分段段落,所以通过拆分组合子单元的对生成的文章进行段落拆分,并随机选取段落组合生成文章,替换子单元可以对生成的文章进行语句替换,使生成的文章语句无误,语序通顺,从而提升生成文章的质量。
第三方面,本申请提供的一种计算机设备,包括一个或多个处理器和存储器,所述存储器上存储有被处理器加载并执行上述方法的计算机程序。
第四方面,本申请提供的一种计算机可读存储介质,存储有能够被处理器加载并执行上述方法的计算机程序。
相比于相关技术,本申请实施例提供一种文章自动生成方法、系统、计算机设备和存储介质,通过将主关键词和辅助关键词组合进行实时网页检索,并对搜索到的网页内容进行文章主体内容提取、拆分和随机组合,从而生成内容丰富多样的文章,使得用于生成文章的内容更丰富、多样,内容来源更广泛,从而使生成的文章具有更广的内容覆盖度,同时该文章自动生成方法不限制网页搜索的范围,具有更高的时效性,减少人力成本和时间成本,不会出现由于不同撰写人员经验不同导致文章质量不同的情况,在一定程度上提升了文章的质量。
附图说明
图1是本申请实施例文章自动生成方法的流程图;
图2是本申请实施例文章自动生成方法中步骤S2和步骤S3的流程框图;
图3是本申请实施例文章自动生成方法中步骤S5的流程框图;
图4是本申请实施例文章自动生成系统的结构框图。
附图标记说明:1、控制模块;2、输入选择模块;21、关键词输入单元;22、模板选择单元;23、段落选择单元;3、模板库模块;4、文章生成模块;41、搜索单元;42、提取生成单元;421、拆分组合子单元;422、替换子单元;43、传输单元。
具体实施方式
以下结合附图1-附图4对本申请作进一步详细说明。
虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的全部其他实施例,都属于本申请保护的范围。
参照图1、图2和图3,本申请公开的一种文章自动生成方法,包括以下步骤:
S1、文章生成模板库数据初始化。
具体地,加载文章生成模板库内的模板数据,其中,文章生成模板库包括各类别文章的段落构成以及核心方向,且段落构成和核心方向决定了文章的基础框架。
其中核心方向包括企业报道、产品新闻、地方新闻、行业及市场动态、会展活动等,每个核心方向都由预先定义好的段落组成,例如产品新闻,段落结构可分为:第一段为产品介绍,固定话术为“A是一款B类产品,它是利用C实现D,该产品是E公司主营的产品之一,在F行业有着一定优势”;第二段为产品所属企业背景介绍,包括企业的成立时间、所属行业和主营业务等基本信息;第三段为产品参数、产品特点、工作原理以及技术指标等,固定话术为“据F了解到,该款产品…”;第四段为产品售后保障服务,可包括产品操作流程步骤、维护保养以及故障解决方案等;第五段为现有客户案例,即目前有哪些客户正在使用该款产品;第六段为产品对比,与G公司不同型号的产品进行对比,包括各个产品的介绍和特点;第七段为产品在行业中的应用/优势以及供需端市场解析/前景展望。
文章生成模板的具体内容以及涉及的行业、产品、企业这些则需要根据主关键词和辅助关键词来确定,同样以产品新闻为例,A是一款B类产品,其中A为产品词,即为主关键词,产品新闻的主要内容围绕主关键词A展开,B为行业,即为辅助关键词,作为文章的衍生内容使用,为了丰富段落内容,结合每个段落的具体内容对应预设辅助关键词,例如第七段中的辅助关键词可预设为发展、前景等。
需要说明的是,核心方向和段落构成不做限定,本申请实施例中仅以产品新闻的一种情况为例进行说明。
S2、输入主关键词,并在文章生成模板库中选取模板。
具体地,用户输入主关键词,并在文章生成模板库中选择相应的所要生成文章的模板即可,例如用户需要生成一篇或几篇关于污水处理领域行业分析的文章,用户输入主关键词为污水处理,并选择行业分析的文章模板即可进行下一步操作。
其中,用户可以根据实际需求修改模板的段落构成,即每个核心方向的段落构成可以根据实际情况随时调整,既可以修改段落名称和辅助关键词,也可以将不需要的段落删除掉。
上述步骤S2还包括:
S21、根据选取的模板一键生成文章。
具体地,若用户无需进行段落调整,或对各段落的辅助关键词进行调整,可以根据预设的模板段落构成以及预设的辅助关键词,直接选择一键生成一篇或多篇文章,例如用户输入主关键词为污水处理,选择行业分析的文章模板后点击一键生成即可生成用户所需要的文章,给用户提供了更多的选择,以适配不同用户的需求。
需要说明的是,一键生成文章的过程与段落生成的过程相同,具体可参考以下步骤。
S3、根据选择的模板选择所需生成的段落,并进行实时网页搜索,获取网页内容。
具体地,用户根据选择的模板继续选择一个所要生成的段落,用户根据段落选择词选择所需生成的段落,例如,同样以行业分析为例,预设的行业分析模板的段落构成分为:第一段为行业发展;第二段为行业的技术特色;第三段为行业中所采用工艺;第四段为行业的环境背景。其中发展、技术特色、采用工艺和环境背景为显示给用户的段落选择词,用户可以通过段落选择词自主确定所需要的段落进行实时网页搜索,从而获取搜索到的网页内容。
需要说明的是,由于网页信息会不断更新,实时网页搜索不会限制文本获取的途径,也确保获取的网页文本内容始终涵盖最新内容。
上述步骤S3还包括:
S31、根据选择段落确定辅助关键词,组合主关键词和辅助关键词进行实时网页搜索。
具体地,为了确保生成文章的每个段落内容的准确性和丰富性,用户可以根据所选择段落的内容,进行辅助关键词的补充或修改,不限制辅助关键词的内容,体现了网页搜索的随机性,以便于在网页中进行更全面的内容搜索,使用户获取到覆盖面更广且最新的网页内容。
S4、根据获取的网页内容,提取所需的段落主体内容,生成文本。
由于根据主关键词和辅助关键词搜索出来的网页内容中,除了用户所需的段落主体内容,还可能包含标题、链接、广告和图片等不相关的内容,所以需要对段落主体内容以外的内容进行剔除。
上述步骤S4还包括:
S41、定义一个提取段落主体内容的函数,定义搜索到的网页为一个标签,并利用函数寻找标签下的子节点。
具体地,为了能够提取到用户需要的段落主体内容,也便于进行后续的调取工作,定义一个提取段落主体内容的find函数,其中将所搜索到的网页定义为body标签,调用body标签,寻找body标签下的各个子节点,子节点包括但不限于标题、链接和文章等。
S42、遍历各个子节点,判断该子节点是否为用户所需要的段落主体内容,若是,则提取该子节点下的所有文字内容;若否,则直接去除该子节点下的文字内容。
具体地,提取段落主体需要先预设权值为提取文字的长度,在获取子节点下的文字长度时,对body标签下的网页内容进行缩减处理,缩减处理即对搜索到的网页内容中的不相关内容(标题、链接和文章)进行剔除,其中缩减处理依据距离段落主体中心越近权值越高,距离段落主体中心权值越远权值越低的规则,通过引用各个子节点的权值参数,记录权值最高的子节点,筛选出密度中心,先提取出直接文本,即先提取出该子节点下的完整段落的文字内容,再重复进行缩减处理,提取出间接文本,即分散段落的文字内容,将直接文本和间接文本组合生成所需要的段落主体内容。
进一步地,对提取出的直接文本和间接文本要进行去除段落前后空字符的操作,合并为一个字符串,即得到一个完整的未分段的文本。
S5、根据生成的文本,拆分文本段落,随机选择拆分的段落组合生成文章,段落生成结束。
具体地,为了确保文章生成的随机性,对去除掉空字符的未分段文本进行拆分,即根据自然段落将未分段文本切割成几个自然段,再根据用户所选择模板的核心方向随机选择切割后的自然段,再将随机选择的自然段组合生成新的文章。
上述步骤S5还包括:
S51、根据生成的文章进行日常用语的替换,形成新的文章文本。
具体地,为了降低所生成文章文本与现有网页文本的重复性,确保所生成的文章文本中语句无误且通顺,提升所生成文章文本的质量,通过NLP(自然语言处理)技术,对生成的文章文本进行分析处理,理解文章文本内容,替换文章文本中的日常用语,重新组织语序,形成新的文章文本。
需要说明的是,利用NLP(自然语言处理)技术对生成的文章文本进行处理,不会影响或改变所生成文章原本的含义。
S6、重新执行步骤S3—S5,对下一个段落进行生成,直至完成所有段落的生成。
具体地,当一个段落的文章文本生成结束后,用户可根据实际情况对所选择的核心方向下的模板中的其余段落进行生成,从而形成一篇或几篇完整的文章,即重复执行步骤S3—S5,直至完成所有段落的文章文本生成,这里不再进行赘述。
基于上述方法,本申请实施例还公开一种文章自动生成系统,参照图4,该系统包括以下模块:
控制模块1,用于控制文章自动生成系统的输入和输出;
输入选择模块2,与控制模块1连接,用于接收控制模块1的控制信号,进行关键词的输入,并根据输入的关键词进行模板选择以及段落选择;
进一步地,输入选择模块2还包括关键词输入单元21、模板选择单元22和段落选择单元23。
关键词输入单元21,用于供用户进行关键词的输入;
模板选择单元22,与关键词输入单元21连接,用于根据用户输入的关键词进行文章生成模板的选择;
段落选择单元23,与模板选择单元22连接,用于根据所选择的文章生成模板选择所需生成的段落。
模板库模块3,与控制模块1连接,用于接收控制模块1的控制信号,建立并存储各类别文章生成模板的段落构成和核心方向,提供给用户进行选择,并将用户选择的模板传输至控制模块1中;
文章生成模块4,与控制模块1连接,用于根据控制模块1传输的模板生成文章。
进一步地,文章生成模块4还包括搜索单元41、提取生成单元42和传输单元43。
搜索单元41,用于根据文章生成模块4接收到的模板,进行全网搜索并获取实时网页内容;
提取生成单元42,与搜索单元41连接,用于提取网页内容中的文本主体,并组合生成文章。
进一步地,提取生成单元42还包括拆分组合子单元421和替换子单元422。
拆分组合子单元421,用于对提取生成单元42生成的文章进行段落拆分,并将拆分后的段落进行随机组合,生成文章;
替换子单元422,与拆分组合子单元421连接,用于对拆分组合子单元421生成的文章进行语句替换,生成新的文章文本。
传输单元43,与提取生成单元42连接,用于将提取生成单元42生成的文章文本传输至控制模块1。
本申请实施例还公开了一种计算机设备。
具体地,该电子设备包括一个或多个处理器和存储器,存储器上存储有能够被处理器加载并执行上述计算机程序,当一个或多个计算机程序被一个或多个处理器执行时,使得一个或多个处理器实现上述的文章自动生成方法的步骤。
本申请实施例还公开了一种计算机可读存储介质。
具体地,该计算机可读存储介质,其存储有能够被处理器加载并执行如上述一种文章自动生成方法的计算机程序,该计算机可读存储介质例如包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离前述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其他技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种文章自动生成方法,其特征在于,包括:
S1、文章生成模板库数据初始化;
S2、输入主关键词,并在所述文章生成模板库中选取模板;
S3、根据选择的所述模板选择所需生成的段落,并进行实时网页搜索,获取网页内容;
S4、根据获取的所述网页内容,提取所需的内容主体,生成文本;
S5、根据生成的所述文本,拆分所述文本段落,随机选择拆分的段落组合生成文章,段落生成结束;
S6、重新执行步骤S3—S5,对下一个段落进行生成,直至完成所有段落的生成。
2.根据权利要求1所述的一种文章自动生成方法,其特征在于,所述根据选择的所述模板选择所需生成的段落,并进行实时网页搜索,获取网页内容还包括以下步骤:
根据选择段落确定辅助关键词,组合主关键词和辅助关键词进行实时网页搜索。
3.根据权利要求1所述的一种文章自动生成方法,其特征在于,所述根据获取的所述网页内容,提取所需的内容主体,生成文本还包括以下步骤:
定义一个提取段落主体内容的函数,定义搜索到的网页为一个标签,并利用函数寻找标签下的子节点;
遍历各个所述子节点,判断该所述子节点是否为用户所需要的段落主体内容,若是,则提取该所述子节点下的所有文字内容;若否,则直接去除该所述子节点下的文字内容。
4.根据权利要求1所述的一种文章自动生成方法,其特征在于,所述根据生成的所述文本,拆分所述文本段落,随机选择拆分的段落组合生成文章,段落生成结束还包括以下步骤:
根据生成的文章进行日常用语的替换,形成新的文章文本。
5.一种文章自动生成系统,其特征在于,包括:
控制模块(1),用于控制文章自动生成系统的输入和输出;
输入选择模块(2),与所述控制模块(1)连接,用于接收所述控制模块(1)的控制信号,进行关键词的输入,并根据输入的关键词进行模板选择以及段落选择;
模板库模块(3),与所述控制模块(1)连接,用于接收所述控制模块(1)的控制信号,建立并存储各类别文章生成模板的段落构成和核心方向,提供给用户进行选择,并将用户选择的模板传输至所述控制模块(1)中;
文章生成模块(4),与所述控制模块(1)连接,用于根据所述控制模块(1)传输的模板生成文章。
6.根据权利要求5所述的一种文章自动生成系统,其特征在于,所述输入选择模块(2)包括:
关键词输入单元(21),用于供用户进行主关键词的输入以及辅助关键词的修改或替换;
模板选择单元(22),与所述关键词输入单元(21)连接,用于根据用户输入的关键词进行文章生成模板的选择;
段落选择单元(23),与所述模板选择单元(22)连接,用于根据所选择的文章生成模板选择所需生成的段落。
7.根据权利要求5所述的一种文章自动生成系统,其特征在于,所述文章生成模块(4)包括:
搜索单元(41),用于根据所述文章生成模块(4)接收到的模板,进行全网搜索并获取实时网页内容;
提取生成单元(42),与所述搜索单元(41)连接,用于提取网页内容中的文本主体,并组合生成文章;
传输单元(43),与所述提取生成单元(42)连接,用于将所述提取生成单元(42)生成的文章文本传输至所述控制模块(1)。
8.根据权利要求7所述的一种文章自动生成系统,其特征在于,所述提取生成单元(42)包括:
拆分组合子单元(421),用于对所述提取生成单元(42)生成的文章进行段落拆分,并将拆分后的段落进行随机组合,生成文章;
替换子单元(422),与所述拆分组合子单元(421)连接,用于对所述拆分组合子单元(421)生成的文章进行语句替换,生成新的文章文本。
9.一种计算机设备,其特征在于,包括一个或多个处理器和存储器,所述存储器上存储有被处理器加载并执行如权利要求1-4所述方法的计算机程序。
10.一种计算机可读存储介质,其特征在于,存储有能够被处理器加载并执行如权利要求1-4所述方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310615917.1A CN116611417B (zh) | 2023-05-26 | 2023-05-26 | 一种文章自动生成方法、系统、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310615917.1A CN116611417B (zh) | 2023-05-26 | 2023-05-26 | 一种文章自动生成方法、系统、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116611417A true CN116611417A (zh) | 2023-08-18 |
CN116611417B CN116611417B (zh) | 2023-11-21 |
Family
ID=87677925
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310615917.1A Active CN116611417B (zh) | 2023-05-26 | 2023-05-26 | 一种文章自动生成方法、系统、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116611417B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102402627A (zh) * | 2011-12-31 | 2012-04-04 | 凤凰在线(北京)信息技术有限公司 | 一种文章实时智能抓取系统和方法 |
CN106610927A (zh) * | 2016-12-19 | 2017-05-03 | 厦门二五八网络科技集团股份有限公司 | 一种基于翻译模板的互联网文章的建构方法与系统 |
CN106874248A (zh) * | 2017-01-22 | 2017-06-20 | 百度在线网络技术(北京)有限公司 | 基于人工智能的文章生成方法和装置 |
CN108563620A (zh) * | 2018-04-13 | 2018-09-21 | 上海财梵泰传媒科技有限公司 | 文本自动写作方法和系统 |
US20180357209A1 (en) * | 2015-05-11 | 2018-12-13 | Lindy Ledohowski | Methods and systems relating to context-specific writing frameworks |
CN109582945A (zh) * | 2018-12-17 | 2019-04-05 | 北京百度网讯科技有限公司 | 文章生成方法、装置及存储介质 |
CN109657223A (zh) * | 2018-12-18 | 2019-04-19 | 安徽省泰岳祥升软件有限公司 | 一种公文自动写作方法及装置 |
CN110264315A (zh) * | 2019-06-20 | 2019-09-20 | 北京百度网讯科技有限公司 | 介绍信息生成方法和装置 |
CN111046645A (zh) * | 2019-12-11 | 2020-04-21 | 浙江大搜车软件技术有限公司 | 生成文章的方法、装置、计算机设备和存储介质 |
CN111680482A (zh) * | 2020-05-07 | 2020-09-18 | 车智互联(北京)科技有限公司 | 一种标题图文生成方法及计算设备 |
CN111859950A (zh) * | 2020-06-18 | 2020-10-30 | 达而观信息科技(上海)有限公司 | 一种自动化生成讲稿的方法 |
CN111930929A (zh) * | 2020-07-09 | 2020-11-13 | 车智互联(北京)科技有限公司 | 一种文章标题生成方法、装置及计算设备 |
CN113609263A (zh) * | 2021-09-30 | 2021-11-05 | 网娱互动科技(北京)股份有限公司 | 一种文章自动生成方法和系统 |
KR102410260B1 (ko) * | 2022-03-07 | 2022-06-22 | 와이에스에이 주식회사 | 인공지능 기반 광고 콘텐츠 자동 생성 및 확인 방법, 장치 및 시스템 |
-
2023
- 2023-05-26 CN CN202310615917.1A patent/CN116611417B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102402627A (zh) * | 2011-12-31 | 2012-04-04 | 凤凰在线(北京)信息技术有限公司 | 一种文章实时智能抓取系统和方法 |
US20180357209A1 (en) * | 2015-05-11 | 2018-12-13 | Lindy Ledohowski | Methods and systems relating to context-specific writing frameworks |
CN106610927A (zh) * | 2016-12-19 | 2017-05-03 | 厦门二五八网络科技集团股份有限公司 | 一种基于翻译模板的互联网文章的建构方法与系统 |
CN106874248A (zh) * | 2017-01-22 | 2017-06-20 | 百度在线网络技术(北京)有限公司 | 基于人工智能的文章生成方法和装置 |
CN108563620A (zh) * | 2018-04-13 | 2018-09-21 | 上海财梵泰传媒科技有限公司 | 文本自动写作方法和系统 |
CN109582945A (zh) * | 2018-12-17 | 2019-04-05 | 北京百度网讯科技有限公司 | 文章生成方法、装置及存储介质 |
CN109657223A (zh) * | 2018-12-18 | 2019-04-19 | 安徽省泰岳祥升软件有限公司 | 一种公文自动写作方法及装置 |
CN110264315A (zh) * | 2019-06-20 | 2019-09-20 | 北京百度网讯科技有限公司 | 介绍信息生成方法和装置 |
CN111046645A (zh) * | 2019-12-11 | 2020-04-21 | 浙江大搜车软件技术有限公司 | 生成文章的方法、装置、计算机设备和存储介质 |
CN111680482A (zh) * | 2020-05-07 | 2020-09-18 | 车智互联(北京)科技有限公司 | 一种标题图文生成方法及计算设备 |
CN111859950A (zh) * | 2020-06-18 | 2020-10-30 | 达而观信息科技(上海)有限公司 | 一种自动化生成讲稿的方法 |
CN111930929A (zh) * | 2020-07-09 | 2020-11-13 | 车智互联(北京)科技有限公司 | 一种文章标题生成方法、装置及计算设备 |
CN113609263A (zh) * | 2021-09-30 | 2021-11-05 | 网娱互动科技(北京)股份有限公司 | 一种文章自动生成方法和系统 |
KR102410260B1 (ko) * | 2022-03-07 | 2022-06-22 | 와이에스에이 주식회사 | 인공지능 기반 광고 콘텐츠 자동 생성 및 확인 방법, 장치 및 시스템 |
Non-Patent Citations (2)
Title |
---|
徐艳华 等: "基于LDA模型的HSK作文生成", 数据分析与知识发现, vol. 02, no. 09, pages 80 - 87 * |
谭浩 等: "新闻专题的高效组织和生成新方法", 科技导报, no. 07, pages 48 - 51 * |
Also Published As
Publication number | Publication date |
---|---|
CN116611417B (zh) | 2023-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2807494C (en) | Method and system for integrating web-based systems with local document processing applications | |
US11687826B2 (en) | Artificial intelligence (AI) based innovation data processing system | |
CN110442728A (zh) | 基于word2vec汽车产品领域的情感词典构建方法 | |
CN110929007A (zh) | 一种电力营销知识体系平台及应用方法 | |
CN112115252A (zh) | 智能辅助写作处理方法、装置、电子设备及存储介质 | |
CN109522415B (zh) | 一种语料标注方法及装置 | |
US20200110802A1 (en) | Systems and Methods of Machine Learning for Digital Assets and Message Creation | |
CN115526171A (zh) | 一种意图识别方法、装置、设备及计算机可读存储介质 | |
WO2011117594A1 (en) | System | |
CN116611417B (zh) | 一种文章自动生成方法、系统、计算机设备和存储介质 | |
Zhou et al. | Assisting in requirements goal modeling: a hybrid approach based on machine learning and logical reasoning | |
CN116362331A (zh) | 一种基于人机协同构建知识图谱的知识点填充方法 | |
CN105631032A (zh) | 基于抽象语义推荐的问答知识库建立方法、装置及系统 | |
CN109948128B (zh) | 一种辅助编辑系统 | |
CN112559753A (zh) | 一种基于业务过程管理技术的自然语言文本处理与分析任务的管理框架 | |
CN115080732A (zh) | 投诉工单处理方法、装置、电子设备和存储介质 | |
CN117453895B (zh) | 一种智能客服应答方法、装置、设备及可读存储介质 | |
Atri et al. | A Pragmatic Approach to Web-Summarizer System | |
CN110738040B (zh) | 一种评论扩展方法及系统 | |
US20230385541A1 (en) | Method and system for producing unified natural language processing objects | |
CN114064878A (zh) | 一种基于强化学习的自然语言数据打标方法及系统 | |
Azevedo et al. | BPMN Model and Text Instructions Automatic Synchronization. | |
KR20240054797A (ko) | 범죄 분석용 문장 데이터 증식 시스템 및 그 방법 | |
Mészáros | Agent-supported knowledge acquisition for digital humanities research | |
Trubitsyna | Usage Artificial Intelligence Toolkit for Improving Translations to English |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |