CN116090473A - 写作智能辅助方法、装置及系统 - Google Patents

写作智能辅助方法、装置及系统 Download PDF

Info

Publication number
CN116090473A
CN116090473A CN202310355078.4A CN202310355078A CN116090473A CN 116090473 A CN116090473 A CN 116090473A CN 202310355078 A CN202310355078 A CN 202310355078A CN 116090473 A CN116090473 A CN 116090473A
Authority
CN
China
Prior art keywords
paper
outline
document
information
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310355078.4A
Other languages
English (en)
Inventor
魏炜
贺智辰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Shenzhen Graduate School
Original Assignee
Peking University Shenzhen Graduate School
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Shenzhen Graduate School filed Critical Peking University Shenzhen Graduate School
Priority to CN202310355078.4A priority Critical patent/CN116090473A/zh
Publication of CN116090473A publication Critical patent/CN116090473A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明适用于智能辅助技术领域,具体提供一种写作智能辅助方法、装置及系统,方法包括:获取在预设的信息源公开发表的论文文档;对论文文档进行语义识别和文本解析,得到论文文档的内容分类数据;根据内容分类数据生成与论文文档对应的论文大纲并保存至论文数据库;获取用户输入的检索词信息;在论文数据库中查找与检索词信息相匹配的至少一篇参考论文,并提供至少一篇参考论文的论文大纲的浏览阅读。本发明通过获取已经公开发表的论文文档,然后对论文文档进行语义识别和文本解析得到内容分类数据,进而生成论文大纲,当用户开始写论文时,可以通过浏览论文大纲以快速搜索到所需的论文文档,减少用户的浏览工作量,节省用户时间,提高效率。

Description

写作智能辅助方法、装置及系统
技术领域
本发明属于智能辅助技术领域,尤其涉及一种写作智能辅助方法、装置及系统。
背景技术
目前在写作论文时,用户需要先在相关网站上搜索相关文献,例如根据所选论文标题或者应用领域确定关键词,然后利用关键词进行搜索与所选论文相关的文献。搜索的结果一般按照文献的相关性降序呈现,用户阅读文献后,根据需要,提取新关键词,再次检索,重复上述过程多次才能完成文献的搜集。
但是,搜索到的文献篇幅较长且包括大量的图文信息,用户需要花费大量的时间在阅读文献和反复搜索上,论文写作整体的效率不高。
发明内容
本发明提供一种写作智能辅助方法,解决现有技术中搜索相关文献容易遗漏以及需要花费用户大量时间进行阅读和搜索导致效率低的问题。
本发明是这样实现的,一种写作智能辅助方法,包括:
获取在预设的信息源公开发表的论文文档;
对论文文档进行语义识别和文本解析,得到论文文档的内容分类数据;
根据内容分类数据生成与论文文档对应的论文大纲并保存至论文数据库;
获取用户输入的检索词信息;
在所述论文数据库中查找与所述检索词信息相匹配的至少一篇参考论文,并提供所述至少一篇参考论文的论文大纲的浏览阅读。
进一步地,在对论文文档进行语义识别和文本解析,得到论文文档的内容分类数据的步骤之后,方法还包括:
对论文文档进行关键词提取得到关键词词频信息;
将关键词词频信息和内容分类数据建立关联关系并保存。
进一步地,在所述在所述论文数据库中查找与所述检索词信息相匹配的至少一篇参考论文,并提供所述至少一篇参考论文的论文大纲的浏览阅读的步骤之后,所述方法还包括:
根据用户对所述至少一篇参考论文的论文大纲的选择操作确定论文主题;
获取与所述论文主题相对应的关键词词频信息并展示。
进一步地,在所述获取与所述论文主题相对应的关键词词频信息并展示的步骤之后,所述方法还包括:
根据所述论文主题在预设的论据数据库中匹配得到候选论据;
提取没有对应论证过程的候选论据作为目标论据;
对所述目标论据进行论证生成,并将论证生成结果进行展示。
进一步地,内容分类数据包括论文论点信息、论文论据信息以及论文结论信息。
第二方面,本申请还提供一种写作智能辅助装置,装置包括:
文档获取单元,用于获取在预设的信息源公开发表的论文文档;
文档解析单元,用于对论文文档进行语义识别和文本解析,得到论文文档的内容分类数据;
大纲生成单元,用于根据内容分类数据生成与论文文档对应的论文大纲并保存至论文数据库;
信息获取单元,用于获取用户输入的检索词信息;
大纲展示单元,用于在所述论文数据库中查找与所述检索词信息相匹配的至少一篇参考论文,并提供所述至少一篇参考论文的论文大纲的浏览阅读。
进一步地,装置还包括:
论文主题确定单元,用于根据用户对所述至少一篇参考论文的论文大纲的选择操作确定论文主题;
词频信息展示单元,用于获取与所述论文主题相对应的关键词词频信息并展示。
进一步地,装置还包括:
论据匹配单元,用于根据所述论文主题在预设的论据数据库中匹配得到候选论据;
论据提取单元,用于提取没有对应论证过程的候选论据作为目标论据;
论证执行单元,用于对所述目标论据进行论证生成,并将论证生成结果进行展示。
进一步地,内容分类数据包括论文论点信息、论文论据信息以及论文结论信息。
第三方面,本申请还提供一种写作智能辅助系统,写作智能辅助系统包括如上述的写作智能辅助装置。
本发明的有益效果在于,通过获取已经公开发表的论文文档,然后对论文文档进行语义识别和文本解析,对论文文档中的内容进行分类得到内容分类数据,然后根据该内容分类数据生成论文文档的论文大纲保存至论文数据库,当用户开始写论文时,可以通过输入的搜索词获取至少一篇参考论文的论文大纲进行展示,用户浏览论文大纲以快速搜索到所需的论文文档,减少用户的浏览工作量,节省用户时间,提高效率。
附图说明
图1是本发明写作智能辅助方法一个实施例的流程示意图;
图2是本发明写作智能辅助方法一个实施例提取关键词词频信息的流程示意图;
图3是本发明写作智能辅助方法一个实施例展示关键词词频信息的流程示意图;
图4是本发明写作智能辅助方法一个实施例进行论证生成的流程示意图;
图5是本发明写作智能辅助装置一个实施例的模块示意图;
图6是本发明一个实施例的实现原理示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例通过获取已经公开发表的论文文档,然后对论文文档进行语义识别和文本解析,对论文文档中的内容进行分类得到内容分类数据,然后根据该内容分类数据生成论文文档的论文大纲保存至论文数据库,当用户开始写论文时,可以通过输入的搜索词获取至少一篇参考论文的论文大纲进行展示,用户浏览论文大纲以快速搜索到所需的论文文档,减少用户的浏览工作量,节省用户时间,提高效率。
实施例一
如图1所示,本实施例提供一种写作智能辅助方法,包括:
S1100、获取在预设的信息源公开发表的论文文档;
信息源是指公开的、开放的平台,例如国家论文期刊网、国家论文数据库或者其他第三方系统提供的数据服务等,能获取已公开发表的论文文档即可,在此不做限定。
可选地,信息源的网址保存在本地数据库中。示例性地,以本申请提供的写作智能辅助方法应用于论文辅助智能系统中为例,论文辅助智能系统设置有处理器,信息源的网址或者地址信息可以保存至该处理器中。可选地,处理器可以是设置于论文辅助智能系统中的实际处理器,也可以是云端的虚拟处理器,在此不做限定。
可选地,当有新的论文文档发表时,处理器获取该论文文档,例如通过网络爬虫技术收集已公开的论文文档。在一些实施例中,论文文档包括该论文所涉及的论文文献、实验数据以及引用的相关文献等信息,在此不做限定。
在一些可能的实施例中,处理器可以定期到信息源中收集论文文档数据,例如每天定时或者间隔n天就从信息源收集论文文档,其中,n大于或等于2,可选地,收集的论文文档可以保存至本地数据库中,在此不做限定。
S1200、对论文文档进行语义识别和文本解析,得到论文文档的内容分类数据;
在收集到论文文档后,可以对论文文档进行语义识别和文本解析。可选地,根据语义对论文文档进行文本解析,从而对论文文档的句子进行分类提取得到内容分类数据。
在一些实施例中,内容分类数据包括但不限于论文论点信息、论文论据信息以及论文结论信息。其中,论文论点信息是指论文文档中的论点。论文论据信息是指论文文档中的论据。论文结论信息是指论文文档中的结论。可选地,可以通过关键词匹配、文档结构分析、句子位置分析或者基于文本挖掘等方式提取出论点句子、论据类句子以及结论类句子。
可选地,可以采用大数据技术对论文文档进行语义识别和文本解析。具体地,可以通过例如Hadoop、MapReduce和Spark等分布式处理方法,对论文文档中的句子进行分析、整理和归类得到内容分类数据。
S1300、根据内容分类数据生成与论文文档对应的论文大纲并保存至论文数据库;
在提取得到论文文档的论文论点、论据和结论后,将这些内容进行整合生成论文大纲。可选地,处理器储存有大纲模板,在获取内容分类数据后,可以将该内容分类数据对应填入该大纲模板中,即可得到论文大纲,然后将论文大纲保存至论文数据库中。
可选地,论文大纲包括了论文文档的论点、论据和结论信息。示例性地,以论文文档的标题为:区域技术创新协同的影响因素研究为例,生成的论文大纲如下:
大纲:
研究假设:H1:知识型人力资本显著促进区域内主体间的技术创新协同活动(a)和跨区域主体间的技术创新协同活动(b)。
研究结果:知识型人力资本 (edu)在1%的水平下显著,区域内知识型人力资本的存量对区域内技术创新协同水平产生显著正向的促进作用。
结论:知识型人力资本显著促进区域内技术创新协同和跨区域技术创新协同。
其中,研究假设即为论点,研究结果即为论据。用户可以通过该论文大纲快速了解到论文文档的相关信息,进而由用户自主判断该论文文档是否符合自己的需求。不需要用户完整的阅读论文文档,减少用户的阅读工作量和耗时。
在一些可能的实施例中,论文大纲中的论点、论据和结论还可以包括其他类型的数据信息。示例性地,论点可以包括背景、理论分析和假设研究,论据可以包括研究设计和研究结果,在此不做限定。可选地,生成的论文大纲如下所示:
大纲:
背景:目前,多数文献并未将区域内和跨区域协同的影响因素分开研究。
理论分析:本文将三螺旋模型作为区域技术创新协同的稳定模式,从技术创新外部环境和创新主体自身等方面对区域技术创新协同影响因素进行分析。
研究假设:H1:知识型人力资本显著促进区域内主体间的技术创新协同活动(a)和跨区域主体间的技术创新协同活动(b)。
研究设计:创新主体合作专利数据作为反映区域技术创新协同的数据样本,选取2005—2016 年北京、天津、河北、上海、江苏、浙江、安徽七个省市的专利数据作为统计对象。
研究结果:知识型人力资本 (edu)在1%的水平下显著,区域内知识型人力资本的存量对区域内技术创新协同水平产生显著正向的促进作用。
结论:知识型人力资本显著促进区域内技术创新协同和跨区域技术创新协同。
S1400、获取用户输入的检索词信息;
S1500、在论文数据库中查找与检索词信息相匹配的至少一篇参考论文,并提供至少一篇参考论文的论文大纲的浏览阅读。
在使用过程中,当用户需要检索相关文献时,可以在论文辅助智能系统中输入检索词。具体地,检索词与用户所选论文的标题或者领域相关。示例性地,以用户输入的检索词为“区域技术创新”为例,在获取用户输入的检索词后遍历论文数据库以查找到与检索词相匹配的至少一篇参考论文。
可选地,遍历数据库的过程可以通过检索词匹配或者语义识别以查找参考论文。在实施时,查找的参考论文可以进行排序,例如根据与检索词的相关性由高到低进行排序,并取排序靠前的几篇参考论文的论文大纲进行展示。例如将排序前3、排序前10或者排序前20参考论文的论文大纲展示以供用户浏览阅读。
示例性地,例如用户输入的检索词为“区域技术创新”,返回的结果如下:
标题:区域技术创新协同的影响因素研究
大纲:
背景:目前,多数文献并未将区域内和跨区域协同的影响因素分开研究。
理论分析:本文将三螺旋模型作为区域技术创新协同的稳定模式,从技术创新外部环境和创新主体自身等方面对区域技术创新协同影响因素进行分析。
研究假设:H1:知识型人力资本显著促进区域内主体间的技术创新协同活动(a)和跨区域主体间的技术创新协同活动(b)。
研究设计:创新主体合作专利数据作为反映区域技术创新协同的数据样本,选取2005—2016 年北京、天津、河北、上海、江苏、浙江、安徽七个省市的专利数据作为统计对象。
研究结果:知识型人力资本 (edu)在1%的水平下显著,区域内知识型人力资本的存量对区域内技术创新协同水平产生显著正向的促进作用。
结论:知识型人力资本显著促进区域内技术创新协同和跨区域技术创新协同。
用户可以快速浏览得到所检索到的参考论文的标题、背景、论点、论据和结论等信息,从而快速判断检索到的参考论文是否符合自己的需求,减少阅读量,提高效率。
在一些可能的实施例中,本申请提供的写作智能辅助方法的实现过程可以看成包括论文入库流程和用户使用流程。如图6所示,论文入库要对论文文档进行文本解析进行观点提取、论据提取和结论提取。在其他实施例中,还可以进行关键词提取,提取得到的观点、论据和结论数据生成论文大纲。
在一些可能的实施例中,生成论文大纲的同时还可以建立知识图谱。示例性地,对提取得到的内容分类数据进行实体提取、关系提取和属性提取。其中,实体提取是指提取名称信息,例如从是论文文档中识别人名、地名和机构名并对其分类。关系提取是从论文文档中抽取两个实体的关系。属性提取是对时间和常量进行抽取。然后生成实体提取、关系提取和属性提取所得到的数据的知识图谱。
当用户要开始撰写论文时,先确定论文主题及领域,再由用户输入关键词等进行检索,系统返回相关论文大纲及知识图谱,用户可以根据需求获取词频等数据,为论文写作提供数据支撑。
本申请实施例通过获取已经公开发表的论文文档,然后对论文文档进行语义识别和文本解析,对论文文档中的内容进行分类得到内容分类数据,然后根据该内容分类数据生成论文文档的论文大纲保存至论文数据库。当用户开始写论文时,可以通过输入的搜索词获取至少一篇参考论文的论文大纲进行展示。用户浏览论文大纲以快速搜索到所需的论文文档,减少用户的浏览工作量,节省用户时间,提高效率。
实施例二
在一些可选实施例中,如图2所示,在对论文文档进行语义识别和文本解析,得到论文文档的内容分类数据的步骤之后,方法还包括:
1210、对论文文档进行关键词提取得到关键词词频信息;
1220、将关键词词频信息和内容分类数据建立关联关系并保存。
在实施时,一个词语如果在论文文档中出现的次数较多,那么这个词语就具有较高的权威性,可以将该词语作为论文文档的关键词。可选地,可以通过使用TF-IDF算法提取关键词,具体地,TF-IDF算法用于评估一个词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时也会随着它在鱼料库中出现的频率成反比下降。依据据TF-IDF算法为每个词赋予其在每一类论文集的权重,论文集则可以认为是一个N维的TF-IDF向量,N代表所有类别论文集合的单词个数,建立论文与单词的矩阵,然后生成标准化矩阵。矩阵行代表词的节点,矩阵列代表论文节点,矩阵中的数值是TF-IDF值,再将矩阵导入,通过改进的HITS算法提取出“权威”的词,即提取得到关键词。
可选地,确定关键词后可以对该关键词进行词频统计,其中,词频统计为对语篇或语料库中某一语词或短语出现的频数进行统计的过程或结果,即可得到关键词词频信息。然后将该关键词词频信息和内容分类数据建立关联关系并保存,此时,同一篇论文文档的论文大纲和关键词词频信息存在关联关系。
实施例三
在一些可选实施例中,如图3所示,在论文数据库中查找与检索词信息相匹配的至少一篇参考论文,并提供至少一篇参考论文的论文大纲的浏览阅读的步骤之后,方法还包括:
S1600、根据用户对至少一篇参考论文的论文大纲的选择操作确定论文主题;
S1700、获取与论文主题相对应的关键词词频信息并展示。
可选地,用户输入检索词进行检索,处理器在论文数据库中查找与检索词信息相匹配的至少一篇论文主题作为参考论文,并提供至少一篇参考论文的论文大纲的浏览阅读。当用户对其中任意一篇参考论文的论文大纲进行选择时,处理器将用户所选论文大纲关联的关键词词频信息进行展示,以辅助用户进行论文写作。
实施例四
在一些可选实施例中,如图4所示,在获取与论文主题相对应的关键词词频信息并展示的步骤之后,方法还包括:
S1800、根据论文主题在预设的论据数据库中匹配得到候选论据;
S1900、提取没有对应论证过程的候选论据作为目标论据;
S2000、对目标论据进行论证生成,并将论证生成结果进行展示。
在辅助用户写作过程中,系统还可以为用户的写作提供数据支撑。可选地,处理器将用户选择的论文大纲对应的论文文档确定为论文主题,然后根据该论文主题在论据数据库中进行匹配得到候选论据。
在一些实施例中,系统设置有论据数据库,论文主题中记载有论据,可以通过关键词匹配、文档结构分析或者句子位置分析等方式提取出论据句子,然后根据该论据句子在论据数据库中匹配得到候选论据。
可选地,论据数据库存储有提前标注好题目、论据和论证三元组,因此,还可以根据论文主题的题目匹配到候选论据。由于候选论据对应关联有论证,从而可以为用户提供论文写作数据支撑。
在一些可能的实施例中,论据数据库中存储有提前标注好题目、论据和论证三元组中论证可以为空,这就会出现匹配得到的候选论据没有对应论证过程,将没有对应论证过程的候选论证作为目标论据,然后对目标论据进行论证生成。
可选地,论证生成先将目标论据结合预设的词表进行多次迭代选择当前最可能生成词,这些词按顺序构成首段生成的结果就是论证生成结果,论证生成结果还可以进行展示,方便用户获取论证过程。具体地,词表为将当前文档集中所有不同词的集合,示例性地,上述使用TF-IDF算法提取的关键词的集合称为词表。
可选地,当目标论据过长时,还可以使用目标论据中的关键词代替论据,以突出论据中的重点内容。使用论据关键词代替目标论据进行论证生成,可以通过一个训练至收敛的卷积神经网络模型实现。具体地,该模型接收论文题目和论据关键词作为输入后输出论证。
在一些可能的实施例中,论证过程还可以在目标论据所对应的论文文档中提取得到,例如论文文档中记载有论证过程中实验的相关数据,包括文字、数字和图片等,在获取用户选取论文大纲确定论文主题时,对论文主题进行语义识别和文本解析提取论证进行展示,为用户的论文写作提供数据支撑。
实施例五
在一些可选地实施例中,如图5所示,本申请还提供一种写作智能辅助装置,装置包括:
文档获取单元2100,用于获取在预设的信息源公开发表的论文文档;
文档解析单元2200,用于对论文文档进行语义识别和文本解析,得到论文文档的内容分类数据;
大纲生成单元2300,用于根据内容分类数据生成与论文文档对应的论文大纲并保存存至论文数据库;
信息获取单元2400,用于获取用户输入的检索词信息;
大纲展示单元2500,用于在所述论文数据库中查找与所述检索词信息相匹配的至少一篇参考论文,并提供所述至少一篇参考论文的论文大纲的浏览阅读。
本申请实施例通过获取已经公开发表的论文文档,然后对论文文档进行语义识别和文本解析,对论文文档中的内容进行分类得到内容分类数据,然后根据该内容分类数据生成论文文档的论文大纲保存至论文数据库。当用户开始写论文时,可以通过输入的搜索词获取至少一篇参考论文的论文大纲进行展示。用户浏览论文大纲以快速搜索到所需的论文文档,减少用户的浏览工作量,节省用户时间,提高效率。
进一步地,装置还包括:
词频信息提取单元,用于对论文文档进行关键词提取得到关键词词频信息;
关联关系建立单元,用于将关键词词频信息和内容分类数据建立关联关系并保存。
进一步地,装置还包括:
论文主题确定单元,用于根据用户对所述至少一篇参考论文的论文大纲的选择操作确定论文主题;
词频信息展示单元,用于获取与所述论文主题相对应的关键词词频信息并展示。
进一步地,所述装置还包括:
论据匹配单元,用于根据所述论文主题在预设的论据数据库中匹配得到候选论据;
论据提取单元,用于提取没有对应论证过程的候选论据作为目标论据;
论证执行单元,用于对所述目标论据进行论证生成,并将论证生成结果进行展示。
进一步地,内容分类数据包括论文论点信息、论文论据信息以及论文结论信息。
所属领域的技术人员可以清楚地了解到,为描述的方便和间接,上述描述的写作智能辅助装置的结构和实现原理,可以参考前述实施例一至四中的对应方法实现原理,在此不再赘述。
实施例六
在一些可选地实施例中,本申请还提供一种写作智能辅助系统,写作智能辅助系统包括如上述的写作智能辅助装置。
在实施时,本申请提供的写作智能辅助系统用于辅助用户进行论文写作,其中,写作智能辅助装置包括文档获取单元2100、文档解析单元2200、大纲生成单元2300、信息获取单元2400和大纲展示单元2500,具体地,文档获取单元2100用于获取在预设的信息源公开发表的论文文档;文档解析单元2200用于对论文文档进行语义识别和文本解析,得到论文文档的内容分类数据;大纲生成单元2300用于根据内容分类数据生成与论文文档对应的论文大纲并保存存至论文数据库;信息获取单元2400用于获取用户输入的检索词信息;大纲展示单元2500用于在所述论文数据库中查找与所述检索词信息相匹配的至少一篇参考论文,并提供所述至少一篇参考论文的论文大纲的浏览阅读。
本申请实施例通过获取已经公开发表的论文文档,然后对论文文档进行语义识别和文本解析,对论文文档中的内容进行分类得到内容分类数据,然后根据该内容分类数据生成论文文档的论文大纲保存至论文数据库。当用户开始写论文时,可以通过输入的搜索词获取至少一篇参考论文的论文大纲进行展示。用户浏览论文大纲以快速搜索到所需的论文文档,减少用户的浏览工作量,节省用户时间,提高效率。
所属领域的技术人员可以清楚地了解到,为描述的方便和间接,上述描述的写作智能辅助系统的实现原理,可以参考前述实施例一至五中的对应结构和实现原理,在此不再赘述。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种写作智能辅助方法,其特征在于,包括:
获取在预设的信息源公开发表的论文文档;
对所述论文文档进行语义识别和文本解析,得到所述论文文档的内容分类数据;
根据所述内容分类数据生成与所述论文文档对应的论文大纲并保存至论文数据库;
获取用户输入的检索词信息;
在所述论文数据库中查找与所述检索词信息相匹配的至少一篇参考论文,并提供所述至少一篇参考论文的论文大纲的浏览阅读。
2.如权利要求1所述的写作智能辅助方法,其特征在于,在所述对所述论文文档进行语义识别和文本解析,得到所述论文文档的内容分类数据的步骤之后,所述方法还包括:
对所述论文文档进行关键词提取得到关键词词频信息;
将所述关键词词频信息和所述内容分类数据建立关联关系并保存。
3.如权利要求2所述的写作智能辅助方法,其特征在于,在所述论文数据库中查找与所述检索词信息相匹配的至少一篇参考论文,并提供所述至少一篇参考论文的论文大纲的浏览阅读的步骤之后,所述方法还包括:
根据用户对所述至少一篇参考论文的论文大纲的选择操作确定论文主题;
获取与所述论文主题相对应的关键词词频信息并展示。
4.如权利要求3所述的写作智能辅助方法,其特征在于,在所述获取与所述论文主题相对应的关键词词频信息并展示的步骤之后,所述方法还包括:
根据所述论文主题在预设的论据数据库中匹配得到候选论据;
提取没有对应论证过程的候选论据作为目标论据;
对所述目标论据进行论证生成,并将论证生成结果进行展示。
5.如权利要求1所述的写作智能辅助方法,其特征在于,所述内容分类数据包括论文论点信息、论文论据信息以及论文结论信息。
6.一种写作智能辅助装置,其特征在于,所述装置包括:
文档获取单元,用于获取在预设的信息源公开发表的论文文档;
文档解析单元,用于对所述论文文档进行语义识别和文本解析,得到所述论文文档的内容分类数据;
大纲生成单元,用于根据所述内容分类数据生成与所述论文文档对应的论文大纲并保存至论文数据库;
信息获取单元,用于获取用户输入的检索词信息;
大纲展示单元,用于在所述论文数据库中查找与所述检索词信息相匹配的至少一篇参考论文,并提供所述至少一篇参考论文的论文大纲的浏览阅读。
7.如权利要求6所述的写作智能辅助装置,其特征在于,所述装置还包括:
词频信息提取单元,用于对所述论文文档进行关键词提取得到关键词词频信息;
关联关系建立单元,用于将所述关键词词频信息和所述内容分类数据建立关联关系并保存。
8.如权利要求7所述的写作智能辅助装置,其特征在于,所述装置还包括:
论文主题确定单元,用于根据用户对所述至少一篇参考论文的论文大纲的选择操作确定论文主题;
词频信息展示单元,用于获取与所述论文主题相对应的关键词词频信息并展示。
9.如权利要求8所述的写作智能辅助装置,其特征在于,所述装置还包括:
论据匹配单元,用于根据所述论文主题在预设的论据数据库中匹配得到候选论据;
论据提取单元,用于提取没有对应论证过程的候选论据作为目标论据;
论证执行单元,用于对所述目标论据进行论证生成,并将论证生成结果进行展示。
10.一种写作智能辅助系统,其特征在于,所述写作智能辅助系统包括如权利要求6至9中任一项所述的写作智能辅助装置。
CN202310355078.4A 2023-04-06 2023-04-06 写作智能辅助方法、装置及系统 Pending CN116090473A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310355078.4A CN116090473A (zh) 2023-04-06 2023-04-06 写作智能辅助方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310355078.4A CN116090473A (zh) 2023-04-06 2023-04-06 写作智能辅助方法、装置及系统

Publications (1)

Publication Number Publication Date
CN116090473A true CN116090473A (zh) 2023-05-09

Family

ID=86204796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310355078.4A Pending CN116090473A (zh) 2023-04-06 2023-04-06 写作智能辅助方法、装置及系统

Country Status (1)

Country Link
CN (1) CN116090473A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108052490A (zh) * 2017-12-29 2018-05-18 北京仁和汇智信息技术有限公司 一种xml论文在线撰写方法和装置
CN109933791A (zh) * 2019-03-06 2019-06-25 科大讯飞股份有限公司 素材推荐方法、装置、计算机设备及计算机可读存储介质
CN110457439A (zh) * 2019-08-06 2019-11-15 北京如优教育科技有限公司 一站式智能写作辅助方法、装置和系统
CN115146030A (zh) * 2022-07-05 2022-10-04 上海晏鼠计算机技术股份有限公司 一种基于知识图谱的公务文书写作方法及系统
CN115687565A (zh) * 2022-09-23 2023-02-03 阿里巴巴达摩院(杭州)科技有限公司 文本生成方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108052490A (zh) * 2017-12-29 2018-05-18 北京仁和汇智信息技术有限公司 一种xml论文在线撰写方法和装置
CN109933791A (zh) * 2019-03-06 2019-06-25 科大讯飞股份有限公司 素材推荐方法、装置、计算机设备及计算机可读存储介质
CN110457439A (zh) * 2019-08-06 2019-11-15 北京如优教育科技有限公司 一站式智能写作辅助方法、装置和系统
CN115146030A (zh) * 2022-07-05 2022-10-04 上海晏鼠计算机技术股份有限公司 一种基于知识图谱的公务文书写作方法及系统
CN115687565A (zh) * 2022-09-23 2023-02-03 阿里巴巴达摩院(杭州)科技有限公司 文本生成方法及装置

Similar Documents

Publication Publication Date Title
CN107180045B (zh) 一种互联网文本蕴含地理实体关系的抽取方法
US8977953B1 (en) Customizing information by combining pair of annotations from at least two different documents
US10387469B1 (en) System and methods for discovering, presenting, and accessing information in a collection of text contents
CN111401045B (zh) 一种文本生成方法、装置、存储介质和电子设备
CN110162768B (zh) 实体关系的获取方法、装置、计算机可读介质及电子设备
US9026529B1 (en) Method and apparatus for determining search result demographics
CN110297880B (zh) 语料产品的推荐方法、装置、设备及存储介质
Armentano et al. NLP-based faceted search: Experience in the development of a science and technology search engine
Anoop et al. A topic modeling guided approach for semantic knowledge discovery in e-commerce
Das et al. The 5w structure for sentiment summarization-visualization-tracking
GB2568575A (en) Document search using grammatical units
Mohnot et al. Hybrid approach for Part of Speech Tagger for Hindi language
Mezentseva et al. Optimization of analysis and minimization of information losses in text mining
CN110688559A (zh) 一种检索方法及装置
US6973423B1 (en) Article and method of automatically determining text genre using surface features of untagged texts
JP4428703B2 (ja) 情報検索方法及びそのシステム並びにコンピュータプログラム
US20090240687A1 (en) Method of Processing a Collection of Document Sources
CN116090473A (zh) 写作智能辅助方法、装置及系统
Segev et al. Context recognition using internet as a knowledge base
Ramezani et al. Automated text summarization: An overview
Krilavičius et al. News media analysis using focused crawl and natural language processing: case of Lithuanian news websites
Rodrigues et al. Rapport—a portuguese question-answering system
JP2002183175A (ja) テキストマイニング方法
CN113918804A (zh) 商品信息检索系统及方法
JP2011076194A (ja) トピック具体表現辞書作成システム、トピック具体表現辞書作成方法及びそのプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination