CN110457439A - 一站式智能写作辅助方法、装置和系统 - Google Patents
一站式智能写作辅助方法、装置和系统 Download PDFInfo
- Publication number
- CN110457439A CN110457439A CN201910725052.8A CN201910725052A CN110457439A CN 110457439 A CN110457439 A CN 110457439A CN 201910725052 A CN201910725052 A CN 201910725052A CN 110457439 A CN110457439 A CN 110457439A
- Authority
- CN
- China
- Prior art keywords
- writing
- data
- keyword
- selection
- author
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一站式智能写作辅助方法、装置、系统和计算机可读存储介质。其中该一站式智能写作辅助方法包括:基于获取的写作属性信息,推荐一个或多个选题和关键词;其中属性信息表示写作所属的领域、类型或关键词;基于选择确定的选题和关键词,推荐一个或多个相关资料,提供所述资料的浏览阅读;基于选择确定的选题和关键词,推荐一个或多个写作提纲;在选择确定的写作提纲框架下,进行写作创作,生成写作作品;进一步提供格式规范,参考文献补全,作品查重等功能。通过采取该一站式智能写作辅助方法,解决了现有技术中提供信息不精准、效率低,写作辅助服务不到位、不完善的技术问题,全方位满足写作需要。
Description
技术领域
本公开涉及智能辅助领域,尤其涉及一种一站式智能写作辅助方法、装置、系统及计算机可读存储介质。
背景技术
写作是日常生活中必不可少的文字活动,经常需要进行大量的工作才能完成一份写作。尤其对于论文的写作,例如学术论文、学位论文等的创作,从立题、参考资料的整理、到创建提纲、撰写内容、提炼主题、规范格式以及查重等等,都需要工作者进行大量的专业性的工作,例如检索、查阅大量资料、规范撰写等。
现有技术中,通过静态资源,例如论文数据库,为论文的创作过程中资料的检索和查阅提供辅助。然而,随着信息技术的发展,传统的静态资源已经越来越不能满足用户动态的需求,传统的“人找信息”迫切需要朝着“信息找人”过渡。而传统的查阅资料的方式也无法满足需求,需要从被动式提供服务向主动式服务升级。
现有技术中的写作辅助还无法主动提供信息,为创作者提供准确、高效的信息,提高写作效率。
发明内容
针对上述技术问题,本公开提出了一种一站式智能写作辅助方法、装置、系统及计算机可读存储介质。
第一方面,本公开实施例提供一种一站式智能写作辅助方法,包括:
基于获取的写作属性信息,推荐一个或多个选题和关键词;其中属性信息表示写作所属的领域、类型或关键词;
基于选择确定的选题和关键词,推荐一个或多个相关资料,提供所述资料的浏览阅读;
基于选择确定的选题和关键词,推荐一个或多个写作提纲;
在选择确定的写作提纲框架下,进行写作创作,生成写作作品。
进一步,收集整理写作相关的资料数据,采用大数据分析技术,词典匹配法进行数据的分析与提取;采用自然语言分析技术进行数据的分析与匹配,实现所述选题和关键词的推荐,相关资料的推荐和写作提纲的推荐;其中采用改进的超文本推导主题搜索(HITS)方法进行关键词提取。
进一步,所述改进的超文本推导主题搜索(HITS)方法包括:数据预处理;对所述资料数据进行分词,获得独立的词语;利用TF-IDF算法计算每个所述词语在所述资料数据中的权重值;根据所述词语在所述资料数据中的权重值,建立标准化矩阵;基于所述标准化矩阵,计算所述词语与所述资料数据之间的关系值;根据所述关系值,提取代表性词语,作为所述资料数据的主题关键词,并将所述主题关键词与所述资料数据关联。
进一步,包括选择确定参考文献,并以规范的引文格式将确定的参考文献添加在所述写作提纲的指定单元。
进一步,所述写作为论文写作,所述写作属性信息包括论文类型、作者学历、所属研究机构、作者专业、导师信息、论文关键词中的任一项或多项。
进一步,包括论文查重,通过查重检测报告单提供查重相关指标数据。
进一步,包括期刊分析,用于给出相关期刊的现状分析;投稿指南,用于给出投稿流程、注意事项信息。
进一步,在所述写作提纲框架下的每一个单元的创作过程中,提供写作提示,所述写作提示为所述单元相关的资料信息。
进一步,在选题和关键词的推荐过程中,在相关资料的推荐和写作提纲的推荐过程中,基于所选取确定的选题、关键词、相关资料或写作提纲,利用AI技术不断自学习,更新所推荐的选题、关键词、相关资料或写作提纲。
进一步,包括以规范的格式组织所述写作作品,以统一规范的文件格式存储所述写作作品;对于相关资料中的外文资料,提供智能翻译选择,在翻译指令的触发下,对所述外文资料进行翻译。
第二方面,本公开实施例提供一种一站式智能写作辅助装置,其特征在于,包括:
第一推荐模块,用于基于获取的写作属性信息,推荐一个或多个选题和关键词;其中属性信息表示写作所属的领域、类型或关键词;
第二推荐模块,用于基于选择确定的选题和关键词,推荐一个或多个相关资料,提供所述资料的浏览阅读;
第三推荐模块,用于基于选择确定的选题和关键词,推荐一个或多个写作提纲;
创作模块,用于在选择确定的写作提纲框架下,进行写作创作,生成写作作品。
进一步,收集整理写作相关的资料数据,采用大数据分析技术,词典匹配法进行数据的分析与提取;采用自然语言分析技术进行数据的分析与匹配,实现所述选题和关键词的推荐,相关资料的推荐和写作提纲的推荐;其中采用改进的超文本推导主题搜索(HITS)方法进行关键词提取。
进一步,所述改进的超文本推导主题搜索(HITS)方法包括:数据预处理;对所述资料数据进行分词,获得独立的词语;利用TF-IDF算法计算每个所述词语在所述资料数据中的权重值;根据所述词语在所述资料数据中的权重值,建立标准化矩阵;基于所述标准化矩阵,计算所述词语与所述资料数据之间的关系值;根据所述关系值,提取代表性词语,作为所述资料数据的主题关键词,并将所述主题关键词与所述资料数据关联。
进一步,包括选择确定参考文献,并以规范的引文格式将确定的参考文献添加在所述写作提纲的指定单元。
进一步,所述写作为论文写作,所述写作属性信息包括论文类型、作者学历、所属研究机构、作者专业、导师信息、论文关键词中的任一项或多项。
进一步,包括论文查重,通过查重检测报告单提供查重相关指标数据。
进一步,包括期刊分析,用于给出相关期刊的现状分析;投稿指南,用于给出投稿流程、注意事项信息。
进一步,在所述写作提纲框架下的每一个单元的创作过程中,提供写作提示,所述写作提示为所述单元相关的资料信息。
进一步,在选题和关键词的推荐过程中,在相关资料的推荐和写作提纲的推荐过程中,基于所选取确定的选题、关键词、相关资料或写作提纲,利用AI技术不断自学习,更新所推荐的选题、关键词、相关资料或写作提纲。
进一步,包括以规范的格式组织所述写作作品,以统一规范的文件格式存储所述写作作品;对于相关资料中的外文资料,提供智能翻译选择,在翻译指令的触发下,对所述外文资料进行翻译。
第三方面,本公开实施例提供一种一种一站式智能写作辅助系统,包括:至少一个处理器;
以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有能被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述第一方面中的任一所述一站式智能写作辅助方法。
第四方面,本公开实施例提供一种非暂态计算机可读存储介质,其特征在于,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行前述第一方面中的任一所述一站式智能写作辅助方法。
本公开公开了一站式智能写作辅助方法、装置、系统及计算机可读存储介质。其中该一站式智能写作辅助方法包括:基于获取的写作属性信息,推荐一个或多个选题和关键词;其中属性信息表示写作所属的领域、类型或关键词;基于选择确定的选题和关键词,推荐一个或多个相关资料,提供所述资料的浏览阅读;基于选择确定的选题和关键词,推荐一个或多个写作提纲;在选择确定的写作提纲框架下,进行写作创作,生成写作作品。通过采取该一站式智能写作辅助方法,解决了现有技术中提供信息不精准、效率低,写作辅助服务不到位、不完善的技术问题。
上述说明仅是本公开技术方案的概述,为了能更清楚了解本公开的技术手段,而可依照说明书的内容予以实施,并且为让本公开的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本公开一个实施例的一种一站式智能写作辅助方法流程图;
图2是本公开另一个实施例的一种一站式智能写作辅助方法流程图;
图3是本公开一个实施例的一种一站式智能写作辅助系统结构图;
图4是本公开一个实施例的计算机可读存储介质结构图;
图5是本公开一个实施例的一种一站式智能写作辅助装置结构图;
图6是本公开一个实施例的改进的超文本推导主题搜索(HITS)方法流程图。
具体实施方式
以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本公开的基本构想,图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
图1,2为本公开实施例提供的一站式智能写作辅助方法流程图,本实施例提供的该一站式智能写作辅助方法可以由一站式智能写作辅助系统来执行,该一站式智能写作辅助系统可以实现为软件,或者实现为软件和硬件的组合,该一站式智能写作辅助系统可以集成设置在图像处理系统中的某设备中,比如服务器或者终端设备中。如图1所示,该一站式智能写作辅助方法包括如下步骤:
步骤S101,基于获取的写作属性信息,推荐一个或多个选题和关键词;其中属性信息表示写作所属的领域、类型或关键词;
在写作开始时,都有个初步的想法,所进行的写作与作者的身份,所处的阶段,环境等因素都息息相关。这些与作者相关的属性信息,作者所要进行的写作的类型,领域,层次等信息都属于写作的属性信息。写作辅助系统基于这些写作的属性信息,才能分析整理推荐最相关的信息知识,辅助作者进行写作。
在一个实施例中,作者进行论文写作,例如,学术论文、学位论文等。论文写作的属性信息包括论文类型,例如学位(学士、硕士、博士)论文、期刊论文、毕业论文等;论文的基本关键词,这些关键词表示论文的初步思路或想法;写作的属性信息还包括作者的属性信息,例如学历,单位,院校,导师等等。
基于获取的写作的属性信息,系统精准推荐一个或多个选题,作者能够从中选取所需要的选题,作为自己所进行的写作的题目。推荐的选题包括但不限于开题报告,文献综述,以及选题方向等多方面内容。
在一个实施例中,写作辅助系统通过多种手段收集现有的写作成果,例如各种论文,小说,科技文献,新闻等等。采用大数据技术对收集的写作成果进行分析、整理、归类,以支持写作辅助,推荐相关信息。例如Hadoop、MapReduce和Spark等分布式处理方法,用于处理收集的大量写作成果,对这些写作成果数据进行分析、整理、归类,以支持写作辅助。
此外,基于实时业务需求,采用支持在线处理的Storm、Cludar Lmpala、Spark等容错实时计算系统,对数据流做连续查询,将结果数据以流的形式输出,以并行方式运行等等。
基于性能、兼容性、数据类型等因素,可以采用Shark、Apache等开源解决方案来形成大数据处理系统。采用异构数据库集成技术、Web信息系统的实体识别技术和DeepWeb集成技术,将异构的数据集获取,整合,生成统一的数据集合,提供数据查询支持。
通过列存储或行列混合存储以及粗粒度索引等技术,结合MPP(Massive ParallelProcessing)架构高效的分布式计算模式,实现对PB量级数据的存储和管理。通过对Hadoop生态体系的技术扩展和封装,实现对半结构化和非结构化数据的存储和管理;采用MPP并行数据库集群与Hadoop集群的混合来实现对百PB量级、EB量级数据的存储和管理。
采用MapReduce计算模式进行底层的抽象并行计算。分布式计算框架MapReduce将对数据的处理归结为Map和Reduce两大类操作,从而简化了编程接口并且提高了系统的容错性。基于MapReduce的分布式机器学习库Mahout需要将迭代运算分解为多个连续的Map和Reduce操作,通过读写HDFS文件方式将上一轮次循环的运算结果传入下一轮完成数据交换。采用大规模数据可视化的技术会结合多分辨率表示等方法,以获得足够的互动性能。主要涉及数据流线化、任务并行化、管道并行化和数据并行化等技术。
在一个实施例中,写作辅助系统可以利用第三方系统提供的数据服务,例如各种论文数据库,文学数据库,科技数据库等等。同样通过大数据技术进行分析、整理、归类,以支持写作辅助,推荐相关信息。例如通过网络爬虫技术收集免费数据,或者与第三方合作收集授权数据,或者直接利用第三方系统。
对大量存在的资料数据进行准确分析是至关重要的,通过分析提取权威、参考意义更高的资料,能够为写作提供更快捷、准确的助益。在一个实施例中,对HITS(Hypertext-Induced Topic Search)算法进行改进,对现有的大量资料数据进行关键词的分析与提取,以获得更加精准的关键词。其中,改进的HITS算法包括两个指标:权威值(Authority)和中心值(Hub)。权威值用来衡量资料数据,即对于一个特定的检索,权威资料提供最好的相关信息。中心值用来衡量一个资料与其他资料关联的数量,即中心资料提供很多指向其他高质量权威型资料的关联。资料的权威值越高,表示这个资料越重要;中心值越高,表示这个资料被关联的次数越多。
改进的HITS算法,如图6所示,包括以下步骤:1)数据预处理,去除不必要的各种词语,例如连词、副词等;
2)对资料数据进行分词,获得独立的词语;采用现有的分词技术进行分词提取获得多个待分析的词语;
3)采用TF-IDF算法为每个词语计算权重值,TF-IDF(Term Frequency&InverseDocumentation Frequency)算法是是词语权重最为有效的实现方法。该算法的主要思想是:一个词在特定的文档中出现的频率越高,说明它在区分该文档内容属性方面的能力越强(TF);一个词在文档中出现的范围越广,说明它区分文档内容的属性越低(1DF)。使用TF-IDF算法计算权重,其计算公式为:Wij=tfij×idfj=tfij×log(N/nj);
其中tfij指特征项tj在文档di中出现的次数;idfj指出现特征项tj的文档的倒数。N表示总文档数,nj指出现特征项tj的文档数。
4)根据所述词语在所述资料数据中的权重值,建立标准化矩阵;
5)基于所述标准化矩阵,计算所述词语与所述资料数据之间的关系值;
6)根据所述关系值,提取代表性词语,作为所述资料数据的主题关键词,并将所述主题关键词与所述资料数据关联。
TF-IDF算法用以评估一个词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。依据TF-IDF算法为每个词赋予其在每一类论文集的权重,论文集则可以认为是一个N维的TF-IDF向量,N代表所有类别论文集合的单词个数,建立论文与单词的矩阵,然后生成标准化矩阵。矩阵行代表词的节点,矩阵列代表论文节点,矩阵中的数值是TF-IDF值,再将矩阵导入,通过改进的HITS算法提取出“权威”的词。
一个词语如果在中心论文里出现许多次,那么它具有较高的权威性;而如果一篇论文中包含许多的权威单词,则它具有较高的中心性。因此可以推断,含有许多“权威”词语的论文一定是“中心”的核心论文,而在许多“中心”的核心论文中出现的词语一定是“权威”的关键词。对于聚类结果中的每一类,论文的主题是相似的而且是某领域的核心论文,改进的HITS算法能够有效地发现关键词和更为核心的论文。
进一步,对于每一个资料数据,既提供改进HITS算法提取出的关键词又提供PUBMED标引的主题词。
基于获取的写作的属性信息,在作者选取了选题情况下,系统进一步推荐该选题密切相关的关键词集合,提供给作者选择。所选择的关键词进一步可以作为作者所进行的写作的关键词,例如论文的关键词。
在一个实施例中,写作辅助系统基于作者所选择的选题和关键词,利用AI技术,进行自学习,不断修正、更新所推荐的选题和关键词。采用回归算法构成经验学习模型,对作者输入的经验数据进行统计分析,确定特征,利用深度学习模型,用深度网络进行数据分析,输出更加贴近作者需要的信息推荐。例如采用遗传算法,构建神经网络,基于经验数据的分析,输出推荐信息。
步骤S102,基于选择确定的选题和关键词,推荐一个或多个相关资料,提供所述资料的浏览阅读;
通常,在进行写作创作过程中,需要搜集大量的资料阅读参考,来开拓写作创作的思路。写作辅助系统基于作者选择确定的选题和关键词,推荐一个或多个与该选题和关键词相关的资料。
在一个实施例中,系统提供在线阅读,提供资料编辑功能,作者可以将有用的内容标注、拷贝等。
在一个实施例中,系统也提供资料的下载,供作者在本地对资料进行操作。
在一个实施例中,出于版权、著作权等知识产权,安全等方面的考虑,限制作者对资料进行相关的操作,例如禁止下载、拷贝等。
在一个实施例中,系统将推荐的资料进行整理归类,以友善的组织形式呈现资料,以便于作者更加便捷、高效地查找、浏览和阅读这些资料。例如,基于资料的属性将资料分类,分类并排序呈现资料,例如按照资料类型(期刊,互联网,专利,图书,论文)进行分类,或者按照来源(期刊名等)进行分类,并按照相关度或者发表时间进行排序。
在一个实施例中,系统对分析整理的资料进行筛除,将相似度大于一定阈值的资料查重筛除,以减少推荐资料的噪音。
作者通过阅读所推荐的资料,形成写作思路,进行写作创作。
在一个实施例中,写作辅助系统基于作者浏览阅读的资料,利用AI技术,进行自学习,不断修正、更新所推荐的资料。所采用的AI技术如上面所述,不再赘述。
步骤S103,基于选择确定的选题和关键词,推荐一个或多个写作提纲;
根据作者选取的关键词,基于所确定的选题,系统推荐一个或多个写作提纲;作者可以从所推荐的写作提纲中确定一个作为所进行的写作的提纲。
提纲是作者构思谋篇的具体体现。便于作者有条理地安排材料、展开论证。好的提纲能够纲举目张,掌握写作全篇的基本骨架,使之结构完整统一,能够分清层次,明确重点,周密地谋篇布局,使总论点和分论点有机地统一起来;能够按照各单元(部分)的要求安排、组织、利用资料,决定取舍,最大限度发挥资料的作用。
在一个实施例中,进一步基于推荐的资料来确定被推荐的写作提纲;
在一个实施例中,进一步基于作者浏览阅读的资料来确定被推荐的写作提纲。
在一个实施例中,写作辅助系统基于作者浏览阅读的资料,利用AI技术,进行自学习,不断修正、更新所推荐的资料。所采用的AI技术如上面所述,不再赘述。
在一个实施例中,写作辅助系统基于作者选取的提纲,利用AI技术,进行自学习,不断修正、更新所推荐的提纲。所采用的AI技术如上面所述,不再赘述。
步骤S104,在选择确定的写作提纲框架下,进行写作创作,生成写作作品。
作者在确定的写作提纲框架下,能够在提纲下的每一个单元中进行写作创作,最终完成写作,生成作品。
在一个实施例中,写作辅助系统在提纲下的每一个单元中都推荐与该单元相关的资料,作为智能写作提示,以供作者在该单元的创作过程中参考。对所述资料的处理,系统同样提供在线阅读,提供资料编辑功能,作者可以将有用的内容标注、拷贝等。
在一个实施例中,系统也提供资料的下载,供作者在本地对资料进行操作。
在一个实施例中,出于版权、著作权等知识产权,安全等方面的考虑,限制作者对资料进行相关的操作,例如禁止下载、拷贝等。
在一个实施例中,系统将推荐的资料进行整理归类,以友善的组织形式呈现资料,以便于作者更加便捷、高效地查找、浏览和阅读这些资料。例如,基于资料的属性将资料分类,分类并排序呈现资料,例如按照资料类型(期刊,互联网,专利,图书,论文)进行分类,或者按照来源(期刊名等)进行分类,并按照相关度或者发表时间进行排序。
通过这种智能写作提示,能够节省作者查询资料的时间,提高写作的效率。
进一步,写作辅助系统以规范的格式来组织所述写作作品,以统一规范的文件格式存储所述写作作品。例如,以word文件格式来存储写作作品;以论文规范格式来组织论文,形成word文件格式的论文,并自动添加封面、目录等论文规范格式,形成规范的论文。
在一个实施例中,提供多种方式的作品打印,共享,传输。例如通过网络共享、打印或上传。
进一步,对于相关资料中的外文资料,写作辅助系统提供智能翻译选择,在翻译指令的触发下,对所述外文资料进行翻译。
通过采取该一站式智能写作辅助方法,解决了现有技术中提供信息不精准、效率低,写作辅助服务不到位、不完善的技术问题。
如图5所示,本公开实施例提供的一种一站式智能写作辅助装置,包括:
第一推荐模块,用于基于获取的写作属性信息,推荐一个或多个选题和关键词;其中属性信息表示写作所属的领域、类型或关键词;
第二推荐模块,用于基于选择确定的选题和关键词,推荐一个或多个相关资料,提供所述资料的浏览阅读;
第三推荐模块,用于基于选择确定的选题和关键词,推荐一个或多个写作提纲;
创作模块,用于在选择确定的写作提纲框架下,进行写作创作,生成写作作品。
第一推荐模块,基于获取的写作属性信息,推荐一个或多个选题和关键词;其中属性信息表示写作所属的领域、类型或关键词;
在写作开始时,都有个初步的想法,所进行的写作与作者的身份,所处的阶段,环境等因素都息息相关。这些与作者相关的属性信息,作者所要进行的写作的类型,领域,层次等信息都属于写作的属性信息。写作辅助系统基于这些写作的属性信息,才能分析整理推荐最相关的信息知识,辅助作者进行写作。
在一个实施例中,作者进行论文写作,例如,学术论文、学位论文等。论文写作的属性信息包括论文类型,例如学位(学士、硕士、博士)论文、期刊论文、毕业论文等;论文的基本关键词,这些关键词表示论文的初步思路或想法;写作的属性信息还包括作者的属性信息,例如学历,单位,院校,导师等等。
基于获取的写作的属性信息,系统精准推荐一个或多个选题,作者能够从中选取所需要的选题,作为自己所进行的写作的题目。推荐的选题包括但不限于开题报告,文献综述,以及选题方向等多方面内容。
在一个实施例中,写作辅助系统通过多种手段收集现有的写作成果,例如各种论文,小说,科技文献,新闻等等。采用大数据技术对收集的写作成果进行分析、整理、归类,以支持写作辅助,推荐相关信息。例如Hadoop、MapReduce和Spark等分布式处理方法,用于处理收集的大量写作成果,对这些写作成果数据进行分析、整理、归类,以支持写作辅助。
此外,基于实时业务需求,采用支持在线处理的Storm、Cludar Lmpala、Spark等容错实时计算系统,对数据流做连续查询,将结果数据以流的形式输出,以并行方式运行等等。
基于性能、兼容性、数据类型等因素,可以采用Shark、Apache等开源解决方案来形成大数据处理系统。采用异构数据库集成技术、Web信息系统的实体识别技术和DeepWeb集成技术,将异构的数据集获取,整合,生成统一的数据集合,提供数据查询支持。
通过列存储或行列混合存储以及粗粒度索引等技术,结合MPP(Massive ParallelProcessing)架构高效的分布式计算模式,实现对PB量级数据的存储和管理。通过对Hadoop生态体系的技术扩展和封装,实现对半结构化和非结构化数据的存储和管理;采用MPP并行数据库集群与Hadoop集群的混合来实现对百PB量级、EB量级数据的存储和管理。
采用MapReduce计算模式进行底层的抽象并行计算。分布式计算框架MapReduce将对数据的处理归结为Map和Reduce两大类操作,从而简化了编程接口并且提高了系统的容错性。基于MapReduce的分布式机器学习库Mahout需要将迭代运算分解为多个连续的Map和Reduce操作,通过读写HDFS文件方式将上一轮次循环的运算结果传入下一轮完成数据交换。采用大规模数据可视化的技术会结合多分辨率表示等方法,以获得足够的互动性能。主要涉及数据流线化、任务并行化、管道并行化和数据并行化等技术。
在一个实施例中,写作辅助系统可以利用第三方系统提供的数据服务,例如各种论文数据库,文学数据库,科技数据库等等。同样通过大数据技术进行分析、整理、归类,以支持写作辅助,推荐相关信息。例如通过网络爬虫技术收集免费数据,或者与第三方合作收集授权数据,或者直接利用第三方系统。
对大量存在的资料数据进行准确分析是至关重要的,通过分析提取权威、参考意义更高的资料,能够为写作提供更快捷、准确的助益。在一个实施例中,对HITS(Hypertext-Induced Topic Search)算法进行改进,对现有的大量资料数据进行关键词的分析与提取,以获得更加精准的关键词。其中,改进的HITS算法包括两个指标:权威值(Authority)和中心值(Hub)。权威值用来衡量资料数据,即对于一个特定的检索,权威资料提供最好的相关信息。中心值用来衡量一个资料与其他资料关联的数量,即中心资料提供很多指向其他高质量权威型资料的关联。资料的权威值越高,表示这个资料越重要;中心值越高,表示这个资料被关联的次数越多。
改进的HITS算法,如图6所示,包括以下步骤:
1)数据预处理,去除不必要的各种词语,例如连词、副词等;
2)对资料数据进行分词,获得独立的词语;采用现有的分词技术进行分词提取获得多个待分析的词语;
3)采用TF-IDF算法为每个词语计算权重值,TF-IDF(Term Frequency&InverseDocumentation Frequency)算法是是词语权重最为有效的实现方法。该算法的主要思想是:一个词在特定的文档中出现的频率越高,说明它在区分该文档内容属性方面的能力越强(TF);一个词在文档中出现的范围越广,说明它区分文档内容的属性越低(IDF)。使用TF-IDF算法计算权重,其计算公式为:Wij=tfij×idfj=tfij×log(N/nj);
其中tfij指特征项tj在文档di中出现的次数;idfj指出现特征项tj的文档的倒数。N表示总文档数,nj指出现特征项tj的文档数。
4)根据所述词语在所述资料数据中的权重值,建立标准化矩阵;
5)基于所述标准化矩阵,计算所述词语与所述资料数据之间的关系值;
6)根据所述关系值,提取代表性词语,作为所述资料数据的主题关键词,并将所述主题关键词与所述资料数据关联。
TF-IDF算法用以评估一个词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。依据TF-IDF算法为每个词赋予其在每一类论文集的权重,论文集则可以认为是一个N维的TF-IDF向量,N代表所有类别论文集合的单词个数,建立论文与单词的矩阵,然后生成标准化矩阵。矩阵行代表词的节点,矩阵列代表论文节点,矩阵中的数值是TF-IDF值,再将矩阵导入,通过改进的HITS算法提取出“权威”的词。
一个词语如果在中心论文里出现许多次,那么它具有较高的权威性;而如果一篇论文中包含许多的权威单词,则它具有较高的中心性。因此可以推断,含有许多“权威”词语的论文一定是“中心”的核心论文,而在许多“中心”的核心论文中出现的词语一定是“权威”的关键词。对于聚类结果中的每一类,论文的主题是相似的而且是某领域的核心论文,改进的HITS算法能够有效地发现关键词和更为核心的论文。
进一步,对于每一个资料数据,既提供改进HITS算法提取出的关键词又提供PUBMED标引的主题词。
基于获取的写作的属性信息,在作者选取了选题情况下,系统进一步推荐该选题密切相关的关键词集合,提供给作者选择。所选择的关键词进一步可以作为作者所进行的写作的关键词,例如论文的关键词。
在一个实施例中,写作辅助系统基于作者所选择的选题和关键词,利用AI技术,进行自学习,不断修正、更新所推荐的选题和关键词。采用回归算法构成经验学习模型,对作者输入的经验数据进行统计分析,确定特征,利用深度学习模型,用深度网络进行数据分析,输出更加贴近作者需要的信息推荐。例如采用遗传算法,构建神经网络,基于经验数据的分析,输出推荐信息。
第二推荐模块,基于选择确定的选题和关键词,推荐一个或多个相关资料,提供所述资料的浏览阅读;
通常,在进行写作创作过程中,需要搜集大量的资料阅读参考,来开拓写作创作的思路。写作辅助系统基于作者选择确定的选题和关键词,推荐一个或多个与该选题和关键词相关的资料。
在一个实施例中,系统提供在线阅读,提供资料编辑功能,作者可以将有用的内容标注、拷贝等。
在一个实施例中,系统也提供资料的下载,供作者在本地对资料进行操作。
在一个实施例中,出于版权、著作权等知识产权,安全等方面的考虑,限制作者对资料进行相关的操作,例如禁止下载、拷贝等。
在一个实施例中,系统将推荐的资料进行整理归类,以友善的组织形式呈现资料,以便于作者更加便捷、高效地查找、浏览和阅读这些资料。例如,基于资料的属性将资料分类,分类并排序呈现资料,例如按照资料类型(期刊,互联网,专利,图书,论文)进行分类,或者按照来源(期刊名等)进行分类,并按照相关度或者发表时间进行排序。
在一个实施例中,系统对分析整理的资料进行筛除,将相似度大于一定阈值的资料查重筛除,以减少推荐资料的噪音。
作者通过阅读所推荐的资料,形成写作思路,进行写作创作。
在一个实施例中,写作辅助系统基于作者浏览阅读的资料,利用AI技术,进行自学习,不断修正、更新所推荐的资料。所采用的AI技术如上面所述,不再赘述。
第三推荐模块,基于选择确定的选题和关键词,推荐一个或多个写作提纲;
根据作者选取的关键词,基于所确定的选题,系统推荐一个或多个写作提纲;作者可以从所推荐的写作提纲中确定一个作为所进行的写作的提纲。
提纲是作者构思谋篇的具体体现。便于作者有条理地安排材料、展开论证。好的提纲能够纲举目张,掌握写作全篇的基本骨架,使之结构完整统一,能够分清层次,明确重点,周密地谋篇布局,使总论点和分论点有机地统一起来;能够按照各单元(部分)的要求安排、组织、利用资料,决定取舍,最大限度发挥资料的作用。
在一个实施例中,进一步基于推荐的资料来确定被推荐的写作提纲;
在一个实施例中,进一步基于作者浏览阅读的资料来确定被推荐的写作提纲。
在一个实施例中,写作辅助系统基于作者浏览阅读的资料,利用AI技术,进行自学习,不断修正、更新所推荐的资料。所采用的AI技术如上面所述,不再赘述。
在一个实施例中,写作辅助系统基于作者选取的提纲,利用AI技术,进行自学习,不断修正、更新所推荐的提纲。所采用的AI技术如上面所述,不再赘述。
创作模块,在选择确定的写作提纲框架下,进行写作创作,生成写作作品。
作者在确定的写作提纲框架下,能够在提纲下的每一个单元中进行写作创作,最终完成写作,生成作品。
在一个实施例中,写作辅助系统在提纲下的每一个单元中都推荐与该单元相关的资料,作为智能写作提示,以供作者在该单元的创作过程中参考。对所述资料的处理,系统同样提供在线阅读,提供资料编辑功能,作者可以将有用的内容标注、拷贝等。
在一个实施例中,系统也提供资料的下载,供作者在本地对资料进行操作。
在一个实施例中,出于版权、著作权等知识产权,安全等方面的考虑,限制作者对资料进行相关的操作,例如禁止下载、拷贝等。
在一个实施例中,系统将推荐的资料进行整理归类,以友善的组织形式呈现资料,以便于作者更加便捷、高效地查找、浏览和阅读这些资料。例如,基于资料的属性将资料分类,分类并排序呈现资料,例如按照资料类型(期刊,互联网,专利,图书,论文)进行分类,或者按照来源(期刊名等)进行分类,并按照相关度或者发表时间进行排序。
通过这种智能写作提示,能够节省作者查询资料的时间,提高写作的效率。
进一步,写作辅助系统以规范的格式来组织所述写作作品,以统一规范的文件格式存储所述写作作品。例如,以word文件格式来存储写作作品;以论文规范格式来组织论文,形成word文件格式的论文,并自动添加封面、目录等论文规范格式,形成规范的论文。
在一个实施例中,提供多种方式的作品打印,共享,传输。例如通过网络共享、打印或上传。
进一步,对于相关资料中的外文资料,写作辅助系统提供智能翻译选择,在翻译指令的触发下,对所述外文资料进行翻译。
下面参考图3,其示出了适于用来实现本公开实施例的一站式智能写作辅助系统300的结构示意图。本公开实施例中的系统300包括的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图3示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图3所示,电子设备300可以包括处理装置(例如中央处理器、图形处理器等)301,其可以根据存储在只读存储器(ROM)302中的程序或者从存储装置308加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理。在RAM303中,还存储有电子设备300操作所需的各种程序和数据。处理装置301、ROM 302以及RAM303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
通常,以下装置可以连接至I/O接口305:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置306;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置307;包括例如磁带、硬盘等的存储装置308;以及通信装置309。通信装置309可以允许电子设备300与其他设备进行无线或有线通信以交换数据。虽然图3示出了具有各种装置的电子设备300,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置309从网络上被下载和安装,或者从存储装置308被安装,或者从ROM 302被安装。在该计算机程序被处理装置301执行时,执行本公开实施例的方法中限定的上述功能。
图4是根据本公开的实施例的计算机可读存储介质的示意图。如图4所示,根据本公开实施例的计算机可读存储介质40,其上存储有非暂时性计算机可读指令41。当该非暂时性计算机可读指令41由处理器运行时,执行前述的本公开各实施例的一站式智能写作辅助方法的全部或部分步骤。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:构建基础页面,所述基础页面的页面代码用于搭建所述业务页面运行所需的环境和/或实现同类业务场景中抽象出的相同的工作流程;构建一个或多个页面模板,所述页面模板用于提供业务场景中实现业务功能的代码模板;基于相应的所述页面模板,通过业务场景的每一个页面的具体功能的代码转换,生成业务场景的每一个页面的最终页面代码;将生成的所述每一个页面的最终页面代码合并入所述基础页面的页面代码,生成所述业务页面的代码。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:构建基础页面,所述基础页面的页面代码用于搭建所述业务页面运行所需的环境和/或实现同类业务场景中抽象出的相同的工作流程;构建一个或多个页面模板,所述页面模板用于提供业务场景中实现业务功能的代码模板;基于相应的所述页面模板,通过业务场景的每一个页面的具体功能的代码转换,生成业务场景的每一个页面的最终页面代码;将生成的所述每一个页面的最终页面代码合并入所述基础页面的页面代码,生成所述业务页面的代码。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言-诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (13)
1.一种一站式智能写作辅助方法,其特征在于,包括:
基于获取的写作属性信息,推荐一个或多个选题和关键词,其中属性信息表示写作所属的领域、类型或关键词;
基于选择确定的选题和关键词,推荐一个或多个相关资料,提供所述资料的浏览阅读;
基于选择确定的选题和关键词,推荐一个或多个写作提纲;
在选择确定的写作提纲框架下,进行写作创作,生成写作作品。
2.如权利要求1所述的方法,其中,收集整理写作相关的资料数据,采用大数据分析技术,词典匹配法进行数据的分析与提取;采用自然语言分析技术进行数据的分析与匹配,实现所述选题和关键词的推荐,相关资料的推荐和写作提纲的推荐;其中采用改进的超文本推导主题搜索(HITS)方法进行关键词提取。
3.如权利要求2所述的方法,其中,所述改进的超文本推导主题搜索(HITS)方法包括:数据预处理;
对所述资料数据进行分词,获得独立的词语;
利用TF-IDF算法计算每个所述词语在所述资料数据中的权重值;
根据所述词语在所述资料数据中的权重值,建立标准化矩阵;
基于所述标准化矩阵,计算所述词语与所述资料数据之间的关系值;
根据所述关系值,提取代表性词语,作为所述资料数据的主题关键词,并将所述主题关键词与所述资料数据关联。
4.如权利要求1所述的方法,进一步包括选择确定参考文献,并以规范的引文格式将确定的参考文献添加在所述写作提纲的指定单元。
5.如权利要求1所述的方法,所述写作为论文写作,所述写作属性信息包括论文类型、作者学历、所属研究机构、作者专业、导师信息、论文关键词中的任一项或多项。
6.如权利要求5所述的方法,进一步包括论文查重,通过查重检测报告单提供查重相关指标数据。
7.如权利要求5所述的方法,进一步包括期刊分析,用于给出相关期刊的现状分析;投稿指南,用于给出投稿流程、注意事项信息。
8.如权利要求1所述的方法,在所述写作提纲框架下的每一个单元的创作过程中,提供写作提示,所述写作提示为所述单元相关的资料信息。
9.如权利要求1所述的方法,进一步在选题和关键词的推荐过程中,在相关资料的推荐和写作提纲的推荐过程中,基于所选取确定的选题、关键词、相关资料或写作提纲,利用Al技术不断自学习,更新所推荐的选题、关键词、相关资料或写作提纲。
10.如权利要求1所述的方法,进一步包括以规范的格式组织所述写作作品,以统一规范的文件格式存储所述写作作品;对于相关资料中的外文资料,提供智能翻译选择,在翻译指令的触发下,对所述外文资料进行翻译。
11.一种一站式智能写作辅助装置,其特征在于,包括:
第一推荐模块,用于基于获取的写作属性信息,推荐一个或多个选题和关键词;其中属性信息表示写作所属的领域、类型或关键词;
第二推荐模块,用于基于选择确定的选题和关键词,推荐一个或多个相关资料,提供所述资料的浏览阅读;
第三推荐模块,用于基于选择确定的选题和关键词,推荐一个或多个写作提纲;
创作模块,用于在选择确定的写作提纲框架下,进行写作创作,生成写作作品。
12.一种一站式智能写作辅助系统,包括:
存储器,用于存储非暂时性计算机可读指令;以及
处理器,用于运行所述计算机可读指令,使得所述处理器执行时实现根据权利要求1-10中任意一项所述的一站式智能写作辅助方法。
13.一种计算机可读存储介质,用于存储非暂时性计算机可读指令,当所述非暂时性计算机可读指令由计算机执行时,使得所述计算机执行权利要求1-10中任意一项所述的一站式智能写作辅助方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910725052.8A CN110457439B (zh) | 2019-08-06 | 2019-08-06 | 一站式智能写作辅助方法、装置和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910725052.8A CN110457439B (zh) | 2019-08-06 | 2019-08-06 | 一站式智能写作辅助方法、装置和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110457439A true CN110457439A (zh) | 2019-11-15 |
CN110457439B CN110457439B (zh) | 2022-03-01 |
Family
ID=68485110
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910725052.8A Active CN110457439B (zh) | 2019-08-06 | 2019-08-06 | 一站式智能写作辅助方法、装置和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110457439B (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111062201A (zh) * | 2019-12-20 | 2020-04-24 | 北京百度网讯科技有限公司 | 用于处理信息的方法和装置 |
CN111310058A (zh) * | 2020-03-27 | 2020-06-19 | 北京百度网讯科技有限公司 | 资讯主题的推荐方法、装置、终端及存储介质 |
CN112016289A (zh) * | 2020-08-28 | 2020-12-01 | 《中国学术期刊(光盘版)》电子杂志社有限公司 | 一种基于大数据技术的论文写作方法 |
CN112148857A (zh) * | 2020-09-23 | 2020-12-29 | 中国电子科技集团公司第十五研究所 | 一种军用公文自动生成系统和方法 |
CN112685534A (zh) * | 2020-12-23 | 2021-04-20 | 上海掌门科技有限公司 | 在创作过程中生成已创作内容的脉络信息的方法与设备 |
CN113220901A (zh) * | 2021-05-11 | 2021-08-06 | 中国科学院自动化研究所 | 基于增强智能的写作构思辅助系统、网路系统 |
CN113254574A (zh) * | 2021-03-15 | 2021-08-13 | 河北地质大学 | 一种机关公文辅助生成方法、装置以及系统 |
CN113343084A (zh) * | 2021-05-25 | 2021-09-03 | 北京字节跳动网络技术有限公司 | 发文关键字段推送方法、装置、存储介质及计算机设备 |
CN113705210A (zh) * | 2021-08-06 | 2021-11-26 | 北京搜狗科技发展有限公司 | 一种文章大纲生成方法、装置和用于生成文章大纲的装置 |
CN114186979A (zh) * | 2021-12-17 | 2022-03-15 | 建信金融科技有限责任公司 | 一种基于自然语言处理的分布式协同材料开发方法及系统 |
CN115186050A (zh) * | 2022-09-08 | 2022-10-14 | 粤港澳大湾区数字经济研究院(福田) | 基于自然语言处理的选题推荐方法、系统及相关设备 |
CN116090473A (zh) * | 2023-04-06 | 2023-05-09 | 北京大学深圳研究生院 | 写作智能辅助方法、装置及系统 |
CN116992834A (zh) * | 2023-09-27 | 2023-11-03 | 国高信息技术产业研究院(山东)集团有限公司 | 基于人工智能的辅助写作方法、系统、介质及电子设备 |
CN118377853A (zh) * | 2024-06-25 | 2024-07-23 | 福建师范大学协和学院 | 基于大语言模型的论文选题辅助方法、系统、介质和设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11339445A (ja) * | 1998-05-22 | 1999-12-10 | Aiwa Co Ltd | ディスク装置 |
CN101887460A (zh) * | 2010-07-14 | 2010-11-17 | 北京大学 | 一种文献质量评估方法及应用 |
CN103440329A (zh) * | 2013-09-04 | 2013-12-11 | 北京邮电大学 | 权威作者和高质量论文推荐系统和推荐方法 |
CN109492112A (zh) * | 2018-10-24 | 2019-03-19 | 北京百科康讯科技有限公司 | 一种基于知识图谱的计算机辅助写作科普文章的方法 |
CN109829105A (zh) * | 2019-01-18 | 2019-05-31 | 王惟惟 | 一种可应用区块链技术的人工智能创作辅助系统 |
-
2019
- 2019-08-06 CN CN201910725052.8A patent/CN110457439B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11339445A (ja) * | 1998-05-22 | 1999-12-10 | Aiwa Co Ltd | ディスク装置 |
CN101887460A (zh) * | 2010-07-14 | 2010-11-17 | 北京大学 | 一种文献质量评估方法及应用 |
CN103440329A (zh) * | 2013-09-04 | 2013-12-11 | 北京邮电大学 | 权威作者和高质量论文推荐系统和推荐方法 |
CN109492112A (zh) * | 2018-10-24 | 2019-03-19 | 北京百科康讯科技有限公司 | 一种基于知识图谱的计算机辅助写作科普文章的方法 |
CN109829105A (zh) * | 2019-01-18 | 2019-05-31 | 王惟惟 | 一种可应用区块链技术的人工智能创作辅助系统 |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111062201A (zh) * | 2019-12-20 | 2020-04-24 | 北京百度网讯科技有限公司 | 用于处理信息的方法和装置 |
CN111310058B (zh) * | 2020-03-27 | 2023-08-08 | 北京百度网讯科技有限公司 | 资讯主题的推荐方法、装置、终端及存储介质 |
CN111310058A (zh) * | 2020-03-27 | 2020-06-19 | 北京百度网讯科技有限公司 | 资讯主题的推荐方法、装置、终端及存储介质 |
CN112016289A (zh) * | 2020-08-28 | 2020-12-01 | 《中国学术期刊(光盘版)》电子杂志社有限公司 | 一种基于大数据技术的论文写作方法 |
CN112148857A (zh) * | 2020-09-23 | 2020-12-29 | 中国电子科技集团公司第十五研究所 | 一种军用公文自动生成系统和方法 |
CN112685534A (zh) * | 2020-12-23 | 2021-04-20 | 上海掌门科技有限公司 | 在创作过程中生成已创作内容的脉络信息的方法与设备 |
CN113254574A (zh) * | 2021-03-15 | 2021-08-13 | 河北地质大学 | 一种机关公文辅助生成方法、装置以及系统 |
CN113220901A (zh) * | 2021-05-11 | 2021-08-06 | 中国科学院自动化研究所 | 基于增强智能的写作构思辅助系统、网路系统 |
CN113343084A (zh) * | 2021-05-25 | 2021-09-03 | 北京字节跳动网络技术有限公司 | 发文关键字段推送方法、装置、存储介质及计算机设备 |
CN113343084B (zh) * | 2021-05-25 | 2024-09-13 | 北京字节跳动网络技术有限公司 | 发文关键字段推送方法、装置、存储介质及计算机设备 |
CN113705210A (zh) * | 2021-08-06 | 2021-11-26 | 北京搜狗科技发展有限公司 | 一种文章大纲生成方法、装置和用于生成文章大纲的装置 |
CN114186979B (zh) * | 2021-12-17 | 2024-05-24 | 建信金融科技有限责任公司 | 一种基于自然语言处理的分布式协同材料开发方法及系统 |
CN114186979A (zh) * | 2021-12-17 | 2022-03-15 | 建信金融科技有限责任公司 | 一种基于自然语言处理的分布式协同材料开发方法及系统 |
CN115186050B (zh) * | 2022-09-08 | 2023-01-10 | 粤港澳大湾区数字经济研究院(福田) | 基于自然语言处理的选题推荐方法、系统及相关设备 |
CN115186050A (zh) * | 2022-09-08 | 2022-10-14 | 粤港澳大湾区数字经济研究院(福田) | 基于自然语言处理的选题推荐方法、系统及相关设备 |
CN116090473A (zh) * | 2023-04-06 | 2023-05-09 | 北京大学深圳研究生院 | 写作智能辅助方法、装置及系统 |
CN116992834A (zh) * | 2023-09-27 | 2023-11-03 | 国高信息技术产业研究院(山东)集团有限公司 | 基于人工智能的辅助写作方法、系统、介质及电子设备 |
CN116992834B (zh) * | 2023-09-27 | 2024-01-05 | 国高信息技术产业研究院(山东)集团有限公司 | 基于人工智能的辅助写作方法、系统、介质及电子设备 |
CN118377853A (zh) * | 2024-06-25 | 2024-07-23 | 福建师范大学协和学院 | 基于大语言模型的论文选题辅助方法、系统、介质和设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110457439B (zh) | 2022-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110457439A (zh) | 一站式智能写作辅助方法、装置和系统 | |
Wan et al. | Aminer: Search and mining of academic social networks | |
He | Improving user experience with case-based reasoning systems using text mining and Web 2.0 | |
CN111797214A (zh) | 基于faq数据库的问题筛选方法、装置、计算机设备及介质 | |
Djenouri et al. | Cluster-based information retrieval using pattern mining | |
CN109033284A (zh) | 基于知识图谱的电力信息运维系统数据库构建方法 | |
Rao et al. | Decision support for e-governance: a text mining approach | |
Guo et al. | An effective and economical architecture for semantic-based heterogeneous multimedia big data retrieval | |
Geiß et al. | Neckar: A named entity classifier for wikidata | |
Ransom et al. | Facets of user‐assigned tags and their effectiveness in image retrieval | |
Gao et al. | SeCo-LDA: Mining service co-occurrence topics for composition recommendation | |
Nawaz et al. | A segregational approach for determining aspect sentiments in social media analysis | |
Carrion et al. | A taxonomy generation tool for semantic visual analysis of large corpus of documents | |
Huang et al. | Measuring the interdisciplinarity of Information and Library Science interactions using citation analysis and semantic analysis | |
Wang et al. | Knowledge annotation for intelligent textbooks | |
Sugimoto et al. | Visualizing changes over time: A history of information retrieval through the lens of descriptor tri-occurrence mapping | |
KR102353584B1 (ko) | 입시 컨설팅 자동 관리 시스템 | |
Chu et al. | Distribution of Large‐Scale English Test Scores Based on Data Mining | |
CN113870998A (zh) | 问诊方法、装置、电子设备和存储介质 | |
Fu | Natural language processing in urban planning: A research agenda | |
Shi et al. | Mashup tag completion with attention-based topic model | |
Guilarte et al. | RelPath: an interactive tool to visualize branches of studies and quantify the expertise of authors by citation paths | |
Iliadis et al. | Fast facts: Platforms from personalization to centralization | |
Cha et al. | Topic model based approach for improved indexing in content based document retrieval | |
Chen et al. | Research on Data Analysis and Visualization of Recruitment Positions Based on Text Mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20211130 Address after: 1501-1, floor 15, No. 19, Chegongzhuang West Road, Haidian District, Beijing 100048 Applicant after: Super Intellectual Property Consultant (Beijing) Co.,Ltd. Address before: 12a-3-110, block D, 12 / F, No. 28, information road, Haidian District, Beijing 100085 Applicant before: Beijing Ruyou Education Technology Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |