CN118113861A - 写作辅助方法、装置、电子设备、介质和产品 - Google Patents
写作辅助方法、装置、电子设备、介质和产品 Download PDFInfo
- Publication number
- CN118113861A CN118113861A CN202410396307.1A CN202410396307A CN118113861A CN 118113861 A CN118113861 A CN 118113861A CN 202410396307 A CN202410396307 A CN 202410396307A CN 118113861 A CN118113861 A CN 118113861A
- Authority
- CN
- China
- Prior art keywords
- text
- key
- input
- input text
- target model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 230000006403 short-term memory Effects 0.000 claims description 28
- 238000012549 training Methods 0.000 claims description 25
- 230000007787 long-term memory Effects 0.000 claims description 24
- 238000012986 modification Methods 0.000 claims description 15
- 230000004048 modification Effects 0.000 claims description 15
- 230000015654 memory Effects 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 238000002372 labelling Methods 0.000 claims description 6
- 230000002787 reinforcement Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 238000012545 processing Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000008719 thickening Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
Abstract
本申请提供一种写作辅助方法、装置、电子设备、介质和产品,涉及人工智能技术领域,其中,所述方法包括:通过目标模型对用户输入的第一输入文本与存储的第一关键文本进行比对处理,所述第一关键文本为对用户输入的第二输入文本进行关键信息提取获得的文本;在所述第一输入文本与所述第一关键文本不匹配的情况下,以预设格式标注出所述第一输入文本中与所述第一关键文本不匹配的内容。本申请的写作辅助方法能够针对下文相较于上文的一致性,对下文进行纠错。
Description
技术领域
本申请涉及人工智能技术领域,尤其涉及一种写作辅助方法、装置、电子设备、介质和产品。
背景技术
目前,写作辅助纠错主要使用简单的语言模型或规则针对限定词、错别字、语法格式和专业术语等进行判别和纠错。可见,现有技术中的写作辅助方法能够判别和纠错的内容较为单一,无法针对下文相较于上文的一致性进行纠错。
发明内容
本申请实施例提供一种写作辅助方法、装置、电子设备、介质和产品,以解决现有写作辅助方法无法针对下文相较于上文的一致性进行纠错的技术问题。
为解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种写作辅助方法,所述方法包括:
通过目标模型提取用户输入的第一输入文本的摘要;
通过所述目标模型对所述第一输入文本的摘要与存储的第一关键文本进行比对处理,所述第一关键文本为对用户历史输入的第二输入文本进行关键信息提取获得的文本;
在所述第一输入文本与所述第一关键文本不匹配的情况下,以预设格式标注出所述第一输入文本中与所述第一关键文本不匹配的内容。
第二方面,本申请实施例提供了一种写作辅助装置,所述装置包括:
第一提取模块,用于通过目标模型提取用户输入的第一输入文本的摘要;
第一比对模块,用于通过所述目标模型对所述第一输入文本的摘要与存储的第一关键文本进行比对处理,所述第一关键文本为对用户历史输入的第二输入文本进行关键信息提取获得的文本;
标注模块,用于在所述第一输入文本与所述第一关键文本不匹配的情况下,以预设格式标注出所述第一输入文本中与所述第一关键文本不匹配的内容。
第三方面,本申请实施例提供了一种电子设备,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的写作辅助方法的步骤。
第四方面,本申请实施例提供了一种计算机程序产品,包括计算机指令,所述计算机指令被处理器执行时实现如第一方面所述的写作辅助方法的步骤。
第五方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的写作辅助方法的步骤。
本申请实施例中,通过对第一输入文本和第一关键文本进行比对处理,能够确定第一输入文本与第一关键文本是否匹配,第一关键文本为对用户输入的第二输入文本进行关键信息提取获得的文本;在第一输入文本与第一关键文本不匹配的情况下,通过以预设格式标注出第一输入文本中与第一关键文本不匹配的内容,即能够标注出第一输入文本中与第二输入文本不匹配的内容。可见,本申请实施例中的写作辅助方法能够针对下文相较于上文的一致性,对下文进行纠错。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种写作辅助方法的流程图;
图2是本申请实施例提供的一种写作辅助的交互界面示意图;
图3是本申请实施例提供的一种写作辅助装置的结构图;
图4是本申请实施例提供的一种电子设备的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的写作辅助方法、装置、电子设备及可读存储介质进行详细地说明。
参见图1,图1是本申请实施例提供的一种写作辅助方法的流程图,如图1所示,所述方法包括以下步骤:
步骤101、通过目标模型提取用户输入的第一输入文本的摘要;
步骤102、通过所述目标模型对所述第一输入文本的摘要与存储的第一关键文本进行比对处理,通过目标模型对用户输入的第一输入文本与存储的第一关键文本进行比对处理,所述第一关键文本为对用户历史输入的第二输入文本进行关键信息提取获得的文本;
步骤103、在所述第一输入文本与所述第一关键文本不匹配的情况下,以预设格式标注出所述第一输入文本中与所述第一关键文本不匹配的内容。
在步骤102中,第一输入文本的摘要中包括第一输入文本的关键信息,通过目标模型对第一输入文本的摘要与第一关键文本进行比对处理,能够提高比对效率。
用户历史输入的第二输入文本可以包括用户输入第一输入文本之前,所输入的文本。通过目标模型可对第二输入文本进行关键信息提取,以获得上述第一关键文本,第一关键文本中包括第二输入文本的关键信息。目标模型是本申请实施例通过对基础模型进行训练后得到的,基础模型例如开源的自然语言大模型,这些大模型具有人工智能生成内容(Artificial Intelligence Generative Content,AIGC)的能力,包括语义理解、文本摘要、文本生成和指令遵循等。
通过对用户输入的第一输入文本与第一关键文本进行比对处理,而不是对用户输入的第一输入文本与第二输入文本进行比对处理,能够提高比对效率。在第一输入文本与第一关键文本匹配的情况下,说明第一输入文本的内容与第一关键文本的内容较为一致,也即说明第一输入文本的内容与第二输入文本的内容较为一致。
在对文章中的下文相较于上文进行一致性判断的情况下,第二输入文本可为文章中位于第一输入文本之前的章节,通过对第一输入文本与第一关键文本进行比对处理,从而能够确定第一输入文本与前文的内容是否匹配。
在步骤103中,第一输入文本与第一关键文本不匹配,说明第一输入文本中存在与第二输入文本不匹配的内容,不匹配的内容可能是情节内容,例如:从前面输入的文本(即第二输入文本)得到的关键文本里确定当天是盛夏酷暑,而当前文本(第一输入文本)描述了双方在雪地里打斗,判断出盛夏和雪地不匹配;不匹配的内容还有可能是人物信息以及世界观等等。本实施例中的以预设格式标注出第一输入文本中与第一关键文本不匹配的内容,可以为通过高亮、加粗字体、加下划线或者改变字体颜色等标注出第一输入文本中与第一关键文本不匹配的内容。
本申请实施例中,通过对第一输入文本和第一关键文本进行比对处理,能够确定第一输入文本和第一关键文本是否匹配,从而确定第一输入文本和第二输入文本是否匹配;在第一输入文本与第一关键文本不匹配的情况下,通过以预设格式标注出第一输入文本中与第一关键文本不匹配的内容,即能够标注出第一输入文本中与第二输入文本不匹配的内容。可见,本申请实施例中的写作辅助方法能够针对下文相较于上文的一致性,对下文进行纠错。
可选地,通过所述目标模型对所述第一输入文本的摘要与所述第一关键文本进行比对处理之前,所述方法还包括:
通过所述目标模型提取所述第二输入文本的摘要;
通过所述目标模型从所述第二输入文本的摘要中提取所述第一关键文本的易变文本和固定文本;
所述通过所述目标模型对所述第一输入文本的摘要与所述第一关键文本进行比对处理,包括:
通过所述目标模型对所述第一输入文本的摘要与所述易变文本和所述固定文本分别进行比对处理。
该实施方式中,第一关键文本包括易变文本和固定文本,可通过目标模型提取第二输入文本的摘要,再通过目标模型从第二输入文本的摘要中提取易变文本和固定文本。其中,易变文本文为第二输入文本中,较容易变化的内容所对应的文本,例如文章情节等,固定文本为第二输入文本中,较不容易变化的内容所对应的文本,例如人物设定和世界观设定等。
在第二输入文本仅包括用户第一次输入的第一个文本的情况下,根据上述方法可确定第一个文本中的易变文本和固定文本。在需要对文章的下文相较于上文进行一致性判断的情况下,上述第一次输入的第一个文本可为文章的起始章节文本。通过目标模型对起始章节文本进行摘要提取,并对摘要进一步提取以得到起始章节对应的易变文本和固定文本。由于起始章节的内容相对较丰富,通过对起始章节的关键内容进行提取所获得的易变文本和固定文本,能够包括文章的较多关键信息。
在第二输入文本包括用户多次输入的M个文本的情况下(M为大于1的整数),本申请实施例中对M个文本的易变文本和固定文本的提取方法可参照下述具体示例。
在用户第一次输入第一个文本的情况下,提取第一个文本的摘要,根据第一个文本的摘要提取易变文本和固定文本,作为初始化的易变文本和初始化的固定文本。在用户第二次输入第二个文本的情况下,参照上述实施例提取用户输入的第二个文本的摘要,对第二个文本的摘要与当前存储的易变文本和固定文本(此处当前存储的为第一个文本对应的易变文本和固定文本)分别进行比对处理,分别确定第二个文本的摘要与当前存储的易变文本和固定文本是否匹配。在第二个文本的摘要与当前存储的易变文本匹配的情况下,对第二个文本的摘要和上述当前存储的易变文本进行对比合并,得到更新后的易变文本;在第二个文本的摘要与当前存储的易变文本不匹配的情况下,且在接收到对第二个文本的修改的情况下,通过目标模型重新生成修改后的第二个文本的摘要,对修改后的第二个文本的摘要与上述当前存储的易变文本进行对比合并,得到更新后的易变文本。需要说明的是,固定文本的更新可参照易变文本的更新,为避免重复,对此不再赘述。前述步骤中,更新后的易变文本和更新后的固定文本为上述两个文本的易变文本和固定文本,在M大于2的情况下,重复前述更新易变文本和更新固定文本的步骤,得到M个文本的易变文本和固定文本。
本申请实施例中,通过目标模型对第一输入文本的摘要与易变文本和固定文本分别进行比对处理,从而能够分别确定第一输入文本的易变内容和固定内容与易变文本和固定文本是否匹配,例如,能够确定第一输入文本的摘要中的情节内容与易变文本中的情节内容是否匹配,还例如,能够确定第一输入文本的摘要中的人物设定内容和世界观设定内容分别与固定文本中的人物设定内容和世界观设定内容是否匹配。可见,本申请实施例能够从易变内容和固定内容两个维度分别对输入文本之间的一致性进行比对处理,有利于提高比对效果,进而有利于提高辅助写作的效果。
可选地,所述通过所述目标模型从所述第二输入文本的摘要中提取所述第一关键文本的易变文本和固定文本之后,所述方法还包括:
将所述易变文本存储至短期记忆文本集合;
将所述固定文本存储至长期记忆文本集合;
所述通过所述目标模型对所述第一输入文本的摘要与所述易变文本和所述固定文本分别进行比对处理,包括:
通过所述目标模型对所述第一输入文本的摘要与所述短期记忆文本集合中的文本和所述长期记忆文本集合中的文本分别进行比对处理。
该实施方式中,由于易变文本的内容较容易变化,可将易变文本存储至短期记忆文本集合;由于固定文本的内容较不容易变化,可将固定文本存储至长期记忆文本集合。在进行输入文本的对比处理时,可将用户当前输入的文本与短期记忆文本集合中的文本和长期记忆文本集合中的文本进行比对。
在一些实施例中,如图2所述,可显示短期记忆文本集合和长期记忆文本集合的内容,以便用户随时查看,并且用户也可对短期记忆文本集合和长期记忆文本集合的内容进行编辑等操作,以更好地满足用户的需求。
本申请实施例将易变文本和固定文本分别存储于不同的文本集合,能够提高文本存储的合理性。
在一些实施例中,在第一输入文本与第一关键文本不匹配的情况下,用户可对第一输入文本或者第一关键文本进行修改,以下对其进行具体说明。
可选地,所述以预设格式标注出所述第一输入文本中与所述第一关键文本不匹配的内容之后,所述方法还包括:
接收对所述第一输入文本的修改;
通过所述目标模型对修改后的所述第一输入文本进行关键信息提取,得到第二关键文本;
通过所述目标模型对所述第一关键文本与所述第二关键文本进行比对合并处理,得到第三关键文本;
将存储的所述第一关键文本更新为所述第三关键文本。
在以预设格式标注出所述第一输入文本中与所述第一关键文本不匹配的内容之后,用户可根据标注对第一输入文本进行修改。参见图2,以高亮形式标注出了第一输入文本与第一关键文本不匹配的内容,用户可根据标注对第一输入文本进行修改。
在接收到用户对第一输入文本的修改之后,通过目标模型对修改后的所述第一输入文本进行关键信息提取,得到第二关键文本。
在一些实施例中,第二关键文本可以是修改后的第一输入文本的摘要。在第一关键文本的易变文本和固定文本分别存储于短期记忆文本集合和长期记忆文本集合的情况下,对第一关键文本与第二关键文本进行比对合并处理包括:对修改后的第一输入文本的摘要和短期记忆文本集合中的文本进行对比合并处理,得到第三关键文本中的易变文本;对修改后的第一输入文本的摘要和长期记忆文本集合中的文本进行对比合并处理,得到第三关键文本中的固定文本。上述将存储的第一关键文本更新为第三关键文本包括:将短期记忆文本集合中的文本由第一关键文本的易变文本更新为第三关键文本的易变文本,将长期记忆文本集合中的文本由第一关键文本的固定文本更新为第三关键文本的固定文本。
在另一些实施例中,可通过目标模型提取修改后的第一输入文本的摘要之后,再根据摘要提取修改后的第一输入文本的易变文本和固定文本,第二关键文本包括修改后的第一输入文本的易变文本和固定文本。在第一关键文本的易变文本和固定文本分别存储于短期记忆文本集合和长期记忆文本集合的情况下,对第一关键文本与第二关键文本进行比对合并处理包括:对修改后的第一输入文本的易变文本和短期记忆文本集合中的文本进行对比合并处理,得到第三关键文本中的易变文本;对修改后的第一输入文本的固定文本和长期记忆文本集合中的文本进行对比合并处理,得到第三关键文本中的固定文本。
在将第一关键文本更新为第三关键文本之后,用户可继续输入文本,通过目标模型可对用户继续输入的文本和存储的第三关键文本进行比对处理。
在需要对文章的下文相较于上文进行一致性判断的情况下,用户可首先输入文章的起始章节文本,参照前述实施例可确定起始章节文本中的易变文本和固定文本,并将起始章节文本的易变文本存储至短期记忆文本集合,从而实现初始化短期记忆文本集合;将起始章节文本的固定文本存储至长期记忆文本集合,从而实现初始化长期记忆文本集合。在进行初始化之后,用户可实时输入文章的片段。通过目标模型可提取实时输入文本的摘要,并可将实时输入文本的摘要分别与短期记忆文本集合中的文本和长期记忆文本集合中的文本进行对比处理。在进行对比处理之后,参照上述方法可对短期记忆文本集合中的文本和长期记忆文本集合中的文本进行更新。
本申请实施例中,通过对第一关键文本与第二关键文本进行比对合并处理,得到第三关键文本,并将存储的第一关键文本更新为所述第三关键文本,能够防止存储的信息过长,满足大模型输入token(token可以被理解为文本中的最小单位)限制数;
需要说明的是,在第一输入文本与第一关键文本匹配的情况下,可直接通过目标模型对第一输入文本的关键文本(例如第一输入文本的摘要文本)与第一关键文本进行对比合并处理,得到第四关键文本,并将存储的第一关键文本更新为第四关键文本,具体地,可参照上述实施例,为避免重复,对此不再赘述。
可选地,所述以预设格式标注出所述第一输入文本中与所述第一关键文本不匹配的内容之后,所述方法还包括:
接收对所述第一关键文本的修改;
通过所述目标模型对所述第一输入文本与修改后的所述第一关键文本进行比对处理。
第一关键文本实时显示,在以预设格式标注出所述第一输入文本中与所述第一关键文本不匹配的内容之后,用户还可能认为之前提取的第一关键文本需要修改,在用户对第一关键文本进行修改的情况下,接收对第一关键文本的修改,并通过目标模型对第一输入文本与修改后的第一关键文本进行比对处理。
在一些实施例中,第一关键文本的易变文本存储至短期记忆文本集合,第一关键文本的固定文本存储至长期记忆文本集合,短期记忆文本集合和长期记忆文本集合中的文本实时显示,用户对第一关键文本修改可包括对短期记忆文本集合和长期记忆文本集合中的文本进行修改。
本申请实施例中,用户还可对第一关键文本进行修改,通过目标模型可对第一输入文本与修改后的第一关键文本进行比对处理,从而能够更好地满足用户的需求。
可选地,在所述第一输入文本与所述第一关键文本不匹配的情况下,所述方法还包括:
输出所述第一输入文本与所述第一关键文本不匹配的原因以及对所述第一输入文本的修改建议。
参见图2,图2中的矛盾内容即包括本申请实施例中的不匹配的原因以及对输入文本的修改建议。
本申请实施例通过输出第一输入文本与第一关键文本不匹配的原因以及对第一输入文本的修改建议,能够提高写作辅助的效果。
可选地,所述目标模型根据如下方法训练得到:
输入预设指令和训练文本至基础模型;
对所述基础模型针对所述预设指令和所述训练文本输出的N个答案按照质量从高到低进行排序,N为大于1的整数;
通过排序后的N个答案两两之间的排序关系,对奖励模型进行训练,以使训练后的奖励模型对排序最高的答案的打分最高;
通过强化学习方法和训练后的奖励模型对所述基础模型进行训练,以得到所述目标模型,所述目标模型用于基于所述预设指令和输入文本输出对应的内容,所述预设指令包括用于对输入文本进行关键信息提取的指令
基础模型是指自然语言大模型,这些自然语言大模型的AIGC能力包括语义理解、文本摘要、文本生成和指令遵循等,基础模型例如ChatGLM。
预设指令可以为提示词(Prompt),本申请实施例可预设多个Prompt分别用于从文本中提取摘要、提取情节内容、提取人物设定、世界观设定或者对比合并处理等自定义任务。
Prompt的设计例如:下面是一段小说片段,我需要你写:
1.人物信息
2.情节摘要
{文本内容}。
其中,大括号中内容为训练数据集中的文本片段,即训练文本,其余内容为自动拼接的自然语言指令Prompt,用于模型的指令学习,使模型更好的理解生成意图。
输入预设指令和训练文本至基础模型,基础模型针对预设指令和预设指令输出N个答案,人工按照质量对N个答案从高到低进行排序。通过排序后的N个答案两两之间的排序关系,能够对奖励模型进行训练。
以下结合具体示例,对奖励模型的训练进行说明。
对于每一个预设指令Prompt,将训练文本填充至Prompt中。利用基础模型生成某Prompt的多个输出{A1,A2,A3,A4},标注人员将四个答案进行排序,得到{A3>A4>A2>A1}。
利用{A3>A4>A2>A1}两两之间的排序关系训练奖励模型,奖励模型接收一个输入<prompt,answer>,给出评价回答质量高低的回报分数Score,对于一对训练数据<answer1,answer2>,假设人工排序中A2>A1,那么Loss函数则鼓励奖励模型对<prompt,answer2>的打分要比<prompt,answer1>的打分要高,以使训练后的奖励模型对排序最高的答案的打分最高。
在对奖励模型进行训练之后,通过强化学习方法和训练后的奖励模型对基础模型进行训练,能够得到目标模型,目标模型能够很好的遵循预设指令输出符合要求的内容。
本申请实施例中的预设指令包括用于对输入文本进行关键信息提取的指令,例如提取上述第一关键文本,在第一关键文本包括易变文本和固定文本的情况下,预设指令可包括用于提取摘要的指令、用于提取摘要中的易变文本的指令,用于提取摘要中的固定文本的指令。其中,指令可无需由用户输入,在需要利用目标模型输出所需内容的情况下,可自动调取对应的指令。例如,在需要提取上述第一输入文本的摘要的情况下,自动调取用于提取摘要的预设指令,并将第一输入文本填充至用于提取摘要的预设指令中,目标模型根据用于提取摘要的预设指令和填充的第一输入文本,输出第一输入文本的摘要。
本申请实施例通过上述训练方法得到目标模型,并设置预设指令包括用于对输入文本进行关键信息提取的指令,能够使目标模型所提取的关键信息能够更好地符合要求。
需要说明的是,在对输出内容的要求不高的情况下,可直接利用基础模型的功能输出需求的内容;在需要更好地输出符合要求的内容的情况下,可设置对应的预设指令并通过上述方法对基础模型进行训练。在一些实施例中,预设指令还可包括用于对比合并处理的指令,例如:
我会给你一个片段摘要和一个短期记忆(它们存储了模型输入token限制数token的中文之前的故事所写的关键内容,这样你就可以跟踪很长的上下文)。我需要你将它们合并后输出摘要。
下面是输入:
片段摘要:{摘要文本}
短期记忆:{短期记忆集合中的文本}。
上述指令用于对摘要文本和短期记忆集合中的文本进行对比合并处理,大括号的内容为自动填充的内容,其他自然语言指令为后台自动添加的预设指令。
参见图3,图3是本申请实施例提供的一种写作辅助装置的结构图,如图3所示,所述装置200包括:
第一提取模块201,用于通过目标模型提取用户输入的第一输入文本的摘要;
第一比对模块202,用于通过所述目标模型对所述第一输入文本的摘要与存储的第一关键文本进行比对处理,所述第一关键文本为对用户输入的第二输入文本进行关键信息提取获得的文本;
标注模块203,用于在所述第一输入文本与所述第一关键文本不匹配的情况下,以预设格式标注出所述第一输入文本中与所述第一关键文本不匹配的内容。
可选地,所述装置200还包括:
第二提取模块,用于通过所述目标模型提取所述第二输入文本的摘要;
第三提取模块,用于通过所述目标模型从所述第二输入文本的摘要中提取所述第一关键文本的易变文本和固定文本;
所述第一比对模块202具体用于:
通过所述目标模型对所述第一输入文本的摘要与所述易变文本和所述固定文本分别进行比对处理。
可选地,所述装置200还包括:
第一存储模块,用于将所述易变文本存储至短期记忆文本集合;
第二存储模块,用于将所述固定文本存储至长期记忆文本集合;
所述第一比对模块202具体用于:
通过所述目标模型对所述第一输入文本的摘要与所述短期记忆文本集合中的文本和所述长期记忆文本集合中的文本分别进行比对处理。
可选地,所述装置200还包括:
第一接收模块,用于接收对所述第一输入文本的修改;
第四提取模块,用于通过所述目标模型对修改后的所述第一输入文本进行关键信息提取,得到第二关键文本;
对比合并模块,用于通过所述目标模型对所述第一关键文本与所述第二关键文本进行比对合并处理,得到第三关键文本;
更新模块,用于将存储的所述第一关键文本更新为所述第三关键文本。
可选地,所述装置200还包括:
第二接收模块,用于接收对所述第一关键文本的修改;
第二比对模块,用于通过所述目标模型对所述第一输入文本与修改后的所述第一关键文本进行比对处理。
可选地,所述装置200还包括:
输出模块,用于输出所述第一输入文本与所述第一关键文本不匹配的原因以及对所述第一输入文本的修改建议。
可选地,所述目标模型根据如下方法训练得到:
输入预设指令和训练文本至基础模型;
对所述基础模型针对所述预设指令和所述训练文本输出的N个答案按照质量从高到低进行排序,N为大于1的整数;
通过排序后的N个答案两两之间的排序关系,对奖励模型进行训练,以使训练后的奖励模型对排序最高的答案的打分最高;
通过强化学习方法和训练后的奖励模型对所述基础模型进行训练,以得到所述目标模型,所述目标模型用于基于所述预设指令和输入文本输出对应的内容,所述预设指令包括用于对输入文本进行关键信息提取的指令。
本申请实施例中,通过以预设格式标注出第一输入文本中与第一关键文本不匹配的内容,即能够标注出第一输入文本中与第二输入文本不匹配的内容。可见,本申请实施例中的写作辅助方法能够针对下文相较于上文的一致性,对下文进行纠错。
本申请实施例中的写作辅助装置200可以是电子设备,也可以是电子设备中的部件,例如集成电路或芯片。该电子设备可以是终端,也可以为除终端之外的其他设备。示例性的,电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、移动上网装置(Mobile Internet Device,MID)、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、机器人、可穿戴设备、超级移动个人计算机(ultra-mobilepersonal computer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等,本申请实施例不作具体限定。
本申请实施例中的写作辅助装置200可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的写作辅助装置200能够实现图1所述方法实施例实现的各个过程,为避免重复,这里不再赘述。
本申请实施例还提供了一种电子设备。请参见图4,图4是本申请实施例提供的一种电子设备的结构图,如图4所示,所述电子设备包括:处理器300、存储器320及存储在所述存储器320上并可在所述处理器300上运行的程序或指令,处理器300,用于读取存储器320中的程序或指令;所述电子设备还包括总线接口和收发机310。
处理器300,用于通过目标模型提取用户输入的第一输入文本的摘要;
处理器300,还用于通过所述目标模型对所述第一输入文本的摘要与存储的第一关键文本进行比对处理,所述第一关键文本为对用户输入的第二输入文本进行关键信息提取获得的文本;
处理器300,还用于在所述第一输入文本与所述第一关键文本不匹配的情况下,以预设格式标注出所述第一输入文本中与所述第一关键文本不匹配的内容。
可选地,所述处理器300还用于:
通过所述目标模型提取所述第二输入文本的摘要;
通过所述目标模型从所述第二输入文本的摘要中提取所述第一关键文本的易变文本和固定文本;
所述处理器300具体用于:
通过所述目标模型对所述第一输入文本的摘要与所述易变文本和所述固定文本分别进行比对处理。
可选地,所述处理器300还用于:
将所述易变文本存储至短期记忆文本集合;
将所述固定文本存储至长期记忆文本集合;
所述处理器300具体用于:
通过所述目标模型对所述第一输入文本的摘要与所述短期记忆文本集合中的文本和所述长期记忆文本集合中的文本分别进行比对处理。
可选地,所述处理器300还用于:
接收对所述第一输入文本的修改;
通过所述目标模型对修改后的所述第一输入文本进行关键信息提取,得到第二关键文本;
通过所述目标模型对所述第一关键文本与所述第二关键文本进行比对合并处理,得到第三关键文本;
将存储的所述第一关键文本更新为所述第三关键文本。
可选地,所述处理器300还用于:
接收对所述第一关键文本的修改;
通过所述目标模型对所述第一输入文本与修改后的所述第一关键文本进行比对处理。
可选地,所述处理器300还用于:
输出所述第一输入文本与所述第一关键文本不匹配的原因以及对所述第一输入文本的修改建议。
可选地,所述目标模型根据如下方法训练得到:
输入预设指令和训练文本至基础模型;
对所述基础模型针对所述预设指令和所述训练文本输出的N个答案按照质量从高到低进行排序,N为大于1的整数;
通过排序后的N个答案两两之间的排序关系,对奖励模型进行训练,以使训练后的奖励模型对排序最高的答案的打分最高;
通过强化学习方法和训练后的奖励模型对所述基础模型进行训练,以得到所述目标模型,所述目标模型用于基于所述预设指令和输入文本输出对应的内容,所述预设指令包括用于对输入文本进行关键信息提取的指令。
本申请实施例中,通过以预设格式标注出第一输入文本中与第一关键文本不匹配的内容,即能够标注出第一输入文本中与第二输入文本不匹配的内容。可见,本申请实施例中的写作辅助方法能够针对下文相较于上文的一致性,对下文进行纠错。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述图1所述方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述图1所述方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
本申请实施例还提供一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现上述图1所示写作辅助方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
Claims (10)
1.一种写作辅助方法,其特征在于,所述方法包括:
通过目标模型提取用户输入的第一输入文本的摘要;
通过所述目标模型对所述第一输入文本的摘要与存储的第一关键文本进行比对处理,所述第一关键文本为对用户历史输入的第二输入文本进行关键信息提取获得的文本;
在所述第一输入文本与所述第一关键文本不匹配的情况下,以预设格式标注出所述第一输入文本中与所述第一关键文本不匹配的内容。
2.根据权利要求1所述的方法,其特征在于,所述通过所述目标模型对所述第一输入文本的摘要与存储的第一关键文本进行比对处理之前,所述方法还包括:
通过所述目标模型提取所述第二输入文本的摘要;
通过所述目标模型从所述第二输入文本的摘要中提取所述第一关键文本的易变文本和固定文本;
所述通过所述目标模型对所述第一输入文本的摘要与存储的第一关键文本进行比对处理,包括:
通过所述目标模型对所述第一输入文本的摘要与所述易变文本和所述固定文本分别进行比对处理。
3.根据权利要求2所述的方法,其特征在于,所述通过所述目标模型从所述第二输入文本的摘要中提取所述第一关键文本的易变文本和固定文本之后,所述方法还包括:
将所述易变文本存储至短期记忆文本集合;
将所述固定文本存储至长期记忆文本集合;
所述通过所述目标模型对所述第一输入文本的摘要与所述易变文本和所述固定文本分别进行比对处理,包括:
通过所述目标模型对所述第一输入文本的摘要与所述短期记忆文本集合中的文本和所述长期记忆文本集合中的文本分别进行比对处理。
4.根据权利要求1所述的方法,其特征在于,所述以预设格式标注出所述第一输入文本中与所述第一关键文本不匹配的内容之后,所述方法还包括:
接收对所述第一输入文本的修改;
通过所述目标模型对修改后的所述第一输入文本进行关键信息提取,得到第二关键文本;
通过所述目标模型对所述第一关键文本与所述第二关键文本进行比对合并处理,得到第三关键文本;
将存储的所述第一关键文本更新为所述第三关键文本。
5.根据权利要求1所述的方法,其特征在于,在所述第一输入文本与所述第一关键文本不匹配的情况下,所述方法还包括:
输出所述第一输入文本与所述第一关键文本不匹配的原因以及对所述第一输入文本的修改建议。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述目标模型根据如下方法训练得到:
输入预设指令和训练文本至基础模型;
对所述基础模型针对所述预设指令和所述训练文本输出的N个答案按照质量从高到低进行排序,N为大于1的整数;
通过排序后的N个答案两两之间的排序关系,对奖励模型进行训练,以使训练后的奖励模型对排序最高的答案的打分最高;
通过强化学习方法和训练后的奖励模型对所述基础模型进行训练,以得到所述目标模型,所述目标模型用于基于所述预设指令和输入文本输出对应的内容,所述预设指令包括用于对输入文本进行关键信息提取的指令。
7.一种写作辅助装置,其特征在于,所述装置包括:
第一提取模块,用于通过目标模型提取用户输入的第一输入文本的摘要;
第一比对模块,用于通过所述目标模型对所述第一输入文本的摘要与存储的第一关键文本进行比对处理,所述第一关键文本为对用户历史输入的第二输入文本进行关键信息提取获得的文本;
标注模块,用于在所述第一输入文本与所述第一关键文本不匹配的情况下,以预设格式标注出所述第一输入文本中与所述第一关键文本不匹配的内容。
8.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-6中任一项所述的写作辅助方法的步骤。
9.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-6中任一项所述的写作辅助方法的步骤。
10.一种计算机程序产品,其特征在于,包括计算机指令,所述计算机指令被处理器执行时实现如权利要求1至6中任一项所述的写作辅助方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410396307.1A CN118113861A (zh) | 2024-04-02 | 2024-04-02 | 写作辅助方法、装置、电子设备、介质和产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410396307.1A CN118113861A (zh) | 2024-04-02 | 2024-04-02 | 写作辅助方法、装置、电子设备、介质和产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118113861A true CN118113861A (zh) | 2024-05-31 |
Family
ID=91218073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410396307.1A Pending CN118113861A (zh) | 2024-04-02 | 2024-04-02 | 写作辅助方法、装置、电子设备、介质和产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118113861A (zh) |
-
2024
- 2024-04-02 CN CN202410396307.1A patent/CN118113861A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110287480B (zh) | 一种命名实体识别方法、装置、存储介质及终端设备 | |
CN109165384A (zh) | 一种命名实体识别方法及装置 | |
US20060129922A1 (en) | Reading product fabrication methodology | |
CN107798123B (zh) | 知识库及其建立、修改、智能问答方法、装置及设备 | |
CN111310447A (zh) | 语法纠错方法、装置、电子设备和存储介质 | |
CN110442871A (zh) | 文本信息处理方法、装置及设备 | |
CN110222654A (zh) | 文本分割方法、装置、设备及存储介质 | |
CN114757176A (zh) | 一种获取目标意图识别模型的方法以及意图识别方法 | |
CN112560510A (zh) | 翻译模型训练方法、装置、设备及存储介质 | |
CN112257462A (zh) | 一种基于神经机器翻译技术的超文本标记语言翻译方法 | |
CN114840662A (zh) | 事件信息抽取方法、装置及电子设备 | |
CN111984845A (zh) | 网站错别字识别方法和系统 | |
CN110134766B (zh) | 一种面向中医古籍文献的分词方法和装置 | |
CN111401012A (zh) | 文本纠错方法、电子设备及计算机可读存储介质 | |
CN114861635A (zh) | 一种中文拼写纠错方法、装置、设备及存储介质 | |
CN113886580A (zh) | 一种情感评分方法、装置及电子设备 | |
CN110287460B (zh) | 电子书的展示方法、计算设备及计算机存储介质 | |
CN110598217B (zh) | 一种点读内容的识别方法、装置、家教机及存储介质 | |
CN109542299B (zh) | 用于电子书的金句展示方法、电子设备及计算机存储介质 | |
CN114417898B (zh) | 数据处理方法、装置、设备及可读存储介质 | |
CN118113861A (zh) | 写作辅助方法、装置、电子设备、介质和产品 | |
CN111435405A (zh) | 一种文章关键句自动标注方法及装置 | |
CN110532391B (zh) | 一种文本词性标注的方法及装置 | |
CN111814433B (zh) | 一种维吾尔语实体识别的方法、装置和电子设备 | |
CN111045836B (zh) | 搜索方法、装置、电子设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |