CN116881398A - 提升大模型生成信息质量的方法及装置 - Google Patents
提升大模型生成信息质量的方法及装置 Download PDFInfo
- Publication number
- CN116881398A CN116881398A CN202310818447.9A CN202310818447A CN116881398A CN 116881398 A CN116881398 A CN 116881398A CN 202310818447 A CN202310818447 A CN 202310818447A CN 116881398 A CN116881398 A CN 116881398A
- Authority
- CN
- China
- Prior art keywords
- information
- vector
- text
- knowledge
- auxiliary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 239000013598 vector Substances 0.000 claims description 131
- 238000005457 optimization Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 14
- 238000009411 base construction Methods 0.000 claims description 6
- 230000010365 information processing Effects 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 abstract description 20
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000003058 natural language processing Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3338—Query expansion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明公开一种提升大模型生成信息质量的方法及装置,该方法包括:接收用户输入信息;利用知识库确定所述用户输入信息的辅助信息;根据所述用户输入信息和所述辅助信息,生成基于大模型的反馈信息。利用本发明方案,可以提升大型预训练模型生成信息的时效性和准确性。
Description
技术领域
本发明涉及计算机应用领域,具体涉及一种提升大模型生成信息质量的方法及装置。
背景技术
近些年,自然语言处理(NLP)和人工智能(AI)领域的创新发展令人瞩目。大规模预训练模型,比如GPT-3和BERT等,已经在该领域引发了大量关注。这类模型通过在海量的文本数据中进行训练,从而学习并掌握语言模式,产生出流畅、自然且具有一定语境理解的文本,但仍存在不少的问题和难点亟需解决,主要有以下几方面:
1.知识更新的挑战:目前,大型预训练模型的知识库仅到其训练数据的最后更新时刻为止。这导致了一种困境,即这些模型在处理需要掌握最新信息的任务时,可能表现得并不理想。例如,当用户向模型询问最近的新闻或事件时,模型可能无法提供精确的信息,因为其知识库可能已经过时。在实际应用中,无论是搜索引擎、问答系统还是新闻推荐系统,用户都期望得到的是最新、最准确的信息。
2.回答专业领域问题的难题:大型预训练模型在训练过程中使用的是广泛的文本数据,这使它们能够理解和生成自然且流畅的文本,但在回答某些特定领域的专业问题时,由于模型在训练过程中并未接受特定领域知识的训练,其表现可能并不理想。例如,当用户询问需要具备医学、法律或某一科学领域知识才能正确回答的问题时,模型可能无法提供准确的答案,或者可能生成与事实相反的误导信息。更为棘手的是,由于大模型本身流畅的信息表述能力,可能形成了典型的事实性知识幻觉现象。
3.模型生成文本质量的问题:虽然大型预训练模型能够生成流畅且自然的文本,但这些文本可能并不总是准确的,或者不能满足用户的需求。例如,模型在生成文本时可能会偏离主题,或者提供不准确的信息,这可能导致用户在使用这些模型时感到困扰,影响用户体验。
发明内容
本发明实施例提供一种提升大模型生成信息质量的方法及装置,以提升大型预训练模型生成信息的时效性和准确性。
为此,本发明实施例提供如下技术方案:
一方面,本发明实施例提供一种提升大模型生成信息质量的方法,所述方法包括:
接收用户输入信息;
利用知识库确定所述用户输入信息的辅助信息;
根据所述用户输入信息和所述辅助信息,生成基于大模型的反馈信息。
可选地,所述利用知识库确定所述用户输入信息的辅助信息包括:
预先利用知识库构建基于向量的知识索引库;
确定所述用户输入信息对应的输入文本向量;
检索所述知识索引库,获取与所述输入文本向量相关的辅助信息。
可选地,所述利用知识库构建基于向量的知识索引库包括:
将知识库中的内容组织成文本;
按照设定策略将所述文本转换为段落形式,得到各段落文本;
根据所述段落文本,生成基于向量的知识索引库。
可选地,所述设定策略包括以下任意一种或多种:段落切分策略、最大长度限制策略。
可选地,所述根据所述段落文本,生成基于向量的知识索引库包括:
确定各段落文本对应的向量;
根据所述向量及不同向量的组合生成所述知识索引库。
可选地,检索所述知识索引库,获取与所述输入文本向量相关的辅助信息包括:
计算所述输入文本向量与所述知识索引库中各向量的相似度;
根据所述相似度确定所述输入文本向量相关的辅助信息,所述辅助信息包括:辅助向量。
可选地,根据所述相似度确定所述输入文本向量相关的辅助向量包括:将相似度大于设定阈值的向量作为所述输入文本向量相关的辅助向量。
可选地,根据所述用户输入信息和所述辅助信息,生成基于大模型的反馈信息包括:
根据所述辅助信息对所述用户输入信息进行优化,得到优化信息;
将所述优化信息输入所述大模型,得到对应所述输入信息的反馈信息。
可选地,所述根据所述辅助信息对所述输入信息进行优化,得到优化信息包括:
将所述用户文本向量和所述辅助向量进行拼接,得到优化信息;或者
将所述辅助信息填充到预设的提示前缀模板中,根据所述提示前缀模板和所述用户文本向量,得到优化信息。
另一方面,本发明实施例还提供一种提升大模型生成信息质量的装置,所述装置包括:
信息接收模块,用于接收用户输入信息;
检索模块,用于利用知识库确定所述用户输入信息的辅助信息;
信息处理模块,用于根据所述用户输入信息和所述辅助信息,生成基于大模型的反馈信息。
可选地,所述检索模块包括:
向量生成单元,用于确定所述用户输入信息对应的输入文本向量;
检索单元,用于检索预先利用知识库构建的、基于向量的知识索引库,获取与所述输入文本向量相关的辅助信息。
可选地,所述装置还包括:知识索引库构建模块,所述知识索引库构建模块包括:
文本拼接单元,用于将知识库中的内容组织成文本;
文本处理单元,用于按照设定策略将所述文本转换为段落形式,得到各段落文本;
索引库生成单元,用于根据所述段落文本,生成基于向量的知识索引库。
可选地,所述检索单元包括:
相似度计算单元,用于计算所述输入文本向量与所述知识索引库中各向量的相似度;
选择单元,用于根据所述相似度确定所述输入文本向量相关的辅助向量。
可选地,所述信息处理模块包括:
优化单元,用于根据所述辅助信息对所述用户输入信息进行优化,得到优化信息;
处理单元,用于将所述优化信息输入所述大模型,得到对应所述输入信息的反馈信息。
另一方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质为非易失性存储介质或非瞬态存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行前面所述方法的步骤。
另一方面,本发明实施例还提供一种电子设备,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行前面所述方法的步骤。
本发明实施例提升大模型生成信息质量的方法及装置,利用知识库确定用户输入信息的辅助信息,由于所述知识库具有广泛性、专业性和时效性等特点,从而可以使用户输入信息得到增强,有效地提升了输入信息的质量,从而可以为输入信息提供更多的先验知识,作为输入信息的辅助信息,可以更好地提升大模型生成信息的实时性和准确性,从而有助于实现更专业、更实时的信息提取和知识生成,大大提升了大模型的应用价值和效率,更好地提升用户体验。
进一步地,预先利用知识库构建基于向量的知识索引库,利用用户输入信息对应的输入文本向量来检索该知识索引库,提高了检索效率。
进一步地,在构建知识索引库时,不仅利用知识库中的内容组织得到的文本对应的向量,而且还对这些不同向量进行组合得到的组合向量来生成知识索引库,从而可以使知识索引库的内容更丰富,使检索得到的辅助信息更全面,更好地保证了最终反馈信息的专业性和时效性。
附图说明
图1是本发明实施例提升大模型生成信息质量的方法的一种流程图;
图2是本发明实施例中构建知识索引库的一种流程图;
图3是本发明实施例提升大模型生成信息质量的装置的一种结构示意图;
图4是本发明实施例中知识索引库构建模块的一种结构示意图。
具体实施方式
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
需要说明的是,在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。另外,本发明实施例中出现的“多个”是指两个或两个以上。
在当今的自然语言处理和人工智能领域,大型预训练模型,如GPT-3、BERT等,已经广泛被接受并应用。这些模型普遍通过在海量的文本数据上进行训练,以此来深度学习和理解语言模式,最终能够生成流畅、自然并且能够理解一定语境的文本。然而,这些模型存在着一些明显的局限性:大型预训练模型的知识获取与训练数据紧密相关,模型所掌握的知识只能截止到其训练数据的最后更新日期,而且其知识更新的频率受新训练数据获取的速度所限制;此外,这些模型在理解和处理实时动态的信息,比如新闻事件或当前的社会发展趋势等方面,在处理专业领域问题上也显示出明显的缺陷。
知识库通常是存储结构化知识的数据库,从形式上有在线知识库和本地离线知识库,从涵盖内容上包括广义的通用知识库如百度百科、以及更为专业的领域知识库,例如医学、法律等。专业类知识库可以帮助缓解大型模型在回答专业问题时可能出现的误解现象,同时,利用知识库内容的可迭代特性,也可以更新大模型获取信息的时间线。
针对现有的大型预训练模型在知识更新速度和处理实时变化信息及专业领域问题上的限制,本发明实施例提供一种提升大模型生成信息质量的方法及装置,充分利用知识库的内容广泛性及时效性,基于知识库来优化模型生成的信息,即对应输入信息的反馈信息,从而提升反馈信息的时效性和准确性。
如图1所示,是本发明实施例提升大模型生成信息质量的方法的一种流程图,包括以下步骤:
步骤101,接收用户输入信息。
所述用户输入信息是指用户输入给大模型系统的信息,本发明方案中的大模型是指大型预训练模型,而且可以是多种领域中的大模型,比如可以包括但不限于:搜索引擎、对话系统、问答系统、新闻推荐系统等基于知识库应用场景中的模型。
通常,对于用户输入信息,需要进行一定的处理再输入所述大模型;而且,对于不同的大模型,其对用户输入信息的处理可以不同,比如对于应用于搜索引擎的大模型,需要对用户输入信息进行切分、找出关键词等处理,对于应用于问答系统的大模型,需要确定用户输入信息中的词向量、句向量等处理。对用户输入信息的处理可以依据大模型的需要来进行,对此本发明实施例不做限定。
另外,在有些情况下,还需要对用户输入信息进行分割,即将较长的文本按照段落或者预设长度,将其分割为更短的文本序列,以方便后续处理和分析。
对用户输入信息的分割可以采用现有的一些语义分割模型来实现,对此本发明实施例不做限定。
对用户输入信息的向量化实质是将原始的文本表述转换为一个多维的向量表示,得到对应用户输入信息的输入文本向量,多维向量可以更好地捕获并体现文本的语义内容,使所述大模型基于多维输入向量可以得到高质量的输出信息。
需要说明的是,在有些应用中,所述用户输入信息可以不限于文本,也可以是其它类型的信息,比如音视频等,在这种情况下,只需从中提取中相应的文本,即可利用本发明方案。
步骤102,利用知识库确定所述用户输入信息的辅助信息。
由于大模型的知识获取与训练数据紧密相关,其知识更新的频率受新训练数据获取的速度所限制,对于有些不能及时更新的大模型,对用户输入信息的理解及反馈可能会有偏差,使基于大模型输出的反馈信息(比如查询结果、对话信息等)不准确,从而影响用户体验。
针对上述这种情况,本发明实施例利用当前知识库对用户输入信息进行加强,从而可以使大模型更好地识别用户输入信息的意图,无论是从专业性还是时效性上来说,均可以丰富用户输入信息,提升大模型输入信息的专业性和时效性,从提升输入信息质量的角度来实现对大模型输出信息的质量。
在一种非限制性实施例中,可以预先利用当前的知识库,构建基于向量的知识索引库,以实现更精准的语义关联搜索。相应地,对用户输入信息,获取其对应的输入文本向量,然后,检索所述知识索引库,获取与输入文本向量相关的辅助信息。
知识索引库的构建方法将在后面详细说明。
步骤103,根据所述用户输入信息和所述辅助信息,生成基于大模型的反馈信息。
本发明实施例提升大模型生成信息质量的方法,利用知识库确定用户输入信息的辅助信息,由于所述知识库具有广泛性、专业性和时效性等特点,从而可以使用户输入信息得到增强,有效地提升了输入信息的质量,从而可以为输入信息提供更多的先验知识,作为输入信息的辅助信息,可以更好地提升大模型生成信息的实时性和准确性,从而有助于实现更专业、更实时的信息提取和知识生成,大大提升了大模型的应用价值和效率,更好地提升用户体验。
如图2所示,是本发明实施例中构建知识索引库的一种流程图,包括以下步骤:
步骤201,将知识库中的内容组织成文本。
所述知识库可以包括但不限于:在线知识库、本地知识库、通用知识库、专业知识库等。而且所述知识库中的内容不限于文本形式,也可以包括图片、音视频等内容。当然,对于知识库中的非文本内容,可以通过相应的识别技术,得到相应的文本。比如对于图片内容,可以利用图片识别技术得到其对应的文本。
以本地专业领域知识库为例,虽然知识库中的数据已经以半结构化或结构化的形式存在,但为了更准确地匹配查询文本,在一种非限制性实施例中,可以将知识库中的每条内容拼接组织成长文本形式,作为后续参考的文档信息。
步骤202,按照设定策略将所述文本转换为段落形式,得到各段落文本。
考虑到知识匹配的粒度问题,可以进一步对上述步骤201得到的长文本的长度进行限制,比如采取段落切分策略和/或最大长度限制策略,将长文本转换为较短的段落形式。
当然,在实际应用中,根据应用需要还可以设定其它策略,对此本实施例不做限定。
步骤203,根据所述段落文本,生成基于向量的知识索引库。
具体地,确定各段落文本对应的向量,比如可以利用自然语言处理领域的向量表征模型,将每一段文本向量化,得到各段落文本对应的向量,由这些向量组成了知识索引库。也就是说,所述知识索引库包含了多个向量。
进一步地,还可以灵活地组合多种向量表示模型,即利用相关模型对不同向量进行组合,得到新的向量,这样可以提升知识索引库的效果。当然,还需要在知识索引库的效果和构建效率之间达到一定的平衡,因为过多的组合会影响知识索引库的构建效率。为此,可以在实际应用中根据需要来确定向量组合的方式和数量等,对此本发明实施例不做限定。
进一步地,还可以针对所述知识索引库中的每条向量,记录该向量对应的文本、以及所述文本在知识库中所属的文档等信息,以便为后续对用户信息的优化提供更多参考。
相应地,在确定用户输入信息的辅助信息时,可以基于用户输入信息对应的输入文本向量,检索该知识索引库中的每条向量,从而得到与所述输入文本向量相关的辅助向量,该辅助向量即为前面所述的所述用户输入信息的辅助信息。进一步地,所述辅助信息还可包括但不限于所述辅助向量对应的文本、以及所述文本在知识库中所属的文档等。
考虑在有些应用(比如对话、查询等)过程中用户输入信息中文本的长度不可控,例如进行论文摘要、大篇幅文本改写等场景时,还需要对用户输入信息进行段落切割,切割策略包括段落切分策略和最大长度限制策略。通过对所有文本段落进行高维特征转换,即文本向量化,可以更好地与知识索引库中的向量进行语义匹配。
需要说明的是,对用户输入信息进行文本向量化和构建知识索引库时对知识库中的信息向量化的模型应保持一致,以便从相同的角度进行文本的高维特征转化。
在上述图1中步骤102的一种非限制性实施例中,可以根据输入文本向量与所述知识索引库中各向量的相似度来确定相应的辅助向量。具体地,计算所述输入文本向量与所述知识索引库中各向量的相似度,将相似度大于设定阈值(比如该阈值为90%)的向量作为所述输入文本向量相关的辅助向量。当然,也可以有其它方式,比如依照相似度由大到小选择一定数量(比如1~2条)的向量作为所述输入文本向量的辅助向量,对此本发明实施例不做限定。当然,也可以从知识索引库中选择一个相似度最高的向量作为所述辅助向量。
该阶段将确定辅助信息的问题转化为常规的文本语义检索任务,从而可以灵活地利用现有的神经向量检索方式。
相应地,在图1的步骤103中,可以根据所述辅助信息对所述用户输入信息进行优化,得到优化信息;然后将所述优化信息输入所述大模型,得到对应所述输入信息的反馈信息。
所述优化信息的确定可以有多种方式,比如,在一种非限制性实施例中,可以将所述用户文本向量和所述辅助向量进行拼接,得到优化信息;在另一中非限制性实施例中,可以将所述辅助信息填充到预设的提示前缀模板中,根据所述提示前缀模板和所述用户文本向量,得到优化信息。当然,还可以有其它优化方式,对此本发明不做限定。
利用所述辅助信息对用户输入信息的优化,可以为大模型提供缺少的实时性知识和专和领域知识,通过对辅助信息与用户输入信息的组织,利用大模型的语义理解能力,可以有效地提取组织后的提示中的先验知识,然后以这些先验知识为索引,找到大模型学习到的语言模型中合适的表述内容。
在该知识生成阶段中,先验知识在大模型生成的反馈信息中起着关键的作用,它带来专业性、时效性以及参考依据,可以更好地提升大模型生成结果的实时性和准确性,有助于实现更专业、更实时的信息提取和知识生成,大大提升了大模型的应用价值和效率。
相应地,本发明实施例还提供一种提升大模型生成信息质量的装置,如图3所示,是该装置的一种结构示意图。
该实施例提升大模型生成信息质量的装置300包括以下各模块:
信息接收模块301,用于接收用户输入信息;
检索模块302,用于利用知识库确定所述用户输入信息的辅助信息;
信息处理模块303,用于根据所述用户输入信息和所述辅助信息,生成基于大模型的反馈信息。
其中,所述检索模块302具体可以包括:向量生成单元和检索单元;所述向量生成单元用于确定所述用户输入信息对应的输入文本向量;所述检索单元用于检索预先利用知识库构建的、基于向量的知识索引库,获取与所述输入文本向量相关的辅助信息。
所述知识索引库可以由相应的知识索引库构建模块来生成,所述知识索引库构建模块可以作为该装置的一部分,也可以独立于该装置,对此本发明实施例不做限定。
如图4所示,是本发明实施例中知识索引库构建模块的一种结构示意图。
该知识索引库构建模块400包括以下各单元:
文本拼接单元401,用于将知识库中的内容组织成文本;
文本处理单元402,用于按照设定策略将所述文本转换为段落形式,得到各段落文本;
索引库生成单元403,用于根据所述段落文本,生成基于向量的知识索引库。
相应地,上述检索单元可以根据所述输入文本向量与所述知识索引库中各向量的相似度来确定所述输入文本向量相关的辅助向量。
在一种非限制性实施例中,所述检索单元可以进一步包括:相似度计算单元和选择单元;其中,所述相似度计算单元用于计算所述输入文本向量与所述知识索引库中各向量的相似度;所述选择单元用于根据所述相似度确定所述输入文本向量相关的辅助向量,比如,可以选择相似度大于设定阈值的一个或多个向量作为所述输入文本向量相关的辅助向量。
相应地,所述信息处理模块303可以包括以下各单元:
优化单元,用于根据所述辅助信息对所述用户输入信息进行优化,得到优化信息,比如,将所述用户文本向量和所述辅助向量进行拼接,得到优化信息;或者将所述辅助信息填充到预设的提示前缀模板中,根据所述提示前缀模板和所述用户文本向量,得到优化信息。当然,还可以有其它优化方式,对此本发明不做限定。
处理单元,用于将所述优化信息输入所述大模型,得到对应所述输入信息的反馈信息。
本发明实施例提供的大型预训练模型优化方法及装置,通过将知识库与大型预训练模型结合,可以有效提高模型生成信息的时效性和准确性。并且,由于知识库数据具有可溯源的特性,可以为模型生成的信息提供具体的参考文档,从而在各种需要处理和理解自然语言的场合中提升系统的性能和用户体验。
在实际应用中,本发明实施例提供的大型预训练模型优化方法及装置可以广泛应用于诸多领域,包括但不限于搜索引擎、对话系统、问答系统、新闻推荐系统等基于知识库的应用场景,可以为用户提供更准确、更实时的响应,可以在各种需要处理和理解自然语言的场合中大幅提升系统的性能和用户体验。
关于上述实施例中描述的各个装置、产品包含的各个模块/单元,其可以是软件模块/单元,也可以是硬件模块/单元,或者也可以部分是软件模块/单元,部分是硬件模块/单元。例如,对于应用于或集成于芯片的各个装置、产品,其包含的各个模块/单元可以都采用电路等硬件的方式实现,或者,至少部分模块/单元可以采用软件程序的方式实现,该软件程序运行于芯片内部集成的处理器,剩余的(如果有)部分模块/单元可以采用电路等硬件方式实现;对于应用于或集成于芯片模组的各个装置、产品,其包含的各个模块/单元可以都采用电路等硬件的方式实现,不同的模块/单元可以位于芯片模组的同一组件(例如芯片、电路模块等)或者不同组件中,或者,至少部分模块/单元可以采用软件程序的方式实现,该软件程序运行于芯片模组内部集成的处理器,剩余的(如果有)部分模块/单元可以采用电路等硬件方式实现;对于应用于或集成于终端设备的各个装置、产品,其包含的各个模块/单元可以都采用电路等硬件的方式实现,不同的模块/单元可以位于终端设备内同一组件(例如,芯片、电路模块等)或者不同组件中,或者,至少部分模块/单元可以采用软件程序的方式实现,该软件程序运行于终端设备内部集成的处理器,剩余的(如果有)部分模块/单元可以采用电路等硬件方式实现。
本发明实施例还公开了一种存储介质,所述存储介质为计算机可读存储介质,其上存储有计算机程序,所述计算机程序运行时可以执行图1或图2或图3中所示方法的全部或部分步骤。所述存储介质可以包括只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁盘或光盘等。存储介质还可以包括非挥发性存储器(non-volatile)或者非瞬态(non-transitory)存储器等。
本发明实施例还提供一种电子设备,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行图1或图2所述方法的全部或部分步骤。
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线或无线方式向另一个网站站点、计算机、服务器或数据中心进行传输。
应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法、装置和系统,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的;例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式;例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的部分步骤。
虽然本申请披露如上,但本申请并非限定于此。任何本领域技术人员,在不脱离本申请的精神和范围内,均可作各种更动与修改,因此本申请的保护范围应当以权利要求所限定的范围为准。
Claims (16)
1.一种提升大模型生成信息质量的方法,其特征在于,所述方法包括:
接收用户输入信息;
利用知识库确定所述用户输入信息的辅助信息;
根据所述用户输入信息和所述辅助信息,生成基于大模型的反馈信息。
2.根据权利要求1所述的方法,其特征在于,所述利用知识库确定所述用户输入信息的辅助信息包括:
预先利用知识库构建基于向量的知识索引库;
确定所述用户输入信息对应的输入文本向量;
检索所述知识索引库,获取与所述输入文本向量相关的辅助信息。
3.根据权利要求2所述的方法,其特征在于,所述利用知识库构建基于向量的知识索引库包括:
将知识库中的内容组织成文本;
按照设定策略将所述文本转换为段落形式,得到各段落文本;
根据所述段落文本,生成基于向量的知识索引库。
4.根据权利要求3所述的方法,其特征在于,所述设定策略包括以下任意一种或多种:段落切分策略、最大长度限制策略。
5.根据权利要求3所述的方法,其特征在于,所述根据所述段落文本,生成基于向量的知识索引库包括:
确定各段落文本对应的向量;
根据所述向量及不同向量的组合生成所述知识索引库。
6.根据权利要求2所述的方法,其特征在于,检索所述知识索引库,获取与所述输入文本向量相关的辅助信息包括:
计算所述输入文本向量与所述知识索引库中各向量的相似度;
根据所述相似度确定所述输入文本向量相关的辅助信息,所述辅助信息包括:辅助向量。
7.根据权利要求6所述的方法,其特征在于,根据所述相似度确定所述输入文本向量相关的辅助向量包括:
将相似度大于设定阈值的向量作为所述输入文本向量相关的辅助向量。
8.根据权利要求6所述的方法,其特征在于,根据所述用户输入信息和所述辅助信息,生成基于大模型的反馈信息包括:
根据所述辅助信息对所述用户输入信息进行优化,得到优化信息;
将所述优化信息输入所述大模型,得到对应所述输入信息的反馈信息。
9.根据权利要求8所述的方法,其特征在于,所述根据所述辅助信息对所述输入信息进行优化,得到优化信息包括:
将所述用户文本向量和所述辅助向量进行拼接,得到优化信息;或者
将所述辅助信息填充到预设的提示前缀模板中,根据所述提示前缀模板和所述用户文本向量,得到优化信息。
10.一种提升大模型生成信息质量的装置,其特征在于,所述装置包括:
信息接收模块,用于接收用户输入信息;
检索模块,用于利用知识库确定所述用户输入信息的辅助信息;
信息处理模块,用于根据所述用户输入信息和所述辅助信息,生成基于大模型的反馈信息。
11.根据权利要求10所述的装置,其特征在于,所述检索模块包括:
向量生成单元,用于确定所述用户输入信息对应的输入文本向量;
检索单元,用于检索预先利用知识库构建的、基于向量的知识索引库,获取与所述输入文本向量相关的辅助信息。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:知识索引库构建模块,所述知识索引库构建模块包括:
文本拼接单元,用于将知识库中的内容组织成文本;
文本处理单元,用于按照设定策略将所述文本转换为段落形式,得到各段落文本;
索引库生成单元,用于根据所述段落文本,生成基于向量的知识索引库。
13.根据权利要求12所述的装置,其特征在于,所述检索单元包括:
相似度计算单元,用于计算所述输入文本向量与所述知识索引库中各向量的相似度;
选择单元,用于根据所述相似度确定所述输入文本向量相关的辅助向量。
14.根据权利要求11所述的装置,其特征在于,所述信息处理模块包括:
优化单元,用于根据所述辅助信息对所述用户输入信息进行优化,得到优化信息;
处理单元,用于将所述优化信息输入所述大模型,得到对应所述输入信息的反馈信息。
15.一种计算机可读存储介质,所述计算机可读存储介质为非易失性存储介质或非瞬态存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1至9中任一项所述方法的步骤。
16.一种电子设备,其特征在于,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行权利要求1至9任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310818447.9A CN116881398A (zh) | 2023-07-04 | 2023-07-04 | 提升大模型生成信息质量的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310818447.9A CN116881398A (zh) | 2023-07-04 | 2023-07-04 | 提升大模型生成信息质量的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116881398A true CN116881398A (zh) | 2023-10-13 |
Family
ID=88270811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310818447.9A Pending CN116881398A (zh) | 2023-07-04 | 2023-07-04 | 提升大模型生成信息质量的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116881398A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105893476A (zh) * | 2016-03-29 | 2016-08-24 | 上海智臻智能网络科技股份有限公司 | 智能问答方法、知识库优化方法及装置、智能知识库 |
CN111090739A (zh) * | 2019-10-30 | 2020-05-01 | 贝壳技术有限公司 | 信息处理方法、装置以及电子设备、存储介质 |
CN111309893A (zh) * | 2020-05-15 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 基于源问题生成相似问题的方法和装置 |
CN111581360A (zh) * | 2020-04-21 | 2020-08-25 | 上海明略人工智能(集团)有限公司 | 一种辅助客服的方法、系统和设备 |
CN116010574A (zh) * | 2023-01-10 | 2023-04-25 | 阿里巴巴(中国)有限公司 | 智能对话处理的方法、云服务器及可读存储介质 |
-
2023
- 2023-07-04 CN CN202310818447.9A patent/CN116881398A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105893476A (zh) * | 2016-03-29 | 2016-08-24 | 上海智臻智能网络科技股份有限公司 | 智能问答方法、知识库优化方法及装置、智能知识库 |
CN111090739A (zh) * | 2019-10-30 | 2020-05-01 | 贝壳技术有限公司 | 信息处理方法、装置以及电子设备、存储介质 |
CN111581360A (zh) * | 2020-04-21 | 2020-08-25 | 上海明略人工智能(集团)有限公司 | 一种辅助客服的方法、系统和设备 |
CN111309893A (zh) * | 2020-05-15 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 基于源问题生成相似问题的方法和装置 |
CN116010574A (zh) * | 2023-01-10 | 2023-04-25 | 阿里巴巴(中国)有限公司 | 智能对话处理的方法、云服务器及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11899681B2 (en) | Knowledge graph building method, electronic apparatus and non-transitory computer readable storage medium | |
CN112800170A (zh) | 问题的匹配方法及装置、问题的回复方法及装置 | |
CN109408821B (zh) | 一种语料生成方法、装置、计算设备及存储介质 | |
KR20230075052A (ko) | 언어 모델을 이용하여 도메인에 특화된 대화를 제공하는 방법, 컴퓨터 장치, 및 컴퓨터 프로그램 | |
CN112434533B (zh) | 实体消歧方法、装置、电子设备及计算机可读存储介质 | |
CN111553138B (zh) | 用于规范内容结构文档的辅助写作方法及装置 | |
CN117077792B (zh) | 一种基于知识图谱生成提示数据的方法及装置 | |
CN112506945A (zh) | 基于知识图谱的自适应导学方法及系统 | |
CN117668181A (zh) | 信息处理方法、装置、终端设备以及存储介质 | |
CN118170894A (zh) | 一种知识图谱问答方法、装置及存储介质 | |
CN110795544A (zh) | 内容搜索方法、装置、设备和存储介质 | |
CN118093839B (zh) | 基于深度学习的知识运营问答对话处理方法及系统 | |
CN117995427B (zh) | 医疗知识库构建方法、装置、电子设备及存储介质 | |
CN117725183A (zh) | 提升ai大语言模型检索性能的重排序方法和装置 | |
CN111859950A (zh) | 一种自动化生成讲稿的方法 | |
CN116595026A (zh) | 信息查询方法 | |
CN117093600A (zh) | 搜索提示词的生成方法、装置、电子设备及存储介质 | |
CN117493505A (zh) | 智能问答方法、装置、设备和存储介质 | |
CN117540004B (zh) | 基于知识图谱和用户行为的工业领域智能问答方法及系统 | |
CN118313347A (zh) | 文档处理方法、装置及其相关产品 | |
CN118210889A (zh) | 基于知识图谱的向量相似性搜索的提示词生成方法及装置 | |
CN118035405A (zh) | 一种基于大模型的知识库问答构建方法及装置 | |
CN117932022A (zh) | 一种智能问答方法、装置、电子设备及存储介质 | |
CN117556057A (zh) | 知识问答方法、向量数据库构建方法及装置 | |
CN116910270A (zh) | 多模态心理知识图谱构建方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |