CN117743390B

CN117743390B - 针对金融信息的查询方法和系统、存储介质

Info

Publication number: CN117743390B
Application number: CN202410186067.2A
Authority: CN
Inventors: 游浩; 黎峰; 王晴
Original assignee: E Capital Transfer Co ltd
Current assignee: E Capital Transfer Co ltd
Priority date: 2024-02-20
Filing date: 2024-02-20
Publication date: 2024-05-28
Anticipated expiration: 2044-02-20
Also published as: CN117743390A

Abstract

本公开涉及金融领域的信息查询技术，并且更具体地涉及一种针对金融信息的查询方法、实施该方法的查询系统和存储介质。该方法包括：响应于接收到输入信息，利用大型语言模型对输入信息进行语义扩充，以生成一个或多个输入文本；利用嵌入模型对一个或多个输入文本进行向量化处理，以获得查询向量；将查询向量与向量数据库中的信息向量进行相似度匹配，以获得与查询向量匹配的信息向量，其中向量数据库为基于金融信息构建的数据库；获取与匹配的信息向量相对应的知识文本块所在的段落的文本信息和相关联的金融法律法规的条目；以及将输入信息、文本信息、金融法律法规的条目和提示信息输入至大语言模型，以获取针对输入信息的查询结果。

Description

针对金融信息的查询方法和系统、存储介质

技术领域

本公开涉及金融领域的信息查询技术，并且更具体地涉及一种针对金融信息的查询方法、实施该方法的查询系统、以及实施该方法的计算机可读存储介质。

背景技术

金融领域是一个复杂且高度专业化的领域，涵盖了银行、投资、风险管理、保险、证券市场等多个方面。在金融领域，由于错误的决策可能导致财务损失、法律问题、甚至引发金融危机，因此信息的准确性以及知识的专业程度至关重要。有鉴于此，金融从业者、投资者和一般公众均具有快速获得可信赖的金融信息和建议的需求。

要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

为了解决或至少缓解以上问题中的一个或多个，提供了以下技术方案。本公开的实施例提供了一种针对金融信息的查询方法、实施该方法的查询系统、以及实施该方法的计算机可读存储介质，其能够自动检索金融合规数据库并智能回答用户提问，从而为用户提供高效且专业的建议或解答。

按照本公开的第一方面，提供一种针对金融信息的查询方法，所述方法包括以下步骤：响应于接收到输入信息，利用大语言模型对所述输入信息进行语义扩充，以生成与所述输入信息语义对应的一个或多个输入文本；利用嵌入模型对所述一个或多个输入文本进行向量化处理，以获得查询向量；将所述查询向量与向量数据库中的信息向量进行相似度匹配，以获得与所述查询向量匹配的信息向量，其中所述向量数据库为基于金融信息构建的数据库并且所述向量数据库是基于以下步骤而构建的：对本地金融信息进行文本内容提取，以生成知识文本；以句为单位对所述知识文本进行切分以生成知识文本块，并将切分后的每一句与该句所在的段落和其对应的金融法律法规的条目相关联；以及利用所述嵌入模型对所述知识文本块进行向量化处理，以生成所述信息向量；获取与匹配的信息向量相对应的知识文本块所在的段落的文本信息和相关联的金融法律法规的条目；以及将所述输入信息、所述文本信息、所述金融法律法规的条目和提示信息输入至所述大语言模型，以获取针对所述输入信息的查询结果。

作为以上方案的替代或补充，在根据本公开一实施例的查询方法中，所述方法还包括：基于更新后的本地金融信息更新所述向量数据库中的信息向量。

作为以上方案的替代或补充，在根据本公开一实施例的查询方法中，所述方法还包括：利用所述大语言模型对所述输入信息进行关键词提取；以及利用嵌入模型对提取到的关键词进行向量化处理以获得所述查询向量。

作为以上方案的替代或补充，在根据本公开一实施例的查询方法中，将所述查询向量与向量数据库中的信息向量进行相似度匹配，以获得与所述查询向量匹配的信息向量包括：计算所述查询向量与所述向量数据库中的各信息向量的相似度；以及筛选出符合以下条件之一的信息向量作为匹配的信息向量：相似度大于或等于第一阈值的信息向量，相似度排序最大的K个信息向量。

作为以上方案的替代或补充，在根据本公开一实施例的查询方法中，所述方法还包括：基于预定义的合规性规则和策略对所述大语言模型进行微调。

根据本公开的第二方面，提供一种针对金融信息的查询系统，包含：存储器；处理器；以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序的运行使得根据本公开第一方面所述的查询方法中的任意一项被执行。

根据本公开的第三方面，提供一种计算机可读存储介质，所述计算机可读存储介质包括指令，所述指令在运行时执行根据本公开第一方面所述的查询方法中的任意一项。

首先，根据本公开的一个或多个实施例的针对金融信息的查询方案利用大语言模型对用户输入进行语义扩充，使得能够查询到更多候选结果，提高问题检索召回率。其次，该方案利用嵌入模型对用户输入进行向量化处理并在向量数据库进行相似度匹配，从而帮助用户更快速地检索金融信息，提高了信息检索效率。再者，该方案利用大语言模型的上下文理解能力和文本分析能力确保查询结果的易读性，避免一些不合理的表达。最后，由于向量数据库和大语言模型都具有高度可扩展性，使得该方案能够快速适应信息时效变化，从而向用户提供更具备实时性的查询结果。

附图说明

本公开的上述和/或其它方面和优点将通过以下结合附图的各个方面的描述变得更加清晰和更容易理解，附图中相同或相似的单元采用相同的标号表示。在所述附图中：

图1为按照本公开的一个或多个实施例的针对金融信息的查询方法10的示意性流程图；

图2为按照本公开的一个或多个实施例的向量数据库的构建方法20的示意性流程图；以及

图3为按照本公开的一个或多个实施例的针对金融信息的查询系统30的示意性框图。

具体实施方式

以下具体实施方式的描述本质上仅仅是示例性地，并且不旨在限制所公开的技术或所公开的技术的应用和用途。此外，不意图受在前述技术领域、背景技术或以下具体实施方式中呈现的任何明示或暗示的理论的约束。

在实施例的以下详细描述中，阐述了许多具体细节以便提供对所公开技术的更透彻理解。然而，对于本领域普通技术人员显而易见的是，可以在没有这些具体细节的情况下实践所公开的技术。在其他实例中，没有详细描述公知的特征，以避免不必要地使描述复杂化。

诸如“包含”和“包括”之类的用语表示除了具有在说明书中有直接和明确表述的单元和步骤以外，本公开的技术方案也不排除具有未被直接或明确表述的其它单元和步骤的情形。诸如“第一”和“第二”之类的用语并不表示单元在时间、空间、大小等方面的顺序而仅仅是作区分各单元之用。下文中所用的词语“示例”或“示例地”或“示例性地”的意思为“用作例子、实施例或说明性”。作为“示例”或“示例地”或“示例性地”所说明的任何实施例不必解释为优于或好于其它实施例。

如上文所述，金融领域涉及复杂的金融产品、投资策略、法规和风险管理等方面的专业知识，因此用户对查询到的金融信息的准确性以及知识的专业程度具有很高的要求。目前的金融知识查询系统大致可划分为两类，也即基于规则的查询系统和基于预训练的语言模型的查询系统。

基于规则的查询系统使用预定义的规则和模板来回答特定类型的金融问题，其规则涉及正则表达式、关键词匹配和句法分析等，此类方案的优势在于能够提供高度定制化的答案，但其答案限制在已知规则的范围内，且系统的语言理解能力和机动能力较差。

基于预训练的语言模型的查询系统大多使用机器学习或深度学习模型，基于大语言模型（例如，GPT（Generative Pre-Trained Transformer，生成式预训练Transformer））系列、BERT（Bidirectional EncoderRepresentations from Transformers，双向Transformer的编码器）、RoBERTa（Robustly optimized BERT approach，鲁棒优化的BERT预训练方法）等）的方法已经在NLP（Natural LanguageProcessing，自然语言处理）任务中取得了显著的成功，在诸如社交媒体、聊天应用、客服系统之类的问答系统中被广泛应用。然而，金融领域的信息和数据通常会因市场波动、新闻事件和宏观经济因素而不断变化，查询系统在回答关于股票价格、汇率、市场趋势等问题时，需要及时更新数据以反映当前的情况，而纯粹的预训练模型无法及时获取并处理最新信息，可能会提供过时的答案。此外，在针对金融专业领域的这些对话中可能存在回答错误或偏差问题，例如，金融领域有着严格的法规和道德准则，数据又通常比较敏感和有限，大模型可能会产生不当的建议或对法规存在不完全理解，从而导致不合理的回答。

为了解决或至少缓解以上问题中的一个或多个，本公开提供了一种针对金融信息的查询方案。在下文中，将参考附图详细地描述根据本公开的各示例性实施例。

下面参考附图，图1为按照本公开的一个或多个实施例的针对金融信息的查询方法10的示意性流程图。

如图1所示，在步骤S110中，响应于接收到输入信息，利用大语言模型对输入信息进行语义扩充，以生成与输入信息语义对应的一个或多个输入文本。

输入信息可以是用户输入的文本信息，也可以是用户发出的语音信息。在一个实施例中，用户经由终端设备的麦克风输入语音查询指令，该语音查询指令通过转换处理转换成对应的文本查询指令，并将该文本查询指令输入至大语言模型。针对问答系统，一个标准问通常会对应多个相似问，其与标准问表达相同或相近的意思，具有相同或相近的语义。大语言模型（Large Language Model，LLM）可针对输入的文本查询指令生成多个相似问，这样有利于查询到更多的候选答案，提高问题检索召回率。

可选地，在接收到输入信息之后，还可以利用大语言模型对输入信息进行关键词提取。关键词提取旨在通过大语言模型提取文本中的关键信息，例如，利用大语言模型提取文本中的时间、地点、人物等信息，并将文本关键信息进行结构化表示。可选地，大语言模型可以对输入信息同时进行关键词提取和语义扩充，例如，先提取关键信息并针对关键信息进行语义扩充，以便进一步提高问题检索召回率。

在步骤S120中，利用嵌入模型对一个或多个输入文本进行向量化处理，以获得查询向量。

在机器学习和自然语言处理中，嵌入（embedding）是指将高维度的数据（例如，文本、图片、音频）映射到低维度空间的过程。嵌入模型的输出通常是一个由实数构成的向量，其将输入的数据表示成一个连续的数值空间中的点，该向量是包含语义信息的。在步骤S120中，通过利用嵌入模型对经过关键词提取和/或语义扩充的输入信息进行向量化处理，将输入信息表示为查询向量，从而允许大语言模型以紧凑高效的方式编码输入文本的上下文信息。

在步骤S130中，将嵌入模型生成的查询向量与向量数据库中的信息向量进行相似度匹配，以获得与查询向量匹配的信息向量。

向量数据库是专门用来存储和查询向量的数据库，其存储的向量来自于对文本、语音、图像、视频等数据的向量化。由于具备强大的搜索和分析引擎，因此向量数据库可用于信息的查询、聚合和分析。与传统数据库相比，向量数据库可以处理更多非结构化数据（例如，图像和音频）。此外，由于向量数据库可以在集群中存储和处理大量的数据，这使得其可适用于大规模的向量数据存储和查询，同时具备良好的扩展性，可以根据需求增加新的文件更新数据库，以适应新领域知识的查询。步骤S130所使用的向量数据库为基于金融信息（例如，银行信息、投资信息、风险管理信息、保险信息、证券市场信息、法规合规信息等）预先构建的数据库。图2示出了按照本公开的一个或多个实施例的向量数据库的构建方法20的示意性流程图。

在步骤S210中，对本地金融信息进行文本内容提取，以生成知识文本。示例性地，可对本地收集好的银行、投资、风险管理、保险、证券市场、法规合规等文件（例如，本文文件、语音文件、视频文教、图片文件等）进行文本提取。在一个实施例中，本地金融信息是动态更新的，也即，可以基于更新后的本地金融信息动态更新向量数据库，从而确保向量数据库能够快速适应信息时效变化，提供更具备实时性的查询结果。

在步骤S220中，按照金融法律法规的条目对知识文本进行切分，以生成知识文本块。在一个实施例中，可使用自定义的切分器进行文本切分，以提高切分语义的精确性。示例性地，文本切分可按照以下流程指示：首先，以句为单位对知识文本进行切分（例如，利用基于金融法律法规的文档切分器对对知识文本进行切分），也即，将知识文本按照句号、问号、感叹号、换行符等进行切分，；接下来，将切分后的每一句与该句所在的段落和/或其对应的金融法律法规的条目（例如，《中华人民共和国中国人民银行法》第四章第二十三条）相关联。相较于以固定字符长度进行的切分，以句为单位的切分生成的知识文本块具有更完整的语义和更加完整的知识点，从而使得存入向量知识库中的知识点更加准确。此外，由于将知识文本块与所在的段落和/或对应的金融法律法规的条目相关联，存入向量知识库中的知识点将具有足够的信息量并且更容易关联到对应的法律法规、便于定位，从而使得向量数据库能够为客户提供准确且合规的服务体验。

在步骤S230中，利用嵌入模型对知识文本块进行向量化处理，以生成信息向量。需要说明的是，此处用到的嵌入模型与步骤S120所使用的嵌入模型为同一模型。可选地，还可为每一个信息向量分配唯一的信息向量标识。可选地，可进一步为信息向量创建向量索引，以将该信息向量标识关联到其所在的段落和/或对应的金融法律法规的条目，从而加快信息向量的检索速度。

下面回到步骤S130中，在嵌入模型生成查询向量之后，在向量数据库中进行查询向量的相似度匹配，并基于相似度匹配结果（例如，依据余弦距离、欧式距离、或向量内积等）从向量数据库中筛选出与该查询向量匹配的信息向量。具体而言，在一个实施例中，计算生成的查询向量与向量数据库中的各信息向量的相似度，并筛选出相似度大于或等于第一阈值的一个或多个信息向量作为与该查询向量匹配的信息向量。在另一个实施例中，还可对查询向量与向量数据库中的各信息向量的相似度进行排序，并筛选出相似度排序最大的K个信息向量（也即，与该查询向量最近似的K个信息向量）作为与该查询向量匹配的信息向量。可选地，还可以将向量搜索与其他类型的查询组合使用，以实现更复杂的分析。

在步骤S140中，获取与匹配的信息向量相对应的知识文本块所在的段落的文本信息和相关联的金融法律法规的条目。示例性地，可首先获取匹配的信息向量的唯一的信息向量标识和/或向量索引，并依据信息向量标识和/或向量索引查询与匹配的信息向量相对应的知识文本块所在的段落的文本信息和/或相关联的金融法律法规的条目。由于在句级向量匹配成功后返回的是包含该句子的整个段落，在后续的推理过程中，大语言模型将能够获取足够的信息量并且更容易关联到对应的法律法规，从而更容易生成符合相关法律法规的查询结果。

在步骤S150中，将输入信息、文本信息、金融法律法规的条目和提示信息输入至所述大语言模型，以获取针对输入信息的查询结果。提示信息（prompt）是指人工智能的提示词，是一种利用自然语言来指导或激发人工智能模型完成特定任务的方法。提示信息的作用在于向大语言模型提示上下文和任务要求，以便帮助大语言模型更好地理解输入的意图，并作出相应的响应。此外，提示信息还可以帮助提高大语言模型的可解释性和可访问性。步骤S150旨在将输入信息、与匹配的信息向量相关联的文本信息和金融法律法规的条目与提示信息一起提供给大语言模型，以便帮助大语言模型更好地理解输入的意图并快速定位到对应的金融法律法规。由于大语言模型通过大量数据的训练而生成，其能够学习多样的语言模式和表达方式，从而避免不合理的表达。

可选地，在微调阶段，可以向大语言模型提供预定义的合规性规则和策略，以引导模型生成更加符合金融法律法规规定的内容。示例性地，这些规则可以涵盖道德、法律和社会准则等方面。除了问答之外，大语言模型还可以根据用户的个人情况和需求提供个性化建议，例如，投资组合建议、退休规划等。

根据本公开的一个或多个实施例的针对金融信息的查询方法10能够利用大型语言模型对用户输入进行语义扩充，使得能够查询到更多候选结果，提高问题检索召回率。其次，方法10利用嵌入模型对用户输入进行向量化处理并在向量数据库进行相似度匹配，从而帮助用户更快速地检索金融信息，提高了信息检索效率。再者，方法10利用大语言模型的上下文理解能力和文本分析能力确保查询结果的易读性，避免一些不合理的表达。最后，由于向量数据库和大语言模型都具有高度可扩展性，使得该方案能够快速适应信息时效变化，从而提供更具备实时性的查询结果。

图3为按照本公开的一个或多个实施例的针对金融信息的查询系统30的示意性框图。如图3所示，针对金融信息的查询系统30包括包含存储器310、处理器320、以及存储在存储器310上并可在处理器320上运行的计算机程序330，计算机程序330的运行使得如图1所示的针对金融信息的查询方法10被执行。

另外，如上所述，本公开也可以被实施为一种计算机可读存储介质，在其中存储有用于使计算机执行如图1所示的针对金融信息的查询系统方法10的程序。在此，作为计算机存储介质，能采用盘类（例如，磁盘、光盘等）、卡类（例如，存储卡、光卡等）、半导体存储器类（例如，ROM、非易失性存储器等）、带类（例如，磁带、盒式磁带等）等各种方式的计算机存储介质。

在可适用的情况下，可以使用硬件、软件或硬件和软件的组合来实现由本公开提供的各种实施例。而且，在可适用的情况下，在不脱离本公开的范围的情况下，本文中阐述的各种硬件部件和/或软件部件可以被组合成包括软件、硬件和/或两者的复合部件。在可适用的情况下，在不脱离本公开的范围的情况下，本文中阐述的各种硬件部件和/或软件部件可以被分成包括软件、硬件或两者的子部件。另外，在可适用的情况下，预期的是，软件部件可以被实现为硬件部件，以及反之亦然。

根据本公开的软件（诸如程序代码和/或数据）可以被存储在一个或多个计算机存储介质上。还预期的是，可以使用联网的和/或以其他方式的一个或多个通用或专用计算机和/或计算机系统来实现本文中标识的软件。在可适用的情况下，本文中描述的各个步骤的顺序可以被改变、被组合成复合步骤和/或被分成子步骤以提供本文中描述的特征。

提供本文中提出的实施例和示例，以便最好地说明按照本公开及其特定应用的实施例，并且由此使本领域的技术人员能够实施和使用本公开。但是，本领域的技术人员将会知道，仅为了便于说明和举例而提供以上描述和示例。所提出的描述不是意在涵盖本公开的各个方面或者将本公开局限于所公开的精确形式。

Claims

1.一种针对金融信息的查询方法，其特征在于，所述方法包括以下步骤：

响应于接收到输入信息，利用大语言模型对所述输入信息进行语义扩充，以生成与所述输入信息语义对应的一个或多个输入文本；

利用嵌入模型对所述一个或多个输入文本进行向量化处理，以获得查询向量；

将所述查询向量与向量数据库中的信息向量进行相似度匹配，以获得与所述查询向量匹配的信息向量，其中所述向量数据库为基于金融信息构建的数据库并且所述向量数据库是基于以下步骤而构建的：

对本地金融信息进行文本内容提取，以生成知识文本；

以句为单位对所述知识文本进行切分以生成知识文本块，并将切分后的每一句与该句所在的段落和其对应的金融法律法规的条目相关联；以及

利用所述嵌入模型对所述知识文本块进行向量化处理，以生成所述信息向量；

获取与匹配的信息向量相对应的知识文本块所在的段落的文本信息和相关联的金融法律法规的条目；以及

将所述输入信息、所述文本信息、所述金融法律法规的条目和提示信息输入至所述大语言模型，以获取针对所述输入信息的查询结果。

2.根据权利要求1所述的查询方法，其特征在于，所述方法还包括：

基于更新后的本地金融信息更新所述向量数据库中的信息向量。

3.根据权利要求1所述的查询方法，其特征在于，所述方法还包括：

利用所述大语言模型对所述输入信息进行关键词提取；以及

利用嵌入模型对提取到的关键词进行向量化处理以获得所述查询向量。

4.根据权利要求1所述的查询方法，其特征在于，将所述查询向量与向量数据库中的信息向量进行相似度匹配，以获得与所述查询向量匹配的信息向量包括：

计算所述查询向量与所述向量数据库中的各信息向量的相似度；以及

筛选出符合以下条件之一的信息向量作为所述匹配的信息向量：

相似度大于或等于第一阈值的信息向量，

相似度排序最大的K个信息向量。

5.根据权利要求1所述的查询方法，其特征在于，所述方法还包括：

基于预定义的合规性规则和策略对所述大语言模型进行微调。

6.一种针对金融信息的查询系统，其特征在于，包含：

存储器；

处理器；以及

存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序的运行使得根据权利要求1-5中任一项所述的查询方法被执行。

7.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括指令，所述指令在运行时执行根据权利要求1-5中任一项所述的查询方法。