CN117573857A - 一种基于大模型的智能文档实现方法、装置设备及介质 - Google Patents
一种基于大模型的智能文档实现方法、装置设备及介质 Download PDFInfo
- Publication number
- CN117573857A CN117573857A CN202410057565.7A CN202410057565A CN117573857A CN 117573857 A CN117573857 A CN 117573857A CN 202410057565 A CN202410057565 A CN 202410057565A CN 117573857 A CN117573857 A CN 117573857A
- Authority
- CN
- China
- Prior art keywords
- user
- model
- document
- documents
- target basic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000012549 training Methods 0.000 claims abstract description 41
- 238000003860 storage Methods 0.000 claims description 17
- 230000003993 interaction Effects 0.000 claims description 7
- 230000008014 freezing Effects 0.000 claims description 5
- 238000007710 freezing Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 4
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 239000000463 material Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及数据处理技术领域,尤其涉及一种基于大模型的智能文档实现方法、装置、设备及介质,基于用户需求选择目标基础模型,并利用用户的私有训练数据对所述目标基础模型进行微调,得到定制模型;基于构建的向量数据库对用户问题进行相似度匹配,找出与所述用户问题匹配的若干文档;通过提示词将所述若干文档作为上文下文并输入所述定制模型,得到所述用户问题对应的问题答复。一方面以大语言模型为基础的问答服务,使得准确率和查询效率更高;另一方面在其他实施例中,采用阶段性的微调训练和实时的向量数据库更新相结合,使得文档的更新能够实时的体现在对用户的答复中,让用户可以无缝的查询到文档最新进展。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种基于大模型的智能文档实现方法、装置设备及介质。
背景技术
客服系统是一种用于管理和处理客户服务请求的软件工具或平台。它为企业提供了一个集中化的、结构化的渠道来处理和响应客户的问题、疑问和投诉。客服系统通常包括以下主要功能模块:客户沟通渠道管理、知识库和自助服务、工单管理等。客服系统在提升客户满意度、提高客户忠诚度和提升企业形象方面发挥着关键作用。
文档库是指用于存储、组织和管理各种文档资料的集合或系统。它通常是一个电子化的文档管理系统,用于存储各种类型的文档,如文本文档、电子表格、演示文稿、图像、视频等,并提供便捷的检索、共享和管理功能,以便用户可以轻松地访问和利用这些文档。
现有技术中,客服系统和文档库往往是两个独立的系统。一方面,企业日常产生的海量文档,包括生产手册、运维手册、常见问题等,都是以文档形式独立保存于企业的内部数据库中,并且数量与日俱增;另一方面,客户通过客服系统能够得到的支持是有限的,能够得到的知识可能是陈旧脱节的。
发明内容
为克服现有技术中的不足,本申请提供一种基于大模型的智能文档实现方法、装置设备及介质,能够以大语言模型为用户查询相关性、准确度更高的最新文档进展。
第一方面,本申请提供一种基于大模型的智能文档实现方法,所述方法包括以下步骤:
基于用户需求选择目标基础模型,并利用用户的私有训练数据对所述目标基础模型进行微调,得到定制模型;
基于构建的向量数据库对用户问题进行相似度匹配,找出与所述用户问题匹配的若干文档;
通过提示词将所述若干文档作为上文下文并输入所述定制模型,得到所述用户问题对应的问题答复。
在一种可能的实施方式中,所述基于用户需求选择目标基础模型,并利用用户的私有训练数据对所述目标基础模型进行微调,得到定制模型,包括以下步骤:
根据用户的使用场景从多个基础模型中选择目标基础模型;
调用用户的文档库,并对所述文档库中的所有文档进行文档整理,得到待训练数据集;其中,所述文档整理包括内容整理和格式整理;
将所述训练数据集存储至私有存储设备,并根据所述目标基础模型的需求对所述待训练数据集进行标注;
利用标注后的所述待训练数据集对所述目标基础模型进行微调训练,生成定制模型,以利用所述定制模型对用户提供问答查询服务。
在一种可能的实施方式中,采用冻结指定参数的方式,利用标注后的所述待训练数据集对所述目标基础模型进行微调训练,生成定制模型。
在一种可能的实施方式中,所述方法还包括以下步骤:
设定模型更新周期;
按照设定的所述模型更新周期调用所述文档库,以重新得到所述待训练数据集,且利用重新得到的所述待训练数据集对所述目标基础模型进行微调,重新生成所述定制模型。
在一种可能的实施方式中,所基于构建的向量数据库对用户问题进行相似度匹配,找出与所述用户问题匹配的若干文档,包括以下步骤:
调用用户的文档库,并将所述文档库中的所有文档向量化,构建向量数据库;
接收用户问题,并基于构建的所述向量数据库计算每个文档与所述用户问题之间的相似度;其中,通过计算每个文档与所述用户问题之间的向量距离确定所述相似度;
按照所述相似度从高到底的顺序,找出与所述用户问题匹配的若干文档。
在一种可能的实施方式中,所述方法还包括以下步骤:
实时调用用户的文档库,以获取所述文档库的新增文档;
将所述新增文档向量化,以实时更新所述向量数据库。
在一种可能的实施方式中,所述通过提示词将所述若干文档作为上文下文并输入所述定制模型,得到所述用户问题对应的问题答复之后,还包括以下步骤:
审核所述问题答复是否符合法规,并将所述问题答复中不符合所述法规的内容过滤掉,得到合规答复内容;
将得到的所述合规答复内容传输至用户的人机交互界面进行显示。
第二方面,本申请提供一种基于大模型的智能文档实现装置,所述装置包括:
微调模块,用于基于用户需求选择目标基础模型,并利用用户的私有训练数据对所述目标基础模型进行微调,得到定制模型;
匹配模块,用于基于构建的向量数据库对用户问题进行相似度匹配,找出与所述用户问题匹配的若干文档;
答复模块,用于通过提示词将所述若干文档作为上文下文并输入所述定制模型,得到所述用户问题对应的问题答复。
第三方面,本申请提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如第一方面任一所述的基于大模型的智能文档实现方法的步骤。
第四方面,本申请提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如第一方面任一所述的基于大模型的智能文档实现方法的步骤。
本实施例提供的一种基于大模型的智能文档实现方法、装置设备及介质,基于用户需求选择目标基础模型,并利用用户的私有训练数据对所述目标基础模型进行微调,得到定制模型;基于构建的向量数据库对用户问题进行相似度匹配,找出与所述用户问题匹配的若干文档;通过提示词将所述若干文档作为上文下文并输入所述定制模型,得到所述用户问题对应的问题答复。一方面以大语言模型为基础的问答服务,使得准确率和查询效率更高;另一方面在其他实施例中,采用阶段性的微调训练和实时的向量数据库更新相结合,使得文档的更新能够实时的体现在对用户的答复中,让用户可以无缝的查询到文档最新进展。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请一实施例所述基于大模型的智能文档实现方法的流程图;
图2示出了本申请一实施例所述对所述目标基础模型进行微调得到定制模型的流程图;
图3示出了本申请一实施例所述基于大模型的智能文档实现装置的结构框图;
图4示出了示出了本申请一实施例所述电子设备的结构框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。 应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。 此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
由于客服系统和文档库这两个系统都是以数据孤岛形式独立存在,从而导致日益丰富完善的文档库并不能立刻提升客服系统的服务水平。现有技术中,为了更新客服系统,往往需要有专业技能的工程师,把特定的关键字和文档进行整理、关联等系列操作后,客户才有可能从客服系统中看见更新的文档,而这个操作往往存在不及时触发、耗时、高成本等诸多问题。鉴于此,本申请提供一种基于大模型的智能文档实现方法、装置设备及介质,能够能够以大语言模型为用户查询相关性、准确度更高的最新文档进展。
参见说明书附图1,本申请提供的一种基于大模型的智能文档实现方法,所述方法包括以下步骤:
S1、基于用户需求选择目标基础模型,并利用用户的私有训练数据对所述目标基础模型进行微调,得到定制模型;
S2、基于构建的向量数据库对用户问题进行相似度匹配,找出与所述用户问题匹配的若干文档;
S3、通过提示词将所述若干文档作为上文下文并输入所述定制模型,得到所述用户问题对应的问题答复。
在本申请实施例中,所述基于大模型的智能文档实现方法可以运行于终端设备或者是服务器;其中,终端设备可以为本地应用软件,当基于大模型的智能文档实现方法运行于服务器时,该基于大模型的智能文档实现方法则可以基于云交互系统来实现与执行,其中,云交互系统至少包括服务器和客户端设备(也即应用软件)。具体的,以应用于服务器为例,当所述基于大模型的智能文档实现方法运行于服务器时,能够以大语言模型为用户查询相关性、准确度更高的最新文档进展。
具体的,参加说明书附图2,在步骤S1中,所基于用户需求选择目标基础模型,并利用用户的私有训练数据对所述目标基础模型进行微调,得到定制模型,包括以下步骤:
S101、根据用户的使用场景从多个基础模型中选择目标基础模型;
S102、调用用户的文档库,并对所述文档库中的所有文档进行文档整理,得到待训练数据集;其中,所述文档整理包括内容整理和格式整理;
S103、将所述训练数据集存储至私有存储设备,并根据所述目标基础模型的需求对所述待训练数据集进行标注;
S104、利用标注后的所述待训练数据集对所述目标基础模型进行微调训练,生成定制模型,以利用所述定制模型对用户提供问答查询服务。
在步骤S101中,即对目标基础模型进行选择,这个阶段主要是根据用户使用场景来选择一个适当的基础模型,比如聊天对话的场景一般会选择通用的大语言模型,如果是图像生成,则会考虑某些text-to-image的模型;同时,目标基础模型的选择还需要考虑使用成本、模型License约束等方面信息。因此,用户能够根据具体应用选择合适的目标基础模型,本申请并不对此进行限制和固定,可以是商业的SaaS服务(比如OpenAI),也可以是开源模型,从而更加契合自身的部署形态和成本预算。
在步骤S102中,所述文档库通常具有以下特点和功能:文档存储与管理,提供安全可靠的文档存储和管理功能,用户可以将各种类型的文档上传到文档库中,并按照文件夹、标签、分类等方式进行组织和管理;文档检索与查找,提供快速的文档检索和查找功能,用户可以通过关键词、属性、标签等方式快速找到需要的文档,提高文档的可访问性和可用性;文档共享与协作,支持文档的共享和协作,多个用户可以共同访问和编辑文档,实现多人协作工作,促进团队协作和信息共享;版本控制与权限管理,提供文档版本控制和权限管理功能,确保文档的版本管理和安全性,防止文档的丢失和误操作,同时保护文档的安全和机密性;备份与恢复,提供文档备份和恢复功能,保障文档数据的安全和可靠性,防止文档的丢失和损坏,保证文档数据的持久性和可持续性。
从而文档库广泛应用于企业、组织、学校、政府等各种组织机构,用于管理和组织各类文档资料,提高工作效率,促进信息共享和协作,帮助用户更好地管理和利用文档资源。在本申请中,文档库具有两个作用,一个是为生成定制模型提供训练数据集,另一个是用于构建向量数据库。
其中,在为生成定制模型提供训练数据集时,需要对文档库中的文档进行整理,这个阶段主要包含内容整理和格式整理两部分。内容整理是为了去除一些不适宜做训练的内容,比如通用的背景介绍、引用附录等信息。格式整理主要是统一文档格式,从pdf、word和各种线上文档格式统一为文本格式,方便后期训练。
在步骤S103中,将所述训练数据集存储至私有存储设备,即保存在用户指定的存储设备中无需上传到任何第三方的公有云中,使得私有数据没有泄露风险,数据安全性更好。同时根据所选择的目标基础模型的需要进行必要的数据标注工作。
在步骤S104中,主要针对前面整理好的训练数据集选择的目标基础模型进行微调训练。所述微调训练(Fine-tuning)是一种机器学习技术,用于调整基础模型的参数,使其适应特定的定制化任务或领域。通常情况下,微调训练是建立在一个已经经过大规模数据集(通常是通用数据集)进行预训练的模型基础上的,使其能够更好地适应特定领域的任务或数据。
在一实施例中,可以采用冻结指定参数的方式,利用标注后的所述待训练数据集对所述目标基础模型进行微调训练,生成定制模型。具体的,先对所述目标基础模型的整体框架进行了解,确定要微调的层数,例如微调的层数整个网络框架的最后的全连接层,然后创建一个新神经网络模型,该新神经网络模型复制了目标基础模型除了最后的全连接层外的所有模型设计及其参数,并添加新的全连接层;最后利用所述待训练数据集只对添加的新的全连接层的参数进行训练(其余层冻结),进而得到适配于利用当前文档库对用户提供问答查询服务的定制模型。
在步骤S2中,即利用所述文档库构建向量数据库。所述向量数据库是一种专门用于存储和管理向量数据的数据库系统。向量数据通常指在数学和计算机科学中的向量表示,它包括数学上的向量概念以及计算机科学中的向量数据结构。向量数据库旨在提供高效的存储、检索和处理向量数据的能力,适用于多种应用场景,如机器学习、数据分析、模式识别等。在本申请中,所述向量数据库主要用于对文档和用户问题进行相似度匹配。
具体的,把所述文档库中的所有文档都预先变成一个唯一(unique)的向量,进行保存,以形成向量数据库。例如,采用向量空间模型VSM得到每个文档的向量表示。当用户进行查询时,基于构建的所述向量数据库计算每个文档与所述用户问题之间的相似度,进而找出和用户问题相似度最高的前几个文档,用以后序输入定制模型。
在一实施例中,通过计算每个文档与所述用户问题之间的向量距离来确定所述相似度,而所述向量距离的计算公式应为本领域技术人员所熟知的技术手段,在此不做赘述。其中,可以设定相似度阈值,将高于该相似度阈值的所有文档提取出来,用以后序输入定制模型;或者可以设定文档提取个数,例如,按照相似度从高到低的顺序找出五个文档,用以后序输入定制模型。
需要说明的是,本申请还考虑到文档库的更新是时时发生的,这里就需要对所述文档库的改动进行监控,并且在有文档更新发生时,触发向量数据库进行实时更新,从而确保最新的文档能够反映在对用户的答复中。
在步骤S3中,即本申请为了优化定制模型的使用效率和性能,采用提示词工程。在大模型使用过程中,所述提示词工程指的是针对大型机器学习模型的使用优化策略。随着深度学习和自然语言处理等领域的快速发展,大型模型的应用日益普遍,而大型模型的使用需要考虑到其复杂性和资源消耗,因此需要一些提示词工程的策略来优化大型模型的使用效率和性能。在本申请中,为了帮助大模型更好的了解问答中的上下文,把查询到的相似度最高的若干文档作为上下文,通过提示词输入大模型,以得到更高质量的问题答复。
进一步的,在本申请中在通过定制模型输出用户问题的相应问题答复之后,还需要通过审核机制,审核所述问题答复中的内容是否符合法规,并将所述问题答复中不符合所述法规的内容过滤掉,得到合规答复内容;最终才将得到的所述合规答复内容传输至用户的人机交互界面进行显示。
传统的文档查询是根据用户输入的关键词在文档中进行匹配,最终呈现的是按照相关度排序的所有文档。用户需要依次查看若干文档,才有可能得到想要的答案。这个过程往往需要大量的时间,所以传统文档查询技术相比本申请以大语言模型为基础的问答服务,无论在查询效率还是人机交互体验方面都是有欠缺的。并且本申请采用的是一个知晓用户海量文档的定制模型,和通用的基础模型相比,这个定制模型更加知晓用户特有的知识上下文,能够在问答过程中基于这个上下文进行回复,从而=有针对性的给出答案,答案的相关性、准确度更高,从而带给用户更好的使用体验。
另外,在本申请中,还需要定期(例如半年一次)更新定制模型。从而采用阶段性的微调训练和实时的向量数据库更新相结合,使得最新的文档变化能够通过提示词实时提供给定制模型作为问题上下文,使得文档的更新能够实时的体现在对用户的答复中,让用户可以无缝的查询到文档最新进展。
可见,本申请提出的基于大模型的智能文档实现方法,让用户选择基础模型,并针对用户的私有训练数据进行微调训练来得到定制模型,以向量数据库的匹配作为不同文档和问题之间相关性判断的标准,通过提示词把相关性高的文档作为问答的上下文材料,提供给定制模型,从而得到更加贴切的答案,显著提高海量文档中的查询效率,并且用户使用体验更好。
基于同一发明构思,本申请实施例中还提供了一种基于大模型的智能文档实现装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述一种基于大模型的智能文档实现方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
如说明书附图3所示,本申请还提供了一种基于大模型的智能文档实现装置,所述装置包括:
微调模块301,用于基于用户需求选择目标基础模型,并利用用户的私有训练数据对所述目标基础模型进行微调,得到定制模型;
匹配模块302,用于基于构建的向量数据库对用户问题进行相似度匹配,找出与所述用户问题匹配的若干文档;
答复模块303,用于通过提示词将所述若干文档作为上文下文并输入所述定制模型,得到所述用户问题对应的问题答复。
在一些实施方式中,所述微调模块301基于用户需求选择目标基础模型,并利用用户的私有训练数据对所述目标基础模型进行微调,得到定制模型,包括:根据用户的使用场景从多个基础模型中选择目标基础模型;调用用户的文档库,并对所述文档库中的所有文档进行文档整理,得到待训练数据集;其中,所述文档整理包括内容整理和格式整理;将所述训练数据集存储至私有存储设备,并根据所述目标基础模型的需求对所述待训练数据集进行标注;利用标注后的所述待训练数据集对所述目标基础模型进行微调训练,生成定制模型,以利用所述定制模型对用户提供问答查询服务。
在一些实施方式中,所述微调模块301采用冻结指定参数的方式,利用标注后的所述待训练数据集对所述目标基础模型进行微调训练,生成定制模型。
在一些实施方式中,所述装置还包括:
模型更新模块,用于设定模型更新周期;按照设定的所述模型周期调用所述文档库,以重新得到所述待训练数据集,且利用重新得到的所述待训练数据集对所述目标基础模型进行微调,重新生成所述定制模型。
在一些实施方式中,所述匹配模块302基于构建的向量数据库对用户问题进行相似度匹配,找出与所述用户问题匹配的若干文档,包括:调用用户的文档库,并将所述文档库中的所有文档向量化,构建向量数据库;接收用户问题,并基于构建的所述向量数据库计算每个文档与所述用户问题之间的相似度;其中,通过计算每个文档与所述用户问题之间的向量距离确定所述相似度;按照所述相似度从高到底的顺序,找出与所述用户问题匹配的若干文档。
在一些实施方式中,所述装置还包括:
向量数据库更新模块,用于实时调用用户的文档库,以获取所述文档库的新增文档;将所述新增文档向量化,以实时更新所述向量数据库。
在一些实施方式中,所述答复模块303通过提示词将所述若干文档作为上文下文并输入所述定制模型,得到所述用户问题对应的问题答复之后,还包括:审核所述问题答复是否符合法规,并将所述问题答复中不符合所述法规的内容过滤掉,得到合规答复内容;将得到的所述合规答复内容传输至用户的人机交互界面进行显示。
本申请所提供的一种基于大模型的智能文档实现装置,通过微调模块基于用户需求选择目标基础模型,并利用用户的私有训练数据对所述目标基础模型进行微调,得到定制模型;通过匹配模块基于构建的向量数据库对用户问题进行相似度匹配,找出与所述用户问题匹配的若干文档;通过答复模块通过提示词将所述若干文档作为上文下文并输入所述定制模型,得到所述用户问题对应的问题答复。一方面以大语言模型为基础的问答服务,使得准确率和查询效率更高;另一方面在其他实施例中,采用阶段性的微调训练和实时的向量数据库更新相结合,使得文档的更新能够实时的体现在对用户的答复中,让用户可以无缝的查询到文档最新进展。
基于本发明的同一构思,说明书附图4所示,本申请实施例提供的一种电子设备400的结构,该电子设备400包括:至少一个处理器401,至少一个网络接口404或者其他用户接口403,存储器405,至少一个通信总线402。通信总线402用于实现这些组件之间的连接通信。该电子设备400可选的包含用户接口403,包括显示器(例如,触摸屏、LCD、CRT、全息成像(Holographic)或者投影(Projector)等),键盘或者点击设备(例如,鼠标,轨迹球(trackball),触感板或者触摸屏等)。
存储器405可以包括只读存储器和随机存取存储器,并向处理器401提供指令和数据。存储器405的一部分还可以包括非易失性随机存取存储器(NVRAM)。
在一些实施方式中,存储器405存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:
操作系统4051,包含各种系统程序,用于实现各种基础业务以及处理基于硬件的任务;
应用程序模块4052,包含各种应用程序,例如桌面(launcher)、媒体播放器(MediaPlayer)、浏览器(Browser)等,用于实现各种应用业务。
在本申请实施例中,通过调用存储器405存储的程序或指令,处理器401用于执行如一种基于大模型的智能文档实现方法中的步骤,能够以大语言模型为用户查询相关性、准确度更高的最新文档进展。
本申请还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如基于大模型的智能文档实现方法中的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述基于大模型的智能文档实现方法。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于大模型的智能文档实现方法,其特征在于,所述方法包括以下步骤:
基于用户需求选择目标基础模型,并利用用户的私有训练数据对所述目标基础模型进行微调,得到定制模型;
基于构建的向量数据库对用户问题进行相似度匹配,找出与所述用户问题匹配的若干文档;
通过提示词将所述若干文档作为上文下文并输入所述定制模型,得到所述用户问题对应的问题答复。
2.根据权利要求1所述一种基于大模型的智能文档实现方法,其特征在于,所述基于用户需求选择目标基础模型,并利用用户的私有训练数据对所述目标基础模型进行微调,得到定制模型,包括以下步骤:
根据用户的使用场景从多个基础模型中选择目标基础模型;
调用用户的文档库,并对所述文档库中的所有文档进行文档整理,得到待训练数据集;其中,所述文档整理包括内容整理和格式整理;
将所述训练数据集存储至私有存储设备,并根据所述目标基础模型的需求对所述待训练数据集进行标注;
利用标注后的所述待训练数据集对所述目标基础模型进行微调训练,生成定制模型,以利用所述定制模型对用户提供问答查询服务。
3.根据权利要求2所述一种基于大模型的智能文档实现方法,其特征在于,其中,采用冻结指定参数的方式,利用标注后的所述待训练数据集对所述目标基础模型进行微调训练,生成定制模型。
4.根据权利要求3所述一种基于大模型的智能文档实现方法,其特征在于,所述方法还包括以下步骤:
设定模型更新周期;
按照设定的所述模型更新周期调用所述文档库,以重新得到所述待训练数据集,且利用重新得到的所述待训练数据集对所述目标基础模型进行微调,重新生成所述定制模型。
5.根据权利要求4所述一种基于大模型的智能文档实现方法,其特征在于,所述基于构建的向量数据库对用户问题进行相似度匹配,找出与所述用户问题匹配的若干文档,包括以下步骤:
调用用户的文档库,并将所述文档库中的所有文档向量化,构建向量数据库;
接收用户问题,并基于构建的所述向量数据库计算每个文档与所述用户问题之间的相似度;其中,通过计算每个文档与所述用户问题之间的向量距离确定所述相似度;
按照所述相似度从高到底的顺序,找出与所述用户问题匹配的若干文档。
6.根据权利要求5所述一种基于大模型的智能文档实现方法,其特征在于,所述方法还包括以下步骤:
实时调用用户的文档库,以获取所述文档库的新增文档;
将所述新增文档向量化,以实时更新所述向量数据库。
7.根据权利要求6所述一种基于大模型的智能文档实现方法,其特征在于,所述通过提示词将所述若干文档作为上文下文并输入所述定制模型,得到所述用户问题对应的问题答复之后,还包括以下步骤:
审核所述问题答复是否符合法规,并将所述问题答复中不符合所述法规的内容过滤掉,得到合规答复内容;
将得到的所述合规答复内容传输至用户的人机交互界面进行显示。
8.一种基于大模型的智能文档实现装置,其特征在于,所述装置包括:
微调模块,用于基于用户需求选择目标基础模型,并利用用户的私有训练数据对所述目标基础模型进行微调,得到定制模型;
匹配模块,用于基于构建的向量数据库对用户问题进行相似度匹配,找出与所述用户问题匹配的若干文档;
答复模块,用于通过提示词将所述若干文档作为上文下文并输入所述定制模型,得到所述用户问题对应的问题答复。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至7任一所述的基于大模型的智能文档实现方法的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至7任一所述的基于大模型的智能文档实现方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410057565.7A CN117573857A (zh) | 2024-01-16 | 2024-01-16 | 一种基于大模型的智能文档实现方法、装置设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410057565.7A CN117573857A (zh) | 2024-01-16 | 2024-01-16 | 一种基于大模型的智能文档实现方法、装置设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117573857A true CN117573857A (zh) | 2024-02-20 |
Family
ID=89895903
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410057565.7A Pending CN117573857A (zh) | 2024-01-16 | 2024-01-16 | 一种基于大模型的智能文档实现方法、装置设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117573857A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220358127A1 (en) * | 2021-05-04 | 2022-11-10 | Bank Of America Corporation | Multicomputer System with Machine Learning Engine for Query Optimization and Dynamic Data Reorganization |
CN115906918A (zh) * | 2022-11-28 | 2023-04-04 | 北京百度网讯科技有限公司 | 预训练模型的微调方法及其装置 |
CN117056531A (zh) * | 2023-08-29 | 2023-11-14 | 上海大学 | 领域知识驱动的大语言模型精调方法、系统、设备及存储介质 |
CN117235226A (zh) * | 2023-09-21 | 2023-12-15 | 支付宝(杭州)信息技术有限公司 | 一种基于大语言模型的问题应答方法及装置 |
CN117290492A (zh) * | 2023-11-27 | 2023-12-26 | 深圳市灵智数字科技有限公司 | 知识库问答方法、装置、电子设备及存储介质 |
-
2024
- 2024-01-16 CN CN202410057565.7A patent/CN117573857A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220358127A1 (en) * | 2021-05-04 | 2022-11-10 | Bank Of America Corporation | Multicomputer System with Machine Learning Engine for Query Optimization and Dynamic Data Reorganization |
CN115906918A (zh) * | 2022-11-28 | 2023-04-04 | 北京百度网讯科技有限公司 | 预训练模型的微调方法及其装置 |
CN117056531A (zh) * | 2023-08-29 | 2023-11-14 | 上海大学 | 领域知识驱动的大语言模型精调方法、系统、设备及存储介质 |
CN117235226A (zh) * | 2023-09-21 | 2023-12-15 | 支付宝(杭州)信息技术有限公司 | 一种基于大语言模型的问题应答方法及装置 |
CN117290492A (zh) * | 2023-11-27 | 2023-12-26 | 深圳市灵智数字科技有限公司 | 知识库问答方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107533670B (zh) | 数字实体的预测热门 | |
US7440978B2 (en) | Method and system for synchronizing multiple user revisions, updating other strategy maps in the databases that are associated with the balanced scorecard | |
US7672908B2 (en) | Intent-based information processing and updates in association with a service agent | |
US11977551B2 (en) | Digital paper based interaction to system data | |
US10917587B2 (en) | Importing and presenting data | |
WO2019062010A1 (zh) | 语义识别方法、电子装置及计算机可读存储介质 | |
US10613841B2 (en) | Task UI layout representing semantical relations | |
US11663255B2 (en) | Automatic collaboration between distinct responsive devices | |
US11580096B2 (en) | System for uploading information into a metadata repository | |
US12008047B2 (en) | Providing an object-based response to a natural language query | |
US20180157738A1 (en) | Informational retrieval | |
GB2603609A (en) | Ranking datasets based on data attributes | |
CN117520514A (zh) | 一种问答任务处理方法、装置、设备及可读存储介质 | |
US11361032B2 (en) | Computer driven question identification and understanding within a commercial tender document for automated bid processing for rapid bid submission and win rate enhancement | |
JP6797382B1 (ja) | 質問回答表示サーバ、質問回答表示方法及び質問回答表示プログラム | |
CN117236624A (zh) | 一种基于动态图的Issue修复者推荐方法与装置 | |
US10671601B2 (en) | Platform for consulting solution | |
Soriano | Maximizing benefits from IT project management: from requirements to value delivery | |
Sterman et al. | Citations as data: Harvesting the scholarly record of your university to enrich institutional knowledge and support research | |
CN117573857A (zh) | 一种基于大模型的智能文档实现方法、装置设备及介质 | |
CN110062112A (zh) | 数据处理方法、装置、设备及计算机可读存储介质 | |
CN114237588A (zh) | 一种代码仓库选择方法、装置、设备及存储介质 | |
JP2015052242A (ja) | ブランクキー検索システム | |
Blake et al. | A spatial collaboration: Building a multi-institution geospatial data discovery portal | |
CN117112809B (zh) | 一种知识追踪方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |