CN117725192A - 基于langchain的专有工业品信息交互调用方法 - Google Patents
基于langchain的专有工业品信息交互调用方法 Download PDFInfo
- Publication number
- CN117725192A CN117725192A CN202410180183.3A CN202410180183A CN117725192A CN 117725192 A CN117725192 A CN 117725192A CN 202410180183 A CN202410180183 A CN 202410180183A CN 117725192 A CN117725192 A CN 117725192A
- Authority
- CN
- China
- Prior art keywords
- industrial
- information
- proprietary
- retrieval
- knowledge base
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000003993 interaction Effects 0.000 title claims abstract description 26
- 230000007246 mechanism Effects 0.000 claims abstract description 35
- 238000005516 engineering process Methods 0.000 claims abstract description 32
- 230000002452 interceptive effect Effects 0.000 claims abstract description 27
- 230000010354 integration Effects 0.000 claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 20
- 238000001914 filtration Methods 0.000 claims abstract description 11
- 230000015654 memory Effects 0.000 claims description 45
- 238000003860 storage Methods 0.000 claims description 23
- 238000004458 analytical method Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 13
- 238000002372 labelling Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 6
- 238000009826 distribution Methods 0.000 claims description 5
- 230000004927 fusion Effects 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 5
- 230000001502 supplementing effect Effects 0.000 claims description 5
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 125000004122 cyclic group Chemical group 0.000 claims description 4
- 238000003058 natural language processing Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 11
- 230000000694 effects Effects 0.000 abstract description 8
- 230000006870 function Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000009960 carding Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000002305 electric material Substances 0.000 description 1
- 239000012776 electronic material Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于langchain的专有工业品信息交互调用方法,涉及数据处理技术领域,所述方法包括:利用langchain将专有工业品信息数据库按照专有工业品分类体系进行去中心化整合,获取专有工业品知识库,再利用langchain问答技术对其进行训练交互集成,构建知识库问答模型,进而以此对检索请求信息进行分析检索,生成专有工业品信息检索结果,再基于知识库检索机制对专有工业品信息检索结果进行滤过调用,获取专有工业品信息调用结果反馈至目标用户。达到利用LangChain问答技术实现专有工业品信息智能化交互调用,提高知识检索准确性和交互调用效率,进而确保工业品知识检索调用覆盖全面性的技术效果。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及基于langchain的专有工业品信息交互调用方法。
背景技术
随着工业互联网的快速发展,工业品的种类和功能也越来越丰富,同时,工业品的研发、生产和应用过程中涉及到的专业知识也越来越广泛和深入。专有工业品知识的检索需求也随之日益增长,为了更好地了解和使用工业品,用户需要快速、准确地检索调用到相关的专有工业品信息。然而,现有工业品信息交互调用速度慢,且检索准确性较低、检索信息调用覆盖不全。
发明内容
本申请通过提供基于langchain的专有工业品信息交互调用方法,解决了现有技术工业品信息交互调用速度慢,且检索准确性较低、检索信息调用覆盖不全的技术问题,达到利用LangChain问答技术实现专有工业品信息智能化交互调用,提高知识检索准确性和交互调用效率,进而确保工业品知识检索调用覆盖全面性的技术效果。
鉴于上述问题,本发明提供了基于langchain的专有工业品信息交互调用方法。
第一方面,本申请提供了基于langchain的专有工业品信息交互调用方法,所述方法包括:根据专有工业品应用特点信息,搭建专有工业品分类体系;获取专有工业品信息数据库,利用langchain将所述专有工业品信息数据库按照所述专有工业品分类体系进行去中心化整合,获取专有工业品知识库;利用langchain问答技术对所述专有工业品知识库进行训练交互集成,构建知识库问答模型;对所述专有工业品知识库中的各工业品信息进行编码标记,建立知识库检索机制;获取目标用户的检索请求信息,基于所述知识库问答模型对所述检索请求信息进行语义分析检索,生成专有工业品信息检索结果;基于所述知识库检索机制对所述专有工业品信息检索结果进行滤过调用,获取专有工业品信息调用结果反馈至所述目标用户。
另一方面,本申请还提供了基于langchain的专有工业品信息交互调用系统,所述系统包括:工业品分类体系搭建模块,用于根据专有工业品应用特点信息,搭建专有工业品分类体系;工业品知识库获取模块,用于获取专有工业品信息数据库,利用langchain将所述专有工业品信息数据库按照所述专有工业品分类体系进行去中心化整合,获取专有工业品知识库;知识库问答模型构建模块,用于利用langchain问答技术对所述专有工业品知识库进行训练交互集成,构建知识库问答模型;知识库检索机制建立模块,用于对所述专有工业品知识库中的各工业品信息进行编码标记,建立知识库检索机制;语义分析检索模块,用于获取目标用户的检索请求信息,基于所述知识库问答模型对所述检索请求信息进行语义分析检索,生成专有工业品信息检索结果;信息调用结果获取模块,用于基于所述知识库检索机制对所述专有工业品信息检索结果进行滤过调用,获取专有工业品信息调用结果反馈至所述目标用户。
第三方面,本申请提供了一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,所述计算机程序被所述处理器执行时实现上述任意一项所述方法中的步骤。
第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述方法中的步骤。
本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
由于采用了根据专有工业品应用特点信息,搭建专有工业品分类体系,再利用langchain将专有工业品信息数据库按照所述专有工业品分类体系进行去中心化整合,获取专有工业品知识库;利用langchain问答技术对所述专有工业品知识库进行训练交互集成,构建知识库问答模型,同时对所述专有工业品知识库进行编码标记,建立知识库检索机制;基于所述知识库问答模型对检索请求信息进行语义分析检索,生成专有工业品信息检索结果,再基于所述知识库检索机制对所述专有工业品信息检索结果进行滤过调用,获取专有工业品信息调用结果反馈至目标用户的技术方案。进而达到利用LangChain问答技术实现专有工业品信息智能化交互调用,提高知识检索准确性和交互调用效率,进而确保工业品知识检索调用覆盖全面性的技术效果。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
图1为本申请基于langchain的专有工业品信息交互调用方法的流程示意图;
图2为本申请基于langchain的专有工业品信息交互调用方法中获取专有工业品知识库的流程示意图;
图3为本申请基于langchain的专有工业品信息交互调用系统的结构示意图;
图4为本申请示例性电子设备的结构示意图。
附图标记说明:工业品分类体系搭建模块11,工业品知识库获取模块12,知识库问答模型构建模块13,知识库检索机制建立模块14,语义分析检索模块15,信息调用结果获取模块16,总线1110,处理器1120,收发器1130,总线接口1140,存储器1150,操作系统1151,应用程序1152和用户接口1160。
具体实施方式
在本申请的描述中,所属技术领域的技术人员应当知道,本申请可以实现为方法、装置、电子设备及计算机可读存储介质。因此,本申请可以具体实现为以下形式:完全的硬件、完全的软件(包括固件、驻留软件、微代码等)、硬件和软件结合的形式。此外,在一些实施例中,本申请还可以实现为在一个或多个计算机可读存储介质中的计算机程序产品的形式,该计算机可读存储介质中包含计算机程序代码。
上述计算机可读存储介质可以采用一个或多个计算机可读存储介质的任意组合。计算机可读存储介质包括:电、磁、光、电磁、红外或半导体的系统、装置或器件,或者以上任意的组合。计算机可读存储介质更具体的例子包括:便携式计算机磁盘、硬盘、随机存取存储器、只读存储器、可擦除可编程只读存储器、闪存、光纤、光盘只读存储器、光存储器件、磁存储器件或以上任意组合。在本申请中,计算机可读存储介质可以是任意包含或存储程序的有形介质,该程序可以被指令执行系统、装置、器件使用或与其结合使用。
本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律的相关规定。
本申请通过流程图和/或方框图描述所提供的方法、装置、电子设备。
应当理解,流程图和/或方框图的每个方框以及流程图和/或方框图中各方框的组合,都可以由计算机可读程序指令实现。这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而生产出一种机器,这些计算机可读程序指令通过计算机或其他可编程数据处理装置执行,产生了实现流程图和/或方框图中的方框规定的功能/操作的装置。
也可以将这些计算机可读程序指令存储在能使得计算机或其他可编程数据处理装置以特定方式工作的计算机可读存储介质中。这样,存储在计算机可读存储介质中的指令就产生出一个包括实现流程图和/或方框图中的方框规定的功能/操作的指令装置产品。
也可以将计算机可读程序指令加载到计算机、其他可编程数据处理装置或其他设备上,使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其他可编程数据处理装置上执行的指令能够提供实现流程图和/或方框图中的方框规定的功能/操作的过程。
下面结合本申请中的附图对本申请进行描述。
实施例1
如图1所示,本申请提供了基于langchain的专有工业品信息交互调用方法,所述方法包括:
步骤S1:根据专有工业品应用特点信息,搭建专有工业品分类体系;
具体的,为实现专有工业品信息的智能化交互调用,首先根据专有工业品应用特点信息,搭建专有工业品分类体系,其中,所述专有工业品应用特点信息为工业品的应用需求特点信息,包括产品规格、性能参数、使用方法等,以此设计工业品知识库的分类结构和内容,所述专有工业品分类体系为工业品知识库的分类结构内容,包括产品信息、技术参数、使用说明、性能参数等,与所述专有工业品应用特点信息相对应,以确保后续工业品知识库构建的内容完整合理性。
步骤S2:获取专有工业品信息数据库,利用langchain将所述专有工业品信息数据库按照所述专有工业品分类体系进行去中心化整合,获取专有工业品知识库;
如图2所示,进一步而言,所述获取专有工业品知识库,本申请步骤还包括:
根据所述专有工业品分类体系,获取工业品分类要素信息,所述工业品分类要素信息包括涉及领域、应用分布、工业技术、保密级别;
基于所述工业品分类要素信息和所述专有工业品信息数据库,构建专用工业品知识图谱;
通过所述专用工业品知识图谱对所述专有工业品信息数据库进行梳理整合,获取专有工业品知识数据库;
利用langchain开发知识库智能合约,基于所述知识库智能合约对所述专有工业品知识数据库进行去中心化存储,得到所述专有工业品知识库。
进一步而言,所述构建专用工业品知识图谱,本申请步骤还包括:
对所述工业品分类要素信息进行知识属性提取,获取工业品要素知识属性集合;
根据所述工业品要素知识属性集合,确定工业品知识属性实体;
基于所述工业品知识属性实体对所述专有工业品信息数据库进行实体内容融合,获得工业品知识属性实体内容;
将所述工业品知识属性实体内容分别作为知识节点,构建所述专用工业品知识图谱。
具体的,通过大数据技术全面搜索挖掘获取专有工业品信息数据库,所述专有工业品信息数据库为各类型专有工业品的设计应用数据信息,包括专有技术、工业设计、专利等与工业品相关的知识产权信息。利用langchain将所述专有工业品信息数据库按照所述专有工业品分类体系进行去中心化整合,其中,LangChain是一种基于区块链技术的语言链项目,可将不同语言的查询和回答映射到知识图谱的语义表示中,从而更好地理解和回答跨语言的用户查询,以提高信息交互的效率和安全性。首先根据所述专有工业品分类体系,获取工业品分类要素信息,所述工业品分类要素信息为工业品知识信息的分类指标信息,包括涉及领域,即应用技术领域;应用分布,即工业品应用用途和生产地域分布;工业技术,即设计制造等技术参数和技术水平;保密级别,即该工业品的保密程度。
基于所述工业品分类要素信息和所述专有工业品信息数据库进行知识图谱构建,首先对所述工业品分类要素信息进行知识属性提取,即可通过专有工业品应用标准对各分类要素的具体分类属性进行关联提取,示例性的,行业领域分类要素的知识属性包括机械制造、电子电气、化工材料等;保密级别分类要素的知识属性包括绝密、机密、秘密等,以此获取工业品要素知识属性集合,所述工业品要素知识属性集合为各分类要素的具体分类知识属性信息。再将所述工业品要素知识属性集合中的每个知识属性,都确定为该工业品分类要素信息下的一个工业品知识属性实体。基于所述工业品知识属性实体对所述专有工业品信息数据库进行实体内容融合,即依据所述专有工业品信息数据库对所述工业品知识属性实体的具体知识内容进行填充,示例性的,机械制造知识属性实体下的知识内容包括机械设备、工装夹具、刀具、量具、模具等,以此获得相应的工业品知识属性实体内容,所述工业品知识属性实体内容为各工业品知识属性实体下的具体工业品内容信息。进而将所述工业品知识属性实体内容中的每个实体内容分别作为知识节点,构建专用工业品知识图谱,所述专用工业品知识图谱用于提供全面准确的专有工业品知识信息,进而提高检索效率。
通过所述专用工业品知识图谱对所述专有工业品信息数据库进行梳理整合,即依据所述专用工业品知识图谱对所述专有工业品信息数据库中的各专有工业品信息进行知识体系分类,并通过分类结果对各专有工业品进行知识标识,以此获取标识后的专有工业品知识数据库。再利用langchain的智能合约功能,开发相应的知识库智能合约,用于实现知识库的去中心化存储和管理,智能合约可包括数据存储、访问控制等模块,以确保知识库的安全性和可靠性。基于所述知识库智能合约对所述专有工业品知识数据库进行去中心化存储,利用智能合约进行工业品信息存储和管理,得到相应的专有工业品知识库,以保证工业品知识信息完整性和可追溯性。
步骤S3:利用langchain问答技术对所述专有工业品知识库进行训练交互集成,构建知识库问答模型;
进一步而言,所述构建知识库问答模型,本申请步骤还包括:
基于所述专有工业品知识库进行问答数据采集、预处理标注,获取工业品问答数据分类标注信息;
利用自然语言处理技术对所述工业品问答数据分类标注信息进行多维语义特征提取,获得工业品语义特征集合;
利用循环神经网络结构对所述工业品问答数据分类标注信息和所述工业品语义特征集合进行问答模型训练,生成工业品问答模型;
基于langchain问答技术对所述工业品问答模型进行交互集成优化,构建所述知识库问答模型。
具体的,利用langchain问答技术对所述专有工业品知识库进行训练交互集成,首先基于所述专有工业品知识库进行大量关联问答数据采集扩充,并对采集问答数据进行预处理,包括分词、去除停用词、标准化等,同时对问答数据进行类型标注和分类,以供后续训练使用,获取相应的工业品问答数据分类标注信息。利用自然语言处理技术对所述工业品问答数据分类标注信息进行多维语义特征提取,如TF-IDF、Word2Vec等从问答数据中提取多维关联语义特征,获得各问答数据相应的工业品语义特征集合,所述工业品语义特征集合包括关键词、句法结构、语义信息等。
利用循环神经网络结构对所述工业品问答数据分类标注信息和所述工业品语义特征集合进行问答模型训练,将所述工业品问答数据分类标注信息和所述工业品语义特征集合作为模型训练样本数据进行标识训练,以对问题和答案进行深度的语义理解和生成。并对初始训练的问答模型进行评估,比较其与真实答案的准确率,再通过反向传播算法进行模型参数训练和优化,以最小化损失函数,进一步提高问答模型的性能和准确性,通过对模型不断的迭代和优化,生成准确率达标的工业品问答模型,用于理解和回答用户工业品检索查询。
进而基于langchain问答技术对所述工业品问答模型进行交互集成优化,在基于LangChain的问答系统中,训练问答模型需要大量的多语言数据,这些样本数据可通过LangChain的智能合约功能进行存储和管理。通过集合LangChain问答技术,可以方便地获取不同语言的问答数据,从而训练出更加准确、全面的问答模型,即所述知识库问答模型,使得问答模型能够处理跨语言的查询和回答。通过将LangChain问答技术与知识图谱结合,可更好的问答跨语言的用户检索查询和语义关系理解,从而提供更准确、全面的交互检索答案。
步骤S4:对所述专有工业品知识库中的各工业品信息进行编码标记,建立知识库检索机制;
进一步而言,所述建立知识库检索机制,本申请步骤还包括:
根据所述专用工业品知识图谱,获得工业品编码规则,所述工业品编码规则包括工业品层级编码信息和工业品标识编码规则;
按照所述工业品编码规则对所述专有工业品知识库中的各工业品信息分别进行编码,获得工业品索引编码信息集合;
基于工业品访问细粒度权限信息对所述工业品索引编码信息集合进行标记,获得工业品检索权限规则;
将所述工业品索引编码信息集合和所述工业品检索权限规则进行检索嵌入合并,建立所述知识库检索机制。
具体的,为提高专有工业品信息的检索调用效率,对所述专有工业品知识库中的各工业品信息进行编码标记。首先根据所述专用工业品知识图谱,设置获得工业品编码规则,所述工业品编码规则为工业品知识信息编码依据,包括工业品层级编码信息,即按照专用工业品知识图谱的分类节点层级由大到小依次编码;工业品标识编码规则,即各知识节点层级的编码数字、字母等标识,可自行设置。按照所述工业品编码规则对所述专有工业品知识库中的各工业品信息分别进行编码,获得工业品索引编码信息集合,所述工业品索引编码信息集合为各专有工业品知识的编码标识信息,以作为信息检索依据,实现信息快速编码检索,进而提高检索调用效率。
通过专有工业品访问权限数据库获取工业品访问细粒度权限信息,可根据工业品保密需求权限设置,所述工业品访问细粒度权限信息为各专有工业品的用户访问查看权限分配信息。基于工业品访问细粒度权限信息对所述工业品索引编码信息集合进行标记,即对各类型访问用户的可查询访问工业品编码进行标识,获得对应的工业品检索权限规则,所述工业品检索权限规则为专有工业品访问检索结果需依据用户访问权限进行筛选设置,以确保专有工业品访问检索保密性和安全性。将所述工业品索引编码信息集合和所述工业品检索权限规则进行检索机制嵌入合并,建立知识库检索机制,所述知识库检索机制为专有工业品知识信息的检索依据规则,包括索引编码规则和检索权限规则。实现专有工业品信息智能化交互调用,提高知识检索准确性和交互调用效率,同时确保工业品知识信息检索安全性。
步骤S5:获取目标用户的检索请求信息,基于所述知识库问答模型对所述检索请求信息进行语义分析检索,生成专有工业品信息检索结果;
具体的,当用户进行专有工业品检索时,获取目标用户的检索请求信息,所述检索请求信息为该用户的工业品检索问题。基于所述知识库问答模型对所述检索请求信息进行语义分析检索,生成对应的专有工业品信息检索结果,所述专有工业品信息检索结果为与检索请求信息相匹配的所有工业品推荐答案信息,提高工业品信息检索全面性。
步骤S6:基于所述知识库检索机制对所述专有工业品信息检索结果进行滤过调用,获取专有工业品信息调用结果反馈至所述目标用户。
进一步而言,所述获取专有工业品信息调用结果,本申请步骤还包括:
基于工业品索引编码信息集合对所述专有工业品信息检索结果进行序列排布,获得专有工业品序列检索信息;
通过所述工业品检索权限规则对所述工业品索引编码信息集合进行干扰项分析,获得工业品干扰编码信息集合;
基于所述工业品干扰编码信息集合与所述专有工业品序列检索信息进行映射,确定工业品屏蔽检索信息;
依据所述工业品屏蔽检索信息对所述专有工业品信息检索结果进行屏蔽调用,确定所述专有工业品信息调用结果。
进一步而言,本申请步骤还包括:
当检索调用失败时,则发出检索词匹配指令;
基于所述检索词匹配指令将所述检索请求信息与所述知识库问答模型进行相似度嵌合匹配,构建检索词语义关联策略;
基于所述检索词语义关联策略对所述知识库检索机制进行检索规则补充。
具体的,为确保工业品信息检索保密性,基于所述知识库检索机制对所述专有工业品信息检索结果进行滤过调用。首先基于工业品索引编码信息集合对所述专有工业品信息检索结果进行序列排布,获得专有工业品序列检索信息,所述专有工业品序列检索信息为按照知识层级编码进行索引排列的专有工业品信息检索信息。再通过所述知识库检索机制中的所述工业品检索权限规则对所述工业品索引编码信息集合进行干扰项分析,即对未在该用户访问检索权限内的工业品编码进行干扰识别,获得所识别的工业品干扰编码信息集合。
进而基于所述工业品干扰编码信息集合与所述专有工业品序列检索信息进行映射,获取与干扰编码信息映射匹配的专有工业品检索信息,确定为工业品屏蔽检索信息。依据所述工业品屏蔽检索信息对所述专有工业品信息检索结果进行屏蔽调用,将专有工业品信息检索结果中的工业品屏蔽检索信息进行屏蔽滤过,确定滤过处理后的专有工业品信息调用结果,以作为最终可展示的专有工业品检索结果。并将所述专有工业品信息调用结果反馈至所述目标用户,作为所述检索请求信息的交互调用答案。实现专有工业品信息智能化交互调用,提高知识检索准确性和适用性,进而确保工业品知识信息检索安全性和检索效率。
为确保信息检索成功率,当目标用户检索调用失败时,表明所述检索请求信息无关联检索信息或请求问题不清楚,则发出检索词匹配指令。基于所述检索词匹配指令将所述检索请求信息与所述知识库问答模型进行相似度嵌合匹配,即利用余弦相似度算法、皮尔逊相关系数等相似度算法作为知识库问答模型的相似度关联嵌合功能层。进而根据相似度关联嵌合功能层构建检索词语义关联策略,所述检索词语义关联策略与相似度关联嵌合功能层的处理功能对应,利用相似度算法对检索调用失败的所述检索请求信息进行相似关联信息计算匹配。基于所述检索词语义关联策略对所述知识库检索机制进行检索规则补充,提高检索规则全面性和完善性,进而提高专有工业品检索成功率和知识检索准确性,确保工业品知识检索调用覆盖全面性。
综上所述,本申请所提供的基于langchain的专有工业品信息交互调用方法具有如下技术效果:
由于采用了根据专有工业品应用特点信息,搭建专有工业品分类体系,再利用langchain将专有工业品信息数据库按照所述专有工业品分类体系进行去中心化整合,获取专有工业品知识库;利用langchain问答技术对所述专有工业品知识库进行训练交互集成,构建知识库问答模型,同时对所述专有工业品知识库进行编码标记,建立知识库检索机制;基于所述知识库问答模型对检索请求信息进行语义分析检索,生成专有工业品信息检索结果,再基于所述知识库检索机制对所述专有工业品信息检索结果进行滤过调用,获取专有工业品信息调用结果反馈至目标用户的技术方案。进而达到利用LangChain问答技术实现专有工业品信息智能化交互调用,提高知识检索准确性和交互调用效率,进而确保工业品知识检索调用覆盖全面性的技术效果。
实施例2
基于与前述实施例中基于langchain的专有工业品信息交互调用方法同样发明构思,本发明还提供了基于langchain的专有工业品信息交互调用系统,如图3所示,所述系统包括:
工业品分类体系搭建模块11,用于根据专有工业品应用特点信息,搭建专有工业品分类体系;
工业品知识库获取模块12,用于获取专有工业品信息数据库,利用langchain将所述专有工业品信息数据库按照所述专有工业品分类体系进行去中心化整合,获取专有工业品知识库;
知识库问答模型构建模块13,用于利用langchain问答技术对所述专有工业品知识库进行训练交互集成,构建知识库问答模型;
知识库检索机制建立模块14,用于对所述专有工业品知识库中的各工业品信息进行编码标记,建立知识库检索机制;
语义分析检索模块15,用于获取目标用户的检索请求信息,基于所述知识库问答模型对所述检索请求信息进行语义分析检索,生成专有工业品信息检索结果;
信息调用结果获取模块16,用于基于所述知识库检索机制对所述专有工业品信息检索结果进行滤过调用,获取专有工业品信息调用结果反馈至所述目标用户。
进一步的,所述系统还包括:
工业品分类要素获取单元,用于根据所述专有工业品分类体系,获取工业品分类要素信息,所述工业品分类要素信息包括涉及领域、应用分布、工业技术、保密级别;
工业品知识图谱获得单元,用于基于所述工业品分类要素信息和所述专有工业品信息数据库,构建专用工业品知识图谱;
数据库梳理整合单元,用于通过所述专用工业品知识图谱对所述专有工业品信息数据库进行梳理整合,获取专有工业品知识数据库;
去中心化存储单元,用于利用langchain开发知识库智能合约,基于所述知识库智能合约对所述专有工业品知识数据库进行去中心化存储,得到所述专有工业品知识库。
进一步的,所述系统还包括:
知识属性提取单元,用于对所述工业品分类要素信息进行知识属性提取,获取工业品要素知识属性集合;
知识属性实体确定单元,用于根据所述工业品要素知识属性集合,确定工业品知识属性实体;
实体内容融合单元,用于基于所述工业品知识属性实体对所述专有工业品信息数据库进行实体内容融合,获得工业品知识属性实体内容;
知识图谱构建单元,用于将所述工业品知识属性实体内容分别作为知识节点,构建所述专用工业品知识图谱。
进一步的,所述系统还包括:
预处理标注单元,用于基于所述专有工业品知识库进行问答数据采集、预处理标注,获取工业品问答数据分类标注信息;
多维语义特征提取单元,用于利用自然语言处理技术对所述工业品问答数据分类标注信息进行多维语义特征提取,获得工业品语义特征集合;
问答模型训练单元,用于利用循环神经网络结构对所述工业品问答数据分类标注信息和所述工业品语义特征集合进行问答模型训练,生成工业品问答模型;
交互集成优化单元,用于基于langchain问答技术对所述工业品问答模型进行交互集成优化,构建所述知识库问答模型。
进一步的,所述系统还包括:
编码规则获得单元,用于根据所述专用工业品知识图谱,获得工业品编码规则,所述工业品编码规则包括工业品层级编码信息和工业品标识编码规则;
工业品信息编码单元,用于按照所述工业品编码规则对所述专有工业品知识库中的各工业品信息分别进行编码,获得工业品索引编码信息集合;
检索权限规则获得单元,用于基于工业品访问细粒度权限信息对所述工业品索引编码信息集合进行标记,获得工业品检索权限规则;
检索嵌入合并单元,用于将所述工业品索引编码信息集合和所述工业品检索权限规则进行检索嵌入合并,建立所述知识库检索机制。
进一步的,所述系统还包括:
检索序列排布单元,用于基于工业品索引编码信息集合对所述专有工业品信息检索结果进行序列排布,获得专有工业品序列检索信息;
干扰项分析单元,用于通过所述工业品检索权限规则对所述工业品索引编码信息集合进行干扰项分析,获得工业品干扰编码信息集合;
屏蔽检索信息确定单元,用于基于所述工业品干扰编码信息集合与所述专有工业品序列检索信息进行映射,确定工业品屏蔽检索信息;
检索结果屏蔽调用单元,用于依据所述工业品屏蔽检索信息对所述专有工业品信息检索结果进行屏蔽调用,确定所述专有工业品信息调用结果。
进一步的,所述系统还包括:
匹配指令发出单元,用于当检索调用失败时,则发出检索词匹配指令;
相似度嵌合匹配单元,用于基于所述检索词匹配指令将所述检索请求信息与所述知识库问答模型进行相似度嵌合匹配,构建检索词语义关联策略;
检索规则补充单元,用于基于所述检索词语义关联策略对所述知识库检索机制进行检索规则补充。
前述图1实施例一中的基于langchain的专有工业品信息交互调用方法的各种变化方式和具体实例同样适用于本实施例的基于langchain的专有工业品信息交互调用系统,通过前述对基于langchain的专有工业品信息交互调用方法的详细描述,本领域技术人员可以清楚的知道本实施例中基于langchain的专有工业品信息交互调用系统的实施方法,所以为了说明书的简洁,在此不再详述。
此外,本申请还提供了一种电子设备,包括总线、收发器、存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该收发器、该存储器和处理器分别通过总线相连,计算机程序被处理器执行时实现上述控制输出数据的方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
示例性电子设备
具体的,参见图4所示,本申请还提供了一种电子设备,该电子设备包括总线1110、处理器1120、收发器1130、总线接口1140、存储器1150和用户接口1160。
在本申请中,该电子设备还包括:存储在存储器1150上并可在处理器1120上运行的计算机程序,计算机程序被处理器1120执行时实现上述控制输出数据的方法实施例的各个过程。
收发器1130,用于在处理器1120的控制下接收和发送数据。
本申请中,总线架构(用总线1110来代表),总线1110可以包括任意数量互联的总线和桥,总线1110将包括由处理器1120代表的一个或多个处理器与存储器1150代表的存储器的各种电路连接在一起。
总线1110表示若干类型的总线结构中的任何一种总线结构中的一个或多个,包括存储器总线和存储器控制器、外围总线、加速图形端口、处理器或使用各种总线体系结构中的任意总线结构的局域总线。作为示例而非限制,这样的体系结构包括:工业标准体系结构总线、微通道体系结构总线、扩展总线、视频电子标准协会、外围部件互连总线。
处理器1120可以是一种集成电路芯片,具有信号处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中硬件的集成逻辑电路或软件形式的指令完成。上述的处理器包括:通用处理器、中央处理器、网络处理器、数字信号处理器、专用集成电路、现场可编程门阵列、复杂可编程逻辑器件、可编程逻辑阵列、微控制单元或其他可编程逻辑器件、分立门、晶体管逻辑器件、分立硬件组件。可以实现或执行本申请中公开的各方法、步骤和逻辑框图。例如,处理器可以是单核处理器或多核处理器,处理器可以集成于单颗芯片或位于多颗不同的芯片。
处理器1120可以是微处理器或任何常规的处理器。结合本申请所公开的方法步骤可以直接由硬件译码处理器执行完成,或者由译码处理器中的硬件和软件模块组合执行完成。软件模块可以位于随机存取存储器、闪存、只读存储器、可编程只读存储器、可擦除可编程只读存储器、寄存器等本领域公知的可读存储介质中。所述可读存储介质位于存储器中,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
总线1110还可以将,例如外围设备、稳压器或功率管理电路等各种其他电路连接在一起,总线接口1140在总线1110和收发器1130之间提供接口,这些都是本领域所公知的。因此,本申请不再对其进行进一步描述。
收发器1130可以是一个元件,也可以是多个元件,例如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。例如:收发器1130从其他设备接收外部数据,收发器1130用于将处理器1120处理后的数据发送给其他设备。取决于计算机装置的性质,还可以提供用户接口1160,例如:触摸屏、物理键盘、显示器、鼠标、扬声器、麦克风、轨迹球、操纵杆、触控笔。
应理解,在本申请中,存储器1150可进一步包括相对于处理器1120远程设置的存储器,这些远程设置的存储器可以通过网络连接至服务器。上述网络的一个或多个部分可以是自组织网络、内联网、外联网、虚拟专用网、局域网、无线局域网、广域网、无线广域网、城域网、互联网、公共交换电话网、普通老式电话业务网、蜂窝电话网、无线网络、无线保真网络以和两个或更多个上述网络的组合。例如,蜂窝电话网和无线网络可以是全球移动通信装置、码分多址装置、全球微波互联接入装置、通用分组无线业务装置、宽带码分多址装置、长期演进装置、LTE频分双工装置、LTE时分双工装置、先进长期演进装置、通用移动通信装置、增强移动宽带装置、海量机器类通信装置、超可靠低时延通信装置等。
应理解,本申请中的存储器1150可以是易失性存储器或非易失性存储器,或可包括易失性存储器和非易失性存储器两者。其中,非易失性存储器包括:只读存储器、可编程只读存储器、可擦除可编程只读存储器、电可擦除可编程只读存储器,或闪存。
易失性存储器包括:随机存取存储器,其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如:静态随机存取存储器、动态随机存取存储器、同步动态随机存取存储器、双倍数据速率同步动态随机存取存储器、增强型同步动态随机存取存储器、同步连接动态随机存取存储器和直接内存总线随机存取存储器。本申请描述的电子设备的存储器1150包括但不限于上述和任意其他适合类型的存储器。
在本申请中,存储器1150存储了操作系统1151和应用程序1152的如下元素:可执行模块、数据结构,或者其子集,或者其扩展集。
具体而言,操作系统1151包含各种装置程序,例如:框架层、核心库层、驱动层等,用于实现各种基础业务和处理基于硬件的任务。应用程序1152包含各种应用程序,例如:媒体播放器、浏览器,用于实现各种应用业务。实现本申请方法的程序可以包含在应用程序1152中。应用程序1152包括:小程序、对象、组件、逻辑、数据结构和其他执行特定任务或实现特定抽象数据类型的计算机装置可执行指令。
此外,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述控制输出数据的方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请披露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.基于langchain的专有工业品信息交互调用方法,其特征在于,所述方法包括:
根据专有工业品应用特点信息,搭建专有工业品分类体系;
获取专有工业品信息数据库,利用langchain将所述专有工业品信息数据库按照所述专有工业品分类体系进行去中心化整合,获取专有工业品知识库;
利用langchain问答技术对所述专有工业品知识库进行训练交互集成,构建知识库问答模型;
对所述专有工业品知识库中的各工业品信息进行编码标记,建立知识库检索机制;
获取目标用户的检索请求信息,基于所述知识库问答模型对所述检索请求信息进行语义分析检索,生成专有工业品信息检索结果;
基于所述知识库检索机制对所述专有工业品信息检索结果进行滤过调用,获取专有工业品信息调用结果反馈至所述目标用户。
2.如权利要求1所述的方法,其特征在于,所述获取专有工业品知识库,包括:
根据所述专有工业品分类体系,获取工业品分类要素信息,所述工业品分类要素信息包括涉及领域、应用分布、工业技术、保密级别;
基于所述工业品分类要素信息和所述专有工业品信息数据库,构建专用工业品知识图谱;
通过所述专用工业品知识图谱对所述专有工业品信息数据库进行梳理整合,获取专有工业品知识数据库;
利用langchain开发知识库智能合约,基于所述知识库智能合约对所述专有工业品知识数据库进行去中心化存储,得到所述专有工业品知识库。
3.如权利要求2所述的方法,其特征在于,所述构建专用工业品知识图谱,包括:
对所述工业品分类要素信息进行知识属性提取,获取工业品要素知识属性集合;
根据所述工业品要素知识属性集合,确定工业品知识属性实体;
基于所述工业品知识属性实体对所述专有工业品信息数据库进行实体内容融合,获得工业品知识属性实体内容;
将所述工业品知识属性实体内容分别作为知识节点,构建所述专用工业品知识图谱。
4.如权利要求1所述的方法,其特征在于,所述构建知识库问答模型,包括:
基于所述专有工业品知识库进行问答数据采集、预处理标注,获取工业品问答数据分类标注信息;
利用自然语言处理技术对所述工业品问答数据分类标注信息进行多维语义特征提取,获得工业品语义特征集合;
利用循环神经网络结构对所述工业品问答数据分类标注信息和所述工业品语义特征集合进行问答模型训练,生成工业品问答模型;
基于langchain问答技术对所述工业品问答模型进行交互集成优化,构建所述知识库问答模型。
5.如权利要求2所述的方法,其特征在于,所述建立知识库检索机制,包括:
根据所述专用工业品知识图谱,获得工业品编码规则,所述工业品编码规则包括工业品层级编码信息和工业品标识编码规则;
按照所述工业品编码规则对所述专有工业品知识库中的各工业品信息分别进行编码,获得工业品索引编码信息集合;
基于工业品访问细粒度权限信息对所述工业品索引编码信息集合进行标记,获得工业品检索权限规则;
将所述工业品索引编码信息集合和所述工业品检索权限规则进行检索嵌入合并,建立所述知识库检索机制。
6.如权利要求5所述的方法,其特征在于,所述获取专有工业品信息调用结果,包括:
基于工业品索引编码信息集合对所述专有工业品信息检索结果进行序列排布,获得专有工业品序列检索信息;
通过所述工业品检索权限规则对所述工业品索引编码信息集合进行干扰项分析,获得工业品干扰编码信息集合;
基于所述工业品干扰编码信息集合与所述专有工业品序列检索信息进行映射,确定工业品屏蔽检索信息;
依据所述工业品屏蔽检索信息对所述专有工业品信息检索结果进行屏蔽调用,确定所述专有工业品信息调用结果。
7.如权利要求1所述的方法,其特征在于,所述方法包括:
当检索调用失败时,则发出检索词匹配指令;
基于所述检索词匹配指令将所述检索请求信息与所述知识库问答模型进行相似度嵌合匹配,构建检索词语义关联策略;
基于所述检索词语义关联策略对所述知识库检索机制进行检索规则补充。
8.基于langchain的专有工业品信息交互调用系统,其特征在于,所述系统包括:
工业品分类体系搭建模块,用于根据专有工业品应用特点信息,搭建专有工业品分类体系;
工业品知识库获取模块,用于获取专有工业品信息数据库,利用langchain将所述专有工业品信息数据库按照所述专有工业品分类体系进行去中心化整合,获取专有工业品知识库;
知识库问答模型构建模块,用于利用langchain问答技术对所述专有工业品知识库进行训练交互集成,构建知识库问答模型;
知识库检索机制建立模块,用于对所述专有工业品知识库中的各工业品信息进行编码标记,建立知识库检索机制;
语义分析检索模块,用于获取目标用户的检索请求信息,基于所述知识库问答模型对所述检索请求信息进行语义分析检索,生成专有工业品信息检索结果;
信息调用结果获取模块,用于基于所述知识库检索机制对所述专有工业品信息检索结果进行滤过调用,获取专有工业品信息调用结果反馈至所述目标用户。
9.一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,其特征在于,所述计算机程序被所述处理器执行时实现如权利要求1-7中任一项所述的基于langchain的专有工业品信息交互调用方法中的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的基于langchain的专有工业品信息交互调用方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410180183.3A CN117725192B (zh) | 2024-02-18 | 基于langchain的专有工业品信息交互调用方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410180183.3A CN117725192B (zh) | 2024-02-18 | 基于langchain的专有工业品信息交互调用方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117725192A true CN117725192A (zh) | 2024-03-19 |
CN117725192B CN117725192B (zh) | 2024-05-14 |
Family
ID=
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109800249A (zh) * | 2018-12-24 | 2019-05-24 | 北京航天智造科技发展有限公司 | 一种基于工业服务云平台用户行为感知的知识服务方法和系统 |
US20210303639A1 (en) * | 2020-03-31 | 2021-09-30 | International Business Machines Corporation | Advanced search and document retrieval for development and verification system prototypes |
CN117077679A (zh) * | 2023-10-16 | 2023-11-17 | 之江实验室 | 命名实体识别方法和装置 |
CN117370506A (zh) * | 2023-07-21 | 2024-01-09 | 中图科信数智技术(北京)有限公司 | 一种支持多模态和多轮对话的农业智能问答方法和系统 |
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109800249A (zh) * | 2018-12-24 | 2019-05-24 | 北京航天智造科技发展有限公司 | 一种基于工业服务云平台用户行为感知的知识服务方法和系统 |
US20210303639A1 (en) * | 2020-03-31 | 2021-09-30 | International Business Machines Corporation | Advanced search and document retrieval for development and verification system prototypes |
CN117370506A (zh) * | 2023-07-21 | 2024-01-09 | 中图科信数智技术(北京)有限公司 | 一种支持多模态和多轮对话的农业智能问答方法和系统 |
CN117077679A (zh) * | 2023-10-16 | 2023-11-17 | 之江实验室 | 命名实体识别方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111026671B (zh) | 测试用例集构建方法和基于测试用例集的测试方法 | |
CN107220386A (zh) | 信息推送方法和装置 | |
CN111552799B (zh) | 信息处理方法、装置、电子设备及存储介质 | |
CN112749284B (zh) | 知识图谱构建方法、装置、设备及存储介质 | |
CN112149400B (zh) | 一种数据处理方法、装置、设备及存储介质 | |
US20090240670A1 (en) | Uniform resource identifier alignment | |
CN112925898B (zh) | 基于人工智能的问答方法、装置、服务器及存储介质 | |
CN112989055A (zh) | 文本识别方法、装置、计算机设备和存储介质 | |
CN113486187A (zh) | 佛学知识图谱构建方法、装置、设备及存储介质 | |
CN114399396A (zh) | 保险产品推荐方法、装置、计算机设备及存储介质 | |
CN115098650A (zh) | 基于历史数据模型的评论信息分析方法及相关装置 | |
CN111488386B (zh) | 数据查询方法和装置 | |
CN117725192B (zh) | 基于langchain的专有工业品信息交互调用方法 | |
CN115906863B (zh) | 基于对比学习的情感分析方法、装置、设备以及存储介质 | |
CN117725192A (zh) | 基于langchain的专有工业品信息交互调用方法 | |
CN116383787A (zh) | 页面创建方法、装置、计算机设备及存储介质 | |
CN114511085A (zh) | 实体属性值的识别方法、装置、设备、介质及程序产品 | |
CN114416847A (zh) | 一种数据转换的方法、装置、服务器及存储介质 | |
Zhang et al. | Formal concept analysis approach for data extraction from a limited deep web database | |
CN112417260B (zh) | 本地化推荐方法、装置及存储介质 | |
CN112148902A (zh) | 数据处理方法、装置、服务器及存储介质 | |
CN116383883B (zh) | 一种基于大数据的数据管理权限处理方法及系统 | |
CN114048392B (zh) | 多媒体资源推送方法、装置、电子设备及存储介质 | |
CN113836940A (zh) | 电力计量领域的知识融合方法、装置和计算机设备 | |
CN115794765A (zh) | 一种元数据服务方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |