CN117891920A - 一种建筑材料检索方法、装置、电子设备及存储介质 - Google Patents

一种建筑材料检索方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN117891920A
CN117891920A CN202410080435.5A CN202410080435A CN117891920A CN 117891920 A CN117891920 A CN 117891920A CN 202410080435 A CN202410080435 A CN 202410080435A CN 117891920 A CN117891920 A CN 117891920A
Authority
CN
China
Prior art keywords
building material
user query
product information
building
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410080435.5A
Other languages
English (en)
Other versions
CN117891920B (zh
Inventor
邓蔚
王希
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ruida Heng Construction Consulting Co ltd
Original Assignee
Beijing Ruida Heng Construction Consulting Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ruida Heng Construction Consulting Co ltd filed Critical Beijing Ruida Heng Construction Consulting Co ltd
Priority to CN202410080435.5A priority Critical patent/CN117891920B/zh
Publication of CN117891920A publication Critical patent/CN117891920A/zh
Application granted granted Critical
Publication of CN117891920B publication Critical patent/CN117891920B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种建筑材料检索方法、装置、电子设备及存储介质,涉及数据检索,包括:获取建筑材料数据,根据建筑材料数据构建建材知识图谱,然后,获取用户查询语句,利用建筑材料大语言模型对用户查询语句进行语义解析,获取与建材相关的结构化用户查询语句,根据建材知识图谱对与建材相关的结构化用户查询语句进行查询和推理,获取建材产品信息,对建材产品信息进行相关度排序,并展示在用户界面,提供了准确、全面的建材产品信息,增强了用户的体验。

Description

一种建筑材料检索方法、装置、电子设备及存储介质
技术领域
本申请涉及数据检索技术领域,尤其涉及一种建筑材料检索方法、装置、电子设备及存储介质。
背景技术
当前,在建材行业中,建材产品的检索和查询通常采用基于关键词匹配或固定分类体系的方法。这种传统的检索方式在处理复杂查询内容或缺失重要信息时存在一些问题,导致检索效果的不准确和检索结果的不全面。首先,基于关键词匹配的检索方法通常只考虑用户输入的关键词与建材产品的标签或描述的匹配程度,并没有考虑到材料、规格、性能、用途等多个维度的信息。其次,固定的分类体系通常将建材产品分为预定义的类别,用户需要在这些类别中选择适合的分类来进行查询。然而,建材产品的种类繁多且不断更新,固定分类体系往往无法覆盖所有的产品种类,导致部分产品难以被正确分类,从而限制了查询结果的全面性。
因此,为了提高建材检索的精确性和效率,引入知识图谱技术成为一种可行的解决方案。知识图谱作为一种图形化的知识表示方式,可以整合建筑材料领域的知识和信息,包括建材产品的关系、属性和特性等。通过利用知识图谱,可以更好地理解建材产品的复杂特征和用途,提高建材检索结果的准确性和全面性。
发明内容
本发明提供一种建筑材料检索方法、装置、电子设备及存储介质,用于提高建材检索的精确性和效率。
第一方面,提供一种建筑材料检索检索方法。该方法包括:
获取建筑材料数据,根据建筑材料数据构建建材知识图谱;
获取用户查询语句,利用建筑材料大语言模型对用户查询语句进行语义解析,获取与建材相关的结构化用户查询语句;
根据建材知识图谱对与建材相关的结构化用户查询语句进行查询和推理,获取建材产品信息;
对建材产品信息进行相关度排序,并展示在用户界面。
一种可能的设计方案中,建材知识图谱包括建材产品的实体类别、建材产品的结构参数和建材产品之间的关系;
获取建筑材料数据,根据建筑材料数据构建建材知识图谱,包括,
获取建筑材料数据,对建筑材料数据进行实体识别与分类,获取建材产品的实体类别;
从建筑材料数据中提取建材产品的结构参数;
根据建筑材料数据中的关联信息建立建材产品之间的关系;
将建材产品的实体类别、建材产品的结构参数和建材产品之间的关系以图谱的形式进行表示。
一种可能的设计方案中,获取用户查询语句,利用建筑材料大语言模型对用户查询语句进行语义解析,获取与建材相关的结构化用户查询语句,包括,
将用户查询语句输入至建筑材料大语言模型中,由建筑材料大语言模型对用户查询语句进行编码,获取语义解析后的与建材相关的结构化用户查询语句;
建筑材料大语言模型由预设的历史建材搜索数据库中的数据进行预训练得到;
历史建材搜索数据库中包括建筑材料的产品名称、品牌、规格、型号和产品说明。
一种可能的设计方案中,根据建材知识图谱对与建材相关的结构化用户查询语句进行查询和推理,获取建材产品信息,包括,
计算与建材相关的结构化用户查询语句与建材知识图谱中建材产品的建材知识相似度;
对建材知识相似度进行从高到低排序,根据预设数量阈值获取相应数量的建材知识,组成单个建材产品候选集;
根据建材知识图谱对单个建材产品候选集进行补全,获取建材产品信息。
可选地,计算与建材相关的结构化用户查询语句与建材知识图谱中建材产品的建材知识相似度,包括,
将与建材相关的结构化用户查询语句中的每个非空字段的类别与建材知识图谱中建材产品的实体类别相匹配;
计算与建材相关的结构化用户查询语句中的每个非空字段和与其相匹配的建材知识图谱中建材产品的结构参数之间的余弦相似度,获得建材知识相似度。
可选地,根据建材知识图谱对单个建材产品候选集进行补全,获取建材产品信息,包括,
根据单个建材产品候选集中的建材知识在建材知识图谱中进行检索,提取与单个建材产品候选集中的建材知识相关的知识节点;
根据单个建材产品候选集中的建材知识相关的知识节点,组成建材产品信息。
一种可能的设计方案中,对建材产品信息进行相关度排序,并展示在用户界面,包括,
将建材产品信息的单个建材产品候选集中的建材知识相似度进行相加,获得建材产品信息的相关度;
根据建材产品信息的相关度对建材产品信息进行从高到低排序;
将建材产品信息的名称、品牌、规格、型号和产品说明展示在用户界面。
第二方面,提供一种建筑材料检索装置。该装置包括:
获取模块,用于获取建筑材料数据,根据建筑材料数据构建建材知识图谱;
解析模块,用于获取用户查询语句,利用建筑材料大语言模型对用户查询语句进行语义解析,获取与建材相关的结构化用户查询语句;
查询推理模块,用于根据建材知识图谱对与建材相关的结构化用户查询语句进行查询和推理,获取建材产品信息;
排序模型,用于对建材产品信息进行相关度排序,并展示在用户界面。
第三方面,提供一种电子设备,该电子设备包括存储器和处理器,存储器上存储有计算机程序,处理器执行计算机程序时实现如第一方面中任一项的方法。
第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如第一方面任一项的方法。
本发明提供的建筑材料检索方法、装置、电子设备及存储介质,该方法包括:获取建筑材料数据,根据建筑材料数据构建建材知识图谱,然后,获取用户查询语句,利用建筑材料大语言模型对用户查询语句进行语义解析,获取与建材相关的结构化用户查询语句,根据建材知识图谱对与建材相关的结构化用户查询语句进行查询和推理,获取建材产品信息,对建材产品信息进行相关度排序,并展示在用户界面。也就是说,通过获取建筑材料数据并构建建材知识图谱,将建筑材料的相关信息组织成结构化的形式,再利用建筑材料大语言模型对用户查询语句进行语义解析,有助于更准确地理解用户的查询,并将其转化为与建材相关的结构化的查询语句,然后,基于建材知识图谱和与建材相关的结构化用户查询语句,进行查询和推理,以获取符合用户需求的建材产品信息,将最符合用户需求的建材产品信息展示在用户界面,提高了用户的体验和建筑材料检索的效率。
应当理解,发明内容部分中所描述的内容并非旨在限定本发明的实施例的关键或重要特征,亦非用于限制本发明的范围。本发明的其它特征将通过以下的描述变得容易理解。
附图说明
结合附图并参考以下详细说明,本发明各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素。
图1为本发明实施例的建筑材料检索方法的流程图;
图2为本发明实施例的建材知识图谱的结构示意图;
图3为本发明的实施例的获取建材产品信息的结构示意图;
图4为本发明实施例的用户界面的结构示意图;
图5为本发明实施例的建筑材料检索装置的结构示意图;
图6为本发明实施例的电子设备的结构图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件的保护范围。
需要说明的是,本发明实施例描述的仅仅是为了更加清楚的说明本发明实施例的技术方案,并不构成对本发明实施例提供的技术方案的限定。
本发明实施例提供一种建筑材料检索方法,图1为本发明实施例的建筑材料检索方法的流程图。参见图1,该方法包括:
S101.获取建筑材料数据,根据建筑材料数据构建建材知识图谱。
其中,建筑材料数据的来源包括但不限于建材供应商和预设的建筑材料数据库,具体包括建筑材料的产品名称、品牌和规格等信息。
本实施例中,根据建筑材料数据构建建材知识图谱,可以帮助将大量的分散信息整合到一个统一的框架中,有助于建立一个组织化的知识结构,从而更好的提供决策支持。
可选地,建材知识图谱包括建材产品的实体类别、建材产品的结构参数和建材产品之间的关系;
获取建筑材料数据,根据建筑材料数据构建建材知识图谱,包括,
获取建筑材料数据,对建筑材料数据进行实体识别与分类,获取建材产品的实体类别;
从建筑材料数据中提取建材产品的结构参数;
根据建筑材料数据中的关联信息建立建材产品之间的关系;
将建材产品的实体类别、建材产品的结构参数和建材产品之间的关系以图谱的形式进行表示。
图2为本发明实施例的建材知识图谱的结构示意图,如图2所示。
其中,建材知识图谱中建材产品的实体类别包括但不限于油浸式变压器、油水分离器、油烟净化器和滤波柜,建材产品的结构参数包括但不限于型号、产品说明、品牌和规格,建材产品之间的关系包括但不限于产品说明关系和品牌从属关系。
此外,可以利用图数据库对建材知识图谱进行管理和存储,图数据库使用节点(Nodes)表示建材产品的实体类别,例如油浸式变压器、油烟净化器、滤波柜等,每个节点可以包含结构参数信息,如规格、型号、品牌等,使用边(Edges)表示建材产品之间的关系,例如产品说明关系、品牌从属关系等。图数据库使用图形结构来存储数据,其中,节点和边之间的连接关系被直接存储,使得查询和遍历建材知识图谱的关系变得高效,能够快速获取节点和边之间的关联信息,还具有良好的扩展性,可以轻松地添加新建材产品的节点、属性和边,当新的建材实体或关系出现时,可以直接将其添加到图数据库中,从而保持建材知识图谱的更新和完整性,有利于对建材产品复杂的数据分析和决策支持。
本实施例中,建材知识图谱中记录了建材产品的实体类别、结构参数和关系,可以更方便地获取和应用建材产品的结构参数和关系,从而提高建筑材料检索的质量和效率。
S102.获取用户查询语句,利用建筑材料大语言模型对用户查询语句进行语义解析,获取与建材相关的结构化用户查询语句。
其中,建筑材料大语言模型(Large Language Mode l,LLM)首先接收用户查询语句作为输入,用户查询语句包括但不限于一个问题、一个命令和一个陈述。然后,建筑材料大语言模型利用强大的语言理解能力对用户查询语句进行分析和理解,通过考虑句子的语法结构、词汇含义和上下文信息,获得对查询语句的准确理解。在语义理解过程中,建筑材料大语言模型会识别用户查询语句中的实体类别,实体类别包括但不限于建材产品的产品名称、产品型号和品牌,通过实体识别,可以确定用户查询语句中涉及的建材产品的主题和关键信息,进而提取用户查询语句中的关键词,以便进一步的查询处理和检索回答的生成。此外,通过分析用户查询语句中的语法结构和上下文信息,建筑材料大语言模型能够建立建材产品实体之间的关系,包括但不限于产品说明关系和品牌从属关系。最后,大语言模型通过实体识别、关键词提取和关系建立等步骤获得的与建材相关的用户查询语句的结构化形式,从而更好地表达用户查询语句的语义和结构。
本实施例中,通过大语言模型对用户查询语句进行语义解析,获取与建材相关的结构化用户查询语句,可以更好地理解用户的查询意图,提高了建筑材料检索的准确度。
可选地,获取用户查询语句,利用建筑材料大语言模型对用户查询语句进行语义解析,获取与建材相关的结构化用户查询语句,包括,
将用户查询语句输入至建筑材料大语言模型中,由建筑材料大语言模型对用户查询语句进行编码,获取语义解析后的与建材相关的结构化用户查询语句;
建筑材料大语言模型由预设的历史建材搜索数据库中的数据进行预训练得到;
历史建材搜索数据库中包括建筑材料的产品名称、品牌、规格、型号和产品说明。
其中,历史建材搜索数据库中的内容示例可以如下表所示:
本实施例中,利用建筑材料大语言模型对用户查询语句进行语义解析和结构化,结合预训练时使用的历史建材搜索数据库的数据,实现了建材数据数据的丰富性和,提高了建材产品搜索的准确度。
S103.根据建材知识图谱对与建材相关的结构化用户查询语句进行查询和推理,获取建材产品信息。
图3为本发明的实施例的获取建材产品信息的结构示意图,如图3所示:
利用历史建材搜索数据库对建筑材料大语言模型进行预训练,将用户查询语句输入至经过预训练后的建筑材料大语言模型中进行解析,获得与建材相关的结构化用户查询语句,然后再利用根据建筑材料数据构建的建材知识图谱,对与建材相关的结构化用户查询语句进行查询和推理,获得建材产品信息,帮助用户更好的获取信息。
具体地,以用户查询语句“我需要找一种适合在厨房使用的地板材料”为例,本发明的实施例可以通过以下步骤获取建材产品信息:
步骤1:根据历史建材搜索数据库对建筑大语言模型进行预训练,历史建材搜索数据库中包含了建筑材料的相关信息和特性,例如建筑材料的名称、用途、性能指标和制造商等。
步骤2:将用户查询语句“我需要找一种适合在厨房使用的地板材料”输入至经过预训练后的建筑材料大语言模型中进行解析,提取关键信息,在这个例子中,关键信息是“厨房”和“地板材料”,即与建材相关的结构化用户查询语句。
步骤3:利用根据建筑材料数据构建的建材知识图谱,对与建材相关的结构化用户查询语句(“厨房”和“地板材料”)进行查询和推理。在这个例子中,针对“厨房”和“地板材料”,知识图谱中可能包含的信息有:瓷砖地板:防水性好,易于清洁,提供各种颜色和纹理选择;复合地板:耐磨性好,相对容易安装;实木地板:耐用且具有自然美感,但需要更多的维护。
步骤4:获得建材产品信息,根据查询和推理获得的结果,可以进一步根据相似度排序对建材产品信息进行排序展示。在这个例子中,可以将瓷砖地板、复合地板和实木地板根据其各自和与建材相关的结构化用户查询语句之间的相似度排名依次展示在用户显示界面中。
本实施例中,根据建材知识图谱对与建材相关的结构化用户查询语句进行查询和推理,获取建材产品信息,提供更加全面和准确的建材产品信息给用户,避免了模糊查询带来的不确定性。
可选地,根据建材知识图谱对与建材相关的结构化用户查询语句进行查询和推理,获取建材产品信息,包括,
计算与建材相关的结构化用户查询语句与建材知识图谱中建材产品的建材知识相似度;
对建材知识相似度进行从高到低排序,根据预设数量阈值获取相应数量的建材知识,组成单个建材产品候选集;
根据建材知识图谱对单个建材产品候选集进行补全,获取建材产品信息。
其中,预设数量阈值可以根据需要进行设定。
其中,根据建材知识图谱对单个建材产品候选集进行补全,假设需要补全的单个建材产品候选集包括“实木地板”,和“复合地板”,则可以根据其相应的品牌、规格、型号和产品说明分别对其进行补全。
本实施例中,通过进行相似度计算、排序、数量控制和信息补全等利用建材知识图谱对与建材相关的结构化用户查询语句进行查询和推理,为用户提供了更好的建材产品选择和决策支持。
可选地,计算与建材相关的结构化用户查询语句与建材知识图谱中建材产品的建材知识相似度,包括,
将与建材相关的结构化用户查询语句中的每个非空字段的类别与建材知识图谱中建材产品的实体类别相匹配;
计算与建材相关的结构化用户查询语句中的每个非空字段和与其相匹配的建材知识图谱中建材产品的结构参数之间的余弦相似度,获得建材知识相似度。
例如,结构用户查询语句为{“颜色”:“红色”,“材质”:“木材”,“尺寸”:“120x80cm”},建材知识图谱中包含以下实体类别:颜色:红色、蓝色、绿色,材质:木材、金属、塑料,尺寸:120x80cm、90x60cm、150x100cm。将用户查询语句中的字段与建材知识图谱中的实体类别进行匹配,则,颜色字段匹配为“红色”,材质字段匹配为“木材”,尺寸字段匹配为“120x80cm”。假设有以下结构参数的值来计算余弦相似度:颜色结构参数:红色[0.8,0.2,0.1],蓝色[0.3,0.5,0.2],绿色[0.1,0.3,0.6],材质结构参数:木材[0.6,0.4,0.2],金属[0.2,0.7,0.1],塑料[0.3,0.3,0.4],尺寸结构参数:120x80cm[0.7,0.3,0.1],90x60cm[0.4,0.5,0.3],150x100cm:[0.6,0.2,0.4],那么,计算结构化用户查询语句中的每个非空字段和与其相匹配的建材知识图谱中建材产品的结构参数之间的余弦相似度,可以为,颜色字段“红色”与颜色结构参数之间的余弦相似度=cosine_similarity([0.8,0.2,0.1],[0.8,0.2,0.1])=1.0,材质字段“木材”与材质结构参数之间的余弦相似度=cosine_similarity([0.6,0.4,0.2],[0.6,0.4,0.2])=1.0,尺寸字段“120x80cm”与尺寸结构参数之间的余弦相似度=cosine_similarity([0.7,0.3,0.1],[0.7,0.3,0.1])=1.0,这样,就获得了建材知识相似度。
本实施例中,通过将与建材相关的用户查询语句中的字段与建材知识图谱中的实体类别进行匹配,并计算结构参数之间的余弦相似度,可以确保返回与用户需求相关的建材产品,提供了准确的相似度评估,进而帮助用户更好地选择适合的建材产品。
可选地,根据建材知识图谱对单个建材产品候选集进行补全,获取建材产品信息,包括,
根据单个建材产品候选集中的建材知识在建材知识图谱中进行检索,提取与单个建材产品候选集中的建材知识相关的知识节点;
根据单个建材产品候选集中的建材知识相关的知识节点,组成建材产品信息。
本实施例中,从建材知识图谱中获取更多相关的建材产品信息,根据候选集中的建材知识在知识图谱中进行精确匹配和检索,对单个建材产品候选集进行补全,可以高效获取丰富的建材产品信息,为用户提供准确、全面和定制化的建材选择。
S104.对建材产品信息进行相关度排序,并展示在用户界面。
本实施例中,通过对建材产品信息进行相关度排序,并展示在用户界面,可以根据用户的搜索意图和需求更加直观的展示搜索结果,为用户提供更加个性化和准确的搜索结果。
可选地,对建材产品信息进行相关度排序,并展示在用户界面,包括,
将建材产品信息的单个建材产品候选集中的建材知识相似度进行相加,获得建材产品信息的相关度;
根据建材产品信息的相关度对建材产品信息进行从高到低排序;
将建材产品信息的名称、品牌、规格、型号和产品说明展示在用户界面。
本实施例中,大语言模型解析后得到的结构化用户查询语句可以记作query,将query中的每个非空字段记作queryi,0<i<M,M的数值取决于结构化用户查询语句中的非空字段数量,queryi中包括但不限于产品名称、品牌和规格。建材知识图谱可以记作KG(Knowledge Graph),建材知识图谱中建材产品的第i个实体类别的第j个结构参数可以记作KGij,0<j<N,N的数据具体由建材知识图谱中建材产品的实体类别对应的结构参数决定。那么,结构化用户查询语句中的每个非空字段和与其相匹配的建材知识图谱中建材产品的结构参数之间的余弦相似度,即建材知识相似度Si的计算公式可以为:
Si={cosine_similarity(queryi,KGij)∣∣j=0,1,...,N}
其中,余弦相似度的计算公式为:
最后,将建材知识相似度Si相加,即可得到得建材产品信息的相关度S,计算公式可以为:
本实施例中,通过将建材产品信息的单个建材产品候选集中的建材知识相似度进行相加,获得建材产品信息的相关度,并将相关度较高的建材产品排在前面,使用户更容易找到与其需求匹配的建材产品,提高了建材产品检索的效率。
图4为本发明实施例的用户界面的结构示意图,如图4所示。
用户界面中包括用户信息查询语句框和建材产品信息条目,其中,建材产品信息可以包括K条,K的数值可以根据需要进行修改,建材产品信息条目中包含名称、品牌、规格1~M、型号1~N和产品说明,其中M和N的数值由检索出的建材产品信息的内容确定。
本实施例中,将建材产品信息的名称、品牌、规格、型号和产品说明展示在用户界面,为用户提供了全面和个性化的搜索结果,提升了用户体验。
基于本实施例提供的建筑材料检索方法,获取建筑材料数据,根据建筑材料数据构建建材知识图谱,然后,获取用户查询语句,利用建筑材料大语言模型对用户查询语句进行语义解析,获取与建材相关的结构化用户查询语句,根据建材知识图谱对与建材相关的结构化用户查询语句进行查询和推理,获取建材产品信息,对建材产品信息进行相关度排序,并展示在用户界面。也就是说,通过获取建筑材料数据并构建建材知识图谱,将建筑材料的相关信息组织成结构化的形式,再利用建筑材料大语言模型对用户查询语句进行语义解析,有助于更准确地理解用户的查询,并将其转化为与建材相关的结构化的查询语句,然后,基于建材知识图谱和与建材相关的结构化用户查询语句,进行查询和推理,以获取符合用户需求的建材产品信息,将最符合用户需求的建材产品信息展示在用户界面,提高了用户的体验和建筑材料检索的效率。
以上结合图1-图4详细说明了本申请实施例提供的建筑材料检索方法。以下结合图5详细说明用于执行本申请实施例提供的建筑材料检索方法的建筑材料检索装置。
图5为本发明实施例的建筑材料检索装置的结构示意图。参见图5,该装置包括:
获取模块501,用于获取建筑材料数据,根据建筑材料数据构建建材知识图谱;
解析模块502,用于获取用户查询语句,利用建筑材料大语言模型对用户查询语句进行语义解析,获取与建材相关的结构化用户查询语句;
查询推理模块503,用于根据建材知识图谱对与建材相关的结构化用户查询语句进行查询和推理,获取建材产品信息;
排序模型504,用于对建材产品信息进行相关度排序,并展示在用户界面。
建筑材料检索装置的技术效果参考前述的建筑材料检索方法的技术效果,此处不再赘述。
图6为本发明实施例的一种电子设备的结构图,如图6所示,该电子设备包括,中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块501、解析模块502、查询推理模块503、排序模块504,其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。
本发明实施例提供一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中所述建筑材料检索装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入电子设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本发明的质量评价模型训练方法。
以上描述仅为本发明的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本发明中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本发明中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种建筑材料检索方法,其特征在于,所述方法包括:
获取建筑材料数据,根据所述建筑材料数据构建建材知识图谱;
获取用户查询语句,利用建筑材料大语言模型对所述用户查询语句进行语义解析,获取与建材相关的结构化用户查询语句;
根据所述建材知识图谱对所述与建材相关的结构化用户查询语句进行查询和推理,获取建材产品信息;
对所述建材产品信息进行相关度排序,并展示在用户界面。
2.根据权利要求1所述的建筑材料检索方法,其特征在于,所述建材知识图谱包括建材产品的实体类别、建材产品的结构参数和建材产品之间的关系
所述获取建筑材料数据,根据所述建筑材料数据构建建材知识图谱,包括,
获取所述建筑材料数据,对所述建筑材料数据进行实体识别与分类,获取所述建材产品的实体类别;
从所述建筑材料数据中提取所述建材产品的结构参数;
根据所述建筑材料数据中的关联信息建立所述建材产品之间的关系;
将所述建材产品的实体类别、所述建材产品的结构参数和所述建材产品之间的关系以图谱的形式进行表示。
3.根据权利要求1所述的建筑材料检索方法,其特征在于,所述获取用户查询语句,利用建筑材料大语言模型对所述用户查询语句进行语义解析,获取与建材相关的结构化用户查询语句,包括,
将所述用户查询语句输入至所述建筑材料大语言模型中,由所述建筑材料大语言模型对所述用户查询语句进行编码,获取语义解析后的所述与建材相关的结构化用户查询语句;
所述建筑材料大语言模型由预设的历史建材搜索数据库中的数据进行预训练得到;
所述历史建材搜索数据库中包括所述建筑材料的产品名称、品牌、规格、型号和产品说明。
4.根据权利要求1所述的建筑材料检索方法,其特征在于,所述根据所述建材知识图谱对所述与建材相关的结构化用户查询语句进行查询和推理,获取建材产品信息,包括,
计算所述与建材相关的结构化用户查询语句与所述建材知识图谱中建材产品的建材知识相似度;
对所述建材知识相似度进行从高到低排序,根据预设数量阈值获取相应数量的建材知识,组成单个建材产品候选集;
根据所述建材知识图谱对所述单个建材产品候选集进行补全,获取所述建材产品信息。
5.根据权利要求4所述的建筑材料检索方法,其特征在于,所述计算所述与建材相关的结构化用户查询语句与所述建材知识图谱中建材产品的建材知识相似度,包括,
将所述与建材相关的结构化用户查询语句中的每个非空字段的类别与所述建材知识图谱中建材产品的实体类别相匹配;
计算所述与建材相关的结构化用户查询语句中的每个非空字段和与其相匹配的所述建材知识图谱中建材产品的结构参数之间的余弦相似度,获得建材知识相似度。
6.根据权利要求4所述的建筑材料检索方法,其特征在于,所述根据所述建材知识图谱对所述单个建材产品候选集进行补全,获取所述建材产品信息,包括,
根据所述单个建材产品候选集中的建材知识在所述建材知识图谱中进行检索,提取与所述单个建材产品候选集中的建材知识相关的知识节点;
根据所述单个建材产品候选集中的建材知识相关的知识节点,组成所述建材产品信息。
7.根据权利要求1所述的建筑材料检索方法,其特征在于,所述对所述建材产品信息进行相关度排序,并展示在用户界面,包括,
将所述建材产品信息的单个建材产品候选集中的建材知识相似度进行相加,获得所述建材产品信息的相关度;
根据所述建材产品信息的相关度对所述建材产品信息进行从高到低排序;
将所述建材产品信息的名称、品牌、规格、型号和产品说明展示在所述用户界面。
8.一种建筑材料检索装置,其特征在于,所述装置包括,
获取模块,用于获取建筑材料数据,根据所述建筑材料数据构建建材知识图谱;
解析模块,用于获取用户查询语句,利用建筑材料大语言模型对所述用户查询语句进行语义解析,获取与建材相关的结构化用户查询语句;
查询推理模块,用于根据所述建材知识图谱对所述与建材相关的结构化用户查询语句进行查询和推理,获取建材产品信息;
排序模型,用于对所述建材产品信息进行相关度排序,并展示在用户界面。
9.一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
CN202410080435.5A 2024-01-19 2024-01-19 一种建筑材料检索方法、装置、电子设备及存储介质 Active CN117891920B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410080435.5A CN117891920B (zh) 2024-01-19 2024-01-19 一种建筑材料检索方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410080435.5A CN117891920B (zh) 2024-01-19 2024-01-19 一种建筑材料检索方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN117891920A true CN117891920A (zh) 2024-04-16
CN117891920B CN117891920B (zh) 2024-10-01

Family

ID=90648674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410080435.5A Active CN117891920B (zh) 2024-01-19 2024-01-19 一种建筑材料检索方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117891920B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2838064A1 (en) * 2007-05-25 2015-02-18 Piksel, Inc. Recomendation systems and methods
CN105701253A (zh) * 2016-03-04 2016-06-22 南京大学 中文自然语言问句语义化的知识库自动问答方法
CN106776532A (zh) * 2015-11-25 2017-05-31 中国移动通信集团公司 一种知识问答方法及装置
CN108415902A (zh) * 2018-02-10 2018-08-17 合肥工业大学 一种基于搜索引擎的命名实体链接方法
CN109492077A (zh) * 2018-09-29 2019-03-19 北明智通(北京)科技有限公司 基于知识图谱的石化领域问答方法及系统
CN111414393A (zh) * 2020-03-26 2020-07-14 湖南科创信息技术股份有限公司 一种基于医学知识图谱的语义相似病例检索方法及设备
CN113569023A (zh) * 2021-07-06 2021-10-29 浙江工业大学 一种基于知识图谱的中文医药问答系统及方法
CN115563313A (zh) * 2022-10-25 2023-01-03 上海交通大学 基于知识图谱的文献书籍语义检索系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2838064A1 (en) * 2007-05-25 2015-02-18 Piksel, Inc. Recomendation systems and methods
CN106776532A (zh) * 2015-11-25 2017-05-31 中国移动通信集团公司 一种知识问答方法及装置
CN105701253A (zh) * 2016-03-04 2016-06-22 南京大学 中文自然语言问句语义化的知识库自动问答方法
CN108415902A (zh) * 2018-02-10 2018-08-17 合肥工业大学 一种基于搜索引擎的命名实体链接方法
CN109492077A (zh) * 2018-09-29 2019-03-19 北明智通(北京)科技有限公司 基于知识图谱的石化领域问答方法及系统
CN111414393A (zh) * 2020-03-26 2020-07-14 湖南科创信息技术股份有限公司 一种基于医学知识图谱的语义相似病例检索方法及设备
CN113569023A (zh) * 2021-07-06 2021-10-29 浙江工业大学 一种基于知识图谱的中文医药问答系统及方法
CN115563313A (zh) * 2022-10-25 2023-01-03 上海交通大学 基于知识图谱的文献书籍语义检索系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
COMPUTER SCIENCE: "keqing: knowledge-based question answering is a nature chain-of-thought mentor of LLM", 《COMPUTER SCIENCE》, 31 December 2023 (2023-12-31), pages 1 - 12 *
杨泽华: "基于问句语义扩展的答案检索方法研究", 《中国优秀硕士学位论文全文数据库 信息科技》, 15 February 2021 (2021-02-15), pages 138 - 2475 *

Also Published As

Publication number Publication date
CN117891920B (zh) 2024-10-01

Similar Documents

Publication Publication Date Title
US11960556B2 (en) Techniques for presenting content to a user based on the user&#39;s preferences
CN117290489B (zh) 一种行业问答知识库快速构建方法与系统
Losiewicz et al. Textual data mining to support science and technology management
CN109447266B (zh) 一种基于大数据的农业科技服务智能分拣方法
Sheth et al. Semantics for the semantic web: The implicit, the formal and the powerful
US20170323023A1 (en) Techniques for presenting content to a user based on the user&#39;s preferences
US9715493B2 (en) Method and system for monitoring social media and analyzing text to automate classification of user posts using a facet based relevance assessment model
AU2011269676B2 (en) Systems of computerized agents and user-directed semantic networking
CN107205016B (zh) 物联网设备的检索方法
CN111274267A (zh) 一种数据库查询方法、装置及计算机可读取存储介质
CA3157928A1 (en) Data preparation using semantic roles
Dubois et al. Fuzzy logic techniques in multimedia database querying: A preliminary investigation of the potentials
CN110659357B (zh) 一种基于本体语义相似度的地理知识问答系统
CN112449700A (zh) 语义模型实例化方法、系统和装置
Remi et al. Domain ontology driven fuzzy semantic information retrieval
CN117312499A (zh) 一种基于语义的大数据分析系统及方法
CN118245564B (zh) 一种支持语义查重查新的特征比对库构建方法及装置
CN112486919A (zh) 文档管理方法、系统及存储介质
Ma et al. Content Feature Extraction-based Hybrid Recommendation for Mobile Application Services.
AU2012272479A1 (en) Preference-guided data exploration and semantic processing
CN117009461A (zh) 基于自然语言处理的短视频内容标签知识库快速检索方法
CN117891920B (zh) 一种建筑材料检索方法、装置、电子设备及存储介质
CN106055702A (zh) 一种面向互联网的数据服务统一描述方法
US11294977B2 (en) Techniques for presenting content to a user based on the user&#39;s preferences
CN112905747A (zh) 一种基于语义分析技术的专业制度档案问答机器人系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant