CN113569058A - 一种信息查询方法、装置及计算机可读存储介质 - Google Patents
一种信息查询方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN113569058A CN113569058A CN202110897054.2A CN202110897054A CN113569058A CN 113569058 A CN113569058 A CN 113569058A CN 202110897054 A CN202110897054 A CN 202110897054A CN 113569058 A CN113569058 A CN 113569058A
- Authority
- CN
- China
- Prior art keywords
- component
- basic
- cluster
- mapping table
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000013507 mapping Methods 0.000 claims abstract description 55
- 239000013598 vector Substances 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 7
- 239000004615 ingredient Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000003796 beauty Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 206010070834 Sensitisation Diseases 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000008313 sensitization Effects 0.000 description 3
- 230000002087 whitening effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 206010015150 Erythema Diseases 0.000 description 1
- 239000006096 absorbing agent Substances 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 231100000321 erythema Toxicity 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000000419 plant extract Substances 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000037072 sun protection Effects 0.000 description 1
- 230000000475 sunscreen effect Effects 0.000 description 1
- 239000000516 sunscreening agent Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/319—Inverted lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Animal Behavior & Ethology (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种信息查询方法、装置及计算机可读存储介质,所述方法包括:接收用户输入的目标成分的名称;根据预先加载的基础成分与基础成分簇的第一映射表,查找所述目标成分所属的目标成分簇;根据预先加载的基础成分簇与基础产品的第二映射表,查找与所述目标成分簇关联的至少一个目标产品。本申请根据预先加载的基础成分与基础成分簇的第一映射表细化了查询领域,根据预先加载的基础成分簇与基础产品的第二映射表可查找与目标成分簇关联的至少一个目标产品,提高了查询反馈的速度,增强了用户的查询使用体验。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种信息查询方法、装置及计算机可读存储介质。
背景技术
随着互联网的迅猛发展,用户要在信息海洋里精准查找出自己所需要的信息也变得更加费时费力,但搜索技术的发展,使得在信息海洋里查找自己需要的信息变得更加精准、简单且快捷。
举例来说,涉及美妆行业,随着美妆行业的消费者整体素质的提升,“科学护肤”“成分党”等理性、高知的消费理念引领了该行业的新风尚。消费者的关注点从品牌、价格等领域逐渐下沉细化到功效和成分等领域,这种趋势也开启了化妆品行业的一种新场景,即从美妆成分清单搜索产品或相似产品的场景。因此,如何提升用户在该新场景下的查询体验,保证用户从其关注的细分领域准确查询到相似产品是美妆企业关注的重点。
其中,在美妆成分相似品的搜索环节中,通常采用基于存储介质的线性查找技术进行搜索,将作为候选池的产品全集持久化在存储介质中,基于需求的产品成分列表,遍历候选池,计算每个产品与目标成分列表的相似度,从中选择相似度较高的多个产品,作为成分相似成品返回。该技术方案仅适用在信息数据总量不大、维度较低的场景时,可快速有效进行查询求解,而在面对信息数据总量较大、维度较高的场景时,则会明显增加查询负担、增大查询计算量和占用过多的时间,难以应对需要实时返回的搜索场景,虽然理论上可以通过多线程和分布式设计实现并行计算从而缩短相应时耗,但仍对性能提升有限并且会引入如增加处理器处理负担等新的问题。
因此,仅从美妆产品的成分进行搜索,忽略了用户实质关心的产品成分的分类、功效、使用目的、是否致敏和使用风险程度等特性,没有深入到用户真正关心的成分特性层面,查询结果仍存在优化空间。而且,面对海量产品信息的查询,难以应对需要实时返回的搜索场景。
发明内容
有鉴于此,本申请的目的之一在于提供一种信息查询方法、装置及计算机可读存储介质,可以根据用户需要实现对目标产品的精准查找并且能够及时反馈查询结果,增强用户的使用体验。
第一方面,本申请实施例提供了一种信息查询方法,包括:
接收用户输入的目标成分的名称;
根据预先加载的基础成分与基础成分簇的第一映射表,查找所述目标成分所属的目标成分簇;
根据预先加载的基础成分簇与基础产品的第二映射表,查找与所述目标成分簇关联的至少一个目标产品。
在一种可能的实现方式中,所述第一映射表的获取步骤,包括:
获取各所述基础成分的属性参数;
通过预设维度,建立所述基础成分与所述基础成分的全部属性参数之间的关联关系;
基于所述基础成分的全部属性参数为各所述预设维度赋值,并根据所述基础成分及全部预设维度的参数值,构建所述基础成分的成分知识图谱;
根据各所述基础成分的知识图谱之间的相似度,采用聚类算法确定各所述基础成分归属的基础成分簇,其中,每个成分簇包含至少一种不同的所述基础成分;
根据各所述基础成分归属的基础成分簇,建立所述第一映射表。
在一种可能的实现方式中,所述采用聚类算法确定各所述基础成分所属的基础成分簇的步骤,包括:
生成与各所述基础成分的各属性参数对应的位向量,其中,不同所述属性参数的所述位向量不同;
将各所述基础成分的各属性参数对应的位向量拼接,获得每个所述基础成分的多热编码;
将相似度满足预设阈值的多热编码对应的基础成分聚类为同一基础成分簇。
在一种可能的实现方式中,所述第二映射表的获取步骤,包括:
分别对各所述基础成分簇以及各所述基础产品分配地址;
根据全部所述基础成分簇的地址和全部所述基础产品的地址生成所述第二映射表。
在一种可能的实现方式中,所述生成所述第二映射表的步骤之后,所述方法还包括:
根据所述第二映射表,构建倒排索引表;
所述根据预先加载的基础成分簇与基础产品的第二映射表,查找与所述目标成分簇关联的至少一个目标产品的步骤,包括:
基于所述倒排索引表,采用弹性搜索引擎查找与所述目标成分簇关联的至少一个目标产品。
在一种可能的实现方式中,所述预设维度包括类别、功效、使用目的、风险类型和风险等级等信息中的至少两个。
在一种可能的实现方式中,所述聚类算法包括均值漂移聚类算法和凝聚层次聚类算法中的至少一种。
第二方面,本申请实施例提供了一种信息查询装置,所述信息查询装置包括:
信息接收模块,用于接收用户输入的目标成分的名称;
第一信息查找模块,用于根据预先加载的基础成分与基础成分簇的第一映射表,查找所述目标成分所属的目标成分簇;
第二信息查找模块,用于根据预先加载的基础成分簇与基础产品的第二映射表,查找与所述目标成分簇关联的至少一个目标产品。
第三方面,本申请实施例提供了一种计算机设备,所述计算机设备包括计算机可读存储介质及处理器,所述计算机可读存储介质上存储有计算机程序,所述计算机程序在被所述处理器执行时,实现第一方面提供的信息查询方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序在被一个或多个处理器执行时,实现本申请提供的信息查询方法。
本申请实施例提供的信息查询方法,通过根据预先加载的基础成分与基础成分簇的第一映射表,查找目标成分所属的目标成分簇,细化了查询领域,实现了根据用户需求对目标产品的精准查询;随后,根据预先加载的基础成分簇与基础产品的第二映射表,便可查找与目标成分簇关联的至少一个目标产品,提高了查询反馈的速度,增强了用户的查询使用体验。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例提供的一种计算机设备的结构示意图;
图2示出了本申请实施例提供的一种信息查询方法流程图;
图3示出了本申请实施例提供的一种信息查询方法所涉及的一种成分的成分知识图谱;
图4示出了本申请实施例提供的一种信息查询方法所涉及的一种成分各维度的多热编码图;
图5示出了本申请实施例提供的一种信息查询装置的模块示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
请参照图1,图1为本申请实施例提供的一种计算机设备的结构示意图,该电子设备可以为具有数据处理能的电子设备,例如,个人电脑、服务器等。存储器120及处理器130各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述计算机设备100包括至少一个可以软件或固件(Firmware)的形式存储于所述存储器120中或固化在所述计算机设备100的操作系统(Operating System,OS)中的软件功能模块。所述处理器130用于执行所述存储器120中存储的可执行模块,例如所述信息查询装置110所包括的软件功能模块及计算机程序等。
其中,所述存储器120可以是,但不限于,随机存取存储器(Random AccessMemory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(ProgrammableRead-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。其中,存储器120用于存储程序,所述处理器130在接收到执行指令后,执行所述程序。
所述处理器130可能是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Process,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
请参照图2,图2为本申请实施例提供的一种信息查询方法流程图,以下将对该方法包括的各个步骤进行详细阐述。
S210,接收用户输入的目标成分的名称。
虽然用户在查询产品的过程中,关注点越来越细化,除了成分之外,往往还会涉及如功能和作用等细分领域,但是涉及具体的查询,多数用户会选择根据该产品的成分进行查询。这种情况下,服务器就可以接收用户输入的成分名称进而查询目标产品。其中,用户意向查询的产品所涉及的成分定义为目标成分。
可选地,为方便用户查询,用户还可以不用查看产品的成分信息,用户可根据所持有的产品,直输入该产品的名称即可,在这种情况下,服务器可根据内置的产品库,自动查询该产品并解析出该产品的所有成分。再根据解析出的成分查询目标产品。
计算机设备在接收到用户的用户输入的信息之后,需要根据这些信息查询成分相同或相似的产品。
S220,根据预先加载的基础成分与基础成分簇的第一映射表,查找所述目标成分所属的目标成分簇。
其中,基础成分为服务器内置产品库中全部产品的全部成分,基础成分簇是基础成分经过聚类算法进行聚类后得到的,第一映射表包含基础成分和基础成分簇。
在本实施例中,以用户输入的目标成分的名称为例,计算机设备可根据该目标成分的名称通过预先加载的第一映射表查询到目标成分归属的目标成分簇。
S230,根据预先加载的基础成分簇与基础产品的第二映射表,查找与所述目标成分簇关联的至少一个目标产品。
第二映射表包括基础成分簇和基础产品,可根据第二映射表查询目标产品。
具体地,在查询到目标成分簇之后,服务器变可根据目标成分簇通过服务器内置的第二映射表查找到至少一个目标产品,其中,第二映射表由基础成分簇和基础产品组成的。
综上,在本实施例中,通过根据预先加载的基础成分与基础成分簇的第一映射表,查找目标成分所属的目标成分簇,细化了查询领域,实现了根据用户需求对目标产品的精准查询;随后,根据预先加载的基础成分簇与基础产品的第二映射表,便可查找与目标成分簇关联的至少一个目标产品,提高了查询反馈的速度,增强了用户的查询使用体验。
其中,S220步骤中所涉及的第一映射表的获取步骤,包括:
获取各所述基础成分的属性参数;
通过预设维度,建立所述基础成分与所述基础成分的全部属性参数之间的关联关系;
基于所述基础成分的全部属性参数为各所述预设维度赋值,并根据所述基础成分及全部预设维度的参数值,构建所述基础成分的成分知识图谱;
根据各所述基础成分的知识图谱之间的相似度,采用聚类算法确定各所述基础成分归属的基础成分簇,其中,每个成分簇包含至少一种不同的所述基础成分;
根据各所述基础成分归属的基础成分簇,建立所述第一映射表。
具体地,在获取基础成分后,可进一步获取与基础成分的属性参数,其中,属性参数包括植物提取物、美白、防晒、致敏和孕妇慎用等,可选地,属性参数可以通过与该成分相关的说明书中获取,或者通过互联网自动查询得到。
然后,可根据全部属性参数为各预设维度赋值,构建基础成分的成分知识图谱。可选地,预设维度包括类别、功效、使用目的、风险类型、风险等级、是否为活性成分和是否含长波黑斑效应紫外线(Ultraviolet A,UVA)吸收剂或中波红斑效应紫外线(UltravioletB,UVB)吸收剂中的至少一个。
可选地,聚类算法包括均值漂移聚类算法和凝聚层次聚类算法中的至少一种。
其中,针对基础成分簇,存在某一个基础成分的各个预设维度的赋值组合很少见时,这个基础成分会单独形成一个基础成分簇,不同的基础成分簇是可以进行合并的,示例性地,如基础成分簇A和基础成分簇B,若A和B合并后的成分簇内存在两个基础成分且这个两个基础成分对应赋值不同的预设维度的数量超过预设阈值,则取消A和B的合并,可选地,预设阈值为1,也可根据用户需求进行设置。
在一种可能的实施方式中,请参照图3,图3为本申请实施例提供的一种信息查询方法所涉及的一种成分的成分知识图谱,以成分A为例,可以对成分A所对应的类别、功效、使用目的、风险类型和风险等级等不同维度进行取值,比如使用目的取值为防晒、功效取值为美白等,如此,便构建了属于成分A的成分知识图谱。进一步地,针对各基础成分,均可采用相同的方式进行成分知识图谱的构建,得到多个成分知识图谱。
为了满足用户的查询需求,细化用户的查询领域,可根据预设维度通过聚类的方式,将用户实际深层次关注的形如一些成分都具备美白功效且有孕妇慎用等属性参数对应的成分进行聚类,得到一个成分簇,该成分簇下便包含与用户实际关注的属性参数所对应的至少一个基础成分。为提高服务器的查询效率和准确度,可通过多热编码的形式表示各属性参数,进而得到基础成分簇。
可选地,在一个基础成分簇达到预定数量阈值的情况下,可根据专家建议或一定的规则进行拆分,避免基础成分簇所含基础成分过多,影响查询效率。
具体地,生成与各所述基础成分的各属性参数对应的位向量,其中,不同所述属性参数的所述位向量不同;
将各所述基础成分的各属性参数对应的位向量拼接,获得每个所述基础成分的多热编码;
将相似度满足预设阈值的多热编码对应的基础成分聚类为同一基础成分簇。
具体地,以成分A和成分B为例,请参照图4,图4为本申请实施例提供的一种信息查询方法所涉及的一种成分各维度的多热编码图,若成分A的风险等级的多热编码为00100,成分B的风险等级的多热编码为00100,而位向量00100都表示风险等级为2级,这种情况下,可认为成分A和成分B的多热编码的相似度为1。这时候,需要判断多热编码的相似度与预设阈值进行比较,若预设阈值为1,则可认为成分A和成分B为相似或相同成分,可以将成分A和成分B进行聚类,归到同一个成分簇。可选的,预设阈值可根据用户需要进行设定。其中,在预设维度中,功效、使用目的的赋值可以分别有多个,比如,当成分A的风险类型的多热编码为100000010000,其中100000在风险类型中表示为孕妇慎用,010000在风险类型中表示为致敏。
其中,S230步骤中所涉及的第二映射表的获取步骤,包括:
分别对各所述基础成分簇以及各所述基础产品分配地址;
根据全部所述基础成分簇的地址和全部所述基础产品的地址生成所述第二映射表。
可选地,还可以为基础成分分配地址,由于基础成分和基础成分簇已经确定,服务器在查询的过程中,可直接识别各个地址以进行快速查询,也节省了查询时间,提高了查询效率。
为各基础成分和各基础成分所属的基础成分簇分配地址并为各基础成分进行分簇后可参照下表1。
表1
其中,为避免基础成分簇列表中同一基础成分簇的地址重复出现,还需要对基础成分簇地址列表进行去重。
为各基础成分簇分配和各基础产品分配地址后可生成第二映射表如表2。
表2
进一步地,可根据第二映射表中的基础成分簇和基础产品构建倒排索引表,随后,可采用弹性搜索引擎查找与目标成分簇相关联的至少一个目标产品。
具体地,将第二映射表中的基础成分簇地址,这里的地址用id表示,也即将第二映射表中的基础成分id进行切分,得到多个基础成分id,然后将这多个基础成分id作为关键字加入倒排索引结构中,形成倒排索引表,然后生成基础成分簇id和基础产品id在弹性搜索引擎中定义的MAPPING结构,以伪代码的形式进行展示如下:
其中,“goods_id”表示基础产品id,“type”:“text”表示对基础产品id以普通文本的方式来记录,“type”:“keyword”、“seperator”:COMMA表示对基础成分簇id使用逗号进行切分,并将切分结果作为关键字加入到倒排索引结构,在根据基础产品id创建基础产品文档索引,根据倒排索引结构和基础产品文档索引构建倒排索引表。
以查询到id分别为43307和43853的产品为例的倒排索引表,请参照下表3。
表3
基础成分簇id | 产品43307 | 产品43853 |
2 | √ | √ |
4 | √ | √ |
136 | √ | √ |
391 | √ | √ |
8981 | √ | |
3529 | √ | |
… |
其中,打钩符号表示该产品中有对应基础成分簇中的基础成分。
具体地,以查询的目标成分已聚类到目标成分簇id1、目标成分簇id2和目标成分簇id3中为例,采用query结构和should条件查询目标产品,具体伪代码如下:
其中,“ingredient_id”表示基础成分簇id;“score”:1表示得分1;“score_mode”:SUM表示采用求和模式将得分进行求和;“FROM:0,SIZE:N”用于控制返回查询结果的前N个,控制返回查询到的目标产品的数量可根据用户的需求进行设置。
具体的地,若查询到与目标成分对应的目标成簇地址,则记含有该目标成分簇地址的产品得1分,然后将得分进行求和,根据产品得分高低将产品进行排名,服务器再根据预定查询数量返回给用户查询到的目标产品。
虽然弹性搜索引擎功能强大,但无法具体应用到该目标产品的查询中,通过上述将基础成分簇地址列表做分词,将每个成分簇id都创建到倒排索引中,便可采用弹性搜索引擎搜索到目标产品。
综上,本申请通过根据预先加载的基础成分与基础成分簇的第一映射表,查找目标成分所属的目标成分簇,细化了查询领域,实现了根据用户需求对目标产品的精准查询;随后,根据预先加载的基础成分簇与基础产品的第二映射表,再根据第二映射表构建倒排索引,通过弹性搜索引擎可查找与目标成分簇关联的至少一个目标产品,提高了查询反馈的速度,增强了用户的查询使用体验。
与上述方法实施例相对应,本申请还提供一种信息查询装置。
请参照图5,图5为本申请实施例提供的一种信息查询装置的模块示意图,该信息查询装置500包括信息接收模块510、第一信息查找模块520和第二信息查找模块530,其中该信息查询装置500可以为上述计算机设备100中的信息查询装置110;
所述信息接收模块510,可用于接收用户输入的目标成分的名称;
所述第一信息查找模块520,可用于根据预先加载的基础成分与基础成分簇的第一映射表,查找所述目标成分所属的目标成分簇;
所述第二信息查找模块530,可用于根据预先加载的基础成分簇与基础产品的第二映射表,查找与所述目标成分簇关联的至少一个目标产品。
本实施例提供的信息查询装置、计算机设备及计算机可读存储介质,通过根据预先加载的基础成分与基础成分簇的第一映射表,查找目标成分所属的目标成分簇,细化了查询领域,实现了根据用户需求对目标产品的精准查询;随后,根据预先加载的基础成分簇与基础产品的第二映射表,便可查找与目标成分簇关联的至少一个目标产品,提高了查询反馈的速度,增强了用户的查询使用体验。
本实施例提供的信息查询装置的具体实施过程,可以参见上述信息查询方法的具体实施过程,在此不再一一赘述。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种信息查询方法,其特征在于,所述方法包括:
接收用户输入的目标成分的名称;
根据预先加载的基础成分与基础成分簇的第一映射表,查找所述目标成分所属的目标成分簇;
根据预先加载的基础成分簇与基础产品的第二映射表,查找与所述目标成分簇关联的至少一个目标产品。
2.根据权利要求1所述的信息查询方法,其特征在于,所述第一映射表的获取步骤,包括:
获取各所述基础成分的属性参数;
通过预设维度,建立所述基础成分与所述基础成分的全部属性参数之间的关联关系;
基于所述基础成分的全部属性参数为各所述预设维度赋值,并根据所述基础成分及全部预设维度的参数值,构建所述基础成分的成分知识图谱;
根据各所述基础成分的知识图谱之间的相似度,采用聚类算法确定各所述基础成分归属的基础成分簇,其中,每个成分簇包含至少一种不同的所述基础成分;
根据各所述基础成分归属的基础成分簇,建立所述第一映射表。
3.根据权利要求2所述的信息查询方法,其特征在于,所述采用聚类算法确定各所述基础成分所属的基础成分簇的步骤,包括:
生成与各所述基础成分的各属性参数对应的位向量,其中,不同所述属性参数的所述位向量不同;
将各所述基础成分的各属性参数对应的位向量拼接,获得每个所述基础成分的多热编码;
将相似度满足预设阈值的多热编码对应的基础成分聚类为同一基础成分簇。
4.根据权利要求2所述的信息查询方法,其特征在于,所述第二映射表的获取步骤,包括:
分别对各所述基础成分簇以及各所述基础产品分配地址;
根据全部所述基础成分簇的地址和全部所述基础产品的地址生成所述第二映射表。
5.根据权利要求4所述的信息查询方法,其特征在于,所述生成所述第二映射表的步骤之后,所述方法还包括:
根据所述第二映射表,构建倒排索引表;
所述根据预先加载的基础成分簇与基础产品的第二映射表,查找与所述目标成分簇关联的至少一个目标产品的步骤,包括:
基于所述倒排索引表,采用弹性搜索引擎查找与所述目标成分簇关联的至少一个目标产品。
6.根据权利要求2所述的信息查询方法,其特征在于,所述预设维度包括类别、功效、使用目的、风险类型和风险等级等信息中的至少两个。
7.根据权利要求2所述的信息查询方法,其特征在于,所述聚类算法包括均值漂移聚类算法和凝聚层次聚类算法中的至少一种。
8.一种信息查询装置,其特征在于,所述信息查询装置包括:
信息接收模块,用于接收用户输入的目标成分的名称;
第一信息查找模块,用于根据预先加载的基础成分与基础成分簇的第一映射表,查找所述目标成分所属的目标成分簇;
第二信息查找模块,用于根据预先加载的基础成分簇与基础产品的第二映射表,查找与所述目标成分簇关联的至少一个目标产品。
9.一种计算机设备,其特征在于,所述计算机设备包括计算机可读存储介质及处理器,所述计算机可读存储介质上存储有计算机程序,所述计算机程序在被所述处理器执行时实现权利要求1-7中任一项所述的信息查询方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该计算机程序在被一个或多个处理器执行时,实现权利要求1-7中任一项所述的信息查询方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110897054.2A CN113569058A (zh) | 2021-08-05 | 2021-08-05 | 一种信息查询方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110897054.2A CN113569058A (zh) | 2021-08-05 | 2021-08-05 | 一种信息查询方法、装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113569058A true CN113569058A (zh) | 2021-10-29 |
Family
ID=78170539
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110897054.2A Pending CN113569058A (zh) | 2021-08-05 | 2021-08-05 | 一种信息查询方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113569058A (zh) |
Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831241A (zh) * | 2012-09-11 | 2012-12-19 | 山东理工大学 | 产品逆向工程数据动态索引多目标自适应构建方法 |
CN104281955A (zh) * | 2014-05-26 | 2015-01-14 | 重庆炬野科技发展有限公司 | 商品信息追溯方法和设备系统 |
KR20160021311A (ko) * | 2014-08-13 | 2016-02-25 | (주)폭스앤플래닛 | Odm 기반의 화장품 사업을 위한 협업 중개시스템 |
CN108304444A (zh) * | 2017-11-30 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 信息查询方法及装置 |
CN108492048A (zh) * | 2018-03-30 | 2018-09-04 | 北京半导体专用设备研究所(中国电子科技集团公司第四十五研究所) | 物料跟踪方法及装置 |
CN110083766A (zh) * | 2019-04-26 | 2019-08-02 | 北京邮电大学 | 一种基于元路径引导嵌入的查询推荐方法及装置 |
KR20200063299A (ko) * | 2018-11-19 | 2020-06-05 | 유소현 | 빅데이터 기반 인공지능 기계학습을 이용한 피부관리 추천 서비스 제공 방법 |
CN111414554A (zh) * | 2020-03-26 | 2020-07-14 | 透明生活(武汉)信息科技有限公司 | 一种商品推荐方法、系统,服务器及存储介质 |
CN111462856A (zh) * | 2020-03-30 | 2020-07-28 | 李睿 | 一种化妆品与皮肤的智能匹配方法 |
CN111860575A (zh) * | 2020-06-05 | 2020-10-30 | 百度在线网络技术(北京)有限公司 | 物品属性信息的处理方法、装置、电子设备和存储介质 |
CN111951979A (zh) * | 2020-08-13 | 2020-11-17 | 上海森亿医疗科技有限公司 | 药物信息标准化方法、药物信息标准化与检索平台和设备 |
CN112184280A (zh) * | 2019-07-02 | 2021-01-05 | 罗成镇 | 化妆品的天然原料需求预测方法及执行这种方法的装置 |
CN112559733A (zh) * | 2019-09-26 | 2021-03-26 | 阿里巴巴集团控股有限公司 | 信息获取方法、装置、电子设备及计算机可读存储介质 |
CN112667770A (zh) * | 2019-10-15 | 2021-04-16 | 北京京东尚科信息技术有限公司 | 一种对物品进行分类的方法和装置 |
CN112765428A (zh) * | 2021-01-15 | 2021-05-07 | 济南大学 | 恶意软件家族聚类及识别方法及系统 |
CN112951443A (zh) * | 2021-04-16 | 2021-06-11 | 平安科技(深圳)有限公司 | 症候群监测预警方法、装置、计算机设备及存储介质 |
CN112951446A (zh) * | 2021-04-16 | 2021-06-11 | 平安科技(深圳)有限公司 | 基于医药图谱的药品查询方法、装置、设备及存储介质 |
KR20210086138A (ko) * | 2019-12-31 | 2021-07-08 | 주식회사 아트랩 | 화장품 제조 또는 마케팅을 위한 전자 장치, 방법, 및 컴퓨터 판독가능 매체 |
KR20210086136A (ko) * | 2019-12-31 | 2021-07-08 | 주식회사 아트랩 | 화장품 제조 및 분석을 위한 전자 장치, 방법, 및 컴퓨터 판독가능 매체 |
-
2021
- 2021-08-05 CN CN202110897054.2A patent/CN113569058A/zh active Pending
Patent Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831241A (zh) * | 2012-09-11 | 2012-12-19 | 山东理工大学 | 产品逆向工程数据动态索引多目标自适应构建方法 |
CN104281955A (zh) * | 2014-05-26 | 2015-01-14 | 重庆炬野科技发展有限公司 | 商品信息追溯方法和设备系统 |
KR20160021311A (ko) * | 2014-08-13 | 2016-02-25 | (주)폭스앤플래닛 | Odm 기반의 화장품 사업을 위한 협업 중개시스템 |
CN108304444A (zh) * | 2017-11-30 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 信息查询方法及装置 |
CN108492048A (zh) * | 2018-03-30 | 2018-09-04 | 北京半导体专用设备研究所(中国电子科技集团公司第四十五研究所) | 物料跟踪方法及装置 |
KR20200063299A (ko) * | 2018-11-19 | 2020-06-05 | 유소현 | 빅데이터 기반 인공지능 기계학습을 이용한 피부관리 추천 서비스 제공 방법 |
CN110083766A (zh) * | 2019-04-26 | 2019-08-02 | 北京邮电大学 | 一种基于元路径引导嵌入的查询推荐方法及装置 |
CN112184280A (zh) * | 2019-07-02 | 2021-01-05 | 罗成镇 | 化妆品的天然原料需求预测方法及执行这种方法的装置 |
CN112559733A (zh) * | 2019-09-26 | 2021-03-26 | 阿里巴巴集团控股有限公司 | 信息获取方法、装置、电子设备及计算机可读存储介质 |
CN112667770A (zh) * | 2019-10-15 | 2021-04-16 | 北京京东尚科信息技术有限公司 | 一种对物品进行分类的方法和装置 |
KR20210086138A (ko) * | 2019-12-31 | 2021-07-08 | 주식회사 아트랩 | 화장품 제조 또는 마케팅을 위한 전자 장치, 방법, 및 컴퓨터 판독가능 매체 |
KR20210086136A (ko) * | 2019-12-31 | 2021-07-08 | 주식회사 아트랩 | 화장품 제조 및 분석을 위한 전자 장치, 방법, 및 컴퓨터 판독가능 매체 |
CN111414554A (zh) * | 2020-03-26 | 2020-07-14 | 透明生活(武汉)信息科技有限公司 | 一种商品推荐方法、系统,服务器及存储介质 |
CN111462856A (zh) * | 2020-03-30 | 2020-07-28 | 李睿 | 一种化妆品与皮肤的智能匹配方法 |
CN111860575A (zh) * | 2020-06-05 | 2020-10-30 | 百度在线网络技术(北京)有限公司 | 物品属性信息的处理方法、装置、电子设备和存储介质 |
CN111951979A (zh) * | 2020-08-13 | 2020-11-17 | 上海森亿医疗科技有限公司 | 药物信息标准化方法、药物信息标准化与检索平台和设备 |
CN112765428A (zh) * | 2021-01-15 | 2021-05-07 | 济南大学 | 恶意软件家族聚类及识别方法及系统 |
CN112951443A (zh) * | 2021-04-16 | 2021-06-11 | 平安科技(深圳)有限公司 | 症候群监测预警方法、装置、计算机设备及存储介质 |
CN112951446A (zh) * | 2021-04-16 | 2021-06-11 | 平安科技(深圳)有限公司 | 基于医药图谱的药品查询方法、装置、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
VINCENT A.L. WORTEL 等: "Skin sensory performance of individual personal care ingredients and marketed personal care products", FOOD QUALITY AND PREFERENCE, vol. 11, no. 1, 31 January 2000 (2000-01-31), pages 121 - 127 * |
周万珍 等: "基于 k-means 与 Apriori 算法的食物营养成分分析", 科学技术与工程, vol. 18, no. 17, 30 June 2018 (2018-06-30), pages 211 - 216 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110866181B (zh) | 资源推荐的方法、装置及存储介质 | |
CN108804641B (zh) | 一种文本相似度的计算方法、装置、设备和存储介质 | |
US9454580B2 (en) | Recommendation system with metric transformation | |
US10504120B2 (en) | Determining a temporary transaction limit | |
CN111008321B (zh) | 基于逻辑回归推荐方法、装置、计算设备、可读存储介质 | |
CN111523010A (zh) | 推荐方法、装置、终端设备及计算机存储介质 | |
US20130339369A1 (en) | Search Method and Apparatus | |
US20220414131A1 (en) | Text search method, device, server, and storage medium | |
CN111178949A (zh) | 服务资源匹配参考数据确定方法、装置、设备和存储介质 | |
CN111325030A (zh) | 文本标签构建方法、装置、计算机设备和存储介质 | |
CN111639255A (zh) | 搜索关键词的推荐方法、装置、存储介质及电子设备 | |
KR102057321B1 (ko) | 상품에 관한 정보를 증강하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 | |
CN112860850B (zh) | 人机交互方法、装置、设备及存储介质 | |
EP3886029A1 (en) | Method and system for unsupervised multi-modal set completion and recommendation | |
CN113111182A (zh) | 信息推荐方法及装置、计算机可存储介质 | |
CN111144098B (zh) | 扩展问句的召回方法和装置 | |
CN113569058A (zh) | 一种信息查询方法、装置及计算机可读存储介质 | |
CN112182264A (zh) | 地标信息的确定方法、装置、设备及可读存储介质 | |
CN112069337A (zh) | 图片处理方法、装置、电子设备及存储介质 | |
CN109558463B (zh) | 一种智能报表的数据处理方法、装置及存储介质 | |
KR102495793B1 (ko) | 가속화된 대규모 유사성 계산 | |
CN110990701A (zh) | 书籍搜索方法、计算设备及计算机存储介质 | |
CN114004212A (zh) | 数据处理方法、装置及存储介质 | |
CN112182403A (zh) | 问题查询方法、装置、设备及存储介质 | |
CN109325791B (zh) | 一种sem广告竞争分析方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |