CN117131095A - 知识库对接方法、装置、设备及介质 - Google Patents
知识库对接方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN117131095A CN117131095A CN202310863332.1A CN202310863332A CN117131095A CN 117131095 A CN117131095 A CN 117131095A CN 202310863332 A CN202310863332 A CN 202310863332A CN 117131095 A CN117131095 A CN 117131095A
- Authority
- CN
- China
- Prior art keywords
- knowledge base
- application scene
- search
- tag
- application
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000003032 molecular docking Methods 0.000 title claims abstract description 43
- 238000004458 analytical method Methods 0.000 claims abstract description 56
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 29
- 239000002537 cosmetic Substances 0.000 claims abstract description 7
- 238000004891 communication Methods 0.000 claims description 18
- 230000003796 beauty Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 4
- 230000009191 jumping Effects 0.000 claims description 4
- 230000001960 triggered effect Effects 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 6
- 230000008451 emotion Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000003058 natural language processing Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 102000016916 Complement C8 Human genes 0.000 description 2
- 108010028777 Complement C8 Proteins 0.000 description 2
- 102100040401 DNA topoisomerase 3-alpha Human genes 0.000 description 2
- 101000611068 Homo sapiens DNA topoisomerase 3-alpha Proteins 0.000 description 2
- DFPAKSUCGFBDDF-UHFFFAOYSA-N Nicotinamide Chemical compound NC(=O)C1=CC=CN=C1 DFPAKSUCGFBDDF-UHFFFAOYSA-N 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229960003966 nicotinamide Drugs 0.000 description 1
- 235000005152 nicotinamide Nutrition 0.000 description 1
- 239000011570 nicotinamide Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012559 user support system Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种知识库对接方法、装置、设备及介质,该方法包括:构建包括多个行业的知识库,其中,多个行业包括美妆行业以及手机行业;检测当前的应用场景,其中,应用场景包括搜索框应用场景、词云应用场景、内容分析应用场景、算法推荐应用场景以及图表下钻应用场景;采用与应用场景匹配的对接策略与知识库对接。本申请通过在不用的需求场景下以与需求场景匹配的策略对接知识库,解决了无法在快速准确获得查询结果的同时满足用户下钻分析的需求场景的问题。
Description
技术领域
本申请涉及深度学习技术领域,尤其涉及一种知识库对接方法、装置、设备及介质。
背景技术
知识库是知识工程中结构化、易操作、易利用、全面有组织的知识集群,是针对某些领域问题求解的需要,采用某些知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合。知识库可用于轻松创建、组织、查找和共享知识,将分散在各处的知识集中起来。例如,知识库能充当企业内所有成员的知识的门户,在企业进行知识管理过程中能够起到重要作用,但是现有知识库无法在快速准确获得查询结果的同时满足用户下钻分析的需求场景。
发明内容
本申请提供了一种知识库对接方法、装置、设备及介质,以解决上述“现有知识库无法在快速准确获得查询结果的同时满足用户下钻分析的需求场景”的技术问题。
根据本申请实施例的一个方面,本申请提供了一种知识库对接方法,包括:构建包括多个行业的知识库,其中,多个行业包括美妆行业以及手机行业;检测当前的应用场景,其中,应用场景包括搜索框应用场景、词云应用场景、内容分析应用场景、算法推荐应用场景以及图表下钻应用场景;采用与应用场景匹配的对接策略与知识库对接。
可选地,采用与应用场景匹配的对接策略与知识库对接包括:在应用场景为搜索框应用场景的情况下,获取用户输入的检索字段;根据知识库获取与检索字段对应的关键词标签;以关键词标签作为索引从知识库中查询与检索字段对应的数据。
可选地,根据知识库获取与检索字段对应的关键词标签包括:获取搜索历史记录,并从搜索历史记录中确定与检索字段匹配的第一标签;从知识库寻找与检索字段匹配的第二标签;整合第一标签与第二标签,得到关键词标签。
可选地,采用与应用场景匹配的对接策略与知识库对接包括:在应用场景为词云应用场景的情况下,获取用户输入的检索字段;根据知识库获取与检索字段存在关联关系的标签词,并获取标签词的第一标签维度;统计第一标签维度的第一维度数量,以及在第一维度数量小于第一预设数量时,则根据声量从提及检索字段的帖子中选取第二标签维度,以使第一维度数量与第二标签维度的第二维度数量之和为第一预设数量。
可选地,采用与应用场景匹配的对接策略与知识库对接包括:在应用场景为内容分析应用场景的情况下,获取用户输入的检索字段;根据知识库获取与检索字段对应的实体类型,并将实体类型作为一级标签进行展示;获取与实体类型对应的实体标签,以及在一级标签被选中时,将实体标签作为二级标签进行展示。
可选地,采用与应用场景匹配的对接策略与知识库对接包括:在应用场景为算法推荐应用场景的情况下,获取用户输入的检索字段;根据知识库获取与检索字段对应的实体类型,并获取与实体类型对应的第二预设数量的实体标签;从知识库中提取与检索字段相关的推荐数据,并根据实体标签展示推荐数据。
可选地,采用与应用场景匹配的对接策略与知识库对接包括:在应用场景为图表下钻应用场景的情况下,若检测到用户输入的检索字段,则对接知识库中与检索字段对应的行业库;生成与检索字段对应的词云,并在检测到任一词云被选中的情况下,根据行业库对被选中的词云进行内容分析;展示内容分析的分析结果,并在分析结果中的任一原帖组件被触发的情况下,跳转至与原帖组件对应的原帖数据。
根据本申请实施例的另一个方面,本申请还提供了一种知识库对接装置,包括:构建模块,用于构建包括多个行业的知识库,其中,多个行业包括美妆行业以及手机行业;检测模块,用于检测当前的应用场景,其中,应用场景包括搜索框应用场景、词云应用场景、内容分析应用场景、算法推荐应用场景以及图表下钻应用场景;对接模块,用于采用与应用场景匹配的对接策略与知识库对接。
根据本申请实施例的另一个方面,本申请还提供了一种电子设备,包括存储器、处理器、通信接口及通信总线,存储器中存储有可在处理器上运行的计算机程序,存储器、处理器通过通信总线和通信接口进行通信,处理器执行计算机程序时实现上述任一方法的步骤。
根据本申请实施例的另一个方面,本申请还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,程序代码使处理器执行上述任一方法。
本申请技术方案可以应用于深度学习技术进行自然语言处理的设计。
本申请实施例提供的上述技术方案与相关技术相比具有如下优点:
本申请提供一种知识库对接方法,包括:构建包括多个行业的知识库,其中,多个行业包括美妆行业以及手机行业;检测当前的应用场景,其中,应用场景包括搜索框应用场景、词云应用场景、内容分析应用场景、算法推荐应用场景以及图表下钻应用场景;采用与应用场景匹配的对接策略与知识库对接。本申请通过在不用的需求场景下以与需求场景匹配的策略对接知识库,解决了无法在快速准确获得查询结果的同时满足用户下钻分析的需求场景的问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为根据本申请实施例提供的一种可选的知识库对接方法的流程图;
图2为根据本申请实施例提供的一种可选的知识库对接装置的框图;
图3为根据本申请实施例提供的一种可选的电子设备结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本申请的说明,其本身并没有特定的意义。因此,“模块”与“部件”可以混合地使用。
知识库是知识工程中结构化、易操作、易利用、全面有组织的知识集群,是针对某些领域问题求解的需要,采用某些知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合。知识库可用于轻松创建、组织、查找和共享知识,将分散在各处的知识集中起来。例如,知识库能充当企业内所有成员的知识的门户,在企业进行知识管理过程中能够起到重要作用,但是现有知识库无法在快速准确获得查询结果的同时满足用户下钻分析的需求场景。
为了解决背景技术中提及的问题,根据本申请实施例的一个方面,本申请提供了一种知识库对接方法,如图1所示,包括:
步骤101,构建包括多个行业的知识库,其中,多个行业包括美妆行业以及手机行业;
步骤103,检测当前的应用场景,其中,应用场景包括搜索框应用场景、词云应用场景、内容分析应用场景、算法推荐应用场景以及图表下钻应用场景;
步骤105,采用与应用场景匹配的对接策略与知识库对接。
本申请涉及一种知识库接入方法,尤其涉及一种行业知识库接入方法,将美妆行业知识库和手机行业知识库接入原有的知识库,然后根据不同的应用场景执行相应的接入方式与包括美妆行业知识库和手机行业知识库的知识库对接,从而实现在不同场景准确得到查询结果的同时满足用户下钻分析的需求。
行业知识库的标签和现有系统上的规则(包含词逻辑)在本质上是两套并行的查询逻辑,是分析对象的两种不同的生成形式,得出的结果也是不同的。
作为一种可选的实施例,采用与应用场景匹配的对接策略与知识库对接包括:在应用场景为搜索框应用场景的情况下,获取用户输入的检索字段;根据知识库获取与检索字段对应的关键词标签;以关键词标签作为索引从知识库中查询与检索字段对应的数据。
用户检索关键词标签时不扣除搜索次数配额,选择标签后点击查询才会扣除搜索次数配额。
当用户搜索多个标签时,从第二个标签开始只能在相同行业知识库中检索结果,即不支持用户进行不同行业的标签对比,也就是说,如果是同一个知识库则允许搜索和查询。
作为一种可选的实施例,根据知识库获取与检索字段对应的关键词标签包括:获取搜索历史记录,并从搜索历史记录中确定与检索字段匹配的第一标签;从知识库寻找与检索字段匹配的第二标签;整合第一标签与第二标签,得到关键词标签。
关键词标签为搜索提示词,主要通过小库精准命中标签以及搜索历史记录得到,最终只有关键词,标签,自定义,分组的四种结果返回的场景,优先级从高到低排序为:关键词,标签,自定义,分组。
可选地,用户在搜索关键词标签时,需要在已对接的所有行业库中匹配相应的结果,如在多个知识库中命中关键词,则需要返回多个结果,不同的结果以行业库的命名区分。
可选地,用户在搜索关键词标签时,支持“实时”的“精准匹配”。
可选地,用户选择关键词标签后,无法进行编辑。
可选地,用户选择标签后,时间组件需要限制可选的时间不能小于预设时间(如,2021年9月1日)。
具体地,用户在搜索框搜索关键词时,在历史记录中带有标签的分析对象也需要打上最近搜的标签(如自定义,知识库标签等)。热点榜单、KOL速查榜、行业智库在用户搜索关键词时,如命中历史记录,也保留最近搜标签。
优先展示有最近搜标签的,没有最近搜标签的以关键词-标签-自定义-分组顺序展示。因为历史记录中不会有分组,所以都有最近搜标签的,组合后依旧以关键词-标签-自定义顺序展示。
作为一种可选的实施例,采用与应用场景匹配的对接策略与知识库对接包括:在应用场景为词云应用场景的情况下,获取用户输入的检索字段;根据知识库获取与检索字段存在关联关系的标签词,并获取标签词的第一标签维度;统计第一标签维度的第一维度数量,以及在第一维度数量小于第一预设数量时,则根据声量从提及检索字段的帖子中选取第二标签维度,以使第一维度数量与第二标签维度的第二维度数量之和为第一预设数量。
先根据标签查询所有帖子,并按照“关联关系中的标签”进行分类,获取不同标签维度的聚合数据,并聚合出标签维度内部的标签count2、如果拿到的关联关系的标签维度小于第一预设数量(如,8),则从命中帖子的同时提及标签中获取帖子维度补足8个维度。
本申请的词云是分实体类型维度的词云(包含通用词云),当用户搜索标签后,在命中标签的帖子中找对应的所有原始实体类型及对应的实体展示;3C知识库因为只有3个实体类型是算法做的,所以3C知识库的原始实体只有3个。
具体地,用户搜索标签本身对应的实体类型也需要参与统计,但是在该实体类型下不显示搜索的原始实体词,需要根据对齐表做过滤,在对齐表中出现的所有对齐词都需要过滤掉;在通用词云中,也不显示搜索的分析对象名称的词。
如标签命中的原帖中没有数据的实体类型不展示,如所有实体类型均无数据,则默认展示通用,需要展示的实体类型需要通过以下逻辑判定,当用户搜索标签后:优先检索与该标签做过关系的原始实体对应的实体类型,最多展示8个,以声量作为统计指标(如一个帖子中有多个原始实体均有关系时,则此时实体类型的声量仅记作1);如没有检索出任何有关系的原始实体,则展示其他原始实体对应的实体类型(即同时提及其他标签),最多展示8个,以声量作为统计指标(如一个帖子中有多个同时提及标签时,则此时实体类型的声量仅记作1);如检索出与该标签做过关系的原始实体对应的实体类型不足8个,则顺位从其他原始实体对应的实体类型中按声量大小取排名靠前的补足;用户搜索标签本身对应的实体类型也需要参与统计,但是在该实体类型下不显示搜索的原始实体;在通用词云中,也不显示搜索的原始实体名称。
示例地,如用户搜索了“护肤品”,命中“护肤品”标签的帖子中跟“护肤品”有关系的标签有“欧莱雅”,欧莱雅对应的实体类型是品牌,则此时“品牌”就是做过关系的实体类型;但是跟“护肤品”同时提及的标签还有“烟酰胺”,则此时“烟酰胺”为其他实体类型。
具体地,单个实体类型的声量不会大于搜索对象的声量。每个实体类型维度下展示的词云均为实体词(此处展示的实体词为“原始实体词”),最多展示前100(声量统计)的实体词;如一个帖子中出现多个原始实体(包括有关系和同时提及)时,在实体词统计时需要分开计算;单个实体词的声量不会大于实体类型的声量。
当用户搜索多个标签时,展示的实体类型以本品为准;如对应的竞品在本品的实体类型上检索不到对应的标签,则显示NO DATA
具体地,本申请中的实体词云支持隐藏关键词、鼠标Hower显示指标,下钻查看原帖等;不展示声量和词频的切换按钮;实体词云最多支持两个词云同时对比;支持用户下拉切换不同的实体类型;枚举为通用加上实体维度;默认展示声量最高的实体类型。
在词云旁设置有注释按钮,提示文案可以是“结合NLP(Natural LanguageProcessing,自然语言处理)算法模型,展示当前条件下消费者在讨论搜索对象时提到的多维度结果”。
作为一种可选的实施例,采用与应用场景匹配的对接策略与知识库对接包括:在应用场景为内容分析应用场景的情况下,获取用户输入的检索字段;根据知识库获取与检索字段对应的实体类型,并将实体类型作为一级标签进行展示;获取与实体类型对应的实体标签,以及在一级标签被选中时,将实体标签作为二级标签进行展示。
首次查询小库数据统计后,需要对结果数进行校验,不足8个的需要再次查询补足8个。第一次查询统计的“标签关系”字段,二次查询统计的是“实体标签”字段,二次查询与第一次查询逻辑差别较大,因此分两次查询。
具体地,内容分析模块分为一级和二级,一级为实体类型,二级为实体类型下的标签。
需要说明的是,用户搜索标签本身对应的实体类型不参与统计展示的一级为实体类型,统计指标为声量,根据声量降序排列。
展示的二级为对应的一级实体类型下的实体标签,统计指标为声量,二级只展示TOP10。当用户搜索多个标签时,展示的实体类型以本品为准;如对应的竞品在本品的实体类型上检索不到对应的标签,则显示NO DATA。
用户可通过点击一级标签展开二级;默认选中排名第一的一级。鼠标hower一级展示的指标逻辑为“某个实体类型下所有分析对象的数值”;鼠标hower二级展示的指标逻辑为“某个实体标签下所有分析对象的数值”点击二级可支持下钻原帖内容分析旁有注释按钮,提示文案为“结合NLP算法模型,聚合当前条件下消费者在讨论搜索对象时提到的信息并根据声量大小取关键信息展示”。
作为一种可选的实施例,采用与应用场景匹配的对接策略与知识库对接包括:在应用场景为算法推荐应用场景的情况下,获取用户输入的检索字段;根据知识库获取与检索字段对应的实体类型,并获取与实体类型对应的第二预设数量的实体标签;从知识库中提取与检索字段相关的推荐数据,并根据实体标签展示推荐数据。
算法推荐场景中,仅进行标签查询。本申请通过算法推荐相关标签来查询标签实体类型统计数据,现有技术中只是查询标签加上实体词统计数据,两种查询逻辑有差别,因此需要分开处理。
具体地,推荐数据是用户当前搜索的标签对应的实体类型中所有实体标签在当前筛选条件下的数据表现,因用户搜索的标签会和推荐的标签重复,要做去重处理;所以算法推荐的个数保持一个原则“去重后的推荐个数最多到9个”(根据当前指标统计得出)。
示例地,若用户搜索了小棕瓶,小棕瓶对应的实体类型是产品,用户的查询范围为1月-3月小红书的数据;那推荐榜单中展示的实体为在1月-3月小红书中所有产品实体按照当前的排序条件降序展示最多TOP10。
在推荐的实体中,需要标记出跟当前搜索标签同时提及的实体标签。
示例地,若用户搜索了小棕瓶,在对应的产品实体类型中,有小蓝瓶,小黑瓶等实体标签,其中小蓝瓶有跟小棕瓶同时提及过,则需要在榜单中标记为“同时提及”。
用户切换排序条件时,需要根据新的指标重新计算生成新的推荐数据;可支持的排序指标为声量,互动量,曝光量。
关于推荐个数与分析对象个数说明(若分析对象个数为最多支持10个),当搜索框的分析对象个数>10个时,用户点击算法推荐会提示“当前分析对象个数已大于10,请调整后重试”;当搜索框的分析对象个数<10个时,用户点击算法推荐后的数量大于10个时,优先显示搜索框的内容,其余的通过算法推荐补齐到10个用户点击算法推荐后的数量小于10个时,全部显示。
具体地,算法推荐应用场景中,概览展示的指标为:声量,互动量,曝光量,情感指数(情感不是帖子的情感,而是实体本身的情感,如搜索的实体未做过情感,则用“-”表示)。概览默认展示TOP3,点击展开查看更多;如本品的数据不在TOP3,则在未展开的默认状态下需要将本品放在第四位,点击展开后本品的位置跟随实际的排名对应的位置显示;在规则查询时,榜单的显示逻辑沿用以上最新的显示逻辑。当用户搜索多个标签时,考虑到本品排名会较靠后,本品的排名以如下逻辑展示①0-100(含)直接显示排名;②100以上的显示100+;推荐的实体需要标记“算法推荐”;用户搜索的和现状一致;鼠标Hower“推荐”标记时,如果该实体同时提及了本品,则显示“该分析对象的数据中同时提到了本品”。推荐榜单展示的指标为:声量,互动量,曝光量,情感指数。
另外,当用户打开算法推荐时,需要将算法推荐的实体标签自动填充到现有的图表中在算法推荐旁有提示按钮;提示文案为:结合NLP算法模型自动推荐出与搜索对象同类型的其他分析对象的市场表现,并自动填充到图表中。
作为一种可选的实施例,采用与应用场景匹配的对接策略与知识库对接包括:在应用场景为图表下钻应用场景的情况下,若检测到用户输入的检索字段,则对接知识库中与检索字段对应的行业库;生成与检索字段对应的词云,并在检测到任一词云被选中的情况下,根据行业库对被选中的词云进行内容分析;展示内容分析的分析结果,并在分析结果中的任一原帖组件被触发的情况下,跳转至与原帖组件对应的原帖数据。
标签类型的图表下钻时,查询对应行业知识库的原帖,包括:切换ES的数据源;DSL(Domain Specific Language,领域特定语言)中的QueryString更换成标签查询;词云、内容分析场景接口下钻,支持标签维度+标签的下钻。
本申请中图表下钻的展示逻辑,分为词云,内容分析,原帖。
示例地,用户下钻后弹窗展示;点击词云或者内容分析的二级可展示原帖,原帖展开路径为向左推出展示。
具体地,本申请还涉及相似文章合并方面的内容,包括:
(1)默认不打开相似文章合并功能;
(2)当用户点击合并重复帖时,对于当前页面显示的最多100条的原帖要做相似文章的合并;如有帖子被合并,在页面上显示“已合并提及关键词的相似文章,共计++条”;如没有重复帖子,在页面上显示“未发现提及关键词的相似文章”(如,根据最近发布条件检索出最多100条帖子,其中20条帖子是相似的,要把相似的20条帖子合并在一起);
(3)显示顺序描述:有帖子被合并时,显示的帖子按照现状(即对应的排序条件)正常显示;当部分帖子被合并时,显示的帖子按照当前的排序条件先在组内执行,后在组间执行,其中,组内表示被合并在一起的一组帖子,按照当前排序条件选择一条,组间表示多组被合并的帖子,多组之间的一条按照当前排序条件展示在系统里;
(4)分页显示的帖子数量以组为数量显示,例:100条帖子被聚合为10组,则需要显示全部;
(5)在导出的数据中加入“相似文章标识”字段,如没有相似文章,则以N/A表示,如有相似文章,则以阿拉伯数字表示,聚在一起的相似文章需要标识相同的数字编号。
被合并在一起的帖子默认只展示一条,用户可点击展开显示全部的帖子,点击收起回到只展示一条的状态。
上述方法可应用于实时舆情:舆情趋势、平台分布、情感分布、用户画像;本竞品分析:本竞品趋势、本竞品平台分布、本竞品同时提及、声量情感分布;活动分析:活动表现趋势、活动分平台分析、活动情感表现、用户画像、活动KOL(Key Opinion Leader,关键意见领袖)表现。
本申请提供一种知识库对接方法,包括:构建包括多个行业的知识库,其中,多个行业包括美妆行业以及手机行业;检测当前的应用场景,其中,应用场景包括搜索框应用场景、词云应用场景、内容分析应用场景、算法推荐应用场景以及图表下钻应用场景;采用与应用场景匹配的对接策略与知识库对接。本申请通过在不用的需求场景下以与需求场景匹配的策略对接知识库,解决了无法在快速准确获得查询结果的同时满足用户下钻分析的需求场景的问题。
根据本申请实施例的另一个方面,本申请还提供了一种知识库对接装置,如图2所示,包括:
构建模块202,用于构建包括多个行业的知识库,其中,多个行业包括美妆行业以及手机行业;
检测模块204,用于检测当前的应用场景,其中,应用场景包括搜索框应用场景、词云应用场景、内容分析应用场景、算法推荐应用场景以及图表下钻应用场景;
对接模块206,用于采用与应用场景匹配的对接策略与知识库对接。
需要说明的是,该实施例中的构建模块202可以用于执行本申请实施例中的步骤101,该实施例中的检测模块204可以用于执行本申请实施例中的步骤103,该实施例中的对接模块206可以用于执行本申请实施例中的步骤105。
可选地,对接模块206还包括第一对接子模块,用于在应用场景为搜索框应用场景的情况下,获取用户输入的检索字段;根据知识库获取与检索字段对应的关键词标签;以关键词标签作为索引从知识库中查询与检索字段对应的数据。
可选地,第一对接子模块还用于获取搜索历史记录,并从搜索历史记录中确定与检索字段匹配的第一标签;从知识库寻找与检索字段匹配的第二标签;整合第一标签与第二标签,得到关键词标签。
可选地,对接模块206还包括第二对接子模块,用于在应用场景为词云应用场景的情况下,获取用户输入的检索字段;根据知识库获取与检索字段存在关联关系的标签词,并获取标签词的第一标签维度;统计第一标签维度的第一维度数量,以及在第一维度数量小于第一预设数量时,则根据声量从提及检索字段的帖子中选取第二标签维度,以使第一维度数量与第二标签维度的第二维度数量之和为第一预设数量。
可选地,对接模块206还包括第三对接子模块,用于在应用场景为内容分析应用场景的情况下,获取用户输入的检索字段;根据知识库获取与检索字段对应的实体类型,并将实体类型作为一级标签进行展示;获取与实体类型对应的实体标签,以及在一级标签被选中时,将实体标签作为二级标签进行展示。
可选地,对接模块206还包括第四对接子模块,用于在应用场景为算法推荐应用场景的情况下,获取用户输入的检索字段;根据知识库获取与检索字段对应的实体类型,并获取与实体类型对应的第二预设数量的实体标签;从知识库中提取与检索字段相关的推荐数据,并根据实体标签展示推荐数据。
可选地,对接模块206还包括第五对接子模块,用于在应用场景为图表下钻应用场景的情况下,若检测到用户输入的检索字段,则对接知识库中与检索字段对应的行业库;生成与检索字段对应的词云,并在检测到任一词云被选中的情况下,根据行业库对被选中的词云进行内容分析;展示内容分析的分析结果,并在分析结果中的任一原帖组件被触发的情况下,跳转至与原帖组件对应的原帖数据。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。
根据本申请实施例的另一方面,如图3所示,本申请提供了一种电子设备,包括存储器31、处理器32、通信接口33及通信总线34,存储器31中存储有可在处理器32上运行的计算机程序,存储器31、处理器32通过通信总线34和通信接口33进行通信,处理器32执行计算机程序时实现上述方法的步骤。
上述电子设备中的存储器、处理器通过通信总线和通信接口进行通信。所述通信总线可以是外设部件互连标准(Peripheral Component Interconnect,简称PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
根据本申请实施例的另一个方面,本申请提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,程序代码使处理器执行上述任一方法的步骤。
可选地,在本申请实施例中,计算机可读介质被设置为存储用于所述处理器执行上述方法步骤的程序代码。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本申请实施例在具体实现时,可以参阅上述各个实施例,具有相应的技术效果。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal Processing,DSP)、数字信号处理设备(DSP Device,DSPD)、可编程逻辑设备(Programmable LogicDevice,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种知识库对接方法,其特征在于,包括:
构建包括多个行业的知识库,其中,所述多个行业包括美妆行业以及手机行业;
检测当前的应用场景,其中,所述应用场景包括搜索框应用场景、词云应用场景、内容分析应用场景、算法推荐应用场景以及图表下钻应用场景;
采用与所述应用场景匹配的对接策略与所述知识库对接。
2.根据权利要求1所述的方法,其特征在于,所述采用与所述应用场景匹配的对接策略与所述知识库对接包括:
在所述应用场景为所述搜索框应用场景的情况下,获取用户输入的检索字段;
根据所述知识库获取与所述检索字段对应的关键词标签;
以所述关键词标签作为索引从所述知识库中查询与所述检索字段对应的数据。
3.根据权利要求2所述的方法,其特征在于,所述根据所述知识库获取与所述检索字段对应的关键词标签包括:
获取搜索历史记录,并从所述搜索历史记录中确定与所述检索字段匹配的第一标签;
从所述知识库寻找与所述检索字段匹配的第二标签;
整合所述第一标签与所述第二标签,得到所述关键词标签。
4.根据权利要求1所述的方法,其特征在于,所述采用与所述应用场景匹配的对接策略与所述知识库对接包括:
在所述应用场景为所述词云应用场景的情况下,获取用户输入的检索字段;
根据所述知识库获取与所述检索字段存在关联关系的标签词,并获取所述标签词的第一标签维度;
统计所述第一标签维度的第一维度数量,以及在所述第一维度数量小于第一预设数量时,则根据声量从提及所述检索字段的帖子中选取第二标签维度,以使所述第一维度数量与所述第二标签维度的第二维度数量之和为所述第一预设数量。
5.根据权利要求1所述的方法,其特征在于,所述采用与所述应用场景匹配的对接策略与所述知识库对接包括:
在所述应用场景为所述内容分析应用场景的情况下,获取用户输入的检索字段;
根据所述知识库获取与所述检索字段对应的实体类型,并将所述实体类型作为一级标签进行展示;
获取与所述实体类型对应的实体标签,以及在所述一级标签被选中时,将所述实体标签作为二级标签进行展示。
6.根据权利要求1所述的方法,其特征在于,所述采用与所述应用场景匹配的对接策略与所述知识库对接包括:
在所述应用场景为所述算法推荐应用场景的情况下,获取用户输入的检索字段;
根据所述知识库获取与所述检索字段对应的实体类型,并获取与所述实体类型对应的第二预设数量的实体标签;
从所述知识库中提取与检索字段相关的推荐数据,并根据所述实体标签展示所述推荐数据。
7.根据权利要求1所述的方法,其特征在于,所述采用与所述应用场景匹配的对接策略与所述知识库对接包括:
在所述应用场景为所述图表下钻应用场景的情况下,若检测到用户输入的检索字段,则对接所述知识库中与所述检索字段对应的行业库;
生成与所述检索字段对应的词云,并在检测到任一所述词云被选中的情况下,根据所述行业库对被选中的所述词云进行内容分析;
展示所述内容分析的分析结果,并在所述分析结果中的任一原帖组件被触发的情况下,跳转至与所述原帖组件对应的原帖数据。
8.一种知识库对接装置,其特征在于,包括:
构建模块,用于构建包括多个行业的知识库,其中,所述多个行业包括美妆行业以及手机行业;
检测模块,用于检测当前的应用场景,其中,所述应用场景包括搜索框应用场景、词云应用场景、内容分析应用场景、算法推荐应用场景以及图表下钻应用场景;
对接模块,用于采用与所述应用场景匹配的对接策略与所述知识库对接。
9.一种电子设备,包括存储器、处理器、通信接口及通信总线,所述存储器中存储有可在所述处理器上运行的计算机程序,所述存储器、所述处理器通过所述通信总线和所述通信接口进行通信,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至7任一项所述的方法的步骤。
10.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行所述权利要求1至7任一所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310863332.1A CN117131095A (zh) | 2023-07-13 | 2023-07-13 | 知识库对接方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310863332.1A CN117131095A (zh) | 2023-07-13 | 2023-07-13 | 知识库对接方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117131095A true CN117131095A (zh) | 2023-11-28 |
Family
ID=88855522
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310863332.1A Pending CN117131095A (zh) | 2023-07-13 | 2023-07-13 | 知识库对接方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117131095A (zh) |
-
2023
- 2023-07-13 CN CN202310863332.1A patent/CN117131095A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9317613B2 (en) | Large scale entity-specific resource classification | |
WO2017121251A1 (zh) | 一种信息推送方法及装置 | |
JP2010055618A (ja) | トピックを基にした検索を提供する方法及びシステム | |
KR101194705B1 (ko) | 연관된 컨텐츠의 검색에 의한 위치 유사성 문턱값의 적응화 | |
US8803882B2 (en) | Identifying on a graphical depiction candidate points and top-moving queries | |
US20070208726A1 (en) | Enhancing search results using ontologies | |
US20210326367A1 (en) | Systems and methods for facilitating searching, labeling, and/or filtering of digital media items | |
JP5859606B2 (ja) | オンライン商取引プラットフォームにおける広告ソースおよびキーワードセットの適合 | |
KR20080045659A (ko) | 정보 처리 장치, 방법, 및 프로그램 | |
TW201214166A (en) | Processing of categorized product information cross reference to other applications | |
CN104123332A (zh) | 搜索结果的显示方法及装置 | |
CN102959542A (zh) | 用于管理视频内容的方法和装置 | |
CA3094201A1 (en) | Ranking and presenting search engine results based on category-specific ranking models | |
CN111506727B (zh) | 文本内容类别获取方法、装置、计算机设备和存储介质 | |
KR20060044524A (ko) | 비지니스 애플리케이션 엔티티 서브스크립션 싱크 동작관리 | |
KR20180097120A (ko) | 전자 문서 검색 방법 및 그 서버 | |
US20210149979A1 (en) | System and Method for Accessing and Managing Cognitive Knowledge | |
US20130346385A1 (en) | System and method for a purposeful sharing environment | |
CN110546633A (zh) | 文档的基于命名实体的类别标签添加 | |
US20230289698A1 (en) | System and Methods for Monitoring Related Metrics | |
CN111061954A (zh) | 搜索结果排序方法、装置及存储介质 | |
US20170316071A1 (en) | Visually Interactive Identification of a Cohort of Data Objects Similar to a Query Based on Domain Knowledge | |
Vergoulis et al. | Bip! finder: Facilitating scientific literature search by exploiting impact-based ranking | |
US20230350955A1 (en) | Comparative search within user-generated content | |
CN105164671A (zh) | 在信息检索系统中使用层级评分以进行消歧 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |