CN116955573B - 问题搜索方法、装置、设备及存储介质 - Google Patents
问题搜索方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116955573B CN116955573B CN202311205234.5A CN202311205234A CN116955573B CN 116955573 B CN116955573 B CN 116955573B CN 202311205234 A CN202311205234 A CN 202311205234A CN 116955573 B CN116955573 B CN 116955573B
- Authority
- CN
- China
- Prior art keywords
- user
- target
- information
- question
- questions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 86
- 238000004458 analytical method Methods 0.000 claims description 49
- 230000008569 process Effects 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 8
- 230000002708 enhancing effect Effects 0.000 claims description 6
- 230000001960 triggered effect Effects 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 claims description 4
- 238000003062 neural network model Methods 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 4
- 230000007123 defense Effects 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 238000013135 deep learning Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 13
- 238000011156 evaluation Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000007726 management method Methods 0.000 description 6
- 235000019219 chocolate Nutrition 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 230000006872 improvement Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 230000002155 anti-virotic effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 101001072091 Homo sapiens ProSAAS Proteins 0.000 description 1
- 102100036366 ProSAAS Human genes 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于计算机领域,公开了一种问题搜索方法、装置、设备及存储介质。该方法包括:在接收到用户问题时,对所述用户问题进行问题描述增强,得到目标问题,所述问题描述增强用于从所述用户问题中提取满足用户需求的关键性问题;提取所述目标问题中的目标关键词;根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息。由于本发明是对用户问题进行问题描述增强,然后进行检索得到答案信息,相对于现有的直接根据用户问题检索对应的答案信息的方式,本发明上述方式能够提高问题搜索的效率,提高用户体验感。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种问题搜索方法、装置、设备及存储介质。
背景技术
现有的问答系统面向通用知识领域,在用户进行问题搜索时,往往是直接根据用户问题中的关键词在通用的知识领域进行关键词匹配搜索,因此在用户进行问题搜索时,往往不能得到用户满意的答案信息。例如,不能准确理解用户的技术术语和问题描述,难以确保提供的答案正确有效用处,如何提高问题搜索的效率成为了亟待解决的技术问题。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供了一种问题搜索方法、装置、设备及存储介质,旨在解决现有技术在进行问题搜索时,由于不能准确理解用户的技术术语和问题描述导致问题搜索效率不高的技术问题。
为实现上述目的,本发明提供了一种问题搜索方法,所述方法包括以下步骤:
在接收到用户问题时,对所述用户问题进行问题描述增强,得到目标问题,所述问题描述增强用于从所述用户问题中提取满足用户需求的关键性问题;
提取所述目标问题中的目标关键词;
根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息。
可选地,所述根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息的步骤,包括:
对所述目标问题进行语义分析,得到所述目标问题对应的语义分析结果;
根据所述语义分析结果判断所述目标问题是否为预设网络安全问题;
在所述目标问题为所述预设网络安全问题时,根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息。
可选地,所述根据所述语义分析结果判断所述目标问题是否为预设网络安全问题的步骤,包括:
根据所述语义分析结果确定所述目标问题对应的主题信息;
根据所述主题信息判断所述目标问题是否为预设网络安全问题。
可选地,所述根据所述语义分析结果判断所述目标问题是否为预设网络安全问题的步骤之后,还包括:
在所述目标问题不属于所述预设网络安全问题时,获取所述用户的产品信息;
根据所述产品信息和所述目标问题对应的目标关键词生成推荐问题,所述推荐问题为与所述产品信息相关联的网络安全问题;
展示所述推荐问题供用户选取并提问。
可选地,所述根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息的步骤,包括:
确定所述目标关键词对应的预设网络安全知识库;
将所述目标关键词转换为向量表示,得到关键词向量;
基于所述关键词向量在所述预设网络安全知识库中进行检索,得到所述目标问题对应的答案信息。
可选地,所述在接收到用户问题时,对所述用户问题进行问题描述增强,得到目标问题的步骤,包括:
在接收到用户问题时,提取所述用户问题中的核心问题和用户需求;
根据所述核心问题和所述用户需求从所述用户问题中提取关键子问题;
根据所述关键子问题确定目标问题。
可选地,所述在接收到用户问题时,提取所述用户问题中的核心问题和用户需求的步骤之前,包括:
在接收到用户问题时,确定所述用户问题对应的目标用户;
获取所述目标用户在预设周期内的请求次数和权限信息;
根据所述请求次数和所述权限信息判断所述目标用户是否满足预设条件;
在所述目标用户满足预设条件时,提取所述用户问题中的核心问题和用户需求。
可选地,所述根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息的步骤,包括:
根据所述目标关键词检索预设网络安全知识库,得到所述目标关键词对应的关联信息;
确定所述目标问题对应的搜索意图;
基于所述搜索意图从所述关联信息中选取目标信息;
对所述目标信息进行答案增强处理,得到所述目标问题对应的答案信息。
可选地,所述在接收到用户问题时,对所述用户问题进行问题描述增强,得到目标问题的步骤之前,还包括:
响应于用户触发的信息录入信息,提取所述信息录入信息中的用户信息和产品信息;
基于所述用户信息和所述产品信息生成集成SDK;
将所述集成SDK发送至所述用户,以使所述用户基于所述集成SDK触发知识问答请求。
可选地,所述基于所述用户信息和所述产品信息生成集成SDK的步骤,包括:
基于所述用户信息和所述产品信息生成应用程序识别码和密钥信息;
根据所述应用程序识别码和所述密钥信息集成SDK。
可选地,所述根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息的步骤之后,还包括:
流式展示所述答案信息;
获取用户基于展示的所述答案信息反馈的评价信息;
基于所述评价信息优化所述答案信息。
可选地,所述流式展示所述答案信息的步骤之后,还包括:
根据所述答案信息分析用户的搜索意图;
根据所述搜索意图推荐后续可选的网络安全问题并展示。
此外,为实现上述目的,本发明还提供一种问题搜索装置,所述装置包括:
增强模块,用于在接收到用户问题时,对所述用户问题进行问题描述增强,得到目标问题,所述问题描述增强用于从所述用户问题中提取满足用户需求的关键性问题;
提取模块,用于提取所述目标问题中的目标关键词;
检索模块,用于根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息。
此外,为实现上述目的,本发明还提出一种问题搜索设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的问题搜索程序,所述问题搜索程序配置为实现如上文所述的问题搜索方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有问题搜索程序,所述问题搜索程序被处理器执行时实现如上文所述的问题搜索方法的步骤。
本发明在接收到用户问题时,对所述用户问题进行问题描述增强,得到目标问题,所述问题描述增强用于从所述用户问题中提取满足用户需求的关键性问题;提取所述目标问题中的目标关键词;根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息。由于本发明是对用户问题进行问题描述增强,然后进行检索得到答案信息 ,相对于现有的直接根据用户问题检索对应的答案信息的方式,本发明上述方式能够提高问题搜索的效率,提高用户体验感。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的问题搜索设备的结构示意图;
图2为本发明问题搜索方法第一实施例的流程示意图;
图3为本发明问题搜索方法第一实施例的问题搜索设备结构示意图;
图4为本发明问题搜索方法第一实施例的用户产品信息接入示意图;
图5为本发明问题搜索方法第二实施例的流程示意图;
图6为本发明问题搜索方法第三实施例的流程示意图;
图7为本发明问题搜索装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的问题搜索设备结构示意图。
如图1所示,该问题搜索设备可以包括:处理器1001,例如中央处理器(CentralProcessing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM),也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对问题搜索设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及问题搜索程序。
在图1所示的问题搜索设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明问题搜索设备中的处理器1001、存储器1005可以设置在问题搜索设备中,所述问题搜索设备通过处理器1001调用存储器1005中存储的问题搜索程序,并执行本发明实施例提供的问题搜索方法。
基于上述问题搜索设备,本发明实施例提供了一种问题搜索方法,参照图2,图2为本发明问题搜索方法第一实施例的流程示意图。
本实施例中,所述问题搜索方法包括以下步骤:
步骤S10:在接收到用户问题时,对所述用户问题进行问题描述增强,得到目标问题,所述问题描述增强用于从所述用户问题中提取满足用户需求的关键性问题。
需要说明的是,本实施例的执行主体可以是一种具有数据处理、网络通信以及程序运行功能的计算服务设备,例如手机、平板电脑、个人电脑等,或者是一种能够实现上述功能的电子设备或问题搜索设备。以下以所述问题搜索设备为例,对本实施例及下述各实施例进行说明。
为了提升信息处理能力,在一些实施例中,问题搜索设备上可以安装有安全大模型(secLLM),安全大模型可以接收用户的输入文本,将输入文本解析成计算机可理解的数据格式,然后使用预训练的神经网络模型来生成响应文本。
在具体实现中,安全大模型利用了深度学习技术中的神经网络,通过大量的语料数据进行训练,从而能够学习到语言的结构、语法规则和语义信息。在用户输入文本之后,安全大模型首先会对文本进行分词和解析,将其转化成计算机可读的矢量形式,然后送入预训练的神经网络模型中进行推断。推断过程中安全大模型会根据用户输入的文本和之前的上下文,预测出最可能的下一步响应。这个预测过程是基于模型对大量语料数据的学习所得,因此可以在很大程度上还原人类自然语言表达的方式,并生成高度连贯和自然的响应文本。最后,安全大模型将生成的响应文本返回给用户,完成一次对话交互。整个过程中,安全大模型还会不断地学习和优化,以提供更加准确和适合用户的回答。
进一步的,目前的安全大模型都是常规知识推理,缺乏安全领域知识。目前的现有的模型主要是通用知识推理,当用户在提出安全问题后,经常会出现答非所问的情况,所以在本实施例中,需对安全大模型使用网络安全领域的知识进行预训练,让其掌握网络安全领域的通用知识,遇到网络安全类问题,需要从网络安全进行推理回答。提高用户网络安全相关问题的搜索效率。
需要说明的是,所述用户问题可以是用户基于所述问题搜索设备中的应用侧输入的要查询的问题信息。所述对所述用户问题进行问题描述增强可以是对所述用户问题进行去噪等优化处理,例如,去除停用词、删除标点符号、使用正则表达式过滤掉一些无关信息,例如URL链接、电话号码等、使用文本分析工具去除一些无关信息等处理。还可以包括:提取关键信息:分析用户问题,从中提取出关键词汇和关键信息,这些关键信息可以帮助理解所述用户问题;补充上下文信息:尽可能多地了解用户问题所处的背景和环境,例如设备、操作系统、应用程序版本等,这些信息有助于更好地诊断问题;明确问题的目标:了解用户的期望和目标,例如,用户的搜索意图;简明扼要:需要使用简练、明确的语言,避免使用过多的无意义词汇;避免描述偏见:避免使用带有负面情绪或偏见的语言,以影响解决问题的搜索结果。
所述目标问题可以是对所述用户问题进行问题描述增强后得到更符合用户需求的问题。
进一步的,为了提高问题搜索的准确性,所述步骤S10,可包括:在接收到用户问题时,提取所述用户问题中的核心问题和用户需求;
根据所述核心问题和所述用户需求从所述用户问题中提取关键子问题;
根据所述关键子问题确定目标问题。
需要说明的是,所述提取所述用户问题中的核心问题和用户需求可以是对所述用户问题进行去噪处理,并用简洁的语言概括所述用户问题,得到核心问题,通过理解所述用户问题得知用户的问题需求。所述根据所述核心问题和所述用户需求从所述用户问题中提取关键子问题可以包括以下步骤:根据用户需求确定用户问题的主题和范围。例如:用户问题是“如何学好java”,则用户需求为提高或增强自己的java编程能力,无论是为了工作需要还是个人兴趣爱好。用户可能感到困惑或不知道从哪里开始,希望获得一些实用的建议和指导,以达到更好学习效果。根据用户需求可知,主题是学习java,关键词可能包括“学习”、“java”。问题的范围较广,因为java是一个广泛的编程语言,因此在回答问题时需要考虑是否从听说读写四个方面入手,是否考虑自学或考试备考的情况等范围。然后找到问题的关键词和关键短语。这些单词或短语通常指向问题的核心内容和方向。将关键词和关键短语转换成问题或子问题的形式,以帮助更好地组织和分析。确保子问题覆盖了问题的所有方面,并可以回答问题。例如:如果问题是“如何制作巧克力蛋糕?”,那么关键词和短语可能包括“制作”、“巧克力”、“蛋糕”。根据这些关键词和短语,我们可以提取出以下关键子问题:制作巧克力蛋糕需要哪些原料和工具?制作巧克力蛋糕的步骤是什么?怎样保证巧克力蛋糕的味道和质量?所述根据所述关键子问题确定目标问题可以是将所述关键子问题作为所述目标问题,可以得到关于所述用户问题的全方位的搜索结果,提高用户体验感。
进一步的,为了避免问题搜索设备的搜索任务过多,导致性能下降,影响用户的体验感,所述在接收到用户问题时,提取所述用户问题中的核心问题和用户需求的步骤之前,包括:
在接收到用户问题时,确定所述用户问题对应的目标用户;
获取所述目标用户在预设周期内的请求次数和权限信息;
根据所述请求次数和所述权限信息判断所述目标用户是否满足预设条件;
在所述目标用户满足预设条件时,提取所述用户问题中的核心问题和用户需求。
需要说明的是,所述预设周期可以是预先设置的时间周期,用于统计用户的问题搜索频率。所述权限信息可以包括所述用户是否有权限提问和在预设周期内的最大提问次数。所述根据所述请求次数和所述权限信息判断所述目标用户是否满足预设条件可以是判断所述用户是否有权限提出问题以及提问次数是否大于权限信息中的最大提问次数,若用户有权限提出问题且提问次数不大于权限信息中的最大提问次数,则判定目标用户满足预设条件。
步骤S20:提取所述目标问题中的目标关键词。
需要说明的是,所述目标关键词可以是从所述目标问题提取出来的能够表征用户的搜索意图的重要单词或短语。可以使用以下方式提取所述目标问题中的目标关键词:停用词过滤:使用停用词列表过滤掉那些出现频率较高但没有实际意义的单词,例如“的”、“是”等;词频统计:统计目标问题中每个单词的出现频率,将出现频率较高的单词作为目标关键词;TF-IDF算法;主题模型:使用LDA(Latent Dirichlet Allocation)等主题模型算法从目标问题中提取关键词;命名实体识别(NER):使用NER技术从目标问题中识别出人名、组织机构名、地名等,作为目标关键词。
步骤S30:根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息。
需要说明的是,所述根据所述目标关键词进行检索可以是基于所述安全大模型检索所述目标关键词对应的相关知识信息,得到相关知识点,然后根据检索到的所述相关知识点确定所述目标问题对应的答案或建议,即答案信息。
进一步的,为了得到准确的答案信息,所述步骤S30,可包括:根据所述目标关键词检索预设网络安全知识库,得到所述目标关键词对应的关联信息;
确定所述目标问题对应的搜索意图;
基于所述搜索意图从所述关联信息中选取目标信息;
对所述目标信息进行答案增强处理,得到所述目标问题对应的答案信息。
需要说明的是,所述确定所述目标问题对应的搜索意图可以是确定用户在查询时表达的意图或目的,所述搜索意图可以由目标问题对应的关键词、搜索历史、上下文、设备类型等多个因素综合所决定的。用户可能有不同的搜索意图,包括获取相关信息或者寻找特定的服务等。所述对所述目标信息进行答案增强处理可以是对所述目标信息进行分析、理解和加工,以提取并呈现出更有用的答案和信息。可以通过诸如语义分析、实体识别、文本摘要、问题回答等技术,从原有信息中提取关键信息并转化为更易于理解和使用的形式,例如图表、摘要、问题回答等。通过答案增强处理,可以使原有信息更具有实用价值,并且可以提高用户的满意度。
进一步的,为了提高用户的体验感,所述步骤S30之后,还包括:流式展示所述答案信息;
获取用户基于展示的所述答案信息反馈的评价信息;
基于所述评价信息优化所述答案信息。
需要说明的是,所述流式展示所述答案信息可以是按照预设显示频率在用户的显示界面中展示所述答案信息。例如,预设显示频率为100字每分钟,则流式展示所述答案信息可以是按照100字每分钟的显示频率逐字在用户的显示界面中打印所述答案信息。所述评价信息可以是用户基于所述答案信息反馈的满意度、改进建议或下一步的指令。所述基于所述评价信息优化所述答案信息可以是在所述评价信息为改进建议时,根据所述改进建议进行检索,根据检索到的信息优化所述答案信息。
进一步的, 为了提高用户体验感,所述流式展示所述答案信息的步骤之后,还包括:
根据所述答案信息分析用户的搜索意图;
根据所述搜索意图推荐后续可选的网络安全问题并展示。
在具体实施中,问题搜索设备可以分析用户下一步可能意图,推荐出下一步的问题或指令。
在具体实施中,可参照图3,图3为本发明问题搜索方法第一实施例的问题搜索设备结构示意图;参照图3,用户可在应用侧发起用户问题。应用侧主要功能包括:安全产品信息管理,企业信息管理,应用APPID,应用公钥、私钥管理、应用数据管理,应用权限管理、应用问答记录管理等。用户在应用侧输入用户问题后,可通过网关将用户问题发送至后台服务端,后台服务端支持问答功能,主要功能包括:应用鉴权、用户鉴权、权限控制、问答频率控制、数据存储等功能。具体可包括:SDK开发和安全产品接入:a)开发 JSSDK,各个安全应用通过集成SDK完成应用接入,b)产品数据接入知识库。产品介绍、白皮书、Q&A、产品问答、运行中产生的告警数据等。企业安全知识库:知识分类,知识存储、关键词提取:a)按企业和安全产品的维度,持续收集和录入细分场景的安全知识。安全领域模型训练:a)安全知识数据收集管理,b)使用通用安全类知识语料,通过GPU集群对安全大模型进行预训练,c)使用高质量的问答对,对安全大模型进行微调,模型增强服务:问题分析、模型调度、知识库查询、问题描述丰富等功能:a)问题分析和提示功能:对用户的问题进行分析,如果不是安全类问题需要引导用户提问安全问题,给出相关的问题模板,b)调用模型进行语义分析,理解问题的意图,对问题进行关键字提取和分类,c)查询向量知识库,查找最近的最新的知识和解决方案,d)使用查询的到的知识和问题描述增强提交给模型进行推理,e)流式返回答案,推理服务:a)使用GPU集群部署安全专有模型,提供模型推理服务。
在具体实施中,可参照图4,图4为本发明问题搜索方法第一实施例的用户产品信息接入示意图;参照图4,用户可以先进行应用账号的注册,录入产品和用户的信息,问题搜索设备根据用户信息和用户的产品信息为用户分配APPID、公钥、私钥等个性化配置信息,并集成SDK。用户根据所述集成SDK与问题搜索设备进行交互,完成签名验证和权限判断后可生成用户凭证,之后可根据用户凭证发起问答请求。在本实施例中,可使用SAAS问答的应用平台的方式,可以解决用户安全产品知识孤岛问题,打造安全领域知识库。应用接入采用轻量级的jssdk方式,使用ECC+SHA256的摘要算法组合方案,在复杂度低于OAUTH2的前提的保障应用接入安全。
应用签名核心代码如下:
var { randomBytes } = require('crypto');
var { ec: EC } = require('elliptic');
// 选择椭圆曲线和哈希算法
var curveName = 'secp256k1';
var hashAlgorithm = 'sha256';
// 创建EC实例
var ec = new EC(curveName);
// 生成公钥和私钥
var keyPair = ec.genKeyPair();
// 获取公钥 万事通服务端使用
var publicKeyStr = keyPair.getPublic('hex');
// 获取私钥 等于app_key 应用端SDK使用
var privateKeyStr = keyPair.getPrivate('hex');
const APPID='7c1c4606-7bb9-4f97-926b-53206ca3cff0';
var nowTime = new Date().getTime();
var username = 'guest'
// 生成消息
var message = nowTime + APPID + username;
// 计算消息的哈希值
var messageHashBuffer = Buffer.from(
require('crypto').createHash(hashAlgorithm).update(message).digest()
);
// 对哈希值进行签名
var signature = keyPair.sign(messageHashBuffer);
console.log('Signature:', signature.toDER('hex'));
var publicKey = ec.keyFromPublic(publicKeyStr, 'hex')
// 验证签名
var isSignatureValid = publicKey.verify(messageHashBuffer,signature);
set_token(jwt_token(key1, userinfo)) // 使用签名过的user信息生成用户登录凭证
本实施例在接收到用户问题时,对所述用户问题进行问题描述增强,得到目标问题,所述问题描述增强用于从所述用户问题中提取满足用户需求的关键性问题;提取所述目标问题中的目标关键词;根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息。由于本实施例是对用户问题进行问题描述增强,然后进行检索得到答案信息 ,相对于现有的直接根据用户问题检索对应的答案信息的方式,本实施例上述方式能够提高问题搜索的效率,提高用户体验感。
参考图5,图5为本发明问题搜索方法第二实施例的流程示意图。
基于上述第一实施例,在本实施例中,所述步骤S30包括:
步骤S301:对所述目标问题进行语义分析,得到所述目标问题对应的语义分析结果。
需要说明的是,所述对所述目标问题进行语义分析可以是利用所述安全大模型对目标问题进行分析,了解目标问题所表达的意思和需求。可以通过以下方式分析目标问题的语义:分词和词性标注:将问题中的词汇按照词性进行标注,例如名词、动词等,以便更好地理解问题;句法分析:分析问题中的句子结构和语法关系,如主谓宾结构等,以便更好地理解问题所表达的含义;语义角色标注:标注句子中不同词语所扮演的语义角色,如主语、宾语、地点等,以便更好地理解问题;命名实体识别:识别问题中涉及到的人名、地名、组织机构等实体,以便更好地理解问题和提供更准确的答案;关系提取:识别问题中涉及的各种关系,如因果关系、时间关系、条件关系等。得到所述目标问题对应的语义分析结果。
步骤S302:根据所述语义分析结果判断所述目标问题是否为预设网络安全问题。
需要说明的是,所述预设网络安全问题可以是预先设置的与网络安全相关的信息,例如:防火墙、入侵检测系统、反病毒软件等。
应理解的是,在网络安全领域,已有的技术包括传统的防火墙、入侵检测系统、反病毒软件等,还有近年来发展的基于机器学习、人工智能和大数据的态势感知等安全解决方案。这些技术主要解决的是针对特定攻击的预防和检测,并未提供对各种安全问题的综合性解答。各个系统产生的知识相互隔离,不能有效的整合,每次发生安全事件或威胁情报后都需要专业的安全运维人员处理,很难在企业内部形成完整的安全知识体系,不能有效的防范安全威胁。而现有的问答系统则主要面向通用知识领域,而不是专业领域,因此在处理网络安全相关问题上存在一些问题。例如,不能准确理解用户的技术术语和问题描述,难以确保提供的答案正确有效;缺乏与专业行业资源的整合,无法及时更新最新的安全知识和解决方案;缺乏对用户个性化需求的响应,无法提供针对不同用户群体的个性化推荐服务。因此,实施例中还包括:响应于用户触发的信息录入信息,提取所述信息录入信息中的用户信息和产品信息;
基于所述用户信息和所述产品信息生成集成SDK;
将所述集成SDK发送至所述用户,以使所述用户基于所述集成SDK触发知识问答请求。
需要说明的是,所述信息录入信息可以是用于基于所述问题搜索设备中的应用侧录入的用户的相关信息和用户对应的产品信息。问题搜索设备可以根据用户的用户信息和所述产品信息生成集成SDK;所述集成SDK用于方便用户使用所述问题搜索设备中的服务。所述知识问答请求可以是用户发送的包含用户问题的命令。所述基于所述用户信息和所述产品信息生成集成SDK的步骤,包括:
基于所述用户信息和所述产品信息生成应用程序识别码和密钥信息;
根据所述应用程序识别码和所述密钥信息集成SDK。
需要说明的是,所述应用程序识别码可以是为所述用户对应的发起知识问答请求的应用分配的APPID。所述密钥信息可以包括与所述用户对应的发起应用进行信息交互时的公钥、私钥以及个性化配置等信息。为了提供针对不同用户群体的个性化推荐服务、避免脱离用户产品的真实使用场景,全方位回答与用户产品相关的安全问题,本实施例中可以根据所述用户的产品信息,构建与所述产品信息相关的知识图谱,通过所述知识图谱对安全大模型进行预训练,让其掌握与用户的产品相关的网络安全领域的通用知识,遇到用户的网络安全问题时,能提高对用户的与网络安全相关的问题的解答效率。
进一步的,为了准确判断用户问题是否为预设网络安全问题,所述步骤S302,可包括:根据所述语义分析结果确定所述目标问题对应的主题信息;
根据所述主题信息判断所述目标问题是否为预设网络安全问题。
需要说明的是,所述主题信息可以包括所述目标问题对应的技术领域和核心内容。所述预设网络安全问题可以是预先设置的问题的类别,可以是在目标问题涉及网络安全方面时,判定目标问题为预设网络安全问题。所述根据所述主题信息判断所述目标问题是否为预设网络安全问题可以是根据所述主题信息判断所述目标问题是否为网络安全领域中的问题,或者是否包含预设的网络安全方面的关键词或技术术语。例如:黑客、病毒、防火墙等。在所述主题信息为网络安全领域中的问题,或包含预设的网络安全方面的关键词或技术术语时,判定目标问题为预设网络安全问题。
步骤S303:在所述目标问题为所述预设网络安全问题时,根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息。
在具体实施中,当问题搜索设备判定用户提出的目标问题为所述预设网络安全问题时,根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息。
进一步的,由于本实施例中涉及对用户提出的网络安全相关领域问题的搜索效率的提高的改进,所述步骤S302之后,还包括:在所述目标问题不属于所述预设网络安全问题时,获取所述用户的产品信息;
根据所述产品信息和所述目标问题对应的目标关键词生成推荐问题,所述推荐问题为与所述产品信息相关联的网络安全问题;
展示所述推荐问题供用户选取并提问。
在具体实施中,当用户提出的用户问题和网络安全无关的时候:例如“你是谁?”,问题搜索设备会给出类似的回答:“我是一个安全专家,建议您询问安全类问题。用户可以选择点击推荐的问题,或者重新输入问题,当用户点击推荐的问题或输入的问题被判断为网络安全问题后,执行提取所述目标问题中的目标关键词的步骤。
本实施例对所述目标问题进行语义分析,得到所述目标问题对应的语义分析结果;根据所述语义分析结果判断所述目标问题是否为预设网络安全问题;在所述目标问题为所述预设网络安全问题时,根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息。本实施例能够提高用户对网络安全相关问题的搜索效率,并且可以进一步的作为企业的网络安全类从业人员的学习、培训工具。
参考图6,图6为本发明问题搜索方法第三实施例的流程示意图。
基于上述各实施例,在本实施例中,所述步骤S30,可包括:
步骤S304:确定所述目标关键词对应的预设网络安全知识库。
需要说明的是,所述预设网络安全知识库可以是预先设置的存储所述目标关键词对应的网络安全信息的知识库。为了提高网络安全问题搜索的准确性,可以对同一类网络安全信息进行整合,得到不同类别的网络安全对应的预设网络安全知识库。例如:可以分为攻击、编码、防御等类型。
步骤S305:将所述目标关键词转换为向量表示,得到关键词向量。
需要说明的是,所述将所述目标关键词转换为向量表示可以是通过词袋模型(Bag-of-words):将每个关键词表示为一个出现次数的统计量。TF-IDF(term frequencyinverse document frequency):将每个关键词表示为在文档集合中的重要性程度。词嵌入(word embedding):将每个关键词表示为一个实数向量,这个向量可以通过训练文本数据来学习得到等方式将目标关键词转换为向量表示,得到关键词向量。
步骤S305:基于所述关键词向量在所述预设网络安全知识库中进行检索,得到所述目标问题对应的答案信息。
需要说明的是,所述基于所述关键词向量在所述预设网络安全知识库中进行检索可以是在所述预设网络安全知识库中查询所述关键词向量对应的关联信息,根据所述关联信息生成所述目标问题对应的答案信息。
本实施例确定所述目标关键词对应的预设网络安全知识库;将所述目标关键词转换为向量表示,得到关键词向量;基于所述关键词向量在所述预设网络安全知识库中进行检索,得到所述目标问题对应的答案信息。本实施例确定所述目标关键词对应的预设网络安全知识库,在所述预设网络安全知识库中检索所述目标问题对应的答案信息。能够得到更加准确的答案信息,提高问题搜索效率。
参照图7,图7为本发明问题搜索装置第一实施例的结构框图。
如图7所示,本发明实施例提出的问题搜索装置包括:
增强模块10,用于在接收到用户问题时,对所述用户问题进行问题描述增强,得到目标问题,所述问题描述增强用于从所述用户问题中提取满足用户需求的关键性问题;
提取模块20,用于提取所述目标问题中的目标关键词;
检索模块30,用于根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息。
本实施例在接收到用户问题时,对所述用户问题进行问题描述增强,得到目标问题,所述问题描述增强用于从所述用户问题中提取满足用户需求的关键性问题;提取所述目标问题中的目标关键词;根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息。由于本实施例是对用户问题进行问题描述增强,然后进行检索得到答案信息 ,相对于现有的直接根据用户问题检索对应的答案信息的方式,本实施例上述方式能够提高问题搜索的效率,提高用户体验感。
需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的问题搜索方法,此处不再赘述。
基于本发明上述问题搜索装置第一实施例,提出本发明问题搜索装置的第二实施例。
在本实施例中,所述检索模块30,还用于对所述目标问题进行语义分析,得到所述目标问题对应的语义分析结果;
根据所述语义分析结果判断所述目标问题是否为预设网络安全问题;
在所述目标问题为所述预设网络安全问题时,根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息。
进一步的,所述检索模块30,还用于根据所述语义分析结果确定所述目标问题对应的主题信息;
根据所述主题信息判断所述目标问题是否为预设网络安全问题。
进一步的,所述检索模块30,还用于在所述目标问题不属于所述预设网络安全问题时,获取所述用户的产品信息;
根据所述产品信息和所述目标问题对应的目标关键词生成推荐问题,所述推荐问题为与所述产品信息相关联的网络安全问题;
展示所述推荐问题供用户选取并提问。
进一步的,所述检索模块30,还用于确定所述目标关键词对应的预设网络安全知识库;
将所述目标关键词转换为向量表示,得到关键词向量;
基于所述关键词向量在所述预设网络安全知识库中进行检索,得到所述目标问题对应的答案信息。
进一步的,所述增强模块10,还用于在接收到用户问题时,提取所述用户问题中的核心问题和用户需求;
根据所述核心问题和所述用户需求从所述用户问题中提取关键子问题;
根据所述关键子问题确定目标问题。
进一步的,所述提取模块20,还用于在接收到用户问题时,确定所述用户问题对应的目标用户;
获取所述目标用户在预设周期内的请求次数和权限信息;
根据所述请求次数和所述权限信息判断所述目标用户是否满足预设条件;
在所述目标用户满足预设条件时,提取所述用户问题中的核心问题和用户需求。
进一步的,所述检索模块30,还用于根据所述目标关键词检索预设网络安全知识库,得到所述目标关键词对应的关联信息;
确定所述目标问题对应的搜索意图;
基于所述搜索意图从所述关联信息中选取目标信息;
对所述目标信息进行答案增强处理,得到所述目标问题对应的答案信息。
进一步的,所述增强模块10,还用于响应于用户触发的信息录入信息,提取所述信息录入信息中的用户信息和产品信息;
基于所述用户信息和所述产品信息生成集成SDK;
将所述集成SDK发送至所述用户,以使所述用户基于所述集成SDK触发知识问答请求。
进一步的,所述增强模块10,还用于基于所述用户信息和所述产品信息生成应用程序识别码和密钥信息;
根据所述应用程序识别码和所述密钥信息集成SDK。
进一步的,所述检索模块30,还用于流式展示所述答案信息;
获取用户基于展示的所述答案信息反馈的评价信息;
基于所述评价信息优化所述答案信息。
进一步的,所述检索模块30,还用于根据所述答案信息分析用户的搜索意图;
根据所述搜索意图推荐后续可选的网络安全问题并展示。
本发明问题搜索装置的其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有问题搜索程序,所述问题搜索程序被处理器执行时实现如上文所述的问题搜索方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
本发明公开了A1、一种问题搜索方法,所述问题搜索方法包括以下步骤:
在接收到用户问题时,对所述用户问题进行问题描述增强,得到目标问题,所述问题描述增强用于从所述用户问题中提取满足用户需求的关键性问题;
提取所述目标问题中的目标关键词;
根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息。
A2、如A1所述的问题搜索方法,所述根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息的步骤,包括:
对所述目标问题进行语义分析,得到所述目标问题对应的语义分析结果;
根据所述语义分析结果判断所述目标问题是否为预设网络安全问题;
在所述目标问题为所述预设网络安全问题时,根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息。
A3、如A2所述的问题搜索方法,所述根据所述语义分析结果判断所述目标问题是否为预设网络安全问题的步骤,包括:
根据所述语义分析结果确定所述目标问题对应的主题信息;
根据所述主题信息判断所述目标问题是否为预设网络安全问题。
A4、如A2所述的问题搜索方法,所述根据所述语义分析结果判断所述目标问题是否为预设网络安全问题的步骤之后,还包括:
在所述目标问题不属于所述预设网络安全问题时,获取所述用户的产品信息;
根据所述产品信息和所述目标问题对应的目标关键词生成推荐问题,所述推荐问题为与所述产品信息相关联的网络安全问题;
展示所述推荐问题供用户选取并提问。
A5、如A1所述的问题搜索方法,所述根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息的步骤,包括:
确定所述目标关键词对应的预设网络安全知识库;
将所述目标关键词转换为向量表示,得到关键词向量;
基于所述关键词向量在所述预设网络安全知识库中进行知识检索,得到所述目标问题对应的答案信息。
A6、如A1所述的问题搜索方法,所述在接收到用户问题时,对所述用户问题进行问题描述增强,得到目标问题的步骤,包括:
在接收到用户问题时,提取所述用户问题中的核心问题和用户需求;
根据所述核心问题和所述用户需求从所述用户问题中提取关键子问题;
根据所述关键子问题确定目标问题。
A7、如A6所述的问题搜索方法,所述在接收到用户问题时,提取所述用户问题中的核心问题和用户需求的步骤之前,包括:
在接收到用户问题时,确定所述用户问题对应的目标用户;
获取所述目标用户在预设周期内的请求次数和权限信息;
根据所述请求次数和所述权限信息判断所述目标用户是否满足预设条件;
在所述目标用户满足预设条件时,提取所述用户问题中的核心问题和用户需求。
A8、如A1-A7任一项所述的问题搜索方法,所述根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息的步骤,包括:
根据所述目标关键词检索预设网络安全知识库,得到所述目标关键词对应的关联信息;
确定所述目标问题对应的搜索意图;
基于所述搜索意图从所述关联信息中选取目标信息;
对所述目标信息进行答案增强处理,得到所述目标问题对应的答案信息。
A9、如A1-A7任一项所述的问题搜索方法,所述在接收到用户问题时,对所述用户问题进行问题描述增强,得到目标问题的步骤之前,还包括:
响应于用户触发的信息录入信息,提取所述信息录入信息中的用户信息和产品信息;
基于所述用户信息和所述产品信息生成集成SDK;
将所述集成SDK发送至所述用户,以使所述用户基于所述集成SDK触发知识问答请求。
A10、如A9所述的问题搜索方法,所述基于所述用户信息和所述产品信息生成集成SDK的步骤,包括:
基于所述用户信息和所述产品信息生成应用程序识别码和密钥信息;
根据所述应用程序识别码和所述密钥信息集成SDK。
A11、如A1-A7任一项所述的问题搜索方法,所述根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息的步骤之后,还包括:
流式展示所述答案信息;
获取用户基于展示的所述答案信息反馈的评价信息;
基于所述评价信息优化所述答案信息。
A12、如A11所述的问题搜索方法,所述流式展示所述答案信息的步骤之后,还包括:
根据所述答案信息分析用户的搜索意图;
根据所述搜索意图推荐后续可选的网络安全问题并展示。
本发明公开了B13、一种问题搜索装置,所述问题搜索装置包括:
增强模块,用于在接收到用户问题时,对所述用户问题进行问题描述增强,得到目标问题,所述问题描述增强用于从所述用户问题中提取满足用户需求的关键性问题;
提取模块,用于提取所述目标问题中的目标关键词;
检索模块,用于根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息。
B14、如B13所述的问题搜索装置,所述检索模块,还用于对所述目标问题进行语义分析,得到所述目标问题对应的语义分析结果;
根据所述语义分析结果判断所述目标问题是否为预设网络安全问题;
在所述目标问题为所述预设网络安全问题时,根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息。
B15、如B14所述的问题搜索装置,所述检索模块,还用于根据所述语义分析结果确定所述目标问题对应的主题信息;
根据所述主题信息判断所述目标问题是否为预设网络安全问题。
B16、如B14所述的问题搜索装置,所述检索模块,还用于在所述目标问题不属于所述预设网络安全问题时,获取所述用户的产品信息;
根据所述产品信息和所述目标问题对应的目标关键词生成推荐问题,所述推荐问题为与所述产品信息相关联的网络安全问题;
展示所述推荐问题供用户选取并提问。
B17、如B13所述的问题搜索装置,所述检索模块,还用于确定所述目标关键词对应的预设网络安全知识库;
将所述目标关键词转换为向量表示,得到关键词向量;
基于所述关键词向量在所述预设网络安全知识库中进行检索,得到所述目标问题对应的答案信息。
B18、如B13所述的问题搜索装置,所述增强模块,还用于在接收到用户问题时,提取所述用户问题中的核心问题和用户需求;
根据所述核心问题和所述用户需求从所述用户问题中提取关键子问题;
根据所述关键子问题确定目标问题。
本发明公开了C19、一种问题搜索设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的问题搜索程序,所述问题搜索程序配置为实现如A1至A12中任一项所述的问题搜索方法的步骤。
本发明公开了D20、一种存储介质,所述存储介质上存储有问题搜索程序,所述问题搜索程序被处理器执行时实现如A1至A12任一项所述的问题搜索方法的步骤。
Claims (8)
1.一种问题搜索方法,其特征在于,应用于问题搜索设备,所述问题搜索设备上安装有安全大模型,所述安全大模型用于接收用户的用户问题,将用户问题解析成计算机可理解的数据格式,使用预训练的神经网络模型生成答案信息,安全大模型利用了深度学习技术中的神经网络,通过大量的语料数据进行训练,从而能够学习到语言的结构、语法规则和语义信息,在用户输入用户问题之后,所述安全大模型首先会对用户问题进行分词和解析,将其转化成计算机可读的矢量形式,然后送入预训练的神经网络模型中进行推断,推断过程中安全大模型会根据用户输入的用户问题和之前的上下文,预测出最优的答案信息,所述问题搜索方法包括以下步骤:
在接收到用户问题时,对所述用户问题进行问题描述增强,得到符合用户需求的目标问题,所述问题描述增强用于从所述用户问题中提取满足用户需求的关键性问题;
提取所述目标问题中的目标关键词;
根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息;
根据所述答案信息分析用户的搜索意图;
根据所述搜索意图推荐可选的网络安全问题并展示;
所述根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息的步骤,包括:
对所述目标问题进行语义分析,得到所述目标问题对应的语义分析结果,所述对所述目标问题进行语义分析包括对所述目标问题进行分词和词性标注、句法分析、语义角色标注、命名实体识别以及关系提取;
根据所述语义分析结果判断所述目标问题是否为预设网络安全问题;
在所述目标问题为所述预设网络安全问题时,根据所述目标关键词在预设网络安全知识库中进行知识检索,得到所述目标问题对应的答案信息;
所述提取所述目标问题中的目标关键词,包括:
使用LDA主题模型算法从所述目标问题中提取目标关键词,或通过命名实体识别提取所述目标问题中的目标关键词;
所述在接收到用户问题时,对所述用户问题进行问题描述增强之前,还包括:
响应于用户触发的信息录入信息,提取所述信息录入信息中的用户信息和产品信息;
基于所述用户信息和所述产品信息生成应用程序识别码和密钥信息,所述密钥信息包括公钥、私钥以及个性化配置信息;
根据所述应用程序识别码和所述密钥信息集成SDK;
将所述集成SDK发送至所述用户,以使所述用户基于所述集成SDK触发知识问答请求;
所述提取所述信息录入信息中的用户信息和产品信息之后,还包括:构建与所述产品信息相关的知识图谱,通过所述知识图谱对所述安全大模型进行预训练;
所述根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息的步骤,包括:
确定所述目标关键词对应的预设网络安全知识库,所述预设网络安全知识库包括攻击知识库、编码知识库以及防御知识库;
将所述目标关键词转换为向量表示,得到关键词向量;
基于所述关键词向量在所述预设网络安全知识库中进行知识检索,得到所述关键词向量对应的关联信息,根据所述关联信息确定所述目标问题对应的答案信息。
2.如权利要求1所述的问题搜索方法,其特征在于,所述根据所述语义分析结果判断所述目标问题是否为预设网络安全问题的步骤,包括:
根据所述语义分析结果确定所述目标问题对应的主题信息;
根据所述主题信息判断所述目标问题是否为预设网络安全问题。
3.如权利要求1所述的问题搜索方法,其特征在于,所述根据所述语义分析结果判断所述目标问题是否为预设网络安全问题的步骤之后,还包括:
在所述目标问题不属于所述预设网络安全问题时,获取所述用户的产品信息;
根据所述产品信息和所述目标问题对应的目标关键词生成推荐问题,所述推荐问题为与所述产品信息相关联的网络安全问题;
展示所述推荐问题供用户选取并提问。
4.如权利要求1所述的问题搜索方法,其特征在于,所述在接收到用户问题时,对所述用户问题进行问题描述增强,得到目标问题的步骤,包括:
在接收到用户问题时,提取所述用户问题中的核心问题和用户需求;
根据所述核心问题和所述用户需求从所述用户问题中提取关键子问题;
根据所述关键子问题确定目标问题。
5.如权利要求4所述的问题搜索方法,其特征在于,所述在接收到用户问题时,提取所述用户问题中的核心问题和用户需求的步骤之前,包括:
在接收到用户问题时,确定所述用户问题对应的目标用户;
获取所述目标用户在预设周期内的请求次数和权限信息;
根据所述请求次数和所述权限信息判断所述目标用户是否满足预设条件;
在所述目标用户满足预设条件时,提取所述用户问题中的核心问题和用户需求。
6.一种问题搜索装置,其特征在于,所述问题搜索装置包括:
增强模块,用于在接收到用户问题时,对所述用户问题进行问题描述增强,得到符合用户需求的目标问题,所述问题描述增强用于从所述用户问题中提取满足用户需求的关键性问题;
提取模块,用于提取所述目标问题中的目标关键词;
检索模块,用于根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息,根据所述答案信息分析用户的搜索意图;根据所述搜索意图推荐可选的网络安全问题并展示;
所述检索模块,还用于对所述目标问题进行语义分析,得到所述目标问题对应的语义分析结果,所述对所述目标问题进行语义分析包括对所述目标问题进行分词和词性标注、句法分析、语义角色标注、命名实体识别以及关系提取;
根据所述语义分析结果判断所述目标问题是否为预设网络安全问题;
在所述目标问题为所述预设网络安全问题时,根据所述目标关键词进行知识检索,得到所述目标问题对应的答案信息;
所述提取模块,还用于使用LDA主题模型算法从所述目标问题中提取目标关键词,或通过命名实体识别提取所述目标问题中的目标关键词;
所述增强模块,还用于响应于用户触发的信息录入信息,提取所述信息录入信息中的用户信息和产品信息;
基于所述用户信息和所述产品信息生成应用程序识别码和密钥信息,所述密钥信息包括公钥、私钥以及个性化配置信息;
根据所述应用程序识别码和所述密钥信息集成SDK;
将所述集成SDK发送至所述用户,以使所述用户基于所述集成SDK触发知识问答请求;
所述增强模块,还用于构建与所述产品信息相关的知识图谱,通过所述知识图谱对安全大模型进行预训练;
所述检索模块,还用于确定所述目标关键词对应的预设网络安全知识库,所述预设网络安全知识库包括攻击知识库、编码知识库以及防御知识库;
将所述目标关键词转换为向量表示,得到关键词向量;
基于所述关键词向量在所述预设网络安全知识库中进行知识检索,得到所述关键词向量对应的关联信息,根据所述关联信息确定所述目标问题对应的答案信息。
7.一种问题搜索设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的问题搜索程序,所述问题搜索程序配置为实现如权利要求1至5中任一项所述的问题搜索方法的步骤。
8.一种存储介质,其特征在于,所述存储介质上存储有问题搜索程序,所述问题搜索程序被处理器执行时实现如权利要求1至5任一项所述的问题搜索方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311205234.5A CN116955573B (zh) | 2023-09-19 | 2023-09-19 | 问题搜索方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311205234.5A CN116955573B (zh) | 2023-09-19 | 2023-09-19 | 问题搜索方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116955573A CN116955573A (zh) | 2023-10-27 |
CN116955573B true CN116955573B (zh) | 2024-03-29 |
Family
ID=88456827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311205234.5A Active CN116955573B (zh) | 2023-09-19 | 2023-09-19 | 问题搜索方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116955573B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117392826B (zh) * | 2023-12-11 | 2024-02-13 | 吉林大学 | 一种基于大数据的网络信息预警方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109284363A (zh) * | 2018-12-03 | 2019-01-29 | 北京羽扇智信息科技有限公司 | 一种问答方法、装置、电子设备及存储介质 |
CN109697228A (zh) * | 2018-12-13 | 2019-04-30 | 平安科技(深圳)有限公司 | 智能问答方法、装置、计算机设备及存储介质 |
CN111324721A (zh) * | 2020-03-16 | 2020-06-23 | 云南电网有限责任公司信息中心 | 一种智能问答知识库的构建方法 |
CN112565236A (zh) * | 2020-11-30 | 2021-03-26 | 广州酷狗计算机科技有限公司 | 信息鉴权方法、装置、计算机设备及存储介质 |
CN115240298A (zh) * | 2022-07-01 | 2022-10-25 | 一汽解放汽车有限公司 | 车辆数字钥匙获取方法、装置、计算机设备和存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111241282B (zh) * | 2020-01-14 | 2023-09-08 | 北京百度网讯科技有限公司 | 文本主题生成方法、装置及电子设备 |
-
2023
- 2023-09-19 CN CN202311205234.5A patent/CN116955573B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109284363A (zh) * | 2018-12-03 | 2019-01-29 | 北京羽扇智信息科技有限公司 | 一种问答方法、装置、电子设备及存储介质 |
CN109697228A (zh) * | 2018-12-13 | 2019-04-30 | 平安科技(深圳)有限公司 | 智能问答方法、装置、计算机设备及存储介质 |
CN111324721A (zh) * | 2020-03-16 | 2020-06-23 | 云南电网有限责任公司信息中心 | 一种智能问答知识库的构建方法 |
CN112565236A (zh) * | 2020-11-30 | 2021-03-26 | 广州酷狗计算机科技有限公司 | 信息鉴权方法、装置、计算机设备及存储介质 |
CN115240298A (zh) * | 2022-07-01 | 2022-10-25 | 一汽解放汽车有限公司 | 车辆数字钥匙获取方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116955573A (zh) | 2023-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110765244B (zh) | 获取应答话术的方法、装置、计算机设备及存储介质 | |
US10789552B2 (en) | Question answering system-based generation of distractors using machine learning | |
KR102033388B1 (ko) | 질의 응답 장치 및 방법 | |
CN109145204B (zh) | 画像标签生成和使用方法及系统 | |
US10585901B2 (en) | Tailoring question answer results to personality traits | |
US20210117509A1 (en) | Creating a knowledge graph based on text-based knowledge corpora | |
US11238132B2 (en) | Method and system for using existing models in connection with new model development | |
CN109617781B (zh) | 即时通讯消息监控方法、装置、计算机设备和存储介质 | |
CN116955573B (zh) | 问题搜索方法、装置、设备及存储介质 | |
CN109871807B (zh) | 人脸图像处理方法和装置 | |
CN112417158A (zh) | 文本数据分类模型的训练方法、分类方法、装置和设备 | |
US20110161368A1 (en) | Text mining apparatus, text mining method, and computer-readable recording medium | |
US11907863B2 (en) | Natural language enrichment using action explanations | |
CN117332072B (zh) | 对话处理、语音摘要提取以及目标对话模型训练方法 | |
CN111192170B (zh) | 题目推送方法、装置、设备和计算机可读存储介质 | |
CN117520523B (zh) | 数据处理方法、装置、设备及存储介质 | |
CN116701604A (zh) | 问答语料库的构建方法和装置、问答方法、设备及介质 | |
CN114186041A (zh) | 一种答案输出方法 | |
CN111309990B (zh) | 一种语句应答方法及装置 | |
CN113505293A (zh) | 信息推送方法、装置、电子设备及存储介质 | |
CN112307186A (zh) | 基于情绪识别的问答服务方法、系统、终端设备及介质 | |
CN112200602A (zh) | 用于广告推荐的神经网络模型训练方法及装置 | |
US11947872B1 (en) | Natural language processing platform for automated event analysis, translation, and transcription verification | |
KR20240051469A (ko) | 텍스트 기반의 대화 장치 | |
US20220269746A1 (en) | System and Methods for Standardizing Scoring of Individual Social Media Content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |