CN114936232B - 一种支持智能搜索的知识库管理系统 - Google Patents

一种支持智能搜索的知识库管理系统 Download PDF

Info

Publication number
CN114936232B
CN114936232B CN202210565054.7A CN202210565054A CN114936232B CN 114936232 B CN114936232 B CN 114936232B CN 202210565054 A CN202210565054 A CN 202210565054A CN 114936232 B CN114936232 B CN 114936232B
Authority
CN
China
Prior art keywords
data
information
module
search
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210565054.7A
Other languages
English (en)
Other versions
CN114936232A (zh
Inventor
张发胜
颜华梅
戴文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Hongpu Technology Co ltd
Original Assignee
Shenzhen Hongpu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Hongpu Technology Co ltd filed Critical Shenzhen Hongpu Technology Co ltd
Priority to CN202210565054.7A priority Critical patent/CN114936232B/zh
Publication of CN114936232A publication Critical patent/CN114936232A/zh
Application granted granted Critical
Publication of CN114936232B publication Critical patent/CN114936232B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • G06F16/287Visualization; Browsing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种支持智能搜索的知识库管理系统,属于知识库管理领域。包括:智能搜索装置,用于客户进行操作显示知识库信息;数据转换模块,用于将客户的操作指令和搜索信息转换成方便处理的数据信息;管理员验证模块,用于工作人员登录,对所述存储模块内的数据信息进行管理。本发明解决了现有技术中使用者无法根据特定需求快速搜索知识信息,影响信息获取速度,知识数据信息的获取途径单一的问题,通过大数据的形式,配合云服务器和通信基站远程处理数据信息,使得知识数据信息的获取方式多样,适应不同的工作,调节数据的对比、搜索和验证工作,适应时间发展和数据管理,提高信息获取的速度和精度。

Description

一种支持智能搜索的知识库管理系统
技术领域
本发明涉及知识库管理技术领域,具体为一种支持智能搜索的知识库管理系统。
背景技术
现如今,农业、气象、勘探和情报等行业都积累了大量的数据,数据的获取、存储、管理和共享在国民经济建设各个领域、各个部门中的应用日益普及和深入,从这些海量数据中发现、表示、存储、管理和共享知识是信息时代发展的必然,也是社会和经济发展的需求。
在知识应用获取的过程中,往往存在以下缺陷:
1、使用者无法根据特定需求快速搜索知识信息,影响信息获取速度。
2、知识数据信息的获取途径单一,适用性差。
3、数据库的管理模式复杂,影响数据汇入和发送。
针对这些缺陷,设计一种支持智能搜索的知识库管理系统,是很有必要的。
发明内容
本发明的目的在于提供一种支持智能搜索的知识库管理系统,可以解决现有技术中使用者无法根据特定需求快速搜索知识信息,影响信息获取速度,知识数据信息的获取途径单一的问题。
为实现上述目的,本发明提供如下技术方案:一种支持智能搜索的知识库管理系统,包括:
智能搜索装置,用于客户进行操作显示知识库信息;
交换机,用于对所述智能搜索装置的操作指令信息传输;
数据转换模块,用于将客户的操作指令和搜索信息转换成方便处理的数据信息;
数据采集模块,用于对所述数据转换模块转换的数据进行统计,并过滤无效信息;
数据分类模块,用于对所述数据采集模块采集到的信息按照设定好的分类原则,对知识信息进行分类,并对已分类好的知识信息进行存储及管理;
存储模块,用于将所述转换的数据信息存储;
管理员验证模块,用于工作人员登录,对所述存储模块内的数据信息进行管理;
管理计算机,用于辅助工作人员远程操作管理工作;
通信基站,用于无线传输所述数据转换模块转换的数据信息;
云服务器,用于临时存储和缓存知识库数据信息;
知识数据库,用于发送知识库数据信息和接收知识库数据信息。
优选的,所述智能搜索装置设置有若干个,若干个所述智能搜索装置均与交换机双向连接,所述交换机与数据转换模块双向连接,且所述交换机通过报文交换接收和转发智能搜索装置的数据到数据转换模块,所述数据转换模块分别与数据采集模块和存储模块双向连接,且所述数据转换模块的输出端与通信基站的输入端连接,所述数据转换模块包括映射平面文件和翻译EDI标准文件,且所述数据转换模块通过通信模块发送数据信息,且映射平面文件和翻译EDI标准文件均设置有两组,两组映射平面文件与翻译EDI标准文件之间通过计算机网络无线连接。
优选的,所述数据采集模块设置为基于远程数据采集模块平台的通信模块,且所述数据采集模块还包括有通信芯片、存储芯片和单片机,且远程数据采集模块平台实现远程数据采集工作,所述数据采集模块的输出端与数据分类模块的输入端连接,所述数据分类模块设置为基于SVM分类模型的知识信息管理模块,所述存储模块的输入端分别与管理员验证模块和云服务器的输出端连接,所述云服务器的输入端与知识数据库的输出端连接,所述管理员验证模块的输入端与管理计算机的输出端连接。
优选的,所述数据采集模块还包括:
数据获取子模块,用于获取通过所述数据转换模块转换的操作指令数据和搜索信息数据;
数据分类子模块,对于操作指令数据和搜索信息数据进行分类并分别设置第一指令标签集合和第二搜索结果标签集合;
配对子模块,将第一标识标签集合中每次发出的操作指令数据和第二标识标签集合中对应的搜索信息数据进行配对,形成若干个配对子集合;
对比子模块,用于将每个配对子集合中的搜索信息数据与预设理想搜索信息数据进行比对,以判断第二标识标签集合中的搜索信息数据与预设理想搜索信息数据之间的偏离程度;
信息判断子模块,当第二标识标签集合中的搜索信息数据与预设理想搜索信息数据之间的偏离程度大于30%时,将该配对子集合中的所述操作指令数据和搜索信息数据认定并标注为无效信息;
过滤剔除子模块,用于将无效信息进行剔除。
优选的,所述数据分类模块还包括:
文字采集模块、图像采集模块和语音采集模块,所述文字采集模块、图像采集模块和语音采集模块分别用于采集文字数据信息、图像数据信息和语音数据信息;
数据传输模块,用于GPRS和短消息双通道传输数据,并且用于采集串口设备数据;
数据搜索单元,用于根据用户输入的检索条件,从知识数据库匹配出该检索条件相类似的知识信息;
数据对比单元,用于将用户输入的知识信息与知识数据库中的知识信息进行对比,筛选出相似度最佳的数据信息;
数据验证单元,用于将所述文字采集模块、图像采集模块和语音采集模块采集到的信息进行二次验证,筛除无用信息;
数据处理单元,用于将所述数据搜索单元、数据对比单元和数据验证单元获取的知识数据信息进行集中处理,管理同时采集到的信息;
数据整合单元,用于将所述数据处理单元处理后的数据进行融合汇总,并根据数据信息重点自适应调整数据信息;
数据发送单元,用于将所述数据整合单元汇总的知识信息进行传输,根据需求进行远程发送工作。
优选的,所述文字采集模块、图像采集模块和语音采集模块的输出端均与数据传输模块的输入端连接,所述数据传输模块的输出端分别与数据搜索单元、数据对比单元和数据验证单元的输入端连接,所述数据搜索单元、数据对比单元和数据验证单元的输出端均与数据处理单元的输入端连接,所述数据处理单元的输出端与数据整合单元的输入端连接,所述数据整合单元的输出端与数据发送单元的输入端连接。
优选的,所述智能搜索装置包括:
折叠显示屏,用于显示智能搜索后知识库的知识信息;
工作台,用于将所述折叠显示屏支撑,并提供位置给客户进行操作;
伸缩板,用于调整客户操作位置,适应不同的环境;
客户端操作模块,用于收集客户搜索指令,且所述客户端操作模块包括文字识别模块、图像识别模块和语音识别模块;
系统服务器,用于连接知识库管理系统中多项管理终端,并且进行交互数据信息。
优选的,所述数据采集模块通过以下步骤筛选出有效的数据信息:
步骤S1:所述操作指令数据汇总形成第一指令标签集合F和第二搜索结果标签集合C,其中第一指令标签集合为:
F=[a1,a2,a3……ai],
第二搜索结果标签集合为:
Figure BDA0003657747030000051
其中,ai为第i个操作指令信息,[ci,1,ai,2,ai,3……ai,j]为针对第i个操作指令信息ai搜索出的j个搜索信息数据子集;
步骤S2:将j个搜索信息数据子集中的每一个搜索信息数据与预设理想搜索信息数据CiA逐个进行比对,以得到文本相似度,包括以下步骤:
S11:将搜索信息数据中的文本采用分词方式进行切分,获得有句法意义的若干个第一文本子单元;将预设理想搜索信息数据CiA中的文本采用分词方式进行切分,获得有句法意义的若干个第二文本子单元,
S12:采用特征构建方法,将第一文本子单元映射为一个长度为64、元素值为0或1的一维向量Veci,j=[a1,a2……an],其中n为自然数,an的取值为O或者1;
将第二文本子单元映射为一个长度为64、元素值为0或1的一维向量:VeciA=[b1,b2……bn],其中n为自然数,bn的取值为O或者1;
S13,基于海明距离,判断第一文本子单元与第二文本子单元之间的文本相似度:
Figure BDA0003657747030000052
其中ri为特征向量的维度的取值,
Figure BDA0003657747030000053
当搜索信息数据中的文本的特征向量与预设理想搜索信息数据中的文本的特征向量里,相等的维度越多,相似度就越大;
S14,将S13中第一文本子单元与第二文本子单元之间的文本相似度低于70%时,将对应的搜索信息数据以及与所述搜索信息数据对应的操作指令数据标注为无效信息。
步骤S3:排除无效信息,得到筛选后的有效信息。
优选的,所述折叠显示屏设置有两个,两个所述折叠显示屏之间安装有连接轴,两个所述折叠显示屏之间连接轴通过转动连接,所述连接轴的下端安装有稳定座,且稳定座与工作台的上端面固定连接,所述工作台的内部设置有滑动通口,所述伸缩板通过滑动通口与工作台滑动连接,所述伸缩板还包括有操作显示屏,所述操作显示屏用于显示客户端操作模块的输入命令,所述客户端操作模块设置有四个,四个所述客户端操作模块均通过固定螺丝与伸缩板固定连接,所述文字识别模块包括键盘输入,所述图像识别模块包括光电电磁摄像头、模拟摄像头、数字摄像头和主控单片机,所述语音识别模块包括控制器模块、语音识别模块、功放模块和喇叭。
优选的,所述智能搜索装置还包括有:
支撑架,所述支撑架位于工作台的下端两侧且与工作台固定连接;
无线传输模块,用于连接无线网络和智能手机进行搜索知识数据库;
散热板,所述散热板位于系统服务器的下端,且所述散热板的内部设置有水冷散热器。
与现有技术相比,本发明的有益效果如下:
1.本支持智能搜索的知识库管理系统,在使用本系统进行搜索查询知识库知识时,使用者可通过操作智能搜索装置,通过智能搜索装置的多项辅助设备配合使用者进行智能搜索工作,搜索过程中,可通过交换机将操作信息进行传输,通过数据转换模块转换成方便处理的数据信息,从而进行快速传输工作,传输作业中,可通过数据采集模块进行统计数据,数据采集模块接收过滤信息后,可通过数据分类模块接触信息类型,且数据分类模块具有智能分析管理数据的效果,从而可匹配出最佳的知识数据信息,将搜索信息匹配知识数据库的数据信息,可通过数据转换模块再次接收知识库信息,通过智能搜索装置进行显示,智能化搜索,且管理计算机通过管理员验证模块登录系统后,可对知识数据库内部数据进行读写,管理不同的数据信息,且可通过大数据的形式,配合云服务器和通信基站远程处理数据信息,使得知识数据信息的获取方式多样,适应不同的工作,调节数据的对比、搜索和验证工作,适应时间发展和数据管理,使用方便,从而可根据用户需求,快速搜索数据信息,提高信息获取的速度和精度。
2.本支持智能搜索的知识库管理系统,使用过程中,可通过文字采集模块、图像采集模块和语音采集模块分别用于采集文字数据信息、图像数据信息和语音数据信息,将采取的信息通过GPRS和短消息双通道传输数据,根据用户输入的检索条件,从知识数据库匹配出该检索条件相类似的知识信息,将文字采集模块、图像采集模块和语音采集模块采集到的信息进行二次验证,筛除无用信息,再数据搜索单元、数据对比单元和数据验证单元获取的知识数据信息进行集中处理,管理同时采集到的信息,最后将数据处理单元处理后的信息进行融合汇总,并根据数据信息重点自适应调整数据信息,多项数据融合筛选,可提高数据管理的效率,提高数据的收发效果。
附图说明
图1为本发明的原理示意图;
图2为本发明的数据分类模块的原理示意图;
图3为本发明的智能搜索装置前视的立体图;
图4为本发明的智能搜索装置后视的立体图;
图5为本发明的智能搜索装置仰视的立体图。
图中:1、智能搜索装置;101、折叠显示屏;102、连接轴;103、工作台;104、滑动通口;105、伸缩板;106、客户端操作模块;107、操作显示屏;108、支撑架;109、系统服务器;110、无线传输模块;111、散热板;2、交换机;3、数据转换模块;4、数据采集模块;5、数据分类模块;501、文字采集模块;502、图像采集模块;503、语音采集模块;504、数据传输模块;505、数据搜索单元;506、数据对比单元;507、数据验证单元;508、数据处理单元;509、数据整合单元;510、数据发送单元;6、存储模块;7、管理员验证模块;8、管理计算机;9、通信基站;10、云服务器;11、知识数据库。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,一种支持智能搜索的知识库管理系统,包括:
智能搜索装置1,用于客户进行操作显示知识库信息,通过智能搜索装置1的多项辅助设备配合使用者进行智能搜索工作;
交换机2,用于对智能搜索装置1的操作指令信息传输,搜索过程中,可通过交换机2将操作信息进行传输;
数据转换模块3,用于将客户的操作指令和搜索信息转换成方便处理的数据信息,通过数据转换模块3转换成方便处理的数据信息,从而进行快速传输工作;
数据采集模块4,用于对数据转换模块3转换的数据进行统计,并过滤无效信息,传输作业中,可通过数据采集模块4进行统计数据;
数据分类模块5,用于对数据采集模块4采集到的信息按照设定好的分类原则,对知识信息进行分类,并对已分类好的知识信息进行存储及管理,数据采集模块4接收过滤信息后,可通过数据分类模块5接触信息类型,且数据分类模块5具有智能分析管理数据的效果,从而可匹配出最佳的知识数据信息,将搜索信息匹配知识数据库11的数据信息;
存储模块6,用于将转换的数据信息存储;
管理员验证模块7,用于工作人员登录,对存储模块6内的数据信息进行管理;
管理计算机8,用于辅助工作人员远程操作管理工作,管理计算机8通过管理员验证模块7登录系统后,可对知识数据库11内部数据进行读写,管理不同的数据信息;
通信基站9,用于无线传输数据转换模块3转换的数据信息;
云服务器10,用于临时存储和缓存知识库数据信息;
知识数据库11,用于发送知识库数据信息和接收知识库数据信息,可通过大数据的形式,配合云服务器10和通信基站9远程处理数据信息,使得知识数据信息的获取方式多样,适应不同的工作,调节数据的对比、搜索和验证工作,适应时间发展和数据管理,使用方便,从而可根据用户需求,快速搜索数据信息,提高信息获取的速度和精度。
进一步地,智能搜索装置1设置有若干个,若干个智能搜索装置1均与交换机2双向连接,交换机2与数据转换模块3双向连接,且交换机2通过报文交换接收和转发智能搜索装置1的数据到数据转换模块3,多个智能搜索装置1同时可进行多项搜索工作,便于提供足够的使用空间,数据转换模块3分别与数据采集模块4和存储模块6双向连接,且数据转换模块3的输出端与通信基站9的输入端连接,数据转换模块3包括映射平面文件和翻译EDI标准文件,且数据转换模块3通过通信模块发送数据信息,且映射平面文件和翻译EDI标准文件均设置有两组,两组映射平面文件与翻译EDI标准文件之间通过计算机网络无线连接,数据转换模块3具有高效的数据传输和转换能力,便于适应不同的数据传输方式。
进一步地,数据采集模块4设置为基于远程数据采集模块平台的通信模块,且数据采集模块4还包括有通信芯片、存储芯片和单片机,且远程数据采集模块平台实现远程数据采集工作。
数据采集模块4还包括:
数据获取子模块,用于获取通过所述数据转换模块3转换的操作指令数据和搜索信息数据;
数据分类子模块,对于操作指令数据和搜索信息数据进行分类并分别设置第一指令标签集合和第二搜索结果标签集合;
配对子模块,将第一标识标签集合中每次发出的操作指令数据和第二标识标签集合中对应的搜索信息数据进行配对,形成由若干个配对单元组成的配对子集合;
对比子模块,用于将每个配对子集合中的搜索信息数据与预设理想搜索信息数据进行比对,以判断第二标识标签集合中的搜索信息数据与预设理想搜索信息数据之间的偏离程度,
信息判断子模块,当第二标识标签集合中的搜索信息数据与预设理想搜索信息数据之间的偏离程度大于30%时,将该配对子集合中的所述操作指令数据和搜索信息数据认定并标注为无效信息;
过滤剔除子模块,用于将无效信息进行剔除,将有效的信息输出给数据分类模块5。
上述技术方案的原理和效果为:通过对数据采集模块4采集的数据进行分类、配对以及比对分析,并判断是否属于无效信息,能够准确的将无效信息剔除,以确保进入数据分类模块5内的数据都是经过初步筛选之后的,进一步确保了知识库管理的完善和准确性。
所述数据采集模块4通过以下步骤筛选出有效的数据信息:
步骤S1:所述操作指令数据汇总形成第一指令标签集合F和第二搜索结果标签集合C,其中第一指令标签集合为:
F=[a1,a2,a3……ai],
第二搜索结果标签集合为:
Figure BDA0003657747030000111
其中,ai为第i个操作指令信息,[ci,1,ai,2,ai,3……ai,j]为针对第i个操作指令信息ai搜索出的j个搜索信息数据子集;
步骤S2:将j个搜索信息数据子集中的每一个搜索信息数据与预设理想搜索信息数据CiA逐个进行比对,以得到文本相似度,包括以下步骤:
S11:将搜索信息数据中的文本采用分词方式进行切分,获得有句法意义的若干个第一文本子单元;将预设理想搜索信息数据CiA中的文本采用分词方式进行切分,获得有句法意义的若干个第二文本子单元,
S12:采用特征构建方法,将第一文本子单元映射为一个长度为64、元素值为0或1的一维向量Veci,j=[a1,a2……an],其中n为自然数,an的取值为O或者1;
将第二文本子单元映射为一个长度为64、元素值为0或1的一维向量:VeciA=[b1,b2……bn],其中n为自然数,bn的取值为O或者1;
S13,基于海明距离,判断第一文本子单元与第二文本子单元之间的文本相似度:
Figure BDA0003657747030000112
其中ri为特征向量的维度的取值,
Figure BDA0003657747030000113
当搜索信息数据中的文本的特征向量与预设理想搜索信息数据中的文本的特征向量里,相等的维度越多,相似度就越大;
S14,将S13中第一文本子单元与第二文本子单元之间的文本相似度低于70%时,相当于偏离程度大于30%,此时将对应的搜索信息数据以及与所述搜索信息数据对应的操作指令数据标注为无效信息。
步骤S3:排除无效信息,得到筛选后的有效信息。
上述技术方案中,第一文本子单元和第二本文子单元的切分采用分词的方式,比如将“大学生该怎样学习渲染”切分为“大学生/该/怎样/学习/渲染”。分词的目的是将文本切分为有句法意义的一个个小单元,便于人和机器理解文本的内容。分词的优势是,在字符相关性较小的位置进行切分、造成的信息损失比较小。由于分词降低了文本的相关性,可以提升一些带有独立性假设的模型。
上述方案中,采用海明距离判断第一文本子单元与第二文本子单元之间的文本相似度,或者,两篇文本之间的差异,海明距离的计算方式非常简单,便于处理。
上述技术方案的原理和技术效果为:在筛选有效信息的过程中,将每个操作指令数据搜索出来的搜索信息数据与预设的理想搜索信息数据进行比较,并采用相似度计算方法计算出搜索信息数据与预设的理想搜索信息数据之间的相似度,当计算出来的相似度信息低于70%时,可以初步判断搜索出来的信息与预期的差距较大,应当删除,以免影响整个知识信息库的准确性。
数据采集模块4的输出端与数据分类模块5的输入端连接,数据分类模块5设置为基于SVM分类模型的知识信息管理模块,存储模块6的输入端分别与管理员验证模块7和云服务器10的输出端连接,云服务器10的输入端与知识数据库11的输出端连接,管理员验证模块7的输入端与管理计算机8的输出端连接,将搜索信息匹配知识数据库11的数据信息,可通过数据转换模块3再次接收知识库信息,通过智能搜索装置1进行显示,智能化搜索,且管理计算机8通过管理员验证模块7登录系统后,可对知识数据库11内部数据进行读写,管理不同的数据信息。
进一步地,数据分类模块5还包括:
文字采集模块501、图像采集模块502和语音采集模块503,文字采集模块501、图像采集模块502和语音采集模块503分别用于采集文字数据信息、图像数据信息和语音数据信息,文字采集模块501、图像采集模块502和语音采集模块503之间相互配合,通过功能模块池轻易快捷地嵌入到第三方应用程序,使数据分类模块5快速拥有多方音视频、协作的功能,当用户可操作层的需求发生变化时,功能模块池因其完全解耦,具有优秀的扩展性;
数据传输模块504,用于GPRS和短消息双通道传输数据,并且用于采集串口设备数据,且数据传输模块504采用无线传输,无线传输的方式适用于太阳能供电的监测场合,可大大减少太阳能供电成本并降低施工难度;
数据搜索单元505,用于根据用户输入的检索条件,从知识数据库11匹配出该检索条件相类似的知识信息,数据搜索单元505可在在相邻层接口间搜索传送的数据单元,便于提高收发效果;
数据对比单元506,用于将用户输入的知识信息与知识数据库11中的知识信息进行对比,筛选出相似度最佳的数据信息,数据对比单元506其中具有多个项目在不同场合下综合变动的一种特殊相对数,再进行对比过程中,把知识数据库11和智能搜索装置1提供的两个数值对比形成的相对数进行比较;
数据验证单元507,用于将文字采集模块501、图像采集模块502和语音采集模块503采集到的信息进行二次验证,筛除无用信息,验证输入数据是否与知识数据库11中已存在的数据匹配;
数据处理单元508,用于将数据搜索单元505、数据对比单元506和数据验证单元507获取的知识数据信息进行集中处理,管理同时采集到的信息,配置采集到的信息命令由命令解析电路发送到配置信息部分,配置信息电路对相应的参数解析并将信息保存到配置寄存器中供其他操作使用;
数据整合单元509,用于将数据处理单元508处理后的数据进行融合汇总,并根据数据信息重点自适应调整数据信息,数据整合单元509通过系统管理软件等手段对物理上分散的设备资源和数据资源进行虚拟化的集中管理;
数据发送单元510,用于将数据整合单元509汇总的知识信息进行传输,根据需求进行远程发送工作,根据数据信息重点自适应调整数据信息,多项数据融合筛选,可提高数据管理的效率,提高数据的收发效果。
进一步地,文字采集模块501、图像采集模块502和语音采集模块503的输出端均与数据传输模块504的输入端连接,数据传输模块504的输出端分别与数据搜索单元505、数据对比单元506和数据验证单元507的输入端连接,数据搜索单元505、数据对比单元506和数据验证单元507的输出端均与数据处理单元508的输入端连接,数据处理单元508的输出端与数据整合单元509的输入端连接,数据整合单元509的输出端与数据发送单元510的输入端连接,导入的数据依次有序的进行处理后,最终呈现的数据具有高精度的数据贴合性。
进一步地,智能搜索装置1包括:
折叠显示屏101,用于显示智能搜索后知识库的知识信息,可根据需求调整折叠显示屏101的角度位置,折叠显示屏101显示多种知识数据;
工作台103,用于将折叠显示屏101支撑,并提供位置给客户进行操作,工作台103在工作中可提供操作空间;
伸缩板105,用于调整客户操作位置,适应不同的环境,伸缩板105可将客户端操作模块106和操作显示屏107隐藏防护,在使用时再次展开,适应不同工作环境;
客户端操作模块106,用于收集客户搜索指令,且客户端操作模块106包括文字识别模块、图像识别模块和语音识别模块,客户端操作模块106可通过采取不同种类的信息,分类处理数据,提供高质量的服务;
系统服务器109,用于连接知识库管理系统中多项管理终端,并且进行交互数据信息,系统服务器109与知识数据库11进行连接,可便于快速提供缓存信息数据。
进一步地,折叠显示屏101设置有两个,两个折叠显示屏101之间安装有连接轴102,两个折叠显示屏101之间连接轴102通过转动连接,连接轴102的下端安装有稳定座,且稳定座与工作台103的上端面固定连接,工作台103的内部设置有滑动通口104,伸缩板105通过滑动通口104与工作台103滑动连接,伸缩板105还包括有操作显示屏107,通过操作客户端操作模块106,操作信息显示在操作显示屏107上,进行搜索知识,操作显示屏107用于显示客户端操作模块106的输入命令,客户端操作模块106设置有四个,四个客户端操作模块106均通过固定螺丝与伸缩板105固定连接,文字识别模块包括键盘输入,图像识别模块包括光电电磁摄像头、模拟摄像头、数字摄像头和主控单片机,语音识别模块包括控制器模块、语音识别模块、功放模块和喇叭,根据搜索数据的需求不同,进行不同的数据采集工作。
进一步地,智能搜索装置1还包括有:
支撑架108,支撑架108位于工作台103的下端两侧且与工作台103固定连接,支撑架108下端可安装滚轮,使智能搜索装置1进行移动;
无线传输模块110,用于连接无线网络和智能手机进行搜索知识数据库11,用无线传输模块110建立专用无线数据传输方式将比有线通讯有更好的更广泛的适应性,几乎不受地理环境限制;
散热板111,散热板111位于系统服务器109的下端,且散热板111的内部设置有水冷散热器,通过系统服务器109存储和缓存知识数据库11中的数据信息,可提高搜索效率。
综上,本支持智能搜索的知识库管理系统,使用者通过操作客户端操作模块106,操作信息显示在操作显示屏107上,进行搜索知识,根据搜索数据的需求不同,进行不同的数据采集工作,通过智能搜索装置1的多项辅助设备配合使用者进行智能搜索工作,搜索过程中,可通过交换机2将操作信息进行传输,通过数据转换模块3转换成方便处理的数据信息,从而进行快速传输工作,传输作业中,可通过数据采集模块4进行统计数据,数据采集模块4接收过滤信息后,可通过数据分类模块5接触信息类型,可通过文字采集模块501、图像采集模块502和语音采集模块503分别用于采集文字数据信息、图像数据信息和语音数据信息,将采取的信息通过GPRS和短消息双通道传输数据,根据用户输入的检索条件,从知识数据库11匹配出该检索条件相类似的知识信息,将文字采集模块501、图像采集模块502和语音采集模块503采集到的信息进行二次验证,筛除无用信息,再数据搜索单元505、数据对比单元506和数据验证单元507获取的知识数据信息进行集中处理,管理同时采集到的信息,最后将数据处理单元508处理后的信息进行融合汇总,并根据数据信息重点自适应调整数据信息,多项数据融合筛选,可提高数据管理的效率,提高数据的收发效果,数据分类模块5具有智能分析管理数据的效果,从而可匹配出最佳的知识数据信息,将搜索信息匹配知识数据库11的数据信息,可通过数据转换模块3再次接收知识库信息,通过智能搜索装置1进行显示,智能化搜索,且管理计算机8通过管理员验证模块7登录系统后,可对知识数据库11内部数据进行读写,管理不同的数据信息,且可通过大数据的形式,配合云服务器10和通信基站9远程处理数据信息,使得知识数据信息的获取方式多样,适应不同的工作,调节数据的对比、搜索和验证工作。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (8)

1.一种支持智能搜索的知识库管理系统,其特征在于,包括:
智能搜索装置(1),用于客户进行操作显示知识库信息;
交换机(2),用于对所述智能搜索装置(1)的操作指令信息传输;
数据转换模块(3),用于将客户的操作指令和搜索信息转换成方便处理的数据信息;
数据采集模块(4),用于对所述数据转换模块(3)转换的数据进行统计,并过滤无效信息;
数据分类模块(5),用于对所述数据采集模块(4)采集到的信息按照设定好的分类原则,对知识信息进行分类,并对已分类好的知识信息进行存储及管理;
存储模块(6),用于将所述转换的数据信息存储;
管理员验证模块(7),用于工作人员登录,对所述存储模块(6)内的数据信息进行管理;
管理计算机(8),用于辅助工作人员远程操作管理工作;
通信基站(9),用于无线传输所述数据转换模块(3)转换的数据信息;
云服务器(10),用于临时存储和缓存知识库数据信息;
知识数据库(11),用于发送知识库数据信息和接收知识库数据信息;
所述数据采集模块(4)还包括:
数据获取子模块,用于获取通过所述数据转换模块(3)转换的操作指令数据和搜索信息数据;
数据分类子模块,对于操作指令数据和搜索信息数据进行分类并分别设置第一指令标签集合和第二搜索结果标签集合;
配对子模块,将第一标识标签集合中每次发出的操作指令数据和第二标识标签集合中对应的搜索信息数据进行配对,形成由若干个配对单元组成的配对子集合;
对比子模块,用于将每个配对子集合中的搜索信息数据与预设理想搜索信息数据进行比对,以判断第二标识标签集合中的搜索信息数据与预设理想搜索信息数据之间的偏离程度,
信息判断子模块,当第二标识标签集合中的搜索信息数据与预设理想搜索信息数据之间的偏离程度大于30%时,将该配对子集合中的所述操作指令数据和搜索信息数据认定并标注为无效信息;
过滤剔除子模块,用于将无效信息进行剔除,将有效的信息输出给数据分类模块(5);
所述数据采集模块(4)通过以下步骤筛选出有效的数据信息:
步骤S1:所述操作指令数据汇总形成第一指令标签集合F和第二搜索结果标签集合C,其中第一指令标签集合为:
F=[a1,a2,a3……ai],
第二搜索结果标签集合为:
Figure FDA0003993535670000021
其中,ai为第i个操作指令信息,[ci,1,ai,2,ai,3……ai,j]为针对第i个操作指令信息ai搜索出的j个搜索信息数据子集;
步骤S2:将j个搜索信息数据子集中的每一个搜索信息数据与预设理想搜索信息数据CiA逐个进行比对,以得到文本相似度,包括以下步骤:
S11:将搜索信息数据中的文本采用分词方式进行切分,获得有句法意义的若干个第一文本子单元;将预设理想搜索信息数据CiA中的文本采用分词方式进行切分,获得有句法意义的若干个第二文本子单元,
S12:采用特征构建方法,将第一文本子单元映射为一个长度为64、元素值为0或1的一维向量Veci,j=[a1,a2……an],其中n为自然数,an的取值为O或者1;
将第二文本子单元映射为一个长度为64、元素值为0或1的一维向量:VeciA=[b1,b2……bn],其中n为自然数,bn的取值为O或者1;
S13,基于海明距离,判断第一文本子单元与第二文本子单元之间的文本相似度:
Figure FDA0003993535670000031
其中ri为特征向量的维度的取值,
Figure FDA0003993535670000032
当搜索信息数据中的文本的特征向量与预设理想搜索信息数据中的文本的特征向量里,相等的维度越多,相似度就越大;
S14,将S13中第一文本子单元与第二文本子单元之间的文本相似度低于70%时,将对应的搜索信息数据以及与所述搜索信息数据对应的操作指令数据标注为无效信息;
步骤S3:排除无效信息,得到筛选后的有效信息。
2.根据权利要求1所述的一种支持智能搜索的知识库管理系统,其特征在于:所述智能搜索装置(1)设置有若干个,若干个所述智能搜索装置(1)均与交换机(2)双向连接,所述交换机(2)与数据转换模块(3)双向连接,且所述交换机(2)通过报文交换接收和转发智能搜索装置(1)的数据到数据转换模块(3),所述数据转换模块(3)分别与数据采集模块(4)和存储模块(6)双向连接,且所述数据转换模块(3)的输出端与通信基站(9)的输入端连接,所述数据转换模块(3)包括映射平面文件和翻译EDI标准文件,且所述数据转换模块(3)通过通信模块发送数据信息,且映射平面文件和翻译EDI标准文件均设置有两组,两组映射平面文件与翻译EDI标准文件之间通过计算机网络无线连接。
3.根据权利要求2所述的一种支持智能搜索的知识库管理系统,其特征在于:所述数据采集模块(4)设置为基于远程数据采集模块平台的通信模块,且所述数据采集模块(4)还包括有通信芯片、存储芯片和单片机,且远程数据采集模块平台实现远程数据采集工作,所述数据采集模块(4)的输出端与数据分类模块(5)的输入端连接,所述数据分类模块(5)设置为基于SVM分类模型的知识信息管理模块,所述存储模块(6)的输入端分别与管理员验证模块(7)和云服务器(10)的输出端连接,所述云服务器(10)的输入端与知识数据库(11)的输出端连接,所述管理员验证模块(7)的输入端与管理计算机(8)的输出端连接。
4.根据权利要求3所述的一种支持智能搜索的知识库管理系统,其特征在于,所述数据分类模块(5)还包括:
文字采集模块(501)、图像采集模块(502)和语音采集模块(503),所述文字采集模块(501)、图像采集模块(502)和语音采集模块(503)分别用于采集从数据采集模块(4)输出的文字数据信息、图像数据信息和语音数据信息;
数据传输模块(504),用于GPRS和短消息双通道传输数据,并且用于采集串口设备数据;
数据搜索单元(505),用于根据用户输入的检索条件,从知识数据库(11)匹配出该检索条件相类似的知识信息;
数据对比单元(506),用于将用户输入的知识信息与知识数据库(11)中的知识信息进行对比,筛选出相似度最佳的数据信息;
数据验证单元(507),用于将所述文字采集模块(501)、图像采集模块(502)和语音采集模块(503)采集到的信息进行二次验证,筛除无用信息;
数据处理单元(508),用于将所述数据搜索单元(505)、数据对比单元(506)和数据验证单元(507)获取的知识数据信息进行集中处理,管理同时采集到的信息;
数据整合单元(509),用于将所述数据处理单元(508)处理后的数据进行融合汇总,并根据数据信息重点自适应调整数据信息;
数据发送单元(510),用于将所述数据整合单元(509)汇总的知识信息进行传输,根据需求进行远程发送工作。
5.根据权利要求4所述的一种支持智能搜索的知识库管理系统,其特征在于:所述文字采集模块(501)、图像采集模块(502)和语音采集模块(503)的输出端均与数据传输模块(504)的输入端连接,所述数据传输模块(504)的输出端分别与数据搜索单元(505)、数据对比单元(506)和数据验证单元(507)的输入端连接,所述数据搜索单元(505)、数据对比单元(506)和数据验证单元(507)的输出端均与数据处理单元(508)的输入端连接,所述数据处理单元(508)的输出端与数据整合单元(509)的输入端连接,所述数据整合单元(509)的输出端与数据发送单元(510)的输入端连接。
6.根据权利要求5所述的一种支持智能搜索的知识库管理系统,其特征在于,所述智能搜索装置(1)包括:
折叠显示屏(101),用于显示智能搜索后知识库的知识信息;
工作台(103),用于将所述折叠显示屏(101)支撑,并提供位置给客户进行操作;
伸缩板(105),用于调整客户操作位置,适应不同的环境;
客户端操作模块(106),用于收集客户搜索指令,且所述客户端操作模块(106)包括文字识别模块、图像识别模块和语音识别模块;
系统服务器(109),用于连接知识库管理系统中多项管理终端,并且进行交互数据信息。
7.根据权利要求6所述的一种支持智能搜索的知识库管理系统,其特征在于:所述折叠显示屏(101)设置有两个,两个所述折叠显示屏(101)之间安装有连接轴(102),两个所述折叠显示屏(101)之间连接轴(102)通过转动连接,所述连接轴(102)的下端安装有稳定座,且稳定座与工作台(103)的上端面固定连接,所述工作台(103)的内部设置有滑动通口(104),所述伸缩板(105)通过滑动通口(104)与工作台(103)滑动连接,所述伸缩板(105)还包括有操作显示屏(107),所述操作显示屏(107)用于显示客户端操作模块(106)的输入命令,所述客户端操作模块(106)设置有四个,四个所述客户端操作模块(106)均通过固定螺丝与伸缩板(105)固定连接,所述文字识别模块包括键盘输入,所述图像识别模块包括光电电磁摄像头、模拟摄像头、数字摄像头和主控单片机,所述语音识别模块包括控制器模块、语音识别模块、功放模块和喇叭。
8.根据权利要求7所述的一种支持智能搜索的知识库管理系统,其特征在于,所述智能搜索装置(1)还包括有:
支撑架(108),所述支撑架(108)位于工作台(103)的下端两侧且与工作台(103)固定连接;
无线传输模块(110),用于连接无线网络和智能手机进行搜索知识数据库(11);
散热板(111),所述散热板(111)位于系统服务器(109)的下端,且所述散热板(111)的内部设置有水冷散热器。
CN202210565054.7A 2022-05-23 2022-05-23 一种支持智能搜索的知识库管理系统 Active CN114936232B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210565054.7A CN114936232B (zh) 2022-05-23 2022-05-23 一种支持智能搜索的知识库管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210565054.7A CN114936232B (zh) 2022-05-23 2022-05-23 一种支持智能搜索的知识库管理系统

Publications (2)

Publication Number Publication Date
CN114936232A CN114936232A (zh) 2022-08-23
CN114936232B true CN114936232B (zh) 2023-03-07

Family

ID=82864761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210565054.7A Active CN114936232B (zh) 2022-05-23 2022-05-23 一种支持智能搜索的知识库管理系统

Country Status (1)

Country Link
CN (1) CN114936232B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1838126A (zh) * 2006-01-11 2006-09-27 张新波 自由输入形式的无线短信匹配和搜索引擎的信息处理方法及其装置
CN112052317A (zh) * 2020-08-19 2020-12-08 杭州古珀医疗科技有限公司 一种基于深度学习的医学知识库智能检索系统及其方法
CN114138986A (zh) * 2021-11-02 2022-03-04 北京银盾泰安网络科技有限公司 一种具有增强内容的客户管理平台及其方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6915297B2 (en) * 2002-05-21 2005-07-05 Bridgewell, Inc. Automatic knowledge management system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1838126A (zh) * 2006-01-11 2006-09-27 张新波 自由输入形式的无线短信匹配和搜索引擎的信息处理方法及其装置
CN112052317A (zh) * 2020-08-19 2020-12-08 杭州古珀医疗科技有限公司 一种基于深度学习的医学知识库智能检索系统及其方法
CN114138986A (zh) * 2021-11-02 2022-03-04 北京银盾泰安网络科技有限公司 一种具有增强内容的客户管理平台及其方法

Also Published As

Publication number Publication date
CN114936232A (zh) 2022-08-23

Similar Documents

Publication Publication Date Title
CN100449542C (zh) 匹配联系人信息的方法及装置
CN105354251B (zh) 电力系统中基于Hadoop的电力云数据管理索引方法
CN102855298A (zh) 图像检索方法及系统
CN107622068A (zh) 一种基于json格式的日志管理方法及装置
CN206411669U (zh) 一种SaaS古籍知识服务云平台
US11537636B2 (en) System and method for using multimedia content as search queries
Jia et al. Photo-to-Search: Using camera phones to inquire of the surrounding world
US20130191368A1 (en) System and method for using multimedia content as search queries
CN115827862A (zh) 一种多元费用凭证数据关联采集方法
CN109145643B (zh) 一种基于私有云的个人多源数据管理方法与系统
CN114936232B (zh) 一种支持智能搜索的知识库管理系统
WO2010071617A1 (en) Method and apparatus for performing image processing
CN106815305A (zh) 一种基于数据分析的车载智慧终端系统
WO2023137700A1 (zh) 一种面向城市决策和评估的多尺度信息目录构建系统
CN112347314B (zh) 一种基于图数据库的数据资源管理系统
CN111079394A (zh) 一种基于互联网的政务资料填单系统及方法
CN112712265A (zh) 一种基于大数据管理的业务运营分析管理系统
CN112506873B (zh) 实物档案数据自动录入管理系统
CN113111696A (zh) 一种小尺寸液晶屏微观识别分类集成系统及其方法
CN116521776B (zh) 一种信息快速查询系统
CN111736939A (zh) 一种页面自适应调整方法、装置、存储介质及计算机设备
CN111538709A (zh) 一种执法证据的智能管理系统及其管理方法
CN111858978B (zh) 一种自动制作网络课件图标的方法及系统
CN214409906U (zh) 一种基于树莓派的建筑智能巡检ar眼镜
CN111104558A (zh) 一种分布式的多源数据处理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant