CN116662374A - 基于相关性分析的信息技术咨询服务系统 - Google Patents
基于相关性分析的信息技术咨询服务系统 Download PDFInfo
- Publication number
- CN116662374A CN116662374A CN202310942925.7A CN202310942925A CN116662374A CN 116662374 A CN116662374 A CN 116662374A CN 202310942925 A CN202310942925 A CN 202310942925A CN 116662374 A CN116662374 A CN 116662374A
- Authority
- CN
- China
- Prior art keywords
- phrase
- adjacent
- consultation
- data
- sentence pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005516 engineering process Methods 0.000 title claims abstract description 27
- 238000010219 correlation analysis Methods 0.000 title claims abstract description 10
- 238000012549 training Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000005259 measurement Methods 0.000 claims description 10
- 230000003313 weakening effect Effects 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 5
- 238000009223 counseling Methods 0.000 claims description 4
- 108091026890 Coding region Proteins 0.000 claims description 3
- 230000008521 reorganization Effects 0.000 claims description 3
- 230000006798 recombination Effects 0.000 claims 1
- 238000005215 recombination Methods 0.000 claims 1
- 238000000034 method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明提供了信息检索咨询技术领域中的基于相关性分析的信息技术咨询服务系统,包括:字段拆分模块,所述字段拆分模块获取咨询字段数据,将所述咨询字段数据进行词组和/或单字的拆分,得到依词序编码排布的原词组数据信息;相关数据查询模块,所述相关数据查询模块根据各词序相应的原词组进行对应的语义相近的临近词组数据的查询,并获取各相应所述临近词组数据的临近参数信息;所述临近词组数据包括正向临近词组和反向临近词组。本发明能够根据咨询字段数据对咨询结果的精准且快速的检索,并测算出检索结果与检索结果的对应性情况,并在无法检出时,快速确定出对应的偏离词组,以实现快速重新定义句式进行检索咨询。
Description
技术领域
本发明涉及信息检索咨询技术领域,尤其涉及基于相关性分析的信息技术咨询服务系统。
背景技术
信息技术咨询过程中,常采用系统信息检索方式的快速查询定位到用户需求的咨询内容。而信息检索又是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。狭义的信息检索仅指信息查询。即用户根据需要,采用一定的方法,借助检索工具,从信息集合中找出所需要信息的查找过程。广义的信息检索是信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户特定的需要将相关信息准确的查找出来的过程。又称信息的存储与检索。
在用户或咨询服务人员利用信息咨询检索系统进行咨询检索时,由于不清楚检索内容是否符合检索结果对应的精准句式,因此常会出现检索内容难以精准的查询到对应的检索结果,需要耗费大量的对检索结果的阅读时间和精力以及重新检索时间和精力,而且重新检索也不便于确定到想要的检索句式以与相应的检索结果相对应。
发明内容
本发明的目的是针对现有技术的不足之处,提供基于相关性分析的信息技术咨询服务系统,解决信息技术咨询过程中难以快速定位咨询内容、咨询内容难以实现与咨询检索结果对应性的技术问题。
为实现上述目的,本发明提供如下技术方案:
基于相关性分析的信息技术咨询服务系统,包括:
字段拆分模块,所述字段拆分模块获取咨询字段数据,将所述咨询字段数据进行词组和/或单字的拆分,得到依词序编码排布的原词组数据信息;
相关数据查询模块,所述相关数据查询模块根据各词序相应的原词组进行对应的语义相近的临近词组数据的查询,并获取各相应所述临近词组数据的临近参数信息;所述临近词组数据包括正向临近词组和反向临近词组;
句式判断模块,所述句式判断模块判断各所述词序对应的所述原词组的所述临近词组数据组成的字段句式是否满足检索对应的精准咨询句式的语义偏移要求,若满足,则控制输出对应的所述精准咨询句式,若不满足,则控制输出不满足句式要求的所述词序对应的原词组数据和指导词组,重新检索咨询;
以及咨询输出模块,所述咨询输出模块根据输出的所述咨询句式,生成与所述精准咨询句式相应的咨询结果数据。
进一步的,所述字段拆分模块包括:
字段采集模块,所述字段采集模块采集用户对所述信息技术的咨询字段数据;
拆分控制模块,所述拆分控制模块控制对所述咨询字段数据进行对应的词组和/或单字拆分,以获得所述原词组数据;
以及排序处理模块,所述排序处理模块将所述原词组数据按照所述咨询字段数据对应的顺序进行次序的编码排序。
进一步的,所述相关数据查询模块包括:
原词组调取模块,所述原词组调取模块依所述词序调取所述原词组数据信息;
以及机器训练模块,所述机器训练模块根据所述原词组数据在机器训练库中查询出与所述原词组数据语义相近的所述正向临近词组和所反向临近词组,并进行分库临时存储。
进一步的,所述正向临近词组为所述原词组数据进行语义加重后的临近词组数据;所述反向临近词组为所述原词组数据进行语义减弱后的临近词组数据。
进一步的,所述机器训练模块包括:
正向存储库,所述正向存储库存储机器训练出的所述正向临近词组,以及各所述正向临近词组以所述原词组为基准向所述原词组数据的语义加重侧的正向偏移度;
以及反向存储库,所述反向存储库存储机器训练出的所述反向临近词组,以及各所述反向临近词组以所述原词组为基准向所述原词组数据的语义减弱侧的正向偏移度。
进一步的,所述句式判断模块包括:
句式重组模块,所述句式重组模块查询满足预定数量n范围内的各所述正向临近词组和所述反向临近词组,并按词序编码顺序将所述正向临近词组和所述反向临近词组进行组合形成所述临近词组数据组成的临近字段句式;
句式检索模块,所述句式检索模块根据所述临近词组数据组成的所述临近字段句式进行相似度最接近的所述精准咨询句式进行查询;
句式筛选模块,所述句式筛选模块筛选出各所述临近字段句式对所述精准咨询句式相应的整体偏移权重满足预定偏移权重/>的所述临近字段句式;
以及总偏移测算模块,所述总偏移测算模块根据满足预定偏移权重的所述临近字段句式的所述整体偏移权重/>,对基于所述原词组的总偏移权重/>进行测算。
进一步的,所述句式筛选模块包括:
整体偏移权重测算模块,所述整体偏移权重测算模块根据所述正向临近词组对应所述精准咨询句式的正向权重参数和所述反向临近词组对应所述精准咨询句式的反向权重参数/>,对所述整体偏移权重/>进行乘积计算;
以及句式控制模块,所述句式控制模块判断所述整体偏移权重在所述预定偏移权重/>范围内时,对所述总偏移权重/>进行测算,并在所述整体偏移权重/>未在所述预定偏移权重/>范围内时,将不满足句式要求的所述词序对应的原词组数据和指导词组控制输出。
进一步的,所述句式控制模块包括:
句式查询模块,所述句式查询模块在所述整体偏移权重未在所述预定偏移权重/>范围内时,调取出对应的所述精准咨询句式,并按所述原词组的拆分方式拆分成对应的精准词组数据;
以及用户载入模块,所述用户载入模块分配在用户端系统作为所述指导词组。
进一步的,所述句式控制模块还包括:
分偏移度调取模块,所述分偏移度调取模块调取各所述原词组对应的所述正向临近词组或所述反向临近词组的正向偏移度或反向偏移度;
以及总偏移权重测算模块,所述总偏移权重测算模块根据所述原词组对相应的所述正向临近词组或所述反向临近词组的偏移权重参数或/>,以及所述正向临近词组或所述反向临近词组对应的所述正向偏移度或所述反向偏移度,对所述总偏移权重/>进行乘积测算。
进一步的,所述咨询输出模块包括:
句式导出模块,所述句式导出模块导出所述精准咨询句式,以及导出所述精准咨询句式对应的咨询结果数据;
以及偏移度输出模块,所述偏移度输出模块导出所述原词组对所述精准咨询句式对应词组的偏移情况,以及所述咨询字段数据对应的测算出的所述总偏移权重。
本发明的有益效果在于:通过将用户咨询内容对应的咨询字段数据进行原词组数据的拆分,并查询与原词组相应加重语义的正向临近词组数据和反向临近词组数据,再按照咨询句式数据的词序重新组合,查询出最为接近的精准咨询句式,根据各临近词组对应的临近字段句式对精准咨询句式偏移时的正向权重参数、反向权重参数以及各临近词组对应的临近字段句式对精准咨询句式偏移时的偏移度,计算出各临近词组对应的临近字段句式对精准组训句式的整体偏移权重。再根据原词组数据对临近词组的偏移度、以及原词组数据对临近词组偏移时的正向偏移权重参数和反向偏移权重参数,计算出原词组数据对临近词组的偏移权重,进而计算得到总偏移权重和各原词组对应精准咨询句式相应词组的偏移权重,从而更好的确认出检索咨询结果的精准性,同时能够根据各词组对精准咨询句式对应的检索结果的偏移情况,重新调整句式,以帮助快速调整咨询句式,提高检索咨询效率。
附图说明
图1为本发明咨询服务系统的架构图;
图2为本发明字段拆分模块的架构图;
图3为本发明相关数据查询模块的架构图;
图4为本发明句式判断模块的架构图;
图5为本发明咨询输出模块的架构图。
具体实施方式
如图1所示,基于相关性分析的信息技术咨询服务系统,包括:
字段拆分模块,字段拆分模块获取咨询字段数据,将咨询字段数据进行词组和/或单字的拆分,得到依词序编码排布的原词组数据信息;
相关数据查询模块,相关数据查询模块根据各词序相应的原词组进行对应的语义相近的临近词组数据的查询,并获取各相应临近词组数据的临近参数信息;临近词组数据包括正向临近词组和反向临近词组;
句式判断模块,句式判断模块判断各词序对应的原词组的临近词组数据组成的字段句式是否满足检索对应的精准咨询句式的语义偏移要求,若满足,则控制输出对应的精准咨询句式,若不满足,则控制输出不满足句式要求的词序对应的原词组数据和指导词组,重新检索咨询;
以及咨询输出模块,咨询输出模块根据输出的咨询句式,生成与精准咨询句式相应的咨询结果数据。
在本发明一实施例中,根据用户需求的信息技术检索咨询服务过程中,通过字段拆分模块先获取到用户需求的信息技术咨询内容,即咨询字段数据。根据咨询字段数据的词组组成情况,将其拆分成词组或单字,以形成具有词组和/或单字的原词组数据。并且再根据构成咨询字段数据的顺序将原词组数据中对应词组和/或单字进行顺序编码。通过相关数据查询模块根据原词组数据对应的词组和/或单字,对相应的临近词组进行查询,并经临近词组根据语义程度分为正向临近词组和反向临近词组,其中,正向临近词组为对原词组进行语义加强的词组,而反向临近词组为对原词组进行语义减弱的词组。通过句式判断模块将各临近词组按照咨询字段数据的词序进行重新组合以形成临近字段句式,再根据各临近字段句式查找出最相近的且为咨询系统存储的对应精准咨询句式,判断临近字段句式是否满足精准咨询句式的语义偏移要求,若满足,则输出该精准咨询句式及其检索结果,同时输出精准咨询句式对应咨询字段数据的偏移情况。同时在不满足时,则会控制输出不满足的咨询字段数据对应的原词组情况,并根据知道词组重新填入相应的咨询字段数据进行重新检索咨询。通过咨询输出模块可以实现对句式判断模块在满足要求时的精准咨询句式的输出,并根据该精准咨询句式获取相应的咨询结果,以完成咨询服务。通过上述方式的查询咨询,能够更好的判断出信息技术咨询服务时,用户的咨询内容是否与咨询结果相对应以及对应的程度,从而提高信息技术咨询服务高效率和精准性。
如图2所示,字段拆分模块包括:
字段采集模块,字段采集模块采集用户对信息技术的咨询字段数据;
拆分控制模块,拆分控制模块控制对咨询字段数据进行对应的词组和/或单字拆分,以获得原词组数据;
以及排序处理模块,排序处理模块将原词组数据按照咨询字段数据对应的顺序进行次序的编码排序。
在本发明一实施例中,字段拆分过程中,通过字段采集模块以实现根据用户提供的咨询内容获取到相应的咨询字段数据。通过拆分控制模块将咨询字段数据按照常规词组和/或单字进行拆分处理,以获取原词组数据。并通过排序处理模块对原词组数据按照咨询字段数据的词序进行编排,以实现对原词组数据的有序查询和判断处理。
如图3所示,相关数据查询模块包括:
原词组调取模块,原词组调取模块依词序调取原词组数据信息;
以及机器训练模块,机器训练模块根据原词组数据在机器训练库中查询出与原词组数据语义相近的正向临近词组和所反向临近词组,并进行分库临时存储。
在本发明一实施例中,在对原词组数据的临近词组数据查询过程中,通过原词组调取模块以实现对咨询字段数据拆分后形成的原词组数据的调取。通过及其训练模块在及其训练库中调取出与原词组相近语义的临近词组。并将临近词组按照语义的加强或减弱情况分为正向临近词组和反向临近词组,并分类存储至临近存储库中,该临近存储库也可分为正向存储库和反向存储库以分别存储正向临近词组和反向临近词组。
正向临近词组为原词组数据进行语义加重后的临近词组数据;反向临近词组为原词组数据进行语义减弱后的临近词组数据。
机器训练模块包括:
正向存储库,正向存储库存储机器训练出的正向临近词组,以及各正向临近词组以原词组为基准向原词组数据的语义加重侧的正向偏移度;
以及反向存储库,反向存储库存储机器训练出的反向临近词组,以及各反向临近词组以原词组为基准向原词组数据的语义减弱侧的正向偏移度。
在本实施例中,对应编码的各原词组例如原词组a会存在加强语义和减弱语义的情况,即正向临近词组和反向临近词组/>,而在正向临近词组/>对应的正向存储库中,会对应的存在各正向偏移度,而在反向存储库中,会对应的存储各反向偏移度/>,依次类推,原词组b对应的各正向偏移度/>,各反向偏移度/>,原词组c……。
句式判断模块包括:
句式重组模块,句式重组模块查询满足预定数量n范围内的各正向临近词组和反向临近词组,并按词序编码顺序将正向临近词组和反向临近词组进行组合形成临近词组数据组成的临近字段句式;
句式检索模块,句式检索模块根据临近词组数据组成的临近字段句式进行相似度最接近的精准咨询句式进行查询;
句式筛选模块,句式筛选模块筛选出各临近字段句式对精准咨询句式相应的整体偏移权重满足预定偏移权重/>的临近字段句式;
以及总偏移测算模块,总偏移测算模块根据满足预定偏移权重的临近字段句式的整体偏移权重/>,对基于原词组的总偏移权重/>进行测算。
在本发明一实施例中,例如咨询字段数据在若干组临近词组形成的临近字段句式中存在形成的临近字段句式为/>,而对应的精准咨询句式为/>时,则需要先计算出临近字段句式/>的各临近词组/>对应于精准咨询句式中各词组的权重偏移度,再进一步的计算出整体偏移权重/>,并判断该整体偏移权重/>是否超出预定偏移权重/>。并且在未超出该预定偏移权重/>时,根据该整体偏移权重/>和咨询字段数据/>对临近字段句式为/>,的偏移度/>,计算得到总偏移权重/>。
句式筛选模块包括:
整体偏移权重测算模块,整体偏移权重测算模块根据正向临近词组对应精准咨询句式的正向权重参数和反向临近词组对应精准咨询句式的反向权重参数/>,对整体偏移权重/>进行乘积计算;
以及句式控制模块,句式控制模块判断整体偏移权重在预定偏移权重/>范围内时,对总偏移权重/>进行测算,并在整体偏移权重/>未在预定偏移权重/>范围内时,将不满足句式要求的词序对应的原词组数据和指导词组控制输出。
在本发明一实施例中,整体偏移权重计算过程中,例如咨询字段数据/>在若干组临近词组形成的临近字段句式中存在形成的临近字段句式为/>,而对应的精准咨询句式为/>时,根据临近字段句式为/>相应的临近词组/>的偏移度/>和正向权重参数/>、反向权重参数/>,计算得到该临近字段句式为对精准字段数据的整体偏移权重/>。再判断当/>时,对总偏移权重/>进行测算。判断当/>时,控制重新输入咨询字段数据。
句式控制模块包括:
句式查询模块,句式查询模块在整体偏移权重未在预定偏移权重/>范围内时,调取出对应的精准咨询句式,并按原词组的拆分方式拆分成对应的精准词组数据;
以及用户载入模块,用户载入模块分配在用户端系统作为指导词组。
句式控制模块还包括:
分偏移度调取模块,分偏移度调取模块调取各原词组对应的正向临近词组或反向临近词组的正向偏移度或反向偏移度;
以及总偏移权重测算模块,总偏移权重测算模块根据原词组对相应的正向临近词组或反向临近词组的偏移权重参数或/>,以及正向临近词组或反向临近词组对应的正向偏移度或反向偏移度,对总偏移权重/>进行乘积测算。
在本发明一实施例中,对总偏移权重进行计算时,例如咨询字段数据/>在若干组临近词组形成的临近字段句式中存在形成的临近字段句式为/>,而对应的精准咨询句式为/>时,根据临近字段句式为/>相应的临近词组/>的偏移度/>和正向权重参数/>、反向权重参数/>,计算得到该临近字段句式为/>对精准字段数据的整体偏移权重/>,再根据咨询字段数据/>至临近字段句式为/>的偏移度/>以及相应的正向偏移权重参数/>和反向偏移权重参数/>,计算出总偏移权重。
咨询输出模块包括:
句式导出模块,句式导出模块导出精准咨询句式,以及导出精准咨询句式对应的咨询结果数据;
以及偏移度输出模块,偏移度输出模块导出原词组对精准咨询句式对应词组的偏移情况,以及咨询字段数据对应的测算出的总偏移权重。
在本发明一实施例中,例如咨询字段数据在若干组临近词组形成的临近字段句式中存在形成的临近字段句式为/>,而对应的精准咨询句式为/>时,例如的偏移权重/>进行计算时,为从/>的偏移,即/>。
本发明还提供了一种基于相关性分析的信息技术咨询服务方法,包括如下步骤:
S1:获取咨询字段数据,将咨询字段数据进行词组和/或单字的拆分,得到依词序编码排布的原词组数据信息;
S2:根据各词序相应的原词组进行对应的语义相近的临近词组数据的查询,并获取各相应临近词组的临近参数信息;临近词组包括正向临近词组和反向临近词组;
S3:判断各词序对应的原词组的临近词组组成的字段句式是否满足检索对应的精准咨询句式的语义偏移要求,若满足,则控制输出对应的精准咨询句式,若不满足,则控制输出不满足句式要求的词序对应的原词组数据和指导词组,重新检索咨询;
S4:根据输出的咨询句式,生成与精准咨询句式相应的咨询结果数据。
综上,本发明通过将用户咨询内容对应的咨询字段数据进行原词组数据的拆分,并查询与原词组相应加重语义的正向临近词组数据和反向临近词组数据,再按照咨询句式数据的词序重新组合,查询出最为接近的精准咨询句式,根据各临近词组对应的临近字段句式对精准咨询句式偏移时的正向权重参数、反向权重参数/>以及各临近词组对应的临近字段句式对精准咨询句式偏移时的偏移度,计算出各临近词组对应的临近字段句式对精准组训句式的整体偏移权重/>。再根据原词组数据对临近词组的偏移度、以及原词组数据对临近词组偏移时的正向偏移权重参数/>和反向偏移权重参数/>,计算出原词组数据对临近词组的偏移权重,进而计算得到总偏移权重/>和各原词组对应精准咨询句式相应词组的偏移权重,从而更好的确认出检索咨询结果的精准性,同时能够根据各词组对精准咨询句式对应的检索结果的偏移情况,重新调整句式,以帮助快速调整咨询句式,提高检索咨询效率。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.基于相关性分析的信息技术咨询服务系统,其特征在于,包括:
字段拆分模块,所述字段拆分模块获取咨询字段数据,将所述咨询字段数据进行词组和/或单字的拆分,得到依词序编码排布的原词组数据信息;
相关数据查询模块,所述相关数据查询模块根据各词序相应的原词组进行对应的语义相近的临近词组数据的查询,并获取各相应所述临近词组数据的临近参数信息;所述临近词组数据包括正向临近词组和反向临近词组;
句式判断模块,所述句式判断模块判断各所述词序对应的所述原词组的所述临近词组数据组成的字段句式是否满足检索对应的精准咨询句式的语义偏移要求,若满足,则控制输出对应的所述精准咨询句式,若不满足,则控制输出不满足句式要求的所述词序对应的原词组数据和指导词组,重新检索咨询;
以及咨询输出模块,所述咨询输出模块根据输出的所述咨询句式,生成与所述精准咨询句式相应的咨询结果数据。
2.根据权利要求1所述的基于相关性分析的信息技术咨询服务系统,其特征在于,所述字段拆分模块包括:
字段采集模块,所述字段采集模块采集用户对所述信息技术的咨询字段数据;
拆分控制模块,所述拆分控制模块控制对所述咨询字段数据进行对应的词组和/或单字拆分,以获得所述原词组数据;
以及排序处理模块,所述排序处理模块将所述原词组数据按照所述咨询字段数据对应的顺序进行次序的编码排序。
3.根据权利要求1所述的基于相关性分析的信息技术咨询服务系统,其特征在于,所述相关数据查询模块包括:
原词组调取模块,所述原词组调取模块依所述词序调取所述原词组数据信息;
以及机器训练模块,所述机器训练模块根据所述原词组数据在机器训练库中查询出与所述原词组数据语义相近的所述正向临近词组和所反向临近词组,并进行分库临时存储。
4.根据权利要求3所述的基于相关性分析的信息技术咨询服务系统,其特征在于,所述正向临近词组为所述原词组数据进行语义加重后的临近词组数据;所述反向临近词组为所述原词组数据进行语义减弱后的临近词组数据。
5.根据权利要求3所述的基于相关性分析的信息技术咨询服务系统,其特征在于,所述机器训练模块包括:
正向存储库,所述正向存储库存储机器训练出的所述正向临近词组,以及各所述正向临近词组以所述原词组为基准向所述原词组数据的语义加重侧的正向偏移度;
以及反向存储库,所述反向存储库存储机器训练出的所述反向临近词组,以及各所述反向临近词组以所述原词组为基准向所述原词组数据的语义减弱侧的正向偏移度。
6.根据权利要求5所述的基于相关性分析的信息技术咨询服务系统,其特征在于,所述句式判断模块包括:
句式重组模块,所述句式重组模块查询满足预定数量n范围内的各所述正向临近词组和所述反向临近词组,并按词序编码顺序将所述正向临近词组和所述反向临近词组进行组合形成所述临近词组数据组成的临近字段句式;
句式检索模块,所述句式检索模块根据所述临近词组数据组成的所述临近字段句式进行相似度最接近的所述精准咨询句式进行查询;
句式筛选模块,所述句式筛选模块筛选出各所述临近字段句式对所述精准咨询句式相应的整体偏移权重满足预定偏移权重/>的所述临近字段句式;
以及总偏移测算模块,所述总偏移测算模块根据满足预定偏移权重的所述临近字段句式的所述整体偏移权重/>,对基于所述原词组的总偏移权重/>进行测算。
7.根据权利要求6所述的基于相关性分析的信息技术咨询服务系统,其特征在于,所述句式筛选模块包括:
整体偏移权重测算模块,所述整体偏移权重测算模块根据所述正向临近词组对应所述精准咨询句式的正向权重参数和所述反向临近词组对应所述精准咨询句式的反向权重参数/>,对所述整体偏移权重/>进行乘积计算;
以及句式控制模块,所述句式控制模块判断所述整体偏移权重在所述预定偏移权重/>范围内时,对所述总偏移权重/>进行测算,并在所述整体偏移权重/>未在所述预定偏移权重/>范围内时,将不满足句式要求的所述词序对应的原词组数据和指导词组控制输出。
8.根据权利要求7所述的基于相关性分析的信息技术咨询服务系统,其特征在于,所述句式控制模块包括:
句式查询模块,所述句式查询模块在所述整体偏移权重未在所述预定偏移权重/>范围内时,调取出对应的所述精准咨询句式,并按所述原词组的拆分方式拆分成对应的精准词组数据;
以及用户载入模块,所述用户载入模块分配在用户端系统作为所述指导词组。
9.根据权利要求7所述的基于相关性分析的信息技术咨询服务系统,其特征在于,所述句式控制模块还包括:
分偏移度调取模块,所述分偏移度调取模块调取各所述原词组对应的所述正向临近词组或所述反向临近词组的正向偏移度或反向偏移度;
以及总偏移权重测算模块,所述总偏移权重测算模块根据所述原词组对相应的所述正向临近词组或所述反向临近词组的偏移权重参数或/>,以及所述正向临近词组或所述反向临近词组对应的所述正向偏移度或所述反向偏移度,对所述总偏移权重/>进行乘积测算。
10.根据权利要求6所述的基于相关性分析的信息技术咨询服务系统,其特征在于,所述咨询输出模块包括:
句式导出模块,所述句式导出模块导出所述精准咨询句式,以及导出所述精准咨询句式对应的咨询结果数据;
以及偏移度输出模块,所述偏移度输出模块导出所述原词组对所述精准咨询句式对应词组的偏移情况,以及所述咨询字段数据对应的测算出的所述总偏移权重。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310942925.7A CN116662374B (zh) | 2023-07-31 | 2023-07-31 | 基于相关性分析的信息技术咨询服务系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310942925.7A CN116662374B (zh) | 2023-07-31 | 2023-07-31 | 基于相关性分析的信息技术咨询服务系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116662374A true CN116662374A (zh) | 2023-08-29 |
CN116662374B CN116662374B (zh) | 2023-10-20 |
Family
ID=87722777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310942925.7A Active CN116662374B (zh) | 2023-07-31 | 2023-07-31 | 基于相关性分析的信息技术咨询服务系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116662374B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6269368B1 (en) * | 1997-10-17 | 2001-07-31 | Textwise Llc | Information retrieval using dynamic evidence combination |
JP2002230021A (ja) * | 2001-01-30 | 2002-08-16 | Canon Inc | 情報検索装置及び情報検索方法並びに記憶媒体 |
WO2006086179A2 (en) * | 2005-01-31 | 2006-08-17 | Textdigger, Inc. | Method and system for semantic search and retrieval of electronic documents |
CN105138511A (zh) * | 2015-08-10 | 2015-12-09 | 北京思特奇信息技术股份有限公司 | 一种对搜索关键词进行语义分析的方法和系统 |
CN106951558A (zh) * | 2017-03-31 | 2017-07-14 | 广东睿盟计算机科技有限公司 | 一种基于深度搜索的税务智能咨询平台的数据处理方法 |
CN107273350A (zh) * | 2017-05-16 | 2017-10-20 | 广东电网有限责任公司江门供电局 | 一种实现智能问答的信息处理方法及其装置 |
CN107315766A (zh) * | 2017-05-16 | 2017-11-03 | 广东电网有限责任公司江门供电局 | 一种集合智能与人工问答的语音问答方法及其装置 |
CN109726215A (zh) * | 2018-12-29 | 2019-05-07 | 重庆工商大学融智学院 | 面向法律咨询服务的法律知识智能查询系统 |
CN109885660A (zh) * | 2019-02-22 | 2019-06-14 | 上海乐言信息科技有限公司 | 一种知识图谱赋能的基于信息检索的问答系统和方法 |
WO2020244534A1 (zh) * | 2019-06-05 | 2020-12-10 | 京东方科技集团股份有限公司 | 医疗问答方法、医疗问答系统、电子设备和计算机可读存储介质 |
CN113988045A (zh) * | 2021-12-28 | 2022-01-28 | 浙江口碑网络技术有限公司 | 文本相似度确定方法、文本处理方法、相应的装置和设备 |
CN114579709A (zh) * | 2022-03-15 | 2022-06-03 | 西南交通大学 | 一种基于知识图谱的智能问答意图识别方法 |
-
2023
- 2023-07-31 CN CN202310942925.7A patent/CN116662374B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6269368B1 (en) * | 1997-10-17 | 2001-07-31 | Textwise Llc | Information retrieval using dynamic evidence combination |
JP2002230021A (ja) * | 2001-01-30 | 2002-08-16 | Canon Inc | 情報検索装置及び情報検索方法並びに記憶媒体 |
WO2006086179A2 (en) * | 2005-01-31 | 2006-08-17 | Textdigger, Inc. | Method and system for semantic search and retrieval of electronic documents |
CN105138511A (zh) * | 2015-08-10 | 2015-12-09 | 北京思特奇信息技术股份有限公司 | 一种对搜索关键词进行语义分析的方法和系统 |
CN106951558A (zh) * | 2017-03-31 | 2017-07-14 | 广东睿盟计算机科技有限公司 | 一种基于深度搜索的税务智能咨询平台的数据处理方法 |
CN107273350A (zh) * | 2017-05-16 | 2017-10-20 | 广东电网有限责任公司江门供电局 | 一种实现智能问答的信息处理方法及其装置 |
CN107315766A (zh) * | 2017-05-16 | 2017-11-03 | 广东电网有限责任公司江门供电局 | 一种集合智能与人工问答的语音问答方法及其装置 |
CN109726215A (zh) * | 2018-12-29 | 2019-05-07 | 重庆工商大学融智学院 | 面向法律咨询服务的法律知识智能查询系统 |
CN109885660A (zh) * | 2019-02-22 | 2019-06-14 | 上海乐言信息科技有限公司 | 一种知识图谱赋能的基于信息检索的问答系统和方法 |
WO2020244534A1 (zh) * | 2019-06-05 | 2020-12-10 | 京东方科技集团股份有限公司 | 医疗问答方法、医疗问答系统、电子设备和计算机可读存储介质 |
CN113988045A (zh) * | 2021-12-28 | 2022-01-28 | 浙江口碑网络技术有限公司 | 文本相似度确定方法、文本处理方法、相应的装置和设备 |
CN114579709A (zh) * | 2022-03-15 | 2022-06-03 | 西南交通大学 | 一种基于知识图谱的智能问答意图识别方法 |
Non-Patent Citations (1)
Title |
---|
郑廷;郑诚;: "基于Lucene的语义检索系统", 计算机工程, no. 16 * |
Also Published As
Publication number | Publication date |
---|---|
CN116662374B (zh) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100295354B1 (ko) | 문서 정보 검색 시스템 | |
CN100424695C (zh) | 搜索文档的文档处理装置及其控制方法 | |
CN108573045A (zh) | 一种基于多阶指纹的比对矩阵相似度检索方法 | |
CN111324750B (zh) | 一种大规模文本相似度计算及文本查重方法 | |
WO2010119233A1 (en) | A data retrieval and indexing method and apparatus | |
CN103593410A (zh) | 通过替换概念性词语进行搜索推荐系统 | |
KR20090065130A (ko) | 시그니처 파일을 이용한 고차원 데이터 색인 및 검색방법과 그 시스템 | |
KR102371437B1 (ko) | 엔티티를 추천하는 방법과 장치, 전자기기 및 컴퓨터 판독가능 매체 | |
EP2631815A1 (en) | Method and device for ordering search results, method and device for providing information | |
MX2012011923A (es) | Asignacion de atributis aplicables para datos que describen la identidad personal. | |
CN112307182A (zh) | 一种基于问答系统的伪相关反馈的扩展查询方法 | |
Tavenard et al. | Improving the efficiency of traditional DTW accelerators | |
CN115329048A (zh) | 一种语句检索的方法及装置、电子设备、存储介质 | |
CN116662374B (zh) | 基于相关性分析的信息技术咨询服务系统 | |
CN113157869A (zh) | 一种文档精准定位检索方法及系统 | |
Dannélls et al. | Evaluation and refinement of an enhanced OCR process for mass digitisation. | |
CN115982316A (zh) | 一种基于多模态的文本检索方法、系统及介质 | |
KR100501079B1 (ko) | 네트워크 기반의 유사어 검색기술 응용시스템 및 방법 | |
CN112396539A (zh) | 一种基于人工智能的行政执法自适应辅助系统实现方法 | |
Sloan et al. | Data preparation and fuzzy matching techniques for improved statistical modeling | |
CN115203206A (zh) | 数据内容搜索方法、装置、计算机设备及可读存储介质 | |
JP4813312B2 (ja) | 電子文書検索方法、電子文書検索装置及びプログラム | |
CN113722452A (zh) | 一种问答系统中基于语义的快速知识命中方法及装置 | |
CN117112736B (zh) | 一种基于语义分析模型的信息检索分析方法及系统 | |
JPH06274546A (ja) | 情報量一致度計算方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |