CN104182489A - 一种文本大数据的查询处理方法 - Google Patents

一种文本大数据的查询处理方法 Download PDF

Info

Publication number
CN104182489A
CN104182489A CN201410391873.XA CN201410391873A CN104182489A CN 104182489 A CN104182489 A CN 104182489A CN 201410391873 A CN201410391873 A CN 201410391873A CN 104182489 A CN104182489 A CN 104182489A
Authority
CN
China
Prior art keywords
semantic
model
inquiry
query
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410391873.XA
Other languages
English (en)
Other versions
CN104182489B (zh
Inventor
黄震华
李美子
方强
张佳雯
向阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN201410391873.XA priority Critical patent/CN104182489B/zh
Publication of CN104182489A publication Critical patent/CN104182489A/zh
Application granted granted Critical
Publication of CN104182489B publication Critical patent/CN104182489B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24522Translation of natural language queries to structured queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • G06F16/212Schema design and management with details for data modelling support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/219Managing data history or versioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24528Standardisation; Simplification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • G06F16/24537Query rewriting; Transformation of operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种文本大数据的查询处理方法,包括以下步骤:1)规范文本大数据语义,构造文本大数据查询分析过程中的查询对象语义范式模型以及精确描述语义,2)建立指令解析与查询工作流模型,构建查询指令语义模型,精炼语义,并且选择和重构查询工作流,3)查询过程控制和反馈结果,筛选查询方法模型,评估和计算查询置信度,并且返回置信度最高的工作流。与现有技术相比,本发明具有方便快速、准确可靠等优点。

Description

一种文本大数据的查询处理方法
技术领域
本发明计算机应用技术领域,尤其是涉及一种文本大数据的查询处理方法。
背景技术
近些年,文本大数据上的查询处理已成为学术界和工业界的一个研究热点和重点。
Ciaccio AD等人指出传统的查询处理方法通常不适合管理和分析文本大数据,并提出3个改进方法TNL、CDCA和SFMAE来有效查询分析文本大数据。SysoevO等人基于steiner树理论,提出有效的近似最优算法来处理文本大数据上的多元单调回归问题。Laurila JK等人针对移动无线通讯网络中累积的文本大数据,设计了LDCC算法来有效分析用户的各通讯指标。Oliner A等人对网络的日志大数据进行一致性编码来有效优化用户的访问性能。Bennett J等人基于map-reduce计算模型,设计了UEQOT方法来提高文本大数据的查询处理效率。而Pébay P等人对文本大数据上的并行查询处理技术做了详细的综述。
在文本大数据的挖掘方面,大都研究工作通过扩展现有的方法来处理文本大数据。例如Zhou J等人、Chen L等人和JaBezdek JC等人分别对层次聚类、K-Mean聚类和Fuzzy C-Mean聚类进行了扩展。这类扩展算法基本上通过对文本大数据进行局部采样,并利用现有的算法(例如CLARA、CLARANS和BIRCH等)来完成数据挖掘过程,因此局部采样的机制在很大程度上影响全局数据挖掘的效果。另一方面,近些年,许多研究工作考虑分布式和并行实施文本大数据的数据挖掘。Chu C等人在多核处理器上基于简单的map-reduce编程模型实现了文本大数据的10类数据挖掘算法,包括局部加权线性回归、K-means聚类、逻辑回归、朴素贝叶斯、线性支持向量机、自变量分析、高斯判别式分析、期望最大化估计以及BP神经网络。Ranger C等人同样基于多核处理机系统,使用map-reduce编程模型实现了3类数据挖掘算法,包括K-means聚类、主成分分析依据线性回归。Gillick D等人基于Hadoop平台对大数据的各类数据挖掘算法进行了性能测试,并得出了map-reduce编程模型是目前最为适合的一种计算框架。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种便捷、准确的文本大数据的查询处理方法。
本发明的目的可以通过以下技术方案来实现:
一种文本大数据的查询处理方法,包括以下步骤:
1)规范文本大数据语义,该步骤包括:
11)构造文本大数据查询分析过程中所涉及的查询对象语义范式模型,通过不同级别范式的语义描述规范刻画各对象的语义描述程度;
12);对不同的查询对象设计不同级别范式相互转化准则得到更为精确的语义描述;
2)建立指令解析与查询工作流模型,该步骤包括:
21)查询指令语义预解析,对查询指令初步解析,使其具备计算机可理解的基础形式;
22)构建查询指令语义模型;
23)指令语义精炼,使指令语义模型符合高级别的描述规范;
24)选择和重构查询工作流,通过底层数据库选取与对象模型相对应的模板实例;
25)查询工作流可靠性验证,利用大规模案例推理学习方法对所确定的结果进行验证;
3)查询过程控制和反馈结果,该步骤包括:
31)通过筛选查询方法模型,并且结合查询成功的历史查询方法模型选取符合工作流各环节需求的查询方法模型;
32)构造和组合各环节候选查询方法模型来实现指令进行正确查询的策略和规则;
33)评估查询置信度,建立“方法-指令”置信体系,通过查询历史,对每一个查询方法模型,评估它对不同类型指令的置信度;
34)构建查询工作链,根据查询工作流构建由使用过的查询方法模型构成的查询工作链;
35)计算查询工作链上的每一个工作流阶段的结果置信度;
36)全链全局置信度计算,并且进行全工作链的置信度全局排序评估,将置信度最高的结果反馈给用户。
所述的步骤1)中的语义范式模型包括文本内容语义范式模型CSNF、查询指令语义范式模型ISNF、查询方法语义范式模型MSNF和查询工作流语义范式模型FSNF。
所述的文本内容语义范式模型的转化准则包括1CSNF、2CSNF和3CSNF,分别判断可判定性、完备性和可计算性。
所述的指令语义范式模型的转换准则包括1ISNF、2ISNF和3ISNF,分别表达可查询性、非矛盾性和最优闭合性。
所述的查询方法语义范式模型的转换准则包括1MSNF、2MSNF和3MSNF,分别对应其可用性、适配性和可验证性。
所述的查询工作流语义范式模型的转换准则包括1FSNF、2FSNF和3FSNF,分别对应标准性、可柔性和完备性。
所述的步骤23)中的精炼方法包括以下步骤:
231)建立符合1ISNF的语义模型,并对该指令所具备的具体实体信息,包括条件、变量和目标进行具体赋值;
232)基于2ISNF语义级别模型的要求,对不可被理解描述为语义的部分进行语义迭代计算;
233)基于3ISNF语义级别模型,对问题中所含有的冗余部分、无效条件、重叠目标、矛盾条件干扰因素进行消除。
与现有技术相比,本发明具有以下优点。
一、方便快速,本发明设计了新的查询指令的语义模型,建立了查询模型规范,能够快速的找到最有效的查询方式获得结果。
二、准确可靠,本方法通过精炼语义,规范了语义模型,消除了查询过程中出现的冗余、无效等问题,提高了查询过程的准确性。
附图说明
图1为本发明的方法流程图
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
实施例:
如图1所示,一种文本大数据的查询处理方法,包括以下步骤:
1)规范文本大数据语义,该步骤包括:
11)构造文本大数据查询分析过程中所涉及的查询对象语义范式模型,通过不同级别范式的语义描述规范刻画各对象的语义描述程度;
12);对不同的查询对象设计不同级别范式相互转化准则得到更为精确的语义描述;
2)建立指令解析与查询工作流模型,该步骤包括:
21)查询指令语义预解析,对查询指令初步解析,使其具备计算机可理解的基础形式;
22)构建查询指令语义模型;
23)指令语义精炼,使指令语义模型符合高级别的描述规范;
24)选择和重构查询工作流,通过底层数据库选取与对象模型相对应的模板实例;
25)查询工作流可靠性验证,利用大规模案例推理学习方法对所确定的结果进行验证。
3)查询过程控制和反馈结果,该步骤包括:
31)通过筛选查询方法模型,并且结合查询成功的历史查询方法模型选取符合工作流各环节需求的查询方法模型;
32)构造和组合各环节候选查询方法模型来实现指令进行正确查询的策略和规则。
33)评估查询置信度,建立“方法-指令”置信体系,通过查询历史,对每一个查询方法模型,评估它对不同类型指令的置信度;
34)构建查询工作链,根据查询工作流构建由使用过的查询方法模型构成的查询工作链,
35)计算查询工作链上的每一个工作流阶段的结果置信度;
36)全链全局置信度计算,并且进行全工作链的置信度全局排序评估,将置信度最高的结果反馈给用户。
查询过程控制与结果反馈模块的具体实施方式如下:本发明文本大数据查询分析过程中所涉及的四类对象为文本内容、查询指令、查询方法和查询工作流程。这四类对象的语义范式模型的实施方式为:1)文本内容语义范式模型(CSNF):即文本大数据中所识别、抽取的用于进行指令查询的内容实体,所具备不同级别的语义描述规范及其转化准则,通过1CSNF、2CSNF和3CSNF分别满足其可判定性、完备性和可计算性;2)指令语义范式模型(ISNF):即系统所需要理解的用户指令应具备的不同级别语义描述规范及转换准则,包括1ISNF、2ISNF和3ISNF分别表达其可查询性、非矛盾性和最优闭合性;3)查询方法语义范式(MSNF):即指令查询方法所对应计算模型应具备的不同级别语义描述规范及转换准则,包括1MSNF、2MSNF和3MSNF,分别对应其可用性、适配性和可验证性;4)查询工作流语义范式(FSNF):即用于指令查询的工作流具备的不同级别语义描述规范及转换准则,包括1FSNF、2FSNF和3FSNF,分别对应标准性、可柔性和完备性。同时,在上述四个语义范式模型及其转化规则基础上,本发明整合描述逻辑、时态逻辑、进程代数的形式化验证技术,对语义范式模型及转化过程进行正确性和完备性验证。
指令解析与查询工作流建模模块的具体实施方式如下:针对查询指令的语义理解,本发明首先对用户指令进行文本预处理,进行初步问题内容解析,并建立符合1ISNF的语义模型,并对该指令所具备的具体实体信息,包括条件、变量和目标进行具体赋值,其次,基于2ISNF语义级别模型的要求,对不可被理解描述为语义的部分进行语义迭代计算,继而,基于3ISNF语义级别模型,本发明对问题中所含有的冗余部分、无效条件、重叠目标、矛盾条件等干扰因素进行消除,使其复杂程度降低,有利于计算机清晰读懂指令真实的查询目标,在对指令语义的准确理解之后,本发明确定其查询的工作流程,使其准确符合指令所具有的输入、目标、约束等,成为一个可执行的工作流,本发明首先基于ISNF范式模型的指令语义,从该指令类别出发利用ISNF到FSNF的语义关联和依赖,选择对应的候选工作流实例集合;其次,本发明从候选工作流中选择符合该指令语义所包含信息的工作流实例,构建其符合3FSNF的语义级别;进一步,本发明利用FSNF的流程重构语义,对所选择的工作流进行重构,完成工作流中不同工作环节、时序的柔性调整;最后本发明通过过往工作流的查询案例知识,对工作流环节中出现的各种潜在风险和威胁进行识别,验证该工作流的可靠性。
查询过程控制与结果反馈模块的具体实施方式如下:本发明首先在FSNF工作流模型基础上,对工作流中所涉及的具体查询方法模型进行评估和选择,并在此基础上利用本体库中的关联模型及其查询案例对查询方法模型的选择结果进行验证;其次,本发明利用MSNF对查询方法模型进行语义约束,消除工作流中可能导致的资源依赖、时序依赖、竞争条件、死锁等问题,确保查询工作流程的正确性;进而,本发明通过四类语义范式模型(CSNF、ISNF、MSNF和FSNF)对可使用资源的实时状态、查询方法模型的使用状态、查询工作流的进度情况等信息进行实时状态检测,记录查询的中间过程变量和临时状态,对各种情况下所发生的资源调度、工作流重构、查询方法重选或查询应急重启等情况进行控制,以确保查询过程的顺利执行,为了提高结果反馈的准确度,本发明不选取唯一的查询工作流与查询方法模型,即一个用户指令可对应多个可行的工作流进行查询,并在每个工作流环节选用多个可能的候选查询方法模型,因此,所取得的答案并不唯一,针对这个问题,本发明采用基于结果置信度排序的策略进行实施,选择最可靠的结果来进行反馈。为此,本发明首先针对指令所有可行的查询工作流和查询方法模型,记录其对特定类型、条件、目标指令的历史使用次数、查询次数、被选中率、成功率、准确率、评价值等多维度指标体系;继而,本发明从时效性、效用性、匹配性等不同角度,综合计算不同的工作流、查询方法模型的置信度值,来刻画它们的认同度、可靠度,同时利用其在过往历史中的使用概率,来预测它们的置信概率。在此基础上,本发明针对不同工作流以及工作流各环节所候选的查询方法模型,形成所有可能的查询工作链,使得每一条工作链都指向其代表的指令结果;进而,针对查询工作链的各环节进行逐一置信度计算,从而形成全工作链的全局置信度,代表该工作链所反馈结果的可靠程度;最后,本发明利用全工作链置信度对不同的结果进行排序,并将置信度最高的查询结果反馈给用户。

Claims (7)

1.一种文本大数据的查询处理方法,其特征在于,包括以下步骤:
1)规范文本大数据语义,该步骤包括:
11)构造文本大数据查询分析过程中所涉及的查询对象语义范式模型,通过不同级别范式的语义描述规范刻画各对象的语义描述程度;
12)对不同的查询对象设计不同级别范式相互转化准则得到更为精确的语义描述;
2)建立指令解析与查询工作流模型,该步骤包括:
21)查询指令语义预解析,对查询指令初步解析,使其具备计算机可理解的基础形式;
22)构建查询指令语义模型;
23)指令语义精炼,使指令语义模型符合高级别的描述规范;
24)选择和重构查询工作流,通过底层数据库选取与对象模型相对应的模板实例;
25)查询工作流可靠性验证,利用大规模案例推理学习方法对所确定的结果进行验证;
3)查询过程控制和反馈结果,该步骤包括:
31)通过筛选查询方法模型,并且结合查询成功的历史查询方法模型选取符合工作流各环节需求的查询方法模型;
32)构造和组合各环节候选查询方法模型来实现指令进行正确查询的策略和规则;
33)评估查询置信度,建立“方法-指令”置信体系,通过查询历史,对每一个查询方法模型,评估它对不同类型指令的置信度;
34)构建查询工作链,根据查询工作流构建由使用过的查询方法模型构成的查询工作链;
35)计算查询工作链上的每一个工作流阶段的结果置信度;
36)全链全局置信度计算,并且进行全工作链的置信度全局排序评估,将置信度最高的结果反馈给用户。
2.根据权利要求1所述的一种文本大数据的查询处理方法,其特征在于,所述的步骤1)中的语义范式模型包括文本内容语义范式模型CSNF、查询指令语义范式模型ISNF、查询方法语义范式模型MSNF和查询工作流语义范式模型FSNF。
3.根据权利要求2所述的一种文本大数据的查询处理方法,其特征在于,所述的文本内容语义范式模型的转化准则包括1CSNF、2CSNF和3CSNF,分别判断可判定性、完备性和可计算性。
4.根据权利要求2所述的一种文本大数据的查询处理方法,其特征在于,所述的指令语义范式模型的转换准则包括1ISNF、2ISNF和3ISNF,分别表达可查询性、非矛盾性和最优闭合性。
5.根据权利要求2所述的一种文本大数据的查询处理方法,其特征在于,所述的查询方法语义范式模型的转换准则包括1MSNF、2MSNF和3MSNF,分别对应其可用性、适配性和可验证性。
6.根据权利要求2所述的一种文本大数据的查询处理方法,其特征在于,所述的查询工作流语义范式模型的转换准则包括1FSNF、2FSNF和3FSNF,分别对应标准性、可柔性和完备性。
7.根据权利要求1或4所述的一种文本大数据的查询处理方法,其特征在于,所述的步骤23)中的精炼方法包括以下步骤:
231)建立符合1ISNF的语义模型,并对该指令所具备的具体实体信息,包括条件、变量和目标进行具体赋值;
232)基于2ISNF语义级别模型的要求,对不可被理解描述为语义的部分进行语义迭代计算;
233)基于3ISNF语义级别模型,对问题中所含有的冗余部分、无效条件、重叠目标、矛盾条件干扰因素进行消除。
CN201410391873.XA 2014-08-11 2014-08-11 一种文本大数据的查询处理方法 Expired - Fee Related CN104182489B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410391873.XA CN104182489B (zh) 2014-08-11 2014-08-11 一种文本大数据的查询处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410391873.XA CN104182489B (zh) 2014-08-11 2014-08-11 一种文本大数据的查询处理方法

Publications (2)

Publication Number Publication Date
CN104182489A true CN104182489A (zh) 2014-12-03
CN104182489B CN104182489B (zh) 2018-04-27

Family

ID=51963529

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410391873.XA Expired - Fee Related CN104182489B (zh) 2014-08-11 2014-08-11 一种文本大数据的查询处理方法

Country Status (1)

Country Link
CN (1) CN104182489B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107590125A (zh) * 2017-09-07 2018-01-16 国网山东省电力公司 一种基于随机算法的大数据文本实时交互方法和装置
CN109992669A (zh) * 2019-04-08 2019-07-09 浙江大学 一种基于语言模型和强化学习的关键词问答方法
CN110046262A (zh) * 2019-06-10 2019-07-23 南京擎盾信息科技有限公司 一种基于法律专家知识库的上下文推理方法
CN111625680A (zh) * 2020-05-15 2020-09-04 青岛聚看云科技有限公司 确定搜索结果的方法及装置
CN111897932A (zh) * 2020-07-21 2020-11-06 深圳市维度统计咨询股份有限公司 一种文本大数据的查询处理方法及系统
CN113919877A (zh) * 2021-10-15 2022-01-11 深圳市酷开网络科技股份有限公司 基于dmp平台圈人任务进度处理方法、装置及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005276125A (ja) * 2004-03-26 2005-10-06 Toshiba Corp データ分析プログラムおよびおよびデータ分析方法
US20080071748A1 (en) * 2006-09-18 2008-03-20 Infobright Inc. Method and system for storing, organizing and processing data in a relational database
CN103491187A (zh) * 2013-09-30 2014-01-01 华南理工大学 一种基于云计算的大数据统一分析处理方法
CN103838788A (zh) * 2012-11-27 2014-06-04 大连灵动科技发展有限公司 一种基于fMRI脑激活数据仓库的数据分析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005276125A (ja) * 2004-03-26 2005-10-06 Toshiba Corp データ分析プログラムおよびおよびデータ分析方法
US20080071748A1 (en) * 2006-09-18 2008-03-20 Infobright Inc. Method and system for storing, organizing and processing data in a relational database
CN103838788A (zh) * 2012-11-27 2014-06-04 大连灵动科技发展有限公司 一种基于fMRI脑激活数据仓库的数据分析方法
CN103491187A (zh) * 2013-09-30 2014-01-01 华南理工大学 一种基于云计算的大数据统一分析处理方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107590125A (zh) * 2017-09-07 2018-01-16 国网山东省电力公司 一种基于随机算法的大数据文本实时交互方法和装置
CN107590125B (zh) * 2017-09-07 2019-12-03 国网山东省电力公司 一种基于随机算法的大数据文本实时交互方法和装置
CN109992669A (zh) * 2019-04-08 2019-07-09 浙江大学 一种基于语言模型和强化学习的关键词问答方法
CN110046262A (zh) * 2019-06-10 2019-07-23 南京擎盾信息科技有限公司 一种基于法律专家知识库的上下文推理方法
CN110046262B (zh) * 2019-06-10 2021-03-12 南京擎盾信息科技有限公司 一种基于法律专家知识库的上下文推理方法
CN111625680A (zh) * 2020-05-15 2020-09-04 青岛聚看云科技有限公司 确定搜索结果的方法及装置
CN111625680B (zh) * 2020-05-15 2023-08-25 青岛聚看云科技有限公司 确定搜索结果的方法及装置
CN111897932A (zh) * 2020-07-21 2020-11-06 深圳市维度统计咨询股份有限公司 一种文本大数据的查询处理方法及系统
CN113919877A (zh) * 2021-10-15 2022-01-11 深圳市酷开网络科技股份有限公司 基于dmp平台圈人任务进度处理方法、装置及可读存储介质

Also Published As

Publication number Publication date
CN104182489B (zh) 2018-04-27

Similar Documents

Publication Publication Date Title
Neelakandan et al. RETRACTED ARTICLE: An automated exploring and learning model for data prediction using balanced CA-SVM
Verenich et al. Survey and cross-benchmark comparison of remaining time prediction methods in business process monitoring
CN111149117B (zh) 机器学习和深度学习模型的基于梯度的自动调整
US20220076150A1 (en) Method, apparatus and system for estimating causality among observed variables
US9646262B2 (en) Data intelligence using machine learning
US7593927B2 (en) Unstructured data in a mining model language
AU2020385264B2 (en) Fusing multimodal data using recurrent neural networks
CN104182489A (zh) 一种文本大数据的查询处理方法
CN109062763A (zh) 一种从svn日志事件流中动态实时挖掘软件过程活动的方法
KR101732319B1 (ko) 목표 지향적 빅데이터 비즈니스 분석 프레임워크
Nguyen et al. Using meta-mining to support data mining workflow planning and optimization
Luan et al. Out-of-distribution detection for deep neural networks with isolation forest and local outlier factor
Kedziora et al. Autonoml: Towards an integrated framework for autonomous machine learning
US11620453B2 (en) System and method for artificial intelligence driven document analysis, including searching, indexing, comparing or associating datasets based on learned representations
Raju et al. An approach for demand forecasting in steel industries using ensemble learning
Qian et al. Short-term wind speed prediction with a two-layer attention-based LSTM
Shih et al. Efficient computer experiment-based optimization through variable selection
Zou et al. Deep non-crossing probabilistic wind speed forecasting with multi-scale features
WO2019104304A1 (en) Accelerated simulation setup process using prior knowledge extraction for problem matching
Kalifullah et al. Retracted: Graph‐based content matching for web of things through heuristic boost algorithm
Li et al. Automatic identification of assumptions from the hibernate developer mailing list
Majeed et al. Data-centric artificial intelligence, preprocessing, and the quest for transformative artificial intelligence systems development
Zhang et al. SageFormer: Series-Aware Framework for Long-Term Multivariate Time Series Forecasting
US20220300821A1 (en) Hybrid model and architecture search for automated machine learning systems
Binu et al. A Cloud-Based Data Analysis and Prediction System for University Admission

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180427

Termination date: 20200811

CF01 Termination of patent right due to non-payment of annual fee