CN112131246A - 基于自然语言语义解析的数据中心智能查询统计方法 - Google Patents

基于自然语言语义解析的数据中心智能查询统计方法 Download PDF

Info

Publication number
CN112131246A
CN112131246A CN202011038101.XA CN202011038101A CN112131246A CN 112131246 A CN112131246 A CN 112131246A CN 202011038101 A CN202011038101 A CN 202011038101A CN 112131246 A CN112131246 A CN 112131246A
Authority
CN
China
Prior art keywords
data center
data
natural language
data information
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011038101.XA
Other languages
English (en)
Other versions
CN112131246B (zh
Inventor
范馨月
沈齐
何清龙
李建森
廖斌
杜逆索
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202011038101.XA priority Critical patent/CN112131246B/zh
Publication of CN112131246A publication Critical patent/CN112131246A/zh
Application granted granted Critical
Publication of CN112131246B publication Critical patent/CN112131246B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于自然语言语义解析的数据中心智能查询统计方法。在查询任务中,解析具体语义关键词,对关键词中的复合词进行分词,分词后对分词的同义词分析重组,将分析重组的结果与转义字典进行匹配;匹配成功,则分析并建立网络及重新定义权重信息,结合数据信息的数据中心权限、数据质量、使用频次信息,构建推荐算法将任务所用到的数据库中的表、字段等拼接成SQL进行查询、统计。本发明具有实用性强、使用简单方便、查询结果具有行业针对性,且查询结果与用户需求契合度高的特点。

Description

基于自然语言语义解析的数据中心智能查询统计方法
技术领域
本发明涉及数据查询统计技术领域,特别是基于自然语言语义解析的数据中心智能查询统计方法。
背景技术
随着人工智能技术的不断发展,自然语言语义解析与交互技术越来越受到重视。目前对话系统针对某个行业有自身的语料库,并不能对数据进行智能管理和统计计算或者模板相对固定,对大型的数据中心,要完成某项查询、统计任务,需要用到哪个数据库中的哪些表、哪个字段能够完成,要求技术人员必须对业务有一定程度的理解及对数据中心表结构熟悉才能够完成。当前对应用行业的数据中心基于中文自然语言数据智能应用成为迫切需求,也是人工智能时代发展的一大趋势。
发明内容
本发明的目的在于,提供一种基于自然语言语义解析的数据中心智能查询统计方法。本发明具有实用性强、使用简单方便、查询结果具有行业针对性,且查询结果与用户需求契合度高的特点。
本发明的技术方案:一种基于自然语言语义解析的数据中心智能查询统计方法,在查询任务中,解析具体语义关键词,对关键词中的复合词进行分词,分词后对分词的同义词分析重组,将分析重组的结果与转义字典进行匹配;匹配成功,则分析并建立网络及重新定义权重信息,结合数据信息的数据中心权限、数据质量、使用频次信息,构建推荐算法将任务所用到的数据中心中的表、字段等拼接成SQL进行查询、统计。
具体地,前述的基于自然语言语义解析的数据中心智能查询统计方法,包括下述步骤:
a.接收规范化处理的数据信息;
b.接收基于用户自然语言,进行语义解析后生成的用户需求关键词或实体;
c.针对行业词汇的转义解释,构建转义词典;
d.在步骤a的数据信息中匹配步骤b的用户需求关键词或实体、用户需求关键词或实体的同义词,和/或关键词的转义后的同义词;对匹配到的相应词汇及对应的字段信息进行保存记录、建立索引;
e.生成由表和关键词为节点、有序对为边构成的有向图;
f.基于有向图构建权重矩阵,以优化PageRank算法评估表及字段并推荐给用户,之后根据数据库类型生成与所述的相应词汇对应关系的SQL。
前述的基于自然语言语义解析的数据中心智能查询统计方法所述的步骤a中,所述的数据信息,是由数据中心所有的数据库、表、字段、中文数据字典、数据质量情况、字段使用频次等信息构成的一张或多张数据信息表。
前述的基于自然语言语义解析的数据中心智能查询统计方法所述的步骤c中,转义词典的构建如下:
c1.将行业词汇进行分词,标记词性;根据所述的词性到转义词典中进行匹配,匹配到后将原转义词典中对应的词汇替换为转义词;
c2.采用词义相似度Sim计算相似度高于90%的词,进行同义词识别,将识别到的同义词添加到转义词典中。
前述的基于自然语言语义解析的数据中心智能查询统计方法所述的步骤c1中,匹配失败时,返回失败原因,由人工添加解释进转义词典。
前述的基于自然语言语义解析的数据中心智能查询统计方法所述的步骤c2中,同义词识别的方法具体为:通过词义相似度Sim计算,识别到相似度值Sim>90%的词汇,之后依据语义拼接构造同义词向量,并记录该词向量的相似度值。
前述的基于自然语言语义解析的数据中心智能查询统计方法所述的步骤d中,若匹配失败,则返回信息给用户以便添加解释进转义词典。
前述的基于自然语言语义解析的数据中心智能查询统计方法所述的步骤e中,有向图的生成具体如下:
记有向图作D=<V,E>;其中,
顶点集V={Ki,Tl},Ki为第i个用户需求关键词或实体,i=1,…,n;Tl表示l张数据信息表,l=1,…,m;
边集定义为E={<Ki,Ti,r>,<Tl,Ki>|i=1,2,3,…,n,l=1,…,m,r为第i个用户需求关键词或实体关联的数据信息表};
当一个用户需求关键词或实体对应同一张数据信息表的几个字段时,取相似度最大的字段,Σr=m。
前述的基于自然语言语义解析的数据中心智能查询统计方法所述的步骤f具体如下:
记第i个用户需求关键词或实体对应的第j张数据信息表的权限为Kij p,其中i=1,2,3,…,n,j=n+1,n+2,…,n+m;
Figure BDA0002705737600000031
Kij f为该字段的使用频次,使用频次越多的字段应优先推荐;
Kij q为该字段的数据质量,量化为百分比数字;
Kij Sim为匹配到的词相似度,其中i=1,2,3,…,n,j=1,2,…,m;其中,i表示第i个用户需求关键词或实体,j表示匹配到的字段在第j张数据信息表中,n是关键词的个数,m是数据信息表中匹配的表的数量;
定义权值
Figure BDA0002705737600000032
这里
Figure BDA0002705737600000033
构造初始权重矩阵
Figure BDA0002705737600000034
计算有向图D=<V,E>的邻接矩阵A,按行归一化后记为A’,最终的权重矩阵
M=Q·(A')T (2)
数据中心中,数据信息表的重要程度由IPR值决定,IPRk+1表示第k次迭代后的IPR值
Figure BDA0002705737600000041
I(Tl)为与Tl相关联的关键词的集合,△+(Kj)为与Tl相关联的关键词Kj的出度,初值
Figure BDA0002705737600000042
一般地β=0.85;
Figure BDA0002705737600000043
迭代后稳定值IPR*(Tl)即为每张数据信息表的评价值;
对Tl的IPR*(Tl)值进行排序,其中l=1,2,…,m,若最大值的表Tj均有<Ki,Tj>,i=1,…,m,则统计、查询任务可以在Tj这张数据信息表内完成,生成与关键词对应关系的SQL。
前述的基于自然语言语义解析的数据中心智能查询统计方法中,若一张数据信息表不能完成查询、统计分析任务,依次选择IPR*值完成SQL拼接。
有益效果:与现有技术相比,本发明具有如下优点:
1.本发明对不同行业的领域增加了自学习的转义词典,能够对不同行业的专业词汇进行学习,使得查询结果更具行业针对性,实用性更强。
2.本发明在相似度的处理方式上对复合关键词做了词义(语义)拼接,通过该方法更够有效提高查询的精度,极大降低了查询结果噪音。
3.使用本发明对大型数据中心进行查询统计时,用户无需知道数据中心中表结构,只需要提供数据字典便可自动执行本发明分析查询、统计任务,并且本发明还能够对不同数据库生产结构化语言查询,因此其使用简单方便。
4.本发明基于词义相似度、数据中心权限、数据质量、精确到字段的使用频次,构建了适用于数据中心的智能推荐算法,对行业词汇的语义进行了转义词库的自学习,避免了因同一词汇在不同行业的不同意义而使得查询结果呈现出不具行业针对性的情况,通过该推荐算法重新定义网络节点及其权重信息后,提高了查询结果与用户查询需求的契合度。
附图说明
图1是本发明流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步的说明,但并不作为对本发明限制的依据。
实施例1。一种基于自然语言语义解析的数据中心智能查询统计方法,在查询任务中,解析具体语义关键词,对关键词中的复合词进行分词,分词后对分词的同义词分析重组,将分析重组的结果与转义字典进行匹配;匹配成功,则分析并建立网络及重新定义权重信息,结合数据信息的数据中心权限、数据质量、使用频次等信息,构建推荐算法将任务所用到的数据中心中的表、字段等拼接成SQL(可以转化为不同的数据库语句)进行查询、统计。
具体地,所述的查询方法,流程参见图1,图1中Ci,(i=1,2,3,...)代表本发明实施流程的第i个步骤,即下述第a,b,…个步骤;A、B为外部流程编号,N表示不需要接收参数,2s表示最长允许等待时间。
具体地,所述的查询方法包括下述步骤:
a.接收规范化处理的数据信息;规范化处理的数据信息可为Json格式文件;
b.接收基于用户自然语言,进行语义解析后生成的用户需求关键词或实体;用户需求关键词或实体可标记为K1,K2,…,Kn
c.针对行业词汇的转义解释,构建带有自学习功能的转义词典;比如“轨迹”转义为“车牌”,因为要完成对车辆行驶轨迹的统计,计算机无法像人一样完成转义的工作,要统计轨迹,数据中心并没有此相似的字段,转而需要在有车牌信息的过车表中完成分析任务,让计算机有自动学习的能力;转义词典的建立,需要多次运行本发明分析任务;
d.在步骤a的数据信息中匹配步骤b的用户需求关键词或实体、用户需求关键词或实体的同义词,和/或关键词的转义后的同义词;对匹配到的相应词汇(即用户需求关键词或实体、用户需求关键词或实体的同义词,和/或关键词的转义后的同义词)及对应的字段信息进行保存记录、建立索引;将匹配到的词相似度记为Ki,j Sim(i=1,2,3,…,n,j=1,2,…,m)这里i表示第几个关键词/实体,j表示匹配到的字段在第几张表中,n是关键词的个数,m是数据信息表中匹配的表的数量。
e.生成由表和关键词为节点、有序对为边构成的有向图;
f.基于有向图构建权重矩阵,以优化PageRank算法评估表及字段并推荐给用户,之后根据数据库类型生成与所述的相应词汇对应关系的SQL。
具体地,前述的步骤a中,所述的数据信息,是由数据中心所有的数据库、表、字段、中文数据字典、数据质量情况(量化为百分比)、字段使用频次等信息构成的一张或多张数据信息表。
具体地,前述的步骤c中,转义词典的基本词库可基于维基百科的词库;转义词典的构建如下:
c1.将行业词汇进行分词,标记词性;根据所述的词性到转义词典中进行匹配,匹配到后将原转义词典中对应的词汇替换为转义词;所述的词性包括名词、动词、处所词等;标记词性可采用现有的Python包,比如jieba\hanlp等;
c2.采用词义相似度Sim计算相似度高于90%的词,进行同义词识别,将识别到的同义词添加到转义词典中,所用的词库可基于哈工大词林扩展版。通过方法,能够避免实体中的形容词、副词等影响后续的推荐算法,比如实体“上传时间”,“时间/n”可以是日期,相似度计算可以找到和时间相似(Sim(x,y)>90%)的词语“日期”,那么将“上传”和“日期”进行重组为“上传日期”实现语义拼接,构造相似词向量并记录词向量的相似度值。
前述的步骤c1中,匹配失败时,返回失败原因,由人工添加解释进转义词典。
步骤c2中,同义词识别的方法具体为:通过词义相似度Sim计算,识别到相似度值Sim>90%的词汇,之后依据语义拼接构造同义词向量,并记录该词向量的相似度值。
具体地,前述的步骤d中,若匹配失败,则返回信息给用户以便添加解释进转义词典。
具体地,前述的步骤e中,有向图的生成具体如下:
记有向图作D=<V,E>;其中,
顶点集V={Ki,Tl},Ki为第i个用户需求关键词或实体,i=1,…,n;Tl表示l张数据信息表,l=1,…,m;
边集定义为E={<Ki,Ti,r>,<Tl,Ki>|i=1,2,3,…,n,l=1,…,m,r为第i个用户需求关键词或实体关联的数据信息表};
当一个用户需求关键词或实体对应同一张数据信息表的几个字段时,取相似度最大的字段,Σr=m。
具体地,前述的步骤f具体如下:
大型的数据中心各部门之间数据不一定都会开放权限,因此对于没有权限的用户不能对某些数据进行操作;
记第i个用户需求关键词或实体对应的第j张数据信息表的权限为Kij p,其中i=1,2,3,…,n,j=n+1,n+2,…,n+m;
Figure BDA0002705737600000071
Kij f为该字段的使用频次,使用频次越多的字段应优先推荐;
Kij q为该字段的数据质量,量化为百分比数字;
Kij Sim为匹配到的词相似度,其中i=1,2,3,…,n,j=1,2,…,m;其中,i表示第i个用户需求关键词或实体,j表示匹配到的字段在第j张数据信息表中,n是关键词的个数,m是数据信息表中匹配的表的数量;
定义权值
Figure BDA0002705737600000072
这里
Figure BDA0002705737600000081
构造初始权重矩阵
Figure BDA0002705737600000082
计算有向图D=<V,E>的邻接矩阵A,按行归一化后记为A’,最终的权重矩阵
M=Q·(A')T (2)
数据中心中,数据信息表的重要程度由IPR值决定,IPRk+1表示第k次迭代后的IPR值
Figure BDA0002705737600000083
I(Tl)为与Tl相关联的关键词的集合,△+(Kj)为与Tl相关联的关键词Kj的出度,初值
Figure BDA0002705737600000084
一般地β=0.85;
Figure BDA0002705737600000085
迭代后稳定值IPR*(Tl)即为每张数据信息表的评价值;
对Tl的IPR*(Tl)值进行排序,其中l=1,2,…,m,若最大值的Tj均有<Ki,Tj>,i=1,…,m,则统计、查询任务可以在Tj这张数据信息表内完成,生成与关键词对应关系的SQL;若一张数据信息表不能完成查询、统计分析任务,依次选择IPR*值完成SQL拼接。

Claims (10)

1.基于自然语言语义解析的数据中心智能查询统计方法,其特征在于,在查询任务中,解析具体语义关键词,对关键词中的复合词进行分词,分词后对分词的同义词分析重组,将分析重组的结果与转义字典进行匹配;匹配成功,则分析并建立网络及重新定义权重信息,结合数据信息的数据中心权限、数据质量、使用频次信息,构建推荐算法将任务所用到的数据中心中的表、字段等拼接成SQL进行查询、统计。
2.根据权利要求1所述的基于自然语言语义解析的数据中心智能查询统计方法,其特征在于,包括下述步骤:
a.接收规范化处理的数据信息;
b.接收基于用户自然语言,进行语义解析后生成的用户需求关键词或实体;
c.针对行业词汇的转义解释,构建转义词典;
d.在步骤a的数据信息中匹配步骤b的用户需求关键词或实体、用户需求关键词或实体的同义词,和/或关键词的转义后的同义词;对匹配到的相应词汇及对应的字段信息进行保存记录、建立索引;
e.生成由表和关键词为节点、有序对为边构成的有向图;
f.基于有向图构建权重矩阵,以优化PageRank算法评估表及字段并推荐给用户,之后根据数据库类型生成与所述的相应词汇对应关系的SQL。
3.根据权利要求2所述的基于自然语言语义解析的数据中心智能查询统计方法,其特征在于:
步骤a中,所述的数据信息,是由数据中心所有的数据库、表、字段、中文数据字典、数据质量情况、字段使用频次等信息构成的一张或多张数据信息表。
4.根据权利要求2所述的基于自然语言语义解析的数据中心智能查询统计方法,其特征在于,
步骤c中,转义词典的构建如下:
c1.将行业词汇进行分词,标记词性;根据所述的词性到转义词典中进行匹配,匹配到后将原转义词典中对应的词汇替换为转义词;
c2.采用词义相似度Sim计算相似度高于90%的词,进行同义词识别,将识别到的同义词添加到转义词典中。
5.根据权利要求4所述的基于自然语言语义解析的数据中心智能查询统计方法,其特征在于:步骤c1中,匹配失败时,返回失败原因,由人工添加解释进转义词典。
6.根据权利要求4所述的基于自然语言语义解析的数据中心智能查询统计方法,其特征在于:
步骤c2中,同义词识别的方法具体为:通过词义相似度Sim计算,识别到相似度值Sim>90%的词汇,之后依据语义拼接构造同义词向量,并记录该词向量的相似度值。
7.根据权利要求2所述的基于自然语言语义解析的数据中心智能查询统计方法,其特征在于:步骤d中,若匹配失败,则返回信息给用户以便添加解释进转义词典。
8.根据权利要求3所述的基于自然语言语义解析的数据中心智能查询统计方法,其特征在于:步骤e中,有向图的生成具体如下:
记有向图作D=<V,E>;其中,
顶点集V={Ki,Tl},Ki为第i个用户需求关键词或实体,i=1,…,n;Tl表示l张数据信息表,l=1,…,m;
边集定义为E={<Ki,Ti,r>,<Tl,Ki>|i=1,2,3,…,n,l=1,…,m,r为第i个用户需求关键词或实体关联的数据信息表};
当一个用户需求关键词或实体对应同一张数据信息表的几个字段时,取相似度最大的字段,Σr=m。
9.根据权利要求8所述的基于自然语言语义解析的数据中心智能查询统计方法,其特征在于,步骤f具体如下:
记第i个用户需求关键词或实体对应的第j张数据信息表的权限为Kij p,其中i=1,2,3,…,n,j=n+1,n+2,…,n+m;
Figure FDA0002705737590000031
Kij f为该字段的使用频次,使用频次越多的字段应优先推荐;
Kij q为该字段的数据质量,量化为百分比数字;
Kij Sim为匹配到的词相似度,其中i=1,2,3,…,n,j=1,2,…,m;其中,i表示第i个用户需求关键词或实体,j表示匹配到的字段在第j张数据信息表中,n是关键词的个数,m是数据信息表中匹配的表的数量;
定义权值
Figure FDA0002705737590000032
这里
Figure FDA0002705737590000033
构造初始权重矩阵
Figure FDA0002705737590000034
计算有向图D=<V,E>的邻接矩阵A,按行归一化后记为A’,最终的权重矩阵
M=Q·(A')T (2)
数据中心中,数据信息表的重要程度由IPR值决定,IPRk+1表示第k次迭代后的IPR值
Figure FDA0002705737590000035
I(Tl)为与Tl相关联的关键词的集合,△+(Kj)为与Tl相关联的关键词Kj的出度,初值
Figure FDA0002705737590000041
一般地β=0.85;
Figure FDA0002705737590000042
迭代后稳定值IPR*(Tl)即为每张数据信息表的评价值;
对Tl的IPR*(Tl)值进行排序,其中l=1,2,…,m,若最大值的表Tj均有<Ki,Tj>,i=1,…,m,则统计、查询任务可以在Tj这张数据信息表内完成,生成与关键词对应关系的SQL。
10.根据权利要求9所述的基于自然语言语义解析的数据中心智能查询统计方法,其特征在于:若一张数据信息表不能完成查询、统计分析任务,依次选择IPR*值完成SQL拼接。
CN202011038101.XA 2020-09-28 2020-09-28 基于自然语言语义解析的数据中心智能查询统计方法 Active CN112131246B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011038101.XA CN112131246B (zh) 2020-09-28 2020-09-28 基于自然语言语义解析的数据中心智能查询统计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011038101.XA CN112131246B (zh) 2020-09-28 2020-09-28 基于自然语言语义解析的数据中心智能查询统计方法

Publications (2)

Publication Number Publication Date
CN112131246A true CN112131246A (zh) 2020-12-25
CN112131246B CN112131246B (zh) 2024-08-30

Family

ID=73839533

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011038101.XA Active CN112131246B (zh) 2020-09-28 2020-09-28 基于自然语言语义解析的数据中心智能查询统计方法

Country Status (1)

Country Link
CN (1) CN112131246B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112686559A (zh) * 2021-01-06 2021-04-20 郑州铁路职业技术学院 基于大数据和人工智能的成果转化在线供需匹配方法
CN117195890A (zh) * 2023-11-07 2023-12-08 成都航空职业技术学院 一种基于机器学习的文本推荐方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060229896A1 (en) * 2005-04-11 2006-10-12 Howard Rosen Match-based employment system and method
CN101510221A (zh) * 2009-02-17 2009-08-19 北京大学 一种用于信息检索的查询语句分析方法与系统
CN104331767A (zh) * 2014-10-28 2015-02-04 江苏云道信息技术有限公司 用于离散制造企业生产过程控制的多系统协同系统及方法
US20180364905A1 (en) * 2017-06-15 2018-12-20 Boris Mikhailovich Putko Method, system and keyboard for input of characters
US20190384762A1 (en) * 2017-02-10 2019-12-19 Count Technologies Ltd. Computer-implemented method of querying a dataset
CN110795627A (zh) * 2019-10-28 2020-02-14 苏州跃盟信息科技有限公司 信息推荐方法及装置、电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060229896A1 (en) * 2005-04-11 2006-10-12 Howard Rosen Match-based employment system and method
CN101510221A (zh) * 2009-02-17 2009-08-19 北京大学 一种用于信息检索的查询语句分析方法与系统
CN104331767A (zh) * 2014-10-28 2015-02-04 江苏云道信息技术有限公司 用于离散制造企业生产过程控制的多系统协同系统及方法
US20190384762A1 (en) * 2017-02-10 2019-12-19 Count Technologies Ltd. Computer-implemented method of querying a dataset
US20180364905A1 (en) * 2017-06-15 2018-12-20 Boris Mikhailovich Putko Method, system and keyboard for input of characters
CN110795627A (zh) * 2019-10-28 2020-02-14 苏州跃盟信息科技有限公司 信息推荐方法及装置、电子设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MARIANA SOLLER RAMADA等: "From keywords to relational database content:A semantic mapping method", 《INFORMATION SYSTEM》, vol. 88, pages 1 - 9 *
刘波: "面向企业图谱的实体链接技术的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, pages 138 - 1241 *
祁瑞丽等: "面向top-K分级的数据库关键词查询系统体系结构", 《燕山大学学报》, vol. 34, no. 1, pages 67 - 73 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112686559A (zh) * 2021-01-06 2021-04-20 郑州铁路职业技术学院 基于大数据和人工智能的成果转化在线供需匹配方法
CN117195890A (zh) * 2023-11-07 2023-12-08 成都航空职业技术学院 一种基于机器学习的文本推荐方法
CN117195890B (zh) * 2023-11-07 2024-01-26 成都航空职业技术学院 一种基于机器学习的文本推荐方法

Also Published As

Publication number Publication date
CN112131246B (zh) 2024-08-30

Similar Documents

Publication Publication Date Title
CN112069298B (zh) 基于语义网和意图识别的人机交互方法、设备及介质
Jung Semantic vector learning for natural language understanding
CN108804521B (zh) 一种基于知识图谱的问答方法及农业百科问答系统
CN108363790B (zh) 用于对评论进行评估的方法、装置、设备和存储介质
CN111125334B (zh) 一种基于预训练的搜索问答系统
Chen et al. Unsupervised induction and filling of semantic slots for spoken dialogue systems using frame-semantic parsing
US9176949B2 (en) Systems and methods for sentence comparison and sentence-based search
CN110705296A (zh) 一种基于机器学习和深度学习的中文自然语言处理工具系统
CN112035599B (zh) 基于垂直搜索的查询方法、装置、计算机设备及存储介质
JPWO2014033799A1 (ja) 単語意味関係抽出装置
CN110597844B (zh) 异构数据库数据统一访问方法及相关设备
CN111159381B (zh) 数据搜索方法及装置
CN115827819A (zh) 一种智能问答处理方法、装置、电子设备及存储介质
CN116628173A (zh) 一种基于关键字提取的智能客服信息生成系统及生成方法
CN112131246B (zh) 基于自然语言语义解析的数据中心智能查询统计方法
Tapsai Information processing and retrieval from CSV file by natural language
CN116561251A (zh) 一种自然语言处理方法
CN118132719A (zh) 一种基于自然语言处理的智能对话方法及系统
Balaji et al. Text summarization using NLP technique
CN113157887B (zh) 知识问答意图识别方法、装置、及计算机设备
CN111581365B (zh) 一种谓词抽取方法
CN112183110A (zh) 一种基于数据中心的人工智能数据应用系统及应用方法
CN110633363B (zh) 一种基于nlp和模糊多准则决策的文本实体推荐方法
CN111382265A (zh) 搜索方法、装置、设备和介质
CN115238705A (zh) 语义解析结果重排序方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant