CN103226606B - 查询选取方法及系统 - Google Patents

查询选取方法及系统 Download PDF

Info

Publication number
CN103226606B
CN103226606B CN201310155688.6A CN201310155688A CN103226606B CN 103226606 B CN103226606 B CN 103226606B CN 201310155688 A CN201310155688 A CN 201310155688A CN 103226606 B CN103226606 B CN 103226606B
Authority
CN
China
Prior art keywords
node
inquiry
index
user
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310155688.6A
Other languages
English (en)
Other versions
CN103226606A (zh
Inventor
易峥
王进
夏炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hexin Software Technology Co ltd
Original Assignee
Hithink Royalflush Information Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hithink Royalflush Information Network Co Ltd filed Critical Hithink Royalflush Information Network Co Ltd
Priority to CN201310155688.6A priority Critical patent/CN103226606B/zh
Publication of CN103226606A publication Critical patent/CN103226606A/zh
Priority to US14/787,472 priority patent/US10185772B2/en
Priority to PCT/CN2014/080619 priority patent/WO2014177118A1/zh
Application granted granted Critical
Publication of CN103226606B publication Critical patent/CN103226606B/zh
Priority to US16/252,819 priority patent/US10922371B2/en
Priority to US17/134,566 priority patent/US11714861B2/en
Priority to US18/335,097 priority patent/US20230325447A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种查询选取方法和查询选取系统,上述方法包括:查询选取系统获取用户输入的自然语言语句,对其进行预处理,得到标准节点序列(节点至少包括指标节点和条件节点),并根据指标节点与其他节点之间的关系,构造节点树,节点树用于表征指标条件组合;根据节点树生成数据查询指令;查询选取系统使用数据查询指令查询数据,并对查询结果进行筛选,得到筛选结果并展示。在本发明实施例中,在用户输入自然语言语句后,由查询选取系统自动对自然语言语句进行处理,构成表征指标条件组合的节点树,并根据节点树生成数据查询指令,在数据库中进行查询筛选,并展示给用户,从而实现了用户通过输入自然语言语句来对数据进行查询和筛选。

Description

查询选取方法及系统
技术领域
本发明涉及加工技术领域,更具体的说,涉及查询选取方法及系统。
背景技术
在对数据库、数据源中的数据进行查询时,现有技术一般会提供多个查询选项(也可称为查询指标或指标),用户选择指标后,还需要配置指标对应的限制条件,并将所有的限制条件以“且”和“或”的逻辑关系组合后,系统形成查询指令,在数据库中进行查询筛选,并展示给用户。在现有技术中,用户无法通过输入自然语言语句来实现对数据的查询和筛选。
发明内容
有鉴于此,本发明实施例提供了查询选取方法及系统,以解决上述问题。
为实现上述目的,本发明实施例提供如下技术方案:
一种查询选取方法,至少基于查询选取系统,包括:
查询选取系统获取用户输入的自然语言语句;
查询选取系统对所述用户输入的自然语言语句进行预处理,得到标准节点序列,所述节点至少包括指标节点和条件节点,所述条件节点包括数字节点、日期节点、字符串节点中的至少一种;
查询选取系统根据指标节点与其他节点之间的关系,构造节点树,所述节点树用于表征指标条件组合;
查询选取系统根据所述节点树生成数据查询指令;
查询选取系统使用所述数据查询指令查询数据,并对查询结果进行筛选,得到筛选结果;
查询选取系统展示所述筛选结果。
一种查询选取系统,包括:
获取单元,用于获取用户输入的自然语言;
预处理单元,用于对所述用户输入的自然语言进行预处理,得到标准节点序列,所述节点至少包括指标节点和条件节点,所述条件节点包括数字节点、日期节点和字符串节点中的至少一种;
节点树构造单元,用于根据指标节点与其他节点之间的关系,构造节点树,所述节点树用于表征指标条件组合;
翻译单元,用于将所述节点树翻译成数据查询指令;
查询筛选单元,用于使用所述数据查询指令查询数据,并对查询结果进行筛选,得到筛选结果;
展示单元,用于展示所述筛选结果。
经由上述的技术方案可知,在本发明实施例中,在用户输入自然语言语句后,由查询选取系统自动对自然语言语句进行处理,构成表征指标条件组合的节点树,并根据节点树生成数据查询指令,在数据库中进行查询筛选,并展示给用户,从而实现了用户通过输入自然语言语句来对数据进行查询和筛选。此外,用户只需要输入自然语言语句,不再需要选择指标、设置限制条件,因此,还简化了用户操作,节省了用户的操作时间。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的查询选取系统结构示意图;
图2为本发明实施例提供的查询选取方法流程图;
图3为本发明实施例提供的查询选取方法另一流程图;
图4为本发明实施例提供的查询选取方法又一流程图;
图5为本发明实施例提供的节点树示意图;
图6为本发明实施例提供的节点树另一示意图;
图7为本发明实施例提供的查询选取方法又一流程图;
图8为本发明实施例提供的查询选取方法又一流程图;
图9为本发明实施例提供的查询选取方法又一流程图;
图10为本发明实施例提供的查询选取方法又一流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在对数据库、数据源中的数据进行查询时,现有技术一般会提供多个查询选项(也可称为查询指标或指标),用户选择指标后,还需要配置指标对应的限制条件,并将所有的限制条件以“且”和“或”的逻辑关系组合后,系统形成查询指令,在数据库中进行查询筛选,并展示给用户。
举例来讲,用户如想查询数学成绩以及语文成绩均超过80分的学生,至少需要选择“数学成绩”、“语文成绩”这两个指标,设置两个限制条件“>80”,设置两个限制条件为“且”的逻辑关系组合后,系统才形成查询指令,在数据库或数据源中进行查询筛选并展示。
因此,在现有技术中,用户无法通过输入自然语言语句来实现对数据的查询和筛选。
有鉴于此,本发明实施例提供了查询选取方法和查询选取系统,以解决上述问题。
参见图1,上述查询选取系统至少可包括获取单元1、预处理单元2、节点树构造单元3、翻译单元4、查询筛选单元5和展示单元6。
基于上述查询选取系统,参见图2,本发明实施例所提供的查询选取方法至少包括如下步骤:
S1、查询选取系统(获取单元)获取用户输入的自然语言语句;
用户可以用手写、按键或语音输入自然语言语句。因此,上述获取单元具体可包括键盘、麦克风(用于语音输入)、手写笔和触摸屏(手写笔和触摸屏用于手写输入)等。
S2、查询选取系统(预处理单元)对用户输入的自然语言语句进行预处理,得到标准节点序列(考虑到后续还将出现标准节点序列,步骤S2中得到的标准节点序列可称为第一标准节点序列)。
上述节点至少包括指标节点和条件节点,而条件节点又可包括数字节点、日期节点和字符串节点中的至少一种。
S3、查询选取系统(节点树构造单元)根据指标节点与其他节点之间的关系,构造节点树,节点树用于表征指标条件组合;
S4、查询选取系统(翻译单元)根据节点树生成数据查询指令;
S5、查询选取系统(查询筛选单元)使用数据查询指令查询数据,并对查询结果进行筛选,得到筛选结果;
S6、查询选取系统(展示单元)展示筛选结果。具体的,展示单元可为显示屏。
经由上述的技术方案可知,在本发明实施例中,在用户输入自然语言语句后,由查询选取系统自动对自然语言语句进行处理,构成表征指标条件组合的节点树,并根据节点树生成数据查询指令,在数据库中进行查询筛选,并展示给用户,从而实现了用户通过输入自然语言语句来对数据进行查询和筛选的目的。并且,在本发明实施例中,用户只需要输入自然语言语句,而不再需要选择指标、设置限制条件,因此,还简化了用户操作,节省了用户的操作时间。
下面将重点介绍步骤S2-S4的细节内容。
首先介绍步骤S2。在本发明其他实施例中,参见图3,上述步骤S2可具体包括:
S21、将用户输入的自然语言语句进行分词处理,得到多个词或词组;
S22、对每一个词或词组构造节点,得到与用户输入的自然语言语句相对应的原始节点序列;
原始节点序列中包括至少一个节点。
更具体的,可通过配置词典对每个词或词组构造节点,节点类型可包括疑问词节点、指标节点、数字节点、日期节点、逻辑词节点、字符串节点等等,最终得到与用户输入语句相对应的一个语义节点序列。
上述数字节点和字符串节点均可作为指标节点的限制条件值。例如,在“三年级五班姓名李明的数学成绩”中,“李明”是一字符串节点,是“姓名”这一指标节点的限制条件值;而在“数学成绩超90分”中,“超90分”这一数字节点是“数学成绩”这一指标节点的条件值。
在对数字节点和日期节点的配置中,首先先确定某一词组是数字,然后再确定这些数据是否是日期,如果是,将其构造成日期节点,否则将其构造成数字节点。
需要说明的,一个特定的系统(也即在特定应用场景下)可提供查询选项(也即查询指标)是固定的。比如,在学生成绩查询系统中,其可提供的指标包括年级、班级、各科目(数学、语文、地理、历史、生物等)等,是固定的。因此,可利用指标关键词对分词得到的各词或词组进行匹配,从而确定出用户输入的语句中所包含的指标。
例如,使用“科目”中数学、语文、地理、历史、生物等指标关键词,对“三年级五班数学成绩超90分,以及语文成绩超过80分的学生”这一语句进行匹配,可匹配出该语句包含“数学”、“语文”两个指标。
同理,逻辑词也是固定的,可预先设置逻辑词字典,该字典中包括逻辑关键词“并且”、“和”、“且”、“同时”、“与”、“或”等,使用逻辑关键词对分词后的词或词组进行匹配,可确定其是否是逻辑关系节点。
S23、将原始节点序列转换为(下述节点树构造单元可处理的)标准节点序列;
由于用户在输入自然语言语句时,带有很大的随意性,因此其对应的节点序列可能是非标准的。仍以上述提及的“三年级五班李明的数学成绩”为例,该句中只出现了“李明”这一词组,但省略了“姓名”,这样,其对应的节点序列只有“李明”这一字符串节点,而缺乏其相应的指标节点-“姓名”。因此,需要对其补入指标节点(姓名),将其转换成标准节点序列“三年级五班姓名李明的数学成绩”。
更具体的,可根据配置规则将用户输入的自然语言语句对应的节点序列转换为节点树构造单元可处理的标准节点序列:
首先通过检查关键词汇和匹配特殊句式特征判断原节点序列的句式是否标准,对检查到的非标准句式根据配置文件指定的转换规则转换为标准句式对应的语义节点序列。关键词汇可用正则表达式来表示。
举例来讲,用户输入“连续3天下雨”,可使用“连续*天”这一正则表达式对其进行匹配和句式转换,将“连续3天下雨”转换成标准句式“今天下雨,并且昨天下雨,并且前天下雨”。
同时,“下雨”是条件节点中的字符串节点,其与“天气状况”这一指标相对应,因此,还需要将指标节点“天气状况”补入,最终转换成的标准节点序列为“今天天气状况下雨,并且昨天天气状况下雨,并且前天天气状况下雨”。
需要说明的是,如果用户以语音方式输入语句时,上述步骤S2还包括对语音输入进行文字识别,得到文字识别结果的步骤。从而将语音转化为文字。
在得出标准节点序列后,接下来的步骤S3是根据指标节点与其他节点之间的关系,构造节点树。
参见图4,步骤S3可具体包括:
S31、根据节点之间的位置关系,确定指标条件组合;
举例来讲,“三年级五班数学成绩超90分,以及语文成绩超过80分的学生”中,“数学成绩”为指标节点,“超90分”为数字节点(条件节点),并且,“数学成绩”与“超90分”的位置关系是相邻,因此,可根据二者的位置关系,确定“超90分”是“数学成绩”这一指标节点的限制条件,也即“超90分”是“数学成绩”这一指标节点的条件节点。
需要说明的是,“超90分”并不是计算机可理解的准确数值范围。因此,需要解析“超90分”这一数字节点,将其转化为“>90”的数字节点。而如果数字节点已经包含了准确数值范围,例如,用户输入了“三年级五班数学成绩>90”的语句,则不需要对数字节点进行解析。
更具体的,在解析时,可将“超”、“大于”、“高于”转化为“>”,将“小于”、“少于”、“低于”转化为“<”,将“不大于”、“小于等于”、“不超过”、“不高于”转化为“《”,将“不小于”、“小于等于”、“不少于”、“不低于”转化为“》”。
同理,日期节点如果未包含计算机可理解的准确日期范围,则需要对日期节点进行解析转换。反之,则不需要解析日期节点。例如,“今年”并不是计算机可理解的准确日期范围,如果今年为2013年,需要将其转化为日期节点“2013”。
相应的,逻辑词节点也需要进行转换,例如,将逻辑词节点“并且”、“和”、“且”、“同时”、“与”等,转换为“and”或“&”,将逻辑词节点“或”、“或者”转换为“or”。
以此类推,可最终得到指标条件组合。
S32、根据指标条件组合构造节点树。
“2013年三年级五班数学成绩超90分,以及语文成绩超过80分的学生”对应的节点树可参见图5。
此外,需要说明的是,节点树中的每一指标节点对应一个条件节点。以“连续3年同比增长率超过50%的股票为例”,其实际是三个指标条件的组合:
(1),最近一年(假设是2013年)的同比增长率>50%;
(2),前推一年(2012年)同比增长率>50%;
(3),前推两年(2011年)的同比增长率>50%。
因此,参见图6,“连续3年同比增长率超过50%的股票为例”所对应的节点树中包括三个“同比增长率”指标节点,每一指标节点对应一个条件节点。
相应的,上述步骤S4可具体包括:
确定节点树中各指标节点对应的数据源;
根据数据源的格式要求,将相应指标节点及条件节点翻译成符合数据源格式要求的查询指令。
这是因为,不同指标所对应的数据可能存储于不同的数据源或数据库中,而每个数据源所支持的查询指令格式可能也是不一样的,因此,需要针对不同数据源翻译出不同格式的查询指令。
尽管指令格式可能不一致,但各个数据源本身都支持按指标条件查询,利用这一特点,本发明实施例对于每一数据源都针对其特有的查询指令格式配置了按指标条件查询的指令翻译程序,并且,在本发明实施例中,对用户输入的语句语义的理解,与最终数据的获取是分离的。
相应的,上述步骤S5中“对查询结果进行筛选”可包括:
根据节点树中各指标节点间的关系,对查询成果进行合并操作和/或过滤操作。
具体的,在获取到查询结果后,按照指标间的逻辑组合关系进行合并和过滤,保留同时符合所有指标条件组合的查询结果。
现举一过滤的例子,以图6节点树为例,前已述及,“连续3年同比增长率超过50%的股票为例”所对应的节点树中包括三个“同比增长率”指标节点,每一指标节点对应一个条件节点。
根据查询指令得到的查询结果有三类:
第一种,最近一年(假设是2013年)同比增长率>50%的股票;
第二种,2012年同比增长率>50%的股票;
第三种,2011年同比增长率>50%的股票。
根据图6的节点树,三个指标节点之间为“且”的逻辑关系,根据该逻辑关系,对上述三种查询结果进行合并和过滤,得到同时满足2013年同比增长率>50%、2012年同比增长率>50%和2011年同比增长率>50%的股票。
另外,需要说明的是,仍以“连续3年同比增长率超过50%的股票”为例,其所对应的节点树中包括三个“同比增长率”指标节点,在生成查询指令时,可分别根据三个指标节点生成三个查询指令,在得到查询结果后,再对查询结果进行过滤。也可以生成一个查询指令,查询同时满足三个指标条件值的数据,此时,就不再需要对查询结果进行过滤了。
至于合并,主要是针对不同指标对应不同数据源的情况,在从多个数据源获得查询结果后,可对这些查询结果进行合并。
在本发明其他实施例中,参见图7,在步骤S6后,还可包括如下步骤:
S7、查询选取系统展示指标条件组合。
考虑到用户出于种种原因会更改指标,在本发明其他实施例中,上述方法还可包括如下步骤:
查询选取系统获取用户输入的条件更改指令。
在获取条件更改指令后,系统将进行条件更改,并重新生成数据查询指令。
相应的,上述查询选取系统可包括指令更改单元,用于获取用户输入的条件更改指令进行条件更改,并重新生成数据查询指令。
条件更改又可具体包括条件追加、条件修改和条件删除。
针对条件追加,用户可采用类似于现有技术中的方式,选择需要追加的指标,并配置指标对应的限制条件。用户也可追加自然语言条件。
可设置一个按键或图标,用户点击,则指令更改单元被触发。
更具体的,参见图8,如果用户选择了自然语言条件这个方式,则需要(步骤S10)获取用户输入追加的自然语言语句(类似于步骤S1),(步骤S11)并对追加的自然语言语句进行预处理得到第二标准节点序列(类似于步骤S2),(步骤S12)再将第二标准节点序列和原来的第一标准节点序列合并,形成新第一标准节点序列后,经过步骤S3重新生成查询指令进入步骤S4重新查询和筛选。
而如果用户只是想修改某些指标对应的条件,或者想删除某些条件或指标,则(步骤S13)直接修改或删除第一标准节点序列中的相应节点,进入步骤S3。
在具体实施时,在执行步骤S7后,查询选取系统可同时提供“条件追加”、“条件修改”、“条件删除”按钮,以方便用户操作。
此外,需要说明的是,请参见图9,上述步骤S7,也可发生在步骤S3之前,而用户更改条件的时机,也可选择在执行步骤S3之前。
或者,请参见图10,在步骤S2后,还可包括如下步骤:
S14、展示第一标准节点序列。以便用户得知系统所“理解”的指标条件组合。
例如,用户输入“三年级五班李明的数学成绩”,将其转换成第一标准节点序列为“年级三年级班级五班姓名李明的科目数学成绩”并展示。
S15、判断用户是否确认指标条件正确。
可提供确认按钮,以供用户进行确认。如果用户确认正确,则执行步骤S3。
如果用户认为指标条件不正确,则输入条件更改指令,进行条件追加、条件修改或条件删除,在此不作赘述。
在具体实施时,在执行步骤S14后,查询选取系统可同时提供“确认”、“条件追加”、“条件修改”、“条件删除”按钮,以方便用户操作。
下面将以“连续3年净利润增长超过50%的股票”为例,对本发明的实施过程进行描述。
步骤(1)用户输入自然语言语句“连续3年净利润增长超过50%的股票”。
步骤(2)得到“连续3年|净利润|增长|超过50%|的股票”的原始节点序列,其中用“|”区分节点。
在该步骤,可明确查询的是股票。并根据配置文件中提供的“净利润”“增长”特征将非标准句式转换为标准句式“连续3年|净利润(同比增长率)|超过50%|的股票”。
步骤(3),对数字节点和时间节点进行解析。
在本实施例中,可将“超过50%”转化为“>50%”,将“连续3年”转化为最近一年开始前推两年的具体时间范围。
步骤(4),构造节点树。
首先,将“>50%”的数字节点,表示绑定为“净利润(同比增长率)”这一指标的值过滤条件,将“连续3年”的时间节点绑定为“净利润(同比增长率)”的时间参数;
再根据“净利润(同比增长率)”这一指标绑定的时间参数为年度的特点,将“连续3年”拆分为“最近一年”、“前推一年”、“前推两年”3个年度时间节点,并对其它节点进行复制,最后得到表征3个指标条件组合的节点树(请参见图6)。
需要指出的是,传统的选股工具在处理这种选股需求时,通常要求用户分3次选择“净利润(同比增长率)”这一指标,每次需要用户为指标选定是哪一年,同时每次需设置指标值大于50%的限制条件,因此操作繁琐,而本发明实施例只要求用户输入一句自然语言语句,因此,极大得简化了用户操作。
步骤(5),将以上指标条件组合翻译数据查询指令。
首先,确定“净利润(同比增长率)”这一指标对应的数据源,然后根据数据源要求的查询指令格式将以上3个指令条件组合翻译为数据源支持的查询指令。
步骤(6),执行查询指令,按净利润(同比增长率)>50%的条件过滤掉所有不符合条件的股票。
步骤(7),将查询出的股票及相关的净利润(同比增长率)数据展示在界面上,同时也将得到的指标条件组合显示给用户,方便用户检查验证。
步骤(8),用户可以选择更改条件(也即前述的输入条件更改指令),如追加一个条件“浙江省”,这样可以选出“浙江省”的“连续3年净利润增长超过50%的股票”。或者,用户将最近一年的净利润(同比增长率)大于50%修改为小于30%等等,然后重新进行选股。
如果用户不再更改条件,则一次正常流程结束。
需要说明的是,本发明实施例所提供的技术方案,其可用于搜索领域、通信领域、工业领域等。现简单各举一例说明。
在搜索领域方面,用户在网页中输入自然语言语句,网页服务器(也即查询选取系统)可执行步骤S1-S4,将用户输入的自然语言语句转化为数据查询指令,然后,网页服务器在使用数据查询指令进行查询得到查询结果,并进行筛选(步骤S5),并将筛选结果返回至客户端显示,则完成了一次搜索。
在通信领域应用方面,例如,用户输入“打电话给李明”,手机(也即查询选取系统)执行步骤S1-S2后,将用户输入的自然语句转化为标准节点序列“打电话给联系人李明”,其中“联系人”为指标节点,“李明”为字符串节点。在步骤S3-S5中,生成数据指令,查询手机的联系人列表,找到“李明”的电话号码并展示。此后,上述方法还可进一步包括根据筛选结果——“李明”的电话号码,发起通信呼叫。
在工业控制应用(例如炼钢领域)方面,如用户输入“将温度保持在50度”,则PLC(也即查询选取系统)进行步骤S1-S2步骤后,获知“温度”为指标节点,“50度”为数字节点。则在步骤S3-S6中,PLC将生成数据指令,查询炼钢生产线当前的温度值并显示(炼钢生产线会定时将当前的温度值上传至某一数据库)。此后,上述方法还可进一步包括,将炼钢生产线当前的温度值与“50度”相比较,如果前者低于后者,则进行加温,如果前者高于后者,则进行降温。
与之相对应,本发明实施例还要求保护查询选取系统,仍请参见图1,该系统至少可包括:
获取单元1,用于获取用户输入的自然语言;
预处理单元2,用于对用户输入的自然语言进行预处理,得到第一标准节点序列,节点至少包括指标节点和条件节点,条件节点包括数字节点、日期节点和字符串节点中的至少一种;
节点树构造单元3,用于根据指标节点与其他节点之间的关系,构造节点树,节点树用于表征指标条件组合;
翻译单元4,用于将节点树翻译成数据查询指令;
查询筛选单元5,用于使用数据查询指令查询数据,并对查询结果进行筛选,得到筛选结果;
展示单元6,用于展示筛选结果。
展示单元6还可以用于展示指标条件组合。
具体细节请参见本文前述方法部分的介绍,在此不作赘述。
在本发明其他实施例中,上述查询选取系统还可包括更改单元,用于获取用户输入的条件更改指令进行条件更改。
更具体的,更改单元可包括条件追加单元、条件修改/删除单元。
条件追加单元在用户输入追加的自然语言语句时,获取用户输入追加的自然语言语句,并对追加的自然语言语句进行预处理得到第二标准节点序列,再和原有的第一标准节点序列合并后,指示节点树构造单元3重新生成数据查询指令。
而条件修改/删除单元,可根据用户的修改或删除操作,修改或删除原有第一标准节点序列中的相应节点,指示节点树构造单元3重新生成数据查询指令。
具体细节请参见本文前述方法部分的介绍,在此不作赘述。
最后需要说明的是,查询选取系统中的预处理单元、节点树构造单元、翻译单元、查询筛选单元、指令更改单元既可为硬件单元、电路,也可为逻辑单元,在为逻辑单元时,具体由处理器完成各单元的功能。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (5)

1.一种查询选取方法,其特征在于,至少基于查询选取系统,包括:
查询选取系统获取用户输入的自然语言语句;
查询选取系统对所述用户输入的自然语言语句进行预处理,得到标准节点序列,所述节点至少包括指标节点和条件节点,所述条件节点包括数字节点、日期节点、字符串节点中的至少一种;
所述预处理包括:将所述用户输入的自然语言语句进行分词处理,得到多个词或词组;对每一个词或词组构造节点,得到原始节点序列;将原始节点序列转换为标准节点序列;
查询选取系统根据指标节点与其他节点之间的关系,构造节点树,所述节点树用于表征指标条件组合,其中,根据节点之间的位置关系,确定指标条件组合,根据所述指标条件组合构造节点树;
查询选取系统根据所述节点树生成数据查询指令,其中包括:确定所述节点树中各指标节点对应的数据源;根据数据源的格式要求,将相应指标节点及条件节点翻译成符合数据源格式要求的查询指令;
查询选取系统使用所述数据查询指令查询数据,并对查询结果进行筛选,得到筛选结果;
查询选取系统展示所述筛选结果;
查询选取系统获取用户输入的条件更改指令,并根据所述条件更改指令重新生成数据查询指令。
2.如权利要求1所述的方法,其特征在于,还包括:
查询选取系统展示指标条件组合。
3.如权利要求1所述的方法,其特征在于,所述条件更改包括条件追加、条件修改和条件删除。
4.如权利要求1所述的方法,其特征在于,所述对查询结果进行筛选包括:根据节点树中各指标节点间的关系,对所述查询结果进行合并操作和/或过滤操作。
5.一种查询选取系统,其特征在于,包括:
获取单元,用于获取用户输入的自然语言;
预处理单元,用于对所述用户输入的自然语言进行预处理,得到标准节点序列,所述节点至少包括指标节点和条件节点,所述条件节点包括数字节点、日期节点和字符串节点中的至少一种;所述预处理包括:将所述用户输入的自然语言语句进行分词处理,得到多个词或词组;对每一个词或词组构造节点,得到原始节点序列;将原始节点序列转换为标准节点序列;
节点树构造单元,用于根据指标节点与其他节点之间的关系,构造节点树,所述节点树用于表征指标条件组合,其中,根据节点之间的位置关系,确定指标条件组合,根据所述指标条件组合构造节点树;
翻译单元,用于将所述节点树翻译成数据查询指令,其中包括:确定所述节点树中各指标节点对应的数据源;根据数据源的格式要求,将相应指标节点及条件节点翻译成符合数据源格式要求的查询指令;
查询筛选单元,用于使用所述数据查询指令查询数据,并对查询结果进行筛选,得到筛选结果;
展示单元,用于展示所述筛选结果;
指令更改单元,用于查询选取系统获取用户输入的条件更改指令,并根据所述条件更改指令重新生成数据查询指令。
CN201310155688.6A 2013-04-28 2013-04-28 查询选取方法及系统 Active CN103226606B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201310155688.6A CN103226606B (zh) 2013-04-28 2013-04-28 查询选取方法及系统
US14/787,472 US10185772B2 (en) 2013-04-28 2014-06-24 Query selection method and system
PCT/CN2014/080619 WO2014177118A1 (zh) 2013-04-28 2014-06-24 查询选取方法及系统
US16/252,819 US10922371B2 (en) 2013-04-28 2019-01-21 Query selection method and system
US17/134,566 US11714861B2 (en) 2013-04-28 2020-12-28 Query selection method and system
US18/335,097 US20230325447A1 (en) 2013-04-28 2023-06-14 Query selection method and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310155688.6A CN103226606B (zh) 2013-04-28 2013-04-28 查询选取方法及系统

Publications (2)

Publication Number Publication Date
CN103226606A CN103226606A (zh) 2013-07-31
CN103226606B true CN103226606B (zh) 2016-08-10

Family

ID=48837051

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310155688.6A Active CN103226606B (zh) 2013-04-28 2013-04-28 查询选取方法及系统

Country Status (3)

Country Link
US (4) US10185772B2 (zh)
CN (1) CN103226606B (zh)
WO (1) WO2014177118A1 (zh)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103226606B (zh) * 2013-04-28 2016-08-10 浙江核新同花顺网络信息股份有限公司 查询选取方法及系统
CN104462150A (zh) * 2013-09-25 2015-03-25 中兴通讯股份有限公司 一种网元管理系统中告警过滤方法及装置
US9798801B2 (en) * 2014-07-16 2017-10-24 Microsoft Technology Licensing, Llc Observation-based query interpretation model modification
CN106020797A (zh) * 2016-05-10 2016-10-12 国网浙江省电力公司丽水供电公司 针对html应用的免接口跨系统数据查询及预警方法
CN105975598A (zh) * 2016-05-10 2016-09-28 国网浙江省电力公司丽水供电公司 基于条件检索的模拟操作方式获取数据的事件预警方法
US10585903B2 (en) * 2016-12-05 2020-03-10 Dropbox, Inc. Identifying relevant information within a document hosting system
CN109829098A (zh) * 2017-08-28 2019-05-31 广东神马搜索科技有限公司 搜索结果优化方法、装置及服务器
CN109491658A (zh) * 2017-09-11 2019-03-19 高德信息技术有限公司 计算机可执行代码数据的生成方法及装置
CN107832310A (zh) * 2017-11-27 2018-03-23 首都师范大学 基于seq2seq模型的结构化论点生成方法及系统
CN108108426B (zh) * 2017-12-15 2021-05-07 杭州汇数智通科技有限公司 自然语言提问的理解方法、装置及电子设备
US20190385711A1 (en) 2018-06-19 2019-12-19 Ellipsis Health, Inc. Systems and methods for mental health assessment
EP3811245A4 (en) 2018-06-19 2022-03-09 Ellipsis Health, Inc. MENTAL HEALTH ASSESSMENT SYSTEMS AND METHODS
CN110728113A (zh) * 2018-06-28 2020-01-24 北京金山办公软件股份有限公司 一种电子表格的信息筛选方法、装置及终端设备
CN109189901B (zh) * 2018-08-09 2021-05-18 北京中关村科金技术有限公司 一种智能客服系统中自动发现新分类以及对应语料的方法
CN109408573A (zh) * 2018-10-11 2019-03-01 上海瀚银信息技术有限公司 一种数据库的数据采集系统及数据采集方法
CN109766355A (zh) * 2018-12-28 2019-05-17 上海汇付数据服务有限公司 一种支持自然语言的数据查询方法和系统
CN110008239A (zh) * 2019-03-22 2019-07-12 跬云(上海)信息科技有限公司 基于预计算优化的逻辑执行优化方法及系统
US11645628B2 (en) * 2019-05-16 2023-05-09 Microsoft Technology Licensing, Llc Translation of time between calendar systems
CN112346923B (zh) * 2019-08-08 2022-12-13 中移(苏州)软件技术有限公司 云平台的指标数据采集方法、装置和存储介质
US11615240B2 (en) * 2019-08-15 2023-03-28 Salesforce.Com, Inc Systems and methods for a transformer network with tree-based attention for natural language processing
CN110750192A (zh) * 2019-09-23 2020-02-04 紫光云(南京)数字技术有限公司 基于可视化编辑系统的过滤模型方法
CN111125159A (zh) * 2019-12-24 2020-05-08 亚信科技(中国)有限公司 一种数据统计的方法及装置
CN112328837A (zh) * 2020-10-28 2021-02-05 北京鸿腾智能科技有限公司 数据展示方法、装置、设备及存储介质
CN112270189B (zh) * 2020-11-12 2023-07-18 佰聆数据股份有限公司 一种提问式的分析节点生成方法、系统及存储介质
CN112069305B (zh) * 2020-11-13 2021-03-30 北京智慧星光信息技术有限公司 数据筛选方法、装置及电子设备
US11681424B2 (en) 2021-05-14 2023-06-20 Microsoft Technology Licensing, Llc Map calendar graphical user interface with content-variable view levels
US11514405B1 (en) 2021-05-14 2022-11-29 Microsoft Technology Licensing, Llc Map calendar graphical user interface with dynamic time mold functionality
CN113517047A (zh) * 2021-06-08 2021-10-19 联仁健康医疗大数据科技股份有限公司 医学数据的获取方法、装置、电子设备及存储介质
US11593367B1 (en) 2021-09-29 2023-02-28 Amazon Technologies, Inc. Selecting between hydration-based scanning and stateless scale-out scanning to improve query performance
CN114090577A (zh) * 2021-11-04 2022-02-25 支付宝(杭州)信息技术有限公司 时序数据的存储、读取方法及装置
US11727003B2 (en) 2021-11-26 2023-08-15 Amazon Technologies, Inc. Scaling query processing resources for efficient utilization and performance
CN114185929B (zh) * 2022-02-15 2022-11-22 支付宝(杭州)信息技术有限公司 一种获取用于数据查询的可视化配置的方法及装置
CN116561132B (zh) * 2023-07-06 2023-12-22 深圳市明源云科技有限公司 业务数据查询方法、电子设备及可读存储介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6594783B1 (en) * 1999-08-27 2003-07-15 Hewlett-Packard Development Company, L.P. Code verification by tree reconstruction
TW432298B (en) * 1999-09-20 2001-05-01 Inst Information Industry Natural language indexing system and method for relational database
US7403938B2 (en) 2001-09-24 2008-07-22 Iac Search & Media, Inc. Natural language query processing
CN1521661A (zh) 2003-01-29 2004-08-18 黄致辉 一种利用自然语言处理功能进行信息检索的方法
CN100485666C (zh) * 2004-04-29 2009-05-06 Nec软件有限公司 结构化自然语言查询和知识系统
US20060224566A1 (en) 2005-03-31 2006-10-05 Flowers John S Natural language based search engine and methods of use therefor
US7761843B2 (en) * 2005-07-01 2010-07-20 Ronald Ortscheid Computer source code generator
CN100485688C (zh) * 2007-06-11 2009-05-06 周广宇 在网络环境下进行结构化信息发布与搜索的方法
US20090112835A1 (en) * 2007-10-24 2009-04-30 Marvin Elder Natural language database querying
CN101510221B (zh) 2009-02-17 2012-05-30 北京大学 一种用于信息检索的查询语句分析方法与系统
CN101872349B (zh) 2009-04-23 2013-06-19 国际商业机器公司 处理自然语言问题的方法和装置
CN101930428A (zh) * 2009-06-18 2010-12-29 万继华 计算机理解自然语言的系统及方法
US9092424B2 (en) * 2009-09-30 2015-07-28 Microsoft Technology Licensing, Llc Webpage entity extraction through joint understanding of page structures and sentences
CN102262634B (zh) * 2010-05-24 2013-05-29 北京大学深圳研究生院 一种自动问答方法及系统
US8862458B2 (en) * 2010-11-30 2014-10-14 Sap Ag Natural language interface
US20130080472A1 (en) * 2011-09-28 2013-03-28 Ira Cohen Translating natural language queries
CN102779163A (zh) * 2012-06-18 2012-11-14 青岛禧泰房产数据技术有限公司 量化检索方法及量化检索系统
CN103092979B (zh) 2013-01-31 2016-01-27 中国科学院对地观测与数字地球科学中心 遥感数据检索自然语言的处理方法
CN103226606B (zh) 2013-04-28 2016-08-10 浙江核新同花顺网络信息股份有限公司 查询选取方法及系统
CN103530415A (zh) 2013-10-29 2014-01-22 谭永 一种兼容关键词搜索的自然语言搜索方法及系统
KR20180001889A (ko) * 2016-06-28 2018-01-05 삼성전자주식회사 언어 처리 방법 및 장치

Also Published As

Publication number Publication date
US20160078135A1 (en) 2016-03-17
US10185772B2 (en) 2019-01-22
CN103226606A (zh) 2013-07-31
US20230325447A1 (en) 2023-10-12
US11714861B2 (en) 2023-08-01
US20190155862A1 (en) 2019-05-23
US20210117493A1 (en) 2021-04-22
WO2014177118A1 (zh) 2014-11-06
US20200226190A9 (en) 2020-07-16
US10922371B2 (en) 2021-02-16

Similar Documents

Publication Publication Date Title
CN103226606B (zh) 查询选取方法及系统
US10474703B2 (en) Method and apparatus for natural language query in a workspace analytics system
CN106020950B (zh) 基于复杂网络分析的函数调用图关键节点识别和标识方法
CN106133766B (zh) 用于计算、应用和显示文档增量的系统和方法
CN105243086B (zh) 一种车辆信息查询方法和装置
US10579678B2 (en) Dynamic hierarchy generation based on graph data
CN104657439A (zh) 用于自然语言精准检索的结构化查询语句生成系统及方法
CN104657440A (zh) 结构化查询语句生成系统及方法
US10657206B2 (en) Graphical user interface system and method for natural language generation editing
JP6693582B2 (ja) 文書要約の生成方法、装置、電子機器、コンピュータ読み取り可能な記憶媒体
CN110543571A (zh) 用于水利信息化的知识图谱构建方法以及装置
EP2889788A1 (en) Accessing information content in a database platform using metadata
US20150026159A1 (en) Digital Resource Set Integration Methods, Interfaces and Outputs
US10540628B2 (en) Hierarchical business rule model
CN114461603A (zh) 多源异构数据融合方法及装置
CN104361040A (zh) 一种定制查询的方法及装置
CN108153754B (zh) 一种数据处理方法及其装置
US20130283233A1 (en) Multi-engine executable data-flow editor and translator
US10482171B2 (en) Digital form optimization
CN114281797A (zh) 基于敏捷低代码平台快速创建基层数据汇聚仓库的方法
CN103116601A (zh) 一种提高输入法智能联想准确度的方法及系统
CN113407678A (zh) 知识图谱构建方法、装置和设备
US10445415B1 (en) Graphical system for creating text classifier to match text in a document by combining existing classifiers
Gibbon Legacy language atlas data mining: Mapping Kru languages
Mou et al. Visual orchestration and autonomous execution of distributed and heterogeneous computational biology pipelines

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Yi Zheng

Inventor after: Wang Jin

Inventor after: Xia Wei

Inventor after: Wang Meng

Inventor before: Yi Zheng

Inventor before: Wang Jin

Inventor before: Ling Ligang

Inventor before: Wang Meng

CB03 Change of inventor or designer information
COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: WANG MINZHEN ZHOU YUTIAN ZHANG GUANGXIN YU XIAOCHEN TO: WANG MINZHEN ZHOU YUTIAN YU XIN YU XIAOCHEN

CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Yi Zheng

Inventor after: Wang Jin

Inventor after: Xia Wei

Inventor before: Yi Zheng

Inventor before: Wang Jin

Inventor before: Xia Wei

Inventor before: Wang Meng

COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: YI ZHENG WANG JIN XIA WEI WANG MENG TO: YI ZHENG WANG JIN XIA WEI

C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220314

Address after: 310000 room 426, building 5, No. 1197, Bin'an Road, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: Hangzhou Hexin Software Technology Co.,Ltd.

Address before: 310000 Room 802, No. 202, Wener Road, Hangzhou, Zhejiang

Patentee before: HITHINK ROYALFLUSH INFORMATION NETWORK Co.,Ltd.

TR01 Transfer of patent right