CN116235163A - 基于推理的自然语言解释 - Google Patents

基于推理的自然语言解释 Download PDF

Info

Publication number
CN116235163A
CN116235163A CN202180054088.3A CN202180054088A CN116235163A CN 116235163 A CN116235163 A CN 116235163A CN 202180054088 A CN202180054088 A CN 202180054088A CN 116235163 A CN116235163 A CN 116235163A
Authority
CN
China
Prior art keywords
computer
query
structured
inference
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180054088.3A
Other languages
English (en)
Inventor
J·瑟恩
S·巴蒂亚
A·达尔米亚
K·桑卡拉纳拉闫安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN116235163A publication Critical patent/CN116235163A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种用于生成域特定的基于推理的含义表示的自然语言处理方法。该方法可包括经由结构化或非结构化数据接收用户查询。该方法还可包括使用域特定本体和通用事实从用户查询生成结构化查询。进一步地,该方法可包括可以分析包括结构化查询来确定该结构化查询是否被分配了一致的概念、属性和动作。此外,该方法可以包括如果确定结构化查询与域本体和通用事实不一致,则校正结构化查询。

Description

基于推理的自然语言解释
背景技术
本发明总体上涉及自然语言处理模型中的词语含义表示,并且更具体地涉及用于域特定自然语言处理解释的基于推理的含义表示。
自然语言处理已经改变了用户与计算设备的交互的格局。许多自然语言处理模型可以确定句子的一般句法结构以及域不可知模型内的一般语义结构。许多模型将自然语言查询和命令翻译成结构化格式,该结构化格式随后可被转换成可执行形式以生成对查询和命令的响应。
发明内容
本公开的实施例包括用于生成域特定的基于推理的词语表示的计算机实现的方法和计算机系统。本发明的实施例可以包括将查询变换成结构化提议,并且生成该结构化提议的基于推理的含义表示。
在本发明的另一实施例中,可包括计算机实现的方法和计算机系统,并且可包括通过处理器识别非结构化数据的定量数据和定性特征。基于所识别的定量数据和/或定性数据生成查询。将所述查询变换成结构化提议,并且生成该结构化查询的基于推理的含义表示。
此外,本发明的另一实施例可以包括计算机实现的方法和计算机系统,并且可以包括接收自然语言查询,其中该查询是基于文本的。将所述查询变换成结构化提议,以及生成所述结构化提议的基于推理的表示。
以上概述并不旨在描述本公开的每个实现方式的每个例示的实施例。
附图说明
图1是一般性地描绘根据本发明的实施例的域特定的基于推理的含义表示生成环境100的功能框图。
图2是示出了根据本发明的实施例的域特定的基于推理的自然语言处理引擎的功能框图。
图3是根据本发明的实施例的用于生成域特定的基于推理的含义表示生成的方法的流程图。
图4是根据本发明的实施例的示例性自然语言预处理系统的功能框图。
图5是根据本发明的实施例的计算系统事件错误诊断环境内的示例性计算系统的功能框图。
图6是描绘根据本发明的实施例的云计算环境的图。
图7是描绘根据本发明的实施例的抽象模型层的功能框图。
虽然在此描述的实施例服从不同修改和替代形式,但是其细节已经通过举例在附图中示出并且将被详细描述。然而,应当理解,所描述的特定实施例不应被视为限制性的。相反,意图是覆盖落入本公开的范围内的所有修改、等同物和替换。
具体实施方式
本文所描绘和描述的实施例认识到针对域特定的自然语言解释的基于推理的含义表示的益处。
在本发明的实施例中,查询可以被变换成结构化提议。可以分析该结构化提议的一致性,并且如果确定该结构化提议不一致,则可以校正该结构化提议,从而得到具有基于推理的域特定表示的结构化提议。
在另外的实施例中,可接收包含基于文本的查询的非结构化数据。成像识别模型可从非结构化数据中提取基于文本的查询和附加(定性和/或定量)数据。可以由自然语言预处理系统对查询和附加数据进行预处理,以便由结构化提议生成器进行消费。结构化提议生成器可以基于由产生结构化提议的域特定推理知识库存储的语料库,将基于推理的含义表示分配给经预处理的查询。可以针对域内的一致含义表示来分析结构化提议。如果确定结构化提议不一致,则可以基于域特定的校正公理将结构化提议校正为一致。
在参考附图详细地描述实施例时,应注意,说明书中对“实施例”、“其他实施例”等的引用表示所描述的实施例可包括特定的特征、结构或特性,但是每个实施例可能不一定包括该特定的特征、结构或特性。此外,这样的短语不一定指相同的实施例。进一步,结合实施例描述特定的特征、结构或特性,无论是否明确描述,本领域技术人员结合其他实施例具有影响这样的特征、结构或特性的知识。
图1是一般性地描绘域特定的基于推理的含义表示生成环境100的功能框图。域特定的基于推理的含义表示生成环境100包括在服务器102上操作的基于域推理的自然语言处理(NLP)引擎104和支持服务器102与客户端计算机108之间的通信的网络106。如图1所示,客户端计算机108可经由网络106访问基于域推理的自然语言处理引擎104。虽然在域特定的基于推理的含义表示生成环境100中仅示出了一个客户端计算机108,但是这是为了便于描述,因为多个客户端计算机可以在域特定的基于推理的含义表示生成环境100内(即,1、2、n...n+1)。
服务器102和客户端计算机108可以是独立的计算设备、管理服务器、web服务器、移动计算设备、或能够接收、发送、和处理数据的任何其他电子设备或计算系统。在其他实施例中,服务器102和客户端计算机108可表示利用多个计算机作为服务器系统的服务器计算系统。应当注意,虽然图1中示出了一个服务器,但是域特定的基于推理的含义表示生成环境100可以具有任意数量的服务器(例如,1、2、n...n+1)。在另一实施例中,服务器102和客户端计算机108可以是膝上型计算机、平板计算机、上网本计算机、个人计算机、台式计算机、或能够经由网络106与域特定的基于推理的含义表示生成环境100内的其他计算设备(未示出)通信的任何可编程电子设备。
在另一实施例中,服务器102和客户端计算机108表示利用集群计算机和组件(例如,数据库服务器计算机、应用服务器计算机等)的计算系统,当在域特定的基于推理的含义表示生成环境100内被访问时,该集群计算机和组件可以充当单个无缝资源池。服务器102和客户端计算机108可包括内部和外部硬件组件,如针对图6更详细地描述和描绘的。
基于域推理的NLP引擎104可以是用于接收一个或多个用户查询、将用户查询变换成结构化提议、确定结构化提议是否一致(下面进一步描述)、校正不一致的结构化提议、以及将一致的提议发送给问/答引擎用于下游应用的(下面进一步描述)的模块。应当注意,图1示出了仅在一个计算设备上操作的基于域推理的NLP引擎104,在一些实施例中,基于域推理的NLP引擎104可以在一个或多个计算设备上操作或者在云计算系统内操作。基于域推理的NLP引擎104可以同时或顺序地在相同或不同的计算系统上执行上面描述的一些动作。
网络106可以是例如局域网(LAN)、诸如互联网的广域网(WAN)或两者的组合,并且可以包括有线、无线或光纤连接。一般而言,网络106可以是将支持服务器102与客户端计算机108之间的通信的连接和协议的任何组合。
推理知识库110存储在服务器102上。在一些实施例中,推理知识库110可包含域特定的本体和通用事实。域特定本体是与域相关联的类别和概念,例如在金融领域,这些概念可以包括债务、借贷、破产、股票、债券等。在另一示例中,生物学概念可包括细胞、有丝分裂、减数分裂、染色体、细菌、无脊椎动物等。域特定本体可以是用户配置的或来源于不同位置或数据库。通用事实捕获与对于任何域是真实的逻辑推理或常识推理相关联的事实。例如,数值比较(例如,大于/小于)或数值聚合(例如,平均值、总和、最大值、最小值等)仅可以应用于数值属性。通用事实的另一示例是对于要求检索头部实体的任何自然语言查询,也必须提及对实体进行排名的排名标准。针对用例和用户可配置要在推理知识库中捕获的通用事实集合。通用事实可以来自众多源,包括用户配置和抽象含义表示(AMR)语义组(sembank)。应注意,推理知识库110可包含一个以上的域特定本体。不同的域本体可以由查询内的特定词语触发。
在一些实施例中,推理知识库110可包含检测公理和动作公理。检测公理可以确定结构化提议是否在语义上是有效的。例如,如果像总和(SUM)的数值聚合被应用于诸如“人”的“概念”,则通过检测公理来检测它,并且通过校正公理来校正它,以将其转换成“人的”“薪水”上的SUM,这是一个数值属性。在另外的示例中,针对诸如人的地址的非日期属性提及了时间比较,它被检测到并被校正为与某个日期时间属性(诸如人的租赁年)的比较。由此,检测和校正公理一起强制执行自然语言解释中的含义表示的语义有效性。
图2是基于域推理的NLP引擎104的功能框图200。结构化查询生成模块202、一致性检查模块204和校正动作解释器模块206被示出为在基于域推理的NLP引擎104内操作。
结构化查询生成模块202可以是能够接收自然语言查询并且将查询变换成结构化提议的计算机模块。自然语言查询可以是口语形式或文本形式(从结构化数据构造或从非结构化数据识别)。此外,查询可以是问题、陈述、命令、或人理解的语言中的任何词或词的组合。结构化提议可以是自然语言查询的基于推理的含义表示。自然语言处理模型可以使用不同方法(以下在图4中进一步描述)预处理口语查询或文本查询,包括但不限于词元化、词干提取、词形还原、词性标记、移除重音字符、扩展缩写词、移除特殊字符、移除停止词、命名实体识别、浅层解析和句子分块。在一些实施例中,自然语言处理可以使用不同方法(例如,词嵌入(Word2Vec、GloVe、词袋(bag-of-words)...等)和抽象含义表示)将语义含义分配给词。在一些实施例中,结构化查询生成模块202可基于推理知识库110中存储的域本体和通用事实将含义表示分配给词。例如,域本体可以包含域特定概念和该概念的关联属性或事实,否则在没有该域本体的情况下,该关联属性或事实对于含义表示分配方法是未知的。存储在推理知识库110中的通用事实可以充当“域本体”与关于属性可以执行的“分配动作”之间的桥梁。在一些实施例中,通用事实可以是不特定于域但具有通用含义表示的一般概念。
在一些实施例中,结构化查询生成模块202可以在自然语言处理流中同时利用通用事实和域本体。例如,用户可提问查询(例如,说出、经由输入/输出机构键入、或者通过光学字符识别在非结构化数据中识别)“哪个公司具有更高的股票价格,公司A还是公司B?”结构化查询生成模块202可预处理该查询,使其处于允许将含义表示分配给该查询的条件下。结构化查询生成模块202可基于查询中的词“股票”的存在被触发以利用来自推理知识库110的金融域本体。词“股票”可以是具有分配给它的许多属性的概念,例如,股票可以被分配属性“股价”、“市值”、“成交量”、“年度股息”、“缩写名称”、股票交易的市场、以及买/卖/持有的分析师评估。在一些实施例中,概念可以具有被自动分配的关键属性,除非在查询内检测到一个或多个附加词。例如,股价可以是被分配给股票的概念的默认属性,但是如果检测到词评估,则可以分配特性属性。结构化查询生成模块202可以利用存储在推理知识库110中的通用事实来识别股价的属性是可测量的属性。附加属性可包括可测量属性的聚集、属性的排名、对属性计数、或者如果属性与时间相关的话包括持续时间。
一致性检查模块204可以是计算机模块,该计算机模块可以确定结构化查询生成模块202是否已将用于所识别的动作的正确概念和正确属性分配给结构化提议中所识别的概念。例如,如果用户键入查询“猎豹是比老虎更快吗?”结构化查询生成模块202识别术语“是”和“更快”,然后,分配“速度”的概念和“排名”的动作。然而,结构化查询生成模块202不正确地分配“聚合”的属性。在一些实施例中,一致性检查模块204基于推理知识库110中存储的推理公理来识别不正确的属性分配。推理公理是可以被预编程或经由机器学习方法(诸如聚类、迁移学习、强化学习或分类)动态地学习的通用规则。在以上示例中,推理公理将是与排名动作相关联的规则,这可以由与“速度”的概念相关联的词“比”触发。聚合将不在排名动作所允许的属性内,从而使得一致性检查模块204将结构化提议标识为不一致。在一些实施例中,一致性检查模块204将向校正动作解释器模块206发送不一致的提议。
如果一致性检查模块204确定结构化查询内没有不一致性,则一致性检查模块204可以向问/答引擎发送一致的结构化提议,因为结构化查询已经具有一致的基于推理的含义表示。在其他实施例中,一致性检查模块204可以向下游应用发送针对查询的一致结构化提议以供进一步处理。
校正动作解释器模块206可以是能够基于推理知识库110中存储的校正公理向不一致的提议分配属性和概念的计算机模块。校正公理是指示校正动作解释器模块206将不一致的结构化提议的属性改变为所识别的概念和动作的一致的结构化提议的域特定规则。如以上示例中所描述的,一致性检查模块204标识被分配给概念“速度”而不是排名动作的不正确属性“聚合”。校正动作解释器模块206可以使用与动作“排名”相关联的校正公理,并且进一步缩小概念“速度”的校正动作,从而提供属性“测量”而不是错误属性“聚合”。校正的结构化提议导致查询的明确含义。在一些实施例中,校正动作解释器模块206可以向问/答引擎发送结构化提议。
图3是描述了用于生成域特定的基于推理的含义表示的方法300的操作步骤的流程图。在步骤302,查询可以被变换成结构化提议。在一些实施例中,可以由结构化查询生成模块202将查询变换成结构化提议。在一些实施例中,查询可以是来自用户的口语自然语言查询。查询可以由结构化查询生成模块202内的语音识别模块426(图4)转换成机器可读格式。例如,通过使用隐式马尔科夫模型的声学建模,可以将从口语请求得到的口语自然语言查询转换成机器可读格式。在其他实施例中,查询可以是文本的形式(结构化数据形式或非结构化数据形式)。在非结构化数据形式中,自然语言处理可使用成像识别或字符识别来区分和消费非结构化数据。在一些实施例中,结构化查询生成模块202可以使用不同技术(下面进一步解释)来向查询分配含义表示,从而得到结构化提议。例如,在一些实施例中,查询内的被隔离词可基于存储在推理知识库110内的域特定子图而被分配概念且进一步被分配概念内的属性。
在步骤304,一致性检查模块204确定来自结构化查询生成模块202的结构化提议是否一致。在一些实施例中,一致性检查模块204可以使用存储在推理知识库110中的推理公理来确定对于给定的识别动作,正确的概念是否已经被分配给已知的域特定词汇。进一步,在一些实施例中,一致性检查模块可以基于推理知识库110中存储的推理公理来确定分配给结构化提议内的概念的属性是否正确。例如,如果测量属性被分配给仅能够具有针对所识别的动作分配给其的定量属性的概念,则一致性检查模块204可以识别不一致的提议。在一些实施例中,如果一致性检查模块204确定结构化提议是一致的,即,结构化提议已经被分配了正确的基于推理的含义表示,并且因此对于所选择的域具有明确的含义,则分析结束。
在步骤306,校正动作解释器模块206可改变一致性检查模块204识别的不一致性。在一些实施例中,校正动作解释器模块206可以使用校正公理来将正确的概念、属性和/或动作分配给所识别的结构化提议。在一些实施例中,校正公理可以是重新变换整个查询的特定指令,其中从可能的分配中移除不正确分配的概念或属性。在其他实施例中,如果存在在查询中识别的并且被分配给结构化提议的多个概念,则校正公理可以是用于基于校正公理内的指令仅重新分配概念或属性的特定指令。
图4是根据本发明的实施例的被配置为对自然语言查询进行预处理的示例性自然语言预处理系统400。自然语言预处理模块402可以在基于域推理的NLP引擎104、结构化查询生成模块202内操作,或者它可以是经由网络106与基于域推理的NLP引擎104通信的独立系统。在一些实施例中,基于域推理的NLP引擎104可以向自然语言预处理模块402发送要分析的查询。进一步,自然语言预处理模块402可直接接收查询(例如,口语、文本或非结构化数据)。此外,自然语言预处理模块402可将经预处理的查询发送至结构化查询生成模块202。
自然语言预处理模块402可执行用于预处理自然语言查询的不同方法和技术(例如,句法分析、语义分析等)。自然语言预处理模块402可被配置为识别和分析任何数量的自然语言。在一些实施例中,自然语言预处理模块402可将查询的一个或多个部分分组成一个或多个细分。进一步,自然语言预处理模块402可以包括用于执行查询的分析的不同模块。这些模块可以包括但不限于分词器416、词性(POS)标记器418(例如,其可以标记在其中识别了特定主体的一个或多个部分中的每一个)、语义关系标识符420、句法关系标识符422、图像识别模块424(其可以从非结构化数据中识别自然语言查询和附加信息)以及语音识别模块426。
在一些实施例中,分词器416可以是执行词汇分析的计算机模块。分词器416可以将字符序列转换成词元序列。词元(token)可以是包括在录音中并且被分类为有意义的符号的字符串。进一步,在一些实施例中,分词器416可以识别查询中的词边界,并且将查询内的任何文本分解成分量文本元素,例如词、多词词元、数字和标点符号。在一些实施例中,分词器416可以接收字符串,识别字符串中的词素(lexeme),并将它们分类为词元。
根据不同实施例,POS标记器418可以是将查询中的词标记为对应于特定词性的计算机模块。POS标记器418可读取自然语言的段落或其他文本,并且将词性分配给每个词或其他词元。POS标记器418可基于词的定义和词的上下文来确定词(或其他口语元素)所对应的词性。词的上下文可以基于其与短语、句子或段落中的相邻和相关词语的关系。在一些实施例中,词的上下文可以取决于一个或多个先前分析的事件错误文本描述。可被分配给词的词性的示例包括但不限于名词、动词、形容词、副词等。POS标记器418可分配的其他词性类别的示例包括但不限于比较级或最高级副词、wh-副词、连词、限定词、否定小品词、所有格标记、介词、wh-代词等。在一些实施例中,POS标记器418可用词性类别来标记或以其他方式注释事件错误文本描述的词元。在一些实施例中,POS标记器418可标记将由自然语言预处理模块402解析的查询的词元或词。
在一些实施例中,语义关系识别器420可以是计算机模块,该计算机模块可被配置为识别查询中的所识别主体(例如,词、短语、图像等)的语义关系。在一些实施例中,语义关系识别器420可以确定实体之间的功能依赖性以及其他语义关系。
根据不同实施例,句法关系识别器422可以是可以被配置成识别由词元组成的查询中的句法关系的计算机模块。句法关系识别器422可以确定句子的语法结构,例如,哪些词组作为短语是相关联的以及哪个词是主体或者动词的客体。句法关系识别器422可以符合正式语法。
图像识别模块424可以是可被配置为识别非结构化数据内的文本的计算机模块。例如,在一些实施例中,图像识别模块424可以是具有神经网络的计算机模块,所述神经网络能够扫描文档(医学期刊文章、幻灯片演示内的医学数据、字处理器中的医学报告等)的像素以使用包括模式匹配、模式识别、图像相关等的不同模型来识别不同字体和手写字符。进一步,在一些实施例中,图像识别模块424可以是神经网络,该神经网络被配置成识别和预测非结构化数据文档内的以下字母,该神经网络也被称为最近邻分类器,例如Cuneiform和Tesseract。
语音识别模块426是被配置为接收口语自然语言查询并且将其变换成计算机可读格式的计算机模块。在一实施例中,声学模型可以将口语自然语言查询改变为波形格式或音素。波形格式或音素可被转换成与相应波形格式或音素相关联的字符。语音识别模块426还可具有预测能力,以确保基于先前识别的对象将正确的字符或词分配给波形格式或音素。例如,使用统计模型(例如,隐式马尔科夫模型),所识别词语之后的潜在词语可以缩减为了识别音素或波形而必须搜索的词。
图5描绘了根据本发明的至少一个实施例中的计算设备的计算机系统500。计算机系统500包括通信结构12,其提供计算机处理器14、存储器16、持久性存储器18、网络适配器28和输入/输出(I/O)接口26之间的通信。通信结构12可以用被设计用于在处理器(诸如微处理器、通信和网络处理器等)、系统存储器、外围设备和系统内的任何其他硬件组件之间传递数据和/或控制信息的任何架构来实现。例如,通信结构12可用一条或多条总线来实现。
存储器16和持久性存储器18是计算机可读存储介质。在该实施例中,存储器16包括随机存取存储器(RAM)20、高速缓存22和程序模块24。通常,存储器16可以包括任何合适的易失性或非易失性计算机可读存储介质。高速缓存22是快速存储器,其通过保存来自存储器16的最近访问的数据和最近访问的数据附近的数据来增强处理器14的性能。
具有至少一个程序模块24的程序/实用程序以及操作系统、一个或多个应用程序、其他程序模块和程序数据可以通过实例而非限制的方式存储在存储器16中。操作系统、一个或多个应用程序、其他程序模块和程序数据中的每一个或它们的一些组合可以包括网络环境的实现方式。程序模块24通常执行本发明的实施例的功能和/或方法,如本文所描述的。
用于实施本发明的实施例的程序指令和数据可以存储在永久性存储装置18和存储器16中,用于由相应的处理器14中的一个或多个经由高速缓存22执行。在实施例中,持久性存储器18包括磁性硬盘驱动器。可替代地,或除了磁性硬盘驱动之外,永久性存储装置18可以包括固态硬盘驱动、半导体存储设备、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、闪存、或能够存储程序指令或数字信息的任何其他计算机可读存储介质。
持久性存储器18使用的介质也可以是可移除的。例如,可移动硬盘驱动器可以用于持久性存储器18。其他示例包括光盘和磁盘、拇指驱动器和智能卡,它们被插入到驱动器中以便转移到另一计算机可读存储介质(其也是持久性存储器18的一部分)上。
在这些示例中,网络适配器28提供与其他数据处理系统或设备的通信。在这些示例中,网络适配器28包括一个或多个网络接口卡。网络适配器28可通过使用物理和无线通信链路中的任一者或两者提供通信。用于实施本发明的实施例的程序指令和数据可通过网络适配器28下载到持久性存储器18。
I/O接口26允许与可以连接到每个计算机系统的其他设备进行数据的输入和输出。例如,(或多个)I/O接口26可以提供到诸如键盘、小键盘、触摸屏和/或一些其他合适的输入设备之类的外部设备30的连接。外部设备30还可包括便携式计算机可读存储介质,诸如例如拇指驱动器、便携式光盘或磁盘、以及存储卡。用于实施本发明的实施例的软件和数据可以存储在这样的便携式计算机可读存储介质上并且可以经由I/O接口26加载到持久性存储器18上。I/O接口26还连接到显示器32。
显示器32提供向用户显示数据的机制,并且可以是例如计算机监视器或虚拟图形用户界面。
本文描述的组件基于在本发明的具体实施例中对其实施的应用来标识。然而,应当理解,本文中的任何特定部件术语仅为了方便而使用,并且因此本发明不应局限于仅在由这种术语标识和/或暗示的任何特定应用中使用。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可包括其上具有用于使处理器执行本发明的各方面的计算机可读程序指令的计算机可读存储介质(或多个介质)。
计算机可读存储介质可为可保留和存储供指令执行装置使用的指令的有形装置。计算机可读存储介质可以是,例如但不限于,电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备、或者上述的任意合适的组合。计算机可读存储介质的更具体示例的非穷尽列表包括以下各项:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式紧凑盘只读存储器(CD-ROM)、数字通用盘(DVD)、记忆棒、软盘、诸如穿孔卡之类的机械编码设备或具有记录在其上的指令的槽中的凸出结构、以及上述各项的任何合适的组合。如本文所使用的计算机可读存储介质不应被解释为暂时性信号本身,例如无线电波或其他自由传播的电磁波、通过波导或其他传输介质传播的电磁波(例如,穿过光纤电缆的光脉冲)或通过电线发射的电信号。
本文中所描述的计算机可读程序指令可以经由网络(例如,互联网、局域网、广域网和/或无线网络)从计算机可读存储介质下载到相应的计算/处理设备,或者下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光传输纤维、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配器卡或网络接口接收来自网络的计算机可读程序指令,并转发计算机可读程序指令以存储在相应计算/处理设备内的计算机可读存储介质中。
用于执行本发明的操作的计算机可读程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或以一种或多种程序设计语言的任何组合编写的源代码或目标代码,这些程序设计语言包括面向对象的程序设计语言(诸如Smalltalk、C++等)和常规的过程式程序设计语言(诸如“C”程序设计语言或类似程序设计语言)。计算机可读程序指令可以完全地在用户计算机上执行、部分在用户计算机上执行、作为独立软件包执行、部分在用户计算机上部分在远程计算机上执行或者完全在远程计算机或服务器上执行。在后一种情况下,远程计算机可通过任何类型的网络(包括局域网(LAN)或广域网(WAN))连接至用户计算机,或者可连接至外部计算机(例如,使用互联网服务提供商通过互联网)。在一些实施例中,包括例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)的电子电路可以通过利用计算机可读程序指令的状态信息来使电子电路个性化来执行计算机可读程序指令,以便执行本发明的各方面。
下面将参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图来描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可被提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器以产生机器,使得经由计算机或其他可编程数据处理装置的处理器执行的指令创建用于实现在流程图和/或框图的或多个框中指定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置、和/或其他设备以特定方式工作,从而,其中存储有指令的计算机可读存储介质包括包含实现流程图和/或框图中的或多个方框中规定的功能/动作的方面的指令的制造品。
也可以把计算机可读程序指令加载到计算机、其他可编程数据处理装置、或其他设备上,使得在计算机、其他可编程装置或其他设备上执行一系列操作步骤,以产生计算机实现的处理,使得在计算机、其他可编程装置或其他设备上执行的指令实现流程图和/或框图中的或多个方框中规定的功能/动作。
附图中的流程图和框图示出了根据本发明的不同实施例的系统、方法和计算机程序产品的可能实现方式的架构、功能和操作。对此,流程图或框图中的每个框可表示指令的模块、段或部分,其包括用于实现指定的逻辑功能的一个或多个可执行指令。在一些备选实现中,框中标注的功能可以不按照图中标注的顺序发生。例如,取决于所涉及的功能,连续示出的两个块实际上可以基本上同时执行,或者这些块有时可以以相反的顺序执行。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作或执行专用硬件与计算机指令的组合的专用的基于硬件的系统来实现。
应当理解,虽然本公开包括关于云计算的详细描述,但是本文所引用的教导的实现不限于云计算环境。相反,本发明的实施例能够结合现在已知的或以后开发的任何其他类型的计算环境来实现。
云计算是服务交付的模型,用于使得能够方便地、按需地网络访问可配置计算资源(例如,网络、网络带宽、服务器、处理、存储器、存储、应用、虚拟机和服务)的共享池,所述可配置计算资源可以以最小的管理努力或与所述服务的提供者的交互来快速供应和释放。该云模型可以包括至少五个特性、至少三个服务模型和至少四个部署模型。
特性如下:
按需自助服务:云消费者可以单方面地根据需要自动地提供计算能力,诸如服务器时间和网络存储,而不需要与服务的提供者的人类交互。
广泛的网络接入:能力可通过网络获得并且通过标准机制接入,该标准机制促进异构瘦客户端平台或厚客户端平台(例如,移动电话、膝上型计算机和PDA)的使用。
资源池:提供者的计算资源被池化以使用多租户模型来服务于多个消费者,其中不同的物理和虚拟资源根据需要动态地指派和重新指派。存在位置独立性的感觉,因为消费者通常不具有对所提供的资源的确切位置的控制或了解,但可能能够以较高抽象级别(例如,国家、州或数据中心)指定位置。
快速弹性:能够快速和弹性地提供能力,在一些情况下自动地快速缩小和快速释放以快速放大。对于消费者而言,可用于供应的能力通常显得不受限制并且可以在任何时间以任何数量购买。
测量的服务:云系统通过在适合于服务类型(例如,存储、处理、带宽和活动用户账户)的某个抽象级别处利用计量能力来自动控制和优化资源使用。可以监视、控制和报告资源使用,为所利用的服务的提供者和消费者提供透明度。
服务模型如下:
软件即服务(SaaS):提供给消费者的能力是使用在云基础设施上运行的提供者的应用。可通过诸如web浏览器(例如,基于web的电子邮件)之类的瘦客户端接口从不同客户端设备访问应用。消费者不管理或控制包括网络、服务器、操作系统、存储或甚至单独的应用能力的底层云基础设施,可能的例外是有限的用户特定应用配置设置。
平台即服务(PaaS):提供给消费者的能力是将消费者创建的或获取的使用由提供商支持的编程语言和工具创建的应用部署到云基础设施上。消费者不管理或控制包括网络、服务器、操作系统或存储的底层云基础设施,但是对所部署的应用和可能的应用托管环境配置具有控制。
基础设施即服务(IaaS):提供给消费者的能力是提供处理、存储、网络和消费者能够部署和运行任意软件的其他基本计算资源,所述软件可以包括操作系统和应用。消费者不管理或控制底层云基础设施,而是具有对操作系统、存储、所部署的应用的控制以及对所选联网组件(例如,主机防火墙)的可能受限的控制。
部署模型如下:
私有云:云基础架构仅为组织运作。它可以由组织或第三方管理,并且可以存在于场所内或场所外。
社区云:云基础架构被若干组织共享并支持共享了关注(例如,任务、安全要求、策略、和合规性考虑)的特定社区。它可以由组织或第三方管理,并且可以存在于场所内或场所外。
公共云:使云基础架构对公众或大型行业组可用,并且由出售云服务的组织拥有。
混合云:云基础架构是两个或更多个云(私有、社区或公共)的组合,这些云保持唯一实体但通过使数据和应用能够移植的标准化或专有技术(例如,云突发以用于云之间的负载平衡)绑定在一起。
云计算环境是面向服务的,聚焦于无状态、低耦合、模块化和语义互操作性。云计算的核心是包括互连节点网络的基础设施。
图6是描述根据本发明的至少一个实施例的云计算环境50的框图。云计算环境50包括云消费者使用的本地计算设备可以与其通信的一个或多个云计算节点10,本地计算设备诸如例如个人数字助理(PDA)或蜂窝电话54A、台式计算机54B、膝上型计算机54C和/或汽车计算机系统54N。节点10可彼此通信。它们可以物理地或虚拟地分组(未示出)在一个或多个网络中,诸如如上所述的私有云、社区云、公共云或混合云、或其组合。这允许云计算环境50提供基础设施、平台和/或软件作为云消费者不需要为其维护本地计算设备上的资源的服务。应当理解,图6中所示的计算设备54A-N的类型仅旨在是说明性的,并且计算节点10和云计算环境50可通过任何类型的网络和/或网络可寻址连接(例如,使用网络浏览器)与任何类型的计算机化设备通信。
图7是描绘根据本发明的至少一个实施例的由图6中描绘的云计算环境50提供的功能抽象模型层的集合的框图。应提前理解,图7中所示的组件、层和功能仅旨在是说明性的,并且本发明的实施例不限于此。如所描述,提供以下层和对应功能:
硬件和软件层60包括硬件和软件组件。硬件组件的示例包括:大型机61;基于RISC(精简指令集计算机)架构的服务器62;服务器63;刀片服务器64;存储设备65;以及网络和联网组件66。在一些实施例中,软件组件包括网络应用服务器软件67和数据库软件68。
虚拟化层70提供抽象层,从该抽象层可以提供虚拟实体的以下示例:虚拟服务器71;虚拟存储器72;虚拟网络73,包括虚拟专用网络;虚拟应用和操作系统74;以及虚拟客户端75。
在一个示例中,管理层80可以提供以下描述的功能。资源供应81提供用于在云计算环境内执行任务的计算资源和其他资源的动态采购。计量和定价82在云计算环境内利用资源时提供成本跟踪,并为这些资源的消费开账单或发票。在一个示例中,这些资源可以包括应用软件许可证。安全性为云消费者和任务提供身份验证,以及为数据和其他资源提供保护。用户门户83为消费者和系统管理员提供对云计算环境的访问。服务水平管理84提供云计算资源分配和管理,使得满足所需的服务水平。服务水平协议(SLA)规划和履行85提供根据SLA预期未来需求的云计算资源的预安排和采购。
工作负载层90提供可以利用云计算环境的功能的示例。可以从该层提供的工作负荷和功能的示例包括:地图和导航91;软件开发和生命周期管理92;虚拟课堂教育交付93;数据分析处理94;事务处理95;以及域特定的基于推理的含义表示生成96。
已经出于说明的目的呈现了本发明的各种实施方式的描述,但并不旨在是详尽的或者限于所公开的实施方式。在不背离本发明的范围的情况下,许多修改和变化对于本领域普通技术人员来说是显而易见的。在此所使用的术语被选择来最好地解释实施例的原理、实际应用、或优于市场中所发现的技术的技术改进、或使得本领域普通技术人员能够理解在此所披露的实施例。

Claims (25)

1.一种用于生成查询的域特定的基于推理的含义表示的计算机实现的方法,所述计算机实现的方法包括:
由处理器将查询变换成结构化提议;以及
由所述处理器生成所述结构化提议的基于推理的含义表示。
2.根据权利要求1所述的计算机实现的方法,进一步包括:
由所述处理器从用户接收所述查询,其中所述查询是由所述处理器利用语音识别模型转换的口语自然语言查询。
3.根据权利要求1所述的计算机实现的方法,进一步包括:
由所述处理器确定所述结构化提议是否一致;以及
响应于确定所述结构化提议不一致,由所述处理器校正所述结构化提议。
4.根据权利要求3所述的计算机实现的方法,其中所述确定基于推理知识库。
5.根据权利要求1所述的计算机实现的方法,进一步包括:
由所述处理器将所述基于推理的含义表示发送至问/答引擎。
6.一种用于生成查询的域特定的基于推理的含义表示的计算机系统,所述系统包括:
处理器;
可读存储介质;以及
计算机程序指令,用于:
将查询变换成结构化提议;以及
生成所述结构化提议的基于推理的含义表示。
7.根据权利要求6所述的计算机系统,进一步包括用于以下操作的指令:
从用户接收所述查询,其中所述查询是利用语音识别转换的口语自然语言查询。
8.根据权利要求6所述的计算机系统,进一步包括用于以下操作的指令:
确定所述结构化提议是否一致;以及
响应于确定所述结构化提议不一致而校正所述结构化提议的程序指令。
9.根据权利要求8所述的计算机系统,其中所述确定基于推理知识库。
10.一种用于生成查询的基于推理的含义表示的计算机实现的方法,所述计算机实现的方法包括:
由处理器识别非结构化数据的定量数据和定性特征;
由所述一个或多个处理器将查询变换成结构化提议;以及
由所述一个或多个处理器基于所述定量数据和所述定性特征来生成所述结构化提议的基于推理的含义表示。
11.根据权利要求10所述的计算机实现的方法,进一步包括:
由所述处理器从用户接收所述查询;以及
由所述处理器接收所述非结构化数据。
12.根据权利要求9所述的计算机实现的方法,进一步包括:
由所述处理器分析所述非结构化数据,其中所述分析包括利用相关联的神经网络的光学字符识别模型。
13.根据权利要求10所述的计算机实现的方法,其中所述变换包括用至少一种自然语言处理方法预处理所述查询。
14.根据权利要求13所述的计算机实现的方法,进一步包括:
由所述处理器确定所述结构化提议是否一致;以及
响应于确定所述查询不一致,由所述处理器基于所述推理知识库来校正所述结构化查询。
15.根据权利要求14所述的计算机实现的方法,其中所述推理知识库包括通用公理和域特定的事实。
16.一种用于生成查询的域特定的基于推理的含义表示的计算机系统,所述系统包括:
处理器;
可读存储介质;以及
计算机程序指令,用于:
识别非结构化数据的定量数据和定性特征;
将查询变换成结构化提议;以及
基于所述定量数据和所述定性特征,生成所述结构化提议的基于推理的含义表示。
17.根据权利要求16所述的计算机系统,进一步包括用于以下操作的指令:
从用户接收所述查询;以及
接收所述非结构化数据。
18.根据权利要求16所述的计算机系统,进一步包括用于以下操作的指令:
分析所述非结构化数据,其中所述分析包括利用相关联的神经网络的光学字符识别模型。
19.根据权利要求16所述的计算机系统,进一步包括:
确定所述结构化提议是否一致;以及
响应于确定所述查询不一致,基于所述推理知识库校正所述结构化查询。
20.根据权利要求19所述的计算机系统,其中所述推理知识库包括通用公理和域特定的事实。
21.一种用于生成查询的基于推理的含义表示的计算机实现的方法,所述计算机实现的方法包括:
由处理器接收自然语言查询,其中所述查询是基于文本的;
由所述处理器将所述查询变换成结构化提议;以及
由所述处理器生成所述结构化提议的基于推理的含义表示。
22.根据权利要求21所述的计算机实现的方法,进一步包括:
由所述处理器将所述基于推理的含义表示发送至任务完成引擎。
23.根据权利要求22所述的计算机实现的方法,其中所述查询可以是指示问/答引擎执行特定任务的命令。
24.根据权利要求21所述的计算机实现的方法,进一步包括:
由所述处理器确定所述结构化提议是否一致;以及
响应于确定所述查询不一致,由所述一个或多个处理器基于所述推理知识库来校正所述结构化查询。
25.根据权利要求24所述的计算机实现的方法,其中所述推理知识库包括通用公理和域特定的事实。
CN202180054088.3A 2020-09-03 2021-08-31 基于推理的自然语言解释 Pending CN116235163A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US17/011,446 2020-09-03
US17/011,446 US20220067102A1 (en) 2020-09-03 2020-09-03 Reasoning based natural language interpretation
PCT/CN2021/115657 WO2022048535A1 (en) 2020-09-03 2021-08-31 Reasoning based natural language interpretation

Publications (1)

Publication Number Publication Date
CN116235163A true CN116235163A (zh) 2023-06-06

Family

ID=80356706

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180054088.3A Pending CN116235163A (zh) 2020-09-03 2021-08-31 基于推理的自然语言解释

Country Status (5)

Country Link
US (1) US20220067102A1 (zh)
JP (1) JP2023540514A (zh)
CN (1) CN116235163A (zh)
GB (1) GB2614178A (zh)
WO (1) WO2022048535A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220342583A1 (en) * 2021-04-26 2022-10-27 The United States Of America, As Represented By The Secretary Of The Navy Methods and apparatus for data preprocessing

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110060587A1 (en) * 2007-03-07 2011-03-10 Phillips Michael S Command and control utilizing ancillary information in a mobile voice-to-speech application
KR101786987B1 (ko) * 2013-04-19 2017-10-18 엠파이어 테크놀로지 디벨롭먼트 엘엘씨 추론화 태스크를 위한 조잡한 시맨틱 데이터 세트 개선
KR101648961B1 (ko) * 2014-09-19 2016-08-18 네이버 주식회사 검색 질의 내 지식 오류 교정 방법 및 시스템
KR102033395B1 (ko) * 2014-11-20 2019-10-18 한국전자통신연구원 심층 자연어 질문 분석 기반 구조화된 지식베이스 질의응답 시스템 및 그 방법
US11138205B1 (en) * 2014-12-22 2021-10-05 Soundhound, Inc. Framework for identifying distinct questions in a composite natural language query
CN104636478B (zh) * 2015-02-13 2019-12-20 广州神马移动信息科技有限公司 信息查询方法和设备
US11036726B2 (en) * 2018-09-04 2021-06-15 International Business Machines Corporation Generating nested database queries from natural language queries
CN109710737B (zh) * 2018-12-21 2021-01-22 神思电子技术股份有限公司 一种基于结构化查询的智能推理方法
US20220121936A1 (en) * 2019-02-27 2022-04-21 Huawei Technologies Co., Ltd. Neural Network Model Processing Method and Apparatus
RU2019128018A (ru) * 2019-09-05 2021-03-05 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для определения ответа для цифровой задачи, выполняемой в компьютерной краудсорсинговой среде

Also Published As

Publication number Publication date
GB2614178A (en) 2023-06-28
US20220067102A1 (en) 2022-03-03
WO2022048535A1 (en) 2022-03-10
JP2023540514A (ja) 2023-09-25
GB202304503D0 (en) 2023-05-10

Similar Documents

Publication Publication Date Title
US10650356B2 (en) Intelligent self-service delivery advisor
US10726204B2 (en) Training data expansion for natural language classification
US11645470B2 (en) Automated testing of dialog systems
US10929383B2 (en) Method and system for improving training data understanding in natural language processing
US11783131B2 (en) Knowledge graph fusion
US11276099B2 (en) Multi-perceptual similarity detection and resolution
US11416823B2 (en) Resolution and pipelining of helpdesk tickets needing resolutions from multiple groups
US11194963B1 (en) Auditing citations in a textual document
US11727266B2 (en) Annotating customer data
CN112100312A (zh) 从数据源中智能提取因果知识
US11373041B2 (en) Text classification using models with complementary granularity and accuracy
US11797842B2 (en) Identifying friction points in customer data
US20230076923A1 (en) Semantic search based on a graph database
US11062330B2 (en) Cognitively identifying a propensity for obtaining prospective entities
US11640430B2 (en) Custom semantic search experience driven by an ontology
US11694025B2 (en) Cognitive issue description and multi-level category recommendation
WO2022048535A1 (en) Reasoning based natural language interpretation
US20220067051A1 (en) Word embedding quality assessment through asymmetry
US11675980B2 (en) Bias identification and correction in text documents
US20230368510A1 (en) Image grounding with modularized graph attentive networks
US20230316943A1 (en) Cognitive framework for identification of questions and answers
US11899910B2 (en) Multi-location copying and context based pasting
US20230004761A1 (en) Generating change request classification explanations
US20230376537A1 (en) Multi-chunk relationship extraction and maximization of query answer coherence
US11526515B2 (en) Replacing mappings within a semantic search application over a commonly enriched corpus

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination