CN110612525B - 通过使用交流话语树启用修辞分析 - Google Patents

通过使用交流话语树启用修辞分析 Download PDF

Info

Publication number
CN110612525B
CN110612525B CN201880030891.1A CN201880030891A CN110612525B CN 110612525 B CN110612525 B CN 110612525B CN 201880030891 A CN201880030891 A CN 201880030891A CN 110612525 B CN110612525 B CN 110612525B
Authority
CN
China
Prior art keywords
tree
verb
utterance
alternating
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880030891.1A
Other languages
English (en)
Other versions
CN110612525A (zh
Inventor
B·加里斯基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oracle International Corp
Original Assignee
Oracle International Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oracle International Corp filed Critical Oracle International Corp
Publication of CN110612525A publication Critical patent/CN110612525A/zh
Application granted granted Critical
Publication of CN110612525B publication Critical patent/CN110612525B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/322Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/44Statistical methods, e.g. probability models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Human Computer Interaction (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明的系统、设备和方法计算一个或多个句子之间的修辞关系。在示例中,计算机实现的方法访问包括多个片段的句子。至少一个片段包括动词和词语。每个词语都包含片段内的词语的角色。每个片段都是基本话语单元。该方法生成话语树,该话语树表示句子片段之间的修辞关系。话语树包括节点,节点包括非终止节点和终止节点,每个非终止节点表示两个句子片段之间的修辞关系,并且话语树的节点中的每个终止节点与句子片段之一相关联。该方法将具有动词的每个片段与动词签名进行匹配,从而创建交流话语树。

Description

通过使用交流话语树启用修辞分析
相关申请的交叉引用
本申请要求于2017年5月10日提交的美国临时申请No.62/504,377的优先权,该申请通过引用被整体并入本文。
技术领域
本公开一般而言涉及语言学。更具体而言,本公开涉及使用交流话语树(communicative discourse trees)来执行话语分析。
关于在联邦政府赞助的研究与开发下做出的发明的权利的声明
不适用
背景技术
语言学是语言的科学研究。语言学的一方面是将计算机科学应用于人类自然语言,诸如英语。由于处理器的速度和存储器的容量的极大提高,语言学的计算机应用正在增加。例如,启用计算机的对语言话语的分析促进了可以回答来自用户的问题的许多应用,诸如自动化代理。使用“聊天机器人(chatbot)”和代理(agent)来回答问题、促进讨论、管理对话以及提供社交推广(social promotion)越来越流行。为了满足这种需求,已经开发了包括合成语义的广泛技术。此类技术在简单、简短的查询和答复的情况下可以支持自动化代理。
但是,因为现有的解决方案由于修辞分析(rhetorical analysis)不足而无法将答案与问题相匹配,因此此类解决方案无法利用丰富的与话语相关的信息来回答问题、执行对话管理、提供建议或实现“聊天机器人”系统。更具体而言,基于统计的解决方案无法将从句子中确定主题的任务与解决句子和答案之间的修辞一致性(rhetorical agreement)分开。基于统计的解决方案或者根本不考虑问题和响应的修辞结构,或者试图同时解决主题以及修辞一致性,而未能恰当地解决修辞一致性。在没有足够的修辞分析的情况下,可能具有任意修辞结构的问题就无法与也可能具有任意修辞结构的适当的答案相匹配。
因此,需要新的解决方案,这些解决方案可以准确地表示问题和答案之间的修辞一致性。
发明内容
一般而言,本发明的系统、设备和方法与计算一个或多个句子之间的修辞相互关系(rhetorical relationship)相关。在示例中,计算机实现的方法访问包括片段的句子。至少一个片段包括动词和词语。每个词语能够在片段内的多个词内充当角色。每个片段是基本的话语单元。该方法生成话语树,该话语树表示句子片段之间的修辞相互关系。话语树包括节点,节点包括非终止节点和终止节点,每个非终止节点表示两个句子片段之间的修辞相互关系,并且话语树的节点中的每个终止节点与句子片段之一相关联。该方法将具有动词的每个片段与动词签名进行匹配,从而创建交流话语树。
匹配包括访问多个动词签名。每个动词签名包括片段的动词和题元角色(thematic role)序列。该方法为动词签名中的每个动词签名确定相应签名中与片段中的词语的角色匹配的题元角色的数量。该方法基于包括最高数量的匹配的特定动词签名从动词签名中选择该特定动词签名。该方法将特定动词签名与片段相关联。
附图说明
图1示出了根据一方面的示例性修辞分类环境。
图2描绘了根据一方面的话语树的示例。
图3描绘了根据一方面的话语树的进一步示例。
图4描绘了根据一方面的说明性模式。
图5描绘了根据一方面的分层二叉树的节点链接表示。
图6描绘了根据一方面的图5中的表示的示例性缩进文本编码。
图7描绘了根据一方面的关于财产税的示例请求的示例性DT。
图8描绘了对图7中表示的问题的示例性响应。
图9图示了根据一方面的用于官方答案的话语树。
图10图示了根据一方面的用于原始答案的话语树。
图11图示了根据一方面的用于第一代理的声明(claim)的交流话语树。
图12图示了根据一方面的用于第二代理的声明的交流话语树。
图13图示了根据一方面的用于第三代理的声明的交流话语树。
图14图示了根据一方面的解析丛林(parsing thickets)。
图15图示了根据一方面的用于构建交流话语树的示例性处理。
图16图示了根据一方面的话语树和场景图。
图17图示了根据一方面的形成请求-响应对。
图18图示了根据一方面的最大公共子交流话语树。
图19图示了根据一方面的用于交流话语树的内核学习格式的树。
图20图示了根据一方面的用于实现修辞一致性分类器的示例性处理。
图21图示了根据一方面的聊天机器人对帖子进行评论。
图22图示了根据一方面的聊天机器人对帖子进行评论。
图23图示了根据一方面的用于算法文本的话语树。
图24图示了根据一方面的带注释的句子。
图25图示了根据一方面的带注释的句子。
图26图示了根据一方面的对话的话语行为。
图27图示了根据一方面的对话的话语行为。
图28描绘了用于实现这些方面之一的分布式系统的简化图。
图29是根据一方面的系统环境的部件的简化框图,通过该系统环境,可以将方面系统的部件所提供的服务作为云服务供应。
图30图示了其中可以实现本发明的各个方面的示例性计算机系统。
具体实施方式
本文公开的方面提供了对计算机实现的语言学领域的技术改进。更具体而言,本文描述的方面将一个或多个句子之间的修辞相互关系表示在交流话语树中。
“交流话语树”或“CDT”包括补充有交流动作的话语树。交流动作是个人基于相互协商和论证而采取的合作动作。
通过使用交流话语树,本文公开的其它方面实现了可以回答从用户接收到的问题的改进的自动化代理或聊天机器人。通过使用交流话语树,各方面克服了先前系统的局限性,这些先前系统通常无法将从句子中确定主题的任务与解决句子和答案之间的修辞一致性分开。
在示例中,在计算设备上执行的修辞分类应用从用户接收问题。修辞分类应用为该问题生成交流话语树。交流话语树是一种话语树,或者是包含交流动作的话语树。修辞分类应用访问该问题的潜在答案的数据库。通过使用预测模型,修辞一致性应用确定问题和每个潜在答案之间的互补级别。响应于确定互补级别高于阈值,修辞一致性分类器例如经由显示设备向用户提供答案。
与传统的基于统计的方法相比,一些方面的技术优势包括改进的自治代理(诸如聊天机器人)和改进的搜索引擎性能。传统的基于统计关键字的方法或者(i)无法解决问题的主题,或者(ii)无法解决问题与答案之间的修辞一致性。因此,现有的自治代理解决方案仅能够对用户问题进行脚本化或有限的响应。这样的解决方案无法确定答案是否完全响应问题。
例如,本文描述的方面使用交流话语树。交流话语树将修辞信息与交流动作组合在一起。通过集成识别交流动作的标签,交流话语树的学习可以发生在更丰富的特征集上而不仅仅是基本话语单元(EDU)的语法和修辞关系(relation)上。通过这种特征集,可以使用诸如分类之类的附加技术来确定问题与答案或请求-响应对之间的修辞一致性级别,从而实现改进的自动化代理。通过这样做,计算系统实现能够智能地回答问题和其它消息的自治代理。
某些定义
如本文所使用的,“修辞结构理论”是提供了可以分析话语的连贯性的理论基础的研究和学习领域。
如本文所使用的,“话语树”或“DT”是指表示句子的一部分的句子的修辞关系的结构。
如本文中所使用的,“修辞关系”、“修辞相互关系”或“连贯关系”或“话语关系”是指话语的两个段在逻辑上如何彼此连接。修辞关系的示例包括阐述、对比和归因。
如本文所使用的,“句子片段”或“片段”是可以从句子的其余部分分开的句子的一部分。片段是基本话语单元。例如,对于句子“Dutch accident investigators say thatevidence points to pro-Russian rebels as being responsible for shooting downthe plane”,两个片段是“Dutch accident investigators say that evidence pointsto pro-Russian rebels”和“as being responsible for shooting down the plane”。片段可以但不必包含动词。
如本文所使用的,“签名”或“框架”是指片段中动词的属性。每个签名可以包括一个或多个题元角色。例如,对于片段“Dutch accident investigators say that evidencepoints to pro-Russian rebels”,动词是“say”并且动词“say”的这种特殊用法的签名可以为“代理动词主题(agent verb topic)”,其中“investigators”是代理,并且“evidence”是主题。
如本文所使用的,“题元角色”是指签名中的用于描述一个或多个词语的角色的组成部分。继续前面的示例,“代理”和“主题”是题元角色。
如本文中所使用的,“核性(nuclearity)”是指哪个文本段、片段或区段(span)对于作者的目的更为中心。核心(nucleus)是更中心的区段,而卫星(satellite)是更不中心的区段。
如本文所使用的,“连贯性(coherency)”是指将两个修辞关系链接在一起。
如本文所使用的,“交流动词(communicative verb)”是指示交流的动词。例如,动词“deny(否认)”是交流动词。
如本文所使用的,“交流动作(communicative action)”描述了由一个或多个代理和代理的主体执行的动作。
图1示出了根据一方面的示例性修辞分类环境。图1描绘了修辞分类计算设备101、输入问题130、输出问题150、数据网络104、服务器160和移动设备170。修辞分类计算设备101包括修辞分类应用102、答案数据库105、修辞一致性分类器120和训练数据125中的一个或多个。修辞分类应用102包括问题交流话语树110、答案交流话语树110中的一个或多个。
移动设备170可以是任何移动设备,诸如移动电话、智能电话、平板电脑、笔记本电脑、智能手表等。移动设备170经由数据网络104与服务器160或修辞分类计算设备101通信。以这种方式,移动设备170可以例如从用户向服务器160或修辞分类计算设备101提供问题171。在示例中,修辞分类计算设备101确定合适的答案172,并通过数据网络104将答案172提供给移动设备170。
数据网络104可以是任何公共或私有网络、有线或无线网络、广域网、局域网或互联网。
在示例中,修辞分类应用102回答经由聊天接收到的问题。更具体而言,修辞分类应用102接收输入问题130,其可以是单个问题或诸如聊天之类的问题流。修辞分类应用102创建问题交流话语树110并选择一个或多个候选答案。可以从现有数据库(诸如答案数据库105)或从通过数据网络104通信的服务器160获得答案。服务器160可以是公共或私有互联网服务器,诸如用户问题和答案的公共数据库。
修辞分类应用102根据候选答案确定最合适的答案。如本文进一步解释的,可以使用不同的方法。在一方面,修辞分类应用102可以为每个候选答案创建候选答案交流话语树,并且将问题交流话语树110与每个候选话语树进行比较。修辞分类应用102识别问题交流话语树和候选答案交流话语树之间的最佳匹配。修辞分类应用102然后针对来自最佳交流话语树的文本访问或查询数据库。修辞分类应用102然后将与第二交流话语树相关联的文本发送到移动设备。
在另一方面,修辞分类应用102为每个候选答案创建答案交流话语树111。修辞分类应用102然后针对每个候选答案创建包括问题130和候选答案的问题-答案对。
修辞分类应用102将问题-答案对提供给预测模型,诸如修辞一致性分类器120。通过使用经训练的修辞一致性分类器120,修辞分类应用102确定问题-答案对是否高于匹配的阈值级别,例如指示答案是否解决问题。如果答案没有解决问题,则修辞分类应用102继续分析包括该问题和不同答案的其它对,直到找到合适的答案为止。通过使用交流话语树,可以准确地对问题和答案之间的修辞一致性和交流动作进行建模。
修辞分类应用102提供答案作为输出答案150。例如,如图1所示,由修辞分类应用102实现的代理响应于涉及两个用户讨论大声唱歌的聊天历史而提供了文本“here is myown personal list of songs(这是我个人的歌曲列表)”。
修辞结构理论与话语树
语言学是语言的科学研究。例如,语言学可以包括句子的结构(句法),例如,主语-动词-宾语;句子的含义(语义学),例如,狗咬人与人咬狗;以及说话者在会话中做什么,即,句子之外的话语分析或语言分析。
话语的理论基础——修辞结构理论(RST)可以归功于Mann,William和Thompson,Sandra,“Rhetorical structure theory:A Theory of Text organization”,Text-Interdisciplinary Journal for the Study of Discourse,8(3):243–281,1988。类似于编程语言理论的语法和语义如何帮助实现现代软件编译器,RST帮助实现了话语的分析。更具体而言,RST在至少两个层次上放置结构块,诸如核性和修辞关系的第一层次,以及结构或模式的第二层次。话语解析器或其它计算机软件可以将文本解析成话语树。
修辞结构理论对文本的逻辑组织进行建模,文本的逻辑组织是由作者采用的结构,它依赖于文本的各部分之间的关系。RST通过经由话语树形成文本的分层连接结构来模拟文本连贯性。修辞关系被分为协调(coordinate)和从属(subordinate)类别;这些关系跨两个或更多个文本区段保持,因此实现了连贯性。这些文本区段被称为基本话语单元(EDU)。句子中的子句和文本中的句子由作者逻辑连接。给定句子的含义与之前和之后的句子的含义相关。子句之间的这种逻辑关系被称为文本的连贯结构。RST是最流行的话语理论之一,它基于树状的话语结构——话语树(DT)。DT的叶子对应于EDU,即连续的原子文本区段。相邻的EDU通过连贯关系(例如,归因、顺序)相连,从而形成更高级别的话语单元。然后,这些单元也受此关系链接的约束。通过关系而链接的EDU然后基于其相对重要性来区分:核心是关系的核部分,而卫星是外围部分。如所讨论的,为了确定准确的请求-响应对,主题和修辞一致性两者都被分析。当说话者回答问题,诸如短语或句子时,说话者的答案应针对该问题的主题。在经由消息的种子文本隐式提出问题的情况下,不仅维持主题而且还与该种子的广义认知状态匹配的适当答案是期望的。
修辞关系
如所讨论的,本文描述的方面使用交流话语树。修辞关系可以用不同的方式描述。例如,Mann和Thompson描述了23种可能的关系。C.Mann,William和Thompson,Sandra(1987)(“Mann and Thompson”)。Rhetorical Structure Theory:A Theory of TextOrganization。其它数量的关系也是可能的。
一些经验研究假设大多数文本是使用核心-卫星关系构造的。参见Mann和Thompson。但是其它关系并没有承载对核心的明确选择。此类关系的示例如下所示。
关系名称 区段 其它区段
对比 一个替代物 另一个替代物
联合 (不受约束) (不受约束)
列表 项目 下一项目
序列 项目 下一项目
图2描绘了根据一方面的话语树的示例。图2包括话语树200。话语树包括文本区段201、文本区段202、文本区段203、关系210和关系228。图2中的数字对应于三个文本区段。图3对应于以下具有编号为1、2、3的三个文本区段的示例文本:
1.Honolulu,Hawaii will be site of the 2017Conference on HawaiianHistory(夏威夷火奴鲁鲁将成为2017年夏威夷历史大会的举办地)
2.It is expected that 200historians from the U.S.and Asia will attend(预计将有来自美国和亚洲的200名历史学家参加)
3.The conference will be concerned with how the Polynesians sailed toHawaii(会议将关注波利尼西亚人如何航行到夏威夷)
例如,关系210(或阐述)描述了文本区段201和文本区段202之间的相互关系。关系228描绘了文本区段203和204之间的相互关系(阐述)。如所绘出的,文本区段202和203进一步阐述文本区段201。在上面的示例中,给定向读者通知会议的目标,文本区段1是核心。文本区段2和3提供关于会议的更多详细信息。在图2中,水平数字(例如,1-3、1、2、3)覆盖文本的(可能由进一步的区段组成的)区段;垂直线指示一个或多个核心;并且曲线表示修辞关系(阐述)并且箭头的方向从卫星指向核心。如果文本区段仅用作卫星而不用作核心,则删除该卫星仍将留下连贯的文本。如果从图2中删除核心,那么文本区段2和3将难以理解。
图3描绘了根据一方面的话语树的另一个示例。图3包括组成部分301和302、文本区段305-307、关系310和关系328。关系310描绘了组成部分306和305以及307和305之间的相互关系310——使能。图3涉及以下文本区段:
1.The new Tech Report abstracts are now in the journal area of thelibrary near the abridged dictionary.(现在新的技术报告摘要在图书馆的靠近缩减词典的期刊区域中。)
2.Please sign your name by any means that you would be interested inseeing.(请以任何您有兴趣看到的方式签署您的名字。)
3.Last day for sign-ups is 31May.(签署的最后一天是5月31日。)
如可以看到的,关系328描绘了实体307和306之间相互关系(该相互关系是使能)。图3图示了虽然核心可以被嵌套,但是仅存在一个最核心的文本区段。
构造话语树
话语树可以使用不同的方法生成。自底向上构造DT的方法的简单示例是:
(1)通过以下方式将话语文本划分为单元:
(a)单元大小取决于分析的目标可以不同
(b)典型地,单元是子句
(2)检查每个单元及其邻居。它们之间保持关系吗?
(3)如果是,则标记该关系。
(4)如果不是,则该单元可能位于更高级别关系的边界处。查看较大单元(区段)之间保持的关系。
(5)继续,直到考虑了文本中的所有单元。
Mann和Thompson还描述了第二级别的构建块结构,称为模式应用。在RST中,修辞关系不直接映射到文本上;它们被装配到称为模式应用的结构上,并且这些结构又被装配到文本。模式应用是从称为模式的更简单的结构派生的(如图4所示)。每个模式指示如何将文本的特定单元分解成其它更小的文本单元。修辞结构树或DT是模式应用的分层系统。模式应用链接多个连续的文本区段,并创建复杂的文本区段,该复杂的文本区段又可以由更高级别的模式应用链接。RST断言,每个连贯话语的结构都可以由单个修辞结构树来描述,该单个修辞结构树的顶部模式创建涵盖整个话语的区段。
图4描绘了根据一方面的说明性模式。图4示出了联合模式是由核心组成的项目列表而没有卫星。图4描绘了模式401-406。模式401描绘了文本区段410和428之间的环境关系。模式402描绘了文本区段420和421之间的序列关系以及文本区段421和422之间的序列关系。模式403描绘了文本区段430和431之间的对比关系。模式404描绘了文本区段440和441之间的联合相互关系。模式405描绘了450和451之间的动机相互关系,以及452和451之间的使能相互关系。模式406描绘了文本区段460和462之间的联合相互关系。图4中示出了以下三个文本区段的联合模式的示例:
1.Skies will be partly sunny in the New York metropolitan area today.(今天纽约都会区的天空将部分晴朗。)
2.It will be more humid,with temperatures in the middle 80’s.(天气会更加潮湿,温度在80中部)
3.Tonight will be mostly cloudy,with the low temperature between 65and 70.(今晚将大部分多云,低温在65至70之间。)
虽然图2-4描绘了话语树的一些图形表示,但其它表示也是可能的。
图5描绘了根据一方面的分层二叉树的节点链接表示。如从图5中可以看到的,DT的叶子对应于称为基本话语单元(EDU)的连续非重叠文本区段。相邻的EDU通过关系(例如,阐述、归因...)连接并形成更大的话语单元,这些单元也通过关系连接。“RST中的话语分析涉及两个子任务:话语分割是识别EDU的任务,并且话语解析是将话语单元链接到标记树中的任务”。参见Joty,Shafiq R和Giuseppe Carenini,Raymond T Ng和YasharMehdad.2013。Combining intra-and multi-sentential rhetorical parsing fordocument-level discourse analysis。In ACL(1),第486-496页。
图5描绘了作为树上的叶子或终止节点的文本区段,每个按它们在全文本中出现的顺序编号,如图6所示。图5包括树500。树500包括例如节点501-507。节点指示相互关系。节点是非终止节点(诸如节点501),或者是终止节点(诸如节点502-507)。如可以看到的,节点503和504通过联合相互关系而相关。节点502、505、506和508是核心。虚线指示分支或文本区段是卫星。关系是灰色框中的节点。
图6描绘了根据一方面的图5中的表示的示例性缩进文本编码。图6包括文本600和文本序列602-604。文本600以更适合计算机编程的方式呈现。文本序列602对应于节点502,序列603对应于节点503,并且序列604对应于节点504。在图6中,“N”指示核心,并且“S”指示卫星。
话语解析器的示例
自动话语分割可以用不同的方法来执行。例如,给定一个句子,分割模型通过预测是否应在句子中的每个特定符号(token)之前插入边界来识别复合基本话语单元的边界。例如,一个框架顺序且独立地考虑句子中的每个符号。在这个框架中,分割模型逐个符号地扫描句子,并使用二进制分类器(诸如支持向量机或逻辑回归)来预测在正被检查的符号之前插入边界是否是合适的。在另一个示例中,任务是顺序标记难题。一旦将文本分割为基本话语单元,就可以执行句子级别话语解析,以构造话语树。可以使用机器学习技术。
在本发明的一个方面,使用了两个修辞结构理论(RST)话语解析器:依赖于组成语法的CoreNLPProcessor,以及使用依赖性语法的FastNLPProcessor。参见Surdeanu,Mihai和Hicks,Thomas和Antonio Valenzuela-Escarcega,Marco。Two Practical RhetoricalStructure Theory Parsers(2015)。
此外,以上两个话语解析器,即,CoreNLPProcessor和FastNLPProcessor使用自然语言处理(NLP)进行句法解析。例如,Stanford CoreNLP给出了词语的基本形式、它们的言语的部分、它们是否是公司、人员的名称等;对日期、时间和数值量进行规范化;根据短语和句法依赖性标记句子的结构;指示哪些名词短语指代相同的实体。实际上,RST仍然是在许多话语的情况下可能工作但在一些情况下可能不工作的理论。存在许多变量,包括但不限于,连贯文本中有哪些EDU,即,使用了什么样的话语分割器、使用了哪些关系清单以及为EDU选择了哪些关系、用于训练和测试的文档的语料库,以及甚至使用了什么解析器。因此,例如,在上面引用的Surdeanu等人的“Two Practical Rhetorical Structure TheoryParsers”中,必须使用专用的度量对特定的语料库进行测试,以确定哪个解析器给出更好的性能。因此,与给出可预测结果的计算机语言解析器不同,话语解析器(和分段器)可能取决于训练和/或测试文本语料库给出不可预测的结果。因此,话语树是可预测领域(例如,编译器)和不可预测领域(例如,像化学一样需要进行实验来确定哪些组合将给你期望结果)的混合。
为了客观地确定话语分析的质量,正在使用一系列度量,例如来自Daniel Marcu,“The Theory and Practice of Discourse Parsing and Summarization”,MIT Press,(2000)的精确度(Precision)/查全率(Recall)/F1度量。精确度或正预测值是检索到的实例当中相关实例所占的比例,而查全率(也称为敏感度)是在相关实例的总数内已被检索的相关实例所占的比例。因此,精确度和查全率两者都基于对相关性的理解和量度。假设用于识别照片中的狗的计算机程序在包含12条狗和一些猫的图片中识别出8条狗。在识别出的八条狗中,五条实际上是狗(真阳性),而其余的是猫(假阳性)。该程序的精确度为5/8,而它的查全率为5/12。当搜索引擎返回30页,其中只有20页是相关的,而未能返回40个附加的相关页时,其精确度为20/30=2/3,而其查全率为20/60=1/3。因此,在这种情况下,精确度是“搜索结果的有用程度”,并且查全率是“结果的完整程度”。F1分数(也称为F-分数或F-量度)是测试的准确性的量度。它考虑了测试的精确度和查全率二者来计算分数:F1=2×((精确度×查全率)/(精确度+查全率))并且是精确度和查全率的调和平均值。F1分数在1达到最佳值(完美的精确度和查全率),在0为最差值。
自治代理或聊天机器人
人类A和人类B之间的会话是一种话语的形式。例如,存在诸如Messenger、/>SMS等应用,除了较传统的电子邮件和语音会话之外,A和B之间的会话典型地还可以经由消息进行。聊天机器人(也可以称为智能机器人或虚拟助手等)是例如取代人类B并在各种程度上模仿两个人类之间的会话的“智能”机器。示例最终目标是,人类A不能分辨出B是人类还是机器(由Alan Turing在1950年开发的图灵测试)。话语分析、包括机器学习在内的人工智能,以及自然语言处理已在通过图灵测试的长期目标方面取得了很大的进步。当然,随着计算机越来越具有搜索和处理大量数据储存库以及对数据执行复杂分析以包括预测分析的能力,长期目标是使聊天机器人像人一样并且与计算机组合。
例如,用户可以通过会话交互与智能机器人平台交互。也称为会话用户界面(UI)的这种交互是最终用户和聊天机器人之间的对话,就像两个人类之间的对话一样。它可能很简单,就像最终用户对聊天机器人说“Hello”,然后聊天机器人以“Hi”响应并询问用户是否需要帮助,或者可以是银行聊天机器人中的交易交互,诸如将资金从一个账户转移到另一个账户,或者在HR聊天机器人中的信息交互,诸如检查剩余假期,或者在零售聊天机器人中的询问FAQ,诸如如何处理退货。自然语言处理(NLP)和机器学习(ML)算法与其它方法的结合可以用于对最终用户意图进行分类。高级别的意图是最终用户想要完成的目标(例如,获得账户余额、进行购买)。意图本质上是客户输入到后端应执行的工作单元的映射。因此,基于用户在聊天机器人中说出的短语,将它们映射到特定且离散的用例或工作单元,例如,检查余额、转移资金和跟踪支出都是聊天机器人应支持的“用例”,并能够从最终用户以自然语言键入的自由文本条目中计算出应触发哪个工作单元。
使AI聊天机器人像人类一样做出响应的基本原则是人类大脑可以制定和理解请求,然后对人类请求给出比机器好得多的响应。因此,如果模仿人类B,那么聊天机器人的请求/响应应该有显著改善。因此,难题的最初部分是人类大脑如何制定和理解请求?为了模仿,使用模型。RST和DT允许以正式且可重复的方式完成这一点。
在高级别上,通常有两种类型的请求:(1)执行某个动作的请求;(2)对信息的请求,例如,问题。第一种类型具有其中创建工作单元的响应。第二种类型具有例如对该问题的良好答案的响应。例如,在一些方面,答案可以采取以下形式:AI从其广泛的(一个或多个)知识库中构造答案,或者通过搜索互联网或内联网或其它公共/私有可用数据源来匹配最佳现有答案。
交流话语树和修辞分类器
本公开的各方面构建交流话语树,并使用交流话语树来分析请求或问题的修辞结构是否与答案一致。更具体而言,本文描述的方面创建请求-响应对的表示、学习该表示,并将这些对关联为有效对或无效对的类别。以这种方式,自治代理可以从用户接收问题、例如通过搜索多个答案来处理问题、从这些答案中确定最佳答案,并将该答案提供给用户。
更具体而言,为了表示文本的语言特征,本文描述的方面使用修辞关系和言语行为(或交流动作)。修辞关系是句子的各部分之间的相互关系,典型地是从话语树中获得的。言语行为是从动词资源(诸如VerbNet)中作为动词获得的。通过使用修辞关系和交流动作两者,本文所述的方面可以正确地识别有效的请求-响应对。为了这样做,各方面将问题的句法结构与答案的句法结构关联。通过使用该结构,可以确定更好的答案。
例如,当自治代理从人接收到该人希望出售具有某些特征的项目的指示时,自治代理应提供不仅包含这些特征而且还指示购买的意图的搜索结果。以这种方式,自治代理已确定用户的意图。类似地,当自治代理从人接收到共享关于特定项目的知识的请求时,搜索结果应包含接收推荐的意图。当人向自主代理请求关于某个题目的意见时,自主代理分享关于该题目的意见,而不是征求其它意见。
分析请求和响应对
图7描绘了根据一方面的关于财产税的示例请求的示例性DT。节点标签是关系并且箭头线指向卫星。核心是实线。图7描绘了以下文本。
请求:“My husbands’grandmother gave him his grandfather’s truck.Shesigned the title over but due to my husband having unpaid fines on hislicense,he was not able to get the truck put in his name.I wanted to put inmy name and paid the property tax and got insurance for the truck.By the timeit came to sending off the title and getting the tag,I didn't have the moneyto do so.Now,due to circumstances,I am not going to be able to afford thetruck.I went to the insurance place and was refused a refund.I am justwondering that since I am not going to have a tag on this truck,is itpossible to get the property tax refunded?”(“我丈夫的祖母给了他他祖父的卡车。她把车契迁过来了,但是由于我丈夫在他的许可证上有没有支付的罚款,所以他无法以他的名字认领卡车。我想写上我的名字,缴纳财产税,并为这辆卡车买了保险。到发送车契和获得标签的时候,我没有钱这样做。现在,由于某些情况,我将无法负担得起这辆卡车。我去了保险处并且被拒绝退款。我只是想知道既然我不会在这辆卡车上贴上标签,是否可以退还财产税?”)
响应:“The property tax is assessed on property that you own.Justbecause you chose to not register it does not mean that you don't own it,sothe tax is not refundable.Even if you have not titled the vehicle yet,youstill own it within the boundaries of the tax district,so the tax ispayable.Note that all states give you a limited amount of time to transfertitle and pay the use tax.If you apply late,there will be penalties on top ofthe normal taxes and fees.You don't need to register it at the same time,butyou absolutely need to title it within the period of time stipulated in statelaw.”(“财产税是对您拥有的财产征收的。仅仅因为您选择不注册就并不意味着您不拥有它,因此该税款不予退还。即使您尚未取得车辆的契书,您仍然在税区范围内拥有它,因此应缴税。请注意,所有州都给您有限的时间转让所有权和支付使用税。如果您延迟申请,除了正常的税费之外还会受到罚款。您不需要同时注册,但是您绝对需要在州法律规定的期限内为其办理车契。”)
如从图7中可以看到的,分析上面的文本将得出以下结果。“My husbands’grandmother gave him his grandfather’s truck”通过“She signed the title overbut due to my husband”进行阐述,后者又通过“having unpaid fines on his license,he was not able to get the truck put in his name”进行阐述,这又通过“I wantedto put in my name”、“and paid the property tax”和“and got insurance for thetruck”进行阐述。
“My husbands’grandmother gave him his grandfather’s truck.She signedthe title over but due to my husband having unpaid fines on his license,hewas not able to get the truck put in his name.I wanted to put in my name andpaid the property tax and got insurance for the truck”通过以下进行阐述:
“I didn't have the money”,这又通过“to do so”进行阐述,后者与“By thetime”对比,“By the time”通过“it came to sending off the title”“and getting thetag”进行阐述,
“My husbands’grandmother gave him his grandfather’s truck.She signedthe title over but due to my husband having unpaid fines on his license,hewas not able to get the truck put in his name.I wanted to put in my name andpaid the property tax and got insurance for the truck.By the time it came tosending off the title and getting the tag,I didn't have the money to do so”与以下形成对比:
“Now,due to circumstances”,其通过“I am not going to be able to affordthe truck”进行阐述,后者通过以下阐述:
“I went to the insurance place”
“and was refused a refund”。
“My husbands’grandmother gave him his grandfather’s truck.She signedthe title over but due to my husband having unpaid fines on his license,hewas not able to get the truck put in his name.I wanted to put in my name andpaid the property tax and got insurance for the truck.By the time it came tosending off the title and getting the tag,I didn't have the money to doso.Now,due to circumstances,I am not going to be able to afford the truck.Iwent to the insurance place and was refused a refund”通过以下阐述:
“I am just wondering that since I am not going to have a tag on thistruck,is it possible to get the property tax refunded?”
“I am just wondering”归因于:
“that”与“is it possible to get the property tax refunded?”是相同的单元,后者的条件为“since I am not going to have a tag on this truck”。
如可以看到的,该主题的主要题目是“Property tax on a car”。问题包括矛盾:一方面,所有财产都应交税,另一方面,所有权有些不完整。一个良好的响应必须既解决问题的主题又澄清不一致性。为了做到这一点,响应者就拥有的财产纳税的必要性做出更强烈的声明,而无论财产的注册状态如何。这个示例是我们的Yahoo!Answers评估领域中正面培训集的成员。主题的主要题目是“Property tax on a car”。问题包括矛盾:一方面,所有财产都应交税,另一方面,所有权有些不完整。良好的答案/响应必须既解决问题的主题又澄清不一致性。读者可以观察到,由于问题包括对比的修辞关系,因此答案必须将它与类似的关系匹配才能令人信服。否则,即使对于那些不是领域专家的人来说,这个答案看起来也不完整。
图8描绘了根据本发明的某些方面的对图7中表示的问题的示例性响应。中心核心是“the property tax is assessed on property”,其通过“that you own”进行阐述。“The property tax is assessed on property that you own”也是通过“Just becauseyou chose to not register it does not mean that you don't own it,so the taxis not refundable.Even if you have not titled the vehicle yet,you still ownit within the boundaries of the tax district,so the tax is payable.Note thatall states give you a limited amount of time to transfer title and pay theuse tax.”来阐述的核心。
核心:“The property tax is assessed on property that you own.Justbecause you chose to not register it does not mean that you don't own it,sothe tax is not refundable.Even if you have not titled the vehicle yet,youstill own it within the boundaries of the tax district,so the tax ispayable.Note that all states give you a limited amount of time to transfertitle and pay the use tax.”通过以下阐述:“there will be penalties on top ofthe normal taxes and fees”,其具有条件:“If you apply late”,这又通过“but youabsolutely need to title it within the period of time stipulated in statelaw”和“You don't need to register it at the same time”的对比来阐述。
比较图7的DT和图8的DT,可以确定响应(图8)与请求(图7)的匹配程度。在本发明的一些方面,以上框架至少部分地用于确定用于请求/响应的DT以及DT之间的修辞一致性。
在另一个示例中,问题“What does The Investigative Committee of theRussian Federation do”(“俄罗斯联邦调查委员会做什么”)至少有两个答案,例如,官方答案或实际答案。
图9图示了根据一方面的用于官方答案的话语树。如图9所绘出的,官方答案或任务语句指出:“The Investigative Committee of the Russian Federation is the mainfederal investigating authority which operates as Russia's Anti-corruptionagency and has statutory responsibility for inspecting the police forces,combating police corruption and police misconduct,is responsible forconducting investigations into local authorities and federal governmentalbodies”(“俄罗斯联邦调查委员会是主要的联邦调查机构,它是俄罗斯的反腐败机构、具有法定职责、负责检查警察、打击警察腐败和警察不当行为,并负责对地方当局和联邦政府机构进行调查”)。
图10图示了根据一方面的用于原始答案的话语树。如图10所绘出的,另一个也许更为诚实的答案指出:“Investigative Committee of the Russian Federation issupposed to fight corruption.However,top-rank officers of the InvestigativeCommittee of the Russian Federation are charged with creation of a criminalcommunity.Not only that,but their involvement in large bribes,moneylaundering,obstruction of justice,abuse of power,extortion,and racketeeringhas been reported.Due to the activities of these officers,dozens of high-profile cases including the ones against criminal lords had been ultimatelyruined.”(“俄罗斯联邦调查委员会本应打击腐败。但是,俄罗斯联邦调查委员会的高级官员被控建立犯罪社区。不仅如此,据报道他们还参与了大贿赂、洗钱、妨碍司法、滥用权力、勒索和敲诈勒索。由于这些官员的活动,数十起备受瞩目的案件,包括针对领主的案件,最终被毁了”)。
答案的选择取决于上下文。修辞结构允许区分“官方”、“政治上正确”、基于模板的答案和“实际”、“原始”、“来自现场的报告”或“争议性”答案。(参见图9和图10)。有时,问题本身可以给出关于预期的答案的类别的提示。如果问题被表述为事实或定义性问题,而没有第二含义,那么第一类别的答案是合适的。否则,如果问题具有“告诉我现实是什么”的含义,那么第二类别是合适的。一般而言,在从问题中提取修辞结构之后,选择具有相似、匹配或互补的修辞结构的合适答案就更容易。
官方答案是基于阐述和联合,这在文本可能包含争议性方面是中立的(参见图9)。同时,原始答案包括对比关系。这种关系在期望特工做的和发现特工所为的短语之间被提取。
请求-响应对的分类
修辞分类应用102可以确定给定的答案或响应,诸如从答案数据库105或公共数据库获得的答案,是否响应于给定的问题或请求。更具体而言,修辞分类应用102通过确定请求和响应之间的(i)相关性或(ii)修辞一致性中的一者或两者来分析请求和响应对是正确还是不正确。修辞一致性可以在不考虑相关性的情况下进行分析,相关性可以被正交处理。
修辞分类应用102可以使用不同的方法来确定问题-答案对之间的相似性。例如,修辞分类应用102可以确定个别问题和个别答案之间的相似度级别。替代地,修辞分类应用102可以确定包括问题和答案的第一对以及包括问题和答案的第二对之间的相似性的量度。
例如,修辞分类应用102使用经训练以预测匹配或不匹配答案的修辞一致性分类器120。修辞分类应用102可以一次处理两个对,例如<q1,a1>和<q2,a2>。修辞分类应用102将q1与q2进行比较,并将a1与a1进行比较,从而产生组合的相似度分数。这样的比较允许通过评估与具有已知标签的另一个问题/答案对的距离来确定未知问题/答案对是否包含正确答案。具体地,可以处理未标签的对<q2,a2>,使得不是基于由q2和a2共享的词语或结构来“猜测”正确性,而是可以关于这样的词语或结构将q2和a2两者与已标签的对<q2,a2>的对应分量q1和a2进行比较。因为这种方法的目标是对答案的与领域无关的分类,因此只能利用问题和答案之间的结构凝聚力,而不是答案的“含义”。
在一方面,修辞分类应用102使用训练数据125来训练修辞一致性分类器120。以这种方式,修辞一致性分类器120被训练为确定问题和答案对之间的相似性。这是分类问题。训练数据125可以包括正面训练集和负面训练集。训练数据125包括在正面数据集中的匹配请求-响应对和在负面数据集中的任意或较低相关性或任意或较低适当性的请求-响应对。对于正面数据集,选择具有不同接受标准的各种领域,这些领域指示答案或响应是否适合该问题。
每个训练数据集包括一组训练对。每个训练集包括表示问题的问题交流话语树和表示答案的答案交流话语树以及问题和答案之间的预期互补级别。通过使用迭代处理,修辞分类应用102向修辞一致性分类器120提供训练对,并从该模型接收互补级别。修辞分类应用102通过针对特定训练对确定所确定的互补级别与预期的互补级别之间的差异来计算损失函数。基于损失函数,修辞分类应用102调整分类模型的内部参数以最小化损失函数。
接受标准可以因应用而异。例如,对于社区问题回答、自动问题回答、自动化和手动客户支持系统、社交网络通信以及诸如消费者之类的个人关于其产品体验的书写(诸如评论和投诉),接受标准可能低。RR接受标准在科学文本、专业新闻、健康和法律文件(以FAQ的形式)、专业社交网络(诸如“stackoverflow”)中可能高。
交流话语树(CDT)
修辞分类应用102可以创建、分析和比较交流话语树。交流话语树被设计为将修辞信息与言语行为结构组合。CDT包含弧线,该弧线标记有用于交流动作的表达式。通过组合交流动作,CDT启用对RST关系和交流动作的建模。CDT是解析丛林的简化。参见Galitsky,B,Ilvovsky,D.和Kuznetsov SO.Rhetoric Map of an Answer to Compound QueriesKnowledge Trail Inc.ACL 2015,681–686.(“Galitsky 2015”)。解析丛林是句子的解析树的组合,这些句子的词语和部分之间在一个图中具有话语级别相互关系。通过合并识别言语动作的标签,交流话语树的学习可以在比仅基本话语单元(EDU)的修辞关系和语法更丰富的特征集上发生。
在示例中,分析了三方之间关于商业客机(即马来西亚航空航班17)坠机原因的争议。建立了所传达的论元(argument)的RST表示。在该示例中,三个冲突代理,即,荷兰调查员、俄罗斯联邦调查委员会和自称的顿涅茨克人民共和国,就此事交换了他们的意见。该示例图示了争议性冲突,其中各方都尽其所能责怪其对方。为了听起来更有说服力,各方不仅提出自己的声明,而且以拒绝对方声明的方式作出回应。为了实现这一目标,各方都试图匹配对方的声明的风格和话语。
图11图示了根据一方面的用于第一代理的声明的交流话语树。
图11描绘了交流话语树100,该树表示以下文本:“Dutch accidentinvestigators say that evidence points to pro-Russian rebels as beingresponsible for shooting down plane.The report indicates where the missilewas fired from and identifies who was in control of the territory and pinsthe downing of MH17 on the pro-Russian rebels”(“荷兰事故调查员说,有证据表明亲俄罗斯叛乱分子是负责击落飞机的人。该报告指出了导弹的发射地点,并确定谁控制了该领土,并将MH17的下落钉在亲俄罗斯叛乱分子身上”)。
如从图11可以看到的,CDT的非终止节点是修辞关系,并且终止节点是作为这些关系的主体的基本话语单元(短语、句子片段)。CDT的某些弧线标记有用于交流动作的表达式,包括行动者代理和这些动作的主体(正在传达的内容)。例如,用于阐述关系的核心节点(在左侧)被标记有say(Dutch,evidence),并且卫星被标记有responsible(rebels,shooting down)。这些标签并不旨在表达EDU的主体是evidence和shooting down,而是为了使该CDT与其它CDT匹配,以便找到它们之间的相似性。在这种情况下,仅通过修辞关系将这些交流动作链接起来而不提供交流话语的信息将太有限,而不能表示所传达的内容和传达的方式的结构。对RR要具有相同或协调的修辞关系的要求太弱,因此需要匹配的节点的顶部上的弧线的CDT标签的一致性。
该图的直边是句法关系,并且弯曲的弧线是话语关系,诸如指代(anaphora)、相同实体、子实体、修辞关系和交流动作。该图包含比用于各个句子的分析树的组合更丰富的信息。除了CDT之外,解析丛林还可以在词语、关系、短语和句子的级别进行泛化(generalization)。言语动作是表达各个言语行为及其主体所涉及的代理的逻辑谓词。如由诸如VerbNet之类的框架所提出的,逻辑谓词的论元根据各自的语义角色形成。参见Karin Kipper、Anna Korhonen、Neville Ryant、Martha Palmer,A Large-scaleClassification of English Verbs,Language Resources and Evaluation Journal,42(1),pp.21-40,Springer Netherland,2008和/或Karin Kipper Schuler,Anna Korhonen,Susan W.Brown,VerbNet overview,extensions,mappings and apps,Tutorial,NAACL-HLT 2009,Boulder,Colorado。
图12图示了根据一方面的用于第二代理的声明的交流话语树。
图12描绘了交流话语树1200,该树表示以下文本:“The InvestigativeCommittee of the Russian Federation believes that the plane was hit by amissile,which was not produced in Russia.The committee cites an investigationthat established the type of the missile”(“俄罗斯联邦调查委员会认为,这架飞机被一枚导弹击中,该导弹不是俄罗斯生产的。该委员会引用了一项调查,该调查确定了导弹的类型”)。
图13图示了根据一方面的用于第三代理的声明的交流话语树。图13描绘了交流话语树1300,该树表示以下文本:“Rebels,the self-proclaimed Donetsk People'sRepublic,deny that they controlled the territory from which the missile wasallegedly fired.It became possible only after three months after the tragedyto say if rebels controlled one or another town”(“自称为顿涅茨克人民共和国的叛乱分子否认控制了据称发射导弹的领土。悲剧发生三个月后才有可能说叛军是否控制了一个或另一个城镇”)。
如从交流话语树1100-1300可以看到的,响应不是任意的。响应谈及与原始文本相同的实体。例如,交流话语树1200和1300与交流话语树1100相关。响应支持关于这些实体以及关于这些实体的动作的估计和观点的不一致。
更具体而言,所涉及代理的答复需要反映第一种子消息的交流话语。作为简单的观察,由于第一代理使用归因来传达其声明,因此其它代理必须遵循这套声明,或者提供其自己的归因或者攻击支持者的归因的有效性,或者两者兼而有之。为了捕获各种各样的特征以用于需要如何在连续消息中保留种子消息的交流结构,可以学习相应CDT的对。
为了验证请求-响应的一致性,仅话语关系或言语行为(交流动作)通常是不够的。如从图11-13所绘出的示例可以看到的,代理之间的交互的话语结构和交互的种类是有用的。但是,交互的领域(例如,军事冲突或政治)或这些交互的主体,即,实体,不需要被分析。
表示修辞关系和交流动作
为了计算抽象结构之间的相似性,频繁使用两种方法:(1)在数值空间中表示这些结构,并将相似性表达为数字,这是统计学习方法,或者(2)使用结构表示,而无需数值空间,诸如树和图形,并且将相似性表达为最大公共子结构。将相似性表达为最大公共子结构被称为泛化。
学习交流动作有助于表达和理解论元。计算动词词典帮助支持获取动作的实体,并提供基于规则的形式来表达其含义。动词表达所描述事件的语义以及该事件中的参与者之间的关系信息,并投射对该信息进行编码的语法结构。动词,尤其是交流动作动词,可能变化很大并且可能展现丰富的语义行为。作为响应,动词分类通过将动词组织到共享核心语义属性的组中来帮助学习系统应对这种复杂性。
VerbNet是这样一种词典,它识别每个类中动词的语义角色和句法模式特性,并明确做出句法模式与可以为该类的所有成员推断出的基础语义关系之间的连接。参见KarinKipper,Anna Korhonen,Neville Ryant和Martha Palmer,Language Resources andEvaluation,Vol.42,No.1(2008年3月),at 21。类的每个句法框架或动词签名具有对应的语义表示,其详细描述了事件的过程中事件参与者之间的语义关系。
例如,动词amuse(娱乐)是类似动词的聚类的一部分,这些动词具有类似的论元(语义角色)的结构,诸如amaze、anger、arouse、disturb和irritate(惊奇、生气、激怒、打扰和烦躁)。这些交流动作的论元的角色如下:Experience(体验者,通常为有生命实体)、Stimulus(刺激)和Result(结果)。每个动词可以具有通过(关于该动词在句子或框架中如何出现的)句法特征区分的含义类别。例如,用于娱乐(amuse)的框架如下,使用以下关键名词短语(NP)、名词(N)、交流动作(V)、动词短语(VP)、副词(ADV):
NP V NP。示例:“The teacher amused the children”。语法:Stimulus VExperiences。子句:amuse(Stimulus,E,Emotion,Experiencer),cause(Stimulus,E),emotional_state(result(E),Emotion,Experiencer)。
NP V ADV-中间。示例:“Small children amuse quickly”。语法:Experiencer VADV。子句:amuse(Experiencer,Prop):-,property(Experiencer,Prop),adv(Prop)。
NP V NP-PRO-ARB。示例“The teacher amused”。语法:Stimulus V.amuse(Stimulus,E,Emotion,Experiencer):.cause(Stimulus,E),emotional_state(result(E),Emotion,Experiencer)。
NP.cause V NP.。示例“The teacher's dolls amused the children”。语法:Stimulus<+genitive>('s)V Experiencer.amuse(Stimulus,E,Emotion,Experiencer):.cause(Stimulus,E),
emotional_state(during(E),Emotion,Experiencer).
NP V NP ADJ。示例“This performance bored me totally”。语法:Stimulus VExperiencer Result.amuse(Stimulus,E,Emotion,Experiencer).cause(Stimulus,E),emotional_state(result(E),Emotion,Experiencer),Pred(result(E),Experiencer)。
交流动作可以被表征为多个聚类,例如:
具有谓语补语的动词(appoint,characterize,dub,declare,conjecture,masquerade,orphan,captain,consider,classify),感知动词(See,sight,peer)。
心理状态动词(amuse,admire,marvel,appeal),欲望动词(want,long)。
判断动词(judgment),评估动词(assess,estimate),搜索动词(hunt,search,stalk,investigate,rummage,ferret),社交互动动词(correspond,marry,meet,battle),交流动词(transfer(message),inquire,interrogate,tell,manner(speaking),talk,chat,say,complain,advise,confess,lecture,overstate,promise)。避免动词(avoid),度量动词(register,cost,fit,price,bill),体动词(begin,complete,continue,stop,establish,sustain)。
本文所描述的方面比统计学习模型更具优势。与统计解决方案相比,使用分类系统的方面可以提供动词或类动词结构,该动词或类动词结构被确定为导致目标特征(诸如修辞一致性)。例如,统计机器学习模型将相似性表达为数字,这会使得难以解释。
表示请求-响应对
表示请求-响应对基于对来促进基于分类的操作。在示例中,请求-响应对可以被表示为解析丛林。解析丛林是两个或更多个句子的解析树的表示,在一个图中句子的部分和词语之间具有话语级别关系。参见Galitsky 2015。问题和答案之间的局部相似性可以被表达为解析丛林的常见子图。公共图节点的数量越多,相似度越高。
图14图示了根据一方面的解析丛林。图14描绘了解析丛林1400,其包括用于请求的解析树1401和用于对应的响应的解析树1402。
解析树1401表示问题:“I just had a baby and it looks more like thehusband I had my baby with.However it does not look like me at all and I amscared that he was cheating on me with another lady and I had her kid.Thischild is the best thing that has ever happened to me and I cannot imaginegiving my baby to the real mom”(“我刚生了一个孩子,看起来更像是我和我的丈夫有了我的孩子。但是,它看起来根本不像我,而且我怕他在和另一位女士对我出轨而我生了她的孩子。这个孩子是我经历过的最好的事情,我无法想象把我的孩子交给真正的母亲”)。
响应1402表示响应“Marital therapists advise on dealing with a childbeing born from an affair as follows.One option is for the husband to avoidcontact but just have the basic legal and financial commitments.Anotheroption is to have the wife fully involved and have the baby fully integratedinto the family just like a child from a previous marriage”(“婚姻治疗师针对与外遇有关的孩子的处理建议如下。一种选择是让丈夫避免接触,而只具有基本的法律和财务承诺。另一种选择是让妻子充分参与其中,使婴儿像来自以前的婚姻的孩子一样完全融入家庭”)。
图14表示用于表示关于文本的段落的语言学信息的贪心方法。该图的直边是句法关系,并且弯曲的弧线是话语关系,诸如指代、相同实体、子实体、修辞关系和交流动作。实心弧线用于相同实体/子实体/指代关系,并且虚线弧线用于修辞关系和交流动作。直边中的椭圆形标签表示句法关系。引理(Lemmas)写在节点的方框中,并且引理形式写在节点的右侧。
解析丛林1400包括比仅仅针对各个句子的解析树的组合更为丰富的信息。沿着句法关系的边以及话语关系的弧线在该图中导航可以将给定的解析丛林变换成语义上等效的形式,以与其它解析丛林匹配,从而执行文本相似性评估任务。为了形成段落的完整形式表示,表达尽可能多的链接。每个话语弧线都产生一对可能是潜在匹配的丛林短语。
种子(请求)和响应之间的局部相似性被表达为解析丛林的公共子图。它们被可视化为连接的云。公共图节点的数量越多,相似度越高。对于修辞一致性,公共子图不必像在它给定文本中那样大。但是,种子的修辞关系和交流动作与响应是相关的,并且需要对应关系。
交流动作的泛化
两个交流动作A1和A2之间的相似性被定义为拥有A1和A2之间公共的特征的抽象动词。将两个动词的相似性定义为抽象的类动词结构支持归纳学习任务,诸如修辞一致性评估。在示例中,可以将以下两个常见动词(agree和disagree)之间的相似性泛化如下:agree^disagree=verb(Interlocutor,Proposed_action,Speaker),其中Interlocutor是向Speaker提议Proposed_action的、并且Speaker向其传达Speaker的响应的人。Proposed_action是如果Speaker接受或拒绝请求或要约时将执行的动作,并且Speaker是已向其提议特定动作并对所作出的请求或要约进行响应的人。
在另一个示例中,动词agree和explain之间的相似性被表示如下:agree^explain=verb(Interlocutor,*,Speaker)。交流动作的主体在交流动作的上下文中被泛化,并且不相对于其它“物理”动作被泛化。因此,各方面将交流动作的各个发生与对应的主体一起泛化。
此外,可以将表示对话的交流动作序列与类似对话的其它此类序列进行比较。以这种方式,个体交流动作的含义以及对话的动态话语结构(与经由修辞关系反映的其静态结构相比)被表示。泛化是发生在每个级别的复合结构表示。交流动作的引理与引理一起泛化,并且其语义角色与相应的语义角色一起泛化。
文本作者使用交流动作来指示对话的结构或冲突。参见Searle,J.R.1969,Speechacts:an essay in the philosophy of language.London:Cambridge UniversityPress。主体在这些动作的上下文中被泛化,并且不相对于其它“物理”动作泛化。因此,交流动作的各个发生与它们的主体以及它们的对一起被泛化为话语“步骤”。
也可以从匹配动词框架(诸如VerbNet)的角度来考虑交流动作的泛化。交流链接反映了与文本中多于一个代理的参与(或提及)相关联的话语结构。这些链接形成连接用于交流动作的词语(或者动词或者隐式指示人的交流意图的多个词语)的序列。
交流动作包括行动者、正在对其采取行动的一个或多个代理,以及描述该动作的特征的短语。交流动作可以被描述为以下形式的函数:verb(agent,subject,cause)(动词(代理,主体,原因)),其中动词表征所涉及的代理之间的某种类型的交互(例如,解释、确认、提醒、不同意、拒绝等),主体是指传送的信息或描述的对象,原因是指用于主体的动机或解释。
场景(标记为有向图)是解析丛林G=(V,A)的子图,其中V={action1,action2…actionn}是与交流动作对应的顶点的有限集合,并且A是带标签的弧线的有限集合(有序的顶点对),其分类如下:
每个弧线actioni,actionj∈Asequence对应于引用相同主体(例如,sj=si)或不同的主体的两个动作vi,agi,si,ci和vj,agj,sj,cj的时间优先级。每个弧线actioni,actionj∈Acause对应于动作actioni和actionj之间的攻击相互关系,指示actioni的原因与actionj的主体或原因冲突。
与代理之间的交互场景相关联的解析丛林的子图具有一些明显的特征。例如,(1)所有顶点都按时间排序,使得所有顶点(初始和终止顶点除外)都存在一个传入弧和一个传出弧,(2)对于Asequence弧,最多一个传入弧且仅一个传出弧是可允许的,以及(3)对于Acause弧,给定顶点可以有许多传出弧,以及许多传入弧。涉及的顶点可以与不同的代理或相同的代理(即,当他自相矛盾时)相关联。为了计算解析丛林与其交流动作之间的相似性,分析了归纳子图、具有相似弧标签的相同配置的子图以及顶点的严格对应关系。
通过分析解析丛林的交流动作的弧线,存在以下相似性:(1)其主体来自T1的一个交流动作针对其主体来自T2的另一个交流动作(不使用交流动作弧),和(2)其主体来自T1的一对交流动作与来自T2的另一对交流动作进行比较(使用了交流动作弧)。
泛化两个不同的交流动作是基于它们的属性。参见(Galitsky等人2013)。如在关于图14所讨论的示例中可以看到的,可以将来自T1的一个交流动作cheating(husband,wife,another lady)与来自T2,的第二交流动作avoid(husband,contact(husband,another lady))进行比较。泛化导致communicative_action(husband,*),其引入对A的约束,其形式为:如果在Q中提到给定的代理(=husband)作为CA的主体,则他(她)也应成为A中的(可能的另一个)CA的主体。始终可以泛化两个交流动作,而对于其主体不是这样:如果其泛化结果为空,则具有这些主体的交流动作的泛化结果也为空。
RST关系的泛化
可以泛化话语树之间的一些关系,诸如表示相同类型的关系(表示关系,诸如对照;主题关系,诸如条件;以及多核心关系,诸如列表)的弧线可以被泛化。核心或由核心表示的情况用“N”指示。卫星或由卫星呈现的情况用“S”指示。“W”指示作者。“R”指示读者(听众)。情况是判断(propositions)、完成的动作或进行中的动作,以及交流动作和状态(包括信念、愿望、批准、解释、和解及其它)。具有上述参数的两个RST关系的泛化被表达为:rst1(N1,S1,W1,R1)^rst2(N2,S2,W2,R2)=(rst1^rst2)(N1^N2,S1^S2,W1^W2,R1^R2)。
N1,S1,W1,R1中的文本作为短语被泛化。例如,rst1^rst2可以被泛化如下:(1)如果relation_type(rst1)!=relation_type(rst2),则泛化为空。(2)否则,修辞关系的签名被泛化为句子:句子sentence(N1,S1,W1,R1)^sentence(N2,S2,W2,R2)。参见Iruskieta,Mikel,Iria da Cunha和Maite Taboada.A qualitative comparison method forrhetorical structures:identifying different discourse structures inmultilingual corpora.Lang Resources&Evaluation.2015年6月,第49卷,第2期。
例如,rst-background^rst-enablement的含义=(S增加R理解N中的元素的能力)^(R理解S增加R执行N中的动作的能力)=increase-VB the-DT ability-NN of-IN R-NNto-IN。
由于关系rst-background^rst-enablement不同,因此RST关系部分为空。然后,泛化作为相应RST关系的语言定义的表达式。例如,对于每个词语或诸如代理的词语的占位符,如果该词语在每个输入短语中相同,则保留该词语(及其POS),如果该词语在这些短语之间不同,则移除该词语。可以将结果表达式解释为正式获得的两个不同RST关系的定义之间的公共含义。
图14中绘出的问题和答案之间的两个弧线显示了基于RST关系“RST对比(RST-contrast)”的泛化实例。例如,“I just had a baby”是与“it does not look like me”的RST对比,并与“husband to avoid contact”相关,后者是与“have the basic legal andfinancial commitments”的RST对比。如可以看到的,答案不必与问题的动词短语相似,但问题和答案的修辞结构是相似的。并非答案中的所有短语都必须与问题中的短语匹配。例如,不匹配的短语与答案中与问题中的短语相关的短语具有某些修辞关系。
构建交流话语树
图15图示了根据一方面的用于构建交流话语树的示例性处理。修辞分类应用102可以实现处理1500。如所讨论的,交流话语树实现改进的搜索引擎结果。
在框1501处,处理1500涉及访问包括片段的句子。至少一个片段包括动词和词语,并且每个词语包括片段内的词语的角色,并且每个片段是基本话语单元。例如,修辞分类应用102访问诸如关于图13所描述的句子“Rebels,the self-proclaimed Donetsk People'sRepublic,deny that they controlled the territory from which the missile wasallegedly fired”。
继续该示例,修辞分类应用102确定该句子包括若干个片段。例如,第一片段是“rebels..deny”。第二片段是“that they controlled the territory”。第三片段是“fromwhich the missile was allegedly fired”。每个片段包含动词,例如,第一片段的“deny”和第二片段的“controlled”。但是,片段不必包含动词。
在框1502处,处理1500涉及生成表示句子片段之间的修辞关系的话语树。话语树包括节点,每个非终止节点表示句子片段中的两个句子片段之间的修辞关系,并且话语树的节点中的每个终止节点与句子片段之一相关联。
继续该示例,修辞分类应用102生成如图13所示的话语树。例如,第三片段“fromwhich the missile was allegedly fired”阐述“that they controlled theterritory”。第二和第三片段一起与所发生的事情的归因相关,即,攻击不可能是叛乱分子,因为他们不控制领土。
在框1503处,处理1500涉及访问多个动词签名。例如,修辞分类应用102访问例如VerbNet中的动词列表。每个动词与片段中的动词匹配或相关。例如,对于第一片段,动词为“deny”。相应地,修辞分类应用102访问与该动词deny相关的动词签名的列表。
如所讨论的,每个动词签名包括片段的动词以及一个或多个题元角色。例如,签名包括名词短语(NP)、名词(N)、交流动作(V)、动词短语(VP)或副词(ADV)中的一个或多个。题元角色描述动词与相关词语之间的相互关系。例如,“the teacher amused the children”具有与“small children amuse quickly”不同的签名。对于第一片段,动词“deny”,修辞分类应用102访问与“deny”匹配的动词的动词签名或框架的列表。该列表是“NP V NP to beNP”、“NP V that S”和“NP V NP”。
每个动词签名包含题元角色。题元角色是指动词在句子片段中的角色。修辞分类应用102确定每个动词签名中的题元角色。题元角色的示例包括行动者、代理、资产、属性、受益人、原因、位置目的地源、目的地、源、位置、体验者、范围、仪器、材料和产品、材料、产品、患者、谓词、接收者、刺激、词干、时间或主题。
在框1504处,处理1500涉及针对动词签名中的每个动词签名确定该相应签名的与片段内的词语的角色匹配的题元角色的数量。对于第一片段,修辞分类应用102确定动词“deny”仅具有三个角色:“代理”,“动词”和“词干”。
在框1505处,处理1500涉及基于具有最高匹配数量的特定动词签名从动词签名中选择特定动词签名。例如,再次参考图13,第一片段“the rebels deny...that theycontrol the territory”中的deny将与动词签名“NP V NP”匹配,并且“control”与control(rebel,territory)进行匹配。动词签名被嵌套,从而产生嵌套签名“deny(rebel,control(rebel,territory))”。
表示请求-响应
请求-响应对可以被单独分析或成对分析。在示例中,请求-响应对可以被链接在一起。在链中,预期修辞一致性不仅在连续的成员之间保持,而且还在三元组和四元组之间保持。可以为表示请求-响应对的序列的文本构造话语树。例如,在客户投诉领域,从投诉人的角度来看,请求和响应在相同的文本中呈现。客户投诉文本可以被分为请求文本部分和响应文本部分,并且然后形成成对的正面和负面数据集。在示例中,用于支持者的所有文本和用于反对者的所有文本被组合。下面每个段落的第一句将形成请求部分(将包括三个句子),并且每个段落的第二句将形成响应部分(在这个示例中也将包括三个句子)。
图16图示了根据一方面的话语树和场景图。图16描绘了话语树1601和场景图1602。话语树1601对应于以下三个句子:
(1)I explained that my check bounced(I wrote it after I made adeposit).A customer service representative accepted that it usually takessome time to process the deposit.(我解释说我的支票被退回了(我是在我存款后写的支票)。客户服务代表接受说通常需要一些时间来处理存款。)
(2)I reminded that I was unfairly charged an overdraft fee a monthago in a similar situation.They denied that it was unfair because theoverdraft fee was disclosed in my account information.(我想起一个月前在类似情况下我被不公平地收取了透支费。他们否认这是不公平的,因为透支费已在我的帐户信息中披露。)
(3)I disagreed with their fee and wanted this fee deposited back tomy account.They explained that nothing can be done at this point and that Ineed to look into the account rules closer.(我不同意他们的费用,并且希望将这笔费用存回我的帐户。他们解释说,此时无法采取任何措施并且我需要更仔细地关注帐户规则。)
如从图16中的话语树可以看到的,可能难以判断文本是表示交互还是描述。因此,通过分析解析丛林的交流动作的弧线,可以发现文本之间的隐式相似性。例如,一般而言:
(1)其主体来自第一树的一个交流动作针对其主体来自第二树的另一个交流动作(不使用交流动作弧)。
(2)其主体来自第一树的一对交流动作针对来自第二树的另一对交流动作(使用了交流动作弧)。
例如,在前面的示例中,cheating(husband,wife,another lady)^avoid(husband,contact(husband,another lady))的泛化为我们提供了communicative_action(husband,*),其引入对A的约束,其形式为:如果在Q中提到给定的代理(=husband)作为CA的主体,则他(她)也应该是A中的(可能,另一个)CA的主体。
为了处理表达CA的主体的词语的含义,可以将词语应用于向量模型,诸如“word2vector”模型。更具体而言,为了计算交流行动的主体之间的泛化,可以使用以下规则:如果subject1=subject2,则subject1^subject2=<subject1,POS(subject1),1>。这里主体仍然存在并且分数为1。否则,如果主体具有相同的言语部分(part-of-speech,POS),则subject1^subject2=<*,POS(subject1),word2vecDistance(subject1^subject2)>。“*”表示引理是占位符,并且分数是这些词语之间的word2vec距离。如果POS不同,则泛化是空元组,并且可以不被进一步泛化。
请求-响应对的分类设置
在常规的搜索中,作为基线,可以根据关键字统计(诸如,术语frequency–inversedocument frequency的缩写(TF*IDF))来测量请求响应对之间的匹配。为了提高搜索相关性,该分数会通过物品受欢迎程度、物品位置或基于分类法的分数而增加(Galitsky,2015)。搜索也可以被表述为机器学习框架中的段落重排问题。特征空间包括请求-响应对作为元素,并且分隔超平面将这个特征空间分为正确和错误对。因此,可以如Req(请求)和Resp(响应)之间的相似性那样以局部方式、或经由请求-响应对之间的相似性以全局学习方式来表述搜索问题。
用于确定请求和响应之间的匹配的其它方法也是可能的。在第一示例中,修辞分类应用102提取Req和Resp的特征并将特征比较为计数,从而引入计分功能,使得分数将指示类别(低分数用于不正确的对,高分数用于正确的对)。
在第二示例中,修辞分类应用102将用于Req和Resp的表示彼此进行比较,并且为比较结果分配分数。类似地,分数将指示类别。
在第三示例中,修辞分类应用102构建对Req和Resp的表示<Req,Resp>作为训练集的元素。修辞分类应用102然后在所有这样的元素<Req,Resp>的特征空间中进行学习。
图17图示根据一方面的形成请求-响应对。图17描绘了请求-响应对1701、请求树(或对象)1702和响应树1703。为了形成<Req,Resp>对象,修辞分类应用102将用于请求的话语树和用于响应的话语树组合成具有根RR的单个树。修辞分类应用102然后将对象分类为正确(具有高一致性)类别和不正确(具有低一致性)类别。
基于最近邻居图的分类
一旦构建了CDT,为了识别文本中的论元,修辞分类应用102计算与用于正面类别的CDT相比的相似性,并验证它低于用于其负面类别的CDT的集合。CDT之间的相似性是借助于最大公共子CDT定义的。
在示例中,构造了具有来自集合和(ΛE,≤)的顶点和边标签的CDT(V,E)的有序集合G。来自G的带标签的CDTΓ是一对((V,l),(E,b))形式的对,其中V是顶点集合,E是边集合,/>是将标签分配给顶点的函数,并且b:E→ΛE是将标签分配给边的函数。具有相同标签的同构树没有区别。
顺序被定义如下:对于两个CDT,来自G的Γ1:=((V1,l1),(E1,b1))以及Γ2:=((V2,l2),(E2,b2)),然后Γ1支配Γ2或Γ2≤Γ1(或Γ2是Γ1的子CDT),如果存在一对一映射V2→V1,使得它(1)遵循边:/> 并且(2)在标签下适合:/>
该定义考虑了当从“较大”CDT G1传递到“较小”CDT G2时,匹配的顶点的标签的相似性(“弱化”)计算。
现在,一对CDT X和Y的相似性CDT Z(用X^Y=Z表示)是X和Y的所有包含最大公共子CDT的集合,它们中的每一个都满足以下附加条件(1)要被匹配,来自CDT X和Y的两个顶点必须表示相同的RST关系;以及(2)来自Z的每个公共子CDT包含具有与X和Y中相同的VerbNet签名的至少一个交流动作。
这个定义容易扩展到寻找若干个图的泛化。图集合X和Y的对上的包含顺序μ被自然地定义为XμY:=X*Y=X。
图18图示了根据一方面的最大公共子交流话语树。注意的是,树是倒置的并且弧的标签被泛化:交流动作site()通过交流动作say()被泛化。前者CA委员会的第一(代理)论元通过后者CA荷兰的第一论元进行泛化。对这对CA的第二论元应用相同的操作:investigator^evidence。
CDT U属于正面类,使得(1)U类似于具有正示例R+(具有非空公共子CDT),以及(2)对于任何负示例R-,如果U类似于R-(即,),则U*R-μU*R+
这个条件引入了相似度的度量,并告知要被分配给类别,未知CDT U与来自正面分类的最近的CDT之间的相似度应高于U与每个负示例之间的相似度。条件2意味着存在正示例R+,使得对于R-,没有U*R+μR-,即,对这个正示例的泛化没有反例。
用于CDT的丛林内核学习
如今,针对串、解析树和解析丛林的树内核学习已成为相当成熟的研究领域。解析树内核将公共子树的数量计数为两个实例之间的话语相似性度量。Joty,Shafiq和A.Moschitti已为DT定义了树内核。Discriminative Reranking of Discourse ParsesUsing Tree Kernels.Proceedings of EMNLP.(2014)。参见Wang,W.,Su,J.,&Tan,C.L.(2010)。Kernel Based Discourse Relation Recognition with Temporal OrderingInformation.In Proceedings of the 48th Annual Meeting of the Association forComputational Linguistics。(使用树内核的特殊形式进行话语关系识别)。通过用关于话语动作的信息扩充DT内核,为CDT定义丛林内核。
CDT可以由每个子树类型的整数计数的向量V表示(不考虑其祖先):
V(T)=(类型1的子树的数量,…,类型I的子树的数量,…,类型n的子树的数量)。由于不同子树的数量在其大小上是指数级的,因此这导致非常高的维数。因此,直接使用特征向量在计算上是不可行的。为了解决计算问题,引入树内核函数来高效地计算上述高维向量之间的点积。给定两个树段CDT1和CDT2,树内核函数被定义为:
K(CDT1,CDT2)=<V(CDT1),V(CDT2)>=∑i V(CDT1)[i],V(CDT2)[i]=∑n1∑n2∑i Ii(n1)*Ii(n2)
其中n1∈N1,n2∈N2,其中N1和N2分别是CDT1和CDT2中所有节点的集合;
Ii(n)是指示符函数。
Ii(n)={如果类型i的子树出现为根在节点处则为1;否则为0}。K(CDT1,CDT2)是树结构上的卷积内核的实例(Collins和Duffy,2002)并且可以通过递归定义来计算:
Δ(n1,n2)=∑I Ii(n1)*Ii(n2)
如果n1和n2被分配相同的POS标签或其孩子是不同的子树,则Δ(n1,n2)=0。
否则,如果n1和n2都是POS标签(是预终止节点),则Δ(n1,n2)=1xλ;
否则,Δ(n1,n2)=λΠj=1 nc(n1)(1+Δ(ch(n1,j),ch(n2,j)))
其中ch(n,j)是节点n的第j个孩子,nc(n1)是n1的孩子的数量,并且λ(0<λ<1)是衰减因子,以便使内核值相对于子树大小的变化较小。此外,递归规则(3)成立,因为给定具有相同孩子的两个节点,可以使用这些孩子和进一步后代的公共子树来构造公共子树。解析树内核将公共子树的数量计数为两个实例之间的句法相似性度量。
图19图示了根据一方面的用于交流话语树的内核学习格式的树。
作为标签的交流动作术语被转换成树,这些树被添加到用于RST关系的相应节点。对于EDU的文本作为终止节点的标签,仅保留短语结构。终止节点被标记有短语类型序列,而不是解析树片段。
如果存在从节点X到终端EDU节点Y的带有标签A(B,C(D))的修辞关系弧,则将子树A-B->(C-D)追加到X。
修辞一致性分类器的实现
修辞一致性分类器120可以通过使用交流话语树来确定两个句子(诸如问题和答案)之间的互补性。图20图示了根据一方面的用于实现修辞一致性分类器的示例性处理。图20描绘了处理2000,其可以由修辞分类应用102实现。如所讨论的,修辞一致性分类器120用训练数据125进行训练。
修辞一致性分类器120为问题和答案二者确定交流话语树。例如,修辞一致性分类器120根据诸如问题171或问题130之类的问题构造问题交流话语树110,并根据候选答案构造答案交流话语树111。
在框2001处,处理2000涉及为问题句子确定包括问题根节点的问题交流话语树。问题句子可以是显式的问题、请求或评论。修辞分类应用102根据问题130创建问题交流话语树110。使用关于图13和图15讨论的示例,示例问题句子是“are rebels responsiblefor the downing of the flight”。修辞分类应用102可以使用关于图15描述的处理1500。示例问题的根节点为“阐述”。
在框2002处,处理2000涉及为答案句子确定第二交流话语树,其中该答案交流话语树包括答案根节点。继续上面的示例,修辞分类应用102创建如图13所绘出的交流话语树111,它也具有根节点“阐述”。
在框2003处,处理2000涉及通过识别问题根节点和答案根节点是相同的来关联交流话语树。修辞分类应用102确定问题交流话语树110和答案交流话语树111具有相同的根节点。所得到的相关联的交流话语树在图17中绘出,并且可以被标记为“请求-响应对”。
在框2004处,处理2000涉及通过将预测模型应用于经合并的话语树来计算问题交流话语树和答案交流话语树之间的互补级别。
修辞一致性分类器使用机器学习技术。在一方面,修辞分类应用102训练并使用修辞一致性分类器120。例如,修辞分类应用102定义请求-响应对的正面类和负面类。正面类包括修辞上正确的请求-响应对,并且负面类包括相关但在修辞上是外来的请求-响应对。
对于每个请求-响应对,修辞分类应用102通过解析每个句子并获得句子片段的动词签名来构建CDT。
修辞分类应用102将相关联的交流话语树对提供给修辞一致性分类器120。修辞一致性分类器120输出互补级别。
在框2005处,处理2000涉及:响应于确定互补级别高于阈值,将问题句子和答案句子识别为是互补的。修辞分类应用102可以使用阈值互补级别来确定问题-答案对是否足够互补。例如,如果分类分数大于阈值,则修辞分类应用102可以将答案输出为答案172或答案150。替代地,修辞分类应用102可以丢弃答案并访问答案数据库105或公共数据库以获取另一个候选答案并根据需要重复处理2000。
在一方面,修辞分类应用102获得共同参考。在另一方面,修辞分类应用102获得实体和子实体或下位词(hyponym)链接。下位词是比适用于词语的一般或上位术语具有更具体含义的词语。例如,“汤勺(spoon)”是“餐具(cutlery)”的下位词。
在另一方面,修辞分类应用102将丛林内核学习应用于表示。丛林内核学习可以代替上述基于分类的学习,例如,在框2004处。修辞分类应用102为请求-响应对的解析树构建解析丛林对。修辞分类应用102应用话语解析来获得用于请求-响应对的话语树对。修辞分类应用102使话语树请求-响应和解析树请求-响应的基本话语单元对齐。修辞分类应用102合并话语树请求-响应和解析树请求-响应的基本话语单元。
在一方面,修辞分类应用102通过word2vector模型改善文本相似性评估。
在另一方面,修辞分类应用102将对应于问题交流话语树110的句子或对应于答案交流话语树的句子发送到诸如移动设备170的设备。来自修辞分类应用102的输出可以用作搜索查询、数据库查找或其它系统的输入。以这种方式,修辞分类应用102可以与搜索引擎系统集成。
图21图示了根据一方面的聊天机器人对帖子进行评论。图21描绘了聊天2100、用户消息2101-2104和代理响应2105。代理响应2105可以通过修辞分类应用102来实现。如图所示,代理响应2105已识别对消息线2101-2104的合适答案。
图22图示了根据一方面的聊天机器人对帖子进行评论。图22描绘了聊天2200、用户消息2201-2205和代理响应2206。图22描绘了来自用户1的三个消息,具体而言是2201、2203和2205,以及来自用户2的两个消息,具体而言是2202和2204。代理响应2206可以通过修辞分类应用102来实现。如图所示,代理响应2106已识别对消息线2201-2204的合适答案。
图21和图22中描绘的特征可以通过修辞分类计算设备101来实现,或者通过向修辞分类计算设备101提供问题130并从修辞分类计算设备101接收答案150的设备来实现。
用于RR一致性和RR非理性的附加规则
以下是结构化规则的示例,这些结构化规则引入了强制执行RR一致性的约束:
1.Req和Resp两者都具有相同的情感极性(如果请求为正面,则响应也应为正面,反之亦然)。
2.Req和Resp两者都具有逻辑论元。
在理性推理下,请求和响应将完全一致:理性代理将提供既相关又与问题修辞匹配的答案。但是,在现实世界中,并非所有响应都是完全理性的。关于认知偏见的研究机构发现人类倾向于以某些方式思考,这些方式可能导致系统偏离理性或良好判断的标准。
对应关系偏见是人们倾向于过分强调对他人观察到的行为的基于个性的解释,从而响应问题。参见Baumeister,R.F.和Bushman,B.J.Social psychology and humannature:International Edition.(2010)。同时,这些响应查询对于情境影响对同一行为的作用和力量是欠考虑的。
确认偏见,即,倾向于以确认那些回答问题的人的先入为主观点的方式来搜索或解释信息。他们可能抹黑不支持其观点的信息。确认偏见与认知失调的概念相关。因此,个人可能通过搜索重新确认其观点的信息来减少不一致性。
锚定导致在做出决策时过于依赖或“锚定”一种品质或一条信息。
可用性启发式方法使我们高估了记忆中具有更大“可用性”的事件的可能性,这可能受记忆的时间长短或记忆可能如何不同寻常或充满情绪的影响。
根据Bandwagon效应,人们回答问题并相信一些东西,是因为许多其它人也这样做(或相信)。
信念偏见是其中某人对论元的逻辑强度的评估由于结论的可信度而产生偏见的效应。
偏见盲点是一种倾向,即认为自己比其它人更少偏见或者能够在其它人中比在自己中识别更多的认知偏见。
评估
测试数据的第一领域从具有广泛主题的问题-答案对的Yahoo!Answers集合中的问题-问答对得出。在4400万个用户问题集合中,选择20000个问题,每个问题包含两个以上的句子。大多数问题的答案都相当详细,因此没有对答案进行过滤。每个问题有多个答案,并且最佳答案被标记。我们认为问题-最佳答案对是正面训练集的元素,而问题-其它答案是负面训练集的元素。为了得到负面集,我们随机选择对不同但多少相关的问题的答案,或者根据问题形成查询并从web搜索结果中获得答案。
我们的第二数据集包括社交媒体。我们主要从Facebook上的帖子中提取请求-响应对。我们还使用了与就业相关的LinkedIn.com和vk.com对话中的一小部分。在社交领域,写作的标准非常低。文本的内聚性非常有限,并且经常缺乏逻辑结构和相关性。作者根据其自己的账户以及数年内经由API可用的公共Facebook账户(在编写用于获取消息的Facebook API不可用时)来形成训练集。此外,我们使用了来自Enron数据集的860个电子邮件线索。另外,我们收集了对代理的帖子的手动响应数据,该代理会自动代表人类用户-主机生成帖子。参见Galitsky B.,Dmitri Ilvovsky,Nina Lebedeva和Daniel Usikov。Improving Trust in Automation of Social Promotion.AAAI Spring Symposium onThe Intersection of Robust Intelligence and Trust in Autonomous SystemsStanford CA 2014.(“Galitsky2014”)。我们从各种社交网络来源形成了4000个对。
第三领域是客户投诉。在典型的投诉中,不满意的客户描述了他在产品和服务方面的问题,以及他如何试图就这些问题与公司交流以及他们如何做出响应的过程。投诉通常以偏见的方式书写,夸大了产品缺陷,并把对方的动作描述为不公平和不适当的。同时,投诉人试图以令人信服、连贯和逻辑上一致的方式书写投诉(Galitsky,2014);因此,投诉用作请求与响应之间具有高度一致性的领域。为了评估用户投诉和公司响应之间的一致性(根据该用户如何描述它),我们收集了10年内来自planetfeedback.com的670个投诉。
第四领域是记者的采访。通常,专业记者书写采访的方式使得问题和答案之间的匹配度非常高。我们从诸如datran.com、allvoices.com、huffmgtonpost.com及其它来源收集了专业和公民记者的1200份贡献文稿。
为了促进数据收集,我们设计了爬取器(crawler),该爬取器搜索一组特定的网站、下载网页、提取候选文本并验证其是否符合问题或请求与响应格式。然后形成相应的文本对。搜索是经由Bing Azure搜索引擎API在Web和新闻领域中实现的。
识别有效和无效答案
答案分类的准确性如表1所示。每行表示特定方法;每类方法以灰色区域显示。
表1:评估结果
可以看到,在记者和社区回答领域中获得最高的准确性,而在客户投诉和社交网络中获得最低的准确性。我们可以得出结论,在固定方法的情况下获得的精确度越高,Req和Resp之间的一致性级别越高,相应地,响应者的能力越高。
确定性方法系列(中间两行,基于局部RR相似度的分类)比SV MTK低约9%,这表明Req和Resp之间的相似度远不如RR对的指示RR一致性的某些结构重要。这意味着不能单独评估Req和Resp之间的一致性:如果我们要求DT(Req)与DT(Resp)非常相似,我们将获得不错的精确度,但查全率极低。从DT到CDT的处理仅有1-2%的帮助,因为交流动作在组织请求和形成响应中都不起主要作用。
对于统计方法系列(底部5行,树内核),最丰富的话语数据源(用于RR-DT的SVMTK)提供了最高分类精确度,几乎与基于RR相似度的分类相同。虽然用于RST和CA的SV MTK(完整解析树)包括更多的语言数据,但它的某个部分(很可能句法上的)是多余的,并且对有限的训练集给出较低的结果。在TK下使用附加特征(诸如情绪和论证)也没有帮助:很可能这些特征是从RR-CDT特征得到的,它们本身对分类准确性并没有贡献。
采用基于CDT的TK系列方法带给我们的准确度可与将DT分类为正确和不正确所达到的精确度相媲美,最先进的系统在过去几年中遇到激烈竞争的修辞解析任务其准确性超过80%。
确定性系列中的直接分析方法执行起来较弱,这意味着需要更多数量和更复杂的特征结构:仅仅计数并考虑修辞关系的类型不足以判断RR彼此的一致性程度。如果两个RR对具有相同的类型和计数的修辞关系甚至交流动作,那么在大多数情况下,它们仍然可能属于相反的RR一致性类别。
用于CDT的最近对邻居学习实现的准确性低于用于CDT的SVMTK,但是前者给出了有趣的子树示例,这些子树的示例典型地用于论证,并且在事实数据之间共享。前者的CDT子树组的数量自然要高得多。不幸的是,SV MTK方法无助于解释RR一致性问题究竟是如何解决的:它仅给出最终评分和分类标签。在没有交流动作的情况下,有可能但很少会在响应中表达逻辑论元(这一观察得到了我们的数据的支持)。
在评估领域中测量RR一致性
从评估识别准确性的角度来看,我们在前面的小节中获得了最佳方法。现在,在固定这个方法后,我们将在我们的评估领域中测量RR一致性。我们还将展示通过最佳方法交付的一般总体一致性如何与各个一致性标准(诸如情感、逻辑论证、主题和关键字相关性)关联。一旦我们使用我们的最佳方法(用于RR-CDT的SV MTK)来标记训练集,它的大小就可以急剧增加,并且我们可以在各个领域探索RR一致性的有趣特性。我们将发现RR一致性的许多直观特征在比以前评估的更大的数据集上的贡献。
在本小节中,我们打算证明RR对有效性识别框架可以用作任意请求和响应之间的一致性的量度。同样,该识别框架可以评估各种特征与RR对有效性的关联强度。
根据识别精确度的评估,我们获得了识别RR对有效与否的最佳方法。现在,在固定该识别方法后,我们将在我们的评估领域中测量RR一致性,还将估计通过该最佳方法交付的一般总体一致性如何与个体一致性标准(诸如情感、逻辑论证、主题和关键字相关性)关联。一旦我们使用我们的最佳方法(用于RR-CDT的SV MTK)来标记训练集,它的大小就可以急剧增加,并且我们可以在各个领域探索RR一致性的有趣特性。我们将发现RR一致性的许多直观特征在比以前评估的更大的数据集上的贡献。我们将仅在上述评估的正面训练数据集上逐个特征地测量该一致性,作为识别精确度(%,表2)。注意的是,查全率和负面数据集对于一致性的评估不是必需的。
表2:四个领域中的请求和响应之间的一致性的量度,%
例如,根据用于RR-CDT分类的SV MTK,我们估计通过词袋方法计算出的按照主题一致性确定的RR对在客户投诉领域中是有效的RR对的观察精确度为64.3%。
按照情感的一致性显示了RR对中合适的情感匹配的贡献。情感规则具体地包括:如果RR的极性相同,则响应应确认请求正在说什么。相反,如果极性相反,则响应应该攻击请求正在声明的内容。按照逻辑论证的一致性需要适当的交流话语,其中响应与请求中的声明不一致。
该数据阐明了支持者正在说的内容与对手如何响应之间的语言一致性性质。对于有效的对话话语,并非所有一致性特征都必须存在。但是,如果这些特征中的大多数特征不一致,那么给定的答案应视为无效、不适合并应选择另一个答案。表2告诉我们在各个领域的对话支持中应在何种程度上使用哪些特征。因此,所提出的技术可以用作书写质量和客户支持质量评估的自动化手段。
聊天机器人应用
用于社交推广的会话代理(CASP)是被呈现为模拟的人类角色的代理,其代表它的人类宿主行动,以为他或她促进和管理她的交流。Galitsky B.,Dmitri Ilvovsky,NinaLebedeva和Daniel Usikov。Improving Trust in Automation of SocialPromotion.AAAI Spring Symposium on The Intersection of Robust Intelligenceand Trust in Autonomous Systems Stanford CA 2014。CASP使其人类宿主摆脱社交网络上例行的、较不重要的活动,诸如分享新闻并关于消息、博客、论坛、其它人的图像和视频进行评论。用于社交推广的会话代理随着可能的信任的丧失而演进。评估了CASP的整体性能,重点是RR对一致性、过滤从web挖掘的回复。
在诸如Facebook和LinkedIn之类的社交网络系统上,人们平均有200-300个朋友或联系人。为了维持与这么高数量的朋友的积极相互关系,每周需要几个小时阅读他们发布的内容并对其进行评论。实际上,人们只维持与10-20个最亲密朋友、家人和同事的相互关系,而与其余朋友交流很少。这些不太亲密的朋友感到社交网络相互关系已被放弃。但是,与社交网络的所有成员维持积极的相互关系对于从工作相关到个人的许多方面都是有益的。期望社交网络的用户向他们的朋友表明这些用户对他们的朋友感兴趣、关心他们,并因此对他们生活中的事件做出反应,从而响应他们发布的消息。因此,社交网络的用户需要花费大量时间来维持社交网络上的相互关系,但是经常没有时间去做。对于亲密的朋友和家人,用户仍然可以手动社交。对于网络的其它人,他们将使用CASP进行社交推广。
CASP跟踪与购买决策相关的用户聊天、用户在博客和论坛上的帖子、在购物网站上的评论以及建议web文档及其摘要。为此,它需要截取文本的部分、产生搜索引擎查询、针对搜索引擎API(诸如Bing)运行它,并过滤掉被确定为与种子消息无关的搜索结果。最后一步对于CASP的合理功能至关重要,修辞空间的相关性差会导致对其失去信任。因此,对RR一致性的准确评估对于成功使用CASP至关重要。
CASP被呈现为模拟角色,其代表它的人类宿主行动,以为她促进和管理她的交流(图21-22)。该代理被设计为使其人类宿主摆脱社交网络上例行的、较不重要的活动,诸如分享新闻并关于消息、博客、论坛、其它人的图像和视频进行评论。与大多数模拟人物角色的应用领域不同,其社交伙伴不一定知道他们与自动化代理交换新闻、观点和更新。我们在许多Facebook账户中试验了CASP的修辞一致性和关于其同伴的心理状态的推理。我们评估了关于涉及与它进行交流的人类用户的精神状态的推理的性能和准确性。对于会话系统,用户需要感觉到它对用户的动作适当地做出反应,并且它所回复的是有意义的。为了在水平领域中实现这一点,需要充分利用语言学信息,以便能够以有意义的方式交换消息。
CASP输入种子(由人类书写的帖子)并输出消息,该消息由CASP根据web上挖掘的内容形成并调整以与输入的帖子相关。这种相关性是基于内容方面的适当性和RR一致性或精神状态一致性方面的适当性(例如,它通过对问题的提问、对寻求更多问题的推荐帖子的答复等进行响应)。
图21-22图示了聊天机器人对帖子进行评论。
我们评估在内容和精神状态两者相关性失败的情况下人类用户如何失去对CASP及其宿主的信任。我们不是评估在系统可用性方面作为中间参数的修辞相关性,而是评估当用户对CASP的修辞上无关和不适当的帖子感到烦恼时,他们如何对CASP失去信任。
表3:信任丢失场景的评估结果
/>
在表3中,我们显示了用户对CASP失败的容忍结果。在一定次数的失败之后,朋友失去信任并抱怨、取消朋友关系、与他人分享关于失去信任的负面信息,以及甚至鼓励其它朋友取消与CASP的朋友关系。单元格中的值指示当失去信任的相应事件发生时,具有失败的修辞相关性的帖子的平均数量。这些具有失败的相关性的帖子发生在该评估活动的一个月内,我们没有获得这些帖子的出现的相对频率的值。平均上,对于每个用户响应了100个帖子(每个种子帖子1-4个)。
可以看到,在各个领域中,用户对CASP失去信任的场景是不同的。对于像旅行和购物等信息关键性较低的领域,对失败的相关性的容忍度相对高。
相反,在更重视(如与工作相关)以及具有个人风格(如个人生活)的领域中,用户对CASP失败更加敏感,并且各种形式的失去信任都更快地发生。
对于所有领域,当帖子的复杂度增加时,容忍度慢慢降低。对于较长的文本,无论内容或其期望方面如何,用户的感受比CASP的较短的单个句子或短语的帖子更差。
算法的自然语言描述领域
将自然语言映射到正式查询或命令语言的能力对于开发对许多计算系统(诸如数据库)的用户友好界面至关重要。但是,相对较少的研究解决从与其形式语言对等物配对的句子的语料库中学习这种语义解析器的问题。Kate,Rohit,Y.W.Wong和R.Mooney。Learningto transform natural to formal languages。In AAAI,2005。此外,据我们所知,没有在话语级别进行此类研究。通过学习将自然语言(NL)转换成完整的形式语言,可以更轻松地开发与复杂计算和AI系统的NL接口。
40多年前,荷兰计算机科学家Dijkstra发明了“结构化编程”的概念,他写道:“我怀疑用我们的母语—无论是荷兰语、英语、美语、法语、德语还是斯瓦希里语—编程的机器与使用它们相比更难制造它们”。该远见绝对是正确的—编程语言的专业化和高精确度是使计算以及计算机取得巨大进步的原因。Dijkstra将编程语言的发明与数学符号主义的发明进行了比较。用他的话说:“与其将使用形式符号的义务视为负担,我们应该将使用它们的便利视为特权:由于有了它们,小学生们都可以学习早期只有天才才能做到的事情”。但是,四十年后的今天,我们却不停地坐拥典型行业应用中的大量代码撞壁—数以亿计的代码行—这是支持和开发的噩梦。“代码本身就是最好的描述”这个典故成了一个不好的笑话。
程序的自然语言描述是文本修辞独特并且语句之间的一致性至关重要的领域。我们将研究常见的修辞表现形式以及特定于领域的表现形式,其将算法描述映射到软件代码中。
图23图示了根据一方面的用于算法文本的话语树。我们有以下文本及其DT(图23):
1)Find a random pixel p1.(找到随机像素p1。)
2)Find a convex area a_off this pixel p1 belongs so that all pixelsare less than 128.(找到该像素p1所属的凸面区域a_off,使得所有像素都小于128。)
3)Verify that the border of the selected area has all pixels above128.(验证所选择的区域的边界的所有像素都在128以上。)
4)If the above verification succeeds,stop with positiveresult.Otherwise,add all pixels which are below 128 to the a_off.(如果以上验证成功,则以正面结果停止。否则,将所有低于128的像素添加到a_off。)
5)Check that the size of a_off is below the threshold.Then go to2.Otherwise,stop with negative result.(检查a_off的大小是否低于阈值。然后跳到2。否则,以负面结果停止。)
现在我们展示如何将特定的句子转换成逻辑形式,然后转换成软件代码表示。某些修辞关系有助于组合由于翻译各个句子而获得的语句。
Verify that the border of the selected area has all pixels above 128.(验证所选择的区域的边界的所有像素都在128以上。)
图24图示了根据一方面的带注释的句子。伪代码1-1至1-3的带注释的解构参见图24。
通过将所有常量转换成变量,我们尝试最小化自由变量的数量,而不是同时过于约束表达式。耦合的(通过边链接)箭头表明,遵循逻辑编程的约定,相同的常数值(像素)被映射到相等的变量(Pixel)中。为了实现这一点,我们添加了需要约束自由变量的(一元)谓词。
1-4)Adding predicates which constrain free variables(添加约束自由变量的谓词)
epistemic_action(verify)&border(Area)&border(Pixel)&above(Pixel,128)&area(Area)
现在我们需要构建显式的表达式来量化所有对象。在这个具体的情况下,由于我们使用循环结构,因此它将不被使用。
图25图示了根据一方面的带注释的句子。伪代码1-5至2-3的带注释的解构参见图25。最后,我们有
2-3)Resultant code fragment(结果代码片段)
相关工作
虽然话语分析在问题问答、摘要和文本生成方面的应用数量有限,但我们尚未发现自动构建的话语树的应用。我们列举了与话语分析在两个领域的应用相关的研究:对话管理和对话游戏。这些领域有可能被应用到当前提议旨在用于的相同问题。这两个提议都有一系列基于逻辑的方法以及基于分析和机器学习的方法。
管理对话和问题回答
如果问题和答案在逻辑上是连接的,那么它们的修辞结构一致性就变得不那么重要。
De Boni提出了一种通过逻辑相关性的证明而不是事实的逻辑证明来确定问题的答案的适当性的方法。参见De Boni,Marco,Using logical relevance for questionanswering,Journal of Applied Logic,第5卷,第1期,2007年3月,第92-103页。我们将逻辑相关性定义为这样的思想,即,就某个问题而言,答案不应被视为绝对正确或错误,而应在适当程度的滑动范围内更灵活地被视为正确。这样,即使在答案的来源不完整或不一致或包含错误的情况下,也可以对答案的适当性进行严格的推理。作者展示了如何通过使用度量化的简化(约束放松的一种形式)来实现逻辑相关性,以便寻求逻辑证明,而不是答案实际上是对特定问题的答案。
我们的CDT模型试图将一般的修辞和言语行为信息组合在一个结构中。虽然言语行为提供了一种务实力量的有用表征,但最近的工作,尤其是在构建对话系统中,已经显著地扩展了这一核心概念,从而为发声可以发挥的更多种类的会话功能建模。由此产生的丰富行为被称为对话行为。参见Jurafsky,Daniel和Martin,James H.2000。Speech andLanguage Processing:An Introduction to Natural Language Processing,Computational Linguistics,and Speech Recognition.Upper Saddle River,NJ:Prentice Hall。Traum和Hinkelman在他们的会话行为的多层次方法中,区分了确保会话的连贯性和内容性所必需的四个对话行为级别。参见Traum,David R.和JamesF.Allen.1994。Discourse obligations in dialogue processing.In Proceedings ofthe 32nd annual meeting on Association for Computational Linguistics(ACL'94).Association for Computational Linguistics,Stroudsburg,PA,USA,1-8。会话行为的四个级别为:轮流(turn-taking)行为、基础行为、核心言语行为和论证行为。
关于Q/A的逻辑和哲学基础的研究已经进行了数十年,其重点是有限的领域和规模较小的系统,并且发现在工业环境中的使用有限。语言学和数学逻辑学开发的“作为…的答案(being an answer to)”的逻辑证明思想已经被证明在实际系统中的适用性有限。当前最新的应用研究旨在产生工作的通用(“开放域”)系统,该研究基于相对简单的体系架构,组合了信息提取和检索,正如在由文本检索会议(TREC)Q/A跟踪给出的标准评估框架中呈现的系统所证明的。
(Sperber和Wilson 1986)根据“证明”特定答案与问题相关所需的工作量来判断答案相关性。该规则可以通过修辞术语被表述为相关性量度:证明答案与问题匹配所需的假想修辞关系越少,该答案越相关。所需的努力可以根据所需的先验知识量、文本或假设中的推论来衡量。为了提供更易于管理的量度,我们建议通过着重于从表述问题的方式中可以消除约束或修辞关系的方式来简化问题。换句话说,我们衡量如何可以简化问题以便证明答案。结果规则表述如下:答案的相关性通过以下来确定:必须从问题中去除多少修辞约束才能证明答案;必须去除的言辞约束越少,答案就越相关。
关于发现修辞关系如何可以帮助Q/A的研究语料库非常有限。Kontos引入了允许在提出生物医学系统模型的“基本”文本与呈现支持该模型的实验结果的论文摘要的部分之间利用修辞关系的系统。参见Kontos,John,Ioanna Malagardi,John Peros(2016)Question Answering and Rhetoric Analysis of Biomedical Texts in the AROMASystem.Unpublished Manuscript。
邻接对被定义为由不同的说话者产生的相邻的话语对,其按第一部分和第二部分排序,并进行分型—特定类型的第一部分需要特定类型的第二部分。这些约束中的一些可以被丢弃,以涵盖话语之间的依赖性的更多情况。参见Popescu-Belis,Andrei.DialogueActs:One or More Dimensions?Tech Report ISSCO Working paper n.62.2005。
邻接对本质上是相关的,但是它们可以被缩减为标签(“第一部分”、“第二部分”、“无”),并可能用指向该对其它成员的指针进行扩充。经常遇到的观察到的种类的邻接对包括以下:请求/提供/邀请→接受/拒绝;评估→同意/不同意;责备→拒绝/接纳;问题→答案;道歉→淡化;感谢→欢迎;问候→问候。参见Levinson,Stephen C.2000。PresumptiveMeanings:The Theory of Generalized Conversational Implicature.Cambridge,MA:The MIT Press。
与邻接对类似,修辞关系是关系概念,涉及话语之间的关系,而不是孤立的话语。但是,考虑到话语是相对于核心仅在一种关系中的卫星,给话语分配该关系的标签是可能的。这强烈要求对对话结构进行深入分析。RST中的修辞关系的数量从由(Grosz和Sidner1986)使用的“支配(dominates)”和“先验满意(satisfaction-precedes)”类到上百种不等。连贯关系是表达文本中的修辞结构的替代方法。参见Scholman,Mere,JacquelineEvers-Vermeul,Ted Sanders.Categories of coherence relations in discourseannotation.Dialogue&Discourse,Vol 7,No 2(2016)。
NLP应用有许多类别,期望它们利用文本的信息结构。DT在文本摘要方面可能非常有用。应当考虑基于由Sparck-Jones 1995年提出的核心-卫星关系和段之间的关系的结构的文本段的知识来形成确切且连贯的摘要。参见Sparck Jones,K.Summarising:analyticframework,key component,experimental method',in Summarising Text forIntelligent Communication,(Ed.B.Endres-Niggemeyer,J.Hobbs and K.SparckJones),Dagstuhl Seminar Report 79(1995)。通过组合从根节点开始的最重要的阐述关系的段,可以生成最具信息的摘要。DT已用于多文档摘要。参见Radev,Dragomir R.,Hongyan Jing和Malgorzata Budzikowska.2000。Centroid-based summarization ofmultiple documents:sentence extraction,utility-based evaluation,and userstudies.In Proceedings of the 2000NAACL-ANLP Workshop on Automaticsummarization-Volume 4。
自然语言生成问题的主要困难是连贯性,可以依靠文本的信息结构以连贯的方式组织提取出的文本片段。测量文本连贯性的一种方法可以用于论文的自动化评估。由于DT可以捕获文本连贯性,因此可以使用产生论文的话语结构来评估论文的写作风格和质量。Burstein描述了一种半自动的用于评估文本的连贯性的论文评估方法。参见Burstein,Jill C.,Lisa Braden-Harder,Martin S.Chodorow,Bruce A.Kaplan,Karen Kukich,ChiLu,Donald A.Rock和Susanne Wolff。(2002)。
在(engio 2003)中提出的神经网络语言模型使用若干前面的词语向量的串联来形成神经网络的输入,并尝试预测下一个词语。参见Bengio,Yoshua,Réjean Ducharme,Pascal Vincent和Christian Janvin。2003。A neural probabilistic languagemodel.J.Mach.Learn.Res.3(March 2003),1137-1155。结果是,在模型被训练之后,词语向量被映射到向量空间中,使得句子和文档的分布式表示在语义上相似的词语具有相似的向量表示。这种模型可以潜在地在话语关系上操作,但很难像我们在树内核学习中那样提供丰富的语言学信息。有大量的研究将word2vec模型扩展超越词语级别以实现短语级别或句子级别的表示。例如,简单的方法是使用文档中所有词语的加权平均值,(词语向量的加权平均),从而失去了词语顺序,类似于词语袋方法所做的那样。更复杂的方法是使用矩阵向量操作,按照句子的语法树给出的顺序来组合词语向量。参见R.Socher,C.D.Manning和A.Y.Ng.2010。Learning continuous phrase representations and syntactic parsingwith recursive neural networks.In Proceedings of the NIPS-2010Deep Learningand Unsupervised Feature Learning Workshop。由于使用解析树组合词语向量依赖于解析,因此它被证明仅适用于句子。
对话系统的策略学习的许多早期方法使用了小的状态空间和动作集合,并且仅关注有限的策略学习实验(例如,确认的类型或主动性的类型)。Communicator数据集(Walker等人2001)是人机对话的可用的最大语料库,并且已用对话上下文进行了进一步注释。该语料库已广泛用于培训和测试对话管理器,但是,它只限于在航空旅行领域中针对有限属性(诸如目的地城市)的信息请求对话。与此同时,在当前的工作中,我们依赖于各种性质的请求-响应对的广泛语料库。
Reichman 1985给出了会话动作的形式化描述和ATN(增强过渡网络)模型,并参考了用于识别话语的言语行为的常规方法。作者使用的语言标记分析类似于现在用于修辞解析的语言标记分析,诸如动词前缀“please”、情态助词、韵律、参考、线索短语(诸如“Yes,but…”(子论元让步和反论元)、“Yes,and...”(论元一致性和进一步的支持)、“No”和“Yes”(不同意/同意),“Because...”(支持)等)和其它施为性指示符。参见Reichman,R.1985。Getting computers to talk like you and me:discourse context,focus andsemantics(an ATN model).Cambridge,Mass.London:MIT Press。
给定文本的DT作为复合查询的候选答案,提出了一种查询关键字在该DT中有效出现和无效出现的规则系统。参见Galisky2015。为了成为查询的有效答案,它的关键字需要出现在该答案的基本话语单元的链条中,以便这些单元完全有序并通过核心-卫星关系连接。如果查询的关键字仅出现在答案的卫星话语单元中,则答案可能无效。
对话游戏
在任意会话中,问题后通常是答案,或一些无法或拒绝回答的显示语句。会话的意图空间有以下模型。通过由代理B提出问题,代理A识别代理B找出答案的目标,并且它采纳告诉B答案以便进行合作的目标。然后,A计划实现目标,从而生成答案。这在简单的情况下提供了优雅的解释,但是需要强的合作假设。代理A必须采纳代理B的目标作为代理A自己的目标。因此,它不能解释为什么A在她不知道答案或没准备好接受B的目标时说任何内容。
Litman和Allen除了领域级别之外,还在话语级别引入了意图分析,并假设了话语级别的一组常规多代理动作。参见Litman,D.L.和Allen,J.F.1987。A plan recognitionmodel for subdialogues in conversation,Cognitive Science,11:163-2。其它人尝试了使用诸如联合意图之类的社交意图构造来解释这种行为。参见Cohen P.R.和Levesque,H.J.1990。Intention is choice with commitment,Artificial Intelligence,42:213-261。还参见Grosz,Barbara J.,和Sidner,Candace L.,1986。Attentions,Intentions andthe Structure of Discourse.Computational Linguistics,12(3),175–204。虽然这些说明确实有助于更令人满意地解释一些话语现象,但它们仍然需要高度的合作性来说明对话的连贯性,并且没有提供简单的解释来说明为什么代理在不支持高级别共同目标的情况下会采取行动。
让我们想象陌生人接近一个人并询问:“Do you have spare coins?”不太可能存在联合的意图或共享的计划,因为他们以前从未见过。从纯粹的战略角度来看,代理可能对陌生人的目标是否实现没有兴趣。但是,通常情况下,代理仍会在这种情况下做出响应。因此,对Q/A的说明必须超出识别说话者意图。问题不仅仅提供说话者的目标的证据,在制定对问题的响应时还涉及比采纳对话者的目标更多的某种东西。
Mann提出了话语层级动作库,有时也称为对话游戏,它对常见的交流互动进行编码。参见Mann,William和Sandra Thompson。1988。Rhetorical structure theory:Towardsa functional theory of text organization.Text-Interdisciplinary Journal forthe Study of Discourse,8(3):243–281。为了进行合作,代理必须始终参与其中的一项游戏。因此,如果问题被提出,则只有固定数量的活动(即由问题引起的那些活动)是合作响应。游戏提供了更好的连贯性解释,但仍然要求代理识别彼此的意图来进行对话游戏。因此,这项工作可以视为意图查看的特殊情况。由于这种分离,他们不必假设每个代理执行的任务上的合作,但仍需要在对话级别识别意图和合作。尚不清楚哪些目标激发会话合作。
Coulthard和Brazil建议,响应可以同时具有响应和新发起的双重作用:发起^(重新发起)^响应^(后续动作)。参见Coulthard,R.M.和Brazil D.1979。Exchange structure:Discourse analysis monographs no.5.Birmingham:The University of Birmingham,English Language Research。交换可以包含两到四个话语。此外,后续动作本身也可以有后续动作。开始动作有时指示交换的开始,这并不限制下一动作的类型。最后,有时发生关闭动作,其不一定是后续动作。当将这些观察结果添加到其表述中时,结果为:
(开始)^发起^(重新发起)^响应^(反馈)^(后续动作)^(关闭)
现在可以处理从两个到七个更多的交换。
图26图示了根据一方面的对话的话语行为。Tsui(1994)根据三部分事务来表征话语行为。她的选择发起、响应和后续动作的系统分别图26中的顶部、中间和底部示出。
图27图示了根据一方面的对话的话语行为。
有效与无效RR对的分类问题也适用于完成对话生成的任务,而不仅仅是问题回答和自动化话语支持。Popescu提出了用于人机对话的自然语言生成器的基于逻辑的修辞结构组成部分。参见Popescu,Vladimir,Jean Caelen,Corneliu Burileanu。Logic-BasedRhetorical Structuring for Natural Language Generation in Human-ComputerDialogue.Lecture Notes in Computer Science Volume4629,pp 309-317,2007。务实和上下文方面都被考虑到与任务控制器的通信,从而提供以完全形式化的任务本体结构化的领域和应用相关的信息。为了达到计算可行性和通用性的目的,已经构建了话语本体,并已提出许多引入对修辞关系的约束的公理。
例如,下面给出了指定topic(α)的语义的公理:
topic(α)::=ExhaustiveDecomposition(i,j;vi,ωj)&memberOf(vi,K(α))&memberOf(ωj,Ω)(equals(vk,ωj)&memberOf(vk,K(α)))
其中K(α)为逻辑上表达话语α的语义的子句。
话语的主题的概念在这里根据领域本体中的对象集合来定义,在话语中以确定的方式进行引用。因此,使用由控制器处理的任务/任务/领域本体来计算话语之间的主题关系。
作为这样的规则的实例,可以考虑
topic(β)::=ExhaustiveDecomposition(book,read,good time(’14h’),goodtime(’monday’),t+);
–good time(θ)::=π:/>Disjoint(topic(γ),topic(π))&smaller(tα,tπ)&((SubclassOf(θ,Δtα)equals(θ,Δtα))&π:equals(Δtπ,θ);;
其中t+是“future and‘new’”。
修辞关系和论证
通常,将问题和答案链接起来的主要方法是逻辑论证。RST和论证关系之间存在明显的连接,这是在本研究中试图学习的。有四种类型的关系:有向关系支持、攻击、细节和无向序列关系。支持和攻击关系是论证性关系,其从相关工作中可以知道。参见Peldszus,A.和Stede,M.2013。From Argument Diagrams to Argumentation Mining in Texts:ASurvey.Int.J of Cognitive Informatics and Natural Intelligence 7(1),1-31。后两个对应于RST中使用的话语关系。论证序列关系对应于RST中的“序列”,论证细节关系大致对应于“背景”和“阐述”。
论证细节关系是重要的,因为在科学出版物中有很多案例,其中一些背景信息(例如术语的定义)对于理解整体论证是重要的。论元组成部分Resp和另一个论元组成部分Req之间的支持关系指示Resp支持(推理,证明)Req。类似地,如果Resp攻击(限制,矛盾)Req,则注释Resp和Req之间的攻击关系。如果Resp是Req的细节,并且给出更多信息或定义了Req中陈述的内容而没有论证推理,则使用细节关系。最后,如果这些组成部分属于一起并且仅在组合中才有意义,即,它们形成多语句的论元组成部分,那么我们将(Req或Resp内的)两个论元组成部分与序列关系链接在一起。
我们观察到,使用SV MTK,可以在广泛的文本样式之间进行区分(Galitsky,2015),包括不带论证的文本样式和带各种形式的论证的文本样式。每种文本样式和体裁都有其固有的修辞结构,其可被利用并自动学习。由于文本样式和文本词汇之间的相关性很低,因此在复杂情况下,仅考虑关键字统计信息的传统分类方法可能缺乏准确性。我们还将文本分类成相当抽象的类,诸如属于文学领域中的语言对象和元语言,以及将基于样式的文档分类成专有设计文档。参见Galitsky,B,Ilvovsky,D.和Kuznetsov SO.Rhetoric Mapof an Answer to Compound Queries Knowledge Trail Inc.ACL 2015,681–686。在有效客户投诉与无效客户投诉(具有论证流程、没有连贯性、指示投诉人的心情较差的那些投诉)的领域中对文本完整性的评估显示,与情感概貌信息相比,修辞结构信息的贡献更大。RST解析器获得的话语结构足以进行文本完整性评估,而基于情感概貌的方法显示的结果要弱得多,并且也不能很好地补充修辞结构。
关于RST解析器已进行了大量研究,但关于如何将RST解析结果用于实际NLP问题的研究仅限于内容生成、摘要和搜索(Jansen等人,2014)。由这些解析器获得的DT不能以基于规则的方式直接用于过滤或构造文本。因此,需要学习来利用DT的隐式属性。就我们所知,这项研究是一项开创性研究,它采用话语树及其扩展来进行一般和开放域的问答回答、聊天机器人、对话管理和文本构造。
对话聊天机器人系统需要能够理解和匹配用户的交流意图、用这些意图进行推理、建立其自己相应的交流意图并用要传达给用户的实际语言来填充这些意图。话语树本身不能提供这些交流意图的表示。在这项研究中,我们介绍了建立在传统话语树上的交流话语树,这种交流话语树如今可由个人大量生产,另一方面构成了对话的描述性话语级模型。经由交流语言树的机器学习来处理对话使我们能够为协作模式和交互类型(计划、执行以及交错式计划和执行)的各种的对话类型建模。
统计计算学习方法相对于用于对话系统开发的基于手动规则的手动编码方法具有几个关键的潜在优势:
·数据驱动的开发周期;
·可证明的最佳动作策略;
·用于选择响应的更准确模型;
·泛化到不可见状态的可能性
·降低行业的开发和部署成本;
将归纳学习结果与基于内核的统计学习进行比较,依靠相同的信息使我们可以比任一种方法执行更简洁的特征工程。
关于RST解析器的大量文献都没有解决如何在实际NLP系统中采用生成的DT的问题。RST解析器的评估主要是针对与由人类注释的测试集的一致性,而不是其对所感兴趣特征的表现力。在这项工作中,我们着重于对DT的解释,并探索了以指示一致性或不一致性的形式而不是对事实进行中性列举的方式来表示它们。
为了提供对对话中给定消息后如何跟着下一条消息的一致性的量度,我们使用了CDT,该CDT现在包括以替代VerbNet框架形式交流动作的标签。我们调查了指示正确与错误的请求-响应和问题-答案对的话语特征。我们使用了两种学习框架来识别正确的对:作为图形的CDT的确定性、最近邻居学习,以及CDT的树内核学习,其中所有CDT子树的特征空间都受到SVM学习。
正面训练集是根据从Yahoo Answers、社交网络、包括Enron电子邮件的企业对话、客户投诉和记者采访中获得的正确对中构建的。通过针对包含相关关键字的不同随机请求和问题来附连响应使得请求和响应之间的相关性相似度高,来创建对应的负面训练集。评估显示,在请求-响应一致性弱的领域中在68-79%的案例中有可能识别有效对,而在强一致性领域中在80-82%的案例中有可能识别有效对。这些准确性对于支持自动化会话至关重要。这些准确性可与将话语树本身分类为有效或无效的基准任务相媲美,也可与事实性问题-问答系统相媲美。
我们相信,这项研究是第一个利用自动构建的话语树来提供问题回答支持的研究。先前的研究使用了特定的客户话语模型和功能,其难以进行系统性地收集、难以解释性地学习、难以进行反向工程以及彼此比较。我们得出结论,以CDT形式学习修辞结构是支持回答复杂问题、聊天机器人和对话管理的关键数据来源。
图28绘出了用于实现方面之一的分布式系统2800的简化图。在所示方面中,分布式系统2800包括一个或多个客户端计算设备2802、2804、2806和2808,其被配置为通过一个或多个网络2810执行和操作客户端应用,诸如web浏览器、专有客户端(例如,OracleForms)等。服务器2812可以经由网络2810与远程客户端计算设备2802、2804、2806和2808通信地耦合。
在各种方面中,服务器812可以适于运行由系统的一个或多个部件提供的一个或多个服务或软件应用。服务或软件应用可以包括非虚拟和虚拟环境。虚拟环境可以包括用于虚拟事件、展览、模拟器、教室、购物交易场所和企业的环境,无论是二维或者三维(3D)表示形式、基于页面的逻辑环境还是其他形式。在一些方面中,这些服务可以作为基于web的服务或云服务被提供,或者在软件即服务(SaaS)模型下被提供给客户端计算设备2802、2804、2806和/或2808的用户。操作客户端计算设备2802、2804、2806和/或2808的用户又可以利用一个或多个客户端应用来与服务器2812交互以利用由这些部件提供的服务。
在图中绘出的配置中,系统2800的软件部件2818、2820和2822被示出为在服务器2812上实现。在其它方面中,系统2800的一个或多个部件和/或由这些部件提供的服务也可以由客户端计算设备2802、2804、2806和/或2808中的一个或多个来实现。然后,操作客户端计算设备的用户可以利用一个或多个客户端应用来使用由这些部件提供的服务。这些部件可以用硬件、固件、软件或其组合来实现。应该认识到的是,各种不同的系统配置是可能的,其可能与分布式系统2800不同。图中所示的方面因此是用于实现方面系统的分布式系统的一个示例,而不是要进行限制。
客户端计算设备2802、2804、2806和/或2808可以是便携式手持设备(例如,蜂窝电话、/>计算平板电脑、个人数字助理(PDA))或可穿戴设备(例如,Google/>头戴式显示器),运行诸如Microsoft Windows/>和/或各种移动操作系统(诸如iOS、Windows Phone、Android、BlackBerry 10、Palm OS等)的软件,并且启用互联网、电子邮件、短消息服务(SMS)、/>或其它通信协议。客户端计算设备可以是通用个人计算机,作为示例,包括运行各种版本的Microsoft/>Apple/>和/或Linux操作系统的个人计算机和/或膝上型计算机。客户端计算设备可以是运行任何各种可商业获得的/>或类UNIX操作系统(包括但不限于各种GNU/Linux操作系统,诸如例如Google Chrome OS)的工作站计算机。替代地或附加地,客户端计算设备2802、2804、2806和2808可以是能够通过(一个或多个)网络2810通信的任何其它电子设备,诸如瘦客户端计算机、启用互联网的游戏系统(例如,具有或不具有手势输入设备的微软Xbox游戏控制台)和/或个人消息传送设备。
虽然示例性分布式系统2800被示出为具有四个客户端计算设备,但是可以支持任何数量的客户端计算设备。其它设备(诸如具有传感器的设备等)可以与服务器2812交互。
分布式系统2800中的(一个或多个)网络2810可以是本领域技术人员熟悉的、可以利用任何各种可商业获得的协议支持数据通信的任何类型的网络,其中协议包括但不限于TCP/IP(传输控制协议/网际协议)、SNA(系统网络体系架构)、IPX(互联网报文交换)、AppleTalk,等等。仅仅作为示例,(一个或多个)网络2810可以是局域网(LAN),诸如基于以太网、令牌环等的LAN。(一个或多个)网络2810可以是广域网和互联网。它可以包括虚拟网络,包括但不限于虚拟专用网(VPN)、内联网、外联网、公共交换电话网(PSTN)、红外网络、无线网络(例如,依据电子电气学会(IEEE)802.28协议套件、和/或任何其它无线协议当中任意一种操作的网络);和/或这些和/或其它网络的任意组合。
服务器2812可以由一个或多个通用计算机、专用服务器计算机(作为示例,包括PC(个人计算机)服务器、服务器、中档服务器、大型计算机、机架安装的服务器等)、服务器场、服务器集群或任何其它适当的布置和/或组合组成。服务器2812可以包括运行虚拟操作系统或涉及虚拟化的其他计算架构的一个或多个虚拟机。可以虚拟化一个或多个逻辑存储设备的灵活的池,以维护服务器的虚拟存储设备。服务器2812可以使用软件定义的网络来控制虚拟网络。在各种方面中,服务器2812可以适于运行在前述公开中所描述的一个或多个服务或软件应用。例如,服务器2812可以与用于执行以上根据本公开的方面描述的处理的服务器对应。
服务器2812可以运行包括以上讨论的操作系统当中任意一种的操作系统,以及任何可商业获得的服务器操作系统。服务器2812还可以运行任何各种附加的服务器应用和/或中间层应用,包括HTTP(超文本传输协议)服务器、FTP(文件传输协议)服务器、CGI(公共网关接口)服务器、服务器、数据库服务器,等等。示例性数据库服务器包括但不限于从Oracle、Microsoft、Sybase、IBM(国际商业机器)等可商业获得的那些数据库服务器。
在一些实现中,服务器2812可以包括一个或多个应用,以分析和整合从客户端计算设备802、804、806和808的用户接收到的数据馈送和/或事件更新。作为示例,数据馈送和/或事件更新可以包括,但不限于,馈送、/>更新或者从一个或多个第三方信息源接收到的实时更新和连续数据流,其可以包括与传感器数据应用、金融报价机、网络性能测量工具(例如,网络监视和流量管理应用)、点击流分析工具、汽车交通监视等相关的实时事件。服务器2812还可以包括一个或多个应用,以经由客户端计算设备2802、2804、2806和2808的一个或多个显示设备显示数据馈送和/或实时事件。
分布式系统2800还可以包括一个或多个数据库2814和2816。数据库2814和2816可以驻留在各种位置中。作为示例,数据库2814和2816中的一个或多个可以驻留在服务器2812本地的(和/或驻留在服务器2812中的)非瞬态存储介质上。替代地,数据库2814和2816可以远离服务器2812,并且经由基于网络的连接或专用的连接与服务器2812通信。在一组方面中,数据库2814和2816可以驻留在本领域技术人员熟悉的存储区域网络(SAN)中。类似地,用于执行服务器2812所具有的功能的任何必要的文件都可以适当地本地存储在服务器2812上和/或远程存储。在一组方面中,数据库2814和2816可以包括适于响应于SQL格式的命令而存储、更新和检索数据的关系数据库,诸如由Oracle提供的数据库。
图29是根据本公开的方面的系统环境2900的一个或多个部件的简化框图,通过该系统环境2900,由方面系统的一个或多个部件提供的服务可以作为云服务提供。在所示方面中,系统环境2900包括可以由用户使用以与提供云服务的云基础设施系统2902交互的一个或多个客户端计算设备2904、2906和2908。客户端计算设备可以被配置为操作客户端应用,诸如web浏览器、专有客户端应用(例如,Oracle Forms)或某种其它应用,这些应用可以由客户端计算设备的用户用来与云基础设施系统2902交互以使用由云基础设施系统2902提供的服务。
应该认识到的是,图中描绘的云基础设施系统2902可以具有除了所描绘的那些之外的其它部件。另外,图中所示的方面仅是可以结合本发明的方面的云基础设施系统的一个示例。在一些其它方面中,云基础设施系统2902可以具有比图中所示更多或更少的部件、可以组合两个或更多个部件、或者可以具有不同的部件配置或布置。
客户端计算设备2904、2906和2908可以是与上面针对2802、2804、2806和2808所描述的设备类似的设备。
虽然示例性系统环境2900被示出具有三个客户端计算设备,但是任何数量的客户端计算设备可以被支持。诸如具有传感器的设备等的其它设备可以与云基础设施系统2902交互。
(一个或多个)网络2910可以促进客户端2904、2906和2908与云基础设施系统2902之间的数据通信和交换。每个网络可以是本领域技术人员所熟悉的可以使用各种商业上可获得的协议(包括上面针对(一个或多个)网络2810所描述的那些协议)中的任何一种支持数据通信的任何类型的网络。
云基础设施系统2902可以包括一个或多个计算机和/或服务器,其可以包括上面针对服务器2829所描述的那些计算机和/或服务器。
在某些方面中,由云基础设施系统提供的服务可以包括按需对云基础设施系统的用户可用的许多服务,诸如在线数据存储和备份解决方案、基于Web的电子邮件服务、被托管的办公室(office)套件和文档协作服务、数据库处理、受管理的技术支持服务等。由云基础设施系统提供的服务可以动态扩展以满足云基础设施系统的用户的需要。由云基础设施系统提供的服务的具体实例化在本文中被称为“服务实例”。一般而言,从云服务提供商的系统经由通信网络(诸如互联网)对用户可用的任何服务被称为“云服务”。通常,在公共云环境中,构成云服务提供商的系统的服务器和系统与客户自己的本地服务器和系统不同。例如,云服务提供商的系统可以托管应用,并且用户可以经由诸如互联网的通信网络按需订购和使用应用。
在一些示例中,计算机网络云基础设施中的服务可以包括对存储装置、被托管的数据库、被托管的Web服务器、软件应用或由云供应商向用户提供的其它服务的受保护的计算机网络访问,或者如本领域中另外已知的那样。例如,服务可以包括通过互联网对云上的远程存储装置进行密码保护的访问。作为另一个示例,服务可以包括基于Web服务的被托管的关系数据库和脚本语言中间件引擎,以供联网的开发人员私有使用。作为另一个示例,服务可以包括对在云供应商的网站上托管的电子邮件软件应用的访问。
在某些方面中,云基础设施系统2902可以包括以自助服务、基于订阅、弹性可扩展、可靠、高度可用和安全的方式递送给客户的应用、中间件和数据库服务产品的套件。这种云基础设施系统的示例是由本受让人提供的Oracle公共云。
大量数据(有时称为大数据)可以由基础设施系统在许多级别和不同规模上托管和/或操纵。这样的数据可能包含庞大而复杂的数据集,以致于很难使用典型的数据库管理工具或传统的数据处理应用进行处理。例如,使用个人计算机或其基于机架的对应物可能难以存储、检索和处理兆兆字节级的数据。使用最新的关系数据库管理系统以及桌面统计数据和可视化程序包,可能难以处理这种大小的数据。他们可能需要运行数千台服务器计算机的超出常用软件工具的结构的大规模并行处理软件,才能在可容忍的经过时间内捕获、整理、管理和处理数据。
分析人员和研究人员可以存储和操纵非常大的数据集,以可视化大量数据,检测趋势和/或以其他方式与数据进行交互。并行链接的数十个、数百个或数千个处理器可以对此类数据进行操作,以呈现该数据或模拟对该数据或其表示的外力。这些数据集可能涉及结构化数据(例如,在数据库中组织的数据或根据结构化模型进行组织的数据)和/或非结构化数据(例如,电子邮件、图像、数据块(二进制大对象)、网页、复杂事件处理)。通过利用一个方面的能力来相对快速地将更多(或更少)计算资源集中在一个目标上,可以根据企业、政府机构、研究组织、私人、志趣相投的个人或组织或其他实体的需求,更好地利用云基础架构系统来对大型数据集执行任务。
在各种方面中,云基础设施系统2902可以适于自动供应、管理和跟踪客户对由云基础设施系统2902供给的服务的订阅。云基础设施系统2902可以经由不同的部署模型来提供云服务。例如,可以依据公共云模型提供服务,其中云基础设施系统2902被销售云服务的组织拥有(例如,被Oracle拥有),并且服务对一般公众或不同行业的企业可用。作为另一个示例,可以依据私有云模型来提供服务,其中云基础设施系统2902仅针对单个组织操作,并且可以为该组织内的一个或多个实体提供服务。还可以依据社区云模型来提供云服务,其中云基础设施系统2902和由云基础设施系统2902提供的服务由相关社区中的若干组织共享。云服务还可以依据混合云模型被提供,该混合云模型是两个或更多个不同模型的组合。
在一些方面中,由云基础设施系统2902提供的服务可以包括在软件即服务(SaaS)类别、平台即服务(PaaS)类别、基础设施即服务(IaaS)类别或包括混合服务的其它服务类别下提供的一个或多个服务。客户经由订阅订单可以订购由云基础设施系统2902提供的一个或多个服务。云基础设施系统2902然后执行处理以提供客户的订阅订单中的服务。
在一些方面中,由云基础设施系统2902提供的服务可以包括但不限于应用服务、平台服务和基础设施服务。在一些示例中,应用服务可以由云基础设施系统经由SaaS平台提供。SaaS平台可以被配置为提供落入SaaS类别的云服务。例如,SaaS平台可以提供在集成开发和部署平台上构建和递送按需应用套件的能力。SaaS平台可以管理和控制用于提供SaaS服务的底层软件和基础设施。通过利用由SaaS平台提供的服务,客户可以利用在云基础设施系统上执行的应用。客户可以获取应用服务,而无需客户购买单独的许可和支持。可以提供各种不同的SaaS服务。示例包括但不限于为大型组织提供销售绩效管理、企业集成和业务灵活性的解决方案的服务。
在一些方面中,平台服务可以由云基础设施系统经由PaaS平台提供。PaaS平台可以被配置为提供落入PaaS类别的云服务。平台服务的示例可以包括但不限于使组织(诸如Oracle)能够在共享的公共体系架构上整合现有应用以及充分利用平台提供的共享服务来构建新应用的能力的服务。PaaS平台可以管理和控制用于提供PaaS服务的底层软件和基础设施。客户可以获取由云基础架构系统提供的PaaS服务,而无需客户购买单独的许可和支持。平台服务的示例包括但不限于Oracle Java云服务(JCS)、Oracle数据库云服务(DBCS)等。
通过利用由PaaS平台提供的服务,客户可以采用由云基础设施系统支持的编程语言和工具,并且还控制所部署的服务。在一些方面中,由云基础设施系统提供的平台服务可以包括数据库云服务、中间件云服务(例如,Oracle融合中间件服务)和Java云服务。在一个方面中,数据库云服务可以支持共享服务部署模型,该模型使得组织能够汇集数据库资源并且以数据库云的形式向客户供应数据库即服务。在云基础设施系统中,中间件云服务可以为客户提供开发和部署各种业务应用的平台,并且Java云服务可以为客户提供部署Java应用的平台。
各种不同的基础设施服务可以由云基础设施系统中的IaaS平台提供。基础设施服务促进底层计算资源(诸如存储装置、网络和其它基础计算资源)的管理和控制,以供客户利用由SaaS平台和PaaS平台提供的服务。
在某些方面中,云基础设施系统2902还可以包括基础设施资源2930,用于向云基础设施系统的客户提供用于提供各种服务的资源。在一个方面中,基础设施资源2930可以包括预先集成和优化的硬件(诸如服务器、存储装置和联网资源)的组合,以执行由PaaS平台和SaaS平台提供的服务。
在一些方面中,云基础设施系统2902中的资源可以由多个用户共享并且根据需要动态重新分配。此外,可以将资源分配给在不同时区的用户。例如,云基础设施系统2930可以使在第一时区中的第一组用户能够在指定的小时数内利用云基础设施系统的资源,并且然后使相同资源能够被重新分配给位于不同时区的另一组用户,从而使资源的利用率最大化。
在某些方面中,可以提供由云基础设施系统2902的不同部件或模块以及由云基础设施系统2902提供的服务共享的多个内部共享服务2932。这些内部共享服务可以包括但不限于:安全和身份服务、集成服务、企业储存库服务、企业管理器服务、病毒扫描和白名单服务、高可用性、备份和恢复服务、启用云支持的服务、电子邮件服务、通知服务、文件传输服务等。
在某些方面中,云基础设施系统2902可以提供云基础设施系统中的云服务(例如,SaaS、PaaS和IaaS服务)的综合管理。在一个方面中,云管理功能可以包括用于供应、管理和跟踪由云基础设施系统2902接收到的客户订阅等的能力。
在一个方面中,如图中所绘出的,云管理功能可以由一个或多个模块提供,诸如订单管理模块2920、订单编排模块2922、订单供应模块2924、订单管理和监视模块2926,以及身份管理模块2928。这些模块可以包括一个或多个计算机和/或服务器或者使用一个或多个计算机和/或服务器来提供,这些计算机和/或服务器可以是通用计算机、专用服务器计算机、服务器场、服务器集群或任何其它适当的布置和/或组合。
在示例性操作2934中,使用客户端设备(诸如客户端设备2904、2906或2908)的客户可以通过请求由云基础设施系统2902提供的一个或多个服务并且下订阅由云基础设施系统2902供应的一个或多个服务来的订单来与云基础设施系统2902交互。在某些方面中,客户可以访问云用户界面(UI)(云UI 2912、云UI 2914和/或云UI 2916)并经由这些UI下订阅订单。云基础设施系统2902响应于客户下订单而接收到的订单信息可以包括识别客户以及客户想要订阅的云基础设施系统2902供应的一个或多个服务的信息。
在客户下订单之后,经由云UI 2912、2914和/或2916接收订单信息。
在操作2936处,订单存储在订单数据库2918中。订单数据库2918可以是由云基础设施系统2918操作和与其它系统元件一起操作的若干数据库之一。
在操作2938处,订单信息被转发到订单管理模块2920。在一些情况下,订单管理模块2920可以被配置为执行与订单相关的计费和记账功能,诸如验证订单、以及在验证后预订订单。
在操作2940处,将关于订单的信息传送到订单编排模块2922。订单编排模块2922可以利用订单信息为客户下的订单编排服务和资源的供应。在一些情况下,订单编排模块2922可以使用订单供应模块2924的服务来编排资源的供应以支持所订阅的服务。
在某些方面中,订单编排模块2922使得能够管理与每个订单相关联的业务过程并应用业务逻辑来确定订单是否应该进行到供应。在操作2942处,在接收到新订阅的订单时,订单编排模块2922向订单供应模块2924发送分配资源并配置履行订阅订单所需的那些资源的请求。订单供应模块2924使得能够为客户订购的服务分配资源。订单供应模块2924提供在由云基础设施系统2900提供的云服务和用于供应用于提供所请求的服务的资源的物理实现层之间的抽象层。因此,订单编排模块2922可以与实现细节(诸如服务和资源是否实际上即时供应或预先供应并仅在请求后才分配/指派)隔离。
在操作2944处,一旦供应了服务和资源,就可以通过云基础设施系统2902的订单供应模块2924向客户端设备2904、2906和/或2908上的客户发送所提供的服务的通知。
在操作2946处,订单管理和监视模块2926可以管理和跟踪客户的订阅订单。在一些情况下,订单管理和监视模块2926可以被配置为收集订阅订单中的服务的使用统计信息,诸如,所使用的存储量、传输的数据量、用户的数量,以及系统运行时间量和系统停机时间量。
在某些方面中,云基础设施系统2900可以包括身份管理模块2928。身份管理模块2928可以被配置为提供身份服务,诸如云基础设施系统2900中的访问管理和授权服务。在一些方面中,身份管理模块2928可以控制关于希望利用由云基础设施系统2902提供的服务的客户的信息。这样的信息可以包括认证这些客户的身份的信息以及描述这些客户被授权相对于各种系统资源(例如,文件、目录、应用、通信端口、存储器段等)执行哪些动作的信息。身份管理模块2928还可以包括对关于每个客户的描述性信息以及关于如何和由谁来访问和修改这些描述性信息的管理。
图30示出了其中可以实现本发明的各种方面的示例性计算机系统3000。系统3000可以用于实现上述任何计算机系统。如图所示,计算机系统3000包括经由总线子系统3002与多个外围子系统通信的处理单元3004。这些外围子系统可以包括处理加速单元3006、I/O子系统3008、存储子系统3018和通信子系统3024。存储子系统3018包括有形计算机可读存储介质3022和系统存储器3010。
总线子系统3002提供用于让计算机系统3000的各种部件和子系统按意图彼此通信的机制。虽然总线子系统3002被示意性地示出为单条总线,但是总线子系统的替代方面可以利用多条总线。总线子系统3002可以是若干种类型的总线结构中的任何一种,包括存储器总线或存储器控制器、外围总线、以及使用任何各种总线体系架构的局部总线。例如,这种体系架构可以包括工业标准体系架构(ISA)总线、微通道体系架构(MCA)总线、增强型ISA(EISA)总线、视频电子标准协会(VESA)局部总线和外围部件互连(PCI)总线,其可以被实现为按IEEE P3086.1标准制造的Mezzanine总线。
可以被实现为一个或多个集成电路(例如,常规微处理器或微控制器)的处理单元3004控制计算机系统3000的操作。一个或多个处理器可以被包括在处理单元3004中。这些处理器可以包括单核或多核处理器。在某些方面中,处理单元3004可以被实现为一个或多个独立的处理单元3032和/或3034,其中在每个处理单元中包括单核或多核处理器。在其它方面中,处理单元3004也可以被实现为通过将两个双核处理器集成到单个芯片中形成的四核处理单元。
在各种方面中,处理单元3004可以响应于程序代码执行各种程序并且可以维护多个并发执行的程序或进程。在任何给定的时间,要被执行的程序代码中的一些或全部代码可以驻留在(一个或多个)处理器3004中和/或存储子系统3018中。通过适当的编程,(一个或多个)处理器3004可以提供上述各种功能。计算机系统3000可以附加地包括处理加速单元3006,其可以包括数字信号处理器(DSP)、专用处理器,等等。
I/O子系统3008可以包括用户接口输入设备和用户接口输出设备。用户接口输入设备可以包括键盘、诸如鼠标或轨迹球的定点设备、结合到显示器中的触摸板或触摸屏、滚动轮、点击轮、拨盘、按钮、开关、键盘、具有语音命令识别系统的音频输入设备、麦克风以及其它类型的输入设备。用户接口输入设备可以包括,例如,运动感测和/或手势识别设备,诸如的Microsoft运动传感器,其使得用户能够使用手势和语音命令通过自然用户接口来控制诸如的Microsoft/>360游戏控制器的输入设备并与之交互。用户接口输入设备也可以包括眼睛姿势识别设备,诸如从用户检测眼睛活动(例如,当拍摄照片和/或做出菜单选择时的“眨眼”)并且将眼睛姿势转换为到输入设备(例如,Google/>)中的输入的Google/>眨眼检测器。此外,用户接口输入设备可以包括使用户能够通过语音命令与语音识别系统(例如,/>导航器)交互的语音识别感测设备。
用户接口输入设备也可以包括但不限于三维(3D)鼠标、操纵杆或指向棒、游戏面板和绘图板,以及音频/视频设备,诸如扬声器、数码相机、数码摄像机、便携式媒体播放器、网络摄像头、图像扫描仪、指纹扫描仪、条形码阅读器3D扫描仪、3D打印机、激光测距仪和视线跟踪设备。此外,用户接口输入设备可以包括,例如,医学成像输入设备,诸如计算机断层扫描、磁共振成像、正电子发射断层摄影术、医疗超声设备。用户接口输入设备也可以包括,例如,诸如MIDI键盘、数字乐器等的音频输入设备。
用户接口输出设备可以包括显示子系统、指示灯,或者诸如音频输出设备的非可视显示器,等等。显示子系统可以是阴极射线管(CRT)、诸如使用液晶显示器(LCD)或等离子显示器的平板设备、投影设备、触摸屏,等等。一般而言,术语“输出设备”的使用意在包括用于从计算机系统3000向用户或其它计算机输出信息的所有可能类型的设备和机制。例如,用户接口输出设备可以包括,但不限于,可视地传达文本、图形和音频/视频信息的各种显示设备,诸如监视器、打印机、扬声器、耳机、汽车导航系统、绘图仪、语音输出设备,以及调制解调器。
计算机系统3000可以包括包含软件元件、被示为当前位于系统存储器3010中的存储子系统3018。系统存储器3010可以存储可加载并且可在处理单元3004上执行的程序指令,以及在这些程序的执行期间所产生的数据。
取决于计算机系统3000的配置和类型,系统存储器3010可以是易失性的(诸如随机存取存储器(RAM))和/或非易失性的(诸如只读存储器(ROM)、闪存存储器,等等)。RAM通常包含可被处理单元3004立即访问和/或目前正被处理单元3004操作和执行的数据和/或程序模块。在一些实现中,系统存储器3010可以包括多种不同类型的存储器,例如静态随机存取存储器(SRAM)或动态随机存取存储器(DRAM)。在一些实现中,诸如包含有助于在启动期间在计算机系统3000的元件之间传送信息的基本例程的基本输入/输出系统(BIOS),通常可以被存储在ROM中。作为示例,但不是限制,系统存储器3010也示出了可以包括客户端应用、web浏览器、中间层应用、关系数据库管理系统(RDBMS)等的应用程序3012,程序数据3014,以及操作系统3016。作为示例,操作系统3016可以包括各种版本的MicrosoftApple/>和/或Linux操作系统、各种可商业获得的/>或类UNIX操作系统(包括但不限于各种GNU/Linux操作系统、Google/>操作系统等)和/或诸如iOS、/>Phone、/>OS、/>10 OS和OS操作系统的移动操作系统。
存储子系统3018也可以提供用于存储提供一些方面的功能的基本编程和数据结构的有形计算机可读存储介质。当被处理器执行时提供上述功能的软件(程序、代码模块、指令)可以被存储在存储子系统3018中。这些软件模块或指令可以被处理单元3004执行。存储子系统3018也可以提供用于存储根据本发明被使用的数据的储存库。
存储子系统3000也可以包括可被进一步连接到计算机可读存储介质3022的计算机可读存储介质读取器3020。与系统存储器3010一起并且,可选地,与其相结合,计算机可读存储介质3022可以全面地表示用于临时和/或更持久地包含、存储、发送和检索计算机可读信息的远程、本地、固定和/或可移除存储设备加存储介质。
包含代码或代码的部分的计算机可读存储介质3022也可以包括本领域已知或使用的任何适当的介质,包括存储介质和通信介质,诸如但不限于,以用于信息的存储和/或传输的任何方法或技术实现的易失性和非易失性、可移除和不可移除介质。这可以包括有形的非暂时性计算机可读存储介质,诸如RAM、ROM、电可擦除可编程ROM(EEPROM)、闪存存储器或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光学储存器、磁带盒、磁带、磁盘储存器或其它磁存储设备,或者其它有形的计算机可读介质。当被指定时,这也可以包括非有形的暂时性计算机可读介质,诸如数据信号、数据传输,或者可以被用来发送期望信息并且可以被计算系统3000访问的任何其它介质。
作为示例,计算机可读存储介质3022可以包括从不可移除的非易失性磁介质读取或写到其的硬盘驱动器、从可移除的非易失性磁盘读取或写到其的磁盘驱动器、以及从可移除的非易失性光盘(诸如CD ROM、DVD和盘或其它光学介质)读取或写到其的光盘驱动器。计算机可读存储介质3022可以包括,但不限于,/>驱动器、闪存卡、通用串行总线(USB)闪存驱动器、安全数字(SD)卡、DVD盘、数字音频带,等等。计算机可读存储介质3022也可以包括基于非易失性存储器的固态驱动器(SSD)(诸如基于闪存存储器的SSD、企业闪存驱动器、固态ROM等)、基于易失性存储器的SSD(诸如固态RAM、动态RAM、静态RAM)、基于DRAM的SSD,磁阻RAM(MRAM)SSD,以及使用基于DRAM和闪存存储器的SSD的组合的混合SSD。盘驱动器及其关联的计算机可读介质可以为计算机系统3000提供计算机可读指令、数据结构、程序模块及其它数据的非易失性存储。
通信子系统3024提供到其它计算机系统和网络的接口。通信子系统3024用作用于从其它系统接收数据和从计算机系统3000向其它系统发送数据的接口。例如,通信子系统3024可以使计算机系统3000能够经由互联网连接到一个或多个设备。在一些方面中,通信子系统3024可以包括用于访问无线语音和/或数据网络的射频(RF)收发器部件(例如,使用蜂窝电话技术,诸如3G、4G或EDGE(用于全球演进的增强型数据速率)的先进数据网络技术,WiFi(IEEE 802.28系列标准),或其它移动通信技术,或其任意组合)、全球定位系统(GPS)接收器部件和/或其它部件。在一些方面中,作为无线接口的附加或者替代,通信子系统3024可以提供有线网络连接(例如,以太网)。
在一些方面中,通信子系统3024也可以代表可以使用计算机系统3000的一个或多个用户接收结构化和/或非结构化数据馈送3026、事件流3028、事件更新3030等形式的输入通信。
作为示例,通信子系统3024可被配置为实时地从社交媒体网络和/或其它通信服务的用户接收非结构化的数据馈送3026,诸如馈送、/>更新、诸如丰富站点摘要(RSS)馈送的web馈送和/或来自一个或多个第三方信息源的实时更新。
此外,通信子系统3024也可被配置为接收连续数据流形式的数据,这可以包括本质上可以是连续的或无界的没有明确终止的实时事件的事件流3028和/或事件更新3030。产生连续数据的应用的示例可以包括,例如,传感器数据应用、金融报价机、网络性能测量工具(例如,网络监视和流量管理应用)、点击流分析工具、汽车流量监视,等等。
通信子系统3024也可被配置为向一个或多个数据库输出结构化和/或非结构化数据馈送3026、事件流3028、事件更新3030,等等,这一个或多个数据库可以与耦合到计算机系统3000的一个或多个流式数据源计算机通信。
计算机系统3000可以是各种类型之一,包括手持便携式设备(例如,蜂窝电话、/>计算平板电脑、PDA)、可穿戴设备(例如,Google/>头戴式显示器)、PC、工作站、大型机、信息站、服务器机架、或任何其它数据处理系统。
由于计算机和网络的不断变化的本质,在图中绘出的计算机系统3000的描述仅仅要作为具体的示例。具有比图中绘出的系统更多或更少部件的许多其它配置是可能的。例如,定制的硬件也可以被使用和/或特定的元素可以用硬件、固件、软件(包括applets)或其组合来实现。另外,也可以采用到诸如网络输入/输出设备之类的其它计算设备的连接。基于本文提供的公开内容和示教,本领域普通技术人员将认识到实现各种方面的其它方式和/或方法。
在前述的说明书中,本发明的各方面参考其具体方面进行了描述,但本领域技术人员将认识到的是,本发明不限于此。上述发明的各个特征和方面可以被单独或联合使用。此外,在不脱离本说明书的更广泛精神和范围的情况下,方面可以在除本文所述的那些之外的任何数目的环境和应用中被使用。相应地,本说明书和附图应当被认为是说明性而不是限制性的。

Claims (39)

1.一种用于计算一个或多个句子片段之间的修辞关系的计算机实现的方法,所述方法包括:
访问包括多个片段的句子,其中至少一个片段包括动词和多个词语,每个词语包括所述词语在所述片段内的角色,其中每个片段是基本话语单元;
生成表示所述多个片段之间的修辞关系的话语树,其中所述话语树包括多个节点,每个非终止节点表示所述多个片段中的两个片段之间的修辞关系,所述话语树的所述节点中的每个终止节点与所述多个片段中的一个片段是相关联的;
将具有动词的每个片段匹配到动词签名,从而创建交流话语树,所述匹配包括:
访问多个动词签名,其中每个动词签名包括片段的所述动词和题元角色序列,其中每个题元角色描述所述动词和相关词语之间的相应关系;
对于所述多个动词签名中的每个动词签名,确定该相应动词签名的多个题元角色,其中所述题元角色中的每个题元角色与所述片段内的词语的角色匹配;
基于特定动词签名包括最高角色匹配数量,从所述多个动词签名中选择所述特定动词签名;以及
将所述特定动词签名与所述片段关联;
从所述多个片段中识别第一片段和第二片段,所述第一片段具有第一动词签名,并且所述第二片段具有第二动词签名,并且其中所述第一动词签名包括题元角色;
确定所述第二片段与所述第一片段的所述题元角色对应;以及
将所述交流话语树的非终止节点与包括所述第一动词签名和所述第二动词签名的经更新的动词签名关联。
2.如权利要求1所述的方法,其中所述交流话语树是第一交流话语树,所述方法还包括:
识别所述第一交流话语树与多个交流话语树中的第二交流话语树之间的最佳匹配;
访问与所述第二交流话语树相关联的文本;以及
将与所述第二交流话语树相关联的文本发送到移动设备。
3.如权利要求1所述的方法,还包括:
从服务器设备以及从用户设备接收包括句子的请求,其中所述句子包括问题;
访问多个候选答案;
通过为所述多个候选答案中的每个候选答案创建相应候选答案交流话语树来确定多个候选答案交流话语树;
针对所述候选答案中的每个候选答案,基于相应候选答案交流话语树与所述交流话语树之间的比较来确定分数;以及
向所述服务器设备提供与具有最高分数的相应候选答案交流话语树对应的答案。
4.如权利要求1所述的方法,其中所述关联还包括:
识别所述特定动词签名中的所述多个题元角色中的每个题元角色;以及
对于所述特定动词签名中的所述多个题元角色中的每个题元角色,将所述片段中的对应词语匹配到该题元角色。
5.如权利要求1所述的方法,其中所述动词是交流动词。
6.如权利要求1所述的方法,其中所述多个动词签名中的每个动词签名包括(i)副词、(ii)名词短语、或(iii)名词之一。
7.一种存储计算机可执行程序指令的非暂态计算机可读存储介质,其中所述计算机可执行程序指令在由处理设备执行时,使所述处理设备执行包括以下各项的操作:
访问包括多个片段的句子,其中至少一个片段包括动词和多个词语,每个词语包括所述词语在所述片段内的角色,其中每个片段是基本话语单元;
生成表示所述多个片段之间的修辞关系的话语树,其中所述话语树包括多个节点,每个非终止节点表示所述多个片段中的两个片段之间的修辞关系,所述话语树的所述节点中的每个终止节点与所述多个片段中的一个片段是相关联的;
将具有动词的每个片段匹配到动词签名,从而创建交流话语树,所述匹配包括:
访问多个动词签名,其中每个动词签名包括片段的所述动词和题元角色序列,其中每个题元角色描述所述动词和相关词语之间的相应关系;
对于所述多个动词签名中的每个动词签名,确定该相应动词签名的多个题元角色,其中所述题元角色中的每个题元角色与所述片段内的词语的角色匹配;
基于特定动词签名包括最高角色匹配数量,从所述多个动词签名中选择所述特定动词签名;以及
将所述特定动词签名与所述片段相关联;
从所述多个片段中识别第一片段和第二片段,所述第一片段具有第一动词签名,并且所述第二片段具有第二动词签名,并且其中所述第一动词签名包括题元角色;
确定所述第二片段与所述第一片段的所述题元角色对应;以及
将所述交流话语树的非终止节点与包括所述第一动词签名和所述第二动词签名的经更新的动词签名关联。
8.如权利要求7所述的非暂态计算机可读存储介质,其中所述交流话语树是第一交流话语树,所述操作还包括:
识别所述第一交流话语树与多个交流话语树中的第二交流话语树之间的最佳匹配;
访问与所述第二交流话语树相关联的文本;以及
将与所述第二交流话语树相关联的文本发送到移动设备。
9.如权利要求7所述的非暂态计算机可读存储介质,所述操作还包括:
从服务器设备以及从用户设备接收包括句子的请求,其中所述句子包括问题;
访问多个候选答案;
通过为所述多个候选答案中的每个候选答案创建相应候选答案交流话语树来确定多个候选答案交流话语树;
针对所述候选答案中的每个候选答案,基于相应候选答案交流话语树与所述交流话语树之间的比较来确定分数;以及
向所述服务器设备提供与具有最高分数的相应候选答案交流话语树对应的答案。
10.如权利要求7所述的非暂态计算机可读存储介质,其中所述关联还包括:
识别所述特定动词签名中的所述多个题元角色中的每个题元角色;以及
对于所述特定动词签名中的所述多个题元角色中的每个题元角色,将所述片段中的对应词语匹配到该题元角色。
11.如权利要求7所述的非暂态计算机可读存储介质,其中所述动词是交流动词。
12.如权利要求7所述的非暂态计算机可读存储介质,其中所述多个动词签名中的每个动词签名包括(i)副词、(ii)名词短语、或(iii)名词之一。
13.一种计算机系统,包括:
非暂态计算机可读介质,存储计算机可执行程序指令;以及
通信地耦合到所述非暂态计算机可读介质的处理设备,用于执行所述计算机可执行程序指令,其中执行所述计算机可执行程序指令将所述处理设备配置为执行包括以下各项的操作:
访问包括多个片段的句子,其中至少一个片段包括动词和多个词语,每个词语包括所述词语在所述片段内的角色,其中每个片段是基本话语单元;
生成表示所述多个片段之间的修辞关系的话语树,其中所述话语树包括多个节点,每个非终止节点表示所述多个片段中的两个片段之间的修辞关系,所述话语树的所述节点中的每个终止节点与所述多个片段中的一个片段是相关联的;
将具有动词的每个片段匹配到动词签名,从而创建交流话语树,所述匹配包括:
访问多个动词签名,其中每个动词签名包括片段的所述动词和题元角色序列,其中每个题元角色描述所述动词和相关词语之间的相应关系;
对于所述多个动词签名中的每个动词签名,确定该相应动词签名的多个题元角色,其中所述题元角色中的每个题元角色与所述片段内的词语的角色匹配;
基于特定动词签名包括最高角色匹配数量,从所述多个动词签名中选择所述特定动词签名;以及
将所述特定动词签名与所述片段相关联;
从所述多个片段中识别第一片段和第二片段,所述第一片段具有第一动词签名,并且所述第二片段具有第二动词签名,并且其中所述第一动词签名包括题元角色;
确定所述第二片段与所述第一片段的所述题元角色对应;以及
将所述交流话语树的非终止节点与包括所述第一动词签名和所述第二动词签名的经更新的动词签名关联。
14.如权利要求13所述的计算机系统,其中所述交流话语树是第一交流话语树,还包括:
识别所述第一交流话语树与多个交流话语树中的第二交流话语树之间的最佳匹配;
访问与所述第二交流话语树相关联的文本;以及
将与所述第二交流话语树相关联的文本发送到移动设备。
15.如权利要求13所述的计算机系统,所述操作还包括:
从服务器设备以及从用户设备接收包括问题的请求;
访问多个候选答案;
通过为所述多个候选答案中的每个候选答案创建交流话语树来确定多个候选答案交流话语树;
针对所述候选答案中的每个候选答案,基于相应候选答案交流话语树与所述交流话语树之间的比较来确定分数;以及
向所述服务器设备提供与具有最高分数的交流话语树对应的答案。
16.如权利要求13所述的计算机系统,其中所述关联还包括:
识别所述特定动词签名中的所述多个题元角色中的每个题元角色;以及
对于所述特定动词签名中的所述多个题元角色中的每个题元角色,将所述片段中的对应词语匹配到该题元角色。
17.如权利要求13所述的计算机系统,其中所述动词是交流动词。
18.一种用于通过分析交流话语树来确定一对的两个句子的互补性的计算机实现的方法,所述方法包括:
针对问题句子,确定包括问题根节点的问题交流话语树,其中交流话语树是包括交流动作的话语树;
针对答案句子,确定答案交流话语树,其中所述答案交流话语树包括答案根节点;
其中所述问题交流话语树和所述答案交流话语树中的每个交流话语树包括具有文本的多个片段之间的修辞关系的话语树,其中具有动词的每个片段通过以下方式被匹配到动词签名:
访问多个动词签名,其中每个动词签名包括片段的所述动词和题元角色序列,其中每个题元角色描述所述动词和相关词语之间的相应关系;
对于所述多个动词签名中的每个动词签名,确定该相应动词签名的多个题元角色,其中每个题元角色与所述片段中的词语的角色匹配;
基于特定动词签名包括最高数量的匹配的角色,从所述多个动词签名中选择所述特定动词签名;以及
将所述特定动词签名与所述片段关联;
通过识别所述问题根节点和所述答案根节点是相同的,来合并所述交流话语树,其中,在经合并的交流话语树中,所述问题交流话语树和所述答案交流话语树被表示为来自该相同根节点的不同分支;
通过将预测模型应用于经合并的交流话语树来计算所述问题交流话语树和所述答案交流话语树之间的互补级别;以及
响应于确定所述互补级别高于阈值,将所述问题句子和所述答案句子识别为是互补的。
19.如权利要求18所述的方法,还包括通过创建附加交流话语树来将所述问题交流话语树和所述答案交流话语树关联。
20.如权利要求18所述的方法,其中所述预测模型用丛林学习机器学习算法来训练,以确定两个交流话语树的子树的互补级别。
21.如权利要求20所述的方法,还包括:
将所述经合并的交流话语树的基本话语单元与对应的解析树对齐;以及
将所述经合并的交流话语树的所述基本话语单元与所述对应的解析树合并。
22.如权利要求18所述的方法,其中所述预测模型是机器学习算法,所述机器学习算法被训练以确定被识别为匹配或不匹配的两个交流话语树之间的互补级别。
23.如权利要求18所述的方法,其中所述经合并的交流话语树是第一交流话语树,所述方法还包括:
识别所述第一交流话语树与多个交流话语树中的第二交流话语树之间的最佳匹配;
访问与所述第二交流话语树相关联的文本;以及
将与所述第二交流话语树相关联的文本发送到移动设备。
24.如权利要求18所述的方法,还包括:
向移动设备发送(i)所述问题句子或(ii)所述答案句子之一作为搜索结果。
25.一种用于通过分析交流话语树来训练分类模型以预测一对的两个句子的互补性的计算机实现的方法,所述方法包括:
访问包括一组训练对的训练数据集合,其中每个训练对包括表示问题的问题交流话语树和表示答案的答案交流话语树以及预期互补级别;
其中所述问题交流话语树和所述答案交流话语树中的每个交流话语树包括具有文本的多个片段之间的修辞关系的话语树,其中具有动词的每个片段通过以下方式被匹配到动词签名:
访问多个动词签名,其中每个动词签名包括片段的所述动词和题元角色序列,其中每个题元角色描述所述动词和相关词语之间的相应关系;
对于所述多个动词签名中的每个动词签名,确定该相应动词签名的多个题元角色,其中每个题元角色与所述片段中的词语的角色匹配;
基于特定动词签名包括最高数量的匹配的角色,从所述多个动词签名中选择所述特定动词签名;以及
将所述特定动词签名与所述片段关联;
以及
通过迭代地进行以下操作来训练分类模型:
向所述分类模型提供所述训练对中的一个训练对,其中所提供的训练对由经合并的交流话语树表示,所述经合并的交流话语树是通过识别所述问题交流话语树的问题根节点与所述答案交流话语树的答案根节点是相同的而合并所述问题交流话语树和所述答案交流话语树来创建的,其中,在经合并的交流话语树中,所述问题交流话语树和所述答案交流话语树被表示为来自该相同根节点的不同分支;
从所述分类模型接收所确定的互补级别;
通过计算所确定的互补级别与相应的预期互补级别之间的差来计算损失函数;以及
调整所述分类模型的内部参数以使所述损失函数最小化。
26.如权利要求25所述的方法,其中所述训练数据集合包括问题答案对,所述问题答案对包括问题以及相关的但与所述问题相比修辞上不正确的答案。
27.一种计算机系统,包括:
非暂态计算机可读介质,存储计算机可执行程序指令;以及
通信地耦合到所述计算机可读介质的处理设备,用于执行所述计算机可执行程序指令,其中执行所述计算机可执行程序指令将所述处理设备配置为执行包括以下各项的操作:
针对问题句子,确定包括问题根节点的问题交流话语树,其中交流话语树是包括交流动作的话语树;
针对答案句子,确定答案交流话语树,其中所述答案交流话语树包括答案根节点;
其中所述问题交流话语树和所述答案交流话语树中的每个交流话语树包括具有文本的多个片段之间的修辞关系的话语树,其中具有动词的每个片段通过以下方式被匹配到动词签名:
访问多个动词签名,其中每个动词签名包括片段的所述动词和题元角色序列,其中每个题元角色描述所述动词和相关词语之间的相应关系;
对于所述多个动词签名中的每个动词签名,确定该相应动词签名的多个题元角色,其中每个题元角色与所述片段中的词语的角色匹配;
基于特定动词签名包括最高数量的匹配的角色,从所述多个动词签名中选择所述特定动词签名;以及
将所述特定动词签名与所述片段关联;
通过识别所述问题根节点和所述答案根节点是相同的,来合并所述交流话语树,其中,在经合并的交流话语树中,所述问题交流话语树和所述答案交流话语树被表示为来自该相同根节点的不同分支;
通过将预测模型应用于经合并的交流话语树来计算所述问题交流话语树和所述答案交流话语树之间的互补级别;以及
响应于确定所述互补级别高于阈值,将所述问题句子和所述答案句子识别为是互补的。
28.如权利要求27所述的计算机系统,所述操作还包括通过创建附加交流话语树来将所述问题交流话语树和所述答案交流话语树关联。
29.如权利要求27所述的计算机系统,其中所述预测模型用丛林学习机器学习算法来训练,以确定两个交流话语树的子树的互补级别。
30.如权利要求27所述的计算机系统,所述操作还包括:
将经合并的交流话语树的基本话语单元与对应的解析树对齐;以及
将所述经合并的交流话语树的所述基本话语单元与所述对应的解析树合并。
31.如权利要求27所述的计算机系统,其中所述预测模型是神经网络机器学习算法,所述神经网络机器学习算法被训练以确定被识别为匹配或不匹配的两个交流话语树之间的互补级别。
32.如权利要求27所述的计算机系统,还包括:
向移动设备发送(i)所述问题句子或(ii)所述答案句子中的一者或两者作为搜索结果。
33.如权利要求27所述的计算机系统,所述操作还包括:
访问包括一组训练对的训练数据集合,其中每个训练对包括表示问题的问题交流话语树和表示答案的答案交流话语树以及预期互补级别;以及
通过迭代地进行以下操作来训练分类模型:
向所述分类模型提供所述训练对中的一个训练对,
从所述分类模型接收所确定的互补级别;
通过计算所确定的互补级别和相应的预期互补级别之间的差来计算损失函数;以及
调整所述分类模型的内部参数以使所述损失函数最小化。
34.如权利要求33所述的计算机系统,其中所述训练数据集合包括问题答案对,所述问题答案对包括问题以及相关的但与所述问题相比修辞上不正确的答案。
35.如权利要求27所述的计算机系统,所述操作还包括:
从表示问题的问题交流话语树和表示答案的答案交流话语树创建经合并的话语树;以及
通过将预测模型应用于所述经合并的话语树来计算所述问题交流话语树和所述答案交流话语树之间的互补级别。
36.如权利要求27所述的计算机系统,其中所述经合并的话语树是第一交流话语树,所述操作还包括:
识别所述第一交流话语树与多个交流话语树中的第二交流话语树之间的最佳匹配;
访问与所述第二交流话语树相关联的文本;以及
将与所述第二交流话语树相关联的文本发送到移动设备。
37.一种计算机系统,包括:
存储计算机可执行程序指令的非暂态计算机可读介质;以及
通信地耦合到所述非暂态计算机可读介质的处理设备,用于执行所述计算机可执行程序指令,其中执行所述计算机可执行程序指令将所述处理设备配置为执行如权利要求25-26中任一项权利要求所述的方法。
38.一种存储计算机可执行程序指令的非暂态计算机可读介质,其中所述程序指令在由处理设备执行时,使得所述处理设备执行如权利要求18-24或权利要求25-26中任一项权利要求所述的方法。
39.一种包括用于执行如权利要求1-6、权利要求18-24、或权利要求25-26中任一项权利要求所述的方法的部件的计算机装置。
CN201880030891.1A 2017-05-10 2018-05-09 通过使用交流话语树启用修辞分析 Active CN110612525B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762504377P 2017-05-10 2017-05-10
US62/504,377 2017-05-10
PCT/US2018/031890 WO2018208979A1 (en) 2017-05-10 2018-05-09 Enabling rhetorical analysis via the use of communicative discourse trees

Publications (2)

Publication Number Publication Date
CN110612525A CN110612525A (zh) 2019-12-24
CN110612525B true CN110612525B (zh) 2024-03-19

Family

ID=62386977

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880030891.1A Active CN110612525B (zh) 2017-05-10 2018-05-09 通过使用交流话语树启用修辞分析

Country Status (5)

Country Link
US (4) US10853581B2 (zh)
EP (1) EP3622412A1 (zh)
JP (4) JP7086993B2 (zh)
CN (1) CN110612525B (zh)
WO (1) WO2018208979A1 (zh)

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10810368B2 (en) * 2012-07-10 2020-10-20 Robert D. New Method for parsing natural language text with constituent construction links
US20210357585A1 (en) * 2017-03-13 2021-11-18 Arizona Board Of Regents On Behalf Of The University Of Arizona Methods for extracting and assessing information from literature documents
US11960844B2 (en) 2017-05-10 2024-04-16 Oracle International Corporation Discourse parsing using semantic and syntactic relations
US10599885B2 (en) 2017-05-10 2020-03-24 Oracle International Corporation Utilizing discourse structure of noisy user-generated content for chatbot learning
US11373632B2 (en) 2017-05-10 2022-06-28 Oracle International Corporation Using communicative discourse trees to create a virtual persuasive dialogue
US11386274B2 (en) 2017-05-10 2022-07-12 Oracle International Corporation Using communicative discourse trees to detect distributed incompetence
US11615145B2 (en) 2017-05-10 2023-03-28 Oracle International Corporation Converting a document into a chatbot-accessible form via the use of communicative discourse trees
EP3622412A1 (en) 2017-05-10 2020-03-18 Oracle International Corporation Enabling rhetorical analysis via the use of communicative discourse trees
US11586827B2 (en) 2017-05-10 2023-02-21 Oracle International Corporation Generating desired discourse structure from an arbitrary text
US10679182B2 (en) * 2017-05-17 2020-06-09 International Business Machines Corporation System for meeting facilitation
US11100144B2 (en) 2017-06-15 2021-08-24 Oracle International Corporation Data loss prevention system for cloud security based on document discourse analysis
US10902738B2 (en) * 2017-08-03 2021-01-26 Microsoft Technology Licensing, Llc Neural models for key phrase detection and question generation
CN111226245A (zh) * 2017-08-18 2020-06-02 Isms解决方案有限责任公司 基于计算机的用于分析协定的学习系统
CN111149100B (zh) 2017-09-28 2023-08-29 甲骨文国际公司 基于命名实体的解析和识别确定跨文档的修辞相互关系
US11809825B2 (en) 2017-09-28 2023-11-07 Oracle International Corporation Management of a focused information sharing dialogue based on discourse trees
US11107006B2 (en) * 2017-12-05 2021-08-31 discourse.ai, Inc. Visualization, exploration and shaping conversation data for artificial intelligence-based automated interlocutor training
US11341422B2 (en) * 2017-12-15 2022-05-24 SHANGHAI XIAOl ROBOT TECHNOLOGY CO., LTD. Multi-round questioning and answering methods, methods for generating a multi-round questioning and answering system, and methods for modifying the system
US11537645B2 (en) 2018-01-30 2022-12-27 Oracle International Corporation Building dialogue structure by using communicative discourse trees
JP6818706B2 (ja) * 2018-02-13 2021-01-20 日本電信電話株式会社 情報提供装置、情報提供方法、およびプログラム
JP6973157B2 (ja) * 2018-02-16 2021-11-24 日本電信電話株式会社 議論構造拡張装置、議論構造拡張方法、及びプログラム
WO2019217722A1 (en) 2018-05-09 2019-11-14 Oracle International Corporation Constructing imaginary discourse trees to improve answering convergent questions
US11455494B2 (en) 2018-05-30 2022-09-27 Oracle International Corporation Automated building of expanded datasets for training of autonomous agents
CN110580335B (zh) * 2018-06-07 2023-05-26 阿里巴巴集团控股有限公司 用户意图的确定方法及装置
JP7185489B2 (ja) * 2018-10-30 2022-12-07 株式会社日立システムズ リソース割り当て方法およびリソース割り当てシステム
CN111177328B (zh) * 2018-11-12 2023-04-28 阿里巴巴集团控股有限公司 问答匹配系统和方法及问答处理设备和介质
US20200151583A1 (en) * 2018-11-13 2020-05-14 Capital One Services, Llc Attentive dialogue customer service system and method
US20200184016A1 (en) * 2018-12-10 2020-06-11 Government Of The United States As Represetned By The Secretary Of The Air Force Segment vectors
CN109710746A (zh) * 2018-12-28 2019-05-03 北京猎户星空科技有限公司 信息处理方法、装置及电子设备
CN109977407A (zh) * 2019-03-27 2019-07-05 北京信息科技大学 一种基于词嵌入的书面语篇多层次差异分析方法
US11501233B2 (en) * 2019-05-21 2022-11-15 Hcl Technologies Limited System and method to perform control testing to mitigate risks in an organization
US11487945B2 (en) * 2019-07-02 2022-11-01 Servicenow, Inc. Predictive similarity scoring subsystem in a natural language understanding (NLU) framework
US11645513B2 (en) * 2019-07-03 2023-05-09 International Business Machines Corporation Unary relation extraction using distant supervision
US11449682B2 (en) 2019-08-29 2022-09-20 Oracle International Corporation Adjusting chatbot conversation to user personality and mood
KR20210044559A (ko) * 2019-10-15 2021-04-23 삼성전자주식회사 출력 토큰 결정 방법 및 장치
US11556698B2 (en) * 2019-10-22 2023-01-17 Oracle International Corporation Augmenting textual explanations with complete discourse trees
US11580298B2 (en) 2019-11-14 2023-02-14 Oracle International Corporation Detecting hypocrisy in text
US11501085B2 (en) 2019-11-20 2022-11-15 Oracle International Corporation Employing abstract meaning representation to lay the last mile towards reading comprehension
US11775772B2 (en) * 2019-12-05 2023-10-03 Oracle International Corporation Chatbot providing a defeating reply
US11521611B2 (en) 2019-12-19 2022-12-06 Palo Alto Research Center Incorporated Using conversation structure and content to answer questions in multi-part online interactions
CN111259162B (zh) * 2020-01-08 2023-10-03 百度在线网络技术(北京)有限公司 对话交互方法、装置、设备和存储介质
US11636270B2 (en) * 2020-01-29 2023-04-25 Adobe Inc. Methods and systems for generating a semantic computation graph for understanding and grounding referring expressions
US11847420B2 (en) 2020-03-05 2023-12-19 Oracle International Corporation Conversational explainability
US11741308B2 (en) 2020-05-14 2023-08-29 Oracle International Corporation Method and system for constructing data queries from conversational input
US11550605B2 (en) * 2020-06-30 2023-01-10 Kasisto, Inc. Building and managing cohesive interaction for virtual assistants
CN112035628A (zh) * 2020-08-03 2020-12-04 北京小米松果电子有限公司 对话数据清洗方法、装置及存储介质
CN112632286A (zh) * 2020-09-21 2021-04-09 北京合享智慧科技有限公司 一种文本属性特征的识别、分类及结构分析方法及装置
US20220114346A1 (en) * 2020-10-12 2022-04-14 Oracle International Corporation Multi case-based reasoning by syntactic-semantic alignment and discourse analysis
CN112256849B (zh) * 2020-10-20 2024-02-13 深圳前海微众银行股份有限公司 模型训练方法、文本检测方法、装置、设备和存储介质
US11928437B2 (en) * 2021-02-02 2024-03-12 Oracle International Corporation Machine reading between the lines
CN112732888A (zh) * 2021-04-01 2021-04-30 中国人民解放军国防科技大学 一种基于图推理模型的答案预测方法及装置
CN113590744B (zh) * 2021-06-30 2024-05-24 中山大学 一种面向可解释的情感溯源方法
US11928109B2 (en) * 2021-08-18 2024-03-12 Oracle International Corporation Integrative configuration for bot behavior and database behavior
CN113609840B (zh) * 2021-08-25 2023-06-16 西华大学 一种汉语法律判决摘要生成方法及系统
WO2023137545A1 (en) * 2022-01-20 2023-07-27 Verb Phrase Inc. Systems and methods for content analysis
EP4270403A1 (en) * 2022-04-25 2023-11-01 Fujitsu Limited Health metric and diagnosis determination
CN116432752B (zh) * 2023-04-27 2024-02-02 华中科技大学 一种隐式篇章关系识别模型的构建方法及其应用

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004295834A (ja) * 2003-03-28 2004-10-21 Csk Corp 文字発話記録の分析装置、分析方法および分析プログラム、情報群の分析装置、分析方法および分析プログラム
CN101957812A (zh) * 2010-09-21 2011-01-26 上海大学 基于事件本体的动词语义信息提取方法
CN102165518A (zh) * 2008-08-27 2011-08-24 罗伯特·博世有限公司 用于在对话系统中从用户话语产生自然语言短语的系统和方法
CN103530281A (zh) * 2013-10-15 2014-01-22 苏州大学 一种论元抽取方法和系统
US8935152B1 (en) * 2008-07-21 2015-01-13 NetBase Solutions, Inc. Method and apparatus for frame-based analysis of search results
CN104484411A (zh) * 2014-12-16 2015-04-01 中国科学院自动化研究所 一种基于词典的语义知识库的构建方法
CN105955956A (zh) * 2016-05-05 2016-09-21 中国科学院自动化研究所 一种汉语隐式篇章关系识别方法
CN106021224A (zh) * 2016-05-13 2016-10-12 中国科学院自动化研究所 一种双语篇章标注方法
CN106445911A (zh) * 2016-03-18 2017-02-22 苏州大学 一种基于微观话题结构的指代消解方法及系统
CN106502981A (zh) * 2016-10-09 2017-03-15 广西师范大学 基于词性、句法和词典的比喻修辞句自动分析与判定方法

Family Cites Families (120)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2696853B1 (fr) * 1992-10-12 1994-12-23 Bull Sa Procédé d'aide à l'optimisation d'une requête d'un système de gestion, de base de données relationnel et procédé d'analyse syntaxique en résultant.
US8725493B2 (en) * 2004-01-06 2014-05-13 Neuric Llc Natural language parsing method to provide conceptual flow
US5930392A (en) * 1996-07-12 1999-07-27 Lucent Technologies Inc. Classification technique using random decision forests
US6181909B1 (en) 1997-07-22 2001-01-30 Educational Testing Service System and method for computer-based automatic essay scoring
US6112168A (en) 1997-10-20 2000-08-29 Microsoft Corporation Automatically recognizing the discourse structure of a body of text
US20070294229A1 (en) 1998-05-28 2007-12-20 Q-Phrase Llc Chat conversation methods traversing a provisional scaffold of meanings
US7152031B1 (en) * 2000-02-25 2006-12-19 Novell, Inc. Construction, manipulation, and comparison of a multi-dimensional semantic space
JP2001167087A (ja) * 1999-12-14 2001-06-22 Fujitsu Ltd 構造化文書検索装置,構造化文書検索方法,構造化文書検索用プログラム記録媒体および構造化文書検索用インデックス作成方法
US20010053968A1 (en) 2000-01-10 2001-12-20 Iaskweb, Inc. System, method, and computer program product for responding to natural language queries
AU2001261505A1 (en) * 2000-05-11 2001-11-20 University Of Southern California Machine translation techniques
US6961692B1 (en) * 2000-08-01 2005-11-01 Fuji Xerox Co, Ltd. System and method for writing analysis using the linguistic discourse model
US6731307B1 (en) 2000-10-30 2004-05-04 Koninklije Philips Electronics N.V. User interface/entertainment device that simulates personal interaction and responds to user's mental state and/or personality
US7519529B1 (en) 2001-06-29 2009-04-14 Microsoft Corporation System and methods for inferring informational goals and preferred level of detail of results in response to questions posed to an automated information-retrieval or question-answering service
US7127208B2 (en) * 2002-01-23 2006-10-24 Educational Testing Service Automated annotation
US7305336B2 (en) * 2002-08-30 2007-12-04 Fuji Xerox Co., Ltd. System and method for summarization combining natural language generation with structural analysis
US20040133579A1 (en) * 2003-01-06 2004-07-08 Richard Gordon Campbell Language neutral syntactic representation of text
US20040148170A1 (en) 2003-01-23 2004-07-29 Alejandro Acero Statistical classifiers for spoken language understanding and command/control scenarios
US7359860B1 (en) 2003-02-27 2008-04-15 Lumen Vox, Llc Call flow object model in a speech recognition system
US7139764B2 (en) * 2003-06-25 2006-11-21 Lee Shih-Jong J Dynamic learning and knowledge representation for data mining
US7373102B2 (en) * 2003-08-11 2008-05-13 Educational Testing Service Cooccurrence and constructions
US7610190B2 (en) * 2003-10-15 2009-10-27 Fuji Xerox Co., Ltd. Systems and methods for hybrid text summarization
US7551552B2 (en) 2003-10-17 2009-06-23 Microsoft Corporation Method for providing guaranteed distributed failure notification
US9646107B2 (en) * 2004-05-28 2017-05-09 Robert T. and Virginia T. Jenkins as Trustee of the Jenkins Family Trust Method and/or system for simplifying tree expressions such as for query reduction
US7698267B2 (en) * 2004-08-27 2010-04-13 The Regents Of The University Of California Searching digital information and databases
US8700404B1 (en) 2005-08-27 2014-04-15 At&T Intellectual Property Ii, L.P. System and method for using semantic and syntactic graphs for utterance classification
US20070073533A1 (en) * 2005-09-23 2007-03-29 Fuji Xerox Co., Ltd. Systems and methods for structural indexing of natural language text
US20070136284A1 (en) * 2005-12-12 2007-06-14 Sbc Knowledge Ventures Lp Method for constructing and repurposing rhetorical content
US7827028B2 (en) * 2006-04-07 2010-11-02 Basis Technology Corporation Method and system of machine translation
US10796093B2 (en) 2006-08-08 2020-10-06 Elastic Minds, Llc Automatic generation of statement-response sets from conversational text using natural language processing
US7925678B2 (en) 2007-01-12 2011-04-12 Loglogic, Inc. Customized reporting and mining of event data
US7840556B1 (en) * 2007-07-31 2010-11-23 Hewlett-Packard Development Company, L.P. Managing performance of a database query
US8306967B2 (en) 2007-10-02 2012-11-06 Loglogic, Inc. Searching for associated events in log data
US7890539B2 (en) * 2007-10-10 2011-02-15 Raytheon Bbn Technologies Corp. Semantic matching using predicate-argument structure
WO2009048434A1 (en) 2007-10-11 2009-04-16 Agency For Science, Technology And Research A dialogue system and a method for executing a fully mixed initiative dialogue (fmid) interaction between a human and a machine
US8463594B2 (en) * 2008-03-21 2013-06-11 Sauriel Llc System and method for analyzing text using emotional intelligence factors
US9646078B2 (en) 2008-05-12 2017-05-09 Groupon, Inc. Sentiment extraction from consumer reviews for providing product recommendations
US7937386B2 (en) 2008-12-30 2011-05-03 Complyon Inc. System, method, and apparatus for information extraction of textual documents
US20100169359A1 (en) * 2008-12-30 2010-07-01 Barrett Leslie A System, Method, and Apparatus for Information Extraction of Textual Documents
US8712759B2 (en) * 2009-11-13 2014-04-29 Clausal Computing Oy Specializing disambiguation of a natural language expression
US8478581B2 (en) * 2010-01-25 2013-07-02 Chung-ching Chen Interlingua, interlingua engine, and interlingua machine translation system
EP2534591A4 (en) 2010-02-10 2013-07-17 Mmodal Ip Llc PROVIDING A COUNTERABLE GUIDANCE FOR RELEVANT PROOF OF QUESTION ANSWER SYSTEMS
US20110231353A1 (en) 2010-03-17 2011-09-22 James Qingdong Wang Artificial intelligence application in human machine interface for advanced information processing and task managing
US9021468B1 (en) 2010-05-18 2015-04-28 Google Inc. Bundling extension installation with web browser installation
US9449080B1 (en) 2010-05-18 2016-09-20 Guangsheng Zhang System, methods, and user interface for information searching, tagging, organization, and display
CN103250129A (zh) 2010-09-24 2013-08-14 国际商业机器公司 使用具有受限结构的文本提供具有延迟类型评估的问答
US8930391B2 (en) * 2010-12-29 2015-01-06 Microsoft Corporation Progressive spatial searching using augmented structures
US11222052B2 (en) 2011-02-22 2022-01-11 Refinitiv Us Organization Llc Machine learning-based relationship association and related discovery and
US8701019B2 (en) 2011-03-24 2014-04-15 Facebook, Inc. Presenting question and answer data in a social networking system
US20120290509A1 (en) 2011-05-13 2012-11-15 Microsoft Corporation Training Statistical Dialog Managers in Spoken Dialog Systems With Web Data
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
NL2007180C2 (en) 2011-07-26 2013-01-29 Security Matters B V Method and system for classifying a protocol message in a data communication network.
US20130046757A1 (en) * 2011-08-17 2013-02-21 Microsoft Corporation Indicating relationship closeness between subsnippets of a search result
WO2013058118A1 (ja) * 2011-10-20 2013-04-25 日本電気株式会社 テキスト含意判定装置、テキスト含意判定方法、及びコンピュータ読み取り可能な記録媒体
US11410072B2 (en) 2011-10-21 2022-08-09 Educational Testing Service Computer-implemented systems and methods for detection of sentiment in writing
US20130151347A1 (en) 2011-12-09 2013-06-13 Robert Michael Baldwin Structured Questions in a Social Networking System
WO2013091075A1 (en) * 2011-12-20 2013-06-27 Soschen Alona Natural language processor
CA2873210A1 (en) * 2012-04-09 2013-10-17 Vivek Ventures, LLC Clustered information processing and searching with structured-unstructured database bridge
US9336202B2 (en) 2012-05-15 2016-05-10 Whyz Technologies Limited Method and system relating to salient content extraction for electronic content
US9336297B2 (en) 2012-08-02 2016-05-10 Paypal, Inc. Content inversion for user searches and product recommendations systems and methods
US20140122083A1 (en) 2012-10-26 2014-05-01 Duan Xiaojiang Chatbot system and method with contextual input and output messages
US9152623B2 (en) * 2012-11-02 2015-10-06 Fido Labs, Inc. Natural language processing system and method
US9037464B1 (en) 2013-01-15 2015-05-19 Google Inc. Computing numeric representations of words in a high-dimensional space
WO2014182820A2 (en) * 2013-05-07 2014-11-13 Haley Paul V System for knowledge acquisition
US9317260B2 (en) * 2013-08-09 2016-04-19 Vmware, Inc. Query-by-example in large-scale code repositories
US9292490B2 (en) * 2013-08-16 2016-03-22 International Business Machines Corporation Unsupervised learning of deep patterns for semantic parsing
CN104598445B (zh) * 2013-11-01 2019-05-10 腾讯科技(深圳)有限公司 自动问答系统和方法
US20150134325A1 (en) 2013-11-14 2015-05-14 Avaya Inc. Deep Language Attribute Analysis
US10019716B1 (en) 2013-11-21 2018-07-10 Google Llc Method for feedback submission resolution
US20150149461A1 (en) * 2013-11-24 2015-05-28 Interstack, Inc System and method for analyzing unstructured data on applications, devices or networks
US9471874B2 (en) * 2013-12-07 2016-10-18 International Business Machines Corporation Mining forums for solutions to questions and scoring candidate answers
US9514098B1 (en) 2013-12-09 2016-12-06 Google Inc. Iteratively learning coreference embeddings of noun phrases using feature representations that include distributed word representations of the noun phrases
WO2015089822A1 (en) 2013-12-20 2015-06-25 Avery Dennison Corporation Polyester-melamine coatings and labels including polyester-melamine coatings
US9817721B1 (en) 2014-03-14 2017-11-14 Sanmina Corporation High availability management techniques for cluster resources
US9946985B2 (en) 2014-04-15 2018-04-17 Kofax, Inc. Touchless mobile applications and context-sensitive workflows
WO2015159133A1 (en) * 2014-04-18 2015-10-22 Arria Data2Text Limited Method and apparatus for document planning
US9582501B1 (en) * 2014-06-16 2017-02-28 Yseop Sa Techniques for automatic generation of natural language text
EP3143248A4 (en) 2014-07-11 2018-01-24 Halliburton Energy Services, Inc. Evaluation tool for concentric wellbore casings
US20160026608A1 (en) 2014-07-22 2016-01-28 Nuance Communications, Inc. Method and Apparatus for Generating Multimodal Dialog Applications by Analyzing Annotated Examples of Human-System Conversations
US9619513B2 (en) * 2014-07-29 2017-04-11 International Business Machines Corporation Changed answer notification in a question and answer system
US20160055240A1 (en) 2014-08-22 2016-02-25 Microsoft Corporation Orphaned utterance detection system and method
US20160071517A1 (en) 2014-09-09 2016-03-10 Next It Corporation Evaluating Conversation Data based on Risk Factors
US9720626B2 (en) 2014-09-19 2017-08-01 Netapp Inc. Cluster configuration information replication
US9559993B2 (en) 2014-10-02 2017-01-31 Oracle International Corporation Virtual agent proxy in a real-time chat service
US10019437B2 (en) * 2015-02-23 2018-07-10 International Business Machines Corporation Facilitating information extraction via semantic abstraction
US9875296B2 (en) 2015-03-25 2018-01-23 Google Llc Information extraction from question and answer websites
US20160292153A1 (en) * 2015-03-31 2016-10-06 International Business Machines Corporation Identification of examples in documents
US20170104829A1 (en) 2015-10-12 2017-04-13 Ehrlich Wesen & Dauer, LLC. Network resource crawler with multiple user-agents
RU2018113724A (ru) 2015-10-21 2019-11-21 ГУГЛ ЭлЭлСи Сбор параметров и автоматическая генерация диалога в диалоговых системах
US10147051B2 (en) 2015-12-18 2018-12-04 International Business Machines Corporation Candidate answer generation for explanatory questions directed to underlying reasoning regarding the existence of a fact
WO2017112813A1 (en) * 2015-12-22 2017-06-29 Sri International Multi-lingual virtual personal assistant
US11042702B2 (en) * 2016-02-04 2021-06-22 International Business Machines Corporation Solving textual logic problems using a statistical approach and natural language processing
US10852813B2 (en) 2016-02-26 2020-12-01 Sony Corporation Information processing system, client terminal, information processing method, and recording medium
US10489509B2 (en) 2016-03-14 2019-11-26 International Business Machines Corporation Personality based sentiment analysis of textual information written in natural language
US20170277993A1 (en) 2016-03-22 2017-09-28 Next It Corporation Virtual assistant escalation
US20170286390A1 (en) 2016-04-04 2017-10-05 Contextors Ltd. Dynamic and automatic generation of interactive text related objects
US10706044B2 (en) 2016-04-06 2020-07-07 International Business Machines Corporation Natural language processing based on textual polarity
US11601552B2 (en) 2016-08-24 2023-03-07 Gridspace Inc. Hierarchical interface for adaptive closed loop communication system
US11721356B2 (en) 2016-08-24 2023-08-08 Gridspace Inc. Adaptive closed loop communication system
US11715459B2 (en) 2016-08-24 2023-08-01 Gridspace Inc. Alert generator for adaptive closed loop communication system
CN106649768B (zh) * 2016-12-27 2021-03-16 北京百度网讯科技有限公司 基于深度问答的问答澄清方法和装置
CN106682194B (zh) * 2016-12-29 2020-05-22 北京百度网讯科技有限公司 基于深度问答的答案定位方法及装置
WO2018165579A1 (en) 2017-03-10 2018-09-13 Eduworks Corporation Automated tool for question generation
US11586827B2 (en) 2017-05-10 2023-02-21 Oracle International Corporation Generating desired discourse structure from an arbitrary text
EP3622412A1 (en) 2017-05-10 2020-03-18 Oracle International Corporation Enabling rhetorical analysis via the use of communicative discourse trees
US10599885B2 (en) 2017-05-10 2020-03-24 Oracle International Corporation Utilizing discourse structure of noisy user-generated content for chatbot learning
US10679011B2 (en) 2017-05-10 2020-06-09 Oracle International Corporation Enabling chatbots by detecting and supporting argumentation
US11386274B2 (en) 2017-05-10 2022-07-12 Oracle International Corporation Using communicative discourse trees to detect distributed incompetence
US11373632B2 (en) 2017-05-10 2022-06-28 Oracle International Corporation Using communicative discourse trees to create a virtual persuasive dialogue
US11100144B2 (en) 2017-06-15 2021-08-24 Oracle International Corporation Data loss prevention system for cloud security based on document discourse analysis
US10839161B2 (en) 2017-06-15 2020-11-17 Oracle International Corporation Tree kernel learning for text classification into classes of intent
US10289974B1 (en) 2017-06-23 2019-05-14 Noble Systems Corporation Establishing a target handle time for a communication in a contact center
US11176325B2 (en) 2017-06-26 2021-11-16 International Business Machines Corporation Adaptive evaluation of meta-relationships in semantic graphs
US10628528B2 (en) 2017-06-29 2020-04-21 Robert Bosch Gmbh System and method for domain-independent aspect level sentiment detection
US10817578B2 (en) 2017-08-16 2020-10-27 Wipro Limited Method and system for providing context based adaptive response to user interactions
US20190103111A1 (en) 2017-10-03 2019-04-04 Rupert Labs Inc. ( DBA Passage AI) Natural Language Processing Systems and Methods
US20190163756A1 (en) 2017-11-29 2019-05-30 International Business Machines Corporation Hierarchical question answering system
US11023684B1 (en) 2018-03-19 2021-06-01 Educational Testing Service Systems and methods for automatic generation of questions from text
US10628219B2 (en) 2018-06-11 2020-04-21 Oracle International Corporation Fuzzy management of high-volume concurrent processes
US11509770B2 (en) 2018-09-25 2022-11-22 International Business Machines Corporation Live agent recommendation for a human-robot symbiosis conversation system
US11409961B2 (en) 2018-10-10 2022-08-09 Verint Americas Inc. System for minimizing repetition in intelligent virtual assistant conversations

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004295834A (ja) * 2003-03-28 2004-10-21 Csk Corp 文字発話記録の分析装置、分析方法および分析プログラム、情報群の分析装置、分析方法および分析プログラム
US8935152B1 (en) * 2008-07-21 2015-01-13 NetBase Solutions, Inc. Method and apparatus for frame-based analysis of search results
CN102165518A (zh) * 2008-08-27 2011-08-24 罗伯特·博世有限公司 用于在对话系统中从用户话语产生自然语言短语的系统和方法
CN101957812A (zh) * 2010-09-21 2011-01-26 上海大学 基于事件本体的动词语义信息提取方法
CN103530281A (zh) * 2013-10-15 2014-01-22 苏州大学 一种论元抽取方法和系统
CN104484411A (zh) * 2014-12-16 2015-04-01 中国科学院自动化研究所 一种基于词典的语义知识库的构建方法
CN106445911A (zh) * 2016-03-18 2017-02-22 苏州大学 一种基于微观话题结构的指代消解方法及系统
CN105955956A (zh) * 2016-05-05 2016-09-21 中国科学院自动化研究所 一种汉语隐式篇章关系识别方法
CN106021224A (zh) * 2016-05-13 2016-10-12 中国科学院自动化研究所 一种双语篇章标注方法
CN106502981A (zh) * 2016-10-09 2017-03-15 广西师范大学 基于词性、句法和词典的比喻修辞句自动分析与判定方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Automatic Labeling of Semantic Roles;Daniel Gildea 等;Computational Linguistics;20020930;第28卷(第3期);245-288 *
Boris Galitsky.Matching parse thickets for open domain question answering.Data & Knowledge Engineering.2016,24-50. *
Discovering Rhetorical Agreement between a Request and Response;Boris Galitsky;Dialogue & Discourse;20171231;167-205 *
Using extended tree kernels to recognize metalanguage in text;Boris Galitsky;Uncertainty Modeling;20170201;71-96 *
基于话题和修辞识别的阅读理解why型问题回答;张志昌;计算机研究与发展;20111231;216-223 *

Also Published As

Publication number Publication date
US20180329879A1 (en) 2018-11-15
JP2023100719A (ja) 2023-07-19
JP2022050439A (ja) 2022-03-30
US20200380214A1 (en) 2020-12-03
WO2018208979A1 (en) 2018-11-15
EP3622412A1 (en) 2020-03-18
US11694037B2 (en) 2023-07-04
JP2020522044A (ja) 2020-07-27
US20180329880A1 (en) 2018-11-15
JP2022122999A (ja) 2022-08-23
US10796102B2 (en) 2020-10-06
JP7086993B2 (ja) 2022-06-20
US20210049329A1 (en) 2021-02-18
US11775771B2 (en) 2023-10-03
JP7439038B2 (ja) 2024-02-27
US10853581B2 (en) 2020-12-01
CN110612525A (zh) 2019-12-24

Similar Documents

Publication Publication Date Title
CN110612525B (zh) 通过使用交流话语树启用修辞分析
US11783126B2 (en) Enabling chatbots by detecting and supporting affective argumentation
US11748572B2 (en) Enabling chatbots by validating argumentation
US11347946B2 (en) Utilizing discourse structure of noisy user-generated content for chatbot learning
US11373632B2 (en) Using communicative discourse trees to create a virtual persuasive dialogue
US10679011B2 (en) Enabling chatbots by detecting and supporting argumentation
US11782985B2 (en) Constructing imaginary discourse trees to improve answering convergent questions
WO2019152426A1 (en) Using communicative discourse trees to detect a request for an explanation
US20220253611A1 (en) Techniques for maintaining rhetorical flow
US11775772B2 (en) Chatbot providing a defeating reply
CN114902230A (zh) 改进的话语解析
CN117015772A (zh) 依赖于话语树以构建本体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant