CN101739434A - 基于多层流程图组织对话语料的自然语言问答方法 - Google Patents
基于多层流程图组织对话语料的自然语言问答方法 Download PDFInfo
- Publication number
- CN101739434A CN101739434A CN200810305647A CN200810305647A CN101739434A CN 101739434 A CN101739434 A CN 101739434A CN 200810305647 A CN200810305647 A CN 200810305647A CN 200810305647 A CN200810305647 A CN 200810305647A CN 101739434 A CN101739434 A CN 101739434A
- Authority
- CN
- China
- Prior art keywords
- correlation
- dialogue
- question
- language material
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及信息检索、自然语言问答系统,自然语言处理领域,特别是涉及一种基于问答库的自然语言问答系统。本发明的目的在于提供一种让问答系统对话上下文具有连贯性的方法,叫做基于多层流程图组织对话语料的自然语言问答方法,其特点是使用多层流程度用来保存语料之间的逻辑关系。流程图中距离越短的两个节点相关程度越大,以此作为依据,在对话用来选择相关程度较大的节点,通过此方法可以有效提高问答系统对话的上下文连贯性。
Description
技术领域
本发明涉及信息检索、自然语言问答系统,自然语言处理领域,特别是涉及一种基于问答库的自然语言问答系统。本发明是对通常的问答系统的改进,用以提高上下文的关联效果。
背景技术
问答系统(QuestionAnswering System)是指能够对计算机用户输入的使用自然语言描述的问句做出回答的计算机程序。问答系统集自然语言处理、信息检索、知识表示为一体,正日益成为国际上研究的热点。它既能够让用户用自然语言提问,又能够为用户返回一个简洁、准确的答案。自然语言问答系统中的人机界面、精确性和实时性是自然语言问答系统的三大研发目标,其中,精确性是自然语言问答系统的首要目标。为了提高问答精确性,上下文的连贯是非常必要的。目前,问答系统为了让用户与系统之间的对话具有连贯性,主要采用的是脚本预设的方法。以下代码给出了一种典型设置问答系统上下文关联的方法。
<pattern>你的名字是*</pattern>
<condition>
<li name=″knowname″value=″true″>你已经知道我的名字了。干吗还问?</li>
<li name=″guesscount″value=″″>不对,不对。<think>
<set name=″knowname″>didguess</set><set name=″guesscount″>2</set></think>
</li>
<li name=″guesscount″value=″2″>
不对.继续猜.<think><set name=″guesscount″>3</set></think>
</li>
</condition>
从以上代码可以看到通过标签和变量可以实现让问答系统具有上下文的连贯性,这种方法可以准确的定义上下文逻辑关系,不足之处是实现成本较高,在知识库较大情况下定义上下文关系需要设计人员做很多工作。因此,有必要设计一种较为方便的让问答系统对话上下文具有连贯性的方法。
发明内容
本发明的目的在于提供一种让问答系统对话上下文具有连贯性的方法,这个方法叫做基于多层流程图组织对话语料的自然语言问答方法,包括两个部分,语料采集系统和问题分析系统。
1、语料采集系统
本方法所设计的语料采集系统采用多层流程图组织对话语料。本发明的目的是让问答系统的对话上下文具有连贯性,显然要实现这个目的必然要求对话语料之间具有逻辑关系,在背景技术中我们已经介绍过,最常用的方法是通过脚本和变量设置对话语料之间的逻辑关系,本发明使用多层流程图来保存语料之间的逻辑关系,流程图中包括但不限于开始、结束、条件判断、并行分支、合并分支、循环、暂定、跳转等流程,使用上述流程表达对话语料中存在的逻辑关系。为了叙述简洁,这里用两层流程图来进行说明。
上下文的相关程度是人的感觉,没有唯一的标准,在本方法中我们约定了两个概念叫做分类距离和语料距离,作为计算上下文相关程度的因子,在问题分析系统中会用到这两个因子用来优选问答系统的对话。
(1)第一层流程图是语料的分类树,见图1,所有语料都在分类树中有对应的位置,分类树的每一个分类节点都对应一组语料,在本方法中,我们约定任意两个分类节点之间的最短路径长度叫做分类距离,分类距离越小相关程度也就越大。
(2)第二层流程图用来表示一组语料之间的上下文逻辑关系,见图2,对应到第一层流程中的一个节点。第二层流程图中的中的语料都应该围绕同一主题,并具有上下文逻辑关系,在问答系统的对话中,第二层流程图中的内容应当优先筛选出。在本方法中,我们约定在同一组语料两个语料之间的最短路径长度叫做语料距离,语料距离越小,相关程度也就越大。
2、问题分析系统
经过采集系统的工作,语料已经有规则的保存在语料采集系统的数据库中,问题分析系统对这些数据进行计算,本方法要兼顾语句相似程度和上下文的相关度,用这两项指标拟合,最终选择最优的对话语句。
(1)语句相似度:表示两个语料之间的相似程度,在很多论文、资料中均有论述,不是本方法讨论主题,但是本方法必须要有语句相似度参与计算,理论上任何一种语句相似度算法均可使用。
(2)位置相关度:表示两个语料之间的相关程度,任意语料都存在分类中,所以分类距离和语料距离都有意义,位置相关度∝1/(分类距离),同时,位置相关度∝1/(语料距离)。
(3)整体相似度:由语句相似度和位置相关度拟合而成。问题分析系统需要根据用户输入内容计算分析取得最优结果反馈给用户,最优的标准是在结果集中选择整体相似度最大的一项。在整体相似度中语句相似度和位置相关度各自占有一定权重,在不同情况下权重数值是可变的,如在具体的侧重内容检索的问答系统中,语句相似度的权重会占有较大比重,起到决定性因素;而在普通日常对话的问答环境中,则位置相关度占有的权重较大。
附图说明
图1是第一层流程图示例
图2是第二层流程图示例
图3是具体实施方式中实例用的资料一
图4是具体实施方式中实例用的资料二
具体实施方式
为使本发明的目的、技术方案和优点表达的更加清楚明白,下面结合附图和一个具体实例对本发明做详细的说明。实例内容:用户向问答系统,提问“你喜欢什么”,在不同上下文条件下,问答系统给出不同的回答。
步骤一:语料采集
附图2、附图3、附图4是通过语料采集系统录入的数据,其存储格式如下表。
节点ID 父节点ID 分类ID 数据
140 1 112 你喜欢什么
141 140 112 吃零食,看电视
142 140 112 边吃零食边看电视。
404 1 101 中餐地方菜八大菜系
405 404 101 川粤鲁苏,闽浙徽湘。
419 1 103 鲁菜
427 405 101 你喜欢什么
428 427 101 好吃的我都爱吃。
434 419 103 鲁菜又名山东菜,形成和发展与由山东地区的文化历史、地理环境、经济条件和习俗尚好有关。山东是我国古文化发祥地之一,地处黄河下游,气候温和,境内山川纵横,河湖交错,沃野千里,物产丰富,文化发达。特色:选料精细、刀法细腻,注重实惠,花色多样,善用葱姜。代表菜品:糖醋鱼
434 419 103 就是山东菜
436 434 103 你喜欢什么
437 436 103 糖醋鱼~糖醋鱼~
438 435 103 糖醋鱼、锅烧肘子、葱爆羊肉、葱扒海参、锅塌豆腐、红烧海螺、炸蛎黄。
441 141 112 你喜欢看什么电视
442 441 112 当然是肥皂剧了
步骤二:问题分析
在步骤一的表格中我们可以看到,节点140、427、436的数据都是“你喜欢什么”,下面介绍通过本发明的方法在不同上下文额环境下问答系统给出不同的回答。
1、用户输入“你喜欢什么”,在数据库中匹配此字符串,匹配到140、427、436节点。
2、没有上下文的时候140节点序号最小,被筛选出,问答系统输出140节点的下级节点,输出内容是“边吃零食边看电视。”
3、假设上下文关联到关于地方菜的语料组,分类ID是101,用户输入“中餐地方菜有什么”,通过语句相似度分析,会筛选到404节点。问答系统输出405节点“川粤鲁苏,闽浙徽湘。”。之后用户再次输入“你喜欢什么”,此时语句相似度依然会筛选出140,427,436。而此时,427节点“好吃的我都喜欢吃”,与上文的系统输出节点405节点在同一个语料组,分类距离为0,语料距离为1,显然可知道位置相似度一定大于140节点和436节点,所以427节点被筛选出,输出“好吃的我都喜欢吃”。
4、和上文相似,如果用户输入与鲁菜相关的内容,比如“鲁菜是什么”这样问答系统定位到,然后再问“你喜欢什么?”,系统选择位置相关度较大的437节点,系统则输出“糖醋鱼~糖醋鱼~”。
这个实例说明了如何利用本方法提高问答系统上下文的关联程度。对具体实施方案的描述仅仅是为帮助理解本发明,而不是用来限制本发明的。任何本领域技术人员均可以利用本发明的思想进行改动和变化,只要其技术手段没有脱离本发明的思想和要点,仍然在本发明的保护范围之内。
Claims (3)
1.一种让问答系统对话上下文具有连贯性的方法,叫做基于多层流程图组织对话语料的自然语言问答方法,包括两个部分,语料采集系统和问题分析系统。语料采集系统的特征在于:使用多层流程图来保存语料之间的逻辑关系,流程图中包括但不限于开始、结束、条件判断、并行分支、合并分支、循环、暂定、跳转等流程,使用上述流程表达对话语料中存在的逻辑关系。
2.问题分析系统需要根据位置相关度和语句相关度计算最终相关度,位置相关度的特征在于:利用权力要求1中所保存的数据,因为权力要求1中保存的是流程图的数据,所以其中包含有数据的逻辑关系,并约定2个语料之间的路径越短,这2个语料的位置相关度越大。位置相关度∝1/语料之间的路径。
3.整体相关度的特征在于:根据权力要求2所得到的位置相关度和语句相似度拟合而成。语句相似度的算法不在本专利涉及的范围之内。在整体相似度中语句相似度和位置相关度各自占有一定权重,在不同情况下权重数值是可变的,如在具体的侧重内容检索的问答系统中,语句相似度的权重会占有较大比重,起到决定性因素;而在普通日常对话的问答环境中,则位置相关度占有的权重较大。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810305647A CN101739434A (zh) | 2008-11-20 | 2008-11-20 | 基于多层流程图组织对话语料的自然语言问答方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810305647A CN101739434A (zh) | 2008-11-20 | 2008-11-20 | 基于多层流程图组织对话语料的自然语言问答方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101739434A true CN101739434A (zh) | 2010-06-16 |
Family
ID=42462924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810305647A Pending CN101739434A (zh) | 2008-11-20 | 2008-11-20 | 基于多层流程图组织对话语料的自然语言问答方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101739434A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102902664A (zh) * | 2012-08-15 | 2013-01-30 | 中山大学 | 一种智能终端上的人工智能自然语言运行系统 |
CN104598445A (zh) * | 2013-11-01 | 2015-05-06 | 腾讯科技(深圳)有限公司 | 自动问答系统和方法 |
CN104714941A (zh) * | 2013-12-12 | 2015-06-17 | 国际商业机器公司 | 用于使用自然语言处理来增强业务流程执行的方法和系统 |
CN108090177A (zh) * | 2017-12-15 | 2018-05-29 | 上海智臻智能网络科技股份有限公司 | 多轮问答系统的生成方法、设备、介质及多轮问答系统 |
CN108664465A (zh) * | 2018-03-07 | 2018-10-16 | 珍岛信息技术(上海)股份有限公司 | 一种自动生成文本方法以及相关装置 |
CN108920644A (zh) * | 2018-06-29 | 2018-11-30 | 北京百度网讯科技有限公司 | 对话连贯性的判断方法、装置、设备及计算机可读介质 |
CN109582777A (zh) * | 2018-12-06 | 2019-04-05 | 中国银行股份有限公司 | 一种人机智能处理方法及系统 |
CN110019727A (zh) * | 2017-12-25 | 2019-07-16 | 上海智臻智能网络科技股份有限公司 | 智能交互方法、装置、终端设备以及存储介质 |
CN110019716A (zh) * | 2017-12-15 | 2019-07-16 | 上海智臻智能网络科技股份有限公司 | 多轮问答方法、终端设备以及存储介质 |
CN110020014A (zh) * | 2017-12-15 | 2019-07-16 | 上海智臻智能网络科技股份有限公司 | 多轮问答装置 |
US11341422B2 (en) | 2017-12-15 | 2022-05-24 | SHANGHAI XIAOl ROBOT TECHNOLOGY CO., LTD. | Multi-round questioning and answering methods, methods for generating a multi-round questioning and answering system, and methods for modifying the system |
-
2008
- 2008-11-20 CN CN200810305647A patent/CN101739434A/zh active Pending
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102902664B (zh) * | 2012-08-15 | 2016-03-02 | 中山大学 | 一种智能终端上的人工智能自然语言运行系统 |
CN102902664A (zh) * | 2012-08-15 | 2013-01-30 | 中山大学 | 一种智能终端上的人工智能自然语言运行系统 |
CN104598445B (zh) * | 2013-11-01 | 2019-05-10 | 腾讯科技(深圳)有限公司 | 自动问答系统和方法 |
CN104598445A (zh) * | 2013-11-01 | 2015-05-06 | 腾讯科技(深圳)有限公司 | 自动问答系统和方法 |
CN104714941A (zh) * | 2013-12-12 | 2015-06-17 | 国际商业机器公司 | 用于使用自然语言处理来增强业务流程执行的方法和系统 |
CN104714941B (zh) * | 2013-12-12 | 2018-04-20 | 国际商业机器公司 | 用于使用自然语言处理来增强业务流程执行的方法和系统 |
CN110020014A (zh) * | 2017-12-15 | 2019-07-16 | 上海智臻智能网络科技股份有限公司 | 多轮问答装置 |
CN110019716A (zh) * | 2017-12-15 | 2019-07-16 | 上海智臻智能网络科技股份有限公司 | 多轮问答方法、终端设备以及存储介质 |
CN108090177A (zh) * | 2017-12-15 | 2018-05-29 | 上海智臻智能网络科技股份有限公司 | 多轮问答系统的生成方法、设备、介质及多轮问答系统 |
CN108090177B (zh) * | 2017-12-15 | 2020-05-05 | 上海智臻智能网络科技股份有限公司 | 多轮问答系统的生成方法、设备、介质及多轮问答系统 |
CN110019716B (zh) * | 2017-12-15 | 2021-11-12 | 上海智臻智能网络科技股份有限公司 | 多轮问答方法、终端设备以及存储介质 |
CN110020014B (zh) * | 2017-12-15 | 2021-11-12 | 上海智臻智能网络科技股份有限公司 | 多轮问答装置 |
US11341422B2 (en) | 2017-12-15 | 2022-05-24 | SHANGHAI XIAOl ROBOT TECHNOLOGY CO., LTD. | Multi-round questioning and answering methods, methods for generating a multi-round questioning and answering system, and methods for modifying the system |
CN110019727A (zh) * | 2017-12-25 | 2019-07-16 | 上海智臻智能网络科技股份有限公司 | 智能交互方法、装置、终端设备以及存储介质 |
CN108664465A (zh) * | 2018-03-07 | 2018-10-16 | 珍岛信息技术(上海)股份有限公司 | 一种自动生成文本方法以及相关装置 |
CN108920644A (zh) * | 2018-06-29 | 2018-11-30 | 北京百度网讯科技有限公司 | 对话连贯性的判断方法、装置、设备及计算机可读介质 |
CN109582777A (zh) * | 2018-12-06 | 2019-04-05 | 中国银行股份有限公司 | 一种人机智能处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101739434A (zh) | 基于多层流程图组织对话语料的自然语言问答方法 | |
Song et al. | Anticipation of converging technology areas—A refined approach for the identification of attractive fields of innovation | |
Xu et al. | Aspect-level opinion mining of online customer reviews | |
Courtial et al. | The use of patent titles for identifying the topics of invention and forecasting trends | |
Ferguson et al. | What's cooking? | |
CN104794202A (zh) | 一种面向创意设计的文物知识库系统构建的方法 | |
Piazzoni | Authenticity makes the city: How “the authentic” affects the production of space | |
KR101818107B1 (ko) | 스토리텔링 저작지원 장치 및 그 방법 | |
CN108038204A (zh) | 针对社交媒体的观点检索系统及方法 | |
Kang et al. | Emotional design of bamboo chair based on deep convolution neural network and deep convolution generative adversarial network | |
DE202015009333U1 (de) | Speisekarten-Erzeugungssystem | |
Sampaio | Migration, Diversity and Inequality in Later Life | |
Yamakata et al. | Cooking recipe search by pairs of ingredient and action—word sequence vs flow-graph representation— | |
Guo | Meat substitutes in Media Discourse | |
Lin et al. | Digital archive database for cultural product design | |
Overton | Small states, big issues? Human geography in the Pacific islands | |
Sasithradevi et al. | KolamNetV2: efficient attention-based deep learning network for tamil heritage art-kolam classification | |
Törnberg | Innovation in complex adaptive systems | |
Kim | Socioeconomic development in the Bronze Age: archaeological understanding of the transition from the Early to Middle Bronze Age, South Korea | |
Khare | Globalizing South Asian Food Cultures | |
Wu et al. | Soft power of Seoul City: The perceived image of Seoul by Chinese visitors | |
Nurhayati et al. | Analysis of Local Gastronomy to Become the Positioning of Tourism Destination (Case Study of Merangkat Chicken in Bilebante Tourism Village, Central Lombok) | |
Grasso et al. | World and Ground | |
Baron | Food and Gender in Bagdad Café | |
Zhao | STATUS OF ENGLISH TRANSLATION OF CHINESE DISH NAME AND ADAPTABILITY ANALYSIS. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20100616 |