CN107992543A - 问答交互方法和装置、计算机设备及计算机可读存储介质 - Google Patents
问答交互方法和装置、计算机设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN107992543A CN107992543A CN201711206831.4A CN201711206831A CN107992543A CN 107992543 A CN107992543 A CN 107992543A CN 201711206831 A CN201711206831 A CN 201711206831A CN 107992543 A CN107992543 A CN 107992543A
- Authority
- CN
- China
- Prior art keywords
- intention
- key element
- word
- answer
- knowledge point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 85
- 238000004458 analytical method Methods 0.000 claims abstract description 31
- 230000011218 segmentation Effects 0.000 claims description 44
- 238000012545 processing Methods 0.000 claims description 37
- 230000002452 interceptive effect Effects 0.000 claims description 27
- 238000005259 measurement Methods 0.000 claims description 16
- 238000001914 filtration Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 7
- 235000021152 breakfast Nutrition 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 12
- 238000000205 computational method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- 235000021170 buffet Nutrition 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 239000012141 concentrate Substances 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000011524 similarity measure Methods 0.000 description 4
- 206010037660 Pyrexia Diseases 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011430 maximum method Methods 0.000 description 3
- 235000012054 meals Nutrition 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000009958 sewing Methods 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
- G10L15/142—Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及一种问答交互方法和装置、计算机设备及计算机可读存储介质。该问答交互方法包括:接收用户的问题,该问题包含至少一个意图和与至少一个意图中的每个意图相关的至少一个要素;对问题进行意图分析,得到至少一个意图和与至少一个意图中的每个意图相关的至少一个要素;根据至少一个意图和与至少一个意图中的每个意图相关的至少一个要素,获取问题对应的答案;以及将答案发送给用户。本发明能够提高计算效率及答案回复的准确率。
Description
技术领域
本发明涉及人机交互技术领域,尤其涉及一种问答交互方法和装置、计算机设备及计算机可读存储介质。
背景技术
人机交互(Human-Computer Interaction,HCI)是研究系统与用户之间的交互关系的科学。系统可以是各种各样的机器,也可以是计算机化的系统和软件。例如,通过人机交互可以实现诸如智能客服系统、语音控制系统等各种人工智能系统。
智能问答系统是人机交互的一种典型应用。传统的智能问答系统是将用户提出的问题直接与知识库中存储的大量问题进行相似度计算,得到与该问题相匹配的答案。但是,由于这种方法针对每个问题都要完整地进行相似度计算,因此,计算量非常大,导致计算效率低。另外,上述方法仅能够对单意图问题或者可以有效断句的多意图问题进行答复,且答案回复的准确率低,因此,导致用户体验差。
发明内容
有鉴于此,本发明的一个目的在于提供一种问答交互方法和装置、计算机设备及计算机可读存储介质,能够提高计算效率及答案回复的准确率。
本发明的一个方面提供一种问答交互方法,包括:接收用户的问题,问题包含至少一个意图和与至少一个意图中的每个意图相关的至少一个要素;对问题进行意图分析,得到至少一个意图和与至少一个意图中的每个意图相关的至少一个要素;根据至少一个意图和与至少一个意图中的每个意图相关的至少一个要素,获取问题对应的答案;以及将答案发送给用户。
本发明的另一个方面提供一种问答交互装置,包括:接收模块,用于接收用户的问题,问题包含至少一个意图和与至少一个意图中的每个意图相关的至少一个要素;分析模块,用于对问题进行意图分析,得到至少一个意图和与至少一个意图中的每个意图相关的至少一个要素;获取模块,用于根据至少一个意图和与至少一个意图中的每个意图相关的至少一个要素,获取问题对应的答案;以及发送模块,用于将答案发送给用户。
本发明的再一个方面提供一种计算机设备,包括:存储器、处理器及存储在存储器中并可在处理器中运行的可执行指令,处理器执行可执行指令时实现如上所述的任一种问答交互方法。
本发明的又一个方面提供一种计算机可读存储介质,其上存储有计算机可执行指令,可执行指令被处理器执行时实现如上所述的任一种问答交互方法。
根据本发明实施例提供的技术方案,通过接收用户的问题,该问题包含至少一个意图和与至少一个意图中的每个意图相关的至少一个要素;对问题进行意图分析,得到至少一个意图和与至少一个意图中的每个意图相关的至少一个要素;根据至少一个意图和与至少一个意图中的每个意图相关的至少一个要素,获取问题对应的答案;以及将答案发送给用户,能够提高计算效率及答案回复的准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据本发明一示例性实施例示出的一种问答交互方法的流程图。
图2是根据本发明另一示例性实施例示出的一种问答交互方法的流程图。
图3是根据本发明另一示例性实施例示出的一种问答交互方法的流程图。
图4是根据本发明一示例性实施例示出的一种问答交互装置的框图。
图5是根据本发明另一示例性实施例示出的一种问答交互装置的框图。
图6是根据本发明另一示例性实施例示出的一种问答交互装置的框图。
图7是根据本发明一示例性实施例示出的用于问答交互的装置700的框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。根据本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是根据本发明一示例性实施例示出的一种问答交互方法的流程图。图1的问答交互方法可以由人机交互装置(例如,智能问答系统等)执行,如图1所示,该问答交互方法包括:
110:接收用户的问题,该问题包含至少一个意图和与至少一个意图中的每个意图相关的至少一个要素。
在本发明实施例中,用户的问题中可以包含一个或多个意图,意图中可以包含一个或多个要素,而问题中可能仅包含一个要素或对应意图的一部分要素。
进一步地,用户的问题可以是用户通过键盘或触摸屏等输入的文本信息,也可以是用户通过话筒等输入的语音信息,或者还可以是用户通过交互终端输入的文本消息、数据链接、语音消息、图片消息、图像消息和视频消息等,本发明对此不作限制。
这里,交互终端是能够与智能问答系统进行信息交互的设备,例如,智能手机、平板电脑、个人电脑或其他智能终端等。举例来说,用户可以一边通过语音或视频向智能问答系统提问,一边通过交互终端向智能问答系统发送相应的数据链接。
需要说明的是,当接收到的问题为语音消息、图片消息、图像消息或视频消息时,智能问答系统可以通过语音识别模块、图片识别模块或视频识别模块等将语音消息、图片消息、图像消息或视频消息转换为文本消息。
120:对问题进行意图分析,得到至少一个意图和与至少一个意图中的每个意图相关的至少一个要素。
在本发明实施例中,意图为通过自然语言处理的方法与预先设定在数据库中的意图匹配得到的,这里,数据库即为存储有意图知识点的知识库。可以根据分词处理或断句处理的结果对用户的问题进行意图分析,例如,通过语义解析、意图匹配等。进一步地,也可以根据分词处理的结果对分词后的多个词语进行排列组合,并基于词汇组合的结果对用户的问题进行意图分析。此外,还可以通过例如其他通过语料训练得到的自然语言解析模型等对问题进行语句处理,得到问题的语义内容,并根据问题的语义内容对用户的问题进行意图分析,本发明对此不作限制。
具体地,分词处理可以采用双向最大匹配法、维特比(Viterbi)算法、隐马尔可夫模型(Hidden Markov Model,HMM)算法和条件随机场(Conditional Random Field,CRF)算法中的一种或多种。断句处理是以逗号、分号、句号、问号、叹号等作为断句的分隔符,将用户的问题划分为多个短句;或者,根据固定的字词对用户的问题进行拆分。词汇组合是将多个词语排列组合在一起,并且这些词语在排列组合后所表达的意图可以是一个,也可以是多个。语义内容可以是通过其他通过语料训练得到的自然语言解析模型等对用户的问题进行整体语义解析得到的。
130:根据至少一个意图和与至少一个意图中的每个意图相关的至少一个要素,获取问题对应的答案。
在本发明实施例中,根据至少一个意图进入相应的意图流程,并进一步根据与至少一个意图中的每个意图相关的至少一个要素执行相应的要素流程,从而得到与问题对应的答案。
需要说明的是,意图流程和要素流程是预先设定好的。具体地,以导医问诊的智能问答系统为例,假设用户的问题为“我头和颈椎都疼,还有点感冒,发烧39度,应该怎么办?”,通过意图分析可以得到用户问题中的意图为“感冒了,该怎么办”,要素为“头和颈椎都疼”和“发烧38度以上”,则智能问答系统自动进入与“感冒”相关的意图流程,并进一步执行与要素“头和颈椎都疼”和“发烧38度以上”相关的要素流程,从而得到相关答案和建议。
140:将答案发送给用户。
在本发明实施例中,可以通过文本、语音、图片、图像或视频中的一种或多种方式将答案发送给用户。
具体地,以招商银行的智能在线客服系统为例,如果用户以文本方式输入“招商银行的信用卡如何还款”,则招商银行的智能在线客服系统以文本方式回复为“您可以在招商银行的柜台或ATM机还款,也可以通过网上银行、自动转账等方式还款”,同时,智能在线客服系统的用户界面上会显示用户当前所在位置周边的招商银行的信息,用户可以通过点击该信息导航前往附近的招商银行进行还款。
根据本发明实施例提供的技术方案,通过接收用户的问题,对问题进行意图分析,得到至少一个意图和与至少一个意图中的每个意图相关的至少一个要素,根据至少一个意图和与至少一个意图中的每个意图相关的至少一个要素,获取问题对应的答案,并将答案发送给用户,能够提高计算效率及答案回复的准确率。
在本发明的另一个实施例中,对问题进行意图分析,得到至少一个意图和与至少一个意图中的每个意图相关的至少一个要素,包括:对问题进行分词处理,得到多个词语;以及根据多个词语从知识库获取至少一个意图,其中至少一个意图中的每个意图对应多个词语中的至少一个词语,至少一个要素对应多个词语中除至少一个词语之外的词语。
具体地,根据预设的分词规则和预设的分词词典对用户的问题进行分词处理,得到多个词语。这里,分词规则可以包括但不限于正向最大匹配法、逆向最大匹配法、逐词遍历法或词频统计法、最少切分法、双相匹配法等。
进一步地,以接收到的用户的问题为“怎样通过电话激活招商银行的信用卡?”为例。智能问答系统可以通过逐词遍历法对用户的问题“怎样通过电话激活招商银行的信用卡?”进行分词处理,得到多个词语“怎样”、“通过”、“电话”、“激活”、“招商银行”、“信用卡”。
需要说明的是,用户的问题中可以包括标点符号,也可以不包括标点符号,本发明对此不作限制。
在本发明的另一个实施例中,知识库包括多个预设的意图知识点,根据多个词语从知识库获取至少一个意图,包括:分别对多个词语进行语义解析,得到多个词语的语义信息;将语义信息与多个预设的意图知识点进行匹配以确定匹配的至少一个意图知识点;以及获取与匹配的至少一个意图知识点对应的至少一个意图。
具体地,在对多个词语进行语义解析之前,可以先对多个词语进行过滤处理,得到至少一个关键词。过滤处理采用的方法可以为根据词性等对多个词语进行过滤,去除前后缀;也可以为根据频次对多个词语进行过滤,去除停用词;或者还可以先去除前后缀、再去除停用词等,本发明对此不作限制。这里,去除停用词是指去除问题中识别意义不大但出现频率高的词,例如,“这”、“的”、“和”等,这些词在计算相似度的过程中会引入较大的误差,可以看成是一种噪音。需要说明的是,过滤处理还可以去除部分无意义词语,例如,“我”、“想”、“吗”等。
接着,对至少一个关键词进行语义解析,得到多个词语的语义信息。通常,语义信息是指任何有含义的语言、文字、数据、符号等提供的信息。在本发明实施例中,语义信息即为用户问题中的意图,其可以通过例如词类替换、命名实体识别等方法获取。这里,语义信息可以包括但不限于词语的同义词和/或同义词组合、词语的同类词和/或同类词组合、与词语具有相同或相似结构的实体。
进一步地,将语义信息与知识库中预先存储的多个意图知识点进行语义相似度计算,并将语义相似度最高的意图知识点作为匹配的至少一个意图知识点。这里,语义相似度是指多个词语的语义信息与知识库中的多个预设的意图知识点和要素知识点之间基于字与词语上的匹配程度,以及语义的高度相似性。语义相似度计算可以采用基于向量空间模型(Vector Space Model,VSM)的计算方法、基于隐形语义索引模型(Latent SemanticIndexing,LSI)的计算方法、基于属性论的语义相似度计算方法和基于汉明距离的语义相似度计算方法中的一种或多种方法的结合。需要说明的是,语义相似度计算方法还可以为其他的语义相似度的计算方法。
最后,获取与匹配的至少一个意图知识点对应的至少一个意图。
在本发明的另一个实施例中,根据至少一个意图和与至少一个意图中的每个意图相关的至少一个要素,获取问题对应的答案,包括:将至少一个要素与知识库中的多个预设的要素知识点进行匹配以确定匹配的至少一个要素知识点;以及根据匹配的至少一个要素知识点执行对应的预设分支流程,得到分支流程对应的答案,其中预先存储有每个意图对应的要素分支流程,预设分支流程为每个意图知识点对应的至少一组要素知识点连接而成,每组要素知识点包括至少一个要素知识点,每个要素知识点流程指向其他组要素知识点或答案,即当与某个要素知识点匹配后对应再将问句中的词语与该要素知识点流程指向的对应其他组要素知识点进行匹配;或当与某个要素知识点匹配后输出该要素知识点流程指向的答案。
具体地,将问题中与意图相关的要素和知识库中预先存储的多个要素知识点进行匹配以确定匹配的要素知识点,并基于该匹配的要素知识点进一步执行该匹配的要素知识点对应的预设分支流程,得到该分支流程对应的答案。这里,预设分支流程为每个意图知识点对应的至少一组要素知识点连接而成,至少一组要素知识点中的每组要素知识点可以包括同一语义条件的肯定的要素知识点和否定的要素知识点,分别用于执行肯定的要素知识点对应的分支流程和否定的要素知识点对应的分支流程。
举例来说,离婚流程的要素知识点可以包括第一组要素知识点“是否愿意离婚”、第二组要素知识点“是否有财产争议”、第三组要素知识点“是否有抚养权争议”等。进一步地,第一组要素知识点“是否愿意离婚”包括肯定的要素知识点“对方愿意离婚”和否定的要素知识点“对方不愿意离婚”,第二组要素知识点“是否有财产争议”包括肯定的要素知识点“有财产争议”和否定的要素知识点“没有财产争议”,第三组要素知识点“是否有抚养权争议”包括肯定的要素知识点“有抚养权争议”和否定的要素知识点“没有抚养权争议”。
在本发明的另一个实施例中,执行分支流程的过程包括:确定至少一个意图中的至少一个意图的要素是否足以触发答案,如果至少一个意图中的至少一个意图的要素足以触发答案,则输出对应的答案;或者如果至少一个意图中的至少一个意图的要素不足以触发答案,则以反问的形式要求用户补全用于触发答案的要素。
具体地,确定与至少一个意图中的至少一个意图相关的要素是否满足分支流程的触发条件,如果满足分支流程的触发条件,则执行该分支流程并输出要素对应的答案;如果不满足分支流程的触发条件,则提示用户需要将用于触发答案的要素补充完整。
在本发明的另一个实施例中,将至少一个要素与多个预设的要素知识点进行匹配以确定匹配的至少一个要素知识点,包括:将至少一个要素与多个预设的要素知识点进行语义相似度计算,其中至少一个意图中的每个意图对应多个词语中的至少一个词语,至少一个要素对应多个词语中除至少一个词语之外的词语;以及将语义相似度最高的要素知识点作为匹配的至少一个要素知识点。
具体地,将问题中的至少一个要素与知识库中预先存储的多个要素知识点进行语义相似度计算,并将语义相似度最高的要素知识点作为匹配的至少一个要素知识点。这里,语义相似度计算可以采用基于向量空间模型的计算方法、基于隐形语义索引模型的计算方法、基于属性论的语义相似度计算方法和基于汉明距离的语义相似度计算方法中的一种或多种方法的结合。需要说明的是,语义相似度计算方法还可以为其他的语义相似度的计算方法。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
图2是根据本发明另一示例性实施例示出的一种问答交互方法的流程图。如图2所示,该问答交互方法包括:
210:接收用户的问题,该问题包含至少一个意图和与至少一个意图中的每个意图相关的至少一个要素。
在本发明实施例中,用户的问题可以仅包含一个意图,也可以包含多个意图。另外,与至少一个意图中的每个意图相关的至少一个要素可以是一个,也可以是多个,本发明对此不作限制。例如,用户的问题为“我想给信用卡还款,请问应该去哪里还?什么时候还?”,则该问题中包含一个意图“信用卡还款”及两个要素“还款地点”和“还款时间”。又如,用户的问题为“请告诉我今天北京和上海的天气”,则该问题中包含两个意图“北京的天气”和“上海的天气”及一个要素“今天”。
需要说明的是,用户的问题可以为文本消息、语音消息、图片消息、图像消息和视频消息中的一种或多种。此外,还需要说明的是,用户的问题中可以包括标点符号,也可以不包括标点符号。
220:对问题进行分词处理,得到多个词语。
在本发明实施例中,根据预设的分词规则和预设的分词词典对用户的问题进行分词处理,得到多个词语。这里,分词规则可以包括但不限于正向最大匹配法、逆向最大匹配法、逐词遍历法或词频统计法、最少切分法、双相匹配法等。分词处理可以采用双向最大匹配法、维特比算法、隐马尔可夫模型算法和条件随机场算法中的一种或多种。
需要说明的是,本发明对问题进行处理的方式不限于分词处理,而是可以为其他适合的方式,例如,断句处理、词汇组合等。
230:对多个词语进行语义解析,得到多个词语的语义信息。
在本发明实施例中,语义信息可以包括但不限于词语的同义词和/或同义词组合、词语的同类词和/或同类词组合、与词语具有相同或相似结构的实体。
240:将语义信息与知识库中的多个预设的意图知识点和要素知识点进行语义相似度计算,并将语义相似度最高的意图知识点和要素知识点分别作为匹配的意图知识点和要素知识点。
在本发明实施例中,语义相似度是指多个词语的语义信息与知识库中的多个预设的意图知识点和要素知识点之间基于字与词语上的匹配程度,以及语义的高度相似性。语义相似度计算可以采用基于向量空间模型的计算方法、基于隐形语义索引模型的计算方法、基于属性论的语义相似度计算方法和基于汉明距离的语义相似度计算方法中的一种或多种方法的结合。需要说明的是,语义相似度计算方法还可以为其他的语义相似度的计算方法。
250:获取与匹配的意图知识点对应的意图以及与匹配的要素知识点对应的要素。
在本发明实施例中,基于意图执行意图对应的主流程,并基于要素进一步执行要素对应的分支流程。
260:确定要素是否满足答案的触发条件。
270:如果要素满足触发条件,则输出要素对应的答案。
280:如果要素不满足触发条件,则提示用户补全用于触发答案的要素,并返回210。
290:将答案发送给用户。
在本发明实施例中,可以将答案以文本、语音等方式呈现给用户。
根据本发明实施例提供的技术方案,通过对用户的问题进行处理和语义解析得到意图和与意图相关的要素,并基于意图执行主流程以及基于要素执行对应的分支流程,能够提高答案回复的速度和准确率,并因此提升用户体验。
下文将以法律咨询的智能问答系统的离婚流程为例对上述问答交互方法进行详细描述。
具体地,智能问答系统接收用户的问题“我想要办离婚,我老婆不愿意,而且我们有财产分配争议,应该怎么办?”,并根据预设的分词规则和预设的分词词典通过去除前后缀、停用词等方法对上述问题进行分词处理,得到多个词语“我要离婚”、“老婆不愿意”、“有财产分配争议”、“怎么办”。
接着,将分词处理后的词语与知识库中预存的知识点(例如,“我要离婚”、“对方愿意离婚”、“对方不愿意离婚”、“有财产争议”、“没有财产争议”等)进行语义相似度计算,得到上述问题中的意图为“我要离婚”,要素为“对方不愿意”和“有财产争议”。
进一步地,基于意图“我要离婚”执行离婚流程,并基于要素“对方不愿意”和“有财产争议”执行对应的分支流程,得到上述问题所对应的法律意见,并将该法律意见以文本、语音等方式呈现给用户。
图3是根据本发明另一示例性实施例示出的一种问答交互方法的流程图。如图3所示,该问答交互方法包括:
310:接收用户的问题,该问题包含多个意图。
在本发明实施例中,用户的问题可以包含多个意图,也可以仅包含一个意图,本发明对此不作限制。例如,用户的问题为“请告诉我北京和上海的天气”,则该问题中包含两个意图,即“北京的天气”和“上海的天气”。又如,用户的问题为“我的信用卡丢了,请问该怎么挂失?”,则该问题中仅包含一个意图,即“信用卡挂失”。
需要说明的是,用户的问题可以为文本消息、语音消息、图片消息、图像消息和视频消息中的一种或多种。此外,还需要说明的是,用户的问题中可以包含标点符号,也可以不包含标点符号。
320:对问题进行分词处理,得到多个词语。
在本发明实施例中,根据预设的分词规则和预设的分词词典对用户的问题进行分词得到分词结果,并通过去除前后缀、停用词等方法对用户的问题的分词结果进行过滤处理。
需要说明的是,对问题进行处理的方法不限于如上所述的分词处理,而是可以包括基于标点符号的断句处理、基于语义信息或固定字词的拆分处理等,本发明对此不作限制。
330:对多个词语进行语义解析,得到多个词语的语义信息。
在本发明实施例中,语义信息可以包括但不限于词语的同义词和/或同义词组合、词语的同类词和/或同类词组合、与词语具有相同或相似结构的实体。
340:根据语义信息对多个词语进行组合,得到待匹配词组,该待匹配词组中均包含多个意图中的一个意图。
在本发明实施例中,根据多个词语中的每个词语的语义信息对多个词语进行组合,得到待匹配词组,待匹配词组中均包含至少一个意图。例如,多个词语为“信用卡”、“还款”、“时间”、“地点”、“分期”,则组合后得到的待匹配词组,其中包括多个意图为:为“信用卡还款时间”、“信用卡还款地点”和“信用卡还款能否分期”。
350:按在问句中的前后顺序将待匹配词组中的至少两个词语组合与知识库中的多个预设的扩展问进行语义相似度计算,并将语义相似度最高的扩展问的意图知识点作为用户的意图。
在本发明实施例中,语义相似度计算可以采用基于向量空间模型的计算方法、基于隐形语义索引模型的计算方法、基于属性论的语义相似度计算方法和基于汉明距离的语义相似度计算方法中的一种或多种方法的结合。例如:“信用卡”、“还款”、“时间”、“地点”,则从前到后顺序与知识库中的扩展问匹配,知识库中扩展问有“信用卡还款时间”“信用卡还款地点”,则“信用卡还款”没有与知识库中的知识点匹配,则顺序取“信用卡”、“还款”、“时间”与知识库中扩展问“信用卡还款时间”匹配。
360:消除问题的待匹配词组中已匹配到意图的词语,并将已消除的词语暂时存储在已消除词语集中。
在本发明实施例中,当得到待匹配词组之后,按照从左到右的消费原则将已匹配的词语从用户的问题中消除,并将已消除的词语暂时保存在已消除词语集中。
370:判断问题中剩余的词语组成的待匹配词组是否与知识库中预设的扩展问完全匹配。
在本发明实施例中,将问题中的剩余的待匹配词组进行排列组合,并分别与知识库中多个预设的扩展问进行匹配。
380:如果问题的剩余的待匹配词组中的至少两个词语的组合与知识库中预设的扩展问完全匹配,则获取与匹配的扩展问对应的意图知识点作为问题中的又一个意图。
在本发明实施例中,如果用户的问题中没有剩余词语,则表明问题中的词语组成的至少一个扩展问均与多个预设的扩展问完全匹配,这时,将与匹配的扩展问对应的答案发送给用户。
需要说明的是,答案可以以文本、语音、图片、图像和视频中的一种或多种形式发送。
390:如果问题的剩余的待匹配词组未与多个预设的扩展问完全匹配,则从已消除词语集中补入缺少的词语,并返回350。
在本发明实施例中,如果用户的问题的剩余的待匹配词组中仍有剩余词语,则表明问题的剩余的待匹配词语中部分或全部词语组成的至少一个待匹配词组并未与知识库中预设的扩展问完全匹配,且缺少的词正好在已消除词语集中,这时,需要根据多个预设的扩展问从已消除词语集中补入缺少的词语,以使与预设的扩展问完整匹配;进一步地,继续执行350,直到用户问题中的所有词语全部被消除或无法与知识库中的扩展问匹配。
根据本发明实施例提供的技术方案,通过对包含多意图的用户问题进行分词处理、语义解析、排列组合及语义信息共享,能够提高答案回复的速度和准确率,并因此提升用户体验。
下文将以酒店的智能问答系统为例对上述问答交互方法进行详细描述。
具体地,智能问答系统接收用户的问题“酒店早餐几点开始?是自助餐吗?在哪里吃?是免费的吗?”,并根据预设的分词规则和预设的分词词典通过对上述问题进行分词处理得到分词结果,再去除前后缀、停用词等方法对分词结果进行过滤上述问题进行分词处理,得到多个词语“酒店”、“早餐”、“几点”、“开始”、“自助餐”、“哪里”、“吃”、“免费”。进一步地,根据上述词语的语义信息对上述词语进行排列组合,得到与知识库中多个扩展问匹配:“酒店早餐几点开始”、“酒店早餐是自助餐吗”、“酒店早餐在哪里吃”等,多个扩展问中的每个扩展问仅包含一个意图。
接着,按照从左到右的消费原则,将待匹配词组中的至少两个词语的组合与知识库中的预设扩展问(即,表达式[酒店][早餐][何时][开始]、[酒店][早餐][是否][自助餐]、[酒店][早餐][哪里][吃]、[酒店][早餐][是否][免费|收费]等)进行语义相似度计算,得到第一个匹配的表达式为[酒店][早餐][何时][开始]。这时,将已匹配的词语“酒店”、“早餐”、“几点”、“开始”暂时保存在已消费的词语集中,并继续对用户问题中的剩余词语进行处理。
进一步地,将用户问题中的剩余词语“自助餐”、“哪里”、“吃”、“免费”与知识库中的表达式进行语义相似度计算。由于知识库中存储的表达式为[酒店][早餐][是否][自助餐],但用户问题中的剩余词语仅有“自助餐”,因此,缺少了两个必须的词语“酒店”和“早餐”,这时,从已消费的词语集中找到缺少的两个词语,并将这两个词语与“自助餐”一起组成一个完整的表达式[酒店][早餐][是否][自助餐],以便将该表达式消费完全,以此类推,直到用户问题中的词语全部被消费。
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
图4是根据本发明一示例性实施例示出的一种问答交互装置400的框图。如图4所示,该问答交互装置400包括:
接收模块410,用于接收用户的问题,该问题包含至少一个意图和与至少一个意图中的每个意图相关的至少一个要素;
分析模块420,用于对问题进行意图分析,得到至少一个意图和与至少一个意图中的每个意图相关的至少一个要素;
获取模块430,用于根据至少一个意图和与至少一个意图中的每个意图相关的至少一个要素,获取问题对应的答案;以及
发送模块440,用于将答案发送给用户。
根据本发明实施例提供的技术方案,通过接收用户的问题,该问题包含至少一个意图和与至少一个意图中的每个意图相关的至少一个要素;对问题进行意图分析,得到至少一个意图和与至少一个意图中的每个意图相关的至少一个要素;根据至少一个意图和与至少一个意图中的每个意图相关的至少一个要素,获取问题对应的答案;以及将答案发送给用户,能够提高计算效率及答案回复的准确率。
在本发明的另一个实施例中,分析模块420对问题进行分词处理,得到多个词语,并根据多个词语从知识库获取至少一个意图,其中至少一个意图中的每个意图对应多个词语中的至少一个词语,至少一个要素对应多个词语中除至少一个词语之外的词语。
在本发明的另一个实施例中,分析模块420还根据预设的分词规则和预设的分词词典对问题进行分词处理,得到多个词语。
在本发明的另一个实施例中,分词规则包括正向最大匹配法、逆向最大匹配法、逐词遍历法或词频统计法中的任一种。
在本发明的另一个实施例中,知识库包括多个预设的意图知识点,分析模块420分别对多个词语进行语义解析,得到多个词语的语义信息,将语义信息与多个预设的意图知识点进行匹配以确定匹配的至少一个意图知识点,并获取与匹配的至少一个意图知识点对应的至少一个意图。
在本发明的另一个实施例中,分析模块420将语义信息与多个预设的意图知识点进行语义相似度计算,并将语义相似度最高的意图知识点作为匹配的至少一个意图知识点。
在本发明的另一个实施例中,语义相似度计算采用以下一种或多种方法的结合:基于向量空间模型的计算方法、基于隐形语义索引模型的计算方法、基于属性论的语义相似度计算方法和基于汉明距离的语义相似度计算方法。
在本发明的另一个实施例中,语义信息包括词语的同义词和/或同义词组合、词语的同类词和/或同类词组合、与词语具有相同或相似结构的实体中的至少一个。
在本发明的另一个实施例中,图4的问答交互装置400还包括:过滤模块450,用于对多个词语进行过滤处理,得到至少一个关键词,其中,分析模块420分别对至少一个关键词进行语义解析,得到多个词语的语义信息。
在本发明的另一个实施例中,过滤处理采用以下任一种或两种方式:去除前后缀和去除停用词。
在本发明的另一个实施例中,获取模块430将至少一个要素与知识库中的多个预设的要素知识点进行匹配以确定匹配的至少一个要素知识点,并根据匹配的至少一个要素知识点执行对应的预设分支流程,得到分支流程对应的答案,其中预先存储有每个意图对应的要素分支流程,预设分支流程为每个意图知识点对应的至少一组要素知识点连接而成,每组要素知识点包括至少一个要素知识点,每个要素知识点流程指向其他组要素知识点或答案。
在本发明的另一个实施例中,获取模块430确定至少一个意图中的至少一个意图的要素是否足以触发答案,如果至少一个意图中的至少一个意图的要素足以触发答案,则输出对应的答案;或者如果至少一个意图中的至少一个意图的要素不足以触发答案,则以反问的形式要求用户补全用于触发答案的要素。
在本发明的另一个实施例中,分析模块420将至少一个要素与多个预设的要素知识点进行语义相似度计算,其中至少一个意图中的每个意图对应多个词语中的至少一个词语,至少一个要素对应多个词语中除至少一个词语之外的词语,并将语义相似度最高的要素知识点作为匹配的至少一个要素知识点。
在本发明的另一个实施例中,至少一组要素知识点中的每组要素知识点包括同一语义条件的肯定的要素知识点和否定的要素知识点。
在本发明的另一个实施例中,分词处理采用以下方法中的一种或多种:双向最大匹配法、维特比算法、隐马尔可夫模型算法和条件随机场算法。
在本发明的另一个实施例中,问题包括以下一种或多种:文本消息、语音消息、图片消息、图像消息和视频消息。
在本发明的另一个实施例中,问题为语音消息、图片消息、图像消息或视频消息,图4的问答交互装置400还包括:转换模块460,用于将问题转换为文本消息。
上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
图5是根据本发明另一示例性实施例示出的一种问答交互装置500的框图。如图5所示,该问答交互装置500包括:
接收模块510,用于接收用户的问题,该问题包含至少一个意图和与至少一个意图中的每个意图相关的至少一个要素;
处理模块520,用于对问题进行分词处理,得到多个词语;
解析模块530,用于对多个词语进行语义解析,得到多个词语的语义信息;
计算模块540,用于将语义信息与知识库中的多个预设的意图知识点和要素知识点进行语义相似度计算,并将语义相似度最高的意图知识点和要素知识点分别作为匹配的意图知识点和要素知识点;
获取模块550,用于获取与匹配的意图知识点对应的意图以及与匹配的要素知识点对应的要素;
确定模块560,用于确定要素是否满足答案的触发条件,如果要素满足触发条件,则输出要素对应的答案;如果要素不满足触发条件,则提示用户补全用于触发答案的要素,并返回接收模块510;以及
发送模块570,用于将答案发送给用户。
根据本发明实施例提供的技术方案,通过对用户的问题进行处理和语义解析得到意图和与意图相关的要素,并基于意图执行主流程以及基于要素执行对应的分支流程,能够提高答案回复的速度和准确率,并因此提升用户体验。
图6是根据本发明另一示例性实施例示出的一种问答交互装置600的框图。如图6所示,该问答交互装置600包括:
接收模块610,用于接收用户的问题,该问题包含多个意图;
处理模块620,用于对问题进行分词处理,得到多个词语;
解析模块630,用于对多个词语进行语义解析,得到多个词语的语义信息;
组合模块640,用于根据语义信息对多个词语进行组合,得到待匹配词组,该待匹配词组中均包含多个意图中的一个意图;
计算模块650,用于按在问句中的前后顺序将待匹配词组中的至少两个词语组合与知识库中的多个预设的扩展问进行语义相似度计算,并将语义相似度最高的扩展问的意图知识点作为用户的意图;
消除模块660,消除问题的待匹配词组中已匹配到意图的词语,并将已消除的词语暂时存储在已消除词语集中;以及
判断模块670,用于判断问题中剩余的词语组成的待匹配词组是否与知识库中预设的扩展问完全匹配,如果问题的剩余的待匹配词组中的至少两个词语的组合与知识库中预设的扩展问完全匹配,则获取与匹配的扩展问对应的意图知识点作为问题中的又一个意图。其中知识库中包括多个意图知识点,每个意图知识点包括多个扩展问。如果问题中的剩余的待匹配词组未与多个预设的扩展问完全匹配,且缺少的词正好在已消除词语集中,则从已消除词语集中补入缺少的词语,为匹配成功;并返回计算模块650直到用户问题中的所有词语全部被消除或无法与知识库中的扩展问匹配。
根据本发明实施例提供的技术方案,通过对包含多意图的用户问题进行分词处理、语义解析、排列组合及语义信息共享,能够提高答案回复的速度和准确率,并因此提升用户体验。
图7是根据本发明一示例性实施例示出的用于问答交互的装置700的框图。
参照图7,装置700包括处理组件710,其进一步包括一个或多个处理器,以及由存储器720所代表的存储器资源,用于存储可由处理组件710的执行的指令,例如应用程序。存储器720中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件710被配置为执行指令,以执行上述问答交互方法。
装置700还可以包括一个电源组件730被配置为执行装置700的电源管理,一个有线或无线网络接口740被配置为将装置700连接到网络,和一个输入输出(I/O)接口750。装置700可以操作基于存储在存储器720的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
一种非临时性计算机可读存储介质,当存储介质中的指令由上述装置700的处理器执行时,使得上述装置700能够执行一种问答交互方法,包括:接收用户的问题,该问题包含至少一个意图和与至少一个意图中的每个意图相关的至少一个要素;对问题进行意图分析,得到至少一个意图和与至少一个意图中的每个意图相关的至少一个要素;根据至少一个意图和与至少一个意图中的每个意图相关的至少一个要素,获取问题对应的答案;以及将答案发送给用户。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序校验码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (28)
1.一种问答交互方法,其特征在于,包括:
接收用户的问题,所述问题包含至少一个意图和与所述至少一个意图中的每个意图相关的至少一个要素;
对所述问题进行意图分析,得到所述至少一个意图和与所述至少一个意图中的每个意图相关的至少一个要素;
根据所述至少一个意图和与所述至少一个意图中的每个意图相关的至少一个要素,获取所述问题对应的答案;以及
将所述答案发送给所述用户。
2.根据权利要求1所述的问答交互方法,其特征在于,所述对所述问题进行意图分析,得到所述至少一个意图和与所述至少一个意图中的每个意图相关的至少一个要素,包括:
对所述问题进行分词处理,得到多个词语;以及
根据所述多个词语从知识库获取所述至少一个意图,其中所述至少一个意图中的每个意图对应所述多个词语中的至少一个词语,所述至少一个要素对应所述多个词语中除所述至少一个词语之外的词语。
3.根据权利要求2所述的问答交互方法,其特征在于,所述对所述问题进行分词处理,得到多个词语,包括:
根据预设的分词规则和预设的分词词典对所述问题进行分词处理,得到所述多个词语。
4.根据权利要求2所述的问答交互方法,其特征在于,所述知识库包括多个预设的意图知识点,所述根据所述多个词语从知识库获取所述至少一个意图,包括:
分别对所述多个词语进行语义解析,得到所述多个词语的语义信息;
将所述语义信息与所述多个预设的意图知识点进行匹配以确定匹配的至少一个意图知识点;以及
获取与所述匹配的至少一个意图知识点对应的所述至少一个意图。
5.根据权利要求4所述的问答交互方法,其特征在于,所述将所述语义信息与所述多个预设的意图知识点进行匹配以确定匹配的至少一个意图知识点,包括:
将所述语义信息与所述多个预设的意图知识点进行语义相似度计算;以及
将语义相似度最高的意图知识点作为所述匹配的至少一个意图知识点。
6.根据权利要求4所述的问答交互方法,其特征在于,所述语义信息包括所述词语的同义词和/或同义词组合、所述词语的同类词和/或同类词组合、与所述词语具有相同或相似结构的实体中的至少一个。
7.根据权利要求4所述的问答交互方法,其特征在于,所述分别对所述多个词语进行语义解析,得到所述多个词语的语义信息之前,所述问答交互方法还包括:
对所述多个词语进行过滤处理,得到至少一个关键词,
其中,所述分别对所述多个词语进行语义解析,得到所述多个词语的语义信息,包括:
分别对所述至少一个关键词进行语义解析,得到所述多个词语的语义信息。
8.根据权利要求7所述的问答交互方法,其特征在于,所述过滤处理采用以下任一种或两种方式:去除前后缀和去除停用词。
9.根据权利要求1所述的问答交互方法,其特征在于,所述根据所述至少一个意图和与所述至少一个意图中的每个意图相关的至少一个要素,获取所述问题对应的答案,包括:
将所述至少一个要素与知识库中的多个预设的要素知识点进行匹配以确定匹配的至少一个要素知识点;以及
根据所述匹配的至少一个要素知识点执行对应的预设分支流程,得到所述分支流程对应的答案,其中预先存储有每个意图对应的要素分支流程,所述预设分支流程为每个意图知识点对应的至少一组要素知识点连接而成,每组要素知识点包括至少一个要素知识点,每个要素知识点流程指向其他组要素知识点或答案。
10.根据权利要求9所述的问答交互方法,其特征在于,所述执行分支流程的过程包括:
确定所述至少一个意图中的至少一个意图的要素是否足以触发答案;
如果所述至少一个意图中的至少一个意图的要素足以触发答案,则输出对应的答案;或者
如果所述至少一个意图中的至少一个意图的要素不足以触发答案,则以反问的形式要求用户补全用于触发答案的要素。
11.根据权利要求9所述的问答交互方法,其特征在于,所述将所述至少一个要素与所述多个预设的要素知识点进行匹配以确定匹配的至少一个要素知识点,包括:
将所述至少一个要素与所述多个预设的要素知识点进行语义相似度计算,其中所述至少一个意图中的每个意图对应所述多个词语中的至少一个词语,所述至少一个要素对应所述多个词语中除所述至少一个词语之外的词语;以及
将语义相似度最高的要素知识点作为所述匹配的至少一个要素知识点。
12.根据权利要求9所述的问答交互方法,其特征在于,所述至少一组要素知识点中的每组要素知识点包括同一语义条件的肯定的要素知识点和否定的要素知识点。
13.根据权利要求1至12中任一项所述的问答交互方法,其特征在于,所述问题包括以下一种或多种:文本消息、语音消息、图片消息、图像消息和视频消息,所述问答交互方法还包括:
将所述问题转换为文本消息。
14.一种问答交互装置,其特征在于,包括:
接收模块,用于接收用户的问题,所述问题包含至少一个意图和与所述至少一个意图中的每个意图相关的至少一个要素;
分析模块,用于对所述问题进行意图分析,得到所述至少一个意图和与所述至少一个意图中的每个意图相关的至少一个要素;
获取模块,用于根据所述至少一个意图和与所述至少一个意图中的每个意图相关的至少一个要素,获取所述问题对应的答案;以及
发送模块,用于将所述答案发送给所述用户。
15.根据权利要求14所述的问答交互装置,其特征在于,所述分析模块对所述问题进行分词处理,得到多个词语,并根据所述多个词语从知识库获取所述至少一个意图,其中所述至少一个意图中的每个意图对应所述多个词语中的至少一个词语,所述至少一个要素对应所述多个词语中除所述至少一个词语之外的词语。
16.根据权利要求15所述的问答交互装置,其特征在于,所述分析模块根据预设的分词规则和预设的分词词典对所述问题进行分词处理,得到所述多个词语。
17.根据权利要求15所述的问答交互装置,其特征在于,所述知识库包括多个预设的意图知识点,所述分析模块分别对所述多个词语进行语义解析,得到所述多个词语的语义信息,将所述语义信息与所述多个预设的意图知识点进行匹配以确定匹配的至少一个意图知识点,并获取与所述匹配的至少一个意图知识点对应的所述至少一个意图。
18.根据权利要求17所述的问答交互装置,其特征在于,所述分析模块将所述语义信息与所述多个预设的意图知识点进行语义相似度计算,并将语义相似度最高的意图知识点作为所述匹配的至少一个意图知识点。
19.根据权利要求17所述的问答交互装置,其特征在于,所述语义信息包括所述词语的同义词和/或同义词组合、所述词语的同类词和/或同类词组合、与所述词语具有相同或相似结构的实体中的至少一个。
20.根据权利要求17所述的问答交互装置,其特征在于,所述问答交互装置还包括:
过滤模块,用于对所述多个词语进行过滤处理,得到至少一个关键词,
其中,所述分析模块分别对所述至少一个关键词进行语义解析,得到所述多个词语的语义信息。
21.根据权利要求20所述的问答交互装置,其特征在于,所述过滤处理采用以下任一种或两种方式:去除前后缀和去除停用词。
22.根据权利要求14所述的问答交互装置,其特征在于,所述获取模块将所述至少一个要素与知识库中的多个预设的要素知识点进行匹配以确定匹配的至少一个要素知识点,并根据所述匹配的至少一个要素知识点执行对应的预设分支流程,得到所述分支流程对应的答案,其中预先存储有每个意图对应的要素分支流程,所述预设分支流程为每个意图知识点对应的至少一组要素知识点连接而成,每组要素知识点包括至少一个要素知识点,每个要素知识点流程指向其他组要素知识点或答案。
23.根据权利要求22所述的问答交互装置,其特征在于,所述获取模块确定所述至少一个意图中的至少一个意图的要素是否足以触发答案,如果所述至少一个意图中的至少一个意图的要素足以触发答案,则输出对应的答案;或者如果所述至少一个意图中的至少一个意图的要素不足以触发答案,则以反问的形式要求用户补全用于触发答案的要素。
24.根据权利要求22所述的问答交互装置,其特征在于,所述分析模块将所述至少一个要素与所述多个预设的要素知识点进行语义相似度计算,其中所述至少一个意图中的每个意图对应所述多个词语中的至少一个词语,所述至少一个要素对应所述多个词语中除所述至少一个词语之外的词语,并将语义相似度最高的要素知识点作为所述匹配的至少一个要素知识点。
25.根据权利要求22所述的问答交互装置,其特征在于,所述至少一组要素知识点中的每组要素知识点包括同一语义条件的肯定的要素知识点和否定的要素知识点。
26.根据权利要求14至25中任一项所述的问答交互装置,其特征在于,所述问题包括以下一种或多种:文本消息、语音消息、图片消息、图像消息和视频消息,所述问答交互装置还包括:
转换模块,用于将所述问题转换为文本消息。
27.一种计算机设备,包括:存储器、处理器及存储在所述存储器中并可在所述处理器中运行的可执行指令,其特征在于,所述处理器执行所述可执行指令时实现如权利要求1至13中任一项所述的问答交互方法。
28.一种计算机可读存储介质,其上存储有计算机可执行指令,其特征在于,所述可执行指令被处理器执行时实现如权利要求1至13中任一项所述的问答交互方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711206831.4A CN107992543B (zh) | 2017-11-27 | 2017-11-27 | 问答交互方法和装置、计算机设备及计算机可读存储介质 |
US16/052,143 US20190164064A1 (en) | 2017-11-27 | 2018-08-01 | Question and answer interaction method and device, and computer readable storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711206831.4A CN107992543B (zh) | 2017-11-27 | 2017-11-27 | 问答交互方法和装置、计算机设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107992543A true CN107992543A (zh) | 2018-05-04 |
CN107992543B CN107992543B (zh) | 2020-11-17 |
Family
ID=62033334
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711206831.4A Active CN107992543B (zh) | 2017-11-27 | 2017-11-27 | 问答交互方法和装置、计算机设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107992543B (zh) |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108880961A (zh) * | 2018-07-19 | 2018-11-23 | 广东美的厨房电器制造有限公司 | 家电设备控制方法及装置、计算机设备和存储介质 |
CN108959366A (zh) * | 2018-05-21 | 2018-12-07 | 宁波薄言信息技术有限公司 | 一种开放性问答的方法 |
CN109002434A (zh) * | 2018-05-31 | 2018-12-14 | 青岛理工大学 | 客服问答匹配方法、服务器及存储介质 |
CN109003605A (zh) * | 2018-07-02 | 2018-12-14 | 北京百度网讯科技有限公司 | 智能语音交互处理方法、装置、设备及存储介质 |
CN109361823A (zh) * | 2018-11-01 | 2019-02-19 | 深圳市号互联科技有限公司 | 一种语音与文本相互转化的智能交互方式 |
CN109697230A (zh) * | 2018-12-26 | 2019-04-30 | 联想(北京)有限公司 | 信息处理方法及电子设备 |
CN109767818A (zh) * | 2018-12-27 | 2019-05-17 | 厦门快商通信息技术有限公司 | 一种定制医疗答疑问诊引导系统 |
CN110019687A (zh) * | 2019-04-11 | 2019-07-16 | 宁波深擎信息科技有限公司 | 一种基于知识图谱的多意图识别系统、方法、设备及介质 |
CN110059231A (zh) * | 2019-04-19 | 2019-07-26 | 话媒(广州)科技有限公司 | 一种回复内容的生成方法及装置 |
CN110162675A (zh) * | 2018-09-25 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 应答语句的生成方法、装置、计算机可读介质及电子设备 |
CN110189751A (zh) * | 2019-04-24 | 2019-08-30 | 中国联合网络通信集团有限公司 | 语音处理方法及设备 |
CN110427467A (zh) * | 2019-06-26 | 2019-11-08 | 深圳追一科技有限公司 | 问答处理方法、装置、计算机设备和存储介质 |
CN110427461A (zh) * | 2019-08-06 | 2019-11-08 | 腾讯科技(深圳)有限公司 | 智能问答信息处理方法、电子设备及计算机可读存储介质 |
CN110472030A (zh) * | 2019-08-08 | 2019-11-19 | 网易(杭州)网络有限公司 | 人机交互方法、装置和电子设备 |
CN110502625A (zh) * | 2019-08-27 | 2019-11-26 | 北京百度网讯科技有限公司 | 医疗问题解答方法、装置、设备及计算机可读存储介质 |
CN110807091A (zh) * | 2019-03-01 | 2020-02-18 | 王涵 | 一种酒店智能问答推荐与决策支持分析方法及系统 |
CN110851484A (zh) * | 2019-11-13 | 2020-02-28 | 北京香侬慧语科技有限责任公司 | 一种获取多指标问题答案的方法及装置 |
CN111309882A (zh) * | 2020-02-13 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 用于实现智能客服问答的方法和装置 |
CN111933133A (zh) * | 2020-07-23 | 2020-11-13 | 珠海大横琴科技发展有限公司 | 智能客服应答的方法及装置、电子设备、存储介质 |
CN112035636A (zh) * | 2020-08-28 | 2020-12-04 | 康键信息技术(深圳)有限公司 | 医疗问诊系统的问答管理方法、装置、设备及存储介质 |
WO2021000403A1 (zh) * | 2019-07-03 | 2021-01-07 | 平安科技(深圳)有限公司 | 智能对话系统的语音匹配方法、电子装置、计算机设备 |
CN112199471A (zh) * | 2020-10-12 | 2021-01-08 | 康佳集团股份有限公司 | 一种客服问题信息处理方法、设备及存储介质 |
CN112395388A (zh) * | 2019-08-16 | 2021-02-23 | 阿里巴巴集团控股有限公司 | 信息处理方法及装置 |
CN112949280A (zh) * | 2021-03-02 | 2021-06-11 | 中国联合网络通信集团有限公司 | 一种数据处理方法和装置 |
CN113192500A (zh) * | 2020-01-29 | 2021-07-30 | 丰田自动车株式会社 | 代理装置、代理系统以及非暂时性记录介质 |
CN114265925A (zh) * | 2021-12-24 | 2022-04-01 | 科大讯飞(苏州)科技有限公司 | 问答方法、装置、电子设备及存储介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110019739A (zh) * | 2017-11-30 | 2019-07-16 | 上海智臻智能网络科技股份有限公司 | 基于必要条件的问答方法和装置、计算机设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104933084A (zh) * | 2015-05-04 | 2015-09-23 | 上海智臻网络科技有限公司 | 一种用于获得答案信息的方法、装置和设备 |
CN105653576A (zh) * | 2015-12-16 | 2016-06-08 | 上海智臻智能网络科技股份有限公司 | 信息搜索的方法及装置、人工座席服务方法及系统 |
CN105678324A (zh) * | 2015-12-31 | 2016-06-15 | 上海智臻智能网络科技股份有限公司 | 基于相似度计算的问答知识库的建立方法、装置及系统 |
US20160379107A1 (en) * | 2015-06-24 | 2016-12-29 | Baidu Online Network Technology (Beijing) Co., Ltd. | Human-computer interactive method based on artificial intelligence and terminal device |
CN107193865A (zh) * | 2017-04-06 | 2017-09-22 | 上海奔影网络科技有限公司 | 人机交互中自然语言意图理解方法及装置 |
-
2017
- 2017-11-27 CN CN201711206831.4A patent/CN107992543B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104933084A (zh) * | 2015-05-04 | 2015-09-23 | 上海智臻网络科技有限公司 | 一种用于获得答案信息的方法、装置和设备 |
US20160379107A1 (en) * | 2015-06-24 | 2016-12-29 | Baidu Online Network Technology (Beijing) Co., Ltd. | Human-computer interactive method based on artificial intelligence and terminal device |
CN105653576A (zh) * | 2015-12-16 | 2016-06-08 | 上海智臻智能网络科技股份有限公司 | 信息搜索的方法及装置、人工座席服务方法及系统 |
CN105678324A (zh) * | 2015-12-31 | 2016-06-15 | 上海智臻智能网络科技股份有限公司 | 基于相似度计算的问答知识库的建立方法、装置及系统 |
CN107193865A (zh) * | 2017-04-06 | 2017-09-22 | 上海奔影网络科技有限公司 | 人机交互中自然语言意图理解方法及装置 |
Cited By (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108959366A (zh) * | 2018-05-21 | 2018-12-07 | 宁波薄言信息技术有限公司 | 一种开放性问答的方法 |
CN108959366B (zh) * | 2018-05-21 | 2020-11-17 | 宁波薄言信息技术有限公司 | 一种开放性问答的方法 |
CN109002434A (zh) * | 2018-05-31 | 2018-12-14 | 青岛理工大学 | 客服问答匹配方法、服务器及存储介质 |
CN109003605A (zh) * | 2018-07-02 | 2018-12-14 | 北京百度网讯科技有限公司 | 智能语音交互处理方法、装置、设备及存储介质 |
CN109003605B (zh) * | 2018-07-02 | 2020-04-21 | 北京百度网讯科技有限公司 | 智能语音交互处理方法、装置、设备及存储介质 |
CN108880961A (zh) * | 2018-07-19 | 2018-11-23 | 广东美的厨房电器制造有限公司 | 家电设备控制方法及装置、计算机设备和存储介质 |
CN110162675A (zh) * | 2018-09-25 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 应答语句的生成方法、装置、计算机可读介质及电子设备 |
CN110162675B (zh) * | 2018-09-25 | 2023-05-02 | 腾讯科技(深圳)有限公司 | 应答语句的生成方法、装置、计算机可读介质及电子设备 |
CN109361823A (zh) * | 2018-11-01 | 2019-02-19 | 深圳市号互联科技有限公司 | 一种语音与文本相互转化的智能交互方式 |
CN109697230A (zh) * | 2018-12-26 | 2019-04-30 | 联想(北京)有限公司 | 信息处理方法及电子设备 |
CN109697230B (zh) * | 2018-12-26 | 2021-07-16 | 联想(北京)有限公司 | 信息处理方法及电子设备 |
CN109767818A (zh) * | 2018-12-27 | 2019-05-17 | 厦门快商通信息技术有限公司 | 一种定制医疗答疑问诊引导系统 |
CN110807091A (zh) * | 2019-03-01 | 2020-02-18 | 王涵 | 一种酒店智能问答推荐与决策支持分析方法及系统 |
CN110807091B (zh) * | 2019-03-01 | 2023-08-18 | 王涵 | 一种酒店智能问答推荐与决策支持分析方法及系统 |
CN110019687A (zh) * | 2019-04-11 | 2019-07-16 | 宁波深擎信息科技有限公司 | 一种基于知识图谱的多意图识别系统、方法、设备及介质 |
CN110019687B (zh) * | 2019-04-11 | 2021-03-23 | 宁波深擎信息科技有限公司 | 一种基于知识图谱的多意图识别系统、方法、设备及介质 |
CN110059231A (zh) * | 2019-04-19 | 2019-07-26 | 话媒(广州)科技有限公司 | 一种回复内容的生成方法及装置 |
CN110189751A (zh) * | 2019-04-24 | 2019-08-30 | 中国联合网络通信集团有限公司 | 语音处理方法及设备 |
CN110427467A (zh) * | 2019-06-26 | 2019-11-08 | 深圳追一科技有限公司 | 问答处理方法、装置、计算机设备和存储介质 |
WO2021000403A1 (zh) * | 2019-07-03 | 2021-01-07 | 平安科技(深圳)有限公司 | 智能对话系统的语音匹配方法、电子装置、计算机设备 |
CN110427461A (zh) * | 2019-08-06 | 2019-11-08 | 腾讯科技(深圳)有限公司 | 智能问答信息处理方法、电子设备及计算机可读存储介质 |
CN110427461B (zh) * | 2019-08-06 | 2023-04-07 | 腾讯科技(深圳)有限公司 | 智能问答信息处理方法、电子设备及计算机可读存储介质 |
CN110472030A (zh) * | 2019-08-08 | 2019-11-19 | 网易(杭州)网络有限公司 | 人机交互方法、装置和电子设备 |
CN112395388A (zh) * | 2019-08-16 | 2021-02-23 | 阿里巴巴集团控股有限公司 | 信息处理方法及装置 |
CN112395388B (zh) * | 2019-08-16 | 2023-12-26 | 阿里巴巴集团控股有限公司 | 信息处理方法及装置 |
CN110502625A (zh) * | 2019-08-27 | 2019-11-26 | 北京百度网讯科技有限公司 | 医疗问题解答方法、装置、设备及计算机可读存储介质 |
CN110851484A (zh) * | 2019-11-13 | 2020-02-28 | 北京香侬慧语科技有限责任公司 | 一种获取多指标问题答案的方法及装置 |
CN113192500A (zh) * | 2020-01-29 | 2021-07-30 | 丰田自动车株式会社 | 代理装置、代理系统以及非暂时性记录介质 |
CN111309882A (zh) * | 2020-02-13 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 用于实现智能客服问答的方法和装置 |
CN111933133A (zh) * | 2020-07-23 | 2020-11-13 | 珠海大横琴科技发展有限公司 | 智能客服应答的方法及装置、电子设备、存储介质 |
CN112035636A (zh) * | 2020-08-28 | 2020-12-04 | 康键信息技术(深圳)有限公司 | 医疗问诊系统的问答管理方法、装置、设备及存储介质 |
CN112199471A (zh) * | 2020-10-12 | 2021-01-08 | 康佳集团股份有限公司 | 一种客服问题信息处理方法、设备及存储介质 |
CN112199471B (zh) * | 2020-10-12 | 2024-09-06 | 康佳集团股份有限公司 | 一种客服问题信息处理方法、设备及存储介质 |
CN112949280A (zh) * | 2021-03-02 | 2021-06-11 | 中国联合网络通信集团有限公司 | 一种数据处理方法和装置 |
CN114265925A (zh) * | 2021-12-24 | 2022-04-01 | 科大讯飞(苏州)科技有限公司 | 问答方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN107992543B (zh) | 2020-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107992543A (zh) | 问答交互方法和装置、计算机设备及计算机可读存储介质 | |
CN109858007A (zh) | 语义分析问答方法和装置、计算机设备和存储介质 | |
CN109657238B (zh) | 基于知识图谱的上下文识别补全方法、系统、终端及介质 | |
CN107885874A (zh) | 数据查询方法和装置、计算机设备及计算机可读存储介质 | |
CN108170792A (zh) | 基于人工智能的问答引导方法、装置和计算机设备 | |
CN107632825A (zh) | 一种业务软件开发方法及装置 | |
CN107273861A (zh) | 一种主观题阅卷评分方法、装置及终端设备 | |
CN108536852A (zh) | 问答交互方法和装置、计算机设备及计算机可读存储介质 | |
CN110427610A (zh) | 文本分析方法、装置、计算机装置及计算机存储介质 | |
CN109033270A (zh) | 一种基于人工客服日志自动构建客服知识库的方法 | |
CN112434501B (zh) | 工单智能生成的方法、装置、电子设备及介质 | |
CN108984500A (zh) | 金额信息的提取方法、终端设备及介质 | |
CN109922213A (zh) | 语音咨询时的数据处理方法、装置、存储介质及终端设备 | |
CN108845986A (zh) | 一种情感分析方法、设备及系统、计算机可读存储介质 | |
CN110046806B (zh) | 用于客服派单的方法、装置和计算设备 | |
CN114387061A (zh) | 产品推送方法、装置、电子设备及可读存储介质 | |
CN107357785A (zh) | 主题特征词抽取方法及系统、情感极性判断方法及系统 | |
CN103678336A (zh) | 实体词识别方法及装置 | |
CN110364186A (zh) | 一种基于对抗学习的端到端的跨语言语音情感识别方法 | |
CN107341685A (zh) | 数据分析方法及装置 | |
CN111651571A (zh) | 基于人机协同的会话实现方法、装置、设备及存储介质 | |
CN109978020A (zh) | 一种基于多维特征的社交网络账号马甲身份辨识方法 | |
CN109902157A (zh) | 一种训练样本有效性检测方法及装置 | |
CN109947934A (zh) | 针对短文本的数据挖掘方法及系统 | |
CN110059955A (zh) | 一种ai客户管理追踪销售系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |