CN107169034B - 一种多轮人机交互的方法及系统 - Google Patents
一种多轮人机交互的方法及系统 Download PDFInfo
- Publication number
- CN107169034B CN107169034B CN201710256102.3A CN201710256102A CN107169034B CN 107169034 B CN107169034 B CN 107169034B CN 201710256102 A CN201710256102 A CN 201710256102A CN 107169034 B CN107169034 B CN 107169034B
- Authority
- CN
- China
- Prior art keywords
- scene
- input information
- slot
- information
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 143
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000013507 mapping Methods 0.000 claims description 61
- 238000000605 extraction Methods 0.000 claims description 37
- 230000002159 abnormal effect Effects 0.000 claims description 33
- 238000009825 accumulation Methods 0.000 claims description 7
- 230000002452 interceptive effect Effects 0.000 abstract description 8
- 230000008569 process Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 230000009471 action Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 5
- 230000004044 response Effects 0.000 description 3
- 241000238558 Eucarida Species 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 244000141359 Malus pumila Species 0.000 description 1
- 244000062793 Sorghum vulgare Species 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 235000021016 apples Nutrition 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- User Interface Of Digital Computer (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提出了一种多轮人机交互的方法及系统,多轮人机交互的方法包括:获取用户的输入信息及用户的用户ID;对输入信息进行场景分发,获取输入信息的场景;根据输入信息、用户ID、输入信息的场景,通过多轮人机交互获取返回信息;将返回信息发送至应用服务端,以供应用服务端执行返回信息,本发明通过多轮人机交互使得在更加复杂的企业应用场景中也能通过语音来完成各种交互操作,使用范围更加广泛,并且实现了场景的精确分发,显著提高了交互准确度和效率。
Description
技术领域
本发明涉及互联网技术领域,具体而言,涉及一种多轮人机交互的方法及系统。
背景技术
随着企业互联网的迅速发展,各个移动应用对智能化的需求越来越大,通过语音完成不同场景的多轮交互操作,而多轮交互的场景维持尤为重要。
目前典型的类似国外苹果针对个人的Siri、微软的小娜以及国内的支付宝、小米的语音助手只能通过简单的交互完成简单的操作。比如Siri,能够实现给某某打个电话,支付宝的语音助手,能够实现“给我查看一下XX”快递单以及页面跳转操作。但基本上都是语音一次交互,一次完成。而在企业应用中除了有打电话和查找人的一次语音交互场景外,存在更多的是多次交互的场景,比如请假、报销、发邮件等。例如,请假应用的场景需要询问请假类型、起止时间、原因、负责人、知会人,又如建立任务类型,需要明确知道建立任务的时间,相关参与人以及任务内容等。而目前现有语音助手类应用几乎都不能满足多次交互。
针对目前在企业应用中加入语音助手的主要技术难点如下:
1.企业应用中很多应用场景是多轮交互,比如请假,需要与用户交互询问用户的请假类型、请假的起止时间、请假的负责人以及原因等。
2.如何根据用户的输入信息,准确分发到相应场景,比如说拨打张三,需要准确分发到打电话的场景。
3.如何定义和存储不同场景的相关信息。
4.如何进行场景状态的维护以及场景内不同类型的跳转。
5.如何进行场景内各个槽的参数的抽取以及槽参数抽取器的设计,比如时间抽取,人名抽取,城市抽取。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的一个目的在于提出了一种多轮人机交互的方法。
本发明的另一个目的在于提出了一种多轮人机交互的系统。
有鉴于此,根据本发明的一个目的,提出了一种多轮人机交互的方法,包括:获取用户的输入信息及用户的用户ID;对输入信息进行场景分发,获取输入信息的场景;根据输入信息、用户ID、输入信息的场景,通过多轮人机交互获取返回信息;将返回信息发送至应用服务端,以供应用服务端执行返回信息。
本发明提供的多轮人机交互的方法,通过第三方语音识别软件获取用户语音信息,将语音信息转化为输入信息并获取用户ID,此转化的输入信息为文本输入信息,根据输入信息获取对应的输入信息的场景,根据输入信息、用户ID、输入信息的场景进行多轮人机交互,返回相应的问答提示信息、相关参数或者操作,由智能秘书应用服务端执行,本发明通过多轮人机交互使得在更加复杂的企业应用场景中也能通过语音来完成各种交互操作,使用范围更加广泛,并且实现了场景的精确分发,显著提高了交互准确度和效率。
根据本发明的上述多轮人机交互的方法,还可以具有以下技术特征:
在上述技术方案中,优选地,对输入信息进行场景分发,获取输入信息的场景的步骤,具体包括:在分发状态映射表中查找是否具有输入信息的场景记录;当具有输入信息的场景记录时,将场景记录作为输入信息的场景。
在该技术方案中,在多轮场景的交互过程,用户给出的信息通常无法直接判断出用户所处的场景,比如周一,可能是请假场景的请假开始时间,也可能是提醒场景的提醒时间,这时需要使用分发状态映射表,用来维护用户所处的场景,将输入信息分发到不同的场景,首先查找分发状态映射表中是否具有输入信息的场景记录,如果有则直接返回此场景记录,解决了多轮人机交互过程中用户的输入过短而无法明确交互场景的问题。
在上述任一技术方案中,优选地,还包括:当不具有输入信息的场景记录时,将场景模式库中的预存场景分发给输入信息;当分发成功后,将预存场景作为输入信息的场景,同时将预存场景记录至分发状态映射表中。
在该技术方案中,当不具有输入信息的场景记录时,在场景模式库中查找预存场景分发给输入信息,当分发成功后,即输入信息中包含明确的分发模式,则将预存场景作为输入信息的场景,并将此预存场景记录至分发状态映射表中,以便后续分发场景使用,通过预存场景的分发能够快速、精准完成场景分发,提高交互效率。
在上述任一技术方案中,优选地,还包括:当分发不成功时,根据输入信息的至少一个特征词,获取输入信息的场景;获取输入信息的场景成功后,将输入信息的场景记录至分发状态映射表中;获取输入信息的场景不成功时,返回空字符。
在该技术方案中,当未在场景模式库中分发到预存场景时,也就是对输入信息无法匹配到准确的场景的情况下,根据输入信息的至少一个特征词,获取输入信息的场景,获取输入信息的场景成功后将输入信息的场景记录至分发状态映射表中,实现场景的精确分发。获取输入信息的场景不成功时,返回空字符,以提示用户未获取到场景。
在上述任一技术方案中,优选地,根据输入信息的至少一个特征词,获取输入信息的场景,具体包括:对输入信息的至少一个特征词的场景进行权重值累加,将累加后的权重值最高的场景作为输入信息的场景。
在该技术方案中,将用户的输入信息经过Trie树扫描,累加碰到的特征词,并对不同特征词的场景权重累加,权重最高的场景作为输入信息的场景,如果有多个场景分类得分相同,可以配置特征词的优先级,并按照优先级别分类场景,对输入信息进行快速精确地场景分发,提高了交互效率和准确性。
在上述任一技术方案中,优选地,根据输入信息、用户ID、输入信息的场景,通过多轮人机交互获取返回信息的步骤,具体包括:根据用户ID及输入信息的场景,读取输入信息的场景的当前内容槽;根据当前内容槽的问答抽取项,从输入信息中抽取消息参数;抽取消息参数成功后,将消息参数转化为符合调用API(Application Programming Interface,应用程序编程接口)服务的参数,以及将消息参数记录到json文件中,进入下一个内容槽;以及返回信息为异常提示,并获取下一个输入信息。
在该技术方案中,输入信息的场景分发完毕后,进行多轮人机交互过程,根据用户ID及输入信息的场景读取当前内容槽,根据问答抽取项从输入信息中抽取消息参数,如果抽取到了消息参数,将消息参数转化为实际数据,即符合API服务的调用参数,便于后续对API服务的调用,并根据用户ID及输入信息的场景进入下一个内容槽,同时返回给用户异常提示,以提示用户输入下一个输入信息。
在上述任一技术方案中,优选地,还包括:从输入信息中抽取消息参数未成功时,判断输入信息中是否存在消息参数;当输入信息中不存在消息参数时,返回信息为当前内容槽的对应问句,并获取下一个输入信息;当输入信息中存在消息参数时,判断当前内容槽是否为必填槽以及当前内容槽是否提供默认参数;当当前内容槽不为必填槽时,设置抽取的消息参数为空,进入下一个内容槽;以及返回信息为异常提示,并获取下一个输入信息。
在该技术方案中,从输入信息中抽取消息参数未成功时,判断输入信息中是否存在消息参数,当输入信息中不存在消息参数时,说明用户只是进入了场景并没有提供参数,需要和用户交互来获取所需参数,则返回当前内容槽的对应问句,询问用户进而获取下一个输入信息。当输入信息中存在消息参数时而未提取出来的情况下,若当前内容槽为非必填槽,则将抽取的消息参数设为空,即此槽不填写,并进入下一个内容槽,异常提示可以为等待输入,等待用户输入下一个输入信息。
在上述任一技术方案中,优选地,还包括:当当前内容槽为必填槽以及当前内容槽提供默认参数时,将默认参数作为消息参数;将消息参数转化为符合调用API服务的参数,以及将消息参数记录到json文件中,同时进入下一个内容槽;当当前内容槽为必填槽以及当前内容槽未提供默认参数时,累加对输入信息的获取次数;判断获取次数是否超过预设次数;当获取次数超过预设次数时,使返回信息为失败提示。
在该技术方案中,从输入信息中抽取消息参数未成功但是输入信息中存在消息参数时,若当前槽为必填槽以及当前内容槽提供了默认参数时,将默认参数作为抽取到的消息参数,并转化为符合调用API服务的参数后进入下一个内容槽。若当前槽为必填槽以及当前内容槽没有提供默认参数时,说明用户的输入信息有误,继续获取用户的输入信息同时累加获取次数,当获取次数超过预设次数后,场景收集参数阶段失败,将场景中的失败提示返回给用户,退出交互过程。
在上述任一技术方案中,优选地,还包括:当获取次数未超过预设次数时,使返回信息为异常提示,并获取下一个输入信息。
在该技术方案中,当未超过预设次数时,返回给用户的异常提示可以为重新输入,等待用户重新输入信息。
在上述任一技术方案中,优选地,还包括:当下一个内容槽为终止槽时,返回信息为根据消息参数调用API服务;当下一个内容槽不为终止槽时,返回信息为当前内容槽的对应问句,获取下一个输入信息。
在该技术方案中,上述方案中的进入下一个内容槽前,判断此内容槽是否为终止槽,当为终止槽时场景收集参数阶段结束,根据消息参数调用API服务,当不为终止槽时,返回信息为当前槽的对应问句,询问用户并等待用户输入下一个输入信息。
在上述任一技术方案中,优选地,当返回信息为根据消息参数调用API服务时,还包括:根据输入信息的场景,获取API服务的API模板;将符合调用API服务的参数替换API模板中的参数。
在该技术方案中,当需要调用API服务时,根据输入信息的场景名称找到对应的API模板以及抽取的消息参数,根据API模板的槽名找到json文件中同一槽名的值进行转换,替换API模板中的槽名,改写完API模板格式后,可以直接将API模板数据交给智能秘书服务端,智能秘书服务端在根据解析返回的参数列表,并根据返回的类型执行相关操作。
在上述任一技术方案中,优选地,内容槽的参数包括以下一种或其组合:槽编号、槽名称、是否为必填槽、槽类型、优先级、对应问句、问答抽取项、异常提示、异常类型、是否必须交互。
在该技术方案中,内容槽的参数包括以下一种或其组合:槽编号、槽名称代表着Frame Parser框架中对应槽的位置编号及标记名称,槽类型包括起始槽、终结槽、终止槽,起始槽指的是Frame Parser解析开始遍历的槽位置,终结槽是指遍历需要结束的槽,而终止槽指的是整个框架遍历需要结束的槽,优先级代表着Frame Parser槽遍历的顺序,优先级越高越优先发问,同一优先级的可以随便安排顺序,即Frame Parser在响应用户请求的时候按照优先级来逐步和用户交互来收集任务所需参数信息,对应问句指的是FrameParser跳转到该槽需要对用户进行提示的问句信息,问答抽取项指的是Frame Parser对用户回答句子的处理逻辑,是否必须交互指的当前槽的数据获得是否需要通过交互获得,主要解决有些槽的数据在交互的时候通过上一次回答的数据获得。
根据本发明的另一个目的,提出了一种多轮人机交互的系统,包括:获取单元,用于获取用户的输入信息及用户的用户ID;场景分发单元,用于对输入信息进行场景分发,获取输入信息的场景;信息交互单元,用于根据输入信息、用户ID、输入信息的场景,通过多轮人机交互获取返回信息;发送单元,用于将返回信息发送至应用服务端,以供应用服务端执行返回信息。
本发明提供的多轮人机交互的系统,通过第三方语音识别软件获取用户语音信息,获取单元将语音信息转化为输入信息并获取用户ID,此转化的输入信息为文本输入信息,场景分发单元根据输入信息获取对应的输入信息的场景,信息交互单元根据输入信息、用户ID、输入信息的场景进行多轮人机交互,发送单元返回相应的问答提示信息、相关参数或者操作,由智能秘书应用服务端执行,本发明通过多轮人机交互使得在更加复杂的企业应用场景中也能通过语音来完成各种交互操作,使用范围更加广泛,并且实现了场景的精确分发,显著提高了交互准确度和效率。
根据本发明的上述多轮人机交互的系统,还可以具有以下技术特征:
在上述技术方案中,优选地,场景分发单元,具体用于:在分发状态映射表中查找是否具有输入信息的场景记录;当具有输入信息的场景记录时,将场景记录作为输入信息的场景。
在该技术方案中,在多轮场景的交互过程,用户给出的信息通常无法直接判断出用户所处的场景,比如周一,可能是请假场景的请假开始时间,也可能是提醒场景的提醒时间,这时需要通过场景分发单元使用分发状态映射表,用来维护用户所处的场景,将输入信息分发到不同的场景,首先查找分发状态映射表中是否具有输入信息的场景记录,如果有则直接返回此场景记录,解决了多轮人机交互过程中用户的输入过短而无法明确交互场景的问题。
在上述任一技术方案中,优选地,场景分发单元,还用于:当不具有输入信息的场景记录时,将场景模式库中的预存场景分发给输入信息;当分发成功后,将预存场景作为输入信息的场景,同时将预存场景记录至分发状态映射表中。
在该技术方案中,当不具有输入信息的场景记录时,场景分发单元在场景模式库中查找预存场景分发给输入信息,当分发成功后,即输入信息中包含明确的分发模式,则将预存场景作为输入信息的场景,并将此预存场景记录至分发状态映射表中,以便后续分发场景使用,通过预存场景的分发能够快速、精准完成场景分发,提高交互效率。
在上述任一技术方案中,优选地,场景分发单元,还用于:当分发不成功时,根据输入信息的至少一个特征词,获取输入信息的场景;获取输入信息的场景成功后,将输入信息的场景记录至分发状态映射表中;获取输入信息的场景不成功时,返回空字符。
在该技术方案中,当未在场景模式库中分发到预存场景时,也就是对输入信息无法匹配到准确的场景的情况下,场景分发单元根据输入信息的至少一个特征词,获取输入信息的场景,获取输入信息的场景成功后将输入信息的场景记录至分发状态映射表中,实现场景的精确分发。获取输入信息的场景不成功时,返回空字符,以提示用户未获取到场景。
在上述任一技术方案中,优选地,场景分发单元,还用于:对输入信息的至少一个特征词的场景进行权重值累加,将累加后的权重值最高的场景作为输入信息的场景。
在该技术方案中,场景分发单元将用户的输入信息经过Trie树扫描,累加碰到的特征词,并对不同特征词的场景权重累加,权重最高的场景作为输入信息的场景,如果有多个场景分类得分相同,可以配置特征词的优先级,并按照优先级别分类场景,对输入信息进行快速精确地场景分发,提高了交互效率和准确性。
在上述任一技术方案中,优选地,信息交互单元,具体用于:根据用户ID及所述输入信息的场景,读取输入信息的场景的当前内容槽;根据当前内容槽的问答抽取项,从输入信息中抽取消息参数;抽取消息参数成功后,将消息参数转化为符合调用API服务的参数,以及将消息参数记录到json文件中,进入下一个内容槽;以及返回信息为异常提示,并获取下一个输入信息。
在该技术方案中,输入信息的场景分发完毕后,进行多轮人机交互过程,信息交互单元根据用户ID及输入信息的场景读取当前内容槽,根据问答抽取项从输入信息中抽取消息参数,如果抽取到了消息参数,将消息参数转化为实际数据,即符合API服务的调用参数,便于后续对API服务的调用,并根据用户ID及输入信息的场景进入下一个内容槽,同时返回给用户异常提示,以提示用户输入下一个输入信息。
在上述任一技术方案中,优选地,信息交互单元,还用于:从输入信息中抽取消息参数未成功时,判断输入信息中是否存在消息参数;当输入信息中不存在所述消息参数时,使返回信息为当前内容槽的对应问句,并获取下一个输入信息;当输入信息中存在消息参数时,判断当前内容槽是否为必填槽以及当前内容槽是否提供默认参数;当当前内容槽不为所述必填槽时,设置抽取的消息参数为空,进入下一个内容槽;以及使返回信息为异常提示,并获取下一个输入信息。
在该技术方案中,从输入信息中抽取消息参数未成功时,信息交互单元判断输入信息中是否存在消息参数,当输入信息中不存在消息参数时,说明用户只是进入了场景并没有提供参数,需要和用户交互来获取所需参数,则返回当前内容槽的对应问句,询问用户进而获取下一个输入信息。当输入信息中存在消息参数时而未提取出来的情况下,若当前内容槽为非必填槽,则将抽取的消息参数设为空,即此槽不填写,并进入下一个内容槽,异常提示可以为等待输入,等待用户输入下一个输入信息。
在上述任一技术方案中,优选地,信息交互单元,还用于:当当前内容槽为所述必填槽以及当前内容槽提供默认参数时,将默认参数作为消息参数;将消息参数转化为符合调用API服务的参数,以及将消息参数记录到json文件中,同时进入下一个内容槽;当当前内容槽为必填槽以及当前内容槽未提供默认参数时,累加对输入信息的获取次数;判断获取次数是否超过预设次数;当获取次数超过预设次数时,使返回信息为失败提示。
在该技术方案中,从输入信息中抽取消息参数未成功但是输入信息中存在消息参数时,若当前槽为必填槽以及当前内容槽提供了默认参数时,将默认参数作为抽取到的消息参数,并转化为符合调用API服务的参数后进入下一个内容槽。若当前槽为必填槽以及当前内容槽没有提供默认参数时,说明用户的输入信息有误,继续获取用户的输入信息同时累加获取次数,当获取次数超过预设次数后,场景收集参数阶段失败,将场景中的失败提示返回给用户,退出交互过程。
在上述任一技术方案中,优选地,信息交互单元,还用于:当获取次数未超过预设次数时,使返回信息为异常提示,并获取下一个输入信息。
在该技术方案中,当未超过预设次数时,信息交互单元返回给用户的异常提示可以为重新输入,等待用户重新输入。
在上述任一技术方案中,优选地,信息交互单元,还用于:当下一个内容槽为终止槽时,返回信息为根据消息参数调用所述API服务;当下一个内容槽不为终止槽时,返回信息为当前内容槽的对应问句,并获取下一个输入信息。
在该技术方案中,上述方案中的进入下一个内容槽前,判断此内容槽是否为终止槽,当为终止槽时场景收集参数阶段结束,根据消息参数调用API服务,当不为终止槽时,返回信息为当前槽的对应问句,询问用户并等待用户输入的下一个输入信息。
在上述任一技术方案中,优选地,当返回信息为根据消息参数调用API服务时,信息交互单元,还用于:根据输入信息的场景,获取API服务的API模板;将符合调用API服务的参数替换API模板中的参数。
在该技术方案中,当需要调用API服务时,根据输入信息的场景名称找到对应的API模板以及抽取的消息参数,根据API模板的槽名找到json文件中同一槽名的值进行转换,替换API模板中的槽名,改写完API模板格式后,可以直接将API模板数据交给智能秘书服务端,智能秘书服务端在根据解析返回的参数列表,并根据返回的类型执行相关操作。
在上述任一技术方案中,优选地,内容槽的参数包括以下一种或其组合:槽编号、槽名称、是否为必填槽、槽类型、优先级、对应问句、问答抽取项、异常提示、异常类型、是否必须交互。
在该技术方案中,内容槽的参数包括以下一种或其组合:槽编号、槽名称代表着Frame Parser框架中对应槽的位置编号及标记名称,槽类型包括起始槽、终结槽、终止槽,起始槽指的是Frame Parser解析开始遍历的槽位置,终结槽是指遍历需要结束的槽,而终止槽指的是整个框架遍历需要结束的槽,优先级代表着Frame Parser槽遍历的顺序,优先级越高越优先发问,同一优先级的可以随便安排顺序,即Frame Parser在响应用户请求的时候按照优先级来逐步和用户交互来收集任务所需参数信息,对应问句指的是FrameParser跳转到该槽需要对用户进行提示的问句信息,问答抽取项指的是Frame Parser对用户回答句子的处理逻辑,是否必须交互指的当前槽的数据获得是否需要通过交互获得,主要解决有些槽的数据在交互的时候通过上一次回答的数据获得。
本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1示出了本发明的一个实施例的多轮人机交互的方法的流程示意图;
图2示出了本发明的另一个实施例的多轮人机交互的方法的流程示意图;
图3示出了本发明的再一个实施例的多轮人机交互的方法的流程示意图;
图4示出了本发明的一个实施例的多轮人机交互的系统的示意图;
图5示出了本发明的一个具体实施例的多轮人机交互的系统的整体架构图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不限于下面公开的具体实施例的限制。
本发明第一方面的实施例,提出一种多轮人机交互的方法,图1示出了本发明的一个实施例的多轮人机交互的方法的流程示意图。其中,该方法包括:
步骤102,获取用户的输入信息及用户的用户ID;
步骤104,对输入信息进行场景分发,获取输入信息的场景;
步骤106,根据输入信息、用户ID、输入信息的场景,通过多轮人机交互获取返回信息;
步骤108,将返回信息发送至应用服务端,以供应用服务端执行返回信息。
本发明提供的多轮人机交互的方法,通过第三方语音识别软件获取用户语音信息,将语音信息转化为输入信息并获取用户ID,此转化的输入信息为文本输入信息,根据输入信息获取对应的输入信息的场景,根据输入信息、用户ID、输入信息的场景进行多轮人机交互,返回相应的问答提示信息、相关参数或者操作,由智能秘书应用服务端执行,本发明通过多轮人机交互使得在更加复杂的企业应用场景中也能通过语音来完成各种交互操作,使用范围更加广泛,并且实现了场景的精确分发,显著提高了交互准确度和效率。
图2示出了本发明的另一个实施例的多轮人机交互的方法的流程示意图。其中,该方法包括:
步骤202,获取用户的输入信息及用户的用户ID;
步骤204,在分发状态映射表中查找是否具有输入信息的场景记录;
步骤206,当具有输入信息的场景记录时,将场景记录作为输入信息的场景;
步骤208,当不具有输入信息的场景记录时,将场景模式库中的预存场景分发给输入信息;
步骤210,判断预存场景分发给输入信息是否成功;
步骤212,当分发成功后,将预存场景作为输入信息的场景,同时将预存场景记录至分发状态映射表中;
步骤214,当分发不成功时,对输入信息的至少一个特征词的场景进行权重值累加,将累加后的权重值最高的场景作为输入信息的场景;
步骤216,判断是否成功根据特征词获取输入信息的场景;
步骤218,获取输入信息的场景成功后,将输入信息的场景记录至分发状态映射表中;
步骤220,获取输入信息的场景不成功时,返回空字符;
步骤222,根据输入信息、用户ID、输入信息的场景,通过多轮人机交互获取返回信息;
步骤224,将返回信息发送至应用服务端,以供应用服务端执行返回信息。
在该实施例中,在多轮场景的交互过程,用户给出的信息通常无法直接判断出用户所处的场景,比如周一,可能是请假场景的请假开始时间,也可能是提醒场景的提醒时间,这时需要使用分发状态映射表,用来维护用户所处的场景,将输入信息分发到不同的场景,首先查找分发状态映射表中是否具有输入信息的场景记录,如果有则直接返回此场景记录,解决了多轮人机交互过程中用户的输入过短而无法明确交互场景的问题。
当不具有输入信息的场景记录时,在场景模式库中查找预存场景分发给输入信息,当分发成功后,即输入信息中包含明确的分发模式,则将预存场景作为输入信息的场景,并将此预存场景记录至分发状态映射表中,以便后续分发场景使用,通过预存场景的分发能够快速、精准完成场景分发,提高交互效率。
当未在场景模式库中分发到预存场景时,也就是对输入信息无法匹配到准确的场景的情况下,根据输入信息的至少一个特征词,获取输入信息的场景,获取输入信息的场景成功后将输入信息的场景记录至分发状态映射表中,实现场景的精确分发。获取输入信息的场景不成功时,返回空字符,以提示用户未获取到场景。
根据输入信息的至少一个特征词,获取输入信息的场景,具体包括:将用户的输入信息经过Trie树扫描,累加碰到的特征词,并对不同特征词的场景权重累加,权重最高的场景作为输入信息的场景,如果有多个场景分类得分相同,可以配置特征词的优先级,并按照优先级别分类场景,对输入信息进行快速精确地场景分发,提高了交互效率和准确性。
图3示出了本发明的再一个实施例的多轮人机交互的方法的流程示意图。其中,该方法包括:
步骤302,获取用户的输入信息及用户的用户ID;
步骤304,对输入信息进行场景分发,获取输入信息的场景;
步骤306,根据用户ID及输入信息的场景,读取输入信息的场景的当前内容槽;根据当前内容槽的问答抽取项,从输入信息中抽取消息参数;
步骤308,判断从输入信息中抽取消息参数是否成功;
步骤310,抽取消息参数成功后,将消息参数转化为符合调用API服务的参数,以及将消息参数记录到json文件中,进入下一个内容槽;以及返回信息为异常提示,并获取下一个输入信息;
步骤312,从输入信息中抽取消息参数未成功时,判断输入信息中是否存在消息参数,当输入信息中不存在消息参数时,进入步骤314,当输入信息中不存在消息参数时,进入步骤316;
步骤314,返回信息为当前内容槽的对应问句,并获取下一个输入信息;
步骤316,判断当前内容槽是否为必填槽;
步骤318,当当前内容槽不为必填槽时,设置抽取的消息参数为空,进入下一个内容槽;以及返回信息为异常提示,并获取下一个输入信息;
步骤320,当当前内容槽为必填槽时,判断当前内容槽是否提供默认参数;
步骤322,当当前内容槽提供默认参数时,将默认参数作为消息参数;将消息参数转化为符合调用API服务的参数,以及将消息参数记录到json文件中,同时进入下一个内容槽;
步骤324,当当前内容槽未提供默认参数时,累加对输入信息的获取次数;判断获取次数是否超过预设次数;当获取次数超过预设次数时,使返回信息为失败提示;当获取次数未超过预设次数时,使返回信息为异常提示,并获取下一个输入信息;
步骤326,判断下一个内容槽是否为终止槽,当下一个内容槽不为终止槽时,进入步骤316;
步骤328,当下一个内容槽为终止槽时,返回信息为根据消息参数调用API服务;
步骤330,将返回信息发送至应用服务端,以供应用服务端执行返回信息。
需要说明的是,上述任一步骤中出现获取下一个输入信息时,可以从步骤304开始再进行。
在该实施例中,输入信息的场景分发完毕后,进行多轮人机交互过程,根据用户ID及输入信息的场景读取当前内容槽,根据问答抽取项从输入信息中抽取消息参数,如果抽取到了消息参数,将消息参数转化为实际数据,即符合API服务的调用参数,便于后续对API服务的调用,并根据用户ID及输入信息的场景进入下一个内容槽,同时返回给用户异常提示,以提示用户输入下一个输入信息。
从输入信息中抽取消息参数未成功时,判断输入信息中是否存在消息参数,当输入信息中不存在消息参数时,说明用户只是进入了场景并没有提供参数,需要和用户交互来获取所需参数,则返回当前内容槽的对应问句,询问用户进而获取下一个输入信息。当输入信息中存在消息参数时而未提取出来的情况下,若当前内容槽为非必填槽,则将抽取的消息参数设为空,即此槽不填写,并进入下一个内容槽,异常提示可以为等待输入,等待用户输入下一个输入信息。
从输入信息中抽取消息参数未成功但是输入信息中存在消息参数时,若当前槽为必填槽以及当前内容槽提供了默认参数时,将默认参数作为抽取到的消息参数,并转化为符合调用API服务的参数后进入下一个内容槽。若当前槽为必填槽以及当前内容槽没有提供默认参数时,说明用户的输入信息有误,继续获取用户的输入信息同时累加获取次数,当获取次数超过预设次数后,场景收集参数阶段失败,将场景中的失败提示返回给用户,退出交互过程。当未超过预设次数时,返回给用户的异常提示可以为重新输入,等待用户重新输入信息。
上述方案中的进入下一个内容槽前,判断此内容槽是否为终止槽,当为终止槽时场景收集参数阶段结束,根据消息参数调用API服务,当不为终止槽时,返回信息为当前槽的对应问句,询问用户并等待用户输入下一个输入信息。
在本发明的一个实施例中,优选地,当返回信息为根据消息参数调用API服务时,还包括:根据输入信息的场景,获取API服务的API模板;将符合调用API服务的参数替换API模板中的参数。
在该实施例中,当需要调用API服务时,根据输入信息的场景名称找到对应的API模板以及抽取的消息参数,根据API模板的槽名找到json文件中同一槽名的值进行转换,替换API模板中的槽名,改写完API模板格式后,可以直接将API模板数据交给智能秘书服务端,智能秘书服务端在根据解析返回的参数列表,并根据返回的类型执行相关操作。
在本发明的一个实施例中,优选地,内容槽的参数包括以下一种或其组合:槽编号、槽名称、是否为必填槽、槽类型、优先级、对应问句、问答抽取项、异常提示、异常类型、是否必须交互。
在该实施例中,内容槽的参数包括以下一种或其组合:槽编号、槽名称代表着Frame框架中对应槽的位置编号及标记名称,槽类型包括起始槽、终结槽、终止槽,起始槽指的是Frame Parser解析开始遍历的槽位置,终结槽是指遍历需要结束的槽,而终止槽指的是整个框架遍历需要结束的槽,优先级代表着Frame Parser槽遍历的顺序,优先级越高越优先发问,同一优先级的可以随便安排顺序,即Frame Parser在响应用户请求的时候按照优先级来逐步和用户交互来收集任务所需参数信息,对应问句指的是Frame Parser跳转到该槽需要对用户进行提示的问句信息,问答抽取项指的是Frame Parser对用户回答句子的处理逻辑,是否必须交互指的当前槽的数据获得是否需要通过交互获得,主要解决有些槽的数据在交互的时候通过上一次回答的数据获得。
本发明第二方面的实施例,提出一种多轮人机交互的系统400,图4示出了本发明的一个实施例的多轮人机交互的系统400的示意图。其中,该系统包括:
获取单元402,用于获取用户的输入信息及用户的用户ID;
场景分发单元404,用于对输入信息进行场景分发,获取输入信息的场景;
信息交互单元406,用于根据输入信息、用户ID、输入信息的场景,通过多轮人机交互获取返回信息;
发送单元408,用于将返回信息发送至应用服务端,以供应用服务端执行返回信息。
本发明提供的多轮人机交互的系统400,通过第三方语音识别软件获取用户语音信息,获取单元402将语音信息转化为输入信息并获取用户ID,此转化的输入信息为文本输入信息,场景分发单元404根据输入信息获取对应的输入信息的场景,信息交互单元406根据输入信息、用户ID、输入信息的场景进行多轮人机交互,发送单元408返回相应的问答提示信息、相关参数或者操作,由智能秘书应用服务端执行,本发明通过多轮人机交互使得在更加复杂的企业应用场景中也能通过语音来完成各种交互操作,使用范围更加广泛,并且实现了场景的精确分发,显著提高了交互准确度和效率。
在本发明的一个实施例中,优选地,场景分发单元404,具体用于:在分发状态映射表中查找是否具有输入信息的场景记录;当具有输入信息的场景记录时,将场景记录作为输入信息的场景。
在该实施例中,在多轮场景的交互过程,用户给出的信息通常无法直接判断出用户所处的场景,比如周一,可能是请假场景的请假开始时间,也可能是提醒场景的提醒时间,这时需要通过场景分发单元404使用分发状态映射表,用来维护用户所处的场景,将输入信息分发到不同的场景,首先查找分发状态映射表中是否具有输入信息的场景记录,如果有则直接返回此场景记录,解决了多轮人机交互过程中用户的输入过短而无法明确交互场景的问题。
在本发明的一个实施例中,优选地,场景分发单元404,还用于:当不具有输入信息的场景记录时,将场景模式库中的预存场景分发给输入信息;当分发成功后,将预存场景作为输入信息的场景,同时将预存场景记录至分发状态映射表中。
在该实施例中,当不具有输入信息的场景记录时,场景分发单元404在场景模式库中查找预存场景分发给输入信息,当分发成功后,即输入信息中包含明确的分发模式,则将预存场景作为输入信息的场景,并将此预存场景记录至分发状态映射表中,以便后续分发场景使用,通过预存场景的分发能够快速、精准完成场景分发,提高交互效率。
在本发明的一个实施例中,优选地,场景分发单元404,还用于:当分发不成功时,根据输入信息的至少一个特征词,获取输入信息的场景;获取输入信息的场景成功后,将输入信息的场景记录至分发状态映射表中;获取输入信息的场景不成功时,返回空字符。
在该实施例中,当未在场景模式库中分发到预存场景时,也就是对输入信息无法匹配到准确的场景的情况下,场景分发单元404根据输入信息的至少一个特征词,获取输入信息的场景,获取输入信息的场景成功后将输入信息的场景记录至分发状态映射表中,实现场景的精确分发。获取输入信息的场景不成功时,返回空字符,以提示用户未获取到场景。
在本发明的一个实施例中,优选地,场景分发单元404,还用于:对输入信息的至少一个特征词的场景进行权重值累加,将累加后的权重值最高的场景作为输入信息的场景。
在该实施例中,场景分发单元404将用户的输入信息经过Trie树扫描,累加碰到的特征词,并对不同特征词的场景权重累加,权重最高的场景作为输入信息的场景,如果有多个场景分类得分相同,可以配置特征词的优先级,并按照优先级别分类场景,对输入信息进行快速精确地场景分发,提高了交互效率和准确性。
在本发明的一个实施例中,优选地,信息交互单元406,具体用于:根据用户ID及所述输入信息的场景,读取输入信息的场景的当前内容槽;根据当前内容槽的问答抽取项,从输入信息中抽取消息参数;抽取消息参数成功后,将消息参数转化为符合调用API服务的参数,以及将消息参数记录到json文件中,进入下一个内容槽;以及返回信息为异常提示,并获取下一个输入信息。
在该实施例中,输入信息的场景分发完毕后,进行多轮人机交互过程,信息交互单元406根据用户ID及输入信息的场景读取当前内容槽,根据问答抽取项从输入信息中抽取消息参数,如果抽取到了消息参数,将消息参数转化为实际数据,即符合API服务的调用参数,便于后续对API服务的调用,并根据用户ID及输入信息的场景进入下一个内容槽,同时返回给用户异常提示,以提示用户输入下一个输入信息。
在本发明的一个实施例中,优选地,信息交互单元406,还用于:从输入信息中抽取消息参数未成功时,判断输入信息中是否存在消息参数;当输入信息中不存在所述消息参数时,使返回信息为当前内容槽的对应问句,并获取下一个输入信息;当输入信息中存在消息参数时,判断当前内容槽是否为必填槽以及当前内容槽是否提供默认参数;当当前内容槽不为所述必填槽时,设置抽取的消息参数为空,进入下一个内容槽;以及使返回信息为异常提示,并获取下一个输入信息。
在该实施例中,从输入信息中抽取消息参数未成功时,信息交互单元406判断输入信息中是否存在消息参数,当输入信息中不存在消息参数时,说明用户只是进入了场景并没有提供参数,需要和用户交互来获取所需参数,则返回当前内容槽的对应问句,询问用户进而获取下一个输入信息。当输入信息中存在消息参数时而未提取出来的情况下,若当前内容槽为非必填槽,则将抽取的消息参数设为空,即此槽不填写,并进入下一个内容槽,异常提示可以为等待输入,等待用户输入下一个输入信息。
在本发明的一个实施例中,优选地,信息交互单元406,还用于:当当前内容槽为所述必填槽以及当前内容槽提供默认参数时,将默认参数作为消息参数;将消息参数转化为符合调用API服务的参数,以及将消息参数记录到json文件中,同时进入下一个内容槽;当当前内容槽为必填槽以及当前内容槽未提供默认参数时,累加对输入信息的获取次数;判断获取次数是否超过预设次数;当获取次数超过预设次数时,使返回信息为失败提示。
在该实施例中,从输入信息中抽取消息参数未成功但是输入信息中存在消息参数时,若当前槽为必填槽以及当前内容槽提供了默认参数时,将默认参数作为抽取到的消息参数,并转化为符合调用API服务的参数后进入下一个内容槽。若当前槽为必填槽以及当前内容槽没有提供默认参数时,说明用户的输入信息有误,继续获取用户的输入信息同时累加获取次数,当获取次数超过预设次数后,场景收集参数阶段失败,将场景中的失败提示返回给用户,退出交互过程。
在本发明的一个实施例中,优选地,信息交互单元406,还用于:当获取次数未超过预设次数时,使返回信息为异常提示,并获取下一个输入信息。
在该实施例中,当未超过预设次数时,信息交互单元406返回给用户的异常提示可以为重新输入,等待用户重新输入。
在本发明的一个实施例中,优选地,信息交互单元406,还用于:当下一个内容槽为终止槽时,返回信息为根据消息参数调用所述API服务;当下一个内容槽不为终止槽时,返回信息为当前内容槽的对应问句,并获取下一个输入信息。
在该实施例中,上述方案中的进入下一个内容槽前,判断此内容槽是否为终止槽,当为终止槽时场景收集参数阶段结束,根据消息参数调用API服务,当不为终止槽时,返回信息为当前槽的对应问句,询问用户并等待用户输入的下一个输入信息。
在本发明的一个实施例中,优选地,当返回信息为根据消息参数调用API服务时,信息交互单元406,还用于:根据输入信息的场景,获取API服务的API模板;将符合调用API服务的参数替换API模板中的参数。
在该实施例中,当需要调用API服务时,根据输入信息的场景名称找到对应的API模板以及抽取的消息参数,根据API模板的槽名找到json文件中同一槽名的值进行转换,替换API模板中的槽名,改写完API模板格式后,可以直接将API模板数据交给智能秘书服务端,智能秘书服务端在根据解析返回的参数列表,并根据返回的类型执行相关操作。
在本发明的一个实施例中,优选地,内容槽的参数包括以下一种或其组合:槽编号、槽名称、是否为必填槽、槽类型、优先级、对应问句、问答抽取项、异常提示、异常类型、是否必须交互。
在该实施例中,内容槽的参数包括以下一种或其组合:槽编号、槽名称代表着Frame框架中对应槽的位置编号及标记名称,槽类型包括起始槽、终结槽、终止槽,起始槽指的是Frame Parser解析开始遍历的槽位置,终结槽是指遍历需要结束的槽,而终止槽指的是整个框架遍历需要结束的槽,优先级代表着Frame Parser槽遍历的顺序,优先级越高越优先发问,同一优先级的可以随便安排顺序,即Frame Parser在响应用户请求的时候按照优先级来逐步和用户交互来收集任务所需参数信息,对应问句指的是Frame Parser跳转到该槽需要对用户进行提示的问句信息,问答抽取项指的是Frame Parser对用户回答句子的处理逻辑,是否必须交互指的当前槽的数据获得是否需要通过交互获得,主要解决有些槽的数据在交互的时候通过上一次回答的数据获得。
本发明具体实施例中,智能秘书的主要工作过程是根据用户的输入信息分发到不同的场景提示用户完成不同场景的交互。该方案的整体架构图如图5所示,从宏观上看主要分为三大子系统:场景分发系统、场景解析Frame Parser系统以及应用API管理系统。下面分别来叙述各子系统:
一.场景分发系统
该部分主要负责根据输入信息,分发不同的场景。场景的分发状态可以分为两种,一是没有进入场景,二是已经进入场景。关于场景分发系统中的基础构件包括:
1.场景分发系统的基础构件
场景分发系统主要包含三个基础构件,一个是场景分发状态映射表,另一个是场景模式分发器,再一个是场景分类器。
(1)场景分发状态映射表:在多轮场景的交互过程,用户给出的信息通常无法直接判断出用户所处的场景,比如周一,可能是请假场景的请假开始时间,也可能是提醒场景的提醒时间,这时需要使用场景分发状态映射表来维护用户所处的场景,用于解决多轮人机交互过程中用户的输入信息较短,而无法明确交互场景的问题。场景分发状态映射表的具体实现方式采用键值对数据库Redis进行实现,在Redis建立一个用于场景分发的场景分发状态映射表,其中key是用户的唯一ID,value是用户所处的某个场景的编号。
(2)场景模式分发器:场景模式分发器主要用于解决用户的输入信息中包含明确的场景分发模式的情况。例如在“给XX打个电话”中,可以明确知道是要分发到打电话场景,“向XX请个假”中,可以明确知道是要分发到请假场景。场景模式分发器主要实现方式是正确匹配场景模式库中的模式。场景模式库里面包含了许多的场景模式,即模式名称为key,场景编码为value的映射资源文件。该部分场景分发通常比较准确,不易误判。
(3)场景分类器:场景分类器是整个场景分发器的核心,在整个场景分发子系统中主要解决通过模式无法准确进行匹配到场景的情况,核心思想是通过一些场景特征词构建一个场景分类器,进行不同场景打分,选择一个得分最高的场景。场景分类器具体的实现是通过“配置文件+Trie树”的方式,加速场景模式的匹配,从而加速场景的分发。实现细节如下,首先建立的场景特征词的配置文件如表1所示:
表1
关键词 | 场景编号 | 概率 | 优先级 |
股票 | GP | 0.8 | 2 |
股价 | GP | 0.8 | 2 |
翻译 | TR | 1.0 | 1 |
机票 | AP | 1.0 | 1 |
在系统初始化时候,将上述配置文件加载到Trie树中,叶子节点存储场景编号及其概率和优先级。利用上述配置文件可以简单的建立一个场景分发器,场景分发过程是将用户输入经过Trie树扫描,累加碰到的关键词,并对不同类别权重累加,权重最高的作为分类结果,如果有多个场景分类得分相同,则按照优先级别分类。
2.场景分发系统的基本流程
用户首先查找分发状态映射表是否有场景记录,如果有则直接返回场景,如果没有场景,那么进入场景选择模块,场景选择模块主要通过两种方式,一种是根据分发模式进行分发,另一种是构建一个分类器按照场景的特征词进行分发。如果用户能够在场景模式中得到分发,那么首先在分发状态映射表中记录用户所处的场景状态,然后返回用户所处的场景。如果用户不能在场景模式分发中进行匹配,那么进入场景分类器根据关键词进行匹配,如果能得到匹配的场景,同样在分发状态映射表中记录用户的场景,返回用户所处的场景,但如果匹配不到,那么直接返回空字符表示不能确定用户所处的场景,整个场景分发子系统就此结束。从图5的整体交互架构看,经过场景分发子系统分发到相应的场景,下一步交给具体的Frame Parser进行场景交互。
二.Frame Parser
Frame Parser主要完成从场景分发器接收用户ID、场景ID、用户的输入信息,然后根据用户从状态State Redis获得用户当前场景处于哪个状态来采取动作和输出,每次响应有两个工作要做:第一个是根据Frame信息以及当前用户所处场景状态输出对应的问句;第二个是根据用户的输入信息抽取出当前场景任务所需的参数信息并保存。
1.Frame Parser的基础构件
(1)Frame槽结构设计:一个场景对应一个框架Frame,比如订航班的框架可能采取如表2形式:
表2
针对Frame框架中的每个槽对应的各个参数的解释如下:
1)槽序号和名称,代表着Frame框架中对应槽的位置编号及标记名称
2)槽类型,主要包括起始槽、终结槽、终止槽。起始槽指的是Frame Parser解析开始遍历的槽位置,终结槽是指遍历需要结束的槽,而终止槽指的是整个框架遍历需要结束的槽。
3)优先级,代表着Frame槽遍历的顺序,优先级越高越优先发问,同一优先级的可以随便安排顺序,即Frame Parser在响应用户请求的时候按照优先级来逐步和用户交互来收集任务所需参数信息。
4)对应问句,指的是Frame Parser跳转到该槽需要对用户进行提示的问句信息。
5)异常提示,指的是Frame Parser没有获取到相关参数给予的提示信息,异常提示只对必填槽起作用,选填槽不需要,当抽取邮件等处理程序没有按照预期获得结果时候作为给用户的提示信息。异常类型分为三种:一种是重复,代表如果没有抽取到参数需要重复执行;第二种是结束,代表找不到处理失败要退出Frame Parser;第三种是缺省,代表如果找不到则取缺省值。
6)问答抽取,指的是Frame Parser对用户回答句子的处理逻辑。All代表所有输入作为整体获取到的参数,Mail代表抽取邮箱内容作为获取参数,还有一些类型比如City(火车或者飞机等地理位置相关),Time(时间类)等其他常见类型。
7)是否交互,指的当前槽的数据获得是否需要通过交互获得,主要解决有些槽的数据未在交互的时候通过上一次回答的数据得到,比如针对上述订票场景,询问出发城市的时候,用户可能说,北京到上海,间接的把下一个槽的到达城市说了,如果该槽是否交互设置为False,那么到达城市槽可以直接不进行交互完成抽取。
在具体每个场景的Frame采用XML(json)格式文件进行储存,除了整体的槽结构外,针对具体的每个场景,不同的场景含有不同的属性,场景的名称、场景的编号、场景的错误提示、场景的异常提示、场景的保持时间、主动退出模式等。
(2)Frame Parser场景基本属性设计:
针对每个场景,在Frame Parser定义文件里面定义如下四个参数:
1)每个场景需要定义参数,即会话过期时间,不同场景可能长度不同,比如比较长的会话可以设定长些,短的会话设定短些,以秒为单位比较灵活。
2)每个场景也需要定义一个主动退出模式,比如订机票的:放弃、不订了等等,不同的场景可能都不一样,所以需要写到场景的Frame Parser定义文件里面。
3)同时要定义一句主动退出情况下对应的输出,这是发现用户主动放弃会话的时候的响应语句,可能不同场景对应输出不同。
4)任务失败提示语,如果场景分析失败,比如抽取不到必填的内容,则给出任务失败提示语,与主动放弃提示语可以相同也可以不同。
(3)Frame Parser的场景状态映射表:
1)映射表1:每个框架对应的起始槽位编号,可以单独有个映射表,输入框架编号,返回其对应的起始框架编号;
2)映射表2:建立框架槽位之间转移关系,通过每个槽的具体位置,可以直接获取到下一个槽的具体位置。
3)映射表3:记载某个框架槽编号对应的所有槽信息,映射表结构,key可以是框架ID+槽编号,value结构存储Frame Parser中槽的每行信息,该行信息是一个槽类型结构。
4)映射表4:记载每个场景的状态抽取参数信息。状态参数抽取信息,用户记录相关场景中参数的抽取信息。状态参数抽取信息有对应的一个状态文件,采取json格式,这个状态文件在用户进入这个场景时候,由场景分发器将对应槽位为空值的json文件插入状态信息中。json文件应该包含Frame Parser对应的所有可选必选槽名称及其对应的值,比如上述的邮件例子对应json状态文件需要包含如下信息(并标明是必填还是选填):
FromCity=NULL
ToCity=NULL
Date=NULL
通常上述的1)至4)结构的场景交互状态映射表在具体实现的时候,采用Redis进行存储和实现,由于都是键值对信息,存取效率较高。
2.Frame Parser的工作流程
步骤1.初始数据的加载,加载各个功能的Frame框架数据,构建如上的四个映射表结构。
步骤2.响应服务请求,作为服务响应请求,输入为用户ID+用户所处的场景ID+用户问句,输出为智能会话的回答语句,假设用户已经分发到某个场景中,执行如下操作。
步骤2.1根据用户ID+场景ID作为Key,读取状态信息映射表中映射表3读取对应内容槽的数据结构,进行步骤2.2的处理逻辑。
步骤2.2执行下列操作:
步骤2.2.1根据槽属性中“问答抽取”项调用相应的抽取器从输入信息文本中抽取参数,此时有两种可能:抽取到了所需信息或者没有抽取到所需信息,如果抽取到了所需信息,则进行步骤2.2.2,否则进行步骤2.2.3。
步骤2.2.2.抽到了所需信息,这种情况下需要根据抽取到的参数进行相应转化为实际的数据比如用户name转为用户ID等类似操作,将具体参数记录到抽取的状态映射表4的json文件中,再根据场景ID和当前槽位查找下一个槽位编号从利用状态映射表2找到新槽位置,执行相关移动操作,并在状态映射表1中设置当前槽编号设置为新的槽编号,并从状态信息映射表3的提示信息返回给用户提示用户输入相应参数。
如果新槽的类型是“终止槽”,则退出循环,退出前将保存到状态信息表4的json文件中所有参数返回,同时清空用户当前所处的状态,并记录退出时标志退出原因T1。如果不是终止槽,记录当前槽属性的“对应问句”直接返回,并标志退出原因T2。
步骤2.2.3.没有抽取到所需信息,可能分以下两种情况:
(1)用户只是进入场景,没有提供参数,比如用户说:打电话,建立一个提醒;
(2)用户提供了数据但是没有抽取出来。
针对(1)这类情况主要发生在第一次进入时,只需要将起始槽属性的“对应问句”返回给用户,提示用户完成相应抽取,并标志退出原因T2。
针对(2)这类用户提供了数据但是没有抽取,此时需要结合当前槽是否是必填槽以及当前槽是否提供默认函数这四种情况进行考虑。
如果是必填槽,提供了默认函数,按照默认函数得到默认值,比如说查天气,用户没有给出查询时间,用户默认的是当天,设置相关抽取值,这种情况跳转到步骤2.2.2步执行相关操作。
如果是可选槽,无论是否提供默认函数,此时假设抽取值为空,执行类似步骤2.2.2步的操作,根据场景ID和当前槽位查找下一个槽位编号从利用状态映射表2找到新槽位置,执行相关移动操作,并在状态映射表1中设置当前槽编号设置为新的槽编号,并从状态信息映射表3的提示信息返回给用户提示用户输入相应参数。
如果是必填槽,用户没有提供默认函数,说明是用户输入出错(包括抽取器不能正常抽取这类数据的情况),那么累加用户的重试次数,判断重试的次数是否超过用户指定的次数,如果超过则退出整个场景,清空记录的状态信息,并标志退出的原因为T3,否则从当前槽的“异常提示”中取出对应问句再次进行询问用户,并标志退出原因T4。
步骤2.3退出操作后处理逻辑:
步骤2.3.1如果退出原因是T2,说明需要和用户交互来获取所需参数,此时首先将当前槽对应的“对应问句”提示返回给用户,等待用户新输入,程序退出Frame Parser模块。
步骤2.3.2如果退出原因是T1,说明场景收集参数阶段结束,将框架的抽取参数传给API应用管理部分或者直接传给后台智能秘书服务端,退出整个Frame Parser模块。
步骤2.3.3如果退出原因是T4,说明需要和用户交互来获取所需参数,此时首先将当前槽对应的“异常提示”提示返回给用户,等待用户新输入,程序退出Frame Parser模块。
步骤2.3.4如果退出原因是T3,说明场景收集参数阶段失败,将场景中的“异常信息”提示返回给用户,退出整个Frame Parser模块。
三.应用API相关管理
存在应用API管理的步骤是因为之前通过Frame Parser解析得到的参数,往往还不能直接作为调用相关API服务的参数,需要进行转化操作。比如以上述的订票服务为例,我们抽取到起始城市为北京和上海,而API的结构是fromCity=bj&toCity=sh,此时需要针对抽取出的参数进行字段名称和字段值进一步去做转化。
应用API管理的目的是灵活管理各个场景对应的外部服务API,自动根据与用户的交互收集到的参数构造API请求,然后将请求结果返回,并构造输出json内容。针对每个场景需要存储一个是API模板与输出模板文件。比如,打电话的API模板定义如下:
API改写逻辑:
1.根据场景名称找到对应的API模板以及读取抽取的参数信息。
2.根据API里面的槽名找到Redis对应json中同一槽名的值,对值执行Action动作,这里往往是一个值转换过程,比如“北京”需要转换为“bj”等。将转换后的值填入并替换掉对应的[槽名|Action。
3.Action可能为空,就是原值不动,Action对应的功能最好类似于Frame Parser的“回答抽取”一样,进行相应的转化操作。
改写完的API格式后,可以直接将API的模板数据交给智能秘书服务端,智能秘书服务端在根据解析返回的参数列表,并根据返回的类型执行相关操作。
本发明基于智能秘书的多轮人交互框架具备以下优点:
1.能够快速支持新的场景,针对新的场景不需要重新开发,只需要编写新的场景的Frame Parser文件都可以支持新的场景的操作。
2.支持场景的完整,可以加入相关条件槽操作,实现槽的跳转,理论上可以支持任意任务型操作,因为程序语言的角度看,当定义了顺序、条件、循环结构,任意程序都可以编写。
3.用户的比较体验好,加入预取操作可以同时接受用户多个的参数,较少了用户之间的交互操作。
4.会话框架的回答抽取支持不少语音上模糊操作,能对一些企业人名、请假类型等进行不同层度的纠错处理。
在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (22)
1.一种多轮人机交互的方法,其特征在于,包括:
获取用户的输入信息及所述用户的用户ID;
对所述输入信息进行场景分发,获取所述输入信息的场景;
根据所述输入信息、所述用户ID、所述输入信息的场景,通过多轮人机交互获取返回信息;
将所述返回信息发送至应用服务端,以供所述应用服务端执行所述返回信息;
根据所述输入信息、所述用户ID、所述输入信息的场景,通过多轮人机交互获取所述返回信息的步骤,具体包括:
根据所述用户ID及所述输入信息的场景,读取所述输入信息的场景的当前内容槽;
根据所述当前内容槽的问答抽取项,从所述输入信息中抽取消息参数;
抽取所述消息参数成功后,将所述消息参数转化为符合调用API服务的参数,以及将所述消息参数记录到json文件中,进入下一个内容槽;以及所述返回信息为异常提示,并获取下一个输入信息。
2.根据权利要求1所述的多轮人机交互的方法,其特征在于,对所述输入信息进行场景分发,获取所述输入信息的场景的步骤,具体包括:
在分发状态映射表中查找是否具有所述输入信息的场景记录;
当具有所述输入信息的场景记录时,将所述场景记录作为所述输入信息的场景。
3.根据权利要求2所述的多轮人机交互的方法,其特征在于,还包括:
当不具有所述输入信息的场景记录时,将场景模式库中的预存场景分发给所述输入信息;
当分发成功后,将所述预存场景作为所述输入信息的场景,同时将所述预存场景记录至所述分发状态映射表中。
4.根据权利要求3所述的多轮人机交互的方法,其特征在于,还包括:
当分发不成功时,根据所述输入信息的至少一个特征词,获取所述输入信息的场景;
获取所述输入信息的场景成功后,将所述输入信息的场景记录至所述分发状态映射表中;
获取所述输入信息的场景不成功时,返回空字符。
5.根据权利要求4所述的多轮人机交互的方法,其特征在于,根据所述输入信息的至少一个特征词,获取所述输入信息的场景,具体包括:
对所述输入信息的至少一个特征词的场景进行权重值累加,将累加后的所述权重值最高的场景作为所述输入信息的场景。
6.根据权利要求1所述的多轮人机交互的方法,其特征在于,还包括:
从所述输入信息中抽取所述消息参数未成功时,判断所述输入信息中是否存在所述消息参数;
当所述输入信息中不存在所述消息参数时,所述返回信息为所述当前内容槽的对应问句,并获取所述下一个输入信息;
当所述输入信息中存在所述消息参数时,判断所述当前内容槽是否为必填槽以及所述当前内容槽是否提供默认参数;
当所述当前内容槽不为所述必填槽时,设置抽取的所述消息参数为空,进入所述下一个内容槽;以及所述返回信息为所述异常提示,并获取所述下一个输入信息。
7.根据权利要求6所述的多轮人机交互的方法,其特征在于,还包括:
当所述当前内容槽为所述必填槽以及所述当前内容槽提供默认参数时,将所述默认参数作为所述消息参数;
将所述消息参数转化为符合调用API服务的参数,以及将所述消息参数记录到所述json文件中,同时进入所述下一个内容槽;
当所述当前内容槽为所述必填槽以及所述当前内容槽未提供默认参数时,累加对所述输入信息的获取次数;
判断所述获取次数是否超过预设次数;
当所述获取次数超过所述预设次数时,所述返回信息为失败提示。
8.根据权利要求7所述的多轮人机交互的方法,其特征在于,还包括:
当所述获取次数未超过所述预设次数时,所述返回信息为异常提示,并获取所述下一个输入信息。
9.根据权利要求6至8中任一项所述的多轮人机交互的方法,其特征在于,还包括:
当所述下一个内容槽为终止槽时,所述返回信息为根据所述消息参数调用所述API服务;
当所述下一个内容槽不为终止槽时,所述返回信息为所述当前内容槽的对应问句,获取所述下一个输入信息。
10.根据权利要求6至8中任一项所述的多轮人机交互的方法,其特征在于,当所述返回信息为根据所述消息参数调用所述API服务时,还包括:
根据所述输入信息的场景,获取所述API服务的API模板;
将所述符合调用API服务的参数替换所述API模板中的参数。
11.根据权利要求6至8中任一项所述的多轮人机交互的方法,其特征在于,所述内容槽的参数包括以下一种或其组合:槽编号、槽名称、是否为所述必填槽、槽类型、优先级、所述对应问句、所述问答抽取项、所述异常提示、异常类型、是否必须交互。
12.一种多轮人机交互的系统,其特征在于,包括:
获取单元,用于获取用户的输入信息及所述用户的用户ID;
场景分发单元,用于对所述输入信息进行场景分发,获取所述输入信息的场景;
信息交互单元,用于根据所述输入信息、所述用户ID、所述输入信息的场景,通过多轮人机交互获取返回信息;
发送单元,用于将所述返回信息发送至应用服务端,以供所述应用服务端执行所述返回信息;
所述信息交互单元,具体用于:
根据所述用户ID及所述输入信息的场景,读取所述输入信息的场景的当前内容槽;
根据所述当前内容槽的问答抽取项,从所述输入信息中抽取消息参数;
抽取所述消息参数成功后,将所述消息参数转化为符合调用API服务的参数,以及将所述消息参数记录到json文件中,进入下一个内容槽;以及所述返回信息为异常提示,并获取下一个输入信息。
13.根据权利要求12所述的多轮人机交互的系统,其特征在于,所述场景分发单元,具体用于:
在分发状态映射表中查找是否具有所述输入信息的场景记录;
当具有所述输入信息的场景记录时,将所述场景记录作为所述输入信息的场景。
14.根据权利要求13所述的多轮人机交互的系统,其特征在于,所述场景分发单元,还用于:
当不具有所述输入信息的场景记录时,将场景模式库中的预存场景分发给所述输入信息;
当分发成功后,将所述预存场景作为所述输入信息的场景,同时将所述预存场景记录至所述分发状态映射表中。
15.根据权利要求14所述的多轮人机交互的系统,其特征在于,所述场景分发单元,还用于:
当分发不成功时,根据所述输入信息的至少一个特征词,获取所述输入信息的场景;
获取所述输入信息的场景成功后,将所述输入信息的场景记录至所述分发状态映射表中;
获取所述输入信息的场景不成功时,返回空字符。
16.根据权利要求15所述的多轮人机交互的系统,其特征在于,所述场景分发单元,还用于:
对所述输入信息的至少一个特征词的场景进行权重值累加,将累加后的所述权重值最高的场景作为所述输入信息的场景。
17.根据权利要求12所述的多轮人机交互的系统,其特征在于,所述信息交互单元,还用于:
从所述输入信息中抽取所述消息参数未成功时,判断所述输入信息中是否存在所述消息参数;
当所述输入信息中不存在所述消息参数时,所述返回信息为所述当前内容槽的对应问句,并获取所述下一个输入信息;
当所述输入信息中存在所述消息参数时,判断所述当前内容槽是否为必填槽以及所述当前内容槽是否提供默认参数;
当所述当前内容槽不为所述必填槽时,设置抽取的所述消息参数为空,进入所述下一个内容槽;以及所述返回信息为所述异常提示,并获取所述下一个输入信息。
18.根据权利要求17所述的多轮人机交互的系统,其特征在于,所述信息交互单元,还用于:
当所述当前内容槽为所述必填槽以及所述当前内容槽提供默认参数时,将所述默认参数作为所述消息参数;
将所述消息参数转化为符合调用API服务的参数,以及将所述消息参数记录到所述json文件中,同时进入所述下一个内容槽;
当所述当前内容槽为所述必填槽以及所述当前内容槽未提供默认参数时,累加对所述输入信息的获取次数;
判断所述获取次数是否超过预设次数;
当所述获取次数超过所述预设次数时,所述返回信息为失败提示。
19.根据权利要求18所述的多轮人机交互的系统,其特征在于,所述信息交互单元,还用于:
当所述获取次数未超过所述预设次数时,所述返回信息为所述异常提示,并获取所述下一个输入信息。
20.根据权利要求17至19中任一项所述的多轮人机交互的系统,其特征在于,所述信息交互单元,还用于:
当所述下一个内容槽为终止槽时,所述返回信息为根据所述消息参数调用所述API服务;
当所述下一个内容槽不为终止槽时,所述返回信息为所述当前内容槽的对应问句,并获取所述下一个输入信息。
21.根据权利要求17至19中任一项所述的多轮人机交互的系统,其特征在于,当所述返回信息为根据所述消息参数调用所述API服务时,所述信息交互单元,还用于:
根据所述输入信息的场景,获取所述API服务的API模板;
将所述符合调用API服务的参数替换所述API模板中的参数。
22.根据权利要求17至19中任一项所述的多轮人机交互的系统,其特征在于,所述内容槽的参数包括以下一种或其组合:槽编号、槽名称、是否为所述必填槽、槽类型、优先级、所述对应问句、所述问答抽取项、所述异常提示、异常类型、是否必须交互。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710256102.3A CN107169034B (zh) | 2017-04-19 | 2017-04-19 | 一种多轮人机交互的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710256102.3A CN107169034B (zh) | 2017-04-19 | 2017-04-19 | 一种多轮人机交互的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107169034A CN107169034A (zh) | 2017-09-15 |
CN107169034B true CN107169034B (zh) | 2020-08-04 |
Family
ID=59812278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710256102.3A Active CN107169034B (zh) | 2017-04-19 | 2017-04-19 | 一种多轮人机交互的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107169034B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107831903B (zh) * | 2017-11-24 | 2021-02-02 | 科大讯飞股份有限公司 | 多人参与的人机交互方法及装置 |
CN110619870B (zh) * | 2018-06-04 | 2022-05-06 | 佛山市顺德区美的电热电器制造有限公司 | 一种人机对话方法、装置、家用电器和计算机存储介质 |
CN110659970A (zh) * | 2018-06-12 | 2020-01-07 | 百度在线网络技术(北京)有限公司 | 基于语音识别的账务信息处理方法、装置和电子设备 |
CN110737671A (zh) * | 2018-07-03 | 2020-01-31 | 百度在线网络技术(北京)有限公司 | 基于表格的检索方法和装置 |
CN109614468A (zh) * | 2018-11-30 | 2019-04-12 | 神思电子技术股份有限公司 | 一种自然语言对话系统知识数据调度方法 |
CN109815326B (zh) * | 2019-01-24 | 2021-09-10 | 网易(杭州)网络有限公司 | 对话控制方法及装置 |
CN109933654A (zh) * | 2019-01-30 | 2019-06-25 | 神思电子技术股份有限公司 | 一种基于状态树的对话管理方法 |
CN110727773B (zh) * | 2019-10-11 | 2022-02-01 | 沈阳民航东北凯亚有限公司 | 信息提供方法及装置 |
CN111105800B (zh) * | 2019-12-26 | 2022-07-15 | 百度在线网络技术(北京)有限公司 | 语音交互处理方法、装置、设备和介质 |
CN113488036A (zh) * | 2020-06-10 | 2021-10-08 | 海信集团有限公司 | 一种多轮语音交互方法、终端及服务器 |
CN112650550A (zh) * | 2020-12-28 | 2021-04-13 | 国电南瑞科技股份有限公司 | 一种基于电网调控领域的语音调阅图形画面方法及装置 |
CN116501592B (zh) * | 2023-06-19 | 2023-09-19 | 阿里巴巴(中国)有限公司 | 人机交互的数据处理方法及服务器 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104360897A (zh) * | 2014-10-29 | 2015-02-18 | 百度在线网络技术(北京)有限公司 | 对话处理方法和对话管理系统 |
CN104464733A (zh) * | 2014-10-28 | 2015-03-25 | 百度在线网络技术(北京)有限公司 | 一种语音对话的多场景管理方法及装置 |
CN105355201A (zh) * | 2015-11-27 | 2016-02-24 | 百度在线网络技术(北京)有限公司 | 基于场景的语音服务处理方法、装置和终端设备 |
CN106202417A (zh) * | 2016-07-12 | 2016-12-07 | 北京光年无限科技有限公司 | 一种用于智能机器人的人机交互方法及系统 |
CN106228983A (zh) * | 2016-08-23 | 2016-12-14 | 北京谛听机器人科技有限公司 | 一种人机自然语言交互中的场景处理方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9646001B2 (en) * | 2011-09-19 | 2017-05-09 | Nuance Communications, Inc. | Machine translation (MT) based spoken dialog systems customer/machine dialog |
-
2017
- 2017-04-19 CN CN201710256102.3A patent/CN107169034B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104464733A (zh) * | 2014-10-28 | 2015-03-25 | 百度在线网络技术(北京)有限公司 | 一种语音对话的多场景管理方法及装置 |
CN104360897A (zh) * | 2014-10-29 | 2015-02-18 | 百度在线网络技术(北京)有限公司 | 对话处理方法和对话管理系统 |
CN105355201A (zh) * | 2015-11-27 | 2016-02-24 | 百度在线网络技术(北京)有限公司 | 基于场景的语音服务处理方法、装置和终端设备 |
CN106202417A (zh) * | 2016-07-12 | 2016-12-07 | 北京光年无限科技有限公司 | 一种用于智能机器人的人机交互方法及系统 |
CN106228983A (zh) * | 2016-08-23 | 2016-12-14 | 北京谛听机器人科技有限公司 | 一种人机自然语言交互中的场景处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107169034A (zh) | 2017-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107169034B (zh) | 一种多轮人机交互的方法及系统 | |
CN102543082B (zh) | 使用自然语言的车载信息服务系统语音操作方法及系统 | |
US20060004570A1 (en) | Transcribing speech data with dialog context and/or recognition alternative information | |
CN102099803A (zh) | 用于自动回答自然语言问题的方法和计算机系统 | |
CN110942326A (zh) | 一种用户满意度预测方法及装置、服务器 | |
CN109743346B (zh) | 会话流程配置方法、装置及计算机可读存储介质 | |
CN112434501B (zh) | 工单智能生成的方法、装置、电子设备及介质 | |
CN110689325A (zh) | 信息处理方法、装置及计算机可读存储介质 | |
CN113806503A (zh) | 一种对话融合方法和装置及设备 | |
CN113468300B (zh) | 一种基于微信交互的智能消息处理系统及方法 | |
CN111259124A (zh) | 对话管理方法、装置、系统及存储介质 | |
CN113132214B (zh) | 一种对话方法、装置、服务器及存储介质 | |
CN103377403B (zh) | 企业业务组件建模方法和系统 | |
CN111898381A (zh) | 一种结合rpa与ai的文本信息提取方法、装置、设备及介质 | |
CN110428816A (zh) | 一种语音细胞库训练和分享的方法及装置 | |
CN110750626B (zh) | 一种基于场景的任务驱动的多轮对话方法及系统 | |
CN113111157A (zh) | 问答处理方法、装置、计算机设备和存储介质 | |
CN113012687A (zh) | 一种信息交互方法、装置及电子设备 | |
CN112735394B (zh) | 一种语音的语义解析方法及装置 | |
CN115935076A (zh) | 基于人工智能的旅游服务信息推送方法及系统 | |
CN115018624A (zh) | 基于风控策略的决策引擎及方法 | |
CN113468306A (zh) | 语音对话方法、装置、电子设备及存储介质 | |
CN114254088A (zh) | 自动应答模型的构建方法和自动应答方法 | |
CN114117024A (zh) | 一种多轮对话功能场景的平台构建方法 | |
CN114567703B (zh) | 政务呼叫中心优化方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |