CN109670088A - 语音问答交互方法、装置、计算机设备及存储介质 - Google Patents
语音问答交互方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN109670088A CN109670088A CN201811527574.9A CN201811527574A CN109670088A CN 109670088 A CN109670088 A CN 109670088A CN 201811527574 A CN201811527574 A CN 201811527574A CN 109670088 A CN109670088 A CN 109670088A
- Authority
- CN
- China
- Prior art keywords
- information
- preset
- text
- client
- voice messaging
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000004044 response Effects 0.000 title claims abstract description 43
- 238000012545 processing Methods 0.000 claims abstract description 26
- 230000011218 segmentation Effects 0.000 claims abstract description 19
- 230000002452 interceptive effect Effects 0.000 claims abstract description 14
- 238000013507 mapping Methods 0.000 claims description 45
- 201000010099 disease Diseases 0.000 claims description 20
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 12
- 238000010586 diagram Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 206010039083 rhinitis Diseases 0.000 description 5
- 230000003993 interaction Effects 0.000 description 4
- 206010041232 sneezing Diseases 0.000 description 4
- 206010011224 Cough Diseases 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 241000252794 Sphinx Species 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 206010037660 Pyrexia Diseases 0.000 description 1
- 208000036071 Rhinorrhea Diseases 0.000 description 1
- 206010039101 Rhinorrhoea Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/20—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Business, Economics & Management (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明实施例提供了一种语音问答交互方法、装置、计算机设备及存储介质。该方法应用于语音交互领域,该方法包括获取用户通过客户端输入的第一语音信息并对第一语音信息进行语音识别以生成第一文本信息,并对第一文本信息进行分词处理,以得出第一文本关键词。并将所述问题信息发送至客户端;获取用户根据问题信息而通过客户端输入的第二语音信息并对第二语音信息进行语音识别,以生成第二文本信息;根据第二文本信息以及问题信息生成问题标记;根据问题标记以及预设的问答数据库确定第二语音信息对应的答案信息并将答案信息反馈至客户端。实施本发明实施例,可实现快速向用户提供所需内容,操作简单,响应速度快。
Description
技术领域
本发明涉及计算机数据处理领域,尤其涉及一种语音问答交互方法、装置、计算机设备及计算机可读存储介质。
背景技术
随着互联网的不断发展,网络信息内容不断丰富,人们可以通过在互联网中搜索各类的信息,例如天气查询、疾病咨询、知识问答等等。通过互联网搜索并获取所需的内容虽然方便了人们获取信息,但是因为互联网的信息内容繁多且杂乱,人们无法快速地获取到真实有效的可靠信息。同时,对于一些分辨能力低、互联网搜索熟悉度差的用户,这种内容获取方式不仅操作繁琐、效率低,而且内容可靠性差。
发明内容
本发明实施例提供了一种语音问答交互方法、装置、计算机设备及存储介质,旨在解决内容获取过程中操作繁琐、效率低等问题。
第一方面,本发明实施例提供了一种语音问答交互方法,其包括:获取用户通过客户端输入的第一语音信息并对所述第一语音信息进行语音识别以生成第一文本信息,并对所述第一文本信息进行分词处理,以得出第一文本关键词。根据所述第一文本关键词以及预设的问答数据库确定所述第一语音信息对应的问题信息并将所述问题信息发送至所述客户端;获取用户根据所述问题信息而通过所述客户端输入的第二语音信息并对所述第二语音信息进行语音识别,以生成第二文本信息;根据所述第二文本信息以及所述问题信息生成问题标记;根据所述问题标记以及所述预设的问答数据库确定所述第二语音信息对应的答案信息并将所述答案信息发送至所述客户端。
第二方面,本发明实施例提供了一种语音问答交互装置,其包括:
第一获取单元,用于获取用户通过客户端输入的第一语音信息并对所述第一语音信息进行语音识别以生成第一文本信息,并对所述第一文本信息进行分词处理,以得出第一文本关键词。
第一确定单元,用于根据所述第一文本关键词以及预设的问答数据库确定所述第一语音信息对应的问题信息并将所述问题信息发送至所述客户端;
第二获取单元,用于获取用户根据所述问题信息而通过所述客户端输入的第二语音信息并对所述第二语音信息进行语音识别,以生成第二文本信息;
第一生成单元,用于根据所述第二文本信息以及所述问题信息生成问题标记;
第二确定单元,用于根据所述问题标记以及所述预设的问答数据库确定所述第二语音信息对应的答案信息并将所述答案信息发送至所述客户端。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现上述语音问答交互方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述语音问答交互方法。
本发明实施例提供一种语音问答交互方法、装置、计算机设备及计算机可读存储介质。该方法包括获取用户通过客户端输入的第一语音信息并对所述第一语音信息进行语音识别以生成第一文本信息,并对所述第一文本信息进行分词处理,以得出第一文本关键词。根据所述第一文本关键词以及预设的问答数据库确定所述第一语音信息对应的问题信息并将所述问题信息发送至所述客户端;获取用户根据所述问题信息而通过所述客户端输入的第二语音信息并对所述第二语音信息进行语音识别,以生成第二文本信息;根据所述第二文本信息以及所述问题信息生成问题标记;根据所述问题标记以及所述预设的问答数据库确定所述第二语音信息对应的答案信息并将所述答案信息发送至所述客户端。实施本发明实施例所提供的语音问答交互方法,通过语音交互的方式,实现快速向用户提供所需内容,操作简单,响应速度快。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种语音问答交互方法的流程示意图;
图2为本发明一实施例提供的一种语音问答交互方法的应用场景示意图;
图3为本发明一实施例提供的一种语音问答交互方法的流程示意图;
图4为本发明一实施例提供的一种语音问答交互方法的流程示意图;
图5为本发明一实施例提供的一种语音问答交互方法的流程示意图;
图6为本发明一实施例提供的一种语音问答交互方法的流程示意图;
图7为本发明一实施例提供的一种语音问答交互装置的示意性框图;
图8为本发明一实施例提供的一种语音问答交互装置的另一示意性框图;
图9为本发明一实施例提供的一种语音问答交互装置的另一示意性框图;
图10为本发明一实施例提供的一种语音问答交互装置的另一示意性框图;
图11为本发明一实施例提供的一种语音问答交互装置的另一示意性框图;
图12为本发明一实施例提供的一种计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或一个以上其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
请参照图1以及图2,其为本发明一实施例提供的一种语音问答交互方法的流程示意图以及应用场景示意图。该语音问答交互方法应用于服务器端20,服务器端20可以为可以是独立的服务器,也可以是多个服务器组成的服务器集群。该服务器端20可通过网络通讯与客户端10进行通讯连接,以实现数据交互。其中,客户端10可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等具有通信功能的电子设备。
其中,该语音问答交互方法包括但不限于步骤S110-S150。
S110,获取用户通过客户端输入的第一语音信息并对所述第一语音信息进行语音识别以生成第一文本信息,并对所述第一文本信息进行分词处理,以得出第一文本关键词。
具体地,获取第一语音信息可通过语音采集装置采集并通过网络通讯发送至服务器端。其中语音采集装置可以是各类具有麦克风的客户端,该客户端可以是在获取第一语音信息之前可根据实际的应用场景向客户端发送提示信息,以提示用于输入对应的语音信息,以提高语音问答交互的成功率。其中,该语音问答的应用场景包括但不限于情感咨询、疾病咨询、天气咨询等。例如,假设该语音问答交互方法的应用场景是智能问诊,在获取第一语音信息之前,向客户端发送的提示信息可以是“请问你哪里不舒服?”。
其中,对所述第一语音信息进行语音识别可通过在服务器端调用语音识别工具实现,该语音识别工具包括但不限于基于HMM和N-gram模型的语音识别工具:CMU Sphinx,Kaldi,HTK,Julius和ISIP。
对所述第一文本信息进行分词处理可通过调用jieba等工具实现。假设所述第一文本信息为“我的喉咙不舒服”。通过对该第一文本信息进行分词处理可得到一个或者多个的第一文本关键词。例如“我的喉咙不舒服”经过分词处理后,所得到的第一文本关键词包括“我的”、“喉咙”、“不舒服”。
S120,根据所述第一文本关键词以及预设的问答数据库确定所述第一语音信息对应的问题信息并将所述问题信息发送至所述客户端。
具体地,为提高语音问答交互所得出的答案信息的准确度,根据所述第一文本关键词以及预设的问答数据库确定所述第一语音信息对应的问题信息并将所述问题信息发送至所述客户端,并将所述问题信息发送至客户端以获取与该问题信息对应的第二语音信息。
其中,预设的问答数据库用于存储各种类型的问题信息、答案信息以及映射于答案信息的映射条件。根据问题信息对应的第二语音信息可生成问题标记,进而根据问题标记确定映射条件,进而确定答案信息。
在一些实施例中,如图3所示,步骤S120包括但不限于步骤S121-S122。
S121,判断所述第一文本关键词与预设的类别关键词是否匹配。
具体地,判断所述第一文本关键词与预设的类别关键词是否匹配包括:判断所述第一文本关键词是否与预设的类型关键词相同或者相似,若所述第一文本关键词与预设的类型关键词相同或者相似,确定所述第一文本关键词与预设的类别关键词匹配。
通过字符比对可判断所述第一文本关键词是否与预设的类型关键词是否相同,通过字符比对以及相似关键词组合可可判断所述第一文本关键词是否与预设的类型关键词是相似。其中,该关键词组合用于存储相似的关键词,例如相似关键词组合例如为“头-脑袋-脑壳”。若第一文本关键词与预设的类型关键词位于同一个相似关键词组合,即确定该第一文本关键词与预设的类型关键词相似。
S122,若所述第一文本关键词与预设的类别关键词匹配,获取与所述类别关键词对应的问题类型,并将所述问题类型对应的问题信息确定为与所述第一语音信息对应的问题信息。
具体地,请参照表1,预设的类别关键词与问题类型之间为一对一或者多对一的映射关系,即一个或者多个关键词可映射于同一个问题类型。问题类型与问题信息之间为一对一或者一对多的映射关系,即同一个问题类型可映射于一个或者多个问题信息,如第一问题信息、第二问题信息等等。
表1
例如,第一文本关键词为“鼻子”,与该第一文本关键词匹配的类别关键词为“鼻子”,与该类别关键词对应的问题类型包括“感冒类型”、“五官类型”,不同问题类型对应着一个或者多个的问题信息,如“是否有发热”、“是否有流鼻涕”等。通过类别关键词可获取与所述类别关键词对应的问题类型,进而将所述问题类型对应的问题信息确定为与所述第一语音信息对应的问题信息。
若所述第一文本关键词与预设的类别关键词不匹配,表明该第一语音信息无法识别,进而发送错误提醒信息至客户端,以提醒客户重新输入第一语音信息。
实施本发明实施例,通过根据第一语音对应的第一文本关键词确定类别关键词,进而根据类别关键词确定与类别关键词对应的问题类型,并将所述问题类型对应的问题信息确定为与所述第一语音信息对应的问题信息。可快速定位第一语音信息对应的问题信息,可提高语音问答的处理速度,降低问题信息检索的处理压力。
S130,获取用户根据所述问题信息而通过所述客户端输入的第二语音信息并对所述第二语音信息进行语音识别,以生成第二文本信息。
具体地,通过将所述问题信息发送至客户端,并采集用户输入的语音信息,以实现获取与所述问题信息对应的第二语音信息。
其中,对所述第二语音信息进行语音识别可通过在服务器端调用语音识别工具实现,该语音识别工具包括但不限于基于HMM和N-gram模型的语音识别工具:CMU Sphinx,Kaldi,HTK,Julius和ISIP。
S140,根据所述第二文本信息以及所述问题信息生成问题标记。
在一些实施例中,如图4所示,步骤S140包括但不限于步骤S141-S143。
S141,对所述第二文本信息进行分词处理以得出第二文本关键词,并判断所述第二文本关键词中是否存在预设的正向关键词以及判断所述第二文本关键词中是否存在预设的反向关键词。
具体地,对所述第二文本信息进行分词处理可通过调用jieba等工具实现。具体地,预设的正向关键词可以为“是”、“有”等,预设的反向关键词可以为“不是”、“没有”等。通过字符比对可实现判断所述第二文本关键词中是否存在预设的正向关键词以及判断所述第二文本关键词中是否存在预设的反向关键词。
S142,若所述第二文本关键词中存在预设的正向关键词,根据所述问题信息生成正向问题标记。
S143,若所述第二文本关键词中存在预设的反向关键词,根据所述问题信息生成反向问题标记。
具体地,根据每个问题信息以及该问题信息对应的第二文本关键词可生成唯一的问题标记,问题标记包括正向问题标记以及反向问题标记。假设问题信息为“是否有咳嗽”,该问题对应的第二文本关键词中包括“有”、“咳嗽”等。通过字符比对可确定第二文本关键词中存在预设的正向关键词“有”,进而根据问题信息生成正向问题标记,该正向问题标记为“有咳嗽”。
若所述第二文本关键词中不存在预设的正向关键词且所述第二文本关键词中不存在预设的反向关键词,表明该第二语音信息无法识别,进而发送错误提醒信息至客户端,以提醒客户重新输入第二语音信息。
S150,根据所述问题标记以及所述预设的问答数据库确定所述第二语音信息对应的答案信息并将所述答案信息发送至所述客户端。
在一些实施例中,如图5所示,步骤S150包括但不限于步骤S151-S152。
S151,在预设的问答数据库中获取与所述问题标记相匹配的映射条件。
具体地,假设文本关键词为“鼻子”,与该文本关键词匹配的类别关键词为“鼻子”,与该类别关键词对应的问题类型包括“感冒类型”、“五官类型”。通过将“感冒类型”、“五官类型”中的问题信息发送至客户端,以获取第二语音信息。根据第二语音信息以及问题信息生成的问题标记为“有打喷嚏”、“没有鼻塞”、“没有发热”。
若问题标记与映射条件相同或者相似,则确定问题标记与映射条件相匹配。通过将这三个问题标记在所述预设的问题数据库中进行字符比对可实现获取与其相匹配的映射条件。
S152,根据所述映射条件以及预设的答案映射关系确定所述第二语音信息对应的答案信息。
具体地,预设的问答数据库用于存储各种类型的问题信息、答案信息以及映射于答案信息的映射条件。根据问题信息对应的第二文本关键词可生成问题标记,进而根据问题标记确定映射条件,以确定答案信息,进而确定答案信息。
请参照表2,预设的答案映射关系用于存储映射条件与答案信息之间的映射关系。映射条件与答案信息之间的映射关系可以为一对一、或者多对一的映射关系。不同的答案映射对应于不同的映射条件,答案信息所对应的映射条件的数量可以一个或者多个。如表2所示,三个映射条件“有打喷嚏”、“没有鼻塞”、“没有发热”所对应的答案信息为“鼻炎”。若问题标记为“有打喷嚏”、“没有鼻塞”、“没有发热”,根据该问题标记获取到的映射条件对应的答案信息为“鼻炎”。在确定所述答案信息之后,将该答案信息发送至客户端。
第一映射条件 | 第二映射条件 | 第三映射条件 | 答案信息 |
有打喷嚏 | 没有鼻塞 | 没有发热 | 鼻炎 |
表2
在一些实施例中,如图6所示,步骤S150之后还可包括步骤S160-S180。
S160,获取所述客户端的当前位置信息,并根据所述当前位置信息确定距离所述当前位置信息最近的医院信息。
具体地,该医院信息可通过预先设置,以限制医院的等级或者类型,例如可以预先设置医院信息为三甲医院或者公立医院等等。
S170,根据所述疾病信息以及预设的科室映射关系确定与所述疾病信息相匹配的科室信息。
具体地,预设的科室映射关系用于存储疾病信息与科室信息之间的映射关系。若疾病信息为确定值,则可通过所确定的疾病信息以及该预设的科室映射关系确定与所述疾病信息相匹配的科室信息。例如预设的科室映射关系包括:鼻炎映射于五官科,若疾病信息为鼻炎,通过预设的科室映射关系,可确定科室信息为五官科。
S180,将所述医院信息以及所述科室信息发送至所述客户端。
其中,将所述医院信息以及所述科室信息发送至所述客户端可通过短信、邮件、微信信息等形式实现。
实施本发明实施例,可实现根据疾病信息确定距离最近的医院信息以及与疾病信息相匹配的科室信息,通过将所述医院信息以及所述科室信息发送至客户端有利于减少用户获取信息的操作次数,实现智能化的语音交互。
图7是本发明实施例提供的一种语音问答交互装置100的示意性框图。如图7所示,对应于以上语音问答交互方法,本发明还提供一种语音问答交互装置100。该语音问答交互装置100包括用于执行上述语音问答交互方法的单元,该装置可以被配置于服务器端中,服务器端可以是独立的服务器,也可以是多个服务器组成的服务器集群。
具体地,请参阅图7,该语音问答交互装置100包括第一获取单元110、第一确定单元120、第二获取单元130、第一生成单元140以及第二确定单元150。
第一获取单元110,用于获取用户通过客户端输入的第一语音信息并对所述第一语音信息进行语音识别以生成第一文本信息,并对所述第一文本信息进行分词处理,以得出第一文本关键词。
第一确定单元120,用于根据所述第一文本关键词以及预设的问答数据库确定所述第一语音信息对应的问题信息并将所述问题信息发送至所述客户端。
在一些实施例中,如图8所示,所述第一确定单元120包括第一判断单元121以及第三确定单元122。
第一判断单元121,用于判断所述第一文本关键词与预设的类别关键词是否匹配。
第三确定单元122,用于若所述第一文本关键词与预设的类别关键词匹配,获取与所述类别关键词对应的问题类型,并将所述问题类型对应的问题信息确定为与所述第一语音信息对应的问题信息。
第二获取单元130,用于获取用户根据所述问题信息而通过所述客户端输入的第二语音信息并对所述第二语音信息进行语音识别,以生成第二文本信息。
第一生成单元140,用于根据所述第二文本信息以及所述问题信息生成问题标记。
在一些实施例中,如图9所示,所述第一生成单元140包括第二判断单元141、第二生成单元142以及第三生成单元143。
第二判断单元141,用于对所述第二文本信息进行分词处理以得出第二文本关键词,并判断所述第二文本关键词中是否存在预设的正向关键词以及判断所述第二文本关键词中是否存在预设的反向关键词。
第二生成单元142,用于若所述第二文本关键词中存在预设的正向关键词,根据所述问题信息生成正向问题标记。
第三生成单元143,用于若所述第二文本关键词中存在预设的反向关键词,根据所述问题信息生成反向问题标记。
第二确定单元150,用于根据所述问题标记以及所述预设的问答数据库确定所述第二语音信息对应的答案信息并将所述答案信息发送至所述客户端。
在一些实施例中,如图10所示,所述第二确定单元150包括第三获取单元151以及第四确定单元152。
第三获取单元151,用于在预设的问答数据库中获取与所述问题标记相匹配的映射条件。
第四确定单元152,用于根据所述映射条件以及预设的答案映射关系确定所述第二语音信息对应的答案信息。
在一些实施例中,如图11所示,所述装置还包括第四获取单元160、第五确定单元170以及发送单元180。
第四获取单元160,用于获取所述客户端的当前位置信息,并根据所述当前位置信息确定距离所述当前位置信息最近的医院信息。
第五确定单元170,用于根据所述疾病信息以及预设的科室映射关系确定与所述疾病信息相匹配的科室信息。
发送单元180,用于将所述医院信息以及所述科室信息发送至所述客户端。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述语音问答交互装置100和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
上述装置100可以实现为一种计算机程序的形式,计算机程序可以在如图12所示的计算机设备上运行。
请参阅图12,图12是本发明实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是客户端。该客户端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等具有通信功能的电子设备。
该计算机设备500包括通过系统总线510连接的处理器520、存储器和网络接口550,其中,存储器可以包括非易失性存储介质530和内存储器540。
该非易失性存储介质530可存储操作系统531和计算机程序532。该计算机程序532被执行时,可使得处理器520执行一种语音问答交互方法。
该处理器520用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器540为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器520执行时,可使得处理器520执行一种语音问答交互方法。
该网络接口550用于与其它设备进行网络通信。本领域技术人员可以理解,该计算机设备的示意性框图仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器520用于运行存储在存储器中的程序代码,以实现如下功能:获取用户通过客户端输入的第一语音信息并对所述第一语音信息进行语音识别以生成第一文本信息,并对所述第一文本信息进行分词处理,以得出第一文本关键词。根据所述第一文本关键词以及预设的问答数据库确定所述第一语音信息对应的问题信息并将所述问题信息发送至所述客户端;获取用户根据所述问题信息而通过所述客户端输入的第二语音信息并对所述第二语音信息进行语音识别,以生成第二文本信息;根据所述第二文本信息以及所述问题信息生成问题标记;根据所述问题标记以及所述预设的问答数据库确定所述第二语音信息对应的答案信息并将所述答案信息发送至所述客户端。
在一实施例中,处理器520在执行所述根据所述第一文本关键词以及预设的问答数据库确定所述第一语音信息对应的问题信息并将所述问题信息发送至所述客户端的步骤时,具体执行如下步骤:判断所述第一文本关键词与预设的类别关键词是否匹配;若所述第一文本关键词与预设的类别关键词匹配,获取与所述类别关键词对应的问题类型,并将所述问题类型对应的问题信息确定为与所述第一语音信息对应的问题信息。
在一实施例中,处理器520在执行所述根据所述第二文本信息以及所述问题信息生成问题标记的步骤时,具体执行如下步骤:对所述第二文本信息进行分词处理以得出第二文本关键词,并判断所述第二文本关键词中是否存在预设的正向关键词以及判断所述第二文本关键词中是否存在预设的反向关键词;若所述第二文本关键词中存在预设的正向关键词,根据所述问题信息生成正向问题标记;若所述第二文本关键词中存在预设的反向关键词,根据所述问题信息生成反向问题标记。
在一实施例中,处理器520在执行所述根据所述问题标记以及所述预设的问答数据库确定所述第二语音信息对应的答案信息并将所述答案信息发送至所述客户端的步骤时,具体执行如下步骤:在预设的问答数据库中获取与所述问题标记相匹配的映射条件;根据所述映射条件以及预设的答案映射关系确定所述第二语音信息对应的答案信息。
在一实施例中,处理器520在执行所述根据所述问题标记以及所述预设的问答数据库确定所述第二语音信息对应的答案信息并将所述答案信息发送至所述客户端的步骤之后,具体执行如下步骤:获取所述客户端的当前位置信息,并根据所述当前位置信息确定距离所述当前位置信息最近的医院信息;根据所述疾病信息以及预设的科室映射关系确定与所述疾病信息相匹配的科室信息;将所述医院信息以及所述科室信息发送至所述客户端。
应当理解,在本发明实施例中,处理器520可以是中央处理单元(CentralProcessing Unit,CPU),该处理器520还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域技术人员可以理解,该计算机设备500的示意性框图并不构成对计算机设备500的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
在本发明的另一实施例中提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,其中计算机程序包括程序指令。所述程序指令被处理器执行时实现如下步骤:获取用户通过客户端输入的第一语音信息并对所述第一语音信息进行语音识别以生成第一文本信息,并对所述第一文本信息进行分词处理,以得出第一文本关键词。根据所述第一文本关键词以及预设的问答数据库确定所述第一语音信息对应的问题信息并将所述问题信息发送至所述客户端;获取用户根据所述问题信息而通过所述客户端输入的第二语音信息并对所述第二语音信息进行语音识别,以生成第二文本信息;根据所述第二文本信息以及所述问题信息生成问题标记;根据所述问题标记以及所述预设的问答数据库确定所述第二语音信息对应的答案信息并将所述答案信息发送至所述客户端。
在一实施例中,所述程序指令被处理器执行以实现所述根据所述第一文本关键词以及预设的问答数据库确定所述第一语音信息对应的问题信息并将所述问题信息发送至所述客户端的步骤时,具体实现如下步骤:判断所述第一文本关键词与预设的类别关键词是否匹配;若所述第一文本关键词与预设的类别关键词匹配,获取与所述类别关键词对应的问题类型,并将所述问题类型对应的问题信息确定为与所述第一语音信息对应的问题信息。
在一实施例中,所述程序指令被处理器执行以实现所述根据所述第二文本信息以及所述问题信息生成问题标记的步骤时,具体实现如下步骤:对所述第二文本信息进行分词处理以得出第二文本关键词,并判断所述第二文本关键词中是否存在预设的正向关键词以及判断所述第二文本关键词中是否存在预设的反向关键词;若所述第二文本关键词中存在预设的正向关键词,根据所述问题信息生成正向问题标记;若所述第二文本关键词中存在预设的反向关键词,根据所述问题信息生成反向问题标记。
在一实施例中,所述程序指令被处理器执行以实现所述根据所述问题标记以及所述预设的问答数据库确定所述第二语音信息对应的答案信息并将所述答案信息发送至所述客户端的步骤时,具体实现如下步骤:在预设的问答数据库中获取与所述问题标记相匹配的映射条件;根据所述映射条件以及预设的答案映射关系确定所述第二语音信息对应的答案信息。
在一实施例中,所述程序指令被处理器执行以实现所述根据所述问题标记以及所述预设的问答数据库确定所述第二语音信息对应的答案信息并将所述答案信息发送至所述客户端的步骤之后,具体实现如下步骤:获取所述客户端的当前位置信息,并根据所述当前位置信息确定距离所述当前位置信息最近的医院信息;根据所述疾病信息以及预设的科室映射关系确定与所述疾病信息相匹配的科室信息;将所述医院信息以及所述科室信息发送至所述客户端。
该计算机可读存储介质可以是U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如一个以上单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,客户端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种语音问答交互方法,其特征在于,所述方法包括:
获取用户通过客户端输入的第一语音信息并对所述第一语音信息进行语音识别以生成第一文本信息,并对所述第一文本信息进行分词处理,以得出第一文本关键词;
根据所述第一文本关键词以及预设的问答数据库确定所述第一语音信息对应的问题信息并将所述问题信息发送至所述客户端;
获取用户根据所述问题信息而通过所述客户端输入的第二语音信息并对所述第二语音信息进行语音识别,以生成第二文本信息;
根据所述第二文本信息以及所述问题信息生成问题标记;
根据所述问题标记以及所述预设的问答数据库确定所述第二语音信息对应的答案信息并将所述答案信息发送至所述客户端。
2.如权利要求1所述的方法,其特征在于,所述根据所述第一文本关键词以及预设的问答数据库确定所述第一语音信息对应的问题信息并将所述问题信息发送至所述客户端,包括:
判断所述第一文本关键词与预设的类别关键词是否匹配;
若所述第一文本关键词与预设的类别关键词匹配,获取与所述类别关键词对应的问题类型,并将所述问题类型对应的问题信息确定为与所述第一语音信息对应的问题信息。
3.如权利要求1所述的方法,其特征在于,所述根据所述第二文本信息以及所述问题信息生成问题标记,包括:
对所述第二文本信息进行分词处理以得出第二文本关键词,并判断所述第二文本关键词中是否存在预设的正向关键词以及判断所述第二文本关键词中是否存在预设的反向关键词;
若所述第二文本关键词中存在预设的正向关键词,根据所述问题信息生成正向问题标记;
若所述第二文本关键词中存在预设的反向关键词,根据所述问题信息生成反向问题标记。
4.如权利要求1所述的方法,其特征在于,所述根据所述问题标记以及所述预设的问答数据库确定所述第二语音信息对应的答案信息并将所述答案信息发送至所述客户端,包括:
在预设的问答数据库中获取与所述问题标记相匹配的映射条件;
根据所述映射条件以及预设的答案映射关系确定所述第二语音信息对应的答案信息。
5.如权利要求1所述的方法,其特征在于,所述答案信息为疾病信息,所述根据所述问题标记以及所述预设的问答数据库确定所述第二语音信息对应的答案信息并将所述答案信息发送至所述客户端之后,还包括:
获取所述客户端的当前位置信息,并根据所述当前位置信息确定距离所述当前位置信息最近的医院信息;
根据所述疾病信息以及预设的科室映射关系确定与所述疾病信息相匹配的科室信息;
将所述医院信息以及所述科室信息发送至所述客户端。
6.一种语音问答交互装置,其特征在于,所述装置包括:
第一获取单元,用于获取用户通过客户端输入的第一语音信息并对所述第一语音信息进行语音识别以生成第一文本信息,并对所述第一文本信息进行分词处理,以得出第一文本关键词;
第一确定单元,用于根据所述第一文本关键词以及预设的问答数据库确定所述第一语音信息对应的问题信息并将所述问题信息发送至所述客户端;
第二获取单元,用于获取用户根据所述问题信息而通过所述客户端输入的第二语音信息并对所述第二语音信息进行语音识别,以生成第二文本信息;
第一生成单元,用于根据所述第二文本信息以及所述问题信息生成问题标记;
第二确定单元,用于根据所述问题标记以及所述预设的问答数据库确定所述第二语音信息对应的答案信息并将所述答案信息发送至所述客户端。
7.如权利要求6所述的装置,其特征在于,所述第一确定单元包括:
第一判断单元,用于判断所述第一文本关键词与预设的类别关键词是否匹配;
第三确定单元,用于若所述第一文本关键词与预设的类别关键词匹配,获取与所述类别关键词对应的问题类型,并将所述问题类型对应的问题信息确定为与所述第一语音信息对应的问题信息。
8.如权利要求6所述的装置,其特征在于,所述第一生成单元包括:
第二判断单元,用于对所述第二文本信息进行分词处理以得出第二文本关键词,并判断所述第二文本关键词中是否存在预设的正向关键词以及判断所述第二文本关键词中是否存在预设的反向关键词;
第二生成单元,用于若所述第二文本关键词中存在预设的正向关键词,根据所述问题信息生成正向问题标记;
第三生成单元,用于若所述第二文本关键词中存在预设的反向关键词,根据所述问题信息生成反向问题标记。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5中任一项的语音问答交互方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1-5任一项所述的语音问答交互方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811527574.9A CN109670088A (zh) | 2018-12-13 | 2018-12-13 | 语音问答交互方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811527574.9A CN109670088A (zh) | 2018-12-13 | 2018-12-13 | 语音问答交互方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109670088A true CN109670088A (zh) | 2019-04-23 |
Family
ID=66143790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811527574.9A Pending CN109670088A (zh) | 2018-12-13 | 2018-12-13 | 语音问答交互方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109670088A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110265153A (zh) * | 2019-05-16 | 2019-09-20 | 平安科技(深圳)有限公司 | 慢性病随访方法及电子装置 |
CN110265154A (zh) * | 2019-06-10 | 2019-09-20 | 重庆橡树信息科技有限公司 | 一种基于互联网的120协同救护系统及实现方法 |
CN110308947A (zh) * | 2019-05-24 | 2019-10-08 | 深圳壹账通智能科技有限公司 | 问答信息的处理方法、系统、计算机设备和存储介质 |
CN110457440A (zh) * | 2019-08-09 | 2019-11-15 | 宝宝树(北京)信息技术有限公司 | 一种反馈答案的方法、装置、设备和介质 |
CN110931017A (zh) * | 2019-11-26 | 2020-03-27 | 国网冀北清洁能源汽车服务(北京)有限公司 | 一种充电桩用充电交互方法及充电桩用充电交互装置 |
CN111930904A (zh) * | 2020-07-08 | 2020-11-13 | 联想(北京)有限公司 | 信息应答方法、装置、设备及存储介质 |
CN116884648A (zh) * | 2023-05-23 | 2023-10-13 | 深圳汇医必达医疗科技有限公司 | 基于中医问诊的语音交互优化方法、装置、设备及介质 |
CN117542498A (zh) * | 2024-01-08 | 2024-02-09 | 安徽医科大学第一附属医院 | 一种基于大数据分析的妇科护理管理系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103124980A (zh) * | 2010-09-24 | 2013-05-29 | 国际商业机器公司 | 包括从多个文档段收集答案的提供问题答案 |
CN103164616A (zh) * | 2013-02-02 | 2013-06-19 | 杭州卓健信息科技有限公司 | 一种智能导诊系统和方法 |
CN103312782A (zh) * | 2013-05-15 | 2013-09-18 | 晁彦公 | 一种远程智能急救系统及其方法 |
CN105094641A (zh) * | 2015-07-15 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 语音问答交互方法和装置 |
CN108962363A (zh) * | 2017-05-17 | 2018-12-07 | 武汉默联股份有限公司 | 医疗服务方法、装置以及医用终端 |
-
2018
- 2018-12-13 CN CN201811527574.9A patent/CN109670088A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103124980A (zh) * | 2010-09-24 | 2013-05-29 | 国际商业机器公司 | 包括从多个文档段收集答案的提供问题答案 |
CN103164616A (zh) * | 2013-02-02 | 2013-06-19 | 杭州卓健信息科技有限公司 | 一种智能导诊系统和方法 |
CN103312782A (zh) * | 2013-05-15 | 2013-09-18 | 晁彦公 | 一种远程智能急救系统及其方法 |
CN105094641A (zh) * | 2015-07-15 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 语音问答交互方法和装置 |
CN108962363A (zh) * | 2017-05-17 | 2018-12-07 | 武汉默联股份有限公司 | 医疗服务方法、装置以及医用终端 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110265153A (zh) * | 2019-05-16 | 2019-09-20 | 平安科技(深圳)有限公司 | 慢性病随访方法及电子装置 |
CN110308947A (zh) * | 2019-05-24 | 2019-10-08 | 深圳壹账通智能科技有限公司 | 问答信息的处理方法、系统、计算机设备和存储介质 |
CN110265154A (zh) * | 2019-06-10 | 2019-09-20 | 重庆橡树信息科技有限公司 | 一种基于互联网的120协同救护系统及实现方法 |
CN110457440A (zh) * | 2019-08-09 | 2019-11-15 | 宝宝树(北京)信息技术有限公司 | 一种反馈答案的方法、装置、设备和介质 |
CN110931017A (zh) * | 2019-11-26 | 2020-03-27 | 国网冀北清洁能源汽车服务(北京)有限公司 | 一种充电桩用充电交互方法及充电桩用充电交互装置 |
CN111930904A (zh) * | 2020-07-08 | 2020-11-13 | 联想(北京)有限公司 | 信息应答方法、装置、设备及存储介质 |
CN116884648A (zh) * | 2023-05-23 | 2023-10-13 | 深圳汇医必达医疗科技有限公司 | 基于中医问诊的语音交互优化方法、装置、设备及介质 |
CN117542498A (zh) * | 2024-01-08 | 2024-02-09 | 安徽医科大学第一附属医院 | 一种基于大数据分析的妇科护理管理系统及方法 |
CN117542498B (zh) * | 2024-01-08 | 2024-04-16 | 安徽医科大学第一附属医院 | 一种基于大数据分析的妇科护理管理系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109670088A (zh) | 语音问答交互方法、装置、计算机设备及存储介质 | |
CN110121707B (zh) | 确定语义不同的响应以提供作为包括在电子通信中的建议 | |
WO2021135910A1 (zh) | 基于机器阅读理解的信息抽取方法、及其相关设备 | |
US20210319051A1 (en) | Conversation oriented machine-user interaction | |
CN112262430A (zh) | 自动确定经由自动助理界面接收到的口头话语的语音识别的语言 | |
CN110493019B (zh) | 会议纪要的自动生成方法、装置、设备及存储介质 | |
CN107315766A (zh) | 一种集合智能与人工问答的语音问答方法及其装置 | |
US20190018694A1 (en) | Virtual laboratory assistant platform | |
CN107230475A (zh) | 一种语音关键词识别方法、装置、终端及服务器 | |
US11321675B2 (en) | Cognitive scribe and meeting moderator assistant | |
CN110245557A (zh) | 图片处理方法、装置、计算机设备及存储介质 | |
WO2020151690A1 (zh) | 语句生成方法、装置、设备及存储介质 | |
CN108763548A (zh) | 收集训练数据的方法、装置、设备和计算机可读存储介质 | |
CN113468894B (zh) | 对话交互方法及装置、电子设备和计算机可读存储介质 | |
WO2021063089A1 (zh) | 规则匹配方法、规则匹配装置、存储介质及电子设备 | |
CN109658931B (zh) | 语音交互方法、装置、计算机设备及存储介质 | |
CN111611290A (zh) | 地址快速定位方法、装置、计算机设备及存储介质 | |
US12073187B2 (en) | Automatic evaluation of natural language text generated based on structured data | |
CN108306813A (zh) | 会话消息的处理方法、服务器及客户端 | |
CN112367494A (zh) | 基于ai的在线会议通讯方法、装置及计算机设备 | |
Meng et al. | Linguistic steganography detection based on perplexity | |
WO2023050669A1 (zh) | 基于神经网络的信息推送方法、系统、设备及介质 | |
Sohail et al. | Text classification in an under-resourced language via lexical normalization and feature pooling | |
US11475069B2 (en) | Corpus processing method, apparatus and storage medium | |
CN110837843B (zh) | 信息分类方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |