CN103413549A - 语音交互的方法、系统以及交互终端 - Google Patents

语音交互的方法、系统以及交互终端 Download PDF

Info

Publication number
CN103413549A
CN103413549A CN2013103303514A CN201310330351A CN103413549A CN 103413549 A CN103413549 A CN 103413549A CN 2013103303514 A CN2013103303514 A CN 2013103303514A CN 201310330351 A CN201310330351 A CN 201310330351A CN 103413549 A CN103413549 A CN 103413549A
Authority
CN
China
Prior art keywords
character string
key message
message word
current
operational scenarios
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013103303514A
Other languages
English (en)
Other versions
CN103413549B (zh
Inventor
付春元
雷倍一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Skyworth RGB Electronics Co Ltd
Original Assignee
Shenzhen Skyworth RGB Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Skyworth RGB Electronics Co Ltd filed Critical Shenzhen Skyworth RGB Electronics Co Ltd
Priority to CN201310330351.4A priority Critical patent/CN103413549B/zh
Publication of CN103413549A publication Critical patent/CN103413549A/zh
Priority to PCT/CN2014/072487 priority patent/WO2015014122A1/zh
Application granted granted Critical
Publication of CN103413549B publication Critical patent/CN103413549B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种语音交互的方法,包括:将用户输入的当前语音信息发送至语音识别服务器,接收语音识别服务器根据该当前语音信息转换得到的字符串;根据从与用户对话过程中的上下文中提取出来并保存的当前对话场景的关键信息词,判断字符串是否符合当前对话场景;若是,则根据预置的匹配规则和关键信息词,匹配字符串;将匹配后的字符串发送至语义解析服务器,接收到语义解析服务器根据字符串所返回的操作指令后,执行该操作指令,向用户做出回答。本发明还公开了相应的系统和一种交互终端。采用本发明所公开的方案,提升了人机对话的体验感,并且为用户提供了人性化的服务,实现了人性化的人机交互。

Description

语音交互的方法、系统以及交互终端
技术领域
本发明涉及到电子产品技术领域,特别涉及到一种语音交互的方法、系统以及交互终端。
背景技术
语音交互是与机器进行语言交流,让机器明白你说的是什么,并给出相应的答案,当输入语音信号时,机器先通过识别和理解过程把语音信号转变为相应的文本或命令,然后归为不同的类别,最后根据不同的类别信息分析出对应的答案。目前,该技术已经进入工业、家电、通信、汽车电子、消费电子产品等各个领域。但是,现有的语音交互主要是停留在一问一答的形式上,用户问什么,智能终端就回答什么,略显呆板;在很多情况下智能终端不能理解用户输入语句的意思,或者不能理解用户输入的缺少关键信息的语句或者省略句的意思;并且,由于智能终端不能根据上下文语义环境分析当前用户输入的语句的意思,因而不能根据当前对话环境给用户必要的提示和引导。这样,就会导致人机对话的体验感较差,使交互欠缺人性化。
发明内容
本发明的主要目的为提供一种语音交互的方法、系统以及交互终端,旨在提升人机对话的体验感,并且为用户提供人性化的服务,实现人性化的交互。
本发明提供一种语音交互的方法,包括步骤:
将用户输入的当前语音信息发送至语音识别服务器,接收语音识别服务器根据该当前语音信息转换得到的字符串;
根据保存的当前对话场景的关键信息词,判断所述字符串是否符合所述当前对话场景;若是,则根据预置的匹配规则和所述关键信息词,匹配所述字符串;
将匹配后的所述字符串发送至语义解析服务器,接收到语义解析服务器根据所述字符串所返回的操作指令后,执行该操作指令,向用户做出回答。
优选地,在所述将用户输入的当前语音信息发送至语音识别服务器,接收语音识别服务器根据该当前语音信息转换得到的字符串的步骤之前,还包括:
解析用户输入的语音信息,提取该语音信息中的关键信息词,将该关键信息词保存至对应的对话场景中。
优选地,所述根据预置的匹配规则匹配所述字符串与所述关键信息词的步骤包括:
计算所述字符串与所述关键信息词的相似度;
根据计算出的相似度以及预置的匹配规则,判断所述字符串与所述关键信息词是否完全匹配;
若所述字符串与所述关键信息词部分匹配,则根据所述关键信息词以及该字符串缺失的信息,补全该字符串。
优选地,所述字符串与所述关键信息词的相似度通过以下方法计算:
假设上一次语音信息为A,当前语音信息为B,A包含的关键信息词为A1、A2、A3、…、An,B包含的关键信息词为B1、B2、B3、…、Bm,则A和B的相似度S(A,B)为:
S ( A , B ) = ( Σ i - 1 m a i m + Σ i - 1 n a i n ) / 2 ;
其中:
ai=max(s(Ai,B1),s(Ai,B2)......s(Ai,Bm))
bi=max(s(A1,Bi),s(A2,Bi)......s(An,Bi))。
优选地,在所述判断字符串是否符合所述当前对话场景的步骤之后,还包括:
若所述字符串不符合所述当前对话场景,比对该字符串与其他对话场景对应的关键信息词,确定所述字符串所符合的对话场景,并将当前对话场景修改为该对话场景。
本发明还提供一种交互终端,包括:
发送及接收模块,用于将用户输入的当前语音信息发送至语音识别服务器,接收语音识别服务器根据该当前语音信息转换得到的字符串;
判断模块,用于根据保存的当前对话场景的关键信息词,判断所述字符串是否符合所述当前对话场景;
匹配模块,用于根据预置的匹配规则和所述关键信息词,匹配所述字符串;
操作模块,用于将匹配后的所述字符串发送至语义解析服务器,接收到语义解析服务器根据所述字符串所返回的操作指令后,执行该操作指令,向用户做出回答。
优选地,交互终端还包括:
解析及保存模块,用于解析用户输入的语音信息,提取该语音信息中的关键信息词,将该关键信息词保存至对应的对话场景中。
优选地,所述匹配模块包括:
计算单元,用于计算所述字符串与所述关键信息词的相似度;
判断单元,用于根据计算出的相似度以及预置的匹配规则,判断所述字符串与所述关键信息词是否完全匹配;
补全单元,用于根据所述关键信息词以及该字符串缺失的信息,补全该字符串。
优选地,交互终端还包括:
比对模块,用于比对所述字符串与其他对话场景对应的关键信息词;
确定及修改模块,用于确定所述字符串所符合的对话场景,并将当前对话场景修改为该对话场景。
本发明进一步提供一种语音交互的系统,包括交互终端、语音识别服务器和语义解析服务器,其中:
所述交互终端包括:
发送及接收模块,用于将用户输入的当前语音信息发送至语音识别服务器,接收语音识别服务器根据该当前语音信息转换得到的字符串;
判断模块,用于根据保存的当前对话场景的关键信息词,判断所述字符串是否符合所述当前对话场景;
匹配模块,用于根据预置的匹配规则和所述关键信息词,匹配所述字符串;
操作模块,用于将匹配后的所述字符串发送至语义解析服务器,接收到语义解析服务器根据所述字符串所返回的操作指令后,执行该操作指令,向用户做出回答;
所述语音识别服务器,用于接收所述交互终端发送的用户输入的当前语音信息,将该当前语音信息转换为对应的字符串;
所述语义解析服务器,用于接收所述交互终端发送的匹配后的字符串,解析所述字符串对应的语义,并生成相应的操作指令。
本发明通过接收到用户输入的当前语音信息后,将其发送至语音识别服务器,并在接收到语音识别服务器根据该当前语音信息转换得到的字符串后,根据保存的当前对话场景的关键信息词,判断字符串是否符合当前对话场景;若是,根据预置的匹配规则和关键信息词,匹配字符串;然后将匹配后的字符串发送至语义解析服务器,在接收到语义解析服务器根据字符串所返回的操作指令后,执行该操作指令,向用户做出回答,从而提升了人机对话的体验感,并且为用户提供了人性化的服务,实现了人性化的人机交互。
附图说明
图1为本发明语音交互的方法第一实施例的流程示意图;
图2为本发明语音交互的方法中匹配字符串与关键信息词的流程示意图;
图3为本发明语音交互的方法第二实施例的流程示意图;
图4为本发明语音交互的方法第三实施例的流程示意图;
图5为本发明交互终端第一实施例的结构示意图;
图6为本发明交互终端的匹配模块的结构示意图;
图7为本发明交互终端第二实施例的结构示意图;
图8为本发明交互终端第三实施例的结构示意图;
图9为本发明语音交互的系统第一实施例的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种语音交互的方法。在接收到用户输入的当前语音信息后,根据上下文语义的关联性,判断当前语音信息是否符合当前对话场景,并在符合时执行相应的操作指令以及向用户回答。
参照图1,图1为本发明语音交互的方法第一实施例的流程示意图。
本实施例所提供的语音交互的方法,包括:
步骤S10,将用户输入的当前语音信息发送至语音识别服务器,接收语音识别服务器根据该当前语音信息转换得到的字符串;
在用户与交互终端进行语音交互的过程中,接收到用户通过语音输入设备所输入的当前语音信息后,将该当前语音信息发送至语音识别服务器,语音识别服务器对该当前语音信息进行识别,并将音频文件转换为对应的以文字信息表示的字符串,将该字符串返回至交互终端。
步骤S20,根据保存的当前对话场景的关键信息词,判断字符串是否符合当前对话场景;若是,则执行步骤S21;
步骤S21,根据预置的匹配规则和关键信息词,匹配字符串;
接收到语音识别服务器返回的字符串后,根据交互终端中所保存的当前对话场景的关键信息词,判断该字符串是否符合当前对话场景。本实施例中,可以包括多种对话场景,例如:聊天场景、天气场景、地图场景、电影音乐场景、股票场景、菜谱场景、笑话场景、周公解梦场景、日期查询场景、翻译场景和网页浏览场景等可以通过和交互终端对话得到回答的对话场景;在每一种对话场景下进行语音交互时,交互终端都会保存用户对话过程中的关键信息词,并将其与相应的对话场景进行对应。
当判断出字符串符合当前对话场景,即字符串所对应的当前语音信息为当前对话场景下的内容时,根据预置的匹配规则以及当前对话场景对应的关键信息词,匹配字符串。本实施例中,预置的匹配规则为预先设定的用于对字符串进行处理的规则,以完善字符串的信息;匹配规则可以包括分词处理、相似度计算、匹配方式和补全信息等步骤。
请一并参照图2,图2为本发明语音交互的方法中匹配字符串与关键信息词的流程示意图。
在本实施例中,步骤S21具体包括:
步骤S211,计算字符串与关键信息词的相似度;
在判断出字符串符合当前对话场景时,根据所保存的当前对话场景下的上一次语音信息,计算当前语音信息和上一次语音信息的相似度,可以根据以下公式计算:
假设上一次语音信息为A,当前语音信息为B,A包含的关键信息词为A1、A2、A3、…、An,B包含的关键信息词为B1、B2、B3、…、Bm,则A和B的相似度为:
S ( A , B ) = ( Σ i - 1 m a i m + Σ i - 1 n a i n ) / 2
其中:
ai=max(s(Ai,B1),s(Ai,B2)......s(Ai,Bm))
bi=max(s(A1,Bi),s(A2,Bi)......s(An,Bi))
在相似度计算时,充分考虑了句子的每个词的深层含义。
步骤S212,根据计算出的相似度以及预置的匹配规则,判断字符串与关键信息词是否完全匹配;
本实施例中,预置的匹配规则中的匹配方法包括精确匹配、中心匹配和广泛匹配;其中,精确匹配是指当前语音信息和上一次语音信息的关键信息词完全相同,中心匹配是指当前语音信息中包含上一次语音信息的关键信息词即可,而广泛匹配是指当前语音信息中包含上一次语音信息的关键信息词或包括与该关键信息词相关的词。在计算出当前语音信息和上一次语音信息的相似度后,根据匹配方法,判断字符串与关键信息词是否完全匹配,即是否符合精确匹配的条件。如符合,则说明根据该字符串即可得到完整的语义。
步骤S213,若字符串与关键信息词部分匹配,则根据关键信息词以及该字符串缺失的信息,补全该字符串。
如字符串不符合精确匹配的条件,即字符串与关键信息词部分匹配,则根据关键信息词判断字符串的关键词中所缺失的信息,补全该字符串,使其与当前对话场景下的关键信息词完全匹配。
步骤S30,将匹配后的字符串发送至语义解析服务器,接收到语义解析服务器根据字符串所返回的操作指令后,执行该操作指令,向用户做出回答。
在根据预置的匹配规则和关键信息词匹配字符串,使其与当前对话场景下的关键信息词完全匹配后,将匹配后的包括完整关键信息词的字符串发送至语义解析服务器,供语义解析服务器解析该字符串的完整语义,语义解析服务器解析出字符串的完整语义后,根据该字符串的语义生成进行相关操作的操作指令,并发送至交互终端。交互终端在接收到语义解析服务器根据字符串所返回的操作指令后,执行该操作指令,并向用户做出相应的回答。
本实施例通过接收到用户输入的当前语音信息后,将其发送至语音识别服务器,并在接收到语音识别服务器根据该当前语音信息转换得到的字符串后,根据保存的当前对话场景的关键信息词,判断字符串是否符合当前对话场景;若是,根据预置的匹配规则和关键信息词,匹配字符串;然后将匹配后的字符串发送至语义解析服务器,在接收到语义解析服务器根据字符串所返回的操作指令后,执行该操作指令,向用户做出回答,从而提升了人机对话的体验感,并且为用户提供了人性化的服务,实现了人性化的人机交互。
参照图3,图3为本发明语音交互的方法第二实施例的流程示意图。
在本发明语音交互的方法第一实施例的基础上,在执行步骤S10之前,该方法还包括:
步骤S40,解析用户输入的语音信息,提取该语音信息中的关键信息词,将该关键信息词保存至对应的对话场景中。
本实施例中,在相应的对话场景下,接收到用户输入的语音信息,解析该语音信息,并提取出其中的关键信息词,保存至该对话场景下,对每次接收到的语音信息都进行该处理,在之后所接收到当前语音信息时,通过所保存的上一次语音信息的关键信息词,即可以判断出当前语音信息是否符合当前对话场景。例如,在聊天场景中,如用户输入“小李是我的朋友”,交互终端就会通过分词处理得到关键信息“小李/nr”、“我/r”、“朋友/n”,对话场景会记录为“聊天场景”;当用户再输入“谁是我的朋友”时,交互终端就会根据聊天场景解析该语音信息,并采用预置的匹配规则匹配已经记录的关键信息后给出答案“小李”。
在相应的对话场景下,接收到用户输入的语音信息,解析该语音信息,并提取出其中的关键信息词,保存至该对话场景下,在之后所接收到当前语音信息时,通过所保存的上一次语音信息的关键信息词,即可以判断出当前语音信息是否符合当前对话场景,从而为更加智能地识别用户输入的语音信息提供了基础。
参照图4,图4为本发明语音交互的方法第三实施例的流程示意图。
在本发明语音交互的方法第一实施例和第二实施例的基础上,在执行步骤S20之后,该方法还包括:
步骤S50,若字符串不符合当前对话场景,比对该字符串与其他对话场景对应的关键信息词,确定字符串所符合的对话场景,并将当前对话场景修改为该对话场景。
在根据交互终端中所保存的当前对话场景的关键信息词,判断出该字符串不符合当前对话场景时,比对该字符串与交互终端中所保存的其他对话场景对应的关键信息词,并根据比对结果确定字符串所符合的对话场景,即当字符串与某一个对话场景的关键信息词相匹配时,则确定该字符串符合该对话场景,同时,将当前对话场景修改为字符串所符合的对话场景。
在判断出字符串不符合当前对话场景时,比对该字符串与交互终端中所保存的其他对话场景对应的关键信息词,确定该字符串符合的对话场景,并将当前对话场景修改为所确定的对话场景,进一步提升了人机对话的体验感,并进一步保证了能够为用户提供人性化的服务。
本发明还提供一种交互终端。
参照图5,图5为本发明交互终端第一实施例的结构示意图。
本实施例所提供的交互终端,包括:
发送及接收模块101,用于将用户输入的当前语音信息发送至语音识别服务器,接收语音识别服务器根据该当前语音信息转换得到的字符串;
判断模块102,用于根据保存的当前对话场景的关键信息词,判断字符串是否符合当前对话场景;
匹配模块103,用于根据预置的匹配规则和关键信息词,匹配字符串;
操作模块104,用于将匹配后的字符串发送至语义解析服务器,接收到语义解析服务器根据字符串所返回的操作指令后,执行该操作指令,向用户做出回答。
在用户与交互终端进行语音交互的过程中,接收到用户通过语音输入设备所输入的当前语音信息后,发送及接收模块101将该当前语音信息发送至语音识别服务器,语音识别服务器对该当前语音信息进行识别,并将音频文件转换为对应的以文字信息表示的字符串,将该字符串返回至交互终端。
发送及接收模块101接收到语音识别服务器返回的字符串后,判断模块102根据交互终端中所保存的当前对话场景的关键信息词,判断该字符串是否符合当前对话场景。本实施例中,可以包括多种对话场景,例如:聊天场景、天气场景、地图场景、电影音乐场景、股票场景、菜谱场景、笑话场景、周公解梦场景、日期查询场景、翻译场景和网页浏览场景等可以通过和交互终端对话得到回答的对话场景;在每一种对话场景下进行语音交互时,交互终端都会保存用户对话过程中的关键信息词,并将其与相应的对话场景进行对应。
当判断出字符串符合当前对话场景,即字符串所对应的当前语音信息为当前对话场景下的内容时,匹配模块103根据预置的匹配规则以及当前对话场景对应的关键信息词,匹配字符串。本实施例中,预置的匹配规则为预先设定的用于对字符串进行处理的规则,以完善字符串的信息;匹配规则可以包括分词处理、相似度计算、匹配方式和补全信息等步骤。
请一并参照图6,图6为本发明交互终端的匹配模块的结构示意图。
在本实施例中,匹配模块103包括:
计算单元1031,用于计算字符串与关键信息词的相似度;
判断单元1032,用于根据计算出的相似度以及预置的匹配规则,判断字符串与关键信息词是否完全匹配;
补全单元1033,用于根据关键信息词以及该字符串缺失的信息,补全该字符串。
在判断出字符串符合当前对话场景时,根据所保存的当前对话场景下的上一次语音信息,通过计算单元1031计算当前语音信息和上一次语音信息的相似度,可以根据以下公式计算:
假设上一次语音信息为A,当前语音信息为B,A包含的关键信息词为A1、A2、A3、…、An,B包含的关键信息词为B1、B2、B3、…、Bm,这两个句子的相似度为:
S ( A , B ) = ( Σ i - 1 m a i m + Σ i - 1 n a i n ) / 2
其中:
ai=max(s(Ai,B1),s(Ai,B2)......s(Ai,Bm))
bi=max(s(A1,Bi),s(A2,Bi)......s(An,Bi))
在相似度计算时,充分考虑了句子的每个词的深层含义。
本实施例中,预置的匹配规则中的匹配方法包括精确匹配、中心匹配和广泛匹配;其中,精确匹配是指当前语音信息和上一次语音信息的关键信息词完全相同,中心匹配是指当前语音信息中包含上一次语音信息的关键信息词即可,而广泛匹配是指当前语音信息中包含上一次语音信息的关键信息词或包括与该关键信息词相关的词。在计算出当前语音信息和上一次语音信息的相似度后,判断单元1032根据匹配方法,判断字符串与关键信息词是否完全匹配,即是否符合精确匹配的条件。如符合,则说明根据该字符串即可得到完整的语义。
如字符串不符合精确匹配的条件,即字符串与关键信息词部分匹配,则通过补全单元1033,根据关键信息词判断字符串的关键词中所缺失的信息,补全该字符串,使其与当前对话场景下的关键信息词完全匹配。
在根据预置的匹配规则和关键信息词匹配字符串,使其与当前对话场景下的关键信息词完全匹配后,将匹配后的包括完整关键信息词的字符串发送至语义解析服务器,供语义解析服务器解析该字符串的完整语义,语义解析服务器解析出字符串的完整语义后,根据该字符串的语义生成进行相关操作的操作指令,并发送至交互终端。交互终端在接收到语义解析服务器根据字符串所返回的操作指令后,通过操作模块104执行该操作指令,并向用户做出相应的回答。
本实施例通过接收到用户输入的当前语音信息后,将其发送至语音识别服务器,并在接收到语音识别服务器根据该当前语音信息转换得到的字符串后,根据保存的当前对话场景的关键信息词,判断字符串是否符合当前对话场景;若是,根据预置的匹配规则和关键信息词,匹配字符串;然后将匹配后的字符串发送至语义解析服务器,在接收到语义解析服务器根据字符串所返回的操作指令后,执行该操作指令,向用户做出回答,从而提升了人机对话的体验感,并且为用户提供了人性化的服务,实现了人性化的人机交互。
参照图7,图7为本发明交互终端第二实施例的结构示意图。
在本发明交互终端第一实施例的基础上,该交互终端还包括:
解析及保存模块105,用于解析用户输入的语音信息,提取该语音信息中的关键信息词,将该关键信息词保存至对应的对话场景中。
本实施例中,在相应的对话场景下,接收到用户输入的语音信息,解析及保存模块105解析该语音信息,并提取出其中的关键信息词,保存至该对话场景下,对每次接收到的语音信息都进行该处理,在之后所接收到当前语音信息时,通过所保存的上一次语音信息的关键信息词,即可以判断出当前语音信息是否符合当前对话场景。例如,在聊天场景中,如用户输入“小李是我的朋友”,交互终端就会通过分词处理得到关键信息“小李/nr”、“我/r”、“朋友/n”,对话场景会记录为“聊天场景”;当用户再输入“谁是我的朋友”时,交互终端就会根据聊天场景解析该语音信息,并采用预置的匹配规则匹配已经记录的关键信息后给出答案“小李”。
在相应的对话场景下,接收到用户输入的语音信息,解析该语音信息,并提取出其中的关键信息词,保存至该对话场景下,在之后所接收到当前语音信息时,通过所保存的上一次语音信息的关键信息词,即可以判断出当前语音信息是否符合当前对话场景,从而为更加智能地识别用户输入的语音信息提供了基础。
参照图8,图8为本发明交互终端第三实施例的结构示意图。
在本发明交互终端第一实施例和第二实施例的基础上,该交互终端还包括:
比对模块106,用于比对字符串与其他对话场景对应的关键信息词;
确定及修改模块107,用于确定字符串所符合的对话场景,并将当前对话场景修改为该对话场景。
在根据交互终端中所保存的当前对话场景的关键信息词,判断出该字符串不符合当前对话场景时,通过比对模块106比对该字符串与交互终端中所保存的其他对话场景对应的关键信息词,确定及修改模块107根据比对结果确定字符串所符合的对话场景,即当字符串与某一个对话场景的关键信息词相匹配时,则确定该字符串符合该对话场景,同时,确定及修改模块107将当前对话场景修改为字符串所符合的对话场景。
在判断出字符串不符合当前对话场景时,比对该字符串与交互终端中所保存的其他对话场景对应的关键信息词,确定该字符串符合的对话场景,并将当前对话场景修改为所确定的对话场景,进一步提升了人机对话的体验感,并进一步保证了能够为用户提供人性化的服务。
本发明进一步还提供一种语音交互的系统。
参照图9,图9为本发明语音交互的系统第一实施例的结构示意图。
本实施例所提供的语音交互的系统,包括交互终端100、语音识别服务器200和语义解析服务器300,其中:
交互终端100包括:
发送及接收模块101,用于将用户输入的当前语音信息发送至语音识别服务器,接收语音识别服务器根据该当前语音信息转换得到的字符串;
判断模块102,用于根据保存的当前对话场景的关键信息词,判断字符串是否符合当前对话场景;
匹配模块103,用于根据预置的匹配规则和关键信息词,匹配字符串;
操作模块104,用于将匹配后的字符串发送至语义解析服务器,接收到语义解析服务器根据字符串所返回的操作指令后,执行该操作指令,向用户做出回答;
语音识别服务器200,用于接收交互终端100发送的用户输入的当前语音信息,将该当前语音信息转换为对应的字符串;
语义解析服务器300,用于接收交互终端发送的匹配后的字符串,解析字符串对应的语义,并生成相应的操作指令。
本语音交互的系统包括了上述交互终端全部实施例的全部技术方案,所达到的技术效果也完全相同,在此不做赘述。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围。

Claims (10)

1.一种语音交互的方法,其特征在于,包括步骤:
将用户输入的当前语音信息发送至语音识别服务器,接收语音识别服务器根据该当前语音信息转换得到的字符串;
根据保存的当前对话场景的关键信息词,判断所述字符串是否符合所述当前对话场景;若是,则根据预置的匹配规则和所述关键信息词,匹配所述字符串;
将匹配后的所述字符串发送至语义解析服务器,接收到语义解析服务器根据所述字符串所返回的操作指令后,执行该操作指令,向用户做出回答。
2.根据权利要求1所述的语音交互的方法,其特征在于,在所述将用户输入的当前语音信息发送至语音识别服务器,接收语音识别服务器根据该当前语音信息转换得到的字符串的步骤之前,还包括:
解析用户输入的语音信息,提取该语音信息中的关键信息词,将该关键信息词保存至对应的对话场景中。
3.根据权利要求2所述的语音交互的方法,其特征在于,所述根据预置的匹配规则匹配所述字符串与所述关键信息词的步骤包括:
计算所述字符串与所述关键信息词的相似度;
根据计算出的相似度以及预置的匹配规则,判断所述字符串与所述关键信息词是否完全匹配;
若所述字符串与所述关键信息词部分匹配,则根据所述关键信息词以及该字符串缺失的信息,补全该字符串。
4.根据权利要求3所述的语音交互的方法,其特征在于,所述字符串与所述关键信息词的相似度通过以下方法计算:
假设上一次语音信息为A,当前语音信息为B,A包含的关键信息词为A1、A2、A3、…、An,B包含的关键信息词为B1、B2、B3、…、Bm,则A和B的相似度S(A,B)为:
S ( A , B ) = ( Σ i - 1 m a i m + Σ i - 1 n a i n ) / 2 ;
其中:
ai=max(s(Ai,B1),s(Ai,B2)......s(Ai,Bm))
bi=max(s(A1,Bi),s(A2,Bi)......s(An,Bi))。
5.根据权利要求1至4中任一项所述的语音交互的方法,其特征在于,在所述判断字符串是否符合所述当前对话场景的步骤之后,还包括:
若所述字符串不符合所述当前对话场景,比对该字符串与其他对话场景对应的关键信息词,确定所述字符串所符合的对话场景,并将当前对话场景修改为该对话场景。
6.一种交互终端,其特征在于,包括:
发送及接收模块,用于将用户输入的当前语音信息发送至语音识别服务器,接收语音识别服务器根据该当前语音信息转换得到的字符串;
判断模块,用于根据保存的当前对话场景的关键信息词,判断所述字符串是否符合所述当前对话场景;
匹配模块,用于根据预置的匹配规则和所述关键信息词,匹配所述字符串;
操作模块,用于将匹配后的所述字符串发送至语义解析服务器,接收到语义解析服务器根据所述字符串所返回的操作指令后,执行该操作指令,向用户做出回答。
7.根据权利要求6所述的交互终端,其特征在于,还包括:
解析及保存模块,用于解析用户输入的语音信息,提取该语音信息中的关键信息词,将该关键信息词保存至对应的对话场景中。
8.根据权利要求7所述的交互终端,其特征在于,所述匹配模块包括:
计算单元,用于计算所述字符串与所述关键信息词的相似度;
判断单元,用于根据计算出的相似度以及预置的匹配规则,判断所述字符串与所述关键信息词是否完全匹配;
补全单元,用于根据所述关键信息词以及该字符串缺失的信息,补全该字符串。
9.根据权利要求6至8中任一项所述的交互终端,其特征在于,还包括:
比对模块,用于比对所述字符串与其他对话场景对应的关键信息词;
确定及修改模块,用于确定所述字符串所符合的对话场景,并将当前对话场景修改为该对话场景。
10.一种语音交互的系统,包括如权利要求6至9中任一项所述的交互终端、语音识别服务器和语义解析服务器,其特征在于,其中:
所述交互终端包括:
发送及接收模块,用于将用户输入的当前语音信息发送至语音识别服务器,接收语音识别服务器根据该当前语音信息转换得到的字符串;
判断模块,用于根据保存的当前对话场景的关键信息词,判断所述字符串是否符合所述当前对话场景;
匹配模块,用于根据预置的匹配规则匹配所述字符串与所述关键信息词;
操作模块,用于将匹配后的所述字符串发送至语义解析服务器,接收到语义解析服务器根据所述字符串所返回的操作指令后,执行该操作指令,向用户做出回答;
所述语音识别服务器,用于接收所述交互终端发送的用户输入的当前语音信息,将该当前语音信息转换为对应的字符串;
所述语义解析服务器,用于接收所述交互终端发送的匹配后的字符串,解析所述字符串对应的语义,并生成相应的操作指令。
CN201310330351.4A 2013-07-31 2013-07-31 语音交互的方法、系统以及交互终端 Active CN103413549B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201310330351.4A CN103413549B (zh) 2013-07-31 2013-07-31 语音交互的方法、系统以及交互终端
PCT/CN2014/072487 WO2015014122A1 (zh) 2013-07-31 2014-02-25 语音交互的方法、系统以及交互终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310330351.4A CN103413549B (zh) 2013-07-31 2013-07-31 语音交互的方法、系统以及交互终端

Publications (2)

Publication Number Publication Date
CN103413549A true CN103413549A (zh) 2013-11-27
CN103413549B CN103413549B (zh) 2016-07-06

Family

ID=49606552

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310330351.4A Active CN103413549B (zh) 2013-07-31 2013-07-31 语音交互的方法、系统以及交互终端

Country Status (2)

Country Link
CN (1) CN103413549B (zh)
WO (1) WO2015014122A1 (zh)

Cited By (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268195A (zh) * 2014-09-19 2015-01-07 三星电子(中国)研发中心 终端中的本地资源的处理方法和装置
WO2015014122A1 (zh) * 2013-07-31 2015-02-05 深圳创维-Rgb电子有限公司 语音交互的方法、系统以及交互终端
CN104464733A (zh) * 2014-10-28 2015-03-25 百度在线网络技术(北京)有限公司 一种语音对话的多场景管理方法及装置
CN104574246A (zh) * 2014-12-22 2015-04-29 百度在线网络技术(北京)有限公司 医疗智能分诊方法、装置及设备
CN104966513A (zh) * 2014-06-09 2015-10-07 腾讯科技(深圳)有限公司 语言命令处理方法和装置
CN105206266A (zh) * 2015-09-01 2015-12-30 重庆长安汽车股份有限公司 基于用户意图猜测的车载语音控制系统及方法
CN105373527A (zh) * 2014-08-27 2016-03-02 中兴通讯股份有限公司 一种省略恢复方法及问答系统
CN105590626A (zh) * 2015-12-29 2016-05-18 百度在线网络技术(北京)有限公司 持续语音人机交互方法和系统
CN105679310A (zh) * 2015-11-17 2016-06-15 乐视致新电子科技(天津)有限公司 一种用于语音识别方法及系统
WO2016127550A1 (zh) * 2015-02-13 2016-08-18 百度在线网络技术(北京)有限公司 人机语音交互方法和装置
CN105912692A (zh) * 2016-04-22 2016-08-31 华讯方舟科技有限公司 一种智能语音对话的方法和装置
CN106023993A (zh) * 2016-07-29 2016-10-12 西安旭天电子科技有限公司 基于自然语言的机器人控制系统及控制方法
CN106228983A (zh) * 2016-08-23 2016-12-14 北京谛听机器人科技有限公司 一种人机自然语言交互中的场景处理方法及系统
CN106233377A (zh) * 2014-04-25 2016-12-14 夏普株式会社 信息处理装置和控制程序
CN107146622A (zh) * 2017-06-16 2017-09-08 合肥美的智能科技有限公司 冰箱、语音交互系统、方法、计算机设备、可读存储介质
CN107274889A (zh) * 2017-06-19 2017-10-20 北京紫博光彦信息技术有限公司 一种根据语音生成业务单据的方法及装置
CN107292109A (zh) * 2017-06-27 2017-10-24 美的集团股份有限公司 饮食规划方法和装置
CN107644641A (zh) * 2017-07-28 2018-01-30 深圳前海微众银行股份有限公司 对话场景识别方法、终端以及计算机可读存储介质
CN107644639A (zh) * 2016-07-21 2018-01-30 北京快乐智慧科技有限责任公司 一种语音交互的方法和系统
CN108491517A (zh) * 2018-03-22 2018-09-04 青岛农业大学 一种地域性农业信息服务语音查询终端
CN108597537A (zh) * 2018-04-06 2018-09-28 东莞市华睿电子科技有限公司 一种音频信号相似度检测方法
CN108595423A (zh) * 2018-04-16 2018-09-28 苏州英特雷真智能科技有限公司 一种基于属性区间变化的动态本体结构的语义分析方法
CN108717853A (zh) * 2018-05-09 2018-10-30 深圳艾比仿生机器人科技有限公司 一种人机语音交互方法、装置及存储介质
CN109063090A (zh) * 2018-07-26 2018-12-21 挖财网络技术有限公司 自动化运维管理系统
CN109359211A (zh) * 2018-11-13 2019-02-19 平安科技(深圳)有限公司 语音交互的数据更新方法、装置、计算机设备和存储介质
CN109660678A (zh) * 2018-12-07 2019-04-19 深圳前海微众银行股份有限公司 电核系统实现方法、系统及可读存储介质
CN109949816A (zh) * 2019-02-14 2019-06-28 安徽云之迹信息技术有限公司 机器人语音处理方法及装置、云端服务器
CN110086945A (zh) * 2019-04-24 2019-08-02 北京百度网讯科技有限公司 通信方法、服务器、智能设备、服务器、存储介质
CN110211577A (zh) * 2019-07-19 2019-09-06 宁波方太厨具有限公司 终端设备及其语音交互方法
CN110209761A (zh) * 2018-02-07 2019-09-06 刘劲彤 一种物品管理的语音交互方法及系统
CN110335603A (zh) * 2019-07-12 2019-10-15 四川长虹电器股份有限公司 应用于电视场景的多模态交互方法
CN110875038A (zh) * 2018-09-03 2020-03-10 蔚来汽车有限公司 意图行为关系的定义方法及意图转换为行为的执行方法
CN110970021A (zh) * 2018-09-30 2020-04-07 航天信息股份有限公司 一种问答控制方法、装置及系统
CN111063344A (zh) * 2018-10-17 2020-04-24 青岛海信移动通信技术股份有限公司 一种语音识别方法、移动终端以及服务器
CN111061857A (zh) * 2019-12-10 2020-04-24 珠海格力电器股份有限公司 菜谱生成方法、装置、电子设备及存储介质
CN111261150A (zh) * 2018-11-30 2020-06-09 阿里巴巴集团控股有限公司 一种人机对话的实现方法及装置
CN111312235A (zh) * 2018-12-11 2020-06-19 阿里巴巴集团控股有限公司 一种语音交互方法、装置及系统
CN111475614A (zh) * 2020-03-09 2020-07-31 百度在线网络技术(北京)有限公司 知识推理对话方法、装置、电子设备和存储介质
CN111881330A (zh) * 2020-08-05 2020-11-03 上海奥珩企业管理有限公司 居家服务场景自动还原方法及系统
CN112002311A (zh) * 2019-05-10 2020-11-27 Tcl集团股份有限公司 文本纠错方法、装置、计算机可读存储介质及终端设备
WO2020248524A1 (zh) * 2019-06-13 2020-12-17 苏州思必驰信息科技有限公司 人机对话方法及电子设备
CN112153213A (zh) * 2019-06-28 2020-12-29 青岛海信移动通信技术股份有限公司 一种确定语音信息的方法和设备
CN112188253A (zh) * 2020-09-28 2021-01-05 深圳创维-Rgb电子有限公司 语音控制方法、装置、智能电视和可读存储介质
CN112349283A (zh) * 2019-08-09 2021-02-09 杭州九阳小家电有限公司 一种基于用户意图的家电控制方法及智能家电
WO2021087917A1 (zh) * 2019-11-07 2021-05-14 南京阿凡达机器人科技有限公司 基于应用程序控制的语音交互方法、机器人、计算机设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101071418A (zh) * 2007-03-29 2007-11-14 腾讯科技(深圳)有限公司 聊天方法与系统
US20080134038A1 (en) * 2006-12-05 2008-06-05 Electronics And Telecommunications Research Interactive information providing service method and apparatus
CN101496002A (zh) * 2005-05-13 2009-07-29 微软公司 利用在线会话的内容选择广告内容和/或其他相关信息以供显示的系统和方法
CN103000173A (zh) * 2012-12-11 2013-03-27 优视科技有限公司 一种语音交互方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3252282B2 (ja) * 1998-12-17 2002-02-04 松下電器産業株式会社 シーンを検索する方法及びその装置
US7212972B2 (en) * 1999-12-08 2007-05-01 Ddi Corporation Audio features description method and audio video features description collection construction method
JP2006301967A (ja) * 2005-04-20 2006-11-02 Sony Computer Entertainment Inc 会話支援装置
CN101329667A (zh) * 2008-08-04 2008-12-24 深圳市大正汉语软件有限公司 多语言语音互译的智能翻译设备及其控制方法
CN101477798B (zh) * 2009-02-17 2011-01-05 北京邮电大学 一种分析和提取设定场景的音频数据的方法
CN103413549B (zh) * 2013-07-31 2016-07-06 深圳创维-Rgb电子有限公司 语音交互的方法、系统以及交互终端

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101496002A (zh) * 2005-05-13 2009-07-29 微软公司 利用在线会话的内容选择广告内容和/或其他相关信息以供显示的系统和方法
US20080134038A1 (en) * 2006-12-05 2008-06-05 Electronics And Telecommunications Research Interactive information providing service method and apparatus
CN101071418A (zh) * 2007-03-29 2007-11-14 腾讯科技(深圳)有限公司 聊天方法与系统
CN103000173A (zh) * 2012-12-11 2013-03-27 优视科技有限公司 一种语音交互方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴全娥,熊海灵: "一种综合多特征的句子相似度计算方法", 《计算机系统应用》, vol. 19, no. 11, 31 December 2010 (2010-12-31) *

Cited By (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015014122A1 (zh) * 2013-07-31 2015-02-05 深圳创维-Rgb电子有限公司 语音交互的方法、系统以及交互终端
CN106233377A (zh) * 2014-04-25 2016-12-14 夏普株式会社 信息处理装置和控制程序
CN104966513B (zh) * 2014-06-09 2018-09-04 腾讯科技(深圳)有限公司 语言命令处理方法和装置
CN104966513A (zh) * 2014-06-09 2015-10-07 腾讯科技(深圳)有限公司 语言命令处理方法和装置
CN105373527A (zh) * 2014-08-27 2016-03-02 中兴通讯股份有限公司 一种省略恢复方法及问答系统
CN105373527B (zh) * 2014-08-27 2020-11-27 中兴通讯股份有限公司 一种省略恢复方法及问答系统
CN104268195A (zh) * 2014-09-19 2015-01-07 三星电子(中国)研发中心 终端中的本地资源的处理方法和装置
CN104464733A (zh) * 2014-10-28 2015-03-25 百度在线网络技术(北京)有限公司 一种语音对话的多场景管理方法及装置
CN104464733B (zh) * 2014-10-28 2019-09-20 百度在线网络技术(北京)有限公司 一种语音对话的多场景管理方法及装置
CN104574246A (zh) * 2014-12-22 2015-04-29 百度在线网络技术(北京)有限公司 医疗智能分诊方法、装置及设备
WO2016127550A1 (zh) * 2015-02-13 2016-08-18 百度在线网络技术(北京)有限公司 人机语音交互方法和装置
CN105206266B (zh) * 2015-09-01 2018-09-11 重庆长安汽车股份有限公司 基于用户意图猜测的车载语音控制系统及方法
CN105206266A (zh) * 2015-09-01 2015-12-30 重庆长安汽车股份有限公司 基于用户意图猜测的车载语音控制系统及方法
WO2017084360A1 (zh) * 2015-11-17 2017-05-26 乐视控股(北京)有限公司 一种用于语音识别方法及系统
CN105679310A (zh) * 2015-11-17 2016-06-15 乐视致新电子科技(天津)有限公司 一种用于语音识别方法及系统
CN105590626A (zh) * 2015-12-29 2016-05-18 百度在线网络技术(北京)有限公司 持续语音人机交互方法和系统
CN105590626B (zh) * 2015-12-29 2020-03-03 百度在线网络技术(北京)有限公司 持续语音人机交互方法和系统
CN105912692B (zh) * 2016-04-22 2019-09-27 华讯方舟科技有限公司 一种智能语音对话的方法和装置
CN105912692A (zh) * 2016-04-22 2016-08-31 华讯方舟科技有限公司 一种智能语音对话的方法和装置
CN107644639A (zh) * 2016-07-21 2018-01-30 北京快乐智慧科技有限责任公司 一种语音交互的方法和系统
CN106023993A (zh) * 2016-07-29 2016-10-12 西安旭天电子科技有限公司 基于自然语言的机器人控制系统及控制方法
CN106228983B (zh) * 2016-08-23 2018-08-24 北京谛听机器人科技有限公司 一种人机自然语言交互中的场景处理方法及系统
CN106228983A (zh) * 2016-08-23 2016-12-14 北京谛听机器人科技有限公司 一种人机自然语言交互中的场景处理方法及系统
CN107146622A (zh) * 2017-06-16 2017-09-08 合肥美的智能科技有限公司 冰箱、语音交互系统、方法、计算机设备、可读存储介质
CN107274889A (zh) * 2017-06-19 2017-10-20 北京紫博光彦信息技术有限公司 一种根据语音生成业务单据的方法及装置
CN107292109B (zh) * 2017-06-27 2021-04-20 美的集团股份有限公司 饮食规划方法和装置
CN107292109A (zh) * 2017-06-27 2017-10-24 美的集团股份有限公司 饮食规划方法和装置
CN107644641B (zh) * 2017-07-28 2021-04-13 深圳前海微众银行股份有限公司 对话场景识别方法、终端以及计算机可读存储介质
CN107644641A (zh) * 2017-07-28 2018-01-30 深圳前海微众银行股份有限公司 对话场景识别方法、终端以及计算机可读存储介质
CN110209761A (zh) * 2018-02-07 2019-09-06 刘劲彤 一种物品管理的语音交互方法及系统
CN110209761B (zh) * 2018-02-07 2021-06-29 刘劲彤 一种物品管理的语音交互方法及系统
CN108491517A (zh) * 2018-03-22 2018-09-04 青岛农业大学 一种地域性农业信息服务语音查询终端
CN108597537A (zh) * 2018-04-06 2018-09-28 东莞市华睿电子科技有限公司 一种音频信号相似度检测方法
CN108595423A (zh) * 2018-04-16 2018-09-28 苏州英特雷真智能科技有限公司 一种基于属性区间变化的动态本体结构的语义分析方法
CN108717853A (zh) * 2018-05-09 2018-10-30 深圳艾比仿生机器人科技有限公司 一种人机语音交互方法、装置及存储介质
CN109063090A (zh) * 2018-07-26 2018-12-21 挖财网络技术有限公司 自动化运维管理系统
CN110875038A (zh) * 2018-09-03 2020-03-10 蔚来汽车有限公司 意图行为关系的定义方法及意图转换为行为的执行方法
CN110970021A (zh) * 2018-09-30 2020-04-07 航天信息股份有限公司 一种问答控制方法、装置及系统
CN110970021B (zh) * 2018-09-30 2022-03-08 航天信息股份有限公司 一种问答控制方法、装置及系统
CN111063344B (zh) * 2018-10-17 2022-06-28 青岛海信移动通信技术股份有限公司 一种语音识别方法、移动终端以及服务器
CN111063344A (zh) * 2018-10-17 2020-04-24 青岛海信移动通信技术股份有限公司 一种语音识别方法、移动终端以及服务器
CN109359211A (zh) * 2018-11-13 2019-02-19 平安科技(深圳)有限公司 语音交互的数据更新方法、装置、计算机设备和存储介质
CN109359211B (zh) * 2018-11-13 2024-05-07 平安科技(深圳)有限公司 语音交互的数据更新方法、装置、计算机设备和存储介质
CN111261150A (zh) * 2018-11-30 2020-06-09 阿里巴巴集团控股有限公司 一种人机对话的实现方法及装置
CN109660678A (zh) * 2018-12-07 2019-04-19 深圳前海微众银行股份有限公司 电核系统实现方法、系统及可读存储介质
CN111312235A (zh) * 2018-12-11 2020-06-19 阿里巴巴集团控股有限公司 一种语音交互方法、装置及系统
CN109949816A (zh) * 2019-02-14 2019-06-28 安徽云之迹信息技术有限公司 机器人语音处理方法及装置、云端服务器
CN110086945A (zh) * 2019-04-24 2019-08-02 北京百度网讯科技有限公司 通信方法、服务器、智能设备、服务器、存储介质
CN110086945B (zh) * 2019-04-24 2021-07-20 北京百度网讯科技有限公司 通信方法、服务器、智能设备、服务器、存储介质
CN112002311A (zh) * 2019-05-10 2020-11-27 Tcl集团股份有限公司 文本纠错方法、装置、计算机可读存储介质及终端设备
US11551693B2 (en) 2019-06-13 2023-01-10 Ai Speech Co., Ltd. Method of man-machine interaction and electronic device
WO2020248524A1 (zh) * 2019-06-13 2020-12-17 苏州思必驰信息科技有限公司 人机对话方法及电子设备
CN112153213A (zh) * 2019-06-28 2020-12-29 青岛海信移动通信技术股份有限公司 一种确定语音信息的方法和设备
CN110335603A (zh) * 2019-07-12 2019-10-15 四川长虹电器股份有限公司 应用于电视场景的多模态交互方法
CN110211577B (zh) * 2019-07-19 2021-06-04 宁波方太厨具有限公司 终端设备及其语音交互方法
CN110211577A (zh) * 2019-07-19 2019-09-06 宁波方太厨具有限公司 终端设备及其语音交互方法
CN112349283A (zh) * 2019-08-09 2021-02-09 杭州九阳小家电有限公司 一种基于用户意图的家电控制方法及智能家电
CN112349283B (zh) * 2019-08-09 2024-03-12 杭州九阳小家电有限公司 一种基于用户意图的家电控制方法及智能家电
WO2021087917A1 (zh) * 2019-11-07 2021-05-14 南京阿凡达机器人科技有限公司 基于应用程序控制的语音交互方法、机器人、计算机设备
CN111061857A (zh) * 2019-12-10 2020-04-24 珠海格力电器股份有限公司 菜谱生成方法、装置、电子设备及存储介质
CN111475614A (zh) * 2020-03-09 2020-07-31 百度在线网络技术(北京)有限公司 知识推理对话方法、装置、电子设备和存储介质
CN111475614B (zh) * 2020-03-09 2023-08-25 百度在线网络技术(北京)有限公司 知识推理对话方法、装置、电子设备和存储介质
CN111881330A (zh) * 2020-08-05 2020-11-03 上海奥珩企业管理有限公司 居家服务场景自动还原方法及系统
CN111881330B (zh) * 2020-08-05 2023-10-27 颐家(上海)医疗养老服务有限公司 居家服务场景自动还原方法及系统
CN112188253A (zh) * 2020-09-28 2021-01-05 深圳创维-Rgb电子有限公司 语音控制方法、装置、智能电视和可读存储介质

Also Published As

Publication number Publication date
CN103413549B (zh) 2016-07-06
WO2015014122A1 (zh) 2015-02-05

Similar Documents

Publication Publication Date Title
CN103413549B (zh) 语音交互的方法、系统以及交互终端
CN107147618A (zh) 一种用户注册方法、装置及电子设备
CN110019687A (zh) 一种基于知识图谱的多意图识别系统、方法、设备及介质
US11404052B2 (en) Service data processing method and apparatus and related device
JP2020030408A (ja) オーディオにおける重要語句を認識するための方法、装置、機器及び媒体
CN112633003A (zh) 一种地址识别方法、装置、计算机设备及存储介质
CN115309877A (zh) 对话生成方法、对话模型训练方法及装置
WO2022142823A1 (zh) 人机对话方法、装置、计算机设备及可读存储介质
CN116955561A (zh) 问答方法、装置、电子设备以及存储介质
CN110704597A (zh) 对话系统可靠性校验方法、模型生成方法及装置
CN114003682A (zh) 一种文本分类方法、装置、设备及存储介质
CN116821290A (zh) 面向多任务对话的大语言模型训练方法和交互方法
CN118113831A (zh) 问答数据的处理方法、装置、电子设备及存储介质
CN106708950B (zh) 用于智能机器人自学习系统的数据处理方法及装置
CN105323392A (zh) 一种快速进入ivr菜单的方法及装置
CN116521821A (zh) 文本语义匹配方法及制冷设备系统
CN112069833B (zh) 日志分析方法、日志分析装置及电子设备
CN116913278B (zh) 语音处理方法、装置、设备和存储介质
CN113763925A (zh) 语音识别方法、装置、计算机设备及存储介质
CN117332062A (zh) 一种数据处理方法和相关装置
CN113571063A (zh) 语音信号的识别方法、装置、电子设备及存储介质
CN114490969B (zh) 基于表格的问答方法、装置以及电子设备
CN112101035B (zh) 命名实体识别方法、装置、可读存储介质及电子设备
CN110399462B (zh) 一种信息的查询方法及装置
CN114049875A (zh) 一种tts播报方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant