CN109725869B - 连续交互控制方法和装置 - Google Patents

连续交互控制方法和装置 Download PDF

Info

Publication number
CN109725869B
CN109725869B CN201910002556.7A CN201910002556A CN109725869B CN 109725869 B CN109725869 B CN 109725869B CN 201910002556 A CN201910002556 A CN 201910002556A CN 109725869 B CN109725869 B CN 109725869B
Authority
CN
China
Prior art keywords
interaction
continuous
voice
voice interaction
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910002556.7A
Other languages
English (en)
Other versions
CN109725869A (zh
Inventor
杨宇宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Shanghai Xiaodu Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Shanghai Xiaodu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd, Shanghai Xiaodu Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910002556.7A priority Critical patent/CN109725869B/zh
Publication of CN109725869A publication Critical patent/CN109725869A/zh
Application granted granted Critical
Publication of CN109725869B publication Critical patent/CN109725869B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明实施例提出一种连续交互控制方法和装置。其中,该方法包括:在语音交互设备处于连续交互状态下,获取语音交互需求和连续交互方式;获取与所述语音交互需求和所述连续交互方式对应的交互引导内容;控制所述语音交互设备播报所述交互引导内容对应的语音。本发明实施例在语音交互过程中,能够播报与语音交互需求和连续交互方式对应的交互引导内容,因此,交互风格自然,对话感更强的、体验更延续。

Description

连续交互控制方法和装置
技术领域
本发明涉及语音交互技术领域,尤其涉及一种连续交互控制方法和装置。
背景技术
在语音交互的过程中,如果用户有自发的延续对话,优先保持用户对话逻辑的沉浸,在用户无继续交互需求时,则对话会退场。
在常规的一次唤醒一次交互的方法中,在每次回复用户后,设备简单拼接运营话术,如“试试对我说***”、“可以对我说***”等。
因此,目前的语音交互方式,存在交互风格生硬,不自然,缺少对话感,打断用户后续交互的沉浸感等缺点。
发明内容
本发明实施例提供一种连续交互控制方法和装置,以解决现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种连续交互控制方法,包括:
在语音交互设备处于连续交互状态下,获取语音交互需求和连续交互方式;
获取与所述语音交互需求和所述连续交互方式对应的交互引导内容;
控制所述语音交互设备播报所述交互引导内容对应的语音。
在一种实施方式中,获取与所述语音交互需求和所述连续交互方式对应的交互引导内容,包括:
如果所述连续交互方式为即时触发方式,则根据所述语音交互设备的当前对话状态,即时触发与所述语音交互需求相关联的交互引导内容。
在一种实施方式中,获取与所述语音交互需求和所述连续交互方式对应的交互引导内容,还包括:
如果所述连续交互方式为退场前触发方式,则根据所述语音交互设备的预测对话状态,退场前触发与所述语音交互需求相关联的交互引导内容。
在一种实施方式中,退场前触发与所述语音交互需求相关联的交互引导内容,包括:
检测所述语音交互设备的收音时长是否达到设定时长且尚未达到退场时长,所述设定时长小于退场时长;
如果所述收音时长达到所述设定时长且尚未达到退场时长,则在所述语音交互设备从连续交互状态退场之前,预测与所述语音交互需求相关联的交互引导内容。
第二方面,本发明实施例提供了一种连续交互控制装置,包括:
获取模块,用于在语音交互设备处于连续交互状态下,获取语音交互需求和连续交互方式;
引导模块,用于获取与所述语音交互需求和所述连续交互方式对应的交互引导内容;
播报模块,用于控制所述语音交互设备播报所述交互引导内容对应的语音。
在一种实施方式中,所述引导模块包括:
及时触发子模块,用于如果所述连续交互方式为即时触发方式,则根据所述语音交互设备的当前对话状态,即时触发与所述语音交互需求相关联的交互引导内容。
在一种实施方式中,所述引导模块还包括:
退场前触发子模块,用于如果所述连续交互方式为退场前触发方式,则根据所述语音交互设备的预测对话状态,退场前触发与所述语音交互需求相关联的交互引导内容。
在一种实施方式中,所述退场前触发子模块还用于:
检测所述语音交互设备的收音时长是否达到设定时长且尚未达到退场时长,所述设定时长小于退场时长;
如果所述收音时长达到所述设定时长且尚未达到退场时长,则在所述语音交互设备从连续交互状态退场之前,预测与所述语音交互需求相关联的交互引导内容。
第三方面,本发明实施例提供了一种连续交互控制装置,所述装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,所述装置的结构中包括处理器和存储器,所述存储器用于存储支持所述装置执行上述连续交互控制方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述装置还可以包括通信接口,用于与其他设备或通信网络通信。
第四方面,本发明实施例提供了一种计算机可读存储介质,用于存储连续交互控制装置所用的计算机软件指令,其包括用于执行上连续交互控制方法所涉及的程序。
上述技术方案中的一个技术方案具有如下优点或有益效果:在语音交互过程中,能够播报与语音交互需求和连续交互方式对应的交互引导内容,因此,交互风格自然,对话感更强的、体验更延续。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1示出根据本发明实施例的连续交互控制方法的流程图。
图2示出根据本发明实施例的连续交互控制方法的流程图。
图3示出根据本发明实施例的连续交互控制装置的结构框图。
图4示出根据本发明实施例的连续交互控制装置的结构框图。
图5示出根据本发明实施例的连续交互控制装置的结构框图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
图1示出根据本发明实施例的连续交互控制方法的流程图。如图1所示,该方法可以包括:
步骤S11、在语音交互设备处于连续交互状态下,获取语音交互需求和连续交互方式;
步骤S12、获取与所述语音交互需求和所述连续交互方式对应的交互引导内容;
步骤S13、控制所述语音交互设备播报所述交互引导内容对应的语音。
语音交互由一次唤醒一次交互,逐渐升级为一次唤醒多次交互。在连续交互中,希望为用户提供更加沉浸自然的对话体验。
语音交互设备被唤醒后,进入唤醒状态,可以开始在收音时长内持续地进行收音。可以根据语音交互设备的方式、具体应用场景的需求等设置收音时长。在收音时长内,如果语音交互设备从收到的语音信号中识别到语音交互需求,则可以按照语音交互需求进行对应的操作。其中,语音交互设备可以在本地对语音信号进行识别,也可以将收到的语音信号发送到其他的设备例如云端的语音识别服务器中进行识别。如果依次识别出多个语音交互需求,则语音交互设备可以按照识别出的语音交互需求的顺序,连续的与用户进行交互。
在收音过程中,可以判断收音时长是否超时。例如,设定一个用于控制退场的时长阈值(以下简称退场时长)假设为8s。如果收音时长小于或等于8s则不超时,如果收音时长大于8s则超时。
在收音时长未超时的情况下,语音交互设备可以连续地进行收音,并识别收到的语音信号中的语音交互需求。在收音时长超时的情况下,语音交互设备会从当前的语音交互对话中退场。
在收音时长即将达到退场时长时,设备即将退场。在这种情况下,语音交互设备可以主动播报交互引导内容,引导用户继续进行对话。播报方式可以采用从文本到语音(TTS,Text To Speech)方式。交互引导内容可以与前次获得的语音交互需求,以及当前的连续交互方式有关。这样得到交互引导内容与用户当前的对话内容更加相符,使得交互引导更加自然。
此外,在语音交互过程中,可以采用全双工方式,将语音交互设备的拾音功能和播放功能同时打开。这样,语音交互设备拾取到用户的语音信号后,如果发现语音交互需求发生了变化,可以打断正在进行的语音对话,按照当前的语音交互需求继续进行对话。
在一种实施方式中,如图2所示,步骤S12包括:
步骤S21、如果所述连续交互方式为即时触发方式,则根据所述语音交互设备的当前对话状态,即时触发与所述语音交互需求相关联的交互引导内容。
在一种实施方式中,在用户对是否能继续交互的预期不明朗的场景中,连续交互方式可以为即时触发方式。例如,在交互性较弱的场景,例如出现无法理解的语音交互需求的场景、具有多个搜索结果的长播报的场景、当前需求已满足的场景等,即时触发语音交互提示,减少对视觉提示的依赖,提高语音交互的顺畅度。
例如,语音交互设备识别语音信号后,可能无法理解当前的语音交互需求,则可以调取一些默认的交互引导内容。例如“没有听懂”、“不好意思,请再说一遍”。如果连续出现设备无法理解的内容,则可以静默退场。
再如,语音交互设备识别语音信号后,可能查找到与语音交互需求对应的多个搜索结果。例如根据“我想看电视剧”的需求找到影视列表页。影视列表页中包括若干电视剧的名称。这时,可以通过显示和/或播报的方式为用户展示该列表页的内容。后续,设备还可以继续播报与本次需求相关的内容。例如“想看哪一个?”。
在一种实施方式中,步骤S12包括:
步骤S22、如果所述连续交互方式为退场前触发方式,则根据所述语音交互设备的预测对话状态,退场前触发与所述语音交互需求相关联的交互引导内容。
在一些对话即将退场的场景,例如,在需求已满足后静默的场景、晚间场景、长播报后静默的场景等,可以根据所述语音交互设备的预测对话状态,退场前触发交互引导内容。
其中,退场前触发与所述语音交互需求相关联的交互引导内容,包括:
检测所述语音交互设备的收音时长是否达到设定时长且尚未达到退场时长,所述设定时长小于退场时长;
如果所述收音时长达到所述设定时长且尚未达到退场时长,则在所述语音交互设备从连续交互状态退场之前,预测与所述语音交互需求相关联的交互引导内容。
例如,如果想要即将退场前2s预测交互引导内容,则可以将上述的设定时长设定为退场时长减去2s。如果退场时长为8s,则在收音时长达到6s时未到8s时,预测与所述语音交互需求相关联的交互引导内容。
其中,获取与所述语音交互需求相关联的交互引导内容的方式有多种,示例如下。
例如,利用当前对话中出现过的任意一个语音交互需求中的关键词进行搜索,获取与当前对话的任意一个语音交互需求相关联的内容作为交互引导内容。
再如,利用当前对话中最后一个语音交互需求中的关键词进行搜索,获取与当前对话的最后一个语音交互需求相关联的内容作为交互引导内容。
再如,利用当前对话中语音交互需求以及针对语音交互需求的回复内容中的关键词进行搜索,获取与当前对话的任意内容相关联的内容作为交互引导内容。
再如,统计当前对话出现次数最多的一个或多个关键词,然后利用统计得到的关键词进行搜索,获取与当前对话关注度较高的话题相关联的内容作为交互引导内容。
此外,也可以设置一些通用的交互引导内容,在即将退场时,直接从通用的交互引导内容中随机选择出一条播报出来。
在一种应用示例中,连续交互形式包括:围绕当前状态的交互以及围绕预测状态的交互。对于围绕当前状态的交互,即时触发交互引导内容;对于围绕预测状态的交互,在对话退场前触发交互引导内容。
1、即时触发:
在用户对能否继续交互预期不明朗的场景,增加语音交互提示,减少对视觉提示的依赖,提高语音交互的顺畅度。例如:在不理解、长播报、有确定交互引导等交互性较弱的场景下,增加即时触发的交互引导内容。参见表1中的示例:
表1
Figure BDA0001934213020000071
2、对话退场前触发:
在用户的交互需求已经满足,不再继续交互的场景下,语音交互设备主动发起交互对话,预测用户可能接受的交互内容,将交互延续下去。触发时机为:对话即将退场时,例如收音即将超时或刚刚超时时。参见表2中的示例:
表2
Figure BDA0001934213020000072
Figure BDA0001934213020000081
以上表1和表2中的Q表示用户说出的内容,A表示语音交互设备响应的内容。
本发明实施例在语音交互过程中,能够播报与语音交互需求和连续交互方式对应的交互引导内容,因此,交互风格自然,对话感更强的、体验更延续。尤其是在交互预期不明朗或者即将退场的情况下,有利于延续交互,使用户更加容易沉浸与语音交互的对话中。
图3示出根据本发明实施例的连续交互控制装置的结构框图。如图3所示,该装置可以包括:
获取模块31,用于在语音交互设备处于连续交互状态下,获取语音交互需求和连续交互方式;
引导模块32,用于获取与所述语音交互需求和所述连续交互方式对应的交互引导内容;
播报模块33,用于控制所述语音交互设备播报所述交互引导内容对应的语音。
在一种实施方式中,如图4所示,所述引导模块32包括:
及时触发子模块41,用于如果所述连续交互方式为即时触发方式,则根据所述语音交互设备的当前对话状态,即时触发与所述语音交互需求相关联的交互引导内容。
在一种实施方式中,所述引导模块32还包括:
退场前触发子模块42,用于如果所述连续交互方式为退场前触发方式,则根据所述语音交互设备的预测对话状态,退场前触发与所述语音交互需求相关联的交互引导内容。
在一种实施方式中,退场前触发子模块42还用于检测所述语音交互设备的收音时长是否达到设定时长且尚未达到退场时长,所述设定时长小于退场时长;如果所述收音时长达到所述设定时长且尚未达到退场时长,则在所述语音交互设备从连续交互状态退场之前,预测与所述语音交互需求相关联的交互引导内容。
本发明实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。
图5示出根据本发明实施例的连续交互控制装置的结构框图。如图5所示,该装置包括:存储器910和处理器920,存储器910内存储有可在处理器920上运行的计算机程序。所述处理器920执行所述计算机程序时实现上述实施例中的连续交互控制方法。所述存储器910和处理器920的数量可以为一个或多个。
该装置还包括:
通信接口930,用于与外界设备进行通信,进行数据交互传输。
存储器910可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器910、处理器920和通信接口930独立实现,则存储器910、处理器920和通信接口930可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,PeripheralComponent)总线或扩展工业标准体系结构(EISA,Extended Industry StandardComponent)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种方式的总线。
可选的,在具体实现上,如果存储器910、处理器920及通信接口930集成在一块芯片上,则存储器910、处理器920及通信接口930可以通过内部接口完成相互间的通信。
本发明实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现上述实施例中任一所述的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (6)

1.一种连续交互控制方法,其特征在于,包括:
在语音交互设备处于连续交互状态下,获取语音交互需求和连续交互方式;
获取与所述语音交互需求和所述连续交互方式对应的交互引导内容;
其中,所述获取与所述语音交互需求和所述连续交互方式对应的交互引导内容,包括:如果所述连续交互方式为退场前触发方式,检测所述语音交互设备的收音时长是否达到设定时长且尚未达到退场时长,所述设定时长小于退场时长;如果所述收音时长达到所述设定时长且尚未达到退场时长,则预测与所述语音交互需求相关联的交互引导内容;
在所述收音时长达到所述退场时长时,控制所述语音交互设备播报所述交互引导内容对应的语音。
2.根据权利要求1所述的方法,其特征在于,获取与所述语音交互需求和所述连续交互方式对应的交互引导内容,包括:
如果所述连续交互方式为即时触发方式,则根据所述语音交互设备的当前对话状态,即时触发与所述语音交互需求相关联的交互引导内容。
3.一种连续交互控制装置,其特征在于,包括:
获取模块,用于在语音交互设备处于连续交互状态下,获取语音交互需求和连续交互方式;
引导模块,用于获取与所述语音交互需求和所述连续交互方式对应的交互引导内容;
其中,所述引导模块包括:
退场前触发子模块,用于如果所述连续交互方式为退场前触发方式,检测所述语音交互设备的收音时长是否达到设定时长且尚未达到退场时长,所述设定时长小于退场时长;如果所述收音时长达到所述设定时长且尚未达到退场时长,则预测与所述语音交互需求相关联的交互引导内容;
播报模块,用于在所述收音时长达到所述退场时长时,控制所述语音交互设备播报所述交互引导内容对应的语音。
4.根据权利要求3所述的装置,其特征在于,所述引导模块包括:
及时触发子模块,用于如果所述连续交互方式为即时触发方式,则根据所述语音交互设备的当前对话状态,即时触发与所述语音交互需求相关联的交互引导内容。
5.一种连续交互控制装置,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至2中任一项所述的方法。
6.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至2中任一项所述的方法。
CN201910002556.7A 2019-01-02 2019-01-02 连续交互控制方法和装置 Active CN109725869B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910002556.7A CN109725869B (zh) 2019-01-02 2019-01-02 连续交互控制方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910002556.7A CN109725869B (zh) 2019-01-02 2019-01-02 连续交互控制方法和装置

Publications (2)

Publication Number Publication Date
CN109725869A CN109725869A (zh) 2019-05-07
CN109725869B true CN109725869B (zh) 2022-10-21

Family

ID=66298705

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910002556.7A Active CN109725869B (zh) 2019-01-02 2019-01-02 连续交互控制方法和装置

Country Status (1)

Country Link
CN (1) CN109725869B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110557451B (zh) * 2019-08-30 2021-02-05 北京百度网讯科技有限公司 对话交互处理方法、装置、电子设备和存储介质
CN111326154B (zh) * 2020-03-02 2022-11-22 珠海格力电器股份有限公司 语音交互的方法、装置、存储介质及电子设备
CN112700775A (zh) * 2020-12-29 2021-04-23 维沃移动通信有限公司 语音接收周期的更新方法、装置和电子设备
CN113129889B (zh) * 2021-03-09 2023-11-07 佛山市佰特智慧物联科技有限公司 语音控制方法及控制装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050049207A (ko) * 2003-11-21 2005-05-25 한국전자통신연구원 대화형 연속 음성인식 시스템 및 이를 이용한 음성끝점검출방법
CN101136198A (zh) * 2006-08-29 2008-03-05 爱信艾达株式会社 语音识别方法及语音识别装置
CN108242236A (zh) * 2016-12-26 2018-07-03 现代自动车株式会社 对话处理装置及其车辆和对话处理方法
CN108766423A (zh) * 2018-05-25 2018-11-06 三星电子(中国)研发中心 一种基于场景的主动唤醒方法和装置
CN108881649A (zh) * 2018-06-08 2018-11-23 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5074759B2 (ja) * 2006-12-20 2012-11-14 トヨタ自動車株式会社 対話制御装置、対話制御方法及び対話制御プログラム
JP2008233678A (ja) * 2007-03-22 2008-10-02 Honda Motor Co Ltd 音声対話装置、音声対話方法、及び音声対話用プログラム
CN108597509A (zh) * 2018-03-30 2018-09-28 百度在线网络技术(北京)有限公司 智能语音交互实现方法、装置、计算机设备及存储介质
CN109086329B (zh) * 2018-06-29 2021-01-05 出门问问信息科技有限公司 基于话题关键词引导的进行多轮对话方法及装置
CN108846127A (zh) * 2018-06-29 2018-11-20 北京百度网讯科技有限公司 一种语音交互方法、装置、电子设备和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050049207A (ko) * 2003-11-21 2005-05-25 한국전자통신연구원 대화형 연속 음성인식 시스템 및 이를 이용한 음성끝점검출방법
CN101136198A (zh) * 2006-08-29 2008-03-05 爱信艾达株式会社 语音识别方法及语音识别装置
CN108242236A (zh) * 2016-12-26 2018-07-03 现代自动车株式会社 对话处理装置及其车辆和对话处理方法
CN108766423A (zh) * 2018-05-25 2018-11-06 三星电子(中国)研发中心 一种基于场景的主动唤醒方法和装置
CN108881649A (zh) * 2018-06-08 2018-11-23 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向自然交互的多通道人机对话系统;杨明浩 等;《计算机科学》;20181215;12-18 *

Also Published As

Publication number Publication date
CN109725869A (zh) 2019-05-07

Similar Documents

Publication Publication Date Title
CN109725869B (zh) 连续交互控制方法和装置
CN109410944B (zh) 语音交互方法、装置和终端
CN109657091B (zh) 语音交互设备的状态呈现方法、装置、设备及存储介质
CN108962233B (zh) 用于语音对话平台的语音对话处理方法及系统
CN111107421B (zh) 视频处理方法、装置、终端设备及存储介质
CN105338409B (zh) 一种网络视频预加载方法及装置
US20170133060A1 (en) Method and device of playing multimedia and medium
CN107277225B (zh) 语音控制智能设备的方法、装置和智能设备
US11200899B2 (en) Voice processing method, apparatus and device
CN110390927B (zh) 音频处理方法、装置、电子设备及计算机可读存储介质
US9819905B1 (en) Video communication sessions between whitelisted devices
CN107948672B (zh) 保存视频数据的方法和系统、以及服务器、穿戴式设备
US20170171278A1 (en) Method and electronic device for continuously playing video
CN111949240A (zh) 交互方法、存储介质、服务程序和设备
CN107066543B (zh) 敏感词过滤方法和装置
CN111601154B (zh) 一种视频处理方法及相关设备
CN111147882B (zh) 视频处理方法、装置、终端设备及存储介质
CN108366297B (zh) 终端信息的跟随方法、装置及智能电视机
CN114374869B (zh) 一种全景视频播放方法、装置及计算机存储介质
CN112565913B (zh) 视频通话方法、装置和电子设备
CN114979747A (zh) 一种直播方法、装置、设备、介质及程序产品
CN111787408B (zh) 多类型多媒体混合播放的处理方法、播放装置及存储介质
CN107220093B (zh) 一种进程处理方法及装置
CN113905225B (zh) 裸眼3d显示装置的显示控制方法及装置
CN110225364B (zh) 一种视频处理方法、装置、终端、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210508

Address after: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant after: BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) Co.,Ltd.

Applicant after: Shanghai Xiaodu Technology Co.,Ltd.

Address before: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant before: BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant