CN109903763A - 服务控制方法、装置及设备 - Google Patents

服务控制方法、装置及设备 Download PDF

Info

Publication number
CN109903763A
CN109903763A CN201910025214.7A CN201910025214A CN109903763A CN 109903763 A CN109903763 A CN 109903763A CN 201910025214 A CN201910025214 A CN 201910025214A CN 109903763 A CN109903763 A CN 109903763A
Authority
CN
China
Prior art keywords
service
audio data
control
control service
application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910025214.7A
Other languages
English (en)
Other versions
CN109903763B (zh
Inventor
何亮
安爱辉
牛禹
赵立峰
薛向东
周冀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Shanghai Xiaodu Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910025214.7A priority Critical patent/CN109903763B/zh
Publication of CN109903763A publication Critical patent/CN109903763A/zh
Priority to US16/667,951 priority patent/US11211075B2/en
Priority to JP2019200534A priority patent/JP6928638B2/ja
Application granted granted Critical
Publication of CN109903763B publication Critical patent/CN109903763B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例提供一种服务控制方法、装置及设备,该方法包括:确定所述电子设备中处于运行状态的应用服务;向所述应用服务和控制服务发送麦克风采集得到的音频数据,所述应用服务用于根据所述音频数据进行多媒体信息交互,所述控制服务用于根据音频数据对所述电子设备进行控制。提高了对电子设备中的服务进行控制的灵活性。

Description

服务控制方法、装置及设备
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种服务控制方法、装置及设备。
背景技术
目前,很多电子设备(例如手机、电脑等设备)中设置有控制服务和应用服务。控制服务可以根据语音对电子设备进行控制。应用服务可以根据语音实现多媒体信息交互,例如,应用服务可以为语音通话服务等。
电子设备中通常设置有麦克风,麦克风可以采集用户输入的音频信息。控制服务和应用服务可以根据麦克风采集到的音频数据进行处理。在现有技术中,在同一时刻,只有一个服务可以从麦克风获取到音频数据,因此,在需要使用音频数据的应用服务(例如语音通话服务)运行时,则控制服务无法从麦克风获取得到音频数据,使得控制服务无法对电子设备进行控制,进而导致对服务进行控制的灵活性差。
发明内容
本发明实施例提供一种服务控制方法、装置及设备,提高了对电子设备中的服务进行控制的灵活性。
第一方面,本发明实施例提供一种服务控制方法,包括:
确定所述电子设备中处于运行状态的应用服务;
向所述应用服务和控制服务发送麦克风采集得到的音频数据,所述应用服务用于根据所述音频数据进行多媒体信息交互,所述控制服务用于根据音频数据对所述电子设备进行控制。
在一种可能的实施方式中,所述向所述应用服务和控制服务发送麦克风采集得到的音频数据,包括:
通过音频通道向所述控制服务发送所述音频数据;
通过所述控制服务向所述应用服务发送所述音频数据。
在一种可能的实施方式中,所述通过所述控制服务向所述应用服务发送所述音频数据,包括:
通过所述控制服务获取所述音频数据对应的备份数据,所述备份数据与所述音频数据相同;
通过所述控制服务向所述应用服务发送所述备份数据。
在一种可能的实施方式中,所述通过所述控制服务向所述应用服务发送所述备份数据,包括:
通过所述控制服务向所述应用服务发送所述备份数据中的应用数据,所述应用数据为用于进行多媒体信息交互的数据。
在一种可能的实施方式中,所述通过所述控制服务向所述应用服务发送所述备份数据中的应用数据,包括:
在所述控制服务在所述音频数据中识别到第一关键词后,所述控制服务暂停向所述应用服务发送所述备份数据,在所述控制服务器在所述音频数据中识别到第二关键词后,所述控制服务继续向所述应用服务发送所述备份数据。
在一种可能的实施方式中,所述第一关键词为触发所述控制服务对所述电子设备进行控制的关键词,所述第二关键词为触发所述控制服务暂停对所述电子设备进行控制的关键词。
在一种可能的实施方式中,所述向所述应用服务和控制服务发送麦克风采集得到的音频数据之后,还包括:
通过所述控制服务对所述音频数据进行语音识别处理;
在所述控制服务在所述音频数据中识别得到第一关键字之后,通过所述控制服务根据所述第一关键字之后的音频数据控制所述电子设备,直至所述控制服务在所述音频数据中识别得到第二关键字之后,暂停控制所述电子设备。
在一种可能的实施方式中,所述向所述应用服务和控制服务发送麦克风采集得到的音频数据,包括:
通过第一音频通道向所述应用服务发送所述音频数据;
通过第二音频通道向所述控制服务发送所述音频数据。
在一种可能的实施方式中,所述方法还包括:
在确定所述电子设备中不存在运行状态的应用服务时,则向所述控制服务发送所述麦克风采集得到的音频数据。
第二方面,本发明实施例提供一种服务控制装置,包括确定模块和发送模块,其中,
所述确定模块用于,确定所述电子设备中处于运行状态的应用服务;
所述发送模块用于,向所述应用服务和控制服务发送麦克风采集得到的音频数据,所述应用服务用于根据所述音频数据进行多媒体信息交互,所述控制服务用于根据音频数据对所述电子设备进行控制。
在一种可能的实施方式中,所述发送模块具体用于:
通过音频通道向所述控制服务发送所述音频数据;
通过所述控制服务向所述应用服务发送所述音频数据。
在一种可能的实施方式中,所述发送模块具体用于:
通过所述控制服务获取所述音频数据对应的备份数据,所述备份数据与所述音频数据相同;
通过所述控制服务向所述应用服务发送所述备份数据。
在一种可能的实施方式中,所述发送模块具体用于:
通过所述控制服务向所述应用服务发送所述备份数据中的应用数据,所述应用数据为用于进行多媒体信息交互的数据。
在一种可能的实施方式中,所述发送模块具体用于:
在所述控制服务在所述音频数据中识别到第一关键词后,所述控制服务暂停向所述应用服务发送所述备份数据,在所述控制服务器在所述音频数据中识别到第二关键词后,所述控制服务继续向所述应用服务发送所述备份数据。
在一种可能的实施方式中,所述第一关键词为触发所述控制服务对所述电子设备进行控制的关键词,所述第二关键词为触发所述控制服务暂停对所述电子设备进行控制的关键词。
在一种可能的实施方式中,所述装置还包括语音识别模块和控制模块,其中,
所述语音识别模块用于,在所述发送模块向所述应用服务和控制服务发送麦克风采集得到的音频数据之后,通过所述控制服务对所述音频数据进行语音识别处理;
所述控制模块用于,在所述控制服务在所述音频数据中识别得到第一关键字之后,通过所述控制服务根据所述第一关键字之后的音频数据控制所述电子设备,直至所述控制服务在所述音频数据中识别得到第二关键字之后,暂停控制所述电子设备。
在一种可能的实施方式中,所述发送模块具体用于:
通过第一音频通道向所述应用服务发送所述音频数据;
通过第二音频通道向所述控制服务发送所述音频数据。
在一种可能的实施方式中,所述发送模块还用于,在确定所述电子设备中不存在运行状态的应用服务时,向所述控制服务发送所述麦克风采集得到的音频数据。
第三方面,本发明实施例提供一种服务控制装置,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第一方面任一项所述的服务控制方法。
第四方面,本发明实施例提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面任一项所述的服务控制方法。
本发明实施例提供的服务控制方法、装置及设备,在确定电子设备中存在应用服务处于运行状态时,则电子设备向应用服务和控制服务发送麦克风采集得到的音频数据,以使得控制服务可以根据接收到的音频数据对电子设备进行控制,以及使得应用服务可以根据接收到的音频数据进行多媒体信息交互。在上述过程中,在应用服务根据音频数据进行多媒体信息交互的过程中,控制服务依然可以根据音频对电子设备进行控制,提高了对电子设备中的服务进行控制的灵活性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1A为本发明实施例提供的一种服务控制方法的架构图
图1B为本发明实施例提供的另一种服务控制方法的架构图;
图2为本发明实施例提供的一种服务控制方法的流程示意图;
图3为本发明实施例提供的向控制服务和应用服务发送音频数据方法的流程示意图;
图4为本发明实施例提供的另一种服务控制方法的流程示意图;
图5为本发明实施例提供的一种服务控制装置的结构示意图;
图6为本发明实施例提供的另一种服务控制装置的结构示意图;
图7为本发明实施例提供的服务控制装置的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1A为本发明实施例提供的一种服务控制方法的架构图。图1B为本发明实施例提供的另一种服务控制方法的架构图。请参见图1A-图1B,电子设备中设置有麦克风、控制服务和应用服务。麦克风可以采集音频数据,并通过音频通道发送音频数据。控制服务可以根据麦克风采集得到的音频数据对电子设备进行控制。控制服务通常一直处于运行状态,并对麦克风采集得到的数据进行实时语音识别,在控制服务识别得到第一关键词之后,控制服务再根据第一关键词之后的音频数据对电子设备进行控制。例如,控制服务可以根据接收到的音频数据对电子设备中的应用服务进行控制,例如,控制服务可以根据接收到的音频数据控制电子设备中的通话应用服务,以通过通话应用服务拨打电话。例如,控制服务可以为人工智能助手应用等。应用服务可以根据麦克风采集得到的音频数据进行多媒体信息交互。例如,应用服务可以为音视频通话服务、音视频录制服务、唱歌服务等。在实际应用过程中,电子设备通常只有一个使用音频数据的应用服务处于运行状态。
请参见图1A,电子设备中设置有一条音频通道。麦克风将采集得到的音频数据通过音频通道实时发送给控制服务。控制服务对接收到的音频数据进行实时处理。在电子设备中的应用服务启动运行之后,电子设备可以通过控制服务将接收到的音频数据发送给应用服务,以使应用服务根据接收到的音频数据进行多媒体信息交互。
请参见图1B,电子设备中设置有两条音频通道。由于控制服务一直处于运行状态,因此,麦克风将采集得到的音频数据通过一条音频通道实时发送给控制服务。在电子设备中的一个应用服务处于运行状态时,麦克风将采集得到的音频数据通过另一条音频通道发送给应用服务,以使应用服务根据接收到的音频数据进行多媒体信息交互。
在本申请中,在确定电子设备中存在应用服务处于运行状态时,则电子设备向应用服务和控制服务发送麦克风采集得到的音频数据,以使得控制服务可以根据接收到的音频数据对电子设备进行控制,以及使得应用服务可以根据接收到的音频数据进行多媒体信息交互。在上述过程中,在应用服务根据音频数据进行多媒体信息交互的过程中,控制服务依然可以根据音频对电子设备进行控制,提高了对电子设备中的服务进行控制的灵活性。
下面,通过具体实施例对本申请所示的技术方案进行详细说明。需要说明的是,下面几个具体实施例可以相互结合,对于相同或相似的内容,在不同的实施例中不再进行重复说明。
图2为本发明实施例提供的一种服务控制方法的流程示意图。请参见图2,该方法可以包括:
S201、确定电子设备中处于运行状态的应用服务。
本发明实施例的执行主体可以为电子设备,也可以为设置在电子设备中的服务控制装置。可选的,服务控制装置可以通过软件实现,也可以通过软件和硬件的结合实现。
可选的,电子设备可以为手机、电脑等设备。
可选的,电子设备的系统可以为Android系统、IOS系统等。
可选的,本发明实施例所示的应用服务是指运行过程中需要使用音频数据的服务。应用服务可以通过根据音频数据进行多媒体信息交互,多媒体信息交互可以包括实现音频通话、音频录制、音频处理等。
例如,应用服务可以为音/视频通话服务、音/视频录制服务、K歌服务等。
在实际应用过程中,通常只有一个应用服务处于运行状态。
S202、向应用服务和控制服务发送麦克风采集得到的音频数据。
可选的,本发明实施例所示的控制服务是指可以根据音频数据对电子设备进行控制的服务。
可选的,对电子设备进行的控制可以包括:启动电子设备中的应用程序,控制电子设备中的应用程序的运行等。
例如,控制服务可以控制电子设备中的通话应用程序向预设联系人拨打电话。控制服务可以控制电子设备中的摄像应用程序启动运行。
可选的,可以通过如下两种可行的实现方式向应用服务和控制服务发送麦克风采集得到的音频数据:
一种可行的实现方式:
通过音频通道向控制服务发送音频数据,通过控制服务向应用服务发送音频数据。
需要说明的是,通过音频通道向控制服务发送的音频数据为麦克风实时采集得到的数据。通过控制服务向应用服务发送的音频数据也为麦克风实时采集得到的数据。
可选的,音频通道可以为音频链路。
可选的,可以将麦克风采集得到的音频数据传输至脉冲编码调制(Pulse CodeModulation,PCM)节点,并由控制服务从PCM节点获取麦克风采集得到的音频数据。
需要说明的是,在图3所述的实施例中对该种可行的实现方式进行详细说明,此处不再进行赘述。
另一种可行的实现方式:
通过第一音频通道向应用服务发送音频数据;通过第二音频通道向控制服务发送音频数据。
在该种可行的实现方式中,电子设备中的控制服务一直处于运行状态,因此,电子设备通过第二音频通道实时向控制设备发送麦克风采集得到的数据。电子设备中的应用服务并非一直处于运行状态,只有在电子设备中的一个应用服务处于运行状态时,才通过第一音频通道向该处于运行状态的应用服务发送音频数据。
可选的,当电子设备为Android系统时,由于原生的Android系统下,同时只支持一个AudioRecord进行录音,在第一服务正在通过AudioRecord进行录音的过程中,在第二服务需要进行录音时,需要退出第一服务,并由第二服务通过AudioRecord进行录音。在本申请中,可以设置两个AudioRecord,当电子设备中同时有两个服务需要进行录音时,则可以通过该两个AudioRecord同时进行录音。
需要说明的是,在确定所述电子设备中不存在运行状态的应用服务时,则向所述控制服务发送所述麦克风采集得到的音频数据。即,在电子设备中不存在运行状态的应用服务时,仅向控制服务发送麦克风采集得到的音频数据。
本发明实施例提供的服务控制方法,在确定电子设备中存在应用服务处于运行状态时,则电子设备向应用服务和控制服务发送麦克风采集得到的音频数据,以使得控制服务可以根据接收到的音频数据对电子设备进行控制,以及使得应用服务可以根据接收到的音频数据进行多媒体信息交互。在上述过程中,在应用服务根据音频数据进行多媒体信息交互的过程中,控制服务依然可以根据音频对电子设备进行控制,提高了对电子设备中的服务进行控制的灵活性。
在上述任意一个实施例的基础上,可选的,可以通过如下可行的实现方式向应用服务和控制服务发送麦克风采集得到的音频数据(图2实施例中的S202),具体的,请参见图3所述的实施例。
图3为本发明实施例提供的向控制服务和应用服务发送音频数据方法的流程示意图。请参见图3,该方法可以包括:
S301、通过音频通道向控制服务发送麦克风采集得到的音频数据。
S302、通过控制服务获取音频数据对应的备份数据。
其中,备份数据与音频数据相同。
可选的,在控制服务接收到麦克风采集得到的音频数据之后,可以对接收到的音频数据进行备份处理,以得到音频数据对应的备份数据。
可选的,控制服务可以对音频数据进行处理。例如,控制服务对音频数据进行语音识别处理等。
S303、通过控制服务向应用服务发送备份数据。
可选的,可以通过控制服务在备份数据中确定应用数据,并通过控制服务向应用服务发送备份数据中的应用数据,应用数据为用于进行多媒体信息交互的数据。
可选的,备份数据中包括控制数据和应用数据。控制数据是指需要由控制服务进行处理的数据,应用数据是指需要由应用服务进行处理的数据。
可选的,控制数据可以为备份数据中第一关键词和第二关键词之间的数据。应用数据可以为备份数据中、除控制数据之外的数据。
可选的,第一关键词为触发控制服务对电子设备进行控制的关键词。
可选的,第二关键词为触发控制服务暂停对电子设备进行控制的关键词。
例如,第一关键词可以为“嗨,小度”、“小度小度”、“出来小度”等。
例如,第二关键词可以为“好啦小度”、“可以了小度”、“走吧小度”等。
可选的,可以通过如下可行的方式实现通过控制服务向应用服务发送备份数据中的应用数据:
在控制服务在音频数据中识别到第一关键词后,控制服务暂停向应用服务发送备份数据,在控制服务器在音频数据中识别到第二关键词后,控制服务继续向应用服务发送备份数据。
需要说明的是,向应用服务发送的备份数据为麦克风实时采集的音频数据对应的备份数据。
可选的,在向应用服务和控制服务发送麦克风采集得到的音频数据之后,通过控制服务对音频数据进行语音识别处理;在控制服务在音频数据中识别得到第一关键字之后,通过控制服务根据第一关键字之后的音频数据控制电子设备,直至控制服务在音频数据中识别得到第二关键字之后,暂停控制电子设备。
在图3所示的实施例中,在控制服务对音频数据进行处理(例如语音识别)的过程中,需要对语音数据进行降噪、调节增益等处理,在控制服务队音频数据进行处理之后,导致音频数据的音色、音调等参数发生变化,进而导致音频失真。通过将音频数据的备份数据发送给应用服务,可以避免应用服务接收到的音频失真。
在上述任意一个实施例的基础上,下面,结合图4,对上述方法实施例所示的应用控制方法进行详细说明。
图4为本发明实施例提供的另一种服务控制方法的流程示意图。请参见图4,该方法可以包括:
S401、通过音频通道向控制服务发送麦克风采集得到的音频数据。
S402、通过控制服务获取音频数据对应的备份数据。
需要说明的是,S402的执行过程可以参见S302的执行过程,此处不再进行赘述。
S403、确定电子设备中处于运行状态的应用服务。
需要说明的是,在确定所述电子设备中不存在运行状态的应用服务时,则向所述控制服务发送所述麦克风采集得到的音频数据。即,在电子设备中不存在运行状态的应用服务时,仅向控制服务发送麦克风采集得到的音频数据。
S404、通过控制服务向处于运行状态的应用服务发送备份数据。
S405、通过控制服务对音频数据进行识别处理。
S406、在控制服务在音频数据中识别得到第一关键字之后,暂停通过控制服务向应用服务发送备份数据。
S407、通过控制服务根据第一关键字之后的音频数据对电子设备进行控制。
S408、在控制服务在音频数据中识别得到第二关键字之后,继续通过控制服务向应用服务发送备份数据。
S409、控制服务暂停对电子设备进行控制。
在图4所示的实施例中,在确定电子设备中存在应用服务处于运行状态时,则电子设备向应用服务和控制服务发送麦克风采集得到的音频数据,以使得控制服务可以根据接收到的音频数据对电子设备进行控制,以及使得应用服务可以根据接收到的音频数据进行多媒体信息交互。在上述过程中,在应用服务根据音频数据进行多媒体信息交互的过程中,控制服务依然可以根据音频对电子设备进行控制,提高了对电子设备中的服务进行控制的灵活性。
下面,通过具体示例,对图4实施例所示的方法进行详细说明。
示例性的,假设电子设备为手机,手机中设置有麦克风,控制服务为小度人工智能服务。
在实际应用过程中,麦克风实施例采集音频数据,并向小度人工智能服务发送音频数据。小度人工智能服务对接收到的音频数据进行识别处理。
当用户需要向小明拨打电话时,则用户可以说“小度小度,给小明打电话”,在小度人工智能服务识别得到“小度小度”时,则根据“小度小度”之后的音频数据“给小明打电话”,向小明拨打电话。
在向小明拨打电话之后,由于用户不需要小度人工智能服务对手机进行控制了,则用户可以说“好了小度”,则小度人工智能服务不再对手机进行控制。小度人工智能服务继续接收麦克风实时采集的音频数据,并对接收到的音频数据进行识别处理。
在电话接通之后,小度人工智能服务将接收到的音频数据的备份数据发送给通话服务,通话服务可以将备份数据发送给通话的对方设备。
当用户需要挂断电话时,则用户说“小度小度,挂断电话吧”,在小度人工智能服务识别得到“小度小度”时,则根据“小度小度”之后的音频数据“挂断电话吧”,挂断电话。且在小度人工智能服务识别得到“小度小度”之后,不再向通话服务发送音频数据“挂断电话吧”对应的备份数据。
在挂断电话之后,用户可以说“好了小度”,则小度人工智能服务不再对手机进行控制。在此之后,小度人工智能服务继续接收麦克风实时采集的音频数据,并对接收到的音频数据进行识别处理。
图5为本发明实施例提供的一种服务控制装置的结构示意图。请参见图5,该服务控制装置10可以包括确定模块11和发送模块12,其中,
所述确定模块11用于,确定所述电子设备中处于运行状态的应用服务;
所述发送模块12用于,向所述应用服务和控制服务发送麦克风采集得到的音频数据,所述应用服务用于根据所述音频数据进行多媒体信息交互,所述控制服务用于根据音频数据对所述电子设备进行控制。
本发明实施例提供的服务控制装置可以执行上述方法实施例所示的技术方案,其实现原理以及有益效果类似,此处不再进行赘述。
在一种可能的实施方式中,所述发送模块12具体用于:
通过音频通道向所述控制服务发送所述音频数据;
通过所述控制服务向所述应用服务发送所述音频数据。
在一种可能的实施方式中,所述发送模块12具体用于:
通过所述控制服务获取所述音频数据对应的备份数据,所述备份数据与所述音频数据相同;
通过所述控制服务向所述应用服务发送所述备份数据。
在一种可能的实施方式中,所述发送模块12具体用于:
通过所述控制服务向所述应用服务发送所述备份数据中的应用数据,所述应用数据为用于进行多媒体信息交互的数据。
在一种可能的实施方式中,所述发送模块12具体用于:
在所述控制服务在所述音频数据中识别到第一关键词后,所述控制服务暂停向所述应用服务发送所述备份数据,在所述控制服务器在所述音频数据中识别到第二关键词后,所述控制服务继续向所述应用服务发送所述备份数据。
在一种可能的实施方式中,所述第一关键词为触发所述控制服务对所述电子设备进行控制的关键词,所述第二关键词为触发所述控制服务暂停对所述电子设备进行控制的关键词。
图6为本发明实施例提供的另一种服务控制装置的结构示意图。在图5所示实施例的基础上,请参见图6,该服务控制装置10还可以包括语音识别模块13和控制模块14,其中,
所述语音识别模块13用于,在所述发送模块向所述应用服务和控制服务发送麦克风采集得到的音频数据之后,通过所述控制服务对所述音频数据进行语音识别处理;
所述控制模块14用于,在所述控制服务在所述音频数据中识别得到第一关键字之后,通过所述控制服务根据所述第一关键字之后的音频数据控制所述电子设备,直至所述控制服务在所述音频数据中识别得到第二关键字之后,暂停控制所述电子设备。
在一种可能的实施方式中,所述发送模块12具体用于:
通过第一音频通道向所述应用服务发送所述音频数据;
通过第二音频通道向所述控制服务发送所述音频数据。
在一种可能的实施方式中,所述发送模块12还用于,在确定所述电子设备中不存在运行状态的应用服务时,向所述控制服务发送所述麦克风采集得到的音频数据。
本发明实施例提供的服务控制装置可以执行上述方法实施例所示的技术方案,其实现原理以及有益效果类似,此处不再进行赘述。
图7为本发明实施例提供的服务控制装置的硬件结构示意图,如图7所示,该服务控制装置20包括:至少一个处理器21和存储器22。可选地,该服务控制装置20还包括通信部件23。其中,处理器21、存储器22以及通信部件23通过总线24连接。
在具体实现过程中,至少一个处理器21执行所述存储器22存储的计算机执行指令,使得至少一个处理器21执行如上的服务控制方法。
处理器21的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
在上述图7所示的实施例中,应理解,处理器可以是中央处理单元(英文:CentralProcessing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:DigitalSignal Processor,简称:DSP)、专用集成电路(英文:Application Specific IntegratedCircuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上所述的服务控制方法。
上述的计算机可读存储介质,上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application Specific IntegratedCircuits,简称:ASIC)中。当然,处理器和可读存储介质也可以作为分立组件存在于设备中。
所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (20)

1.一种服务控制方法,其特征在于,包括:
确定所述电子设备中处于运行状态的应用服务;
向所述应用服务和控制服务发送麦克风采集得到的音频数据,所述应用服务用于根据所述音频数据进行多媒体信息交互,所述控制服务用于根据音频数据对所述电子设备进行控制。
2.根据权利要求1所述的方法,其特征在于,所述向所述应用服务和控制服务发送麦克风采集得到的音频数据,包括:
通过音频通道向所述控制服务发送所述音频数据;
通过所述控制服务向所述应用服务发送所述音频数据。
3.根据权利要求2所述的方法,其特征在于,所述通过所述控制服务向所述应用服务发送所述音频数据,包括:
通过所述控制服务获取所述音频数据对应的备份数据,所述备份数据与所述音频数据相同;
通过所述控制服务向所述应用服务发送所述备份数据。
4.根据权利要求3所述的方法,其特征在于,所述通过所述控制服务向所述应用服务发送所述备份数据,包括:
通过所述控制服务向所述应用服务发送所述备份数据中的应用数据,所述应用数据为用于进行多媒体信息交互的数据。
5.根据权利要求4所述的方法,其特征在于,所述通过所述控制服务向所述应用服务发送所述备份数据中的应用数据,包括:
在所述控制服务在所述音频数据中识别到第一关键词后,所述控制服务暂停向所述应用服务发送所述备份数据,在所述控制服务器在所述音频数据中识别到第二关键词后,所述控制服务继续向所述应用服务发送所述备份数据。
6.根据权利要求5所述的方法,其特征在于,所述第一关键词为触发所述控制服务对所述电子设备进行控制的关键词,所述第二关键词为触发所述控制服务暂停对所述电子设备进行控制的关键词。
7.根据权利要求2所述的方法,其特征在于,所述向所述应用服务和控制服务发送麦克风采集得到的音频数据之后,还包括:
通过所述控制服务对所述音频数据进行语音识别处理;
在所述控制服务在所述音频数据中识别得到第一关键字之后,通过所述控制服务根据所述第一关键字之后的音频数据控制所述电子设备,直至所述控制服务在所述音频数据中识别得到第二关键字之后,暂停控制所述电子设备。
8.根据权利要求1所述的方法,其特征在于,所述向所述应用服务和控制服务发送麦克风采集得到的音频数据,包括:
通过第一音频通道向所述应用服务发送所述音频数据;
通过第二音频通道向所述控制服务发送所述音频数据。
9.根据权利要求1-8任一项所述的方法,其特征在于,所述方法还包括:
在确定所述电子设备中不存在运行状态的应用服务时,则向所述控制服务发送所述麦克风采集得到的音频数据。
10.一种服务控制装置,其特征在于,包括确定模块和发送模块,其中,
所述确定模块用于,确定所述电子设备中处于运行状态的应用服务;
所述发送模块用于,向所述应用服务和控制服务发送麦克风采集得到的音频数据,所述应用服务用于根据所述音频数据进行多媒体信息交互,所述控制服务用于根据音频数据对所述电子设备进行控制。
11.根据权利要求10所述的装置,其特征在于,所述发送模块具体用于:
通过音频通道向所述控制服务发送所述音频数据;
通过所述控制服务向所述应用服务发送所述音频数据。
12.根据权利要求11所述的装置,其特征在于,所述发送模块具体用于:
通过所述控制服务获取所述音频数据对应的备份数据,所述备份数据与所述音频数据相同;
通过所述控制服务向所述应用服务发送所述备份数据。
13.根据权利要求11所述的装置,其特征在于,所述发送模块具体用于:
通过所述控制服务向所述应用服务发送所述备份数据中的应用数据,所述应用数据为用于进行多媒体信息交互的数据。
14.根据权利要求13所述的装置,其特征在于,所述发送模块具体用于:
在所述控制服务在所述音频数据中识别到第一关键词后,所述控制服务暂停向所述应用服务发送所述备份数据,在所述控制服务器在所述音频数据中识别到第二关键词后,所述控制服务继续向所述应用服务发送所述备份数据。
15.根据权利要求14所述的装置,其特征在于,所述第一关键词为触发所述控制服务对所述电子设备进行控制的关键词,所述第二关键词为触发所述控制服务暂停对所述电子设备进行控制的关键词。
16.根据权利要求11所述的装置,其特征在于,所述装置还包括语音识别模块和控制模块,其中,
所述语音识别模块用于,在所述发送模块向所述应用服务和控制服务发送麦克风采集得到的音频数据之后,通过所述控制服务对所述音频数据进行语音识别处理;
所述控制模块用于,在所述控制服务在所述音频数据中识别得到第一关键字之后,通过所述控制服务根据所述第一关键字之后的音频数据控制所述电子设备,直至所述控制服务在所述音频数据中识别得到第二关键字之后,暂停控制所述电子设备。
17.根据权利要求10所述的装置,其特征在于,所述发送模块具体用于:
通过第一音频通道向所述应用服务发送所述音频数据;
通过第二音频通道向所述控制服务发送所述音频数据。
18.根据权利要求10-17任一项所述的装置,其特征在于,
所述发送模块还用于,在确定所述电子设备中不存在运行状态的应用服务时,向所述控制服务发送所述麦克风采集得到的音频数据。
19.一种服务控制装置,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至8任一项所述的服务控制方法。
20.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至8任一项所述的服务控制方法。
CN201910025214.7A 2019-01-11 2019-01-11 服务控制方法、装置及设备 Active CN109903763B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201910025214.7A CN109903763B (zh) 2019-01-11 2019-01-11 服务控制方法、装置及设备
US16/667,951 US11211075B2 (en) 2019-01-11 2019-10-30 Service control method, service control apparatus and device
JP2019200534A JP6928638B2 (ja) 2019-01-11 2019-11-05 サービス制御方法、サービス制御装置及びコンピュータ読み取り可能な記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910025214.7A CN109903763B (zh) 2019-01-11 2019-01-11 服务控制方法、装置及设备

Publications (2)

Publication Number Publication Date
CN109903763A true CN109903763A (zh) 2019-06-18
CN109903763B CN109903763B (zh) 2022-02-22

Family

ID=66943581

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910025214.7A Active CN109903763B (zh) 2019-01-11 2019-01-11 服务控制方法、装置及设备

Country Status (3)

Country Link
US (1) US11211075B2 (zh)
JP (1) JP6928638B2 (zh)
CN (1) CN109903763B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102665116A (zh) * 2012-03-30 2012-09-12 广东白云学院 一种基于互联网的视音频传输系统及其视音频流分发方法
CN102763102A (zh) * 2009-10-07 2012-10-31 亚马逊技术股份有限公司 用于数据环境的自服务配置
US8949713B1 (en) * 2008-06-30 2015-02-03 Amazon Technologies, Inc. Version-specific request processing
US20150058447A1 (en) * 2013-08-21 2015-02-26 At&T Intellectual Property I, Lp Method and apparatus for accessing devices and services
CN104615358A (zh) * 2015-02-06 2015-05-13 掌赢信息科技(上海)有限公司 一种应用程序启动方法和电子设备
CN107004411A (zh) * 2014-08-11 2017-08-01 亚马逊技术股份有限公司 话音应用架构
CN107957908A (zh) * 2017-11-20 2018-04-24 深圳创维数字技术有限公司 一种麦克风共享方法、装置、计算机设备及存储介质
CN108302697A (zh) * 2018-01-15 2018-07-20 珠海格力电器股份有限公司 语音控制处理方法及装置
CN108986814A (zh) * 2018-09-04 2018-12-11 出门问问信息科技有限公司 一种唤醒应用服务的方法及装置
CN109151564A (zh) * 2018-09-03 2019-01-04 青岛海信电器股份有限公司 基于麦克风的设备控制方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8374879B2 (en) * 2002-02-04 2013-02-12 Microsoft Corporation Systems and methods for managing interactions from multiple speech-enabled applications
US8886545B2 (en) * 2007-03-07 2014-11-11 Vlingo Corporation Dealing with switch latency in speech recognition
US9794348B2 (en) * 2007-06-04 2017-10-17 Todd R. Smith Using voice commands from a mobile device to remotely access and control a computer
KR101356368B1 (ko) * 2012-02-24 2014-01-29 주식회사 팬택 어플리케이션 전환 장치 및 방법
CN106157955A (zh) * 2015-03-30 2016-11-23 阿里巴巴集团控股有限公司 一种语音控制方法及装置
US11164570B2 (en) * 2017-01-17 2021-11-02 Ford Global Technologies, Llc Voice assistant tracking and activation
CN107122179A (zh) 2017-03-31 2017-09-01 阿里巴巴集团控股有限公司 语音的功能控制方法和装置
US20190013019A1 (en) * 2017-07-10 2019-01-10 Intel Corporation Speaker command and key phrase management for muli -virtual assistant systems
US11211063B2 (en) * 2018-11-27 2021-12-28 Lg Electronics Inc. Multimedia device for processing voice command
US11189279B2 (en) * 2019-05-22 2021-11-30 Microsoft Technology Licensing, Llc Activation management for multiple voice assistants

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949713B1 (en) * 2008-06-30 2015-02-03 Amazon Technologies, Inc. Version-specific request processing
CN102763102A (zh) * 2009-10-07 2012-10-31 亚马逊技术股份有限公司 用于数据环境的自服务配置
CN102665116A (zh) * 2012-03-30 2012-09-12 广东白云学院 一种基于互联网的视音频传输系统及其视音频流分发方法
US20150058447A1 (en) * 2013-08-21 2015-02-26 At&T Intellectual Property I, Lp Method and apparatus for accessing devices and services
CN107004411A (zh) * 2014-08-11 2017-08-01 亚马逊技术股份有限公司 话音应用架构
CN104615358A (zh) * 2015-02-06 2015-05-13 掌赢信息科技(上海)有限公司 一种应用程序启动方法和电子设备
CN107957908A (zh) * 2017-11-20 2018-04-24 深圳创维数字技术有限公司 一种麦克风共享方法、装置、计算机设备及存储介质
CN108302697A (zh) * 2018-01-15 2018-07-20 珠海格力电器股份有限公司 语音控制处理方法及装置
CN109151564A (zh) * 2018-09-03 2019-01-04 青岛海信电器股份有限公司 基于麦克风的设备控制方法及装置
CN108986814A (zh) * 2018-09-04 2018-12-11 出门问问信息科技有限公司 一种唤醒应用服务的方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SHI-HUANG CHEN ET AL: "The Use of Cloud Speech Recognition Technology in Vehicle Diagnosis Applications", 《2011 FIFTH INTERNATIONAL CONFERENCE ON INNOVATIVE MOBILE AND INTERNET SERVICES IN UBIQUITOUS COMPUTING》 *
袁满等: "基于策略的网格应用服务QoS管理模型", 《北京航空航天大学学报》 *

Also Published As

Publication number Publication date
US11211075B2 (en) 2021-12-28
JP6928638B2 (ja) 2021-09-01
US20200227051A1 (en) 2020-07-16
JP2020113968A (ja) 2020-07-27
CN109903763B (zh) 2022-02-22

Similar Documents

Publication Publication Date Title
US10129394B2 (en) Telephonic communication routing system based on customer satisfaction
CN109246672A (zh) 数据传输方法、装置、系统及蓝牙耳机
CN108196821A (zh) 具有连续关键词识别的免提设备
CN101645954A (zh) 终端通信录管理方法和终端设备
CN110457078A (zh) 智能服务方法、装置及设备
CN113240444A (zh) 银行客服坐席推荐方法及装置
US20050278177A1 (en) Techniques for interaction with sound-enabled system or service
CN105955695B (zh) 一种设置智能终端音量的方法及智能终端
EP1889257B1 (en) A method and system for recording an electronic communication and extracting constituent audio data therefrom
CN108696625A (zh) 存储消息
CN109903763A (zh) 服务控制方法、装置及设备
CN108173740A (zh) 一种语音通信的方法和装置
CN110058835A (zh) 设备控制方法、装置及设备
CN112634925B (zh) 一种音频调试的方法、装置及计算机设备
CN112565668B (zh) 一种网络会议共享声音的方法
CN104427287A (zh) 数据处理方法及设备
CN114979344A (zh) 回声消除方法、装置、设备及存储介质
CN110113494A (zh) 录音方法及相关装置
CN110457077A (zh) 智能服务方法、装置及设备
CN109510890A (zh) 一种蓝牙通话内置录音的方法及设备
CN211296772U (zh) 基于统一接口的模块化电话终端
CN115273875A (zh) 一种基于车载安卓系统的音频处理方法和相关装置
CN102055852B (zh) 一种终端设备的适配及支持终端设备适配的方法和终端
CN105592023B (zh) SIPHelloSDK与语音板卡的通话系统和方法
CN116828408A (zh) 基于无线链路的电脑控制手机通信的设备及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210521

Address after: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant after: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Applicant after: Shanghai Xiaodu Technology Co.,Ltd.

Address before: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant