CN111179934A - 选择语音引擎的方法、移动终端和计算机可读存储介质 - Google Patents

选择语音引擎的方法、移动终端和计算机可读存储介质 Download PDF

Info

Publication number
CN111179934A
CN111179934A CN201811340827.1A CN201811340827A CN111179934A CN 111179934 A CN111179934 A CN 111179934A CN 201811340827 A CN201811340827 A CN 201811340827A CN 111179934 A CN111179934 A CN 111179934A
Authority
CN
China
Prior art keywords
voice
engine
speech
user
speech engine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201811340827.1A
Other languages
English (en)
Inventor
王力博
李春林
顾志红
燕立杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qiku Internet Technology Shenzhen Co Ltd
Original Assignee
Qiku Internet Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qiku Internet Technology Shenzhen Co Ltd filed Critical Qiku Internet Technology Shenzhen Co Ltd
Priority to CN201811340827.1A priority Critical patent/CN111179934A/zh
Publication of CN111179934A publication Critical patent/CN111179934A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephone Function (AREA)

Abstract

本申请揭示了一种选择语音引擎的方法、移动终端和计算机可读存储介质,其中方法包括:语音助手判断是否接收到用户发送的语音请求信息;若是,根据所述语音请求信息,从预先与所述语音助手绑定连接的各语音引擎中选择出满足预设条件的指定语音引擎;采用所述指定语音引擎为所述用户提供语音交互服务。本申请在接收到用户当前发送的语音请求信息后,会智能地从预先设置的多个语音引擎中选择出满足预设条件的指定语音引擎来为用户提供优质的语音交互服务,提高了用户的使用体验。

Description

选择语音引擎的方法、移动终端和计算机可读存储介质
技术领域
本申请涉及计算机技术领域,具体涉及一种选择语音引擎的方法、移动终端和计算机可读存储介质。
背景技术
语音助手是一类可以通过语音交互来实现查询与操作的应用程序,通过此类应用程序,可以大大提高在不同场景下操作手机的便利性。现有技术中,语音助手都是单一设置有一个固定语音引擎,在接收到用户发出的语音请求后,由这个固定语音引擎来完成与用户之间的语音交互服务,即先通过该固定语音引擎对用户发出的语音请求进行识别得到识别结果,再执行与该识别结果相对应的操作,以满足用户的意图。由于现有的语音助手不支持多种语音引擎的切换,只能通过单一的固定语音引擎来为用户提供服务,服务单一,缺乏智能性,造成用户的语音交互体验不好。
发明内容
本申请的主要目的为提供一种选择语音引擎的方法、移动终端和计算机可读存储介质,旨在解决由于现有的语音助手只通过单一的固定语音引擎来为用户提供服务,服务单一,缺乏智能性的技术问题。
本申请提出一种选择语音引擎的方法,应用于移动终端,所述方法包括步骤:
语音助手判断是否接收到用户发送的语音请求信息;
若是,根据所述语音请求信息,从预先与所述语音助手绑定连接的各语音引擎中选择出满足预设条件的指定语音引擎;
采用所述指定语音引擎为所述用户提供语音交互服务。
优选地,所述根据所述语音请求信息,从预先与所述语音助手绑定连接的各语音引擎中选择出满足预设条件的指定语音引擎的步骤,包括:
分别采集在第一预设时间周期内,所述用户选择使用各所述语音引擎的使用次数;
对各所述使用次数进行比较,筛选所述使用次数最多的第一语音引擎;
将所述第一语音引擎确定为所述指定语音引擎。
优选地,所述根据所述语音请求信息,从预先与所述语音助手绑定连接的各语音引擎中选择出满足预设条件的指定语音引擎的步骤,包括:
将所述语音请求信息分别发送到各所述语音引擎,以便各所述语音引擎分别对所述语音请求信息进行识别,并分别返回对应于所述语音请求信息的第一识别结果;
将各所述第一识别结果分别推送给所述用户,以便所述用户返回与各所述第一识别结果分别对应的识别置信度,其中所述识别置信度包括所述用户分别对各所述第一识别结果给予的评分;
对各所述识别置信度进行分析统计,筛选所述评分最高的第二语音引擎;
将所述第二语音引擎确定为所述指定语音引擎。
优选地,所述根据所述语音请求信息,从预先与所述语音助手绑定连接的各语音引擎中选择出满足预设条件的指定语音引擎的步骤,包括:
将所述语音请求信息分别发送到各所述语音引擎,以便各所述语音引擎分别对所述语音请求信息进行识别,并分别返回对应于所述语音请求信息的第二识别结果;
分别记录各所述语音引擎返回各所述第二识别结果的响应时间;
对各所述响应时间进行比较,筛选所述响应时间最短的第三语音引擎;
对所述第三语音引擎返回的识别结果的功能性质进行分析,得到分析结果,其中所述功能性质包括本地功能或联网功能;
若所述第三语音引擎返回的识别结果的功能性质为所述本地功能,将所述第三语音引擎确定为所述指定语音引擎。
优选地,所述对所述第三语音引擎返回的识别结果的功能性质进行分析,得到分析结果的步骤之后,包括:
若所述第三语音引擎返回的识别结果的功能性质为所述联网功能,接收各所述语音引擎分别返回的与各所述第二识别结果一一对应的第一反馈信息;
将各所述第一反馈信息推送给所述用户;
接收所述用户返回的从各所述反馈信息中选取的指定反馈信息;
将与所述指定反馈信息对应的第四语音引擎确定为所述指定语音引擎。
优选地,所述对所述第三语音引擎返回的识别结果的功能性质进行分析,得到分析结果的步骤之后,包括:
若所述第三语音引擎返回的识别结果的功能性质为所述联网功能,接收各所述语音引擎分别返回的与各所述第二识别结果一一对应的第二反馈信息;
将各所述第二反馈信息推送给所述用户,以便所述用户根据各所述第二反馈信息分别返回对各所述语音引擎的满意度分值;
根据各所述语音引擎分别对应的所述响应时间,分别生成与各所述响应时间对应的速度分值;
分别统计各所述语音引擎的分值总和,得出分值总和最高的第五语音引擎,其中所述分值总和为每个所述语音引擎的满意度分值与速度分值的加和;
将所述第五语音引擎确定为所述指定语音引擎。
优选地,所述将所述语音请求信息分别发送到各所述语音引擎的步骤之前,包括:
判断所述移动终端当前是否开启了网络服务;
若所述移动终端当前没有开启网络服务,打开所述移动终端的网络服务。
优选地,所述采用所述指定语音引擎为所述用户提供语音交互服务的步骤之前,包括:
断开语音引擎接口与所述指定语音引擎之外的其它语音引擎的连接。
本申请还提供一种移动终端,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本申请中提供的选择语音引擎的方法、移动终端和计算机可读存储介质,具有以下有益效果:
本申请中提供的选择语音引擎的方法、移动终端和计算机可读存储介质,语音助手判断是否接收到用户发送的语音请求信息;若是,根据所述语音请求信息,从预先与所述语音助手绑定连接的各语音引擎中选择出满足预设条件的指定语音引擎;采用所述指定语音引擎为所述用户提供语音交互服务。本申请在接收到用户当前发送的语音请求信息后,会智能地从预先设置的多个语音引擎中选择出满足预设条件的指定语音引擎来为用户提供优质的语音交互服务,提高了用户的使用体验。
附图说明
图1是本申请一实施例的选择语音引擎的方法的流程示意图;
图2是本申请另一实施例的选择语音引擎的方法的流程示意图;
图3是本申请又一实施例的选择语音引擎的方法的流程示意图;
图4是本申请一实施例的移动终端的结构示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用于解释本申请,并不用于限定本申请。
需要说明,本申请实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变,所述的连接可以是直接连接,也可以是间接连接。
参照图1,本申请一实施例的选择语音引擎的方法,应用于移动终端,包括:
S1:语音助手判断是否接收到用户发送的语音请求信息;
S2:若是,根据所述语音请求信息,从预先与所述语音助手绑定连接的各语音引擎中选择出满足预设条件的指定语音引擎;
S3:采用所述指定语音引擎为所述用户提供语音交互服务。
本实施例中,在移动终端内预先设置有多个语音引擎,且上述多个语音引擎均与语音助手建立了连接。当语音助手接收到用户发送的语音请求信息后,会智能地从与语音助手预先绑定连接的各语音引擎中选择出满足预设条件的指定语音引擎,并采用该指定语音引擎来为用户提供语音交互服务,从而实现通过该指定语音引擎来为用户提高优质的语音交互服务,提高用户的使用体验。其中,上述的语音请求信息为用户向语音助手任意发起的语音数据中的第一句话,并且在接收到用户发送的语音请求信息的步骤之前还有唤醒语音助手的过程,即语音助手在采集到用户的唤醒动作后才会进入到工作状态。另外,从预先绑定连接的各语音引擎中选择出满足预设条件的指定语音引擎的方式,具体可包括以下几种:比如,可根据用户对于各个语音引擎的使用情况,先从移动终端内置的多个语音引擎中筛选出用户使用次数最多的第一语音引擎,并根据用户的个人使用习惯将用户最喜欢使用的第一语音引擎作为指定语音识别引擎,来为用户进行语音交互服务;或者通过将接收到的由用户发送的语音请求信息发送到内置的各个语音引擎中,并将各个语音引擎分别返回的对应于该语音请求信息的各识别结果推送给用户,再根据用户返回的与各识别结果对应的各识别置信度,从而选择出识别置信度最高的第二语音引擎作为最优语音识别引擎来为用户进行语音交互服务;或者可通过将用户当前发送的语音请求信息发送到内置的各个语音引擎中,并根据各个语音引擎返回的对于该语音请求信息的各识别结果的速度,从而选择出返回识别结果最快的第三语音引擎作为最优语音识别引擎,来为用户进行语音交互服务;或者可通过将用户当前发送的语音请求信息发送到内置的各个语音引擎中,各个语音引擎会对该语音请求信息进行识别得到各识别结果后,会向语音助手返回与各识别结果相对应的各反馈信息,根据用户从各反馈信息中选择的指定反馈信息,来将与该第一反馈信息相对应的第四语音引擎作为最优语音识别引擎,并为用户进行语音交互服务。处理上述列举的几种方式,还可以通过其它方式来从预先绑定连接的各语音引擎中选择出满足预设条件的指定语音引擎,在此不再赘述。本实施例在接收到用户发送的语音请求信息后,会智能地从预先绑定连接的多个语音引擎中选择出满足预设条件的指定语音引擎来为用户提供优质的语音交互服务,有效地提高了用户的使用体验。
进一步地,本申请一实施例中,上述步骤S2,包括:
S200:分别采集在第一预设时间周期内,所述用户选择使用各所述语音引擎的使用次数;
S201:对各所述使用次数进行比较,筛选所述使用次数最多的第一语音引擎;
S202:将所述第一语音引擎确定为所述指定语音引擎。
本实施例中,在接收到用户当前发送的语音请求信息后,可根据用户对于移动终端内预置的各个语音引擎的使用习惯或使用满意度,智能地从该各个语音引擎中挑选出一个指定语音引擎来为用户提供语音交互服务。具体地,可分别采集在第一预设时间周期内,用户对于各个语音引擎的使用次数,其中第一预设时间周期可根据实际情况或者由用户进行设定,对第一预设时间周期的时间长度也不作限定,例如第一预设时间周期可设为接收到用户发出的语音请求信息之前的一个月内,之后对采集得到的用户分别选择使用各语音引擎的使用次数进行比较,来筛选出使用次数最多的第一语音引擎,并将该第一语音引擎作为上述指定语音引擎。由于该指定语音引擎为用户近段时间使用次数最多的第一语音引擎,也意味着用户可能对该第一语音引擎提供的服务比较信任和满意,因此将该第一语音引擎确定为指定语音引擎,并通过该指定语音引擎来与用户进行语音交互,有利于提供令用户满意的优质的服务,提高用户的使用体验。
参照图2,进一步地,本申请一实施例中,上述步骤S2,包括:
S210:将所述语音请求信息分别发送到各所述语音引擎,以便各所述语音引擎分别对所述语音请求信息进行识别,并分别返回对应于所述语音请求信息的第一识别结果;
S211:将各所述第一识别结果分别推送给所述用户,以便所述用户返回与各所述第一识别结果分别对应的识别置信度,其中所述识别置信度包括所述用户分别对各所述第一识别结果给予的评分;
S212:对各所述识别置信度进行分析统计,筛选所述评分最高的第二语音引擎;
S213:将所述第二语音引擎确定为所述指定语音引擎。
本实施例中,在接收到用户当前发送的语音请求信息后,通过将接收到的由用户发送的语音请求信息发送到内置的各个语音引擎中,并将各个语音引擎分别返回的对应于该语音请求信息的各第一识别结果推送给用户,再根据用户返回的与各第一识别结果分别对应的识别置信度,来智能地从各个语音引擎中挑选出一个识别置信度最高的指定语音引擎来为用户提供语音交互服务,其中,上述识别置信度是指各语音引擎经过识别后得到的识别结果对应于语音请求信息的准确度,形式上可用分数值表示,即用户对于各第一识别结果给予的评分。举例地,如果用户当前发出的语音请求信息为“世界杯怎么样了”,语音引擎A对于该语音请求信息的识别结果为“世界被怎么样了”,语音引擎B对于该语音请求信息的识别结果为“视界被怎么样了”,语音引擎C对于该语音请求信息的识别结果为“世界杯怎么样了”,之后用户会根据语音引擎A、B、C的识别结果的具体内容,来给出它们的识别置信度对应的分数:语音引擎A:85.7分(7个字中识别错了1个字),语音引擎B:71.4分(7个字中识别错了2个字),语音引擎C:100分(7个字都识别正确)。在接收到用户返回的各识别置信度后,通过对各识别置信度进行分析统计,筛选出识别置信度最高的第二语音引擎,并将该第二语音引擎作为指定语音引擎,从而实现选择识别置信度最高的第二语音引擎来与用户进行语音交互,有利于准确识别用户的语音交互信息,并为用户提供精确的服务,提高用户的使用体验。进一步地,筛选评分最高的指定语音引擎的方式还可为:将所述语音请求信息分别发送到各所述语音引擎,以便各所述语音引擎分别对所述语音请求信息进行识别,并分别返回对应于所述语音请求信息的第三识别结果;将各所述第一识别结果分别推送给所述用户,以便用户返回一个指定识别结果,其中该指定识别结果是用户认为识别最准确的结果;接收所述用户返回的所述指定识别结果,将与所述指定识别结果对应的第六语音引擎确定为所述指定语音引擎。
参照图3,进一步地,本申请一实施例中,上述步骤S2,包括:
S220:将所述语音请求信息分别发送到各所述语音引擎,以便各所述语音引擎分别对所述语音请求信息进行识别,并分别返回对应于所述语音请求信息的第二识别结果;
S221:分别记录各所述语音引擎返回各所述第二识别结果的响应时间;
S222:对各所述响应时间进行比较,筛选所述响应时间最短的第三语音引擎;
S223:对所述第三语音引擎返回的识别结果的功能性质进行分析,得到分析结果,其中所述功能性质包括本地功能或联网功能;
S224:若所述第三语音引擎返回的识别结果的功能性质为所述本地功能,将所述第三语音引擎确定为所述指定语音引擎。
本实施例中,在接收到用户当前发送的语音请求信息后,可根据移动终端内预置的各个语音引擎度对于该语音请求信息的各识别效率,智能地从该各个语音引擎中挑选出一个指定语音引擎来为用户提供语音交互服务。具体地,将接收到的语音请求信息分别发送到各个语音引擎,使得各语音引擎对该语音请求信息进行识别,并分别返回对应于该语音请求信息的各第二识别结果,之后分别记录下每个语音引擎返回各第二识别结果的响应时间,再对各响应时间进行比较,筛选出响应时间最短的第三语音引擎,其中,第三语音引擎的响应时间最短代表第三语音引擎将语音请求信息识别为文字信息所花费的时间最少,识别效率最高。之后再对第三语音引擎返回的识别结果的功能性质进行分析,其中该功能性质包括本地功能与联网功能,举例地,如果第一识别结果为“打开蓝牙”,由于打开蓝牙的操作不需要使用到网络资源,则第一识别结果对应为本地功能,如果第一识别结果为“世界杯怎么样了”,由于用户需要了解“世界杯”的情况,则需要使用到网络资源来对“世界杯”的相关内容进行搜索,那么第一识别结果对应为联网功能。在本实施例,当第三语音引擎返回的识别结果的功能性质为本地功能,则直接将响应时间最短的第三语音引擎作为指定语音引擎。在本实施例通过选择响应时间最短,即响应速度最快的第三语音引擎作为指定语音引擎来与用户进行语音交互,有利于提高与用户交互过程中的识别效率,降低与用户的交互时间,提高用户的使用体验。
进一步地,本申请一实施例中,上述步骤S223之后,包括:
S2230:若所述第三语音引擎返回的识别结果的功能性质为所述联网功能,接收各所述语音引擎分别返回的与各所述第二识别结果一一对应的第一反馈信息;
S2231:将各所述第一反馈信息推送给所述用户;
S2232:接收所述用户返回的从各所述反馈信息中选取的指定反馈信息;
S2233:将与所述指定反馈信息对应的第四语音引擎确定为所述指定语音引擎。
本实施例中,当上述第三语音引擎返回的识别结果对应的功能性质为联网功能时,那么在接收到用户当前发送的语音请求信息后,可根据移动终端内预置的各个语音引擎度分别返回的与各所述第二识别结果一一对应的第一反馈信息,智能地从该各个语音引擎中挑选出一个指定语音引擎来为用户提供语音交互服务,其中,各第一反馈信息的生成过程为:各语音引擎根据各自生成的第二识别结果来分析出用户的意图,然后申请网络资源进行意图搜索,来得到与各第二识别结果一一对应的各第一反馈信息。另外,在接收到各语音引擎返回的各第一反馈信息后,通过将该各第一反馈信息推送给用户,以便用户从各第一反馈信息中选择出指定反馈信息,并将与该第一反馈信息对应的第四语音引擎作为指定语音引擎,其中,上述指定反馈信息可以为所有的第一反馈信息中最符合用户自身意图的一个反馈信息。举例地,用户当前发出的语音请求信息为“世界杯怎么样了”,语音引擎A对于该语音请求信息的第一反馈信息为世界杯的最新积分,语音引擎B对于该语音请求信息的第一反馈信息为世界杯的最新赛事转播时间,语音引擎C对于该语音请求信息的第一反馈信息为世界杯的百度百科信息,则用户会根据自身的意图,从语音引擎A、B、C分别返回的第一反馈信息中选择出一个指定反馈信息,例如用户选择的为语音引擎B返回的第一反馈信息,则语音助手会根据用户的选择,智能地将语音引擎B确定为指定语音引擎。在本实施例,通过将与用户选择的指定反馈信息相对应的第四语音引擎作为指定语音引擎,以实现根据用户的兴趣、意图来选择指定语音引擎为用户提供语音交互服务,用利于推送出令用户满意的反馈信息,为用户提供满意的服务,提高用户的使用体验。
进一步地,本申请一实施例中,上述步骤S223之后,包括:
S2240:若所述第三语音引擎返回的识别结果的功能性质为所述联网功能,接收各所述语音引擎分别返回的与各所述第二识别结果一一对应的第二反馈信息;
S2241:将各所述第二反馈信息推送给所述用户,以便所述用户根据各所述第二反馈信息分别返回对各所述语音引擎的满意度分值;
S2242:根据各所述语音引擎分别对应的所述响应时间,分别生成与各所述响应时间对应的速度分值;
S2243:分别统计各所述语音引擎的分值总和,得出分值总和最高的第五语音引擎,其中所述分值总和为每个所述语音引擎的满意度分值与速度分值的加和;
S2244:将所述第五语音引擎确定为所述指定语音引擎。
本实施例中,当上述第一识别结果对应的功能性质为联网功能时,在接收到用户当前发送的语音请求信息后,可根据移动终端内预置的各个语音引擎度返回各第二识别结果的各响应时间以及返回的与各所述第二识别结果一一对应的各第二反馈信息,来智能地从该各个语音引擎中挑选出一个指定语音引擎为用户提供语音交互服务。具体地,在接收到用户当前发出的语音请求信息后,通过分别记录各语音引擎返回各第二识别结果的各响应时间,并自动生成与各响应时间对应的各速度分值,即对各响应时间按时间长度递增的顺序进行排序,并为不同的顺序分配按照第一评分规则分配对应的速度分值,该第一评分规则可根据实际情况进行设置,例如假如总共有3个语音引擎,可为排序第一的响应时间对应的语音引擎D分配3分,为排序第二的响应时间对应的语音引擎E分配2分,为排序第三的响应时间对应的语音引擎F分配1分。另外,在接收到各语音引擎返回的各第二反馈信息后,将该各第二反馈信息推送给用户,以便用户返回与各第二反馈信息相对应的满意度分值,其中,可按照第二评分规则分配与各第二反馈信息对应的各满意度分值,该第二评分规则可根据实际情况进行设置,优选满意度分值的设置占比重大于上述速度分值,例如满意度分值的数值范围与速度分值的数值范围之间的比例设为3:1,结合本实施例提到的上述例子,假如语音引擎E的反馈信息完全符合用户意图,将语音引擎E对应的满意度分值设为9分,假如语音引擎D的反馈信息比较符合用户意图,将语音引擎D对应的满意度分值设为6分,假如语音引擎F的反馈信息不太符合用户意图,将语音引擎F对应的满意度分值设为3分。进一步地,在获取了每一个语音引擎的速度分值和满意度分值后,分别统计各语音引擎的分值总和,其中分值总和为每个语音引擎的满意度分值与速度分值的加和,最后将分值总和最高的第五语音引擎作为指定语音引擎。如上述例子,可求出语音引擎D的分值总和为9分,语音引擎E的分值总和为11分,语音引擎D的分值总和为4分,则将分值总和最高的语音引擎E作为指定语音引擎来为用户提供服务。在本实施例,综合考虑了各语音引擎返回各第二识别结果的速度以及各语音引擎返回各第二反馈信息的信息准确度,将分值总和最高对应的第五语音引擎确定为指定识别引擎,从而实现选取了识别效率快且反馈信息准确的第五语音引擎来为用户提高优质的服务,提高用户的使用体验。
进一步地,本申请一实施例中,上述步骤S210或S220之后,包括:
S230:判断所述移动终端当前是否开启了网络服务;
S231:若所述移动终端当前没有开启网络服务,打开所述移动终端的网络服务。
本实施例中,当接收到用户发出的语音请求信息后,如果语音助手当前处于无网络连接的状态,则语音助手会无法对上述语音请求信息进行处理,即在用户向语音助手发出语音请求信息后,无法得到语音助手的回应或服务,造成用户的使用体验不好。因此在语音助手将接收到的语音请求信息分别发送到各语音引擎的步骤之前,需要先确保移动终端当前处于有网络连接的状态。具体地,首先会对移动终端当前是否开启了网络服务进行判断,即来判断移动终端当前是否成功开启了数据服务或者是否成功连接了无线网络等。如果移动终端当前没有开启网络服务,即移动终端无法正常访问网络,为了使各语音引擎能顺利完成后续与上述语音请求信息对应的操作,语音助手会智能地打开移动终端的网络服务,以使得各语音引擎能够在具有网络连接的环境下完成对语音请求信息以及用户后续发出的语音数据的识别,并且各语音引擎也能够通过申请网络资源进行与语音请求信息相对应的网络搜索,其中上述打开移动终端的网络服务的方式可为语音助手向移动终端发出了一个开启网络服务的指定,或者为其它的方式,在此不一一列举。在本实施例,通过检测移动终端是否开启了网络服务,并在移动终端处于无网络连接的状态下智能地开启其网络服务,有利于各语音引擎能顺利完成后续与上述语音请求信息对应的操作,而不会出现各语音引擎由于没有网络服务而导致无法为用户提供服务的情况,有效地保证了用户的使用体验。
进一步地,本申请一实施例中,上述步骤S3之前,包括:
S300:断开语音引擎接口与所述指定语音引擎之外的其它语音引擎的连接。
本实施例中,移动终端内置的所有语音引擎都是使用统一的语音引擎接口进行封装的,且语音助手是通过上述语音引擎接口与各语音引擎建立连接的。语音助手在接收到用户当前发出的语音请求信息后,会通过该语音引擎接口将该语音请求信息发送到每一个语音引擎,以使得各语音引擎能够同时接收到该语音请求信息,并分别对该语音请求信息进行识别以生成对应的多个识别结果。在从预先与移动终端均连接的各语音引擎中选择出满足预设条件的指定语音引擎后,断开语音引擎接口与该指定语音引擎之外的其它语音引擎的连接,即只保留下语音引擎接口与指定语音引擎建立的连接,并只通过该指定语音引擎为用户提供语音交互服务,从而有效地减少上述其它语音引擎的资源消耗。
参照图4,本申请实施例中还提供一种移动终端,该移动终端可以是服务器,其内部结构可以如图4所示。该移动终端包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该移动终端设计的处理器用于提供计算和控制能力。该移动终端的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该移动终端的数据库用于存储语音请求信息等数据。该移动终端的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种选择语音引擎的方法。
上述处理器执行上述选择语音引擎的方法的步骤:
语音助手判断是否接收到用户发送的语音请求信息;
若是,根据所述语音请求信息,从预先与所述语音助手绑定连接的各语音引擎中选择出满足预设条件的指定语音引擎;
采用所述指定语音引擎为所述用户提供语音交互服务。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的移动终端的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种选择语音引擎的方法,具体为:
语音助手判断是否接收到用户发送的语音请求信息;
若是,根据所述语音请求信息,从预先与所述语音助手绑定连接的各语音引擎中选择出满足预设条件的指定语音引擎;
采用所述指定语音引擎为所述用户提供语音交互服务。
综上所述,本申请实施例中提供的选择语音引擎的方法、移动终端和计算机可读存储介质,语音助手判断是否接收到用户发送的语音请求信息;若是,根据所述语音请求信息,从预先与所述语音助手绑定连接的各语音引擎中选择出满足预设条件的指定语音引擎;采用所述指定语音引擎为所述用户提供语音交互服务。本申请在接收到用户当前发送的语音请求信息后,会智能地从预先设置的多个语音引擎中选择出满足预设条件的指定语音引擎来为用户提供优质的语音交互服务,提高了用户的使用体验。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种选择语音引擎的方法,其特征在于,应用于移动终端,包括:
语音助手判断是否接收到用户发送的语音请求信息;
若是,根据所述语音请求信息,从预先与所述语音助手绑定连接的各语音引擎中选择出满足预设条件的指定语音引擎;
采用所述指定语音引擎为所述用户提供语音交互服务。
2.根据权利要求1所述的选择语音引擎的方法,其特征在于,所述根据所述语音请求信息,从预先与所述语音助手绑定连接的各语音引擎中选择出满足预设条件的指定语音引擎的步骤,包括:
分别采集在第一预设时间周期内,所述用户选择使用各所述语音引擎的使用次数;
对各所述使用次数进行比较,筛选所述使用次数最多的第一语音引擎;
将所述第一语音引擎确定为所述指定语音引擎。
3.根据权利要求1所述的选择语音引擎的方法,其特征在于,所述根据所述语音请求信息,从预先与所述语音助手绑定连接的各语音引擎中选择出满足预设条件的指定语音引擎的步骤,包括:
将所述语音请求信息分别发送到各所述语音引擎,以便各所述语音引擎分别对所述语音请求信息进行识别,并分别返回对应于所述语音请求信息的第一识别结果;
将各所述第一识别结果分别推送给所述用户,以便所述用户返回与各所述第一识别结果分别对应的识别置信度,其中所述识别置信度包括所述用户分别对各所述第一识别结果给予的评分;
对各所述识别置信度进行分析统计,筛选所述评分最高的第二语音引擎;
将所述第二语音引擎确定为所述指定语音引擎。
4.根据权利要求1所述的选择语音引擎的方法,其特征在于,所述根据所述语音请求信息,从预先与所述语音助手绑定连接的各语音引擎中选择出满足预设条件的指定语音引擎的步骤,包括:
将所述语音请求信息分别发送到各所述语音引擎,以便各所述语音引擎分别对所述语音请求信息进行识别,并分别返回对应于所述语音请求信息的第二识别结果;
分别记录各所述语音引擎返回各所述第二识别结果的响应时间;
对各所述响应时间进行比较,筛选所述响应时间最短的第三语音引擎;
对所述第三语音引擎返回的识别结果的功能性质进行分析,得到分析结果,其中所述功能性质包括本地功能或联网功能;
若所述第三语音引擎返回的识别结果的功能性质为所述本地功能,将所述第三语音引擎确定为所述指定语音引擎。
5.根据权利要求4所述的选择语音引擎的方法,其特征在于,所述对所述第三语音引擎返回的识别结果的功能性质进行分析,得到分析结果的步骤之后,包括:
若所述第三语音引擎返回的识别结果的功能性质为所述联网功能,接收各所述语音引擎分别返回的与各所述第二识别结果一一对应的第一反馈信息;
将各所述第一反馈信息推送给所述用户;
接收所述用户返回的从各所述反馈信息中选取的指定反馈信息;
将与所述指定反馈信息对应的第四语音引擎确定为所述指定语音引擎。
6.根据权利要求4所述的选择语音引擎的方法,其特征在于,所述对所述第三语音引擎返回的识别结果的功能性质进行分析,得到分析结果的步骤之后,包括:
若所述第三语音引擎返回的识别结果的功能性质为所述联网功能,接收各所述语音引擎分别返回的与各所述第二识别结果一一对应的第二反馈信息;
将各所述第二反馈信息推送给所述用户,以便所述用户根据各所述第二反馈信息分别返回对各所述语音引擎的满意度分值;
根据各所述语音引擎分别对应的所述响应时间,分别生成与各所述响应时间对应的速度分值;
分别统计各所述语音引擎的分值总和,得出分值总和最高的第五语音引擎,其中所述分值总和为每个所述语音引擎的满意度分值与速度分值的加和;
将所述第五语音引擎确定为所述指定语音引擎。
7.根据权利要求3或4所述的选择语音引擎的方法,其特征在于,所述将所述语音请求信息分别发送到各所述语音引擎的步骤之前,包括:
判断所述移动终端当前是否开启了网络服务;
若所述移动终端当前没有开启网络服务,打开所述移动终端的网络服务。
8.根据权利要求1所述的选择语音引擎的方法,其特征在于,所述采用所述指定语音引擎为所述用户提供语音交互服务的步骤之前,包括:
断开语音引擎接口与所述指定语音引擎之外的其它语音引擎的连接。
9.一种移动终端,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
CN201811340827.1A 2018-11-12 2018-11-12 选择语音引擎的方法、移动终端和计算机可读存储介质 Withdrawn CN111179934A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811340827.1A CN111179934A (zh) 2018-11-12 2018-11-12 选择语音引擎的方法、移动终端和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811340827.1A CN111179934A (zh) 2018-11-12 2018-11-12 选择语音引擎的方法、移动终端和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN111179934A true CN111179934A (zh) 2020-05-19

Family

ID=70648077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811340827.1A Withdrawn CN111179934A (zh) 2018-11-12 2018-11-12 选择语音引擎的方法、移动终端和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111179934A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111798830A (zh) * 2020-07-07 2020-10-20 云知声智能科技股份有限公司 婴儿安抚机器人及基于婴儿安抚机器人的安抚方法
CN111862972A (zh) * 2020-07-08 2020-10-30 北京梧桐车联科技有限责任公司 语音交互服务方法、装置、设备及存储介质
CN111933132A (zh) * 2020-07-13 2020-11-13 深圳市优必选科技股份有限公司 语音识别方法、系统、终端设备及计算机可读存储介质
CN113114546A (zh) * 2021-04-15 2021-07-13 北京蓦然认知科技有限公司 一种动态构建语音处理能力列表的方法及装置
CN113593535A (zh) * 2021-06-30 2021-11-02 青岛海尔科技有限公司 语音数据的处理方法及装置、存储介质、电子装置
CN113593535B (zh) * 2021-06-30 2024-05-24 青岛海尔科技有限公司 语音数据的处理方法及装置、存储介质、电子装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050240404A1 (en) * 2004-04-23 2005-10-27 Rama Gurram Multiple speech recognition engines
CN101021899A (zh) * 2007-03-16 2007-08-22 南京搜拍信息技术有限公司 综合利用人脸及人体辅助信息的交互式人脸识别系统及方法
CN103117058A (zh) * 2012-12-20 2013-05-22 四川长虹电器股份有限公司 基于智能电视平台的多语音引擎切换系统及方法
CN103853703A (zh) * 2014-02-19 2014-06-11 联想(北京)有限公司 一种信息处理方法及电子设备
CN104795069A (zh) * 2014-01-21 2015-07-22 腾讯科技(深圳)有限公司 语音识别方法和服务器
CN106601257A (zh) * 2016-12-31 2017-04-26 联想(北京)有限公司 一种声音识别方法、设备和第一电子设备
CN107171874A (zh) * 2017-07-21 2017-09-15 维沃移动通信有限公司 一种语音引擎切换方法、移动终端及服务器
CN107452378A (zh) * 2017-08-15 2017-12-08 北京百度网讯科技有限公司 基于人工智能的语音交互方法和装置
US20180211669A1 (en) * 2017-01-26 2018-07-26 Essence, Inc Speech Recognition Based on Context and Multiple Recognition Engines

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050240404A1 (en) * 2004-04-23 2005-10-27 Rama Gurram Multiple speech recognition engines
CN101021899A (zh) * 2007-03-16 2007-08-22 南京搜拍信息技术有限公司 综合利用人脸及人体辅助信息的交互式人脸识别系统及方法
CN103117058A (zh) * 2012-12-20 2013-05-22 四川长虹电器股份有限公司 基于智能电视平台的多语音引擎切换系统及方法
CN104795069A (zh) * 2014-01-21 2015-07-22 腾讯科技(深圳)有限公司 语音识别方法和服务器
CN103853703A (zh) * 2014-02-19 2014-06-11 联想(北京)有限公司 一种信息处理方法及电子设备
CN106601257A (zh) * 2016-12-31 2017-04-26 联想(北京)有限公司 一种声音识别方法、设备和第一电子设备
US20180211669A1 (en) * 2017-01-26 2018-07-26 Essence, Inc Speech Recognition Based on Context and Multiple Recognition Engines
CN107171874A (zh) * 2017-07-21 2017-09-15 维沃移动通信有限公司 一种语音引擎切换方法、移动终端及服务器
CN107452378A (zh) * 2017-08-15 2017-12-08 北京百度网讯科技有限公司 基于人工智能的语音交互方法和装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111798830A (zh) * 2020-07-07 2020-10-20 云知声智能科技股份有限公司 婴儿安抚机器人及基于婴儿安抚机器人的安抚方法
CN111862972A (zh) * 2020-07-08 2020-10-30 北京梧桐车联科技有限责任公司 语音交互服务方法、装置、设备及存储介质
CN111862972B (zh) * 2020-07-08 2023-11-14 北京梧桐车联科技有限责任公司 语音交互服务方法、装置、设备及存储介质
CN111933132A (zh) * 2020-07-13 2020-11-13 深圳市优必选科技股份有限公司 语音识别方法、系统、终端设备及计算机可读存储介质
CN113114546A (zh) * 2021-04-15 2021-07-13 北京蓦然认知科技有限公司 一种动态构建语音处理能力列表的方法及装置
CN113593535A (zh) * 2021-06-30 2021-11-02 青岛海尔科技有限公司 语音数据的处理方法及装置、存储介质、电子装置
WO2023273776A1 (zh) * 2021-06-30 2023-01-05 青岛海尔科技有限公司 语音数据的处理方法及装置、存储介质、电子装置
CN113593535B (zh) * 2021-06-30 2024-05-24 青岛海尔科技有限公司 语音数据的处理方法及装置、存储介质、电子装置

Similar Documents

Publication Publication Date Title
CN111179934A (zh) 选择语音引擎的方法、移动终端和计算机可读存储介质
CN106503236B (zh) 基于人工智能的问题分类方法以及装置
CN107169034B (zh) 一种多轮人机交互的方法及系统
EP3306867A1 (en) Auto-response method, apparatus and device, and computer-readable storage medium
CN109254669A (zh) 一种表情图片输入方法、装置、电子设备及系统
CN110689881B (zh) 语音识别方法、装置、计算机设备和存储介质
CN110992937B (zh) 语言离线识别方法、终端及可读存储介质
CN111581375A (zh) 对话意图类型识别方法、多轮对话方法、装置及计算设备
CN110347810B (zh) 对话式检索回答方法、装置、计算机设备及存储介质
US20090100340A1 (en) Associative interface for personalizing voice data access
CN112905939A (zh) Html5页面资源的加载方法、装置、设备及存储介质
CN113806503A (zh) 一种对话融合方法和装置及设备
CN113139667A (zh) 基于人工智能的酒店房间推荐方法、装置、设备及存储介质
CN111738774A (zh) 识别潜在目标用户的方法、装置、计算机设备和存储介质
KR20210095609A (ko) 회의록 열람 문서 생성 방법 및 그 장치
CN112052316A (zh) 模型评估方法、装置、存储介质及电子设备
CN109684443B (zh) 智能交互方法和装置
CN113779214B (zh) 跳转条件的自动生成方法、装置、计算机设备及存储介质
CN111243593A (zh) 语音识别纠错方法、移动终端和计算机可读存储介质
CN107894882B (zh) 一种移动终端的语音输入方法
CN111028841B (zh) 唤醒系统调节参数的方法、装置、计算机设备和存储介质
CN111225115B (zh) 信息提供方法及装置
CN115293389A (zh) 预订车辆的方法、装置、设备以及存储介质
CN115294979A (zh) 用于减少语音响应时间的方法、装置、存储介质和语音设备
CN111399910B (zh) 用户指令的处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20200519