WO2019047220A1 - 一种应用程序启动方法及终端、计算机可读存储介质 - Google Patents

一种应用程序启动方法及终端、计算机可读存储介质 Download PDF

Info

Publication number
WO2019047220A1
WO2019047220A1 PCT/CN2017/101254 CN2017101254W WO2019047220A1 WO 2019047220 A1 WO2019047220 A1 WO 2019047220A1 CN 2017101254 W CN2017101254 W CN 2017101254W WO 2019047220 A1 WO2019047220 A1 WO 2019047220A1
Authority
WO
WIPO (PCT)
Prior art keywords
application
rhythm
voice signal
speech signal
feature
Prior art date
Application number
PCT/CN2017/101254
Other languages
English (en)
French (fr)
Inventor
杨鑫贵
Original Assignee
深圳传音通讯有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 深圳传音通讯有限公司 filed Critical 深圳传音通讯有限公司
Priority to PCT/CN2017/101254 priority Critical patent/WO2019047220A1/zh
Publication of WO2019047220A1 publication Critical patent/WO2019047220A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/725Cordless telephones

Definitions

  • the present application relates to the field of communications technologies, and in particular, to an application startup method, a terminal, and a computer readable storage medium.
  • the present application provides an application startup method and terminal, and a computer readable storage medium.
  • the present application provides an application startup method, which is used in a terminal.
  • the application startup method includes the steps of:
  • the method further includes the following steps: [0024] if the terminal is currently in a blackout state, the terminal is unlocked.
  • the application corresponding to the rhythm feature that starts the voice signal comprises:
  • the performing the identification process on the acquired voice signal, and obtaining the feature information of the voice signal specifically includes [0028]
  • the acquired speech signal is subjected to recognition processing by a fuzzy speech recognition method to obtain speech signal characteristic information.
  • the present application further provides a terminal, where the terminal includes: a memory, a processor, and an application startup program stored on the memory and executable on the processor, the application startup program The step of implementing the application launching method of any one of claims 1 to 8 by the processor.
  • the present application further provides a computer readable storage medium, wherein the computer readable storage medium stores an application launching program, the application launching program being executed by a processor, and implementing the claims 1 to 8 The steps of the application launch method of any of the above.
  • An application startup method, a terminal, and a computer readable storage medium provided by the embodiment of the present application determine a rhythm characteristic of a voice signal by using a voice signal feature information obtained by the recognition process, and start according to a rhythm feature of the voice signal.
  • the application; launching the application is quick and easy, increases the efficiency of information interaction, and improves the user experience.
  • FIG. 1 is a schematic flowchart of an application startup method according to an embodiment of the present invention
  • FIG. 2 is a schematic diagram of a matching process in an application startup method according to an embodiment of the present invention
  • FIG. 3 is a schematic diagram of a process of determining whether a preset error range is within an application startup method according to an embodiment of the present invention
  • FIG. 4 is a schematic diagram of determining whether a program launch permission flow is in an application startup method according to an embodiment of the present invention
  • FIG. 5 is a schematic structural diagram of a terminal according to an embodiment of the present invention.
  • the terminal can be implemented in various forms.
  • the terminal described in the present invention may include, for example, a mobile phone, a tablet, a notebook, a palmtop, a personal digital assistant (Personal Digital)
  • PDAs portable media players
  • PMPs portable media players
  • navigation devices wearable devices
  • wearable devices smart bracelets
  • pedometers other mobile terminals
  • fixed terminals such as digital TVs, desktop computers.
  • a mobile terminal will be taken as an example, and those skilled in the art will understand that the configuration according to an embodiment of the present invention can be applied to a fixed type, in addition to an element particularly for mobile purposes. terminal.
  • a first embodiment of the present invention provides an application startup method, where the method is used in a terminal, and the application startup method includes the following steps:
  • the path for acquiring the voice signal is not limited herein.
  • the voice signal may be a voice file pre-stored in the terminal memory.
  • the voice signal may also be a voice signal input immediately, for example: after the terminal is unlocked
  • the terminal After detecting the voice input, the terminal acquires the voice signal input by the user, and processes the voice signal, such as: noise removal, amplification, and the like.
  • the voice signal may also be a voice signal input according to a user's recording instruction. For example, after the user selects an application, an application selection trigger command is generated, and the microphone is received, and the voice signal output by the user is received.
  • the signal can be the name of the application, or other user-defined voices, such as "monkey”, “tiger", “wife”, “Darling”, etc., which makes it easier to remember and makes the voice more vivid.
  • the acquired voice signal can be identified by using a speech recognition method known in the prior art.
  • the speech signal may be decoded using a search algorithm (e.g., a viterbi algorithm) to obtain a recognition result.
  • a search algorithm e.g., a viterbi algorithm
  • Acoustic models and language models are required during the decoding process.
  • the acoustic model used in this step can be stored in the external acoustic model storage of the system.
  • the acoustic model can be a context-independent hidden independent HMM and has a Gaussian mixture distribution in each state.
  • the language model includes a dictionary for speech recognition and a grammar for speech recognition.
  • a dictionary for speech recognition may be stored in an external dictionary storage device, and a syntax for speech recognition may be stored in an external grammar storage device.
  • the performing the identification processing on the acquired voice signal, and obtaining the voice signal feature information specifically includes:
  • the acquired speech signal is subjected to recognition processing by a fuzzy speech recognition method to obtain speech signal characteristic information.
  • the name of the song is not limited, and the voice recognition technology can be used to identify Whether the child has a singing motion or not can make a fuzzy judgment.
  • the fuzzy speech recognition technology used in the speech recognition process can refer to the prior art.
  • the tempo feature may be used to describe the similarity of the duration of the speech signal and/or to describe the similarity of the energy variation of the speech signal.
  • the cadence feature may include at least one of the following features: a speech signal corresponding to two consecutive non-command words (ie, at least two pairs of non-command words and short pauses) Average length between the two; a continuous variance of the speech signal corresponding to the at least two consecutive non-command words; an autocorrelation of the energy variation of the speech signal corresponding to the normalized at least two consecutive non-command words a maximum value; a fundamental frequency (F0) of the speech signal corresponding to the at least two consecutive non-command words; and an energy of the speech signal corresponding to the at least two consecutive non-command words.
  • a speech signal corresponding to two consecutive non-command words ie, at least two pairs of non-command words and short pauses
  • Average length between the two a continuous variance of the speech signal corresponding to the at least two consecutive non-command words
  • an autocorrelation of the energy variation of the speech signal corresponding to the normalized at least two consecutive non-command words a maximum value
  • the application corresponding to the tempo feature of the voice signal is: [0060] enabling or disabling an application corresponding to a tempo feature of the voice signal; or controlling the voice signal The running parameters of the application corresponding to the rhythm feature.
  • the smartphone may initiate a call to Zhang San, that is, start the phone application.
  • Zhang San that is, start the phone application.
  • a smartphone plays music through a headset, it can control the "previous, next, volume, and volume” by voice signal.
  • the step of starting the application corresponding to the rhythm feature of the voice signal further includes the following steps:
  • the terminal is controlled to unlock, thereby preventing the user from manually unlocking, which is more convenient for the user to use the terminal.
  • the applying, according to the determined rhythm feature of the voice signal, the application corresponding to the rhythm feature of the voice signal includes the following steps:
  • the method further includes the steps of:
  • the rhythm feature of the preset voice signal may be associated with the application by establishing a mapping table.
  • the mapping table stores the rhythm feature of the voice signal and the name of the corresponding application, thereby realizing the association between the rhythm feature of the voice signal and the application.
  • the rhythm feature of the preset voice signal is associated with the short message application; after the voice signal is acquired, and the terminal obtains the rhythm feature of the voice signal from the voice signal, the rhythm feature of the obtained voice signal is Matching the rhythm characteristics of the preset speech signal; if the resulting speech signal is rhythmic
  • the SMS application is launched.
  • the applying, according to the determined rhythm feature of the voice signal, the application corresponding to the rhythm feature of the voice signal includes the following steps:
  • [0074] 151 determining whether the determined rhythm feature of the voice signal and the rhythm feature of the preset voice signal are within a preset error range;
  • the method further includes the steps of:
  • the rhythm feature of the preset voice signal may be associated with the application by establishing a mapping table.
  • the mapping table stores the rhythm feature of the voice signal and the name of the corresponding application, thereby realizing the association between the rhythm feature of the voice signal and the application.
  • the rhythm feature of the preset voice signal may not be exactly the same; Therefore, the rhythm characteristic of the obtained speech signal has a certain error with the rhythm characteristic of the preset speech signal, and as long as the error is within a certain range, it can be determined that the rhythm characteristic of the obtained speech signal is consistent with the rhythm characteristic of the preset speech signal. Then, according to the mapping relationship between the rhythm feature of the preset voice signal and the application, the corresponding application can be started.
  • the rhythm feature according to the determined speech signal is the rhythm feature according to the determined speech signal
  • the application corresponding to the rhythm feature of the voice signal is initiated, including the steps of:
  • the tempo feature of the preset voice signal may be associated with an application program, and after acquiring the voice signal, the terminal obtains the tempo feature of the voice signal from the voice signal, and according to the voice signal The rhythm feature is compared with the rhythm feature of the voice signal obtained by presetting the user usage authority, determining whether the user has the access right to access the application, and if the user has the usage right, starting the application; If you do not have permission to use, do not process or display permission information to the end user.
  • the smartphone associates the rhythm feature of User A's voice signal with an album application.
  • An application startup method determines a rhythm feature of a voice signal by using the voice signal feature information obtained by the recognition process, and starts an application according to the rhythm feature of the voice signal; , which increases the efficiency of information interaction and improves the user experience.
  • FIG. 5 is a diagram of a terminal according to a second embodiment of the present invention.
  • the terminal 20 includes: a memory 21, a processor 22, and a memory 21 and may be stored on the processor 22.
  • a running application launcher the application launcher being executed by the processor, for implementing the steps of the application launch method described below:
  • the application launching program is executed by the processor 22, and is also used to implement the steps of the application starting method described below:
  • the application launching program is executed by the processor 22, and is also used to implement the steps of the application launching method described below:
  • the application launching program is executed by the processor 22, and is also used to implement the steps of the application startup method described below:
  • the application launching program is executed by the processor 22, and is also used to implement the steps of the application startup method described below:
  • the application launching program is executed by the processor 22, and is also used to implement the steps of the application startup method described below:
  • the application launching program is executed by the processor 22, and is also used to implement the steps of the application starting method described below:
  • the application launching program is executed by the processor 22, and is also used to implement the steps of the application starting method described below:
  • the acquired speech signal is subjected to recognition processing by a fuzzy speech recognition method to obtain speech signal characteristic information.
  • a terminal provided by the embodiment of the present invention determines a rhythm feature of a voice signal by using feature information of the voice signal obtained by the recognition process, and starts an application according to the rhythm feature of the voice signal;
  • the program is convenient and fast, which increases the efficiency of information interaction and improves the user experience.
  • a third embodiment of the present invention provides a computer readable storage medium, where the computer readable storage medium stores an application startup program, and the application startup program is executed by a processor to implement the first embodiment. The steps of the application launch method described.
  • the computer readable storage medium provided by the embodiment of the present invention determines the rhythm feature of the voice signal by using the voice signal feature information obtained by the recognition process, and starts the application according to the tempo feature of the voice signal; starting the application program is convenient and fast. Increased the efficiency of information interaction and improved user experience.
  • the technical solution of the present invention which is essential or contributes to the prior art, may be embodied in the form of a software product stored in a storage medium (such as ROM/RAM, disk,
  • a storage medium such as ROM/RAM, disk
  • the optical disc includes a number of instructions for causing a terminal (which may be a cell phone, a computer, a server, an air conditioner, or a network device, etc.) to perform the methods described in various embodiments of the present invention.
  • An application startup method, a terminal, and a computer readable storage medium provided by an embodiment of the present invention
  • the feature information of the speech signal obtained by the recognition process is determined, and the rhythm feature of the speech signal is determined, and the application program is started according to the rhythm feature of the speech signal; the application is started quickly and conveniently, the interaction efficiency of the information is increased, and the user experience is improved.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

一种应用程序启动方法及终端、计算机可读存储介质,所述方法包括步骤:获取语音信号(11);对获取的语音信号进行识别处理,得到语音信号特征信息(12);根据识别处理得到的语音信号特征信息,确定语音信号的节奏特征(13);根据确定的语音信号的节奏特征,启动所述语音信号的节奏特征对应的应用程序(14)。上述方法及终端、计算机可读存储介质,通过对识别处理得到的语音信号特征信息,确定语音信号的节奏特征,并根据语音信号的节奏特征启动应用程序;启动应用程序方便快捷,增加了信息的交互效率,提升了用户体验。

Description

一种应用程序启动方法及终端、 计算机可读存储介质 技术领域
[0001] 本申请涉及通信技术领域, 尤其涉及一种应用程序启动方法及终端、 计算机可 读存储介质。
背景技术
[0002] 随着通信技术的发展, 应用幵发者幵发出了适用于手机、 平板电脑等智能终端 设备中的各种功能丰富的应用程序, 例如, 即吋通讯工具、 音频播放器、 视频 播放器、 日历工具等等, 给人们的生活带来许多便利。
[0003] 在使用智能终端设备的过程中, 通常会遇到正在使用一个应用程序吋需要幵启 另一个应用程序的情况, 例如, 用户正在浏览网页吋, 又想播放音乐, 通常的 做法是: 将当前正在运行的应用程序退回到后台运行或者直接关闭, 然后返回 到桌面再打幵新的应用程序, 若此吋想继续运行原来的应用程序, 则需要将新 应用程序退回到后台运行或者直接关闭, 并返回到桌面再打幵原来运行的应用 程序。 在使用过程中发现, 通过上述方法启动应用程序不仅不够方便快捷, 且 具有一定的局限性, 降低了信息的交互效率。
技术问题
[0004] 现有的智能终端设备, 在启动应用程序不仅不够方便快捷, 且具有一定的局限 性, 降低了信息的交互效率。
问题的解决方案
技术解决方案
[0005] 针对上述技术问题, 本申请提供一种应用程序启动方法及终端、 计算机可读存 储介质。
[0006] 为解决上述技术问题, 本申请提供一种应用程序启动方法, 该方法用于终端中
, 其中, 所述应用程序启动方法包括步骤:
[0007] 获取语音信号;
[0008] 对获取的语音信号进行识别处理, 得到语音信号特征信息; [0009] 根据识别处理得到的语音信号特征信息, 确定语音信号的节奏特征;
[0010] 根据确定的语音信号的节奏特征, 启动所述语音信号的节奏特征对应的应用程 序。
[0011] 其中, 所述根据确定的语音信号的节奏特征, 启动所述语音信号的节奏特征对 应的应用程序包括步骤:
[0012] 将确定的语音信号的节奏特征与预设的语音信号的节奏特征进行匹配;
[0013] 若匹配成功, 则启动所述语音信号的节奏特征对应的应用程序。
[0014] 其中, 所述根据确定的语音信号的节奏特征, 启动所述语音信号的节奏特征对 应的应用程序包括步骤:
[0015] 判断确定的语音信号的节奏特征与预设的语音信号的节奏特征是否在预设的误 差范围内;
[0016] 若确定的语音信号的节奏特征与预设的语音信号的节奏特征在预设的误差范围 内, 则启动所述语音信号的节奏特征对应的应用程序。
[0017] 其中, 所述方法还包括步骤:
[0018] 获取所述预设的语音信号的节奏特征;
[0019] 将所述预设的语音信号的节奏特征与所述应用程序进行关联。
[0020] 其中, 所述根据确定的语音信号的节奏特征, 启动所述语音信号的节奏特征对 应的应用程序包括步骤:
[0021] 根据确定的语音信号的节奏特征, 判断终端用户是否具有应用程序启动权限; [0022] 若终端用户具有应用程序启动权限, 则启动所述语音信号的节奏特征对应的应 用程序。
[0023] 其中, 所述启动所述语音信号的节奏特征对应的应用程序之前还包括步骤: [0024] 若所述终端当前处于熄屏状态, 则解锁所述终端。
[0025] 其中, 所述启动所述语音信号的节奏特征对应的应用程序包括:
[0026] 启动或关闭所述语音信号的节奏特征对应的应用程序; 或者控制所述语音信号 的节奏特征对应的应用程序的运行参数。
[0027] 其中, 所述对获取的语音信号进行识别处理, 得到语音信号特征信息具体包括 [0028] 通过模糊语音识别方法对获取的语音信号进行识别处理, 得到语音信号特征信 息。
[0029] 本申请还提供一种终端, 其中, 所述终端包括: 存储器、 处理器及存储在所述 存储器上并可在所述处理器上运行的应用程序启动程序, 所述应用程序启动程 序被所述处理器执行吋实现如权利要求 1至 8中任一项所述的应用程序启动方法 的步骤。
[0030] 本申请还提供一种计算机可读存储介质, 其中, 所述计算机可读存储介质上存 储有应用程序启动程序, 所述应用程序启动程序被处理器执行吋实现如权利要 求 1至 8中任一项所述的应用程序启动方法的步骤。
发明的有益效果
有益效果
[0031] 本申请实施例提供的一种应用程序启动方法及终端、 计算机可读存储介质, 通 过对识别处理得到的语音信号特征信息, 确定语音信号的节奏特征, 并根据语 音信号的节奏特征启动应用程序; 启动应用程序方便快捷, 增加了信息的交互 效率, 提升了用户体验。
对附图的简要说明
附图说明
[0032] 图 1为本发明实施例的应用程序启动方法流程示意图;
[0033] 图 2为本发明实施例的应用程序启动方法中匹配流程示意图;
[0034] 图 3为本发明实施例的应用程序启动方法中判断是否在预设的误差范围内流程 示意图;
[0035] 图 4为本发明实施例的应用程序启动方法中判断是否具有应用程序启动权限流 程示意图;
[0036] 图 5为本发明实施例的终端结构示意图。
[0037] 本发明目的的实现、 功能特点及优点将结合实施例, 参照附图做进一步说明。
本发明的实施方式 [0038] 应当理解, 此处所描述的具体实施例仅仅用以解释本发明, 并不用于限定本发 明。
[0039] 在后续的描述中, 使用用于表示元件的诸如"模块"、 "部件 "或"单元"的后缀仅 为了有利于本发明的说明, 其本身没有特定的意义。 因此, "模块"、 "部件 "或" 单元"可以混合地使用。
[0040] 终端可以以各种形式来实施。 例如, 本发明中描述的终端可以包括诸如手机、 平板电脑、 笔记本电脑、 掌上电脑、 个人数字助理 (Personal Digital
Assistant, PDA) 、 便捷式媒体播放器 (Portable Media Player, PMP) 、 导航装 置、 可穿戴设备、 智能手环、 计步器等移动终端, 以及诸如数字 TV、 台式计算 机等固定终端。
[0041] 后续描述中将以移动终端为例进行说明, 本领域技术人员将理解的是, 除了特 别用于移动目的的元件之外, 根据本发明的实施方式的构造也能够应用于固定 类型的终端。
[0042] 第一实施例
[0043] 如图 1所示, 本发明第一实施例提供一种应用程序启动方法, 该方法用于终端 中, 所述应用程序启动方法包括步骤:
[0044] 11、 获取语音信号。
[0045] 在本实施例中, 获取语音信号的途径在此不作限制。 所述语音信号可以为预先 存储在所述终端存储器中的语音文件。
[0046] 或者所述语音信号也可以为即吋输入的语音信号, 例如: 在所述终端解锁之后
, 检测到有语音输入吋, 所述终端获取用户输入的语音信号, 并对语音信号进 行处理, 比如: 除噪、 放大等处理。
[0047] 或者所述语音信号也可以为根据用户的录制指令录入的语音信号, 例如: 用户 选择应用程序后生成应用程序选择触发指令, 此吋幵启麦克风, 接收用户输出 的语音信号, 该语音信号可以是应用程序的名字, 也可以是用户自定义的其他 语音, 比如"猴子"、 "老虎"、 "老婆"、 "Darling"等, 这样更方便记忆, 也使得语 音幵启更生动。
[0048] 12、 对获取的语音信号进行识别处理, 得到语音信号特征信息。 [0049] 在本实施例中, 可通过使用现有技术中已知的语音识别方法, 对获取的语音信 号进行识别处理。
[0050] 作为示例地, 在获取语音信号之后, 可使用搜索算法 (例如 viterbi算法) 进行 解码, 从而得到识别结果。 在解码过程中需要使用声学模型和语言模型。 在该 步骤所使用的声学模型可以存储在系统的外部声学模型存储装置中。 声学模型 可以是上下文无关的隐马尔科夫模型 (context independent HMM) , 并且在每一 种状态下具有高斯混合分布。 语言模型包括用于语音识别的词典以及用于语音 识别的语法。 用于语音识别的词典可以存储在外部词典存储装置中, 并且用于 语音识别的语法可以存储在外部语法存储装置中。
[0051] 在一种实施方式中, 所述对获取的语音信号进行识别处理, 得到语音信号特征 信息具体包括:
[0052] 通过模糊语音识别方法对获取的语音信号进行识别处理, 得到语音信号特征信 息。
[0053] 作为示例地, 在语音信号进行识别处理的过程中, 对于不确定性的问题, 如" 请小朋友唱一首歌", 并未限定歌曲的名称, 则可以利用模糊语音识别技术识别 出小孩有没有唱歌的动作进行模糊判断即可。 语音识别过程中采用的模糊语音 识别技术可参考现有技术。
[0054] 13、 根据识别处理得到的语音信号特征信息, 确定语音信号的节奏特征。
[0055] 在本实施例中, 所述节奏特征可以用于描述语音信号的持续吋间的相似度, 以 及 /或者描述语音信号的能量变化的相似度。
[0056] 所述节奏特征可以包括以下各项特征中的至少一项: 两个连续的非命令词对应 的语音信号 (即, 至少两个由非命令词和短暂的停顿组成的对的持续吋间的平 均长度; 所述至少两个连续的非命令词对应的语音信号的持续吋间的方差; 经 过标准化的所述至少两个连续的非命令词对应的语音信号的能量变化的自相关 的最大值; 所述至少两个连续的非命令词对应的语音信号的基频 (F0) ; 以及 所述至少两个连续的非命令词对应的语音信号的能量。
[0057] 本领域技术人员能够理解, 还可以选择其他特征作为节奏特征, 只要该特征可 以用于描述语音信号的持续吋间的相似度, 以及 /或者描述语音信号的能量变化 的相似度。
[0058] 14、 根据确定的语音信号的节奏特征, 启动所述语音信号的节奏特征对应的应 用程序。
[0059] 在本实施例中, 所述启动所述语音信号的节奏特征对应的应用程序包括: [0060] 启动或关闭所述语音信号的节奏特征对应的应用程序; 或者控制所述语音信号 的节奏特征对应的应用程序的运行参数。
[0061] 例如, 智能手机接收到"拨打张三电话 "的语音信号后, 可发起对张三的呼叫, 即启动电话应用程序。 智能手机在通过耳机播放音乐吋, 可以通过语音信号对 其进行 "上一首、 下一首、 增加音量、 降低音量"的控制。
[0062] 进一步地, 在本实施例中, 所述启动所述语音信号的节奏特征对应的应用程序 之前还包括步骤:
[0063] 若所述终端当前处于熄屏状态, 则解锁所述终端。
[0064] 在该步骤中, 在终端处于熄屏状态吋, 控制所述终端进行解锁, 从而避免了用 户手动去解锁, 更加方便用户使用终端。
[0065] 请参考图 2所示, 在一种实施方式中, 所述根据确定的语音信号的节奏特征, 启动所述语音信号的节奏特征对应的应用程序包括步骤:
[0066] 141、 将确定的语音信号的节奏特征与预设的语音信号的节奏特征进行匹配; [0067] 142、 若匹配成功, 则启动所述语音信号的节奏特征对应的应用程序。
[0068] 进一步地, 在该实施方式中, 所述方法还包括步骤:
[0069] 获取所述预设的语音信号的节奏特征;
[0070] 将所述预设的语音信号的节奏特征与所述应用程序进行关联。
[0071] 作为示例地, 可通过建立映射表的方式实现将所述预设的语音信号的节奏特征 与所述应用程序进行关联。 具体地, 所述映射表保存有语音信号的节奏特征以 及对应的应用程序的名称, 这样实现了语音信号的节奏特征与应用程序的关联
[0072] 例如: 预设的语音信号的节奏特征与短信应用程序进行了关联; 在获取到语音 信号, 且终端从语音信号中得到语音信号的节奏特征吋, 将得到的语音信号的 节奏特征与预设的语音信号的节奏特征进行匹配; 若得到的语音信号的节奏特 征与预设的语音信号的节奏特征一致, 则启动短信应用程序。
[0073] 请参考图 3所示, 在一种实施方式中, 所述根据确定的语音信号的节奏特征, 启动所述语音信号的节奏特征对应的应用程序包括步骤:
[0074] 151、 判断确定的语音信号的节奏特征与预设的语音信号的节奏特征是否在预 设的误差范围内;
[0075] 152、 若确定的语音信号的节奏特征与预设的语音信号的节奏特征在预设的误 差范围内, 则启动所述语音信号的节奏特征对应的应用程序。
[0076] 与上类似的, 在该实施方式中, 所述方法还包括步骤:
[0077] 获取所述预设的语音信号的节奏特征;
[0078] 将所述预设的语音信号的节奏特征与所述应用程序进行关联。
[0079] 作为示例地, 可通过建立映射表的方式实现将所述预设的语音信号的节奏特征 与所述应用程序进行关联。 具体地, 所述映射表保存有语音信号的节奏特征以 及对应的应用程序的名称, 这样实现了语音信号的节奏特征与应用程序的关联
[0080] 实际工作过程中, 存在一种情形或应用场景: 在获取到语音信号, 且终端从语 音信号中得到语音信号的节奏特征吋, 与预设的语音信号的节奏特征不可能完 全一模一样; 因此得到的语音信号的节奏特征与预设的语音信号的节奏特征具 有一定的误差, 只要该误差在一定范围内, 即可认定得到的语音信号的节奏特 征与预设的语音信号的节奏特征一致, 再根据预设的语音信号的节奏特征与应 用程序的映射关系, 即可启动对应的应用程序。
[0081] 请参考图 4所示, 在另一种实施方式中, 所述根据确定的语音信号的节奏特征
, 启动所述语音信号的节奏特征对应的应用程序包括步骤:
[0082] 161、 根据确定的语音信号的节奏特征, 判断终端用户是否具有应用程序启动 权限;
[0083] 162、 若终端用户具有应用程序启动权限, 则启动所述语音信号的节奏特征对 应的应用程序。
[0084] 在该实施方式中, 可将预设的语音信号的节奏特征与应用程序进行关联, 在获 取到语音信号, 终端从语音信号中得到语音信号的节奏特征, 并根据语音信号 的节奏特征, 与预先设置用户使用权限吋所获取的语音信号的节奏特征进行比 对, 确定该用户是否具有访问该应用程序的使用权限, 若用户具有使用权限, 则启动该应用程序; 若用户不具有使用权限, 则不做处理或者向终端用户显示 权限信息。
[0085] 作为示例地, 智能手机将用户 A的语音信号的节奏特征与相册应用程序进行关 联。 在获取用户 B的语音信号, 并根据用户 B的语音信号进行识别处理, 得到用 户 B的语音信号的节奏特征, 与预先设置的用户 A的语音信号的节奏特征比对之 后, 确定用户 B没有访问权限, 因此无法访问该相册; 当用户 A再次访问相册吋 , 智能手机通过比对用户 A的语音信号的节奏特征与预先设置的用户 A的语音信 号的节奏特征, 判断出用户 A具有访问权限, 因此启动相册应用程序供用户 A使 用。
[0086] 本发明实施例提供的一种应用程序启动方法, 通过对识别处理得到的语音信号 特征信息, 确定语音信号的节奏特征, 并根据语音信号的节奏特征启动应用程 序; 启动应用程序方便快捷, 增加了信息的交互效率, 提升了用户体验。
[0087] 第二实施例
[0088] 参照图 5, 图 5为本发明第二实施例提供一种终端, 所述终端 20包括: 存储器 21 、 处理器 22及存储在所述存储器 21上并可在所述处理器 22上运行的应用程序启 动程序, 所述应用程序启动程序被所述处理器执行吋, 用于实现以下所述应用 程序启动方法的步骤:
[0089] 获取语音信号;
[0090] 对获取的语音信号进行识别处理, 得到语音信号特征信息;
[0091] 根据识别处理得到的语音信号特征信息, 确定语音信号的节奏特征;
[0092] 根据确定的语音信号的节奏特征, 启动所述语音信号的节奏特征对应的应用程 序。
[0093] 所述应用程序启动程序被所述处理器 22执行吋, 还用于实现以下所述应用程序 启动方法的步骤:
[0094] 将确定的语音信号的节奏特征与预设的语音信号的节奏特征进行匹配;
[0095] 若匹配成功, 则启动所述语音信号的节奏特征对应的应用程序。 [0096] 所述应用程序启动程序被所述处理器 22执行吋, 还用于实现以下所述应用程序 启动方法的步骤:
[0097] 判断确定的语音信号的节奏特征与预设的语音信号的节奏特征是否在预设的误 差范围内;
[0098] 若确定的语音信号的节奏特征与预设的语音信号的节奏特征在预设的误差范围 内, 则启动所述语音信号的节奏特征对应的应用程序。
[0099] 所述应用程序启动程序被所述处理器 22执行吋, 还用于实现以下所述应用程序 启动方法的步骤:
[0100] 获取所述预设的语音信号的节奏特征;
[0101] 将所述预设的语音信号的节奏特征与所述应用程序进行关联。
[0102] 所述应用程序启动程序被所述处理器 22执行吋, 还用于实现以下所述应用程序 启动方法的步骤:
[0103] 根据确定的语音信号的节奏特征, 判断终端用户是否具有应用程序启动权限; [0104] 若终端用户具有应用程序启动权限, 则启动所述语音信号的节奏特征对应的应 用程序。
[0105] 所述应用程序启动程序被所述处理器 22执行吋, 还用于实现以下所述应用程序 启动方法的步骤:
[0106] 若所述终端当前处于熄屏状态, 则解锁所述终端。
[0107] 所述应用程序启动程序被所述处理器 22执行吋, 还用于实现以下所述应用程序 启动方法的步骤:
[0108] 启动或关闭所述语音信号的节奏特征对应的应用程序; 或者控制所述语音信号 的节奏特征对应的应用程序的运行参数。
[0109] 所述应用程序启动程序被所述处理器 22执行吋, 还用于实现以下所述应用程序 启动方法的步骤:
[0110] 通过模糊语音识别方法对获取的语音信号进行识别处理, 得到语音信号特征信 息。
[0111] 本发明实施例提供的一种终端, 通过对识别处理得到的语音信号特征信息, 确 定语音信号的节奏特征, 并根据语音信号的节奏特征启动应用程序; 启动应用 程序方便快捷, 增加了信息的交互效率, 提升了用户体验。
[0112] 第三实施例
[0113] 本发明第三实施例提供一种计算机可读存储介质, 所述计算机可读存储介质上 存储有应用程序启动程序, 所述应用程序启动程序被处理器执行吋实现第一实 施例所述的应用程序启动方法的步骤。
[0114] 本发明实施例提供的计算机可读存储介质, 通过对识别处理得到的语音信号特 征信息, 确定语音信号的节奏特征, 并根据语音信号的节奏特征启动应用程序 ; 启动应用程序方便快捷, 增加了信息的交互效率, 提升了用户体验。
[0115] 需要说明的是, 在本文中, 术语"包括"、 "包含 "或者其任何其他变体意在涵盖 非排他性的包含, 从而使得包括一系列要素的过程、 方法、 物品或者装置不仅 包括那些要素, 而且还包括没有明确列出的其他要素, 或者是还包括为这种过 程、 方法、 物品或者装置所固有的要素。 在没有更多限制的情况下, 由语句 "包 括一个 ...... "限定的要素, 并不排除在包括该要素的过程、 方法、 物品或者装置 中还存在另外的相同要素。
[0116] 上述本发明实施例序号仅仅为了描述, 不代表实施例的优劣。
[0117] 通过以上的实施方式的描述, 本领域的技术人员可以清楚地了解到上述实施例 方法可借助软件加必需的通用硬件平台的方式来实现, 当然也可以通过硬件, 但很多情况下前者是更佳的实施方式。 基于这样的理解, 本发明的技术方案本 质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来, 该计 算机软件产品存储在一个存储介质 (如 ROM/RAM、 磁碟、 光盘) 中, 包括若干 指令用以使得一台终端 (可以是手机, 计算机, 服务器, 空调器, 或者网络设 备等) 执行本发明各个实施例所述的方法。
[0118] 上面结合附图对本发明的实施例进行了描述, 但是本发明并不局限于上述的具 体实施方式, 上述的具体实施方式仅仅是示意性的, 而不是限制性的, 本领域 的普通技术人员在本发明的启示下, 在不脱离本发明宗旨和权利要求所保护的 范围情况下, 还可做出很多形式, 这些均属于本发明的保护之内。
工业实用性
[0119] 本发明实施例提供的一种应用程序启动方法及终端、 计算机可读存储介质, 通 过对识别处理得到的语音信号特征信息, 确定语音信号的节奏特征, 并根据语 音信号的节奏特征启动应用程序; 启动应用程序方便快捷, 增加了信息的交互 效率, 提升了用户体验。

Claims

权利要求书
[权利要求 1] 一种应用程序启动方法, 该方法用于终端中, 其特征在于, 所述应用 程序启动方法包括步骤:
获取语音信号;
对获取的语音信号进行识别处理, 得到语音信号特征信息; 根据识别处理得到的语音信号特征信息, 确定语音信号的节奏特征; 根据确定的语音信号的节奏特征, 启动所述语音信号的节奏特征对应 的应用程序。
[权利要求 2] 根据权利要求 1所述的一种应用程序启动方法, 其特征在于, 所述根 据确定的语音信号的节奏特征, 启动所述语音信号的节奏特征对应的 应用程序包括步骤:
将确定的语音信号的节奏特征与预设的语音信号的节奏特征进行匹配 若匹配成功, 则启动所述语音信号的节奏特征对应的应用程序。
[权利要求 3] 根据权利要求 1所述的一种应用程序启动方法, 其特征在于, 所述根 据确定的语音信号的节奏特征, 启动所述语音信号的节奏特征对应的 应用程序包括步骤:
判断确定的语音信号的节奏特征与预设的语音信号的节奏特征是否在 预设的误差范围内;
若确定的语音信号的节奏特征与预设的语音信号的节奏特征在预设的 误差范围内, 则启动所述语音信号的节奏特征对应的应用程序。
[权利要求 4] 根据权利要求 2或 3所述的一种应用程序启动方法, 其特征在于, 所述 方法还包括步骤:
获取所述预设的语音信号的节奏特征;
将所述预设的语音信号的节奏特征与所述应用程序进行关联。
[权利要求 5] 根据权利要求 1所述的一种应用程序启动方法, 其特征在于, 所述根 据确定的语音信号的节奏特征, 启动所述语音信号的节奏特征对应的 应用程序包括步骤: 根据确定的语音信号的节奏特征, 判断终端用户是否具有应用程序启 动权限;
若终端用户具有应用程序启动权限, 则启动所述语音信号的节奏特征 对应的应用程序。
根据权利要求 1所述的一种应用程序启动方法, 其特征在于, 所述启 动所述语音信号的节奏特征对应的应用程序之前还包括步骤: 若所述终端当前处于熄屏状态, 则解锁所述终端。
根据权利要求 1所述的一种应用程序启动方法, 其特征在于, 所述启 动所述语音信号的节奏特征对应的应用程序包括:
启动或关闭所述语音信号的节奏特征对应的应用程序; 或者控制所述 语音信号的节奏特征对应的应用程序的运行参数。
根据权利要求 1所述的一种应用程序启动方法, 其特征在于, 所述对 获取的语音信号进行识别处理, 得到语音信号特征信息具体包括: 通过模糊语音识别方法对获取的语音信号进行识别处理, 得到语音信 号特征信息。
一种终端, 其特征在于, 所述终端包括: 存储器、 处理器及存储在所 述存储器上并可在所述处理器上运行的应用程序启动程序, 所述应用 程序启动程序被所述处理器执行吋实现如权利要求 1至 8中任一项所述 的应用程序启动方法的步骤。
一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上 存储有应用程序启动程序, 所述应用程序启动程序被处理器执行吋实 现如权利要求 1至 8中任一项所述的应用程序启动方法的步骤。
PCT/CN2017/101254 2017-09-11 2017-09-11 一种应用程序启动方法及终端、计算机可读存储介质 WO2019047220A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/CN2017/101254 WO2019047220A1 (zh) 2017-09-11 2017-09-11 一种应用程序启动方法及终端、计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2017/101254 WO2019047220A1 (zh) 2017-09-11 2017-09-11 一种应用程序启动方法及终端、计算机可读存储介质

Publications (1)

Publication Number Publication Date
WO2019047220A1 true WO2019047220A1 (zh) 2019-03-14

Family

ID=65635313

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2017/101254 WO2019047220A1 (zh) 2017-09-11 2017-09-11 一种应用程序启动方法及终端、计算机可读存储介质

Country Status (1)

Country Link
WO (1) WO2019047220A1 (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929390A (zh) * 2012-10-16 2013-02-13 广东欧珀移动通信有限公司 一种在待机状态下应用程序的启动方法及装置
CN103797535A (zh) * 2011-08-24 2014-05-14 感官公司 减少语音辨识系统中的漏报
CN104157284A (zh) * 2013-05-13 2014-11-19 佳能株式会社 语音命令检测方法和系统,以及信息处理系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103797535A (zh) * 2011-08-24 2014-05-14 感官公司 减少语音辨识系统中的漏报
CN102929390A (zh) * 2012-10-16 2013-02-13 广东欧珀移动通信有限公司 一种在待机状态下应用程序的启动方法及装置
CN104157284A (zh) * 2013-05-13 2014-11-19 佳能株式会社 语音命令检测方法和系统,以及信息处理系统

Similar Documents

Publication Publication Date Title
US20210287671A1 (en) Speech recognition method, speech wakeup apparatus, speech recognition apparatus, and terminal
US11437041B1 (en) Speech interface device with caching component
JP6974486B2 (ja) 共有された音声対応デバイスにおける電話の処理
US10079014B2 (en) Name recognition system
CN106663430B (zh) 使用用户指定关键词的说话者不相依关键词模型的关键词检测
CN106448678B (zh) 用于在电子装置中执行语音命令的方法和设备
US7980465B2 (en) Hands free contact database information entry at a communication device
KR101931397B1 (ko) 음성 인증을 사용하는 디바이스 액세스
US9502032B2 (en) Dynamically biasing language models
US11188289B2 (en) Identification of preferred communication devices according to a preference rule dependent on a trigger phrase spoken within a selected time from other command data
WO2016184119A1 (zh) 一种音量调节方法、系统、设备和计算机存储介质
EP3271917A1 (en) Communicating metadata that identifies a current speaker
WO2014177015A1 (zh) 一种移动终端的语音识别方法及其装置
JP2017535809A (ja) サウンド検出モデルを生成するためのサウンドサンプル検証
WO2017181615A1 (zh) 一种陌生来电处理方法、装置及移动终端
TW201520896A (zh) 喚醒應用程式的方法及裝置
CN108509412A (zh) 一种数据处理方法、装置、电子设备以及存储介质
WO2014032597A1 (zh) 语音识别方法及电子设备
JP6817386B2 (ja) 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末
WO2019047220A1 (zh) 一种应用程序启动方法及终端、计算机可读存储介质
WO2020224570A1 (zh) 交互方法及装置、音箱、电子设备和存储介质
TW201523301A (zh) 聯繫人查詢系統及方法、通訊裝置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17924097

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17924097

Country of ref document: EP

Kind code of ref document: A1