CN107657953A - 语音控制方法及系统 - Google Patents

语音控制方法及系统 Download PDF

Info

Publication number
CN107657953A
CN107657953A CN201710885478.0A CN201710885478A CN107657953A CN 107657953 A CN107657953 A CN 107657953A CN 201710885478 A CN201710885478 A CN 201710885478A CN 107657953 A CN107657953 A CN 107657953A
Authority
CN
China
Prior art keywords
numbering
icon
button
phonetic order
sound control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710885478.0A
Other languages
English (en)
Inventor
李斌
吴忠兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Aiyouwei Software Development Co Ltd
Original Assignee
Shanghai Aiyouwei Software Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Aiyouwei Software Development Co Ltd filed Critical Shanghai Aiyouwei Software Development Co Ltd
Priority to CN201710885478.0A priority Critical patent/CN107657953A/zh
Publication of CN107657953A publication Critical patent/CN107657953A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04817Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object or an image, setting a parameter value or selecting a range
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本申请公开了一种语音控制方法及系统,涉及通讯领域,其方法包括:对终端界面上的可触发按键或者图标编号;获取包含编号内容的语音指令;解析所述语音指令中包含的编号;触发所述编号所对应的按键或者图标。本申请先将可触发的按键或者图标进行编号;再从语言指令中识别编号,执行对应动作;由于编号的发音简单,容易识别,语音控制的精确度高;而且,编号的意义,仅用户知晓,而周围环境中的其他人不理解其含义,因此,具有良好的隐秘性。

Description

语音控制方法及系统
技术领域
[0001]本申请涉及通讯领域,尤其涉及一种语音控制方法及系统。
背景技术
[0002] 随着通讯技术的不断发展,终端的控制方式越来越丰富,也越来越智能,其中,语 音控制即一种应用广泛、技术较成熟的控制方式。但是现有技术中的语音系统,仍存在识别 精度方面的问题,对于一些复杂或者生僻的发音,识别度较差,如果再加上口音的问题,其 识别准确度会进一步降低。此外,语音控制存在隐私性问题,用户的操作,会被周边环境中 的人或者设备获取识别。
发明内容
[0003] 本申请的目的在于提供一种语音控制方法及系统,以解决现有技术中的语音控制 技术所存在的识别精度低,隐秘性差的技术问题。
[0004] 为实现上述目的之一,本申请提供了一种语音控制方法,包括:
[0005] 对终端界面上的可触发按键或者图标编号;
[0006] 获取包含编号内容的语音指令;
[0007] 解析所述语音指令中包含的编号;
[0008] 触发所述编号所对应的的按键或者图标。
[0009] 在上述技术方案中,进一步的,对可触发的按键或者图标编号的方法为:
[0010] 通过读取终端当前界面的底层信息,获知当前界面的可操作按键或者图标,并在 上述按键或者图标上生成对应的编号。
[0011] 在上述技术方案中,进一步的,对可触发的按键或者图标编号的方法为:
[0012] 获取触发指令;
[0013] 进入手动录入模式;
[0014] 选择终端当前界面的可触发的按键或者图标,并手动录入编号;
[0015] 记忆所述按键或者图标与编号的对应关系。
[0016] 在上述技术方案中,进一步的,在对终端界面上的可触发按键或者图标编号之前, 还包括:预先获取并储存用户关于编号的语音指令;
[0017] 在解析语音指令中包含的编号之前,需要将带解析的语音指令与预先储存的语音 指令比较,根据声音特征判断二者是否为同一人发出:
[0018] 当判断二者是为同一人发出,触发所述编号所对应的的按键或者图标;否则,不触 发所述编号所对应的的按键或者图标。
[0019] 在上述技术方案中,进一步的,解析所述语音指令中包含的编号有多个,则依次执 行多个编号。
[0020] 在上述技术方案中,进一步的,所述语音指令中包括两个相同的编号,则对该编号 对应的按键或者图标执行双击动作。
[0021] 在上述技术方案中,进一步的,还包括:
[0022] 生成与终端的物理键对应的虚拟键;
[0023] 并对生成的虚拟键进行编号。
[0024] 在上述技术方案中,进一步的,还包括:
[0025] 生成上翻或者下翻的虚拟键;
[0026] 并对生成的虚拟键进行编号。
[0027]在上述技术方案中,进一步的,所述编号为数字、字母或词语。
[0028] 此外,本申请还提供了一种语音控制系统,包括:
[0029] 一个存储器,被配置为存储数据及指令;
[0030] 一个与存储器建立通信的处理器,其中,当执行存储器中的指令时,所述处理器被 配置为:
[0031] 对终端界面上的可触发按键或者图标编号;
[0032] 获取包含编号内容的语音指令;
[0033]解析所述语音指令中包含的编号;
[0034]触发所述编号所对应的的按键或者图标。
[0035]相较于现有技术,本申请提供的语音控制方法,先将可触发的按键或者图标进行 编号;再从语言指令中识别编号,执行对应动作;由于编号的发音简单,容易识别,语音控制 的精确度高;而且,编号的意义,仅用户知晓,而周围环境中的其他人不理解其含义,因此, 具有良好的隐秘性。
[0036] 本申请的附加方面和优点将在下面的描述部分中变得明显,或通过本申请的实践 了解到。
附图说明
[0037] 为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体 实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的 附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前 提下,还可以根据这些附图获得其他的附图。
[0038] 为更好地理解并阐述本申请的一些实施例,以下将结合附图参考实施例的描述, 在这些附图中,同样的数字编号在附图中指示相应的部分。
[0039] 图1是根据本申请的一些实施例提供的网络环境系统的示例性示意图。语音控制 方法
[0040] 图2是图1所示的电子设备功能配置的示例性单元示意图。
[0041] 图3是根据本申请的一些实施例提供的语音控制方法的示例性流程图。
[0042] 图4是根据本申请的一些实施例提供的语音控制方法的示例性流程图。
具体实施方式
[0043] 以下参考附图的描述为便于综合理解有权利要求及其等效内容所定义的本申请 的各种实施例。这些实施例包括各种特定细节以便于理解,但这些仅被视为示例性的。因 此,本领域技术人员可以理解对在此描述的各种实施例进行各种变化和修改而不会脱罔本 申请的范围和精神。另外,为简要并清楚地描述本申请,本申请将省略对公知功能和结构的 描述。
[0044]在以下说明书和权利要求书中使用的术语和短语不限于字面含义,而是仅为能够 清楚和一致地理解本申请。因此,对于本领域技术人员,可以理解,提供对本申请各种实施 例的描述仅仅是为说明的目的,而不是限制所附权利要求及其等效定义的本申请。
[0045]下面将结合本申请一些实施例中的附图,对本申请实施例中的技术方案进行清 楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。 基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有 其他实施例,都属于本申请保护的范围。
[0046]需要说明的是,在本申请实施例中使用的术语是仅仅处于描述特定实施例的目 的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一”、 “一个”、“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还 应当理解,本文中使用的术语“和/或”是指并包含一个或多个相绑定的列出项目的任何或 所有可能组合。表达“第一”、“第二”、“所述第一”和“所述第二”是用于修饰相应元件而不考 虑顺序或者重要性,仅仅被用于区分一种元件与另一元件,而不限制相应元件。
[0047] 根据本申请一些实施例的终端可以是电子设备,该电子设备可以包括智能手机、 个人电脑(PC,例如平板电脑、台式电脑、笔记本、上网本、掌上电脑PDA)、移动电话、电子书 阅读器、便携式多媒体播放器(PMP)、音频/视频播放器(MP3/MP4)、摄像机、虚拟现实设备 (VR)和可穿戴设备等中的一种或几种的组合。根据本申请的一些实施例,所述可穿戴设备 包括附件类型(例如手表、戒指、手环、眼镜、或头戴式装置(HMD))、集成类型(例如电子服 装)、装饰类型(例如皮肤垫、纹身或内置电子装置)等中的一种或几种的组合。在本申请的 一些实施例中,所述电子设备可以是灵活的,不限于上述设备,或者可以是上述各种设备中 的一种或几种的组合。在本申请中,术语“用户”可指示使用电子设备的人或使用电子设备 的设备(例如人工智能电子设备)。
[0048]本申请实施例提供了一种语音控制方法。为了便于理解本申请实施例,以下将参 考附图对本申请实施例进行详细描述。
[0049]图1是根据本申请的一些实施例提供的网络环境系统1〇〇的示例性示意图。如图1 所示,网络环境系统100可以包括电子设备110、网络120和服务器130等。电子设备110可以 包括总线111、处理器112、存储器113、输入/输出模块114、显示器115、通信模块116和物理 键117等。在本申请的一些实施例中,电子设备110可以省略一个或多个元件,或者可以进一 步包括一个或多个其他元件。
[0050] 总线111可以包括电路。所述电路可以互连电子设备110内的一个或多个元件(例 如,总线111、处理器II2、存储器113、输入/输出模块114、显示器115和通信模块116)。所述 电路也可以在电子设备110内的一个或多个元件之间实现通信(例如,获取和/或发送数 据)。
[0051] 处理器112可以包括一个或多个协处理器(Co-processor)、应用处理器(AP, Application Processor)和通信处理器(Communication Processor)。作为示例,处理器 112可以执行与电子设备110的一个或多个元件的控制和/或数据处理。
[0052]存储器II3可以存储数据。所述数据可以包括与电子设备110中的一个或多个其它 元件相关的指令或数据。例如,所述数据可以包括处理器112处理前的原始数据,中间数据 和/或处理后的数据。具体而言,存储器113可以存储照片、图像、虹膜信息等。存储器113可 以包括非永久记忆性存储器和/或永久记忆性存储器。
[0053] 根据本申请的一些实施例,存储器113可以存储软件和/或程序。所述程序可以包 括内核、中间件、应用编程接口(API,Application Programming Interface)和/或应用程 序。所述内核、所述中间件或所述应用编程接口的至少一部分可以包括操作系统(0S, Operating System)。作为示例,所述内核可以控制或管理用于执行其他程序(例如,中间 件、应用编程接口和应用程序)中实现的操作或功能的系统资源(例如,总线111、处理器 112、存储器113等)。此外,所述内核可以提供接口。所述接口可以通过所述中间件、所述应 用编程接口或所述应用程序访问电子设备110的一个或多个元件以控制或管理系统资源。 [0054]所述中间件可以作为数据传输的中间层。所述数据传输可以允许应用编程接口或 应用程序与所述内核通信用以交换数据。作为示例,所述中间件可以处理从所述应用程序 获取的一个或多个任务请求。例如,所述中间件可以向一个或多个应用程序分配电子设备 110的系统资源(例如,总线111、处理器112、存储器113等)的优先级,以及处理所述一个或 多个任务请求。所述应用编程接口可以是所述应用程序用于控制从所述内核或所述中间件 提供功能的接口。所述应用编程接口也可以包括一个或多个接口或功能。所述功能可以用 于安全控制、通信控制、文件控制、窗口控制、文本控制、图像处理、信号处理等。
[0055] 输入/输出模块114可以向电子设备110的其他元件发送从用户或外部设备输入的 指令或数据。输入/输出模块114也可以将从电子设备110的其他元件获取的指令或数据输 出给用户或外部设备。
[0056]显示器115可以显示内容。所述内容可以向用户显示各种类型(例如,文本、图像、 视频、图标和/或符号)。显示器115可以包括液晶显示器(LCD,Liquid Crystal Display)、 发光二极管(LED,Light_Emitting Diode)显不器、有机发光二极管(0LED,0rganic Light Emitting Diode)显示器、微型机电系统(MEMS,Micro Electro Mechanical Systems)显 示器或电子纸显示器等,或几种的组合。显示器115可以包括触摸屏。在一些实施例中,显示 器115可以显示虚拟键。所述触摸屏可以获取所述虚拟键的输入。显示器115可以通过所述 触摸屏获取输入。所述输入可以包括触摸输入、手势输入、动作输入、接近输入、电子笔或用 户身体部分的输入。
[0057] 通信模块116可以配置设备之间的通信。在一些实施例中,网络环境1〇〇可以进一 步包括电子设备140。作为示例,所述设备之间的通信可以包括电子设备110和其他设备(例 如,服务器130或电子设备140)之间的通信。例如,通信模块116可以通过无线通信或有线通 信连接到网络120,与其他设备(例如,服务器130或电子设备140)实现通信。
[0058]所述无线通信可以包括微波通信和/或卫星通信等。所述无线通信可以包括蜂窝 通信(例如,全球移动通信(GSM,Global System for Mobile Communications)、码分多址 (CDMA,Code Division Multiple Access)、第二代移动通{目(3G,The 3rd Generation Telecommunication)、第四代移动通信(4G)、第五代移动通信(5G))、长期演进技术(LTE, Long Term Evolution)、长期演进技术升级版(LTE-A,LTE-Advanced)、宽带码分多址 (WCDMA,Wideband Code Division Multiple Access)、通用移动通信系统(UMTS, Universal Mobile Telecommunications System)、无线宽带(WiBro,Wireless Broadband)等,或几种的组合。根据本申请的一些实施例,所述无线通信可以包括无线局域 网(WiFi,Wireless Fidelity)、蓝牙、低功耗蓝牙(BLE,Bluetooth Low Energy)、紫蜂协议 (ZigBee)、近场通讯(NFC,Near Field Communication)、磁安全传输、射频和体域网(BAN, Body Area Network)等,或几种的组合。根据本申请的一些实施例,所述有线通信可以包括 全球导航卫星系统(Glonass/GNSS,Global Navigation Satellite System)、全球定位系 统(GPS,Global Position System)、北斗导航卫星系统或伽利略(欧洲全球卫星导航系统) 等。所述有线通信可以包括通用串行总线(USB,Universal Serial Bus)、高清多媒体接口 (HDMI,High_Definition Multimedia Interface)、推荐标准232 (RS_232,Recommend Standard 232)、和/或简易老式电话服务(P〇TS,Plain Old Telephone Service)等中的 一种,或几种的组合。
[0059] 物理键117可以用于用户交互。物理键117可以包括一个或多个实体键。在一些实 施例中,用户可以自定义物理键117的功能。例如,物理键117可以用于产生触发信息。
[0060] 网络120可以包括通信网络。所述通信网络可以包括计算机网络(例如,局域网 (LAN,Local Area Network)或广域网(WAN,Wide Area Network))、互联网和/或电话网络 等,或几种的组合。网络120可以向网络环境系统100中的其他设备(例如,电子设备110、服 务器130、电子设备140等)发送信息。
[0061] 服务器130可以通过网络120连接网络环境系统100中的其他设备(例如,电子设 备110、电子设备140等)。
[0062] 电子设备140可以与电子设备110相同或不同的类型。根据本申请的一些实施例, 在电子设备110中执行的部分或全部操作可以在另一设备或多个设备(例如,电子设备140 和/或服务器130)中执行。在一些实施例中,当电子设备110自动或响应于请求执行一种或 多种功能和/或服务时,电子设备110可以请求其他设备(例如,电子设备140和/或服务器 130)替代执行功能和/或服务。在一些实施例中,电子设备110除执行功能或服务外,进一步 执行与其相关的一种或多种功能。在一些实施例中,其他设备(例如,电子设备140和/或服 务器130)可以执行所请求的功能或其它相关的一种或多种功能,可以将执行结果发送给电 子设备110。电子设备110可以重复执行结果或进一步处理执行结果,以提供所请求的功能 或服务。
[0063]需要说明的是,以上对于网络环境系统100的描述,仅为描述方便,并不能把本申 请限制在所举实施例的范围之内。可以理解,对于本领域技术人员,基于本系统的原理,可 能在不背离该原理的前提下,对各个元件进行任意组合,或者构成子系统与其他元件连接, 对实施上述方法和系统的应用领域进行形式和细节上的各种修正和改变。例如,网络环境 系统100可以进一步包括数据库等。诸如此类的变形,均在本申请的保护范围之内。
[0064]图2是根据本申请的一些实施例提供的电子设备功能配置的示例性单元框图。如 图2所示,处理器112可以包括处理模块200,所述处理模块200可以包括获取单元210、分析 单元220、控制单元230。
[0065] 根据本申请的一些实施例,获取单元210可以获取信息。所述信息可以包括但不限 于文字、图片、音频、视频、动作、手势等,或几种的组合。在一些实施例中,获取单元210可以 通过输入/输出模块114、显示器115的触摸屏和/或物理键117获取输入信息。作为示例,获 取单元210可以获取电子设备110的输入信息。所述输入信息可以包括按键输入、触控输入、 手势输入、动作输入、远程输入、传输输入等,或几种的组合。
[0066]在一些实施例中,获取单元210可以获取包含编号内容的语音指令,获取终端当前 界面的底层信息,获取触发指令等。
[0067] 根据本申请的一些实施例,分析单元220至少能够对获取单元210获取的信息以及 电子设备中存储的信息进行分析。在一些实施例中,分析单元220能够分析获取单元210获 取的含编号内容的语音指令,以解析出语音指令中包含的编号。
[0068] 根据本申请的一些实施例,控制单元230可以控制电子设备。所述控制电子设备可 以包括控制电子设备110执行动作。在一些实施例中,控制单元230可控制电子设备在后台 同时运行同一种类的若干个APP。在一些实施例中,控制单元230根据分析单元220的分析结 果,触发所述编号所对应的的按键或者图标。
[0069] 需要说明的是,以上对于处理模块200中的单元描述,仅为描述方便,并不能把本 申请限制在所举实施例的范围之内。可以理解,对于本领域技术人员,基于本系统的原理, 可能在不背离该原理的前提下,对各个单元进行任意组合,或者构成子模块与其他单元连 接,对实施上述模块和单元的功能进行形式和细节上的各种修正和改变。例如,电子设备 110可以进一步包括传感器等,获取单元210可以通过传感器获取信息。又例如,处理单元 220可以进一步包括划分子单元等。诸如此类的变形,均在本申请的保护范围之内。
[0070] 图3是根据本申请的一些实施例提供的语音控制方法的示例性流程图。如图3所 示,流程300可以通过处理模块200实现。
[0071] 在步骤310,对终端界面上的可触发按键或者图标编号。所述编号为数字、字母或 词语。
[0072] 在一些实施例中,对可触发的按键或者图标编号的方法为手动编号,具体来说,包 括:
[0073] 获取触发指令;例如长按或者双击屏幕的设定区域,或者触发屏幕上设定的虚拟 按键,或者在设置菜单中选择相关的按键选项。
[0074] 进入手动录入模式;在该模式下,当用户点击按键或者图标时,不会触发按键或者 图标,仅会对按键或者图标录入编号;
[0075] 选择终端当前界面的可触发的按键或者图标,并手动录入编号;
[0076] 记忆所述按键或者图标与编号的对应关系。
[0077] 举例来说,在一游戏界面,可将游戏操控键逐一录入编号,例如将击打、向左、向 右、跳跃等依次编号为1、2、3、4等。
[0078] 在一些实施例中,对可触发的按键或者图标编号的方法为自动编号,具体来说,包 括:通过读取终端当前界面的底层信息,获知当前界面的可操作按键或者图标,并在上述按 键或者图标上生成对应的编号。
[0079] 例如,在一手机界面,包括电话、通讯录、照相机、微信、微博等APP,可在进入该界 面后,读取当前界面的底层信息,并为上述APP依次编号
[0080] 在步骤320,获取包含编号内容的语音指令。
[0081] 利用声音采集装置,获取用户发出的语音,以实现声控目的。
[0082] 在步骤330,解析所述语音指令中包含的编号。
[0083] 通过语义识别技术,读取语音指令中包含的编号信息,进而形成控制指令。
[0084] 在一些实施例中,一条语音指令中可包含多个编号,既可以为多个不同的编号,也 可为多次相同的编号。
[0085] 在步骤340,触发所述编号所对应的的按键或者图标。
[0086] 根据解析出的编号,执行对应的动作。在一些实施例中,解析语音指令中包含的编 号有多个,则依次执行多个编号。在一些实施例中,所述语音指令中包括两个相同的编号, 则对该编号对应的按键或者图标执行双击动作。
[0087]不同于现有技术中的语音控制,本申请提供的语音控制方法,将可触发的按键或 者图标,进行编号;再从语言指令中识别编号,执行对应动作;由于编号的发音简单,容易识 另IJ,语音控制的精确度高;而且,编号的意义,仅用户知晓,而周围环境中的其他人不理解其 含义,因此,具有良好的隐秘性。
[0088]图4是根据本申请的一些实施例提供的语音控制方法的示例性流程图。如图4所 示,流程400可以通过处理模块200实现。
[0089]在步骤410,预先获取并储存用户关于编号的语音指令。
[0090]首先,需要进入预设置或者预采集状态;然后,会显示所有的编号,或者用户选择 的部分编号;用户根据显示读出编号,储存用户的发音,作为语音指令。
[0091] 在步骤420,对终端界面上的可触发按键或者图标编号,并对终端的物理键进行编 号。
[0092] 对终端界面上的可触发按键或者图标编号的方法,与步骤310相同,在此不再赘 述。
[0093] 在一些实施例中,对终端的物理键进行编号的方法为:
[0094] 生成与终端的物理键对应的虚拟键或者虚拟图标,该虚拟键或者虚拟图标是能够 被触发的,或者不能被触发的。
[0095] 并对生成的虚拟键进行编号。
[0096] 用户不仅可以通过语音指令控制终端显示界面上的图标或者虚拟键,还可控制物 理键,操作更加智能化,实用性更强。
[0097] 此外,除了对物理键进行编号外,还会对一些常用操作进行编号,例如,可以针对 屏幕的上翻和下翻控制,生成对应的虚拟键,并对虚拟键进行编号。将用户上滑屏幕、下滑 屏幕的操作,在通过编号后,也可通过语音控制,进一步提高实用性。
[0098]在步骤430,获取包含编号内容的语音指令。
[0099] 该步骤与步骤320相同,在此不再赘述。
[0100] 在步骤440,将带解析的语音指令与预先储存的语音指令比较。
[0101] 根据声音特征判断二者是否为同一人发出:
[0102] 当判断二者是为同一人发出,触发所述编号所对应的的按键或者图标;否则,不触 发所述编号所对应的的按键或者图标。
[0103] 通过语音特征的对比,实现身份验证功能。主要目的在于,识别主人的声音,避免 周围环境声音造成干扰,提高识别的精确度;其次,还能限制终端的使用,提高隐私的安全 性。
[0104] 在步骤450,解析所述语音指令中包含的编号。
[0105] 该步骤与步骤330相同,在此不再赘述。
[0106] 在步骤460,触发所述编号所对应的的按键或者图标。
[0107] 该步骤与步骤340相同,在此不再赘述。
[0108] 需要注意的是,上述的实施例仅仅是用作示例,本申请不限于这样的示例,而是可 以进行各种变化。
[0109] 需要说明的是,在本说明书中,术语“包括”、“包含”或者其任何其他变体意在涵盖 非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要 素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备 所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在 包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0110] 最后,还需要说明的是,上述一系列处理不仅包括以这里所述的顺序按时间序列 执行的处理,而且包括并行或分别地、而不是按时间顺序执行的处理。
[0111]本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以 通过计算机程序指令相关的硬件来完成,所述的程序可存储于一计算机可读存储介质中, 该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、 光盘、只读存储器(Read-Only Memory,R0M)或随机存储器(Random Access Memory,RAM) 等。
[0112]以上所揭露的仅为本申请一些优选的实施例,不能以此来限定本申请之权利范 围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本申请权利要 求所作的等同变化,仍属于发明所涵盖的范围。

Claims (10)

1. 一种语音控制方法,其特征在于,包括: 对终端界面上的可触发按键或者图标编号; 获取包含编号内容的语音指令; 解析所述语音指令中包含的编号; 触发所述编号所对应的的按键或者图标。 _
2. 根据权利要求1所述的语音控制方法,其特征在于,对可触发的按键或者图标编号的 方法为: _ 通过读取终端当前界面的底层信息,获知当前界面的可操作按键或者图标,并在上述 按键或者图标上生成对应的编号。 _
3. 根据权利要求1所述的语音控制方法,其特征在于,对可触发的按键或者图标编号的 方法为: 获取触发指令; 进入手动录入模式; 选择终端当前界面的可触发的按键或者图标,并手动录入编号; 记忆所述按键或者图标与编号的对应关系。
4. 根据权利要求1所述的语音控制方法,其特征在于,在对终端界面上的可触发按键或 者图标编号之前,还包括:预先获取并储存用户关于编号的语音指令; 在解析语音指令中包含的编号之前,需要将带解析的语音指令与预先储存的语音指令 比较,根据声音特征判断二者是否为同一人发出: 当判断二者是为同一人发出,触发所述编号所对应的的按键或者图标;否则,不触发所 述编号所对应的的按键或者图标。
5. 根据权利要求1所述的语音控制方法,其特征在于,解析所述语音指令中包含的编号 有多个,则依次执行多个编号。
6. 根据权利要求1所述的语音控制方法,其特征在于,所述语音指令中包括两个相同的 编号,则对该编号对应的按键或者图标执行双击动作。
7. 根据权利要求1所述的语音控制方法,其特征在于,还包括: 生成与终端的物理键对应的虚拟键; 并对生成的虚拟键进行编号。
8. 根据权利要求1或7所述的语音控制方法,其特征在于,还包括: 生成上翻或者下翻的虚拟键; 并对生成的虚拟键进行编号。
9. 根据权利要求1所述的语音控制方法,其特征在于,所述编号为数字、字母或词语。
10. —种语音控制系统,其特征在于,包括: 一个存储器,被配置为存储数据及指令; 一个与存储器建立通信的处理器,其中,当执行存储器中的指令时,所述处理器被配置 为: 对终端界面上的可触发按键或者图标编号; 获取包含编号内容的语音指令; 解析所述语音指令中包含的编号; 触发所述编号所对应的的按键或者图标。
CN201710885478.0A 2017-09-27 2017-09-27 语音控制方法及系统 Pending CN107657953A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710885478.0A CN107657953A (zh) 2017-09-27 2017-09-27 语音控制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710885478.0A CN107657953A (zh) 2017-09-27 2017-09-27 语音控制方法及系统

Publications (1)

Publication Number Publication Date
CN107657953A true CN107657953A (zh) 2018-02-02

Family

ID=61115965

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710885478.0A Pending CN107657953A (zh) 2017-09-27 2017-09-27 语音控制方法及系统

Country Status (1)

Country Link
CN (1) CN107657953A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108364645A (zh) * 2018-02-08 2018-08-03 北京奇安信科技有限公司 一种基于语音指令实现页面交互的方法及装置
CN109391833A (zh) * 2018-09-13 2019-02-26 苏宁智能终端有限公司 一种智能电视的语音控制方法及智能电视
CN109817204A (zh) * 2019-02-26 2019-05-28 深圳安泰创新科技股份有限公司 语音交互方法及装置、电子设备、可读存储介质
CN109859761A (zh) * 2019-02-22 2019-06-07 安徽卓上智能科技有限公司 一种智能语音交互控制方法
CN110364158A (zh) * 2019-08-14 2019-10-22 广州创维平面显示科技有限公司 语音交互方法、装置、电视机设备及存储介质
CN110427145A (zh) * 2019-08-01 2019-11-08 联想(北京)有限公司 一种信息处理方法及装置
CN110457105A (zh) * 2019-08-07 2019-11-15 腾讯科技(深圳)有限公司 界面操作方法、装置、设备及存储介质
WO2020001421A1 (zh) * 2018-06-29 2020-01-02 南京铁道职业技术学院 语音屏幕鼠标校核下的图标安全操作方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007264471A (ja) * 2006-03-29 2007-10-11 Toshiba Corp 音声認識装置および音声認識方法
CN101188108A (zh) * 2007-12-17 2008-05-28 凯立德欣技术(深圳)有限公司 一种语音控制方法、装置及移动终端
CN106250474A (zh) * 2016-07-29 2016-12-21 Tcl集团股份有限公司 一种语音控制的处理方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007264471A (ja) * 2006-03-29 2007-10-11 Toshiba Corp 音声認識装置および音声認識方法
CN101188108A (zh) * 2007-12-17 2008-05-28 凯立德欣技术(深圳)有限公司 一种语音控制方法、装置及移动终端
CN106250474A (zh) * 2016-07-29 2016-12-21 Tcl集团股份有限公司 一种语音控制的处理方法及系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108364645A (zh) * 2018-02-08 2018-08-03 北京奇安信科技有限公司 一种基于语音指令实现页面交互的方法及装置
WO2020001421A1 (zh) * 2018-06-29 2020-01-02 南京铁道职业技术学院 语音屏幕鼠标校核下的图标安全操作方法
CN109391833B (zh) * 2018-09-13 2021-01-26 苏宁智能终端有限公司 一种智能电视的语音控制方法及智能电视
CN109391833A (zh) * 2018-09-13 2019-02-26 苏宁智能终端有限公司 一种智能电视的语音控制方法及智能电视
CN109859761A (zh) * 2019-02-22 2019-06-07 安徽卓上智能科技有限公司 一种智能语音交互控制方法
CN109817204A (zh) * 2019-02-26 2019-05-28 深圳安泰创新科技股份有限公司 语音交互方法及装置、电子设备、可读存储介质
CN110427145A (zh) * 2019-08-01 2019-11-08 联想(北京)有限公司 一种信息处理方法及装置
CN110457105A (zh) * 2019-08-07 2019-11-15 腾讯科技(深圳)有限公司 界面操作方法、装置、设备及存储介质
CN110364158A (zh) * 2019-08-14 2019-10-22 广州创维平面显示科技有限公司 语音交互方法、装置、电视机设备及存储介质

Similar Documents

Publication Publication Date Title
CN107657953A (zh) 语音控制方法及系统
CN107609914A (zh) 一种智能菜单设计方法及系统
CN107341378A (zh) 用于设定应用的使用权限的方法
CN107704849A (zh) 双重验证功能的人脸识别方法及系统
CN108986806A (zh) 基于声源方向的语音控制方法及系统
CN107707766A (zh) 基于行程安排的充电提醒方法
CN107786979A (zh) 一种多终端共享通信方法及系统
CN107358179A (zh) 一种基于虹膜验证的生活管理系统、媒质和方法
CN109472122A (zh) 一种多媒体信息提示方法及系统
CN107734474A (zh) 绑定电话号码的应用统计方法及系统
CN108428455A (zh) 声纹特征的采集方法及系统
CN108010519A (zh) 一种信息搜索方法及系统
CN108228811A (zh) 信息推荐方法及系统
CN107315681A (zh) 应用程序自启动测试系统、媒质和方法
CN107846508A (zh) 针对健忘人群的辅助记忆方法及系统
CN108021350A (zh) 一种终端输出音量调整方法及系统
CN107690040A (zh) 自动拨号方法
CN107402690A (zh) 一种全局收藏方法及系统
CN107613106A (zh) 同类app的自动选择方法及系统
CN107071182A (zh) 一种通信方法
CN107368194A (zh) 终端设备的手势操控方法
CN108897479A (zh) 一种终端触控方法及系统
CN108184248A (zh) 一种终端的数据处理方法及系统
CN107423585A (zh) 一种应用的隐秘使用方法及系统
CN108921855A (zh) 基于信息的图片处理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180202