WO2015192447A1

WO2015192447A1 - 一种数据处理方法、装置和终端

Info

Publication number: WO2015192447A1
Application number: PCT/CN2014/084168
Authority: WO
Inventors: 吕何平; 杨清峰
Original assignee: 中兴通讯股份有限公司
Priority date: 2014-06-16
Filing date: 2014-08-12
Publication date: 2015-12-23
Also published as: EP3156915A4; CN105278970A; EP3156915A1; US20170154068A1

Abstract

本发明公开了一种数据处理方法、装置和终端。该方法包括：提取用户界面中的文本信息；基于所述文本信息，获得与所述文本信息对应的操作指令；其中，所述操作指令用于启动应用程序或服务进程；执行所述操作指令。本发明有效地解决了在语音识别受限的环境中，无法快速启动应用或服务的问题。本发明通过检测文本信息，获得与文本信息对应的操作指令，通过触发该操作指令，能够快速启动应用程序，提高了用户体验效果。

Description

一种数据处理方法、装置和终端技术领域本发明涉及数据处理技术领域，特别是涉及一种数据处理方法、装置和终端。背景技术语音技术发展迅速，语音技术涉及语音识别的各个方面。基于语音识别技术，用户可以执行快捷操作，缩短启动应用或服务的时间。例如：用户语音输入 "打开通信录"，则终端识别语音数据后，可以快速打开通信录。但是，语音识别技术的复杂度很高，识别的准确度也有待提高，并且对周围的环境有一定的要求，比如：需要相对安静的环境。而且，有些引擎需要借助网络交换信息的方式，才能获取后续的动作指令，以达到快速启动应用或服务的目的，对用户的实际操作不友好。目前，在语音条件受限的环境（如，会议模式）中，或者在有文本呈现的界面（如，短信会话界面、网页浏览界面）中，语音识别受到限制，这时，若用户想要进行快捷操作，只能通过手动的方式打开相应的应用，并在应用中输入想要执行的操作，这样，不能起到快速启动应用或服务的目的。例如：用户想要搜索 A地址所在的位置，当语音识别受到限制时，则只能手动打开地图应用，输入 A地址，搜索 A地址所在的位置，操作过程复杂，用户体验效果不佳。发明内容本发明实施例要解决的技术问题是提供一种数据处理方法、装置和终端，用以至少解决在语音识别受限的环境中，无法快速启动应用或服务的问题。为解决上述技术问题，本发明实施例是通过以下技术方案来实现的。在本发明的一个实施例中，提供了一种数据处理方法，包括：提取用户界面中的文本信息；基于所述文本信息，获得与所述文本信息对应的操作指令；其中，所述操作指令用于启动应用程序或服务进程；执行所述操作指令。其中，基于所述文本信息，获得与所述文本信息对应的操作指令，包括：解析所述文本信息中的关键字；在预先设置的语法规则库中，检索与所述关键字相对应的操作指令；其中，所述语法规则库中记载了不同的关键字对应的操作指令。其中，在解析所述文本信息中的关键字之前，还包括：对提取到的所述文本信息进行容错处理。其中，在执行所述操作指令之后，所述方法还包括：将所述关键字作为执行所述应用程序或服务进程的信息。其中，在执行所述操作指令之前，还包括：显示为所述操作指令设置的显示信息和 /或动作选项。其中，执行所述操作指令，包括: 当获得的操作指令为多个时，执行被选定的操作指令或者按照预先设置的顺序执行。在本发明的另一实施例中，还提供了一种数据处理装置，包括：提取模块，设置为提取用户界面中的文本信息；获得模块，设置为基于所述文本信息，获得与所述文本信息对应的操作指令；其中，所述操作指令用于启动应用程序或服务进程；执行模块，设置为执行所述操作指令。其中，所述获得模块具体设置为：解析所述文本信息中的关键字；在预先设置的语法规则库中，检索与所述关键字相对应的操作指令；其中，所述语法规则库中记载了不同的关键字对应的操作指令。其中，所述获得模块还设置为：对提取到的所述文本信息进行容错处理。其中，所述执行模块还设置为，将所述关键字作为执行所述应用程序或服务进程的信息。其中，所述装置还包括显示模块，设置为显示为所述操作指令设置的显示信息和 / 或动作选项。其中，执行模块具体设置为：当获得的操作指令为多个时，执行被选定的操作指令或者按照预先设置的顺序进行触发。在本发明的再一实施例中，还提供了一种终端，所述终端使用上述的数据处理装置。本发明实施例有益效果如下: 本发明实施例通过检测文本信息，获得与文本信息对应的操作指令，通过执行执行该操作指令，快速启动应用程序或服务，避免了语音识别受限的问题，提高了用户体验效果。附图说明图 1 是根据本发明一实施例的数据处理方法的流程图；图 2是根据本发明一实施例的获得与文本信息对应的操作指令的步骤流程图；图 3是根据本发明一实施例的数据处理方法的流程图；图 4 是根据本发明一实施例的用户界面的示意图；图 5是根据本发明一实施例的数据处理装置的结构图。具体实施方式为了解决在语音识别受限的环境中，无法快速启动应用或服务的问题。本发明实施例提供了一种数据处理方法、装置和终端。本发明实施例的主要思想在于，获取用户界面中的文本信息，根据该文本信息，执行与该文本信息对应的操作指令。这样，可以快速的执行应用程序或服务，在语音识别受限的环境中，也不会影响该方式的执行，提高执行效率。以下结合附图以及实施例，对本发明实施例进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不限定本发明。如图 1所示，图 1是根据本发明一实施例的数据处理方法的流程图。步骤 S110, 提取用户界面（User Interface, UI) 中的文本信息。文本信息包括：文字、字母、字符等。提取用户界面中的文本信息包括：针对用户界面中的元素进行实时侦听；确定用户界面中的元素是否被操作；当有元素被操作时，检测元素中是否有文本信息；如果元素中存在文本信息，则识别文本信息，并将文本信息从元素中抽离出来。如果用户界面中的元素未被操作，或者元素中不存在文本信息，则继续对用户界面中的元素进行侦听或检测。用户界面中的元素为文本信息的载体，包括但不限于图标、按钮、对话框、网页、搜索栏。用户界面中的元素都包含文本（text) 属性。在 text属性中包含文本信息。从元素中抽离文本信息是指将文字、字母、字符等信息从元素中分离出来。例如：从短信息对话框中分离出用户输入的文字。进一步地，可以从元素的 text属性中提取文本信息。具体而言，在 android (安卓）系统中，元素被统一称作控件。对于采用 android 系统的终端而言，提取用户界面中的文本信息，主要依托于现有的控件分离技术，分离出用户界面的控件，并提取出控件 text 属性中的文本信息。控件分离技术包括： hierarchy viewer uiautomatorviewer等。该控件分离技术也可以是开发者设置的自定义程序，利用屏幕像素采集点提取出控件中的文本信息。文本信息被抽离出来后，存储到指定的堆栈或者变量数组中。当用户界面中存在多个元素时，还可以获取文本信息所属的应用程序名称、以及进程名称和 /或进程识别符（Process Identification, PID)。将文本信息、应用程序名称、以及进程名称和 /或 PID对应存储。在一实施例中，可以在终端中定义文本转义模式，启动文本转义模式，设置为启动本发明的数据处理功能。文本转义模式可以作为系统-设置中的菜单、子菜单或开关等。文本转义模式可以通过点击控件图标、或者是物理按键来启动。例如：长时间按 home键、上下键同时按下等。在启动文本转义模式后，即可以实时侦听用户界面中的元素，对用户界面中的文本信息进行提取。

步骤 S120，基于文本信息，获得与该文本信息对应的操作指令。操作指令是指：用于启动应用程序或服务进程的命令；其中，服务例如为全球定位系统（Global Positioning System, GPS) 进程。获得与文本信息对应的操作指令的过程，包括：解析文本信息中的关键字；在预先设置的语法规则库中，检索与关键字相对应的操作指令。语法规则库中记载了不同的关键字对应的操作指令。具体而言，语法规则库包括映射关系和语法规则。映射关系中至少包括：关键字与应用程序的映射关系（对应关系）、应用程序与操作指令的映射关系、操作指令与显示信息的映射关系。语法规则至少包括：容错规则、解析规则、标准化处理规则。进一步地，语法规则库可以是数据表或数据库。在一个实施例中，语法规则库中的操作指令和应用程序使用机器识别码或机器识别语句。机器识别码或和机器识别语句能被系统快速识别。比如在 android系统中的可以用 startActivity(Intent)语句来用于启动一个进程或应用。语法规则库可以由本地生成，如：通过搜集本地的应用程序生成；也可以由服务器生成，通过服务端同步加载 /更新到本地，但是，本地需要设置一个程序，设置为检测哪些操作指令是本地可以实现的，否则可能出现空指针异常。在一个实施例中，在解析文本信息中的关键字之前，还包括：对提取到的文本信息进行容错处理。容错处理的目的在于：对文本信息进行拼写、语法检查，纠正文本信息中的错误。如：纠正文本信息中的错别字。在一个实施例中，在解析文本信息中的关键字之后，还包括：对解析出的关键字进行标准化处理，使关键字的形式统一。如图 2所示，图 2是根据本发明一实施例的获得与文本信息对应的操作指令的步骤流程图。步骤 S210, 对提到的文本信息进行容错处理。预先在语法规则库中设置容错规则。具体的容错规则可以是错误的拼写、语法与正确的拼写、语法的映射关系，还可以按照人工智能的方式进行训练，得到的检错算法，也可以是现有的检错算法。步骤 S220, 解析出文本信息中的关键字。预先在语法规则库中设置解析规则。该解析规则用于确定文本信息中的关键字。例如：该解析规则包括可以作为关键字的文字、字母、字符，文本信息中若出现这些文字、字母、字符，则可以作为文本信息的关键字。具体而言，根据解析规则中包含的关键字，直接检索出文本信息中的关键字。还可以对文本信息进行拆分，对拆分出的各个数据部分进行分析，抽取出其中的关键字，该拆分规则可以在解析规则中设置。可以按照语法结构，对文本信息进行拆分，例如：文本信息为"我在中山路"，则按照主、谓、宾、定、状、补的语法结构拆分文本信息，文本信息被拆分后，可以得到 "我"、 "在"、 "中山"、 "路"这几个部分，其中，在解析规则中包括 "路"，则可以将文本信息中的 "路"作为关键字。步骤 S230, 针对解析出的关键字进行标准化处理。该标准化处理是指，将不同形式的关键字进行统一。因为解析的出的关键字形式多样，如：关键字可以是中文、英文、日文等形式。所以，将不同形式的关键字转化为统一的形式，如：将关键字都转化为英文形式。关键字的标准化处理规则，可以预先在语法规则库中设置。如：为每个中文的字或词，设置一一对应的英文单词。将标准化后的关键字缓存在字符数组或堆栈中。在一个实施例中，在对关键字进行标准化处理后，基于关键字，形成转义语句。该转义语句为机器识别码或机器识别语句。转义语句的形成规则可以在语法规则库中设置。例如：关键字 "路"的英文单词为 road, 该 road的转义语句为 go to X road, "x " 为转义语句中的变量。在对文本信息进行拆分时，若得到关键字和关键字的定语，可以将定语作为转义语句中的变量的变量值，如：对 "中山路 "进行拆分得到 "中山"、 "路"， "中山"为关键字 "路" 的定语，则可以将 "中山"作为变量值。如果可以将关键字转化为转义语句，则在语法规则库中预先设置关键字和转义语句的映射关系，根据关键字和其转义语句在语法规则库中进行信息检索。步骤 S240, 在预先设置的语法规则库中，检索与关键字相对应的操作指令。该关键字经过标准化处理。将关键字作为检索词，检索与关键字相关的映射关系，从而获得与关键字对应的操作指令。如果未检索到与关键字相对应的操作指令，则显示检索失败或者继续提取用户界面中的文本信息。提取出的关键字可以是一个或多个。与关键字对应的操作指令也可以是一个或多个。如果关键字为 C和 D的形式，则在语法规则库中可以检索与 C有关的映射关系、与 D有关的映射关系、以及与 C和 D有关的映射关系。如：关键字为"天气" + "路"，则在语法规则库中可以检索与 "天气"有关的映射关系、与 "路"有关的映射关系、以及与 "天气"和 "路"有关的映射关系。当基于关键字形成转义语句后，可以将关键字和转义语句作为检索词，在映射关系中进行检索，从而获得与关键字、转义语句对应的操作指令。例如：关键字为 r₀ad、转义语句为 go to X road, 可以检索到如表 1所示映射关系。表 1

步骤 S130，执行操作指令。检索成功，获得与关键字对应的一个或多个操作指令。当获得多个操作指令时，执行被选定的操作指令，或者按照预先设置的顺序执行。执行顺序可以按照检索的时间先后，也可以按照操作指令的优先级高低。操作指令的优先级可以由设计者进行设置。可以对多个操作指令进行类型划分，相同类型的操作指令组成一个队列。操作指令的类型可以是操作指令的优先级、操作指令需要启动的应用程序等。例如：形成单独的队列来处理闹钟指令，形成单独的队列来处理定位指令。在执行文本信息对应的操作指令之前，还包括：显示为操作指令设置的显示信息和 /或动作选项。显示信息与操作指令对应，如表示 1所示，可以在语法规则库中获得。动作选项是指人机交互的选项。例如：请用户选择是否执行操作指令。进一步地，当获得的操作指令为多个时，可以显示包含多个显示信息的菜单动作选项，当菜单中的显示信息被选中后，执行该显示信息对应的操作指令。执行操作指令后，在 android系统中，使用 intent组件启动相应的应用程序或服务进程；在 windos系统下，可使用 hook程序启动相应的应用程序或服务进程。执行文本信息对应的操作指令之后，启动相应的应用程序或服务进行，将关键字作为执行应用程序或服务进程的信息，来执行与关键字相关的动作。例如：表 1的操作指令 " send intent to (com.baidu.map,x road,gps(now station》" 中包括语句 "gps(now station)", 则执行操作指令后，可以调用 GPS系统，定位当前的地理位置，在定位当前的地理位置后，实现当前地理位置到 "x road" 的导航。通过上述方法，可以达到在语音识别技术受限的环境中，快速启动应用程序或服务的目的。在此过程中，可以自动识别用户的需求，如果发现用户可能需要启动应用程序或服务时，为用户提供后续动作的选择，并采用系统级命令进行执行，执行效率较高，用户体验较好。

基于上述方法，给出一个实例，来说明本发明的数据处理方法。如图 3所示，图 3是根据本发明一实施例的用户界面的示意图。本实施例所使用的系统为 android系统。步骤 S310, 获取用户界面中的元素及 text属性值（文本信息）。利用 uiautomatorviewer获取用户界面中的元素及 text属性值。当前用户界面有 3个控件：控件 1为 TextView, 其 text属性值 1 (文本信息）为 " X与 Y聊天界面"。控件 2为 Multiline Text, 其 text属性值 2为 "我在中山路"。控件 3为 Multiline Text, 其 text属性值 3为 "好，我这就去"。控件 1-3所属的 activity名称为： talklistActivty。提取控件 1-3的 text属性值、 activity名称。步骤 S320, 解析 text属性值中的关键字，并对关键字进行标准化处理。按照汉语的语法结构，解析上述三个 text属性值。解析 text属性值 1，可以得到 "X"、 "与"、 "Y，，、 "耳卯天"、 "界面" 解析 text属性值 2，，

可以得到 "我"、 "在"、 "中山 "、 "路，解析 text属性值 3，可以得到 "好"、 "我"、 "这"、 " " +，

就"、云如果在语法规则库的解析规则中，只包括"路"，则将 text属性值 2中 "路"作为关键字。将该关键字转换为英文 "road"。 "road"的转义语句为 "go to xx road"。将 "路" 的定语 "中山"作为转义语句和操作指令中的变量值。记录关键字、转义语句、 activity名称，如表 2所示。表 2

步骤 S330，在语法规则库中，检索与关键字相对应的操作指令。通过检索语法规则库，可以获得表 1所示的检索结果。将三种操作指令取出，借助 android的系统实例化三个 intent实例： intent 1= send intent to (com . androi d . googl emap ,xx road); intent2= send intent to (com.baidu.map ,xx road,gps(now station)); intent3= send intent to (com. android. googl emap,line(xx road,gps(now station)))。将操作指令、显示信息、以及表 2中标识用户界面进程的关键信息 activity名称记录在内存中，如表 3所示。表 3

步骤 S340, 执行被选中的操作指令。在用户界面中显示 3个 Intent的显示信息的菜单选项。如图 4所示的根据本发明一实施例的用户界面的示意图。在图 4中，将表 3中每个显示信息中的变量 " XX "替换为变量值"中山"，并且，将显示信息以列表的形式显示在用户界面中。当用户选择其中一个显示信息时，则该显示信息对应的 intent被选中。例如：当用户点击 "谷歌地图定位 XX路"，菜单点击事件执行一条指令，类似 sendlntentG方式启动高德导航，并将 "中山路" 的信息输入到导航地图上，这样用户就可以直观的感知地图。

本发明实施例还提供了一种数据处理装置。如图 5所示，图 5是根据本发明一实施例的数据处理装置的结构图。该装置包括：提取模块 510，设置为提取用户界面中的文本信息；获得模块 520，设置为基于文本信息，获得与文本信息对应的操作指令。操作指令用于启动应用程序或服务进程。获得模块 520具体设置为：解析文本信息中的关键字；在预先设置的语法规则库中，检索与关键字相对应的操作指令。其中，语法规则库中记载了不同的关键字对应的操作指令。进一步地，获得模块 420还设置为：对提取到的文本信息进行容错处理。执行模块 530，设置为执行文本信息对应的操作指令。执行模块 430具体设置为：当获得的操作指令为多个时，执行被选定的操作指令或者按照预先设置的顺序进行执行。执行模块 530还设置为，将关键字作为执行应用程序或服务进程的信息。装置还包括显示模块 540，设置为显示为操作指令设置的显示信息和 /或动作选项。将该数据处理装置设置在终端中，为使用该终端的用户提供数据处理功能，以便快速启动应用程序或服务。本发明实施例所述的装置的功能已经在图 1-图 4 所示的方法实施例中进行了描述，故本实施例的描述中未详尽之处，可以参见前述实施例中的相关说明，在此不做赘述。尽管为示例目的，已经公开了本发明的优选实施例，本领域的技术人员将意识到各种改进、增加和取代也是可能的，因此，本发明的范围应当不限于上述实施例。工业实用性如上所述，本发明实施例提供的一种数据处理方法、装置和终端，具有以下有益效果：通过检测文本信息，获得与文本信息对应的操作指令，通过触发该操作指令，能够快速启动应用程序，提高了用户体验效果。

Claims

权利要求书、一种数据处理方法，包括：提取用户界面中的文本信息；

基于所述文本信息，获得与所述文本信息对应的操作指令；其中，所述操作指令用于启动应用程序或服务进程；执行所述操作指令。、如权利要求 1所述的方法，其中，基于所述文本信息，获得与所述文本信息对应的操作指令，包括：解析所述文本信息中的关键字；

在预先设置的语法规则库中，检索与所述关键字相对应的操作指令；其中，所述语法规则库中记载了不同的关键字对应的操作指令。、如权利要求 2所述的方法，其中，在解析所述文本信息中的关键字之前，还包括：对提取到的所述文本信息进行容错处理。、如权利要求 2所述的方法，其中，在执行所述操作指令之后，所述方法还包括: 将所述关键字作为执行所述应用程序或服务进程的信息。、如权利要求 1或 2所述的方法，其中，在执行所述操作指令之前，还包括：显示为所述操作指令设置的显示信息和 /或动作选项。、如权利要求 5所述的方法，其中，执行所述操作指令，包括：当获得的操作指令为多个时，执行被选定的操作指令或者按照预先设置的顺序执行。、一种数据处理装置，包括：

提取模块，设置为提取用户界面中的文本信息；

获得模块，设置为基于所述文本信息，获得与所述文本信息对应的操作指令；其中，所述操作指令用于启动应用程序或服务进程；

执行模块，设置为执行所述操作指令。、如权利要求 7所述的装置，其中，所述获得模块具体设置为：解析所述文本信息中的关键字；在预先设置的语法规则库中，检索与所述关键字相对应的操作指令；其中，所述语法规则库中记载了不同的关键字对应的操作指令。、如权利要求 8所述的装置，其中，所述获得模块还设置为：对提取到的所述文本信息进行容错处理。 0、如权利要求 8所述的装置，其中，所述执行模块还设置为，将所述关键字作为执行所述应用程序或服务进程的信息。 1、如权利要求 7或 8所述的装置，其中，所述装置还包括显示模块，设置为显示为所述操作指令设置的显示信息和 /或动作选项。、如权利要求 11所述的装置，其中，执行模块具体设置为：当获得的操作指令为多个时，执行被选定的操作指令或者按照预先设置的顺序进行触发。 3、一种终端，所述终端使用权利要求 7-12任一项所述的数据处理装置。