CN108227565A - 一种信息处理方法、终端及计算机可读介质 - Google Patents

一种信息处理方法、终端及计算机可读介质 Download PDF

Info

Publication number
CN108227565A
CN108227565A CN201711323962.0A CN201711323962A CN108227565A CN 108227565 A CN108227565 A CN 108227565A CN 201711323962 A CN201711323962 A CN 201711323962A CN 108227565 A CN108227565 A CN 108227565A
Authority
CN
China
Prior art keywords
information
operated
models
trained
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711323962.0A
Other languages
English (en)
Inventor
徐宇垚
张淼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Het Data Resources and Cloud Technology Co Ltd
Original Assignee
Shenzhen Het Data Resources and Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Het Data Resources and Cloud Technology Co Ltd filed Critical Shenzhen Het Data Resources and Cloud Technology Co Ltd
Priority to CN201711323962.0A priority Critical patent/CN108227565A/zh
Publication of CN108227565A publication Critical patent/CN108227565A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/04Programme control other than numerical control, i.e. in sequence controllers or logic controllers
    • G05B19/042Programme control other than numerical control, i.e. in sequence controllers or logic controllers using digital processors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Automation & Control Theory (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例公开了一种信息处理方法、终端及计算机可读介质,其中方法包括:获取待操作信息,所述待操作信息至少包括目标操作对象和目标操作;将所述待操作信息作为翻译模型的输入,从而获得对应的目标控制指令,其中,所述翻译模型为预先训练好的;根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息所对应的目标操作;采用本发明实施例,能够提升指令识别的准确率。

Description

一种信息处理方法、终端及计算机可读介质
技术领域
本发明涉及信息技术领域,尤其涉及一种信息处理方法、终端及计算机可读介质。
背景技术
随着终端技术的发展,目前支持用户直接通过语音对终端(如智能手机、智能家居设备)进行指令控制。但由于受使用环境、用户发音及语法结构等因素的影像,使得终端出现语音识别错误或无法识别的问题。为解决上述问题,现有技术提出以下两种语音指令控制方案。
第一种方案,系统自定义命令和系统截取屏幕并识别图片中可操作区域,可操作区域包括图标、按钮、文本标签等界面控件,然后生成对应的命令集库;系统采集语音,通过在线或离线的方式对语音进行识别为文字,系统匹配文字与命令集库,识别语音控制命令,系统模拟控制命令对应的操控动作或通知应用进行操作,实现语音操控目标。然而在实践中发现,由于图片识别的效果不佳存在误差,导致命令集库不精确,同样存在误差。其次,可操作区域内识别到的数据并非都是命令数据,其大多数为非控制命令数据,因此命令集库的识别效率较低、精确度较差。此外,系统直接将文字与命令集库中的命令进行简单匹配,匹配较好的命令不多,匹配效率较低。
第二种方案,将终端接收的语音数据打包发送到服务器;将语音数据与服务器中的训练样本进行匹配,确定合适的识别语音文本;根据服务器返回的识别语音文本内容命令移动终端执行对应的操作。然而在实践中发现,由于用户发音方式不同,直接将语音数据与训练样本数据进行匹配容易产生匹配错误,降低语音识别的准确性。
发明内容
本发明实施例提供一种信息处理方法,利用预存的翻译模型识别并获取获取待操作信息所对应的目标控制指令,能够提升指令识别的准确率。
第一方面,本发明实施例提供了一种信息处理方法,该方法包括:
获取待操作信息,所述待操作信息至少包括目标操作对象和目标操作;
将所述待操作信息作为预存的翻译模型的输入,从而获得对应的目标控制指令;其中,所述翻译模型为预先训练好的;
根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息所对应的目标操作。
一些可能的实施例中,所述方法还包括:
获取训练数据,所述训练数据包括多个操作信息以及所述多个操作信息各自对应的控制指令;
利用所述训练数据对训练模型进行学习和训练,从而获得训练后的所述翻译模型。
一些可能的实施例中,所述训练模型包括以下中的任一项:序列翻译seq2seq模型、对偶学习dual-learning模型、零翻译Zero-Shot Translation模型。
一些可能的实施例中,当所述训练模型为序列翻译seq2seq模型时,所述seq2seq模型是由编码器、解码器以及与所述编码器和所述解码器耦合的注意力attention机制构成;
其中,所述编码器和所述解码器是基于神经网络模型创建而得的,所述神经网络模型包括但不限于以下中的任一项:卷积神经网络CNN模型、循环神经网络RNN模型、深度神经网络DNN模型、反向传播BP神经网络模型、长短期记忆网络LSTM模型、门重复单元GRU模型。
一些可能的实施例中,所述利用所述训练数据对训练模型进行学习和训练,从而获得训练后的所述翻译模型包括:
将所述多个操作信息以及所述多个操作信息各自对应的控制指令分别作为所述编码器和所述解码器的输入,以对所述训练模型进行学习和训练,从而获得训练后的所述翻译模型。
一些可能的实施例中,所述获取用户输入的待操作信息包括:
获取待操作的初始信息;
对所述初始信息进行预处理,从而获得所述待操作信息;其中,所述预处理包括以下操作处理中的任一项或多项的组合:文本转换、切词处理、词性标注、主干词提取、词汇删除、词汇停用、语法纠正、词性转换、词汇转换。
一些可能的实施例中,所述待操作信息包括以下中的任一项或多项的组合:语音信息以及文本信息。
第二方面,本发明实施例提供了一种终端,该终端包括用于执行上述第一方面的方法的单元。
第三方面,本发明实施例提供了另一种终端,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储支持终端执行上述方法的计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述第一方面的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。
本发明实施例可获取待操作信息,所述待操作信息至少包括目标操作对象和目标操作,然后将所述待操作信息作为翻译模型的输入,从而获得对应的目标控制指令,其中,所述翻译模型为预先训练好的,最后根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息所对应的目标操作;这样能够解决现有技术中指令识别准确率较低等问题,从而提升了指令识别的准确率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种信息处理方法的示意流程图;
图2是本发明实施例提供的一种网络框架示意图;
图3是本发明另一实施例提供的一种信息处理方法的示意流程图;
图4是本发明实施例提供的一种终端的示意性框图;
图5是本发明另一实施例提供的一种终端的示意性框图;
图6是本发明另一实施例提供的一种终端的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
具体实现中,本发明实施例中描述的终端包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的其它便携式设备。还应当理解的是,在某些实施例中,所述设备并非便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。
在接下来的讨论中,描述了包括显示器和触摸敏感表面的终端。然而,应当理解的是,终端可以包括诸如物理键盘、鼠标和/或控制杆的一个或多个其它物理用户接口设备。
终端支持各种应用程序,例如以下中的一个或多个:绘图应用程序、演示应用程序、文字处理应用程序、网站创建应用程序、盘刻录应用程序、电子表格应用程序、游戏应用程序、电话应用程序、视频会议应用程序、电子邮件应用程序、即时消息收发应用程序、锻炼支持应用程序、照片管理应用程序、数码相机应用程序、数字摄影机应用程序、web浏览应用程序、数字音乐播放器应用程序和/或数字视频播放器应用程序。
可以在终端上执行的各种应用程序可以使用诸如触摸敏感表面的至少一个公共物理用户接口设备。可以在应用程序之间和/或相应应用程序内调整和/或改变触摸敏感表面的一个或多个功能以及终端上显示的相应信息。这样,终端的公共物理架构(例如,触摸敏感表面)可以支持具有对用户而言直观且透明的用户界面的各种应用程序。
参见图1,是本发明实施例提供一种信息处理方法的示意流程图,如图1所示的方法可包括如下实施步骤:
步骤S102:终端获取待操作信息,所述待操作信息至少包括目标操作对象和目标操作。
所述待操作信息为用户输入的待操作的指令信息,该指令信息用于指示对目标操作对象进行目标操作。所述待操作信息的输入形式本发明不做限定,可以是文本信息、语音信息、图片信息等等。
步骤S104:所述终端将所述待操作信息作为翻译模型的输入,获得对应的目标控制指令;其中,所述翻译模型为预先训练好的。
所述翻译模型为所述终端预先根据训练数据训练而得的,是预先存储至所述终端的;具体将在下文进行详细阐述。
步骤S106:所述终端根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息所对应的目标操作。
下面介绍本发明涉及的一些具体实施例以及可选实施例。
步骤S104之前,所述终端还需预先训练翻译模型。具体的,所述终端可获取训练数据,所述训练数据包括多个操作信息以及所述多个操作信息各自对应的控制指令。然后所述终端可利用所述训练数据对训练模型进行训练和学习,从而获得训练后的翻译模型。
在可选实施例中,所述终端可获取多个操作信息(如口语文本指令信息),然后根据该多个操作信息生成相应地控制指令,并保存该多个操作信息与多个控制指令的关联关系或映射关系,以作为所述训练数据。即本申请中所述多个操作信息以及所述多个操作信息对应的多个控制指令。其中,一个控制指令可对应一个或多个操作信息。
以所述操作信息为口语文本指令信息为例,如某个操作信息为“空调调26度”,则相应地控制指令应为“空调温度设置26度”。又如另一个操作信息为“把空调设为26度”,其对应的控制指令同样也为“空调温度设置26度”。
在可选实施例中,所述训练模型或所述翻译模型可为用于文本序列的翻译的数学模型,该数学模型包括但不限于以下中的任一项或多项:序列翻译(sequence tosequence,seq2seq)模型、对偶学习dual-learning模型、零翻译Zero-Shot Translation模型、或其他用于文本序列映射的深度学习模型。
下面以所述训练模型为seq2seq模型为例,阐述模型训练的具体过程。应理解的是,所述seq2seq模型是一种深度学习模型,它是处理序列到序列问题的利器。其解决问题的主要思路是通过深度神经网络模型(如常用的是LSTM,长短记忆网络,一种循环神经网络(RNN)等)将一个作为输入的序列映射为一个作为输出的序列,这一过程由编码输入encoder与解码输出decoder两个环节组成。可选地,还可包括注意力机制(AttentionMechanism)。attention是一种在根据模型内部状态动态聚焦于输入或输出不同部分的一种机制。
也即是所述seq2seq模型可包括编码器encoder、解码器decoder以及与所述编码器和所述解码器耦合的注意力机制attention。且所述编码器encoder和所述解码器均是通过神经网络模型而创建的,该神经网络模型包括但不限于以下中的任一项:卷积神经网络(Convolutional Neural Network,CNN)模型、循环神经网络(Recurrent NeuralNetworks,RNN)模型、深度神经网络(Deep Neural Network,DNN)模型、反向传播(Backpropagation,BP)神经网络模型、长短期记忆网络(Long-Short Term Memory,LSTM)模型、门重复单元(Gated Recurrent Unit,GRU)模型、或其他用于深度学习的网络模型。关于所述seq2seq模型本申请不做过多详述。
具体训练过程中,所述终端可将多个操作信息(如大量的口语文本指令信息)作为seq2seq模型中编码器的输入,将所述多个操作信息对应的多个控制指令作为seq2seq模型中解码器的输入,选择相应地神经网络模型作为该编码器和解码器的神经网络,且通过attention机制连接该编码器和解码器,进而对该seq2seq模型中的各个部件进行训练和学习,从而获得训练后的seq2seq模型。
下面介绍本申请涉及的一些具体实施方式。
步骤S102中,终端可获取用户输入的待操作信息,所述待操作信息包括但不限于以下信息中的任一种或多种形式的组合:本文信息、语音信息、图片信息等等。所述待操作信息至少包括待操作的目标操作对象以及目标操作。可选地,所述待操作信息还可包括诸如操作时间、操作动作、操作方位、操作位置、操作参数等等信息,本申请不做限定。
步骤S104中,所述终端将获取的所述待操作信息输入至预先训练好的所述翻译模型,可获得输出相应地的目标控制指令。进一步步骤S106中,所述终端可根据所述目标控制指令的指示,针对所述目标操作对象执行相应地目标操作,如将空调温度设置为26度。
在可选实施例中,步骤S102的一种具体实施方式可为:所述终端获取用户输入的待操作的初始信息,所述初始信息的输入形式本申请不做限定,可以是语音信息、文本信息等等。进一步地,所述终端可对所述初始信息进行预处理,从而获得用户输入的所述待操作信息;其中,所述预处理包括以下操作处理中的任一项或多项的组合:文本转换、切词处理、词性标注、主干词提取、词汇删除、词汇停用、语法纠正、词性转换、词汇转换。
所述预处理为用户侧或终端侧预先自定义设置的操作处理,该操作处理包括但不限于以下操作处理中的任一项或多项的组合:文本转换、分词(或切词)处理、去停用词(如词汇删除、词汇停用等)、词性标注、主干词提取、语法纠正、词性转换、词汇转换(如同义词替换、反义词替换等)等等。关于所述预处理的具体实施过程,本申请不做详述。
在可选实施例中,为提升信息处理的准确性(如分词的准确性),所述终端可根据预存词典数据库中的词汇对所述a个初始信息进行预处理,如分词处理、去停用词等处理。所述词典数据库中可预先存储有多个自定义的词汇、短语等等,例如字典中的词汇等,以便所述终端按照这些常用词汇对信息进行预处理等。
在可选实施例中,所述终端还可定时/周期性地对所述词典数据库中的词汇进行定期更新,以获得/收集更多的操作信息与控制指令之间的关联关系,或收集更多的控制指令信息。具体的,如用户可在所述词典数据库中添加新词汇、也可添加多个操作信息中所包含的词汇,如设备名、操作动作、操作参数、操作时间、操作位置/地点、方位以及同义词或反义词等词汇。
在可选实施例中,当所述初始信息为语音信息时,所述终端可对所述初始信息进行文本转换处理,从而得到文本形式的初始信息。进一步,可对所述文本形式的初始信息进行预处理操作,如分词、去停用词、词性标注等等,从而获得预处理后的所述待操作信息。进而将所述待操作信息输入至训练好的翻译模型中,输出相应地的目标控制指令,以按照所述目标控制指令对目标操作对象执行相应地目标操作。具体参见图2示出本发明涉及的一种信息处理的具体框架处理示意图。
通过实施本发明实施例,能够通过采集、人工刷选的方式获得多个操作信息,并生成相应地多个控制指令,提升了控制指令生成的精确度。进一步,利用翻译模型(如seq2seq模型)可以是完全由数据驱动的,可提高信息处理的拓展性,不需人工介入训练和处理过程,提升信息处理的效率。可选地,还加入词典数据库,提升信息处理的准确性。
参见图3,是本发明实施例提供又一种信息处理方法的示意流程图,如图3所示的方法可包括如下实施步骤:
步骤S202、获取训练数据,所述训练数据包括多个操作信息以及所述多个操作信息各自对应的控制指令;
步骤S204、利用所述训练数据对训练模型进行学习和训练,从而获得训练后的所述翻译模型。
在可选实施例中,所述训练模型包括以下中的任一项:序列翻译seq2seq模型、对偶学习dual-learning模型、零翻译Zero-Shot Translation模型。
在可选实施例中,当所述训练模型为序列翻译seq2seq模型时,所述seq2seq模型是由编码器、解码器以及与所述编码器和所述解码器耦合的注意力attention机制构成;其中,所述编码器和所述解码器是基于神经网络模型创建而得的,所述神经网络模型包括但不限于以下中的任一项:卷积神经网络CNN模型、循环神经网络RNN模型、深度神经网络DNN模型、反向传播BP神经网络模型、长短期记忆网络LSTM模型、门重复单元GRU模型。
在可选实施例中,当所述训练模型为序列翻译seq2seq模型时,步骤S204的具体实施方式为:将所述多个操作信息以及所述多个操作信息各自对应的控制指令分别作为所述编码器和所述解码器的输入,以对所述训练模型进行学习和训练,从而获得训练后的所述翻译模型。
步骤S206、获取待操作的初始信息;
步骤S208、对所述初始信息进行预处理,从而获得待操作信息;其中,所述预处理包括以下操作处理中的任一项或多项的组合:文本转换、切词处理、词性标注、主干词提取、词汇删除、词汇停用、语法纠正、词性转换、词汇转换。
步骤S210、将所述待操作信息作为翻译模型的输入,从而获得对应的目标控制指令;其中,所述翻译模型为预先训练好的;
步骤S212、根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息所对应的目标操作。
本发明实施例中未示出或未描述的内容可具体参见前述实施例中的相关说明,这里不再赘述。
本发明实施例可获取用户输入的待操作信息,所述待操作信息至少包括目标操作对象和目标操作,然后将所述待操作信息作为翻译模型的输入,从而获得对应的目标控制指令,其中,所述翻译模型为预先训练好的,最后根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息所对应的目标操作;这样能够解决现有技术中指令识别准确率较低等问题,从而提升了指令识别的准确率。
本发明实施例还提供一种终端,该终端用于执行前述任一项所述的方法的单元。具体地,参见图4,是本发明实施例提供的一种终端的示意框图。本实施例的终端400包括:获取单元402、计算单元404以及处理单元406;其中,
所述获取单元402用于获取待操作信息,所述待操作信息至少包括目标操作对象和目标操作;
所述计算单元404用于将所述待操作信息作为翻译模型的输入,从而获得对应的目标控制指令;其中,所述翻译模型为预先训练好的;
所述处理单元406用于根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息所对应的目标操作。
本发明实施例中未示出或未描述的内容可具体参见前述实施例中的相关说明,这里不再赘述。
本发明实施例可获取用户输入的待操作信息,所述待操作信息至少包括目标操作对象和目标操作,然后将所述待操作信息作为翻译模型的输入,从而获得对应的目标控制指令,其中,所述翻译模型为预先训练好的,最后根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息所对应的目标操作;这样能够解决现有技术中指令识别准确率较低等问题,从而提升了指令识别的准确率。
请一并参见图5,是本发明实施例提供的一种终端的示意框图。本实施例的终端400包括如上图4所述实施例中的所述获取单元402、所述计算单元404以及所述处理单元406。可选地,还可包括训练单元408,
所述获取单元402用于获取训练数据,所述训练数据包括多个操作信息以及所述多个操作信息各自对应的控制指令;
所述训练单元408用于利用所述训练数据对训练模型进行学习和训练,从而获得训练后的所述翻译模型。
在可选实施例中,所述训练模型包括以下中的任一项:序列翻译seq2seq模型、对偶学习dual-learning模型、零翻译Zero-Shot Translation模型。
在可选实施例中,当所述训练模型为序列翻译seq2seq模型时,所述seq2seq模型是由编码器、解码器以及与所述编码器和所述解码器耦合的注意力attention机制构成;
其中,所述编码器和所述解码器是基于神经网络模型创建而得的,所述神经网络模型包括但不限于以下中的任一项:卷积神经网络CNN模型、循环神经网络RNN模型、深度神经网络DNN模型、反向传播BP神经网络模型、长短期记忆网络LSTM模型、门重复单元GRU模型。
在可选实施例中,
所述训练单元408用于将所述多个操作信息以及所述多个操作信息各自对应的控制指令分别作为所述编码器和所述解码器的输入,以对所述训练模型进行学习和训练,从而获得训练后的所述翻译模型。
在可选实施例中,
所述获取单元402用于获取待操作的初始信息;
所述处理单元406用于对所述初始信息进行预处理,从而获得所述待操作信息;其中,所述预处理包括以下操作处理中的任一项或多项的组合:文本转换、切词处理、词性标注、主干词提取、词汇删除、词汇停用、语法纠正、词性转换、词汇转换。
在可选实施例中,所述待操作信息包括以下中的任一项或多项的组合:语音信息以及文本信息。
本发明实施例中未示出或未描述的内容可具体参见前述实施例中的相关说明,这里不再赘述。
本发明实施例可获取用户输入的待操作信息,所述待操作信息至少包括目标操作对象和目标操作,然后将所述待操作信息作为翻译模型的输入,从而获得对应的目标控制指令,其中,所述翻译模型为预先训练好的,最后根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息所对应的目标操作;这样能够解决现有技术中指令识别准确率较低等问题,从而提升了指令识别的准确率。
参见图6,是本发明另一实施例提供的一种终端的示意框图。如图所示的本实施例中的终端可以包括:一个或多个处理器801;一个或多个输入设备802,一个或多个输出设备803和存储器804。上述处理器801、输入设备802、输出设备803和存储器804通过总线805连接。存储器802用于存储计算机程序,所述计算机程序包括程序指令,处理器801用于执行存储器802存储的程序指令。其中,处理器801被配置用于调用所述程序指令执行如下操作:
获取待操作信息,所述待操作信息至少包括目标操作对象和目标操作;
将所述待操作信息作为翻译模型的输入,从而获得对应的目标控制指令;其中,所述翻译模型为预先训练好的;
根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息所对应的目标操作。
一些可能的实施例中,所述处理器801还用于:
获取训练数据,所述训练数据包括多个操作信息以及所述多个操作信息各自对应的控制指令;
利用所述训练数据对训练模型进行学习和训练,从而获得训练后的所述翻译模型。
一些可能的实施例中,所述训练模型包括以下中的任一项:序列翻译seq2seq模型、对偶学习dual-learning模型、零翻译Zero-Shot Translation模型。
一些可能的实施例中,当所述训练模型为序列翻译seq2seq模型时,所述seq2seq模型是由编码器、解码器以及与所述编码器和所述解码器耦合的注意力attention机制构成;
其中,所述编码器和所述解码器是基于神经网络模型创建而得的,所述神经网络模型包括但不限于以下中的任一项:卷积神经网络CNN模型、循环神经网络RNN模型、深度神经网络DNN模型、反向传播BP神经网络模型、长短期记忆网络LSTM模型、门重复单元GRU模型。
一些可能的实施例中,所述利用所述训练数据对训练模型进行学习和训练,从而获得训练后的所述翻译模型包括:
将所述多个操作信息以及所述多个操作信息各自对应的控制指令分别作为所述编码器和所述解码器的输入,以对所述训练模型进行学习和训练,从而获得训练后的所述翻译模型。
一些可能的实施例中,所述获取用户输入的待操作信息包括:
获取待操作的初始信息;
对所述初始信息进行预处理,从而获得所述待操作信息;其中,所述预处理包括以下操作处理中的任一项或多项的组合:文本转换、切词处理、词性标注、主干词提取、词汇删除、词汇停用、语法纠正、词性转换、词汇转换。
一些可能的实施例中,所述待操作信息包括以下中的任一项或多项的组合:语音信息以及文本信息。
应当理解,在本发明实施例中,所称处理器801可以是中央处理单元(CentralProcessing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
输入设备802可以包括触控板、指纹采传感器(用于采集用户的指纹信息和指纹的方向信息)、麦克风等,输出设备803可以包括显示器(LCD等)、扬声器等。
该存储器804可以包括只读存储器和随机存取存储器,并向处理器801提供指令和数据。存储器804的一部分还可以包括非易失性随机存取存储器。例如,存储器804还可以存储设备类型的信息。
具体实现中,本发明实施例中所描述的处理器801、输入设备802、输出设备803可执行本发明实施例提供的所述方法实施例中所描述的实现方式,也可执行本发明实施例所描述的终端的实现方式,在此不再赘述。
在本发明的另一实施例中提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时实现如上所述方法实施例中的所有或部分实施方式或实施步骤。
所述计算机可读存储介质可以是前述任一实施例所述的终端的内部存储单元,例如终端的硬盘或内存。所述计算机可读存储介质也可以是所述终端的外部存储设备,例如所述终端上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述终端的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的终端和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的终端和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种信息处理方法,其特征在于,所述方法包括:
获取待操作信息,所述待操作信息至少包括目标操作对象和目标操作;
将所述待操作信息作为预存的翻译模型的输入,以获得对应的目标控制指令;
根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息所对应的目标操作。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取训练数据,所述训练数据包括多个操作信息以及所述多个操作信息各自对应的控制指令;
利用所述训练数据对训练模型进行学习和训练,获得训练后的所述翻译模型。
3.根据权利要求2所述的方法,其特征在于,所述训练模型包括以下中的任一项:序列翻译seq2seq模型、对偶学习dual-learning模型、零翻译Zero-ShotTranslation模型。
4.根据权利要求3所述的方法,其特征在于,
当所述训练模型为序列翻译seq2seq模型时,所述seq2seq模型是由编码器、解码器以及与所述编码器和所述解码器耦合的注意力attention机制构成;
其中,所述编码器和所述解码器是基于神经网络模型创建而得的,所述神经网络模型包括但不限于以下中的任一项:卷积神经网络CNN模型、循环神经网络RNN模型、深度神经网络DNN模型、反向传播BP神经网络模型、长短期记忆网络LSTM模型、门重复单元GRU模型。
5.根据权利要求4所述的方法,其特征在于,所述利用所述训练数据对训练模型进行学习和训练,获得训练后的所述翻译模型包括:
将所述多个操作信息以及所述多个操作信息各自对应的控制指令分别作为所述编码器和所述解码器的输入,以对所述训练模型进行学习和训练,从而获得训练后的所述翻译模型。
6.根据权利要求1所述的方法,其特征在于,所述获取待操作信息包括:
获取待操作的初始信息;
对所述初始信息进行预处理,获得所述待操作信息;其中,所述预处理包括以下操作处理中的任一项或多项的组合:文本转换、切词处理、词性标注、主干词提取、词汇删除、词汇停用、语法纠正、词性转换、词汇转换。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述待操作信息包括以下中的任一项或多项的组合:语音信息、文本信息以及图片信息。
8.一种终端,其特征在于,包括用于执行如权利要求1-7任一权利要求所述的方法的单元。
9.一种终端,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。
CN201711323962.0A 2017-12-12 2017-12-12 一种信息处理方法、终端及计算机可读介质 Pending CN108227565A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711323962.0A CN108227565A (zh) 2017-12-12 2017-12-12 一种信息处理方法、终端及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711323962.0A CN108227565A (zh) 2017-12-12 2017-12-12 一种信息处理方法、终端及计算机可读介质

Publications (1)

Publication Number Publication Date
CN108227565A true CN108227565A (zh) 2018-06-29

Family

ID=62649463

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711323962.0A Pending CN108227565A (zh) 2017-12-12 2017-12-12 一种信息处理方法、终端及计算机可读介质

Country Status (1)

Country Link
CN (1) CN108227565A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109190578A (zh) * 2018-09-13 2019-01-11 合肥工业大学 基于时域卷积网络与循环神经网络融合的手语视频翻译方法
CN109408626A (zh) * 2018-11-09 2019-03-01 苏州思必驰信息科技有限公司 对自然语言进行处理的方法及装置
CN109543017A (zh) * 2018-11-21 2019-03-29 广州语义科技有限公司 法律问题关键词生成方法及其系统
CN109741751A (zh) * 2018-12-11 2019-05-10 上海交通大学 面向智能语音控制的意图识别方法及装置
CN110875035A (zh) * 2019-10-24 2020-03-10 广州多益网络股份有限公司 新型多任务联合的语音识别训练架构和方法
CN110927791A (zh) * 2018-09-20 2020-03-27 中国石油化工股份有限公司 基于深度学习利用地震数据进行流体预测的方法及装置
CN110930499A (zh) * 2019-10-12 2020-03-27 深圳国泰安教育技术有限公司 一种3d数据处理方法及装置
CN111061881A (zh) * 2019-12-27 2020-04-24 浪潮通用软件有限公司 文本分类方法、设备及存储介质
CN111343204A (zh) * 2020-05-18 2020-06-26 鹏城实验室 控制命令混淆方法、装置及计算机可读存储介质
CN111352348A (zh) * 2018-12-24 2020-06-30 北京三星通信技术研究有限公司 设备控制方法、装置、电子设备及计算机可读存储介质
CN112309377A (zh) * 2019-07-18 2021-02-02 Tcl集团股份有限公司 一种智能洗浴控制方法、设备及存储介质
CN115797878A (zh) * 2023-02-13 2023-03-14 中建科技集团有限公司 基于图像处理的设备操作安全检测方法、系统及相关设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150178321A1 (en) * 2012-04-10 2015-06-25 Google Inc. Image-based 3d model search and retrieval
CN106503236A (zh) * 2016-10-28 2017-03-15 北京百度网讯科技有限公司 基于人工智能的问题分类方法以及装置
CN107346340A (zh) * 2017-07-04 2017-11-14 北京奇艺世纪科技有限公司 一种用户意图识别方法及系统
CN107451230A (zh) * 2017-07-24 2017-12-08 宗晖(上海)机器人有限公司 一种问答方法以及问答系统
CN107451433A (zh) * 2017-06-27 2017-12-08 中国科学院信息工程研究所 一种基于文本内容的信息源识别方法与装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150178321A1 (en) * 2012-04-10 2015-06-25 Google Inc. Image-based 3d model search and retrieval
CN106503236A (zh) * 2016-10-28 2017-03-15 北京百度网讯科技有限公司 基于人工智能的问题分类方法以及装置
CN107451433A (zh) * 2017-06-27 2017-12-08 中国科学院信息工程研究所 一种基于文本内容的信息源识别方法与装置
CN107346340A (zh) * 2017-07-04 2017-11-14 北京奇艺世纪科技有限公司 一种用户意图识别方法及系统
CN107451230A (zh) * 2017-07-24 2017-12-08 宗晖(上海)机器人有限公司 一种问答方法以及问答系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐宇垚: "基于改进PCA-SOM神经网络的文本分类研究", 《信息科技辑》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109190578B (zh) * 2018-09-13 2019-10-18 合肥工业大学 基于时域卷积网络与循环神经网络融合的手语视频翻译方法
CN109190578A (zh) * 2018-09-13 2019-01-11 合肥工业大学 基于时域卷积网络与循环神经网络融合的手语视频翻译方法
CN110927791B (zh) * 2018-09-20 2022-01-25 中国石油化工股份有限公司 基于深度学习利用地震数据进行流体预测的方法及装置
CN110927791A (zh) * 2018-09-20 2020-03-27 中国石油化工股份有限公司 基于深度学习利用地震数据进行流体预测的方法及装置
CN109408626A (zh) * 2018-11-09 2019-03-01 苏州思必驰信息科技有限公司 对自然语言进行处理的方法及装置
CN109543017A (zh) * 2018-11-21 2019-03-29 广州语义科技有限公司 法律问题关键词生成方法及其系统
CN109543017B (zh) * 2018-11-21 2022-12-13 广州语义科技有限公司 法律问题关键词生成方法及其系统
CN109741751A (zh) * 2018-12-11 2019-05-10 上海交通大学 面向智能语音控制的意图识别方法及装置
CN111352348A (zh) * 2018-12-24 2020-06-30 北京三星通信技术研究有限公司 设备控制方法、装置、电子设备及计算机可读存储介质
CN112309377A (zh) * 2019-07-18 2021-02-02 Tcl集团股份有限公司 一种智能洗浴控制方法、设备及存储介质
CN110930499A (zh) * 2019-10-12 2020-03-27 深圳国泰安教育技术有限公司 一种3d数据处理方法及装置
CN110930499B (zh) * 2019-10-12 2023-10-13 深圳国匠云职业教育科技有限公司 一种3d数据处理方法及装置
CN110875035A (zh) * 2019-10-24 2020-03-10 广州多益网络股份有限公司 新型多任务联合的语音识别训练架构和方法
CN111061881A (zh) * 2019-12-27 2020-04-24 浪潮通用软件有限公司 文本分类方法、设备及存储介质
CN111343204A (zh) * 2020-05-18 2020-06-26 鹏城实验室 控制命令混淆方法、装置及计算机可读存储介质
CN115797878A (zh) * 2023-02-13 2023-03-14 中建科技集团有限公司 基于图像处理的设备操作安全检测方法、系统及相关设备

Similar Documents

Publication Publication Date Title
CN108227565A (zh) 一种信息处理方法、终端及计算机可读介质
CN108108094A (zh) 一种信息处理方法、终端及计算机可读介质
CN111310440B (zh) 文本的纠错方法、装置和系统
CN111145754B (zh) 语音输入方法、装置、终端设备及存储介质
US11488577B2 (en) Training method and apparatus for a speech synthesis model, and storage medium
CN107679032A (zh) 语音转换纠错方法和装置
CN112328761B (zh) 一种意图标签设置方法、装置、计算机设备及存储介质
CN111985229A (zh) 一种序列标注方法、装置及计算机设备
CN110427627A (zh) 基于语义表示模型的任务处理方法和装置
CN108227564A (zh) 一种信息处理方法、终端及计算机可读介质
CN110010136B (zh) 韵律预测模型的训练和文本分析方法、装置、介质和设备
CN111414561B (zh) 用于呈现信息的方法和装置
WO2020001329A1 (zh) 一种输入预测方法及装置
US20230055233A1 (en) Method of Training Voice Recognition Model and Voice Recognition Device Trained by Using Same Method
CN110808032A (zh) 一种语音识别方法、装置、计算机设备及存储介质
WO2023071562A1 (zh) 语音识别文本处理方法、装置、设备、存储介质及程序产品
CN114830139A (zh) 使用模型提供的候选动作训练模型
KR101677859B1 (ko) 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치
CN111653265A (zh) 语音合成方法、装置、存储介质和电子设备
CN106952655A (zh) 一种输入方法和终端
CN112463942A (zh) 文本处理方法、装置、电子设备及计算机可读存储介质
CN111767694A (zh) 文本生成方法、装置和计算机可读存储介质
US20230394720A1 (en) Systems and methods for digital ink generation and editing
CN111653266A (zh) 语音合成方法、装置、存储介质和电子设备
CN112559725A (zh) 文本匹配方法、装置、终端和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180629

RJ01 Rejection of invention patent application after publication