CN108227564A - 一种信息处理方法、终端及计算机可读介质 - Google Patents

一种信息处理方法、终端及计算机可读介质 Download PDF

Info

Publication number
CN108227564A
CN108227564A CN201711323894.8A CN201711323894A CN108227564A CN 108227564 A CN108227564 A CN 108227564A CN 201711323894 A CN201711323894 A CN 201711323894A CN 108227564 A CN108227564 A CN 108227564A
Authority
CN
China
Prior art keywords
information
similarity
operation information
operated
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711323894.8A
Other languages
English (en)
Other versions
CN108227564B (zh
Inventor
徐宇垚
张淼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Hetai Intelligent Home Appliance Controller Co ltd
Original Assignee
Shenzhen Het Data Resources and Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Het Data Resources and Cloud Technology Co Ltd filed Critical Shenzhen Het Data Resources and Cloud Technology Co Ltd
Priority to CN201711323894.8A priority Critical patent/CN108227564B/zh
Publication of CN108227564A publication Critical patent/CN108227564A/zh
Application granted granted Critical
Publication of CN108227564B publication Critical patent/CN108227564B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/04Programme control other than numerical control, i.e. in sequence controllers or logic controllers
    • G05B19/042Programme control other than numerical control, i.e. in sequence controllers or logic controllers using digital processors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Automation & Control Theory (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种信息处理方法、终端及计算机可读介质,其中方法包括:获取待操作信息,所述待操作信息至少包括目标操作对象以及目标操作;根据预存的m个操作信息和所述待操作信息,计算获得n个相似度;确定目标相似度对应的目标控制指令,所述目标相似度为所述n个相似度中的相似度,所述目标控制指令与所述目标相似度对应的操作信息关联;根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息对应的目标操作。采用本发明实施例,能够解决现有技术中指令识别准确率较低等问题,从而提升了指令识别的准确率。

Description

一种信息处理方法、终端及计算机可读介质
技术领域
本发明涉及信息技术领域,尤其涉及一种信息处理方法、终端及计算机可读介质。
背景技术
随着终端技术的发展,目前支持用户直接通过语音对终端(如智能手机、智能家居设备)进行指令控制。但由于受使用环境、用户发音及语法结构等因素的影响,使得终端出现语音识别错误或无法识别的问题。为解决上述问题,现有技术提出以下两种语音指令控制方案。
第一种方案,系统自定义命令和系统截取屏幕并识别图片中可操作区域,可操作区域包括图标、按钮、文本标签等界面控件,然后生成对应的命令集库;系统采集语音,通过在线或离线的方式对语音进行识别为文字,系统匹配文字与命令集库,识别语音控制命令,系统模拟控制命令对应的操控动作或通知应用进行操作,实现语音操控目标。然而在实践中发现,由于图片识别的效果不佳存在误差,导致命令集库不精确,同样存在误差。其次,可操作区域内识别到的数据并非都是命令数据,其大多数为非控制命令数据,因此命令集库的识别效率较低、精确度较差。此外,系统直接将文字与命令集库中的命令进行简单匹配,匹配较好的命令不多,匹配效率较低。
第二种方案,将终端接收的语音数据打包发送到服务器;将语音数据与服务器中的训练样本进行匹配,确定合适的识别语音文本;根据服务器返回的识别语音文本内容命令移动终端执行对应的操作。然而在实践中发现,由于用户发音方式不同,直接将语音数据与训练样本数据进行匹配容易产生匹配错误,降低语音识别的准确性。
发明内容
本发明实施例提供一种信息处理方法,可解决现有技术中指令识别准确率较低等问题,从而提升了指令识别的准确率。
第一方面,本发明实施例提供了一种提示方法,该方法包括:
获取待操作信息,所述待操作信息至少包括目标操作对象以及目标操作;
根据预存的m个操作信息和所述待操作信息,计算获得n个相似度,所述相似度为所述操作信息与所述待操作信息之间的相似度,m和n均为正整数,且n小于或等于m;
在所述n个相似度中确定目标相似度,并根据所确定的目标相似度确定对应的目标控制指令,其中,所述目标控制指令与所述目标相似度对应的操作信息关联;
根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息对应的目标操作。
在一些可能的实施例中,所述在所述n个相似度中确定目标相似度,并根据所确定的目标相似度确定对应的目标控制指令之前,还包括:
创建a个操作信息与b个控制指令之间的关联关系,所述a个操作信息至少包括所述m个操作信息以及所述待操作信息,所述b个控制指令至少包括所述目标控制指令。
在一些可能的实施例中,所述方法还包括:
获取a个第一初始信息;
对所述a个第一初始信息进行预处理,获得对应的所述a个操作信息;其中,所述预处理为用户侧或终端侧预先自定义的操作处理,所述操作处理包括以下处理中的至少一项:文本预处理、格式转换、特征提取以及分类处理。
在一些可能的实施例中,若所述预处理包括文本预处理、格式转换、特征提取以及分类处理,则所述对所述a个第一初始信息进行预处理,从而获得对应的所述a个操作信息包括:
对所述a个第一初始信息进行文本预处理,获得a个第一中间信息;其中,所述文本预处理包括以下中的任一项或多项的组合:文本转换、切词处理、词性标注、主干词提取、词汇删除、词汇停用、语法纠正、词性转换、词汇转换;
对所述a个第一中间信息进行格式转换处理,从而获得具备预设格式的a个第二中间信息;
对所述a个第二中间信息进行特征提取处理,从而获得所述a个操作信息。
在一些可能的实施例中,所述方法还包括:
采用预存的分类模型对所述a个操作信息进行分类处理,从而获得k个分类;其中,每个分类中包括至少一个操作信息,k为正整数,且k小于或等于a。
在一些可能的实施例中,所述根据预存的m个操作信息和所述待操作信息,计算获得n个相似度之前,所述方法还包括:
从所述k个分类中,选取每个分类所包括的操作信息,以获得预存的所述m个操作信息。即,所述m个操作信息包括所述k个分类中每个分类中的操作信息,其中,k小于或等于m。
在一些可能的实施例中,所述特征提取处理包括以下处理中的任一项或多项的组合:奇异值分解SVD、主成分分析PCA、变分自编译器VAE、前向特征构造FFC、聚类分析CA、因子分析FA。
在一些可能的实施例中,所述分类模型包括以下中的任一项:潜在语义索引LSI模型、文档主题生成LDA模型、向量空间VSM模型、文本相似度N-Gram模型。
在一些可能的实施例中,所述获取用户输入的待操作信息包括:
获取待操作的第二初始信息;
对所述第二初始信息进行预处理,从而得到所述待操作信息,其中,所述预处理为用户侧或终端侧预先自定义的操作处理,所述操作处理包括以下处理中的至少一项:文本预处理、格式转换、特征提取以及分类处理。
在一些可能的实施例中,所述根据预存的m个操作信息和所述待操作信息,计算获得n个相似度包括:
从预存的m个操作信息中选取n个操作信息;
采用预设的相似度算法分别计算所述n个操作信息各自与所述待操作信息之间的相似度,从而获得n个相似度。
在一些可能的实施例中,所述相似度算法包括以下算法中的任一项:余弦相似度、皮尔森相关系数、Jaccard相似系数、Tanimoto系数、相对熵。
在一些可能的实施例中,所述待操作信息包括以下信息中的至少一项:语音信息、文本信息以及图片信息。
第二方面,本发明实施例提供了一种终端,该终端包括用于执行上述第一方面的方法的单元。
第三方面,本发明实施例提供了另一种终端,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储支持终端执行上述方法的计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述第一方面的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。
本发明实施例可通过获取待操作信息,所述待操作信息至少包括目标操作对象以及目标操作,然后根据预存的m个操作信息和所述待操作信息,计算获得n个相似度,所述相似度为所述操作信息与所述待操作信息之间的相似度,m和n均为正整数,且n小于或等于m,然后确定目标相似度对应的目标控制指令,所述目标相似度为所述n个相似度中的相似度,所述目标控制指令与所述目标相似度对应的操作信息关联,最后根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息对应的目标操作。采用本发明实施例,能够解决现有技术中指令识别准确率较低等问题,从而提升了指令识别的准确率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种信息处理方法的示意流程图;
图2是本发明实施例提供的一种网络框架示意图;
图3是本发明另一实施例提供的一种信息处理方法的示意流程图;
图4是本发明实施例提供的一种终端的示意性框图;
图5是本发明另一实施例提供的一种终端的示意性框图;
图6是本发明另一实施例提供的一种终端的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
具体实现中,本发明实施例中描述的终端包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的其它便携式设备。还应当理解的是,在某些实施例中,所述设备并非便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。
在接下来的讨论中,描述了包括显示器和触摸敏感表面的终端。然而,应当理解的是,终端可以包括诸如物理键盘、鼠标和/或控制杆的一个或多个其它物理用户接口设备。
终端支持各种应用程序,例如以下中的一个或多个:绘图应用程序、演示应用程序、文字处理应用程序、网站创建应用程序、盘刻录应用程序、电子表格应用程序、游戏应用程序、电话应用程序、视频会议应用程序、电子邮件应用程序、即时消息收发应用程序、锻炼支持应用程序、照片管理应用程序、数码相机应用程序、数字摄影机应用程序、web浏览应用程序、数字音乐播放器应用程序和/或数字视频播放器应用程序。
可以在终端上执行的各种应用程序可以使用诸如触摸敏感表面的至少一个公共物理用户接口设备。可以在应用程序之间和/或相应应用程序内调整和/或改变触摸敏感表面的一个或多个功能以及终端上显示的相应信息。这样,终端的公共物理架构(例如,触摸敏感表面)可以支持具有对用户而言直观且透明的用户界面的各种应用程序。
参见图1,是本发明实施例提供一种信息处理方法的示意流程图,如图1所示的方法可包括如下实施步骤:
步骤S102:终端获取待操作信息,所述待操作信息至少包括目标操作对象以及目标操作。
所述待操作信息为用户输入的待操作的指令信息,该指令信息用于指示对目标操作对象进行目标操作。所述待操作信息的输入形式本发明不做限定,可以是文本信息、语音信息、图片信息等等。
步骤S104:所述终端根据预存的m个操作信息和所述待操作信息,计算获得n个相似度,所述相似度为所述操作信息与所述待操作信息之间的相似度,m和n均为正整数,且n小于或等于m。
步骤S106:所述终端确定目标相似度对应的目标控制指令,所述目标相似度为所述n个相似度中的相似度,所述目标控制指令与所述目标相似度对应的操作信息关联。
具体的,所述终端可从所述n个相似度中确定出一个目标相似度,然后根据所述目标相似度确定与之对应的目标控制指令,其中该目标控制指令与所述目标相似度对应的操作信息关联,具体实现将在下文进行阐述。
在可选实施例中,所述终端中创建有a个操作信息与b个控制指令之间的关联关系,所述a个操作信息至少包括所述m个操作信息以及所述待操作信息,所述b个控制指令至少包括所述目标控制指令。相应地,步骤S104-S106中所述终端可根据m个操作信息和待操作信息,计算获得n个相似度;相应地从n个相似度中查找出目标相似度,进而获得所述目标相似度对应的目标控制指令。关于所述相似度的计算以及所述目标控制指令的查找将在下文进行具体阐述。
步骤S108:所述终端根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息对应的目标操作。
下面介绍本申请涉及的一些具体实施例和可选实施例。
步骤S104之前,所述终端还需预先创建并存储多个操作信息与多个控制指令之间的关联关系。以a个操作信息和b个控制指令为例,具体的:终端可获取a个操作信息(如口语文本指令信息),根据该a个操作信息生成b个控制指令,并保存该a个操作信息与b个控制指令的关联关系或映射关系。也即是所述终端可创建并保存a个操作信息与b个控制指令的关联关系。其中,一个控制指令可对应一个或多个操作信息,a和b均为正整数,且a大于或等于b。
以所述操作信息为口语文本指令信息为例,如某个操作信息为“空调调26度”,则相应地控制指令应为“空调温度设置26度”。又如另一个操作信息为“把空调设为26度”,其对应的控制指令同样也为“空调温度设置26度”。
在可选实施例中,所述终端获取a个操作信息具体包括:所述终端获取a个第一初始信息,然后对所述a个第一初始信息进行预处理,从而获得对应的所述a个操作信息。其中,所述预处理为用户侧或终端侧自定义设置的操作处理,该操作处理包括但不限于以下处理中的任一项或多项的组合:文本预处理、格式转换、特征提取以及分类处理等等。下面以所述预处理包括上述文本预处理、格式转换、特征提取以及分类处理为例,进行详细阐述。
首先,所述终端可对所述a个第一初始信息进行文本预处理,从而获得a个第一中间信息,该文本预处理为用户侧或终端侧预先自定义设置的,其可包括但不限于以下中的任一项或多项的组合:文本转换、分词(或切词)处理、去停用词(如词汇删除、词汇停用等)、词性标注、主干词提取、语法纠正、词性转换、词汇转换(如同义词替换、反义词替换等)等等。关于所述文本预处理的具体实施过程,本申请不做详述。
在可选实施例中,为实现准确的文本预处理(如准确的分词处理),所述终端可根据预存词典数据库中的词汇对所述a个初始信息进行文本预处理,如分词处理、去停用词等处理。所述词典数据库中可预先存储有多个自定义的词汇、短语等等,例如字典中的词汇等,以便所述终端按照这些常用词汇对信息进行文本预处理等。
在可选实施例中,所述终端还可定时/周期性地对所述词典数据库中的词汇进行定期更新,以获得/收集更多的操作信息与控制指令之间的关联关系,或收集更多的控制指令信息。具体的,如用户可在所述词典数据库中添加新词汇、也可添加多个操作信息中所包含的词汇,如设备名、操作动作、操作参数、操作时间、操作位置/地点、方位以及同义词或反义词等词汇。
接着,所述终端可对所述a个第一中间信息进行格式转换处理,从而获得具备预设格式的a个第二中间信息。所述预设格式同样为用户侧或终端侧自定义设置的,例如向量格式、矩阵格式、十进制格式等等。下面以词频-逆文档频率(term frequency-inversedocument frequency,IF-IDF)向量转换为例,进行详细阐述。
应理解的,IF-IDF是一种用于信息检索和数据挖掘中常用的加权技术。如果某个词、词语或短语(以下统称为词汇)在一篇文章中出现频率较高,且在其他文章出现频率较少,则认为该词汇具备较好的分类区分能力。具体的,本申请可采用以下公式(1)将a个第一中间信息转换为相应地a个第二中间信息(具体为a个IF-IDF向量)。
应理解的是,所述a个第一中间信息经过文本预处理(具体可为分词、去停用词等处理)后,每个第一中间信息是由多个词汇组成的。相应地,利用上述公式(1)可将每个第一中间信息转换为相应地的一个TF-IDF向量(即第二中间信息)。
然后,当数据量较大(即a较大)时,为减少终端的计算负荷,可对数据进行降维处理。即是本申请下面阐述的特征提取处理。具体的,所述终端可对所述a个第二中间信息进行特征提取处理,从而可得到a个操作信息。其中,所述特征提取处理包括但不限于以下降维处理中的任一项或多项的组合:奇异值分解(singular value decomposition,SVD)、主成分分析(principal components analysis,PCA)、变分自编译器(variationalautoencoder,VAE)、反向特征清除(backward feature elimination,BFF)、前向特征构造(forward feature construction,FFC)、聚类分析(cluster analysis,CA)、因子分析(factor analysis,FA)、或其他数据降维处理方法,本发明不做限定。
以SVD特征提取处理为例。应理解的,SVD可以将一个比较复杂的矩阵用更小更简单的几个子矩阵的相乘来表示,这些子矩阵描述的是大矩阵的重要特性。例如描述一个人为例,可被描述为:这个人长得浓眉大眼,方脸,络腮胡,而且带个黑框的眼镜,这样寥寥的几个特征,就可使得别人具备较为清楚的认识。实际中,人脸上的特征是有着无数种的,之所以能这么描述,是因为人具备一些较好抽象/抽取的重要特征,可通过机器学习抽取该重要特征,如SVD方法等。
在可选实施例中,还可包括最后地分类处理。具体的,所述终端可采用预先训练好的分类模型对所述a个操作信息进行分类处理,从而获得k个分类(即k个分类索引index),其中a和k均为正整数,且k小于或等于a。其中,每个分类中可包括一个或多个操作信息。即为属于同一类的操作信息创建相应的分类索引index。
在可选实施例中,所述分类模型可用于将相似度较大的操作信息归为一类,其包括但不限于以下中的任一项:潜在语义索引(latent semantic indexing,LSI)模型、文档主题生成(latent dirichlet allocation,LDA)模型、向量空间(vector space model,VSM)模型、文本相似度N-Gram模型、或者其他用于信息分类的模型。
以所述分类模型为LSI模型为例,所述终端可利用多个特征提取后的第二中间信息和多个控制指令来对LSI模型进行训练和学习,找出词汇之间的关系,从而获得训练好的LSI模型。
下面介绍本申请涉及的一些具体实施方式。
步骤S102中,终端可获取用户输入的待操作信息,所述待操作信息包括但不限于以下信息中的任一种或多种形式的组合:本文信息、语音信息、图片信息等等。所述待操作信息至少包括待操作的目标操作对象以及目标操作。可选地,所述待操作信息还可包括诸如操作时间、操作标识(设备名)、操作方位、操作位置、操作参数等等信息,本申请不做限定。
在可选实施例中,步骤S102的一种具体实施方式为:所述终端获取用户输入的待操作的第二初始信息,所述第二初始信息的输入形式本申请不做限定,可以是语音信息、文本信息等等。进一步地,所述终端可对所述第二初始信息进行预处理,从而获得用户输入的所述待操作信息。关于所述预处理可参见前述实施例中的相关介绍,这里不再赘述。
在可选实施例中,当所述原始信息为语音信息时,所述终端可对所述原始信息进行文本转换处理,从而得到文本形式的初始信息。进一步,可对所述文本形式的初始信息进行其他预处理操作,如文本预处理(分词、去停用词、词性标注等)等,从而获得预处理后的所述待操作信息。以所述预处理为文本预处理为例,参见图2示出本发明涉及的一种信息处理的具体框架处理示意图。
步骤S104中,所述终端可从预存的m个操作信息中选择n个操作信息。其中,所述n个操作信息可包含上述k个分类中每个分类中的一个或多个操作信息,其中n大于或等于k,且n和k均为正整数。或者,所述n个操作信息可为所述m个操作信息中的任意n个,本发明不做限定。进一步地,所述终端可利用预存的相似度算法,分别计算n个操作信息与所述待操作信息各自对应的相似度,从而获得n个相似度。
优选地,所述终端可选取k个分类中每个分类的操作信息,即n个操作信息,然后分别计算每个分类中的操作信息与所述待操作信息间的相似度,从而获得n个相似度。这样可减少终端的计算量,避免与终端预存的m个或更多的操作信息一一进行相似度计算,提高终端运行速率。
参见前述实施例中,当步骤S102中利用的预处理和所述操作信息中使用的预处理完全相同,均包括文本预处理、格式转换以及特征提取时,以预设格式为TF-IDF向量为例。步骤S104中所述终端可分别计算n个TF-IDF向量(即n个操作信息)与一个TF-IDF向量(即一个待操作信息)各自之间的相似度。
在可选实施例中,所述相似度算法为用户侧或终端设备侧预先自定义设置的,其包括但不限于以下算法中的任一项:余弦相似度、皮尔森相关系数、Jaccard相似系数、Tanimoto系数、相对熵(也被称为交叉熵、KL散度Kullback–Leibler divergence)、或其他用于计算信息相似度的算法。
以所述相似度算法为余弦相似度为例,可利用以下公式(2)计算所述待操作信息A和所述操作信息B之间的相似度cosθ。
其中,Ai表示向量A(所述待操作信息)中的第i个元素。同样地,Bi表示向量B(所述操作信息)中的第i个元素。
步骤S106中,所述终端可从n个相似度中选取出一个目标相似度,其中目标相似度选取的规则本申请并不做限定,例如选择相似度数值最大的作为所述目标相似度、又如对所述n个相似度求取平均值,以作为目标相似度、又如取所述n个相似度中的众数作为目标相似度等等。进一步地,所述终端可确定所述目标相似度对应的操作信息,进而确定该操作信息关联的目标控制指令。进而步骤S108中,根据该目标控制指令对目标操作对象执行相应地目标操作,如将空调温度设置为26度。
通过实施本发明实施例,能够通过采集、人工刷选的方式获得多个操作信息,并生成相应地多个控制指令,提升了控制指令生成的精确度。进一步地,利用相似度算法获取目标控制指令,提高目标控制指令匹配的准确率。可选地,还加入词典数据库,提升分词处理的准确性。最后,利用分类模型计算得到的分类(即分类索引index)可完成数据的自动驱动,即在数据较多时,无需人工介入直接通过机器学习完成内部相关步骤实现。
参见图3,是本发明实施例提供又一种信息处理方法的示意流程图,如图3所示的方法可包括如下实施步骤:
步骤S202、获取a个第一初始信息;
步骤S204、对所述a个第一初始信息进行文本预处理,从而获得a个第一中间信息;其中,所述文本预处理包括以下中的任一项或多项的组合:文本转换、切词处理、词性标注、主干词提取、词汇删除、词汇停用、语法纠正、词性转换、词汇转换;
步骤S206、对所述a个第一中间信息进行格式转换处理,从而获得具备预设格式的a个第二中间信息;
步骤S208、对所述a个第二中间信息进行特征提取处理,从而获得所述a个操作信息;
步骤S210、采用预存的分类模型对所述a个操作信息进行分类处理,从而获得k个分类;其中,每个分类中包括至少一个操作信息,k为正整数,且k小于或等于a。
步骤S212、创建a个操作信息与b个控制指令之间的关联关系,所述a个操作信息至少包括所述m个操作信息以及所述待操作信息,所述b个控制指令至少包括所述目标控制指令。
步骤S214、获取待操作的第二初始信息;
步骤S216、对所述第二初始信息进行预处理,从而得到待操作信息,其中,所述预处理为用户侧或终端侧预先自定义的操作处理,所述操作处理包括以下处理中的至少一项:文本预处理、格式转换、特征提取以及分类处理。
关于步骤S216可参见前述步骤S204-步骤S208中的相关阐述,这里不再赘述。
步骤S218、根据预存的m个操作信息和所述待操作信息,计算获得n个相似度,所述相似度为所述操作信息与所述待操作信息之间的相似度,m和n均为正整数,且n小于或等于m;
可选实施例中,所述m个操作信息包括所述k个分类中每个分类中的操作信息,其中,k小于或等于m。
步骤S220、在所述n个相似度中确定目标相似度,并根据所确定的目标相似度确定对应的目标控制指令,所述目标控制指令与所述目标相似度对应的操作信息关联;
步骤S222、根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息对应的目标操作。
本发明实施例中未示出或未描述的内容可具体参见前述实施例中的相关说明,这里不再赘述。
本发明实施例可通过获取用户输入的待操作信息,所述待操作信息至少包括目标操作对象以及目标操作,然后根据预存的m个操作信息和所述待操作信息,计算获得n个相似度,所述相似度为所述操作信息与所述待操作信息之间的相似度,m和n均为正整数,且n小于或等于m,然后确定目标相似度对应的目标控制指令,所述目标相似度为所述n个相似度中的相似度,所述目标控制指令与所述目标相似度对应的操作信息关联,最后根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息对应的目标操作。采用本发明实施例,能够解决现有技术中指令识别准确率较低等问题,从而提升了指令识别的准确率。
本发明实施例还提供一种终端,该终端用于执行前述任一项所述的方法的单元。具体地,参见图4,是本发明实施例提供的一种终端的示意框图。本实施例的终端400包括:获取单元402、计算单元404、确定单元406以及处理单元408;其中,
所述获取单元402用于获取待操作信息,所述待操作信息至少包括目标操作对象以及目标操作;
所述计算单元404用于根据预存的m个操作信息和所述待操作信息,计算获得n个相似度,所述相似度为所述操作信息与所述待操作信息之间的相似度,m和n均为正整数,且n小于或等于m;
所述确定单元406用于在所述n个相似度中确定目标相似度,并根据所确定的目标相似度确定对应的目标控制指令,所述目标控制指令与所述目标相似度对应的操作信息关联;
所述处理单元408用于根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息对应的目标操作。
本发明实施例中未示出或未描述的内容可具体参见前述实施例中的相关说明,这里不再赘述。
本发明实施例可通过获取用户输入的待操作信息,所述待操作信息至少包括目标操作对象以及目标操作,然后根据预存的m个操作信息和所述待操作信息,计算获得n个相似度,所述相似度为所述操作信息与所述待操作信息之间的相似度,m和n均为正整数,且n小于或等于m,然后确定目标相似度对应的目标控制指令,所述目标相似度为所述n个相似度中的相似度,所述目标控制指令与所述目标相似度对应的操作信息关联,最后根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息对应的目标操作。采用本发明实施例,能够解决现有技术中指令识别准确率较低等问题,从而提升了指令识别的准确率。
请一并参见图5,是本发明实施例提供的又一种终端的示意框图。本实施例的终端400包括可包括上述图4所述实施例中的所述获取单元402、所述计算单元404、所述确定单元406以及所述处理单元408;还可包括创建单元410,
所述创建单元410用于创建a个操作信息与b个控制指令之间的关联关系,所述a个操作信息至少包括所述m个操作信息以及所述待操作信息,所述b个控制指令至少包括所述目标控制指令。
在一些可能的实施例中,
所述获取单元402还用于获取a个第一初始信息;
所述处理单元406还用于对所述a个第一初始信息进行预处理,从而获得对应的所述a个操作信息;其中,所述预处理为用户侧或终端侧预先自定义的操作处理,所述操作处理包括以下处理中的至少一项:文本预处理、格式转换、特征提取以及分类处理。
在一些可能的实施例中,若所述预处理包括文本预处理、格式转换、特征提取以及分类处理,
所述处理单元406用于对所述a个第一初始信息进行文本预处理,从而获得a个第一中间信息;其中,所述文本预处理包括以下中的任一项或多项的组合:文本转换、切词处理、词性标注、主干词提取、词汇删除、词汇停用、语法纠正、词性转换、词汇转换;
所述处理单元406还用于对所述a个第一中间信息进行格式转换处理,从而获得具备预设格式的a个第二中间信息;
所述处理单元406还用于对所述a个第二中间信息进行特征提取处理,从而获得所述a个操作信息。
在一些可能的实施例中,
所述处理单元406还用于采用预存的分类模型对所述a个操作信息进行分类处理,从而获得k个分类;其中,每个分类中包括至少一个操作信息,k为正整数,且k小于或等于a。
在一些可能的实施例中,
所述处理单元406还用于从所述k个分类中,选取每个分类所包括的操作信息,以获得预存的所述m个操作信息,其中,k小于或等于m。即,所述m个操作信息包括所述k个分类中每个分类中的操作信息,其中,k小于或等于m。
在一些可能的实施例中,所述特征提取处理包括以下处理中的任一项或多项的组合:奇异值分解SVD、主成分分析PCA、变分自编译器VAE、前向特征构造FFC、聚类分析CA、因子分析FA。
在一些可能的实施例中,所述分类模型包括以下中的任一项:潜在语义索引LSI模型、文档主题生成LDA模型、向量空间VSM模型、文本相似度N-Gram模型。
在一些可能的实施例中,
所述获取单元402还用于待操作的第二初始信息;
所述处理单元406还用于对所述第二初始信息进行预处理,从而得到所述待操作信息,其中,所述预处理为用户侧或终端侧预先自定义的操作处理,所述操作处理包括以下处理中的至少一项:文本预处理、格式转换、特征提取以及分类处理。
本发明实施例中未示出或未描述的内容可具体参见前述实施例中的相关说明,这里不再赘述。
本发明实施例可通过获取用户输入的待操作信息,所述待操作信息至少包括目标操作对象以及目标操作,然后根据预存的m个操作信息和所述待操作信息,计算获得n个相似度,所述相似度为所述操作信息与所述待操作信息之间的相似度,m和n均为正整数,且n小于或等于m,然后确定目标相似度对应的目标控制指令,所述目标相似度为所述n个相似度中的相似度,所述目标控制指令与所述目标相似度对应的操作信息关联,最后根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息对应的目标操作。采用本发明实施例,能够解决现有技术中指令识别准确率较低等问题,从而提升了指令识别的准确率。
参见图6,是本发明另一实施例提供的一种终端的示意框图。如图所示的本实施例中的终端可以包括:一个或多个处理器801;一个或多个输入设备802,一个或多个输出设备803和存储器804。上述处理器801、输入设备802、输出设备803和存储器804通过总线805连接。存储器802用于存储计算机程序,所述计算机程序包括程序指令,处理器801用于执行存储器802存储的程序指令。其中,处理器801被配置用于调用所述程序指令执行如下操作:
获取待操作信息,所述待操作信息至少包括目标操作对象以及目标操作;
根据预存的m个操作信息和所述待操作信息,计算获得n个相似度,所述相似度为所述操作信息与所述待操作信息之间的相似度,m和n均为正整数,且n小于或等于m;
在所述n个相似度中确定目标相似度,并根据所确定的目标相似度确定对应的目标控制指令,其中,所述目标控制指令与所述目标相似度对应的操作信息关联;
根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息对应的目标操作。
在一些可能的实施例中,所述确定目标相似度对应的目标控制指令之前,所述处理器801还用于:
创建a个操作信息与b个控制指令之间的关联关系,所述a个操作信息至少包括所述m个操作信息以及所述待操作信息,所述b个控制指令至少包括所述目标控制指令。
在一些可能的实施例中,所述处理器801还用于:
获取a个第一初始信息;
对所述a个第一初始信息进行预处理,从而获得对应的所述a个操作信息;其中,所述预处理为用户侧或终端侧预先自定义的操作处理,所述操作处理包括以下处理中的至少一项:文本预处理、格式转换、特征提取以及分类处理。
在一些可能的实施例中,若所述预处理包括文本预处理、格式转换、特征提取以及分类处理,则所述对所述a个第一初始信息进行预处理,从而获得对应的所述a个操作信息包括:
对所述a个第一初始信息进行文本预处理,从而获得a个第一中间信息;其中,所述文本预处理包括以下中的任一项或多项的组合:文本转换、切词处理、词性标注、主干词提取、词汇删除、词汇停用、语法纠正、词性转换、词汇转换;
对所述a个第一中间信息进行格式转换处理,从而获得具备预设格式的a个第二中间信息;
对所述a个第二中间信息进行特征提取处理,从而获得所述a个操作信息;
采用预存的分类模型对所述a个操作信息进行分类处理,从而获得k个分类;其中,每个分类中包括至少一个操作信息,k为正整数,且k小于或等于a。
在一些实施例中,所述根据预存的m个操作信息和所述待操作信息,计算获得n个相似度之前,所述方法还包括:
从所述k个分类中,选取每个分类所包括的操作信息,以获得预存的所述m个操作信息,其中,k小于或等于m。即,所述m个操作信息包括所述k个分类中每个分类中的操作信息,其中,k小于或等于m。
在一些可能的实施例中,所述特征提取处理包括以下处理中的任一项或多项的组合:奇异值分解SVD、主成分分析PCA、变分自编译器VAE、前向特征构造FFC、聚类分析CA、因子分析FA。
在一些可能的实施例中,所述分类模型包括以下中的任一项:潜在语义索引LSI模型、文档主题生成LDA模型、向量空间VSM模型、文本相似度N-Gram模型。
在一些可能的实施例中,所述获取用户输入的待操作信息包括:
获取待操作的第二初始信息;
对所述第二初始信息进行预处理,从而得到所述待操作信息,其中,所述预处理为用户侧或终端侧预先自定义的操作处理,所述操作处理包括以下处理中的至少一项:文本预处理、格式转换、特征提取以及分类处理。
在一些可能的实施例中,所述根据预存的m个操作信息和所述待操作信息,计算获得n个相似度包括:
从预存的m个操作信息中选取n个操作信息;
采用预设的相似度算法分别计算所述n个操作信息各自与所述待操作信息之间的相似度,从而获得n个相似度。
在一些可能的实施例中,所述相似度算法包括以下算法中的任一项:余弦相似度、皮尔森相关系数、Jaccard相似系数、Tanimoto系数、相对熵。
在一些可能的实施例中,所述待操作信息包括以下信息中的至少一项:语音信息以及文本信息。
应当理解,在本发明实施例中,所称处理器801可以是中央处理单元(CentralProcessing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
输入设备802可以包括触控板、指纹采传感器(用于采集用户的指纹信息和指纹的方向信息)、麦克风等,输出设备803可以包括显示器(LCD等)、扬声器等。
该存储器804可以包括只读存储器和随机存取存储器,并向处理器801提供指令和数据。存储器804的一部分还可以包括非易失性随机存取存储器。例如,存储器804还可以存储设备类型的信息。
具体实现中,本发明实施例中所描述的处理器801、输入设备802、输出设备803可执行本发明实施例提供的所述方法实施例中所描述的实现方式,也可执行本发明实施例所描述的终端的实现方式,在此不再赘述。
在本发明的另一实施例中提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时实现如上所述方法实施例中的所有或部分实施方式或实施步骤。
所述计算机可读存储介质可以是前述任一实施例所述的终端的内部存储单元,例如终端的硬盘或内存。所述计算机可读存储介质也可以是所述终端的外部存储设备,例如所述终端上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述终端的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的终端和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的终端和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (14)

1.一种信息处理方法,其特征在于,所述方法包括:
获取待操作信息,所述待操作信息至少包括目标操作对象以及目标操作;
根据预存的m个操作信息和所述待操作信息,计算获得n个相似度,所述相似度为所述操作信息与所述待操作信息之间的相似度,m和n均为正整数,且n小于或等于m;
在所述n个相似度中确定目标相似度,并根据所确定的目标相似度确定对应的目标控制指令,其中,所述目标控制指令与所述目标相似度对应的操作信息关联;
根据所述目标控制指令的指示,针对所述目标操作对象执行所述待操作信息对应的目标操作。
2.根据权利要求1所述的方法,其特征在于,所述在所述n个相似度中确定目标相似度,并根据所确定的目标相似度确定对应的目标控制指令之前,还包括:
创建a个操作信息与b个控制指令之间的关联关系,所述a个操作信息至少包括所述m个操作信息以及所述待操作信息,所述b个控制指令至少包括所述目标控制指令。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取a个第一初始信息;
对所述a个第一初始信息进行预处理,获得对应的所述a个操作信息;其中,所述预处理为用户侧或终端侧预先自定义的操作处理,所述操作处理包括以下处理中的至少一项:文本预处理、格式转换、特征提取以及分类处理。
4.根据权利要求3所述的方法,其特征在于,若所述预处理包括文本预处理、格式转换、特征提取以及分类处理,则所述对所述a个第一初始信息进行预处理,获得对应的所述a个操作信息包括:
对所述a个第一初始信息进行文本预处理,获得a个第一中间信息;其中,所述文本预处理包括以下中的任一项或多项的组合:文本转换、切词处理、词性标注、主干词提取、词汇删除、词汇停用、语法纠正、词性转换、词汇转换;
对所述a个第一中间信息进行格式转换处理,从而获得具备预设格式的a个第二中间信息;
对所述a个第二中间信息进行特征提取处理,获得所述a个操作信息。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
采用预存的分类模型对所述a个操作信息进行分类处理,获得k个分类;其中,每个分类中包括至少一个操作信息,k为正整数,且k小于或等于a。
6.根据权利要求5所述的方法,其特征在于,所述根据预存的m个操作信息和所述待操作信息,计算获得n个相似度之前,所述方法还包括:
从所述k个分类中,选取每个分类所包括的操作信息,以获得预存的所述m个操作信息,其中,k小于或等于m。
7.根据权利要求4所述的方法,其特征在于,所述特征提取处理包括以下处理中的任一项或多项的组合:奇异值分解SVD、主成分分析PCA、变分自编译器VAE、前向特征构造FFC、聚类分析CA、因子分析FA。
8.根据权利要求4所述的方法,其特征在于,所述分类模型包括以下中的任一项:潜在语义索引LSI模型、文档主题生成LDA模型、向量空间VSM模型、文本相似度N-Gram模型。
9.根据权利要求1-8中任一项所述的方法,其特征在于,所述获取待操作信息包括:
获取待操作的第二初始信息;
对所述第二初始信息进行预处理,获得所述待操作信息,其中,所述预处理为用户侧或终端侧预先自定义的操作处理,所述操作处理包括以下处理中的至少一项:文本预处理、格式转换、特征提取以及分类处理。
10.根据权利要求1-8中任一项所述的方法,其特征在于,所述根据预存的m个操作信息和所述待操作信息,计算获得n个相似度包括:
从预存的m个操作信息中选取n个操作信息;
采用预设的相似度算法分别计算所述n个操作信息各自与所述待操作信息之间的相似度,以获得n个相似度。
11.根据权利要求10所述的方法,其特征在于,所述相似度算法包括以下算法中的任一项:余弦相似度、皮尔森相关系数、Jaccard相似系数、Tanimoto系数、相对熵。
12.一种终端,其特征在于,包括用于执行如权利要求1-11任一权利要求所述的方法的单元。
13.一种终端,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-11任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-11任一项所述的方法。
CN201711323894.8A 2017-12-12 2017-12-12 一种信息处理方法、终端及计算机可读介质 Active CN108227564B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711323894.8A CN108227564B (zh) 2017-12-12 2017-12-12 一种信息处理方法、终端及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711323894.8A CN108227564B (zh) 2017-12-12 2017-12-12 一种信息处理方法、终端及计算机可读介质

Publications (2)

Publication Number Publication Date
CN108227564A true CN108227564A (zh) 2018-06-29
CN108227564B CN108227564B (zh) 2020-07-21

Family

ID=62649460

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711323894.8A Active CN108227564B (zh) 2017-12-12 2017-12-12 一种信息处理方法、终端及计算机可读介质

Country Status (1)

Country Link
CN (1) CN108227564B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109190039A (zh) * 2018-08-29 2019-01-11 腾讯科技(深圳)有限公司 确定相似对象的方法、装置及计算机可读存储介质
CN109858473A (zh) * 2018-12-28 2019-06-07 天津幸福生命科技有限公司 一种自适应纠偏方法、装置、可读介质及电子设备
CN110826627A (zh) * 2019-11-06 2020-02-21 广东三维家信息科技有限公司 图像相似度测量方法、装置及电子设备
CN110874528A (zh) * 2018-08-10 2020-03-10 珠海格力电器股份有限公司 文本相似度的获取方法及装置
CN111222585A (zh) * 2020-01-15 2020-06-02 深圳前海微众银行股份有限公司 数据处理方法、装置、设备及介质
WO2021217974A1 (zh) * 2020-04-28 2021-11-04 平安科技(深圳)有限公司 一种口语语义匹配的方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425640A (zh) * 2012-05-14 2013-12-04 华为技术有限公司 一种多媒体问答系统及方法
US20150178321A1 (en) * 2012-04-10 2015-06-25 Google Inc. Image-based 3d model search and retrieval
CN104750835A (zh) * 2015-04-03 2015-07-01 浪潮集团有限公司 一种文本分类方法及装置
CN105989040A (zh) * 2015-02-03 2016-10-05 阿里巴巴集团控股有限公司 智能问答的方法、装置及系统
CN107122382A (zh) * 2017-02-16 2017-09-01 江苏大学 一种基于说明书的专利分类方法
CN107291697A (zh) * 2017-06-29 2017-10-24 浙江图讯科技股份有限公司 一种语义分析方法、电子设备、存储介质及其诊断系统
CN107436875A (zh) * 2016-05-25 2017-12-05 华为技术有限公司 文本分类方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150178321A1 (en) * 2012-04-10 2015-06-25 Google Inc. Image-based 3d model search and retrieval
CN103425640A (zh) * 2012-05-14 2013-12-04 华为技术有限公司 一种多媒体问答系统及方法
CN105989040A (zh) * 2015-02-03 2016-10-05 阿里巴巴集团控股有限公司 智能问答的方法、装置及系统
CN104750835A (zh) * 2015-04-03 2015-07-01 浪潮集团有限公司 一种文本分类方法及装置
CN107436875A (zh) * 2016-05-25 2017-12-05 华为技术有限公司 文本分类方法及装置
CN107122382A (zh) * 2017-02-16 2017-09-01 江苏大学 一种基于说明书的专利分类方法
CN107291697A (zh) * 2017-06-29 2017-10-24 浙江图讯科技股份有限公司 一种语义分析方法、电子设备、存储介质及其诊断系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐宇垚: "基于改进PCA-SOM神经网络的文本分类研究", 《信息科技辑》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110874528A (zh) * 2018-08-10 2020-03-10 珠海格力电器股份有限公司 文本相似度的获取方法及装置
CN110874528B (zh) * 2018-08-10 2020-11-10 珠海格力电器股份有限公司 文本相似度的获取方法及装置
CN109190039A (zh) * 2018-08-29 2019-01-11 腾讯科技(深圳)有限公司 确定相似对象的方法、装置及计算机可读存储介质
CN109190039B (zh) * 2018-08-29 2021-12-14 腾讯科技(深圳)有限公司 确定相似对象的方法、装置及计算机可读存储介质
CN109858473A (zh) * 2018-12-28 2019-06-07 天津幸福生命科技有限公司 一种自适应纠偏方法、装置、可读介质及电子设备
CN109858473B (zh) * 2018-12-28 2023-03-07 天津幸福生命科技有限公司 一种自适应纠偏方法、装置、可读介质及电子设备
CN110826627A (zh) * 2019-11-06 2020-02-21 广东三维家信息科技有限公司 图像相似度测量方法、装置及电子设备
CN111222585A (zh) * 2020-01-15 2020-06-02 深圳前海微众银行股份有限公司 数据处理方法、装置、设备及介质
WO2021217974A1 (zh) * 2020-04-28 2021-11-04 平安科技(深圳)有限公司 一种口语语义匹配的方法及装置

Also Published As

Publication number Publication date
CN108227564B (zh) 2020-07-21

Similar Documents

Publication Publication Date Title
CN108227564A (zh) 一种信息处理方法、终端及计算机可读介质
CN108108094A (zh) 一种信息处理方法、终端及计算机可读介质
CN108227565A (zh) 一种信息处理方法、终端及计算机可读介质
CN112328761B (zh) 一种意图标签设置方法、装置、计算机设备及存储介质
CN110502610A (zh) 基于文本语义相似度的智能语音签名方法、装置及介质
CN110209812B (zh) 文本分类方法和装置
CN114780727A (zh) 基于强化学习的文本分类方法、装置、计算机设备及介质
CN110459222A (zh) 语音控制方法、语音控制装置及终端设备
EP3115907A1 (en) Common data repository for improving transactional efficiencies of user interactions with a computing device
CN108241741A (zh) 一种文本分类方法、服务器及计算机可读存储介质
CN113722438B (zh) 基于句向量模型的句向量生成方法、装置及计算机设备
CN109508441B (zh) 通过自然语言实现数据统计分析的方法、装置及电子设备
CN107807968A (zh) 基于贝叶斯网络的问答装置、方法及存储介质
EP3732592A1 (en) Intelligent routing services and systems
US11892998B2 (en) Efficient embedding table storage and lookup
CN112699686A (zh) 基于任务型对话系统的语义理解方法、装置、设备及介质
CN114357117A (zh) 事务信息查询方法、装置、计算机设备及存储介质
CN110225210A (zh) 基于通话摘要自动填写工单方法及系统
CN111985243A (zh) 情感模型的训练方法、情感分析方法、装置及存储介质
CN113220828B (zh) 意图识别模型处理方法、装置、计算机设备及存储介质
CN112100360B (zh) 一种基于向量检索的对话应答方法、装置和系统
CN111898363B (zh) 文本长难句的压缩方法、装置、计算机设备及存储介质
CN110347696B (zh) 数据转换方法、装置、计算机设备以及存储介质
CN111767720A (zh) 一种标题生成方法、计算机及可读存储介质
CN111737607A (zh) 数据处理方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 518000 Guangdong science and technology innovation and Research Institute, Shenzhen, Shenzhen, Nanshan District No. 6, science and technology innovation and Research Institute, Shenzhen, D 10, 1004, 10

Patentee after: Shenzhen Hetai intelligent home appliance controller Co.,Ltd.

Address before: 518000 Guangdong science and technology innovation and Research Institute, Shenzhen, Shenzhen, Nanshan District No. 6, science and technology innovation and Research Institute, Shenzhen, D 10, 1004, 10

Patentee before: SHENZHEN H&T DATA RESOURCES AND CLOUD TECHNOLOGY Ltd.