CN110414582A - 一种模型训练方法、装置、计算设备及存储介质 - Google Patents

一种模型训练方法、装置、计算设备及存储介质 Download PDF

Info

Publication number
CN110414582A
CN110414582A CN201910658355.2A CN201910658355A CN110414582A CN 110414582 A CN110414582 A CN 110414582A CN 201910658355 A CN201910658355 A CN 201910658355A CN 110414582 A CN110414582 A CN 110414582A
Authority
CN
China
Prior art keywords
model training
corpus data
controlled
control
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910658355.2A
Other languages
English (en)
Other versions
CN110414582B (zh
Inventor
胡志华
贾巨涛
谢俊杰
魏德平
吴伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Zhuhai Lianyun Technology Co Ltd
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Zhuhai Lianyun Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai, Zhuhai Lianyun Technology Co Ltd filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN201910658355.2A priority Critical patent/CN110414582B/zh
Publication of CN110414582A publication Critical patent/CN110414582A/zh
Application granted granted Critical
Publication of CN110414582B publication Critical patent/CN110414582B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开了一种模型训练方法、装置、计算设备及存储介质,属于计算机技术领域。所述方法包括:获得用于对智能家居设备进行语音控制的语料数据;确定所述语料数据是否满足模型训练触发条件;在所述语料数据满足所述模型训练触发条件时,根据所述语料数据对语音控制模型进行模型训练,以得到更新后的语音控制模型。通过在语料数据累计到一次程度时才进行模型训练,可以在一定程度上减少模型训练的次数,降低对训练资源的消耗,从而可以节约模型训练资源,同时通过减少模型训练的次数来提高模型训练的效率。

Description

一种模型训练方法、装置、计算设备及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种模型训练方法、装置、计算设备及存储介质。
背景技术
随着大数据的高效计算资源的出现,以及随着人工智能(ArtificialIntelligence,AI)在越来越多领域的应用,机器学习的场景也越来越多,例如在针对智能家居设备进行语音控制的应用场景中,通过机器学习可以得到语音控制模型,该语音控制模型是一种深度学习模型,基于该模型可以对各种智能家居设备进行语音控制。
在使用语音控制模型对智能家居设备进行语音控制之前,需要先对语音控制模型进行模型训练,进而将达到特定的训练条件的模型来进行实际应用。目前,在对前述的语音控制模型进行训练的过程中,一般是在获得一条语音控制信息之后就会立即对模型重新进行训练,这样在一定程度上可以尽量确保模型更新的及时性,但是,由于模型训练的过程比较复杂,不管训练的数据是多少,都会将整个训练流程都运行一遍,所以比较消耗资源,并且花费的时间也较多。
发明内容
本申请实施例提供一种模型训练方法、装置、计算设备及存储介质,用于提高节约模型训练的训练资源,提高模型训练的效率。
第一方面,提供一种模型训练方法,所述方法包括:
获得用于对智能家居设备进行语音控制的语料数据;
确定所述语料数据是否满足模型训练触发条件;
在所述语料数据满足所述模型训练触发条件时,根据所述语料数据对语音控制模型进行模型训练,以得到更新后的语音控制模型。
可选的,确定所述语料数据是否满足模型训练触发条件,包括:
若确定所述语料数据所对应的语音控制信息的数量大于等于第一预定数量,则确定满足所述模型训练触发条件;和/或,
若确定所述语料数据所对应的语音控制信息的类型符合预定分布规则,则确定满足所述模型训练触发条件。
可选的,确定所述语料数据所对应的语音控制信息的类型符合预定分布规则,包括:
对所述语料数据所包括的每条语音控制信息进行语义解析,以得到每条语音控制信息所针对的待控制设备;
若所有的待控制设备的设备类型的种类大于第二预定数量,则确定符合所述预定分布规则。
可选的,若所有的待控制设备的设备类型的种类大于第二预定数量,则确定符合所述预定分布规则,包括:
若所有的待控制设备的设备种类大于所述第二预定数量,且每种待控制设备对应的语音控制信息的数量大于相应的数量阈值,则确定符合所述预定分布规则。
可选的,若所有的待控制设备的设备类型的种类大于第二预定数量,则确定符合所述预定分布规则,包括:
若所有的待控制设备的设备类型的种类大于所述第二预定数量,且所有设备类型中存在具有联动控制关系的第三预定数量的设备类型,则确定符合所述预定分布规则。
可选的,在得到更新后的语音控制模型之后,所述方法还包括:
获得用户输入的目标语音控制信息;
将所述目标语音控制信息输入所述更新后的语音控制模型,以确定所述目标语音控制信息所针对的目标设备以及对应的目标控制指令;
将所述目标控制指令发送给所述目标设备,以使所述目标设备执行与所述目标控制指令对应的操作。
第二方面,提供一种模型训练装置,所述装置包括:
获得模块,用于获得用于对智能家居设备进行语音控制的语料数据;
确定模块,用于确定所述语料数据是否满足模型训练触发条件;
模型训练模块,用于在所述语料数据满足所述模型训练触发条件时,根据所述语料数据对语音控制模型进行模型训练,以得到更新后的语音控制模型。
可选的,所述确定模块用于:
若确定所述语料数据所对应的语音控制信息的数量大于等于第一预定数量,则确定满足所述模型训练触发条件;和/或,
若确定所述语料数据所对应的语音控制信息的类型符合预定分布规则,则确定满足所述模型训练触发条件。
可选的,所述确定模块用于:
对所述语料数据所包括的每条语音控制信息进行语义解析,以得到每条语音控制信息所针对的待控制设备;
若所有的待控制设备的设备类型的种类大于第二预定数量,则确定符合所述预定分布规则。
可选的,所述确定模块用于:
若所有的待控制设备的设备种类大于所述第二预定数量,且每种待控制设备对应的语音控制信息的数量大于相应的数量阈值,则确定符合所述预定分布规则。
可选的,所述确定模块用于:
若所有的待控制设备的设备类型的种类大于所述第二预定数量,且所有设备类型中存在具有联动控制关系的第三预定数量的设备类型,则确定符合所述预定分布规则。
可选的,所述装置还包括设备控制模块,用于:
在所述模型训练模块得到所述更新后的语音控制模型之后,获得用户输入的目标语音控制信息;
将所述目标语音控制信息输入所述更新后的语音控制模型,以确定所述目标语音控制信息所针对的目标设备以及对应的目标控制指令;
将所述目标控制指令发送给所述目标设备,以使所述目标设备执行与所述目标控制指令对应的操作。
第三方面,提供一种计算设备,所述计算设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面中的任一种方法所包括的步骤。
第四方面,供一种存储介质,所述存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行上述第一方面中的任一种方法所包括的步骤。
本申请实施例中,在获得用于对智能家居设备进行语音控制的预料数据之后,可以先判断这些预料数据是否满足预先设定的模型训练触发条件,进一步地,只有在满足模型训练触发条件时,才根据这些预料数据对语音控制模型进行模型,以得到更新后的语音控制模型,也就是说,并非是在一旦获得用于模型训练的语料数据时就立即进行模型训练,而是在累计获得的语料数据符合特定的模型训练触发条件时才进行模型训练,例如是在累计获得的语料数据达到一定的数量时才进行模型训练,因为多个语料数据和一个语料数据在进行模型训练时所消耗的设备训练资源几乎是相同的,并非考虑到一般来说一次模型训练所花费的时间较长,所以在语料数据累计到一次程度时才进行模型训练,可以在一定程度上减少模型训练的次数,降低对训练资源的消耗,从而可以节约训练资源,同时通过减少模型训练的次数来提高模型训练的效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例中的模型训练方法的流程图;
图2为本申请实施例中的模型训练装置的结构框图;
图3为本申请实施例中的计算设备的结构示意图;
图4为本申请实施例中的计算设备的另一结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互任意组合。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请的说明书和权利要求书及上述附图中的术语“第一”和“第二”是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的保护。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请中的“多个”可以表示至少两个,例如可以是两个、三个或者更多个,本申请实施例不做限制。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,在不做特别说明的情况下,一般表示前后关联对象是一种“或”的关系。
为了更好的理解本申请实施例中的技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
请参见图1,本申请实施例提供的模型训练方法的流程描述如下。
步骤101:获得用于对智能家居设备进行语音控制的预料数据。
其中,智能家居设备例如包括智能电视、智能冰箱、智能空调、智能音箱、智能电饭煲、智能窗帘等智能电子设备,这些智能家居设备可以通过语音进行控制,例如,用于在需要开启空调时,则可以通过说出“打开空调”或者“开启空调”的语音来对控制进行控制,语音控制的方式比较方便,所以也越来越受到用户的喜欢。
智能家居设备能够对用户的语音进行响应,一般是通过预先训练好的语音控制模型对语音进行识别、解析进而产生相应的控制指令,智能家居设备再执行该控制指令以实现相应的设备功能,从而实现对智能家居设备的语音控制。所以,针对智能家居设备的语音控制模型的训练是比较重要的。在具体实施过程中,在智能家居设备出厂之前,设备生产商可以将预先训练好的语音控制模型内置到智能家居设备中,这样,终端用户在收到智能家居设备之后,则可以利用内置的语音控制模型对其进行语音控制。在另一种实施方式中,设备生产商也可以将语音控制模型共享在云端,而用户在进行语音控制时,智能家居设备可以将获得的控制语音上传到云端,由云端利用本地的语音控制模型对控制语音进行识别和解析,进而得到相应的控制指令。
需要说明的是,语音控制模型是可以动态更新的,例如可以在智能家居设备自身进行本地更新,或者可以在云端进行更新,或者还可以采取其它的方式进行更新。具体的,语音控制模型的更新可以是对语音控制模型进行更新训练,通过对语音控制模型进行更新训练,可以逐渐提高语音控制模型进行语音识别和控制的准确性,并且可以根据用户和市场的变化来进行对应的功能控制更新,以尽量满足实际的用户使用需求。
而本申请实施例中的步骤101中所获得的语料数据,用于对语音控制模型进行模型训练的语料数据样本,而这里所说的模型训练可以针对语音控制模型的首次训练,或者也可以是首次训练之后的模型更新训练,本申请实施例不做限制。
本申请实施例中的语料数据,如前所述的是以语料数据样本,语料数据可以理解为是语音控制信息,即用来对智能家居设备进行语音控制的语音信息,语料数据可以存放在语料库中。
步骤102:判断获得的语料数据是否满足模型训练触发条件。
如前所述的,本申请实施例可以将获得的语料数据可以存储在语料库中,在对语音控制模型进行模型训练之前,需要先对语料库中用来进行模型训练的语料数据进行检测,只有当累积的语料数据满足模型训练触发条件时,才会使用这些语料数据进行模型训练,而并非是一旦得到一条语料数据就跑一次模型训练的过程中,这样可以在一定程度上减少模型训练的次数,以尽量地降低多次模型训练所消耗的训练资源,并且由于一次完整的模型训练过程需要花费较长的时间,所以通过减少模型训练的次数的方式可以提高模型训练效率。
所以,本申请实施例中的模型训练触发条件,是指累积获得的用于对语音控制模型进行模型训练的语料数据满足特定的要求,只有满足该特定的要求,才能使用这些语料数据进行模型训练,而该模型训练触发条件,可以在一定程度上对模型训练的次数进行限定,例如可以减少模型训练的次数。为便于理解,以下对模型训练触发条件的一些可能的情形进行举例说明。
第一种情形
在一种可能的实施方式中,模型训练触发条件是指语料数据所对应的语音控制信息的数量大于等于第一预定数量,该第一预定数量例如是200或者300,等等,该第一预定数量可以根据职能家居设备的上市时长或者使用时长进行动态调整,例如,在刚开始使用的一段时间内,为了磨合智能家居设备和用户之间的习惯匹配,可以将第一预定数量设置的较小,这样可以在获得较少数量的语音控制信息样本后就及时地进行模型更新训练,而在使用了较长一段时间后,表明用户和智能家居设备之间的磨合可能已经比较匹配,此时可以将第一预定数量设置的较大,这样可以尽量减少模型训练的次数,同时对用户的常规使用的影响也较小。
也就是说,可以在语料库中累积的语料数据所对应的语音控制信息的数量大于等于第一预定数量时,则确定满足前述的模型训练触发条件。由于在训练模型的过程中,对一条语音控制信息进行模型训练的时间和对多条语音控制信息所花费的模型训练时间是差不多的,所以在累积用来进行模型训练的语音控制信息的数量达到一定量的时候才进行一次模型训练,通过对语料数据的批量训练可以减少模型训练的次数,从而节约模型训练的训练资源,同时通过训练次数的减少也可以减少模型训练的总时间,从而可以提高模型训练效率。
第二种情形
在另一种可能的实施方式中,模型训练触发条件是指语料数据所对应的语音控制信息的类型符合预定分布规则,即,若预料数据所对应的语音控制信息的类型符合预定分布规则的话,则可以确定满足前述的模型训练触发条件。语音控制信息符合预定分布规则,不仅可以说明语音控制信息的数量不仅仅是如现有技术中的一条,即并非是在获得一条语音控制信息后就立即进行模型训练,并且还需要符合特定的分布规则,这样可以进一步地对语料数据样本进行要求和限定,从而可以进一步地减少模型训练的次数,进而提高模型训练效率。
首先,可以对语料数据所包括的每条语音控制信息进行语音识别,再对识别结果进行语义解析,进而可以确定每条语音控制信息所针对的待控制设备。例如,语音控制信息是“打开空调”,那么进行语音识别后则可以提取到“打开”这一动词与“空调”这一名词,并且通过语义解析可以将“空调”识别为一种智能家居设备的名称,即可以将“空调”确定为是待控制设备;又例如,语音控制信息是“关闭加湿器”,那么进行语音识别后则可以提取到“关闭”这一动词与“加湿器”这一名词,且通过语义解析可以将“加湿器”识别为一种智能家居设备的名称,即可以将“空调”确定为是待控制设备。
在确定所有的待控制设备之后,可以判断所有的待控制设备的设备类型的种类是否大于第二预定数量,第二预定数量例如是2或者3,若确定大于第二预定数量,则可以确定符合前述的预定分布规则。也就是说,可以在模型训练所针对的智能家居设备的种类是多种的时候才进行模型训练,这样可以通过一次模型训练更新对多个智能家居设备的语音控制更新,通过批量更新的方式不仅可以减少模型训练的数量,还可以实现对多种类型的智能家居设备的批量更新控制。
在一种可选的实施方式中,在所有的待控制设备的设备类型的种类大于第二预定数量时,还可以进一步地的判断每种待控制设备对应的语音控制信息的数量是否大于相应的数量阈值,例如为空调这种类型的待控制设备所设置的数量阈值是10,而对电视这种类型的待控制设备所设置的数量阈值是8,等等,也就是说,针对各种类型的待控制设备所设置的数量阈值可以不同,具体可以根据各种类型的待控制设备的平时使用的频繁程度来进行设置,当然,针对各种类型的待控制设备所设置的数量阈值也可以相同,本申请实施例不做限制。若每种待控制设备对应的语音控制信息的数量大于对应设置的数量阈值,则确定符合前述的预定分布规则。也就是说,在设备种类满足一定条件的基础上,还针对每种类型的设备又设置了进一步地的条件,这样通过双重条件限制的方式可以尽量的减少模型训练的次数,以尽量的提高模型训练的效率。
在另一种可选的实施方式中,在所有的待控制设备的设备类型的种类大于第二预定数量时,还可以进一步地判断所有设备类型中存在具有联动控制关系的设备类型是否达到第三预定数量,这里所述的联动控制关系,是指通过控制一个智能家居设备则可以自动地联动控制另外一个智能家具设备,例如在检测到用户离开家之后,用户可以通过语音控制的方式控制关闭电视,那么通过联动控制的方式则可以进一步地的自动地关闭空调和智能照明设备。也就是说,在设备种类满足一定条件的基础上,还针对联动控制的设备类型进行进一步的条件限制,这样通过双重条件限制的方式可以尽量的减少模型训练的次数,以尽量的提高模型训练的效率。
以上以第一种情形和第二种情形对模型训练触发条件进行了一些举例说明,在具体实施过程中,还可以将第一种情形和第二种情形中的模型训练触发条件结合起来作为另一种可能的模型训练触发条件,或者还可以采用其它的方式来定义模型训练触发条件,只要能够尽量地降低模型训练的次数,则可以在一定程度上减少模型训练的训练资源的占用,同时提供模型训练效率。
步骤103:在获得的预料数据满足模型训练触发条件时,则根据语料数据对语音控制模型进行模型训练,以得到更新后的语音控制模型。
再通过前述方式确定语料库中累积获得的语料数据满足模型训练触发条件之后,则可以根据这些语料数据对语音控制模型进行更新训练,而具体的更新训练过程例如可以采用目前的模型训练方式,此处就不详细说明了,通过模型训练,进而可以得到更新后语音控制模型。
步骤104:利用更新后的语音控制模型对智能家居设备进行控制。
也就是说,在获得更新后的语音控制模型,则可以利用更新的语音控制模型来对用户后续的语音控制信息进行响应。例如,可以获得用户输入的目标语音控制信息,再将该目标语音控制信息输入更新后的语音控制模型,以确定该目标语音控制信息所针对的目标设备以及对应的目标控制指令,然后将确定出的目标控制指令发送给确定出的目标设备,以使该目标设备执行与该目标控制指令对应的操作,从而实现语音控制。通过更新后的语音控制模型对用户的语音控制信息进行响应,可以尽量满足用户变化的语音控制需求,以及可以满足不同差异化的语音控制需求,进而提高对智能家居设备语音控制的准确性,以提高智能家居设备的智能性,并且可以增强用户的使用体验感受。
本申请实施例中,并非是在一旦获得用于模型训练的语料数据时就立即进行模型训练,而是在累计获得的语料数据符合特定的模型训练触发条件时才进行模型训练,例如是在累计获得的语料数据达到一定的数量时才进行模型训练,因为多个语料数据和一个语料数据在进行模型训练时所消耗的设备训练资源几乎是相同的,并非考虑到一般来说一次模型训练所花费的时间较长,所以在语料数据累计到一次程度时才进行模型训练,可以在一定程度上减少模型训练的次数,降低对训练资源的消耗,从而可以节约训练资源,同时通过减少模型训练的次数来提高模型训练的效率。
基于同一发明构思,本申请实施例提供一种模型训练装置。该模型训练装置可以是硬件结构、软件模块、或硬件结构加软件模块。该模型训练装置可以由芯片系统实现,芯片系统可以由芯片构成,也可以包含芯片和其他分立器件。请参见图2所示,本申请实施例中的模型训练装置包括获得模块201、确定模块202和控制模块203,其中:
获得模块201,用于获得用于对智能家居设备进行语音控制的语料数据;
确定模块202,用于确定语料数据是否满足模型训练触发条件;
模型训练模块203,用于在语料数据满足模型训练触发条件时,根据语料数据对语音控制模型进行模型训练,以得到更新后的语音控制模型。
在一种可能的实施方式中,确定模块202用于:
若确定语料数据所对应的语音控制信息的数量大于等于第一预定数量,则确定满足模型训练触发条件;和/或,
若确定语料数据所对应的语音控制信息的类型符合预定分布规则,则确定满足模型训练触发条件。
在一种可能的实施方式中,确定模块202用于:
对语料数据所包括的每条语音控制信息进行语义解析,以得到每条语音控制信息所针对的待控制设备;
若所有的待控制设备的设备类型的种类大于第二预定数量,则确定符合预定分布规则。
在一种可能的实施方式中,确定模块202用于:
若所有的待控制设备的设备种类大于第二预定数量,且每种待控制设备对应的语音控制信息的数量大于相应的数量阈值,则确定符合预定分布规则。
在一种可能的实施方式中,确定模块202用于:
若所有的待控制设备的设备类型的种类大于第二预定数量,且所有设备类型中存在具有联动控制关系的第三预定数量的设备类型,则确定符合预定分布规则。
在一种可能的实施方式中,本申请实施例中的模型训练装置还包括设备控制模块,用于:
在模型训练模块203得到更新后的语音控制模型之后,获得用户输入的目标语音控制信息;
将目标语音控制信息输入更新后的语音控制模型,以确定目标语音控制信息所针对的目标设备以及对应的目标控制指令;
将目标控制指令发送给目标设备,以使目标设备执行与目标控制指令对应的操作。
前述的模型训练方法的实施例涉及的所有相关内容均可以援引到本申请施例中的模型训练装置所对应的功能模块的功能描述,在此不再赘述。
本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,另外,在本申请各个实施例中的各功能模块可以集成在一个处理器中,也可以是单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
基于同一发明构思,本申请实施例还提供一种计算设备,该计算设备例如是服务器或者服务器集群,该计算设备可以训练模型,例如训练前文中提到的用于对智能家居设备进行语音控制的语音控制模型。如图3所示,本申请实施例中的计算设备包括至少一个处理器301,以及与至少一个处理器301连接的存储器302和通信接口303,本申请实施例中不限定处理器301与存储器302之间的具体连接介质,图3中是以处理器301和存储器302之间通过总线300连接为例,总线300在图3中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线300可以分为地址总线、数据总线、控制总线等,为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
在本申请实施例中,存储器302存储有可被至少一个处理器301执行的指令,至少一个处理器301通过执行存储器302存储的指令,可以执行前述的推荐多媒体内容的方法中所包括的步骤。
其中,处理器301是计算设备的控制中心,可以利用各种接口和线路连接整个计算设备的各个部分,通过运行或执行存储在存储器302内的指令以及调用存储在存储器302内的数据,计算设备的各种功能和处理数据,从而对计算设备进行整体监控。可选的,处理器301可包括一个或多个处理单元,处理器301可集成应用处理器和调制解调处理器,其中,处理器301主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器301中。在一些实施例中,处理器301和存储器302可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
处理器301可以是通用处理器,例如中央处理器(CPU)、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器302作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器302可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器302是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器302还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
通信接口303是能够用于进行通信的传输接口,例如可以通过通信接口303接收数据或者发送数据。
参见图4所示的计算设备的进一步地的结构示意图,该计算设备还包括帮助计算设备内的各个器件之间传输信息的基本输入/输出系统(I/O系统)401、用于存储操作系统402、应用程序403和其他程序模块404的大容量存储设备405。
基本输入/输出系统401包括有用于显示信息的显示器406和用于用户输入信息的诸如鼠标、键盘之类的输入设备404。其中显示器406和输入设备407都通过连接到系统总线300的基本输入/输出系统401连接到处理器301。所述基本输入/输出系统401还可以包括输入输出控制器以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器还提供输出到显示屏、打印机或其他类型的输出设备。
所述大容量存储设备405通过连接到系统总线300的大容量存储控制器(未示出)连接到处理器301。所述大容量存储设备405及其相关联的计算机可读介质为该服务器包提供非易失性存储。也就是说,大容量存储设备405可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
根据本发明的各种实施例,该计算设备包还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即该计算设备可以通过连接在所述系统总线300上的通信接口303连接到网络408,或者说,也可以使用通信接口303来连接到其他类型的网络或远程计算机系统(未示出)。
基于同一发明构思,本申请实施例还提供一种存储介质,该存储介质可以以计算机可读存储介质,该存储介质存储有计算机指令,当该计算机指令在计算机上运行时,使得计算机执行如前述的模型训练方法的步骤。
基于同一发明构思,本申请实施例还提供一种模型训练装置,该模型训练装置包括至少一个处理器及存储介质,当该存储介质中包括的指令被该至少一个处理器执行时,可以执行如前述的模型训练方法的步骤。
基于同一发明构思,本申请实施例还提供一种芯片系统,该芯片系统包括处理器,还可以包括存储器,用于实现如前述的模型训练方法的步骤。该芯片系统可以由芯片构成,也可以包含芯片和其他分立器件。
在一些可能的实施方式中,本申请实施例提供的模型训练方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在计算机上运行时,所述程序代码用于使所述计算机执行前文述描述的根据本申请各种示例性实施方式的模型训练方法中的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种模型训练方法,其特征在于,所述方法包括:
获得用于对智能家居设备进行语音控制的语料数据;
确定所述语料数据是否满足模型训练触发条件;
在所述语料数据满足所述模型训练触发条件时,根据所述语料数据对语音控制模型进行模型训练,以得到更新后的语音控制模型。
2.如权利要求1所述的方法,其特征在于,确定所述语料数据是否满足模型训练触发条件,包括:
若确定所述语料数据所对应的语音控制信息的数量大于等于第一预定数量,则确定满足所述模型训练触发条件;和/或,
若确定所述语料数据所对应的语音控制信息的类型符合预定分布规则,则确定满足所述模型训练触发条件。
3.如权利要求2所述的方法,其特征在于,确定所述语料数据所对应的语音控制信息的类型符合预定分布规则,包括:
对所述语料数据所包括的每条语音控制信息进行语义解析,以得到每条语音控制信息所针对的待控制设备;
若所有的待控制设备的设备类型的种类大于第二预定数量,则确定符合所述预定分布规则。
4.如权利要求3所述的方法,其特征在于,若所有的待控制设备的设备类型的种类大于第二预定数量,则确定符合所述预定分布规则,包括:
若所有的待控制设备的设备种类大于所述第二预定数量,且每种待控制设备对应的语音控制信息的数量大于相应的数量阈值,则确定符合所述预定分布规则。
5.如权利要求3所述的方法,其特征在于,若所有的待控制设备的设备类型的种类大于第二预定数量,则确定符合所述预定分布规则,包括:
若所有的待控制设备的设备类型的种类大于所述第二预定数量,且所有设备类型中存在具有联动控制关系的第三预定数量的设备类型,则确定符合所述预定分布规则。
6.如权利要求1-5任一所述的方法,其特征在于,在得到更新后的语音控制模型之后,所述方法还包括:
获得用户输入的目标语音控制信息;
将所述目标语音控制信息输入所述更新后的语音控制模型,以确定所述目标语音控制信息所针对的目标设备以及对应的目标控制指令;
将所述目标控制指令发送给所述目标设备,以使所述目标设备执行与所述目标控制指令对应的操作。
7.一种模型训练装置,其特征在于,所述装置包括:
获得模块,用于获得用于对智能家居设备进行语音控制的语料数据;
确定模块,用于确定所述语料数据是否满足模型训练触发条件;
模型训练模块,用于在所述语料数据满足所述模型训练触发条件时,根据所述语料数据对语音控制模型进行模型训练,以得到更新后的语音控制模型。
8.如权利要求7所述的装置,其特征在于,所述确定模块用于:
若确定所述语料数据所对应的语音控制信息的数量大于等于第一预定数量,则确定满足所述模型训练触发条件;和/或,
若确定所述语料数据所对应的语音控制信息的类型符合预定分布规则,则确定满足所述模型训练触发条件。
9.一种计算设备,其特征在于,所述计算设备所述包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-6任一所述的方法包括的步骤。
10.一种存储介质,其特征在于,所述存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1-6任一所述的方法包括的步骤。
CN201910658355.2A 2019-07-21 2019-07-21 一种模型训练方法、装置、计算设备及存储介质 Active CN110414582B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910658355.2A CN110414582B (zh) 2019-07-21 2019-07-21 一种模型训练方法、装置、计算设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910658355.2A CN110414582B (zh) 2019-07-21 2019-07-21 一种模型训练方法、装置、计算设备及存储介质

Publications (2)

Publication Number Publication Date
CN110414582A true CN110414582A (zh) 2019-11-05
CN110414582B CN110414582B (zh) 2022-03-08

Family

ID=68362198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910658355.2A Active CN110414582B (zh) 2019-07-21 2019-07-21 一种模型训练方法、装置、计算设备及存储介质

Country Status (1)

Country Link
CN (1) CN110414582B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112002326A (zh) * 2020-10-28 2020-11-27 深圳市一恒科电子科技有限公司 一种交互方法及机器人设备
CN112907309A (zh) * 2019-11-19 2021-06-04 阿里巴巴集团控股有限公司 模型更新方法、资源推荐方法、装置、设备及系统
CN113496286A (zh) * 2020-03-18 2021-10-12 杭州海康威视数字技术股份有限公司 模型训练控制方法和设备
CN113741884A (zh) * 2020-05-29 2021-12-03 阿里巴巴集团控股有限公司 数据处理方法、装置及设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1256935A2 (de) * 2001-05-07 2002-11-13 Siemens Aktiengesellschaft Verfahren zum Training und Betrieb eines Spracherkenners, Spracherkenner und Spracherkenner-Trainingssystem
CN101071564A (zh) * 2006-05-11 2007-11-14 通用汽车公司 把词表外语音与词表内语音区别开
CN105204357A (zh) * 2015-09-18 2015-12-30 小米科技有限责任公司 智能家居设备的情景模式调整方法及装置
CN107731226A (zh) * 2017-09-29 2018-02-23 杭州聪普智能科技有限公司 基于语音识别的控制方法、装置及电子设备
CN107743083A (zh) * 2017-10-27 2018-02-27 朱秋华 一种智能家居系统
CN107833574A (zh) * 2017-11-16 2018-03-23 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置
CN108882103A (zh) * 2018-07-18 2018-11-23 北京小米移动软件有限公司 智能音箱、声音采集设备及智能音箱系统
CN109033079A (zh) * 2018-07-06 2018-12-18 龙马智芯(珠海横琴)科技有限公司 语言模型的训练方法、训练装置及检验方法
CN109036393A (zh) * 2018-06-19 2018-12-18 广东美的厨房电器制造有限公司 家电设备的唤醒词训练方法、装置及家电设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1256935A2 (de) * 2001-05-07 2002-11-13 Siemens Aktiengesellschaft Verfahren zum Training und Betrieb eines Spracherkenners, Spracherkenner und Spracherkenner-Trainingssystem
CN101071564A (zh) * 2006-05-11 2007-11-14 通用汽车公司 把词表外语音与词表内语音区别开
CN105204357A (zh) * 2015-09-18 2015-12-30 小米科技有限责任公司 智能家居设备的情景模式调整方法及装置
CN107731226A (zh) * 2017-09-29 2018-02-23 杭州聪普智能科技有限公司 基于语音识别的控制方法、装置及电子设备
CN107743083A (zh) * 2017-10-27 2018-02-27 朱秋华 一种智能家居系统
CN107833574A (zh) * 2017-11-16 2018-03-23 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置
CN109036393A (zh) * 2018-06-19 2018-12-18 广东美的厨房电器制造有限公司 家电设备的唤醒词训练方法、装置及家电设备
CN109033079A (zh) * 2018-07-06 2018-12-18 龙马智芯(珠海横琴)科技有限公司 语言模型的训练方法、训练装置及检验方法
CN108882103A (zh) * 2018-07-18 2018-11-23 北京小米移动软件有限公司 智能音箱、声音采集设备及智能音箱系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LUKA KRALJEVIĆ 等: "Voice command module for Smart Home Automation", 《INTERNATIONAL JOURNAL OF SIGNAL PROCESSING》 *
吴 伟 等: "基于语速差异的新闻发布会中首要说话人检测", 《计算机工程与应用》 *
徐子豪 等: "基于语音识别和无线传感网络的智能家居系统设计", 《计算机测量与控制》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112907309A (zh) * 2019-11-19 2021-06-04 阿里巴巴集团控股有限公司 模型更新方法、资源推荐方法、装置、设备及系统
CN113496286A (zh) * 2020-03-18 2021-10-12 杭州海康威视数字技术股份有限公司 模型训练控制方法和设备
CN113741884A (zh) * 2020-05-29 2021-12-03 阿里巴巴集团控股有限公司 数据处理方法、装置及设备
CN112002326A (zh) * 2020-10-28 2020-11-27 深圳市一恒科电子科技有限公司 一种交互方法及机器人设备

Also Published As

Publication number Publication date
CN110414582B (zh) 2022-03-08

Similar Documents

Publication Publication Date Title
CN110414582A (zh) 一种模型训练方法、装置、计算设备及存储介质
CN109165249A (zh) 数据处理模型构建方法、装置、服务器和用户端
CN109951594A (zh) 屏幕亮度的智能调节方法、装置、存储介质及移动终端
CN109741755A (zh) 语音唤醒词阈值管理装置及管理语音唤醒词阈值的方法
CN112988400B (zh) 显存优化方法、装置、电子设备以及可读存储介质
US11514368B2 (en) Methods, apparatuses, and computing devices for trainings of learning models
CN107911491A (zh) 信息推荐方法、装置及存储介质、服务器和移动终端
CN109224442A (zh) 虚拟场景的数据处理方法、装置及存储介质
CN107947951A (zh) 用户群组推荐方法、装置及存储介质和服务器
CN114721833A (zh) 一种基于平台业务类型的智能云端协调方法和装置
CN110010125A (zh) 一种智能机器人的控制方法、装置、终端设备及介质
CN111079001A (zh) 装修推荐信息生成方法、装置、存储介质及电子设备
CN113850394B (zh) 联邦学习方法、装置、电子设备及存储介质
CN107172501A (zh) 一种直播房间推荐展示方法及系统
WO2021208392A1 (zh) 用于人机对话的语音技能跳转方法、电子设备及存储介质
CN107748697B (zh) 应用关闭方法、装置、存储介质及电子设备
CN108762836A (zh) 预加载应用的管理方法、装置、存储介质及智能终端
CN104580375A (zh) 确定目标应用的ui样式信息的方法与设备
CN112269943B (zh) 一种信息推荐系统及方法
CN109690534A (zh) 使用动态用户模型进行预取以减少等待时间
CN115170390B (zh) 一种文件风格化方法、装置、设备及存储介质
WO2023130808A1 (zh) 动画帧的显示方法、装置、设备及存储介质
CN110285528A (zh) 空调器的控制方法及装置、空调器、家用电器
CN110286587A (zh) 实现模型迭代控制的方法、服务器及计算机可读存储介质
CN108984147A (zh) 音量控制方法、电子装置及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant