CN106034146A - 信息交互方法及系统 - Google Patents

信息交互方法及系统 Download PDF

Info

Publication number
CN106034146A
CN106034146A CN201510109332.8A CN201510109332A CN106034146A CN 106034146 A CN106034146 A CN 106034146A CN 201510109332 A CN201510109332 A CN 201510109332A CN 106034146 A CN106034146 A CN 106034146A
Authority
CN
China
Prior art keywords
information
equipment
weight
gradient
weight information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510109332.8A
Other languages
English (en)
Other versions
CN106034146B (zh
Inventor
周俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510109332.8A priority Critical patent/CN106034146B/zh
Publication of CN106034146A publication Critical patent/CN106034146A/zh
Application granted granted Critical
Publication of CN106034146B publication Critical patent/CN106034146B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers

Abstract

本申请公开了一种信息交互方法及系统,其中,信息交互方法包括:判断是否接收到退出命令,若未接收到,则从第一设备读取当前权重信息,并根据读取到的当前权重信息计算梯度信息;以及向第一设备返回大于等于预设梯度阈值的梯度信息,以使第一设备根据返回的梯度信息重新计算权重信息,并将大于等于预设权重阈值的权重信息作为当前权重信息,重复执行上述操作,直至接收到退出命令。上述信息交互方法及系统,通过至少一个第二设备向第一设备返回大于等于预设梯度阈值的梯度信息,通过第一设备向至少一个第二设备提供大于等于预设权重阈值的权重信息,大大降低了第一设备和第二设备间的通信量,从而降低了资源消耗,提高了通信效率。

Description

信息交互方法及系统
技术领域
本申请涉及计算机技术领域,尤其涉及一种信息交互方法及系统。
背景技术
机器学习作为大数据处理的核心技术,可被广泛应用于各个领域,尤其适用于生成训练模型。由于训练模型涉及的损失函数变量(即权重信息)可能超千亿,因此训练数据非常大,求解最小化损失函数并没有一步到位的解法,通常需要经过多轮迭代来获得近似最优解。
具体地,在机器学习中,slave(也称为worker/工作者,在集群环境中,可能会有多个worker)计算梯度信息,并将所有的梯度信息发给master(也称为server/服务器),然后master根据权重更新公式和来自slave的梯度信息计算出新权重,并为slave提供所有的新权重。这样,master和slave通过多轮迭代可以获得近似最优解,即可以获得较好的训练模型,但是在迭代的过程中,二者之间的通信量巨大,这必然会增大资源消耗、降低通信效率,另外,slave内存消耗巨大。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种信息交互方法,该方法可以大大减少通信量,提高通信效率。
本申请的第二个目的在于提出一种信息交互方法。
本申请的第三个目的在于提出一种信息交互系统。
为达上述目的,本申请第一方面实施例提出了一种信息交互方法,该信息交互方法包括:判断是否接收到退出命令,若未接收到,则从第一设备读取当前权重信息,并根据读取到的当前权重信息计算梯度信息;以及向第一设备返回大于等于预设梯度阈值的梯度信息,以使第一设备根据返回的梯度信息重新计算权重信息,并将大于等于预设权重阈值的权重信息作为当前权重信息,重复执行上述操作,直至接收到退出命令。
本申请实施例的信息交互方法,通过至少一个第二设备向第一设备返回大于等于预设梯度阈值的梯度信息,通过第一设备向至少一个第二设备提供大于等于预设权重阈值的权重信息,大大降低了第一设备和第二设备间的通信量,从而降低了资源消耗,提高了通信效率,同时大大降低了slave对内存的消耗。
为达上述目的,本申请第二方面实施例提出了一种信息交互方法,该信息交互方法包括:判断是否满足退出条件,若不满足,则为至少一个第二设备提供当前权重信息,并接收至少一个第二设备返回的大于等于预设梯度阈值的梯度信息;以及根据返回的梯度信息重新计算权重信息,并将大于等于预设权重阈值的权重信息作为当前权重信息,重复执行上述操作,直至满足退出条件。
本申请实施例的信息交互方法,通过第一设备接收至少一个第二设备返回的大于等于预设梯度阈值的梯度信息,通过第一设备向至少一个第二设备提供大于等于预设权重阈值的权重信息,大大降低了第一设备和第二设备间的通信量,从而降低了资源消耗,提高了通信效率,同时大大降低了slave对内存的消耗。
为达上述目的,本申请第三方面实施例提出了一种信息交互系统,该信息交互系统第一设备和至少一个第二设备,其中:
第一设备,用于判断是否满足退出条件,若不满足,则为至少一个第二设备提供当前权重信息,接收至少一个第二设备返回的大于等于预设梯度阈值的梯度信息,根据返回的梯度信息重新计算权重信息,并将大于等于预设权重阈值的权重信息作为当前权重信息,重复执行上述操作,直至满足退出条件;
至少一个第二设备,用于判断是否接收到退出命令,若未接收到,则从第一设备读取当前权重信息,根据读取到的当前权重信息计算梯度信息,并向第一设备返回大于等于预设梯度阈值的梯度信息,重复执行上述操作,直至接收到退出命令。
本申请实施例的信息交互系统,通过至少一个第二设备向第一设备返回大于等于预设梯度阈值的梯度信息,通过第一设备向至少一个第二设备提供大于等于预设权重阈值的权重信息,大大降低了第一设备和第二设备间的通信量,从而降低了资源消耗,提高了通信效率,同时大大降低了slave对内存的消耗。
附图说明
图1是本申请一个实施例信息交互方法的流程图。
图2是本申请另一个实施例信息交互方法的流程图。
图3是本申请一个实施例的信息交互过程示意图。
图4是本申请一个实施例信息交互系统的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的信息交互方法及系统。
图1是本申请一个实施例信息交互方法的流程图,该实施例从第二设备侧进行描述,其中,第二设备可以为slave。
如图1所示,该信息交互方法包括:
S101,判断是否接收到退出命令,若未接收到,则从第一设备读取当前权重信息,并根据读取到的当前权重信息计算梯度信息。
具体地,第二设备例如slave判断是否接收到退出命令,其中,退出命令可以来自第一设备例如master,也可以来自外部其他设备,若未接收到,则从第一设备读取当前权重信息,并根据读取到的当前权重信息计算梯度信息,若接收到,则停止工作。
S102,向第一设备返回大于等于预设梯度阈值的梯度信息,以使第一设备根据返回的梯度信息重新计算权重信息,并将大于等于预设权重阈值的权重信息作为当前权重信息,重复执行上述操作,直至接收到退出命令。
第二设备在计算出梯度信息后,并未将计算出的所有梯度信息发送给第一设备,而是基于梯度阈值机制向第一设备发送梯度信息,即仅向第一设备发送大于等于预设梯度阈值的梯度信息。具体地,可以直接向第一设备返回大于等于预设梯度阈值的梯度信息,也可以将小于预设梯度阈值的梯度信息设置为零,并向第一设备返回非零梯度信息。这种仅向第一设备返回部分梯度信息的方式,可以有效地减少第一设备和第二设备间的通信量,从而提高通信效率。
第一设备在接收到大于等于预设梯度阈值的梯度信息后,重新计算出权重信息,但在本申请的实施例中,第一设备并不为第二设备提供所有重新计算出的权重信息,而是基于权重阈值机制为第二设备提供权重信息,即仅为第二设备提供大于等于预设权重阈值的权重信息。具体地,可以直接为第二设备提供大于等于预设权重阈值的权重信息,也可以将小于预设权重阈值的权重信息设置为零,并为第二设备提供非零权重信息。这种仅为第二设备提供部分权重信息的方式,可以有效地减少第一设备和第二设备间的通信量,从而提高通信效率,同时可有效减少第二设备对内存的消耗。
需要说明的是,上述预设梯度阈值和预设权重阈值的取值很重要,因为预设梯度阈值和预设权重阈值的设置不仅仅是为了减少第一设备和第二设备间的通信量,还需要尽可能地保证通过上述迭代获得近似最优解,即需要保证获得的训练模型的质量。
其中,上述梯度信息和权重信息均可以为包含至少一个元素的向量。上述预设梯度阈值可以为对应梯度信息所包含元素的平均值除以N,N为4-6,优选值为5;上述预设权重阈值为对应权重信息所包含元素的平均值除以M,M为11-13,优选值为12。上述这两个阈值都是基于实验数据不断调整获得的,当然也与对应的梯度信息和权重信息有关。
上述阈值的设置,不仅可以有效地减少第一设备和第二设备间的通信量,还可以保证获得近似最优解,即保证获得的训练模型的质量。
由此可见,在该实施例中,随着迭代的进行,通信量越来越少,能够有效地降低网络资源的使用量和集群资源的消耗量;每轮迭代时间越来越短,收敛速度越来越快,能够快速得到训练好的模型,为用户提供服务;同时,由于通信量的减少,可以大大降低slave对内存的消耗。
需要说明的是,上述信息交互方法可以应用于多个领域,尤其适用于生成机器学习领域的各种训练模型,例如可以应用于手写字母识别、人脸识别或指纹识别等领域,基于图1所示的实现过程可以快速地生成对应的识别模型,以完成对手写字母、人脸或指纹的识别,由于本发明实施例所提供的信息交互方法是在利用机器学习原理的基础上实现的,因此,需要用户更好地掌握机器学习的知识,增加了用户的使用难度,同时,通用性稍差,但是可以大大地减少通信量,提高通信效率,并降低第二设备例如slave的内存消耗。
上述信息交互方法,通过判断是否接收到来自第一设备的退出命令,若未接收到,则从第一设备读取当前权重信息,并根据读取到的当前权重信息计算梯度信息;以及向第一设备返回大于等于预设梯度阈值的梯度信息,以使第一设备根据返回的梯度信息重新计算权重信息,并将大于等于预设权重阈值的权重信息作为当前权重信息,重复执行上述操作,直至接收到退出命令,可以大大降低第一设备和第二设备间的通信量,从而降低资源消耗,提高通信效率,同时大大降低了slave对内存的消耗。
图2是本申请另一个实施例信息交互方法的流程图,该实施例从第一设备侧进行描述,其中,第一设备可以为master。
如图2所示,该信息交互方法包括:
S201,判断是否满足退出条件,若不满足,则为至少一个第二设备提供当前权重信息,并接收至少一个第二设备返回的大于等于预设梯度阈值的梯度信息。
具体地,第一设备例如master判断自己是否满足退出条件,若不满足,则为至少一个第二设备例如slave提供当前权重信息,至少一个第二设备根据读取到的当前权重信息计算梯度信息,并向第一设备返回大于等于预设梯度阈值的梯度信息,这种仅向第一设备返回部分梯度信息的方式,可以有效地减少第一设备和第二设备间的通信量,从而提高通信效率。
另外,若第一设备确认自己满足退出条件,则向至少一个第二设备发送退出命令,以使至少一个第二设备停止工作。
S202,根据返回的梯度信息重新计算权重信息,并将大于等于预设权重阈值的权重信息作为当前权重信息,重复执行上述操作,直至满足退出条件。
在该实施例中,第一设备接收第二设备返回的大于等于预设梯度阈值的梯度信息后,重新计算权重信息,并将大于等于预设权重阈值的权重信息作为当前权重信息。这种仅为第二设备提供部分权重信息的方式,可以有效地减少第一设备和第二设备间的通信量,从而提高通信效率,同时可有效减少第二设备对内存的消耗。
具体地,将大于等于预设权重阈值的权重信息作为当前权重信息可以为:直接将大于等于预设权重阈值的权重信息作为当前权重信息;也可以为:将小于预设权重阈值的权重信息设置为零,并将非零权重信息作为当前权重信息。
需要说明的是,上述预设梯度阈值和预设权重阈值的取值很重要,因为预设梯度阈值和预设权重阈值的设置不仅仅是为了减少第一设备和第二设备间的通信量,还需要尽可能地保证通过上述迭代获得近似最优解,即需要保证获得的训练模型的质量。
其中,上述梯度信息和权重信息均可以为包含至少一个元素的向量;上述预设梯度阈值可以为对应梯度信息所包含元素的平均值除以N,N为4-6,优选值为5;上述预设权重阈值为对应权重信息所包含元素的平均值除以M,M为11-13,优选值为12。上述阈值的设置,不仅可以有效地减少第一设备和第二设备间的通信量,还可以保证获得近似最优解,即保证获得的训练模型的质量。上述预设梯度阈值和预设权重阈值的取值仅为示例,在实际应用中可以根据需要动态调整。
由此可见,在该实施例中,随着迭代的进行,通信量越来越少,能够有效地降低网络资源的使用量和集群资源的消耗量;每轮迭代时间越来越短,收敛速度越来越快,能够快速得到训练好的模型,为用户提供服务;同时,由于通信量的减少,可以大大降低slave对内存的消耗。
需要说明的是,上述信息交互方法可以应用于多个领域,尤其适用于生成机器学习领域的各种训练模型,例如可以应用于手写字母识别、人脸识别或指纹识别等领域,基于图2所示的实现过程可以快速地生成对应的识别模型,以完成对手写字母、人脸或指纹的识别,由于本发明实施例所提供的信息交互方法是在利用机器学习原理的基础上实现的,因此,需要用户更好地掌握机器学习的知识,增加了用户的使用难度,同时,通用性稍差,但是可以大大地减少通信量,提高通信效率,并降低第二设备例如slave的内存消耗。
上述信息交互方法,通过第一设备接收至少一个第二设备返回的大于等于预设梯度阈值的梯度信息,通过第一设备向至少一个第二设备提供大于等于预设权重阈值的权重信息,大大降低了第一设备和第二设备间的通信量,从而降低了资源消耗,提高了通信效率,同时大大降低了slave对内存的消耗。
图3是本申请一个实施例的信息交互过程示意图,该实施例以master和slave为例描述梯度信息和权重信息的交互过程。
如图3所示,信息交互过程包括:
S301,slave如果没有收到master的退出命令,则从master上读取权重信息。
slave如果收到master的退出命令,则停止工作,即交互过程结束。
S302,slave根据读取到的权重信息,计算梯度信息。
S303,slave基于梯度阈值机制将非零梯度信息推送回master。
具体地,slave将绝对值小于预设梯度阈值的梯度元素置成零,而仅向master推送非零的梯度信息,从而减少通信量。
S304,master判断是否满足退出条件,如果不满足退出条件,则为所有slave提供权重,转向S305,如果满足退出条件,则向所有slave发送退出命令。
S305,master将所有slave发回的梯度信息进行累加。
S306,master根据累加得到的梯度信息更新权重,并基于权重阈值机制为所有slave提供非零权重,然后转向S301。
具体地,master将绝对值小于预设权重阈值的权重元素置成零,而仅向master推送非零的权重信息,从而减少通信量。
由此可见,经过多轮交互,越来越接近最优解,那么slave上小于预设梯度阈值的梯度便可以截断(截断成0,或者成阈值),从而不需要将这些被截断的梯度发送给master;而master在更新权重时,将小于预设权重阈值的权重截断成0,这样slave不需要读取这些为0的权重,通过这些步骤来加速通信速度,并减少通信量,同时大大降低了slave对内存的消耗。
图4是本申请一个实施例信息交互系统的结构示意图。
如图4所示,信息交互系统包括第一设备41和至少一个第二设备42,其中:
第一设备41用于判断是否满足退出条件,若不满足,则为至少一个第二设备42提供当前权重信息,接收至少一个第二设备42返回的大于等于预设梯度阈值的梯度信息,根据返回的梯度信息重新计算权重信息,并将大于等于预设权重阈值的权重信息作为当前权重信息,重复执行上述操作,直至满足退出条件;
上述至少一个第二设备42,用于判断是否接收退出命令,若未接收到,则从第一设备41读取当前权重信息,根据读取到的当前权重信息计算梯度信息,并向第一设备41返回大于等于预设梯度阈值的梯度信息,重复执行上述操作,直至接收到退出命令。
在该实施例中,至少一个第二设备42在计算出梯度信息后,并未将计算出的所有梯度信息发送给第一设备,而是基于梯度阈值机制向第一设备发送梯度信息。具体地,至少一个第二设备42可以用于:直接向上述第一设备41返回大于等于预设梯度阈值的梯度信息;或者将小于预设梯度阈值的梯度信息设置为零,并向上述第一设备41返回非零梯度信息。
同样地,上述第一设备41可以用于:直接将大于等于预设权重阈值的权重信息作为当前权重信息;或者将小于预设权重阈值的权重信息设置为零,并将非零权重信息作为当前权重信息。
需要说明的是,上述预设梯度阈值和预设权重阈值的取值很重要,因为预设梯度阈值和预设权重阈值的设置不仅仅是为了减少第一设备和第二设备间的通信量,还需要尽可能地保证通过上述迭代获得近似最优解,即需要保证获得的训练模型的质量。
其中,上述梯度信息和权重信息均可以为包含至少一个元素的向量;上述预设梯度阈值可以为对应梯度信息所包含元素的平均值除以N,N为4-6,优选值为5;上述预设权重阈值为对应权重信息所包含元素的平均值除以M,M为11-13,优选值为12。上述这两个阈值都是基于实验数据不断调整获得的,当然也与对应的梯度信息和权重信息有关。上述预设梯度阈值和预设权重阈值的取值仅为示例,在实际应用中可以根据需要动态调整。
上述仅向第一设备返回部分梯度信息和仅为第二设备提供部分权重信息的方式,可以有效地减少第一设备和第二设备间的通信量,从而提高通信效率。
另外,上述第一设备41还可以用于:若满足退出条件,则向至少一个第二设备42发送退出命令,上述至少一个第二设备42还可以用于:若接收到退出命令,则停止工作。
其中,第一设备可以为服务器(master),第二设备可以为工作者(slave)。上述第一设备和第二设备的交互过程可参见图1、图2或图3及其对应的文字描述,此处不赘述。
由此可见,在该实施例中,随着迭代的进行,通信量越来越少,能够有效地降低网络资源的使用量和系统资源的消耗量;每轮迭代时间越来越短,收敛速度越来越快,能够快速得到训练好的模型,为用户提供服务;同时,由于通信量的减少,可以大大降低slave对内存的消耗。
需要说明的是,上述信息交互系统可以应用于多个领域,尤其适用于生成机器学习领域的各种训练模型,例如可以应用于手写字母识别、人脸识别或指纹识别等领域,基于该系统可以快速地生成对应的识别模型,以完成对手写字母、人脸或指纹的识别,由于本发明实施例所提供的信息交互方法是在利用机器学习原理的基础上实现的,因此,需要用户更好地掌握机器学习的知识,增加了用户的使用难度,同时,通用性稍差,但是可以大大地减少通信量,提高通信效率,并降低第二设备例如slave的内存消耗。
上述信息交互系统,通过至少一个第二设备向第一设备返回大于等于预设梯度阈值的梯度信息,通过第一设备向至少一个第二设备提供大于等于预设权重阈值的权重信息,大大降低了第一设备和第二设备间的通信量,从而降低了资源消耗,提高了通信效率,同时大大降低了slave对内存的消耗。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (15)

1.一种信息交互方法,其特征在于,包括:
判断是否接收到退出命令,若未接收到,则从所述第一设备读取当前权重信息,并根据读取到的当前权重信息计算梯度信息;以及
向所述第一设备返回大于等于预设梯度阈值的梯度信息,以使所述第一设备根据返回的梯度信息重新计算权重信息,并将大于等于预设权重阈值的权重信息作为当前权重信息,重复执行上述操作,直至接收到所述退出命令。
2.根据权利要求1所述的方法,其特征在于,所述向所述第一设备返回大于等于预设梯度阈值的梯度信息,包括:
直接向所述第一设备返回大于等于预设梯度阈值的梯度信息;或者
将小于预设梯度阈值的梯度信息设置为零,并向所述第一设备返回非零梯度信息。
3.根据权利要求1或2所述的方法,其特征在于,所述梯度信息和权重信息均为包含至少一个元素的向量;所述预设梯度阈值为对应梯度信息所包含元素的平均值除以N,N为4-6;所述预设权重阈值为对应权重信息所包含元素的平均值除以M,M为11-13。
4.根据权利要求3所述的方法,其特征在于,所述N为5,所述M为12。
5.一种信息交互方法,其特征在于,包括:
判断是否满足退出条件,若不满足,则为至少一个第二设备提供当前权重信息,并接收所述至少一个第二设备返回的大于等于预设梯度阈值的梯度信息;以及
根据返回的梯度信息重新计算权重信息,并将大于等于预设权重阈值的权重信息作为当前权重信息,重复执行上述操作,直至满足所述退出条件。
6.根据权利要求5所述的方法,其特征在于,在所述判断是否满足退出条件之后,还包括:
若满足所述退出条件,则向所述至少一个第二设备发送退出命令。
7.根据权利要求5所述的方法,其特征在于,所述将大于等于预设权重阈值的权重信息作为当前权重信息,包括:
直接将大于等于预设权重阈值的权重信息作为当前权重信息;或者
将小于预设权重阈值的权重信息设置为零,并将非零权重信息作为当前权重信息。
8.根据权利要求5-7任一项所述的方法,其特征在于,所述梯度信息和权重信息均为包含至少一个元素的向量;所述预设梯度阈值为对应梯度信息所包含元素的平均值除以N,N为4-6;所述预设权重阈值为对应权重信息所包含元素的平均值除以M,M为11-13。
9.根据权利要求8所述的方法,其特征在于,所述N为5,所述M为12。
10.一种信息交互系统,其特征在于,包括第一设备和至少一个第二设备,其中:
所述第一设备,用于判断是否满足退出条件,若不满足,则为所述至少一个第二设备提供当前权重信息,接收所述至少一个第二设备返回的大于等于预设梯度阈值的梯度信息,根据返回的梯度信息重新计算权重信息,并将大于等于预设权重阈值的权重信息作为当前权重信息,重复执行上述操作,直至满足所述退出条件;
所述至少一个第二设备,用于判断是否接收到退出命令,若未接收到,则从所述第一设备读取当前权重信息,根据读取到的当前权重信息计算梯度信息,并向所述第一设备返回大于等于预设梯度阈值的梯度信息,重复执行上述操作,直至接收到所述退出命令。
11.根据权利要求10所述的系统,其特征在于,所述至少一个第二设备,具体用于:
直接向所述第一设备返回大于等于预设梯度阈值的梯度信息;或者
将小于预设梯度阈值的梯度信息设置为零,并向所述第一设备返回非零梯度信息。
12.根据权利要求10所述的系统,其特征在于,所述第一设备,具体用于:
直接将大于等于预设权重阈值的权重信息作为当前权重信息;或者
将小于预设权重阈值的权重信息设置为零,并将非零权重信息作为当前权重信息。
13.根据权利要求10所述的系统,其特征在于,所述梯度信息和权重信息均为包含至少一个元素的向量;所述预设梯度阈值为对应梯度信息所包含元素的平均值除以N,N为4-6;所述预设权重阈值为对应权重信息所包含元素的平均值除以M,M为11-13。
14.根据权利要求13所述的系统,其特征在于,所述N为5,所述M为12。
15.根据权利要求10-14任一项所述的系统,其特征在于,所述第一设备,还用于:若满足所述退出条件,则向所述至少一个第二设备发送退出命令;
所述至少一个第二设备,还用于:若接收到所述退出命令,则停止工作。
CN201510109332.8A 2015-03-12 2015-03-12 信息交互方法及系统 Active CN106034146B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510109332.8A CN106034146B (zh) 2015-03-12 2015-03-12 信息交互方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510109332.8A CN106034146B (zh) 2015-03-12 2015-03-12 信息交互方法及系统

Publications (2)

Publication Number Publication Date
CN106034146A true CN106034146A (zh) 2016-10-19
CN106034146B CN106034146B (zh) 2019-10-22

Family

ID=57150568

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510109332.8A Active CN106034146B (zh) 2015-03-12 2015-03-12 信息交互方法及系统

Country Status (1)

Country Link
CN (1) CN106034146B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649739A (zh) * 2016-12-23 2017-05-10 深圳市空谷幽兰人工智能科技有限公司 多轮交互信息继承识别方法、装置以及交互系统
CN109214193A (zh) * 2017-07-05 2019-01-15 阿里巴巴集团控股有限公司 数据加密、机器学习模型训练方法、装置以及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100017487A1 (en) * 2004-11-04 2010-01-21 Vericept Corporation Method, apparatus, and system for clustering and classification
US8027938B1 (en) * 2007-03-26 2011-09-27 Google Inc. Discriminative training in machine learning
US20140229217A1 (en) * 2013-02-14 2014-08-14 Aktana, Inc. System and method for determining suggested activities for a worker based on business objectives
CN104035751A (zh) * 2014-06-20 2014-09-10 深圳市腾讯计算机系统有限公司 基于多图形处理器的数据并行处理方法及装置
WO2015021459A1 (en) * 2013-08-09 2015-02-12 Yang Shaofeng Method for processing and displaying real-time social data on map

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100017487A1 (en) * 2004-11-04 2010-01-21 Vericept Corporation Method, apparatus, and system for clustering and classification
US8027938B1 (en) * 2007-03-26 2011-09-27 Google Inc. Discriminative training in machine learning
US20140229217A1 (en) * 2013-02-14 2014-08-14 Aktana, Inc. System and method for determining suggested activities for a worker based on business objectives
WO2015021459A1 (en) * 2013-08-09 2015-02-12 Yang Shaofeng Method for processing and displaying real-time social data on map
CN104035751A (zh) * 2014-06-20 2014-09-10 深圳市腾讯计算机系统有限公司 基于多图形处理器的数据并行处理方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649739A (zh) * 2016-12-23 2017-05-10 深圳市空谷幽兰人工智能科技有限公司 多轮交互信息继承识别方法、装置以及交互系统
CN106649739B (zh) * 2016-12-23 2020-09-11 广东惠禾科技发展有限公司 多轮交互信息继承识别方法、装置以及交互系统
CN109214193A (zh) * 2017-07-05 2019-01-15 阿里巴巴集团控股有限公司 数据加密、机器学习模型训练方法、装置以及电子设备

Also Published As

Publication number Publication date
CN106034146B (zh) 2019-10-22

Similar Documents

Publication Publication Date Title
WO2021219053A1 (zh) 联邦学习建模方法、装置、设备及可读存储介质
CN111242282B (zh) 基于端边云协同的深度学习模型训练加速方法
US20170185895A1 (en) System and Method for Training Parameter Set in Neural Network
CN102750289B (zh) 基于标签组对数据进行混合的方法和设备
CN107229966B (zh) 一种模型数据更新方法、装置及系统
CN109144696A (zh) 一种任务调度方法、装置、电子设备及存储介质
CN111030861A (zh) 一种边缘计算分布式模型训练方法、终端和网络侧设备
CN102857778B (zh) 3d视频转换系统和方法及其选择关键帧的方法和装置
CN112541584B (zh) 深度神经网络模型并行模式选择方法
CN105204791A (zh) 一种基于应力分析的优化三维打印物体结构的算法
CN109202895A (zh) 设计支持装置、设计支持方法及存储设计支持程序的介质
CN111539345A (zh) 用于确定变道动作的方法、装置、设备及可读存储介质
CN110163409A (zh) 一种应用于置换流水车间的卷积神经网络调度方法
CN114172820A (zh) 跨域sfc动态部署方法、装置、计算机设备及存储介质
CN111833590A (zh) 交通信号灯的控制方法、装置及计算机可读存储介质
CN108106624A (zh) 一种多人预约调度路径规划方法及相关装置
CN106034146A (zh) 信息交互方法及系统
CN111106960B (zh) 一种虚拟网络的映射方法、映射装置及可读存储介质
CN109255462A (zh) 一种货物配送方法及装置
CN108898648A (zh) 一种k线图构造方法、系统及相关设备
CN105719261A (zh) 点云数据合并系统及方法
CN112445617A (zh) 一种基于移动边缘计算的负载策略选择方法及系统
CN113804196B (zh) 无人车路径规划方法及相关设备
CN114254735A (zh) 一种基于分布式的僵尸网络模型构建方法和装置
CN113177289A (zh) 一种用于计算机数值仿真结果的数据处理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant