CN112672266B - 异常音箱的确定方法及装置 - Google Patents
异常音箱的确定方法及装置 Download PDFInfo
- Publication number
- CN112672266B CN112672266B CN202011515981.5A CN202011515981A CN112672266B CN 112672266 B CN112672266 B CN 112672266B CN 202011515981 A CN202011515981 A CN 202011515981A CN 112672266 B CN112672266 B CN 112672266B
- Authority
- CN
- China
- Prior art keywords
- sound box
- candidate
- box
- data
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明提供了一种异常音箱的确定方法及装置,该方法包括:响应于异常音箱识别指令,确定所述异常音箱识别指令对应的各个待识别音箱;获取每个所述待识别音箱在预设时段内的音箱使用数据;基于每个所述音箱使用数据中的开关数据组以及网络连接数据组在所述各个待识别音箱中确定出候选音箱;依据每个所述候选音箱的异常分值在各个所述候选音箱中确定出异常音箱,每个所述候选音箱的异常分值由该候选音箱的使用数据中的交互数据组确定。应用本发明提供的方法,能够获取音箱使用数据,基于音箱使用数据识别出位置异常的音箱,进而可以避免用户使用位置异常的音箱请求服务。
Description
技术领域
本发明涉及数据处理技术领域,特别涉及一种异常音箱的确定方法及装置。
背景技术
随着科学技术的发展,数字化和智能化技术在各个领域的也得到了广泛的应用,智能化设备的出现也使得各个领域数字化的进程逐渐加快,例如,智能音箱,在生活中也得到了广泛的使用;智能音箱可以为用户提供良好的交互体验,受到了用户的欢迎。
在一些使用场景中,一台音箱设备一般都会固定放置在某一位置,并将音箱与该位置的位置标识进行映射绑定;管理系统可以接收用户通过音箱发出的服务请求,管理系统根据该音箱已经绑定的位置进行对应的服务配送操作。
然而,在使用智能音箱的过程中,往往会出现一些音箱在不同的位置里发生了调换,在此情况下,通常难以发现音箱的位置异常,从而会导致当接收到用户通过位置异常的音箱发出服务请求时,会将服务配送到错误的位置。
发明内容
本发明所要解决的技术问题是提供一种异常音箱的确定方法,能够准确地确定出异常音箱。
本发明还提供了一种异常音箱的确定装置,用以保证上述方法在实际中的实现及应用。
一种异常音箱的确定方法,包括:
响应于异常音箱识别指令,确定所述异常音箱识别指令对应的各个待识别音箱;
获取每个所述待识别音箱在预设时段内的音箱使用数据;
基于每个所述音箱使用数据中的开关数据组以及网络连接数据组在所述各个待识别音箱中确定出候选音箱;
依据每个所述候选音箱的异常分值在各个所述候选音箱中确定出异常音箱,每个所述候选音箱的异常分值由该候选音箱的使用数据中的交互数据组确定。
上述的方法,可选的,所述确定所述异常音箱识别指令对应的各个待识别音箱,包括:
对所述异常音箱识别指令进行解析,获得所述异常音箱识别指令中包含的区域标识;
确定所述区域标识对应的音箱分布区域;
将所述音箱分布区域中的各个音箱确定为所述异常音箱识别指令对应的各个待识别音箱。
上述的方法,可选的,所述基于每个所述音箱使用数据中的开关数据组以及网络连接数据组在所述多个待识别音箱中确定出候选音箱,包括:
对于每个所述音箱使用数据,判断该音箱使用数据中的开关数据组是否未存在表征关机事件的开关数据;判断该音箱使用数据中的网络连接数据组的各个网络连接数据是否均一致;若前述任一判断的判断结果为否,则将该音箱使用数据所属的待识别音箱确定为候选识别音箱。
上述的方法,可选的,由每个所述候选音箱的使用数据中的交互数据组确定每个所述候选音箱的异常分值的过程,包括:
对每个所述待识别音箱的音箱使用数据中的交互数据进行向量化处理,得到每个所述待识别音箱的向量集合;其中,所述向量集合包含第一向量组和第二向量组;所述第一向量组包含所述预设时段的第一子时段的交互数据向量,所述第二向量组包含所述预设时段的第二子时段的交互数据向量;
对于每个所述候选音箱,确定该候选音箱的第一向量组与第二向量组的第一相似度;并确定该候选音箱的第一向量组与各个所述待识别音箱中除该候选音箱以外的每个待识别音箱的第二向量组的备选相似度,将各个所述备选相似度中值最大的备选相似度作为该候选音箱的第二相似度;
基于每个所述候选音箱的第一相似度和第二相似度,获得每个所述候选音箱的异常分值。
上述的方法,可选的,所述对每个所述候选音箱的音箱使用数据中的交互数据进行向量化处理,得到每个所述待识别音箱的向量集合,包括:
对每个所述待识别音箱的音箱使用数据中的每一交互数据进行分词处理,得到每一所述交互数据的各个分词;
应用预先设置的文本深度表示模型将对每个分词进行映射,得到每个分词的词向量;
基于每个所述待识别音箱的归属于所述预设时段的第一子时段的各个词向量,获得该待识别音箱的所述第一向量组;并基于每个所述待识别音箱的归属于所述预设时段的第二子时段的各个词向量,获得该待识别音箱的所述第二向量组;
将每个所述待识别音箱的所述第一向量组和所述第二向量组,组成每个所述待识别音箱的向量集合。
上述的方法,可选的,所述依据每个所述候选音箱的异常分值确定出异常音箱,包括:
按各个所述候选音箱的异常分值由高至低的顺序,选取至少一个候选音箱作为异常音箱。
一种异常音箱的确定装置,包括:
第一确定单元,用于响应于异常音箱识别指令,确定所述异常音箱识别指令对应的各个待识别音箱;
获取单元,用于获取每个所述待识别音箱在预设时段内的音箱使用数据;
第二确定单元,用于基于每个所述音箱使用数据中的开关数据组以及网络连接数据组在所述各个待识别音箱中确定出候选音箱;
第三确定单元,用于依据每个所述候选音箱的异常分值在各个所述候选音箱中确定出异常音箱,每个所述候选音箱的异常分值由该候选音箱的使用数据中的交互数据组确定。
上述装置,可选的,所述第一确定单元,包括:
解析子单元,用于对所述异常音箱识别指令进行解析,获得所述异常音箱识别指令中包含的区域标识;
第一确定子单元,用于确定所述区域标识对应的音箱分布区域;
第二确定子单元,用于将所述音箱分布区域中的各个音箱确定为所述异常音箱识别指令对应的各个待识别音箱。
上述的方法,可选的,所述第二确定单元,包括:
第三确定子单元,用于对于每个所述音箱使用数据,判断该音箱使用数据中的开关数据组是否未存在表征关机事件的开关数据;判断该音箱使用数据中的网络连接数据组的各个网络连接数据是否均一致;若前述任一判断的判断结果为否,则将该音箱使用数据所属的待识别音箱确定为候选识别音箱。
上述的方法,可选的,还包括第四确定单元,所述第四确定单元被配置为:
对每个所述待识别音箱的音箱使用数据中的交互数据进行向量化处理,得到每个所述待识别音箱的向量集合;其中,所述向量集合包含第一向量组和第二向量组;所述第一向量组包含所述预设时段的第一子时段的交互数据向量,所述第二向量组包含所述预设时段的第二子时段的交互数据向量;
对于每个所述候选音箱,确定该候选音箱的第一向量组与第二向量组的第一相似度;并确定该候选音箱的第一向量组与各个所述待识别音箱中除该候选音箱以外的每个待识别音箱的第二向量组的备选相似度,将各个所述备选相似度中值最大的备选相似度作为该候选音箱的第二相似度;
基于每个所述候选音箱的第一相似度和第二相似度,获得每个所述候选音箱的异常分值。
与现有技术相比,本发明包括以下优点:
本发明提供了一种异常音箱的确定方法及装置,该方法包括:响应于异常音箱识别指令,确定所述异常音箱识别指令对应的各个待识别音箱;获取每个所述待识别音箱在预设时段内的音箱使用数据;基于每个所述音箱使用数据中的开关数据组以及网络连接数据组在所述各个待识别音箱中确定出候选音箱;依据每个所述候选音箱的异常分值在各个所述候选音箱中确定出异常音箱,每个所述候选音箱的异常分值由该候选音箱的使用数据中的交互数据组确定。应用本发明提供的方法,能够获取音箱使用数据,基于音箱使用数据识别出位置异常的音箱,进而可以避免用户使用位置异常的音箱请求服务。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明提供的一种异常音箱的确定方法的方法流程图;
图2为本发明提供的一种确定每个候选音箱的异常分值的过程的方法流程图;
图3为本发明提供的一种获得待识别音箱的向量集合的过程的方法流程图;
图4为本发明提供的一种异常音箱的确定装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本发明可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。
本发明实施例提供了一种异常音箱的确定方法,其执行主体可以为电子设备,该电子设备可以为计算机或各种移动设备,所述方法的方法流程图如图1所示,具体包括:
S101:响应于异常音箱识别指令,确定所述异常音箱识别指令对应的各个待识别音箱。
本发明实施例提供的方法中,各个待识别音箱可以为某一音箱分布区域内的智能音箱,即,每个待识别音箱分布在该音箱分布区域的不同位置。
可选的,该音箱分布区域可以为酒店、医院、学校、单元楼或商业办公楼等区域,待识别音箱所处的位置可以为房间或座位等。
S102:获取每个所述待识别音箱在预设时段内的音箱使用数据。
本发明实施例提供的方法中,该预设时段可以为任意时长等,可以依据实际需求进行设定,例如,设置为一个小时、一天、两个星期或一个月等。
其中,该待识别音箱的音箱使用数据可以包括音箱的开关数据组、网络连接数据组、交互数据组以及该待识别音箱所绑定的位置标识。
S103:基于每个所述音箱使用数据中的开关数据组以及网络连接数据组在所述各个待识别音箱中确定出候选音箱。
本发明实施例提供的方法中,每个开关数据组包含在该预设时段内的各个时间的开关数据。
具体的,可以基于开关数据组中的开关数据确定该待识别音箱的是否发生关机事件。
其中,每个网络连接数据组包含在该预设时段内的各个时间的网络连接数据。
可选的,该网络连接数据组中的网络连接数据包含该待识别音箱的连接的网络设备的MAC地址。
S104:依据每个所述候选音箱的异常分值在各个所述候选音箱中确定出异常音箱,每个所述候选音箱的异常分值由该候选音箱的使用数据中的交互数据组确定。
本发明实施例提供的方法中,可以基于每个首选音箱的使用数据中的交互数据以及位置标识确定每个所述候选音箱的异常分值。
其中,该交互数据可以为用户与音箱在交互过程中产生的数据,例如,可以为对话数据。
本发明实施例提供的方法中,可以依据每个候选音箱的异常分值大小,在各个候选音箱中选取一个或多个异常音箱。
其中,该异常音箱可以表征位置标识与所处的位置不匹配的音箱,即,发生调换后的音箱。
本发明实施例提供了一种异常音箱的确定方法,包括:响应于异常音箱识别指令,确定所述异常音箱识别指令对应的各个待识别音箱;获取每个所述待识别音箱在预设时段内的音箱使用数据;基于每个所述音箱使用数据中的开关数据组以及网络连接数据组在所述各个待识别音箱中确定出候选音箱;依据每个所述候选音箱的异常分值在各个所述候选音箱中确定出异常音箱,每个所述候选音箱的异常分值由该候选音箱的使用数据中的交互数据组确定。应用本发明提供的方法,能够获取音箱使用数据,基于音箱使用数据识别出位置异常的音箱,可以避免用户使用位置异常的音箱请求服务。
本发明实施例提供的方法中,基于上述的实施过程,具体的,所述确定所述异常音箱识别指令对应的各个待识别音箱,包括:
对所述异常音箱识别指令进行解析,获得所述异常音箱识别指令中包含的区域标识;
确定所述区域标识对应的音箱分布区域;
将所述音箱分布区域中的各个音箱确定为所述异常音箱识别指令对应的各个待识别音箱。
本发明实施例提供的方法中,通过对异常音箱识别指令进行解析,获得该音箱识别指令中的指令信息,可以在该指令信息中获取到区域标识。
其中,可以在预先建立的音箱分布区域集合中确定该区域标识对应的音箱分布区域,该音箱分布区域集合中包含多个备选音箱分布区域,每个备选音箱分布区域均包含多个音箱。
可选的,确定出该区域标识对应的音箱分布区域后,可以将该音箱分布区域中包含的各个音箱确定为待识别音箱。
本发明实施例提供的方法中,基于上述的实施过程,具体的,所述基于每个所述音箱使用数据中的开关数据组以及网络连接数据组在所述多个待识别音箱中确定出候选音箱,包括:
对于每个所述音箱使用数据,判断该音箱使用数据中的开关数据组是否未存在表征关机事件的开关数据;判断该音箱使用数据中的网络连接数据组的各个网络连接数据是否均一致;若前述任一判断的判断结果为否,则将该音箱使用数据所属的待识别音箱确定为候选识别音箱。
本发明实施例提供的方法中,该开关数据组包含在预设时段内的每个时间范围的开关数据,依次确定开关数据组中的每个开关数据是否表征音箱存在关机事件。
可选的,开关数据组记录音箱过去t天内,每天是否有关机事件发生,该开关数据组可以表示为[state0,state1,....statet],statei为每一天的开关数据。
具体的,开关数据组中的开关数据可以为“0”或“1”,0可以表征该待识别音箱在该开关数据对应的时间内不存在关机事件,“1”可以表征该待识别音箱在该开关数据对应的时间内存在关机事件。
例如,开关数据组为[0,0,0,0,0,0,0,0,0,0,1,0,0,0];该开关数据组表征过去两周里面,倒数第四天发生关机事件,其他时间都未发生关机事件。
其中,该网络连接数据组可以包含在预设时段内每个时间范围内音箱所连接的网络设备的mac地址。
可选的,网络连接数据组记录音箱过去t天,每天的连接的网络的mac地址,序列为[mac0,mac1,....mact],maci的取值为mac的地址。
其中,该网络连接数据组中的网络连接数据可以为字符串的形式。
具体的,若音箱使用数据中存在至少一个表征关机事件的开关数据,或者该音箱使用数据中的网络连接数据组中的各个网络连接数据不一致,则将该音箱使用数据所属的待识别音箱确定为候选识别音箱。
本发明实施例提供的方法中,基于上述的实施过程,具体的,由每个所述候选音箱的使用数据中的交互数据组确定每个所述候选音箱的异常分值的过程,如图2所示,具体包括:
S201:对每个所述待识别音箱的音箱使用数据中的交互数据进行向量化处理,得到每个所述待识别音箱的向量集合;其中,所述向量集合包含第一向量组和第二向量组;所述第一向量组包含所述预设时段的第一子时段的交互数据向量,所述第二向量组包含所述预设时段的第二子时段的交互数据向量。
本发明实施例提供的方法中,该交互数据可以为对话数据,该预设时段可以设置为两个星期,该第一子时段可以为第一星期,该第二子时段可以为第二星期,第一向量组可以包含第一星期的每一天的交互数据向量,第二次向量组可以包含第二星期的每一天的交互数据向量,第二星期可以为第一星期的前一星期。
S202:对于每个所述候选音箱,确定该候选音箱的第一向量组与第二向量组的第一相似度;并确定该候选音箱的第一向量组与各个所述待识别音箱中除该候选音箱以外的每个待识别音箱的第二向量组的备选相似度,将各个所述备选相似度中值最大的备选相似度作为该候选音箱的第二相似度。
本发明实施例提供的方法中,第一相似度表征该音箱在第一子时段和第二子时段的行为近似程度,第二相似度表征该音箱与其他音箱的
可选的,基于第一相似度计算公式可以确定该候选音箱的第一向量组与第二向量组的第一相似度,该第一相似度的计算公式,可以包括:
其中,[x0,x1...xnlen]为第一向量组,[y0,y1...ynlen]为第二向量组,SelfValus为第一相似度,nlen为向量长度。
可选的,基于备选相似度计算公式确定该候选音箱的第一向量组与各个所述待识别音箱中除该候选音箱以外的每个待识别音箱的第二向量组的备选相似度,该第二相似度的计算公式如下:
其中,j∈[0,n]且j≠i,n为待识别音箱的数量,roomnum为音箱的位置标识,ohterfValus为备选相似度。
需要说明的是,两个音箱的位置标识的绝对值越小,则说明两个音箱的位置标识所对应的位置越接近。
可选的,在酒店应用场景中,音箱的位置标识可以为房间号,该音箱所在的房间号roomnum可以为四位数值,前两位为楼层数,后两位为同层的编号,例如1201,1202等。
具体的,将各个备选相似度中数值最大的作为第二相似度。
S203:基于每个所述候选音箱的第一相似度和第二相似度,获得每个所述候选音箱的异常分值。
本发明实施例提供的方法中,可以将候选音箱的第二相似度减去第一相似度,得到候选音箱的异常分值,具体为:
SpecailValue=otherfValue-SelfValus
其中,SpecailValue可以为异常分值,该异常分值越大,则表示该异常分值所属的音箱的异常可能性越高。
本发明实施例提供的方法中,基于上述的实施过程,具体的,所述对每个所述候选音箱的音箱使用数据中的交互数据进行向量化处理,得到每个所述待识别音箱的向量集合的过程,如图3所示,具体包括:
S301:对每个所述待识别音箱的音箱使用数据中的每一交互数据进行分词处理,得到每一所述交互数据的各个分词。
本发明实施例提供的方法中,可以采用基于词典的最大匹配分词方法进行分词,针对分词有歧义的部分可以采用序列标注的分词方法,其中,交互数据可以包含用户的对话数据,用户说的一句话q可以由若干的分好的词组成,可以表示为{w0,w1,....wmax},其中max表示允许的句子的最大的长度。
其中,最大匹配方法的词典以及有监督的条件随机场模型的训练学习语料都来源于预先标注的多条用户对话数据,具体的,预先标注的用户对话数据的数量可以为10万条。
S302:应用预先设置的文本深度表示模型将对每个分词进行映射,得到每个分词的词向量。
本发明实施例提供的方法中,可以将每一个分词映射为一个低维连续向量。
其中,该文本深度表示模型将句子中的每个词进行表征获得词向量,该文本深度标识模型可以为word2vec模型,是一个将词语转换成向量形式的工具。
S303:基于每个所述待识别音箱的归属于所述预设时段的第一子时段的各个词向量,获得该待识别音箱的所述第一向量组;并基于每个所述待识别音箱的归属于所述预设时段的第二子时段的各个词向量,获得该待识别音箱的所述第二向量组。
本发明实施例提供的方法中,可以分别将第一子时段和第二时段内的每一交互数据的词向量进行拼接,得到交互数据的句向量,例如,可以将处理后得到语句q的词向量的表示为qvector={d0,d1,....dmax}。
其中,若该第一子时段和第二子时段的时长为一周,则可以将每一天的交互数据的向量表示为Dayi=sum(qvector1,qvector2,qvector3,...),对于每周七天来说,会有不同的入住特点,可以对最近的一周的数据计算,可以得到Weekm=Average(Daym+7*k),其中,m取值为[1,7],表示每周不同的特征值,k为可以选择的最近的k周,可选的,k值取1。
对于每台待识别音箱,可以对一周七天的向量再次进行拼接操作,即可得到待识别音箱的第一子时段的第一向量组和第二子时段的第二向量组,其中,向量组可以表示为:VectorSpeaki=Week1∪Week2∪...∪Week7。
S304:将每个所述待识别音箱的所述第一向量组和所述第二向量组,组成每个所述待识别音箱的所述向量集合。
本发明实施例提供的方法中,由第一词向量组以及第二词向量组组成向量集合。
本发明实施例提供的方法中,基于上述的实施过程,具体的,所述依据每个所述候选音箱的异常分值确定出异常音箱,包括:
按各个所述候选音箱的异常分值由高至低的顺序,选取至少一个候选音箱作为异常音箱。
本发明实施例提供的方法中,可以选取各个候选音箱中异常分值由高至低的顺序,选取异常分值前5%~10%的候选音箱作为异常音箱。
本发明实施例提供的方法中,基于上述的实施过程,具体的,依据每个候选音箱的异常分值确定出异常音箱的另一种可行的方式为:
在各个候选音箱中确定出异常分值是否大于预先设置的分值阈值初始异常音箱,按各个初始异常音箱的异常分值由大至小的顺序在各个初始异常音箱中确定至少一个异常音箱。
在本发明提供的又一异常音箱的确定方法的实施例中,该方法可以应用于多个应用场景,例如,可以应用于酒店中,酒店的每个客房设置有对应的音箱,可以按一定的周期对该酒店中的各个音箱进行检测,以确定出存在位置异常的音箱,具体过程如下:
步骤一,数据准备。
在确定目标酒店后,收集预设时段内该酒店的所有的n台音箱音箱使用数据。该预设时段可以为该过去t天,可以选取过去两周,即,t为14,n台音箱可以记为Speaker1,Speaker2,...,Speakeri,...,Speakern。
对于任意一台音箱Speakeri,收集的数据包括:
(1)用户与音箱的交互数据Dialog;此数据分为用户的问话q和音箱的回答a,{q1,a1,q2,...},如{“帮我送矿泉水”,“您需要几瓶”,“两瓶”,“好的,两瓶水稍后为您送到”}。
(2)音箱的开关数据组OpenCloseData;此数据只需记录过去t天,每天是否有关机事件发生,序列[state0,state1,....statet],statei可以取值为0或者1,如序列[0,0,0,0,0,0,0,0,0,0,1,0,0,0],代表过去两周里面,倒数第四天曾经发生了关机的操作,其他时间都是未关机过;
(3)网络连接数据组WifiMacData;此数据记录设备过去t天,每天的连接的网络的mac地址,该网络连接数据组为[mac0,mac1,....mact],maci的取值为mac的地址,可以为字符串的形式,例如,该网络连接数据组为[“adbcfjiddhdkfh545k”,“adbcfjiddhdkfh545k”,“adbcfjiddhdkfh545k”,“adbcfjiddhdkfh545k”,“adbcfjiddhdkfh545k”,“adbcfjiddhdkfh545k”,“adbcfjiddhdkfh545k”,“adbcfjiddhdkfh545k”,“adbcfjiddhdkfh545k”,“adbcfjiddhdkfh545k”,“adbcfjiddhdkfh545k”,“adbcfjiddhdkfh545k”,“adbcfjiddhdkfh545k”,“adbcfjiddhdkfh545k”],该网络连接数据组代表过去两周每天连接的mac地址都为“adbcfjiddhdkfh545k”。
(4)该音箱所在的房间号roomnum;该房间号一般为四位数值,前两位为楼层数,后两位为同层的编号,例如1201,1202等。
步骤二,确定音箱的向量表示。对于音箱进行向量化的表示,主要是利用用户的对话数据Dialog,进行自然语言的处理,形成合适的向量。包括如下处理流程:
(a)分词,首先采用基于词典的最大匹配分词方法进行分词,针对分词有歧义的部分可以采用序列标注的分词方法。
具体的,用户说的一句话q可以由若干的分好的词组成,q可以表示为{w0,w1,....wmax},其中max表示允许的句子的最大的长度。
(b)词向量表示,把语句中每一个词映射为一个低维连续向量。
其中,可以采用文本深度表示模型(如Word2Vec)将句子中的每个词进行表征获得词向量。word2vec是一个将词语转换成向量形式的工具,处理后得到语句q的词向量的表示qvector={d0,d1,....dmax}。
(c)音箱向量表示,音箱每天所产生的词向量可以进行加和操作,作为当天的一条向量表示得到Dayi=sum(qvector1,qvector2,qvector3,...)。
其中,对于每周七天来说,会有不同的入住特点,所以对最近的一周的数据计算,可以得到Weekm=Average(Daym+7*k),其中m的取值为[1,7],表示每周不同的特征值,k为可以选择的最近的k周,K可以为任意正整数,例如,k值可以取1。
对于每台音箱,可以对一周七天的向量再次进行拼接操作,即可得到音箱的向量表示:VectorSpeaki=Week1∪Week2∪...∪Week7。
步骤三,异常分值的计算。异常分值的计算可以包括两个方面,第一方面,对单个音箱,计算该音箱在本周与上周的行为的“近似性”,将其定义为第一相似度SelfValue;第二方面,计算音箱与其他房间的音箱的近似程度,以判断是否有替换的可能性,将其定义为备选相似度OhterValue。
首先,对于音箱Speakeri,可以根据最近一周(t,y-7)的数据得到第一向量组VectorSpeaki-thisweek,根据上一周(t-8,t-14)的数据,得到第二向量组VectorSpeaki-lastweek,确定该候选音箱的第一向量组与第二向量组的第一相似度。
其次,对于音箱Speakeri的本周的向量表示VectorSpeaki-thisweek与另外一个音箱Speakerj的上周的向量表示VectorSpeakj-lastweek计算相似度,该相似度引入了房间号roomnum要考虑房间的距离关系,临近的房间的音箱更容易发生替换,可以确定该音箱的第一向量组与各个待识别音箱中除该音箱以外的每个待识别音箱的第二向量组的备选相似度,将各个所述备选相似度中值最大的备选相似度作为该音箱的第二相似度。
最后,由音箱的第一相似度和第二相似度得到异常分值SpecailValue,其中,该异常分值越大,则表示该音箱越异常。
步骤四,对候选的音箱进行关键数据的筛选。对于上述几步得到的可能发生的变化的音箱来说,需要对关键的信息进行筛选,得到候选结果。
具体的,可以通过每个音箱的开关数据组OpenCloseData和网络连接数据组WifiMacData确定出各个候选音箱。
其中,音箱的开关数据组中包含至少存在一个表征关机事件的开关数据以及音箱的开关数据组中包含的mac地址中的字符串发生过变化,则将该音箱作为候选音箱。
步骤五,可以在步骤四中的候选结果中,选取得异常分值最高的前5~10%的音箱作为异常音箱并输出。
与图1所述的方法相对应,本发明实施例还提供了一种异常音箱的确定装置,用于对图1中方法的具体实现,本发明实施例提供的异常音箱的确定装置可以应用于电子设备中,其结构示意图如图4所示,具体包括:
第一确定单元401,用于响应于异常音箱识别指令,确定所述异常音箱识别指令对应的各个待识别音箱;
获取单元,用于获取每个所述待识别音箱在预设时段内的音箱使用数据;
第二确定单元402,用于基于每个所述音箱使用数据中的开关数据组以及网络连接数据组在所述各个待识别音箱中确定出候选音箱;
第三确定单元403,用于依据每个所述候选音箱的异常分值在各个所述候选音箱中确定出异常音箱,每个所述候选音箱的异常分值由该候选音箱的使用数据中的交互数据组确定。
本发明实施例提供了一种异常音箱的确定装置,通过响应于异常音箱识别指令,确定所述异常音箱识别指令对应的各个待识别音箱;获取每个所述待识别音箱在预设时段内的音箱使用数据;基于每个所述音箱使用数据中的开关数据组以及网络连接数据组在所述各个待识别音箱中确定出候选音箱;依据每个所述候选音箱的异常分值在各个所述候选音箱中确定出异常音箱,每个所述候选音箱的异常分值由该候选音箱的使用数据中的交互数据组确定。应用本发明实施例提供的装置,能够获取音箱使用数据,基于音箱使用数据识别出位置异常的音箱,进而可以避免用户使用位置异常的音箱请求服务。
在本发明提供的一实施例中,基于上述的方案,可选的,所述第一确定单元401,包括:
解析子单元,用于对所述异常音箱识别指令进行解析,获得所述异常音箱识别指令中包含的区域标识;
第一确定子单元,用于确定所述区域标识对应的音箱分布区域;
第二确定子单元,用于将所述音箱分布区域中的各个音箱确定为所述异常音箱识别指令对应的各个待识别音箱。
在本发明提供的一实施例中,基于上述的方案,可选的,所述第二确定单元402,包括:
第三确定子单元,用于对于每个所述音箱使用数据,判断该音箱使用数据中的开关数据组是否未存在表征关机事件的开关数据;判断该音箱使用数据中的网络连接数据组的各个网络连接数据是否均一致;若前述任一判断的判断结果为否,则将该音箱使用数据所属的待识别音箱确定为候选识别音箱。
在本发明提供的一实施例中,基于上述的方案,可选的,异常音箱的确定还包括第四确定单元,所述第四确定单元被配置为:
对每个所述待识别音箱的音箱使用数据中的交互数据进行向量化处理,得到每个所述待识别音箱的向量集合;其中,所述向量集合包含第一向量组和第二向量组;所述第一向量组包含所述预设时段的第一子时段的交互数据向量,所述第二向量组包含所述预设时段的第二子时段的交互数据向量;
对于每个所述候选音箱,确定该候选音箱的第一向量组与第二向量组的第一相似度;并确定该候选音箱的第一向量组与各个所述待识别音箱中除该候选音箱以外的每个待识别音箱的第二向量组的备选相似度,将各个所述备选相似度中值最大的备选相似度作为该候选音箱的第二相似度;
基于每个所述候选音箱的第一相似度和第二相似度,获得每个所述候选音箱的异常分值。
在本发明提供的一实施例中,基于上述的方案,可选的,所述依据每个所述候选音箱的异常分值确定出异常音箱,包括:
按各个所述候选音箱的异常分值由高至低的顺序,选取至少一个候选音箱作为异常音箱。
上述本发明实施例公开的异常音箱的确定装置中的各个单元和模块具体的原理和执行过程,与上述本发明实施例公开的异常音箱的确定方法相同,可参见上述本发明实施例提供的异常音箱的确定方法中相应的部分,这里不再进行赘述。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
以上对本发明所提供的一种异常音箱的确定方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种异常音箱的确定方法,其特征在于,包括:
响应于异常音箱识别指令,确定所述异常音箱识别指令对应的各个待识别音箱;
获取每个所述待识别音箱在预设时段内的音箱使用数据;
基于每个所述音箱使用数据中的开关数据组以及网络连接数据组在所述各个待识别音箱中确定出候选音箱;
依据每个所述候选音箱的异常分值在各个所述候选音箱中确定出异常音箱,每个所述候选音箱的异常分值由该候选音箱的使用数据中的交互数据组确定;
其中,所述确定所述异常音箱识别指令对应的各个待识别音箱,包括:
对所述异常音箱识别指令进行解析,获得所述异常音箱识别指令中包含的区域标识;
确定所述区域标识对应的音箱分布区域;
将所述音箱分布区域中的各个音箱确定为所述异常音箱识别指令对应的各个待识别音箱。
2.根据权利要求1所述的方法,其特征在于,所述基于每个所述音箱使用数据中的开关数据组以及网络连接数据组在所述各个待识别音箱中确定出候选音箱,包括:
对于每个所述音箱使用数据,判断该音箱使用数据中的开关数据组是否未存在表征关机事件的开关数据;判断该音箱使用数据中的网络连接数据组的各个网络连接数据是否均一致;若前述任一判断的判断结果为否,则将该音箱使用数据所属的待识别音箱确定为候选识别音箱。
3.根据权利要求1所述的方法,其特征在于,由每个所述候选音箱的使用数据中的交互数据组确定每个所述候选音箱的异常分值的过程,包括:
对每个所述待识别音箱的音箱使用数据中的交互数据进行向量化处理,得到每个所述待识别音箱的向量集合;其中,所述向量集合包含第一向量组和第二向量组;所述第一向量组包含所述预设时段的第一子时段的交互数据向量,所述第二向量组包含所述预设时段的第二子时段的交互数据向量;
对于每个所述候选音箱,确定该候选音箱的第一向量组与第二向量组的第一相似度;并确定该候选音箱的第一向量组与各个所述待识别音箱中除该候选音箱以外的每个待识别音箱的第二向量组的备选相似度,将各个所述备选相似度中值最大的备选相似度作为该候选音箱的第二相似度;
基于每个所述候选音箱的第一相似度和第二相似度,获得每个所述候选音箱的异常分值。
4.根据权利要求3所述的方法,其特征在于,所述对每个所述候选音箱的音箱使用数据中的交互数据进行向量化处理,得到每个所述待识别音箱的向量集合,包括:
对每个所述待识别音箱的音箱使用数据中的每一交互数据进行分词处理,得到每一所述交互数据的各个分词;
应用预先设置的文本深度表示模型将对每个分词进行映射,得到每个分词的词向量;
基于每个所述待识别音箱的归属于所述预设时段的第一子时段的各个词向量,获得该待识别音箱的所述第一向量组;并基于每个所述待识别音箱的归属于所述预设时段的第二子时段的各个词向量,获得该待识别音箱的所述第二向量组;
将每个所述待识别音箱的所述第一向量组和所述第二向量组,组成每个所述待识别音箱的向量集合。
5.根据权利要求1所述的方法,其特征在于,所述依据每个所述候选音箱的异常分值确定出异常音箱,包括:
按各个所述候选音箱的异常分值由高至低的顺序,选取至少一个候选音箱作为异常音箱。
6.一种异常音箱的确定装置,其特征在于,包括:
第一确定单元,用于响应于异常音箱识别指令,确定所述异常音箱识别指令对应的各个待识别音箱;
获取单元,用于获取每个所述待识别音箱在预设时段内的音箱使用数据;
第二确定单元,用于基于每个所述音箱使用数据中的开关数据组以及网络连接数据组在所述各个待识别音箱中确定出候选音箱;
第三确定单元,用于依据每个所述候选音箱的异常分值在各个所述候选音箱中确定出异常音箱,每个所述候选音箱的异常分值由该候选音箱的使用数据中的交互数据组确定;
其中,所述第一确定单元,包括:
解析子单元,用于对所述异常音箱识别指令进行解析,获得所述异常音箱识别指令中包含的区域标识;
第一确定子单元,用于确定所述区域标识对应的音箱分布区域;
第二确定子单元,用于将所述音箱分布区域中的各个音箱确定为所述异常音箱识别指令对应的各个待识别音箱。
7.根据权利要求6所述的装置,其特征在于,所述第二确定单元,包括:
第三确定子单元,用于对于每个所述音箱使用数据,判断该音箱使用数据中的开关数据组是否未存在表征关机事件的开关数据;判断该音箱使用数据中的网络连接数据组的各个网络连接数据是否均一致;若前述任一判断的判断结果为否,则将该音箱使用数据所属的待识别音箱确定为候选识别音箱。
8.根据权利要求6所述的装置,其特征在于,还包括第四确定单元,所述第四确定单元被配置为:
对每个所述待识别音箱的音箱使用数据中的交互数据进行向量化处理,得到每个所述待识别音箱的向量集合;其中,所述向量集合包含第一向量组和第二向量组;所述第一向量组包含所述预设时段的第一子时段的交互数据向量,所述第二向量组包含所述预设时段的第二子时段的交互数据向量;
对于每个所述候选音箱,确定该候选音箱的第一向量组与第二向量组的第一相似度;并确定该候选音箱的第一向量组与各个所述待识别音箱中除该候选音箱以外的每个待识别音箱的第二向量组的备选相似度,将各个所述备选相似度中值最大的备选相似度作为该候选音箱的第二相似度;
基于每个所述候选音箱的第一相似度和第二相似度,获得每个所述候选音箱的异常分值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011515981.5A CN112672266B (zh) | 2020-12-21 | 2020-12-21 | 异常音箱的确定方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011515981.5A CN112672266B (zh) | 2020-12-21 | 2020-12-21 | 异常音箱的确定方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112672266A CN112672266A (zh) | 2021-04-16 |
CN112672266B true CN112672266B (zh) | 2022-04-26 |
Family
ID=75406640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011515981.5A Active CN112672266B (zh) | 2020-12-21 | 2020-12-21 | 异常音箱的确定方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112672266B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102780957A (zh) * | 2011-05-09 | 2012-11-14 | 索尼公司 | 声学设备和检测异常声音的方法 |
CN107465987A (zh) * | 2017-08-09 | 2017-12-12 | 广东思派康电子科技有限公司 | 一种语音交互音箱成品拾音系统的测试方法及其测试系统 |
CN110782639A (zh) * | 2019-10-28 | 2020-02-11 | 深圳奇迹智慧网络有限公司 | 异常行为告警方法、装置、系统和存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104661170A (zh) * | 2015-03-09 | 2015-05-27 | 山东省计算中心(国家超级计算济南中心) | 多音箱故障检测系统 |
CN109754798B (zh) * | 2018-12-20 | 2021-10-15 | 歌尔股份有限公司 | 多音箱同步控制方法、系统及音箱 |
CN109830240A (zh) * | 2019-03-25 | 2019-05-31 | 出门问问信息科技有限公司 | 基于语音操作指令识别用户特定身份的方法、装置及系统 |
US11172297B2 (en) * | 2019-04-30 | 2021-11-09 | Pixart Imaging Inc. | Operating method of smart audio system |
CN111629316A (zh) * | 2020-05-15 | 2020-09-04 | 广东思派康电子科技有限公司 | 一种音箱连续播放测试的监测方法及监测系统 |
-
2020
- 2020-12-21 CN CN202011515981.5A patent/CN112672266B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102780957A (zh) * | 2011-05-09 | 2012-11-14 | 索尼公司 | 声学设备和检测异常声音的方法 |
CN107465987A (zh) * | 2017-08-09 | 2017-12-12 | 广东思派康电子科技有限公司 | 一种语音交互音箱成品拾音系统的测试方法及其测试系统 |
CN110782639A (zh) * | 2019-10-28 | 2020-02-11 | 深圳奇迹智慧网络有限公司 | 异常行为告警方法、装置、系统和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112672266A (zh) | 2021-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021082982A1 (zh) | 基于图谱化知识库的问答方法、设备、存储介质及装置 | |
WO2019076286A1 (zh) | 一种语句的用户意图识别方法和装置 | |
CN110415679B (zh) | 语音纠错方法、装置、设备和存储介质 | |
JP2006039575A (ja) | 信頼性スコアを使用した自然言語コール・ルーティングのための方法および装置 | |
WO2021218028A1 (zh) | 基于人工智能的面试内容精炼方法、装置、设备及介质 | |
CN110807566A (zh) | 人工智能模型评测方法、装置、设备及存储介质 | |
CN112287680B (zh) | 一种问诊信息的实体抽取方法、装置、设备及存储介质 | |
CN111930792B (zh) | 数据资源的标注方法、装置、存储介质及电子设备 | |
CN102915493A (zh) | 信息处理装置和方法 | |
CN112685550B (zh) | 智能问答方法、装置、服务器及计算机可读存储介质 | |
CN111429204A (zh) | 酒店推荐方法、系统、电子设备和存储介质 | |
CN109034199B (zh) | 数据处理方法及装置、存储介质和电子设备 | |
CN111026840A (zh) | 文本处理方法、装置、服务器和存储介质 | |
CN110717021A (zh) | 人工智能面试中获取输入文本和相关装置 | |
CN110647613A (zh) | 一种课件构建方法、装置、服务器和存储介质 | |
CN112214595A (zh) | 类别确定方法、装置、设备及介质 | |
CN111126422B (zh) | 行业模型的建立及行业的确定方法、装置、设备及介质 | |
CN114974253A (zh) | 一种基于人物画像的自然语言解释方法、装置及存储介质 | |
CN116402166B (zh) | 一种预测模型的训练方法、装置、电子设备及存储介质 | |
CN110782128B (zh) | 一种用户职业标签生成方法、装置和电子设备 | |
CN112672266B (zh) | 异常音箱的确定方法及装置 | |
CN113535925B (zh) | 语音播报方法、装置、设备及存储介质 | |
CN114611519A (zh) | 一种文本的实体关系抽取方法、装置及电子设备 | |
CN114638308A (zh) | 一种获取对象关系的方法、装置、电子设备和存储介质 | |
CN113468306A (zh) | 语音对话方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Room 702, 7th floor, NO.67, Beisihuan West Road, Haidian District, Beijing 100080 Applicant after: Beijing Yunji Technology Co.,Ltd. Address before: Room 702, 7th floor, NO.67, Beisihuan West Road, Haidian District, Beijing 100080 Applicant before: BEIJING YUNJI TECHNOLOGY Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |