CN108877774B - 一种数据采集装置、数据分析平台、系统及方法 - Google Patents

一种数据采集装置、数据分析平台、系统及方法 Download PDF

Info

Publication number
CN108877774B
CN108877774B CN201810762793.9A CN201810762793A CN108877774B CN 108877774 B CN108877774 B CN 108877774B CN 201810762793 A CN201810762793 A CN 201810762793A CN 108877774 B CN108877774 B CN 108877774B
Authority
CN
China
Prior art keywords
voice
identifier
voice command
same
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810762793.9A
Other languages
English (en)
Other versions
CN108877774A (zh
Inventor
张德春
文静
杜均
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Hongmei Intelligent Technology Co Ltd
Original Assignee
Sichuan Hongmei Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Hongmei Intelligent Technology Co Ltd filed Critical Sichuan Hongmei Intelligent Technology Co Ltd
Priority to CN201810762793.9A priority Critical patent/CN108877774B/zh
Publication of CN108877774A publication Critical patent/CN108877774A/zh
Application granted granted Critical
Publication of CN108877774B publication Critical patent/CN108877774B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2807Exchanging configuration information on appliance services in a home automation network
    • H04L12/2809Exchanging configuration information on appliance services in a home automation network indicating that an appliance service is present in a home automation network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2807Exchanging configuration information on appliance services in a home automation network
    • H04L12/2814Exchanging control software or macros for controlling appliance services in a home automation network

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Telephonic Communication Services (AREA)
  • Selective Calling Equipment (AREA)

Abstract

本发明提供了一种数据采集装置、数据分析平台、系统及方法,该数据采集装置应用于智能家电,包括:自定义单元,用于接收外部定义的至少一个特征标识和每一个所述特征标识对应的至少一个关键参数;采集提取单元,用于采集智能家电的设备标识,读取所述智能家电上的运行日志,从所述运行日志中,采集包含有至少一个所述特征标识的日志语句,并从采集到的所述日志语句中提取包含有至少一个所述关键参数的运行参数;定位单元,用于定位出所述智能家电所在经纬度;通信单元,用于对采集的所述设备标识、提取出的特征标识及对应的运行参数以及定位出的智能家电所在经纬度进行封装发送。本发明提供的方案实现了对智能家电中的数据进行采集。

Description

一种数据采集装置、数据分析平台、系统及方法
技术领域
本发明涉及智能家电技术领域,特别涉及一种数据采集装置、数据分析平台、系统及方法。
背景技术
随着具有语音功能的智能家电的普及,各大家电企业不断推出带有不同语音功能的空调、冰箱和洗衣机等产品。而语音的功能的目的不应该为了智能而智能,而应该贴合不同用户的需求和习惯。
为了能够使语音功能贴合不同用户的需求和习惯,则需要对不同用户使用语音情况进行收集和统计,例如不同地域对语音功能的使用存在差异,不同地域对命令词的发音等存在差异,而对语音使用情况进行收集和统计将有益于分析不同用户对语音的不同需求,以提高用户体验。因此,对智能家电中语音使用情况进行收集及统计则显得十分重要。
发明内容
本发明实施例提供了一种数据采集装置、数据分析平台、系统及方法,实现了对智能家电中语音使用情况进行收集及统计。
一种数据采集装置,应用于智能家电,包括:自定义单元、采集提取单元、定位单元以及通信单元,其中,
所述自定义单元,用于接收外部定义的至少一个特征标识和每一个所述特征标识对应的至少一个关键参数,其中,所述特征标识包括:运行日志中语音标识、遥控标识以及客户端标识中的任意一种或多种;
所述采集提取单元,用于采集智能家电的设备标识,读取所述智能家电上的运行日志,从所述运行日志中,采集包含有至少一个所述特征标识的日志语句,并从采集到的所述日志语句中提取包含有至少一个所述关键参数的运行参数;
所述定位单元,用于定位出所述智能家电所在经纬度;
所述通信单元,用于对所述采集提取单元采集的所述设备标识、所述采集提取单元提取出的特征标识及对应的运行参数以及所述定位单元定位出的智能家电所在经纬度进行封装发送。
可选地,
上述数据采集装置,进一步包括:统计单元,其中,
所述统计单元,用于根据所述运行参数,统计所述采集提取单元采集的所述特征标识对应的使用频率、所述采集提取单元提取出的每一种运行参数的识别率,并针对语音标识,统计所述采集提取单元提取出的语音命令词评测分数;
所述通信单元,进一步用于将所述统计单元统计出的每一种所述特征标识对应的使用频率、所述运行参数对应的命令识别率以及语音命令词评测分数进行封装发送。
可选地,
所述统计单元,用于根据下述频率计算公式,计算所述统计单元统计出的每一种所述特征标识对应的使用频率;
频率计算公式:
Figure BDA0001728264980000021
其中,ωi表征特征标识i对应的使用频率;fi表征预先为特征标识i分配的权重;xij表征特征标识i相关的运行参数中命令类型j在设定时间内出现的频次;n表征特征标识i相关的运行参数包含的命令类型种类;m表征自定义单元定义的特征标识的个数。
可选地,
所述统计单元,用于利用下述识别率计算公式,计算所述采集提取单元提取出的所述运行参数对应的命令识别率;
识别率计算公式:
Figure BDA0001728264980000031
其中,所述βij表征特征标识i对应的命令类型j的识别率;yij表征特征标识i相关的运行参数中命令类型j在设定时间内执行成功的次数;zij表征特征标识i相关的运行参数中命令类型j在设定时间内执行总次数。
可选地,
所述统计单元,用于当所述特征标识包含语音标识时,利用下述评测分数计算公式,计算所述采集提取单元提取出的语音命令词评测分数;
评测分数计算公式:
Figure BDA0001728264980000032
其中,Fg表征与标准语音命令词g相关的评测分数;Tgk表征外部输入的第k次执行成功的语音命令中包含的语音命令词与标准语音命令词g匹配字符数;Bg表征标准语音命令词g的总个数;p表征执行成功的总次数;Da表征预设的地域系数;Sgu表征外部输入的与标准语音命令词g的第u次未执行成功的语音命令的声波与预存的标准语音命令词g声波的匹配度;q表征未执行成功的总次数。
一种数据分析平台,与至少两个上述任一所述的数据采集装置的智能家电连接,包括:通信模块、数据分析模块以及方案优化模块,其中,
所述通信模块,用于接收所述智能家电中的数据采集装置发送的封装后的设备标识、特征标识及对应的运行参数以及智能家电所在经纬度,其中,所述特征标识包括:运行日志中语音标识、遥控标识以及客户端标识中的任意一种或多种;
所述数据分析模块,用于预先按照经纬度划分出各个区域,按照所述通信模块接收到的所述智能家电所在经纬度,确定出所述智能家电所属区域,针对同一区域、同一种设备标识以及同一种特征标识对应的运行参数进行分析和统计;
所述方案优化模块,用于利用所述数据分析模块的分析和统计的结果,针对同一区域、同一种设备标识,对每一种特征标识的运行模式进行优化,并输出优化结果。
可选地,
所述通信模块,进一步用于接收所述智能家电中的数据采集装置发送的封装后所述特征标识对应的使用频率、所述特征标识对应的每一种运行参数的识别率,以及针对语音标识的语音命令词评测分数;
所述数据分析模块,进一步用于利用下述方式使用频率计算公式,统计每一个区域中同一种设备标识对应的每一种调控方式的使用频率;利用下述参数识别率计算公式,统计每一个区域中同一种设备标识对应的每一种运行参数的命令识别率;利用下述区域语音评测分数计算公式,计算每一个区域中同一种设备标识对应的语音命令词区域评测分数;
方式使用频率计算公式:
Figure BDA0001728264980000041
其中,所述Wc表征同一区域同一种设备标识对应的调控方式t的使用频率;ωcte表征同一区域同一种设备标识对应的第e台智能家电的调控方式t的使用频率;n表征同一区域同一种设备标识对应的智能家电的总台数;
参数识别率计算公式:
Figure BDA0001728264980000042
Figure BDA0001728264980000043
其中,μcij表征同一区域同一种设备的特征标识i对应的命令类型j的命令识别率;βcije表征同一区域同一种设备中第e台设备的特征标识i对应的命令类型j的识别率;n表征同一区域同一种设备标识对应的智能家电的总台数;
语音命令词区域评测分数:
Figure BDA0001728264980000051
其中,Qcg表征同一区域同一种设备中与标准语音命令词g相关的语音命令词区域评测分数;Fcge表征同一区域同一种设备中第e台设备与标准语音命令词g相关的评测分数;n表征同一区域同一种设备标识对应的智能家电的总台数。
可选地,上述数据分析平台,进一步包括:结构展示模块和统计查询模块,其中,
所述数据分析模块,用于当所述特征标识为语音标识时,分别统计同一区域中同一种设备标识对应的用户语音命令词/语音激活词使用频次、语音播报频次、语音激活词成功/失败的次数、语音命令词识别成功/失败的次数以及同一地区同一种设备的台数;
所述结果展示模块,用于对所述用户语音命令词/语音激活词使用频次以及语音播报频次进行展示,并按照所述用户语音命令词/语音激活词使用频次,对每一个区域中每一种设备的用户语音命令/语音激活词进行热度排序并以可视化图表方式展示,按照所述用户语音命令词/语音激活词使用频次,对区域进行热度排序并以可视化图表方式展示;
所述统计查询模块,用于按照所述数据分析模块统计出的同一区域中同一种设备标识对应的用户语音命令词/语音激活词使用频次及同一地区同一种设备的台数,分别针对同一区域和同一种设备标识,统计语音识别功能/语音激活功能使用频次、语音识别功能/语音激活功能使用比例以及语音识别功能/语音激活功能使用区域;并分别为统计出的所述语音识别功能/语音激活功能使用频次、所述语音识别功能/语音激活功能使用比例以及所述语音识别功能/语音激活功能使用区域提供查询方式;按照所述数据分析模块统计出的语音播报频次,分别针对同一区域和同一种设备标识,统计语音播报功能使用频次、语音播报功能使用比例、语音播报词条以及语音播报功能使用区域;并分别为统计出的所述语音播报功能使用频次、所述语音播报功能使用比例、所述语音播报词条以及所述语音播报功能使用区域提供查询方式;按照所述数据分析模块统计出的语音激活词成功/失败的次数、语音命令词识别成功/失败的次数,分别针对同一区域和同一种设备标识,统计语音识别率、语音激活率以及语音使用词条,并分别为统计出的所述语音识别率、所述语音激活率以及所述语音使用词条提供查询方式。
可选地,
所述通信模块,进一步用于接收所述智能家电中的数据采集装置发送的封装后的每一次执行成功的语音命令中包含的语音命令词、执行成功的语音命令的声波以及未执行成功的语音命令的声波;
所述方案优化模块,用于利用下述阈值计算公式组,调整每一个区域中每一种设备标识对应的语音命令词阈值/语音激活阈值;
阈值计算公式组计算公式:
Figure BDA0001728264980000061
其中,pg表征所述数据分析模块统计出的第g个标准语音激活词成功的次数/第g个标准语音命令词识别成功的次数;qg表征所述数据分析模块统计出的第g个标准语音激活词失败的次数/第g个标准语音命令词识别失败的次数;r表征标准语音激活词/标准语音命令词的总个数;A表征预设的不小于60%的成功率阈值;R表征预设的不大于30%的成功率阈值;YFc表征同一区域同一种设备标识对应的优化后的语音命令词阈值/语音激活阈值;K表征设备本身具有的语音命令词阈值/语音激活阈值;cgk表征针对同一区域同一种设备标识,所述通信模块接收到的第k次执行成功的语音命令中包含的语音命令词/语音激活词与对应的第g个标准语音命令词/标准激活词匹配字符数;Bcg表征针对同一区域同一种设备标识,第g个标准语音命令词/标准激活词的总个数;Dca表征预设的地域c中同一设备标识对应的第一地域系数;Scgu表征所述通信模块接收到的第u次未执行成功的语音命令的声波与预存的第g个标准语音命令词/标准语音激活词声波的匹配度;D’ca表征预设的地域c中同一设备标识对应的第二地域系数;Scgv表征所述通信模块接收到的第v次执行成功的语音命令的声波与预存的第g个标准语音命令词/语音激活词声波的匹配度。
一种数据分析系统,包括:至少两个上述任一所述的数据采集装置的智能家电和上述任一所述的数据分析平台,其中,
所述智能家电与所述数据分析平台通过http post网络进行协议通信。
一种数据分析方法,与至少两个上述任一所述的数据采集装置的智能家电连接,预先按照经纬度划分出各个区域,还包括:
接收所述智能家电中的数据采集装置发送的封装后的设备标识、特征标识及对应的运行参数以及智能家电所在经纬度,其中,所述特征标识包括:运行日志中语音标识、遥控标识以及客户端标识中的任意一种或多种;
按照所述智能家电所在经纬度,确定出所述智能家电所属区域;
针对同一区域、同一种设备标识以及同一种特征标识对应的运行参数进行分析和统计;
利用所述分析和统计的结果,针对同一区域、同一种设备标识,对每一种特征标识的运行模式进行优化,并输出优化结果。
可选地,
进一步包括:接收所述智能家电中的数据采集装置发送的封装后的每一次执行成功的语音命令中包含的语音命令词、执行成功的语音命令的声波以及未执行成功的语音命令的声波;
所述针对同一区域、同一种设备标识以及同一种特征标识对应的运行参数进行分析和统计,包括:当所述特征标识为语音标识时,分别统计语音激活词成功/失败的次数、语音命令词识别成功/失败的次数以及同一地区同一种设备的台数;
所述利用所述分析和统计的结果,针对同一区域、同一种设备标识,对每一种特征标识的运行模式进行优化,包括:
利用下述阈值计算公式组,调整每一个区域中每一种设备标识对应的语音命令词阈值/语音激活阈值;
阈值计算公式组计算公式:
Figure BDA0001728264980000081
其中,pg表征第g个标准语音激活词成功的次数/第g个标准语音命令词识别成功的次数;qg表征第g个标准语音激活词失败的次数/第g个标准语音命令词识别失败的次数;r表征标准语音激活词/标准语音命令词的总个数;A表征预设的不小于60%的成功率阈值;R表征预设的不大于30%的成功率阈值;YFc表征同一区域同一种设备标识对应的优化后的语音命令词阈值/语音激活阈值;K表征设备本身具有的语音命令词阈值/语音激活阈值;cgk表征针对同一区域同一种设备标识,所述通信模块接收到的第k次执行成功的语音命令中包含的语音命令词/语音激活词与对应的第g个标准语音命令词/标准激活词匹配字符数;Bcg表征针对同一区域同一种设备标识,第g个标准语音命令词/标准激活词的总个数;Dca表征预设的地域c中同一设备标识对应的第一地域系数;Scgu表征所述通信模块接收到的第u次未执行成功的语音命令的声波与预存的第g个标准语音命令词/标准语音激活词声波的匹配度;D’ca表征预设的地域c中同一设备标识对应的第二地域系数;Scgv表征所述通信模块接收到的第v次执行成功的语音命令的声波与预存的第g个标准语音命令词/语音激活词声波的匹配度。
本发明实施例提供了一种数据采集装置、数据分析平台、系统及方法,通过数据采集装置应用于智能家电,该数据采集装置中,包括:自定义单元、采集提取单元、定位单元以及通信单元,其中,所述自定义单元,用于接收外部定义的至少一个特征标识和每一个所述特征标识对应的至少一个关键参数,其中,所述特征标识包括:运行日志中语音标识、遥控标识以及客户端标识中的任意一种或多种;所述采集提取单元,用于采集智能家电的设备标识,读取所述智能家电上的运行日志,从所述运行日志中,采集包含有至少一个所述特征标识的日志语句,并从采集到的所述日志语句中提取包含有至少一个所述关键参数的运行参数;所述定位单元,用于定位出所述智能家电所在经纬度;所述通信单元,用于对所述采集提取单元采集的所述设备标识、所述采集提取单元提取出的特征标识及对应的运行参数以及所述定位单元定位出的智能家电所在经纬度进行封装发送,实现了对智能家电中语音使用情况进行收集,另外,通过数据分析平台,对数据采集装置采集到的智能家电中语音使用情况,按照所述通信模块接收到的所述智能家电所在经纬度,确定出所述智能家电所属区域,针对同一区域、同一种设备标识以及同一种特征标识对应的运行参数进行分析和统计,利用所述数据分析模块的分析和统计的结果,针对同一区域、同一种设备标识,对每一种特征标识的运行模式进行优化,并输出优化结果,实现了对智能家电中语音使用情况的统计。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的数据采集装置的结构示意图;
图2是本发明另一个实施例提供的数据采集装置的结构示意图;
图3是本发明一个实施例提供的数据分析平台的结构示意图;
图4是本发明另一个实施例提供的数据分析平台的结构示意图;
图5是本发明一个实施例提供的数据分析系统的结构示意图;
图6是本发明一个实施例提供的数据分析方法的流程图;
图7是本发明另一个实施例提供的数据分析方法的流程图;
图8是本发明又一个实施例提供的数据分析方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种数据采集装置,应用于智能家电,该数据采集装置可以包括:自定义单元101、采集提取单元102、定位单元103以及通信单元104,其中,
所述自定义单元101,用于接收外部定义的至少一个特征标识和每一个所述特征标识对应的至少一个关键参数,其中,所述特征标识包括:运行日志中语音标识、遥控标识以及客户端标识中的任意一种或多种;
所述采集提取单元102,用于采集智能家电的设备标识,读取所述智能家电上的运行日志,从所述运行日志中,采集包含有至少一个所述特征标识的日志语句,并从采集到的所述日志语句中提取包含有至少一个所述关键参数的运行参数;
所述定位单元103,用于定位出所述智能家电所在经纬度;
所述通信单元104,用于对所述采集提取单元102采集的所述设备标识、所述采集提取单元102提取出的特征标识及对应的运行参数以及所述定位单元103定位出的智能家电所在经纬度进行封装发送。
在图1所示的实施例中,所述自定义单元,用于接收外部定义的至少一个特征标识和每一个所述特征标识对应的至少一个关键参数,其中,所述特征标识包括:运行日志中语音标识、遥控标识以及客户端标识中的任意一种或多种;所述采集提取单元,用于采集智能家电的设备标识,读取所述智能家电上的运行日志,从所述运行日志中,采集包含有至少一个所述特征标识的日志语句,并从采集到的所述日志语句中提取包含有至少一个所述关键参数的运行参数;所述定位单元,用于定位出所述智能家电所在经纬度;所述通信单元,用于对所述采集提取单元采集的所述设备标识、所述采集提取单元提取出的特征标识及对应的运行参数以及所述定位单元定位出的智能家电所在经纬度进行封装发送,实现了对智能家电中语音使用情况进行收集。
在本发明一个实施例中,如图2所示,上述数据采集装置,进一步包括:统计单元201,其中,
所述统计单元201,用于根据所述运行参数,统计所述采集提取单元102采集的所述特征标识对应的使用频率、所述采集提取单元102提取出的每一种运行参数的识别率,并针对语音标识,统计所述采集提取单元102提取出的语音命令词评测分数;
所述通信单元104,进一步用于将所述统计单元201统计出的每一种所述特征标识对应的使用频率、所述运行参数对应的命令识别率以及语音命令词评测分数进行封装发送。
该过程实现了对每一台智能家电的使用情况,尤其是语音使用情况进行了统计,以方便后续的管理。
在本发明另一实施例中,所述统计单元,用于根据下述频率计算公式,计算所述统计单元统计出的每一种所述特征标识对应的使用频率;
频率计算公式:
Figure BDA0001728264980000121
其中,ωi表征特征标识i对应的使用频率;fi表征预先为特征标识i分配的权重;xij表征特征标识i相关的运行参数中命令类型j在设定时间内出现的频次;n表征特征标识i相关的运行参数包含的命令类型种类;m表征自定义单元定义的特征标识的个数。上面已经提及特征标识可为遥控标识即通过遥控控制智能家电的标识,也可以为语音标识即通过语音命令控制智能家电的标识,还可以为客户端标识即通过客户端APP控制智能家电的标识。
在本发明又一实施例中,所述统计单元,用于利用下述识别率计算公式,计算所述采集提取单元提取出的所述运行参数对应的命令识别率;
识别率计算公式:
Figure BDA0001728264980000122
其中,所述βij表征特征标识i对应的命令类型j的识别率;yij表征特征标识i相关的运行参数中命令类型j在设定时间内执行成功的次数;zij表征特征标识i相关的运行参数中命令类型j在设定时间内执行总次数。
在本发明又一实施例中,所述统计单元,用于当所述特征标识包含语音标识时,利用下述评测分数计算公式,计算所述采集提取单元提取出的语音命令词评测分数;
评测分数计算公式:
Figure BDA0001728264980000131
其中,Fg表征与标准语音命令词g相关的评测分数;Tgk表征外部输入的第k次执行成功的语音命令中包含的语音命令词与标准语音命令词g匹配字符数;Bg表征标准语音命令词g的总个数;p表征执行成功的总次数;Da表征预设的地域系数;Sgu表征外部输入的与标准语音命令词g的第u次未执行成功的语音命令的声波与预存的标准语音命令词g声波的匹配度;q表征未执行成功的总次数。
如图3所示,本发明一个实施例提供一种数据分析平台,与至少两个具有数据采集装置的智能家电连接,包括:通信模块301、数据分析模块302以及方案优化模块303,其中,
所述通信模块301,用于接收所述智能家电中的数据采集装置发送的封装后的设备标识、特征标识及对应的运行参数以及智能家电所在经纬度,其中,所述特征标识包括:运行日志中语音标识、遥控标识以及客户端标识中的任意一种或多种;
所述数据分析模块302,用于预先按照经纬度划分出各个区域,按照所述通信模块301接收到的所述智能家电所在经纬度,确定出所述智能家电所属区域,针对同一区域、同一种设备标识以及同一种特征标识对应的运行参数进行分析和统计;
所述方案优化模块303,用于利用所述数据分析模块302的分析和统计的结果,针对同一区域、同一种设备标识,对每一种特征标识的运行模式进行优化,并输出优化结果。
该输出的优化结果可以给技术人员或者是管理者查看,以针对优化结果调整智能家电。
在图3所示的实施例中,对数据采集装置采集到的智能家电中语音使用情况,按照所述通信模块接收到的所述智能家电所在经纬度,确定出所述智能家电所属区域,针对同一区域、同一种设备标识以及同一种特征标识对应的运行参数进行分析和统计,利用所述数据分析模块的分析和统计的结果,针对同一区域、同一种设备标识,对每一种特征标识的运行模式进行优化,并输出优化结果,实现了对智能家电中语音使用情况的统计。
在本发明另一实施例中,所述通信模块,进一步用于接收所述智能家电中的数据采集装置发送的封装后所述特征标识对应的使用频率、所述特征标识对应的每一种运行参数的识别率,以及针对语音标识的语音命令词评测分数;
所述数据分析模块,进一步用于利用下述方式使用频率计算公式,统计每一个区域中同一种设备标识对应的每一种调控方式的使用频率;利用下述参数识别率计算公式,统计每一个区域中同一种设备标识对应的每一种运行参数的命令识别率;利用下述区域语音评测分数计算公式,计算每一个区域中同一种设备标识对应的语音命令词区域评测分数;
方式使用频率计算公式:
Figure BDA0001728264980000141
其中,所述Wc表征同一区域同一种设备标识对应的调控方式t的使用频率;ωcte表征同一区域同一种设备标识对应的第e台智能家电的调控方式t的使用频率;n表征同一区域同一种设备标识对应的智能家电的总台数;
参数识别率计算公式:
Figure BDA0001728264980000142
Figure BDA0001728264980000143
其中,μcij表征同一区域同一种设备的特征标识i对应的命令类型j的命令识别率;βcije表征同一区域同一种设备中第e台设备的特征标识i对应的命令类型j的识别率;n表征同一区域同一种设备标识对应的智能家电的总台数;
语音命令词区域评测分数:
Figure BDA0001728264980000151
其中,Qcg表征同一区域同一种设备中与标准语音命令词g相关的语音命令词区域评测分数;Fcge表征同一区域同一种设备中第e台设备与标准语音命令词g相关的评测分数;n表征同一区域同一种设备标识对应的智能家电的总台数。
如图4所示,在本发明另一实施例中,上述数据分析平台,进一步包括:结构展示模块401和统计查询模块402,其中,
所述数据分析模块302,用于当所述特征标识为语音标识时,分别统计同一区域中同一种设备标识对应的用户语音命令词/语音激活词使用频次、语音播报频次、语音激活词成功/失败的次数、语音命令词识别成功/失败的次数以及同一地区同一种设备的台数;
所述结果展示模块401,用于对所述用户语音命令词/语音激活词使用频次以及语音播报频次进行展示,并按照所述用户语音命令词/语音激活词使用频次,对每一个区域中每一种设备的用户语音命令/语音激活词进行热度排序并以可视化图表方式展示,按照所述用户语音命令词/语音激活词使用频次,对区域进行热度排序并以可视化图表方式展示;
所述统计查询模块402,用于按照所述数据分析模块302统计出的同一区域中同一种设备标识对应的用户语音命令词/语音激活词使用频次及同一地区同一种设备的台数,分别针对同一区域和同一种设备标识,统计语音识别功能/语音激活功能使用频次、语音识别功能/语音激活功能使用比例以及语音识别功能/语音激活功能使用区域;并分别为统计出的所述语音识别功能/语音激活功能使用频次、所述语音识别功能/语音激活功能使用比例以及所述语音识别功能/语音激活功能使用区域提供查询方式;按照所述数据分析模块302统计出的语音播报频次,分别针对同一区域和同一种设备标识,统计语音播报功能使用频次、语音播报功能使用比例、语音播报词条以及语音播报功能使用区域;并分别为统计出的所述语音播报功能使用频次、所述语音播报功能使用比例、所述语音播报词条以及所述语音播报功能使用区域提供查询方式;按照所述数据分析模块302统计出的语音激活词成功/失败的次数、语音命令词识别成功/失败的次数,分别针对同一区域和同一种设备标识,统计语音识别率、语音激活率以及语音使用词条,并分别为统计出的所述语音识别率、所述语音激活率以及所述语音使用词条提供查询方式。
在本发明又一实施例中,所述通信模块,进一步用于接收所述智能家电中的数据采集装置发送的封装后的每一次执行成功的语音命令中包含的语音命令词、执行成功的语音命令的声波以及未执行成功的语音命令的声波;
所述方案优化模块,用于利用下述阈值计算公式组,调整每一个区域中每一种设备标识对应的语音命令词阈值/语音激活阈值;
阈值计算公式组计算公式:
Figure BDA0001728264980000161
其中,pg表征所述数据分析模块统计出的第g个标准语音激活词成功的次数/第g个标准语音命令词识别成功的次数;qg表征所述数据分析模块统计出的第g个标准语音激活词失败的次数/第g个标准语音命令词识别失败的次数;r表征标准语音激活词/标准语音命令词的总个数;A表征预设的不小于60%的成功率阈值;R表征预设的不大于30%的成功率阈值;YFc表征同一区域同一种设备标识对应的优化后的语音命令词阈值/语音激活阈值;K表征设备本身具有的语音命令词阈值/语音激活阈值;cgk表征针对同一区域同一种设备标识,所述通信模块接收到的第k次执行成功的语音命令中包含的语音命令词/语音激活词与对应的第g个标准语音命令词/标准激活词匹配字符数;Bcg表征针对同一区域同一种设备标识,第g个标准语音命令词/标准激活词的总个数;Dca表征预设的地域c中同一设备标识对应的第一地域系数;Scgu表征所述通信模块接收到的第u次未执行成功的语音命令的声波与预存的第g个标准语音命令词/标准语音激活词声波的匹配度;’ca表征预设的地域c中同一设备标识对应的第二地域系数;Scgv表征所述通信模块接收到的第v次执行成功的语音命令的声波与预存的第g个标准语音命令词/语音激活词声波的匹配度。
如图5所示,本发明实施例提供一种数据分析系统,包括:至少两个具有数据采集装置的智能家电501和数据分析平台502,其中,
所述智能家电501与所述数据分析平台502通过http post网络进行协议通信。
如图6所示,本发明一个实施例提供一种数据分析方法,与至少两个上述任一所述的数据采集装置的智能家电连接,该数据分析方法可包括如下步骤:
步骤601:预先按照经纬度划分出各个区域;
步骤602:接收所述智能家电中的数据采集装置发送的封装后的设备标识、特征标识及对应的运行参数以及智能家电所在经纬度,其中,所述特征标识包括:运行日志中语音标识、遥控标识以及客户端标识中的任意一种或多种;
步骤603:按照智能家电所在经纬度,确定出所述智能家电所属区域;
步骤604:针对同一区域、同一种设备标识以及同一种特征标识对应的运行参数进行分析和统计;
步骤605:利用分析和统计的结果,针对同一区域、同一种设备标识,对每一种特征标识的运行模式进行优化,并输出优化结果。
在本发明一个实施例中,上述放法进一步包括:接收所述智能家电中的数据采集装置发送的封装后的每一次执行成功的语音命令中包含的语音命令词、执行成功的语音命令的声波以及未执行成功的语音命令的声波;
所述针对同一区域、同一种设备标识以及同一种特征标识对应的运行参数进行分析和统计,包括:当所述特征标识为语音标识时,分别统计语音激活词成功/失败的次数、语音命令词识别成功/失败的次数以及同一地区同一种设备的台数;
所述利用所述分析和统计的结果,针对同一区域、同一种设备标识,对每一种特征标识的运行模式进行优化,包括:
利用下述阈值计算公式组,调整每一个区域中每一种设备标识对应的语音命令词阈值/语音激活阈值;
阈值计算公式组计算公式:
Figure BDA0001728264980000181
其中,pg表征第g个标准语音激活词成功的次数/第g个标准语音命令词识别成功的次数;qg表征第g个标准语音激活词失败的次数/第g个标准语音命令词识别失败的次数;r表征标准语音激活词/标准语音命令词的总个数;A表征预设的不小于60%的成功率阈值;R表征预设的不大于30%的成功率阈值;YFc表征同一区域同一种设备标识对应的优化后的语音命令词阈值/语音激活阈值;K表征设备本身具有的语音命令词阈值/语音激活阈值;cgk表征针对同一区域同一种设备标识,所述通信模块接收到的第k次执行成功的语音命令中包含的语音命令词/语音激活词与对应的第g个标准语音命令词/标准激活词匹配字符数;Bcg表征针对同一区域同一种设备标识,第g个标准语音命令词/标准激活词的总个数;Dca表征预设的地域c中同一设备标识对应的第一地域系数;Scgu表征所述通信模块接收到的第u次未执行成功的语音命令的声波与预存的第g个标准语音命令词/标准语音激活词声波的匹配度;D’ca表征预设的地域c中同一设备标识对应的第二地域系数;Scgv表征所述通信模块接收到的第v次执行成功的语音命令的声波与预存的第g个标准语音命令词/语音激活词声波的匹配度。
数据分析平台分析数据分为两种情况,一种是直接分析智能家电发来的原始数据;另一种情况为在智能家电发来的使用频率、识别率及评测分数的基础上进行分析,下面将以该两种情况分开论述。
情况一:直接分析智能家电发来的原始数据:
下面将以采集全国同一型号的智能空调中的语音命令执行情况,并通过对同一型号的智能空调中的语音命令执行情况进行统计分析,优化不同区域的语音命令词阈值/语音激活词阈值,以保证智能空调对语音命令识别率,提高用户体验,同时可以为技术人员或管理者提供统计查询或者优化结果查询,以方便技术人员或管理者对智能空调的语音功能按需调整。其具体实时方式,如图7所示,可包括如下步骤:
步骤701:数据分析平台预先按照经纬度划分出各个区域;
例如:将口音相近的A省和B省划分到一个区域命名为区域1。
步骤702:各个智能空调对自身语音命令执行情况进行采集,并定位自身所在经纬度;
该过程的具体实施方式是,安装于智能空调中的数据采集装置,接收外部定义的语音标识,该定义的语音标识是为了能够从智能空调的运行日志中直接找到与语音标识相关的信息即从运行日志中,采集包含有至少一个语音标识的日志语句,并从采集到的日志语句中提取包含有至少一个关键参数的运行参数。另外,定义遥控标识,则能够从智能空调的运行日志中直接找到与遥控标识相关的信息,定义客户端标识,则能够从智能空调的运行日志中直接找到与客户端标识相关的信息,在此不再赘述。
步骤703:将采集到的语音命令执行情况,定位出的经纬度以及自身的设备标识发送给数据分析平台;
该语音命令执行情况可以包括:每一次执行成功的语音命令中包含的语音命令词、执行成功的语音命令的声波以及未执行成功的语音命令的声波。
步骤704:数据分析平台接收智能空调发送的封装后的设备标识、语音标识及对应的运行参数以及智能空调所在经纬度;
步骤705:按照智能空调所在经纬度,确定出智能空调所属区域;
步骤706:针对同一区域、同一种设备标识以及同一种特征标识对应的运行参数进行分析和统计;
该步骤具体实施方式:分别统计同一区域中同一种设备标识对应的用户语音命令词/语音激活词使用频次、语音播报频次、语音激活词成功/失败的次数、语音命令词识别成功/失败的次数以及同一地区同一种设备的台数;
步骤707:对统计结果进行展示,并接受对统计结果的查询;
对所述用户语音命令词/语音激活词使用频次以及语音播报频次进行展示,并按照所述用户语音命令词/语音激活词使用频次,对每一个区域中每一种设备的用户语音命令/语音激活词进行热度排序并以可视化图表方式展示,按照所述用户语音命令词/语音激活词使用频次,对区域进行热度排序并以可视化图表方式展示;按照统计出的同一区域中同一种设备标识对应的用户语音命令词/语音激活词使用频次及同一地区同一种设备的台数,分别针对同一区域和同一种设备标识,统计语音识别功能/语音激活功能使用频次、语音识别功能/语音激活功能使用比例以及语音识别功能/语音激活功能使用区域;并分别为统计出的所述语音识别功能/语音激活功能使用频次、所述语音识别功能/语音激活功能使用比例以及所述语音识别功能/语音激活功能使用区域提供查询方式;按照统计出的语音播报频次,分别针对同一区域和同一种设备标识,统计语音播报功能使用频次、语音播报功能使用比例、语音播报词条以及语音播报功能使用区域;并分别为统计出的所述语音播报功能使用频次、所述语音播报功能使用比例、所述语音播报词条以及所述语音播报功能使用区域提供查询方式;按照统计出的语音激活词成功/失败的次数、语音命令词识别成功/失败的次数,分别针对同一区域和同一种设备标识,统计语音识别率、语音激活率以及语音使用词条,并分别为统计出的所述语音识别率、所述语音激活率以及所述语音使用词条提供查询方式。
步骤708:利用所述分析和统计的结果,针对同一区域、同一种设备标识,对每一种特征标识的运行模式进行优化,并输出优化结果。
该步骤的具体实施方式:利用下述阈值计算公式组,调整每一个区域中每一种设备标识对应的语音命令词阈值/语音激活阈值;
阈值计算公式组计算公式:
Figure BDA0001728264980000211
其中,pg表征所述数据分析模块统计出的第g个标准语音激活词成功的次数/第g个标准语音命令词识别成功的次数;qg表征所述数据分析模块统计出的第g个标准语音激活词失败的次数/第g个标准语音命令词识别失败的次数;r表征标准语音激活词/标准语音命令词的总个数;A表征预设的不小于60%的成功率阈值;R表征预设的不大于30%的成功率阈值;YFc表征同一区域同一种设备标识对应的优化后的语音命令词阈值/语音激活阈值;K表征设备本身具有的语音命令词阈值/语音激活阈值;Tcgk表征针对同一区域同一种设备标识,所述通信模块接收到的第k次执行成功的语音命令中包含的语音命令词/语音激活词与对应的第g个标准语音命令词/标准激活词匹配字符数;Bcg表征针对同一区域同一种设备标识,第g个标准语音命令词/标准激活词的总个数;Dca表征预设的地域c中同一设备标识对应的第一地域系数;Scgu表征所述通信模块接收到的第u次未执行成功的语音命令的声波与预存的第g个标准语音命令词/标准语音激活词声波的匹配度;D’ca表征预设的地域c中同一设备标识对应的第二地域系数;Scgv表征所述通信模块接收到的第v次执行成功的语音命令的声波与预存的第g个标准语音命令词/语音激活词声波的匹配度。
情况二:在智能家电发来的使用频率、识别率及评测分数的基础上进行分析:
下面将在全国同一型号的智能空调中的语音命令的使用频率、识别率及评测分数的基础上,进行统计分析,优化不同区域的语音命令词阈值/语音激活词阈值,以保证智能空调对语音命令识别率,提高用户体验,同时可以为技术人员或管理者提供统计查询或者优化结果查询,以方便技术人员或管理者对智能空调的语音功能按需调整。其具体实时方式,如图8所示,可包括如下步骤:
步骤801:数据分析平台预先按照经纬度划分出各个区域;
例如:将口音相近的A省和B省划分到一个区域命名为区域1。
步骤802:各个智能空调对自身语音命令执行情况进行采集,并定位自身所在经纬度;
该过程的具体实施方式是,安装于智能空调中的数据采集装置,接收外部定义的语音标识,该定义的语音标识是为了能够从智能空调的运行日志中直接找到与语音标识相关的信息即从运行日志中,采集包含有至少一个语音标识的日志语句,并从采集到的日志语句中提取包含有至少一个关键参数的运行参数。另外,定义遥控标识,则能够从智能空调的运行日志中直接找到与遥控标识相关的信息,定义客户端标识,则能够从智能空调的运行日志中直接找到与客户端标识相关的信息,在此不再赘述。
步骤803:智能空调统计自身的语音标识对应的使用频率、每一种语音命令词的识别率以及语音命令词评测分数;
该步骤的具体实施方式:
根据下述频率计算公式,计算语音标识对应的使用频率;
频率计算公式:
Figure BDA0001728264980000231
其中,ωi表征特征标识i对应的使用频率;fi表征预先为特征标识i分配的权重;xij表征特征标识i相关的运行参数中命令类型j在设定时间内出现的频次;n表征特征标识i相关的运行参数包含的命令类型种类;m表征自定义单元定义的特征标识的个数;
利用下述识别率计算公式,计算语音命令对应的命令识别率;
识别率计算公式:
Figure BDA0001728264980000232
其中,所述βij表征特征标识i对应的命令类型j的识别率;yij表征特征标识i相关的运行参数中命令类型j在设定时间内执行成功的次数;zij表征特征标识i相关的运行参数中命令类型j在设定时间内执行总次数;
利用下述评测分数计算公式,计算语音命令词评测分数;
评测分数计算公式:
Figure BDA0001728264980000233
其中,Fg表征与标准语音命令词g相关的评测分数;Tgk表征外部输入的第k次执行成功的语音命令中包含的语音命令词与标准语音命令词g匹配字符数;Bg表征标准语音命令词g的总个数;p表征执行成功的总次数;Da表征预设的地域系数;Sgu表征外部输入的与标准语音命令词g的第u次未执行成功的语音命令的声波与预存的标准语音命令词g声波的匹配度;q表征未执行成功的总次数。
步骤804:接收智能空调发送的封装后语音标识对应的使用频率、语音命令的识别率以及语音命令词评测分数,以及智能家电所在经纬度;
步骤805:按照智能空调所在经纬度,确定出所述智能空调所属区域;
步骤806:针对同一区域、同一种设备标识以及同一种特征标识对应的运行参数进行分析和统计;
该步骤具体实施方式可以包括:利用下述方式使用频率计算公式,统计每一个区域中同一种设备标识对应的每一种调控方式的使用频率;利用下述参数识别率计算公式,统计每一个区域中同一种设备标识对应的每一种运行参数的命令识别率;利用下述区域语音评测分数计算公式,计算每一个区域中同一种设备标识对应的语音命令词区域评测分数;
方式使用频率计算公式:
Figure BDA0001728264980000241
其中,所述Wc表征同一区域同一种设备标识对应的调控方式t的使用频率;ωcte表征同一区域同一种设备标识对应的第e台智能家电的调控方式t的使用频率;n表征同一区域同一种设备标识对应的智能家电的总台数;
参数识别率计算公式:
Figure BDA0001728264980000242
Figure BDA0001728264980000243
其中,μcij表征同一区域同一种设备的特征标识i对应的命令类型j的命令识别率;βcije表征同一区域同一种设备中第e台设备的特征标识i对应的命令类型j的识别率;n表征同一区域同一种设备标识对应的智能家电的总台数;
语音命令词区域评测分数:
Figure BDA0001728264980000244
其中,Qcg表征同一区域同一种设备中与标准语音命令词g相关的语音命令词区域评测分数;Fcge表征同一区域同一种设备中第e台设备与标准语音命令词g相关的评测分数;n表征同一区域同一种设备标识对应的智能家电的总台数。
步骤807:利用所述分析和统计的结果,针对同一区域、同一种设备标识,对每一种特征标识的运行模式进行优化,并输出优化结果,并接受查询。
可以理解地,除了智能空调,其他包含有数据采集装置的智能家电如冰箱、洗衣机等均可通过上述方法完成统计和分析;另外,除了针对语音命令,其他的调控指令如遥控调控、客户端APP调控也均适用。
值得说明的是,所述智能家电与所述数据分析平台通过http post网络进行协议通信。智能家电将数据封装成http post数据格式。上述数据分析平台可以基于Hadoop分布式完成,以分布式对不同数据进行分类存储。
本发明实施例提供了一种可读介质,包括执行指令,当存储控制器的处理器执行所述执行指令时,所述存储控制器执行本发明上述任一实施例提供的方法。
本发明实施例提供了一种存储控制器,包括:处理器、存储器和总线;所述存储器用于存储执行指令,所述处理器与所述存储器通过所述总线连接,当所述存储控制器运行时,所述处理器执行所述存储器存储的所述执行指令,以使所述存储控制器执行本发明上述任一实施例提供的方法。
综上所述,本发明以上各个实施例至少具有如下有益效果:
1、在本发明实施例中,通过数据采集装置应用于智能家电,该数据采集装置中,包括:自定义单元、采集提取单元、定位单元以及通信单元,其中,所述自定义单元,用于接收外部定义的至少一个特征标识和每一个所述特征标识对应的至少一个关键参数,其中,所述特征标识包括:运行日志中语音标识、遥控标识以及客户端标识中的任意一种或多种;所述采集提取单元,用于采集智能家电的设备标识,读取所述智能家电上的运行日志,从所述运行日志中,采集包含有至少一个所述特征标识的日志语句,并从采集到的所述日志语句中提取包含有至少一个所述关键参数的运行参数;所述定位单元,用于定位出所述智能家电所在经纬度;所述通信单元,用于对所述采集提取单元采集的所述设备标识、所述采集提取单元提取出的特征标识及对应的运行参数以及所述定位单元定位出的智能家电所在经纬度进行封装发送,实现了对智能家电中语音使用情况及其他指令调控的使用情况进行收集。
2、通过数据分析平台,对数据采集装置采集到的智能家电中语音使用情况,按照所述通信模块接收到的所述智能家电所在经纬度,确定出所述智能家电所属区域,针对同一区域、同一种设备标识以及同一种特征标识对应的运行参数进行分析和统计,利用所述数据分析模块的分析和统计的结果,针对同一区域、同一种设备标识,对每一种特征标识的运行模式进行优化,并输出优化结果,实现了对智能家电中语音使用情况及其他智能调控情况的统计。
3、统计单元,用于根据所述运行参数,统计所述采集提取单元采集的所述特征标识对应的使用频率、所述采集提取单元提取出的每一种运行参数的识别率,并针对语音标识,统计所述采集提取单元提取出的语音命令词评测分数;通信单元,进一步用于将所述统计单元统计出的每一种所述特征标识对应的使用频率、所述运行参数对应的命令识别率以及语音命令词评测分数进行封装发送。该过程实现了对每一台智能家电的使用情况,尤其是语音使用情况进行了统计,以方便后续的管理。
4、数据分析平台为用户提供了各种查询方式,方便技术人员或者管理者掌握对智能家电使用情况,以根据智能家电使用情况对智能家电进行调整,提高了用户体验。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个······”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (6)

1.一种数据分析平台,其特征在于,与至少两个具有数据采集装置的智能家电连接,包括:通信模块、数据分析模块以及方案优化模块,其中,
所述通信模块,用于接收所述智能家电中的数据采集装置发送的封装后的设备标识、特征标识及对应的运行参数以及智能家电所在经纬度,其中,所述特征标识包括:运行日志中语音标识、遥控标识以及客户端标识中的任意一种或多种;
所述数据分析模块,用于预先按照经纬度划分出各个区域,按照所述通信模块接收到的所述智能家电所在经纬度,确定出所述智能家电所属区域,针对同一区域、同一种设备标识以及同一种特征标识对应的运行参数进行分析和统计;
所述方案优化模块,用于利用所述数据分析模块的分析和统计的结果,针对同一区域、同一种设备标识,对每一种特征标识的运行模式进行优化,并输出优化结果;
所述数据采集装置应用于智能家电,包括:自定义单元、采集提取单元、定位单元以及通信单元,其中,
所述自定义单元,用于接收外部定义的至少一个特征标识和每一个所述特征标识对应的至少一个关键参数,其中,所述特征标识包括:运行日志中语音标识、遥控标识以及客户端标识中的任意一种或多种;
所述采集提取单元,用于采集智能家电的设备标识,读取所述智能家电上的运行日志,从所述运行日志中,采集包含有至少一个所述特征标识的日志语句,并从采集到的所述日志语句中提取包含有至少一个所述关键参数的运行参数;
所述定位单元,用于定位出所述智能家电所在经纬度;
所述通信单元,用于对所述采集提取单元采集的所述设备标识、所述采集提取单元提取出的特征标识及对应的运行参数以及所述定位单元定位出的智能家电所在经纬度进行封装发送;
该数据分析平台进一步包括:结果展示模块和统计查询模块,其中,
所述数据分析模块,用于当所述特征标识为语音标识时,分别统计同一区域中同一种设备标识对应的用户语音命令词/语音激活词使用频次、语音播报频次、语音激活词成功/失败的次数、语音命令词识别成功/失败的次数以及同一地区同一种设备的台数;
所述结果展示模块,用于对所述用户语音命令词/语音激活词使用频次以及语音播报频次进行展示,并按照所述用户语音命令词/语音激活词使用频次,对每一个区域中每一种设备的用户语音命令/语音激活词进行热度排序并以可视化图表方式展示,按照所述用户语音命令词/语音激活词使用频次,对区域进行热度排序并以可视化图表方式展示;
所述统计查询模块,用于按照所述数据分析模块统计出的同一区域中同一种设备标识对应的用户语音命令词/语音激活词使用频次及同一地区同一种设备的台数,分别针对同一区域和同一种设备标识,统计语音识别功能/语音激活功能使用频次、语音识别功能/语音激活功能使用比例以及语音识别功能/语音激活功能使用区域;并分别为统计出的所述语音识别功能/语音激活功能使用频次、所述语音识别功能/语音激活功能使用比例以及所述语音识别功能/语音激活功能使用区域提供查询方式;按照所述数据分析模块统计出的语音播报频次,分别针对同一区域和同一种设备标识,统计语音播报功能使用频次、语音播报功能使用比例、语音播报词条以及语音播报功能使用区域;并分别为统计出的所述语音播报功能使用频次、所述语音播报功能使用比例、所述语音播报词条以及所述语音播报功能使用区域提供查询方式;按照所述数据分析模块统计出的语音激活词成功/失败的次数、语音命令词识别成功/失败的次数,分别针对同一区域和同一种设备标识,统计语音识别率、语音激活率以及语音使用词条,并分别为统计出的所述语音识别率、所述语音激活率以及所述语音使用词条提供查询方式;
所述通信模块,进一步用于接收所述智能家电中的数据采集装置发送的封装后的每一次执行成功的语音命令中包含的语音命令词、执行成功的语音命令的声波以及未执行成功的语音命令的声波;
所述方案优化模块,用于利用下述阈值计算公式组,调整每一个区域中每一种设备标识对应的语音命令词阈值/语音激活阈值;
阈值计算公式组计算公式:
Figure FDA0002844750440000031
其中,pg表征所述数据分析模块统计出的第g个标准语音激活词成功的次数/第g个标准语音命令词识别成功的次数;qg表征所述数据分析模块统计出的第g个标准语音激活词失败的次数/第g个标准语音命令词识别失败的次数;r表征标准语音激活词/标准语音命令词的总个数;A表征预设的不小于60%的成功率阈值;R表征预设的不大于30%的成功率阈值;YFc表征同一区域同一种设备标识对应的优化后的语音命令词阈值/语音激活阈值;K表征设备本身具有的语音命令词阈值/语音激活阈值;Tcgk表征针对同一区域同一种设备标识,所述通信模块接收到的第k次执行成功的语音命令中包含的语音命令词/语音激活词与对应的第g个标准语音命令词/标准激活词匹配字符数;Bcg表征针对同一区域同一种设备标识,第g个标准语音命令词/标准激活词的总个数;Dca表征预设的地域c中同一设备标识对应的第一地域系数;Scgu表征所述通信模块接收到的第u次未执行成功的语音命令的声波与预存的第g个标准语音命令词/标准语音激活词声波的匹配度;D’ca表征预设的地域c中同一设备标识对应的第二地域系数;Scgv表征所述通信模块接收到的第v次执行成功的语音命令的声波与预存的第g个标准语音命令词/语音激活词声波的匹配度。
2.根据权利要求1所述的数据分析平台,其特征在于,
所述通信模块,进一步用于接收所述智能家电中的数据采集装置发送的封装后所述特征标识对应的使用频率、所述特征标识对应的每一种运行参数的识别率,以及针对语音标识的语音命令词评测分数;
所述数据分析模块,进一步用于利用下述方式使用频率计算公式,统计每一个区域中同一种设备标识对应的每一种调控方式的使用频率;利用下述参数识别率计算公式,统计每一个区域中同一种设备标识对应的每一种运行参数的命令识别率;利用下述区域语音评测分数计算公式,计算每一个区域中同一种设备标识对应的语音命令词区域评测分数;
方式使用频率计算公式:
Figure FDA0002844750440000041
其中,所述Wct表征同一区域同一种设备标识对应的调控方式t的使用频率;ωcte表征同一区域同一种设备标识对应的第e台智能家电的调控方式t的使用频率;n表征同一区域同一种设备标识对应的智能家电的总台数;
参数识别率计算公式:
Figure FDA0002844750440000042
Figure FDA0002844750440000043
其中,所述βij表征特征标识i对应的命令类型j的识别率;yij表征特征标识i相关的运行参数中命令类型j在设定时间内执行成功的次数;zij表征特征标识i相关的运行参数中命令类型j在设定时间内执行总次数;μcij表征同一区域同一种设备的特征标识i对应的命令类型j的命令识别率;βcije表征同一区域同一种设备中第e台设备的特征标识i对应的命令类型j的识别率;n表征同一区域同一种设备标识对应的智能家电的总台数;
语音命令词区域评测分数:
Figure FDA0002844750440000051
其中,Qcg表征同一区域同一种设备中与标准语音命令词g相关的语音命令词区域评测分数;Fcge表征同一区域同一种设备中第e台设备与标准语音命令词g相关的评测分数;n表征同一区域同一种设备标识对应的智能家电的总台数。
3.根据权利要求1所述的数据分析平台,其特征在于,所述数据采集装置进一步包括:统计单元,其中,
所述统计单元,用于根据所述运行参数,统计所述采集提取单元采集的所述特征标识对应的使用频率、所述采集提取单元提取出的每一种运行参数的识别率,并针对语音标识,统计所述采集提取单元提取出的语音命令词评测分数;
所述通信单元,进一步用于将所述统计单元统计出的每一种所述特征标识对应的使用频率、所述运行参数对应的命令识别率以及语音命令词评测分数进行封装发送。
4.根据权利要求3所述的数据分析平台,其特征在于,
所述统计单元,用于根据下述频率计算公式,计算所述统计单元统计出的每一种所述特征标识对应的使用频率;
频率计算公式:
Figure FDA0002844750440000052
其中,ωi表征特征标识i对应的使用频率;fi表征预先为特征标识i分配的权重;xij表征特征标识i相关的运行参数中命令类型j在设定时间内出现的频次;n表征特征标识i相关的运行参数包含的命令类型种类;m表征自定义单元定义的特征标识的个数;
和/或,
所述统计单元,用于利用下述识别率计算公式,计算所述采集提取单元提取出的所述运行参数对应的命令识别率;
识别率计算公式:
Figure FDA0002844750440000061
其中,所述βij表征特征标识i对应的命令类型j的识别率;yij表征特征标识i相关的运行参数中命令类型j在设定时间内执行成功的次数;zij表征特征标识i相关的运行参数中命令类型j在设定时间内执行总次数;
和/或,
所述统计单元,用于当所述特征标识包含语音标识时,利用下述评测分数计算公式,计算所述采集提取单元提取出的语音命令词评测分数;
评测分数计算公式:
Figure FDA0002844750440000062
其中,Fg表征与标准语音命令词g相关的评测分数;Tgk表征外部输入的第k次执行成功的语音命令中包含的语音命令词与标准语音命令词g匹配字符数;Bg表征标准语音命令词g的总个数;p表征执行成功的总次数;Da表征预设的地域系数;Sgu表征外部输入的与标准语音命令词g的第u次未执行成功的语音命令的声波与预存的标准语音命令词g声波的匹配度;q表征未执行成功的总次数。
5.一种数据分析系统,其特征在于,包括:具有数据采集装置的智能家电和权利要求1至4中任一所述的数据分析平台,其中,
所述智能家电与所述数据分析平台通过http post网络进行协议通信。
6.一种基于权利要求1至4中任一所述数据分析平台的数据分析方法,其特征在于,该数据分析平台与至少两个具有数据采集装置的智能家电连接;预先按照经纬度划分出各个区域,还包括:
接收所述智能家电中的数据采集装置发送的封装后的设备标识、特征标识及对应的运行参数以及智能家电所在经纬度,其中,所述特征标识包括:运行日志中语音标识、遥控标识以及客户端标识中的任意一种或多种;
按照所述智能家电所在经纬度,确定出所述智能家电所属区域;
针对同一区域、同一种设备标识以及同一种特征标识对应的运行参数进行分析和统计;
利用所述分析和统计的结果,针对同一区域、同一种设备标识,对每一种特征标识的运行模式进行优化,并输出优化结果;
进一步包括:接收所述智能家电中的数据采集装置发送的封装后的每一次执行成功的语音命令中包含的语音命令词、执行成功的语音命令的声波以及未执行成功的语音命令的声波;
所述针对同一区域、同一种设备标识以及同一种特征标识对应的运行参数进行分析和统计,包括:当所述特征标识为语音标识时,分别统计语音激活词成功/失败的次数、语音命令词识别成功/失败的次数以及同一地区同一种设备的台数;
所述利用所述分析和统计的结果,针对同一区域、同一种设备标识,对每一种特征标识的运行模式进行优化,包括:
利用下述阈值计算公式组,调整每一个区域中每一种设备标识对应的语音命令词阈值/语音激活阈值;
阈值计算公式组计算公式:
Figure FDA0002844750440000081
其中,pg表征第g个标准语音激活词成功的次数/第g个标准语音命令词识别成功的次数;qg表征第g个标准语音激活词失败的次数/第g个标准语音命令词识别失败的次数;r表征标准语音激活词/标准语音命令词的总个数;A表征预设的不小于60%的成功率阈值;R表征预设的不大于30%的成功率阈值;YFc表征同一区域同一种设备标识对应的优化后的语音命令词阈值/语音激活阈值;K表征设备本身具有的语音命令词阈值/语音激活阈值;Tcgk表征针对同一区域同一种设备标识,所述通信模块接收到的第k次执行成功的语音命令中包含的语音命令词/语音激活词与对应的第g个标准语音命令词/标准激活词匹配字符数;Bcg表征针对同一区域同一种设备标识,第g个标准语音命令词/标准激活词的总个数;Dca表征预设的地域c中同一设备标识对应的第一地域系数;Scgu表征所述通信模块接收到的第u次未执行成功的语音命令的声波与预存的第g个标准语音命令词/标准语音激活词声波的匹配度;D’ca表征预设的地域c中同一设备标识对应的第二地域系数;Scgv表征所述通信模块接收到的第v次执行成功的语音命令的声波与预存的第g个标准语音命令词/语音激活词声波的匹配度。
CN201810762793.9A 2018-07-12 2018-07-12 一种数据采集装置、数据分析平台、系统及方法 Active CN108877774B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810762793.9A CN108877774B (zh) 2018-07-12 2018-07-12 一种数据采集装置、数据分析平台、系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810762793.9A CN108877774B (zh) 2018-07-12 2018-07-12 一种数据采集装置、数据分析平台、系统及方法

Publications (2)

Publication Number Publication Date
CN108877774A CN108877774A (zh) 2018-11-23
CN108877774B true CN108877774B (zh) 2021-02-09

Family

ID=64301220

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810762793.9A Active CN108877774B (zh) 2018-07-12 2018-07-12 一种数据采集装置、数据分析平台、系统及方法

Country Status (1)

Country Link
CN (1) CN108877774B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109887507B (zh) * 2019-04-22 2021-03-12 成都启英泰伦科技有限公司 一种降低相似语音命令词误识别率的方法
CN113434612B (zh) * 2021-07-09 2024-01-26 青岛海尔科技有限公司 数据统计方法及装置、存储介质及电子装置
CN116109121B (zh) * 2023-04-17 2023-06-30 西昌学院 基于大数据分析的用户需求挖掘方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100631786B1 (ko) * 2005-02-18 2006-10-12 삼성전자주식회사 프레임의 신뢰도를 측정하여 음성을 인식하는 방법 및 장치
US8677409B2 (en) * 2007-01-05 2014-03-18 At&T Intellectual Property I, L.P Methods, systems, and computer program products for categorizing/rating content uploaded to a network for broadcasting
CN107665710B (zh) * 2016-07-27 2021-02-09 上海博泰悦臻网络技术服务有限公司 移动终端语音数据处理方法及装置
CN107919121B (zh) * 2017-11-24 2021-06-01 江西科技师范大学 智能家居设备的控制方法、装置、存储介质及计算机设备
CN108183844B (zh) * 2018-02-06 2020-09-08 四川虹美智能科技有限公司 一种智能家电语音控制方法、装置及系统

Also Published As

Publication number Publication date
CN108877774A (zh) 2018-11-23

Similar Documents

Publication Publication Date Title
CN108877774B (zh) 一种数据采集装置、数据分析平台、系统及方法
US20200374306A1 (en) Network traffic anomaly detection method, apparatus, computer device and storage medium
WO2019141028A1 (zh) 电器设备的控制方法、装置和系统
US20180342241A1 (en) Method and Apparatus of Recognizing Field of Semantic Parsing Information, Device and Readable Medium
US9928831B2 (en) Speech data recognition method, apparatus, and server for distinguishing regional accent
CN109241418A (zh) 基于随机森林的异常用户识别方法及装置、设备、介质
CN111128156A (zh) 基于模型训练的智能家居设备语音控制方法及装置
CN104007994A (zh) 一种基于策略库交互的更新方法、升级方法与升级系统
CN106601257A (zh) 一种声音识别方法、设备和第一电子设备
CN113436611B (zh) 车载语音设备的测试方法、装置、电子设备和存储介质
CN108932947B (zh) 语音控制方法及家电设备
CN111061837A (zh) 话题识别方法、装置、设备及介质
CN113990324A (zh) 一种语音智能家居控制系统
CN110059171B (zh) 智能问答性能提升方法及系统
CN110866094A (zh) 指令识别方法、装置、存储介质、电子装置
CN113297249A (zh) 慢查询语句的识别和分析、查询语句的统计方法及装置
CN112418735A (zh) 一种基于图计算的电网ai调度系统及方法
CN102682290A (zh) 分别式生物特征识别方法和系统
CN109145124B (zh) 信息的存储方法、装置、存储介质及电子装置
CN110970019A (zh) 智能家居系统的控制方法和装置
CN115426363A (zh) 智能板材加工工厂的数据采集方法及终端
CN114861678A (zh) 时间信息的确定方法和装置、存储介质及电子装置
CN112002083B (zh) 一种应用于银行自助设备的业务阻塞预警系统
CN109634649B (zh) 页面流程实验方法、系统、设备及可读存储介质
CN113935309A (zh) 一种基于语义平台的技能优化处理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant