具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面,先介绍本申请的实施方式,之后将用实验数据证实本申请的方案与现有技术相比有什么不同,能实现什么有益效果。
请参考图1,其示出了本发明的用于智能语音对话开发平台的数据统计方法一实施例的流程图,本实施例的用于智能语音对话开发平台的数据统计方法可以适用于开发平台的数据统计系统。其中,智能语音对话开发平台主要是为开发者提供便捷的智能语音对话开发环境和语音识别引擎,使开发者可以更简单地开发自己的智能语音对话产品。开发者开发的过程中可以利用平台已有的资源或者其他开发者开发的产品。
如图1所示,在步骤101中,响应于开发者产品在用户终端上的使用和在开发平台网页上被访问,采集与开发者产品相关的日志数据;
在步骤102中,分别统计开发者所有产品的日志数据中的第一数据,以及所有产品中的任一产品的日志数据中的第二数据,第一数据和第二数据中均至少包括行为数据和语音数据;
在步骤103中,响应于开发者的统计数据获取请求,将第一数据和第二数据以图表的形式展示给开发者。
在本实施例中,对于步骤101,数据统计系统可以通过用户终端和开发平台网页同时采集开发者产品被使用和被访问的日志数据。当开发者开发的产品被用于用户终端,例如早教机,智能语音对话软件(例如聊天机器人)、智能音箱等,开发平台就能通过用户终端收集用户操作产生的日志数据;当其他开发者或用户通过开发平台网页访问开发者开发的产品时,开发平台也能通过网页收集访问的日志数据。之后,对于步骤102,数据统计系统分别统计开发者的所有产品的日志数据中的第一数据,例如终端和请求数据(可以包括所有产品的终端用户数、请求次数、变化趋势以及Top10排名)和控制台基础数据(可以包括所有产品的创建、发布、被请求的个数及变化趋势)等,本申请在此方面没有限制。数据统计系统还统计所有产品中的任一产品的日志数据中的第二数据,可以包括各产品的终端用户数、请求次数及变化趋势等,本申请在此方面没有限制。之后,对于步骤103,数据统计系统响应于开发者的统计数据获取请求,例如开发者点击产品数据时,以图表的形式展示终端和请求数据、控制台基础数据以及各产品的详细产品数据。
进一步参考图2,其示出了本发明的用于智能语音对话开发平台的数据统计方法另一实施例的流程图,本实施例的用于智能语音对话开发平台的数据统计方法可以适用于开发平台的数据统计系统。本实施例的流程图主要是对图1的流程进一步扩展的流程。
如图2所示,在步骤201中,从日志数据中筛选出异常日志,并从异常日志中获取导致异常的语音对应的识别文本;
在步骤202中,基于识别文本分析异常日志的错误原因。
在本实施例中,对于步骤201,统计系统从所有的日志数据中筛选出异常日志,并从异常日志中再获取导致异常发生的语音对应的识别文本。之后,对于步骤202,基于识别文本分析异常日志的错误原因,例如,错误原因可以是收到退出指令、语义解析没有结果或者是识别结果为空等,本申请在此没有限制。从而可以通过日志统计帮开发者找出异常日志,并简单的分析错误原因供开发者参考。
在一些可选的实施例中,上述方法还可以包括:响应于开发者的异常日志获取请求,以表格形式向所述开发者展示异常日志的多项数据,所述多项数据中至少包括所述识别文本和所述错误原因。从而当开发者点击异常日志时,可以展示各异常日志和系统大致分析的导致异常的识别文本和错误原因,公开发者调试改进时参考。
在另一些可选的实施例中,上述方法还包括:响应于所述开发者点开任一所述异常日志,向所述开发者提供将所述异常日志提交至所述开发平台处理的按键。从而当开发者对无法独立解决异常日志所存在的问题时,可以求助,然后可以在平台的协助下更好地解决问题。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作合并,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
请参考图3,其示出了智能语音对话平台为开发者提供的多种数据服务的框图。
其中,数据平台可以为开发者提供总览数据和专项数据。总览数据可以包括实时数据、基础数据、周趋势数据和月趋势数据。专项数据包括开发者数据、产品数据和技能数据。进一步地,开发者数据可以包括网站基础数据、活跃度排名、用户活跃时段和用户地域分布;产品数据可以包括活跃用户数、产品请求数、产品活跃时段、产品对话数据和活跃产品排名;技能数据可以包括活跃用户数、技能命中数、技能分类数据以及活跃技能排名。
本发明的方案为DUI(Dialog User Interface,对话用户界面)平台的开发者提供多种形式的数据服务,包括数据周报、平台数据统计、日志信息搜索等。现在市面上提供数据服务的平台有友盟、百度统计、腾讯大数据等,而提供语音相关数据服务的平台有讯飞、如意、alexa等。其中提供数据服务的平台只针对网站或移动端的数据进行全方位多维度的分析,而提供语音相关数据服务的平台只提供与语音数据相关的统计和分析,目前并没有将二者结合的语音行业级数据服务平台。
数据服务主要以数据平台为载体进行数据的呈现,数据平台分为总览数据和专项数据两部分。总览数据包含实时数据、基本的日活日请求数据,以及周和月的趋势对比数据。专项数据分为三部分,开发者数据、产品数据和技能数据。开发者数据包含了PV(PageView,浏览量)、UV(Unique Visitor,访客数)、VV(Video View,播放数)、访问时长等网站基础数据、开发者的活跃度排名、用户活跃的时段以及用户地域分布等;产品数据包含活跃用户数、产品请求数、产品的活跃时段分布、终端对话时长和轮数数据以及活跃产品的排名;技能数据包含活跃用户数、技能命中数/率、技能分类使用数据以及活跃技能的排名数据。
请参考图4a、图4b和图4c,其示出了数据统计系统的一个具体实施例的界面图。
其中,产品数据界面可以包括终端和请求数据(参考图4a,用于展示所有产品的终端用户数、请求次数、变化趋势以及Top10排名)、控制台基础数据(参考图4b,用于展示所有产品的创建、发布、被请求的个数及变化趋势)以及详细产品数据(参考图4c,用于展示各产品的终端用户数、请求次数及变化趋势)。参考图4a,其示出了终端和请求数据的部分界面图,图4a的左侧示出了“累计终端用户数”和相应的“日活跃度”、以及“累计请求次数”和相应的“日活跃度”,图4a的右侧示出了“活跃用户数”和“请求次数”的变化趋势折线图的一部分。参考图4b,其示出了控制台基础数据的部分界面图,图4b的左侧示出了“创建总数”和相应的“日活跃度”、“发布总数”和相应的“日活跃度”、以及“活跃总数”和相应的“日活跃度”,图4b的右侧示出了“创建数”、“发布数”和“活跃数”的变化趋势折线图的一部分。参考图4c,其示出了详细产品数据的部分界面图,图4c的上部示出了“产品名称”、“累计终端用户数”和相应的“日活跃度”、以及“累计请求次数”和相应的“日活跃度”,图4c的下部示出了“活跃用户数”和“请求次数”的变化趋势折线图。以上示出的是“产品数据界面”,“技能数据界面”与之相似,在此不再赘述。
进一步参考图5a、图5b、图5c和图5d,其示出了数据统计系统的又一个具体实施例的界面图。
其中,图5a示出了异常日志界面可以包括用于检索异常日志的条件以及检索后得出的异常日志表格。其中,该异常日志表格中可以展示以下参数:等级、产品、产品版本、技能、技能版本、识别文本、时间、错误原因、日志Json和详情。其中,“日志Json”处为开发者提供对应的异常日志的下载路径,开发者点击“详情”处的“查看”可以查看具体的异常日志的详情,该处可以提供比异常日志表格中所展示的更多更详细的信息,图5b示出了日志详情界面的部分界面。并且,当开发者点击“查看”跳转到“日志详情”界面后,该界面上可以包括“提交工单”按钮,从而开发者可以点击该按钮获取来自平台的帮助,从而可以在平台的帮助下更好地解决出现的问题。当开发者提交工单后,可以与平台的服务人员进行沟通以更好的解决问题,其中,图5c示出了开发者反馈的问题列表,点击“查看”可以跳转到图5d展示的界面,图5d示出了问题详情的部分界面,右侧的“跟踪状态”展示了问题的处理进度。
综上,通过对数据进行多维度的分析以及良好的可视化效果,可以更全面更直观地掌握分析的结果和数据的价值。平台提供了基础的网站数据以及行业级的语音数据服务,比如通过留存率,可以了解用户对网站的粘性;通过技能命中率,可以了解目前的技能配置是否有优化的空间。这些都是从直观的分析到深层次产品优化的延伸。
此外,数据平台每个模块的数据都提供了多维度的筛选条件,包含日期、公司、团队、技能四个方面,可以多维度掌握数据,提供更全面的语音数据服务。
请参考图6,其示出了本发明一实施例提供的用于智能语音对话开发平台的数据统计系统的框图。
如图6所示,本发明的用于智能语音对话开发平台的数据统计系统600,包括采集单元610、压缩模块620和微调模块630。
其中,采集单元610,配置为响应于开发者产品在用户终端上的使用和在开发平台网页上被访问,采集与所述开发者产品相关的日志数据;统计单元620,配置为分别统计开发者所有产品的日志数据中的第一数据,以及所述所有产品中的任一产品的日志数据中的第二数据,所述第一数据和所述第二数据中均至少包括行为数据和语音数据;以及展示单元630,配置为响应于开发者的统计数据获取请求,将所述第一参数和所述第二参数以图表的形式展示给所述开发者。
在一些可选的实施例中,用于智能语音对话开发平台的数据统计系统600还包括筛选单元(图中未示出)和分析单元(图中未示出)。其中,筛选单元,配置为从所述日志数据中筛选出异常日志,并从所述异常日志中获取导致异常的语音对应的识别文本;以及分析单元,配置为基于所述识别文本分析所述异常日志的错误原因。
在一些可选的实施例中,用于智能语音对话开发平台的数据统计系统600还包括异常日志单元(图中未示出),配置为响应于开发者的异常日志获取请求,以表格形式向所述开发者展示异常日志的多项数据,所述多项数据中至少包括所述识别文本和所述错误原因。
在一些可选的实施例中,用于智能语音对话开发平台的数据统计系统600还包括提交处理单元(图中未示出),配置为响应于所述开发者点开任一所述异常日志,向所述开发者提供将所述异常日志提交至所述开发平台处理的按键。
应当理解,图6中记载的诸模块与参考图1和图2中描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征以及相应的技术效果同样适用于图6中的诸模块,在此不再赘述。
值得注意的是,本公开的实施例中的模块并不用于限制本公开的方案,例如采集单元可以描述为响应于开发者产品在用户终端上的使用和在开发平台网页上被访问,采集与所述开发者产品相关的日志数据的单元。另外,还可以通过硬件处理器来实现相关功能模块,例如采集单元也可以用处理器实现,在此不再赘述。
在另一些实施例中,本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的用于智能语音对话开发平台的数据统计方法;
作为一种实施方式,本发明的非易失性计算机存储介质存储有计算机可执行指令,计算机可执行指令设置为:
响应于开发者产品在用户终端上的使用和在开发平台网页上被访问,采集与所述开发者产品相关的日志数据;
分别统计开发者所有产品的日志数据中的第一数据,以及所述所有产品中的任一产品的日志数据中的第二数据,所述第一数据和所述第二数据中均至少包括行为数据和语音数据;
响应于开发者的统计数据获取请求,将所述第一参数和所述第二参数以图表的形式展示给所述开发者。
作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的用于智能语音对话开发平台的数据统计方法对应的程序指令/模块。一个或者多个程序指令存储在非易失性计算机可读存储介质中,当被处理器执行时,执行上述任意方法实施例中的用于智能语音对话开发平台的数据统计方法。
非易失性计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据用于智能语音对话开发平台的数据统计装置的使用所创建的数据等。此外,非易失性计算机可读存储介质可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至用于智能语音对话开发平台的数据统计装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明实施例还提供一种计算机程序产品,计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,使计算机执行上述任一项用于智能语音对话开发平台的数据统计方法。
图7是本发明实施例提供的电子设备的结构示意图,如图7所示,该设备包括:一个或多个处理器710以及存储器720,图7中以一个处理器710为例。用于智能语音对话开发平台的数据统计方法的设备还可以包括:输入装置730和输出装置740。处理器710、存储器720、输入装置730和输出装置740可以通过总线或者其他方式连接,图7中以通过总线连接为例。存储器720为上述的非易失性计算机可读存储介质。处理器710通过运行存储在存储器720中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例用于智能语音对话开发平台的数据统计方法。输入装置730可接收输入的数字或字符信息,以及产生与信息投放装置的用户设置以及功能控制有关的键信号输入。输出装置740可包括显示屏等显示设备。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
作为一种实施方式,上述电子设备应用于神经网络语言模型中,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:
响应于开发者产品在用户终端上的使用和在开发平台网页上被访问,采集与所述开发者产品相关的日志数据;
分别统计开发者所有产品的日志数据中的第一数据,以及所述所有产品中的任一产品的日志数据中的第二数据,所述第一数据和所述第二数据中均至少包括行为数据和语音数据;
响应于开发者的统计数据获取请求,将所述第一参数和所述第二参数以图表的形式展示给所述开发者。
本申请实施例的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。