CN108446370A - 语音数据统计方法和系统 - Google Patents

语音数据统计方法和系统 Download PDF

Info

Publication number
CN108446370A
CN108446370A CN201810213378.8A CN201810213378A CN108446370A CN 108446370 A CN108446370 A CN 108446370A CN 201810213378 A CN201810213378 A CN 201810213378A CN 108446370 A CN108446370 A CN 108446370A
Authority
CN
China
Prior art keywords
data
developer
product
abnormal log
daily record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810213378.8A
Other languages
English (en)
Other versions
CN108446370B (zh
Inventor
徐香君
肖通
陆峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sipic Technology Co Ltd
Original Assignee
AI Speech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AI Speech Ltd filed Critical AI Speech Ltd
Priority to CN201810213378.8A priority Critical patent/CN108446370B/zh
Publication of CN108446370A publication Critical patent/CN108446370A/zh
Application granted granted Critical
Publication of CN108446370B publication Critical patent/CN108446370B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开用于智能语音对话开发平台的数据统计方法和系统,方法包括:响应于开发者产品在用户终端上的使用和在开发平台网页上被访问,采集与开发者产品相关的日志数据;分别统计开发者所有产品的日志数据中的第一数据,以及所有产品中的任一产品的日志数据中的第二数据,第一数据和第二数据中均至少包括行为数据和语音数据;响应于开发者的统计数据获取请求,将第一参数和第二参数以图表的形式展示给开发者。本发明提出了一种结合了成熟的网站数据分析和具有自身特点的语音数据分析方法及系统,既能查看常见的网站数据分析指标,又能掌握目前语音相关指标的情况。

Description

语音数据统计方法和系统
技术领域
本发明属于数据统计技术领域,尤其涉及用于智能语音对话开发平台的语音数据统计方法和系统。
背景技术
现有技术中,互联网以及移动互联网时代已领跑多年,相关的数据服务比较完备,而AI(Artificial Intelligence,人工智能)行业兴起时间不长,业内还没有构建出完善的数据服务体系。
相关技术中,一类为专注于数据统计平台,均为第三方全域数据服务商,可覆盖PC、手机、传感器、无线路由器等多种设备数据,打造全域数据平台。针对网站或移动端的数据进行全方位多维度的分析,不外乎流量、来源、转化、访客和事件、用户行为、版本渠道等方面的分析;而另一类则为专注于语音技术的网站,其提供的数据服务必然是与语音数据相关的,包括语音请求次数、活跃用户数、意图命中数等。
发明人在实现本发明的过程中发现,上述相关技术中,一类是只专注于全网站的事件或行为分析,一类是只专注于自身的语音设备数据收集分析,目前没有发现将二者结合的语音行业级数据服务平台。
发明内容
本发明实施例提供一种用于智能语音对话开发平台的数据统计方法、系统及电子设备,用于至少解决上述技术问题之一。
第一方面,本发明实施例提供一种用于智能语音对话开发平台的数据统计方法,包括:响应于开发者产品在用户终端上的使用和在开发平台网页上被访问,采集与所述开发者产品相关的日志数据;分别统计开发者所有产品的日志数据中的第一数据,以及所述所有产品中的任一产品的日志数据中的第二数据,所述第一数据和所述第二数据中均至少包括行为数据和语音数据;以及响应于开发者的统计数据获取请求,将所述第一参数和所述第二参数以图表的形式展示给所述开发者。
第二方面,本发明实施例提供一种用于智能语音对话开发平台的数据统计系统,包括:采集单元,配置为响应于开发者产品在用户终端上的使用和在开发平台网页上被访问,采集与所述开发者产品相关的日志数据;统计单元,配置为分别统计开发者所有产品的日志数据中的第一数据,以及所述所有产品中的任一产品的日志数据中的第二数据,所述第一数据和所述第二数据中均至少包括行为数据和语音数据;以及展示单元,配置为响应于开发者的统计数据获取请求,将所述第一参数和所述第二参数以图表的形式展示给所述开发者。
第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的用于智能语音对话开发平台的数据统计方法的步骤。
第四方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行本发明任一实施例的用于智能语音对话开发平台的数据统计方法的步骤。
本发明的方法和系统所提出的方案是基于语音的网站数据服务,结合了成熟的网站数据分析和具有自身特点的语音数据分析。既能查看常见的网站数据分析指标,又能掌握目前语音相关指标的情况。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种用于智能语音对话开发平台的数据统计方法的流程图;
图2为本发明一实施例提供的另一种用于智能语音对话开发平台的数据统计方法的流程图;
图3为本发明一实施例提供的智能语音对话平台为开发者提供的多种数据服务的框图;
图4a、图4b和图4c为本发明一实施例提供的一种用于智能语音对话开发平台的数据统计方法的展示界面的一个具体示例;
图5a、图5b、图5c和图5d为本发明一实施例提供的一种用于智能语音对话开发平台的数据统计方法的展示界面的又一个具体示例;
图6为本发明一实施例提供的一种用于智能语音对话开发平台的数据统计系统的框图;
图7是本发明一实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面,先介绍本申请的实施方式,之后将用实验数据证实本申请的方案与现有技术相比有什么不同,能实现什么有益效果。
请参考图1,其示出了本发明的用于智能语音对话开发平台的数据统计方法一实施例的流程图,本实施例的用于智能语音对话开发平台的数据统计方法可以适用于开发平台的数据统计系统。其中,智能语音对话开发平台主要是为开发者提供便捷的智能语音对话开发环境和语音识别引擎,使开发者可以更简单地开发自己的智能语音对话产品。开发者开发的过程中可以利用平台已有的资源或者其他开发者开发的产品。
如图1所示,在步骤101中,响应于开发者产品在用户终端上的使用和在开发平台网页上被访问,采集与开发者产品相关的日志数据;
在步骤102中,分别统计开发者所有产品的日志数据中的第一数据,以及所有产品中的任一产品的日志数据中的第二数据,第一数据和第二数据中均至少包括行为数据和语音数据;
在步骤103中,响应于开发者的统计数据获取请求,将第一数据和第二数据以图表的形式展示给开发者。
在本实施例中,对于步骤101,数据统计系统可以通过用户终端和开发平台网页同时采集开发者产品被使用和被访问的日志数据。当开发者开发的产品被用于用户终端,例如早教机,智能语音对话软件(例如聊天机器人)、智能音箱等,开发平台就能通过用户终端收集用户操作产生的日志数据;当其他开发者或用户通过开发平台网页访问开发者开发的产品时,开发平台也能通过网页收集访问的日志数据。之后,对于步骤102,数据统计系统分别统计开发者的所有产品的日志数据中的第一数据,例如终端和请求数据(可以包括所有产品的终端用户数、请求次数、变化趋势以及Top10排名)和控制台基础数据(可以包括所有产品的创建、发布、被请求的个数及变化趋势)等,本申请在此方面没有限制。数据统计系统还统计所有产品中的任一产品的日志数据中的第二数据,可以包括各产品的终端用户数、请求次数及变化趋势等,本申请在此方面没有限制。之后,对于步骤103,数据统计系统响应于开发者的统计数据获取请求,例如开发者点击产品数据时,以图表的形式展示终端和请求数据、控制台基础数据以及各产品的详细产品数据。
进一步参考图2,其示出了本发明的用于智能语音对话开发平台的数据统计方法另一实施例的流程图,本实施例的用于智能语音对话开发平台的数据统计方法可以适用于开发平台的数据统计系统。本实施例的流程图主要是对图1的流程进一步扩展的流程。
如图2所示,在步骤201中,从日志数据中筛选出异常日志,并从异常日志中获取导致异常的语音对应的识别文本;
在步骤202中,基于识别文本分析异常日志的错误原因。
在本实施例中,对于步骤201,统计系统从所有的日志数据中筛选出异常日志,并从异常日志中再获取导致异常发生的语音对应的识别文本。之后,对于步骤202,基于识别文本分析异常日志的错误原因,例如,错误原因可以是收到退出指令、语义解析没有结果或者是识别结果为空等,本申请在此没有限制。从而可以通过日志统计帮开发者找出异常日志,并简单的分析错误原因供开发者参考。
在一些可选的实施例中,上述方法还可以包括:响应于开发者的异常日志获取请求,以表格形式向所述开发者展示异常日志的多项数据,所述多项数据中至少包括所述识别文本和所述错误原因。从而当开发者点击异常日志时,可以展示各异常日志和系统大致分析的导致异常的识别文本和错误原因,公开发者调试改进时参考。
在另一些可选的实施例中,上述方法还包括:响应于所述开发者点开任一所述异常日志,向所述开发者提供将所述异常日志提交至所述开发平台处理的按键。从而当开发者对无法独立解决异常日志所存在的问题时,可以求助,然后可以在平台的协助下更好地解决问题。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作合并,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
请参考图3,其示出了智能语音对话平台为开发者提供的多种数据服务的框图。
其中,数据平台可以为开发者提供总览数据和专项数据。总览数据可以包括实时数据、基础数据、周趋势数据和月趋势数据。专项数据包括开发者数据、产品数据和技能数据。进一步地,开发者数据可以包括网站基础数据、活跃度排名、用户活跃时段和用户地域分布;产品数据可以包括活跃用户数、产品请求数、产品活跃时段、产品对话数据和活跃产品排名;技能数据可以包括活跃用户数、技能命中数、技能分类数据以及活跃技能排名。
本发明的方案为DUI(Dialog User Interface,对话用户界面)平台的开发者提供多种形式的数据服务,包括数据周报、平台数据统计、日志信息搜索等。现在市面上提供数据服务的平台有友盟、百度统计、腾讯大数据等,而提供语音相关数据服务的平台有讯飞、如意、alexa等。其中提供数据服务的平台只针对网站或移动端的数据进行全方位多维度的分析,而提供语音相关数据服务的平台只提供与语音数据相关的统计和分析,目前并没有将二者结合的语音行业级数据服务平台。
数据服务主要以数据平台为载体进行数据的呈现,数据平台分为总览数据和专项数据两部分。总览数据包含实时数据、基本的日活日请求数据,以及周和月的趋势对比数据。专项数据分为三部分,开发者数据、产品数据和技能数据。开发者数据包含了PV(PageView,浏览量)、UV(Unique Visitor,访客数)、VV(Video View,播放数)、访问时长等网站基础数据、开发者的活跃度排名、用户活跃的时段以及用户地域分布等;产品数据包含活跃用户数、产品请求数、产品的活跃时段分布、终端对话时长和轮数数据以及活跃产品的排名;技能数据包含活跃用户数、技能命中数/率、技能分类使用数据以及活跃技能的排名数据。
请参考图4a、图4b和图4c,其示出了数据统计系统的一个具体实施例的界面图。
其中,产品数据界面可以包括终端和请求数据(参考图4a,用于展示所有产品的终端用户数、请求次数、变化趋势以及Top10排名)、控制台基础数据(参考图4b,用于展示所有产品的创建、发布、被请求的个数及变化趋势)以及详细产品数据(参考图4c,用于展示各产品的终端用户数、请求次数及变化趋势)。参考图4a,其示出了终端和请求数据的部分界面图,图4a的左侧示出了“累计终端用户数”和相应的“日活跃度”、以及“累计请求次数”和相应的“日活跃度”,图4a的右侧示出了“活跃用户数”和“请求次数”的变化趋势折线图的一部分。参考图4b,其示出了控制台基础数据的部分界面图,图4b的左侧示出了“创建总数”和相应的“日活跃度”、“发布总数”和相应的“日活跃度”、以及“活跃总数”和相应的“日活跃度”,图4b的右侧示出了“创建数”、“发布数”和“活跃数”的变化趋势折线图的一部分。参考图4c,其示出了详细产品数据的部分界面图,图4c的上部示出了“产品名称”、“累计终端用户数”和相应的“日活跃度”、以及“累计请求次数”和相应的“日活跃度”,图4c的下部示出了“活跃用户数”和“请求次数”的变化趋势折线图。以上示出的是“产品数据界面”,“技能数据界面”与之相似,在此不再赘述。
进一步参考图5a、图5b、图5c和图5d,其示出了数据统计系统的又一个具体实施例的界面图。
其中,图5a示出了异常日志界面可以包括用于检索异常日志的条件以及检索后得出的异常日志表格。其中,该异常日志表格中可以展示以下参数:等级、产品、产品版本、技能、技能版本、识别文本、时间、错误原因、日志Json和详情。其中,“日志Json”处为开发者提供对应的异常日志的下载路径,开发者点击“详情”处的“查看”可以查看具体的异常日志的详情,该处可以提供比异常日志表格中所展示的更多更详细的信息,图5b示出了日志详情界面的部分界面。并且,当开发者点击“查看”跳转到“日志详情”界面后,该界面上可以包括“提交工单”按钮,从而开发者可以点击该按钮获取来自平台的帮助,从而可以在平台的帮助下更好地解决出现的问题。当开发者提交工单后,可以与平台的服务人员进行沟通以更好的解决问题,其中,图5c示出了开发者反馈的问题列表,点击“查看”可以跳转到图5d展示的界面,图5d示出了问题详情的部分界面,右侧的“跟踪状态”展示了问题的处理进度。
综上,通过对数据进行多维度的分析以及良好的可视化效果,可以更全面更直观地掌握分析的结果和数据的价值。平台提供了基础的网站数据以及行业级的语音数据服务,比如通过留存率,可以了解用户对网站的粘性;通过技能命中率,可以了解目前的技能配置是否有优化的空间。这些都是从直观的分析到深层次产品优化的延伸。
此外,数据平台每个模块的数据都提供了多维度的筛选条件,包含日期、公司、团队、技能四个方面,可以多维度掌握数据,提供更全面的语音数据服务。
请参考图6,其示出了本发明一实施例提供的用于智能语音对话开发平台的数据统计系统的框图。
如图6所示,本发明的用于智能语音对话开发平台的数据统计系统600,包括采集单元610、压缩模块620和微调模块630。
其中,采集单元610,配置为响应于开发者产品在用户终端上的使用和在开发平台网页上被访问,采集与所述开发者产品相关的日志数据;统计单元620,配置为分别统计开发者所有产品的日志数据中的第一数据,以及所述所有产品中的任一产品的日志数据中的第二数据,所述第一数据和所述第二数据中均至少包括行为数据和语音数据;以及展示单元630,配置为响应于开发者的统计数据获取请求,将所述第一参数和所述第二参数以图表的形式展示给所述开发者。
在一些可选的实施例中,用于智能语音对话开发平台的数据统计系统600还包括筛选单元(图中未示出)和分析单元(图中未示出)。其中,筛选单元,配置为从所述日志数据中筛选出异常日志,并从所述异常日志中获取导致异常的语音对应的识别文本;以及分析单元,配置为基于所述识别文本分析所述异常日志的错误原因。
在一些可选的实施例中,用于智能语音对话开发平台的数据统计系统600还包括异常日志单元(图中未示出),配置为响应于开发者的异常日志获取请求,以表格形式向所述开发者展示异常日志的多项数据,所述多项数据中至少包括所述识别文本和所述错误原因。
在一些可选的实施例中,用于智能语音对话开发平台的数据统计系统600还包括提交处理单元(图中未示出),配置为响应于所述开发者点开任一所述异常日志,向所述开发者提供将所述异常日志提交至所述开发平台处理的按键。
应当理解,图6中记载的诸模块与参考图1和图2中描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征以及相应的技术效果同样适用于图6中的诸模块,在此不再赘述。
值得注意的是,本公开的实施例中的模块并不用于限制本公开的方案,例如采集单元可以描述为响应于开发者产品在用户终端上的使用和在开发平台网页上被访问,采集与所述开发者产品相关的日志数据的单元。另外,还可以通过硬件处理器来实现相关功能模块,例如采集单元也可以用处理器实现,在此不再赘述。
在另一些实施例中,本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的用于智能语音对话开发平台的数据统计方法;
作为一种实施方式,本发明的非易失性计算机存储介质存储有计算机可执行指令,计算机可执行指令设置为:
响应于开发者产品在用户终端上的使用和在开发平台网页上被访问,采集与所述开发者产品相关的日志数据;
分别统计开发者所有产品的日志数据中的第一数据,以及所述所有产品中的任一产品的日志数据中的第二数据,所述第一数据和所述第二数据中均至少包括行为数据和语音数据;
响应于开发者的统计数据获取请求,将所述第一参数和所述第二参数以图表的形式展示给所述开发者。
作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的用于智能语音对话开发平台的数据统计方法对应的程序指令/模块。一个或者多个程序指令存储在非易失性计算机可读存储介质中,当被处理器执行时,执行上述任意方法实施例中的用于智能语音对话开发平台的数据统计方法。
非易失性计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据用于智能语音对话开发平台的数据统计装置的使用所创建的数据等。此外,非易失性计算机可读存储介质可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至用于智能语音对话开发平台的数据统计装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明实施例还提供一种计算机程序产品,计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,使计算机执行上述任一项用于智能语音对话开发平台的数据统计方法。
图7是本发明实施例提供的电子设备的结构示意图,如图7所示,该设备包括:一个或多个处理器710以及存储器720,图7中以一个处理器710为例。用于智能语音对话开发平台的数据统计方法的设备还可以包括:输入装置730和输出装置740。处理器710、存储器720、输入装置730和输出装置740可以通过总线或者其他方式连接,图7中以通过总线连接为例。存储器720为上述的非易失性计算机可读存储介质。处理器710通过运行存储在存储器720中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例用于智能语音对话开发平台的数据统计方法。输入装置730可接收输入的数字或字符信息,以及产生与信息投放装置的用户设置以及功能控制有关的键信号输入。输出装置740可包括显示屏等显示设备。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
作为一种实施方式,上述电子设备应用于神经网络语言模型中,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:
响应于开发者产品在用户终端上的使用和在开发平台网页上被访问,采集与所述开发者产品相关的日志数据;
分别统计开发者所有产品的日志数据中的第一数据,以及所述所有产品中的任一产品的日志数据中的第二数据,所述第一数据和所述第二数据中均至少包括行为数据和语音数据;
响应于开发者的统计数据获取请求,将所述第一参数和所述第二参数以图表的形式展示给所述开发者。
本申请实施例的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种用于智能语音对话开发平台的数据统计方法,包括:
响应于开发者产品在用户终端上的使用和在开发平台网页上被访问,采集与所述开发者产品相关的日志数据;
分别统计开发者所有产品的日志数据中的第一数据,以及所述所有产品中的任一产品的日志数据中的第二数据,所述第一数据和所述第二数据中均至少包括行为数据和语音数据;
响应于开发者的统计数据获取请求,将所述第一数据和所述第二数据以图表的形式展示给所述开发者。
2.根据权利要求1所述的方法,所述方法还包括:
从所述日志数据中筛选出异常日志,并从所述异常日志中获取导致异常的语音对应的识别文本;
基于所述识别文本分析所述异常日志的错误原因。
3.根据权利要求2所述的方法,所述方法还包括:
响应于开发者的异常日志获取请求,以表格形式向所述开发者展示异常日志的多项数据,所述多项数据中至少包括所述识别文本和所述错误原因。
4.根据权利要求3所述的方法,所述方法还包括:
响应于所述开发者点开任一所述异常日志,向所述开发者提供将所述异常日志提交至所述开发平台处理的按键。
5.一种用于智能语音对话开发平台的数据统计系统,包括:
采集单元,配置为响应于开发者产品在用户终端上的使用和在开发平台网页上被访问,采集与所述开发者产品相关的日志数据;
统计单元,配置为分别统计开发者所有产品的日志数据中的第一数据,以及所述所有产品中的任一产品的日志数据中的第二数据,所述第一数据和所述第二数据中均至少包括行为数据和语音数据;
展示单元,配置为响应于开发者的统计数据获取请求,将所述第一参数和所述第二参数以图表的形式展示给所述开发者。
6.根据权利要求5所述的系统,还包括:
筛选单元,配置为从所述日志数据中筛选出异常日志,并从所述异常日志中获取导致异常的语音对应的识别文本;
分析单元,配置为基于所述识别文本分析所述异常日志的错误原因。
7.根据权利要求6所述的系统,还包括:
异常日志单元,配置为响应于开发者的异常日志获取请求,以表格形式向所述开发者展示异常日志的多项数据,所述多项数据中至少包括所述识别文本和所述错误原因。
8.根据权利要求7所述的系统,还包括:
提交处理单元,配置为响应于所述开发者点开任一所述异常日志,向所述开发者提供将所述异常日志提交至所述开发平台处理的按键。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至4任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至4任一项所述方法的步骤。
CN201810213378.8A 2018-03-15 2018-03-15 语音数据统计方法和系统 Active CN108446370B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810213378.8A CN108446370B (zh) 2018-03-15 2018-03-15 语音数据统计方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810213378.8A CN108446370B (zh) 2018-03-15 2018-03-15 语音数据统计方法和系统

Publications (2)

Publication Number Publication Date
CN108446370A true CN108446370A (zh) 2018-08-24
CN108446370B CN108446370B (zh) 2019-04-26

Family

ID=63195368

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810213378.8A Active CN108446370B (zh) 2018-03-15 2018-03-15 语音数据统计方法和系统

Country Status (1)

Country Link
CN (1) CN108446370B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110096612A (zh) * 2019-05-06 2019-08-06 苏州思必驰信息科技有限公司 语音日志的在线音频分析数据的获取方法及系统
CN110503960A (zh) * 2019-09-26 2019-11-26 大众问问(北京)信息科技有限公司 语音识别结果的实时上载方法、装置、设备及存储介质
CN111047362A (zh) * 2019-12-18 2020-04-21 上海智勘科技有限公司 智能音箱使用活跃度的统计管理方法和系统
CN113079262A (zh) * 2021-03-24 2021-07-06 北京百度网讯科技有限公司 智能语音对话的数据处理方法和装置、电子设备和介质

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101110044A (zh) * 2007-08-28 2008-01-23 中兴通讯股份有限公司 一种内存监控管理的方法及系统
CN101136798A (zh) * 2007-10-16 2008-03-05 中兴通讯股份有限公司 一种数据配置自动化测试系统和方法
CN101394267A (zh) * 2008-10-08 2009-03-25 北京启明星辰信息技术股份有限公司 基于通用范化标签语言的安全信息管理系统及方法
CN101415144A (zh) * 2008-12-10 2009-04-22 中国电信股份有限公司 移动媒体信息综合业务平台系统及其实现方法
CN101686426A (zh) * 2008-09-27 2010-03-31 北京掌易迅移动软件技术有限责任公司 移动服务平台的总体技术构架
CN102902764A (zh) * 2012-09-25 2013-01-30 北京奇虎科技有限公司 一种日志记录的方法和装置
CN103400576A (zh) * 2013-07-18 2013-11-20 百度在线网络技术(北京)有限公司 基于用户行为日志的语音模型更新方法及装置
CN103414791A (zh) * 2013-08-30 2013-11-27 苏州跨界软件科技有限公司 移动应用开发云平台
CN103593440A (zh) * 2013-11-15 2014-02-19 北京国双科技有限公司 日志文件的读写方法及装置
CN103744890A (zh) * 2013-12-23 2014-04-23 清华大学 日志分离方法及装置
CN103873811A (zh) * 2012-12-10 2014-06-18 株式会社理光 信息处理设备、信息处理方法和信息处理系统
CN104317934A (zh) * 2014-10-31 2015-01-28 北京思特奇信息技术股份有限公司 一种快速批量外呼的方法及系统
CN104424306A (zh) * 2013-09-04 2015-03-18 腾讯科技(深圳)有限公司 一种日志记录方法、装置及终端设备
US20150095318A1 (en) * 2013-09-27 2015-04-02 Labor Genome, Ltd. System for scoring an organational role capability
CN104538031A (zh) * 2014-12-15 2015-04-22 北京云知声信息技术有限公司 智能语音服务开发云平台及方法
US9318128B1 (en) * 2013-01-08 2016-04-19 Google Inc. Methods and systems for determining instructions for applications that are recognizable by a voice interface
CN105630869A (zh) * 2015-12-15 2016-06-01 北京奇虎科技有限公司 一种语音数据的存储方法和装置
CN106293820A (zh) * 2016-08-02 2017-01-04 山东大学 开发测试运维一体化系统、部署、全量以及增量更新方法
CN106649696A (zh) * 2016-12-19 2017-05-10 北京云知声信息技术有限公司 信息分类方法及装置
CN107068147A (zh) * 2015-10-19 2017-08-18 谷歌公司 语音端点确定

Patent Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101110044A (zh) * 2007-08-28 2008-01-23 中兴通讯股份有限公司 一种内存监控管理的方法及系统
CN101136798A (zh) * 2007-10-16 2008-03-05 中兴通讯股份有限公司 一种数据配置自动化测试系统和方法
CN101686426A (zh) * 2008-09-27 2010-03-31 北京掌易迅移动软件技术有限责任公司 移动服务平台的总体技术构架
CN101394267A (zh) * 2008-10-08 2009-03-25 北京启明星辰信息技术股份有限公司 基于通用范化标签语言的安全信息管理系统及方法
CN101415144A (zh) * 2008-12-10 2009-04-22 中国电信股份有限公司 移动媒体信息综合业务平台系统及其实现方法
CN102902764A (zh) * 2012-09-25 2013-01-30 北京奇虎科技有限公司 一种日志记录的方法和装置
CN103873811A (zh) * 2012-12-10 2014-06-18 株式会社理光 信息处理设备、信息处理方法和信息处理系统
US9318128B1 (en) * 2013-01-08 2016-04-19 Google Inc. Methods and systems for determining instructions for applications that are recognizable by a voice interface
CN103400576A (zh) * 2013-07-18 2013-11-20 百度在线网络技术(北京)有限公司 基于用户行为日志的语音模型更新方法及装置
CN103414791A (zh) * 2013-08-30 2013-11-27 苏州跨界软件科技有限公司 移动应用开发云平台
CN104424306A (zh) * 2013-09-04 2015-03-18 腾讯科技(深圳)有限公司 一种日志记录方法、装置及终端设备
US20150095318A1 (en) * 2013-09-27 2015-04-02 Labor Genome, Ltd. System for scoring an organational role capability
CN103593440A (zh) * 2013-11-15 2014-02-19 北京国双科技有限公司 日志文件的读写方法及装置
CN103744890A (zh) * 2013-12-23 2014-04-23 清华大学 日志分离方法及装置
CN104317934A (zh) * 2014-10-31 2015-01-28 北京思特奇信息技术股份有限公司 一种快速批量外呼的方法及系统
CN104538031A (zh) * 2014-12-15 2015-04-22 北京云知声信息技术有限公司 智能语音服务开发云平台及方法
CN107068147A (zh) * 2015-10-19 2017-08-18 谷歌公司 语音端点确定
CN105630869A (zh) * 2015-12-15 2016-06-01 北京奇虎科技有限公司 一种语音数据的存储方法和装置
CN106293820A (zh) * 2016-08-02 2017-01-04 山东大学 开发测试运维一体化系统、部署、全量以及增量更新方法
CN106649696A (zh) * 2016-12-19 2017-05-10 北京云知声信息技术有限公司 信息分类方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110096612A (zh) * 2019-05-06 2019-08-06 苏州思必驰信息科技有限公司 语音日志的在线音频分析数据的获取方法及系统
CN110503960A (zh) * 2019-09-26 2019-11-26 大众问问(北京)信息科技有限公司 语音识别结果的实时上载方法、装置、设备及存储介质
CN110503960B (zh) * 2019-09-26 2022-02-11 大众问问(北京)信息科技有限公司 语音识别结果的实时上载方法、装置、设备及存储介质
CN111047362A (zh) * 2019-12-18 2020-04-21 上海智勘科技有限公司 智能音箱使用活跃度的统计管理方法和系统
CN113079262A (zh) * 2021-03-24 2021-07-06 北京百度网讯科技有限公司 智能语音对话的数据处理方法和装置、电子设备和介质
CN113079262B (zh) * 2021-03-24 2022-12-13 北京百度网讯科技有限公司 智能语音对话的数据处理方法和装置、电子设备和介质

Also Published As

Publication number Publication date
CN108446370B (zh) 2019-04-26

Similar Documents

Publication Publication Date Title
US11206229B2 (en) Directed acyclic graph based framework for training models
US20200342032A1 (en) Insights into performance of a bot system
CN112671823B (zh) 基于机器学习的交互到联络中心代理的最优路由
CN108446370B (zh) 语音数据统计方法和系统
US11106683B2 (en) System architecture for interactive query processing
US10949748B2 (en) Deep learning of bots through examples and experience
CN104753985B (zh) 会话列表显示方法和装置
DE202017105915U1 (de) Erzeugen und Senden einer Aufrufanfrage zu einem geeigneten Agenten einer dritten Partei
US10387536B2 (en) Computerized data-aware agent systems for retrieving data to serve a dialog between human user and computerized system
CN107451199A (zh) 问题推荐方法及装置、设备
US11570214B2 (en) Crowdsourced innovation laboratory and process implementation system
US20130239006A1 (en) Aggregator, filter and delivery system for online context dependent interaction, systems and methods
AU2017348460A1 (en) Systems and methods for monitoring and analyzing computer and network activity
US10999333B2 (en) Contemporaneous feedback during web-conferences
CN108288179A (zh) 一种用户偏好房源计算方法和系统
US9898512B1 (en) Factual query pattern learning
DE202017100386U1 (de) Latenzreduzierung bei der feedbackbasierten Ermittlung einer Systemperformance
WO2018031309A1 (en) Computerized group task digital assistance
CN109727649B (zh) 使用机器学习设计数据分析平台
US11966441B2 (en) Method and system for predicative Q and A and resource suggestions
CN111026945B (zh) 多平台爬虫调度方法、装置和存储介质
CN116662527A (zh) 用于生成学习资源的方法及相关产品
CN107608979A (zh) 识别用户潜在求助的知识点的方法及装置
Shin Socio-technical design of algorithms: Fairness, accountability, and transparency
CN112541705A (zh) 生成用户行为评估模型的方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Patentee after: Sipic Technology Co.,Ltd.

Address before: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Patentee before: AI SPEECH Co.,Ltd.

CP01 Change in the name or title of a patent holder
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Voice data statistical methods and systems

Effective date of registration: 20230726

Granted publication date: 20190426

Pledgee: CITIC Bank Limited by Share Ltd. Suzhou branch

Pledgor: Sipic Technology Co.,Ltd.

Registration number: Y2023980049433

PE01 Entry into force of the registration of the contract for pledge of patent right