CN111028862A - 处理语音数据的方法、装置、计算机设备和存储介质 - Google Patents

处理语音数据的方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN111028862A
CN111028862A CN201911304122.9A CN201911304122A CN111028862A CN 111028862 A CN111028862 A CN 111028862A CN 201911304122 A CN201911304122 A CN 201911304122A CN 111028862 A CN111028862 A CN 111028862A
Authority
CN
China
Prior art keywords
analysis
voice
cough
target
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911304122.9A
Other languages
English (en)
Other versions
CN111028862B (zh
Inventor
康美琴
孔令皓
李磊鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Haiyi Tongzhan Information Technology Co Ltd
Original Assignee
Beijing Haiyi Tongzhan Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Haiyi Tongzhan Information Technology Co Ltd filed Critical Beijing Haiyi Tongzhan Information Technology Co Ltd
Priority to CN201911304122.9A priority Critical patent/CN111028862B/zh
Publication of CN111028862A publication Critical patent/CN111028862A/zh
Application granted granted Critical
Publication of CN111028862B publication Critical patent/CN111028862B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4803Speech analysis specially adapted for diagnostic purposes

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Veterinary Medicine (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种处理语音数据的方法、装置、计算机设备和存储介质。所述方法包括:接收分析需求参数,所述分析需求参数包括分析时间段、分析对象和分析指标;从候选语音片段集合中获取与所述分析时间段和所述分析对象对应的目标语音片段,得到目标语音片段集合,所述目标语音片段中包含分析对象的咳嗽特征;按照所述分析指标对所述目标语音片段集合的目标语音片段进行统计和分析,得到所述分析对象的当前咳嗽状态。通过自动识别语音数据中的咳嗽特征,并分析语音数据中的咳嗽特征,实现对分析对象的咳嗽状态的监测,提高了咳嗽监测效率。

Description

处理语音数据的方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种处理语音数据的方法、装置、计算机设备和存储介质。
背景技术
养殖行业伴随消费需求增长而发展。养殖过程不仅要制定科学饲喂方法提高养殖对象的生长性能,同时疾病防控也是养殖过程中的关键技术,容易引起养殖户困扰。养殖的常见疾病较多,轻则增加养殖成本,重则造成巨大经济损失。
对于养殖对象疾病的发现,一般采用人工巡查的方式进行。养殖场最常见的疾病一般都伴随着养殖对象的咳嗽、哮喘等症状。人工巡查一般通过饲养员巡查养殖场时,观察养殖对象是否存在咳嗽、哮喘、形态、体表异常等症状,人工巡查统计养殖对象咳嗽特征等需要多人配合,监测效率低。
发明内容
为了解决上述技术问题,本申请提供了一种处理语音数据的方法、装置、计算机设备和存储介质。
第一方面,本申请提供了一种处理语音数据的方法,包括:
接收分析需求参数,分析需求参数包括分析时间段、分析对象和分析指标;
从候选语音片段集合中获取与分析时间段和分析对象对应的目标语音片段,得到目标语音片段集合,目标语音片段中包含分析对象的咳嗽特征;
按照分析指标对目标语音片段集合的目标语音片段进行统计和分析,得到分析对象的当前咳嗽状态。
第二方面,本申请提供了一种处理语音数据的装置,包括:
数据接收模块,用于接收分析需求参数,分析需求参数包括分析时间段、分析对象和分析指标;
语音筛选模块,用于从候选语音片段集合中获取与分析时间段和分析对象对应的目标语音片段,得到目标语音片段集合,目标语音片段中包含分析对象的咳嗽特征;
语音分析模块,用于按照分析指标对目标语音片段集合的目标语音片段进行统计和分析,得到分析对象的当前咳嗽状态。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
接收分析需求参数,分析需求参数包括分析时间段、分析对象和分析指标;
从候选语音片段集合中获取与分析时间段和分析对象对应的目标语音片段,得到目标语音片段集合,目标语音片段中包含分析对象的咳嗽特征;
按照分析指标对目标语音片段集合的目标语音片段进行统计和分析,得到分析对象的当前咳嗽状态。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
接收分析需求参数,分析需求参数包括分析时间段、分析对象和分析指标;
从候选语音片段集合中获取与分析时间段和分析对象对应的目标语音片段,得到目标语音片段集合,目标语音片段中包含分析对象的咳嗽特征;
按照分析指标对目标语音片段集合的目标语音片段进行统计和分析,得到分析对象的当前咳嗽状态。
上述处理语音数据的方法、装置、计算机设备和存储介质,所述方法包括:接收分析需求参数,分析需求参数包括分析时间段、分析对象和分析指标;从候选语音片段集合中获取与分析时间段和分析对象对应的目标语音片段,得到目标语音片段集合,目标语音片段中包含分析对象的咳嗽特征;按照分析指标对目标语音片段集合的目标语音片段进行统计和分析,得到分析对象的当前咳嗽状态。通过自动识别语音数据中的咳嗽特征,并分析语音数据中的咳嗽特征,实现对分析对象的咳嗽状态的监测,提高了咳嗽监测效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中处理语音数据的方法的应用环境图;
图2为一个实施例中处理语音数据的方法的流程示意图;
图3为另一个实施例中处理语音数据的方法的流程示意图;
图4为一个实施例中咳嗽分析步骤的流程示意图;
图5为一个实施例中处理语音数据系统的示意图;
图6为一个实施例中报警界面的示意图;
图7为另一个实施例中播放语音界面的示意图;
图8为一个实施例中处理语音数据的装置的结构框图;
图9为一个实施例中计算机设备的内部结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为一个实施例中处理语音数据的方法的应用环境图。参照图1,该处理语音数据的方法应用于处理语音数据的系统。该处理语音数据的系统包括语音采集设备110和计算机设备120。语音采集设备110和计算机设备120通过网络连接。计算机设备120包括终端和服务器,其中,终端具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
如图2所示,在一个实施例中,提供了一种处理语音数据的方法。本实施例主要以该方法应用于上述图1中的计算机设备120来举例说明。参照图2,该处理语音数据的方法具体包括如下步骤:
步骤S201,接收分析需求参数。
在本具体实施例中,分析需求参数包括分析时间段、分析对象和分析指标。
具体地,分析需求参数是指想要监测分析对象指标的参数,参数包括但不限于时间信息、位置信息、分析对象和分析指标等等。分析时间段可以自定义设置,也可以选择预先配置的时间段,如可以将一个小时、半天和一天等作为分析时间段。分析对象为养殖对象,养殖对象包括猪、羊、牛等等。分析指标包括咳嗽次数、咳嗽平均次数和咳嗽频率等等。
步骤S202,从候选语音片段集合中获取与分析时间段和分析对象对应的目标语音片段,得到目标语音片段集合。
在本具体实施例中,目标语音片段中包含分析对象的咳嗽特征。
步骤S203,按照分析指标对目标语音片段集合的目标语音片段进行统计和分析,得到分析对象的当前咳嗽状态。
具体地,候选语音片段集合包含多个候选语音片段,每个候选语音片段中携带对应的分析对象标识和采集时间信息等。根据分析时间段和分析对象对候选语音片段集合中的候选语音片段进行筛选,即从候选语音片段集合中筛选出与分析时间段对应的候选语音片段,得到该时间段对应的语音片段,并采用分析对象对该时间段对应的语音片段进行再次筛选,得到分析对象的语音片段,即目标语音片段。其中,目标语音片段中包含咳嗽特征,每个目标语音片段可以包含一个或多个分析对象的咳嗽声。咳嗽特征是用于表征咳嗽的语音特征,咳嗽特征可以为语音特征或图特征,其中图特征是指根据语音数据生成的语谱图对应的特征。
根据分析指标对目标语音片段集合进行分析,即统计目标语音片段集合中目标语音片段的总数量、目标语音片段之间的时间间隔等,根据统计到的总数量和时间间隔等等对分析对象的咳嗽状态进行分析,得到分析对象的咳嗽状态,当前咳嗽状态是正在分析的分析对象的咳嗽状态。其中咳嗽状态可以通过咳嗽次数和咳嗽频率等确定。咳嗽状态可以包含多个状态,状态的数量和等级可以自定义,如设置轻微、严重和危险三个用于表示咳嗽状态的等级。不同等级的咳嗽状态对应的咳嗽数据不同,如不同等级的咳嗽状态对应不同的咳嗽频率区间。咳嗽频率区间可以采用咳嗽次数区间或平均咳嗽次数区间等等表示。
上述处理语音数据的方法,包括:接收分析需求参数,所述分析需求参数包括分析时间段、分析对象和分析指标;从候选语音片段集合中获取与所述分析时间段和所述分析对象对应的目标语音片段,得到目标语音片段集合,所述目标语音片段中包含分析对象的咳嗽特征;按照所述分析指标对所述目标语音片段集合的目标语音片段进行统计和分析,得到所述分析对象的当前咳嗽状态。通过自动识别语音数据中的咳嗽特征,并分析语音数据中的咳嗽特征,实现对分析对象的咳嗽状态的监测,提高了咳嗽监测效率。
在一个实施例中,如图3所示,步骤S202之前,还包括:
步骤S204,接收包含初始分析对象语音信息的多个初始语音片段。
步骤S205,提取各个初始语音片段的语音特征。
步骤S206,根据各个初始语音片段中的语音特征,判断各个初始语音片段中是否包含咳嗽特征。
步骤S207,将包含咳嗽特征的初始语音片段作为候选语音片段,各个候选语音片段组成候选语音片段集合。
具体地,初始语音片段是指语音采集设备采集的语音数据进行分段得到的语音片段。提取语音片段中的语音特征,可以采用常见的语音特征提取模型提取语音特征。提取的语音特征可以是直接对语音片段进行特征提取得到的特征,也可以是将语音片段转化成语谱图后提取的特征。计算各个语音片段中提取的语音特征与咳嗽特征的相似度,当某个语音片段中的语音特征与咳嗽特征的相似度大于或等于预设相似度,表示该语音片段中的语音特征包含咳嗽特征,反之,则表示该语音片段中不存在咳嗽特征。将包含咳嗽特征语音片段作为候选语音片段,由各个候选语音片段组成的集合为候选语音片段集合。对语音片段进行分类,分为包含咳嗽特征的语音片段和不包含咳嗽特征的语音片段。
在一个实施中,保存包含咳嗽特征的语音片段。仅保存包含咳嗽特征的语音片段,减少了不包含咳嗽特征的语音片段的存储,节约存储资源。
在一个实施例中,如图4所示,步骤S203,包括:
步骤S2031,统计目标语音片段集合中目标语音片段的数目,得到片段数目。
步骤S2032,统计目标语音片段集合对应的分析对象的数目,得到对象数目。
步骤S2033,计算片段数目与对象数目之间的比值,得到分析对象的当前平均咳嗽次数。
步骤S2034,从预设的标准平均咳嗽次数区间与标准咳嗽状态的对应关系中,查找根据当前平均咳嗽次数匹配的标准咳嗽状态,得到分析对象的当前咳嗽状态。
具体地,片段数目是指目标语音片段集合包含的目标语音片段的数目,同理对象数目是指目标语音片段集合对应的分析对象的数目。计算片段数目与对象数目之间的比值,得到分析对象的当前平均咳嗽次数,其中当前平均咳嗽次数可是为日平均次数或周平均次数等等。如统计一天的目标语音片段集合,则得到日平均次数,统计一周的目标语音片段集合,则得到周平均次数。标准平均咳嗽次数区间与标准咳嗽状态的对应关系是预先设定的对应关系,不同的平均咳嗽次数区间对应不同的咳嗽状态,该对应关系可以是技术人员的经验值或根据真实的历史数据统计得到的。根据该对应关系查找与当前平均咳嗽次数匹配的标准咳嗽状态,将与当前平均咳嗽次数匹配的标准咳嗽状态作为当前咳嗽状态。
在一个实施例中,展示分析对象的当前咳嗽状态。展示当前咳嗽状态同时,展示分析对象所处位置、养殖对象的数量等信息。
在一个实施例中,步骤S203之后还包括:当当前咳嗽状态为目标咳嗽状态时,生成报警指令,发送报警指令。
具体地,目标咳嗽状态是指预先设置的用于报警的咳嗽状态,即咳嗽严重程度达到一定程度时,应该向养殖场的养殖人员报警,提示养殖人员应该注意及时处理分析对象。故当当前咳嗽状态为目标咳嗽状态时,生成用于报警的报警指令,发送报警指令,并执行报警指令。其中报警指令可以采用声光报警等等,也可以采用短消息通知的方式报警,如将报警信息发送给对应的终端,在对应的终端上显示报警信息,也可以生成控制灯亮灭或语音播放器播放报警信息的控制指令,发送并执行该控制指令,使得灯亮起或熄灭,或语音播放器播放报警信息等。其中报警信息包含被报警的位置信息、被报警的对象信息等等。
在一个具体的实施例中,如图5所示,处理语音数据的系统,包括语音采集设备110,边缘计算网关130,IOT平台140和大数据平台150,其中,语音采集设备110负责采集养殖场的声音,将声音储存在TF卡中。边缘计算网关130从流程上负责串联整套系统中的各个组件。按照规则,可向硬件发送指令,触发每一个模块的相关动作。TF卡中的声音数据经过AI声音算法识别后,经过网关的应用程序上传至IOT平台140,IOT平台140将数据进行保存、解析,再将数据上传至大数据平台150。AI声音识别方法是指部署在边缘计算网关的声音识别算法把声音信号通过快速傅里叶变换转到频域后生成声谱图,再使用深度学习网络对声谱图进行图像分类,分类的结果是咳嗽声音和背景噪声。最后收集咳嗽对应的语音片段,进行保存并上报。IOT平台140将为整个系统提供统一服务,一方面基于MQTT协议将边缘计算网关130上报的咳嗽数据接收过来,通过规则引擎上传给大数据平台150,另一方面IOT平台140提供接口,将边缘计算网关130上传的咳嗽数据完整地保存到大数据平台150上。IOT平台140还可将咳嗽数据抽象为时间序列的指标,实现数据自动流转及系统自动诊断。大数据平台150是一个集硬件和规则管理、数据查阅、统计分析的平台,支持的内容主要包括:负责将语音采集设备110、边缘计算网关130、养殖场之间的关系绑定起来;将IOT平台140上传的数据进行处理分析,并以图表方式展示给用户;支持用户设置相应参数。
用户通过大数据平台150可以了解养殖对象的咳嗽状态,医护人员根据咳嗽状态采取治疗方案。
衡量养殖对象咳嗽严重程度的指标包括养殖对象的平均咳嗽次数。其中养殖对象的平均咳嗽次数的计算公式为:养殖对象平均咳嗽次数=每个养殖场每小时咳嗽音频数量/每个养殖场内养殖对象的数量。其中音频时间长度为15秒。养殖对象的平均咳嗽次数可根据严重程度分为自定义划分对应的等级,如划分为三级,分别轻微、严重、危险。用户可根据疫病严重程度和分布情况进行相应诊断。
用户可查看全场各区疫病分布情况和严重情况和有疫情养殖场每天24小时的咳嗽详情和历史咳嗽数据。如图6所示,用户可以通过界面上的咳嗽报警界面查看报警信息,如图7所示,用户可以在界面上点击按钮播放咳嗽声音。
如大数据平台150上设置有用于播放养殖对象的咳嗽声音的按钮,当点击按钮可收听养殖对象的咳嗽音频,为疾病确认和治疗提供依据。
利用AI智能识别声音技术和无线信号传输命令、数据的方式,实现无人监测养殖对象的咳嗽,有效提高了监测效率。且减少人员进出养殖场地,提升疾病报警效率,降低疾病爆发风险,保证养殖企业的经济效益。远程监测养殖对象的咳嗽,并可在手机实时收听养殖对象的咳嗽声音,实现远程监测疾病。
图2-图4分别为一个实施例中处理语音数据的方法或步骤的流程示意图。应该理解的是,虽然图2-图4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-图4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图8所示,提供了一种处理语音数据的装置200,包括:
数据接收模块201,用于接收分析需求参数,分析需求参数包括分析时间段、分析对象和分析指标。
语音筛选模块202,用于从候选语音片段集合中获取与分析时间段和分析对象对应的目标语音片段,得到目标语音片段集合,目标语音片段中包含分析对象的咳嗽特征。
语音分析模块203,用于按照分析指标对目标语音片段集合的目标语音片段进行统计和分析,得到分析对象的当前咳嗽状态。
在一个实施例中,上述处理语音数据的装置200,还包括:
初始语音接收模块,用于接收包含初始分析对象语音信息的多个初始语音片段。
特征提取模块,用于提取各个初始语音片段的语音特征。
判断模块,用于根据各个初始语音片段中的语音特征,判断各个初始语音片段中是否包含咳嗽特征。
候选语音筛选模块,用于将包含咳嗽特征的初始语音片段作为候选语音片段,各个候选语音片段组成候选语音片段集合,保存候选语音片段集合。
在一个实施例中,语音分析模块,包括:
统计单元,用于统计目标语音片段集合中目标语音片段的数目,得到片段数目,统计目标语音片段集合对应的分析对象的数目,得到对象数目。
平均咳嗽次数计算单元,用于计算片段数目与对象数目之间的比值,得到分析对象的当前平均咳嗽次数。
咳嗽状态查询单元,用于从预设的标准平均咳嗽次数区间与标准咳嗽状态的对应关系中,查找根据当前平均咳嗽次数匹配的标准咳嗽状态,得到分析对象的当前咳嗽状态。
在一个实施例中,上述处理语音数据的装置200,还包括:
报警模块,用于当当前咳嗽状态为目标咳嗽状态时,生成报警指令,发送报警指令。
图9示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端110(或计算机设备120)。如图9所示,该计算机设备通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现处理语音数据的方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行处理语音数据的方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的处理语音数据的装置可以实现为一种计算机程序的形式,计算机程序可在如图9所示的计算机设备上运行。计算机设备的存储器中可存储组成该处理语音数据的装置的各个程序模块,比如,图8所示的数据接收模块201、语音筛选模块202和语音分析模块203。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的处理语音数据的方法中的步骤。
例如,图9所示的计算机设备可以通过如图8所示的处理语音数据的装置中的数据接收模块201执行接收分析需求参数,分析需求参数包括分析时间段、分析对象和分析指标。计算机设备可以通过语音筛选模块202执行从候选语音片段集合中获取与分析时间段和分析对象对应的目标语音片段,得到目标语音片段集合,目标语音片段中包含分析对象的咳嗽特征。计算机设备可以通过语音分析模块203执行按照分析指标对目标语音片段集合的目标语音片段进行统计和分析,得到分析对象的当前咳嗽状态。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:接收分析需求参数,分析需求参数包括分析时间段、分析对象和分析指标;从候选语音片段集合中获取与分析时间段和分析对象对应的目标语音片段,得到目标语音片段集合,目标语音片段中包含分析对象的咳嗽特征;按照分析指标对目标语音片段集合的目标语音片段进行统计和分析,得到分析对象的当前咳嗽状态。
在一个实施例中,从候选语音片段集合中获取与分析时间段和分析对象对应的目标语音片段,得到目标语音片段集合之前,处理器执行计算机程序时还实现以下步骤:接收包含初始分析对象语音信息的多个初始语音片段;提取各个初始语音片段的语音特征;根据各个初始语音片段中的语音特征,判断各个初始语音片段中是否包含咳嗽特征;将包含咳嗽特征的初始语音片段作为候选语音片段,各个候选语音片段组成候选语音片段集合。
在一个实施例中,分析指标为平均咳嗽次数,按照分析指标对目标语音片段集合的目标语音片段进行统计和分析,得到分析对象的当前咳嗽状态,包括:统计目标语音片段集合中目标语音片段的数目,得到片段数目;统计目标语音片段集合对应的分析对象的数目,得到对象数目;计算片段数目与对象数目之间的比值,得到分析对象的当前平均咳嗽次数;从预设的标准平均咳嗽次数区间与标准咳嗽状态的对应关系中,查找根据当前平均咳嗽次数匹配的标准咳嗽状态,得到分析对象的当前咳嗽状态。
在一个实施例中,按照分析指标对目标语音片段集合的目标语音片段进行统计和分析,得到分析对象的当前咳嗽状态之后,处理器执行计算机程序时还实现以下步骤:当当前咳嗽状态为目标咳嗽状态时,生成报警指令,发送报警指令。
在一个实施例中,分析需求参数为用户自定义的参数或用户选择的分析选项中配置的参数。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:接收分析需求参数,分析需求参数包括分析时间段、分析对象和分析指标;从候选语音片段集合中获取与分析时间段和分析对象对应的目标语音片段,得到目标语音片段集合,目标语音片段中包含分析对象的咳嗽特征;按照分析指标对目标语音片段集合的目标语音片段进行统计和分析,得到分析对象的当前咳嗽状态。
在一个实施例中,从候选语音片段集合中获取与分析时间段和分析对象对应的目标语音片段,得到目标语音片段集合之前,计算机程序被处理器执行时还实现以下步骤:接收包含初始分析对象语音信息的多个初始语音片段;提取各个初始语音片段的语音特征;根据各个初始语音片段中的语音特征,判断各个初始语音片段中是否包含咳嗽特征;将包含咳嗽特征的初始语音片段作为候选语音片段,各个候选语音片段组成候选语音片段集合。
在一个实施例中,分析指标为平均咳嗽次数,按照分析指标对目标语音片段集合的目标语音片段进行统计和分析,得到分析对象的当前咳嗽状态,包括:统计目标语音片段集合中目标语音片段的数目,得到片段数目;统计目标语音片段集合对应的分析对象的数目,得到对象数目;计算片段数目与对象数目之间的比值,得到分析对象的当前平均咳嗽次数;从预设的标准平均咳嗽次数区间与标准咳嗽状态的对应关系中,查找根据当前平均咳嗽次数匹配的标准咳嗽状态,得到分析对象的当前咳嗽状态。
在一个实施例中,按照分析指标对目标语音片段集合的目标语音片段进行统计和分析,得到分析对象的当前咳嗽状态之后,计算机程序被处理器执行时还实现以下步骤:当当前咳嗽状态为目标咳嗽状态时,生成报警指令,发送报警指令。
在一个实施例中,分析需求参数为用户自定义的参数或用户选择的分析选项中配置的参数。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种处理语音数据的方法,其特征在于,所述方法包括:
接收分析需求参数,所述分析需求参数包括分析时间段、分析对象和分析指标;
从候选语音片段集合中获取与所述分析时间段和所述分析对象对应的目标语音片段,得到目标语音片段集合,所述目标语音片段中包含所述分析对象的咳嗽特征;
按照所述分析指标对所述目标语音片段集合的目标语音片段进行统计和分析,得到所述分析对象的当前咳嗽状态。
2.根据权利要求1所述的方法,其特征在于,所述从候选语音片段集合中获取与所述分析时间段和所述分析对象对应的目标语音片段,得到目标语音片段集合之前,还包括:
接收包含初始分析对象语音信息的多个初始语音片段;
提取各个所述初始语音片段的语音特征;
根据各个所述初始语音片段中的语音特征,判断各个所述初始语音片段中是否包含咳嗽特征;
将包含所述咳嗽特征的初始语音片段作为所述候选语音片段,各个所述候选语音片段组成所述候选语音片段集合。
3.根据权利要求1所述的方法,其特征在于,所述分析指标为平均咳嗽次数,所述按照所述分析指标对所述目标语音片段集合的目标语音片段进行统计和分析,得到所述分析对象的当前咳嗽状态,包括:
统计所述目标语音片段集合中所述目标语音片段的数目,得到片段数目;
统计所述目标语音片段集合对应的分析对象的数目,得到对象数目;
计算所述片段数目与所述对象数目之间的比值,得到所述分析对象的当前平均咳嗽次数;
从预设的标准平均咳嗽次数区间与标准咳嗽状态的对应关系中,查找根据所述当前平均咳嗽次数匹配的标准咳嗽状态,得到所述分析对象的当前咳嗽状态。
4.根据权利要求1所述的方法,其特征在于,所述按照所述分析指标对所述目标语音片段集合的目标语音片段进行统计和分析,得到所述分析对象的当前咳嗽状态之后,还包括:
当所述当前咳嗽状态为目标咳嗽状态时,生成报警指令,发送所述报警指令。
5.根据权利要求1所述的方法,其特征在于,所述分析需求参数为用户自定义的参数或用户选择的分析选项中配置的参数。
6.一种处理语音数据的装置,其特征在于,所述装置包括:
数据接收模块,用于接收分析需求参数,所述分析需求参数包括分析时间段、分析对象和分析指标;
语音筛选模块,用于从候选语音片段集合中获取与所述分析时间段和所述分析对象对应的目标语音片段,得到目标语音片段集合,所述目标语音片段中包含分析对象的咳嗽特征;
语音分析模块,用于按照所述分析指标对所述目标语音片段集合的目标语音片段进行统计和分析,得到所述分析对象的当前咳嗽状态。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
初始语音接收模块,用于接收包含初始分析对象语音信息的多个初始语音片段;
特征提取模块,用于提取各个所述初始语音片段的语音特征;
判断模块,用于根据各个所述初始语音片段中的语音特征,判断各个所述初始语音片段中是否包含咳嗽特征;
候选语音筛选模块,用于将包含所述咳嗽特征的初始语音片段作为所述候选语音片段,各个所述候选语音片段组成所述候选语音片段集合,保存所述候选语音片段集合。
8.根据权利要求6所述的装置,其特征在于,所述语音分析模块,包括:
统计单元,用于统计所述目标语音片段集合中所述目标语音片段的数目,得到片段数目,统计所述目标语音片段集合对应的分析对象的数目,得到对象数目;
平均咳嗽次数计算单元,用于计算所述片段数目与所述对象数目之间的比值,得到所述分析对象的当前平均咳嗽次数;
咳嗽状态查询单元,用于从预设的标准平均咳嗽次数区间与标准咳嗽状态的对应关系中,查找根据所述当前平均咳嗽次数匹配的标准咳嗽状态,得到所述分析对象的当前咳嗽状态。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
CN201911304122.9A 2019-12-17 2019-12-17 处理语音数据的方法、装置、计算机设备和存储介质 Active CN111028862B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911304122.9A CN111028862B (zh) 2019-12-17 2019-12-17 处理语音数据的方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911304122.9A CN111028862B (zh) 2019-12-17 2019-12-17 处理语音数据的方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN111028862A true CN111028862A (zh) 2020-04-17
CN111028862B CN111028862B (zh) 2022-09-06

Family

ID=70209560

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911304122.9A Active CN111028862B (zh) 2019-12-17 2019-12-17 处理语音数据的方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN111028862B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113259343A (zh) * 2021-05-11 2021-08-13 河南垂天科技有限公司 一种基于边缘计算技术的5g白盒网关器件
CN113456055A (zh) * 2021-07-05 2021-10-01 自牧机器人(青岛)有限公司 一种基于人工智能的家禽呼吸道实时监测系统
CN113488071A (zh) * 2021-07-16 2021-10-08 河南牧原智能科技有限公司 一种猪只咳嗽识别方法、装置、设备及可读存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011141916A1 (en) * 2010-05-13 2011-11-17 Sensewiser Ltd. Contactless non-invasive analyzer of breathing sounds
CN106847293A (zh) * 2017-01-19 2017-06-13 内蒙古农业大学 设施养殖羊应激行为的声信号监测方法
CN106999143A (zh) * 2014-12-12 2017-08-01 皇家飞利浦有限公司 声学监测系统、监测方法和监测计算机程序
CN107094633A (zh) * 2017-05-25 2017-08-29 仁怀市泓熙养殖专业合作社 具有呼吸道疾病监测功能的猪舍
CN108806720A (zh) * 2017-05-05 2018-11-13 京东方科技集团股份有限公司 话筒、数据处理器、监测系统及监测方法
CN109009129A (zh) * 2018-08-20 2018-12-18 南京农业大学 基于声学分析的母猪呼吸系统疾病预警方法
CN109065023A (zh) * 2018-08-23 2018-12-21 广州势必可赢网络科技有限公司 一种语音鉴定方法、装置、设备及计算机可读存储介质
CN109243470A (zh) * 2018-08-16 2019-01-18 南京农业大学 基于音频技术的肉鸡咳嗽监测方法
CN109360584A (zh) * 2018-10-26 2019-02-19 平安科技(深圳)有限公司 基于深度学习的咳嗽监测方法及装置
CN109602421A (zh) * 2019-01-04 2019-04-12 平安科技(深圳)有限公司 健康监测方法、装置及计算机可读存储介质
CN110444230A (zh) * 2019-07-04 2019-11-12 南京农业大学 一种基于音频技术的肉鸡呼吸道疾病自动识别装置
US20190362727A1 (en) * 2017-01-18 2019-11-28 Dong Whan LEE Method for providing bidirectional communication service for different breeds of animals

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011141916A1 (en) * 2010-05-13 2011-11-17 Sensewiser Ltd. Contactless non-invasive analyzer of breathing sounds
CN106999143A (zh) * 2014-12-12 2017-08-01 皇家飞利浦有限公司 声学监测系统、监测方法和监测计算机程序
US20190362727A1 (en) * 2017-01-18 2019-11-28 Dong Whan LEE Method for providing bidirectional communication service for different breeds of animals
CN106847293A (zh) * 2017-01-19 2017-06-13 内蒙古农业大学 设施养殖羊应激行为的声信号监测方法
CN108806720A (zh) * 2017-05-05 2018-11-13 京东方科技集团股份有限公司 话筒、数据处理器、监测系统及监测方法
CN107094633A (zh) * 2017-05-25 2017-08-29 仁怀市泓熙养殖专业合作社 具有呼吸道疾病监测功能的猪舍
CN109243470A (zh) * 2018-08-16 2019-01-18 南京农业大学 基于音频技术的肉鸡咳嗽监测方法
CN109009129A (zh) * 2018-08-20 2018-12-18 南京农业大学 基于声学分析的母猪呼吸系统疾病预警方法
CN109065023A (zh) * 2018-08-23 2018-12-21 广州势必可赢网络科技有限公司 一种语音鉴定方法、装置、设备及计算机可读存储介质
CN109360584A (zh) * 2018-10-26 2019-02-19 平安科技(深圳)有限公司 基于深度学习的咳嗽监测方法及装置
CN109602421A (zh) * 2019-01-04 2019-04-12 平安科技(深圳)有限公司 健康监测方法、装置及计算机可读存储介质
CN110444230A (zh) * 2019-07-04 2019-11-12 南京农业大学 一种基于音频技术的肉鸡呼吸道疾病自动识别装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐亚妮: ""基于语音识别技术的母猪咳嗽检测系统研究与实现"", 《中国优秀硕士学位论文全文数据库农业科技辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113259343A (zh) * 2021-05-11 2021-08-13 河南垂天科技有限公司 一种基于边缘计算技术的5g白盒网关器件
CN113456055A (zh) * 2021-07-05 2021-10-01 自牧机器人(青岛)有限公司 一种基于人工智能的家禽呼吸道实时监测系统
CN113488071A (zh) * 2021-07-16 2021-10-08 河南牧原智能科技有限公司 一种猪只咳嗽识别方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN111028862B (zh) 2022-09-06

Similar Documents

Publication Publication Date Title
CN111028862B (zh) 处理语音数据的方法、装置、计算机设备和存储介质
Fairbrass et al. Biases of acoustic indices measuring biodiversity in urban areas
CN111177714A (zh) 异常行为检测方法、装置、计算机设备和存储介质
CN110600139A (zh) 一种基于gis的区域性人口传染病预警方法
CN115865649B (zh) 一种智能运维管理控制方法、系统和存储介质
Deng et al. Components of variation in female common cuckoo calls
CN110111815A (zh) 动物异常声音监控方法及装置、存储介质、电子设备
US20220183566A1 (en) Systems and methods for diurnal curve tracking and analysis
CN109522858A (zh) 植物疾病检测方法、装置及终端设备
WO2022119811A1 (en) Health monitoring system
CN111522859A (zh) 告警分析方法、装置、计算机设备和存储介质
CN114898737A (zh) 声学事件检测方法、装置、电子设备和存储介质
CN110751092B (zh) 基于物联网的农业监控方法及装置、存储介质及电子设备
CN113284606A (zh) 一种基于远程监测数据分析的居家养老智能管理方法、系统及计算机存储介质
CN115881260A (zh) 一种基于远程监测数据分析的居家养老智能管理方法
CN114334157A (zh) 一种脑卒中风险预测方法及装置
Pérez-Granados et al. Vocalisations of the Greater Rhea (Rhea americana): an allegedly silent ratite
CN108831554B (zh) 医疗信息处理方法及装置
CN111210910A (zh) 猪只疾病诊断方法及系统
Langford et al. Bio-logging reveals heritable patterns of natural behaviours in sheep
CN117271994B (zh) 一种用于老人关怀监护的门体检测方法及系统
CN116955456B (zh) 基于开源情报的舆论数据处理方法及系统
CN116055808B (zh) 基于直播间的审核处理方法、装置、设备及介质
US20230178070A1 (en) Characterization via homologizing disparate speech terminology
CN117594240A (zh) 健康建议生成方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 601, 6 / F, building 2, No. 18, Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant after: Jingdong Technology Information Technology Co.,Ltd.

Address before: 601, 6 / F, building 2, No. 18, Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant before: Jingdong Shuke Haiyi Information Technology Co.,Ltd.

Address after: 601, 6 / F, building 2, No. 18, Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant after: Jingdong Shuke Haiyi Information Technology Co.,Ltd.

Address before: 601, 6 / F, building 2, No. 18, Kechuang 11th Street, Beijing Economic and Technological Development Zone, Beijing 100176

Applicant before: BEIJING HAIYI TONGZHAN INFORMATION TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant