CN104537036B - 一种分析语言特征的方法及装置 - Google Patents
一种分析语言特征的方法及装置 Download PDFInfo
- Publication number
- CN104537036B CN104537036B CN201410810280.2A CN201410810280A CN104537036B CN 104537036 B CN104537036 B CN 104537036B CN 201410810280 A CN201410810280 A CN 201410810280A CN 104537036 B CN104537036 B CN 104537036B
- Authority
- CN
- China
- Prior art keywords
- subfile
- analysis
- physical attribute
- assay value
- carried out
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Abstract
本发明涉及计算机技术领域,公开了一种分析语言特征的方法及装置,在该方案中,确定待分析的音频文件的语言特征时,先将所述待分析的音频文件划分为至少一个子文件;针对所述至少一个子文件中的任意一子文件,对所述任意一子文件进行语义分析,得到第一分析值,所述第一分析值用于表征所述任意一子文件在语义维度的语言特征;根据所述第一分析值确定所述任意一子文件的语言特征,这样,避免了人工去判断音频文件的语言特征,提高了准确度和效率。
Description
技术领域
本发明涉及计算机技术领域,特别涉及一种分析语言特征的方法及装置。
背景技术
众所周知,语言暴力在社会生活中随处可见,近年来已经成为语言学界研究的热门话题。语言暴力指用不合逻辑和法律规范的语言风暴,从而以语言霸权的形式,孤立和剥夺他人的某种权利,对他人造成伤害。作为一种隐性暴力,它造成的伤害容易被人忽视或者遗忘。语言暴力通常是由强势的一方向弱势的一方发出的。例如:上级对下级,警察对百姓,医生对病人,教师对学生,家长对子女,教练对队员。
随着社会的文明度的提高,通过对音频文件分析出语言暴力,进而减少语言暴力显得尤为重要。但是,目前分析音频文件的方法是由分析人员人工进行分析的,人为因素较大,因此,分析音频文件的方法存在准确度较低、效率较差的缺陷。
发明内容
本发明实施例提供一种分析语言特征的方法及装置,用以解决现有技术中存在的准确度较低、效率较差的缺陷。
本发明实施例提供的具体技术方案如下:
第一方面,提供一种分析语言特征的方法,包括:
将所述待分析的音频文件划分为至少一个子文件;
针对所述至少一个子文件中的任意一子文件,对所述任意一子文件进行语义分析,得到第一分析值,所述第一分析值用于表征所述任意一子文件在语义维度的语言特征;
根据所述第一分析值确定所述任意一子文件的语言特征。
结合第一方面,在第一种可能的实现方式中,对所述任意一子文件进行语义分析之前,还包括:
获取预设语音特征信息;或者
获取指定音频文件,并从所述指定音频文件中获取指定语音特征信息;
对所述任意一子文件进行语义分析,具体包括:
将所述任意一子文件中与所述预设语音特征信息或者与所述指定语音特征信息对应的信息进行语义分析。
结合第一方面,以及第一方面的第一种可能的实现方式,在第二种可能的实现方式中,将所述待分析的音频文件划分为至少一个子文件,具体包括:
将所述待分析的音频文件中对应的对话主题为同一个对话主题的对话作为一个子文件;和/或
将所述待分析的音频文件中对应的对话间隔小于或者等于预设间隔的任意两段对话作为一个子文件。
结合第一方面,以及第一方面的第一至第二种可能的实现方式,在第三种可能的实现方式中,根据所述第一分析值确定所述任意一子文件的语言特征之前,还包括:
对所述任意一子文件进行语音分析,得到第二分析值,所述第二分析值用于表征所述任意一子文件在语音维度的语言特征;
根据所述第一分析值确定所述任意一子文件的语言特征,具体包括:
计算所述第一分析值与第一预设权重值的第一乘积,及所述第二分析值与第二预设权重值的第二乘积;
根据所述第一乘积和所述第二乘积之和确定所述任意一子文件的语言特征。
结合第一方面的第一至第三种可能的实现方式,在第四种可能的实现方式中,对所述任意一子文件进行语音分析,具体包括:
对所述任意一子文件进行非物理属性分析,获得非物理属性信息;和/或
对所述任意一子文件进行物理属性分析,获得物理属性信息。
结合第一方面的第一至第三种或者第四种可能的实现方式,在第五种可能的实现方式中,对所述任意一子文件进行语音分析之前,还包括:
对所述任意一子文件进行场景识别,确定场景类型;
对所述任意一子文件进行语义分析,具体包括:
根据确定的场景类型对所述任意一子文件进行语义分析;
对所述任意一子文件进行语音分析,具体包括:
根据确定的场景类型对所述任意一子文件进行语音分析。
结合第一方面的第五种可能的实现方式,在第六种可能的实现方式中,计算所述第一分析值与第一预设权重值的第一乘积,及所述第二分析值与第二预设权重值的第二乘积之前,还包括:
根据确定的场景类型调整所述第一预设权重值和所述第二预设权重值。
结合第一方面,以及第一方面的第一至第二种,或者第五种可能的实现方式,在第七种可能的实现方式中,对所述任意一子文件进行语义分析,得到第一分析值之前,还包括:
对所述任意一子文件进行物理属性分析,获得物理属性信息;
对所述任意一子文件进行语义分析,得到第一分析值之后,还包括:
根据所述物理属性信息对所述第一分析值进行调整。
结合第一方面的第七种可能的实现方式,在第八种可能的实现方式中,根据所述物理属性信息对所述第一分析值进行调整之前,还包括:
对所述任意一子文件进行场景识别,确定场景类型;
根据所述物理属性信息对所述第一分析值进行调整,具体包括:
根据确定的场景类型、所述物理属性信息对所述第一分析值进行调整。
结合第一方面,以及第一方面的第一至第二种,或者第五种可能的实现方式,在第九种可能的实现方式中,对所述任意一子文件进行语义分析,得到第一分析值之前,还包括:
对所述任意一子文件进行非物理属性分析,获得非物理属性信息;
对所述任意一子文件进行语义分析,得到第一分析值之后,还包括:
根据所述非物理属性信息对得到第一分析值进行调整。
结合第一方面的第九种可能的实现方式,在第十种可能的实现方式中,根据所述非物理属性信息对得到第一分析值进行调整之前,还包括:
对所述任意一子文件进行场景识别,确定场景类型。
结合第一方面的第十种可能的实现方式,在第十一种可能的实现方式中,对所述任意一子文件进行非物理属性分析,获得非物理属性信息,具体包括:
根据确定的场景类型,对所述任意一子文件进行非物理属性分析,获得非物理属性信息。
结合第一方面的第十或者第十一种可能的实现方式,在第十二种可能的实现方式中,根据所述非物理属性信息对得到第一分析值进行调整,具体包括:
根据确定的场景类型、所述非物理属性信息对得到第一分析值进行调整。
结合第一方面,以及第一方面的第一至第二种,或者第五种可能的实现方式,在第十三种可能的实现方式中,对所述任意一子文件进行语义分析,得到第一分析值之前,还包括:
对所述任意一子文件进行物理属性分析,获得物理属性信息;
对所述任意一子文件进行非物理属性分析,获得非物理属性信息;
对所述任意一子文件进行语义分析,得到第一分析值之后,还包括:
根据所述物理属性信息、所述非物理属性信息对所述第一分析值进行调整。
结合第一方面的第十三种可能的实现方式,在第十四种可能的实现方式中,根据所述物理属性信息、所述非物理属性信息对所述第一分析值进行调整之前,还包括:
对所述任意一子文件进行场景识别,确定场景类型。
结合第一方面的第十四种可能的实现方式,在第十五种可能的实现方式中,对所述任意一子文件进行非物理属性分析,获得非物理属性信息,具体包括:
根据确定的场景类型,对所述任意一子文件进行非物理属性分析,获得非物理属性信息。
结合第一方面的第十四或者十五种可能的实现方式,在第十六种可能的实现方式中,根据所述物理属性信息、所述非物理属性信息对所述第一分析值进行调整,具体包括:
根据确定的场景类型、所述物理属性信息、所述非物理属性信息对所述第一分析值进行调整。
结合第一方面,以及第一方面的第一至第十六种,或者第十七种可能的实现方式,根据所述第一分析值确定所述任意一子文件的语言特征,具体包括:
判断所述第一分析值是否达到指定语言特征所对应的预设门限值,若是,确定所述任意一子文件具有所述指定语言特征;否则,确定所述任意一子文件未具有所述指定语言特征;或者
确定所述第一分析值所属的取值范围;并
确定所述任意一子文件具有所述取值范围对应的语言特征。
结合第一方面的第三至第六种可能的实现方式,在第十八种可能的实现方式中根据所述第一乘积和所述第二乘积之和确定所述任意一子文件的语言特征,具体包括:
判断所述第一乘积和所述第二乘积之和是否达到指定语言特征所对应的预设门限值,若是,确定所述任意一子文件具有所述指定语言特征;否则,确定所述任意一子文件未具有所述指定语言特征;或者
确定所述第一乘积和所述第二乘积之和所属的取值范围;并
确定所述任意一子文件具有所述取值范围对应的语言特征。
第二方面,提供一种分析语言特征的装置,包括:
划分单元,用于将所述待分析的音频文件划分为至少一个子文件;
第一分析单元,用于针对所述至少一个子文件中的任意一子文件,对所述任意一子文件进行语义分析,得到第一分析值,所述第一分析值用于表征所述任意一子文件在语义维度的语言特征;
确定单元,用于根据所述第一分析值确定所述任意一子文件的语言特征。
结合第二方面,在第一种可能的实现方式中,还包括第一获取单元,用于获取预设语音特征信息;或者,获取指定音频文件,并从所述指定音频文件中获取指定语音特征信息;
所述第一分析单元在对所述任意一子文件进行语义分析时,具体为:
将所述任意一子文件中与所述预设语音特征信息或者与所述指定语音特征信息对应的信息进行语义分析。
结合第二方面,以及第二方面的第一种可能的实现方式,在第二种可能的实现方式中,所述划分单元具体用于:
将所述待分析的音频文件中对应的对话主题为同一个对话主题的对话作为一个子文件;和/或
将所述待分析的音频文件中对应的对话间隔小于或者等于预设间隔的任意两段对话作为一个子文件。
结合第二方面,以及第二方面的第一至第二种可能的实现方式,在第三种可能的实现方式中,还包括第二分析单元,用于:
对所述任意一子文件进行语音分析,得到第二分析值,所述第二分析值用于表征所述任意一子文件在语音维度的语言特征;
所述确定单元在根据所述第一分析值确定所述任意一子文件的语言特征时,具体为:
计算所述第一分析值与第一预设权重值的第一乘积,及所述第二分析值与第二预设权重值的第二乘积;
根据所述第一乘积和所述第二乘积之和确定所述任意一子文件的语言特征。
结合第二方面的第一至第三种可能的实现方式,在第四种可能的实现方式中,所述第二分析单元在对所述任意一子文件进行语音分析时,具体为:
对所述任意一子文件进行非物理属性分析,获得非物理属性信息;和/或
对所述任意一子文件进行物理属性分析,获得物理属性信息。
结合第二方面的第一至第三种或者第四种可能的实现方式,在第五种可能的实现方式中,所述确定单元还用于:
对所述任意一子文件进行场景识别,确定场景类型;
所述第一分析单元具体用于:
根据确定的场景类型对所述任意一子文件进行语义分析;
所述第二分析单元具体用于:
根据确定的场景类型对所述任意一子文件进行语音分析。
结合第二方面的第五种可能的实现方式,在第六种可能的实现方式中,还包括第一调整单元,用于:
根据确定的场景类型调整所述第一预设权重值和所述第二预设权重值。
结合第二方面,以及第二方面的第一至第二种,或者第五种可能的实现方式,在第七种可能的实现方式中,还包括第二获取单元,用于:
对所述任意一子文件进行物理属性分析,获得物理属性信息;
还包括第二调整单元,用于:
根据所述物理属性信息对所述第一分析值进行调整。
结合第二方面的第五种可能的实现方式,在第八种可能的实现方式中,所述确定单元还用于:
对所述任意一子文件进行场景识别,确定场景类型;
所述第二调整单元在根据所述物理属性信息对所述第一分析值进行调整时,具体为:
根据确定的场景类型、所述物理属性信息对所述第一分析值进行调整。
结合第二方面,以及第二方面的第一至第二种,或者第五种可能的实现方式,在第九种可能的实现方式中,还包括第三获取单元,用于:
对所述任意一子文件进行非物理属性分析,获得非物理属性信息;
还包括第三调整单元,用于:
根据所述非物理属性信息对得到第一分析值进行调整。
结合第二方面的第九种可能的实现方式,在第十种可能的实现方式中,所述确定单元还用于:
对所述任意一子文件进行场景识别,确定场景类型。
结合第二方面的第十种可能的实现方式,在第十一种可能的实现方式中,所述第三获取单元对所述任意一子文件进行非物理属性分析,获得非物理属性信息时,具体为:
根据确定的场景类型,对所述任意一子文件进行非物理属性分析,获得非物理属性信息。
结合第二方面的第十或者第十一种可能的实现方式,在第十二种可能的实现方式中,所述第三调整单元根据所述非物理属性信息对得到第一分析值进行调整时,具体为:
根据确定的场景类型、所述非物理属性信息对得到第一分析值进行调整。
结合第二方面,以及第二方面的第一至第二种,或者第五种可能的实现方式,在第十三种可能的实现方式中,还包括第四获取单元,用于:
对所述任意一子文件进行物理属性分析,获得物理属性信息;
对所述任意一子文件进行非物理属性分析,获得非物理属性信息;
还包括第四调整单元,用于:
根据所述物理属性信息、所述非物理属性信息对所述第一分析值进行调整。
结合第二方面的第十三种可能的实现方式,在第十四种可能的实现方式中,所述确定单元还用于:
对所述任意一子文件进行场景识别,确定场景类型。
结合第二方面的第十四种可能的实现方式,在第十五种可能的实现方式中,所述第四获取单元对所述任意一子文件进行非物理属性分析,获得非物理属性信息时,具体为:
根据确定的场景类型,对所述任意一子文件进行非物理属性分析,获得非物理属性信息。
结合第二方面的第十四或者十五种可能的实现方式,在第十六种可能的实现方式中,所述第四调整单元根据所述物理属性信息、所述非物理属性信息对所述第一分析值进行调整时,具体为:
根据确定的场景类型、所述物理属性信息、所述非物理属性信息对所述第一分析值进行调整。
结合第二方面,以及第二方面的第一至第十六种,在第十七种可能的实现方式中,所述确定单元根据所述第一分析值确定所述任意一子文件的语言特征时,具体为:
判断所述第一分析值是否达到指定语言特征所对应的预设门限值,若是,确定所述任意一子文件具有所述指定语言特征;否则,确定所述任意一子文件未具有所述指定语言特征;或者
确定所述第一分析值所属的取值范围;并
确定所述任意一子文件具有所述取值范围对应的语言特征。
结合第二方面的第三至第六种可能的实现方式,在第十八种可能的实现方式中,所述确定单元根据所述第一乘积和所述第二乘积之和确定所述任意一子文件的语言特征时,具体为:
判断所述第一乘积和所述第二乘积之和是否达到指定语言特征所对应的预设门限值,若是,确定所述任意一子文件具有所述指定语言特征;否则,确定所述任意一子文件未具有所述指定语言特征;或者
确定所述第一乘积和所述第二乘积之和所属的取值范围;并确定所述任意一子文件具有所述取值范围对应的语言特征。
本发明有益效果如下:
现有技术中,都是人为判断音频文件的语音特征,本发明实施例中,确定待分析的音频文件的语言特征时,先将所述待分析的音频文件划分为至少一个子文件;针对所述至少一个子文件中的任意一子文件,对所述任意一子文件进行语义分析,得到第一分析值,所述第一分析值用于表征所述任意一子文件在语义维度的语言特征;根据所述第一分析值确定所述任意一子文件的语言特征,这样,避免了人工去判断音频文件的语言特征,提高了准确度和效率。
附图说明
图1为本发明实施例中分析语言特征的流程图;
图2为本发明实施例中分析语言特征的第一实施例;
图3为本发明实施例中分析语言特征的第二实施例;
图4为本发明实施例中分析语言特征的装置的第一结构图;
图5为本发明实施例中分析语言特征的装置的第二结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
另外,本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字母“/”,一般表示前后关联对象是一种“或”的关系。
下面结合说明书附图对本发明优选的实施方式进行详细说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明,并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
下面结合附图对本发明优选的实施方式进行详细说明。
参阅图1所示,本发明实施例中,分析语言特征的一种流程如下:
步骤100:将待分析的音频文件划分为至少一个子文件;
步骤110:针对至少一个子文件中的任意一子文件,对任意一子文件进行语义分析,得到第一分析值,第一分析值用于表征任意一子文件在语义维度的语言特征;
步骤120:根据第一分析值确定任意一子文件的语言特征。
本发明实施例中,划分得到的子文件的形式有多种,例如,可以为音频文件,或者,也可以为文本文件,其中,在进行语音分析时,子文件为音频文件,在进行语义分析时,子文件为文本文件。本发明实施例中,如果子文件为文本文件时,采用ASR(Automatic SpeechRecognition,自动语音识别)技术将音频文件转换为文本文件,当然,也可以采用其他技术,在此不再进行一一详述。
本发明实施例中,进一步的,一般在ASR转换时需要记录待转换的子音频文件和转换得到的文本的对应关系,以便在结果中反馈该文本对应的语音点。
本发明实施例中,对任意一子文件进行语义分析之前,还包括如下操作:
获取预设语音特征信息,例如,可以为成人和小孩的语音特征信息,或者,也可以为男人和女人的语音特征信息。
上述是将明确指定要分析的子文件中的信息是与成人和小孩的语音特征对应的信息,或者是与男人和女人的语音特征对应的信息,当然,在实际应用中,也可以是将一段指定的音频文件中的语音特征对应的信息,那么,此时,可以获取指定音频文件,并从指定音频文件中获取指定语音特征信息。
那么,在对任意一子文件进行语义分析时,可选的,可以采用如下方式:
将任意一子文件中与预设语音特征信息或者与指定语音特征信息对应的信息进行语义分析,这里不是说只对此部分进行语义分析,其他部分也可能作为上下文参与语义分析,只不过需要得出语言特征结果的部分只针对与预设语言特征信息或者指定语言特征信息对应的部分。
本发明实施中,获取预设语音特征信息或者指定语音特征信息后,可以对待分析的音频文件中相应的部分进行标注,标注为待确定语言特征的部分。
本发明实施例中,将待分析的音频文件划分为至少一个子文件的方式有多种,可选的,可以采用如下方式:
将待分析的音频文件中对应的对话主题为同一个对话主题的对话作为一个子文件。
例如,音频文件中有三段老板和员工的对话,有两段员工和员工的对话,其中,第一段对话、第二段对话、第三段对话都是针对项目进度的报告,第四段对话和第五段对话是关于午餐订餐的内容,那么,此时,前三段对话作为一个子文件,第四段对话和第五段对话作为另一个子文件。
或者,也可以采用如下方式,将待分析的音频文件中对应的对话间隔小于或者等于预设间隔的任意两段对话作为一个子文件。
例如,音频文件中有三段老板和员工的对话,有两段员工和员工的对话,其中,第一段对话、第二段对话、第三段对话都是针对项目进度的报告,虽然,这三段对话的主题是一个主题,但是,由于第一段对话与第二段对话之间的间隔为3小时,第二段对话和第三段对话的间隔为15分钟,第三段对话和第一段对话的间隔为3小时15分钟,且预设间隔为1小时,则第一段对话和第二段对话作为一个子文件,第三段对话作为一个子文件。
本发明实施例中,对任意一子文件进行语义分析时,可选的,可以采用如下方式:
采用NLP(Natural Language Processing,自然语言处理技术)对任意一子文件进行语义分析。
步骤100-步骤120是讲从语义方面来确定子文件的语言特征。在实际应用中,也可以结合语音方面来确定子文件的语言特征,因此,根据第一分析值确定任意一子文件的语言特征之前,还包括如下操作:
对任意一子文件进行语音分析,得到第二分析值,第二分析值用于表征任意一子文件在语音维度的语言特征;
此时,根据第一分析值确定任意一子文件的语言特征时,可选的,可以采用如下方式:
计算第一分析值与第一预设权重值的第一乘积,及第二分析值与第二预设权重值的第二乘积;
根据第一乘积和第二乘积之和确定任意一子文件的语言特征。
本发明实施例中,对任意一子文件进行语音分析时,可选的,可以采用如下方式:
对任意一子文件进行非物理属性分析,获得非物理属性信息;和/或
对任意一子文件进行物理属性分析,获得物理属性信息。
本发明实施例中,在对任意一子文件进行非物理属性分析时,可选的,可以采用如下方式:
对任意一子文件进行语调分析和/或情绪分析。
在对任意一子文件进行物理属性分析时,可选的,可以采用如下方式:
对任意一子文件进行音量分析和/或语音语速分析。
在实际应用中,同一物理属性信息或者同一非物理属性信息在不同场景下得到的分析值是不同的,例如:同样的音量在室外可能正常,在室内可能就靠近愤怒、不礼貌的负面结果,因此,音量比较大时,在室外场景下得到的第二分析值和在室内场景下得到的第二分析值是不同的。因此,本发明实施例中,对任意一子文件进行语音分析之前,还包括如下操作:
对任意一子文件进行场景识别,确定场景类型。
那么,在对任意一子文件进行语义分析时,可选的,可以根据确定的场景类型对任意一子文件进行语义分析,在对任意一子文件进行语音分析时,可选的,根据确定的场景类型对任意一子文件进行语音分析。
也就是说,语义分析时可以参考场景类型,或者语音分析时也可以参考场景类型。
本发明实施例中,可选的,喇叭声对应室外场景,广播体操对应学校场景。
上述讲述的是场景类型对语音分析和语义分析时的影响,在本发明实施例中,如果根据第一分析值和第二分析值共同来确定子文件的语言特征的话,第一预设权重值和第二预设权重值在不同场景下是不同的。例如,在室外场景下,第一预设权重值是70%,第二预设权重值是30%,在室内场景下,第一预设权重值是50%,第二预设权重值是50%。
因此,本发明实施例中,计算第一分析值与第一预设权重值的第一乘积,及第二分析值与第二预设权重值的第二乘积之前,还包括如下操作:
根据确定的场景类型调整第一预设权重值和第二预设权重值。
前面讲述的是子文件从语义方面分析得到第一分析值,从语音方面分析得到第二分析值,然后,再综合第一分析值和第二分析值确定子文件的语言特征,本发明实施例中,也可以是在从语义方面得到第一分析值时参考语音方面的分析,因此,本发明实施例中,对任意一子文件进行语义分析,得到第一分析值之前,还包括如下操作:
对任意一子文件进行物理属性分析,获得物理属性信息;
此时,在对任意一子文件进行语义分析,得到第一分析值之后,还包括如下操作:
根据物理属性信息对第一分析值进行调整。
本发明实施例中,进行调整的第一分析值可以是根据确定的场景类型得到的,也可以是没有参考确定的场景类型得到的。本发明实施例中,进一步的,根据物理属性信息对第一分析值进行调整之前,还包括如下操作:
对任意一子文件进行场景识别,确定场景类型;
此时,根据物理属性信息对第一分析值进行调整时,可选的,可以采用如下方式:
根据确定的场景类型、物理属性信息对第一分析值进行调整。
同理,对任意一子文件进行语义分析,得到第一分析值之前,还包括如下操作:
对任意一子文件进行非物理属性分析,获得非物理属性信息;
此时,可选的,对任意一子文件进行语义分析,得到第一分析值之后,还包括如下操作:
根据非物理属性信息对得到第一分析值进行调整。
本发明实施例中,根据非物理属性信息对得到第一分析值进行调整之前,还包括如下操作:
对任意一子文件进行场景识别,确定场景类型。
可选的,对任意一子文件进行非物理属性分析,获得非物理属性信息时,可以采用如下方式:
根据确定的场景类型,对任意一子文件进行非物理属性分析,获得非物理属性信息。
那么,在根据非物理属性信息对得到第一分析值进行调整时,可选的,可以采用如下方式:
根据确定的场景类型、非物理属性信息对得到第一分析值进行调整。
其中,得到的第一分析值可以是参考确定的场景类型确定的,也可以是未参考确定的场景类型确定的。
上述讲述的是根据物理属性信息对第一分析值进行调整,或者是根据非物理属性信息对第一分析值进行调整,本发明实施例中,也可以是根据物理属性信息、非物理属性信息来对第一分析值进行调整,具体在实现时,可以采用如下方式:对任意一子文件进行语义分析,得到第一分析值之前,还包括如下操作:
对任意一子文件进行物理属性分析,获得物理属性信息;
对任意一子文件进行非物理属性分析,获得非物理属性信息;
此时,对任意一子文件进行语义分析,得到第一分析值之后,还包括如下操作:
根据物理属性信息、非物理属性信息对第一分析值进行调整。
本发明实施例中,根据物理属性信息、非物理属性信息对第一分析值进行调整之前,还包括如下操作:
对任意一子文件进行场景识别,确定场景类型。
此时,对任意一子文件进行非物理属性分析,获得非物理属性信息时,可选的,可以采用如下方式:
根据确定的场景类型,对任意一子文件进行非物理属性分析,获得非物理属性信息。
此时,可选的,根据物理属性信息、非物理属性信息对第一分析值进行调整时,可选的,可以采用如下方式:
根据确定的场景类型、物理属性信息、非物理属性信息对第一分析值进行调整。
本发明实施例中,根据第一分析值确定任意一子文件的语言特征时,可选的,可以采用如下方式:
判断第一分析值是否达到指定语言特征所对应的预设门限值,若是,确定任意一子文件具有指定语言特征;否则,确定任意一子文件未具有指定语言特征;或者
确定第一分析值所属的取值范围;并
确定任意一子文件具有取值范围对应的语言特征。
同理,若根据第一乘积和第二乘积之和来确定任意一子文件的语言特征的话,根据第一乘积和第二乘积之和确定任意一子文件的语言特征时,可以采用如下方式:
判断第一乘积和第二乘积之和是否达到指定语言特征所对应的预设门限值,若是,确定任意一子文件具有指定语言特征;否则,确定任意一子文件未具有指定语言特征;或者
确定第一乘积和第二乘积之和所属的取值范围;并
确定任意一子文件具有取值范围对应的语言特征。
本发明实施例中,可选的,语言特征为如下几种形式中的一种或者任意组合:粗鲁语言特征、礼貌语言特征、平常语言特征。
如图2所示,为了更好地理解本发明实施例,以下给出具体应用场景,针对分析老师跟学生的对话是否有语言暴力的过程,做出进一步详细描述,A为终端,B为分析语言特征的服务器:
步骤200:A进行录音,得到音频文件,并将得到的音频文件发送至B;
步骤210:A将预设语言特征信息发送至B,其中,预设语言特征信息为老师和学生的语音特征信息;
步骤220:B将接收到的音频文件划分为两个子音频文件:子音频文件1和子音频文件2;
该实施例中,针对子音频文件1和子音频文件2的操作过程是相同的,以下以对子音频文件1的执行过程为例进行说明。
步骤230:B确定场景类型为室外,并根据室外这种场景类型对子音频文件1中与预设语音特征信息对应的信息进行语音分析,得到第二分析值;
步骤240:B将子音频文件1采用ASR技术转换为文本1,并根据室外这种场景类型采用NLP技术对文件1中与预设语音特征信息对应的信息进行语义分析,得到第一分析值;
步骤250:B根据室外这种场景类型将第一预设权重值设置为70%,将第二预设权重值设置为30%;
步骤260:计算第一分析值和70%的第一乘积,第二分析值和30%的第二乘积;
步骤270:B判断第一乘积和第二乘积之和是否达到暴力语言特征对应的预设门限值,若是,则确定子音频文件1具有暴力语言特征,否则,确定子音频文件1未具有暴力语言特征。
上述实施例中,音频文件和预设的语言特征信息是分两个步骤来执行的,在实际应用中,也可以是一个步骤来执行,其他过程类似,在此不再进行一一详述。
如图3所示,为了更好地理解本发明实施例,以下给出具体应用场景,针对分析成人跟小孩的对话的语言特征的过程,做出进一步详细描述,A为终端,B为分析语言特征的服务器:
步骤300:A进行录音,得到音频文件,并将得到的音频文件发送至B,及指定音频文件发送至B;
步骤310:B将接收到的音频文件划分为两个子音频文件:子音频文件1和子音频文件2,并从接收到的指定音频文件中获取指定语音特征信息;
该实施例中,针对子音频文件1和子音频文件2的操作过程是相同的,以下以对子音频文件1的执行过程为例进行说明。
步骤320:B将子音频文件1采用ASR技术转换为文本1,并根据室外这种场景类型采用NLP技术对文本1中与预设语音特征信息对应的信息进行语义分析,得到第一分析值;
步骤330:B对子音频文件1进行物理属性分析,获得物理属性信息,对子音频文件1进行非物理属性分析,获得非物理属性信息;
步骤340:B确定场景类型,并根据确定的场景类型、物理属性信息、非物理属性信息对第一分析值进行调整;
步骤350:B确定调整得到的第一分析值所属的取值范围是属于礼貌语言特征对应的取值范围的话,因此确定子音频文件1具有礼貌语言特征。
基于上述相应方法的技术方案,参阅图4所示,本发明实施例提供一种分析语言特征的装置,该装置包括划分单元40、第一分析单元41和确定单元42,其中:
划分单元40,用于将待分析的音频文件划分为至少一个子文件;
第一分析单元41,用于针对至少一个子文件中的任意一子文件,对任意一子文件进行语义分析,得到第一分析值,第一分析值用于表征任意一子文件在语义维度的语言特征;
确定单元42,用于根据第一分析值确定任意一子文件的语言特征。
本发明实施例中,进一步的,还包括第一获取单元,用于获取预设语音特征信息;或者,获取指定音频文件,并从指定音频文件中获取指定语音特征信息;
第一分析单元41在对任意一子文件进行语义分析时,具体为:
将任意一子文件中与预设语音特征信息或者与指定语音特征信息对应的信息进行语义分析。
本发明实施例中,可选的,划分单元40具体用于:
将待分析的音频文件中对应的对话主题为同一个对话主题的对话作为一个子文件;和/或
将待分析的音频文件中对应的对话间隔小于或者等于预设间隔的任意两段对话作为一个子文件。
本发明实施例中,进一步的,还包括第二分析单元,用于:
对任意一子文件进行语音分析,得到第二分析值,第二分析值用于表征任意一子文件在语音维度的语言特征;
确定单元42在根据第一分析值确定任意一子文件的语言特征时,具体为:
计算第一分析值与第一预设权重值的第一乘积,及第二分析值与第二预设权重值的第二乘积;
根据第一乘积和第二乘积之和确定任意一子文件的语言特征。
本发明实施例中,可选的,第二分析单元在对任意一子文件进行语音分析时,具体为:
对任意一子文件进行非物理属性分析,获得非物理属性信息;和/或
对任意一子文件进行物理属性分析,获得物理属性信息。
本发明实施例中,进一步的,确定单元42还用于:
对任意一子文件进行场景识别,确定场景类型。
本发明实施例中,可选的,第一分析单元具体用于:
根据确定的场景类型对任意一子文件进行语义分析。
本发明实施例中,可选的,第二分析单元具体用于:
根据确定的场景类型对任意一子文件进行语音分析。
本发明实施例中,进一步的,还包括第一调整单元,用于:
根据确定的场景类型调整第一预设权重值和第二预设权重值。
本发明实施例中,可选的,还包括第二获取单元,用于:
对任意一子文件进行物理属性分析,获得物理属性信息;
还包括第二调整单元,用于:
根据物理属性信息对第一分析值进行调整。
本发明实施例中,进一步的,确定单元42还用于:
对任意一子文件进行场景识别,确定场景类型;
第二调整单元在根据物理属性信息对第一分析值进行调整时,具体为:
根据确定的场景类型、物理属性信息对第一分析值进行调整。
本发明实施例中,进一步的,还包括第三获取单元,用于:
对任意一子文件进行非物理属性分析,获得非物理属性信息;
还包括第三调整单元,用于:
根据非物理属性信息对得到第一分析值进行调整。
本发明实施例中,进一步的,确定单元42还用于:
对任意一子文件进行场景识别,确定场景类型。
本发明实施例中,具体的,第三获取单元对任意一子文件进行非物理属性分析,获得非物理属性信息时,具体为:
根据确定的场景类型,对任意一子文件进行非物理属性分析,获得非物理属性信息。
本发明实施例中,可选的,第三调整单元根据非物理属性信息对得到第一分析值进行调整时,具体为:
根据确定的场景类型、非物理属性信息对得到第一分析值进行调整。
本发明实施例中,进一步的,还包括第四获取单元,用于:
对任意一子文件进行物理属性分析,获得物理属性信息;
对任意一子文件进行非物理属性分析,获得非物理属性信息;
还包括第四调整单元,用于:
根据物理属性信息、非物理属性信息对第一分析值进行调整。
本发明实施例中,进一步的,确定单元42还用于:
对任意一子文件进行场景识别,确定场景类型。
本发明实施例中,可选的,第四获取单元对任意一子文件进行非物理属性分析,获得非物理属性信息时,具体为:
根据确定的场景类型,对任意一子文件进行非物理属性分析,获得非物理属性信息。
本发明实施例中,可选的,第四调整单元根据物理属性信息、非物理属性信息对第一分析值进行调整时,具体为:
根据确定的场景类型、物理属性信息、非物理属性信息对第一分析值进行调整。
本发明实施例中,进一步的,确定单元42根据第一分析值确定任意一子文件的语言特征时,具体为:
判断第一分析值是否达到指定语言特征所对应的预设门限值,若是,确定任意一子文件具有指定语言特征;否则,确定任意一子文件未具有指定语言特征;或者
确定第一分析值所属的取值范围;并
确定任意一子文件具有取值范围对应的语言特征。
本发明实施例中,进一步的,确定单元42根据第一乘积和第二乘积之和确定任意一子文件的语言特征时,具体为:
判断第一乘积和第二乘积之和是否达到指定语言特征所对应的预设门限值,若是,确定任意一子文件具有指定语言特征;否则,确定任意一子文件未具有指定语言特征;或者
确定第一乘积和第二乘积之和所属的取值范围;并
确定任意一子文件具有取值范围对应的语言特征。
如图5所示,为本发明实施例提供的分析语言特征的另一种结构示意图,包括至少一个处理器501,通信总线502,存储器503以及至少一个通信接口504。
其中,通信总线502用于实现上述组件之间的连接并通信,通信接口504用于与外部设备连接并通信。
其中,存储器503用于存储有可执行的程序代码,处理器501通过执行这些程序代码,以用于:
将待分析的音频文件划分为至少一个子文件;
针对至少一个子文件中的任意一子文件,对任意一子文件进行语义分析,得到第一分析值,第一分析值用于表征任意一子文件在语义维度的语言特征;
根据第一分析值确定任意一子文件的语言特征。
综上所述,本发明实施例中,确定待分析的音频文件的语言特征时,先将所述待分析的音频文件划分为至少一个子文件;针对所述至少一个子文件中的任意一子文件,对所述任意一子文件进行语义分析,得到第一分析值,所述第一分析值用于表征所述任意一子文件在语义维度的语言特征;根据所述第一分析值确定所述任意一子文件的语言特征,这样,避免了人工去判断音频文件的语音特征,提高了准确度和效率,尤其在语义分析基础上综合语音分析、综合场景更能较大提升准确度。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (20)
1.一种分析语言特征的方法,其特征在于,包括:
将待分析的音频文件划分为至少一个子文件;
针对所述至少一个子文件中的任意一子文件,对所述任意一子文件进行语义分析,得到第一分析值,所述第一分析值用于表征所述任意一子文件在语义维度的语言特征;
对所述任意一子文件进行语音分析,得到第二分析值,所述第二分析值用于表征所述任意一子文件在语音维度的语言特征;
计算所述第一分析值与第一预设权重值的第一乘积,及所述第二分析值与第二预设权重值的第二乘积;
根据所述第一乘积和所述第二乘积之和确定所述任意一子文件的语言特征。
2.如权利要求1所述的方法,其特征在于,对所述任意一子文件进行语义分析之前,还包括:
获取预设语音特征信息;或者
获取指定音频文件,并从所述指定音频文件中获取指定语音特征信息;
对所述任意一子文件进行语义分析,具体包括:
将所述任意一子文件中与所述预设语音特征信息或者与所述指定语音特征信息对应的信息进行语义分析。
3.如权利要求1或2所述的方法,其特征在于,将所述待分析的音频文件划分为至少一个子文件,具体包括:
将所述待分析的音频文件中对应的对话主题为同一个对话主题的对话作为一个子文件;和/或
将所述待分析的音频文件中对应的对话间隔小于或者等于预设间隔的任意两段对话作为一个子文件。
4.如权利要求1所述的方法,其特征在于,对所述任意一子文件进行语音分析,具体包括:
对所述任意一子文件进行非物理属性分析,获得非物理属性信息;和/或
对所述任意一子文件进行物理属性分析,获得物理属性信息。
5.如权利要求1所述的方法,其特征在于,对所述任意一子文件进行语音分析之前,还包括:
对所述任意一子文件进行场景识别,确定场景类型;
对所述任意一子文件进行语义分析,具体包括:
根据确定的场景类型对所述任意一子文件进行语义分析;
对所述任意一子文件进行语音分析,具体包括:
根据确定的场景类型对所述任意一子文件进行语音分析。
6.如权利要求1所述的方法,其特征在于,对所述任意一子文件进行语义分析,得到第一分析值之前,还包括:
对所述任意一子文件进行物理属性分析,获得物理属性信息;
对所述任意一子文件进行语义分析,得到第一分析值之后,还包括:
根据所述物理属性信息对所述第一分析值进行调整。
7.如权利要求1所述的方法,其特征在于,对所述任意一子文件进行语义分析,得到第一分析值之前,还包括:
对所述任意一子文件进行物理属性分析,获得非物理属性;
对所述任意一子文件进行语义分析,得到第一分析值之后,还包括:
根据所述非物理属性对所述第一分析值进行调整。
8.如权利要求1所述的方法,其特征在于,对所述任意一子文件进行语义分析,得到第一分析值之前,还包括:
对所述任意一子文件进行物理属性分析,获得物理属性信息、非物理属性;
对所述任意一子文件进行语义分析,得到第一分析值之后,还包括:
根据所述物理属性信息、所述非物理属性对所述第一分析值进行调整。
9.如权利要求1所述的方法,其特征在于,根据所述第一分析值确定所述任意一子文件的语言特征,具体包括:
判断所述第一分析值是否达到指定语言特征所对应的预设门限值,若是,确定所述任意一子文件具有所述指定语言特征;否则,确定所述任意一子文件未具有所述指定语言特征;或者
确定所述第一分析值所属的取值范围;并
确定所述任意一子文件具有所述取值范围对应的语言特征。
10.如权利要求1所述的方法,其特征在于,根据所述第一乘积和所述第二乘积之和确定所述任意一子文件的语言特征,具体包括:
判断所述第一乘积和所述第二乘积之和是否达到指定语言特征所对应的预设门限值,若是,确定所述任意一子文件具有所述指定语言特征;否则,确定所述任意一子文件未具有所述指定语言特征;或者
确定所述第一乘积和所述第二乘积之和所属的取值范围;并
确定所述任意一子文件具有所述取值范围对应的语言特征。
11.一种分析语言特征的装置,其特征在于,包括:
划分单元,用于将待分析的音频文件划分为至少一个子文件;
第一分析单元,用于针对所述至少一个子文件中的任意一子文件,对所述任意一子文件进行语义分析,得到第一分析值,所述第一分析值用于表征所述任意一子文件在语义维度的语言特征;
第二分析单元,用于对所述任意一子文件进行语音分析,得到第二分析值,所述第二分析值用于表征所述任意一子文件在语音维度的语言特征;
确定单元,用于计算所述第一分析值与第一预设权重值的第一乘积,及所述第二分析值与第二预设权重值的第二乘积;
根据所述第一乘积和所述第二乘积之和确定所述任意一子文件的语言特征。
12.如权利要求11所述的装置,其特征在于,还包括第一获取单元,用于获取预设语音特征信息;或者,获取指定音频文件,并从所述指定音频文件中获取指定语音特征信息;
所述第一分析单元在对所述任意一子文件进行语义分析时,具体为:
将所述任意一子文件中与所述预设语音特征信息或者与所述指定语音特征信息对应的信息进行语义分析。
13.如权利要求11或12所述的装置,其特征在于,所述划分单元具体用于:
将所述待分析的音频文件中对应的对话主题为同一个对话主题的对话作为一个子文件;和/或
将所述待分析的音频文件中对应的对话间隔小于或者等于预设间隔的任意两段对话作为一个子文件。
14.如权利要求11所述的装置,其特征在于,所述第二分析单元在对所述任意一子文件进行语音分析时,具体为:
对所述任意一子文件进行非物理属性分析,获得非物理属性信息;和/或
对所述任意一子文件进行物理属性分析,获得物理属性信息。
15.如权利要求11所述的装置,其特征在于,所述确定单元还用于:
对所述任意一子文件进行场景识别,确定场景类型;
所述第一分析单元具体用于:
根据确定的场景类型对所述任意一子文件进行语义分析;
所述第二分析单元具体用于:
根据确定的场景类型对所述任意一子文件进行语音分析。
16.如权利要求11所述的装置,其特征在于,还包括第二获取单元,用于:
对所述任意一子文件进行物理属性分析,获得物理属性信息;
还包括第二调整单元,用于:
根据所述物理属性信息对所述第一分析值进行调整。
17.如权利要求11所述的装置,其特征在于,还包括第三获取单元,用于:
对所述任意一子文件进行非物理属性分析,获得非物理属性信息;
还包括第三调整单元,用于:
根据所述非物理属性信息对得到第一分析值进行调整。
18.如权利要求11所述的装置,其特征在于,还包括第四获取单元,用于:
对所述任意一子文件进行物理属性分析,获得物理属性信息;
对所述任意一子文件进行非物理属性分析,获得非物理属性信息;
还包括第四调整单元,用于:
根据所述物理属性信息、所述非物理属性信息对所述第一分析值进行调整。
19.如权利要求11所述的装置,其特征在于,所述确定单元根据所述第一分析值确定所述任意一子文件的语言特征时,具体为:
判断所述第一分析值是否达到指定语言特征所对应的预设门限值,若是,确定所述任意一子文件具有所述指定语言特征;否则,确定所述任意一子文件未具有所述指定语言特征;或者
确定所述第一分析值所属的取值范围;并
确定所述任意一子文件具有所述取值范围对应的语言特征。
20.如权利要求11所述的装置,其特征在于,所述确定单元根据所述第一乘积和所述第二乘积之和确定所述任意一子文件的语言特征时,具体为:
判断所述第一乘积和所述第二乘积之和是否达到指定语言特征所对应的预设门限值,若是,确定所述任意一子文件具有所述指定语言特征;否则,确定所述任意一子文件未具有所述指定语言特征;或者
确定所述第一乘积和所述第二乘积之和所属的取值范围;并
确定所述任意一子文件具有所述取值范围对应的语言特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410810280.2A CN104537036B (zh) | 2014-12-23 | 2014-12-23 | 一种分析语言特征的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410810280.2A CN104537036B (zh) | 2014-12-23 | 2014-12-23 | 一种分析语言特征的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104537036A CN104537036A (zh) | 2015-04-22 |
CN104537036B true CN104537036B (zh) | 2018-11-13 |
Family
ID=52852564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410810280.2A Active CN104537036B (zh) | 2014-12-23 | 2014-12-23 | 一种分析语言特征的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104537036B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3364868B1 (en) * | 2015-10-23 | 2021-05-19 | Siemens Medical Solutions USA, Inc. | Generating natural language representations of mental content from functional brain images |
CN107885747B (zh) * | 2016-09-29 | 2022-06-28 | 西门子公司 | 一种语义关系生成方法和设备 |
CN106504773B (zh) * | 2016-11-08 | 2023-08-01 | 上海贝生医疗设备有限公司 | 一种可穿戴装置及语音与活动监测系统 |
CN108399919A (zh) * | 2017-02-06 | 2018-08-14 | 中兴通讯股份有限公司 | 一种语义识别方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1588537A (zh) * | 2004-09-29 | 2005-03-02 | 上海交通大学 | 建立基于语法模型的语义分析器的方法 |
CN101030368A (zh) * | 2006-03-03 | 2007-09-05 | 国际商业机器公司 | 在保持情感的同时跨通道进行通信的方法和系统 |
CN101477798A (zh) * | 2009-02-17 | 2009-07-08 | 北京邮电大学 | 一种分析和提取设定场景的音频数据的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010049596A1 (en) * | 2000-05-30 | 2001-12-06 | Adam Lavine | Text to animation process |
-
2014
- 2014-12-23 CN CN201410810280.2A patent/CN104537036B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1588537A (zh) * | 2004-09-29 | 2005-03-02 | 上海交通大学 | 建立基于语法模型的语义分析器的方法 |
CN101030368A (zh) * | 2006-03-03 | 2007-09-05 | 国际商业机器公司 | 在保持情感的同时跨通道进行通信的方法和系统 |
CN101477798A (zh) * | 2009-02-17 | 2009-07-08 | 北京邮电大学 | 一种分析和提取设定场景的音频数据的方法 |
Non-Patent Citations (1)
Title |
---|
《面向情感的电影背景音乐分类方法》;张宝印 等;《计算机科学》;20131231;第40卷(第12期);第38-40页 * |
Also Published As
Publication number | Publication date |
---|---|
CN104537036A (zh) | 2015-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11455985B2 (en) | Information processing apparatus | |
Costantini et al. | EMOVO corpus: an Italian emotional speech database | |
US9070369B2 (en) | Real time generation of audio content summaries | |
Yin et al. | Speech-based cognitive load monitoring system | |
Eyben et al. | Affect recognition in real-life acoustic conditions-a new perspective on feature selection | |
CN109147765A (zh) | 音频质量综合评测方法及系统 | |
CN104537036B (zh) | 一种分析语言特征的方法及装置 | |
CN105334743A (zh) | 一种基于情感识别的智能家居控制方法及其系统 | |
US20210390973A1 (en) | Method and system for speech emotion recognition | |
US20160124909A1 (en) | Computerized tool for creating variable length presentations | |
CN105096941A (zh) | 语音识别方法以及装置 | |
CN107564531A (zh) | 基于声纹特征的会议记录方法、装置及计算机设备 | |
CN102930866A (zh) | 一种用于口语练习的学生朗读作业的评判方法 | |
US9934426B2 (en) | System and method for inspecting emotion recognition capability using multisensory information, and system and method for training emotion recognition using multisensory information | |
CN108922521A (zh) | 一种语音关键词检索方法、装置、设备及存储介质 | |
CN110853621B (zh) | 语音顺滑方法、装置、电子设备及计算机存储介质 | |
JP2015219480A (ja) | 対話状況特徴計算装置、文末記号推定装置、これらの方法及びプログラム | |
CN107767881A (zh) | 一种语音信息的满意度的获取方法和装置 | |
Priva et al. | Distinct behaviors in convergence across measures. | |
US11699043B2 (en) | Determination of transcription accuracy | |
US9805740B2 (en) | Language analysis based on word-selection, and language analysis apparatus | |
Fagel et al. | Analysis of the perceptual qualities of Dutch speakers' voice and pronunciation | |
Eyben et al. | Towards a standard set of acoustic features for the processing of emotion in speech. | |
Yap et al. | Glottal features for speech-based cognitive load classification | |
Loukina et al. | Pronunciation accuracy and intelligibility of non-native speech |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |