CN108804069B - 音量调节方法及装置、存储介质、电子设备 - Google Patents

音量调节方法及装置、存储介质、电子设备 Download PDF

Info

Publication number
CN108804069B
CN108804069B CN201810513231.0A CN201810513231A CN108804069B CN 108804069 B CN108804069 B CN 108804069B CN 201810513231 A CN201810513231 A CN 201810513231A CN 108804069 B CN108804069 B CN 108804069B
Authority
CN
China
Prior art keywords
volume
sample
value
threshold value
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810513231.0A
Other languages
English (en)
Other versions
CN108804069A (zh
Inventor
王海坤
王智国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201810513231.0A priority Critical patent/CN108804069B/zh
Publication of CN108804069A publication Critical patent/CN108804069A/zh
Application granted granted Critical
Publication of CN108804069B publication Critical patent/CN108804069B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)

Abstract

本公开提供一种音量调节方法及装置、存储介质、电子设备。该方法包括:获取当前用户的当前音量值;利用所述当前音量值与智能设备的预设音量门限值相比较,确定所述当前音量值对应的音量类型;将所述智能设备的输出音量调整为所述音量类型对应的预设反馈音量。如此方案,既可使智能设备的输出音量与用户说话的音量相匹配,又可使输出音量与当前环境相匹配,有助于提高音量调节的效果。

Description

音量调节方法及装置、存储介质、电子设备
技术领域
本公开涉及智能控制技术领域,具体地,涉及一种音量调节方法及装置、存储介质、电子设备。
背景技术
随着智能技术的不断发展,智能设备在日常生活中得以普及,例如,手机、手表、手环等可穿戴式设备,智能音箱、智能电视等智能家居产品,车载语音交互系统、翻译机等等。随着设备智能化程度的不断提高,大多智能设备均具备语音交互功能。
为了提高用户体验,可以结合实际使用需求,自动调节语音交互过程中设备的输出音量。例如,在用户接听来电时,可以通过MIC记录用户说话的声音大小,通过听筒记录另一端传来的声音大小,当二者的音量差值大于预设值时,可以自动调节另一端传来的声音的音量值,即调节扬声器输出音量的大小,使听筒的音量与用户的音量相匹配。
发明内容
本公开的主要目的是提供一种音量调节方法及装置、存储介质、电子设备,有助于提高音量调节的效果。
为了实现上述目的,本公开提供一种音量调节方法,所述方法包括:
获取当前用户的当前音量值;
利用所述当前音量值与智能设备的预设音量门限值相比较,确定所述当前音量值对应的音量类型;
将所述智能设备的输出音量调整为所述音量类型对应的预设反馈音量。
可选地,确定所述智能设备的预设音量门限值的方式为:
根据预先采集的不同音量类型下的样本音量值,确定出用于区分所述音量类型的预设音量门限值,所述样本音量值为针对样本用户采集的通用样本音量值,或者,所述样本音量值为针对所述当前用户采集的个性化样本音量值。
可选地,所述根据预先采集的不同音量类型下的样本音量值,确定出用于区分所述音量类型的预设音量门限值,包括:
根据所述不同音量类型下的样本音量值,统计各音量类型下的音量分布情况;根据所述音量分布情况,确定出相邻音量类型之间的交点;将所述交点确定为区分所述相邻音量类型的预设音量门限值;
或者,
对所述不同音量类型下的样本音量值进行聚类处理,得到至少两个类,每个类对应一个音量类型;利用相邻音量类型对应的类的类中心,确定出区分所述相邻音量类型的预设音量门限值。
可选地,所述根据所述不同音量类型下的样本音量值,统计各音量类型下的音量分布情况,包括:
利用当前音量类型下的最大样本音量值和最小样本音量值,划分出N个音量区间,N≥1;
统计各音量区间对应的样本音量值的数目,得到所述当前音量类型下的音量分布情况。
可选地,确定所述智能设备的预设音量门限值的方式为:
根据样本用户在不同音量类型下的通用样本音量值,确定出用于区分所述音量类型的初始音量门限值;
根据所述当前用户在不同音量类型下的个性化样本音量值,更新所述初始音量门限值,得到所述预设音量门限值。
可选地,所述根据所述当前用户在不同音量类型下的个性化样本音量值,更新所述初始音量门限值,得到所述预设音量门限值,包括:
利用当前音量类型下的个性化样本音量值替换所述当前音量类型下的通用样本音量值,得到新的样本音量值;
利用所述新的样本音量值中的最大样本音量值和最小样本音量值,划分出M个音量区间,M≥2;
统计各音量区间对应的新的样本音量值的数目;
利用各音量区间对应的新的样本音量值的数目,确定出满足预设条件的待用音量区间;
利用所述待用音量区间对应的音量值大小,确定出预设音量门限值。
本公开提供一种音量调节装置,所述装置包括:
当前音量值获取模块,用于获取当前用户的当前音量值;
音量类型确定模块,用于利用所述当前音量值与智能设备的预设音量门限值相比较,确定所述当前音量值对应的音量类型;
输出音量调整模块,用于将所述智能设备的输出音量调整为所述音量类型对应的预设反馈音量。
可选地,所述装置还包括:
预设音量门限值确定模块,用于根据预先采集的不同音量类型下的样本音量值,确定出用于区分所述音量类型的预设音量门限值,所述样本音量值为针对样本用户采集的通用样本音量值,或者,所述样本音量值为针对所述当前用户采集的个性化样本音量值。
可选地,所述预设音量门限值确定模块包括:音量分布情况统计模块,用于根据所述不同音量类型下的样本音量值,统计各音量类型下的音量分布情况;预设音量门限值确定子模块,用于根据所述音量分布情况,确定出相邻音量类型之间的交点;将所述交点确定为区分所述相邻音量类型的预设音量门限值;
或者,
所述预设音量门限值确定模块,用于对所述不同音量类型下的样本音量值进行聚类处理,得到至少两个类,每个类对应一个音量类型;利用相邻音量类型对应的类的类中心,确定出区分所述相邻音量类型的预设音量门限值。
可选地,所述音量分布情况统计模块,用于利用当前音量类型下的最大样本音量值和最小样本音量值,划分出N个音量区间,N≥1;统计各音量区间对应的样本音量值的数目,得到所述当前音量类型下的音量分布情况。
可选地,所述装置还包括:
初始音量门限值确定模块,用于根据样本用户在不同音量类型下的通用样本音量值,确定出用于区分所述音量类型的初始音量门限值;
初始音量门限值更新模块,用于根据所述当前用户在不同音量类型下的个性化样本音量值,更新所述初始音量门限值,得到所述预设音量门限值。
可选地,所述初始音量门限值更新模块,用于利用当前音量类型下的个性化样本音量值替换所述当前音量类型下的通用样本音量值,得到新的样本音量值;利用所述新的样本音量值中的最大样本音量值和最小样本音量值,划分出M个音量区间,M≥2;统计各音量区间对应的新的样本音量值的数目;利用各音量区间对应的新的样本音量值的数目,确定出满足预设条件的待用音量区间;利用所述待用音量区间对应的音量值大小,确定出预设音量门限值。
本公开提供一种存储介质,其中存储有多条指令,所述指令由处理器加载,执行上述音量调节方法的步骤。
本公开提供一种电子设备,所述电子设备包括;
上述的存储介质;以及
处理器,用于执行所述存储介质中的指令。
本公开方案中,可以先确定出与当前音量值相匹配的音量类型,即初步实现用户说话的音量与音量类型之间的匹配;与此同时,为了尽量消除用户说话音量的个体差异对音量调节的影响,本公开方案还可以预先设置各音量类型对应的反馈音量,进而将智能设备的输出音量自动调节为音量类型对应的反馈音量。如此,既可使智能设备的输出音量与用户说话的音量相匹配,又可使输出音量与当前环境相匹配,有助于提高音量调节的效果。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1为本公开方案音量调节方法的流程示意图;
图2为本公开方案中3种音量类型的音量分布情况示意图;
图3为本公开方案中更新初始音量门限值的流程示意图;
图4为本公开方案中新的样本音量值对应的直方图的示意图;
图5为本公开方案音量调节装置的构成示意图;
图6为本公开方案用于音量调节的电子设备的结构示意图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
在介绍本公开方案之前,先对本公开方案的应用场景进行解释说明。
通常,对于智能设备来说,其输出的音量与用户说话的音量相匹配,往往是最适合用户的。例如,在安静环境下,用户说话的音量减小,对应的希望智能设备可以自动降低输出音量,使之与用户当前的说话音量相匹配;反之,在嘈杂环境下,用户说话的音量增大,则希望智能设备的输出音量可以随之调大,同样可与用户当前的说话音量相匹配。
发明人在研发过程中发现,由于不同用户的说话音量存在个体差异,使得现有的音量调节方案的调节效果较差,可能无法达到预期效果。举例来说,对于说话声音大的用户来说,即使在小音量情况下,其说话音量可能也会比说话声音小的用户要大,故,对于说话声音大的用户来说,现有的音量调节方案很难调小智能设备的输出音量;反之,对于说话声音小的用户来说,则很难调大智能设备的输出音量。这就导致虽然智能设备的输出音量与用户说话音量相匹配,但却不适用于当前环境,例如,在嘈杂的卖场使用翻译机,对于说话声音小的用户来说,即使其提高音量与翻译机进行语音交互,但与之匹配的输出音量仍可能偏小,致使对方在嘈杂环境下无法听清楚翻译机播放的内容。
针对于此,本公开提供一种新的音量调节方案,用以提高音量调节效果。
参见图1,示出了本公开音量调节方法的流程示意图。可以包括以下步骤:
S101,获取当前用户的当前音量值。
作为一种示例,可以在当前用户与智能设备进行语音交互时,由智能设备的麦克风拾取用户说话时的当前音量值。举例来说,当前音量值可以体现为分贝值或者能量值。本公开方案对获取当前音量值的方式、当前音量值的具体表现形式等可不做限定,具体可参照相关技术。
S102,利用所述当前音量值与智能设备的预设音量门限值相比较,确定所述当前音量值对应的音量类型。
在实际应用过程中,可以通过预设音量门限值来区分不同的音量类型。举例来说,音量类型可以包括小音量、大音量,故可以通过1个预设音量门限值加以区分;或者,音量类型可以包括小音量、中音量、大音量,故可以通过低门限值、高门限值这2个预设音量门限值加以区分。本公开方案对音量类型的表现形式、音量类型的数量、预设音量门限值的数量等可不做限定,具体可结合实际应用需求确定。
获得当前音量值后,可以利用当前音量值与预设音量门限值相比较,确定出当前音量值对应的音量类型。以高、低门限值为例,如果当前音量值低于低门限值,则可判定音量类型为小音量;如果当前音量值高于高门限值,则可判定音量类型为大音量;如果当前音量值高于低门限值、且低于高门限值,则可判定音量类型为中音量。
作为一种示例,可以根据需求人为设置智能设备的预设音量门限值;或者,可以按照以下方式设置智能设备的预设音量门限值。
方式一,可以根据预先采集的不同音量类型下的样本音量值,确定出用于区分所述音量类型的预设音量门限值。
举例来说,样本音量值可以为针对当前用户采集的个性化样本音量值。基于此可以确定出当前用户个性化的预设音量门限值,有助于提高本公开方案的音量调节效果。
举例来说,样本音量值可以为针对样本用户采集的通用样本音量值。如此,在个性化样本音量值的样本量不足时,基于通用样本音量值可以确定出通用的预设音量门限值,有助于确保本公开方案可以及时发挥作用。作为一种示例,为了保证通用样本音量值的多样性,样本用户可以尽量覆盖男女性别、不同年龄段等,具体可结合实际应用需求选择样本用户。
本方式中,通过样本音量值确定预设音量门限值的过程可以体现为:
1.根据所述不同音量类型下的样本音量值,统计各音量类型下的音量分布情况;根据所述音量分布情况,确定出相邻音量类型之间的交点;将所述交点确定为区分所述相邻音量类型的预设音量门限值。
具体地,可以先分析各音量类型下样本音量值的音量分布情况,并据此确定出相邻音量类型之间的交点,进而得到区分相邻音量类型的预设音量门限值。作为一种示例,可以按照以下方式分析音量分布情况:首先,利用当前音量类型下的最大样本音量值和最小样本音量值,划分出N个音量区间,N≥1;其次,统计各音量区间对应的样本音量值的数目,得到所述当前音量类型下的音量分布情况。
以当前音量类型为小音量为例,可以对小音量对应的所有样本音量值进行排序,确定出小音量对应的最小样本音量值Emin、最大样本音量值Emax;然后结合预设区间数目N进行音量区间划分,例如,各音量区间的粒度可以为Gap=(Emax-Emin)/N;最后遍历小音量对应的所有样本音量值,找到每个样本音量值所属的音量区间,统计各音量区间的样本音量值的数目,得到小音量的音量分布情况。其中,N的取值可以由实际应用需求确定,例如,N=10,通常,N的取值越大,音量区间的粒度越小,确定出的预设音量门限值越精准,本公开方案对N的取值可不做具体限定。
按照以上方式,还可以统计得到其他音量类型的音量分布情况,如图2所示,可以得到小音量、中音量、大音量的音量分布情况示意图。
由图2可知,相邻音量类型之间通常会存在部分交集,本公开方案可以从中确定出一个交点,将交点对应的音量值确定为相邻音量类型之间的预设音量门限值。举例来说,可以随机从交集中选择一个音量值作为交点;或者,可以将交集的中值确定为交点;或者,可以先确定出相邻音量类型中音量差最小的两个音量值,再将两个音量值中的任一个或者将二者的均值,确定为交点。本公开方案对确定交点的方式可不做具体限定。
综上,图2所示示例可以确定出低门限值、高门限值这2个预设音量门限值,用于区分小音量、中音量、大音量。
可以理解地,相邻音量类型可以是音量值相近的音量类型。例如,与小音量对应的音量值相比,大音量对应的音量值与中音量对应的音量值更接近,故可以将中音量、大音量确定为相邻音量类型。同理,小音量、中音量亦可确定为相邻音量类型。
2.对所述不同音量类型下的样本音量值进行聚类处理,得到至少两个类,每个类对应一个音量类型;利用相邻音量类型对应的类的类中心,确定出区分所述相邻音量类型的预设音量门限值。
具体地,可以通过聚类处理,将所有的样本音量值归并到至少两个类中,可以理解地,一个类对应一个音量类型。以小音量、中音量、大音量3个音量类型为例,可以聚类得到3个类,如此,便可基于小音量对应的类的类中心、中音量对应的类的类中心,确定出区分二者的低门限值;基于中音量对应的类的类中心、大音量对应的类的类中心,确定出区分二者的高门限值。举例来说,可以计算两个类中心的均值,将其确定为预设音量门限值,本公开方案对此可不做具体限定。此外,聚类处理采用的算法、实现过程等可参照相关技术实现,此处不做详述。
方式二,可以根据样本用户在不同音量类型下的通用样本音量值,确定出用于区分所述音量类型的初始音量门限值;根据所述当前用户在不同音量类型下的个性化样本音量值,更新所述初始音量门限值,得到所述预设音量门限值。
在实际应用过程中,可以先基于通用样本音量值确定出通用的预设音量门限值,即初始音量门限值,确保本公开方案可以及时发挥作用;同时,为了提高本公开方案的音量调节效果,还可以在使用过程中,不断采集当前用户的个性化样本音量值,并基于此进行门限值更新,最终得到更适合于当前用户的个性化的预设音量门限值。
基于通用样本音量值确定初始音量门限值的过程等,可以参照上文所做介绍,此处不再详述。
作为一种示例,本公开方案还提供一种利用个性化样本音量值更新初始音量门限值的方案,具体可参见图3所示示意图,可以包括以下步骤:
S201,利用当前音量类型下的个性化样本音量值替换所述当前音量类型下的通用样本音量值,得到新的样本音量值。
在当前用户的使用过程中,智能设备可以采集当前用户的个性化样本音量值,可以理解地,这些个性化样本音量值可能对应于同一个音量类型,也可能对应于不同音量类型,具体与当前用户的实际使用情况相关。
获得个性化样本音量值后,可以利用其替换掉属于同一音量类型下的通用样本音量值,例如,采集到小音量对应的个性化样本音量值后,可以用这些样本替换掉小音量对应的通用样本音量值,得到新的样本音量值。
S202,利用所述新的样本音量值中的最大样本音量值和最小样本音量值,划分出M个音量区间,M≥2。
S203,统计各音量区间对应的新的样本音量值的数目。
举例来说,可以对所有新的样本音量值进行排序,确定出其中的最小样本音量值E′min、最大样本音量值E′max;然后结合预定区间数目M进行音量区间划分,例如,各音量区间的粒度可以为Gap′=(E′max-E′min)/M;最后遍历所有新的样本音量值,找到每个新的样本音量值所属的音量区间,统计各音量区间对应的新的样本音量值的数目,得到图4所示直方图。其中,M的取值可以由实际应用需求确定,例如,M=10,通常,M的取值越大,音量区间的粒度越小,更新得到的预设音量门限值越精准,本公开方案对M的取值可不做具体限定。
S204,利用各音量区间对应的新的样本音量值的数目,确定出满足预设条件的待用音量区间。
S205,利用所述待用音量区间对应的音量值大小,确定出预设音量门限值。
本公开方案中,可以根据预设条件从所有音量区间中,确定出待用音量区间,再根据待用音量区间对应的音量值,确定出预设音量门限值。
举例来说,预设条件可以是满足要求的新的样本音量值的数目不小于预设值;或者,满足要求的新的样本音量值的数目、新的样本音量值的总数量之间的比值不小于预设比例。可以理解地,预设值可以是人为设置的固定值;或者,可以是根据新的样本音量值的总数量、以及预设比例计算出的可变值,本公开方案对此可不做具体限定。
以利用预设比例确定低门限值、高门限值为例,可以做如下设置:将音量值最低的15%的新的样本音量值,确定为小音量;将音量值最高的15%的新的样本音量值,确定为大音量。
本公开方案中,新的样本音量值的总数量K,可以体现为以下公式:
Figure BDA0001673196510000111
其中,Ti表示第i个音量区间对应的新的样本音量值的数目。
在确定低门限值时,可以按照音量值由低到高,即从第1个音量区间开始统计新的样本音量值的数目,直至达到总数量K的15%为止。也就是说,满足要求的新的样本音量值指的是,音量值最低的新的样本音量值。具体过程可以体现为以下公式:
Figure BDA0001673196510000112
根据以上公式,可以找到第一次满足R1>15%时的音量区间d1,即待用音量区间,d1对应的音量值范围为E′min+Gap′*(d1-1)~E′min+Gap′*d1,可以据此确定出低门限值。例如,可以将d1的上限E′min+Gap′*d1确定为低门限值;或者,可以随机从上述范围内选取一个音量值作为低门限值;或者,可以将第一次满足R1>15%时的音量值确定为低门限值,本公开方案对此可不做具体限定。
在确定高门限值时,可以按照音量值由低到高,即从第1个音量区间开始统计新的样本音量值的数目,直至达到总数量K的85%为止。对应的,满足要求的新的样本音量值指的是,音量值最低的新的样本音量值。具体过程可以体现为以下公式:
Figure BDA0001673196510000121
根据以上公式,可以找到第一次满足R2>85%时的音量区间d2,即待用音量区间,d2对应的音量值范围为E′min+Gap'*(d2-1)~E′min+Gap′*d2,可以据此确定出高门限值。例如,可以将d2的下限E′nin+Gap′*(d2-1)确定为高门限值;或者,可以随机从上述范围内选取一个音量值作为高门限值;或者,可以将第一次满足R2>85%时的音量值确定为高门限值,本公开方案对此可不做具体限定。
在实际应用过程中,满足要求的新的样本音量值还可以是音量值最高的新的样本音量值,如此,在计算高、低门限值时,根据需求确定对应预设比例即可,本公开方案对此可不做具体限定。
可以理解地,对于不同类型的智能设备来说,可能会采用不同型号的麦克风、数模转换器等录音元器件,也可能会使用不同的录音增益设置参数,为了确保本公开方案的音量调节效果,可以针对不同智能设备设置不同预设音量门限值,即,在确定某个智能设备的预设音量门限值时,可以由该智能设备采集样本音量值。
S103,将所述智能设备的输出音量调整为所述音量类型对应的预设反馈音量。
综上,通过S102可以确定出与当前音量值相匹配的音量类型,即初步实现了用户说话的音量与音量类型之间的匹配;与此同时,为了尽量消除用户说话音量的个体差异对音量调节的影响,本公开方案还可以预先设置各音量类型对应的反馈音量,如此,便可实现差异用户的归一化处理,即,不论是说话声音大的用户,还是说话声音小的用户,在被判定为同一音量类型时,智能设备可以将输出音量自动调节为相同的反馈音量。如此,对于说话声音大的用户来说,可以实现小音量输出;对于说话声音小的用户来说,则可实现大音量的输出。本公开的音量调节方案,既可使智能设备的输出音量与用户说话的音量相匹配,又可使输出音量与当前环境相匹配,有助于提高音量调节的效果。
本公开方案中,可以依赖外界环境、用户的听感舒适度等,设置各音量类型对应的预设反馈音量。例如,针对长期处于嘈杂环境中的用户来说,可以适当将各音量类型对应的预设反馈音量设置的偏大些;或者,针对声音比较敏感的用户来说,可以在满足用户听感舒适度的前提下,适当将各音量类型对应的预设反馈音量设置的偏小些。
在实际应用过程中,可以统计大量用户的使用需求,据此设置各音量类型对应的预设反馈音量;或者,当前用户在使用智能设备时,可以根据自身的使用需求,个性化的设置各音量类型对应的预设反馈音量。本公开方案对设置预设反馈音量的方式、预设反馈音量的具体取值等可不做限定,具体可结合实际应用需求确定。
参见图5,示出了本公开音量调节装置的构成示意图。所述装置可以包括:
当前音量值获取模块301,用于获取当前用户的当前音量值;
音量类型确定模块302,用于利用所述当前音量值与智能设备的预设音量门限值相比较,确定所述当前音量值对应的音量类型;
输出音量调整模块303,用于将所述智能设备的输出音量调整为所述音量类型对应的预设反馈音量。
可选地,所述装置还包括:
预设音量门限值确定模块,用于根据预先采集的不同音量类型下的样本音量值,确定出用于区分所述音量类型的预设音量门限值,所述样本音量值为针对样本用户采集的通用样本音量值,或者,所述样本音量值为针对所述当前用户采集的个性化样本音量值。
可选地,所述预设音量门限值确定模块包括:音量分布情况统计模块,用于根据所述不同音量类型下的样本音量值,统计各音量类型下的音量分布情况;预设音量门限值确定子模块,用于根据所述音量分布情况,确定出相邻音量类型之间的交点;将所述交点确定为区分所述相邻音量类型的预设音量门限值;
或者,
所述预设音量门限值确定模块,用于对所述不同音量类型下的样本音量值进行聚类处理,得到至少两个类,每个类对应一个音量类型;利用相邻音量类型对应的类的类中心,确定出区分所述相邻音量类型的预设音量门限值。
可选地,所述音量分布情况统计模块,用于利用当前音量类型下的最大样本音量值和最小样本音量值,划分出N个音量区间,N≥1;统计各音量区间对应的样本音量值的数目,得到所述当前音量类型下的音量分布情况。
可选地,所述装置还包括:
初始音量门限值确定模块,用于根据样本用户在不同音量类型下的通用样本音量值,确定出用于区分所述音量类型的初始音量门限值;
初始音量门限值更新模块,用于根据所述当前用户在不同音量类型下的个性化样本音量值,更新所述初始音量门限值,得到所述预设音量门限值。
可选地,所述初始音量门限值更新模块,用于利用当前音量类型下的个性化样本音量值替换所述当前音量类型下的通用样本音量值,得到新的样本音量值;利用所述新的样本音量值中的最大样本音量值和最小样本音量值,划分出M个音量区间,M≥2;统计各音量区间对应的新的样本音量值的数目;利用各音量区间对应的新的样本音量值的数目,确定出满足预设条件的待用音量区间;利用所述待用音量区间对应的音量值大小,确定出预设音量门限值。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
参见图6,示出了本公开用于音量调节的电子设备400的结构示意图。电子设备400至少可以包括处理器401和存储介质402,作为一种示例,处理器401和存储介质402可以通过总线或其它方式连接,图6所示以通过总线连接为例。处理器401的数量可以为一个或者多个,图6所示以一个处理器为例。存储介质402所代表的存储设备资源,用于存储可由处理器401执行的指令,例如应用程序。此外,处理器401可以被配置为加载存储介质中的指令,以执行上述音量调节方法。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。

Claims (14)

1.一种音量调节方法,其特征在于,所述方法包括:
获取当前用户的当前音量值;
利用所述当前音量值与智能设备的预设音量门限值相比较,确定所述当前音量值对应的音量类型;其中,所述预设音量门限值的确定方式包括:统计大量样本音量值在各音量类型下的分布情况,基于分步情况获得相邻音量类型间的样本交集,从样本交集中确定所述预设音量门限值;或者对大量样本音量值进行聚类,根据聚类得到的各类中心确定门限值;或者,统计利用当前用户的个性化样本更新后的样本音量值分布情况,基于更新后的分布情况及预设条件确定所述预设音量门限值;
将所述智能设备的输出音量调整为所述音量类型对应的预设反馈音量。
2.根据权利要求1所述的方法,其特征在于,
所述样本音量值包括针对样本用户采集的具体有多样性的通用样本音量值。
3.根据权利要求1所述的方法,其特征在于,所述对大量样本音量值进行聚类,根据聚类得到的各类中心确定门限值具体包括:
对不同音量类型下的所述样本音量值进行聚类处理,得到至少两个类,每个类对应一个音量类型;利用相邻音量类型对应的类的类中心,确定出区分所述相邻音量类型的预设音量门限值。
4.根据权利要求1所述的方法,其特征在于,根据不同音量类型下的所述样本音量值,统计各音量类型下的音量分布情况,包括:
利用当前音量类型下的最大样本音量值和最小样本音量值,划分出N个音量区间,N≥1;
统计各音量区间对应的样本音量值的数目,得到所述当前音量类型下的音量分布情况。
5.根据权利要求1所述的方法,其特征在于,所述基于更新后的分布情况及预设条件确定所述预设音量门限值具体包括:
根据样本用户在不同音量类型下的通用样本音量值,确定出用于区分所述音量类型的初始音量门限值;
根据所述当前用户在不同音量类型下的个性化样本音量值,更新所述初始音量门限值,得到所述预设音量门限值。
6.根据权利要求5所述的方法,其特征在于,所述根据所述当前用户在不同音量类型下的个性化样本音量值,更新所述初始音量门限值,得到所述预设音量门限值具体包括:
利用当前音量类型下的个性化样本音量值替换所述当前音量类型下的通用样本音量值,得到新的样本音量值;
利用所述新的样本音量值中的最大样本音量值和最小样本音量值,划分出M个音量区间,M≥2;
统计各音量区间对应的新的样本音量值的数目;
利用各音量区间对应的新的样本音量值的数目,确定出满足预设条件的待用音量区间;
利用所述待用音量区间对应的音量值大小,确定出预设音量门限值。
7.一种音量调节装置,其特征在于,所述装置包括:
当前音量值获取模块,用于获取当前用户的当前音量值;
音量类型确定模块,用于利用所述当前音量值与智能设备的预设音量门限值相比较,确定所述当前音量值对应的音量类型;其中,所述预设音量门限值的确定方式包括:统计大量样本音量值在各音量类型下的分布情况,基于分步情况获得相邻音量类型间的样本交集,从样本交集中确定所述预设音量门限值;或者对大量样本音量值进行聚类,根据聚类得到的各类中心确定门限值;或者,统计利用当前用户的个性化样本更新后的样本音量值分布情况,基于更新后的分布情况及预设条件确定所述预设音量门限值;
输出音量调整模块,用于将所述智能设备的输出音量调整为所述音量类型对应的预设反馈音量。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
预设音量门限值确定模块,用于根据预先采集的不同音量类型下的样本音量值,确定出用于区分所述音量类型的预设音量门限值,所述样本音量值为针对样本用户采集的通用样本音量值,或者,所述样本音量值为针对所述当前用户采集的个性化样本音量值。
9.根据权利要求8所述的装置,其特征在于,
所述预设音量门限值确定模块包括:音量分布情况统计模块,用于根据所述不同音量类型下的样本音量值,统计各音量类型下的音量分布情况;预设音量门限值确定子模块,用于根据所述音量分布情况,确定出相邻音量类型之间的交点;将所述交点确定为区分所述相邻音量类型的预设音量门限值;
或者,
所述预设音量门限值确定模块,用于对所述不同音量类型下的样本音量值进行聚类处理,得到至少两个类,每个类对应一个音量类型;利用相邻音量类型对应的类的类中心,确定出区分所述相邻音量类型的预设音量门限值。
10.根据权利要求9所述的装置,其特征在于,
所述音量分布情况统计模块,用于利用当前音量类型下的最大样本音量值和最小样本音量值,划分出N个音量区间,N≥1;统计各音量区间对应的样本音量值的数目,得到所述当前音量类型下的音量分布情况。
11.根据权利要求7所述的装置,其特征在于,所述装置还包括:
初始音量门限值确定模块,用于根据样本用户在不同音量类型下的通用样本音量值,确定出用于区分所述音量类型的初始音量门限值;
初始音量门限值更新模块,用于根据所述当前用户在不同音量类型下的个性化样本音量值,更新所述初始音量门限值,得到所述预设音量门限值。
12.根据权利要求11所述的装置,其特征在于,
所述初始音量门限值更新模块,用于利用当前音量类型下的个性化样本音量值替换所述当前音量类型下的通用样本音量值,得到新的样本音量值;利用所述新的样本音量值中的最大样本音量值和最小样本音量值,划分出M个音量区间,M≥2;统计各音量区间对应的新的样本音量值的数目;利用各音量区间对应的新的样本音量值的数目,确定出满足预设条件的待用音量区间;利用所述待用音量区间对应的音量值大小,确定出预设音量门限值。
13.一种存储介质,其中存储有多条指令,其特征在于,所述指令由处理器加载,执行权利要求1至6任一项所述方法的步骤。
14.一种电子设备,其特征在于,所述电子设备包括;
权利要求13所述的存储介质;以及
处理器,用于执行所述存储介质中的指令。
CN201810513231.0A 2018-05-25 2018-05-25 音量调节方法及装置、存储介质、电子设备 Active CN108804069B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810513231.0A CN108804069B (zh) 2018-05-25 2018-05-25 音量调节方法及装置、存储介质、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810513231.0A CN108804069B (zh) 2018-05-25 2018-05-25 音量调节方法及装置、存储介质、电子设备

Publications (2)

Publication Number Publication Date
CN108804069A CN108804069A (zh) 2018-11-13
CN108804069B true CN108804069B (zh) 2020-09-11

Family

ID=64091861

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810513231.0A Active CN108804069B (zh) 2018-05-25 2018-05-25 音量调节方法及装置、存储介质、电子设备

Country Status (1)

Country Link
CN (1) CN108804069B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110103867A (zh) * 2019-05-09 2019-08-09 贵安新区新特电动汽车工业有限公司 声音强度调整方法及装置
CN113495712A (zh) * 2020-03-20 2021-10-12 北京字节跳动网络技术有限公司 自动音量调整方法、装置、介质和设备
CN115052070A (zh) * 2022-06-24 2022-09-13 歌尔股份有限公司 一种调节通话音量的方法、装置、通话设备及介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103139351B (zh) * 2011-11-24 2016-10-05 联想(北京)有限公司 音量控制方法、装置及通信终端
CN103686339B (zh) * 2013-11-14 2018-02-02 乐视致新电子科技(天津)有限公司 一种自适应音量调节方法及装置
CN105025149B (zh) * 2015-07-20 2018-07-27 广东小天才科技有限公司 一种自动调节通话音量的方法及装置
US20180013870A1 (en) * 2016-07-07 2018-01-11 Hong Fu Jin Precision Industry (Shenzhen) Co., Ltd. Volume adjustment method and communication device using the same

Also Published As

Publication number Publication date
CN108804069A (zh) 2018-11-13

Similar Documents

Publication Publication Date Title
CN104954555B (zh) 一种音量调节方法及系统
RU2461081C2 (ru) Интеллектуальная градиентная система шумоподавления
EP3301675B1 (en) Parameter prediction device and parameter prediction method for acoustic signal processing
US10142483B2 (en) Technologies for dynamic audio communication adjustment
CN108804069B (zh) 音量调节方法及装置、存储介质、电子设备
CN109429147B (zh) 电子装置与电子装置的控制方法
WO2021012872A1 (zh) 一种编码参数调控方法、装置、设备及存储介质
KR20210020751A (ko) 복수의 소비자 장치에 개인화된 오디오 재생 기능을 제공하기 위한 시스템 및 방법
US20170195811A1 (en) Audio Monitoring and Adaptation Using Headset Microphones Inside User's Ear Canal
CN102185954A (zh) 视频通话中音频调整方法及终端设备
US9601128B2 (en) Communication apparatus and voice processing method therefor
CN110060696B (zh) 混音方法及装置、终端及可读存储介质
US10602275B2 (en) Audio enhancement via beamforming and multichannel filtering of an input audio signal
WO2017166495A1 (zh) 一种语音信号处理方法及装置
WO2022005701A1 (en) Audio anomaly detection in a speech signal
CN108806683A (zh) 一种基于智能音箱的路由器功率调节方法及系统
WO2021094528A1 (en) Devices and method for hearing device parameter configuration
CN112235462A (zh) 语音调节方法、系统、电子设备及计算机可读存储介质
CN107750038B (zh) 音量调节方法、装置、设备及存储介质
EP3274993A1 (en) An audio signal processing apparatus for processing an input earpiece audio signal upon the basis of a microphone audio signal
CN109716432B (zh) 增益处理方法及其装置、电子设备、信号采集方法及其系统
CN110168640A (zh) 用于增强信号中需要分量的装置和方法
CN113571086B (zh) 声音信号处理方法、装置、电子设备及可读存储介质
Harishkumar et al. Monaural speech separation system based on optimum soft mask
US11902745B2 (en) System of processing devices to perform an algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant