CN113711624A - 声音处理装置 - Google Patents

声音处理装置 Download PDF

Info

Publication number
CN113711624A
CN113711624A CN202080030000.XA CN202080030000A CN113711624A CN 113711624 A CN113711624 A CN 113711624A CN 202080030000 A CN202080030000 A CN 202080030000A CN 113711624 A CN113711624 A CN 113711624A
Authority
CN
China
Prior art keywords
time constant
output signal
amplification factor
sound
intensity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202080030000.XA
Other languages
English (en)
Other versions
CN113711624B (zh
Inventor
宫阪修二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Socionext Inc
Original Assignee
Socionext Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Socionext Inc filed Critical Socionext Inc
Publication of CN113711624A publication Critical patent/CN113711624A/zh
Application granted granted Critical
Publication of CN113711624B publication Critical patent/CN113711624B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/35Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using translation techniques
    • H04R25/353Frequency, e.g. frequency shift or compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/35Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using translation techniques
    • H04R25/356Amplitude, e.g. amplitude shift or compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/50Customised settings for obtaining desired overall acoustical characteristics
    • H04R25/502Customised settings for obtaining desired overall acoustical characteristics using analog signal processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Neurosurgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

声音处理装置(10)具备:预处理部(30),从来自第1麦克风(20)的第1电信号提取声音频带的信号,输出第1输出信号;第1控制部(50),生成第1放大系数,通过将第1放大系数与第1输出信号相乘,从而对第1输出信号的强度的动态范围进行压缩,并且以第1时间常数对第1放大系数进行平滑处理从而生成第1修正放大系数;以及第1乘法运算部(44),将第1修正放大系数与第1输出信号相乘,关于第1时间常数,在第1输出信号的强度增大的情况下,第1时间常数为第1上升时间常数,在第1输出信号的强度减小的情况下,第1时间常数为第1下降时间常数,第1上升时间常数为,听力低下者的听觉的时间分辨率以上、且小于使听力低下者引发重振现象的声音的持续时间。

Description

声音处理装置
技术领域
本公开涉及声音处理装置。
背景技术
为了使声音成为听力低下者容易听清的声音,已知的是需要考虑以下3个项目(例如,参考非专利文献1等)。
考虑项目1:不发出大声,以稍微大一点声音,清楚地说话。
考虑项目2:对日语的pa(パ)行、ta(タ)行、ka(カ)行以及sa(サ)行明确清楚地发音。
考虑项目3:对词语的开头(换言之词头),充分用力并说得长一点。
另一方面开发了一种技术,就是通过数字信号处理,将通常的声音转换为容易听清的声音的技术。
在专利文献1中,使用动态范围压缩技术,将小的声音变大,将过大的声音变小,从而提高听力低下者容易听清的程度。
在专利文献2中,检测子音部,并对其进行强调,从而提高听力低下者容易听清的程度。
(现有技术文献)
(专利文献)
专利文献1:日本专利第5149991号公报
专利文献2:日本专利第6284003号公报
非专利文献1:明治安田生命集团介护综合信息网站「MY介护广场」[online],[平成31年4月5日检索],因特网<URL:https://www.my-kaigo.com/pub/individual/chiebukuro/taiken/choukaku/0030.html>
非专利文献2:高木明,“听力低下者的频率选择性和时间分辨率”,耳鼻喉科展望,耳鼻喉科展望会,2002年12月15日,第45卷,第6号,p.460-468
专利文献1记载的技术与所述考虑项目1对应,另一方面起到违背所述考虑项目3的作用。下面叙述该理由。
以助听目的来适用动态范围压缩技术的情况下,会产生下述的限制条件。
首先,作为第1限制条件,必须使起始(Attack)的时间常数(ATT)减小。起始的时间常数是指,在有强度高的信号被输入时,针对用于降低该强度的衰减处理决定以怎样的陡峭程度来进行的常数,该时间常数的值越小则快速地进行衰减处理,值越大则缓慢地进行衰减处理。必须使这个值减小的理由是,为了防止听力低下者出现重振现象。重振现象是多见于听力低下者的现象,是对强度高的信号过度敏感地反应,听声音时比健康人听起来响度更大的现象。因此,对听力低下者进行助听处理时,需要对突发产生的大音量的声音快速进行衰减。因此,需要使起始的时间常数(ATT)减小。
接下来作为第2限制条件,必须使释放(Release)的时间常数(REL)增大。释放的时间常数是指,在有强度低的信号被输入时,针对用于提高该强度的放大处理决定以怎样的陡峭程度来进行的常数,该时间常数的值越小则快速地进行放大处理,值越大则缓慢地进行放大处理。下面说明为什么需要使该释放的时间常数增大的理由。
根据所述限制条件1,起始的时间常数的值小,当时间常数小的情况下,音量的控制会陡峭,所以对于频繁地发生音量的变动的信号,会产生处理后的声音不自然地抖动的现象。为了抑制这样的音量的不自然的抖动,有必要将释放的时间常数,设为比起始的时间常数长很多。
关于根据所述限制条件1以及限制条件2所决定的助听处理的时间常数的例子,使用图14进行说明。图14是表示以往的助听处理的时间常数的例子的图。在图14中,作为以往的助听处理中的时间常数的例子,示出了使用市面销售的助听器时的时间常数的例子。在以往的助听处理中,起始的时间常数ATT和释放的时间常数REL,例如成为图14表示的值,起始的时间常数ATT比释放的时间常数REL小,大约少一位数字或者两位数字。
这样在以助听为目的的动态范围压缩中,对声音急剧变大的词头部分陡峭地进行抑制,所以从上述考虑项目3的观点上,起到难以听清的作用。此外,因为需要使释放的时间常数增大,所以存在“使小的声音变大”这种助听功能的本来的作用被迟延的课题。
专利文献2记载的技术与所述考虑项目2对应,存在的课题是当词头为母音的情况下词头没有被强调,所以不能成为容易听清的声音。
发明内容
本公开鉴于上述以往的问题点,其目的在于提供一种能够输出容易听清的声音的声音处理装置。
为了解决上述课题,本公开的一个方案涉及的声音处理装置,具备:第1麦克风,将第1声音转换为第1电信号;预处理部,从所述第1电信号提取声音频带的信号,输出包含所述声音频带的信号的第1输出信号;第1控制部,生成第1放大系数,并且以第1时间常数对所述第1放大系数进行平滑处理从而生成第1修正放大系数,所述第1放大系数用于与所述第1输出信号相乘,从而对所述第1输出信号的强度的动态范围进行压缩;以及第1乘法运算部,将所述第1修正放大系数与所述第1输出信号相乘,关于所述第1时间常数,在所述第1输出信号的强度增大的情况下,所述第1时间常数为第1上升时间常数,在所述第1输出信号的强度减小的情况下,所述第1时间常数为第1下降时间常数,所述第1上升时间常数为,听力低下者的听觉的时间分辨率以上、且小于使所述听力低下者引发重振现象的声音的持续时间。
这样通过将第1上升时间常数设为听力低下者的听觉的时间分辨率以上,从而能够防止对词头的声音的强度陡峭地进行抑制。进而通过将第1上升时间常数设为听力低下者的听觉的时间分辨率以上,从而在词头的第1输出信号的强度的上升紧之后,第1修正放大系数会维持上升紧之前的放大系数。从而在第1控制部上升紧之后的第1输出信号被放大。这样词头被强调,所以能够生成容易听清的声音。此外,通过将第1上升时间常数设为小于使听力低下者引发重振现象的声音的持续时间,从而能够对重振现象的产生进行抑制。
此外,在本公开的一个方案涉及的声音处理装置,还可以具备第1设定部,所述第1设定部对所述第1上升时间常数以及所述第1下降时间常数进行设定。
从而能够将第1上升时间常数以及第1下降时间常数,设定为所希望的值。
此外,在本公开的一个方案涉及的声音处理装置,第1上升时间常数可以是,20msec以上、且小于200msec的值。
这样通过将第1上升时间常数设为20msec以上,从而能够防止陡峭地抑制词头的声音的强度。此外,通过将第1上升时间常数设为小于200msec,从而能够对重振现象的产生进行抑制。
此外,在本公开的一个方案涉及的声音处理装置,所述第1上升时间常数可以是大于所述第1下降时间常数的值。
这样,通过使第1上升时间常数变大,从而即使在第1下降时间常数小的情况下,也能够抑制声音不自然地抖动。
此外,在本公开的一个方案涉及的声音处理装置可以是,所述预处理部,具有:第1滤波器,从所述第1电信号提取所述声音频带的信号;以及预处理乘法运算部,将所述第1滤波器的输出信号与预处理放大系数相乘,关于所述预处理放大系数,在所述第1滤波器的输出信号的强度比规定的阈值小的情况下,比在所述第1滤波器的输出信号的强度比所述规定的阈值大的情况下小。
从而,能够减少对强度低的噪声成分的放大。
此外,为了解决所述课题,本公开的一个方案涉及的声音处理装置,具备:第1麦克风,将第1声音转换为第1电信号;预处理部,从所述第1电信号提取声音频带的信号,输出包含所述声音频带的信号的第1输出信号;第1控制部,生成第1放大系数,并且以第1时间常数对所述第1放大系数进行平滑处理从而生成第1修正放大系数,所述第1放大系数用于与所述第1输出信号相乘,从而对所述第1输出信号的强度的动态范围进行压缩;第1乘法运算部,将所述第1修正放大系数与所述第1输出信号相乘;第2麦克风,将第2声音转换为第2电信号;第2控制部,生成第2放大系数,并且以第2时间常数对所述第2放大系数进行平滑处理从而生成第2修正放大系数,所述第2放大系数用于和与所述第2电信号有关的第2输出信号相乘,从而对所述第2输出信号的强度的动态范围进行压缩;以及第2乘法运算部,将所述第2修正放大系数与所述第2输出信号相乘,关于所述第1时间常数,在所述第1输出信号的强度增大的情况下,所述第1时间常数为第1上升时间常数,在所述第1输出信号的强度减小的情况下,所述第1时间常数为第1下降时间常数,关于所述第2时间常数,在所述第2输出信号的强度增大的情况下,所述第2时间常数为第2上升时间常数,在所述第2输出信号的强度减小的情况下,所述第2时间常数为第2下降时间常数,所述第1上升时间常数,大于所述第2上升时间常数。
这样通过将第1上升时间常数设为比第2上升时间常数大,从而能够防止陡峭地抑制第1声音的词头的强度。从而能够生成容易听清的声音。
此外,为了解决所述课题,本公开的一个方案涉及的声音处理装置,具备上升强调部,所述上升强调部被输入声音频带的信号,并以规定的时间来对所述信号的上升部分进行强调。所述规定的时间为,听力低下者的听觉的时间分辨率以上、且小于使所述听力低下者引发重振现象的声音的持续时间。
这样以听力低下者的听觉的时间分辨率以上的时间,对声音频带的信号的上升部分进行强调,从而能够生成听力低下者容易听清的声音。此外,通过将第1上升时间常数设为小于使听力低下者引发重振现象的声音的持续时间,从而能够抑制重振现象的产生。
通过本公开,能够提供能够输出容易听清的声音的声音处理装置。
附图说明
图1是表示实施方式1的声音处理装置的功能结构的一例的方框图。
图2是表示实施方式1的第1控制部的功能结构的一例的方框图。
图3是表示实施方式1的修正系数生成部的功能结构的一例的方框图。
图4是表示实施方式1的第1放大系数与第1输出信号的强度之间的关系的一例的图表。
图5是表示实施方式1的第1时间常数的决定方法的一例的流程图。
图6A是表示实施方式1的第1输出信号的上升部分的波形的一例,和在各个时刻的与第1输出信号相乘的第1修正放大系数的大小及朝向的图。
图6B是表示将图6A表示的第1输出信号与第1修正放大系数相乘的信号的波形的图表。
图7是表示使用了实施方式1的声音处理装置的论证实验的结果的图表。
图8是表示实施方式2的声音处理装置的功能结构的一例的方框图。
图9是表示实施方式2的预处理部的功能结构的一例的方框图。
图10是表示实施方式2的预处理放大系数与滤波器的输出信号的强度E之间的关系的一例的图表。
图11是表示实施方式3的声音处理装置的功能结构的一例的方框图。
图12是说明变形例的第1时间常数的决定方法的图。
图13是表示由软件来实现声音处理装置的功能的计算机的硬件结构的一例的图。
图14是表示以往的助听处理中的时间常数的例子的图。
图15是表示非专利文献2记载的听力级别与时间分辨率的关系的图。
具体实施方式
以下利用附图来详细说明本公开的实施方式。另外,以下说明的实施方式都是示出本公开的一个具体例子。以下的实施方式所示的数值、形状、材料、规格、构成要素、构成要素的配置位置以及连接形态、步骤、步骤的顺序等均为一个例子,其主旨并非是对本发明进行限定。并且,对于以下的实施方式的构成要素中,没有记载在本公开的最上位概念的独立技术方案的构成要素,作为任意的构成要素来说明。并且,各个图并非严谨的图示。在各个图中,对于实质上相同的构成赋予相同的符号,有时省略或简化重复说明。
(获得本公开的一个方案的经过)
在为了使听力低下者容易听清从而需要考虑的所述背景技术中记述的项目中,考虑项目1和考虑项目3有可能相反。在考虑项目1中记载了不能发出强度强的声音。另一方面,在考虑项目3则推荐词语的开头(上升)发出强度强的声音。
然而这些项目,通过进行如下协调能够并存。即在词头部分发出强度强的声音,但是只要强度强的声音不持续至引发重振现象的程度就可以。这里关于在词头部分发出强度高的声音的恰当的时间长度,以下参照近几年的听觉心理的研究成果(非专利文献2)进行类推。
图15是表示非专利文献2记载的听力级别与时间分辨率的关系的图。图15的图表(a)~(d)表示,针对从11岁到75岁的听力低下者,进行间隙检测阈值测试而获得的听力级别与时间分辨率的关系。各图表的横轴示出能够检测的听力级别。换言之,越是横轴的右侧,越是听力衰弱。纵轴示出时间分辨率,换言之,能够检测的声音的间隙的长度。在纵轴上越是上方,表示时间分辨率越差。在图15标记的黑点,表示各个受试者的数据的位置。在图15的图表(a)、(b)、(c)以及(d),分别表示实验的刺激音的频率为1kHz、2kHz、4kHz以及8kHz的情况的结果。在任一个图表上,都具有递增倾向,可以知道的倾向是听力越劣化,则时间分辨率越劣化。尤其是时间分辨率,有时从20msec劣化到30msec。时间分辨率的劣化,表示不能感知短的声音。可以估计基于该症状听力低下者不能感知词头的复杂的频率变化,结果上难以听清言词。但是反过来,对词头以大约20msec以上的时间持续进行强调,则有望使具有上述症状的听力低下者也能够提高容易听清的程度。
另一方面,该强调处理持续的时间过长,则由于重振现象,使听觉出现过敏反应,声音在头脑中响度很大,导致听得不舒服。
作为检查有无重振现象的症状的试验而已知的SISI(Short IncrementSensitivity Index:短增量敏感指数)试验中,刺激音的持续时间是200msec。这表示对于具有重振现象的症状的听力低下者,强的信号的持续时间为200msec时,会引发重振现象的症状。从而,可以估计强调词头的时间长度,应该设为小于200msec。
鉴于这样的以往的研究成果,在下面说明的实施方式中,将强调词头的时间长度设为从20msec至200msec。
此外,使用该方法,对包括听力低下者的很多老年人作为受试者进行了论证实验,显示出该方法对老年人容易听清声音做出了贡献,所以将该结果也记在实施方式中。
(实施方式1)
下面说明实施方式1的声音处理装置。
[结构]
首先针对本实施方式的声音处理装置的功能结构,参考附图进行说明。图1是表示本实施方式的声音处理装置10的功能结构的一例的方框图。
声音处理装置10是对第1声音进行处理,并从第1扬声器80发出的装置。如图1所示,声音处理装置10,作为功能部具备第1麦克风20、预处理部30、以及上升强调部40。在本实施方式中,声音处理装置10,还具备第1扬声器80。
第1麦克风20是将第1声音转换为第1电信号的麦克风。在本实施方式中,第1麦克风20被设计成输入在近处的说话人的声音。因此,被输入到第1麦克风20的第1声音中,说话人的声音的音量比周围的噪声高很多。
预处理部30是从第1麦克风20输出的第1电信号提取声音频带的信号,输出包含声音频带的信号的第1输出信号的处理部。这里的声音频带是指,包含人的声音的频率的频带。具体而言,声音频带大概是70Hz以上且3000Hz以下。在本实施方式中,预处理部30具有滤波器32。滤波器32是,从第1电信号提取声音频带的信号的第1滤波器的一例。在本实施方式中,滤波器32是从第1电信号提取规定的频率以下的频带的信号的低通滤波器。滤波器32,例如从第1电信号提取8000Hz以下的频带的信号。
上升强调部40是被输入声音频带的信号,以规定的时间来对该信号的上升部分进行强调的处理部。该规定的时间为,听力低下者的听觉的时间分辨率以上、且小于使听力低下者引发重振现象的声音的持续时间。在本实施方式中,作为声音频带的信号,被输入第1输出信号。上升强调部40,在第1声音中,强调上升的部分,换言之强调词头的部分。上升强调部40,具有第1控制部50、第1乘法运算部44。在本实施方式中,上升强调部40,还具有第1设定部42。
第1控制部50是生成第1放大系数,通过将第1放大系数与预处理部30输出的第1输出信号相乘,从而对第1输出信号的强度的动态范围进行压缩,并且以第1时间常数τ对第1放大系数进行平滑处理从而生成第1修正放大系数的处理部。关于第1时间常数τ,在第1输出信号的强度增大的情况下,第1时间常数τ为第1上升时间常数ATT(换言之,起始的时间常数),在第1输出信号的强度减小的情况下,第1时间常数τ为第1下降时间常数REL(换言之,释放的时间常数)。第1上升时间常数ATT为,听力低下者的听觉的时间分辨率以上、且小于使听力低下者引发重振现象的声音的持续时间。具体而言,第1上升时间常数ATT,例如是20msec以上,且小于200msec。
这里针对第1控制部50,利用图2进行说明。图2是表示本实施方式的第1控制部50的功能结构的一例的方框图。如图2所示,第1控制部50具有强度检测部52、系数生成部54、时间常数决定部56、修正系数生成部60。
强度检测部52是对第1输出信号的强度E进行检测的检测部。强度检测部52,将检测出的强度E,输出给系数生成部54。
系数生成部54是生成随着强度E的减小而增大并且随着强度E的增大而减小的第1放大系数G(t)的处理部。换言之,系数生成部54,生成用于对第1输出信号的动态范围进行压缩的第1放大系数G(t)。另外这里的t表示时间。系数生成部54,将所生成的第1放大系数,输出给时间常数决定部56、修正系数生成部60。
时间常数决定部56是决定第1时间常数τ的处理部,该第1时间常数τ是在修正系数生成部60使用的平滑处理的时间常数。
修正系数生成部60是,对在系数生成部54生成的第1放大系数G(t)的时间变动进行平滑,从而将第1放大系数转换为第1修正放大系数mG(t)的处理部。在此关于修正系数生成部60的结构例,利用图3来说明。图3是表示本实施方式的修正系数生成部60的功能结构的一例的方框图。如图3所示,修正系数生成部60具有乘法器62以及乘法器68、加法器64、延迟元件66。换言之,修正系数生成部60是时间常数为第1时间常数τ的数字滤波器。
加法器64是将由乘法器62以及乘法器68输出的两个信号相加的处理部。延迟元件66是以单位处理的周期T,对由加法器64输出的信号进行延迟的处理部。单位处理的周期T是在信号强度检测部52对第1输出信号的强度E进行检测的周期,进而是在系数生成部54生成第1放大系数的周期。例如,在第1输出信号的采样频率为16kHz的情况下,第1放大系数的生成是按每个采样进行时,T成为1/16000sec,当第1放大系数的生成是按每16个采样进行(将16个采样总结起来求出第1放大系数)时,T成为16/16000sec,即成为1msec。
乘法器62是将第1放大系数G(t)与倍率b相乘的处理部。乘法器68是将延迟元件66输出的信号的强度与倍率a相乘的处理部,被输入来自时间常数决定部56的第1时间常数τ。在此乘法器68的倍率a和乘法器62的倍率b,分别使用第1时间常数τ以及单位处理的周期T表示为如下的式(1)以及式(2)。
a=τ/(τ+T) (1)
b=1-a=T/(τ+T) (2)
图1所示的第1设定部42是对第1上升时间常数ATT以及第1下降时间常数REL进行设定的设定部。第1设定部42,将所设定的第1上升时间常数ATT以及第1下降时间常数REL,输出给第1控制部50。从而,能够将第1上升时间常数ATT以及第1下降时间常数REL设定为所希望的值。另外,第1设定部42不是本实施方式涉及的声音处理装置10的必需的构成要素。例如,可以预先由第1控制部50设定第1上升时间常数ATT以及第1下降时间常数REL。
第1乘法运算部44是将第1修正放大系数与第1输出信号相乘的处理部。第1乘法运算部44,将第1修正放大系数与第1输出信号相乘而得到的信号,输出给第1扬声器80。
第1扬声器80是发出第1乘法运算部44的输出信号的扬声器。
[动作]
下面说明如上所述构成的声音处理装置的动作。
首先,第1麦克风20,对包含说话人的声音的第1声音进行拾音并转换为第1电信号。在此第1麦克风20被设置为说话人接近第1麦克风20并发出声音。第1麦克风20,可以被设计为例如说话人能够目视确认第1麦克风20的拾音孔的位置。或者,第1麦克风20也可以被设计为说话人正对着拍摄说话人的脸部的相机时,说话人的嘴部接近第1麦克风20的拾音孔。通过这样设置第1麦克风20,被输入到第1麦克风20的第1声音中,说话人发出的声音成为主要成分,所以能够抑制对在第1麦克风20的周围突然发生的大音量的噪声进行拾音。因此,即使将第1上升时间常数ATT设为大的值,也能够抑制发出突然产生的大音量的噪声。
接下来预处理部30的滤波器32,从来自第1麦克风20的第1电信号提取声音频带的信号,输出包含声音频带的信号的第1输出信号。例如,这里为了将采样频率成为16kHz,所以将滤波器32的截止频率设为8kHz。从而,能够进一步明确在以后处理的信号的主要成分为人的声音信号。因此,如在以后所述,即使将动态范围压缩中的第1上升时间常数ATT设为大的值,也能降低如下风险,即不能抑制发出突然发生的大音量的声音的风险。另外,滤波器32的截止频率,不限定为8kHz。例如,滤波器32的截止频率可以大约是3kHz以上且24kHz以下。
接下来上升强调部40的第1控制部50,针对在来自预处理部30的第1输出信号的强度E增大时减少的第1放大系数,以第1上升时间常数ATT进行平滑处理,针对在强度E减小时增大的第1放大系数,以第1下降时间常数REL进行平滑处理,从而生成第1修正放大系数。
具体而言,图2表示的强度检测部52,对来自预处理部30的第1输出信号的强度E进行检测。强度E可以是例如第1输出信号的绝对值,也可以是能量。作为强度E,也可以求出在几个时刻的第1输出信号的强度E的绝对值的和,也可以求出平方和。这里按每个采样求出强度E时,在采样频率为16kHz的情况下,所述单位处理的周期T成为1/16000,若针对16个采样的全体求出强度E时,单位处理的周期T成为16/16000也就是1msec。进而对如上述求出的值,以低通滤波器进行处理的值,作为强度E。
接下来,图2表示的系数生成部54,生成第1放大系数,该第1放大系数随着强度E越小则越大,随着强度E越大则越小。关于这样的第1放大系数,利用图4进行说明。图4是表示本实施方式的第1放大系数与第1输出信号的强度E的关系的一例的图表。在图4中,横轴表示第1输出信号的强度E,纵轴表示与其对应的第1放大系数。该图表具有不断下降的倾向,随着强度E越大,则第1放大系数越小,随着强度E越小,则第1放大系数越大。换句话说,第1放大系数,针对强度E为单调减少。另外这里的单调减少,如图4所示,也包括第1放大系数针对强度E为一定值的范围。另外,在图4中,第1放大系数,按照强度E的上升,从正值变为负值,但是没有必要一定是跨越正负的边界来变化,只要是随着强度E变大,第1放大系数成为非增加就可以。
针对如上所述生成的第1放大系数的时间变动,在修正系数生成部60进行平滑处理,从而生成第1修正放大系数。此时,在平滑处理中使用的第1时间常数τ,由时间常数决定部56决定,关于该决定方法利用图5来说明。图5是表示本实施方式的第1时间常数τ的决定方法的一例的流程图。如图5所示,时间常数决定部56,首先从第1设定部42,获得第1上升时间常数ATT以及第1下降时间常数REL。进而,时间常数决定部56,从系数生成部54获得当前时刻的第1放大系数G(t),从修正系数生成部60,获得1个单位处理的周期T之前的时刻的第1修正放大系数mG(t-T)(S12)。
接下来时间常数决定部56,将第1放大系数G(t)与第1修正放大系数mG(t-T)进行比较(S14)。在G(t)<mG(t-T)时(S14中的“是”),表示当前时刻的第1放大系数比过去小,所以当前时刻的强度E比1个单位处理的周期T之前大,所以表示起始(换言之,上升)的状态。在这个情况下,时间常数决定部56,作为在平滑处理中使用的第1时间常数τ,选择第1上升时间常数ATT(S16)。在不是的情况下(S14中的“否”),时间常数决定部56,选择第1下降时间常数REL(S18)。将这样决定的第1时间常数τ,由时间常数决定部56输出给修正系数生成部60(S20)。这样使用由时间常数决定部56输出的第1时间常数τ,在所述的修正系数生成部60,第1放大系数的时间变动被平滑,生成第1修正放大系数。
在本实施方式中第1上升时间常数ATT以及第1下降时间常数REL,由第1设定部42而被设定。这些时间常数的具体值例如以下述方式决定。
首先第1上升时间常数ATT为,收听由声音处理装置10进行了处理的第1声音的听力低下者的听觉的时间分辨率以上、且小于使该听力低下者引发重振现象的声音的持续时间。具体而言,第1上升时间常数ATT,例如设定为20msec以上、且小于200msec的值。该数值范围的依据,如同获得本公开的一个方案的经过中叙述的那样。此外第1上升时间常数ATT,可以决定为适合收听由声音处理装置10处理后的第1声音的听力低下者的值。具体而言,可以计测各个听力低下者的听觉的时间分辨率以及引发重振现象的声音的持续时间,根据由计测而获得的那些数值,来决定第1上升时间常数ATT。
这样使第1上升时间常数设为听力低下者的听觉的时间分辨率以上,从而能够防止陡峭地抑制词头的声音的强度。此外将第1上升时间常数设为小于使听力低下者引发重振现象的声音的持续时间时,能够抑制重振现象的发生。
另一方面,关于第1下降时间常数REL,如图14表示的以往技术中是上升时间常数的大约数十倍以上且数百倍以下的值,但是在本实施方式的声音处理装置10,第1上升时间常数ATT可以设定为大的值,第1下降时间常数REL可以不是图14表示的值一样大的值。具体而言,第1下降时间常数REL,可以与第1上升时间常数ATT同等(例如,小于第1上升时间常数ATT的10倍),也可以小于第1上升时间常数ATT。例如,第1上升时间常数ATT为50msec,第1下降时间常数REL为200msec,也可以是第1上升时间常数ATT为100msec,第1下降时间常数REL为80msec。此外,第1下降时间常数REL为小于40msec,第1上升时间常数ATT为40msec以上。
使用这样设定的第1时间常数τ,在第1控制部50生成第1修正放大系数,将第1修正放大系数与第1输出信号相乘,从而得到输出信号。接受了该输出信号的第1扬声器80,按照该输出信号发出声音,从而将处理后的声音提供给听力低下者即收听者。
在此利用图6A以及图6B来说明通过具有上述结构的声音处理装置10,第1声音转换为听力低下者容易听清的并且词头被强调的信号的理由。
图6A是表示本实施方式的第1输出信号的上升部分(换言之词头部分)的波形的一例,和在各个时刻的与第1输出信号相乘的第1修正放大系数的大小及朝向的图。在图6A中,在第1输出信号通过第1修正放大系数被放大的情况下,用从时间轴向外侧的箭头记号来表示,在第1输出信号通过第1修正放大系数被衰减的情况下,用朝向时间轴的箭头记号来表示。图6B是表示将图6A表示的第1输出信号与第1修正放大系数相乘的信号的波形的图表。
在图6A的左侧、即在声音上升前的时刻,第1输出信号的强度E小,第1放大系数成为大的值。例如,按照图4表示的强度E与第1放大系数的关系来转换时,在声音的上升之前,第1放大系数一直是+6dB。这里关于第1修正放大系数,因为第1放大系数一直是+6dB,所以即使对时间变动进行平滑也仍然是+6dB。在图6A的左侧,箭头记号从中心朝向外侧就是表示这个意思。这样第1输出信号将图6A的第1输出信号设为+6dB,成为图6B的左侧。
接下来到达声音的上升的时刻。在该情况下,第1输出信号的强度E变大,所以第1放大系数变小。例如图4表示的例子中,第1放大系数为-6dB。
在这个情况下,第1输出信号的强度E急剧变大,成为起始状态。因为按照图5表示的方法,第1输出信号的强度E,在急剧变大紧之后的时刻的第1放大系数G(t)是-6dB,在该时刻的单位处理的周期T之前的第1修正放大系数mG(t-T)是+6dB,所以在图5的步骤S14中选择“是”(换言之,起始侧),作为第1时间常数τ,选择第1上升时间常数ATT。
这里将第1上升时间常数ATT设定为例如40msec等这样的比听力低下者的时间分辨率大的值。时间常数为40msec的意思是,从现状的第1修正放大系数到达作为目标的第1修正放大系数的63%为止所需要的时间为大约40msec。在图4表示的例子中,在当前时刻的单位处理的周期T之前第1放大系数为+6dB,在当前时刻第1放大系数为-6dB,所以时间常数为40msec的意思是,从+6dB到达作为目标的-6dB的63%所需要的时间为40msec。换言之,至少在40msec的期间,停留在比作为目标的值大的值(换言之,处于强调第1输出信号的状态)。图6A表示的箭头记号,在第1输出信号的上升的时刻之后也有一段时间,从时间轴朝向外侧就是表示这个意思。
作为结果,与第1修正放大系数相乘的第1输出信号的波形,如图6B表示,成为上升部分(换言之,词头部分)被强调的波形。在本实施方式中,第1上升时间常数ATT为比听力低下者的时间分辨率大的值,所以词头部分被强调,即使是听力低下者也能够清楚地感知声音。但是第1上升时间常数ATT过大时,引发重振现象,对于听力低下者而言成为不愉快的声音。周知的是以200msec持续发出大的声音,会引发重振现象,所以第1上升时间常数必须小于200msec。
这样本实施方式涉及的声音处理装置10,具备上升强调部40,该上升强调部40被输入声音频带的信号即第1输出信号,并以规定的时间来对该第1输出信号的上升部分进行强调。该规定的时间为,听力低下者的听觉的时间分辨率以上、且小于使听力低下者引发重振现象的声音的持续时间。从而,以听力低下者能够识别的时间,持续对词头进行强调,而且该强调处理的时间长度比较短,不会产生重振现象导致的不舒服,所以能够实现听力低下者容易听清的声音。
此外,如上所述,第1上升时间常数可以是比第1下降时间常数大的值。这样通过使第1上升时间常数变大,从而即使在第1下降时间常数小的情况下,也能够抑制声音不自然地抖动。
[实验结果]
接下来利用图7来说明本实施方式的使用声音处理装置10进行的论证实验的结果。图7是表示本实施方式的使用声音处理装置10进行的论证实验的结果的图表。在图7中表示针对23名受试者的实验结果。图7的横轴表示以正确回答率的升序排序的各个受试者。图7的纵轴表示各个实验的正确回答率。
在本实验中,根据在2003年日本听觉医学会制定的语音听力测试法,使用67-S语表,进行语音辨别测试。具体而言,使受试者听67-S语表所示的单音节,用平假名记下来,调查该正确回答率。受试者是60岁年龄段3名,70岁年龄段18名,以及80岁年龄段3名总共23名。此外以两个不同的条件进行所述测试,一个条件是对单音节的声音没有加工直接让受试者听,另一个条件是让受试者听使用本实施方式的声音处理装置10进行了处理的单音节的声音。另外,声音处理装置10,将第1上升时间常数ATT以及第1下降时间常数REL,分别设定为40msec以及20msec。
在图7中分别用黑三角和黑圆点来表示各个受试者听无加工的声音的情况下的正确回答率、以及使用本实施方式的声音处理装置10进行了处理的声音的情况下的正确回答率,此外将这些2个正确回答率的差异用箭头记号来表示。
如图7所示,不仅是对于正确回答率高的听力低下程度不显著的受试者,而且对于正确回答率低的听力低下程度显著的受试者,使用本实施方式的声音处理装置10进行了处理的声音的正确回答率比没有加工的声音的正确回答率高。这样通过实验证实了通过本实施方式的声音处理装置10,能够输出容易听清的声音。
(实施方式2)
下面说明实施方式2的声音处理装置。如上所述,在实施方式1的声音处理装置10中,上升(起始)的紧之后,词头部分确实被强调,之后,按照第1上升时间常数,比较缓慢地降低到目标的级别。为了实现这样的动作,如图4所示,在系数生成部54中,在第1输出信号的强度E小的情况下,生成大的第1放大系数。从而,使第1放大系数减小时的平滑处理的时间常数变大,从而能够使信号的振幅确实地增大。但是在该情况下,使第1输出信号的强度E小的噪声也被放大。例如图6B的左侧的第1输出信号,换言之,相当于说话人发出声音之前的噪声的信号被放大。
于是,在本实施方式中,针对这样能够抑制噪声的声音处理装置进行说明。本实施方式的声音处理装置的预处理部的结构,与实施方式1的声音处理装置10不同。下面关于本实施方式的声音处理装置,以与实施方式1的声音处理装置10的不同点为中心进行说明。
首先关于本实施方式的声音处理装置的功能结构,利用图8以及图9进行说明。图8是表示本实施方式的声音处理装置110的功能结构的一例的方框图。图9是表示本实施方式的预处理部130的功能结构的一例的方框图。
如图8所示,本实施方式涉及的声音处理装置110,作为功能部具备第1麦克风20、预处理部130、上升强调部40。在本实施方式中,声音处理装置110,还具备第1扬声器80。如图8所示,本实施方式的声音处理装置110,与实施方式1涉及的声音处理装置10不同之处在于预处理部130的结构。
本实施方式的预处理部130,如图9所示具有滤波器32、预处理控制部133、预处理乘法运算部138。滤波器32,与实施方式1涉及的滤波器32同样,是从第1麦克风20输出的第1电信号提取声音频带的信号的第1滤波器的一例。
预处理控制部133是,根据滤波器32的输出信号,生成预处理放大系数的处理部。预处理控制部133,如图9所示具有强度检测部134、系数生成部135、修正系数生成部136。
强度检测部134是对滤波器32的输出信号的强度E进行检测的检测部。强度检测部134,可以与实施方式1的强度检测部52同样地检测强度E。强度检测部134将检测出的强度E,输出给系数生成部135。
系数生成部135是生成预处理放大系数的处理部。预处理放大系数是按照滤波器32的输出信号的强度E而变化的系数,该预处理放大系数在滤波器32的输出信号的强度E比规定的阈值小的情况下,比在滤波器32的输出信号的强度E比规定的阈值大的情况下小。下面关于预处理放大系数,利用图10来说明。图10是表示本实施方式的预处理放大系数与滤波器32的输出信号的强度E之间的关系的一例的图表。如图10所示,预处理放大系数,随着滤波器32的输出信号的强度E变大而增大。例如,预处理放大系数也可以是,图3所示的第1放大系数成为+6dB的强度E的范围中是-6dB,图3所示的第1放大系数成为-6dB的强度E的范围中是0dB。在图10所示的例子中,预处理放大系数,在强度E比规定的阈值-48dB小的情况下,比强度E比阈值-48dB大的情况下小。具体而言,强度E比规定的阈值-48dB小的情况下,随着强度E变小,预处理放大系数也减小,在规定的强度E以下时,预处理放大系数成为-6dB。另一方面,强度E比规定的阈值-48dB大的情况下,预处理放大系数成为0dB。
修正系数生成部136是通过对预处理放大系数的时间变动进行平滑处理,从而修正预处理放大系数的处理部。修正系数生成部136,将修正后的预处理放大系数输出给预处理乘法运算部138。另外,修正系数生成部136,不是声音处理装置110的必需的构成要素。换言之,系数生成部135生成的预处理放大系数,也可以直接输入到预处理乘法运算部138。
预处理乘法运算部138是将滤波器32的输出信号与预处理放大系数相乘的处理部。预处理乘法运算部138,将滤波器32的输出信号与预处理放大系数相乘而得到的信号,作为第1输出信号,输出给上升强调部40。
如上所述本实施方式的预处理部130,输出对强度E低的信号进行了衰减的第1输出信号。从而,既能够减少对应该强调的词头进行抑制,也能够减少强度E低的噪声成分在上升强调部40被放大。
(实施方式3)
下面说明实施方式3的声音处理装置。本实施方式的声音处理装置,除了具备对第1声音进行处理的处理部,还具备对第2声音进行处理的处理部。下面关于本实施方式的声音处理装置,以与实施方式1涉及的声音处理装置10的不同点为中心进行说明。
首先,利用图11来说明本实施方式的声音处理装置的功能结构。图11是表示本实施方式的声音处理装置210的功能结构的一例的方框图。
如图11所示,声音处理装置210,作为功能部具备第1麦克风20、预处理部30、上升强调部40、第2麦克风220、压缩部240。在本实施方式中,声音处理装置210,还具备第1扬声器80以及第2扬声器280。声音处理装置210,例如在第1扬声器80的附近设置第2麦克风220,在第1麦克风20的附近设置第2扬声器280,从而能够从第1麦克风20朝向第1扬声器80的方向、以及从第2麦克风220朝向第2扬声器280的方向这样的双方向对声音进行处理。换言之本实施方式的声音处理装置210,能够对发出第1声音的第1用户,以及发出第2声音的第2用户之间的对话中发出的各个声音,在双方向进行处理。
本实施方式的第1麦克风20、预处理部30、上升强调部40以及第1扬声器80,与实施方式1的第1麦克风20、预处理部30、上升强调部40以及第1扬声器80具有同样的结构。
第2麦克风220是将第2声音转换为第2电信号的麦克风。在本实施方式中,被输入到第2麦克风220的声音,并非限定于接近麦克风的说话人的声音。例如,第2麦克风220,可以被设计为将接近第2麦克风220存在困难的说话人的声音,作为第2声音来输入。在这个情况下,被输入到第2麦克风220的第2声音中,周围的噪声的音量相对于说话人的声音的音量有可能比较高。
压缩部240是对与从第2麦克风220输出的第2电信号有关的第2输出信号的动态范围,进行压缩的处理部。在本实施方式中,第2输出信号与第2电信号相同,然而第2输出信号也可以是通过与实施方式1或者实施方式2的各个预处理部同样的预处理部,对第2电信号进行了处理的信号。换言之,本实施方式的声音处理装置210还可以具备预处理部,该预处理部通过处理来自第2麦克风220的第2电信号从而生成第2输出信号,将第2输出信号输出给压缩部240。压缩部240具有第2控制部250、第2设定部242。在本实施方式中,压缩部240还具有第2乘法运算部244。
第2控制部250是一种处理部,第2控制部生成第2放大系数,通过将第2放大系数与第2输出信号相乘,从而对第2输出信号的强度的动态范围进行压缩,并且以第2时间常数对第2放大系数进行平滑处理从而生成第2修正放大系数。关于第2时间常数,在第2输出信号的强度增大的情况下,第2时间常数是第2上升时间常数,在第2输出信号的强度减小的情况下,第2时间常数是第2下降时间常数。第2控制部250,具有与第1控制部50同样的结构。在此,由第1设定部42设定的第1上升时间常数,比由第2设定部242设定的第2上升时间常数大,由第1设定部42设定的第1下降时间常数,比由第2设定部242设定的第2下降时间常数小。
第2设定部242是对第2上升时间常数以及第2下降时间常数进行设定的设定部。第2设定部242,将设定的第2上升时间常数以及第2下降时间常数,输出给第2控制部250。从而,能够将第2上升时间常数以及第2下降时间常数,设定为所希望的值。另外,第2设定部242,并非是本实施方式的声音处理装置210必需的构成要素。例如,第2上升时间常数以及第2下降时间常数,可以预先由第2控制部250设定。
第2乘法运算部244是将第2修正放大系数与第2输出信号相乘的处理部。第2乘法运算部244,将通过将第2修正放大系数与第2输出信号相乘而得到的信号,输出给第2扬声器280。
本实施方式的声音处理装置210具有上述的结构,所以能够在从第1麦克风20向第1扬声器80的方向、以及从第2麦克风220向第2扬声器280的方向这样的双方向对声音进行处理。此外,在本实施方式中,由第1设定部42设定的第1上升时间常数,比由第2设定部242设定的第2上升时间常数大,所以与实施方式1的声音处理装置10同样,第1声音的词头被强调。从而,在对发出第1声音的非听力低下者的第1用户,以及发出第2声音的听力低下者的第2用户之间的对话中发出的各个声音,在双方向进行处理的情况下,第2用户能够从第1扬声器80收听词头被强调的容易听清的声音。
另一方面,在第2用户没有接近第2麦克风220发声的情况下,第2声音,有可能包含第2用户的声音以外的比较多的噪声。即使在这样的情况下,与第2声音对应的第2输出信号,通过压缩部240被压缩动态范围,所以能够抑制第2声音有可能包含的大音量的噪声。
本实施方式涉及的声音处理装置210,能够起到上述一样的效果,例如能够适用于呼叫护士等。在这个情况下,护士使用第1麦克风20以及第2扬声器280,作为听力低下者的患者使用第2麦克风220以及第1扬声器80,从而患者能够容易听清护士的声音。此外,患者有时候不能接近第2麦克风220,例如将第2麦克风220的灵敏度设为比第1麦克风20的灵敏度高,从而实现这样的患者也能使用的声音处理装置210。
(变形例等)
以上关于本公开的声音处理装置,根据各个实施方式进行了说明,但是本公开并非被这些实施方式所限定。在不超出本公开的宗旨的范围内,将本领域技术人员想出的各种变形实施在各个实施方式、或者将各个实施方式中的一部分构成要素进行组合构筑的形式,也包括在本公开的范围内。
例如在所述各个实施方式中,根据第1放大系数和第1修正放大系数决定了第1时间常数,但是第1时间常数的决定方法不限于此。例如,可以根据第1输出信号是否为起始状态,来决定第1时间常数。这样的方法,利用图12进行说明。图12是说明变形例的第1时间常数的决定方法的图。在图12中将横轴作为时间轴,示出了信号的能量按照时间以阶梯形状来变化的第1输出信号SL,以及表示检测第1输出信号是否为起始状态的检测期间的窗W1以及W2的概要。
如图12所示通过窗W1以及接在窗W1之后的窗W2,检测窗内的能量,从而判断第1输出信号是否上升(换言之,是否为起始状态)。例如,窗W1以及W2的位置如图12的波形(a)~(d)、(j)和(k)所示的情况下,两个窗之间没有能量变化,所以判断为第1输出信号没有上升(即,不是起始)。此外,窗W1以及W2的位置如图12的波形(e)~(i)所示的情况下,比起在窗W1检测出的能量,在窗W2检测出的能量大,所以能够判断为第1输出信号上升(即,是起始)。
这样能够根据第1输出信号是否为起始状态,来决定第1时间常数。在使用这样的方法的情况下,声音处理装置可以具备暂时存储由窗W1检测出的能量的存储器。
此外以下所示的形式,也可以包括在本公开的一个或者多个方案的范围内。
(1)构成所述各个声音处理装置的构成要素的硬件结构,没有特别限定,例如可以由计算机来构成。关于这样的硬件结构例,利用图13来说明。图13是表示本公开的声音处理装置的功能由软件来实现的计算机1000的硬件结构的一例的图。
计算机1000是,如图13所示的具备输入装置1001、输出装置1002、CPU1003、内置存储器1004、RAM1005以及总线1009的计算机。输入装置1001、输出装置1002、CPU1003、内置存储器1004以及RAM1005,通过总线1009来连接。
输入装置1001是输入按钮、触摸板、触摸显示器等作为用户界面的装置,用于接受用户的操作。另外输入装置1001的结构,除了接受用户的接触操作之外,还可以是接受声音的操作、遥控器等的远程操作的结构。输入装置1001,也可以包含相当于第1麦克风20以及第2麦克风220的麦克风。
输出装置1002是对来自计算机1000的信号进行输出的装置,除了成为信号输出端子之外,还可以成为扬声器、显示器等用户界面的装置。输出装置1002,也可以包含相当于第1扬声器80以及第2扬声器280的扬声器。
内置存储器1004是闪存等。此外内置存储器1004,可以预先存储有用于实现声音处理装置的功能的程序、以及利用了声音处理装置的功能结构的应用的至少一方。
RAM1005是随机存取存储器(Random Access Memory),在执行程序或者应用时利用于存储数据等。
CPU1003是中央处理器(Central Processing Unit),将存储在内置存储器1004的程序、应用复制到RAM1005,将该程序或者应用包含的命令,从RAM1005依次读出并执行。
计算机1000,例如针对由数字信号构成的第1电信号以及第2电信号,进行与所述各个实施方式的预处理部、上升强调部以及压缩部同样的处理。
(2)构成上述各个声音处理装置的构成要素的一部分,可以由1个系统LSI(LargeScale Integration:大规模集成电路)来构成。系统LSI是将多个构成部集成在1个芯片上来制造的超多功能LSI,具体而言是包括微处理机,ROM(Read Only Memory),RAM等构成的计算机系统。所述RAM记录有计算机程序。所述RAM存储有计算机程序。上述微处理机,按照上述计算机程序动作,从而系统LSI达成其功能。
(3)构成上述声音处理装置的构成要素的一部分,可以由能够在各个装置进行装拆的IC卡或单体的模块构成。上述IC卡或上述模块是由微处理机、ROM、RAM等构成的计算机系统。上述IC卡或上述模块,可以包括上述超多功能LSI。微处理机,按照计算机程序进行动作,从而上述IC卡或上述模块达成该功能。该IC卡或者该模块,可以具有耐篡改性。
(4)此外,构成上述声音处理装置的构成要素的一部分,可以是将上述计算机程序或者上述数字信号记录在能够由计算机读取的记录介质,例如软磁盘、硬盘、CD-ROM、MO、DVD、DVD-ROM、DVD-RAM、BD(Blu-ray(注册商标)Disc)、半导体存储器等。此外,也可以是在这些记录介质中记录的上述数字信号。
此外,构成上述声音处理装置的构成要素的一部分,可以是将上述计算机程序或上述数字信号,经由电通信线路、无线或有线通信线路、以因特网为代表的网络、数据广播等进行传输。
(5)本公开可以是上述示出的方法。此外,这些方法可以是由计算机实现的计算机程序,也可以是由上述计算机程序构成的数字信号。
(6)此外,本公开可以是具备微处理机和存储器的计算机系统,所述存储器存储所述计算机程序,所述微处理机按照所述计算机程序来动作。
(7)此外,通过将上述程序或上述数字信号记录在上述记录介质并移送,或者将上述程序或上述数字信号,经由上述网络等移送,从而可以由独立的其他的计算机系统来实施。
(8)可以分别组合上述实施方式以及上述变形例。
本公开涉及的声音处理装置,能够提供听力低下者容易听清的声音,所以能够用于听力低下者居住的住宅的门铃对讲装置,在医院用于呼叫护士等。此外,适用于听力低下者视听的电视机上,从而对电视节目的声音提高容易听清的程度。
符号说明
10,110,210声音处理装置
20第1麦克风
30,130预处理部
32滤波器
40上升强调部
42第1设定部
44第1乘法运算部
50第1控制部
52,134强度检测部
54,135系数生成部
56时间常数决定部
60,136修正系数生成部
62,68乘法器
64加法器
66延迟元件
80第1扬声器
133预处理控制部
138预处理乘法运算部
220第2麦克风
240压缩部
242第2设定部
244第2乘法运算部
250第2控制部
280第2扬声器
1000计算机
1001输入装置
1002输出装置
1003CPU
1004内置存储器
1005RAM
1009总线

Claims (7)

1.一种声音处理装置,
所述声音处理装置具备:
第1麦克风,将第1声音转换为第1电信号;
预处理部,从所述第1电信号提取声音频带的信号,输出包含所述声音频带的信号的第1输出信号;
第1控制部,生成第1放大系数,并且以第1时间常数对所述第1放大系数进行平滑处理从而生成第1修正放大系数,所述第1放大系数用于与所述第1输出信号相乘,从而对所述第1输出信号的强度的动态范围进行压缩;以及
第1乘法运算部,将所述第1修正放大系数与所述第1输出信号相乘,
关于所述第1时间常数,
在所述第1输出信号的强度增大的情况下,所述第1时间常数为第1上升时间常数,
在所述第1输出信号的强度减小的情况下,所述第1时间常数为第1下降时间常数,
所述第1上升时间常数为,听力低下者的听觉的时间分辨率以上、且小于使所述听力低下者引发重振现象的声音的持续时间。
2.如权利要求1所述的声音处理装置,
所述声音处理装置还具备第1设定部,所述第1设定部对所述第1上升时间常数以及所述第1下降时间常数进行设定。
3.如权利要求1或者2所述的声音处理装置,
所述第1上升时间常数是,20msec以上、且小于200msec的值。
4.如权利要求1至3的任一项所述的声音处理装置,
所述第1上升时间常数是大于所述第1下降时间常数的值。
5.如权利要求1至4的任一项所述的声音处理装置,
所述预处理部,具有:
第1滤波器,从所述第1电信号提取所述声音频带的信号;以及
预处理乘法运算部,将所述第1滤波器的输出信号与预处理放大系数相乘,
关于所述预处理放大系数,在所述第1滤波器的输出信号的强度比规定的阈值小的情况下,比在所述第1滤波器的输出信号的强度比所述规定的阈值大的情况下小。
6.一种声音处理装置,
所述声音处理装置具备:
第1麦克风,将第1声音转换为第1电信号;
预处理部,从所述第1电信号提取声音频带的信号,输出包含所述声音频带的信号的第1输出信号;
第1控制部,生成第1放大系数,并且以第1时间常数对所述第1放大系数进行平滑处理从而生成第1修正放大系数,所述第1放大系数用于与所述第1输出信号相乘,从而对所述第1输出信号的强度的动态范围进行压缩;
第1乘法运算部,将所述第1修正放大系数与所述第1输出信号相乘;
第2麦克风,将第2声音转换为第2电信号;
第2控制部,生成第2放大系数,并且以第2时间常数对所述第2放大系数进行平滑处理从而生成第2修正放大系数,所述第2放大系数用于和与所述第2电信号有关的第2输出信号相乘,从而对所述第2输出信号的强度的动态范围进行压缩;以及
第2乘法运算部,将所述第2修正放大系数与所述第2输出信号相乘,
关于所述第1时间常数,
在所述第1输出信号的强度增大的情况下,所述第1时间常数为第1上升时间常数,
在所述第1输出信号的强度减小的情况下,所述第1时间常数为第1下降时间常数,
关于所述第2时间常数,
在所述第2输出信号的强度增大的情况下,所述第2时间常数为第2上升时间常数,
在所述第2输出信号的强度减小的情况下,所述第2时间常数为第2下降时间常数,
所述第1上升时间常数,大于所述第2上升时间常数。
7.一种声音处理装置,
所述声音处理装置具备上升强调部,所述上升强调部被输入声音频带的信号,并以规定的时间来对所述信号的上升部分进行强调,
所述规定的时间为,听力低下者的听觉的时间分辨率以上、且小于使所述听力低下者引发重振现象的声音的持续时间。
CN202080030000.XA 2019-04-23 2020-01-17 声音处理装置 Active CN113711624B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019081394 2019-04-23
JP2019-081394 2019-04-23
PCT/JP2020/001552 WO2020217605A1 (ja) 2019-04-23 2020-01-17 音声処理装置

Publications (2)

Publication Number Publication Date
CN113711624A true CN113711624A (zh) 2021-11-26
CN113711624B CN113711624B (zh) 2024-06-07

Family

ID=72942081

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080030000.XA Active CN113711624B (zh) 2019-04-23 2020-01-17 声音处理装置

Country Status (4)

Country Link
US (1) US11758337B2 (zh)
JP (1) JPWO2020217605A1 (zh)
CN (1) CN113711624B (zh)
WO (1) WO2020217605A1 (zh)

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4191864A (en) * 1978-08-25 1980-03-04 American Hospital Supply Corporation Method and apparatus for measuring attack and release times of hearing aids
US4630302A (en) * 1985-08-02 1986-12-16 Acousis Company Hearing aid method and apparatus
CN1254454A (zh) * 1997-06-30 2000-05-24 西门子听觉仪器公司 具有输入agc和输出agc的助听器
CN1524397A (zh) * 2001-07-09 2004-08-25 ¿ 助听器和一种声信号的处理方法
US20060233408A1 (en) * 2005-03-29 2006-10-19 Kates James M Hearing aid with adaptive compressor time constants
CN1879150A (zh) * 2003-11-14 2006-12-13 皇家飞利浦电子股份有限公司 用于音频信号处理的系统和方法
CN1988737A (zh) * 2005-12-21 2007-06-27 奥迪康有限公司 用于控制助听器的传递函数的系统
CN101048813A (zh) * 2004-08-30 2007-10-03 高通股份有限公司 用于语音ip传输的自适应去抖动缓冲器
CN101183859A (zh) * 2006-11-17 2008-05-21 Akg声学有限公司 音频压缩器
CN101904183A (zh) * 2009-03-09 2010-12-01 松下电器产业株式会社 助听器
CN103026738A (zh) * 2010-07-15 2013-04-03 唯听助听器公司 助听器系统中信号处理的方法和助听器系统
CN106664487A (zh) * 2014-07-24 2017-05-10 株式会社索思未来 信号处理装置以及信号处理方法
CN107426663A (zh) * 2016-05-23 2017-12-01 奥迪康有限公司 包括波束形成器滤波单元和增益单元的可配置的助听器
CN107731236A (zh) * 2014-11-06 2018-02-23 阿哈隆·丹尼尔·谢费尔 用于声音的动态范围压缩的方法与装置
US20180166092A1 (en) * 2016-12-09 2018-06-14 Acer Incorporated Voice signal processing apparatus and voice signal processing method
CN109587603A (zh) * 2018-12-10 2019-04-05 北京达佳互联信息技术有限公司 音量控制方法、装置及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6993480B1 (en) * 1998-11-03 2006-01-31 Srs Labs, Inc. Voice intelligibility enhancement system
MX2011012736A (es) 2009-05-29 2011-12-16 Sharp Kk Aparato de reproduccion de sonido, metodo de reproduccion de sonido y medio de grabacion.
JPWO2012098856A1 (ja) * 2011-01-17 2014-06-09 パナソニック株式会社 補聴器、及び、補聴器の制御方法
JP6284003B2 (ja) 2013-03-27 2018-02-28 パナソニックIpマネジメント株式会社 音声強調装置及び方法
EP3337186A1 (en) 2016-12-16 2018-06-20 GN Hearing A/S Binaural hearing device system with a binaural impulse environment classifier

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4191864A (en) * 1978-08-25 1980-03-04 American Hospital Supply Corporation Method and apparatus for measuring attack and release times of hearing aids
US4630302A (en) * 1985-08-02 1986-12-16 Acousis Company Hearing aid method and apparatus
CN1254454A (zh) * 1997-06-30 2000-05-24 西门子听觉仪器公司 具有输入agc和输出agc的助听器
CN1524397A (zh) * 2001-07-09 2004-08-25 ¿ 助听器和一种声信号的处理方法
CN1879150A (zh) * 2003-11-14 2006-12-13 皇家飞利浦电子股份有限公司 用于音频信号处理的系统和方法
CN101048813A (zh) * 2004-08-30 2007-10-03 高通股份有限公司 用于语音ip传输的自适应去抖动缓冲器
US20060233408A1 (en) * 2005-03-29 2006-10-19 Kates James M Hearing aid with adaptive compressor time constants
CN1988737A (zh) * 2005-12-21 2007-06-27 奥迪康有限公司 用于控制助听器的传递函数的系统
CN101183859A (zh) * 2006-11-17 2008-05-21 Akg声学有限公司 音频压缩器
CN101904183A (zh) * 2009-03-09 2010-12-01 松下电器产业株式会社 助听器
CN103026738A (zh) * 2010-07-15 2013-04-03 唯听助听器公司 助听器系统中信号处理的方法和助听器系统
CN106664487A (zh) * 2014-07-24 2017-05-10 株式会社索思未来 信号处理装置以及信号处理方法
CN107731236A (zh) * 2014-11-06 2018-02-23 阿哈隆·丹尼尔·谢费尔 用于声音的动态范围压缩的方法与装置
CN107426663A (zh) * 2016-05-23 2017-12-01 奥迪康有限公司 包括波束形成器滤波单元和增益单元的可配置的助听器
US20180166092A1 (en) * 2016-12-09 2018-06-14 Acer Incorporated Voice signal processing apparatus and voice signal processing method
CN109587603A (zh) * 2018-12-10 2019-04-05 北京达佳互联信息技术有限公司 音量控制方法、装置及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ADRIAN CARINA HENRI: "he effect of Amplitude Compression on the Perception of Speech in Noise by the Hearing Impaired", pages 17 - 22, Retrieved from the Internet <URL:https://dspace.library.uu.nl/bitstream/handle/1874/13210/full> *

Also Published As

Publication number Publication date
CN113711624B (zh) 2024-06-07
JPWO2020217605A1 (zh) 2020-10-29
US20220038831A1 (en) 2022-02-03
US11758337B2 (en) 2023-09-12
WO2020217605A1 (ja) 2020-10-29

Similar Documents

Publication Publication Date Title
US10083702B2 (en) Enhancing perception of frequency-lowered speech
JP4876245B2 (ja) 子音加工装置、音声情報伝達装置及び子音加工方法
US6674868B1 (en) Hearing aid
JP5863928B1 (ja) 音声調整装置
US20240127843A1 (en) Processing and utilizing audio signals according to activation selections
WO2012098856A1 (ja) 補聴器、及び、補聴器の制御方法
CN112130801B (zh) 音响装置及音响处理方法
US11064301B2 (en) Sound level control for hearing assistive devices
CN113711624B (zh) 声音处理装置
JP2006333396A (ja) 音声信号拡声装置
US9179225B2 (en) Hearing aid device
JP2002252894A (ja) 音響信号処理装置
CN116017250A (zh) 数据处理方法、装置、存储介质、芯片与辅听设备
JP5054477B2 (ja) 補聴装置
JP3303446B2 (ja) 音声信号処理装置
CN111951801A (zh) 基于语音控制的音量调节方法和装置
JP3420831B2 (ja) 骨伝導音声のノイズ除去装置
JPH06289896A (ja) 音声の特徴強調方式および装置
KR102403996B1 (ko) 보청기의 채널영역 방식, 채널영역 방식을 이용한 보청기의 피팅방법, 그리고 이를 통해 피팅된 디지털 보청기
Voix et al. EVALUATION OF A DIGITAL EARPLUG FEATURING A MULTI-BAND ADAPTIVE GAIN CONTROL NOISE REDUCTION AL-GORITHM FOR ENHANCED AUDIBILITY IN NOISY ENVIRON-MENTS
JP4005166B2 (ja) 音声信号の処理回路
JP3292098B2 (ja) 聴覚補助装置
JP3632384B2 (ja) 聴覚補助装置
EP4158625A1 (en) A own voice detector of a hearing device
JP2005064744A (ja) 聴覚補助装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant