CN102483920A - 声音再生装置和声音再生方法 - Google Patents

声音再生装置和声音再生方法 Download PDF

Info

Publication number
CN102483920A
CN102483920A CN200980161196XA CN200980161196A CN102483920A CN 102483920 A CN102483920 A CN 102483920A CN 200980161196X A CN200980161196X A CN 200980161196XA CN 200980161196 A CN200980161196 A CN 200980161196A CN 102483920 A CN102483920 A CN 102483920A
Authority
CN
China
Prior art keywords
regeneration
mentioned
signal
sound
ambient sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200980161196XA
Other languages
English (en)
Inventor
外川太郎
大谷猛
远藤香绪里
大田恭士
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of CN102483920A publication Critical patent/CN102483920A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

声音再生装置具备:周围声音分析部,其对周围声音的特征进行分析;特征分析部,其对再生用信号的音响特征进行分析;再生定时调整部,其一方面将再生用信号记录于记录介质,另一方面以后续再生的再生定时从记录介质中读出再生用信号;再生速度变更部,其对从记录介质读出的再生用信号的再生速度进行变更;和控制部,其一方面对上述再生定时调整部进行控制,以便在与周围声音分析部的分析结果对应的再生定时对再生用信号进行再生,另一方面对上述再生速度变更部进行控制,以便以与上述周围声音分析部的分析结果、以及由上述特征分析部得到的音响特征对应的再生速度来再生上述再生用信号。

Description

声音再生装置和声音再生方法
技术领域
本发明涉及声音再生装置和声音再生方法。
背景技术
近年来,移动电话得以普及而被使用于各种场所。移动电话不仅在安静的场所被使用,在飞机场的候机厅、站台那样的嘈杂环境下也被使用。
因此,存在有一种为了使接听者在噪音环境下容易听清说话者的声音,而对应于周围噪音的声级来突出声音的高频带的方法(例如参照专利文献1)。
在专利文献1所记载的方法中,在被突出的频带中以大于噪音的声级来输出声音。但是,当音量超过扬声器的输出性能的极限时,声音会失真,音质有时反而会劣化。或者,声音的高声级输出有时会给接听者的听觉器官带来不良影响。
鉴于此,有一种如下的方法:在周围噪音声级较大的情况下将接收声音记录于存储器,当周围噪音声级变小时同时进行记录再生(后续再生),由此,即使在高噪音环境下也容易听清接收声音(例如参照专利文献2)。
专利文献1:日本特开平11-202896号公报
专利文献2:日本特开2007-312040号公报
专利文献3:日本特开2002-258881号公报
专利文献4:日本特开2007-003682号公报
专利文献5:日本特开2002-287800号公报
专利文献6:日本特开2000-349893号公报
专利文献7:日本特开平10-049191号公报
在专利文献2所记载的方法中,每当噪音变大时因后续再生而产生的时间延迟持续增加。即使在噪音较小时,所产生的时间延迟也不会恢复。因此,存在着在接听完接收声音之前浪费了较多的时间的问题。
发明内容
本发明的方式的目的之一在于,提供一种能够将噪音产生时输入的再生用信号在没有噪音时以较短时间再生的技术。
本发明的方式之一是声音再生装置,具备:周围声音分析部,其对周围声音的特征进行分析;特征分析部,其对被输入的再生用信号的音响特征进行分析;再生定时调整部,其一方面将上述再生用信号记录于记录介质,另一方面,在后续再生的再生定时从上述记录介质读出上述再生用信号;再生速度变更部,其对从上述记录介质读出的再生用信号的再生速度进行变更;和控制部,其一方面对上述再生定时调整部进行控制,以便在与上述周围声音分析部的分析结果对应的再生定时再生上述再生用信号,另一方面对上述再生速度变更部进行控制,以便以与上述周围声音分析部的分析结果、以及由上述特征分析部得到的音响特征对应的再生速度来再生上述再生用信号。
根据本发明的方式之一,能够将噪音产生时被输入的再生用信号在没有噪音时以短时间再生。
附图说明
图1是表示实施方式1中的声音再生装置的构成例的图。
图2是表示实施方式2中的声音再生装置的构成例的图。
图3是表示实施方式2中的控制部的处理例的流程图。
图4是表示实施方式2中的再生定时调整部的处理例的流程图。
图5是表示实施方式2中的再生速度变更部的处理例的流程图。
图6是表示实施方式3中的声音再生装置的构成例的图。
图7是表示实施方式3中的声音再生装置的控制部的处理例的流程图。
图8是表示实施方式3中的再生定时调整部的处理例的流程图。
图9是表示实施方式4中的声音再生装置的构成例的图。
图10是表示实施方式4中的控制部的处理例的流程图。
具体实施方式
下面,参照附图对本发明的实施方式进行说明。实施方式的构成只是例示,本发明的方式不限于实施方式的构成。
<实施方式1>
图1是表示实施方式1涉及的声音再生装置的构成例的图。在图1中,声音再生装置1具备:与对声音再生装置1的周围声音进行集音的话筒2连接的周围声音分析部3;和作为被输入输入信号、即声音再生装置应该再生的再生用信号的特征分析部的声音分析部4。
而且,声音再生装置1具备被输入周围声音分析部3以及声音分析部4的输出的控制部5、和被输入输入信号以及来自控制部5的输出的再生定时调整部6。
并且,声音再生装置1具备被输入来自再生定时6的输出和来自控制部5的输出的再生速度变更部7。再生速度变更部7与用于输出再生声音的扬声器8连接。
周围声音分析部3被输入对声音再生装置1的周围噪音的发生状况进行表示的来自话筒2的输出信号。周围声音分析部3根据表示周围噪音的发生状况的输出信号来分析周围噪音(也称为周围声音)的特征。
声音分析部4被输入再生对象的输入信号、即再生用信号。声音分析部4对再生用信号的音响特征进行分析。
控制部5根据由周围声音分析部3输入的周围声音的分析结果、即周围噪音的特征,和声音分析部4对再生用信号的分析结果、即再生用信号的音响特征,来决定再生用信号的再生定时以及再生速度。控制部5将所决定的再生定时指示给再生定时调整部6,并且将所决定的再生速度指示给再生速度变更部7。
再生定时调整部6按照来自控制部5的指示,对再生用信号的再生定时进行调整。即,再生定时调整部6根据再生定时将再生用信号提供给再生速度变更部7。
再生速度变更部7按照来自控制部5的指示,对再生用信号的再生速度进行变更,并将再生信号与扬声器8连接。通过这样的构成,在声音再生装置1中,控制部根据周围声音分析部的分析结果和声音分析部的分析结果,对再生定时调整部6以及再生速度变更部7进行控制,以便进行如下的动作。
即,由再生定时调整部6保持周围声音分析部3的分析结果所表示的噪音时被输入的再生用信号。然后,在由周围声音分析部3表示了没有噪音的分析结果时,从再生定时调整部6向再生速度变更部7传递再生用信号。再生速度变更部7以与再生用信号的音响特征对应的再生速度进行再生用信号的再生处理。
由此,通过将噪音环境下被输入的再生用信号在噪音停止后的再生定时以比1快的倍速进行再生,能够将噪音环境下被输入的声音在容易听清的环境下以较短时间进行再生。由此,由于声音再生装置1的使用者能够在抑制了延迟的状态下收听再生声音,所以可以在通话目的下应用声音再生装置1。即,能够将声音再生装置1应用于电话机、智能手机、个人计算机那样的具有通话功能的电子设备。
<实施方式2>
图2表示了实施方式2涉及的声音再生装置的构成例(声音再生装置1A)。声音再生装置1A能够在噪音声级(也称为周围声音声级)较大的情况下错开声音再生装置1被输入的再生用信号的再生定时(改变),并且根据再生用信号的基音频率(pitch frequency)来变更再生时的话速。
声音再生装置1A例如能够应用于移动电话、智能手机、个人计算机那样的具有通话功能或者能够下载带有声音的动画文件和声音文件并进行再生的功能的电子设备。或者,也能够应用于无线电接收器或电视接收器那样的声音信号的接收装置。
在图2中,声音再生装置1A具备:与被输入周围杂音的话筒2连接的周围声音分析部3,和被输入输入信号、即再生用信号的特征分析部4A。再生用信号例如是来自通话对方的接听信号、动画声音数据的信号、收音机、电视的播送声音信号。再生用信号包括声音区间和非声音区间(包括无音区间),将声音区间中的信号称为声音信号,将非声音区间中的信号称为非声音信号。
而且,声音再生装置1A具备被输入周围声音分析部3以及特征分析部4A的输出的控制部5、和被输入再生用信号以及来自控制部5的输出的再生定时调整部6。
并且,声音再生装置1A具备被输入来自再生定时调整部6的输出和来自控制部5的输出的再生速度变更部7、和与再生定时调整部6以及控制部5连接的延迟时间测定部9。再生速度变更部7与用于输出再生声音的扬声器8连接。
再生定时调整部6具备读入从外部输入的再生用信号、将再生用信号输出至与由控制部5输入的动作模式对应的输出目的地的输出选择部64;将由输出选择部64输入的再生用信号记录到作为记录介质的缓冲器61的记录部62;和将来自输出选择部64的再生用信号作为数据记录于缓冲器61,并且根据缓冲器61中记录的数据生成再生用信号并将其输出的记录再生部63。
周围声音分析部3针对由对声音再生装置1A的周围的噪音进行集音的话筒2输入的信号(称为周围声音信号)进行分析,并输出表示周围声音的有无的判定结果。
具体而言,周围声音分析部3每隔单位时间便进行针对周围声音信号的分析,例如测定周围声音信号的每个单位时间的噪音声级。周围声音分析部3判断每个单位时间的噪音声级是否小于预先设定的阈值TH1。在噪音声级小于阈值TH1的情况下,周围声音分析部3输出“周围声音小”的判定结果,在噪音声级为阈值TH1以上的情况下,周围声音分析部3输出“周围声音大”的判定结果。这样,表示每个单位时间的周围声音(噪音)的有无的判定结果被输出而输入给控制部5。阈值TH1可以通过考虑周围声音的大小(噪音声级)是否对用户收听再生声音造成影响来决定。
特征分析部4A对每个单位时间的输入信号(再生用信号)的特征进行分析。作为分析结果,特征分析部4A将单位时间的再生用信号是声音信号还是非声音信号(包括无音)的判定结果输入给控制部5。在再生用信号是声音信号的情况下,特征分析部4A测定声音信号的基音频率,并将基音频率输入给控制部5。再生用信号是声音信号还是非声音信号的判定例如通过专利文献3(特开2002-258881号公报)所示的方法来进行。
另外,基音频率例如可以利用如下的(式1)以及(式2)来计算。
[数式1]
corr ( a ) = &Sigma; i = 0 M - 1 x ( i - a ) x ( i ) &Sigma; i = 0 M - 1 x ( i - a ) 2 &Sigma; i = 0 M - 1 x ( i ) 2 &CenterDot; &CenterDot; &CenterDot; ( 1 )
pitch=freq/a_max      …(2)
其中,
x:通话音的信号
M:计算相关系数的区间的长度(采样)
a:计算相关系数的信号的开始位置
pitch:基音频率(Hz)
corr(a):错开位置为a时的相关系数
a_max:与最大相关系数对应的a
i:信号的索引(采样)
freq:采样频率(Hz)
再生定时调整部6的输出选择部64根据来自控制部5的表示动作模式的控制信号,将再生用信号的输出目的地在记录部62、记录再生部63、“无输出(终端)”之间切换。
动作模式有:进行同时记录再生(后续再生)、即将从再生定时调整部6获取的再生用信号记录于缓冲器61,另一方面基于从缓冲器61读出的数据对再生用信号进行再生的“记录再生”模式;将再生定时调整部6被输入的再生用信号记录于缓冲器61的“记录”模式;和不对被输入的再生用信号进行处理的“无处理”模式。
在动作模式是“记录再生”的情况下,输出选择部64将再生用信号向记录再生部63输出。与此相对,在动作模式是“记录”的情况下,输出选择部64将再生用信号输出给记录部62。另外,在动作模式是“无处理”模式的情况下,输出选择部64不进行被输入的再生用信号的输出。
记录部62在动作模式“记录”中,进行将由输出选择部64输出的再生用信号作为数据蓄积到缓冲器61中的写入处理。记录再生部63在“记录再生”模式中,基于从缓冲器61读出的数据生成再生用信号并将其输出,另一方面进行将来自输出选择部64的再生用信号作为数据蓄积到缓冲器61中的写入处理。作为记录再生部63的输出的再生信号被输入给再生速度变更部7。
再生速度变更部7以遵循于由控制部5指示的再生倍率的再生速度来输出再生信号。由此,被再生速度变更部7调整后的再生速度的再生声音从扬声器8输出。
延迟时间测定部9取得为了进行再生定时调整而蓄积于缓冲器61的再生用信号的大小、即蓄积量,根据蓄积量计算出延迟时间,并将延迟时间输入给控制部5。
控制部5根据“存在周围声音”或者“不存在周围声音”的判定结果、声音区间或者非声音区间的判定结果、基音频率、以及延迟时间,决定每个单位时间的动作模式及再生倍率。所决定的动作模式被通知给再生定时调整部6,再生倍率被通知给再生速度变更部7。
在由周围声音分析部3判定为周围声音声级较小、且由延迟时间测定部9测定出的延迟时间为0的情况下,控制部5进行控制,以进行通常再生、即以1倍的速度进行再生。与此相对,在由周围声音分析部3判定为周围声音声级较大、且延迟小于规定的阈值TH2的情况下,控制部5进行控制,以使再生定时被调整。在上述以外的情况下,控制部5进行控制,以使短时间再生被进行。
其中,周围声音分析部3、特征分析部4A、控制部5、再生定时调整部6、再生速度变更部7例如可以被实现为通过专用的硬件电路的应用而实现的功能。
另外,周围声音分析部3、特征分析部4A、控制部5、再生定时调整部6、再生速度变更部7也可以被实现为通过由CPU(Central ProcessingUnit)、DSP(Digital Signal Processor)那样的处理器(未图示)执行存储器(记录介质:未图示)中保存的程序而产生的功能。缓冲器61由记录介质(例如RAM、闪存那样的半导体存储器)来实现。
或者,周围声音分析部3、特征分析部4A、再生定时调整部6以及再生速度变更部7也可以由专用的硬件实现,控制部5由专用或者通用的处理器进行的软件处理来实现。
图2所示的构成只是例示,图2所示的各模块所具有的功能可以变形成由多个模块来实现。或者,可以变形为图2的多个模块的功能由一个模块来实现。另外,可以变形为某个模块的一部分功能由其他模块来实现。
图3是表示图2所示的控制部5的处理例的流程图。图3所示的处理例如以声音再生装置1A的未图示的电源被接通为触发而开始执行。
图3所示的处理每隔单位时间或者规定周期由周围声音分析部3、特征分析部4A、控制部5、再生定时调整部6、再生速度变更部7以及延迟时间测定部9同步执行。
首先,控制部5获取对周围声音分析部3中的判定结果、即“噪音小”或者“噪音大”进行表示的信号(步骤S01)。
接着,控制部5从特征分析部4A获取表示再生用信号是声音信号还是非声音信号的判定结果(步骤S02)。此时,在再生用信号是声音信号的情况下,控制部5从特征分析部4A获取声音信号的基音频率(步骤S03)。因此,在再生用信号是非声音信号的情况下,不进行步骤S03的处理。
接着,控制部5从延迟时间测定部9获取延迟时间(步骤S04)。接着,控制部5判定周围声音分析部3的判定结果是否是“周围声音小”。此时,在判定结果是“周围声音小”的情况下(S05“是”),处理进入到步骤S06。与此相对,在判定结果是“周围声音大”的情况下(S05“否”),处理进入到步骤S12。
在步骤S06中,控制部5通过判定延迟时间是否为零、即缓冲器61的蓄积量是否为零,来判定是否有延迟。在没有延迟的情况下(S06“是”),处理进入到步骤S07。与此相对,在有延迟的情况下(S06“否”),处理进入到步骤S09。
在步骤S07中,控制部5将动作模式设定为“记录再生”。接着,控制部5将再生倍率设定为1倍(步骤S08)。然后,控制部5使处理进入到步骤S17,将动作模式“记录再生”赋予给再生定时调整部6,并且将再生速度“1倍”赋予给再生速度变更部7。然后,处理返回到步骤S01。
当在步骤S06中判定为有延迟、处理进入到步骤S09时,控制部5将动作模式设定为“记录再生”(步骤S09)。
接着,控制部5判定从缓冲器61读出的声音信号的基音频率是否为阈值TH3以上(步骤S10)。此时,如果基音频率为阈值TH3以上(S10“是”),则处理进入到步骤S08,声音信号的再生倍率被设定为1倍。与此相对,如果基音频率小于阈值TH3(S10“否”),则处理进入到步骤S11。
在步骤S11中,控制部5将再生倍率设定为X倍(例如1<X≤2)。对于X的值,例如可以将表示基音频率与再生倍率之间的相关的映射预先存储到控制部5中,将与基音频率对应的再生倍率设定为X。由于再生倍率提高,所以声音的频率变高,听取的容易度提高。
然后,处理进入到步骤S17,控制部5将动作模式“记录再生”赋予给再生定时调整部6,并且将再生速度“X倍”赋予给再生速度变更部7。然后,处理返回到步骤S01。
在处理从步骤S05进入到S12的情况下,控制部5判定输入信号、即再生用信号是否是声音信号。此时,在再生用信号是声音信号的情况下(S12“是”),处理进入到步骤S13。与此相对,在再生用信号是非声音信号的情况下(S12“否”),处理进入到步骤S15。
在步骤S13中,控制部13判定延迟时间是否为预先设定的阈值TH3以上。此时,在延迟时间为阈值TH3以上的情况下(S13“是”),处理进入到步骤S09,动作模式被设定为“记录再生”。
与之相对,在延迟时间小于阈值TH3的情况下(S13“否”),控制部5将动作模式设定为“记录”(步骤S14)。并且,控制部5将再生倍率设定为0倍。通过将再生倍率设定为0倍,来自扬声器8的再生声音输出被停止。
然后,处理进入到步骤S17,动作模式“记录”被赋予给再生定时调整部6,并且再生速度“0倍”被赋予给再生速度变更部7。然后,处理返回到步骤S01。
当在步骤S12中判定为再生用信号是非声音信号的情况下(S12“否”),控制部15将动作模式设定为“无处理”(步骤S15),在步骤S16中将再生倍率设定为0。然后,处理进入到步骤S17,动作模式“无处理”被赋予给再生定时调整部6,并且再生速度“0倍”被赋予给再生速度变更部7。然后,处理返回到步骤S01。
在动作模式“无处理”中,由于没有从输出选择部64输出再生用信号,所以不进行再生也不进行向缓冲器61的记录。因此,在缓冲器61中只蓄积声音信号。
根据图3所示的处理,在周围声音较小、没有延迟的情况下,以再生倍率为1倍对再生用信号进行再生,从扬声器8输出再生声音。与此相对,在周围声音较小、有延迟的情况下,再生用信号被记录于缓冲器61。由此,进行再生定时调整。另一方面,缓冲器61中记录的声音信号被以与该声音信号的基音频率对应的再生倍率再生。
与此相对,在周围声音较大但没有延迟的情况下,进行声音信号向缓冲器61的记录,停止再生声音的输出。由此,噪音环境化下的再生被限制,能够尝试周围声音降低时的再生。
另外,在周围声音较大、延迟也较大的情况下,进行与周围声音较小、有延迟的情况同样的动作。即,在周围的噪音较大但不允许再生的延迟的情况下,根据需要使再生倍率上升,以便尽可能输出容易听清的再生声音。
这样,在周围声音较小且也没有延迟的情况下,声音再生装置1A不对再生定时进行调整,而按照以1倍的速度来输出再生用信号的再生声音的方式进行动作。另一方面,在周围声音较大、延迟较小的情况下,声音再生装置1A按照停止再生声音的输出、试图调整再生定时的方式进行动作。并且,在周围声音较小并有延迟的情况下、以及周围声音较大且延迟较大的情况下,能够以提高再生速度来进行短时间再生的方式进行动作。
此外,在周围声音较大而延迟也较大的情况下,可以与基音频率的大小无关地设定大于1倍的再生倍率X。由此,能够在短时间减少缓冲器61的蓄积量。
图4是表示图2所示的再生定时调整部6的动作例的流程图。首先,再生定时调整部6的输出选择部64将由外部输入的再生用信号(输入信号)读入到未图示的内部存储器(步骤S21)。
接着,再生定时调整部6获取由控制部5输入的动作模式(步骤S22)。动作模式被写入到内部存储器。
接着,再生定时调整部6判定动作模式是否是“无处理”。此时,如果动作模式是“无处理”,则处理进入到步骤S27。此时,不进行来自输出选择部64的再生用信号的输出。与此相对,如果动作模式是“无处理”,则处理进入到步骤S24。该情况下,输出选择部64将再生用信号输出给记录部62。
在步骤S24中,由记录部62将再生用信号记录于缓冲器61,并且由再生定时调整部6管理的缓冲器61的数据记录位置被更新。
在步骤25中,再生定时调整部6判定动作模式是否是“记录再生”。此时,如果动作模式是“记录再生”(S25“是”),则处理进入到步骤S27。与此相对,如果动作模式不是“再生”(S25“否”),则处理进入到步骤S25。
在步骤S25中,再生定时调整部6读出缓冲器61中蓄积的数据,输出基于该数据的声音信号,并且对由再生定时调整部6管理的数据读出位置进行更新。然后,处理进入到步骤S27。
在步骤S27中,再生定时调整部6根据数据读出位置与数据记录位置之差,输出缓冲器61的蓄积量。蓄积量被输入给延迟时间测定部9。然后,处理返回到步骤S21。
这样,再生定时调整部6判定读入的再生用信号是否是声音信号,在是声音信号的情况下蓄积到缓冲器61中,在是非声音信号的情况下不进行向缓冲器61的蓄积。由此,能够实现仅对声音区间的信号、即声音信号进行记录再生的处理。
图5是表示图2所示的再生速度变更部7的动作例(短时间再生动作)的流程图。
首先,再生速度变更部7从控制部5获取再生倍率(步骤S31)。接着,再生速度变更部7判定再生倍率是否为0倍(步骤S32)。此时,如果再生倍率是0倍(S32“是”),则再生速度变更部7不进行再生处理,而将处理返回到步骤S31。因此,再生信号不被从扬声器8输出。
与此相对,如果再生倍率不是0倍(S32“否”),则再生速度变更部7将由记录再生部63输出的再生用信号读入到再生速度变更部7内的未图示的内部存储器(S33)。
接着,再生速度变更部7判定再生倍率是否为1倍(步骤S34)。此时,如果再生倍率是1倍(S34“是”),则再生速度变更部7以通常速度(1倍)进行再生处理,将再生信号向扬声器8输出。因此,从扬声器8输出1倍速度的再生信号。
与此相对,如果再生倍率不是1倍(S34“否”),则再生速度变更部7对从记录再生部63输出的再生用信号,以由控制部5指示的再生速度X倍进行再生处理(S36)。因此,从扬声器8输出X倍速度的再生信号。
这样,通过由再生速度变更部7将再生速度设为大于1倍的X倍(但最大值为2倍),可实现短时间再生。
根据实施方式2的声音再生装置1A,在周围噪音较大的情况下,仅将声音信号蓄积于缓冲器61,以使得只有再生用信号中的声音信号被同时记录再生(后续再生)。由此,能够避免不必要的时间延迟的增加。与此相对,在周围噪音较小的情况下,能够通过加快话速进行再生(加快再生速度)来缩短时间延迟。从而,可在短时间内听到再生声音。
因此,例如通过对再生定时及再生速度进行控制,以使时间延迟为规定的阈值以下(例如1秒左右),能够适用于通话用途。尤其是对于关门声或警报声那样的瞬时产生的噪音,能够输出容易听清的再生声音。
另外,根据声音再生装置1A,能够由再生定时调整部6将再生定时错开到(变更)周围噪音变小的时间点。由此,能够容易听清再生声音。
另外,根据声音再生装置1A,可以将在“周围声音大”的期间蓄积于缓冲器61的再生用信号限定为声音信号。由此,由于能够减少后续再生的再生用信号的量,所以可避免不必要的时间延迟的增加。而且,能够减少声音再生装置1A的系统构成所需要的存储器量。
另外,声音再生装置1A在使再生定时延迟时,能够按照将噪音即将变大时的规定时间量回溯再生的方式进行动作。由此,可避免在声音的中途开始进行后续再生而导致清晰度下降。
另外,声音再生装置1A能够使话语结束那样的声音变低的位置(基音频率较低的部分)的再生速度加快等。由此,可以在不降低再生声音的清晰度的情况下挽回时间延迟。
另外,声音再生装置1A通过在再生速度变更部7中利用话速变速技术,能够在保持原本声音的基音频率而不降低自然性的情况下挽回时间延迟。话速变速技术例如能够利用专利文献4(日本特开2007-003682号公报)所记载的技术。
另外,声音再生装置1A能够按照延迟时间不变大的方式执行再生控制。由此,能够在短时间内听清再生声音,尤其适用于通话。
另外,声音再生装置1A能够通过步骤S13的判定来进行上述再生定时调整及上述再生速度变更处理,以使时间延迟为规定值以下。
<实施方式3>
接着,对实施方式3涉及的声音再生装置进行说明。实施方式3具有与实施方式2共同的构成。因此,省略对共同点的说明,而以不同点为中心进行说明。
作为实施方式3,对能够在噪音声级较大的情况下错开再生用信号的再生定时,并且根据再生用信号中包含的声音区间长度来进行再生速度变更的声音再生装置进行说明。
图6是表示实施方式3中的声音再生装置1B的构成例的图。图6中的声音再生装置1B在以下方面与声音再生装置1A不同。
(1)特征分析部4取代基音频率将声音区间长度输入给控制部5。
(2)控制部5将基于声音区间长度的声音区间边界数据赋予给再生定时调整部6。声音区间边界数据是表示声音区间的开始时间点的数据。
(3)控制部5根据声音区间长度来决定再生速度。
(4)记录再生部63根据声音区间边界数据,以从声音区间的开头开始后续再生的方式,从缓冲器61读出数据。
除了以上的方面,声音再生装置1B的构成与声音再生装置1A的构成大致相同。
图7是表示实施方式3中的声音再生装置1B的控制部5的处理例的流程图。图7所示的处理与实施方式2中的控制部5的处理(图3)相比,在以下方面不同。
即,在步骤S03A中,控制部5从特征分析部4A获取声音区间长度。于是,控制部5生成根据声音区间长度而求出的缓冲器61上的声音区间边界数据。
另外,在步骤S10A中,控制部5判定应该从缓冲器61读出并再生的数据的声音区间长度是否为预先设定的阈值Th4以上。此时,如果声音区间长度为阈值TH4以上(S10A“是”),则处理进入到步骤S08,再生倍率被设定为1倍。与此相对,在声音区间长度小于阈值TH4的情况下(S10A“否”),再生倍率被设定为X倍(1<X≤2)。
并且,在步骤27A中,对再生定时调整部6赋予动作模式和声音区间边界数据。动作模式以及声音区间边界数据被保存在再生定时调整部6内的内部存储器中。
除了以上的方面,控制部5的处理与实施方式2相同,因此省略说明。
图8是表示实施方式3中的再生定时调整部6的处理例的流程图。图8所示的步骤S21以及S22与实施方式2中的处理(图5)相同。
在步骤S31中,再生定时调整部6获取声音区间边界数据,并将其保存于内部存储器。
接着,再生定时调整部6判定动作模式是否发生了变化,即,动作模式“记录再生”是否变化成了其他动作模式(“无处理”或者“记录”)(步骤S32)。在动作模式“记录再生”变化成了其他动作模式的情况下(S32“是”),处理进入到步骤S33,在动作模式“记录再生”没有变化成其他动作模式的情况下(S32“否”),处理进入到步骤S34。
在步骤S33中,再生定时调整部6将由再生定时调整部6管理的数据读出位置修正为声音区间的开头,并使处理进入到步骤S34。
在步骤S34中,再生定时调整部6判定动作模式是否是“无处理”。在动作模式是“无处理”的情况下(S34“是”),处理进入到步骤S38,在动作模式不是“无处理”的情况下(S34“否”),处理进入到步骤S35。
在步骤S35中,再生定时调整部6将再生用信号和声音区间边界数据记录于缓冲器61,并且对数据记录位置进行更新。
接着,再生定时调整部6判定动作模式是否是“记录再生”(步骤S36)。此时,在动作模式是“记录再生”的情况下(S36“是”),处理进入到步骤S37,在动作模式不是“记录再生”的情况下(S36“否”),处理进入到步骤S38。
在步骤S37中,再生定时调整部6的记录再生部63根据数据读出位置从声音区间的开头读出数据,生成并输出再生用信号(步骤S38)。
根据实施方式3,当在动作模式“记录再生”中对于从缓冲器61读出的声音信号,声音区间长度小于预先设定的阈值TH3时,由再生速度变更部7利用话速变换处理来进行加快话速的处理。对于再生速度变更处理,通过利用话速变换技术在保持原本声音的基音频率不变的情况下对发话速度进行变更,能够不降低自然性地挽回时间延迟。话速变换技术例如可以采用专利文献4(日本特开2007-003682号公报)所记载的技术。
由此,声音再生装置1B通过在再生速度变更部7中利用话速变换技术,能够保持原本声音的基音频率而不降低自然性地挽回时间延迟。
另外,在实施方式3的再生定时调整动作中,将蓄积有声音区间的声音信号的缓冲器61的读出位置设定为由声音分析部4A分析出的声音区间的开始位置。由此,在周围声音变小的情况下,能够回溯到声音区间的开头来再生声音信号。由此,可避免清晰度下降。
另外,根据实施方式3中的声音再生装置1B,例如能够针对“哎”、“啊”那样的声音区间长度较短的声音区间加快再生速度。由此,能够在不降低再生声音的清晰度的情况下挽回时间延迟。
<实施方式4>
接着,对实施方式4涉及的声音再生装置进行说明。实施方式4具有与实施方式3共同的构成。因此,省略共同点的说明,而以不同点为中心进行说明。
在实施方式4中,针对能够根据对周围噪音的产生状况学习而获得的结果和从存储器读出的输入信号所包含的声音区间长度,来进行再生定时的调整和再生速度变更的声音再生装置进行说明。
图9是表示实施方式4中的声音再生装置1C的构成例的图。声音再生装置1C的构成要素与实施方式3的声音再生装置1B(图6)相比,在以下方面不同。
(1)具有代替周围声音分析部3的周围声音分析部3A。周围声音分析部3A将来自话筒2的周围声音(噪音)读入到内部存储器,学习周围声音的产生间隔。即,周围声音分析部3A对噪音声级为阈值TH1以上的区间(噪音区间)的间隔进行测定,针对从某个噪音区间的结束时期到下一个噪音区间的开始时期为止的间隔,计算出如平均、方差那样的统计量作为周围声音产生间隔。周围声音产生间隔被输入给控制部5。
(2)延迟时间测定部9(图6)被省略。因此,基于缓冲器61的蓄积量的延迟时间不被赋予给控制部5。
(3)控制部5根据来自周围声音分析部3A的周围声音产生间隔、和来自特征分析部4A的声音/非声音的判定结果以及声音区间长度,决定再生定时调整部6的动作模式及再生速度。
除了以上的方面,声音再生装置1C的构成与声音再生装置1B的构成大致相同。
图10是表示实施方式4中的声音再生装置1C的控制部5的处理例的流程图。图10所示的处理例如可以以声音再生装置1C的电源接通作为触发来开始执行。
控制部5从周围声音分析部3A获取作为学习结果的周围声音产生间隔信息,并将其读入到控制部5内的内部存储器(未图示)(步骤S101)。周围声音产生间隔信息例如可以包含间隔时间长度、和根据间隔时间长度而求出的下一个噪音产生预测时刻。
接着,控制部5从特征分析部4A获取针对再生用信号的声音/非声音的判定结果,并将其读入到内部存储器(步骤S102)。
接着,控制部5从特征分析部4A获取声音区间长度,并将其读入到内部存储器(步骤S103)。
接着,控制部5利用声音/非声音的判定结果,判定被输入到再生定时调整部6的再生用信号是否是声音信号(步骤S104)。此时,在再生用信号是声音信号的情况下(S104“是”),处理进入到步骤S105。与此相对,在再生用信号是非声音信号的情况下(S104“否”),处理进入到步骤S113。
在步骤S105中,控制部5判定声音信号的声音区间长度是否比到周围声音产生为止的期间短。到周围声音产生为止的期间能够根据噪音产生预测时刻和当前时刻求出。
在声音区间长度比到周围声音产生为止的期间短的情况下(S105“是”),控制部5根据在周围声音产生之前声音信号的再生结束的课程,使处理进入到步骤S106。与此相对,在声音区间长度为到周围声音产生为止的期间以上的情况下(S105“否”),根据在声音信号的再生结束之前产生周围声音的过程,使处理进入到步骤S108。
在步骤S106中,控制部5将动作模式设定为“记录再生”。接着,控制部5将再生倍率设定为1倍(步骤S107)。然后,控制部5将动作模式“记录再生”向再生定时调整部6输出,并且将再生倍率“1倍”向再生速度变更部7输出(步骤S114)。然后,处理返回到步骤S101。
在处理进入到步骤S108的情况下,控制部5判定对声音区间长度乘以0.5而得到的值是否比(声音区间长度的1/2)到周围声音产生为止的期间短(小于)。
此时,在声音区间长度的1/2比到周围声音产生为止的期间短的情况下(S108“是”),处理进入到步骤S109。与此相对,在声音区间长度的1/2为到周围声音产生为止的期间以上的情况下(S108“否”),处理进入到步骤S111。
在步骤S109中,控制部5将动作模式设定为“记录再生”。接着,控制部5将再生倍率设定为X(1<X≤2)倍(步骤S110)。此时的X的值例如能够根据声音区间长度的长度来决定。
然后,控制部5将动作模式“记录再生”向再生定时调整部6输出,并且将再生倍率“X倍”向再生速度变更部7输出(步骤S114)。然后,处理返回到步骤S101。
在处理进入到步骤S111的情况下,控制部5将动作模式设定为“记录”。接着,控制部5将再生倍率设定为0倍(步骤S112)。
然后,控制部5将动作模式“记录”向再生定时调整部6输出,并且将再生倍率“0倍”向再生速度变更部7输出(步骤S114)。然后,处理返回到步骤S101。
在处理进入到步骤S104的情况下,控制部5将动作模式设定为“无处理”。接着,控制部5将再生倍率设定为0倍(步骤S112)。
然后,控制部5将动作模式“无处理”向再生定时调整部6输出,并且将再生倍率“0倍”向再生速度变更部7输出(步骤S114)。然后,处理返回到步骤S101。
根据实施方式4的声音再生装置1C,周围声音分析部3学习周围声音的间隔,并赋予给控制部5。控制部5对声音区间长度和到下一个周围声音(噪音)产生为止的期间进行比较,当在下一个噪音产生之前声音信号的再生结束时,进行控制以便以1倍速度进行同时记录再生。
与此相对,在到下一个周围声音产生为止的期间比声音区间长度长的情况下,若再生声音区间长度的声音信号,则可能在该再生过程中产生周围声音。该情况下,控制部5将声音区间长度声音区间长度的一半的长度(声音区间长度/2)与到下一个周围声音产生为止的期间进行比较,在声音区间长度/2的值比到下一个周围声音产生为止的期间短的情况下,进行控制以便以X倍速度进行同时记录再生。
在声音区间长度/2的值为到下一个周围声音产生为止的期间声音区间长度/2的值以上的情况下,只进行声音信号的记录,并延迟再生定时以便在周围声音间隔中进行再生。由此,能够在不发生因再生速度过快而导致清晰度下降的情况下,以不与噪音重叠的方式进行再生,从而能够听清再生声音。
附图标记说明:1、1A、1B、1C…声音再生装置;2…话筒;3、3A…周围声音分析部;4…声音分析部;4A…特征分析部;5…控制部;6…再生定时调整部;7…再生速度变更部;8…扬声器;61…缓冲器(存储器);62…记录部;63…记录再生部;64…输出选择部。

Claims (12)

1.一种声音再生装置,具备:
周围声音分析部,其对周围声音的特征进行分析;
特征分析部,其对再生用信号的音响特征进行分析;
再生定时调整部,其一方面将上述再生用信号记录于记录介质,另一方面在后续再生的再生定时从上述记录介质中读出上述再生用信号;
再生速度变更部,其对从上述记录介质读出的上述再生用信号的再生速度进行变更;和
控制部,其一方面对上述再生定时调整部进行控制,以便在与上述周围声音分析部的分析结果对应的再生定时再生上述再生用信号,另一方面对上述再生速度变更部进行控制,以便以与上述周围声音分析部的分析结果、和由上述特征分析部得到的音响特征对应的再生速度来再生上述再生用信号。
2.根据权利要求1所述的声音再生装置,其中,
上述周围声音分析部的分析结果包含周围声音声级,
上述控制部对上述再生定时调整部进行控制,以便在上述周围声音声级为规定的声级阈值以上的期间将上述再生用信号记录于上述记录介质,在上述周围声音声级小于上述规定的阈值的期间将上述记录介质中记录的上述再生用信号后续再生。
3.根据权利要求2所述的声音再生装置,其中,
还包括对与上述记录介质的蓄积量对应的延迟时间进行测量的测定部,
在上述周围声音声级为规定的声级阈值以上、且上述延迟时间小于规定的延迟阈值的情况下,上述控制部进行将上述再生用信号记录于上述记录介质的控制。
4.根据权利要求3所述的声音再生装置,其中,
在上述周围声音声级为规定的声级阈值以上,而上述延迟时间为规定的时间阈值以上的情况下,上述控制部对上述再生定时调整部进行控制,以便进行上述记录介质中记录的再生用信号的后续再生。
5.根据权利要求1所述的声音再生装置,其中,
由上述特征分析部得到的音响特征包含上述再生用信号是声音信号还是非声音信号的判断结果,
上述控制部对上述再生定时调整部进行控制,以便如果上述再生用信号是声音信号则向上述记录介质进行记录,如果上述再生用信号是非声音信号则不向上述记录介质进行记录。
6.根据权利要求1所述的声音再生装置,其中,
由上述特征分析部得到的音响特征包含作为声音信号的上述再生用信号的基音频率,
上述控制部对上述再生速度变更部进行控制,以便以与上述基音频率对应的再生速度来再生上述再生用信号。
7.根据权利要求1所述的声音再生装置,其中,
由上述特征分析部得到的音响特征包含作为声音信号的上述再生用信号的声音区间长度,
上述控制部对上述再生速度变更部进行控制,以便以与上述声音区间长度对应的再生速度来再生上述再生用信号。
8.根据权利要求1所述的声音再生装置,其中,
由上述特征分析部得到的音响特征包含作为声音信号的上述再生用信号的声音区间长度,
上述控制部对上述再生定时调整部进行控制,以便根据上述声音区间长度回溯到上述再生用信号的开头来读出上述记录介质中记录的上述再生用信号。
9.根据权利要求1所述的声音再生装置,其中,
上述周围声音分析部的分析结果包含周期性产生的周围声音的间隔,
由上述特征分析部得到的音响特征包含作为声音信号的上述再生用信号的声音区间长度,
上述控制部对上述再生速度变更部进行控制,以便以基于上述声音区间长度、与根据上述周围声音的间隔而求出的从当前时刻到下一个周围声音产生时刻为止的时间长度之间的关系的再生速度来再生上述再生用信号。
10.根据权利要求9所述的声音再生装置,其中,
在将再生速度设为最大时的上述声音区间长度的长度比上述时间长度长的情况下,上述控制部进行不再生上述再生用信号而将其记录于上述记录介质的控制。
11.根据权利要求1所述的声音再生装置,其中,
上述周围声音分析部学习周围声音的产生状况,
上述控制部对上述再生定时调整部进行控制,以便上述再生用信号的再生定时根据周围声音的产生的学习结果而变更。
12.一种声音再生方法,包括:
对周围声音的特征进行分析,
对再生用信号的音响特征进行分析,
按照在与周围声音的分析结果对应的再生定时,且以与上述音响特征对应的再生速度来再生上述再生用信号的方式进行控制。
CN200980161196XA 2009-09-02 2009-09-02 声音再生装置和声音再生方法 Pending CN102483920A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2009/065349 WO2011027437A1 (ja) 2009-09-02 2009-09-02 音声再生装置および音声再生方法

Publications (1)

Publication Number Publication Date
CN102483920A true CN102483920A (zh) 2012-05-30

Family

ID=43648998

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980161196XA Pending CN102483920A (zh) 2009-09-02 2009-09-02 声音再生装置和声音再生方法

Country Status (6)

Country Link
US (1) US8457955B2 (zh)
EP (1) EP2474974A1 (zh)
JP (1) JPWO2011027437A1 (zh)
KR (1) KR20120061862A (zh)
CN (1) CN102483920A (zh)
WO (1) WO2011027437A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9961441B2 (en) * 2013-06-27 2018-05-01 Dsp Group Ltd. Near-end listening intelligibility enhancement
JP2016225755A (ja) * 2015-05-28 2016-12-28 富士通株式会社 通話装置およびプログラム
JP7240116B2 (ja) * 2018-09-11 2023-03-15 カワサキモータース株式会社 乗物の音声システム及び音声出力方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06332500A (ja) * 1993-05-21 1994-12-02 Olympus Optical Co Ltd 可変速再生機能付音声再生装置
JPH1049191A (ja) * 1996-07-31 1998-02-20 Denso Corp 話速変換装置
US20070265839A1 (en) * 2005-01-18 2007-11-15 Fujitsu Limited Apparatus and method for changing reproduction speed of speech sound
JP2007312040A (ja) * 2006-05-17 2007-11-29 Sanyo Electric Co Ltd 放送受信装置
JP2008058956A (ja) * 2006-07-31 2008-03-13 Matsushita Electric Ind Co Ltd 音声再生装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08162981A (ja) * 1994-12-09 1996-06-21 Sanyo Electric Co Ltd 放送音声再生装置
JPH11202896A (ja) * 1998-01-14 1999-07-30 Kokusai Electric Co Ltd 音声高域強調方法及び音声高域強調装置
JP2000349893A (ja) 1999-06-08 2000-12-15 Matsushita Electric Ind Co Ltd 音声再生方法および音声再生装置
JP3849116B2 (ja) 2001-02-28 2006-11-22 富士通株式会社 音声検出装置及び音声検出プログラム
JP2002287800A (ja) 2001-03-28 2002-10-04 Toshiba Corp 音声信号処理装置
JP3804569B2 (ja) * 2002-04-12 2006-08-02 ブラザー工業株式会社 文章読み上げ装置、文章読み上げ方法、及びプログラム
JP4675692B2 (ja) 2005-06-22 2011-04-27 富士通株式会社 話速変換装置
WO2009011021A1 (ja) * 2007-07-13 2009-01-22 Panasonic Corporation 話速変換装置及び話速変換方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06332500A (ja) * 1993-05-21 1994-12-02 Olympus Optical Co Ltd 可変速再生機能付音声再生装置
JPH1049191A (ja) * 1996-07-31 1998-02-20 Denso Corp 話速変換装置
US20070265839A1 (en) * 2005-01-18 2007-11-15 Fujitsu Limited Apparatus and method for changing reproduction speed of speech sound
JP2007312040A (ja) * 2006-05-17 2007-11-29 Sanyo Electric Co Ltd 放送受信装置
JP2008058956A (ja) * 2006-07-31 2008-03-13 Matsushita Electric Ind Co Ltd 音声再生装置

Also Published As

Publication number Publication date
WO2011027437A1 (ja) 2011-03-10
US8457955B2 (en) 2013-06-04
JPWO2011027437A1 (ja) 2013-01-31
KR20120061862A (ko) 2012-06-13
EP2474974A1 (en) 2012-07-11
US20120158403A1 (en) 2012-06-21

Similar Documents

Publication Publication Date Title
CN102197422B (zh) 使用传感器阵列进行音频源接近度估计以用于减少噪音
JP4640461B2 (ja) 音量調整装置およびプログラム
KR100842618B1 (ko) 음악 파일 재생 방법 및 장치
JP5716595B2 (ja) 音声補正装置、音声補正方法及び音声補正プログラム
CN106612482B (zh) 一种调整音频参数的方法及移动终端
CN102257559A (zh) 基于掩蔽的增益控制
CN103270740A (zh) 声音控制装置、声音控制方法、声音控制程序以及移动终端装置
CN103177727A (zh) 一种音频频带处理方法及系统
CN109040934A (zh) 听力设备的调校方法和装置、听力设备
CN108733341B (zh) 一种语音交互方法及装置
US9754606B2 (en) Processing apparatus, processing method, program, computer readable information recording medium and processing system
CN102483920A (zh) 声音再生装置和声音再生方法
CN105869656B (zh) 一种语音信号清晰度的确定方法及装置
CN103312911B (zh) 数据处理方法和电子终端
JP2002091487A (ja) 音声認識装置、音声認識方法および音声認識プログラム
WO2023051622A1 (zh) 提升远场语音交互性能的方法和远场语音交互系统
CN105632523A (zh) 调节音频数据的音量输出值的方法和装置及终端
CN113259826B (zh) 在电子终端中实现助听的方法和装置
CN105577863A (zh) 录音方法及装置
CN104581538A (zh) 消除噪音的方法和装置
CN115904299A (zh) 音频播放音量的调节方法、装置和音频播放系统
JP2905112B2 (ja) 環境音分析装置
JP2000349893A (ja) 音声再生方法および音声再生装置
CN112181350B (zh) 一种主动式的终端控制方法与装置
CN112951265B (zh) 音频处理方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120530