CN114679512A - 老人智能手机通话实时降速方法及装置 - Google Patents

老人智能手机通话实时降速方法及装置 Download PDF

Info

Publication number
CN114679512A
CN114679512A CN202210308571.6A CN202210308571A CN114679512A CN 114679512 A CN114679512 A CN 114679512A CN 202210308571 A CN202210308571 A CN 202210308571A CN 114679512 A CN114679512 A CN 114679512A
Authority
CN
China
Prior art keywords
audio data
speed reduction
time
real
call
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210308571.6A
Other languages
English (en)
Inventor
刘晓东
郑鹏飞
陈立伟
郭晓枝
田红亮
张学松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Sprocomm Technologies Co ltd
Original Assignee
Shenzhen Sprocomm Technologies Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Sprocomm Technologies Co ltd filed Critical Shenzhen Sprocomm Technologies Co ltd
Priority to CN202210308571.6A priority Critical patent/CN114679512A/zh
Publication of CN114679512A publication Critical patent/CN114679512A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72433User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • G10L21/043Time compression or expansion by changing speed
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)

Abstract

本发明提供了一种老人智能手机通话实时降速方法及装置,包括,对从另一台手机经无线通信链路传输过来的原始音频数据以预设的频率进行音频数据采样;对采样的音频数据通过基于时域的语音变速不变调算法按照预设的降速速率进行降速处理;将降速处理的音频数据通过老人智能手机的听筒进行实时播放。本发明的有益效果在于:基于时域的语音变速不变调算法,对老人智能手机进行实时通话降速,能够利于老人与其他人进行通话时,听得更加仔细清晰,提高老人手机通话的使用体验。

Description

老人智能手机通话实时降速方法及装置
技术领域
本发明涉及一种通话实时降速方法及装置,尤其是指一种老人智能手机通话实时降速方法及装置。
背景技术
老年智能手机,通话播放语速跟普通的手机一样,对于反应迟钝的人,听起来有困难。
现有老年智能手机,大多情况下,除了可以将听筒的声音放大外,对实时通话无任何处理,导致很多老人使用通话功能不方便。
发明内容
本发明所要解决的技术问题是:提供一种老人智能手机通话实时降速方法及装置。
为了解决上述技术问题,本发明采用的技术方案为:一种老人智能手机通话实时降速方法,包括,
对从另一台手机经无线通信链路传输过来的原始音频数据以预设的频率进行音频数据采样;
对采样的音频数据通过基于时域的语音变速不变调算法按照预设的降速速率进行降速处理;
将降速处理的音频数据通过老人智能手机的听筒进行实时播放。
进一步的,对采样的音频数据进行降速前,还包括:
对采样的音频数据进行vad语音识别,判断每段采样的音频数据是否为语音,将为语音的音频数据作为需要进行降速处理的数据。
进一步的,老人智能手机通话实时降速方法还包括,
判断通话是否结束,若通话结束,则将采集的剩余的音频数据进行降速处理,并通过老人智能手机的听筒进行实时播放后,完成通话。
进一步的,对从另一台手机经无线通信链路传输过来的原始音频数据以预设的频率进行音频数据采样的步骤具体为:
对原始音频数据的采集频率为44.1kHz,每段原始音频数据的采集时长为30ms。
进一步的,老人智能手机通话实时降速方法还包括,
将原始音频数据进行解码,从pcm格式解码为short类型。
本发明还提供了一种老人智能手机通话实时降速装置,包括,
音频采集模块,用于对从另一台手机经无线通信链路传输过来的原始音频数据以预设的频率进行音频数据采样;
音频降速模块,用于对采样的音频数据通过基于时域的语音变速不变调算法按照预设的降速速率进行降速处理;
音频播放模块,用于将降速处理的音频数据通过老人智能手机的听筒进行实时播放。
进一步的,在音频降速模块前,还包括:
语音识别模块,用于对采样的音频数据进行vad语音识别,判断每段采样的音频数据是否为语音,将为语音的音频数据作为需要进行降速处理的数据。
进一步的,老人智能手机通话实时降速装置还包括,
通话结束判断模块,用于判断通话是否结束,若通话结束,则将采集的剩余的音频数据进行降速处理,并通过老人智能手机的听筒进行实时播放后,完成通话。
进一步的,音频采集模块中,对原始音频数据的采集频率为44.1kHz,每段原始音频数据的采集时长为30ms。
进一步的,老人智能手机通话实时降速装置还包括,
音频解码模块,用于将原始音频数据进行解码,从pcm格式解码为short类型。
本发明的有益效果在于:基于时域的语音变速不变调算法,对老人智能手机进行实时通话降速,能够利于老人与其他人进行通话时,听得更加仔细清晰,提高老人手机通话的使用体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的机构获得其他的附图。
图1为本发明实施例的老人智能手机通话实时降速方法流程图;
图2为本发明实施例的另一老人智能手机通话实时降速方法流程图;
图3为本发明实施例的老人智能手机通话实时降速装置框图;
图4为本发明实施例的另一老人智能手机通话实时降速装置框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
请参阅图1,本发明的第一实施例为:一种老人智能手机通话实时降速方法,包括,
S10、对从另一台手机经无线通信链路传输过来的原始音频数据以预设的频率进行音频数据采样;
S30、对采样的音频数据通过基于时域的语音变速不变调算法按照预设的降速速率进行降速处理;降速速率,一般设为0.8倍。
S40、将降速处理的音频数据通过老人智能手机的听筒进行实时播放。
本实施例方案,可以在原来通话的基础上,基于java,用AudioRecord此方法录制到下行音频数据,为了让java方法中能够调用c++中的降速算法实现的一些函数,书写Java本地接口。
在Java里面标识一个方法是JNI方法,使用关键字native,还可以在Kotlin里面使用externa1关键字。
生成JNI头文件,使用关键字external标识该方法是JNI方法,在调用这个方法时JVM会自动去调用Java_包名-类名-方法名的c++函数。Java提供了一个工具javah来自动生成这个头文件,当然也可以自己直接写,通过上面的javah帮助发现输入的是c1ass文件,Kotlin最终也会生成class文件。
除了上面说的externa1标识的方法调用c++代码。其实jni.h里面还提供一种方式,通过注册方式绑定Java与c++的函数关系,在JNI_OnLoad方法里面注册从而不需要编写JNI头文件,比较灵活方便,不需要每次都要生成头文件。
为了保证播放的音频数据清晰无杂音,录制和算法处理都采用了16kHz的采样频率,CHANNEL_CONFIGURATION_MONO(单声道),16BIT的采样格式,最后用AudioTrack进行播放。
本实施例中,基于时域的语音变速不变调算法,对老人智能手机进行实时通话降速,能够利于老人与其他人进行通话时,听得更加仔细清晰,不会遗漏重要对话和信息,提高老人手机通话的使用体验。
如图2所示,对采样的音频数据进行降速前,还包括:
S20、对采样的音频数据进行vad语音识别,判断每段采样的音频数据是否为语音,将为语音的音频数据作为需要进行降速处理的数据。
本过程,可以将静默状态的数据除去,这样语音的音频数据降速后,时长变长,能够进行部分抵消,减少通话延迟。
其中,老人智能手机通话实时降速方法还包括,
判断通话是否结束,若通话结束,则将采集的剩余的音频数据进行降速处理,并通过老人智能手机的听筒进行实时播放后,完成通话。
其中,对从另一台手机经无线通信链路传输过来的原始音频数据以预设的频率进行音频数据采样的步骤具体为:
对原始音频数据的采集频率为44.1kHz,每段原始音频数据的采集时长为30ms。
其中,老人智能手机通话实时降速方法还包括,
将原始音频数据进行解码,从pcm格式解码为short类型。
如图3所示,本发明的另一实施例为:一种老人智能手机通话实时降速装置,包括,
音频采集模块10,用于对从另一台手机经无线通信链路传输过来的原始音频数据以预设的频率进行音频数据采样;
音频降速模块30,用于对采样的音频数据通过基于时域的语音变速不变调算法按照预设的降速速率进行降速处理;
音频播放模块40,用于将降速处理的音频数据通过老人智能手机的听筒进行实时播放。
如图4所示,在音频降速模块30前,还包括:
语音识别模块20,用于对采样的音频数据进行vad语音识别,判断每段采样的音频数据是否为语音,将为语音的音频数据作为需要进行降速处理的数据。
其中,老人智能手机通话实时降速装置还包括,
通话结束判断模块,用于判断通话是否结束,若通话结束,则将采集的剩余的音频数据进行降速处理,并通过老人智能手机的听筒进行实时播放后,完成通话。
其中,音频采集模块10中,对原始音频数据的采集频率为44.1kHz,每段原始音频数据的采集时长为30ms。
其中,老人智能手机通话实时降速装置还包括,
音频解码模块,用于将原始音频数据进行解码,从pcm格式解码为short类型。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述老人智能手机通话实时降速装置的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种老人智能手机通话实时降速方法,其特征在于:包括,
对从另一台手机经无线通信链路传输过来的原始音频数据以预设的频率进行音频数据采样;
对采样的音频数据通过基于时域的语音变速不变调算法按照预设的降速速率进行降速处理;
将降速处理的音频数据通过老人智能手机的听筒进行实时播放。
2.如权利要求1所述的老人智能手机通话实时降速方法,其特征在于:对采样的音频数据进行降速前,还包括:
对采样的音频数据进行vad语音识别,判断每段采样的音频数据是否为语音,将为语音的音频数据作为需要进行降速处理的数据。
3.如权利要求1所述的老人智能手机通话实时降速方法,其特征在于:还包括,
判断通话是否结束,若通话结束,则将采集的剩余的音频数据进行降速处理,并通过老人智能手机的听筒进行实时播放后,完成通话。
4.如权利要求1所述的老人智能手机通话实时降速方法,其特征在于:对从另一台手机经无线通信链路传输过来的原始音频数据以预设的频率进行音频数据采样的步骤具体为:
对原始音频数据的采集频率为44.1kHz,每段原始音频数据的采集时长为30ms。
5.如权利要求1所述的老人智能手机通话实时降速方法,其特征在于:还包括,
将原始音频数据进行解码,从pcm格式解码为short类型。
6.一种老人智能手机通话实时降速装置,其特征在于:包括,
音频采集模块,用于对从另一台手机经无线通信链路传输过来的原始音频数据以预设的频率进行音频数据采样;
音频降速模块,用于对采样的音频数据通过基于时域的语音变速不变调算法按照预设的降速速率进行降速处理;
音频播放模块,用于将降速处理的音频数据通过老人智能手机的听筒进行实时播放。
7.如权利要求6所述的老人智能手机通话实时降速装置,其特征在于:在音频降速模块前,还包括:
语音识别模块,用于对采样的音频数据进行vad语音识别,判断每段采样的音频数据是否为语音,将为语音的音频数据作为需要进行降速处理的数据。
8.如权利要求6所述的老人智能手机通话实时降速装置,其特征在于:还包括,
通话结束判断模块,用于判断通话是否结束,若通话结束,则将采集的剩余的音频数据进行降速处理,并通过老人智能手机的听筒进行实时播放后,完成通话。
9.如权利要求6所述的老人智能手机通话实时降速装置,其特征在于:音频采集模块中,
对原始音频数据的采集频率为44.1kHz,每段原始音频数据的采集时长为30ms。
10.如权利要求6所述的老人智能手机通话实时降速装置,其特征在于:还包括,
音频解码模块,用于将原始音频数据进行解码,从pcm格式解码为short类型。
CN202210308571.6A 2022-03-25 2022-03-25 老人智能手机通话实时降速方法及装置 Pending CN114679512A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210308571.6A CN114679512A (zh) 2022-03-25 2022-03-25 老人智能手机通话实时降速方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210308571.6A CN114679512A (zh) 2022-03-25 2022-03-25 老人智能手机通话实时降速方法及装置

Publications (1)

Publication Number Publication Date
CN114679512A true CN114679512A (zh) 2022-06-28

Family

ID=82076065

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210308571.6A Pending CN114679512A (zh) 2022-03-25 2022-03-25 老人智能手机通话实时降速方法及装置

Country Status (1)

Country Link
CN (1) CN114679512A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5717818A (en) * 1992-08-18 1998-02-10 Hitachi, Ltd. Audio signal storing apparatus having a function for converting speech speed
US6272459B1 (en) * 1996-04-12 2001-08-07 Olympus Optical Co., Ltd. Voice signal coding apparatus
CN111627422A (zh) * 2020-05-13 2020-09-04 广州国音智能科技有限公司 语音加速检测方法、装置、设备及可读存储介质
WO2021218591A1 (zh) * 2020-04-27 2021-11-04 佛山市顺德区美的洗涤电器制造有限公司 语音处理方法及装置、家电设备和可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5717818A (en) * 1992-08-18 1998-02-10 Hitachi, Ltd. Audio signal storing apparatus having a function for converting speech speed
US6272459B1 (en) * 1996-04-12 2001-08-07 Olympus Optical Co., Ltd. Voice signal coding apparatus
WO2021218591A1 (zh) * 2020-04-27 2021-11-04 佛山市顺德区美的洗涤电器制造有限公司 语音处理方法及装置、家电设备和可读存储介质
CN111627422A (zh) * 2020-05-13 2020-09-04 广州国音智能科技有限公司 语音加速检测方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN107995360B (zh) 通话处理方法及相关产品
CN1306472C (zh) 分布式语音识别系统中用于发送语音活动的系统和方法
CN101809979B (zh) 用于车辆上的数据通信的方法
JP2011511962A (ja) コンテキスト・デスクリプタ伝送のためのシステム、方法、および装置
CN103903627A (zh) 一种语音数据的传输方法及装置
CN103971696A (zh) 语音处理方法、装置及终端设备
CN103401984A (zh) 蓝牙耳机及通讯装置
JP2006527528A (ja) 音声チャネルを介してデータを伝送するための方法及び装置
US10504538B2 (en) Noise reduction by application of two thresholds in each frequency band in audio signals
JPH10187198A (ja) ハンズフリー音声メモシステムおよび方法
EP0725499A1 (en) Transmitter-receiver
CN102781075A (zh) 一种降低移动终端通话功耗的方法及移动终端
CN100504840C (zh) 用于背景噪声快速动态估计的方法
CN111199751B (zh) 一种麦克风的屏蔽方法、装置和电子设备
CN101277338A (zh) 一种记录通信终端下行语音信号的方法及该通信终端
JP2001186221A (ja) ディジタル通信装置または関連装置の改良
JP6549009B2 (ja) 通信端末及び音声認識システム
CN114679512A (zh) 老人智能手机通话实时降速方法及装置
CN109510891A (zh) 语音控制录音装置及方法
CN112927680B (zh) 一种基于电话信道的声纹有效语音的识别方法及装置
CN104078049B (zh) 信号处理设备和信号处理方法
JP2014230135A (ja) 通話装置及びマスキング音生成プログラム
CN111698602A (zh) 耳机及其耳机控制方法、控制装置和可读存储介质
KR100664117B1 (ko) 이동통신단말기의 백색잡음 감소장치 및 방법
CN116631456A (zh) 一种声控通讯处理方法、耳机、存储介质及计算机

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination