CN113726940A - 录音方法和装置 - Google Patents

录音方法和装置 Download PDF

Info

Publication number
CN113726940A
CN113726940A CN202110663657.6A CN202110663657A CN113726940A CN 113726940 A CN113726940 A CN 113726940A CN 202110663657 A CN202110663657 A CN 202110663657A CN 113726940 A CN113726940 A CN 113726940A
Authority
CN
China
Prior art keywords
recording
terminal equipment
signal
digital signal
interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110663657.6A
Other languages
English (en)
Other versions
CN113726940B (zh
Inventor
杨枭
玄建永
刘镇亿
吴元友
张盛伟
褚建飞
叶千峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Honor Device Co Ltd
Original Assignee
Honor Device Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honor Device Co Ltd filed Critical Honor Device Co Ltd
Priority to CN202110663657.6A priority Critical patent/CN113726940B/zh
Publication of CN113726940A publication Critical patent/CN113726940A/zh
Priority to PCT/CN2022/088074 priority patent/WO2022262410A1/zh
Priority to EP22790187.3A priority patent/EP4131907A4/en
Priority to US17/909,382 priority patent/US20240201944A1/en
Application granted granted Critical
Publication of CN113726940B publication Critical patent/CN113726940B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6008Substation equipment, e.g. for use by subscribers including speech amplifiers in the transmitter circuit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/64Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
    • H04M1/642Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations storing speech in digital form
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/162Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72433User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72469User interfaces specially adapted for cordless or mobile telephones for operating the device by selecting functions from two or more displayed items, e.g. menus or icons

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请实施例提供一种录音方法和装置,涉及终端技术领域,方法包括:终端设备显示第一界面,第一界面中包括第一控件,第一控件包括;用于选定输出规格为第一位宽音质的录音的第一选项,以及,用于选定输出规格为第二位宽音质的录音的第二选项;当终端设备接收到选定第一选项的操作时,终端设备对麦克风获取的录音进行处理,得到第一位宽的录音;或者,当终端设备接收到选定第二选项的操作时,终端设备对麦克风获取的录音进行处理,得到第二位宽的录音。这样,终端设备可以为用户提供多种录音音质的选项,进而用户可以根据需求灵活的选择合适的录音音质。

Description

录音方法和装置
技术领域
本申请涉及终端技术领域,尤其涉及一种录音方法和装置。
背景技术
目前,随着终端技术的发展,用户对于终端设备的功能需求也越发多样化,为了满足用户对于声音的记录需求,较多终端设备支持录音或录像等功能。
通常情况下,在利用终端设备实现录音功能时,终端设备可以基于麦克风接收环境中的声音信号,并将声音信号转化为电信号,保存在存储器中。
然而,当环境中的声音信号过大或过小时,终端设备则难以获取较好的录音效果。
发明内容
本申请实施例提供一种录音方法和装置,终端设备可以实现对信号的增益的灵活调整,进而获取较好的录音效果。
第一方面,本申请实施例提供一种录音方法,终端设备包括麦克风,方法包括:终端设备显示第一界面,第一界面中包括第一控件,第一控件包括;用于选定输出规格为第一位宽音质的录音的第一选项,以及,用于选定输出规格为第二位宽音质的录音的第二选项;当终端设备接收到选定第一选项的操作时,终端设备对麦克风获取的录音进行处理,得到第一位宽的录音;或者,当终端设备接收到选定第二选项的操作时,终端设备对麦克风获取的录音进行处理,得到第二位宽的录音。这样,终端设备可以为用户提供多种录音音质的选项,进而用户可以根据需求灵活的选择合适的录音音质。
其中,该第一界面可以为选择录音音质对应的界面,该第一控件可以为录音音质选项,该第一选项可以为标准音质对应的选项,该第二选项可以为高清音质对应的选项。
在一种可能的实现方式中,还包括:终端设备显示第二界面,第二界面中包括第二控件;终端设备接收针对第二控件的第一操作;响应于第一操作,终端设备显示第三界面;第三界面中包括第三控件;终端设备接收针对第三控件的第二操作;终端设备显示第一界面,包括:响应于第二操作,终端设备显示第一界面。这样,终端设备可以通过接收用户对于录音中的功能的触发,开启录音音质的设置,进而终端设备可以实现用户对于录音音质的灵活设置。
其中,该第二界面可以为打开录音应用程序时显示的界面,该第二控件可以为用于开启录音应用程序对应的更多功能的控件,该第一操作可以为触发该开启录音应用程序对应的更多功能的控件的操作;该第三界面可以触发该开启录音应用程序对应的更多功能的控件所显示的界面,该第三控件可以为用于设置录音音质的控件,该第二操作可以为触发该用于设置录音音质的控件。
在一种可能的实现方式中,第二界面中还包括第四控件,终端设备对麦克风获取的录音进行处理,得到第一位宽的录音,包括:终端设备接收针对第四控件的第三操作;响应于第三操作,终端设备对麦克风获取的录音进行处理,得到第一位宽的录音。这样,终端设备基于用户设置录音音质并且对于录音控件的触发,实现录音。
其中,该第四控件可以为开启录音音质的控件,该第三操作可以为触发该开启录音音质的控件的操作。
在一种可能的实现方式中,第三界面中还包括:以列表形式显示的用于实现语音转文本服务的第五控件、用于实现录音文件的排序的第六控件以及用于查看录音应用程序的信息的第七控件。
在一种可能的实现方式中,第二界面中还包括录音文件,录音文件的周围显示录音文件对应的第一标识;第一标识用于标识录音文件的音质类型。这样,用户可以很容易的通过第一标识了解当前录音文件的音质类型。
在一种可能的实现方式中,还包括:终端设备接收到针对录音文件的第四操作;响应于第四操作,终端设备显示第四界面;第四界面中包括录音播放标识以及第二标识,第二标识用于标识录音文件的音频类型,第二标识与第一标识不同。这样,用户可以很容易的通过第一标识了解当前录音文件的音质类型。
其中,该第四操作可以为打开录音文件的操作,该第四界面可以开启的录音文件对应的界面。
在一种可能的实现方式中,还包括:终端设备显示第五界面,第五界面中包括第八控件;终端设备接收针对第八控件的第五操作;终端设备显示第一界面,包括:响应于第五操作,终端设备显示第一界面。
其中,该第五界面可以为打开录音应用程序时显示的界面,该第八控件可以为开启录音的控件,该第五操作可以为触发该开启录音的控件对应的操作。
在一种可能的实现方式中,终端设备还包括编译码器CODEC,终端设备对麦克风获取的录音进行处理,得到第一位宽的录音,包括:终端设备基于第二位宽,对麦克风获取的录音进行处理,得到处理后的第一信号;第二位宽为终端设备默认的位宽;终端设备将第一信号转换为第一位宽对应的信号,得到第一位宽的录音;或者,终端设备基于第二位宽,在CODEC中将麦克风获取的录音转换为第一位宽对应的信号;终端设备对第一位宽对应的信号进行处理,得到第一位宽的录音。这样,终端设备可以基于对模拟增益的调节,在环境声压级较大时减少MIC中削波引起的失真,并在环境声压级较小时放大声音,扩展信号的动态范围,进而获取更好的录音效果。
其中,该第一幅度信息可以为短时信号幅度,该第一模拟增益信息可以为短时信号幅度对应的模拟增益;该第一幅度信息与第一模拟增益信息的对应关系可以由调节策略表中得到。
在一种可能的实现方式中,终端设备基于第二位宽,对麦克风获取的录音进行处理,得到处理后的第一信号,包括:终端设备基于第二位宽,将麦克风获取的录音输入至CODEC中,得到麦克风获取的录音对应的数字信号;终端设备计算数字信号的第一幅度信息;终端设备根据第一幅度信息与第一模拟增益信息的对应关系,得到第一幅度信息对应的第一模拟增益信息;终端设备基于第一模拟增益信息,对数字信号进行模拟增益调节,得到处理后的第一信号。这样,终端设备可以基于用户设置的位宽,对信号进行处理,进而获取更好的录音效果。
在一种可能的实现方式中,终端设备计算数字信号的第一幅度信息,包括:终端设备利用快速傅里叶变换FFT,将数字信号转化为频域信号;终端设备对频域信号进行滤波,得到滤波后的信号;终端设备计算滤波后的信号对应的幅度谱;终端设备基于第一时间长度,计算数字信号的第一幅度信息。这样,由于环境声压级可以随着时间快速变化,且测量时间越长,测量精度越不准确,则终端设备可以利用短时信号幅度标识环境的声压级的变化情况。
在一种可能的实现方式中,终端设备基于第二位宽,对麦克风获取的录音进行处理,得到处理后的第一信号,包括:终端设备基于第二位宽,将麦克风获取的录音输入至CODEC中,得到麦克风获取的录音对应的数字信号;终端设备基于数字信号的长时功率,和数字信号中超出第一幅度阈值或第二幅度阈值的采样点数,确定数字信号的类型;终端设备根据数字信号的类型与第二模拟增益信息的对应关系,确定数字信号的类型对应的第二模拟增益信息;终端设备基于第二模拟增益信息,对麦克风获取的录音进行处理,得到模拟增益处理后的数字信号;终端设备根据第二模拟增益信息与数字信号的初始模拟增益信息的差值,确定数字信号对应的数字增益信息;终端设备基于数字增益信息,对模拟增益处理后的数字信号进行处理,得到处理后的第一信号。这样,终端设备可以基于对模拟增益和数字增益的调节,在环境声压级较大时减少MIC中削波引起的失真,并在环境声压级较小时放大声音,扩展信号的动态范围,进而获取更好的录音效果。
在一种可能的实现方式中,数字信号的类型包括第一类型数字信号,第二类型数字信号以及第三类型数字信号;第一类型数字信号为满足第一条件的信号;第二类型数字信号为满足第二条件的信号;第三类型数字信号为不满足第二条件的信号;第一条件为数字信号中大于第一幅度阈值的采样点数大于第一计数阈值;第二条件为数字信号中大于第二幅度阈值的采样点数大于第二计数阈值,且数字信号的长时功率大于第一长时功率阈值。
其中,该第一类型数字信号可以为短时削波大信号,该第二类型数字信号可以为长时大信号,该第三类型数字信号可以为长时小信号;该第一幅度阈值可以称为第一削波阈值,第二幅度阈值可以称为第二削波阈值。
在一种可能的实现方式中,第一位宽为16比特,第二位宽为24比特或32比特。
在一种可能的实现方式中,终端设备包括录音算法模块和CODEC,当终端设备接收到选定第一选项的操作时,终端设备对麦克风获取的录音进行处理,得到第一位宽的录音,包括:当终端设备接收到选定第一选项的操作时,终端设备基于录音文件的格式以及选定第一选项的操作,向录音算法模块和/或CODEC下发第一指令;终端设备的录音算法模块和/或CODEC基于第一指令,对麦克风获取的录音进行处理,得到第一位宽的录音。
第二方面,本申请实施例提供一种录音装置,终端设备包括麦克风,装置包括:显示单元,用于显示第一界面,第一界面中包括第一控件,第一控件包括;用于选定输出规格为第一位宽音质的录音的第一选项,以及,用于选定输出规格为第二位宽音质的录音的第二选项;当终端设备接收到选定第一选项的操作时,处理单元,用于对麦克风获取的录音进行处理,得到第一位宽的录音;或者,当终端设备接收到选定第二选项的操作时,处理单元,还用于对麦克风获取的录音进行处理,得到第二位宽的录音。
在一种可能的实现方式中,显示单元,还用于显示第二界面,第二界面中包括第二控件;处理单元,还用于接收针对第二控件的第一操作;响应于第一操作,显示单元,还用于显示第三界面;第三界面中包括第三控件;处理单元,还用于接收针对第三控件的第二操作;响应于第二操作,显示单元,还用于显示第一界面。
在一种可能的实现方式中,第二界面中还包括第四控件,处理单元,具体用于接收针对第四控件的第三操作;响应于第三操作,处理单元,还具体用于对麦克风获取的录音进行处理,得到第一位宽的录音。
在一种可能的实现方式中,第三界面中还包括:以列表形式显示的用于实现语音转文本服务的第五控件、用于实现录音文件的排序的第六控件以及用于查看录音应用程序的信息的第七控件。
在一种可能的实现方式中,第二界面中还包括录音文件,录音文件的周围显示录音文件对应的第一标识;第一标识用于标识录音文件的音质类型。
在一种可能的实现方式中,处理单元,还用于接收到针对录音文件的第四操作;响应于第四操作,显示单元,还用于显示第四界面;第四界面中包括录音播放标识以及第二标识,第二标识用于标识录音文件的音频类型,第二标识与第一标识不同。
在一种可能的实现方式中,显示单元,还用于显示第五界面,第五界面中包括第八控件;处理单元,还用于接收针对第八控件的第五操作;响应于第五操作,显示单元,还用于显示第一界面。
在一种可能的实现方式中,终端设备还包括编译码器CODEC,处理单元,具体用于:基于第二位宽,对麦克风获取的录音进行处理,得到处理后的第一信号;第二位宽为终端设备默认的位宽;将第一信号转换为第一位宽对应的信号,得到第一位宽的录音;或者,基于第二位宽,在CODEC中将麦克风获取的录音转换为第一位宽对应的信号;对第一位宽对应的信号进行处理,得到第一位宽的录音。
在一种可能的实现方式中,处理单元,具体用于:基于第二位宽,将麦克风获取的录音输入至CODEC中,得到麦克风获取的录音对应的数字信号;计算数字信号的第一幅度信息;根据第一幅度信息与第一模拟增益信息的对应关系,得到第一幅度信息对应的第一模拟增益信息;基于第一模拟增益信息,对数字信号进行模拟增益调节,得到处理后的第一信号。
在一种可能的实现方式中,处理单元,具体用于:利用快速傅里叶变换FFT,将数字信号转化为频域信号;对频域信号进行滤波,得到滤波后的信号;计算滤波后的信号对应的幅度谱;基于第一时间长度,计算数字信号的第一幅度信息。
在一种可能的实现方式中,处理单元,具体用于:基于第二位宽,将麦克风获取的录音输入至CODEC中,得到麦克风获取的录音对应的数字信号;基于数字信号的长时功率,和数字信号中超出第一幅度阈值或第二幅度阈值的采样点数,确定数字信号的类型;根据数字信号的类型与第二模拟增益信息的对应关系,确定数字信号的类型对应的第二模拟增益信息;基于第二模拟增益信息,对麦克风获取的录音进行处理,得到模拟增益处理后的数字信号;根据第二模拟增益信息与数字信号的初始模拟增益信息的差值,确定数字信号对应的数字增益信息;基于数字增益信息,对模拟增益处理后的数字信号进行处理,得到处理后的第一信号。
在一种可能的实现方式中,数字信号的类型包括第一类型数字信号,第二类型数字信号以及第三类型数字信号;第一类型数字信号为满足第一条件的信号;第二类型数字信号为满足第二条件的信号;第三类型数字信号为不满足第二条件的信号;第一条件为数字信号中大于第一幅度阈值的采样点数大于第一计数阈值;第二条件为数字信号中大于第二幅度阈值的采样点数大于第二计数阈值,且数字信号的长时功率大于第一长时功率阈值。
在一种可能的实现方式中,第一位宽为16比特,第二位宽为24比特或32比特。
在一种可能的实现方式中,终端设备包括录音算法模块和CODEC,处理单元,具体用于:当终端设备接收到选定第一选项的操作时,终端设备基于录音文件的格式以及选定第一选项的操作,向录音算法模块和/或CODEC下发第一指令;基于第一指令,对麦克风获取的录音进行处理,得到第一位宽的录音。
第三方面,本申请实施例提供一种录音装置,包括处理器和存储器,存储器用于存储代码指令;处理器用于运行代码指令,使得电子设备以执行如第一方面或第一方面的任一种实现方式中描述的录音方法。
第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质存储有指令,当指令被执行时,使得计算机执行如第一方面或第一方面的任一种实现方式中描述的录音方法。
第五方面,一种计算机程序产品,包括计算机程序,当计算机程序被运行时,使得计算机执行如第一方面或第一方面的任一种实现方式中描述的录音方法。
应当理解的是,本申请的第二方面至第五方面与本申请的第一方面的技术方案相对应,各方面及对应的可行实施方式所取得的有益效果相似,不再赘述。
附图说明
图1为可能的实现方式中的一种录音示意图;
图2为本申请实施例提供的一种终端设备的结构示意图;
图3为本申请实施例提供的一种设置录音音质的界面示意图;
图4为本申请实施例提供的另一种设置录音音质的界面示意图;
图5为本申请实施例提供的一种提示录音音质的界面示意图;
图6为本申请实施例提供的另一种提示录音音质的界面示意图;
图7为本申请实施例提供的一种前半段链路高位宽+后半段链路位宽转换的录音方法的流程示意图;
图8为本申请实施例提供的另一种前半段链路高位宽+后半段链路位宽转换的录音方法的流程示意图;
图9为本申请实施例提供的一种增益调整的信号示意图;
图10为本申请实施例提供的一种全链路统一位宽的录音方法的流程示意图;
图11为本申请实施例提供的另一种全链路统一位宽的录音方法的流程示意图;
图12为本申请实施例提供的一种录音方法的流程示意图;
图13为本申请实施例提供的一种录音装置的结构示意图;
图14为本申请实施例提供的一种控制设备的硬件结构示意图;
图15为本申请实施例提供的一种芯片的结构示意图。
具体实施方式
为了便于清楚描述本申请实施例的技术方案,在本申请的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。例如,第一终端设备和第二终端设备仅仅是为了区分不同的终端设备,并不对其先后顺序进行限定。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
需要说明的是,本申请中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
本申请中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。
随着终端技术的发展,终端设备的功能越来越全面,例如终端设备中的录音功能、或摄像功能等已经成为人们日常生活中必不可少的功能之一。
然而,终端设备的录音功能以及摄像功能中的录音部分等存在以下两个主要问题:
其一,由于终端设备中的麦克风可以基于环境中的声音的大小(或可以理解为环境声压级的大小),对接收到的声音信号进行不同程度的处理,该处理过程影响终端设备的录音效果。例如,当环境声压级过大时,麦克风输出的模拟信号会产生削波,造成录音的失真,进而当终端设备对削波后的模拟信号进行模拟增益处理并转换成数字信号后,削波导致的失真可以被进一步放大;或者,当环境声压级过小时,麦克风输出的模拟信号幅度较小,很容易被噪声掩盖,进而影响终端设备的录音效果。
其二,较多终端设备默认采用16比特(bit)的音频录制能力,未提供24bit/32bit等更高规格的无损音频录制能力。其中,相比于16bit的录音音质,24bit/32bit的录音音质更为清晰。
为解决上述问题,可能的实现方式中,提供了一种录音方法。示例性的,图1为可能的实现方式中的一种录音方法示意图。如图1所示,其中,实现该录音方法的终端设备可以包括:主芯片和编译码器(coder-decoder,CODEC)。主芯片中包括数字信号处理(digitalsignal processing,DSP)模块,该DSP模块可以包括录音算法模块,录音算法模块中执行录音算法HDR以及录音处理等。该CODEC中可以采用两组可编程增益放大器(pmgrammablegain amplifier,PGA)+模拟数字转换器(analog-to-digital converter,ADC),具体方法可以包括如下步骤:
S101、终端设备基于麦克风(microphone,MIC)获取环境中的声音信号,并将声音信号转化为模拟信号。
本申请实施例中,当环境中的声音信号的强度较大时,MIC可以对该声音信号进行削波处理。其中,MIC的数量可以为一个或多个。
S102、终端设备中的CODEC对模拟信号进行处理,输出该模拟信号对应的数字信号。
本申请实施例中,该CODEC中包括两组PGA+ADC,并分别构成两个录音通路。如图1所示,模拟增益PGA1和ADC1可以构成通路1,且通路1中的PGA1可以设置较大的模拟增益,用于采集模拟信号中的较小的信号;模拟增益PGA2和ADC2构成通路2,且通路2中的PGA2可以设置较小的模拟增益,用于降低削波影响,并采集模拟信号中的较大的信号。其中,该PGA1和PGA2用于对模拟信号进行放大、转换或滤波等处理;该ADC1和ADC2用于将模拟信号转化为数字信号。
示例性的,当MIC的数量为多个时,每个MIC可以作为通路1和通路2的输出,或者也可以理解为,每个MIC均占用上述通路1和通路2。
S103、终端设备基于录音算法高动态范围(high dynamic range,HDR)实时分析两个通路的信号质量,并选择信号质量较好的通路中的数字信号。
示例性的,若通路1的削波严重时,则终端设备可以选择通路2的数字信号进行录音处理。
S104、对数字信号进行录音处理。
然而,由于上述S101-S104所示的步骤中的录音方法,采用双PGA+ADC的CODEC,占用较多的硬件资源,且难以支持较多的MIC。例如,通常情况下,该录音方法对应的设备中包含5个PGA+ADC,当麦克风的数量为3时,则需要6个PGA+ADC,因此难以实现较多MIC的录音处理。
有鉴于此,本申请实施例提供一种录音方法,终端设备可以在录音算法中增加增益调节策略,并根据当前信号的情况,对信号的模拟增益和/或数字增益进行灵活调节,扩展信号的动态范围,进而减少由于麦克风中的削波处理对录音效果的影响,得到较好的录音效果;并且,终端设备可以实现用户对于输出的录音音质的设置。
可以理解的是,上述终端设备也可以称为终端,(terminal)、用户设备(userequipment,UE)、移动台(mobile station,MS)、移动终端(mobile terminal,MT)等。终端设备可以为具有录音功能和/或录像功能等的手机(mobile phone)、智能电视、穿戴式设备、平板电脑(Pad)、带无线收发功能的电脑、虚拟现实(virtual reality,VR)终端设备、增强现实(augmented reality,AR)终端设备、工业控制(industrial control)中的无线终端、无人驾驶(self-driving)中的无线终端、远程手术(remote medical surgery)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端等等。本申请的实施例对终端设备所采用的具体技术和具体设备形态不做限定。因此,
为了能够更好地理解本申请实施例,下面对本申请实施例的终端设备的结构进行介绍。示例性的,图2为本申请实施例提供的一种终端设备的结构示意图。
终端设备可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,指示器192,摄像头193,以及显示屏194等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本申请实施例示意的结构并不构成对终端设备的具体限定。在本申请另一些实施例中,终端设备可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。处理器110中还可以设置存储器,用于存储指令和数据。
USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为终端设备充电,也可以用于终端设备与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他电子设备,例如AR设备等。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。电源管理模块141用于连接充电管理模块140与处理器110。
终端设备的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。终端设备中的天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。
移动通信模块150可以提供应用在终端设备上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。
无线通信模块160可以提供应用在终端设备上的包括无线局域网(wirelesslocalarea networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequencymodulation,FM)等无线通信的解决方案。
终端设备通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。在一些实施例中,终端设备可以包括1个或N个显示屏194,N为大于1的正整数。
终端设备可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
摄像头193用于捕获静态图像或视频。在一些实施例中,终端设备可以包括1个或N个摄像头193,N为大于1的正整数。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展终端设备的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,可执行程序代码包括指令。内部存储器121可以包括存储程序区和存储数据区。
终端设备可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。终端设备可以通过扬声器170A收听音乐,或收听免提通话。受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当终端设备接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。耳机接口170D用于连接有线耳机。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。本申请实施例中,终端设备可以拥有设置一个麦克风170C。例如当终端设备设置3个麦克风170C,并开启终端设备中的录音功能时,终端设备可以分别获取3个麦克风170C中的音频信号;并分别对3个麦克风170C中的音频信号进行模拟增益和/或数字调节等处理;进一步的,终端设备可以将处理后的3个信号进行合并,得到最终的录音处理结果。
压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。陀螺仪传感器180B可以用于确定终端设备的运动姿态。气压传感器180C用于测量气压。磁传感器180D包括霍尔传感器。加速度传感器180E可检测终端设备在各个方向上(一般为三轴)加速度的大小。距离传感器180F,用于测量距离。接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。环境光传感器180L用于感知环境光亮度。指纹传感器180H用于采集指纹。温度传感器180J用于检测温度。触摸传感器180K,也称“触控器件”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。骨传导传感器180M可以获取振动信号。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。终端设备可以接收按键输入,产生与终端设备的用户设置以及功能控制有关的键信号输入。指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
终端设备的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构等,在此不再赘述。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以独立实现,也可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
本申请实施例中,终端设备可以实现基于用户设置的录音音质,进行录制。示例性的,用户设置录音音质的方法可以包括以下两种。方法一:用户可以先选择录制时的录音音质,再触发录音控件进行录音(如图3对应的实施例)。方法二:用户可以先触发录音控件,再选择录制时的录音音质(如图4对应的实施例)进行录音。
方法一:用户可以先选择录制时的录音音质,再触发录音控件进行录音。
示例性的,图3为本申请实施例提供的一种设置录音音质的界面示意图。在图3对应的实施例中,以终端设备为手机为例进行示例说明,该示例并不构成对本申请实施例的限定。
当终端设备接收到用户打开录音应用(application,APP)的操作时,终端设备可以显示如图3中的a所示的界面,该界面中可以包括:用于开启更多功能的更多控件301,扬声器控件、搜索录音文件对应的输入框、多个录音文件以及开启录制控件302等。其中,该多个录音文件包括:录音1、录音2、录音3和录音4等,各录音文件的周围显示该录音文件对应的录音时间、录音时长以及播放录音控件等。
如图3中的a所示的界面,当终端设备接收到用户触发该更多控件301的操作时,终端设备可以显示如图3中的b所示的界面,该界面中可以包括提示框303等,该提示框303中包括:转文本服务控件304、录音音质控件305、排序控件306以及关于控件307等。其中,该录音音质控件305用于设置输出的录音的音质情况。
如图3中的b所示的界面,当终端设备接收到用户触发该录音音质控件305的操作时,终端设备可以显示如图3中的c所示的界面,该界面中可以包括录音音质选项308等,该录音音质选项308中可以显示:标准音质选项、高清音质选项309以及取消控件等。其中,该标准音质可以为16bit/48千赫兹(khz),约1.5兆(M)/分钟;该高清音质可以为24bit/48khz,约16.5M/分钟。
如图3中的c所示的界面,当终端设备接收到用户触发该高清音质选项309的操作时,终端设备则可以保存用户选择的录音音质。进一步的,如图3中的a所示的界面中,当终端设备接收到用户触发开启录制控件302的操作时,则终端设备可以按照用户选择的录音音质进行录制。
方法二:用户可以先触发录音控件,再选择录制时的录音音质进行录音。示例性的,图4为本申请实施例提供的另一种设置录音音质的界面示意图。在图4对应的实施例中,以终端设备为手机为例进行示例说明,该示例并不构成对本申请实施例的限定。
当终端设备接收到用户打开录音APP的操作时,终端设备可以显示如图4中的a所示的界面,该界面中包括开启录制控件401等,该图4中的a所示的界面与图3中的a所示的界面类似,在此不再赘述。
如图4中的a所示的界面,当终端设备接收到用户触发开启录制控件401的操作时,终端设备可以显示如图4中的b所示的界面,该界面中包括录音音质选项402等,该录音音质选项402中包括高清音质选项403等,该图4图的b所示的界面与图3中的c所示的界面类似,在此不再赘述。
如图4中的b所示的界面,当终端设备接收到用户触发高清音质选项403的操作时,终端设备则可以按照用户选择的录音音质进行录制。
可以理解的是,如图3中的c所示的界面中的录音音质选项,或者如图4中的b所示的界面中的录音音质选项,可以根据实际场景包括其他内容,例如终端设备可以提供32bit/48khz或其他参数下的录音音质,本申请实施例中对此不做限定。
基于此,终端设备可以为用户提供多种录音音质的选项,进而用户可以根据需求灵活的选择合适的录音音质。
在图3以及图4对应的实施例的基础上,可能的实现方式中,终端设备也可以在录音过程中(如图5对应的实施例),以及回放录音时(如图6对应的实施例)显示用户选择的录音音质。
示例性的,图5为本申请实施例提供的一种提示录音音质的界面示意图。在图5对应的实施例中,以终端设备为手机为例进行示例说明,该示例并不构成对本申请实施例的限定。
当终端设备基于用户选择的录音音质,例如高清音质,开启录音时,终端设备可以显示如图5所示的界面,该界面中可以显示录制声音的波形、用于提示录音音质的文字信息,例如高清501、停止录音控件502、标记控件以及暂停控件等。可选的,当用户选择标准音质时,该图5所示的界面中也可以显示,标准音质对应的文字信息,例如标准。
示例性的,图6为本申请实施例提供的另一种提示录音音质的界面示意图。在图6对应的实施例中,以终端设备为手机为例进行示例说明,该示例并不构成对本申请实施例的限定。
当终端设备在如图5所示的界面中,接收到用户触发停止录音控件502的操作时,终端设备可以显示如图6中的a所示的界面,对比于如图3中的a所示的界面,或者如图4中的b所示的界面,该如图6中的a所示界面中增加在图5对应的实施例中录制的录音文件,例如录音5,且在录音5的周围显示高清音质对应的标识601。
如图6中的a所示的界面,当终端设备接收到用户触发录音5所在的区域的操作时,终端设备可以显示如图6中的b所示的界面,该界面中可以显示扬声器控件、用于开启更多功能的控件、用于提示录音音质的文字信息,例如高清602,转文字控件、编辑控件、跳过静音控件、倍速播放控件、标记控件以及暂停控件603等。可选的,当用户选择标准音质时,该图6中的b所示的界面中也可以显示,标准音质对应的文字信息,例如标准。
在图3或图4对应的实施例的基础上,可能的实现方式中,终端设备可以基于用户选择的录音音质,对MIC接收到的声音信号进行不同程度的录音处理。示例性的,终端设备可以基于前半段链路高位宽+后半段链路位宽转换的方法进行录音(如图7对应的实施例以及图8对应的实施例);或者,终端设备可以基于全链路统一位宽的方法进行录音(如图10对应的实施例以及图11对应的实施例)。
其中,在图7-图8对应的实施例中,前半段链路可以理解为由CODEC到录音处理之间的链路,前半段链路的位宽可以为24bit/32bit;后半段链路可以理解为录音处理之后的链路,例如由输出位数转换以及之后的链路,后半段链路中的输出位数转换对应的模块中可以实现,根据用户设置的录音音质,例如设置为16bit,将24bit/32bit转换为16bit。在图10-图11对应的实施例中,全链路统一位宽可以理解为,全链路可以根据用户设置的录音音质,例如16bit/24bit/32bit,进行录音处理。
在前半段链路高位宽+后半段链路位宽转换的录音方法中,前半段链路中涉及的录音算法可以为基于模拟增益调节(如图7对应的实施例),或者该录音算法也可以为基于模拟增益和数字增益共同调节(如图8对应的实施例)。
示例性的,图7为本申请实施例提供的一种前半段链路高位宽+后半段链路位宽转换的录音方法的流程示意图。在图7对应的实施例中,以录音算法控制模拟增益调节,且终端设备设置三MIC为例进行示例说明。其中,该录音算法模块中可以包括:短时信号幅度计算、增益调节策略以及录音处理等;该DSP模块中可以包括:录音算法模块、以及输出位数转换的模块等;该主芯片中可以包括DSP模块等。
如图7所示,该录音方法可以包括如下步骤:
S701、终端设备基于麦克风获取环境中的声音信号,并将声音信号转化为模拟信号。
S702、终端设备中的CODEC对模拟信号进行处理,输出该模拟信号对应的数字信号。
本申请实施例中,当MIC的数量为一个时,该CODEC中可以包含一组PGA+ADC;当MIC的数量为多个时,则每个MIC可以分别对应一组PGA+ADC。如图7所示,当MIC的数量为3时,则模拟增益PGA和ADC的数量均可以为3。
S703、终端设备获取经过CODEC处理后的数字信号的短时信号幅度。
本申请实施例中,获取短时信号幅度的方法可以为,对S702中的数字信号进行快速傅里叶变换(fast fourier transform,FFT)处理,将时域的数字信号转化为频域信号;利用截止频率对频域信号进行低通滤波处理,该截止频率可以调节;计算低通滤波后的频域信号的幅度谱,并按照时间长度进行平均,例如该时间长度可以为5ms或10ms等,得到短时信号幅度。可以理解的是,由于环境声压级可以随着时间快速变化,且测量时间越长,测量精度越不准确,则终端设备可以利用短时信号幅度标识环境的声压级的变化情况。
S704、终端设备基于短时信号幅度进行模拟增益调节。
本申请实施例中,终端设备可以根据调节策略表中指示的,短时信号幅度与模拟增益的对应关系,获取合适的模拟增益的数值。其中,该调节策略表可以为预设的,例如该调价策略表可以为终端设备基于模拟增益调节的历史记录中得到的,或者,也可以为终端设备基于对短时信号幅度与模拟增益的样本数据的训练生成的。例如,调节策略表可以如下表1所示:
表1调节策略表
短时信号幅度(dBFS) PGA(dB)
0 -12
-6 -6
-12 0
可以理解的是,该调节策略表中指示的短时信号幅度与PGA的对应关系可以根据实际场景包括其他内容,本申请实施例中对此不做限定。
进一步的,终端设备可以将得到的PGA的模拟增益写入芯片平台控制寄存器,进而调整MIC的模拟增益。
可以理解的是,当MIC的数量为多个时,则每个MIC均可以对应于由CODEC到增益调节策略构成的1条通道。如图7所示,当MIC的数量为3时,则由CODEC到增益调节策略可以构成3条通道。
S705、终端设备对模拟增益调节后的信号,进行录音处理。
本申请实施例中,当MIC的数量为3时,则终端设备可以对由3条通道中输出的信号进行合并录音处理。
S706、终端设备根据用户对于录音音质的设置,进行输出位数转换,并输出录音。
示例性的,在后半段链路中,响应于用户设置录音音质的操作,终端设备可以基于该用户设置的录音音质对应的位宽,下发输出位数转换中相应的参数,实现将前半段链路中的24bit/32bit的信号转化与用户设置的位宽相对应的信号,例如将24bit/32bit的信号转化为24bit/32bit或者16bit的信号。
本申请实施例中,终端设备可以为录音算法设置两条输出通路,例如录音输出通路以及摄像输出通路。其中,录音输出通路可以为录音APP设计,用于支持至少两种位宽输出模式,例如输出24bit/32bit(高清)的WAV格式的录音文件,和16bit(标准)的m4a格式的录音文件等,且上述24bit/32bit(高清)以及16bit(标准)的两种录音输出模式可以由用户设置。摄像输出通路可以为摄像APP中的录音模块设计,用于支持至少一种16bit的位宽输出模式,例如输出16bit的mp4格式的视频文件等。
示例性的,终端设备可以根据输出的文件类型,下发与文件类型对应的不同指令。例如,当终端设备接收到输出视频文件的指令时,终端设备可以向录音算法模块下发默认的16bit的mp4文件对应的指令,进而终端设备可以利用S706所示的步骤中的输出位数转换的模块将24bit/32bit的数据转化为16bit;或者,当终端设备接收到输出录音文件的指令时,进一步的,终端设备可以根据用户选择的录音文件格式确定录音处理方式。如当终端设备接收到用户选择16bit m4a格式的录音的操作时,终端设备向录音算法模块下发16bitm4a格式对应的指令,并利用S706所示的步骤中的输出位数转换的模块将24bit/32bit的数据转化为16bit;或者,当终端设备接收到用户选择24bit/32bit WAV格式的录音的操作时,终端设备向录音算法模块下发24bit WAV格式对应的指令,此时终端设备可以不对录音数据进行位数转换处理。
基于此,终端设备可以基于对模拟增益的调节,在环境声压级较大时减少MIC中削波引起的失真,并在环境声压级较小时放大声音,扩展信号的动态范围,进而获取更好的录音效果;并且终端设备可以实现用户对于输出的录音音质的设置。
示例性的,图8为本申请实施例提供的另一种前半段链路高位宽+后半段链路位宽转换的录音方法的流程示意图。在图8对应的实施例中,以录音算法控制模拟增益调节以及数字增益调节,且终端设备设置三MIC为例进行示例说明。其中,该录音算法模块中可以包括:模拟增益和数字增益计算、数字增益补偿以及录音处理等;该DSP模块中可以包括:录音算法模块、以及输出位数转换的模块等;该主芯片中可以包括DSP模块等。
如图8所示,该录音方法可以包括如下步骤:
S801、终端设备基于麦克风获取环境中的声音信号,并将声音信号转化为模拟信号。
S802、终端设备中的CODEC对模拟信号进行处理,输出该模拟信号对应的数字信号。
S803、终端设备计算经过CODEC处理后的数字信号的模拟增益和数字增益。
本申请实施例中,计算模拟增益和数字增益的方法可以为,终端设备统计1帧内超过第一削波阈值(或也可以理解为幅度阈值)和第二削波阈值的采样点数;计算当前帧的长时功率。其中,该1帧的取值可以为10ms。示例性的,信号f(t)在t处的长时功率可以为:
Figure BDA0003116084090000131
其中,|f(t)|可以理解为信号的幅度,t的取值可以为20ms或200ms等。
进一步的,终端设备确定当前信号的类型。例如,终端设备确定当前信号是否满足第一条件或第二条件。第一条件为,利用第一削波阈值得到的当前信号的削波点数大于第一计数阈值;第二条件为,利用第二削波阈值得到的当前信号的削波点数大于第二计数阈值,且该信号的长时功率大于长时功率阈值。其中,满足第一条件的信号可以称为短时削波大信号;满足第二条件的信号可以称为长时大信号,不满足第二条件的信号可以称为长时小信号。其中,上述长时功率阈值可以与下述第一长时功率阈值(或第二长时功率阈值)相同,也可以不同,本申请实施例中对此不做限定。
可以理解的是,当信号的长时功率大于第一长时功率阈值的时间达到对应时限,或者信号的长时功率大于第二长时功率阈值的时间达到对应时限时,则该信号可以理解为大信号;或者,当信号的长时功率小于第三长时功率阈值的时间达到对应时限,或者信号的长时功率小于第四长时功率阈值的时间达到对应时限时,则该信号可以理解为小信号。当终端设备的信号计时器检测到当前信号的削波点数,未超过上述第一计数阈值或者第二计数阈值的时间超出时限时,说明当前的信号较为稳定,终端设备可以适应增加用于测量该大信号的长时功率大于第一长时功率阈值(或第二长时功率阈值)时的时限,以及适应增加用于测量该小信号的时长功率小于第三长时功率阈值(或第四长时功率阈值)时的时限。
进一步的,终端设备可以基于信号的削波情况,计算该信号的模拟增益。示例性的,终端设备保存有信号类型与模拟增益之间的对应关系,并根据信号的类型,确定模拟增益的数值。例如,该信号的类型可以包括短时削波大信号,长时大信号,长时小信号等。对于短时削波大信号,为减少削波时间,终端设备可以快速下调模拟增益,例如可以将模拟增益每秒下调12dB等;对于长时大信号,信号未削波,只是削波的概率增加,终端设备可以慢速下调模拟增益,例如可以将模拟增益每秒下调3dB等;对于长时小信号,终端设备可以慢速上调模拟增益,例如可以将模拟增益每秒上调3dB等。进而,终端设备可以将模拟增益的计算结果写入芯片平台控制寄存器,并调整MIC的模拟增益。
其中,上述模拟增益调节的具体数值可以为预设的,例如该模拟增益调节的数值可以基于开发人员多次进行模拟增益调节的经验得到的,示例性的,该模拟增益的数值可以根据信号的类型进行调整。可以理解的是,上述模拟增益调节的具体数值可以根据实际场景包括其他内容,本申请实施例中对此不做限定。
进一步的,终端设备基于信号的模拟增益与信号初始的模拟增益的差值,计算该信号的数字增益。例如,当信号的模拟增益大于(或远大于)信号初始的模拟增益时,则终端设备可以慢速(或快速)下调数字增益;或者,当信号的模拟增益小于(或远小于)信号初始的模拟增益时,则终端设备可以慢速(或快速)上调数字增益。
S804、终端设备基于数字增益进行数字增益补偿。
本申请实施例中,终端设备可以采用动态范围控制(dynamic range control,DRC)方法进行数字增益补偿,例如终端设备可以根据信号的模拟增益与信号初始的模拟增益的差值,配置与其差值相对应的DRC曲线,进而实现数字增益补偿。或者,终端设备也可以采用其他方法进行数字增益补偿,本申请实施例中对此不做限定。
可以理解的是,该数字增益补偿用于解决由于模拟增益的动态调整,而引入的语音忽大忽小的问题。例如,当下调信号的模拟增益时,则该信号对应的声音忽然减小,因此终端设备可以通过数字增益补偿,减缓这种声音忽然减小的情况。
示例性的,图9为本申请实施例提供的一种增益调整的信号示意图。如图9中的a所示的信号,该信号中可以存在削波情况;经过S803所示的步骤中的模拟增益调整后的信号可以如图9中的b所示;经过S804所示的步骤中的数字增益补偿后的信号可以如图9中的c所示。
S805、终端设备对模拟增益和数字增益调节后的信号,进行录音处理。
S806、终端设备根据用户对于录音音质的设置,进行输出位数转换,并输出录音。
其中,在后半段链路中,该S806所示的步骤中输出位数转换的方法与S706所示的步骤中输出位数转换的方法类似,S806所示的步骤中录音或录像的输出模式,与S706所示步骤中录音或录像的输出模式类似,在此不再赘述。
基于此,终端设备可以基于对模拟增益号和数字增益的共同调节,在环境声压级较大时减少MIC中削波引起的失真,并在环境声压级较小时放大声音,扩展信号的动态范围,进而获取更好的录音效果;并且终端设备可以实现用户对于输出的录音音质的设置。
在基于全链路统一位宽的录音方法中,录音算法可以为基于模拟增益调节(如图10对应的实施例),或者该录音算法也可以为基于模拟增益和数字增益共同调节(如图11对应的实施例)。
可以理解的是,在全链路统一位宽的录音方法,若终端设备可以实现16bit、24bit以及32bit等位宽的录音,则在该链路的录音算法中可以包含16bit、24bit以及32bit分别对应的算法模块,进而终端设备可以基于用户对于录音音质的选择,调用指令以执行相应的算法模块。
示例性的,图10为本申请实施例提供的一种全链路统一位宽的录音方法的流程示意图。在图10对应的实施例中,以录音算法控制模拟增益调节,且终端设备设置三MIC为例进行示例说明。其中,该录音算法模块中可以包括短时信号幅度计算、增益调节策略以及录音处理等;该DSP模块中可以包括录音算法模块等;该主芯片中可以包括DSP模块等。
如图10所示,该录音方法可以包括如下步骤:
S1001、终端设备基于麦克风获取环境中的声音信号,并将声音信号转化为模拟信号。
S1002、终端设备中的CODEC基于用户对于录音音质的设置,对模拟信号进行处理,并输出该模拟信号对应的数字信号。
其中,终端设备可以基于图3对应的实施例或图4对应的实施例中用户设置的录音音质,例如16bit/24bit/32bit,进行录音处理。
示例性的,终端设备可以根据输出的文件类型,下发与文件类型对应的指令。例如,当终端设备接收到输出视频文件的指令时,终端设备可以向CODEC和录音算法模块下发默认的16bit的mp4文件对应的指令,进而终端设备可以根据16bit的指令设定CODEC中的ADC的位宽的参数,以及录音算法模块中的位宽的参数;或者,当终端设备接收到输出录音文件的指令时,进一步的,终端设备可以根据用户选择的录音文件格式确定录音处理方式。如当终端设备接收到用户选择16bit m4a格式的录音的操作时,终端设备向CODEC和录音算法模块下发16bit m4a格式对应的指令,并可以根据16bit的指令设定CODEC中的ADC的位宽的参数,以及录音算法模块中的位宽的参数;或者,当终端设备接收到用户选择24bit/32bit WAV格式的录音的操作时,终端设备向CODEC和录音算法模块下发24bit/32bit WAV格式对应的指令,并可以根据24bit的指令设定CODEC中的ADC的位宽的参数,以及录音算法模块中的位宽的参数,避免位数转换的过程,实现全链路统一位宽。
S1003、终端设备获取经过CODEC处理后的数字信号的短时信号幅度。
本申请实施例中,该S1003所示的步骤中获取短时信号幅度的方法与S703所示的步骤中获取短时信号幅度的方法类似,在此不再赘述。
S1004、终端设备基于短时信号幅度进行模拟增益调节。
本申请实施例中,该S1004所示的步骤中进行模拟增益调节的方法与S704所示的步骤中进行模拟增益调节的方法类似,在此不再赘述。
S1005、终端设备对模拟增益调节后的信号,进行录音处理,并输出录音。
本申请实施例中,录音APP和摄像APP均可以实现全链路16比特/24比特/32比特等的输出模式,各输出模式对应的录音格式与图7对应的实施例中的录音输出格式类似,在此不再赘述。
可以理解的是,由于图10对应的实施例中采用全链路统一位宽的录音处理方法,相比于图7对应的实施例,可以简化录音处理逻辑,并减少输出位数转换的模块中对于内存空间的占用。
基于此,终端设备可以基于对模拟增益的调节,在环境声压级较大时减少MIC中削波引起的失真,并在环境声压级较小时放大声音,扩展信号的动态范围,进而获取更好的录音效果;并且终端设备可以实现用户对于输出的录音音质的设置。
示例性的,图11为本申请实施例提供的另一种全链路统一位宽的录音方法的流程示意图。在图11对应的实施例中,以录音算法控制模拟增益和数字增益共同调节,且终端设备设置三MIC为例进行示例说明。其中,该录音算法模块中可以包括:模拟增益和数字增益计算、数字增益补偿以及录音处理等;该DSP模块中可以包括录音算法模块等;该主芯片中可以包括DSP模块等。
如图11所示,该录音方法可以包括如下步骤:
S1101、终端设备基于麦克风获取环境中的声音信号,并将声音信号转化为模拟信号。
S1102、终端设备中的CODEC基于用户对于录音音质的设置,对模拟信号进行处理,并输出该模拟信号对应的数字信号。
S1103、终端设备计算经过CODEC处理后的数字信号的模拟增益和数字增益。
本申请实施例中,该S1103所示的步骤中计算模拟增益和数字增益的方法与S803所示的步骤中计算模拟增益和数字增益的方法类似,在此不再赘述。
S1104、终端设备基于数字增益进行数字增益补偿。
本申请实施例中,该S1104所示的步骤中进行数字增益补偿的方法与S804所示的步骤中进行数字增益补偿的方法类似,在此不再赘述。
S1105、终端设备对模拟增益调节后的信号,进行录音处理,并输出录音。
本申请实施例中,该S1105所示的步骤中进行录音处理的方法与S805所示的步骤中进行录音处理的方法类似,S1105所示的步骤中音或录像的输出模式,与S1005所示步骤中音或录像的输出模式类似,在此不再赘述。
可以理解的是,由于图11对应的实施例中采用全链路统一位宽的录音处理方法,相比于图8对应的实施例,可以简化录音处理逻辑,并减少输出位数转换的模块中对于内存空间的占用。
基于此,终端设备可以基于对模拟增益号和数字增益的共同调节,在环境声压级较大时减少MIC中削波引起的失真,并在环境声压级较小时放大声音,扩展信号的动态范围,进而获取更好的录音效果;并且终端设备可以实现用户对于输出的录音音质的设置。
可以理解的是,本申请实施例中描述的界面只作为一种示例,并不作为本申请实施例的限定。
可以理解的是,本申请实施例描述的界面,仅作为一种示例,并不作为对本申请实施例的进一步限定。
基于上述实施例中所描述的内容,为了更好的理解本申请各实施例,示例性的,图12为本申请实施例提供的一种录音方法的流程示意图。
如图12所示,该录音方法可以包括如下步骤:
S1201、终端设备显示第一界面。
本申请实施例中,第一界面可以为如图3中的c所示的界面;第一控件可以为图3中的c所示的录音音质选项308,第一控件包括;用于选定输出规格为第一位宽音质的录音的第一选项,该第一选项可以为如图3中的c所示的标准音质对应的选项,以及,用于选定输出规格为第二位宽音质的录音的第二选项,该第二选项可以为如图3中的c所示的高清音质选项309。
S1202、当终端设备接收到选定第一选项的操作时,终端设备对麦克风获取的录音进行处理,得到第一位宽的录音;或者,当终端设备接收到选定第二选项的操作时,终端设备对麦克风获取的录音进行处理,得到第二位宽的录音。
本申请实施例中,如图3中的c所示的界面,该第一操作可以为触发录音音质选项308中的标准音质对应的选项或者触发高清音质选项309的操作。
可选的,还包括:终端设备显示第二界面,第二界面中包括第二控件;终端设备接收针对第二控件的第一操作;响应于第一操作,终端设备显示第三界面;第三界面中包括第三控件;终端设备接收针对第三控件的第二操作;终端设备显示第一界面,包括:响应于第二操作,终端设备显示第一界面。
本申请实施例中,该第二界面可以为如图3中的a所示的界面,该第二控件可以为如图3中的a所示的界面中的开启更多功能的更多控件301;第一操作可以为触发该开启更多功能的更多控件301的操作;第三界面可以为如图3中的b所示的界面,该第三控件可以为如图3中的b所示的界面中的录音音质控件305,该第二操作可以为触发该录音音质控件305的操作。
可选的,第二界面中还包括第四控件,S1202包括:终端设备接收针对第四控件的第三操作;响应于第三操作,终端设备对麦克风获取的录音进行处理,得到第一位宽的录音。
本申请实施例中,该第四控件可以为如图3中的a所示的开启录制控件302,该第三操作可以为触发该开启录制控件302的操作。
可选的,第三界面中还包括:以列表形式显示的用于实现语音转文本服务的第五控件、用于实现录音文件的排序的第六控件以及用于查看录音应用程序的信息的第七控件。
本申请实施例中,如图3中的b所示的界面,该用于实现语音转文本服务的第五控件可以为转文本服务控件304,该用于实现录音文件的排序的第六控件可以为排序控件306,该用于查看录音应用程序的信息的第七控件可以为关于控件307。
可选的,第二界面中还包括录音文件,录音文件的周围显示录音文件对应的第一标识;第一标识用于标识录音文件的音质类型。
本申请实施例中,该第二界面也可以为如图6中的a所示的界面,该第一标识可以为录音5对应的标识601。
可选的,还包括:终端设备接收到针对录音文件的第四操作;响应于第四操作,终端设备显示第四界面;第四界面中包括录音播放标识以及第二标识,第二标识用于标识录音文件的音频类型,第二标识与第一标识不同。
本申请实施例中,该第四操作可以为触发如图6中的a所示的录音5的操作;该第四界面可以为如图6中的b所示的界面,该第二标识可以为如图6中的b所示的标识高清601。
可选的,还包括:终端设备显示第五界面,第五界面中包括第八控件;终端设备接收针对第八控件的第五操作;终端设备显示第一界面,包括:响应于第五操作,终端设备显示第一界面。
本申请实施例中,该第五界面可以为如图4中的a所示的界面,该第八控件可以为如图4中的a所示的界面中的开启录制控件401;该第五操作可以为触发该开启录制控件401的操作。
可选的,终端设备还包括编译码器CODEC,S1202中的终端设备对麦克风获取的录音进行处理,得到第一位宽的录音,包括:终端设备基于第二位宽,对麦克风获取的录音进行处理,得到处理后的第一信号;第二位宽为终端设备默认的位宽;终端设备将第一信号转换为第一位宽对应的信号,得到第一位宽的录音;或者,终端设备基于第二位宽,在CODEC中将麦克风获取的录音转换为第一位宽对应的信号;终端设备对第一位宽对应的信号进行处理,得到第一位宽的录音。
可选的,终端设备基于第二位宽,对麦克风获取的录音进行处理,得到处理后的第一信号,包括:终端设备基于第二位宽,将麦克风获取的录音输入至CODEC中,得到麦克风获取的录音对应的数字信号;终端设备计算数字信号的第一幅度信息;终端设备根据第一幅度信息与第一模拟增益信息的对应关系,得到第一幅度信息对应的第一模拟增益信息;终端设备基于第一模拟增益信息,对数字信号进行模拟增益调节,得到处理后的第一信号。
本申请实施例中,该第一幅度信息可以为短时信号幅度,该第一模拟增益信息可以为短时信号幅度对应的模拟增益;该第一幅度信息与第一模拟增益信息的对应关系可以由调节策略表中得到。
可选的终端设备计算数字信号的第一幅度信息,包括:终端设备利用快速傅里叶变换FFT,将数字信号转化为频域信号;终端设备对频域信号进行滤波,得到滤波后的信号;终端设备计算滤波后的信号对应的幅度谱;终端设备基于第一时间长度,计算数字信号的第一幅度信息。
可选的,终端设备基于第二位宽,对麦克风获取的录音进行处理,得到处理后的第一信号,包括:终端设备基于第二位宽,将麦克风获取的录音输入至CODEC中,得到麦克风获取的录音对应的数字信号;终端设备基于数字信号的长时功率,和数字信号中超出第一幅度阈值或第二幅度阈值的采样点数,确定数字信号的类型;终端设备根据数字信号的类型与第二模拟增益信息的对应关系,确定数字信号的类型对应的第二模拟增益信息;终端设备基于第二模拟增益信息,对麦克风获取的录音进行处理,得到模拟增益处理后的数字信号;终端设备根据第二模拟增益信息与数字信号的初始模拟增益信息的差值,确定数字信号对应的数字增益信息;终端设备基于数字增益信息,对模拟增益处理后的数字信号进行处理,得到处理后的第一信号。
可选的,数字信号的类型包括第一类型数字信号,第二类型数字信号以及第三类型数字信号;第一类型数字信号为满足第一条件的信号;第二类型数字信号为满足第二条件的信号;第三类型数字信号为不满足第二条件的信号;第一条件为数字信号中大于第一幅度阈值的采样点数大于第一计数阈值;第二条件为数字信号中大于第二幅度阈值的采样点数大于第二计数阈值,且数字信号的长时功率大于第一长时功率阈值。
本申请实施例中,该第一类型数字信号可以为短时削波大信号,该第二类型数字信号可以为长时大信号,该第三类型数字信号可以为长时小信号;该第一幅度阈值可以称为第一削波阈值,第二幅度阈值可以称为第二削波阈值。
可选的,第一位宽为16比特,第二位宽为24比特或32比特。
可选的,终端设备包括录音算法模块和CODEC,当终端设备接收到选定第一选项的操作时,终端设备对麦克风获取的录音进行处理,得到第一位宽的录音,包括:当终端设备接收到选定第一选项的操作时,终端设备基于录音文件的格式以及选定第一选项的操作,向录音算法模块和/或CODEC下发第一指令;终端设备的录音算法模块和/或CODEC基于第一指令,对麦克风获取的录音进行处理,得到第一位宽的录音。
上面结合图3-图12,对本申请实施例提供的方法进行了说明,下面对本申请实施例提供的执行上述方法的装置进行描述。如图13所示,图13为本申请实施例提供的一种录音装置的结构示意图,该录音装置可以是本申请实施例中的终端设备,也可以是终端设备内的芯片或芯片系统。
如图13所示,录音装置130可以用于通信设备、电路、硬件组件或者芯片中,该录音装置包括:显示单元1301、处理单元1302。其中,显示单元1301用于支持录音方法执行的显示的步骤;处理单元1302用于支持录音装置执行信息处理的步骤。
具体的,本申请实施例提供一种录音装置130,终端设备包括麦克风,装置包括:显示单元1301,用于显示第一界面,第一界面中包括第一控件,第一控件包括;用于选定输出规格为第一位宽音质的录音的第一选项,以及,用于选定输出规格为第二位宽音质的录音的第二选项;当终端设备接收到选定第一选项的操作时,处理单元1302,用于对麦克风获取的录音进行处理,得到第一位宽的录音;或者,当终端设备接收到选定第二选项的操作时,处理单元1302,还用于对麦克风获取的录音进行处理,得到第二位宽的录音。
在一种可能的实现方式中,显示单元1301,还用于显示第二界面,第二界面中包括第二控件;处理单元1302,还用于接收针对第二控件的第一操作;响应于第一操作,显示单元1301,还用于显示第三界面;第三界面中包括第三控件;处理单元1302,还用于接收针对第三控件的第二操作;响应于第二操作,显示单元1301,还用于显示第一界面。
在一种可能的实现方式中,第二界面中还包括第四控件,处理单元1302,具体用于接收针对第四控件的第三操作;响应于第三操作,处理单元1302,还具体用于对麦克风获取的录音进行处理,得到第一位宽的录音。
在一种可能的实现方式中,第三界面中还包括:以列表形式显示的用于实现语音转文本服务的第五控件、用于实现录音文件的排序的第六控件以及用于查看录音应用程序的信息的第七控件。
在一种可能的实现方式中,第二界面中还包括录音文件,录音文件的周围显示录音文件对应的第一标识;第一标识用于标识录音文件的音质类型。
在一种可能的实现方式中,处理单元1302,还用于接收到针对录音文件的第四操作;响应于第四操作,显示单元1301,还用于显示第四界面;第四界面中包括录音播放标识以及第二标识,第二标识用于标识录音文件的音频类型,第二标识与第一标识不同。
在一种可能的实现方式中,显示单元1301,还用于显示第五界面,第五界面中包括第八控件;处理单元1302,还用于接收针对第八控件的第五操作;响应于第五操作,显示单元1301,还用于显示第一界面。
在一种可能的实现方式中,终端设备还包括编译码器CODEC,处理单元1302,具体用于:基于第二位宽,对麦克风获取的录音进行处理,得到处理后的第一信号;第二位宽为终端设备默认的位宽;将第一信号转换为第一位宽对应的信号,得到第一位宽的录音;或者,基于第二位宽,在CODEC中将麦克风获取的录音转换为第一位宽对应的信号;对第一位宽对应的信号进行处理,得到第一位宽的录音。
在一种可能的实现方式中,处理单元1302,具体用于:基于第二位宽,将麦克风获取的录音输入至CODEC中,得到麦克风获取的录音对应的数字信号;计算数字信号的第一幅度信息;根据第一幅度信息与第一模拟增益信息的对应关系,得到第一幅度信息对应的第一模拟增益信息;基于第一模拟增益信息,对数字信号进行模拟增益调节,得到处理后的第一信号。
在一种可能的实现方式中,处理单元1302,具体用于:利用快速傅里叶变换FFT,将数字信号转化为频域信号;对频域信号进行滤波,得到滤波后的信号;计算滤波后的信号对应的幅度谱;基于第一时间长度,计算数字信号的第一幅度信息。
在一种可能的实现方式中,处理单元1302,具体用于:基于第二位宽,将麦克风获取的录音输入至CODEC中,得到麦克风获取的录音对应的数字信号;基于数字信号的长时功率,和数字信号中超出第一幅度阈值或第二幅度阈值的采样点数,确定数字信号的类型;根据数字信号的类型与第二模拟增益信息的对应关系,确定数字信号的类型对应的第二模拟增益信息;基于第二模拟增益信息,对麦克风获取的录音进行处理,得到模拟增益处理后的数字信号;根据第二模拟增益信息与数字信号的初始模拟增益信息的差值,确定数字信号对应的数字增益信息;基于数字增益信息,对模拟增益处理后的数字信号进行处理,得到处理后的第一信号。
在一种可能的实现方式中,数字信号的类型包括第一类型数字信号,第二类型数字信号以及第三类型数字信号;第一类型数字信号为满足第一条件的信号;第二类型数字信号为满足第二条件的信号;第三类型数字信号为不满足第二条件的信号;第一条件为数字信号中大于第一幅度阈值的采样点数大于第一计数阈值;第二条件为数字信号中大于第二幅度阈值的采样点数大于第二计数阈值,且数字信号的长时功率大于第一长时功率阈值。
在一种可能的实现方式中,第一位宽为16比特,第二位宽为24比特或32比特。
在一种可能的实现方式中,终端设备包括录音算法模块和CODEC,处理单元1302,具体用于:当终端设备接收到选定第一选项的操作时,终端设备基于录音文件的格式以及选定第一选项的操作,向录音算法模块和/或CODEC下发第一指令;基于第一指令,对麦克风获取的录音进行处理,得到第一位宽的录音。
在一种可能的实施例中,录音装置还可以包括:存储单元1304。处理单元1302、存储单元1304通过线路相连。
存储单元1304可以包括一个或者多个存储器,存储器可以是一个或者多个设备、电路中用于存储程序或者数据的器件。
存储单元1304可以独立存在,通过通信线路与录音装置具有的处理单元1302相连。存储单元1304也可以和处理单元1302集成在一起。
在一种可能的实施例中,录音装置还可以包括:通信单元1303。通信单元1303可以是输入或者输出接口、管脚或者电路等。示例性的,存储单元1304可以存储雷达或目标设备的方法的计算机执行指令,以使处理单元1302执行上述实施例中雷达或目标设备的方法。存储单元1304可以是寄存器、缓存或者RAM等,存储单元1304可以和处理单元1302集成在一起。存储单元1304可以是ROM或者可存储静态信息和指令的其他类型的静态存储设备,存储单元1304可以与处理单元1302相独立。
图14为本申请实施例提供的一种控制设备的硬件结构示意图,如图14所示,该控制设备包括处理器1401,通信线路1404以及至少一个通信接口(图14中示例性的以通信接口1403为例进行说明)。
处理器1401可以是一个通用中央处理器(central processing unit,CPU),微处理器,特定应用集成电路(application-specific integrated circuit,ASIC),或一个或多个用于控制本申请方案程序执行的集成电路。
通信线路1404可包括在上述组件之间传送信息的电路。
通信接口1403,使用任何收发器一类的装置,用于与其他设备或通信网络通信,如以太网,无线局域网(wireless local area networks,WLAN)等。
可能的,该控制设备还可以包括存储器1402。
存储器1402可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,EEPROM)、只读光盘(compactdisc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过通信线路1404与处理器相连接。存储器也可以和处理器集成在一起。
其中,存储器1402用于存储执行本申请方案的计算机执行指令,并由处理器1401来控制执行。处理器1401用于执行存储器1402中存储的计算机执行指令,从而实现本申请实施例所提供的录音方法。
可能的,本申请实施例中的计算机执行指令也可以称之为应用程序代码,本申请实施例对此不作具体限定。
在具体实现中,作为一种实施例,处理器1401可以包括一个或多个CPU,例如图14中的CPU0和CPU1。
在具体实现中,作为一种实施例,控制设备可以包括多个处理器,例如图14中的处理器1401和处理器1405。这些处理器中的每一个可以是一个单核(single-CPU)处理器,也可以是一个多核(multi-CPU)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
示例性的,图15为本申请实施例提供的一种芯片的结构示意图。芯片150包括一个或两个以上(包括两个)处理器1520和通信接口1530。
在一些实施方式中,存储器1540存储了如下的元素:可执行模块或者数据结构,或者他们的子集,或者他们的扩展集。
本申请实施例中,存储器1540可以包括只读存储器和随机存取存储器,并向处理器1520提供指令和数据。存储器1540的一部分还可以包括非易失性随机存取存储器(non-volatile random access memory,NVRAM)。
本申请实施例中,存储器1540、通信接口1530以及存储器1540通过总线系统耦合在一起。其中,总线系统除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。为了便于描述,在图15中将各种总线都标为总线系统。
上述本申请实施例描述的方法可以应用于处理器1520中,或者由处理器1520实现。处理器1520可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器1520中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1520可以是通用处理器(例如,微处理器或常规处理器)、数字信号处理器(digitalsignal processing,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现成可编程门阵列(field-programmable gate array,FPGA)或者其他可编程逻辑器件、分立门、晶体管逻辑器件或分立硬件组件,处理器1520可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。
结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。其中,软件模块可以位于随机存储器、只读存储器、可编程只读存储器或带电可擦写可编程存储器(electricallyerasable programmable read only memory,EEPROM)等本领域成熟的存储介质中。该存储介质位于存储器1540,处理器1520读取存储器1540中的信息,结合其硬件完成上述方法的步骤。
在上述实施例中,存储器存储的供处理器执行的指令可以以计算机程序产品的形式实现。其中,计算机程序产品可以是事先写入在存储器中,也可以是以软件形式下载并安装在存储器中。
计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包括一个或多个可用介质集成的服务器、数据中心等数据存储设备。例如,可用介质可以包括磁性介质(例如,软盘、硬盘或磁带)、光介质(例如,数字通用光盘(digital versatile disc,DVD))、或者半导体介质(例如,固态硬盘(solid state disk,SSD))等。
本申请实施例还提供了一种计算机可读存储介质。上述实施例中描述的方法可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。计算机可读介质可以包括计算机存储介质和通信介质,还可以包括任何可以将计算机程序从一个地方传送到另一个地方的介质。存储介质可以是可由计算机访问的任何目标介质。
作为一种可能的设计,计算机可读介质可以包括紧凑型光盘只读储存器(compactdisc read-only memory,CD-ROM)、RAM、ROM、EEPROM或其它光盘存储器;计算机可读介质可以包括磁盘存储器或其它磁盘存储设备。而且,任何连接线也可以被适当地称为计算机可读介质。例如,如果使用同轴电缆,光纤电缆,双绞线,DSL或无线技术(如红外,无线电和微波)从网站,服务器或其它远程源传输软件,则同轴电缆,光纤电缆,双绞线,DSL或诸如红外,无线电和微波之类的无线技术包括在介质的定义中。如本文所使用的磁盘和光盘包括光盘(CD),激光盘,光盘,数字通用光盘(digital versatile disc,DVD),软盘和蓝光盘,其中磁盘通常以磁性方式再现数据,而光盘利用激光光学地再现数据。
上述的组合也应包括在计算机可读介质的范围内。以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (17)

1.一种录音方法,其特征在于,终端设备包括麦克风,所述方法包括:
终端设备显示第一界面,所述第一界面中包括第一控件,所述第一控件包括;用于选定输出规格为第一位宽音质的录音的第一选项,以及,用于选定输出规格为第二位宽音质的录音的第二选项;
当所述终端设备接收到选定所述第一选项的操作时,所述终端设备对所述麦克风获取的录音进行处理,得到所述第一位宽的录音;
或者,当所述终端设备接收到选定所述第二选项的操作时,所述终端设备对所述麦克风获取的录音进行处理,得到所述第二位宽的录音。
2.根据权利要求1所述的方法,其特征在于,还包括:
所述终端设备显示第二界面,所述第二界面中包括第二控件;
所述终端设备接收针对所述第二控件的第一操作;
响应于所述第一操作,所述终端设备显示第三界面;所述第三界面中包括第三控件;
所述终端设备接收针对所述第三控件的第二操作;
所述终端设备显示第一界面,包括:
响应于所述第二操作,所述终端设备显示所述第一界面。
3.根据权利要求2所述的方法,其特征在于,所述第二界面中还包括第四控件,所述终端设备对所述麦克风获取的录音进行处理,得到所述第一位宽的录音,包括:
所述终端设备接收针对所述第四控件的第三操作;
响应于所述第三操作,所述终端设备对所述麦克风获取的录音进行处理,得到所述第一位宽的录音。
4.根据权利要求2所述的方法,其特征在于,所述第三界面中还包括:以列表形式显示的用于实现语音转文本服务的第五控件、用于实现录音文件的排序的第六控件以及用于查看录音应用程序的信息的第七控件。
5.根据权利要求2所述的方法,其特征在于,所述第二界面中还包括录音文件,所述录音文件的周围显示所述录音文件对应的第一标识;所述第一标识用于标识所述录音文件的音质类型。
6.根据权利要求5所述的方法,其特征在于,还包括:
所述终端设备接收到针对所述录音文件的第四操作;
响应于所述第四操作,所述终端设备显示第四界面;所述第四界面中包括录音播放标识以及第二标识,所述第二标识用于标识所述录音文件的音频类型,所述第二标识与所述第一标识不同。
7.根据权利要求1所述的方法,其特征在于,还包括:
所述终端设备显示第五界面,所述第五界面中包括第八控件;
所述终端设备接收针对所述第八控件的第五操作;
所述终端设备显示第一界面,包括:
响应于所述第五操作,所述终端设备显示所述第一界面。
8.根据权利要求1所述的方法,其特征在于,所述终端设备还包括编译码器CODEC,所述终端设备对所述麦克风获取的录音进行处理,得到所述第一位宽的录音,包括:
所述终端设备基于所述第二位宽,对所述麦克风获取的录音进行处理,得到处理后的第一信号;所述第二位宽为所述终端设备默认的位宽;
所述终端设备将所述第一信号转换为所述第一位宽对应的信号,得到所述第一位宽的录音;
或者,所述终端设备基于所述第二位宽,在所述CODEC中将所述麦克风获取的录音转换为所述第一位宽对应的信号;所述终端设备对所述第一位宽对应的信号进行处理,得到所述第一位宽的录音。
9.根据权利要求8所述的方法,其特征在于,所述终端设备基于第二位宽,对所述麦克风获取的录音进行处理,得到处理后的第一信号,包括:
所述终端设备基于所述第二位宽,将所述麦克风获取的录音输入至所述CODEC中,得到所述麦克风获取的录音对应的数字信号;
所述终端设备计算所述数字信号的第一幅度信息;
所述终端设备根据所述第一幅度信息与第一模拟增益信息的对应关系,得到所述第一幅度信息对应的第一模拟增益信息;
所述终端设备基于所述第一模拟增益信息,对所述数字信号进行模拟增益调节,得到所述处理后的第一信号。
10.根据权利要求9所述的方法,其特征在于,所述终端设备计算所述数字信号的第一幅度信息,包括:
所述终端设备利用快速傅里叶变换FFT,将所述数字信号转化为频域信号;
所述终端设备对所述频域信号进行滤波,得到滤波后的信号;
所述终端设备计算所述滤波后的信号对应的幅度谱;
所述终端设备基于第一时间长度,计算所述数字信号的第一幅度信息。
11.根据权利要求8所述的方法,其特征在于,所述终端设备基于第二位宽,对所述麦克风获取的录音进行处理,得到处理后的第一信号,包括:
所述终端设备基于所述第二位宽,将所述麦克风获取的录音输入至CODEC中,得到所述麦克风获取的录音对应的数字信号;
所述终端设备基于所述数字信号的长时功率,和所述数字信号中超出第一幅度阈值或第二幅度阈值的采样点数,确定所述数字信号的类型;
所述终端设备根据所述数字信号的类型与第二模拟增益信息的对应关系,确定所述数字信号的类型对应的第二模拟增益信息;
所述终端设备基于所述第二模拟增益信息,对所述麦克风获取的录音进行处理,得到模拟增益处理后的数字信号;
所述终端设备根据所述第二模拟增益信息与所述数字信号的初始模拟增益信息的差值,确定所述数字信号对应的数字增益信息;
所述终端设备基于所述数字增益信息,对所述模拟增益处理后的数字信号进行处理,得到所述处理后的第一信号。
12.根据权利要求11所述的方法,其特征在于,所述数字信号的类型包括第一类型数字信号,第二类型数字信号以及第三类型数字信号;所述第一类型数字信号为满足第一条件的信号;所述第二类型数字信号为满足第二条件的信号;所述第三类型数字信号为不满足所述第二条件的信号;所述第一条件为所述数字信号中大于第一幅度阈值的采样点数大于第一计数阈值;所述第二条件为所述数字信号中大于第二幅度阈值的采样点数大于第二计数阈值,且所述数字信号的长时功率大于第一长时功率阈值。
13.根据权利要求1所述的方法,其特征在于,所述第一位宽为16比特,所述第二位宽为24比特或32比特。
14.根据权利要求1所述的方法,其特征在于,所述终端设备包括录音算法模块和CODEC,所述当所述终端设备接收到选定所述第一选项的操作时,所述终端设备对所述麦克风获取的录音进行处理,得到所述第一位宽的录音,包括:
当所述终端设备接收到选定所述第一选项的操作时,所述终端设备基于录音文件的格式以及所述选定所述第一选项的操作,向所述录音算法模块和/或所述CODEC下发第一指令;
所述终端设备的所述录音算法模块和/或所述CODEC基于所述第一指令,对所述麦克风获取的录音进行处理,得到所述第一位宽的录音。
15.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,使得所述电子设备执行如权利要求1至14任一项所述的方法。
16.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,使得计算机执行如权利要求1至14任一项所述的方法。
17.一种计算机程序产品,其特征在于,包括计算机程序,当所述计算机程序被运行时,使得计算机执行如权利要求1至14任一项所述的方法。
CN202110663657.6A 2021-06-15 2021-06-15 录音方法和装置 Active CN113726940B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202110663657.6A CN113726940B (zh) 2021-06-15 2021-06-15 录音方法和装置
PCT/CN2022/088074 WO2022262410A1 (zh) 2021-06-15 2022-04-21 录音方法和装置
EP22790187.3A EP4131907A4 (en) 2021-06-15 2022-04-21 SOUND RECORDING METHOD AND APPARATUS
US17/909,382 US20240201944A1 (en) 2021-06-15 2022-04-21 Sound recording method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110663657.6A CN113726940B (zh) 2021-06-15 2021-06-15 录音方法和装置

Publications (2)

Publication Number Publication Date
CN113726940A true CN113726940A (zh) 2021-11-30
CN113726940B CN113726940B (zh) 2023-08-22

Family

ID=78672958

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110663657.6A Active CN113726940B (zh) 2021-06-15 2021-06-15 录音方法和装置

Country Status (4)

Country Link
US (1) US20240201944A1 (zh)
EP (1) EP4131907A4 (zh)
CN (1) CN113726940B (zh)
WO (1) WO2022262410A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022262410A1 (zh) * 2021-06-15 2022-12-22 荣耀终端有限公司 录音方法和装置
CN116828102A (zh) * 2023-08-29 2023-09-29 荣耀终端有限公司 录音方法、设备及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117133305B (zh) * 2023-04-27 2024-08-06 荣耀终端有限公司 立体声降噪方法、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106160687A (zh) * 2016-06-29 2016-11-23 努比亚技术有限公司 一种音量调节装置及方法、相关设备
CN106953962A (zh) * 2017-05-11 2017-07-14 深圳天珑无线科技有限公司 一种通话录音方法及装置
CN107092461A (zh) * 2017-06-01 2017-08-25 深圳天珑无线科技有限公司 录音方法、装置和计算机可读存储介质
CN110097897A (zh) * 2019-04-02 2019-08-06 烽火通信科技股份有限公司 一种Android设备录音复用方法及系统
CN112333606A (zh) * 2020-10-21 2021-02-05 浙江华创视讯科技有限公司 一种麦克风增益异常的调整方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100077022A1 (en) * 2001-06-27 2010-03-25 John Mikkelsen Media delivery platform
US7559027B2 (en) * 2006-02-28 2009-07-07 Palm, Inc. Master multimedia software controls
GB2473912A (en) * 2009-09-10 2011-03-30 Miniweb Technologies Ltd User-driven transition or skip between content items
US10194239B2 (en) * 2012-11-06 2019-01-29 Nokia Technologies Oy Multi-resolution audio signals
KR102065409B1 (ko) * 2013-09-04 2020-01-13 엘지전자 주식회사 이동단말기 및 그 제어방법
US9800217B1 (en) * 2014-02-26 2017-10-24 Marvell International Ltd. Integrated amplifier system
US10013407B2 (en) * 2014-07-01 2018-07-03 Designation Station, LLC Automated processing of transcripts, transcript designations, and/or video clip load files
CN105094808B (zh) * 2015-06-26 2018-04-10 努比亚技术有限公司 一种控制装置及方法
KR20180020702A (ko) * 2016-08-19 2018-02-28 엘지전자 주식회사 이동단말기 및 그 제어방법
CN113726940B (zh) * 2021-06-15 2023-08-22 北京荣耀终端有限公司 录音方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106160687A (zh) * 2016-06-29 2016-11-23 努比亚技术有限公司 一种音量调节装置及方法、相关设备
CN106953962A (zh) * 2017-05-11 2017-07-14 深圳天珑无线科技有限公司 一种通话录音方法及装置
CN107092461A (zh) * 2017-06-01 2017-08-25 深圳天珑无线科技有限公司 录音方法、装置和计算机可读存储介质
CN110097897A (zh) * 2019-04-02 2019-08-06 烽火通信科技股份有限公司 一种Android设备录音复用方法及系统
CN112333606A (zh) * 2020-10-21 2021-02-05 浙江华创视讯科技有限公司 一种麦克风增益异常的调整方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022262410A1 (zh) * 2021-06-15 2022-12-22 荣耀终端有限公司 录音方法和装置
CN116828102A (zh) * 2023-08-29 2023-09-29 荣耀终端有限公司 录音方法、设备及存储介质
CN116828102B (zh) * 2023-08-29 2023-11-21 荣耀终端有限公司 录音方法、设备及存储介质

Also Published As

Publication number Publication date
US20240201944A1 (en) 2024-06-20
EP4131907A1 (en) 2023-02-08
WO2022262410A1 (zh) 2022-12-22
EP4131907A4 (en) 2023-11-22
CN113726940B (zh) 2023-08-22

Similar Documents

Publication Publication Date Title
US11308977B2 (en) Processing method of audio signal using spectral envelope signal and excitation signal and electronic device including a plurality of microphones supporting the same
CN113726940B (zh) 录音方法和装置
US11251763B2 (en) Audio signal adjustment method, storage medium, and terminal
WO2021008614A1 (zh) 一种建立通信连接的方法及可穿戴设备
CN109041024B (zh) 码率优化方法、装置、电子设备以及存储介质
WO2019033987A1 (zh) 提示方法、装置、存储介质及终端
WO2019033986A1 (zh) 声音播放器件的检测方法、装置、存储介质及终端
KR20180068075A (ko) 전자 장치, 저장매체 및 전자 장치의 음성 신호 처리 방법
CN111083289B (zh) 音频播放方法、装置、存储介质及移动终端
CN107371102B (zh) 音频播放音量的控制方法、装置及存储介质和移动终端
KR102565447B1 (ko) 청각 인지 속성에 기반하여 디지털 오디오 신호의 이득을 조정하는 전자 장치 및 방법
CN112947886A (zh) 保护用户听力的方法、装置和电子设备
US11822854B2 (en) Automatic volume adjustment method and apparatus, medium, and device
CN112599144A (zh) 音频数据处理方法、音频数据处理装置、介质与电子设备
CN116208704A (zh) 一种声音处理方法及其装置
CN113963716A (zh) 通话式门铃的音量均衡方法、装置、设备和可读存储介质
KR102443637B1 (ko) 네트워크 연결 정보에 기반하여 잡음 제어 파라미터를 결정하는 전자 장치 및 그의 동작 방법
US20190122687A1 (en) Method for processing audio signal and electronic device for supporting the same
CN113613157A (zh) 耳机及其佩戴状态检测方法、装置及存储介质
CN112259076A (zh) 语音交互方法、装置、电子设备及计算机可读存储介质
CN113840034B (zh) 声音信号处理方法和终端设备
CN106293607B (zh) 自动切换音频输出模式的方法及系统
CN115623123B (zh) 一种音频处理方法及设备
CN111083250A (zh) 移动终端及其降噪方法
CN112307161B (zh) 用于播放音频的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220613

Address after: 100095 floors 2-14, building 3, yard 5, honeysuckle Road, Haidian District, Beijing

Applicant after: Beijing Honor Device Co.,Ltd.

Address before: Unit 3401, unit a, building 6, Shenye Zhongcheng, No. 8089, Hongli West Road, Donghai community, Xiangmihu street, Futian District, Shenzhen, Guangdong 518040

Applicant before: Honor Device Co.,Ltd.

GR01 Patent grant
GR01 Patent grant