CN117812523A - 一种录音信号的生成方法、装置、系统和电子设备 - Google Patents
一种录音信号的生成方法、装置、系统和电子设备 Download PDFInfo
- Publication number
- CN117812523A CN117812523A CN202211167230.8A CN202211167230A CN117812523A CN 117812523 A CN117812523 A CN 117812523A CN 202211167230 A CN202211167230 A CN 202211167230A CN 117812523 A CN117812523 A CN 117812523A
- Authority
- CN
- China
- Prior art keywords
- information
- audio signal
- energy
- signal
- azimuth information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 105
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 title abstract description 7
- 230000005236 sound signal Effects 0.000 claims abstract description 718
- 238000009877 rendering Methods 0.000 claims abstract description 23
- 230000004044 response Effects 0.000 claims description 55
- 238000004891 communication Methods 0.000 claims description 52
- 230000006854 communication Effects 0.000 claims description 52
- 230000015654 memory Effects 0.000 claims description 41
- 238000004590 computer program Methods 0.000 claims description 10
- 230000000694 effects Effects 0.000 abstract description 11
- 230000006870 function Effects 0.000 description 39
- 238000012545 processing Methods 0.000 description 27
- 239000011159 matrix material Substances 0.000 description 23
- 238000007726 management method Methods 0.000 description 21
- 239000010410 layer Substances 0.000 description 18
- 239000013598 vector Substances 0.000 description 15
- 230000008569 process Effects 0.000 description 14
- 238000010295 mobile communication Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 210000000988 bone and bone Anatomy 0.000 description 9
- 210000005069 ears Anatomy 0.000 description 9
- 239000000284 extract Substances 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 5
- 230000009467 reduction Effects 0.000 description 4
- 229920001621 AMOLED Polymers 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 210000003128 head Anatomy 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 230000003416 augmentation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000036772 blood pressure Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 239000012792 core layer Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000002138 osteoinductive effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000010349 pulsation Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003238 somatosensory effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Landscapes
- Stereophonic System (AREA)
Abstract
本申请实施例提供了一种录音信号的生成方法、装置、系统和电子设备。该方法包括:获取左耳拾音装置对待处理声音信号进行拾音后得到的第一音频信号,以及右耳拾音装置对待处理声音信号进行拾音后得到的第二音频信号;获取第一音频信号的第一直达声信号和第二音频信号的第二直达声信号;根据第一直达声信号和第二直达声信号,确定发出待处理声音信号的声源的第一方位信息;根据第一方位信息,对第一直达声信号和第二直达声信号进行渲染,生成录音信号。通过该方法得到的录音信号,充分融合了声源的方位信息,可以很好地表达声音信号的空间信息,重放后,可以达到人耳听感的效果,用户体验更好。
Description
技术领域
本申请涉及终端技术领域,尤其涉及一种录音信号的生成方法、装置、系统和电子设备。
背景技术
目前,在立体声录音的应用场景中,通常是由用户佩戴立体声耳机,例如真无线立体声(true wireless stereo,TWS)耳机,然后通过该立体声耳机位于用户左耳中的左耳拾音装置(例如麦克风)和位于用户右耳中的右耳拾音装置,同时对周围环境中的声音信号进行拾音。然后,通过与该立体声耳机通信连接的电子设备,对拾音后得到的音频信号进行保存,从而得到立体声录音信号。
但是,由于立体声耳机的硬件设备所能呈现的空间感受限,使得按照上述方式得到的录音信号,无法准确表达声音信号的空间信息,无法达到人耳听感的效果,后续重放时,无法实现空间感的还原,用户体验较差。
发明内容
本申请实施例提供了一种录音信号的生成方法、装置、系统和电子设备,以解决目前立体声录音得到的录音信号,无法准确表达声音信号的空间信息,导致后续重放时,无法实现空间感的还原,用户体验较差的问题。
第一方面,本申请实施例提供了一种录音信号的生成方法,该方法包括:
获取第一音频信号和第二音频信号,所述第一音频信号为左耳拾音装置对待处理声音信号进行拾音后得到的音频信号,所述第二音频信号为右耳拾音装置对所述待处理声音信号进行拾音后得到的音频信号;
获取所述第一音频信号的第一直达声信号和所述第二音频信号的第二直达声信号;
根据所述第一直达声信号和所述第二直达声信号,确定发出所述待处理声音信号的声源的第一方位信息;
根据所述第一方位信息,对所述第一直达声信号和所述第二直达声信号进行渲染,生成所述待处理声音信号的录音信号。
这样,通过该方法,电子设备可以对左耳拾音装置对待处理声音信号拾音后得到的第一音频信号和右耳拾音装置对相同的待处理声音信号拾音后得到的第二音频信号,分别进行直达声提取,得到第一直达声信号和第二直达声信号。然后,可以根据第一直达声信号和第二直达声信号确定发出声音信号的声源的方位信息。之后,可以根据该方位信息对第一直达声信号和第二直达声信号进行渲染,得到待处理声音信号的录音信号。可见,通过该方法得到的录音信号,充分融合了声源的方位信息,可以很好地表达声音信号的空间信息,重放后,可以达到人耳听感的效果,用户体验更好。
一种可能的实现方式中,所述根据所述第一直达声信号和所述第二直达声信号,确定发出所述待处理声音信号的声源的第一方位信息,包括:
根据所述第一直达声信号和所述第二直达声信号生成双耳差值信息,所述双耳差值信息包括第一耳间时间差和/或第一耳间强度差;
根据所述双耳差值信息,确定所述第一方位信息。
这样,电子设备在提取到第一音频信号的第一直达声信号,以及第二音频信号的第二直达声信号之后,可以根据这两个直达声信号获取双耳间的差值信息,之后,可以根据双耳差值信息确定声源的方位信息,使得后续生成的录音信号,充分融合声源的方位信息,能够很好地表达声音信号的空间信息,重放后,用户的听感体验更好。
一种可能的实现方式中,所述双耳差值信息为所述第一耳间时间差,所述根据所述双耳差值信息,确定所述第一方位信息,包括:
获取所述第一耳间时间差对应的第一预设方位信息和第二预设方位信息;
确定第二方位信息,所述第二方位信息指示的方位为所述第一预设方位信息和所述第二预设方位信息共同指示的方位;
获取第三音频信号,所述第三音频信号为第一辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第一辅助拾音装置位于所述第二方位信息指示的方位且与所述左耳拾音装置和所述右耳拾音装置不在同一平面;
获取第一能量和第二能量,所述第一能量为所述第一音频信号和所述第二音频信号中与所述第二方位信息对应的音频信号的能量,所述第二能量为所述第三音频信号的能量;
根据所述第一能量、所述第二能量、所述第一预设方位信息和所述第二预设方位信息,确定所述第一方位信息。
这样,在第一音频信号和第二音频信号的频率既不过高,也不会太低的场景中,可以根据耳间时间差,精确地得到声源的方位信息,使得后续生成的录音信号,可以更加准确地表达声音信号的空间信息,重放后,用户的听感体验更好。
一种可能的实现方式中,所述双耳差值信息为所述第一耳间强度差,所述根据所述双耳差值信息,确定所述第一方位信息,包括:
获取所述第一耳间强度差对应的第三预设方位信息和第四预设方位信息;
确定第三方位信息,所述第三方位信息指示的方位为所述第三预设方位信息和所述第四预设方位信息共同指示的方位;
获取第四音频信号,所述第四音频信号为第二辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第二辅助拾音装置位于所述第三方位信息指示的方位且与所述左耳拾音装置和所述右耳拾音装置不在同一平面;
获取第三能量和第四能量,所述第三能量为所述第一音频信号和所述第二音频信号中与所述第三方位信息对应的音频信号的能量,所述第四能量为所述第四音频信号的能量;
根据所述第三能量、所述第四能量、所述第三预设方位信息和所述第四预设方位信息,确定所述第一方位信息。
这样,在第一音频信号和第二音频信号的频率较高的场景中,可以根据耳间强度差,精确地得到声源的方位信息,使得后续生成的录音信号,可以更加准确地表达声音信号的空间信息,重放后,用户的听感体验更好。
一种可能的实现方式中,所述双耳差值信息为所述第一耳间时间差和所述第一耳间强度差,所述根据所述双耳差值信息,确定所述第一方位信息,包括:
获取所述第一耳间时间差对应的第一预设方位信息和第二预设方位信息,以及所述第一耳间强度差对应的第三预设方位信息和第四预设方位信息;
确定第二方位信息和第三方位信息,所述第二方位信息指示的方位为所述第一预设方位信息和所述第二预设方位信息共同指示的方位,所述第三方位信息指示的方位为所述第三预设方位信息和所述第四预设方位信息共同指示的方位;
获取第三音频信号和第四音频信号,所述第三音频信号为第一辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第四音频信号为第二辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第一辅助拾音装置位于所述第二方位信息指示的方位,所述第二辅助拾音装置位于所述第三方位信息指示的方位,所述第一辅助拾音装置和所述第二辅助拾音装置均与所述左耳拾音装置和所述右耳拾音装置不在同一平面;
获取第一能量、第二能量、第三能量和第四能量,所述第一能量为所述第一音频信号和所述第二音频信号中与所述第二方位信息对应的音频信号的能量,所述第二能量为所述第三音频信号的能量,所述第三能量为所述第一音频信号和所述第二音频信号中与所述第三方位信息对应的音频信号的能量,所述第四能量为所述第四音频信号的能量;
根据所述第一能量、所述第二能量、所述第一预设方位信息和所述第二预设方位信息,确定第四方位信息;
根据所述第三能量、所述第四能量、所述第三预设方位信息和所述第四预设方位信息,确定第五方位信息;
根据所述第四方位信息和所述第五方位信息生成所述第一方位信息。
这样,在任意的应用场景中,都可以根据耳间时间差和耳间强度差,共同确定声源的方位信息,适用性更好,并且确定出的方位信息更加精确,使得后续生成的录音信号,可以更加准确地表达声音信号的空间信息,重放后,用户的听感体验更好。
一种可能的实现方式中,所述根据所述第一方位信息,对所述第一直达声信号和所述第二直达声信号进行渲染,生成所述待处理声音信号的录音信号,包括:
获取第一响应信息,所述第一响应信息为所述第一方位信息对应的预设双耳房间脉冲响应信息;
根据所述第一响应信息,对所述第一直达声信号和所述第二直达声信号进行渲染,生成所述待处理声音信号的录音信号。
这样,可以增强录音信号的空间感,使得录音信号更加接近人耳的听感,用户体验更好。
第二方面,本申请实施例提供了一种录音信号的生成装置,该装置包括:
第一获取模块,用于获取第一音频信号和第二音频信号,所述第一音频信号为左耳拾音装置对待处理声音信号进行拾音后得到的音频信号,所述第二音频信号为右耳拾音装置对所述待处理声音信号进行拾音后得到的音频信号;
第二获取模块,用于获取所述第一音频信号的第一直达声信号和所述第二音频信号的第二直达声信号;
确定模块,用于根据所述第一直达声信号和所述第二直达声信号,确定发出所述待处理声音信号的声源的第一方位信息;
生成模块,用于根据所述第一方位信息,对所述第一直达声信号和所述第二直达声信号进行渲染,生成所述待处理声音信号的录音信号。
一种可能的实现方式中,所述确定模块用于根据所述第一直达声信号和所述第二直达声信号,确定发出所述待处理声音信号的声源的第一方位信息,具体为:
所述确定模块用于:
根据所述第一直达声信号和所述第二直达声信号生成双耳差值信息,所述双耳差值信息包括第一耳间时间差和/或第一耳间强度差;
根据所述双耳差值信息,确定所述第一方位信息。
一种可能的实现方式中,所述双耳差值信息为所述第一耳间时间差,所述确定模块用于根据所述双耳差值信息,确定所述第一方位信息,具体为:
所述确定模块用于:
获取所述第一耳间时间差对应的第一预设方位信息和第二预设方位信息;
确定第二方位信息,所述第二方位信息指示的方位为所述第一预设方位信息和所述第二预设方位信息共同指示的方位;
获取第三音频信号,所述第三音频信号为第一辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第一辅助拾音装置位于所述第二方位信息指示的方位且与所述左耳拾音装置和所述右耳拾音装置不在同一平面;
获取第一能量和第二能量,所述第一能量为所述第一音频信号和所述第二音频信号中与所述第二方位信息对应的音频信号的能量,所述第二能量为所述第三音频信号的能量;
根据所述第一能量、所述第二能量、所述第一预设方位信息和所述第二预设方位信息,确定所述第一方位信息。
一种可能的实现方式中,所述双耳差值信息为所述第一耳间强度差,所述确定模块用于根据所述双耳差值信息,确定所述第一方位信息,具体为:
所述确定模块用于:
获取所述第一耳间强度差对应的第三预设方位信息和第四预设方位信息;
确定第三方位信息,所述第三方位信息指示的方位为所述第三预设方位信息和所述第四预设方位信息共同指示的方位;
获取第四音频信号,所述第四音频信号为第二辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第二辅助拾音装置位于所述第三方位信息指示的方位且与所述左耳拾音装置和所述右耳拾音装置不在同一平面;
获取第三能量和第四能量,所述第三能量为所述第一音频信号和所述第二音频信号中与所述第三方位信息对应的音频信号的能量,所述第四能量为所述第四音频信号的能量;
根据所述第三能量、所述第四能量、所述第三预设方位信息和所述第四预设方位信息,确定所述第一方位信息。
一种可能的实现方式中,所述双耳差值信息为所述第一耳间时间差和所述第一耳间强度差,所述确定模块用于根据所述双耳差值信息,确定所述第一方位信息,具体为:
所述确定模块用于:
获取所述第一耳间时间差对应的第一预设方位信息和第二预设方位信息,以及所述第一耳间强度差对应的第三预设方位信息和第四预设方位信息;
确定第二方位信息和第三方位信息,所述第二方位信息指示的方位为所述第一预设方位信息和所述第二预设方位信息共同指示的方位,所述第三方位信息指示的方位为所述第三预设方位信息和所述第四预设方位信息共同指示的方位;
获取第三音频信号和第四音频信号,所述第三音频信号为第一辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第四音频信号为第二辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第一辅助拾音装置位于所述第二方位信息指示的方位,所述第二辅助拾音装置位于所述第三方位信息指示的方位,所述第一辅助拾音装置和所述第二辅助拾音装置均与所述左耳拾音装置和所述右耳拾音装置不在同一平面;
获取第一能量、第二能量、第三能量和第四能量,所述第一能量为所述第一音频信号和所述第二音频信号中与所述第二方位信息对应的音频信号的能量,所述第二能量为所述第三音频信号的能量,所述第三能量为所述第一音频信号和所述第二音频信号中与所述第三方位信息对应的音频信号的能量,所述第四能量为所述第四音频信号的能量;
根据所述第一能量、所述第二能量、所述第一预设方位信息和所述第二预设方位信息,确定第四方位信息;
根据所述第三能量、所述第四能量、所述第三预设方位信息和所述第四预设方位信息,确定第五方位信息;
根据所述第四方位信息和所述第五方位信息生成所述第一方位信息。
一种可能的实现方式中,所述生成模块用于根据所述第一方位信息,对所述第一直达声信号和所述第二直达声信号进行渲染,生成所述待处理声音信号的录音信号,具体为:
所述生成模块用于:
获取第一响应信息,所述第一响应信息为所述第一方位信息对应的预设双耳房间脉冲响应信息;
根据所述第一响应信息,对所述第一直达声信号和所述第二直达声信号进行渲染,生成所述待处理声音信号的录音信号。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或者多个处理器和一个或者多个存储器;所述一个或者多个存储器存储有计算机程序或指令,当所述计算机程序或指令被所述一个或者多个处理器执行时,使得所述电子设备执行第一方面中任意一项所述的方法。
第四方面,本申请实施例提供了一种录音信号的生成系统,该系统包括:用于对待处理声音信号进行拾音的左耳拾音装置和右耳拾音装置,以及第三方面所述的电子设备;所述电子设备中设置有用于对所述待处理声音信号进行拾音的第一辅助拾音装置和第二辅助拾音装置;所述左耳拾音装置和所述右耳拾音装置与所述电子设备之间,通过无线方式或有线方式,通信连接。
第五方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序或指令,当所述计算机程序或指令被执行时,如第一方面中任意一项所述的方法被执行。
可见,通过本申请提供的录音信号的生成方法、装置、系统和电子设备,电子设备可以对左耳拾音装置对待处理声音信号拾音后得到的第一音频信号和右耳拾音装置对相同的待处理声音信号拾音后得到的第二音频信号,分别进行直达声提取,得到第一直达声信号和第二直达声信号。然后,可以根据第一直达声信号和第二直达声信号确定发出声音信号的声源的方位信息。之后,可以根据该方位信息对第一直达声信号和第二直达声信号进行渲染,得到待处理声音信号的录音信号。可见,通过该方法得到的录音信号,充分融合了声源的方位信息,可以很好地表达声音信号的空间信息,重放后,可以达到人耳听感的效果,用户体验更好。
附图说明
图1是本申请实施例提供的一种应用场景示意图;
图2是本申请实施例提供的一种电子设备的结构示意图;
图3是本申请实施例提供的一种电子设备的软件结构框图;
图4是本申请实施例提供的一种录音信号的生成方法的流程示意图;
图5是本申请实施例提供的一种获取第一音频信号的第一直达声信号和第二音频信号的第二直达声信号的方法的流程示意图;
图6是本申请实施例提供的一种确定第一方位信息的方法的流程示意图;
图7是本申请实施例提供的另一种应用场景示意图;
图8是本申请实施例提供的另一种确定第一方位信息的方法的流程示意图;
图9是本申请实施例提供的另一种确定第一方位信息的方法的流程示意图;
图10是本申请实施例提供的一种录音信号的生成装置的结构框图;
图11是本申请实施例提供的一种芯片的结构框图。
具体实施方式
下面结合附图,对本申请的技术方案进行描述。
在本申请的描述中,除非另有说明,“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。此外,“至少一个”是指一个或多个,“至少两个”是指两个或两个以上,“多个”也是指两个或两个以上。“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
需要说明的是,本申请中,“示例性地”或者“例如”等词用于表示作例子、例证或说明。本申请中被描述为“示例性地”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“示例性地”或者“例如”等词旨在以具体方式呈现相关概念。
为了便于理解本申请的技术方案,下面先对本申请提供的技术方案的应用场景进行示例性说明。
参见图1,图1为本申请提供的一种应用场景示意图。本申请的技术方案可以应用于图1所示的应用场景中。如图1所示,该应用场景中可以包括:电子设备100和立体声耳机200。
其中,立体声耳机200可以包括左耳耳机201和右耳耳机202。左耳耳机201可以用于佩戴于用户的左耳。左耳耳机201中可以设置左耳拾音装置(例如麦克风)。左耳耳机201可以通过其中的左耳拾音装置对周围环境中的声音信号进行拾音,生成左耳音频信号。右耳耳机202可以用于佩戴于用户的右耳。右耳耳机202中可以设置右耳拾音装置。右耳耳机202可以通过其中的右耳拾音装置,对周围环境中的声音信号进行拾音,生成右耳音频信号。
电子设备100可以通过有线连接的方式或无线连接的方式,与立体声耳机200的左耳耳机201和/或右耳耳机202,进行通信连接。电子设备100与左耳耳机201进行通信连接后,可以从左耳耳机201获取左耳音频信号。相应地,电子设备100与右耳耳机202进行通信连接后,可以从右耳耳机202获取右耳音频信号。
电子设备100中还可以设置一个或多个辅助拾音装置,例如,设置于电子设备100的顶部的麦克风(简称顶麦)、设置于电子设备100的底部的麦克风(简称底麦)和设置于电子设备100的背部的麦克风(简称背麦)等。电子设备100还可以通过其中设置的辅助拾音装置对周围环境中的声音信号进行拾音,生成相应的音频信号。
此外,电子设备100和立体声耳机200的具体作用或功能,还可以参考后续实施例的内容,此处不再详述。
目前,用户双耳佩戴立体声耳机200后,即左耳佩戴左耳耳机201,同时,右耳佩戴右耳耳机202后,可以通过立体声耳机200的左耳耳机201和右耳耳机202,同时对周围环境中的声音信号进行拾音,分别生成左耳音频信号和右耳音频信号。在此过程中,电子设备100可以与立体声耳机200的左耳耳机201和右耳耳机202建立通信连接,实时地从立体声耳机200获取左耳音频信号和右耳音频信号,并且将获得的由相同声音信号生成的左耳音频信号和右耳音频信号,作为录音信号,对应存储。后续,可以通过电子设备100中的扬声器,将录音信号进行重放。
不过,由于立体声耳机200的硬件设备所能呈现的空间感受限,生成的录音信号不能很好地表达声音信号的空间信息,无法达到人耳听感的效果,后续在重放时,无法实现空间感的还原,用户体验较差。
为了解决上述问题,本申请实施例提供了一种录音信号的生成方法、装置、系统和电子设备。该方法中,电子设备可以对左耳拾音装置对待处理声音信号拾音后得到的第一音频信号和右耳拾音装置对相同的待处理声音信号拾音后得到的第二音频信号,分别进行直达声提取,得到第一直达声信号和第二直达声信号。然后,可以根据第一直达声信号和第二直达声信号确定发出声音信号的声源的方位信息。之后,可以根据该方位信息对第一直达声信号和第二直达声信号进行渲染,得到待处理声音信号的录音信号。通过该方法得到的录音信号,充分融合了声源的方位信息,可以很好地表达声音信号的空间信息,重放后,可以达到人耳听感的效果,用户体验更好。
需要说明的是,本申请的电子设备可以是静止的,也可以是移动的。电子设备可以包括通信终端、车载设备、移动设备、用户终端、移动终端、无线通信设备、便携式终端、用户代理、用户装置、服务设备或用户设备(user equipment,UE)等计算机网络中处于网络最外围的设备,主要用于数据的输入以及处理结果的输出或显示等。例如,终端设备可以是移动电话、平板设备、具备无线通信功能的手持设备、计算设备、车载通信模块或连接到无线调制解调器的其它处理设备等。
示例性地,可以参见图2,图2示出了电子设备100的结构示意图。
电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本发明实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-networkprocessing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K,充电器,闪光灯,摄像头193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现电子设备100的触摸功能。
I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器110与显示屏194,摄像头193等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(displayserial interface,DSI)等。在一些实施例中,处理器110和摄像头193通过CSI接口通信,实现电子设备100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现电子设备100的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器110与摄像头193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为电子设备100充电,也可以用于电子设备100与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他电子设备,例如AR设备等。
可以理解的是,本发明实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备100的结构限定。在本申请另一些实施例中,电子设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过电子设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为电子设备供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。
电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在电子设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,电子设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得电子设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivision multiple access,CDMA),宽带码分多址(wideband code division multipleaccess,WCDMA),时分码分多址(time-division code division multiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidounavigation satellite system,BDS),准天顶卫星系统(quasi-zenith satellitesystem,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
电子设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,电子设备100可以包括1个或N个显示屏194,N为大于1的正整数。
电子设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,电子设备100可以包括1个或N个摄像头193,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样,电子设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(movingpicture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。处理器110通过运行存储在内部存储器121的指令,和/或存储在设置于处理器中的存储器的指令,执行电子设备100的各种功能应用以及数据处理。
电子设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备100可以通过扬声器170A收听音乐,或收听免提通话。电子设备100中可以设置多个扬声器170A,例如,可以在电子设备100的顶部设置一个扬声器170A,还可以在底部设置一个扬声器170A等。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。在一些实施例中,也可以将扬声器170A和受话器170B设置为一个部件,本申请对此不进行限制。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。电子设备100可以设置至少一个麦克风170C。在另一些实施例中,电子设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,电子设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动电子设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association ofthe USA,CTIA)标准接口。
压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180A,电极之间的电容改变。电子设备100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194,电子设备100根据压力传感器180A检测所述触摸操作强度。电子设备100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
陀螺仪传感器180B可以用于确定电子设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定电子设备100围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器180B检测电子设备100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消电子设备100的抖动,实现防抖。陀螺仪传感器180B还可以用于导航,体感游戏场景。
气压传感器180C用于测量气压。在一些实施例中,电子设备100通过气压传感器180C测得的气压值计算海拔高度,辅助定位和导航。
磁传感器180D包括霍尔传感器。电子设备100可以利用磁传感器180D检测翻盖皮套的开合。在一些实施例中,当电子设备100是翻盖机时,电子设备100可以根据磁传感器180D检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。
加速度传感器180E可检测电子设备100在各个方向上(一般为三轴)加速度的大小。当电子设备100静止时可检测出重力的大小及方向。还可以用于识别电子设备姿态,应用于横竖屏切换,计步器等应用。
距离传感器180F,用于测量距离。电子设备100可以通过红外或激光测量距离。在一些实施例中,拍摄场景,电子设备100可以利用距离传感器180F测距以实现快速对焦。
接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。电子设备100通过发光二极管向外发射红外光。电子设备100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定电子设备100附近有物体。当检测到不充分的反射光时,电子设备100可以确定电子设备100附近没有物体。电子设备100可以利用接近光传感器180G检测用户手持电子设备100贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180G也可用于皮套模式,口袋模式自动解锁与锁屏。
环境光传感器180L用于感知环境光亮度。电子设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合,检测电子设备100是否在口袋里,以防误触。
指纹传感器180H用于采集指纹。电子设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
温度传感器180J用于检测温度。在一些实施例中,电子设备100利用温度传感器180J检测的温度,执行温度处理策略。例如,当温度传感器180J上报的温度超过阈值,电子设备100执行降低位于温度传感器180J附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,电子设备100对电池142加热,以避免低温导致电子设备100异常关机。在其他一些实施例中,当温度低于又一阈值时,电子设备100对电池142的输出电压执行升压,以避免低温导致的异常关机。
触摸传感器180K,也称“触控器件”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于电子设备100的表面,与显示屏194所处的位置不同。
骨传导传感器180M可以获取振动信号。在一些实施例中,骨传导传感器180M可以获取人体声部振动骨块的振动信号。骨传导传感器180M也可以接触人体脉搏,接收血压跳动信号。在一些实施例中,骨传导传感器180M也可以设置于耳机中,结合成骨传导耳机。音频模块170可以基于所述骨传导传感器180M获取的声部振动骨块的振动信号,解析出语音信号,实现语音功能。应用处理器可以基于所述骨传导传感器180M获取的血压跳动信号解析心率信息,实现心率检测功能。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备100可以接收按键输入,产生与电子设备100的用户设置以及功能控制有关的键信号输入。
马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和电子设备100的接触和分离。电子设备100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。电子设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,电子设备100采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在电子设备100中,不能和电子设备100分离。
电子设备100的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。本发明实施例以分层架构的Android系统为例,示例性说明电子设备100的软件结构。
图3是本申请实施例的电子设备100的软件结构框图。
分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Androidruntime)和系统库,以及内核层。
应用程序层可以包括一系列应用程序包。
如图3所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息等应用程序。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。
如图3所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供电子设备100的通信功能。例如通话状态的管理(包括接通,挂断等)。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。
AndroidRuntime包括核心库和虚拟机。Androidruntime负责安卓系统的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)等。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。
下面,对本申请提供的录音信号的生成方法的实施例进行说明。
参见图4,图4为本申请实施例提供的一种录音信号的生成方法的流程示意图。该方法可以应用于电子设备,例如可以应用于图1至图3所示的电子设备100中。如图4所示,该方法可以包括以下步骤:
步骤S101、获取第一音频信号和第二音频信号。
结合前述内容可知,用户双耳佩戴立体声耳机(例如TWS耳机)后,可以通过双耳佩戴的立体声耳机的左耳拾音装置和右耳拾音装置同时对相同的声音信号进行拾音,然后将拾音后得到的左耳音频信号和右耳音频信号发送给电子设备,通过电子设备进行存储,达到录音的目的,从而得到录音信号。也就是说,电子设备可以通过与其通信连接的左耳拾音装置和右耳拾音装置,获取左耳拾音装置对声音信号拾音后得到的左耳音频信号和右耳拾音装置对相同的声音信号拾音后得到的右耳音频信号。
例如,在用户使用TWS耳机和手机进行视频网络日志(video blog,VOLG)拍摄的应用场景中,用户双耳佩戴TWS耳机后,可以通过蓝牙或WIFI,将TWS耳机与手机建立通信连接。然后,用户可以在手机的VOLG拍摄模式下,开启双耳录音功能。之后,TWS耳机可以通过左耳中的麦克风和右耳中的麦克风,同时对相同的声音信号进行拾音,得到相同的声音信号对应的左耳音频信号和右耳音频信号。在此过程中,手机可以实时地获取到TWS耳机拾音后生成的左耳音频信号和右耳音频信号,并且,手机可以将来自于相同声音信号的左耳音频信号和右耳音频信号,作为录音信号,进行对应存储。
需要说明的是,在通过用户双耳佩戴的立体声耳机,进行录音的过程中,左耳拾音装置和右耳拾音装置都可以实时且连续地对声音信号进行拾音。并且电子设备也可以实时且连续地从左耳拾音装置和右耳拾音装置获取到左耳音频信号和右耳音频信号。电子设备获取到左耳音频信号和右耳音频信号后,可以按照一定的处理频率,对获取到的由相同声音信号生成的左耳音频信号和右耳音频信号进行后续处理,生成录音信号。由于电子设备每次对由相同声音信号生成的左耳音频信号和右耳音频信号进行处理,生成录音信号的实现方式相同,所以,本申请后续实施例中,以任意一次由相同声音信号(后续将该声音信号记为待处理声音信号)生成的左耳音频信号和右耳音频信号为例,对本申请提供的录音信号的生成方法的实施例进行说明,基于其它声音信号得到的左耳音频信号和右耳音频信号生成录音信号的处理方式参考该处理方式即可。
在此基础上,在本申请的后续实施例中,将左耳拾音装置对待处理声音信号进行拾音后得到的音频信号(左耳音频信号)记为第一音频信号。将右耳拾音装置对待处理声音信号进行拾音后得到的音频信号(右耳音频信号)记为第二音频信号。
左耳拾音装置和右耳拾音装置分别得到第一音频信号和第二音频信号之后,可以将第一音频信号和第二音频信号发送给电子设备。也就是说,电子设备可以从与其通信连接的左耳拾音装置和右耳拾音装置中获取第一音频信号和第二音频信号。
步骤S102、获取所述第一音频信号的第一直达声信号和所述第二音频信号的第二直达声信号。
音频信号通常包括直达声信号和环境声信号。为了便于区分,本申请后续实施例中,将第一音频信号包括的直达声信号记为第一直达声信号,将第一音频信号包括的环境声信号记为第一环境声信号。将第二音频信号包括的直达声信号记为第二直达声信号,将第二音频信号包括的环境声信号记为第二环境声信号。
电子设备通过与其通信连接的左耳拾音装置获取到第一音频信号,以及通过与其通信连接的右耳拾音装置获取到第二音频信号之后,可以从第一音频信号中提取第一直达声信号,以及从第二音频信号中提取第二直达声信号。
一种可能的实现方式中,从第一音频信号中提取第一直达声信号,以及从第二音频信号中提取第二直达声信号的实现方式,可以参见图5,图5为本申请实施例提供的一种获取第一音频信号的第一直达声信号和第二音频信号的第二直达声信号的方法的流程示意图。如图5所示,该方法可以包括以下步骤:
步骤S201、生成第一频域信号和第二频域信号。
其中,第一频域信号是指由第一音频信号转换至频域坐标系后得到的信号。第二频域信号是指由第二音频信号转换至频域坐标系后得到的信号。
可选地,可以通过对第一音频信号进行傅里叶变换,得到第一频域信号。同理,可以通过对第二音频信号进行傅里叶变换,得到第二频域信号。
步骤S202、根据所述第一频域信号和所述第二频域信号,生成协方差矩阵。
具体实现时,待处理声音信号可以包括多个声音信号,对于待处理声音信号包括的每一个声音信号,第一音频信号和第二音频信号中分别对应一个信号。同理,对于待处理声音信号包括的每一个声音信号,第一频域信号和第二频域信号中也都分别对应一个信号。所以,在执行步骤S202时,需要对待处理声音信号包括的每一个声音信号,分别对应生成一个协方差矩阵。
可选地,在生成待处理声音信号包括的任意一个声音信号对应的协方差矩阵时,可以将该声音信号确定为目标信号,然后按照下述方式,生成目标信号对应的协方差矩阵:获取第一频域信号包括的第一信号Xl和第二频域信号包括的第二信号Xr;其中,第一信号Xl为第一频域信号包括的与目标信号对应的信号,第二信号Xr为第二频域信号包括的与目标信号对应的信号;获取第一信号Xl和第二信号Xr构成的矩阵,记为第一矩阵XH,XH=[Xl,Xr];获取第一矩阵的共轭转置矩阵X;根据第一矩阵XH和第一矩阵的共轭转置矩阵X,生成协方差矩阵C,C=XXH。
步骤S203、对所述协方差矩阵进行特征值分解,生成多个特征值和每个特征值对应的特征向量。
在执行步骤S203时,需要对每一个协方差矩阵进行特征值分解,生成该协方差矩阵对应的多个特征值和每个特征值对应的特征向量。
步骤S204、获取目标特征向量的归一化向量。
在执行步骤S204时,需要获取每一个协方差矩阵对应的目标特征向量的归一化向量。
其中,对于任意一个协方差矩阵,其对应的目标特征向量是指该协方差矩阵对应的目标特征值对应的特征向量。协方差矩阵对应的目标特征值是指该协方差矩阵对应生成的多个特征值中最大的特征值。
可选地,获取任意一个目标特征向量的归一化向量,可以按照下述方式实现:对目标特征向量ν1进行归一化处理,生成归一化向量P,
步骤S205、根据所述归一化向量获取第一直达声信号和第二直达声信号。
对于待处理声音信号包括的每一个声音信号,将该声音信号确定为目标信号,生成目标信号对应的协方差矩阵,并且获取到该协方差矩阵对应的目标特征向量的归一化向量之后,可以按照下述方式获取目标信号对应的直达声信号:根据归一化向量P和第一信号Xl,按照下述公式ωl=XlP,计算得到第一权重系数ωl;根据归一化向量P和第二信号Xr,按照下述公式ωr=XrP,计算得到第二权重系数ωr;根据第一权重系数ωl和归一化向量P,按照下述公式Pl=ωlP,计算得到第一信号Xl包括的直达声信号Pl;根据第二权重系数ωr和归一化向量P,按照下述公式Pr=ωrP,计算得到第二信号Xr包括的直达声信号Pr。
按照上述方式得到待处理声音信号包括的每一个声音信号对应的直达声信号Pl和直达声信号Pr之后,便可以得到第一直达声信号和第二直达声信号。第一直达声信号包括待处理声音信号包括的所有声音信号对应的直达声信号Pl,第二直达声信号包括待处理声音信号包括的所有声音信号对应的直达声信号Pr。第一直达声信号和第二直达声信号均为频域坐标系下的信号。
步骤S103、根据所述第一直达声信号和所述第二直达声信号,确定发出待处理声音信号的声源的第一方位信息。
获取到第一音频信号的第一直达声信号和第二音频信号的第二直达声信号之后,可以根据第一直达声信号和第二直达声信号生成双耳间的差值信息,简称双耳差值信息。示例性地,双耳差值信息可以包括第一耳间时间差(interaural time difference,ITD)和/或第一耳间强度差(interaural intensity difference,IID)。然后,可以根据双耳差值信息,确定发出待处理声音信号的声源的第一方位信息。
可选地,获取到第一直达声信号和第二直达声信号之后,可以按照下述公式ITD=argmaxτRlr(τ)=argmaxτ(ifft(pl(f)pr(f))),计算得到第一耳间时间差ITD。其中,pl(f)表示第一直达声信号包括的某一个频点的信号。pr(f)表示第二直达声信号包括的某一个频点的信号,信号pl(f)和信号pr(f)对应待处理声音信号中的同一个声音信号,τ表示第一直达声信号和第二直达声信号互相关最大值对应的时延。
可选地,获取到第一直达声信号和第二直达声信号之后,还可以先将第一直达声信号,通过傅里叶逆变换,转换至时域坐标系下,得到时域坐标系下的第三直达声信号,以及,将第二直达声信号,通过傅里叶逆变换,转换至时域坐标系下,得到时域坐标系下的第四直达声信号。然后,还可以按照下述公式ITD=argmaxτRlr(τ)=argmaxτ∫pl(t)pr(t+τ)dt,计算得到第一耳间时间差ITD。其中,pl(t)表示第三直达声信号包括的某一个时刻的信号,pr(t+τ)表示第四直达声信号包括的某一个时刻的信号,τ的含义如上,此处不再赘述。当t的取值相同时,pl(t)和pr(t+τ)对应待处理声音信号中的同一个声音信号。
可选地,获取到第一直达声信号和第二直达声信号之后,可以按照下述公式首先计算得到待处理声音信号中每一个声音信号对应的IID(f),然后对待处理声音信号中所有声音信号对应的IID(f)求均值,得到第一耳间强度差IID。其中,pl(f)表示第一直达声信号包括的某一个频点的信号。pr(f)表示第二直达声信号包括的某一个频点的信号,信号pl(f)和信号pr(f)对应待处理声音信号中的同一个声音信号。
根据第一直达声信号和第二直达声信号,计算得到双耳差值信息之后,根据双耳差值信息,确定发出待处理声音信号的声源的第一方位信息,可以按照多种方式实现。例如:
第一种方式中,双耳差值信息为第一耳间时间差,则根据双耳差值信息,确定第一方位信息,可以参见图6所示的实现方式,图6为本申请实施例提供的一种确定第一方位信息的方法的流程示意图。如图6所示,该方法可以包括以下步骤:
步骤S301、获取第一耳间时间差对应的第一预设方位信息和第二预设方位信息。
具体实现时,可以根据头相关函数(headrelatedtransferfunction,HRTF),预先建立耳间时间差和方位信息的对应关系。
根据耳间时间差确定的方位信息通常位于一个如图7所示的混淆锥内,一个耳间时间差通常可以对应两个方位信息,但是这两个方位信息仅能指示左或右的方位,无法指示前或后的方位,也就是说,通常这两个方位信息指示的左或右的方位相同,但是指示的前或后的方位不同,此处的前、后、左、右都是以用户双眼的正前方为前划分。
为了便于区分,本申请实施例中,将预先建立的耳间时间差和方位信息的对应关系中的耳间时间差记为第二耳间时间差,将该对应关系中的方位信息记为第五预设方位信息。
基于此,获取第一耳间时间差对应的第一预设方位信息和第二预设方位信息,可以按照下述方式实现:在预先存储的第二耳间时间差中找出与第一耳间时间差相同的第二耳间时间差,记为第三耳间时间差;将第三耳间时间差对应的两个第五预设方位信息分别确定为第一耳间时间差对应的第一预设方位信息和第二预设方位信息。第一预设方位信息和第二预设方位信息指示的左或右的方位相同,但是指示的前或后的方位可能不同。
步骤S302、确定第二方位信息。
其中,第二方位信息指示的方位为第一预设方位信息和第二预设方位信息共同指示的方位。例如,第一预设方位信息指示向左30度,第二预设方位信息指示向左60度,则第一预设方位信息与第二预设方位信息共同指示的方位为左。则,第二方位信息指示的方位为左。
步骤S303、获取第三音频信号。
其中,第三音频信号为第一辅助拾音装置对待处理声音信号进行拾音后得到的音频信号。第一辅助拾音装置位于第二方位信息指示的方位且与左耳拾音装置和右耳拾音装置不在同一平面。
例如,在用户使用TWS耳机和手机进行VOLG拍摄的应用场景中,如果第二方位信息指示的方位为左,则可以将手机的顶麦作为第一辅助拾音装置,手机的顶麦对待处理声音信号拾音后生成的音频信号即为第三音频信号。或者,如果第二方位信息指示的方位为右,则可以将手机的底麦作为第一辅助拾音装置,手机的底麦对待处理声音信号拾音后生成的音频信号即为第三音频信号。
步骤S304、获取第一能量和第二能量。
其中,第一能量为第一音频信号和第二音频信号中与第二方位信息对应的音频信号的能量。如果第二方位信息指示的方位为左,则第一音频信号与第二音频信号中与第二方位信息对应的音频信号为第一音频信号,则第一能量为第一音频信号的能量。或者,如果第二方位信息指示的方位为右,则第一音频信号与第二音频信号中与第二方位信息对应的音频信号为第二音频信号,则第一能量为第二音频信号的能量。第二能量为第三音频信号的能量。
步骤S305、根据所述第一能量、所述第二能量、所述第一预设方位信息和所述第二预设方位信息,确定第一方位信息。
具体实现时,如果第一能量大于第二能量,则说明发出待处理声音信号的声源靠近用户,则将第一预设方位信息和第二预设方位信息中指示的方位更靠近用户的预设方位信息确定为第一方位信息。即,如果第一预设方位信息指示的方位比第二预设方位信息指示的方位更加靠近用户,则将第一预设方位信息确定为第一方位信息。或者,如果第二预设方位信息指示的方位比第一预设方位信息指示的方位更加靠近用户,则将第二预设方位信息确定为第一方位信息。或者,
如果第一能量小于第二能量,则说明发出待处理声音信号的声源远离用户,靠近第一辅助拾音装置,则将第一预设方位信息和第二预设方位信息中指示的方位更远离用户的预设方位信息确定为第一方位信息。即,如果第一预设方位信息指示的方位比第二预设方位信息指示的方位更加远离用户,则将第一预设方位信息确定为第一方位信息。或者,如果第二预设方位信息指示的方位比第一预设方位信息指示的方位更加远离用户,则将第二预设方位信息确定为第一方位信息。
第二种方式中,双耳差值信息为第一耳间强度差,则根据双耳差值信息,确定第一方位信息,可以参见图8所示的实现方式,图8为本申请实施例提供的另一种确定第一方位信息的方法的流程示意图。如图8所示,该方法可以包括以下步骤:
步骤S401、获取第一耳间强度差对应的第三预设方位信息和第四预设方位信息。
具体实现时,还可以根据头相关函数,预先建立耳间强度差与方位信息的对应关系。并且,根据耳间强度差确定的方位信息通常也位于一个如图7所示的混淆锥内,一个耳间强度差通常也可以对应两个方位信息,这两个方位信息也仅能指示左或右的方位,无法指示前或后的方位,也就是说,这两个方位信息指示的左或右的方位相同,但是指示的前或后的方位可能不同。
为了便于区分,本申请实施例中,将预先建立的耳间强度差和方位信息的对应关系中的耳间强度差记为第二耳间强度差,将该对应关系中的方位信息记为第六预设方位信息。
基于此,获取第一耳间强度差对应的第三预设方位信息和第四预设方位信息,可以按照下述方式实现:在预先存储的第二耳间强度差中找出与第一耳间强度差相同的第二耳间强度差,记为第三耳间强度差;将第三耳间强度差对应的两个第六预设方位信息分别确定为第一时间强度差对应的第三预设方位信息和第四预设方位信息。第三预设方位信息和第四预设方位信息指示的左或右的方位相同,但是指示的前或后的方位可能不同。
步骤S402、确定第三方位信息。
其中,第三方位信息指示的方位为第三预设方位信息和第四预设方位信息共同指示的方位。例如,第三预设方位信息指示的方位为向左20度,第四预设方位信息指示的方位为向左70度,则第三预设方位信息和第四预设方位信息共同指示的方位为向左。则,第三方位信息指示的方位为向左。
步骤S403、获取第四音频信号。
其中,第四音频信号为第二辅助拾音装置对待处理声音信号进行拾音后得到的音频信号。第二辅助拾音装置位于第三方位信息指示的方位且与左耳拾音装置和右耳拾音装置不在同一平面。
例如,在用户使用TWS耳机和手机进行VOLG拍摄的应用场景中,如果第三方位信息指示的方位为左,则可以将手机的顶麦作为第二辅助拾音装置,手机的顶麦对待处理声音信号拾音后生成的音频信号即为第四音频信号。或者,如果第三方位信息指示的方位为右,则可以将手机的底麦作为第二辅助拾音装置,手机的底麦对待处理声音信号拾音后生成的音频信号即为第四音频信号。
步骤S404、获取第三能量和第四能量。
其中,第三能量为第一音频信号和第二音频信号中与第三方位信息对应的音频信号的能量。如果第三方位信息指示的方位为左,则第一音频信号与第二音频信号中与第三方位信息对应的音频信号为第一音频信号,则,第三能量为第一音频信号的能量。或者,如果第三方位信息指示的方位为右,则第一音频信号与第二音频信号中与第三方位信息对应的音频信号为第二音频信号,则第三能量为第二音频信号的能量。第四能量为第四音频信号的能量。
步骤S405、根据所述第三能量、所述第四能量、所述第三预设方位信息和所述第四预设方位信息,确定第一方位信息。
具体实现时,如果第三能量大于第四能量,则说明发出待处理声音信号的声源靠近用户,则将第三预设方位信息和第四预设方位信息中指示的方位更靠近用户的预设方位信息确定为第一方位信息。即,如果第三预设方位信息指示的方位比第四预设方位信息指示的方位更加靠近用户,则将第三预设方位信息确定为第一方位信息。或者,如果第四预设方位信息指示的方位比第三预设方位信息指示的方位更加靠近用户,则将第四预设方位信息确定为第一方位信息。或者,
如果第三能量小于第四能量,则说明发出待处理声音信号的声源远离用户,靠近第二辅助拾音装置,则将第三预设方位信息和第四预设方位信息中指示的方位更远离用户的预设方位信息确定为第一方位信息。即,如果第三预设方位信息指示的方位比第四预设方位信息指示的方位更加远离用户,则将第三预设方位信息确定为第一方位信息。或者,如果第四预设方位信息指示的方位比第三预设方位信息指示的方位更加远离用户,则将第四预设方位信息确定为第一方位信息。
第三种方式中,双耳差值信息为第一耳间时间差和第一耳间强度差,则根据双耳差值信息,确定第一方位信息,可以参见图9所示的实现方式,图9为本申请实施例提供的另一种确定第一方位信息的方法的流程示意图。如图9所示,该方法可以包括以下步骤:
步骤S501、获取第一耳间时间差对应的第一预设方位信息和第二预设方位信息,以及第一耳间强度差对应的第三预设方位信息和第四预设方位信息。
步骤S501的具体实现方式可以参见前述实施例的内容,此处不再赘述。
步骤S502、确定第二方位信息和第三方位信息。
其中,第二方位信息指示的方位为第一预设方位信息和第二预设方位信息共同指示的方位。第三方位信息指示的方位为第三预设方位信息和第四预设方位信息共同指示的方位。
步骤S502的具体实现方式可以参考前述实施例的内容,此处不再赘述。
步骤S503、获取第三音频信号和第四音频信号。
其中,第三音频信号为第一辅助拾音装置对待处理声音信号进行拾音后得到的音频信号。第四音频信号为第二辅助拾音装置对待处理声音信号进行拾音后得到的音频信号。第一辅助拾音装置位于第二方位信息指示的方位。第二辅助拾音装置位于第三方位信息指示的方位。第一辅助拾音装置和第二辅助拾音装置均与左耳拾音装置和右耳拾音装置不在同一平面。
需要说明的是,第一辅助拾音装置与第二辅助拾音装置可以相同,也可以不同。即,第一辅助拾音装置与第二辅助拾音装置可以为同一个拾音装置,也可以为不同的拾音装置。
步骤S503的具体实现方式可以参考前述实施例的内容,此处不再赘述。
步骤S504、获取第一能量、第二能量、第三能量和第四能量。
其中,第一能量为第一音频信号和第二音频信号中与第二方位信息对应的音频信号的能量。第二能量为第三音频信号的能量。第三能量为第一音频信号和第二音频信号中与第三方位信息对应的音频信号的能量。第四能量为第四音频信号的能量。
步骤S504的具体实现方式可以参考前述实施例的内容,此处不再赘述。
步骤S505、根据所述第一能量、所述第二能量、所述第一预设方位信息和所述第二预设方位信息,确定第四方位信息。
步骤S505的具体实现方式可以参考图6所示实施例中步骤S305的具体实现方式,此处不再详述。
步骤S506、根据所述第三能量、所述第四能量、所述第三预设方位信息和所述第四预设方位信息,确定第五方位信息。
步骤S506的具体实现方式可以参考图8所示实施例中步骤S405的具体实现方式,此处不再详述。
步骤S507、根据所述第四方位信息和所述第五方位信息生成第一方位信息。
单独基于耳间时间差,确定第一方位信息时,如果第一音频信号和第二音频信号的频率太高或太低,均会使得定位产生较大误差。单独基于耳间强度差确定第一方位信息时,如果第一音频信号和第二音频信号的频率较低,低频信号可能会绕过头部导致双耳间的差异不明显,也会导致定位不准确。
于是,为了进一步提高根据双耳差值信息确定第一方位信息的准确性,在通过第一耳间时间差确定出第四方位信息,以及通过第一耳间强度差确定出第五方位信息后,可以对第四方位信息和第五方位信息,进行均值计算,将计算得到的均值确定为第一方位信息。或者,还可以对第四方位信息和第五方位信息,进行加权平均计算,将计算得到的加权平均值确定为第一方位信息。
步骤S104、根据所述第一方位信息,对所述第一直达声信号和所述第二直达声信号进行渲染,生成所述待处理声音信号的录音信号。
具体实现时,可以预先建立双耳房间脉冲响应(binauralroom impulseresponse,BRIR)信息与方位信息的对应关系。为了便于区分,本申请中,将预先建立的双耳房间脉冲响应信息与方位信息的对应关系中的双耳房间脉冲响应信息记为预设双耳房间脉冲响应信息,将该对应关系中的方位信息记为第七预设方位信息。
基于此,根据第一方位信息,对第一直达声信号和第二直达声信号进行渲染,生成待处理声音信号的录音信号,可以按照下述方式实现:获取第一响应信息,第一响应信息为第一方位信息对应的预设双耳房间脉冲响应信息。根据第一响应信息,对第一直达声信号和第二直达声信号进行渲染,生成待处理声音信号的录音信号。
进一步地,获取第一响应信息,可以按照下述方式实现:在预先存储的第七预设方位信息中找出与第一方位信息相同的第七预设方位信息,记为第六方位信息;将第六方位信息对应的预设双耳房间脉冲响应信息确定为第一响应信息。
第一响应信息可以包括左耳响应信息和右耳响应信息。左耳响应信息和右耳响应信息都可以包括多个响应信息。左耳响应信息包括的任意一个响应信息可以表示为hl(t′),t′表示该响应信息的采集时间(或称为生成时间)。右耳响应信息包括的任意一个响应信息可以表示为hr(t′),t′表示该响应信息的采集时间(或称为生成时间)。
具体实现时,根据第一响应信息,对第一直达声信号和第二直达声信号进行渲染,生成待处理声音信号的录音信号的实现方式,可以包括多种。例如:
第一种方式中,可以先将第一直达声信号,通过傅里叶逆变换,转换至时域坐标系下,得到时域坐标系下的第三直达声信号,以及,将第二直达声信号,通过傅里叶逆变换,转换至时域坐标系下,得到时域坐标系下的第四直达声信号。然后,可以按照下述公式生成待处理声音信号中每一个声音信号的录音信号。其中,表示待处理声音信号中任意一个声音信号的录音信号,pl(t-t′)表示第三直达声信号中包括的与该声音信号对应的信号,pr(t-t′)表示第四直达声信号中包括的与该声音信号对应的信号。
按照上述方式,生成待处理声音信号中每一个声音信号的录音信号之后,便可以得到待处理声音信号的录音信号。待处理声音信号的录音信号包括待处理声音信号包括的所有声音信号的录音信号。
第二种方式中,可以按照下述公式生成待处理声音信号中每一个声音信号的录音信号。其中,/>表示待处理声音信号中任意一个声音信号的录音信号,Hl(k)表示左耳响应信息转换至频域坐标系后得到的左耳频域响应信息包括的与该声音信号对应的频点的响应信息,Hr(k)表示右耳响应信息转换至频域坐标系后得到的右耳频域响应信息包括的与该声音信号对应的频点的响应信息,Pl(k)表示第一直达声信号包括的与该声音信号对应的频点的信号,Pr(k)表示第二直达声信号包括的与该声音信号对应的频点的信号。
按照上述方式,生成待处理声音信号中每一个声音信号的录音信号之后,便可以得到待处理声音信号的录音信号。待处理声音信号的录音信号包括待处理声音信号包括的所有声音信号的录音信号。
第三种方式中,可以按照下述公式生成待处理声音信号中每一个声音信号的录音信号。其中,/>表示待处理声音信号中任意一个声音信号的录音信号,Pl(k)表示第一直达声信号包括的与该声音信号对应的频点的信号,Pr(k)表示第二直达声信号包括的与该声音信号对应的频点的信号,/>表示第一响应信息对应的方位角,/>等于第一耳间时间差,N表示待处理声音信号对应的频点的数量,Al表示左耳响应信息在该声音信号对应的频点下不同方位归一化的结果,即,其中,Na表示预设双耳房间脉冲响应信息对应的方位的数量,Ar表示右耳响应信息在该声音信号对应的频点下不同方位归一化的结果,即,
按照上述方式,生成待处理声音信号中每一个声音信号的录音信号之后,便可以得到待处理声音信号的录音信号。待处理声音信号的录音信号包括待处理声音信号包括的所有声音信号的录音信号。
第三种方式相比于第一种方式和第二种方式,能够在增强空间感的同时,降低对原始的待处理声音信号的修改力度,可以减小渲染生成的录音信号的失真,使得录音信号更加接近人耳的听感,用户体验更好。
可见,通过本申请实施例提供的录音信号的生成方法,电子设备可以对左耳拾音装置对待处理声音信号拾音后得到的第一音频信号和右耳拾音装置对相同的待处理声音信号拾音后得到的第二音频信号,分别进行直达声提取,得到第一直达声信号和第二直达声信号。然后,可以根据第一直达声信号和第二直达声信号确定发出声音信号的声源的方位信息。之后,可以根据该方位信息对第一直达声信号和第二直达声信号进行渲染,得到待处理声音信号的录音信号。通过该方法得到的录音信号,充分融合了声源的方位信息,可以很好地表达声音信号的空间信息,重放后,可以达到人耳听感的效果,用户体验更好。
本文中描述的各个方法实施例可以为独立的方案,也可以根据内在逻辑进行组合,这些方案都落入本申请的保护范围中。
可以理解的是,上述各个方法实施例中,由电子设备实现的方法和操作,也可以由可用于电子设备的部件(例如芯片、模块或者电路)实现。
上述实施例对本申请提供的录音信号的生成方法进行了介绍。可以理解的是,电子设备为了实现上述功能,其包含了执行每一个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对电子设备进行功能模块的划分,例如,可以对应每一个功能划分每一个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
以上,结合图1至图9详细说明了本申请实施例提供的录音信号的生成方法。以下,结合图10和图11详细说明本申请实施例提供的装置。应理解,装置实施例的描述与方法实施例的描述相互对应,因此,未详细描述的内容可以参见上文方法实施例,为了简洁,这里不再赘述。
参见图10,图10为本申请实施例提供的一种录音信号的生成装置的结构框图。该装置可以为电子设备的一部分,应用于电子设备中。也可以为电子设备,本申请对此不进行限制。如图10所示,该装置1000可以包括:第一获取模块1001、第二获取模块1002、确定模块1003和生成模块1004。该装置1000可以执行上述图4至图9所示任意一个方法实施例中电子设备执行的操作。
例如,在本申请一种可选的实施例中,所述第一获取模块1001,可以用于获取第一音频信号和第二音频信号,所述第一音频信号为左耳拾音装置对待处理声音信号进行拾音后得到的音频信号,所述第二音频信号为右耳拾音装置对所述待处理声音信号进行拾音后得到的音频信号。
所述第二获取模块1002,可以用于获取所述第一音频信号的第一直达声信号和所述第二音频信号的第二直达声信号。
所述确定模块1003,可以用于根据所述第一直达声信号和所述第二直达声信号,确定发出所述待处理声音信号的声源的第一方位信息。
所述生成模块1004,可以用于根据所述第一方位信息,对所述第一直达声信号和所述第二直达声信号进行渲染,生成所述待处理声音信号的录音信号。
一种可能的实现方式中,所述确定模块1003用于根据所述第一直达声信号和所述第二直达声信号,确定发出所述待处理声音信号的声源的第一方位信息,具体为:所述确定模块1003用于:根据所述第一直达声信号和所述第二直达声信号生成双耳差值信息,所述双耳差值信息包括第一耳间时间差和/或第一耳间强度差;根据所述双耳差值信息,确定所述第一方位信息。
一种可能的实现方式中,所述双耳差值信息为所述第一耳间时间差,所述确定模块1003用于根据所述双耳差值信息,确定所述第一方位信息,具体为:所述确定模块1003用于:获取所述第一耳间时间差对应的第一预设方位信息和第二预设方位信息;确定第二方位信息,所述第二方位信息指示的方位为所述第一预设方位信息和所述第二预设方位信息共同指示的方位;获取第三音频信号,所述第三音频信号为第一辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第一辅助拾音装置位于所述第二方位信息指示的方位且与所述左耳拾音装置和所述右耳拾音装置不在同一平面;获取第一能量和第二能量,所述第一能量为所述第一音频信号和所述第二音频信号中与所述第二方位信息对应的音频信号的能量,所述第二能量为所述第三音频信号的能量;根据所述第一能量、所述第二能量、所述第一预设方位信息和所述第二预设方位信息,确定所述第一方位信息。
一种可能的实现方式中,所述双耳差值信息为所述第一耳间强度差,所述确定模块1003用于根据所述双耳差值信息,确定所述第一方位信息,具体为:所述确定模块1003用于:获取所述第一耳间强度差对应的第三预设方位信息和第四预设方位信息;确定第三方位信息,所述第三方位信息指示的方位为所述第三预设方位信息和所述第四预设方位信息共同指示的方位;获取第四音频信号,所述第四音频信号为第二辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第二辅助拾音装置位于所述第三方位信息指示的方位且与所述左耳拾音装置和所述右耳拾音装置不在同一平面;获取第三能量和第四能量,所述第三能量为所述第一音频信号和所述第二音频信号中与所述第三方位信息对应的音频信号的能量,所述第四能量为所述第四音频信号的能量;根据所述第三能量、所述第四能量、所述第三预设方位信息和所述第四预设方位信息,确定所述第一方位信息。
一种可能的实现方式中,所述双耳差值信息为所述第一耳间时间差和所述第一耳间强度差,所述确定模块1003用于根据所述双耳差值信息,确定所述第一方位信息,具体为:所述确定模块1003用于:获取所述第一耳间时间差对应的第一预设方位信息和第二预设方位信息,以及所述第一耳间强度差对应的第三预设方位信息和第四预设方位信息;确定第二方位信息和第三方位信息,所述第二方位信息指示的方位为所述第一预设方位信息和所述第二预设方位信息共同指示的方位,所述第三方位信息指示的方位为所述第三预设方位信息和所述第四预设方位信息共同指示的方位;获取第三音频信号和第四音频信号,所述第三音频信号为第一辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第四音频信号为第二辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第一辅助拾音装置位于所述第二方位信息指示的方位,所述第二辅助拾音装置位于所述第三方位信息指示的方位,所述第一辅助拾音装置和所述第二辅助拾音装置均与所述左耳拾音装置和所述右耳拾音装置不在同一平面;获取第一能量、第二能量、第三能量和第四能量,所述第一能量为所述第一音频信号和所述第二音频信号中与所述第二方位信息对应的音频信号的能量,所述第二能量为所述第三音频信号的能量,所述第三能量为所述第一音频信号和所述第二音频信号中与所述第三方位信息对应的音频信号的能量,所述第四能量为所述第四音频信号的能量;根据所述第一能量、所述第二能量、所述第一预设方位信息和所述第二预设方位信息,确定第四方位信息;根据所述第三能量、所述第四能量、所述第三预设方位信息和所述第四预设方位信息,确定第五方位信息;根据所述第四方位信息和所述第五方位信息生成所述第一方位信息。
一种可能的实现方式中,所述生成模块1004用于根据所述第一方位信息,对所述第一直达声信号和所述第二直达声信号进行渲染,生成所述待处理声音信号的录音信号,具体为:所述生成模块1004用于:获取第一响应信息,所述第一响应信息为所述第一方位信息对应的预设双耳房间脉冲响应信息;根据所述第一响应信息,对所述第一直达声信号和所述第二直达声信号进行渲染,生成所述待处理声音信号的录音信号。
也就是说,该装置1000可以实现对应于图4至图9所示任意一个录音信号的生成方法实施例中电子设备所执行的步骤或者流程,该装置1000可以包括用于执行图4至图9所示任意一个录音信号的生成方法实施例中电子设备执行的方法的模块。应理解,各模块执行上述相应步骤的具体过程在上述游戏运行方法实施例中已经详细说明,为了简洁,在此不再赘述。
本申请实施例还提供了一种处理装置,该处理装置包括至少一个处理器和通信接口。所述通信接口用于为所述至少一个处理器提供信息输入和/或输出,所述至少一个处理器用于执行上述方法实施例中的方法。
应理解,上述处理装置可以是一个芯片。例如,参见图11,图11为本申请实施例提供的一种芯片的结构框图。图11所示的芯片可以为通用处理器,也可以为专用处理器。该芯片1100可以包括至少一个处理器1101。其中,所述至少一个处理器1101可以用于支持图10所示的装置执行图4至图9中任意一个实施例所示的技术方案。
可选的,该芯片1100还可以包括收发器1102,收发器1102用于接受处理器1101的控制,用于支持图10所示的装置执行图4至图9中任意一个实施例所示的技术方案。可选的,图11所示的芯片1100还可以包括存储介质1103。具体的,所述收发器1102可以替换为通信接口,所述通信接口为所述至少一个处理器1101提供信息输入和/或输出。
需要说明的是,图11所示的芯片1100可以使用下述电路或者器件来实现:一个或多个现场可编程门阵列(field programmable gate array,FPGA)、可编程逻辑器件(programmable logic device,PLD)、专用集成芯片(application specific integratedcircuit,ASIC)、系统芯片(system on chip,SoC)、中央处理器(central processor unit,CPU)、网络处理器(network processor,NP)、数字信号处理电路(digital signalprocessor,DSP)、微控制器(micro controller unit,MCU),控制器、状态机、门逻辑、分立硬件部件、任何其他适合的电路、或者能够执行本申请通篇所描述的各种功能的电路的任意组合。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
可以理解,本申请实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic RAM,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(directrambus RAM,DR RAM)。应注意,本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
根据本申请实施例提供的方法,本申请实施例还提供一种计算机程序产品,该计算机程序产品包括:计算机程序或指令,当该计算机程序或指令在计算机上运行时,使得该计算机执行图4至图9所示实施例中任意一个实施例的方法。
根据本申请实施例提供的方法,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序或指令,当该计算机程序或指令在计算机上运行时,使得该计算机执行图4至图9所示实施例中任意一个实施例的方法。
根据本申请实施例提供的方法,本申请实施例还提供了一种电子设备。该电子设备包括但不限于手机、平板电脑、个人电脑、工作站设备、大屏设备(例如:智慧屏、智能电视等)、掌上游戏机、家用游戏机、虚拟现实设备、增强现实设备、混合现实设备、车载智能终端等。该电子设备可以包括本申请上述实施例提供的录音信号的生成装置。该电子设备可以用于执行图4至图9所示实施例中任意一个实施例的方法。
根据本申请实施例提供的方法,本申请实施例还提供了一种录音信号的生成系统。该系统可以包括:用于对待处理声音信号进行拾音的左耳拾音装置和右耳拾音装置,以及上述电子设备;所述电子设备中设置有用于对所述待处理声音信号进行拾音的第一辅助拾音装置和第二辅助拾音装置;所述左耳拾音装置和所述右耳拾音装置与所述电子设备之间,通过无线方式或有线方式,通信连接。其中,左耳拾音装置、右耳拾音装置、第一辅助拾音装置、第二辅助拾音装置和该系统的具体功能可以参考前述方法实施例的内容,此处不再赘述。该系统可以用于执行图4至图9所示实施例中任意一个实施例的方法,并且获得相应的有益效果。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置模块和电子设备的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
上述本申请实施例提供的录音信号的生成装置、系统、处理装置、芯片、计算机存储介质、计算机程序产品、电子设备均用于执行上文所提供的方法,因此,其所能达到的有益效果可参考上文所提供的方法对应的有益效果,在此不再赘述。
应理解,在本申请的各个实施例中,各步骤的执行顺序应以其功能和内在逻辑确定,各步骤序号的大小并不意味着执行顺序的先后,不对实施例的实施过程构成限定。
本说明书的各个部分均采用递进的方式进行描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点介绍的都是与其他实施例不同之处。尤其,对于录音信号的生成装置、系统、芯片、计算机存储介质、计算机程序产品、电子设备的实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
以上所述的本申请实施方式并不构成对本申请保护范围的限定。
Claims (15)
1.一种录音信号的生成方法,其特征在于,所述方法包括:
获取第一音频信号和第二音频信号,所述第一音频信号为左耳拾音装置对待处理声音信号进行拾音后得到的音频信号,所述第二音频信号为右耳拾音装置对所述待处理声音信号进行拾音后得到的音频信号;
获取所述第一音频信号的第一直达声信号和所述第二音频信号的第二直达声信号;
根据所述第一直达声信号和所述第二直达声信号,确定发出所述待处理声音信号的声源的第一方位信息;
根据所述第一方位信息,对所述第一直达声信号和所述第二直达声信号进行渲染,生成所述待处理声音信号的录音信号。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一直达声信号和所述第二直达声信号,确定发出所述待处理声音信号的声源的第一方位信息,包括:
根据所述第一直达声信号和所述第二直达声信号生成双耳差值信息,所述双耳差值信息包括第一耳间时间差和/或第一耳间强度差;
根据所述双耳差值信息,确定所述第一方位信息。
3.根据权利要求2所述的方法,其特征在于,所述双耳差值信息为所述第一耳间时间差,所述根据所述双耳差值信息,确定所述第一方位信息,包括:
获取所述第一耳间时间差对应的第一预设方位信息和第二预设方位信息;
确定第二方位信息,所述第二方位信息指示的方位为所述第一预设方位信息和所述第二预设方位信息共同指示的方位;
获取第三音频信号,所述第三音频信号为第一辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第一辅助拾音装置位于所述第二方位信息指示的方位且与所述左耳拾音装置和所述右耳拾音装置不在同一平面;
获取第一能量和第二能量,所述第一能量为所述第一音频信号和所述第二音频信号中与所述第二方位信息对应的音频信号的能量,所述第二能量为所述第三音频信号的能量;
根据所述第一能量、所述第二能量、所述第一预设方位信息和所述第二预设方位信息,确定所述第一方位信息。
4.根据权利要求2所述的方法,其特征在于,所述双耳差值信息为所述第一耳间强度差,所述根据所述双耳差值信息,确定所述第一方位信息,包括:
获取所述第一耳间强度差对应的第三预设方位信息和第四预设方位信息;
确定第三方位信息,所述第三方位信息指示的方位为所述第三预设方位信息和所述第四预设方位信息共同指示的方位;
获取第四音频信号,所述第四音频信号为第二辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第二辅助拾音装置位于所述第三方位信息指示的方位且与所述左耳拾音装置和所述右耳拾音装置不在同一平面;
获取第三能量和第四能量,所述第三能量为所述第一音频信号和所述第二音频信号中与所述第三方位信息对应的音频信号的能量,所述第四能量为所述第四音频信号的能量;
根据所述第三能量、所述第四能量、所述第三预设方位信息和所述第四预设方位信息,确定所述第一方位信息。
5.根据权利要求2所述的方法,其特征在于,所述双耳差值信息为所述第一耳间时间差和所述第一耳间强度差,所述根据所述双耳差值信息,确定所述第一方位信息,包括:
获取所述第一耳间时间差对应的第一预设方位信息和第二预设方位信息,以及所述第一耳间强度差对应的第三预设方位信息和第四预设方位信息;
确定第二方位信息和第三方位信息,所述第二方位信息指示的方位为所述第一预设方位信息和所述第二预设方位信息共同指示的方位,所述第三方位信息指示的方位为所述第三预设方位信息和所述第四预设方位信息共同指示的方位;
获取第三音频信号和第四音频信号,所述第三音频信号为第一辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第四音频信号为第二辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第一辅助拾音装置位于所述第二方位信息指示的方位,所述第二辅助拾音装置位于所述第三方位信息指示的方位,所述第一辅助拾音装置和所述第二辅助拾音装置均与所述左耳拾音装置和所述右耳拾音装置不在同一平面;
获取第一能量、第二能量、第三能量和第四能量,所述第一能量为所述第一音频信号和所述第二音频信号中与所述第二方位信息对应的音频信号的能量,所述第二能量为所述第三音频信号的能量,所述第三能量为所述第一音频信号和所述第二音频信号中与所述第三方位信息对应的音频信号的能量,所述第四能量为所述第四音频信号的能量;
根据所述第一能量、所述第二能量、所述第一预设方位信息和所述第二预设方位信息,确定第四方位信息;
根据所述第三能量、所述第四能量、所述第三预设方位信息和所述第四预设方位信息,确定第五方位信息;
根据所述第四方位信息和所述第五方位信息生成所述第一方位信息。
6.根据权利要求1所述的方法,其特征在于,所述根据所述第一方位信息,对所述第一直达声信号和所述第二直达声信号进行渲染,生成所述待处理声音信号的录音信号,包括:
获取第一响应信息,所述第一响应信息为所述第一方位信息对应的预设双耳房间脉冲响应信息;
根据所述第一响应信息,对所述第一直达声信号和所述第二直达声信号进行渲染,生成所述待处理声音信号的录音信号。
7.一种录音信号的生成装置,其特征在于,所述装置包括:
第一获取模块,用于获取第一音频信号和第二音频信号,所述第一音频信号为左耳拾音装置对待处理声音信号进行拾音后得到的音频信号,所述第二音频信号为右耳拾音装置对所述待处理声音信号进行拾音后得到的音频信号;
第二获取模块,用于获取所述第一音频信号的第一直达声信号和所述第二音频信号的第二直达声信号;
确定模块,用于根据所述第一直达声信号和所述第二直达声信号,确定发出所述待处理声音信号的声源的第一方位信息;
生成模块,用于根据所述第一方位信息,对所述第一直达声信号和所述第二直达声信号进行渲染,生成所述待处理声音信号的录音信号。
8.根据权利要求7所述的装置,其特征在于,所述确定模块用于根据所述第一直达声信号和所述第二直达声信号,确定发出所述待处理声音信号的声源的第一方位信息,具体为:
所述确定模块用于:
根据所述第一直达声信号和所述第二直达声信号生成双耳差值信息,所述双耳差值信息包括第一耳间时间差和/或第一耳间强度差;
根据所述双耳差值信息,确定所述第一方位信息。
9.根据权利要求8所述的装置,其特征在于,所述双耳差值信息为所述第一耳间时间差,所述确定模块用于根据所述双耳差值信息,确定所述第一方位信息,具体为:
所述确定模块用于:
获取所述第一耳间时间差对应的第一预设方位信息和第二预设方位信息;
确定第二方位信息,所述第二方位信息指示的方位为所述第一预设方位信息和所述第二预设方位信息共同指示的方位;
获取第三音频信号,所述第三音频信号为第一辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第一辅助拾音装置位于所述第二方位信息指示的方位且与所述左耳拾音装置和所述右耳拾音装置不在同一平面;
获取第一能量和第二能量,所述第一能量为所述第一音频信号和所述第二音频信号中与所述第二方位信息对应的音频信号的能量,所述第二能量为所述第三音频信号的能量;
根据所述第一能量、所述第二能量、所述第一预设方位信息和所述第二预设方位信息,确定所述第一方位信息。
10.根据权利要求8所述的装置,其特征在于,所述双耳差值信息为所述第一耳间强度差,所述确定模块用于根据所述双耳差值信息,确定所述第一方位信息,具体为:
所述确定模块用于:
获取所述第一耳间强度差对应的第三预设方位信息和第四预设方位信息;
确定第三方位信息,所述第三方位信息指示的方位为所述第三预设方位信息和所述第四预设方位信息共同指示的方位;
获取第四音频信号,所述第四音频信号为第二辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第二辅助拾音装置位于所述第三方位信息指示的方位且与所述左耳拾音装置和所述右耳拾音装置不在同一平面;
获取第三能量和第四能量,所述第三能量为所述第一音频信号和所述第二音频信号中与所述第三方位信息对应的音频信号的能量,所述第四能量为所述第四音频信号的能量;
根据所述第三能量、所述第四能量、所述第三预设方位信息和所述第四预设方位信息,确定所述第一方位信息。
11.根据权利要求8所述的装置,其特征在于,所述双耳差值信息为所述第一耳间时间差和所述第一耳间强度差,所述确定模块用于根据所述双耳差值信息,确定所述第一方位信息,具体为:
所述确定模块用于:
获取所述第一耳间时间差对应的第一预设方位信息和第二预设方位信息,以及所述第一耳间强度差对应的第三预设方位信息和第四预设方位信息;
确定第二方位信息和第三方位信息,所述第二方位信息指示的方位为所述第一预设方位信息和所述第二预设方位信息共同指示的方位,所述第三方位信息指示的方位为所述第三预设方位信息和所述第四预设方位信息共同指示的方位;
获取第三音频信号和第四音频信号,所述第三音频信号为第一辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第四音频信号为第二辅助拾音装置对所述待处理声音信号进行拾音后得到的音频信号,所述第一辅助拾音装置位于所述第二方位信息指示的方位,所述第二辅助拾音装置位于所述第三方位信息指示的方位,所述第一辅助拾音装置和所述第二辅助拾音装置均与所述左耳拾音装置和所述右耳拾音装置不在同一平面;
获取第一能量、第二能量、第三能量和第四能量,所述第一能量为所述第一音频信号和所述第二音频信号中与所述第二方位信息对应的音频信号的能量,所述第二能量为所述第三音频信号的能量,所述第三能量为所述第一音频信号和所述第二音频信号中与所述第三方位信息对应的音频信号的能量,所述第四能量为所述第四音频信号的能量;
根据所述第一能量、所述第二能量、所述第一预设方位信息和所述第二预设方位信息,确定第四方位信息;
根据所述第三能量、所述第四能量、所述第三预设方位信息和所述第四预设方位信息,确定第五方位信息;
根据所述第四方位信息和所述第五方位信息生成所述第一方位信息。
12.根据权利要求7所述的装置,其特征在于,所述生成模块用于根据所述第一方位信息,对所述第一直达声信号和所述第二直达声信号进行渲染,生成所述待处理声音信号的录音信号,具体为:
所述生成模块用于:
获取第一响应信息,所述第一响应信息为所述第一方位信息对应的预设双耳房间脉冲响应信息;
根据所述第一响应信息,对所述第一直达声信号和所述第二直达声信号进行渲染,生成所述待处理声音信号的录音信号。
13.一种电子设备,其特征在于,所述电子设备包括:一个或者多个处理器和一个或者多个存储器;所述一个或者多个存储器存储有计算机程序或指令,当所述计算机程序或指令被所述一个或者多个处理器执行时,使得所述电子设备执行如权利要求1-6中任意一项所述的方法。
14.一种录音信号的生成系统,其特征在于,包括:用于对待处理声音信号进行拾音的左耳拾音装置和右耳拾音装置,以及权利要求13所述的电子设备;所述电子设备中设置有用于对所述待处理声音信号进行拾音的第一辅助拾音装置和第二辅助拾音装置;所述左耳拾音装置和所述右耳拾音装置与所述电子设备之间,通过无线方式或有线方式,通信连接。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序或指令,当所述计算机程序或指令被执行时,如权利要求1-6中任意一项所述的方法被执行。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211167230.8A CN117812523A (zh) | 2022-09-23 | 2022-09-23 | 一种录音信号的生成方法、装置、系统和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211167230.8A CN117812523A (zh) | 2022-09-23 | 2022-09-23 | 一种录音信号的生成方法、装置、系统和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117812523A true CN117812523A (zh) | 2024-04-02 |
Family
ID=90430634
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211167230.8A Pending CN117812523A (zh) | 2022-09-23 | 2022-09-23 | 一种录音信号的生成方法、装置、系统和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117812523A (zh) |
-
2022
- 2022-09-23 CN CN202211167230.8A patent/CN117812523A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111095723B (zh) | 无线充电方法及电子设备 | |
CN114650363B (zh) | 一种图像显示的方法及电子设备 | |
CN114079893B (zh) | 蓝牙通信方法、终端设备及计算机可读存储介质 | |
CN114422340B (zh) | 日志上报方法、电子设备及存储介质 | |
CN113973398B (zh) | 无线网络连接方法、电子设备及芯片系统 | |
CN114466107A (zh) | 音效控制方法、装置、电子设备及计算机可读存储介质 | |
CN114727220B (zh) | 一种设备搜寻方法以及电子设备 | |
CN114880251B (zh) | 存储单元的访问方法、访问装置和终端设备 | |
CN114610193A (zh) | 内容共享方法、电子设备及存储介质 | |
CN113126948B (zh) | 一种音频播放方法及相关设备 | |
WO2022257563A1 (zh) | 一种音量调节的方法,电子设备和系统 | |
CN115914461B (zh) | 位置关系识别方法和电子设备 | |
CN116048217B (zh) | 一种电子设备运行方法、装置和电子设备 | |
CN115641867B (zh) | 语音处理方法和终端设备 | |
CN114466238B (zh) | 帧解复用方法、电子设备及存储介质 | |
CN114338642B (zh) | 一种文件传输方法和电子设备 | |
CN113678481B (zh) | 无线音频系统、音频通讯方法及设备 | |
CN117812523A (zh) | 一种录音信号的生成方法、装置、系统和电子设备 | |
CN114489876A (zh) | 一种文本输入的方法、电子设备和系统 | |
CN116414500A (zh) | 电子设备操作引导信息录制方法、获取方法和终端设备 | |
CN116346982B (zh) | 处理音频的方法、电子设备及可读存储介质 | |
CN116320880B (zh) | 音频处理方法和装置 | |
CN116321265B (zh) | 网络质量评估方法、电子设备以及存储介质 | |
CN116708751B (zh) | 一种拍照时长的确定方法、装置和电子设备 | |
CN114205318B (zh) | 头像显示方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |