CN111800684A - 录音笔及应用于录音笔的声音处理方法 - Google Patents
录音笔及应用于录音笔的声音处理方法 Download PDFInfo
- Publication number
- CN111800684A CN111800684A CN202010792499.XA CN202010792499A CN111800684A CN 111800684 A CN111800684 A CN 111800684A CN 202010792499 A CN202010792499 A CN 202010792499A CN 111800684 A CN111800684 A CN 111800684A
- Authority
- CN
- China
- Prior art keywords
- recording pen
- main body
- body module
- arc
- microphone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 8
- 238000005516 engineering process Methods 0.000 claims abstract description 6
- 230000005236 sound signal Effects 0.000 claims description 54
- 238000012545 processing Methods 0.000 claims description 28
- 238000000034 method Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 13
- 230000007613 environmental effect Effects 0.000 claims description 11
- 241001422033 Thestylus Species 0.000 claims description 5
- 230000007704 transition Effects 0.000 claims description 4
- 239000000126 substance Substances 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 10
- 238000010030 laminating Methods 0.000 abstract description 5
- 238000013461 design Methods 0.000 abstract description 2
- 238000005070 sampling Methods 0.000 description 19
- 238000013518 transcription Methods 0.000 description 17
- 230000035897 transcription Effects 0.000 description 17
- 230000009467 reduction Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 229920003023 plastic Polymers 0.000 description 4
- 239000004033 plastic Substances 0.000 description 4
- 229910052710 silicon Inorganic materials 0.000 description 4
- 239000010703 silicon Substances 0.000 description 4
- 238000013519 translation Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 229910000838 Al alloy Inorganic materials 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 239000006112 glass ceramic composition Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C7/00—Arrangements for writing information into, or reading information out from, a digital store
- G11C7/16—Storage of analogue signals in digital stores using an arrangement comprising analogue/digital [A/D] converters, digital memories and digital/analogue [D/A] converters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/50—Constructional details
- H04N23/51—Housings
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
- H04R1/083—Special constructions of mouthpieces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
Abstract
本申请公开了一种录音笔及应用于录音笔的声音处理方法,录音笔包括主体模块、主板、全向麦克风阵列、定向麦克风及摄像头,主体模块的两个侧面设计成弧形结构,使得用户握持录音笔时与手掌贴合程度更高,不会硌手,更加便于用户的长时间握持使用。同时,本申请将全向麦克风阵列固定在主体模块呈弧形结构的侧面空间中,将定向麦克风和摄像头设置在主体模块顶部,使得机身内部元器件的布局更加合理,进而提升了录音笔的拾音效果。
Description
技术领域
本申请涉及电子产品技术领域,更具体的说,是涉及一种录音笔及应用于录音笔的声音处理方法。
背景技术
随着人工智能及语音识别技术的发展,越来越多的基于语音处理技术的电子产品得以普及,尤其是录音笔,在工作、生活场景中深受用户喜爱。
目前市面上的传统录音笔结构一般为长方体的平面设备,其内布设麦克风、主板等元器件。考虑到用户使用的方便,电子设备的体积一般不会过大,而受限于此,各元器件在电子设备内部的摆放空间很小,这就导致各个元器件的布局不合理,进而影响拾音效果。
同时,由于录音笔使用过程,可能需要用户长时间手持使用,如新闻采访等场景,需要用户长时间手持录音笔。现有的录音笔其长方体结构与手掌贴合度不高,使用手感不佳,尤其是在长时间手持时,容易硌手,使用十分不方便。
发明内容
鉴于上述问题,提出了本申请以便提供一种录音笔及应用于录音笔的声音处理方法,以解决传统录音笔受限于长方体结构,内部元器件布局不合理,导致拾音效果差,且长方体结构与手掌贴合度不高,使用手感不佳的问题。具体方案如下:
本申请第一方面,公开了一种录音笔,包括:
主体模块、主板、全向麦克风阵列、定向麦克风及摄像头;其中,
所述全向麦克风阵列及所述定向麦克风用于拾取环境声音信号,所述摄像头用于拍摄图像;
所述主板置于所述主体模块内部,且与所述全向麦克风阵列、所述定向麦克风及所述摄像头电性连接,所述主板用于对拾取的所述环境声音信号进行处理,以及对拍摄的图像进行处理;
所述全向麦克风阵列固定在所述主体模块呈弧形结构的侧面空间中,所述定向麦克风及所述摄像头固定在所述主体模块的顶部。
在一些实施例中,所述主体模块包括前后两个壳体,且前壳体与后壳体组成弧形结构的侧面空间。
在一些实施例中,所述前壳体为弧形,所述后壳体包括弧形翻边,所述弧形翻边与弧形的前壳体组成弧形结构的侧面空间。
在一些实施例中,所述后壳体顶端凸出,凸出部位与后壳体其余部位通过弧面过渡。
在一些实施例中,所述全向麦克风阵列包括第一全向麦克风组和第二全向麦克风组,所述第一全向麦克风组通过第一电路板与所述主板连接,所述第二全向麦克风组通过第二电路板与所述主板连接。
在一些实施例中,录音笔还包括:容纳于所述主体模块前后壳组成的弧形结构的侧面空间的麦克风支架,所述麦克风支架将全向麦克风阵列固定在侧面空间。
在一些实施例中,所述全向麦克风阵列包含的各全向麦克风对称设置于所述主体模块的两个侧面空间。
在一些实施例中,录音笔还包括:
围绕所述定向麦克风及所述摄像头设置的固定装置,所述固定装置与所述主体模块的顶部固定连接,所述固定装置为镂空结构,其镂空部分位于所述定向麦克风的拾音方向及摄像头的镜头处。
在一些实施例中,所述摄像头通过支架与所述固定装置固定连接。
在一些实施例中,所述固定装置两侧的侧壁为弧形结构。
在一些实施例中,所述定向麦克风设置于所述主体模块顶部的两侧,所述摄像头设置于所述主体模块顶部的中央位置。
在一些实施例中,录音笔还包括:设置于所述主体模块的前表面的触控屏。
在一些实施例中,所述主板包括音频编码器和处理器,所述音频编码器用于对所述全向麦克风阵列及所述定向麦克风拾取的环境声音信号进行数字编码,得到数字音频,所述处理器用于对所述数字音频进行处理,得到录音数据,以及,对拍摄的图像进行图像识别处理,得到图像对应的识别结果。
本申请第二方面,公开了一种应用于录音笔的声音处理方法,包括:
由置于录音笔主体模块呈弧形结构的侧面空间内的全向麦克风阵列,拾取第一环境声音信号;
由置于录音笔主体模块顶部的定向麦克风,拾取第二环境声音信号;
由内置于录音笔主体模块内部的主板,处理所述第一环境声音信号及所述第二环境声音信号,得到语音处理结果。
借由上述技术方案,本申请提供的录音笔由于主体模块的两个侧面设计成弧形结构,使得用户握持录音笔时与手掌贴合程度更高,不会硌手,更加便于用户的长时间握持使用。
同时,本申请将全向麦克风阵列固定在主体模块呈弧形结构的侧面空间中,将定向麦克风和摄像头设置在主体模块顶部,使得机身内部元器件的布局更加合理,进而提升了录音笔的拾音效果。
进一步,本申请的录音笔通过融合摄像头拍摄及麦克风拾音,可以更加全面的记录场景信息,在录音的同时能够进行拍照,并通过图像识别获取文本内容,与录音对应的转写文本进行融合编辑,更加便于用户后续的数据回顾。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本申请实施例提供的一种录音笔背视图;
图2为本申请实施例提供的一种录音笔斜视图;
图3为本申请实施例提供的一种录音笔正视图;
图4为本申请实施例提供的一种录音笔左视图;
图5为本申请实施例提供的一种录音笔右视图;
图6为本申请实施例提供的一种录音笔顶视图;
图7为本申请实施例提供的一种录音笔底视图;
图8为本申请实施例提供的录音笔的正面剖视图;
图9为本申请实施例提供的录音笔的侧面剖视图;
图10为本申请实施例提供的沿录音笔主体模块下部水平轴线的剖视图;
图11为本申请实施例提供的录音笔电路硬件原理图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1-10示出了本申请中录音笔的结构示意图。
在一些实施例中,结合图1-10所示,本申请的录音笔可以包括主体模块101、主板102、全向麦克风阵列103、定向麦克风104及摄像头105。
其中,全向麦克风阵列103可以包含多个全向麦克风。定向麦克风104可以是一个或多个。全向麦克风阵列103和定向麦克风104用于拾取环境声音信号。
其中定向麦克风和全向麦克风阵列拾取的环境声音信号可以包括场景声音、说话声音等,对于处于麦克风拾音环境内的声音均可以进行拾取。
对于全向麦克风阵列103,其可以用于录音场景的360度全方位拾音,可以采用动圈式麦克风、铝带式麦克风、硅麦等。以硅麦为例,其一致性良好,自适应距离可以达到3-5米,完全能够满足小型场景的录音需求。通过采用硅麦,可以利用其灵敏度高和相位一致的特性,便于提高声源定位、窄波束计算的精度。本申请中可以采用不同采样率不同精度如不低于16KHZ、24bit的采样率和采样精度进行拾音采样。
对于定向麦克风104,又称为超指向麦克风,其只能朝向单一方向进行拾音,对拾音方向的环境声音信号的敏感程度高于其它方向的环境声音信号的敏感程度。定向麦克风104可以采用电容式麦克风,如微机电麦克风、驻极体电容麦克风等。定向麦克风104可以适用于定向远距离高保真拾音场景,定向麦克风104的录音音质听感及录音保真度远高于硅麦。通过采用不同采样率不同精度进行拾音,可以实现远距离的高保真录音,能够还原更加真实、清晰的录音现场,示例如采用不低于96KHZ、24bit的采样率及采样精度拾音采集时,其拾音距离可以达到15米以上。
上述全向麦克风阵列103拾取的环境声音信号可以供环境声音信号的降噪使用。定向麦克风104可以用于定向模式拾音,其具备较好的方向性,其它方向如反向的环境声音信号会被物理过滤掉。通过定向麦克风和全向麦克风阵列的配合,可以达到较好的拾音效果。
摄像头105用于拍摄图像。在使用本申请的录音笔进行录音过程,可以同时对纸质稿件、显示屏中的图像等进行图像拍摄,拍摄的图像可以供主板进行图像识别、图像去噪等处理。
一种示例的场景如,在会议场景下,用户在使用录音笔进行录音的同时,可以对演讲稿中的内容进行拍摄,进而由主板识别拍摄的内容,转换为文本形式,与录音对应的转写文本一起保存。
主板102置于主体模块101内部,且与全向麦克风阵列103、定向麦克风104及摄像头105电性连接。主板102可以用于对拾取的所述环境声音信号进行处理,以及对摄像头105拍摄的图像进行处理。
示例性的,主板102可以结合声源定位、窄波束降噪和回声消除等声音处理算法,对全向麦克风阵列103、定向麦克风104拾取的环境声音信号进行相应处理,如对全向麦克风阵列103拾取的环境声音信号进行回声消除、降噪等处理,得到录音数据流,用于供后续的识别转写。对定向麦克风104拾取的环境声音信号进行回声消除处理,得到高保真录音,用于提升录音听感。
上述两部分录音在保证转写效率和准确率的同时,又保证了人耳的录音听感,还原最真实高保真现场声音。
进一步,主板102还可以对拍摄的图像进行图像识别,如通过OCR识别技术得到图像对应的文本内容,进而可以将文本内容与录音对应的转写文本融合在一起进行存储,如按照图像拍摄时间,将图像对应的识别文本内容插入对应时间的录音转写文本中。当然,主板还可以将拍摄的原始图像也一并存储。
通过融合摄像头拍摄及麦克风拾音,可以更加全面的记录场景信息,在录音的同时能够进行拍照,并通过图像识别获取文本内容,与录音对应的转写文本进行融合编辑,更加便于用户后续的数据回顾。
对于主体模块101,其可以设计成弧形结构的侧面空间,也即,将主体模块101的两个侧面设计成弧形结构。基于此结构,使得用户握持录音笔时与手掌贴合程度更高,不会硌手,更加便于用户的长时间握持使用。
同时,本申请可以进一步将全向麦克风阵列103固定在主体模块101呈弧形结构的侧面空间中,使得机身内部元器件的布局更加合理,进而提升了录音笔的拾音效果。
进一步,本申请还可以将定向麦克风104及摄像头105固定在主体模块101的顶部,充分利用顶部较大的空间容纳定向麦克风和摄像头,且主体模块101顶部天然的不会对定向麦克风拾音方向进行遮挡。
基于此,通过将定向麦克风104和摄像头105设置在主体模块101的顶部,避免设置在主体模块101的其它位置,对主体模块101内部空间的占用,同时也不会与其它元器件如主板等形成器件干扰,使得录音笔整体元器件的布局更加合理,进而提升了录音笔的拾音效果。同时,通过在主体模块101的顶部同时设置定向麦克风104和摄像头105,相比于单独设置其中一个,其更加能够增强顶部的结构强度。
在本申请的一些实施例中,主体模块101可以由前后两个壳体组成,分别为前壳体1011和后壳体1012。
前壳体1011和后壳体1012可以组成弧形结构的侧面空间。
进一步的,结合图10所示,后壳体1012可以包括弧形翻边,且前壳体1011为弧形,则后壳体1012的弧形翻边与弧形的前壳体1011组成弧形结构的侧面空间。示例性的,可以设置前壳体1011的两侧边为弧形,其它部位为平面,两侧边和其它部位的连接通过圆弧过渡;当然也可以设置前壳体1011的整体都为弧形,具体前壳体的弧形部位,本申请不做限制。
通过将后壳体1012设置为包括翻边结构,使得后壳体1012两侧向上圆弧过渡,进一步提高了与用户手掌的贴合度。并且,基于此形成的弧形结构的侧面空间,其弧度更大,更利于内部元器件的放置。
主体模块101的后壳体1012可以采用塑胶PC材质、玻璃陶瓷材质等多种材质,以塑胶PC材质为例,其可以采用注塑加喷漆工艺,使得主体模块101更加轻薄有质感。由于主体模块两个侧边为弧形结构,因此可以采用曲面一体注塑技术,使得主体模块101后壳体整体性更高,握持手感更佳。
对于前壳体1011,其可以采用铝合金材质、塑料材质等多种不同材质,具体可以根据实际需要而选择。
对于主体模块101的后壳体1012,其可以设计成平面结构。除此之外,主体模块101的后壳体1012还可以设计成顶端凸出,凸出部位与后壳体1012其余部位通过弧面过渡,如图4、图5所示。通过这种设计结构,使得录音笔整体更加轻薄,更利于用户操控使用。并且保证了主体模块顶部拥有足够空间来布设定向麦克风和摄像头。
在本申请的一些实施例中,关于全向麦克风阵列103,其可以划分为两个全向麦克风组,分别为第一全向麦克风组1031和第二全向麦克风组1032,其中第一全向麦克风组1031和第二全向麦克风组1032各自可以包含若干全向麦克风,并且第一全向麦克风组1031和第二全向麦克风组1032各自包含的全向麦克风的数量可以相同或不同。
第一全向麦克风组1031可以通过第一电路板106与主板102连接,第二全向麦克风组1032可以通过第二电路板107与主板102连接。其中,第一电路板106和第二电路板107可以为同一个电路板,也可以为不同的电路板。
第一全向麦克风组1031和第二全向麦克风组1032可以分别固定在主体模块101的两个侧面空间,如图8所示。通过将全向麦克风阵列103划分为两组,并分别固定在主体模块101的两个侧面空间,可以充分利用侧面空间,不影响全向麦克风的性能,并且能够大大缩小机身两侧的屏占比。
一种示例性的情况,全向麦克风阵列103包含的各全向麦克风可以对称设置于主体模块101的两个侧面空间,以此能够保证全向麦克风阵列拾音的全向性。当然,除此之外,全向麦克风阵列103包含的各全向麦克风还可以设置于主体模块101的一侧空间内,图8仅仅示例了一种可选的分布方式。
如图10所示,在主体模块101的前壳体1011上,与每一全向麦克风对应位置处可以开设拾音孔,以保证全向麦克风的拾音效果。
如图3所示,一种示例性的情况下,全向麦克风阵列包含的全向麦克风的个数可以为6个,则第一全向麦克风组1031和第二全向麦克风组1032各自可以分别包含3个全向麦克风,第一全向麦克风组1031和第二全向麦克风组1032可以对称设置于主体模块101的两侧。
如图10所示,本申请的录音笔还可以包括容纳于主体模块101前后壳组成的弧形结构的侧面空间的麦克风支架108。该麦克风支架108将全向麦克风阵列103固定在侧面空间中。
其中,麦克风支架108的个数可以与全向麦克风阵列中包含的全向麦克风的个数相同,也即为每一全向麦克风均设置一个麦克风支架108,当然,麦克风支架108的个数和全向麦克风的个数也可以不一样,具体的数量,本申请不做限制。
在本申请的一些实施例中,结合图1所示,可以围绕定向麦克风104及摄像头105设置固定装置109。固定装置109与主体模块101的顶部固定连接,具体连接方式本申请不做限定
为了保证定向麦克风的拾音,以及摄像头的拍摄,固定装置109可以设计为镂空结构,其镂空部分位于定向麦克风104的拾音方向及摄像头105的镜头处。
进一步,固定装置两侧的侧壁可以设计为弧形结构,该弧形结构的大小可以根据设置于主体模块顶部两侧的定向麦克风或摄像头的位置而定,同时,弧形结构的侧壁能够与定向麦克风或摄像头保持更大的间距。
若主体模块两侧设置的为定向麦克风,则可以进一步在弧形结构的侧壁上做镂空处理,相比于平面结构,该弧形结构的侧壁可以进一步扩大镂空面积,保证定向麦克风更好的拾音效果。
通过设置固定装置109,可以提升主体模块101顶部的结构强度,能够对定向麦克风及摄像头形成保护作用。
在一些实施例中,为了进一步提升摄像头的稳定性,可以在摄像头与固定装置109之间增加设置支架,也即摄像头105通过支架与固定装置109固定连接,所述支架的具体结构以及其和固定装置109的连接方式,本申请不做限定。
可以理解的是,定向麦克风104的个数可以是一个或多个,则定向麦克风104在主体模块101顶部的设置位置可以有多处。以定向麦克风104为两个为例进行说明,该两个定向麦克风可以分别设置在主体模块104顶部的两侧,或者是同时设置在顶部一侧。
在此基础上,对于摄像头105,其可以设置在主体模块101顶部任意位置,保证不与定向麦克风104冲突即可,示例如图6,可以将摄像头105设置于顶部中央位置。
在本申请的一些实施例中,录音笔还可以进一步包括触控屏110。触控屏110可以设置在主体模块101的前表面。
结合图2所示,本申请的录音笔还可以包括触控屏110。触控屏110可以采用LCD屏幕或电子水墨屏等其它材质的屏幕。屏幕尺寸可以不做限制,示例如采用122mm*65mm*10.9mm尺寸的屏幕。触控屏110的分辨率可以采用360*640或更高的分辨率,以满足页面内容显示。同时,还可以作为交互的操控界面、设备状态的显示界面。其中,录音控制、场景选择、转写文字显示、翻译、设置、字幕实时显示等,都可以通过触控屏110实现,相比于单纯的物理按键,操作更加快捷。
在本申请的一些实施例中,主板102可以包括音频编码器111和处理器112。
其中,音频编码器111可以用于对全向麦克风阵列103及定向麦克风104拾取的环境声音信号进行数字编码,得到数字音频,将数字音频传输至处理器112。处理器112可以用于对所述数字音频进行处理,得到录音数据,以及,对摄像头105拍摄的图像进行图像识别处理,得到图像对应的识别结果。
进一步的,音频编码器111还可以用于将喇叭播放的模拟音频进行数字编码,转换为数字信号作为回声消除参考信号,发送至处理器112。
音频编码器111与处理器112之间可以通过I2S/TDM、I2C等数字接口进行数据的传输。
为了保证音频数据的同步性和及时性,对于每一路模拟音频均可以设置独立的音频编码器,以实现数模转换。当然也可以共用同一个音频编码器,音频编码器的具体数量,本申请不做限定。
处理器112用于接收全向麦克风阵列和定向麦克风的环境声音信号做语音降噪、语音增强等语音算法运算、数据调度传输、外设协同逻辑控制及系统应用的交互管理。处理器112含有足够运算力,也可提供本地语音识别及转写服务,实现离线转写内容实时显示。处理器112可以支持蓝牙、Wi-Fi无线传输,满足GPS定位功能。对于定向麦克风采集的录音数据、全向麦克风阵列采集的多路环境声音信号、对全向麦克风阵列采集的环境声音信号进行降噪处理后的用于识别转写的声音数据,可以通过Wi-Fi无线传输的形式,实时或定时传输到云端和无线设备上,用于云端识别、转写、回听、检索、分析和存档,即能够通过在线、离线两种方式对环境声音信号进行处理,显然,两种方式可以同时处理,也可以根据需要进行处理,具体的处理方式,本申请不做限定。
可选地,可以在云端为每一用户设置单独的账户,来管理自己的录音数据相关的数据,如进行播放、删除、回听、检索、分析等操作,从而即使用户未随身携带录音笔或者录音笔丢失,也不妨碍用户对已在云端存储的录音数据相关的数据的使用,给用户带来了极大方便。
处理器112具备本地语音转写成文本的能力,可以在不联网的情况下,在本地对录音进行转写、翻译等工作。
处理器112含有足够运算力,可以提供本地语音识别及转写服务。该处理器112可以将全向麦克风阵列采集的多路环境声音信号、对定向麦克风采集的环境声音信号及降噪处理后的识别转写环境声音数据流和听感环境声音数据流全部无缝实时送给云端。同时,处理器112还可以启动本地算法引擎,将语音识别转写成文字,包括识别、转写、翻译、导出等,实现在设备离线的情况下实时得到转写结果等。
在本申请的一些实施例中,结合图10示例的录音笔硬件布局示意图,对录音笔的各组件布局方式进行介绍。
图10示例的是沿录音笔主体模块下部水平轴线的剖视图。由图10可知:
全向麦克风阵列中多个全向麦克风可以分布在主体模块101的两个弧形侧边空间内。各全向麦克风可以通过柔性电路板FPC与主板连接。在主体模块101前壳体1011上,对应于全向麦克风位置处开设有拾音孔。
为了固定全向麦克风,在弧形侧边空间内还可以设置全向麦克风支架108,用于将全向麦克风固定在侧边空间内。
在主体模块101的前表面,设置有触控屏110。在触控屏110与主体模块101的背面之间设置有电池113。
主体模块101由前壳1011和后壳1012配合连接,并在两侧形成弧形结构的侧面空间。
由于录音笔主体模块101两侧形成有弧形结构的侧面空间,因此可以将全向麦克风、全向麦克风支架置于弧形结构内部,同时,还可以将主板延伸至两侧的弧形结构内部,充分利用弧形结构空间进行元器件的摆放,使得元器件布局更加合理。
在本申请的一些实施例中,结合图11示例的录音笔电路硬件原理图,对录音笔的数据处理过程进行介绍。
录音笔包括如下硬件结构:处理器112、音频编码器111、定向麦克风104、全向麦克风阵列103、摄像头105、触控屏110、实体操控按键114、存储模块115、数据接口116、电源管理模块117、充电管理模块118、电池113。
如图11所示,上述定向麦克风104通过音频编码器111与处理器112电性连接,全向麦克风阵列103通过音频编码器111与处理器112电性连接。此外,处理器112还与摄像头105、触控屏110、实体操控按键114、存储模块115、数据接口116、电源管理模块117及充电管理模块118电性连接,电源管理模块117还连接有电池113,用于为录音笔中各元器件进行供电。
其中,音频编码器111可以将定向麦克风和全向麦克风阵列采集的模拟音频转换为数字音频,同步将喇叭播放的模拟音频转换为数字音频作为回声消除参考信号,通过I2S/TDM、I2C等数字接口将所有的数字音频数据传输至处理器112进行相关运算。
为了保证音频数据的同步性和及时性,对于每一路模拟音频均可以设置独立的音频编码器,以实现数模转换。
摄像头105可以通过MIPI接口与处理器112连接。
处理器除了具备前文介绍的功能之外,其还可以用于接收摄像头105发送的图像,利用内部的ISP来提升图像的效果,同时,配合图像识别算法对图像内容进行识别,得到识别文本内容。该识别文本内容可以与录音对应的转写文本融合在一起进行存储,也可以通过LET、Wi-Fi无线传输的形式,实时或定时传输到云端和无线设备上,用于云端分析和存档。
处理器112可以采用加密处理器,即对处理的文件进行自动加密,只有授权的应用或终端才能够打开文件,从而保证了录音文件的数据安全。
进一步的,处理器112还可以支持智能文件管理系统,能够对文件添加多维度的标签,如时间、地点、场景、名称等、进而通过搜索任意的标签,可以得到与标签对应的文件内容。同时,还可以通过语音或文字搜索方式进行搜索。
存储模块115可以用于存储系统代码、录音数据、转写数据、个人设置信息等,可以通过数据接口或无线模块,将音频数据导出或上传到云空间中。其中,通过无线模块可以开启网络,可以实时转写,上传。录音分享,使得录音笔在录音的同时,可以将内容同步上传到云空间,进行转写保存。其他终端可以同步听到或者看到录音内容和文字内容,实现了实时同步,实时分享的效率。
电源管理模块117、电池113及充电管理模块118构成了录音笔的供电管理部分,其中可以加入5V/2A充电协议,对电池进行标准模式充电,既提升了充电效率,又能够保证安全。
对于开关机按键504和音量调整按键505,可以设置于主体模块的左右侧面上。
对于实体操控按键114,其可以包括开关机按键1141、音量调整按键1142及录音按键1143。开关机按键1141、音量调整按键1142及录音按键1143可以设置在主体模块101的同一侧面或不同侧面上,其设置位置可以是侧面的上部、中部、下部,图1-5仅仅示例了一种可选的设置方式,除此之外还可以根据实际需要而选择其它排布位置及方式。
数据接口116可以是Type-C接口、Micro USB接口等多种类型的数据接口,用于与外部设备进行数据传输,以及提供充电功能。数据接口116可以设置在主体模块101底部或其它位置,如图7所示,可以将数据接口116设置在主体模块101底部中央位置,同时,在数据接口116两侧可以设置喇叭,用于播放声音。
为了布设数据接口116及天线等,本申请的录音笔还可以包括小板119。小板119用于放置数据接口116、天线等器件。
录音笔还可以具备SIM托,可以插入4G、5G卡,开启网络,进行数据的上传及下载。
在本申请的一些实施例中,进一步公开了一种应用于录音笔的声音处理方法,结合下述步骤对声音处理方法进行介绍:
S1、由置于录音笔主体模块呈弧形结构的侧面空间内的全向麦克风阵列,拾取第一环境声音信号。
S2、由置于录音笔主体模块顶部的定向麦克风,拾取第二环境声音信号。
S3、由内置于录音笔主体模块内部的主板,处理所述第一环境声音信号及所述第二环境声音信号,得到语音处理结果。
其中,主板可以包括音频编码器和处理器,则上述S3,由主板处理所述第一环境声音信号及所述第二环境声音信号的过程,可以包括:
S31、由音频编码器将所述第一环境声音信号和所述第二环境声音信号转换为第一数字音频信号。
S32、由音频编码器将喇叭播放的模拟音频信号转换为第二数字音频信号。
S33、由处理器以所述第二数字音频信号作为回声消除参考信号,对所述第一数字音频信号进行回声消除处理。
在上述示例的基础上,主板处理所述第一环境声音信号及所述第二环境声音信号的过程,进一步还可以包括:
S33、由处理器利用回声消除后的第一数字音频信号,使用窄波束降噪算法进行降噪处理。
在上述示例的基础上,主板处理所述第一环境声音信号及所述第二环境声音信号的过程,进一步还可以包括:
S34、由处理器利用回声消除后的第一数字音频信号,使用声源定位算法进行声源定位。
进一步的,上述S1,由全向麦克风阵列拾取第一环境声音信号的过程,可以包括:
S11、由全向麦克风阵列中各全向麦克风采用第一设定采样频率及第一设定采样精度,拾取第一环境声音信号。
其中,第一设定采样频率可以是不低于16KHZ的采样频率,第一设定采样精度可以是不低于24bit的采样精度。
上述S2,由定向麦克风拾取第二环境声音信号的过程,可以包括:
S21、由定向麦克风采用第二设定采样频率及第二设定采样精度,拾取第二环境声音信号。
其中,第二设定采样频率可以是不低于96KHZ的采样频率,第二设定采样精度可以是不低于24bit的采样精度。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间可以根据需要进行组合,且相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (14)
1.一种录音笔,其特征在于,包括:
主体模块、主板、全向麦克风阵列、定向麦克风及摄像头;其中,
所述全向麦克风阵列及所述定向麦克风用于拾取环境声音信号,所述摄像头用于拍摄图像;
所述主板置于所述主体模块内部,且与所述全向麦克风阵列、所述定向麦克风及所述摄像头电性连接,所述主板用于对拾取的所述环境声音信号进行处理,以及对拍摄的图像进行处理;
所述全向麦克风阵列固定在所述主体模块呈弧形结构的侧面空间中,所述定向麦克风及所述摄像头固定在所述主体模块的顶部。
2.根据权利要求1所述的录音笔,其特征在于,所述主体模块包括前后两个壳体,且前壳体与后壳体组成弧形结构的侧面空间。
3.根据权利要求2所述的录音笔,其特征在于,所述前壳体为弧形,所述后壳体包括弧形翻边,所述弧形翻边与弧形的前壳体组成弧形结构的侧面空间。
4.根据权利要求2所述的录音笔,其特征在于,所述后壳体顶端凸出,凸出部位与后壳体其余部位通过弧面过渡。
5.根据权利要求1所述的录音笔,其特征在于,所述全向麦克风阵列包括第一全向麦克风组和第二全向麦克风组,所述第一全向麦克风组通过第一电路板与所述主板连接,所述第二全向麦克风组通过第二电路板与所述主板连接。
6.根据权利要求1所述的录音笔,其特征在于,还包括:容纳于所述主体模块前后壳体组成的弧形结构的侧面空间的麦克风支架,所述麦克风支架将全向麦克风阵列固定在侧面空间。
7.根据权利要求1所述的录音笔,其特征在于,所述全向麦克风阵列包含的各全向麦克风对称设置于所述主体模块的两个侧面空间。
8.根据权利要求1所述的录音笔,其特征在于,还包括:
围绕所述定向麦克风及所述摄像头设置的固定装置,所述固定装置与所述主体模块的顶部固定连接,所述固定装置为镂空结构,其镂空部分位于所述定向麦克风的拾音方向及摄像头的镜头处。
9.根据权利要求8所述的录音笔,其特征在于,所述摄像头通过支架与所述固定装置固定连接。
10.根据权利要求8所述的录音笔,其特征在于,所述固定装置两侧的侧壁为弧形结构。
11.根据权利要求1所述的录音笔,其特征在于,所述定向麦克风设置于所述主体模块顶部的两侧,所述摄像头设置于所述主体模块顶部的中央位置。
12.根据权利要求1所述的录音笔,其特征在于,还包括:设置于所述主体模块的前表面的触控屏。
13.根据权利要求1所述的录音笔,其特征在于,所述主板包括音频编码器和处理器,所述音频编码器用于对所述全向麦克风阵列及所述定向麦克风拾取的环境声音信号进行数字编码,得到数字音频,所述处理器用于对所述数字音频进行处理,得到录音数据,以及,对拍摄的图像进行图像识别处理,得到图像对应的识别结果。
14.一种应用于录音笔的声音处理方法,其特征在于,包括:
由置于录音笔主体模块呈弧形结构的侧面空间内的全向麦克风阵列,拾取第一环境声音信号;
由置于录音笔主体模块顶部的定向麦克风,拾取第二环境声音信号;
由内置于录音笔主体模块内部的主板,处理所述第一环境声音信号及所述第二环境声音信号,得到语音处理结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010792499.XA CN111800684A (zh) | 2020-08-09 | 2020-08-09 | 录音笔及应用于录音笔的声音处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010792499.XA CN111800684A (zh) | 2020-08-09 | 2020-08-09 | 录音笔及应用于录音笔的声音处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111800684A true CN111800684A (zh) | 2020-10-20 |
Family
ID=72833717
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010792499.XA Pending CN111800684A (zh) | 2020-08-09 | 2020-08-09 | 录音笔及应用于录音笔的声音处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111800684A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020030744A1 (en) * | 2000-04-07 | 2002-03-14 | Youichi Sawachi | Portable multi-function apparatus and controller |
CN201989479U (zh) * | 2011-04-29 | 2011-09-28 | 深圳市京华信息技术有限公司 | 一种录音笔 |
CN204991146U (zh) * | 2015-06-17 | 2016-01-20 | 傅映霞 | 一种带有摄像和一键发送功能的录音笔 |
CN106303187A (zh) * | 2015-05-11 | 2017-01-04 | 小米科技有限责任公司 | 语音信息的采集方法、装置及终端 |
CN206946186U (zh) * | 2017-05-03 | 2018-01-30 | 歌尔科技有限公司 | 一种多功能便携式设备 |
CN109036482A (zh) * | 2018-06-22 | 2018-12-18 | 厦门盈趣科技股份有限公司 | 一种集ocr与语音识别的智能录音笔 |
CN110211612A (zh) * | 2019-05-09 | 2019-09-06 | 天津讯飞极智科技有限公司 | 一种录音笔以及录音方法 |
CN210075514U (zh) * | 2019-08-16 | 2020-02-14 | 天津讯飞极智科技有限公司 | 一种录音设备 |
CN210119979U (zh) * | 2019-08-23 | 2020-02-28 | 宁波探客信息科技有限公司 | 一种双麦克风语音记录装置 |
-
2020
- 2020-08-09 CN CN202010792499.XA patent/CN111800684A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020030744A1 (en) * | 2000-04-07 | 2002-03-14 | Youichi Sawachi | Portable multi-function apparatus and controller |
CN201989479U (zh) * | 2011-04-29 | 2011-09-28 | 深圳市京华信息技术有限公司 | 一种录音笔 |
CN106303187A (zh) * | 2015-05-11 | 2017-01-04 | 小米科技有限责任公司 | 语音信息的采集方法、装置及终端 |
CN204991146U (zh) * | 2015-06-17 | 2016-01-20 | 傅映霞 | 一种带有摄像和一键发送功能的录音笔 |
CN206946186U (zh) * | 2017-05-03 | 2018-01-30 | 歌尔科技有限公司 | 一种多功能便携式设备 |
CN109036482A (zh) * | 2018-06-22 | 2018-12-18 | 厦门盈趣科技股份有限公司 | 一种集ocr与语音识别的智能录音笔 |
CN110211612A (zh) * | 2019-05-09 | 2019-09-06 | 天津讯飞极智科技有限公司 | 一种录音笔以及录音方法 |
CN210075514U (zh) * | 2019-08-16 | 2020-02-14 | 天津讯飞极智科技有限公司 | 一种录音设备 |
CN210119979U (zh) * | 2019-08-23 | 2020-02-28 | 宁波探客信息科技有限公司 | 一种双麦克风语音记录装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021078116A1 (zh) | 视频处理方法及电子设备 | |
WO2019218369A1 (zh) | 一种便携式智能语音交互控制设备、方法及系统 | |
WO2020010579A1 (zh) | 一种带具有语音交互功能耳机的智能手表 | |
CN210075514U (zh) | 一种录音设备 | |
US20070230735A1 (en) | Selective type headset | |
CN107506353B (zh) | 翻译盒子和翻译系统 | |
US20150326973A1 (en) | Portable Binaural Recording & Playback Accessory for a Multimedia Device | |
CN107845386B (zh) | 声音信号处理方法、移动终端和服务器 | |
CN108712704B (zh) | 音箱、音频数据的播放方法、装置、存储介质及电子装置 | |
CN108960158A (zh) | 一种智能手语翻译的系统和方法 | |
CN111935593B (zh) | 录音笔及录音控制方法 | |
CN105895134A (zh) | 具有远程录音和云端转写控制的记录装置及其实现方法 | |
CN213339682U (zh) | 录音笔 | |
CN112599144B (zh) | 音频数据处理方法、音频数据处理装置、介质与电子设备 | |
CN213025407U (zh) | 录音笔 | |
CN207099091U (zh) | 一种智能会议系统 | |
WO2016140380A1 (ko) | 셀피 스틱을 이용한 고음질 녹화영상 생성 장치 및 방법 | |
CN214429694U (zh) | 录音笔及电子设备 | |
CN214429693U (zh) | 录音笔及电子设备 | |
CN209641352U (zh) | 一种录音笔 | |
CN111800684A (zh) | 录音笔及应用于录音笔的声音处理方法 | |
CN213342605U (zh) | 录音笔 | |
CN110211612A (zh) | 一种录音笔以及录音方法 | |
CN110225184A (zh) | 一种智能家居用多功能音耳机 | |
CN104378845A (zh) | 多功能智能通信系统(固定和可移动网络视听、通信、办公设备及终端) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201020 |