CN109637555A - 一种商务会议用日语语音识别翻译系统 - Google Patents
一种商务会议用日语语音识别翻译系统 Download PDFInfo
- Publication number
- CN109637555A CN109637555A CN201910117668.7A CN201910117668A CN109637555A CN 109637555 A CN109637555 A CN 109637555A CN 201910117668 A CN201910117668 A CN 201910117668A CN 109637555 A CN109637555 A CN 109637555A
- Authority
- CN
- China
- Prior art keywords
- voice
- sound
- microphone
- microphone array
- initialization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013519 translation Methods 0.000 title claims abstract description 28
- 238000001228 spectrum Methods 0.000 claims abstract description 8
- 238000001914 filtration Methods 0.000 claims abstract description 7
- 239000012528 membrane Substances 0.000 claims description 19
- 238000000034 method Methods 0.000 claims description 12
- 239000000758 substrate Substances 0.000 claims description 9
- 230000004888 barrier function Effects 0.000 claims description 8
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000003786 synthesis reaction Methods 0.000 claims description 4
- 230000005428 wave function Effects 0.000 claims description 4
- 239000005030 aluminium foil Substances 0.000 claims description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 238000007747 plating Methods 0.000 claims description 3
- 230000005611 electricity Effects 0.000 claims 1
- 239000012535 impurity Substances 0.000 abstract description 2
- 238000004088 simulation Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Circuit For Audible Band Transducer (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种商务会议用日语语音识别翻译系统,包括固定于中心塔外表面的麦克风阵列,麦克风阵列电性连接至处理器输入接口,处理器输出接口电性连接至扬声器,麦克风阵列中单个的麦克风包括单向筒,收集语音录音,判断发言人位置,将对应方向的麦克风采集声音作为原声,原声中高于日语频谱的声音过滤,将原声根据发声的间隔切割为语段,语段输入语音‑语义对比库进行对比,匹配出原声对应的翻译后语义,将翻译后语义通过扬声器播放;本发明实施中,降低采集到语音信息的杂音,提高翻译的成功率;将采集到的语音模拟电流信息除杂后叠加增益,并根据日语的特点进一步过滤杂声,转化为语义信息后进行翻译。
Description
技术领域
本发明涉及会务翻译领域,具体涉及一种商务会议用日语语音识别翻译系统。
背景技术
随着科技的进步,国际交流的日益繁杂和信息量急剧增加,不同语言之间的障碍所导致的信息问题越来越影响沟通的效率。中日语商务会议中,需要人工翻译对与会人员的发言进行实时翻译,不仅人力成本高昂,而且人工翻译过程中经常出现因为思考而导致的中断。
现有技术中采用机器翻译方式对会议中的发言进行实时翻译,但是由于会议室中的复杂声源状况,直接使用麦克风进行采集,采集到的声音夹杂大量无关语音,会导致后期的语音识别和翻译出现错误。尤其是针对日语的识别和实时翻译,由于日语中每个发音短促,未经除杂降噪处理的声音信息直接处理更容易导致识别错误。
在公开号为CN100440150C的专利中公开了一种将源语言输入机器翻译成使用目标语言的翻译输出的一种方法,其特征在于,包括:将源语言输入的片段与例库中的例子的源语言片段进行匹配;将源语言输入中所有匹配的块识别为源语言输入中的一组项,这组项由例子中的一个或多个源语言片段匹配;选择匹配的块的块组合,以包含源语言输入的一个或多个片段;关于所选择的块组合中的每个块,识别与该块有关的例子;将所识别的例子的目标语言部分与所识别的例子的源语言部分进行对准,所识别的例子的源语言部分与源语言输入的一个或多个片段相匹配;访问项库以获得源语言输入中未被所识别的例子覆盖的项的译文;以及,根据被调准的部分来提供翻译输出,以作为所识别的例子的目标语言部分。但是上述专利中,将采集到的声音直接进行识别翻译,依旧存在识别不准确的问题。
发明内容
本发明的目的在于克服现有技术中存在的上述问题,提供一种商务会议用日语语音识别翻译系统,降低采集到语音信息的杂音,提高翻译的成功率。
为实现上述技术目的,达到上述技术效果,本发明是通过以下技术方案实现:
一种商务会议用日语语音识别翻译装置,包括固定于中心塔外表面的麦克风阵列,麦克风阵列电性连接至处理器输入接口,处理器输出接口电性连接至扬声器;
所述麦克风阵列中单个的麦克风包括单向筒,单向筒底部设置有震动膜,震动膜相对设置有基板,震动膜和基板电性连接至放大电路,放大电路经过数字采样电路后电性连接至处理器;
球形中心塔表面均匀分布的麦克风阵列采集会议中的语音,由于声波为纵波,与单向筒方向相同的声波才会直接进入单向筒内,引起震动膜的震动,震动膜与基板之间的相对距离改变,产生的电信号经过放大电路产生声波模拟电流信号,经过数字采样电路后变为声波数字信号,进入处理器进行接下来的处理。
进一步地,所述中心塔为球形,麦克风阵列均匀分布于中心塔表面。
进一步地,所述单向筒内设置有一个以上板状或筒状导向机构。
进一步地,所述震动膜为铝箔,与放大电路连接处镀设有金箔。
一种商务会议用日语语音识别翻译方法,包括以下步骤:
步骤S1:收集语音录音;
步骤S2:判断发言人位置,将对应方向的麦克风采集声音作为原声(Initialization-Voice);
步骤S3:原声(Initialization-Voice)中高于日语频谱的声音过滤;
步骤S4:将原声(Initialization-Voice)根据发声的间隔切割为语段(Segment),语段(Segment)输入语音-语义对比库进行对比,匹配出原声(Initialization-Voice)对应的翻译后语义(Post-translational-Semantics);
步骤S5:将翻译后语义(Post-translational-Semantics)通过扬声器播放。
进一步地,所述步骤S2具体包括以下步骤:
步骤S2.1:麦克风阵列中每个麦克风同步实时采集声音,将每个麦克风采集声音的时间按照时间排序,标记为集合A0[V1,V2,V3…Vn];
步骤S2.2:时间最早收集到的声音为原声(Initialization-Voice),标记该麦克风为标准音麦克风(Standard-microphone);
步骤S2.3:将集合A0中的声音波形按照相位差进行调整,将初始位置对齐,将集合A0中的声音波形叠加增益后输入至处理器。
进一步地,由于回声也会被麦克风阵列采集,将回声进行处理,拟合为声波,并增益至原声(Initialization-Voice)。
进一步地,麦克风阵列采集A0[V1,V2,V3…Vn]后,继续采集回声,其中每个麦克风采集的声音标记为P[P1,P2,…Pn]建立关于麦克风序号为变量的散点函数I(Pn),设f(x)为待合成语音以时间为变量的波形函数图,b代表Pn处收集声波的响度与原声(Initialization-Voice)的比值,kx与kn分别代表麦克风阵列与回声障碍物的法向量,S为人声频率范围集合,则
若麦克风阵列与发言人之间有障碍物,则V等于0,无障碍物则等于1;
反向计算出f(x),为利用回声合成的语音,声音波形叠加增益后输入至处理器。
进一步地,所述步骤S4中,将原声(Initialization-Voice)中高于以及低于日语频谱的声音过滤。
进一步地,所述步骤S4中,语音-语义对比库包括本地对比库与云端对比库,本地对比库中包含常用语段,非常用语段存储至云端;
进行对比时,优先与本地对比库进行对比,未匹配则将其上传至云端与云端对比库进行对比。
本发明的收益效果是:
降低采集到语音信息的杂音,提高翻译的成功率;将采集到的语音模拟电流信息除杂后叠加增益,并根据日语的特点进一步过滤杂声,转化为语义信息后进行翻译。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所述商务会议用日语语音识别翻译装置的结构示意图;
图2为本发明所述麦克风阵列中单个麦克风的结构示意图;
图3为本发明所述装置中放大电路连接的示意图;
图4为本发明所述商务会议用日语语音识别翻译方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1-4所示,本发明为:
一种商务会议用日语语音识别翻译装置,包括固定于中心塔1外表面的麦克风阵列2,麦克风阵列2电性连接至处理器3输入接口,处理器3输出接口电性连接至扬声器4;
所述麦克风阵列2中单个的麦克风包括单向筒21,单向筒21,单向筒21底部设置有震动膜22,震动膜22相对设置有基板23,震动膜22和基板23电性连接至放大电路,放大电路经过数字采样电路后电性连接至处理器3;
球形中心塔1表面均匀分布的麦克风阵列2采集会议中的语音,由于声波为纵波,与单向筒21方向相同的声波才会直接进入单向筒21内,引起震动膜22的震动,震动膜22与基板23之间的相对距离改变,产生的电信号经过放大电路产生声波模拟电流信号,经过数字采样电路后变为声波数字信号,进入处理器3进行接下来的处理。
进一步地,所述中心塔1为球形,麦克风阵列2均匀分布于中心塔1表面。
进一步地,所述单向筒21内设置有一个以上板状或筒状导向机构24。
进一步地,所述震动膜22为铝箔,与放大电路连接处镀设有金箔。
一种商务会议用日语语音识别翻译方法,包括以下步骤:
步骤S1:收集语音录音;
步骤S2:判断发言人位置,将对应方向的麦克风采集声音作为原声(Initialization-Voice);
步骤S3:原声(Initialization-Voice)中高于日语频谱的声音过滤;
步骤S4:将原声(Initialization-Voice)根据发声的间隔切割为语段(Segment),语段(Segment)输入语音-语义对比库进行对比,匹配出原声(Initialization-Voice)对应的翻译后语义(Post-translational-Semantics);
步骤S5:将翻译后语义(Post-translational-Semantics)通过扬声器播放
进一步地,所述步骤S2具体包括以下步骤:
步骤S2.1:麦克风阵列2中每个麦克风同步实时采集声音,将每个麦克风采集声音的时间按照时间排序,标记为集合A0[V1,V2,V3…Vn];
步骤S2.2:时间最早收集到的声音为原声(Initialization-Voice),标记该麦克风为标准音麦克风(Standard-microphone);
步骤S2.3:将集合A0中的声音波形按照相位差进行调整,将初始位置对齐,将集合A0中的声音波形叠加增益后输入至处理器3。
进一步地,由于回声也会被麦克风阵列2采集,将回声进行处理,拟合为声波,并增益至原声(Initialization-Voice)。
进一步地,麦克风阵列2采集A0[V1,V2,V3…Vn]后,继续采集回声,其中每个麦克风采集的声音标记为P[P1,P2,…Pn]建立关于麦克风序号为变量的散点函数I(Pn),设f(x)为待合成语音以时间为变量的波形函数图,b代表Pn处收集声波的响度与原声(Initialization-Voice)的比值,kx与kn分别代表麦克风阵列2与回声障碍物的法向量,S为人声频率范围集合,则
若麦克风阵列2与发言人之间有障碍物,则V等于0,无障碍物则等于1;
反向计算出f(x),为利用回声合成的语音,声音波形叠加增益后输入至处理器3;
上述公式中,即是将会议室墙面以及相关物体反射的声波进行拟合。
进一步地,所述步骤S4中,将原声(Initialization-Voice)中高于以及低于日语频谱的声音过滤。
进一步地,所述步骤S4中,语音-语义对比库包括本地对比库与云端对比库,本地对比库中包含常用语段,非常用语段存储至云端;
进行对比时,优先与本地对比库进行对比,未匹配则将其上传至云端与云端对比库进行对比。
本实施例的一个具体应用为:
球形中心塔1表面均匀分布的麦克风阵列2采集会议中的语音,由于声波为纵波,与单向筒21方向相同的声波才会直接进入单向筒21内,引起震动膜22的震动,震动膜22与基板23之间的相对距离改变,产生的电信号经过放大电路产生声波模拟电流信号,经过数字采样电路后变为声波数字信号,进入处理器3进行接下来的处理。
判断发言人位置,将对应方向的麦克风采集声音作为原声(Initialization-Voice),由于单向筒21分布于球星中心塔1表面,因此发言人对应方向的麦克风采集到的声音即为原声(Initialization-Voice);
由于震动膜22震动产生的电流过于微弱,放大电路放大倍数过高会导致输出电流畸变,因此将其它麦克风收集的回声进行处理,与原声(Initialization-Voice)相互叠加,可以起到降低信号畸变的作用,麦克风阵列2中每个麦克风同步实时采集声音,将每个麦克风采集声音的时间按照时间排序,标记为集合A0[V1,V2,V3…Vn],时间最早收集到的声音为原声(Initialization-Voice),标记该麦克风为标准音麦克风(Standard-microphone);
麦克风阵列2采集A0[V1,V2,V3…Vn]后,继续采集回声,其中每个麦克风采集的声音标记为P[P1,P2,…Pn]建立关于麦克风序号为变量的散点函数I(Pn),设f(x)为待合成语音以时间为变量的波形函数图,b代表Pn处收集声波的响度与原声(Initialization-Voice)的比值,kx与kn分别代表麦克风阵列2与回声障碍物的法向量,S为人声频率范围集合,则
若麦克风阵列2与发言人之间有障碍物,则V等于0,无障碍物则等于1;
反向计算出f(x),为利用回声合成的语音,该声音波形按照相位差进行调整,将初始位置对齐,将集合A0中的声音波形叠加增益后输入至处理器3;
由于每种语言频谱具有相对固定的率范围,因为过滤频谱外的声音,可以起到除去杂音的作用。
将原声(Initialization-Voice)根据发声的间隔切割为语段(Segment),语段(Segment)输入语音-语义对比库进行对比,语音-语义对比库包括本地对比库与云端对比库,本地对比库中包含常用语段,非常用语段存储至云端,进行对比时,优先与本地对比库进行对比,未匹配则将其上传至云端与云端对比库进行对比,匹配出原声(Initialization-Voice)对应的翻译后语义(Post-translational-Semantics)。
将翻译后语义(Post-translational-Semantics)通过扬声器4播放。
上述操作中,相比较传统方式,降低采集到语音信息的杂音,提高翻译的成功率。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等描述意指结合该实施例或示例描述的具体特征、结构、材料过着特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (10)
1.一种商务会议用日语语音识别翻译装置,其特征在于:包括固定于中心塔(1)外表面的麦克风阵列(2),麦克风阵列(2)电性连接至处理器(3)输入接口,处理器(3)输出接口电性连接至扬声器(4);
所述麦克风阵列(2)中单个的麦克风包括单向筒(21),单向筒(21),单向筒(21)底部设置有震动膜(22),震动膜(22)相对设置有基板(23),震动膜(22)和基板(23)电性连接至放大电路,放大电路经过数字采样电路后电性连接至处理器(3)。
2.根据权利要求1所述的装置,其特征在于:所述中心塔(1)为球形,麦克风阵列(2)均匀分布于中心塔(1)表面。
3.根据权利要求1所述的装置,其特征在于:所述单向筒(21)内设置有一个以上板状或筒状导向机构(24)。
4.根据权利要求1所述的装置,其特征在于:所述震动膜(22)为铝箔,与放大电路连接处镀设有金箔。
5.一种商务会议用日语语音识别翻译方法,其特征在于:包括以下步骤:
步骤S1:收集语音录音;
步骤S2:判断发言人位置,将对应方向的麦克风采集声音作为原声(Initialization-Voice);
步骤S3:原声(Initialization-Voice)中高于或低于日语频谱的声音过滤;
步骤S4:将原声(Initialization-Voice)根据发声的间隔切割为语段(Segment),语段(Segment)输入语音-语义对比库进行对比,匹配出原声(Initialization-Voice)对应的翻译后语义(Post-translational-Semantics);
步骤S5:将翻译后语义(Post-translational-Semantics)通过扬声器(4)播放。
6.根据权利要求5所述的方法,其特征在于:所述步骤S2具体包括以下步骤:
步骤S2.1:麦克风阵列(2)中每个麦克风同步实时采集声音,将每个麦克风采集声音的时间按照时间排序,标记为集合A0[V1,V2,V3…Vn];
步骤S2.2:时间最早收集到的声音为原声(Initialization-Voice),标记该麦克风为标准音麦克风(Standard-microphone);
步骤S2.3:将集合A0中的声音波形按照相位差进行调整,将初始位置对齐,将集合A0中的声音波形叠加增益后输入至处理器(3)。
7.根据权利要求6所述的方法,其特征在于:
由于回声也会被麦克风阵列(2)采集,将回声进行处理,拟合为声波,并增益至原声(Initialization-Voice)。
8.根据权利要求7所述的方法,其特征在于:麦克风阵列(2)采集A0[V1,V2,V3…Vn]后,继续采集回声,其中每个麦克风采集的声音标记为P[P1,P2,…Pn]建立关于麦克风序号为变量的散点函数I(Pn),设f(x)为待合成语音以时间为变量的波形函数图,b代表Pn处收集声波的响度与原声(Initialization-Voice)的比值,kx与kn分别代表麦克风阵列(2)与回声障碍物的法向量,S为人声频率范围集合,则
若麦克风阵列(2)与发言人之间有障碍物,则V等于0,无障碍物则等于1;
反向计算出f(x),为利用回声合成的语音,声音波形叠加增益后输入至处理器(3)。
9.根据权利要求5所述的方法,其特征在于:所述步骤S4中,将原声(Initialization-Voice)中高于以及低于日语频谱的声音过滤。
10.根据权利要求5所述的方法,其特征在于:所述步骤S4中,语音-语义对比库包括本地对比库与云端对比库,本地对比库中包含常用语段,非常用语段存储至云端;
进行对比时,优先与本地对比库进行对比,未匹配则将其上传至云端与云端对比库进行对比。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910117668.7A CN109637555B (zh) | 2019-02-15 | 2019-02-15 | 一种商务会议用日语语音识别翻译系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910117668.7A CN109637555B (zh) | 2019-02-15 | 2019-02-15 | 一种商务会议用日语语音识别翻译系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109637555A true CN109637555A (zh) | 2019-04-16 |
CN109637555B CN109637555B (zh) | 2022-05-24 |
Family
ID=66065411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910117668.7A Active CN109637555B (zh) | 2019-02-15 | 2019-02-15 | 一种商务会议用日语语音识别翻译系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109637555B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112435690A (zh) * | 2019-08-08 | 2021-03-02 | 百度在线网络技术(北京)有限公司 | 双工蓝牙翻译处理方法、装置、计算机设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09292971A (ja) * | 1996-04-26 | 1997-11-11 | Sony Corp | 翻訳装置 |
CN1716241A (zh) * | 2005-07-04 | 2006-01-04 | 张�杰 | 采用声频数据比较的自动翻译处理方法及自动翻译器 |
CN107146487A (zh) * | 2017-07-21 | 2017-09-08 | 锦州医科大学 | 一种英语语音翻译方法 |
CN108376548A (zh) * | 2018-01-16 | 2018-08-07 | 厦门亿联网络技术股份有限公司 | 一种基于麦克风阵列的回声消除方法与系统 |
-
2019
- 2019-02-15 CN CN201910117668.7A patent/CN109637555B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09292971A (ja) * | 1996-04-26 | 1997-11-11 | Sony Corp | 翻訳装置 |
CN1716241A (zh) * | 2005-07-04 | 2006-01-04 | 张�杰 | 采用声频数据比较的自动翻译处理方法及自动翻译器 |
CN107146487A (zh) * | 2017-07-21 | 2017-09-08 | 锦州医科大学 | 一种英语语音翻译方法 |
CN108376548A (zh) * | 2018-01-16 | 2018-08-07 | 厦门亿联网络技术股份有限公司 | 一种基于麦克风阵列的回声消除方法与系统 |
Non-Patent Citations (1)
Title |
---|
郭威等: "嵌入式语音识别在混响环境中的信号增强方法", 《计算机应用研究》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112435690A (zh) * | 2019-08-08 | 2021-03-02 | 百度在线网络技术(北京)有限公司 | 双工蓝牙翻译处理方法、装置、计算机设备和存储介质 |
CN112435690B (zh) * | 2019-08-08 | 2024-06-04 | 百度在线网络技术(北京)有限公司 | 双工蓝牙翻译处理方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109637555B (zh) | 2022-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chi et al. | Subglottal coupling and its influence on vowel formants | |
CN110349582B (zh) | 显示装置与远场语音处理电路 | |
CN108109617A (zh) | 一种远距离拾音方法 | |
CN108449687B (zh) | 一种多麦克风阵列降噪的会议系统 | |
Ganapathy et al. | Temporal envelope compensation for robust phoneme recognition using modulation spectrum | |
CN101930747A (zh) | 一种将语音转换成口型图像的方法和装置 | |
CN111916101A (zh) | 一种融合骨振动传感器和双麦克风信号的深度学习降噪方法及系统 | |
CN105895077A (zh) | 录音标记方法及录音装置 | |
Himawan et al. | Learning feature mapping using deep neural network bottleneck features for distant large vocabulary speech recognition | |
CN111276150B (zh) | 一种基于麦克风阵列的智能语音转文字及同声翻译系统 | |
CN112185342A (zh) | 语音转换与模型训练方法、装置和系统及存储介质 | |
Abushariah et al. | Modern standard Arabic speech corpus for implementing and evaluating automatic continuous speech recognition systems | |
JP2006330170A (ja) | 記録文書作成支援システム | |
CN109637555A (zh) | 一种商务会议用日语语音识别翻译系统 | |
Chibelushi et al. | Design issues for a digital audio-visual integrated database | |
Deroche et al. | Voice segregation by difference in fundamental frequency: Effect of masker type | |
CN109300478A (zh) | 一种听力障碍者的辅助对话装置 | |
Deshwal et al. | A Structured Approach towards Robust Database Collection for Language Identification | |
CN112908336A (zh) | 一种用于语音处理装置的角色分离方法及其语音处理装置 | |
JP2011199698A (ja) | Av機器 | |
Chan et al. | Lexically-guided perceptual learning in early Cantonese-English bilinguals | |
JP2005196020A (ja) | 音声処理装置と方法並びにプログラム | |
Klatt | Acoustic correlates of breathiness: First harmonic amplitude, turbulence noise, and tracheal coupling | |
JP3916834B2 (ja) | 雑音が付加された周期波形の基本周期あるいは基本周波数の抽出方法 | |
JP5706368B2 (ja) | 音声変換関数学習装置、音声変換装置、音声変換関数学習方法、音声変換方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230216 Address after: 519000 No. 9, Pingdong 1st Road, Nanping Science and Technology Industrial Park, Xiangzhou District, Zhuhai City, Guangdong Province Patentee after: Guangdong Chuangfeng Precision Machinery Co.,Ltd. Address before: 519090 No.65, south of Zhuhai Avenue, Jinwan District, Zhuhai City, Guangdong Province Patentee before: GUODONG POLYTECHNIC OF SCIENCE AND TECHNOLOGY |