CN109036408A - 一种用于vr展示教学的语音识别控制设备及控制方法 - Google Patents
一种用于vr展示教学的语音识别控制设备及控制方法 Download PDFInfo
- Publication number
- CN109036408A CN109036408A CN201810964756.6A CN201810964756A CN109036408A CN 109036408 A CN109036408 A CN 109036408A CN 201810964756 A CN201810964756 A CN 201810964756A CN 109036408 A CN109036408 A CN 109036408A
- Authority
- CN
- China
- Prior art keywords
- voice
- formula
- cantilever
- microphone
- teaching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 241000209140 Triticum Species 0.000 claims abstract description 25
- 235000021307 Triticum Nutrition 0.000 claims abstract description 25
- 230000009467 reduction Effects 0.000 claims abstract description 25
- 238000012360 testing method Methods 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 5
- 240000007817 Olea europaea Species 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000001427 coherent effect Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000009795 derivation Methods 0.000 claims 1
- 239000007787 solid Substances 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000009471 action Effects 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 229910017435 S2 In Inorganic materials 0.000 description 2
- 238000013016 damping Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000002407 reforming Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明公开了一种用于VR展示教学的语音识别控制设备,包括机体,机体两侧固定有悬臂,悬臂外侧设置有降噪采集麦,悬臂内测设置有耳机,悬臂的末端通过弹性带连接,弹性带中部设置有连接扣,悬臂设置有转轴,转轴通过摆杆连接麦克风;一种用于VR展示教学的语音识别控制方法,包括以下步骤,通过降噪采集麦和麦克风分别采集降噪麦采集H(x)和麦克风采集G(x);结合预设静音室对比数据得出人声O(x);通过人声O(x)中的语音信息组合出语音指令;语音指令控制机体;本发明实施中,能够解析用户的语音指令用于控制VR设备,方便在教学过程中能够使用。
Description
技术领域
本发明涉及VR教学设备领域,具体涉及一种用于VR展示教学的语音识别控制设备及控制方法。
背景技术
VR教学可以应用在虚拟仿真校园、虚拟教学科研、虚拟实验等方面。VR教学是可实现集教学、体验、实践于一体的立体化教学,改革传统教学模式,创新教学方法,达到培养创新型、实用型人才的目的。 VR教学随着3D虚拟现实技术、三维建模、数据库技术等技术手段的不断成熟而成熟,VR教学在教育上应用日益广泛,但是传统的VR设备只能使用手柄以及内部的姿态加速度传感器进行控制,操作不便。
在专利号为CN107341981A的专利中公开了一种基于VR技术的学生教学互动平台控制方法,其包括如下步骤:S1、在服务器中建立学生以及教师形体三维模型;采集学生、教师的声音素材,根据学生、教师的声音素材建立学生、教师的语音数据库,语音数据中存储学生、教师的声音特征数据;S2、根据教学内容在服务器中建立不同的教学场景模型;所述教学场景模型包括环境模型、道具模型;53、服务器接收第一终端的教学请求,第一终端为教师侧的终端;服务器根据第一终端的教学请求选择需要连接的第二终端,第二终端为学生侧的终端;服务器在选择后建立与第二终端的连接;S4、服务器根据第一终端以及选择的第二终端从服务器中匹配相对应的学生以及教师形体三维模型以及教师、学生的声音特征数据;S5、第一终端向服务器发送教学信息;服务器根据教学信息判断需要的教学场景模型,并从服务器中匹配、选择相对应的教学场景模型;根据选择的教学场景模型、学生以及教师形体三维模型以及教师、学生的声音特征数据建立临时教学综合场景;S6、服务器接收教师、学生的语音信息、肢体动作信息;将教师的语音信息按照服务器中的教师的声音特征数据进行优化;将教师、学生的肢体动作信息、学生的语音信息、经过优化的教师的语音信息投射到临时教学综合场景中。但是上述方案使用VR机体的自带控制器进行控制,控制使用不便。
在专利号为CN107300970A的专利中公开了一种虚拟现实交互方法,其特征在于,包括以下步骤:获取VR资源;所述VR资源包括多个VR 场景和多个交互环节;在对所述VR资源的VR场景进行展示的过程中,采集用户的控制语音;根据采集到的控制语音,对所述VR场景的展示过程进行控制;当展示到交互环节时,根据所述交互环节中采集到的用户的交互语音,确定所需展示的下一个VR场景,在当前所展示的VR 场景中展示所述交互语音的反馈信息。但是上述方式无法对背景噪音以及vr设备本身声音进行过滤,容易导致误操作。
发明内容
本发明的目的在于克服现有技术中存在的上述问题,提供一种用于VR展示教学的语音识别控制设备及控制方法,能够解析用户的语音指令用于控制VR设备,方便在教学过程中能够使用。
为实现上述技术目的,达到上述技术效果,本发明是通过以下技术方案实现:
一种用于VR展示教学的语音识别控制设备,包括机体,其特征在于:机体两侧固定有悬臂,悬臂外侧设置有降噪采集麦,悬臂内测设置有耳机,悬臂的末端通过弹性带连接,弹性带中部设置有连接扣,悬臂设置有转轴,转轴通过摆杆连接麦克风,用户将设备戴在头上,扣上连接扣,旋转摆杆,调整麦克风至合适的位置,调整过程中,转轴内的转盘在转动槽内转动,盲孔与转动槽内壁的弹性片卡接,起到相对固定的作用,在转盘转动过程,既是调整麦克风的位置;
所述转轴包括在悬臂侧壁转动槽内安置的转盘,转盘顶部和底部设置有与转动槽滑动摩擦的弧形块,转盘左右两侧设置有系列盲孔,盲孔与转动槽内壁左右固定的弹性片卡接,转盘固定有摆杆。
进一步地,所述摆杆包括套筒以及与套筒末端活动插接的伸缩杆,伸缩杆顶部的插接端固定有阻尼器,阻尼器侧壁开设的盲槽内设置有活动的橡胶块,盲槽内的弹性件压迫橡胶块与套筒内壁产生摩擦,套筒底部开口端内壁固定有限位块。
进一步地,所述盲孔纵向剖面为半球形,所述弹性片纵向剖面为半橄榄形。
一种用于VR展示教学的语音识别控制方法,其特征在于:包括以下步骤,
-步骤S1:通过降噪采集麦和麦克风分别采集降噪麦采集H(x)和麦克风采集G(x);
-步骤S2:结合预设静音室对比数据得出人声O(x);
-步骤S3:通过人声O(x)中的语音信息组合出语音指令;
-步骤S4:语音指令控制机体。
进一步地,一种用于VR展示教学的语音识别控制方法,其特征在于:所述步骤S2中,分为以下步骤,
-步骤S2.1:
设耳机输出声波为F(x),背景噪声为W(x),则
H(x)=W(x)+m1O(x)+k1F(x) 公式1,
G(x)=W(x)+m2O(x)+k2F(x) 公式2,
其中,m1为人声至降噪麦的传导系数,m1为人声至麦克风的传导系数,k1为耳机至降噪麦的传导系数,k2为耳机麦克风的传导系数;
-步骤S2.2:
在出厂静音室测试阶段,播放耳机,排除背景噪音W(x)以及人声O(x)的干扰,上述公式1和公式2变形为:
H(x)=k1F(x) 公式3,
G(x)=k2F(x) 公式4,
由于转轴多级可调整,针对每个转轴旋转状态,测试每个状态的k1、 k2数值,
-步骤S2.3:
在出厂静音室测试阶段,测试人员戴上设备说话,关闭耳机,排除背景噪音W(x)以及耳机声音F(x)的干扰,上述公式1和公式2变形为:
H(x)=m1O(x) 公式5,
G(x)=m2O(x) 公式6,
由于转轴多级可调整,针对每个转轴旋转状态,测试每个状态的m1、 m2数值,
-步骤S2.4:
代入公式1与公式2,之后公式2减去公式1,得到:
G(x)-H(x)=(m2-m1)O(x)+(k2-k1)F(x) 公式7,
求解得出人声
将预设的m1、m2、k1、k2按预设顺序依此代入进行求解。
进一步地,所述步骤S3中,包括以下步骤,
-步骤S3.1:
在联网状态下,机体将人声语音O(x)实时上传至云识别平台进行语音指令识别,再将之后的语音指令下载,
-步骤S3.2:
当无法联网或者网络延迟过高,则将人声O(x)在本地处理。
进一步地,所述步骤S3.2包括以下步骤,
-步骤S3.2.1:
将人声O(x)建立响度dB-时间t模型,
-步骤S3.2.2:
将响度dB-时间t模型中响度dB中人声O(x)求导得出D(x),
-步骤S3.2.3:
其中单个字的发声区间导数连贯,而单字之间则不连贯,由此将人声O(x)分切为单字发声,
-步骤S3.2.4:
将分切后的单字发声与语音数据库进行比对,转化为单个汉字,若转化失败,则跳转步骤S2.4重新求解,再合成为语音指令。
本发明的收益效果是:
1、方便调整麦克风位置,用户将设备戴在头上,扣上连接扣,旋转摆杆,调整麦克风至合适的位置,调整过程中,转轴内的转盘在转动槽内转动,盲孔与转动槽内壁的弹性片卡接,起到相对固定的作用,在转盘转动过程,既是调整麦克风的位置。
2、能够解析用户的语音指令用于控制VR设备,方便在教学过程中能够使用,包括以下步骤,通过降噪采集麦和麦克风分别采集降噪麦采集H(x)和麦克风采集G(x);结合预设静音室对比数据得出人声 O(x);通过人声O(X)中的语音信息组合出语音指令;语音指令控制机体;本发明实施中,能够解析用户的语音指令用于控制VR设备,方便在教学过程中能够使用。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所述用于VR展示教学的语音识别控制设备的结构立体示图;
图2为本发明所述用于VR展示教学的语音识别控制设备的右视图;
图3为本发明所述转轴的结构示意图;
图4为本发明所述摆杆的结构示意图;
图5为本发明所述摆杆的A处放大结构示意图;
图6为本发明所述语音识别控制设备各处音源的示意图;
图7为本发明所述用于VR展示教学的语音识别控制方法的步骤示意图;
图8为本发明所述步骤S3.2中切分单字语音的波形示意图;
图9为本发明所述步骤S3.2中切割单字之后的语音波形示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1-9所示,本发明为为:
一种用于VR展示教学的语音识别控制设备,包括机体1,机体1 两侧固定有悬臂2,悬臂2外侧设置有降噪采集麦3,悬臂2内测设置有耳机6,悬臂2的末端通过弹性带4连接,弹性带4中部设置有连接扣5,悬臂2设置有转轴7,转轴7通过摆杆8连接麦克风9风;
所述转轴包括在悬臂侧壁转动槽内安置的转盘,转盘顶部和底部设置有与转动槽滑动摩擦的弧形块,转盘左右两侧设置有系列盲孔,盲孔与转动槽内壁左右固定的弹性片卡接,转盘固定有摆杆,用户将设备戴在头上,扣上连接扣5,旋转摆杆8,调整麦克风9至合适的位置,调整过程中,转轴7内的转盘71在转动槽21内转动,盲孔712 与转动槽21内壁的弹性片22卡接,起到相对固定的作用,在转盘71 转动过程,既是调整麦克风9的位置。
进一步地,摆杆8包括套筒81以及与套筒81末端活动插接的伸缩杆82,伸缩杆82顶部的插接端固定有阻尼器821,阻尼器821侧壁开设的盲槽内设置有活动的橡胶块822,盲槽内的弹性件823压迫橡胶块822与套筒81内壁产生摩擦,套筒81底部开口端内壁固定有限位块811,当手动调整伸缩杆82插入深度的时候,盲槽内的弹性件823 压迫橡胶块822与套筒81内壁产生摩擦,产生阻尼作用,保持摆杆8 停留在调整之后的长度。
进一步地,所述盲孔712纵向剖面为半球形,所述弹性片22纵向剖面为半橄榄形。
一种用于VR展示教学的语音识别控制方法,其特征在于:包括以下步骤,
-步骤S1:通过降噪采集麦和麦克风分别采集降噪麦采集H(x)和麦克风采集G(x);
-步骤S2:结合预设静音室对比数据得出人声O(x);
-步骤S3:通过人声O(x)中的语音信息组合出语音指令;
-步骤S4:语音指令控制机体。
进一步地,一种用于VR展示教学的语音识别控制方法,其特征在于:所述步骤S2中,分为以下步骤,
-步骤S2.1:
设耳机输出声波为F(x),背景噪声为W(x),则
H(x)=W(x)+m1O(x)+k1F(x) 公式1,
G(x)=W(x)+m2O(x)+k2F(x) 公式2,
其中,m1为人声至降噪麦的传导系数,m1为人声至麦克风的传导系数,k1为耳机至降噪麦的传导系数,k2为耳机麦克风的传导系数;
-步骤S2.2:
在出厂静音室测试阶段,播放耳机,排除背景噪音W(x)以及人声 O(x)的干扰,上述公式1和公式2变形为:
H(x)=k1F(x) 公式3,
G(x)=k2F(x) 公式4,
由于转轴多级可调整,针对每个转轴旋转状态,测试每个状态的k1、 k2数值,
-步骤S2.3:
在出厂静音室测试阶段,测试人员戴上设备说话,关闭耳机,排除背景噪音W(x)以及耳机声音F(x)的干扰,上述公式1和公式2变形为:
H(x)=m1O(x) 公式5,
G(x)=m2O(x) 公式6,
由于转轴多级可调整,针对每个转轴旋转状态,测试每个状态的m1、 m2数值,
-步骤S2.4:
代入公式1与公式2,之后公式2减去公式1,得到:
G(x)-H(x)=(m2-m1)O(x)+(k2-k1)F(x) 公式7,
求解得出人声
将预设的m1、m2、k1、k2按预设顺序依此代入进行求解。
进一步地,所述步骤S3中,包括以下步骤,
-步骤S3.1:
在联网状态下,机体将人声语音O(x)实时上传至云识别平台进行语音指令识别,再将之后的语音指令下载,
-步骤S3.2:
当无法联网或者网络延迟过高,则将人声O(x)在本地处理。
进一步地,所述步骤S3.2包括以下步骤,
-步骤S3.2.1:
将人声O(x)建立响度dB-时间t模型,
-步骤S3.2.2:
将响度dB-时间t模型中响度dB中人声O(x)求导得出D(x),
-步骤S3.2.3:
其中单个字的发声区间导数连贯,而单字之间则不连贯,由此将人声O(x)分切为单字发声,
-步骤S3.2.4:
将分切后的单字发声与语音数据库进行比对,转化为单个汉字,若转化失败,则跳转步骤S2.4重新求解,再合成为语音指令。
本实施例的一个具体应用为:
如图1-5所示,用户将设备戴在头上,扣上连接扣5,旋转摆杆8,调整麦克风9至合适的位置,调整过程中,转轴7内的转盘71在转动槽21内转动,盲孔712与转动槽21内壁的弹性片22卡接,起到相对固定的作用,在转盘71转动过程,既是调整麦克风9的位置,当手动调整伸缩杆82插入深度的时候,盲槽内的弹性件823压迫橡胶块822 与套筒81内壁产生摩擦,产生阻尼作用,保持摆杆8停留在调整之后的长度。
如图6所示,用户对麦克风9说出语音指令,通过降噪采集麦3 和麦克风9分别采集降噪麦采集H(x)和麦克风采集G(x),
如图7所示,降噪采集麦3接收到的声音H(x)包括背景噪声为 W(x)、衰减之后的人声m1O(x)以及衰减之后的耳机声音k1F(x),麦克风9采集到的声音麦克风采集G(x)包括背景噪声为W(x)、衰减周的人声m2O(x)以及衰减之后的耳机声音k2F(x),即如下:
H(x)=W(x)+m1O(x)+k1F(x) 公式1,
G(x)=W(x)+m2O(x)+k2F(x) 公式2,
其中,m1为人声至降噪麦3的传导系数,m1为人声至麦克风9的传导系数,k1为耳机6至降噪麦3的传导系数,k2为耳机6麦克风9 的传导系数,在出厂静音室测试阶段,播放耳机6,排除背景噪音W(x) 以及人声O(x)的干扰,上述公式1和公式2变形为:
H(x)=k1F(x) 公式3,
G(x)=k2F(x) 公式4,
由于转轴7多级可调整,针对每个转轴7旋转状态,测试每个状态的k1、k2数值,
在出厂静音室测试阶段,测试人员戴上设备说话,关闭耳机6,排除背景噪音W(x)以及耳机声音F(x)的干扰,上述公式1和公式2变形为:
H(x)=m1O(x) 公式5,
G(x)=m2O(x) 公式6,
由于转轴7多级可调整,针对每个转轴7旋转状态,测试每个状态的m1、m2数值,
代入公式1与公式2,之后公式2减去公式1,得到:
G(x)-H(x)=(m2-m1)O(x)+(k2-k1)F(x) 公式7,
求解得出人声
在解析O(x)过程中,将预设的m1、m2、k1、k2按预设顺序依此代入进行求解;
将人声O(x)建立响度dB-时间t模型,
将响度dB-时间t模型中响度dB中人声O(x)求导得出D(x)
其中单个字的发声区间导数连贯,而单字之间则不连贯,由此将人声O(x)分切为单字发声,若无法解析出有意义单字发声,则转入将下一预设的m1、m2、k1、k2按预设顺序依此代入进行求解,
求解成功之后,将分切后的单字发声与语音数据库进行比对,转化为单个汉字,再合成为语音指令,
入图8所示,为语音“左转三十五度”六个汉字的语音波形图,分切之后入图9所示,
语音指令控制机体1。
上述操作中,相比较传统方式,能够解析用户的语音指令用于控制VR设备,方便在教学过程中能够使用。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等描述意指结合该实施例或示例描述的具体特征、结构、材料过着特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (7)
1.一种用于VR展示教学的语音识别控制设备,包括机体(1),其特征在于:机体(1)两侧固定有悬臂(2),悬臂(2)外侧设置有降噪采集麦(3),悬臂(2)内测设置有耳机(6),悬臂(2)的末端通过弹性带(4)连接,弹性带(4)中部设置有连接扣(5),悬臂(2)设置有转轴(7),转轴(7)通过摆杆(8)连接麦克风(9);
所述转轴(7)包括在悬臂(2)侧壁转动槽(21)内安置的转盘(71),转盘(71)顶部和底部设置有与转动槽(21)滑动摩擦的弧形块(711),转盘(71)左右两侧设置有系列盲孔(712),盲孔(712)与转动槽(21)内壁左右固定的弹性片(22)卡接,转盘(71)固定有摆杆(8)。
2.根据权利要求1所述的一种用于VR展示教学的语音识别控制设备,其特征在于:所述摆杆(8)包括套筒(81)以及与套筒(81)末端活动插接的伸缩杆(82),伸缩杆(82)顶部的插接端固定有阻尼器(821),阻尼器(821)侧壁开设的盲槽内设置有活动的橡胶块(822),盲槽内的弹性件(823)压迫橡胶块(822)与套筒(81)内壁产生摩擦,套筒(81)底部开口端内壁固定有限位块(811)。
3.根据权利要求1所述的一种用于VR展示教学的语音识别控制设备,其特征在于:所述盲孔(712)纵向剖面为半球形,所述弹性片(22)纵向剖面为半橄榄形。
4.根据权利要求1所述的一种用于VR展示教学的语音识别控制方法,其特征在于:包括以下步骤,
-步骤S1:通过降噪采集麦(3)和麦克风(9)分别采集降噪麦采集H(x)和麦克风采集G(x);
-步骤S2:结合预设静音室对比数据得出人声O(x);
-步骤S3:通过人声O(x)中的语音信息组合出语音指令;
-步骤S4:语音指令控制机体(1)。
5.根据权利要求4所述的一种用于VR展示教学的语音识别控制方法,其特征在于:所述步骤S2中,分为以下步骤,
-步骤S2.1:
设耳机输出声波为F(x),背景噪声为W(x),则
H(x)=W(x)+m1O(x)+k1F(x) 公式1,
G(x)=W(x)+m2O(x)+k2F(x) 公式2,
其中,m1为人声至降噪麦(3)的传导系数,m1为人声至麦克风(9)的传导系数,k1为耳机(6)至降噪麦(3)的传导系数,k2为耳机(6)麦克风(9)的传导系数;
-步骤S2.2:
在出厂静音室测试阶段,播放耳机(6),排除背景噪音W(x)以及人声O(x)的干扰,上述公式1和公式2变形为:
H(x)=k1F(x) 公式3,
G(x)=k2F(x) 公式4,
由于转轴(7)多级可调整,针对每个转轴(7)旋转状态,测试每个状态的k1、k2数值,
-步骤S2.3:
在出厂静音室测试阶段,测试人员戴上设备说话,关闭耳机(6),排除背景噪音W(x)以及耳机声音F(x)的干扰,上述公式1和公式2变形为:
H(x)=m1O(x) 公式5,
G(x)=m2O(x) 公式6,
由于转轴(7)多级可调整,针对每个转轴(7)旋转状态,测试每个状态的m1、m2数值,
-步骤S2.4:
代入公式1与公式2,之后公式2减去公式1,得到:
G(x)-H(x)=(m2-m1)O(x)+(k2-k1)F(x) 公式7,
求解得出人声
将预设的m1、m2、k1、k2按预设顺序依此代入进行求解。
6.根据权利要求4所述的一种用于VR展示教学的语音识别控制方法,其特征在于:所述步骤S3中,包括以下步骤,
-步骤S3.1:
在联网状态下,机体(1)将人声语音O(x)实时上传至云识别平台进行语音指令识别,再将之后的语音指令下载,
-步骤S3.2:
当无法联网或者网络延迟过高,则将人声O(x)在本地处理。
7.根据权利要求6所述的一种用于VR展示教学的语音识别控制方法,其特征在于:所述步骤S3.2包括以下步骤,
-步骤S3.2.1:
将人声O(x)建立响度(dB)-时间(t)模型,
-步骤S3.2.2:
将响度(dB)-时间(t)模型中响度(dB)中人声O(x)求导得出D(x),
-步骤S3.2.3:
其中单个字的发声区间导数连贯,而单字之间则不连贯,由此将人声O(x)分切为单字发声,
-步骤S3.2.4:
将分切后的单字发声与语音数据库进行比对,转化为单个汉字,若转化失败,则跳转步骤S2.4重新求解,再合成为语音指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810964756.6A CN109036408A (zh) | 2018-08-23 | 2018-08-23 | 一种用于vr展示教学的语音识别控制设备及控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810964756.6A CN109036408A (zh) | 2018-08-23 | 2018-08-23 | 一种用于vr展示教学的语音识别控制设备及控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109036408A true CN109036408A (zh) | 2018-12-18 |
Family
ID=64627046
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810964756.6A Pending CN109036408A (zh) | 2018-08-23 | 2018-08-23 | 一种用于vr展示教学的语音识别控制设备及控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109036408A (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB913244A (en) * | 1959-07-28 | 1962-12-19 | Airmed Ltd | Improvements in or relating to headsets |
DE19715321A1 (de) * | 1997-04-01 | 1998-10-08 | Said Ammar | Halteanordnung für ein Handy |
US5907826A (en) * | 1996-10-28 | 1999-05-25 | Nec Corporation | Speaker-independent speech recognition using vowel/consonant segmentation based on pitch intensity values |
US20100246845A1 (en) * | 2009-03-30 | 2010-09-30 | Benjamin Douglass Burge | Personal Acoustic Device Position Determination |
KR20140013676A (ko) * | 2012-07-25 | 2014-02-05 | 허춘화 | 디스플레이 단말기 헤드마운트 장치 |
CN204256272U (zh) * | 2014-12-22 | 2015-04-08 | 王傲立 | 耳机式虚拟现实显示器 |
DE102014212733A1 (de) * | 2014-07-01 | 2016-01-07 | Bayerische Motoren Werke Aktiengesellschaft | Auditive Prüfung von Geräuschen |
WO2016005087A1 (de) * | 2014-07-09 | 2016-01-14 | Robert Bosch Gmbh | Vorrichtung und verfahren zur akustischen untersuchung von umgebungsobjekten eines fortbewegungsmittels |
CN105388614A (zh) * | 2014-09-01 | 2016-03-09 | 三星电子株式会社 | 头戴式显示装置 |
CN105551498A (zh) * | 2015-10-28 | 2016-05-04 | 东莞酷派软件技术有限公司 | 一种语音识别的方法及装置 |
CN206193359U (zh) * | 2016-11-17 | 2017-05-24 | 厦门轻居科技有限公司 | 一种多人交互式虚拟现实体验装置 |
US20170324437A1 (en) * | 2016-04-22 | 2017-11-09 | James J. Ruttler | Smart aviation communication headset and peripheral components |
CN107948804A (zh) * | 2017-12-28 | 2018-04-20 | 歌尔科技有限公司 | 一种虚拟现实头戴设备 |
CN108260051A (zh) * | 2018-01-15 | 2018-07-06 | 深圳前海黑鲸科技有限公司 | 语音遥控系统、便携式传输设备及智能设备 |
CN208903661U (zh) * | 2018-08-23 | 2019-05-24 | 重庆加河科技有限公司 | 一种用于vr展示教学的语音识别控制设备 |
CN209327691U (zh) * | 2016-05-06 | 2019-08-30 | 深圳脑穿越科技有限公司 | 虚拟现实眼镜 |
-
2018
- 2018-08-23 CN CN201810964756.6A patent/CN109036408A/zh active Pending
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB913244A (en) * | 1959-07-28 | 1962-12-19 | Airmed Ltd | Improvements in or relating to headsets |
US5907826A (en) * | 1996-10-28 | 1999-05-25 | Nec Corporation | Speaker-independent speech recognition using vowel/consonant segmentation based on pitch intensity values |
DE19715321A1 (de) * | 1997-04-01 | 1998-10-08 | Said Ammar | Halteanordnung für ein Handy |
US20100246845A1 (en) * | 2009-03-30 | 2010-09-30 | Benjamin Douglass Burge | Personal Acoustic Device Position Determination |
KR20140013676A (ko) * | 2012-07-25 | 2014-02-05 | 허춘화 | 디스플레이 단말기 헤드마운트 장치 |
DE102014212733A1 (de) * | 2014-07-01 | 2016-01-07 | Bayerische Motoren Werke Aktiengesellschaft | Auditive Prüfung von Geräuschen |
WO2016005087A1 (de) * | 2014-07-09 | 2016-01-14 | Robert Bosch Gmbh | Vorrichtung und verfahren zur akustischen untersuchung von umgebungsobjekten eines fortbewegungsmittels |
CN105388614A (zh) * | 2014-09-01 | 2016-03-09 | 三星电子株式会社 | 头戴式显示装置 |
CN204256272U (zh) * | 2014-12-22 | 2015-04-08 | 王傲立 | 耳机式虚拟现实显示器 |
CN105551498A (zh) * | 2015-10-28 | 2016-05-04 | 东莞酷派软件技术有限公司 | 一种语音识别的方法及装置 |
US20170324437A1 (en) * | 2016-04-22 | 2017-11-09 | James J. Ruttler | Smart aviation communication headset and peripheral components |
CN209327691U (zh) * | 2016-05-06 | 2019-08-30 | 深圳脑穿越科技有限公司 | 虚拟现实眼镜 |
CN206193359U (zh) * | 2016-11-17 | 2017-05-24 | 厦门轻居科技有限公司 | 一种多人交互式虚拟现实体验装置 |
CN107948804A (zh) * | 2017-12-28 | 2018-04-20 | 歌尔科技有限公司 | 一种虚拟现实头戴设备 |
CN108260051A (zh) * | 2018-01-15 | 2018-07-06 | 深圳前海黑鲸科技有限公司 | 语音遥控系统、便携式传输设备及智能设备 |
CN208903661U (zh) * | 2018-08-23 | 2019-05-24 | 重庆加河科技有限公司 | 一种用于vr展示教学的语音识别控制设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106875764B (zh) | 基于网络的虚拟现实外语学习系统及控制方法 | |
CN106409030A (zh) | 一种个性化外语口语学习系统 | |
CN102063903A (zh) | 言语交互训练系统及方法 | |
WO2015025155A1 (en) | Audio-visual dialogue system and method | |
US20160321953A1 (en) | Pronunciation learning support system utilizing three-dimensional multimedia and pronunciation learning support method thereof | |
CN106249903B (zh) | 一种虚拟现实场景内容的播放方法及装置 | |
CN104537925B (zh) | 语障儿童语言训练辅助系统及方法 | |
US20200402490A1 (en) | Audio performance with far field microphone | |
CN107093421A (zh) | 一种语音模拟方法和装置 | |
CN110491241B (zh) | 一种声乐发声训练装置及其方法 | |
CN110393015A (zh) | 高级人工声音听觉训练 | |
CN208903661U (zh) | 一种用于vr展示教学的语音识别控制设备 | |
CN111105776A (zh) | 有声播放装置及其播放方法 | |
Lancaster | Basic cinematography: a creative guide to visual storytelling | |
CN109036408A (zh) | 一种用于vr展示教学的语音识别控制设备及控制方法 | |
CN105303909B (zh) | 一种基于振动学习英文的方法、装置和系统 | |
Cheyne et al. | Talker-to-listener distance effects on speech production and perception | |
WO2019168920A1 (en) | System and method for integrating special effects with a text source | |
CN111445742B (zh) | 一种基于远程教育系统的声乐教学系统 | |
Bernardet et al. | Speech breathing in virtual humans: An interactive model and empirical study | |
Kerr et al. | A breath controlled AAC system | |
CN108734606A (zh) | 一种基于神经网络算法的智能教学系统 | |
US20150380012A1 (en) | Speech rehabilitation assistance apparatus and method for controlling the same | |
JP3829005B2 (ja) | 仮想環境提示装置 | |
CN110362675A (zh) | 一种外语教学内容展示方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20181218 |
|
WD01 | Invention patent application deemed withdrawn after publication |