CN109254418A

CN109254418A - 一种用于失聪人群的眼镜

Info

Publication number: CN109254418A
Application number: CN201811218031.9A
Authority: CN
Inventors: 孟然; 李荣华; 张玉敏; 晏云敏
Original assignee: Dalian Jiaotong University
Current assignee: Dalian Jiaotong University
Priority date: 2018-10-18
Filing date: 2018-10-18
Publication date: 2019-01-22

Abstract

一种用于失聪人群的眼镜，包括AR系统和语音转换系统，框架前部安装AR显示屏，AT显示屏下方安装光组合器，AR显示器，通过USB接口和USB插头连接语音转换系统的语音转换装置，语音转换装置连接语音接收器，语音接收器录入接收所需要的语音，通过语音转换装置将声音转换成文字，语音转换装置将转换好的文字电流传输给AR显示器，再通过AR显示器将转换好的文字射入人眼。本发明的用于失聪人群的眼镜，通过准确的语音识别技术，识别所需要的录入的语音，经过文本语音转换技术与AR技术的结合，更加便捷、舒适的帮助失聪人群进行无障碍交流，更好的维护失聪人群的自信心与自尊心。

Description

一种用于失聪人群的眼镜

技术领域

本发明涉及文本语音转换技术领域。

背景技术

文本语音转换技术是当下应用极为广泛的技术之一，当前技术背景下，AR增强现实技术已经得到了较好的利用和发展，AR增强现实技术已经广泛的应用于日常生活之中，在医学，娱乐和航天等方面有广泛的应用。

如何通过文本语音转换帮助失聪人群进行无障碍交流是本申请所解决的问题。

发明内容

为了通过文本语音转换帮助失聪人群进行无障碍交流，本发明提供了一种用于失聪人群的眼镜。

本发明为实现上述目的所采用的技术方案是：一种用于失聪人群的眼镜，包括AR系统和语音转换系统，框架前部安装AR显示屏，AT显示屏下方安装光组合器，AR显示器，通过USB接口和USB插头连接语音转换系统的语音转换装置，语音转换装置连接语音接收器，语音接收器录入接收所需要的语音，通过语音转换装置将声音转换成文字，语音转换装置将转换好的文字电流传输给AR显示器，再通过AR显示器将转换好的文字射入人眼。

所述框架上部安装头部跟踪器，头部跟踪器连接场景生成器，场景生成器连接AR显示屏，AR显示器通过头部跟踪器实时跟踪用户头部的位置和姿态。

所述AR显示屏采用自由曲面镜片。

本发明的用于失聪人群的眼镜，通过准确的语音识别技术，识别所需要的录入的语音，经过文本语音转换技术与AR技术的结合，更加便捷、舒适的帮助失聪人群进行无障碍交流，更好的维护失聪人群的自信心与自尊心。

附图说明

图1是本发明用于失聪人群的眼镜原理图。

图2是本发明用于失聪人群的眼镜主视结构图。

图3是本发明用于失聪人群的眼镜俯视结构图。

图4是本发明用于失聪人群的眼镜语音转换系统结构图。

图5是本发明用于失聪人群的眼镜整体原理结构图。

图中：1、AR显示屏，2、光组合器，3、开关，4、USB接口，5、声音接收器，6、语音转换装置，7、USB插头，8、头部跟踪器，9、场景生成器。

具体实施方式

本发明的于失聪人群的眼镜原理和结构如图1-4所示，主要包括两大部分；第一部分是 AR显示部分包括AR显示屏器1、处理的光组合器2、开关3、USB接口4，第二部分是语音转换部分包括声音接收器5、语音转换装置6、USB插头7。两部分是由USB插头7和 USB接口4连接。框架前部安装AR显示屏2，AT显示屏1下方安装光组合器2，AR显示器1，通过USB接口4和USB插头7连接语音转换系统的语音转换装置6，语音转换装置 6连接语音接收器5。框架上部安装头部跟踪器8，头部跟踪器8连接场景生成器9，场景生成器9连接AR显示屏1。

所有装置都由眼镜整体框架所连接。声音接收装置录入接收所需要的语音，通过降噪装置，减少周围噪音的干扰，提高反馈率。再通过声音转换处理装置将声音转换成文字。声音处理装置将转换好的文字电流传输给AR显示装置，再通过AR显示装置将转换好的文字射入人眼。USB接口装置，可以使文本语音的转换装置可拆卸下来，使该项方案可以在电视，电脑等其他移动端使用。

AR显示技术的最根本目的在于实现增强现实技术中的视觉体验，让我们看到一个被处理过的世界。“叠加”是AR显示技术的关键所在。利用AR显示技术的叠加原理，我们将语音转换装置所获取的语音转化为文字，通过降维处理叠加在镜片上，形成信息的叠加和视频的叠加。虚拟场景发生器负责虚拟场景的建模、管理、绘制和其他外设的管理。该装置上方头部位置的头部方位跟踪设备跟踪用户视线变化，实现用户观察坐标系与虚拟场景坐标系的匹配。交互设备现感官信号以及环境控制操作信号的输入和输出。头部位置上方的方位跟踪定位设备负责测量用户在真实环境中的六自由度位置和方位信息。

显示器具备普通的三维图像显示功能而且能够实时跟踪用户头部的位置和姿态，并及时将视线信息反馈给图像生成软件，实现视景图像与增强信息的同步刷新。这样可以使用户能够以在真实世界中观察周围事物的方式在增强环境中畅游从而增强用户在融合环境中的浸没感和交互。头部方位跟踪器获取头部方位信息。

显示设备上，本项目镜片采用自由曲面技术。自由曲面技术削减偏振分光棱镜技术的局限性带来的影响，其视场角目前可以做到的范围在20°到30°，厚度上要比棱镜要好，但是通常都在8mm以上。自由曲面技术把原本的立方体表面做成弯曲的表面，甚至膜层也做成弯曲的，最大程度地利用每一个位置的分光效果，就可以更大程度地利用分光膜层，既能扩大显示的范围，而不产生体积上夸张的扩大，同时也能增大视场角的范围。使用者可以直接透过AR显示器看到真实世界的影像，点像投影装置把虚拟影像投射在AR显示器上，该装置不会影响失聪人群观察环境。而且本装置的设计所采用的是从人体数据入手,建立数字头部模型,再通过人机工程学计算得出设计尺寸，这样提高了眼镜佩戴的舒适度。

声音接收器接收所需要的语音，在语音识别之前，需要对录入语音进行VAD操作。用一些信号处理技术，把首尾端的静音切除，对语音信号进行分析和处理，除去冗余信息，降低对后续步骤造成的干扰。语音转换装置对声音进行声学特征提取，将声音进行分帧，利用提取MFCC特征的变换方法，根据人耳的生理特征，把每一帧波形形变成一个多维向量，可以简单的理解这个向量包含了这帧语音的内容信息。提取影响语音识别的关键信息和表达语言含义的特征信息。紧扣特征信息，用最小单元识别字词。按照不同语言的各自语法，依照先后次序识别字词。把前后意思当作辅助识别条件，有利于分析和识别。按照语义分析，给关键信息划分段落，取出所识别出的字词并连接起来，同时根据语句意思调整句子构成。结合语义，仔细分析上下文的相互联系，对当前正在处理的语句进行适当修正。把帧识别成状态，把状态组合成音素，把音素组合成单词，对语音进行识别。识别出相应的语音，将语音电流转化为相应的文字电流，再将文字电流传输到投影装置处和USB 接口处。

本发明是通过实施例进行描述的，本领域技术人员知悉，在不脱离本发明的精神和范围的情况下，可以对这些特征和实施例进行各种改变或等效替换。另外，在本发明的教导下，可以对这些特征和实施例进行修改以适应具体的情况及材料而不会脱离本发明的精神和范围。因此，本发明不受此处所公开的具体实施例的限制，所有落入本申请的权利要求范围内的实施例都属于本发明的保护范围。

Claims

1.一种用于失聪人群的眼镜，其特征在于：包括AR系统和语音转换系统，框架前部安装AR显示屏(2)，AT显示屏(1)下方安装光组合器(2)，AR显示器(1)，通过USB接口(4)和USB插头(7)连接语音转换系统的语音转换装置(6)，语音转换装置(6)连接语音接收器(5)，语音接收器(5)录入接收所需要的语音，通过语音转换装置(6)将声音转换成文字，语音转换装置(6)将转换好的文字电流传输给AR显示器(1)，再通过AR显示器(1)将转换好的文字射入人眼。

2.根据权利要求1所述的一种用于失聪人群的眼镜，其特征在于：所述框架上部安装头部跟踪器(8)，头部跟踪器(8)连接场景生成器(9)，场景生成器(9)连接AR显示屏(1)，AR显示器(1)通过头部跟踪器(8)实时跟踪用户头部的位置和姿态。

3.根据权利要求1所述的一种用于失聪人群的眼镜，其特征在于：所述AR显示屏(1)采用自由曲面镜片。