CN108074569A - 一种智能化语音实时识别及展示方法 - Google Patents

一种智能化语音实时识别及展示方法 Download PDF

Info

Publication number
CN108074569A
CN108074569A CN201711277421.9A CN201711277421A CN108074569A CN 108074569 A CN108074569 A CN 108074569A CN 201711277421 A CN201711277421 A CN 201711277421A CN 108074569 A CN108074569 A CN 108074569A
Authority
CN
China
Prior art keywords
sign language
information
text information
target
exhibiting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711277421.9A
Other languages
English (en)
Inventor
兰鲁光
卢亮
杨猛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Popular Science Product Engineering Research Centre Co Ltd
Original Assignee
Anhui Popular Science Product Engineering Research Centre Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Popular Science Product Engineering Research Centre Co Ltd filed Critical Anhui Popular Science Product Engineering Research Centre Co Ltd
Priority to CN201711277421.9A priority Critical patent/CN108074569A/zh
Publication of CN108074569A publication Critical patent/CN108074569A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Social Psychology (AREA)
  • Psychiatry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种智能化语音实时识别及展示方法,包括:采集待翻译语音信息;将待翻译语音信息转换为目标文字信息;根据目标文字信息在预设的文字手语对照数据库检索与目标文字信息匹配的目标手语信息;展示目标文字信息,和/或展示目标手语信息,如此,当听障人在与健听人进行交流时,通过采集健听人的语音信息并转换为文字信息和手语信息,然后通过智能移动终端向听障人展示这些文字信息和手语信息,帮助该听障人理解健听人所讲的话的内容,实现了方便、快捷、有效的语音翻译。

Description

一种智能化语音实时识别及展示方法
技术领域
本发明涉及语音识别技术领域,尤其涉及一种智能化语音实时识别及展示方法。
背景技术
现今时代,话筒普遍存在,但对于听障人而言,并没有一款话筒产品能够很好地帮助到他们;全国范围内的听障人超过两千万人,由于该人群无法与健听人直接进行语言交流,从而造成这样一个庞大的群体一直生活在社会的边缘,他们很难真正融入这个社会。如今,听障人与健听人沟通主要通过以下两种途径:手语翻译员翻译和佩戴助听器。由于手语翻译员人才十分稀缺,其次大多数交流场景都是随机出现的,很难保证手语翻译员及时出现在听障人身边;再加上聘用专职手语翻译员花费较大,一般听障人很难承担。对于不同的听障人,助听器的效果不尽相同,佩戴助听器对于神经性耳聋患者效果甚微。长久佩戴助听器会导致耳朵很不舒服,还有可能引发中耳炎等不良后果。
随着科技的发展和人们生活水平的不断提高,手机、平板电脑等智能终端已成为人们日常生活中一种常见的消费类电子产品。如果结合智能终端的便利性和语音识别技术将会给听障人与健听人之间的沟通带来很大的便利。
发明内容
基于背景技术存在的技术问题,本发明提出了一种智能化语音实时识别及展示方法;
本发明提出的一种智能化语音实时识别及展示方法,包括:
S1、采集待翻译语音信息;
S2、将待翻译语音信息转换为目标文字信息;
S3、根据目标文字信息在预设的文字手语对照数据库检索与目标文字信息匹配的目标手语信息;
S4、展示目标文字信息,和/或展示目标手语信息。
优选地,步骤S1,具体包括:
采用智能移动终端的麦克风采集待翻译语音信息,所述智能移动终端包括智能手机、平板电脑、智能手表等其他移动通讯设备。
优选地,步骤S3中,所述文字手语对照数据库,具体包括:文字手语对照数据库中包括与文字信息一一对应的手语信息。
优选地,步骤S3中,所述目标手语信息,具体包括:手语视频信息、手语动画信息、手语图片信息中一者或多者。
优选地,步骤S4,具体包括:
通过智能移动终端的显示屏展示目标文字信息,和/或展示目标手语信息,所述智能移动终端包括智能手机、平板电脑、智能手表等其他移动通讯设备。
优选地,还包括步骤S5,将目标文字信息和目标手语信息上传至云端服务器进行存储。
优选地,步骤S4,还包括:在展示目标文字信息,和/或展示目标手语信息的过程中,可根据用户指令调整展示速度和展示次数。
本发明通过采集待翻译语音信息,将待翻译语音信息转换为目标文字信息,根据目标文字信息在预设的文字手语对照数据库检索与目标文字信息匹配的目标手语信息,展示目标文字信息,和/或展示目标手语信息,如此,当听障人在与健听人进行交流时,通过采集健听人的语音信息并转换为文字信息和手语信息,然后通过智能移动终端向听障人展示这些文字信息和手语信息,帮助该听障人理解健听人所讲的话的内容,实现了方便、快捷、有效的语音翻译。
附图说明
图1为本发明提出的一种智能化语音实时识别及展示方法的流程示意图。
具体实施方式
参照图1,本发明提出的一种智能化语音实时识别及展示方法,包括:
步骤S1,采集待翻译语音信息,具体包括:采用智能移动终端的麦克风采集待翻译语音信息,所述智能移动终端包括智能手机、平板电脑、智能手表等其他移动通讯设备。
在具体方案中,可通过麦克风采集健听人的语音信息,目前,手机作为人手必备的电子产品,手机上的麦克风即可采集语音信息,同样其他移动通讯设备可通过自带的麦克风采集健听人的待翻译语音信息。
步骤S2,将待翻译语音信息转换为目标文字信息。
在具体方案中,采集待翻译语音信息后,通过语音识别技术即可将待翻译语音信息转换为目标文字信息。
步骤S3,根据目标文字信息在预设的文字手语对照数据库检索与目标文字信息匹配的目标手语信息,其中,所述文字手语对照数据库中包括与文字信息一一对应的手语信息,所述目标手语信息包括手语视频信息、手语动画信息、手语图片信息中一者或多者。
在具体方案中,建立文字手语对照数据库,在得到目标手语信息后,即可在文字手语对照数据库检索与目标手语信息匹配的手语信息,其中,手语信息包括手语视频信息、手语动画信息、手语图片信息。
步骤S4,展示目标文字信息,和/或展示目标手语信息,具体包括:通过智能移动终端的显示屏展示目标文字信息,和/或展示目标手语信息,所述智能移动终端包括智能手机、平板电脑、智能手表等其他移动通讯设备,进一步的,在展示目标文字信息,和/或展示目标手语信息的过程中,可根据用户指令调整展示速度和展示次数
在具体方案中,手机上的显示屏可展示目标文字信息,和/或展示目标手语信息,同样其他移动通讯设备自带的显示屏可方便快捷的向听障人展示标文字信息,和/或展示目标手语信息,方便听障人与健听人之间进行沟通,通过调整展示速度和展示次数让听障人更易懂。
步骤S5,将目标文字信息和目标手语信息上传至云端服务器进行存储。
在具体方案中,通过将目标文字信息和目标手语信息上传至云端服务器进行存储,可方便听障人对目标文字信息和目标手语信息进行后续观看。
本实施方式通过采集待翻译语音信息,将待翻译语音信息转换为目标文字信息,根据目标文字信息在预设的文字手语对照数据库检索与目标文字信息匹配的目标手语信息,展示目标文字信息,和/或展示目标手语信息,如此,当听障人在与健听人进行交流时,通过采集健听人的语音信息并转换为文字信息和手语信息,然后通过智能移动终端向听障人展示这些文字信息和手语信息,帮助该听障人理解健听人所讲的话的内容,实现了方便、快捷、有效的语音翻译。以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (7)

1.一种智能化语音实时识别及展示方法,其特征在于,包括:
S1、采集待翻译语音信息;
S2、将待翻译语音信息转换为目标文字信息;
S3、根据目标文字信息在预设的文字手语对照数据库检索与目标文字信息匹配的目标手语信息;
S4、展示目标文字信息,和/或展示目标手语信息。
2.根据权利要求1所述的智能化语音实时识别及展示方法,其特征在于,步骤S1,具体包括:
采用智能移动终端的麦克风采集待翻译语音信息,所述智能移动终端包括智能手机、平板电脑、智能手表等其他移动通讯设备。
3.根据权利要求1所述的智能化语音实时识别及展示方法,其特征在于,步骤S3中,所述文字手语对照数据库,具体包括:文字手语对照数据库中包括与文字信息一一对应的手语信息。
4.根据权利要求1所述的智能化语音实时识别及展示方法,其特征在于,步骤S3中,所述目标手语信息,具体包括:手语视频信息、手语动画信息、手语图片信息中一者或多者。
5.根据权利要求1所述的智能化语音实时识别及展示方法,其特征在于,步骤S4,具体包括:
通过智能移动终端的显示屏展示目标文字信息,和/或展示目标手语信息,所述智能移动终端包括智能手机、平板电脑、智能手表等其他移动通讯设备。
6.根据权利要求1所述的智能化语音实时识别及展示方法,其特征在于,还包括步骤S5,将目标文字信息和目标手语信息上传至云端服务器进行存储。
7.根据权利要求1所述的智能化语音实时识别及展示方法,其特征在于,步骤S4,还包括:在展示目标文字信息,和/或展示目标手语信息的过程中,可根据用户指令调整展示速度和展示次数。
CN201711277421.9A 2017-12-06 2017-12-06 一种智能化语音实时识别及展示方法 Pending CN108074569A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711277421.9A CN108074569A (zh) 2017-12-06 2017-12-06 一种智能化语音实时识别及展示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711277421.9A CN108074569A (zh) 2017-12-06 2017-12-06 一种智能化语音实时识别及展示方法

Publications (1)

Publication Number Publication Date
CN108074569A true CN108074569A (zh) 2018-05-25

Family

ID=62158034

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711277421.9A Pending CN108074569A (zh) 2017-12-06 2017-12-06 一种智能化语音实时识别及展示方法

Country Status (1)

Country Link
CN (1) CN108074569A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110730360A (zh) * 2019-10-25 2020-01-24 北京达佳互联信息技术有限公司 视频上传、播放的方法、装置、客户端设备及存储介质
CN111147894A (zh) * 2019-12-09 2020-05-12 苏宁智能终端有限公司 一种手语视频的生成方法、装置及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116576A (zh) * 2013-01-29 2013-05-22 安徽安泰新型包装材料有限公司 一种语音手势交互翻译装置及其控制方法
CN105206123A (zh) * 2015-10-27 2015-12-30 苏州大学 一种聋哑患者交流装置
CN105913015A (zh) * 2016-04-07 2016-08-31 安徽大学 一种手语识别转换系统
CN105957514A (zh) * 2016-07-11 2016-09-21 吉林宇恒光电仪器有限责任公司 一种便携式聋哑人交流设备
CN106295603A (zh) * 2016-08-18 2017-01-04 广东技术师范学院 汉语手语双向翻译系统、方法和装置
CN206179322U (zh) * 2016-07-29 2017-05-17 东莞市飞扬塑胶模具有限公司 一种手语翻译手环
CN106943740A (zh) * 2017-04-25 2017-07-14 合肥充盈信息科技有限公司 一种手语语音游戏互动系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116576A (zh) * 2013-01-29 2013-05-22 安徽安泰新型包装材料有限公司 一种语音手势交互翻译装置及其控制方法
CN105206123A (zh) * 2015-10-27 2015-12-30 苏州大学 一种聋哑患者交流装置
CN105913015A (zh) * 2016-04-07 2016-08-31 安徽大学 一种手语识别转换系统
CN105957514A (zh) * 2016-07-11 2016-09-21 吉林宇恒光电仪器有限责任公司 一种便携式聋哑人交流设备
CN206179322U (zh) * 2016-07-29 2017-05-17 东莞市飞扬塑胶模具有限公司 一种手语翻译手环
CN106295603A (zh) * 2016-08-18 2017-01-04 广东技术师范学院 汉语手语双向翻译系统、方法和装置
CN106943740A (zh) * 2017-04-25 2017-07-14 合肥充盈信息科技有限公司 一种手语语音游戏互动系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110730360A (zh) * 2019-10-25 2020-01-24 北京达佳互联信息技术有限公司 视频上传、播放的方法、装置、客户端设备及存储介质
CN111147894A (zh) * 2019-12-09 2020-05-12 苏宁智能终端有限公司 一种手语视频的生成方法、装置及系统

Similar Documents

Publication Publication Date Title
US11153430B2 (en) Information presentation method and device
CN104464716B (zh) 一种语音播报系统和方法
CN103918284B (zh) 语音控制装置、语音控制方法和程序
TWI779113B (zh) 音頻活動追蹤及概括的裝置、方法、設備以及電腦可讀儲存媒體
CN111669515B (zh) 一种视频生成方法及相关装置
US20200058302A1 (en) Lip-language identification method and apparatus, and augmented reality device and storage medium
EP3035718A1 (en) Method for outputting text data content as voice of text data sender
CN109074117A (zh) 用于提升记忆力与作决策的以个人情绪为基础的计算机可读取认知感觉内存储器及认知洞察力
EP2899609A1 (en) Wearable device, system and method for name recollection
CN107705251A (zh) 图片拼接方法、移动终端及计算机可读存储介质
CN109598003B (zh) 一种ar翻译装置及方法
CN103546623A (zh) 用于发送语音信息及其文本描述信息的方法、装置与设备
CN206711600U (zh) 基于虚拟现实环境的具有情感功能的语音交互系统
CN108256458A (zh) 一种针对聋人自然手语的双向实时翻译系统及方法
US9778734B2 (en) Memory aid method using audio/video data
CN107864353A (zh) 一种视频录制方法及移动终端
CN109166409B (zh) 一种手语转换方法及装置
CN108766416B (zh) 语音识别方法及相关产品
CN108877410A (zh) 一种聋哑人手语交互方法以及聋哑人手语交互装置
CN110166789A (zh) 监测视频直播敏感信息的方法、计算机设备及可读存储介质
CN108074569A (zh) 一种智能化语音实时识别及展示方法
CN108091335A (zh) 一种基于语音识别的实时语音翻译系统
CN110337041B (zh) 视频播放方法、装置、计算机设备及存储介质
CN103973670B (zh) 一种腕表的社区交友方法及其交友系统
CN204014003U (zh) 一种带增强现实显示器的耳机

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180525

RJ01 Rejection of invention patent application after publication