CN108877408A - 手语翻译装置及方法 - Google Patents

手语翻译装置及方法 Download PDF

Info

Publication number
CN108877408A
CN108877408A CN201810661819.0A CN201810661819A CN108877408A CN 108877408 A CN108877408 A CN 108877408A CN 201810661819 A CN201810661819 A CN 201810661819A CN 108877408 A CN108877408 A CN 108877408A
Authority
CN
China
Prior art keywords
matching
model
module
sign language
display module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810661819.0A
Other languages
English (en)
Inventor
邱雁
杜昌恒
杨健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Dongyi Medical Equipment Co Ltd
Original Assignee
Guizhou Dongyi Medical Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou Dongyi Medical Equipment Co Ltd filed Critical Guizhou Dongyi Medical Equipment Co Ltd
Priority to CN201810661819.0A priority Critical patent/CN108877408A/zh
Publication of CN108877408A publication Critical patent/CN108877408A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B21/00Teaching, or communicating with, the blind, deaf or mute
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B21/00Teaching, or communicating with, the blind, deaf or mute
    • G09B21/009Teaching or communicating with deaf persons

Abstract

本发明涉及手语翻译技术领域,提供一种手语翻译装置及方法。该装置包括存储模块、深度摄像机、处理模块、第一显示模块以及第二显示模块。除处理模块以外的各模块均与处理模块连接。存储模块存储标准手语的多个第一3D模型以及对应的文字信息;深度摄像机对第一手势进行拍摄获得第一深度图像;处理模块基于第一深度图像建立第一手势的第二3D模型,并确定第一匹配3D模型以及第一匹配文字信息;第一显示模块显示第一匹配3D模型以及第一匹配文字信息;第二显示模块显示第一匹配文字信息。该装置能够自动实现实时的手语翻译并且使聋哑人与普通人都可以实时查看手语翻译的结果,确保翻译结果的准确性。

Description

手语翻译装置及方法
技术领域
本发明涉及手语翻译技术领域,具体而言,涉及一种手语翻译装置及方法。
背景技术
随着社会进步,对于聋哑人的关怀不断加大。对于聋哑人而言,由于无法通过声带表达语言,因此在与他人交流时通常使用手语。然而,掌握手语的人毕竟是少数,因此对于绝大多数普通人而言,仍然难以和聋哑人之间进行正常交流,通常需要掌握手语的第三方人士充当翻译,其沟通效率较为低下,并且在日常生活中,并不容易找到这样的第三方人士。
发明内容
有鉴于此,本发明实施例提供了一种手语翻译装置及方法,以解决上述技术问题。
为实现上述目的,本发明提供如下技术方案:
第一方面,本发明实施例提供一种手语翻译装置,包括:
存储模块,用于存储标准手语的多个第一3D模型,以及与多个第一3D模型中的每个第一3D模型对应的文字信息;
深度摄像机,用于对第一手势进行拍摄,获得包含第一手势的第一深度图像;
处理模块,分别与存储模块以及深度摄像机连接,用于基于第一深度图像建立第一手势的第二3D模型,并确定多个第一3D模型中与第二3D模型匹配的第一匹配3D模型以及与第一匹配3D模型对应的第一匹配文字信息;
第一显示模块,与处理模块连接,用于显示第一匹配3D模型以及第一匹配文字信息;
第二显示模块,与处理模块连接,用于显示第一匹配文字信息。
可见,该手语翻译装置能够实时将第一手势翻译为第一匹配文字信息,并通过第一显示模块向聋哑人显示第一匹配3D模型以及第一匹配文字信息,以及通过第二显示模块向普通人显示第一匹配文字信息。从而,聋哑人能够通过第一显示模块确认手语翻译结果是否正确,以便采取相应的措施,同时普通人可以直接观看到手语翻译结果,获知聋哑人想表达的内容。该装置大大简化了聋哑人与普通人之间的交流方式,无需第三方人士介入即可自动实现手语翻译,并且使沟通双方都可以实时查看手语翻译的结果,确保翻译结果的准确性。
结合第一方面,在第一方面的第一种可能的实现方式中,处理模块还用于在接收到模型修订指令时,控制深度摄像机对第二手势进行拍摄,获得包含第二手势的第二深度图像,基于第二深度图像建立第二手势的第三3D模型,并确定多个第一3D模型中与第三3D模型匹配的第二匹配3D模型以及与第二匹配3D模型对应的第二匹配文字信息;
第一显示模块还用于将第一匹配3D模型更新显示为第二匹配3D模型,以及将第一匹配文字信息更新显示为第二匹配文字信息;
第二显示模块还用于将第一匹配文字信息更新显示为第二匹配文字信息。
如果聋哑人通过第一显示模块发现第一匹配文字信息存在翻译错误,可以通过向处理模块下达模型修订指令,并在深度摄像机前作出替代第一手势的第二手势,以实现翻译错误的修订,确保意思表达的准确性。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,手语翻译装置还包括:
修订模块,与处理模块连接,用于选中第一匹配3D模型和/或第一匹配文字信息,并在第一匹配3D模型和/或第一匹配文字信息被选中时产生模型修订指令。
聋哑人下达模型修订指令可以通过修订模块进行下达。
结合第一方面的第一种可能的实现方式,在第一方面的第三种可能的实现方式中,手语翻译装置还包括:
通信模块,与处理模块连接,处理模块还用于将第一匹配3D模型、第一匹配文字信息、第二匹配3D模型以及第二匹配文字信息通过通信模块发送至服务器,以使服务器更新存储在服务器上的多个第一3D模型,以及用于通过通信模块从服务器获得更新后的多个第一3D模型并存储至存储模块。
若翻译存在错误,很有可能是标准手语的多个第一3D模型不够精确,可以将上述信息上传至服务器,以使服务器更新标准手语的多个第一3D模型,处理模块还可以将从服务器获取更新后的多个第一3D模型并存储至存储模块,以替换掉存储模块之前存储的多个第一3D模型,从而改善手语翻译的质量。
结合第一方面,或第一方面的第一种至第三种中的任意一种可能的实现方式,在第一方面的第四种可能的实现方式中,手语翻译装置还包括:
语音播放模块,与处理模块连接,用于播放与第一匹配文字信息对应的第一语音信息。
普通人除了通过第一匹配文字信息,还可以通过第一语音信息获知聋哑人想表达的内容,更为方便。
结合第一方面,或第一方面的第一种至第三种中的任意一种可能的实现方式,在第一方面的第五种可能的实现方式中,手语翻译装置还包括:
语音采集模块,与处理模块连接,用于采集获得第二语音信息,处理模块还用于将第二语音信息转化为第一文字信息,并控制第一显示模块显示第一文字信息,以及控制第二显示模块显示第一文字信息。
普通人与聋哑人之间的交流可以是双向交流,普通人可以通过语音采集模块录入交流内容。
结合第一方面,或第一方面的第一种至第三种中的任意一种可能的实现方式,在第一方面的第六种可能的实现方式中,手语翻译装置还包括:
文字输入模块,与处理模块连接,用于输入第二文字信息,处理模块还用于控制第一显示模块显示第二文字信息,以及控制第二显示模块显示第二文字信息。
除语音采集模块外,普通人还可以通过文字输入模块录入交流内容。
第二方面,本发明实施例提供一种手语翻译方法,应用于手语翻译装置中的处理模块,手语翻译装置包括存储模块、深度摄像机、处理模块、第一显示模块以及第二显示模块,存储模块、深度摄像机、第一显示模块以及第二显示模块均与处理模块连接,方法包括:
获得深度摄像机拍摄的包含第一手势的第一深度图像;
基于第一深度图像建立第一手势的第二3D模型;
获得存储模块存储的标准手语的多个第一3D模型,以及与多个第一3D模型中的每个第一3D模型对应的文字信息;
确定多个第一3D模型中与第二3D模型匹配的第一匹配3D模型以及与第一匹配3D模型对应的第一匹配文字信息;
控制第一显示模块显示第一匹配3D模型以及第一匹配文字信息;
控制第二显示模块显示第一匹配文字信息。
结合第二方面,在第二方面的第一种可能的实现方式中,控制第二显示模块显示第一匹配文字信息之后,方法还包括:
在接收到模型修订指令时,获得深度摄像机拍摄的包含第二手势的第二深度图像;
基于第二深度图像建立第二手势的第三3D模型;
确定多个第一3D模型中与第三3D模型匹配的第二匹配3D模型以及与第二匹配3D模型对应的第二匹配文字信息;
控制第一显示模块将第一匹配3D模型更新显示为第二匹配3D模型,以及将第一匹配文字信息更新显示为第二匹配文字信息;
控制第二显示模块将第一匹配文字信息更新显示为第二匹配文字信息。
结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,手语翻译装置还包括与处理模块连接的通信模块,控制第二显示模块将第一匹配文字信息更新显示为第二匹配文字信息之后,方法还包括:
将第一匹配3D模型、第一匹配文字信息、第二匹配3D模型以及第二匹配文字信息通过通信模块发送至服务器,以使服务器更新存储在服务器上的多个第一3D模型;
通过通信模块从服务器获得更新后的多个第一3D模型并存储至存储模块。
为使本发明的上述目的、技术方案和有益效果能更明显易懂,下文特举实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明第一实施例提供的手语翻译装置的功能模块图;
图2示出了本发明第一实施例提供的手语翻译装置的结构示意图;
图3示出了本发明第二实施例提供的手语翻译装置的功能模块图;
图4示出了本发明第三实施例提供的手语翻译装置的功能模块图。
图中:10-手语翻译装置;100-处理模块;110-存储模块;120-深度摄像机;130-第一显示模块;140-第二显示模块;150-语音播放模块;160-通信模块;170-语音采集模块;180-文字输入模块。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
第一实施例
图1示出了本发明第一实施例提供的手语翻译装置10的功能模块图。参照图1,手语翻译装置10包括存储模块110、深度摄像机120、处理模块100、第一显示模块130以及第二显示模块140。其中,存储模块110、深度摄像机120、第一显示模块130以及第二显示模块140均与处理模块100连接。
其中,存储模块110具有数据存储功能,用于存储对应于标准手语手势的多个第一3D模型,其中的每个第一3D模型对应一条文字信息,即该第一3D模型对应的标准手语手势的文字含义。存储模块110可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
图2示出了本发明第一实施例提供的手语翻译装置10的结构示意图。参照图2,手语翻译装置10用于协助聋哑人与普通人进行交流,在图2示出的实施方式中,聋哑人与普通人分别位于手语翻译装置10的两侧。深度摄像机120可以设置在手语识别装置靠近聋哑人的一侧,在某次交流时,聋哑人作出第一手势,深度摄像机120拍摄获得包含有第一手势的第一深度图像并将第一深度图像发送至处理模块100。
处理模块100可以是一种集成电路芯片,具有信号的处理能力。具体可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、微控制单元(Micro ControllerUnit,MCU)、网络处理器(Network Processor,NP)或者其他常规处理器;还可以是专用处理器,包括数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、现场可编程门阵列(Field Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
处理模块100从第一深度图像中分割出第一手势所在的区域,并根据第一深度图像中蕴含的深度信息重建出第一手势的第二3D模型。然后,处理模块100将第二3D模型与从存储模块110中读取出的多个第一3D模型依次对比,具体的对比方法可采用3D模型的形状匹配算法,进而将多个第一3D模型中与第二3D模型中相似度最高的第一3D模型确定为与第二3D模型匹配的第一匹配3D模型。可以理解,在其他一些实施方式中,第一匹配3D模型的确定准则也可以是其他准则,不一定是相似度最高。显然的,第一匹配3D模型对应一条文字信息,将其称之为第一匹配文字信息。
继续参照图2,第一显示模块130可以设置在手语识别装置靠近聋哑人的一侧,聋哑人可以观察靠第一显示模块130上显示的内容。第二显示模块140可以设置在手语识别装置靠近普通人的一侧,普通人可以观察到第二显示模块140上显示的内容。
具体而言,第一显示模块130上显示第一匹配3D模型以及第一匹配文字信息,使聋哑人获知手语翻译的结果,方便其确认翻译结果是否存在错误。由于实际中,聋哑人会连续做出多个手势,因此在显示时可以采用列表的方式,第一匹配3D模型以及第一匹配文字信息作为列表中的一项。
第二显示模块140上显示第一匹配文字信息,使普通人获知手语翻译的结果。考虑到普通人通常不掌握手语,因此第二显示模块140可以不显示第一匹配3D模型,当然在某些实施方式中,显示第一匹配3D模型也是可以的。
可以理解的,第一显示模块130以及第二显示模块140至少需要显示上述内容,还可以显示其他任何需要显示的内容。第一显示模块130以及第二显示模块140均可以采用液晶显示屏实现,当然采用其他显示设备实现也是可以的。
图2中,通过对向设置第一显示模块130以及第二显示模块140,在聋哑人与普通人之间实现了类似面对面交流的效果,用户体验较好,当然在其他一些实施方式中,第一显示模块130以及第二显示模块140还可以采取其他设置方式。
目前而言,手语翻译尚不能做到绝对正确,主要原因有两方面:第一,作为标准手语的多个第一3D模型不准确,由于聋哑人的首部外形、大小、姿态等都存在细微差异,第一3D模型并不能精确的反映这些差异,造成翻译错误。第二,聋哑人自身手势动作不标准,造成翻译错误。
由于聋哑人可以在第一显示模块130上直观地看到翻译结果,因此,在第一实施例的部分实施方式中,允许聋哑人对翻译错误进行修订,以便正确表达交流内容。
在第一实施例的一种实施方式中,手语翻译装置10还包括与处理模块100连接的修订模块(图1未示出)。聋哑人可以通过修订模块选中要进行修订的第一匹配3D模型和/或第一匹配文字信息,在第一匹配3D模型和/或第一匹配文字信息被选中时,修订模块产生相应的模型修订指令并发送至处理模块100。在一种实现方案中,修订模块和第一显示模块130集成在一起,例如第一显示模块130为触控屏,在触控屏上点击第一匹配3D模型和/或第一匹配文字信息的显示区域就可以进行选中。在另一种实现方式中,修订模块为独立的设备,例如方向按键和确认按键,通过按下方向按键使得第一显示模块130上的选中标识(例如光标、高亮标识等)移动至第一匹配3D模型和/或第一匹配文字信息的显示区域,再按下确认按键进行选中。
上述选中操作完成后,聋哑人在深度摄像机120前做出用于替代第一手势的第二手势,以便手语翻译装置10基于第二手势重新翻译错误的内容。处理模块100在接收到模型修订指令后,控制深度摄像机120对第二手势进行拍摄,获得包含第二手势的第二深度图像,并基于第二深度图像建立第二手势的第三3D模型,之后确定多个第一3D模型中与第三3D模型匹配的第二匹配3D模型以及与第二匹配3D模型对应的第二匹配文字信息,这一过程和对第一手势进行翻译的过程类似,此处不再详细阐述。
翻译完成后,处理模块100控制第一显示模块130将第一匹配3D模型更新显示为第二匹配3D模型,以及将第一匹配文字信息更新显示为第二匹配文字信息,以便聋哑人再次确认翻译结果是否正确。同时,同步控制第二显示模块140将第一匹配文字信息更新显示为第二匹配文字信息,以使普通人能够实时获知更新后的翻译结果。当然,如果因为某些特殊原因,例如聋哑人对手势的记忆错误,无法做出正确的手势,聋哑人也可以直接通过文字输入等方式修订翻译结果。
进一步的,继续参照图1,在第一实施例的某些实施方式中,手语翻译装置10还可以包括语音播放模块150。处理模块100基于第一匹配文字信息进行人工语音合成,并控制语音播放模块150播放合成的第一语音信息,以使普通人能够方便地获知聋哑人所要表达的内容。对于一些不愿意通过观察第二显示模块140进行交流的人群,例如视力不佳的老年人,此种实施方式更能满足其需求。语音播放模块150可以采用,但不限于采用扬声器实现。
综上所述,第一实施例提供的手语翻译装置10,能够通过3D模型匹配的方式,实时将聋哑人的手势翻译对应的文字信息,同时通过第一显示模块130以及第二显示模块140分别向聋哑人以及普通人展现翻译结果,大大简化了聋哑人与普通人之间的交流方式,并且聋哑人在发现翻译结果存在错误时,还可以重新进行手势录入,以使手语翻译装置10修订翻译结果,确保翻译结果的准确性,保障交流的正常进行。在一种实施方式中,手语翻译装置10还可以包括语音播放模块150,通过语音方式向普通人传达手语内容,改善用户体验。
第二实施例
图3示出了本发明第二实施例提供的手语翻译装置10的功能模块图。参照图3,第二实施例中的手语翻译装置10与第一实施例相比,还包括与处理模块100连接的通信模块160,同时通信模块160还与远端的服务器(图3未示出)通信连接。这里所称的通信连接,可以是有线的或者无线的方式。对于无线的方式,通信模块160可以是移动通信模块160、Wi-Fi模块、蓝牙模块、NB-IoT模块以及Zigbee模块等。
在聋哑人对翻译结果进行修订后,处理模块100将第一匹配3D模型、第一匹配文字信息、第二匹配3D模型以及第二匹配文字信息通过通信模块160发送至服务器,服务器上存储有标准手语的多个第一3D模型,服务器基于接收到的上述数据可以对多个第一3D模型进行更新,使得这些模型对于手势的描述更为精确。更新完毕后,服务器将更新后的多个第一3D模型通过通信模块160下发至处理模块100,当然在某些实施方式中,也可以是处理模块100定期发送请求去服务器上获取最新的多个第一3D模型。处理模块100进一步将获得的多个第一3D模型存储至存储模块110,将之前存储模块110内的旧模型替换掉或者进行更新,以使用于手语翻译的多个第一3D模型不断优化,改善翻译结果。
第二实施例与第一实施例相同之处,可以参考第一实施例中的描述,此处不再重复阐述。
第三实施例
图4示出了本发明第三实施例提供的手语翻译装置10的功能模块图。参照图4,第三实施例中的手语翻译装置10与第二实施例相比,还包括与处理模块100连接的语音采集模块170以及与处理模块100连接的文字输入模块180。
在第三实施例中,手语翻译装置10支持聋哑人与普通人之间的双向交流,即聋哑人可以通过做出手势将交流内容传达给普通人,普通人也可以将交流内容以文字的方式传达给聋哑人。
具体而言,语音采集模块170采集获得普通人说话形成的第二语音信息并将其发送至处理模块100,处理模块100通过语音识别将第二语音信息转化为第一文字信息,之后控制第一显示模块130显示第一文字信息以使聋哑人获知,当然也可以在第二显示模块140上同步显示第一文字信息,以使普通人确认语音识别的结果是否正确。语音交流方式非常简单,如果结合语音播放模块150,对于普通人而言,与聋哑人交流和与普通人进行对话无异。语音采集模块170可以采用,但不限于采用拾音器实现。
普通人也可以直接通过文字输入模块180输入第二文字信息,实现与聋哑人的交流。处理模块100接收到第二文字信息后,控制第一显示模块130显示第二文字信息以使聋哑人获知,当然也可以在第二显示模块140上同步显示第二文字信息,以使普通人确认输入的内容是否正确。文字交流方式非常快速,对于普通人而言,与聋哑人交流和与普通人进行文字聊天无异。
在一种实现方案中,文字输入模块180和第二显示模块140集成在一起,例如第二显示模块140为触控屏,在触控屏上就能够通过虚拟键盘进行文字输入。在另一种实现方式中,修订模块为独立的设备,例如键盘,通过在键盘上打字进行文字输入。
第三实施例与第二实施例相同之处,可以参考第二实施例中的描述,此处不再重复阐述。
第四实施例
本发明第四实施例提供一种手语翻译方法,应用于本发明实施例提供的手语翻译装置10中的处理模块100,手语翻译装置10包括存储模块110、深度摄像机120、处理模块100、第一显示模块130以及第二显示模块140,存储模块110、深度摄像机120、第一显示模块130以及第二显示模块140均与处理模块100连接,方法包括:
处理模块100获得深度摄像机120拍摄的包含第一手势的第一深度图像;
处理模块100基于第一深度图像建立第一手势的第二3D模型;
处理模块100获得存储模块110存储的标准手语的多个第一3D模型,以及与多个第一3D模型中的每个第一3D模型对应的文字信息;
处理模块100确定多个第一3D模型中与第二3D模型匹配的第一匹配3D模型以及与第一匹配3D模型对应的第一匹配文字信息;
处理模块100控制第一显示模块130显示第一匹配3D模型以及第一匹配文字信息;
处理模块100控制第二显示模块140显示第一匹配文字信息。
在第四实施例的一种实施方式中,在处理模块100控制第二显示模块140显示第一匹配文字信息之后,该方法还可以包括:
处理模块100在接收到模型修订指令时,获得深度摄像机120拍摄的包含第二手势的第二深度图像;
处理模块100基于第二深度图像建立第二手势的第三3D模型;
处理模块100确定多个第一3D模型中与第三3D模型匹配的第二匹配3D模型以及与第二匹配3D模型对应的第二匹配文字信息;
处理模块100控制第一显示模块130将第一匹配3D模型更新显示为第二匹配3D模型,以及将第一匹配文字信息更新显示为第二匹配文字信息;
处理模块100控制第二显示模块140将第一匹配文字信息更新显示为第二匹配文字信息。
进一步的,手语翻译装置10还可以包括与处理模块100连接的通信模块160,在处理模块100控制第二显示模块140将第一匹配文字信息更新显示为第二匹配文字信息之后,该方法还可以包括:
处理模块100将第一匹配3D模型、第一匹配文字信息、第二匹配3D模型以及第二匹配文字信息通过通信模块160发送至服务器,以使服务器更新存储在服务器上的多个第一3D模型;
处理模块100通过通信模块160从服务器获得更新后的多个第一3D模型并存储至存储模块110。
本发明第四实施例提供的手语翻译方法,其实现原理及产生的技术效果和前述装置实施例相同,为简要描述,方法实施例部分未提及之处,可参考前述装置实施例中相应内容。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种手语翻译装置,其特征在于,包括:
存储模块,用于存储标准手语的多个第一3D模型,以及与所述多个第一3D模型中的每个第一3D模型对应的文字信息;
深度摄像机,用于对第一手势进行拍摄,获得包含所述第一手势的第一深度图像;
处理模块,分别与所述存储模块以及所述深度摄像机连接,用于基于所述第一深度图像建立所述第一手势的第二3D模型,并确定所述多个第一3D模型中与所述第二3D模型匹配的第一匹配3D模型,以及与所述第一匹配3D模型对应的第一匹配文字信息;
第一显示模块,与所述处理模块连接,用于显示所述第一匹配3D模型以及所述第一匹配文字信息;
第二显示模块,与所述处理模块连接,用于显示所述第一匹配文字信息。
2.根据权利要求1所述的手语翻译装置,其特征在于,所述处理模块还用于在接收到模型修订指令时,控制所述深度摄像机对第二手势进行拍摄,获得包含所述第二手势的第二深度图像,基于所述第二深度图像建立所述第二手势的第三3D模型,并确定所述多个第一3D模型中与所述第三3D模型匹配的第二匹配3D模型以及与所述第二匹配3D模型对应的第二匹配文字信息;
所述第一显示模块还用于将所述第一匹配3D模型更新显示为所述第二匹配3D模型,以及将所述第一匹配文字信息更新显示为所述第二匹配文字信息;
所述第二显示模块还用于将所述第一匹配文字信息更新显示为所述第二匹配文字信息。
3.根据权利要求2所述的手语翻译装置,其特征在于,所述手语翻译装置还包括:
修订模块,与所述处理模块连接,用于选中所述第一匹配3D模型和/或所述第一匹配文字信息,并在所述第一匹配3D模型和/或所述第一匹配文字信息被选中时产生所述模型修订指令。
4.根据权利要求2所述的手语翻译装置,其特征在于,所述手语翻译装置还包括:
通信模块,与所述处理模块连接,所述处理模块还用于将所述第一匹配3D模型、所述第一匹配文字信息、所述第二匹配3D模型以及所述第二匹配文字信息通过所述通信模块发送至服务器,以使所述服务器更新存储在所述服务器上的所述多个第一3D模型,以及用于通过所述通信模块从所述服务器获得更新后的所述多个第一3D模型并存储至所述存储模块。
5.根据权利要求1-4中任一项所述的手语翻译装置,其特征在于,所述手语翻译装置还包括:
语音播放模块,与所述处理模块连接,用于播放与所述第一匹配文字信息对应的第一语音信息。
6.根据权利要求1-4中任一项所述的手语翻译装置,其特征在于,所述手语翻译装置还包括:
语音采集模块,与所述处理模块连接,用于采集获得第二语音信息,所述处理模块还用于将所述第二语音信息转化为第一文字信息,并控制所述第一显示模块显示所述第一文字信息,以及控制所述第二显示模块显示所述第一文字信息。
7.根据权利要求1-4中任一项所述的手语翻译装置,其特征在于,所述手语翻译装置还包括:
文字输入模块,与所述处理模块连接,用于输入第二文字信息,所述处理模块还用于控制所述第一显示模块显示所述第二文字信息,以及控制所述第二显示模块显示所述第二文字信息。
8.一种手语翻译方法,其特征在于,应用于手语翻译装置中的处理模块,所述手语翻译装置包括存储模块、深度摄像机、处理模块、第一显示模块以及第二显示模块,所述存储模块、所述深度摄像机、所述第一显示模块以及所述第二显示模块均与所述处理模块连接,所述方法包括:
控制所述深度摄像机对第一手势进行拍摄,获得包含第一手势的第一深度图像;
基于所述第一深度图像建立所述第一手势的第二3D模型;
获得所述存储模块存储的标准手语的多个第一3D模型,以及与所述多个第一3D模型中的每个第一3D模型对应的文字信息;
确定所述多个第一3D模型中与所述第二3D模型匹配的第一匹配3D模型以及与所述第一匹配3D模型对应的第一匹配文字信息;
控制所述第一显示模块显示所述第一匹配3D模型以及所述第一匹配文字信息;
控制所述第二显示模块显示所述第一匹配文字信息。
9.根据权利要求8所述的手语翻译方法,其特征在于,所述控制所述第二显示模块显示所述第一匹配文字信息之后,所述方法还包括:
在接收到模型修订指令时,控制所述深度摄像机对第二手势进行拍摄,获得包含所述第二手势的第二深度图像;
基于所述第二深度图像建立所述第二手势的第三3D模型;
确定所述多个第一3D模型中与所述第三3D模型匹配的第二匹配3D模型以及与所述第二匹配3D模型对应的第二匹配文字信息;
控制所述第一显示模块将所述第一匹配3D模型更新显示为所述第二匹配3D模型,以及将所述第一匹配文字信息更新显示为所述第二匹配文字信息;
控制所述第二显示模块将所述第一匹配文字信息更新显示为所述第二匹配文字信息。
10.根据权利要求9所述的手语翻译方法,其特征在于,所述手语翻译装置还包括与所述处理模块连接的通信模块,所述控制所述第二显示模块将所述第一匹配文字信息更新显示为所述第二匹配文字信息之后,所述方法还包括:
将所述第一匹配3D模型、所述第一匹配文字信息、所述第二匹配3D模型以及所述第二匹配文字信息通过所述通信模块发送至服务器,以使所述服务器更新存储在所述服务器上的所述多个第一3D模型;
通过所述通信模块从所述服务器获得更新后的所述多个第一3D模型并存储至所述存储模块。
CN201810661819.0A 2018-06-25 2018-06-25 手语翻译装置及方法 Pending CN108877408A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810661819.0A CN108877408A (zh) 2018-06-25 2018-06-25 手语翻译装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810661819.0A CN108877408A (zh) 2018-06-25 2018-06-25 手语翻译装置及方法

Publications (1)

Publication Number Publication Date
CN108877408A true CN108877408A (zh) 2018-11-23

Family

ID=64294572

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810661819.0A Pending CN108877408A (zh) 2018-06-25 2018-06-25 手语翻译装置及方法

Country Status (1)

Country Link
CN (1) CN108877408A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110992783A (zh) * 2019-10-29 2020-04-10 东莞市易联交互信息科技有限责任公司 一种基于机器学习的手语翻译方法及翻译设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2257286A (en) * 1991-06-28 1993-01-06 Eric Francis Hobbs Apparatus for facilitating learning.
CN1918566A (zh) * 2004-02-13 2007-02-21 罗杰·佩恩 外国语交流辅助设备
CN102956132A (zh) * 2011-08-25 2013-03-06 鸿富锦精密工业(深圳)有限公司 手语翻译系统、手语翻译装置及手语翻译方法
CN103645876A (zh) * 2013-12-06 2014-03-19 百度在线网络技术(北京)有限公司 语音输入方法和装置
CN105957514A (zh) * 2016-07-11 2016-09-21 吉林宇恒光电仪器有限责任公司 一种便携式聋哑人交流设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2257286A (en) * 1991-06-28 1993-01-06 Eric Francis Hobbs Apparatus for facilitating learning.
CN1918566A (zh) * 2004-02-13 2007-02-21 罗杰·佩恩 外国语交流辅助设备
CN102956132A (zh) * 2011-08-25 2013-03-06 鸿富锦精密工业(深圳)有限公司 手语翻译系统、手语翻译装置及手语翻译方法
CN103645876A (zh) * 2013-12-06 2014-03-19 百度在线网络技术(北京)有限公司 语音输入方法和装置
CN105957514A (zh) * 2016-07-11 2016-09-21 吉林宇恒光电仪器有限责任公司 一种便携式聋哑人交流设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110992783A (zh) * 2019-10-29 2020-04-10 东莞市易联交互信息科技有限责任公司 一种基于机器学习的手语翻译方法及翻译设备

Similar Documents

Publication Publication Date Title
CN112771472B (zh) 提供实时产品交互协助的系统和方法
CN107622373B (zh) 面试系统
Cao et al. An exploratory study of augmented reality presence for tutoring machine tasks
CN109801194A (zh) 一种具有远程评价功能的跟随教学方法
CN109698920A (zh) 一种基于互联网教学平台的跟随教学系统
CN109801193A (zh) 一种具有语音评价功能的跟随教学系统
WO2017034720A1 (en) Gesture based annotations
CN107025213A (zh) 用于共享演示数据和注释的方法和设备
Eronen et al. Philosophy of science and the formalization of psychological theory
TW201131528A (en) System and method for learning concept map
Havard et al. A use case study comparing augmented reality (AR) and electronic document-based maintenance instructions considering tasks complexity and operator competency level
US11862302B2 (en) Automated transcription and documentation of tele-health encounters
CN109697906A (zh) 一种基于互联网教学平台的跟随教学方法和系统
CN107331225A (zh) 一种基于图形图像的互动作业生成方法
Lavric et al. Exploring low-cost visual assets for conveying assembly instructions in AR
CN108877408A (zh) 手语翻译装置及方法
CN110378329A (zh) 基于点阵笔的智能辅助练字系统
KR20180080154A (ko) 법률상담서비스를 위한 낱말 주머니[Bag of Words] 기반 자연어 처리 활용 방법 및 시스템
CN110222166A (zh) 问答服务提供方法、装置、设备、介质及沉浸式教练系统
CN109272214A (zh) 玻璃纤维叶片生产的培训指导方法、系统及ar眼镜
CN110111011A (zh) 一种教学质量监管方法、装置及电子设备
JP2020086075A (ja) 学習支援システム、プログラム
CN114879877A (zh) 状态数据同步方法、装置、设备及存储介质
KR101601744B1 (ko) 애니메이션을 이용한 어휘 학습 방법 및 그 시스템
Qi et al. Weakly-Supervised Emotion Transition Learning for Diverse 3D Co-speech Gesture Generation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181123

RJ01 Rejection of invention patent application after publication