CN105632497A - 一种语音输出方法、语音输出系统 - Google Patents

一种语音输出方法、语音输出系统 Download PDF

Info

Publication number
CN105632497A
CN105632497A CN201610004434.8A CN201610004434A CN105632497A CN 105632497 A CN105632497 A CN 105632497A CN 201610004434 A CN201610004434 A CN 201610004434A CN 105632497 A CN105632497 A CN 105632497A
Authority
CN
China
Prior art keywords
lip image
user
speech
voice
speech data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610004434.8A
Other languages
English (en)
Inventor
张春宇
吴春芸
陈翩翩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InfoVision Optoelectronics Kunshan Co Ltd
Original Assignee
InfoVision Optoelectronics Kunshan Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by InfoVision Optoelectronics Kunshan Co Ltd filed Critical InfoVision Optoelectronics Kunshan Co Ltd
Priority to CN201610004434.8A priority Critical patent/CN105632497A/zh
Publication of CN105632497A publication Critical patent/CN105632497A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/24Speech recognition using non-acoustical features
    • G10L15/25Speech recognition using non-acoustical features using position of the lips, movement of the lips or face analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72433User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72439User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for image or video messaging

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供一种语音输出方法,所述语音输出方法包括建立唇部图像语音数据库;获取唇部图像;根据所述唇部图像语音数据库查找到获取的所述唇部图像对应的语音数据;输出所述唇部图像对应的语音。本发明还提供一种使用上述语音输出方法的语音输出系统,本发明提供的语音输出方法及语音输出系统,根据所述唇部图像语音数据库查找到获取的所述唇部图像对应的语音数据后输出语音,实现了无声到有声沟通方式,其适用性广、抗干扰性好。

Description

一种语音输出方法、语音输出系统
技术领域
本发明涉及一种通信技术领域,特别涉及一种语音输出方法及语音输出系统。
背景技术
通信技术快速发展的现代社会,手机产品在通信方面带给了人们极大的便利,从蓝牙技术到无线上网都显示出了手机产品的强大功能。利用手机产品进行通话,成为了人们联系的主要方式。如今,摄像头也已经成为了手机的标准配置,随着手机功能的多样化,手机产品渐渐成为人们日常生活中的必需品。
现有的手机产品在通话时,都是利用语音通话技术,通过将人的语音信号转换为相应的电信号,再通过无线射频技术发送,接收方接收到信号后还原出原来的语音信号。
但现有的手机产品主要是对通话方的语音信号进行接收处理,没有考虑到具有语音障碍的人士无法使用语音进行通话,适用性不广泛,此外,在会议室、嘈杂的环境中利用语音进行通话容易打扰到他人,而且容易被人窃听,抗干扰性差。
因此,有必要提供改进的技术方案以克服现有技术中存在的以上技术问题。
发明内容
本发明要解决的主要技术问题是提供一种语音输出方法,其适用性广、抗干扰性好。
本发明提供一种语音输出方法,所述语音输出方法包括建立唇部图像语音数据库;获取唇部图像;根据所述唇部图像语音数据库查找到获取的所述唇部图像对应的语音数据;输出所述唇部图像对应的语音。
优选地,所述获取唇部图像的步骤包括调节摄像头的焦距、清晰度以及角度,以使所述摄像头能获取到用户的正面唇部图像。
优选地,所述建立唇部图像语音数据库的步骤包括提示用户输入语音信号;采集所述用户的唇部图像及所述唇部图像对应的语音数据;存储所述用户的唇部图像及所述唇部图像对应的语音数据。
优选地,采集所述用户的唇部图像及所述唇部图像对应的语音数据的步骤之后还包括若所述用户的唇部图像与所述唇部图像对应的语音数据存在延时,则对所述用户的唇部图像与所述唇部图像对应的语音数据进行同步处理。
优选地,采集所述用户的唇部图像及所述唇部图像对应的语音数据的步骤之后还包括对所述唇部图像对应的语音数据进行祛噪处理。
优选地,存储所述用户的唇部图像及所述唇部图像对应的语音数据的步骤包括提示用户输入唇部图像;输出所述唇部图像对应的语音;判断是否接收到用户输出的确认信息;若接收到所述用户输出的确认信息,则存储采集的所述用户的唇部图像及所述唇部图像对应的语音数据;若接收到所述用户输出的返回信息,则返回所述提示用户输入语音信号的步骤。
本发明还提供一种语音输出系统,所述语音输出系统包括数据库产生模块、唇部图像获取模块、语音输出模块。所述数据库产生模块用于建立唇部图像语音数据库。所述唇部图像获取模块用于获取唇部图像。所述语音输出模块用于根据所述唇部图像语音数据库查找到所述唇部图像对应的语音数据后,输出所述唇部图像对应的语音。
优选地,所述唇部图像获取模块包括摄像头、调节单元。所述摄像头用于获取所述唇部图像;所述调节单元用于调节摄像头的焦距、清晰度以及角度,以使所述摄像头能获取到用户的正面唇部图像。
优选地,所述数据库产生模块包括第一提示单元、采集单元及存储单元;所述第一提示单元,用于提示用户输入语音信号;所述采集单元,用于采集所述用户的唇部图像及所述唇部图像对应的语音数据;所述存储单元用于存储所述用户的唇部图像及所述唇部图像对应的语音数据。
优选地,所述数据库产生模块还包括测试单元;所述测试单元用于提示用户输入唇部图像,并输出所述唇部图像对应的语音,且在接收到所述用户输出的确认信息后控制所述存储单元存储采集的所述用户的唇部图像及所述唇部图像对应的语音数据。
发明提供的语音输出方法及语音输出系统能根据所述唇部图像语音数据库查找到获取的所述唇部图像对应的语音数据后输出语音,实现了无声到有声沟通方式,其适用性广、抗干扰性好。
通过以下参考附图的详细说明,本发明的其它方面和特征变得明显。但是应当知道,附图仅仅为解释的目的设计,而不是作为本发明的范围的限定,这是因为其应当参考附加的权利要求。还应当知道,除非另外指出,不必要依比例绘制附图,它们仅仅力图概念地说明此处描述的结构和流程。
附图说明
图1为本发明一实施方式的语音输出方法的流程示意图。
图2为本发明一实施方式的建立唇部图像语音数据库的流程示意图。
图3为本发明一实施方式的语音输出系统的结构示意图。
图4为本发明一实施方式的数据库产生模块的结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。
尽管本发明使用第一、第二、第三等术语来描述不同的元件、信号、端口、组件或部分,但是这些元件、信号、端口、组件或部分并不受这些术语的限制。这些术语仅是用来将一个元件、信号、端口、组件或部分与另一个元件、信号、端口、组件或部分区分开来。在本发明中,一个元件、端口、组件或部分与另一个元件、端口、组件或部分“相连”、“连接”,可以理解为直接电性连接,或者也可以理解为存在中间元件的间接电性连接。除非另有定义,否则本发明所使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域的普通技术人员所通常理解的意思。
图1为本发明一实施方式的语音输出方法的流程示意图。如图1所示,语音输出方法可以但不限于应用于电子设备例如手机之间的通话,语音输出方法包括如下步骤:
步骤S11:建立唇部图像语音数据库;
步骤S12:获取唇部图像;
具体地,可以但不限于通过摄像头等图像获取装置获取唇部图像。此外,可以通过调节摄像头的焦距、清晰度以及角度等等,使摄像头能获取到用户的更清晰的正面唇部图像。
步骤S13:根据唇部图像语音数据库查找到获取的唇部图像对应的语音数据;
具体地,可以但不限于通过多次循环的比较获取的唇部图像与唇部图像语音数据库中的唇部图像,找到唇部图像语音数据库中与获取的唇部图像最相似的唇部图像,并找到其对应的语音数据。
步骤S14:输出唇部图像对应的语音。
发明提供的语音输出方法能根据所述唇部图像语音数据库查找到获取的所述唇部图像对应的语音数据后输出语音,实现了无声到有声沟通方式,其适用性广、抗干扰性好。
图2为本发明一实施方式的建立唇部图像语音数据库的流程示意图。如图2所示,建立唇部图像语音数据库包括如下步骤:
步骤S111:提示用户输入语音信号;
具体地,可以利用麦克风播放提示语音或者显示屏显示提示文字提示用户输入语音信号,以用于建立唇部图像语音数据库。
步骤S112:采集用户的唇部图像及唇部图像对应的语音数据;
在本发明一实施方式中,步骤S112:采集所述用户的唇部图像及所述唇部图像对应的语音数据之后还可以对采集的唇部图像及唇部图像对应的语音数据进行处理,例如若所述用户的唇部图像与所述唇部图像对应的语音数据存在延时,则对所述用户的唇部图像与所述唇部图像对应的语音数据进行同步处理、和/或对所述唇部图像对应的语音数据进行祛噪处理等等。
步骤S113:存储用户的唇部图像及唇部图像对应的语音数据。
其中,为了保证存储的用户的唇部图像及其对应的语音数据的准确性,可以但不限于对采集的用户的唇部图像及唇部图像对应的语音数据进行测试。
具体地,步骤S113:存储用户的唇部图像及唇部图像对应的语音数据可以但不限于包括如下步骤:
提示用户输入唇部图像;
输出唇部图像对应的语音;
具体地,找到与用户输入的唇部图像最相似的采集的唇部图像后,将采集的唇部图像对应的语音数据输出。
判断是否接收到用户输出的确认信息;
具体地,用户人为的判断其输入的唇部图像是否与听到的语音匹配,若其输入的唇部图像与听到的语音匹配,则输出确认信息,若其输入的唇部图像与听到的语音不匹配,则输出返回信息。
若接收到所述用户输出的确认信息,则存储采集的所述用户的唇部图像及所述唇部图像对应的语音数据;
若接收到所述用户输出的返回信息,则返回步骤S111:提示用户输入语音信号。
发明提供的语音输出方法能根据所述唇部图像语音数据库查找到获取的所述唇部图像对应的语音数据后输出语音,实现了无声到有声沟通方式,其适用性广、抗干扰性好。此外,在建立唇部图像语音数据库时根据用户输出的确认信息确认存储的用户的唇部图像其对应的语音数据是否匹配,提高了语音输出方法的准确性。
图3为本发明一实施方式的语音输出系统的结构示意图。语音输出系统包括数据库产生模块30、唇部图像获取模块31、语音输出模块32。
数据库产生模块30用于建立唇部图像语音数据库。
唇部图像获取模块31用于获取唇部图像。
具体地,唇部图像获取模块31包括摄像头、调节单元。摄像头用于获取唇部图像;调节单元用于调节摄像头的焦距、清晰度以及角度,以使摄像头能获取到用户的正面唇部图像。
语音输出模块32用于根据唇部图像语音数据库查找到唇部图像对应的语音数据后,输出唇部图像对应的语音。
图4为本发明一实施方式的数据库产生模块30的结构示意图。如图4所示,数据库产生模块30包括第一提示单元300、采集单元301及存储单元302。
第一提示单元300,用于提示用户输入语音信号;采集单元301,用于采集用户的唇部图像及唇部图像对应的语音数据;存储单元302用于存储用户的唇部图像及唇部图像对应的语音数据。
在本发明一实施方式中,数据库产生模块还包括测试单元303。
测试单元303用于提示用户输入唇部图像,并输出唇部图像对应的语音,且在接收到用户输出的确认信息后控制存储单元302存储用户的唇部图像及唇部图像对应的语音数据。
发明提供的语音输出方法及语音输出系统能根据所述唇部图像语音数据库查找到获取的所述唇部图像对应的语音数据后输出语音,实现了无声到有声沟通方式,其适用性广、抗干扰性好。
本文中应用了具体个例对本发明的语音输出方法及语音输出系统及实施方式进行了阐述,以上实施方式的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制,本发明的保护范围应以所附的权利要求为准。

Claims (10)

1.一种语音输出方法,其特征在于,所述语音输出方法包括:
建立唇部图像语音数据库;
获取唇部图像;
根据所述唇部图像语音数据库查找到获取的所述唇部图像对应的语音数据;
输出所述唇部图像对应的语音。
2.如权利要求1所述的语音输出方法,其特征在于,所述获取唇部图像的步骤包括:
调节摄像头的焦距、清晰度以及角度,以使所述摄像头能获取到用户的正面唇部图像。
3.如权利要求1所述的语音输出方法,其特征在于,所述建立唇部图像语音数据库的步骤包括:
提示用户输入语音信号;
采集所述用户的唇部图像及所述唇部图像对应的语音数据;
存储所述用户的唇部图像及所述唇部图像对应的语音数据。
4.如权利要求3所述的语音输出方法,其特征在于,采集所述用户的唇部图像及所述唇部图像对应的语音数据的步骤之后还包括:
若所述用户的唇部图像与所述唇部图像对应的语音数据存在延时,则对所述用户的唇部图像与所述唇部图像对应的语音数据进行同步处理。
5.如权利要求3所述的语音输出方法,其特征在于,采集所述用户的唇部图像及所述唇部图像对应的语音数据的步骤之后还包括:
对所述唇部图像对应的语音数据进行祛噪处理。
6.如权利要求3至5任意一项所述的语音输出方法,其特征在于,存储所述用户的唇部图像及所述唇部图像对应的语音数据的步骤包括:
提示用户输入唇部图像;
输出所述唇部图像对应的语音;
判断是否接收到用户输出的确认信息;
若接收到所述用户输出的确认信息,则存储采集的所述用户的唇部图像及所述唇部图像对应的语音数据;
若接收到所述用户输出的返回信息,则返回所述提示用户输入语音信号的步骤。
7.一种语音输出系统,其特征在于,所述语音输出系统包括:
数据库产生模块,用于建立唇部图像语音数据库;
唇部图像获取模块,用于获取唇部图像;
语音输出模块,用于根据所述唇部图像语音数据库查找到所述唇部图像对应的语音数据后,输出所述唇部图像对应的语音。
8.如权利要求7所述的语音输出系统,其特征在于,所述唇部图像获取模块包括:
摄像头,所述摄像头用于获取所述唇部图像;
调节单元,所述调节单元用于调节摄像头的焦距、清晰度以及角度,以使所述摄像头能获取到用户的正面唇部图像。
9.如权利要求7所述的语音输出系统,其特征在于,所述数据库产生模块包括:
第一提示单元,用于提示用户输入语音信号;
采集单元,用于采集所述用户的唇部图像及所述唇部图像对应的语音数据;
存储单元,用于存储所述用户的唇部图像及所述唇部图像对应的语音数据。
10.如权利要求9所述的语音输出系统,其特征在于,所述数据库产生模块还包括:
测试单元,所述测试单元用于提示用户输入唇部图像,并输出所述唇部图像对应的语音,且在接收到所述用户输出的确认信息后控制所述存储单元存储采集单元采集的所述用户的唇部图像及所述唇部图像对应的语音数据。
CN201610004434.8A 2016-01-06 2016-01-06 一种语音输出方法、语音输出系统 Pending CN105632497A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610004434.8A CN105632497A (zh) 2016-01-06 2016-01-06 一种语音输出方法、语音输出系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610004434.8A CN105632497A (zh) 2016-01-06 2016-01-06 一种语音输出方法、语音输出系统

Publications (1)

Publication Number Publication Date
CN105632497A true CN105632497A (zh) 2016-06-01

Family

ID=56047342

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610004434.8A Pending CN105632497A (zh) 2016-01-06 2016-01-06 一种语音输出方法、语音输出系统

Country Status (1)

Country Link
CN (1) CN105632497A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197572A (zh) * 2018-01-02 2018-06-22 京东方科技集团股份有限公司 一种唇语识别方法和移动终端
CN108538283A (zh) * 2018-03-15 2018-09-14 上海电力学院 一种由唇部图像特征到语音编码参数的转换方法
CN108538282A (zh) * 2018-03-15 2018-09-14 上海电力学院 一种由唇部视频直接生成语音的方法
CN108648745A (zh) * 2018-03-15 2018-10-12 上海电力学院 一种由唇部图像序列到语音编码参数的转换方法
JP2019208138A (ja) * 2018-05-29 2019-12-05 住友電気工業株式会社 発話認識装置、及びコンピュータプログラム

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS603793A (ja) * 1983-06-21 1985-01-10 Agency Of Ind Science & Technol 口唇情報解析装置
CN1556496A (zh) * 2003-12-31 2004-12-22 天津大学 唇形识别发声器
CN1624764A (zh) * 2003-12-04 2005-06-08 乐金电子(中国)研究开发中心有限公司 便携终端机的语音识别方法
CN1702691A (zh) * 2005-07-11 2005-11-30 北京中星微电子有限公司 基于语音的彩色人脸合成方法、系统及其着色方法、装置
CN101101752A (zh) * 2007-07-19 2008-01-09 华中科技大学 基于视觉特征的单音节语言唇读识别系统
CN101321387A (zh) * 2008-07-10 2008-12-10 中国移动通信集团广东有限公司 基于通信系统的声纹识别方法及系统
CN101482976A (zh) * 2009-01-19 2009-07-15 腾讯科技(深圳)有限公司 语音驱动嘴唇形状变化的方法、获取嘴唇动画的方法及装置
CN101510256A (zh) * 2009-03-20 2009-08-19 深圳华为通信技术有限公司 一种口型语言的转换方法及装置
CN101751692A (zh) * 2009-12-24 2010-06-23 四川大学 语音驱动唇形动画的方法
CN102023703A (zh) * 2009-09-22 2011-04-20 现代自动车株式会社 组合唇读与语音识别的多模式界面系统
CN201986001U (zh) * 2010-12-31 2011-09-21 上海华勤通讯技术有限公司 口型识别输入移动终端
CN202352332U (zh) * 2011-11-30 2012-07-25 李扬德 一种便携式唇语识别器
CN103745723A (zh) * 2014-01-13 2014-04-23 苏州思必驰信息科技有限公司 一种音频信号识别方法及装置
CN104199545A (zh) * 2014-08-28 2014-12-10 青岛海信移动通信技术股份有限公司 一种基于口型执行预设操作的方法及装置
CN104484656A (zh) * 2014-12-26 2015-04-01 安徽寰智信息科技股份有限公司 基于深度学习的唇语识别唇形模型库构建方法
CN104504088A (zh) * 2014-12-26 2015-04-08 安徽寰智信息科技股份有限公司 一种用于唇语识别的唇形模型库构建方法
CN104838339A (zh) * 2013-01-07 2015-08-12 日立麦克赛尔株式会社 便携终端装置以及信息处理系统
CN105022470A (zh) * 2014-04-17 2015-11-04 中兴通讯股份有限公司 一种基于唇读的终端操作方法及装置

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS603793A (ja) * 1983-06-21 1985-01-10 Agency Of Ind Science & Technol 口唇情報解析装置
CN1624764A (zh) * 2003-12-04 2005-06-08 乐金电子(中国)研究开发中心有限公司 便携终端机的语音识别方法
CN1556496A (zh) * 2003-12-31 2004-12-22 天津大学 唇形识别发声器
CN1702691A (zh) * 2005-07-11 2005-11-30 北京中星微电子有限公司 基于语音的彩色人脸合成方法、系统及其着色方法、装置
CN101101752A (zh) * 2007-07-19 2008-01-09 华中科技大学 基于视觉特征的单音节语言唇读识别系统
CN101321387A (zh) * 2008-07-10 2008-12-10 中国移动通信集团广东有限公司 基于通信系统的声纹识别方法及系统
CN101482976A (zh) * 2009-01-19 2009-07-15 腾讯科技(深圳)有限公司 语音驱动嘴唇形状变化的方法、获取嘴唇动画的方法及装置
CN101510256A (zh) * 2009-03-20 2009-08-19 深圳华为通信技术有限公司 一种口型语言的转换方法及装置
CN102023703A (zh) * 2009-09-22 2011-04-20 现代自动车株式会社 组合唇读与语音识别的多模式界面系统
CN101751692A (zh) * 2009-12-24 2010-06-23 四川大学 语音驱动唇形动画的方法
CN201986001U (zh) * 2010-12-31 2011-09-21 上海华勤通讯技术有限公司 口型识别输入移动终端
CN202352332U (zh) * 2011-11-30 2012-07-25 李扬德 一种便携式唇语识别器
CN104838339A (zh) * 2013-01-07 2015-08-12 日立麦克赛尔株式会社 便携终端装置以及信息处理系统
CN103745723A (zh) * 2014-01-13 2014-04-23 苏州思必驰信息科技有限公司 一种音频信号识别方法及装置
CN105022470A (zh) * 2014-04-17 2015-11-04 中兴通讯股份有限公司 一种基于唇读的终端操作方法及装置
CN104199545A (zh) * 2014-08-28 2014-12-10 青岛海信移动通信技术股份有限公司 一种基于口型执行预设操作的方法及装置
CN104484656A (zh) * 2014-12-26 2015-04-01 安徽寰智信息科技股份有限公司 基于深度学习的唇语识别唇形模型库构建方法
CN104504088A (zh) * 2014-12-26 2015-04-08 安徽寰智信息科技股份有限公司 一种用于唇语识别的唇形模型库构建方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197572A (zh) * 2018-01-02 2018-06-22 京东方科技集团股份有限公司 一种唇语识别方法和移动终端
CN108197572B (zh) * 2018-01-02 2020-06-12 京东方科技集团股份有限公司 一种唇语识别方法和移动终端
CN108538283A (zh) * 2018-03-15 2018-09-14 上海电力学院 一种由唇部图像特征到语音编码参数的转换方法
CN108538282A (zh) * 2018-03-15 2018-09-14 上海电力学院 一种由唇部视频直接生成语音的方法
CN108648745A (zh) * 2018-03-15 2018-10-12 上海电力学院 一种由唇部图像序列到语音编码参数的转换方法
CN108538283B (zh) * 2018-03-15 2020-06-26 上海电力学院 一种由唇部图像特征到语音编码参数的转换方法
CN108648745B (zh) * 2018-03-15 2020-09-01 上海电力学院 一种由唇部图像序列到语音编码参数的转换方法
CN108538282B (zh) * 2018-03-15 2021-10-08 上海电力学院 一种由唇部视频直接生成语音的方法
JP2019208138A (ja) * 2018-05-29 2019-12-05 住友電気工業株式会社 発話認識装置、及びコンピュータプログラム

Similar Documents

Publication Publication Date Title
CN107464557B (zh) 通话录音方法、装置、移动终端及存储介质
US10728656B1 (en) Audio device and audio processing method
CN208507180U (zh) 一种便携式智能语音交互控制设备
CN105632497A (zh) 一种语音输出方法、语音输出系统
US9106447B2 (en) Systems, methods and apparatus for providing unread message alerts
CN106024014B (zh) 一种语音转换方法、装置及移动终端
CN102231865B (zh) 一种蓝牙耳机
CN108538320B (zh) 录音控制方法和装置、可读存储介质、终端
CN106055364A (zh) 一种启动应用方法及终端设备
CA2376374C (en) Wearable computer system and modes of operating the system
CN102984666B (zh) 一种通话过程中的通讯录语音信息处理方法及系统
US9413862B2 (en) Apparatus enabling automatically adjusting functions of components thereof
CN108924706A (zh) 蓝牙耳机切换控制方法、蓝牙耳机及计算机可读存储介质
CN108549206A (zh) 一种带具有语音交互功能耳机的智能手表
CN104123937A (zh) 提醒设置方法、装置和系统
KR20150040567A (ko) 휴대 기기에서 연관 정보 표시 방법 및 장치
CN105611014A (zh) 移动终端通话语音降噪方法及装置
KR102447381B1 (ko) 통화 중 인공지능 서비스를 제공하기 위한 방법 및 그 전자 장치
CN105532634A (zh) 超声波驱蚊方法、装置及系统
CN108777827A (zh) 无线耳机、音量调整方法及相关产品
CN104424073A (zh) 一种信息处理的方法及电子设备
CN103546617A (zh) 一种声音调节的方法及终端
CN106022071A (zh) 一种指纹解锁的方法及终端
CN106940997A (zh) 一种向语音识别系统发送语音信号的方法和装置
CN111696553A (zh) 一种语音处理方法、装置及可读介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 215301, 1, Longteng Road, Kunshan, Jiangsu, Suzhou

Applicant after: InfoVision Optoelectronics(Kunshan)Co.,Ltd.

Address before: 215301, 1, Longteng Road, Kunshan, Jiangsu, Suzhou

Applicant before: INFOVISION OPTOELECTRONICS (KUNSHAN) Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160601