CN105632497A - 一种语音输出方法、语音输出系统 - Google Patents
一种语音输出方法、语音输出系统 Download PDFInfo
- Publication number
- CN105632497A CN105632497A CN201610004434.8A CN201610004434A CN105632497A CN 105632497 A CN105632497 A CN 105632497A CN 201610004434 A CN201610004434 A CN 201610004434A CN 105632497 A CN105632497 A CN 105632497A
- Authority
- CN
- China
- Prior art keywords
- lip image
- user
- speech
- voice
- speech data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012790 confirmation Methods 0.000 claims description 10
- 238000012360 testing method Methods 0.000 claims description 6
- 230000001105 regulatory effect Effects 0.000 claims description 5
- 238000004891 communication Methods 0.000 abstract description 8
- 238000005516 engineering process Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 208000011293 voice disease Diseases 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
- G10L15/25—Speech recognition using non-acoustical features using position of the lips, movement of the lips or face analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/7243—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
- H04M1/72433—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/7243—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
- H04M1/72439—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for image or video messaging
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- General Business, Economics & Management (AREA)
- Business, Economics & Management (AREA)
- Computer Networks & Wireless Communication (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供一种语音输出方法,所述语音输出方法包括建立唇部图像语音数据库;获取唇部图像;根据所述唇部图像语音数据库查找到获取的所述唇部图像对应的语音数据;输出所述唇部图像对应的语音。本发明还提供一种使用上述语音输出方法的语音输出系统,本发明提供的语音输出方法及语音输出系统,根据所述唇部图像语音数据库查找到获取的所述唇部图像对应的语音数据后输出语音,实现了无声到有声沟通方式,其适用性广、抗干扰性好。
Description
技术领域
本发明涉及一种通信技术领域,特别涉及一种语音输出方法及语音输出系统。
背景技术
通信技术快速发展的现代社会,手机产品在通信方面带给了人们极大的便利,从蓝牙技术到无线上网都显示出了手机产品的强大功能。利用手机产品进行通话,成为了人们联系的主要方式。如今,摄像头也已经成为了手机的标准配置,随着手机功能的多样化,手机产品渐渐成为人们日常生活中的必需品。
现有的手机产品在通话时,都是利用语音通话技术,通过将人的语音信号转换为相应的电信号,再通过无线射频技术发送,接收方接收到信号后还原出原来的语音信号。
但现有的手机产品主要是对通话方的语音信号进行接收处理,没有考虑到具有语音障碍的人士无法使用语音进行通话,适用性不广泛,此外,在会议室、嘈杂的环境中利用语音进行通话容易打扰到他人,而且容易被人窃听,抗干扰性差。
因此,有必要提供改进的技术方案以克服现有技术中存在的以上技术问题。
发明内容
本发明要解决的主要技术问题是提供一种语音输出方法,其适用性广、抗干扰性好。
本发明提供一种语音输出方法,所述语音输出方法包括建立唇部图像语音数据库;获取唇部图像;根据所述唇部图像语音数据库查找到获取的所述唇部图像对应的语音数据;输出所述唇部图像对应的语音。
优选地,所述获取唇部图像的步骤包括调节摄像头的焦距、清晰度以及角度,以使所述摄像头能获取到用户的正面唇部图像。
优选地,所述建立唇部图像语音数据库的步骤包括提示用户输入语音信号;采集所述用户的唇部图像及所述唇部图像对应的语音数据;存储所述用户的唇部图像及所述唇部图像对应的语音数据。
优选地,采集所述用户的唇部图像及所述唇部图像对应的语音数据的步骤之后还包括若所述用户的唇部图像与所述唇部图像对应的语音数据存在延时,则对所述用户的唇部图像与所述唇部图像对应的语音数据进行同步处理。
优选地,采集所述用户的唇部图像及所述唇部图像对应的语音数据的步骤之后还包括对所述唇部图像对应的语音数据进行祛噪处理。
优选地,存储所述用户的唇部图像及所述唇部图像对应的语音数据的步骤包括提示用户输入唇部图像;输出所述唇部图像对应的语音;判断是否接收到用户输出的确认信息;若接收到所述用户输出的确认信息,则存储采集的所述用户的唇部图像及所述唇部图像对应的语音数据;若接收到所述用户输出的返回信息,则返回所述提示用户输入语音信号的步骤。
本发明还提供一种语音输出系统,所述语音输出系统包括数据库产生模块、唇部图像获取模块、语音输出模块。所述数据库产生模块用于建立唇部图像语音数据库。所述唇部图像获取模块用于获取唇部图像。所述语音输出模块用于根据所述唇部图像语音数据库查找到所述唇部图像对应的语音数据后,输出所述唇部图像对应的语音。
优选地,所述唇部图像获取模块包括摄像头、调节单元。所述摄像头用于获取所述唇部图像;所述调节单元用于调节摄像头的焦距、清晰度以及角度,以使所述摄像头能获取到用户的正面唇部图像。
优选地,所述数据库产生模块包括第一提示单元、采集单元及存储单元;所述第一提示单元,用于提示用户输入语音信号;所述采集单元,用于采集所述用户的唇部图像及所述唇部图像对应的语音数据;所述存储单元用于存储所述用户的唇部图像及所述唇部图像对应的语音数据。
优选地,所述数据库产生模块还包括测试单元;所述测试单元用于提示用户输入唇部图像,并输出所述唇部图像对应的语音,且在接收到所述用户输出的确认信息后控制所述存储单元存储采集的所述用户的唇部图像及所述唇部图像对应的语音数据。
发明提供的语音输出方法及语音输出系统能根据所述唇部图像语音数据库查找到获取的所述唇部图像对应的语音数据后输出语音,实现了无声到有声沟通方式,其适用性广、抗干扰性好。
通过以下参考附图的详细说明,本发明的其它方面和特征变得明显。但是应当知道,附图仅仅为解释的目的设计,而不是作为本发明的范围的限定,这是因为其应当参考附加的权利要求。还应当知道,除非另外指出,不必要依比例绘制附图,它们仅仅力图概念地说明此处描述的结构和流程。
附图说明
图1为本发明一实施方式的语音输出方法的流程示意图。
图2为本发明一实施方式的建立唇部图像语音数据库的流程示意图。
图3为本发明一实施方式的语音输出系统的结构示意图。
图4为本发明一实施方式的数据库产生模块的结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。
尽管本发明使用第一、第二、第三等术语来描述不同的元件、信号、端口、组件或部分,但是这些元件、信号、端口、组件或部分并不受这些术语的限制。这些术语仅是用来将一个元件、信号、端口、组件或部分与另一个元件、信号、端口、组件或部分区分开来。在本发明中,一个元件、端口、组件或部分与另一个元件、端口、组件或部分“相连”、“连接”,可以理解为直接电性连接,或者也可以理解为存在中间元件的间接电性连接。除非另有定义,否则本发明所使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域的普通技术人员所通常理解的意思。
图1为本发明一实施方式的语音输出方法的流程示意图。如图1所示,语音输出方法可以但不限于应用于电子设备例如手机之间的通话,语音输出方法包括如下步骤:
步骤S11:建立唇部图像语音数据库;
步骤S12:获取唇部图像;
具体地,可以但不限于通过摄像头等图像获取装置获取唇部图像。此外,可以通过调节摄像头的焦距、清晰度以及角度等等,使摄像头能获取到用户的更清晰的正面唇部图像。
步骤S13:根据唇部图像语音数据库查找到获取的唇部图像对应的语音数据;
具体地,可以但不限于通过多次循环的比较获取的唇部图像与唇部图像语音数据库中的唇部图像,找到唇部图像语音数据库中与获取的唇部图像最相似的唇部图像,并找到其对应的语音数据。
步骤S14:输出唇部图像对应的语音。
发明提供的语音输出方法能根据所述唇部图像语音数据库查找到获取的所述唇部图像对应的语音数据后输出语音,实现了无声到有声沟通方式,其适用性广、抗干扰性好。
图2为本发明一实施方式的建立唇部图像语音数据库的流程示意图。如图2所示,建立唇部图像语音数据库包括如下步骤:
步骤S111:提示用户输入语音信号;
具体地,可以利用麦克风播放提示语音或者显示屏显示提示文字提示用户输入语音信号,以用于建立唇部图像语音数据库。
步骤S112:采集用户的唇部图像及唇部图像对应的语音数据;
在本发明一实施方式中,步骤S112:采集所述用户的唇部图像及所述唇部图像对应的语音数据之后还可以对采集的唇部图像及唇部图像对应的语音数据进行处理,例如若所述用户的唇部图像与所述唇部图像对应的语音数据存在延时,则对所述用户的唇部图像与所述唇部图像对应的语音数据进行同步处理、和/或对所述唇部图像对应的语音数据进行祛噪处理等等。
步骤S113:存储用户的唇部图像及唇部图像对应的语音数据。
其中,为了保证存储的用户的唇部图像及其对应的语音数据的准确性,可以但不限于对采集的用户的唇部图像及唇部图像对应的语音数据进行测试。
具体地,步骤S113:存储用户的唇部图像及唇部图像对应的语音数据可以但不限于包括如下步骤:
提示用户输入唇部图像;
输出唇部图像对应的语音;
具体地,找到与用户输入的唇部图像最相似的采集的唇部图像后,将采集的唇部图像对应的语音数据输出。
判断是否接收到用户输出的确认信息;
具体地,用户人为的判断其输入的唇部图像是否与听到的语音匹配,若其输入的唇部图像与听到的语音匹配,则输出确认信息,若其输入的唇部图像与听到的语音不匹配,则输出返回信息。
若接收到所述用户输出的确认信息,则存储采集的所述用户的唇部图像及所述唇部图像对应的语音数据;
若接收到所述用户输出的返回信息,则返回步骤S111:提示用户输入语音信号。
发明提供的语音输出方法能根据所述唇部图像语音数据库查找到获取的所述唇部图像对应的语音数据后输出语音,实现了无声到有声沟通方式,其适用性广、抗干扰性好。此外,在建立唇部图像语音数据库时根据用户输出的确认信息确认存储的用户的唇部图像其对应的语音数据是否匹配,提高了语音输出方法的准确性。
图3为本发明一实施方式的语音输出系统的结构示意图。语音输出系统包括数据库产生模块30、唇部图像获取模块31、语音输出模块32。
数据库产生模块30用于建立唇部图像语音数据库。
唇部图像获取模块31用于获取唇部图像。
具体地,唇部图像获取模块31包括摄像头、调节单元。摄像头用于获取唇部图像;调节单元用于调节摄像头的焦距、清晰度以及角度,以使摄像头能获取到用户的正面唇部图像。
语音输出模块32用于根据唇部图像语音数据库查找到唇部图像对应的语音数据后,输出唇部图像对应的语音。
图4为本发明一实施方式的数据库产生模块30的结构示意图。如图4所示,数据库产生模块30包括第一提示单元300、采集单元301及存储单元302。
第一提示单元300,用于提示用户输入语音信号;采集单元301,用于采集用户的唇部图像及唇部图像对应的语音数据;存储单元302用于存储用户的唇部图像及唇部图像对应的语音数据。
在本发明一实施方式中,数据库产生模块还包括测试单元303。
测试单元303用于提示用户输入唇部图像,并输出唇部图像对应的语音,且在接收到用户输出的确认信息后控制存储单元302存储用户的唇部图像及唇部图像对应的语音数据。
发明提供的语音输出方法及语音输出系统能根据所述唇部图像语音数据库查找到获取的所述唇部图像对应的语音数据后输出语音,实现了无声到有声沟通方式,其适用性广、抗干扰性好。
本文中应用了具体个例对本发明的语音输出方法及语音输出系统及实施方式进行了阐述,以上实施方式的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制,本发明的保护范围应以所附的权利要求为准。
Claims (10)
1.一种语音输出方法,其特征在于,所述语音输出方法包括:
建立唇部图像语音数据库;
获取唇部图像;
根据所述唇部图像语音数据库查找到获取的所述唇部图像对应的语音数据;
输出所述唇部图像对应的语音。
2.如权利要求1所述的语音输出方法,其特征在于,所述获取唇部图像的步骤包括:
调节摄像头的焦距、清晰度以及角度,以使所述摄像头能获取到用户的正面唇部图像。
3.如权利要求1所述的语音输出方法,其特征在于,所述建立唇部图像语音数据库的步骤包括:
提示用户输入语音信号;
采集所述用户的唇部图像及所述唇部图像对应的语音数据;
存储所述用户的唇部图像及所述唇部图像对应的语音数据。
4.如权利要求3所述的语音输出方法,其特征在于,采集所述用户的唇部图像及所述唇部图像对应的语音数据的步骤之后还包括:
若所述用户的唇部图像与所述唇部图像对应的语音数据存在延时,则对所述用户的唇部图像与所述唇部图像对应的语音数据进行同步处理。
5.如权利要求3所述的语音输出方法,其特征在于,采集所述用户的唇部图像及所述唇部图像对应的语音数据的步骤之后还包括:
对所述唇部图像对应的语音数据进行祛噪处理。
6.如权利要求3至5任意一项所述的语音输出方法,其特征在于,存储所述用户的唇部图像及所述唇部图像对应的语音数据的步骤包括:
提示用户输入唇部图像;
输出所述唇部图像对应的语音;
判断是否接收到用户输出的确认信息;
若接收到所述用户输出的确认信息,则存储采集的所述用户的唇部图像及所述唇部图像对应的语音数据;
若接收到所述用户输出的返回信息,则返回所述提示用户输入语音信号的步骤。
7.一种语音输出系统,其特征在于,所述语音输出系统包括:
数据库产生模块,用于建立唇部图像语音数据库;
唇部图像获取模块,用于获取唇部图像;
语音输出模块,用于根据所述唇部图像语音数据库查找到所述唇部图像对应的语音数据后,输出所述唇部图像对应的语音。
8.如权利要求7所述的语音输出系统,其特征在于,所述唇部图像获取模块包括:
摄像头,所述摄像头用于获取所述唇部图像;
调节单元,所述调节单元用于调节摄像头的焦距、清晰度以及角度,以使所述摄像头能获取到用户的正面唇部图像。
9.如权利要求7所述的语音输出系统,其特征在于,所述数据库产生模块包括:
第一提示单元,用于提示用户输入语音信号;
采集单元,用于采集所述用户的唇部图像及所述唇部图像对应的语音数据;
存储单元,用于存储所述用户的唇部图像及所述唇部图像对应的语音数据。
10.如权利要求9所述的语音输出系统,其特征在于,所述数据库产生模块还包括:
测试单元,所述测试单元用于提示用户输入唇部图像,并输出所述唇部图像对应的语音,且在接收到所述用户输出的确认信息后控制所述存储单元存储采集单元采集的所述用户的唇部图像及所述唇部图像对应的语音数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610004434.8A CN105632497A (zh) | 2016-01-06 | 2016-01-06 | 一种语音输出方法、语音输出系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610004434.8A CN105632497A (zh) | 2016-01-06 | 2016-01-06 | 一种语音输出方法、语音输出系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105632497A true CN105632497A (zh) | 2016-06-01 |
Family
ID=56047342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610004434.8A Pending CN105632497A (zh) | 2016-01-06 | 2016-01-06 | 一种语音输出方法、语音输出系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105632497A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197572A (zh) * | 2018-01-02 | 2018-06-22 | 京东方科技集团股份有限公司 | 一种唇语识别方法和移动终端 |
CN108538283A (zh) * | 2018-03-15 | 2018-09-14 | 上海电力学院 | 一种由唇部图像特征到语音编码参数的转换方法 |
CN108538282A (zh) * | 2018-03-15 | 2018-09-14 | 上海电力学院 | 一种由唇部视频直接生成语音的方法 |
CN108648745A (zh) * | 2018-03-15 | 2018-10-12 | 上海电力学院 | 一种由唇部图像序列到语音编码参数的转换方法 |
JP2019208138A (ja) * | 2018-05-29 | 2019-12-05 | 住友電気工業株式会社 | 発話認識装置、及びコンピュータプログラム |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS603793A (ja) * | 1983-06-21 | 1985-01-10 | Agency Of Ind Science & Technol | 口唇情報解析装置 |
CN1556496A (zh) * | 2003-12-31 | 2004-12-22 | 天津大学 | 唇形识别发声器 |
CN1624764A (zh) * | 2003-12-04 | 2005-06-08 | 乐金电子(中国)研究开发中心有限公司 | 便携终端机的语音识别方法 |
CN1702691A (zh) * | 2005-07-11 | 2005-11-30 | 北京中星微电子有限公司 | 基于语音的彩色人脸合成方法、系统及其着色方法、装置 |
CN101101752A (zh) * | 2007-07-19 | 2008-01-09 | 华中科技大学 | 基于视觉特征的单音节语言唇读识别系统 |
CN101321387A (zh) * | 2008-07-10 | 2008-12-10 | 中国移动通信集团广东有限公司 | 基于通信系统的声纹识别方法及系统 |
CN101482976A (zh) * | 2009-01-19 | 2009-07-15 | 腾讯科技(深圳)有限公司 | 语音驱动嘴唇形状变化的方法、获取嘴唇动画的方法及装置 |
CN101510256A (zh) * | 2009-03-20 | 2009-08-19 | 深圳华为通信技术有限公司 | 一种口型语言的转换方法及装置 |
CN101751692A (zh) * | 2009-12-24 | 2010-06-23 | 四川大学 | 语音驱动唇形动画的方法 |
CN102023703A (zh) * | 2009-09-22 | 2011-04-20 | 现代自动车株式会社 | 组合唇读与语音识别的多模式界面系统 |
CN201986001U (zh) * | 2010-12-31 | 2011-09-21 | 上海华勤通讯技术有限公司 | 口型识别输入移动终端 |
CN202352332U (zh) * | 2011-11-30 | 2012-07-25 | 李扬德 | 一种便携式唇语识别器 |
CN103745723A (zh) * | 2014-01-13 | 2014-04-23 | 苏州思必驰信息科技有限公司 | 一种音频信号识别方法及装置 |
CN104199545A (zh) * | 2014-08-28 | 2014-12-10 | 青岛海信移动通信技术股份有限公司 | 一种基于口型执行预设操作的方法及装置 |
CN104484656A (zh) * | 2014-12-26 | 2015-04-01 | 安徽寰智信息科技股份有限公司 | 基于深度学习的唇语识别唇形模型库构建方法 |
CN104504088A (zh) * | 2014-12-26 | 2015-04-08 | 安徽寰智信息科技股份有限公司 | 一种用于唇语识别的唇形模型库构建方法 |
CN104838339A (zh) * | 2013-01-07 | 2015-08-12 | 日立麦克赛尔株式会社 | 便携终端装置以及信息处理系统 |
CN105022470A (zh) * | 2014-04-17 | 2015-11-04 | 中兴通讯股份有限公司 | 一种基于唇读的终端操作方法及装置 |
-
2016
- 2016-01-06 CN CN201610004434.8A patent/CN105632497A/zh active Pending
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS603793A (ja) * | 1983-06-21 | 1985-01-10 | Agency Of Ind Science & Technol | 口唇情報解析装置 |
CN1624764A (zh) * | 2003-12-04 | 2005-06-08 | 乐金电子(中国)研究开发中心有限公司 | 便携终端机的语音识别方法 |
CN1556496A (zh) * | 2003-12-31 | 2004-12-22 | 天津大学 | 唇形识别发声器 |
CN1702691A (zh) * | 2005-07-11 | 2005-11-30 | 北京中星微电子有限公司 | 基于语音的彩色人脸合成方法、系统及其着色方法、装置 |
CN101101752A (zh) * | 2007-07-19 | 2008-01-09 | 华中科技大学 | 基于视觉特征的单音节语言唇读识别系统 |
CN101321387A (zh) * | 2008-07-10 | 2008-12-10 | 中国移动通信集团广东有限公司 | 基于通信系统的声纹识别方法及系统 |
CN101482976A (zh) * | 2009-01-19 | 2009-07-15 | 腾讯科技(深圳)有限公司 | 语音驱动嘴唇形状变化的方法、获取嘴唇动画的方法及装置 |
CN101510256A (zh) * | 2009-03-20 | 2009-08-19 | 深圳华为通信技术有限公司 | 一种口型语言的转换方法及装置 |
CN102023703A (zh) * | 2009-09-22 | 2011-04-20 | 现代自动车株式会社 | 组合唇读与语音识别的多模式界面系统 |
CN101751692A (zh) * | 2009-12-24 | 2010-06-23 | 四川大学 | 语音驱动唇形动画的方法 |
CN201986001U (zh) * | 2010-12-31 | 2011-09-21 | 上海华勤通讯技术有限公司 | 口型识别输入移动终端 |
CN202352332U (zh) * | 2011-11-30 | 2012-07-25 | 李扬德 | 一种便携式唇语识别器 |
CN104838339A (zh) * | 2013-01-07 | 2015-08-12 | 日立麦克赛尔株式会社 | 便携终端装置以及信息处理系统 |
CN103745723A (zh) * | 2014-01-13 | 2014-04-23 | 苏州思必驰信息科技有限公司 | 一种音频信号识别方法及装置 |
CN105022470A (zh) * | 2014-04-17 | 2015-11-04 | 中兴通讯股份有限公司 | 一种基于唇读的终端操作方法及装置 |
CN104199545A (zh) * | 2014-08-28 | 2014-12-10 | 青岛海信移动通信技术股份有限公司 | 一种基于口型执行预设操作的方法及装置 |
CN104484656A (zh) * | 2014-12-26 | 2015-04-01 | 安徽寰智信息科技股份有限公司 | 基于深度学习的唇语识别唇形模型库构建方法 |
CN104504088A (zh) * | 2014-12-26 | 2015-04-08 | 安徽寰智信息科技股份有限公司 | 一种用于唇语识别的唇形模型库构建方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197572A (zh) * | 2018-01-02 | 2018-06-22 | 京东方科技集团股份有限公司 | 一种唇语识别方法和移动终端 |
CN108197572B (zh) * | 2018-01-02 | 2020-06-12 | 京东方科技集团股份有限公司 | 一种唇语识别方法和移动终端 |
CN108538283A (zh) * | 2018-03-15 | 2018-09-14 | 上海电力学院 | 一种由唇部图像特征到语音编码参数的转换方法 |
CN108538282A (zh) * | 2018-03-15 | 2018-09-14 | 上海电力学院 | 一种由唇部视频直接生成语音的方法 |
CN108648745A (zh) * | 2018-03-15 | 2018-10-12 | 上海电力学院 | 一种由唇部图像序列到语音编码参数的转换方法 |
CN108538283B (zh) * | 2018-03-15 | 2020-06-26 | 上海电力学院 | 一种由唇部图像特征到语音编码参数的转换方法 |
CN108648745B (zh) * | 2018-03-15 | 2020-09-01 | 上海电力学院 | 一种由唇部图像序列到语音编码参数的转换方法 |
CN108538282B (zh) * | 2018-03-15 | 2021-10-08 | 上海电力学院 | 一种由唇部视频直接生成语音的方法 |
JP2019208138A (ja) * | 2018-05-29 | 2019-12-05 | 住友電気工業株式会社 | 発話認識装置、及びコンピュータプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107464557B (zh) | 通话录音方法、装置、移动终端及存储介质 | |
US10728656B1 (en) | Audio device and audio processing method | |
CN208507180U (zh) | 一种便携式智能语音交互控制设备 | |
CN105632497A (zh) | 一种语音输出方法、语音输出系统 | |
US9106447B2 (en) | Systems, methods and apparatus for providing unread message alerts | |
CN106024014B (zh) | 一种语音转换方法、装置及移动终端 | |
CN102231865B (zh) | 一种蓝牙耳机 | |
CN108538320B (zh) | 录音控制方法和装置、可读存储介质、终端 | |
CN106055364A (zh) | 一种启动应用方法及终端设备 | |
CA2376374C (en) | Wearable computer system and modes of operating the system | |
CN102984666B (zh) | 一种通话过程中的通讯录语音信息处理方法及系统 | |
US9413862B2 (en) | Apparatus enabling automatically adjusting functions of components thereof | |
CN108924706A (zh) | 蓝牙耳机切换控制方法、蓝牙耳机及计算机可读存储介质 | |
CN108549206A (zh) | 一种带具有语音交互功能耳机的智能手表 | |
CN104123937A (zh) | 提醒设置方法、装置和系统 | |
KR20150040567A (ko) | 휴대 기기에서 연관 정보 표시 방법 및 장치 | |
CN105611014A (zh) | 移动终端通话语音降噪方法及装置 | |
KR102447381B1 (ko) | 통화 중 인공지능 서비스를 제공하기 위한 방법 및 그 전자 장치 | |
CN105532634A (zh) | 超声波驱蚊方法、装置及系统 | |
CN108777827A (zh) | 无线耳机、音量调整方法及相关产品 | |
CN104424073A (zh) | 一种信息处理的方法及电子设备 | |
CN103546617A (zh) | 一种声音调节的方法及终端 | |
CN106022071A (zh) | 一种指纹解锁的方法及终端 | |
CN106940997A (zh) | 一种向语音识别系统发送语音信号的方法和装置 | |
CN111696553A (zh) | 一种语音处理方法、装置及可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 215301, 1, Longteng Road, Kunshan, Jiangsu, Suzhou Applicant after: InfoVision Optoelectronics(Kunshan)Co.,Ltd. Address before: 215301, 1, Longteng Road, Kunshan, Jiangsu, Suzhou Applicant before: INFOVISION OPTOELECTRONICS (KUNSHAN) Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160601 |