CN107864353A - 一种视频录制方法及移动终端 - Google Patents
一种视频录制方法及移动终端 Download PDFInfo
- Publication number
- CN107864353A CN107864353A CN201711120699.5A CN201711120699A CN107864353A CN 107864353 A CN107864353 A CN 107864353A CN 201711120699 A CN201711120699 A CN 201711120699A CN 107864353 A CN107864353 A CN 107864353A
- Authority
- CN
- China
- Prior art keywords
- text information
- vedio data
- information
- module
- mobile terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000004590 computer program Methods 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 230000006854 communication Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
- G10L15/25—Speech recognition using non-acoustical features using position of the lips, movement of the lips or face analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/47217—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8455—Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
- H04N5/92—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
- H04N5/92—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N5/9201—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
- H04N5/93—Regeneration of the television signal or of selected parts thereof
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- Databases & Information Systems (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Telephone Function (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明提供了一种视频录制方法及移动终端,涉及电子技术领域,解决现有技术中录制视频时所拍摄人物的声音较小,录制的视频将无法记录所拍摄人物通过语言表达的内容的问题。该方法包括采集视频图像数据;在采集到的视频图像数据中,获取包括人体对象的目标视频图像数据;根据目标视频图像数据,识别人体对象的唇语信息;将视频图像数据与识别出的唇语信息进行对应存储。本发明的方案在录制视频的同时,识别视频中人体对象的唇语信息,并与视频图像数据实时记录,这样即使所拍摄人物的声音较小,甚至没有声音,也能够在录制的视频中记录所拍摄人物通过语言表达的内容,提高了视频拍摄质量,提升了用户拍摄体验。
Description
技术领域
本发明涉及电子技术领域,尤其涉及一种视频录制方法及移动终端。
背景技术
随着电子技术的不断发展,智能手机等移动电子设备给人们的生活带来了很大的方便。越来越多的用户使用手机录制视频,来记录生活或工作中的重要时刻。但是在录制视频的环境比较嘈杂,或者所拍摄人物使用唇语交流时,所拍摄人物的声音较小,甚至没有声音,这种情况下录制的视频中也会出现声音较小,甚至没有声音,导致录制的视频无法记录所拍摄人物通过语言表达的内容,严重影响视频拍摄质量,影响用户拍摄体验。
发明内容
本发明实施例提供一种视频录制方法及移动终端,以解决现有技术中录制视频时所拍摄人物的声音较小,甚至没有声音,录制的视频无法记录所拍摄人物通过语言表达的内容的问题。
为了解决上述技术问题,本发明是这样实现的:一种视频录制方法,包括:
采集视频图像数据;
在采集到的视频图像数据中,获取包括人体对象的目标视频图像数据;
根据所述目标视频图像数据,识别所述人体对象的唇语信息;
将所述视频图像数据与识别出的唇语信息进行对应存储。
第一方面,本发明的实施例还提供了一种移动终端,包括:
采集模块,用于采集视频图像数据;
第一获取模块,用于在采集到的视频图像数据中,获取包括人体对象的目标视频图像数据;
识别模块,用于根据所述目标视频图像数据,识别所述人体对象的唇语信息;
存储模块,用于将所述视频图像数据与识别出的唇语信息进行对应存储。
第二方面,本发明的实施例还提供了一种移动终端,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上任一项所述的视频录制方法的步骤。
第三方面,本发明的实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的视频录制方法的步骤。
在本发明实施例中,采集视频图像数据时,在采集到的视频图像数据中,获取包括人体对象的目标视频图像数据;然后根据目标视频图像数据,识别人体对象的唇语信息;再将视频图像数据与识别出的唇语信息进行对应存储。从而在录制视频的同时,识别视频中人体对象的唇语信息,并与视频图像数据实时记录,这样即使所拍摄人物的声音较小,甚至没有声音,也能够在录制的视频中记录所拍摄人物通过语言表达的内容,提高了视频拍摄质量,提升了用户拍摄体验。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的视频录制方法的流程图;
图2为本发明实施例提供的视频录制方法的另一流程图;
图3为本发明实施例提供的视频录制方法的另一流程图;
图4为本发明实施例提供的视频录制方法中显示文字信息的示意图;
图5为本发明实施例提供的视频录制方法中显示文字信息以及进度条的示意图;
图6为本发明实施例提供的视频录制方法中显示文字信息的页面以及页面标签的示意图;
图7为本发明实施例提供的视频录制方法中文字显示设置界面的示意图;
图8为本发明实施例提供的视频录制方法中语音播放设置界面的示意图;
图9为本发明实施例提供的视频录制方法中显示声音条的示意图;
图10为本发明实施例提供的移动终端的结构示意图;
图11为本发明实施例提供的移动终端的另一结构示意图;
图12为本发明实施例提供的移动终端的另一结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的一些实施例中,提供了一种视频录制方法,参照图1所示,所述方法包括:
步骤101,采集视频图像数据。
这里,可通过移动终端的前置摄像头或后置摄像头采集视频图像数据。
步骤102,在采集到的视频图像数据中,获取包括人体对象的目标视频图像数据。
这里,通过在采集到的视频图像数据中,获取包括人体对象的目标视频图像数据,便于后续基于包括人体对象的目标视频图像数据,识别人体对象的唇语信息。
步骤103,根据所述目标视频图像数据,识别所述人体对象的唇语信息。
这里,根据目标视频图像数据,识别人体对象的唇语信息,获得了人体对象通过语言表达的内容。
步骤104,将所述视频图像数据与识别出的唇语信息进行对应存储。
这里,通过将视频图像数据与识别出的唇语信息进行对应存储,实现了对视频图像数据与唇语信息的实时记录,从而得到了记录有所拍摄人物通过语言表达的内容的视频,且不受所拍摄人物的声音大小的限制,在录制的视频中均能够记录所拍摄人物通过语言表达的内容。
本发明实施例的视频录制方法,在录制视频的同时,识别视频中人体对象的唇语信息,并与视频图像数据实时记录,这样即使所拍摄人物的声音较小,甚至没有声音,也能够在录制的视频中记录所拍摄人物通过语言表达的内容,提高了视频拍摄质量,提升了用户拍摄体验。
可选的,上述步骤103包括:
步骤1031,从所述目标视频图像数据中,获取所述人体对象的唇部区域图像。
这里,通过从目标视频图像数据中,获取人体对象的唇部区域图像,便于后续基于唇部区域图像获得对应的唇语信息。
步骤1032,从所述唇部区域图像中提取唇部特征,并在预先设置的唇语特征库中,获取与所提取的唇部特征相匹配的目标唇部特征;其中所述唇语特征库包括多个唇部特征以及每个唇部特征分别对应的唇语信息。
这里,预先设置有唇语特征库,唇语特征库包括多个唇部特征以及每个唇部特征分别对应的唇语信息。通过从唇部区域图像中提取唇部特征,并在唇语特征库中,获取与所提取的唇部特征相匹配的目标唇部特征,能够在唇语特征库中获取到目标唇部特征对应的唇语信息,从而获得所拍摄的人体对象的唇语信息。
其中,唇语特征库为预先根据大数据训练得到。唇语特征库可以针对大量用户的大数据训练得到,也可以针对移动终端的使用者的个性化大数据训练得到。
进一步的,获取与所提取的唇部特征相匹配的目标唇部特征时,可将所提取的唇部特征与唇语特征库中的每个唇部特征分别进行比对,当所提取的唇部特征与某个唇部特征的匹配值达到一阈值时,确定该唇部特征与所提取的唇部特征相匹配。
其中,唇部区域一般指双唇以及双唇中间的区域,但有时候人在说话时,周边的部分可能也会有较大幅度的动作,因此本发明实施例中,唇部区域还可以包括双唇周围的部位,如下巴以及嘴唇两边的脸部。唇部特征可包括双唇的轮廓特征以及双唇周围部位的轮廓特征。
具体的,可通过外观轮廓提取方法或轮廓特征提取方法中的至少一种,对唇部区域图像进行唇部特征提取,得到提取结果。
步骤1033,获取所述目标唇部特征对应的唇语信息。
这里,获取到与所提取的唇部特征相匹配的目标唇部特征,能够在唇语特征库中获取到目标唇部特征对应的唇语信息,从而获得了所拍摄的人体对象的唇语信息。
可选的,如图2所示,上述步骤104包括:
步骤1041,获取所述唇语信息对应的文字信息和/或语音信息。
这里,将所拍摄视频的唇语信息翻译为文字信息和/或语音信息。
步骤1042,将所述视频图像数据与所述文字信息和/或语音信息进行对应存储。
这里,通过将所拍摄视频的唇语信息翻译为文字信息和/或语音信息,并与视频图像数据进行对应存储,使用户能够对文字信息进行查看或对语音信息进行收听,从而使用户能够了解到视频中人体对象通过语言表达的内容。
可选的,上述步骤1041中,获取所述唇语信息对应的文字信息之后,还包括:
步骤105,在拍摄界面中显示所述视频图新数据以及所述视频图像数据对应的文字信息。
此时,如图4所示,在拍摄视频图像数据的同时,实时显示视频图像数据对应的文字信息,便于用户通过查看文字信息了解到视频中人体对象通过语言表达的内容。
其中,为了便于用户对文字信息进行查看,还可以在获取唇语信息对应的文字信息之后,生成文字信息对应的文本文件,在文本文件中记录文字信息;并在检测到查看该文本文件的指令时,显示该文本文件,从而方便用户进行阅览。
其中,在文字信息的文字内容较长时,可采用不同的方式进行显示,例如自动滑动或翻页的方式显示。
此时,在播放视频图像数据的同时,自动滑动显示当前的文字信息或自动翻页显示当前的文字信息,使用户在观看视频的同时能够通过文字信息了解到视频中人体对象通过语言表达的内容。或者在用户查看文字信息对应的文本文件时,自动滑动显示文字信息或自动翻页显示文字信息。
采用自动滑动的方式显示时,可选的,如图3所示,上述步骤105中,在拍摄界面中显示所述视频图像数据对应的文字信息的步骤包括:
步骤1051,显示所述视频图像数据对应的文字信息以及所述文字信息对应的进度条;所述进度条包括可在所述进度条中滑动的滑块,所述滑块在所述进度条中停留的位置与所述文字信息的显示进度相关联。
其中,可在播放视频图像数据的同时,显示视频图像数据对应的文字信息以及文字信息对应的进度条,或者在用户查看文字信息对应的文本文件时,显示文字信息以及文字信息对应的进度条。
此时,如图5所示,通过显示文字信息以及文字信息对应的进度条51,便于用户通过调整进度条51中滑块52的位置来调整文字信息的显示进度,从而查看之前显示的文字内容或者之后显示的文字内容,提高了便利性。
上述步骤1051之后,还包括:
步骤106,检测到控制所述滑块滑动的操作时,根据所述滑块滑动后在所述进度条中停留的位置,确定对应进度的文字信息并显示。
此时,检测到用户控制滑块滑动的操作时,根据滑块滑动后在进度条中停留的位置,确定对应进度的文字信息并显示,使用户能随时查看想要查看的文字内容,提高了便利性。
其中,可通过拖动滑块的方式或其他方式来控制滑块滑动。
采用翻页的方式显示时,可选的,上述步骤105中,在拍摄界面中显示所述视频图像数据对应的文字信息的步骤包括:
步骤1052,将所述视频图像数据对应的文字信息划分到多个页面,并生成每个页面的标签。
这里,通过将视频图像数据对应的文字信息划分到多个页面,每个页面记录有不同的文字内容,从而实现了对文字信息的分页显示,并生成每个页面的标签,便于用户查看任意页面的文字内容。
步骤1053,显示所述视频图像数据对应的文字信息所在的页面以及每个页面的标签。
其中,可在播放视频图像数据的同时,显示视频图像数据对应的文字信息所在的页面以及每个页面的标签,或者在用户查看文字信息对应的文本文件时,显示文字信息所在的页面以及每个页面的标签。
此时,通过显示文字信息所在的页面以及每个页面的标签,便于用户通过选择相应的标签来查看相应的文字内容,提高了便利性。
上述步骤1053之后,还包括:
步骤107,检测到对标签的第一选择指令时,根据所述第一选择指令获取所选择的标签,并显示所选择的标签对应的页面。
此时,检测到用户对标签的第一选择指令时,根据第一选择指令获取所选择的标签,并显示所选择的标签对应的页面,使用户能随时查看想要查看的文字内容,提高了便利性。
例如,如图6所示,将视频图像数据对应的文字信息划分到3个页面,并生成每个页面的标签1、2、3,然后显示文字信息所在的页面以及每个页面的标签,检测到用户对标签1、2或3的选择指令时,显示所选择的标签1、2或3对应的页面,使用户能随时查看想要查看的文字内容。
其中,可通过点击或双击标签或其他方式来输入对标签的选择指令。
可选的,上述步骤1041中,获取所述唇语信息对应的文字信息之后,还包括:
步骤114,获取用户输入的备注信息,并将所述备注信息添加到所述文字信息中。
此时,可在文字信息中,如文字信息的文字结尾或开头处,添加一些附加的备注信息。
其中,备注信息如可包括文字的录制时间、文件录制地点、所拍摄的人物的个人信息简介、所拍摄的视频内容简介或其他内容。
其中,文字录制地点可通过移动终端的定位模块如GPS获取,并以文字形式记录下来。
可选的,上述步骤105之前,还包括:
步骤108,接收文字显示设置指令。
这里,通过接收用户输入的文字显示设置指令,便于用户根据自己的需求和喜好调整文字显示方式。
具体的,如图7所示,可显示一个文字显示设置界面71,通过该文字显示设置界面71接收用户对文字信息的文字显示设置指令,并在该界面显示一个预览窗口72,将文字显示设置对应的文字显示效果通过该预览窗口72进行显示,方便用户了解设定以后的文字效果。
上述步骤105中,在拍摄界面中显示所述视频图像数据对应的文字信息的步骤包括:
步骤1054,根据所述文字显示设置指令,在拍摄界面中显示所述视频图像数据对应的文字信息。
这里,根据用户输入的文字显示设置指令,显示文字信息,能够满足不同用户对文字显示方式的不同需求和喜好,提升了用户体验。
其中,文字显示设置指令如可包括对文字语言类型、文字字体类型、文字字体大小、文字摆放位置、文字颜色的设置或其他个性化设置。
例如,文字显示设置指令包括文字显示时第一行以一种颜色显示,第二行以另一种颜色显示,换行时自动切换颜色。又例如,文字显示设置指令包括正文内容采用一种字体颜色和一种字体大小显示,备注信息采用另一种字体颜色和另一种字体大小显示。又例如,换行时字体大小不同,如第一行字体大小为小四,第二行字体大小为五号,又例如,换行时字体类型不同,如第一行字体类型为宋体,第二行字体类型为楷体。
可选的,上述步骤1041中,获取所述唇语信息对应的语音信息之后,还包括:
步骤109,在拍摄界面中显示所述视频图像数据,并播放所述视频图像数据对应的语音信息。
此时,在拍摄视频图像数据的同时,播放视频图像数据对应的语音信息,便于用户通过收听语音信息了解到视频中人体对象通过语言表达的内容。
可选的,上述步骤109之前,还包括:
步骤110,接收语音播放设置指令。
这里,通过接收用户输入的语音播放设置指令,便于用户根据自己的需求和喜好调整语音播放方式。
具体的,如图8所示,可显示一个语音播放设置界面81,通过该语音播放设置界面81接收用户对语音信息的语音播放设置指令,并在该界面显示一个声音试听按钮82,通过该声音试听按钮82接收用户输入的声音试听指令,检测到声音试听指令时,播放语音播放设置指令对应的声音效果,从而方便用户了解设定以后的声音效果。
上述步骤109中,播放所述视频图像数据对应的语音信息的步骤包括:
步骤1091,根据所述语音播放设置指令,播放所述视频图像数据对应的语音信息。
这里,根据用户输入的语音播放设置指令,播放语音信息,能够满足不同用户对语音播放方式的不同需求和喜好,提升了用户体验。
其中,语音播放设置指令如可包括对声音音量、声音音调、声音音色的设置或其他个性化设置。
可选的,上述步骤1041中,获取所述唇语信息对应的语音信息之后,还包括:
步骤111,生成所述语音信息对应的至少一个声音条。
这里,通过生成语音信息对应的至少一个声音条,每个声音条记录有不同的唇语语音内容。
步骤112,显示所述至少一个声音条。
这里,通过声音条的形式显示语音信息,便于用户选择查听任意声音条记录的唇语语音内容,提高了便利性。
其中,可在播放视频图像数据的同时,显示至少一个声音条,便于用户通过选择相应的声音条来查听相应的唇语语音内容。
步骤113,检测到对声音条的第二选择指令时,根据所述第二选择指令获取所选择的声音条,并播放所述声音条对应的语音信息。
这里,检测到用户对声音条的第二选择指令时,根据第二选择指令获取所选择的声音条,并播放声音条对应的语音信息,使用户能随时查听想要查听的唇语语音内容,提高了便利性。
例如,如图9所示,将视频中的语音信息分成两段,生成语音信息对应的两个声音条91,第一个声音条代表第一段语音信息,第二个声音条代表第二段语音信息。然后在播放视频图像数据的同时,显示两个声音条。检测到对第一个声音条的选择指令时,播放第一段语音信息,检测到对第二个声音条的选择指令时,播放第二段语音信息,使用户能随时查听想要查听的唇语语音内容。
其中,可通过点击或双击声音条或其他方式来输入对声音条的选择指令。
本发明实施例的视频录制方法,在录制视频的同时,识别视频中人体对象的唇语信息,并与视频图像数据实时记录,这样即使所拍摄人物的声音较小,甚至没有声音,也能够在录制的视频中记录所拍摄人物通过语言表达的内容,提高了视频拍摄质量,提升了用户拍摄体验。
在本发明的一些实施例中,参照图10所示,还提供了一种移动终端1000。移动终端1000包括:
采集模块1001,用于采集视频图像数据;
第一获取模块1002,用于在采集到的视频图像数据中,获取包括人体对象的目标视频图像数据;
识别模块1003,用于根据所述目标视频图像数据,识别所述人体对象的唇语信息;
存储模块1004,用于将所述视频图像数据与识别出的唇语信息进行对应存储。
本发明实施例的移动终端1000,在录制视频的同时,识别视频中人体对象的唇语信息,并与视频图像数据实时记录,这样即使所拍摄人物的声音较小,甚至没有声音,也能够在录制的视频中记录所拍摄人物通过语言表达的内容,提高了视频拍摄质量,提升了用户拍摄体验。
可选的,如图11所示,所述识别模块1003包括:
第一获取子模块10031,用于从所述目标视频图像数据中,获取所述人体对象的唇部区域图像;
提取子模块10032,用于从所述唇部区域图像中提取唇部特征,并在预先设置的唇语特征库中,获取与所提取的唇部特征相匹配的目标唇部特征;其中所述唇语特征库包括多个唇部特征以及每个唇部特征分别对应的唇语信息;
第二获取子模块10033,用于获取所述目标唇部特征对应的唇语信息。
可选的,所述存储模块1004包括:
第三获取子模块10041,用于获取所述唇语信息对应的文字信息和/或语音信息;
存储子模块10042,用于将所述视频图像数据与所述文字信息和/或语音信息进行对应存储。
可选的,移动终端1000还包括:
第一显示模块1005,用于在拍摄界面中显示所述视频图像数据以及所述视频图像数据对应的文字信息。
可选的,所述第一显示模块1005包括:
第一显示子模块,用于显示所述视频图像数据对应的文字信息以及所述文字信息对应的进度条;所述进度条包括可在所述进度条中滑动的滑块,所述滑块在所述进度条中停留的位置与所述文字信息的显示进度相关联;
第二显示子模块,用于检测到控制所述滑块滑动的操作时,根据所述滑块滑动后在所述进度条中停留的位置,确定对应进度的文字信息并显示。
可选的,所述第一显示模块1005包括:
划分子模块,用于将所述视频图像数据对应的文字信息划分到多个页面,并生成每个页面的标签;
第三显示子模块,用于显示所述视频图像数据对应的文字信息所在的页面以及每个页面的标签;
第四显示子模块,用于检测到对标签的第一选择指令时,根据所述第一选择指令获取所选择的标签,并显示所选择的标签对应的页面。
可选的,移动终端1000还包括:
第一接收模块1006,用于接收文字显示设置指令;
所述第一显示模块1005具体用于:
根据所述文字显示设置指令,在拍摄界面中显示所述视频图像数据对应的文字信息。
可选的,移动终端1000还包括:
第二显示模块1007,用于在拍摄界面中显示所述视频图像数据,并播放所述视频图像数据对应的语音信息。
可选的,移动终端1000还包括:
第二接收模块1008,用于接收语音播放设置指令;
所述第二显示模块1007具体用于:
根据所述语音播放设置指令,播放所述视频图像数据对应的语音信息。
可选的,移动终端1000还包括:
生成模块1009,用于生成所述语音信息对应的至少一个声音条;
第三显示模块1010,用于显示所述至少一个声音条;
播放模块1011,用于检测到对声音条的第二选择指令时,根据所述第二选择指令获取所选择的声音条,并播放所述声音条对应的语音信息。
可选的,移动终端1000还包括:
备注模块1012,用于获取用户输入的备注信息,并将所述备注信息添加到所述文字信息中。
本发明实施例提供的移动终端能实现图1至图9的方法实施例中移动终端实现的各个过程,为避免重复,在此不再赘述。本发明实施例的移动终端1000,在录制视频的同时,识别视频中人体对象的唇语信息,并与视频图像数据实时记录,这样即使所拍摄人物的声音较小,甚至没有声音,也能够在录制的视频中记录所拍摄人物通过语言表达的内容,提高了视频拍摄质量,提升了用户拍摄体验。
图12为实现本发明各个实施例的一种移动终端的硬件结构示意图。该移动终端1200包括但不限于:射频单元1201、网络模块1202、音频输出单元1203、输入单元1204、传感器1205、显示单元1206、用户输入单元1207、接口单元1208、存储器1209、处理器1210、以及电源1211等部件。本领域技术人员可以理解,图12中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,移动终端包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
其中,输入单元1204,用于采集视频图像数据。
处理器1210,用于在采集到的视频图像数据中,获取包括人体对象的目标视频图像数据;根据所述目标视频图像数据,识别所述人体对象的唇语信息;将所述视频图像数据与识别出的唇语信息对应存储到存储器1209。
该移动终端1200在录制视频的同时,识别视频中人体对象的唇语信息,并与视频图像数据实时记录,这样即使所拍摄人物的声音较小,甚至没有声音,也能够在录制的视频中记录所拍摄人物通过语言表达的内容,提高了视频拍摄质量,提升了用户拍摄体验。
可选的,处理器1210还用于从所述目标视频图像数据中,获取所述人体对象的唇部区域图像;从所述唇部区域图像中提取唇部特征,并在预先设置的唇语特征库中,获取与所提取的唇部特征相匹配的目标唇部特征;其中所述唇语特征库包括多个唇部特征以及每个唇部特征分别对应的唇语信息;获取所述目标唇部特征对应的唇语信息。
可选的,处理器1210还用于获取所述唇语信息对应的文字信息和/或语音信息;将所述视频图像数据与所述文字信息和/或语音信息对应存储到存储器1209。
可选的,显示单元1206用于在拍摄界面中显示所述视频图像数据以及所述视频图像数据对应的文字信息。
可选的,显示单元1206还用于显示所述视频图像数据对应的文字信息以及所述文字信息对应的进度条;所述进度条包括可在所述进度条中滑动的滑块,所述滑块在所述进度条中停留的位置与所述文字信息的显示进度相关联;处理器1210还用于检测到控制所述滑块滑动的操作时,根据所述滑块滑动后在所述进度条中停留的位置,确定对应进度的文字信息并通过显示单元1206显示。
可选的,处理器1210还用于将所述视频图像数据对应的文字信息划分到多个页面,并生成每个页面的标签;显示单元1206还用于显示所述视频图像数据对应的文字信息所在的页面以及每个页面的标签;处理器1210还用于检测到对标签的第一选择指令时,根据所述第一选择指令获取所选择的标签,并通过显示单元1206显示所选择的标签对应的页面。
可选的,用户输入单元1207用于接收文字显示设置指令;显示单元1206还用于根据所述文字显示设置指令,在拍摄界面中显示所述视频图像数据对应的文字信息。
可选的,显示单元1206还用于在拍摄界面中显示所述视频图像数据,音频输出单元1203用于播放所述视频图像数据对应的语音信息。
可选的,用户输入单元1207还用于接收语音播放设置指令;音频输出单元1203还用于根据所述语音播放设置指令,播放所述视频图像数据对应的语音信息。
可选的,处理器1210还用于生成所述语音信息对应的至少一个声音条;显示单元1206还用于显示所述至少一个声音条;处理器1210还用于检测到对声音条的第二选择指令时,根据所述第二选择指令获取所选择的声音条,并通过音频输出单元1203播放所述声音条对应的语音信息。
可选的,用户输入单元1207还用于获取用户输入的备注信息,处理器1210还用于将所述备注信息添加到所述文字信息中。
应理解的是,本发明实施例中,射频单元1201可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器1210处理;另外,将上行的数据发送给基站。通常,射频单元1201包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元1201还可以通过无线通信系统与网络和其他设备通信。
移动终端通过网络模块1202为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元1203可以将射频单元1201或网络模块1202接收的或者在存储器1209中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元1203还可以提供与移动终端1200执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元1203包括扬声器、蜂鸣器以及受话器等。
输入单元1204用于接收音频或视频信号。输入单元1204可以包括图形处理器(Graphics Processing Unit,GPU)12041和麦克风12042,图形处理器12041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元1206上。经图形处理器12041处理后的图像帧可以存储在存储器1209(或其它存储介质)中或者经由射频单元1201或网络模块1202进行发送。麦克风12042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元1201发送到移动通信基站的格式输出。
移动终端1200还包括至少一种传感器1205,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板12061的亮度,接近传感器可在移动终端1200移动到耳边时,关闭显示面板12061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器1205还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元1206用于显示由用户输入的信息或提供给用户的信息。显示单元1206可包括显示面板12061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板12061。
用户输入单元1207可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元1207包括触控面板12071以及其他输入设备12072。触控面板12071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板12071上或在触控面板12071附近的操作)。触控面板12071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1210,接收处理器1210发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板12071。除了触控面板12071,用户输入单元1207还可以包括其他输入设备12072。具体地,其他输入设备12072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板12071可覆盖在显示面板12061上,当触控面板12071检测到在其上或附近的触摸操作后,传送给处理器1210以确定触摸事件的类型,随后处理器1210根据触摸事件的类型在显示面板12061上提供相应的视觉输出。虽然在图12中,触控面板12071与显示面板12061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板12071与显示面板12061集成而实现移动终端的输入和输出功能,具体此处不做限定。
接口单元1208为外部装置与移动终端1200连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元1208可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端1200内的一个或多个元件或者可以用于在移动终端1200和外部装置之间传输数据。
存储器1209可用于存储软件程序以及各种数据。存储器1209可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1209可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器1210是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器1209内的软件程序和/或模块,以及调用存储在存储器1209内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器1210可包括一个或多个处理单元;优选的,处理器1210可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1210中。
移动终端1200还可以包括给各个部件供电的电源1211(比如电池),优选的,电源1211可以通过电源管理系统与处理器1210逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,移动终端1200包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种移动终端,包括处理器1210,存储器1209,存储在存储器1209上并可在所述处理器1210上运行的计算机程序,该计算机程序被处理器1210执行时实现上述视频录制方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述视频录制方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
Claims (15)
1.一种视频录制方法,其特征在于,包括:
采集视频图像数据;
在采集到的视频图像数据中,获取包括人体对象的目标视频图像数据;
根据所述目标视频图像数据,识别所述人体对象的唇语信息;
将所述视频图像数据与识别出的唇语信息进行对应存储。
2.根据权利要求1所述的方法,其特征在于,将所述视频图像数据与识别出的唇语信息进行对应存储的步骤包括:
获取所述唇语信息对应的文字信息和/或语音信息;
将所述视频图像数据与所述文字信息和/或语音信息进行对应存储。
3.根据权利要求2所述的方法,其特征在于,获取所述唇语信息对应的文字信息之后,还包括:
在拍摄界面中显示所述视频图像数据以及所述视频图像数据对应的文字信息。
4.根据权利要求3所述的方法,其特征在于,在拍摄界面中显示所述视频图像数据对应的文字信息的步骤包括:
显示所述视频图像数据对应的文字信息以及所述文字信息对应的进度条;所述进度条包括可在所述进度条中滑动的滑块,所述滑块在所述进度条中停留的位置与所述文字信息的显示进度相关联;
所述显示所述视频图像数据对应的文字信息以及所述文字信息对应的进度条之后,还包括:
检测到控制所述滑块滑动的操作时,根据所述滑块滑动后在所述进度条中停留的位置,确定对应进度的文字信息并显示。
5.根据权利要求3所述的方法,其特征在于,在拍摄界面中显示所述视频图像数据对应的文字信息的步骤包括:
将所述视频图像数据对应的文字信息划分到多个页面,并生成每个页面的标签;
显示所述视频图像数据对应的文字信息所在的页面以及每个页面的标签;
所述显示所述视频图像数据对应的文字信息所在的页面以及每个页面的标签之后,还包括:
检测到对标签的第一选择指令时,根据所述第一选择指令获取所选择的标签,并显示所选择的标签对应的页面。
6.根据权利要求2所述的方法,其特征在于,获取所述唇语信息对应的语音信息之后,还包括:
生成所述语音信息对应的至少一个声音条;
显示所述至少一个声音条;
检测到对声音条的第二选择指令时,根据所述第二选择指令获取所选择的声音条,并播放所述声音条对应的语音信息。
7.根据权利要求2所述的方法,其特征在于,获取所述唇语信息对应的文字信息之后,还包括:
获取用户输入的备注信息,并将所述备注信息添加到所述文字信息中。
8.一种移动终端,其特征在于,包括:
采集模块,用于采集视频图像数据;
第一获取模块,用于在采集到的视频图像数据中,获取包括人体对象的目标视频图像数据;
识别模块,用于根据所述目标视频图像数据,识别所述人体对象的唇语信息;
存储模块,用于将所述视频图像数据与识别出的唇语信息进行对应存储。
9.根据权利要求8所述的移动终端,其特征在于,所述存储模块包括:
第三获取子模块,用于获取所述唇语信息对应的文字信息和/或语音信息;
存储子模块,用于将所述视频图像数据与所述文字信息和/或语音信息进行对应存储。
10.根据权利要求9所述的移动终端,其特征在于,还包括:
第一显示模块,用于在拍摄界面中显示所述视频图像数据以及所述视频图像数据对应的文字信息。
11.根据权利要求10所述的移动终端,其特征在于,所述第一显示模块包括:
第一显示子模块,用于显示所述视频图像数据对应的文字信息以及所述文字信息对应的进度条;所述进度条包括可在所述进度条中滑动的滑块,所述滑块在所述进度条中停留的位置与所述文字信息的显示进度相关联;
第二显示子模块,用于检测到控制所述滑块滑动的操作时,根据所述滑块滑动后在所述进度条中停留的位置,确定对应进度的文字信息并显示。
12.根据权利要求10所述的移动终端,其特征在于,所述第一显示模块包括:
划分子模块,用于将所述视频图像数据对应的文字信息划分到多个页面,并生成每个页面的标签;
第三显示子模块,用于显示所述视频图像数据对应的文字信息所在的页面以及每个页面的标签;
第四显示子模块,用于检测到对标签的第一选择指令时,根据所述第一选择指令获取所选择的标签,并显示所选择的标签对应的页面。
13.根据权利要求9所述的移动终端,其特征在于,还包括:
生成模块,用于生成所述语音信息对应的至少一个声音条;
第三显示模块,用于显示所述至少一个声音条;
播放模块,用于检测到对声音条的第二选择指令时,根据所述第二选择指令获取所选择的声音条,并播放所述声音条对应的语音信息。
14.根据权利要求9所述的移动终端,其特征在于,还包括:
备注模块,用于获取用户输入的备注信息,并将所述备注信息添加到所述文字信息中。
15.一种移动终端,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至11中任一项所述的视频录制方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711120699.5A CN107864353B (zh) | 2017-11-14 | 2017-11-14 | 一种视频录制方法及移动终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711120699.5A CN107864353B (zh) | 2017-11-14 | 2017-11-14 | 一种视频录制方法及移动终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107864353A true CN107864353A (zh) | 2018-03-30 |
CN107864353B CN107864353B (zh) | 2019-10-18 |
Family
ID=61700307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711120699.5A Active CN107864353B (zh) | 2017-11-14 | 2017-11-14 | 一种视频录制方法及移动终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107864353B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108831472A (zh) * | 2018-06-27 | 2018-11-16 | 中山大学肿瘤防治中心 | 一种基于唇语识别的人工智能发声系统及发声方法 |
CN109325219A (zh) * | 2018-08-24 | 2019-02-12 | 维沃移动通信有限公司 | 一种生成记录文档的方法、装置及系统 |
CN111147914A (zh) * | 2019-12-24 | 2020-05-12 | 珠海格力电器股份有限公司 | 一种视频处理的方法、存储介质及电子设备 |
CN112672021A (zh) * | 2020-12-25 | 2021-04-16 | 维沃移动通信有限公司 | 语言识别方法、装置及电子设备 |
CN113377326A (zh) * | 2021-06-08 | 2021-09-10 | 广州博冠信息科技有限公司 | 一种音频数据处理方法、装置、终端及存储介质 |
CN113873165A (zh) * | 2021-10-25 | 2021-12-31 | 维沃移动通信有限公司 | 拍照方法、装置和电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101241656A (zh) * | 2008-03-11 | 2008-08-13 | 黄中伟 | 口型识别能力的计算机辅助训练方法 |
US20140010418A1 (en) * | 2011-03-21 | 2014-01-09 | Hewlett-Packard Development Company, L.P. | Lip activity detection |
CN105791712A (zh) * | 2014-12-22 | 2016-07-20 | 富泰华工业(深圳)有限公司 | 自动还原丢失语音信息的系统与方法 |
CN105825167A (zh) * | 2016-01-29 | 2016-08-03 | 维沃移动通信有限公司 | 一种提高唇语识别率的方法和移动终端 |
CN107124647A (zh) * | 2017-05-27 | 2017-09-01 | 深圳市酷开网络科技有限公司 | 一种全景视频录制时自动生成字幕文件的方法及装置 |
-
2017
- 2017-11-14 CN CN201711120699.5A patent/CN107864353B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101241656A (zh) * | 2008-03-11 | 2008-08-13 | 黄中伟 | 口型识别能力的计算机辅助训练方法 |
US20140010418A1 (en) * | 2011-03-21 | 2014-01-09 | Hewlett-Packard Development Company, L.P. | Lip activity detection |
CN105791712A (zh) * | 2014-12-22 | 2016-07-20 | 富泰华工业(深圳)有限公司 | 自动还原丢失语音信息的系统与方法 |
CN105825167A (zh) * | 2016-01-29 | 2016-08-03 | 维沃移动通信有限公司 | 一种提高唇语识别率的方法和移动终端 |
CN107124647A (zh) * | 2017-05-27 | 2017-09-01 | 深圳市酷开网络科技有限公司 | 一种全景视频录制时自动生成字幕文件的方法及装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108831472A (zh) * | 2018-06-27 | 2018-11-16 | 中山大学肿瘤防治中心 | 一种基于唇语识别的人工智能发声系统及发声方法 |
CN109325219A (zh) * | 2018-08-24 | 2019-02-12 | 维沃移动通信有限公司 | 一种生成记录文档的方法、装置及系统 |
CN111147914A (zh) * | 2019-12-24 | 2020-05-12 | 珠海格力电器股份有限公司 | 一种视频处理的方法、存储介质及电子设备 |
CN112672021A (zh) * | 2020-12-25 | 2021-04-16 | 维沃移动通信有限公司 | 语言识别方法、装置及电子设备 |
CN112672021B (zh) * | 2020-12-25 | 2022-05-17 | 维沃移动通信有限公司 | 语言识别方法、装置及电子设备 |
CN113377326A (zh) * | 2021-06-08 | 2021-09-10 | 广州博冠信息科技有限公司 | 一种音频数据处理方法、装置、终端及存储介质 |
CN113377326B (zh) * | 2021-06-08 | 2023-02-03 | 广州博冠信息科技有限公司 | 一种音频数据处理方法、装置、终端及存储介质 |
CN113873165A (zh) * | 2021-10-25 | 2021-12-31 | 维沃移动通信有限公司 | 拍照方法、装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN107864353B (zh) | 2019-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107799125A (zh) | 一种语音识别方法、移动终端及计算机可读存储介质 | |
CN107864353B (zh) | 一种视频录制方法及移动终端 | |
CN108108214A (zh) | 一种操作引导方法、装置及移动终端 | |
CN108197185A (zh) | 一种音乐推荐方法、终端及计算机可读存储介质 | |
CN107613131A (zh) | 一种应用程序免打扰方法及移动终端 | |
CN107817939A (zh) | 一种图像处理方法及移动终端 | |
CN107864357A (zh) | 视频通话特效控制方法、终端及计算机可读存储介质 | |
CN108572764A (zh) | 一种文字输入控制方法、设备及计算机可读存储介质 | |
CN107358227A (zh) | 一种标记识别方法、移动终端以及计算机可读存储介质 | |
CN107592459A (zh) | 一种拍照方法及移动终端 | |
CN109857905A (zh) | 一种视频编辑方法及终端设备 | |
CN107707828A (zh) | 一种视频处理方法及移动终端 | |
CN108174236A (zh) | 一种媒体文件处理方法、服务器及移动终端 | |
CN107943390A (zh) | 一种文字复制方法及移动终端 | |
CN111508531B (zh) | 音频处理方法及装置 | |
CN109743504A (zh) | 一种辅助拍照方法、移动终端和存储介质 | |
CN107908705A (zh) | 一种信息推送方法、信息推送装置及移动终端 | |
CN110097872A (zh) | 一种音频处理方法及电子设备 | |
CN107704828A (zh) | 阅读信息的展示方法、移动终端及计算机可读存储介质 | |
CN107911735A (zh) | 一种音视频播放处理方法、装置及终端 | |
CN107992455A (zh) | 一种文本处理方法、终端及计算机可读存储介质 | |
CN107885416A (zh) | 一种文本复制方法、终端及计算机可读存储介质 | |
CN107957994A (zh) | 一种翻译方法、终端及计算机可读存储介质 | |
CN108037885A (zh) | 一种操作提示方法及移动终端 | |
CN110379428A (zh) | 一种信息处理方法及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |