CN103297711B - 汉语自动实时标注汉语字幕录播设备 - Google Patents

汉语自动实时标注汉语字幕录播设备 Download PDF

Info

Publication number
CN103297711B
CN103297711B CN201310243591.0A CN201310243591A CN103297711B CN 103297711 B CN103297711 B CN 103297711B CN 201310243591 A CN201310243591 A CN 201310243591A CN 103297711 B CN103297711 B CN 103297711B
Authority
CN
China
Prior art keywords
chinese
module
code
video
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310243591.0A
Other languages
English (en)
Other versions
CN103297711A (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
QINGHAI HANLA INFORMATION TECHNOLOGY CO., LTD.
Original Assignee
Qinghai Hanla Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qinghai Hanla Information Technology Co Ltd filed Critical Qinghai Hanla Information Technology Co Ltd
Priority to CN201310243591.0A priority Critical patent/CN103297711B/zh
Publication of CN103297711A publication Critical patent/CN103297711A/zh
Application granted granted Critical
Publication of CN103297711B publication Critical patent/CN103297711B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本技术方案是一种汉语自动实时标注汉语字幕录播设备,属于语音和图像数据处理设备技术领域。本技术方案的设备包括话筒和摄像机模块(1)、音视频同步信号标记模块(2)、有声语言音频信号提取模块(3)、汉语语音识别模块(4)、视频画面或影像画面字幕叠加机模块(5)、带汉语语音汉语字幕的音影像资料储存或输出模块(11)、音视频编码压缩模块(6)、网络传输模块A(7)、带音视频解码解压缩软件服务器模块(8)、网络传输模块B(9)、带音视频音像播放软件的客户端模块(10)、带现场实时汉语语音和汉语字幕的场景音视频影像资料输出模块(12),本技术方案的音像录播设备可以方便有声音像资料实时标注汉语字幕信息并人们方便观看。

Description

汉语自动实时标注汉语字幕录播设备
技术领域
本技术方案属于语音和图像数据处理设备技术领域。
背景技术
目前市面上的汉语有声影像资料的汉字字幕叠加,一般通过人工方式将汉语有声影像资料中的汉语语音转换成汉字,再交给视频画面或影像画面字幕叠加机将表达汉语意思的汉字字幕叠加在视频画面或影像画面上,由于存在大量实时的汉语有声影像资料,包括电视录像和电影等有声影像资料,因此,如果单靠采用人工转换的方式会很费工费时而且很难做到实时传输,随着数字有声影像技术的出现,特别是计算机系统用于处理视频影像资料的技术出现,越来越需要有一种能自动实时将汉语语音的音像转换成汉语字幕并加注在视频画面上的技术出现,而且这种能自动根据汉语语音实时转换成汉语或汉语字幕的技术不但能在带汉字系统的计算机系统中运行,还能在不带汉字系统只带128个字符的ASCII码系统的以美国为代表的西方国家的计算机系统中运行,以满足世界互联网的日益广泛的运用和云计算、物联网以及世界各地汉语热的出现,中西文化交流越来越频繁的新形势的需要。
发明内容
本技术方案的提出就是为了解决上述出现这些问题。具体来说本技术方案通过采用以下的汉语自动实时标注汉语字幕录播设备的技术来解决上述出现的问题:
本技术方案采用的录播设备包括话筒和摄像机模块1、音视频同步信号标记模块2、有声语言音频信号提取模块3、汉语语音识别模块4、、视频画面或影像画面字幕叠加机模块5、带汉语语音汉语字幕的音影像资料储存或输出模块11、音视频编码压缩模块6、网络传输模块A7、带音视频解码解压缩软件服务器模块8、网络传输模块B9、带音视频音像播放软件的客户端模块10、带现场实时汉语语音和汉语字幕的场景音视频影像资料输出模块12。
本技术方案采用的录播设备工作时按以下步骤进行: 在现场实时汉语语音音像录播时,所述录播设备通过话筒和摄像机模块1,将汉语语音及现场场景录入并储存到所述的音像录播设备的系统中,系统中的计算机首先通过音视频同步信号标记模块2做好通过上述摄像机模块1摄制的影像资料中视频画面或影像画面与上述话筒录制的对应的汉语有声语言的音频信号同步信号标记并储存在音像录播设备的储存系统中, 然后将带同步信号标记的汉语有声语言的音频信号通过有声语言音频信号提取模块3提取出来,带同步信号标记的汉语有声语言的音频信号提取出来后再传给计算机中的内嵌汉字和汉语拼音与汉语语音码双向转换模块的汉语语音识别模块4,汉语语音识别模块4将汉语语音识别成带与所识别的汉语语音相同同步信号标记的用26个拉丁字母表示的汉语语音码,再将上述带同步信号标记的汉语语音码字幕传输给现有的视频画面或影像画面字幕叠加机模块5,根据汉语语音码字幕与视频画面或影像画面同步信号标记的对应关系将汉语字幕信息叠加在视频画面或影像画面上,并传输给带汉语语音汉语字幕的音影像资料储存或输出模块11,然后再通过所述音视频编码压缩模块6进行编码和压缩,经上述编码和压缩后再传输给网络传输模块A7,再由网络传输模块A7将编码和压缩后的上述具有相同同步信号标记的带汉语字幕的视频画面或影像画面传输到宽带网络,宽带网络将其传输到指定的带音视频解码解压缩软件服务器模块8上进行储存,带音视频音像播放软件的客户端模块10通过网络传输模块B9登陆到上述带音视频解码解压缩软件服务器模块8,通过带现场实时汉语语音和汉语字幕的场景音视频影像资料输出模块12,就可以实时观看上述现场实时带汉语字幕和汉语语音的视频影像资料画面。
所述的汉语语音识别模块4内嵌汉字和汉语拼音与汉语语音码双向转换模块。
所述网络传输模块A7或网络传输模块B9,是有线网络传输模块或者是无线网络传输模块中的任意一种,在采用有线网络传输模块时,所述宽带网络是有线宽带网络,在采用无线网络传输模块时,所述宽带网络是无线宽带网络。
所述的无线网络传输模块是3G、4G、wifi、wimax、蓝牙中的任意一种。
上述的汉语语音码,在汉字系统的计算机中可以通过上述汉字和汉语拼音与汉语语音码双向转换模块转换成汉字,汉语语音码或汉字能够单独或者汉语语音码与汉字、汉语拼音,意义一致的外文对照显示、储存、输出。
上述的汉语语音码是以单词为单位,这里将单个汉字看作单音节词,根据组成该单词的每个音节的《汉语拼音方案》中的拼音,用且仅用26个拉丁字母对汉语拼音的声母、介母、韵母、声调采取先编码再依次按“声码+介码+韵码+调码兼隔音节符号”的顺序编码拼写,并通过得到的语音码的编码直接表达汉语信息,当直接用语音码编码来表示汉语信息时,其标点符号的用法同英文的标点符号的用法相同,编码时同一个单词的多个音节不用空格连续编码,单词与单词之间要有空格隔开。
由于本技术方案采用26个拉丁字母表示的汉语语音码来表达汉语信息,且当直接用语音码编码来表示汉语信息时,其标点符号的用法同英文的标点符号的用法相同,这样就保证了汉语信息的表达连标点符号在内都与ASCII码完全一致,也即与ASCII码100%兼容,这样上述汉语语音识别模块、机器翻译模块、语音合成模块由于处理的汉语信息是用与ASCII码完全一致的汉语语音码来表示的,这样就使得这些模块可以在ASCII码系统的计算机中运行,由于组成整个系统的模块可以在ASCII码系统的计算机中运行,因此,整个系统可以在ASCII码系统的计算机中运行。
有了本技术方案以后,汉语信息可以在汉字内码系统和非汉字内码系统的ASCII内码系统的计算机信息系统中畅通无阻地进行传输和处理,使得实时汉语音像自动实现添加与音像资料中的汉语语音相对应的汉语字幕并实时播出。
附图说明
附图1所示是本发明的汉语自动实时标注汉语字幕录播设备系统示意图
具体实施方式
下面结合实施例对本发明的具体实施方式作进一步的说明。
(一)本技术方案所采用的汉语语音码的每一音节声、韵、调的编码方法采用以下的方法:
注:破折号“—”后的符号均为汉语拼音符号,破折号“—”前的字母为所采用的汉语每一音节声、韵、调的编码,以下均同,以下将下列对照表简称为码表。
这里值得指出的是:在用键盘键入汉语语音码及汉语语音码语句的标点符号时,组成汉语语音码编码的26个拉丁字母与西文标准键盘的26个字母键完全一一相同对应,汉语语音码语句的标点符号键与西文标准键盘的标点符号键也一一相同对应,输入汉语语音码字母和标点符号时,只需要击打西文标准键盘的相应的相同键位即可。
1、声码的编码符号采用与汉语拼音方案基本一致的声母的字母符号,比如采用下面这种声码的编码形式:
b—b; p—p; m—m; f—f; d—d; t—t;
n—n; l—l; g—g; k—k; h—h;
j—zh, j; q—ch, q; x—sh,x; r—r;
z—z; c—c; s—s; y—y; w—w。
2、汉语拼音介母(ü)采用26个拉丁字母中的一个字母表示,比如采用下面这种介码的编码形式:
i—i; u—u; y—ü。
3、韵码的编码,对单韵母除(ü)采用26个拉丁字母中的一个字母表示外,其它采用与汉语拼音相同的字母符号,汉语拼音的复合韵母可以采用《汉语拼音方案》相同的形式,也可以采用一个辅音字母来编码,比如采用下面的这种字母符号来对汉语拼音的韵母进行编码:
a—a; o—o; e—e; i—i; u—u; y—ü;
k—ao; c— ai; s—an; x—ou; w—ei; n—en;
z—ua; l—uo; b—ang; d—ong; p—eng;
q—ing; g—ng; er—er;
r—i;“i只与汉语拼音声母zh、ch、sh相拼时,汉语拼音的i用语音码的编码r代表”。即:汉语拼音的zhi、chi、shi分别用语音码的jr、qr、xr代表。jr或qr或xr或er键盘输入时分别按J和R或Q和R或X和R或E和R两个键位输入。
4、调码的编码除采用一个汉语不用的辅音字母v表示汉语拼音的上声(∨)外,其它采用元音字母来表示汉语的声调,比如采用下面的字母来对汉语拼音的声调进行编码:
a— —,阴平 ; e— / ,阳平 ; v— ∨ ,上声 ; u—\ ,去声 ;
o— 拼音不标轻声调号, 轻声 。
(二)利用上述编码的汉语语音码汉语信息表示采用如下的方法:
以单词为单位,这里将单个汉字看作单音节词,根据组成该单词的每个音节的《汉语拼音方案》中的拼音,依次按“声码+介码+韵码+调码兼隔音节符号”的顺序编码,同一个单词的多个音节不用空格隔开连写,单词与单词之间的编码用空格隔开,当汉语信息表示处于汉语语音码状态时,其六种点号,七种标号和一个移行号采用与英文相同的形式;
这里由于将独立运用的汉字看作单音节词,因此,本发明所采用的汉字编码的方法和汉语单词音节编码的方法相同,在本发明中采用单词音节编码按词连写后得到单词编码,我们将由若干个单词组成的一组词称为词组,本发明所采用词组的编码同汉语句子的编码相同,由于单词可以表示词组和汉语句子,因此在本发明中所采用的词组的编码和汉语句子的编码都可以通过单词的编码实现,而不需要对词组和汉语句子另外制定一套专门的编码,一般在整句整篇以词为单位表示汉语信息时,在理解时一般不需要进行同音字词的选择,原则上听起来不会产生歧义的句子,用编码表达时也不会产生歧义。
下面以一句通过话筒输入的汉语句子的语音为例来说明本技术方案的具体实现步骤
在现场实时汉语语音音像录播时,所述录播设备通过话筒和摄像机模块1,将汉语语音及现场场景录入并储存到所述的录播设备的系统中,系统中的计算机首先通过音视频同步信号标记模块2做好通过上述摄像机模块1摄制的影像资料中视频画面或影像画面与上述话筒录制的对应的汉语有声语言的音频信号同步信号标记并储存在音像录播设备的储存系统中, 音视频同步信号标记模块2制作同步信号标记可以采用现有的制作视频画面或影像画面与音频同步时间戳标记的技术进行。
然后将带同步信号标记的汉语有声语言的音频信号通过有声语言音频信号提取模块3提取出来,提取方法可以直接按系统储存的汉语有声语言音频数字信号提取,也可以将有汉语声语言音频信号通过D/A数模转换装置将系统储存的汉语有声语言音频数字信号转换成模拟信号再提取出来,更原始的方法是汉语有声语言音频信号通过喇叭播放汉语有声语言的声音的方式提取出来,这里就不一一枚举。
带同步信号标记的汉语有声语言的音频信号提取出来后再传给计算机中的汉语语音识别模块4,汉语语音识别模块4将汉语语音识别成带与所识别的汉语语音相同同步信号标记的用26个拉丁字母表示的汉语语音码。
当采用汉语语音码汉语语音识别模块4来进行汉语语音识别时,该汉语语音识别模块将汉语音节作为识别的基元,通过查找预先储存在计算机系统中的汉语音节语音模板和汉语语音音节码对照表,匹配后识别出相应的汉语音节语音码,语音连续输入时便得到连续的汉语音节语音码串,对上述得到汉语音节语音码串通过查词库的方式进行按词切分,对多种单词切分,可以依据汉语词法句法上下文联系及统计规律等手段进行判别后再进行单词切分,对切分出的单词采取同一单词的音节与音节之间连写,词与词之间空格的方式表示。
下面例举用本发明方法对汉语语音进行汉语语音码识别的例子:
1.汉语语音转换成汉语语音码:
比如:我们提取影像资料中的下列汉语句子的汉语语音:
“我们每天使用拉丁文 。”
(1)通过查找预先储存在计算机系统中的汉语音节语音模板和汉语语音音节码对照表,匹配后识别出相应的汉语音节语音码串:
Wov mno mwv tisa xrv ydu laa dqa wnv .(音节与音节之间有空格)
或wovmnomwvtisaxrvydulaadqawnv. (音节与音节之间无空格)
(熟练后mno中的轻音符o在不引起混音时可以省略,以上以下均同。)
为了让大家看清楚这里将表示声调的字母加了下划线,语音码中的声调字母同时具隔音节作用,实际语音码中声调无下划线,熟练汉语语音码后声调兼隔音节符能够方便区分出来。
这样便完成了一个系统的复杂性与系统的词库规模性无关的纯语音识别过程。
(2)将语音码串进行单词切分,最终完成以词为单位的语音码转换。
通过查找预先储存在计算机系统中的分好词的汉语语音码单词词库,将同一个单词的多个音节连写,词与词之间用空格隔开便得到以下我们最终需要的汉语语音码:
Wovmno mwvtisa xrvydu laadqawnv.
再将上述带同步信号标记的汉语语音码字幕传输给传统的视频画面或影像画面字幕叠加机模块5,根据汉语语音码字幕与视频画面或影像画面同步信号标记的对应关系将字幕信息叠加在视频画面或影像画面上。
更进一步在得到汉语语音码后,汉语语音码需要时可以通过汉语语音码汉字转换模块转换成汉字,该汉语语音码汉字转换模块可以内嵌在汉语语音识别模块4中,此时整个系统必须运行在汉字系统的计算机中, 汉语语音码或汉字或汉语拼音能够单独或者汉语语音码与汉字、汉语拼音,意义一致的外文对照显示、储存、输出,具体过程如下:
通过调用汉语语音码汉字双向转换模块计算机通过以下步骤将汉语语音码转换成汉字:
通过分别查找汉语语音码与以词为单位的汉字和汉语拼音对照表可以方便地将汉语语音码转换成汉字和汉语拼音,比如:
wovmno 通过查声码、介码、韵码、调码和汉语拼音对照表或根据该对照表生成的汉语语音码音节或单词和拼音音节或单词对照表得到wǒmen,再通过wǒmen查找到以词为单位的汉字,当以单词为单位的语音码通过以单词为单位的汉语拼音与以单词为单位的汉字建立对应关系后,一旦需要以单词为单位的语音码可以不再需要通过以单词为单位的汉语拼音,直接与以单词为单位的汉字建立对应关系并实行相应的转换。比如: wovmno 可以转换为wǒmen,再通过wǒmen可以转换成 “我们”,这样wovmno和“我们”便直接建立了对应关系,需要时可以不通过汉语拼音wǒmen进行转换,而直接在wovmno和“我们”之间实现双向可逆转换。
遇同音词时,可以依据汉语词法句法上下文联系及统计规律等手段进行判别后进行以词为单位的汉字选定。比如:ysvlune 上装满了邮包。ysvlune上装满了原油。结合上下文的联系可以知道:前面一句中的“ysvlune”代表邮轮,后面一句中的“ysvlune” 代表油轮,这两句话分别会转换成“邮轮上装满了邮包”和“油轮上装满了原油”。对其它单词情况也依次类推。
上述双向可逆转换的结果既可以单独显示也可以对照显示,比如:
原句:“我们每天使用汉语拉丁文。”用本发明方法计算机可以可逆地转换为以下几种形式:
1.“Wǒmen měitiān shǐyòng lādīngwěn。”
2.“wovmno mwvtisa xrvydu laadqawnv.”
3.“Wǒmen měitiān shǐyòng lādīngwěn。”
我们 每天 使用 拉丁文。
4.“wovmno mwvtisa xrvydu laadqawnv.”
我们 每天 使用 拉丁文。
5. “Wǒmen měitiān shǐyòng lādīngwěn。”
“wovmno mwvtisa xrvydu laadqawnv.”
为了让外国人或中国少数民族更方面地了解汉语的含义和学习汉语,也可以在每个对照的单词中插入相应的外语单词或少数民族文字,比如在下面的单词中加入相应的英语单词作中文意思的注解:
“wovmno Wǒmen mwvtisa měitiān xrvydu shǐyòng laadqawnv lādīngwěn 。”
我们 We 每天every day 使用use 拉丁文Latine。
这样我们采用上述方法实现了将汉语语音实时影像资料转加注汉语文字幕的实时影像资料。这样本技术方案中提到的以上以下的汉语字幕就可以是汉语语音码、汉字和汉语拼音,并传输给带汉语语音汉语字幕的音影像资料储存或输出模块11作进一步储存或输出。
最后并通过上述得到的汉语语音并加注汉语字幕的实时影像资料经过音视频编码压缩模块6进行编码和压缩,经上述编码和压缩后再传输给网络传输模块A7,再由网络传输模块A7将编码和压缩后的上述具有相同同步信号标记的汉语文字幕和汉语语音的视频画面或影像画面传输到宽带网络,宽带网络将其传输到指定的带音视频解码解压缩软件服务器模块8上进行储存,带音视频音像播放软件的客户端模块10通过网络传输模块B9登陆到上述带音视频解码解压缩软件服务器模块8通过带现场实时汉语语音和汉语字幕的场景音视频影像资料输出模块12,就可以实时观看上述现场实时带汉语字幕和汉语语音的视频影像资料画面,这样我们就通过本技术的设备完成了实时汉语语音音像资料转化为汉语语音并加注汉语字幕的音像资料的实时录播过程。
用上述方法,所述的设备系统对汉语语音与其对应字幕实现了转换,并且通过现有的视频画面或影像画面与字符信号叠加技术将汉语语音与其对应的汉语字幕实现了转换并与同步对应的视频画面或影像画面合成叠加储存或输出,并进一步通过所述的网络传输和服务器以及客户端可以实时观看转换后的汉语语音和汉语字幕的音像资料画面,进一步需要时可以从服务器上下载该音像资料并转换成各种便于播放的格式供电视台或多媒体机播放。
最后值得指出的是:所述网络传输模块A7或网络传输模块B9,是有线网络传输模块或者是无线网络传输模块中的任意一种,在采用有线网络传输模块时,所述宽带网络是有线宽带网络,在采用无线网络传输模块时,所述宽带网络是无线宽带网络。
所述的无线网络传输模块是3G、4G、wifi、wimax、蓝牙中的任意一种。所采用的计算机也可以是嵌入式计算机系统,由于这些网络和计算机都属于现有技术,具体应用的例子这里就不在一一累述。

Claims (9)

1.一种汉语自动实时标注汉语字幕录播设备, 其特征是:包括话筒和摄像机模块(1)、音视频同步信号标记模块(2)、有声语言音频信号提取模块(3)、汉语语音识别模块(4)、视频画面或影像画面字幕叠加机模块(5)、带汉语语音汉语字幕的音影像资料储存或输出模块(11)、音视频编码压缩模块(6)、网络传输模块A(7)、带音视频解码解压缩软件服务器模块(8)、网络传输模块B(9)、带音视频音像播放软件的客户端模块(10)、带现场实时汉语语音和汉语字幕的场景音视频影像资料输出模块(12);
该设备工作时按以下步骤进行: 在现场实时汉语语音音像录播时,所述录播设备通过话筒和摄像机模块(1),将汉语语音及现场场景录入并储存到所述的音像录播的系统中,系统中的计算机首先通过音视频同步信号标记模块(2)做好通过所述摄像机模块(1)摄制的影像资料中视频画面或影像画面与上述话筒录制的对应的汉语有声语言的音频信号同步信号标记并储存在音像录播设备的储存系统中, 然后将带同步信号标记的汉语有声语言的音频信号通过有声语言音频信号提取模块(3)提取出来,带同步信号标记的汉语有声语言的音频信号提取出来后再传给计算机中的内嵌汉字和汉语拼音与汉语语音码双向转换模块的汉语语音识别模块(4),汉语语音识别模块(4)将汉语语音识别成带与所识别的汉语语音相同同步信号标记的用26个拉丁字母表示的汉语语音码,再将上述带同步信号标记的汉语语音码字幕传输给现有的视频画面或影像画面字幕叠加机模块(5),根据汉语语音码字幕与视频画面或影像画面同步信号标记的对应关系将字幕信息叠加在视频画面或影像画面上,然后与具有相同同步信号标记的带汉语字幕的视频画面或影像画面合成在一起并传输给带汉语语音汉语字幕的音影像资料储存或输出模块(11),然后再通过所述音视频编码压缩模块(6)进行编码和压缩,经上述编码和压缩后再传输给网络传输模块A(7),再由网络传输模块A(7)将编码和压缩后的上述具有相同同步信号标记的带汉语字幕的视频画面或影像画面传输到宽带网络,宽带网络将其传输到指定的带音视频解码解压缩软件服务器模块(8)上进行储存,带音视频音像播放软件的客户端模块(10)通过网络传输模块B(9)登陆到上述带音视频解码解压缩软件服务器模块(8),通过带现场实时汉语语音和汉语字幕的场景音视频影像资料输出模块(12),就可以实时观看上述现场实时带汉语字幕和汉语语音的视频影像资料画面。
2.如权利要求1所述的汉语自动实时标注汉语字幕录播设备,其特征是:所述网络传输模块A(7)或网络传输模块B(9),是有线网络传输模块或者是无线网络传输模块中的任意一种,在采用有线网络传输模块时,所述宽带网络是有线宽带网络,在采用无线网络传输模块时,所述宽带网络是无线宽带网络。
3.如权利要求2所述的汉语自动实时标注汉语字幕录播设备,其特征是: 所述的无线网络传输模块是3G、4G、wifi、wimax、蓝牙中的任意一种。
4.如权利要求1所述的汉语自动实时标注汉语字幕录播设备,其特征是:所述的汉语语音码是以单词为单位,这里将单个汉字看作单音节词,根据组成该单词的每个音节的《汉语拼音方案》中的拼音,用且仅用26个拉丁字母对汉语拼音的声母、介母、韵母、声调采取先编码再依次按“声码+介码+韵码+调码兼隔音节符号”的顺序编码拼写,并通过得到的语音码的编码直接表达汉语信息,当直接用语音码编码来表示汉语信息时,其标点符号的用法同英文的标点符号的用法相同,编码时同一个单词的多个音节不用空格连续编码,单词与单词之间要有空格隔开。
5.如权利要求4所述的汉语自动实时标注汉语字幕录播设备,其特征是:所述的汉语语音码是声母全部用辅音拉丁字母表示,用于表示汉语信息的语音码的声母除了《汉语拼音方案》中的声母zh、ch、sh分别用j、q、x三个辅音拉丁字母表示外,其余的声母用与《汉语拼音方案》中的相同符号的辅音拉丁字母表示,《汉语拼音方案》中的zhi、chi、shi分别用语音码的jr、qr、xr表示,《汉语拼音方案》中的er用语音码的er来表示,jr或qr或xr或er键盘输入时分别按J和R或Q和R或X和R或E和R两个键位输入。
6.如权利要求4所述的汉语自动实时标注汉语字幕录播设备,其特征是: 所述的汉语语音码用26个字母中的一个字母y表示原来《汉语拼音方案》中的单韵母和介母中的ü,其余单韵母和介母的编码采用与《汉语拼音方案》中的单韵母和介母相同的符号。
7.如权利要求4所述的汉语自动实时标注汉语字幕录播设备,其特征是:所述的汉语语音码复合韵母除了用与《汉语拼音方案》中的相同的符号表示外,用一个辅音字母表示。
8.如权利要求4所述的汉语自动实时标注汉语字幕录播设备,其特征是: 所述的汉语语音码其调码用四个元音字母和一个汉语不用的字母v表示,用拉丁字母a、e、v、u、o分别表示《汉语拼音方案》中的阴平-、阳平e:/、上声v:∨、去声u:\、轻声o不标。
9.如权利要求1所述的汉语自动实时标注汉语字幕录播设备,其特征是:所述的汉语语音码,在汉字系统的计算机中可以通过所述汉字和汉语拼音与汉语语音码双向转换模块转换成汉字,汉语语音码或汉字能够单独或者汉语语音码与汉字、汉语拼音,意义一致的外文对照显示、储存、输出。
CN201310243591.0A 2013-06-19 2013-06-19 汉语自动实时标注汉语字幕录播设备 Expired - Fee Related CN103297711B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310243591.0A CN103297711B (zh) 2013-06-19 2013-06-19 汉语自动实时标注汉语字幕录播设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310243591.0A CN103297711B (zh) 2013-06-19 2013-06-19 汉语自动实时标注汉语字幕录播设备

Publications (2)

Publication Number Publication Date
CN103297711A CN103297711A (zh) 2013-09-11
CN103297711B true CN103297711B (zh) 2016-11-02

Family

ID=49097962

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310243591.0A Expired - Fee Related CN103297711B (zh) 2013-06-19 2013-06-19 汉语自动实时标注汉语字幕录播设备

Country Status (1)

Country Link
CN (1) CN103297711B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108366182B (zh) * 2018-02-13 2020-07-07 京东方科技集团股份有限公司 文字语音同步播报的校准方法及装置、计算机存储介质
CN110728120A (zh) * 2019-09-06 2020-01-24 上海陆家嘴国际金融资产交易市场股份有限公司 证件识别过程中自动填入拼音的方法、装置和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005236925A (ja) * 2004-02-23 2005-09-02 Victor Co Of Japan Ltd 字幕デコード装置
CN101118539A (zh) * 2006-08-01 2008-02-06 苗玉水 现代汉语信息全息拉丁化汉语语音码表示法
CN101118540A (zh) * 2006-08-02 2008-02-06 苗玉水 汉字汉语拼音与汉语语音码双向可逆转换方法
CN101118541A (zh) * 2006-08-03 2008-02-06 苗玉水 汉语语音码汉语语音识别方法
CN101131689A (zh) * 2006-08-22 2008-02-27 苗玉水 汉语外语句型转换双向机器翻译方法
CN103905743A (zh) * 2012-12-30 2014-07-02 上海能感物联网有限公司 汉语自动实时标注汉语字幕音像录播方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201039628A (en) * 2009-04-30 2010-11-01 Mitac Int Corp Subtitle generation system and method thereof

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005236925A (ja) * 2004-02-23 2005-09-02 Victor Co Of Japan Ltd 字幕デコード装置
CN101118539A (zh) * 2006-08-01 2008-02-06 苗玉水 现代汉语信息全息拉丁化汉语语音码表示法
CN101118540A (zh) * 2006-08-02 2008-02-06 苗玉水 汉字汉语拼音与汉语语音码双向可逆转换方法
CN101118541A (zh) * 2006-08-03 2008-02-06 苗玉水 汉语语音码汉语语音识别方法
CN101131689A (zh) * 2006-08-22 2008-02-27 苗玉水 汉语外语句型转换双向机器翻译方法
CN103905743A (zh) * 2012-12-30 2014-07-02 上海能感物联网有限公司 汉语自动实时标注汉语字幕音像录播方法

Also Published As

Publication number Publication date
CN103297711A (zh) 2013-09-11

Similar Documents

Publication Publication Date Title
CN103297710B (zh) 汉语自动实时标注中外文字幕音像录播设备
CN103309855A (zh) 汉语与外语自动实时语音翻译并标注字幕的音像录播设备
US20180144747A1 (en) Real-time caption correction by moderator
CN102479208B (zh) 汉语语音码多样网页信息搜索转换翻译方法
CN105159870A (zh) 一种精准完成连续自然语音文本化的处理系统及方法
WO2005081869A3 (en) Method and apparatus for text input in various languages
CN102360413B (zh) 可控密钥序列的具有误导功能的隐写方法
CN101482975A (zh) 一种文字转换动画的方法和装置
JP2023012522A (ja) クロスモーダル情報に基づく文書読解モデルトレーニング方法及び装置
CN103902531A (zh) 汉语与外语自动实时语音翻译并标注字幕的音像录播方法
CN103902529A (zh) 外语自动实时标注中外文字幕音像录播方法
CN103297711B (zh) 汉语自动实时标注汉语字幕录播设备
CN103854648A (zh) 汉语外语有声影像资料双向可逆语音转换并加注字幕方法
CN110493613B (zh) 一种视频音唇同步的合成方法及系统
CN104239363A (zh) 非特定人外语语音现场实时查询指路机信息的方法
Bertoldi et al. On the creation and the annotation of a large-scale Italian-LIS parallel corpus
CN103853709A (zh) 计算机汉语有声影像资料自动加注中外文字幕的方法
CN103905743A (zh) 汉语自动实时标注汉语字幕音像录播方法
CN103336585A (zh) 基于场景感知的一字一键中文输入方法和设备
CN103853705A (zh) 计算机汉语语音与外语语音实时语音字幕翻译方法
CN103297709A (zh) 汉语有声影像资料加注汉语字幕的装置
CN103902530A (zh) 汉语自动实时标注中外文字幕音像录播方法
CN101770328B (zh) 多重切分的中文拼音系统及其方法
CN100458668C (zh) 首音汉字输入法
CN103854647A (zh) 汉语与外语双向实时语音翻译无线移动通讯设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20160817

Address after: 810003 Qinghai city of Xining province Qinghai Biotechnology Industrial Park by the four Road No. 26 building 510 room hatch

Applicant after: QINGHAI HANLA INFORMATION TECHNOLOGY CO., LTD.

Address before: Taicang City, Suzhou City, Jiangsu Province, and 215411 Metro Jianxiong Road No. 20

Applicant before: Jiangsu Huayin Information Science & Technology Co., Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20161102

Termination date: 20200619

CF01 Termination of patent right due to non-payment of annual fee