CN101149957A - 一种音字同步播放的方法及播放器 - Google Patents

一种音字同步播放的方法及播放器 Download PDF

Info

Publication number
CN101149957A
CN101149957A CNA2007101810400A CN200710181040A CN101149957A CN 101149957 A CN101149957 A CN 101149957A CN A2007101810400 A CNA2007101810400 A CN A2007101810400A CN 200710181040 A CN200710181040 A CN 200710181040A CN 101149957 A CN101149957 A CN 101149957A
Authority
CN
China
Prior art keywords
captions
voice data
subtitle file
word
play position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007101810400A
Other languages
English (en)
Other versions
CN101149957B (zh
Inventor
李匡匡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Actions Semiconductor Co Ltd
Original Assignee
Actions Semiconductor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Actions Semiconductor Co Ltd filed Critical Actions Semiconductor Co Ltd
Priority to CN2007101810400A priority Critical patent/CN101149957B/zh
Publication of CN101149957A publication Critical patent/CN101149957A/zh
Application granted granted Critical
Publication of CN101149957B publication Critical patent/CN101149957B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Television Systems (AREA)
  • Studio Circuits (AREA)

Abstract

本发明适用于音频播放领域,提供了一种音字同步播放方法及播放器,所述方法包括下述步骤:根据当前显示字幕,从字幕文件中读取所述当前显示字幕的下一字幕的字时延;根据所述字时延计算显示所述下一字幕时的音频数据的播放位置;当音频数据播放至所述显示下一字幕时的音频数据的播放位置时,显示所述下一字幕;循环执行上述步骤,直至所述字幕文件显示完毕。在本发明实施例中,根据当前显示字幕以及当前显示字幕的下一个字幕的字时延,计算显示下一个字幕时的音频数据的播放位置,当音频数据播放至该位置时,即显示下一个字幕,从而实现了歌词按字同步播放的功能。

Description

一种音字同步播放的方法及播放器
技术领域
本发明属于音频播放领域,尤其涉及一种音频和文字同步播放的方法及播放器。
背景技术
目前各种数码播放器为了增加娱乐性和便利性,在播放音频数据的同时,向用户显示音频数据的字幕,便于用户跟唱。
为了达到在音频数据播放过程中,同步显示音频数据的字幕,先将字幕按LRC格式保存成LRC字幕文件。LRC字幕文件中包括字幕、若干时间标签(Time-Tag)和若干标识标签(ID-Tag)。其中时间标签的形式为[mm:ss.ms]([分钟数:秒数.毫秒数])或者[mm:ss]([分钟数:秒数]),分钟数、秒数、毫秒数均为非负整数。同时为LRC字幕文件中的每行字幕分配一起始时间标签和结束时间标签。
将字幕按LRC格式保存成LRC字幕文件后,在播放音频数据时,读取该LRC字幕文件,当音频数据播放的时间与LRC字幕文件中的某行字幕的起始播放时间相同时,从LRC字幕文件中读取该行字幕,并在屏幕上高亮显示该行字幕,即可达到歌词按行同步显示的效果。
这种实现歌词按字同步的方法的不足之处在于,根据预先设定的每行字幕的起始播放时间和结束播放时间只能实现歌词按行同步,难以实现歌词按字同步的效果。
发明内容
本发明实施例的目的在于提供一种音字同步播放方法,旨在解决由于现有的音字同步播放方法是根据每行字幕的起始播放时间和结束播放时间实现歌词按行同步的,难以实现歌词按字同步的问题。
本发明实施例是这样实现的,一种音字同步播放方法,所述方法包括下述步骤:
根据当前显示字幕,从字幕文件中读取所述当前显示字幕的下一字幕的字时延;
根据所述字时延计算显示所述下一字幕时的音频数据的播放位置;
当音频数据播放至所述显示下一字幕时的音频数据的播放位置时,显示所述下一字幕;
循环执行上述步骤,直至所述字幕文件显示完毕。
本发明实施例的另一目的在于提供一种音字同步播放器,所述音字同步播放器包括:
字幕文件存储单元,用于存储字幕文件,所述字幕文件包括字时延字段;
微处理器,用于根据当前显示字幕,从所述字幕文件中读取所述当前显示字幕的下一字幕的字时延,同时根据字幕显示控制指令从所述字幕文件中读取所述当前显示字幕的下一字幕;
音频解码器,用于根据所述字时延计算显示下一字幕时的音频数据的播放位置,同时当音频数据播放至所述音频数据的位置时,产生一字幕显示控制指令,并输出至所述微处理器;
字幕显示单元,用于在所述微处理器的控制下显示所述当前显示字幕的下一字幕。
在本发明实施例中,根据当前显示字幕以及当前显示字幕的下一个字幕的字时延,计算显示下一个字幕时的音频数据的播放位置,当音频数据播放至该位置时,即显示下一个字幕,从而实现了歌词按字同步播放的功能。
附图说明
图1是本发明实施例提供的音字同步播放方法的实现流程图;
图2是本发明实施例提供的音字同步播放器的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在本发明实施例中,根据当前显示字幕以及当前显示字幕的下一个字幕的字时延,计算显示下一个字幕时的音频数据的播放位置,当音频数据播放至该位置时,即显示下一个字幕,从而实现了音字同步播放的功能。
为了实现字幕按字同步,在本发明实施例中,预先定义一种字幕存储格式,并将音频数据的字幕存储为上述定义的字幕存储格式的字幕文件。该字幕文件包括字幕字段、时间标签字段、标识标签字段以及字时延字段。其中字幕字段、标识标签字段以及时间标签字段的定义和表示形式与LRC字幕文件相同,字时延字段用于表示后一个字幕比前一个字幕显示的时延,其表示形式为Tag[ms](Tag[毫秒数]),毫秒数为非负整数。在本发明实施例中,将上述定义的字幕格式称为AKC(Action Kalaok Caption)格式,将符合这种格式的字幕文件称为AKC字幕文件。
在制作AKC字幕文件时,为用于注释的字幕设置标识标签。为每一行字幕分配一起始时间标签,用于表示该行字幕显示的起始时间。为每一个字幕分配一字时延,用于表示后一字幕比前一字幕显示的时延。
如其存储格式可以如下所述:
[ti:白狐]
[ar:陈瑞]
[00:00.60]《白狐》
[00:12.78]陈瑞
[00:27.93]
[00:38.3]我[200]是[960]一[1000]只[200]修[200]行[200]千[1600]年[200]的[200]狐
[00:44.71]千[200]年修行[400]千年孤独
其中[ti:白狐]为标识标签,[00:00.60]、[00:12.78]、[00:27.93]等为每一行字幕的起始时间标签,[200]、[960]、[1000]等是为每一个字幕分配的字时延。
图1示出了本发明实施例提供的音字同步播放方法的实现流程,详述如下:
在步骤S101中,根据当前显示的字幕从AKC字幕文件中读取当前显示的字幕的下一个字幕的字时延;
在步骤S102中,根据获取的下一个字幕的字时延计算显示下一个字幕的音频数据的播放位置。由于播放器一般都采用脉冲编码调制(Pulse CodeModulation,PCM)对音频模拟信号数字化进行取样,从而通过PCM以及音频采样率可以将音频数据播放时间精确到毫秒级,根据获取的下一个字幕的字时延计算显示下一个字幕的PCM的位置,该PCM的位置即为显示下一个字幕的音频数据的播放位置,其计算公式为:PCM Place=字时延/(fs/1000);
在步骤S103中,当音频数据播放至计算出的显示下一个字幕的PCM位置时,高亮显示下一个字幕,从而达到字幕按字同步的效果;
在步骤S104中,判断字幕文件是否显示完毕,如果未显示完毕,执行步骤S101,否则结束。
以下以上述例子中的AKC字幕文件为例,详细说明基于AKC字幕文字的音字同步播放方法的流程。假设音频采样率fs=8khz,当前的AKC文件如下:[00:38.3]我[200]是[960]一[1000]只[200]修[200]行[200]千[1600]年[200]的[200]狐,当前显示的字幕为“[00:38.3]我[200]是”,则下一个要显示的字幕为“一”,则实现音字同步的过程如下:
根据当前显示的字幕“[00:38.3]我[200]是”,从AKC字幕文件中读取下一个要显示的字幕的字时延“[960]”;
根据获取的字时延“[960]”计算下一个字幕“一”显示的时间标签。计算下一个字幕的显示的时间标签,即根据该字时延计算播放完多少个PCM单位的音频数据后,显示下一个字幕,即PCM Place=960/(fs/1000)=120,即播放完120个单位的PCM后显示下一个字幕“一”;
当音频数据播放到上述计算的显示下一个字幕的PCM的位置时,在屏幕上显示下一个字幕“一”;
判断该AKC字幕文件是否显示完毕,如果没有,重复上述步骤,直至该AKC字幕文件显示完毕。
图2示出了本发明实施例提供的音字同步播放器的结构,为了便于说明,仅示出了与本发明实施例相关的部分。
字幕文件存储单元21存储AKC字幕文件,其中AKC字幕文件的定义如上所述,其包括字幕字段、标识标签字段、时间标签字段以及字时延字段,且每行字幕分配一时间标签,每个字幕分配一字时延,用以表示下一个字幕比前一个字幕显示的时延。
微处理器22从字幕文件存储单元21存储的字幕文件中读取当前显示字幕的下一个字幕的字时延,并将读取的下一个字幕的字时延输出至音频解码器23。同时根据接收到的字幕显示控制指令,从字幕文件存储单元21存储的字幕文件中读取当前显示字幕的下一个字幕,并输出至字幕显示单元24。
音频解码器23接收到微处理器22输出的当前显示字幕的下一个字幕的字时延后,根据采样率和该字时延,计算显示下一个字幕时的音频数据的播放位置,即显示下一个字幕时的PCM的位置。当音频数据播放至该音频数据的位置时,产生一字幕显示控制指令,并输出至微处理器22。
字幕显示单元24在微处理器22的控制下,在屏幕上显示微控制器22传输的字幕。
其中音频解码器23包括PCM位置计算单元231、音频解码单元232以及显示控制指令产生单元233。
PCM位置计算单元231根据接收的下一个字幕的字时延计算显示下一个字幕时的音频数据的播放位置,即PCM的位置。其计算公式为:PCM Place=字时延/(采样率/1000)。输出计算出的显示下一个字幕时的音频数据的播放位置至显示控制指令产生单元233。
音频解码单元232对音频数据进行解码,并输出音频数据的当前播放位置。其根据当前解码的音频数据以及采样率,可以计算出精确的PCM的播放时间。
显示控制指令产生单元233在音频解码单元232对音频数据解码至PCM位置计算单元231计算出的显示下一个字幕时的音频数据的播放位置时,产生字幕显示控制指令,并将该字幕显示控制指令传输至微控制器22。
其中PCM位置计算单元231以及显示控制指令产生单元233也可以作为独立的单元。
在本发明实施例中,根据每行字幕的起始时间标签,显示每行的起始字幕,根据当前显示字幕以及当前显示字幕的下一个字幕的字时延,计算显示下一个字幕时的音频数据的播放位置,当音频数据播放至该位置时,即显示下一个字幕,从而实现了音字同步播放的功能。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种音字同步播放方法,其特征在于,所述方法包括下述步骤:
根据当前显示字幕,从字幕文件中读取所述当前显示字幕的下一字幕的字时延;
根据所述字时延计算显示所述下一字幕时的音频数据的播放位置;
当音频数据播放至所述显示下一字幕时的音频数据的播放位置时,显示所述下一字幕;
循环执行上述步骤,直至所述字幕文件显示完毕。
2.如权利要求1所述的方法,其特征在于,所述字幕文件包括字幕字段、时间标签字段、标识标签字段和字时延字段。
3.一种音字同步播放器,其特征在于,所述音字同步播放器包括:
字幕文件存储单元,用于存储字幕文件,所述字幕文件包括字时延字段;
微处理器,用于根据当前显示字幕,从所述字幕文件中读取所述当前显示字幕的下一字幕的字时延,同时根据字幕显示控制指令从所述字幕文件中读取所述当前显示字幕的下一字幕;
音频解码器,用于根据所述字时延计算显示下一字幕时的音频数据的播放位置,同时当音频数据播放至所述音频数据的位置时,产生一字幕显示控制指令,并输出至所述微处理器;
字幕显示单元,用于在所述微处理器的控制下显示所述当前显示字幕的下一字幕。
4.如权利要求3所述的音字同步播放器,其特征在于,所述音频解码器包括:
PCM位置计算单元,用于根据所述字时延计算显示下一个字幕时的音频数据的播放位置;
音频解码单元,用于对音频数据进行解码,并输出音频数据的当前播放位置;
显示控制指令产生单元,用于当所述音频解码单元输出的音频数据的当前播放位置与所述PCM位置计算单元计算出的显示下一个字幕时的音频数据的播放位置相同时,产生字幕显示控制指令,并输出至所述微控制器。
5.如权利要求3或者4所述的音字同步播放器,其特征在于,所述字幕文件包括字幕字段、时间标签字段、标识标签字段和字时延字段。
CN2007101810400A 2007-09-30 2007-09-30 一种音字同步播放的方法及播放器 Expired - Fee Related CN101149957B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007101810400A CN101149957B (zh) 2007-09-30 2007-09-30 一种音字同步播放的方法及播放器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007101810400A CN101149957B (zh) 2007-09-30 2007-09-30 一种音字同步播放的方法及播放器

Publications (2)

Publication Number Publication Date
CN101149957A true CN101149957A (zh) 2008-03-26
CN101149957B CN101149957B (zh) 2010-06-23

Family

ID=39250426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101810400A Expired - Fee Related CN101149957B (zh) 2007-09-30 2007-09-30 一种音字同步播放的方法及播放器

Country Status (1)

Country Link
CN (1) CN101149957B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009067878A1 (fr) * 2007-11-08 2009-06-04 Tencent Technology (Shenzhen) Company Limited Procédé et système d'affichage de caractères de paroles
WO2011124110A1 (zh) * 2010-04-09 2011-10-13 青岛海信移动通信技术股份有限公司 移动终端播放歌曲的方法及可播放歌曲的移动终端
CN104244065A (zh) * 2014-09-04 2014-12-24 无锡天脉聚源传媒科技有限公司 一种字幕处理的方法及装置
CN106652983A (zh) * 2016-09-18 2017-05-10 福建网龙计算机网络信息技术有限公司 一种字幕制作方法及系统
CN108962286A (zh) * 2018-10-15 2018-12-07 腾讯音乐娱乐科技(深圳)有限公司 音频识别方法、装置及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100297206B1 (ko) * 1999-01-08 2001-09-26 노영훈 자막 엠피 3 정보 구조 및 이를 재생하는 플레이어
CN1471305A (zh) * 2002-07-25 2004-01-28 梁肇新 多媒体音视频与说明文字的同步驱动技术
KR100541215B1 (ko) * 2003-11-24 2006-01-10 (주)테일러테크놀로지 디지탈 오디오파일의 가사제공시스템
CN1794216A (zh) * 2005-11-01 2006-06-28 无敌科技(西安)有限公司 一种将音频文件与对应的文字数据同步播放的方法
CN1932976B (zh) * 2006-09-18 2010-06-23 北京北大方正电子有限公司 一种实现视音频处理中字幕与语音同步的方法和系统
CN100418095C (zh) * 2006-10-20 2008-09-10 无敌科技(西安)有限公司 音词同步的播放系统及其方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009067878A1 (fr) * 2007-11-08 2009-06-04 Tencent Technology (Shenzhen) Company Limited Procédé et système d'affichage de caractères de paroles
WO2011124110A1 (zh) * 2010-04-09 2011-10-13 青岛海信移动通信技术股份有限公司 移动终端播放歌曲的方法及可播放歌曲的移动终端
CN104244065A (zh) * 2014-09-04 2014-12-24 无锡天脉聚源传媒科技有限公司 一种字幕处理的方法及装置
CN104244065B (zh) * 2014-09-04 2017-08-08 无锡天脉聚源传媒科技有限公司 一种字幕处理的方法及装置
CN106652983A (zh) * 2016-09-18 2017-05-10 福建网龙计算机网络信息技术有限公司 一种字幕制作方法及系统
CN108962286A (zh) * 2018-10-15 2018-12-07 腾讯音乐娱乐科技(深圳)有限公司 音频识别方法、装置及存储介质
CN108962286B (zh) * 2018-10-15 2020-12-01 腾讯音乐娱乐科技(深圳)有限公司 音频识别方法、装置及存储介质

Also Published As

Publication number Publication date
CN101149957B (zh) 2010-06-23

Similar Documents

Publication Publication Date Title
CN101427580B (zh) 使用从内容流确定的指纹进行脚本同步
CN101149957B (zh) 一种音字同步播放的方法及播放器
JP3918580B2 (ja) マルチメディア情報符号化装置、マルチメディア情報再生装置、マルチメディア情報符号化処理プログラム及びマルチメディア情報再生処理プログラム
JP2003505743A (ja) 楽器ディジタルインタフェース(midi)データを使用するオーディオ番組放送のための方法及び装置
CN102324191B (zh) 一种有声读物逐字同步显示方法及系统
CN101261864B (zh) 一种在移动终端上实现录音合成的方法和系统
CA2578190C (en) Device and method for generating a coded multi-channel signal and device and method for decoding a coded multi-channel signal
CN102610267B (zh) 一种改善播放系统音频播放质量的方法
EP1953761A3 (en) A method of reproducing text-based subtitle data including style information
CN102568261A (zh) 乐器辅助学习机
CN1953044A (zh) 一种基于midi文件的乐器演奏提示和检测系统及方法
US8881045B2 (en) Method and apparatus for generating prompt information of a mobile terminal
CN104361883B (zh) 歌唱评测标准文件制作方法和装置
CN109785868A (zh) 音乐文件转化与播放方法、装置、计算机设备及存储介质
CN110797003A (zh) 一种文本转语音显示字幕信息的方法
CN110070849A (zh) 音频演奏方法及计算机可读存储介质
CN101425230A (zh) 一种在连续语境下学习单字发音的方法及装置
CN101916577A (zh) 一种音视频播放同步的方法及装置
CN109065018A (zh) 一种面向智能机器人的故事数据处理方法及系统
CN201585019U (zh) 具有语音转换功能的移动终端
JP2008518248A (ja) Midiファイルを再生する装置及び方法
CN111081116A (zh) 一种声乐转换钢琴曲的钢琴学习系统
CN213718159U (zh) 一种用于具备tts语音播放功能的收费车道系统
CN110085227B (zh) 编辑语音技能文件的方法和装置、电子设备、可读介质
CN100416651C (zh) 混合参数模式的语音合成系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP02 Change in the address of a patent holder

Address after: 519085 hi tech Zone, Guangdong, Zhuhai science and Technology Innovation Coast Road, No. four, No. 1

Patentee after: Juli Integrated Circuit Design Co., Ltd.

Address before: 519085 No. 1, unit 15, building 1, 1 Da Ha Road, Tang Wan Town, Guangdong, Zhuhai

Patentee before: Juli Integrated Circuit Design Co., Ltd.

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100623

Termination date: 20130930