CN114333918A - 一种有声读物字幕匹配方法和装置 - Google Patents

一种有声读物字幕匹配方法和装置 Download PDF

Info

Publication number
CN114333918A
CN114333918A CN202011029546.1A CN202011029546A CN114333918A CN 114333918 A CN114333918 A CN 114333918A CN 202011029546 A CN202011029546 A CN 202011029546A CN 114333918 A CN114333918 A CN 114333918A
Authority
CN
China
Prior art keywords
audio
words
subtitles
time information
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011029546.1A
Other languages
English (en)
Inventor
邓裕强
朱志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Jiubang Digital Technology Co Ltd
Original Assignee
Guangzhou Jiubang Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Jiubang Digital Technology Co Ltd filed Critical Guangzhou Jiubang Digital Technology Co Ltd
Priority to CN202011029546.1A priority Critical patent/CN114333918A/zh
Publication of CN114333918A publication Critical patent/CN114333918A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明提供的一种有声读物字幕匹配方法和装置,通过对所述音频内容时刻信息的读取,匹配到各个单子字幕的时刻信息,生成字幕后,就可以实现实时匹配,相比较现有技术,字幕匹配的精度更高。

Description

一种有声读物字幕匹配方法和装置
技术领域
本发明涉及音频字幕技术领域,尤其涉及一种有声读物字幕匹配方法和装置。
背景技术
有声小说,有声读物,作为当代年轻人的热衷的生活方式之一,也作为家长们陪伴小朋友的学前读物,但没有字幕匹配的有声读物,有声小说,难以满足不同用户的需求,虽然当前有存在的字母匹配技术,却不能做到与音频的实时匹配。
发明内容
为了解决当前遇到的问题,本发明提供一种有声读物字幕匹配方法和装置,所述方法主要解决有声读物,特别是用户,博主等自己录制的音频,字幕不能实时匹配的难题。
根据本发明一个方面,提供了一种有声读物字幕匹配方法,其中,该方法包括:
获取有声读物音频,按照顺序生成识别到的单词及对应的开始时刻。
根据单词和单词时刻点,生成由单词和时刻信息组成的单词时刻列表,所述列表中每个元素为键值对,key存放单词,Value存放时刻信息。
生成.lrc文件字幕,根据时刻信息匹配音频。
根据本发明的一个方面,还提供一种在播放设备上位有声读物音频匹配字幕文件的装置,其中,所述装置包括:
音频读取装置:获取有声读物音频,按照顺序生成识别到的单词及对应的开始时刻。
数据整理装置:根据单词和单词时刻点,生成由单词和时刻信息组成的单词时刻列表,所述列表中每个元素为键值对,key存放单词,Value存放时刻信息。
字幕生成装置:生成.lrc文件字幕,根据时刻信息匹配音频。
本发明提供的一种有声读物字幕匹配方法和装置,通过对所述音频内容时刻信息的读取,匹配到各个单子字幕的时刻信息,生成字幕后,就可以实现实时匹配,相比较现有技术,字幕匹配的精度更高。
附图说明
图1示出了本发明的一种有声读物字幕匹配方法流程图。
图2示出了本发明的一种有声读物字幕匹配配置流程图。
具体实施方式
为了更加详细的讨论本技术方案,通过以下实施例做详细说明。
参照图1,一种有声读物字幕匹配的方法,其中,该方法包括:
获取有声读物音频,按照顺序生成识别到的单词及对应的开始时刻。
根据单词和单词时刻点,生成由单词和时刻信息组成的单词时刻列表,所述列表中每个元素为键值对,key存放单词,Value存放时刻信息。
生成.lrc文件字幕,根据时刻信息匹配音频。
根据本发明的一个方面,还提供一种在播放设备上位有声读物音频匹配字幕文件的装置,其中,所述装置包括:
音频读取装置:获取有声读物音频,按照顺序生成识别到的单词及对应的开始时刻。
数据整理装置:根据单词和单词时刻点,生成由单词和时刻信息组成的单词时刻列表,所述列表中每个元素为键值对,key存放单词,Value存放时刻信息。
字幕生成装置:生成.lrc文件字幕,根据时刻信息匹配音频。
根据本发明的一个方面,还提供了一种网络设备,其包括至少一个存储器和至少一个处理器,其中,所述存储器中包括计算机可执行指令,当所述计算机可执行指令被所述处理器执行,如上述在网络设备为视频匹配字幕文件的方法的操作被执行。
根据本发明的一个方面,还提供了一种计算机程序产品,其包括计算机可执行指令,当所述计算机可执行指令被网络设备执行,如上述在网络设备为视频匹配字幕文件的方法被执行。
根据本发明的一个方面,还提供了一种计算机可读存储介质,其包括计算机可执行指令,当所述计算机可执行指令被网络设备执行,如上述在网络设备为视频匹配字幕文件的方法被执行。
根据本发明的一个方面,还提供了一种播放设备,其包括至少一个存储器和至少一个处理器,其中,所述存储器中包括计算机可执行指令,当所述计算机可执行指令被所述处理器执行,如上述在播放设备为视频匹配字幕文件的方法的操作被执行。
根据本发明的一个方面,还提供了一种计算机程序产品,其包括计算机可执行指令,当所述计算机可执行指令被播放设备执行,如上述在播放设备为视频匹配字幕文件的方法被执行。
根据本发明的一个方面,还提供了一种计算机可读存储介质,其包括计算机可执行指令,当所述计算机可执行指令被播放设备执行,如上述在播放设备为视频匹配字幕文件的方法被执行。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (2)

1.一种有声读物字幕匹配方法,所述方法包括:
获取有声读物音频,按照顺序生成识别到的单词及对应的开始时刻;
根据单词和单词时刻点,生成由单词和时刻信息组成的单词时刻列表,所述列表中每个元素为键值对,key存放单词,Value存放时刻信息;
生成.lrc文件字幕,根据时刻信息匹配音频。
2.一种有声读物字幕匹配的装置,所述装置包括:
音频读取装置:获取有声读物音频,按照顺序生成识别到的单词及对应的开始时刻;
数据整理装置:根据单词和单词时刻点,生成由单词和时刻信息组成的单词时刻列表,所述列表中每个元素为键值对,key存放单词,Value存放时刻信息;
字幕生成装置:生成.lrc文件字幕,根据时刻信息匹配音频。
CN202011029546.1A 2020-09-27 2020-09-27 一种有声读物字幕匹配方法和装置 Pending CN114333918A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011029546.1A CN114333918A (zh) 2020-09-27 2020-09-27 一种有声读物字幕匹配方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011029546.1A CN114333918A (zh) 2020-09-27 2020-09-27 一种有声读物字幕匹配方法和装置

Publications (1)

Publication Number Publication Date
CN114333918A true CN114333918A (zh) 2022-04-12

Family

ID=81010588

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011029546.1A Pending CN114333918A (zh) 2020-09-27 2020-09-27 一种有声读物字幕匹配方法和装置

Country Status (1)

Country Link
CN (1) CN114333918A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102801925A (zh) * 2012-08-08 2012-11-28 无锡天脉聚源传媒科技有限公司 一种字幕加配的方法及装置
US20130216202A1 (en) * 2011-08-31 2013-08-22 Nokia Corporation Method, apparatus and computer program product for subtitle synchronization in multimedia content
CN104038804A (zh) * 2013-03-05 2014-09-10 三星电子(中国)研发中心 基于语音识别的字幕同步装置和方法
US20160293160A1 (en) * 2013-04-02 2016-10-06 Igal NIR Automatic Generation Of A Database For Speech Recognition From Video Captions
CN106792097A (zh) * 2016-12-27 2017-05-31 深圳Tcl数字技术有限公司 音频信号字幕匹配方法及装置
CN106847315A (zh) * 2017-01-24 2017-06-13 广州朗锐数字传媒科技有限公司 一种有声读物逐句同步展示方法
CN108959163A (zh) * 2018-06-28 2018-12-07 掌阅科技股份有限公司 有声电子书的字幕显示方法、电子设备及计算机存储介质
KR101996551B1 (ko) * 2018-01-02 2019-07-04 중앙대학교 산학협력단 음성인식 및 대본을 이용하는 자막 생성 장치 및 방법
US10423660B1 (en) * 2017-12-07 2019-09-24 Amazon Technologies, Inc. System for detecting non-synchronization between audio and subtitle
CN111008300A (zh) * 2019-11-20 2020-04-14 四川互慧软件有限公司 一种在音视频中基于关键词的时间戳定位搜索方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130216202A1 (en) * 2011-08-31 2013-08-22 Nokia Corporation Method, apparatus and computer program product for subtitle synchronization in multimedia content
CN102801925A (zh) * 2012-08-08 2012-11-28 无锡天脉聚源传媒科技有限公司 一种字幕加配的方法及装置
CN104038804A (zh) * 2013-03-05 2014-09-10 三星电子(中国)研发中心 基于语音识别的字幕同步装置和方法
US20160293160A1 (en) * 2013-04-02 2016-10-06 Igal NIR Automatic Generation Of A Database For Speech Recognition From Video Captions
CN106792097A (zh) * 2016-12-27 2017-05-31 深圳Tcl数字技术有限公司 音频信号字幕匹配方法及装置
CN106847315A (zh) * 2017-01-24 2017-06-13 广州朗锐数字传媒科技有限公司 一种有声读物逐句同步展示方法
US10423660B1 (en) * 2017-12-07 2019-09-24 Amazon Technologies, Inc. System for detecting non-synchronization between audio and subtitle
KR101996551B1 (ko) * 2018-01-02 2019-07-04 중앙대학교 산학협력단 음성인식 및 대본을 이용하는 자막 생성 장치 및 방법
CN108959163A (zh) * 2018-06-28 2018-12-07 掌阅科技股份有限公司 有声电子书的字幕显示方法、电子设备及计算机存储介质
CN111008300A (zh) * 2019-11-20 2020-04-14 四川互慧软件有限公司 一种在音视频中基于关键词的时间戳定位搜索方法

Similar Documents

Publication Publication Date Title
KR102081495B1 (ko) 계정 추가 방법, 단말, 서버, 및 컴퓨터 저장 매체
TWI260510B (en) Method of and apparatus for synchronizing interactive contents
CN105869446A (zh) 一种电子阅读装置和语音阅读加载方法
CN106851401A (zh) 一种自动添加字幕的方法及系统
US20140164371A1 (en) Extraction of media portions in association with correlated input
CN106059904B (zh) 基于即时通讯软件进行直播歌曲打分的方法与系统
CN105609106A (zh) 记事文档生成方法和装置
CN109995939B (zh) 信息处理方法和电子设备
US8538758B2 (en) Electronic apparatus
CN102737690B (zh) 音乐应用启动的方法及终端
WO2014154097A1 (en) Automatic page content reading-aloud method and device thereof
US11425072B2 (en) Inline responses to video or voice messages
CN106681523A (zh) 一种输入法的字库配置方法、装置以及调用处理方法
US20160217704A1 (en) Information processing device, control method therefor, and computer program
CN112541323A (zh) 一种朗读素材处理方法及装置
EP1168329A3 (en) Storage medium, apparatus for creating recordation data therefor and apparatus for restoring recorded data
WO2022228377A1 (zh) 录音方法、装置、电子设备和可读存储介质
CN106209575A (zh) 信息发送方法、获取方法、装置及界面系统
CN114333918A (zh) 一种有声读物字幕匹配方法和装置
CN106657255A (zh) 文件共享的方法、装置和终端设备
US11315607B2 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
CN110959174A (zh) 信息处理装置、信息处理方法以及程序
CN106777369B (zh) 一种为有声书添加书签的系统及方法
CN106339424A (zh) 一种网页保存处理方法及装置
CN110516043A (zh) 用于问答系统的答案生成方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination