CN114333918A - 一种有声读物字幕匹配方法和装置 - Google Patents
一种有声读物字幕匹配方法和装置 Download PDFInfo
- Publication number
- CN114333918A CN114333918A CN202011029546.1A CN202011029546A CN114333918A CN 114333918 A CN114333918 A CN 114333918A CN 202011029546 A CN202011029546 A CN 202011029546A CN 114333918 A CN114333918 A CN 114333918A
- Authority
- CN
- China
- Prior art keywords
- audio
- words
- subtitles
- time information
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明提供的一种有声读物字幕匹配方法和装置,通过对所述音频内容时刻信息的读取,匹配到各个单子字幕的时刻信息,生成字幕后,就可以实现实时匹配,相比较现有技术,字幕匹配的精度更高。
Description
技术领域
本发明涉及音频字幕技术领域,尤其涉及一种有声读物字幕匹配方法和装置。
背景技术
有声小说,有声读物,作为当代年轻人的热衷的生活方式之一,也作为家长们陪伴小朋友的学前读物,但没有字幕匹配的有声读物,有声小说,难以满足不同用户的需求,虽然当前有存在的字母匹配技术,却不能做到与音频的实时匹配。
发明内容
为了解决当前遇到的问题,本发明提供一种有声读物字幕匹配方法和装置,所述方法主要解决有声读物,特别是用户,博主等自己录制的音频,字幕不能实时匹配的难题。
根据本发明一个方面,提供了一种有声读物字幕匹配方法,其中,该方法包括:
获取有声读物音频,按照顺序生成识别到的单词及对应的开始时刻。
根据单词和单词时刻点,生成由单词和时刻信息组成的单词时刻列表,所述列表中每个元素为键值对,key存放单词,Value存放时刻信息。
生成.lrc文件字幕,根据时刻信息匹配音频。
根据本发明的一个方面,还提供一种在播放设备上位有声读物音频匹配字幕文件的装置,其中,所述装置包括:
音频读取装置:获取有声读物音频,按照顺序生成识别到的单词及对应的开始时刻。
数据整理装置:根据单词和单词时刻点,生成由单词和时刻信息组成的单词时刻列表,所述列表中每个元素为键值对,key存放单词,Value存放时刻信息。
字幕生成装置:生成.lrc文件字幕,根据时刻信息匹配音频。
本发明提供的一种有声读物字幕匹配方法和装置,通过对所述音频内容时刻信息的读取,匹配到各个单子字幕的时刻信息,生成字幕后,就可以实现实时匹配,相比较现有技术,字幕匹配的精度更高。
附图说明
图1示出了本发明的一种有声读物字幕匹配方法流程图。
图2示出了本发明的一种有声读物字幕匹配配置流程图。
具体实施方式
为了更加详细的讨论本技术方案,通过以下实施例做详细说明。
参照图1,一种有声读物字幕匹配的方法,其中,该方法包括:
获取有声读物音频,按照顺序生成识别到的单词及对应的开始时刻。
根据单词和单词时刻点,生成由单词和时刻信息组成的单词时刻列表,所述列表中每个元素为键值对,key存放单词,Value存放时刻信息。
生成.lrc文件字幕,根据时刻信息匹配音频。
根据本发明的一个方面,还提供一种在播放设备上位有声读物音频匹配字幕文件的装置,其中,所述装置包括:
音频读取装置:获取有声读物音频,按照顺序生成识别到的单词及对应的开始时刻。
数据整理装置:根据单词和单词时刻点,生成由单词和时刻信息组成的单词时刻列表,所述列表中每个元素为键值对,key存放单词,Value存放时刻信息。
字幕生成装置:生成.lrc文件字幕,根据时刻信息匹配音频。
根据本发明的一个方面,还提供了一种网络设备,其包括至少一个存储器和至少一个处理器,其中,所述存储器中包括计算机可执行指令,当所述计算机可执行指令被所述处理器执行,如上述在网络设备为视频匹配字幕文件的方法的操作被执行。
根据本发明的一个方面,还提供了一种计算机程序产品,其包括计算机可执行指令,当所述计算机可执行指令被网络设备执行,如上述在网络设备为视频匹配字幕文件的方法被执行。
根据本发明的一个方面,还提供了一种计算机可读存储介质,其包括计算机可执行指令,当所述计算机可执行指令被网络设备执行,如上述在网络设备为视频匹配字幕文件的方法被执行。
根据本发明的一个方面,还提供了一种播放设备,其包括至少一个存储器和至少一个处理器,其中,所述存储器中包括计算机可执行指令,当所述计算机可执行指令被所述处理器执行,如上述在播放设备为视频匹配字幕文件的方法的操作被执行。
根据本发明的一个方面,还提供了一种计算机程序产品,其包括计算机可执行指令,当所述计算机可执行指令被播放设备执行,如上述在播放设备为视频匹配字幕文件的方法被执行。
根据本发明的一个方面,还提供了一种计算机可读存储介质,其包括计算机可执行指令,当所述计算机可执行指令被播放设备执行,如上述在播放设备为视频匹配字幕文件的方法被执行。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (2)
1.一种有声读物字幕匹配方法,所述方法包括:
获取有声读物音频,按照顺序生成识别到的单词及对应的开始时刻;
根据单词和单词时刻点,生成由单词和时刻信息组成的单词时刻列表,所述列表中每个元素为键值对,key存放单词,Value存放时刻信息;
生成.lrc文件字幕,根据时刻信息匹配音频。
2.一种有声读物字幕匹配的装置,所述装置包括:
音频读取装置:获取有声读物音频,按照顺序生成识别到的单词及对应的开始时刻;
数据整理装置:根据单词和单词时刻点,生成由单词和时刻信息组成的单词时刻列表,所述列表中每个元素为键值对,key存放单词,Value存放时刻信息;
字幕生成装置:生成.lrc文件字幕,根据时刻信息匹配音频。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011029546.1A CN114333918A (zh) | 2020-09-27 | 2020-09-27 | 一种有声读物字幕匹配方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011029546.1A CN114333918A (zh) | 2020-09-27 | 2020-09-27 | 一种有声读物字幕匹配方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114333918A true CN114333918A (zh) | 2022-04-12 |
Family
ID=81010588
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011029546.1A Pending CN114333918A (zh) | 2020-09-27 | 2020-09-27 | 一种有声读物字幕匹配方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114333918A (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102801925A (zh) * | 2012-08-08 | 2012-11-28 | 无锡天脉聚源传媒科技有限公司 | 一种字幕加配的方法及装置 |
US20130216202A1 (en) * | 2011-08-31 | 2013-08-22 | Nokia Corporation | Method, apparatus and computer program product for subtitle synchronization in multimedia content |
CN104038804A (zh) * | 2013-03-05 | 2014-09-10 | 三星电子(中国)研发中心 | 基于语音识别的字幕同步装置和方法 |
US20160293160A1 (en) * | 2013-04-02 | 2016-10-06 | Igal NIR | Automatic Generation Of A Database For Speech Recognition From Video Captions |
CN106792097A (zh) * | 2016-12-27 | 2017-05-31 | 深圳Tcl数字技术有限公司 | 音频信号字幕匹配方法及装置 |
CN106847315A (zh) * | 2017-01-24 | 2017-06-13 | 广州朗锐数字传媒科技有限公司 | 一种有声读物逐句同步展示方法 |
CN108959163A (zh) * | 2018-06-28 | 2018-12-07 | 掌阅科技股份有限公司 | 有声电子书的字幕显示方法、电子设备及计算机存储介质 |
KR101996551B1 (ko) * | 2018-01-02 | 2019-07-04 | 중앙대학교 산학협력단 | 음성인식 및 대본을 이용하는 자막 생성 장치 및 방법 |
US10423660B1 (en) * | 2017-12-07 | 2019-09-24 | Amazon Technologies, Inc. | System for detecting non-synchronization between audio and subtitle |
CN111008300A (zh) * | 2019-11-20 | 2020-04-14 | 四川互慧软件有限公司 | 一种在音视频中基于关键词的时间戳定位搜索方法 |
-
2020
- 2020-09-27 CN CN202011029546.1A patent/CN114333918A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130216202A1 (en) * | 2011-08-31 | 2013-08-22 | Nokia Corporation | Method, apparatus and computer program product for subtitle synchronization in multimedia content |
CN102801925A (zh) * | 2012-08-08 | 2012-11-28 | 无锡天脉聚源传媒科技有限公司 | 一种字幕加配的方法及装置 |
CN104038804A (zh) * | 2013-03-05 | 2014-09-10 | 三星电子(中国)研发中心 | 基于语音识别的字幕同步装置和方法 |
US20160293160A1 (en) * | 2013-04-02 | 2016-10-06 | Igal NIR | Automatic Generation Of A Database For Speech Recognition From Video Captions |
CN106792097A (zh) * | 2016-12-27 | 2017-05-31 | 深圳Tcl数字技术有限公司 | 音频信号字幕匹配方法及装置 |
CN106847315A (zh) * | 2017-01-24 | 2017-06-13 | 广州朗锐数字传媒科技有限公司 | 一种有声读物逐句同步展示方法 |
US10423660B1 (en) * | 2017-12-07 | 2019-09-24 | Amazon Technologies, Inc. | System for detecting non-synchronization between audio and subtitle |
KR101996551B1 (ko) * | 2018-01-02 | 2019-07-04 | 중앙대학교 산학협력단 | 음성인식 및 대본을 이용하는 자막 생성 장치 및 방법 |
CN108959163A (zh) * | 2018-06-28 | 2018-12-07 | 掌阅科技股份有限公司 | 有声电子书的字幕显示方法、电子设备及计算机存储介质 |
CN111008300A (zh) * | 2019-11-20 | 2020-04-14 | 四川互慧软件有限公司 | 一种在音视频中基于关键词的时间戳定位搜索方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI260510B (en) | Method of and apparatus for synchronizing interactive contents | |
CN105869446A (zh) | 一种电子阅读装置和语音阅读加载方法 | |
CN106851401A (zh) | 一种自动添加字幕的方法及系统 | |
US20140164371A1 (en) | Extraction of media portions in association with correlated input | |
CN106059904B (zh) | 基于即时通讯软件进行直播歌曲打分的方法与系统 | |
CN105609106A (zh) | 记事文档生成方法和装置 | |
CN104952471B (zh) | 一种媒体文件合成方法、装置和设备 | |
US8538758B2 (en) | Electronic apparatus | |
CN102737690B (zh) | 音乐应用启动的方法及终端 | |
WO2022228377A1 (zh) | 录音方法、装置、电子设备和可读存储介质 | |
WO2014154097A1 (en) | Automatic page content reading-aloud method and device thereof | |
US20160217704A1 (en) | Information processing device, control method therefor, and computer program | |
CN112541323A (zh) | 一种朗读素材处理方法及装置 | |
CN109995939A (zh) | 信息处理方法和电子设备 | |
EP1168329A3 (en) | Storage medium, apparatus for creating recordation data therefor and apparatus for restoring recorded data | |
US11315607B2 (en) | Information processing apparatus, information processing method, and non-transitory computer readable medium | |
CN114333918A (zh) | 一种有声读物字幕匹配方法和装置 | |
CN106294293B (zh) | 一种实现交互式电子阅读的系统、方法和设备 | |
CN106657255A (zh) | 文件共享的方法、装置和终端设备 | |
CN110516043A (zh) | 用于问答系统的答案生成方法和装置 | |
WO2019026395A1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN106777369B (zh) | 一种为有声书添加书签的系统及方法 | |
CN113657381A (zh) | 字幕生成方法、装置、计算机设备以及存储介质 | |
CN106339424A (zh) | 一种网页保存处理方法及装置 | |
CN110287157A (zh) | 一种文件处理方法、文件读取方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |