CN106888392A - 一种机顶盒自动翻译系统及方法 - Google Patents

一种机顶盒自动翻译系统及方法 Download PDF

Info

Publication number
CN106888392A
CN106888392A CN201710077892.9A CN201710077892A CN106888392A CN 106888392 A CN106888392 A CN 106888392A CN 201710077892 A CN201710077892 A CN 201710077892A CN 106888392 A CN106888392 A CN 106888392A
Authority
CN
China
Prior art keywords
module
top box
set top
main control
translated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710077892.9A
Other languages
English (en)
Inventor
郭宇程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Unionman Technology Co Ltd
Original Assignee
Guangdong Unionman Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Unionman Technology Co Ltd filed Critical Guangdong Unionman Technology Co Ltd
Priority to CN201710077892.9A priority Critical patent/CN106888392A/zh
Publication of CN106888392A publication Critical patent/CN106888392A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/426Internal components of the client ; Characteristics thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • H04N21/4856End-user interface for client configuration for language selection, e.g. for the menu or subtitles

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供了一种机顶盒自动翻译系统,设有SD卡读取模块、音频采集模块、语音识别模块和机顶盒主控模块,所述音频采集模块连接所述语音识别模块,所述语音识别模块和SD卡读取模块连接所述机顶盒主控模块;还设有与所述机顶盒主控模块连接的机顶盒附属模块,本发明还提供与该系统对应的一种机顶盒自动翻译方法。实施本发明提供的一种机顶盒自动翻译系统及方法,通过在机顶盒主控模块上扩展SD卡读取模块进行语音学习并扩展音频采集模块和语音识别模块进行语音学习优化处理,能够去除大部分现场噪声,得到更高保真度的修复波形,主控模块再转化得到对应的翻译词句,从而实现了高质量低差错的外语语音字幕同步翻译,提升了用户的观视体验。

Description

一种机顶盒自动翻译系统及方法
技术领域
本发明涉及机顶盒技术领域,尤其涉及一种机顶盒自动翻译系统及方法。
背景技术
随着国际文化交流活动的日益活跃,越来越多的外语电影、电视剧进入中国市场,群众热衷于看好莱坞大片、追外剧,但除了部分人能够无障碍欣赏原版影片之外,另外大部分人只能依靠后期配上的同声翻译字幕或同声配音。但是目前有些电视台点播节目,播放的为与海外同步的视频资源,没有经过后期制作(同声翻译字幕或同声配音)的情况下十分影响用户的观视体验。
现代机顶盒在设计上及功能上越来越智能,在机顶盒的主控模块上扩展相关模块即能够实现如智能回放与自动录像存储等功能,但目前的智能机顶盒仍然没能实现电视节目语音同步翻译,影响整个物联网行业及家电行业的智能化进程。
发明内容
本发明提供一种机顶盒自动翻译系统及方法,解决了在机顶盒主控模块上扩展SD卡读取模块进行语音学习并扩展音频采集模块和语音识别模块进行语音学习优化处理,最后转化得到对应的翻译词句从而实现外语语音同步翻译的技术问题。
为解决以上技术问题,本发明提供一种机顶盒自动翻译系统,设有SD卡读取模块、音频采集模块、语音识别模块和机顶盒主控模块,所述音频采集模块连接所述语音识别模块,所述语音识别模块和SD卡读取模块连接所述机顶盒主控模块;还设有与所述机顶盒主控模块连接的机顶盒附属模块;
所述SD卡读取模块用于读取外接SD卡中的词句数据库;
所述音频采集模块用于提前录入无噪声样本语音后将其转化为无噪波形图,并通过提取所述无噪波形图特征点的方式将其转化为学习记忆样本;所述音频采集模块还用于采集当前待翻译语音并将其转化为原始波形图;
所述语音识别模块用于接收所述学习记忆样本和原始波形图,并将所述原始波形图进行失真还原得到修复波形图;
所述机顶盒主控模块还用于将所述修复波形图转化为对应的翻译词句并与所述SD卡读取模块读取到的词句数据库进行比较,根据相似度显示语音识别结果和翻译出来的词句于显示设备上。
进一步地,所述机顶盒附属模块设有与所述机顶盒主控模块连接的电源模块、时钟模块、AV/分量/HDMI输出模块和存储模块,所述AV/分量/HDMI输出模块还连接所述存储模块;所述电源模块、时钟模块、AV/分量/HDMI输出模块和存储模块分别为所述机顶盒主控模块提供供电功能、计时与定时功能、音频输出功能和存储功能。
优选地,所述机顶盒主控模块采用51单片机;所述语音识别模块采用基于非特定人语音识别技术的专用语音识别芯片LD3320。
进一步地,所述待翻译语音与翻译出来的词句为不同语种。
本发明还提供一种机顶盒自动翻译方法,包括以下步骤:
S1.所述SD卡读取模块读取外接SD卡中的词句数据库;
S2.所述音频采集模块提前录入无噪声样本语音后将其转化为无噪波形图,并通过提取所述无噪波形图特征点的方式将其转化为学习记忆样本;
S3.所述音频采集模块采集当前待翻译语音并将其转化为原始波形图;
S4.所述语音识别模块接收所述学习记忆样本和原始波形图,并将所述原始波形图进行失真还原得到修复波形图;
S5.所述机顶盒主控模块将所述修复波形图转化为对应的翻译词句并与所述SD卡读取模块读取到的词句数据库进行比较,根据相似度显示语音识别结果和翻译出来的词句于显示设备上。
进一步地,所述步骤S3中的所述待翻译语音与所述步骤S5中的所述翻译出来的词句为不同语种。
进一步地,在所述步骤S5中,所述机顶盒主控模块通过转化程度函数将所述修复波形图转化为对应的翻译词句。
本发明提供的一种机顶盒自动翻译系统及方法,通过在机顶盒主控模块上扩展SD卡读取模块进行语音学习并扩展音频采集模块和语音识别模块进行语音学习优化处理,能够去除大部分现场噪声,得到更高保真度的修复波形,主控模块再通过转化程度函数得到与所述修复波形对应的翻译词句,从而实现了高质量低差错的外语语音字幕同步翻译,提升了用户的观视体验,进一步加快了整个物联网行业及家电行业的智能化进程。
附图说明
图1是本发明实施例提供的一种机顶盒自动翻译系统的模块结构图;
图2是本发明实施例提供的一种机顶盒自动翻译系统的机顶盒附属模块的内部结构图;
图3是本发明实施例提供的一种机顶盒自动翻译方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。以下仅为较佳实施例,不构成对本发明保护范围的限制。
参见图1,是本发明实施例提供的一种机顶盒自动翻译系统的模块结构图。在本实施例中。在本实施例中,所述的一种机顶盒自动翻译系统,设有SD卡读取模块10、音频采集模块20、语音识别模块30和机顶盒主控模块40,所述音频采集模块20连接所述语音识别模块30,所述语音识别模块30和SD卡读取模块10连接所述机顶盒主控模块40;还设有与所述机顶盒主控模块40连接的机顶盒附属模块50;
所述SD卡读取模块10用于读取外接SD卡中的词句数据库;
所述音频采集模块20用于提前录入无噪声样本语音后将其转化为无噪波形图,并通过提取所述无噪波形图特征点的方式将其转化为学习记忆样本;所述音频采集模块20还用于采集当前待翻译语音并将其转化为原始波形图;
所述语音识别模块30用于接收所述学习记忆样本和原始波形图,并将所述原始波形图进行失真还原得到修复波形图;
所述机顶盒主控模块40还用于将所述修复波形图转化为对应的翻译词句并与所述SD卡读取模块10读取到的词句数据库进行比较,根据相似度(最大相似度)显示语音识别结果和翻译出来的词句于显示设备上。
其中,参见图2,是本发明实施例提供的一种机顶盒自动翻译系统的机顶盒附属模块的内部结构图。所述的机顶盒附属模块50设有与所述机顶盒主控模块40连接的电源模块51、时钟模块52、AV/分量/HDMI输出模块53和存储模块54,所述AV/分量/HDMI输出模块53还连接所述存储模块54;所述电源模块51、时钟模块52、AV/分量/HDMI输出模块53和存储模块54分别为所述机顶盒主控模块40提供供电功能、计时与定时功能、音频输出功能与存储功能。所述音频采集模块20采集的即为扬声器设备通过AV/分量/HDMI输出模块53输出的节目音频原声。
在本实施例中,因为机顶盒主控模块40多采用51单片机也因为51单片机高可扩展性、片上资源丰富、多I/O口、低价格、高处理速度等优点,本发明实施例中的所述机顶盒主控模块40采用51单片机;所述语音识别模块30采用基于非特定人语音识别技术的专用语音识别芯片LD3320,而且它不需要外接任何的辅助芯片如FLASH、RAM等即可实现语音识别、声控、人机对话功能,其语音识别效果更好;而考虑到语言的应用环境、听众等因素,可设置所述待翻译语音与翻译出来的词句为不同语种,比如英语、韩语转汉语,或汉语转英语、韩语等。
与所述机顶盒自动翻译系统对应的是,参见图3,是本发明实施例提供的一种机顶盒自动翻译方法的流程图。本实施例提供的一种机顶盒自动翻译方法,包括以下步骤:
S1.所述SD卡读取模块10读取外接SD卡中的词句数据库;
S2.所述音频采集模块20提前录入无噪声样本语音后将其转化为无噪波形图,并通过提取所述无噪波形图特征点的方式将其转化为学习记忆样本;
S3.所述音频采集模块20采集当前待翻译语音并将其转化为原始波形图;
S4.所述语音识别模块30接收所述学习记忆样本和原始波形图,并将所述原始波形图进行失真还原得到修复波形图;
S5.所述机顶盒主控模块40将所述修复波形图转化为对应的翻译词句并与所述SD卡读取模块10读取到的词句数据库进行比较,根据相似度显示语音识别结果和翻译出来的词句于显示设备上。
同样,所述步骤S3中的所述待翻译语音与所述步骤S5中的所述翻译出来的词句为不同语种。
在所述步骤S5中,所述机顶盒主控模块40通过转化程度函数将所述修复波形图转化为对应的翻译词句。
当然,为了更完善用户使用体验,在机顶盒的应用操作软件中作对应程序的烧录,比如在菜单中加入翻译功能选择菜单,对设置的默认语言转换类别识别到了就进行自动翻译,用户也可以手动选择翻译语音同步或停止;用户也可以根据自己的需求而选择将原始字幕隐藏起来等等。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (7)

1.一种机顶盒自动翻译系统,其特征在于,设有SD卡读取模块、音频采集模块、语音识别模块和机顶盒主控模块,所述音频采集模块连接所述语音识别模块,所述语音识别模块和SD卡读取模块连接所述机顶盒主控模块;还设有与所述机顶盒主控模块连接的机顶盒附属模块;
所述SD卡读取模块用于读取外接SD卡中的词句数据库;
所述音频采集模块用于提前录入无噪声样本语音后将其转化为无噪波形图,并通过提取所述无噪波形图特征点的方式将其转化为学习记忆样本;所述音频采集模块还用于采集当前待翻译语音并将其转化为原始波形图;
所述语音识别模块用于接收所述学习记忆样本和原始波形图,并将所述原始波形图进行失真还原得到修复波形图;
所述机顶盒主控模块还用于将所述修复波形图转化为对应的翻译词句并与所述SD卡读取模块读取到的词句数据库进行比较,根据相似度显示语音识别结果和翻译出来的词句于显示设备上。
2.如权利要求1所述的一种机顶盒自动翻译系统,其特征在于:所述机顶盒附属模块设有与所述机顶盒主控模块连接的电源模块、时钟模块、AV/分量/HDMI输出模块和存储模块,所述AV/分量/HDMI输出模块还连接所述存储模块;所述电源模块、时钟模块、AV/分量/HDMI输出模块和存储模块分别为所述机顶盒主控模块提供供电功能、计时与定时功能、音频输出功能和存储功能。
3.如权利要求1所述的一种机顶盒自动翻译系统,其特征在于:所述机顶盒主控模块采用51单片机;所述语音识别模块采用基于非特定人语音识别技术的专用语音识别芯片LD3320。
4.如权利要求1所述的一种机顶盒自动翻译系统,其特征在于:所述待翻译语音与翻译出来的词句为不同语种。
5.一种机顶盒自动翻译方法,其特征在于,包括以下步骤:
S1.所述SD卡读取模块读取外接SD卡中的词句数据库;
S2.所述音频采集模块提前录入无噪声样本语音后将其转化为无噪波形图,并通过提取所述无噪波形图特征点的方式将其转化为学习记忆样本;
S3.所述音频采集模块采集当前待翻译语音并将其转化为原始波形图;
S4.所述语音识别模块接收所述学习记忆样本和原始波形图,并将所述原始波形图进行失真还原得到修复波形图;
S5.所述机顶盒主控模块将所述修复波形图转化为对应的翻译词句并与所述SD卡读取模块读取到的词句数据库进行比较,根据相似度显示语音识别结果和翻译出来的词句于显示设备上。
6.如权利要求5所述的一种机顶盒自动翻译方法,其特征在于:所述步骤S3中的所述待翻译语音与所述步骤S5中的所述翻译出来的词句为不同语种。
7.如权利要求5所述的一种机顶盒自动翻译方法,其特征在于:在所述步骤S5中,所述机顶盒主控模块通过转化程度函数将所述修复波形图转化为对应的翻译词句。
CN201710077892.9A 2017-02-14 2017-02-14 一种机顶盒自动翻译系统及方法 Pending CN106888392A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710077892.9A CN106888392A (zh) 2017-02-14 2017-02-14 一种机顶盒自动翻译系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710077892.9A CN106888392A (zh) 2017-02-14 2017-02-14 一种机顶盒自动翻译系统及方法

Publications (1)

Publication Number Publication Date
CN106888392A true CN106888392A (zh) 2017-06-23

Family

ID=59179599

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710077892.9A Pending CN106888392A (zh) 2017-02-14 2017-02-14 一种机顶盒自动翻译系统及方法

Country Status (1)

Country Link
CN (1) CN106888392A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108281145A (zh) * 2018-01-29 2018-07-13 南京地平线机器人技术有限公司 语音处理方法、语音处理装置和电子设备
CN108366305A (zh) * 2018-02-07 2018-08-03 深圳佳力拓科技有限公司 一种不带字幕的码流通过语音识别显示字幕的方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1760973A (zh) * 2004-10-12 2006-04-19 上海海事大学 基于定性映射的语音识别方法
CN101640043A (zh) * 2009-09-01 2010-02-03 清华大学 基于多坐标序列内核的说话人识别方法和系统
CN101924863A (zh) * 2010-05-21 2010-12-22 中山大学 一种数字电视设备
CN104464724A (zh) * 2014-12-08 2015-03-25 南京邮电大学 一种针对刻意伪装语音的说话人识别方法
CN105448303A (zh) * 2015-11-27 2016-03-30 百度在线网络技术(北京)有限公司 语音信号的处理方法和装置
CN106157953A (zh) * 2015-04-16 2016-11-23 科大讯飞股份有限公司 连续语音识别方法及系统
CN106303695A (zh) * 2016-08-09 2017-01-04 北京东方嘉禾文化发展股份有限公司 音频翻译多语言文字处理方法和系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1760973A (zh) * 2004-10-12 2006-04-19 上海海事大学 基于定性映射的语音识别方法
CN101640043A (zh) * 2009-09-01 2010-02-03 清华大学 基于多坐标序列内核的说话人识别方法和系统
CN101924863A (zh) * 2010-05-21 2010-12-22 中山大学 一种数字电视设备
CN104464724A (zh) * 2014-12-08 2015-03-25 南京邮电大学 一种针对刻意伪装语音的说话人识别方法
CN106157953A (zh) * 2015-04-16 2016-11-23 科大讯飞股份有限公司 连续语音识别方法及系统
CN105448303A (zh) * 2015-11-27 2016-03-30 百度在线网络技术(北京)有限公司 语音信号的处理方法和装置
CN106303695A (zh) * 2016-08-09 2017-01-04 北京东方嘉禾文化发展股份有限公司 音频翻译多语言文字处理方法和系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108281145A (zh) * 2018-01-29 2018-07-13 南京地平线机器人技术有限公司 语音处理方法、语音处理装置和电子设备
CN108281145B (zh) * 2018-01-29 2021-07-02 南京地平线机器人技术有限公司 语音处理方法、语音处理装置和电子设备
CN108366305A (zh) * 2018-02-07 2018-08-03 深圳佳力拓科技有限公司 一种不带字幕的码流通过语音识别显示字幕的方法及系统

Similar Documents

Publication Publication Date Title
US11146841B2 (en) Voice-based television control method and intelligent terminal
EP3989047A1 (en) Method for voice controlling apparatus, and electronic apparatus
CN106340291A (zh) 一种双语字幕制作方法及系统
CN102075797A (zh) 一种语音浏览频道或节目的方法及数字电视接收终端
CN106792097A (zh) 音频信号字幕匹配方法及装置
CN111741369B (zh) 一种基于语音识别的智能电视机顶盒
CN207010880U (zh) 机顶盒
CN106888392A (zh) 一种机顶盒自动翻译系统及方法
JP2012109901A (ja) 資料提示装置
CN105848004A (zh) 字幕播放方法、字幕播放装置
CN105681890A (zh) 一种视频播放终端的字幕显示方法及装置
CN109710949A (zh) 一种翻译方法及翻译机
CN103458321A (zh) 一种字幕加载方法及装置
CN103414720A (zh) 交互式3d语音服务方法
CN106815028A (zh) 一种显示界面的构建方法、装置及操作方法和装置
CN108366305A (zh) 一种不带字幕的码流通过语音识别显示字幕的方法及系统
CN102164318A (zh) 语音提示方法、装置及数字电视接收终端
CN108052511A (zh) 基于方言识别的多语言翻译器
CN105812927A (zh) 烘托场景氛围的方法及电视机
JP5081207B2 (ja) テレビジョン装置及びその操作方法
CN203942613U (zh) 具有舞台灯投射功能的机顶盒
CN113468351A (zh) 一种智能设备及图像处理方法
CN102802060A (zh) 一种智能机顶盒
CN111107283A (zh) 一种信息显示方法、电子设备及存储介质
CN201726485U (zh) 能够把声音翻译成字幕的电视机

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170623

RJ01 Rejection of invention patent application after publication