CN204614442U - 一种纸质文本音频化与播放系统 - Google Patents
一种纸质文本音频化与播放系统 Download PDFInfo
- Publication number
- CN204614442U CN204614442U CN201520140240.1U CN201520140240U CN204614442U CN 204614442 U CN204614442 U CN 204614442U CN 201520140240 U CN201520140240 U CN 201520140240U CN 204614442 U CN204614442 U CN 204614442U
- Authority
- CN
- China
- Prior art keywords
- module
- data
- wifi
- client software
- control module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本实用新型涉及一种纸质文本音频化与播放系统包括:客户端软件模块(S10)、云端存储与处理软件模块(S20)和WiFi音频输出设备(S30);所述客户端软件模块(S10)包括摄像控制模块(S11)、数据传输与控制模块(S12)、音频管理模块(S13)和音频数据处理模块(S14);所述云端存储与处理软件模块(S20)包括光学字符识别模块(S21)、多媒体数据存储控制模块(S22)和语音合成处理模块(S23);所述WiFi音频输出设备(S30)包括WiFi信号模块(S31)和音频控制与处理模块(S32)。本装置实现了网络无线路由功能和WiFi AP功能,在不特定使用WiFI无线音箱功能时,具备普通无线路由和WiFI AP功能装置。
Description
技术领域
本实用新型涉及纸质文本音频化系统,特别是涉及一种纸质文本音频化与播放系统。
背景技术
随着互联网技术与应用的迅猛发展,人们日常生活节凑加快,人们生活逐渐进入一种“时间碎片化”状态;互联网技术已经深刻影响到了出版行业形态,以电子化代替纸质化的出版形态越来越成熟。在上述两种形态影响下,一方面人们可以充分利用碎片化时间进行电子阅读。
利用现有智能设备和便携式电脑,比如智能Phone/Pad等,人们可以在机场、码头等空暇时间随时进行阅读;更加便利的是采用TTS技术,人们可以以语音方式听取“电子文本”内容。
现有的阅读模式不足之处在于,电子化阅读在特定环境下,比如长距离驾驶下等场景无法进行;长时间进行电子阅读,对人体眼睛也有一定的刺激反应。更重要是现有电子阅读方法无法解决现存纸质文本资料碎片化时间阅读问题。
基于以上所述现有电子阅读模式缺陷,提出解决现存纸质文本资料电子化阅读这一现实问题有效解决方案。
发明内容
本实用新型目的在于提供一种纸质文本音频化系统,并以语音形式播放纸质文本内容的系统,解决了现有电子阅读设备不能方便的进行纸质文本资料阅读的问题。
为实现上述技术思路,本发明提供了一种纸质文本音频化与播放系统,系统装置能方便将纸质文本转化为图片形式,藉由图片文字识别技术获取文本文字内容,再通过语音合成技术,将获得电子文本内容转化为语音信号;以语音形式直接播放纸质文本文字内容,方便人们随时阅读。
本实用新型提供的一种纸质文本音频化与播放系统,所述系统包括:客户端软件模块、云端存储与处理软件模块和WiFi音频输出设备,所述客户端软件模块分别与所述云端存储与处理软件模块和所述WiFi音频输出设备双向数据传输连接。
所述客户端软件模块包括摄像控制模块、数据传输与控制模块、音频管理模块和音频数据处理模块,所述摄像控制模块向所述数据传输与控制模块单向数据传输连接,所述数据传输与控制模块与所述音频数据处理模块双向数据传输连接,所述音频数据处理模块与所述音频管理模块双向数据传输连接。
所述云端存储与处理软件模块包括光学字符识别模块、多媒体数据存储控制模块和语音合成处理模块,所述光学字符识别模块向所述多媒体数据存储控制模块单向数据传输连接,所述多媒体数据存储控制模块与所述语音合成处理模块双向数据传输连接。
所述WiFi音频输出设备包括WiFi信号模块、音频控制与处理模块,所述WiFi信号模块与所述音频控制与处理模块双向数据传输连接。
进一步地,所述摄像控制模块可调用智能设备摄像硬件资源直接拍摄纸质资料文档,以JPG或者BMP图片格式存储在所述客户端软件模块本地;所述数据传输与控制模块用于控制将所述客户端软件模块获取图片数据传输至所述云端存储与处理软件模块。
进一步地,所述光学字符识别模块用于对传输到云端图像数据进行文字模式识别,获取图像文字内容;所述多媒体数据存储控制模块将对应识别文字内容进行存储处理,文本内容保存在内容数据库中;所述语音合成处理模块根据文字内容合成对应的语音信号,经所述多媒体数据存储控制模块进行语音信号的压缩处理,存入内容数据库。
进一步地,所述多媒体数据存储控制模块将处理得到语音信号通过网络信号返回到所述客户端软件模块。
进一步地,所述音频数据处理模块能将获得压缩语音数据进行解压处理;所述WiFi信号模块能将解压后的语音数据直接在所述客户端软件模块所在智能硬件设备进行播放,也可控制将解压后的音频数据传输送到所述数据传输与控制模块进行处理。
进一步地,所述WiFi信号模块能接收客户端软件所传输的音频数据信号;并且通过所述音频控制与处理模块控制直接以音频信号形式播放。
基于OCR(光学字符识别)技术和TTS(语音合成)技术的纸质文本音频化与播放系统包括:客户端软件模块、云端存储与处理软件模块、WiFi音频输出设备。
客户端软件模块首先获取纸质文本资料内容,通过摄像控制模块调用客户端软件所在智能硬件设备如Phone/Pad上硬件摄像头资源进行拍照,以图像形式获得文本内容;图片格式主要采用常见的JPG、BMP格式。所获取图像内容首先存放在客户端软件进行本地存储。
数据传输与控制模块用于控制与预处理客户端软件获取图像数据,一方面用于控制客户端软件存储图像数据容量,一方面及时将图像数据加上序号信息,再传输至云端存储与处理软进行处理。
云端存储与处理软件模块收到客户端上传的序列化图像数据后,通过光学字符识别(OCR)模块进行图像文字内容模式识别,以从图像数据获得文本内容;光学字符识别(OCR)模块同时对获得文本内容加以序号信息,以标识图像数据,保持有效同步。
标识后的文本内容通过多媒体数据存储控制模块,将对应识别文字内容进行存储处理,文本内容保存在内容数据库中。
语音合成(TTS)处理模块根据格式化后的电子文字内容合成对应的语音信号(Text To Speech),经多媒体数据存储控制模块,进行语音信号压缩处理,压缩后语音信号存入内容数据库。
云端存储与处理软件模块包含多媒体数据存储控制模块将处理得到语音信号传输到客户端软件模块。
客户端软件模块包含音频数据处理模块,能将获得压缩语音数据进行解压处理;音频管理模块将解压后的语音数据直接在客户端软件所在智能硬件设备进行播放,用户可以直接通过听取到纸质文本内容。
音频管理模块也可控制解压后的音频数据通过WiFi信号进行推送,音频数据首先在客户端软件经由数据传输与控制模块进行处理。客户端软件所在智能设备保持和WiFi音频输出设备如WiFi音箱/耳机等信号链路,音频数据经WiFi信号链路传送到WiFi音频输出设备。
WiFi音频输出设备包含WiFi信号模块能接收客户端软件所传输的音频数据;WiFi音频输出设备解析标准WiFi信号为音频数据流。
音频数据流数据通过音频控制与处理模块控制,直接以声音形式播放。
综上所述,本实用新型,为解决现有电子阅读工具和系统不能方便阅读纸质文本内容的问题,通过采用客户端软件、云端存储与处理软件、WiFi音频输出设备构建起一种纸质文本音频化与播放系统:通过客户端软件以图像形式获取纸质文本,上传至云端存储与处理软件后,通过光学字符识别和文本语音合成技术实现纸质文本内容的音频化,进一步通过客户端软件控制将音频内容以声音形式输出,方便人们以声音的方式获取文本内容,解决了纸质文本无法电子化阅读的问题。
附图说明
图1为本实用新型功能结构图。
具体实施方式
下面将结合本实用新型实施例中的附图1,对本实用新型实施例中的技术方案进行清楚、完整地描述,显然,所描述实施例仅仅是本实用新型的一部分的实施例,而不是全部的实施例。基于本实用新型中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本实用新型保护的范围。
一种纸质文本音频化与播放系统,包括:客户端软件模块S10、云端存储与处理软件模块S20和WiFi音频输出设备S30,客户端软件模块S10分别与云端存储与处理软件模块S20和WiFi音频输出设备S30双向数据传输连接。
客户端软件模块S10包括摄像控制模块S11、数据传输与控制模块S12、音频管理模块S13和音频数据处理模块S14,摄像控制模块S11向数据传输与控制模块S12单向数据传输连接,数据传输与控制模块S12与音频数据处理模块S14双向数据传输连接,音频数据处理模块S14与音频管理模块S13双向数据传输连接。
云端存储与处理软件模块S20包括光学字符识别模块S21、多媒体数据存储控制模块S22和语音合成处理模块S23,光学字符识别模块S21向多媒体数据存储控制模块S22单向数据传输连接,多媒体数据存储控制模块S22与语音合成处理模块S23双向数据传输连接。
WiFi音频输出设备S30包括WiFi信号模块S31、音频控制与处理模块S32,WiFi信号模块S31与音频控制与处理模块S32双向数据传输连接。
优选地,摄像控制模块S11可调用智能设备摄像硬件资源直接拍摄纸质资料文档,以JPG或者BMP图片格式存储在客户端软件模块S10本地。
数据传输与控制模块S12用于控制将客户端软件模块S10获取图片数据传输至云端存储与处理软件模块S20。
优选地,光学字符识别模块S21用于对传输到云端图像数据进行文字模式识别,获取图像文字内容。
多媒体数据存储控制模块S22将对应识别文字内容进行存储处理,文本内容保存在内容数据库中。
语音合成处理模块S23根据文字内容合成对应的语音信号,经多媒体数据存储控制模块S22进行语音信号的压缩处理,存入内容数据库。
优选地,多媒体数据存储控制模块S22将处理得到语音信号通过网络信号返回到客户端软件模块S10。
优选地,音频数据处理模块S14能将获得压缩语音数据进行解压处理;WiFi信号模块S31能将解压后的语音数据直接在客户端软件模块S10所在智能硬件设备进行播放,也可控制将解压后的音频数据传输送到所述数据传输与控制模块S12进行处理。
优选地,WiFi信号模块S31能接收客户端软件所传输的音频数据信号;并且通过音频控制与处理模块S32控制直接以音频信号形式播放。
本实用新型包括客户端软件模块S10、云端存储与处理软件模块S20、WiFi音频输出设备S30。其应用流程为:
客户端软件模块S10通过控制智能设备的摄像组件,如智能手机的摄像头获得文本的图像,纸质文本内容转换为图像数据;客户端软件模块S10控制图像数据在智能设备的存储,如存放在智能手机的SD卡之中,并进行图像数据的序列化工作,以时间顺序标识图像数据的序列排列。
客户端软件模块S10将序列化后的图像数据通过WiFi/3G/4G网络传送到云端存储与处理软件模块S20;其包含的光学字符识别模块S21首先对图像中包含的文字内容进行模式识别,获得对应的文字形式内容,文字内容也通过时间顺序对应的进行序列化,以便于保持和图像内容的同步一致;语音合成(TTS)处理模块S22对序列化后的电子文本内容进行语音合成处理,获得对应的音频内容,并进一步的进行语音数据压缩,存放到云端数据库中。
压缩后的语音数据传回至客户端软件模块S10,音频数据处理模块S14,能将获得压缩语音数据进行解压处理;音频管理模块S13能将解压后的语音数据直接在客户端软件所在智能硬件设备进行播放;也可控制将解压后的音频数据传输到数据传输与控制模块S12进行处理。
数据传输与控制模块S12调用客户端软件的WiFi组件,推送音乐媒体流到WiFi音频输出设备S30,首先WiFi信号模块S31进行WiFi协议解析,主要对WiFi数据包解析处理;获得的音频数据通过音频控制与处理模块S32对外输出声音信号。
以上所述实施例仅表达了本实用新型的一种实施方式,其描述较为具体和详细,但并不能因此而理解为对本实用新型专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本实用新型构思的前提下,还可以做出若干变形和改进,这些都属于本实用新型的保护范围。因此,本实用新型专利的保护范围应以所附权利要求为准。
Claims (4)
1.一种纸质文本音频化与播放系统,其特征在于,所述系统包括:客户端软件模块(S10)、云端存储与处理软件模块(S20)和WiFi音频输出设备(S30),所述客户端软件模块(S10)分别与所述云端存储与处理软件模块(S20)和所述WiFi音频输出设备(S30)双向数据传输连接;
所述客户端软件模块(S10)包括摄像控制模块(S11)、数据传输与控制模块(S12)、音频管理模块(S13)和音频数据处理模块(S14),所述摄像控制模块(S11)向所述数据传输与控制模块(S12)单向数据传输连接,所述数据传输与控制模块(S12)与所述音频数据处理模块(S14)双向数据传输连接,所述音频数据处理模块(S14)与所述音频管理模块(S13)双向数据传输连接;
所述云端存储与处理软件模块(S20)包括光学字符识别模块(S21)、多媒体数据存储控制模块(S22)和语音合成处理模块(S23),所述光学字符识别模块(S21)向所述多媒体数据存储控制模块(S22)单向数据传输连接,所述多媒体数据存储控制模块(S22)与所述语音合成处理模块(S23)双向数据传输连接;
所述WiFi音频输出设备(S30)包括WiFi信号模块(S31)和音频控制与处理模块(S32),所述WiFi信号模块(S31)与所述音频控制与处理模块(S32)双向数据传输连接。
2.根据权利要求1所述的纸质文本音频化与播放系统,其特征在于,所述多媒体数据存储控制模块(S22)将处理得到语音信号通过网络信号返回到所述客户端软件模块(S10)。
3.根据权利要求1所述的纸质文本音频化与播放系统,其特征在于,所述音频数据处理模块(S14)能将获得压缩语音数据进行解压处理;所述WiFi信号模块(S31)能将解压后的语音数据直接在所述客户端软件模块(S10)所在智能硬件设备进行播放,也可控制将解压后的音频数据传输送到所述数据传输与控制模块(S12)进行处理。
4.根据权利要求1所述的纸质文本音频化与播放系统,其特征在于,所述WiFi信号模块(S31)能接收客户端软件所传输的音频数据信号;并且通过所述音频控制与处理模块(S32)控制直接以音频信号形式播放。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201520140240.1U CN204614442U (zh) | 2015-03-12 | 2015-03-12 | 一种纸质文本音频化与播放系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201520140240.1U CN204614442U (zh) | 2015-03-12 | 2015-03-12 | 一种纸质文本音频化与播放系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN204614442U true CN204614442U (zh) | 2015-09-02 |
Family
ID=53966977
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201520140240.1U Expired - Fee Related CN204614442U (zh) | 2015-03-12 | 2015-03-12 | 一种纸质文本音频化与播放系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN204614442U (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106599059A (zh) * | 2016-11-15 | 2017-04-26 | 广州酷狗计算机科技有限公司 | 一种添加歌曲的方法和装置 |
CN106856091A (zh) * | 2016-12-21 | 2017-06-16 | 北京智能管家科技有限公司 | 一种多语言文本的自动播报方法及系统 |
-
2015
- 2015-03-12 CN CN201520140240.1U patent/CN204614442U/zh not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106599059A (zh) * | 2016-11-15 | 2017-04-26 | 广州酷狗计算机科技有限公司 | 一种添加歌曲的方法和装置 |
CN106856091A (zh) * | 2016-12-21 | 2017-06-16 | 北京智能管家科技有限公司 | 一种多语言文本的自动播报方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111669515B (zh) | 一种视频生成方法及相关装置 | |
CN103918284B (zh) | 语音控制装置、语音控制方法和程序 | |
EP1855483A3 (en) | Apparatus and method for transmitting and receiving moving pictures using near field communication | |
EP1758356A3 (en) | Mobile phone, communication terminal, phone call method and phone call program | |
CN113297843B (zh) | 指代消解的方法、装置及电子设备 | |
TW200509655A (en) | Mobile phone system with card character recognition function | |
CN112312366A (zh) | 一种通过nfc标签实现功能的方法、电子设备及系统 | |
CN204029175U (zh) | 一种具有音视频播放功能的点读系统及点读笔 | |
CN203366566U (zh) | 一种交互式在线教育系统 | |
CN204614442U (zh) | 一种纸质文本音频化与播放系统 | |
CN203366564U (zh) | 一种交互式网络教育系统 | |
CN205987391U (zh) | 基于gps定位的旅游景区游客的游玩系统 | |
CN103680223A (zh) | 辅助阅读设备及辅助阅读系统和辅助阅读方法 | |
CN115734303A (zh) | 一种切换网络的方法及相关装置 | |
CN203149645U (zh) | 基于二维码应用的移动式多媒体地图管理系统 | |
CN103647944A (zh) | 基于lte网络的多模工业智能穿戴装置 | |
CN112562688A (zh) | 语音转写方法、装置、录音笔和存储介质 | |
CN104408031A (zh) | 应用二维码信息的有声读物装置 | |
CN202397470U (zh) | 一种基于物联网的人体运动数据采集器 | |
CN210750149U (zh) | 一种导盲眼镜及其导盲系统 | |
CN109285563A (zh) | 在线翻译过程中的语音数据处理方法及装置 | |
CN107481714A (zh) | 一种纸质文本音频化与播放系统 | |
CN205160575U (zh) | 一种轨道交通应急指挥信息自动获取装置 | |
CN206061014U (zh) | 基于通信网络的远程教育系统 | |
CN105376667A (zh) | 具有摄像功能的耳机及基于云平台的影音文件传输系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150902 Termination date: 20210312 |
|
CF01 | Termination of patent right due to non-payment of annual fee |