CN106446887A - 一种将图片转换为语音的方法及装置 - Google Patents

一种将图片转换为语音的方法及装置 Download PDF

Info

Publication number
CN106446887A
CN106446887A CN201610975041.1A CN201610975041A CN106446887A CN 106446887 A CN106446887 A CN 106446887A CN 201610975041 A CN201610975041 A CN 201610975041A CN 106446887 A CN106446887 A CN 106446887A
Authority
CN
China
Prior art keywords
picture
converted
housing
voice
mainboard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610975041.1A
Other languages
English (en)
Inventor
罗杰仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201610975041.1A priority Critical patent/CN106446887A/zh
Publication of CN106446887A publication Critical patent/CN106446887A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/147Details of sensors, e.g. sensor lenses
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management

Abstract

本发明公开了一种将图片转换为语音的方法及装置,该装置的结构为:在壳体(1)的背面设有显示屏(2)和扬声器(4);壳体内设有主板;壳体上还设有与主板相连的调音模块和进程控制按键;进程控制按键包括下一首按键(7)、暂停/播放按键(9)和前一首按键(11);壳体的正面设有摄像头(16)和补光灯;壳体上还设有与主板连接的位置检测装置。该装置易于实施,结构独特,功能丰富,特别适合盲人使用。

Description

一种将图片转换为语音的方法及装置
技术领域
本发明涉及一种将图片转换为语音的方法及装置。
背景技术
根据世界卫生组织提供的数据,中国是全世界盲人最多的国家,占全世界盲人口的18%。每年在中国约有45万人失明,2010年中国盲人(blind)824.8万,低视力(lowvision)6727.4万,视力残疾(visual impairment)是两者的总和7551.2万。按照这个势头,目前的盲人,估计可能超过1300万,也就是,每一百个人里面,就有一个盲人。对于很多人来说,阅读和交流是件很简单的事情,然而,对于盲人来说,他们的阅读却要通过“听”与“触摸”来实现。社会对盲文读物出版给予大力支持,但是“书荒仍存”,有一个重要原因就是制作成本高、印刷效率远低于普通出版物。目前,出现了一些帮助盲人上网的读屏软件,一定程度上可以解决盲人上网的困难,但对于解决阅读纸质书籍、同时帮助盲人与正常人交流的技术或设备还是不够方便或低廉。
因此,有必要设计一种新的将图片转换为语音的方法及装置。
发明内容
本发明所要解决的技术问题是提供一种将图片转换为语音的方法及装置,该装置易于实施,结构独特,功能丰富,特别适合盲人使用。
发明的技术解决方案如下:
一种将图片转换为语音的装置,在壳体(1)的背面设有显示屏(2)和扬声器(4);
壳体内设有主板;主板用于获取照片,并针对照片进行文字识别形成文本文档,以及将文本文档转化为语音在扬声器中播放出来,以上实现均为现有成熟技术;
壳体上还设有与主板相连的调音模块和进程控制按键;进程控制按键包括下一首按键(7)、暂停/播放按键(9)和前一首按键(11);
壳体的正面设有摄像头(16)和补光灯;
壳体上还设有与主板连接的位置检测装置。
所述的位置检测装置包括设置在壳体背面的导轨(8)以及设置在导轨上的滑块(10),为稳定起见,优选地,导轨为平行的两条;位置检测装置还包括设置在壳体内的2个同步轮(15)和张设在2个同步轮上的同步带(14);所述的滑块固定在同步带上与同步带联动;其中一个同步轮上设有同轴的编码盘,编码盘输出编码到主板。编码盘能记录同步转动的角度,从而能间接检测出滑块的位移,滑块用于播放控制,滑块位于最左侧时,一篇文章从头开始播放,滑块位于导轨的正中时,文章跳至50%的位置播放,更进一步,同步轮还连接有驱动电机,文章播放时,驱动电机驱动同步轮旋转,使得滑块同步移动,如播放到80%时,滑块也移动到80%的位置。
壳体的顶部设有快门键(3),快门键用于控制摄像头,也可以不使用快门键,直接在屏幕上操作,显示屏为触摸显示屏。
壳体上设有USB插口(12)和SD卡插槽(13)中的至少一种;用于插入U盘或SD卡等,将生成的文本文件存储到存储介质中,或将外部的文本文件通过存储介质转移到本装置中。
壳体上设有耳机插孔。
调压模块为调音按键或音量调节旋钮(6)。
摄像头的左右两侧各设有1个作为补光灯的主闪光灯(17);壳体背面还设有由多个辅助闪光灯(19)和一片导光板(18)形成的环形闪光模块(导光板为回字形,由4条长方形的子板依次首尾回环连接而成,每条子板下方设有2个辅助LED灯。壳体为方形壳体);
扬声器为2个,分布在壳体背面的左右两侧。形成立体声输出,音质好。
壳体内设有电池和用于为电池充电的充电电路,壳体上设有于所述充电电路相连的充电接口(充电接口用于接电源适配器,电源适配器接220V交流市电)。
壳体内集成有wifi模块或移动通信模块(3G或4G模块),用于通过网络获取文本资源。
一种将图片转换为语音的方法,采用前述的将图片转换为语音的装置;包括以下步骤:
步骤1:采用摄像头获取带有文字信息的图片;
步骤2:主板上的文字识别模块将图片上的文字内容转换为文本信息,并将多个图片上的文字信息整合到一个文本文件中;
步骤3:基于主板上的文本信息-语音转换模块将文本文件转换为音频播放。
通过本装置可以将可视的图片、以及包括文字的纸质(或电子屏幕显示)页面实时转换为语音输出。
包括以下步骤:
第一步,数码摄像机对目标图片进行拍照,形成的图片文件存储到图片存储器;
第二步,图片/文字译码器(即文字识别模块)读取图片文件,将图片文件转译处理为文本文件,形成的文本文件存储到文本存储器;
第三步,文字/语音合成器(即文本信息-语音转换模块)读取文本文件,将文本文件转译和存储为音频文件,并根据该音频文件合成出语音信号;
第四步,由音频处理放大器将音频信号进行放大后输出至扬声器播放。
所述语音合成器内置有文字/语音合成器,将文本文件转换形成为音频信号并输出至音频处理放大器,由扬声器将放大后的语音播放出来;
本装置设有图片/文字译码器,其利用类似于目前已经具有的将带有文字符号的图片转换为文本的软件工具,如通过对扫描仪扫描得到的图片转换为WORD文档或txt文档的软件工具,由微处理器单元控制图片/文字译码器将图片文字转换形成文本文件、控制文字/语音合成器将文本文件转换形成为音频信号,从而完成由图片到语音的转换;还设有图片存储器、文本存储器,可对图片、文本信息进行存储,微处理器单元可以通过数据线、地址线对图片或文本信息进行选择调用,可以具有一定的编辑功能,选择对特定语音的播放。这样,盲人使用起来比较方便,可以较快地学习掌握,实现对纸质或电子显示的图片的“阅读”。
图片的边缘留有一定的空白:
所述第一步设有一个拍摄完整度提醒功能,根据取景的外边缘的灰度判断目标是否已经全部进入镜头,进而通过语音提示相机镜头移动的方向,包括上/下、左/右、远/近动作指令。
所述文字/语音合成器可根据设置选择语音的语种、男女声、语速。
所述控制键盘与微处理器单元的控制信号输入端相连,该微处理器单元通过数据/地址线与图片/文字译码器、文字/语音合成器、图片存储器、文本存储器的相应数据端口或地址端口相连,并完成相应的控制和数据调用、存储动作;
有益效果:
本发明提供了一种将图片转换为语音的方法及装置,该装置特别针对盲人群体设计,比如位置检测装置能便于使用者手动调节播放进度,这一特征为本发明的最大亮点。另外,设置有物理按键,如播放键等,便于操作。
本装置具有丰富的拍照功能,环形闪光模块有利于获取无阴影的高素质的图片;
本装置具有丰富的接口和通信模块,USB接口等便于通过有线模式传输文本文件,wifi模块和移动通信模块便于通过无线网络方式传输文本资源,从而极大地扩展了本产品的功能。
采用本装置能方便地将纸质的树制作成电子书,便于携带,另外,具有语音播放文本信息的功能,减缓使用者的视觉疲劳,该装置特别适用于盲人群体。
附图说明
图1为将图片转换为语音的装置的背面结构示意图;
图2为将图片转换为语音的装置的正面结构示意图;
图3为位置检测装置的结构示意图;
图4为电原理框图。
标号说明:1-壳体,2-显示屏,3-快门键,4-扬声器,5-充电接口,6-音量调节旋钮,7-下一首按键,8-导轨,9-暂停/播放按键,10-滑块,11-前一首按键,12-USB插口,13-SD卡插槽;14-同步带,15-同步轮,16-摄像头,17-主闪光灯,18-导光板,19-辅助闪光灯。
具体实施方式
以下将结合附图和具体实施例对本发明做进一步详细说明:
实施例1:如图1-4.一种将图片转换为语音的装置,在壳体1的背面设有显示屏2和扬声器4;
壳体内设有主板;主板用于获取照片,并针对照片进行文字识别形成文本文档,以及将文本文档转化为语音在扬声器中播放出来,以上实现均为现有成熟技术;
壳体上还设有与主板相连的调音模块和进程控制按键;进程控制按键包括下一首按键7、暂停/播放按键9和前一首按键11;
壳体的正面设有摄像头16和补光灯;
壳体上还设有与主板连接的位置检测装置。
所述的位置检测装置包括设置在壳体背面的导轨8以及设置在导轨上的滑块10(为稳定起见,导轨为平行的两条);位置检测装置还包括设置在壳体内的2个同步轮15和张设在2个同步轮上的同步带14;所述的滑块固定在同步带上与同步带联动;其中一个同步轮上设有同轴的编码盘,编码盘输出编码到主板。编码盘能记录同步转动的角度,从而能间接检测出滑块的位移,滑块用于播放控制,滑块位于最左侧时,一篇文章从头开始播放,滑块位于导轨的正中时,文章跳至50%的位置播放,更进一步,同步轮还连接有驱动电机,文章播放时,驱动电机驱动同步轮旋转,使得滑块同步移动,如播放到80%时,滑块也移动到80%的位置。
壳体的顶部设有快门键3,快门键用于控制摄像头(也可以不使用快门键,直接在屏幕上操作,显示屏为触摸显示屏)。
壳体上设有USB插口12和SD卡插槽13中的至少一种;用于插入U盘或SD卡等,将生成的文本文件存储到存储介质中,或将外部的文本文件通过存储介质转移到本装置中。
壳体上设有耳机插孔。
调压模块为调音按键或音量调节旋钮6。
摄像头的左右两侧各设有1个作为补光灯的主闪光灯17;壳体背面还设有由多个辅助闪光灯19和一片导光板18形成的环形闪光模块,导光板为回字形,由4条长方形的子板依次首尾回环连接而成,每条子板下方设有2个辅助LED灯。壳体为方形壳体;
扬声器为2个,分布在壳体背面的左右两侧。形成立体声输出,音质好。
壳体内设有电池和用于为电池充电的充电电路,壳体上设有于所述充电电路相连的充电接口(充电接口用于接电源适配器,电源适配器接220V交流市电)。
壳体内集成有wifi模块或移动通信模块(3G或4G模块),用于通过网络获取文本资源。
一种将图片转换为语音的方法,采用前述的将图片转换为语音的装置;包括以下步骤:
步骤1:采用摄像头获取带有文字信息的图片;
步骤2:主板上的文字识别模块将图片上的文字内容转换为文本信息,并将多个图片上的文字信息整合到一个文本文件中;
步骤3:基于主板上的文本信息-语音转换模块将文本文件转换为音频播放。

Claims (10)

1.一种将图片转换为语音的装置,其特征在于:在壳体(1)的背面设有显示屏(2)和扬声器(4);
壳体内设有主板;
壳体上还设有与主板相连的调音模块和进程控制按键;进程控制按键包括下一首按键(7)、暂停/播放按键(9)和前一首按键(11);
壳体的正面设有摄像头(16)和补光灯;
壳体上还设有与主板连接的位置检测装置。
2.根据权利要求1所述的将图片转换为语音的装置,其特征在于:所述的位置检测装置包括设置在壳体背面的导轨(8)以及设置在导轨上的滑块(10);位置检测装置还包括设置在壳体内的2个同步轮(15)和张设在2个同步轮上的同步带(14);所述的滑块固定在同步带上与同步带联动;其中一个同步轮上设有同轴的编码盘,编码盘输出编码到主板。
3.根据权利要求1所述的将图片转换为语音的装置,其特征在于:壳体的顶部设有快门键(3),快门键用于控制摄像头。
4.根据权利要求1所述的将图片转换为语音的装置,其特征在于:壳体上设有USB插口(12)和SD卡插槽(13)中的至少一种。
5.根据权利要求1所述的将图片转换为语音的装置,其特征在于:壳体上设有耳机插孔。
6.根据权利要求1所述的将图片转换为语音的装置,其特征在于:调压模块为调音按键或音量调节旋钮(6)。
7.根据权利要求1所述的将图片转换为语音的装置,其特征在于:摄像头的左右两侧各设有1个作为补光灯的主闪光灯(17);壳体背面还设有由多个辅助闪光灯(19)和一片导光板(18)形成的环形闪光模块;
扬声器为2个,分布在壳体背面的左右两侧。
8.根据权利要求1所述的将图片转换为语音的装置,其特征在于:壳体内设有电池和用于为电池充电的充电电路,壳体上设有于所述充电电路相连的充电接口。
9.根据权利要求1所述的将图片转换为语音的装置,其特征在于:壳体内集成有wifi模块或移动通信模块。
10.一种将图片转换为语音的方法,其特征在于,采用权利要求1-9任一项所述的将图片转换为语音的装置;包括以下步骤:
步骤1:采用摄像头获取带有文字信息的图片;
步骤2:主板上的文字识别模块将图片上的文字内容转换为文本信息,并将多个图片上的文字信息整合到一个文本文件中;
步骤3:基于主板上的文本信息-语音转换模块将文本文件转换为音频播放。
CN201610975041.1A 2016-11-07 2016-11-07 一种将图片转换为语音的方法及装置 Pending CN106446887A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610975041.1A CN106446887A (zh) 2016-11-07 2016-11-07 一种将图片转换为语音的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610975041.1A CN106446887A (zh) 2016-11-07 2016-11-07 一种将图片转换为语音的方法及装置

Publications (1)

Publication Number Publication Date
CN106446887A true CN106446887A (zh) 2017-02-22

Family

ID=58181042

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610975041.1A Pending CN106446887A (zh) 2016-11-07 2016-11-07 一种将图片转换为语音的方法及装置

Country Status (1)

Country Link
CN (1) CN106446887A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108320624A (zh) * 2017-12-22 2018-07-24 昆山遥矽微电子科技有限公司 文字识别语音机
CN108470067A (zh) * 2018-03-28 2018-08-31 掌阅科技股份有限公司 电子书展现形式的转换方法、计算设备及计算机存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1147647A (zh) * 1996-04-29 1997-04-16 王宇鹏 电脑阅读机
CN1421769A (zh) * 2001-11-27 2003-06-04 朱若愚 一种数字语音播放方法及系统
CN2655349Y (zh) * 2003-07-09 2004-11-10 周晓静 电视播音控制器
CN101123768A (zh) * 2007-08-02 2008-02-13 深圳市杰普林数码科技有限公司 一种老人手机及其使用方法
US20100145703A1 (en) * 2005-02-25 2010-06-10 Voiceye, Inc. Portable Code Recognition Voice-Outputting Device
CN102663926A (zh) * 2012-05-10 2012-09-12 黄莹 可升级盲文学习机
CN102855791A (zh) * 2012-09-19 2013-01-02 华南理工大学 一种盲人识字辅助装置及其运行方法
CN202816213U (zh) * 2012-09-19 2013-03-20 华南理工大学 一种盲人识字辅助装置
CN103077625A (zh) * 2013-01-30 2013-05-01 中国盲文出版社 一种盲用电子阅读器和助盲阅读方法
CN103390016A (zh) * 2012-05-07 2013-11-13 Lg电子株式会社 显示与音频文件相关联的文本的方法以及电子设备
CN103988193A (zh) * 2011-03-23 2014-08-13 奥德伯公司 管理同步内容的播放
CN203966394U (zh) * 2014-07-11 2014-11-26 金玉梅 供盲人用的外语学习机
CN105357413A (zh) * 2015-11-03 2016-02-24 浙江中烟工业有限责任公司 一种具有语音播报功能的文件扫描设备

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1147647A (zh) * 1996-04-29 1997-04-16 王宇鹏 电脑阅读机
CN1421769A (zh) * 2001-11-27 2003-06-04 朱若愚 一种数字语音播放方法及系统
CN2655349Y (zh) * 2003-07-09 2004-11-10 周晓静 电视播音控制器
US20100145703A1 (en) * 2005-02-25 2010-06-10 Voiceye, Inc. Portable Code Recognition Voice-Outputting Device
CN101123768A (zh) * 2007-08-02 2008-02-13 深圳市杰普林数码科技有限公司 一种老人手机及其使用方法
CN103988193A (zh) * 2011-03-23 2014-08-13 奥德伯公司 管理同步内容的播放
CN103390016A (zh) * 2012-05-07 2013-11-13 Lg电子株式会社 显示与音频文件相关联的文本的方法以及电子设备
CN102663926A (zh) * 2012-05-10 2012-09-12 黄莹 可升级盲文学习机
CN202816213U (zh) * 2012-09-19 2013-03-20 华南理工大学 一种盲人识字辅助装置
CN102855791A (zh) * 2012-09-19 2013-01-02 华南理工大学 一种盲人识字辅助装置及其运行方法
CN103077625A (zh) * 2013-01-30 2013-05-01 中国盲文出版社 一种盲用电子阅读器和助盲阅读方法
CN203966394U (zh) * 2014-07-11 2014-11-26 金玉梅 供盲人用的外语学习机
CN105357413A (zh) * 2015-11-03 2016-02-24 浙江中烟工业有限责任公司 一种具有语音播报功能的文件扫描设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈强;李响;蒋清晓;: "利用嵌入式平台开发盲用阅读器" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108320624A (zh) * 2017-12-22 2018-07-24 昆山遥矽微电子科技有限公司 文字识别语音机
CN108470067A (zh) * 2018-03-28 2018-08-31 掌阅科技股份有限公司 电子书展现形式的转换方法、计算设备及计算机存储介质

Similar Documents

Publication Publication Date Title
CN103077625A (zh) 一种盲用电子阅读器和助盲阅读方法
CN107180564B (zh) 一种外语练习用装置及使用方法
CN101609612A (zh) 多功能读书机
CN106446887A (zh) 一种将图片转换为语音的方法及装置
CN201213041Y (zh) 光学点读机
CN200962258Y (zh) 一种多功能数码学习笔
CN206209799U (zh) 一种将图片转换为语音的装置
CN206340342U (zh) 一种扫描录音多功能翻译笔
JP2009503628A (ja) マルチメディア・デジタルコード印刷装置及び印刷方法
CN202650286U (zh) 多功能网络学习机
CN205177193U (zh) 一种聋哑患者交流装置
CN107705641A (zh) 一种点读普通印刷读物的装置及方法
CN106372626A (zh) 一种基于手势识别的交流装置和方法
CN206574091U (zh) 一种基于手势识别的交流装置
CN211427531U (zh) 一种智能互动学习机器人装置
CN215067967U (zh) 一种多功能触摸一体机交互终端
CN205880863U (zh) 一种便携式智能日语翻译装置
CN205211232U (zh) 一种多功能平板语言学习机
WO2008140194A1 (en) System and method for searching and output of media contents via character recognition
CN210295461U (zh) 一种用于提高职场沟通效果的普通话发音纠正设备
CN106971637A (zh) 一种外语趣味学习机及其方法
CN112435543A (zh) 一种盲人智能识别设备
CN215181900U (zh) 一种用扫描方法实现的点读笔及系统
CN208061203U (zh) 一种英语翻译装置
CN102975514B (zh) 一种电子脚踏翻页器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170222

WD01 Invention patent application deemed withdrawn after publication