CN200997199Y - 一种全自动智能盲用阅读器 - Google Patents

一种全自动智能盲用阅读器 Download PDF

Info

Publication number
CN200997199Y
CN200997199Y CN 200720105795 CN200720105795U CN200997199Y CN 200997199 Y CN200997199 Y CN 200997199Y CN 200720105795 CN200720105795 CN 200720105795 CN 200720105795 U CN200720105795 U CN 200720105795U CN 200997199 Y CN200997199 Y CN 200997199Y
Authority
CN
China
Prior art keywords
module
unit
key
fully
control module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN 200720105795
Other languages
English (en)
Inventor
蒋清晓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HANGZHOU REJOIN TECH CO., LTD.
Original Assignee
蒋清晓
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 蒋清晓 filed Critical 蒋清晓
Priority to CN 200720105795 priority Critical patent/CN200997199Y/zh
Application granted granted Critical
Publication of CN200997199Y publication Critical patent/CN200997199Y/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

本实用新型公开了一种全自动智能盲用阅读器。其内部模块连接关系为:阅读控制单元分别与扫描输入单元、图像处理单元、文字识别单元、智能判别单元、语音合成单元、发音单元相接,存储单元分别与扫描输入单元、图像处理单元、智能判别单元、语音合成单元相接。本实用新型可以全自动的辅助盲人进行书刊、报纸、文件等纸制文字资料的阅读,避免了盲人因看不见而无法进行复杂操作的情况,可在盲人无法辨别纸制文件放置方向和角度的情况下准确进行阅读,更有方便的阅读控制功能,使盲人阅读进行的更方便和高效率。

Description

一种全自动智能盲用阅读器
技术领域
本实用新型总体设计用于盲人及视力障碍人士用于文字语音转化的全自动智能阅读设备。属于信息电子技术领域,是信息无障碍的残疾人辅助用具。
背景技术
盲人及视力障碍人士是社会的弱势群体,视觉能力的缺失使他们无法以最直观的方式获取信息。现在世界上大部分的文字信息均以视觉的方式表达,盲人只能通过盲文和语音的方式来识别文字获取信息。然而现实生活中,99%以上的文字信息资料都是以视力障碍人士无法阅读的纸制资料形式出现的,盲人在无视力正常人士辅助下是完全无法获取这些信息的,纸制资料信息成为了盲人及视力障碍人士参与现实社会活动的巨大障碍,也造成了现实生活中盲人及视力障碍人群文化水平相对低下的严重后果。
现在盲人及视力障碍人士获取文字信息的方式主要有:①通过计算机辅助软件的形式把电子文字信息转化为语音②通过辅助设备将纸制文字资料转化为可触摸感知的信息③通过辅助设备将纸制文字资料信息转化为语音信息每种方式各有其优缺点,第一种方式对于纸制资料如期刊报纸文件等等无法进行处理,第二种方式使用者需要经过复杂而系统的训练,。第三种方式可以直接将文字资料信息转化为语音信息,甚至对于不识字的盲人及视力障碍人士,也可以使用,是目前而言最为优秀的信息获取方式。
然而现在的大部分文字语音转换设备均存在以下的问题:首先,操作相当复杂,对于视力正常的人士而言使用已经很费力,更何况对于视力有障碍的人;其次,对于盲人而言,因为他们无法感知纸制资料上的文字印刷的方向,因此在阅读过程中会经常发生放置错误的情况,当前的文字语音转换设备无法智能判断纸制资料的放置情况,给盲人使用造成了很大障碍;最后,在阅读过程中,这些设备均无法提供很好的阅读控制系统,给实际使用造成了很大的困难。
因此,很需要一种能够辅助盲人及视力障碍人士在没有正常人帮助情况下也能够很方便的实现纸制文字资料信息阅读的技术。
发明内容
本实用新型的目的是提供一种全自动智能盲用阅读器。
全自动智能盲用阅读器的内部模块连接关系为:阅读控制单元分别与扫描输入单元、图像处理单元、文字识别单元、智能判别单元、语音合成单元、发音单元相接,存储单元分别与扫描输入单元、图像处理单元、智能判别单元、语音合成单元相接。
所述的阅读控制单元包括阅读控制器模块和系统控制模块,阅读控制器模块和系统控制模块内部模块连接关系为:阅读器键盘与USB键盘控制器芯片、第一USB端口、第二USB端口系统流程自动控制模块、语音提示控制模块相接。
阅读器键盘按键共有8个,分别是启动朗读键、朗读暂停键、读下一句键、读上一句键、变声键、朗读加速键、朗读减速键和复位键。
文字识别单元内部模块连接关系为:图像切分模块与字符特征提取模块、结果输出模块、标准特征库模块相接。
智能判断单元内部模块连接关系为:标准词库模块与文义智能判断查找模块、统计判别模块、输出模块相接。
图像处理单元内部模块连接关系为:去噪声模块与亮度对比度调节模块、图像旋转模块相接。
语音合成单元和发音单元内部模块连接关系为:文字语音转换模块和控制命令语音存储模块与变声变调模块、扬声器相接。
本实用新型可以全自动的辅助盲人进行书刊、报纸、文件等纸制文字资料的阅读,避免了盲人因看不见而无法进行复杂操作的情况,可在盲人无法辨别纸制文件放置方向和角度的情况下准确进行阅读,更有方便的阅读控制功能,使盲人阅读进行的更方便和高效率。
附图说明
图1是全自动智能盲用阅读器的电路框图;
图2是本实用新型的阅读控制器的电路框图;
图3是本实用新型的阅读器键盘示意图;
图4是本实用新型的基于FPGA的电路框图;
图5是本实用新型的语音合成单元和发音单元结构图。
具体实施方式
如图1所示,全自动智能盲用阅读器包括扫描输入单元、阅读控制单元、文字识别单元、智能判断单元、图像处理单元、语音合成单元、存储单元和发音单元。阅读控制单元2分别与扫描输入单元1、图像处理单元5、文字识别单元3、智能判别单元4、语音合成单元6、发音单元相接8,存储单元7分别与扫描输入单元1、图像处理单元5、智能判别单元4、语音合成单元6相接。
扫描输入单元1主要由光学成像扫描头、机械传动机构以及控制和A/D转换处理电路组成。其中,光学成像扫描头由条形灯管灯源、三只条形平面反射镜、聚焦透镜(透镜组)和CCD电荷耦合器件组成。条形灯管和条形平面反射镜在扫描头上沿水平方向放置。工作时条形灯管发出的平行光线经纸制资料、条形平面反射镜反射后经聚焦透镜(或透镜组)进入CCD,由CCD将光信号转换为与光强度成正比的模拟电信号。机械传动机构由步进电机、传动齿轮、传动皮带组成。扫描头由圆形支撑滑杆支撑,卡在传动皮带上,由传动皮带带动沿支撑滑杆移动。A/D转换处理电路由A/D转换芯片和相应的外部电路组成,经过CCD转换的模拟电信号通过A/D转换处理电路变为表示纸制资料成像灰度的数字信号传送给存储单元(7)。
如图2所示,阅读控制单元由阅读控制器模块21和系统控制模块22组成,阅读控制器模块21和系统控制模块22内部模块连接关系为:阅读器键盘211与USB键盘控制器芯片212、第一USB端口213、第二USB端口223系统流程自动控制模块222、语音提示控制模块221相接。
其中阅读控制器模块,其主要功能是接受使用者的指令,并将这一指令通过第一USB端口传送到系统控制模块中去。阅读控制器模块主要由阅读器键盘、USB键盘控制器芯片和第一USB端口组成。因为本实用新型的使用者很多是盲人,因此在阅读器键盘外形设计上,使用外形相差很大的按键。
如图3所示,在本实施例中,阅读器键盘的按键共有8个,阅读的控制8个命令,每一个命令对应一个按键,分别是启动朗读键2111、朗读暂停键2112、读下一句键2113、读上一句键2114、变声键2115、朗读加速键2116、朗读减速键2117和复位键2118,USB键盘控制器芯片212采用了美国ATMEL公司的AT43USB324。使用者在阅读过程中的任何控制命令都由按键,经过USB键盘控制器芯片的编码,通过第一USB端口传送到系统控制模块。系统控制模块由系统流程自动控制模块222和语音提示控制模块221组成。系统流程自动控制模块负责控制整个系统的运行,并发送当前系统运行状态给语音提示控制模块。语音提示控制模块与语音合成单元6相连接,其主要功能是控制语音合成单元合成当前系统运行状态的语音,从而提示用户当前系统运行到哪一个状态。语音提示对于盲人使用者是非常重要的。在本实施例中,系统流程自动控制模块和语音提示控制模块均基于FPGA实现
如图4所示在本实施例中,文字识别单元3、智能判断单元4、图像处理单元5和系统流程自动控制模块222和语音提示控制模块221均基于FPGA实现,。
所述的文字识别单元3内部模块连接关系为:图像切分模块31与字符特征提取模块32、结果输出模块34、标准特征库模块33相接。智能判断单元4内部模块连接关系为:标准词库模块41与文义智能判断查找模块42、统计判别模块43、输出模块44相接。图像处理单元5内部模块连接关系为:去噪声模块51与亮度对比度调节模块52、图像旋转模块53相接。
本实施例中,FPGA采用Xilinx公司出品的Virtex-4系列的FPGAXC4VLX100,存储单元7由SRAM存储器K7N163601M实现。系统流程自动控制模块控制整个系统的流程,是本系统的核心部分。在用户通过阅读控制器模块按下了启动键后,该模块可以在无需用户干预的情况下自动的控制系统中的各个模块按照顺序操作,使纸制资料的文字信息转换为声音信号。并根据用户在阅读时的控制命令,调整操作流程,满足用户要求。在系统按顺序操作,处于不同的状态时,系统流程自动控制模块将当前状态的信息以及用户按键的信息传给语音提示控制模块,语音提示控制模块产生相应的语音提示控制信号控制语音合成模块,达到提示用户当前状态和用户按键结果的目的。
图像处理单元包括了去噪声模块51、亮度对比度调节模块52和图像旋转模块53。去噪声模块的主要功能是从存储单元中读取扫描输入单元存储的图像数据,并且去除图像中的噪声点,以提高文字识别的准确度。亮度对比度调节模块的主要功能是将去除噪声后的图像增强对比度,并根据图像本身的特性自适应的调整亮度,同样是为了增加识别率。图像旋转模块的主要功能是将图像旋转指定的角度后输出,这个角度可以是从0~360°中任意一个整数值的角度,和智能判断模块配合即可将以倾斜角度放置的纸制文字资料图像正确的识别出来。文字识别单元3主要包括图像切分模块31,字符特征提取模块32,标准特征库模块33和结果输出模块34。图像切分模块的主要功能是将经过图像处理单元处理后的图像按照单个文字的区域进行切分,这样图像信息就被分隔为若干块含有单个文字信息的小图片。字符特征提取模块按照既定的算法提取含有单个文字信息小图片中关于字符的特征信息,并将这一信息与标准特征库模块中的标准特征信息进行对比,选择最为接近的特征信息所在的标准字符做为识别结果。结果输出模块整合整幅图像中的识别结果信息,并传送给智能判断单元。
智能判断单元4包括标准词库模块41,文义智能判断查找模块42和统计判别模块43和输出模块44。标准词库模块中含有大量的汉语和英语的词库,是为文义智能判断查找模块提供智能判断的标准。文义智能判断查找模块对每一个由文字识别单元识别得出的识别结果文字在标准词库模块中查找所有的词,并且与识别结果中该字符的实际上下文进行比较,如果识别结果的实际上下文中都没有能够在标准词库模块中查找到相应的词语,那么就认为这个字不能成词,并将这一结果传给统计判别模块。统计判别模块统计识别结果全文中所有字符的成词率。经过大量的实践证明,如果一段文字中所有字符的加总成词数量除以文章的总字符数小于一定的数值,那么可以认为这段文字是无意义的乱码。在阅读过程中,如果使用者不慎将纸制文字资料放置方向弄错,那么虽然可以得出识别结论,但却是没有意义的乱码。经过统计识别模块的判断,可以得出该次扫描识别的结果是否有效的结论。如果结果有效,则通过输出模块输出识别结果给语音合成单元。否则,则通过系统自动流程控制模块将图像进行旋转操作,并重新进行识别流程,直到图像旋转到该文档的正确位置,也就是最能够被识别的位置,该结果将输出至语音合成单元。
如图5所示,语音合成单元6主要包括文字语音转换模块61和控制命令语音存储模块62。文字语音转换模块的主要功能是将通过智能判断后的正确的文字信息转换为语音信号并传送给发音单元。控制命令语音存储模块受阅读控制单元的的控制,其内部存储了系统各个流程和阅读控制器上各个按键的提示音,阅读控制单元传送指令,则控制语音存储模块将送出相应的提示音信号,该信号与文字语音转换模块输出的信号是叠加在一起后送出给发音单元的。本实施例中,文字语音转换模块使用了OSYN06188语音合成芯片,控制命令语音存储模块使用了AP89043语音芯片。
发音单元8由变声变调模块81和扬声器82组成,变声变调模块的主要作用是将语音合成单元输出的声音根据用户的需要进行实时的处理,如进行男女声切换和变调处理等等。变声变调模块采用了SD771D单芯片实时变音处理器。
尽管结合数量有限的实施例说明了本实用新型,本领域的熟练人员显然知道据此有许多修改和变体。后附的权利要求旨在包括这些符合本实用新型的真正精神和范围的修改和变体。

Claims (7)

1.一种全自动智能盲用阅读器,其特征在于,阅读控制单元(2)分别与扫描输入单元(1)、图像处理单元(5)、文字识别单元(3)、智能判别单元(4)、语音合成单元(6)、发音单元相接(8),存储单元(7)分别与扫描输入单元(1)、图像处理单元(5)、智能判别单元(4)、语音合成单元(6)相接。
2.根据权利要求1所述的一种全自动智能盲用阅读器,其特征在于,所述的阅读控制单元(2)包括阅读控制器模块(21)和系统控制模块(22),阅读控制器模块(21)和系统控制模块(22)内部模块连接关系为:阅读器键盘(211)与USB键盘控制器芯片(212)、第一USB端口(213)、第二USB端口(223)系统流程自动控制模块(222)、语音提示控制模块(221)相接。
3.根据权利要求2所述的一种全自动智能盲用阅读器,其特征在于,所述的阅读器键盘(211)按键共有8个,分别是启动朗读键(2111)、朗读暂停键(2112)、读下一句键(2113)、读上一句键(2114)、变声键(2115)、朗读加速键(2116)、朗读减速键(2117)和复位键(2118)。
4.根据权利要求1所述的一种全自动智能盲用阅读器,其特征在于,所述的文字识别单元(3)内部模块连接关系为:图像切分模块(31)与字符特征提取模块(32)、结果输出模块(34)、标准特征库模块(33)相接。
5.根据权利要求1所述的一种全自动智能盲用阅读器,其特征在于,所述的智能判断单元(4)内部模块连接关系为:标准词库模块(41)与文义智能判断查找模块(42)、统计判别模块(43)、输出模块(44)相接。
6.根据权利要求1所述的一种全自动智能盲用阅读器,其特征在于,所述的图像处理单元(5)内部模块连接关系为:去噪声模块(51)与亮度对比度调节模块(52)、图像旋转模块(53)相接。
7.根据权利要求1所述的一种全自动智能盲用阅读器,其特征在于,所述的语音合成单元(6)和发音单元(8)内部模块连接关系为:文字语音转换模块(61)和控制命令语音存储模块(62)与变声变调模块(81)、扬声器(82)相接。
CN 200720105795 2007-01-24 2007-01-24 一种全自动智能盲用阅读器 Expired - Lifetime CN200997199Y (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200720105795 CN200997199Y (zh) 2007-01-24 2007-01-24 一种全自动智能盲用阅读器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200720105795 CN200997199Y (zh) 2007-01-24 2007-01-24 一种全自动智能盲用阅读器

Publications (1)

Publication Number Publication Date
CN200997199Y true CN200997199Y (zh) 2007-12-26

Family

ID=38995635

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200720105795 Expired - Lifetime CN200997199Y (zh) 2007-01-24 2007-01-24 一种全自动智能盲用阅读器

Country Status (1)

Country Link
CN (1) CN200997199Y (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286273B (zh) * 2008-06-06 2010-10-13 蒋清晓 智障与自闭症儿童微电脑沟通辅助训练系统
CN101753764B (zh) * 2008-12-17 2012-09-26 夏普株式会社 图像处理装置及方法、图像读取装置、图像发送装置
CN101615253B (zh) * 2008-06-27 2012-12-05 范钦雄 文件内容即时辨识系统及方法
CN102855791A (zh) * 2012-09-19 2013-01-02 华南理工大学 一种盲人识字辅助装置及其运行方法
CN107393126A (zh) * 2017-07-12 2017-11-24 深圳怡化电脑股份有限公司 一种纸币版本分类的方法、装置、设备及存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286273B (zh) * 2008-06-06 2010-10-13 蒋清晓 智障与自闭症儿童微电脑沟通辅助训练系统
CN101615253B (zh) * 2008-06-27 2012-12-05 范钦雄 文件内容即时辨识系统及方法
CN101753764B (zh) * 2008-12-17 2012-09-26 夏普株式会社 图像处理装置及方法、图像读取装置、图像发送装置
CN102855791A (zh) * 2012-09-19 2013-01-02 华南理工大学 一种盲人识字辅助装置及其运行方法
CN102855791B (zh) * 2012-09-19 2014-09-10 华南理工大学 一种盲人识字辅助装置及其运行方法
CN107393126A (zh) * 2017-07-12 2017-11-24 深圳怡化电脑股份有限公司 一种纸币版本分类的方法、装置、设备及存储介质
CN107393126B (zh) * 2017-07-12 2019-10-11 深圳怡化电脑股份有限公司 一种纸币版本分类的方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN101009095A (zh) 全自动智能盲用阅读器
CN200997199Y (zh) 一种全自动智能盲用阅读器
US10741167B2 (en) Document mode processing for portable reading machine enabling document navigation
US11532149B1 (en) Recognition and selection of a discrete pattern within a scene containing multiple patterns
US9626000B2 (en) Image resizing for optical character recognition in portable reading machine
US7659915B2 (en) Portable reading device with mode processing
US8531494B2 (en) Reducing processing latency in optical character recognition for portable reading machine
US8284999B2 (en) Text stitching from multiple images
US8249309B2 (en) Image evaluation for reading mode in a reading machine
US20060013483A1 (en) Gesture processing with low resolution images with high resolution processing for optical character recognition for a reading machine
US20060006235A1 (en) Directed reading mode for portable reading machine
WO2015059976A1 (ja) 情報処理装置、情報処理方法、及びプログラム
US6140913A (en) Apparatus and method of assisting visually impaired persons to generate graphical data in a computer
CN104657054A (zh) 一种基于点读机的学习方法及装置
EP2299387A1 (en) Device and method for recognizing and reading text out loud
CN102800225A (zh) 一种盲人阅读方法及装置
CN101084851A (zh) 便携式电子助视器
JPH06119372A (ja) 電子翻訳機
CN1629934A (zh) 一种用于交互控制的语音虚拟键盘的构建和使用方法
EP1804175A1 (en) An acoustic and visual device for simultaneously translating information
CN110065076A (zh) 一种机器人二次开发编辑系统
CN203084960U (zh) 一种盲用电子阅读器
CN2577349Y (zh) 读字扫描器
CN202067424U (zh) 一种盲人阅读装置
Dokhe et al. Survey Paper: Image Reader For Blind Person

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Assignee: Hangzhou Rejoin Technology Co., Ltd.

Assignor: Jiang Qingxiao

Contract record no.: 2013330000086

Denomination of utility model: Automatic intelligent reader for blind

Granted publication date: 20071226

License type: Exclusive License

Record date: 20130422

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
ASS Succession or assignment of patent right

Owner name: HANGZHOU REJOINTECH CO., LTD.

Free format text: FORMER OWNER: JIANG QINGXIAO

Effective date: 20130715

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 310027 HANGZHOU, ZHEJIANG PROVINCE TO: 310013 HANGZHOU, ZHEJIANG PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20130715

Address after: 310013, room 609, A, Zhejiang Science Park, 525 Xixi Road, Xihu District, Zhejiang, Hangzhou

Patentee after: Hangzhou Rejoin Technology Co., Ltd.

Address before: 32, 38, 310027 Yuquan Road, Zhejiang University, Zhejiang Road, Zhejiang, Hangzhou, 685

Patentee before: Jiang Qingxiao

ASS Succession or assignment of patent right

Owner name: HANGZHOU RUIJIELONG TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: HANGZHOU REJOINTECH CO., LTD.

Effective date: 20141016

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 310013 HANGZHOU, ZHEJIANG PROVINCE TO: 310000 HANGZHOU, ZHEJIANG PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20141016

Address after: Hangzhou City, Zhejiang province Binjiang District 310000 shore road 1197 Building 5 room 543

Patentee after: HANGZHOU REJOIN TECH CO., LTD.

Address before: 310013, room 609, A, Zhejiang Science Park, 525 Xixi Road, Xihu District, Zhejiang, Hangzhou

Patentee before: Hangzhou Rejoin Technology Co., Ltd.

CX01 Expiry of patent term

Granted publication date: 20071226

EXPY Termination of patent right or utility model