CN110334712A - 智能穿戴终端、云端服务器和数据处理方法 - Google Patents

智能穿戴终端、云端服务器和数据处理方法 Download PDF

Info

Publication number
CN110334712A
CN110334712A CN201910508818.7A CN201910508818A CN110334712A CN 110334712 A CN110334712 A CN 110334712A CN 201910508818 A CN201910508818 A CN 201910508818A CN 110334712 A CN110334712 A CN 110334712A
Authority
CN
China
Prior art keywords
text
image
text image
obtains
writing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910508818.7A
Other languages
English (en)
Inventor
佘少华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Xiaozhuan Technology Co Ltd
Original Assignee
Guangzhou Xiaozhuan Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Xiaozhuan Technology Co Ltd filed Critical Guangzhou Xiaozhuan Technology Co Ltd
Priority to CN201910508818.7A priority Critical patent/CN110334712A/zh
Publication of CN110334712A publication Critical patent/CN110334712A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种智能穿戴终端、云端服务器和数据处理方法。该方法包括获取文本图像;将文本图像发送给云端服务器,以使云端服务器对文本图像进行字符识别,得到文字文本,再根据云语音库对文字文本进行语音转换,得到播报语音,并反馈播报语音;对接收的播报语音进行音频播放。本申请可以解决了相关技术中视力障碍人群无法有效进行阅读的技术问题。

Description

智能穿戴终端、云端服务器和数据处理方法
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种智能穿戴终端、云端服务器和数据处理方法。
背景技术
近年来随着智能穿戴设备的出现,越来越多的穿戴设备被用在多媒体消费领域用来现实更多的用户功能和满足不一样的用户体验。智能眼镜做为穿戴式设备的一种,目前已现实了类似音视频操作、内容显示、语音控制、导航等一般通用智能设备所拥有的大部分功能。但由于智能眼镜的应用目前还未开发成熟,对在各个领域的应用还不全面,比如作为穿戴式设备对用户最重要的智能辅助功能上,仍然存在较多的特殊应用未被实现。
在我们身边,有着为数不少的视力障碍人群,他们看不到光明、无法阅读、甚至寸步难行;同时随着社会的发展,老龄化日趋严峻,年龄增长造成的视力减退给老年人带来了巨大的困扰,尤其是他们在进行书本或者报纸阅读时,由于视力或者印刷等原因,比较难辨别和理解书本/报纸中字体较小的内容;再其次老人长时间阅读时,时常出现注意力不集中,或者较难理解书本相关内容的意思;目前,针对上述几种视力障碍人群上的困扰,目前还没有太多非常有效的科技手段来进行解决。
针对相关技术中视力障碍人群无法有效进行阅读的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种智能穿戴终端、云端服务器和数据处理方法,以解决相关技术中视力障碍人群无法有效进行阅读的问题。
为了实现上述目的,第一方面,本申请提供了一种数据处理方法,该方法应用于智能穿戴终端,该方法包括:
获取文本图像;
将文本图像发送给云端服务器,以使云端服务器对文本图像进行字符识别,得到文字文本,再根据文字文本生成反馈信息,将反馈信息进行反馈;
对接收反馈的反馈信息进行音频播放处理,以通过音频播放对用户提醒文本图像包括的文字文本。
可选地,在获取文本图像之后,该方法包括:
对文本图像进行图像灰度处理,得到灰度图像;
对灰度图像进行图像二值化处理,得到二值化图像;
识别出二值化图像中是否存在字形特征;
当识别出二值化图像中存在字形特征时,执行将文本图像发送给云端服务器的步骤。
可选地,该方法还包括:
采集当前目标介质的对应的当前距离值和/或光电反馈值;
确定距离值是否不大于文字可识别距离阈值,和/或光电反馈值是否不小于图像可识别阈值;
当距离值不大于文字可识别距离阈值,和/或光电反馈值是否不小于图像可识别阈值时,对于当前目标执行获取文本图像的步骤。
第二方面,本申请还提供了另一种数据处理方法,该方法应用于云端服务器,该方法包括:
接收智能穿戴终端发送的文本图像;
对文本图像进行字符识别,得到文字文本;
根据文字文本生成反馈信息;
向智能穿戴终端反馈反馈信息,以使智能穿戴终端对接收反馈的反馈信息进行音频播放处理,以通过音频播放对用户提醒文本图像包括的文字文本。
可选地,对文本图像进行字符识别,包括:
对文本图像进行图像处理,得到文本图像上的文字区域;
对文字区域进行栏位分割,得到至少一个分割区域;
对于每个分割区域,提取该分割区域中的每个文字图像数据,并对每个文字图像数据进行光学字符识别OCR识别,得到文字文本。
可选地,对文本图像进行图像处理,包括:
对文本图像进行图像灰度处理,得到灰度图像;
对灰度图像进行图像二值化处理,得到二值化图像;
识别出二值化图像中字形特征;
划定出包含有字形特征的文字区域。
可选地,根据文字文本生成反馈信息,包括:
根据云语音库对文字文本进行语音转换,得到播报语音;
根据播报语音生成反馈信息。
第三方面,本申请还提供了一种智能穿戴终端,该智能穿戴终端包括:
获取模块,用于获取文本图像;
发送模块,用于将文本图像发送给云端服务器,以使云端服务器对文本图像进行字符识别,得到文字文本,再根据文字文本生成反馈信息,并将反馈信息进行反馈;
播放模块,用于对接收反馈的反馈信息进行音频播放处理,以通过音频播放对用户提醒文本图像包括的文字文本。
第四方面,本申请还提供了一种云端服务器,该云端服务器包括:
接收模块,用于接收智能穿戴终端发送的文本图像;
识别模块,用于对文本图像进行字符识别,得到文字文本;
生成模块,用于根据文字文本生成反馈信息;
反馈模块,用于向智能穿戴终端反馈反馈信息,以使智能穿戴终端对接收反馈的反馈信息进行音频播放处理,以通过音频播放对用户提醒所述文本图像包括的所述文字文本。
第五方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机代码,当计算机代码被执行时,上述的数据处理方法被执行。
在本申请提供的数据处理方法中,通过获取文本图像;将文本图像发送给云端服务器,以使云端服务器对文本图像进行字符识别,得到文字文本,再根据云语音库对文字文本进行语音转换,得到播报语音,并反馈播报语音;对接收的播报语音进行音频播放。这样,通过智能穿戴终端获取用户眼前的书籍报纸等文本图像,然后通过云端服务器采用OCR技术对文本图像中的文字进行识别,然后使用智能穿戴终端对识别出的文字进行音频播放,使用户轻松的用听力来完成眼前书箱及报纸的阅读。从而解决了相关技术中盲人、老人等视力障碍人群无法有效进行阅读的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请实施例提供的一种数据处理方法的流程示意图;
图2是本申请实施例提供的另一种数据处理方法的流程示意图;
图3是本申请实施例提供的另一种数据处理方法的流程示意图;
图4是本申请实施例提供的另一种数据处理方法的流程示意图;
图5是本申请实施例提供的另一种数据处理方法的流程示意图;
图6是本申请实施例提供的一种步骤500的流程示意图;
图7是本申请实施例提供的一种步骤510的流程示意图;
图8是本申请实施例提供的一种智能穿戴终端的结构示意图;
图9是本申请实施例提供的一种云端服务器的结构示意图;
图10是本申请实施例提供的一种智能穿戴终端的外观示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
根据本申请的一个方面,本申请实施例提供了一种数据处理方法,该方法应用于智能穿戴终端,该智能穿戴终端可以为智能眼镜和智能头盔等等智能终端,例如,该智能穿戴终端为智能眼镜时,图10是本申请实施例提供的一种智能穿戴终端的外观示意图,如图10所示,该智能眼镜至少包括图像采集单元1、音频播放单元2和通信单元等,图像采集单元1可以包括设置在智能眼镜的镜框上的摄像头等,通过图像采集单元1可以实时获取当前目标的图像,通过通信单元可以将采集的图像发送给云端服务器,音频播放单元2可以包括设置在智能眼镜的眼镜腿上的喇叭等,通过音频播放单元2可以对该智能眼镜的用户进行语音播报。图1是本申请实施例提供的一种数据处理方法的流程示意图,如图1所示,该方法包括如下的步骤100至步骤300:
100,获取文本图像。
具体的,获取该文本图像可以是由于本智能穿戴终端实时获取的当前目标介质(例如,报纸、书籍)的图像,获取该文本图像也可以是直接从本地存储器中读取的。
200,将文本图像发送给云端服务器,以使云端服务器对文本图像进行字符识别,得到文字文本,再根据文字文本生成反馈信息,并将反馈信息进行反馈。
其中,文字文本应包括至少一个文字,当该文本图像中存在文字文本时,通过对该文本图像进行字符识别,可以识别出文字文本。例如,该文本图像为报纸的图像时,通过对该文本图进行字符识别,可以识别出该报纸图像上的文字,并保存为文字文本。
需要说明的是,该文字文本应包括的文字可以是各种语言的文字,例如,该文字可以是汉字、英文字等等。
具体的,当该文本图像中存在文字文本时,通过云端服务器对该文本图像进行字符识别,可以识别出文字文本;之后,云端服务器再根据文字文本生成反馈信息,该反馈信息至少包含智能穿戴终端对应的唯一识别码,这样,基于反馈信息包括的唯一识别码向该智能穿戴终端反馈反馈信息,而反馈信息还可以包括文字文本转换的播放语音,以便于智能穿戴终端对反馈信息包含的文字文本转换的播放语音进行播放,这样,需要云端服务器对文字文本进行语音转换,生成播放语音,因此,云端服务器还可以包括云语音库以及语音检索及转换单元,云语音库中至少包含多种语言的语音词汇库、语言数据,语音检索及转换单元用于在云语音库中对输入的文字文本进行解析、检索及转换,从而将该文字文本转换为播报语音。由于将文字文本的转换过程由云端服务器完成,可以有效地克服智能穿戴终端的硬件限制,而且由于云端服务器包括的云语音库存储量和更新频率更高,使得将该文字文本转换为播报语音的精确性更高、速度更快。需要说明的是,反馈信息还可以包括文字文本但不包括由该文字文本转换的播放语音,这样,将该反馈信息反馈给智能穿戴终端后,该智能穿戴终端需要对该反馈信息包括的文字文本进行语音转换,生成播放语音,从而使得该智能穿戴终端能够对文字文本进行语音播报,因此,该智能穿戴终端还可以包括本地语音库以及语音检索及转换单元,本地语音库中至少包含多种语言的语音词汇库、语言数据,语音检索及转换单元用于在本地语音库中对输入的文字文本进行解析、检索及转换,从而将该文字文本转换为播报语音。
300,对接收反馈的反馈信息进行音频播放处理,以通过音频播放对用户提醒文本图像包括的文字文本。
具体的,当智能穿戴终端接收到云端服务器反馈的反馈信息后,如果该反馈信息包含有播放语音时,则智能穿戴终端直接对反馈信息包括的播放语音进行音频播放,以使提醒用户文本图像包括的文字文本内容,如果该反馈信息包含有文字文本但不包含该文字文本转换的播放语音时,则智能穿戴终端对文字文本进行语音转换,得到该文字文本转换的播放语音,从而智能穿戴终端对播放语音进行音频播放。其中,通过音频播放单元2对该播报语音进行音频播放,其中,如图10所示,该音频播放单元2包括一个或多个扬声器或骨传导耳机,这样,通过获取用户眼前的书籍报纸等文本图像或者读取本地的文本图像,然后通过云端服务器采用OCR技术对文本图像中的文字进行识别,然后使用智能穿戴终端对识别出的文字进行音频播放,实现了盲人、老人等视力障碍用户可以轻松的用听力的方式来完成书箱及报纸等文本图像的阅读的目的。
在一个可行的实施方式中,图2是本申请实施例提供的另一种数据处理方法的流程示意图,如图2所示,在步骤100之后,该方法包括如下的步骤110至步骤130:
110,对文本图像进行图像灰度处理,得到灰度图像;
120,对灰度图像进行图像二值化处理,得到二值化图像;
130,识别出二值化图像中是否存在字形特征;
当识别出二值化图像中存在字形特征时,执行步骤200,将文本图像发送给云端服务器。
具体的,在步骤100之后,即获取文本图像之后,对获取的文本图像先进行图像灰度处理,经过灰度处理后,得到该文本图像的灰度图像,之后,对灰度图像进行图像二值化处理,得到该文本图像的二值化图像,之后,对二值化图像进行图像识别,识别出二值化图像中是否存在字形特征,当二值化图像中不存在字形特征时,则结束对该文本图像的处理,当识别出二值化图像中存在字形特征时,执行步骤200,即将文本图像发送给云端服务器。
在一个可行的实施方式中,图3是本申请实施例提供的另一种数据处理方法的流程示意图,如图3所示,该方法还包括步骤010至步骤020:
010,采集当前目标介质的对应的当前距离值和/或光电反馈值;
020,确定距离值是否不大于文字可识别距离阈值,和/或光电反馈值是否不小于图像可识别阈值;
当距离值不大于文字可识别距离阈值,和/或光电反馈值是否不小于图像可识别阈值时,对于当前目标执行步骤100,获取文本图像。
其中,如图10所示,图像采集单元1可以至少包括纸距检测单元和/或光电传感器以及摄像头等。
具体的,通过纸距检测单元可以采集本智能穿戴终端与当前目标介质(例如,报纸和书籍)的当前距离值,该纸距检测单元可以是红外测距传感器,也可以是超声测距传感器,通过光电传感器可以检测当前目标介质的光电反馈值,之后,确定距离值是否不大于文字可识别距离阈值,和/或光电反馈值是否不小于图像可识别阈值,当距离值不大于文字可识别距离阈值,和/或光电反馈值是否不小于图像可识别阈值时,可以确定当前目标介质进入了本智能穿戴终端的可识别距离范围,从而通过摄像头采集当前目标介质的文本图像,即执行步骤100,获取文本图像。
在一个可行的实施方式中,图4是本申请实施例提供的另一种数据处理方法的流程示意图,如图4所示,该方法还包括步骤030至步骤050:
030,获取用户语音;
040,将用户语音发送给服务器,以使服务器根据云语音库将用户语音转换为文本数据指令,并将文本数据指令反馈;
050,确定文本数据指令与指定操作指令是否相匹配;
当文本数据指令与指定操作指令相匹配时,执行步骤100,获取文本图像。
在本实施例中,本智能穿戴终端还可以设置一个语音采集单元,当用户发出声音时,语音采集单元获取用户语音,之后,将该用户语音发送给服务器,以使服务器根据云语音库将用户语音转换为文本数据指令,并将文本数据指令反馈,确定文本数据指令与指定操作指令是否相匹配(即该用户语音是否为对本智能穿戴终端的语音操作指令),当文本数据指令与指定操作指令相匹配时(也就是说,该该用户语音为对本智能穿戴终端的语音操作指令),可以直接采集当前目标介质的文本图像,即执行步骤100,获取文本图像。
在本申请提供的数据处理方法中,通过100,获取文本图像;200,将文本图像发送给云端服务器,以使云端服务器对文本图像进行字符识别,得到文字文本,再根据云语音库对文字文本进行语音转换,得到播报语音,并反馈播报语音;300,对接收的播报语音进行音频播放。这样,通过智能穿戴终端获取用户眼前的书籍报纸等文本图像,然后通过云端服务器采用OCR技术对文本图像中的文字进行识别,转换出的文字文本通过云语音处理转换为播报语音,然后使用智能穿戴终端对播报语音进行音频播放,使用户轻松的用听力来完成眼前书箱及报纸的阅读。从而解决了相关技术中盲人、老人等视力障碍人群无法有效进行阅读的技术问题。
基于相同的技术构思,本申请实施例还提供了另一种数据处理方法,图5是本申请实施例提供的另一种数据处理方法的流程示意图,如图5所示,该方法应用于云端服务器,该方法包括步骤400至步骤700:
400,接收智能穿戴终端发送的文本图像;
500,对文本图像进行字符识别,得到文字文本;
600,根据文字文本生成反馈信息;
700,向智能穿戴终端反馈反馈信息,以使智能穿戴终端对接收反馈的反馈信息进行音频播放处理,以通过音频播放对用户提醒文本图像包括的文字文本。
在本申请提供的数据处理方法中,通过400,接收智能穿戴终端发送的文本图像;500,对文本图像进行字符识别,得到文字文本;600,根据文字文本生成反馈信息;700,向智能穿戴终端反馈反馈信息,以使智能穿戴终端对接收反馈的反馈信息进行音频播放处理,以通过音频播放对用户提醒文本图像包括的文字文本。这样,通过智能穿戴终端获取用户眼前的书籍报纸等文本图像,然后通过云端服务器采用OCR技术对文本图像中的文字进行识别,然后使用智能穿戴终端对识别出的文字进行音频播放,使用户轻松的用听力来完成眼前书箱及报纸的阅读。从而解决了相关技术中盲人、老人等视力障碍人群无法有效进行阅读的技术问题。
可选地,图6是本申请实施例提供的一种步骤500的流程示意图,如图6所示,步骤500,对文本图像进行字符识别,包括如下的步骤510至步骤530:
510,对文本图像进行图像处理,得到文本图像上的文字区域;
520,对文字区域进行栏位分割,得到至少一个分割区域;
530,对于每个分割区域,提取该分割区域中的每个文字图像数据,并对每个文字图像数据进行光学字符识别OCR识别,得到文字文本。
具体的,对文本图像进行图像识别,当文本图像中不存在文字时,结束对该文本图像的处理;当文本图像中存在文字时,可以识别出文本图像中包含有文字的文字区域,由于报纸或书籍中文字都是分区块排版的,而还存在一些书籍中的文字并不是分区块排版的,因此,先需要判断文本图像上的文字区域中是否存在至少两个栏位文字区域,步骤520,对文字区域进行栏位分割,得到至少一个分割区域,具体包括:
基于文字区域中文字分布确定文字区域中是否存在至少两个栏位文字区域;
当文字区域中不存在至少两个栏位文字区域,而仅存在一个整体的文字区域时,将一个整体的文字区域作为一个分割区域;
当文字区域中存在至少两个栏位文字区域,需要对该文字区域进行栏位分割,从而得到每个独立于其他区域的分割区域。
这样之后,对于每个分割区域,提取该分割区域中的每个文字图像数据,该提取过程,可以是对每个分割区域中每个具有字形特征的最小区域进行分割,分割后可以得到每个文字对应的区域,进而提取每个文字的至少包含有字形体征的文字图像数据,进而通过OCR技术对文字图像数据进行识别,从而确定出每个文字图像数据对应的文字。之后,按照分割区域的排布顺序(例如,从上之下和/或从左至右的排布顺序)对每个分割区域对的文字文本进行合并,生成该文本图像对应的文字文本。
在一个可行的实施方式中,图7是本申请实施例提供的一种步骤510的流程示意图,如图7所示,步骤510,对文本图像进行图像处理包括如下的步骤511至步骤514:
511,对文本图像进行图像灰度处理,得到灰度图像;
512,对灰度图像进行图像二值化处理,得到二值化图像;
513,识别出二值化图像中字形特征;
514,划定出包含有字形特征的文字区域。
具体的,对获取的文本图像先进行图像灰度处理,经过灰度处理后,得到该文本图像的灰度图像,之后,对灰度图像进行图像二值化处理,得到该文本图像的二值化图像,之后,对二值化图像进行图像识别,识别出二值化图像中字形特征,由于经过步骤130,可以确定文本图像中存在字形特征,进而划定出包含有字形特征的文字区域。
在一个可行的实施方式中,步骤600,根据文字文本生成反馈信息,包括:
根据云语音库对文字文本进行语音转换,得到播报语音;
根据播报语音生成反馈信息。
其中,由于将文字文本的转换为播报语音的过程由云端服务器完成,从而可以有效地克服智能穿戴终端的硬件限制,智能穿戴终端不用在设置本地语音库以及语音检索及转换单元,而且由于云端服务器包括的云语音库存储量和更新频率更高,使得将该文字文本转换为播报语音的精确性更高、速度更快。
基于相同的技术构思,本申请实施例还提供了一种智能穿戴终端,图8是本申请实施例提供的一种智能穿戴终端的结构示意图,如图8所示,该智能穿戴终端包括:
获取模块10,用于获取文本图像;
发送模块20,用于将文本图像发送给云端服务器,以使云端服务器对文本图像进行字符识别,得到文字文本,再根据文字文本生成反馈信息,并将反馈信息进行反馈;
播放模块30,用于对接收反馈的反馈信息进行音频播放处理,以通过音频播放对用户提醒文本图像包括的文字文本。
可选地,该智能穿戴终端还包括:
第一灰度处理模块,用于对文本图像进行图像灰度处理,得到灰度图像;
第一二值化处理模块,用于对灰度图像进行图像二值化处理,得到二值化图像;
第一二值化图像识别模块,用于识别出二值化图像中是否存在字形特征;
当识别出二值化图像中存在字形特征时,执行发送模块20,将文本图像发送给云端服务器。
可选地,该智能穿戴终端还包括:
采集模块,用于采集当前目标介质的对应的当前距离值和/或光电反馈值;
第一确定模块,用于确定距离值是否不大于文字可识别距离阈值,和/或光电反馈值是否不小于图像可识别阈值;
当距离值不大于文字可识别距离阈值,和/或光电反馈值是否不小于图像可识别阈值时,对于当前目标执行获取模块10,获取文本图像。
可选地,该智能穿戴终端还包括:
语音获取模块,用于获取用户语音;
语音发送模块,用于将用户语音发送给服务器,以使服务器根据云语音库将用户语音转换为文本数据指令,并将文本数据指令反馈;
第二确定模块,用于确定文本数据指令与指定操作指令是否相匹配;
当文本数据指令与指定操作指令相匹配时,执行获取模块10,获取文本图像。
基于相同的技术构思,本申请实施例还提供了一种云端服务器,图9是本申请实施例提供的一种云端服务器的结构示意图,如图9所示,该云端服务器包括:
接收模块40,用于接收智能穿戴终端发送的文本图像;
识别模块50,用于对文本图像进行字符识别,得到文字文本;
生成模块60,用于根据文字文本生成反馈信息;
反馈模块70,用于向智能穿戴终端反馈反馈信息,以使智能穿戴终端对接收反馈的反馈信息进行音频播放处理,以通过音频播放对用户提醒文本图像包括的文字文本。
可选地,该云端服务器还包括:
图像处理模块,用于对文本图像进行图像处理,得到文本图像上的文字区域;
栏位分割模块,用于对文字区域进行栏位分割,得到至少一个分割区域;
OCR识别模块,用于对于每个分割区域,提取该分割区域中的每个文字图像数据,并对每个文字图像数据进行光学字符识别OCR识别,得到文字文本。
可选地,该云端服务器还包括:
第二灰度处理模块,用于对文本图像进行图像灰度处理,得到灰度图像;
第二二值化处理模块,用于对灰度图像进行图像二值化处理,得到二值化图像;
第二二值化图像识别模块,用于识别出二值化图像中字形特征;
划定模块,用于划定出包含有字形特征的文字区域。
基于相同的技术构思,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机代码,当计算机代码被执行时,上述的数据处理方法被执行。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
本申请所涉及的计算机程序可以存储于计算机可读存储介质中,计算机可读存储介质可以包括:能够携带计算机程序代码的任何实体装置、虚拟装置、优盘、移动硬盘、磁碟、光盘、计算机存储器、只读计算机存储器(Read-Only Memory,ROM)、随机存取计算机存储器(Random Access Memory,RAM)、电载波信号、电信信号以及其他软件分发介质等。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种数据处理方法,其特征在于,该方法应用于智能穿戴终端,该方法包括:
获取文本图像;
将所述文本图像发送给云端服务器,以使所述云端服务器对所述文本图像进行字符识别,得到文字文本,再根据所述文字文本生成反馈信息,并将所述反馈信息进行反馈;
对接收反馈的所述反馈信息进行音频播放处理,以通过音频播放对用户提醒所述文本图像包括的所述文字文本。
2.根据权利要求1所述的数据处理方法,其特征在于,在所述获取文本图像之后,该方法包括:
对所述文本图像进行图像灰度处理,得到灰度图像;
对所述灰度图像进行图像二值化处理,得到二值化图像;
识别出所述二值化图像中是否存在字形特征;
当识别出所述二值化图像中存在所述字形特征时,执行所述将所述文本图像发送给云端服务器的步骤。
3.根据权利要求1所述的数据处理方法,其特征在于,该方法还包括:
采集当前目标介质的对应的当前距离值和/或光电反馈值;
确定所述距离值是否不大于文字可识别距离阈值,和/或所述光电反馈值是否不小于图像可识别阈值;
当所述距离值不大于文字可识别距离阈值,和/或所述光电反馈值是否不小于图像可识别阈值时,对于所述当前目标执行所述获取文本图像的步骤。
4.一种数据处理方法,其特征在于,该方法应用于云端服务器,该方法包括:
接收智能穿戴终端发送的文本图像;
对所述文本图像进行字符识别,得到文字文本;
根据所述文字文本生成反馈信息;
向所述智能穿戴终端反馈所述反馈信息,以使所述智能穿戴终端对接收反馈的所述反馈信息进行音频播放处理,以通过音频播放对用户提醒所述文本图像包括的所述文字文本。
5.根据权利要求4所述的数据处理方法,其特征在于,所述对所述文本图像进行字符识别,包括:
对所述文本图像进行图像处理,得到所述文本图像上的文字区域;
对所述文字区域进行栏位分割,得到至少一个分割区域;
对于每个所述分割区域,提取该分割区域中的每个文字图像数据,并对所述每个文字图像数据进行光学字符识别OCR识别,得到文字文本。
6.根据权利要求4所述的数据处理方法,其特征在于,所述对所述文本图像进行图像处理,包括:
对所述文本图像进行图像灰度处理,得到灰度图像;
对所述灰度图像进行图像二值化处理,得到二值化图像;
识别出所述二值化图像中字形特征;
划定出包含有所述字形特征的文字区域。
7.根据权利要求4所述的数据处理方法,其特征在于,所述根据所述文字文本生成反馈信息,包括:
根据云语音库对所述文字文本进行语音转换,得到播报语音;
根据所述播报语音生成所述反馈信息。
8.一种智能穿戴终端,其特征在于,该智能穿戴终端包括:
获取模块,用于获取文本图像;
发送模块,用于将所述文本图像发送给云端服务器,以使所述云端服务器对所述文本图像进行字符识别,得到文字文本,再根据所述文字文本生成反馈信息,并将所述反馈信息进行反馈;
播放模块,用于对接收反馈的所述反馈信息进行音频播放处理,以通过音频播放对用户提醒所述文本图像包括的所述文字文本。
9.一种云端服务器,其特征在于,该云端服务器包括:
接收模块,用于接收智能穿戴终端发送的文本图像;
识别模块,用于对所述文本图像进行字符识别,得到文字文本;
生成模块,用于根据所述文字文本生成反馈信息;
反馈模块,用于向所述智能穿戴终端反馈所述反馈信息,以使所述智能穿戴终端对接收反馈的所述反馈信息进行音频播放处理,以通过音频播放对用户提醒所述文本图像包括的所述文字文本。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机代码,当所述计算机代码被执行时,如权利要求1-7任一项所述的数据处理方法被执行。
CN201910508818.7A 2019-06-11 2019-06-11 智能穿戴终端、云端服务器和数据处理方法 Pending CN110334712A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910508818.7A CN110334712A (zh) 2019-06-11 2019-06-11 智能穿戴终端、云端服务器和数据处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910508818.7A CN110334712A (zh) 2019-06-11 2019-06-11 智能穿戴终端、云端服务器和数据处理方法

Publications (1)

Publication Number Publication Date
CN110334712A true CN110334712A (zh) 2019-10-15

Family

ID=68140416

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910508818.7A Pending CN110334712A (zh) 2019-06-11 2019-06-11 智能穿戴终端、云端服务器和数据处理方法

Country Status (1)

Country Link
CN (1) CN110334712A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046223A (zh) * 2019-11-14 2020-04-21 李秉伦 一种视觉障碍者语音辅助方法、终端、服务器及系统
CN111179128A (zh) * 2019-10-29 2020-05-19 广东小天才科技有限公司 一种信息播放方法、音箱设备及存储介质
CN113253797A (zh) * 2020-02-07 2021-08-13 阿里巴巴集团控股有限公司 数据处理系统、方法、装置、电子设备以及可穿戴设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609408A (zh) * 2012-01-11 2012-07-25 清华大学 基于多文种文档图像识别的跨文种理解方法
CN104143084A (zh) * 2014-07-17 2014-11-12 武汉理工大学 一种针对视力障碍人群的辅助阅读眼镜
CN106557166A (zh) * 2016-11-23 2017-04-05 上海擎感智能科技有限公司 智能眼镜及其控制方法、控制装置
CN107346629A (zh) * 2017-08-22 2017-11-14 贵州大学 一种智能盲人阅读方法及智能盲人阅读器系统
CN109196520A (zh) * 2018-08-28 2019-01-11 深圳市汇顶科技股份有限公司 生物特征识别装置、方法和电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609408A (zh) * 2012-01-11 2012-07-25 清华大学 基于多文种文档图像识别的跨文种理解方法
CN104143084A (zh) * 2014-07-17 2014-11-12 武汉理工大学 一种针对视力障碍人群的辅助阅读眼镜
CN106557166A (zh) * 2016-11-23 2017-04-05 上海擎感智能科技有限公司 智能眼镜及其控制方法、控制装置
CN107346629A (zh) * 2017-08-22 2017-11-14 贵州大学 一种智能盲人阅读方法及智能盲人阅读器系统
CN109196520A (zh) * 2018-08-28 2019-01-11 深圳市汇顶科技股份有限公司 生物特征识别装置、方法和电子设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111179128A (zh) * 2019-10-29 2020-05-19 广东小天才科技有限公司 一种信息播放方法、音箱设备及存储介质
CN111046223A (zh) * 2019-11-14 2020-04-21 李秉伦 一种视觉障碍者语音辅助方法、终端、服务器及系统
CN113253797A (zh) * 2020-02-07 2021-08-13 阿里巴巴集团控股有限公司 数据处理系统、方法、装置、电子设备以及可穿戴设备

Similar Documents

Publication Publication Date Title
CN110287830A (zh) 智能穿戴终端、云端服务器和数据处理方法
CN107197384B (zh) 应用于视频直播平台的虚拟机器人多模态交互方法和系统
CN103052953B (zh) 信息处理设备、信息处理方法
CN110334712A (zh) 智能穿戴终端、云端服务器和数据处理方法
CN107357787B (zh) 语义交互方法、装置及电子设备
CN105787133B (zh) 广告信息过滤方法及装置
CN106062730A (zh) 用于主动构成内容以便在连续社交通信中使用的系统和方法
CN114465737B (zh) 一种数据处理方法、装置、计算机设备及存储介质
CN110072140B (zh) 一种视频信息提示方法、装置、设备及存储介质
CN102193772A (zh) 信息处理器、信息处理方法和程序
CN113392687A (zh) 视频标题生成方法、装置、计算机设备及存储介质
CN108230033A (zh) 用于输出信息的方法和装置
CN113870133A (zh) 多媒体显示及匹配方法、装置、设备及介质
CN114598933B (zh) 一种视频内容处理方法、系统、终端及存储介质
CN112199932A (zh) Ppt生成方法、装置、计算机可读存储介质及处理器
CN111488813A (zh) 视频的情感标注方法、装置、电子设备及存储介质
CN114390368A (zh) 直播视频数据的处理方法及装置、设备、可读介质
CN111354350B (zh) 语音处理方法及装置、语音处理设备、电子设备
KR20220077790A (ko) A.i 및 빅데이터에 기반한 비대면 온라인 멘토, 멘티 매칭 플랫폼 시스템
US20220375223A1 (en) Information generation method and apparatus
CN113099267B (zh) 视频生成方法、装置、电子设备及存储介质
CN107291952B (zh) 一种提取有意义串的方法及装置
CN112885356B (zh) 一种基于声纹的语音识别方法
CN109525868A (zh) 视频的焦点分布的分析系统、分析方法及存储媒体
CN113128261B (zh) 数据处理方法及装置、视频处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191015

RJ01 Rejection of invention patent application after publication