CN108628858A - 基于移动终端的文字扫描识别在线翻译的操作方法及系统 - Google Patents

基于移动终端的文字扫描识别在线翻译的操作方法及系统 Download PDF

Info

Publication number
CN108628858A
CN108628858A CN201810360893.9A CN201810360893A CN108628858A CN 108628858 A CN108628858 A CN 108628858A CN 201810360893 A CN201810360893 A CN 201810360893A CN 108628858 A CN108628858 A CN 108628858A
Authority
CN
China
Prior art keywords
pixel
noise reduction
mobile terminal
translation
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810360893.9A
Other languages
English (en)
Inventor
蒋海锋
万畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Institute of Science and Technology
Original Assignee
Guangdong Institute of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Institute of Science and Technology filed Critical Guangdong Institute of Science and Technology
Priority to CN201810360893.9A priority Critical patent/CN108628858A/zh
Publication of CN108628858A publication Critical patent/CN108628858A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Image Processing (AREA)

Abstract

本发明提供了一种基于移动终端的文字扫描识别在线翻译的操作方法及系统,应用移动设备来进行纸质文件的文字扫描识别和在线翻译,通过将移动设备放置在拍摄固定架进行拍摄并进行预定放置位置和预拍摄的检测,提高移动设备拍摄照片的清晰度,保证文字的还原度;然后对拍摄照片进行除燥处理来消除拍摄照片因拍照模糊或者光线不充足所产生的杂质或暗影,以及采用先整体后局部的识别策略来提高扫描识别的正确率,减少错误识别的发生;再将扫描识别的结果发送给在线翻译网站进行翻译并对翻译结果进行语句错误的校正,以保证最终翻译结果的准确性。本发明操作方便简单,翻译准确率高,并且可有效提高翻译效率。

Description

基于移动终端的文字扫描识别在线翻译的操作方法及系统
技术领域
本发明属于数据处理技术领域,尤其涉及一种基于移动终端的文字扫描识别在线翻译的操作方法及系统。
背景技术
随着全球化浪潮的不断推进,我国与外国之间的商务交往和文化交流越来越多,怎样消除语言障碍,提高与外国人的交流效率也越来越重要。在对外商务或文化交流的场合,经常会出现需要将纸质的外文文件翻译成中文文件或者将中文文件翻译成其他国家语言文件的情况。如果需要翻译的文件只有纸件材料的情况下,无法直接采用翻译软件进行翻译,需要工作人员将纸件材料上的文字逐字逐句的进行翻译,耗时耗力,且容易耽误业务或谈判的正常进行。
发明内容
为了解决上述技术问题,本发明提供一种基于移动终端的文字扫描识别在线翻译的操作方法,包括:
S1.将移动终端放置于拍摄固定架上,移动终端上安装的客户端检测移动终端的位置直至移动终端调整至拍摄的预定放置位置;
S2.客户端进行预拍摄检测,根据检测结果调整移动终端高度;当移动终端到达合适高度时,拍摄纸件文件的照片;
S3.客户端对照片进行除噪处理,获得低噪图片;
S4.客户端扫描识别低噪图片上的文字,保存成文档文件;
S5.客户端提取文档文件中的文字,选择需要翻译的语言应用翻译软件进行在线翻译;翻译结束后矫正语句错误,获得翻译文件。
进一步的,步骤S1包括:将待拍摄纸件文件正面朝上水平放置,并将拍摄固定架压放在待拍摄纸件文件的空白处;将移动终端放置于拍摄固定架上;客户端的位置检测模块检测移动终端是否处于拍摄的预定放置位置;如果是,位置检测模块激活移动终端的摄像头驱动软件进入拍照模式;如果否,位置检测模块发出调整移动终端放置位置的提醒信息并在移动终端上显示;移动终端每次被移动后,位置检测模块都会重新检测移动终端的位置直至移动终端调整至拍摄的预定放置位置。
进一步的,客户端检测移动终端是否处于拍摄的预定放置位置的具体过程包括:客户端的位置检测模块调用移动终端的陀螺仪测定陀螺仪中读取传感器平面的法向量与待拍摄纸件文件的夹角θ,设定当位置检测模块检测到θ∈[-95°~-90°或90°-95°]时,位置检测模块向移动终端的摄像头驱动软件发送激活信号。
进一步的,所述拍摄固定架包括底部放置架和可伸缩的立柱;所述底部放置架包括第一压条以及与所述第一压条水平垂直的两根第二压条,两根所述第二压条的一端分别与所述第一压条的两端连接;所述立柱垂直设置,所述立柱的底端与所述第一压条的中间位置连接,所述立柱的顶端设置有移动终端放置架。
进一步的,移动终端放置架可绕立柱的顶端调整角度。
进一步的,立柱上设有立柱伸缩装置,其高度可调节,可以适应不同的光圈微距的移动终端,通过调节立柱的高度,将移动终端调整至合适的对焦位置,使移动终端可以拍出更加清晰的照片。
进一步的,拍摄固定架还包括与立柱伸缩装置连接的伸缩控制装置。当移动终端位于移动终端放置架上时,移动终端与伸缩控制装置连接,伸缩控制装置根据客户端预拍摄检测的检测结果自动调整移动终端的高度。
进一步的,第一压条为可伸缩结构,其长度可调节,使底部放置架适合压放不同大小的纸质文件。使用者将第一压条的长度调节合适,即可使第一压条和两根第二压条均压放在纸质文件的周边空白处,操作简单,使用方便。
进一步的,步骤S2包括:移动终端进入拍照模式后,客户端的预拍摄检测模块进行预拍摄检测,根据检测结果调整移动终端高度;当预拍摄检测模块检测到待拍摄图片占移动终端拍摄界面的75%-85%时,摄像头对焦3秒后拍摄,获得纸件文件的照片。
进一步的,步骤S3具体包括:
(1)客户端的对比度检测单元将纸件文件的照片处理成待降噪图像,具体包括:首先将照片分成若干大小为6像素*6像素的待处理块D,按照下列公式计算每一个待处理块D的图像对比度con:
其中,maxD表示D中像素值的最大值,minD表示D中像素值的最小值;
然后按照下列公式统计每一个待处理块D的对比度符合系统预设要求的比例pcon:
其中conmin为符合系统预设要求的对比度的最小值,size()为满足要求的数量,如果pcon≤pconmin,则忽略该待处理块D;剩余所有未忽略的待处理块D组成待降噪图像;
(2)客户端的图像纹理检测单元确定该待降噪图像的待降噪像素点的图像纹理程度值,具体包括:
以待降噪图像中的任一待降噪像素点为中心,统计该待降噪像素点周围预设区域内的其它待降噪像素点与该待降噪像素点的亮度差值,获得最大亮度差值和最小亮度差值,并根据最大亮度差值与该降噪像素点的噪点阈值半径=3.2确定该待降噪像素点的LBP图像纹理程度值;
(3)客户端的图像相似性检测单元根据图像纹理程度值设定待降噪像素点的相似性检测下限阈值和上限阈值;
(4)客户端的权重计算单元根据预设区域内各个像素点与待降噪像素点的像素值的差值、待降噪像素点的相似性检测的下限阈值以及上限阈值,按照下列公式计算系统预设区域内各个像素点的权重值W(i,j);
其中,Diff(i,j)为预设区域内其他像素点j与待降噪像素点i的像素值的差值;THlow为待降噪像素点的相似性检测的下限阈值;THhign为待降噪像素点的相似性检测的上限阈值;
(5)客户端的降噪处理单元对待降噪像素点i进行多次循环降噪,每一次降噪处理均利用前一次的降噪结果,直至照片除噪处理成符合系统预设要求的低噪图片。
进一步的,对待降噪像素点i按照如下公式进行降噪:
其中,Pout为待降噪像素点i降噪后的像素值,Pin为待降噪像素点i降噪前的像素值,N为预设区域内其他像素点j的数量。
进一步的,步骤S4具体包括:
(1)在低噪图片中选择任一像素作为当前像素,以当前像素周围的像素作为该当前像素的邻域像素;在当前像素周围选择一最大扫描识别框,最大扫描识别框应包含低噪图片中所有待扫描识别的文字;
(2)计算最大扫描识别框中每一像素的降噪处理前比较框与降噪处理后比较框中相对位置像素的灰度值的差值的绝对值总和;当该差值的绝对值总和大于预先设定的门槛值时,判定该像素为边缘像素,通过最小门槛值所求出的边缘像素为最低边缘像素,以具有最低边缘像素的部分作为次搜寻框,次搜寻框的尺寸为低噪图片中单个文字的尺寸;将次搜寻框作为当前搜寻框,并根据当前搜寻框中边缘像素所占比例决定一灰度强度参数,并在当前搜寻框中每一像素周围决定一比较框,求出当前搜寻框中每一邻域像素与当前像素的相似度;
(3)按照(2)所求出的相似度,将图像上的像素点的灰度值设置为0和255CCD,经高斯累计光斑中心定位的方法,平均二值化处理后的图像将呈现出明显的黑白效果;
(4)将次搜寻框框选的图片上的文本区域作为当前图片形式读取;对次搜寻框框选文本区域中的各个图元文字分别进行选取;将次搜寻框框选文本区域中的第一个图元文字与字模库模块储存的各种常规字体的字模库中的各个字模文字作对比,找到相似度最高的字模文字;将记录该相似度最高的字模文字的字模库定义为标准字模库;将次搜寻框框选文本区域中第一个图元文字后面的各图元文字只与标准字模库中的各字模文字作比较,在标准字模库中分别依次找到相似度最高的字模文字,并以可编辑文字的形式输出,自动保存成文档文件。
进一步的,步骤S5具体包括:首先本地提取单元提取文档文件中的文字,将提取的文字作为待翻译内容,并将待翻译内容发送给在线翻译单元;然后通过翻译选择单元选择翻译语言和翻译网站,翻译选择单元将选择结果发送给在线翻译单元;在线翻译单元接收到本地提取单元发送的待翻译内容以及翻译选择单元发送的选择结果后,根据翻译网站的选择结果将待翻译内容和翻译语言通过无线网络或有线网络发送到选择的在线翻译网站,接收从在线翻译网站反馈的翻译结果并发送给校正单元;校正单元对翻译结果中的语句错误进行校正后即可获得翻译文件。
本发明还提供一种基于移动终端的文字扫描识别在线翻译的操作系统,包括拍摄固定架以及安装在移动终端上的客户端,所述客户端包括:
位置检测模块:用于检测移动终端是否处于拍摄的预定放置位置;
预拍摄检测模块:用于检测待拍摄图片与移动终端拍摄界面的相对大小,并根据检测结果发送调整移动终端高度的信息;当移动终端到达合适高度时,向移动终端的摄像头发送拍摄指令;
除燥模块:用于对照片进行除噪处理,获得低噪图片;
扫描识别模块:用于扫描识别低噪图片上的文字,保存成文档文件;
翻译模块:用于提取文档文件中的文字,选择需要翻译成的语言应用翻译软件进行在线翻译;翻译结束后矫正语句错误,获得翻译文件。
进一步的,所述客户端还包括字模库模块,所述字模库模块用于储存各种常规字体的字模库。
进一步的,所述拍摄固定架包括底部放置架和可伸缩的立柱;所述底部放置架包括第一压条以及与所述第一压条水平垂直的两根第二压条,两根所述第二压条的一端分别与所述第一压条的两端连接;所述立柱垂直设置,所述立柱的底端与所述第一压条的中间位置连接,所述立柱的顶端设置有移动终端放置架。
进一步的,移动终端放置架可绕立柱的顶端调整角度。
进一步的,立柱上设有立柱伸缩装置,其高度可调节,可以适应不同的光圈微距的移动终端,通过调节立柱的高度,将移动终端调整至合适的对焦位置,使移动终端可以拍出更加清晰的照片。
进一步的,拍摄固定架还包括与立柱伸缩装置连接的伸缩控制装置。当移动终端位于移动终端放置架上时,移动终端与伸缩控制装置连接,伸缩控制装置根据客户端预拍摄检测的检测结果自动调整移动终端的高度。
进一步的,第一压条为可伸缩结构,其长度可调节,使底部放置架适合压放不同大小的纸质文件。使用者将第一压条的长度调节合适,即可使第一压条和两根第二压条均压放在纸质文件的周边空白处,操作简单,使用方便。
进一步的,所述除燥模块包括对比度检测单元、图像纹理检测单元、图像相似性检测单元、权重计算单元和降噪处理单元,其中:
对比度检测单元:用于将纸件文件的照片处理成待降噪图像,具体包括:首先将照片分成若干大小为6像素*6像素的待处理块D,按照下列公式计算每一个待处理块D的图像对比度con:
其中,maxD表示D中像素值的最大值,minD表示D中像素值的最小值;
然后按照下列公式统计每一个待处理块D的对比度符合系统预设要求的比例pcon:
其中conmin为符合系统预设要求的对比度的最小值,size()为满足要求的数量,如果pcon≤pconmin,则忽略该待处理块D;剩余所有未忽略的待处理块D组成待降噪图像;
图像纹理检测单元:用于确定该待降噪图像的待降噪像素点的图像纹理程度值,具体包括:以待降噪图像中的任一待降噪像素点为中心,统计该待降噪像素点周围预设区域内的其它待降噪像素点与该待降噪像素点的亮度差值,获得最大亮度差值和最小亮度差值,并根据最大亮度差值与该降噪像素点的噪点阈值半径=3.2确定该待降噪像素点的LBP图像纹理程度值;
图像相似性检测单元:用于根据图像纹理程度值设定待降噪像素点的相似性检测下限阈值和上限阈值;
权重计算单元:用于根据预设区域内各个像素点与待降噪像素点的像素值的差值、待降噪像素点的相似性检测的下限阈值以及上限阈值计算系统预设区域内各个像素点的权重值;
各个像素点的权重值W(i,j)按照下列公式计算:
其中,Diff(i,j)为预设区域内其他像素点j与待降噪像素点i的像素值的差值;THlow为待降噪像素点的相似性检测的下限阈值;THhign为待降噪像素点的相似性检测的上限阈值;
降噪处理单元:用于对待降噪像素点i进行多次循环降噪,每一次降噪处理均利用前一次的降噪结果,直至照片除噪处理成符合系统预设要求的低噪图片。
进一步的,对待降噪像素点i按照如下公式进行降噪:
其中,Pout为待降噪像素点i降噪后的像素值,Pin为待降噪像素点i降噪前的像素值,N为预设区域内其他像素点j的数量。
进一步的,所述翻译模块包括本地提取单元、翻译选择单元、在线翻译单元和校正单元,其中:
本地提取单元:用于提取文档文件中的文字,将提取的文字作为待翻译内容,并将待翻译内容发送给在线翻译单元;
翻译选择单元:用于选择翻译语言和翻译网站,并将选择结果发送给在线翻译单元;
在线翻译单元:用于接收本地提取单元发送的待翻译内容以及翻译选择单元发送的选择结果,并根据翻译网站的选择结果将待翻译内容和翻译语言通过无线网络或有线网络发送到选择的在线翻译网站;接收从在线翻译网站反馈的翻译结果并发送给校正单元;
校正单元:用于对翻译结果中的语句错误进行校正,获得翻译文件。
与现有技术相比,本发明的有益效果在于:
本发明应用移动设备来进行纸质文件的文字扫描识别和在线翻译,通过将移动设备放置在拍摄固定架进行拍摄并进行预定放置位置和预拍摄的检测,提高移动设备拍摄照片的清晰度,保证文字的还原度;然后对拍摄照片进行除燥处理来消除拍摄照片因拍照模糊或者光线不充足所产生的杂质或暗影,以及采用先整体后局部的识别策略来提高扫描识别的正确率,减少错误识别的发生;再将扫描识别的结果发送给在线翻译网站进行翻译并对翻译结果进行语句错误的校正,以保证最终翻译结果的准确性。本发明操作方便简单,翻译准确率高,并且可有效提高翻译效率。
附图说明
图1为基于移动终端的文字扫描识别在线翻译的操作系统的客户端的结构示意图;
图2为基于移动终端的文字扫描识别在线翻译的操作系统的拍摄固定架的结构示意图。
具体实施方式
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明保护范围的限制。
下面将参照附图更详细地描述本发明的示例性实施例。
实施例1
一种基于移动终端的文字扫描识别在线翻译的操作方法,包括:
S1.将待拍摄纸件文件4正面朝上水平放置,并将拍摄固定架压放在待拍摄纸件文件4的空白处;将移动终端放置于拍摄固定架上;移动终端上安装的客户端的位置检测模块检测移动终端是否处于拍摄的预定放置位置;如果是,位置检测模块激活移动终端的摄像头驱动软件进入拍照模式;如果否,位置检测模块发出调整移动终端放置位置的提醒信息并在移动终端上显示;移动终端每次被移动后,位置检测模块都会重新检测移动终端的位置直至移动终端调整至拍摄的预定放置位置;
S2.移动终端进入拍照模式后,客户端的预拍摄检测模块进行预拍摄检测,根据检测结果调整移动终端高度;当预拍摄检测模块检测到待拍摄图片占移动终端拍摄界面的75%-85%时,摄像头对焦3秒后拍摄,获得纸件文件4的jpg格式照片;
S3.客户端的除燥模块对jpg格式照片进行除噪处理,获得低噪jpg图片;
S4.客户端的扫描识别模块扫描识别低噪jpg图片上的文字,保存成Word文件或PDF文件;
S5.客户端的翻译模块提取Word文件或PDF文件中的文字,选择需要翻译成的语言应用翻译软件进行在线翻译;翻译结束后矫正语句错误,获得Word翻译文件或PDF翻译文件。
在本实施例中,拍摄固定架如图2所示,包括底部放置架1和可伸缩的立柱2;底部放置架1包括第一压条以及与第一压条水平垂直的两根第二压条,两根第二压条的一端分别与第一压条的两端连接;立柱2垂直设置,其底端与第一压条的中间位置连接,其顶端设置有移动终端放置架3。
优选的,移动终端放置架3可绕立柱2的顶端调整角度。
优选的,立柱2上设有立柱伸缩装置,其高度可调节,可以适应不同的光圈微距的移动终端,通过调节立柱2的高度,将移动终端调整至合适的对焦位置,使移动终端可以拍出更加清晰的照片。
优选的,拍摄固定架还包括与立柱伸缩装置连接的伸缩控制装置。当移动终端位于移动终端放置架上时,移动终端与伸缩控制装置连接,伸缩控制装置根据客户端预拍摄检测的检测结果自动调整移动终端的高度。
优选的,第一压条为可伸缩结构,其长度可调节,使底部放置架1适合压放不同大小的纸质文件。使用者将第一压条的长度调节合适,即可使第一压条和两根第二压条均压放在纸质文件的周边空白处,操作简单,使用方便。
在本实施例中,客户端检测移动终端是否处于拍摄的预定放置位置的具体过程包括:客户端的位置检测模块调用移动终端的陀螺仪测定陀螺仪中读取传感器平面的法向量与待拍摄纸件文件4的夹角θ;设定当θ>0时,传感器背对待拍摄纸件文件4,当θ<0时,传感器正对待拍摄纸件文件4,当θ=0时,传感器和待拍摄纸件文件4垂直,当时,传感器和待拍摄纸件文件4平行;当位置检测模块检测到θ∈[-95°~-90°或90°-95°]时,移动终端和待拍摄纸件文件4平行,表明移动终端处于拍摄的预定放置位置,位置检测模块向移动终端的摄像头驱动软件发送激活信号。
现有移动终端中均配置有陀螺仪,利用陀螺仪即可监测拍照移动终端是否与待拍摄纸件文件4平行设置。移动终端与待拍摄纸件文件4平行设置可以使拍出的照片更加的清晰,文字也不易变形,提高了文字的还原度,更加有利于纸件文件4的jpg格式照片的除噪处理和扫描识别,大大提高了后续扫描识别的正确率。
在本实施例中,步骤S3具体包括:
(1)客户端的对比度检测单元将移动终端的摄像头拍摄的纸件文件4的jpg格式照片处理成待降噪图像,具体包括:首先将jpg格式照片分成若干大小为6像素*6像素的待处理块D,按照下列公式计算每一个待处理块D的图像对比度con:
其中,maxD表示D中像素值的最大值,minD表示D中像素值的最小值;
然后按照下列公式统计每一个待处理块D的对比度符合系统预设要求的比例pcon:
其中conmin为符合系统预设要求的对比度的最小值,size()为满足要求的数量,如果pcon≤pconmin,则忽略该待处理块D;剩余所有未忽略的待处理块D组成待降噪图像;
(2)客户端的图像纹理检测单元确定该待降噪图像的待降噪像素点的图像纹理程度值,具体包括:
以待降噪图像中的任一待降噪像素点为中心,统计该待降噪像素点周围预设区域内的其它待降噪像素点与该待降噪像素点的亮度差值,获得最大亮度差值和最小亮度差值,并根据最大亮度差值与该降噪像素点的噪点阈值半径=3.2确定该待降噪像素点的LBP图像纹理程度值;(3)客户端的图像相似性检测单元根据图像纹理程度值设定待降噪像素点的相似性检测下限阈值和上限阈值;
(4)客户端的权重计算单元根据预设区域内各个像素点与待降噪像素点的像素值的差值、待降噪像素点的相似性检测的下限阈值以及上限阈值,按照下列公式计算系统预设区域内各个像素点的权重值W(i,j);
其中,Diff(i,j)为预设区域内其他像素点j与待降噪像素点i的像素值的差值;THlow为待降噪像素点的相似性检测的下限阈值;THhign为待降噪像素点的相似性检测的上限阈值;
(5)客户端的降噪处理单元对待降噪像素点i进行多次循环降噪,每一次降噪处理均利用前一次的降噪结果,直至jpg格式照片除噪处理成符合系统预设要求的低噪jpg图片;
对待降噪像素点i按照如下公式进行降噪:
其中,Pout为待降噪像素点i降噪后的像素值,Pin为待降噪像素点i降噪前的像素值,N为预设区域内其他像素点j的数量。
采用上述步骤进行除噪处理,可以使纸件文件4的jpg格式照片除噪处理得更为彻底,消除jpg格式照片因拍照模糊或者光线不充足所产生的杂质或暗影,方便下一步的扫描识别,大大提高扫描识别的正确率。
在本实施例中,步骤S4具体包括:
(1)在低噪jpg图片中选择任一像素作为当前像素,以当前像素周围的像素作为该当前像素的邻域像素;在当前像素周围选择一最大扫描识别框,最大扫描识别框应包含低噪jpg图片中所有待扫描识别的文字;
(2)计算最大扫描识别框中每一像素的降噪处理前比较框与降噪处理后比较框中相对位置像素的灰度值的差值的绝对值总和;当该差值的绝对值总和大于预先设定的门槛值时,判定该像素为边缘像素,通过最小门槛值所求出的边缘像素为最低边缘像素,以具有最低边缘像素的部分作为次搜寻框,次搜寻框的尺寸为低噪jpg图片中单个文字的尺寸;将次搜寻框作为当前搜寻框,并根据当前搜寻框中边缘像素所占比例决定一灰度强度参数,并在当前搜寻框中每一像素周围决定一比较框,求出当前搜寻框中每一邻域像素与当前像素的相似度;
(3)按照(2)所求出的相似度,将图像上的像素点的灰度值设置为0和255CCD,经高斯累计光斑中心定位的方法,平均二值化处理后的图像将呈现出明显的黑白效果;
(4)将次搜寻框框选的图片上的文本区域作为当前图片形式读取;对次搜寻框框选文本区域中的各个图元文字分别进行选取;将次搜寻框框选文本区域中的第一个图元文字与字模库模块储存的各种常规字体的字模库中的各个字模文字作对比,找到相似度最高的字模文字;将记录该相似度最高的字模文字的字模库定义为标准字模库;将次搜寻框框选文本区域中第一个图元文字后面的各图元文字只与标准字模库中的各字模文字作比较,在标准字模库中分别依次找到相似度最高的字模文字,并以可编辑文字的形式输出,自动保存成Word文件或PDF文件。
采用上述步骤进行扫描识别,采用先整体后局部的识别策略,可以提高扫描识别的正确率,减少错误识别的发生,进而提高在线翻译的准确率。
在本实施例中,步骤S5具体包括:首先本地提取单元提取Word文件或PDF文件中的文字,将提取的文字作为待翻译内容,并将待翻译内容发送给在线翻译单元;然后通过翻译选择单元选择翻译语言和翻译网站,翻译选择单元将选择结果发送给在线翻译单元;在线翻译单元接收到本地提取单元发送的待翻译内容以及翻译选择单元发送的选择结果后,根据翻译网站的选择结果将待翻译内容和翻译语言通过无线网络或有线网络发送到选择的在线翻译网站,接收从在线翻译网站反馈的翻译结果并发送给校正单元;校正单元对翻译结果中的语句错误进行校正后即可获得Word翻译文件或PDF翻译文件。
实施例2
一种基于移动终端的文字扫描识别在线翻译的操作系统,如图1和图2所示,包括拍摄固定架以及安装在移动终端上的客户端,其中:
拍摄固定架包括底部放置架1和可伸缩的立柱2;底部放置架1包括第一压条以及与第一压条水平垂直的两根第二压条,两根第二压条的一端分别与第一压条的两端连接;立柱2垂直设置,其底端与第一压条的中间位置连接,其顶端设置有移动终端放置架3;
优选的,移动终端放置架3可绕立柱2的顶端调整角度;
优选的,立柱2上设有立柱伸缩装置,其高度可调节,可以适应不同的光圈微距的移动终端,通过调节立柱2的高度,将移动终端调整至合适的对焦位置,使移动终端可以拍出更加清晰的照片;
优选的,拍摄固定架还包括与立柱伸缩装置连接的伸缩控制装置;当移动终端位于移动终端放置架上时,移动终端与伸缩控制装置连接,伸缩控制装置根据客户端预拍摄检测的检测结果自动调整移动终端的高度;
优选的,第一压条为可伸缩结构,其长度可调节,使底部放置架1适合压放不同大小的纸质文件。使用者将第一压条的长度调节合适,即可使第一压条和两根第二压条均压放在纸质文件的周边空白处,操作简单,使用方便;
客户端包括位置检测模块、预拍摄检测模块、除燥模块、扫描识别模块、翻译模块和字模库模块,其中:
位置检测模块:用于检测移动终端是否处于拍摄的预定放置位置;如果是,位置检测模块激活移动终端的摄像头驱动软件进入拍照模式;如果否,位置检测模块发出调整移动终端放置位置的提醒信息并在移动终端上显示;每次调整移动终端的位置后,位置检测模块都会重新检测移动终端的位置直至移动终端调整至拍摄的预定放置位置;
在本实施例中,位置检测模块检测移动终端是否处于拍摄的预定放置位置的具体方法为:位置检测模块调用移动终端的陀螺仪测定陀螺仪中读取传感器平面的法向量与待拍摄纸件文件4的夹角θ;设定,当θ>0时,传感器背对待拍摄纸件文件4,当θ<0时,传感器正对待拍摄纸件文件4,当θ=0时,传感器和待拍摄纸件文件4垂直,当时,传感器和待拍摄纸件文件4平行;当位置检测模块检测到θ∈[-95°~-90°或90°-95°]时,移动终端和待拍摄纸件文件4平行,表明移动终端处于拍摄的预定放置位置,位置检测模块向移动终端的摄像头驱动软件发送激活信号;
现有移动终端中均配置有陀螺仪,利用陀螺仪即可监测拍照移动终端是否与待拍摄纸件文件4平行设置。移动终端与待拍摄纸件文件4平行设置可以使拍出的照片更加的清晰,文字也不易变形,提高了文字的还原度,更加有利于纸件文件4的jpg格式照片的除噪处理和扫描识别,大大提高了后续扫描识别的正确率;
预拍摄检测模块:用于检测待拍摄图片与移动终端拍摄界面的相对大小,并根据检测结果发送调整移动终端高度的信息;当通过调整移动终端高度后预拍摄检测模块检测到待拍摄图片占移动终端拍摄界面的75%-85%时,摄像头对焦3秒后拍摄,获得纸件文件4的jpg格式照片;在本实施例中,当拍摄固定架包括与立柱伸缩装置连接的伸缩控制装置时,预拍摄检测模块将调整移动终端高度的信息发送给伸缩控制装置;否则直接将调整移动终端高度的信息在移动终端上显示;
除燥模块:用于对移动终端的摄像头拍摄的纸件文件4的jpg格式照片进行除噪处理,获得低噪jpg图片;包括对比度检测单元、图像纹理检测单元、图像相似性检测单元、权重计算单元和降噪处理单元,其中:
对比度检测单元:用于将纸件文件4的jpg格式照片处理成待降噪图像,具体包括:首先将jpg格式照片分成若干大小为6像素*6像素的待处理块D,按照下列公式计算每一个待处理块D的图像对比度con:
其中,maxD表示D中像素值的最大值,minD表示D中像素值的最小值;
然后按照下列公式统计每一个待处理块D的对比度符合系统预设要求的比例pcon:
其中conmin为符合系统预设要求的对比度的最小值,size()为满足要求的数量,如果pcon≤pconmin,则忽略该待处理块D;剩余所有未忽略的待处理块D组成待降噪图像;
图像纹理检测单元:用于确定该待降噪图像的待降噪像素点的图像纹理程度值,具体包括:以待降噪图像中的任一待降噪像素点为中心,统计该待降噪像素点周围预设区域内的其它待降噪像素点与该待降噪像素点的亮度差值,获得最大亮度差值和最小亮度差值,并根据最大亮度差值与该降噪像素点的噪点阈值半径=3.2确定该待降噪像素点的LBP图像纹理程度值;
图像相似性检测单元:用于根据图像纹理程度值设定待降噪像素点的相似性检测下限阈值和上限阈值;
权重计算单元:用于根据预设区域内各个像素点与待降噪像素点的像素值的差值、待降噪像素点的相似性检测的下限阈值以及上限阈值计算系统预设区域内各个像素点的权重值;
各个像素点的权重值W(i,j)按照下列公式计算:
其中,Diff(i,j)为预设区域内其他像素点j与待降噪像素点i的像素值的差值;THlow为待降噪像素点的相似性检测的下限阈值;THhign为待降噪像素点的相似性检测的上限阈值;
降噪处理单元:用于对待降噪像素点i进行多次循环降噪,每一次降噪处理均利用前一次的降噪结果,直至jpg格式照片除噪处理成符合系统预设要求的低噪jpg图片;
对待降噪像素点i按照如下公式进行降噪:
其中,Pout为待降噪像素点i降噪后的像素值,Pin为待降噪像素点i降噪前的像素值,N为预设区域内其他像素点j的数量;
经过除燥模块的处理,可以有效消除jpg格式照片因拍照模糊或者光线不充足所产生的杂质或暗影,方便扫描识别模块进行扫描识别,大大提高扫描识别的正确率;
扫描识别模块:用于扫描识别低噪jpg图片上的文字,保存成Word文件或PDF文件;
翻译模块:用于提取Word文件或PDF文件中的文字,选择需要翻译成的语言应用翻译软件进行在线翻译;翻译结束后矫正语句错误,获得Word翻译文件或PDF翻译文件;包括本地提取单元、翻译选择单元、在线翻译单元和校正单元,其中:
本地提取单元:用于提取Word文件或PDF文件中的文字,将提取的文字作为待翻译内容,并将待翻译内容发送给在线翻译单元;
翻译选择单元:用于选择翻译语言和翻译网站,并将选择结果发送给在线翻译单元;
在线翻译单元:用于接收本地提取单元发送的待翻译内容以及翻译选择单元发送的选择结果,并根据翻译网站的选择结果将待翻译内容和翻译语言通过无线网络或有线网络发送到选择的在线翻译网站;接收从在线翻译网站反馈的翻译结果并发送给校正单元;
校正单元:用于对翻译结果中的语句错误进行校正,获得Word翻译文件或PDF翻译文件;
字模库模块:用于储存各种常规字体的字模库。
在本实施例中,扫描识别模块扫描识别低噪jpg图片上的文字保存成Word文件或PDF文件的具体过程包括:
(1)在低噪jpg图片中选择任一像素作为当前像素,以当前像素周围的像素作为该当前像素的邻域像素;在当前像素周围选择一最大扫描识别框,最大扫描识别框应包含低噪jpg图片中所有待扫描识别的文字;
(2)计算最大扫描识别框中每一像素的降噪处理前比较框与降噪处理后比较框中相对位置像素的灰度值的差值的绝对值总和;当该差值的绝对值总和大于预先设定的门槛值时,判定该像素为边缘像素,通过最小门槛值所求出的边缘像素为最低边缘像素,以具有最低边缘像素的部分作为次搜寻框,次搜寻框的尺寸为低噪jpg图片中单个文字的尺寸;将次搜寻框作为当前搜寻框,并根据当前搜寻框中边缘像素所占比例决定一灰度强度参数,并在当前搜寻框中每一像素周围决定一比较框,求出当前搜寻框中每一邻域像素与当前像素的相似度;
(3)按照(2)所求出的相似度,将图像上的像素点的灰度值设置为0和255CCD,经高斯累计光斑中心定位的方法,平均二值化处理后的图像将呈现出明显的黑白效果;
(4)将次搜寻框框选的图片上的文本区域作为当前图片形式读取;对次搜寻框框选文本区域中的各个图元文字分别进行选取;将次搜寻框框选文本区域中的第一个图元文字与字模库模块中储存的各种常规字体字模库中的各个字模文字作对比,找到相似度最高的字模文字;将记录该相似度最高的字模文字的字模库定义为标准字模库;将次搜寻框框选文本区域中第一个图元文字后面的各图元文字只与标准字模库中的各字模文字作比较,在标准字模库中分别依次找到相似度最高的字模文字,并以可编辑文字的形式输出,自动保存成Word文件或PDF文件。
扫描识别模块采用先整体后局部的识别策略,可以提高扫描识别的正确率,减少错误识别的发生,进而提高在线翻译的准确率。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (10)

1.一种基于移动终端的文字扫描识别在线翻译的操作方法,其特征在于,所述方法包括:
S1.将移动终端放置于拍摄固定架上,移动终端上安装的客户端检测移动终端的位置直至移动终端调整至拍摄的预定放置位置;
S2.客户端进行预拍摄检测,根据检测结果调整移动终端高度;当移动终端到达合适高度时,拍摄纸件文件(4)的照片;
S3.客户端对照片进行除噪处理,获得低噪图片;
S4.客户端扫描识别低噪图片上的文字,保存成文档文件;
S5.客户端提取文档文件中的文字,选择需要翻译的语言应用翻译软件进行在线翻译;翻译结束后矫正语句错误,获得翻译文件。
2.根据权利要求1所述的操作方法,其特征在于,步骤S1包括:将待拍摄纸件文件(4)正面朝上水平放置,并将拍摄固定架压放在待拍摄纸件文件(4)的空白处;将移动终端放置于拍摄固定架上;客户端的位置检测模块检测移动终端是否处于拍摄的预定放置位置;如果是,位置检测模块激活移动终端的摄像头驱动软件进入拍照模式;如果否,位置检测模块发出调整移动终端放置位置的提醒信息并在移动终端上显示;移动终端每次被移动后,位置检测模块都会重新检测移动终端的位置直至移动终端调整至拍摄的预定放置位置。
3.根据权利要求1所述的操作方法,其特征在于,客户端检测移动终端是否处于拍摄的预定放置位置的具体过程包括:客户端的位置检测模块调用移动终端的陀螺仪测定陀螺仪中读取传感器平面的法向量与待拍摄纸件文件(4)的夹角θ,设定当位置检测模块检测到θ∈[-95°~-90°或90°-95°]时,位置检测模块向移动终端的摄像头驱动软件发送激活信号。
4.根据权利要求1所述的操作方法,其特征在于,所述拍摄固定架包括底部放置架(1)和可伸缩的立柱(2);所述底部放置架(1)包括第一压条以及与所述第一压条水平垂直的两根第二压条,两根所述第二压条的一端分别与所述第一压条的两端连接;所述立柱(2)垂直设置,所述立柱(2)的底端与所述第一压条的中间位置连接,所述立柱(2)的顶端设置有移动终端放置架(3)。
5.根据权利要求1所述的操作方法,其特征在于,步骤S3具体包括:
(1)客户端的对比度检测单元将纸件文件(4)的照片处理成待降噪图像,具体包括:首先将照片分成若干大小为6像素*6像素的待处理块D,按照下列公式计算每一个待处理块D的图像对比度con:
其中,maxD表示D中像素值的最大值,minD表示D中像素值的最小值;
然后按照下列公式统计每一个待处理块D的对比度符合系统预设要求的比例pcon:
其中conmin为符合系统预设要求的对比度的最小值,size()为满足要求的数量,如果pcon≤pconmin,则忽略该待处理块D;剩余所有未忽略的待处理块D组成待降噪图像;
(2)客户端的图像纹理检测单元确定该待降噪图像的待降噪像素点的图像纹理程度值,具体包括:
以待降噪图像中的任一待降噪像素点为中心,统计该待降噪像素点周围预设区域内的其它待降噪像素点与该待降噪像素点的亮度差值,获得最大亮度差值和最小亮度差值,并根据最大亮度差值与该降噪像素点的噪点阈值半径=3.2确定该待降噪像素点的LBP图像纹理程度值;
(3)客户端的图像相似性检测单元根据图像纹理程度值设定待降噪像素点的相似性检测下限阈值和上限阈值;
(4)客户端的权重计算单元根据预设区域内各个像素点与待降噪像素点的像素值的差值、待降噪像素点的相似性检测的下限阈值以及上限阈值,按照下列公式计算系统预设区域内各个像素点的权重值W(i,j);
其中,Diff(i,j)为预设区域内其他像素点j与待降噪像素点i的像素值的差值;THlow为待降噪像素点的相似性检测的下限阈值;THhign为待降噪像素点的相似性检测的上限阈值;
(5)客户端的降噪处理单元对待降噪像素点i进行多次循环降噪,每一次降噪处理均利用前一次的降噪结果,直至照片除噪处理成符合系统预设要求的低噪图片。
6.根据权利要求1所述的操作方法,其特征在于,步骤S4具体包括:
(1)在低噪图片中选择任一像素作为当前像素,以当前像素周围的像素作为该当前像素的邻域像素;在当前像素周围选择一最大扫描识别框,最大扫描识别框应包含低噪图片中所有待扫描识别的文字;
(2)计算最大扫描识别框中每一像素的降噪处理前比较框与降噪处理后比较框中相对位置像素的灰度值的差值的绝对值总和;当该差值的绝对值总和大于预先设定的门槛值时,判定该像素为边缘像素,通过最小门槛值所求出的边缘像素为最低边缘像素,以具有最低边缘像素的部分作为次搜寻框,次搜寻框的尺寸为低噪图片中单个文字的尺寸;将次搜寻框作为当前搜寻框,并根据当前搜寻框中边缘像素所占比例决定一灰度强度参数,并在当前搜寻框中每一像素周围决定一比较框,求出当前搜寻框中每一邻域像素与当前像素的相似度;
(3)按照(2)所求出的相似度,将图像上的像素点的灰度值设置为0和255CCD,经高斯累计光斑中心定位的方法,平均二值化处理后的图像将呈现出明显的黑白效果;
(4)将次搜寻框框选的图片上的文本区域作为当前图片形式读取;对次搜寻框框选文本区域中的各个图元文字分别进行选取;将次搜寻框框选文本区域中的第一个图元文字与字模库模块储存的各种常规字体的字模库中的各个字模文字作对比,找到相似度最高的字模文字;将记录该相似度最高的字模文字的字模库定义为标准字模库;将次搜寻框框选文本区域中第一个图元文字后面的各图元文字只与标准字模库中的各字模文字作比较,在标准字模库中分别依次找到相似度最高的字模文字,并以可编辑文字的形式输出,自动保存成文档文件。
7.根据权利要求1所述的操作方法,其特征在于,步骤S5具体包括:首先本地提取单元提取文档文件中的文字,将提取的文字作为待翻译内容,并将待翻译内容发送给在线翻译单元;然后通过翻译选择单元选择翻译语言和翻译网站,翻译选择单元将选择结果发送给在线翻译单元;在线翻译单元接收到本地提取单元发送的待翻译内容以及翻译选择单元发送的选择结果后,根据翻译网站的选择结果将待翻译内容和翻译语言通过无线网络或有线网络发送到选择的在线翻译网站,接收从在线翻译网站反馈的翻译结果并发送给校正单元;校正单元对翻译结果中的语句错误进行校正后即可获得翻译文件。
8.一种基于移动终端的文字扫描识别在线翻译的操作系统,其特征在于,所述系统包括拍摄固定架以及安装在移动终端上的客户端,所述客户端包括:
位置检测模块:用于检测移动终端是否处于拍摄的预定放置位置;
预拍摄检测模块:用于检测待拍摄图片与移动终端拍摄界面的相对大小,并根据检测结果发送调整移动终端高度的信息;当移动终端到达合适高度时,向移动终端的摄像头发送拍摄指令;
除燥模块:用于对照片进行除噪处理,获得低噪图片;
扫描识别模块:用于扫描识别低噪图片上的文字,保存成文档文件;
翻译模块:用于提取文档文件中的文字,选择需要翻译成的语言应用翻译软件进行在线翻译;翻译结束后矫正语句错误,获得翻译文件。
9.根据权利要求8所述的操作系统,其特征在于,所述拍摄固定架包括底部放置架(1)和可伸缩的立柱(2);所述底部放置架(1)包括第一压条以及与所述第一压条水平垂直的两根第二压条,两根所述第二压条的一端分别与所述第一压条的两端连接;所述立柱(2)垂直设置,所述立柱(2)的底端与所述第一压条的中间位置连接,所述立柱(2)的顶端设置有移动终端放置架(3)。
10.根据权利要求8所述的操作系统,其特征在于,所述除燥模块包括对比度检测单元、图像纹理检测单元、图像相似性检测单元、权重计算单元和降噪处理单元,其中:
对比度检测单元:用于将纸件文件(4)的照片处理成待降噪图像,具体包括:首先将照片分成若干大小为6像素*6像素的待处理块D,按照下列公式计算每一个待处理块D的图像对比度con:
其中,maxD表示D中像素值的最大值,minD表示D中像素值的最小值;
然后按照下列公式统计每一个待处理块D的对比度符合系统预设要求的比例pcon:
其中conmin为符合系统预设要求的对比度的最小值,size()为满足要求的数量,如果pcon≤pconmin,则忽略该待处理块D;剩余所有未忽略的待处理块D组成待降噪图像;
图像纹理检测单元:用于确定该待降噪图像的待降噪像素点的图像纹理程度值,具体包括:以待降噪图像中的任一待降噪像素点为中心,统计该待降噪像素点周围预设区域内的其它待降噪像素点与该待降噪像素点的亮度差值,获得最大亮度差值和最小亮度差值,并根据最大亮度差值与该降噪像素点的噪点阈值半径=3.2确定该待降噪像素点的LBP图像纹理程度值;
图像相似性检测单元:用于根据图像纹理程度值设定待降噪像素点的相似性检测下限阈值和上限阈值;
权重计算单元:用于根据预设区域内各个像素点与待降噪像素点的像素值的差值、待降噪像素点的相似性检测的下限阈值以及上限阈值计算系统预设区域内各个像素点的权重值;
各个像素点的权重值W(i,j)按照下列公式计算:
其中,Diff(i,j)为预设区域内其他像素点j与待降噪像素点i的像素值的差值;THlow为待降噪像素点的相似性检测的下限阈值;THhign为待降噪像素点的相似性检测的上限阈值;
降噪处理单元:用于对待降噪像素点i进行多次循环降噪,每一次降噪处理均利用前一次的降噪结果,直至照片除噪处理成符合系统预设要求的低噪图片。
CN201810360893.9A 2018-04-20 2018-04-20 基于移动终端的文字扫描识别在线翻译的操作方法及系统 Pending CN108628858A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810360893.9A CN108628858A (zh) 2018-04-20 2018-04-20 基于移动终端的文字扫描识别在线翻译的操作方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810360893.9A CN108628858A (zh) 2018-04-20 2018-04-20 基于移动终端的文字扫描识别在线翻译的操作方法及系统

Publications (1)

Publication Number Publication Date
CN108628858A true CN108628858A (zh) 2018-10-09

Family

ID=63694161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810360893.9A Pending CN108628858A (zh) 2018-04-20 2018-04-20 基于移动终端的文字扫描识别在线翻译的操作方法及系统

Country Status (1)

Country Link
CN (1) CN108628858A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109617946A (zh) * 2018-11-06 2019-04-12 国电电力发展股份有限公司 将图像中自定义文字识别结果数据自动上传的方法及拍照设备
CN110377917A (zh) * 2019-07-08 2019-10-25 天津大学 一种图书馆的翻译阅读桌及其共享翻译方法
CN110717397A (zh) * 2019-09-11 2020-01-21 中国海洋大学 一种基于手机相机的在线翻译系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2745280Y (zh) * 2004-11-27 2005-12-07 夏新电子股份有限公司 可做文字翻译的摄像手机
CN101562694A (zh) * 2009-05-26 2009-10-21 天津三星光电子有限公司 实现数码相机文字提取和自动翻译功能的方法
CN101667251A (zh) * 2008-09-05 2010-03-10 三星电子株式会社 具备辅助定位功能的ocr识别方法和装置
CN101873415A (zh) * 2009-04-22 2010-10-27 北京麦哲科技有限公司 具有翻译功能的摄像头装置及方法
CN102289668A (zh) * 2011-09-07 2011-12-21 谭洪舟 基于像素邻域特征的自适应文字图像的二值化处理方法
CN103927726A (zh) * 2014-04-23 2014-07-16 浙江宇视科技有限公司 图像降噪装置
CN104575120A (zh) * 2015-01-09 2015-04-29 代四广 一种用于辅助教学的展示系统
CN104881405A (zh) * 2015-05-22 2015-09-02 东莞中山大学研究院 一种基于智能手机实现拍照翻译的方法及智能手机
CN105654072A (zh) * 2016-03-24 2016-06-08 哈尔滨工业大学 一种低分辨率医疗票据图像的文字自动提取和识别系统与方法
CN106096610A (zh) * 2016-06-13 2016-11-09 湖北工业大学 一种基于支持向量机的文档图像二值化方法
CN106202069A (zh) * 2016-07-28 2016-12-07 新乡学院 一种便捷式英语翻译装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2745280Y (zh) * 2004-11-27 2005-12-07 夏新电子股份有限公司 可做文字翻译的摄像手机
CN101667251A (zh) * 2008-09-05 2010-03-10 三星电子株式会社 具备辅助定位功能的ocr识别方法和装置
CN101873415A (zh) * 2009-04-22 2010-10-27 北京麦哲科技有限公司 具有翻译功能的摄像头装置及方法
CN101562694A (zh) * 2009-05-26 2009-10-21 天津三星光电子有限公司 实现数码相机文字提取和自动翻译功能的方法
CN102289668A (zh) * 2011-09-07 2011-12-21 谭洪舟 基于像素邻域特征的自适应文字图像的二值化处理方法
CN103927726A (zh) * 2014-04-23 2014-07-16 浙江宇视科技有限公司 图像降噪装置
CN104575120A (zh) * 2015-01-09 2015-04-29 代四广 一种用于辅助教学的展示系统
CN104881405A (zh) * 2015-05-22 2015-09-02 东莞中山大学研究院 一种基于智能手机实现拍照翻译的方法及智能手机
CN105654072A (zh) * 2016-03-24 2016-06-08 哈尔滨工业大学 一种低分辨率医疗票据图像的文字自动提取和识别系统与方法
CN106096610A (zh) * 2016-06-13 2016-11-09 湖北工业大学 一种基于支持向量机的文档图像二值化方法
CN106202069A (zh) * 2016-07-28 2016-12-07 新乡学院 一种便捷式英语翻译装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109617946A (zh) * 2018-11-06 2019-04-12 国电电力发展股份有限公司 将图像中自定义文字识别结果数据自动上传的方法及拍照设备
CN110377917A (zh) * 2019-07-08 2019-10-25 天津大学 一种图书馆的翻译阅读桌及其共享翻译方法
CN110717397A (zh) * 2019-09-11 2020-01-21 中国海洋大学 一种基于手机相机的在线翻译系统

Similar Documents

Publication Publication Date Title
US10108860B2 (en) Systems and methods for generating composite images of long documents using mobile video data
US7835589B2 (en) Photographic document imaging system
CN111127339B (zh) 一种文档图像的梯形畸变矫正方法及装置
US8170368B2 (en) Correcting device and method for perspective transformed document images
US8045795B2 (en) Image processing apparatus, image processing method, computer program, and storage medium
US7729536B2 (en) Boundary extracting method, program, and device using the same
CN108628858A (zh) 基于移动终端的文字扫描识别在线翻译的操作方法及系统
US8446494B2 (en) Automatic redeye detection based on redeye and facial metric values
US8218890B2 (en) Method and apparatus for cropping images
MX2008011002A (es) Metodo de ajuste de distorsion y aparato basado en el modelo.
US20110228124A1 (en) Character recognition preprocessing method and apparatus
WO2009114967A1 (zh) 基于移动扫描的图像处理方法及装置
CN103577818A (zh) 一种图像文字识别的方法和装置
US9852349B2 (en) Scanning system, terminal device and scanning method
US20160337545A1 (en) System and method for low light document capture and binarization with multiple flash images
US7003159B2 (en) Document frame recognition system and method
CN111985465A (zh) 文本识别方法、装置、设备及存储介质
CN105516590B (zh) 一种图片处理方法及装置
Du et al. Snap and translate using windows phone
CN102682457A (zh) 一种对平面媒体图像进行适应屏幕阅读的重排方法
US9113002B2 (en) Method and system for automatically capturing an object using a mobile terminal
CN115100657A (zh) 电气cad图纸扫描图的字符与带宽度的线条识别方法
Hsueh Interactive text recognition and translation on a mobile device
CN109635798B (zh) 一种信息提取方法及装置
AU2020273367A1 (en) Photographic document imaging system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181009

RJ01 Rejection of invention patent application after publication