WO2014180387A1 - 一种信息输入方法及装置 - Google Patents

一种信息输入方法及装置 Download PDF

Info

Publication number
WO2014180387A1
WO2014180387A1 PCT/CN2014/078179 CN2014078179W WO2014180387A1 WO 2014180387 A1 WO2014180387 A1 WO 2014180387A1 CN 2014078179 W CN2014078179 W CN 2014078179W WO 2014180387 A1 WO2014180387 A1 WO 2014180387A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
text
character
image area
cut
Prior art date
Application number
PCT/CN2014/078179
Other languages
English (en)
French (fr)
Inventor
陈飞雄
郭庆吉
Original Assignee
中兴通讯股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中兴通讯股份有限公司 filed Critical 中兴通讯股份有限公司
Publication of WO2014180387A1 publication Critical patent/WO2014180387A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Abstract

本发明公开了一种信息输入方法及装置,其中,该方法包括:通过图像获取模块获取图像;对获取的图像中的字符进行切割处理;对各个切割字符进行文字识别,以识别出各个切割字符对应的文字;将识别的各个文字按对应的切割字符在所述图像的字符版面中的位置,进行文字排版;将排版后的文字按文字排版格式输出到文本输入框。采用本发明提供的方案,可方便的实现信息输入,省时省力,提高信息输入效率。

Description

一种信息输入方法及装置 技术领域 本发明涉及到智能输入技术领域, 特别涉及到一种信息输入方法及装置。 背景技术 移动终端 (如手机) 具有大容量存储空间及强大的处理能力, 人们可通过该移动 终端打电话、 发送短信、 收发邮件、 上网浏览等, 当人们需要输入文字信息时, 一般 都是通过拼音输入法、 五笔输入法、 手写输入法等类型。 当我们需要将大量纸质文档 中的文字录入到移动终端时, 如果通过上述几种输入法进行录入, 费时又费力。 发明内容 本发明提供了一种信息输入方法及装置, 其能够解决现有技术中在移动终端录入 信息的费时费力的缺陷, 实现信息的快速输入。 本发明提供一种信息输入方法, 该方法包括: 通过图像获取模块获取图像; 对获取的图像中的字符进行切割处理; 对各个切割字符进行文字识别, 以识别出各个切割字符对应的文字; 将识别的各个文字按对应的切割字符在所述图像的字符版面中的位置, 进行文字 排版; 将排版后的文字按文字排版格式输出到文本输入框。 优选地, 对获取的图像中的字符进行切割处理包括: 对获取的图像中的所有字符进行切割处理; 或者 提供选择操作界面, 供用户在获取的图像中选择待识别的图像区域, 锁定用户基 于所述操作界面选择的图像区域, 并对选择的图像区域中的字符进行切割处理。 优选地, 对获取的图像中的字符进行切割处理包括: 对获取的图像进行二值化、 倾斜校正、 分段落分行及字符切割。 优选地, 锁定用户基于所述操作界面选择的图像区域包括:
A、 获取用户在所述操作界面的第一选择手势, 所述第一选择手势为一条带有预 设宽度的直线, 根据该第一选择手势将该带有预设宽度的直线覆盖的图像区域锁定为 待识别的图像区域; 和 /或
B、 获取用户在所述操作界面的第二选择手势, 所述第二选择手势为两条连续的 直线, 根据该第二选择手势中的两条连续的直线锁定一个平行四边形区域作为待识别 的图像区域。 优选地, 将识别的各个文字按对应的切割字符在所述图像的字符版面中的位置, 进行文字排版之后, 该方法还包括: 将排版后的文字按文字排版格式传送给终端。 本发明还提供一种信息输入装置, 该装置包括: 图像获取模块, 设置为获取图像; 切割处理模块, 设置为对获取的图像中的字符进行切割处理; OCR识别模块, 设置为对各个切割字符进行文字识别, 以识别出各个切割字符对 应的文字; 排版模块, 设置为将识别的各个文字按对应的切割字符在所述图像的字符版面中 的位置, 进行文字排版; 输入模块, 设置为将排版后的文字按文字排版格式输出到文本输入框。 优选地, 所述切割处理模块包括第一子切割处理单元或者第二子切割处理单元; 所述第一子切割处理单元, 设置为对获取的图像中的所有字符进行切割处理; 所述第二子切割处理单元, 设置为提供选择操作界面, 供用户在获取的图像中选 择待识别的图像区域, 锁定用户基于所述操作界面选择的图像区域, 并对选择的图像 区域中的字符进行切割处理。 优选地, 所述切割处理模块还设置为对获取的图像进行二值化、 倾斜校正、 分段 落分行及字符切割。 优选地, 所述第二子切割处理单元包括: 提供单元, 设置为提供选择操作界面, 供用户在获取的图像中选择待识别的图像 区域; 锁定单元, 设置为获取用户在所述操作界面的第一选择手势, 所述第一选择手势 为一条带有预设宽度的直线, 根据该第一选择手势将该带有预设宽度的直线覆盖的图 像区域锁定为待识别的图像区域; 和 /或设置为获取用户在所述操作界面的第二选择手 势, 所述第二选择手势为两条连续的直线, 根据该第二选择手势中的两条连续的直线 锁定一个平行四边形区域作为待识别的图像区域; 处理单元, 设置为对锁定单元锁定的待识别的图像区域进行切割处理。 优选地, 所述装置还包括与所述排版模块连接的输出模块, 所述输出模块设置为 将排版后的文字按文字排版格式传送给终端。 采用本发明实施例, 可通过图像获取模块获取图像; 对获取的图像中的字符进行 切割处理; 对各个切割字符进行文字识别, 以识别出各个切割字符对应的文字; 将识 别的各个文字按对应的切割字符在所述图像的字符版面中的位置, 进行文字排版; 将 排版后的文字按文字排版格式输出到文本输入框。 本发明提供的方案可方便的实现信 息输入, 省时省力, 提高信息输入效率。 附图说明 图 1为本发明的信息输入方法的第一实施例流程示意图; 图 2为本发明的 息输入方法的第一实施例中的待识别区域的一示意图; 图 3为本发明的 息输入方法的第一实施例中的待识别区域的又一示意图; 图 4为本发明的 息输入方法的第二实施例流程示意图;
'、 _- 图 5为本发明的 息输入装置的第一实施例结构框图; 图 6为本发明的信息输入装置的第二实施例结构框图。 本发明目的的实现、 功能特点及优点将结合实施例, 参照附图做进一步说明( 具体实施方式 应当理解,此处所描述的具体实施例仅仅用以解释本发明, 并不用于限定本发明。 参照图 1, 图 1为本发明的信息输入方法的第一实施例流程示意图, 该方法包括:
S10、 通过图像获取模块获取图像。 该图像获取模块可以是摄像头, 该摄像头可以是数字摄像头和 /或模拟摄像头。 当 用户需要将外部的非计算机可识别信息变成计算机可识别信息时 (如将纸质文档中的 文字转换成计算机可识别信息), 通过图像获取模块获取非计算机可识别信息的图像, 如通过摄像头拍摄需要输入信息所在纸的图像。 在用户通过该图像获取模块获取图像 时, 可能由于手抖动或被拍摄物体抖动, 导致拍摄的图像很模糊, 达不到在后面步骤 的文字识别要求, 因此, 在一个优选的实施方式中, 还可对获取的图像进行图像清晰 度判断, 当判断结果为图像的清晰度没达到预设阀值时, 则提醒用户重新通过图像获 取模块获取图像。 作为一种具体实施方式, 在对获取的图形信息进行图像清晰度判断 时, 可利用图像的平均边缘强度作为检测值, 当平均边缘强度小于预设边缘强度阀值 时, 则认为拍摄的图像模糊, 当平均边缘强度大于或等于预设边缘强度阀值时, 则认 为拍摄的图像清楚。 该平均边缘强度是指由边缘算法 (如 Sobel算法等) 获得。 S20、 对获取的图像中的字符进行切割处理。 在该步骤 S20中, 对获取的图像中的字符进行切割处理, 在具体实施过程中, 可 先对获取的图像进行前景色噪声过滤及背景色噪声过滤, 然后对噪声过滤后的图像进 行二值化、 倾斜校正、 分段落分行、 字符切割。 根据应用场景及系统设定的不同, 以 上二值化、 倾斜校正、 分段落分行、 字符切割等过程可以采用不同的方式实现, 例如, 在一个优选实施方式中, 二值化可以是将图像上的像素点的灰度值设置为 0或 255, 也就是将整个图像呈现出明显的只有黑和白的视觉效果; 倾斜校正, 可以是对图像中 的倾斜内容进行校正 (在通过图像获取模块获取图像时, 当被拍摄物倾斜放置时, 将 使得获得的内容倾斜), 可预先设置一个水平基准线, 再判断该图像边缘(可通过图像 边缘检测检测出图像边缘, 如通过以下步骤检测图像边缘: 1、 滤波: 边缘检测主要基 于导数计算, 但受噪声影响, 但滤波器在降低噪声的同时也导致边缘强度的损失; 2、 增强: 增强算法将领域中灰度有显著变化的点突出显示。一般通过计算梯度幅值完成; 3、 检测: 但在有些图像中梯度幅值较大的并不是边缘点; 4、 定位: 精确确定边缘的 位置。)与该水平基准线的夹角值, 当该夹角值大于预设的倾斜角度值时, 认为该图像 倾斜, 则对该图像进行倾斜校正, 以使得该图像边缘与水平基准线的夹角值小于或等 于预设的倾斜角度值, 当该夹角值小于或等于预设的倾斜角度值时, 认为该图像不倾 斜, 不需要进行倾斜校正; 分段落分行, 对图像中的文档图片先进行分段落再分行即 进行版面分析。
S30、 对各个切割字符进行文字识别, 以识别出各个切割字符对应的文字。 在该步骤 S30中, 对各个切割字符进行文字识别, 以识别出各个切割字符对应的 文字, 具体的, 可通过预设的字符库与算法对各个切割字符进行识别, 以识别出各个 切割字符对应的文字。 在该步骤中, 可采用微软公司提供的 OCR引擎进行文字识别, 它是一个公开的编程接口。
S40、将识别的各个文字按对应的切割字符在该图像的字符版面中的位置,进行文 字排版。 在该步骤 S40中, 将识别出的各个字符进行版面恢复, 即将识别出的各个文字按 照对应的切割字符所在图像的字符版面中的位置进行排列, 段落不变、 位置不变、 顺 序不变。
S50、 将排版后的文字按文字排版格式输出到文本输入框。 在该步骤 S50中, 将排版后的文字按文字排版格式输出到文本输入框, 具体的, 可先将排版后的文字按文字排版格式放置在剪切板上, 以供虚拟键盘使用; 再通过虚 拟键盘将剪切板上的文字识别结果输入到鼠标焦点所在的文本输入框中。 进一步的, 以上步骤 S20可以包括:
S21、对获取的图像中的所有字符进行切割处理; 或者, 提供选择操作界面, 供用 户在获取的图像中选择待识别的图像区域,锁定用户基于该操作界面选择的图像区域, 并对选择的图像区域中的字符进行切割处理。 在该步骤 S21中, 可对获取图像中的所有字符进行切割处理, 而不需要用户选择 待识别的区域,在需要对图像获取模块获取的图像进行整体识别时,可采用该种方式, 方便快捷, 提高识别效率。 在该步骤 S21中, 还可为用户提供选择操作界面, 供用户 在获取的图像中选择待识别的图像区域, 锁定用户基于该操作界面选择的图像区域, 并对选择的图像区域中的字符进行切割处理; 具体的, 用户可在该选择操作界面进行 触摸操作, 在该步骤 S21 中, 根据用户的触摸操作锁定待识别的图像区域, 如: A、 获取用户在该操作界面的第一选择手势,该第一选择手势为一条带有预设宽度的直线, 根据该第一选择手势将该带有预设宽度的直线覆盖的图像区域锁定为待识别的图像区 域, 和 /或, B、 获取用户在该操作界面的第二选择手势, 该第二选择手势为两条连续 的直线, 根据该第二选择手势中的两条连续的直线锁定一个平行四边形区域作为待识 别的图像区域。 该第一选择手势为一条带有预设宽度的直线, 则在该步骤 S21中, 根据该第一选 择手势将该带有预设宽度的直线覆盖的图像区域锁定为待识别的图像区域。 该预设宽 度可根据实际需要设置, 如可设置为 5mm、 7mm等, 如果在步骤 S10中获取的图像 中的文字比较大, 则可适当将预设宽度设置大一点。该第一选择手势可沿着各个方向, 如, 当步骤 S10中获得的图像中的文字方向是水平的, 则该第一选择手势可以沿着水 平方向, 当步骤 S10中获得的图像中的文字方向是垂直的, 则该第一选择手势可以沿 着垂直方向, 当步骤 S10中获得的图像中的文字方向是斜向的, 则该第一选择手势相 应的沿着文字倾斜的方向。 该第二选择手势为两条连续的直线, 则在该步骤 S21中, 根据该第二选择手势中 的两条连续的直线锁定一个平行四边形区域作为待识别的图像区域。 优选地, 可以将 用户的第二选择手势中的两条连续的直线中的第一条直线 al 作为平行四边形的对角 线, 第二条直线 a2作为平行四边形的其中一条边, 然后锁定出一个平行四边形区域作 为待识别的图像区域(如图 2所示)。优选地, 可以将用户的第二选择手势中的两条连 续的直线中的第一条直线 al作为平行四边形的边, 第二条直线 a2也作为平行四边行 的边, 然后锁定出一个平行四边形区域作为待识别的图像区域 (如图 3所示)。 参照图 4, 图 4为本发明的信息输入方法的第二实施例流程示意图。 基于上述的信息输入方法的第一实施例, 在步骤 S40之后, 该方法还可以包括: S60、 将排版后的文字按文字排版格式传送给终端。 该终端可以为 PC机、 手机、 Ipad等, 在该步骤中, 可通过 USB连接线将排版后 的文字按文字排版格式传送给终端, 也可以通过通信模块将排版后的文字按文字排版 格式传送给终端, 该通信模块可以是 wifi单元、 蓝牙单元等。 该终端接收按文字排版 格式排版后的文字, 并将排版后的文字按文字排版格式输入到鼠标焦点所在的文本输 入框中, 具体的, 该终端将接收的排版后的文字放置在剪切板上, 以供虚拟键盘使用, 该虚拟键盘将剪切板上的排版后的文字输入到鼠标焦点所在的文本输入框中。 参考图 5, 图 5为本发明的信息输入装置的第一实施例结构示意图, 该信息输入 装置可以是手机, 该信息输入装置包括: 图像获取模块 10, 与该图像获取模块连接的 切割处理模块 20,与该切割处理模块 20连接的 OCR识别模块 30,与该 OCR (Optical Character Recognition, 光学字符识别) 识别模块 30连接的排版模块 40, 与该排版模 块连接的输入模块 50, 其中: 图像获取模块 10, 设置为获取图像; 切割处理模块 20, 设置为对获取的图像中的字符进行切割处理; OCR识别模块 30,设置为对各个切割字符进行文字识别, 以识别出各个切割字符 对应的文字; 排版模块 40, 设置为将识别的各个文字按对应的切割字符在该图像的字符版面中 的位置, 进行文字排版; 输入模块 50, 设置为将排版后的文字按文字排版格式输出到文本输入框。 该图像获取模块 10可以是摄像头, 该摄像头可以是数字摄像头和 /或模拟摄像头。 当用户需要将外部的非计算机可识别信息变成计算机可识别信息时 (如将纸质文档中 的文字转换成计算机可识别信息), 通过图像获取模块 10获取非计算机可识别信息的 图像, 如通过摄像头拍摄需要输入信息所在纸的图像。 在用户通过该图像获取模块 10 获取图像时, 可能由于手抖动或被拍摄物体抖动, 导致拍摄的图像很模糊, 达不到在 后面步骤的文字识别要求, 因此, 在一个优选的实施方式中, 还可先对获取的图像进 行图像清晰度判断, 当判断结果为图像的清晰度没达到预设阀值时, 则提醒用户重新 通过图像获取模块获取图像。 作为一种具体实施方式, 在对获取的图形信息进行图像 清晰度判断时, 可利用图像的平均边缘强度作为检测值, 当平均边缘强度小于预设边 缘强度阀值时, 则认为拍摄的图像模糊, 当平均边缘强度大于或等于预设边缘强度阀 值时, 则认为拍摄的图像清楚。 该平均边缘强度是指由边缘算法 (如 Sobel算法等) 获得。 切割处理模块 20对获取的图像中的字符进行切割处理,在具体实施过程中,可先 对获取的图像进行前景色噪声过滤及背景色噪声过滤, 然后对噪声过滤后的图像进行 二值化、 倾斜校正、 分段落分行、 字符切割。 根据应用场景及系统设定的不同, 以上 二值化、 倾斜校正、 分段落分行、 字符切割等过程可以采用不同的方式实现, 例如, 在一个优选实施方式中, 二值化可以是将图像上的像素点的灰度值设置为 0或 255, 也就是将整个图像呈现出明显的只有黑和白的视觉效果; 倾斜校正, 可以是对图像中 的倾斜内容进行校正 (在通过图像获取模块获取图像时, 当被拍摄物倾斜放置时, 将 使得获得的内容倾斜), 可预先设置一个水平基准线, 再判断该图像边缘(可通过图像 边缘检测检测出图像边缘, 如通过以下步骤检测图像边缘: 1、 滤波: 边缘检测主要基 于导数计算, 但受噪声影响, 但滤波器在降低噪声的同时也导致边缘强度的损失; 2、 增强: 增强算法将领域中灰度有显著变化的点突出显示。一般通过计算梯度幅值完成; 3、 检测: 但在有些图像中梯度幅值较大的并不是边缘点; 4、 定位: 精确确定边缘的 位置。)与该水平基准线的夹角值, 当该夹角值大于预设的倾斜角度值时, 认为该图像 倾斜, 则对该图像进行倾斜校正, 以使得该图像边缘与水平基准线的夹角值小于或等 于预设的倾斜角度值, 当该夹角值小于或等于预设的倾斜角度值时, 认为该图像不倾 斜, 不需要进行倾斜校正; 分段落分行, 对图像中的文档图片先进行分段落再分行即 进行版面分析。 该 OCR识别模块 30对各个切割字符进行文字识别, 以识别出各个切割字符对应 的文字, 具体的, 可通过预设的字符库与算法对各个切割字符进行识别, 以识别出各 个切割字符对应的文字。 该 OCR识别模块可采用微软公司提供的 OCR引擎, 它是一 个公开的编程接口。 排版模块 40将识别出的各个字符进行版面恢复,即将识别出的各个文字按照对应 的切割字符所在图像的字符版面中的位置进行排列, 段落不变、位置不变、顺序不变。 输入模块 50将排版后的文字按文字排版格式输出到文本输入框, 具体的,可先将 排版后的文字按文字排版格式放置在剪切板上, 以供虚拟键盘使用; 再通过虚拟键盘 将剪切板上的文字识别结果输入到鼠标焦点所在的文本输入框中。 进一步的, 该切割处理模块 20包括第一子切割处理单元 21或者第二子切割处理 单元 22; 该第一子切割处理单元 21, 设置为对获取的图像中的所有字符进行切割处理; 该第二子切割处理单元 22, 设置为提供选择操作界面, 供用户在获取的图像中选 择待识别的图像区域, 锁定用户基于该操作界面选择的图像区域, 并对选择的图像区 域中的字符进行切割处理。 该切割处理模块 20也可同时包括第一子切割处理单元 21和第二子切割处理单元 22。 该第一子切割处理单元 21可对获取图像中的所有字符进行切割处理,而不需要用 户选择待识别的区域, 在需要对图像获取模块获取的图像进行整体识别时, 可采用该 种方式, 方便快捷, 提高识别效率。 该第二子切割处理单元 22为用户提供选择操作界面,供用户在获取的图像中选择 待识别的图像区域, 锁定用户基于该操作界面选择的图像区域, 并对选择的图像区域 中的字符进行切割处理。 用户可在该选择操作界面通过鼠标选取或通过触摸选取待识 别的图像区域。 进一步的, 该第二子切割处理单元 22包括: 提供单元, 设置为提供选择操作界面, 供用户在获取的图像中选择待识别的图像 区域; 锁定单元, 设置为获取用户在该操作界面的第一选择手势, 该第一选择手势为一 条带有预设宽度的直线, 根据该第一选择手势将该带有预设宽度的直线覆盖的图像区 域锁定为待识别的图像区域; 和 /或设置为获取用户在该操作界面的第二选择手势, 该 第二选择手势为两条连续的直线, 根据该第二选择手势中的两条连续的直线锁定一个 平行四边形区域作为待识别的图像区域; 处理单元, 设置为对锁定单元锁定的待识别的图像区域进行切割处理。 该提供单元为用户提供选择操作界面, 用户在该选择操作界面进行触摸操作。 该锁定单元获取用户在该选择操作界面的触摸操作, 并根据用户的触摸操作锁定 待识别的图像区域, 如: A、 获取用户在该操作界面的第一选择手势, 该第一选择手 势为一条带有预设宽度的直线, 根据该第一选择手势将该带有预设宽度的直线覆盖的 图像区域锁定为待识别的图像区域, 和 /或, B、 获取用户在该操作界面的第二选择手 势, 该第二选择手势为两条连续的直线, 根据该第二选择手势中的两条连续的直线锁 定一个平行四边形区域作为待识别的图像区域。 该第一选择手势为一条带有预设宽度的直线, 则该第二子切割处理单元 22, 根据 该第一选择手势将该带有预设宽度的直线覆盖的图像区域锁定为待识别的图像区域。 该预设宽度可根据实际需要设置, 如可设置为 5mm、 7mm等, 如果图像获取模块 10 获取的图像中的文字比较大, 则可适当将预设宽度设置大一点。 该第一选择手势可沿 着各个方向, 如, 当图像获取模块 10获得的图像中的文字方向是水平的, 则该第一选 择手势可以沿着水平方向, 当图像获取模块 10获得的图像中的文字方向是垂直的,则 该第一选择手势可以沿着垂直方向,当图像获取模块 10获得的图像中的文字方向是斜 向的, 则该第一择手势相应的沿着文字倾斜的方向。 该第二选择手势为两条连续的直线,则第二子切割处理单元 22根据该第二选择手 势中的两条连续的直线锁定一个平行四边形区域作为待识别的图像区域。 优选地, 可 以将用户的第二选择手势中的两条连续的直线中的第一条直线 al 作为平行四边形的 对角线, 第二条直线 a2作为平行四边形的其中一条边, 然后锁定出一个平行四边形区 域作为待识别的图像区域(如图 2所示)。优选地, 可以将用户的第二选择手势中的两 条连续的直线中的第一条直线 al作为平行四边形的边, 第二条直线 a2也作为平行四 边行的边, 然后锁定出一个平行四边形区域作为待识别的图像区域 (如图 3所示)。
参考图 6, 图 6为本发明的信息输入装置的第二实施例结构示意图。 基于上述的信息输入装置的第一实施例, 该装置还包括与所述排版模块连接的输 出模块 60, 设置为将排版后的文字按文字排版格式传送给终端。 该终端可以为 PC机、 手机、 Ipad等, 该输出模块可以为 USB接口, 通过该 USB 接口和 USB连接线将排版后的文字按文字排版格式传送给终端;该输出模块也可以为 通讯模块, 通过该通讯模块将排版后的文字按文字排版格式传送给终端, 该通信模块 可以是 wifi单元、 蓝牙单元等。 该终端接收按文字排版格式排版后的文字, 并将排版 后的文字按文字排版格式输入到鼠标焦点所在的文本输入框中, 具体的, 该终端将接 收的排版后的文字放置在剪切板上, 以供虚拟键盘使用, 该虚拟键盘将剪切板上的排 版后的文字输入到鼠标焦点所在的文本输入框中。 以上所述仅为本发明的优选实施例, 并非因此限制本发明的专利范围, 凡是利用 本发明说明书及附图内容所作的等效结构或等效流程变换, 或直接或间接运用在其他 相关的技术领域, 均同理包括在本发明的专利保护范围。

Claims

权 利 要 求 书 、 一种信息输入方法, 包括:
通过图像获取模块获取图像;
对获取的图像中的字符进行切割处理;
对各个切割字符进行文字识别, 以识别出各个切割字符对应的文字; 将识别的各个文字按对应的切割字符在所述图像的字符版面中的位置, 进 行文字排版;
将排版后的文字按文字排版格式输出到文本输入框。 、 根据权利要求 1所述的方法,其中,对获取的图像中的字符进行切割处理包括:
对获取的图像中的所有字符进行切割处理; 或者
提供选择操作界面, 供用户在获取的图像中选择待识别的图像区域, 锁定 用户基于所述操作界面选择的图像区域, 并对选择的图像区域中的字符进行切 割处理。 、 根据权利要求 1或 2所述的方法, 其中, 对获取的图像中的字符进行切割处理 包括:
对获取的图像进行二值化、 倾斜校正、 分段落分行及字符切割。 、 根据权利要求 2所述的方法, 其中, 锁定用户基于所述操作界面选择的图像区 域包括:
A、 获取用户在所述操作界面的第一选择手势, 所述第一选择手势为一条 带有预设宽度的直线, 根据该第一选择手势将该带有预设宽度的直线覆盖的图 像区域锁定为待识别的图像区域; 和 /或
B、 获取用户在所述操作界面的第二选择手势, 所述第二选择手势为两条 连续的直线, 根据该第二选择手势中的两条连续的直线锁定一个平行四边形区 域作为待识别的图像区域。 、 根据权利要求 1所述的方法, 其中, 将识别的各个文字按对应的切割字符在所 述图像的字符版面中的位置, 进行文字排版之后, 所述方法还包括:
将排版后的文字按文字排版格式传送给终端。 、 一种信息输入装置, 包括:
图像获取模块, 设置为获取图像;
切割处理模块, 设置为对获取的图像中的字符进行切割处理;
OCR识别模块, 设置为对各个切割字符进行文字识别, 以识别出各个切割 字符对应的文字;
排版模块, 设置为将识别的各个文字按对应的切割字符在所述图像的字符 版面中的位置, 进行文字排版;
输入模块, 设置为将排版后的文字按文字排版格式输出到文本输入框。 、 根据权利要求 6所述的装置, 其中, 所述切割处理模块包括第一子切割处理单 元或者第二子切割处理单元;
所述第一子切割处理单元, 设置为对获取的图像中的所有字符进行切割处 理;
所述第二子切割处理单元, 设置为提供选择操作界面, 供用户在获取的图 像中选择待识别的图像区域, 锁定用户基于所述操作界面选择的图像区域, 并 对选择的图像区域中的字符进行切割处理。 、 根据权利要求 6或 7所述的装置, 其中, 所述切割处理模块还设置为对获取的 图像进行二值化、 倾斜校正、 分段落分行及字符切割。 、 根据权利要求 7所述的装置, 其中, 所述第二子切割处理单元包括:
提供单元, 设置为提供选择操作界面, 供用户在获取的图像中选择待识别 的图像区域;
锁定单元, 设置为获取用户在所述操作界面的第一选择手势, 所述第一选 择手势为一条带有预设宽度的直线, 根据该第一选择手势将该带有预设宽度的 直线覆盖的图像区域锁定为待识别的图像区域;和 /或设置为获取用户在所述操 作界面的第二选择手势, 所述第二选择手势为两条连续的直线, 根据该第二选 择手势中的两条连续的直线锁定一个平行四边形区域作为待识别的图像区域; 处理单元, 设置为对锁定单元锁定的待识别的图像区域进行切割处理。 0、 根据权利要求 6所述的装置, 还包括与所述排版模块连接的输出模块, 所述输 出模块设置为将排版后的文字按文字排版格式传送给终端。
PCT/CN2014/078179 2013-12-05 2014-05-22 一种信息输入方法及装置 WO2014180387A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201310654645.2 2013-12-05
CN201310654645.2A CN104699663A (zh) 2013-12-05 2013-12-05 一种信息输入方法及装置

Publications (1)

Publication Number Publication Date
WO2014180387A1 true WO2014180387A1 (zh) 2014-11-13

Family

ID=51866768

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2014/078179 WO2014180387A1 (zh) 2013-12-05 2014-05-22 一种信息输入方法及装置

Country Status (2)

Country Link
CN (1) CN104699663A (zh)
WO (1) WO2014180387A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915668A (zh) * 2015-05-29 2015-09-16 深圳泓数科技有限公司 医学影像中的文字信息识别方法及装置
CN110728129A (zh) * 2019-09-03 2020-01-24 北京字节跳动网络技术有限公司 对图片中的文本内容进行排版的方法、装置、介质和设备
CN112861865A (zh) * 2021-01-29 2021-05-28 国网内蒙古东部电力有限公司 一种基于ocr技术的辅助审计方法

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184838A (zh) * 2015-09-21 2015-12-23 深圳市金立通信设备有限公司 一种图片处理方法及终端
CN105975542A (zh) * 2016-04-29 2016-09-28 乐视控股(北京)有限公司 一种字符串的输入方法及装置
CN109542285A (zh) * 2018-11-16 2019-03-29 北京小米移动软件有限公司 图像处理方法及装置
CN109766778A (zh) * 2018-12-19 2019-05-17 平安科技(深圳)有限公司 基于ocr技术的发票信息录入方法、装置、设备及存储介质
CN111008559B (zh) * 2019-10-31 2023-08-11 浙江数链科技有限公司 一种面单识别结果的排版方法、系统及计算机设备
CN112183307A (zh) * 2020-09-25 2021-01-05 上海眼控科技股份有限公司 文本识别方法、计算机设备和存储介质
CN112507882A (zh) * 2020-12-10 2021-03-16 展讯通信(上海)有限公司 基于输入框的信息输入方法及系统、移动终端及存储介质
CN112990022A (zh) * 2021-03-18 2021-06-18 广州伟宏智能科技有限公司 一种ocr文字识别提取方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002252691A (ja) * 2001-02-26 2002-09-06 Seiko Epson Corp OCR(OpticalCharacterRecognition:光学的文字読み取り)機能付き携帯電話端末
CN101064012A (zh) * 2007-06-11 2007-10-31 北京航空航天大学 基于sms的手持式字符识别仪

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002252691A (ja) * 2001-02-26 2002-09-06 Seiko Epson Corp OCR(OpticalCharacterRecognition:光学的文字読み取り)機能付き携帯電話端末
CN101064012A (zh) * 2007-06-11 2007-10-31 北京航空航天大学 基于sms的手持式字符识别仪

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915668A (zh) * 2015-05-29 2015-09-16 深圳泓数科技有限公司 医学影像中的文字信息识别方法及装置
CN110728129A (zh) * 2019-09-03 2020-01-24 北京字节跳动网络技术有限公司 对图片中的文本内容进行排版的方法、装置、介质和设备
CN110728129B (zh) * 2019-09-03 2023-06-23 北京字节跳动网络技术有限公司 对图片中的文本内容进行排版的方法、装置、介质和设备
CN112861865A (zh) * 2021-01-29 2021-05-28 国网内蒙古东部电力有限公司 一种基于ocr技术的辅助审计方法
CN112861865B (zh) * 2021-01-29 2024-03-29 国网内蒙古东部电力有限公司 一种基于ocr技术的辅助审计方法

Also Published As

Publication number Publication date
CN104699663A (zh) 2015-06-10

Similar Documents

Publication Publication Date Title
WO2014180387A1 (zh) 一种信息输入方法及装置
US11087407B2 (en) Systems and methods for mobile image capture and processing
US10635712B2 (en) Systems and methods for mobile image capture and processing
US10127441B2 (en) Systems and methods for classifying objects in digital images captured using mobile devices
US10049268B2 (en) Selective, user-mediated content recognition using mobile devices
WO2014086272A1 (zh) 方便电子化的专业笔记本及其添加到电子日历中的方法
JP2017120503A (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
JP2014010674A (ja) 情報管理システム、画像処理装置、制御方法、及び、制御プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14795273

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14795273

Country of ref document: EP

Kind code of ref document: A1