CN115019324A

CN115019324A - 文本扫描的交互方法、装置、计算机设备和存储介质

Info

Publication number: CN115019324A
Application number: CN202110240253.6A
Authority: CN
Inventors: 韩瑞
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-03-04
Filing date: 2021-03-04
Publication date: 2022-09-06

Abstract

本申请涉及一种文本扫描的交互方法、装置、计算机设备和存储介质。所述方法涉及人工智能的文本识别技术，所述方法包括：响应于文本扫描的触发操作，显示包括至少一个文本对象的扫描画面；在扫描画面中，显示沿文本对象的边缘进行连续绘制描边；当边缘被遮挡时，显示结束对文本对象绘制描边及已绘制的描边；当边缘未被遮挡时，显示继续沿文本对象的边缘进行连续绘制描边，直至形成闭合描边时结束绘制并显示闭合描边；响应于文本识别的触发操作，显示文本对象对应的文本识别结果。采用本方法能够提高文本扫描和文本识别的准确性和效率。

Description

文本扫描的交互方法、装置、计算机设备和存储介质

技术领域

本申请涉及计算机技术领域，特别是涉及一种文本扫描的交互方法、装置、计算机设备和存储介质。

背景技术

近年来，用户通常会将线下文件或图像的数据导入计算机设备保存，既能够避免文件或数据丢失，又能够方便用户阅览。比如，在办公场景中，用户可以将客户或同事提供的纸质名片的信息手动存入智能设备内，又比如，用户通过手动录入的方式将图片内的文字翻译后获得翻译内容，显然，上述人工录入的方式费时费力。

随着互联网技术及人工智能的快速发展，出现了文本识别技术，能够帮助用户自动扫描并识别文本对象内的文本信息，比如文字识别、文字翻译、文字扫描等等。扫描文本对象，作为文本识别的第一步，在一定程度上决定了文本识别的准确度。

日常生活中，目前在扫描文本对象时，当文本对象被遮挡时，可能会造成文本识别失败，用户就会多次尝试文本扫描，导致文本识别的效率及准确率较低。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提升文本识别的效率及准确性的文本扫描的交互方法、装置、计算机设备和存储介质。

一种文本扫描的交互方法，包括：

响应于文本扫描的触发操作，显示包括至少一个文本对象的扫描画面；

在所述扫描画面中，显示沿所述文本对象的边缘进行连续绘制描边；

当所述边缘被遮挡时，显示结束对所述文本对象绘制描边及已绘制的描边；

当所述边缘未被遮挡时，显示继续沿所述文本对象的边缘进行连续绘制描边，直至形成闭合描边时结束绘制并显示所述闭合描边；

响应于文本识别的触发操作，显示所述文本对象对应的文本识别结果。

一种文本扫描的交互方法，所述方法包括：

响应于文本扫描的触发操作，显示包括多个文本对象的扫描画面；

对于所述扫描画面中的每个文本对象，在所述扫描画面中，显示沿每个文本对象的边缘进行连续绘制的每个描边；

对于所述扫描画面中的每个文本对象，当所述文本对象的边缘被遮挡时，显示结束对所述文本对象绘制描边及已绘制的描边，当所述边缘未被遮挡时，显示继续沿所述文本对象的边缘进行连续绘制描边，直至形成闭合描边时结束绘制并显示所述闭合描边；

响应于文本识别的触发操作，显示所述多个文本对象中至少一个文本对象对应的文本识别结果。

一种文本扫描的交互装置，所述装置包括：

扫描画面显示模块，用于响应于文本扫描的触发操作，显示包括至少一个文本对象的扫描画面；

描边显示模块，用于在所述扫描画面中，显示沿所述文本对象的边缘进行连续绘制描边；

所述描边显示模块，还用于当所述边缘被遮挡时，显示结束对所述文本对象绘制描边及已绘制的描边；当所述边缘未被遮挡时，显示继续沿所述文本对象的边缘进行连续绘制描边，直至形成闭合描边时结束绘制并显示所述闭合描边；

文本识别结果显示模块，用于响应于文本识别的触发操作，显示所述文本对象对应的文本识别结果。

在一个实施例中，所述描边显示模块还用于在所述扫描画面中，从所述文本对象的未遮挡边缘上的任一像素点开始，显示沿所述文本对象的未遮挡边缘上的像素点进行连续绘制描边，直至遍历完所述未遮挡边缘上的像素点时结束绘制，并显示已绘制的沿所述未遮挡边缘的描边。

在一个实施例中，所述描边显示模块还用于在所述扫描画面中，显示按第一预设颜色沿所述文本对象的边缘进行连续绘制描边，当所述边缘被遮挡时，结束对所述文本对象绘制描边并闪烁显示所述绘制的描边。

在一个实施例中，所述描边显示模块还用于在所述扫描画面中，显示沿所述文本对象的边缘进行连续绘制描边时，所述描边随所述文本对象在所述扫描画面中的实时偏移而实时跟踪所述文本对象。

在一个实施例中，所述描边显示模块还用于在所述扫描画面中，从所述文本对象的完整边缘上的任一像素点开始进行连续绘制描边；当所述边缘未被遮挡时，显示继续沿所述文本对象的完整边缘上的像素点进行连续绘制描边，直至形成闭合描边时结束绘制并显示所述闭合描边。

在一个实施例中，所述描边显示模块还用于对于所述扫描画面中被完整展示的文本对象，在所述扫描画面中，显示按第二预设颜色沿所述文本对象的完整边缘的顺时针方向或逆时针方向所连续绘制的描边。

在一个实施例中，所述描边显示模块还用于在所述扫描画面中，显示按第二预设颜色沿所述文本对象的完整边缘的顺时针方向或逆时针方向进行连续绘制描边；当所述边缘未被遮挡时，显示继续沿所述文本对象的完整边缘上的像素点进行连续绘制描边，直至形成闭合描边时结束绘制并显示所述闭合描边。

在一个实施例中，所述装置还包括：

提示信息显示模块，用于在所述当所述边缘被遮挡时，结束对所述文本对象绘制描边并显示已绘制的描边之后，显示关于所述文本对象扫描失败的提示信息；

所述提示信息显示模块，还用于在所述当所述边缘未被遮挡时，显示继续沿所述文本对象的边缘进行连续绘制描边，直至形成闭合描边时结束绘制并显示所述闭合描边之后，显示关于所述文本对象扫描成功的提示信息。

在一个实施例中，所述文本识别结果显示模块还用于响应于文本翻译的触发操作，显示所述扫描画面当前的采集图像；在所述采集图像中，显示所述文本对象中的文本内容对应的翻译内容。

在一个实施例中，所述装置还包括提示信息显示模块，用于当所述扫描画面中的文本对象内包括图形码时，在所述扫描画面中，显示关于所述图形码扫描成功的提示信息；

所述文本识别结果显示模块，还用于显示所述文本对象内所述图形码的嵌入链接所对应的访问界面。

在一个实施例中，所述文本对象为卡证，所述扫描画面显示模块还用于显示卡证信息录入界面；响应于所述卡证信息录入界面中的卡证扫描触发操作，从所述卡证信息录入界面进入卡证扫描界面；在所述卡证扫描界面，显示包括至少一个卡证的扫描画面。

在一个实施例中，所述文本识别结果显示模块还用于响应于所述卡证扫描界面中的文字识别触发操作，从所述卡证扫描界面返回所述卡证信息录入界面；在所述卡证信息录入界面，显示所述卡证对应的文字识别录入信息。

在一个实施例中，所述装置还包括矩形检测模块，包括：

预处理单元，用于对从所述扫描画面中采集到的图像进行预处理，获得预处理图像；

边缘像素识别单元，用于确定所述预处理图像中的边缘像素点；

矩形识别单元，用于将所述边缘像素点分类后，得到至少一个边缘点集合识别每个边缘点集合对应的形状；当识别的形状为闭合矩形时，确定所述边缘点集合所对应的文本对象的边缘在所述扫描画面中未被遮挡，当识别的形状不为闭合矩形时，确定所述边缘点集合所对应的文本对象的边缘在所述扫描画面中被遮挡。

在一个实施例中，所述预处理单元，还用于对所述采集到的图像进行去噪处理和对比度增强处理，获得预处理图像；

所述边缘像素识别单元，还用于计算所述预处理图像中每个像素点对应的梯度与方向，根据所述梯度与方向确定边缘像素点。

一种文本扫描的交互装置，所述装置包括：

扫描画面显示模块，用于响应于文本扫描的触发操作，显示包括多个文本对象的扫描画面；

描边显示模块，用于对于所述扫描画面中的每个文本对象，在所述扫描画面中，显示沿每个文本对象的边缘进行连续绘制的每个描边；

所述描边显示模块，还用于对于所述扫描画面中的每个文本对象，当所述文本对象的边缘被遮挡时，显示结束对所述文本对象绘制描边及已绘制的描边，当所述边缘未被遮挡时，显示继续沿所述文本对象的边缘进行连续绘制描边，直至形成闭合描边时结束绘制并显示所述闭合描边；

文本识别结果显示模块，用于响应于文本识别的触发操作，显示所述多个文本对象中至少一个文本对象对应的文本识别结果。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

一种计算机程序，所述计算机程序包括计算机指令，所述计算机指令存储在计算机可读存储介质中，计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令，所述处理器执行所述计算机指令，使得所述计算机设备执行上述文本扫描的交互方法的步骤。

上述文本扫描的交互方法、装置、计算机设备和存储介质，作为文本识别的第一步，在扫描文本对象的过程中，在扫描画面中沿文本对象的边缘动态、连续地绘制描边，将文本对象的边缘以描边动画的形式向用户展示，能够在扫描过程中给用户正确的、有针对性的反馈信息，展示当前文本对象在扫描画面中的状态，引导用户对扫描画面中的文本对象做出调整，从而提高文本扫描和文本识别的效率和准确性。

具体地，对于扫描画面中的文本对象，沿着其边缘绘制的描边的过程中，当边缘被遮挡时，结束绘制并显示已绘制的描边，该绘制过程及已绘制的描边能够引导用户将被遮挡的文本对象进行调整，使其被完整展示在扫描画面中，减少了多次尝试对该文本对象进行文本识别后存在的失败或是准确率较低的情况；当边缘未被遮挡时，继续沿着其边缘绘制的描边能够向用户表达该文本对象已被扫描成功的信号，可以进行下一步的文本识别，从而能够响应于文本识别的触发操作，展示该文本对象对应的文本识别结果，整个扫描过程避免了用户多次尝试无效的文本扫描，提高了文本扫描和文本识别的准确性和效率。

附图说明

图1为一个实施例中文本扫描的交互方法的应用环境图；

图2为一个实施例中文本扫描的交互方法的流程示意图；

图3为一个实施例中扫描画面的示意图；

图4为一个实施例中显示为被局部遮挡的文本对象绘制的描边的示意图；

图5为一个实施例中显示为被完整展示的文本对象绘制的描边的示意图；

图6为一个实施例中在扫描画面中显示为多个文本对象绘制描边的示意图；

图7为另一个实施例中显示为被局部遮挡的文本对象绘制描边的示意图；

图8为另一个实施例中显示被完整展示的文本对象绘制描边的示意图；

图9为一个实施例中扫描画面变化的示意图；

图10为另一个实施例中扫描画面变化的示意图；

图11为一个实施例中扫描画面所在的用户交互界面的示意图；

图12为一个实施例中启动卡证扫描的界面示意图；

图13为一个实施例中卡证信息录入界面与卡证扫描界面的示意图；

图14为一个实施例中文本扫描的交互方法的时序图；

图15为一个实施例中文本扫描的交互装置的结构框图；

图16为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的文本扫描的交互方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。在一个实施例中，终端102响应于文本扫描的触发操作，显示包括至少一个文本对象的扫描画面；在扫描画面中，显示沿文本对象的边缘进行连续绘制描边；当边缘被遮挡时，显示结束对文本对象绘制描边及已绘制的描边；当边缘未被遮挡时，显示继续沿文本对象的边缘进行连续绘制描边，直至形成闭合描边时结束绘制并显示闭合描边；响应于文本识别的触发操作，显示文本对象对应的文本识别结果；响应于文本识别的触发操作，显示文本对象对应的文本识别结果。其中，文本对象的边缘通过服务器104进行检测，也可以通过终端102进行检测。终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，终端102上运行了在线文档应用，该在线文档应用执行上述文本扫描的交互方法，实现文本识别的功能。在一个实施例中，终端102上运行了社交应用，比如即时通讯应用，终端102上运行的社交应用可执行上述文本扫描的交互方法。

本申请实施例提供的文本扫描的交互方法，其执行主体可以是本申请实施例提供的文本扫描的交互装置，或者集成了该文本扫描的交互装置的计算机设备，其中该文本扫描的交互装置可以采用硬件或软件的方式实现。计算机设备可以是图1中所示的终端102或服务器104。

本申请实施例提供的文本扫描的交互方法，涉及人工智能(ArtificialIntelligence，AI)技术，人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本申请实施例提供的文本扫描的交互方法，涉及人工智能的计算机视觉技术(Computer Vision，CV)。计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR(Optical Character Recognition)、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术，还包括常见的人脸识别、指纹识别等生物特征识别技术。

文本识别是计算机视觉研究领域的分支之一，俗称光学字符识别，英文全称是OCR，OCR利用光学技术和计算机技术把印在或写在纸上的文字读取出来，并转换成一种计算机能够接受、人可以理解的格式，OCR技术是实现文字高速录入的一项关键技术。

本申请实施例提供的文本扫描的交互方法，涉及计算机视觉技术领域的文本识别技术。例如，在文本扫描过程中，终端102可以获取采集图像，对采集图像中的文本对象进行文本识别，获得文本内容，可以显示文本内容。终端102还可以对获得的文本内容进一步进行翻译，获得翻译内容，再显示该翻译内容。终端102还可以将采集图像上传至服务器104，通过服务器104对该采集图像进行文本识别后获得文本内容，将该文本内容返回至终端102进行显示，服务器104可以获取该文本内容对应的翻译内容后，将该翻译内容返回至终端102进行显示。

文本识别的通常包括以下几个步骤：输入图像，图像预处理，图像版面处理，图像切分，特征提取，模型训练，识别后处理。近年来，后几个步骤的效率和精准度通过各式各样的方式得到提升，但忽略了图像输入的重要性。图像输入作为文本识别的第一个步骤是后续处理步骤的前提与关键。在用户通过智能终端进行文本识别的应用场景中，通常是通过扫描文本对象获得输入图像的，然而，普遍存在的场景是，在扫描过程中，扫描画面中的文本对象通常会被局部遮挡，比如摄像头距离文本对象太近，或是多个文本对象之间叠加导致文本对象产生遮挡关系，使得无法进行准确的文本识别，用户不得不一次次尝试文本扫描与文本识别，导致文本识别的效率低下。

为此，本申请实施例提供了文本扫描的交互方法，作为文本识别的第一步，在扫描文本对象的过程中，在扫描画面中沿文本对象的边缘动态、连续地绘制描边，将文本对象的边缘以描边动画的形式向用户展示，能够在扫描过程中给用户正确的、有针对性的反馈信息，展示当前文本对象在扫描画面中的状态，引导用户对扫描画面中的文本对象做出调整，从而提高文本扫描和文本识别的效率和准确性。

在一个实施例中，如图2所示，提供了一种文本扫描的交互方法，以该方法应用于图1中的终端102为例进行说明，包括以下步骤：

步骤202，响应于文本扫描的触发操作，显示包括至少一个文本对象的扫描画面。

其中，文本扫描是扫描文本对象的过程，用于获得待进行文本识别的采集图像。文本扫描的触发操作，是启动文本扫描的触发操作，文本扫描的触发操作可以是用户触发的单击操作、双击操作或滑动操作。

文本对象是待进行文本识别的实体对象，为了实现对文本对象进行描边，文本对象可以是包括文本内容的规则形状的实体对象，包括但不限于矩形文本对象、圆形文本对象或是能够实现对其进行描边的其他形状的对象，例如文件、证件、名片等等。当然，这里的规则形状并不是用于限制实体对象本身，规则形状指的是该实体对象在扫描画面中呈现的二维平面样式是规则形状的，例如，在需要识别书本封面的文本内容时，用户扫描书本封面，书本封面的四条边在扫描画面中是可绘制描边的直线。

扫描画面是包括至少一个文本对象的实时画面。扫描画面中可以包括一个文本对象，也可以包括两个或两个以上的多个文本对象，多个文本对象之间可能存在叠加或覆盖关系。在一个实施例中，终端可以响应于文本扫描的触发操作，启动摄像头进行图像采集，根据摄像头的实时采集画面显示包括至少一个文本对象的扫描画面。如图3所示，为一个实施例中扫描画面的示意图。参照图3，在该扫描画面300中，包括被完整展示的文本对象302和被局部遮挡的文本对象304。

步骤204，在扫描画面中，显示沿文本对象的边缘进行连续绘制描边。

为了能够在扫描过程中给用户正确的、有针对性的反馈信息，通过在扫描画面中显示沿每个文本对象的边缘动态、连续地绘制描边，将文本对象的边缘以描边动画的形式向用户展示，能够展示当前文本对象在扫描画面中的状态，引导用户对扫描画面中的文本对象做出调整。

步骤206，当边缘被遮挡时，显示结束对文本对象绘制描边及已绘制的描边。

本申请实施例中，文本对象的边缘被遮挡，指的是文本对象的边缘的一部分被遮挡，称之为局部遮挡。具体地，当沿文本对象的边缘进行连续绘制描边的过程中，当绘制至该文本对象的被遮挡边缘时，则结束对该文本对象绘制描边并显示已绘制的描边。也就是，当扫描画面中的文本对象被局部遮挡时，在扫描画面中，显示沿文本对象的未遮挡边缘的至少一部分所连续绘制的描边。

其中，被局部遮挡的文本对象的边缘被局部遮挡，扫描画面中只能显示文本对象的局部边缘，即未遮挡边缘，在这种情况下，如果直接对文本对象进行识别，可能存在识别失败或识别准确率低下的情况。为此，通过在扫描画面中沿被局部遮挡的文本对象的边缘动态、连续地绘制描边，将局部遮挡的文本对象的边缘以描边动画的形式向用户展示，能够在扫描过程中给用户正确的、有针对性的反馈信息，展示当前被局部遮挡的文本对象在扫描画面中的状态，引导用户对扫描画面中被局部遮挡的文本对象做出调整，从而提高文本扫描和文本识别的效率和准确性。

描边是一种动态地、持续的提示信息，也可以称之为反馈信息，是沿着文本对象的边缘，边绘制边显示的动态反馈信息。描边能够在扫描过程中引导用户对被局部遮挡的文本对象作出调整，使得调整后的文本对象能够被完整采集，避免用户多次尝试无效的文本识别，从而提高文本识别的准确率和效率。

在一个实施例中，终端在启动文本扫描后，实时获取采集图像，采集图像中包括被局部遮挡的文本对象，终端可以识别文本对象的未遮挡边缘，并显示沿着该未遮挡边缘绘制的描边动画。可选地，对于被局部遮挡的文本对象，沿着其未遮挡边缘的显示绘制的局部描边后，还可以继续在扫描画面中持续显示绘制完成的局部描边。当然，也可以在绘制结束之后，不再在该扫描画面中显示该绘制完成的局部描边。

在一个实施例中，终端可以沿着被局部遮挡的文本对象的全部未遮挡边缘显示绘制的描边，并显示绘制完成的描边。在另一个实施例中，终端可以沿着被局部遮挡的文本对象的部分未遮挡边缘显示绘制的描边。

需要说明的是，沿着文本对象的边缘所绘制的描边，并不限于严丝合缝地沿着文本对象的边缘进行绘制，文本对象的边缘可以是绘制过程中的一种参考信息，能够大致反应出文本对象在扫描画面中的位置，因此，绘制的描边与文本对象的边缘稍有偏移或误差也属于本申请实施例提供的文本扫描的交互方法的保护范围。

如图4所示，为一个实施例中在扫描画面中显示为被局部遮挡的文本对象绘制描边的示意图。参照图4，在该扫描画面40中，包括被局部遮挡的文本对象402，该文本对象402被遮挡物局部遮挡，对于被局部遮挡的文本对象402，从未遮挡边缘上的A点处开始绘制，逐步绘制到B点，再绘制到C点，最后绘制到D点，完成针对该被局部遮挡的文本对象绘制描边。

步骤208，当边缘未被遮挡时，显示继续沿文本对象的边缘进行连续绘制描边，直至形成闭合描边时结束绘制并显示闭合描边。

本申请实施例中，文本对象的边缘未被遮挡，指的是文本对象的边缘被完整展示在扫描画面中。具体地，当沿文本对象的边缘进行连续绘制描边的过程中，当绘制过程中该文本对象的边缘不存在被遮挡的情形时，则继续沿该文本对象的边缘进行连续绘制描边直至绘制的描边形成闭合形状，即闭合描边时才结束绘制。也就是，当扫描画面中的文本对象被完整展示时，在扫描画面中，显示沿文本对象的完整边缘所连续绘制的描边。

其中，被完整展示的文本对象的边缘也会被完整展示，扫描画面中显示文本对象的完整边缘，在这种情况下，沿着其完整边缘绘制的描边能够向用户表达该文本对象已被扫描成功的信号，引导用户可以进行下一步的文本识别，从而能够响应于文本识别的触发操作，展示该文本对象对应的文本识别结果，提高了文本扫描和文本识别的准确性和效率。

在一个实施例中，终端在启动文本扫描后，实时获取采集图像，采集图像中包括被完整展示的文本对象，终端可以识别文本对象的完整边缘，并显示沿着该完整边缘绘制的描边动画。可选地，对于被完整展示的文本对象，沿着其完整边缘的显示绘制的描边结束后，还可以继续在扫描画面中持续显示绘制完成的闭合描边。当然，也可以在绘制结束之后，不再在该扫描画面中显示该绘制完成的闭合描边。

如图5所示，为一个实施例中在扫描画面中显示为被完整展示的文本对象绘制描边的示意图。参照图5，在该扫描画面50中，包括被完整展示的文本对象502，对于被完整展示的文本对象502，从完整边缘上的A点处开始绘制，逐步绘制到B点，再绘制到C点，最后绘制到A点，完成针对该被完整展示的文本对象绘制描边。

如图6所示，为一个实施例中在扫描画面中显示为多个文本对象绘制描边的示意图。参照图6，在该扫描画面60中，包括被完整展示的第一文本对象602以及被该第一文本对象602局部遮挡的第二文本对象604，对于第一文本对象602，显示沿其完整边缘逐步连续绘制的描边602a，对于第二文本对象604，显示显示沿其局部边缘逐步连续绘制的描边604a，并且，描边602a和描边604a是同时绘制的。

步骤210，响应于文本识别的触发操作，显示文本对象对应的文本识别结果。

前文提到，文本扫描用于获得待进行文本识别的输入图像。当在扫描画面中显示文本对象的描边后，就完成了对文本对象的扫描，获得了输入图像，可以进行下一步的文本识别。文本识别的触发操作，是启动文本识别的触发操作，文本识别的触发操作可以是用户触发的单击操作、双击操作或滑动操作。

在一个实施例中，终端可以在扫描画面所在的用户交互界面中设置文本识别触发控件，终端获取到针对该文本识别触发控件的触发操作时，触发对扫描画面中的至少一个文本对象进行文本识别，获得文本识别结果，并显示该文本识别结果。比如，终端可以获取对该文本对象进行文字识别得到的文本内容，在该扫描画面中显示该文本内容。比如，终端可以获取对该文本对象进行文字识别得到的文本内容后，获取该文本内容对应的翻译内容，在该扫描画面中显示该翻译内容。还比如，终端可以获取从扫描画面的采集图像中切分出文本对象图像，并将该文本对象图像以预设的文件格式进行存储，预设的文件格式比如PDF格式或者表格格式。

在一个实施例中，终端可以在该扫描画面中直接显示文本识别结果，在另一些实施例中，终端也可以显示扫描画面的扫描界面进入其他用户交互界面，在该用户交互界面中显示文本识别结果。

在一个实施例中，终端可以显示扫描画面中各个文本对象对应的文本识别结果。在另一些实施例中，终端也可以仅对扫描画面中被完整展示的文本对象对应的文本识别结果进行显示。

上述文本扫描的交互方法，作为文本识别的第一步，在扫描文本对象的过程中，在扫描画面中沿文本对象的边缘动态、连续地绘制描边，将文本对象的边缘以描边动画的形式向用户展示，能够在扫描过程中给用户正确的、有针对性的反馈信息，展示当前文本对象在扫描画面中的状态，引导用户对扫描画面中的文本对象做出调整，从而提高文本扫描和文本识别的效率和准确性。具体地，对于扫描画面中的文本对象，沿着其边缘绘制的描边能够引导用户将被遮挡的文本对象进行调整，使其被完整展示在扫描画面中，减少了多次尝试对该文本对象进行文本识别后存在的失败或是准确率较低的情况；当边缘未被遮挡时，继续沿着其边缘绘制的描边能够向用户表达该文本对象已被扫描成功的信号，可以进行下一步的文本识别，从而能够响应于文本识别的触发操作，展示该文本对象对应的文本识别结果，整个扫描过程避免了用户多次尝试无效的文本扫描，提高了文本扫描和文本识别的准确性和效率。

在一个实施例中，在扫描画面中，显示沿文本对象的边缘进行连续绘制描边，当边缘被遮挡时，显示结束对文本对象绘制描边及已绘制的描边包括：在扫描画面中，从文本对象的未遮挡边缘上的任一像素点开始，显示沿文本对象的未遮挡边缘上的像素点进行连续绘制描边，直至遍历完未遮挡边缘上的像素点时结束绘制，并显示已绘制的沿未遮挡边缘的描边。

其中，文本对象的未遮挡边缘上的任一像素点可以是靠近遮挡边缘的像素点，也可以是与遮挡边缘有适当距离的像素点，可以理解，以未遮挡边缘上的不同像素点为绘制的起始点所获得的描边可能存在差异。

具体地，对于靠近遮挡边缘的像素点，从该像素点开始沿文本对象的未遮挡边缘连续绘制的描边，是沿着文本对象的全部未遮挡边缘绘制的描边，如图7中的(a)部分所示，在该扫描画面70中，包括被局部遮挡的文本对象702，该文本对象702被遮挡物局部遮挡，对于被局部遮挡的文本对象702，其未遮挡边缘704上包括靠近遮挡边缘的像素点A1，若从未遮挡边缘上704的A1点处开始沿着顺时针方向绘制，逐步绘制到B1点，再绘制到C1点，最后绘制到D1点，完成针对该被局部遮挡的文本对象的全部未遮挡边缘704所绘制的描边。

对于与遮挡边缘有适当距离的像素点，从该像素点开始沿文本对象的未遮挡边缘连续绘制的描边，是沿着该文本对象的部分未遮挡边缘绘制的描边。如图7中的(b)部分所示，在该扫描画面70中，包括被局部遮挡的文本对象702，该文本对象702被遮挡物局部遮挡，对于被局部遮挡的文本对象702，其未遮挡边缘704上包括远离遮挡边缘的像素点A2，若从未遮挡边缘702上的A2点处开始沿着顺时针方向绘制，逐步绘制到B2点，最后绘制到C2点，完成针对该被局部遮挡的文本对象的部分未遮挡边缘704所绘制的描边。

可选地，终端可以在扫描画面中，从文本对象的未遮挡边缘上的任一像素点开始，显示沿文本对象的未遮挡边缘的顺时针方向或逆时针方向连续绘制的描边。可以理解，对于图7中的(a)部分和(b)部分所示的情况，若沿着逆时针方向绘制描边，会导致描边太少，从而影响绘制的描边对用户的反馈作用，为此，若采用顺时针方向进行绘制，终端可在检测出文本对象的未遮挡边缘上的像素后，根据像素点在图像中的坐标，识别出未遮挡边缘上位于图像左下角的像素点，将位于左下角的像素点作为绘制描边的起始点。类似地，若采用逆时针方向进行绘制，终端可以在检测出文本对象的未遮挡边缘上的像素后，根据像素点在图像中的坐标，识别出未遮挡边缘上位于图像右下角的像素点，将位于右下角的像素点作为绘制描边的起始点。

本实施例中，通过沿未遮挡边缘上的任一像素点开始连续绘制描边，能够达到显示动态的描边的效果，从而使得文本扫描过程中用户能够通过该动态的描边获得更好、更有效的提示信息。

在一个实施例中，在扫描画面中，显示沿文本对象的边缘进行连续绘制描边；当边缘被遮挡时，显示结束对文本对象绘制描边及已绘制的描边，包括：在扫描画面中，显示按第一预设颜色沿文本对象的边缘进行连续绘制描边，当边缘被遮挡时，结束对文本对象绘制描边并闪烁显示绘制的描边。

其中，第一预设颜色，可以是默认颜色，比如蓝色、黄色或者红色。第一预设颜色还可以是与扫描画面中除文本对象之外的背景区域存在较大对比度的颜色，这样以第一预设颜色绘制的描边更能够起到提示用户的作用。

除此之外，在完成对被局部遮挡的文本对象绘制描边后，描边上的所有像素点可以一起闪烁，进一步提示用户该文本对象被局部遮挡，可能导致该文本对象扫描失败的情况，可选地，终端可以在完成对该局部遮挡的文本对象绘制描边后，采用第一预设颜色闪烁显示绘制的描边，可选地，终端可以在完成对该局部遮挡的文本对象绘制描边后，采用与第一预设颜色不同的第二预设颜色闪烁显示绘制的描边。

可选地，终端可以持续闪烁显示绘制的描边。可选地，在闪烁显示绘制的局部描边后，终端还可以继续在扫描画面中持续静态显示绘制完成的局部描边，终端也可以在闪烁显示绘制的局部描边之后，不再在该扫描画面中显示该绘制完成的局部描边。

本实施例中，通过预设的颜色显示绘制的描边，并在完成绘制后闪烁显示该描边，能够达到更好的提示用户该文本对象被局部遮挡可能会被扫描失败，从而引导用户对该文本对象作出调整的效果。

在一个实施例中，步骤204包括：当扫描画面中的文本对象被局部遮挡时，在扫描画面中，显示沿文本对象的未遮挡边缘的至少一部分所连续绘制的描边时，描边随文本对象在扫描画面中的实时偏移而实时跟踪文本对象。

本实施例中，由于扫描画面是摄像头实时的采集图像构成的画面，随着摄像头的抖动或移动，扫描画面中的被局部遮挡的文本对象的位置会相应发生变化，而绘制描边是一个动态的过程，当文本对象在扫描画面中的位置发生变化时，在绘制描边的过程中，当前已绘制的部分描边或已完成绘制的描边也会随着文本对象的实时偏移而变化或移动，实现描边跟踪文本对象的效果。

可选地，在终端绘制描边的过程中，已绘制的描边随着文本对象的偏移而实时跟踪该文本对象，在终端完成描边的绘制后，完成绘制的描边随着文本对象的偏移而实时跟踪该文本对象。可以理解，描边对文本对象的跟踪，是在绘制过程中就开始跟踪，在绘制完成后在跟踪文本对象的过程中，已绘制的描边可能会减少，也可能迅速增多，还会发生偏移。

具体地，终端可以实时检测被局部遮挡的文本对象在扫描画面中的偏移，当偏移在预设范围之内时，当前已绘制的部分描边或已完成绘制的描边随着该文本对象的偏移而移动。当摄像头相对于该文本对象移动过多或抖动太大时，超过预设范围时，该文本对象在扫描画面中偏移太大，可以触发对文本对象进行重新描边，在扫描画面中显示对偏移后的文本对象重新绘制描边，或者，超过预设范围时，可以触发沿偏移后的文本对象的局部边缘直接显示新的描边。

比如，当用户对被局部遮挡的文本对象作为调整，使该文本对象被完整展示在扫描画面中时，就可以触发对该文本对象重新绘制描边，并在扫描画面中显示重新绘制描边的过程。

本实施例中，通过在扫描画面中显示随文本对象的偏移而实时跟踪该文本对象的描边，能够达到更好的提示用户该文本对象被局部遮挡可能会被扫描失败，从而引导用户对该文本对象作出调整的效果。

在一个实施例中，在扫描画面中，显示沿文本对象的边缘进行连续绘制描边，包括：在扫描画面中，从文本对象的完整边缘上的任一像素点开始进行连续绘制描边；当边缘未被遮挡时，显示继续沿文本对象的边缘进行连续绘制描边，直至形成闭合描边时结束绘制并显示闭合描边，包括：当边缘未被遮挡时，显示继续沿文本对象的完整边缘上的像素点进行连续绘制描边，直至形成闭合描边时结束绘制并显示闭合描边。

其中，文本对象的完整边缘上的任一像素点可以是任意一个像素点，可以理解，对于扫描画面中被完整展示的文本对象，以该文本对象的完整边缘上不同像素点为绘制的起始点都能获得完整边缘的闭合描边。

如图8所示，为一个实施例中对被完整展示的文本对象绘制闭合描边的示意图。参照图8的(a)部分，在该扫描画面80中，包括被完整展示的文本对象802，可以从完整边缘上804的A1点处开始沿着顺时针方向绘制，逐步绘制到B1点，再绘制到C1点，最后绘制到A1点，完成针对该被完整展示的文本对象的完整边缘804所绘制的闭合描边。参照图8的(b)部分，可以从完整边缘上804的A2点处开始沿着顺时针方向绘制，逐步绘制到B2点，再绘制到C2点，最后绘制到A2点，完成针对该被完整展示的文本对象的完整边缘804所绘制的闭合描边。

本实施例中，对于被完整展示的文本对象，沿着其完整边缘绘制的闭合描边能够向用户表达该文本对象已被扫描成功的信号，可以进行下一步的文本识别。

在一个实施例中，在扫描画面中，显示沿文本对象的边缘进行连续绘制描边，包括：在扫描画面中，显示按第二预设颜色沿文本对象的完整边缘的顺时针方向或逆时针方向进行连续绘制描边；当边缘未被遮挡时，显示继续沿文本对象的边缘进行连续绘制描边，直至形成闭合描边时结束绘制并显示闭合描边，包括：当边缘未被遮挡时，显示继续沿文本对象的完整边缘上的像素点进行连续绘制描边，直至形成闭合描边时结束绘制并显示闭合描边。

可选地，第一终端可以按第一预设颜色显示扫描画面中沿被局部遮挡的文本对象的局部边缘绘制的描边，并按第一预设颜色或与第一预设颜色不同的第二预设颜色显示扫描画面中沿被完整展示的文本对象的完整边缘连续绘制的描边，以对两者进行区分。

可选地，当文本对象为矩形文本对象时，从该矩形文本对象的完整边缘上的任一像素点开始，显示沿该矩形文本对象的完整矩形边缘连续绘制的描边，直至形成闭合矩形描边时结束绘制。

可选地，终端可以继续在扫描画面中持续静态显示绘制完成的闭合描边，终端也可以在显示完成绘制的闭合描边之后，不再在该扫描画面中显示该绘制完成的闭合描边。

本实施例中，对于扫描画面中被完整展示的文本对象，通过预设的颜色显示绘制的描边，并在完成绘制后显示该描边，能够达到更好的提示用户的效果。

在一个实施例中，上述文本扫描的交互方法还包括：在当边缘被遮挡时，结束对文本对象绘制描边并显示已绘制的描边之后，显示关于文本对象扫描失败的提示信息。

由于被局部遮挡的文本对象中可能存在部分文本内容无法识别到的情况，因此，为提高文本识别的效率，终端可以在完成沿边缘局部绘制的描边后，通过在扫描画面中显示关于该文本对象扫描失败的提示信息，以告知用户不对该文本对象进行文本识别，从而引导用户对该文本对象作出调整。提示信息可以是文字形式的提示信息，也可以是图标形式的提示信息。

可选地，对于被局部遮挡的文本对象，在显示绘制完成的描边后，可以在扫描画面中静态地持续显示该绘制完成的描边，同时显示关于该文本对象扫描失败的提示信息，也可以不再在该扫描画面中显示该绘制完成的描边，而只显示关于该文本对象扫描失败的提示信息，提示信息可以靠近该文本对象显示。

如图9所示，为一个实施例中扫描画面变化的示意图。参照图9的(a)部分，在该扫描画面90中，包括被局部遮挡的文本对象902，参照图9的(b)部分，显示沿该文本对象902的未遮挡边缘绘制的描边904，参照图9的(c)部分，扫描画面中显示沿该文本对象902的描边904，同时显示关于该文本对象扫描失败的提示信息906。

可选地，终端可以响应于文本识别的触发操作，仅对扫描画面中扫描成功的文本对象进行文本识别，显示扫描成功的文本对象对应的文本识别结果，而不对扫描失败的文本对象进行文本识别。

本实施例中，通过进一步在扫描画面中显示关于被局部遮挡的文本对象的扫描失败提示信息，能够进一步引导用户对该被局部遮挡的文本对象作出调整。

在一个实施例中，上述文本扫描的交互方法还包括：在当边缘未被遮挡时，显示继续沿文本对象的边缘进行连续绘制描边，直至形成闭合描边时结束绘制并显示闭合描边之后，显示关于文本对象扫描成功的提示信息。

由于被完整展示的文本对象中的文本内容可以被完全采集到，对该文本对象进行文本识别可以获得准确的文本内容，因此，终端可以在绘制完成闭合描边后，通过在扫描画面中显示关于该文本对象扫描成功的提示信息，以告知用户进一步对该文本对象进行文本识别，提升文本识别的效率。提示信息可以是文字形式的提示信息，也可以是图标形式的提示信息。

如图10所示，为一个实施例中扫描画面变化的示意图。参照图10的(a)部分，在该扫描画面100中，包括被完整展示的文本对象1002，参照图10的(b)部分，显示沿该文本对象1002的完整边缘绘制的描边1004，参照图10的(c)部分，扫描画面中显示沿该文本对象1002的描边1004，同时显示关于该文本对象扫描成功的提示信息1006。

本实施例中，通过进一步在扫描画面中显示关于被完整展示的文本对象的扫描成功提示信息，能够进一步引导用户对该被完整展示的文本对象进行文本识别。

在一个实施例中，步骤210包括：响应于文本翻译的触发操作，显示扫描画面当前的采集图像；在采集图像中，显示文本对象中的文本内容对应的翻译内容。

具体地，文本识别可以包括文本翻译，文本翻译是指识别出文本对象的文本内容后，进一步对该文本内容进行翻译，获得对应的翻译内容。其中，文本翻译的触发操作是启动文本翻译的触发操作，当用户通过终端显示的描边认为文本对象被成功扫描时，可以在该用户界面中触发文本翻译操作，当用户通过该终端显示的描边认为文本对象可能翻译失败时，可以对扫描画面中的文本对象作出调整后，再触发文本翻译操作。终端可以响应于该扫描画面中的文本翻译触发操作，显示当前扫描画面捕捉到的采集图像，获得该采集图形中文本内容的翻译内容后，在采集图像中显示该翻译内容。

可选地，终端可以在扫描画面所在的用户交互界面中设置文本翻译触发控件，终端响应于用户在该用户交互界面中针对该控件的触发操作，显示扫描画面当前捕捉到的采集图像，并在该采集图像中显示文本对象中文本内容的翻译内容。

可选地，显示的翻译内容可以覆盖并替换采集图像中原始的文本内容。可选地，显示的翻译内容也可以与原始的文本内容对照显示在该采集图像中。可选地，终端可以将捕捉到的采集图像发送至服务器，通过服务器识别出该采集图像中的文本内容，获得对应的翻译内容，并接收服务器返回的该翻译内容，再将该翻译内容显示在采集图像中。

如图11所示，为一个实施例中扫描画面所在的用户交互界面的示意图。参照图11的(a)部分，在该扫描画面110所在的用户交互界面中，还包括被完整展示的文本对象1102、文本翻译触发控件1104和绘制完成的该文本对象1102的完整描边1106，终端响应于针对该控件的触发操作1108，显示图11的(b)部分，即当前扫描画面中捕捉到的采集图像，并在采集图像中显示文本对象中文本内容的翻译内容，该翻译内容替换并覆盖了原始的文本内容。

本实施例中，通过在扫描画面中显示绘制的描边，能够引导对扫描画面中展示的文本对象作出调整，从而提高文本扫描和文本翻译的效率和准确性。

在一个实施例中，上述文本扫描的交互方法还包括：当扫描画面中的文本对象内包括图形码时，在扫描画面中，显示关于图形码扫描成功的提示信息；步骤210包括：显示文本对象内图形码的嵌入链接所对应的访问界面。

其中，图形码可以是条形码、二维码或小程序码。有别于文本识别是对文本对象中的文本内容进行识别，图形码是一种在平面的二维方向上按一定规律分布的黑白相间的几何图形，可以用于记录数据和信息，扫描到图形码后可直接进入该图形码对应的访问页面。在一些场景中，文本对象上会引致有图形码，比如，名片上会印制有员工所在企业的图形码，比如，纸质票据上会印制有用于查询票据信息的图形码。

具体地，当扫描画面中文本对象内包括被完整展示的图形码时，终端可以在采集到该图形码时，在扫描画面中显示关于该图形码扫描成功的提示信息，并根据用户的确认操作，从该扫描画面所在的用户交互界面进入到该图形码的嵌入链接所对应的访问页面，或是，在扫描成功后直接进入该图形码的嵌入链接所对应的访问页面。提示信息可以是文字形式的提示信息，也可以是图标形式的提示信息。

本实施例中，若在文本扫描过程中采集到图形码，则可以直接显示该图形码的嵌入链接所对应的访问页面，能够方便用户操作。

在一个实施例中，如图12所示，当文本对象为卡证时，步骤202包括：

步骤1202，显示卡证信息录入界面。

其中，卡证可以是包括文本内容的证件或卡片，比如名片、身份证或是手写便签，等等。卡证信息录入界面是终端上提供的文本识别功能中的用户交互界面。可选地，该文本识别功能可以是终端上的社交应用提供的，还可以是终端上的在线文档应用提供的。

步骤1204，响应于卡证信息录入界面中的卡证扫描触发操作，从卡证信息录入界面进入卡证扫描界面。

其中，卡证扫描触发操作是启动卡证扫描的触发操作，终端可以响应于该卡证扫描触发操作，从卡证信息录入界面跳转至或是切换至卡证扫描界面。

步骤1206，在卡证扫描界面，显示包括至少一个卡证的扫描画面。

具体地，终端启动摄像头后，实时获取包括卡证的采集图像，在卡证扫描界面中实时显示采集图像，即显示对该卡证的扫描画面。

如图13所示，为一个实施例中卡证信息录入界面与卡证扫描界面的示意图。参照图13，在卡证信息录入界面130中，包括卡证扫描控件1302，终端可以响应于用户针对该卡证扫描控件1302的触发操作1304，进入卡证扫描界面131，在该卡证扫描界面131中显示扫描画面。

在一个具体的应用场景中，用户可以打开在线文档应用，进入在线文档应用的卡证信息录入界面，在该卡证信息录入界面中触发卡证扫描的触发操作，终端根据该触发操作启动摄像头，并从该卡证扫信息录入界面进入卡证扫描界面，在该卡证扫描界面中显示摄像头实时采集的包括文本对象的扫描画面。

本实施例中，通过设置卡证信息录入界面，在卡证信息录入界面中触发文本扫描，能够直接基于卡证信息录入界面实现文本扫描和文本识别的功能，不需要额外操作，方便用户操作。

在一个实施例中，步骤210包括：响应于卡证扫描界面中的文字识别触发操作，从卡证扫描界面返回卡证信息录入界面；在卡证信息录入界面，显示卡证对应的文字识别录入信息。

其中，卡证信息录入界面中还可以包括卡证填写表单，用户可以手动将卡证中的信息录入到该卡证填写表单中，也可以通过文本文本，自动将识别到的文字识别录入信息填充到该卡证填写表单中。比如，卡证为名片时，卡证填写表单的项目可以包括姓名、职位、公司、地址、手机等等。

可选地，终端可以在卡证扫描界面中设置文字识别触发控件，当用户通过终端显示的卡证的描边认为卡证被成功扫描时，可以在该卡证扫描界面中触发针对该卡证的文字识别触发操作，当用户通过该终端显示的描边认为卡证可能识别失败时，可以对扫描画面中的卡证作出调整后，再触发针对该卡证的文字识别的触发操作。

可选地，终端可以将捕捉到的采集图像发送至服务器，通过服务器识别出该采集图像中卡证对应的文字识别录入信息，并接收服务器返回的文字识别录入信息，再将该文字识别录入信息自动填充至卡证扫描界面的卡证填写表单中。

参照图13，在卡证扫描界面131中包括文本识别触发控件1312，终端响应于针对该控件的触发操作1314，获得对该扫描画面中文本对象进行文本识别得到的文字识别录入信息，并将文字识别录入信息自动填充到卡证信息录入界面130中。

本实施例中，通过终端显示的卡证的描边引导用户进行下一步的文字识别，获得文字识别录入信息，并将获得的文字识别录入信息自动展示，能够提升对卡证进行文本识别的准确率和效率。

在一个实施例中，上述文本扫描的交互方法还包括：对从扫描画面中采集到的图像进行预处理，获得预处理图像；确定预处理图像中的边缘像素点；将边缘像素点分类后，得到至少一个边缘点集合；识别每个边缘点集合对应的形状；当识别的形状为闭合形状时，确定边缘点集合所对应的文本对象在扫描画面中被完整展示，当识别的形状不为闭合形状时，确定边缘点集合所对应的文本对象在扫描画面中被局部遮挡。

在一个实施例中，当识别的形状为闭合矩形时，确定边缘点集合所对应的文本对象在扫描画面中被完整展示，当识别的形状不为闭合矩形时，确定边缘点集合所对应的文本对象在扫描画面中被局部遮挡。

考虑到日常生活中的文本对象多为矩形，在本实施例中，通过判断文本对象的边缘像素能够形成闭合矩形，从而确定该文本对象是被完整展示还是被局部遮挡。该识别步骤可以由终端来执行，也可以由服务器来执行。

具体地，首先，需要对扫描画面中当前捕捉到的采集图像进行预处理，包括对采集到的图像进行去噪处理和对比度增强处理，获得预处理图像，例如可以使用medianBlur函数，也就是中值滤波器来平滑采集图像。接着，利用边缘检测算法识别出图像中的边缘像素点，终端可以利用边缘检测算法Canny计算预处理图像中每个像素点对应的梯度与方向，根据梯度与方向确定边缘像素点。然后，终端将边缘像素点设定为一个数据集，对该数据集分类后，得到至少一个边缘点集合，例如，当采集图像中包括两个文本对象时，该数据集中的边缘像素点件归为两类，得到两个边缘点集合，当采集图像中包括一个文本对象时，该数据集中的边缘像素点将被归为一类，得到一个边缘点集合。接着，结合每个像素点的位置信息，识别每个边缘点集合中边缘像素点构成的形状，例如，终端可以使用通过轮廓检测函数findcontour获得边缘点集合对应的轮廓，判断能否形成闭合形状，从而确定该边缘点集合对应的文本对象是被完整展示还是局部遮挡，进一步还可以再将该轮廓通过多边形拟合曲线函数approxPloyDP判断是否为闭合矩形。

如图14所示，为一个实施例中文本扫描的交互方法的时序图，参照图14，启动文本扫描后，用户通过终端的摄像头采集多个文本对象N1和N2，并将采集图像发送至服务器，服务器识别该多个文本对象的边缘像素点后，判断N1的边缘像素点形成了闭合矩形，终端显示沿着文本对象N1的边缘绘制的动态描边并显示文本对象N1扫描成功的提示信息，服务器判断文本对象N2的边缘像素点未形成闭合矩形，终端显示沿着文本对象N2的未遮挡边缘绘制的动态描边并显示N2扫描失败的提示信息，在用户主动对文本对象N2作出调整后，使文本对象N2被完整展示在采集图像中之后，终端显示沿着文本对象N2的完整边缘绘制的动态描边并显示N2扫描成功的提示信息，从而完成了多个文本对象的扫描。

在一个实施例中，提供了一种文本扫描的交互方法，包括：

响应于文本扫描的触发操作，显示包括多个文本对象的扫描画面；对于扫描画面中的每个文本对象，在扫描画面中，显示沿每个文本对象的边缘进行连续绘制的每个描边；对于扫描画面中的每个文本对象，当文本对象的边缘被遮挡时，显示结束对文本对象绘制描边及已绘制的描边，当边缘未被遮挡时，显示继续沿文本对象的边缘进行连续绘制描边，直至形成闭合描边时结束绘制并显示闭合描边；响应于文本识别的触发操作，显示多个文本对象中至少一个文本对象对应的文本识别结果。

需要说明的是，该实施例中涉及的名词及概念的解释与说明，可参考前文提到的相关的内容，在此不再赘述。在本实施例中，扫描画面中包括多个文本对象，多个文本对象指的是两个或两个以上的文本对象。对于每个扫描对象，同时显示沿着每个扫描对象的边缘进行连续绘制描边，当该扫描画面中某个文本对象未被遮挡时，结束绘制描边并显示已绘制的描边，当该扫描画面中某个文本对象未被遮挡时，显示继续沿该文本对象的边缘进行连续绘制的描边，直至形成闭合描边时才结束绘制并显示该闭合描边。在扫描多个文本对象的过程中，在扫描画面中沿每个文本对象的边缘动态、连续地绘制每个描边，将每个文本对象的边缘以描边动画的形式向用户展示，能够在扫描过程中给用户正确的、有针对性的反馈信息，展示当前每个文本对象在扫描画面中的状态，引导用户对扫描画面中的每个文本对象做出调整，从而提高文本扫描和文本识别的效率和准确性。

在一个具体的应用场景中，文本扫描的交互方法包括以下步骤：

用户启动文本扫描，进入文本扫描界面；在文本扫描界面中，显示包括至少一个文本对象的扫描画面；对于扫描画面中的采集图像，对采集图像进行预处理，获得预处理图像，再识别出该预处理图像中的边缘像素点，并将边缘像素点进行分类。例如分为两类，分别属于被完整展示的文本对象N1的边缘像素点构成的边缘点集合X1和被局部遮挡的文本对象N2的边缘像素点构成的边缘点集合X2。对于X1中的像素点，判断能够形成闭合矩形，则选取其中任意一个像素点，沿着顺时针方向采用蓝色显示该边缘点集合中的每个边缘像素点，从而形成一个沿着轮廓绘制的动态描边，在完成绘制时也就是形成矩形闭合描边时，在该闭合描边的内部显示扫描成功的提示信息，从而引导用户做出下一步的文本识别的触发操作。对于X2中的像素点，判断不能形成闭合矩形，则选取其中任意一个像素点，沿着顺时针方向采用蓝色显示该边缘点集合中的每个边缘像素点，从而形成一个沿着轮廓绘制的动态描边，在完成绘制时也就是绘制到X2中的最后一个边缘像素点时，形成未闭合的描边，此时该描边上的所有像素点构成的描边可以采用黄色进行显示并一起闪烁，并显示该文本对象扫描失败的提示信息，从而引导用户对该文本对象作出调整。最后，终端响应于文本识别的触发操作，对扫描成功的文本对象N1进行文本识别，获得文本识别结果，并显示文本对象N1的文本识别结果。

应该理解的是，虽然上述流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图15示，提供了一种文本扫描的交互装置1500，该装置可以采用软件模块或硬件模块，或者是二者的结合成为计算机设备的一部分，该装置具体包括：扫描画面显示模块1502、描边显示模块1504和文本识别结果显示模块1506，其中：

扫描画面显示模块1502，用于响应于文本扫描的触发操作，显示包括至少一个文本对象的扫描画面；

描边显示模块1504，用于在扫描画面中，显示沿文本对象的边缘进行连续绘制描边；

描边显示模块1504，还用于当边缘被遮挡时，显示结束对文本对象绘制描边及已绘制的描边；当边缘未被遮挡时，显示继续沿文本对象的边缘进行连续绘制描边，直至形成闭合描边时结束绘制并显示闭合描边；

文本识别结果显示模块1506，用于响应于文本识别的触发操作，显示文本对象对应的文本识别结果。

在一个实施例中，描边显示模块1504还用于在扫描画面中，从文本对象的未遮挡边缘上的任一像素点开始，显示沿文本对象的未遮挡边缘上的像素点进行连续绘制描边，直至遍历完未遮挡边缘上的像素点时结束绘制，并显示已绘制的沿未遮挡边缘的描边。

在一个实施例中，描边显示模块1504还用于在扫描画面中，显示按第一预设颜色沿文本对象的边缘进行连续绘制描边，当边缘被遮挡时，结束对文本对象绘制描边并闪烁显示绘制的描边。

在一个实施例中，描边显示模块1504还用于在扫描画面中，显示沿文本对象的边缘进行连续绘制描边时，描边随文本对象在扫描画面中的实时偏移而实时跟踪文本对象。

在一个实施例中，描边显示模块1504还用于在扫描画面中，从文本对象的完整边缘上的任一像素点开始进行连续绘制描边；当边缘未被遮挡时，显示继续沿文本对象的完整边缘上的像素点进行连续绘制描边，直至形成闭合描边时结束绘制并显示闭合描边。

在一个实施例中，描边显示模块1504还用于在扫描画面中，显示按第二预设颜色沿文本对象的完整边缘的顺时针方向或逆时针方向进行连续绘制描边；当边缘未被遮挡时，显示继续沿文本对象的完整边缘上的像素点进行连续绘制描边，直至形成闭合描边时结束绘制并显示闭合描边。

在一个实施例中，文本扫描的交互装置1500还包括：

提示信息显示模块，用于在当边缘被遮挡时，结束对文本对象绘制描边并显示已绘制的描边之后，显示关于文本对象扫描失败的提示信息；

提示信息显示模块，还用于在当边缘未被遮挡时，显示继续沿文本对象的边缘进行连续绘制描边，直至形成闭合描边时结束绘制并显示闭合描边之后，显示关于文本对象扫描成功的提示信息。

在一个实施例中，文本识别结果显示模块1506还用于响应于文本翻译的触发操作，显示扫描画面当前的采集图像；在采集图像中，显示文本对象中的文本内容对应的翻译内容。

在一个实施例中，文本扫描的交互装置1500还包括提示信息显示模块，用于当扫描画面中的文本对象内包括图形码时，在扫描画面中，显示关于图形码扫描成功的提示信息；

文本识别结果显示模块1506，还用于显示文本对象内图形码的嵌入链接所对应的访问界面。

在一个实施例中，文本对象为卡证，扫描画面显示模块1504还用于显示卡证信息录入界面；响应于卡证信息录入界面中的卡证扫描触发操作，从卡证信息录入界面进入卡证扫描界面；在卡证扫描界面，显示包括至少一个卡证的扫描画面。

在一个实施例中，文本识别结果显示模块1506还用于响应于卡证扫描界面中的文字识别触发操作，从卡证扫描界面返回卡证信息录入界面；在卡证信息录入界面，显示卡证对应的文字识别录入信息。

在一个实施例中，文本扫描的交互装置1500还包括矩形检测模块，包括：

预处理单元，用于对从扫描画面中采集到的图像进行预处理，获得预处理图像；

边缘像素识别单元，用于确定预处理图像中的边缘像素点；

矩形识别单元，用于将边缘像素点分类后，得到至少一个边缘点集合识别每个边缘点集合对应的形状；当识别的形状为闭合矩形时，确定边缘点集合所对应的文本对象的边缘在扫描画面中未被遮挡，当识别的形状不为闭合矩形时，确定边缘点集合所对应的文本对象的边缘在扫描画面中被遮挡。

在一个实施例中，预处理单元，还用于对采集到的图像进行去噪处理和对比度增强处理，获得预处理图像；

边缘像素识别单元，还用于计算预处理图像中每个像素点对应的梯度与方向，根据梯度与方向确定边缘像素点。

一种文本扫描的交互装置，包括：

描边显示模块，用于对于扫描画面中的每个文本对象，在扫描画面中，显示沿每个文本对象的边缘进行连续绘制的每个描边；

描边显示模块，还用于对于扫描画面中的每个文本对象，当文本对象的边缘被遮挡时，显示结束对文本对象绘制描边及已绘制的描边，当边缘未被遮挡时，显示继续沿文本对象的边缘进行连续绘制描边，直至形成闭合描边时结束绘制并显示闭合描边；

文本识别结果显示模块，用于响应于文本识别的触发操作，显示多个文本对象中至少一个文本对象对应的文本识别结果。

上述文本扫描的交互装置，作为文本识别的第一步，在扫描文本对象的过程中，在扫描画面中沿文本对象的边缘动态、连续地绘制描边，将文本对象的边缘以描边动画的形式向用户展示，能够在扫描过程中给用户正确的、有针对性的反馈信息，展示当前文本对象在扫描画面中的状态，引导用户对扫描画面中的文本对象做出调整，从而提高文本扫描和文本识别的效率和准确性。具体地，对于扫描画面中被局部遮挡的文本对象，沿着其局部边缘绘制的描边能够引导用户将被局部遮挡的文本对象进行调整，使其被完整展示在扫描画面中，减少了多次尝试对该局部遮挡的文本对象进行文本识别后存在的失败或是准确率较低的情况；对于被完整展示的文本对象，沿着其完整边缘绘制的描边能够向用户表达该文本对象已被扫描成功的信号，可以进行下一步的文本识别，从而能够响应于文本识别的触发操作，展示该文本对象对应的文本识别结果，整个扫描过程避免了用户多次尝试无效的文本扫描，提高了文本扫描和文本识别的准确性和效率。

关于文本扫描的交互装置的具体限定可以参见上文中对于文本扫描的交互方法的限定，在此不再赘述。上述文本扫描的交互装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图16所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种文本扫描的交互方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图16中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，还提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种文本扫描的交互方法，包括：

2.根据权利要求1所述的方法，其特征在于，所述在所述扫描画面中，显示沿所述文本对象的边缘进行连续绘制描边；当所述边缘被遮挡时，显示结束对所述文本对象绘制描边及已绘制的描边，包括：

在所述扫描画面中，从所述文本对象的未遮挡边缘上的任一像素点开始，显示沿所述文本对象的未遮挡边缘上的像素点进行连续绘制描边，直至遍历完所述未遮挡边缘上的像素点时结束绘制，并显示已绘制的沿所述未遮挡边缘的描边。

3.根据权利要求1所述的方法，其特征在于，所述在所述扫描画面中，显示沿所述文本对象的边缘进行连续绘制描边；当所述边缘被遮挡时，显示结束对所述文本对象绘制描边及已绘制的描边，包括：

在所述扫描画面中，显示按第一预设颜色沿所述文本对象的边缘进行连续绘制描边，当所述边缘被遮挡时，结束对所述文本对象绘制描边并闪烁显示所述绘制的描边。

4.根据权利要求1所述的方法，其特征在于，所述在所述扫描画面中，显示沿所述文本对象的边缘进行连续绘制描边，包括：

在所述扫描画面中，显示沿所述文本对象的边缘进行连续绘制描边时，所述描边随所述文本对象在所述扫描画面中的实时偏移而实时跟踪所述文本对象。

5.根据权利要求1所述的方法，其特征在于，所述在所述扫描画面中，显示沿所述文本对象的边缘进行连续绘制描边，包括：

在所述扫描画面中，从所述文本对象的完整边缘上的任一像素点开始进行连续绘制描边；

所述当所述边缘未被遮挡时，显示继续沿所述文本对象的边缘进行连续绘制描边，直至形成闭合描边时结束绘制并显示所述闭合描边，包括：

当所述边缘未被遮挡时，显示继续沿所述文本对象的完整边缘上的像素点进行连续绘制描边，直至形成闭合描边时结束绘制并显示所述闭合描边。

6.根据权利要求1所述的方法，其特征在于，所述在所述扫描画面中，显示沿所述文本对象的边缘进行连续绘制描边，包括：

在所述扫描画面中，显示按第二预设颜色沿所述文本对象的完整边缘的顺时针方向或逆时针方向进行连续绘制描边；

7.根据权利要求1所述的方法，其特征在于，所述方法还包括：

在所述当所述边缘被遮挡时，结束对所述文本对象绘制描边并显示已绘制的描边之后，显示关于所述文本对象扫描失败的提示信息；

在所述当所述边缘未被遮挡时，显示继续沿所述文本对象的边缘进行连续绘制描边，直至形成闭合描边时结束绘制并显示所述闭合描边之后，显示关于所述文本对象扫描成功的提示信息。

8.根据权利要求1所述的方法，其特征在于，所述响应于文本识别的触发操作，显示所述文本对象对应的文本识别结果，包括：

响应于文本翻译的触发操作，显示所述扫描画面当前的采集图像；

在所述采集图像中，显示所述文本对象中的文本内容对应的翻译内容。

9.根据权利要求1所述的方法，其特征在于，所述方法还包括：

当所述扫描画面中的文本对象内包括图形码时，在所述扫描画面中，显示关于所述图形码扫描成功的提示信息；

所述响应于文本识别的触发操作，显示所述文本对象对应的文本识别结果，包括：

显示所述文本对象内所述图形码的嵌入链接所对应的访问界面。

10.根据权利要求1所述的方法，其特征在于，所述文本对象为卡证，所述响应于文本扫描的触发操作，显示包括至少一个文本对象的扫描画面，包括：

显示卡证信息录入界面；

响应于所述卡证信息录入界面中的卡证扫描触发操作，从所述卡证信息录入界面进入卡证扫描界面；

在所述卡证扫描界面，显示包括至少一个卡证的扫描画面。

11.根据权利要求10所述的方法，其特征在于，所述响应于文本识别的触发操作，显示所述文本对象对应的文本识别结果，包括：

响应于所述卡证扫描界面中的文字识别触发操作，从所述卡证扫描界面返回所述卡证信息录入界面；

在所述卡证信息录入界面，显示所述卡证对应的文字识别录入信息。

12.根据权利要求1至11任一项所述的方法，其特征在于，所述方法还包括：

对从所述扫描画面中采集到的图像进行预处理，获得预处理图像；

确定所述预处理图像中的边缘像素点；

将所述边缘像素点分类后，得到至少一个边缘点集合；

识别每个边缘点集合对应的形状；

当识别的形状为闭合矩形时，确定所述边缘点集合所对应的文本对象的边缘在所述扫描画面中未被遮挡，当识别的形状不为闭合矩形时，确定所述边缘点集合所对应的文本对象的边缘在所述扫描画面中被遮挡。

13.根据权利要求12所述的方法，其特征在于，所述对所述扫描画面中当前采集到的图像进行预处理，获得预处理图像，包括：

对所述采集到的图像进行去噪处理和对比度增强处理，获得预处理图像；

所述确定所述预处理图像中的边缘像素点，包括：

计算所述预处理图像中每个像素点对应的梯度与方向，根据所述梯度与方向确定边缘像素点。

14.一种文本扫描的交互方法，其特征在于，所述方法包括：

15.根据权利要求14所述的方法，其特征在于，所述对于所述扫描画面中的每个文本对象，在所述扫描画面中，显示沿每个文本对象的边缘进行连续绘制相应的描边，包括：

对于所述扫描画面中的每个文本对象，在所述扫描画面中，显示按第一预设颜色沿每个文本对象的边缘进行连续绘制的每个描边；

所述当所述文本对象的边缘被遮挡时，结束对所述文本对象绘制描边并显示已绘制的描边，包括：

当所述文本对象的边缘被遮挡时，结束对所述文本对象绘制描边并以第二预设颜色闪烁显示已绘制的描边。