CN110717483B - 网络图像识别处理方法,计算机可读存储介质和移动终端 - Google Patents

网络图像识别处理方法,计算机可读存储介质和移动终端 Download PDF

Info

Publication number
CN110717483B
CN110717483B CN201910886439.1A CN201910886439A CN110717483B CN 110717483 B CN110717483 B CN 110717483B CN 201910886439 A CN201910886439 A CN 201910886439A CN 110717483 B CN110717483 B CN 110717483B
Authority
CN
China
Prior art keywords
character strings
target data
characters
character
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910886439.1A
Other languages
English (en)
Other versions
CN110717483A (zh
Inventor
李友宙
钟央丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Shanzheng Technology Co ltd
Original Assignee
Zhejiang Shanzheng Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Shanzheng Technology Co ltd filed Critical Zhejiang Shanzheng Technology Co ltd
Priority to CN201910886439.1A priority Critical patent/CN110717483B/zh
Publication of CN110717483A publication Critical patent/CN110717483A/zh
Application granted granted Critical
Publication of CN110717483B publication Critical patent/CN110717483B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种用于网络图像识别的处理方法使得可以准确高效地从网络平台上的不可编辑格式的数据中提取出可编辑数据以允许自动批量地对网络平台上的经营主体进行监管的图像识别处理方法,其包括:提取目标数据,旋转对齐该目标数据并进行二值化,识别多个字符串及其在目标数据中的坐标位置,将多个字符串分为第一部分和第二部分,查找属性表将第一部分字符串分为多个预设类别,对第二部分的字符串赋予权重,并将每个预设类别的字符串与第二部分的字符串之中权重最高的一个进行关联。本发明还公开了计算机可读存储介质和移动终端,可用于以更高效和准确的方式来批量提取和存储用于监管网络经营主体的数据。

Description

网络图像识别处理方法,计算机可读存储介质和移动终端
技术领域
本申请关于图像处理技术的领域,更具体地关于一种用于网络图像识别的处理方法,以及计算机可读存储介质和移动终端。
背景技术
在网络监管领域,有关部门经常需要在网络上对经营主体的经营相关信息进行核查。由于网络上经营主体的各项信息经常存在信息录入不准确,信息错误,信息过期,信息为不可编辑格式需要人工辨认等问题以及监管与不同网络系统的兼容性,通常需要人工对经营主体在网络平台上所录入的数据进行抽查记录和判断正确与否,再将其存储到监控系统中进行显示。这显然即耗费人力物力,又在面对大量待分析数据时无能为力(如网络购物网站上本地区的经营主体可能高达上万家)。因此,需要一种能够将网络平台上反映商品、证书、许可证等不可编辑的图片等格式的待监管数据准确地提取出来,并批量以固定格式存储以提高后续监管过程的效率的处理方法,同时需要解决现有OCR技术中所识别出的文字信息如何进行正确分类以确保监管正确性的问题。
发明内容
本发明的目的在于提供一种用于网络图像识别的处理方法使得可以准确高效地从网络平台上的不可编辑格式的数据中提取出可编辑数据以允许自动批量地对网络平台上的经营主体进行监管的图像识别处理方法,其包括:从目标地址以图像形式提取目标数据;通过将目标数据的多个预设区域中像素值的分布特征与预先保存的模板对比来旋转所述目标数据;将旋转后的目标数据二值化;从二值化的目标数据中识别多个字符串及其在目标数据中的坐标位置;将多个字符串分为第一部分和第二部分,第一部分仅包含汉字字符而第二部分仅包含字母或数字字符;查找预先保存的属性表将第一部分字符串分为多个预设类别;根据第二部分的字符串的坐标位置距离每个预设类别的字符串的坐标位置的位移矢量,长度与预设类别的字符串的长度的对比以及字符串之中一个或多个字符的校验和来对第二部分的字符串赋予权重,从而将每个预设类别的字符串与第二部分的字符串之中权重最高的一个进行关联;以及存储和显示每个预设类别的字符串以及其所关联的一个第二部分的字符串。
在优选实施例中,权重随着位移矢量的绝对值增加而减小。
在优选实施例中,权重随着第二部分的字符串的长度与预设类别的字符串的区别增大而减小。
在优选实施例中,校验和为所述一个或多个字符中的每个与预先设定的固定数值的乘积之和。
在优选实施例中,该一个或多个字符的数量小于所述第二部分的字符串所包含的字符数量。
在优选实施例中,还根据所述权重的大小从所述第二部分的字符串中去除一个或更多的字符。
本发明的实施例还公开了计算机可读存储介质和移动终端,以用于执行本发明的实施例所公开的方法步骤。
本发明所提供的优势在于可以将不同格式或者不同网络平台上的各类与经营相关的数据转换为相同的可编辑格式,解决了现有技术中需要人工进行监管的低效问题,以及现有OCR识别中难以确保所识别的字符是否能正确反映待监管属性的准确性问题,因此可以以更高效和准确的方式来提取和存储这些与经营相关的数据。
附图说明
本发明申请的附图是为了提供实施例的图示说明而不是为了限制实施例,在图中相似的附图标记表示相似的元素。
图1是根据本公开一些实施例的图像识别的处理方法的流程图。
图2是根据本公开一些实施例的移动终端的框图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
如图1所示,在步骤S101中先从目标地址以图像形式提取目标数据。目标地址对应于待监管的网络经营主体,例如各类网上商家,在Internet或者特定网络平台上的地址。目标数据对应于可能包含待监管的特定信息的载体,例如商品库存信息,价格信息,日期信息,销售信息,地址信息,营业执照信息等。由于目标数据在目标地址中所呈现的格式、版本和加密方法可能各不相同,出于效率考虑优选以图像形式对目标数据进行提取。所提取的图像形式的目标数据可根据与预先保存的模板对比来首先进行对齐。可以在目标数据中根据相对于图像中心或者边缘等的位置关系来预先定义多个预设的区域,优选是这些区域相互之间具有足够的间隔。每个区域中可以根据其像素的分布特征,如颜色分布,亮度分布,灰度梯度分布,特征矩阵等,分布于模板中的对应区域进行对比,从而得到目标数据相对于模板的坐标变换矩阵。根据所得到的坐标变化矩阵可以将目标数据旋转至与模板所定义的标准方向对齐,从而在图像中的文字方向并非沿屏幕的长度或宽度方向时先进行旋转对齐以减低后续处理误差,同时能够确保目标数据的坐标系与模板一致以便于后续字符识别时的坐标位置确定。优选地还可以对旋转对齐后的目标数据进行二值化,以将目标数据准备为便于识别的初始状态。
在步骤S102中,优选从二值化后的目标数据中识别图中所包含的字符串。二值化之后的字符将具有相对于原图中的背景的明显的区别,便于更高效地从图中识别字符。当然,也可以仅仅调整目标数据的对比度,亮度,色温等或者进行锐化等处理,再从图中识别字符。在对二值化目标数据进行OCR扫描后,将可以提取多个字符串。字符串的定义可以是在一定间隔阈值之内相互邻接的多个汉字、字符、数字、符号等,而间隔大于间隔阈值的字符将被判定为属于另一个字符串,每个字符串可以仅包括一个所识别的字符。每个字符串在目标数据的坐标系中的坐标位置也将被同时提取,例如字符串首位字符的坐标、末位字符的坐标,中间位置的坐标等。
在步骤S103中,将所识别的字符串分别两个部分,其中第一部分仅包含汉字字符而第二部分仅包含字母或数字字符。如果所识别的字符串同时包括汉字字符以及字母或数字字符,则将所识别的字符串分割为汉字部分以及字母或数字部分。可以参考标定符合类字符的位置来帮助对汉字字符以及字母或数字字符进行分割。还可以使用边界检测、语义辨认来帮助对字符串进行分割以进一步减少错误。在监管过程中,汉字类字符表示的是属性的种类,例如公司名称,姓名,商品名称,商品类目,地址等,而字母或数字字符则表示该种类属性的数值内容,例如电话号码,日期,识别码,数量,金额等。网络监管所需的仅为其中的一个或多个属性而不是全部,因此应通过对字符串内容的分类来提取监管所需的属性及其关联的数值内容。
在步骤S104中,查找预先保存的属性表将第一部分字符串分为多个预设类别。预先保存的属性表可以根据监管策略保护一种或多个特定属性,例如名称、地址、信用代码等的各种可能出现的形式,并从第一部分字符串中查找与某一特定属性的所有可能出现的形式相似的字符串,将其归入该属性所对应的预设类别中。如果没有查找到任何与某一特定属性对应的第一部分的字符串,则该属性所对应的预设类别可判断为不存在相应的记录。在多个预设类别中存在未找到对应的第一部分的字符串的类别时,可以提示出错,并且回到步骤S101中,重新进行目标数据的提取。
在步骤S105中,对第二部分的字符串设置权重以便确定第二部分的字符串所包含的数值内容对应于哪一个第一部分字符串所体现的预设类别。权重应根据第二部分字符串的坐标位置距离步骤S104中所分类的预设类别对应的字符串的坐标位置的距离来确定。可定义一个从第二部分字符串的坐标位置指向预设类别对应的字符串的坐标位置的位移矢量,权重应随着该位移矢量的绝对值也就是长度的增加而减小。例如,对应于预设类别“人民币”的数值内容为金额,金额的数值范围并不确定,但从位置邻接于该预设类别字符串的四周发现金额的可能性要大于更远的位置的可能性。此外对于位移矢量的长度超出一定限制的第二部分字符串可以将权重减为零。权重还应根据第二部分字符串的长度与预设劣势的字符串的长度对比来确定,该长度既可以是字符串坐标位置所体现的一段长度范围,也可以是字符串所包含的字符的数量。在预先保存的属性表中,每个预设类别的数值内容一般具有确定范围之内的长度甚至是确定的格式。根据字符串长度的对比,可以进一步判断第二部分字符串是否对应于其附近的第一部分字符串。例如预设类别“年”所对应的字符串长度为2或4位,更多或更少位数的字符串对应该预设类别的权重将被降低。第二部分的字符串所赋予的权重将根据字符串长度与预设类别的字符串所对应的长度的区别变化,区别大则减小权重。最后,权重还应根据第二部分字符串的校验和来确定,检验和是将第二字符串中的一个或多个字符中的每一个与预先设定的固定数值相乘并将相乘后的结果相加得到的。该固定数值优选在预先保存的属性表中,按照“预设类别”,“预设类别对应的长度范围”,“用于计算检验和的固定数值”的顺序依次保存。例如,对于信用代码等该检验和通过求余运算来判断是否属于正确的代码,或者对于年份信息和价格信息,则对其个十百千位分别乘以对应的数量级并相加来确定是否属于正确的日期或价格范围。在从属性表中读取“预设类别”后,首先对其附件坐标位置的第二部分字符串赋予权重进行初筛,如果结果不唯一则之后读取“预设类别对应的长度范围”并赋予权重进一步筛选,如果结果仍不唯一则最后读取“用于计算检验和的固定数值”并进行校验。这样可以进一步提高本实施例方法的自动批量处理效率。此后,将权重最高也就是经过上述步骤后剩下的一个第二部分的字符串与预设类别的第一部分的字符串相关联,确定该第二部分的字符串所反映的是该第一部分的字符串的属性的内容。
在步骤S106中,将每个预设类别的字符串与其所关联的第二部分的字符串一起进行存储。可以以自动方式遍历待监管的网络地址或者对网络平台进行登录,并执行上述步骤S101-S105,所得到的结果均在步骤S106中保存在存储器之中并输出为包含可编辑格式的预设类别及其数值属性。输出包括在显示器上显示每个预设类别字符串与其所关联的第二部分的字符串。后续操作者将可以根据所保存的可编辑格式的信息以及显示的信息来判断网络经营主体的经营状况是否正常。
以上方法步骤S101-S106可以以计算机可读指令的形式存储于计算机可读介质,诸如光盘,闪存,硬盘,存储云,RAM,ROM等之中,并且由各种类型的固定或者便携式计算机读取并执行以实施该方法步骤。
图2公开了根据一些实施例的移动终端200。移动终端200可以是掌上计算机,智能电话,平板计算机,可穿戴智能设备,笔记本计算机等各类便携设备。终端设备移动终端200应包括处理器201,处理器201可以是任何专业或者通用的微处理器,处理芯片,逻辑单元,控制器,片上系统等。移动终端200还包括存储器203,存储器203可以是易失性或者非易失性的存储装置或其组合,并且用来存储体现图1中方法步骤S101-S106的计算机程序211。存储器203中还应包括诸如各类操作系统的系统程序212以及计算机程序211和系统程序212所产生或使用的存储数据213。移动终端200还可以包括显示器205以用于显示所输出的结构。移动终端200还可以包括用户接口207例如触摸屏、按键、轨迹球、姿势识别摄像头、键盘、鼠标等以用于用户输入。移动终端200还可以包括收发器209以用于与Internet或者其上的其他移动或固定终端进行通信以实现数据的传输。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (8)

1.一种用于网络图像识别的处理方法,其特征在于包括如下步骤:
从目标地址以图像形式提取目标数据;
通过将所述目标数据的多个预设区域中像素值的分布特征与预先保存的模板对比来旋转所述目标数据;
将旋转后的所述目标数据二值化;
从二值化的所述目标数据中识别多个字符串及其在所述目标数据中的坐标位置;
将所述多个字符串分为第一部分和第二部分,所述第一部分仅包含汉字字符而所述第二部分仅包含字母或数字字符;
查找预先保存的属性表将所述第一部分字符串分为多个预设类别;
根据所述第二部分的字符串的坐标位置距离每个预设类别的字符串的坐标位置的位移矢量,长度与所述预设类别的字符串的长度的对比以及字符串之中一个或多个字符的校验和来对所述第二部分的字符串赋予权重,从而将每个预设类别的字符串与所述第二部分的字符串之中权重最高的一个进行关联;以及
存储和显示每个预设类别的字符串以及其所关联的一个第二部分的字符串。
2.权利要求1所述的方法,其特征在于所述权重随着所述位移矢量的绝对值增加而减小。
3.权利要求2所述的方法,其特征在于所述权重随着所述第二部分的字符串的长度与所述预设类别的字符串的区别增大而减小。
4.权利要求3所述的方法,其特征在于所述校验和为所述一个或多个字符中的每个与预先设定的固定数值的乘积之和。
5.权利要求4所述的方法,其特征在于所述一个或多个字符的数量小于所述第二部分的字符串所包含的字符数量。
6.权利要求5所述的方法,其特征在于还包括根据所述权重的大小从所述第二部分的字符串中去除一个或更多的字符。
7.一种计算机可读存储介质,其具有存储于其上的计算机可读指令,其特征在于所述计算机可读指令在被处理器执行时实现权利要求1-6中任一项所述的方法。
8.一种移动终端,包括处理器和存储器,所述存储器中存储有所述处理器可执行的计算机程序,其特征在于所述计算机程序在被所述处理器执行时实现权利要求1-6中任一项所述的方法。
CN201910886439.1A 2019-09-19 2019-09-19 网络图像识别处理方法,计算机可读存储介质和移动终端 Active CN110717483B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910886439.1A CN110717483B (zh) 2019-09-19 2019-09-19 网络图像识别处理方法,计算机可读存储介质和移动终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910886439.1A CN110717483B (zh) 2019-09-19 2019-09-19 网络图像识别处理方法,计算机可读存储介质和移动终端

Publications (2)

Publication Number Publication Date
CN110717483A CN110717483A (zh) 2020-01-21
CN110717483B true CN110717483B (zh) 2023-04-18

Family

ID=69209942

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910886439.1A Active CN110717483B (zh) 2019-09-19 2019-09-19 网络图像识别处理方法,计算机可读存储介质和移动终端

Country Status (1)

Country Link
CN (1) CN110717483B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006350964A (ja) * 2005-06-20 2006-12-28 Sharp Corp 文字認識装置、文字認識方法、データ変換装置、データ変換方法、文字認識プログラム、データ変換プログラム、並びに文字認識プログラムおよびデータ変換プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2008287493A (ja) * 2007-05-17 2008-11-27 Nippon Telegr & Teleph Corp <Ntt> 文書群組合せ装置、文書分類方法、プログラムおよび記録媒体
JP2016170677A (ja) * 2015-03-13 2016-09-23 オムロン株式会社 文書画像処理用のプログラムおよびこのプログラムを用いた画像処理装置ならびに文字認識装置
CN106033416A (zh) * 2015-03-09 2016-10-19 阿里巴巴集团控股有限公司 一种字符串处理方法及装置
CN107239784A (zh) * 2017-07-03 2017-10-10 福建中金在线信息科技有限公司 一种图片识别方法、装置、电子设备及可读存储介质
JP2018124384A (ja) * 2017-01-31 2018-08-09 京セラドキュメントソリューションズ株式会社 情報処理装置、情報処理方法
JP2019040467A (ja) * 2017-08-25 2019-03-14 キヤノン株式会社 画像処理装置およびその制御方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5699570B2 (ja) * 2010-11-30 2015-04-15 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
TWI607387B (zh) * 2016-11-25 2017-12-01 財團法人工業技術研究院 字符辨識系統及其字符辨識方法
US10679089B2 (en) * 2016-12-30 2020-06-09 Business Imaging Systems, Inc. Systems and methods for optical character recognition

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006350964A (ja) * 2005-06-20 2006-12-28 Sharp Corp 文字認識装置、文字認識方法、データ変換装置、データ変換方法、文字認識プログラム、データ変換プログラム、並びに文字認識プログラムおよびデータ変換プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2008287493A (ja) * 2007-05-17 2008-11-27 Nippon Telegr & Teleph Corp <Ntt> 文書群組合せ装置、文書分類方法、プログラムおよび記録媒体
CN106033416A (zh) * 2015-03-09 2016-10-19 阿里巴巴集团控股有限公司 一种字符串处理方法及装置
JP2016170677A (ja) * 2015-03-13 2016-09-23 オムロン株式会社 文書画像処理用のプログラムおよびこのプログラムを用いた画像処理装置ならびに文字認識装置
JP2018124384A (ja) * 2017-01-31 2018-08-09 京セラドキュメントソリューションズ株式会社 情報処理装置、情報処理方法
CN107239784A (zh) * 2017-07-03 2017-10-10 福建中金在线信息科技有限公司 一种图片识别方法、装置、电子设备及可读存储介质
JP2019040467A (ja) * 2017-08-25 2019-03-14 キヤノン株式会社 画像処理装置およびその制御方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A Study on Caption Recognition for Multi-color Characters on Complex Background;Yutaka Katsuyama等;《2012 IEEE International Symposium on Multimedia,10-12 December 2012,Irvine, CA, USA》;全文 *
光学识别技术在病案数字图像归档工作中的应用;李阳;《中国病案》;全文 *

Also Published As

Publication number Publication date
CN110717483A (zh) 2020-01-21

Similar Documents

Publication Publication Date Title
US11450125B2 (en) Methods and systems for automated table detection within documents
CN111275880B (zh) 票据识别方法、装置、设备和存储介质
CN108520196B (zh) 奢侈品辨别方法、电子装置及存储介质
US9027833B2 (en) Commodity information display apparatus and method for displaying commodity information in different forms
US20170323170A1 (en) Method and system for data extraction from images of semi-structured documents
US20170337443A1 (en) Location based optical character recognition (ocr)
US10706658B2 (en) Vending machine recognition apparatus, vending machine recognition method, and recording medium
US20190043033A1 (en) Point-of-sale terminal
JP6579456B1 (ja) 検索対象情報絞込システム
KR102282025B1 (ko) 컴퓨터를 이용한 문서 분류 및 문자 추출 방법
JP6651169B2 (ja) 陳列状況判定システム
JP7449505B2 (ja) 情報処理システム
CN110688995B (zh) 地图查询的处理方法,计算机可读存储介质和移动终端
CN110717483B (zh) 网络图像识别处理方法,计算机可读存储介质和移动终端
CN112287936A (zh) 光学字符识别测试方法、装置、可读存储介质及终端设备
CN105469028B (zh) 信息处理装置及信息处理方法
CN111428725A (zh) 数据结构化处理方法、装置和电子设备
JP2020009466A (ja) 陳列状況判定システム
CN112149402B (zh) 文档对比方法、装置、电子设备和计算机可读存储介质
JP7343115B1 (ja) 情報処理システム
JP2020166811A (ja) 文書フォームの識別
WO2023171132A1 (ja) 情報処理システム
CN116758576B (zh) 基于机器学习的营销信息识别方法、装置、设备和介质
CN113435331B (zh) 图像文字识别方法、系统、电子设备及存储介质
CN115424272A (zh) 一种电子投标文件检测方法、装置、计算机设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant