CN112966681B - 商品拍照智能识别建档检索的方法、设备及存储介质 - Google Patents
商品拍照智能识别建档检索的方法、设备及存储介质 Download PDFInfo
- Publication number
- CN112966681B CN112966681B CN202110393113.2A CN202110393113A CN112966681B CN 112966681 B CN112966681 B CN 112966681B CN 202110393113 A CN202110393113 A CN 202110393113A CN 112966681 B CN112966681 B CN 112966681B
- Authority
- CN
- China
- Prior art keywords
- commodity
- information
- character
- retrieval
- filing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开了一种商品拍照智能识别建档检索的方法、设备及存储介质,该方法包括以下步骤:获取商品标签图片;将所述商品标签图片的大小压缩至预设值并上传至服务器;对压缩后的商品标签图片进行识别,提取压缩后的商品标签图片的文字识别信息;对所述文字识别信息的商品属性进行提取并保存至数据库。本发明解决商品信息录入麻烦、检索速度慢且不准确的痛点,实现了“一拍即建档,一拍即检索”快速且精准的建档及检索。
Description
技术领域
本发明涉及信息处理领域,尤其涉及一种商品拍照智能识别建档检索的方法、设备及存储介质。
背景技术
现有技术中一般是通过在商品建档页面手工录入商品名称、货号及价格等信息,或拍照上传商品图片,后续检索查找时根据人工比对图片找出对应的商品,或以图搜图来检索商品,该方法是基于整个商品图片,商品图片特征过于复杂,检索不精准,重新拍照后的图片只能检索出相似商品。对于一次到货几百个SKU(库存保有单位即库存进出计量的单位,可以是以件、盒、托盘等为单位,SKU是物理上不可分割的最小存货单元。在使用时要根据不同业态,不同管理模式来处理)的批发商家场景无法满足快速及精准的建档及检索的需求。
发明内容
有鉴于此,本申请实施例提供一种商品拍照智能识别建档检索的方法、设备及存储介质,解决商品信息录入麻烦、检索速度慢且不准确的痛点,实现了“一拍即建档,一拍即检索”快速且精准的建档及检索。
本申请实施例提供了一种商品拍照智能识别建档检索的方法,所述方法包括:
获取商品标签图片;
将所述商品标签图片的大小压缩至预设值并上传至服务器;
对压缩后的商品标签图片进行识别,提取压缩后的商品标签图片的文字识别信息;
对所述文字识别信息的商品属性进行提取并保存至数据库。
在一实施例中,所述对压缩后的商品标签图片进行识别,提取压缩后的商品标签图片的文字识别信息,包括:
将压缩后的商品标签图片进行预处理,生成预处理结果;
利用光学字符识别技术,将所述预处理结果转化为文字检测结果;
对所述文字检测结果执行文字边缘检测矫正,获得文字边缘检测矫正结果;
利用预设分类器,对所述文字边缘检测矫正结果进行字符分类,获得所述文字识别信息。
在一实施例中,所述利用预设分类器,对所述文字边缘检测矫正结果进行分类,获得所述文字识别信息的步骤之后,还包括:
基于信息修正模型,对所述文字识别信息进行修正。
在一实施例中,所述基于信息修正模型,对所述文字识别信息进行修正,包括
构建商品信息语料库;
利用所述商品信息语料库对神经网络模型进行训练,生成所述信息修正模型;
将所述文字识别信息输入所述信息修正模型;
利用所述信息修正模型,将所述文字识别信息根据所述商品属性进行提取并分类,并输出所述文字识别信息每个分类的预测结果;
将所述每个分类的预测结果进行汇总,完成所述文字识别信息的修正。
在一实施例中,所述构建商品信息语料库,包括:
获取商品信息;
将所述商品信息根据所述商品属性进行提取并分类,生成所述商品信息语料库;其中,每个分类对应一个商品属性。
在一实施例中,所述预处理至少包括灰度化操作、降噪操作、二值化操作、字符切分操作以及归一化操作。
在一实施例中,所述商品属性至少包括商品编码、商品名称、商品品牌以及商品价格。
在一实施例中,所述方法,还包括:
获取待检索的商品标签图片中的待检索文字识别信息;
根据所述文字识别信息中的预设商品属性在所述数据库中进行检索并输出检索结果。
为了实现上述目的,还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有商品拍照智能识别建档检索的方法,所述商品拍照智能识别建档检索的方法程序被处理器执行时实现上述任一所述的商品拍照智能识别建档检索的方法的步骤。
为了实现上述目的,还提供一种商品拍照智能识别建档检索设备,包括存储器,处理器及存储在所述存储器上并可在所述处理器上运行的商品拍照智能识别建档检索的方法程序,所述处理器执行所述商品拍照智能识别建档检索的方法程序时实现上述任一所述的商品拍照智能识别建档检索的方法的步骤。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
获取商品标签图片;通过商品标签相关信息进行建档及检索,由于商品标签在同种商品中的相对唯一性,使商品建档及检索更加的准确。
将所述商品标签图片的大小压缩至预设值并上传至服务器;通过预设值的设置,在不影响识别效果的基础上,经过压缩处理后,大大提高上传速度,为快速建档或者检索提供条件。
对压缩后的商品标签图片进行识别,提取压缩后的商品标签图片的文字识别信息;通过预设识别技术提取商品标签图片中的文字信息,保证文字信息识别的正确性,从而保证商品建档的正确性。
对所述文字识别信息的商品属性进行提取并保存至数据库。通过文字信息建档,以文字进行检索提高检索的精准度。
本发明解决了批发商家货品繁杂、周转快而过程中录入信息麻烦的痛点,极大地减低了批发商实现商品信息化管理的成本,提升了批发商经营效益;满足了快速及精准的建档及检索的需求;实现了一拍即建档,一拍即检索的技术效果。
附图说明
图1为本申请商品拍照智能识别建档检索的方法的第一实施例的流程示意图;
图2为本申请商品建档过程示意图;
图3为本申请商品拍照智能识别建档检索的方法第一实施例中步骤S130的具体实施步骤;
图4为本申请商品拍照智能识别建档检索的方法第一实施例中步骤S130的另一具体实施步骤;
图5为本申请商品拍照智能识别建档检索的方法中的文字识别过程示意图;
图6为本申请商品拍照智能识别建档检索的方法步骤S136-1的具体实施步骤;
图7为本申请商品拍照智能识别建档检索的方法步骤S135-1-1的具体实施步骤;
图8为本申请商品拍照智能识别建档检索的方法第二实施例的流程示意图;
图9为本申请商品检索过程示意图;
图10为本申请商品拍照智能识别建档并检索与销售结合的过程示意图;
图11为本申请实施例中涉及的商品拍照智能识别建档检索设备的硬件架构示意图。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:获取商品标签图片;将所述商品标签图片的大小压缩至预设值并上传至服务器;对压缩后的商品标签图片进行识别,提取压缩后的商品标签图片的文字识别信息;对所述文字识别信息的商品属性进行提取并保存至数据库。本发明商品信息录入麻烦、检索速度慢且不准确的痛点,实现了“一拍即建档,一拍即检索”快速且精准的建档及检索。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
参照图1,图1为本申请商品拍照智能识别建档检索的方法的第一实施例,所述方法包括:
步骤S110:获取商品标签图片。
具体地,所述商品标签图片可以通过移动终端的摄像头进行拍摄获取。所述移动终端可以包括移动手机、笔记本、平板电脑等具有拍摄功能及通信功能的终端。
具体地,商品标签可以是实物标签,用于标明物品的品名、重量、体积、价格、用途等信息的简要标牌。有传统的印刷标签和现代条码打印标签。商品标签在同种商品中具有相对唯一性,即同种商品的商品标签可以相同(比如特定颜色的同一款衣服或者特定尺码的同一款衣服或者特定颜色且特定尺码的同一款衣服的商品标签是一样的),同种商品的商品标签与其他种类的商品的商品标签具有区别。
适用范围包括但不限于:
包装:唛头标签、邮政包裹、信件包装、运输货物标示、信封地址标签。
电器:手机内部标签、各种电器标签、笔记本电脑标签、机电产品标签。
商品:价格标签、产品说明标签、货架标签、条码标签、药品标签。
管理:图书标签、车检标签、安检标签、财产标签。
办公:文件公文标签、档案保存标签、各种物品及文具标签。
生产:原材料标示、加工产品标示、成品标签、库存管理标签。
化工:油漆材料标示、汽油机油产品包装标示及各种特殊溶剂产品的标示。
珠宝:珠宝首饰吊牌标签、不易粘贴于商品的吊牌标签。
服装:服装吊牌(即各种服装上吊挂的牌子,包含一些服装材质,洗涤注意事项等信息。从质地上看,吊牌的制作材料大多为纸质,也有塑料的、金属的。从它的造型上看,则更是多种多样的:有长条形的,对折形的,圆形的,三角形的,插袋式的以及其它特殊造型的)、水洗唛标签(水洗标)。
机场:登机牌、行李标签。
车票:火车票、长途汽车票。
食品:酒类标签、食品标识。
其他:停车场票、高速公路收费票、防伪标签、加密标签、防盗标签等。
步骤S120:将所述商品标签图片的大小压缩至预设值并上传至服务器。
具体地,压缩是一种通过特定的算法来减小计算机文件大小的机制,压缩(compression)可以减少数据大小以节省保存空间和传输的时间。在本实施例中,将商品标签的图片大小进行压缩后,会大大提高上传的速度。其中,所述预设值可以为800*800,也可以是其他的值,在此不作限定,可以根据需求动态调整;但所述预设值需要满足正确识别文字信息的要求,并不是随意设置。
需要另外说明的是,服务器可以布置在移动本地,也可以在云端,在此并不限定,根据业务需求动态调整。
步骤S130:对压缩后的商品标签图片进行识别,提取压缩后的商品标签图片的文字识别信息。
具体地,基于预设识别技术进行文字识别,可以是OCR(Optical CharacterRecognition,光学字符识别),也可以是基于神经网络的文字识别方法,包括但不限于CNN(循环神经网络)+RNN(递归神经网络)+CTC(Connectionist Temporal Classification)、CNN(循环神经网络)+Seq2Seq(序列到序列模型)+Attention(注意力机制)等,其他基于神经网络的文字识别方法也同样使用,在此并不作限定。
步骤S140:对所述文字识别信息的商品属性进行提取并保存至数据库。
具体地,商品属性可以包括但并不限定于商品编码、商品名称、商品品牌以及商品价格。
具体地,数据库可以是“按照数据结构来组织、存储和管理数据的仓库”。是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。数据库可以是关系数据库,包括Mysql,SqlServer,Oracle Server等。
需要另外说明的是,所述数据库可以保存在服务器端,也可以部署在移动终端本地。
具体可以参照图2为商品建档过程示意图。
在上述实施例中,存在的有益效果为:获取商品标签图片;通过商品标签相关信息进行建档及检索,由于商品标签在同种商品中的相对唯一性,使商品建档及检索更加的准确。
将所述商品标签图片的大小压缩至预设值并上传至服务器;通过预设值的设置,在不影响识别效果的基础上,经过压缩处理后,大大提高上传速度,为快速建档或者检索提供条件。
对压缩后的商品标签图片进行识别,提取压缩后的商品标签图片的文字识别信息;通过预设识别技术提取商品标签图片中的文字信息,保证文字信息识别的正确性,从而保证商品建档的正确性。
对所述文字识别信息的商品属性进行提取并保存至数据库。通过文字信息建档,以文字进行检索提高检索的精准度。
本发明解决了批发商家货品繁杂、周转快而过程中录入信息麻烦的痛点,极大地减低了批发商实现商品信息化管理的成本,提升了批发商经营效益;满足了快速及精准的建档及检索的需求;实现了一拍即建档,一拍即检索的技术效果。
参照图3,图3为本申请商品拍照智能识别建档检索的方法第一实施例中步骤S130的具体实施步骤,所述对压缩后的商品标签图片进行识别,提取压缩后的商品标签图片的文字识别信息,包括:
步骤S131:将压缩后的商品标签图片进行预处理,生成预处理结果。
具体地,预处理可以是对商品标签图片预先进行处理的操作,预处理属于准备过程,将商品标签图片根据相应规则处理成为统一标准,包括但并不限于灰度化操作、降噪操作、二值化操作、字符切分操作以及归一化操作。
步骤S132:利用光学字符识别技术,将所述预处理结果转化为文字检测结果。
具体地,OCR(Optical Character Recognition,光学字符识别):电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供处理软件进一步编辑加工的技术。
步骤S133:对所述文字检测结果执行文字边缘检测矫正,获得文字边缘检测矫正结果。
具体地,文字边缘检测矫正可以是对检测到的文字边缘进行矫正,可以使文字检测结果更加正确。
步骤S134:利用预设分类器,对所述文字边缘检测矫正结果进行字符分类,获得所述文字识别信息。
具体地,预设分类器是对样本进行分类的方法的统称,包含但不限于最近邻分类器、朴素贝叶斯分类器、决策树、逻辑回归、神经网络等算法。使用预设分类器可以将所述文字边缘检测矫正结果中的每个字符对应属于哪个字符分类进行识别,最终获得文字识别信息。
可以参照图5为商品拍照智能识别建档检索的方法中文字识别过程示意图。
在上述实施例中,通过光学字符识别技术可以将商品标签中的文字信息正确的识别出来,从而保证商品建档的正确性。
参照图4,图4为本申请商品拍照智能识别建档检索的方法第一实施例中步骤S130的另一具体实施步骤,所述利用预设分类器,对所述文字边缘检测矫正结果进行分类,获得所述文字识别信息的步骤之后,还包括:
步骤S131-1:将压缩后的商品标签图片进行预处理,生成预处理结果。
步骤S132-1:利用光学字符识别技术,将所述预处理结果转化为文字检测结果。
步骤S133-1:对所述文字检测结果执行文字边缘检测矫正,获得文字边缘检测矫正结果。
步骤S134-1:利用预设分类器,对所述文字边缘检测矫正结果进行字符分类,获得所述文字识别信息。
步骤S135-1:基于信息修正模型,对所述文字识别信息进行修正。
具体地,信息修正模型可以将对形近字识别错误进行修正,比如“聚酯纤维”识别成为“聚醋纤维”,“卡其色”识别为“卡具色”等。其中,形近字可以是字形结构相近的字,形近字识别错误会导致文字识别信息的语义错误。
上述实施例中,另包括步骤S135-1,其他步骤已经进行了阐述,在此不再赘述。
可以参照图5为商品拍照智能识别建档检索的方法中文字识别过程示意图。
在上述实施例中,存在的有益效果为:在利用光学字符识别技术的基础上,基于信息修正模型对识别错误的情况进行修正,以进一步提高文字识别信息的正确性,从而保证商品建档的正确性,也同时保证在进行商品检索时的正确性。
参照图6,图6为本申请商品拍照智能识别建档检索的方法步骤S136-1的具体实施步骤,所述基于信息修正模型,对所述文字识别信息进行修正,包括
步骤S135-1-1:构建商品信息语料库。
具体地,商品信息语料库可以是预设商品对应的信息组成的语料库,每一类预设商品构建一个相应的商品信息语料库。
步骤S135-1-2:利用所述商品信息语料库对神经网络模型进行训练,生成所述信息修正模型。
具体地,可以利用所述商品信息语料库针对性的对信息修正模型进行训练,以提取每一类预设商品信息的特征,从而保证修正具有针对性,以更好的对文字识别信息进行修正。
步骤S135-1-3:将所述文字识别信息输入所述信息修正模型。
具体地,将所述文字识别信息作为所述信息修正模型的输入。
步骤S135-1-4:利用所述信息修正模型,将所述文字识别信息根据所述商品属性进行提取并分类,并输出所述文字识别信息每个分类的预测结果。
具体地,商品属性可以根据预设商品标签信息进行调整,并不限定于本申请中的举例;预测结果是信息修正模型的输出。
步骤S135-1-5:将所述每个分类的预测结果进行汇总,完成所述文字识别信息的修正。
具体地,将每个分类的预测结果按照预设提取规则的顺序进行汇总,从而完成文字识别信息的修正。
上述实施例中,存在的有益效果为:经过信息修正模型的修正,提高文字识别信息的正确性,从而保证商品建档的准确性。
参照图7,图7为本申请商品拍照智能识别建档检索的方法步骤S135-1-1的具体实施步骤,所述构建商品信息语料库,包括:
步骤S135-1-1-1:获取商品信息。
具体地,所述商品信息可以是有关商品的文字信息,可以从商品的标签、商品的说明书、商品的使用手册中获得;数据量越大,使用所述商品信息语料库训练的信息修正模型效果会更好,在本实施例中,商品信息获取基于大数据量,所述商品信息语料库的大小至少为3G,但并不限定于该数量级,根据需求动态调整。
步骤S135-1-1-2:将所述商品信息根据所述商品属性进行提取并分类,生成所述商品信息语料库;其中,每个分类对应一个商品属性。
具体地,在本实施例中以服装进行举例,在服装标签中,将标签中的信息按照货号、颜色、规格、成份、执行标准、安全技术标准、产地以及零售价进行分类提取。
在上述实施例中,存在的有益效果为:保证商品信息语料库的构建质量,从而保证信息修正模型训练的效果,以提高文字识别的正确性。
在其中一个实施例中,所述预处理至少包括灰度化操作、降噪操作、二值化操作、字符切分操作以及归一化操作。
具体地,灰度化操作:在RGB模型中,如果R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫灰度值,因此,灰度图像每个像素只需一个字节存放灰度值(又称强度值、亮度值),灰度范围为0-255。
降噪操作(Image Denoising)是指减少数字图像中噪声的过程。降噪在这个阶段非常重要,降噪算法的好坏对特征提取的影响很大。
二值化操作就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果。
字符切分操作(character segmentation)是通过图像分析将文字行图像中不同字符分割开的过程。
归一化操作指对图像进行了一系列标准的处理变换,使之变换为一固定标准形式的过程,该标准图像称作归一化图像。
在上述实施例中,存在的有益效果为:经过预处理后的商品标签图片满足预设识别技术的标准且文字特征突出,可以顺利进行图像识别处理,进一步提高识别准确率。
在其中一个实施例中,所述商品属性至少包括商品编码、商品名称、商品品牌以及商品价格。
参照图8,图8为本申请商品拍照智能识别建档检索的方法的第二实施例,所述方法,包括:
步骤S210:获取商品标签图片。
步骤S220:将所述商品标签图片的大小压缩至预设值并上传至服务器。
步骤S230:对压缩后的商品标签图片进行识别,提取压缩后的商品标签图片的文字识别信息。
步骤S240:对所述文字识别信息的商品属性进行提取并保存至数据库。
步骤S250:获取待检索的商品标签图片中的待检索文字识别信息。
具体地,待检索的商品标签图片可以是用户当前需要了解商品相关信息的商品对应的标签图片;待检索文字识别信息的识别过程参照步骤S210至步骤S230。
步骤S260:根据所述待检索文字识别信息中的预设商品属性在所述数据库中进行检索并输出检索结果。
具体地,在本实施例中,可以根据服装标签中识别出来的货号进行检索。
具体参照图9为商品检索过程示意图。
需要另外说明的是,商品拍照智能识别并检索方法与移动终端的应用程序中的销售功能进行结合,即可以通过检索出来的结果加入到销售单中,执行开单操作,并同时更新数据库中的商品数量,以实时保证数据库中数据的正确性,减少用户的工作量,提高用户体验,具体可以参照图10,以识别服装吊牌为例;同时,也可以将商品快速检索方法与移动终端的应用程序中的查询功能进行结合,即可以通过检索出来的结果获得商品相关情况,以更好的了解库存情况及时调整,避免库存不足的情况发生,提高用户收益。
上述步骤中步骤S210、步骤S220、步骤S230以及步骤S240在本申请商品快速建档方法中已经进行了阐述,在此不再赘述。
上述实施例中,存在的有益效果为:通过压缩商品标签图片的大小可以提高上传的速度,利用识别出的文字信息在数据库中进行检索,提高识别的精确度,可以达到一拍即检索的技术效果。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有商品拍照智能识别建档检索的方法程序,所述商品拍照智能识别建档检索的方法程序被处理器执行时实现上述任一所述的商品拍照智能识别建档检索的方法的步骤。
本申请还提供一种商品拍照智能识别建档检索设备,包括存储器,处理器及存储在所述存储器上并可在所述处理器上运行的商品拍照智能识别建档检索的方法程序,所述处理器执行所述商品拍照智能识别建档检索的方法程序时实现上述任一所述的商品拍照智能识别建档检索的方法的步骤。
本申请涉及一种商品拍照智能识别建档检索设备010包括如图11所示:至少一个处理器012、存储器011。
处理器012可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器012中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器012可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器011,处理器012读取存储器011中的信息,结合其硬件完成上述方法的步骤。
可以理解,本发明实施例中的存储器011可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ReadOnly Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double DataRateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本发明实施例描述的系统和方法的存储器011旨在包括但不限于这些和任意其它适合类型的存储器。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (6)
1.一种商品拍照智能识别建档检索的方法,其特征在于,所述方法包括:
获取商品标签图片;
将所述商品标签图片的大小压缩至预设值并上传至服务器;
对压缩后的商品标签图片进行识别,提取压缩后的商品标签图片的文字识别信息,包括:将压缩后的商品标签图片进行预处理,生成预处理结果;利用光学字符识别技术,将所述预处理结果转化为文字检测结果;对所述文字检测结果执行文字边缘检测矫正,获得文字边缘检测矫正结果;利用预设分类器,对所述文字边缘检测矫正结果进行字符分类,获得所述文字识别信息;基于信息修正模型,对所述文字识别信息进行修正,包括:构建商品信息语料库;利用所述商品信息语料库对神经网络模型进行训练,生成所述信息修正模型;将所述文字识别信息输入所述信息修正模型;利用所述信息修正模型,将所述文字识别信息根据商品属性进行提取并分类,并输出所述文字识别信息每个分类的预测结果;将所述每个分类的预测结果进行汇总,完成所述文字识别信息的修正;
对所述文字识别信息的商品属性进行提取并保存至数据库;获取待检索的商品标签图片中的待检索文字识别信息;
根据所述待检索文字识别信息中的预设商品属性在所述数据库中进行检索并输出检索结果,将所述检索结果加入销售单中,执行开单操作,并同时更新数据库中商品的数量。
2.如权利要求1所述的商品拍照智能识别建档检索的方法,其特征在于,所述构建商品信息语料库,包括:
获取商品信息;
将所述商品信息根据所述商品属性进行提取并分类,生成所述商品信息语料库;其中,每个分类对应一个商品属性。
3.如权利要求1所述的商品拍照智能识别建档检索的方法,其特征在于,所述预处理至少包括灰度化操作、降噪操作、二值化操作、字符切分操作以及归一化操作。
4.如权利要求1所述的商品拍照智能识别建档检索的方法,其特征在于,所述商品属性至少包括商品编码、商品名称、商品品牌以及商品价格。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有商品拍照智能识别建档检索的方法程序,所述商品拍照智能识别建档检索的方法程序被处理器执行时实现权利要求1-4任一所述的商品拍照智能识别建档检索的方法的步骤。
6.一种商品拍照智能识别建档检索设备,其特征在于,包括存储器,处理器及存储在所述存储器上并可在所述处理器上运行的商品拍照智能识别建档检索的方法程序,所述处理器执行所述商品拍照智能识别建档检索的方法程序时实现权利要求1-4任一所述的商品拍照智能识别建档检索的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110393113.2A CN112966681B (zh) | 2021-04-12 | 2021-04-12 | 商品拍照智能识别建档检索的方法、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110393113.2A CN112966681B (zh) | 2021-04-12 | 2021-04-12 | 商品拍照智能识别建档检索的方法、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112966681A CN112966681A (zh) | 2021-06-15 |
CN112966681B true CN112966681B (zh) | 2022-05-10 |
Family
ID=76280235
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110393113.2A Active CN112966681B (zh) | 2021-04-12 | 2021-04-12 | 商品拍照智能识别建档检索的方法、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112966681B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113434710A (zh) * | 2021-06-29 | 2021-09-24 | 平安普惠企业管理有限公司 | 文档检索方法、装置、服务器以及存储介质 |
CN114495127A (zh) * | 2022-03-31 | 2022-05-13 | 来也科技(北京)有限公司 | 基于rpa和ai的商品信息处理方法、装置、设备和介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104077269A (zh) * | 2013-03-25 | 2014-10-01 | 三星电子株式会社 | 显示设备及其输出文本的方法 |
CN104239861A (zh) * | 2014-09-10 | 2014-12-24 | 深圳市易讯天空网络技术有限公司 | 卷曲文本图像预处理方法和彩票扫描识别方法 |
CN110210470A (zh) * | 2019-06-05 | 2019-09-06 | 复旦大学 | 商品信息图像识别系统 |
CN110490528A (zh) * | 2019-08-28 | 2019-11-22 | 武汉高达软件系统有限公司 | 一种仓库自动入库的算法及系统 |
CN111080406A (zh) * | 2019-12-04 | 2020-04-28 | 重庆锐云科技有限公司 | 一种基于拍照的商品价格智能查询系统及方法 |
CN111080399A (zh) * | 2019-11-22 | 2020-04-28 | 汉口北进出口服务有限公司 | 一种商品信息处理方法和装置 |
CN112308059A (zh) * | 2020-10-29 | 2021-02-02 | 中智关爱通(上海)科技股份有限公司 | 用于电子商务的商品信息翻译方法、系统和可读存储介质 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103761546A (zh) * | 2013-12-30 | 2014-04-30 | 武汉华工赛百数据系统有限公司 | 用于食品加工企业质量安全追溯的方法 |
CN104765891A (zh) * | 2015-05-06 | 2015-07-08 | 苏州搜客信息技术有限公司 | 一种基于图像的搜索购物方法 |
US20170004120A1 (en) * | 2015-06-30 | 2017-01-05 | Facebook, Inc. | Corrections for natural language processing |
CN106022805B (zh) * | 2016-05-25 | 2019-09-24 | 华中科技大学 | 一种基于标签识读的防伪溯源系统及方法 |
CN106096609B (zh) * | 2016-06-16 | 2019-03-19 | 武汉大学 | 一种基于ocr的商品查询关键字自动生成方法 |
CN107767156A (zh) * | 2016-08-17 | 2018-03-06 | 百度在线网络技术(北京)有限公司 | 一种信息录入方法、装置及系统 |
CN107861972B (zh) * | 2017-09-15 | 2022-02-22 | 广州唯品会研究院有限公司 | 一种用户录入商品信息后显示商品全结果的方法及设备 |
CN107862561A (zh) * | 2017-09-15 | 2018-03-30 | 广州唯品会研究院有限公司 | 一种基于图片属性提取建立用户兴趣库的方法及设备 |
CN108090801A (zh) * | 2017-11-29 | 2018-05-29 | 维沃移动通信有限公司 | 商品推荐方法、移动终端及服务器 |
CN108563782B (zh) * | 2018-04-25 | 2023-04-18 | 平安科技(深圳)有限公司 | 商品信息格式处理方法、装置、计算机设备和存储介质 |
CN109583439A (zh) * | 2018-12-04 | 2019-04-05 | 龙马智芯(珠海横琴)科技有限公司 | 文字校正的方法及装置、存储介质、处理器 |
CN109801138A (zh) * | 2019-01-21 | 2019-05-24 | 口碑(上海)信息技术有限公司 | 商品图片的搜索方法及装置 |
CN109886257B (zh) * | 2019-01-30 | 2022-10-18 | 四川长虹电器股份有限公司 | 一种ocr系统中采用深度学习矫正发票图片分割结果的方法 |
SG10201904825XA (en) * | 2019-05-28 | 2019-10-30 | Alibaba Group Holding Ltd | Automatic optical character recognition (ocr) correction |
CN110489457B (zh) * | 2019-07-19 | 2022-01-11 | 北京宜通华瑞科技有限公司 | 基于图像识别的商品信息分析方法、系统及存储介质 |
CN112445926B (zh) * | 2019-08-27 | 2024-02-27 | 阿里巴巴集团控股有限公司 | 一种图像检索方法以及装置 |
CN111539414B (zh) * | 2020-04-26 | 2023-05-23 | 梁华智能科技(上海)有限公司 | 一种ocr图像字符识别和字符校正的方法及系统 |
CN112380349A (zh) * | 2020-12-04 | 2021-02-19 | 有米科技股份有限公司 | 商品性别分类方法、装置及电子设备 |
-
2021
- 2021-04-12 CN CN202110393113.2A patent/CN112966681B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104077269A (zh) * | 2013-03-25 | 2014-10-01 | 三星电子株式会社 | 显示设备及其输出文本的方法 |
CN104239861A (zh) * | 2014-09-10 | 2014-12-24 | 深圳市易讯天空网络技术有限公司 | 卷曲文本图像预处理方法和彩票扫描识别方法 |
CN110210470A (zh) * | 2019-06-05 | 2019-09-06 | 复旦大学 | 商品信息图像识别系统 |
CN110490528A (zh) * | 2019-08-28 | 2019-11-22 | 武汉高达软件系统有限公司 | 一种仓库自动入库的算法及系统 |
CN111080399A (zh) * | 2019-11-22 | 2020-04-28 | 汉口北进出口服务有限公司 | 一种商品信息处理方法和装置 |
CN111080406A (zh) * | 2019-12-04 | 2020-04-28 | 重庆锐云科技有限公司 | 一种基于拍照的商品价格智能查询系统及方法 |
CN112308059A (zh) * | 2020-10-29 | 2021-02-02 | 中智关爱通(上海)科技股份有限公司 | 用于电子商务的商品信息翻译方法、系统和可读存储介质 |
Non-Patent Citations (4)
Title |
---|
"医学文本图像字符识别校正技术研究与应用";李琴等;《医学信息学杂志》;20181231;第39卷(第6期);第56-60页 * |
"基于OCR技术的变电站防误操作系统";华伟等;《电力信息与通信技术》;20171231;第15卷(第4期);第70-75页 * |
"基于机器翻译模型的汉语近音错别字校对方法研究";薛鑫;《中国优秀硕士学位论文全文数据库 信息科技辑》;20180715(第7期);正文第41页第4.2节 * |
"面向油田领域的中文真词错误自动校对方法研究";王辉等;《计算技术与自动化》;20210331;第40卷(第1期);第141页第2节 * |
Also Published As
Publication number | Publication date |
---|---|
CN112966681A (zh) | 2021-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wei et al. | Deep learning for retail product recognition: Challenges and techniques | |
CN107016387B (zh) | 一种识别标签的方法及装置 | |
CN107748754B (zh) | 一种知识图谱完善方法和装置 | |
CN112966681B (zh) | 商品拍照智能识别建档检索的方法、设备及存储介质 | |
Meier et al. | Fully convolutional neural networks for newspaper article segmentation | |
US11941581B2 (en) | System and method for classifier training and retrieval from classifier database for large scale product identification | |
KR102124568B1 (ko) | 인공지능과 빅데이터를 이용한 이미지 인식 기반 무인 결제 시스템 | |
CN102930264A (zh) | 基于图像识别技术的商品陈列信息采集分析系统及方法 | |
CN109635705B (zh) | 一种基于二维码和深度学习的商品识别方法及装置 | |
CN111582913B (zh) | 一种广告推荐方法及装置 | |
CN113963147B (zh) | 一种基于语义分割的关键信息提取方法及系统 | |
CN111784372A (zh) | 门店商品推荐方法及设备 | |
US20210019511A1 (en) | Systems and methods for extracting data from an image | |
CN114783584A (zh) | 一种药品随货同行单的录单方法及装置 | |
Raoui-Outach et al. | Deep Learning for automatic sale receipt understanding | |
CN111612000A (zh) | 一种商品分类方法、装置、电子设备及存储介质 | |
CN117115571A (zh) | 一种细粒度智能商品识别方法、装置、设备及介质 | |
CN117275011B (zh) | 一种商品识别与商品价签匹配方法、系统、终端及介质 | |
CN111414917B (zh) | 一种低像素密度文本的识别方法 | |
CN113780116A (zh) | 发票分类方法、装置、计算机设备和存储介质 | |
Liu et al. | A novel SVM network using HOG feature for prohibition traffic sign recognition | |
CN111178464A (zh) | 一种基于神经网络的ocr识别在物流行业快递面单的应用 | |
Liu et al. | A study on the design and implementation of an improved AdaBoost optimization mathematical algorithm based on recognition of packaging bottles | |
Barla et al. | Old fashioned state-of-the-art image classification | |
Merrad et al. | A Real-time Mobile Notification System for Inventory Stock out Detection using SIFT and RANSAC. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |