CN113076439A - 一种基于垃圾识别的垃圾分类系统和方法 - Google Patents

一种基于垃圾识别的垃圾分类系统和方法 Download PDF

Info

Publication number
CN113076439A
CN113076439A CN202110282547.5A CN202110282547A CN113076439A CN 113076439 A CN113076439 A CN 113076439A CN 202110282547 A CN202110282547 A CN 202110282547A CN 113076439 A CN113076439 A CN 113076439A
Authority
CN
China
Prior art keywords
garbage
image
image data
library
semantic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110282547.5A
Other languages
English (en)
Inventor
李蕊江
罗明
龚绍杰
叶琳
陈静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Jiutong Zhilu Technology Co ltd
Original Assignee
Sichuan Jiutong Zhilu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Jiutong Zhilu Technology Co ltd filed Critical Sichuan Jiutong Zhilu Technology Co ltd
Priority to CN202110282547.5A priority Critical patent/CN113076439A/zh
Publication of CN113076439A publication Critical patent/CN113076439A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于垃圾识别的垃圾分类系统和方法,涉及垃圾分类处理领域。所述基于垃圾识别的垃圾分类系统通过数据爬虫、图像识别器和语意识别器相结合,将互联网上有关“可回收垃圾”、“有害垃圾”、“厨余垃圾”和“其他垃圾”的图片爬取下来,通过图像识别器为图片打上标签,通过语意识别器将“实物名词”保留到“垃圾分类标签库”中,通过建立“垃圾分类标签库”并将用户所上传图像的标签在“垃圾分类标签库”中进行检索,从而实现对垃圾的识别分类,无需人工对训练图像打标签,避免了筛选素材存在的人为导向,识别盲区等问题;同时语意识别器的词义相似度比较功能,能将词语不同但词义相同的标签建立匹配,极大地提高了系统的泛化能力。

Description

一种基于垃圾识别的垃圾分类系统和方法
技术领域
本发明涉及垃圾分类处理领域,尤其涉及一种基于垃圾识别的垃圾分类系统和方法。
背景技术
由于人们长期缺乏垃圾分类的经验,对垃圾处理分类缺乏常识性的认知,为了帮助人们改变现状,尽早地适应垃圾分类的习惯,故我们不仅需要从法律条款上对垃圾分类进行推进,更应该帮助人们建立正确的垃圾分类观,帮助人们分辨日常垃圾类别。
结合互联网技术和智能手机的飞速发展,通过智能手机对垃圾分类进行查询帮助的系统孕育而生,传统垃圾分类系统是通过用户登陆客户端,将所需查询的垃圾名称输入文本框进行查询,系统通过将用户输入内容与后台垃圾分类数据库进行文本对比,从而确定垃圾类别,具备方案简单易实施的优点,但是缺点也十分明显。文本输入限制了查询速率和便捷度,通过对比垃圾分类数据库文本的方式使系统不具备泛化能力,且分类数据库的更新完全依靠人工,对超出范围的搜索无法给出答复。
现有技术是通过采集垃圾图像,通过图像分析系统给垃圾匹配标签,通过语意系统对标签分词等处理后,再与现有垃圾分类数据库中的数据进行匹配,从而实现对垃圾的分类识别,但是,训练图像分析系统需要大量的时间和财力,图像分析系统需要大量已经分类好的垃圾图像素材作为训练材料,而训练材料还是以人为选取,并通过人为判断为图像匹配上正确的标签,初期准备工作量巨大,且存在训练材料选取的人为认知局限性,这就致使了系统建立成本大,存在人为导向,存在识别盲区。
因此,有必要提供一种新的,用于对垃圾进行快速、便捷、建立成本合理且覆盖面广的垃圾分类系统和方法来解决上述技术问题。
发明内容
为解决上述技术问题,本发明提供一种基于垃圾识别的垃圾分类系统和方法,涉及垃圾分类处理领域。所述基于垃圾识别的垃圾分类系统通过数据爬虫、图像识别器和语意识别器相结合,将互联网上有关“可回收垃圾”、“有害垃圾”、“厨余垃圾”和“其他垃圾”的图片爬取下来,通过图像识别器为图片打上标签,通过语意识别器将“实物名词”保留到“垃圾分类标签库”中,通过建立“垃圾分类标签库”并将用户所上传图像的标签在“垃圾分类标签库”中进行检索,从而实现对垃圾的识别分类,不需要人工对训练图像素材进行打标签,极大减小人工劳动的同时,还避免了人工筛选素材存在的人为导向,识别盲区等问题;通过基于API接口的图像识别器和语意识别器,不需要本地建立训练模型,仅需通过如:百度、阿里、腾讯等提供的图像识别和语意识别的API接口就能实现对垃圾的识别与分类,极大的节省了图像识别的训练时间和训练成本;语意识别器的词义相似度比较功能,能将词语不同但词义相同的标签建立匹配,极大地提高了系统的泛化能力。
本发明提供的一种基于垃圾识别的垃圾分类系统,包括移动客户端和后台识别端。
作为更加具体的解决方案,所述移动客户端以微信小程序和/或手机APP形式部署在移动终端上,所述移动客户端包括调用摄像头进行图像数据采集、向后台识别端上传图像数据、从后台识别端接受数据和通过移动终端对数据进行显示的功能。
进一步地,所述后台识别端部署于后台服务器上并通过后台服务器的网络接口与移动终端建立通信连接,所述后台识别端包括数据爬虫、初筛过滤器、图像预处理器、存储集群、图像识别器、语意识别器和图像过滤器。
更进一步地,所述数据爬虫能根据指定的关键词从互联网中抓取与关键词匹配的图像数据,并将抓取到的图像数据保存至存储集群的指定文件保存地址中。
作为更进一步地具体的解决方案,所述初筛过滤器能对存储集群中指定文件保存地址的图像数据的图像进行内容和格式进行读取,并将无对象内容的图像数据进行删除操作,其余的图像数据统一转化为JPG格式后保存至同一指定文件保存地址中。
作为更进一步地具体的解决方案,所述图像预处理器能对存储集群指定文件保存地址中的格式为JPG的图像数据的图像内容进行预处理操作,经过预处理操作后的图像数据保存至同一指定文件保存地址中。
作为更进一步地具体的解决方案,所述存储集群包括至少一个电可擦存储介质,所述数据爬虫、初筛过滤器、复筛过滤器、存储集群、图像识别器和语意识别器能对指定指定文件保存地址进行数据读写操作。
作为更进一步地具体的解决方案,所述图像识别器能对输入图像数据进行图像识别操作,所述图像识别操作包括对图像数据中出现的对象进行识别,并以标签形式对识别结果和识别准确度进行标注。
作为更进一步地具体的解决方案,所述语意识别器能对输入文本数据进行语意识别操作,所述语意识别操作包括将文本分词为单个词语,对词语词性进行识别标注和对不同词语进行词义相似度比较。
作为更进一步地具体的解决方案,所述初筛过滤器是基于python的初筛过滤器,所述初筛过滤器能检测图像数据的内容是否为空,并将检测内容为空的图像数据进行删除操作,其余的图像数据将统一转化为长边边长3072px,短边边长1024px,base64编码后大小为 3.8M,格式为JPG的图像数据。
作为更进一步地具体的解决方案,所述图像预处理器是基于python的图像预处理器,所述预处理操作包括彩色图像转变成灰度图、灰度图转化成二值图、对图像数据进行图像增强处理、对图像数据进行边缘检测、对图像数据进行轮廓匹配和与图像分割,其中,所述图像增强处理包括锐化和去噪。
作为更进一步地具体的解决方案,集群为可分区存储介质,所述存储集群按存储数据类型被分为:垃圾分类初筛素材库、垃圾分类素材库、垃圾分类标签库和识别对比区;所述垃圾分类初筛素材库包括“其他垃圾初筛素材库”、“可回收垃圾初筛素材库”、“有害垃圾初筛素材库”和“厨余垃圾初筛素材库”;所述垃圾分类素材库包括“其他垃圾素材库”、“可回收垃圾素材库”、“有害垃圾素材库”和“厨余垃圾素材库”;所述垃圾分类标签库包括“其他垃圾标签库”、“可回收垃圾标签库”、“有害垃圾标签库”和“厨余垃圾标签库”;所述识别对比区包括“临时识别区”、“正式识别区”和“对比标签区”。
作为更进一步地具体的解决方案,所述图像识别器是基于API接口的图像识别器,调用所述图像识别器对图像数据进行图像识别操作需要向API图像识别服务地址发送POST请求,并在URL中带上access_token和image参数;图像识别器在验证POST请求正确后会对image参数对应的图像数据进行图像识别操作,并以JSON格式向请求方返回图像识别操作结果,其中,图像数据格式应为PNG、JPG、JPEG或BMP格式,base64编码后大小不大于4M,最短边不小于30px,最长边不大于4096px,长宽比不大于3。
作为更进一步地具体的解决方案,所述语意识别器是基于API接口的语意识别器,调用所述语意识别器对文本数据进行语意识别操作需要向API语意识别服务地址发送POST请求,并在URL中带上access_token参数和在body中附上文本数据,语意识别器在验证POST请求正确后会对body中附上的文本数据进行语意识别操作,并以JSON格式向请求方返回语意识别操作结果,其中,文本数据格式应为GBK或UTF-8编码格式,长度不超过20000 字节。
作为更进一步地具体的解决方案,所述方法运用于权利要求1至权利要求6任一项所述的基于垃圾识别的垃圾分类系统,所述方法包括:
使用垃圾分类名称“可回收垃圾”、“有害垃圾”、“厨余垃圾”和“其他垃圾”作为图像爬取关键词,通过数据爬虫从互联网上对与垃圾分类名称相关的图像数据进行爬取;
通过初筛过滤器对图像数据进行初筛操作,所述初筛操作包括,并将通过初筛过滤器的图像数据按照图像爬取关键词分别储存于“其他垃圾初筛素材库”、“可回收垃圾初筛素材库”、“有害垃圾初筛素材库”和“厨余垃圾初筛素材库”中,未通过初筛过滤器的图像数据不做保存;
通过图像预处理器对“其他垃圾初筛素材库”、“可回收垃圾初筛素材库”、“有害垃圾初筛素材库”和“厨余垃圾初筛素材库”中的图像数据进行预处理操作,并将通过预处理操作的图像数据分别储存于“其他垃圾素材库”、“可回收垃圾素材库”、“有害垃圾素材库”和“厨余垃圾素材库”中;
通过图像识别器对“其他垃圾素材库”、“可回收垃圾素材库”、“有害垃圾素材库”和“厨余垃圾素材库”中的图像数据分别进行标签识别操作,并将识别后的标签根据图像数据来源分别保存在“其他垃圾标签库”、“可回收垃圾标签库”、“有害垃圾标签库”和“厨余垃圾标签库”中;
通过语意识别器对“其他垃圾标签库”、“可回收垃圾标签库”、“有害垃圾标签库”和“厨余垃圾标签库”进行语意识别,将语意识别为“实物名词”的标签进行保留,其余语意的标签进行删除;
用户通过移动客户端上传需进行查询分类的垃圾图像数据,垃圾图像数据保存至“临时识别区”;
通过图像过滤器对“临时识别区”中的垃圾图像数据进行评估操作,若垃圾图像数据通过评估操作则保存至“正式识别区”,若未通过评估则通过移动客户端告知用户重新上传正确的垃圾图像数据,其中,所述评估操作包括:图像数据是否格式正确,图像数据中是否能正常识别对象,图像数据大小是否超过4M;
通过图像识别器对“正式识别区”中保存的垃圾图像数据进行标签识别,并将标签保存至“对比标签区”;
通过语意识别器对“对比标签区”内的标签进行语意识别,将语意识别为“实物名词”的标签进行保留,其余语意的标签进行删除;
将“对比标签区”中的标签分别在“其他垃圾标签库”、“可回收垃圾标签库”、“有害垃圾标签库”和“厨余垃圾标签库”进行检索,若检索到,则通过移动客户端向客户输出当前标签库对应垃圾分类名称;若未检索到,则通过移动客户端向客户输出未查询到当前物品对应垃圾分类名称。
与相关技术相比较,本发明提供的用于一种基于垃圾识别的垃圾分类系统和方法具有如下有益效果:
1、本发明通过数据爬虫、图像识别器和语意识别器相结合,将互联网上有关“可回收垃圾”、“有害垃圾”、“厨余垃圾”和“其他垃圾”的图片爬取下来,通过图像识别器为图片打上标签,通过语意识别器将“实物名词”保留到“垃圾分类标签库”中,通过建立“垃圾分类标签库”并将用户所上传图像的标签在“垃圾分类标签库”中进行检索,从而实现对垃圾的识别分类,不需要人工对训练图像素材进行打标签,极大减小人工劳动的同时,还避免了人工筛选素材存在的人为导向,识别盲区等问题;
2、本发明通过基于API接口的图像识别器和语意识别器,不需要本地建立训练模型,仅需通过如:百度、阿里、腾讯等提供的图像识别和语意识别的API接口就能实现对垃圾的识别与分类,极大的节省了图像识别的训练时间和训练成本,同时还能提供更加精准的识别率;
3、本发明通过语意识别器的词义相似度比较功能,能将词语不同但词义相同的标签建立匹配,极大地提高了系统的泛化能力。
附图说明
图1为本发明提供的一种基于垃圾识别的垃圾分类系统的较佳实施例系统示意图一;
图2为本发明提供的一种基于垃圾识别的垃圾分类系统的较佳实施例系统示意图二。
具体实施方式
下面结合附图和实施方式对本发明作进一步说明。
如图1至图2所示,本发明一种基于垃圾识别的垃圾分类系统和方法,包括移动客户端和后台识别端。
作为更加具体的解决方案,所述移动客户端以微信小程序和/或手机APP形式部署在移动终端上,所述移动客户端包括调用摄像头进行图像数据采集、向后台识别端上传图像数据、从后台识别端接受数据和通过移动终端对数据进行显示的功能。
进一步地,所述后台识别端部署于后台服务器上并通过后台服务器的网络接口与移动终端建立通信连接,所述后台识别端包括数据爬虫、初筛过滤器、图像预处理器、存储集群、图像识别器、语意识别器和图像过滤器。
更进一步地,所述数据爬虫能根据指定的关键词从互联网中抓取与关键词匹配的图像数据,并将抓取到的图像数据保存至存储集群的指定文件保存地址中。
作为更进一步地具体的解决方案,所述初筛过滤器能对存储集群中指定文件保存地址的图像数据的图像进行内容和格式进行读取,并将无对象内容的图像数据进行删除操作,其余的图像数据统一转化为JPG格式后保存至同一指定文件保存地址中。
作为更进一步地具体的解决方案,所述图像预处理器能对存储集群指定文件保存地址中的格式为JPG的图像数据的图像内容进行预处理操作,经过预处理操作后的图像数据保存至同一指定文件保存地址中。
作为更进一步地具体的解决方案,所述存储集群包括至少一个电可擦存储介质,所述数据爬虫、初筛过滤器、复筛过滤器、存储集群、图像识别器和语意识别器能对指定指定文件保存地址进行数据读写操作。
作为更进一步地具体的解决方案,所述图像识别器能对输入图像数据进行图像识别操作,所述图像识别操作包括对图像数据中出现的对象进行识别,并以标签形式对识别结果和识别准确度进行标注。
作为更进一步地具体的解决方案,所述语意识别器能对输入文本数据进行语意识别操作,所述语意识别操作包括将文本分词为单个词语,对词语词性进行识别标注和对不同词语进行词义相似度比较。
作为更进一步地具体的解决方案,所述初筛过滤器是基于python的初筛过滤器,所述初筛过滤器能检测图像数据的内容是否为空,并将检测内容为空的图像数据进行删除操作,其余的图像数据将统一转化为长边边长3072px,短边边长1024px,base64编码后大小为 3.8M,格式为JPG的图像数据。
作为更进一步地具体的解决方案,所述图像预处理器是基于python的图像预处理器,所述预处理操作包括彩色图像转变成灰度图、灰度图转化成二值图、对图像数据进行图像增强处理、对图像数据进行边缘检测、对图像数据进行轮廓匹配和与图像分割,其中,所述图像增强处理包括锐化和去噪。
作为更进一步地具体的解决方案,集群为可分区存储介质,所述存储集群按存储数据类型被分为:垃圾分类初筛素材库、垃圾分类素材库、垃圾分类标签库和识别对比区;所述垃圾分类初筛素材库包括“其他垃圾初筛素材库”、“可回收垃圾初筛素材库”、“有害垃圾初筛素材库”和“厨余垃圾初筛素材库”;所述垃圾分类素材库包括“其他垃圾素材库”、“可回收垃圾素材库”、“有害垃圾素材库”和“厨余垃圾素材库”;所述垃圾分类标签库包括“其他垃圾标签库”、“可回收垃圾标签库”、“有害垃圾标签库”和“厨余垃圾标签库”;所述识别对比区包括“临时识别区”、“正式识别区”和“对比标签区”。
作为更进一步地具体的解决方案,所述图像识别器是基于API接口的图像识别器,调用所述图像识别器对图像数据进行图像识别操作需要向API图像识别服务地址发送POST请求,并在URL中带上access_token和image参数;图像识别器在验证POST请求正确后会对image参数对应的图像数据进行图像识别操作,并以JSON格式向请求方返回图像识别操作结果,其中,图像数据格式应为PNG、JPG、JPEG或BMP格式,base64编码后大小不大于4M,最短边不小于30px,最长边不大于4096px,长宽比不大于3。
作为更进一步地具体的解决方案,所述语意识别器是基于API接口的语意识别器,调用所述语意识别器对文本数据进行语意识别操作需要向API语意识别服务地址发送POST请求,并在URL中带上access_token参数和在body中附上文本数据,语意识别器在验证POST请求正确后会对body中附上的文本数据进行语意识别操作,并以JSON格式向请求方返回语意识别操作结果,其中,文本数据格式应为GBK或UTF-8编码格式,长度不超过20000 字节。
需要说明是:所述语意识别器和图像识别器均基于API接口,接口来源本实施选用百度、腾讯和阿里任一提供的语意识别和图像识别API接口,通过API接口,无需自己建立复杂的识别模型就能实现更加精准的词义和图像识别。
作为更进一步地具体的解决方案,所述方法运用于权利要求1至权利要求6任一项所述的基于垃圾识别的垃圾分类系统,所述方法包括:
使用垃圾分类名称“可回收垃圾”、“有害垃圾”、“厨余垃圾”和“其他垃圾”作为图像爬取关键词,通过数据爬虫从互联网上对与垃圾分类名称相关的图像数据进行爬取;
通过初筛过滤器对图像数据进行初筛操作,所述初筛操作包括,并将通过初筛过滤器的图像数据按照图像爬取关键词分别储存于“其他垃圾初筛素材库”、“可回收垃圾初筛素材库”、“有害垃圾初筛素材库”和“厨余垃圾初筛素材库”中,未通过初筛过滤器的图像数据不做保存;
通过图像预处理器对“其他垃圾初筛素材库”、“可回收垃圾初筛素材库”、“有害垃圾初筛素材库”和“厨余垃圾初筛素材库”中的图像数据进行预处理操作,并将通过预处理操作的图像数据分别储存于“其他垃圾素材库”、“可回收垃圾素材库”、“有害垃圾素材库”和“厨余垃圾素材库”中;
通过图像识别器对“其他垃圾素材库”、“可回收垃圾素材库”、“有害垃圾素材库”和“厨余垃圾素材库”中的图像数据分别进行标签识别操作,并将识别后的标签根据图像数据来源分别保存在“其他垃圾标签库”、“可回收垃圾标签库”、“有害垃圾标签库”和“厨余垃圾标签库”中;
通过语意识别器对“其他垃圾标签库”、“可回收垃圾标签库”、“有害垃圾标签库”和“厨余垃圾标签库”进行语意识别,将语意识别为“实物名词”的标签进行保留,其余语意的标签进行删除;
用户通过移动客户端上传需进行查询分类的垃圾图像数据,垃圾图像数据保存至“临时识别区”;
通过图像过滤器对“临时识别区”中的垃圾图像数据进行评估操作,若垃圾图像数据通过评估操作则保存至“正式识别区”,若未通过评估则通过移动客户端告知用户重新上传正确的垃圾图像数据,其中,所述评估操作包括:图像数据是否格式正确,图像数据中是否能正常识别对象,图像数据大小是否超过4M;
通过图像识别器对“正式识别区”中保存的垃圾图像数据进行标签识别,并将标签保存至“对比标签区”;
通过语意识别器对“对比标签区”内的标签进行语意识别,将语意识别为“实物名词”的标签进行保留,其余语意的标签进行删除;
将“对比标签区”中的标签分别在“其他垃圾标签库”、“可回收垃圾标签库”、“有害垃圾标签库”和“厨余垃圾标签库”进行检索,若检索到,则通过移动客户端向客户输出当前标签库对应垃圾分类名称;若未检索到,则通过移动客户端向客户输出未查询到当前物品对应垃圾分类名称。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (7)

1.一种基于垃圾识别的垃圾分类系统,其特征在于,包括移动客户端和后台识别端;
所述移动客户端以微信小程序和/或手机APP形式部署在移动终端上,所述移动客户端包括调用摄像头进行图像数据采集、向后台识别端上传图像数据、从后台识别端接受数据和通过移动终端对数据进行显示的功能;
所述后台识别端部署于后台服务器上并通过后台服务器的网络接口与移动终端建立通信连接,所述后台识别端包括数据爬虫、初筛过滤器、图像预处理器、存储集群、图像识别器、语意识别器和图像过滤器;
所述数据爬虫能根据指定的关键词从互联网中抓取与关键词匹配的图像数据,并将抓取到的图像数据保存至存储集群的指定文件保存地址中;
所述初筛过滤器能对存储集群中指定文件保存地址的图像数据的图像进行内容和格式进行读取,并将无对象内容的图像数据进行删除操作,其余的图像数据统一转化为JPG格式后保存至同一指定文件保存地址中;
所述图像预处理器能对存储集群指定文件保存地址中的格式为JPG的图像数据的图像内容进行预处理操作,经过预处理操作后的图像数据保存至同一指定文件保存地址中;
所述存储集群包括至少一个电可擦存储介质,所述数据爬虫、初筛过滤器、复筛过滤器、存储集群、图像识别器和语意识别器能对指定指定文件保存地址进行数据读写操作;
所述图像识别器能对输入图像数据进行图像识别操作,所述图像识别操作包括对图像数据中出现的对象进行识别,并以标签形式对识别结果和识别准确度进行标注;
所述语意识别器能对输入文本数据进行语意识别操作,所述语意识别操作包括将文本分词为单个词语,对词语词性进行识别标注和对不同词语进行词义相似度比较。
2.根据权利要求1所述的一种基于垃圾识别的垃圾分类系统,其特征在于,所述初筛过滤器是基于python的初筛过滤器,所述初筛过滤器能检测图像数据的内容是否为空,并将检测内容为空的图像数据进行删除操作,其余的图像数据将统一转化为长边边长3072px,短边边长1024px,base64编码后大小为3.8M,格式为JPG的图像数据。
3.根据权利要求1所述的一种基于垃圾识别的垃圾分类系统,其特征在于,所述图像预处理器是基于python的图像预处理器,所述预处理操作包括彩色图像转变成灰度图、灰度图转化成二值图、对图像数据进行图像增强处理、对图像数据进行边缘检测、对图像数据进行轮廓匹配和与图像分割,其中,所述图像增强处理包括锐化和去噪。
4.根据权利要求1所述的一种基于垃圾识别的垃圾分类系统,其特征在于,所述存储集群为可分区存储介质,所述存储集群按存储数据类型被分为:垃圾分类初筛素材库、垃圾分类素材库、垃圾分类标签库和识别对比区;所述垃圾分类初筛素材库包括“其他垃圾初筛素材库”、“可回收垃圾初筛素材库”、“有害垃圾初筛素材库”和“厨余垃圾初筛素材库”;所述垃圾分类素材库包括“其他垃圾素材库”、“可回收垃圾素材库”、“有害垃圾素材库”和“厨余垃圾素材库”;所述垃圾分类标签库包括“其他垃圾标签库”、“可回收垃圾标签库”、“有害垃圾标签库”和“厨余垃圾标签库”;所述识别对比区包括“临时识别区”、“正式识别区”和“对比标签区”。
5.根据权利要求1所述的一种基于垃圾识别的垃圾分类系统,其特征在于,所述图像识别器是基于API接口的图像识别器,调用所述图像识别器对图像数据进行图像识别操作需要向API图像识别服务地址发送POST请求,并在URL中带上access_token和image参数;图像识别器在验证POST请求正确后会对image参数对应的图像数据进行图像识别操作,并以JSON格式向请求方返回图像识别操作结果,其中,图像数据格式应为PNG、JPG、JPEG或BMP格式,base64编码后大小不大于4M,最短边不小于30px,最长边不大于4096px,长宽比不大于3。
6.根据权利要求1所述的一种基于垃圾识别的垃圾分类系统,其特征在于,所述语意识别器是基于API接口的语意识别器,调用所述语意识别器对文本数据进行语意识别操作需要向API语意识别服务地址发送POST请求,并在URL中带上access_token参数和在body中附上文本数据,语意识别器在验证POST请求正确后会对body中附上的文本数据进行语意识别操作,并以JSON格式向请求方返回语意识别操作结果,其中,文本数据格式应为GBK或UTF-8编码格式,长度不超过20000字节。
7.一种基于垃圾识别的垃圾分类方法,其特征在于,所述方法运用于权利要求1至权利要求6任一项所述的基于垃圾识别的垃圾分类系统,所述方法包括:
使用垃圾分类名称“可回收垃圾”、“有害垃圾”、“厨余垃圾”和“其他垃圾”作为图像爬取关键词,通过数据爬虫从互联网上对与垃圾分类名称相关的图像数据进行爬取;
通过初筛过滤器对图像数据进行初筛操作,所述初筛操作包括,并将通过初筛过滤器的图像数据按照图像爬取关键词分别储存于“其他垃圾初筛素材库”、“可回收垃圾初筛素材库”、“有害垃圾初筛素材库”和“厨余垃圾初筛素材库”中,未通过初筛过滤器的图像数据不做保存;
通过图像预处理器对“其他垃圾初筛素材库”、“可回收垃圾初筛素材库”、“有害垃圾初筛素材库”和“厨余垃圾初筛素材库”中的图像数据进行预处理操作,并将通过预处理操作的图像数据分别储存于“其他垃圾素材库”、“可回收垃圾素材库”、“有害垃圾素材库”和“厨余垃圾素材库”中;
通过图像识别器对“其他垃圾素材库”、“可回收垃圾素材库”、“有害垃圾素材库”和“厨余垃圾素材库”中的图像数据分别进行标签识别操作,并将识别后的标签根据图像数据来源分别保存在“其他垃圾标签库”、“可回收垃圾标签库”、“有害垃圾标签库”和“厨余垃圾标签库”中;
通过语意识别器对“其他垃圾标签库”、“可回收垃圾标签库”、“有害垃圾标签库”和“厨余垃圾标签库”进行语意识别,将语意识别为“实物名词”的标签进行保留,其余语意的标签进行删除;
用户通过移动客户端上传需进行查询分类的垃圾图像数据,垃圾图像数据保存至“临时识别区”;
通过图像过滤器对“临时识别区”中的垃圾图像数据进行评估操作,若垃圾图像数据通过评估操作则保存至“正式识别区”,若未通过评估则通过移动客户端告知用户重新上传正确的垃圾图像数据,其中,所述评估操作包括:图像数据是否格式正确,图像数据中是否能正常识别对象,图像数据大小是否超过4M;
通过图像识别器对“正式识别区”中保存的垃圾图像数据进行标签识别,并将标签保存至“对比标签区”;
通过语意识别器对“对比标签区”内的标签进行语意识别,将语意识别为“实物名词”的标签进行保留,其余语意的标签进行删除;
将“对比标签区”中的标签分别在“其他垃圾标签库”、“可回收垃圾标签库”、“有害垃圾标签库”和“厨余垃圾标签库”进行检索,若检索到,则通过移动客户端向客户输出当前标签库对应垃圾分类名称;若未检索到,则通过移动客户端向客户输出未查询到当前物品对应垃圾分类名称。
CN202110282547.5A 2021-03-16 2021-03-16 一种基于垃圾识别的垃圾分类系统和方法 Pending CN113076439A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110282547.5A CN113076439A (zh) 2021-03-16 2021-03-16 一种基于垃圾识别的垃圾分类系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110282547.5A CN113076439A (zh) 2021-03-16 2021-03-16 一种基于垃圾识别的垃圾分类系统和方法

Publications (1)

Publication Number Publication Date
CN113076439A true CN113076439A (zh) 2021-07-06

Family

ID=76612704

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110282547.5A Pending CN113076439A (zh) 2021-03-16 2021-03-16 一种基于垃圾识别的垃圾分类系统和方法

Country Status (1)

Country Link
CN (1) CN113076439A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004154609A (ja) * 2002-11-01 2004-06-03 Mitsubishi Heavy Ind Ltd ごみ分別システム及びごみ分別方法
CN110427896A (zh) * 2019-08-07 2019-11-08 成都理工大学 一种基于卷积神经网络的垃圾分类智能系统
CN110498152A (zh) * 2019-09-18 2019-11-26 福州大学 一种基于ai的智能分类垃圾桶及其方法
CN110502616A (zh) * 2019-08-29 2019-11-26 上海墨百意信息科技有限公司 一种确定垃圾分类的方法、设备及计算机存储介质
CN110654738A (zh) * 2019-09-18 2020-01-07 西安理工大学 一种基于自然语言处理的垃圾自动分类回收装置与方法
CN110929760A (zh) * 2019-10-30 2020-03-27 中国科学院自动化研究所南京人工智能芯片创新研究院 一种基于计算机视觉的垃圾分类软件

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004154609A (ja) * 2002-11-01 2004-06-03 Mitsubishi Heavy Ind Ltd ごみ分別システム及びごみ分別方法
CN110427896A (zh) * 2019-08-07 2019-11-08 成都理工大学 一种基于卷积神经网络的垃圾分类智能系统
CN110502616A (zh) * 2019-08-29 2019-11-26 上海墨百意信息科技有限公司 一种确定垃圾分类的方法、设备及计算机存储介质
CN110498152A (zh) * 2019-09-18 2019-11-26 福州大学 一种基于ai的智能分类垃圾桶及其方法
CN110654738A (zh) * 2019-09-18 2020-01-07 西安理工大学 一种基于自然语言处理的垃圾自动分类回收装置与方法
CN110929760A (zh) * 2019-10-30 2020-03-27 中国科学院自动化研究所南京人工智能芯片创新研究院 一种基于计算机视觉的垃圾分类软件

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
董子源等: "基于卷积神经网络的垃圾图像分类算法", 《计算机系统应用》 *

Similar Documents

Publication Publication Date Title
CN109033387B (zh) 一种融合多源数据的物联网搜索系统、方法及存储介质
JP6894534B2 (ja) 情報処理方法及び端末、コンピュータ記憶媒体
CN111753060A (zh) 信息检索方法、装置、设备及计算机可读存储介质
KR101869895B1 (ko) 딥 러닝 기반의 오브젝트 인식 서버, 오브젝트 인식 시스템 및 오브젝트 인식 방법
CN101398834A (zh) 一种针对输入信息的处理方法和装置及一种输入法系统
CN109685052A (zh) 文本图像处理方法、装置、电子设备及计算机可读介质
US10031924B2 (en) System and method for feature recognition and document searching based on feature recognition
CN112347244A (zh) 基于混合特征分析的涉黄、涉赌网站检测方法
CN111931859B (zh) 一种多标签图像识别方法和装置
CN111353491A (zh) 一种文字方向确定方法、装置、设备及存储介质
CN111752900A (zh) 基于rpa及ai的文件存储方法、装置、设备和介质
CN112632269A (zh) 一种文档分类模型训练的方法和相关装置
CN111061887A (zh) 一种新闻人物照片提取方法、装置、设备及存储介质
US20220262154A1 (en) Determining experiments represented by images in documents
CN114297140A (zh) 一种基于人工智能的档案管理系统
CN113254634A (zh) 一种基于相空间的档案分类方法及系统
CN110532449B (zh) 一种业务文档的处理方法、装置、设备和存储介质
CN115953788A (zh) 基于ocr和nlp技术的绿色金融属性智能认定方法及系统
CN113742496B (zh) 一种基于异构资源融合的电力知识学习系统及方法
CN114372532A (zh) 标签标注质量的确定方法、装置、设备、介质及产品
CN110704643B (zh) 不同类文献相同作者自动辨识方法及装置、存储介质终端
CN111552783A (zh) 内容分析查询方法、装置、设备和计算机存储介质
CN114238735B (zh) 一种互联网数据智能采集方法
CN113076439A (zh) 一种基于垃圾识别的垃圾分类系统和方法
CN114706948A (zh) 新闻处理方法、装置、存储介质以及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210706

RJ01 Rejection of invention patent application after publication