CN111611261B - 基于文本解耦合的垃圾分类识别系统 - Google Patents

基于文本解耦合的垃圾分类识别系统 Download PDF

Info

Publication number
CN111611261B
CN111611261B CN202010423529.XA CN202010423529A CN111611261B CN 111611261 B CN111611261 B CN 111611261B CN 202010423529 A CN202010423529 A CN 202010423529A CN 111611261 B CN111611261 B CN 111611261B
Authority
CN
China
Prior art keywords
text content
classified
classification
coupling
mark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010423529.XA
Other languages
English (en)
Other versions
CN111611261A (zh
Inventor
崔童莉
贺朵汐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Sanhong Information Technology Co ltd
Original Assignee
Shandong Sanhong Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Sanhong Information Technology Co ltd filed Critical Shandong Sanhong Information Technology Co ltd
Priority to CN202010423529.XA priority Critical patent/CN111611261B/zh
Publication of CN111611261A publication Critical patent/CN111611261A/zh
Application granted granted Critical
Publication of CN111611261B publication Critical patent/CN111611261B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02WCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
    • Y02W30/00Technologies for solid waste management
    • Y02W30/10Waste collection, transportation, transfer or storage, e.g. segregated refuse collecting, electric or hybrid propulsion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种垃圾分类识别系统,包括:存储器、服务器、存储在所述存储器上并可在所述服务器上运行的计算机程序、数据库以及显示屏,服务器用于:接收用户输入的待查询的查询文本内容;使用查询文本内容在分类对象文本字段中进行检索,如果检索到的分类文本内容与查询文本内容一致,并且耦合标志为表征非耦合的标志,显示第一检索结果,如果检索到的分类文本内容与查询文本内容不一致,则:对查询文本内容进行分词处理,得到对应的分词向量并使用分词向量进行检索,如果检索到匹配的分类记录,则显示第二检索结果,检索结果包括分类文本内容和对应的类别标志或者仅包括类别标志。本发明能够避免出现垃圾分类错误。

Description

基于文本解耦合的垃圾分类识别系统
技术领域
本发明涉及一种垃圾分类识别系统,具体涉及一种基于文本解耦合的垃圾分类识别系统。
背景技术
随着经济的快速发展,越来越多的人涌入城市中,使得城市人口越来越多,城市人口的增多导致排放的垃圾越来越多,超出了城市的承载能力,而且各种各样的垃圾如果不处理好,对人们的卫生安全更是一个巨大的威胁。为了保障经济利益和安全卫生,很多城市执行了垃圾分类,并且提供了垃圾分类宝典小程序,便于用户进行垃圾分类。
目前的垃圾分类宝典小程序使用的主要技术包括:第一、图像识别,即识别出拍照所获取的对象文本例如吸顶灯;第二、使用文本在数据库中检索,获得垃圾类别。数据库中至少包括“对象文本”和“垃圾类别”两个字段,对于北京市,垃圾类别为四类“可回收”、“有害”、“厨余”、“其他”。对于上海,垃圾类别也有四类。
然而,这种分类技术会存在对象文本会出现“耦合”的情况,例如,对于“骨”来说,“猪骨”属于“其他”,而“鸡骨”属于“厨余”,即“骨”使得“其他”和“厨余”耦合在一起,这样,用户吃的骨是鸡骨时,而输入“骨”进行查询时,给出的分类结果是“其他垃圾”就会导致分类错误,而且是无感知的分类错误。
因此,亟待需要提供一种能够使得用户准确进行垃圾分类的垃圾分类方案。
发明内容
针对上述技术问题,本发明实施例提供一种基于文本解耦合的垃圾分类识别系统,能够确保用户准确进行垃圾分类。
本发明采用的技术方案为:
本发明实施例提供一种基于文本解耦合的垃圾分类识别系统,包括:存储器、服务器、存储在所述存储器上并可在所述服务器上运行的计算机程序、数据库以及显示屏,
其中,所述数据库存储有分类记录表,所述分类记录表包括表征已分类垃圾的名称的分类对象文本,基于分类对象文本生成的分词向量和类别标志,每个分类记录包括表征每个已分类垃圾的名称的分类文本内容、对应的分词向量、类别标志和耦合标志,所述耦合标志包括表示耦合和非耦合的标志,其中,耦合是指至少两个分类记录的分类文本内容对应的分词存在交集并且类别标志不同;
所述服务器执行所述计算机程序时实现如下步骤:
S100、接收用户输入的待查询的查询文本内容;
S200、使用所述查询文本内容在所述分类记录表中的分类对象文本字段中进行检索,如果检索到的分类文本内容与所述查询文本内容一致,并且检索到的分类文本内容对应的耦合标志为表征非耦合的标志,则在所述显示屏上显示第一检索结果,如果检索到的分类文本内容与所述查询文本内容不一致,执行步骤S300;所述第一检索结果包括检索到的分类文本内容和对应的类别标志或者仅包括检索到的分类文本内容对应的类别标志;
S300、对接收的所述查询文本内容进行分词处理,得到对应的分词向量;
S400、使用所述分词向量在所述分类记录表中的分词向量字段中进行检索,如果检索到与所述分词向量匹配的分类记录,则在所述显示屏上显示第二检索结果,所述第二检索结果包括检索到的分类记录中的分类文本内容和对应的类别标志或者仅包括检索到的分类文本内容对应的类别标志。
可选地,所述耦合标志通过下述方式得到:
获取数据库中类别标志对应的所有分词向量中的所有分词的分词集合U1,U2,......,UN
如果Ui和Uj存在交集Uij,则将交集Uij中的分词作为文本耦合词;i,j的取值为1...N;
使用文本耦合词在数据库中的分词向量中进行检索,并将检索到的分类记录设置为表征耦合的标志,以及将没有检索到的分类记录设置为表征非耦合的标志。
可选地,步骤S400具体包括:
使用所述分词向量在所述数据库中进行检索,得到对应的检索分类记录;所述检索分类记录包括基于所述分词向量检索得到的分类文本内容、对应的分词向量、类别标志和耦合标志;
如果检索到的所有检索分类记录的耦合标志均为表征非耦合的标志,则将检索分类记录中的类别标志作为所述第二检索结果并在所述显示屏上进行显示;
如果检索到至少一个检索分类记录的耦合标志为表征耦合的标志,则将检索分类记录中的分类文本内容和类别标志作为所述第二检索结果并在所述显示屏上进行显示。
可选地,所述分类记录表还包括耦合引段,所述耦合引段用于指示与分类记录存在耦合关系的其他记录。
可选地,步骤S200还包括:
如果检索到的分类文本内容与所述查询文本内容一致,并且检索到的分类文本内容对应的耦合标志为表征耦合的标志,则根据检索到的分类记录的耦合引段直接定位到与检索到的分类记录耦合的其他记录,并将检索到的分类记录中的分类文本内容和对应的类别标志以及定位的其他记录中的分类文本内容和对应的类别标志作为所述第一检索结果并在所述显示屏上进行显示,或者,仅将检索到的分类记录中的分类文本内容对应的类别标志以及定位的其他记录中的分类文本内容对应的类别标志作为所述第一检索结果并在所述显示屏上进行显示。
可选地,步骤S400还包括:
如果检索到与所述分词向量相关的分类文本内容,并且检索到的分类文本内容对应的耦合标志为表征耦合的标志,则根据检索到的分类记录的耦合引段直接定位到与检索到的分类记录耦合的其他记录,并将检索到的分类记录中的分类文本内容和对应的类别标志以及其他记录中的分类文本内容和对应的类别标志作为所述第二检索结果并在所述显示屏上进行显示。
可选地,所述服务器执行所述计算机程序时还实现:根据分词向量相似度对所述第一检索结果和所述第二检索结果进行排序;所述分词向量相似度表示为A/B,其中,A为基于查询文本内容得到的分词向量中和基于分类文本内容得到的分词向量中的相同分词的数量,B为基于分类文本内容得到的分词向量中分词的数量。
可选地,还包括设置用户的移动终端中的本地数据库,所述本地数据库中存储有本地对象文本内容和用户定义的类别标志。
可选地,在步骤S400中,将没有检索到相关分类文本内容的查询文本内容存储到所述本地数据库中作为本地对象文本内容,并将该本地对象文本内容的类别标志设置为Null。
可选地,在步骤S400中,如果没有检索到与所述查询文本内容相关的分类文本内容,则执行步骤S500;
S500、使用所述查询文本内容在所述本地文本内容中进行检索,如果检索到相关的本地文本内容并且类别标志不是Null,则向用户呈现第三检索结果,所述第三检索结果包括检索到的本地文本内容和对应的类别标志。
本发明实施例提供的基于文本解耦合的垃圾分类识别系统,在用户输入待查询的查询文本内容时,在数据库中进行检索时,如果检索到与查询文本内容一致(即一模一样)的分类文本内容并且耦合标志为非耦合的情况下,则将检索到的第一检索结果进行显示,如果不一致,则对查询文本内容进行分词处理,然后在数据库中进行检索,如果检索到与所述分词向量匹配的分类记录,则在显示屏上显示第二检索结果,这样,一方面在数据库中存在与查询文本内容一模一样的文本内容时,能够直接向用户呈现检索结果,如果数据库中不存在于查询文本内容一模一样的文本内容时,通过对查询文本内容进行分词处理,得到相匹配的分类记录,能够为用户提供分类建议,从而能够避免提供分类错误的建议,提高垃圾分类准确性。
附图说明
图1为本发明实施例提供的基于文本解耦合和图像处理的垃圾分类识别系统的结构示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
图1为本发明实施例提供的基于文本解耦合和图像处理的垃圾分类识别系统的结构示意图。如图1所示,本发明实施例提供的基于文本解耦合和图像处理的垃圾分类识别系统,包括:存储器1、服务器2、存储在所述存储器1上并可在所述服务器2上运行的计算机程序、数据库3以及显示屏4。其中,
所述数据库3存储有分类记录表,所述分类记录表包括表征已分类垃圾的名称的分类对象文本,基于分类对象文本生成的分词向量和类别标志,每个分类记录包括表征每个已分类垃圾的名称的分类文本内容、对应的分词向量、类别标志和耦合标志,所述耦合标志包括表示耦合和非耦合的标志,其中,耦合是指至少两个分类记录的分类文本内容对应的分词存在交集并且类别标志不同;
所述服务器2执行所述计算机程序时实现如下步骤:
S100、接收用户输入的待查询的查询文本内容;
S200、使用所述查询文本内容在所述分类记录表中的分类对象文本字段中进行检索,如果检索到的分类文本内容与所述查询文本内容一致,并且检索到的分类文本内容对应的耦合标志为表征非耦合的标志,则在所述显示屏4上显示第一检索结果,如果检索到的分类文本内容与所述查询文本内容不一致,执行步骤S300;所述第一检索结果包括检索到的分类文本内容和对应的类别标志或者仅包括检索到的分类文本内容对应的类别标志;
S300、对接收的所述查询文本内容进行分词处理,得到对应的分词向量;
S400、使用所述分词向量在所述分类记录表中的分词向量字段中进行检索,如果检索到与所述分词向量匹配的分类记录,则在所述显示屏上显示第二检索结果,所述第二检索结果包括检索到的分类记录中的分类文本内容和对应的类别标志。
在步骤S100中,用户输入可包括语音输入和文本输入。对于语音输入,可采用现有技术中的语言识别程序转换为对应的文本。
在步骤S200中,第一检索结果优选可包括类别标志。显示屏4可为用户的移动终端上的显示屏。
在步骤S300中,对查询文本内容进行分词的方式可采用现有技术,例如文本内容为“白炽灯”,分词向量为(白炽,灯),对象内容为“节能灯”,分词向量为(节能,灯)。
在步骤S400中,由于采用分词进行检索,能够为不在数据库中的查询文本内容提供检索结果,例如,查询文本内容为“孩子的玩具”,通过将其分词为“孩子”和“玩具”,从而获得检索结果。此外,在步骤S400中,如果没有获得匹配的分类记录,则在显示屏4上向用户显示提示信息,例如“未检索到”。
在本发明实施例中,数据库3中的分类记录的格式可表示为:记录a,XXX,(XX,X),Y,Z,其中,a为记录序号,XXX为分类文本内容,(XX,X)为分词向量,Y为类别标志,Z为耦合标志;类别标志可以实现为标志代码,例如0,1,2,3等,也可以实现为标志字符串,例如“可回收”、“有害”、“厨余”、“其他”等;耦合标志可通过标志代码表示,例如0表示耦合,1表示非耦合。在另一个示例中,耦合标志也可通过字符串表示,例如“耦合”、“非耦合”。数据库3中的分词向量的方式与步骤S300中的分词方式一样。以白炽灯和节能等为例,数据库3中的分类记录可表示为:
记录1,白炽灯,(白炽,灯),可回收,耦合
记录2,节能灯,(节能,灯),有害,耦合
在本发明实施例中,耦合标志可通过下述方式得到:
获取数据库中类别标志对应的所有分词向量中的所有分词的分词集合U1,U2,......,UN;在一个示例中,N=4个,N为类别标志的数量。
如果Ui和Uj存在交集Uij,则将交集Uij中的分词作为文本耦合词;i,j的取值为1...N;
使用文本耦合词在数据库中的分词向量中进行检索,并将检索到的分类记录设置为表征耦合的标志,以及将没有检索到的分类记录设置为表征非耦合的标志。也就是说,在本发明实施例中,如果某个分类记录的耦合标志为表示耦合的标志,则表示该分类记录的文本内容对应的分词与其他至少一个分类记录的文本内容对应的分词之间存在交集且类别标志不同,例如白炽灯和节能灯之间由于存在文本耦合词“灯”,并且类别标志不同,所以对应的分类记录设置有表示耦合的标志。
进一步地,在本发明实施例中,在步骤S200中,如果检索到的分类文本内容与所述查询文本内容一致,并且检索到的分类文本内容对应的耦合标志为表征耦合的标志,则进入步骤S300。
进一步地,在本发明一实施例中,步骤S400可具体包括:
S420、使用所述分词向量在所述数据库中进行检索,得到对应的检索分类记录;所述检索分类记录包括基于所述分词向量检索得到的分类文本内容、对应的分词向量、类别标志和耦合标志;
具体地,在使用分词向量检索时,可利用分词向量中的每个分词分别在所述分词向量字段中进行检索,得到与每个分词匹配的检索分类记录。
S421、如果检索到的所有检索分类记录的耦合标志均为表征非耦合的标志,则将检索分类记录中的类别标志作为所述第二检索结果并在所述显示屏上进行显示;这说明所有检索结果都在同一类别标志内,所以不用区分检索结果了,更为简洁。
S422、如果检索到至少一个检索分类记录的耦合标志为表征耦合的标志,则将检索分类记录中的分类文本内容和类别标志作为所述第二检索结果并在所述显示屏上进行显示。
进一步地,在本发明实施例中,所述分类记录表还包括耦合引段,所述耦合引段用于指示与分类记录存在耦合关系的其他记录。例如:
记录1,白炽灯,(白炽,灯),可回收,耦合,记录2
记录2,节能灯,(节能,灯),有害,耦合,记录1
进一步地,在分类记录表包括耦合引段的情况下,步骤S200还包括:
如果检索到的分类文本内容与所述查询文本内容一致,并且检索到的分类文本内容对应的耦合标志为表征耦合的标志,则根据检索到的分类记录(例如记录1)的耦合引段(例如记录2)直接定位到与检索到的分类记录耦合的其他记录(记录2),并将检索到的分类记录中的分类文本内容和对应的类别标志以及定位的其他记录中的分类文本内容和对应的类别标志作为所述第一检索结果并在所述显示屏上进行显示,或者,仅将检索到的分类记录中的分类文本内容对应的类别标志以及定位的其他记录中的分类文本内容对应的类别标志作为所述第一检索结果并在所述显示屏上进行显示。
进一步地,在分类记录表包括耦合引段的情况下,步骤S400还包括:
如果检索到与所述分词向量相关的分类文本内容,并且检索到的分类文本内容对应的耦合标志为表征耦合的标志,则根据检索到的分类记录(例如记录1)的耦合引段(例如记录2)直接定位到与检索到的分类记录耦合的其他记录(例如记录2),并将检索到的分类记录中的分类文本内容和对应的类别标志以及其他记录中的分类文本内容和对应的类别标志作为所述第二检索结果并在所述显示屏上进行显示。
进一步地,在本发明实施例中,所述服务器2执行所述计算机程序时还实现:根据分词向量相似度对所述第一检索结果和所述第二检索结果进行排序;所述分词向量相似度表示为A/B,其中,A为基于查询文本内容得到的分词向量中和基于分类文本内容得到的分词向量中的相同分词的数量,B为基于分类文本内容得到的分词向量中分词的数量。由于根据分词向量相似度对检索结果进行了排序,能够将相似度大的检索结果呈现给用户,节约用户的浏览时间和便于用户进行垃圾分类。
进一步地,在本发明实施例中,所述垃圾分类识别系统还包括设置用户的移动终端中的本地数据库(未图示),所述本地数据库中存储有本地对象文本内容和用户定义的类别标志。用户定义的类别标志可基于用户的输入进行修改,即本地数据库能够接收用户用于移动终端的输入装置所输入的本地对象文本内容对应的类型标志(不限时间,即用户任何时候都可以输入),例如用户将“羊蝎子”对应的Null修改为“其他垃圾”。
进一步地,在本发明实施例中,在本地数据库存储有本地对象文本内容和用户定义的类别标志的情况下,在步骤S400中,将没有检索到相关分类文本内容的查询文本内容存储到所述本地数据库中作为本地文本内容,并将该本地文本内容的类别标志设置为Null。
进一步地,在步骤S400中,如果没有检索到与所述查询文本内容相关的分类文本内容,则执行步骤S500;
S500、使用所述查询文本内容在所述本地文本内容中进行检索,如果检索到相关的本地文本内容并且类别标志不是Null,则向用户呈现第三检索结果,所述第三检索结果包括检索到的本地文本内容和对应的类别标志。
综上,本发明实施例提供的基于文本解耦合的垃圾分类识别系统,在用户输入待查询的查询文本内容时,在数据库中进行检索时,如果检索到与查询文本内容一致(即一模一样)的分类文本内容并且耦合标志为非耦合的情况下,则将检索到的第一检索结果进行显示,如果不一致,则对查询文本内容进行分词处理,然后在数据库中进行检索,如果检索到与所述分词向量匹配的分类记录,则在显示屏上显示第二检索结果,这样,一方面在数据库中存在与查询文本内容一模一样的文本内容时,能够直接向用户呈现检索结果,如果数据库中不存在于查询文本内容一模一样的文本内容时,通过对查询文本内容进行分词处理,得到相匹配的分类记录,能够为用户提供分类建议,从而能够避免提供分类错误的建议,提高垃圾分类准确性。
以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (8)

1.一种基于文本解耦合的垃圾分类识别系统,其特征在于,包括:存储器、服务器、存储在所述存储器上并可在所述服务器上运行的计算机程序、数据库以及显示屏,
其中,所述数据库存储有分类记录表,所述分类记录表包括表征已分类垃圾的名称的分类对象文本,基于分类对象文本生成的分词向量和类别标志,每个分类记录包括表征每个已分类垃圾的名称的分类文本内容、对应的分词向量、类别标志和耦合标志,所述耦合标志包括表示耦合和非耦合的标志,其中,耦合是指至少两个分类记录的分类文本内容对应的分词存在交集并且类别标志不同;
所述服务器执行所述计算机程序时实现如下步骤:
S100、接收用户输入的待查询的查询文本内容;
S200、使用所述查询文本内容在所述分类记录表中的分类对象文本字段中进行检索,如果检索到的分类文本内容与所述查询文本内容一致,并且检索到的分类文本内容对应的耦合标志为表征非耦合的标志,则在所述显示屏上显示第一检索结果,如果检索到的分类文本内容与所述查询文本内容不一致,执行步骤S300;所述第一检索结果包括检索到的分类文本内容和对应的类别标志或者仅包括检索到的分类文本内容对应的类别标志;
S300、对接收的所述查询文本内容进行分词处理,得到对应的分词向量;
S400、使用所述分词向量在所述分类记录表中的分词向量字段中进行检索,如果检索到与所述分词向量匹配的分类记录,则在所述显示屏上显示第二检索结果,所述第二检索结果包括检索到的分类记录中的分类文本内容和对应的类别标志或者仅包括检索到的分类文本内容对应的类别标志;
所述耦合标志通过下述方式得到:
获取数据库中类别标志对应的所有分词向量中的所有分词的分词集合U1,U2,......,UN
如果Ui和Uj存在交集Uij,则将交集Uij中的分词作为文本耦合词;i,j的取值为1...N;
使用文本耦合词在数据库中的分词向量中进行检索,并将检索到的分类记录设置为表征耦合的标志,以及将没有检索到的分类记录设置为表征非耦合的标志;
步骤S400具体包括:
使用所述分词向量在所述数据库中进行检索,得到对应的检索分类记录;所述检索分类记录包括基于所述分词向量检索得到的分类文本内容、对应的分词向量、类别标志和耦合标志;
如果检索到的所有检索分类记录的耦合标志均为表征非耦合的标志,则将检索分类记录中的类别标志作为所述第二检索结果并在所述显示屏上进行显示;
如果检索到至少一个检索分类记录的耦合标志为表征耦合的标志,则将检索分类记录中的分类文本内容和类别标志作为所述第二检索结果并在所述显示屏上进行显示。
2.根据权利要求1所述的垃圾分类识别系统,其特征在于,所述分类记录表还包括耦合引段,所述耦合引段用于指示与分类记录存在耦合关系的其他记录。
3.根据权利要求2所述的垃圾分类识别系统,其特征在于,步骤S200还包括:
如果检索到的分类文本内容与所述查询文本内容一致,并且检索到的分类文本内容对应的耦合标志为表征耦合的标志,则根据检索到的分类记录的耦合引段直接定位到与检索到的分类记录耦合的其他记录,并将检索到的分类记录中的分类文本内容和对应的类别标志以及定位的其他记录中的分类文本内容和对应的类别标志作为所述第一检索结果并在所述显示屏上进行显示,或者,仅将检索到的分类记录中的分类文本内容对应的类别标志以及定位的其他记录中的分类文本内容对应的类别标志作为所述第一检索结果并在所述显示屏上进行显示。
4.根据权利要求2所述的垃圾分类识别系统,其特征在于,步骤S400还包括:
如果检索到与所述分词向量相关的分类文本内容,并且检索到的分类文本内容对应的耦合标志为表征耦合的标志,则根据检索到的分类记录的耦合引段直接定位到与检索到的分类记录耦合的其他记录,并将检索到的分类记录中的分类文本内容和对应的类别标志以及其他记录中的分类文本内容和对应的类别标志作为所述第二检索结果并在所述显示屏上进行显示。
5.根据权利要求1所述的垃圾分类识别系统,其特征在于,所述服务器执行所述计算机程序时还实现:根据分词向量相似度对所述第一检索结果和所述第二检索结果进行排序;所述分词向量相似度表示为A/B,其中,A为基于查询文本内容得到的分词向量中和基于分类文本内容得到的分词向量中的相同分词的数量,B为基于分类文本内容得到的分词向量中分词的数量。
6.根据权利要求1所述的垃圾分类识别系统,其特征在于,还包括设置用户的移动终端中的本地数据库,所述本地数据库中存储有本地对象文本内容和用户定义的类别标志。
7.根据权利要求6所述的垃圾分类识别系统,其特征在于,在步骤S400中,将没有检索到相关分类文本内容的查询文本内容存储到所述本地数据库中作为本地对象文本内容,并将该本地对象文本内容的类别标志设置为Null。
8.根据权利要求7所述的垃圾分类识别系统,其特征在于,在步骤S400中,如果没有检索到与所述查询文本内容相关的分类文本内容,则执行步骤S500;
S500、使用所述查询文本内容在所述本地文本内容中进行检索,如果检索到相关的本地文本内容并且类别标志不是Null,则向用户呈现第三检索结果,所述第三检索结果包括检索到的本地文本内容和对应的类别标志。
CN202010423529.XA 2020-05-24 2020-05-24 基于文本解耦合的垃圾分类识别系统 Active CN111611261B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010423529.XA CN111611261B (zh) 2020-05-24 2020-05-24 基于文本解耦合的垃圾分类识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010423529.XA CN111611261B (zh) 2020-05-24 2020-05-24 基于文本解耦合的垃圾分类识别系统

Publications (2)

Publication Number Publication Date
CN111611261A CN111611261A (zh) 2020-09-01
CN111611261B true CN111611261B (zh) 2023-09-01

Family

ID=72196098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010423529.XA Active CN111611261B (zh) 2020-05-24 2020-05-24 基于文本解耦合的垃圾分类识别系统

Country Status (1)

Country Link
CN (1) CN111611261B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110164445A (zh) * 2018-02-13 2019-08-23 阿里巴巴集团控股有限公司 语音识别方法、装置、设备及计算机存储介质
CN110482072A (zh) * 2019-07-02 2019-11-22 上海净收智能科技有限公司 垃圾分类方法、系统、介质、垃圾收纳装置、及云端平台
CN110502616A (zh) * 2019-08-29 2019-11-26 上海墨百意信息科技有限公司 一种确定垃圾分类的方法、设备及计算机存储介质
CN110569874A (zh) * 2019-08-05 2019-12-13 深圳大学 一种垃圾分类方法、装置、智能终端及存储介质
CN110598034A (zh) * 2019-08-24 2019-12-20 深圳市奥芯博电子科技有限公司 垃圾分类识别方法及系统
CN110597954A (zh) * 2019-08-29 2019-12-20 深圳创维-Rgb电子有限公司 垃圾分类方法、装置、系统及计算机可读存储介质
CN110765142A (zh) * 2019-09-27 2020-02-07 恒大智慧科技有限公司 一种社区内垃圾管理方法、系统及可读存储介质
JP2020027407A (ja) * 2018-08-10 2020-02-20 Kddi株式会社 ゴミ分別支援システム、端末装置、ゴミ分別支援方法、及びプログラム
CN110852263A (zh) * 2019-11-11 2020-02-28 北京智能工场科技有限公司 一种基于人工智能的手机拍照识别垃圾分类方法
CN111046201A (zh) * 2019-11-25 2020-04-21 浙江科技学院 一种基于计算机软件的垃圾分类模拟系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7574409B2 (en) * 2004-11-04 2009-08-11 Vericept Corporation Method, apparatus, and system for clustering and classification

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110164445A (zh) * 2018-02-13 2019-08-23 阿里巴巴集团控股有限公司 语音识别方法、装置、设备及计算机存储介质
JP2020027407A (ja) * 2018-08-10 2020-02-20 Kddi株式会社 ゴミ分別支援システム、端末装置、ゴミ分別支援方法、及びプログラム
CN110482072A (zh) * 2019-07-02 2019-11-22 上海净收智能科技有限公司 垃圾分类方法、系统、介质、垃圾收纳装置、及云端平台
CN110569874A (zh) * 2019-08-05 2019-12-13 深圳大学 一种垃圾分类方法、装置、智能终端及存储介质
CN110598034A (zh) * 2019-08-24 2019-12-20 深圳市奥芯博电子科技有限公司 垃圾分类识别方法及系统
CN110502616A (zh) * 2019-08-29 2019-11-26 上海墨百意信息科技有限公司 一种确定垃圾分类的方法、设备及计算机存储介质
CN110597954A (zh) * 2019-08-29 2019-12-20 深圳创维-Rgb电子有限公司 垃圾分类方法、装置、系统及计算机可读存储介质
CN110765142A (zh) * 2019-09-27 2020-02-07 恒大智慧科技有限公司 一种社区内垃圾管理方法、系统及可读存储介质
CN110852263A (zh) * 2019-11-11 2020-02-28 北京智能工场科技有限公司 一种基于人工智能的手机拍照识别垃圾分类方法
CN111046201A (zh) * 2019-11-25 2020-04-21 浙江科技学院 一种基于计算机软件的垃圾分类模拟系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于物联网的智能垃圾分类系统的设计;孟田宇等;《卫星电视与宽带多媒体》(第15期);全文 *

Also Published As

Publication number Publication date
CN111611261A (zh) 2020-09-01

Similar Documents

Publication Publication Date Title
CN112184525B (zh) 通过自然语义分析实现智能匹配推荐的系统及方法
CN109388795B (zh) 一种命名实体识别方法、语言识别方法及系统
CN106777275B (zh) 基于多粒度语义块的实体属性和属性值提取方法
JP5252725B2 (ja) 名前をハイパーリンクするためのシステム、方法、及びソフトウェア
CN111581976A (zh) 医学术语的标准化方法、装置、计算机设备及存储介质
CN105095195A (zh) 基于知识图谱的人机问答方法和系统
CN112231494B (zh) 信息抽取方法、装置、电子设备及存储介质
CN111488468B (zh) 地理信息知识点抽取方法、装置、存储介质及计算机设备
CN110609998A (zh) 一种电子文档信息的数据提取方法、电子设备及存储介质
CN112699645B (zh) 语料标注方法、装置及设备
CN110909122A (zh) 一种信息处理方法及相关设备
CN108776677B (zh) 平行语句库的创建方法、设备及计算机可读存储介质
CN111191012A (zh) 知识图谱产生装置、方法及其计算机程序产品
CN113268615A (zh) 资源标签生成方法、装置、电子设备及存储介质
CN111639156A (zh) 一种基于层级标签的查询方法、装置,设备及存储介质
Ha et al. Information extraction from scanned invoice images using text analysis and layout features
CN111291152A (zh) 案例文书的推荐方法、装置、设备及存储介质
US12086189B2 (en) Document search device, document search program, and document search method
CN115098657A (zh) 自然语言转换数据库查询语句的方法、设备及介质
CN111611261B (zh) 基于文本解耦合的垃圾分类识别系统
CN112364068A (zh) 课程标签生成方法、装置、设备及介质
CN110457436B (zh) 信息标注方法、装置、计算机可读存储介质及电子设备
CN111611262B (zh) 基于文本解耦合和图像处理的垃圾分类识别系统
CN114840657A (zh) 一种基于混合模式的api知识图谱自适应构建及智能问答方法
CN110308931B (zh) 一种数据处理方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20221110

Address after: 276300 no.5-1, West Yanjie District, Wenquan Road, economic development zone, Yinan County, Linyi City, Shandong Province

Applicant after: Shandong Sanhong Information Technology Co.,Ltd.

Address before: 513, 34 / F, A4 - (3) office building, Hanyu financial and business center, 7000 Jingshi Road, Jinan area, China (Shandong) pilot Free Trade Zone, Jinan City, Shandong Province

Applicant before: Jinan Xinge Information Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant