CN110502616B - 一种确定垃圾分类的方法、设备及计算机存储介质 - Google Patents

一种确定垃圾分类的方法、设备及计算机存储介质 Download PDF

Info

Publication number
CN110502616B
CN110502616B CN201910805366.9A CN201910805366A CN110502616B CN 110502616 B CN110502616 B CN 110502616B CN 201910805366 A CN201910805366 A CN 201910805366A CN 110502616 B CN110502616 B CN 110502616B
Authority
CN
China
Prior art keywords
garbage
query
knowledge base
information
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910805366.9A
Other languages
English (en)
Other versions
CN110502616A (zh
Inventor
郭建廷
岳聪
雷欣
李志飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Mobvoi Information Technology Co ltd
Original Assignee
Shanghai Mobvoi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Mobvoi Information Technology Co ltd filed Critical Shanghai Mobvoi Information Technology Co ltd
Priority to CN201910805366.9A priority Critical patent/CN110502616B/zh
Publication of CN110502616A publication Critical patent/CN110502616A/zh
Application granted granted Critical
Publication of CN110502616B publication Critical patent/CN110502616B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Animal Behavior & Ethology (AREA)
  • Health & Medical Sciences (AREA)
  • Processing Of Solid Wastes (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种确定垃圾分类的方法、设备及计算机存储介质,包括:识别垃圾分类问题中的查询垃圾;判断所述查询垃圾是否与垃圾分类知识库中的物品信息相匹配;当所述查询垃圾与所述垃圾分类知识库中的物品信息不匹配时,根据知识图谱和所述垃圾分类知识库确定所述查询垃圾所属的目标垃圾种类。本发明实施例中所提供的一种确定垃圾分类的方法、设备及计算机存储介质,当查询垃圾无法匹配到垃圾分类知识库中的物品信息时,便通过知识图谱来发掘关于查询垃圾的其他潜在信息,并利用所发掘的潜在信息来对应垃圾分类知识库中的物品信息,从而能够对各种查询垃圾都提供对应较为准确的垃圾种类结果,有效提高了垃圾查询效率。

Description

一种确定垃圾分类的方法、设备及计算机存储介质
技术领域
本发明涉及信息处理技术领域,尤其涉及一种确定垃圾分类的方法、设备及计算机存储介质。
背景技术
垃圾分类是当下制约环保事业发展的瓶颈之一,也是造成环境污染、资源再利用困难的根源之一。近年来,随着垃圾分类制度的推行,各地的垃圾分类工作正迅速展开。
伴随着垃圾分类工作的迅速展开,垃圾分类问答系统逐渐进入市场,为人们的垃圾分类工作提供了较大的便利。但是在现有问答系统中,只支持完全匹配垃圾分类知识库中物品来回答垃圾分类的问题,而垃圾分类知识库中的物品有限,因此出现了较多查询垃圾不在垃圾分类知识库中,导致无法查询的问题。
发明内容
本发明实施例为了有效克服现有技术所存在的上述缺陷,创造性地提供一种确定垃圾分类的方法,包括:识别垃圾分类问题中的查询垃圾;判断所述查询垃圾是否与垃圾分类知识库中的物品信息相匹配;当所述查询垃圾与所述垃圾分类知识库中的物品信息不匹配时,根据知识图谱和所述垃圾分类知识库确定所述查询垃圾所属的目标垃圾种类。
在一可实施方式中,所述方法还包括:当所述查询垃圾与所述垃圾分类知识库中的物品信息相匹配时,根据所述垃圾分类知识库确定所述查询垃圾所属的目标垃圾种类。
在一可实施方式中,所述根据知识图谱和所述垃圾分类知识库确定所述查询垃圾所属的目标垃圾种类,包括:根据所述知识图谱确定所述查询垃圾的一维度信息;判断所述查询垃圾的一维度信息是否与所述垃圾分类知识库中的物品信息相匹配;当所述查询垃圾的一维度信息与所述垃圾分类知识库中的物品信息相匹配时,通过所述垃圾分类知识库根据所述查询垃圾的一维度信息确定所述查询垃圾所属的目标垃圾种类。
在一可实施方式中,所述一维度信息的优先级从高到低依次为:类别属性信息、标签信息、上位词。
在一可实施方式中,所述一维度信息为上位词;相应的,通过所述垃圾分类知识库根据所述查询垃圾的一维度信息确定所述查询垃圾所属的目标垃圾种类,包括:统计匹配的所述查询垃圾的上位词所对应的垃圾种类信息;根据所述垃圾种类信息中的匹配频次信息确定对应于所述查询垃圾的目标垃圾种类。
在一可实施方式中,所述方法还包括:当所述查询垃圾的上位词与所述垃圾分类知识库中的物品信息不匹配时,分别将所述查询垃圾和所述垃圾分类知识库中的每个实体数据转化为查询垃圾词向量和知识库垃圾词向量;判断所述查询垃圾词向量和所述知识库垃圾词向量的相似度;根据所述查询垃圾词向量和所述知识库垃圾词向量的相似度确定所述查询垃圾的目标垃圾种类。
在一可实施方式中,判断所述查询垃圾词向量和所述知识库垃圾词向量的相似度,包括:通过计算余弦相似度来判断所述查询垃圾词向量和所述知识库垃圾词向量的相似度;或,通过神经网络来判断所述查询垃圾词向量和所述知识库垃圾词向量的相似度;或,通过计算空间距离来判断所述查询垃圾词向量和所述知识库垃圾词向量的相似度。
本发明另一方面提供一种确定垃圾分类的设备,包括:问题识别模块,用于识别垃圾分类问题中的查询垃圾;匹配判断模块,用于判断所述查询垃圾是否与垃圾分类知识库中的物品信息相匹配;综合判断模块,用于当所述查询垃圾与所述垃圾分类知识库中的物品信息不匹配时,根据知识图谱和所述垃圾分类知识库确定所述查询垃圾所属的目标垃圾种类。
在一可实施方式中,所述设备还包括:知识库判断模块,用于当所述查询垃圾与所述垃圾分类知识库中的物品信息相匹配时,根据所述垃圾分类知识库确定所述查询垃圾所属的目标垃圾种类。
本发明另一方面提供一种计算机存储介质,所述存储介质中存储有计算机可执行指令,当所述指令被执行时用于执行上述中任一项所述的确定垃圾分类的方法。
本发明实施例中所提供的一种确定垃圾分类的方法、设备及计算机存储介质,当查询垃圾无法匹配到垃圾分类知识库中的物品信息时,便通过知识图谱来发掘关于查询垃圾的其他潜在信息,并利用所发掘的潜在信息来对应垃圾分类知识库中的物品信息,从而能够对各种查询垃圾都提供对应较为准确的垃圾种类结果,有效提高了垃圾查询效率。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
在附图中,相同或对应的标号表示相同或对应的部分。
图1为本发明一实施例所提供的一种确定垃圾分类的方法的一种实现流程示意图;
图2为本发明一实施例所提供的一种确定垃圾分类的方法的另一种实现流程示意图;
图3为本发明一实施例所提供的一种确定垃圾分类的设备的一种组成结构图;
图4为本发明一实施例所提供的一种确定垃圾分类的设备的另一种组成结构图。
具体实施方式
为使本发明的目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书中的一些方面相一致的方法、装置或设备的例子。
请参考图1,本发明实施例一方面提供一种确定垃圾分类的方法,包括:
步骤101,识别垃圾分类问题中的查询垃圾;
步骤102,判断查询垃圾是否与垃圾分类知识库中的物品信息相匹配;
步骤103,当查询垃圾与垃圾分类知识库中的物品信息不匹配时,根据知识图谱和垃圾分类知识库确定查询垃圾所属的目标垃圾种类。
本发明实施例中的垃圾分类方法可以应用于客户端或服务器中,其中客户端包括如台式机、移动手机、甚至应用软件客户端,本发明实施例在此不对方法所应用的客户端的具体形式进行限制。本发明实施例中的服务器可以包括单个服务器、服务器集群甚至基于服务器集群构建的平台。
其中,步骤101中从垃圾分类问题中识别查询垃圾,具体的,当垃圾分类问题为:“苹果是什么垃圾?”时,所识别的查询垃圾为:“苹果”,具体识别过程可以通过自主构建的识别主语模型或通过发送给外部识别主语模型来获取查询垃圾反馈信息,当然也可以通过其他方法来识别查询垃圾,本发明实施例在此不对查询垃圾的识别方法进行限制。
同样的,步骤102中所使用的垃圾分类知识库可以为内部搭建的垃圾分类知识库或直接使用外源垃圾分类知识库,本发明实施例在此不对垃圾分类知识库的来源和具体结构进行限制,只要能够用于对应查询垃圾判断标准垃圾种类即可。
本发明实施例步骤103中所使用的知识图谱(knowledge graph)是一种语义网络,其结点(node)代表实体(entity)或者概念(concept),边(edge)代表实体/概念之间的各种语义关系(relation)。一个知识图谱由若干个三元组(h、r、t)组成,其中h和t代表一条关系的头结点和尾节点,r代表关系。由于现有的垃圾分类知识库通常物品有限,存在较多查询垃圾不在垃圾分类知识库中,因此无法仅通过垃圾分类知识库来查询所有查询垃圾。本发明实施例中,当查询垃圾无法匹配到垃圾分类知识库中的物品信息时,便通过知识图谱来发掘关于查询垃圾的其他潜在信息,并利用所发掘的潜在信息来对应垃圾分类知识库中的物品信息,从而能够对各种查询垃圾都提供对应较为准确的垃圾种类结果,有效提高了垃圾查询效率。
请参考图2,在一可实施方式中,方法还包括:
步骤104,当查询垃圾与垃圾分类知识库中的物品信息相匹配时,根据垃圾分类知识库确定查询垃圾所属的目标垃圾种类。
本发明实施例中,当查询垃圾能够与垃圾分类知识库中的物品信息匹配时,便将查询垃圾在垃圾分类知识库中的匹配物品所对应的垃圾种类确定为目标垃圾种类。如当垃圾分类问题为“矿泉水瓶是什么垃圾?”时,能够识别得到查询垃圾为“矿泉水瓶”,而矿泉水瓶能够与垃圾分类知识库中的物品信息-“矿泉水瓶”直接匹配,因此,可以直接根据垃圾分类知识库确定矿泉水瓶所属的目标垃圾种类即为物品信息-“矿泉水瓶”所对应的垃圾种类-可回收物。
在一可实施方式中,根据知识图谱和垃圾分类知识库确定查询垃圾所属的目标垃圾种类,包括:
根据知识图谱确定查询垃圾的一维度信息;
判断查询垃圾的一维度信息是否与垃圾分类知识库中的物品信息相匹配;
当查询垃圾的一维度信息与垃圾分类知识库中的物品信息相匹配时,通过垃圾分类知识库根据查询垃圾的一维度信息确定查询垃圾所属的目标垃圾种类。
本发明实施例中,当查询垃圾与垃圾分类知识库中的物品信息不匹配时,也即查询垃圾未直接归属于垃圾分类知识库中的已有物品信息时,可以通过根据知识图谱来确定查询垃圾的一维度信息,查询垃圾的一维度信息能够与垃圾分类知识库中的物品信息相匹配,然后再通过垃圾分类知识库根据查询垃圾的一维度信息确定查询垃圾所属的目标垃圾种类。本发明实施例中的维度信息可以为查询垃圾的标签信息、类别属性信息、上位词或者同义词、缩略词等。
在一可实施方式中,根据知识图谱和垃圾分类知识库确定查询垃圾所属的目标垃圾种类,包括:
根据知识图谱确定查询垃圾的多个维度信息;
判断查询垃圾的多个维度信息是否与垃圾分类知识库中的物品信息相匹配;
当查询垃圾的多个维度信息与垃圾分类知识库中的物品信息相匹配时,通过垃圾分类知识库根据查询垃圾的多个匹配维度信息确定查询垃圾所属的目标垃圾种类。
本发明实施例中,如当查询垃圾的类别属性信息、标签信息和上位词均能与垃圾分类知识库中的物品信息相匹配时,可以先分别通过垃圾分类知识库根据查询垃圾的多个匹配维度信息确定查询垃圾所属的一个或多个垃圾种类,然后根据垃圾种类的频次信息确定出目标垃圾种类。
在一可实施方式中,一维度信息的优先级从高到低依次为:类别属性信息、标签信息、上位词。
本发明实施例中,由于查询垃圾的类别属性信息概括信息范围较大,采用类别属性信息作为查询垃圾的维度信息来匹配垃圾分类知识库中的物品信息,并根据查询垃圾的类别属性信息在垃圾分类知识库中确定出的目标垃圾种类往往准确率较高,较少发生因限缩语义后进行匹配查询而造成的查询错误的问题。具体的,如查询垃圾为“黑加仑蛋糕”时,由于黑加仑蛋糕并不在垃圾分类知识库中,因此查询垃圾无法与垃圾分类知识库中的物品信息相匹配,此时,根据知识图谱确定查询垃圾的类别属性信息,即“食品”,然后判断查询垃圾是否与垃圾分类知识库中的物品信息相匹配,判断得到“食品”与垃圾分类知识库中的物品信息“食品”相匹配,此时,便可以通过垃圾分类知识库根据查询垃圾的类别属性信息确定目标垃圾种类,也即通过在垃圾分类知识库中确定“食品”的垃圾种类为“湿垃圾”后,目标垃圾种类也为“湿垃圾”。
本发明实施例中的维度信息也可以为标签信息,当查询垃圾、查询垃圾的类别属性信息均与垃圾分类知识库中的物品信息不匹配时,可以通过知识图谱确定查询垃圾的标签信息,当查询垃圾的标签信息与垃圾分类知识库中的物品信息相匹配时,便可以通过垃圾分类知识库根据查询垃圾的标签信息确定查询垃圾所属的目标垃圾种类。其中,知识图谱中实体的标签信息可以来自于网页页面词条标签或其他信息来源。如当查询垃圾为“达芙文阿达帕林凝胶”时,“达芙文阿达帕林凝胶”不在垃圾分类知识库中;那么下一步可以通过知识图谱确定查询垃圾的第一优先级维度信息,即类别属性信息,为“维A酸类产品”,再判断“维A酸类产品”与垃圾分类知识库中的物品信息不匹配;此时便可以根据知识图谱确定查询垃圾的第二优先级维度信息,即标签信息,为“药品”,并且“药品”与垃圾分类知识库中的物品信息-“药品”相匹配,这样便可以通过垃圾分类知识库根据查询垃圾的标签信息确定查询垃圾所属的目标垃圾种类,即“药品”所属的目标垃圾种类为“有毒垃圾”。
本发明实施例中,维度信息还可以为上位词,当以上方法均无法确定目标垃圾种类时,可以通过知识图谱确定查询垃圾的上位词,当查询垃圾的上位词与垃圾分类知识库中的物品信息相匹配时,便可以通过垃圾分类知识库根据查询垃圾的上位词确定查询垃圾所属的目标垃圾种类。
在一可实施方式中,一维度信息为上位词;
相应的,通过垃圾分类知识库根据查询垃圾的一维度信息确定查询垃圾所属的目标垃圾种类,包括:
统计匹配的查询垃圾的上位词所对应的垃圾种类信息;
根据垃圾种类信息中的匹配频次信息确定对应于查询垃圾的目标垃圾种类。
本发明实施例中,当采用上位词作为查询垃圾的一维度信息时,由于同一种查询垃圾的上位词可能有多个,比如“西红柿”的上位词有“水果”、“蔬菜”、“食物”等等,因此,需先统计匹配的查询垃圾的上位词所对应的垃圾种类信息,然后根据垃圾种类信息的匹配频次确定目标垃圾种类。本发明实施例中,根据垃圾种类信息的匹配频次确定目标垃圾种类具体可以为,将匹配频次最高的垃圾种类信息确定为对应于查询垃圾的目标垃圾种类,其中,如果垃圾种类信息的匹配频次信息相同时,如垃圾种类信息为“可回收物”和“装修垃圾”均为两次时,则将两个垃圾种类信息共同确定为目标垃圾种类,在问答系统的垃圾种类查询结果中可以给出:“不确定,可能是可回收物或装修垃圾”的回答。
如查询垃圾“西红柿”的上位词“水果”、“蔬菜”、“食物”所对应的垃圾种类信息均为“湿垃圾”,也即“湿垃圾”这一垃圾种类信息的匹配频次为3次,而其他垃圾种类信息的匹配频次为0,因此可以据此确定出对应于查询垃圾“西红柿”的目标垃圾种类为“湿垃圾”。
在一可实施方式中,方法还包括:
当查询垃圾的上位词与垃圾分类知识库中的物品信息不匹配时,分别将查询垃圾和垃圾分类知识库中的每个实体数据转化为查询垃圾词向量和知识库垃圾词向量;
判断查询垃圾词向量和知识库垃圾词向量的相似度;
根据查询垃圾词向量和知识库垃圾词向量的相似度确定查询垃圾的目标垃圾种类。
本发明实施例中,当查询垃圾的上位词也无法与垃圾分类知识库中的物品信息相匹配时,可以将查询垃圾和垃圾分类知识库中的每一个实体数据都转化为词向量后,通过进行词向量相似度计算来确定与查询垃圾词向量相似度最高的知识库垃圾词向量,从而在垃圾分类知识库中将此知识库垃圾词向量的物品信息对应的垃圾种类确定为目标垃圾种类。通过计算词向量相似度的方法能够简单有效的在垃圾分类知识库中找到匹配度较高的物品信息,从而得以保证对各种查询垃圾均能确定出目标垃圾种类。
在一可实施方式中,判断查询垃圾词向量和知识库垃圾词向量的相似度,包括:
通过计算余弦相似度来判断查询垃圾词向量和知识库垃圾词向量的相似度;
或,通过神经网络来判断查询垃圾词向量和知识库垃圾词向量的相似度;
或,通过计算空间距离来判断查询垃圾词向量和知识库垃圾词向量的相似度。
本发明实施例中,判断查询垃圾词向量和知识库垃圾词向量的相似度的方法包括:计算词向量的余弦相似度、神经网络判断和计算空间距离这几种方式,其中,计算词向量的空间距离具体还可以包括计算欧式距离、马氏距离等方法。当然,还可以通过同时使用这几种相似度判断方法中的两种或多种判断方法计算相似度,还可以赋予每一种相似度计算方法以权重值,最后根据综合计算终值来确定目标垃圾种类,本发明实施例在此不对相似度具体计算方法进行限制。
请参考图3,本发明另一方面提供一种确定垃圾分类的设备,包括:
问题识别模块,用于识别垃圾分类问题中的查询垃圾;
匹配判断模块,用于判断查询垃圾是否与垃圾分类知识库中的物品信息相匹配;
综合判断模块,用于当查询垃圾与垃圾分类知识库中的物品信息不匹配时,根据知识图谱和垃圾分类知识库确定查询垃圾所属的目标垃圾种类。
其中,问题识别模块从垃圾分类问题中识别查询垃圾,具体的,当垃圾分类问题为:“苹果是什么垃圾?”时,所识别的查询垃圾为:“苹果”,具体识别过程可以通过自主构建的识别主语模型或通过发送给外部识别主语模型来获取查询垃圾反馈信息,当然也可以通过其他方法来识别查询垃圾,本发明实施例在此不对查询垃圾的识别方法进行限制。
同样的,匹配判断模块中所使用的垃圾分类知识库可以为内部搭建的垃圾分类知识库或直接使用外源垃圾分类知识库,本发明实施例在此不对垃圾分类知识库的来源和具体结构进行限制,只要能够用于对应查询垃圾判断标准垃圾种类即可。
本发明实施例综合判断模块中所使用的知识图谱(knowledge graph)是一种语义网络,其结点(node)代表实体(entity)或者概念(concept),边(edge)代表实体/概念之间的各种语义关系(relation)。一个知识图谱由若干个三元组(h、r、t)组成,其中h和t代表一条关系的头结点和尾节点,r代表关系。由于现有的垃圾分类知识库通常物品有限,存在较多查询垃圾不在垃圾分类知识库中,因此无法仅通过垃圾分类知识库来查询所有查询垃圾。本发明实施例中,当查询垃圾无法匹配到垃圾分类知识库中的物品信息时,便通过知识图谱来发掘关于查询垃圾的其他潜在信息,并利用所发掘的潜在信息来对应垃圾分类知识库中的物品信息,从而能够对各种查询垃圾都提供对应较为准确的垃圾种类结果,有效提高了垃圾查询效率。
请参考图4,在一可实施方式中,设备还包括:
知识库判断模块,用于当查询垃圾与垃圾分类知识库中的物品信息相匹配时,根据垃圾分类知识库确定查询垃圾所属的目标垃圾种类。
本发明实施例中,当查询垃圾能够与垃圾分类知识库中的物品信息匹配时,便通过知识库判断模块将查询垃圾在垃圾分类知识库中的匹配物品所对应的垃圾种类确定为目标垃圾种类。如当垃圾分类问题为“矿泉水瓶是什么垃圾?”时,能够识别得到查询垃圾为“矿泉水瓶”,而矿泉水瓶能够与垃圾分类知识库中的物品信息-“矿泉水瓶”直接匹配,因此,可以直接根据垃圾分类知识库确定矿泉水瓶所属的目标垃圾种类即为物品信息-“矿泉水瓶”所对应的垃圾种类-可回收物。
在一可实施方式中,综合判断模块包括:
维度确定单元,用于根据知识图谱确定查询垃圾的一维度信息;
维度匹配单元,用于判断查询垃圾的一维度信息是否与垃圾分类知识库中的物品信息相匹配;
第一种类确定单元,用于当查询垃圾的一维度信息与垃圾分类知识库中的物品信息相匹配时,通过垃圾分类知识库根据查询垃圾的一维度信息确定查询垃圾所属的目标垃圾种类。
本发明实施例中,当查询垃圾与垃圾分类知识库中的物品信息不匹配时,也即查询垃圾未直接归属于垃圾分类知识库中的已有物品信息时,可以通过维度确定单元根据知识图谱来确定查询垃圾的一维度信息,维度匹配单元判断查询垃圾的一维度信息能够与垃圾分类知识库中的物品信息相匹配,然后再通过第一种类确定单元利用垃圾分类知识库根据查询垃圾的一维度信息确定查询垃圾所属的目标垃圾种类。本发明实施例中的维度信息可以为查询垃圾的标签信息、类别属性信息、上位词或者同义词、缩略词等。
在一可实施方式中,综合判断模块包括:
多维度确定单元,用于根据知识图谱确定查询垃圾的多个维度信息;
多维度匹配单元,用于判断查询垃圾的多个维度信息是否与垃圾分类知识库中的物品信息相匹配;
第二种类确定单元,用于当查询垃圾的多个维度信息与垃圾分类知识库中的物品信息相匹配时,通过垃圾分类知识库根据查询垃圾的多个匹配维度信息确定查询垃圾所属的目标垃圾种类。
本发明实施例中,如当查询垃圾的类别属性信息、标签信息和上位词均能与垃圾分类知识库中的物品信息相匹配时,可以先通过多维度确定单元得到查询垃圾的多个维度信息,然后通过多维度匹配单元判断所得到的多个维度信息是否与垃圾分类知识库中的物品信息相匹配,最后通过第二种类确定单元分别通过垃圾分类知识库根据查询垃圾的多个匹配维度信息确定查询垃圾所属的一个或多个垃圾种类,并根据垃圾种类的频次信息确定出目标垃圾种类。
在一可实施方式中,一维度信息的优先级从高到低依次为:类别属性信息、标签信息、上位词。
本发明实施例中,由于查询垃圾的类别属性信息概括信息范围较大,采用类别属性信息作为查询垃圾的维度信息来匹配垃圾分类知识库中的物品信息,并根据查询垃圾的类别属性信息在垃圾分类知识库中确定出的目标垃圾种类往往准确率较高,较少发生因限缩语义后进行匹配查询而造成的查询错误的问题。具体的,如查询垃圾为“黑加仑蛋糕”时,由于黑加仑蛋糕并不在垃圾分类知识库中,因此查询垃圾无法与垃圾分类知识库中的物品信息相匹配,此时,根据知识图谱确定查询垃圾的类别属性信息,即“食品”,然后判断查询垃圾是否与垃圾分类知识库中的物品信息相匹配,判断得到“食品”与垃圾分类知识库中的物品信息“食品”相匹配,此时,便可以通过垃圾分类知识库根据查询垃圾的类别属性信息确定目标垃圾种类,也即通过在垃圾分类知识库中确定“食品”的垃圾种类为“湿垃圾”后,目标垃圾种类也为“湿垃圾”。
本发明实施例中的维度信息也可以为标签信息,当查询垃圾、查询垃圾的类别属性信息均与垃圾分类知识库中的物品信息不匹配时,可以通过知识图谱确定查询垃圾的标签信息,当查询垃圾的标签信息与垃圾分类知识库中的物品信息相匹配时,便可以通过垃圾分类知识库根据查询垃圾的标签信息确定查询垃圾所属的目标垃圾种类。其中,知识图谱中实体的标签信息可以来自于网页页面词条标签或其他信息来源。如当查询垃圾为“达芙文阿达帕林凝胶”时,“达芙文阿达帕林凝胶”不在垃圾分类知识库中;那么下一步可以通过知识图谱确定查询垃圾的第一优先级维度信息,即类别属性信息,为“维A酸类产品”,再判断“维A酸类产品”与垃圾分类知识库中的物品信息不匹配;此时便可以根据知识图谱确定查询垃圾的第二优先级维度信息,即标签信息,为“药品”,并且“药品”与垃圾分类知识库中的物品信息-“药品”相匹配,这样便可以通过垃圾分类知识库根据查询垃圾的标签信息确定查询垃圾所属的目标垃圾种类,即“药品”所属的目标垃圾种类为“有毒垃圾”。
本发明实施例中,维度信息还可以为上位词,当以上方法均无法确定目标垃圾种类时,可以通过知识图谱确定查询垃圾的上位词,当查询垃圾的上位词与垃圾分类知识库中的物品信息相匹配时,便可以通过垃圾分类知识库根据查询垃圾的上位词确定查询垃圾所属的目标垃圾种类。
在一可实施方式中,一维度信息为上位词;
相应的,第一种类确定单元包括:
统计子单元,用于统计匹配的查询垃圾的上位词所对应的垃圾种类信息;
种类确定子单元,用于根据垃圾种类信息中的匹配频次信息确定对应于查询垃圾的目标垃圾种类。
本发明实施例中,当采用上位词作为查询垃圾的一维度信息时,由于同一种查询垃圾的上位词可能有多个,比如“西红柿”的上位词有“水果”、“蔬菜”、“食物”等等,因此,需先通过统计子单元统计匹配的查询垃圾的上位词所对应的垃圾种类信息,然后通过种类确定子单元根据垃圾种类信息的匹配频次确定目标垃圾种类。本发明实施例中,根据垃圾种类信息的匹配频次确定目标垃圾种类具体可以为,将匹配频次最高的垃圾种类信息确定为对应于查询垃圾的目标垃圾种类,其中,如果垃圾种类信息的匹配频次信息相同时,如垃圾种类信息为“可回收物”和“装修垃圾”均为两次时,则将两个垃圾种类信息共同确定为目标垃圾种类,在问答系统的垃圾种类查询结果中可以给出:“不确定,可能是可回收物或装修垃圾”的回答。
如查询垃圾“西红柿”的上位词“水果”、“蔬菜”、“食物”所对应的垃圾种类信息均为“湿垃圾”,也即“湿垃圾”这一垃圾种类信息的匹配频次为3次,而其他垃圾种类信息的匹配频次为0,因此可以据此确定出对应于查询垃圾“西红柿”的目标垃圾种类为“湿垃圾”。
在一可实施方式中,设备还包括:
词向量转化单元,用于当查询垃圾的上位词与垃圾分类知识库中的物品信息不匹配时,分别将查询垃圾和垃圾分类知识库中的每个实体数据转化为查询垃圾词向量和知识库垃圾词向量;
相似度判断单元,用于判断查询垃圾词向量和知识库垃圾词向量的相似度;
相似度确定单元,用于根据查询垃圾词向量和知识库垃圾词向量的相似度确定查询垃圾的目标垃圾种类。
本发明实施例中,当查询垃圾的上位词也无法与垃圾分类知识库中的物品信息相匹配时,可以通过词向量转化单元将查询垃圾和垃圾分类知识库中的每一个实体数据都转化为词向量后,通过相似度判断单元进行词向量相似度计算来确定与查询垃圾词向量相似度最高的知识库垃圾词向量,从而相似度确定单元在垃圾分类知识库中将此知识库垃圾词向量的物品信息对应的垃圾种类确定为目标垃圾种类。通过计算词向量相似度的方法能够简单有效的在垃圾分类知识库中找到匹配度较高的物品信息,从而得以保证对各种查询垃圾均能确定出目标垃圾种类。
在一可实施方式中,相似度判断单元包括:
余弦相似度判断子单元,用于通过计算余弦相似度来判断查询垃圾词向量和知识库垃圾词向量的相似度;
神经网络判断子单元,用于通过神经网络来判断查询垃圾词向量和知识库垃圾词向量的相似度;
空间距离判断子单元,用于通过计算空间距离来判断查询垃圾词向量和知识库垃圾词向量的相似度。
本发明实施例中,判断查询垃圾词向量和知识库垃圾词向量的相似度的方法包括:计算词向量的余弦相似度、神经网络判断和计算空间距离这几种方式,其中,计算词向量的空间距离具体还可以包括计算欧式距离、马氏距离等方法。当然,还可以通过同时使用这几种相似度判断方法中的两种或多种判断方法计算相似度,还可以赋予每一种相似度计算方法以权重值,最后根据综合计算终值来确定目标垃圾种类,本发明实施例在此不对相似度具体计算方法进行限制。
本发明另一方面提供一种计算机可读存储介质,存储介质中存储有计算机可执行指令,当指令被执行时用于执行上述任一项的确定垃圾分类的方法。
这里需要指出的是:以上实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果,对于本发明实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解,为节约篇幅,因此不再赘述。
本发明实施例中,多个步骤之间的实现顺序在不影响实现目的的情况下可以替换。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (9)

1.一种确定垃圾分类的方法,其特征在于,包括:
识别垃圾分类问题中的查询垃圾;
判断所述查询垃圾是否与垃圾分类知识库中的物品信息相匹配;
当所述查询垃圾与所述垃圾分类知识库中的物品信息不匹配时,根据知识图谱和所述垃圾分类知识库确定所述查询垃圾所属的目标垃圾种类;
所述根据知识图谱和所述垃圾分类知识库确定所述查询垃圾所属的目标垃圾种类,包括:
根据所述知识图谱确定所述查询垃圾的一维度信息;
判断所述查询垃圾的一维度信息是否与所述垃圾分类知识库中的物品信息相匹配;
当所述查询垃圾的一维度信息与所述垃圾分类知识库中的物品信息相匹配时,通过所述垃圾分类知识库根据所述查询垃圾的一维度信息确定所述查询垃圾所属的目标垃圾种类。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述查询垃圾与所述垃圾分类知识库中的物品信息相匹配时,根据所述垃圾分类知识库确定所述查询垃圾所属的目标垃圾种类。
3.根据权利要求1所述的方法,其特征在于,所述一维度信息的优先级从高到低依次为:类别属性信息、标签信息、上位词。
4.根据权利要求3所述的方法,其特征在于,所述一维度信息为上位词;
相应的,通过所述垃圾分类知识库根据所述查询垃圾的一维度信息确定所述查询垃圾所属的目标垃圾种类,包括:
统计匹配的所述查询垃圾的上位词所对应的垃圾种类信息;
根据所述垃圾种类信息中的匹配频次信息确定对应于所述查询垃圾的目标垃圾种类。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
当所述查询垃圾的上位词与所述垃圾分类知识库中的物品信息不匹配时,分别将所述查询垃圾和所述垃圾分类知识库中的每个实体数据转化为查询垃圾词向量和知识库垃圾词向量;
判断所述查询垃圾词向量和所述知识库垃圾词向量的相似度;
根据所述查询垃圾词向量和所述知识库垃圾词向量的相似度确定所述查询垃圾的目标垃圾种类。
6.根据权利要求5所述的方法,其特征在于,判断所述查询垃圾词向量和所述知识库垃圾词向量的相似度,包括:
通过计算余弦相似度来判断所述查询垃圾词向量和所述知识库垃圾词向量的相似度;
或,通过神经网络来判断所述查询垃圾词向量和所述知识库垃圾词向量的相似度;
或,通过计算空间距离来判断所述查询垃圾词向量和所述知识库垃圾词向量的相似度。
7.一种确定垃圾分类的设备,其特征在于,包括:
问题识别模块,用于识别垃圾分类问题中的查询垃圾;
匹配判断模块,用于判断所述查询垃圾是否与垃圾分类知识库中的物品信息相匹配;
综合判断模块,用于当所述查询垃圾与所述垃圾分类知识库中的物品信息不匹配时,根据知识图谱和所述垃圾分类知识库确定所述查询垃圾所属的目标垃圾种类;
所述综合判断模块,包括:
维度确定单元:用于根据知识图谱确定查询垃圾的一维度信息;
维度匹配单元:用于判断查询垃圾的一维度信息是否与垃圾分类知识库中的物品信息相匹配;
第一种类确定单元:用于当查询垃圾的一维度信息与垃圾分类知识库中的物品信息相匹配时,通过垃圾分类知识库根据查询垃圾的一维度信息确定查询垃圾所属的目标垃圾种类。
8.根据权利要求7所述的设备,其特征在于,所述设备还包括:
知识库判断模块,用于当所述查询垃圾与所述垃圾分类知识库中的物品信息相匹配时,根据所述垃圾分类知识库确定所述查询垃圾所属的目标垃圾种类。
9.一种计算机存储介质,其特征在于,所述存储介质中存储有计算机可执行指令,当所述指令被执行时用于执行权利要求1-6中任一项所述的确定垃圾分类的方法。
CN201910805366.9A 2019-08-29 2019-08-29 一种确定垃圾分类的方法、设备及计算机存储介质 Active CN110502616B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910805366.9A CN110502616B (zh) 2019-08-29 2019-08-29 一种确定垃圾分类的方法、设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910805366.9A CN110502616B (zh) 2019-08-29 2019-08-29 一种确定垃圾分类的方法、设备及计算机存储介质

Publications (2)

Publication Number Publication Date
CN110502616A CN110502616A (zh) 2019-11-26
CN110502616B true CN110502616B (zh) 2022-03-08

Family

ID=68590200

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910805366.9A Active CN110502616B (zh) 2019-08-29 2019-08-29 一种确定垃圾分类的方法、设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN110502616B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111169842B (zh) * 2020-01-06 2021-08-03 思必驰科技股份有限公司 一种垃圾箱、垃圾分类方法、装置以及可读存储介质
CN111259977A (zh) * 2020-01-22 2020-06-09 浙江工业大学 一种基于深度学习的垃圾分类装置
CN111611261B (zh) * 2020-05-24 2023-09-01 山东三宏信息科技有限公司 基于文本解耦合的垃圾分类识别系统
CN111709866B (zh) * 2020-06-22 2024-02-20 上海陇宇电子科技有限公司 一种基于移动设备的智能垃圾分类方法
CN113052005B (zh) * 2021-02-08 2024-02-02 湖南工业大学 一种用于家居服务的垃圾分拣方法和垃圾分拣装置
CN113076439A (zh) * 2021-03-16 2021-07-06 四川九通智路科技有限公司 一种基于垃圾识别的垃圾分类系统和方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003331118A (ja) * 2002-05-14 2003-11-21 Toshiba Corp ゴミ分別支援端末及びそれに用いるプログラム
CN106919655B (zh) * 2017-01-24 2020-05-19 网易(杭州)网络有限公司 一种答案提供方法和装置
CN109492077B (zh) * 2018-09-29 2020-09-29 北京智通云联科技有限公司 基于知识图谱的石化领域问答方法及系统
CN109815321B (zh) * 2018-12-26 2020-12-11 出门问问信息科技有限公司 问答方法、装置、设备及存储介质
CN109739964A (zh) * 2018-12-27 2019-05-10 北京拓尔思信息技术股份有限公司 知识数据提供方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN110502616A (zh) 2019-11-26

Similar Documents

Publication Publication Date Title
CN110502616B (zh) 一种确定垃圾分类的方法、设备及计算机存储介质
CN107516235B (zh) 商品偏好预估方法和装置
CN103870507A (zh) 一种基于类目的搜索方法和装置
CN103984714B (zh) 一种基于本体语义的云制造服务供需智能匹配方法
CN104036051B (zh) 一种基于标签传播的数据库模式摘要生成方法
CN102012936B (zh) 基于云计算平台的海量数据聚合方法和系统
CN103823893A (zh) 一种基于用户评论的产品检索方法及产品检索系统
CN105354202A (zh) 数据推送方法及装置
CN111881283A (zh) 一种业务关键词库创建方法、智能聊天引导方法及装置
CN110955690A (zh) 一种基于大数据技术的自助数据标签平台及自助数据标签方法
CN105046274A (zh) 一种电子商务商品类别自动标注方法
US9286549B1 (en) Sublinear time classification via feature padding and hashing
CN112825182A (zh) 一种确定推荐商品的方法和装置
CN103123685B (zh) 文本模式识别方法
CN103577472A (zh) 个人信息获得、推定、商品的分类、检索方法及系统
CN110389932B (zh) 电力文件自动分类方法及装置
CN103366143B (zh) 大规模射频识别系统中丢失标签的快速识别方法
CN109902215A (zh) 一种交易匹配的方法及系统
CN112884009A (zh) 一种分类模型训练方法及系统
CN112257448A (zh) 一种多任务命名实体识别方法、系统、介质及终端
CN115269633A (zh) 一种基于cad图纸智能查询商品的方法
CN115391701A (zh) 一种互联网内容风险分析及预警方法
CN114817687A (zh) 一种物联网实体服务的高效发现方法
CN108897736B (zh) 基于Paper Rank算法的文献排序方法及装置
Maria Anu et al. An overview of RFID data processing techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant