CN107705066A - 一种商品入库时信息录入方法及电子设备 - Google Patents

一种商品入库时信息录入方法及电子设备 Download PDF

Info

Publication number
CN107705066A
CN107705066A CN201710834062.6A CN201710834062A CN107705066A CN 107705066 A CN107705066 A CN 107705066A CN 201710834062 A CN201710834062 A CN 201710834062A CN 107705066 A CN107705066 A CN 107705066A
Authority
CN
China
Prior art keywords
commodity
knowledge
illustrative plates
attribute information
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710834062.6A
Other languages
English (en)
Other versions
CN107705066B (zh
Inventor
郭师光
刘宇
崔燕红
董亚楠
黄惠燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vipshop (Hainan) e-commerce Co.,Ltd.
Original Assignee
Guangzhou Vipcom Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Vipcom Research Institute Co Ltd filed Critical Guangzhou Vipcom Research Institute Co Ltd
Priority to CN201710834062.6A priority Critical patent/CN107705066B/zh
Publication of CN107705066A publication Critical patent/CN107705066A/zh
Application granted granted Critical
Publication of CN107705066B publication Critical patent/CN107705066B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/087Inventory or stock management, e.g. order filling, procurement or balancing against orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种商品入库时信息录入方法及电子设备,属于计算机技术领域。所述方法包括:当商品入库时,获取供应商提供的商品的商品信息;若原有商品信息不齐全,则利用预先训练的神经网络对商品图片进行识别,从商品图片中提取商品的属性信息;根据商品的属性信息,从预先建立的商品知识图谱的关系网络中获取与属性信息对应的商品信息;以及应用获取的商品信息对商品的录入信息进行不全,并入库。从而通过商品图片属性自动提取和商品知识图谱相结合的方式,自动的获取商品入库时所需要的商品信息,整个过程自动完成,无需人工查询归类,极大降低了入库信息录入的人工成本,提高了商品入库的效率,提高准确率。

Description

一种商品入库时信息录入方法及电子设备
技术领域
本发明涉及计算机技术领域,特别涉及一种商品入库时信息录入方法及电子设备。
背景技术
现有的电商物流在商品入库、以及商品在中转仓库间中转时,一般采用商品名称以及原有的分类进行入库;其入库的信息采用供应商或电商录入的商品信息,但是供应商或电商录入的商品信息常常存在着不全或者不相符的情况,这是会采用对商品信息查询归类等获取进一步的商品信息。比如衣服会根据颜色,材质,性别,价格,品牌等,整个商品信息录入过程效率低下以及操作繁琐;同时,此种方法采用人工的方式,其出现人工错误的概率很高,并且仍然有部分商品存在属性缺失的情况。所以需要提供一种快捷方便且信息齐全的商品信息录入方法。
发明内容
为了提高商品入库效率,降低商品录入错误率,提高准确率,同时降低人工成本,本发明实施例提供了一种商品入库时信息录入方法及电子设备。所述技术方案如下:
第一方面,提供了一种商品入库时信息录入方法,所述方法包括:
当商品入库时,获取供应商和/或电商提供的所述商品的商品信息,所述商品信息包括商品图片和原有商品文本信息;
若所述原有商品信息不齐全,则利用预先训练的神经网络对所述商品图片进行识别,从所述商品图片中提取所述商品的属性信息;
根据所述商品的属性信息,从预先建立的商品知识图谱的关系网络中获取与所述属性信息对应的商品信息;以及
应用获取的所述商品信息对所述商品的录入信息进行补全,并入库。
结合第一方面,在第一种可能实现的方式中,所述利用预先训练的神经网络对所述商品图片进行识别,从所述商品图片中提取所述商品的属性信息包括:
对所述商品的图片进行预处理;
通过深度学习模型从一张图中提取出若干局部细节图;以及
使用训练好的多任务模型进行属性信息预测,或者使用训练好的多个单一任务模型进行属性信息预测。
结合第一方面的第一种可能实现的方式,在第二种可能实现的方式中,所述根据所述商品的属性信息,从预先建立的商品知识图谱中获取与所述属性信息对应的商品文本信息包括:
根据预测的所述属性信息,在所述商品知识图谱中全局搜索对应的商品信息;
若搜索不到,则创建与所述属性信息对应的商品信息,并对所述商品知识图谱更新。
结合第一方面的第二种可能实现的方式,在第三种可能实现的方式中,所述商品知识图谱的建立包括:
搜集大量的带有各种文字的图片,将这些带有文字说明的图片数据经过处理作为知识图谱的基础数据,所述基础数据中包括图片和图片的文本信息;
对所述基础数据进行实体抽取、关系抽取、属性抽取以及知识抽取,获取有效文本;
并根据所述有效文本建立所述商品知识图谱;
其中,所述商品知识图谱中构建了不同种商品及商品属性类别之间的关系,以及同类别商品中不容种个体之间的关系。
结合第一方面至第一方面的第三种任意一种可能实现的方式,在第四种可能实现的方式中,所述方法还包括:
根据所述商品知识图谱,创建和商品知识图谱对应的图像属性特征。
第二方面,提供了一种电子设备,所述电子设备包括:
第一商品信息获取模块,用于当商品入库时,获取供应商和/或电商提供的所述商品的商品信息,所述商品信息包括商品图片和原有商品文本信息;
属性信息获取模块,用于当所述原有商品信息不齐全时,则利用预先训练的神经网络对所述商品图片进行识别,从所述商品图片中提取所述商品的属性信息;
第二商品信息获取模块,用于根据所述商品的属性信息,从预先建立的商品知识图谱的关系网络中获取与所述属性信息对应的商品信息;
录入模块,用于应用获取的所述商品信息对所述商品的录入信息进行补全,并入库。
结合第二方面,在第一种可能实现的方式中,所述属性信息获取模块具体包括:
预处理单元,用于对所述商品的图片进行预处理;
细节图提取单元,用于通过深度学习模型从一张图中提取出若干局部细节图;以及
预测单元,用于使用训练好的多任务模型进行属性信息预测,或者使用训练好的多个单一任务模型进行属性信息预测。
结合第二方面的第一种可能实现的方式,在第二种可能实现的方式中,所述第二商品信息获取模块具体包括:
搜索单元,用于根据预测的所述属性信息,在所述商品知识图谱中全局搜索对应的商品信息;
第一创建单元,用于当搜索不到时,则创建与所述属性信息对应的商品信息,并对所述商品知识图谱更新。
结合第二方面的第二种可能实现的方式,在第三种可能实现的方式中,所述设备还包括商品图谱建立模块,具体包括:
基础数据获取单元,用于搜集大量的带有各种文字的图片,将这些带有文字说明的图片数据经过处理作为知识图谱的基础数据,所述基础数据中包括图片和图片的文本信息;
有效文本获取单元,用于对所述基础数据进行实体抽取、关系抽取、属性抽取以及知识抽取,获取有效文本;
第二创建单元,用于并根据所述有效文本建立所述商品知识图谱;
其中,所述商品知识图谱中构建了不同种商品及商品属性类别之间的关系,以及同类别商品中不容种个体之间的关系。
结合第二方面至第二方面的第三种任意一种可能实现的方式,在第四种可能实现的方式中,所述设备还包括:
图像属性特征创建模块,用于根据所述商品知识图谱,创建和商品知识图谱对应的图像属性特征。
本发明实施例提供的技术方案带来的有益效果是:
本发明实施例提供了一种商品入库时信息录入方法及电子设备,方法通过当在商品入库,若原有商品信息不齐全,利用预先训练的神经网络对所述商品图片进行识别,从所述商品图片中提取所述商品的属性信息,再根据所述商品的属性信息,从预先建立的商品知识图谱的关系网络中获取与所述属性信息对应的商品信息,从而对商品的录入信息进行补全,使得通过商品图片属性自动提取和商品知识图谱相结合的方式,自动的获取商品入库时所需要的商品信息,以对商品信息不齐全进行补全,整个过程自动完成,相较于传统的人工查询归类进行补全的方式而言,该过程无需人工参与,极大降低了入库信息录入的人工成本,提高了商品入库的信息录入效率,从而提高了商品入库效率;同时,传统的通过人工分类进行入库,操作繁琐且效率低,本发明只需将商品图片输入预先训练的神经网络,自动完成信息补充,整个过程操作简捷且短时间内完成,进一步提高了商品入库效率;另外,传统的通过人工分类或查询归类的方式,容易出现错误,而通过本发明实施例所提供的方式,通过预先训练的神经网络和商品知识图谱自动进行,能够降低商品录入的错误率,进一步提高商品入库效率,满足快速物流过程中需要对商品进行及时录入的需求。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种商品入库时信息录入方法流程图;
图2是本发明实施例提供的一种商品知识图谱建立的过程流程图;
图3是本发明实施例提供的一种根据有效文本建立商品知识图谱的过程流程图;
图4是本发明实施例提供的一种电子设备结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本发明实施例提供了一种商品入库时信息录入方法,参照图1所示,该方法包括:
101、当商品入库时,获取供应商和/或电商提供的商品的商品信息。
商品信息包括商品图片和原有商品文本信息。
具体的,供应商提供的商品的商品信息包括商品名称以及原有的分类等,比如衣服,供应商提供的商品信息可以包括颜色、材质、品牌、适用性别以及价格等;电商提供的商品信息可以是对商品的描述信息,如适用少女、上班族等,春装或夏装,或修身等信息。
其中,商品的图片来自电商上传的图片。
102、若原有商品信息不齐全,则利用预先训练的神经网络对商品图片进行识别,从商品图片中提取商品的属性信息。
具体的,以上衣为例,说明商品入库时所需信息可以包括:衣服名称、品牌信息、适用性别、适用人群、适用季节;以及款式相关信息,如修身、适中、宽松;衣服细节信息,如领型、袖型,袖长,衣长;材质信息等等,还可以包括其他,此处只是以衣服进行示例说明,还包括其他商品的入库时所需的信息,此处不再一一列举,在实际应用中根据需求进行设置。
当原有的商品信息不齐全时,需要对商品的商品信息进行补全,首先利用预先训练的神经网络对商品图片进行识别,从商品图片中提取商品的属性信息,具体的,该过程可以包括:
a、对商品的图片进行预处理。
具体的,对商品的图片进行预处理可以包括模式的采集、模数转换、滤波、消除模糊、减少噪声、纠正几何失真;
通过预处理步骤保证了计算机识别和图片特征提取步骤的准确和高效。
b、通过深度学习模型从一张图中提取出若干局部细节图。
具体的,该细节图可以包括商品的局部形状特征图、商品纹理特征图和商品颜色特征图等。
c、使用训练好的多任务模型进行属性信息预测,或者使用训练好的多个单一任务模型进行属性信息预测。
将提取的多个局部细节图输入训练好的多任务模型中进行属性信息预测,该多任务模型可以是能够识别不同类别商品或商品特征的模型;或者将提取的额多个局部细节图分别输入训练好的多个单一任务模型中进行属性信息预测。
该多任务模型和单一任务模型是预先训练所得,本发明实施例对具体的训练方式不加以限定。
103、根据商品的属性信息,从预先建立的商品知识图谱中获取与属性信息对应的商品文本信息。
具体的,该过程可以包括:
根据预测的属性信息,在商品知识图谱中全局搜索对应的商品信息,通过商品知识图谱将获取的商品的属性信息转化为商品文本信息;
若搜索不到,则创建与属性信息对应的商品信息,并对商品知识图谱更新;该过程是对商品知识图谱逐渐完善以及更新的过程。
需要说明的是,该商品知识图谱是预先建立的,也可以是使用建立好的商品知识图谱,本发明实施例对具体的商品知识图谱的建立过程不加以限定。
104、应用获取的商品文本信息对商品的录入信息进行补全,并入库。
可选的,方法还包括:
105、根据商品知识图谱,创建和商品知识图谱对应的图像属性特征。
通过创建和商品知识图谱对应的图像属性特征,以使得通过商品知识图谱能够对获取的属性进行匹配到对应的文本信息;该过程也是对商品知识图谱逐渐完善和更新的过程。
可选的,参照图2所示,商品知识图谱的建立的过程可以包括:
201、搜集大量的带有各种文字的图片,将这些带有文字说明的图片数据经过处理作为知识图谱的基础数据,基础数据中包括图片和图片的文本信息。
其中,可以是搜集,也可以从各位购物网站中搜集获取,还可以是从其他地方搜集获取。
利用深度学习(Deep neural network)图像识别技术能够提高图像识别的正确率,深度学习模型的网络模型非常大,训练这个模型需要海量的带有基础数据。所以能够搜集到大量的基础数据是商品知识图谱建立的关键,只有获取到大量的基础数据才能经深度学习进行模型训练。
202、对基础数据进行实体抽取、关系抽取、属性抽取以及知识抽取,获取有效文本。
203、根据有效文本建立商品知识图谱。
其中,商品知识图谱中构建了不同种商品及商品属性类别之间的关系,以及同类别商品中不容种个体之间的关系。
商品知识图谱可以为网络状。
具体的,参照图3中所示,该根据有效文本建立商品知识图谱的过程可以包括:
S1、信息抽取得到网页内有效的文本。
S2、对文本进行中文分词、词性标注。
S3、对该进行中文分词、词性标注后的文本进行文本聚类。
具体的,可以通过利用LDA(Latent Dirichlet Allocation)模型或PLSA(Probabilistic Latent Semantic Analysis)模型对文本进行聚类;
S4、整理聚类结果后进行类别标注,进行有监督学习,对以后的未标注文本进行训练。
具体的,该训练过程可以通过两种方式进行,在第一种训练方式可以包括:
先进行实体名词识别,可以利用CRF(Conditional Random Field,条件随机域)或HMM(Hidden Markov Model,一种统计模型)模型进行;
再利用语言模型或分类器对文本进行分类,可以利用n-gram(一种语言模型)或soft-max classifier(soft-max分类器)进行分类;
最后利用神经网络训练分词向量,具体可以利用RNNLM神经网络。
第二种训练方式可以包括:
先利用神经网络训练分词向量,具体可以利用RNNLM神经网络;
再利用神经网络和语音模型对文本进行分类,该神经网络可以是RNNLM,语言模型可以是n-gram模型。
S5、停用词过滤,抽取关键词。
具体可以利用TF-LDF(term frequency-inverse document frequency)或者TextRank算法对聚类后训练的文本进行关键词抽取。
S6、获取相同的近义词及通过相同的实体名词获取同类别词。
S7、利用语法分析、模板、同类实体名词、近义词抽取类别的属性特征。
S8、利用类别中句子词向量的相似度,抽取类别之间的关系,以及利用类别内句子中词向量的相似度,抽取类别内物品或物品属性的关系。
本发明实施例提供了一种商品入库时信息录入方法,通过当在商品入库,若原有商品信息不齐全,利用预先训练的神经网络对商品图片进行识别,从商品图片中提取商品的属性信息,再根据商品的属性信息,从预先建立的商品知识图谱的关系网络中获取与属性信息对应的商品信息,从而对商品的录入信息进行补全,使得通过商品图片属性自动提取和商品知识图谱相结合的方式,自动的获取商品入库时所需要的商品信息,以对商品信息不齐全进行补全,整个过程自动完成,相较于传统的人工查询归类进行补全的方式而言,该过程无需人工参与,极大降低了入库信息录入的人工成本,提高了商品入库的信息录入效率,从而提高了商品入库效率;同时,传统的通过人工分类进行入库,操作繁琐且效率低,本发明只需将商品图片输入预先训练的神经网络,自动完成信息补充,整个过程操作简捷且短时间内完成,进一步提高了商品入库效率;另外,传统的通过人工分类或查询归类的方式,容易出现错误,而通过本发明实施例所提供的方式,通过预先训练的神经网络和商品知识图谱自动进行,能够降低商品录入的错误率,进一步提高商品入库效率,满足快速物流过程中需要对商品进行及时录入的需求。
实施例二
本发明实施例提供了一种电子设备,参照图4所示,该电子设备4包括:
第一商品信息获取模块41,用于当商品入库时,获取供应商和/或电商提供的商品的商品信息,商品信息包括商品图片和原有商品文本信息;
属性信息获取模块42,用于当原有商品信息不齐全时,则利用预先训练的神经网络对商品图片进行识别,从商品图片中提取商品的属性信息;
第二商品信息获取模块43,用于根据商品的属性信息,从预先建立的商品知识图谱的关系网络中获取与属性信息对应的商品文本信息;
录入模块44,用于应用获取的商品文本信息对商品的录入信息进行补全,并入库。
可选的,属性信息获取模块42具体包括:
预处理单元421,用于对商品的图片进行预处理;
细节图提取单元422,用于通过深度学习模型从一张图中提取出若干局部细节图;以及
预测单元423,用于使用训练好的多任务模型进行属性信息预测,或者使用训练好的多个单一任务模型进行属性信息预测。
可选的,第二商品信息获取模块43具体包括:
搜索单元431,用于根据预测的属性信息,在商品知识图谱中全局搜索对应的商品信息;
第一创建单元432,用于当搜索不到时,则创建与属性信息对应的商品信息,并对商品知识图谱更新。
可选的,设备还包括商品图谱建立模块45,具体包括:
基础数据获取单元451,用于搜集大量的带有各种文字的图片,将这些带有文字说明的图片数据经过处理作为知识图谱的基础数据,基础数据中包括图片和图片的文本信息;
有效文本获取单元452,用于对基础数据进行实体抽取、关系抽取、属性抽取以及知识抽取,获取有效文本;
第二创建单元453,用于并根据有效文本建立商品知识图谱;
其中,商品知识图谱中构建了不同种商品及商品属性类别之间的关系,以及同类别商品中不容种个体之间的关系。
可选的,设备还包括:
图像属性特征创建模块46,用于根据商品知识图谱,创建和商品知识图谱对应的图像属性特征。
本发明实施例提供了一种电子设备,该电子设备通过当在商品入库,若原有商品信息不齐全,利用预先训练的神经网络对商品图片进行识别,从商品图片中提取商品的属性信息,再根据商品的属性信息,从预先建立的商品知识图谱的关系网络中获取与属性信息对应的商品信息,从而对商品的录入信息进行补全,使得通过商品图片属性自动提取和商品知识图谱相结合的方式,自动的获取商品入库时所需要的商品信息,以对商品信息不齐全进行补全,整个过程自动完成,相较于传统的人工查询归类进行补全的方式而言,该过程无需人工参与,极大降低了入库信息录入的人工成本,提高了商品入库的信息录入效率,从而提高了商品入库效率;同时,传统的通过人工分类进行入库,操作繁琐且效率低,本发明只需将商品图片输入预先训练的神经网络,自动完成信息补充,整个过程操作简捷且短时间内完成,进一步提高了商品入库效率;另外,传统的通过人工分类或查询归类的方式,容易出现错误,而通过本发明实施例所提供的方式,通过预先训练的神经网络和商品知识图谱自动进行,能够降低商品录入的错误率,进一步提高商品入库效率,满足快速物流过程中需要对商品进行及时录入的需求。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
需要说明的是:上述实施例提供的电子设备在执行商品入库时信息录入方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的电子设备与商品入库时信息录入方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种商品入库时信息录入方法,其特征在于,所述方法包括:
当商品入库时,获取供应商和/或电商提供的所述商品的商品信息,所述商品信息包括商品图片和原有商品文本信息;
若所述原有商品信息不齐全,则利用预先训练的神经网络对所述商品图片进行识别,从所述商品图片中提取所述商品的属性信息;
根据所述商品的属性信息,从预先建立的商品知识图谱的关系网络中获取与所述属性信息对应的商品文本信息;以及
应用获取的所述商品文本信息对所述商品的录入信息进行补全,并入库。
2.根据权利要求1所述的方法,其特征在于,所述利用预先训练的神经网络对所述商品图片进行识别,从所述商品图片中提取所述商品的属性信息包括:
对所述商品的图片进行预处理;
通过深度学习模型从一张图中提取出若干局部细节图;以及
使用训练好的多任务模型进行属性信息预测,或者使用训练好的多个单一任务模型进行属性信息预测。
3.根据权利要求2所述的方法,其特征在于,所述根据所述商品的属性信息,从预先建立的商品知识图谱中获取与所述属性信息对应的商品文本信息包括:
根据预测的所述属性信息,在所述商品知识图谱中全局搜索对应的商品信息;
若搜索不到,则创建与所述属性信息对应的商品信息,并对所述商品知识图谱更新。
4.根据权利要求3所述的方法,其特征在于,所述商品知识图谱的建立包括:
搜集大量的带有各种文字的图片,将这些带有文字说明的图片数据经过处理作为知识图谱的基础数据,所述基础数据中包括图片和图片的文本信息;
对所述基础数据进行实体抽取、关系抽取、属性抽取以及知识抽取,获取有效文本;
并根据所述有效文本建立所述商品知识图谱;
其中,所述商品知识图谱中构建了不同种商品及商品属性类别之间的关系,以及同类别商品中不容种个体之间的关系。
5.根据权利要求1-4任意一项所述的方法,其特征在于,所述方法还包括:
根据所述商品知识图谱,创建和商品知识图谱对应的图像属性特征。
6.一种电子设备,其特征在于,所述电子设备包括:
第一商品信息获取模块,用于当商品入库时,获取供应商和/或电商提供的所述商品的商品信息,所述商品信息包括商品图片和原有商品文本信息;
属性信息获取模块,用于当所述原有商品信息不齐全时,则利用预先训练的神经网络对所述商品图片进行识别,从所述商品图片中提取所述商品的属性信息;
第二商品信息获取模块,用于根据所述商品的属性信息,从预先建立的商品知识图谱的关系网络中获取与所述属性信息对应的商品文本信息;
录入模块,用于应用获取的所述商品文本信息对所述商品的录入信息进行补全,并入库。
7.根据权利要求6所述的设备,其特征在于,所述属性信息获取模块具体包括:
预处理单元,用于对所述商品的图片进行预处理;
细节图提取单元,用于通过深度学习模型从一张图中提取出若干局部细节图;以及
预测单元,用于使用训练好的多任务模型进行属性信息预测,或者使用训练好的多个单一任务模型进行属性信息预测。
8.根据权利要求7所述的设备,其特征在于,所述第二商品信息获取模块具体包括:
搜索单元,用于根据预测的所述属性信息,在所述商品知识图谱中全局搜索对应的商品信息;
第一创建单元,用于当搜索不到时,则创建与所述属性信息对应的商品信息,并对所述商品知识图谱更新。
9.根据权利要求8所述的设备,其特征在于,所述设备还包括商品图谱建立模块,具体包括:
基础数据获取单元,用于搜集大量的带有各种文字的图片,将这些带有文字说明的图片数据经过处理作为知识图谱的基础数据,所述基础数据中包括图片和图片的文本信息;
有效文本获取单元,用于对所述基础数据进行实体抽取、关系抽取、属性抽取以及知识抽取,获取有效文本;
第二创建单元,用于并根据所述有效文本建立所述商品知识图谱;
其中,所述商品知识图谱中构建了不同种商品及商品属性类别之间的关系,以及同类别商品中不容种个体之间的关系。
10.根据权利要求6-9任意一项所述的设备,其特征在于,所述设备还包括:
图像属性特征创建模块,用于根据所述商品知识图谱,创建和商品知识图谱对应的图像属性特征。
CN201710834062.6A 2017-09-15 2017-09-15 一种商品入库时信息录入方法及电子设备 Active CN107705066B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710834062.6A CN107705066B (zh) 2017-09-15 2017-09-15 一种商品入库时信息录入方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710834062.6A CN107705066B (zh) 2017-09-15 2017-09-15 一种商品入库时信息录入方法及电子设备

Publications (2)

Publication Number Publication Date
CN107705066A true CN107705066A (zh) 2018-02-16
CN107705066B CN107705066B (zh) 2022-01-07

Family

ID=61171758

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710834062.6A Active CN107705066B (zh) 2017-09-15 2017-09-15 一种商品入库时信息录入方法及电子设备

Country Status (1)

Country Link
CN (1) CN107705066B (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108898414A (zh) * 2018-05-23 2018-11-27 苏宁易购集团股份有限公司 电商平台的优惠券发放方法及装置
CN109035630A (zh) * 2018-08-21 2018-12-18 深圳码隆科技有限公司 商品信息识别方法和系统
CN109189838A (zh) * 2018-07-16 2019-01-11 安徽信尔联信息科技有限公司 一种商品整理归类方法
CN109325482A (zh) * 2018-09-29 2019-02-12 北京极致盘点科技有限公司 基于图像识别的固定资产盘点方法及装置
CN109472721A (zh) * 2018-11-20 2019-03-15 北京千丁互联科技有限公司 一种房产资源管理方法及系统
CN109902733A (zh) * 2019-02-22 2019-06-18 北京三快在线科技有限公司 录入物品信息的方法、装置及存储介质
CN110059279A (zh) * 2019-03-22 2019-07-26 浙江口碑网络技术有限公司 商品套餐信息的生成方法及装置
CN110674360A (zh) * 2019-09-27 2020-01-10 厦门美亚亿安信息科技有限公司 一种用于数据关联图谱的构建和数据的溯源方法和系统
CN110738372A (zh) * 2019-10-15 2020-01-31 秒针信息技术有限公司 货物的装配方法及装置
CN110880089A (zh) * 2019-11-21 2020-03-13 秒针信息技术有限公司 基于知识图谱的仓库空间分配方法及系统
CN110910065A (zh) * 2019-11-21 2020-03-24 秒针信息技术有限公司 基于大数据和知识图谱的仓库空间分配方法及系统
CN110955791A (zh) * 2018-09-27 2020-04-03 上海小蚁科技有限公司 物品入库、物品信息检索方法及装置、存储介质、终端
CN110968775A (zh) * 2018-09-30 2020-04-07 北京京东尚科信息技术有限公司 商品属性生成模型的训练方法及生成、搜索方法和系统
CN111191012A (zh) * 2018-10-25 2020-05-22 财团法人资讯工业策进会 知识图谱产生装置、方法及其计算机程序产品
CN111199223A (zh) * 2018-11-19 2020-05-26 北京京东尚科信息技术有限公司 识别方法和设备、存储介质及处理器
CN111242712A (zh) * 2018-11-29 2020-06-05 阿里巴巴集团控股有限公司 一种商品展示方法及其装置
CN111242554A (zh) * 2020-01-17 2020-06-05 秒针信息技术有限公司 拣货方式类型确定方法和装置
CN112258259A (zh) * 2019-08-14 2021-01-22 北京京东尚科信息技术有限公司 数据处理方法、装置和计算机可读存储介质
CN112308492A (zh) * 2020-11-10 2021-02-02 济南浪潮高新科技投资发展有限公司 基于深度学习与知识图谱融合的仓库管理方法及系统
CN112395429A (zh) * 2020-12-02 2021-02-23 上海三稻智能科技有限公司 基于图神经网络的hs编码判定、推送、应用方法、系统及存储介质
CN112487787A (zh) * 2020-08-21 2021-03-12 中国银联股份有限公司 一种基于知识图谱确定目标信息的方法和装置
CN112784061A (zh) * 2021-01-27 2021-05-11 数贸科技(北京)有限公司 知识图谱的构建方法、装置、计算设备及存储介质
CN113298609A (zh) * 2021-01-27 2021-08-24 阿里巴巴集团控股有限公司 对象识别码处理方法、对象发布方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930264A (zh) * 2012-09-29 2013-02-13 李炳华 基于图像识别技术的商品陈列信息采集分析系统及方法
CN103955543A (zh) * 2014-05-20 2014-07-30 电子科技大学 基于多模态的服装图像检索方法
CN104462508A (zh) * 2014-12-19 2015-03-25 北京奇虎科技有限公司 基于知识图谱的人物关系搜索方法和装置
CN105808614A (zh) * 2014-12-31 2016-07-27 阿里巴巴集团控股有限公司 建立特产知识库和提供特产信息的方法及服务器
CN106776710A (zh) * 2016-11-18 2017-05-31 广东技术师范学院 一种基于垂直搜索引擎的图文知识库构建方法
CN107077659A (zh) * 2016-09-26 2017-08-18 达闼科技(北京)有限公司 一种智能库存管理系统、服务器、方法、终端和程序产品

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930264A (zh) * 2012-09-29 2013-02-13 李炳华 基于图像识别技术的商品陈列信息采集分析系统及方法
CN103955543A (zh) * 2014-05-20 2014-07-30 电子科技大学 基于多模态的服装图像检索方法
CN104462508A (zh) * 2014-12-19 2015-03-25 北京奇虎科技有限公司 基于知识图谱的人物关系搜索方法和装置
CN105808614A (zh) * 2014-12-31 2016-07-27 阿里巴巴集团控股有限公司 建立特产知识库和提供特产信息的方法及服务器
CN107077659A (zh) * 2016-09-26 2017-08-18 达闼科技(北京)有限公司 一种智能库存管理系统、服务器、方法、终端和程序产品
CN106776710A (zh) * 2016-11-18 2017-05-31 广东技术师范学院 一种基于垂直搜索引擎的图文知识库构建方法

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108898414A (zh) * 2018-05-23 2018-11-27 苏宁易购集团股份有限公司 电商平台的优惠券发放方法及装置
CN109189838A (zh) * 2018-07-16 2019-01-11 安徽信尔联信息科技有限公司 一种商品整理归类方法
CN109035630A (zh) * 2018-08-21 2018-12-18 深圳码隆科技有限公司 商品信息识别方法和系统
CN110955791A (zh) * 2018-09-27 2020-04-03 上海小蚁科技有限公司 物品入库、物品信息检索方法及装置、存储介质、终端
CN109325482A (zh) * 2018-09-29 2019-02-12 北京极致盘点科技有限公司 基于图像识别的固定资产盘点方法及装置
CN109325482B (zh) * 2018-09-29 2022-09-27 北京易盘点科技有限公司 基于图像识别的固定资产盘点方法及装置
CN110968775A (zh) * 2018-09-30 2020-04-07 北京京东尚科信息技术有限公司 商品属性生成模型的训练方法及生成、搜索方法和系统
CN111191012B (zh) * 2018-10-25 2023-05-30 财团法人资讯工业策进会 知识图谱产生装置、方法及其计算机可读存储介质
CN111191012A (zh) * 2018-10-25 2020-05-22 财团法人资讯工业策进会 知识图谱产生装置、方法及其计算机程序产品
CN111199223A (zh) * 2018-11-19 2020-05-26 北京京东尚科信息技术有限公司 识别方法和设备、存储介质及处理器
CN109472721A (zh) * 2018-11-20 2019-03-15 北京千丁互联科技有限公司 一种房产资源管理方法及系统
CN111242712B (zh) * 2018-11-29 2023-04-28 阿里巴巴集团控股有限公司 一种商品展示方法及其装置
CN111242712A (zh) * 2018-11-29 2020-06-05 阿里巴巴集团控股有限公司 一种商品展示方法及其装置
CN109902733A (zh) * 2019-02-22 2019-06-18 北京三快在线科技有限公司 录入物品信息的方法、装置及存储介质
CN110059279A (zh) * 2019-03-22 2019-07-26 浙江口碑网络技术有限公司 商品套餐信息的生成方法及装置
CN110059279B (zh) * 2019-03-22 2021-02-02 浙江口碑网络技术有限公司 商品套餐信息的生成方法及装置
CN112258259A (zh) * 2019-08-14 2021-01-22 北京京东尚科信息技术有限公司 数据处理方法、装置和计算机可读存储介质
CN110674360A (zh) * 2019-09-27 2020-01-10 厦门美亚亿安信息科技有限公司 一种用于数据关联图谱的构建和数据的溯源方法和系统
CN110738372A (zh) * 2019-10-15 2020-01-31 秒针信息技术有限公司 货物的装配方法及装置
CN110910065A (zh) * 2019-11-21 2020-03-24 秒针信息技术有限公司 基于大数据和知识图谱的仓库空间分配方法及系统
CN110880089A (zh) * 2019-11-21 2020-03-13 秒针信息技术有限公司 基于知识图谱的仓库空间分配方法及系统
CN111242554A (zh) * 2020-01-17 2020-06-05 秒针信息技术有限公司 拣货方式类型确定方法和装置
CN111242554B (zh) * 2020-01-17 2023-10-17 秒针信息技术有限公司 拣货方式类型确定方法和装置
CN112487787A (zh) * 2020-08-21 2021-03-12 中国银联股份有限公司 一种基于知识图谱确定目标信息的方法和装置
CN112308492A (zh) * 2020-11-10 2021-02-02 济南浪潮高新科技投资发展有限公司 基于深度学习与知识图谱融合的仓库管理方法及系统
CN112395429A (zh) * 2020-12-02 2021-02-23 上海三稻智能科技有限公司 基于图神经网络的hs编码判定、推送、应用方法、系统及存储介质
CN112784061A (zh) * 2021-01-27 2021-05-11 数贸科技(北京)有限公司 知识图谱的构建方法、装置、计算设备及存储介质
CN113298609A (zh) * 2021-01-27 2021-08-24 阿里巴巴集团控股有限公司 对象识别码处理方法、对象发布方法、装置、设备及介质

Also Published As

Publication number Publication date
CN107705066B (zh) 2022-01-07

Similar Documents

Publication Publication Date Title
CN107705066A (zh) 一种商品入库时信息录入方法及电子设备
CN111428053B (zh) 一种面向税务领域知识图谱的构建方法
CN106156286B (zh) 面向专业文献知识实体的类型抽取系统及方法
CN105760507B (zh) 基于深度学习的跨模态主题相关性建模方法
CN110222160A (zh) 智能语义文档推荐方法、装置及计算机可读存储介质
CN101794311B (zh) 基于模糊数据挖掘的中文网页自动分类方法
CN110263180B (zh) 意图知识图谱生成方法、意图识别方法及装置
CN107220295A (zh) 一种人民矛盾调解案例搜索和调解策略推荐方法
CN108984518A (zh) 一种面向裁判文书的文本分类方法
Wong et al. An unsupervised framework for extracting and normalizing product attributes from multiple web sites
CN103823824A (zh) 一种借助互联网自动构建文本分类语料库的方法及系统
CN103744981A (zh) 一种基于网站内容用于网站自动分类分析的系统
CN103886020B (zh) 一种房地产信息快速搜索方法
CN107679110A (zh) 结合文本分类与图片属性提取完善知识图谱的方法及装置
CN112559684A (zh) 一种关键词提取及信息检索方法
CN103577462A (zh) 一种文档分类方法及装置
CN106874397B (zh) 一种面向物联网设备的自动语义标注方法
CN110019703A (zh) 数据标记方法及装置、智能问答方法及系统
CN103778206A (zh) 一种网络服务资源的提供方法
CN110008473A (zh) 一种基于迭代方法的医疗文本命名实体识别标注方法
CN107908749B (zh) 一种基于搜索引擎的人物检索系统及方法
CN112685440B (zh) 标记搜索语义角色的结构化查询信息表达方法
CN103049454B (zh) 一种基于多标签分类的中英文搜索结果可视化系统
CN103177126B (zh) 用于搜索引擎的色情用户查询识别方法及设备
Dann et al. Reconstructing the giant: Automating the categorization of scientific articles with deep learning techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20211209

Address after: 571900 4001, third floor, incubation building, Hainan Ecological Software Park, high tech industry demonstration zone, Laocheng Town, Chengmai County, Hainan Province

Applicant after: Vipshop (Hainan) e-commerce Co.,Ltd.

Address before: 510000 room 01, No.314, Fangcun Avenue middle, Liwan District, Guangzhou City, Guangdong Province

Applicant before: GUANGZHOU WEIPINHUI RESEARCH INSTITUTE CO.,LTD.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant