CN112288512B - 信息处理方法、装置、电子设备及可读存储介质 - Google Patents
信息处理方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN112288512B CN112288512B CN202011074550.XA CN202011074550A CN112288512B CN 112288512 B CN112288512 B CN 112288512B CN 202011074550 A CN202011074550 A CN 202011074550A CN 112288512 B CN112288512 B CN 112288512B
- Authority
- CN
- China
- Prior art keywords
- standard
- attribute
- name
- target
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 26
- 238000003672 processing method Methods 0.000 title claims abstract description 19
- 238000003860 storage Methods 0.000 title claims abstract description 11
- 238000000034 method Methods 0.000 claims abstract description 49
- 238000005065 mining Methods 0.000 claims abstract description 30
- 230000001960 triggered effect Effects 0.000 claims abstract description 22
- 230000004044 response Effects 0.000 claims abstract description 10
- 230000002776 aggregation Effects 0.000 claims description 38
- 238000004220 aggregation Methods 0.000 claims description 38
- 238000013145 classification model Methods 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000004931 aggregating effect Effects 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 9
- 238000002372 labelling Methods 0.000 claims description 7
- 238000012795 verification Methods 0.000 claims description 7
- 230000015654 memory Effects 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 230000001502 supplementing effect Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 239000013589 supplement Substances 0.000 claims description 2
- 241000209094 Oryza Species 0.000 description 8
- 235000007164 Oryza sativa Nutrition 0.000 description 8
- 238000010276 construction Methods 0.000 description 8
- 235000009566 rice Nutrition 0.000 description 8
- 235000013311 vegetables Nutrition 0.000 description 8
- 235000013372 meat Nutrition 0.000 description 7
- 235000013305 food Nutrition 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 235000015278 beef Nutrition 0.000 description 5
- 239000000306 component Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 235000021186 dishes Nutrition 0.000 description 5
- 239000000463 material Substances 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 235000013527 bean curd Nutrition 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 235000013555 soy sauce Nutrition 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 235000012149 noodles Nutrition 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 1
- 241000124879 Grus leucogeranus Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
- G06Q30/0625—Directed, with specific intent or strategy
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开的实施例提供了一种信息处理方法、装置、电子设备及可读存储介质,所述方法包括:响应针对目标对象触发的第一操作,在预先建立的标准信息库中检索与目标对象相匹配的目标标准对象,标准信息库中包括标准对象的对象名称和标准对象的属性标签,标准对象为对网络中的对象进行信息挖掘所得到;输出目标标准对象对应的属性标签;响应针对目标标准对象对应的属性标签触发的第二操作,生成目标对象对应的录入信息,录入信息包括:录入的对象名称和录入的属性标签;根据标准信息库,校验录入信息的合理性;若确定录入信息的合理性满足预设条件,则根据录入信息更新标准信息库。本公开实施例可以提高用户录入目标对象信息的效率和准确率。
Description
技术领域
本公开的实施例涉及互联网技术领域,尤其涉及一种信息处理方法、装置、电子设备及可读存储介质。
背景技术
随着电子商务平台的发展,通过互联网展示、宣传、销售商品的形式越来越趋于平常化。商品的种类也越来越多样化,如服装鞋帽、家具家电、食品生鲜,以及目前兴起的餐饮外卖行业中各商家提供的菜品等。
商家可以在电商平台中录入商品信息,由此可以通过电商平台将商品信息展示给消费者,以使消费者可以在线浏览、购买商家提供的商品。
在商家录入商品信息的过程中,为了减少手动输入的操作成本,以及提高录入商品信息的效率,电商平台可以根据待录入商品的商品名称以及商家类别自动推荐需要录入的商品信息。
然而,自动推荐的商品信息只考虑了商品名称和商家类别,导致推荐的商品信息不够完整,且缺乏个性化。以餐饮外卖场景为例,对于同一个菜品,不同商家可能会选择不同的食材、配料、做法等,对该菜品的描述也具有较大的差异,因此,电商平台自动推荐的商品信息难以满足不同商家的预期,进而影响商家录入商品信息的效率。
发明内容
本公开的实施例提供一种信息处理方法、装置、电子设备及可读存储介质,用以提高录入目标对象信息的效率和准确率。
根据本公开的实施例的第一方面,提供了一种信息处理方法,所述方法包括:
响应针对目标对象触发的第一操作,在预先建立的标准信息库中检索与所述目标对象相匹配的目标标准对象,其中,所述标准信息库中包括标准对象的对象名称和标准对象的属性标签,所述标准对象为对网络中的对象进行信息挖掘所得到;
输出所述目标标准对象对应的属性标签;
响应针对所述目标标准对象对应的属性标签触发的第二操作,生成所述目标对象对应的录入信息,所述录入信息包括:录入的对象名称和录入的属性标签;
根据所述标准信息库,校验所述录入信息的合理性;
若确定所述录入信息的合理性满足预设条件,则根据所述录入信息更新所述标准信息库。
根据本公开的实施例的第二方面,提供了一种信息处理装置,所述装置包括:
检索模块,用于响应针对目标对象触发的第一操作,在预先建立的标准信息库中检索与所述目标对象相匹配的目标标准对象,其中,所述标准信息库中包括标准对象的对象名称和标准对象的属性标签,所述标准对象为对网络中的对象进行信息挖掘所得到;
推荐模块,用于输出所述目标标准对象对应的属性标签;
生成模块,用于响应针对所述目标标准对象对应的属性标签触发的第二操作,生成所述目标对象对应的录入信息,所述录入信息包括:录入的对象名称和录入的属性标签;
校验模块,用于根据所述标准信息库,校验所述录入信息的合理性;
更新模块,用于若确定所述录入信息的合理性满足预设条件,则根据所述录入信息更新所述标准信息库。
根据本公开的实施例的第三方面,提供了一种电子设备,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现前述信息处理方法。
根据本公开的实施例的第四方面,提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述信息处理方法。
本公开的实施例提供了一种信息处理方法、装置、电子设备及可读存储介质,所述方法包括:
响应针对目标对象触发的第一操作,在预先建立的标准信息库中检索与所述目标对象相匹配的目标标准对象,其中,所述标准信息库中包括标准对象的对象名称和标准对象的属性标签,所述标准对象为对网络中的对象进行信息挖掘所得到;输出所述目标标准对象对应的属性标签;响应针对所述目标标准对象对应的属性标签触发的第二操作,生成所述目标对象对应的录入信息,所述录入信息包括:录入的对象名称和录入的属性标签;根据所述标准信息库,校验所述录入信息的合理性;若确定所述录入信息的合理性满足预设条件,则根据所述录入信息更新所述标准信息库。
本公开实施例通过预先建立标准信息库,可以辅助用户进行对象信息的录入,在用户录入目标对象信息时,可以自动向用户推荐符合其需求的目标对象的属性标签,提高用户录入目标对象信息的效率和准确率,节约时间和人力成本。此外,本公开实施例利用挖掘的标准对象的属性标签辅助用户进行对象信息的录入的基础上,还对目标对象的录入信息进行校验,若确定所述录入信息的合理性满足预设条件,则根据所述录入信息更新所述标准信息库,以不断扩充并完善标准信息库。
附图说明
为了更清楚地说明本公开的实施例的技术方案,下面将对本公开的实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示出了本公开的一个实施例中的信息处理方法的步骤流程图;
图2示出了本公开的一个实施例中的信息处理方法的整体流程示意图;
图3示出了本公开的一个实施例中的信息处理装置的结构图;
图4示出了本公开的一个实施例提供的电子设备的结构图。
具体实施方式
下面将结合本公开的实施例中的附图,对本公开的实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开的实施例一部分实施例,而不是全部的实施例。基于本公开的实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开的实施例保护的范围。
实施例一
参照图1,其示出了本公开的一个实施例中的信息处理方法的步骤流程图,所述方法包括:
步骤101、响应针对目标对象触发的第一操作,在预先建立的标准信息库中检索与所述目标对象相匹配的目标标准对象,其中,所述标准信息库中包括标准对象的对象名称和标准对象的属性标签,所述标准对象为对网络中的对象进行信息挖掘所得到;
步骤102、输出所述目标标准对象对应的属性标签;
步骤103、响应针对所述目标标准对象对应的属性标签触发的第二操作,生成所述目标对象对应的录入信息,所述录入信息包括:录入的对象名称和录入的属性标签;
步骤104、根据所述标准信息库,校验所述录入信息的合理性;
步骤105、若确定所述录入信息的合理性满足预设条件,则根据所述录入信息更新所述标准信息库。
本公开实施例预先建立标准信息库,以辅助用户进行对象信息的录入,在用户录入目标对象信息时,本公开实施例可以自动向用户推荐符合其需求的目标对象的属性标签,提高用户录入目标对象信息的效率和准确率,节约时间和人力成本。
本公开实施例提供的方法可应用于电子设备,所述电子设备包括人机交互界面,用户可以通过所述人机交互界面进行操作,使所述电子设备执行特定的功能。该人机交互界面的实现形态可以是网页、或者应用页面,或者窗口等。所述电子设备包括但不限于:服务器、智能手机、录音笔、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving Picture Experts Group Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving Picture Experts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。
进一步地,所述电子设备中可以安装有客户端,客户端可以是APP(Application,简称APP)或者万维网使用的网页浏览器等,所述客户端可以显示有信息录入界面。本公开实施例可以接收用户通过所述信息录入界面针对目标对象触发的第一操作。所述目标对象为待录入的对象。所述第一操作为用于触发录入目标对象信息的操作。
在本公开实施例中,所述对象可以包括商品、文档、音乐、视频等可标注属性标签的任意内容。本公开实施例对所述对象的具体类别不做限制。为便于描述,本公开实施例中以所述对象为商品为例进行描述,所述商品可以为服装、电器、书籍、食品、菜品等任意类型的商品。进一步地,本公开实施例主要以所述商品为外卖点餐场景中的菜品为例进行说明。
本公开实施例响应所述第一操作,在预先建立的标准信息库中检索与所述目标对象相匹配的目标标准对象,并且输出所述目标标准对象对应的属性标签,以使用户可以根据推荐的所述目标标准对象对应的属性标签,快捷录入目标对象的信息。可选地,以所述对象为菜品为例,所述标准对象为标准菜品,所述标准菜品对应的属性标签包括但不限于品类、做法、口味、食材、荤素、菜系等多维度的属性标签。可以理解,本公开实施例对所述属性标签的具体内容不做限制。
其中,标准对象是指对一类对象进行标准化处理,过滤掉描述词,仅保留核心成分得到的通用化对象。例如,对“特色腐竹炒肉/大份”这样一个菜品名称,进行标准化处理后得到的标准菜品的名称为“腐竹炒肉”,以及对该标准菜品挖掘的属性标签包括:食材:腐竹、肉,菜系:中式菜。
一个示例中,假设接收到用户通过所述信息录入界面针对目标对象触发的第一操作,且接收到用户输入的该目标对象的名称为“卤肉盖浇饭”,则首先在预先建立的标准信息库中检索与该目标对象相匹配的目标标准对象。例如,检索到与目标对象“卤肉盖浇饭”相匹配的目标标准对象为“盖浇饭”,则输出该目标标准对象对应的属性标签,以辅助用户快速录入该目标对象的属性信息。所述标准信息库中包括标准对象的对象名称和标准对象的属性标签,所述标准对象为对网络中的对象进行信息挖掘所得到,本公开实施例基于标准信息库推荐目标对象的属性标签,使得推荐的属性标签既符合目标对象的特征又符合用户的个性化需求,可以提高自动录入目标对象信息的准确性。
接下来,本公开实施例可以接收用户针对推荐的目标标准对象对应的属性标签触发的第二操作,所述第二操作可用于从推荐的属性标签中确定目标属性标签。
在本公开的一种可选实施例中,所述第二操作包括但不限于:选择操作、修改操作、删除操作中的至少一种。
例如,所述第二操作可以为从推荐的属性标签中选择目标属性标签,或者,所述第二操作可以为从推荐的属性标签中选择候选属性标签,并且对选择的候选属性标签进行编辑修改得到目标属性标签,或者,所述第二操作可以为从推荐的属性标签中选择候选属性标签,并且对选择的候选属性标签中不需要的标签维度进行删除得到目标属性标签等。在实际应用中,用户可以根据推荐的属性标签一键选择,也可以对推荐的属性标签选择性填入或修改等,本公开实施例对所述第二操作的具体类型不做限制。
本公开实施例响应所述第二操作,根据用户确定的目标属性标签生成所述目标对象对应的录入信息,实现对目标对象信息的自动录入,提高录入效率。所述录入信息可以包括:录入的对象名称和录入的属性标签。
最后,在录入目标对象信息之后,本公开实施例还可以根据所述标准信息库,校验所述录入信息的合理性。若确定所述录入信息的合理性满足预设条件,则根据所述录入信息更新所述标准信息库,以不断扩充并完善已有的标准信息库。
本公开实施例的信息处理方法可以包括如下三个部分:信息挖掘、信息聚合、信息推荐。
其中,信息挖掘,指通过数据端(D端)挖掘标准对象的对象名称和标准对象的多维度属性标签,建立标准信息库的过程。
本公开实施例对所述标准信息库的存储位置不做限制。可选地,所述标准信息库可以保存在数据端。所述数据端可以包括数据服务器、数据服务器集群等。
信息聚合,指构建标准信息库之后,对标准信息库中已挖掘的属性标签进行聚合,保留其中置信度较高的属性标签,过滤掉置信度较低的属性标签,得到过滤后的标准信息库。过滤后的标准信息库可用于在信息录入过程中自动推荐符合目标对象的属性标签。
信息推荐,指在用户录入目标对象信息的过程中,基于过滤后的标准信息库主动向用户推荐与所述目标对象相匹配的标准对象的属性信息,以供用户选择或修改。
本公开实施例预先挖掘标准对象的对象名称和标准对象的多维度属性标签,在用户输入目标对象的名称后,通过关联与目标对象名称相匹配的标准对象,为待录入的目标对象智能推荐多维度的属性标签,用户在推荐的属性标签基础上选择或调整后即可完成目标对象的信息录入,提升对象信息录入的效率。
此外,本公开实施例利用挖掘的标准对象的属性标签辅助用户进行对象信息的录入的基础上,还对目标对象的录入信息进行校验,并且根据校验结果对录入的目标对象的属性标签(以下简称录入标签)与挖掘的标准对象的属性标签(以下简称挖掘标签)进行融合,以扩充并完善所述标准信息库。参照图2,示出了本公开的信息处理方法的整体流程示意图,图2以电商场景为例,所述对象为商品,具体为菜品。对于电商场景,通过图2所示的流程可以打通数据端(D端)和商家端(B端)的商品属性标签生产过程,在提高自动推荐商品属性标签的准确性以及满足个性化需求的基础上,还可以提升商品信息建设的完备性和一致性。其中,所述商品信息建设,包括但不限于商品属性标签的推荐与挖掘。
商品信息建设对提升商家商品质量,丰富用户决策信息、优化浏览路径,建设供需链接的高效通道,具有重要的价值和意义。
在电商场景下,商品信息建设包括商家端商品属性标签的录入、数据端商品属性标签的挖掘两部分。其中,商家端通过自动关联与目标商品名称相匹配的标准商品,进而推荐标准商品的属性标签的方式,进行商品信息的录入与管理;数据端通过商品名称、商家名称及商家类别等信息进行挖掘,或者直接利用商家录入商品信息的方式,挖掘商品属性标签,供搜索、推荐等线上业务进行召回、排序等。
本公开实施例基于挖掘的标准信息库,可以提高推荐目标对象的属性标签的完备性和一致性,提高用户录入属性标签的准确性与个性化。此外,对于电商场景,利用商家录入的属性标签可以对挖掘的商品属性标签进行补充和完善,打通数据端和商家端两端的标签体系,可以提升商品信息建设的效率和质量。
在本公开的一种可选实施例中,所述在预先建立的标准信息库中检索与所述目标对象相匹配的目标标准对象,包括:
步骤S11、获取用户输入的所述目标对象的对象名称;
步骤S12、在预先建立的标准信息库中,对所述目标对象的对象名称与所述标准信息库中的标准对象的对象名称进行匹配,得到相似度大于预设阈值的多个候选标准对象;
步骤S13、基于分词匹配模型对所述多个候选标准对象进行排序,得到匹配度最高的目标标准对象。
本公开实施例在接收到用户通过客户端针对目标对象触发的第一操作后,可以获取用户输入的所述目标对象的对象名称,通过对标准信息库进行检索,对所述目标对象的对象名称与所述标准信息库中的标准对象的对象名称进行匹配,召回相似度大于预设阈值的多个候选标准对象。然后基于分词匹配模型对所述多个候选标准对象进行排序,得到匹配度最高的目标标准对象。将匹配度最高的目标标准对象的属性标签推荐给用户。
在本公开的一种可选实施例中,所述响应针对目标对象触发的第一操作之前,所述方法还可以包括:
步骤S21、收集网络中对象的对象名称、各对象对应的归属者名称、以及各对象对应归属者的归属类别;
步骤S22、根据所述各对象对应的对象名称、归属者名称、以及归属类别,挖掘标准对象的对象名称和标准对象的属性标签;
步骤S23、基于挖掘的标准对象的对象名称和标准对象的属性标签,建立标准信息库。
以电商场景为例,所述对象可以为商品,可以建立包括标准商品的商品名称和标准商品的属性标签的标准信息库。所述对象名称指商品名称,所述各对象对应的归属者名称指各商品所属商家的商家名称。所述各对象对应归属者的归属类别指各商品所属商家的商家类别。
本公开实施例可以收集网络中各商品的商品名称、各商品所属商家的商家名称、以及各商品所属商家的商家类别,根据所述各商品对应的商品名称、商家名称、以及商家类别,挖掘标准商品的商品名称和标准商品的属性标签,基于挖掘的标准商品的商品名称和标准商品的属性标签,建立标准信息库。
在本公开的一种可选实施例中,所述根据所述各对象对应的对象名称、归属者名称、以及归属类别,挖掘标准对象的对象名称和标准对象的属性标签,可以包括:
根据所述各对象对应的对象名称、归属者名称、以及归属类别,基于规则投票模型和/或文本分类模型,挖掘标准对象的对象名称和标准对象的属性标签,其中,所述文本分类模型为根据训练数据和标注信息训练得到,所述训练数据包括对象名称样本、归属者名称样本、以及归属类别样本,所述标注信息包括对所述对象名称样本、归属者名称样本、归属类别样本分别标注的属性标签。
以电商场景为例,所述对象可以为商品,可以基于规则投票模型和/或文本分类模型,挖掘标准商品的商品名称和标准商品的属性标签。
一个示例中,首先根据商品名称、商家名称、以及商家类别分别挖掘商品的属性标签,再通过规则投票模型确定商品最终的属性标签。例如,某商品的商品名称为“卤肉盖浇饭”,根据商品名称可以挖掘属性标签为“盖浇饭”。该商品对应的商家名称为“白鹤村卤鸡面”,根据商家名称可以挖掘属性标签为“面”。该商家对应的商家类别为“盖浇饭”,根据商家类别可以挖掘属性标签为“盖浇饭”。通过规则投票模型可以确定该商品最终的属性标签为“盖浇饭”。
进一步地,如果根据商品名称、商家名称、以及商家类别挖掘得到的属性标签均不相同,无法根据规则投票模型确定最终的属性标签,则可以通过预先训练好的文本分类模型确定商品的属性标签。
所述文本分类模型可以为根据机器学习方法和大量的训练数据,对现有的神经网络进行有监督训练得到的。需要说明的是,本公开实施例对所述文本分类模型的模型结构以及训练方法不加以限制。所述文本分类模型可以是融合了多种神经网络的分类模型。所述神经网络包括但不限于以下的至少一种或者至少两种的组合、叠加、嵌套:CNN(Convolutional NeuralNetwork,卷积神经网络)、LSTM(Long Short-Term Memory,长短时记忆)网络、RNN(SimpleRecurrentNeuralNetwork,循环神经网络)、CRF(ConditionalRandom Field,条件随机场)、注意力神经网络等。
可以理解,本公开实施例对所述训练数据的标注信息不做限制。例如,所述标注信息还可以包括不同价格信息下商品对应的属性标签等。
在本公开的一种可选实施例中,所述建立标准信息库之后,所述方法还可以包括:
步骤S31、对于收集的各对象,分别计算每个对象与所述标准信息库中各标准对象之间的第一匹配度;
步骤S32、对所述收集的各对象按照所述第一匹配度进行聚合,得到每个标准对象对应的第一聚合结果;
步骤S33、根据所述第一聚合结果,分别计算每个标准对象的对象名称对应的第一置信度,以及每个标准对象的各属性标签分别对应的第二置信度;
步骤S34、根据所述第一置信度和所述第二置信度,对所述标准信息库中各标准对象的对象名称以及属性标签进行过滤,得到过滤后的标准信息库。
以电商场景为例,所述对象可以为商品,以所述商品为菜品为例。
本公开实施例根据数据端构建的标准信息库(也即标准菜品库),通过文本相似度模型,建立收集的各对象(各菜品)与标准对象(标准菜品)之间的匹配关系,以获得标准对象(标准菜品)下的属性标签聚合结果。具体地,分别统计标准对象(标准菜)维度的第一聚合结果以及各属性标签维度的第二聚合结果。进而可以计算标准对象(标准菜)维度的第一置信度以及各属性标签维度的第二置信度。根据所述第一置信度和所述第二置信度可以判断标准信息库中已挖掘的属性标签是否合理,并且过滤掉不合理的属性标签,得到过滤后的标准信息库。过滤后的标准信息库中的属性标签均为合理的、置信度高的属性标签。由此可以提高推荐属性标签的准确度。
在本公开的一种可选实施例中,所述根据所述第一聚合结果,分别计算每个标准对象的对象名称对应的第一置信度,以及每个标准对象的各属性标签分别对应的第二置信度,可以包括:
步骤S41、统计所述第一聚合结果中每个标准对象的对象名称对应的第一对象数量和第一对象占比,以及所述第一聚合结果中每个标准对象的各属性标签分别对应的第二对象数量和第二对象占比;
步骤S42、根据所述第一对象数量和第一对象占比,计算第一置信度,以及根据所述第二对象数量和第二对象占比,计算第二置信度。
以电商场景为例,所述对象可以为商品,以所述商品为菜品为例。分别以标准菜维度和属性标签维度统计商品数量和商品占比,计算第一置信度和第二置信度。通过计算置信度,判断已挖掘的属性标签的合理性。
具体地,统计所述第一聚合结果中每个标准菜的标准菜名称对应的第一商品数量和第一商品占比,以及统计所述第一聚合结果中每个标准菜的各属性标签分别对应的第二商品数量和第二商品占比。根据所述第一商品数量和第一商品占比,计算第一置信度,以及根据所述第二商品数量和第二商品占比,计算第二置信度。
对于标准菜维度,第一置信度scoreSi计算如下:
其中,表示第i个标准菜的第一置信度,表示统计的第i个标准菜对应的第一商品数量。只有在标准菜下的商品数量大于一定阈值时,统计数据才有意义。通过上式(1),可以过滤掉统计信息不足的标准菜品及属性标签。
对于属性标签维度,第二置信度计算如下:
其中,表示第i个标准菜的第j个属性标签的第二置信度,表示统计的第i个标准菜的第j个属性标签对应的第二商品数量,表示统计的第i个标准菜对应的第一商品数量。对于某个标准菜,当其某个属性标签下的商品数量在该标准菜下全部商品数量中所占比例高于一定阈值时,说明该标准菜的此属性标签可信。通过上式(2),可以过滤掉属性标签的随机错误。
本公开实施例利用标准信息库中各标准对象的对象名称,对各标准对象的属性标签进行聚合,即一个标准对象的对象名称可以关联若干个相似对象,通过对某个标准对象的对象名称下的属性标签进行聚合,保留其中出现频率较高的高置信度属性标签,作为该标准对象的属性标签。
在本公开的一种可选实施例中,所述根据所述标准信息库,校验所述录入信息的合理性,可以包括:
步骤S51、计算所述录入的对象名称与所述标准信息库中各标准对象的对象名称之间的第二匹配度;
步骤S52、对所述录入的对象名称按照所述第二匹配度进行聚合,得到每个录入的对象名称对应的第二聚合结果;
步骤S53、根据所述第二聚合结果,分别计算每个录入的对象名称对应的第三置信度,以及每个录入的属性标签对应的第四置信度;
步骤S54、根据所述第三置信度和所述第四置信度,确定所述录入的对象名称的合理性,以及所述录入的属性标签的合理性。
在生成所述目标对象对应的录入信息之后,本公开实施例根据所述标准信息库,校验所述录入信息的合理性。
以电商场景为例,所述对象可以为商品,以所述商品为菜品为例。具体地,计算录入的菜品名称与所述标准菜品库中各标准菜品的菜品名称之间的第二匹配度,对所述录入的菜品名称按照所述第二匹配度进行聚合,得到每个录入的菜品名称对应的第二聚合结果。根据所述第二聚合结果,分别基于菜品维度计算每个录入的菜品名称对应的第三置信度,以及基于属性标签维度计算每个录入的属性标签对应的第四置信度;根据所述第三置信度和所述第四置信度,确定所述录入的菜品名称的合理性,以及所述录入的属性标签的合理性。
其中,计算第三置信度的方法与计算第一置信度的方法相同,计算第四置信度与计算第二置信度的方法相同,此处不再进行赘述,相互参照即可。
本公开实施例在利用挖掘的标准对象的属性标签辅助用户进行对象信息的录入的基础上,还对目标对象的录入信息进行校验,如果校验得到录入信息合理,则根据录入信息进一步扩充并完善已有的标准信息库;可选地,如果校验得到录入信息不合理,可以输入提示信息,提示用户是否对当前的录入信息进行修改,以辅助用户录入更加合理的目标对象信息。
在本公开的一种可选实施例中,所述根据所述录入信息更新所述标准信息库,包括:
利用录入的属性标签补充所述标准对象中缺失的属性标签,或者,利用录入的属性标签替换所述标准对象中不一致的属性标签。
本公开实施例利用挖掘的标准对象的属性标签辅助用户进行对象信息的录入,同时对用户录入的目标对象的信息进行校验,并且根据校验结果对标准信息库进行扩充及完善。对于电商场景,可以打通数据端和商家端的商品属性标签生产流程,在提高自动推荐商品属性标签的准确性以及满足个性化需求的基础上,还可以提升商品信息建设的完备性和一致性。
以电商场景为例,所述对象可以为商品,以所述商品为菜品为例。
在录入信息(包括录入的菜品名称和录入的该菜品名称对应的属性标签)经过标准信息库的校验之后,若确定所述录入信息的合理性满足预设条件,则对标准信息库中预先挖掘的该菜品的属性标签和当前录入的属性标签进行比对,对于挖掘缺失的属性标签,可以利用校验后的录入的属性标签进行补充。对于预先挖掘的该菜品的属性标签和当前录入的属性标签不一致的情况,可以用校验后的录入属性标签进行替换。
一个示例中,标准信息库中存在某个标准菜品,该标准菜品的名称为“红烧牛肉”,预先挖掘的标准菜品的属性标签通常为一些常规的共性标签,如牛肉。某商家在录入目标菜品“红烧牛肉”时,可以向该商家推荐该标准菜品对应的属性标签。该商家在选择推荐的属性标签后,假设增加了新的属性标签,如辅材:土豆。在录入的目标菜品“红烧牛肉”和其对应的属性标签经过标准信息库的校验之后,可以将用户新增的属性标签补充到标准信息库中标准菜品“红烧牛肉”的属性标签中。
本公开实施例通过融合校验后的录入属性标签,可以获得不同商家的个性化标签,由此,使得标准信息库中的属性标签得到不断完善并且可以体现不同商家的个性化信息。
此外,对于预先挖掘的和录入的相同维度的属性标签,利用校验后的录入属性标签对挖掘的属性标签可以进行修正,进一步验证和提升标准信息库中属性标签的准确性。
综上,本公开实施例通过预先建立标准信息库,可以辅助用户进行对象信息的录入,在用户录入目标对象信息时,可以自动向用户推荐符合其需求的目标对象的属性标签,提高用户录入目标对象信息的效率和准确率,节约时间和人力成本。
此外,本公开实施例利用挖掘的标准对象的属性标签辅助用户进行对象信息的录入的基础上,还对目标对象的录入信息进行校验,若确定所述录入信息的合理性满足预设条件,则根据所述录入信息更新所述标准信息库,以不断扩充并完善标准信息库。对于电商场景,可以打通数据端和商家端的商品属性标签生产流程,在提高自动推荐商品属性标签的准确性以及满足个性化需求的基础上,还可以提升商品信息建设的完备性和一致性。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开实施例并不受所描述的动作顺序的限制,因为依据本公开实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本公开实施例所必须的。
实施例二
参照图3,其示出了本公开的一个实施例中的信息处理装置的结构图,具体如下。
检索模块201,用于响应针对目标对象触发的第一操作,在预先建立的标准信息库中检索与所述目标对象相匹配的目标标准对象,其中,所述标准信息库中包括标准对象的对象名称和标准对象的属性标签,所述标准对象为对网络中的对象进行信息挖掘所得到;
推荐模块202,用于输出所述目标标准对象对应的属性标签;
生成模块203,用于响应针对所述目标标准对象对应的属性标签触发的第二操作,生成所述目标对象对应的录入信息,所述录入信息包括:录入的对象名称和录入的属性标签;
校验模块204,用于根据所述标准信息库,校验所述录入信息的合理性;
更新模块205,用于若确定所述录入信息的合理性满足预设条件,则根据所述录入信息更新所述标准信息库。
可选地,所述装置还包括:
收集模块,用于收集网络中对象的对象名称、各对象对应的归属者名称、以及各对象对应归属者的归属类别;
挖掘模块,用于根据所述各对象对应的对象名称、归属者名称、以及归属类别,挖掘标准对象的对象名称和标准对象的属性标签;
建立模块,用于基于挖掘的标准对象的对象名称和标准对象的属性标签,建立标准信息库。
可选地,所述挖掘模块,具体用于根据所述各对象对应的对象名称、归属者名称、以及归属类别,基于规则投票模型和/或文本分类模型,挖掘标准对象的对象名称和标准对象的属性标签,其中,所述文本分类模型为根据训练数据和标注信息训练得到,所述训练数据包括对象名称样本、归属者名称样本、以及归属类别样本,所述标注信息包括对所述对象名称样本、归属者名称样本、归属类别样本分别标注的属性标签。
可选地,所述装置还包括:
第一计算模块,用于对于收集的各对象,分别计算每个对象与所述标准信息库中各标准对象之间的第一匹配度;
第一聚合模块,用于对所述收集的各对象按照所述第一匹配度进行聚合,得到每个标准对象对应的第一聚合结果;
第二计算模块,用于根据所述第一聚合结果,分别计算每个标准对象的对象名称对应的第一置信度,以及每个标准对象的各属性标签分别对应的第二置信度;
数据过滤模块,用于根据所述第一置信度和所述第二置信度,对所述标准信息库中各标准对象的对象名称以及属性标签进行过滤,得到过滤后的标准信息库。
可选地,所述第二计算模块,包括:
统计子模块,用于统计所述第一聚合结果中每个标准对象的对象名称对应的第一对象数量和第一对象占比,以及所述第一聚合结果中每个标准对象的各属性标签分别对应的第二对象数量和第二对象占比;
第一置信计算子模块,用于根据所述第一对象数量和第一对象占比,计算第一置信度,以及根据所述第二对象数量和第二对象占比,计算第二置信度。
可选地,所述校验模块,包括:
匹配计算子模块,用于计算所述录入的对象名称与所述标准信息库中各标准对象的对象名称之间的第二匹配度;
聚合子模块,用于对所述录入的对象名称按照所述第二匹配度进行聚合,得到每个录入的对象名称对应的第二聚合结果;
第二置信计算子模块,用于根据所述第二聚合结果,分别计算每个录入的对象名称对应的第三置信度,以及每个录入的属性标签对应的第四置信度;
合理性确定子模块,用于根据所述第三置信度和所述第四置信度,确定所述录入的对象名称的合理性,以及所述录入的属性标签的合理性。
可选地,所述更新模块,具体用于利用录入的属性标签补充所述标准对象中缺失的属性标签,或者,利用录入的属性标签替换所述标准对象中不一致的属性标签。
可选地,所述检索模块,包括:
获取子模块,用于获取用户输入的所述目标对象的对象名称;
匹配子模块,用于在预先建立的标准信息库中,对所述目标对象的对象名称与所述标准信息库中的标准对象的对象名称进行匹配,得到相似度大于预设阈值的多个候选标准对象;
排序子模块,用于基于分词匹配模型对所述多个候选标准对象进行排序,得到匹配度最高的目标标准对象。
可选地,所述第二操作包括:选择操作、修改操作、删除操作中的至少一种。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开的实施例还提供了一种电子设备,参见图4,包括:处理器301、存储器302以及存储在所述存储器上并可在所述处理器上运行的计算机程序3021,所述处理器执行所述程序时实现前述实施例的信息处理方法。
本公开的实施例还提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述实施例的信息处理方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本公开的实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本公开的实施例的内容,并且上面对特定语言所做的描述是为了披露本公开的实施例的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本公开的实施例的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本公开的实施例的示例性实施例的描述中,本公开的实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本公开的实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本公开的实施例的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
本公开的实施例的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开的实施例的排序设备中的一些或者全部部件的一些或者全部功能。本公开的实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本公开的实施例的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本公开的实施例进行说明而不是对本公开的实施例进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开的实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述仅为本公开的实施例的较佳实施例而已,并不用以限制本公开的实施例,凡在本公开的实施例的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本公开的实施例的保护范围之内。
以上所述,仅为本公开的实施例的具体实施方式,但本公开的实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开的实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的实施例的保护范围之内。因此,本公开的实施例的保护范围应以权利要求的保护范围为准。
Claims (18)
1.一种信息处理方法,其特征在于,所述方法包括:
响应针对目标对象触发的第一操作,在预先建立的标准信息库中检索与所述目标对象相匹配的目标标准对象,其中,所述标准信息库中包括标准对象的对象名称和标准对象的属性标签,所述标准对象为对网络中的对象进行信息挖掘所得到,所述第一操作为用于触发录入所述目标对象的操作;
输出所述目标标准对象对应的属性标签;
响应针对所述目标标准对象对应的属性标签触发的第二操作,生成所述目标对象对应的录入信息,所述录入信息包括:录入的对象名称和录入的属性标签,其中,所述第二操作为从推荐的所述属性标签中选择目标属性标签,或者,所述第二操作为从推荐的所述属性标签中选择候选属性标签,并且对选择的所述候选属性标签进行编辑修改得到目标属性标签,或者,所述第二操作为从推荐的所述属性标签中选择候选属性标签,并且对选择的候选属性标签中不需要的标签维度进行删除得到目标属性标签;
根据所述标准信息库,校验所述录入信息的合理性;
若确定所述录入信息的合理性满足预设条件,则根据所述录入信息更新所述标准信息库。
2.根据权利要求1所述的方法,其特征在于,所述响应针对目标对象触发的第一操作之前,所述方法还包括:
收集网络中对象的对象名称、各对象对应的归属者名称、以及各对象对应归属者的归属类别;
根据所述各对象对应的对象名称、归属者名称、以及归属类别,挖掘标准对象的对象名称和标准对象的属性标签;
基于挖掘的标准对象的对象名称和标准对象的属性标签,建立标准信息库。
3.根据权利要求2所述的方法,其特征在于,所述根据所述各对象对应的对象名称、归属者名称、以及归属类别,挖掘标准对象的对象名称和标准对象的属性标签,包括:
根据所述各对象对应的对象名称、归属者名称、以及归属类别,基于规则投票模型和/或文本分类模型,挖掘标准对象的对象名称和标准对象的属性标签,其中,所述文本分类模型为根据训练数据和标注信息训练得到,所述训练数据包括对象名称样本、归属者名称样本、以及归属类别样本,所述标注信息包括对所述对象名称样本、归属者名称样本、归属类别样本分别标注的属性标签。
4.根据权利要求2所述的方法,其特征在于,所述建立标准信息库之后,所述方法还包括:
对于收集的各对象,分别计算每个对象与所述标准信息库中各标准对象之间的第一匹配度;
对所述收集的各对象按照所述第一匹配度进行聚合,得到每个标准对象对应的第一聚合结果;
根据所述第一聚合结果,分别计算每个标准对象的对象名称对应的第一置信度,以及每个标准对象的各属性标签分别对应的第二置信度;
根据所述第一置信度和所述第二置信度,对所述标准信息库中各标准对象的对象名称以及属性标签进行过滤,得到过滤后的标准信息库。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一聚合结果,分别计算每个标准对象的对象名称对应的第一置信度,以及每个标准对象的各属性标签分别对应的第二置信度,包括:
统计所述第一聚合结果中每个标准对象的对象名称对应的第一对象数量和第一对象占比,以及所述第一聚合结果中每个标准对象的各属性标签分别对应的第二对象数量和第二对象占比;
根据所述第一对象数量和第一对象占比,计算第一置信度,以及根据所述第二对象数量和第二对象占比,计算第二置信度。
6.根据权利要求1所述的方法,其特征在于,所述根据所述标准信息库,校验所述录入信息的合理性,包括:
计算所述录入的对象名称与所述标准信息库中各标准对象的对象名称之间的第二匹配度;
对所述录入的对象名称按照所述第二匹配度进行聚合,得到每个录入的对象名称对应的第二聚合结果;
根据所述第二聚合结果,分别计算每个录入的对象名称对应的第三置信度,以及每个录入的属性标签对应的第四置信度;
根据所述第三置信度和所述第四置信度,确定所述录入的对象名称的合理性,以及所述录入的属性标签的合理性。
7.根据权利要求1所述的方法,其特征在于,所述根据所述录入信息更新所述标准信息库,包括:
利用录入的属性标签补充所述标准对象中缺失的属性标签,或者,利用录入的属性标签替换所述标准对象中不一致的属性标签。
8.根据权利要求1所述的方法,其特征在于,所述在预先建立的标准信息库中检索与所述目标对象相匹配的目标标准对象,包括:
获取用户输入的所述目标对象的对象名称;
在预先建立的标准信息库中,对所述目标对象的对象名称与所述标准信息库中的标准对象的对象名称进行匹配,得到相似度大于预设阈值的多个候选标准对象;
基于分词匹配模型对所述多个候选标准对象进行排序,得到匹配度最高的目标标准对象。
9.一种信息处理装置,其特征在于,所述装置包括:
检索模块,用于响应针对目标对象触发的第一操作,在预先建立的标准信息库中检索与所述目标对象相匹配的目标标准对象,其中,所述标准信息库中包括标准对象的对象名称和标准对象的属性标签,所述标准对象为对网络中的对象进行信息挖掘所得到,所述第一操作为用于触发录入所述目标对象的操作;
推荐模块,用于输出所述目标标准对象对应的属性标签;
生成模块,用于响应针对所述目标标准对象对应的属性标签触发的第二操作,生成所述目标对象对应的录入信息,所述录入信息包括:录入的对象名称和录入的属性标签,其中,所述第二操作为从推荐的所述属性标签中选择目标属性标签,或者,所述第二操作为从推荐的所述属性标签中选择候选属性标签,并且对选择的所述候选属性标签进行编辑修改得到目标属性标签,或者,所述第二操作为从推荐的所述属性标签中选择候选属性标签,并且对选择的候选属性标签中不需要的标签维度进行删除得到目标属性标签;
校验模块,用于根据所述标准信息库,校验所述录入信息的合理性;
更新模块,用于若确定所述录入信息的合理性满足预设条件,则根据所述录入信息更新所述标准信息库。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
收集模块,用于收集网络中对象的对象名称、各对象对应的归属者名称、以及各对象对应归属者的归属类别;
挖掘模块,用于根据所述各对象对应的对象名称、归属者名称、以及归属类别,挖掘标准对象的对象名称和标准对象的属性标签;
建立模块,用于基于挖掘的标准对象的对象名称和标准对象的属性标签,建立标准信息库。
11.根据权利要求10所述的装置,其特征在于,所述挖掘模块,具体用于根据所述各对象对应的对象名称、归属者名称、以及归属类别,基于规则投票模型和/或文本分类模型,挖掘标准对象的对象名称和标准对象的属性标签,其中,所述文本分类模型为根据训练数据和标注信息训练得到,所述训练数据包括对象名称样本、归属者名称样本、以及归属类别样本,所述标注信息包括对所述对象名称样本、归属者名称样本、归属类别样本分别标注的属性标签。
12.根据权利要求10所述的装置,其特征在于,所述装置还包括:
第一计算模块,用于对于收集的各对象,分别计算每个对象与所述标准信息库中各标准对象之间的第一匹配度;
第一聚合模块,用于对所述收集的各对象按照所述第一匹配度进行聚合,得到每个标准对象对应的第一聚合结果;
第二计算模块,用于根据所述第一聚合结果,分别计算每个标准对象的对象名称对应的第一置信度,以及每个标准对象的各属性标签分别对应的第二置信度;
数据过滤模块,用于根据所述第一置信度和所述第二置信度,对所述标准信息库中各标准对象的对象名称以及属性标签进行过滤,得到过滤后的标准信息库。
13.根据权利要求12所述的装置,其特征在于,所述第二计算模块,包括:
统计子模块,用于统计所述第一聚合结果中每个标准对象的对象名称对应的第一对象数量和第一对象占比,以及所述第一聚合结果中每个标准对象的各属性标签分别对应的第二对象数量和第二对象占比;
第一置信计算子模块,用于根据所述第一对象数量和第一对象占比,计算第一置信度,以及根据所述第二对象数量和第二对象占比,计算第二置信度。
14.根据权利要求9所述的装置,其特征在于,所述校验模块,包括:
匹配计算子模块,用于计算所述录入的对象名称与所述标准信息库中各标准对象的对象名称之间的第二匹配度;
聚合子模块,用于对所述录入的对象名称按照所述第二匹配度进行聚合,得到每个录入的对象名称对应的第二聚合结果;
第二置信计算子模块,用于根据所述第二聚合结果,分别计算每个录入的对象名称对应的第三置信度,以及每个录入的属性标签对应的第四置信度;
合理性确定子模块,用于根据所述第三置信度和所述第四置信度,确定所述录入的对象名称的合理性,以及所述录入的属性标签的合理性。
15.根据权利要求9所述的装置,其特征在于,所述更新模块,具体用于利用录入的属性标签补充所述标准对象中缺失的属性标签,或者,利用录入的属性标签替换所述标准对象中不一致的属性标签。
16.根据权利要求9所述的装置,其特征在于,所述检索模块,包括:
获取子模块,用于获取用户输入的所述目标对象的对象名称;
匹配子模块,用于在预先建立的标准信息库中,对所述目标对象的对象名称与所述标准信息库中的标准对象的对象名称进行匹配,得到相似度大于预设阈值的多个候选标准对象;
排序子模块,用于基于分词匹配模型对所述多个候选标准对象进行排序,得到匹配度最高的目标标准对象。
17.一种电子设备,其特征在于,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-8中任一所述的信息处理方法。
18.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如方法权利要求1-8中任一所述的信息处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011074550.XA CN112288512B (zh) | 2020-10-09 | 2020-10-09 | 信息处理方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011074550.XA CN112288512B (zh) | 2020-10-09 | 2020-10-09 | 信息处理方法、装置、电子设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112288512A CN112288512A (zh) | 2021-01-29 |
CN112288512B true CN112288512B (zh) | 2024-07-16 |
Family
ID=74422790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011074550.XA Active CN112288512B (zh) | 2020-10-09 | 2020-10-09 | 信息处理方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112288512B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117785899A (zh) * | 2023-12-27 | 2024-03-29 | 行吟信息科技(武汉)有限公司 | 一种标签管理方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109447749A (zh) * | 2018-10-24 | 2019-03-08 | 口碑(上海)信息技术有限公司 | 商品信息录入方法及装置 |
CN109859004A (zh) * | 2019-01-10 | 2019-06-07 | 珠海金山网络游戏科技有限公司 | 一种基于历史数据的商品推荐方法及系统 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090163183A1 (en) * | 2007-10-04 | 2009-06-25 | O'donoghue Hugh | Recommendation generation systems, apparatus and methods |
CN106570612A (zh) * | 2016-10-08 | 2017-04-19 | 中国南方电网有限责任公司 | 一种基于数据挖掘的隐患等级自动评估方法 |
CN107688606A (zh) * | 2017-07-26 | 2018-02-13 | 北京三快在线科技有限公司 | 一种推荐信息的获取方法及装置,电子设备 |
CN108061558A (zh) * | 2017-11-30 | 2018-05-22 | 深圳中兴网信科技有限公司 | 智能路线导航方法、装置、服务器、移动终端和存储介质 |
CN110309412A (zh) * | 2018-03-15 | 2019-10-08 | 阿里巴巴集团控股有限公司 | 提供服饰搭配信息的方法、装置及电子设备 |
CN108694658A (zh) * | 2018-07-31 | 2018-10-23 | 深圳春沐源控股有限公司 | 一种商品信息推送方法、相关装置及存储介质 |
CN111444334B (zh) * | 2019-01-16 | 2023-04-25 | 阿里巴巴集团控股有限公司 | 数据处理方法、文本识别方法、装置及计算机设备 |
CN109871457A (zh) * | 2019-01-30 | 2019-06-11 | 北京百度网讯科技有限公司 | 基于图像的数据处理方法、装置、电子设备和存储介质 |
US10553316B1 (en) * | 2019-04-04 | 2020-02-04 | Kpn Innovations, Llc | Systems and methods for generating alimentary instruction sets based on vibrant constitutional guidance |
CN110297934B (zh) * | 2019-07-04 | 2024-03-15 | 腾讯科技(深圳)有限公司 | 一种图像数据处理方法、装置及存储介质 |
CN111080335A (zh) * | 2019-10-17 | 2020-04-28 | 广东禧越网络科技有限公司 | 一种基于购物平台的商品价格管控方法 |
-
2020
- 2020-10-09 CN CN202011074550.XA patent/CN112288512B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109447749A (zh) * | 2018-10-24 | 2019-03-08 | 口碑(上海)信息技术有限公司 | 商品信息录入方法及装置 |
CN109859004A (zh) * | 2019-01-10 | 2019-06-07 | 珠海金山网络游戏科技有限公司 | 一种基于历史数据的商品推荐方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112288512A (zh) | 2021-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108629665B (zh) | 一种个性化商品推荐方法和系统 | |
TWI631474B (zh) | Method and device for product identification label and method for product navigation | |
US8407104B2 (en) | Catalog based price search | |
US8682739B1 (en) | Identifying objects in video | |
KR101419504B1 (ko) | 사용자 성향 분석을 통한 맞춤형 쇼핑 정보 제공 시스템 및 방법 | |
US11550856B2 (en) | Artificial intelligence for product data extraction | |
CN109840796B (zh) | 决策因素分析装置与决策因素分析方法 | |
CN107833082B (zh) | 一种商品图片的推荐方法和装置 | |
US20230214895A1 (en) | Methods and systems for product discovery in user generated content | |
CN110827112B (zh) | 深度学习的商品推荐方法、装置、计算机设备及存储介质 | |
CN105718184A (zh) | 一种数据处理方法和装置 | |
US11580585B1 (en) | User-preferred item attributes | |
CN107632984A (zh) | 一种聚类数据表的展现方法、装置和系统 | |
US11682060B2 (en) | Methods and apparatuses for providing search results using embedding-based retrieval | |
CN103885951A (zh) | 一种图文信息的投放、生成方法及装置 | |
CA2655196A1 (en) | System and method for generating a display of tags | |
US20200226168A1 (en) | Methods and systems for optimizing display of user content | |
WO2019072098A1 (zh) | 一种识别核心产品词的方法和系统 | |
CN105931082B (zh) | 一种商品类目关键词提取方法和装置 | |
US20220058227A1 (en) | Artificial intelligence for product data extraction | |
TWI645348B (zh) | 商品相關網路文章之自動圖文摘要方法及系統 | |
CN112488781A (zh) | 搜索推荐方法、装置、电子设备及可读存储介质 | |
CN116308684B (zh) | 一种网购平台店铺信息推送方法及系统 | |
CN105989125B (zh) | 对无结果词进行标签识别的搜索方法和系统 | |
CN113761347A (zh) | 一种商品推荐方法、装置、存储介质及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |