CN116561652B - 一种标签标注方法及装置、电子设备、存储介质 - Google Patents
一种标签标注方法及装置、电子设备、存储介质 Download PDFInfo
- Publication number
- CN116561652B CN116561652B CN202310355912.XA CN202310355912A CN116561652B CN 116561652 B CN116561652 B CN 116561652B CN 202310355912 A CN202310355912 A CN 202310355912A CN 116561652 B CN116561652 B CN 116561652B
- Authority
- CN
- China
- Prior art keywords
- information
- label
- attribute
- determining
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000002372 labelling Methods 0.000 title claims abstract description 60
- 238000013473 artificial intelligence Methods 0.000 claims abstract description 24
- 238000000034 method Methods 0.000 claims abstract description 22
- 230000008451 emotion Effects 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 17
- 230000011218 segmentation Effects 0.000 claims description 13
- 239000003086 colorant Substances 0.000 claims description 9
- 238000012423 maintenance Methods 0.000 abstract description 8
- 241000220225 Malus Species 0.000 description 25
- 235000021016 apples Nutrition 0.000 description 12
- 235000009508 confectionery Nutrition 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 235000010724 Wisteria floribunda Nutrition 0.000 description 4
- 235000013399 edible fruits Nutrition 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 241000581835 Monodora junodii Species 0.000 description 2
- 240000008790 Musa x paradisiaca Species 0.000 description 2
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000779 smoke Substances 0.000 description 2
- 244000021317 Annona cherimola Species 0.000 description 1
- 241000207199 Citrus Species 0.000 description 1
- 235000011430 Malus pumila Nutrition 0.000 description 1
- 235000015103 Malus silvestris Nutrition 0.000 description 1
- 241000700647 Variola virus Species 0.000 description 1
- 235000009754 Vitis X bourquina Nutrition 0.000 description 1
- 235000012333 Vitis X labruscana Nutrition 0.000 description 1
- 240000006365 Vitis vinifera Species 0.000 description 1
- 235000014787 Vitis vinifera Nutrition 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000013312 flour Nutrition 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 235000011888 snacks Nutrition 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开一种标签标注方法及装置、电子设备、存储介质,涉及计算机技术领域,便于在有效提高数据利用效率的同时,使信息标注更准确且无需额外的维护。所述方法包括:获取待标注信息;通过第一模型,确定所述待标注信息对应的语义关键词,所述第一模型为基于人工智能的模型;根据所述语义关键词,确定所述待标注信息对应的信息分类标准,所述信息分类标准的数量为至少一个;确定每个所述信息分类标准下包括的分类条目,其中,每个所述分类条目具有一个对应的条目标签;根据所述语义关键词以及所述条目标签,为所述待标注信息标注目标标签。本发明可用于信息标注中。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种标签标注方法及装置、电子设备、存储介质。
背景技术
在大数据时代,为了挖掘数据中的有效信息,常常需要为数据标注相应的标签。标签是一种信息分类和标记机制。通常可以通过标签快速获知相关信息的基本特征,例如用户的年龄、性别、地区等,也可以通过事物的标签,对事物进行分类和相应处理。
相关技术中,标签一般根据用户的需求预先定义,并由人工或计算机系统对信息标注标签。然而,随着时间的推移和数据的快速增长及变化,原有的标签可能会不再适合当前的需要,因此需要花费大量的时间和精力重新定义标签并利用新定义的标签重新对信息进行标注。此外,由于标签需要根据用户需求定义,导致信息中如果含有一些标签定义未覆盖到的内容,就不能对该内容进行有效的挖掘,进而无法充分发挥数据的有效价值,数据利用效率低。
发明内容
有鉴于此,本发明实施例提供一种标签标注方法及装置、电子设备及存储介质,便于在有效提高数据利用效率的同时,使信息标注更准确且无需额外的维护。
第一方面,本发明实施例提供一种标签标注方法,包括:获取待标注信息;通过第一模型,确定所述待标注信息对应的语义关键词,所述第一模型为基于人工智能的模型;根据所述语义关键词,确定所述待标注信息对应的信息分类标准,所述信息分类标准的数量为至少一个;确定每个所述信息分类标准下包括的分类条目,其中,每个所述分类条目具有一个对应的条目标签;根据所述语义关键词以及所述条目标签,为所述待标注信息标注目标标签。
在一种实施方式中,所述通过第一模型,确定所述待标注信息对应的语义关键词包括:将所述待标注信息输入所述第一模型;基于所述第一模型,对所述待标注信息进行分词处理,得到对应的词语序列;根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,确定所述待标注信息对应的语义关键词。
在一种实施方式中,所述根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,确定所述待标注信息对应的语义关键词包括:根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,从所述词语序列选择至少一个词语作为语义关键词;或者,根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,生成至少一个语义关键词。
在一种实施方式中,所述根据所述语义关键词,确定所述待标注信息对应的信息分类标准包括:根据所述语义关键词的词意,确定所述语义关键词所描述的对象属性,得到目标属性,其中,所述语义关键词为所述目标属性的一个属性值;根据所述目标属性,确定所述待标注信息对应的信息分类标准。
在一种实施方式中,所述根据所述目标属性,确定所述待标注信息对应的信息分类标准包括:在预设的数据库中查找所述目标属性;在查找到所述目标属性的情况下,根据所述数据库中预先存储的目标属性与信息分类标准的对应关系,确定所述待标注信息对应的信息分类标准;在未查找到所述目标属性的情况下,为所述目标属性创建新的信息分类标准并存储到所述数据库中。
在一种实施方式中,所述确定每个所述信息分类标准下包括的分类条目包括:根据所述语义关键词的词意,确定所述语义关键词所描述的对象属性,得到目标属性,其中,所述语义关键词为所述目标属性的一个属性值;根据预设属性规则或第二模型,获取所述目标属性对应的全部属性值,得到所述目标属性的属性值集合;所述第二模型为基于人工智能的模型;根据所述目标属性的属性值集合,确定所述信息分类标准下包括的分类条目。
在一种实施方式中,所述根据所述语义关键词以及所述条目标签,为所述待标注信息标注目标标签包括:根据多个所述语义关键词各自对应的目标属性之间的关系,确定所述待标注信息、除所述目标属性之外的至少一个对象属性,得到备选属性,所述备选属性具有预设的属性值集合;根据所述备选属性的属性值集合,确定所述待标注信息的备选标签;基于所述条目标签和所述备选标签,为所述待标注信息标注目标标签。
在一种实施方式中,所述基于所述条目标签和所述备选标签,为所述待标注信息标注目标标签包括:根据所述语义关键词,从所述条目标签中选择至少一个标签,得到第一标签;根据预设选择规则或第三模型,从所述备选标签中选择至少一个标签,得到第二标签;所述第三模型为基于人工智能的模型;将所述第一标签和所述第二标签作为目标标签,为所述待标注信息标注。
第二方面,本发明的实施例还提供一种标签标注装置,包括:获取单元,用于获取待标注信息;第一确定单元,用于通过第一模型,确定所述待标注信息对应的语义关键词,所述第一模型为基于人工智能的模型;第二确定单元,用于根据所述语义关键词,确定所述待标注信息对应的信息分类标准,所述信息分类标准的数量为至少一个;第三确定单元,用于确定每个所述信息分类标准下包括的分类条目,其中,每个所述分类条目具有一个对应的条目标签;标注单元,用于根据所述语义关键词以及所述条目标签,为所述待标注信息标注目标标签。
在一种实施方式中,所述第一确定单元包括:输入模块,用于将所述待标注信息输入所述第一模型;分词模块,用于基于所述第一模型,对所述待标注信息进行分词处理,得到对应的词语序列;第一确定模块,用于根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,确定所述待标注信息对应的语义关键词。
在一种实施方式中,所述第一确定模块,具体用于:根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,从所述词语序列选择至少一个词语作为语义关键词;或者,根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,生成至少一个语义关键词。
在一种实施方式中,所述第二确定单元包括:第二确定模块,用于根据所述语义关键词的词意,确定所述语义关键词所描述的对象属性,得到目标属性,其中,所述语义关键词为所述目标属性的一个属性值;第三确定模块,用于根据所述目标属性,确定所述待标注信息对应的信息分类标准。
在一种实施方式中,所述第三确定模块,具体用于:在预设的数据库中查找所述目标属性;在查找到所述目标属性的情况下,根据所述数据库中预先存储的目标属性与信息分类标准的对应关系,确定所述待标注信息对应的信息分类标准;在未查找到所述目标属性的情况下,为所述目标属性创建新的信息分类标准并存储到所述数据库中。
在一种实施方式中,所述第三确定单元包括:第四确定模块,用于根据所述语义关键词的词意,确定所述语义关键词所描述的对象属性,得到目标属性,其中,所述语义关键词为所述目标属性的一个属性值;获取模块,用于根据预设属性规则或第二模型,获取所述目标属性对应的全部属性值,得到所述目标属性的属性值集合;所述第二模型为基于人工智能的模型;第五确定模块,用于根据所述目标属性的属性值集合,确定所述信息分类标准下包括的分类条目。
在一种实施方式中,所述标注单元包括:第六确定模块,用于根据多个所述语义关键词各自对应的目标属性之间的关系,确定所述待标注信息、除所述目标属性之外的至少一个对象属性,得到备选属性,所述备选属性具有预设的属性值集合;第七确定模块,用于根据所述备选属性的属性值集合,确定所述待标注信息的备选标签;标注模块,用于基于所述条目标签和所述备选标签,为所述待标注信息标注目标标签。
在一种实施方式中,所述标注模块,具体用于:根据所述语义关键词,从所述条目标签中选择至少一个标签,得到第一标签;根据预设选择规则或第三模型,从所述备选标签中选择至少一个标签,得到第二标签;所述第三模型为基于人工智能的模型;将所述第一标签和所述第二标签作为目标标签,为所述待标注信息标注。
第三方面,本发明的实施例还提供一种电子设备,所述电子设备包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为上述电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行本发明的实施例提供的任一种标签标注方法。
第四方面,本发明的实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现本发明的实施例提供的任一种标签标注方法。
本发明的实施例提供的标签标注方法及装置、电子设备及存储介质,能够获取待标注信息,通过第一模型,确定所述待标注信息对应的语义关键词,根据所述语义关键词,确定所述待标注信息对应的信息分类标准,并确定每个所述信息分类标准下包括的分类条目,根据所述语义关键词以及所述分类条目下的条目标签,为所述待标注信息标注目标标签。由于第一模型为基于人工智能的模型,便于随着待标注信息的不同而进行训练和调整,这样,一方面便于充分挖掘待标注信息中的有效信息,提高大数据的利用效率,另一方面,在基于第一模型进行语义分析时,也能够从待标注信息中得到更为准确的语义关键词,并根据语义关键词得到更为准确的信息分类标准及每个信息分类标准下的分类条目,从而使标签系统能够更准确地进行动态更新,而无需进行额外的维护工作,因此,本公开的技术方案便于在有效提高数据利用效率的同时,使信息标注更准确且无需额外的维护。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的实施例提供的标签标注方法的一种流程图;
图2为本发明的实施例提供的标签标注方法及应用的一种流程图;
图3为图2中的数据处理阶段的一种流程图;
图4为本发明的实施例提供的标签标注装置的一种结构示意图;
图5为本发明的实施例提供的电子设备的一种结构示意图。
具体实施方式
下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
第一方面,本发明实施例提供一种标签标注方法,便于在有效提高数据利用效率的同时,使信息标注更准确且无需额外的维护。
如图1所示,本发明的实施例提供的标签标注方法,可以包括:
S11,获取待标注信息;
本发明的实施例中,待标注信息可以指需要进行标注标签操作的各种信息,具体可以有多种形式,例如文本信息、语音信息、视频信息等。为了便于后续处理,在本发明的一个实施例中,对于非文本形式的待标注信息,可以先转换为文本形式。
S12,通过第一模型,确定所述待标注信息对应的语义关键词,所述第一模型为基于人工智能的模型;
在本发明的一个实施例中,一方面,第一模型可以为能够进行语义理解的各种模型,例如可以为NLP(Natural Language Processing,自然语言处理)模型。另一方面,第一模型也可以是能够随着待标注信息的不同而进行训练学习,并优化调整的模型,例如,第一模型可以为基于人工智能的模型。
待标注信息对应的语义关键词,可以指能够代表待标注信息含义的关键性词语。其中,待标注信息的含义,既可以包括待标注信息的字面意思,也可以结合上下文语境,包含待标注信息字里行间所表达的含义。相应的,待标注信息对应的语义关键词,既可以本身就包含在待标注信息中,是待标注信息的一部分,也可以不明确包含在待标注信息中。
S13,根据所述语义关键词,确定所述待标注信息对应的信息分类标准,所述信息分类标准的数量为至少一个;
待标注信息中可以包括一个或多个语义关键词,其中,至少一个语义关键词可以具有对应的信息分类标准,也即是说,一个待标注信息可以具有一个或多个信息分类标准。其中,信息分类标准可以指按照何种标准或从何种角度,对信息进行分类。同一个待标注信息,按照不同的信息分类标准,可以划分入不同的类别。
举例而言,在本发明的一个实施例中,待标注信息为“我想买些苹果,最好是又脆又甜的,大小倒是无所谓,我知道山西苹果好吃”,那么,该待标注信息对应的语义关键词例如可以包括:苹果、最好、脆、甜、大小、无所谓、山西、好吃。语义关键词对应的信息分类标准例如可以包括:苹果----水果种类,最好----偏好程度,脆----口感,甜----味道,大小----体积,无所谓----偏好程度,山西----产地,好吃----偏好程度。即,语义关键词“苹果”对应的信息分类标准为水果种类,语义关键词“最好”对应的信息分类标准为偏好程度,语义关键词“脆”对应的信息分类标准为口感……相应的,在对该待标注信息进行分类时,如果按照水果种类分类,那么该待标注信息可以被划分为“苹果”类,而不是“香蕉”或“葡萄”类,如果按照口感分类,那么该待标注信息可以被划分为“脆”类,而不是“面”或“糯”类,如果按照味道分类,那么该待标注信息可以被划分为“甜”类,而不是“酸”类,等等。
S14,确定每个所述信息分类标准下包括的分类条目,其中,每个所述分类条目具有一个对应的条目标签;
本步骤中,可以详细确定每个信息分类标准下具体包括哪些分类条目,其中,每个所述分类条目具有一个对应的条目标签,例如可以将分类条目的名称作为该分类条目对应的条目标签。举例而言,在本发明的一个实施例中,如果信息分类标准为水果种类,则其对应的分类条目和条目标签可以包括苹果、香蕉、柑橘等,如果信息分类标准为口感,则其对应的分类条目和条目标签可以包括:硬、软、脆、糯、面等。
S15,根据所述语义关键词以及所述条目标签,为所述待标注信息标注目标标签。
本步骤中,可以根据待标注信息的语义关键词以及信息分类标准下的条目标签,为待标注信息进行标注。其中,目标标签,即为对待标注信息标注的标签。可选的,在一个例子中,可以看语义关键词命中哪个或哪些条目标签,就将该条目标签作为目标标签对待标注信息标注,或者可以看语义关键词与哪个或哪些条目标签接近,就将该条目标签作为目标标签对待标注信息标注。
本发明的实施例提供的标签标注方法,能够获取待标注信息,通过第一模型,确定所述待标注信息对应的语义关键词,根据所述语义关键词,确定所述待标注信息对应的信息分类标准,并确定每个所述信息分类标准下包括的分类条目,根据所述语义关键词以及所述分类条目下的条目标签,为所述待标注信息标注目标标签。由于第一模型为基于人工智能的模型,便于随着待标注信息的不同而进行训练和调整,这样,一方面便于充分挖掘待标注信息中的有效信息,提高大数据的利用效率,另一方面,在基于第一模型进行语义分析时,也能够从待标注信息中得到更为准确的语义关键词,并根据语义关键词得到更为准确的信息分类标准及每个信息分类标准下的分类条目,从而使标签系统能够更准确地进行动态更新,而无需进行额外的维护工作,因此,本公开的技术方案便于在有效提高数据利用效率的同时,使信息标注更准确且无需额外的维护。
具体而言,步骤S11中,在获取待标注信息时,既可以通过在线业务数据获取待标注信息,也可以通过各种数据库获取待标注信息。在将各种非文本形式的待标注信息转化为文本形式的待标注信息后,即可进行后续的标注操作。
可选的,在本发明的一个实施例中,获取到待标注信息后,步骤S12通过第一模型,确定所述待标注信息对应的语义关键词具体可以包括:将所述待标注信息输入所述第一模型;基于所述第一模型,对所述待标注信息进行分词处理,得到对应的词语序列;根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,确定所述待标注信息对应的语义关键词。其中,感情色彩可以包括褒义、贬义和中性。
具体的,第一模型可以为自然语言处理模型,可以处理输入其中的文本形式的待标注信息,例如可以处理文本形式的一段对话等。基于第一模型可以对输入其中的待标注信息进行分词处理,从而将待标注信息划分为一系列具有相对独立含义的词语,得到词语序列。例如,可以将“晚饭去吃海底捞”划分为晚饭/去吃/海底捞,得到词语序列:晚饭、去吃、海底捞。得到词语序列后,可以根据词语序列中各词语的词性、词意和感情色彩中的一项或多项,确定待标注信息对应的语义关键词。例如,在一个例子中,词语序列为:我女儿、超级、喜欢、看、冰雪奇缘,则可以得到对应的语义关键词:超级、喜欢、冰雪奇缘。
可选的,在本发明的一个实施例中,根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,确定所述待标注信息对应的语义关键词可以包括:根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,从所述词语序列选择至少一个词语作为语义关键词。即,语义关键词可以包含在词语序列之中。
在本发明的另一个实施例中,根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,确定所述待标注信息对应的语义关键词可以包括:根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,生成至少一个语义关键词。即,语义关键词可以不包含在词语序列之中,而是待标注信息的“言外之意”。例如,在一个例子中,词语序列为:我、2小时前、就、下单了,外卖员、现在、才、送来,则可以根据词语序列中的副词“2小时前”、“现在”、“才”确定,语义关键词包括“配送延迟”、“用户不满”等。
步骤S12确定待标注信息对应的语义关键词之后,即可在步骤S13中,根据所述语义关键词,确定所述待标注信息对应的信息分类标准。具体而言,在本发明的一个实施例中,根据所述语义关键词,确定所述待标注信息对应的信息分类标准具体可以包括:根据所述语义关键词的词意,确定所述语义关键词所描述的对象属性,得到目标属性,其中,所述语义关键词为所述目标属性的一个属性值;根据所述目标属性,确定所述待标注信息对应的信息分类标准。
可以理解的,尽管一个对象可以通过多种属性来描述,例如成分、形状、体积、颜色、产地、价格等等,不同人在不同场景下,对同一个对象,可能会从中选择不同属性来描述。这些在一个待标注信息的语义关键词中所描述的对象属性,即为该待标注信息对应的目标属性。目标属性不是必然包含在待标注信息中,而常常通过其对应的各种属性值来表述。因此,为了确定待标注信息中所描述的目标属性,在本发明的一个实施例中,可以从待标注信息的语义关键词,反推待标注信息所描述的目标属性。即,根据语义关键词这一属性值,反推该属性值对应的属性。
举例而言,在本发明的一个实施例中,待标注信息为“我喜欢吃烟台产的富士苹果”,对应的语义关键词包括:烟台、产、富士苹果,根据属性值“烟台”,可以确定对应的目标属性为:产地,根据属性值“富士苹果”可以确定对应的目标属性为:苹果种类。在另一个例子中,待标注信息为“我想买大大的、红红的、又脆又甜的苹果”,对应的语义关键词包括:大大的、红红的、脆、甜,由属性值“大大的”可以确定对应的目标属性为体积,由属性值“红红的”可以确定对应的目标属性为颜色,由属性值“脆”可以确定对应的目标属性为口感,由属性值“甜”可以确定对应的目标属性为味道。
得到目标属性后,即可根据目标属性,确定待标注信息对应的信息分类标准。在本发明的一个实施例中,可以直接将目标属性作为待标注信息的信息分类标准,例如,目标属性包括颜色,则可以按照颜色,对待标注信息中的苹果进行分类,具体分类例如可以包括:红色苹果、黄色苹果、青苹果。在本发明的另一个实施例中,为了提高效率,也可以根据需要,将几个目标属性进行合并,按照合并后的目标属性确定对应的信息分类标准。例如,将目标属性产地和目标属性品种合并,作为一个信息分类标准进行分类,具体的分类例如可以包括:烟台富士、陕西秦冠、甘肃天水花牛、新疆阿克苏糖心等。
可选的,一方面,在本发明的一个实施例中,目标属性和信息分类标准之间可以具有预先设置的映射关系,可以根据该映射关系确定目标属性对应的信息分类标准。另一方面,目标属性与信息分类标准之间的映射关系,也可能是不完备的,即,一些待标注信息可能从一个崭新的角度(即崭新的目标属性)描述某个对象,该目标属性该如何分类,并没有预先记录在该映射关系中。为此,在具体实施中,根据所述目标属性,确定所述待标注信息对应的信息分类标准可以包括:在预设的数据库中查找所述目标属性;在查找到所述目标属性的情况下,根据所述数据库中预先存储的目标属性与信息分类标准的对应关系,确定所述待标注信息对应的信息分类标准,从而充分利用已有信息,有效提高标注效率;在未查找到所述目标属性的情况下,为所述目标属性创建新的信息分类标准并存储到所述数据库中,从而能够对已有的信息进行扩展和补充,使标签系统自动更新,也令标注更为细致、全面、准确。
进一步地,在本发明的一个实施例中,数据库中除了可以存储目标属性与信息分类标准的对应关系之外,还可以存储信息分类标准下包括的各分类条目和条目标签,则基于此,步骤S14中确定每个信息分类标准下包括的分类条目,具体可以包括:根据数据库中存储的、信息分类标准下包括的分类条目和条目标签,确定每个信息分类标准下包括的分类条目,从而有效提高标注效率。
可选的,在本发明的另一个实施例中,数据库中未存储信息分类标准下包括的各分类条目和条目标签,则基于此,步骤S14中,确定每个所述信息分类标准下包括的分类条目具体可以包括:根据所述语义关键词的词意,确定所述语义关键词所描述的对象属性,得到目标属性,其中,所述语义关键词为所述目标属性的一个属性值;根据预设属性规则或第二模型,获取所述目标属性对应的全部属性值,得到所述目标属性的属性值集合;所述第二模型为基于人工智能的模型;根据所述目标属性的属性值集合,确定所述信息分类标准下包括的分类条目。
举例而言,在本发明的一个实施例中,可以根据语义关键词“红红的”的词意,确定该语义关键词所描述的对象属性为颜色,即目标属性为颜色,“红”即为颜色属性的一个属性值。根据预设属性规则或第二模型,可以获知苹果颜色属性的全部属性值例如可以包括:红色、黄色、青色、条纹等,则该全部属性值组成的集合即为目标属性的属性值集合,可以根据该目标属性的属性值集合确定信息分类标准下包括的分类条目。例如,按照颜色分类,待标注信息中的语义关键词苹果可以包括:红苹果、黄苹果、青苹果、条纹苹果等。
得到分类条目和对应的条目标签后,即可在步骤S15中,根据所述语义关键词以及所述条目标签,为所述待标注信息标注目标标签。例如,可以将语义关键词命中的条目标签或语义关键词相近的条目标签,作为目标标签,对待标注信息进行标注。
考虑到一个待标注信息中,一般只对对象的某一方面或几方面的属性进行描述,而其他方面的属性,或许用户也有自己的偏好,只是没有来得及一一说明,为此,进一步地,在本发明的一个实施例中,步骤S15根据所述语义关键词以及所述条目标签,为所述待标注信息标注目标标签具体可以包括:根据多个所述语义关键词各自对应的目标属性之间的关系,确定所述待标注信息、除所述目标属性之外的至少一个对象属性,得到备选属性,所述备选属性具有预设的属性值集合;根据所述备选属性的属性值集合,确定所述待标注信息的备选标签;基于所述条目标签和所述备选标签,为所述待标注信息标注目标标签。
例如,在本发明的一个实施例中,待标注信息中,语义关键词对应的目标属性包括颜色,属性值为红色,还包括体积,属性值为大果,则可以推测该用户可能偏好外形好、质量优的苹果,而这类苹果通常价格也比较高,则还可以为该待标注信息确定一个备选属性:价格。备选属性价格对应的属性值集合及备选标签例如可以包括:价格很低、价格偏低、价格中等、价格偏高、价格很高。则,可以基于条目标签(红、黄、青,大、中、小等),以及备选标签(价格很低、价格偏低、价格中等、价格偏高、价格很高等),对待标注信息标注。
具体的,基于所述条目标签和所述备选标签,为所述待标注信息标注目标标签可以包括:根据所述语义关键词,从所述条目标签中选择至少一个标签,得到第一标签;根据预设选择规则或第三模型,从所述备选标签中选择至少一个标签,得到第二标签;所述第三模型为基于人工智能的模型;将所述第一标签和所述第二标签作为目标标签,为所述待标注信息标注。
例如,可以根据语义关键词“大”从代表体积的条目标签中选择大苹果作为一个第一标签,根据语义关键词“红”从代表颜色的条目标签中选择红苹果作为另一个第一标签,再根据预设选择规则或第三模型,从代表价格的备选标签中选择价格偏高作为一个第二标签,将第一标签“大苹果”、“红苹果”和第二标签“价格较高”作为目标标签,对待标注信息进行标注。
需要说明的是,本发明的实施例中的第一模型、第二模型和第三模型均为基于人工智能的模型,这三种模型既可以是三个独立的模型,也可以彼此结合,形成一个统一的大模型,本发明的实施例对此不做限定。
对待标注信息进行标注后,得到了已标注信息,就可以根据具体的应用场景,确定该应用场景对应的标签,并将具有该标签的各已标注信息进行聚合和统计。例如,在本发明的一个实施例中,需要统计平台A上个月有哪些用户购买了商品B并且给予了好评。则可以在已标注信息中,筛选出目标标签为购买A,且好评A的用户聚合,统计具体的用户情况。统计出的结果,可以通过手机、显示器等终端显示给相应的人员观看。
示例性的,一种标签标注及应用的具体过程可以如图2所示,具体可以包括数据采集阶段、数据处理阶段和数据展示阶段。具体的,S001:数据采集阶段,从京东接口采集到数据之后放入kafka,随后进入clickhouse做初步的数据处理,然后采集到hive中作为原始数据。S002:数据处理阶段,首先做数据清洗,将数据分为两类,一类为直接进行打标签处理的特定人群数据,另一类为需要先做分词处理(包括但不限于动态情感分词处理)再做打标签处理的文本数据;对文本数据进行分词处理之后形成动态标签体系,随后根据需求对特定人群进行打标处理,最后对打标后的数据根据需求进行统计聚合等操作。S003:数据展示阶段,将数据从clickhouse导入mysql,最终由后端代码读取,在前端页面进行展示。
示例性的,上述数据处理阶段的一种处理方式可以如图3所示,其中,分类1、分类2等即为按照不同的信息分类标准进行分类,对分类1的标签处理、对分类2的标签处理等,具体可以包括对按照信息分类标准分类下,确定每个分类标准下包括的具体分类条目。前文已经进行了详细说明,此处不再赘述。
第二方面,本发明实施例提供一种标签标注装置,便于在有效提高数据利用效率的同时,使信息标注更准确且无需额外的维护。
如图4所示,本发明的实施例还提供一种标签标注装置,该装置可以包括:
获取单元31,用于获取待标注信息;
第一确定单元32,用于通过第一模型,确定所述待标注信息对应的语义关键词,所述第一模型为基于人工智能的模型;
第二确定单元33,用于根据所述语义关键词,确定所述待标注信息对应的信息分类标准,所述信息分类标准的数量为至少一个;
第三确定单元34,用于确定每个所述信息分类标准下包括的分类条目,其中,每个所述分类条目具有一个对应的条目标签;
标注单元35,用于根据所述语义关键词以及所述条目标签,为所述待标注信息标注目标标签。
本发明的实施例提供的标签标注装置,能够获取待标注信息,通过第一模型,确定所述待标注信息对应的语义关键词,根据所述语义关键词,确定所述待标注信息对应的信息分类标准,并确定每个所述信息分类标准下包括的分类条目,根据所述语义关键词以及所述分类条目下的条目标签,为所述待标注信息标注目标标签。由于第一模型为基于人工智能的模型,便于随着待标注信息的不同而进行训练和调整,这样,一方面便于充分挖掘待标注信息中的有效信息,提高大数据的利用效率,另一方面,在基于第一模型进行语义分析时,也能够从待标注信息中得到更为准确的语义关键词,并根据语义关键词得到更为准确的信息分类标准及每个信息分类标准下的分类条目,从而使标签系统能够更准确地进行动态更新,而无需进行额外的维护工作,因此,本公开的技术方案便于在有效提高数据利用效率的同时,使信息标注更准确且无需额外的维护。
在一种实施方式中,第一确定单元32可以包括:
输入模块,用于将所述待标注信息输入所述第一模型;
分词模块,用于基于所述第一模型,对所述待标注信息进行分词处理,得到对应的词语序列;
第一确定模块,用于根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,确定所述待标注信息对应的语义关键词。
在一种实施方式中,所述第一确定模块,具体可以用于:
根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,从所述词语序列选择至少一个词语作为语义关键词;
或者,
根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,生成至少一个语义关键词。
在一种实施方式中,第二确定单元33可以包括:
第二确定模块,用于根据所述语义关键词的词意,确定所述语义关键词所描述的对象属性,得到目标属性,其中,所述语义关键词为所述目标属性的一个属性值;
第三确定模块,用于根据所述目标属性,确定所述待标注信息对应的信息分类标准。
在一种实施方式中,所述第三确定模块,具体可以用于:
在预设的数据库中查找所述目标属性;
在查找到所述目标属性的情况下,根据所述数据库中预先存储的目标属性与信息分类标准的对应关系,确定所述待标注信息对应的信息分类标准;
在未查找到所述目标属性的情况下,为所述目标属性创建新的信息分类标准并存储到所述数据库中。
在一种实施方式中,第三确定单元34可以包括:
第四确定模块,用于根据所述语义关键词的词意,确定所述语义关键词所描述的对象属性,得到目标属性,其中,所述语义关键词为所述目标属性的一个属性值;
获取模块,用于根据预设属性规则或第二模型,获取所述目标属性对应的全部属性值,得到所述目标属性的属性值集合;所述第二模型为基于人工智能的模型;
第五确定模块,用于根据所述目标属性的属性值集合,确定所述信息分类标准下包括的分类条目。
在一种实施方式中,标注单元35可以包括:
第六确定模块,用于根据多个所述语义关键词各自对应的目标属性之间的关系,确定所述待标注信息、除所述目标属性之外的至少一个对象属性,得到备选属性,所述备选属性具有预设的属性值集合;
第七确定模块,用于根据所述备选属性的属性值集合,确定所述待标注信息的备选标签;
标注模块,用于基于所述条目标签和所述备选标签,为所述待标注信息标注目标标签。
在一种实施方式中,所述标注模块,具体可以用于:
根据所述语义关键词,从所述条目标签中选择至少一个标签,得到第一标签;
根据预设选择规则或第三模型,从所述备选标签中选择至少一个标签,得到第二标签;所述第三模型为基于人工智能的模型;
将所述第一标签和所述第二标签作为目标标签,为所述待标注信息标注。
以上图1示出的具体操作可由图4的装置中的各个单元来执行,这里,对于具体操作细节将不再赘述。
第三方面,相应的,本发明实施例提供一种电子设备,便于在有效提高数据利用效率的同时,使信息标注更准确且无需额外的维护。
如图5所示,本发明的实施例提供的一种电子设备,可以包括:壳体41、处理器42、存储器43、电路板44和电源电路45,其中,电路板44安置在壳体41围成的空间内部,处理器42和存储器43设置在电路板44上;电源电路45,用于为上述电子设备的各个电路或器件供电;存储器43用于存储可执行程序代码;处理器42通过读取存储器43中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前述任一实施例所述的标签标注方法。
处理器42对上述步骤的具体执行过程以及处理器42通过运行可执行程序代码来进一步执行的步骤,可以参见前述实施例的描述,在此不再赘述。
该电子设备以多种形式存在,可具有单机或分布式的运算结构,本发明对此不作限制。
第四方面,本发明的实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现前述实施例提供的任一种标签标注方法,因此也能实现相应的技术效果,前文已经进行了详细说明,此处不再赘述。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
为了描述的方便,描述以上装置是以功能分为各种单元/模块分别描述。当然,在实施本发明时可以把各单元/模块的功能在同一个或多个软件和/或硬件中实现。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (14)
1.一种标签标注方法,其特征在于,包括:
获取待标注信息;
通过第一模型,确定所述待标注信息对应的语义关键词,所述第一模型为基于人工智能的模型;
根据所述语义关键词,确定所述待标注信息对应的信息分类标准,所述信息分类标准的数量为至少一个;
确定每个所述信息分类标准下包括的分类条目,其中,每个所述分类条目具有一个对应的条目标签;
根据所述语义关键词以及所述条目标签,为所述待标注信息标注目标标签;
所述根据所述语义关键词,确定所述待标注信息对应的信息分类标准包括:
根据所述语义关键词的词意,确定所述语义关键词所描述的对象属性,得到目标属性,其中,所述语义关键词为所述目标属性的一个属性值;
根据所述目标属性,确定所述待标注信息对应的信息分类标准;
所述根据所述语义关键词以及所述条目标签,为所述待标注信息标注目标标签包括:
根据多个所述语义关键词各自对应的目标属性之间的关系,确定所述待标注信息、除目标属性之外的至少一个对象属性,得到备选属性,所述备选属性具有预设的属性值集合;
根据所述备选属性的属性值集合,确定所述待标注信息的备选标签;
基于所述条目标签和所述备选标签,为所述待标注信息标注目标标签。
2.根据权利要求1所述的方法,其特征在于,所述通过第一模型,确定所述待标注信息对应的语义关键词包括:
将所述待标注信息输入所述第一模型;
基于所述第一模型,对所述待标注信息进行分词处理,得到对应的词语序列;
根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,确定所述待标注信息对应的语义关键词。
3.根据权利要求2所述的方法,其特征在于,所述根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,确定所述待标注信息对应的语义关键词包括:
根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,从所述词语序列选择至少一个词语作为语义关键词;
或者,
根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,生成至少一个语义关键词。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标属性,确定所述待标注信息对应的信息分类标准包括:
在预设的数据库中查找所述目标属性;
在查找到所述目标属性的情况下,根据所述数据库中预先存储的目标属性与信息分类标准的对应关系,确定所述待标注信息对应的信息分类标准;
在未查找到所述目标属性的情况下,为所述目标属性创建新的信息分类标准并存储到所述数据库中。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述确定每个所述信息分类标准下包括的分类条目包括:
根据所述语义关键词的词意,确定所述语义关键词所描述的对象属性,得到目标属性,其中,所述语义关键词为所述目标属性的一个属性值;
根据预设属性规则或第二模型,获取所述目标属性对应的全部属性值,得到所述目标属性的属性值集合;所述第二模型为基于人工智能的模型;
根据所述目标属性的属性值集合,确定所述信息分类标准下包括的分类条目。
6.根据权利要求1所述的方法,其特征在于,所述基于所述条目标签和所述备选标签,为所述待标注信息标注目标标签包括:
根据所述语义关键词,从所述条目标签中选择至少一个标签,得到第一标签;
根据预设选择规则或第三模型,从所述备选标签中选择至少一个标签,得到第二标签;所述第三模型为基于人工智能的模型;
将所述第一标签和所述第二标签作为目标标签,为所述待标注信息标注。
7.一种标签标注装置,其特征在于,包括:
获取单元,用于获取待标注信息;
第一确定单元,用于通过第一模型,确定所述待标注信息对应的语义关键词,所述第一模型为基于人工智能的模型;
第二确定单元,用于根据所述语义关键词,确定所述待标注信息对应的信息分类标准,所述信息分类标准的数量为至少一个;
第三确定单元,用于确定每个所述信息分类标准下包括的分类条目,其中,每个所述分类条目具有一个对应的条目标签;
标注单元,用于根据所述语义关键词以及所述条目标签,为所述待标注信息标注目标标签;
所述第二确定单元包括:
第二确定模块,用于根据所述语义关键词的词意,确定所述语义关键词所描述的对象属性,得到目标属性,其中,所述语义关键词为所述目标属性的一个属性值;
第三确定模块,用于根据所述目标属性,确定所述待标注信息对应的信息分类标准;
所述标注单元包括:
第六确定模块,用于根据多个所述语义关键词各自对应的目标属性之间的关系,确定所述待标注信息、除目标属性之外的至少一个对象属性,得到备选属性,所述备选属性具有预设的属性值集合;
第七确定模块,用于根据所述备选属性的属性值集合,确定所述待标注信息的备选标签;
标注模块,用于基于所述条目标签和所述备选标签,为所述待标注信息标注目标标签。
8.根据权利要求7所述的装置,其特征在于,所述第一确定单元包括:
输入模块,用于将所述待标注信息输入所述第一模型;
分词模块,用于基于所述第一模型,对所述待标注信息进行分词处理,得到对应的词语序列;
第一确定模块,用于根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,确定所述待标注信息对应的语义关键词。
9.根据权利要求8所述的装置,其特征在于,所述第一确定模块,具体用于:
根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,从所述词语序列选择至少一个词语作为语义关键词;
或者,
根据所述词语序列中各词语的词性、词意和感情色彩中的至少一项,生成至少一个语义关键词。
10.根据权利要求7所述的装置,其特征在于,所述第三确定模块,具体用于:
在预设的数据库中查找所述目标属性;
在查找到所述目标属性的情况下,根据所述数据库中预先存储的目标属性与信息分类标准的对应关系,确定所述待标注信息对应的信息分类标准;
在未查找到所述目标属性的情况下,为所述目标属性创建新的信息分类标准并存储到所述数据库中。
11.根据权利要求7至10中任一项所述的装置,其特征在于,所述第三确定单元包括:
第四确定模块,用于根据所述语义关键词的词意,确定所述语义关键词所描述的对象属性,得到目标属性,其中,所述语义关键词为所述目标属性的一个属性值;
获取模块,用于根据预设属性规则或第二模型,获取所述目标属性对应的全部属性值,得到所述目标属性的属性值集合;所述第二模型为基于人工智能的模型;
第五确定模块,用于根据所述目标属性的属性值集合,确定所述信息分类标准下包括的分类条目。
12.根据权利要求7所述的装置,其特征在于,所述标注模块,具体用于:
根据所述语义关键词,从所述条目标签中选择至少一个标签,得到第一标签;
根据预设选择规则或第三模型,从所述备选标签中选择至少一个标签,得到第二标签;所述第三模型为基于人工智能的模型;
将所述第一标签和所述第二标签作为目标标签,为所述待标注信息标注。
13.一种电子设备,其特征在于,所述电子设备包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为上述电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前述权利要求1至6任一项所述的标签标注方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现前述权利要求1至6中任一项所述的标签标注方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310355912.XA CN116561652B (zh) | 2023-04-04 | 2023-04-04 | 一种标签标注方法及装置、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310355912.XA CN116561652B (zh) | 2023-04-04 | 2023-04-04 | 一种标签标注方法及装置、电子设备、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116561652A CN116561652A (zh) | 2023-08-08 |
CN116561652B true CN116561652B (zh) | 2024-04-26 |
Family
ID=87497300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310355912.XA Active CN116561652B (zh) | 2023-04-04 | 2023-04-04 | 一种标签标注方法及装置、电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116561652B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101114295A (zh) * | 2007-08-11 | 2008-01-30 | 腾讯科技(深圳)有限公司 | 检索在线广告资源的方法和装置 |
CN103235803A (zh) * | 2013-04-17 | 2013-08-07 | 北京京东尚科信息技术有限公司 | 一种从文本中获取物品属性值的方法和装置 |
CN104317891A (zh) * | 2014-10-23 | 2015-01-28 | 华为软件技术有限公司 | 一种对页面标注标签的方法及装置 |
CN106919711A (zh) * | 2017-03-13 | 2017-07-04 | 北京百度网讯科技有限公司 | 基于人工智能的标注信息的方法和装置 |
CN107832287A (zh) * | 2017-09-26 | 2018-03-23 | 晶赞广告(上海)有限公司 | 一种标签识别方法及装置、存储介质、终端 |
CN108038192A (zh) * | 2017-12-11 | 2018-05-15 | 广东欧珀移动通信有限公司 | 应用搜索方法和装置、电子设备、计算机可读存储介质 |
CN109145261A (zh) * | 2018-09-04 | 2019-01-04 | 北京奇艺世纪科技有限公司 | 一种生成标签的方法和装置 |
CN111582360A (zh) * | 2020-05-06 | 2020-08-25 | 北京字节跳动网络技术有限公司 | 用于标注数据的方法、装置、设备和介质 |
CN112651211A (zh) * | 2020-12-11 | 2021-04-13 | 北京大米科技有限公司 | 标签信息确定方法、装置、服务器及存储介质 |
WO2022142593A1 (zh) * | 2020-12-28 | 2022-07-07 | 深圳壹账通智能科技有限公司 | 文本分类方法、装置、电子设备及可读存储介质 |
KR20230029158A (ko) * | 2021-08-24 | 2023-03-03 | 주식회사 아이클레이브 | 쇼핑몰 배너 문장 자동 제작 방법 |
-
2023
- 2023-04-04 CN CN202310355912.XA patent/CN116561652B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101114295A (zh) * | 2007-08-11 | 2008-01-30 | 腾讯科技(深圳)有限公司 | 检索在线广告资源的方法和装置 |
CN103235803A (zh) * | 2013-04-17 | 2013-08-07 | 北京京东尚科信息技术有限公司 | 一种从文本中获取物品属性值的方法和装置 |
CN104317891A (zh) * | 2014-10-23 | 2015-01-28 | 华为软件技术有限公司 | 一种对页面标注标签的方法及装置 |
CN106919711A (zh) * | 2017-03-13 | 2017-07-04 | 北京百度网讯科技有限公司 | 基于人工智能的标注信息的方法和装置 |
CN107832287A (zh) * | 2017-09-26 | 2018-03-23 | 晶赞广告(上海)有限公司 | 一种标签识别方法及装置、存储介质、终端 |
CN108038192A (zh) * | 2017-12-11 | 2018-05-15 | 广东欧珀移动通信有限公司 | 应用搜索方法和装置、电子设备、计算机可读存储介质 |
CN109145261A (zh) * | 2018-09-04 | 2019-01-04 | 北京奇艺世纪科技有限公司 | 一种生成标签的方法和装置 |
CN111582360A (zh) * | 2020-05-06 | 2020-08-25 | 北京字节跳动网络技术有限公司 | 用于标注数据的方法、装置、设备和介质 |
CN112651211A (zh) * | 2020-12-11 | 2021-04-13 | 北京大米科技有限公司 | 标签信息确定方法、装置、服务器及存储介质 |
WO2022142593A1 (zh) * | 2020-12-28 | 2022-07-07 | 深圳壹账通智能科技有限公司 | 文本分类方法、装置、电子设备及可读存储介质 |
KR20230029158A (ko) * | 2021-08-24 | 2023-03-03 | 주식회사 아이클레이브 | 쇼핑몰 배너 문장 자동 제작 방법 |
Non-Patent Citations (2)
Title |
---|
基于集成学习和二维关联边条件随机场的Web数据语义标注方法;丁艳辉;李庆忠;董永权;彭朝晖;;计算机学报;20100215(02);77-88 * |
高楠 ; 李利娟 ; 李伟 ; 祝建明 ; .融合语义特征的关键词提取方法.计算机科学.(03),118-123. * |
Also Published As
Publication number | Publication date |
---|---|
CN116561652A (zh) | 2023-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107861972B (zh) | 一种用户录入商品信息后显示商品全结果的方法及设备 | |
US9218364B1 (en) | Monitoring an any-image labeling engine | |
CN107958030B (zh) | 视频封面推荐模型优化方法及装置 | |
CN110059271B (zh) | 运用标签知识网络的搜索方法及装置 | |
US9037600B1 (en) | Any-image labeling engine | |
CN108694647B (zh) | 一种商户推荐理由的挖掘方法及装置,电子设备 | |
CN109635198B (zh) | 在商品展示平台上呈现用户搜索结果的方法、装置、介质及电子设备 | |
US20140172642A1 (en) | Analyzing commodity evaluations | |
CN111046225B (zh) | 音频资源处理方法、装置、设备及存储介质 | |
CN113570413B (zh) | 广告关键词的生成方法、装置、存储介质及电子设备 | |
CN108509499A (zh) | 一种搜索方法及装置,电子设备 | |
CN110110577A (zh) | 识别菜名的方法及装置、存储介质、电子装置 | |
CN113329261B (zh) | 视频处理方法及装置 | |
CN107832338A (zh) | 一种识别核心产品词的方法和系统 | |
CN114065750A (zh) | 商品信息匹配、发布方法及其装置、设备、介质、产品 | |
CN106339898A (zh) | 一种基于互联网大数据的产品创新方法 | |
CN107833088A (zh) | 内容提供方法、装置及智能设备 | |
CN112749330A (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN117788109A (zh) | 一种基于大语言模型生成商品标签的方法及电子设备 | |
CN113722443B (zh) | 一种融合文本相似度和协同过滤的标签推荐方法和系统 | |
CN116561652B (zh) | 一种标签标注方法及装置、电子设备、存储介质 | |
CN113220974A (zh) | 点击率预测模型训练、搜索召回方法、装置、设备及介质 | |
US20240004880A1 (en) | Data augmentation system, data augmentation method, and information storage medium | |
CN111797622B (zh) | 用于生成属性信息的方法和装置 | |
US11232325B2 (en) | Data analysis system, method for controlling data analysis system, and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |