CN107247709B - 一种百科词条标签的优化方法及系统 - Google Patents
一种百科词条标签的优化方法及系统 Download PDFInfo
- Publication number
- CN107247709B CN107247709B CN201710627612.7A CN201710627612A CN107247709B CN 107247709 B CN107247709 B CN 107247709B CN 201710627612 A CN201710627612 A CN 201710627612A CN 107247709 B CN107247709 B CN 107247709B
- Authority
- CN
- China
- Prior art keywords
- entry
- label
- entries
- similarity
- labels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种百科词条标签的优化方法,其包括以下步骤:S1:对百科词条进行判断是否有标签;若有标签,则执行步骤S2;若无标签,则执行步骤S3;S2:对有标签的词条按标签正确性作降序排序,排序后的第一个标签作为词条的最佳标签;S3:获取该无标签词条的属性词的词向量,并分别与有标签的词条的属性词的词向量进行相似度比较,从而在有标签词条中匹配出该无标签词条相似度最大的词条,并将该词条的标签作为无标签词条的标签。相比于现有技术,本发明可在合适的时间内完成标签优化工作。该方法提高了百科词条的三元组数据的标签的正确性,改善了知识本体库的质量,提高了问答系统回答用户问题的正确性。
Description
技术领域
本发明涉及优化方法,特别是一种百科词条标签的优化方法及系统。
背景技术
知识库,又称为智能数据库或人工智能数据库。知识库是知识工程中结构化、易操作、易利用、全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合。这些知识片包括与领域相关的理论知识、事实数据,由专家经验得到的启发式知识,如某领域内有关的定义、定理和运算法则以及常识性知识等。
知识库有着广泛的应用,典型的应用有智能问答系统或自动问题系统或问答知识库,自动问题系统中存储着一些预设的问题,并存储预设问题对应的答案信息,在公众用户提出问题时,自动问题系统会将公众用户提出的问题与预设的问题进行匹配,若匹配成功,自动问题系统会将该预设问题对应的答案信息反馈给公众用户。
在问答系统领域中,往往需要从百科中抽取结构化数据来扩展知识本体库。所要抽取的结构数据为三元组格式,即词条-词条属性-属性值。为了提高在本体库中搜索词条的速度,需要会利用词条标签对词条进行分类,以缩减搜索词条的范围,同时了解该词条所属领域。但是百科词条经常会有标签错误或无标签的情况。
同时,对于词条有可能会存在多个标签,由于词条标签经常是由网民编辑的,标签质量难以保证。即使是由专业的工作人员编辑词条标签,同样会出现标签质量不高的情况。目前的方法,无法提供更好的优化效果。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供了一种百科词条标签的优化方法及系统。
本发明通过以下的方案实现:一种百科词条标签的优化方法,其包括以下步骤:
S1:对百科词条进行判断是否有标签;若有标签,则执行步骤S2;若无标签,则执行步骤S3;
S2:对有标签的词条按标签正确性作降序排序,排序后的第一个标签作为词条的最佳标签;
S3:获取该无标签词条的属性词的词向量,并分别与有标签的词条的属性词的词向量进行相似度比较,从而在有标签词条中匹配出该无标签词条相似度最大的词条,并将该词条的标签作为无标签词条的标签;
所述步骤S3中具体包括以下步骤:
S31:获得无标签词条的各个属性词的词向量,将所有属性词的向量相加再取平均得到的最终的一个向量;
S32:将该无标签词条的各个属性词的词向量与有标签词条的属性词向量进行相似度比较;
S33:获取有标签的词条中匹配出跟无标签的词条最相近的词条,并把其标签作为无标签的词条的标签;
所述步骤S33中,在有标签的词条中匹配出跟无标签的词条最相近的词条时,具体通过:
遍历全部有标签的词条,并匹配出相似度最大的词条标签;
或着,通过抽取设定数量的有标签的词条,并匹配出相似度最大的词条标签;
或者,通过设定一个相似度阈值,当余弦相似度大于设定的相似度阈值时,则结束匹配;
所述步骤S2中具体包括:
S21:对百科语料进行训练,获得word2vec模型;
S22:向量化词条属性和词条标签;
S23:获取词条标签向量和词条属性向量的余弦相似度;
S24:将余弦相似度最大值所对应的标签作为该词条的最佳标签。
本发明还提供了一种百科词条标签的优化系统,其包括判断模块、有标签词条处理模块和无标签词条处理模块;
所述判断模块,用于对百科词条的标签进行判断,若该词条有标签时,则发送至所述有标签词条处理模块,若该词条无标签时,则发送至所述无标签词条处理模块;
所述有标签词条处理模块,用于对有标签的词条按标签正确性作降序排序,排序后的第一个标签作为词条的最佳标签;
所述无标签词条处理模块,用于获取该无标签词条的属性词的词向量,并分别与有标签的词条的属性词的词向量进行相似度比较,从而在有标签词条中匹配出该无标签词条相似度最大的词条,并将该词条的标签作为无标签词条的标签;
所述无标签词条处理模块包括:
属性词向量获取模块,用于获得无标签词条的各个属性词的词向量,将所有属性词的向量相加再取平均得到的最终的一个向量;
相似度比较模块,用于将该无标签词条的各个属性词的词向量与有标签词条的属性词向量进行相似度比较;
无标签词条的标签获取模块,用于获取有标签的词条中匹配出跟无标签的词条最相近的词条,并把其标签作为无标签的词条的标签;
所述无标签词条的标签获取模块具体通过:
遍历全部有标签的词条,并匹配出相似度最大的词条标签;
或着,通过抽取设定数量的有标签的词条,并匹配出相似度最大的词条标签;
或者,通过设定一个相似度阈值,当余弦相似度大于设定的相似度阈值时,则结束匹配。
所述有标签词条处理模块包括:
模型获取模块,用于对百科语料进行训练,获得word2vec模型;
向量化模块,用于向量化词条属性和词条标签;
余弦相似度获取模块,用于获取词条标签向量和词条属性向量的余弦相似度;
最佳标签获取模块,用于将余弦相似度最大值所对应的标签作为该词条的最佳标签。
相比于现有技术,本发明可在合适的时间内完成标签优化工作。该方法提高了百科词条的三元组数据的标签的正确性,改善了知识本体库的质量,提高了问答系统回答用户问题的正确性。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1是本发明的百科词条标签优化方法的步骤流程图。
图2是本步骤S2的具体步骤流程图。
图3是本步骤S3的具体步骤流程图。
图4是本发明的百科词条标签优化系统的连接框图。
具体实施方式
以下结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
为了解决现有技术的缺陷,本发明提供了一种百科词条标签的优化方法和系统,具体通过以下实施例进行介绍:
请参阅图1,其为本发明的百科词条标签优化方法的步骤流程图。本发明的百科词条标签的优化方法,其包括以下步骤:
S1:对百科词条进行判断是否有标签;若有标签,则执行步骤S2;若无标签,则执行步骤S3;
S2:对有标签的词条按标签正确性作降序排序,排序后的第一个标签作为词条的最佳标签。具体的请同时参阅图2,其为本步骤S2的具体步骤流程图。所述步骤S2中包括:
S21:对百科语料进行训练,获得word2vec模型。
S22:向量化词条属性和词条标签。
S23:获取词条标签向量和词条属性向量的余弦相似度。
S24:将余弦相似度最大值所对应的标签作为该词条的最佳标签。
S3:获取该无标签词条的属性词的词向量,并分别与有标签的词条的属性词的词向量进行相似度比较,从而在有标签词条中匹配出该无标签词条相似度最大的词条,并将该词条的标签作为无标签词条的标签。
具体的请同时参阅图2,其为本步骤S3的具体步骤流程图。所述步骤S3中包括以下步骤:
S31:获得无标签词条的各个属性词的词向量,将所有属性词的向量相加再取平均得到的最终的一个向量。
通过word2vec得到的词向量是类似[0.792,-0.188,-0.235,0.104,-0.343,...]这样类似的一个几十到几百维的向量。因为每一个词的维度是一样的。所以,可以把两个向量相加,作为两个词的向量。所以,所有属性词的向量表示,就是把所有属性词的向量相加再取平均得到的最终的一个向量。词条的多个属性,就可以融合为一个向量。
S32:将该无标签词条的各个属性词的词向量与有标签词条的属性词向量进行相似度比较。
S33:获取有标签的词条中匹配出跟无标签的词条最相近的词条,并把其标签作为无标签的词条的标签。具体的,若两个词条的属性越相近,余弦相似度越高。根据这一特点,可以从有标签的词条中匹配出跟无标签的词条最相近的词条,并把它的标签作为无标签的词条的标签,从而实现了为无标签的词条打上一个正确的标签这一功能。
进一步,所述步骤S33中,在有标签的词条中匹配出跟无标签的词条最相近的词条时,具体包括以下三种方式:
(1)遍历全部有标签的词条,并匹配出相似度最大的词条标签。这方法适用于有标签的词条数在合适的范围内的情况。
(2)通过抽取设定数量的有标签的词条,并匹配出相似度最大的词条标签。这方法适用于有标签的词条数较多或者打标签的时间较长的情况。
(3)通过设定一个相似度阈值,当余弦相似度大于设定的相似度阈值时,则结束匹配。例如通过计算可以得出如下单词对的语义相似性:
Cosine(WE“钱”,WE“买”)=0.79
Cosine(WE“钱”,WE“现金”)=0.93
Cosine(WE“钱”,WE“赚钱”)=0.81
Cosine(WE“钱”,WE“钞票”)=0.95
如果设置阈值为0.9,只要获取一个相似度,‘钱’跟‘现金’就不管后面的相似标签了。因为已经满足要求,提高了效率。
以下通过两个具体实例,介绍一下本发明的百科词条标签的优化方法的应用方式。
例1:“丈夫”是一个有标签的词条,其标签有:影视、词语、词汇、电视剧和称谓共5个标签。在不给定词条属性的情况下,这5个标签都是正确的。
当给出词条“丈夫”的全部属性(中文名、其它译名、制片地区、导演、编剧、主演、集数、类型、出品人、导演和编剧)后,利用本发明可实现对上述5个标签按正确性作降序排序,排序结果为:电视剧、词语、称谓、词汇、影视。最后,把词条“丈夫”的标签定为“电视剧”。上百度百科查询词条“丈夫”,发现这的确是一部电视剧。
例2:“安静琪”是一个无标签的词条。该词条的属性有:姓名、外文名、国籍、民族、出生地、职业、毕业院校、身高、体重和三围共10个。利用本发明方法可以匹配到词条“王希怡”“张诗菡”。“王希怡”“张诗菡”的属性都是姓名、国籍、出生地、出生日期、职业、毕业院校、身高、体重和三围,与“安静琪”的属性极为相似。已知“王希怡”的标签是模特,“张诗菡”的标签是艺人,于是利用它们俩的标签为“安静琪”打上了“模特”和“艺人”这两个标签。上百度百科查询词条“安静琪”,发现安静琪的确是模特和艺人。
另外请同时参阅图4,其为本发明的百科词条标签优化系统的连接框图。本发明还提供了一种百科词条标签的优化系统,其包括判断模块1、有标签词条处理模块2和无标签词条处理模块3。
所述判断模块1,用于对百科词条的标签进行判断,若该词条有标签时,则发送至所述有标签词条处理模块,若该词条无标签时,则发送至所述无标签词条处理模块。
所述有标签词条处理模块2,用于对有标签的词条按标签正确性作降序排序,排序后的第一个标签作为词条的最佳标签。
所述无标签词条处理模块3,用于获取该无标签词条的属性词的词向量,并分别与有标签的词条的属性词的词向量进行相似度比较,从而在有标签词条中匹配出该无标签词条相似度最大的词条,并将该词条的标签作为无标签词条的标签。
具体的,所述有标签词条处理模块2包括:模型获取模块21、向量化模块22、余弦相似度获取模块23和最佳标签获取模块24。
所述模型获取模块21,用于对百科语料进行训练,获得word2vec模型。
所述向量化模块22,用于向量化词条属性和词条标签。
所述余弦相似度获取模块23,用于获取词条标签向量和词条属性向量的余弦相似度。
所述最佳标签获取模块24,用于将余弦相似度最大值所对应的标签作为该词条的最佳标签。
进一步,所述无标签词条处理模块3包括:属性词向量获取模块31、相似度比较模块32和无标签词条的标签获取模块33。
所述属性词向量获取模块31,用于获得无标签词条的各个属性词的词向量,将所有属性词的向量相加再取平均得到的最终的一个向量。
所述相似度比较模块32,用于将该无标签词条的各个属性词的词向量与有标签词条的属性词向量进行相似度比较。
所述无标签词条的标签获取模块33,用于获取有标签的词条中匹配出跟无标签的词条最相近的词条,并把其标签作为无标签的词条的标签。
具体的,所述无标签词条的标签获取模块33具体通过以下几种方式实现:
(1)遍历全部有标签的词条,并匹配出相似度最大的词条标签。这方法适用于有标签的词条数在合适的范围内的情况。
(2)通过抽取设定数量的有标签的词条,并匹配出相似度最大的词条标签。这方法适用于有标签的词条数较多或者打标签的时间较长的情况。
(3)通过设定一个相似度阈值,当余弦相似度大于设定的相似度阈值时,则结束匹配。例如通过计算可以得出如下单词对的语义相似性:
Cosine(WE“钱”,WE“买”)=0.79
Cosine(WE“钱”,WE“现金”)=0.93
Cosine(WE“钱”,WE“赚钱”)=0.81
Cosine(WE“钱”,WE“钞票”)=0.95
如果设置阈值为0.9,只要获取一个相似度,‘钱’跟‘现金’就不管后面的相似标签了。因为已经满足要求,提高了效率。
相比于现有技术,本发明可在合适的时间内完成标签优化工作。该方法提高了百科词条的三元组数据的标签的正确性,改善了知识本体库的质量,提高了问答系统回答用户问题的正确性。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (2)
1.一种百科词条标签的优化方法,其特征在于:包括以下步骤:
S1:对百科词条进行判断是否有标签;若有标签,则执行步骤S2;若无标签,则执行步骤S3;
S2:对有标签的词条按标签正确性作降序排序,排序后的第一个标签作为词条的最佳标签;
所述步骤S2中具体包括:
S21:对百科语料进行训练,获得word2vec模型;
S22:向量化词条属性和词条标签;
S23:获取词条标签向量和词条属性向量的余弦相似度;
S24:将余弦相似度最大值所对应的标签作为该词条的最佳标签;
S3:获取该无标签词条的属性词的词向量,并分别与有标签的词条的属性词的词向量进行相似度比较,从而在有标签词条中匹配出该无标签词条相似度最大的词条,并将该词条的标签作为无标签词条的标签;
所述步骤S3中具体包括以下步骤:
S31:获得无标签词条的各个属性词的词向量,将所有属性词的向量相加再取平均得到的最终的一个向量;
S32:将该无标签词条的各个属性词的词向量与有标签词条的属性词向量进行相似度比较;
S33:获取有标签的词条中匹配出跟无标签的词条最相近的词条,并把其标签作为无标签的词条的标签;
所述步骤S33中,在有标签的词条中匹配出跟无标签的词条最相近的词条时,具体通过:
遍历全部有标签的词条,并匹配出相似度最大的词条标签;
或者,通过抽取设定数量的有标签的词条,并匹配出相似度最大的词条标签;
或者,通过设定一个相似度阈值,当余弦相似度大于设定的相似度阈值时,则结束匹配。
2.一种百科词条标签的优化系统,其特征在于:包括判断模块、有标签词条处理模块和无标签词条处理模块;
所述判断模块,用于对百科词条的标签进行判断,若该词条有标签时,则发送至所述有标签词条处理模块,若该词条无标签时,则发送至所述无标签词条处理模块;
所述有标签词条处理模块,用于对有标签的词条按标签正确性作降序排序,排序后的第一个标签作为词条的最佳标签;
所述有标签词条处理模块包括:
模型获取模块,用于对百科语料进行训练,获得word2vec模型;
向量化模块,用于向量化词条属性和词条标签;
余弦相似度获取模块,用于获取词条标签向量和词条属性向量的余弦相似度;
最佳标签获取模块,用于将余弦相似度最大值所对应的标签作为该词条的最佳标签;
所述无标签词条处理模块,用于获取该无标签词条的属性词的词向量,并分别与有标签的词条的属性词的词向量进行相似度比较,从而在有标签词条中匹配出该无标签词条相似度最大的词条,并将该词条的标签作为无标签词条的标签;
所述无标签词条处理模块包括:
属性词向量获取模块,用于获得无标签词条的各个属性词的词向量,将所有属性词的向量相加再取平均得到的最终的一个向量;
相似度比较模块,用于将该无标签词条的各个属性词的词向量与有标签词条的属性词向量进行相似度比较;
无标签词条的标签获取模块,用于获取有标签的词条中匹配出跟无标签的词条最相近的词条,并把其标签作为无标签的词条的标签;
所述无标签词条的标签获取模块具体通过:
遍历全部有标签的词条,并匹配出相似度最大的词条标签;
或者,通过抽取设定数量的有标签的词条,并匹配出相似度最大的词条标签;
或者,通过设定一个相似度阈值,当余弦相似度大于设定的相似度阈值时,则结束匹配。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710627612.7A CN107247709B (zh) | 2017-07-28 | 2017-07-28 | 一种百科词条标签的优化方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710627612.7A CN107247709B (zh) | 2017-07-28 | 2017-07-28 | 一种百科词条标签的优化方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107247709A CN107247709A (zh) | 2017-10-13 |
CN107247709B true CN107247709B (zh) | 2021-03-16 |
Family
ID=60012384
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710627612.7A Active CN107247709B (zh) | 2017-07-28 | 2017-07-28 | 一种百科词条标签的优化方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107247709B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111241844A (zh) * | 2018-11-29 | 2020-06-05 | 北京搜狗科技发展有限公司 | 一种信息推荐方法及装置 |
CN110222709B (zh) * | 2019-04-29 | 2022-01-25 | 上海暖哇科技有限公司 | 一种多标签智能打标方法及系统 |
CN110532345A (zh) * | 2019-07-15 | 2019-12-03 | 北京小米智能科技有限公司 | 一种未标注数据的处理方法、装置及存储介质 |
CN111444707B (zh) * | 2020-03-26 | 2022-07-01 | 腾讯科技(深圳)有限公司 | 一种标题生成方法、设备及计算机可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102073729A (zh) * | 2011-01-14 | 2011-05-25 | 百度在线网络技术(北京)有限公司 | 一种关系化知识共享平台及其实现方法 |
CN103678281A (zh) * | 2013-12-31 | 2014-03-26 | 北京百度网讯科技有限公司 | 对文本进行自动标注的方法和装置 |
CN105824898A (zh) * | 2016-03-14 | 2016-08-03 | 苏州大学 | 一种网络评论的标签提取方法和装置 |
CN106776827A (zh) * | 2016-11-24 | 2017-05-31 | 天津大学 | 用于自动化扩展层次化本体知识库的方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9244908B2 (en) * | 2012-03-27 | 2016-01-26 | Accenture Global Services Limited | Generation of a semantic model from textual listings |
CN103699663B (zh) * | 2013-12-27 | 2017-02-08 | 中国科学院自动化研究所 | 一种基于大规模知识库的热点事件挖掘方法 |
CN106294733B (zh) * | 2016-08-10 | 2019-05-07 | 成都轻车快马网络科技有限公司 | 基于文本分析的网页检测方法 |
CN106484919A (zh) * | 2016-11-15 | 2017-03-08 | 任子行网络技术股份有限公司 | 一种基于网页独立词的行业网站分类方法和系统 |
CN106649818B (zh) * | 2016-12-29 | 2020-05-15 | 北京奇虎科技有限公司 | 应用搜索意图的识别方法、装置、应用搜索方法和服务器 |
-
2017
- 2017-07-28 CN CN201710627612.7A patent/CN107247709B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102073729A (zh) * | 2011-01-14 | 2011-05-25 | 百度在线网络技术(北京)有限公司 | 一种关系化知识共享平台及其实现方法 |
CN103678281A (zh) * | 2013-12-31 | 2014-03-26 | 北京百度网讯科技有限公司 | 对文本进行自动标注的方法和装置 |
CN105824898A (zh) * | 2016-03-14 | 2016-08-03 | 苏州大学 | 一种网络评论的标签提取方法和装置 |
CN106776827A (zh) * | 2016-11-24 | 2017-05-31 | 天津大学 | 用于自动化扩展层次化本体知识库的方法 |
Non-Patent Citations (1)
Title |
---|
面向商品评论的观点挖掘方法研究;牛晓静;《中国优秀硕士学位论文全文数据库 信息科技辑》;20170415(第04期);第I138-607页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107247709A (zh) | 2017-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107705066B (zh) | 一种商品入库时信息录入方法及电子设备 | |
CN107766371B (zh) | 一种文本信息分类方法及其装置 | |
CN107247709B (zh) | 一种百科词条标签的优化方法及系统 | |
CN106570708B (zh) | 一种智能客服知识库的管理方法及系统 | |
CN109271537B (zh) | 一种基于蒸馏学习的文本到图像生成方法和系统 | |
US20190058609A1 (en) | Method and apparatus for pushing information based on artificial intelligence | |
CN110188197B (zh) | 一种用于标注平台的主动学习方法及装置 | |
CN111090763B (zh) | 一种图片自动标签方法及装置 | |
CN113033438B (zh) | 一种面向模态非完全对齐的数据特征学习方法 | |
CN102855317A (zh) | 一种基于演示视频的多模式索引方法及系统 | |
CN110059222B (zh) | 一种基于协同过滤的视频标签添加方法 | |
CN106227836B (zh) | 基于图像与文字的无监督联合视觉概念学习系统及方法 | |
CN103778206A (zh) | 一种网络服务资源的提供方法 | |
CN110990597A (zh) | 基于文本语义映射的跨模态数据检索系统及其检索方法 | |
CN111291168A (zh) | 图书检索方法、装置及可读存储介质 | |
CN114003709A (zh) | 一种基于问句匹配的智能问答系统和方法 | |
CN109885641A (zh) | 一种数据库中文全文检索的方法及系统 | |
CN112434533A (zh) | 实体消歧方法、装置、电子设备及计算机可读存储介质 | |
CN116150404A (zh) | 一种基于联合学习的教育资源多模态知识图谱构建方法 | |
CN111428502A (zh) | 一种面向军事语料的命名实体标注方法 | |
CN115187910A (zh) | 视频分类模型训练方法、装置、电子设备及存储介质 | |
Yao | [Retracted] Application of Higher Education Management in Colleges and Universities by Deep Learning | |
CN111241142A (zh) | 一种科技成果转化推送系统及方法 | |
Feng et al. | ModelsKG: A Design and Research on Knowledge Graph of Multimodal Curriculum Based on PaddleOCR and DeepKE | |
CN115600595A (zh) | 一种实体关系抽取方法、系统、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |