CN107918667B - 文本标签词的生成方法、系统及装置 - Google Patents

文本标签词的生成方法、系统及装置 Download PDF

Info

Publication number
CN107918667B
CN107918667B CN201711213971.4A CN201711213971A CN107918667B CN 107918667 B CN107918667 B CN 107918667B CN 201711213971 A CN201711213971 A CN 201711213971A CN 107918667 B CN107918667 B CN 107918667B
Authority
CN
China
Prior art keywords
label
words
word
text
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711213971.4A
Other languages
English (en)
Other versions
CN107918667A (zh
Inventor
尹越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Youzan Technology Co ltd
Original Assignee
Hangzhou Youzan Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Youzan Technology Co ltd filed Critical Hangzhou Youzan Technology Co ltd
Priority to CN201711213971.4A priority Critical patent/CN107918667B/zh
Publication of CN107918667A publication Critical patent/CN107918667A/zh
Application granted granted Critical
Publication of CN107918667B publication Critical patent/CN107918667B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种文本标签词的生成方法、系统及装置,其中方法包括:提取文本中的标签词,根据提取的标签词,以及预设的标签词关系,生成相互关联的分组标签词;进而按照各个分组标签词之间的关联关系,对分组标签词进行聚合,并在预设的标签词词典中查找能够被本文完全覆盖的聚合后的分组标签词,得到组合型标签词;最后根据组合型标签词以及预设的标签词关系,在文本中生成映射标签词。本发明提供的文本标签词的生成方法、系统以及装置,可操作性强,能够快速、独立地根据实际需求,为文本生成相应的标签词,无需专业人员介入。

Description

文本标签词的生成方法、系统及装置
技术领域
本发明涉及文本分类技术领域,特别涉及一种文本标签词的生成方法、系统及装置。
背景技术
现有的对于一段文本,生成标签词的主要方法是:首先对文本进行分词,然后利用分类算法,将文本划分为某一个类别,从而为这段文本生成对应的类别标签词。
这种方法对操作人员的专业度要求较高,对于非专业人员来讲,很难快速、独立的根据实际需求,为一类文本生成相应的标签词。
发明内容
基于此,本发明提供了一种文本标签词的生成方法、系统及装置,通过向词典中添加标签词以及标签词之间关系,就可以快速为文本标注上满足需求的标签词,方法简单,可操作性强。利用本发明提供的文本标签词的生成方法及系统,非技术人员可快速独立的根据实际需求,为文本生成相应的标签词,无需专业人员介入。
本发明提供的文本标签词的生成方法,包括以下步骤:
提取文本中的标签词;
根据提取的所述标签词,以及预设的标签词关系,生成相互关联的分组标签词;
按照各个所述分组标签词之间的关联关系,对所述分组标签词进行聚合,并在预设的标签词词典中查找能够被本文完全覆盖的聚合后的所述分组标签词,得到组合型标签词;
根据所述组合型标签词以及所述预设的标签词关系,在文本中生成映射标签词。
作为一种可实施方式,在提取文本中的标签词之前,还包括以下步骤:
根据文本内容,在标签词词典中添加标签词和标签词关系。
作为一种可实施方式,提取文本中的标签词,包括以下步骤:
利用标签词词典中新添加的标签词,对文本进行分词,提取文本中的标签词。
作为一种可实施方式,根据提取的所述标签词,以及预设的标签词关系,依次生成相互关联的分组标签词,包括以下步骤:
根据提取的所述标签词,以及所述预设的标签词关系,生成上层标签词;
根据提取的所述标签词、生成的上层标签词,以及所述预设的标签词关系,生成同义标签词;
根据提取的所述标签词、生成的上层标签词、生成的同义标签词,以及所述预设的标签词关系,生成修饰标签词。
作为一种可实施方式,按照分组标签词之间的关联关系,对所述分组标签词进行聚合,并在预设的标签词词典中查找能够被本文完全覆盖的聚合后的所述分组标签词,得到组合型标签词,包括以下步骤:
根据所述标签词、上层标签词、同义标签词、以及修饰标签词之间的关联关系进行分组;
根据各组之间的关联关系,将所有能够关联起来的分组进行关联;
根据分组关联结果,在预设的标签词词典中查找被本文完全覆盖的标签词,得到所述组合型标签词。
本发明提供的文本标签词的生成系统,包括标签词提取模块、标签词分组模块、标签词聚合模块以及标签词生成模块;
所述标签词提取模块,用于提取文本中的标签词;
所述标签词分组模块,用于根据提取的所述标签词,以及预设的标签词关系,生成相互关联的分组标签词;
所述标签词聚合模块,用于按照各个所述分组标签词之间的关联关系,对所述分组标签词进行聚合,并在预设的标签词词典中查找能够被本文完全覆盖的聚合后的所述分组标签词,得到组合型标签词;
所述标签词生成模块,用于根据所述组合型标签词以及所述预设的标签词关系,在文本中生成映射标签词。
作为一种可实施方式,本发明的文本标签词的生成系统,还包括添加模块;
所述添加模块,用于根据文本内容,在词典中添加标签词和标签词关系。
作为一种可实施方式,所述标签词分组模块包括上层标签词生成单元、同义标签词生成单元、以及修饰标签词生成单元;
所述上层标签词生成单元,用于根据提取的所述标签词,以及所述预设的标签词关系,生成上层标签词;
所述同义标签词生成单元,用于根据提取的所述标签词、生成的上层标签词,以及所述预设的标签词关系,生成同义标签词;
所述修饰标签词生成单元,用于根据提取的所述标签词、生成的上层标签词、生成的同义标签词,以及所述预设的标签词关系,生成修饰标签词。
作为一种可实施方式,所述标签词聚合模块包括分组单元、关联单元以及查找单元;
所述分组单元,用于根据所述标签词、上层标签词、同义标签词、以及修饰标签词之间的关联关系进行分组;
所述关联单元,用于根据各组之间的关联关系,将所有能够关联起来的分组进行关联;
所述查找单元,用于根据分组关联结果,在预设的标签词词典中查找被本文完全覆盖的标签词,得到所述组合型标签词。
本发明提供的文本标签词的生成装置,包括存储器以及连接所述存储器的处理器;
所述处理器用于提取文本中的标签词,并根据提取的所述标签词,以及存储器中预设的标签词关系,生成相互关联的分组标签词;按照各个所述分组标签词之间的关联关系,对所述分组标签词进行聚合,并在预设的标签词词典中查找能够被本文完全覆盖的聚合后的所述分组标签词,得到组合型标签词;根据所述组合型标签词以及所述预设的标签词关系,在文本中生成映射标签词。
本发明相比于现有技术的有益效果在于:
本发明提供的文本标签词的生成方法、系统以及装置,通过提取文本中的标签词,根据提取的标签词,以及预设的标签词关系,生成相互关联的分组标签词;进而按照各个分组标签词之间的关联关系,对分组标签词进行聚合,并在预设的标签词词典中查找能够被本文完全覆盖的聚合后的分组标签词,得到组合型标签词;最后根据组合型标签词以及预设的标签词关系,在文本中生成映射标签词。其可操作性强,能够快速、独立地根据实际需求,为文本生成相应的标签词,无需专业人员介入。
附图说明
图1为本发明实施例一提供的文本标签词的生成方法的流程示意图;
图2为本发明另一实施例提供的文本标签词的生成方法的流程示意图;
图3为本发明实施例二提供的文本标签词的生成系统的结构示意图。
具体实施方式
以下结合附图,对本发明上述的和另外的技术特征和优点进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的部分实施例,而不是全部实施例。
参见图1,本发明实施例一提供了一种文本标签词的生成方法,包括以下步骤:
S100,提取文本中的标签词。
标签词词典中存储有标签词和标签词关系。在上述步骤S100提取文本中的标签词之前,还可以包括以下步骤:根据文本内容,在标签词词典中添加标签词和标签词关系。标签词和标签词关系可以存储在一个词典中,也可以位于不同的词典中,例如,标签词添加在标签词词典中,标签词关系则添加在标签词关系词典中。
本实施例,首先需要向预先设置的词典中添加目标标签词以及标签词关系,已明确生成的标签的要求或者期望。具体的,可以利用标签词词典中新添加的标签词,对文本进行分词,从而提取文本中的标签词。
S200,根据提取的标签词,以及预设的标签词关系,生成相互关联的分组标签词。
提取的标签词可能会有多个,基于原始提取的标签词,再根据预设的标签词关系,例如上层关系、同义关系、或修饰关系等等,可以生成多个相互关联的分组标签词。
具体地,作为一种可实施方式,步骤S200可以通过以下步骤来实现:
S210,根据提取的标签词,以及预设的标签词关系,生成上层标签词;
S220,根据提取的标签词、生成的上层标签词,以及预设的标签词关系,生成同义标签词;
S230,根据提取的标签词、生成的上层标签词、生成的同义标签词,以及预设的标签词关系,生成修饰标签词。
一个原始的标签词与其上层标签词对应为一组,同理,一个原始的标签词与其同义标签词对应为一组,一个原始的标签词与其修饰标签词对应为一组,这样便可生成相互关联的分组标签词。
此处需要说明的是,根据文本内容,实际预设的标签词关系不局限于上述三种,可能还会有其他标签词关系,此处不一一阐述。
S300,按照各个分组标签词之间的关联关系,对分组标签词进行聚合,并在预设的标签词词典中查找能够被本文完全覆盖的聚合后的分组标签词,得到组合型标签词。
各个分组标签词之间存在着相互交叉的关联关系,例如,1号分组标签词中包括A和a,A是a的上层标签词,2号分组标签词中包括B和b,B是b的上层标签词,同时,B又是A的修饰标签词,这样通过修饰标签词就可以将1号分组标签词合2号分组标签词关联起来,以此类推,对分组标签词进行聚合。
此处以修饰标签词进行关联,也可以以其他标签词进行关联。
具体地,作为一种可实施方式,步骤S300可以通过以下步骤来实现:
S310,根据标签词、上层标签词、同义标签词、以及修饰标签词之间的关联关系进行分组;
S320,根据各组之间的关联关系,将所有能够关联起来的分组进行关联;
S330,根据分组关联结果,在文本中查找能够完全覆盖分组关联结果的标签词,得到组合型标签词。
S400,根据组合型标签词以及预设的标签词关系,在文本中生成映射标签词。
本实施例提供的文本标签词的生成方法,方法简单,可操作性强,可快速、独立地根据实际需求,为文本生成相应的标签词,无需专业人员介入。
下面以一段老师对学生的评语,希望能够给该评语标注上对学生评价以及后续对学生的鼓励措施变迁的需求标签词,作为实例,对本发明的实现过程进行说明:
文本:“小a平时考试成绩一直很好,积极帮助同学”;
标签词词典:
{"name":"小a"};
{"name":"考试成绩"};
{"name":"很好"};
{"name":"学生学习优秀"};
字段解释:
name:这个标签词本身的文本内容;
标签词关系词典:
{"left_name":"学生","rel":"rel_super","right_name":"小a"};
{"left_name":"学习","rel":"rel_super","right_name":"考试成绩"};
{"left_name":"学习","rel":"rel_super","right_name":"考试水品"};
{"left_name":"优秀","rel":"rel_same","right_name":"很好"};
{"left_name":"优秀","rel":"rel_same","right_name":"优异"};
{"left_name":"学习","rel":"rel_modify","right_name":"学生"};
{"left_name":"优秀","rel":"rel_modify","right_name":"学习"};
{"left_name":"给予奖学金","rel":"rel_map","right_name":"学生学习优秀"};
字段解释:
left_name:本条标签词关系中,位于左侧的标签词的文本内容;
rel:本条标签词关系中,左右两个标签词之间具体是什么关系;
right_name:本条标签词关系中,位于右侧的标签词的文本内容;
标签词关系解释:
rel_super:说明左侧标签词是右侧标签词的上层标签词。比如,上例中的“学生”,是“小a”这个具体学生的一个泛化概念,所以是上层标签词。
rel_same:说明左侧标签词和右侧标签词是同义词关系。比如,上例中的“很好”,“优异”,都是“优秀”的同义词。
rel_modify:说明左侧标签词和右侧标签词是修饰关系。比如,上例中的“学习”可以修饰“学生”,“优秀”可以修饰“学习”。
参见图2,具体处理步骤如下:
S10:提取在文本中出现的标签词;
利用标签词词典中添加的标签词,对文本进行分词,可以提取出原始文本的标签词如下:
0:["小a"];
1:["考试成绩"];
2:["很好"];
S20:根据上面步骤生成的标签词,利用标签词关系词典中的rel_super关系,推理出上层标签词如下:
0:["小a",上层标签词:"学生"];
1:["考试成绩",上层标签词:"学习"];
2:["很好"];
S30:根据上面步骤生成的标签词,利用标签词关系词典中的rel_same关系,推理出同义标签词如下:
0:["小a",上层标签词:"学生"];
1:["考试成绩",上层标签词:"学习"];
2:["很好",同义词标签词:优秀];
S40:根据上面步骤生成的标签词,利用标签词关系词典中的rel_modify关系,推理出可以修饰的标签词如下:
0:["小a",上层标签词:"学生"];
1:["考试成绩",上层标签词:"学习",修饰:"学生"];
2:["很好",同义词标签词:优秀,修饰:"学习"];
S50:根据上面步骤生成的标签词,得到因为修饰标签词而关联起来的标签词分组如下:
[0,1]:因为1号组的"学习"可以修饰"学生",而“学生”存在于0号组,所以0、1号组可以关联起来;
[1,2]:因为2号组的"优秀"可以修饰"学习",而“学习”存在于1号组,所以1,2号组可以关联起来;
S60:根据上面步骤生成的标签词,以及分组之间的关联关系,将所有可以关联起来的分组关联起来:
[0,1,2]:因为0,1号组有关联关系,1,2号组有关联关系,所以[0,1,2]号组都有关联关系;
S70:利用S50、S60生成的分组关联关系,在标签词词典中,寻找文本上可以完全覆盖分组的组合型标签词如下:
"学生学习优秀":这是一个组合型的标签词,其中三个子标签词“学生”,“学习”,“优秀”,分别在分组0,1,2中出现,完全覆盖了步骤六中生成的[0,1,2]的关联分组,所以,"学生学习优秀",就是本步骤中所生成的标签词;
S80:根据上面步骤生成的标签词,利用标签词关系词典中的rel_map关系,推理出映射标签词如下:
"给予奖学金":因为“学生学习优秀”和“给予奖学金”之间有rel_map关系,所以本步骤可以推理出标签词“给予奖学金”;
最终,对于给定的“小a平时考试成绩一直很好,积极帮助同学”的文本,生成了“学生学习优秀”这样的评价类型的标签词,以及“给予奖学金”这样的决定对学生采取什么鼓励措施的标签词。
基于同一发明构思,本发明实施例二还提供了一种文本标签词的生成系统,该系统与上述文本标签词的生成方法的原理相同,该系统的实现可参照上述方法的实现过程实施,此处不再冗述。
参见图3,本发明实施例二提供的文本标签词的生成系统,包括标签词提取模块100、标签词分组模块200、标签词聚合模块300以及标签词生成模块400。
具体地,标签词提取模块100用于提取文本中的标签词;
标签词分组模块200用于根据提取的标签词,以及预设的标签词关系,生成相互关联的分组标签词;
标签词聚合模块300用于按照各个分组标签词之间的关联关系,对分组标签词进行聚合,并在预设的标签词词典中查找能够被本文完全覆盖的聚合后的分组标签词,得到组合型标签词;
标签词生成模块400用于根据组合型标签词以及预设的标签词关系,在文本中生成映射标签词。
进一步地,本实施例提供的文本标签词的生成系统,还包括添加模块,添加模块用于根据文本内容,在词典中添加标签词和标签词关系。
具体地,标签词分组模块200包括上层标签词生成单元、同义标签词生成单元、以及修饰标签词生成单元;
上层标签词生成单元用于根据提取的标签词,以及预设的标签词关系,生成上层标签词;
同义标签词生成单元用于根据提取的标签词、生成的上层标签词,以及预设的标签词关系,生成同义标签词;
修饰标签词生成单元用于根据提取的标签词、生成的上层标签词、生成的同义标签词,以及预设的标签词关系,生成修饰标签词。
具体地,标签词聚合模块300包括分组单元、关联单元以及查找单元;
分组单元用于根据标签词、上层标签词、同义标签词、以及修饰标签词之间的关联关系进行分组;
关联单元用于根据各组之间的关联关系,将所有能够关联起来的分组进行关联;
查找单元用于根据分组关联结果,在预设的标签词词典中查找被本文完全覆盖的标签词,得到组合型标签词。
基于同一发明构思,本发明实施例三还提供了一种文本标签词的生成装置,该装置包括存储器以及连接存储器的处理器;
处理器用于提取文本中的标签词,并根据提取的标签词,以及存储器中预设的标签词关系,生成相互关联的分组标签词;按照各个分组标签词之间的关联关系,对分组标签词进行聚合,并在预设的标签词词典中查找能够被本文完全覆盖的聚合后的分组标签词,得到组合型标签词;根据组合型标签词以及预设的标签词关系,在文本中生成映射标签词。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种文本标签词的生成方法,其特征在于,包括以下步骤:
提取文本中的标签词;
根据提取的所述标签词,以及预设的标签词关系,生成相互关联的分组标签词,具体步骤为,根据提取的所述标签词,以及所述预设的标签词关系,生成上层标签词;根据提取的所述标签词、生成的上层标签词,以及所述预设的标签词关系,生成同义标签词;根据提取的所述标签词、生成的上层标签词、生成的同义标签词,以及所述预设的标签词关系,生成修饰标签词;
按照各个所述分组标签词之间的关联关系,对所述分组标签词进行聚合,并在预设的标签词词典中查找能够被本文完全覆盖的聚合后的所述分组标签词,得到组合型标签词,具体步骤为:根据所述标签词、上层标签词、同义标签词、以及修饰标签词之间的关联关系进行分组;根据各组之间的关联关系,将所有能够关联起来的分组进行关联;根据分组关联结果,在预设的标签词词典中查找被本文完全覆盖的标签词,得到所述组合型标签词;
根据所述组合型标签词以及所述预设的标签词关系,在文本中生成映射标签词。
2.根据权利要求1所述的文本标签词的生成方法,其特征在于,在提取文本中的标签词之前,还包括以下步骤:
根据文本内容,在标签词词典中添加标签词和标签词关系。
3.根据权利要求1所述的文本标签词的生成方法,其特征在于,提取文本中的标签词,包括以下步骤:
利用标签词词典中新添加的标签词,对文本进行分词,提取文本中的标签词。
4.一种文本标签词的生成系统,其特征在于,包括标签词提取模块、标签词分组模块、标签词聚合模块以及标签词生成模块;
所述标签词提取模块,用于提取文本中的标签词;
所述标签词分组模块,用于根据提取的所述标签词,以及预设的标签词关系,生成相互关联的分组标签词,所述标签词分组模块包括上层标签词生成单元、同义标签词生成单元、以及修饰标签词生成单元;所述上层标签词生成单元,用于根据提取的所述标签词,以及所述预设的标签词关系,生成上层标签词;所述同义标签词生成单元,用于根据提取的所述标签词、生成的上层标签词,以及所述预设的标签词关系,生成同义标签词;所述修饰标签词生成单元,用于根据提取的所述标签词、生成的上层标签词、生成的同义标签词,以及所述预设的标签词关系,生成修饰标签词;
所述标签词聚合模块,用于按照各个所述分组标签词之间的关联关系,对所述分组标签词进行聚合,并在预设的标签词词典中查找能够被本文完全覆盖的聚合后的所述分组标签词,得到组合型标签词,所述标签词聚合模块包括分组单元、关联单元以及查找单元;所述分组单元,用于根据所述标签词、上层标签词、同义标签词、以及修饰标签词之间的关联关系进行分组;所述关联单元,用于根据各组之间的关联关系,将所有能够关联起来的分组进行关联;所述查找单元,用于根据分组关联结果,在预设的标签词词典中查找被本文完全覆盖的标签词,得到所述组合型标签词;
所述标签词生成模块,用于根据所述组合型标签词以及所述预设的标签词关系,在文本中生成映射标签词。
5.根据权利要求4所述的文本标签词的生成系统,其特征在于,还包括添加模块;
所述添加模块,用于根据文本内容,在词典中添加标签词和标签词关系。
6.一种文本标签词的生成装置,其特征在于,包括存储器以及连接所述存储器的处理器;
所述处理器用于提取文本中的标签词,并根据提取的所述标签词,以及存储器中预设的标签词关系,生成相互关联的分组标签词;
按照各个所述分组标签词之间的关联关系,对所述分组标签词进行聚合,并在预设的标签词词典中查找能够被本文完全覆盖的聚合后的所述分组标签词,得到组合型标签词,具体步骤为:根据所述标签词、上层标签词、同义标签词、以及修饰标签词之间的关联关系进行分组;
根据各组之间的关联关系,将所有能够关联起来的分组进行关联;
根据分组关联结果,在预设的标签词词典中查找被本文完全覆盖的标签词,得到所述组合型标签词;
根据所述组合型标签词以及所述预设的标签词关系,在文本中生成映射标签词。
CN201711213971.4A 2017-11-28 2017-11-28 文本标签词的生成方法、系统及装置 Active CN107918667B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711213971.4A CN107918667B (zh) 2017-11-28 2017-11-28 文本标签词的生成方法、系统及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711213971.4A CN107918667B (zh) 2017-11-28 2017-11-28 文本标签词的生成方法、系统及装置

Publications (2)

Publication Number Publication Date
CN107918667A CN107918667A (zh) 2018-04-17
CN107918667B true CN107918667B (zh) 2020-09-04

Family

ID=61897841

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711213971.4A Active CN107918667B (zh) 2017-11-28 2017-11-28 文本标签词的生成方法、系统及装置

Country Status (1)

Country Link
CN (1) CN107918667B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095288A (zh) * 2014-05-14 2015-11-25 腾讯科技(深圳)有限公司 数据分析方法及数据分析装置
KR20160082574A (ko) * 2014-12-30 2016-07-08 선주규 핵심어 선별 및 문장 생성 방법 및 장치
CN106777261A (zh) * 2016-12-28 2017-05-31 深圳市华傲数据技术有限公司 基于多源异构数据集的数据查询方法及装置
CN107315798A (zh) * 2017-06-19 2017-11-03 北京神州泰岳软件股份有限公司 基于多主题语义标签信息映射的结构化处理方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9886950B2 (en) * 2013-09-08 2018-02-06 Intel Corporation Automatic generation of domain models for virtual personal assistants

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095288A (zh) * 2014-05-14 2015-11-25 腾讯科技(深圳)有限公司 数据分析方法及数据分析装置
KR20160082574A (ko) * 2014-12-30 2016-07-08 선주규 핵심어 선별 및 문장 생성 방법 및 장치
CN106777261A (zh) * 2016-12-28 2017-05-31 深圳市华傲数据技术有限公司 基于多源异构数据集的数据查询方法及装置
CN107315798A (zh) * 2017-06-19 2017-11-03 北京神州泰岳软件股份有限公司 基于多主题语义标签信息映射的结构化处理方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"自动关键词抽取研究综述";赵京胜;《软件学报》;20170605;第28卷(第9期);第2431-2449页 *

Also Published As

Publication number Publication date
CN107918667A (zh) 2018-04-17

Similar Documents

Publication Publication Date Title
US10565508B2 (en) Inferred facts discovered through knowledge graph derived contextual overlays
US9471874B2 (en) Mining forums for solutions to questions and scoring candidate answers
US9373075B2 (en) Applying a genetic algorithm to compositional semantics sentiment analysis to improve performance and accelerate domain adaptation
CN109726298B (zh) 适用于科技文献的知识图谱构建方法、系统、终端及介质
CN106844341B (zh) 基于人工智能的新闻摘要提取方法及装置
CN113590776B (zh) 基于知识图谱的文本处理方法、装置、电子设备及介质
US20160170989A1 (en) Identification and Evaluation of Lexical Answer Type Conditions in a Question to Generate Correct Answers
US9536444B2 (en) Evaluating expert opinions in a question and answer system
US10108661B2 (en) Using synthetic events to identify complex relation lookups
CN111340054A (zh) 数据标注方法、装置及数据处理设备
US10482180B2 (en) Generating ground truth for questions based on data found in structured resources
US20160188569A1 (en) Generating a Table of Contents for Unformatted Text
US11151117B2 (en) Increasing the accuracy of a statement by analyzing the relationships between entities in a knowledge graph
JP2021136027A (ja) 文書のテーマ・カバレッジの分析
CN112035614B (zh) 测试集生成方法、装置、计算机设备和存储介质
US11048737B2 (en) Concept identification in a question answering system
CN113722441B (zh) 一种相似文本的生成方法、装置、设备及存储介质
CN113505195A (zh) 知识库及其构建、检索方法、基于其的出题方法和系统
CN117077679B (zh) 命名实体识别方法和装置
US10229156B2 (en) Using priority scores for iterative precision reduction in structured lookups for questions
CN107918667B (zh) 文本标签词的生成方法、系统及装置
CN111597336A (zh) 训练文本的处理方法、装置、电子设备及可读存储介质
CN116628162A (zh) 语义问答方法、装置、设备及存储介质
CN116719915A (zh) 智能问答方法、装置、设备及存储介质
CN111859985B (zh) Ai客服模型测试方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Method, system, and device for generating text label words

Effective date of registration: 20231229

Granted publication date: 20200904

Pledgee: Hangzhou United Rural Commercial Bank Co.,Ltd. Dongyue sub branch

Pledgor: HANGZHOU YOUZAN TECHNOLOGY CO.,LTD.

Registration number: Y2023980074694

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Granted publication date: 20200904

Pledgee: Hangzhou United Rural Commercial Bank Co.,Ltd. Dongyue sub branch

Pledgor: HANGZHOU YOUZAN TECHNOLOGY CO.,LTD.

Registration number: Y2023980074694