CN105893523B - 利用答案相关性排序的评估度量来计算问题相似度的方法 - Google Patents
利用答案相关性排序的评估度量来计算问题相似度的方法 Download PDFInfo
- Publication number
- CN105893523B CN105893523B CN201610194522.9A CN201610194522A CN105893523B CN 105893523 B CN105893523 B CN 105893523B CN 201610194522 A CN201610194522 A CN 201610194522A CN 105893523 B CN105893523 B CN 105893523B
- Authority
- CN
- China
- Prior art keywords
- answer
- question
- similarity
- relevance ranking
- customer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种利用答案相关性排序的评估度量来计算问题相似度的方法,该方法包括:步骤一:在问答知识库中的训练数据集上学习答案排序模型;步骤二:采用快速信息检索从问答知识库中检索出用户问题的相关问题;步骤三:根据学习出的答案排序模型分别对用户问题和相关问题的同一候选答案集进行排序;步骤四:计算问题‑答案相关性排序的评估度量,即斯皮尔曼、皮尔森和肯德尔相关系数;步骤五:将得到的相关系数直接作为问题的相似度得分;或加入到相似度特征集合中训练分类器,然后将分类器输出的概率置信得分作为问题的相似度得分。本发明通过答案的相似度来计算问题的相似度,克服了同一问题具有不同自然语言表述的词汇鸿沟难题。
Description
技术领域
本发明涉及到社区问答(CQA)系统中的问题检索技术,涉及利用问题-答案相关性排序的评估度量来计算检索问题相似度的方法。
背景技术
近年来,随着社区问答(Community-based Question Answering,CQA)网站,如Yahoo Answer、Wiki Answer、百度知道、搜搜问问等的蓬勃发展,越来越多的研究机构和研究者开始关注这一领域。一方面,用户可以提出各种问题,这些问题在社区问答网站上被有相关知识的用户或专家回答。另一方面,针对用户提出的查询问题(记作Q0),CQA系统检索现有的问答知识库找出已有答案的相关问题(记作Q1),并将相关问题的答案(记作A)返回作为用户查询问题的答案。CQA系统通常包括两个重要模块:(1)问题检索:以用户问题作为查询内容,从问题知识库中检索出相关问题;(2)答案排序:根据答案和问题的语义相关的匹配程度,对多个候选答案进行排序。目前问题检索采用的主要方法可归为以下几类:(1)基于信息检索的方法:采用传统信息检索的方法如TFIDF、BM25,把用户问题作为查询去检索出知识库中最相关的问题;(2)基于有监督的机器学习的方法:从问题之间抽取多种不同的特征如:词匹配、基于翻译、基于主题等的相似特征,然后使用机器学习方法去估计问题间的相似度,从而找出最相关的问题。然而,上述这些大多都是在问题之间采用基于词匹配或浅层语义分析检索相似问题,并没有考虑到与问题相关的答案信息,因此很难解决针对同一问题用户采用不同自然语言表述的实际情况。
发明内容
本发明的目的是针对现有技术的不足而提供的一种问题相似度计算方法,该方法利用了问题-答案相关性排序的评估度量来计算问题的相似度,提高问题相似度评估的准确性。
实现本发明目的的具体技术方案是:
一种利用答案相关性排序的评估度量来计算问题相似度的方法,该方法包括如下步骤:
步骤一:在CQA问答知识库中已有问题-答案排序信息的训练数据集上学习有监督的答案排序模型;
步骤二:采用快速信息检索方法,从问答知识库中检索出与用户问题相关的候选问题集合,其中包含噪声问题;
步骤三:根据构建的答案排序模型计算分别得到用户问题和各个相关候选问题针对同一答案集的相关性排序;
步骤四:计算相关性排序的评估度量,即斯皮尔曼(Spearman)、皮尔森(Pearson)和肯德尔(Kendall)相关系数;
步骤五:得到的相关系数直接作为用户问题和相关问题的相似度得分;或者加入到问题相似度特征集合中来训练分类器,然后将分类器输出的概率置信得分作为用户问题和相关问题的相似度得分。
所述步骤一中的训练数据集上学习有监督的答案排序模型,包括如下步骤:
步骤a1:从问答知识库中抽取已有的问题-答案对,根据用户对不同答案的评分,给予对应的问题-答案对不同的标签,构建训练数据集;
步骤a2:在训练数据集上采用机器学习模型学习出有监督的答案排序模型;其中,所述机器学习模型为逻辑回归或支持向量机。
所述步骤二中从问答知识库中检索出与用户问题相关的候选问题集合,包括如下步骤:
步骤b1:采用快速信息检索方法,以用户问题为查询内容,在问答知识库中进行查询检索;其中,所述快速信息检索方法为TFIDF或BM25;
步骤b2:返回的结果作为与用户问题相关的候选问题集合,其中包含噪声问题。
所述步骤三中计算分别得到用户问题和各个相关候选问题针对同一答案集的相关性排序,包括如下步骤:
步骤c1:使用步骤一中已训练的答案排序模型,计算用户问题与候选问题集的各个答案的相关得分进行相关性排序;
步骤c2:使用步骤一中已训练的答案排序模型,计算相关问题与候选问题集的各个答案的相关得分进行相关性排序。
所述步骤四中计算相关性排序的评估度量,包括如下步骤:
步骤d1:选择评估排序的度量,即斯皮尔曼(Spearman)、皮尔森(Pearson)和肯德尔(Kendall)相关系数;
步骤d2:针对步骤三得到的相关性排序,计算各个排序相关系数的值。
所述步骤五中用户问题和相关问题的相似度得分包括如下步骤:
步骤e1:将计算得到的相关系数值直接作为用户问题和相关问题的相似度得分;
步骤e2:将计算得到的相关系数值加入到问题相似度特征集合中,训练分类器,然后将分类器输出的概率置信得分作为用户问题和相关问题的相似度得分。
本发明与现有技术不同之处:⑴、本方法通过计算问题-答案相关性排序的评估度量即斯皮尔曼、皮尔森和肯德尔相关系数,将问题-答案的排序信息加入到问题相似性计算中,通过答案的相似度来估计问题的相似度,克服问题检索中同一问题具有不同自然语言表述的难题;⑵、本方法中提出使用相关性排序的度量,既可以直接作为问题的相关性得分,也可以与其他简单词匹配和浅层语义相似度特征结合,从多个角度捕获自然语言表述的不同问题之间的相似度,提高问题语义相似估计的准确性和全面性。
本发明的有益效果包括:本发明提出利用问题与答案之间的相关性排序的评估度量来计算问题相似度的方法,将答案排序信息通过计算排序相关系数的方式融入到问题检索中,克服了由于采用不同自然语言表达的词汇鸿沟问题,提高用户问题检索的准确性和全面性。并且该方法也可以应用在已有CQA问题知识库的管理,通过发现知识库中已有的相似问题,进行相似问题的答案的合并和优化,提升用户体验。
附图说明
图1为本发明的流程图。
具体实施方式
结合以下具体实施例和附图,对本发明作进一步的详细说明。实施本发明的过程、条件、实验方法等,除以下专门提及的内容之外,均为本领域的普遍知识和公知常识,本发明没有特别限制内容。
本发明中所涉及的专业术语的定义如下:
社区问答(community question answering):一方面,用户可以提出任意主题的问题,这些问题在社区问答网站上被有相关知识的用户或专家回答,另一方面,社区问答系统针对用户问题,检索相关问题并返回相关问题的答案作为用户问题的答案。
问题检索(question retrieval):输入一个查询问题,在社区问答知识库中检索出相似的问题。答案排序(answer ranking):给定一个问题和多个候选答案,根据问题-答案的相关匹配程度对答案进行相关性排序。
排序相关系数(rank correlation coefficient):表示两个排序之间的统计依存程度,常用的排序相关系数有斯皮尔曼(Spearman)、皮尔森(Pearson)、肯德尔(Kendall)排序相关系数等。
为了利用答案排序信息,社区问答中用户会给予不同质量的答案不同的评分,这一评分能够反映答案与问题的匹配程度,回答地越好的答案评分会越高。本发明的第一步就利用这种社区用户数据标记的方法,虽然社区用户标记数据的质量不如专家标记数据高,存在一些噪声,但减少了很多人工成本,并且可以获得大量足够的标记训练数据样本。在标记的训练集上训练有监督的排序模型有两种方式:一是基于两两比较的排序模型,即学习排序(Learning-to-rank),然后用模型的输出直接作为排序得分;二是训练有监督的分类模型,即逻辑回归(Logistic Regression,LR)、支持向量机(Support VectorMachine,SVM)等,然后利用模型的概率输出置信得分作为排序得分。以第二种方式为例,模型训练过程描述如下:
输入:问题答案集合Q-A={q1-a1,q2-a2,…,qn-an},标记值集合T={t1,t2,…,tn},分类算法及其相关参数
输出:训练好的答案排序模型
过程:
步骤a1:对Q-A集合的问题答案句子对抽取特征如:词匹配特征,基于翻译的特征,基于主题的特征。抽取的特征描述如下:
(1)、词匹配特征:该特征记录了问题和答案句子中共同出现的词的比例,以Q1-A1对为例,该特征采用了以下5种度量方法:
其中|Q1|,|A1|分别表示问题和答案中不重复词的数量。
(2)、基于翻译的特征:该特征将问题和答案相关性看作是统计机器翻译问题,即给定答案A1,问题Q1出现的概率值P(Q1|A1)。具体的计算方法如下:
P(w|A1)=(1-θ)Ptr(w|A1)+θPml(w|C) (6)
其中P(w|A1)表示问题Q1中词w从答案A1生成的概率,θ是平滑参数,C表示问答语料库,Pml(w|C)可以通过最大似然计算,Ptr(w|A1)通过训练数据计算得到,P(w|a)表示从A1中的词a到Q1中词w的翻译概率。
(3)、基于主题的特征:该特征使用LDA主题模型来训练问题和答案的主题向量,然后计算两个主题向量的余弦值。
步骤a2:初始化分类器参数,将抽取的特征和标记值T输入分类器,训练分类器模型。
本发明的第二步采用快速信息检索方法(即TFIDF、BM25),从问答知识库中检索出大量与用户问题相关的候选问题集合(包含噪声)。
本发明的第三步利用构建的答案排序模型分别对用户问题Q0和相关问题Q1的同一答案集A={A1,A2,…An}进行排序,n为答案集A中答案的数量,得到排序结果得分为S0={s01,s02,…,s0n}和S1={s11,s12,…,s1n}。
本发明的第四步是在第三步得到的排序结果S0和S1上计算这两个排序的相关系数,采用斯皮尔曼(Spearman)、皮尔森(Pearson)、肯德尔(Kendall)这三种常用相关系数,如下:
(1)、斯皮尔曼相关系数:评估两个得分排序结果是否能用单调函数很好的描述出来,输出值在1和-1之间,正数表示正相关,负数表示负相关,值越大表示越相关,计算方法如下:
其中,di表示先将得分S0和S1转化为排序R0={r01,r02,…,r0n}和R1={r11,r12,…,r1n},然后计算r0i-r1i的值。
(2)、皮尔森相关系数:评估两个得分排序结果是否线性相关,1表示正相关,0表示不相关,1表示负相关,计算方法如下,
其中,
(3)、肯德尔相关系数:评估两个得分排序结果是否序相关,计算方法如下:
假如,对于所有的得分s0i和s1i都是唯一的,如果s0i>s1i且s0j>s1j或者s0i<s1i且s0j<s1j,那么得分对(s0i,s1i)和(s0j,s1j)是一致的(concordant pairs),反之是不一致的(disconcordant pairs)。最终,本发明第五步中将得到的相关系数直接作为用户问题和相关问题的相似度得分,或者加入到问题相似度特征集合中,常用的问题相似度特征有词匹配、基于翻译和基于主题的特征等,计算方法与在Q-A对上的计算方式一样,使用这些特征来训练分类器,然后将分类器的概率输出置信得分作为用户问题和相关问题的相似度得分。
表1一个包含相似问题与它们各自答案集的相关排序的示例表
Claims (4)
1.一种利用答案相关性排序的评估度量来计算问题相似度的方法,其特征在于,该方法包括如下步骤:
步骤一:在CQA问答知识库中已有问题-答案排序信息的训练数据集上学习有监督的答案排序模型;
步骤二:采用快速信息检索方法,从问答知识库中检索出与用户问题相关的候选问题集合,其中包含噪声问题;
步骤三:根据构建的答案排序模型计算分别得到用户问题和各个相关的候选问题针对同一答案集的相关性排序;
步骤四:计算相关性排序的评估度量,即斯皮尔曼、皮尔森和肯德尔相关系数;
步骤五:得到的相关系数直接作为用户问题和相关的候选问题的相似度得分;或者加入到问题相似度特征集合中来训练分类器,然后将分类器输出的概率置信得分作为用户问题和相关的候选问题的相似度得分。
2.如权利要求1所述的方法,其特征在于,所述步骤一中的训练数据集上学习有监督的答案排序模型,包括如下步骤:
步骤a1:从问答知识库中抽取已有的问题-答案对,根据用户对不同答案的评分,给予对应的问题-答案对不同的标签,构建训练数据集;
步骤a2:在训练数据集上采用机器学习模型学习出有监督的答案排序模型;其中,所述机器学习模型为逻辑回归或支持向量机。
3.如权利要求1所述的方法,其特征在于,所述步骤二中从问答知识库中检索出与用户问题相关的候选问题集合,包括如下步骤:
步骤b1:采用快速信息检索方法,以用户问题为查询内容,在问答知识库中进行查询检索;其中,所述快速信息检索方法为TFIDF或BM25;
步骤b2:返回的结果作为与用户问题相关的候选问题集合,其中包含噪声问题。
4.如权利要求1所述的方法,其特征在于,所述步骤三中计算分别得到用户问题和各个相关的候选问题针对同一答案集的相关性排序,包括如下步骤:
步骤c1:使用步骤一中已训练的答案排序模型,计算用户问题与相关的候选问题集的各个答案的相关得分进行相关性排序;
步骤c2:使用步骤一中已训练的答案排序模型,计算相关的候选问题集的各个答案的相关得分进行相关性排序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610194522.9A CN105893523B (zh) | 2016-03-31 | 2016-03-31 | 利用答案相关性排序的评估度量来计算问题相似度的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610194522.9A CN105893523B (zh) | 2016-03-31 | 2016-03-31 | 利用答案相关性排序的评估度量来计算问题相似度的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105893523A CN105893523A (zh) | 2016-08-24 |
CN105893523B true CN105893523B (zh) | 2019-05-17 |
Family
ID=57014365
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610194522.9A Active CN105893523B (zh) | 2016-03-31 | 2016-03-31 | 利用答案相关性排序的评估度量来计算问题相似度的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105893523B (zh) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108509461A (zh) * | 2017-02-28 | 2018-09-07 | 华为技术有限公司 | 一种基于强化学习的排序学习方法及服务器 |
CN107203600B (zh) * | 2017-05-12 | 2020-09-18 | 浙江大学 | 一种利用刻画因果依赖关系和时序影响机制增强答案质量排序的评判方法 |
WO2019084867A1 (zh) * | 2017-11-02 | 2019-05-09 | 深圳前海达闼云端智能科技有限公司 | 自动回答方法、装置、存储介质及电子设备 |
CN110019715B (zh) * | 2017-12-08 | 2023-07-14 | 阿里巴巴集团控股有限公司 | 应答确定方法、装置、设备、介质和系统 |
CN108121800B (zh) * | 2017-12-21 | 2021-12-21 | 北京百度网讯科技有限公司 | 基于人工智能的信息生成方法和装置 |
CN108717413B (zh) * | 2018-03-26 | 2021-10-08 | 浙江大学 | 一种基于假设性半监督学习的开放领域问答方法 |
CN108647233B (zh) * | 2018-04-02 | 2020-11-17 | 北京大学深圳研究生院 | 一种用于问答系统的答案排序方法 |
CN108920543B (zh) * | 2018-06-13 | 2020-07-10 | 珠海格力电器股份有限公司 | 查询和交互的方法及装置、计算机装置、存储介质 |
CN109376984A (zh) * | 2018-09-03 | 2019-02-22 | 杭州医好网络科技有限公司 | 一种基于医院后勤分类运送任务的员工排序方法 |
CN109492076B (zh) * | 2018-09-20 | 2022-02-11 | 西安交通大学 | 一种基于网络的社区问答网站答案可信评估方法 |
CN109582781A (zh) * | 2018-11-21 | 2019-04-05 | 平安科技(深圳)有限公司 | 随访问题的选择方法、装置、计算机设备及存储介质 |
CN109815317B (zh) * | 2018-12-13 | 2023-08-22 | 重庆德塔蔓灵科技有限公司 | 一种排序学习方法、系统、计算机可读存储介质及设备 |
US11600389B2 (en) | 2019-03-19 | 2023-03-07 | Boe Technology Group Co., Ltd. | Question generating method and apparatus, inquiring diagnosis system, and computer readable storage medium |
CN110059231B (zh) * | 2019-04-19 | 2021-10-19 | 康忠华 | 一种回复内容的生成方法及装置 |
CN110175241B (zh) * | 2019-05-23 | 2021-08-03 | 腾讯科技(深圳)有限公司 | 问答库构建方法、装置、电子设备及计算机可读介质 |
CN110389264B (zh) * | 2019-07-01 | 2020-07-17 | 浙江大学 | 一种异常用电计量的检测方法 |
CN110543558B (zh) * | 2019-09-06 | 2023-01-17 | 北京百度网讯科技有限公司 | 问题匹配方法、装置、设备和介质 |
CN113051393A (zh) * | 2019-12-27 | 2021-06-29 | 财团法人工业技术研究院 | 问答学习方法、问答学习系统及其计算机程序产品 |
US12014284B2 (en) | 2019-12-27 | 2024-06-18 | Industrial Technology Research Institute | Question-answering learning method and question-answering learning system using the same and computer program product thereof |
CN111427995B (zh) * | 2020-02-26 | 2023-05-26 | 平安科技(深圳)有限公司 | 基于内部对抗机制的语义匹配方法、装置及存储介质 |
CN112184021B (zh) * | 2020-09-28 | 2023-09-05 | 中国人民解放军国防科技大学 | 一种基于相似支持集的答案质量评估方法 |
CN112052326A (zh) * | 2020-09-30 | 2020-12-08 | 民生科技有限责任公司 | 一种基于长短文本匹配的智能问答方法及系统 |
CN112329009B (zh) * | 2020-10-12 | 2022-12-06 | 南京理工大学 | 一种针对联合学习中噪声攻击的防御方法 |
CN112380330A (zh) * | 2020-11-13 | 2021-02-19 | 四川大学 | 一种精分阴性症状背景下的训练用机器人系统和方法 |
CN112417126B (zh) * | 2020-12-02 | 2024-01-23 | 车智互联(北京)科技有限公司 | 一种问答方法、计算设备以及存储介质 |
CN113157891B (zh) * | 2021-05-07 | 2023-11-17 | 泰康保险集团股份有限公司 | 知识图谱路径排序方法、系统、设备及存储介质 |
CN113505213B (zh) * | 2021-09-09 | 2021-12-24 | 无码科技(杭州)有限公司 | 关键句提取方法、系统、计算机可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609500A (zh) * | 2012-02-01 | 2012-07-25 | 北京百度网讯科技有限公司 | 一种问题推送方法和采用该方法的问答系统和搜索引擎 |
CN102903008A (zh) * | 2011-07-29 | 2013-01-30 | 国际商业机器公司 | 用于计算机问答的方法及系统 |
JP2014142858A (ja) * | 2013-01-25 | 2014-08-07 | Canon Marketing Japan Inc | 回答支援システム、回答支援システムの制御方法、およびプログラム |
CN104462554A (zh) * | 2014-12-25 | 2015-03-25 | 北京奇虎科技有限公司 | 问答页面相关问题推荐方法和装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090253112A1 (en) * | 2008-04-07 | 2009-10-08 | Microsoft Corporation | Recommending questions to users of community qiestion answering |
US20110246465A1 (en) * | 2010-03-31 | 2011-10-06 | Salesforce.Com, Inc. | Methods and sysems for performing real-time recommendation processing |
-
2016
- 2016-03-31 CN CN201610194522.9A patent/CN105893523B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102903008A (zh) * | 2011-07-29 | 2013-01-30 | 国际商业机器公司 | 用于计算机问答的方法及系统 |
CN102609500A (zh) * | 2012-02-01 | 2012-07-25 | 北京百度网讯科技有限公司 | 一种问题推送方法和采用该方法的问答系统和搜索引擎 |
JP2014142858A (ja) * | 2013-01-25 | 2014-08-07 | Canon Marketing Japan Inc | 回答支援システム、回答支援システムの制御方法、およびプログラム |
CN104462554A (zh) * | 2014-12-25 | 2015-03-25 | 北京奇虎科技有限公司 | 问答页面相关问题推荐方法和装置 |
Non-Patent Citations (1)
Title |
---|
Exploiting User Profile Information for Answer Ranking in CQA;Zhi-Min Zhou等;《The 21st International Conference on World Wide Web》;20120420;767-774 |
Also Published As
Publication number | Publication date |
---|---|
CN105893523A (zh) | 2016-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105893523B (zh) | 利用答案相关性排序的评估度量来计算问题相似度的方法 | |
CN110427463B (zh) | 搜索语句响应方法、装置及服务器和存储介质 | |
US10831769B2 (en) | Search method and device for asking type query based on deep question and answer | |
CN105989040B (zh) | 智能问答的方法、装置及系统 | |
CN107729468B (zh) | 基于深度学习的答案抽取方法及系统 | |
US8346701B2 (en) | Answer ranking in community question-answering sites | |
Bao et al. | Competitor mining with the web | |
CN106055675B (zh) | 一种基于卷积神经网络和距离监督的关系抽取方法 | |
US20100125540A1 (en) | System And Method For Providing Robust Topic Identification In Social Indexes | |
CN109960756A (zh) | 新闻事件信息归纳方法 | |
CN113076411B (zh) | 一种基于知识图谱的医疗查询扩展方法 | |
CN112559684A (zh) | 一种关键词提取及信息检索方法 | |
Gupta et al. | Vico: Word embeddings from visual co-occurrences | |
CN108520038B (zh) | 一种基于排序学习算法的生物医学文献检索方法 | |
CN114519351A (zh) | 一种基于用户意图嵌入图谱学习的主题文本快速检测方法 | |
JP5213098B2 (ja) | 質問応答方法及びシステム | |
CN112463944B (zh) | 一种基于多模型融合的检索式智能问答方法及装置 | |
Gao et al. | Chinese micro-blog sentiment analysis based on semantic features and PAD model | |
CN112395484A (zh) | 一种面向自动驾驶汽车的用户满意度评价方法 | |
CN104077419B (zh) | 结合语义与视觉信息的长查询图像检索重排序方法 | |
CN110069601A (zh) | 情绪检测分析方法及相关装置 | |
Feng et al. | Lexical semantic relatedness for twitter analytics | |
CN116226320A (zh) | 一种预测下文信息的方法、装置、电子设备及存储介质 | |
CN113868387A (zh) | 一种基于改进tf-idf加权的word2vec医疗相似问题检索方法 | |
Othman et al. | Using word embeddings to retrieve semantically similar questions in community question answering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |