CN104199965B - 一种语义信息检索方法 - Google Patents

一种语义信息检索方法 Download PDF

Info

Publication number
CN104199965B
CN104199965B CN201410483181.8A CN201410483181A CN104199965B CN 104199965 B CN104199965 B CN 104199965B CN 201410483181 A CN201410483181 A CN 201410483181A CN 104199965 B CN104199965 B CN 104199965B
Authority
CN
China
Prior art keywords
expression
concept
text
word
semantic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410483181.8A
Other languages
English (en)
Other versions
CN104199965A (zh
Inventor
吴晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201410483181.8A priority Critical patent/CN104199965B/zh
Publication of CN104199965A publication Critical patent/CN104199965A/zh
Application granted granted Critical
Publication of CN104199965B publication Critical patent/CN104199965B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

发明公开了一种语义信息检索方法,该方法包括:接收用户提交的查询词,通过分词处理得到该查询词中所包含的关键词;依据关键词之间的语义关系,进行查询分析,将其转换为概念表达;从存储介质中以篇为单位读取待检索文本;对待检索文本进行分句分词,把读取的文本切分为语句、词语;对语句进行语义分析,得到语句的概念类别和词语的概念表达;计算上述获取的查询词的概念表达与待检索文本的概念表达之间的语义距离;依据语义距离由近及远排序,返回查询结果。与传统信息检索方法通过词语匹配得到的检索结果相比,可以有效提升检索结果的准确性。

Description

一种语义信息检索方法
技术领域
本发明涉及互联网技术领域,尤其是一种语义信息检索方法。
背景技术
信息检索的发展到现在已经经历了两代。第一代信息检索是人工分目录检索;第二代是计算机依靠算法实现的以关键词检索为主要表现的自动信息检索。第二代检索的主要技术特征为概率统计算法在检索中取得的成功。这一技术的出现无疑莫定了检索技术发展的一个重要里程碑,基本方法为对文本进行分词,同时构建由词语作为特征的文本特征向量,并建立倒排索引供查询匹配使用。另一方面,将用户输入的检索请求也表示为特征向量,计算两者之间的余弦距离,或者计算当出现检索特征向量时出现文本特征向量的概率值,并将结果从高到低排序,作为检索返回结果。比如,专利号CN102023989公开了一种信息检索方法及系统,所述方法包括:接收查询词,通过分词处理得到该查询词中所包含的关键词,通过所述信息检索系统的倒排索引数据查找与所述关键词匹配的文本,以及与所述文本对应的正排索引数据,根据所述文本对应的正排索引数据确定出所述文本的摘要,将所述文本的摘要以及文本的信息作为检索结果进行输出。通过此方法进而解决检索效率低的问题;专利号CN103365910A公开了一种信息检索的方法和系统,所述方法利用QA词表扩展检索关键词,从而提升检索的覆盖率;专利号CN103383701A公开了一种信息检索方法、装置及终端,所述方法通过历史检索记录来对当前输入关键词进行补全从而降低用户输入的难度,扩充检索结果。
采用概率统计算法实现检索的最大优势在于:已有相当多成熟、可供利用的数学模型,同时算法实现的方案明确、复杂度不高、易于工程化。
然而,这些方法都无一例外的将词语作为处理对象,并将其看作相互独立的离散符号,即一个词语的出现与其它词语的出现相互独立,这就不可避免地存在处理上的欠缺,以篇章为单元、以词语为单位的数据集合无法满足概率统计模型对数据无关性的要求。这已经成为影响当前信息检索效能进一步提高的瓶颈。
发明内容
为了解决以上问题,本发明提供了一种基于语义的信息检索方法,目的是充分利用上下文中蕴含的丰富语义知识来提升信息检索的效能。该方法通过自然语言理解手段获取词汇及语句的形式化语义表示,并在这基础上结合一定的统计模型实现信息检索。
所述技术方案如下:
接收用户提交的查询词,通过分词处理得到该查询词中所包含的关键词;
依据关键词之间的语义关系,进行查询分析,将关键词转换为概念表达;
从存储介质中以篇为单位读取待检索文本;
对待检索文本进行分句分词,把读取的文本切分为语句、词语;
对语句进行语义分析,得到语句的概念类别和词语的概念表达;
计算上述获取的查询词的概念表达与待检索文本的概念表达之间的语义距离;
依据语义距离由近及远排序,返回查询结果。
本发明提供的技术方案的有益效果是:
基于对语义的概念表示,通过语句语义分析获取检索词以及待检索文本的概念表达,利用概念之间的相关性和统计特性,计算两者之间的语义距离来实现高效的信息检索,与传统信息检索方法通过词语匹配得到的检索结果相比,可以有效提升检索结果的准确性。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1是本发明语义信息检索方法流程图;
图2是本发明语义距离计算的流程图;
图3语句语义理解结果示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明实施方式作进一步地详细描述:
本实施例提供了一种信息检索方法方法,如图1所示,该方法包括:
步骤10接收用户提交的查询词,通过分词处理得到该查询词中所包含的关键词;
查询词可以是单个词或多个词或词句,还可以是通过关系运算符(and,or等)连接的多个单词(或词句)。通过分词处理得到该查询词中所包含的关键词,并过滤掉停用词,比如:的、是。
步骤20依据关键词之间的语义关系,进行查询分析,将关键词转换为概念表达;
首先,将上述步骤获得的关键词读入到候选数组,假设由n个关键词组成,Q={q1,q2,...,qn};
其次,从词语知识库中选取查询关键字qi的所有候选义项的概念表达ci,假设有k个,将它们读入到新的数组ci={ci1,ci2,...,cik},其中,1<=i<=n,k表示查询关键字qi的候选概念表达的序号;
如果HasRelation(cix,cjy)==true,即cix和cjy之间被定义了语义相关性,其中cix∈ci,cjy∈cj,i≠j则,从词语知识库中返回两者之间的相关度值R(cix,cjy);否则两者之间相关度设为零;
获取使得
Figure GDA0002133754710000041
最优的一组数组概念表达Cm={c1x,c2y,...,cnz}以及对应的
Figure GDA0002133754710000042
值,其中,x、y、z表示ci的第x个、第y个、第z个概念表达。
其中,词语知识库由人工预先维护好,词语知识库中包含:义项数:为词语可能对应的概念数;概念符号:概念表达,为词语所对应的概念;句类代码:为该词语所能激活的语句的句类表示式代码;语义相关性:为该词语概念表达与其他存在相关性词语对应的概念表达之间的相关性度量值。
下表给出了一个词语知识库的实施示例:
Figure GDA0002133754710000043
步骤30从存储介质中以篇为单位读取待检索文本;
步骤40对待检索文本进行分句分词,把读取的文本切分为语句、词语;
以文本的“回车、换行、句号、问号、叹号和分号”等字符为切分点,把文本切分成若干个语句。再通过逆向最大匹配法,依据词语知识库中词语,将语句切分为若干词语。
步骤50对语句进行语义分析,得到语句的概念类别和词语的概念表达;
对于每一个语句,依据词语知识库,分析语句得到语句的概念类别和各词语所映射的概念(Term concept),语句的概念类别用句类表示式(SCE)来表示。
具体地,语义分析的流程为:
依据词语知识库,从语句中挑选一个特征词语;
从词语知识库中获取该特征词语所能激活的语句的句类表示式;
提出假设,假设上述表示式就是本语句的句类表示式;
寻找语句中的其他词语是否存在这样一组概念表达,使得句类表示式对他们的语义要求都满足;
如果满足,则假设成立,语义分析成功,输出句类表示式以及各组成词语所映射的概念表达;
如果不满足,则重新寻找语句中的特征词语,直至语义分析成功,或者所有假设都不成立,输出语义分析失败。
在本实施例中,如果语义分析失败,该语句将跳过不再做处理。
图3给出了一个经过语义分析后所得到的语句理解结果,处理结果包括了语句的句类表示式(SCE)以及各元素所映射的概念(Term concept)。其中,原语句之上的“||”为主语义块划分标志,“||~”和“~||”为辅语义块划分标志。“SB+S+SC+Cn1+Cn2”为句类表达式(SCE),句类表达式的模式是预先设置好的,该表达式表明了该语句是一个状态句,描述了一种状态。句类表达式中的各个语义块与语句之中的词语的对应关系已经由箭头指出。图中同时指出了语句中的每个词语对应的概念表达式(Term concept)。
步骤60计算上述获取的查询词的概念表达与待检索文本的概念表达之间的语义距离;
具体地,语义距离计算的方法如图2所示。
步骤201计算全局模型下,待检索文本与检索词概念表达之间的语义距离。用文本出现某个概念表达的概率来表示,具体计算公式为:
Figure GDA0002133754710000051
其中,
Figure GDA0002133754710000052
Figure GDA0002133754710000061
其中,p为基于Kullback-Leibler算法生成的文本聚类;
kl(d,p)是文本d和聚类p之间的K-L距离;
n(ti,d)为概念表达ti在文本d中的权重,为文本d中出现的概念表达t的数量;
|d|为文本d中出现的所有概念表达的数量。
Figure GDA0002133754710000062
度量的是概念表达t在聚类p中的出现的数量;
tf(p,t)为聚类p中出现的概念表达t的数量;
|p|为p中出现的所有概念表达的数量。
步骤202计算局部模型下,待检索文本与检索词概念表达之间的语义距离;
具体方法为:度量某个文本,在某个领域下,独立产生某个概念表达的可能性。采用了泊松分布(Poisson distribution)模型对模型的风险进行了模型化,采用泊松分布模型的原因是其较好的反映了词条分布模型。
具体计算公式为:
Figure GDA0002133754710000063
其中,P(t,d)为概念表达t与文本d之间的相关度,
Figure GDA0002133754710000064
tf(di,t)为文本di出现概念表达t的次数,|di|为文本di中所有概念表达的数量;
Pavg(t,p)为所有包含文本di的聚类p出现概念表达t的平均可能性,具体计算公式为:
Figure GDA0002133754710000065
df(t)为出现概念表达t的文本的数量;
P(ki,λ)为风险函数,ki为文档di中出现概念表达t的次数,ki=tf(di,t),λ为该文档所在领域中概念表达t出现的次数。
Figure GDA0002133754710000066
k!为k的阶乘,
λ为该文本di所在聚类p中概念表达t出现的次数,
Figure GDA0002133754710000071
df(t)为出现概念表达t的文档的数量。
步骤203采用差值方法将局部模型和全局模型进行平滑,计算最终待检索文本与检索词之间的语义距离;
具体公式为:
Figure GDA0002133754710000072
其中,P(t|d)=λP(t|d,p)+(1-λ)P(t|d,c)。
Figure GDA0002133754710000073
Figure GDA0002133754710000074
argTmax P(T|Q)表示出现查询条件Q的情况下出现某一个概念表达T的可能性最大;
α为平滑参数;
T为所有概念表达t的集合,Q为所有查询词的概念表达的集合,即q的集合;
t∞q表示查询q被翻译成了相应的概念表达t;
Q表示查询条件;
T表示查询条件对应的概念表达;
qi表示查询条件Q中第i个关键词;
tij表示第i个关键词qi所对应的第j个候选概念表达。
步骤70依据语义距离由近及远排序,返回查询结果;
具体地,计算每一个文本产生查询条件的可能性P(Q|d),可能性越大则语义距离越近,并对文本按语义距离由近及远进行排序,返回查询结果d的排序后集合。
以上所述实施方式仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案作出的各种变形和改进,均应落入本发明的权利要求书确定的保护范围内。

Claims (4)

1.一种语义信息检索方法,包括:接收用户提交的查询词,查询词是单个词或多个词或词句,或者是通过关系运算符and或者or连接的多个单词或词句;通过分词处理得到该查询词中所包含的关键词;依据关键词之间的语义关系,进行查询分析,将其转换为概念表达;从存储介质中以篇为单位读取待检索文本;对待检索文本进行分句分词,把读取的文本切分为语句、词语;对语句进行语义分析,得到语句的概念类别和词语的概念表达;计算上述获取的查询词的概念表达与待检索文本的概念表达之间的语义距离;依据语义距离由近及远排序,返回查询结果; 其中,上述查询词的概念表达与待检索文本的概念表达之间的语义距离计算的方法分为下述三个步骤:
步骤1:计算全局模型下,待检索文本d与检索词概念表达t之间的语义距离P(t|d,c);
Figure FDA0002465878390000011
其中,p为基于Kullback-Leibler算法生成的文本聚类;
P(p|d)为文本d属于某个聚类p的可能性,
Figure FDA0002465878390000012
kl(d,p)是文本d和聚类p之间的K-L距离;
Figure FDA0002465878390000013
其中,n(ti,d)为概念表达ti在文本d中出现的数量;
|d|为文本d中出现的所有概念表达的数量;
P(t|p)为聚类p产生某个概念表达t的可能性,
Figure FDA0002465878390000014
即为概念表达t在聚类p中的出现的数量,tf(p,t)为聚类p中出现的概念表达t的数量,|p|为p中出现的所有概念表达的数量;
步骤2:计算局部模型下,待检索文本d与检索词概念表达t之间的语义距离P(t|d,p);
Figure FDA0002465878390000015
其中,P(t,d)为概念表达t与文本d之间的相关度,
Figure FDA0002465878390000021
tf(di,t)为文本di出现概念表达t的次数,|di|为文本di中所有概念表达的数量;
其中,Pavg(t,p)为所有包含文本di的聚类p出现概念表达t的平均可能性,具体计算公式为:
Figure FDA0002465878390000022
df(t)为出现概念表达t的文本的数量;
其中,P(ki,λ)为风险函数,ki为文档di中出现概念表达t的次数,ki=tf(di,t),λ为该文档所在聚类中概念表达t出现的次数,
Figure FDA0002465878390000023
k!为k的阶乘,λ为该文本di所在聚类p中概念表达t出现的次数,
Figure FDA0002465878390000024
df(t)为出现概念表达t的文档的数量;
步骤3:采用差值方法将局部模型和全局模型进行平滑,计算最终待检索文本d与检索词Q之间的语义距离P(Q|d);
Figure FDA0002465878390000025
其中,P(q|t)为出现概念表达t时出现检索词q的可能性;
P(t|d)为文档d与概念表达t的相关度,具体计算公式为:
P(t|d)=λP(t|d,p)+(1-λ)P(t|d,c);
其中,P(t|d,p)同上,P(t|d,c)同上,λ为平滑参数;
其中,t∞q表示查询q被映射成了相应的概念表达t;
其中,P(T|Q)为查询条件Q下,出现T的可能性,具体计算公式为:
Figure FDA0002465878390000026
其中,argTmaxP(T|Q)表示出现查询条件Q的情况下出现某一个概念表达T的可能性最大;
T为所有概念表达t的集合;
Q为所有查询词的概念表达的集合,即q的集合;
qi表示查询条件Q中第i个关键词;
tij表示第i个关键词qi所对应的第j个候选概念表达;
R(x,y)表示概念表达x和概念表达y之间的语义相关度,值越大,表明两者相关度越大。
2.根据权利要求1所述的语义信息检索方法,其特征在于,将关键词转换为概念表达的具体流程为:
将上述步骤获得的关键词读入到候选数组,假设由n个关键词组成,Q={q1,q2,...,qn};
从词语知识库中选取查询关键字qi的所有候选义项的概念表达ci,假设有k个,将它们读入到新的数组ci={ci1,ci2,...,cik},其中,1<=i<=n,k表示查询关键字qi的候选概念表达的序号;
如果HasRelation(cix,cjy)==true,即cix和cjy之间被定义了语义相关性,其中cix∈ci,cjy∈cj,i≠j则,从词语知识库中返回两者之间的相关度值R(cix,cjy);否则两者之间相关度设为零;
获取使得
Figure FDA0002465878390000031
最优的一组数组概念表达Cm={c1x,c2y,...,cnz}以及对应的
Figure FDA0002465878390000032
值,其中,x、y、z表示ci的第x个、第y个、第z个概念表达。
3.根据权利要求1所述的语义信息检索方法,其特征在于,对语句进行语义分析的具体流程为:
依据词语知识库,从语句中挑选一个特征词语;
从词语知识库中获取该特征词语所能激活的语句的句类表示式;
提出假设,假设上述表示式就是本语句的句类表示式;
寻找语句中的其他词语是否存在这样一组概念表达,使得句类表示式对他们的语义要求都满足;
如果满足,则假设成立,语义分析成功,输出句类表示式以及各组成词语所映射的概念表达;
如果不满足,则重新寻找语句中的特征词语,直至语义分析成功,或者所有假设都不成立,输出语义分析失败。
4.根据权利要求2或3所述的语义信息检索方法,其特征在于,词语知识库由人工预先维护好,词语知识库中包含:义项数:为词语可能对应的概念数;概念符号:概念表达,为词语所对应的概念;句类代码:为该词语所能激活的语句的句类表示式代码;语义相关性:为该词语概念表达与其他存在相关性词语对应的概念表达之间的相关性度量值。
CN201410483181.8A 2014-09-22 2014-09-22 一种语义信息检索方法 Active CN104199965B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410483181.8A CN104199965B (zh) 2014-09-22 2014-09-22 一种语义信息检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410483181.8A CN104199965B (zh) 2014-09-22 2014-09-22 一种语义信息检索方法

Publications (2)

Publication Number Publication Date
CN104199965A CN104199965A (zh) 2014-12-10
CN104199965B true CN104199965B (zh) 2020-08-07

Family

ID=52085258

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410483181.8A Active CN104199965B (zh) 2014-09-22 2014-09-22 一种语义信息检索方法

Country Status (1)

Country Link
CN (1) CN104199965B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573028B (zh) * 2015-01-14 2019-01-25 百度在线网络技术(北京)有限公司 实现智能问答的方法和系统
CN106708797B (zh) * 2015-07-15 2021-03-16 中兴通讯股份有限公司 一种文字处理方法和装置
CN105512300B (zh) * 2015-12-11 2019-01-22 宁波中青华云新媒体科技有限公司 信息过滤方法及系统
US9792534B2 (en) * 2016-01-13 2017-10-17 Adobe Systems Incorporated Semantic natural language vector space
CN106412196A (zh) * 2016-05-31 2017-02-15 深圳市永兴元科技有限公司 联系人信息处理方法和装置
CN106095818A (zh) * 2016-05-31 2016-11-09 深圳市永兴元科技有限公司 联系人的查询方法和装置
US10984026B2 (en) * 2017-04-25 2021-04-20 Panasonic Intellectual Property Management Co., Ltd. Search method for performing search based on an obtained search word and an associated search word
CN107704453B (zh) * 2017-10-23 2021-10-08 深圳市前海众兴科研有限公司 一种文字语义分析方法、文字语义分析终端及存储介质
CN107885801B (zh) * 2017-10-31 2024-02-02 上海博泰悦臻网络技术服务有限公司 多层次信息检索的方法、导航终端及存储介质
CN108491183B (zh) * 2018-04-04 2021-01-15 联想(北京)有限公司 一种信息处理方法和电子设备
JP7139157B2 (ja) * 2018-06-04 2022-09-20 株式会社ユニバーサルエンターテインメント 検索文生成システム、及び検索文生成方法
CN109543096B (zh) * 2018-10-15 2024-06-28 平安科技(深圳)有限公司 数据查询方法、装置、计算机设备和存储介质
CN110276071B (zh) * 2019-05-24 2023-10-13 众安在线财产保险股份有限公司 一种文本匹配方法、装置、计算机设备及存储介质
CN110532354B (zh) * 2019-08-27 2023-01-06 腾讯科技(深圳)有限公司 内容的检索方法及装置
CN112926300A (zh) * 2021-03-31 2021-06-08 深圳市优必选科技股份有限公司 图像搜索方法、图像搜索装置及终端设备
CN113139048B (zh) * 2021-04-19 2022-11-04 中国人民解放军91054部队 一种检索结果提供方法及系统
CN113704397B (zh) * 2021-08-05 2024-01-09 北京百度网讯科技有限公司 检索方法、装置、电子设备以及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101937462A (zh) * 2010-09-03 2011-01-05 中国科学院声学研究所 文献自动评价方法及系统
CN103838833A (zh) * 2014-02-24 2014-06-04 华中师范大学 基于相关词语语义分析的全文检索系统
CN104008090A (zh) * 2014-04-29 2014-08-27 河海大学 一种基于概念向量模型的多主题提取方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101937462A (zh) * 2010-09-03 2011-01-05 中国科学院声学研究所 文献自动评价方法及系统
CN103838833A (zh) * 2014-02-24 2014-06-04 华中师范大学 基于相关词语语义分析的全文检索系统
CN104008090A (zh) * 2014-04-29 2014-08-27 河海大学 一种基于概念向量模型的多主题提取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种基于知识库的语义检索系统模型;马中杰 等;《微型机与应用》;20101025;第29卷(第20期);第71-72页 *
马中杰 等.一种基于知识库的语义检索系统模型.《微型机与应用》.2010,第29卷(第20期), *

Also Published As

Publication number Publication date
CN104199965A (zh) 2014-12-10

Similar Documents

Publication Publication Date Title
CN104199965B (zh) 一种语义信息检索方法
CN110019732B (zh) 一种智能问答方法以及相关装置
CN111767716B (zh) 企业多级行业信息的确定方法、装置及计算机设备
CN112035599B (zh) 基于垂直搜索的查询方法、装置、计算机设备及存储介质
CN103425687A (zh) 一种基于关键词的检索方法和系统
WO2021068683A1 (zh) 正则表达式生成方法、装置、服务器及计算机可读存储介质
CN116628173B (zh) 一种基于关键字提取的智能客服信息生成系统及生成方法
WO2004066090A2 (en) Query string matching method and apparatus
CN111625621B (zh) 一种文档检索方法、装置、电子设备及存储介质
CN108875065B (zh) 一种基于内容的印尼新闻网页推荐方法
CN110222192A (zh) 语料库建立方法及装置
CN115563313A (zh) 基于知识图谱的文献书籍语义检索系统
CN110866102A (zh) 检索处理方法
CN111753514B (zh) 一种专利申请文本的自动生成方法和装置
CN111325033B (zh) 实体识别方法、装置、电子设备及计算机可读存储介质
CN109948154A (zh) 一种基于邮箱名的人物获取及关系推荐系统和方法
CN102722526B (zh) 基于词性分类统计的重复网页和近似网页的识别方法
CN113761104A (zh) 知识图谱中实体关系的检测方法、装置和电子设备
KR101592670B1 (ko) 인덱스를 이용하는 데이터 검색 장치 및 이를 이용하는 방법
CN116226526A (zh) 一种知识产权智能检索平台及方法
CN111444414A (zh) 一种用于建模ad-hoc检索任务中多样相关特征的信息检索模型
CN105426490A (zh) 一种基于树形结构的索引方法
CN114385777A (zh) 文本数据处理方法、装置、计算机设备和存储介质
CN113536772A (zh) 一种文本处理方法、装置、设备及存储介质
CN110930189A (zh) 基于用户行为的个性化营销方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant