CN114925692B - 一种获取目标事件的数据处理系统 - Google Patents

一种获取目标事件的数据处理系统 Download PDF

Info

Publication number
CN114925692B
CN114925692B CN202210856529.8A CN202210856529A CN114925692B CN 114925692 B CN114925692 B CN 114925692B CN 202210856529 A CN202210856529 A CN 202210856529A CN 114925692 B CN114925692 B CN 114925692B
Authority
CN
China
Prior art keywords
target
word
occurrence
list
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210856529.8A
Other languages
English (en)
Other versions
CN114925692A (zh
Inventor
傅晓航
刘羽
张正义
刘宸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke Yuchen Technology Co Ltd
Original Assignee
Zhongke Yuchen Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongke Yuchen Technology Co Ltd filed Critical Zhongke Yuchen Technology Co Ltd
Priority to CN202210856529.8A priority Critical patent/CN114925692B/zh
Publication of CN114925692A publication Critical patent/CN114925692A/zh
Application granted granted Critical
Publication of CN114925692B publication Critical patent/CN114925692B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种获取目标事件的数据处理系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括:初始文本集,当所述计算机程序被处理器执行时,实现以下步骤:获取目标语句且对目标语句进行分词处理,获取目标语句对应的目标共现词列表,根据初始文本集中初始文本列表,获取初始文本列表对应的关键共现词列表,根据目标共现词列表和关键共现词列表,获取目标语句对应的相似度列表且当相似度列表中任一相似度预设的相似度阈值时,将相似度对应的事件作为目标事件;能够通过用户输入的共现词与事件的共现词之间的相似度,确定出用户是否需要查询该事件,有利于用户根据需求查询一系列事件,提高用户体验感。

Description

一种获取目标事件的数据处理系统
技术领域
本发明涉及获取事件技术领域,尤其涉及一种获取目标事件的数据处理系统。
背景技术
随着互联网的不断普及,人类社会进入信息爆炸时代,在这个信息爆炸时代,每一天用户可通过各种媒介平台接收各类数据信息,例如用户通过各种媒介平台获取各种话题对应的至少一个事件,其中一个话题可经历出现、发展、高潮、平淡到最后结束的历程,在这些历程中出现至少一个事件,且不同历程中的事件存在一些关系。
现有技术中存在问题:只是查询出历史上的一系列事件,但无法基于用户的需求,将事件都呈现出来,以便于用户进行查询。
发明内容
针对上述技术问题,本发明采用的技术方案为一种获取目标事件的数据处理系统,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括:初始文本集A={A1,……,Ai,……,An},Ai是指第i个事件对应的初始文本列表,i=1……n,n为事件数量,当所述计算机程序被处理器执行时,实现以下步骤:
S100、获取目标语句且对目标语句进行分词处理,获取目标语句对应的目标共现词列表D={D1,……,Dt,……,Dk},Dt是指目标语句中第t个目标共现词,t=1……k,k是指目标语句中目标共现词数量;
S200、根据Ai,获取Ai对应的关键共现词列表Hi={Hi1,……,Hiy,……,
Figure 31582DEST_PATH_IMAGE002
},Hiy是 指Ai对应的第y个关键共现词,y=1……qi,qi是指Ai中关键共现词数量;
S300、根据D和Hi,获取目标语句对应的相似度列表F={F1,……Fi,……,Fn},Fi是指目标语句与Ai对应的事件之间的相似度,Fi符合如下条件:
Figure 762778DEST_PATH_IMAGE004
,其中,Ft iy是指Dt与Hiy之间的相似度,Wiy是指Hiy对应的权重值;
S400、当Fi>预设的相似度阈值时,将Fi对应的事件作为目标事件;
S500、根据目标事件对应的初始文本列表,获取目标事件对应的事件特征集。
本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明提供的一种识获取目标事件的数据处理系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:
本发明的一种获取目标事件的数据处理系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括:初始文本集,当所述计算机程序被处理器执行时,实现以下步骤:获取目标语句且对目标语句进行分词处理,获取目标语句对应的目标共现词列表,根据初始文本集中初始文本列表,获取初始文本列表对应的关键共现词列表,
根据目标共现词列表和关键共现词列表,获取目标语句对应的相似度列表,当相似度列表中任一相似度预设的相似度阈值时,将相似度对应的事件作为目标事件,根据目标事件对应的初始文本列表,获取目标事件对应的特征列表;能够通过用户输入的共现词与事件的共现词之间的相似度,确定出用户是否需要查询该事件,有利于用户根据需求查询一系列事件,提高用户体验感。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
图1为本发明实施例提供的一种获取目标事件的数据处理系统的执行计算机程序的流程图。
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种获取目标位置的数据处理系统的具体实施方式及其功效,详细说明如后。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
本实施例一提供了一种获取目标事件的数据处理系统,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括:初始文本集A={A1,……,Ai,……,An},Ai是指第i个事件对应的初始文本列表,i=1……n,n为事件数量,当所述计算机程序被处理器执行时,实现以下步骤,如图1所示:
S100、获取目标语句且对目标语句进行分词处理,获取目标语句对应的目标共现词列表D={D1,……,Dt,……,Dk},Dt是指目标语句中第t个目标共现词,t=1……k,k是指目标语句中目标共现词数量。
具体地,目标语句是指用户输入的语句。
具体地,在S100步骤中还通过如下步骤确定目标共现词:
S101、对目标语句进行分词处理,获取目标语句对应的目标词列表,本领域技术人员知晓采用现有技术中任一分词方法,在此不再赘述。
S103、从目标词列表中获取任意两个目标词,构建成目标共现词;可以理解为:目标共现词是指在目标语句中共同出现的目标词,即任一目标共现词包括第一目标词和第二目标词,其中,第一目标词和第二目标词是从目标词列表中获取任意两个目标词且第一目标词与第二目标词不一致;能够通过一组共同出现的词表征语句的含义,无需通过语句中所有词,查询出事件,简化确定事件的过程。
S200、根据Ai,获取Ai对应的关键共现词列表Hi={Hi1,……,Hiy,……,
Figure 834770DEST_PATH_IMAGE006
},Hiy是 指Ai对应的第y个关键共现词,y=1……qi,qi是指Ai中关键共现词数量。
具体地,在S200步骤之前还通过如下步骤Hi
S1、从数据库中,获取Ai={Ai1,……,Aij,……,
Figure 57941DEST_PATH_IMAGE008
},Aij是指第i个事件对应的第j 初始文本,j=1……mi,mi是指第i个事件对应的初始文本数量。
S2、根据Ai,获取Ai对应的初始共现词集合Bi={Bi1,……,Bij,……,
Figure 122849DEST_PATH_IMAGE010
},Bij= {B1 ij,……,Br ij,……,BSj ij},Br ij是指Aij中第r个初始共现词,r=1……Sj,Sj是指Aij中初始 共现词数量。
具体地,在S2步骤中还通过如下步骤获取初始共现词:
S21、将Ai进行语句处理,获取Ai对应的语句列表Yi={Yi1,……,Yig,……,
Figure 226328DEST_PATH_IMAGE012
},Yig 是指Ai对应的第g个语句,g=1……zi,zi是指Ai对应的语句数量,本领域技术人员可以采取 任一语句处理对文本划分成若干语句,在此不再赘述;
S22、对Yig进行分词处理,获取Yig对应的初始词列表;
S23、从Yig对应的初始词列表中获取任意两个初始词,构建成初始共现词。
S3、根据所有的Bij中每一Br ij,获取Ai对应的中间共现词列表Gi={Gi1,……,Gix,……,Gip},Gix是指Ai中第x个中间共现词,x=1……p,p为Ai内中间共现词的数量,可以理解为:所有的Bij中每一Br ij进行去重处理得到的,本领域技术人员可以采取任一去重方法,在此不再赘述。
S4、根据Bi,获取Ai对应的中间共现词数量列表Ci={Ci1,……,Cix,……,Cip},Cix是指在Bi中Gix的重复次数。
S5、遍历Ci且当Cix≤预设的重复次数阈值时,从中间共现词列表中删除Cix对应的中间共现词,生成Hi,本领域技术人员根据实际需求设置重复次数阈值,优选地,重复次数阈值的取值为3。
S300、根据D和Hi,获取目标语句对应的相似度列表F={F1,……Fi,……,Fn},Fi是指目标语句与Ai对应的事件之间的相似度,Fi符合如下条件:
Figure DEST_PATH_IMAGE014A
,其中,Ft iy是指Dt与Hiy之间的相似度,Wiy是指Hiy对应的权重值。
具体地,在S300步骤中,Ft iy符合如下条件:
Figure 859434DEST_PATH_IMAGE016
,其中,MKt γ是指Dt对应的词向量中第γ位bit值,NKiy γ是指 Hiy对应的词向量中第γ位bit值,γ=1……φ,φ是指词向量中向量维度。
进一步地,在S300步骤中还通过如下步骤获取Wiy
S301、根据Ci,获取Hi对应的关键共现词数量列表C'i={C'i1,……,C'iy,……,
Figure 304322DEST_PATH_IMAGE018
},C'iy是指在Ci中Hiy的重复次数;
S302、根据C'i,获取Wiy,其中,Wiy符合如下条件:
Figure 891030DEST_PATH_IMAGE020
,可知,通过重复次数确定出权重值,使得对相似度的确定更加准确,有 利于确定用户输入的语句与事件之间的关系,准确的确定出用户需要查询的事件,使得用 户根据需求查询一系列事件,提高用户体验感。
优选地,在S300步骤中还通过如下步骤获取MKt γ
S311、获取Dt={Dt1,Dt2},其中,Dt1是指第t个目标共现词中第一个目标词,Dt2是指第t个目标共现词中第二个目标词;
S312、将Dt1和Dt2分别输入至预训练语言模型中,得到Dt1对应的词向量Qt1=(Q1 t1,……,Qγ t1,……,Qφ t1),Qγ t1是指第t个目标共现词中第一个目标词对应的第γ位bit值,以及Dt2对应的词向量Qt2=(Q1 t2,……,Qγ t2,……,Qφ t2),Qγ t2是指第t个目标共现词中第二个目标词对应的第γ位bit值;
S313、根据Qγ t1和Qγ t2,获取MKt γ,其中,MKt γ符合如下条件:
MKt γ=Qγ t1+Qγ t2
优选地,在S300步骤中还通过如下步骤获取NKiy γ
S321、获取Hiy={H1 iy,H2 iy},其中,H1 iy是指第y个关键共现词中第一个关键词,H2 iy是指第y个关键共现词中第二个关键词;
S322、将H1 iy和H2 iy分别输入至预训练语言模型中,得到H1 iy对应的词向量P1 iy=(P11 iy,……,P iy,……,P iy),P iy是指第y个关键共现词中第一个关键词对应的第γ位bit值,以及Dt2对应的词向量P2 iy=(P21 iy,……,P iy,……,P iy),P iy是指第y个关键共现词中第二个关键词对应的第γ位bit值;
S323、根据P iy和P iy,获取NKt γ,其中,NKt γ符合如下条件:
NKiy γ=P iy+P iy
上述,无论目标共现词还是关键共现词均通过共现词中不同的两个词对应的向量之和作为共现词的向量,避免因共现词中词的位置关系,导致目标共现词和关键共现词之间的相似度存在差异,提高了目标共现词和关键共现词之间相似的确定性,进而有利于用户输入的语句与事件之间的关系,使得用户根据需求查询一系列事件,提高用户体验感。
S400、当Fi>预设的相似度阈值时,将Fi对应的事件作为目标事件,本领域技术人员根据实际需求设置相似度阈值,在此不再赘述。
S500、根据目标事件对应的初始文本列表,获取目标事件对应的事件特征集。
具体地,在S500步骤中还包括如下步骤:
S501、根据预设的事件特征列表TZ={TZ1,……,TZα,……,TZβ},TZα是指第α个事件特征,α=1……β,β为事件特征数量。
优选地,当β=5时,事件特征为:时间、地点、人物、来源、内容。
S502、根据TZ,获取目标事件对应的任一初始文本的特征列表,可以理解为初始文本的特征列表中事件特征与TZ一致。
S503、按照目标事件对应的初始文本列表中每一初始文本对应的相似度的由大至小顺序,对每一初始文本中第α个事件特征的特征值进行排序;
S504、将排序后的目标事件对应的所有初始文本的特征列表作为目标事件对应的事件特征集;可知,通过目标共现词与关键共现词之间的相似度,对目标事件的特征进行排序,有利于用户能够快速的查询到与输入语句相似度最高的文本,使得用户可以快速知晓事件的相关内容,提高用户的体验感。
本实施例提供了一种获取目标事件的数据处理系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括:初始文本集,当所述计算机程序被处理器执行时,实现以下步骤:获取目标语句且对目标语句进行分词处理,获取目标语句对应的目标共现词列表,根据初始文本集中初始文本列表,获取初始文本列表对应的关键共现词列表,根据目标共现词列表和关键共现词列表,获取目标语句对应的相似度列表,当相似度列表中任一相似度预设的相似度阈值时,将相似度对应的事件作为目标事件,根据目标事件对应的初始文本列表,获取目标事件对应的特征列表;能够通过用户输入的共现词与事件的共现词之间的相似度,确定出用户是否需要查询该事件,有利于用户根据需求查询一系列事件,提高用户体验感。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (4)

1.一种获取目标事件的数据处理系统,其特征在于,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括:初始文本集A={A1,……,Ai,……,An},Ai是指第i个事件对应的初始文本列表,i=1……n,n为事件数量,当所述计算机程序被处理器执行时,实现以下步骤:
S100、获取目标语句且对目标语句进行分词处理,获取目标语句对应的目标共现词列表D={D1,……,Dt,……,Dk},Dt是指目标语句中第t个目标共现词,t=1……k,k是指目标语句中目标共现词数量,其中,目标共现词是指在目标语句中共同出现的目标词,任一目标共现词包括第一目标词和第二目标词,其中,第一目标词和第二目标词是从目标词列表中获取任意两个目标词且第一目标词与第二目标词不一致;
S200、根据Ai,获取Ai对应的关键共现词列表Hi={Hi1,……,Hiy,……,
Figure DEST_PATH_IMAGE002
},Hiy是指Ai对应的第y个关键共现词,y=1……qi,qi是指Ai中关键共现词数量;
S300、根据D和Hi,获取目标语句对应的相似度列表F={F1,……Fi,……,Fn},Fi是指目标语句与Ai对应的事件之间的相似度,Fi符合如下条件:
Figure DEST_PATH_IMAGE004
,其中,Ft iy是指Dt与Hiy之间的相似度,Wiy是指Hiy对应的权重值,在S300步骤中,Ft iy符合如下条件:
Figure DEST_PATH_IMAGE006
,其中,MKt γ是指Dt对应的词向量中第γ位bit值,NKiy γ是指Hiy对应的词向量中第γ位bit值,γ=1……φ,φ是指词向量中向量维度;
其中,在S300步骤中还通过如下步骤获取MKt γ
S311、获取Dt={Dt1,Dt2},其中,Dt1是指第t个目标共现词中第一个目标词,Dt2是指第t个目标共现词中第二个目标词;
S312、将Dt1和Dt2分别输入至预训练语言模型中,得到Dt1对应的词向量Qt1=(Q1 t1,……,Qγ t1,……,Qφ t1),Qγ t1是指第t个目标共现词中第一个目标词对应的第γ位bit值,以及Dt2对应的词向量Qt2=(Q1 t2,……,Qγ t2,……,Qφ t2),Qγ t2是指第t个目标共现词中第二个目标词对应的第γ位bit值;
S313、根据Qγ t1和Qγ t2,获取MKt γ,其中,MKt γ符合如下条件:
MKt γ=Qγ t1+Qγ t2
其中,在S300步骤中还通过如下步骤获取NKiy γ
S321、获取Hiy={H1 iy,H2 iy},其中,H1 iy是指第y个关键共现词中第一个关键词,H2 iy是指第y个关键共现词中第二个关键词;
S322、将H1 iy和H2 iy分别输入至预训练语言模型中,得到H1 iy对应的词向量P1 iy=(P11 iy,……,P iy,……,P iy),P iy是指第y个关键共现词中第一个关键词对应的第γ位bit值,以及Dt2对应的词向量P2 iy=(P21 iy,……,P iy,……,P iy),P iy是指第y个关键共现词中第二个关键词对应的第γ位bit值;
S323、根据P iy和P iy,获取NKt γ,其中,NKt γ符合如下条件:
NKiy γ=P iy+P iy
S400、当Fi>预设的相似度阈值时,将Fi对应的事件作为目标事件;
S500、根据目标事件对应的初始文本列表,获取目标事件对应的事件特征集。
2.根据权利要求1所述的获取目标事件的数据处理系统,其特征在于,在S100步骤中还通过如下步骤确定目标共现词:
S101、对目标语句进行分词处理,获取目标语句对应的目标词列表;
S103、从目标词列表中获取任意两个目标词,构建成目标共现词。
3.根据权利要求1所述的获取目标事件的数据处理系统,其特征在于,在S200步骤之前还通过如下步骤获取Hi
S1、从数据库中,获取Ai={Ai1,……,Aij,……,
Figure DEST_PATH_IMAGE008
},Aij是指第i个事件对应的第j初始文本,j=1……mi,mi是指第i个事件对应的初始文本数量;
S2、根据Ai,获取Ai对应的初始共现词集合Bi={Bi1,……,Bij,……,
Figure DEST_PATH_IMAGE010
},Bij={B1 ij,……,Br ij,……,BSj ij},Br ij是指Aij中第r个初始共现词,r=1……Sj,Sj是指Aij中初始共现词数量;
S3、根据所有的Bij中每一Br ij,获取Ai对应的中间共现词列表Gi={Gi1,……,Gix,……,Gip},Gix是指Ai中第x个中间共现词,x=1……p,p为Ai内中间共现词的数量;
S4、根据Bi,获取Ai对应的中间共现词数量列表Ci={Ci1,……,Cix,……,Cip},Cix是指在Bi中Gix的重复次数;
S5、遍历Ci且当Cix≤预设的重复次数阈值时,从中间共现词列表中删除Cix对应的中间共现词,生成Hi
4.根据权利要求3所述的获取目标事件的数据处理系统,其特征在于,在S300步骤中还通过如下步骤获取Wiy
S301、根据Ci,获取Hi对应的关键共现词数量列表C'i={C'i1,……,C'iy,……,
Figure DEST_PATH_IMAGE012
},C'iy是指在Ci中Hiy的重复次数;
S302、根据C'i,获取Wiy,其中,Wiy符合如下条件:
Figure DEST_PATH_IMAGE014
CN202210856529.8A 2022-07-21 2022-07-21 一种获取目标事件的数据处理系统 Active CN114925692B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210856529.8A CN114925692B (zh) 2022-07-21 2022-07-21 一种获取目标事件的数据处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210856529.8A CN114925692B (zh) 2022-07-21 2022-07-21 一种获取目标事件的数据处理系统

Publications (2)

Publication Number Publication Date
CN114925692A CN114925692A (zh) 2022-08-19
CN114925692B true CN114925692B (zh) 2022-10-11

Family

ID=82816152

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210856529.8A Active CN114925692B (zh) 2022-07-21 2022-07-21 一种获取目标事件的数据处理系统

Country Status (1)

Country Link
CN (1) CN114925692B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115509723B (zh) * 2022-11-01 2023-10-20 中科雨辰科技有限公司 一种获取非目标任务对象的数据处理系统
CN115563287B (zh) * 2022-12-02 2023-03-17 中科雨辰科技有限公司 一种获取关联对象的数据处理系统
CN115544215B (zh) * 2022-12-02 2023-03-31 中科雨辰科技有限公司 一种关联对象的获取方法、介质及设备
CN115964190B (zh) * 2022-12-07 2023-07-14 中科雨辰科技有限公司 一种更新历史事件信息的数据处理系统
CN115797883B (zh) * 2023-02-06 2023-04-28 以萨技术股份有限公司 一种确定异常事件的数据处理系统
CN116304117B (zh) * 2023-05-15 2023-09-08 北京睿企信息科技有限公司 一种获取文本信息的数据处理方法、系统和存储介质
CN116756151B (zh) * 2023-08-17 2023-11-24 公安部信息通信中心 一种知识搜索与数据处理系统
CN117371435B (zh) * 2023-10-09 2024-04-05 北京睿企信息科技有限公司 一种获取热度发生波动的热词的数据处理系统
CN117435697B (zh) * 2023-12-21 2024-03-22 中科雨辰科技有限公司 一种获取核心事件的数据处理系统
CN118113792B (zh) * 2024-04-23 2024-09-13 生命奇点(北京)科技有限公司 一种获取实体和实体关系的系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006139484A (ja) * 2004-11-11 2006-06-01 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法及びそのシステム並びにコンピュータプログラム
CN106610931A (zh) * 2015-10-23 2017-05-03 北京国双科技有限公司 话题名称的提取方法及装置
CN109740075A (zh) * 2018-12-13 2019-05-10 北京百度网讯科技有限公司 事件相关度计算方法、装置、设备及存储介质
CN110032675A (zh) * 2019-03-13 2019-07-19 平安城市建设科技(深圳)有限公司 基于共现词的检索方法、装置、设备及可读存储介质
CN112883165A (zh) * 2021-03-16 2021-06-01 山东亿云信息技术有限公司 一种基于语义理解的智能全文检索方法及系统
CN114579675A (zh) * 2022-05-05 2022-06-03 中科雨辰科技有限公司 一种确定共指事件的数据处理系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112287656B (zh) * 2020-10-12 2024-05-28 四川语言桥信息技术有限公司 文本比对方法、装置、设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006139484A (ja) * 2004-11-11 2006-06-01 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法及びそのシステム並びにコンピュータプログラム
CN106610931A (zh) * 2015-10-23 2017-05-03 北京国双科技有限公司 话题名称的提取方法及装置
CN109740075A (zh) * 2018-12-13 2019-05-10 北京百度网讯科技有限公司 事件相关度计算方法、装置、设备及存储介质
CN110032675A (zh) * 2019-03-13 2019-07-19 平安城市建设科技(深圳)有限公司 基于共现词的检索方法、装置、设备及可读存储介质
CN112883165A (zh) * 2021-03-16 2021-06-01 山东亿云信息技术有限公司 一种基于语义理解的智能全文检索方法及系统
CN114579675A (zh) * 2022-05-05 2022-06-03 中科雨辰科技有限公司 一种确定共指事件的数据处理系统

Also Published As

Publication number Publication date
CN114925692A (zh) 2022-08-19

Similar Documents

Publication Publication Date Title
CN114925692B (zh) 一种获取目标事件的数据处理系统
CN108804641B (zh) 一种文本相似度的计算方法、装置、设备和存储介质
CN111444320B (zh) 文本检索方法、装置、计算机设备和存储介质
CN107704563B (zh) 一种问句推荐方法及系统
CN110717034A (zh) 一种本体构建方法及装置
CN109376222B (zh) 问答匹配度计算方法、问答自动匹配方法及装置
CN108829822A (zh) 媒体内容的推荐方法和装置、存储介质、电子装置
JP2006172452A (ja) データ整理のための方法及びシステム
JP2010092490A (ja) データ整理のための方法及びシステム
JP2005251211A (ja) 文書の一般テキストサマリを作成する方法およびシステム
CN110321437B (zh) 一种语料数据处理方法、装置、电子设备及介质
CN114579675B (zh) 一种确定共指事件的数据处理系统
CN110941721A (zh) 基于变分自编码主题模型的短文本主题挖掘方法及系统
CN111476038A (zh) 长文本生成方法、装置、计算机设备和存储介质
CN112182145A (zh) 文本相似度确定方法、装置、设备和存储介质
CN117711600B (zh) 一种基于llm模型的电子病历问答系统
CN117454843B (zh) 一种基于电子病历问答模型的数据预处理系统
CN111241310A (zh) 一种深度跨模态哈希检索方法、设备及介质
CN117556034A (zh) 一种对电子病历问答模型输出结果标准化的数据处理系统
CN114021573B (zh) 一种自然语言处理方法、装置、设备及可读存储介质
Vekariya et al. A novel approach for semantic similarity measurement for high quality answer selection in question answering using deep learning methods
CN117520126B (zh) 一种电子病历问答模型的评分系统
Prasanth et al. Effective big data retrieval using deep learning modified neural networks
CN117435685A (zh) 文档检索方法、装置、计算机设备、存储介质和产品
JPH0454564A (ja) 重み学習型テキストベース検索装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant