CN114925692B - 一种获取目标事件的数据处理系统 - Google Patents
一种获取目标事件的数据处理系统 Download PDFInfo
- Publication number
- CN114925692B CN114925692B CN202210856529.8A CN202210856529A CN114925692B CN 114925692 B CN114925692 B CN 114925692B CN 202210856529 A CN202210856529 A CN 202210856529A CN 114925692 B CN114925692 B CN 114925692B
- Authority
- CN
- China
- Prior art keywords
- target
- word
- occurrence
- list
- event
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及一种获取目标事件的数据处理系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括:初始文本集,当所述计算机程序被处理器执行时,实现以下步骤:获取目标语句且对目标语句进行分词处理,获取目标语句对应的目标共现词列表,根据初始文本集中初始文本列表,获取初始文本列表对应的关键共现词列表,根据目标共现词列表和关键共现词列表,获取目标语句对应的相似度列表且当相似度列表中任一相似度预设的相似度阈值时,将相似度对应的事件作为目标事件;能够通过用户输入的共现词与事件的共现词之间的相似度,确定出用户是否需要查询该事件,有利于用户根据需求查询一系列事件,提高用户体验感。
Description
技术领域
本发明涉及获取事件技术领域,尤其涉及一种获取目标事件的数据处理系统。
背景技术
随着互联网的不断普及,人类社会进入信息爆炸时代,在这个信息爆炸时代,每一天用户可通过各种媒介平台接收各类数据信息,例如用户通过各种媒介平台获取各种话题对应的至少一个事件,其中一个话题可经历出现、发展、高潮、平淡到最后结束的历程,在这些历程中出现至少一个事件,且不同历程中的事件存在一些关系。
现有技术中存在问题:只是查询出历史上的一系列事件,但无法基于用户的需求,将事件都呈现出来,以便于用户进行查询。
发明内容
针对上述技术问题,本发明采用的技术方案为一种获取目标事件的数据处理系统,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括:初始文本集A={A1,……,Ai,……,An},Ai是指第i个事件对应的初始文本列表,i=1……n,n为事件数量,当所述计算机程序被处理器执行时,实现以下步骤:
S100、获取目标语句且对目标语句进行分词处理,获取目标语句对应的目标共现词列表D={D1,……,Dt,……,Dk},Dt是指目标语句中第t个目标共现词,t=1……k,k是指目标语句中目标共现词数量;
S300、根据D和Hi,获取目标语句对应的相似度列表F={F1,……Fi,……,Fn},Fi是指目标语句与Ai对应的事件之间的相似度,Fi符合如下条件:
S400、当Fi>预设的相似度阈值时,将Fi对应的事件作为目标事件;
S500、根据目标事件对应的初始文本列表,获取目标事件对应的事件特征集。
本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明提供的一种识获取目标事件的数据处理系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:
本发明的一种获取目标事件的数据处理系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括:初始文本集,当所述计算机程序被处理器执行时,实现以下步骤:获取目标语句且对目标语句进行分词处理,获取目标语句对应的目标共现词列表,根据初始文本集中初始文本列表,获取初始文本列表对应的关键共现词列表,
根据目标共现词列表和关键共现词列表,获取目标语句对应的相似度列表,当相似度列表中任一相似度预设的相似度阈值时,将相似度对应的事件作为目标事件,根据目标事件对应的初始文本列表,获取目标事件对应的特征列表;能够通过用户输入的共现词与事件的共现词之间的相似度,确定出用户是否需要查询该事件,有利于用户根据需求查询一系列事件,提高用户体验感。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
图1为本发明实施例提供的一种获取目标事件的数据处理系统的执行计算机程序的流程图。
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种获取目标位置的数据处理系统的具体实施方式及其功效,详细说明如后。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
本实施例一提供了一种获取目标事件的数据处理系统,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括:初始文本集A={A1,……,Ai,……,An},Ai是指第i个事件对应的初始文本列表,i=1……n,n为事件数量,当所述计算机程序被处理器执行时,实现以下步骤,如图1所示:
S100、获取目标语句且对目标语句进行分词处理,获取目标语句对应的目标共现词列表D={D1,……,Dt,……,Dk},Dt是指目标语句中第t个目标共现词,t=1……k,k是指目标语句中目标共现词数量。
具体地,目标语句是指用户输入的语句。
具体地,在S100步骤中还通过如下步骤确定目标共现词:
S101、对目标语句进行分词处理,获取目标语句对应的目标词列表,本领域技术人员知晓采用现有技术中任一分词方法,在此不再赘述。
S103、从目标词列表中获取任意两个目标词,构建成目标共现词;可以理解为:目标共现词是指在目标语句中共同出现的目标词,即任一目标共现词包括第一目标词和第二目标词,其中,第一目标词和第二目标词是从目标词列表中获取任意两个目标词且第一目标词与第二目标词不一致;能够通过一组共同出现的词表征语句的含义,无需通过语句中所有词,查询出事件,简化确定事件的过程。
具体地,在S200步骤之前还通过如下步骤Hi:
S2、根据Ai,获取Ai对应的初始共现词集合Bi={Bi1,……,Bij,……,},Bij=
{B1 ij,……,Br ij,……,BSj ij},Br ij是指Aij中第r个初始共现词,r=1……Sj,Sj是指Aij中初始
共现词数量。
具体地,在S2步骤中还通过如下步骤获取初始共现词:
S21、将Ai进行语句处理,获取Ai对应的语句列表Yi={Yi1,……,Yig,……,},Yig
是指Ai对应的第g个语句,g=1……zi,zi是指Ai对应的语句数量,本领域技术人员可以采取
任一语句处理对文本划分成若干语句,在此不再赘述;
S22、对Yig进行分词处理,获取Yig对应的初始词列表;
S23、从Yig对应的初始词列表中获取任意两个初始词,构建成初始共现词。
S3、根据所有的Bij中每一Br ij,获取Ai对应的中间共现词列表Gi={Gi1,……,Gix,……,Gip},Gix是指Ai中第x个中间共现词,x=1……p,p为Ai内中间共现词的数量,可以理解为:所有的Bij中每一Br ij进行去重处理得到的,本领域技术人员可以采取任一去重方法,在此不再赘述。
S4、根据Bi,获取Ai对应的中间共现词数量列表Ci={Ci1,……,Cix,……,Cip},Cix是指在Bi中Gix的重复次数。
S5、遍历Ci且当Cix≤预设的重复次数阈值时,从中间共现词列表中删除Cix对应的中间共现词,生成Hi,本领域技术人员根据实际需求设置重复次数阈值,优选地,重复次数阈值的取值为3。
S300、根据D和Hi,获取目标语句对应的相似度列表F={F1,……Fi,……,Fn},Fi是指目标语句与Ai对应的事件之间的相似度,Fi符合如下条件:
具体地,在S300步骤中,Ft iy符合如下条件:
进一步地,在S300步骤中还通过如下步骤获取Wiy,
S302、根据C'i,获取Wiy,其中,Wiy符合如下条件:
优选地,在S300步骤中还通过如下步骤获取MKt γ:
S311、获取Dt={Dt1,Dt2},其中,Dt1是指第t个目标共现词中第一个目标词,Dt2是指第t个目标共现词中第二个目标词;
S312、将Dt1和Dt2分别输入至预训练语言模型中,得到Dt1对应的词向量Qt1=(Q1 t1,……,Qγ t1,……,Qφ t1),Qγ t1是指第t个目标共现词中第一个目标词对应的第γ位bit值,以及Dt2对应的词向量Qt2=(Q1 t2,……,Qγ t2,……,Qφ t2),Qγ t2是指第t个目标共现词中第二个目标词对应的第γ位bit值;
S313、根据Qγ t1和Qγ t2,获取MKt γ,其中,MKt γ符合如下条件:
MKt γ=Qγ t1+Qγ t2。
优选地,在S300步骤中还通过如下步骤获取NKiy γ:
S321、获取Hiy={H1 iy,H2 iy},其中,H1 iy是指第y个关键共现词中第一个关键词,H2 iy是指第y个关键共现词中第二个关键词;
S322、将H1 iy和H2 iy分别输入至预训练语言模型中,得到H1 iy对应的词向量P1 iy=(P11 iy,……,P1γ iy,……,P1φ iy),P1γ iy是指第y个关键共现词中第一个关键词对应的第γ位bit值,以及Dt2对应的词向量P2 iy=(P21 iy,……,P2γ iy,……,P2φ iy),P2γ iy是指第y个关键共现词中第二个关键词对应的第γ位bit值;
S323、根据P1γ iy和P2γ iy,获取NKt γ,其中,NKt γ符合如下条件:
NKiy γ=P1γ iy+P2γ iy。
上述,无论目标共现词还是关键共现词均通过共现词中不同的两个词对应的向量之和作为共现词的向量,避免因共现词中词的位置关系,导致目标共现词和关键共现词之间的相似度存在差异,提高了目标共现词和关键共现词之间相似的确定性,进而有利于用户输入的语句与事件之间的关系,使得用户根据需求查询一系列事件,提高用户体验感。
S400、当Fi>预设的相似度阈值时,将Fi对应的事件作为目标事件,本领域技术人员根据实际需求设置相似度阈值,在此不再赘述。
S500、根据目标事件对应的初始文本列表,获取目标事件对应的事件特征集。
具体地,在S500步骤中还包括如下步骤:
S501、根据预设的事件特征列表TZ={TZ1,……,TZα,……,TZβ},TZα是指第α个事件特征,α=1……β,β为事件特征数量。
优选地,当β=5时,事件特征为:时间、地点、人物、来源、内容。
S502、根据TZ,获取目标事件对应的任一初始文本的特征列表,可以理解为初始文本的特征列表中事件特征与TZ一致。
S503、按照目标事件对应的初始文本列表中每一初始文本对应的相似度的由大至小顺序,对每一初始文本中第α个事件特征的特征值进行排序;
S504、将排序后的目标事件对应的所有初始文本的特征列表作为目标事件对应的事件特征集;可知,通过目标共现词与关键共现词之间的相似度,对目标事件的特征进行排序,有利于用户能够快速的查询到与输入语句相似度最高的文本,使得用户可以快速知晓事件的相关内容,提高用户的体验感。
本实施例提供了一种获取目标事件的数据处理系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括:初始文本集,当所述计算机程序被处理器执行时,实现以下步骤:获取目标语句且对目标语句进行分词处理,获取目标语句对应的目标共现词列表,根据初始文本集中初始文本列表,获取初始文本列表对应的关键共现词列表,根据目标共现词列表和关键共现词列表,获取目标语句对应的相似度列表,当相似度列表中任一相似度预设的相似度阈值时,将相似度对应的事件作为目标事件,根据目标事件对应的初始文本列表,获取目标事件对应的特征列表;能够通过用户输入的共现词与事件的共现词之间的相似度,确定出用户是否需要查询该事件,有利于用户根据需求查询一系列事件,提高用户体验感。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (4)
1.一种获取目标事件的数据处理系统,其特征在于,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括:初始文本集A={A1,……,Ai,……,An},Ai是指第i个事件对应的初始文本列表,i=1……n,n为事件数量,当所述计算机程序被处理器执行时,实现以下步骤:
S100、获取目标语句且对目标语句进行分词处理,获取目标语句对应的目标共现词列表D={D1,……,Dt,……,Dk},Dt是指目标语句中第t个目标共现词,t=1……k,k是指目标语句中目标共现词数量,其中,目标共现词是指在目标语句中共同出现的目标词,任一目标共现词包括第一目标词和第二目标词,其中,第一目标词和第二目标词是从目标词列表中获取任意两个目标词且第一目标词与第二目标词不一致;
S300、根据D和Hi,获取目标语句对应的相似度列表F={F1,……Fi,……,Fn},Fi是指目标语句与Ai对应的事件之间的相似度,Fi符合如下条件:
其中,在S300步骤中还通过如下步骤获取MKt γ:
S311、获取Dt={Dt1,Dt2},其中,Dt1是指第t个目标共现词中第一个目标词,Dt2是指第t个目标共现词中第二个目标词;
S312、将Dt1和Dt2分别输入至预训练语言模型中,得到Dt1对应的词向量Qt1=(Q1 t1,……,Qγ t1,……,Qφ t1),Qγ t1是指第t个目标共现词中第一个目标词对应的第γ位bit值,以及Dt2对应的词向量Qt2=(Q1 t2,……,Qγ t2,……,Qφ t2),Qγ t2是指第t个目标共现词中第二个目标词对应的第γ位bit值;
S313、根据Qγ t1和Qγ t2,获取MKt γ,其中,MKt γ符合如下条件:
MKt γ=Qγ t1+Qγ t2;
其中,在S300步骤中还通过如下步骤获取NKiy γ:
S321、获取Hiy={H1 iy,H2 iy},其中,H1 iy是指第y个关键共现词中第一个关键词,H2 iy是指第y个关键共现词中第二个关键词;
S322、将H1 iy和H2 iy分别输入至预训练语言模型中,得到H1 iy对应的词向量P1 iy=(P11 iy,……,P1γ iy,……,P1φ iy),P1γ iy是指第y个关键共现词中第一个关键词对应的第γ位bit值,以及Dt2对应的词向量P2 iy=(P21 iy,……,P2γ iy,……,P2φ iy),P2γ iy是指第y个关键共现词中第二个关键词对应的第γ位bit值;
S323、根据P1γ iy和P2γ iy,获取NKt γ,其中,NKt γ符合如下条件:
NKiy γ=P1γ iy+P2γ iy;
S400、当Fi>预设的相似度阈值时,将Fi对应的事件作为目标事件;
S500、根据目标事件对应的初始文本列表,获取目标事件对应的事件特征集。
2.根据权利要求1所述的获取目标事件的数据处理系统,其特征在于,在S100步骤中还通过如下步骤确定目标共现词:
S101、对目标语句进行分词处理,获取目标语句对应的目标词列表;
S103、从目标词列表中获取任意两个目标词,构建成目标共现词。
3.根据权利要求1所述的获取目标事件的数据处理系统,其特征在于,在S200步骤之前还通过如下步骤获取Hi:
S2、根据Ai,获取Ai对应的初始共现词集合Bi={Bi1,……,Bij,……,},Bij={B1 ij,……,Br ij,……,BSj ij},Br ij是指Aij中第r个初始共现词,r=1……Sj,Sj是指Aij中初始共现词数量;
S3、根据所有的Bij中每一Br ij,获取Ai对应的中间共现词列表Gi={Gi1,……,Gix,……,Gip},Gix是指Ai中第x个中间共现词,x=1……p,p为Ai内中间共现词的数量;
S4、根据Bi,获取Ai对应的中间共现词数量列表Ci={Ci1,……,Cix,……,Cip},Cix是指在Bi中Gix的重复次数;
S5、遍历Ci且当Cix≤预设的重复次数阈值时,从中间共现词列表中删除Cix对应的中间共现词,生成Hi。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210856529.8A CN114925692B (zh) | 2022-07-21 | 2022-07-21 | 一种获取目标事件的数据处理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210856529.8A CN114925692B (zh) | 2022-07-21 | 2022-07-21 | 一种获取目标事件的数据处理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114925692A CN114925692A (zh) | 2022-08-19 |
CN114925692B true CN114925692B (zh) | 2022-10-11 |
Family
ID=82816152
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210856529.8A Active CN114925692B (zh) | 2022-07-21 | 2022-07-21 | 一种获取目标事件的数据处理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114925692B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115509723B (zh) * | 2022-11-01 | 2023-10-20 | 中科雨辰科技有限公司 | 一种获取非目标任务对象的数据处理系统 |
CN115563287B (zh) * | 2022-12-02 | 2023-03-17 | 中科雨辰科技有限公司 | 一种获取关联对象的数据处理系统 |
CN115544215B (zh) * | 2022-12-02 | 2023-03-31 | 中科雨辰科技有限公司 | 一种关联对象的获取方法、介质及设备 |
CN115964190B (zh) * | 2022-12-07 | 2023-07-14 | 中科雨辰科技有限公司 | 一种更新历史事件信息的数据处理系统 |
CN115797883B (zh) * | 2023-02-06 | 2023-04-28 | 以萨技术股份有限公司 | 一种确定异常事件的数据处理系统 |
CN116304117B (zh) * | 2023-05-15 | 2023-09-08 | 北京睿企信息科技有限公司 | 一种获取文本信息的数据处理方法、系统和存储介质 |
CN116756151B (zh) * | 2023-08-17 | 2023-11-24 | 公安部信息通信中心 | 一种知识搜索与数据处理系统 |
CN117371435B (zh) * | 2023-10-09 | 2024-04-05 | 北京睿企信息科技有限公司 | 一种获取热度发生波动的热词的数据处理系统 |
CN117435697B (zh) * | 2023-12-21 | 2024-03-22 | 中科雨辰科技有限公司 | 一种获取核心事件的数据处理系统 |
CN118113792B (zh) * | 2024-04-23 | 2024-09-13 | 生命奇点(北京)科技有限公司 | 一种获取实体和实体关系的系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006139484A (ja) * | 2004-11-11 | 2006-06-01 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索方法及びそのシステム並びにコンピュータプログラム |
CN106610931A (zh) * | 2015-10-23 | 2017-05-03 | 北京国双科技有限公司 | 话题名称的提取方法及装置 |
CN109740075A (zh) * | 2018-12-13 | 2019-05-10 | 北京百度网讯科技有限公司 | 事件相关度计算方法、装置、设备及存储介质 |
CN110032675A (zh) * | 2019-03-13 | 2019-07-19 | 平安城市建设科技(深圳)有限公司 | 基于共现词的检索方法、装置、设备及可读存储介质 |
CN112883165A (zh) * | 2021-03-16 | 2021-06-01 | 山东亿云信息技术有限公司 | 一种基于语义理解的智能全文检索方法及系统 |
CN114579675A (zh) * | 2022-05-05 | 2022-06-03 | 中科雨辰科技有限公司 | 一种确定共指事件的数据处理系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112287656B (zh) * | 2020-10-12 | 2024-05-28 | 四川语言桥信息技术有限公司 | 文本比对方法、装置、设备和存储介质 |
-
2022
- 2022-07-21 CN CN202210856529.8A patent/CN114925692B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006139484A (ja) * | 2004-11-11 | 2006-06-01 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索方法及びそのシステム並びにコンピュータプログラム |
CN106610931A (zh) * | 2015-10-23 | 2017-05-03 | 北京国双科技有限公司 | 话题名称的提取方法及装置 |
CN109740075A (zh) * | 2018-12-13 | 2019-05-10 | 北京百度网讯科技有限公司 | 事件相关度计算方法、装置、设备及存储介质 |
CN110032675A (zh) * | 2019-03-13 | 2019-07-19 | 平安城市建设科技(深圳)有限公司 | 基于共现词的检索方法、装置、设备及可读存储介质 |
CN112883165A (zh) * | 2021-03-16 | 2021-06-01 | 山东亿云信息技术有限公司 | 一种基于语义理解的智能全文检索方法及系统 |
CN114579675A (zh) * | 2022-05-05 | 2022-06-03 | 中科雨辰科技有限公司 | 一种确定共指事件的数据处理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114925692A (zh) | 2022-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114925692B (zh) | 一种获取目标事件的数据处理系统 | |
CN108804641B (zh) | 一种文本相似度的计算方法、装置、设备和存储介质 | |
CN111444320B (zh) | 文本检索方法、装置、计算机设备和存储介质 | |
CN107704563B (zh) | 一种问句推荐方法及系统 | |
CN110717034A (zh) | 一种本体构建方法及装置 | |
CN109376222B (zh) | 问答匹配度计算方法、问答自动匹配方法及装置 | |
CN108829822A (zh) | 媒体内容的推荐方法和装置、存储介质、电子装置 | |
JP2006172452A (ja) | データ整理のための方法及びシステム | |
JP2010092490A (ja) | データ整理のための方法及びシステム | |
JP2005251211A (ja) | 文書の一般テキストサマリを作成する方法およびシステム | |
CN110321437B (zh) | 一种语料数据处理方法、装置、电子设备及介质 | |
CN114579675B (zh) | 一种确定共指事件的数据处理系统 | |
CN110941721A (zh) | 基于变分自编码主题模型的短文本主题挖掘方法及系统 | |
CN111476038A (zh) | 长文本生成方法、装置、计算机设备和存储介质 | |
CN112182145A (zh) | 文本相似度确定方法、装置、设备和存储介质 | |
CN117711600B (zh) | 一种基于llm模型的电子病历问答系统 | |
CN117454843B (zh) | 一种基于电子病历问答模型的数据预处理系统 | |
CN111241310A (zh) | 一种深度跨模态哈希检索方法、设备及介质 | |
CN117556034A (zh) | 一种对电子病历问答模型输出结果标准化的数据处理系统 | |
CN114021573B (zh) | 一种自然语言处理方法、装置、设备及可读存储介质 | |
Vekariya et al. | A novel approach for semantic similarity measurement for high quality answer selection in question answering using deep learning methods | |
CN117520126B (zh) | 一种电子病历问答模型的评分系统 | |
Prasanth et al. | Effective big data retrieval using deep learning modified neural networks | |
CN117435685A (zh) | 文档检索方法、装置、计算机设备、存储介质和产品 | |
JPH0454564A (ja) | 重み学習型テキストベース検索装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |