CN116150409B - 一种文本时间序列获取方法、电子设备及存储介质 - Google Patents
一种文本时间序列获取方法、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116150409B CN116150409B CN202310372627.9A CN202310372627A CN116150409B CN 116150409 B CN116150409 B CN 116150409B CN 202310372627 A CN202310372627 A CN 202310372627A CN 116150409 B CN116150409 B CN 116150409B
- Authority
- CN
- China
- Prior art keywords
- time
- information
- time information
- target
- information table
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/383—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
Abstract
本发明提供了一种文本时间序列获取方法、电子设备和存储介质,方法包括如下步骤:S100,获取目标文本中的时间描述信息表,时间描述信息表的第i行包括(TDi,Si,Pi,Ci),其中,TDi为目标文本中识别到的第i个时间描述语句中的时间描述,Si为目标文本中识别到的第i个时间描述语句对应的实体集,Si={Si1,Si2,…,Sij,…,Sif(i)},Sij为Si中的第j个实体,Pi为第i个时间描述语句在目标文本中的位置ID;S200,获取初始时间序列信息表TS;S300,基于所述时间描述信息表和TS获取目标时间序列信息表。本发明能够提高事件时间轴的获取效率。
Description
技术领域
本发明涉及文本处理领域,具体涉及一种文本时间序列获取方法、电子设备及存储介质。
背景技术
随着信息技术的广泛普及,人们习惯于从网络上发布的文本例如新闻文本中获取所需要的信息。在一些应用场景中,需要知晓某个文本所记载的事件的时间链,即事件的开始到结束所经历的时间序列。目前基本上依靠用户通过手动标注的形式获取,获取效率低。
发明内容
针对上述技术问题,本发明采用的技术方案为:
本发明实施例提供一种文本时间序列获取方法,所述方法包括如下步骤:
S100,获取目标文本中的时间描述信息表;所述时间描述信息表的第i行包括(TDi,Si,Pi,Ci),其中,TDi为目标文本中识别到的第i个时间描述语句中的时间描述,Si为目标文本中识别到的第i个时间描述语句对应的实体集,Si={Si1,Si2,…,Sij,…,Sif(i)},Sij为Si中的第j个实体,j的取值为1到f(i),f(i)为Si中的实体数量,Pi为第i个时间描述语句在目标文本中的位置ID,Ci为TDi对应的时态类型,i的取值为1到n,n为目标文本中的识别到的时间描述语句的数量。
S200,获取初始时间序列信息表TS={TS1,TS2,…,TSr,…,TSm},TSr为TS中的第r时间序列,初始值为Null,r的取值为1到m,m为TS中的时间序列的数量。
S300,基于所述时间描述信息表和TS获取目标时间序列信息表。
其中,S300具体包括:
S301,获取TD1对应的目标时间信息T1并将获取的T1加入到TS中的第一时间序列TS1中;设置h=2;所述目标时间信息T1为根据TD1得到的日期信息;
S302,如果h≤n,执行S303;否则,执行S307;
S303,如果TDh和TDh-1的时态类型相同,执行S304,否则,获取TDh对应的目标时间信息Th,并执行S305;
S304,如果(Ph-Ph-1)≤k,并且Sh∩So h-1≠Null,获取TDh对应的目标时间信息Th并将Th加入到Th-1对应的时间序列中,否则,获取Th并执行S305;其中,So h-1为TDh-1对应的时间序列中所包含的实体并集;k为预设值;
S305,将Th加入到Th-1对应的时间序列的下一个时间序列中;执行S306;
S306,设置h=h+1,执行S302;
S307,获取当前的TS作为目标时间序列信息表,并退出当前控制程序。
本发明实施例还提供一种非瞬时性计算机可读存储介质,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现前述方法。
本发明实施例还提供一种电子设备,包括处理器和前述的非瞬时性计算机可读存储介质。
本发明至少具有以下技术效果:
本发明实施例提供的文本时间序列获取方法,能够自动获取文本中涉及的实体的时间序列,从而能够提高事件时间轴的获取效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的文本时间序列获取方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种文本时间序列获取方法,如图1所示,所述方法可包括如下步骤:
S100,获取目标文本中的时间描述信息表;所述时间描述信息表的第i行包括(TDi,Si,Pi,Ci),其中,TDi为目标文本中识别到的第i个时间描述语句中的时间描述,Si为目标文本中识别到的第i个时间描述语句对应的实体集,Si={Si1,Si2,…,Sij,…,Sif(i)},Sij为Si中的第j个实体,j的取值为1到f(i),f(i)为Si中的实体数量,Pi为第i个时间描述语句在目标文本中的位置ID,Ci为TDi对应的时态类型,i的取值为1到n,n为目标文本中的识别到的时间描述语句的数量。
在本发明实施例中,目标文本可为官方媒体发布的文本,例如新闻文本。目标文本可为由任何语言类型的文本,优选,可为中文文本。
在本发明实施例中,时间描述可为与时间相关的表述,例如“6号”、“上周”、“本月5号”、“上个月”等表述。时间描述可通过经训练的时间描述提取模型获取得到。不同语言类型的文本可具有不同的时间描述提取模型。
在本发明实施例中,实体可为人物、机构等,例如,张三、XXX环保局等。实体可基于经训练的实体提取模型获取得到。
在本发明实施例中,时间描述语句在目标文本中的位置ID可为按照前后顺序在目标文本中的位置编号。
在本发明实施例中,时态类型可包括过去时和将来时,每个时间描述的时态类型可基于现有的时态提取模型获取得到。
进一步地,在本发明实施例中,Si中的实体为经过等同替换并且去重处理后的实体。例如,Si中的实体包含“CPU”和“中央处理器”,则认为这两个实体是同一个实体,保留其中的一个实体即可,例如,保留中央处理器。
S200,获取初始时间序列信息表TS={TS1,TS2,…,TSr,…,TSm},TSr为TS中的第r时间序列,初始值为Null,r的取值为1到m,m为TS中的时间序列的数量。TS存储的为有序数据,初始化为包含表头元素的列表,列表的长度可以扩展。
S300,基于所述时间描述信息表和TS获取目标时间序列信息表。
进一步地,在本发明实施例中,S300可具体包括:
S301,获取TD1对应的目标时间信息T1并将获取的T1加入到TS中的第一时间序列TS1中;设置h=2,执行S302。
在本发明实施例中,所述目标时间信息为根据对应的时间描述语句得到的日期信息即具体时间,即T1为根据TD1得到的日期信息,例如,得到的日期信息为2022年3月5日等。在本发明实施例中,日期信息可为设定类型的时间信息。
S302,如果h≤n,执行S303;否则,执行S307。
S303,如果TDh和TDh-1的时态类型相同,执行S304,否则,获取TDh对应的目标时间信息Th,并执行S305。
S304,如果(Ph-Ph-1)≤k即相邻时间描述语句之间间隔的语句数量不超过k,并且Sh∩So h-1≠Null,获取TDh对应的目标时间信息Th并将Th加入到T(h-1)对应的时间序列中,否则,说明两个语句描述的不是同一件事,获取Th并执行S305;其中,So h-1为TDh-1对应的时间序列中所包含的实体并集;k为预设值。
在本发明实施例中,k可为经验值,在一个示意性实施例中,k可为2或者3,优选,k等于3。因为,按照新闻文本的叙事规则,一般前后两三句话会说同一件事情。
S305,将Th加入到Th-1对应的时间序列的下一个时间序列中;执行S306。
S306,设置h=h+1,执行S302。
S307,获取当前的TS作为目标时间序列信息表,并退出当前控制程序。
本领域技术人员知晓,当前的TS中的时间序列的数量可能不等于初始设置的m,有可能小于m或者大于m,最后得到的目标时间序列信息表为不包含Null的时间序列信息表。
进一步地,在本发明实施例中,如果TDi包含设定类型的时间信息,则将TDi包含的设定类型的时间信息作为Ti的目标时间信息,否则,TDi的目标时间信息Ti基于预设时间信息匹配信息表确定,其中,预设时间信息匹配信息表中的第s行包括(TDMs,Es),TDMs为预设时间信息匹配信息表中的第s个时间描述,s的取值为1到G,G为预设时间信息匹配信息表的行数量,Es为TDMs对应的时间表达式,Es用于基于TDMs对应的基准时间确定TDMs对应的目标时间信息。
在本发明实施例中,所述设定类型的时间信息包括第一类时间信息至第三类时间信息,其中,第一类时间信息为确定属于某个时间点的时间信息例如2022年3月2日,第二类时间信息为确定属于某个时间段的时间信息例如2022年2月15日至/~2022年5月5日,第三类时间信息为确定属于某个时间范围内的时间信息例如,位于2022年5月1日至/~2022年6月1日中的某一天或者某一段时间内,又例如,位于2022年5月1日之前,或者,又例如,位于2022年6月1日之后。
本发明实施例中,将时间信息分成三类时间信息,能够统一时间信息的表达标准。
在本发明实施例中,时间表达式可为正则表达式,可基于现有技术确定,例如微软的正则工具,或者,例如CN111563359A公开的技术方案。例如,对于时间描述“上周”,对应的时间表达式可为基准时间之前的7天,时间描述“下周”,对应的时间表达式可为基准时间之后的7天等。
本领域技术人员知晓,对于TD1,其基准时间应为目标文本的时间戳即发布时间。
在本发明实施例中,TDi基于预设时间信息匹配信息表确定,可包括:
S10,获取TDi对应的基准时间。
具体地,如果TDh和TDh-1的时态类型不相同即两句话之间改变了时态,说明两句话说的不是同一件事,则将目标文本的时间戳作为计算Th的基准时间。
如果TDh和TDh-1的时态类型相同,(Ph-Ph-1)≥k,且Sh∩So h-1≠Null,则用于计算Th的基准时间通过如下步骤获取:
S20,设置g=1。
S21,如果g≤H,执行S22,否则,退出当前控制程序;H为Th-1对应的时间序列中包含的时间描述语句的数量。
S22,如果Sh∩Sh-g≠Null,则将Sh-g对应的目标时间信息作为计算Th的基准时间,即将距离TDh所对应位置最近且存在实体交集的描述语句对应的目标时间信息作为TDh的基准时间;否则,执行S23。
S23,设置g=g+1,执行S11。
S11,基于TDi,从预设时间信息匹配信息表获取对应的时间表达式。具体,将TDi作为查询词在预设时间信息匹配信息表中进行查询,查询到对应的时间描述和对应的时间表达式。
S12,基于TDi对应的基准时间和时间表达式,生成对应的时间信息计算结果,如果只生成一个时间信息计算结果例如2022年5月日或者2022年3月1日至2022年3月20日,则将生成的时间信息计算结果作为TDi对应的目标时间信息,如果生成两个时间信息计算结果,则基于TDi的时态类型从生成的时间信息计算结果中选择对应的时间信息计算结果作为TDi对应的目标时间信息。
在本发明实施例中,对于某些特别不清楚的时间描述,例如,仅为关于某天的描述,例如“6日”,则由于不知道是基准时间之前的日期还是之后的日期,会输出两个计算结果,具体地,如果生成两个时间信息计算结果,则基于TDi的时态类型将生成的时间信息计算结果中选择对应的计算结果作为TDi对应的目标时间信息可包括:
如果TDi对应的时态类型为过去时,则从生成的时间信息计算结果中选择比TDi对应的基准时间小的计算结果作为TDi的目标时间信息,如果TDi对应的时态类型为将来时,则从生成的时间信息计算结果中选择比TDi对应的基准时间大的计算结果作为TDi的目标时间信息。例如,如果时间描述为“6日”,对应的基准时间为2022年5月1日,计算结果可能是2022年4月6日和2022年6月6日两个结果,此时,需要根据“6日”对应的时态类型进行确定,如果是过去时,则对应的目标时间信息为2022年4月6日,如果为将来时,则对应的目标时间信息为2022年6月6日。
进一步地,本发明实施例中,还包括以下步骤:
S400,获取目标时间序列信息表中的每个时间序列对应的时间长度。
本领域技术人员知晓,获取目标时间序列信息表中的每个时间序列对应的时间长度可为现有技术。
本发明实施例提供的文本时间序列获取方法,在具体应用时,可基于目标文本中的时间序列判断目标文本中所记载的事件是否为同一件事,例如,目标文本中获取到两个时间序列,如果两个时间序列的时间长度基本相同,并且对应的实体基本相同,则说明对应的事件为同一事件,这说明文本对同一事件做了两次描述。
本发明的实施例还提供了一种非瞬时性计算机可读存储介质,该存储介质可设置于电子设备之中以保存用于实现方法实施例中一种方法相关的至少一条指令或至少一段程序,该至少一条指令或该至少一段程序由该处理器加载并执行以实现上述实施例提供的方法。
本发明的实施例还提供了一种电子设备,包括处理器和前述的非瞬时性计算机可读存储介质。
本发明的实施例还提供一种计算机程序产品,其包括程序代码,当所述程序产品在电子设备上运行时,所述程序代码用于使该电子设备执行本说明书上述描述的根据本发明各种示例性实施方式的方法中的步骤。
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员还应理解,可以对实施例进行多种修改而不脱离本发明的范围和精神。本发明开的范围由所附权利要求来限定。
Claims (10)
1.一种文本时间序列获取方法,其特征在于,所述方法包括如下步骤:
S100,获取目标文本中的时间描述信息表;所述时间描述信息表的第i行包括(TDi,Si,Pi,Ci),其中,TDi为目标文本中识别到的第i个时间描述语句中的时间描述,Si为目标文本中识别到的第i个时间描述语句对应的实体集,Si={Si1,Si2,…,Sij,…,Sif(i)},Sij为Si中的第j个实体,j的取值为1到f(i),f(i)为Si中的实体数量,Pi为第i个时间描述语句在目标文本中的位置ID,Ci为TDi对应的时态类型,i的取值为1到n,n为目标文本中的识别到的时间描述语句的数量;
S200,获取初始时间序列信息表TS={TS1,TS2,…,TSr,…,TSm},TSr为TS中的第r时间序列,初始值为Null,r的取值为1到m,m为TS中的时间序列的数量;
S300,基于所述时间描述信息表和TS获取目标时间序列信息表;
其中,S300具体包括:
S301,获取TD1对应的目标时间信息T1并将获取的T1加入到TS中的第一时间序列TS1中;设置h=2;所述目标时间信息T1为根据TD1得到的日期信息;
S302,如果h≤n,执行S303;否则,执行S307;
S303,如果TDh和TDh-1的时态类型相同,执行S304,否则,获取TDh对应的目标时间信息Th,并执行S305;
S304,如果(Ph-Ph-1)≤k,并且Sh∩So h-1≠Null,获取TDh对应的目标时间信息Th并将Th加入到Th-1对应的时间序列中,否则,获取Th并执行S305;其中,So h-1为TDh-1对应的时间序列中所包含的实体并集;k为预设值;
S305,将Th加入到Th-1对应的时间序列的下一个时间序列中;执行S306;
S306,设置h=h+1,执行S302;
S307,获取当前的TS作为目标时间序列信息表,并退出当前控制程序。
2.根据权利要求1所述的方法,其特征在于,如果TDi包含设定类型的时间信息,则将TDi包含的设定类型的时间信息作为TDi的目标时间信息,否则,TDi的目标时间信息基于预设时间信息匹配信息表确定,其中,预设时间信息匹配信息表中的第s行包括(TDMs,Es),TDMs为预设时间信息匹配信息表中的第s个时间描述,s的取值为1到G,G为预设时间信息匹配信息表的行数量,Es为TDMs对应的时间表达式,Es用于基于TDMs对应的基准时间确定TDMs对应的目标时间信息。
3.根据权利要求2所述的方法,其特征在于,所述设定类型的时间信息包括第一类时间信息至第三类时间信息,其中,第一类时间信息为确定属于某个时间点的时间信息,第二类时间信息为确定属于某个时间段的时间信息,第三类时间信息为确定属于某个时间范围内的时间信息。
4.根据权利要求2所述的方法,其特征在于,TDi基于预设时间信息匹配信息表确定,包括:
S10,获取TDi对应的基准时间;
S11,基于TDi,从预设时间信息匹配信息表获取对应的时间表达式;
S12,基于TDi对应的基准时间和时间表达式,生成对应的时间信息计算结果,如果只生成一个时间信息计算结果,则将生成的时间信息计算结果作为TDi对应的目标时间信息,如果生成两个时间信息计算结果,则基于TDi的时态类型从生成的时间信息计算结果中选择对应的时间信息计算结果作为TDi对应的目标时间信息。
5.根据权利要求4所述的方法,其特征在于,如果TDh和TDh-1的时态类型不相同,将目标文本的时间戳作为计算Th的基准时间。
6.根据权利要求4所述的方法,其特征在于,如果TDh和TDh-1的时态类型相同,(Ph-Ph-1)≤k,且Sh∩So (h-1)≠Null,用于计算Th的基准时间通过如下步骤获取:
S20,设置g=1;
S21,如果g≤H,执行S22,否则,退出当前控制程序;H为Th-1对应的时间序列中包含的时间描述语句的数量;
S22,如果Sh∩Sh-g≠Null,则将Sh-g对应的目标时间信息作为计算Th的基准时间;否则,执行S23;
S23,设置g=g+1,执行S21。
7.根据权利要求1所述的方法,其特征在于,所述目标文本为新闻文本。
8.根据权利要求1所述的方法,其特征在于,还包括以下步骤:
S400,获取目标时间序列信息表中的每个时间序列对应的时间长度。
9.一种非瞬时性计算机可读存储介质,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1~8中任意一项的所述方法。
10.一种电子设备,其特征在于,包括处理器和权利要求9所述的非瞬时性计算机可读存储介质。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310372627.9A CN116150409B (zh) | 2023-04-10 | 2023-04-10 | 一种文本时间序列获取方法、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310372627.9A CN116150409B (zh) | 2023-04-10 | 2023-04-10 | 一种文本时间序列获取方法、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116150409A CN116150409A (zh) | 2023-05-23 |
CN116150409B true CN116150409B (zh) | 2023-06-23 |
Family
ID=86350881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310372627.9A Active CN116150409B (zh) | 2023-04-10 | 2023-04-10 | 一种文本时间序列获取方法、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116150409B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111563359A (zh) * | 2019-01-29 | 2020-08-21 | 腾讯科技(深圳)有限公司 | 时间识别方法、装置以及相关设备 |
CN115422464A (zh) * | 2022-09-29 | 2022-12-02 | 北京明略昭辉科技有限公司 | 一种序列事件的参与人数的确定方法、装置及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009101954A1 (ja) * | 2008-02-15 | 2009-08-20 | Nec Corporation | テキスト情報分析システム |
CN111538815B (zh) * | 2020-04-27 | 2023-09-22 | 北京百度网讯科技有限公司 | 一种文本查询方法、装置、设备及存储介质 |
CN115151903A (zh) * | 2020-12-25 | 2022-10-04 | 京东方科技集团股份有限公司 | 文本抽取方法及装置、计算机可读存储介质以及电子设备 |
-
2023
- 2023-04-10 CN CN202310372627.9A patent/CN116150409B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111563359A (zh) * | 2019-01-29 | 2020-08-21 | 腾讯科技(深圳)有限公司 | 时间识别方法、装置以及相关设备 |
CN115422464A (zh) * | 2022-09-29 | 2022-12-02 | 北京明略昭辉科技有限公司 | 一种序列事件的参与人数的确定方法、装置及存储介质 |
Non-Patent Citations (3)
Title |
---|
Text mining in bioinformatics: Past, present and future;Hadee Faiiazee 等;《2012 International Conference on Information Retrieval & Knowledge Management》;全文 * |
中文文本的事件时空信息标注;张春菊;张雪英;王曙;廖建平;陈晓丹;;中文信息学报(第03期);全文 * |
针对科技路线图的文本挖掘研究:信息抽取方法;谢秀芳 等;情报理论与实践;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116150409A (zh) | 2023-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11194965B2 (en) | Keyword extraction method and apparatus, storage medium, and electronic apparatus | |
CN109905772B (zh) | 视频片段查询方法、装置、计算机设备及存储介质 | |
CN110263248B (zh) | 一种信息推送方法、装置、存储介质和服务器 | |
CN108763535B (zh) | 信息获取方法及装置 | |
WO2019037258A1 (zh) | 信息推荐的装置、方法、系统及计算机可读存储介质 | |
CN109635094B (zh) | 用于生成答案的方法和装置 | |
EP1091303A3 (en) | Method and system for providing alternatives for text derived from stochastic input sources | |
CN103678336B (zh) | 实体词识别方法及装置 | |
CN111538816B (zh) | 基于ai识别的问答方法、装置、电子设备及介质 | |
CN111984845B (zh) | 网站错别字识别方法和系统 | |
CN112686051A (zh) | 语义识别模型训练方法、识别方法、电子设备、存储介质 | |
CN112015992B (zh) | 智能单词背诵计划生成方法 | |
CN116150409B (zh) | 一种文本时间序列获取方法、电子设备及存储介质 | |
CN106844512B (zh) | 智能问答方法及系统 | |
CN112765397A (zh) | 一种音频转换方法、音频播放方法及装置 | |
EP3425531A1 (en) | System, method, electronic device, and storage medium for identifying risk event based on social information | |
JP6942759B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
CN109033082B (zh) | 语义模型的学习训练方法、装置及计算机可读存储介质 | |
CN108415959B (zh) | 一种文本分类方法及装置 | |
JP2008021139A (ja) | 意味タグ付け用モデル構築装置、意味タグ付け装置及びコンピュータプログラム | |
CN110543634B (zh) | 语料数据集的处理方法、装置、电子设备及存储介质 | |
CN108763258A (zh) | 文档主题参数提取方法、产品推荐方法、设备及存储介质 | |
CN111367962B (zh) | 数据库的更新方法及装置、计算机可读存储介质、电子设备 | |
Rahman et al. | An investigative design based statistical approach for determining Bangla sentence validity | |
CN107203512B (zh) | 用于从用户的自然语言输入中提取关键元素的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |