CN104572888A - 一种时间序列关联的信息检索方法 - Google Patents

一种时间序列关联的信息检索方法 Download PDF

Info

Publication number
CN104572888A
CN104572888A CN201410814851.XA CN201410814851A CN104572888A CN 104572888 A CN104572888 A CN 104572888A CN 201410814851 A CN201410814851 A CN 201410814851A CN 104572888 A CN104572888 A CN 104572888A
Authority
CN
China
Prior art keywords
text
time sequence
tab
vocabulary
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410814851.XA
Other languages
English (en)
Other versions
CN104572888B (zh
Inventor
蔡青林
陈岭
孙建伶
陈蕾英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201410814851.XA priority Critical patent/CN104572888B/zh
Publication of CN104572888A publication Critical patent/CN104572888A/zh
Application granted granted Critical
Publication of CN104572888B publication Critical patent/CN104572888B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/322Trees

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种时间序列关联的信息检索方法,首先按照时间顺序统计文本数据库的词频分布,为各词汇构建词频时间序列;然后基于相似性度量方法,计算各词汇与时间序列的相关度。对于每个文本文件,基于各词汇相关度计算文本主题与查询时间序列的相关度,实现文本筛选及相关文本主题信息的查询,最终可为时间序列的波动模式提供合理的解释。本发明可实现时间序列与文本数据库的交互查询,从文本数据的角度分析和挖掘时间序列的波动模式;在大数据时代可发挥重要作用,如在金融领域的电子化交易市场中,根据股票价格的显著性波动模式,查询与其相关的新闻、政策或法令信息,帮助投资者执行准确的舆情分析,以深入挖掘市场价格的影响因素。

Description

一种时间序列关联的信息检索方法
技术领域
本发明涉及数据库、数据挖掘、信息检索等领域,尤其涉及时间序列数据分析和挖掘。
背景技术
对于时间序列在文本数据库中的主题信息检索问题,目前还没有公开的解决方法。尽管如此,工业界已经提出了针对时间序列与文本数据的联合分析方法。比如,通过提取文本表达式概括时间序列,可以有效利用时间序列的结构化特征实现时间序列的相似性检索;基于单词动态时间变化性质的相似性分析,能够在较大程度上改进语义相关词汇的查找方法;另外,最新提出的方法通过使用基于词汇时间动态性质计算的权重,可以很好地改进文本检索的质量。但是,以上方法的缺陷在于它们无法实现词汇的动态选择,而导致查询结果对不同时间序列查询的针对性不强。
另外一类最新的联合分析方法是因果主题挖掘方法。该类方法基于概率主题模式,对与输入时间序列有因果关系的文本主题自动建模。然而,该类方法具有复杂的参数评价过程,需要用户具备一定的专家知识,这在实际应用中难以保证。
在金融领域,基于文本数据(如新闻)的股票价格预测方法也被提出。该类方法的主要目标是从文本数据中查找具有预测意义的词汇,并根据它们在出现最频繁的时间段内对股票价格的影响进行标记,进而实现金融时间序列的预测。这类方法大多基于回归和分类的初始化,难以用于解决时间序列在文本数据库的相关主题查询问题。
发明内容
本发明要解决的问题是如何以时间序列作为输入,从文本数据库查询出与其相关的文本主题信息。为了解决该问题,本发明提出了时间序列关联的信息检索方法。
本发明的目的是通过以下技术方案实现的:一种时间序列关联的信息检索方法,包括以下步骤:
(1)数据预处理,具体包括以下子步骤:
(1.1)依次读取文本数据库的每个文本文件d;
(1.2)除去文本文件d中所有停用词,并以d的发布时间作为时间戳t对其标记;
(1.3)以时间戳t作为索引项,对文本数据库构建B+-树索引I;
(2)词汇相关性度量,具体包括以下子步骤:
(2.1)按照查询时间序列Q的时间戳顺序,依次从索引I中查询时间戳为ti的文本集合Ci,构造Q的相关文本集合C;
(2.2)对每个文本子集Ci统计词频分布,分别为各词汇termj构造词频时间序列TF_Sequej
(2.3)基于动态时间弯曲距离,分别计算各词频时间序列TF_Sequej与查询时间序列Q的相似度,作为相应词汇termj与Q的相关度term_corrj,并构造词汇相关度表table;
(3)文本主题相关性度量,具体包括以下子步骤:
(3.1)查询词汇相关度表table,获取di中各词汇与Q的相关度;根据词汇相关度,对di的所有词汇按照由大到小的顺序排列,保留前N个词汇作为主题词汇集S;计算S中所有词汇相关度的平均值作为文本di的主题相关度。
(3.2)根据文本主题相关度,对C的所有文本文件按照由大到小的顺序排列,保留前k个文本作为查询结果予以返回。
进一步地,所述步骤2.2包括以下子步骤:
(2.2.1)分别计算Ci中各词汇termj的出现次数,并作为termj在时间戳ti的词频;
(2.2.2)将词汇termj在所有时间戳的词频依次相连,为其构造词频时间序列。
进一步地,所述步骤2.3包括以下子步骤:
(2.3.1)初始化词汇相关度表table,对查询时间序列Q做z-规范化处理,得到Q'={(x'1,t1),(x'2,t2),...,(x'i,ti),...,(x'n,tn)};
(2.3.2)依次读取相关文本集合C的每条词频时间序列TF_Sequej,并作z-规范化处理,得到TF_Seque'j={(TF'1j,t1),(TF'2j,t2),...,(TF'nj,tn)};
(2.3.3)创建动态规划表Tab并对其进行初始化;
(2.3.4)依次计算Q'的第1个元素值与TF_Seque'j的n个元素值之间的差的绝对值,并存入Tab第1行;
(2.3.5)依次计算TF_Seque'j的第1个元素值与Q'的n个元素值之间的差的绝对值,并存入Tab第1列;
(2.3.6)利用动态规划方法,依次扫描Q'的第2到第n个元素值和TF_Seque'j的第2到第n个元素值,计算Tab(2:n,2:n)的每个单元值,包括以下子步骤;
(2.3.6.1)顺序扫描Q',依次计算其第i个元素值与TF_Seque'j的各元素值之差的绝对值;
(2.3.6.2)根据先行后列的顺序扫描Tab(2:n,2:n),在每个单元Tab(i,l)中,首先比较Tab(i-1,l)、Tab(i,l-1)和Tab(i-1,l-1)的大小,选择最小值记为min,然后计算|x'i-TF'lj|+min的值赋予Table(i,l);
(2.3.7)对Tab(n,n)的值取倒数,作为termj的词汇相关度,加入词汇相关度表table。
本发明的有益效果是:
1、有效解决了时序数据与文本数据的交互查询问题,基于文本主题信息为时间序列波动模式提供了合理的解释,在时序数据与文本数据的联合分析与挖掘任务中具有重要作用。
2、在词汇相关性度量步骤中,基于动态时间弯曲距离的度量方法,可有效克服词频时间序列与查询时间序列在时间轴上的局部伸缩和相位偏移,从而充分考虑了时间序列波动模式与影响因素的因果关系。
3、在文本主题相关度计算步骤中,只基于最相关的若干词汇进行计算,保证了本发明对文本主题信息的敏感性及相关度判断的准确性。
附图说明
图1为时间序列关联的信息检索方法流程图;
图2基于动态时间弯曲距离计算词汇相关度流程图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
如图1所示,本发明一种时间序列关联的信息检索方法,包括以下步骤:
(1)数据预处理,具体包括以下子步骤:
(1.1)依次读取文本数据库D的每个文本文件d;
(1.2)除去文本文件d中所有停用词,并以d的发布时间作为时间戳t对其标记;
(1.3)以时间戳t作为索引项,对文本数据库D的所有文本文件构建B+-树索引I;
(2)词汇相关性度量,具体包括以下子步骤:
(2.1)按照查询时间序列Q={(x1,t1),(x2,t2),...,(xi,ti),...,(xn,tn)}的时间戳顺序,依次从索引I中查询时间戳为ti的文本集合Ci,构造Q的相关文本集合C={C1,C2,...,Ci,...,Cn};
(2.2)对每个文本子集Ci统计词频分布,为C中各词汇构造词频时间序列TF_Seque,具体为:
(2.2.1)分别计算Ci中各词汇termj的出现次数,并作为termj在时间戳ti的词频TFij,表示为(TFij,ti);
(2.2.2)将词汇termj在所有时间戳的词频(TFij,ti)依次连接,为termj构造词频时间序列TF_Sequej={(TF1j,t1),(TF2j,t2),...,(TFnj,tn)};
(2.3)基于动态时间弯曲距离,分别计算各词频时间序列TF_Sequej与查询时间序列Q的相似度,作为相应词汇termj与Q的相关度term_corrj,如图2所示,并构造词汇相关度表table={(term1,term_corr1);(term2,term_corr2);...;(termτ,term_corrτ)},具体为:
(2.3.1)初始化词汇相关度表计算时间序列Q所有采样点的平均值m和标准差σ,根据公式(1)对Q做z-规范化处理,得到规范化的时间序列Q'={(x'1,t1),(x'2,t2),...,(x'i,ti),...,(x'n,tn)};
x ′ i = x i - m σ - - - ( 1 )
(2.3.2)依次读取相关文本集合C的每条词频时间序列TF_Sequej,并根据公式(1)作z-规范化处理,得到规范化的词频时间序列TF_Seque'j={(TF'1j,t1),(TF'2j,t2),...,(TF'nj,tn)};
(2.3.3)初始化动态规划表Tab=cell(n,n);
(2.3.4)依次计算Q'的第1个元素值x'1与TF_Seque'j的n个元素值TF'1j~TF'nj之间的差的绝对值{|x'1-TF'1j|,...,|x'1-TF'nj|},并存入Tab第1行Tab(1,1:n);
(2.3.5)依次计算TF_Seque'j的第1个元素值TF'1j与Q'的n个元素值x'1~x'n之间的差的绝对值{|x'1-TF'1j|,...,|x'n-TF'1j|},并存入Tab第1列Table(1:n,1);
(2.3.6)利用动态规划方法,依次扫描Q'的第2到第n个元素值x'2~x'n和TF_Seque'j的第2到第n个元素值TF'2j~TF'nj,计算Tab(2:n,2:n)的每个单元值,该过程包括以下子步骤:
(2.3.6.1)顺序扫描x'2~x'n,对于Q'的第i个元素值x'i,依次计算它与TF'2j~TF'nj之间的差的绝对值{|x'i-TF'2j|,...,|x'i-TF'nj|};
(2.3.6.2)根据先行后列的顺序扫描Tab(2:n,2:n),在每个单元Tab(i,l)中,首先比较Tab(i-1,l)、Tab(i,l-1)和Tab(i-1,l-1)的大小,选择最小值记为min,然后计算|x'i-TF'lj|+min的值赋予Table(i,l);
(2.3.7)对Tab(n,n)的值取倒数,作为termj与Q的相关度term_corrj,将(termj,term_corrj加入词汇相关度表table;
(3)文本主题相关性度量,具体包括以下子步骤:
(3.1)依次读取文本集合C的每个文本文件di,计算其主题信息与查询时间序列Q的相关度topic_corri,具体为:
(3.1.1)查询词汇相关度表table,获取di中各词汇termj与Q的相关度term_corrj
(3.1.2)根据词汇相关度,对di的所有词汇按照由大到小的顺序排列,保留前N个词汇作为主题词汇集S={term1,term2,...,termN};
(3.1.3)根据公式(2)计算S中所有词汇相关度的平均值,作为文本di的主题信息与查询时间序列Q的相关度topic_corr;
topic _ corr = 1 N Σ i = 1 N term _ corr i - - - ( 2 )
(3.2)根据文本主题相关度topic_corr,对C的所有文本文件按照由大到小的顺序排列,保留前k个文本作为查询结果予以返回。
本发明针对时间序列在文本数据库中的主题信息检索任务,提出了时间序列关联的信息检索方法,可有效实现时间序列与文本数据库的交互查询。不仅可以帮助人们更深入地理解时间序列波动模式的形成原因,而且在一定程度上满足了大数据时代对跨学科、跨领域数据分析和挖掘任务的迫切需求,在基于时间序列与文本数据的联合分析和挖掘任务中可发挥重要作用。

Claims (3)

1.一种时间序列关联的信息检索方法,其特征在于,包括以下步骤:
(1)数据预处理,具体包括以下子步骤:
(1.1)依次读取文本数据库的每个文本文件d;
(1.2)除去文本文件d中所有停用词,并以d的发布时间作为时间戳t对其标记;
(1.3)以时间戳t作为索引项,对文本数据库构建B+-树索引I;
(2)词汇相关性度量,具体包括以下子步骤:
(2.1)按照查询时间序列Q的时间戳顺序,依次从索引I中查询时间戳为ti的文本集合Ci,构造Q的相关文本集合C;
(2.2)对每个文本子集Ci统计词频分布,分别为各词汇termj构造词频时间序列TF_Sequej
(2.3)基于动态时间弯曲距离,分别计算各词频时间序列TF_Sequej与查询时间序列Q的相似度,作为相应词汇termj与Q的相关度term_corrj,并构造词汇相关度表table;
(3)文本主题相关性度量,具体包括以下子步骤:
(3.1)查询词汇相关度表table,获取di中各词汇与Q的相关度;根据词汇相关度,对di的所有词汇按照由大到小的顺序排列,保留前N个词汇作为主题词汇集S;计算S中所有词汇相关度的平均值作为文本di的主题相关度。
(3.2)根据文本主题相关度,对C的所有文本文件按照由大到小的顺序排列,保留前k个文本作为查询结果予以返回。
2.根据权利要求1所述一种时间序列关联的信息检索方法,其特征在于,所述步骤2.2包括以下子步骤:
(2.2.1)分别计算Ci中各词汇termj的出现次数,并作为termj在时间戳ti的词频;
(2.2.2)将词汇termj在所有时间戳的词频依次相连,为其构造词频时间序列。
3.根据权利要求1所述一种时间序列关联的信息检索方法,其特征在于,所述步骤2.3包括以下子步骤:
(2.3.1)初始化词汇相关度表table,对查询时间序列Q做z-规范化处理,得到Q'={(x'1,t1),(x'2,t2),...,(x'i,ti),...,(x'n,tn)};
(2.3.2)依次读取相关文本集合C的每条词频时间序列TF_Sequej,并作z-规范化处理,得到TF_Seque'j={(TF'1j,t1),(TF'2j,t2),...,(TF'nj,tn)};
(2.3.3)创建动态规划表Tab并对其进行初始化;
(2.3.4)依次计算Q'的第1个元素值与TF_Seque'j的n个元素值之间的差的绝对值,并存入Tab第1行;
(2.3.5)依次计算TF_Seque'j的第1个元素值与Q'的n个元素值之间的差的绝对值,并存入Tab第1列;
(2.3.6)利用动态规划方法,依次扫描Q'的第2到第n个元素值和TF_Seque'j的第2到第n个元素值,计算Tab(2:n,2:n)的每个单元值,包括以下子步骤;
(2.3.6.1)顺序扫描Q',依次计算其第i个元素值与TF_Seque'j的各元素值之差的绝对值;
(2.3.6.2)根据先行后列的顺序扫描Tab(2:n,2:n),在每个单元Tab(i,l)中,首先比较Tab(i-1,l)、Tab(i,l-1)和Tab(i-1,l-1)的大小,选择最小值记为min,然后计算|x'i-TF'lj|+min的值赋予Table(i,l);
(2.3.7)对Tab(n,n)的值取倒数,作为termj的词汇相关度,加入词汇相关度表table。
CN201410814851.XA 2014-12-23 2014-12-23 一种时间序列关联的信息检索方法 Expired - Fee Related CN104572888B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410814851.XA CN104572888B (zh) 2014-12-23 2014-12-23 一种时间序列关联的信息检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410814851.XA CN104572888B (zh) 2014-12-23 2014-12-23 一种时间序列关联的信息检索方法

Publications (2)

Publication Number Publication Date
CN104572888A true CN104572888A (zh) 2015-04-29
CN104572888B CN104572888B (zh) 2018-05-29

Family

ID=53088950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410814851.XA Expired - Fee Related CN104572888B (zh) 2014-12-23 2014-12-23 一种时间序列关联的信息检索方法

Country Status (1)

Country Link
CN (1) CN104572888B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107590143A (zh) * 2016-07-06 2018-01-16 北京金山云网络技术有限公司 一种时间序列的检索方法、装置及系统
CN108229684A (zh) * 2018-01-26 2018-06-29 中国科学技术信息研究所 构建专家知识向量模型的方法、装置及终端设备
CN108399263A (zh) * 2018-03-15 2018-08-14 北京大众益康科技有限公司 时序数据的存储和查询方法及存储和处理平台
CN110347804A (zh) * 2019-07-22 2019-10-18 同方知网数字出版技术股份有限公司 一种线性时间复杂度的敏感信息检测方法
CN111488385A (zh) * 2020-04-07 2020-08-04 腾讯科技(深圳)有限公司 基于人工智能的数据处理方法、装置和计算机设备
CN112163157A (zh) * 2020-09-30 2021-01-01 腾讯科技(深圳)有限公司 一种文本推荐方法、装置、服务器及介质
CN112948589A (zh) * 2021-05-13 2021-06-11 腾讯科技(深圳)有限公司 文本分类方法、装置和计算机可读存储介质
CN113537651A (zh) * 2021-09-17 2021-10-22 深圳市安软科技股份有限公司 一种金融时间序列预测方法、系统及相关设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488790A (zh) * 2013-10-08 2014-01-01 河海大学 基于加权borda计数法的多元时间序列相似分析方法
CN103942300A (zh) * 2014-04-15 2014-07-23 大连海事大学 一种中心时间序列的动态求解方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488790A (zh) * 2013-10-08 2014-01-01 河海大学 基于加权borda计数法的多元时间序列相似分析方法
CN103942300A (zh) * 2014-04-15 2014-07-23 大连海事大学 一种中心时间序列的动态求解方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张娟等: "股票时间序列模型的关联规则挖掘", 《天津理工大学学报》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107590143B (zh) * 2016-07-06 2020-04-03 北京金山云网络技术有限公司 一种时间序列的检索方法、装置及系统
CN107590143A (zh) * 2016-07-06 2018-01-16 北京金山云网络技术有限公司 一种时间序列的检索方法、装置及系统
CN108229684A (zh) * 2018-01-26 2018-06-29 中国科学技术信息研究所 构建专家知识向量模型的方法、装置及终端设备
CN108229684B (zh) * 2018-01-26 2022-04-15 中国科学技术信息研究所 构建专家知识向量模型的方法、装置及终端设备
CN108399263B (zh) * 2018-03-15 2022-03-01 北京大众益康科技有限公司 时序数据的存储和查询方法及存储和处理平台
CN108399263A (zh) * 2018-03-15 2018-08-14 北京大众益康科技有限公司 时序数据的存储和查询方法及存储和处理平台
CN110347804A (zh) * 2019-07-22 2019-10-18 同方知网数字出版技术股份有限公司 一种线性时间复杂度的敏感信息检测方法
CN111488385A (zh) * 2020-04-07 2020-08-04 腾讯科技(深圳)有限公司 基于人工智能的数据处理方法、装置和计算机设备
CN111488385B (zh) * 2020-04-07 2023-08-15 腾讯科技(深圳)有限公司 基于人工智能的数据处理方法、装置和计算机设备
CN112163157A (zh) * 2020-09-30 2021-01-01 腾讯科技(深圳)有限公司 一种文本推荐方法、装置、服务器及介质
CN112163157B (zh) * 2020-09-30 2023-01-10 腾讯科技(深圳)有限公司 一种文本推荐方法、装置、服务器及介质
CN112948589B (zh) * 2021-05-13 2021-07-30 腾讯科技(深圳)有限公司 文本分类方法、装置和计算机可读存储介质
CN112948589A (zh) * 2021-05-13 2021-06-11 腾讯科技(深圳)有限公司 文本分类方法、装置和计算机可读存储介质
CN113537651A (zh) * 2021-09-17 2021-10-22 深圳市安软科技股份有限公司 一种金融时间序列预测方法、系统及相关设备

Also Published As

Publication number Publication date
CN104572888B (zh) 2018-05-29

Similar Documents

Publication Publication Date Title
CN104572888A (zh) 一种时间序列关联的信息检索方法
US20210382878A1 (en) Systems and methods for generating a contextually and conversationally correct response to a query
CN103049435B (zh) 文本细粒度情感分析方法及装置
CN105989040B (zh) 智能问答的方法、装置及系统
Peng et al. Detecting Spam Review through Sentiment Analysis.
CN104657496B (zh) 一种计算信息热度值的方法和设备
US20170213157A1 (en) Method and system to provide related data
US20190155918A1 (en) Real-time classification of evolving dictionaries
US20110106743A1 (en) Method and system to predict a data value
US8838597B1 (en) Semantic metadata extraction
CN102890702A (zh) 一种面向网络论坛的意见领袖挖掘方法
CN105426514A (zh) 个性化的移动应用app推荐方法
KR20220147550A (ko) 다중 목표의 이미지-텍스트 매칭 모델의 훈련 방법, 이미지-텍스트 검색 방법 및 장치
Nagar et al. Using text and data mining techniques to extract stock market sentiment from live news streams
CN104899231A (zh) 基于细粒度属性分类的感情分析引擎
Chou et al. Integrating XBRL data with textual information in Chinese: A semantic web approach
Buono et al. Big data econometrics: Now casting and early estimates
CN116542800A (zh) 基于云端ai技术的智能化财务报表分析系统
CN118153964A (zh) 基于大数据技术的供应商企业风险评估方法及系统
CN112286921B (zh) 一种基于多源异构数据的动态企业画像生成方法
Mohnot et al. Hybrid approach for Part of Speech Tagger for Hindi language
Leblay et al. Computational fact-checking: Problems, state of the art, and perspectives
CN115408532A (zh) 一种面向开源情报的武器装备知识图谱构建方法、系统、装置及存储介质
CN114691835A (zh) 基于文本挖掘的审计计划数据生成方法、装置和设备
Ye et al. DataFrame QA: A Universal LLM Framework on DataFrame Question Answering Without Data Exposure

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180529

Termination date: 20201223