CN106933815B - 文献价值获取方法与装置 - Google Patents
文献价值获取方法与装置 Download PDFInfo
- Publication number
- CN106933815B CN106933815B CN201511004803.5A CN201511004803A CN106933815B CN 106933815 B CN106933815 B CN 106933815B CN 201511004803 A CN201511004803 A CN 201511004803A CN 106933815 B CN106933815 B CN 106933815B
- Authority
- CN
- China
- Prior art keywords
- document
- value
- target document
- target
- documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种文献价值获取方法,该方法包括如下步骤:根据目标文献进行语义检索,获取与所述目标文献相关的目标文献相关数据集;根据所述目标文献相关数据集中与所述目标文献最相关的预定数量的文献与所述目标文献的相关度,和/或所述目标文献相关数据集中与所述目标文献的相关度在预定相关度阈值以上的文献数量计算所述目标文献的价值。本发明突破性地提出了一种非常客观的判断文献价值的新方式,为日渐活跃的专利交易市场提供了有力的技术支持。
Description
技术领域
本发明涉及价值评估技术领域,尤其提出一种文献价值的获取方法和装置。
背景技术
在专利交易上,专利价值的计算一直是个难题,尤其是现在专利交易市场日渐活跃,亟待一种能够客观地计算专利价值地方式。
现有技术中专利文献CN103679291提出一种文献价值评估方法,该方法是利用公司竞争力分值和公司专利被引用的次数来评估专利的价值,公司竞争力分值毕竟是一个主观因素,而且跟专利本身的价值并不存在直接的关联,因此这种价值评估方法并不能评价出专利的真正价值。
现有技术中专利文献CN104156411公开了一种专利价值数据综合处理系统,其主要是对人为的评价数据进行整理,并没有提出如何进行客观地对文献进行价值判定。
发明内容
本发明所要解决的技术问题是无法客观评估文献(尤其是专利)的价值。
为此目的,本发明提出了一种一种文献价值获取方法,该方法包括如下步骤:
根据目标文献进行语义检索,获取与所述目标文献相关的目标文献相关数据集;
根据所述目标文献相关数据集中与所述目标文献最相关的预定数量的文献与所述目标文献的相关度,和/或所述目标文献相关数据集中与所述目标文献的相关度在预定相关度阈值以上的文献数量,和/或所述目标文献相关数据集中各文献的申请日与所述目标文献的申请日之间的差值,计算所述目标文献的价值。
可选的,所述方法包括步骤:
根据限制性检索条件对数据库进行检索生成第一检索结果数据集;
基于所述第一检索结果数据集利用引用逻辑或者被引用逻辑获取目标文献。
可选的,基于所述第一检索结果数据集利用引用逻辑或者被引用逻辑获取目标文献,具体包括:
根据引用逻辑变换检索请求,获取第一检索数据集中的文献引用的其他文献构成的第二检索结果数据集;
统计所述第二检索结果数据集中每篇文献被所述第一检索结果数据集中的多少篇文献引用,记为N1Cited,并按照所述N1Cited对所述第二检索结果数据集中的文献进行第一排序;根据第一排序结果选择目标文献。
可选的,基于所述第一检索结果数据集利用引用逻辑或者被引用逻辑获取目标文献,具体包括:
统计所述第一检索结果数据集中每篇文献被引用的次数,记为N2Cited,并按照所述N2Cited对所述第一检索结果数据集中的文献进行第二排序;
根据第二排序结果选择目标文献。
可选的,所述步骤:从所述第一检索结果数据集获取目标文献,包括:
根据被引用逻辑变换检索请求,获取引用第一检索结果数据集中的其他文献构成的第三检索结果数据集;
统计所述第三检索结果数据集中每篇文献被引用的次数,记为N3Cited,并按照所述N3Cited对所述第三检索结果数据集中的文献进行第三排序;
根据第三排序结果选择目标文献。
可选的,所述步骤:根据排序结果选择目标文献,具体包括:
选择N1Cited、N2Cited或N3Cited最大的文献作为目标文献,
和/或,
选择N1Cited、N2Cited或N3Cited最靠前的数篇文献作为目标文献。
可选的,所述步骤:
根据所述目标文献相关数据集中与所述目标文献最相关的预定数量的文献与所述目标文献的相关度计算所述目标文献的价值,具体包括:
获取所述目标文献相关数据集中在所述目标文献的申请日前公开的与所述目标文献最相关的第一预定数量的文献,作为第一目标文献相关数据子集,计算所述第一目标文献相关数据子集中文献的相关度平均值,作为第一相关度平均值;
获取所述目标文献相关数据集中在所述目标文献的申请日后公开的与所述目标文献最相关的第二预定数量的文献,作为第二目标文献相关数据子集,计算所述第二目标文献相关数据子集中文献的相关度平均值,作为第二相关度平均值;
根据所述第一相关度平均值和/或第二相关度平均值计算所述目标文献的第一价值。
可选的,所述步骤:根据所述目标文献相关数据集中与所述目标文献的相关度在预定相关度阈值以上的文献的数量计算所述目标文献的价值,具体包括:
设定预定相关度阈值;
获取所述目标文献相关数据集中在所述目标文献的申请日前公开的、与所述目标文献的相关度大于所述相关度阈值的文献,作为第三目标文献相关数据子集,并统计所述第三目标文献相关数据子集中文献的数量,记为X,和/或计算第三目标文献相关数据子集的相关度平均值,记为RX;
获取所述目标文献相关数据集中在所述目标文献的申请日后公开的与所述目标文献的相关度大于所述相关度阈值的文献,作为第四目标文献相关数据子集,并统计所述第四目标文献相关数据子集中文献的数量,记为Y,和/或计算第三目标文献相关数据子集的相关度平均值,记为RY;
根据所述X,Y和/或RX,RY计算所述目标文献的第二价值。
可选的,所述步骤:根据所述目标文献相关数据集中各文献的申请日与所述目标文献的申请日之间的差值,计算所述目标文献的价值
包括:获取所述目标文献相关数据集中在所述目标文献的申请日前公开的文献,作为第五目标文献相关数据子集,
计算所述第五目标文献相关数据子集中各文献的申请日与所述目标文件的申请日之间的差值,记为{Ti,i=1,2,3,…,n};
获取所述目标文献相关数据集中在所述目标文献的申请日后公开的的文献,作为第六目标文献相关数据子集;
计算所述第六目标文献相关数据子集中各文献的申请日与所述目标文件的申请日的差值,记为{Tj’,j=1,2,3,…,m};
根据所述{Ti,i=1,2,3,…,n},{Tj’,j=1,2,3,…,m}计算所述目标文献的第三价值。
可选的,所述第五目标文献相关数据子集、第六目标文献相关数据子集中的文献是预定数量的文献或者与所述目标文献具有预定相关度以上的文献。
可选的,该方法还包括:计算参考文献的第一价值,作为第一参考价值;或,计算参考文献的第二价值,作为第二参考价值;或,计算参考文献的第三价值,作为第三参考价值;或计算参考文献组中每篇参考文献的第一价值的平均值,作为第一参考价值;或,计算参考文献组中每篇参考文献的第二价值的平均值,作为第二参考价值;或,计算参考文献组中每篇参考文献的第三价值的平均值,作为第三参考价值;所述参考文献、参考文献组为在目标文献的申请时间段申请的所述目标文献所属分类号下的其它文献或文献组、或在目标文献的申请时间段申请的与所述目标文献最相关的其它文献或文献组。
可选的,该方法还包括:
根据所述第一价值和第一参考价值、第二价值和第二参考价值和/或第三价值和第三参考价值,对比评估所述目标文献的价值。
本发明还提供了一种文献价值获取装置,该装置包括:
语义检索单元,用于根据目标文献进行语义检索,获取与所述目标文献相关的目标文献相关数据集;
文献价值计算单元,用于根据所述目标文献相关数据集中与所述目标文献最相关的预定数量的文献与所述目标文献的相关度,和/或所述目标文献相关数据集中与所述目标文献的相关度在预定相关度阈值以上的文献数量计算所述目标文献的价值。
可选的,该装置还包括:
限制性检索单元,用于根据限制性检索请求进行检索,获取第一检索结果数据集;
目标文献推送单元,用于从所述第一检索结果数据集利用引用逻辑或者被引用逻辑获取目标文献。
可选的,所述目标文献推送单元包括:
引用逻辑变换检索子单元,用于根据引用逻辑变换检索请求,获取第一检索数据集中的文献引用的其他文献构成的第二检索结果数据集;
第一被引用统计子单元,统计所述第二检索结果数据集中每篇文献被所述第一检索结果数据集中的多少篇文献引用,记为N1Cited,并按照所述N1Cited对所述第二检索结果数据集中的文献进行第一排序;
第一目标文献选择子单元,用于根据第一排序结果选择目标文献。
可选的,所述目标文献推送单元包括:
第二被引用统计子单元,用于统计所述第一检索结果数据集中每篇文献被引用的次数,记为N2Cited,并按照所述N2Cited对所述第一检索结果数据集中的文献进行第二排序;
第二目标文献选择子单元,用于根据第二排序结果选择目标文献。
可选的,所述目标文献推送单元包括:
被引用逻辑变换检索子单元,用于根据被引用逻辑变换检索请求,获取引用第一检索结果数据集中文献的其他文献构成的第三检索结果数据集;
第三被引用统计子单元,用于统计所述第三检索结果数据集中每篇文献被引用的次数,记为N3Cited,并按照所述N3Cited对所述第三检索结果数据集中的文献进行第三排序;
第三目标文献选择子单元,用于根据第三排序结果选择目标文献。
可选的,所述第一目标文献选择子单元、第二目标文献选择子单元或第三目标文献选择子单元具体用于选择N1Cited、N2Cited或N3Cited最大的文献作为目标文献,和/或,选择N1Cited、N2Cited或N3Cited最靠前的数篇文献作为目标文献。
可选的,所述文献价值计算单元具体包括:
第一子集获取子单元,用于获取所述目标文献相关数据集中在所述目标文献的申请日前公开的与所述目标文献最相关的文献,作为第一目标文献相关数据子集;
第一相关度平均值计算子单元,用于计算所述第一目标文献相关数据子集中文献的相关度平均值,作为第一相关度平均值;
第二子集获取子单元,用于获取所述目标文献相关数据集中在所述目标文献的申请日后公开的与所述目标文献最相关的第二预定数量的文献,作为第二目标文献相关数据子集;第二相关度平均值计算子单元,用于计算所述第一目标文献相关数据子集中文献的相关度平均值,作为第二相关度平均值;
第一价值计算子单元,根据所述第一相关度平均值和/或第二相关度平均值计算所述目标文献的第一价值。
可选的,所述文献价值计算单元具体包括:
阈值设定子单元,用于设定预定相关度阈值;
第三目标文献相关数据子集获取子单元,用于获取所述目标文献相关数据集中在所述目标文献的申请日前公开的、与所述目标文献的相关度大于所述相关度阈值的文献,作为第三目标文献相关数据子集;
第一统计子单元,用于统计所述第三目标文献相关数据子集中文献的数量,记为X,和/或统计第三目标文献相关数据子集的相关度平均值,记为RX;
第四目标文献相关数据子集获取子单元,用于获取所述目标文献相关数据集中在所述目标文献的申请日后公开的、与所述目标文献的相关度大于所述相关度阈值的文献,作为第四目标文献相关数据子集;
第二统计子单元,用于统计所述第四目标文献相关数据子集中文献的数量,记为Y,和/或统计第四目标文献相关数据子集的相关度平均值,记为RY;
第二文献价值计算子单元,用于根据所述X,Y和/或RX,RY计算所述目标文献的价值。
可选的,所述文献价值计算单元具体包括:
第五目标文献相关数据子集子单元,用于获取所述目标文献相关数据集中在所述目标文献的申请日前公开的文献,作为第五目标文献相关数据子集,
第一申请日差值计算子单元,用于计算所述第五目标文献相关数据子集中各文献的申请日与所述目标文献的申请日之间的差值,记为{Ti,i=1,2,3,…,n};
第六目标文献相关数据子集获取子单元,用于获取所述目标文献相关数据集中在所述目标文献的申请日后公开的的文献,作为第六目标文献相关数据子集;
第二申请日差值计算子单元,用于计算所述第六目标文献相关数据子集中各文献的申请日与所述目标文件的申请日的差值,记为{Tj’,j=1,2,3,…,m};
第三文献价值计算子单元,用于根据所述{Ti,i=1,2,3,…,n},,{Tj’,j'=1,2,3,…,m}计算所述目标文献的第三价值。
可选的,所述第五目标文献相关数据子集、第六目标文献相关数据子集中的文献是预定数量的文献或者与所述目标文献具有预定相关度以上的文献。
可选的,所述第一文献价值计算子单元,还用于计算参考文献的第一价值,或计算参考文献组中每篇参考文献的第一价值的平均值,作为第一参考价值;所述第二文献价值计算子单元还用于计算参考文献的第二价值,或计算参考文献组中每篇参考文献的第二价值的平均值,作为第二参考价值;所述第三文献价值计算子单元还用于计算参考文献的第三价值,或计算参考文献组中每篇参考文献的第三价值的平均值,作为第三参考价值;所述参考文献、参考文献组为在目标文献的申请时间段申请的所述目标文献所属分类号下的其它文献或文献组、或在目标文献的申请时间段申请的所述目标文献最相关的其它文献或文献组。
可选的,该装置还包括价值对比评估单元,用于根据所述第一价值和第一参考价值、第二价值和第二参考价值和/或第三价值和第三参考价值,对比评估所述目标文献的价值。
通过采用本发明所公开的文献价值获取方法和装置,利用在前和在后公开的文献与目标文献之间的相关度能够客观的计算出目标文献的价值,为专利交易提供了有效技术支撑。
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1示出了一种实施方式的价值计算手段的数据示意图;
图2示出了一种实施方式的价值计算手段的流程图;
图3示出了第二种实施方式的价值计算手段的流程图;
图4示出了另一种实施方式的价值计算手段的数据示意图;
图5示出了第三种实施方式的价值计算手段的流程图;
图6示出了文献价值计算单元的一种实施方式的具体结构框图;
图7示出了文献价值计算单元的另一种实施方式的具体结构框图;
图8示出了文献价值计算单元的第三种实施方式的具体结构框图。
具体实施方式
下面将结合附图对本发明的实施例进行详细描述。
本发明所要解决的技术问题是无法评估文献(尤其是专利)的价值。本发明主要是基于语义检索的文献价值挖掘的精髓(即按照相关度对相关文献进行排序)与文献价值的关联,从而创新性的提出了一种价值计算的方法。
首先说明一下相关度的概念。在使用智能搜索系统进行搜索时,系统会根据搜索表达式和文献文本(尤其是专利文本)内容含义自动算出两者之间的相关度,并以百分比表示。
本发明提出一种文献价值获取方法,该方法包括如下步骤:
根据目标文献进行语义检索,获取与所述目标文献相关的目标文献相关数据集;
根据所述目标文献相关数据集中与所述目标文献最相关的预定数量的文献与所述目标文献的相关度,和/或所述目标文献相关数据集中与所述目标文献的相关度在预定相关度阈值以上的文献数量计算所述目标文献的价值,和/或根据所述目标文献相关数据集中各文献的申请日与所述目标文献的申请日之间的差值,计算所述目标文献的价值。优选的,所述步骤:根据所述目标文献相关数据集中与所述目标文献最相关的预定数量的文献与所述目标文献的相关度,和/或所述目标文献相关数据集中与所述目标文献的相关度在预定相关度阈值以上的文献数量和/或根据所述目标文献相关数据集中各文献的申请日与所述目标文献的申请日之间的差值,计算所述目标文献的价值,如图1所示,包括:S10.获取所述目标文献相关数据集中在所述目标文献的申请日前公开的与所述目标文献最相关的第一预定数量的文献,作为第一目标文献相关数据子集;S11.计算所述第一目标文献相关数据子集中文献的相关度平均值,作为第一相关度平均值;S12.获取所述目标文献相关数据集中在所述目标文献的申请日后公开的与所述目标文献最相关的第二预定数量的文献,作为第二目标文献相关数据子集;S13.计算所述第二目标文献相关数据子集中文献的相关度平均值,作为第二相关度平均值;S14.根据所述第一相关度平均值和/或第二相关度平均值计算所述目标文献的价值。第一相关平均值越低,目标文献的创新性价值越高,反之,第一相关平均值越高,目标文献的创新性价值越低;反之,第二相关平均值越高,目标文献的创新性价值越高。从另一个角度讲,第一相关平均值越高,目标文献与在先技术越接近,创新性价值越低,而第二相关平均值越高,在后技术与目标文献越接近,越能说明目标文献引领了一种新技术发展趋势,其越有创新性价值和市场价值。
根据所述第一相关度平均值和/或第二相关度平均值计算所述目标文献的价值,在具体实施时,可考虑分别将第一相关度平均值、第二相关度平均值作为所述目标文献的价值因子,也可考虑将所述第二相关度平均值与所述第一相关度平均值的差值作为所述目标文献的价值因子。价值因子可单独作为目标文献价值评估的评估因素,也可与其他评估因素一起综合对目标文献进行价值评估。本发明披露,第二相关度平均值与第一相关度平均值的差是与目标文献的创造性最相关联的一个数值指标之一。
如图2所述,在目标文献的申请日前公开的与所述目标文献相关的预定数量H的文献按照相关度进行排序,每篇文献依次标记为prior1,prior2,prior3,……priorH,相关度依次记为rel1,rel2,rel3,……relH,在目标文献的申请日后公开的与所述目标文献相关的预定数量H的文献按照相关度进行排序,每篇文献依次标记为post1,post2,post3,……postH,相关度依次记为rel’1,rel’2,rel’3,……rel’H,。第一相关度平均值REL(PRIOR)=(rel1+rel2+rel3+……+relH)/H。第二相关度平均值REL(POST)=(rel’1+rel’2+rel’3+……+rel’H)/H。所述目标文献的价值V1(P)=REL(POST)-REL(PRIOR)。作为其他的实施方式,所述V1(P)=a REL(POST)-bREL(PRIOR),即对所述第二相关度平均值和所述第一相关度平均值分别进行加权,然后再做差。
作为一种具体实施方式,比如目标文献为US4769292,那么输入智能语义检索命令R/4769292and di/4769292,获取到按照与目标文献US4769292的相关度对在目标文献US4769292的申请日前公开的所有文献进行排序的结果。一般来说,我们只关注最相关的预定数量的文献,那么可以限定下最相关的预定数量,假设这个数量设定为100,那么在R/4769292and di/4769292的基础上进一步输入检索命令and top/100,可以得到与所述目标文献US4769292最相关的在其申请日前公开的100篇文献,而且这100篇文献按照相关度进行了排序。所述100篇文献与目标文献的相关度记为rel1,rel2,rel3,……,rel100,计算第一相关度平均值,REL(PRIOR)=(rel1+rel2+rel3+……+rel100)/100。
输入智能语义检索命令R/4769292and di/+4769292,获取到按照与目标文献US4769292的相关度对在目标文献US4769292的申请日后公开的所有文献进行排序的结果。一般来说,我们只关注最相关的预定数量的文献,那么可以限定下最相关的预定数量,假设这个数量设定为100,那么在R/4769292and di/+4769292的基础上进一步输入检索命令andtop/100,可以得到与所述目标文献US4769292最相关的在其申请日后公开的100篇文献,而且这100篇文献按照相关度进行了排序。所述100篇文献与目标文献的相关度记为rel’1,rel’2,rel’3,……,rel’100,计算第二相关度平均值,REL(POST)=(rel’1+rel’2+rel’3+……+rel’100)/100。
优选的,所述步骤:根据所述目标文献相关数据集中与所述目标文献的相关度在预定相关度阈值以上的文献的数量计算所述目标文献的价值,如图3所示,具体包括:
S20.设定预定相关度阈值;
S21.获取所述目标文献相关数据集中在所述目标文献的申请日前公开的、与所述目标文献的相关度大于所述相关度阈值的文献,作为第三目标文献相关数据子集;
S22.统计所述第三目标文献相关数据子集中文献的数量,记为X;
S23..获取所述目标文献相关数据集中在所述目标文献的申请日后公开的与所述目标文献的相关度大于所述相关度阈值的文献,作为第四目标文献相关数据子集;
S24.统计所述第四目标文献相关数据子集中文献的数量,记为Y;
S25.根据所述X,Y计算所述目标文献的第二价值。
根据所述X,Y计算所述目标文献的价值,在具体实施时,可考虑分别将X、Y作为所述目标文献的价值因子,也可考虑将Y减去X的差值分别作为所述目标文献的价值因子,价值因子可单独作为目标文献价值评估的评估因素,也可与其他评估因素一起综合对目标文献进行价值评估,最终获得第二价值V2。作为另一种实施方式,还可计算第三目标文献相关数据子集的相关度平均值,记为RX,计算所述第四目标文献相关数据子集中相关度平均值,记为RY;根据所述RX,RY计算所述目标文献的第二价值,或者根据所述X,Y和RX,RY计算所述目标文献的第二价值。
在目标文献的申请日之前申请的相关文献的数量能够反映在目标文献之前技术发的热度,也能说明该技术在之前是否已经充分得到保护,数量越多,平均相关度越高,保护越充分,目标文献的价值越低,而在目标文献的申请日之后申请的相关文献的数量能够反映在目标文献之后技术发的热度,数量越多,平均相关度越高,相似技术越多,后来跟进的越多,目标文献的价值越高。
另外一种计算文献价值的手段是,图4所示,根据所述目标文献相关数据集中各文献的申请日与所述目标文献的申请日之间的差值,计算所述目标文献的价值。图中,X轴表示相关文献的申请日,其中负坐标轴表示在目标文献的申请日前申请的相关文献的申请日apdi(i=1,2,3,…,n),所述目标文献与每篇相关文献的申请日之差记为Ti,Ti=(apd(P)-apd(i))。正坐标轴表示在目标文献的申请日后申请的相关文献的申请日apdj’(j'=1,2,3,…,m),所述目标文献与每篇相关文献的申请日之差记为Tj',Tj'=apd(j')-apd(P)。纵轴表示相关文献与目标文献的相关度。在满足相关度条件下,我们可以找出与目标文献相关的目标文献相关数据集,作为一种具体实施方式,如图5所示,,一种根据利用相关文献和目标文献的申请日之间的差值计算文献价值的方式,具体包括如下步骤:S30.获取所述目标文献相关数据集中在所述目标文献的申请日前公开的文献,作为第五目标文献相关数据子集;S31.计算所述第五目标文献相关数据子集中各文献的申请日与所述目标文件的申请日之间的差值,记为{Ti,i=1,2,3,…,n};S32.获取所述目标文献相关数据集中在所述目标文献的申请日后公开的的文献,作为第六目标文献相关数据子集;S33.计算所述第六目标文献相关数据子集中各文献的申请日与所述目标文件的申请日的差值,记为{Ti’,j'=1,2,2,…,m};S34.根据所述{Ti,i=1,2,3,…,n},{Tj’,j'=1,2,3,…,m}计算所述目标文献的第三价值。可分别将所有Ti的总和的平均值Tprior/n、Tj’的总和平均值Tpost/m作为所述目标文献的价值因子,也可考虑将Tpost/n与Tprior/m的差值作为所述目标文献的价值因子,价值因子可单独作为目标文献价值评估的评估因素,根据价值因子计算第三价值V3。本发明认为Tpost/m-Tprior/n可反映目标文献的市场贡献量。
其中Ti是目标文献申请日与第五目标文献相关数据子集中第i篇文献的申请日间的差;Tj’是第六目标文献相关数据子集中第j'篇文献的申请日与目标文献申请日间的差;Tprior=a1*T1+a2*T2+...+an*Tn;Tpost=b1*T1'+b2*T2'+...+bm*Tm',其中,系数可以是a1=a2=...=an=1/n;b1=b2=...=bm=1/m,也可以根据所述第i篇文献与所述目标文献的相关度对应确定Ti系数ai,根据所述第j'篇文献与所述目标文献的相关度对应确定Tj’的系数bj,即相关度越高,对应的系数越大,从而加大了相关度高的文献在价值计算上的权重,有利于更可观的计算出目标文献的价值。这样,综合考虑目标文献创造性的数值和目标文献的市场容量,目标文献的价值计算就更加全面。
为了获取准确的目标文献的价值,最优选的方式是从多维度考虑,多方面综合评价目标文献的价值,本发明还披露,Tprior/n+Tpost/m与目标文献的相关市场容量有关系,在计算所述第三价值时还可将Tprior/n+Tpost/m作为价值因子进行考虑。
本发明挖掘到了目标文献相关数据集中与所述目标文献最相关的预定数量的文献与所述目标文献的相关度、目标文献相关数据集中与所述目标文献的相关度在预定相关度阈值以上的文献数量、目标文献相关数据集中各文献的申请日与所述目标文献的申请日之间的差值在目标文献的价值上的体现,从多种角度或方面文献价值计算的手段,能够实现多维度的、客观的文献价值评估,这对于文献价值的评估领域无疑会带来极大的飞跃。
上述三种计算目标文献的价值的方法均可单独适用,也可结合使用,即根据V1(P),V2(P),V3(P)进一步计算目标文献的最终价值,可采用线性算法V(P)=α*V1(P)+β*V2(P)+γ*V3(P)+f(P),其中α为V1(P)的加权因子,β为V2(P)的加权因子,γ为V3的加权因子,f(P)为需要考虑的其他因素,比如目标文献所属人或者法人的规模、市场地位、专利数量、竞争潜力等其他因素。V1(P),V2(P),V3(P)在不同的角度反映目标文献的价值,具体来说,V1(P)从相关度上,V2(P)从数量上,V3(P)从时间跨度上,f(P)从现实因素等不同的角度上反映目标文献的价值,作为一个优选的方式,也可将V1(P),V2(P),V3(P)带入价值函数模型V(P)=F(V1(P),V2(P),V3(P),f(P))计算目标文献的最终价值。
作为本发明的创新之处,本发明发现了目标文献申请日前后的相关文献在文献价值计算上的不同体现,继而提出了利用目标文献申请日前后的相关文献计算文献价值的方式,具体有如下三种不同维度的方式或手段(当然也可只利用其中一种方式或者手段):
1、获取所述目标文献相关数据集中在所述目标文献的申请日前公开的与所述目标文献最相关的第一预定数量的文献,作为第一目标文献相关数据子集,计算所述第一目标文献相关数据子集中文献的相关度平均值,作为第一相关度平均值;获取所述目标文献相关数据集中在所述目标文献的申请日后公开的与所述目标文献最相关的第二预定数量的文献,作为第二目标文献相关数据子集,计算所述第二目标文献相关数据子集中文献的相关度平均值,作为第二相关度平均值;根据所述第一相关度平均值和/或第二相关度平均值计算所述目标文献的价值。
目标文献申请日前的相关文献与所述目标文献的相关度越高,能说明书目标文献之前已经有很相关的技术,如果与预定数量的申请日前的相关文献的平均相关度高,能说明目标文献之前非常相关的技术已经得到充分保护,目标文献价值偏低,这无疑是非常客观的判断目标文献的技术价值的方式。而目标文献申请日后的预定数量相关文献与所述目标文献的相关度越高,能说明目标文献之后有很多与目标文献相关的技术追随者,也能反映目标文献引发了后面一系列的创新与改进,如此目标文献很有可能就是核心技术或者领先技术,目标文献价值很高,这无疑是非常客观的判断目标文献的技术价值的方式。由此,不难发现,同样是相关度这个数据,申请日前后的不同对文献价值的判断在方向上是相反的,本发明提出目标文献申请日前这个分水岭,能够有助于更加准确的计算目标文献的价值。
2、获取所述目标文献相关数据集中在所述目标文献的申请日前公开的、与所述目标文献的相关度大于所述相关度阈值的文献,作为第三目标文献相关数据子集,并统计所述第三目标文献相关数据子集中文献的数量,记为X;获取所述目标文献相关数据集中在所述目标文献的申请日后公开的与所述目标文献的相关度大于所述相关度阈值的文献,作为第四目标文献相关数据子集,计算所述第四目标文献相关数据子集中文献的数量,记为Y;根据所述X,Y计算所述目标文献的价值。
作为另一种实施方式,还可计算第三目标文献相关数据子集的相关度平均值,记为RX,计算所述第四目标文献相关数据子集中相关度平均值,记为RY;根据所述RX,RY计算所述目标文献的第二价值,或者根据所述X,Y和RX,RY计算所述目标文献的第二价值。
目标文献申请日前与所述目标文献相关的文献数量越多,能说明目标文献之前已经有很多相关的技术,如果申请日前在预定相关度以上的相关文献的数量很高,能说明目标文献之前非常相关的很多技术方案已经得到充分保护,目标文献价值偏低;平均相关度越高,目标文献的创新性越低,这无疑是非常客观的判断目标文献的技术价值的方式。而目标文献申请日后的相关文献的数量很高,能说明目标文献之后有很多相关技术的追随者,也能反映目标文献引发了后面一系列的创新与改进,如此目标文献很有可能就是核心技术或者领先技术,目标文献价值很高;平均相关度越高,目标文献的跟进现象越明显,热度越高,目标文献价值越高,这无疑是非常客观的判断目标文献的技术价值的方式。
3、获取所述目标文献相关数据集中在所述目标文献的申请日前公开的文献,作为第五目标文献相关数据子集,计算所述第五目标文献相关数据子集中各文献的申请日与所述目标文件的申请日之间的差值,记为{Ti,i=1,2,3,…,n};获取所述目标文献相关数据集中在所述目标文献的申请日后公开的的文献,作为第六目标文献相关数据子集;计算所述第六目标文献相关数据子集中各文献的申请日与所述目标文件的申请日的差值,记为{Tj’,j'=1,2,3,…,m};根据所述{Ti,i=1,2,3,…,n},{Tj’,j'=1,2,3,…,m}计算所述目标文献的价值。在第1、2种方式中已经将申请日前后这个因素充分引入价值计算的过程中,而且充分的考虑相关程度和相关的数量两维因素。在第3种方式中,更进一步的,将目标文献与目标文献申请日前相关文献的申请时间差以及将目标文献申请日后相关文献与目标文献的申请时间差引入价值计算的过程。相关文献在目标文献之前申请的时间越久,说明目标文献的落后度越高,目标文献的价值越低;而相关文献在目标文献之后申请的时间越久,说明目标文献的领先度越高,目标文献的价值越高。
在上述3种方式中,考虑到价值计算的基准,对于相关文献的相关度可以按照价值判断标准进行设定。关于所述价值计算,不同的技术领域的目标文献需要考虑目标文献所归属的技术分支在目标文献申请时发展的状况,因此如何选择一个价值参考基准是需要考虑的问题。作为解决此问题的一个技术手段。首先选择出一篇参考文献,用前面所述的计算目标文献的价值计算过程来计算所述参考文献的价值作为参考价值(即价值基准)。作为解决此问题的另一个技术手段,选择出一组参考文献,然后利用前面所述的计算目标文献的价值计算过程来计算出所述每篇参考文献的价值,然后将每篇参考文献的价值相加取平均,将平均值作为参考价值(即价值基准)。具体来说,所述参考文献、参考文献组可为在目标文献的申请时间段申请的所述目标文献所属分类号下的其它文献或文献组、或在目标文献的申请时间段申请的与所述目标文献最相关的其它文献或文献组。计算参考价值的具体步骤可包括:计算参考文献的第一价值,作为第一参考价值V1r、计算参考文献的第二价值,作为第二参考价值V2r和/或计算参考文献的第三价值,作为第三参考价值V3r;或计算参考文献组中每篇参考文献的第一价值的平均值,作为第一参考价值V1r;或,计算参考文献组中每篇参考文献的第二价值的平均值,作为第二参考价值V2r;或,计算参考文献组中每篇参考文献的第三价值的平均值,作为第三参考价值V3r。根据所述第一价值和第一参考价值、第二价值和第二参考价值和/或第三价值和第三参考价值对比评估所述目标文献的价值。例如,目标文献的价值可以表示为线性函数,V(P)=α*(V1(P)-V1r)+β*(V2(P)-V2r)+γ*(V3(P)-V3r)+f(P),其中,α、β、γ为加权系数,f(P)为需要考虑的其他因素,比如目标文献所属人或者法人的规模、市场地位、专利数量、竞争潜力等其他因素。目标函数价值也可以是其它非线性函数。本发明通过提出引入参考价值来评估目标文献的价值,充分考虑了目标文献所属领域的价值基准的因素。举例来说,通过上述目标文献的第一价值、第二价值、第三价值的计算方法,一件计算机领域计算机程序相关发明专利文献作为目标文献,其第一价值、第二价值和第三价值很可能与一件冰箱领域内的压缩机相关发明专利文献作为目标文献第一价值、第二价值和第三价值不一定具有可比性,这是因为领域不同,竞争激烈程度(用相关度表示)不同。通过引入参考价值可以消去不同技术领域间的目标文献偏差,从而使得通过本发明的提出的价值获取方法计算出的价值不局限于相同领域内目标文献价值之间的比较,能够反映出不同领域内目标文献的真实价值差异。上述内容只是提供一种方式,本发明并不局限于此种方式,只要是考虑文献所属领域或者行业具体情况进行基准价值的计算或者设定的方式均涵盖本发明的技术方案范围内。
本发明可建立上述多维度价值因素的价值计算模型,从而从多维度考虑,综合确定目标文献的最终价值,从而评估出目标文献的实际价值,为日渐活跃的专利交易市场提供有力的技术支撑。
本发明披露的对目标文献进行价值计算,其中目标文献的选取可以是任意文献。很多时候,需要挖掘目标文献,但在浩如烟海的专利数据中寻求到有价值的专利实属不易,在现有技术中,很多还是通过布尔算符进行限制性检索获得一定量的文献后,进行人工筛选,这不免在很大程度上加入很多的主观因素和个人的局限性因素,无法保证检索结果的可控性。本发明在发掘目标文献或者有价值文献上也提出了新的方式,即在根据限制性检索条件对数据库进行检索生成第一检索结果数据集后,基于所述第一检索结果数据集利用引用逻辑或者被引用逻辑获取目标文献。
可选的,基于所述第一检索结果数据集利用引用逻辑或者被引用逻辑获取目标文献,具体包括:
根据引用逻辑变换检索请求,获取第一检索数据集中的文献引用的其他文献构成的第二检索结果数据集;
统计所述第二检索结果数据集中每篇文献被所述第一检索结果数据集中的多少篇文献引用,记为N1Cited,并按照所述N1Cited对所述第二检索结果数据集中的文献进行第一排序;
根据第一排序结果选择目标文献。
作为一种具体实施方式,通过输入检索式aclm/oled and db/us,查找权利要求中包含有关键词oled的美国专利文献A(8924篇专利文献),在此基础上,继续输入andg/cited-d,即通过引用逻辑可查找到所述8924篇美国专利文献引用的文献构成的检索结果B,同时在显示检索结果B的列表中显示出B中每篇文献被A中的多少篇文献引用,而且按照被引用的篇数对检索结果B中的文献进行排序显示。选择被引用篇数多的文献作为目标文献。前面提到的文献US4769292就是检索结果B中排序第一的专利文献,该文献也是本技术领域公认的核心专利。我们通过大数据分析发现,一般来说,被引用次数多的文献很可能就是重要专利、核心专利或者基础专利。这些专利很有可能是专利交易的对象或者被关注的对象,本发明在找到这样的专利文献作为目标文献,再进一步利用前面所述的价值计算方法计算其价值。
可选的,基于所述第一检索结果数据集利用引用逻辑或者被引用逻辑获取目标文献,具体包括:
统计所述第一检索结果数据集中每篇文献被引用的次数,记为N2Cited,并按照所述N2Cited对所述第一检索结果数据集中的文献进行第二排序;
根据第二排序结果选择目标文献。具体的实施方式已经包括在前面的内容中,在此不再赘述。
可选的,所述步骤:从所述第一检索结果数据集获取目标文献,包括:
根据被引用逻辑变换检索请求,获取引用第一检索结果数据集中文献的其他文献构成的第三检索结果数据集;
统计所述第三检索结果数据集中每篇文献被引用的次数,记为N3Cited,并按照所述N3Cited对所述第三检索结果数据集中的文献进行第三排序;
根据第三排序结果选择目标文献。
可选的,所述步骤:根据排序结果选择目标文献,具体包括:
选择N1Cited、N2Cited或N3Cited最大的文献作为目标文献,
和/或,
选择N1Cited、N2Cited或N3Cited最靠前的数篇文献作为目标文献。
通过利用本发明提供的方法,不仅能够客观地计算出目标文献的价值,而且在提供一种查找有价值专利的方法,为专利运营提供了技术支撑。
通过上面的内容,根据相关文献与目标文献的相关度可以计算出文献的价值值。同时,引发了一个问题,那就是什么样的值能说明目标文献的价值大?下面给出关于这个问题的一种解决方式。获取目标文献的分类号以及申请时间;根据所述分类号和申请时间获取在所述申请时间申请的所述分类号下的文献;选取所述文献中与所述目标文献最相关的预定数量的文献m;计算所述文献m与目标文献的相关度的平均值,作为RELref;根据所述计算的目标文献的价值和所述RELref1评估所述目标文献的实际价值。作为另外一种方式,还可设定第二相关度阈值,选取所述文献中与所述目标文献的相关度大于所述第二相关度阈值的文献数量,记为RELref2,根据所述计算的目标文献的价值和所述RELref2评估所述目标文献的实际价值。如果前面计算出的价值与该参考值相差不大,则说明目标文献不具有突出的价值,如果具有一定差距,根据差距的级别可判断出目标文献的价值大小。
作为一个具体实施例,目标文献是美国文献US4769292,该文献的美国分类号为428/690,其申请时间是1987年10月,输入检索命令ccl/428/690and apd/198710,得到1987年10月申请的428/690分类号下的所有文献,计算这些文献或者其中与目标文献最相关的预定数量的文献的相关平度均值作为价值参考值RELref.根据该价值参考值以及前面计算的目标文献的价值评估目标文献的实际价值。
本发明还提供一种文献价值获取装置,该装置包括:
语义检索单元,用于根据目标文献进行语义检索,获取与所述目标文献相关的目标文献相关数据集;文献价值计算单元,用于根据所述目标文献相关数据集中与所述目标文献最相关的预定数量的文献与所述目标文献的相关度,和/或所述目标文献相关数据集中与所述目标文献的相关度在预定相关度阈值以上的文献数量计算所述目标文献的价值。
所述装置可以是终端设备,也可以安装在终端设备上的客户端,也可以是基于计算机程序的功能模块架构,即所述各单元可通过软件或者硬件结合软件的方式来实现。所述终端设备包括具有数据计算、统计能力或数据匹配等信息处理能力的处理器。作为一种具体实施方式,装置还包括:限制性检索单元,用于根据限制性检索请求进行检索,获取第一检索结果数据集;目标文献推送单元,用于从所述第一检索结果数据集利用引用逻辑或者被引用逻辑获取目标文献。
作为几种不同的实施方式的一种,所述目标文献推送单元包括:引用逻辑变换检索子单元,用于根据引用逻辑变换检索请求,获取第一检索数据集中的文献引用的其他文献构成的第二检索结果数据集;第一被引用统计子单元,统计所述第二检索结果数据集中每篇文献被所述第一检索结果数据集中的多少篇文献引用,记为N1Cited,并按照所述N1Cited对所述第二检索结果数据集中的文献进行第一排序;第一目标文献选择子单元,用于根据第一排序结果选择目标文献。
作为几种不同的实施方式的另一种,所述目标文献推送单元可包括:
第二被引用统计子单元,用于统计所述第一检索结果数据集中每篇文献被引用的次数,记为N2Cited,并按照所述N2Cited对所述第一检索结果数据集中的文献进行第二排序;第二目标文献选择子单元,用于根据第二排序结果选择目标文献。
在第三种实施方式中,所述目标文献推送单元包括:被引用逻辑变换检索子单元,用于根据被引用逻辑变换检索请求,获取引用第一检索结果数据集中文献的其他文献构成的第三检索结果数据集;第三被引用统计子单元,用于统计所述第三检索结果数据集中每篇文献被引用的次数,记为N3Cited,并按照所述N3Cited对所述第三检索结果数据集中的文献进行第三排序;
第三目标文献选择子单元,用于根据第三排序结果选择目标文献。
优选的,所述第一目标文献选择子单元、第二目标文献选择子单元或第三目标文献选择子单元具体用于选择N1Cited、N2Cited或N3Cited最大的文献作为目标文献,和/或,选择N1Cited、N2Cited或N3Cited最靠前的数篇文献作为目标文献。
如图6所示,所述文献价值计算单元具体包括:第一子集获取子单元101,用于获取所述目标文献相关数据集中在所述目标文献的申请日前公开的与所述目标文献最相关的文献,作为第一目标文献相关数据子集;第一相关度平均值计算子单元102,用于计算所述第一目标文献相关数据子集中文献的相关度平均值,作为第一相关度平均值;第二子集获取子单元103,用于获取所述目标文献相关数据集中在所述目标文献的申请日后公开的与所述目标文献最相关的第二预定数量的文献,作为第二目标文献相关数据子集;第二相关度平均值计算子单元104,用于计算所述第一目标文献相关数据子集中文献的相关度平均值,作为第二相关度平均值;第一价值计算子单元105,根据所述第一相关度平均值和/或第二相关度平均值计算所述目标文献的第一价值。作为一种具体方式,可选的,所述第一价值计算子单元将所述第二相关度平均值减去所述第一相关度平均值的差值作为所述目标文献的价值因子,当然可也将第一相关度平均值、第二相关度平均值分别作为价值因子。
作为另一种实施方式,如图7所示,所述文献价值计算单元具体包括:
阈值设定子单元201,用于设定预定相关度阈值;第三目标文献相关数据子集获取子单元202,用于获取所述目标文献相关数据集中在所述目标文献的申请日前公开的、与所述目标文献的相关度大于所述相关度阈值的文献,作为第三目标文献相关数据子集;第一统计子单元203,用于统计所述第三目标文献相关数据子集中文献的数量,记为X;第四目标文献相关数据子集获取子单元204,用于获取所述目标文献相关数据集中在所述目标文献的申请日后公开的、与所述目标文献的相关度大于所述相关度阈值的文献,作为第四目标文献相关数据子集;第二统计子单元205,用于统计所述第四目标文献相关数据子集中文献的数量,记为Y;第二价值计算子单元206,用于根据所述X,Y计算所述目标文献的第二价值。作为具体的手段,可将Y与X的差值作为价值因子,也可将分别将X、Y作为价值因子。作为另一种实施方式,还可计算第三目标文献相关数据子集的相关度平均值,记为RX,计算所述第四目标文献相关数据子集中相关度平均值,记为RY;根据所述RX,RY计算所述目标文献的第二价值,或者根据所述X,Y和RX,RY计算所述目标文献的第二价值。
作为另一实现,所述文献价值计算单元具体还可包括:第五目标文献相关数据子集子单元301,用于获取所述目标文献相关数据集中在所述目标文献的申请日前公开的文献,作为第五目标文献相关数据子集,第一申请日差值计算子单元302,计算所述第五目标文献相关数据子集中各文献的申请日与所述目标文件的申请日之间的差值,记为{Ti,i=1,2,3,…,n};第六目标文献相关数据子集获取子单元303,用于获取所述目标文献相关数据集中在所述目标文献的申请日后公开的的文献,作为第六目标文献相关数据子集;第二申请日差值计算子单元304,用于计算所述第六目标文献相关数据子集中各文献的申请日与所述目标文件的申请日的差值,记为{Tj’,j'=1,2,3,…,m};第三价值计算子单元305,用于根据所述{Ti,i=1,2,3,…,n},{Tj’,j'=1,2,3,…,m}计算所述目标文献的第三价值。作为具体的手段,可将{Ti,i=1,2,3,…,n}的平均值与{Tj’,j'=1,2,3,…,m}的平均值的差值作为价值因子,也可将分别将{Ti,i=1,2,3,…,n}的平均值、{Ti’,j'=1,2,3,…,m}的平均值作为价值因子,其中n,m为自然数。可分别将所有Ti的总和Tprior/n、Ti’的总和Tpost/m作为所述目标文献的价值因子,也可考虑将Tpost/n与Tprior/m的差值作为所述目标文献的价值因子,价值因子可单独作为目标文献价值评估的评估因素,根据价值因子计算第三价值V3。本发明认为Tpost/m-Tprior/n可反映目标文献的市场贡献量。其中Ti是目标文献申请日与第五目标文献相关数据子集中第i篇文献的申请日间的差;Tj’是第六目标文献相关数据子集中第j篇文献的申请日与目标文献申请日间的差;
Tprior=a1*T1+a2*T2+...+an*Tn;Tpost=b1*T1'+b2*T2'+...+bm*Tm',其中,系数可以是a1=a2=...=am=1/n;b1=b2=...=bn=1/m,也可以根据所述第i篇文献与所述目标文献的相关度对应确定Ti系数ai,根据所述第j'篇文献与所述目标文献的相关度对应确定Tj’的系数bj,即相关度越高,对应的系数越大,从而加大了相关度高的文献在价值计算上的权重,有利于更可观的计算出目标文献的价值。
本发明还披露,Tprior/n+Tpost/m与目标文献的相关市场容量有关系,在计算所述第三价值时还可将Tprior/n+Tpost/m作为价值因子进行考虑。
为了获取准确的目标文献的价值,最优选的方式是从多维度考虑,多方面综合评价目标文献的价值,当然只利用单方面的价值计算也可解决本发明提到的客观获取目标文献价值的技术问题。
不同的技术领域的目标文献需要考虑目标文献所归属的技术分支在目标文献申请时段内发展的状况。作为一种具体实施方式,所述第一文献价值计算子单元,还用于计算参考文献的第一价值,或计算参考文献组中每篇参考文献的第一价值的平均值,作为第一参考价值V1r;所述第二文献价值计算子单元还用于计算参考文献的第二价值,或计算参考文献组中每篇参考文献的第二价值的平均值,作为第二参考价值V2r;所述第三文献价值计算子单元还用于计算参考文献的第三价值,或计算参考文献组中每篇参考文献的第三价值的平均值,作为第三参考价值V3r;所述参考文献、参考文献组为在目标文献的申请时间段申请的所述目标文献所属分类号下的其它文献或文献组、或在目标文献的申请时间段申请的与所述目标文献最相关的其它文献或文献组;
价值对比评估单元,用于根据所述第一价值和第一参考价值、第二价值和第二参考价值和/或第三价值和第三参考价值对比评估所述目标文献的价值。
这只是提供一种具体实现方式,本发明并不局限于此种方式,只要是考虑文献所属领域或者行业具体情况进行预定参考价值或预定价值的设定的方式均落入本发明的保护范围内。
所述价值获取装置还可包括:价值对比评估单元,根据所述第一价值和第一参考价值、第二价值和第二参考价值和/或第三价值和第三参考价值,对比评估所述目标文献的价值。例如,目标文献的价值可以通过线性函数计算器计算,V(P)=α*(V1(P)-V1r)+β*(V2(P)-V2r)+γ*(V3(P)-V3r)+f(P),其中,α、β、γ为加权系数,f(P)为需要考虑的其他因素,比如目标文献所属人或者法人的规模、市场地位、专利数量、竞争潜力,产品所处阶段(比如预研、研发、生产样品、测试、上市、销售)等其他因素。目标函数价值也可以通过其它非线性函数计算器计算。本发明提出的文献价值评估单元除了依据上述三种价值以及与所述三种价值相应的参考价值还可结合其他的价值因素进行综合价值评估。
通过采用本发明所公开的文献价值获取方法和装置,利用在前和在后公开的文献与目标文献之间的相关度能够客观的计算出目标文献的价值,为专利交易提供了有效技术支撑。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。比如目标文献的获取并不局限在利用引用逻辑或者被引用逻辑,还可以是限制性检索、人工筛选或者其他转换检索手段等等。转换手段的选择也不局限在利用引用逻辑、同族逻辑、不同版本号逻辑等等。文献价值的计算也不仅仅限于上述提到的三种主要方式,其他利用文献相关度、相关文献的数量以及申请时间跨度来计算文献价值的方式均属于本发明的构思范围内。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
Claims (18)
1.一种文献价值获取方法,其特征在于,该方法包括如下步骤:
根据目标文献进行语义检索,获取与所述目标文献相关的目标文献相关数据集;
根据所述目标文献相关数据集中与所述目标文献最相关的预定数量的文献与所述目标文献的相关度,和/或所述目标文献相关数据集中与所述目标文献的相关度在预定相关度阈值以上的相关度,和/或所述目标文献相关数据集中各文献的申请日与所述目标文献的申请日之间的差值,计算所述目标文献的价值;
根据所述目标文献相关数据集中与所述目标文献最相关的预定数量的文献与所述目标文献的相关度计算所述目标文献的价值,具体包括:
获取所述目标文献相关数据集中在所述目标文献的申请日前公开的与所述目标文献最相关的第一预定数量的文献,作为第一目标文献相关数据子集,计算所述第一目标文献相关数据子集中文献的相关度平均值,作为第一相关度平均值;
获取所述目标文献相关数据集中在所述目标文献的申请日后公开的与所述目标文献最相关的第二预定数量的文献,作为第二目标文献相关数据子集,计算所述第二目标文献相关数据子集中文献的相关度平均值,作为第二相关度平均值;
根据所述第一相关度平均值和/或第二相关度平均值计算所述目标文献第一价值;
根据所述目标文献相关数据集中与所述目标文献的相关度在预定相关度阈值以上的文献的数量计算所述目标文献的价值,具体包括:设定预定相关度阈值;
获取所述目标文献相关数据集中在所述目标文献的申请日前公开的与所述目标文献的相关度大于所述预定相关度阈值的文献,作为第三目标文献相关数据子集,并统计所述第三目标文献相关数据子集中文献的数量,记为X,和/或计算第三目标文献相关数据子集的相关度平均值,记为RX;
获取所述目标文献相关数据集中在所述目标文献的申请日后公开的与所述目标文献的相关度大于所述预定相关度阈值的文献,作为第四目标文献相关数据子集,并统计所述第四目标文献相关数据子集中文献的数量,记为Y,和/或计算第四目标文献相关数据子集的相关度平均值,记为RY;
根据所述X,Y,和/或RX,RY计算所述目标文献的第二价值;
根据所述目标文献相关数据集中各文献的申请日与所述目标文献的申请日之间的差值,计算所述目标文献的价值还包括如下步骤:
获取所述目标文献相关数据集中在所述目标文献的申请日前公开的文献,作为第五目标文献相关数据子集,
计算所述第五目标文献相关数据子集中各文献的申请日与所述目标文献的申请日之间的差值,记为{Ti,i=1,2,3,…,n};
获取所述目标文献相关数据集中在所述目标文献的申请日后公开的文献,作为第六目标文献相关数据子集;
计算所述第六目标文献相关数据子集中各文献的申请日与所述目标文献的申请日的差值,记为{Tj’,j'=1,2,3,…,m};
根据所述{Ti,i=1,2,3,…,n},{Tj’,j'=1,2,3,…,m}计算所述目标文献的第三价值。
2.根据权利要求1所述的文献价值获取方法,其特征还在于,
所述方法包括步骤:
根据限制性检索条件对数据库进行检索生成第一检索结果数据集;
基于所述第一检索结果数据集利用引用逻辑或者被引用逻辑获取目标文献。
3.根据权利要求2所述的文献价值获取方法,其特征还在于,基于所述第一检索结果数据集利用引用逻辑或者被引用逻辑获取目标文献,具体包括:
根据引用逻辑变换检索请求,获取第一检索结果数据集中的文献引用的其他文献构成的第二检索结果数据集;
统计所述第二检索结果数据集中每篇文献被所述第一检索结果数据集中的多少篇文献引用,记为N1Cited,并按照所述N1Cited对所述第二检索结果数据集中的文献进行第一排序;
根据第一排序结果选择目标文献。
4.根据权利要求2所述的文献价值获取方法,其特征还在于,基于所述第一检索结果数据集利用引用逻辑或者被引用逻辑获取目标文献,具体包括:
统计所述第一检索结果数据集中每篇文献被引用的次数,记为N2Cited,并按照所述N2Cited对所述第一检索结果数据集中的文献进行第二排序;
根据第二排序结果选择目标文献。
5.根据权利要求2所述的文献价值获取方法,其特征还在于,所述步骤:从所述第一检索结果数据集获取目标文献,包括:
根据被引用逻辑变换检索请求,获取引用第一检索结果数据集中的其他文献构成的第三检索结果数据集;
统计所述第三检索结果数据集中每篇文献被引用的次数,记为N3Cited,并按照所述N3Cited对所述第三检索结果数据集中的文献进行第三排序;
根据第三排序结果选择目标文献。
6.根据权利要求3-5任一项所述的文献价值获取方法,其特征还在于,所述步骤:根据排序结果选择目标文献,具体包括:选择N1Cited、N2Cited或N3Cited最大的文献作为目标文献,和/或,选择N1Cited、N2Cited或N3Cited最靠前的数篇文献作为目标文献。
7.根据权利要求1所述的文献价值获取方法,所述第五目标文献相关数据子集、第六目标文献相关数据子集中的文献是预定数量的文献或者与所述目标文献具有预定相关度以上的文献。
8.根据权利要求1所述的文献价值获取方法,该方法还包括:根据所述第一价值、第二价值和/或第三价值评估所述目标文献的价值。
9.根据权利要求1所述的文献价值获取方法,其特征还在于,该方法还包括:计算参考文献的第一价值,作为第一参考价值;或,计算参考文献的第二价值,作为第二参考价值;或,计算参考文献的第三价值,作为第三参考价值;或计算参考文献组中每篇参考文献的第一价值的平均值,作为第一参考价值;或,计算参考文献组中每篇参考文献的第二价值的平均值,作为第二参考价值;或,计算参考文献组中每篇参考文献的第三价值的平均值,作为第三参考价值;所述参考文献、参考文献组为在目标文献的申请时间段申请的所述目标文献所属分类号下的其它文献或文献组、或在目标文献的申请时间段申请的与所述目标文献最相关的其它文献或文献组;根据所述第一价值和第一参考价值、第二价值和第二参考价值和/或第三价值和第三参考价值,对比评估所述目标文献的价值。
10.一种文献价值获取装置,其特征在于,该装置包括:
语义检索单元,用于根据目标文献进行语义检索,获取与所述目标文献相关的目标文献相关数据集;
文献价值计算单元,用于根据所述目标文献相关数据集中与所述目标文献最相关的预定数量的文献与所述目标文献的相关度,和/或所述目标文献相关数据集中与所述目标文献的相关度在预定相关度阈值以上的相关度,和/或所述目标文献相关数据集中各文献的申请日与所述目标文献的申请日之间的差值,计算所述目标文献的价值;
其中,所述文献价值计算单元根据所述目标文献相关数据集中与所述目标文献最相关的预定数量的文献与所述目标文献的相关度计算所述目标文献的价值,所述文献价值计算单元具体包括:
第一子集获取子单元,用于获取所述目标文献相关数据集中在所述目标文献的申请日前公开的与所述目标文献最相关的第一预定数量的文献,作为第一目标文献相关数据子集;
第一相关度平均值计算子单元,用于计算所述第一目标文献相关数据子集中文献的相关度平均值,作为第一相关度平均值;
第二子集获取子单元,用于获取所述目标文献相关数据集中在所述目标文献的申请日后公开的与所述目标文献最相关的第二预定数量的文献,作为第二目标文献相关数据子集;
第二相关度平均值计算子单元,用于计算所述第二目标文献相关数据子集中文献的相关度平均值,作为第二相关度平均值;
第一价值计算子单元,根据所述第一相关度平均值和/或第二相关度平均值计算所述目标文献的第一价值;
其中,所述文献价值计算单元根据所述目标文献相关数据集中与所述目标文献的相关度在预定相关度阈值以上的相关度计算所述目标文献的价值,所述文献价值计算单元具体包括:
阈值设定子单元,用于设定预定相关度阈值;
第三目标文献相关数据子集获取子单元,用于获取所述目标文献相关数据集中在所述目标文献的申请日前公开的、与所述目标文献的相关度大于所述预定相关度阈值的文献,作为第三目标文献相关数据子集;
第一统计子单元,用于统计所述第三目标文献相关数据子集中文献的数量,记为X,和/或计算第三目标文献相关数据子集的相关度平均值,记为RX;
第四目标文献相关数据子集获取子单元,用于获取所述目标文献相关数据集中在所述目标文献的申请日后公开的、与所述目标文献的相关度大于所述预定相关度阈值的文献,作为第四目标文献相关数据子集;
第二统计子单元,用于统计所述第四目标文献相关数据子集中文献的数量,记为Y,和/或计算第四目标文献相关数据子集的相关度均值,记为RY;
第二文献价值计算子单元,用于根据所述X,Y和/或RX,RY计算所述目标文献的第二价值;
其中,所述文献价值计算单元根据所述目标文献相关数据集中各文献的申请日与所述目标文献的申请日之间的差值计算所述目标文献的价值,所述文献价值计算单元具体包括:
第五目标文献相关数据子集获取子单元,用于获取所述目标文献相关数据集中在所述目标文献的申请日前公开的文献,作为第五目标文献相关数据子集,
第一申请日差值计算子单元,计算所述第五目标文献相关数据子集中各文献的申请日与所述目标文献的申请日之间的差值,记为{Ti,i=1,2,3,…,n};
第六目标文献相关数据子集获取子单元,用于获取所述目标文献相关数据集中在所述目标文献的申请日后公开的的文献,作为第六目标文献相关数据子集;
第二申请日差值计算子单元,用于计算所述第六目标文献相关数据子集中各文献的申请日与所述目标文献的申请日的差值,记为{Tj’,j'=1,2,3,…,m};
第三文献价值计算子单元,用于根据所述{Ti,i=1,2,3,…,n},{Tj’,j'=1,2,3,…,m}计算所述目标文献的第三价值。
11.根据权利要求10所述的文献价值获取装置,该装置还包括:限制性检索单元,用于根据限制性检索请求进行检索,获取第一检索结果数据集;
目标文献推送单元,用于从所述第一检索结果数据集利用引用逻辑或者被引用逻辑获取目标文献。
12.根据权利要求11所述的文献价值获取装置,其特征还在于,所述目标文献推送单元包括:
引用逻辑变换检索子单元,用于根据引用逻辑变换检索请求,获取第一检索结果数据集中的文献引用的其他文献构成的第二检索结果数据集;
第一被引用统计子单元,统计所述第二检索结果数据集中每篇文献被所述第一检索结果数据集中的多少篇文献引用,记为N1Cited,并按照所述N1Cited对所述第二检索结果数据集中的文献进行第一排序;
第一目标文献选择子单元,用于根据第一排序结果选择目标文献。
13.根据权利要求11所述的文献价值获取装置,其特征还在于,所述目标文献推送单元包括:
第二被引用统计子单元,用于统计所述第一检索结果数据集中每篇文献被引用的次数,记为N2Cited,并按照所述N2Cited对所述第一检索结果数据集中的文献进行第二排序;
第二目标文献选择子单元,用于根据第二排序结果选择目标文献。
14.根据权利要求11所述的文献价值获取装置,其特征还在于,所述目标文献推送单元包括:
被引用逻辑变换检索子单元,用于根据被引用逻辑变换检索请求,获取引用第一检索结果数据集中文献的其他文献构成的第三检索结果数据集;
第三被引用统计子单元,用于统计所述第三检索结果数据集中每篇文献被引用的次数,记为N3Cited,并按照所述N3Cited对所述第三检索结果数据集中的文献进行第三排序;
第三目标文献选择子单元,用于根据第三排序结果选择目标文献。
15.根据权利要求12-14任一项所述的文献价值获取装置,其特征还在于,所述第一目标文献选择子单元、第二目标文献选择子单元或第三目标文献选择子单元具体用于选择N1Cited、N2Cited或N3Cited最大的文献作为目标文献,和/或,选择N1Cited、N2Cited或N3Cited最靠前的数篇文献作为目标文献。
16.根据权利要求10所述的文献价值获取装置,所述第五目标文献相关数据子集、第六目标文献相关数据子集中的文献是预定数量的文献或者与所述目标文献具有预定相关度以上的文献。
17.根据权利要求10所述的文献价值获取装置,该装置还包括价值评估子单元,根据所述第一价值、第二价值和/或第三价值评估所述目标文献的价值。
18.根据权利要求10所述的文献价值获取装置,所述第一价值计算子单元,还用于计算参考文献的第一价值,或计算参考文献组中每篇参考文献的第一价值的平均值,作为第一参考价值;所述第二文献价值计算子单元还用于计算参考文献的第二价值,或计算参考文献组中每篇参考文献的第二价值的平均值,作为第二参考价值;所述第三文献价值计算子单元还用于计算参考文献的第三价值,或计算参考文献组中每篇参考文献的第三价值的平均值,作为第三参考价值;所述参考文献、参考文献组为在目标文献的申请时间段申请的所述目标文献所属分类号下的其它文献或文献组、或在目标文献的申请时间段申请的与所述目标文献最相关的其它文献或文献组;
价值对比评估单元,用于根据所述第一价值和第一参考价值、第二价值和第二参考价值和/或第三价值和第三参考价值对比评估所述目标文献的价值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511004803.5A CN106933815B (zh) | 2015-12-29 | 2015-12-29 | 文献价值获取方法与装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511004803.5A CN106933815B (zh) | 2015-12-29 | 2015-12-29 | 文献价值获取方法与装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106933815A CN106933815A (zh) | 2017-07-07 |
CN106933815B true CN106933815B (zh) | 2021-02-05 |
Family
ID=59458411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201511004803.5A Active CN106933815B (zh) | 2015-12-29 | 2015-12-29 | 文献价值获取方法与装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106933815B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110175774A (zh) * | 2019-05-24 | 2019-08-27 | 中译语通科技股份有限公司 | 文献价值评估方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101937462A (zh) * | 2010-09-03 | 2011-01-05 | 中国科学院声学研究所 | 文献自动评价方法及系统 |
CN104951929A (zh) * | 2015-07-17 | 2015-09-30 | 北京国之专利预警咨询中心 | 一种用于信息提醒的方法及设备 |
CN105096103A (zh) * | 2015-07-17 | 2015-11-25 | 北京国之专利预警咨询中心 | 一种用于信息提醒的方法及设备 |
-
2015
- 2015-12-29 CN CN201511004803.5A patent/CN106933815B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101937462A (zh) * | 2010-09-03 | 2011-01-05 | 中国科学院声学研究所 | 文献自动评价方法及系统 |
CN104951929A (zh) * | 2015-07-17 | 2015-09-30 | 北京国之专利预警咨询中心 | 一种用于信息提醒的方法及设备 |
CN105096103A (zh) * | 2015-07-17 | 2015-11-25 | 北京国之专利预警咨询中心 | 一种用于信息提醒的方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN106933815A (zh) | 2017-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lo et al. | Why significant variables aren’t automatically good predictors | |
US8799275B2 (en) | Information retrieval based on semantic patterns of queries | |
KR20180072167A (ko) | 유사특허 추출 시스템 및 그 방법 | |
US20080228752A1 (en) | Technical correlation analysis method for evaluating patents | |
KR101616544B1 (ko) | Lda를 이용한 특허 문헌 분석 방법 | |
CN112818218B (zh) | 信息推荐方法、装置、终端设备及计算机可读存储介质 | |
TWI772023B (zh) | 資訊處理裝置、資訊處理方法及資訊處理程序 | |
CN107862551A (zh) | 网络应用推广效果的预测方法、装置和终端设备 | |
WO2014205046A1 (en) | System and method for text mining documents | |
Wang | Research on the features of car insurance data based on machine learning | |
CN105786810B (zh) | 类目映射关系的建立方法与装置 | |
CN106502881B (zh) | 一种商品排序规则的测试方法和装置 | |
Aldous et al. | Five statistical questions about the tree of life | |
Kim et al. | A method to identify differential expression profiles of time-course gene data with Fourier transformation | |
Kumar | Knowledge discovery practices and emerging applications of data mining: Trends and new domains: Trends and new domains | |
Kusa et al. | Outcome-based evaluation of systematic review automation | |
CN106933815B (zh) | 文献价值获取方法与装置 | |
Dendek et al. | Evaluation of features for author name disambiguation using linear support vector machines | |
CN107908649A (zh) | 一种文本分类的控制方法 | |
CN112506930B (zh) | 一种基于机器学习技术的数据洞察系统 | |
Vysakh et al. | Altmetrics linked scholarly information from dimensions. ai datasets for the top 100 LIS | |
CN109934689B (zh) | 目标对象排名解释方法、装置、电子设备及可读存储介质 | |
CN111651643A (zh) | 候选内容的处理方法及相关设备 | |
Siregar et al. | Housing price prediction using a hybrid genetic algorithm with extreme gradient boosting | |
Al-Kerboly et al. | Clustering Algorithms Comparison for University of Anbar Researchers’ Google Scholar Profiles |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |