CN106372225B - 一种基于高价值对比库的信息处理装置及方法 - Google Patents

一种基于高价值对比库的信息处理装置及方法 Download PDF

Info

Publication number
CN106372225B
CN106372225B CN201610809108.4A CN201610809108A CN106372225B CN 106372225 B CN106372225 B CN 106372225B CN 201610809108 A CN201610809108 A CN 201610809108A CN 106372225 B CN106372225 B CN 106372225B
Authority
CN
China
Prior art keywords
value
unit
information processing
information
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610809108.4A
Other languages
English (en)
Other versions
CN106372225A (zh
Inventor
朱欣昱
崔国振
程序
孔文娟
王科
张素兰
赵亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intellectual Property Publishing House Co ltd
Original Assignee
Intellectual Property Publishing House Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intellectual Property Publishing House Co ltd filed Critical Intellectual Property Publishing House Co ltd
Priority to CN201610809108.4A priority Critical patent/CN106372225B/zh
Publication of CN106372225A publication Critical patent/CN106372225A/zh
Application granted granted Critical
Publication of CN106372225B publication Critical patent/CN106372225B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services; Handling legal documents
    • G06Q50/184Intellectual property management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/11Patent retrieval

Abstract

本发明公开了一种基于高价值对比库的信息处理装置及方法,接收用户输入信息;根据用户输入信息,生成检索式来检索与该用户输入信息对应的领域范围,并存储检索获得的文件;根据预定的指标对比较文件生成单元获得的文件进行筛选,从而获得一组高价值文件;语义分析由比较文件生成单元检索获得的每个文件,得到每个文件的关键词列表,语义分析由指标筛选单元获得的该组高价值文件,得到该组高价值文件的关键词列表集合,并将该关键词列表集合作为参考关键词列表;将语义分析比较文件生成单元检索获得的每个文件的关键词列表与参考关键词列表相比较,得到评分值。

Description

一种基于高价值对比库的信息处理装置及方法
技术领域
本发明涉及一种基于高价值对比库的信息处理装置及方法,尤其涉及一种对技术信息,例如专利信息进行处理,从而对技术信息进行评分,并筛选出重要度高的信息的方法和装置。
背景技术
技术信息,尤其是专利信息对于企业或科研院所的发展是不可或缺的重要资源。例如,在企业或科研院所进行研发或投资前,可以全面了解特定技术领域的现有技术水平,确定正确的研究方向,避免重复开发,节省时间和科研经费。但是,由于全世界的申请人每年在各技术领域向不同国家申请了大量不同质量和价值的专利,这些专利中的一些专利对该领域技术做出了巨大的贡献,而另一些专利仅对公知技术进行了微小改进。因此,企业通常需要分析这些庞大的专利信息,以获得有价值的内容。
此外,在企业内部进行技术信息,尤其是专利信息的管理时,通常是将所有的专利集中在一起进行管理,但随着时间的推移和技术的发展,有些申请变为无价值的专利,因此,为了确保维持有价值的专利,同时摒弃无价值的专利,企业通常需要对专利价值进行评估。传统上是以人工方式进行上述专利价值评估的,因此需要消耗大量的人力及时间成本。由此可知,需要构建一种信息处理装置及方法,以自动对相关领域的专利进行评分,从而筛选出有价值的专利信息,并对无价值的专利信息加以摒弃。
在专利文献1(公开号:US2011/0289096A1)中,公开了一种对专利和其他无形资产进行评价的方法和系统,比较第一组已知的具有较高价值的专利(例如诉讼成功的专利)与第二组已知的具有较低价值的专利(例如诉讼不成功或不具有诉讼历史的专利),来获得第一组和第二组专利的多个特征值,其中,第一组专利的上述特征值要大大高于第二组专利的上述特征值,上述特征值可以是专利的维护周期、被引证次数等。使用上述分析出的多个特征值,来建立数学模型或数学算法,以评价未知的一个或一组专利,从而获知待评专利是否具有较高价值。但是,由于专利的保护范围更多地体现为权利要求的保护范围,因此,权利要求对于表征专利的法律价值和技术价值具有重要意义,但在上述专利文献1中,用来评价专利价值的仅仅是如专利的维护周期,被引证次数等特征值,虽然这些特征值可以在一定程度上表征某些专利的法律价值和技术价值,但其只是一些辅助数据,不能通过语义信息,尤其是权利要求的语义信息来对专利的价值进行评价。此外,由于即便是同一辅助数据,其在不同领域的具体指标值也会存在较大差异,例如典型地在电子计算机领域和医药领域,专利维护周期、被引证次数等辅助指标的值之间即存在明显不同,因此,用相同标准在不同领域中评判专利价值也是不科学的。
在专利文献2(公开号:CN1573738A)中,公开了一种自动分析专利文件中专利范围的方法,其用以分析一专利文件中有关申请专利范围的权利范围,包括下列步骤:输入上述专利文件,上述专利文件包含至少一申请专利范围;以及撷取上述至少一申请专利范围中,逗点/分号与逗点/分号间的文字,逗点/分号与句号间的文字以及逗点/分号与连接词间的文字,形成多个字组;参考一关键词库,比对上述字组以得到至少一组成组件;根据上述至少一组成组件,以评估上述至少一申请专利范围的权利范围。
该专利文献2中,关键词库包括必要字组、成对字组以及同义字组。每个成对字组包含两个成对的字组,每个同义字组包含多个同义的字组。必要字组是指当申请专利属于一特定技术领域时,必要出现于申请专利范围中的字组,成对字组是指于申请专利范围中,成对出现的字组,同义字组是于申请专利范围中,可视为意义相同的字组。
由此可知,虽然在上述专利文献2中是以语义信息为基础来分析权利要求的范围的,但是其需要预先形成与该领域相关的一关键词库,因此,该关键词库的整理和收集也需耗费一定的人力。
发明内容
因此,本发明要解决的技术问题是提供一种基于高价值对比库的信息处理装置及方法,尤其是提供一种专利信息处理装置和方法,能够自动地根据语义分析结果来对专利群中的专利进行信息处理,从而对专利信息进行评分,并更为准确地筛选出重要度高的信息。
为解决上述技术问题,本发明的基于高价值对比库的信息处理装置包括:接收单元,接收用户输入的信息;比较文件生成单元,根据用户输入的信息,生成检索式来检索与该用户输入的信息对应的领域范围,并存储检索获得的文件;指标筛选单元,根据预定的指标对比较文件生成单元获得的文件进行筛选,从而获得一组高价值文件;第二分析单元,语义分析由比较文件生成单元检索获得的每个文件,得到每个文件的关键词列表;参考关键词列表存储单元,语义分析由指标筛选单元获得的该组高价值文件,得到该组高价值文件的关键词列表集合,并将该关键词列表集合作为参考关键词列表;比较单元,将第二分析单元获得的每个文件的关键词列表与参考关键词列表相比较,得到评分值。
本发明的基于高价值对比库的信息处理方法包括:接收步骤,接收用户输入的信息;比较文件生成步骤,根据用户输入的信息,生成检索式来检索与该用户输入的信息对应的领域范围,并存储检索获得的文件;指标筛选步骤,根据预定的指标对比较文件生成步骤获得的文件进行筛选,从而获得一组高价值文件;第二分析步骤,语义分析由比较文件生成步骤检索获得的每个文件,得到每个文件的关键词列表;参考关键词列表存储步骤,语义分析由指标筛选步骤获得的该组高价值文件,得到该组高价值文件的关键词列表集合,并将该关键词列表集合作为参考关键词列表;比较步骤,将第二分析步骤获得的每个文件的关键词列表与参考关键词列表相比较,得到评分值。
由于本发明中,语义分析高价值文件,得到该组高价值文件的关键词列表集合,并将该关键词列表集合作为参考关键词列表。由此可知,本发明的参考关键词是通过自动分析来获得的,因此,可以避免构建参考关键词列表所耗费的人力。
该参考关键词列表存储单元包括第三分析单元,语义分析由指标筛选单元获得的该组高价值文件。该第三分析单元先通过语义分析,获得该组高价值文件中的每个文件的关键词列表,之后通过整合上述每个文件的关键词列表,并进行同义词合并后,得到该组高价值文件的关键词列表集合来作为参考关键词列表。
由于本发明中在形成参考关键词列表时,整合每个文件的关键词列表,并进行将上述关键词进行同义词合并,因此,可以将具有相同含义的关键词进行合并,由此,可以避免因对同一物体的表述不同造成的评价偏差。
另外,由于本申请中,通过指标值从检索所获得的比较文件中筛选出高价值的文件,再根据该高价值的文件进行参考关键词列表的构建。而由于高价值文件通常被认为是所在领域中较为核心的文件,因此,根据其所构建的参考关键词列表的准确度更高,所得到的评分值更为准确。
上述指标筛选所使用的预定指标包括无效诉讼信息、专利运营信息、被引证次数信息、同族数量信息、缴费信息以及奖项信息;根据上述预定指标中的一个或多个,从比较文件生成单元获得的文件中筛选获得一组高价值文件。由于无效诉讼信息、专利运营信息表明该技术文件具有一定的市场价值,同时,当文件的被引用次数高、同族覆盖的数量高时,也意味着这些文件受关注的程度高,或对于申请人而言,认为其具有相当高的价值,因此,上述信息也可以作为高价值对比库的筛选指标。
上述信息处理装置还可以包括特征值分析单元,根据用户输入的信息来获得一批文件,将该批文件分类为第一组文件和第二组文件,其中第一组文件是已知的高附加值文件,第二组文件是已知的不具有高附加值的文件,获得上述两组文件的指标差异大于一定阈值的指标值作为特征值;其中该指标筛选单元根据上述特征值中的一个或多个,从比较文件生成单元获得的文件中筛选获得一组高价值文件。其中,当用户输入的信息是特定专利时,获取该特定专利的分类号来获取该批文件,当用户输入的信息是相应技术的简单描述时,可以通过统计分析来获得该技术的简单描述对应的分类号,并基于上述分类号来获得该批文件。由于本申请中,是基于所在分类号,即所在领域的文献特点来进行特征值的分析,从而设定筛选指标的,因此,其可以基于大数据的统计结果来进行设定指标,并进行指标筛选,相较于预先规定一个值来进行筛选的方式,可以更准确地提取出高价值的文件。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细的说明,其中:
图1示意性示出了依照本发明的信息处理系统的第一实施例;
图2示意性示出了依照本发明的信息处理系统所实施的处理流程的一实施例;
图3示意性示出了依照本发明的信息处理系统中的数据生成单元的一实施例;
图4示意性示出了本发明的信息处理系统中的数据生成单元所实施的处理流程的一实施例;
图5示意性示出了依照本发明的信息处理系统中的数据生成单元的另一实施例;
图6示意性示出了依照本发明的信息处理系统中的数据生成单元所实施的处理流程的另一实施例;
图7示意性示出了依照本发明的信息处理系统中的数据生成单元的一实施例;
图8示意性示出了依照本发明的信息处理系统中的分析单元的一实施例;
图9示意性示出了本发明的信息处理系统中的分析单元所实施的处理流程的一例;
图10示意性示出了依照本发明的信息处理系统中的比较单元的一实施例;
图11示意性示出了本发明的信息处理系统中的比较单元所实施的处理流程的一例;
图12示意性示出了依照本发明的信息处理系统中的比较单元的另一实施例;
图13示意性示出了依照本发明的信息处理系统的第二实施例;
图14示意性示出了依照本发明的信息处理系统的第三实施例;
图15示意性示出了依照本发明的信息处理系统的第四实施例。
具体实施方式
结合附图来说明本发明的实施例。需要说明的是,每个附图中的实线表示信号的经过线路,而虚线表示该模块或步骤在整个装置或流程中是可省略的,而点划线表示上述多个模块可进行组合或不进行组合,而独立成为模块。
第一实施例
图1示出了本发明的信息处理系统的一个实施例。图2示出了依照本发明的信息处理系统所实施的处理流程的一实施例。下面,结合图1和图2来进行相应说明。
如图1所示,该信息处理系统包括输入装置101、信息处理装置201和显示装置301。在步骤S2020中,上述输入装置101接收用户输入的信息,该输入信息例如是某个特定专利号或用户关注的相应技术的简单描述。上述信息处理装置包括接收单元202,用于接收用户输入的信息;在步骤S2030中,比较文件生成单元230中的数据生成单元203根据用户输入的信息,生成相应的检索式,并用所生成的检索式在信息数据库217中进行检索而得到包含一组技术文件信息的检索结果,该组技术文件信息的技术领域与某个特定专利号或用户关注的相应技术的技术领域相同,其中,该信息数据库217中预先存储了一批技术文件信息,该技术文件信息包括但不限于各国专利公报、专利公告、实用新型公报、特定标准、核心期刊文件等。之后,在步骤S2040中,数据生成单元203将上述检索结果存储到比较文件生成单元230的对比库204中。
在步骤S2050中,根据预定指标,由指标筛选单元205根据预定指标对对比库204中的技术文件进行筛选,并将符合上述筛选条件的技术文件存储到高价值对比库206中。
本发明的指标筛选单元205中的筛选指标是本领域技术人员认定的高质量专利的特征值,该特征值可以通过专利文献1(公开号:US2011/0289096A1)所示的方法来进行确定,此时,该信息处理装置201可以具有特征值分析单元207,根据用户输入的信息来确定一批文件,例如该批文件可以与用户输入的特定专利具有相同的分类号,或者是用户输入的简单描述信息对应的分类号。之后,根据将该批文件分类为第一组文件和第二组文件,其中第一组文件是具有诉讼无效、运营信息的文件,第二组文件是不具有上述信息的文件,之后获得上述两组文件的指标大于一定阈值的特征值,该指标可以是权利要求的数目、权利要求的字数、被引用次数等。之后,根据上述特征值,由指标筛选单元205进行文件筛选,从而获得高价值对比库206。
或者,也可以预先规定几个指标值,在进行技术文件筛选时,根据上述指标值来进行筛选。该预定的几个指标值包括:该文件是否具有复审、无效、诉讼等行政和司法信息,是否具有转让、许可、质押等运营信息,被引用的次数或同族文件的数量是否大于预定值,缴费数额是否高于预定的值,是否获奖或是否在海关备案等。
在实施例中,可以以其中的一个指标为基准来进行判断和筛选,也可以将其中的几个指标相组合,来进行相应的筛选和判断。在一个例子中,可以将指标设置为当对比库204中的某个文件包含复审、无效和诉讼信息、获得了特定的奖项、或在海关进行了备案,由于上述信息表明该技术文件具有一定的市场价值,因此将含有上述信息的文件添加到高价值对比库206中。另外,当某些文件的被引用次数、同族覆盖的数量高于一定数量时,也将这些文件添加到高价值对比库206中。另外,当某些文件的许可和转让非发生在企业关联公司之间,也可以将上述文件添加到高价值对比库206中。
当用户向输入装置101输入的是某个特定专利号时(步骤S2041中“是”),该系统还包括第一分析单元210,对所输入的特定专利进行语义分析,并进行词频分析、相关度分析、冗余信息去除等或上述方式的组合,从而获得与该特定专利号对应的关键词及该关键词的权重。
接着,在步骤S2110中,将对比库204中存储的所有比较文件中的每一个依次输入到第二分析单元211,之后对对比库204中存储的每一个文件进行语义分析,并进行词频分析、相关度分析、冗余信息去除等或上述方式的组合,从而获得与该文件对应的关键词及其权重,并依次将每个文件所对应的关键词及其权重输入到比较单元208。
在步骤S2120中,从参考关键词列表存储单元212获得参考关键词列表,该参考关键词列表存储单元212包括第三分析单元214和存储器215,其中第三分析单元214对高价值对比库206中存储的每一个文件进行语义分析,并进行词频分析、相关度分析、冗余信息去除等或上述方式的组合,从而获得与该文件对应的关键词及其权重,同时整合第三分析单元214中获得的关键词及其权重,并通过对其进行同义词整理和归纳,来形成参考关键词列表,该列表包括了相应的参考关键词及其对应权重。第三分析单元214将所获得的上述参考关键词列表及其权重存储到存储器215中。当然,在通过自动分析获得参考关键词列表时,也可省略该存储器215,而使该参考关键词列表存储单元212仅包括第三分析单元214。
在步骤S2080中,当用户向输入装置101输入的是某个特定专利号时,比较单元208将由第一分析单元210得到的关键词及其权重与参考关键词列表存储单元212中的参考关键词及其权重进行对比,而获得用户所输入的上述特定专利的评分值,同时生成指示信息,该指示信息用于标志该评分值是上述用户输入的特定专利的评分值。
同时,将第二分析单元211所获得的每个文件的关键词及其权重与参考关键词列表存储单元212中的参考关键词及其权重进行对比,而分别得到上述对比库204中存储的每个文件的评分值。
在步骤S3010中,以列表方式将评分结果显示在显示装置301上。当然,也可仅显示部分评分值,比如前300个比较文件和特定专利号的评分值。当用户向输入装置101输入的是某个特定专利号时,以高亮方式显示该特定专利号的评分结果。
该信息处理装置201还可进一步包括排序单元209,即,在S2080和S3010之间插入步骤S2090,接收比较单元208输出的每个评分值,并在进行同族专利或相同专利去重后,将上述比较单元208生成的每个文件的评分值以及用户输入的特定专利对应的评分值进行排序,得到排序结果。可以采用归一化的值来得到排序结果,例如,可以根据文件的相应排序来获得每个文件的序号,之后,再根据每个文件在全部文件中的序号占比来获得相应的归一化排序结果,比如,当某一文件的排序号是21时,而共有553个比较文件时,该归一化值可以是21/553,并将该值作为排序结果。
此时,显示装置301接收排序单元209输出的排序结果,当用户向输入装置101输入的是某个特定专利号时,还接收步骤S2080中生成的指示信息,并显示上述排序结果,同时,当用户向输入装置101输入的是某个特定专利号时,以高亮方式显示该特定专利号的评分值。
其中,上述第一分析单元210、第二分析单元211和第三分析单元214中的任两个或全部三个可以仅由一个分析单元216实现。
此外,因专利的权利要求书代表了该专利的法律信息,且独立权利要求包含了大部分重要的法律信息,因此,在第一分析单元210、第二分析单元211和第三分析单元214对专利进行语义分析时,可以仅对其权利要求进行分析,或仅对独立权利要求进行分析。
图3是本发明的数据生成单元的一个实施例,对应于用户向输入装置101输入一特定技术文件,如特定专利号的情形。图4是本发明的数据生成单元的处理流程图。下面结合图3和图4来进行说明。该数据生成单元203包括技术领域语义分析单元2031、分类号获取单元2032、特定特征提取单元2033和检索式生成单元2034。其中,在用户向输入装置101输入特定专利号时,该数据生成单元203在图4的步骤S20301中从信息数据库217中检索该特定专利号而获得上述特定专利的信息。
之后,该技术领域语义分析单元2031在图4的步骤S20302中从所获得的上述特定专利的信息中提取该专利的发明名称、说明书的技术领域、权利要求的前序部分进行语义分析,而获得与该特定专利有关的技术领域关键词。通过语义分析方法来获得关键词的方法是现有技术中常用的技术,方法有例如美国专利文献(公开号:US2010/0185689A1)和中国专利文献(公开号:CN104239300A)所公开的通过语义分析来提取关键词的方法等。
在提取出相应的关键词后,技术领域语义分析单元2031在图4的步骤S20303中访问同义词库2036,获取所提取的关键词的同义词。其中,同义词是预先存储在同义词库2036中的。分类号获取单元2032在图4的步骤S20304中提取用户输入的特定专利的分类号,并获得上述特定专利分类号的交叉分类号。其中该交叉分类号的获取方法包括预先建立所有分类号的交叉分类号映射,在提取出特定专利的分类号后,通过映射方式获得其所有交叉分类号;或者通过统计分析获得该特定专利的分类号的方法等。
在步骤S20313中,将表示是否进行了特定特征提取的标志i设为0。
之后,检索式生成单元2034在图4的步骤S20305中获得技术领域语义分析模块所提取的关键词及其同义词和分类号获取单元2032获取的分类号,来构建检索式。
在步骤S20306中通过检索单元2035用由检索式生成单元2034所生成的检索式在信息数据库库217中进一步检索而获得检索结果,当步骤S20307中的检索结果超过第一阈值且i<5时(对应于步骤S20307中的“是”),该第一阈值的取值范围是例如5000,说明检索结果存在较大噪声,此时数据生成单元203启动图4的步骤S20314,使标志i=i+1,并在S20315中判断i是否为1。在i为1的情况下,表示需进行特定特征提取,而在步骤S20308中,使特定特征提取单元2033工作,该特定特征提取单元2033从权利要求的特征部分、说明书全文中寻找出现“技术问题”、“发明目的”等体现该所要解决的技术问题的句子或段落,从上述句子或段落中通过与上述类似的语义分析方法来获得上述句子或段落的关键词。
当特定特征提取单元2033提取的关键词有多个时,对上述关键词进行优先级排序,例如可根据权利要求的序号、与“发明目的”、“技术问题”的词距远近程度、词频的概率、与发明名称之间的相关程度等来建立该优先级顺序,并将上述关键词命名为优先级1关键词、优先级2关键词….优先级N关键词。
在图4的步骤S20309中,将特定特征提取单元2033提取的关键词,即优先级1关键词、优先级2关键词….优先级N关键词与排除词库2037相比较,而将表示该领域通用含义的词语排除,该排除词例如是“处理器”、“数据”、“信息”、“信号”、“单元”、“模块”等代表了本领域通用结构的词语。例如在此例中,优先级1关键词是通用词,因此,在步骤S20310中将其抛弃。
在步骤S20311中,以优先级为顺序对保留关键词进行排序,例如在此例中,保留的关键词是优先级2关键词….优先级N关键词。之后,从优先级最高的关键词开始,即在本例中,从优先级2关键词开始,查询同义词库2036,获得该优先级2关键词的同义词,在步骤S20305中,以步骤S20303获得的技术领域的关键词及其同义词、步骤S20304中获得的特定专利的分类号及其交叉分类号以及步骤S20312中获得的优先级2关键词及其同义词库为基础,构建检索式,并继续在S20307中判断检索结果是否大于第一阈值且i是否小于5,在检索结果大于第一阈值且i小于5的情况下,继续进行S20314,使i=i+1,由于此时i=2,因此,直接进入到S20312中,获取优先级次之的优先级3关键词及其同义词,并与步骤S20303获得的关键词及其同义词、步骤S20304获得的分类号及其交叉分类号以及优先级2关键词一起,在步骤S20305中构建检索式,直至S20307的判定结果为否。
当S20307的判定结果为否时,结束流程。将此时数据生成单元203所获得的数据存储到对比库204中。
图5是本发明的数据生成单元的另一实施例。图6是本发明的数据生成单元所实施的处理流程的另一例。其对应于用户输入相关技术的简单描述的情形。如图5所示,数据生成单元203包括技术领域分析单元2031’,分类号获取单元2032’、特定特征分析单元2033’、检索式生成单元2034’和检索单元2035’。如图6所示,该技术领域分析单元2031’在步骤S20301’中获取用户输入的有关技术领域的相关描述,该描述可以是用户输入的有关技术领域的关键词或者相应句子表述。在用户输入是句子表述时,可通过语义分析将该句子拆分成表征技术领域的关键词。
之后,在步骤S20302’中,访问同义词库2036,来获取与用户输入的技术领域有关的关键词对应的同义词。
在步骤S20303’中,通过在信息数据库217中检索该技术领域的关键词及其同义词,来统计与该技术领域对应的分类号。由于关键词检索会引入大量噪声,通常认为排序在后的分类号与申请人输入的技术领域无关,因此,可以只选取统计分析得到的前10或前20分类号作为需要检索的分类号。
该图6的后续步骤与图4的相应流程步骤相同,因此,在此省略说明。
图7是本发明的数据生成单元的又一实施例。该数据生成单元203对应于用户输入特定的专利号的情形。如图7所示,该数据生成单元包括检索单元2035,用于检索信息数据库217而获得该特定专利号的专利信息。关键词获取单元2031”根据所获得的专利信息,获得相应的关键词;分类号获取单元2032”根据上述专利信息,获得分类号;检索式生成单元2034”,根据关键词获取单元2031”获得的关键词和分类号获取单元2032”获得的分类号,来生成检索式,从而由检索单元2035继续检索信息数据库217,并将检索获得的结果存储在对比库204中。
当然,在检索式生成单元2034”进行检索式的生成时,可以按优先级顺序来进行检索式的构建,同时一直判断检索单元2035检索的结果,只有当检索结果满足预定的条件时,才将上述检索结果存储到对比库204中。
上述例子中,高价值对比库206和数据生成单元203之间是分立的模块,当然本领域普通技术人员应当明白,可以将两者联合来考虑检索式。
例如,为了使参考关键词列表尽可能准确,通常认为需包含预定数量的高价值比较文件,因此,当根据指标筛选单元205的指标值,所筛选出的高价值比较文件的数量不能满足预定数量时,此时可以重新对数据生成单元203中的检索式生成单元生成的检索式进行调整,直到其满足预定数量。
例如,当通过指标筛选单元205筛选后发现高价值对比库206中存储的比较文件小于预定数量时,此时可以增加图7的分类号获取单元2032”中获取的分类号的数量,并与之前的分类号构建逻辑或的关系,从而增加检索的数量。
图8是本发明的第一分析单元的一实施例。图9是本发明的第一分析单元的处理流程图。下面结合图8和图9来进行说明。如图8所示,第一分析单元包括专利信息获取单元2101、前序关键词获取单元2102、独权关键词获取单元2103、从权关键词获取单元2104和综合单元2105。
专利信息获取单元2101在步骤S21001中获取与专利号对应的专利信息,在步骤S21002中,前序关键词获取单元2102提取出独立权利要求,并通过语义分析来分析其前序部分,获得关键词表,并通过访问同义词库2036,合并所获得的关键词同义词而得到关键词表1,获得该关键词表1中的每个关键词对应的词频,并对其赋予第一加权值W1。
在步骤S21003中,独权关键词获取单元2103提取独立权利要求的特征部分,并通过语义分析和访问同义词库2036而获得关键词表2及关键词表2的关键词的对应词频,同时根据上述关键词表2中的关键词与前序部分的相关关系对其赋予不同的相关度,并对上述关键词表2中的关键词赋予第二加权值W2。
在步骤S21004中,从权关键词获取单元2104提取从属权利要求的特征,并通过语义分析和访问同义词库2036获得关键词表3及关键词表3的关键词的对应词频,同时根据上述关键词表3中的关键词与前序部分的相关关系对其赋予不同的相关度,并对上述关键词表3中的关键词赋予第三加权值W3。
在步骤S21005中,综合单元2105获取步骤S21002、S21003、S21004的关键词、词频、相关值,加权值,并进一步进行同义关键词合并,而得到关键词列表,该列表中存储了相关关键词及其对应权重。
图1中的第二分析单元211和第三分析单元214的结构和处理流程与上述第一分析单元210相似,在此省略相应说明。
图10是本发明的比较单元208的一个实施例。图11是本发明的比较单元208所实施的实施流程的一个实施例。如图10和图11所示,本发明的比较单元208包括参考关键词权重排序单元2081、关键词顺序分析单元2082和求和单元2083。首先,在步骤S20801中,对所输入的参考关键词列表及其权重,按权重对参考关键词进行排序,并赋予每个关键词相应的序号。在步骤S20802中,获得待评专利的关键词及其权重。该待评专利可以是用户向图1的输入装置101输入的特定专利或者图1的对比库204中的每一个文件。接着,在步骤S20803中,由关键词顺序分析单元2082获得待评专利中的每个关键词在参考关键词表中的序号,之后由求和单元2083在步骤S20804中对待评专利的每个关键词的序号求和,而获得最终的评分值。
图12是本发明的比较单元的另一实施例。对于其与图10的相同模块与结构,引用与图10相同的图标记而省略说明。在这里,仅说明其与图10的不同点。图12的比较单元还包括关键词相似度分析单元2085’,用于输入参考关键词及其权重值和待评专利关键词及其权重,分析其相似度后,输出到求和单元2083’。该相似度分析方法包括但不限于求取参考关键词及其权重值和待评专利关键词及其权重之间的向量夹角,从而获得其相似度。由此,通过相似度来调整求和单元2083’输出的求和值,从而得到评分值。
第二实施例
图13示出了本发明的信息处理系统的另一实施例。对于与图1具有相同功能的模块或单元,在图13中引用同一附图标记而省略说明。在这里,仅说明其与图1的不同点。
图13中,该信息处理装置201’还包括报告生成单元218,接收排序单元209输出的排序结果,当用户向输入装置101输入的是某个特定专利号时,还接收指示该特定专利的评分值的指示信息,并根据上述排序结果和指示信息,生成相应的图表与对应的说明,从而生成报告,并将对应的报告输出到显示装置301。
上述报告包括重要度最高的多项技术或专利以及当用户向输入装置101输入的是某个特定专利号时,该特定技术或专利的排名情况、重要度最高的专利的申请人分布、特定申请人的专利重要度时间分布、领域分布等。
由此,用户可以通过图文等直观的方式获知评价结果,以便进行后续操作。
第三实施例
图14示出了本发明的信息处理系统的又一实施例。对于与图1具有相同功能的模块或单元,在图14中引用同一附图标记而省略说明。在这里,仅说明其与图1的不同点。
图14中,与图1中相同,该数据生成单元203将检索结果存储到对比库204’中。由于当向输入装置101输入的是某个特定专利号时,数据生成单元203是以该输入的特定专利号为基础来生成检索式的,因此,此时所输入的特定专利号也包含在对比库204’的比较文件中。
因此,此时可以省略设置第一分析单元210。此时,对比库204’可获得接收单元202接收的特定专利号,并用一指示信息来标示该特定专利号。第二分析单元211’接收对比库204’中的一组技术文件信息以及表示用户输入的特定专利号的指示信息,来进行分析,并将每个技术文件信息的关键词分析结果和表示用户输入的特定专利的指示信息输入到比较单元208’。
比较单元208’比较上述第二分析单元211’输出的每个文件的关键词与参考关键词列表存储单元212的参考关键词的比较结果,而得到上述对比库204’中存储的每个文件的评分值以及表示用户输入的特定专利的评分值的指示信息。
之后,将上述每个文件的评分值以及表示用户输入的特定专利的评分值的指示信息输入到排序单元209’进行排序。排序单元209’将排序结果以及表示用户输入的特定专利的评分值的指示信息输出到显示单元301来加以显示。
当然,上述图14的信息处理装置201”也可如图13所示,具有报告生成单元218,生成相应的图表与对应的说明,从而生成报告,并将对应的报告输出到显示装置301。
第四实施例
本发明的信息处理系统可以由图15所示的计算机系统501来实现。如图15所示,本发明的计算机系统包括输入装置5013、存储器5011和处理器5012,其中用户向该输入装置5013输入信息,在该存储器5011中存储了计算机指令信息,该计算机指令信息是可执行例如图2、4、6、9或11等流程和图7、13、14所对应的流程的指令信息;该处理器5012从存储器5011中读取该计算机指令信息,使得该处理器5012可接收用户向输入装置输入的信息;据用户输入的信息,生成检索式来检索与该用户输入的信息对应的领域范围,并存储检索获得的文件;根据预定的指标对比较文件生成单元获得的文件进行筛选,从而获得一组高价值文件;语义分析由比较文件生成单元检索获得的每个文件,得到每个文件的关键词列表;分析由指标筛选单元获得的该组高价值文件,得到该组高价值文件的关键词列表集合,并将该关键词列表集合作为参考关键词列表;将检索获得的每个文件的关键词列表与参考关键词列表相比较,得到评分值。
本发明的信息处理装置及方法可以在如下几个方面实施:
例如,对于企业而言,可以将由本发明的信息处理装置输出的评分值输入到企业的知识产权管理系统中,该知识产权管理系统中具有年费管理装置,该年费管理装置可根据本发明的信息处理装置输出的评分值,来决定继续支付年费或放弃。
例如,也可将本发明的信息处理装置输出的评分值输出到企业运营管理系统中,在投资价值不明的情况下,该企业管理系统具有判断装置,根据上述评分值来分析本企业的核心技术,并针对上述核心技术进行外围布局,以形成专利包,从而更好地保护自身专利。
例如,也可将本发明的信息处理装置输出的评分值与企业运营管理系统中的企业运营数据,例如转让次数、许可次数、转让许可领域、质押、融资领域等相结合,来得到该待评专利的评分值。
根据本发明,企业可评估其竞争对手或其他公司正在研发的技术的相关价值,并基于上述相关价值来进行投资对象的选择,或与其他对手探讨是否进行共同研发,以较早地抢占市场先机。
上面参照附图说明了本发明的实施例,但是本发明的范围并不限于上述实施例,合适地组合或替换各实施例的结构也包含在本发明的范围中。本领域普通技术人员可以根据其知识组合或替换上述各实施例的结构或组成,这些变形的实施方式也包含在本发明的范围中。

Claims (55)

1.一种基于高价值对比库的信息处理装置,其特征在于,包括:
接收单元,接收用户输入的信息;
比较文件生成单元,根据用户输入的信息,生成检索式来检索与该用户输入的信息对应的领域范围,并存储检索获得的文件;
指标筛选单元,根据预定的指标对比较文件生成单元获得的文件进行筛选,从而获得一组高价值文件;
第二分析单元,语义分析由比较文件生成单元检索获得的每个文件,得到每个文件的关键词列表;
参考关键词列表存储单元,语义分析由指标筛选单元获得的该组高价值文件,得到该组高价值文件的关键词列表集合,并将该关键词列表集合作为参考关键词列表;
比较单元,包括参考关键词权重排序单元、关键词顺序分析单元和求和单元;比较单元将参考关键词列表中的参考关键词按权重排序,将第二分析单元获得的每个文件的关键词列表与参考关键词列表相比较,获得每个文件的关键词列表中每个关键词在参考关键词列表中排序序号,对关键词排序序号求和后得到评分值。
2.根据权利要求1所述的基于高价值对比库的信息处理装置,其特征在于:
该指标筛选单元的预定指标包括无效诉讼信息、专利运营信息、被引证次数信息、同族数量信息、缴费信息以及奖项信息;
其中,该指标筛选单元根据上述预定指标中的一个或多个,从比较文件生成单元获得的文件中筛选获得一组高价值文件。
3.根据权利要求1所述的基于高价值对比库的信息处理装置,其特征在于:
该信息处理装置还包括特征值分析单元,根据用户输入的信息来获得一批文件,将该批文件分类为第一组文件和第二组文件,其中,第一组文件是已知的高附加值文件,第二组文件是已知的不具有高附加值的文件,获得上述两组文件的指标差大于一定阈值的指标作为特征值;
其中,该指标筛选单元根据上述特征值中的一个或多个,从比较文件生成单元获得的文件中筛选获得一组高价值文件。
4.根据权利要求3所述的基于高价值对比库的信息处理装置,其特征在于:
当用户输入的信息是特定专利时,获取该特定专利的分类号来获得该批文件;当用户输入的信息是相应技术描述时,通过统计分析获得该相应技术描述对应的分类号,并基于上述分类号来获得该批文件。
5.根据权利要求1所述的基于高价值对比库的信息处理装置,其特征在于:
该参考关键词列表存储单元包括第三分析单元,语义分析由指标筛选单元获得的该组高价值文件。
6.根据权利要求1所述的基于高价值对比库的信息处理装置,其特征在于:该比较文件生成单元包括数据生成单元和对比库,其中数据生成单元根据用户输入的信息,生成检索式进行检索;对比库存储检索获得的文件。
7.根据权利要求1所述的基于高价值对比库的信息处理装置,其特征在于:具有高价值对比库,用于存储由指标筛选单元筛选出的该组高价值文件。
8.根据权利要求5所述的基于高价值对比库的信息处理装置,其特征在于:该第三分析单元先通过语义分析,获得该组高价值文件中的每个文件的关键词列表,之后通过整合上述每个文件的关键词列表,并进行同义词合并后,得到该组高价值文件的关键词列表集合来作为参考关键词列表。
9.根据权利要求1所述的基于高价值对比库的信息处理装置,其特征在于:接收单元接收的用户输入信息包括用户输入的特定专利号或相关技术描述。
10.根据权利要求9所述的基于高价值对比库的信息处理装置,其特征在于:当用户输入的信息是特定专利号时,对比库还用第一指示信息来指示该特定专利号;且比较单元也输出第二指示信息,该第二指示信息指示用户输入的特定专利号的评分值。
11.根据权利要求1所述的基于高价值对比库的信息处理装置,其特征在于:上述关键词列表和参考关键词列表中不仅包括关键词,还包括上述关键词的对应权重。
12.根据权利要求1所述的基于高价值对比库的信息处理装置,其特征在于:该信息处理装置还包括信息数据库,其中存储了技术信息,该技术信息包括专利信息;比较文件生成单元生成检索式,在信息数据库中进行检索,而得到相应的文件。
13.根据权利要求1所述的基于高价值对比库的信息处理装置,其特征在于:该信息处理装置还包括排序单元,接收比较单元输出的每个文件的评分值,并对上述评分值加以排序。
14.根据权利要求13所述的基于高价值对比库的信息处理装置,其特征在于:该信息处理装置还包括报告生成单元,根据评分值和排序单元的排序结果来生成报告。
15.根据权利要求1所述的基于高价值对比库的信息处理装置,其特征在于:该比较文件生成单元包括数据生成单元,所述数据生成单元包括分类号获取单元,用于在用户输入特定专利号时,获取上述特定专利的分类号及其交叉分类号;
技术领域语义分析单元,语义分析该特定专利的技术领域而得到相关关键词;
检索式生成单元,获得分类号获取单元获得的分类号及其交叉分类号和技术领域语义分析单元分析获得的关键词及其同义词,来构建检索式;
检索单元,用所构建的检索式进行检索而获得一组比较文件。
16.根据权利要求1所述的基于高价值对比库的信息处理装置,其特征在于:该比较文件生成单元包括数据生成单元,所述数据生成单元包括技术领域分析单元,用于在用户输入相关技术描述时,获取对应的关键词;
分类号获取单元,根据技术领域分析单元所获得的关键词,来分析其相应分类号;
检索式生成单元,获得分类号获取单元获得的分类号和技术领域语义分析单元分析获得的关键词及其同义词,来构建检索式;
检索单元,用所构建的检索式进行检索而获得一组比较文件。
17.根据权利要求15或16所述的基于高价值对比库的信息处理装置,其特征在于:所述数据生成单元包括特定特征分析单元,进一步当检索单元获得的比较文件数量大于一定阈值时,使特定特征分析单元工作,语义分析特定特征;
检索式生成单元,获得分类号获取单元获得的分类号、技术领域语义分析单元分析获得的关键词及其同义词,和特定特征分析单元获得的特定特征关键词及其同义词,来构建检索式。
18.根据权利要求17所述的基于高价值对比库的信息处理装置,其特征在于:当由特定特征分析单元获得的特定特征有多个时,对该特定特征进行优先级排序,按优先级顺序来构建包含特定特征的检索式。
19.根据权利要求15、16、18的其中之一所述的基于高价值对比库的信息处理装置,其特征在于:根据高价值文件的数量来对数据生成单元所生成的检索式进行调整。
20.根据权利要求5所述的基于高价值对比库的信息处理装置,其特征在于:上述第二或第三分析单元包括专利信息获取单元,获得比较文件生成单元检索获得的每个文件的信息;
前序关键词获取单元,语义分析每个文件的独立权利要求的前序部分,来获得其相应关键词及其词频;
独权关键词获取单元,语义分析独立权利要求的特征部分,来获得相应关键词及其词频;
从权关键词获取单元,语义分析从属权利要求的特征部分,来获得相应关键词及其词频;
综合单元,综合前序关键词获取单元、独权关键词获取单元和从权关键词获取单元获得的关键词及其词频,并通过对上述获得的关键词进行同义词合并,来获得相应关键词列表。
21.根据权利要求20所述的基于高价值对比库的信息处理装置,其特征在于:对前序关键词获取单元、独权关键词获取单元和从权关键词获取单元获取的关键词赋予不同的权重,综合单元获取上述关键词、词频和权重,并进行同义关键词合并,而得到关键词列表。
22.根据权利要求1所述的基于高价值对比库的信息处理装置,其特征在于:上述比较单元包括参考关键词权重排序单元,按权重对参考关键词进行排序,并对其中的关键词赋予不同的序号,而得到第二参考关键词列表;
关键词顺序分析单元,获得第二分析单元得到的每个文件的多个关键词中的每一个在第二参考关键词表中的序号;
求和单元,对关键词顺序分析单元得到的每个关键词的序号进行求和,而得到上述评分值。
23.根据权利要求1所述的基于高价值对比库的信息处理装置,其特征在于:该比较单元进一步具有关键词相似度分析单元,输入参考关键词及其权重和第二分析单元得到的每个文件的关键词及其权重,而得到其相似度;将该相似度进一步输出到求和单元中,来对求和单元输出的评分值进行调整。
24.一种基于高价值对比库的信息处理系统,其特征在于,包括:
输入装置、权利要求1-16、18、20-23的其中之一所述的信息处理装置以及显示装置;其中,
输入装置向信息处理装置输入用户的输入;显示装置,显示信息处理装置输出的数据,该数据是评分值、排序单元输出的排序结果或报告。
25.根据权利要求24所述的基于高价值对比库的信息处理系统,其特征在于:
其中用户输入特定专利号或相关技术描述,当用户输入特定专利号时,显示装置在显示信息处理装置输出的数据时,高亮显示与该特定专利有关的数据。
26.一种基于高价值对比库的计算机系统,其特征在于,包括:
输入装置,由用户向计算机系统输入信息;
存储器,该存储器中存储了计算机指令信息,
处理器,从存储器中读取该计算机指令信息,进行处理,使得该处理器可接收用户向输入装置输入的信息;据用户输入的信息,生成检索式来检索与该用户输入的信息对应的领域范围,并存储检索获得的文件;根据预定指标对比较文件生成单元获得的文件进行筛选,从而获得一组高价值文件;语义分析由比较文件生成单元检索获得的每个文件,得到每个文件的关键词列表;语义分析由指标筛选单元获得的该组高价值文件,得到该组高价值文件的关键词列表集合,并将该关键词列表集合作为参考关键词列表;将检索获得的每个文件的关键词列表与参考关键词列表相比较,得到评分值。
27.根据权利要求26所述的基于高价值对比库的计算机系统,其特征在于:该处理器还进一步读取计算机指令信息,进行处理,使得该处理器可将所得到的评分值进行排序,得到排序结果,并根据排序结果,生成相应的报告。
28.根据权利要求26或27所述的基于高价值对比库的计算机系统,其特征在于,该计算机系统还包括显示器,用于显示处理器输出的评分值、排序结果或报告。
29.根据权利要求28所述的基于高价值对比库的计算机系统,其特征在于:当用户输入的信息是特定专利号时,显示器高亮显示该特定专利号的评分值、排序结果或报告中与该特定专利号相关的数据。
30.一种基于高价值对比库的知识产权管理系统,其特征在于:具有年费管理装置,根据权利要求1的信息处理装置或权利要求26的计算机系统输出的评分值,来决定继续支付年费或放弃支付年费。
31.一种基于高价值对比库的企业运营管理系统,其特征在于:根据权利要求1的信息处理装置或权利要求26的计算机系统输出的评分值,来选择投资对象。
32.根据权利要求31所述的基于高价值对比库的企业运营管理系统,其特征在于:将权利要求1的信息处理装置或权利要求26的计算机系统输出的评分值与该运营管理系统中存储的运营数据相结合,来得到评价值。
33.一种基于高价值对比库的信息处理方法,其特征在于,包括:
接收步骤,接收用户输入的信息;
比较文件生成步骤,根据用户输入的信息,生成检索式来检索与该用户输入的信息对应的领域范围,并存储检索获得的文件;
指标筛选步骤,根据预定的指标对比较文件生成步骤获得的文件进行筛选,从而获得一组高价值文件;
第二分析步骤,语义分析由比较文件生成步骤检索获得的每个文件,得到每个文件的关键词列表;
参考关键词列表存储步骤,语义分析由指标筛选步骤获得的该组高价值文件,得到该组高价值文件的关键词列表集合,并将该关键词列表集合作为参考关键词列表;
比较步骤,将第二分析步骤获得的每个文件的关键词列表与参考关键词列表相比较,得到评分值。
34.根据权利要求33所述的基于高价值对比库的信息处理方法,其特征在于:
该指标筛选步骤的预定指标包括无效诉讼信息、专利运营信息、被引证次数信息、同族数量信息、缴费信息以及奖项信息;
其中,该指标筛选步骤根据上述预定指标中的一个或多个,从比较文件生成步骤获得的文件中筛选获得一组高价值文件。
35.根据权利要求33所述的基于高价值对比库的信息处理方法,其特征在于:
该信息处理方法还包括特征值分析步骤,根据用户输入的信息来获得一批文件,将该批文件分类为第一组文件和第二组文件,其中第一组文件是已知的高附加值文件,第二组文件是已知的不具有高附加值的文件,获得上述两组文件的指标差大于一定阈值的指标作为特征值;
其中,该指标筛选步骤根据上述特征值中的一个或多个,从比较文件生成步骤获得的文件中筛选获得一组高价值文件。
36.根据权利要求35所述的基于高价值对比库的信息处理方法,其特征在于:
当用户输入的信息是特定专利时,获取该特定专利的分类号来获得该批文件;当用户输入的信息是相应技术描述时,通过统计分析获得该相应技术描述对应的分类号,并基于上述分类号来获得该批文件。
37.根据权利要求33所述的基于高价值对比库的信息处理方法,其特征在于:
该参考关键词列表存储步骤包括第三分析步骤,语义分析由指标筛选步骤获得的该组高价值文件。
38.根据权利要求33所述的基于高价值对比库的信息处理方法,其特征在于:该比较文件生成步骤包括数据生成步骤和对比库,其中,数据生成步骤根据用户输入的信息,生成检索式进行检索;将检索获得的文件存储到对比库中。
39.根据权利要求33所述的基于高价值对比库的信息处理方法,其特征在于:将由指标筛选步骤筛选出的该组高价值文件存储到高价值对比库中。
40.根据权利要求37所述的基于高价值对比库的信息处理方法,其特征在于:该第三分析步骤先通过语义分析,获得该组高价值文件中的每个文件的关键词列表,之后通过整合上述每个文件的关键词列表,并进行同义词合并后,得到该组高价值文件的关键词列表集合来作为参考关键词列表。
41.根据权利要求33所述的基于高价值对比库的信息处理方法,其特征在于:接收步骤接收的用户输入信息包括用户输入的特定专利号或相关技术描述。
42.根据权利要求41所述的基于高价值对比库的信息处理方法,其特征在于:当用户输入的信息是特定专利号时,对比库还用第一指示信息来指示该特定专利号;且比较步骤也输出第二指示信息,该第二指示信息指示用户输入的特定专利号的评分值。
43.根据权利要求33所述的基于高价值对比库的信息处理方法,其特征在于:上述关键词列表和参考关键词列表中不仅包括关键词,还包括上述关键词的对应权重。
44.根据权利要求33所述的基于高价值对比库的信息处理方法,其特征在于:该信息处理方法用于信息处理装置中,该信息处理装置还包括信息数据库,其中存储了技术信息,该技术信息包括专利信息;比较文件生成步骤生成检索式,在信息数据库中进行检索,而得到相应的文件。
45.根据权利要求33所述的基于高价值对比库的信息处理方法,其特征在于:该信息处理方法还包括排序步骤,接收比较步骤输出的每个文件的评分值,并对上述评分值加以排序。
46.根据权利要求45所述的基于高价值对比库的信息处理方法,其特征在于:该信息处理方法还包括报告生成步骤,根据评分值和排序步骤的排序结果来生成报告。
47.根据权利要求38所述的基于高价值对比库的信息处理方法,其特征在于:所述数据生成步骤包括分类号获取步骤,用于在用户输入特定专利号时,获取上述特定专利的分类号及其交叉分类号;
技术领域语义分析步骤,语义分析该特定专利的技术领域而得到相关关键词;
检索式生成步骤,获得分类号获取步骤获得的分类号及其交叉分类号和技术领域语义分析步骤分析获得的关键词及其同义词,来构建检索式;
检索步骤,用所构建的检索式进行检索而获得一组比较文件。
48.根据权利要求38所述的基于高价值对比库的信息处理方法,其特征在于:所述数据生成步骤包括技术领域分析步骤,用于在用户输入相关技术描述时,获取对应的关键词;
分类号获取步骤,根据技术领域分析步骤所获得的关键词,来分析其相应分类号;
检索式生成步骤,获得分类号获取步骤获得的分类号和技术领域语义分析步骤分析获得的关键词及其同义词,来构建检索式;
检索步骤,用所构建的检索式进行检索而获得一组比较文件。
49.根据权利要求47或48所述的基于高价值对比库的信息处理方法,其特征在于:所述数据生成步骤包括特定特征分析步骤,进一步当检索步骤获得的比较文件数量大于一定阈值时,使特定特征分析步骤工作,语义分析特定特征;
检索式生成步骤,获得分类号获取步骤获得的分类号、技术领域语义分析步骤分析获得的关键词及其同义词,和特定特征分析步骤获得的特定特征关键词及其同义词,来构建检索式。
50.根据权利要求49所述的基于高价值对比库的信息处理方法,其特征在于:当由特定特征分析步骤获得的特定特征有多个时,对该特定特征进行优先级排序,按优先级顺序来构建包含特定特征的检索式。
51.根据权利要求47-48、50的其中之一所述的基于高价值对比库的信息处理方法,其特征在于:
根据高价值文件的数量来对数据生成步骤所生成的检索式进行调整。
52.根据权利要求37所述的基于高价值对比库的信息处理方法,其特征在于:上述第二或第三分析步骤包括专利信息获取步骤,获得比较文件生成步骤检索获得的每个文件的信息;
前序关键词获取步骤,语义分析每个文件的独立权利要求的前序部分,来获得其相应关键词及其词频;
独权关键词获取步骤,语义分析独立权利要求的特征部分,来获得相应关键词及其词频;
从权关键词获取步骤,语义分析从属权利要求的特征部分,来获得相应关键词及其词频;
综合步骤,综合前序关键词获取步骤、独权关键词获取步骤和从权关键词获取步骤获得的关键词及其词频,并通过对上述获得的关键词进行同义词合并,来获得相应关键词列表。
53.根据权利要求52所述的基于高价值对比库的信息处理方法,其特征在于:对前序关键词获取步骤、独权关键词获取步骤和从权关键词获取步骤获取的关键词赋予不同的权重,综合步骤获取上述关键词、词频和权重,并进行同义关键词合并,而得到关键词列表。
54.根据权利要求33所述的基于高价值对比库的信息处理方法,其特征在于:上述比较步骤包括参考关键词权重排序步骤,按权重对参考关键词进行排序,并对其中的关键词赋予不同的序号,而得到第二参考关键词列表;
关键词顺序分析步骤,获得第二分析步骤得到的每个文件的多个关键词中的每一个在第二参考关键词表中的序号;
求和步骤,对关键词顺序分析步骤得到的每个关键词的序号进行求和,而得到上述评分值。
55.根据权利要求33所述的基于高价值对比库的信息处理方法,其特征在于:该比较步骤进一步具有关键词相似度分析步骤,输入参考关键词及其权重和第二分析步骤得到的每个文件的关键词及其权重,而得到其相似度;将该相似度进一步输出到求和步骤中,来对求和步骤输出的评分值进行调整。
CN201610809108.4A 2016-09-07 2016-09-07 一种基于高价值对比库的信息处理装置及方法 Active CN106372225B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610809108.4A CN106372225B (zh) 2016-09-07 2016-09-07 一种基于高价值对比库的信息处理装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610809108.4A CN106372225B (zh) 2016-09-07 2016-09-07 一种基于高价值对比库的信息处理装置及方法

Publications (2)

Publication Number Publication Date
CN106372225A CN106372225A (zh) 2017-02-01
CN106372225B true CN106372225B (zh) 2020-05-19

Family

ID=57899297

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610809108.4A Active CN106372225B (zh) 2016-09-07 2016-09-07 一种基于高价值对比库的信息处理装置及方法

Country Status (1)

Country Link
CN (1) CN106372225B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108073569B (zh) * 2017-06-21 2021-08-27 北京华宇元典信息服务有限公司 一种基于多层级多维度语义理解的法律认知方法、装置和介质
CN110414753A (zh) * 2018-04-27 2019-11-05 南方电网科学研究院有限责任公司 一种知识产权价值评估系统及其方法
CN108897832B (zh) * 2018-06-22 2021-09-03 申报家(广州)智能科技发展有限公司 一种自动分析价值信息的方法与装置
CN109102197A (zh) * 2018-08-23 2018-12-28 佛山市木记信息技术有限公司 专利价值评估体系
CN109325101A (zh) * 2018-09-18 2019-02-12 江苏润桐数据服务有限公司 一种高价值专利的自动获得方法和装置
CN109325100A (zh) * 2018-09-18 2019-02-12 江苏润桐数据服务有限公司 一种高价值专利的自动获得方法和装置
CN109559256A (zh) * 2018-11-15 2019-04-02 苏州征之魂专利技术服务有限公司 一种专利数据挖掘系统及方法
JP6550583B1 (ja) * 2018-12-11 2019-07-31 株式会社AI Samurai 特許マップ表示装置及び特許マップ表示方法並びに特許マップ表示プログラム
CN111080309B (zh) * 2019-12-25 2022-05-06 支付宝(杭州)信息技术有限公司 针对多个对象或多个模型的数据处理方法、装置及设备
CN112182030A (zh) * 2020-09-30 2021-01-05 索意互动(北京)信息技术有限公司 专利文献检索方法、电子设备及计算机可读存储介质
CN113239194B (zh) * 2021-04-30 2023-05-05 中国航空工业集团公司西安飞机设计研究所 专利评议方法、系统、存储介质和电子设备
CN114331766B (zh) * 2022-01-05 2022-07-08 中国科学技术信息研究所 专利技术核心度的确定方法、装置、电子设备及存储介质
CN114612166B (zh) * 2022-05-10 2022-09-09 浙江省标准化研究院(金砖国家标准化(浙江)研究中心、浙江省物品编码中心) 一种产业链的必要专利的分析系统及方法
CN117112735B (zh) * 2023-10-19 2024-02-13 中汽信息科技(天津)有限公司 一种专利数据库的构建方法和电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1573738A (zh) * 2003-06-20 2005-02-02 台湾积体电路制造股份有限公司 自动分析专利文件中申请专利范围的方法、系统及储存媒体
CN102763104A (zh) * 2010-02-26 2012-10-31 乐天株式会社 信息处理装置、信息处理方法、记录了信息处理程序的记录介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6556992B1 (en) * 1999-09-14 2003-04-29 Patent Ratings, Llc Method and system for rating patents and other intangible assets

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1573738A (zh) * 2003-06-20 2005-02-02 台湾积体电路制造股份有限公司 自动分析专利文件中申请专利范围的方法、系统及储存媒体
CN102763104A (zh) * 2010-02-26 2012-10-31 乐天株式会社 信息处理装置、信息处理方法、记录了信息处理程序的记录介质

Also Published As

Publication number Publication date
CN106372225A (zh) 2017-02-01

Similar Documents

Publication Publication Date Title
CN106372225B (zh) 一种基于高价值对比库的信息处理装置及方法
CN106446071B (zh) 信息处理装置及方法
KR101658794B1 (ko) 문서 분류 시스템, 문서 분류 방법 및 문서 분류 프로그램
CN106446070B (zh) 一种基于专利群的信息处理装置及方法
TW201415264A (zh) 取證系統、取證方法及取證程式
JP2013214152A (ja) 文書分別システム及び文書分別方法並びに文書分別プログラム
TW201539216A (zh) 文件分析系統、文件分析方法、及文件分析程式
JP2015052841A (ja) 文書分析システム及び文書分析方法並びに文書分析プログラム
KR101803150B1 (ko) 빅데이터를 이용한 중요 판례 추출 및 정리 방법
CN110569273A (zh) 一种基于相关性排序的专利检索系统及方法
JP5683749B1 (ja) 文書分析システム、文書分析方法、および、文書分析プログラム
TWI556128B (zh) Forensic system, forensic method and evidence collection program
TW201508525A (zh) 文件分類系統、文件分類方法及文件分類程式
WO2016009553A1 (ja) 知財評価システム、知財評価システムの制御方法、および知財評価プログラム
JP5669904B1 (ja) 事前情報を提供する文書調査システム、文書調査方法、及び文書調査プログラム
JP2015084168A (ja) 文書分別調査システム及び文書分別調査方法並びに文書分別調査プログラム
JP2015149085A (ja) データ分析システム、データ分析方法、および、データ分析プログラム
CN113918705A (zh) 带有预警和推荐功能的投稿审核方法及系统
WO2015025978A1 (ja) 文書分別システム及び文書分別方法並びに文書分別プログラム
CN110619212B (zh) 一种基于字符串的恶意软件识别方法、系统及相关装置
KR102472640B1 (ko) 빅데이터 기반 특허 분석 서비스 제공 방법 및 장치
CN114925373B (zh) 基于用户评语的移动应用隐私保护政策漏洞自动识别的方法
JP5990562B2 (ja) 事前情報を提供する文書調査システム、文書調査方法、及び文書調査プログラム
JP2015172952A (ja) 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム
JP5898371B2 (ja) 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant