CN106446071A - 信息处理装置及方法 - Google Patents
信息处理装置及方法 Download PDFInfo
- Publication number
- CN106446071A CN106446071A CN201610807114.6A CN201610807114A CN106446071A CN 106446071 A CN106446071 A CN 106446071A CN 201610807114 A CN201610807114 A CN 201610807114A CN 106446071 A CN106446071 A CN 106446071A
- Authority
- CN
- China
- Prior art keywords
- information
- key word
- unit
- file
- keywords
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services; Handling legal documents
- G06Q50/184—Intellectual property management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Technology Law (AREA)
- Operations Research (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种信息处理装置及方法,包括:接收单元,接收用户输入的信息;比较文件生成单元,根据用户输入的信息,生成检索式来检索与该用户输入的信息对应的领域范围,并存储检索获得的文件;分析单元,语义分析检索获得的每个文件,得到每个文件的关键词列表;参考关键词列表存储单元,存储参考关键词列表;比较单元,将分析单元获得的每个文件的关键词列表与参考关键词列表相比较,而得到评分值。由于本发明将与用户输入有关的领域范围内的所有文件都进行分析,并通过对所有文件进行语义分析来进行评分,所以通过对比相同领域的不同文件的评分值,可以很容易地对文件的价值高低进行评价,并筛选出重要度高的技术文件信息。
Description
技术领域
本发明涉及一种信息处理装置及方法,尤其涉及一种对技术信息,例如专利信息进行处理,从而对技术信息进行评分,并筛选出重要度高的信息的方法和装置。
背景技术
技术信息,尤其是专利信息对于企业或科研院所的发展是不可或缺的重要资源。例如在企业或科研院所进行研发或投资前,可以全面了解特定技术领域的现有技术水平,确定正确的研究方向,避免重复开发,节省时间和科研经费。但是由于全世界的申请人每年在各技术领域向不同国家申请了大量不同质量和价值的专利,这些专利中的一些专利对该领域技术做出了巨大的贡献,而另一些专利仅对公知技术进行了微小改进。因此,企业通常需要分析这些庞大的专利信息,以获得有价值的内容。
此外,在企业内部进行技术信息,尤其是专利信息的管理时,通常是将所有的专利集中在一起进行管理,但随着时间的推移和技术的发展,有些申请变为无价值的专利,因此,为了确保维持有价值的专利,同时摒弃无价值的专利,企业通常需要对专利价值进行评估。传统上是以人工方式进行上述专利价值评估的,因此需要消耗大量的人力及时间成本。由此可知,需要构建一种信息处理装置及方法,以自动对相关领域的专利进行评分,从而筛选出有价值的专利信息,并对无价值的专利信息加以摒弃。
在专利文献1(公开号:US2011/0289096A1)中,公开了一种对专利和其他无形资产进行评价的方法和系统,比较第一组已知的具有较高价值的专利(例如诉讼成功的专利)与第二组已知的具有较低价值的专利(例如诉讼不成功或不具有诉讼历史的专利),来获得第一组和第二组专利的多个特征值,其中,第一组专利的上述特征值要大大高于第二组专利的上述特征值,上述特征值可以是专利的维护周期、被引证次数等。使用上述分析出的多个特征值,来建立数学模型或数学算法,以评价未知的一个或一组专利,从而获知待评专利是否具有较高价值。但是,由于专利的保护范围更多地体现为权利要求的保护范围,因此,权利要求对于表征专利的法律价值和技术价值具有重要意义,但在上述专利文献1中,用来评价专利价值的仅仅是如专利的维护周期,被引证次数等特征值,虽然这些特征值可以在一定程度上表征某些专利的法律价值和技术价值,但其只是一些辅助数据,不能通过语义信息,尤其是权利要求的语义信息来对专利的价值进行评价。此外,由于即便是同一辅助数据,其在不同领域的具体指标值也会存在较大差异,例如典型地在电子计算机领域和医药领域,专利维护周期、被引证次数等辅助指标的值之间即存在明显不同,因此,用相同标准在不同领域中评判专利价值也是不科学的。
在专利文献2(CN104751270A)中,公开了一种专利组合管理装置及方法,所述专利组合管理装置包括:专利价值运算单元,根据输入的专利组合价值得分信息输出指令,来运算处理专利信息存储单元内的个别申请的价值得分;年费支付额计算单元,根据专利组合价值得分信息输出指令,从年费信息存储手段的年费表计算对象申请的专利年费支付额;图等生成装置,根据构成专利组合的具有一定关联性的申请和/或专利的群或构成专利组合的个别申请的价值得分,以及由年费支付额计算单元计算而得的年费额,生成预先决定的图形或表;以及显示装置,显示专利组合管理画面。其中,评价得分的重要指标有权利残存期间、权利要求项数、独立权利要求项数、说明书页数、发明数、发明人数、申请人数、实施例数、外国申请的国家数、分案申请数等。由此,可以使申请的评价得分及信息可视化,使企业可直观获知放弃申请的年费减少量。由于专利文献2中用于评价专利价值的数据也仅仅是例如权利残存期间、权利要求项数、独立权利要求项数等非实质数据,因此也不能通过语义信息,尤其是权利要求的语义信息来对专利的价值进行评价。
发明内容
本发明要解决的技术问题是提供一种信息处理装置和方法,尤其是提供一种专利信息处理装置和方法,能够通过语义信息来对专利信息进行处理,从而对专利信息进行评分,并筛选出重要度高的信息。
为解决上述技术问题,本发明的信息处理装置包括:接收单元,接收用户输入的信息;比较文件生成单元,根据用户输入的信息,生成检索式来检索与该用户输入的信息对应的领域范围,并存储检索获得的文件;分析单元,语义分析检索获得的每个文件,得到每个文件的关键词列表;参考关键词列表存储单元,存储参考关键词列表;比较单元,将分析单元获得的每个文件的关键词列表与参考关键词列表相比较,而得到评分值。
本发明的信息处理方法,包括如下步骤:接收步骤,接收用户输入的信息;比较文件生成步骤,根据用户输入的信息,生成检索式来检索与该用户输入的信息对应的领域范围,并存储检索获得的文件;分析步骤,语义分析检索获得的每个文件,得到每个文件的关键词列表;参考关键词列表存储步骤,存储参考关键词列表;比较步骤,将分析单元获得的每个文件的关键词列表与参考关键词列表相比较,而得到评分值。
依照本发明,由于其根据用户输入的信息,生成检索式来检索与该用户输入的信息对应的领域范围,由此可知本发明是在与用户输入的信息对应的领域中来进行评价的,因此,上述方式保证了评价基准的相对统一。另一方面,本发明对检索获得的每个文件进行语义分析,并将所获得的每个文件与参考关键词列表相比较来获得评分值。该参考关键词列表中存储了表征该领域的基础术语的词语或者对基础术语赋予了较大的值(比如权重或频次),通常情况下,当文件中除该基础术语之外,未包含进一步限定某些术语的细化特征关键词,则说明该文件涉及的范围较大,而若文件中包含了很多更为细化的特征关键词,则说明文件涉及的范围较小,因此,通过将文件的关键词列表与参考关键词列表相比较,可以获知该文件与参考关键词列表之间的关系,从而可以对不同的文件赋予不同的评分值。由于本发明将用户输入的领域范围内可检索到的所有文件都进行评分,所以通过对比相同领域的不同文件的评分值,可以很容易地对文件的价值高低进行评价。
可选的,本发明进一步具有排序装置,将比较单元输出的评分结果进行排序,并当用户输入特定专利号时,高亮显示该特定专利的评分值,并且,本发明还可进一步具有报告生成单元,根据排序装置的排序结果来生成报告,由此,可以更直观地看到评分结果,获知文件价值的高低,并得到更易于进行人机交互的报告。
可选的,对于专利文件来说,由于权利要求中包含了法律信息,直接表征该文件的保护范围,而如果分析整个说明书信息,可能会带来更多的噪声,因此,在语义分析检索获得的每个文件时,可以仅对每个文件的权利要求进行分析,从而获得每个文件的关键词列表;可选的,还可仅对每个文件的独立权利要求进行分析,从而获得其关键词列表。
可选的,该参考关键词列表是通过整合分析单元所获得的每个文件的关键词列表,并进行同义词合并后自动形成的关键词列表。即,上述参考关键词列表可以通过自动分析来获得。由此,不需要事先通过人工方式建立每个技术领域的参考关键词,而可通过大数据的方式语义分析某一技术领域的全部技术文献,来获得参考关键词列表,不仅可节约人力,而且通过大数据分析可以更客观地获得该领域的关键词表征。
可选的,由于对于同样的技术文件而言,发表时间越早,意味着该技术文件更有价值,因此,该信息处理装置还可包括日期分析单元,获得比较文件生成单元检索获得的每个文件的日期;评分值调整单元,根据日期分析单元分析得到的日期,来调整比较单元输出的评分值。
可选的,由于辅助指标,比如该文件被同一领域的其他文件的引证程度,专利存续周期等也在一定程度上表征了该文件的价值,因此,信息处理装置还可包括辅助指标分析单元,分析比较文件生成单元检索获得的每个文件的辅助指标;综合单元,对比较单元输出的评分值和辅助指标分析单元输出的辅助指标赋予不同的加权,而得到加权评分值。由此,可以更准确地对该文件进行评分。
可选的,可以根据上述信息处理装置输出的值来进行后续处理,比如可通过参考上述值来进行专利投资等专利运营,或者在企业内部可以根据上述值来评价可以停止哪些专利的维持费用,由此,可以节约大量人力成本。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细的说明,其中:
图1示意性示出了依照本发明的信息处理系统的第一实施例;
图2示意性示出了依照本发明的信息处理系统所实施的处理流程的一实施例;
图3示意性示出了依照本发明的数据生成单元的一实施例;
图4示意性示出了本发明的数据生成单元所实施的处理流程的一实施例;
图5示意性示出了依照本发明的数据生成单元的另一实施例;
图6示意性示出了本发明的数据生成单元所实施的处理流程的另一实施例;
图7示意性示出了依照本发明的分析单元的一实施例;
图8示意性示出了本发明的分析单元所实施的处理流程的一例;
图9示意性示出了依照本发明的比较单元的一实施例;
图10示意性示出了本发明的比较单元所实施的处理流程的一例;
图11示意性示出了依照本发明的比较单元的另一实施例;
图12示意性示出了依照本发明的信息处理系统的第二实施例;
图13示意性示出了依照本发明的信息处理系统的第三实施例;
图14示意性示出了依照本发明的信息处理系统的第四实施例;
图15示意性示出了依照本发明的信息处理系统的第五实施例;
图16示意性示出了依照本发明的信息处理系统的第六实施例。
具体实施方式
结合附图来说明本发明的实施例。需要说明的是,每个附图中的实线表示信号的经过线路,而虚线表示该模块或步骤在整个装置或流程中是可省略的,而点划线表示上述多个模块可进行组合或不进行组合,而独立成为模块。
第一实施例
图1示出了本发明的信息处理系统的一个实施例。图2示出了依照本发明的信息处理系统所实施的处理流程的一实施例。下面,结合图1和图2来进行相应说明。
如图1所示,该信息处理系统包括输入装置101、信息处理装置201和显示装置301。在步骤S2020中,上述输入装置101接收用户输入的信息,该输入信息例如是某个特定专利号或用户关注的相应技术的简单描述。上述信息处理装置包括接收单元202,用于接收用户输入的信息;在步骤S2030中,比较文件生成单元230中的数据生成单元203根据用户输入的信息,生成相应的检索式,并用所生成的检索式在信息数据库217中进行检索而得到包含一组技术文件信息的检索结果,该组技术文件信息的技术领域与某个特定专利号或用户关注的相应技术的技术领域相同,其中,该信息数据库217中预先存储了一批技术文件信息,该技术文件信息包括但不限于各国专利公报、专利公告、实用新型公报、特定标准、核心期刊文件等。之后,在步骤S2040中,数据生成单元203将上述检索结果存储到比较文件生成单元230的对比库204中。
当用户向输入装置101输入的是某个特定专利号时(步骤S2041中“是”),该系统还包括第一分析单元210,对所输入的特定专利进行语义分析,并进行词频分析、相关度分析、冗余信息去除等或上述方式的组合,从而获得与该特定专利号对应的关键词及该关键词的权重。
接着,在步骤S2110中,将对比库204中存储的所有比较文件中的每一个依次输入到第二分析单元211,之后对对比库204中存储的每一个文件进行语义分析,并进行词频分析、相关度分析、冗余信息去除等或上述方式的组合,从而获得与该文件对应的关键词及其权重,并依次将每个文件所对应的关键词及其权重输入到比较单元208。
在步骤S2120中,从参考关键词列表存储单元212获得参考关键词列表,其中,上述参考关键词列表存储单元212用于生成参考关键词列表,该参考关键词列表可以是预先存储在该信息处理装置201中的,这些预先存储的参考关键词是由相应领域的专家根据经验给出的,并在列表中按领域范围进行分类,也可以通过分析对比库204中的技术文件信息来自动获得。即,当通过自动分析获得时,该参考关键词列表存储单元212可包括第三分析单元214和存储器215,其中第三分析单元214通过整合第二分析单元211中获得的关键词及其权重,并通过对其进行同义词整理和归纳,来形成参考关键词列表,该列表包括了相应的参考关键词及其对应权重。或者第三分析单元214也可直接读取对比库204中存储的比较文件,并通过与第一分析单元210或第二分析单元211同样的方式进行分析,之后再对所获得关键词进行同义词归纳和整理,来形成参考关键词列表。
第三分析单元214将所获得的上述参考关键词列表及其权重存储到存储器215中。当然,在通过自动分析获得参考关键词列表时,也可省略该存储器215,而使该参考关键词列表存储单元212仅包括第三分析单元214。
在步骤S2080中,当用户向输入装置101输入的是某个特定专利号时,比较单元208将由第一分析单元210得到的关键词及其权重与参考关键词列表存储单元212中的参考关键词及其权重进行对比,而获得用户所输入的上述特定专利的评分值,同时生成指示信息,该指示信息用于标志该评分值是上述用户输入的特定专利的评分值。
同时,将第二分析单元211所获得的每个文件的关键词及其权重与参考关键词列表存储单元212中的参考关键词及其权重进行对比,而分别得到上述对比库204中存储的每个文件的评分值。
在步骤S3010中,该比较单元208以列表方式将评分结果显示在显示装置301上。当然,也可仅显示部分评分值,比如前300个比较文件和特定专利号的评分值。当用户向输入装置101输入的是某个特定专利号时,以高亮方式显示该特定专利号的评分结果。
该信息处理装置201还可进一步包括排序单元209,即,在S2080和S3010之间插入步骤S2090,接收比较单元208输出的每个评分值,并在进行同族专利或相同专利去重后,将上述比较单元208生成的每个文件的评分值以及用户输入的特定专利对应的评分值进行排序,得到排序结果。可以采用归一化的值来得到排序结果,例如,可以根据文件的相应排序来获得每个文件的序号,之后,再根据每个文件在全部文件中的序号占比来获得相应的归一化排序结果,比如,当某一文件的排序序号是21时,而共有553个比较文件时,该归一化值为21/553,并将该值作为排序结果。
此时,显示装置301接收排序单元209输出的排序结果,当用户向输入装置101输入的是某个特定专利号时,还接收步骤S2080中生成的指示信息,并显示上述排序结果,同时,当用户向输入装置101输入的是某个特定专利号时,以高亮方式显示该特定专利号的评分值。
其中,上述第一分析单元210、第二分析单元211和第三分析单元214中的任两个或全部三个可以仅由一个分析单元216实现。
此外,因专利的权利要求书代表了该专利的法律信息,且独立权利要求包含了大部分重要的法律信息,因此,在第一分析单元210、第二分析单元211和第三分析单元214对专利进行语义分析时,可以仅对其权利要求进行分析,或仅对独立权利要求进行分析。
图3是本发明的数据生成单元的一个实施例,对应于用户向输入装置101输入一特定技术文件,如特定专利号的情形。图4是本发明的数据生成单元的处理流程图。下面结合图3和图4来进行说明。该数据生成单元203包括技术领域语义分析单元2031、分类号获取单元2032、特定特征提取单元2033和检索式生成单元2034。其中,在用户向输入装置101输入特定专利号时,该数据生成单元203在图4的步骤S20301中从信息数据库217中检索该特定专利号而获得上述特定专利的信息。
之后,该技术领域语义分析单元2031在图4的步骤S20302中从所获得的上述特定专利的信息中提取该专利的发明名称、说明书的技术领域、权利要求的前序部分进行语义分析,而获得与该特定专利有关的技术领域关键词。通过语义分析方法来获得关键词的方法是现有技术中常用的技术,方法有例如US2010/0185689A1和CN104239300A所公开的通过语义分析来提取关键词的方法等。
在提取出相应的关键词后,技术领域语义分析单元2031在图4的步骤S20303中访问同义词库2036,获取所提取的关键词的同义词。其中,同义词是预先存储在同义词库2036中的。分类号获取单元2032在图4的步骤S20304中提取用户输入的特定专利的分类号,并获得上述特定专利分类号的交叉分类号。其中该交叉分类号的获取方法包括预先建立所有分类号的交叉分类号映射,在提取出特定专利的分类号后,通过映射方式获得其所有交叉分类号;或者通过统计分析获得该特定专利的分类号的方法等。
在步骤S20313中,将表示是否进行了特定特征提取的标志i设为0。
之后,检索式生成单元2034在图4的步骤S20305中获得技术领域语义分析模块所提取的关键词及其同义词和分类号获取单元2032获取的分类号,来构建检索式。
在步骤S20306中通过检索单元2035用由检索式生成单元2034所生成的检索式在信息数据库库217中进一步检索而获得检索结果,当步骤S2037中的检索结果超过第一阈值且i<5时(对应于步骤S20307中的“是”),该第一阈值的取值范围是例如5000,说明检索结果存在较大噪声,此时数据生成单元203启动图4的步骤S20314,使标志i=i+1,并在S20315中判断i是否为1。在i为1的情况下,表示需进行特定特征提取,而在步骤S20308中,使特定特征提取单元2033工作,该特定特征提取单元2033从权利要求的特征部分、说明书全文中寻找出现“技术问题”、“发明目的”等体现该所要解决的技术问题的句子或段落,从上述句子或段落中通过与上述类似的语义分析方法来获得上述句子或段落的关键词。
当特定特征提取单元2033提取的关键词有多个时,对上述关键词进行优先级排序,例如可根据权利要求的序号、与“发明目的”、“技术问题”的词距远近程度、词频的概率、与发明名称之间的相关程度等来建立该优先级顺序,并将上述关键词命名为优先级1关键词、优先级2关键词….优先级N关键词。
在图4的步骤S20309中,将特定特征提取单元2033提取的关键词,即优先级1关键词、优先级2关键词….优先级N关键词与排除词库2037相比较,而将表示该领域通用含义的词语排除,该排除词例如是“处理器”、“数据”、“信息”、“信号”、“单元”、“模块”等代表了本领域通用结构的词语。例如在此例中,优先级1关键词是通用词,因此,在步骤S20310中将其抛弃。
在步骤S20311中,以优先级为顺序对保留关键词进行排序,例如在此例中,保留的关键词是优先级2关键词….优先级N关键词。之后,从优先级最高的关键词开始,即在本例中,从优先级2关键词开始,查询同义词库2036,获得该优先级2关键词的同义词,在步骤S20305中,以步骤S20303获得的技术领域的关键词及其同义词、步骤S20304中获得的特定专利的分类号及其交叉分类号以及步骤S20312中获得的优先级2关键词及其同义词库为基础,构建检索式,并继续在S20307中判断检索结果是否大于第一阈值且i是否小于5,在检索结果大于第一阈值且i小于5的情况下,继续进行S20314,使i=i+1,由于此时i=2,因此,直接进入到S20312中,获取优先级次之的优先级3关键词及其同义词,并与步骤S20303获得的关键词及其同义词、步骤S20304获得的分类号及其交叉分类号以及优先级2关键词一起,在步骤S20305中构建检索式,直至S20307的判定结果为否。
当S20307的判定结果为否时,结束流程。将此时数据生成单元203所获得的数据存储到对比库204中。
图5是本发明的数据生成单元的另一实施例。图6是本发明的数据生成单元所实施的处理流程的另一例。其对应于用户输入相关技术的简单描述的情形。如图5所示,数据生成单元203包括技术领域分析单元2031’,分类号获取单元2032’、特定特征分析单元2033’、检索式生成单元2034’和检索单元2035’。如图6所示,该技术领域分析单元2031’在步骤S20301’中获取用户输入的有关技术领域的相关描述,该描述可以是用户输入的有关技术领域的关键词或者相应句子表述。在用户输入是句子表述时,可通过语义分析将该句子拆分成表征技术领域的关键词。
之后,在步骤S20302’中,访问同义词库2036,来获取与用户输入的技术领域有关的关键词对应的同义词。
在步骤S20303’中,通过在信息数据库217中检索该技术领域的关键词及其同义词,来统计与该技术领域对应的分类号。由于关键词检索会引入大量噪声,通常认为排序在后的分类号与申请人输入的技术领域无关,因此,可以只选取统计分析得到的前10或前20分类号作为需要检索的分类号。
该图6的后续步骤与图4的相应流程步骤相同,因此,在此省略说明。
图7是本发明的分析单元的一实施例。图8是本发明的分析单元的处理流程图。下面结合图7和图8来进行说明。如图7所示,第一分析单元210包括专利信息获取单元2101、前序关键词获取单元2102、独权关键词获取单元2103、从权关键词获取单元2104和综合单元2105。
专利信息获取单元2101在步骤S21001中获取与专利号对应的专利信息,在步骤S21002中,前序关键词获取单元2102提取出独立权利要求,并通过语义分析来分析其前序部分,获得关键词表,并通过访问同义词库2036,合并所获得的关键词同义词而得到关键词表1,获得该关键词表1中的每个关键词对应的词频,并对其赋予第一加权值W1。
在步骤S21003中,独权关键词获取单元2103提取独立权利要求的特征部分,并通过语义分析和访问同义词库2036而获得关键词表2及关键词表2的关键词的对应词频,同时根据上述关键词表2中的关键词与前序部分的相关关系对其赋予不同的相关度,并对上述关键词表2中的关键词赋予第二加权值W2。
在步骤S21004中,从权关键词获取单元2104提取从属权利要求的特征,并通过语义分析和访问同义词库2036获得关键词表3及关键词表3的关键词的对应词频,同时根据上述关键词表3中的关键词与前序部分的相关关系对其赋予不同的相关度,并对上述关键词表3中的关键词赋予第三加权值W3。
在步骤S21005中,综合单元2105获取步骤S21002、S21003、S21004的关键词、词频、相关值,加权值,并进一步进行同义关键词合并,而得到关键词列表,该列表中存储了相关关键词及其对应权重。
图1中的第二分析单元211的结构和处理流程与上述第一分析单元210相似,在此省略相应说明。
图1中的第三分析单元214接收第二分析单元211分析得出的对比库204中存储的每个文件的关键词及其权重,并访问同义词库2036来进行同义词整理和归纳,而形成参考关键词列表,该列表包括了相应的参考关键词及其对应权重。
图9是本发明的比较单元208的一个实施例。图10是本发明的比较单元208所实施的实施流程的一个实施例。如图9和图10所示,本发明的比较单元208包括参考关键词权重排序单元2081、关键词顺序分析单元2082和求和单元2083。首先,在步骤S20801中,对所输入的参考关键词列表及其权重,按权重对参考关键词进行排序,并赋予每个关键词相应的序号。在步骤S20802中,获得待评专利的关键词及其权重。该待评专利可以是用户向图1的输入装置101输入的特定专利或者图1的对比库204中的每一个文件。接着,在步骤S20803中,由关键词顺序分析单元2082获得待评专利中的每个关键词在参考关键词表中的序号,之后由求和单元2083在步骤S20804中对待评专利的每个关键词的序号求和,而获得最终的评分值。
图11是本发明的比较单元的另一实施例。对于其与图9的相同模块与结构,引用与图9相同的图标记而省略说明。在这里,仅说明其与图9的不同点。图11的比较单元208还包括关键词相似度分析单元2085’,用于输入参考关键词及其权重值和待评专利关键词及其权重,分析其相似度后,输出到求和单元2083’。该相似度分析方法包括但不限于求取参考关键词及其权重值和待评专利关键词及其权重之间的向量夹角,从而获得其相似度。由此,通过相似度来调整求和单元2083’输出的求和值,从而得到评分值。
第二实施例
图12示出了本发明的信息处理系统的另一实施例。对于与图1具有相同功能的模块或单元,在图12中引用同一附图标记而省略说明。在这里,仅说明其与图1的不同点。
图12中,该信息处理装置201’还包括报告生成单元218,接收排序单元209输出的排序结果,当用户向输入装置101输入的是某个特定专利号时,还接收指示该特定专利的评分值的指示信息,并根据上述排序结果和指示信息,生成相应的图表与对应的说明,从而生成报告,并将对应的报告输出到显示装置301。
上述报告包括重要度最高的多项技术或专利以及当用户向输入装置101输入的是某个特定专利号时,该特定技术或专利的排名情况、重要度最高的专利的申请人分布、特定申请人的专利重要度时间分布、领域分布等。
由此,用户可以通过图文等直观的方式获知评价结果,以便进行后续操作。
第三实施例
图13示出了本发明的信息处理系统的又一实施例。对于与图1具有相同功能的模块或单元,在图13中引用同一附图标记而省略说明。在这里,仅说明其与图1的不同点。
图13中,与图1中相同,该数据生成单元203将检索结果存储到对比库204’中。由于当向输入装置101输入的是某个特定专利号时,数据生成单元203是以该输入的特定专利号为基础来生成检索式的,因此,此时所输入的特定专利号也包含在对比库204’的比较文件中。
因此,此时可以省略设置第一分析单元210。此时,对比库204’可获得接收单元202接收的特定专利号,并用一指示信息来标示该特定专利号。第二分析单元211’接收对比库204’中的一组技术文件信息以及表示用户输入的特定专利号的指示信息,来进行分析,并将每个技术文件信息的关键词分析结果和表示用户输入的特定专利的指示信息输入到比较单元208’。
比较单元208’比较上述第二分析单元211’输出的每个文件的关键词与参考关键词列表存储单元212的参考关键词的比较结果,而得到上述对比库204’中存储的每个文件的评分值以及表示用户输入的特定专利的评分值的指示信息。
之后,将上述每个文件的评分值以及表示用户输入的特定专利的评分值的指示信息输入到排序单元209’进行排序。排序单元209’将排序结果以及表示用户输入的特定专利的评分值的指示信息输出到显示单元301来加以显示。
当然,上述图13的信息处理装置201’也可如图12所示,具有报告生成单元218,生成相应的图表与对应的说明,从而生成报告,并将对应的报告输出到显示装置301。
第四实施例
图14表示本发明的信息处理装置的第四实施例。对于与图1具有相同功能的模块或单元,在图14中引用同一附图标记而省略说明。在这里,仅说明其与图1的不同点。
该图14的信息处理装置201”’还包括日期分析单元230和第一评分值调整单元231。该日期分析单元230分析待评专利的日期,例如申请日。该待评专利是用户向图1的输入装置101输入的特定专利或者图1的对比库204中的每一个文件,其是比较单元208输出的专利的评分值所对应的文件。
第一评分值调整单元231根据日期分析单元230输出的日期,对比较单元208输出的评分值进行调整。其中,日期分析单元230分析该对比库204中的每一个比较文件,求出这些文件的日期平均值,之后将日期分析单元230获得的某个比较文件的日期与上述日期平均值相比,根据其距日期平均值的距离,获得调整值b,并用调整值b与比较单元208输出的评分值加权,来进行调整。其中,当某个比较文件的日期早于平均值时,该调整值b>1,且比较文件的日期越早,调整值b越大;该某个比较文件专利的日期晚于平均值时,该调整值b<1,且比较文件的日期越晚,调整值b越小。
显示装置301显示该第一评分值调整单元231输出的结果。当然,还可在第一评分值调整单元231后具有排序单元,对调整后的评分值进行排序。同时,该信息处理装置201”’还可具有报告生成单元,根据调整后的评分值生成报告,并将报告结果显示在显示装置301上。
第五实施例
图15表示本发明的信息处理装置的又一实施例。对于与图1具有相同功能的模块或单元,在图15中引用同一附图标记而省略说明。在这里,仅说明其与图1的不同点。
图15的信息处理装置201””还包括第二评分值调整单元221,接收与图1相同的比较单元208输出评分值和辅助指标分析单元220输出的辅助指标值,其中,该辅助指标值是一个或多个。然后对评分值和辅助指标值赋予不同的加权值,例如对比较单元208输出的评分值给予加权a1,对辅助指标分析单元输出的一个或多个辅助指标分别给予加权值a2……aN,例如,对于第一辅助指标,给予加权值a2,……对于第N辅助指标,给予加权值aN,而由第二评分值调整单元221输出加权评分值。之后,由显示装置301输出该加权平均值。
当然,也可由日期分析单元分析待评专利的日期,通过第一评分值调整单元来调整该评分值后,由辅助指标分析单元220分析待评专利的辅助指标后,对辅助指标分析单元220输出的一个或多个辅助指标给予加权值a2……aN,再通过第二评分值调整单元221对调整后的评分值进行加权,而得到调整加权评分值。
此外,该加权评分值也可经与图1相同的排序单元209排序后输出,或可由图10的报告生成单元218分析该加权评分值而生成报告后,由显示单元301输出。
辅助指标分析单元220分析待评专利的辅助指标,该待评专利是对比库204中存储的每一个比较文件或用户输入的特定专利,所获得的指标可以是例如引证文件量、被引证文件量、独立权利要求字数、法律状态、专利的剩余时间、说明书页数、权利要求项数、同一分类号下的文献量、该领域的PPH比例、该领域的优先审查比例、同一领域的申请人数量、同族专利个数等辅助指标。
第六实施例
本发明的信息处理系统可以由图16所示的计算机系统501来实现。如图16所示,本发明的计算机系统501包括输入装置5013、存储器5011和处理器5012,其中用户向该输入装置5013输入信息,在该存储器5011中存储了计算机指令信息和参考关键词列表,该计算机指令信息是可执行例如图2、4、6、8或10等流程的指令信息;该处理器5012从存储器5011中读取该计算机指令信息,来加以处理,使得该处理器可接收用户输入的信息;根据用户输入的信息,生成检索式来检索与该用户输入的信息对应的领域范围,并存储检索获得的文件;语义分析检索获得的每个文件,得到每个文件的关键词列表;同时将所获得的每个文件的关键词列表与存储器中存储的参考关键词列表相比较,得到评分值,并在计算机系统501的显示器上显示最终的评分结果。在用户输入的信息中包含了特定专利号时,以高亮方式显示该特定专利的评分值。
本发明的信息处理装置及方法可以在如下几个方面实施:
例如,对于企业而言,可以将由本发明的信息处理装置输出的评分值输入到企业的知识产权管理系统中,该知识产权管理系统中具有年费管理装置,该年费管理装置可根据本发明的信息处理装置输出的评分值,来决定继续支付年费或放弃。
例如,也可将本发明的信息处理装置输出的评分值输出到企业运营管理系统中,在投资价值不明的情况下,该企业管理系统具有判断装置,根据上述评分值来分析本企业的核心技术,并针对上述核心技术进行外围布局,以形成专利包,从而更好地保护自身专利。
例如,也可将本发明的信息处理装置输出的评分值与企业运营管理系统中的企业运营数据,例如转让次数、许可次数、转让许可领域、质押、融资领域等相结合,来得到该待评专利的评分值。
根据本发明,企业可评估其竞争对手或其他公司正在研发的技术的相关价值,并基于上述相关价值来进行投资对象的选择,或与其他对手探讨是否进行共同研发,以较早地抢占市场先机。
上面参照附图说明了本发明的实施例,但是本发明的范围并不限于上述实施例,合适地组合或替换各实施例的结构也包含在本发明的范围中。本领域普通技术人员可以根据其知识组合或替换上述各实施例的结构或组成,这些变形的实施方式也包含在本发明的范围中。
Claims (57)
1.一种信息处理装置,其特征在于,包括:
接收单元,接收用户输入的信息;
比较文件生成单元,根据用户输入的信息,生成检索式来检索与该用户输入的信息对应的领域范围,并存储检索获得的文件;
分析单元,语义分析检索获得的每个文件,得到每个文件的关键词列表;
参考关键词列表存储单元,存储参考关键词列表,其中该参考关键词列表对应于上述领域范围;
比较单元,将分析单元获得的每个文件的关键词列表与参考关键词列表相比较,得到评分值。
2.根据权利要求1所述的信息处理装置,其特征在于:该语义分析单元通过语义分析比较文件生成单元检索获得的每个文件的权利要求,来获得每个文件的关键词列表。
3.根据权利要求1或2所述的信息处理装置,其特征在于:该语义分析单元通过语义分析比较文件生成单元检索获得的每个文件的独立权利要求,来获得每个文件的关键词列表。
4.根据权利要求1-3的其中之一所述的信息处理装置,其特征在于:该比较文件生成单元包括数据生成单元和对比库,其中数据生成单元根据用户输入的信息,生成检索式进行检索;对比库存储检索获得的文件。
5.根据权利要求1-4的其中之一所述的信息处理装置,其特征在于:上述参考关键词列表是预先存储在参考关键词列表存储单元中的。
6.根据权利要求1所述的信息处理装置,其特征在于:上述参考关键词列表是通过整合分析单元获得的每个文件的关键词列表,并进行同义词合并后自动形成的关键词列表。
7.根据权利要求1所述的信息处理装置,其特征在于:接收单元接收的用户输入信息包括用户输入的特定专利号或相关技术描述。
8.根据权利要求1-7的其中之一所述的信息处理装置,其特征在于:当用户输入的信息是特定专利号时,对比库还用第一指示信息来指示该特定专利号;且比较单元也输出第二指示信息,该第二指示信息指示用户输入的特定专利号的评分值。
9.根据权利要1-8的其中之一所述的信息处理装置,其特征在于:该分析单元包括第一分析单元,语义分析用户输入的特定专利号的关键词而获得该特定专利的关键词列表;第二分析单元,分析该比较文件生成单元所获得的每个文件的关键词列表。
10.根据权利要1-9的其中之一所述的信息处理装置,其特征在于:上述参考关键词存储单元包括第三分析单元,整合第二分析单元所获得的每个文件的关键词列表,并通过访问同义词库来合并整合后的关键词列表中的同义词,而形成参考关键词列表。
11.根据权利要求1-10的其中之一所述的信息处理装置,其特征在于:上述关键词列表和参考关键词列表中不仅包括关键词,还包括上述关键词的对应权重。
12.根据权利要求1-11的其中之一所述的信息处理装置,其特征在于:该信息处理装置还包括信息数据库,其中存储了技术信息,该技术信息包括专利信息;比较文件生成单元生成检索式,在信息数据库中进行检索,而得到相应的文件。
13.根据权利要求1-12的其中之一所述的信息处理装置,其特征在于:该信息处理装置还包括日期分析单元,获得比较文件生成单元检索获得的每个文件的日期;第一评分值调整单元,根据日期分析单元分析得到的日期,来调整比较单元输出的评分值。
14.根据权利要求1-13的其中之一所述的信息处理装置,其特征在于:该信息处理装置包括辅助指标分析单元,分析比较文件生成单元检索获得的每个文件的辅助指标;第二评分值调整单元,对比较单元输出的评分值和辅助指标分析单元输出的辅助指标赋予不同的加权,而得到加权评分值。
15.根据权利要求1-14的其中之一所述的信息处理装置,其特征在于:该信息处理装置还包括排序单元,接收比较单元输出的每个文件的评分值,并对上述评分值加以排序。
16.根据权利要求1-15的其中之一所述的信息处理装置,其特征在于:所述数据生成单元包括分类号获取单元,用于在用户输入特定专利号时,获取上述特定专利的分类号及其交叉分类号;
技术领域语义分析单元,语义分析该特定专利的技术领域而得到相关关键词;
检索式生成单元,获得分类号获取单元获得的分类号及其交叉分类号和技术领域语义分析单元分析获得的关键词及其同义词,来构建检索式;
检索单元,用所构建的检索式进行检索而获得一组比较文件。
17.根据权利要求4所述的信息处理装置,其特征在于:所述数据生成单元包括技术领域分析单元,用于在用户输入相关技术描述时,获取对应的关键词;
分类号获取单元,根据技术领域分析单元所获得的关键词,来分析其相应分类号;
检索式生成单元,获得分类号获取单元获得的分类号和技术领域语义分析单元分析获得的关键词及其同义词,来构建检索式;
检索单元,用所构建的检索式进行检索而获得一组比较文件。
18.根据权利要求16或17所述的信息处理装置,其特征在于:进一步当检索单元获得的比较文件数量大于一定阈值时,使特定特征分析单元工作,语义分析特定特征;
检索式生成单元,获得分类号获取单元获得的分类号、技术领域语义分析单元分析获得的关键词及其同义词,和特定特征分析单元获得的特定特征关键词及其同义词,来构建检索式。
19.根据权利要求18所述的信息处理装置,其特征在于:当由特定特征分析单元获得的特定特征有多个时,对该特定特征进行优先级排序,按优先级顺序来构建包含特定特征的检索式。
20.根据权利要求1-19的其中之一所述的信息处理装置,其特征在于:该分析单元包括专利信息获取单元,获得比较文件生成单元检索获得的每个文件的信息;
前序关键词获取单元,语义分析每个文件的独立权利要求的前序部分,来获得其相应关键词及其词频;
独权关键词获取单元,语义分析独立权利要求的特征部分,来获得相应关键词及其词频;
从权关键词获取单元,语义分析从属权利要求的特征部分,来获得相应关键词及其词频;
综合单元,综合前序关键词获取单元、独权关键词获取单元和从权关键词获取单元获得的关键词及其词频,并通过对上述获得的关键词进行同义词合并,来获得相应关键词列表。
21.根据权利要求20所述的信息处理装置,其特征在于:对前序关键词获取单元、独权关键词获取单元和从权关键词获取单元获取的关键词赋予不同的权重,综合单元获取上述关键词、词频和权重,并进行同义关键词合并,而得到关键词列表。
22.根据权利要求10所述的信息处理装置,其特征在于:上述比较单元包括参考关键词权重排序单元,按权重对参考关键词进行排序,并对其中的关键词赋予不同的序号,而得到第二参考关键词列表;
关键词顺序分析单元,获得分析单元得到的每个文件的多个关键词中的每一个在第二参考关键词表中的序号;
求和单元,对关键词顺序分析单元得到的每个关键词的序号进行求和,而得到上述评分值。
23.根据权利要求1-22的其中之一所述的信息处理装置,其特征在于:该比较单元进一步具有关键词相似度分析单元,输入参考关键词及其权重和分析单元得到的每个文件的关键词及其权重,而得到其相似度;将该相似度进一步输出到求和单元中,来对求和单元输出的评分值进行调整。
24.一种信息处理系统,其特征在于,包括:
输入装置、权利要求1-23的其中之一所述的信息处理装置以及显示装置;其中输入装置向信息处理装置输入用户的输入;显示装置,显示信息处理装置输出的数据,该数据是评分值、加权评分值、排序单元输出的排序结果或报告。
25.根据权利要求24所述的信息处理系统,其特征在于:
其中用户输入特定专利号或相关技术描述,当向用户输入特定专利号时,显示装置在显示信息处理装置输出的数据时,高亮显示与该特定专利有关的数据。
26.一种计算机系统,其特征在于,包括:
输入装置,由用户向其输入信息;
存储器,该存储器中存储了计算机指令信息和参考关键词列表,
处理器,从存储器中读取该计算机指令信息,进行处理,使得该处理器可接接收用户输入的信息;根据用户输入的信息,生成检索式来检索与该用户输入的信息对应的领域范围,并存储检索获得的文件;语义分析检索获得的每个文件,得到每个文件的关键词列表;同时将所获得的每个文件的关键词列表与存储器中存储的参考关键词列表相比较,得到评分值。
27.根据权利要求26所述的计算机系统,其特征在于:该处理器还进一步读取计算机指令信息,进行处理,使得该处理器可将所得到的评分值进行排序,得到排序结果,并根据排序结果,生成相应的报告。
28.根据权利要求27所述的计算机系统,其特征在于:该处理器还进一步读取计算机指令信息,进行处理,使得该处理器可分析检索获得的每个文件的日期,并根据分析得到的日期,来调整所输出的评分值。
29.根据权利要求26所述的计算机系统,其特征在于:该处理器还进一步读取计算机指令,进行处理,使其获得检索得到的每个文件的一个或多个辅助指标,并将评分值和辅助指标赋予不同的加权,而得到加权评分值。
30.根据权利要求26-29的其中之一所述的计算机系统,其特征在于,该计算机系统还包括显示器,用于显示处理器输出的评分值、加权评分值、排序结果或报告。
31.根据权利要求26所述的计算机系统,其特征在于:当用户输入的信息是特定专利号时,显示器高亮显示该特定专利号的评分值、排序结果或报告中与该特定专利号相关的数据。
32.一种知识产权管理系统,其特征在于:具有年费管理装置,根据权利要求1的信息处理装置或权利要求26的计算机系统输出的评分值,来决定继续支付年费或放弃支付年费。
33.一种企业运营管理系统,其特征在于:根据权利要求1的信息处理装置或权利要求26的计算机系统输出的评分值,来选择投资对象。
34.根据权利要求33所述的企业运营管理系统,其特征在于:将权利要求1的信息处理装置或权利要求26的计算机系统输出的评分值与该运营管理系统中存储的运营数据相结合,来得到评价值。
35.一种信息处理方法,其特征在于,包括步骤:
接收步骤,接收用户输入的信息;
比较文件生成步骤,根据用户输入的信息,生成检索式来检索与该用户输入的信息对应的领域范围,并存储检索获得的文件;
分析步骤,语义分析检索获得的每个文件,得到每个文件的关键词列表;
参考关键词列表存储步骤,存储参考关键词列表,其中该参考关键词列表对应于上述领域范围;
比较步骤,将分析步骤获得的每个文件的关键词列表与参考关键词列表相比较,而得到评分值。
36.根据权利要求35所述的信息处理方法,其特征在于:该分析步骤通过语义分析比较文件生成步骤检索获得的每个文件的权利要求,来获得每个文件的关键词列表。
37.根据权利要求35或36所述的信息处理方法,其特征在于:该分析步骤通过语义分析比较文件生成步骤检索获得的每个文件的独立权利要求,来获得每个文件的关键词列表。
38.根据权利要求35-37的其中之一所述的信息处理方法,其特征在于:该比较文件生成步骤包括数据生成步骤,根据用户输入的信息,生成检索式进行检索和存储步骤,存储检索获得的文件。
39.根据权利要求35所述的信息处理方法,其特征在于:上述参考关键词列表是预先存储在参考关键词列表存储步骤中的。
40.根据权利要求35所述的信息处理方法,其特征在于:上述参考关键词列表是通过整合分析步骤所获得的每个文件的关键词列表,并进行同义词合并后自动形成的关键词列表。
41.根据权利要求35所述的信息处理方法,其特征在于:接收步骤接收的用户输入信息包括用户输入的特定专利号或相关技术描述。
42.根据权利要求35所述的信息处理方法,其特征在于:当用户输入的信息是特定专利号时,对比库还用第一指示信息来指示该特定专利号;且比较步骤也输出第二指示信息,该第二指示信息指示用户输入的特定专利号的评分值。
43.根据权利要35所述的信息处理方法,其特征在于:该分析步骤包括第一分析步骤,语义分析用户输入的特定专利号的关键词而获得该特定专利的关键词列表;第二分析步骤,分析该比较文件生成步骤所获得的每个文件的关键词列表。
44.根据权利要35所述的信息处理方法,其特征在于:上述参考关键词存储步骤包括第三分析步骤,整合第二分析步骤所获得的每个文件的关键词列表,并通过访问同义词库来合并整合后的关键词列表中的同义词,而形成参考关键词列表。
45.根据权利要求35所述的信息处理方法,其特征在于:上述关键词列表和参考关键词列表中不仅包括关键词,还包括上述关键词的对应权重。
46.根据权利要求35所述的信息处理方法,其特征在于:该信息处理方法用于信息处理装置,该信息处理装置包括信息数据库,其中存储了技术信息,该技术信息包括专利信息;比较文件生成步骤生成检索式,在信息数据库中进行检索,而得到相应的文件。
47.根据权利要求35所述的信息处理方法,其特征在于:该信息处理方法还包括日期分析步骤,获得比较文件生成步骤检索获得的每个文件的日期;第一评分值调整步骤,根据日期分析步骤分析得到的日期,来调整比较步骤输出的评分值。
48.根据权利要求35-47的其中之一所述的信息处理方法,其特征在于:该信息处理方法包括辅助指标分析步骤,分析比较文件生成步骤检索获得的每个文件的辅助指标;第二评分值调整方法,对比较步骤输出的评分值和辅助指标分析步骤输出的辅助指标赋予不同的加权,而得到加权评分值。
49.根据权利要求35所述的信息处理方法,其特征在于:该信息处理方法还包括排序步骤,接收比较步骤输出的每个文件的评分值,并对上述评分值加以排序。
50.根据权利要求35所述的信息处理方法,其特征在于:所述数据生成步骤包括分类号获取步骤,用于在用户输入特定专利号时,获取特定专利的分类号及其交叉分类号;
技术领域语义分析步骤,语义分析该特定专利的技术领域而得到相关关键词;
检索式生成步骤,获得分类号获取步骤获得的分类号及其交叉分类号和技术领域语义分析步骤分析获得的关键词及其同义词,来构建检索式;
检索步骤,用所构建的检索式进行检索而获得一组比较文件。
51.根据权利要求35所述的信息处理方法,其特征在于:所述数据生成步骤包括技术领域分析步骤,用于在用户输入相关技术描述时,获取对应的关键词;
分类号获取步骤,根据所获得的技术领域,来分析其相应分类号;
检索式生成步骤,获得分类号获取步骤获得的分类号和技术领域语义分析步骤分析获得的关键词及其同义词,来构建检索式;
检索步骤,用所构建的检索式进行检索而获得一组比较文件。
52.根据权利要求50或51所述的信息处理方法,其特征在于:进一步当检索步骤获得的比较文件数量大于一定阈值时,使特定特征分析步骤工作,语义分析特定特征;
检索式生成步骤,获得分类号获取步骤获得的分类号、技术领域语义分析步骤分析获得的关键词及其同义词,和特定特征分析步骤获得的特定特征关键词及其同义词,来构建检索式。
53.根据权利要求35所述的信息处理方法,其特征在于:当由特定特征分析步骤获得的特定特征有多个时,对该特定特征进行优先级排序,按优先级顺序来构建包含特定特征的检索式。
54.根据权利要求35所述的信息处理方法,其特征在于:该分析步骤包括专利信息获取步骤,获得比较文件生成步骤检索获得的每个文件的信息;
前序关键词获取步骤,语义分析每个文件的独立权利要求的前序部分,来获得其相应关键词及其词频;
独权关键词获取步骤,语义分析独立权利要求的特征部分,来获得相应关键词及其词频;
从权关键词获取步骤,语义分析从属权利要求的特征部分,来获得相应关键词及其词频;
综合步骤,综合前序关键词获取步骤、独权关键词获取步骤和从权关键词获取步骤获得的关键词及其词频,并通过对上述获得的关键词进行同义词合并,来获得相应关键词列表。
55.根据权利要求54所述的信息处理方法,其特征在于:综合步骤,综合前序关键词获取步骤、独权关键词获取步骤和从权关键词获取步骤获得的关键词及其词频,并通过对上述获得的关键词进行同义词合并,来获得相应关键词列表。
56.根据权利要求35所述的信息处理方法,其特征在于:上述比较步骤包括参考关键词权重排序步骤,按权重对参考关键词进行排序,并对其中的关键词赋予不同的序号,而得到第二参考关键词列表;
关键词顺序分析步骤,获得分析步骤得到的每个文件的多个关键词中的每一个在第二参考关键词表中的序号;
求和步骤,对关键词顺序分析步骤得到的每个关键词的序号进行求和,而得到上述评分值。
57.根据权利要求56所述的信息处理方法,其特征在于:该比较步骤进一步具有关键词相似度分析步骤,输入参考关键词及其权重和分析步骤得到的每个文件的关键词及其权重,而输出其相似度;将该相似度进一步输出到求和步骤中,来对求和步骤输出的评分值进行调整。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610807114.6A CN106446071B (zh) | 2016-09-07 | 2016-09-07 | 信息处理装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610807114.6A CN106446071B (zh) | 2016-09-07 | 2016-09-07 | 信息处理装置及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106446071A true CN106446071A (zh) | 2017-02-22 |
CN106446071B CN106446071B (zh) | 2020-03-27 |
Family
ID=58164258
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610807114.6A Active CN106446071B (zh) | 2016-09-07 | 2016-09-07 | 信息处理装置及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106446071B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108073569A (zh) * | 2017-06-21 | 2018-05-25 | 北京华宇元典信息服务有限公司 | 一种基于多层级多维度语义理解的法律认知方法、装置和介质 |
CN109063148A (zh) * | 2018-08-07 | 2018-12-21 | 黑龙江阳光惠远信息技术有限公司 | 一种基于第三方平台的相关专利推荐系统及推荐方法 |
CN109102197A (zh) * | 2018-08-23 | 2018-12-28 | 佛山市木记信息技术有限公司 | 专利价值评估体系 |
CN109117649A (zh) * | 2018-07-23 | 2019-01-01 | 合肥联宝信息技术有限公司 | 一种文件处理方法、装置及计算机可读存储介质 |
CN110503281A (zh) * | 2018-05-16 | 2019-11-26 | 北京牡丹电子集团有限责任公司 | 创新产品加值功能开发辅助性系统及其方法 |
CN111460784A (zh) * | 2020-01-20 | 2020-07-28 | 索意互动(北京)信息技术有限公司 | 分析文本信息的方法、系统和计算机存储介质 |
CN111540472A (zh) * | 2020-05-18 | 2020-08-14 | 霓蝶(上海)医疗科技有限公司 | 一种健康活动的智能风险评估系统及其评估方法 |
CN111557015A (zh) * | 2018-12-11 | 2020-08-18 | 株式会社艾飒木兰 | 专利地图显示装置、专利地图显示方法及专利地图显示程序 |
CN113239194A (zh) * | 2021-04-30 | 2021-08-10 | 中国航空工业集团公司西安飞机设计研究所 | 专利评议方法、系统、存储介质和电子设备 |
CN115619347A (zh) * | 2022-10-19 | 2023-01-17 | 江苏才标信息科技有限公司 | 一种专利管理方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1818907A (zh) * | 2006-03-10 | 2006-08-16 | 上海汉光知识产权数据科技有限公司 | 一种利用ipc分类检索专利的方法 |
CN101276351A (zh) * | 2007-03-30 | 2008-10-01 | 上海汉光知识产权数据科技有限公司 | 一种专利文献检索的方法 |
CN101520785A (zh) * | 2008-02-29 | 2009-09-02 | 富士通株式会社 | 信息检索方法和系统 |
CN103988168A (zh) * | 2011-10-12 | 2014-08-13 | 谷歌公司 | 用于向用户提供意见查询的方法和系统 |
CN105005556A (zh) * | 2015-07-29 | 2015-10-28 | 成都理工大学 | 一种基于地质大数据的标引关键词提取方法和系统 |
CN105389344A (zh) * | 2015-10-21 | 2016-03-09 | 南方电网科学研究院有限责任公司 | 一种自助式查新方法及系统 |
JP2016115277A (ja) * | 2014-12-17 | 2016-06-23 | ダイキン工業株式会社 | 技術者支援システム |
-
2016
- 2016-09-07 CN CN201610807114.6A patent/CN106446071B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1818907A (zh) * | 2006-03-10 | 2006-08-16 | 上海汉光知识产权数据科技有限公司 | 一种利用ipc分类检索专利的方法 |
CN101276351A (zh) * | 2007-03-30 | 2008-10-01 | 上海汉光知识产权数据科技有限公司 | 一种专利文献检索的方法 |
CN101520785A (zh) * | 2008-02-29 | 2009-09-02 | 富士通株式会社 | 信息检索方法和系统 |
CN103988168A (zh) * | 2011-10-12 | 2014-08-13 | 谷歌公司 | 用于向用户提供意见查询的方法和系统 |
JP2016115277A (ja) * | 2014-12-17 | 2016-06-23 | ダイキン工業株式会社 | 技術者支援システム |
CN105005556A (zh) * | 2015-07-29 | 2015-10-28 | 成都理工大学 | 一种基于地质大数据的标引关键词提取方法和系统 |
CN105389344A (zh) * | 2015-10-21 | 2016-03-09 | 南方电网科学研究院有限责任公司 | 一种自助式查新方法及系统 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108073569A (zh) * | 2017-06-21 | 2018-05-25 | 北京华宇元典信息服务有限公司 | 一种基于多层级多维度语义理解的法律认知方法、装置和介质 |
CN108073569B (zh) * | 2017-06-21 | 2021-08-27 | 北京华宇元典信息服务有限公司 | 一种基于多层级多维度语义理解的法律认知方法、装置和介质 |
CN110503281A (zh) * | 2018-05-16 | 2019-11-26 | 北京牡丹电子集团有限责任公司 | 创新产品加值功能开发辅助性系统及其方法 |
CN109117649A (zh) * | 2018-07-23 | 2019-01-01 | 合肥联宝信息技术有限公司 | 一种文件处理方法、装置及计算机可读存储介质 |
CN109063148A (zh) * | 2018-08-07 | 2018-12-21 | 黑龙江阳光惠远信息技术有限公司 | 一种基于第三方平台的相关专利推荐系统及推荐方法 |
CN109102197A (zh) * | 2018-08-23 | 2018-12-28 | 佛山市木记信息技术有限公司 | 专利价值评估体系 |
CN111557015B (zh) * | 2018-12-11 | 2021-08-24 | 株式会社艾飒木兰 | 专利地图显示装置及专利地图显示方法 |
CN111557015A (zh) * | 2018-12-11 | 2020-08-18 | 株式会社艾飒木兰 | 专利地图显示装置、专利地图显示方法及专利地图显示程序 |
CN111460784A (zh) * | 2020-01-20 | 2020-07-28 | 索意互动(北京)信息技术有限公司 | 分析文本信息的方法、系统和计算机存储介质 |
CN111460784B (zh) * | 2020-01-20 | 2023-09-26 | 索意互动(北京)信息技术有限公司 | 分析文本信息的方法、系统和计算机存储介质 |
CN111540472A (zh) * | 2020-05-18 | 2020-08-14 | 霓蝶(上海)医疗科技有限公司 | 一种健康活动的智能风险评估系统及其评估方法 |
CN113239194A (zh) * | 2021-04-30 | 2021-08-10 | 中国航空工业集团公司西安飞机设计研究所 | 专利评议方法、系统、存储介质和电子设备 |
CN113239194B (zh) * | 2021-04-30 | 2023-05-05 | 中国航空工业集团公司西安飞机设计研究所 | 专利评议方法、系统、存储介质和电子设备 |
CN115619347A (zh) * | 2022-10-19 | 2023-01-17 | 江苏才标信息科技有限公司 | 一种专利管理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN106446071B (zh) | 2020-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106446071A (zh) | 信息处理装置及方法 | |
CN106372225A (zh) | 一种基于高价值对比库的信息处理装置及方法 | |
CN106446070A (zh) | 一种基于专利群的信息处理装置及方法 | |
KR101658794B1 (ko) | 문서 분류 시스템, 문서 분류 방법 및 문서 분류 프로그램 | |
US20080301138A1 (en) | Method for Analyzing Patent Claims | |
CN108073673A (zh) | 一种基于机器学习的法律知识图谱构建方法、装置、系统和介质 | |
CN106960063A (zh) | 一种针对招商引资领域的互联网情报抓取和推荐系统 | |
CN105975453A (zh) | 评论标签提取方法和装置 | |
CN110610005A (zh) | 基于深度学习的盗窃罪辅助量刑方法 | |
US20130290197A1 (en) | Patent power calculating device and method for operating patent power calculating device | |
CN110659985A (zh) | 一种捞回误拒潜在用户的方法、装置和电子设备 | |
CN112765974B (zh) | 一种业务辅助方法、电子设备及可读存储介质 | |
CN112801530A (zh) | 一种基于语意拆分的智能评审系统及工作方法 | |
KR20180086084A (ko) | 인공 지능 기술을 적용한 기계 학습 기반의 입력 특허 집합과 관계성 높은 특허 집합을 생성하는 방법 및 장치 | |
CN113918705A (zh) | 带有预警和推荐功能的投稿审核方法及系统 | |
TW201421387A (zh) | 文件管理系統及文件管理方法以及文件管理程式 | |
CN103294741A (zh) | 类似文件检索辅助装置以及类似文件检索辅助方法 | |
RU2718978C1 (ru) | Способ управления автоматизированной системой правовых консультаций | |
WO2016009553A1 (ja) | 知財評価システム、知財評価システムの制御方法、および知財評価プログラム | |
JP2006221478A (ja) | 文書検索装置及びマクロアプローチによるポートフォリオ分析装置 | |
Widyassari et al. | The 7-Phases Preprocessing Based On Extractive Text Summarization | |
Ormos et al. | Impacts of public news on stock market prices: Evidence from S&P500 | |
Lee et al. | The firm life cycle forecasting model using machine learning based on news articles | |
CN113487440A (zh) | 模型生成、健康险理赔的确定方法、装置、设备及介质 | |
CN112463925A (zh) | 案件卷宗处理方法、相关设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |