CN107533741B - 信息处理装置和方法以及介质 - Google Patents
信息处理装置和方法以及介质 Download PDFInfo
- Publication number
- CN107533741B CN107533741B CN201680020618.1A CN201680020618A CN107533741B CN 107533741 B CN107533741 B CN 107533741B CN 201680020618 A CN201680020618 A CN 201680020618A CN 107533741 B CN107533741 B CN 107533741B
- Authority
- CN
- China
- Prior art keywords
- information
- unit
- frequency
- frequency distribution
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 17
- 238000000034 method Methods 0.000 title description 18
- 238000011156 evaluation Methods 0.000 claims abstract description 92
- 238000012545 processing Methods 0.000 claims description 8
- 238000003672 processing method Methods 0.000 claims description 2
- 229920001971 elastomer Polymers 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 239000000806 elastomer Substances 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
- G06Q50/184—Intellectual property management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Technology Law (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实现说明书等公报的品质的恰当的评价方法。权利要求词汇频次分布生成部(41)将专利刊登公报的权利要求书的内容分解成各词汇,并生成表示分解后的各词汇的频次分布的权利要求词汇频次分布。说明书词汇频次分布生成部(42)将专利刊登公报的说明书的内容分解成各词汇,并生成表示分解后的各词汇的频次分布的说明书词汇频次分布。说明书同义词频次分布生成部(43)将从说明书提取的各词汇分类成与权利要求书的多个词汇分别对应的多个组,并生成表示分别以分类后的多个组为单位的频次分布的说明书同义词频次分布。评价信息生成部(44)基于权利要求词汇类度分布和说明书同义词频次分布来生成评价信息。
Description
技术领域
本发明涉及信息处理装置和方法以及程序。
背景技术
以往,出于保护预定实施或实施中的业务等的目的,许多企业会取得专利权。此外,专利权是财产权,能通过或向第三者转让、或进行独占实施权的设定或普通实施权的许可来有效转化。
为了取得专利权,除了申请请求书之外,还需要提交该申请请求书的附件。作为申请请求书的附件,有权利要求书、说明书、附图、以及摘要。
关于辅助制作这样的申请请求书的附件的技术(例如参照专利文献1)、解析申请请求书的附件的文章构成等的技术(例如参照专利文献2),已经进行了很多研发。
现有技术文献
专利文献
专利文献1:日本特开2013-080278号公报
专利文献2:日本特开2014-010728号公报
发明内容
发明所要解决的问题
然而,存在如下状况:要求了实现说明书等公报的品质的恰当的评价方法,而在包含专利文献1、2在内的现有技术中,却无法充分满足该要求。
本发明是鉴于这样的状况而完成的,其目的在于实现说明书等公报的品质的恰当的评价方法。
用于解决问题的方案
本发明的一方面的信息处理装置具备:
第一信息生成单元,将与知识产权有关的公报所能包含的第一文件的内容分解成包括文字、图形、符号或者它们的结合的规定的单位信息,并生成表示分解后的所述单位信息的频次分布的第一信息;
第二信息生成单元,将该公报所能包含的第二文件的内容分解成所述单位信息,并生成表示分解后的所述单位信息的频次分布的第二信息;以及
评价信息生成单元,基于所述第一信息和所述第二信息,生成对所述公报的内容进行评价的评价信息。
在此,可以设为:
还具备:第三信息生成单元,将所述第二信息中的各单位信息分类成与所述第一信息的多个单位信息分别对应的多个组,并生成表示以分类后的所述多个组的每一个为单位的频次分布的第三信息,
所述评价信息生成单元能基于所述第一信息和所述第三信息来生成所述评价信息。
可以设为:
所述评价信息生成单元按所述第一信息中的各单位信息,运算基于与所述第三信息中的对应的组的位次差的得分,
基于所述第一信息中的所述各单位信息的所述得分的总值,生成所述评价信息。
可以设为:
所述评价信息生成单元基于所述第一信息中各单位信息的位次,对所述得分进行加权。
可以设为:
所述评价信息生成单元按所述第一信息的所述单位信息,基于与所述第三信息中的所属于对应的组的各单位信息的关联程度,对所述得分进行加权。
可以设为:
所述评价信息生成单元从所述第一信息的所述单位信息中去除干扰信息,并基于按去除了该干扰信息后的所述单位信息得到的所述得分的总值,生成所述评价信息。
本发明的一方面的信息处理方法以及程序是与上述的本发明的一方面的信息处理装置对应的方法及程序。
发明效果
根据本发明,能实现说明书等公报的品质的恰当的评价方法。
附图说明
图1是表示作为应用了本发明的信息处理装置的一实施方式的公报评价装置的硬件构成的框图。
图2是表示图1的公报评价装置的功能构成的功能框图。
图3是对由具有图2的功能构成的公报评价装置所执行的评价信息生成处理的概略进行说明的示意图。
图4是对由具有图2的功能构成的公报评价装置所执行的评价信息生成处理的流程进行说明的流程图。
具体实施方式
以下,使用附图对本发明的实施方式进行说明。
图1是表示作为本发明的信息处理装置的一实施方式的公报评价装置1的硬件构成的框图。
公报评价装置1具备:CPU(Central Processing Unit:中央处理器)11、ROM(ReadOnly Memory:只读存储器)12、RAM(Random Access Memory:随机存取存储器)13、总线14、输入输出接口15、输入部16、输出部17、存储部18、通信部19、以及驱动器20。
CPU11按照记录于ROM12的程序或从存储部18载入RAM13的程序来执行各种处理。
RAM13还适当存储有CPU11执行各种处理时所需的数据等。
CPU11、ROM12以及RAM13经由总线14相互连接。该总线14还连接有输入输出接口15。输入输出接口15连接有输入部16、输出部17、存储部18、通信部19以及驱动器20。
输入部16由键盘、鼠标等构成,根据操作员的指示操作输入各种信息。
输出部17由显示器、扬声器等构成,输出图像、声音。
存储部18由硬盘、DRAM(Dynamic Random Access Memory:动态随机存取存储器)等构成,存储各种数据。
通信部19对经由包含互联网的网络4而在与其它装置(未图示)之间进行的通信进行控制。
在驱动器20适当装接有包含磁盘、光盘、磁光盘、或者半导体存储器等的可移动介质31。通过驱动器20而从可移动介质31读出的程序根据需要被安装于存储部18。此外,可移动介质31能与存储部18同样地也对存储于存储部18的各种数据进行存储。
具有这样的构成的公报评价装置1在本实施方式中为对专利公报或申请公开公报、或者实用新型注册公报所能包含的说明书进行品质评价的装置。
需要说明的是,为了方便起见,以下的说明中,对发明专利权进行说明,但在实用新型专利权的情况下也基本相同。
为了取得专利权,除了申请请求书之外,还需要提交权利要求书、说明书、必要的附图、以及摘要来作为该申请请求书的附件。
权利要求书起到作为专利权的权利书的作用。即,专利发明的技术范围基于权利要求书的记载来确定。
说明书起到作为将发明的内容向第三者公开的技术文献的作用。
在此,关于权利要求书的记载,要求“要申请专利的发明记载于发明的详细说明中”的这一必要条件(以下,称为“支持必要条件”)。具体而言,以日本为例,该支持必要条件由专利法第36条第6款第1项来规定。
该支持必要条件在日本构成驳回理由(专利法第49条4项)。就是说,只要不是满足支持必要条件的说明书,在日本就不能取得专利权。
因此,是否满足支持必要条件对说明书的品质来说是重要的要素之一。
因此,本实施方式的公报评价装置1基于权利要求书中所含词汇的频次分布和说明书中所含词汇的频次分布,生成表示支持必要条件的满足程度的评价值(以下,称为“支持信息满足程度指数”),来作为评价说明书的内容的评价信息。
以下,将截止到生成关于评价对象的专利公报或申请公开公报的评价信息(支持信息满足程度指数)为止的一系列处理称为“评价信息生成处理”。
图2是表示公报评价装置1的功能构成中用于执行评价信息生成处理的功能构成的功能框图。
公报评价装置1的CPU11中,在执行评价信息生成处理的情况下,由权利要求词汇频次分布生成部41、说明书词汇频次分布生成部42、说明书同义词频次分布生成部43、以及评价信息生成部44来发挥功能。需要说明的是,评价信息生成部44中包含加权部51。
在公报评价装置1的存储部18的一个区域内设有公报信息DB61。
权利要求词汇频次分布生成部41将评价对象的专利公报或申请公开公报中所含的权利要求书的内容(权利要求的内容)分解成各词汇,并生成表示分解后的词汇的频次分布的信息(以下,称为“权利要求词汇频次分布”)。
说明书词汇频次分布生成部42将评价对象的专利公报或申请公开公报中所含的说明书的内容分解成各词汇,并生成表示分解后的词汇的频次分布的信息(以下,称为“说明书词汇频次分布”)。
在此,也可以在生成支持信息满足程度指数时,对权利要求词汇频次分布和说明书词汇频次分布进行比较,但有时该比较不成为有效的比较。以下对其原因进行说明。
不过,说明书中,除了上述支持必要条件之外,关于发明的详细说明还要求“按照具有本发明所属的技术领域中的公知常识的人能对其进行实施的程度来进行清楚且充分地记载”的这一条件(以下,称为“可实施必要条件”)。具体而言,以日本为例,该可实施必要条件由专利法第36条第4款第1项来规定。
该可实施必要条件在日本构成驳回理由(专利法第49条4项)。就是说,只要不是满足可实施必要条件的说明书,在日本就不能取得专利权。
在此,由于权利要求书如上所述那样具有作为权利书的性质,因此多数情况下一般尽量以上位概念来记载以便得到较大的权利范围。就是说,权利要求词汇频次分布中所出现的各词汇多数情况下为上位概念的模糊的词汇。
与此相比,多数情况下,说明书中会使用为了满足可实施必要条件的表示具体的技术内容的词汇,就是说对该上位概念(权利要求书所记载的词汇)进行举例示出的下位概念。就是说,说明书内,作为对上位概念进行说明的词语,多数情况下会出现表示具体的技术内容的词汇。
换言之,权利要求书所记载的上位概念词汇会直接使用,说明书中的实施方式却很少记载,而是多数情况下会以多个下位概念(例示)的词汇来记载。
因此,即使直接对权利要求词汇频次分布和说明书词汇频次分布进行比较,有时也不会是有效的比较。
因此,本实施方式中,说明书同义词频次分布生成部43将从说明书中提取出来的各词汇分类成与权利要求书的多个词汇(上位概念)分别对应的多个组。
在此,分类成多个组的分类方法不进行特别限定,但在本实施方式中,采用如下分类方法:多个同义词的上位概念与权利要求书的一个规定词汇对应,并将同义词分类至同一组。
说明书同义词频次分布生成部43生成表示以分类后的多个组(与权利要求书的多个词汇对应的组)的每一个为单位的频次分布的信息。以下,将这样的信息称为“说明书同义词频次分布”。
评价信息生成部44基于权利要求词汇类度分布和说明书同义词频次分布,生成支持信息满足程度指数(评价信息)。
例如,本实施方式中,评价信息生成部44将权利要求词汇频次分布中所含的词汇的频次排序和说明书同义词频次分布中所含的组(与权利要求词汇频次分布的规定词汇对应的组)的频次排序进行对比,由此计算出其类似度。评价信息生成部44生成该类似度或其加工值来作为支持信息满足程度指数(评价信息)。
具体而言,例如,评价信息生成部44按权利要求词汇频次分布中的各词汇来运算基于与说明书同义词频次分布中的对应的组的位次差的得分,并基于权利要求词汇频次分布中的各词汇的得分的总值来生成支持信息满足程度指数(评价信息)。
图3是对这样的由具有图2的功能构成的公报评价装置1所执行的评价信息生成处理的概要进行说明的示意图。
在图3的例子中,关于权利要求词汇频次71的频次排序,第一位是“弹性体”,第二位是“应力”。
在此,关于说明书词汇频次72的频次排序,第一位是“应力”,第二位是“弹簧”,第三位是“橡胶”。因此,当在频次排序这一点上对权利要求词汇频次71和说明书词汇频次72进行比较时,权利要求书和说明书的第一位不同,权利要求书的第一位的“弹性体”在说明书中未上榜。结果,在仅基于该位次来生成支持信息满足程度指数(评价信息)的情况下,类似度较低(一致度较低),值可能会较低。
具体而言,例如,位次一致的情况下赋予得分“1”,位次差为1的情况下赋予得分“0.9”,位次差为2的情况下赋予得分“0.8”,之后位次差每增加1,得分就减少0.1,当得分达到“0”后得分一律为“0”。该情况下,关于权利要求词汇频次71,第一位的“弹性体”的得分为“0.9”,第二位的“应力”的得分为“0”。如果这些得分的总值变为支持信息满足程度指数(评价信息),则其值变成“0.9”。
这样,本来应该为高值的支持信息满足程度指数(评价信息)变低的原因是,“弹性体”这一上位概念与作为其下位概念的“弹簧”和“橡胶”没有相互对应。
因此,本实施方式中,说明书同义词频次分布生成部43对从说明书中提取出来的“弹簧”和“橡胶”以使其属于与权利要求书的“弹性体”对应的组的方式进行分类。
作为这样的分类的结果,生成了说明书同义词频次73。关于说明书同义词频次73的频次排序,第一位为“弹簧、橡胶”所属的组,即与权利要求书的“弹性体”对应的组。然后,第二位为“应力”所属的组,即与权利要求书的“应力”对应的组。
该情况下,权利要求词汇频次71与说明书同义词频次73的各位次一致,因此,当基于该位次来生成支持信息满足程度指数(评价信息)时,类似度高(一致度高),成为高值。
具体而言,例如,如果使用高位得分,则关于权利要求词汇频次71,第一位的“弹性体”的得分为“1”,第二位的“应力”的得分也为“1”。因此,这些得分的总值中为“2”这一高值成为支持信息满足程度指数(评价信息)。
在此,权利要求词汇频次71和说明书同义词频次54都是基于简单的词汇的出现频次的分布。有时,由这样的简单的出现频次彼此比较后得到的支持信息满足程度指数(评价信息)的可靠性也有可能不算高。
因此,本实施方式的评价信息生成部44设有加权部51。
例如,在采用了基于上述的频次排序的得分的情况下,评价信息生成部44能基于权利要求词汇频次71中各词汇的位次来对得分进行加权。
例如,即使位次一致,当对使第一位彼此一致的情况和使第十位彼此一致的情况进行比较时,可以说前者的情况对整体的类似度的贡献的比例更高。
因此,加权部51以使第一位彼此一致的情况下的得分较高的方式进行加权,并且以使第十位彼此一致的情况下的得分较低的方式进行加权。例如,以使第一位彼此一致的情况下的得分为“2”,另一方面以使第十位彼此一致的情况下的得分为“0.2”的方式进行加权。
此外,例如,评价信息生成部44还能按权利要求词汇频次71中的各词汇,基于与说明书同义词频次73中的所属于对应的组的各词汇的关联程度,对得分进行加权。
例如,关于与权利要求书的“弹性体”对应的组,说明书同义词频次73中对应的组中加入了“弹簧、橡胶”。它们是“弹性体”的下位概念,但“弹性体”这一词汇本身不加入该组。
另一方面,关于与权利要求书的“应力”对应的组,说明书同义词频次73中对应的组中加入了“应力”这一词汇本身。
因此,加权部51以如下方式进行加权:比起权利要求书的“弹性体”,权利要求书的“应力”更属于关联度高的词汇所对应的组,权重增加。
能想到这样进行各种加权后生成的支持信息满足程度指数(评价信息)为更接近实际的值。就是说,通过进行加权,能生成更高精度的支持信息满足程度指数(评价信息)。
在此,对于权利要求词汇频次71,也会有如下的情况:与构成专利发明的特征的词汇不同的词汇,例如图3所示的“所述”这样的普通词汇在频次排序中靠前。因此,将这样的词汇作为干扰信息去除为好。
即,评价信息生成部44去除权利要求词汇频次71的各词汇中的干扰信息(例如“所述”这样的词汇),并基于去除该干扰信息之后的按各词汇的得分的总值,生成支持信息满足程度指数(评价信息)。
能想到在这样进行干扰去除后生成的支持信息满足程度指数(评价信息)为更接近实际的值。就是说,通过去除干扰信息,能生成更高精度的支持信息满足程度指数(评价信息)。
图4是由对具有图2的功能构成的公报评价装置1所执行的评价信息生成处理的流程进行说明的流程图。
在步骤S1中,权利要求词汇频次分布生成部41生成权利要求词汇频次分布。
在步骤S2中,说明书词汇频次分布生成部42生成说明书词汇频次分布。
在步骤S3中,说明书同义词频次分布生成部43生成说明书同义词频次分布。
在步骤S4中,评价信息生成部44基于权利要求词汇类度分布和说明书同义词频次分布,生成支持信息满足程度指数(评价信息)。
由此,评价信息生成处理结束。
以上,对本发明的实施方式进行了说明,但本发明不限于上述的实施方式。此外,记载于本实施方式的效果不过是列举了由本发明所产生的最佳效果,本发明的效果不限定于记载于本实施方式的效果。
例如,上述的实施方式中,从专利刊登公报或申请公开公报的权利要求书中提取各词汇并生成频次分布,从说明书中提取各词汇并生成频次分布。
然而,不限定于上述的实施方式,例如也可以从说明书、附图或摘要中提取文字、图形或符号或者它们的结合(以下,称为“文字等”)。
进一步说,上述的实施方式中,采用了与专利有关的公报,但不一定特别需要限定于专利,能将本发明用于与以包含文字等的两种以上的文件的提交为前提而被赋予的知识产权有关的公报的一般的评价。
此外,例如,上述的实施方式中,频次分布的单位信息采用了词汇,但不特别限定于此,可以采用由文字、图形、符号或者它们的结合构成的任意的单位信息。
换言之,本实施方式所适用的信息处理装置只要具有如下的构成即可,能采用各种实施方式。
即,本发明的信息处理装置具备:
第一信息生成单元(例如图2的权利要求词汇频次分布生成部41),将与知识产权有关的公报所能包含的第一文件(例如权利要求书)的内容分解成包括文字、图形、符号或者它们的结合的规定的单位信息(例如词汇),并生成表示分解后的所述单位信息的频次分布的第一信息(例如权利要求词汇频次分布);
第二信息生成单元(例如图2的说明书词汇频次分布生成部42),将该公报所能包含的第二文件(例如说明书)的内容分解成所述单位信息(例如词汇),并生成表示分解后的所述单位信息的频次分布的第二信息(例如说明书词汇频次分布);以及
评价信息生成单元,基于所述第一信息和所述第二信息,生成对所述公报的内容进行评价的评价信息。
通过采用该信息处理装置,能更恰当地对与知识产权有关的公报进行评价。
需要说明的是,公报所能包含的第一文件的内容和第二文件的内容不一定需要是公报的副本,假如公报会被公布,则是该公报中所应该含有的第一文件和第二文件的各内容的含义。
就是说,不一定需要公报的公布,即使在未申请的阶段或申请后未公开的阶段,也有可能存在表示第一文件、第二文件的内容的信息,因此记载为“公报所能包含”来作为也包含这些内容的含义。
因此,作为公报所能包含的第一文件和第二文件的内容,例如也包含与申请后未公开的“权利要求书”、“说明书”等有关的由申请人方面保存的拷贝数据的内容,或者记载了申请前的“权利要求书”、“说明书”的内容的文件(例如申请人方面制作的发明报告书等)的内容等。
此外,第二用户也不一定需要是实施候选经营者,也可以是申请人方面的知识产权负责人等。
根据以上事项,例如,专利申请人(企业)方面的知识产权负责人等也能在申请前的阶段进行说明书方案的评价,因此能重新撰写并提出申请,以使低评价的说明书方案变成高评价的说明书方案。
而且,这样的评价信息可适用于专利分析等其他领域。例如,能活用在基于被引用件数的专利评价索引的修正(加权)上。
此外,例如,在基于专利分析来搜索许可候选等时,也能将包含评价信息(支持信息满足程度指数)高的说明书的专利作为“可匹配性高”的专利,优先提示给许可候选人等。
上述的一系列处理能通过硬件来执行,也能通过软件来执行。
换言之,图3的功能构成不过是举例示出,不进行特别限定。即,公报评价装置1只要具备能将上述的一系列处理作为整体来执行的功能即可,为了实现该功能要使用怎样的功能块并不一定特别限定于图2的例子。
此外,一个功能块既可以由硬件单体来构成,也可以由软件单体来构成,还可以由它们的组合来构成。
在由软件来执行一系列处理的情况下,构成该软件的程序从网络、记录介质安装到计算机等。
计算机可以是装入到专用的硬件的计算机。此外,计算机可以是通过安装各种程序而能执行各种功能的计算机,例如通用的个人计算机。
包含这类程序的记录介质不仅是由为了向用户提供程序而与装置主体分别配置的图1的可移动介质31来构成,而且还可由在预装到装置主体的状态下提供给用户的记录介质等来构成。可移动介质31例如由磁盘(包含软盘)、光盘或磁光盘等构成。光盘例如由CD-ROM(Compact Disk-Read Only Memory:光盘只读存储器)、DVD(Digital VersatileDisk:数字通用磁盘)等构成。磁光盘由MD(Mini-Disk:迷你光盘)等构成。此外,在预装于装置主体的状态下提供给用户的记录介质例如由记录有程序的图1的ROM12、包含在存储部18中的硬盘等构成。
需要说明的是,本说明书中,描述记录于记录介质的程序的步骤不仅包含按照其顺序按时序进行的处理,而且不一定是按时序处理,也包含并行或独立执行的处理。
附图标记说明:
1 公报评价装置
11 CPU
12 ROM
13 RAM
14 总线
15 输入输出接口
16 输入部
17 输出部
18 存储部
19 通信部
20 驱动器
31 可移动介质
41 权利要求词汇频次分布生成部
42 说明书词汇频次分布生成部
43 说明书同义词频次分布生成部
44 评价信息生成部
51 加权部
61 公报信息DB
Claims (6)
1.一种信息处理装置,具备:
第一信息生成单元,将与知识产权有关的公报所能包含的第一文件的内容分解成包括文字、图形、符号或者它们的结合的规定的单位信息,并生成表示分解后的所述单位信息的频次分布的第一信息;
第二信息生成单元,将该公报所能包含的第二文件的内容分解成所述单位信息,并生成表示分解后的所述单位信息的频次分布的第二信息;
第三信息生成单元,将所述第二信息中的各单位信息分类成与所述第一信息的多个单位信息分别对应的多个组,并生成表示以分类后的所述多个组的每一个为单位的频次分布的第三信息;以及
评价信息生成单元,按所述第一信息中的各单位信息,以所述第一信息中的所述各单位信息的频次的位次与所述第三信息中的对应的组的频次的位次的位次差越小则成为越高的得分的方式运算得分,并将所述第一信息中的所述各单位信息的所述得分的和作为所述得分的总值,作为所述得分的总值越高则将所述公报的内容评价得越高的评价信息而生成表示支持必要条件的满足程度的所述评价信息。
2.根据权利要求1所述的信息处理装置,其中,
所述评价信息生成单元以如下方式进行加权:以所述第一信息中的所述各单位信息的频次的位次越高则成为越高的得分的方式增加所述得分的权重。
3.根据权利要求1所述的信息处理装置,其中,
所述评价信息生成单元以如下方式进行加权:按所述第一信息的所述单位信息,在与所述第三信息中的所属于对应的组的各单位信息一致的情况下增加所述得分的权重。
4.根据权利要求1所述的信息处理装置,其中,
所述评价信息生成单元将所述第一信息的所述单位信息中的不符合直接表示所述知识产权的具体的权利内容的单位信息的单位信息作为干扰信息去除,并将按去除了该干扰信息后的所述单位信息得到的所述得分的和作为所述得分的总值,作为所述得分的总值越高则将所述公报的内容评价得越高的评价信息而生成表示支持必要条件的满足程度的所述评价信息。
5.一种信息处理方法,由信息处理装置来执行,包含:
第一信息生成步骤,将与知识产权有关的公报所能包含的第一文件的内容分解成包括文字、图形、符号或者它们的结合的规定的单位信息,并生成表示分解后的所述单位信息的频次分布的第一信息;
第二信息生成步骤,将该公报所能包含的第二文件的内容分解成所述单位信息,并生成表示分解后的所述单位信息的频次分布的第二信息;
第三信息生成步骤,将所述第二信息中的各单位信息分类成与所述第一信息的多个单位信息分别对应的多个组,并生成表示以分类后的所述多个组的每一个为单位的频次分布的第三信息;以及
评价信息生成步骤,按所述第一信息中的各单位信息,以所述第一信息中的所述各单位信息的频次的位次与所述第三信息中的对应的组的频次的位次的位次差越小则成为越高的得分的方式运算得分,并将所述第一信息中的所述各单位信息的所述得分的和作为所述得分的总值,作为所述得分的总值越高则将所述公报的内容评价得越高的评价信息而生成表示支持必要条件的满足程度的所述评价信息。
6.一种非临时性的计算机可读取记录介质,记录有使计算机执行包含以下步骤的控制处理的程序:
第一信息生成步骤,将与知识产权有关的公报所能包含的第一文件的内容分解为包括文字、图形、符号或者它们的结合的规定的单位信息,并生成表示分解后的所述单位信息的频次分布的第一信息;
第二信息生成步骤,将该公报所能包含的第二文件的内容分解成所述单位信息,并生成表示分解后的所述单位信息的频次分布的第二信息;
第三信息生成步骤,将所述第二信息中的各单位信息分类成与所述第一信息的多个单位信息分别对应的多个组,并生成表示以分类后的所述多个组的每一个为单位的频次分布的第三信息;以及
评价信息生成步骤,按所述第一信息中的各单位信息,以所述第一信息中的所述各单位信息的频次的位次与所述第三信息中的对应的组的频次的位次的位次差越小则成为越高的得分的方式运算得分,并将所述第一信息中的所述各单位信息的所述得分的和作为所述得分的总值,作为所述得分的总值越高则将所述公报的内容评价得越高的评价信息而生成表示支持必要条件的满足程度的所述评价信息。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015080125A JP6023254B1 (ja) | 2015-04-09 | 2015-04-09 | 情報処理装置及び方法、並びにプログラム |
JP2015-080125 | 2015-04-09 | ||
PCT/JP2016/061586 WO2016163529A1 (ja) | 2015-04-09 | 2016-04-08 | 情報処理装置及び方法、並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107533741A CN107533741A (zh) | 2018-01-02 |
CN107533741B true CN107533741B (zh) | 2021-04-13 |
Family
ID=57072014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680020618.1A Active CN107533741B (zh) | 2015-04-09 | 2016-04-08 | 信息处理装置和方法以及介质 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10902535B2 (zh) |
EP (1) | EP3261053A4 (zh) |
JP (1) | JP6023254B1 (zh) |
CN (1) | CN107533741B (zh) |
WO (1) | WO2016163529A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6784157B2 (ja) * | 2016-11-29 | 2020-11-11 | 富士通株式会社 | 特徴抽出方法、特徴抽出プログラム及び特徴抽出装置 |
CN112733549B (zh) * | 2020-12-31 | 2024-03-01 | 厦门智融合科技有限公司 | 一种基于多重语义融合的专利价值信息分析方法、装置 |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001306852A (ja) | 2000-04-18 | 2001-11-02 | Nec Corp | 知的財産権取引システムおよび知的財産権取引方法 |
JP4075302B2 (ja) * | 2000-10-26 | 2008-04-16 | セイコーエプソン株式会社 | 文書検索における検索知識作成方法および文書検索における検索知識作成装置 |
JP2002245067A (ja) * | 2001-02-14 | 2002-08-30 | Mitsubishi Electric Corp | 情報検索装置 |
US8484177B2 (en) | 2001-03-21 | 2013-07-09 | Eugene M. Lee | Apparatus for and method of searching and organizing intellectual property information utilizing a field-of-search |
JP2004062669A (ja) | 2002-07-30 | 2004-02-26 | Alps Electric Co Ltd | 知的財産権売買システム、知的財産権売買方法及びそのプログラム並びに記録媒体 |
JP2004280756A (ja) * | 2003-03-19 | 2004-10-07 | Patolis Corp | 特許明細書分析システム及び特許明細書分析方法及びプログラムを記録したコンピュータ読み取り可能な記録媒体及びプログラム |
JP2004361992A (ja) * | 2003-05-30 | 2004-12-24 | Toshiba Corp | 関連語抽出装置、関連語抽出方法及びプログラム |
JP4426894B2 (ja) * | 2004-04-15 | 2010-03-03 | 株式会社日立製作所 | 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置 |
US20060156268A1 (en) | 2005-01-13 | 2006-07-13 | Wen Kuei-Ann | Circuit design platform |
JP2007011876A (ja) | 2005-07-01 | 2007-01-18 | Kosudakku Kk | 知的財産情報提供システム |
US20080208700A1 (en) | 2006-01-20 | 2008-08-28 | Heather Alisha Davis | Method for facilitating the sale, transfer and/or assignment of intellectual property |
EP2079049A4 (en) * | 2006-11-02 | 2011-11-09 | Patent Result Co Ltd | PATENT EVALUATION DEVICE |
US20080195678A1 (en) | 2007-02-13 | 2008-08-14 | International Business Machines Corporation | Methodologies and analytics tools for identifying potential partnering relationships in a given industry |
US7890549B2 (en) * | 2007-04-30 | 2011-02-15 | Quantum Leap Research, Inc. | Collaboration portal (COPO) a scaleable method, system, and apparatus for providing computer-accessible benefits to communities of users |
US9256594B2 (en) | 2007-06-06 | 2016-02-09 | Michael S. Neustel | Patent analyzing system |
WO2009001696A1 (ja) * | 2007-06-22 | 2008-12-31 | Patent Result Co., Ltd. | 情報処理装置、プログラム、情報処理方法 |
US20090024486A1 (en) | 2007-07-17 | 2009-01-22 | Sevrain Christophe J P | Online marketplace for intellectual property |
US20090228777A1 (en) | 2007-08-17 | 2009-09-10 | Accupatent, Inc. | System and Method for Search |
US20090054157A1 (en) | 2007-08-23 | 2009-02-26 | Hamilton Ii Rick A | Intellectual property protection for content created within a virtual universe |
JP5151368B2 (ja) * | 2007-09-28 | 2013-02-27 | 富士ゼロックス株式会社 | 情報処理装置および情報処理プログラム |
WO2009150758A1 (ja) * | 2008-06-13 | 2009-12-17 | 株式会社パテント・リザルト | 情報処理装置、プログラム、情報処理方法 |
JP2010049780A (ja) | 2008-07-25 | 2010-03-04 | Panasonic Corp | Ecc回路、半導体記憶装置、メモリシステム |
JP4920743B2 (ja) | 2009-11-30 | 2012-04-18 | コンフォートクック株式会社 | 知的所有権ライセンス契約仲介システムおよびその方法 |
US9110971B2 (en) * | 2010-02-03 | 2015-08-18 | Thomson Reuters Global Resources | Method and system for ranking intellectual property documents using claim analysis |
TWI430195B (zh) | 2010-06-04 | 2014-03-11 | Univ Nat Chiao Tung | An Automated Patent Trading Platform System |
CN102298583B (zh) | 2010-06-22 | 2016-04-27 | 深圳市世纪光速信息技术有限公司 | 一种电子公告板网页质量评价方法和系统 |
US8805074B2 (en) | 2010-09-27 | 2014-08-12 | Sharp Laboratories Of America, Inc. | Methods and systems for automatic extraction and retrieval of auxiliary document content |
JP2013080278A (ja) | 2011-09-30 | 2013-05-02 | Toyobo Co Ltd | 特許出願明細書または実用新案登録出願明細書作成支援システム |
US20130145283A1 (en) | 2011-12-06 | 2013-06-06 | Wei-Yeh Lee | Automated Patent Event Notification System |
JP6006023B2 (ja) | 2012-07-01 | 2016-10-12 | 技術経営ソリューション株式会社 | 特許明細書分析表示装置 |
US9461876B2 (en) * | 2012-08-29 | 2016-10-04 | Loci | System and method for fuzzy concept mapping, voting ontology crowd sourcing, and technology prediction |
CN103825951A (zh) | 2014-02-28 | 2014-05-28 | 惠州学院 | 一种云计算协同创新平台及其实施方法 |
US9910899B1 (en) * | 2014-09-03 | 2018-03-06 | State Farm Mutual Automobile Insurance Company | Systems and methods for electronically mining intellectual property |
-
2015
- 2015-04-09 JP JP2015080125A patent/JP6023254B1/ja active Active
-
2016
- 2016-04-08 CN CN201680020618.1A patent/CN107533741B/zh active Active
- 2016-04-08 US US15/563,859 patent/US10902535B2/en active Active
- 2016-04-08 EP EP16776695.5A patent/EP3261053A4/en not_active Ceased
- 2016-04-08 WO PCT/JP2016/061586 patent/WO2016163529A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2016163529A1 (ja) | 2016-10-13 |
EP3261053A4 (en) | 2018-01-10 |
JP6023254B1 (ja) | 2016-11-09 |
EP3261053A1 (en) | 2017-12-27 |
US10902535B2 (en) | 2021-01-26 |
JP2016200945A (ja) | 2016-12-01 |
US20180075556A1 (en) | 2018-03-15 |
CN107533741A (zh) | 2018-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111291570B (zh) | 一种实现司法文书中要素识别的方法及装置 | |
US9020862B2 (en) | Method and system for computer question-answering | |
US20160189057A1 (en) | Computer implemented system and method for categorizing data | |
CN110134777B (zh) | 问题去重方法、装置、电子设备和计算机可读存储介质 | |
US11416534B2 (en) | Classification of electronic documents | |
CN110889412B (zh) | 体检报告中的医学长文定位与分类方法及装置 | |
US12072957B2 (en) | Data classification system, data classification method, and recording medium | |
CN111753048A (zh) | 文档检索方法、装置、设备及存储介质 | |
AU2017251771A1 (en) | Statistical self learning archival system | |
CN117520503A (zh) | 基于llm模型的金融客服对话生成方法、装置、设备及介质 | |
CN107533741B (zh) | 信息处理装置和方法以及介质 | |
CN107844531B (zh) | 答案输出方法、装置和计算机设备 | |
CN111210321B (zh) | 一种基于合同管理的风险预警方法及系统 | |
CN113468323B (zh) | 争议焦点类别及相似判断方法及系统及装置及推荐方法 | |
CN112287215A (zh) | 一种智能就业推荐方法和装置 | |
Yadav et al. | Semantic analysis of issues on google play and twitter | |
CN114266496A (zh) | 一种基于政策完成度分析的政策落地效果评价方法及系统 | |
CN113360596A (zh) | 一种基于tf-idf和倒排索引的众测助理实现方法 | |
Sagala et al. | A comparative study for classification on different domain | |
JP6734174B2 (ja) | 情報処理装置 | |
JP6660333B2 (ja) | 情報抽出装置、情報抽出方法及び情報抽出プログラム | |
CN111382246A (zh) | 文本的匹配方法、匹配装置及终端 | |
CN109284279B (zh) | 一种审讯问题选择方法、终端设备及存储介质 | |
CN113010517B (zh) | 数据表管理方法及装置 | |
JP7178388B2 (ja) | 情報処理装置及び方法、並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |