CN114830122A - 信息处理装置、阅读理解辅助方法及程序 - Google Patents
信息处理装置、阅读理解辅助方法及程序 Download PDFInfo
- Publication number
- CN114830122A CN114830122A CN202080087033.8A CN202080087033A CN114830122A CN 114830122 A CN114830122 A CN 114830122A CN 202080087033 A CN202080087033 A CN 202080087033A CN 114830122 A CN114830122 A CN 114830122A
- Authority
- CN
- China
- Prior art keywords
- text
- patent document
- display
- indicating
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 66
- 238000000034 method Methods 0.000 title claims description 18
- 238000004458 analytical method Methods 0.000 claims abstract description 121
- 239000000470 constituent Substances 0.000 claims abstract description 38
- 238000011156 evaluation Methods 0.000 claims description 72
- 230000001419 dependent effect Effects 0.000 claims description 25
- 238000010586 diagram Methods 0.000 claims description 23
- 230000008569 process Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 description 21
- 239000000284 extract Substances 0.000 description 15
- 239000012634 fragment Substances 0.000 description 7
- 239000010410 layer Substances 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 239000002344 surface layer Substances 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000012916 structural analysis Methods 0.000 description 2
- 238000012356 Product development Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000011247 coating layer Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/106—Display of layout of documents; Previewing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
- G06Q50/184—Intellectual property management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/11—Patent retrieval
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Technology Law (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- Operations Research (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
一种信息处理装置,包括:分析部,对专利文献数据中包含的表示权利要求书的文本数据进行分析,以针对所述权利要求书中包含的每个权利要求,对发明的构成要素进行确定;以及显示控制部,将表示所述权利要求书的各个权利要求的文本分割成每个所述构成要素并显示在显示装置上。
Description
技术领域
本发明涉及一种信息处理装置、阅读理解辅助方法及程序。
背景技术
传统上,开发了用于对专利文献的阅读理解进行辅助的技术。特别是,专利文献中包含的权利要求书的记载往往比一般的文件更难理解。为此,正在研究用于对专利文献、尤其是权利要求书的记载的阅读理解进行辅助的技术。
例如,专利文献1公开了一种装置,其输出用于表示由从权利要求书的记载中指定的字符串所表示的要素与该要素的下位要素之间的关系的图。另外,专利文献2公开了一种装置,其将权利要求书的记载划分为各个段落,并生成将划分出的多个描述片段的关系结构化而成的信息。
<现有技术文献>
<专利文献>
专利文献1:日本特开2014-219833号公报
专利文献2:日本特开2012-003517号公报
发明内容
<本发明要解决的问题>
以调查、研究等各种业务为目的,进行对专利文献进行阅读理解的工作。在这样的工作中,往往急需对大量的专利文献进行阅读理解,并且迅速且准确地对权利要求书的记载进行阅读理解很重要。
然而,专利文献1或专利文献2所公开的技术在对大量的专利文献进行阅读理解时,无法一目了然地掌握权利要求书的记载,缺乏阅读理解的迅速性。
在专利文献1公开的发明中,按照设定的规则将权利要求书的记载分割成多个要素,通过提取所分割的要素之间的关系来进行权利要求书的记载的结构分析,接受对权利要求书中包含的字符串的指定,进行用于从通过结构分析得到的文件的结构信息中提取与指定的字符串相对应的结构信息的信息提取,将提取出的结构信息图表化并输出,从而进行阅读理解的辅助。
在专利文献2公开的发明中,通过权利要求结构信息生成装置针对具有更深结构的专利权利要求进行结构分析,该权利要求结构信息生成装置生成用于表示将专利权利要求的文本划分而成的描述片段和该描述片段的结构的权利要求结构信息,该权利要求结构信息生成装置具备:存储部,对作为专利权利要求的文本的专利权利要求信息进行存储;词素分析部,对专利权利要求信息进行词素分析;段落确定部,对专利权利要求信息的段落的划分位置进行确定;表层划分信息存储部,对两个以上的表层划分信息进行存储,该表层划分信息具有作为描述片段的划分且表示描述片段之间的关系的表层的线索信息和与表层的线索信息相对应的令牌;令牌赋予部,在专利权利要求信息中对属于表层的线索信息的位置赋予与表层的线索信息相对应的令牌;段落类型对应信息存储部,对两个以上的段落类型对应信息进行存储,该段落类型对应信息具有作为描述片段的划分的段落的词类的线索信息和与词类的线索信息相对应的划分段落类型;划分段落类型赋予部,在专利权利要求信息中,对属于词类的线索信息的段落赋予与词类的线索信息相对应划分段落类型;生成部,使用赋予给专利权利要求信息的令牌和划分段落类型,根据表示预先规定的专利权利要求的结构的规则,生成表示专利权利要求信息的描述片段的结构的权利要求结构信息;以及输出部,输出由生成部生成的权利要求结构信息。
如上所述,专利文献1或专利文献2中公开的技术虽然适合于对一个专利文献的公开内容深入地进行阅读理解的目的,然而由于其并非专门针对提高权利要求书的记载的可读性,因此并不适合在需要对大量的专利文献进行阅读理解的情况下,对权利要求书的记载足够迅速且准确地进行阅读理解的目的。
鉴于上述情况为了解决上述问题,本发明的目的在于对针对权利要求书的记载的迅速且准确的阅读理解进行辅助。
<用于解决问题的手段>
本发明包括如下的方案。
[1]一种信息处理装置,包括:分析部,对专利文献数据中包含的表示权利要求书的文本数据进行分析,以针对所述权利要求书中包含的每个权利要求,对发明的构成要素进行确定;以及显示控制部,将表示所述权利要求书的各个权利要求的文本分割成每个所述构成要素并显示在显示装置上。
[2]根据[1]所述的信息处理装置,其中,所述分析部进一步从表示权利要求书的所述文本数据中,对表示重要的用语的重要词进行确定,所述显示控制部在表示所述权利要求书的各个权利要求的文本中,对表示所述重要词的文本进行强调并将其显示在所述显示装置上。
[3]根据[1]或[2]所述的信息处理装置,其中,所述分析部进一步对所述专利文献数据中包含的表示说明书的文本数据进行分析,以进一步对表示作为用于在所述说明书中对发明进行说明的用语的、在所述权利要求书中不存在先行的记载的用语的新出词进行确定,所述显示控制部在表示所述权利要求书的各个权利要求的文本中,对表示所述新出词的文本进行强调并将其显示在所述显示装置上。
[4]根据[1]至[3]中任一项所述的信息处理装置,还包括:操作接受部,接受用户针对所述专利文献数据的评价结果的输入;以及评价登记部,将所述评价结果与所述专利文献数据相关联地登记,其中,所述显示控制部将所述评价结果显示在所述显示装置上。
[5]根据[4]所述的信息处理装置,其中,所述显示控制部将被所述分析部作为分析对象的所述专利文献数据和登记在所述评价登记部中的所述评价结果显示在由多个用户使用的装置上。
[6]根据[1]至[5]中任一项所述的信息处理装置,其中,所述显示控制部将分割而成的所述构成要素图表化为结构图并进行显示。
[7]一种阅读理解辅助方法,对专利文献数据中包含的表示权利要求书的文本数据进行分析,以针对所述权利要求书中包含的每个权利要求,对发明的构成要素进行确定,将表示所述权利要求书的各个权利要求的文本分割成每个所述构成要素并进行显示。
[8]一种程序,用于使计算机执行以下步骤:对专利文献数据中包含的表示权利要求书的文本数据进行分析,以针对所述权利要求书中包含的每个权利要求,对发明的构成要素进行确定的步骤;以及将表示所述权利要求书的各个权利要求的文本分割成每个所述构成要素并显示在显示装置上的步骤。
[9]一种信息处理装置,包括:分析部,对专利文献数据中包含的表示权利要求书的文本数据进行分析,以针对所述权利要求书中包含的每个权利要求,对发明的主题进行确定;以及显示控制部,将表示所述主题的文本与所述权利要求的编号相关联地显示在显示装置上。
[10]根据[9]所述的信息处理装置,其中,所述分析部进一步针对所述权利要求书中包含的每个权利要求,对发明的构成要素进行确定,所述显示控制部进一步将表示所述权利要求书的各个权利要求的文本分割成每个所述构成要素并显示在所述显示装置上。
[11]根据[9]或[10]所述的信息处理装置,其中,所述显示控制部根据用户的操作在包含表示所述权利要求书的各个权利要求的所述文本的显示和不包含所述文本的显示之间进行切换,并且将其显示在所述显示装置上。
[12]根据[9]至[11]中任一项所述的信息处理装置,还包括:操作接受部,接受用户针对所述专利文献数据的评价结果的输入;以及评价登记部,将所述评价结果与所述专利文献数据相关联地登记,其中,所述显示控制部将所述评价结果显示在所述显示装置上。
[13]根据[12]所述的信息处理装置,其中,所述显示控制部将被所述分析部作为分析对象的所述专利文献数据和登记在所述评价登记部中的所述评价结果显示在由多个用户使用的装置上。
[14]根据[9]至[13]中任一项所述的信息处理装置,其中,所述分析部从表示所述权利要求的所述文本数据中选择表示所述主题的所述文本。
[15]根据[9]至[13]中任一项所述的信息处理装置,其中,所述分析部从表示所述权利要求书的所述文本数据中选择唯一地表征所述发明且具有用户便于对发明进行识别的程度的长度的短语,并将其作为表示所述主题的所述文本。
[16]一种阅读理解辅助方法,对专利文献数据中包含的表示权利要求书的文本数据进行分析,以针对所述权利要求书中包含的每个权利要求,对发明的主题进行确定,将表示所述主题的文本与所述权利要求的编号相关联地显示在显示装置上。
[17]一种程序,用于使计算机执行以下步骤:对专利文献数据中包含的表示权利要求书的文本数据进行分析,以针对所述权利要求书中包含的每个权利要求,对发明的主题进行确定的步骤;以及将表示所述主题的文本与所述权利要求的编号相关联地显示在显示装置上的步骤。
[18]一种信息处理装置,包括:分析部,对专利文献数据中包含的表示权利要求书的文本数据进行分析,以对所述权利要求书中包含的权利要求的从属关系进行确定;以及显示控制部,基于确定的所述从属关系,将表示所述权利要求书中包含的独立权利要求的文本显示在显示装置上。
[19]根据[18]所述的信息处理装置,其中,所述分析部进一步针对所述权利要求书中包含的每个所述权利要求,对所述发明的主题进行确定,所述显示控制部进一步将表示所述主题的文本与所述权利要求的编号相关联地显示在显示装置上。
[20]根据[18]或[19]所述的信息处理装置,其中,所述分析部进一步针对所述权利要求书中包含的每个权利要求,对发明的构成要素进行确定,所述显示控制部进一步将表示所述权利要求书的各个权利要求的文本分割成每个所述构成要素并显示在所述显示装置上。
[21]根据[19]所述的信息处理装置,其中,所述分析部进一步针对所述权利要求书中包含的每个权利要求,对发明的构成要素进行确定,所述显示控制部基于确定的所述从属关系,针对独立权利要求,将表示所述权利要求书的各个权利要求的文本分割成每个所述构成要素并进行显示,针对从属权利要求,将表示所述主题的文本与所述权利要求的编号相关联地显示,并且选择显示表示分割成每个所述构成要素的所述权利要求书的各个权利要求的文本的分割显示形式、以及不显示表示所述权利要求书的各个权利要求的文本的分割显示形式中的任意一种显示形式,并以选择的所述显示形式显示在所述显示装置上。
[22]根据[18]至[21]中任一项所述的信息处理装置,还包括:操作接受部,接受用户针对所述专利文献数据的评价结果的输入;以及评价登记部,将所述评价结果与所述专利文献数据相关联地登记,其中,所述显示控制部将所述评价结果显示在所述显示装置上。
[23]根据[22]所述的信息处理装置,其中,所述显示控制部将被所述分析部作为分析对象的所述专利文献数据和登记在所述评价登记部中的所述评价结果显示在由多个用户使用的装置上。
[24]根据[18]至[23]中任一项所述的信息处理装置,其中,所述分析部在对所述从属关系进行确定的处理中,将所述从属关系不明的权利要求分类为独立权利要求。
[25]一种阅读理解辅助方法,对专利文献数据中包含的表示权利要求书的文本数据进行分析,以对所述权利要求书中包含的权利要求的从属关系进行确定,基于确定的所述从属关系,对表示所述权利要求书中包含的独立权利要求的文本进行显示。
[26]一种程序,用于使计算机执行以下步骤:对专利文献数据中包含的表示权利要求书的文本数据进行分析,以对所述权利要求书中包含的权利要求的从属关系进行确定的步骤;以及基于确定的所述从属关系,将表示所述权利要求书中包含的独立权利要求的文本显示在显示装置上。
<发明的效果>
能够对针对权利要求书的记载的迅速且准确的阅读理解进行辅助。
附图说明
图1是示出根据一个实施方式的阅读理解辅助系统的系统构成的一个示例的图。
图2是示出根据一个实施方式的信息处理装置的硬件构成的一个示例的图。
图3是示出根据一个实施方式的信息处理装置的功能的一个示例的图。
图4是示出根据一个实施方式的信息处理装置的阅读理解辅助处理的一个示例的流程图。
图5是示出根据一个实施方式的分析结果画面的一个示例的图。
图6是示出根据一个实施方式的分析结果画面的另一个示例的图。
图7是示出根据一个实施方式的分析结果画面的又一个示例的图。
图8是示出根据一个实施方式的分析结果画面的又一个示例的图。
具体实施方式
以下,参照附图对根据本发明的阅读理解辅助系统的实施方式进行说明。
图1是示出根据一个实施方式的阅读理解辅助系统的系统构成的一个示例的图。
阅读理解辅助系统1是对专利文献的阅读理解进行辅助的系统。具体而言,阅读理解辅助系统1包括信息处理装置10、专利文献提取装置20、以及终端装置30。信息处理装置10、专利文献提取装置20、以及终端装置30经由网络40以能够进行通信的方式相互连接。
信息处理装置10对表示专利文献的数据(以下称为专利文献数据)进行分析,以基于分析结果生成用于在画面上显示的画面数据。生成的画面数据是表示便于对专利文献数据中包含的权利要求书的记载进行阅读理解的画面的数据。
专利文献提取装置20通过经由终端装置30的用户操作接受检索条件的指定,并基于检索条件从专利公报、公开公报等的数据库中提取专利文献数据。然后,专利文献提取装置20通过经由终端装置30的用户操作,将所提取的专利文献数据发送至信息处理装置10。
终端装置30是接受用户操作以向信息处理装置10或专利文献提取装置20指示各种功能的执行,或者从信息处理装置10或专利文献提取装置20接收画面数据,并显示接收到的画面数据的装置。
接着,对信息处理装置10的硬件构成进行说明。
图2是示出根据一个实施方式的信息处理装置的硬件构成的一个示例的图。
信息处理装置10包括CPU(Central Processing Unit:中央处理单元)101、主存储装置102、辅助存储装置103、输入装置104、显示装置105、通信接口装置106、以及驱动器装置107。该些装置中的各个装置均通过总线连接。
CPU101是对信息处理装置10的动作进行控制的主控制部,并且通过读取并执行存储在主存储装置102中的程序来实现后述的各种功能。
主存储装置102在信息处理装置10启动时从辅助存储装置103中读出程序并对其进行存储。辅助存储装置103对安装的程序进行存储,并且对后述的各种功能所需的文件、数据等进行存储。
输入装置104是用于进行各种信息的输入的装置,例如由键盘、指示装置等来实现。显示装置105是用于进行各种信息的显示的装置,例如由显示器等实现。通信接口装置106包括LAN卡等,并且用于与网络连接。
根据本实施方式的程序是对信息处理装置10进行控制的各种程序的至少一部分。例如,通过存储介质108的分发或从网络的下载等来提供程序。记录有程序的存储介质108可以使用CD-ROM、软盘、磁光盘等以光学、电学或磁的方式记录信息的存储介质、ROM、快闪存储器等以电学的方式记录信息的半导体存储器等各种类型的存储介质。
另外,当记录有程序的存储介质108被设置在驱动器装置107中时,程序经由驱动器装置107从存储介质108被安装到辅助存储装置103中。从网络下载的程序经由通信接口装置106被安装到辅助存储装置103中。
接着,对信息处理装置10的功能进行说明。
图3是示出根据一个实施方式的信息处理装置的功能的一个示例的图。
信息处理装置10包括存储部11、专利文献取得部12、分析部13、显示控制部14、评价登记部15、以及操作接受部16。
存储部11对各种数据、程序等进行存储。具体而言,存储部11对学习完成模型17进行存储。
学习完成模型17是为了对专利文献进行分析通过机器学习构建的模型。学习完成模型17例如可以是神经网络、决策树、支持向量机等,也可以是通过深度学习构建的模型。具体而言,学习完成模型17优选专门针对语言分析,例如可以是“IBM WATSON(注册商标)”。用作学习完成模型17的“IBM WATSON(注册商标)”可以被定制用于专利文献的分析。
需要说明的是,机器学习是一种技术,其使计算机从学习数据中自主地生成算法,以便根据模式和推理来有效地执行特定的任务。根据本实施方式的学习完成模型17是表示如此生成的算法的模型。
专利文献取得部12取得专利文献数据。具体而言,专利文献取得部12接收在专利文献提取装置20中提取的专利文献数据。发送的数据是表示一个或多个专利文献的集合的数据(以下称为集合数据)。集合数据例如可以是CSV(Comma-Separated Values:逗号分隔值)格式等的文件。需要说明的是,集合数据是专利文献数据的一个示例。
分析部13对集合数据进行分析。具体而言,分析部13应用学习完成模型17中所示的算法,针对集合数据中包含的每个专利文献进行分析。
分析部13基于各个专利文献中包含的权利要求书的记载,对本发明的构成要素进行确定。然后,分析部13将各个权利要求的记载分割成每个构成要素。
在此,构成要素是对发明进行限定的要素,并且是将对象包含在发明的范围内所需的要素。具体而言,在产品的发明的情况下,构成要素可以是产品所具备的部件等要素,但不限于此。例如,分析部13可以将产品中包含的相同部件分解成多个构成要素。
通常,为了掌握每个权利要求的发明的范围,将每个权利要求的记载分解成构成要素以进行分析。另外,已知即使如此分解的各个构成要素的记载过长或过短,也难以掌握发明的范围。
因此,期望将学习完成模型17预先通过机器学习构建为用于将各个权利要求分解成具有便于阅读理解的长度的构成要素的算法。然后,分析部13根据如此构建的学习完成模型17中规定的算法,将表示各个权利要求的文本数据作为输入,输出将各个权利要求的记载分解成具有便于阅读理解的长度的构成要素而成的文本数据。
另外,分析部13针对每个权利要求,确定表示发明的主题的文本。具体而言,将学习完成模型17预先通过机器学习构建为用于从每个权利要求的文本数据中提取发明的主题的算法。然后,分析部13根据以此方式构建的学习完成模型17中规定的算法,将表示各个权利要求的文本数据作为输入,输出表示各个权利要求的发明的主题的文本数据。
此外,分析部13将各个权利要求分类为独立形式权利要求和引用形式权利要求。独立形式权利要求(以下记载为独立权利要求)是独立于其他权利要求而描述的权利要求,引用形式权利要求(以下记载为从属权利要求)是通过引用其他权利要求来描述的权利要求。具体而言,将学习完成模型17预先通过机器学习构建为用于基于表示权利要求书的文本数据来对权利要求书中包含的权利要求的从属关系进行确定的算法。然后,分析部13基于以此方式构建的学习完成模型17中规定的算法,将表示权利要求书的文本数据作为输入,输出将各个权利要求分类为独立权利要求和从属权利要求而成的数据。需要说明的是,输出的数据还包括表示从属权利要求所引用的权利要求的编号的数据。在对各个权利要求进行分类时,在判别结果不明的情况下,也可以将其分类为独立权利要求。
独立权利要求和从属权利要求的分类可以通过使用各个权利要求为独立权利要求的确定度(也称为确信度、可靠度、概率)和各个权利要求为从属权利要求的确定度来进行判别。在此情况下,学习完成模型17中规定的算法输出该些确定度。当权利要求为独立权利要求的确定度为预定值以上时,分析部13将该权利要求分类为独立权利要求。另外,当权利要求为从属权利要求的确定度为预定值以上时,分析部13将该权利要求分类为从属权利要求。另外,分析部13将既不属于独立权利要求也不属于从属权利要求的权利要求(即,作为独立权利要求的确定度小于预定值且作为从属权利要求的确定度小于预定值的权利要求)分类为独立权利要求。
在针对各个权利要求判别结果不明的情况或输出的确定度较低的情况下,通过从失败保护的观点出发将其分类为独立权利要求,从而能够防止用户看漏独立权利要求。
需要说明的是,为了提高上述的各种分析的精度,分析部13可以在将学习完成模型17中所示的算法应用于集合数据之前,执行基于规则的预处理。
例如,分析部13可以从各个专利文献中包含的权利要求书的记载中,提取作为用于分割为每个权利要求的指标的文本。具体而言,分析部13可以提取表示各个权利要求编号的文本、紧接在句号之前的文本、或“其特征在于”等文本。
需要说明的是,根据专利文献的格式,可以认为在权利要求书的记载中不存在“权利要求”的记载。然而,由于认为权利要求书的记载中至少包含表示各个权利要求编号的文本,因此优选分析部13基于各个权利要求编号前后的文本的规则性来提取作为用于分割为每个权利要求的指标的文本。
另外,为了提高构成要素的确定的精度,分析部13可以从各个专利文献中包含的权利要求书的记载中,提取“所述”或“该”等文本作为表示先行词的文本。在此情况下,提取的字符串之后的词为表示构成要素的文本的候选。
分析部13可以提取“具备”、“包括”或“由……组成”等文本作为表示结构的文本,并可以进一步提取“具备……的步骤”、“用于进行……的步骤”等文本作为表示步骤的结构的文本。
分析部13可以提取“在此”、“由此”或“对此”等文本作为表示原因和结果的关系等的文本。
另外,分析部13可以提取“其特征在于”或“其中”等文本作为构成要素之中的特别对前提进行限定的文本。
分析部13可以提取“以上”、“以下”、“小于”或“从……到……”等文本作为对记载内容为数值范围的部分进行限定的文本。
另外,为了提高将各个权利要求分类为独立权利要求或从属权利要求的精度,分析部13可以提取在从属权利要求中使用的“进一步”和“根据……所述的”等文本。
此外,分析部13可以进行词素分析作为预处理。例如,分析部13将每个权利要求的记载分割成词素,从分割出的词素中选择表示构成要素的候选文本,并对各个权利要求或权利要求书的记载中包含的个数进行计数。
分析部13将该些预处理的结果与集合数据中包含的每个专利文献的文本一起输入至学习完成模型17中,并获得从学习完成模型17输出的分析结果。
需要说明的是,优选地,分析部13可以针对在各个专利文献的记载中使用的每种语言执行具有不同内容的处理作为该些预处理。另外,分析部13可以使用针对各个专利文献的记载中使用的每种语言具有不同内容的学习完成模型17进行分析。更优选地,分析部13可以进行针对每个申请对象(特定国家或国际申请)具有不同内容的预处理或使用了具有不同内容的学习完成模型17的分析。由此,分析部13能够根据基于语言的特性或基于申请对象的特性的分析。
具体而言,分析部13根据各个专利文献的记载对所使用的语言进行判别。然后,如表1所示,分析部13提取与上述的事例相对应的每种语言的文本。
[表1]
例如,当判别为英文或中文的专利文献时,分析部13可以提取表1所示的英文或中文的文本。
另外,集合数据可以针对每个专利文献包含表示申请对象的文本。例如,表示各个专利文献的文本包含表示美国的“US”、表示欧洲的“EP”、表示国际申请的“PCT”等文本。因此,分析部13可以从表示各个专利文献的文本中提取表示申请对象的文本,并进行针对每个申请对象不同的预处理或使用了具有不同内容的学习完成模型17的分析。
另外,学习完成模型17可以包括针对分析内容而不同的多个模型。例如,分析部13可以通过使用各个模型来实现构成要素的确定、表示发明的主题的文本的确定、以及将各个权利要求分类为独立权利要求或从属权利要求。
为了对专利文献的阅读理解进行辅助,显示控制部14基于分析部13的分析结果,使显示装置105或终端装置30显示后述的各种画面。
评价登记部15根据由操作接受部16接受到的用户的操作,登记对专利文献进行评价后的结果。登记的评价内容由显示控制部14显示在显示装置105或终端装置30的画面上。
操作接受部16从输入装置104或终端装置30接受用户的操作。具体而言,操作接受部16接受针对输入装置104或终端装置30所具备的键盘、鼠标、触摸面板等各种输入设备的输入。
接着,对信息处理装置10的动作进行说明。
图4是示出根据一个实施方式的信息处理装置的阅读理解辅助处理的一个示例的流程图。
专利文献提取装置20响应于用户的操作,将请求开始阅读理解辅助处理的信号发送至信息处理装置10。信息处理装置10响应于从专利文献提取装置20发送的请求信号,开始阅读理解辅助处理。专利文献取得部12取得专利文献的集合数据(步骤S11)。
具体而言,专利文献提取装置20接受检索条件的指定,从专利文献的数据库中检索专利文献。然后,专利文献提取装置20将检索到的一个或多个专利文献作为一个集合数据发送至信息处理装置10。发送的集合数据例如是CSV格式的数据。
接着,分析部13对通过接收取得的集合数据进行分析(步骤S12)。具体而言,分析部13根据学习完成模型17中规定的算法对专利文献的集合数据进行分析,并输出每个专利文献的分析结果。
输出的分析结果包括将各个权利要求的记载分解为便于阅读理解的长度的构成要素而成的文本数据、表示各个权利要求的发明的主题的文本数据、以及将各个权利要求分类为独立权利要求和从属权利要求而成的数据。
接着,显示控制部14根据由操作接受部16接受的用户的操作,使显示装置105或终端装置30显示分析结果画面(步骤S13)。显示的分析结果画面是对专利文献的阅读理解进行辅助的画面。关于具体的显示内容,后面将作说明。
接着,评价登记部15登记由用户输入的评价结果(步骤S14)。具体而言,操作接受部16接受用户的操作,并取得表示在分析结果画面所包含的评价输入栏中输入的评价结果的信息。评价登记部15将表示由操作接受部16取得的评价结果的信息存储在存储部11中。
需要说明的是,被存储的表示评价结果的信息与专利文献相关联。当显示专利文献时,显示控制部14显示包括与该专利文献相关联的评价结果的分析结果画面。另外,信息处理装置10可以将表示所登记的评价结果的信息发送至专利文献提取装置20。
接着,对由显示控制部14显示在显示装置105或终端装置30上的画面进行说明。
信息处理装置10的显示控制部14响应于由操作接受部16接受的用户的操作,使显示装置105或终端装置30显示集合一览表画面。集合一览表画面包括在上述的阅读理解辅助处理的步骤S11中由专利文献取得部12取得的专利文献的集合数据的一览表。
各个集合数据的显示栏例如包括面板标题栏、面板列表、以及备忘录栏。
在面板标题栏中,例如显示以集合数据作为对象的分析项目的名称。
在面板列表中,例如以列表的形式显示集合数据的标题、集合数据中包含的公报件数、创建日期或最近的修改日期、创建者或最近的修改者等集合数据的属性信息。
另外,在备忘录栏中,例如包括用于将接受向集合数据赋予的备忘录用的文本的输入的备忘录编辑画面弹出显示的按钮的GUI(Graphical User Interface:图形用户界面)、以及对输入的备忘录用的文本进行显示的显示栏。
信息处理装置10的显示控制部14响应于由操作接受部16接受的用户的操作,使显示装置105或终端装置30显示公报一览表画面。
公报一览表画面例如包括在集合一览表画面上选择的集合数据中包含的公报的一览表。另外,公报一览表画面包括公报选择区域和分析按钮。
公报一览表例如包括项目编号、标记、公报编号、名称、申请人、评价、状态、以及发明的对象作为项目。
项目“项目编号”的值是集合数据中的公报的编号。
作为项目“标记”的值,显示在后述的分析结果屏幕上设置的标记。该标记例如用于对用户关注的公报进行记录。
项目“公报编号”的值是专利公报、公开公报等公布各个专利文献的公报的编号。
项目“名称”值是各个专利文献中的发明的名称。
项目“申请人”的值是各个专利文献的申请人的名称。
项目“评价”的值是在后述的分析结果画面上登记的评价结果。
项目“状态”的值是各个专利文献的审查状况。
项目“发明的对象”的值是表示通过由分析部13对各个专利文献进行分析而确定的发明的主题的文本。
公报选择区域是对公报进行选择的复选框。当用户在公开选择区域中选择专利文献并按下分析按钮时,显示控制部14响应于由操作接受部16接受的用户的操作,使显示装置105或终端装置30显示用于表示所选择的专利文献的分析结果的分析结果画面。
集合一览表画面的显示和公报的一览表的显示也可以显示在由被许可信息共享的其他用户所使用的多个显示装置105或终端装置30上。由此,能够通过由特定的用户组成的团队对在评价登记部15中输入的评价结果进行共享和管理。另外,通过由团队对专利文献的集合进行管理,从而能够以分工的方式进行专利文献的阅读理解,并且能够减轻每个用户的负担。
图5是示出根据一个实施方式的分析结果画面的一个示例的图。
分析结果画面包括标题栏1021、导航显示栏1022、权利要求显示栏1023、评价登记栏1024、正文显示栏1025、以及附图显示栏1026。
标题栏1021包括集合数据的名称、针对公报一览表画面的链接等。另外,标题栏1021针对当前选择的专利文献包括申请人、发明名称、状态显示1031、图标中心1032等。图标中心1032例如包括有无同族专利的显示、详细显示按钮、标记按钮、全文显示按钮、PDF(Portable Document Format)按钮、CSV输出按钮、打印输出按钮等的图标显示或接受操作的按钮等。
状态显示1031通过颜色对当前选择的专利文献的专利权是否有效进行显示。例如,在专利权有效的情况下,状态显示1031为表示仍然有效的绿色,在专利权的有效期已经结束的情况下,状态显示1031为表示并非有效的黄色。
具体而言,显示控制部14基于专利文献的申请日,对专利权是否有效进行判定,并根据判定的结果确定状态显示1031的颜色。
在有无同族专利的显示中,可以通过颜色对在当前选择的专利文献中是否存在所谓的专利族进行表示。
例如,当在专利文献中存在专利族时,有无同族专利的显示为表示存在专利族的红色,当不存在同族专利时,有无同族专利的显示为表示不存在专利族的灰色。
具体而言,针对由专利文献提取装置20取得的集合数据的每个专利文献,包含表示专利族存在与否的数据,并且显示控制部14基于集合数据中包含的表示专利族存在与否的数据,确定有无同族专利的显示的颜色。
详细显示按钮例如是用于对将显示专利族的详细信息的画面弹出显示的GUI。还针对由专利文献提取装置20取得的集合数据的每个专利文献,包含表示专利族的详细信息的数据。
标记按钮例如是用于接受在当前选择的专利文献中设置标记的操作的GUI。当设置了标志时,将所设置的标记显示在上述的公报一览表画面和后述的导航显示栏中。
全文显示按钮是用于显示弹出画面的GUI,该弹出画面包含当前选择的专利文献中包含的说明书、权利要求书、附图、摘要等的记载。
PDF按钮是用于生成和下载PDF文件的GUI,该PDF文件包含当前选择的专利文献中包含的说明书、权利要求书、附图、摘要等的记载。
CSV输出按钮是用于将在权利要求显示栏1023中显示的文本作为按照显示格式的CSV格式的文件输出的GUI。当以CSV格式的文件获得分解为每个构成要素的各个权利要求的记载时,能够以CSV格式的文件作为基础,将其用于权利要求表分析等详细的分析。
打印输出按钮是用于对当前显示的权利要求显示栏1023进行打印的GUI。
导航显示栏1022包括在公布一览表画面中选择的公报的一览表,并且是用于接受对在标题栏1021、权利要求显示栏1023、正文显示栏1025、附图显示栏1026等中显示的专利文献进行选择的操作的显示栏。
权利要求显示栏1023是用于基于分析部13针对当前选择的专利文献的分析结果对权利要求书的记载进行阅读理解的显示栏。
权利要求显示栏1023包括全部权项按钮1033、独立权项按钮1034、分割显示形式切换按钮1038、折叠记号1039、权利要求编号显示栏1040、以及构成要素显示栏1041。
另外,全部权项按钮1033和独立权项按钮1034是用于分别显示全部权利要求的项数和独立权利要求的项数,并且从“全部权利要求”和“独立权利要求”两个显示对象选择当前显示的显示对象的GUI。当显示对象为“全部权利要求”时,显示包括独立权利要求和从属权利要求在内的所有权利要求,当显示对象为“独立权利要求”时,仅显示独立权利要求。
分割显示形式切换按钮1038是用于每次按下时,以依次进行切换的方式从“展开全部权利要求”、“隐藏全部权利要求”、“仅独立权利要求”三个分割显示形式中选择用于将权利要求书的说明分割显示为多个构成要素的形式的GUI。在分割显示形式切换按钮1038旁边显示所选择的分割显示形式。
在分割显示形式为“展开全部权利要求”的情况下,显示所有被选择为显示对象的权利要求的构成要素。在分割显示形式为“隐藏全部权利要求”的情况下,不显示所有被选择为显示对象的权利要求的构成要素。另外,在分割显示形式为“仅独立权利要求”的情况下,仅显示被选择为显示对象的权利要求之中的独立权利要求的构成要素。
需要说明的是,图5是选择“全部权利要求”作为显示目标、并选择“展开全部权利要求”作为分割显示形式的画面的一个示例,并且后述的图6是其另一个示例。另外,后述的图7是选择“全部权利要求”作为显示对象、并选择“仅独立权利要求”作为分割显示形式的画面的一个示例,图8是选择“全部权利要求”作为显示对象、并选择“隐藏全部权利要求”作为分割显示形式的画面的一个示例。
折叠记号1039是表示是否显示各个权利要求的构成要素的记号。需要说明的是,如图5所示,在分割显示形式为“展开全部权利要求”的情况下,由于针对所有被选择为显示目标的权利要求对构成要素进行显示,因此折叠记号1039为表示显示构成要素的向下箭头。
权利要求编号显示栏1040包括各个权利要求的编号、表示各个权利要求的发明的主题的文本、以及在从属权利要求的情况下引用的权利要求的编号。
表示各个权利要求的发明的主题的文本、从属权利要求引用的权利要求的编号等包含在分析部13的分析结果中。然后,显示控制部14基于分析结果,将表示主题的文本与所述权利要求的编号相关联地显示在显示装置105或终端装置30上。
在权利要求编号显示栏1040中,例如独立权利要求的情况下的背景颜色与从属权利要求的情况下的背景颜色不同,从而可以一目了然地对独立权利要求和从属权利要求进行区分。
在构成要素显示栏1041中,在针对每个构成要素不同的显示栏中排列地显示有表示各个权利要求的文本。表示各个构成要求的文本是根据学习完成模型17中规定的算法被分析部13分解成便于阅读理解的长度的文本。
通过在显示对象为“全部权利要求”且分割显示形式为“展开全部权利要求”的情况下的权利要求显示栏1023的显示,使得用户能够对权利要求书中包含的全部权利要求的记载综合地进行确认,同时能够对各个权利要求的记载快速且准确地进行阅读理解。
显示控制部14将表示权利要求书的各个权利要求的文本分割为每个构成要素,并将其显示在显示装置105或终端装置30上。用户通过对分割为每个构成要素的文本进行阅读,从而缩短对构成要素的划分进行搜索的时间,并提高阅读理解的速度。另外,由于对构成要件错误地进行划分的情况变少,因此阅读理解的准确性得到提高。
在评价登记栏1024中显示评价结果的选项。可以针对每个用户设定从预先设定的选项中优先显示的选项。当选择了评价登记栏1024中包含的“评价输入显示”链接时,显示控制部14在显示装置105或终端装置30上显示评价输入画面。关于评价输入画面后面将作说明。
在针对当前选择的专利文献已经登记了由用户进行的评价的结果的情况下,在评价登记栏1024中显示所登记的评价结果。
在正文显示栏1025中显示“文本显示”链接。当选择“文本显示”链接时,显示控制部14在显示装置105或终端装置30上显示当前选择的专利文献的说明书中记载的文本。
在附图显示栏1026中显示当前选择的专利文献的代表图和各个附图。在附图显示栏1026中,除了附图文件的图以外,还可以显示在说明书中由“表1”等所示的表、由“式1”所示的化学式或计算式等、或由“化1”等所示的化学结构图。
图6是示出根据一个实施方式的分析结果画面的另一个示例的图。
如图6所示,在权利要求显示栏1023中,可以以将表示各个权利要求的文本进一步分割为多个阶层的方式进行显示。具体而言,在权利要求显示栏1023中,将表示各个权利要求的文本分割而得到的文本被显示为构成要素显示栏(上位阶层)1042,并且将显示在构成要素显示栏(上位阶层)1042中的文本进一步分割而得到的文本被显示为构成要素显示栏(下位阶层)1043。
构成要素显示栏(上位阶层)1042和构成要素显示栏(下位阶层)1043被相互关联地显示。构成要素显示栏(下位阶层)1043与作为其上位的阶层的构成要素显示栏(上位阶层)1042相比位于画面的下方。
需要说明的是,虽然在图6中示出了两个阶层以下的阶层显示的示例,但是也可以包括三个阶层以上的阶层显示。
另外,由于通过仅对未被阶层化的构成要素显示栏1041和作为最下位的阶层的构成要素显示栏(下位阶层)1043进行阅读,就能够不重复地对表示各个权利要求的所有文本进行阅读,因此作为最下位以外的阶层的构成要素显示栏(上位阶层)1042与未被阶层化的构成要素显示栏1041和作为最下位的阶层的构成要素显示栏(下位阶层)1043相比为不显眼的显示。
通过将表示各个权利要求的文本以分成多个阶层的方式显示,从而即使在表示各个权利要求的文本包含具有复杂的复合句结构或长句子的构成要素的记载的情况下,也易于对文章结构进行理解,从而实现快速且准确的阅读理解。
需要说明的是,权利要求显示栏1023被图表化为结构图来进行显示。例如,权利要求编号显示栏1040与构成要素显示栏1041、构成要素显示栏(上位阶层)1042或构成要素显示栏(下位阶层)1043通过线被互相关联。即,在权利要求显示栏1023中,构成要素之间的关系被图表化为结构图来进行显示。
构成要素显示栏1041通过以被框包围的方式将构成要素一体地表示从而构成结构图的一部分。
另外,通过图表化为结构图,从而将表示各个权利要求的文本的复杂的文章结构可视化。并且,通过图表化为结构图以进行可视化,从而例如在一个阶层的情况下,能够对多个构成要素为同列的情况迅速地进行识别,并且在多个阶层以上的情况下,能够对表示权利要求的文本具有复杂的阶层关系的情况迅速地进行识别。
图7是示出根据一个实施方式的分析结果画面的又一个示例的图。
图7是按下图5所示的分析结果画面的全部权项按钮1033以选择“全部权利要求”作为显示对象,并按下分割显示形式切换按钮1038以选择“仅独立权利要求”作为分割显示形式的画面的一个示例。
在该分割显示形式中,在独立权利要求的情况下,显示权利要求编号显示栏1040和构成要素显示栏1041。在从属权利要求的情况下,仅显示权利要求编号显示栏1040,不显示构成要素显示栏1041。
在独立权利要求的权利要求编号显示栏1040旁边显示的折叠记号1039为表示显示了构成要素的向下箭头。在从属权利要求的权利要求编号显示栏1040旁边显示的折叠记号1039为表示未显示构成要素的右向箭头。
在分割显示形式为“仅独立权利要求”时,关于当前选择的专利文献的专利权,仅将与权利范围直接相关的独立权利要求展开为构成要素进行显示,关于与权利范围未直接相关的从属权利要求不显示其记载内容。因此,由于在画面内仅显示必要性较高的信息,因此用户能够高效地进行阅读理解,从而能够对专利权的权利范围快速且准确地进行掌握。
图8是示出根据一个实施方式的分析结果画面的又一个示例的图。
图8是按下图5所示的分析结果画面的全部权项按钮1033以选择“全部权利要求”作为显示对象,并按下分割显示形式切换按钮1038以选择“隐藏全部权利要求”作为分割显示形式的画面的一个示例。
在该分割显示形式中,针对全部权利要求,仅显示权利要求编号显示栏1040,不显示构成要素显示栏1041。
在各个权利要求的权利要求编号显示栏1040旁边显示的折叠记号1039为表示未显示构成要素的右向箭头。
在分割显示形式为“隐藏全部权利要求”时,不显示各个权利要求的内容,而在画面内显示更多用于表示各个权利要求的发明的主题的文本,从而一目了然地对独立权利要求和从属权利要求进行区分。因此,用户能够一目了然地对整个权利要求书的构成进行掌握。另外,由于仅显示表示权利要求的发明的主题的文本,因此在为无需进行阅读理解的专利文献的情况下,用户能够迅速地跳过该专利文献。
另外,通过对表示发明的主题的文本进行查看,从而能够在对权利要求的记载进行阅读之前,对其是否为需要详细地进行阅读理解的权利要求快速地进行判断,从而提高全体的专利文献的阅读理解的速度。
虽然未图示,但是当按下图5所示的分析结果画面的独立权项按钮1034以选择“独立权利要求”作为显示目标,并按下分割显示形式切换按钮1038以选择“隐藏全部权利要求”作为分割显示形式时,在当前选择的专利文献中,针对独立权利要求,仅显示权利要求编号显示栏1040,不显示构成要素显示栏1041,针对从属权利要求,权利要求编号显示栏1040和构成要素显示栏1041均不被显示。
在选择图5、图6、图7或图8的分析结果画面的评价登记栏1024的“评价输入显示”链接时,可以将评价输入画面弹出显示。
评价输入画面可以包括评价选择按钮、类别选择下拉菜单、文本输入栏、以及登记按钮。
评价选择按钮例如是用于选择预先设定的选项之中的、设定为针对每个用户优先显示的选项的GUI。
在评价输入画面中,除了设置评价选择按钮以外,还可以设置评价选择下拉菜单。评价选择下拉菜单是用于从预先设定的选项之中的设定为针对每个用户优先显示的选项以外的选项中选择评价结果的GUI。
类别选择下拉菜单例如是用于从在专利文献提取装置20中设定的选项中选择评价类别的GUI。
文本输入栏例如是用于输入备注、评论等文本的输入栏。
登记按钮例如是用于对选择和输入信息进行登记的GUI。当按下登记按钮时,评价登记部15将所选择并输入的信息与当前选择的专利文献相关联地存储在存储部11中,并将其发送至专利文献提取装置20。
由此,用户能够记录对专利文献进行阅读和评价的结果,并使用自己评价的结果,并且能够将评价结果告知其他用户并让其使用。
需要说明的是,虽然示出了将评价结果与专利文献相关联的示例,但是评价登记部15也可以对针对每个权利要求或针对每个构成要素进行评价的评价结果进行登记。
通过根据本实施方式的阅读理解辅助系统1,由于在分析结果画面内配置了阅读理解所需的信息,因此能够迅速且准确地对专利文献的内容进行阅读理解。
传统上,在对权利要求书中包含的权利要求的记载进行阅读理解时,负责人等需要将权利要求的记载分解为每个构成要素,并针对每个构成要素进行研究。
然而,如图5、图6或图7所示,分析部13通过对学习完成模型17进行有效利用来进行分析,并且显示控制部14针对将权利要求的记载分解而成的每个构成要素进行显示,从而能够减轻将权利要求分解为构成要素的工作的负担,并能够避免因分解为构成要素的不当而引起的误解等的风险。
另外,如图7所示,通过仅将独立权利要求展开为构成要素并进行显示,从而例如在要关注权利范围来进行阅读理解的情况下,在画面内仅显示必要性较高的信息,从而使用户能够在避免看漏的风险,同时能够高效地进行阅读理解。
此外,如图8所示,通过以一览表的方式显示用于表示各个权利要求的发明的主题的文本,从而使用户能够一目了然地对整个权利要求书的构成进行掌握。
通过根据本实施方式的阅读理解辅助系统1,提高了用户对专利文献的阅读理解的精度,从而减少了专利文献提取装置20从用户接受请求的检索处理的次数,并抑制了专利文献提取装置20的处理负荷。
另外,由于提高了专利文献的检索工作的精度,因此促进了在产品开发等中的专利发明的有效利用,减轻了侵犯专利权的风险。
本发明不限于具体公开的实施方式,并且可以在不脱离权利要求书的情况下进行各种变形和改变。
在本实施方式中,示出了表示集合数据中包含的专利文献的数据是在专利公报、公开公报等公报中记载的数据的示例。然而,表示专利文献的数据不限于在公报中记载的数据。表示专利文献的数据只要表示权利要求书,并且包含针对每个权利要求记载的文本数据,则也可以不包含例如所谓的权利要求草案等表示说明书、附图、摘要等的数据。
本实施方式中的表示发明的主题的文本是表示发明的对象的文本。更具体而言,作为表示发明的主题的文本,从各个权利要求的文本中,选择唯一地表征发明且具有用户便于对发明进行识别的程度的长度的短语。表示发明的主题的文本可以与发明的名称相同,也可以在日文等的情况下是与各个权利要求的末尾的措辞相同的短语,也可以是与该些记载不同的短语。例如,其可以不仅是“蓄电设备用集电体”等各个权利要求的末尾的措辞,而是包括“形成有被覆层的蓄电设备用集电体”等能够与该技术领域的其他发明进行差别化的表示具体的发明特征的措辞。
如果用户仅通过对该类表示发明的主题的文本进行查看就能够大致理解发明的内容,则在对权利要求的记载进行阅读之前,就能够对其是否为需要详细进行阅读理解的权利要求快速地进行判断。
显示控制部14可以以在图5、图6或图7所示的构成要素显示栏1041中对权利要求书的重要词、新出词等进行强调显示的方式进行控制。
重要词是在权利要求书中作为与发明的本质部分相关的重要的用语使用,并且关于该用语在后面记载有详细的说明的用语。例如,可以将在权利要求书中被反复记载作为要件之一,来提取重要词。
新出词是在权利要求书中不存在先行的记载的用语,并且是在说明书中对发明进行说明的用语。新出词可以与重要词重复,并且可以仅限于技术用语、一般用语或专业用语以外的用语。
在此情况下,分析部13基于说明书和权利要求书的记载,提取权利要求书的新出词、重要词等,并且显示控制部14基于分析结果,进行以红色等与其他文字颜色不同的颜色来显示构成要素显示栏1041的新出词的控制。通过以此方式对新出词、重要词进行强调显示,从而能够在权利要求书内立即找到要关注的部分。
信息处理装置10可以将分解为各个构成要素的权利要求的记载反映到电子表格软件等的形式的表格数据中并进行输出。用户能够将输出的数据原样地用于调查资料等原始数据。
虽然示出了根据本实施方式的信息处理装置10、专利文献提取装置20以及终端装置30分别为单独的装置的示例,但是其一部分或全部也可以由相同的装置来实现。
显示装置105和终端装置30分别是由显示控制部14控制以显示画面的显示装置的一个示例。显示装置不限于此,只要能够显示画面,则也可以是投影仪、监视器等。
虽然在本实施方式中,示出了专利文献和各种显示画面为日文的示例,但是也可以是其他语言。例如,在英文的专利文献的情况下,只要构建专门用于英文专利文献的学习完成模型17,则也可以通过与日文专利文献的情况相同的机制来实现阅读理解辅助系统1。
另外,本国际申请以于2019年12月20日提交的日本发明专利申请2019-230888号、日本发明专利申请2019-230889号及日本发明专利申请2019-230890号作为要求优先权的基础,并在本国际申请中援引该日本专利申请的全部内容。
符号说明
1 阅读理解辅助系统;
10 信息处理装置;
11 存储部;
12 专利文献取得部;
13 分析部;
14 显示控制部;
15 评价登记部;
16 操作接受部;
17 学习完成模型;
20 专利文献提取装置;
30 终端装置;
40 网络;
101 CPU;
102 主存储装置;
103 辅助存储装置;
104 输入装置;
105 显示装置;
106 通信接口装置;
107 驱动器装置;
108 存储介质;
1021 标题栏;
1022 导航显示栏;
1023 权利要求显示栏;
1024 评价登记栏;
1025 正文显示栏;
1026 附图显示栏;
1031 状态显示;
1032 图标中心;
1033 全部权项按钮;
1034 独立权项按钮;
1038 分割显示形式切换按钮;
1039 折叠记号;
1040 权利要求编号显示栏;
1041 构成要素显示栏;
1042 构成要素显示栏(上位阶层);
1043 构成要素显示栏(下位阶层)。
Claims (19)
1.一种信息处理装置,包括:
分析部,对专利文献数据中包含的表示权利要求书的文本数据进行分析,以针对所述权利要求书中包含的每个权利要求,对发明的构成要素进行确定;以及
显示控制部,将表示所述权利要求书的各个权利要求的文本分割成每个所述构成要素并显示在显示装置上。
2.根据权利要求1所述的信息处理装置,其中,
所述分析部进一步从表示权利要求书的所述文本数据中,对表示重要的用语的重要词进行确定,
所述显示控制部在表示所述权利要求书的各个权利要求的文本中,对表示所述重要词的文本进行强调并将其显示在所述显示装置上。
3.根据权利要求1或2所述的信息处理装置,其中,
所述分析部进一步对所述专利文献数据中包含的表示说明书的文本数据进行分析,以进一步对表示作为用于在所述说明书中对发明进行说明的用语的、在所述权利要求书中不存在先行的记载的用语的新出词进行确定,
所述显示控制部在表示所述权利要求书的各个权利要求的文本中,对表示所述新出词的文本进行强调并将其显示在所述显示装置上。
4.根据权利要求1至3中任一项所述的信息处理装置,还包括:
操作接受部,接受用户针对所述专利文献数据的评价结果的输入;以及
评价登记部,将所述评价结果与所述专利文献数据相关联地登记,
其中,所述显示控制部将所述评价结果显示在所述显示装置上。
5.根据权利要求4所述的信息处理装置,其中,
所述显示控制部将被所述分析部作为分析对象的所述专利文献数据和登记在所述评价登记部中的所述评价结果显示在由多个用户使用的装置上。
6.根据权利要求1至5中任一项所述的信息处理装置,其中,
所述显示控制部将分割而成的所述构成要素图表化为结构图并进行显示。
7.根据权利要求1至6中任一项所述的信息处理装置,其中,
所述分析部对所述专利文献数据中包含的表示所述权利要求书的所述文本数据进行分析,以针对所述权利要求书中包含的每个所述权利要求,对所述发明的主题进行确定,
所述显示控制部将表示所述主题的文本与所述权利要求的编号相关联地显示在所述显示装置上。
8.根据权利要求7所述的信息处理装置,其中,
所述显示控制部根据用户的操作在包含表示所述权利要求书的各个权利要求的所述文本的显示和不包含所述文本的显示之间进行切换,并且将其显示在所述显示装置上。
9.根据权利要求7或8所述的信息处理装置,其中,
所述分析部从表示所述权利要求的所述文本数据中选择表示所述主题的所述文本。
10.根据权利要求7或8所述的信息处理装置,其中,
所述分析部从表示所述权利要求的所述文本数据中选择唯一地表征所述发明且具有用户便于对发明进行识别的程度的长度的短语,并将其作为表示所述主题的所述文本。
11.根据权利要求1至10中任一项所述的信息处理装置,其中,
所述分析部对所述专利文献数据中包含的表示所述权利要求书的所述文本数据进行分析,以对所述权利要求书中包含的权利要求的从属关系进行确定,
所述显示控制部基于确定的所述从属关系,将表示所述权利要求书中包含的独立权利要求的文本显示在所述显示装置上。
12.根据权利要求7至10中任一项所述的信息处理装置,其中,
所述分析部对所述专利文献数据中包含的表示所述权利要求书的所述文本数据进行分析,以对所述权利要求中包含的权利要求的从属关系进行确定,
所述显示控制部基于确定的所述从属关系,
针对独立权利要求,将表示所述权利要求书的各个权利要求的文本分割成每个所述构成要素并进行显示,
针对从属权利要求,将表示所述主题的文本与所述权利要求的编号相关联地显示,并且选择显示表示分割成每个所述构成要素的所述权利要求书的各个权利要求的文本的分割显示形式、以及不显示表示所述权利要求书的各个权利要求的文本的分割显示形式中的任意一种显示形式,并以选择的所述显示形式显示在所述显示装置上。
13.根据权利要求11或12所述的信息处理装置,其中,
所述分析部在对所述从属关系进行确定的处理中,将所述从属关系不明的权利要求分类为独立权利要求。
14.一种阅读理解辅助方法,
对专利文献数据中包含的表示权利要求书的文本数据进行分析,以针对所述权利要求书中包含的每个权利要求,对发明的构成要素进行确定,
将表示所述权利要求书的各个权利要求的文本分割成每个所述构成要素并进行显示。
15.根据权利要求14所述的阅读理解辅助方法,其中,
对所述专利文献数据中包含的表示所述权利要求书的所述文本数据进行分析,以针对所述权利要求书中包含的每个所述权利要求,对所述发明的主题进行确定,
将表示所述主题的文本与所述权利要求的编号相关联地显示。
16.根据权利要求14或15所述的阅读理解辅助方法,其中,
对所述专利文献数据中包含的表示所述权利要求书的所述文本数据进行分析,以对所述权利要求书中包含的权利要求的从属关系进行确定,
基于确定的所述从属关系,对表示所述权利要求书中包含的独立权利要求的文本进行显示。
17.一种程序,用于使计算机执行以下步骤:
对专利文献数据中包含的表示权利要求书的文本数据进行分析,以针对所述权利要求书中包含的每个权利要求,对发明的构成要素进行确定的步骤;以及
将表示所述权利要求书的各个权利要求的文本分割成每个所述构成要素并显示在显示装置上的步骤。
18.根据权利要求17所述的程序,其中,所述程序用于进一步使所述计算机执行以下步骤:
对所述专利文献数据中包含的表示所述权利要求书的所述文本数据进行分析,以针对所述权利要求书中包含的每个所述权利要求,对所述发明的主题进行确定的步骤;以及
将表示所述主题的文本与所述权利要求的编号相关联地显示在所述显示装置上的步骤。
19.根据权利要求17或18所述的程序,其中,所述程序用于进一步使所述计算机执行以下步骤:
对所述专利文献数据中包含的表示所述权利要求书的所述文本数据进行分析,以对所述权利要求书中包含的权利要求的从属关系进行确定的步骤;以及
基于确定的所述从属关系,将表示所述权利要求书中包含的独立权利要求的文本显示在所述显示装置上的步骤。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019230889 | 2019-12-20 | ||
JP2019230890 | 2019-12-20 | ||
JP2019-230888 | 2019-12-20 | ||
JP2019-230889 | 2019-12-20 | ||
JP2019-230890 | 2019-12-20 | ||
JP2019230888 | 2019-12-20 | ||
PCT/JP2020/047078 WO2021125252A1 (ja) | 2019-12-20 | 2020-12-17 | 情報処理装置、読解支援方法およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114830122A true CN114830122A (zh) | 2022-07-29 |
Family
ID=76477611
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080087033.8A Pending CN114830122A (zh) | 2019-12-20 | 2020-12-17 | 信息处理装置、阅读理解辅助方法及程序 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230334252A1 (zh) |
EP (1) | EP4080444A4 (zh) |
JP (1) | JPWO2021125252A1 (zh) |
CN (1) | CN114830122A (zh) |
WO (1) | WO2021125252A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7536375B1 (ja) | 2024-03-24 | 2024-08-20 | 株式会社椿知財サービス | 情報処理装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3682535B2 (ja) * | 2002-10-03 | 2005-08-10 | 独立行政法人情報通信研究機構 | 文書差分検出装置及びプログラム |
WO2005048055A2 (en) * | 2003-11-07 | 2005-05-26 | Spore, Inc. | Patent claims analysis system and method |
US7823061B2 (en) * | 2004-05-20 | 2010-10-26 | Wizpatent Pte Ltd | System and method for text segmentation and display |
JP2007065745A (ja) * | 2005-08-29 | 2007-03-15 | Canon Inc | 文書検索方法および文書検索装置、プログラム |
JP3908261B2 (ja) * | 2006-05-26 | 2007-04-25 | インテック・ウェブ・アンド・ゲノム・インフォマティクス株式会社 | 修辞構造解析システム |
US9372923B2 (en) * | 2007-05-09 | 2016-06-21 | Lexisnexis Group | Systems and methods for analyzing documents |
JP5489872B2 (ja) | 2010-06-17 | 2014-05-14 | 株式会社インテック | 請求項構造情報生成装置、請求項構造情報生成方法、及びプログラム |
JP6232736B2 (ja) | 2013-05-08 | 2017-11-22 | 株式会社リコー | 文書読解支援装置、文書読解支援システム、文書読解支援方法およびプログラム |
-
2020
- 2020-12-17 WO PCT/JP2020/047078 patent/WO2021125252A1/ja unknown
- 2020-12-17 EP EP20901455.4A patent/EP4080444A4/en active Pending
- 2020-12-17 US US17/757,375 patent/US20230334252A1/en active Pending
- 2020-12-17 JP JP2021565637A patent/JPWO2021125252A1/ja active Pending
- 2020-12-17 CN CN202080087033.8A patent/CN114830122A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230334252A1 (en) | 2023-10-19 |
WO2021125252A1 (ja) | 2021-06-24 |
EP4080444A1 (en) | 2022-10-26 |
JPWO2021125252A1 (zh) | 2021-06-24 |
EP4080444A4 (en) | 2024-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Higuchi | KH Coder 3 reference manual | |
JP5666307B2 (ja) | 漢字系文字および文字構成要素の分類ならびに読み出しのためのシステムと方法 | |
JP2011501258A (ja) | 情報抽出装置および方法 | |
US20110320459A1 (en) | Term identification method and apparatus | |
KR20160106527A (ko) | 웹 질의에서의 온라인 핸드라이팅 인식을 위한 시스템 및 방법 | |
US12051256B2 (en) | Entry detection and recognition for custom forms | |
CN103576889A (zh) | 输入支持方法和输入支持设备 | |
Melnyk et al. | Widget classification with applications to web accessibility | |
CN114830122A (zh) | 信息处理装置、阅读理解辅助方法及程序 | |
Higuchi | KH Coder 2. x reference manual | |
JP2007279978A (ja) | 文書検索装置及び文書検索方法 | |
JP4356541B2 (ja) | 特許マップ作成支援システム、そのプログラム、及び分析装置 | |
JP2019061522A (ja) | 文書推薦システム、文書推薦方法および文書推薦プログラム | |
US20200411200A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2006227914A (ja) | 情報検索装置、情報検索方法、プログラム、記憶媒体 | |
KR102043434B1 (ko) | 조사 보고서 작성 장치 및 조사 보고서 작성 디스플레이 방법 | |
CN114174965A (zh) | 数字墨水处理系统、方法和程序 | |
JPH11232303A (ja) | テキスト検索装置 | |
KR101078966B1 (ko) | 문서 분석 시스템 | |
JP4615279B2 (ja) | 文献分類認識装置、その方法、文献分類装置、および、それらのプログラム | |
JP5379416B2 (ja) | 言語処理装置および言語処理方法 | |
JP4585768B2 (ja) | 文書処理装置、文書処理方法および文書処理プログラム | |
JP2003203091A (ja) | 文書速読支援装置、文書速読支援方法、文書速読支援プログラムおよび記録媒体 | |
JP4922030B2 (ja) | 文字列検索装置、方法及びプログラム | |
JP7541172B1 (ja) | 情報生成装置、情報生成方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: Tokyo, Japan Applicant after: Lishennoco Co.,Ltd. Address before: Tokyo, Japan Applicant before: Showa electrical materials Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230726 Address after: Tokyo, Japan Applicant after: Showa electrical materials Co.,Ltd. Address before: Tokyo, Japan Applicant before: SHOWA DENKO Kabushiki Kaisha |