CN113302617A - 一种文章生成装置,文章生成方法,以及文章生成程序 - Google Patents
一种文章生成装置,文章生成方法,以及文章生成程序 Download PDFInfo
- Publication number
- CN113302617A CN113302617A CN201980089307.4A CN201980089307A CN113302617A CN 113302617 A CN113302617 A CN 113302617A CN 201980089307 A CN201980089307 A CN 201980089307A CN 113302617 A CN113302617 A CN 113302617A
- Authority
- CN
- China
- Prior art keywords
- article
- patent classification
- classification
- patent document
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000000605 extraction Methods 0.000 claims abstract description 30
- 239000000284 extract Substances 0.000 claims abstract description 25
- 230000005540 biological transmission Effects 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 description 51
- 238000004891 communication Methods 0.000 description 37
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
- G06Q50/184—Intellectual property management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Technology Law (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种即使是在用户输入了缺乏专利性的内容时,也能自动提供高专利性结构的文章生成装置、文章生成方法、以及文章生成程序。所述文章生成装置,包括:接收部,从终端设备接收发明文章;确定部,确定所述发明文章的第一专利分类;选择部,选择与已确定的所述第一专利分类相对应的第二专利分类;提取部,使用所述第二专利分类,从专利文献数据库中提取与所述发明文章相似的第二专利分类专利文献;生成部,基于所述提取的第二专利分类专利文献生成与所述发明文章相关的追加发明文章;发送部,将生成的所述追加发明文章发送至所述终端设备。
Description
技术领域
本发明涉及一种文章生成装置,文章生成方法,以及文章生成程序。
背景技术
专利申请人和专利事务所在进行专利申请之前,会事先调查发明内容是否具有专利性。根据专利文献1中所记载的技术,通过从预定的专利文献集中根据主题分类符号获取专利特征量,无需依赖人工专利检索即可判断被评估专利的专利性。
此外,如果该发明具有专利性,专利申请人或专利事务所则将撰写专利申请用说明书,并提交专利局。该专利申请用说明书的撰写很费力,正在考虑其自动化。专利文献2公开了一种从技术人员所持有的终端设备接收发明人信息或技术信息文献并自动生成专利申请用说明书的技术。通过利用这种技术,专利申请人和专利事务所可以自动撰写专利申请用的说明书。
现有技术文献
专利文献
专利文献1:日本专利公开第2015-207194号
专利文献2:日本专利公开第2014-179068号
发明内容
但是,在所述专利文献1所记载的技术中,虽然可以判断用户输入的发明的内容是否具有专利性,但在判断专利性低时,并不意味着对于低专利性,存在提高专利性的处理。同样的,在所述专利文献2所记载的技术中,无论专利性如何,是基于接收到的技术信息而完成的。
即,不论是哪种技术,当用户输入的发明内容缺乏专利性时,均不提供支持。
因此,考虑到了所述技术问题,本发明的目的在于,提供一种即使是在用户输入了缺乏专利性的内容时,也能自动提供高专利性结构的文章生成装置,文章生成方法,及文章生成程序。
(1)本发明的第1形态涉及一种文章生成装置,包括:接收部,从终端设备接收发明文章;确定部,确定所述发明文章的第一专利分类;选择部,选择与已确定的所述第一专利分类相对应的第二专利分类;提取部,使用所述第二专利分类,从专利文献数据库中提取与所述发明文章相似的第二专利分类专利文献;生成部,基于所述提取的第二专利分类专利文献生成与所述发明文章相关的追加发明文章;发送部,将生成的所述追加发明文章发送至所述终端设备。
(2)可选的,在所述(1)中,还包括专利分类数据库,关联存储所述第一专利分类和第二专利分类之间的对应关系;所述选择部,从所述专利分类数据库中选择与所述第一专利分类对应的所述第二专利分类。
(3)可选的,在所述(1)中,所述提取部利用所述第一专利分类,从专利文献数据库中提取与所述发明文章相似的第一专利分类专利文章;所述选择部选择所述第一专利分类专利文章所赋予的专利分类或与所述第一专利分类专利文章相关联的现有技术文献所赋予的专利分类作为第二专利分类。
(4)可选的,在所述(1)~(3)中的任一项中,所述选择部选择多个第二专利分类,所述发送部将所述多个第二专利分类发送至所述终端设备中;所述接收部从所述终端设备接收多个第二专利分类中的至少1个所述第二专利分类的选择输入;所述提取部可以使用至少一个所述第二专利分类,从专利文献数据库中提取与所述发明文章相似的第二专利文献。
(5)可选的,在所述(1)~(4)中的任一项中,所述提取部从专利文献数据库中提取多个所述第二专利分类专利文献;所述生成部基于所述多个所述第二专利分类专利文献中与所述发明文章最相似的第二专利分类专利文献,生成与所述发明文章相关的追加发明文章。
(6)可选的,在所述(1)~(4)中的任一项中,所述提取部从专利文献数据库中提取多个所述第二专利分类专利文献;所述生成部在所述多个所述第二专利分类专利文献中,将与发明文章不相似的部分的共同部分生成为所述追加发明文章。
(7)可选的,在所述(1)~(6)中的任一项中,所述生成部将存在于第二专利分类专利文献中,但不存在于所述发明文章中的文章生成为所述追加发明文章。
(8)本发明的第2形态涉及一种文章生成方法,包括:接收步骤,从终端设备接收发明文章;确定步骤,确定所述发明文章的第一专利分类;选择步骤,选择与已确定的所述第一专利分类相对应的第二专利分类;提取步骤,使用所述第二专利分类,从专利文献数据库中提取与所述发明文章相似的第二专利分类专利文献;生成步骤,基于所述提取的第二专利分类专利文献生成与所述发明文章相关的追加发明文章;发送步骤,将所述生成的所述追加发明文章发送至所述终端设备。
(9)本发明的第3形态涉及一种文章生成程序,使计算机执行的功能包括:接收功能,从终端设备接收发明文章;确定功能,确定所述发明文章的第一专利分类;选择功能,选择与已确定的所述第一专利分类相对应的第二专利分类;提取功能,使用所述第二专利分类,从专利文献数据库中提取与所述发明文章相似的第二专利分类专利文献;生成功能,基于所述提取的第二专利分类专利文献生成与所述发明文章相关的追加发明文章;发送功能,将生成的所述追加发明文章发送至所述终端设备。
发明的效果
根据所述第1形态~第3形态,可以提供一种即使是在用户输入了缺乏专利性的内容时,也能自动提供高专利性结构的文章生成装置,文章生成方法,及文章生成程序。
附图说明
图1是由文章生成系统1处理的一实施例的示意图。
图2是文章生成系统1的一实施例的结构示意图。
图3是用户的终端设备2一实施例的结构示意图。
图4是服务器4一实施例的结构示意图。
图5是由实施例的文章生成系统1的,从接收来自用户的终端设备2的发明文章,生成追加发明文章,到将生成的追加发明文章发送给用户的终端设备2的一系列流程的操作顺序的示意图。
具体实施方式
下面将参照附图描述关于本公开的一个方面的一种文章生成装置,文章生成方法,以及文章生成程序。然而,该指出的是,本公开的技术范围并不限于这些实施例,而是扩展到权利要求书中描述的发明及其等效物。
(由文章生成系统1的处理概要)
图1是由文章生成系统1处理的一实施例的示意图。
文章生成系统1,包括:多个用户的终端设备2、2、2···以及专利文献数据库3、这些多个用户的终端设备2、以及与专利文献数据库3进行相互通讯的服务器4。服务器4的服务器通讯部417,从多个用户的终端设备2、2、2···接收发明文章,该发明文章,即发明内容,是用户自动生成追加发明文章的基础;服务器处理部416,根据接收到的发明文章以及专利文献数据库3中存储的专利文献,生成追加发明文章。更具体地,服务器处理部416,确定发明文章的第一专利分类,选择与已确定的第一专利分类相对应的第二专利分类,使用第二专利分类,从专利文献数据库中提取与发明文章相似的第二专利分类专利文献,基于提取的第二专利分类专利文献生成与发明文章相关的追加发明文章。并且,服务器通讯部417,将生成的追加发明文章发送至用户的终端设备2、2、2···中。另外,用户输入的发明文章,可以是一个相当于独立项的一个发明文章,也可以是包括多个相当于从属项的发明文章的发明文章。在本实施例中,将相当于独立项的发明文章假设为一个接收结构,但本发明不限于该结构。
另外,在本实施例中,尽管存储在专利文献数据库3中的专利文献被描述为与发明文章相似的相似专利检索目标,但服务器4可以设置为从专利文献数据库3下载专利文献,并在服务器4中提取相似的专利文献的结构。根据该结构,由于可以本地完成处理,因此可以加快处理速度。
专利文献数据库3是例如日本专利局的数据库。专利厅的数据库,可以包括1个机构,也可以包括多个机构。另外,由于包括美国、欧洲、日本、中国及韩国5个机构的数据库,可以覆盖全球约90%的专利,因此,为了提高判断专利性的准确性,可以包括这五个机构的数据库。
(文章生成系统1的示意结构)
图2是文章生成系统1的一实施例的结构示意图。
文章生成系统1包括:多个用户的终端设备2、2、2···和、专利文献数据库3和、服务器4。以下,多个用户的终端设备有时简称为用户的终端设备2。用户的终端设备2、2、2···以及服务器4通过诸如互联网5的通讯网络分别相互连接。进一步的,专利文献数据库3以及服务器4通过例如互联网5等通讯网络分别相互连接。此外,虽然这里图示了一个互联网5,但当互联网5由多个网络组成时,可以在每个网络之间适当地设置网关(未示出)。在用户的终端设备2上执行的程序(例如,浏览程序)和,在服务器4上执行的程序(例如,管理程序),使用诸如超文本传输协议(HTTP)之类的通讯协议进行通讯。
进一步地,在用户的终端设备2与服务器4之间的连接,以及专利文献数据库3与服务器4之间的连接中,所要处理的信息是机密信息,因此互联网5的通讯环境在安全方面需要优异。此外,通过准备专线,可以提高用户终端设备2与服务器4之间的连接,以及专利文献数据库3与服务器4之间的连接的安全性。
(用户的终端设备2的示意结构)
图3是用户的终端设备2一实施例的结构示意图。
用户的终端设备2执行与无线通讯网络的连接、Web访问等。因此,用户的终端设备2包括:终端通讯部211、终端存储部212、终端操作部213、终端显示部214和终端处理部215。
另外,假设了用户的终端设备2为平板电脑或笔记本电脑,但本发明不以此为限。用户的终端设备2可以是任何可以应用本发明的装置,例如多功能手机(所谓的“智能手机”)、移动电话(所谓的“功能手机”)、移动信息终端(PDA)、便携式游戏机、便携式音乐播放器、平板终端等。
终端通讯部211包括通讯接口电路,并将用户的终端设备2连接到互联网5。终端通讯部211通过网络将终端处理部215提供的数据发送至服务器4等。此外,终端通讯部211将通过网络将从服务器4等接收的数据提供给终端处理部215。
终端存储部212包括例如半导体存储装置。终端存储部212存储在终端处理部215中进行处理时所使用的操作系统程序、驱动程序、应用程序、数据等。例如,终端存储部212将控制终端操作部213的输入设备驱动程序、控制终端显示部214的输出设备驱动程序等作为驱动程序存储。各种程序可以使用已知的安装程序等,从诸如CD-ROM、DVD-ROM等计算机可读便携式记录介质安装在终端存储部212中。此外,终端存储部212可以临时存储与预定的处理相关的临时数据。
终端操作部213可以是任何设备,只要用户可以操作终端设备2即可,例如鼠标、触摸屏、键盘或按键等。用户可以通过使用终端操作部213来选择或取消选择信息、输入字符、数字等。当用户操作终端操作部213时,终端操作部213产生对应于该操作的信号。然后,生成的信号被发送至终端处理部215。
终端显示部214也可以是任何设备,只要可以显示影像、图像等即可,例如可以是液晶显示器或有机EL(Electro-Luminescence)显示器等。终端显示部214显示与终端处理部215提供的视频数据对应的视频、与图像数据对应的图像等。
终端处理部215包括一个或多个处理器及其外围电路。终端处理部215全面控制用户的终端设备2的整体操作,例如,CPU。终端处理部215控制终端通讯部211和终端显示部214等的操作,以使用户的终端设备的各种处理可以根据存储在终端存储部212的程序和终端操作部213的操作按照正确的顺序进行。终端处理部215基于存储在终端存储部212中的程序(操作系统程序、驱动程序、应用程序等)执行处理。此外,终端处理部215可以并行执行多个程序(应用程序等)。
终端处理部215包括:将用户的终端设备2从外部接收到的画面显示信息处理为用户可以观看的画面显示的功能和,将基于用户的终端操作部213的操作内容的处理,转换为可以传输到用户的终端设备2外部的信号,并将其发送到终端发送部211的功能。这些功能是通过包含在终端处理部215中的处理器执行的程序实现的功能模块。或者,这些中的各部分均可以作为独立的集成电路、微处理器或固件安装在用户的终端设备2上。
(用户的终端设备2的处理)
用户的终端设备2由用户操作。用户操作终端操作部213将作为待生成追加发明文章的基础的发明文章输入到用户的终端设备2中。根据需要,终端处理部215可以更正发明文章中的错误或进行语法更正。
此外,用户的终端设备2可以是用户的个人终端设备,也可以是企业用终端设备或整个企业的网络。
(专利文献数据库3的结构)
专利文献数据库3根据服务器4的需求向服务器4提供所需的专利文献数据。即,专利文献数据库3根据从服务器4接收到的检索条件,提取与该检索条件对应的检索结果,并将提取出的作为检索结果的专利文献的数据发送至服务器4。专利文献数据库3可以在每次有来自服务器4的请求时,检索专利文献并发送至服务器4,也可以定期地关于代表性的检索结果,专利文献数据库3将专利文献发送至服务器4。尽管没有特别示出,专利文献数据库3可以包括诸如处理部、通讯部、以及存储部这样的作为服务器的构成要素。
进一步地,当服务器4兼作专利文献数据库3时,专利文献数据库3将专利文献的数据发送至服务器4。然后,服务器4的存储部411等存储专利文献的数据。专利文献数据库3可以响应来自服务器4的请求将专利文献的数据发送至服务器4,也可以通过专利文献数据库3的主动,将专利文献的数据发送至服务器4。在这种情况下,由于服务器4可以在服务器4中完成检索和确定,所以可以自由调整处理速度。
专利文献数据库3积累和存储新公开的专利公报和注册专利公报。专利文献数据库3可以在所有过去的专利文献中逐项列出。例如,可以分为摘要、专利权利要求的范围(权利要求)、全文等。在本实施例中文章生成系统1,如后述,进行全文检索以及包含在权利要求项中的检索关键词的自由词检索。
(服务器4的示意结构)
图4是服务器4一实施例的结构示意图。
服务器4包括作为服务器4的存储区域的服务器存储部411。此外,还包括了服务器处理部416,其包括:确定部412、选择部413、提取部414和生成部415。进一步的,服务器4包括服务器通讯部417,以与用户的终端设备2和专利文献数据库3进行通讯。
服务器存储部411具有例如半导体存储器、磁盘装置和光盘装置中的至少一种,并且经由总线连接到服务器4。终端存储部411存储通过终端处理部416进行处理的操作系统程序、驱动程序、应用程序、数据等。例如,服务器存储部411存储控制服务器通讯部417的通讯设备驱动程序等作为驱动程序。计算机程序可以使用已知的安装程序等,从诸如CD-ROM、DVD-ROM等计算机可读便携式记录介质安装在服务器存储部411中。此外,服务器存储部411存储后述的专利分类数据库等。
服务器处理部416包括:确定部412、选择部413、提取部414和生成部415。服务器处理部416的功能是通过包含在服务器处理部416中的处理器执行的程序实现的功能模块。或者,这些中的各部分都可以在用户的终端设备4中安装成独立的集成电路、微处理器或固件。另外,服务器处理部416的处理内容将在后面描述。此外,服务器处理部416的构成要素的划分仅是一实施例,哪个构成要素执行哪个处理不限于本实施例的描述。
确定部412确定服务器通讯部417从用户的终端设备2接收到的发明文章的第一专利分类。具体而言,确定部412可以通过使用发明文章中包含的多个词中出现频率高的词来确定第一专利分类;或可以从专利文献数据库3中检索出发明文章中包含较多的多个词的专利文献,将与提取的专利文献相关联的专利分类作为发明文章的第一专利分类;或可以使用来自词依存关系的重要术语来确定第一专利分类。即,确定第一专利分类,是为了确定用户输入的发明文章所属的专利分类。另外,第一专利分类通常确定为一个,但当第一专利分类难以缩小为一个时,对于发明文章可以确定多个第一专利分类。从输入的发明文章中确定第一专利分类的技术只要使用一般的技术即可,不限于上述方法。
第一专利分类是基于专利局的专利文献所赋予的技术分类,假设为FI和IPC。但是,此处也可以使用UPC和F-term等专利分类。进一步地,如果是为了将专利文献归入不同领域的划分,可以是专利局提供的分类以外的分类,例如图书馆的书籍分类等。
在本发明中,确定第一专利分类是为了后述的选择部413选择第二专利分类,如果选择部413可以在没有第一专利分类的情况下选择第二专利分类,则不需要确定部412的构成。
选择部413选择与确定部412确定的第一专利分类对应的第二专利分类。选择部413可以从存储在服务器存储部411中的专利分类数据库(未图示)中选择与第1专利分类对应的第2专利分类,所述专利分类数据库关联存储所述第一专利分类和第二专利分类之间的对应关系。下面将详细描述的提取部414,可以选择第一专利分类专利文章所赋予的专利分类或与第一专利分类专利文章相关联的现有技术文献所赋予的专利分类作为第二专利分类。在这种情况下,可以确定第二专利分类,使其不与第一专利分类重叠。进一步的,第二专利分类可以选择与第一专利分类不相似的专利分类。例如,通过排除从专利分类的开头至预定位数一致的专利文献,可以选择不相似的专利分类。即,选择部413只要可以在专利分类上与第一专利分类相距预定距离而指定第二专利分类即可,选择方法不限于上述内容。进一步的,可以根据技术分类将预定距离设置为不同的值。例如,IT软件的技术领域,即使跨技术分类,多数情况中,也会被判断为基本上容易组合,因此有必要设置一个大的预定距离。即,专利分类数据库可以以每个专利分类,存储从专利分类开头的第一预定位数(例如,4位数)以及从专利分类开头的第二预定位数(例如,3位数)。这里,第二预定位数需要小于第一预定位数。根据该结构,可以排除无限接近第一专利分类的专利分类,提取适度接近的第二专利分类中所包含第二专利分类专利文章。例如,可以选择与专利分类的开头的第一个预定位数(例如4位数)不匹配,与从开头的第二个预定位数(例如3位数)匹配的专利分类作为第二专利分类。
第二专利分类是根据专利局给专利文献所赋予的技术分类,假设为FI和IPC。但是,在这里也可以使用UPC或F-term等专利分类。进一步地,只要是为了将专利文献划分到不同领域的分类即可,也可以是专利局提供的分类以外的分类,例如图书馆的书籍分类等。但是,作为第二专利分类,最好使用与第一专利分类相同类型的专利分类。
提取部414使用选择部413选择的第二专利分类从专利文献数据库3中提取与发明文章相似的第二专利分类专利文献。可以使用一般的方法来提取相似的专利文献。例如,可以将确定部412使用的重要术语作为检索关键词,从专利文献数据库3中提取包含检索关键词的专利文献。更具体地,提取部414将接收到的发明文章按要素划分。具体来说,可以使用小术语分析。即将发明文章分为多个词单位,提取哪个词修饰哪个词的依赖关系。当发明文章为英文等时,可以进行定界处理,按句号、冒号、分号、逗号、关系代词的优先级进行划分。然后,从包含发明文章中的多个词中提取检索关键词。例如,可以提取出现频率高的词作为检索关键词,或者可以从词的依存关系中提取重要的词作为检索关键词。即,检索关键词是为了用一个词来表示用户输入的发明文章所属的技术领域的术语。另外,检索关键词通常是一个词,但如果很难将检索关键词缩小为一个,则可以设为多个词。
另外,提取部414提取第二专利分类专利文献,可以通过简单的关键词检索来检索专利文献数据库3中包含的专利文献。例如,可以提取权利要求中记载了检索关键词的专利文献作为检索结果,也可以提取权利要求1中记载了检索关键词的专利文献作为检索结果。
为了提高提取文献的准确度,提取部414可以从包含检索关键词的专利文献中考虑该检索关键词的重要性来提高专利文献的准确度。例如,提取部414通过使用TF-IDF法等,来评估检索关键词在专利文献所包含的文章中的重要程度。在这里,检索关键词在一个专利文献整体中出现的专利文献,假设其在该专利文献中的重要性低,而当检索关键词仅出现在一个专利文献中的特定文章中时,假设其重要性高。另外,利用TF-IDF等方法,关于检索关键词的专利文献的提取,可以在用户将发明文章输入到用户的终端设备2中,并得到检索关键词时进行,也可以预先在服务器存储部411中存储各种检索关键词的专利文献。
此外,选择部413可以选择多个第二专利分类。服务器通讯部417将这些多个第二专利分类发送至用户的终端设备2中,用户在用户的终端设备2中接受至少一个从多个第二专利分类中选择并输入的第二专利分类。提取部414可以使用选择的至少一个的第二专利分类,从专利文献数据库3中提取与发明文章相似的第二专利分类专利文献。
生成部415基于提取的第二专利分类专利文章生成与发明文章相关的追加发明文章。生成部415可以利用第二专利分类专利文章的权利要求中描述的信息生成追加发明文章,也可以利用分析整个第二专利分类专利文章的结果生成追加发明文章。在本实施例中,可以将第二专利分类专利文章的从属项作为追加发明文章提供给用户。另外,可以当提取部414判断第二专利分类专利文章的部分从属项与发明文章相似时,则将判断为不相似的从属项作为追加发明文章,提供给用户。
提取部414可以从专利文献数据库3中提取多个第二专利分类专利文章。生成部415可以基于多个第二专利分类专利文章中与发明文章最相似的第二专利分类专利文章,生成与发明文章相关的追加发明文章。最相似的第二专利分类专利文章可以由提取部414根据相似检索关键词的匹配率确定,也可以等待用户从用户终端设备2中选择。
此外,当提取部414从专利文献数据库3中提取多个所述第二专利分类专利文章时,生成部415可在多个所述第二专利分类专利文章中,将与发明文章不相似的共同部分作为追加发明文章生成。即,将提取部414提取的多个第二专利分类专利文章中频繁使用的结构生成为追加发明文章。多个第二专利分类专利文章之间的相似部分的检索,可以由提取部414或生成部415执行。提取部414或生成部415可以通过比较多个已做句法分析的第二专利分类专利文章的文本,检索相似部分,也可以通过比较已做句法分析的词语的释义概念,检索相似部分。生成部415可以将发明文章相关的追加发明文章的专利性在第一专利分类中的判断结果生成为追加发明文章。
生成部415,可以将存在于第二专利分类专利文章中,但不存在于发明文章中的文章生成为追加发明文章。即,当发明文章包括多项发明时,可以将发明文章及第二专利分类专利文章的差异生成为追加发明文章。
服务器通讯部417具有用于将服务器4连接到互联网5的通讯接口电路。服务器通讯部417从用户的终端设备2接收作为请求生成追加发明文章的基础的发明文章,并将生成部415生成的追加发明文章发送至用户的终端设备2。此外,服务器通讯部417根据需要从专利文献数据库3接收专利文献的信息。服务器通讯部417根据需要与用户的终端设备2进行各种通讯,服务器通讯部417根据需要与专利文献数据库3进行各种通讯。另外,服务器通讯部417可以相当于本发明中的接收部和发送部。
(由文章生成系统1的处理)
图5是表示由本实施例的文章生成系统1,从用户的终端设备2接收发明文章,生成追加发明文章,到将生成的追加发明文章发送给用户的终端设备2的图的一系列流程的操作顺序的一实施例的图。
下面描述的操作顺序主要由服务器处理部416基于预先存储在服务器存储部411中的程序,与服务器4的各要素协作执行。此外,在以下描述的操作顺序中,服务器4通过服务器通讯部417收发与用户的终端设备2的各种信息。
首先,服务器4的服务器通讯部417从用户的终端设备2接收发明文章,将其作为自动生成追加发明文章的基础(步骤S101)。另外,当服务器通讯部417从用户的终端设备2接收到发明文章时开始此处理。
然后,服务器处理部416进行发明文章的专利性的判断,为此服务器处理部416判断是否以适合的格式被描述(步骤S102)。例如,在本实施例中,由于发明文章需要由一个发明来构成,如果文章中存在多个逗号,则服务器处理部416通过服务器通讯部417向用户的终端设备2发送错误信息。当发明文章以错误的格式书写时(步骤S102为NO),服务器处理部416向用户的终端设备2发送错误信息(步骤S103),并且处理结束。然后,服务器处理部416等待已修改了格式的发明文章,或接收下一个发明文章。另外,可以省略该S102步骤。
当发明文章以正确的格式书写时(步骤S102为YES),服务器处理416确定从用户的终端设备2接收的发明文章的第一专利分类(步骤S104)。服务器存储部411可以临时存储该已确定的第一专利分类。
然后,服务器处理部416选择与已确定的第一专利分类相对应的第二专利分类(步骤S105)。考虑到服务器4的负载,服务器处理部416可以参考存储有与第一专利分类对应的第二专利分类的专利分类数据库进行选择。另外,可以配置为根据专利文献数据库3中存储的文献所赋予的专利分类自动更新。即,专利分类彼此之间的距离具有适当的距离即可。如果距离太近,则成为专利性被否定的原因,如果距离太远,则作为追加发明,领域过于不同而无意义。选择与第一专利分类相对应的第二专利分类的方法,如上述,可采用各种方法。例如,服务器处理部416,将与已确定的专利分类的开头的第一个预定位数(例如4位数)不匹配,但与开头的第二个预定位数(例如3位数)匹配的专利分类作为第二专利分类,从专利分类数据库提取。
然后,服务器处理部416使用第二专利分类,从专利文献数据库3中提取与发明文章相似的第二专利分类专利文献(步骤S106)。当专利文献存储在服务器存储部411中时,服务器处理部416从服务器存储部411中提取与发明文章相似的第二专利分类专利文献。
进一步的,服务器处理部416基于提取的第二专利分类专利文献生成与发明文章相关的追加发明文章(步骤S107)。服务器处理部416可以组合发明文章和追加发明文章,将文章加工成权利要求组的形式。
然后,服务器通讯部417,将生成的追加发明文章发送至用户终端设备2中(步骤S108)。除了追加发明文章之外,服务器传输部417可以同时将在步骤S101中接收到的发明文章发送至用户的终端设备2中。
如上所述,本实施方式的文章生成系统1可以由源自多个用户的终端设备2的下述发明文章自动生成追加发明,所述发明文章是自动生成追加发明文章的基础。本实施例的文章生成系统1中,根据被赋予为第二专利分类的专利文献生成追加发明文章,所述第二专利分类距离发明文章所分类的第一专利分类的距离不过于接近也不过于遥远,因此在判断专利性时,可以从不易否定专利性的专利文献中生成追加发明文章。此外,考虑到了实际存储在专利文献数据库3中的专利文献所赋予的专利分类,由于文章生成系统1随时更新信息,基于以最新专利文献所赋予的专利分类为基础提取的第2专利分类的专利文献,生成追加发明文章,因此,可以生成适合专利局等审查的追加发明文章。
另外,本发明中,作为文章生成系统1,将用户的终端设备2、专利文献数据库3以及服务器4描述为相互独立的系统,但作为将所有这些功能均存在于一处的判定装置,也可以发挥同样的效果。此外,还可以将这些功能作为用于将它们安装在用户的终端设备等上的程序来提供。
应该理解的是,本领域的技术人员可以在不偏离本发明的精神和范围的情况下对其进行各种改变、替换和修改。还应当理解,在以下描述的变形例中,每一种变形例彼此可以相互结合来实现本发明。
(变形例1)
服务器通讯部417被配置为从用户的终端设备2接收发明文章,但是服务器通讯部417不仅可以接收发明文章,还可以接收任务文章。通过进一步接收任务文章,确定部412可以根据任务文章和发明文章各自包含的检索关键词确定专利分类。因此,确定部412可以提高待确定专利分类的准确度。另外,在本发明中,可以通过从用户的终端设备2接收任务文章和任务文章以外的文章,提高确定部414确定专利分类的精确度。
(变形例2)
提取部414使用发明文章将重要术语作为检索关键词,从专利文献数据库3中提取了包含该检索关键词的专利文献,但也可以以任务文章以及发明文章为基础将重要术语作为检索关键词,从专利文献数据库3中提取了包含该检索关键词的专利文献。
在这种情况下,提取部414通过将从用户终端设备2接收到的发明文章与存储在专利文献数据库3中的专利文献的权利要求进行比较,提取了第二专利分类专利文献,但是除了发明文章和专利文献数据库3中存储的专利文献的权利要求之外,还可以对从用户的终端设备2接收到的任务文章以及专利文献数据库3中存储的专利文献的任务进行进一步比较。如果相似文章的数量(文章的项)较多,则可以判断整个文章之间的相似度较高,从而提高基于提取部414对第二专利分类专利文献的提取精度。
符号说明
1文章生成系统、
2用户的终端设备、
211终端通讯部、
212终端存储部、
213终端操作部、
214终端显示部、
215终端处理部、
3专利文献数据库、
4服务器、
411服务器存储部、
412确定部、
413选择部、
414提取部、
415生成部、
416服务器处理部、
417服务器通讯部、
5互联网。
Claims (9)
1.一种文章生成装置,其特征在于包括:
接收部,从终端设备接收发明文章;
确定部,确定所述发明文章的第一专利分类;
选择部,选择与已确定的所述第一专利分类相对应的第二专利分类;
提取部,使用所述第二专利分类,从专利文献数据库中提取与所述发明文章相似的第二专利分类专利文献;
生成部,基于所述提取的第二专利分类专利文献生成与所述发明文章相关的追加的发明文章;
发送部,将生成的所述追加发明文章发送至所述终端设备。
2.如权利要求1所述的文章生成装置,其特征在于:
还包括专利分类数据库,关联存储所述第一专利分类和第二专利分类之间的对应关系;
所述选择部从所述专利分类数据库中选择与所述第一专利分类对应的所述第二专利分类。
3.如权利要求1所述的文章生成装置,其特征在于:
所述提取部利用所述第一专利分类,从专利文献数据库中提取与所述发明文章相似的第一专利分类专利文章;
所述选择部选择所述第一专利分类专利文章所赋予的专利分类或与所述第一专利分类专利文章相关联的现有技术文献所赋予的专利分类作为第二专利分类。
4.如权利要求1~3中任一项所述的文章生成装置,其特征在于:
所述选择部选择多个第二专利分类;
所述发送部将所述多个第二专利分类发送至所述终端设备中;
所述接收部从所述终端设备接收多个第二专利分类中的至少1个所述第二专利分类的选择输入;
所述提取部使用至少一个所述第二专利分类,从专利文献数据库中提取与所述发明文章相似的第二专利文献。
5.如权利要求1~4中任一项所述的文章生成装置,其特征在于:
所述提取部从专利文献数据库中提取多个所述第二专利分类专利文献;
所述生成部基于所述多个所述第二专利分类专利文献中的与所述发明文章最相似的第二专利分类专利文献,生成与所述发明文章相关的追加发明文章。
6.如权利要求1~4中任一项所述的文章生成装置,其特征在于:
所述提取部从专利文献数据库中提取多个所述第二专利分类专利文献;
所述生成部在所述多个所述第二专利分类专利文献中,将与发明文章不相似的部分的共同部分生成为所述追加发明文章。
7.如权利要求1~6中任一项所述的文章生成装置,其特征在于:
所述生成部将存在于第二专利分类专利文献中并且所述发明文章中不存在的文章生成为所述追加发明文章。
8.一种文章生成方法,其特征在于:
计算机包括:
接收步骤,从终端设备接收发明文章;
确定步骤,确定所述发明文章的第一专利分类;
选择步骤,选择与已确定的所述第一专利分类相对应的第二专利分类;
提取步骤,使用所述第二专利分类,从专利文献数据库中提取与所述发明文章相似的第二专利分类专利文献;
生成步骤,基于所述提取的第二专利分类专利文献生成与所述发明文章相关的追加发明文章;
发送步骤,将生成的所述追加发明文章发送至所述终端设备。
9.一种文章生成程序,其特征在于:
使计算机执行的功能包括:
接收功能,从终端设备接收发明文章;
确定功能,确定所述发明文章的第一专利分类;
选择功能,选择与已确定的所述第一专利分类相对应的第二专利分类;
提取功能,使用所述第二专利分类,从专利文献数据库中提取与所述发明文章相似的第二专利分类专利文献;
生成功能,基于所述提取的第二专利分类专利文献生成与所述发明文章相关的追加发明文章;
发送功能,将生成的所述追加发明文章发送至所述终端设备。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/022031 WO2020245887A1 (ja) | 2019-06-03 | 2019-06-03 | 文章生成装置、文章生成方法、および文章生成プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113302617A true CN113302617A (zh) | 2021-08-24 |
Family
ID=68836114
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980089307.4A Pending CN113302617A (zh) | 2019-06-03 | 2019-06-03 | 一种文章生成装置,文章生成方法,以及文章生成程序 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20210383492A1 (zh) |
JP (1) | JP6618103B1 (zh) |
CN (1) | CN113302617A (zh) |
WO (1) | WO2020245887A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021152809A1 (ja) * | 2020-01-30 | 2021-08-05 | 株式会社 AI Samurai | 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040007860A (ko) * | 2002-07-11 | 2004-01-28 | 한국전자통신연구원 | 기술 분류형 특허 맵 데이터베이스 구축방법 |
KR20110104813A (ko) * | 2010-03-17 | 2011-09-23 | (주)광개토연구소 | 특허 정보를 활용한 융합 정보 생성 방법 및 그 시스템 |
US20130317994A1 (en) * | 2011-11-11 | 2013-11-28 | Bao Tran | Intellectual property generation system |
KR20140048001A (ko) * | 2012-10-15 | 2014-04-23 | (주)광개토연구소 | 융합 특허 분석 정보를 제공하는 방법 및 시스템 |
CN105723405A (zh) * | 2013-07-30 | 2016-06-29 | 易单咨集团有限公司 | 引导论文作者 |
CN105930316A (zh) * | 2016-05-06 | 2016-09-07 | 长沙市麓智信息科技有限公司 | 专利撰写辅助系统及其辅助方法 |
US9678618B1 (en) * | 2011-05-31 | 2017-06-13 | Google Inc. | Using an expanded view to display links related to a topic |
JP6308708B1 (ja) * | 2017-08-25 | 2018-04-11 | 和之 白井 | 特許要件適否予測装置および特許要件適否予測プログラム |
CN109213855A (zh) * | 2018-09-12 | 2019-01-15 | 合肥汇众知识产权管理有限公司 | 基于专利撰写的文献标记方法 |
CN109284360A (zh) * | 2018-09-18 | 2019-01-29 | 江苏润桐数据服务有限公司 | 一种专利检索自动去噪方法和装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030229470A1 (en) * | 2002-06-10 | 2003-12-11 | Nenad Pejic | System and method for analyzing patent-related information |
JP2009043051A (ja) * | 2007-08-09 | 2009-02-26 | Ntt Advanced Technology Corp | 文章処理方法および装置 |
JP6429747B2 (ja) * | 2015-08-20 | 2018-11-28 | ヤフー株式会社 | 情報提供装置、情報提供方法および情報提供プログラム |
US20170075877A1 (en) * | 2015-09-16 | 2017-03-16 | Marie-Therese LEPELTIER | Methods and systems of handling patent claims |
-
2019
- 2019-06-03 WO PCT/JP2019/022031 patent/WO2020245887A1/ja active Application Filing
- 2019-06-03 JP JP2019547525A patent/JP6618103B1/ja active Active
- 2019-06-03 CN CN201980089307.4A patent/CN113302617A/zh active Pending
-
2021
- 2021-08-26 US US17/412,591 patent/US20210383492A1/en not_active Abandoned
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040007860A (ko) * | 2002-07-11 | 2004-01-28 | 한국전자통신연구원 | 기술 분류형 특허 맵 데이터베이스 구축방법 |
KR20110104813A (ko) * | 2010-03-17 | 2011-09-23 | (주)광개토연구소 | 특허 정보를 활용한 융합 정보 생성 방법 및 그 시스템 |
US9678618B1 (en) * | 2011-05-31 | 2017-06-13 | Google Inc. | Using an expanded view to display links related to a topic |
US20130317994A1 (en) * | 2011-11-11 | 2013-11-28 | Bao Tran | Intellectual property generation system |
KR20140048001A (ko) * | 2012-10-15 | 2014-04-23 | (주)광개토연구소 | 융합 특허 분석 정보를 제공하는 방법 및 시스템 |
CN105723405A (zh) * | 2013-07-30 | 2016-06-29 | 易单咨集团有限公司 | 引导论文作者 |
CN105930316A (zh) * | 2016-05-06 | 2016-09-07 | 长沙市麓智信息科技有限公司 | 专利撰写辅助系统及其辅助方法 |
JP6308708B1 (ja) * | 2017-08-25 | 2018-04-11 | 和之 白井 | 特許要件適否予測装置および特許要件適否予測プログラム |
CN109213855A (zh) * | 2018-09-12 | 2019-01-15 | 合肥汇众知识产权管理有限公司 | 基于专利撰写的文献标记方法 |
CN109284360A (zh) * | 2018-09-18 | 2019-01-29 | 江苏润桐数据服务有限公司 | 一种专利检索自动去噪方法和装置 |
Non-Patent Citations (1)
Title |
---|
梁田 等: ""基于知识分类体系的专利检索系统"", 《情报理论与实践》, vol. 35, no. 04, 30 April 2012 (2012-04-30), pages 99 - 102 * |
Also Published As
Publication number | Publication date |
---|---|
WO2020245887A1 (ja) | 2020-12-10 |
JP6618103B1 (ja) | 2019-12-11 |
US20210383492A1 (en) | 2021-12-09 |
JPWO2020245887A1 (ja) | 2021-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10122839B1 (en) | Techniques for enhancing content on a mobile device | |
US9167070B2 (en) | Widget discovery in computing devices | |
US9767183B2 (en) | Method and system for enhanced query term suggestion | |
US9342233B1 (en) | Dynamic dictionary based on context | |
US10878044B2 (en) | System and method for providing content recommendation service | |
US20110289407A1 (en) | Font recommendation engine | |
US20100277424A1 (en) | Electronic device and method for predicting word input | |
US20140040741A1 (en) | Smart Auto-Completion | |
CN102138142A (zh) | 对部分用户输入的词典建议 | |
US10175883B2 (en) | Techniques for predicting user input on touch screen devices | |
US20120109932A1 (en) | Related links | |
EP3815342B1 (en) | Adaptive user-interface assembling and rendering | |
CN102750081A (zh) | 信息处理设备、信息处理方法和程序 | |
CN105094793A (zh) | 用于基于语音学家的人/机接口部件的系统和方法 | |
US20140331127A1 (en) | Template based copy and paste function | |
US20210383491A1 (en) | Patent text generating device, patent text generating method, and non-transitory computer-readable medium | |
CN113302617A (zh) | 一种文章生成装置,文章生成方法,以及文章生成程序 | |
US20150081733A1 (en) | Data search system and data search method | |
JP6978736B2 (ja) | 特許文章管理装置、特許文章管理方法、および特許文章管理プログラム | |
KR101757755B1 (ko) | 선행기술조사의 분배처리 방법 및 이를 운용하는 서버 및 시스템 | |
US20140289741A1 (en) | Cooperation method, image processing device, and medium | |
JP2020198072A (ja) | 文章生成装置、文章生成方法、および文章生成プログラム | |
KR102131080B1 (ko) | 문서 객체 모델을 이용한 웹 어플리케이션 세부 페이지 분석 방법 및 이를 위한 장치 | |
US20240111397A1 (en) | Label management system for an electronic document management service | |
US20240104129A1 (en) | Label management system for an electronic document management service |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |