KR20200014716A - 특허 평가 판정 방법, 특허 평가 판정 장치 및 특허 평가 판정 프로그램을 기록한 기록 매체 - Google Patents

특허 평가 판정 방법, 특허 평가 판정 장치 및 특허 평가 판정 프로그램을 기록한 기록 매체 Download PDF

Info

Publication number
KR20200014716A
KR20200014716A KR1020197002518A KR20197002518A KR20200014716A KR 20200014716 A KR20200014716 A KR 20200014716A KR 1020197002518 A KR1020197002518 A KR 1020197002518A KR 20197002518 A KR20197002518 A KR 20197002518A KR 20200014716 A KR20200014716 A KR 20200014716A
Authority
KR
South Korea
Prior art keywords
sentence
group
search keyword
patentability
server
Prior art date
Application number
KR1020197002518A
Other languages
English (en)
Inventor
하지메 시라사카
다까시 미까미
Original Assignee
가부시키가이샤 에이아이 사무라이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시키가이샤 에이아이 사무라이 filed Critical 가부시키가이샤 에이아이 사무라이
Publication of KR20200014716A publication Critical patent/KR20200014716A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3335Syntactic pre-processing, e.g. stopword elimination, stemming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/11Patent retrieval

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

특허 평가 판정 방법은, 발명에 관한 발명 문장의 입력을 접수하는 발명 입력 스텝과, 상기 입력된 발명 문장을 단어 단위로 구문 분석을 행한 후에, 상기 발명 문장에 있어서의 임의의 검색 키워드를 추출하는 키워드 추출 스텝과, 상기 추출된 검색 키워드를 사용하여 당해 검색 키워드가 포함되는 특허 문장군을 데이터베이스로부터 추출하는 특허 문장군 추출 스텝과, 상기 발명 문장 및 상기 특허 문장군에 포함되는 문장을 비교하여 상기 발명 문장의 특허성을 판정하는 판정 스텝을 포함하여 구성되어 있다.

Description

특허 평가 판정 방법, 특허 평가 판정 장치 및 특허 평가 판정 프로그램
본 발명은, 특허 평가 판정 방법, 특허 평가 판정 장치 및 특허 평가 판정 프로그램에 관한 것이다.
정보 처리 기술이 진화됨으로써 다양한 시뮬레이션이 가능해지고 있다. 즉, 고성능의 정보 처리 단말기를 용이하게 입수할 수 있게 되었기 때문에, 많은 사람에 의해 복잡한 알고리즘을 저렴하게 처리할 수 있게 되었다.
특허는 출원에서 권리화까지 많은 비용이 들기 때문에, 출원 전에 선행 기술 조사를 실시하는 것도 가능지만, 이것에도 비용이 든다. 따라서, 시뮬레이션의 하나로 특허 발명 등의 특허성 판정 기술이 존재한다. 예를 들어, 특허문헌 1은 특허 출원 A의 청구항 1에 포함되는 형태소군 중 소정 비율 이상의 형태소가, 다른 특허 출원 B의 명세서에도 포함되어 있을 때에는, 특허 출원 B는 특허 출원 A와 유사하다고 판정한다. 또한, 특허문헌 1에서는, TF(Term Frequency)·IDF(Inverse Document Frequency)법과 같이, 형태소마다의 중요성을 가미한 후에 유부를 판정하는 것도 가능한 것이 기재되어 있다.
그러나, 상술한 바와 같이 특허문헌 1에서는, 평가 대상의 특허의 청구항에 포함되는 단어가 다른 특허 출원의 명세서 전체에 포함되어 있는지를 검색하기 때문에, 단어가 어떤 문장에 있어서 사용되고 있는지까지 분석할 수 없다. 즉, 평가 대상의 특허가 표현하고 있는 의미와 전혀 다른 의미여도, 동일한 단어만 포함되어 있으면 유사 특허로서 판정되어 버린다.
일본 특허 공개 제2009-238074호 공보
따라서, 본 발명은 상기 사정을 감안하여 이루어진 것이며, 보다 높은 정밀도로 평가 대상 특허(발명)와 유사한 특허문헌이 공지로 되어 있는지 여부를 판정할 수 있는 특허 평가 판정 방법, 특허 평가 판정 장치 및 특허 평가 판정 프로그램을 제공하는 것을 목적으로 한다.
(1) 본 발명의 제1 양태는, 발명에 관한 발명 문장의 입력을 접수하는 발명 입력 스텝과, 상기 입력된 발명 문장을 단어 단위로 구문 분석을 행한 후에, 상기 발명 문장에 있어서의 임의의 검색 키워드를 추출하는 키워드 추출 스텝과, 상기 추출된 검색 키워드를 사용하여 당해 검색 키워드가 포함되는 특허 문장군을 데이터베이스로부터 추출하는 특허 문장군 추출 스텝과, 상기 발명 문장 및 상기 특허 문장군에 포함되는 문장을 비교하여 상기 발명 문장의 특허성을 판정하는 판정 스텝을 포함하는 것을 특징으로 하는 특허 평가 판정 방법에 관한 것이다.
(2) 상기 (1)에 있어서, 상기 판정 스텝은, 상기 발명 문장 및 상기 특허 문장군에 포함되는 문장의 편집 거리를 기초로 상기 발명 문장의 특허성을 판정해도 된다.
(3) 상기 (2)에 있어서, 상기 판정 스텝은, 상기 특허 문장군에 포함되는 문장의 편집 거리의 역수에 상기 발명 문장의 길이 지수 및 상기 검색 키워드의 함유율을 승산한 결과를 기초로 상기 발명 문장의 특허성을 판정해도 된다.
(4) 상기 (2) 또는 (3)에 있어서, 상기 판정부는, 상기 발명 문장을 구성 요소마다 구분한 후에, 구분된 상기 구성 요소마다 상기 특허 문장군에 포함되는 문장과의 편집 거리를 기초로 상기 발명 문장의 특허성을 판정해도 된다.
(5) 상기 (1) 내지 (4) 중 어느 것에 있어서, 상기 특허 문장군 추출 스텝은, 상기 특허 문장군에 부여되어 있는 특허 분류를 추출하고, 당해 추출된 특허 분류 중에서 추출수가 많은 상위 특허 분류를 선택하고, 상기 검색 키워드 및 상기 선택된 상위 특허 분류를 사용하여 상기 특허 문장군을 재추출해도 된다.
(6) 상기 (5)에 있어서, 상기 특허 문장군 추출 스텝은, 상기 검색 키워드 및 상기 선택된 상위 특허 분류를 사용하여 얻어진 상기 특허 문장군 중에서 분산 표현 공간에 있어서의 상기 검색 키워드와 근접하는 특허군으로 좁힌 결과를 상기 특허 문장군으로서 추출해도 된다.
(7) 상기 (1) 내지 (6) 중 어느 것에 있어서, 상기 판정 스텝은, 상기 발명 문장 및 상기 특허 문장군에 포함되는 문장을 비교하여 상기 발명 문장과 유사한 특허 문장을 추출하고, 상기 발명 문장 및 당해 추출된 특허 문장과의 유사도를 판정함으로써 상기 발명 문장의 특허성을 판정해도 된다.
(8) 본 발명의 제2 양태는, 발명에 관한 발명 문장의 입력을 접수하는 발명 입력부와, 상기 입력된 발명 문장을 단어 단위로 구문 분석을 행한 후에, 상기 발명 문장에 있어서의 임의의 검색 키워드를 추출하는 키워드 추출부와, 상기 추출된 검색 키워드를 사용하여 당해 검색 키워드가 포함되는 특허 문장군을 데이터베이스로부터 추출하는 특허 문장군 추출부와, 상기 발명 문장 및 상기 특허 문장군에 포함되는 문장을 비교하여 상기 발명 문장의 특허성을 판정하는 판정부를 포함하는 것을 특징으로 하는 특허 평가 판정 장치에 관한 것이다.
(9) 본 발명의 제3 양태는, 컴퓨터에, 발명에 관한 발명 문장의 입력을 접수하는 발명 입력 기능과, 상기 입력된 발명 문장을 단어 단위로 구문 분석을 행한 후에, 상기 발명 문장에 있어서의 임의의 검색 키워드를 추출하는 키워드 추출 기능과, 상기 추출된 검색 키워드를 사용하여 당해 검색 키워드가 포함되는 특허 문장군을 데이터베이스로부터 추출하는 특허 문장군 추출 기능과, 상기 발명 문장 및 상기 특허 문장군에 포함되는 문장을 비교하여 상기 발명 문장의 특허성을 판정하는 판정 기능을 실현시키는 것을 특징으로 하는 특허 평가 판정 프로그램에 관한 것이다.
본 발명에 따르면, 발명의 기술분야인 검색 키워드를, 발명 문장으로부터 구문 분석을 행함으로써 추출한 후에 발명 문장 및 추출된 특허 문장군에 포함되는 문장을 비교하기 때문에, 높은 정밀도로 특허성의 판정을 행하는 특허 평가 판정 방법, 특허 평가 판정 장치 및 특허 평가 판정 프로그램을 제공할 수 있다.
도 1은 특허 평가 판정 시스템에 의한 처리의 일례를 설명하기 위한 모식도이다.
도 2는 특허 평가 판정 시스템의 개략 구성의 일례를 도시하는 도면이다.
도 3은 유저의 단말 장치의 개략 구성의 일례를 도시하는 도면이다.
도 4는 서버의 개략 구성의 일례를 도시하는 도면이다.
도 5는 판정부에 의한 발명 문장의 유사 특허와의 유사 스코어를 나타내는 표의 일례이다.
도 6은 본 실시 형태에 관한 특허 평가 판정 시스템에 의한 유저의 단말 장치로부터 발명 문장의 판정 요구에 따라서, 당해 발명 문장의 특허성을 판정하고, 판정 결과를 유저의 단말 장치에 송신할 때까지의 일련의 흐름의 동작 시퀀스의 일례를 도시하는 도면이다.
도 7은 유저의 단말 장치의 단말기 표시부에 의해 표시되는 발명 문장 입력 화면의 일례를 도시하는 도면이다.
도 8은 유저의 단말 장치의 단말기 표시부에 의해 표시되는 발명 문장 표시 화면의 일례를 도시하는 도면이다.
도 9는 유저의 단말 장치의 단말기 표시부에 의해 표시되는 발명 문장 평가 화면의 일례를 도시하는 도면이다.
도 10은 본 실시 형태의 변형예 1에 관한 특허 평가 판정 시스템에 의한 유저의 단말 장치로부터 발명 문장의 판정 요구에 따라서, 당해 발명 문장의 특허성을 판정하고, 판정 결과를 유저의 단말 장치에 송신할 때까지의 일련의 흐름의 동작 시퀀스의 일례를 도시하는 도면이다.
도 11은 본 실시 형태의 변형예 2에 관한 특허 평가 판정 시스템에 의한 유저의 단말 장치로부터 발명 문장의 판정 요구에 따라서, 당해 발명 문장의 특허성을 판정하고, 판정 결과를 유저의 단말 장치에 송신할 때까지의 일련의 흐름의 동작 시퀀스의 일례를 도시하는 도면이다.
이하, 본 개시의 일 측면에 관한 특허 평가 판정 시스템, 특허 평가 판정 방법 및 특허 평가 판정 프로그램에 대하여 도면을 참조하면서 설명한다. 단, 본 개시의 기술적 범위는 그것들의 실시 형태에 한정되지 않고, 특허청구범위에 기재된 발명과 그 균등물에 이르는 점에 유의하기 바란다.
(특허 평가 판정 시스템(1)에 의한 처리의 개요)
도 1은 특허 평가 판정 시스템(1)에 의한 처리의 일례를 설명하기 위한 모식도이다.
특허 평가 판정 시스템(1)은, 복수의 유저의 단말 장치(2, 2, 2 …) 및 특허 문장 데이터베이스(3), 이들 복수의 유저의 단말 장치(2) 및 특허 문장 데이터베이스(3)와 서로 통신되는 서버(4)를 갖는다. 서버(4)는, 복수의 유저의 단말 장치(2)로부터 특허성의 평가 판정을 희망하는 발명 문장을 수신하고, 당해 발명 문장에 포함되는 발명을 대표하는 키워드를 검색 키워드로서 추출하는 검색 키워드 추출부(412)를 갖는다. 서버(4)는 추출된 검색 키워드를 기초로 특허 문장 데이터베이스(3)로부터 유사 특허 문장군을 추출하는 특허 문장군 추출부(413)를 갖는다. 그리고, 서버(4)는 복수의 유저의 단말 장치(2, 2, 2 …)로부터 수신한 발명 문장과 추출된 특허 문장군을 비교하여, 발명 문장의 특허성을 판정하는 판정부(414)를 갖는다. 그리고, 서버(4)는 판정부(413)가 판정한 특허성의 평가를 복수의 유저의 단말 장치(2, 2, 2 …)에 송신한다.
또한, 본 실시 형태에서는, 특허 문장 데이터베이스(3)에 기억되어 있는 특허 문장을 검색 대상으로 하여 기재하고 있지만, 서버(4)는 특허 문장 데이터베이스(3)로부터 특허 문장을 다운로드하여 서버(4) 내에서 유사 특허 문장군을 추출하는 구성으로 해도 된다. 이 구성에 따르면, 처리를 로컬로 완결할 수 있기 때문에, 처리 속도를 빠르게 할 수 있다.
특허 문장 데이터베이스(3)는, 예를 들어 특허청의 데이터베이스이다. 특허청의 데이터베이스는, 1청이어도 복수 청을 포함하고 있어도 된다. 또한, 미국, 유럽, 일본, 중국 및 한국의 5청의 데이터베이스를 포함함으로써 세계의 특허의 약 90%를 망라할 수 있기 때문에, 특허성의 판정의 정밀도를 향상시키기 위해서는, 이들 5청의 데이터베이스를 포함하고 있으면 된다.
또한, 유저의 단말 장치(2, 2, 2 …)로부터 서버(4)가 수신하는 발명 문장은, 특허청에서 공개가 되어 있는 공지 문헌에 포함되는 청구항이어도 된다. 또한, 출원 전의 청구항에 관한 문장이어도 되고, 출원 심사 후 등의 보정 예정의 청구항이어도 된다. 또한, 본 발명 문장은, 1개의 발명만을 포함하고 있는 것이 바람직하다. 즉, 1개의 청구항의 형식의 기재이면 된다. 물론, 복수의 청구항의 형식으로 발명 문장을 유저의 단말 장치(2)가 서버(4)에 송신하는 것도 가능하다. 그 경우, 발명마다의 단락을 서버(4)의 서버 처리부(416)가 인식하여 발명마다 특허성의 판정을 행하면 된다. 또한, 본 실시 형태에 있어서는, 출원 전의 발명의 내용을 발명 문장으로서 설명하지만, 본 발명은 이 구성에 한정되지 않는다.
(특허 평가 판정 시스템(1)의 개략 구성)
도 2는 특허 평가 판정 시스템(1)의 개략 구성의 일례를 도시하는 도면이다.
특허 평가 판정 시스템(1)은, 복수의 유저의 단말 장치(2, 2, 2 …)와, 특허 문장 데이터베이스(3)와, 서버(4)를 갖는다. 이하에서는, 복수의 유저의 단말 장치를 간단히 유저의 단말 장치(2)라 칭하는 경우가 있다. 유저의 단말 장치(2, 2, 2 …) 및 서버(4)는, 예를 들어 인터넷(5) 등의 통신 네트워크를 통해 각각 서로 접속된다. 또한, 특허 문장 데이터베이스(3) 및 서버(4)는, 예를 들어 인터넷(5) 등의 통신 네트워크를 통해 각각 서로 접속된다. 또한, 여기서는 인터넷(5)이 1개 예시되어 있지만, 인터넷(5)이 복수의 네트워크를 포함하는 경우에는, 각각의 네트워크간에 게이트웨이(도시 생략)를 적절히 설치해도 된다. 유저의 단말 장치(2)에서 실행되는 프로그램(예를 들어, 열람 프로그램)과, 서버(4)에서 실행되는 프로그램(예를 들어, 관리 프로그램)은, 하이퍼 텍스트 전송 프로토콜(HTTP) 등의 통신 프로토콜을 사용하여 통신을 행한다.
또한, 유저의 단말 장치(2)와 서버(4) 사이의 접속, 및 특허 문장 데이터베이스(3)와 서버(4) 사이의 접속은, 취급하는 정보가 기밀 정보가 되기 때문에, 인터넷(5)의 통신 환경이 시큐리티의 면에서 우수할 필요가 있다. 또한, 유저의 단말 장치(2)와 서버(4) 사이의 접속, 및 특허 문장 데이터베이스(3)와 서버(4) 사이의 접속은, 전용의 회선을 준비함으로써 시큐리티를 강화할 수 있다.
(유저의 단말 장치(2)의 개략 구성)
도 3은 유저의 단말 장치(2)의 개략 구성의 일례를 도시하는 도면이다.
유저의 단말 장치(2)는, 무선 통신 네트워크에의 접속, Web 액세스 등을 실행한다. 그를 위해, 유저의 단말 장치(2)는, 단말기 통신부(211)와, 단말기 기억부(212)와, 단말기 조작부(213)와, 단말기 표시부(214)와, 단말기 처리부(215)를 구비한다.
또한, 유저의 단말 장치(2)로서는, 태블릿 PC나 노트북 PC를 상정하지만, 본 발명은 이것에 한정되지 않는다. 유저의 단말 장치(2)는 본 발명이 적용 가능하면 되고, 예를 들어 다기능 휴대 전화(소위 「스마트폰」), 휴대 전화(소위 「피처폰」), 휴대 정보 단말기(PDA), 휴대 게임기, 휴대 음악 플레이어, 태블릿 단말기 등이어도 된다.
단말기 통신부(211)는 통신 인터페이스 회로를 구비하고, 유저의 단말 장치(2)를 인터넷(5)에 접속한다. 단말기 통신부(211)는 네트워크를 통해 단말기 처리부(215)로부터 공급된 데이터를 서버(4) 등에 송신한다. 또한, 단말기 통신부(211)는 네트워크를 통해 서버(4) 등으로부터 수신한 데이터를 단말기 처리부(215)에 공급한다.
단말기 기억부(212)는, 예를 들어 반도체 메모리 장치를 구비한다. 단말기 기억부(212)는 단말기 처리부(215)에서의 처리에 사용되는 오퍼레이팅 시스템 프로그램, 드라이버 프로그램, 애플리케이션 프로그램, 데이터 등을 기억한다. 예를 들어, 단말기 기억부(212)는, 드라이버 프로그램으로서, 단말기 조작부(213)를 제어하는 입력 디바이스 드라이버 프로그램, 단말기 표시부(214)를 제어하는 출력 디바이스 드라이버 프로그램 등을 기억한다. 또한, 단말기 기억부(212)는, 애플리케이션 프로그램으로서, 점포 관계자가 단말기 조작부(213)를 조작함으로써 입력된 검색 조건, 특징 정보 및 특징 화상 등을 서버(4)에 등록하기 위한 등록 화면을 표시하는 열람 프로그램 등을 기억한다. 각종 프로그램은, 예를 들어 CD-ROM, DVD-ROM 등의 컴퓨터 판독 가능한 가반형 기록 매체로부터, 공지의 셋업 프로그램 등을 사용하여 단말기 기억부(212)에 인스톨되어도 된다. 또한, 단말기 기억부(212)는 소정의 처리에 관한 일시적인 데이터를 일시적으로 기억해도 된다.
단말기 조작부(213)는, 유저의 단말 장치(2)의 조작이 가능하면 어떤 디바이스여도 되고, 예를 들어 마우스, 터치 패널 또는 키 버튼 등이다. 유저는, 단말기 조작부(213)를 사용하여, 정보의 선택이나 해제, 문자나 숫자 등을 입력할 수 있다. 단말기 조작부(213)는 유저에 의해 조작되면, 그 조작에 대응하는 신호를 발생한다. 그리고, 발생한 신호는, 단말기 처리부(215)에 송신된다.
단말기 표시부(214)도, 영상이나 화상 등의 표시가 가능하면 어떤 디바이스여도 되고, 예를 들어 액정 디스플레이나 유기 EL(Electro-Luminescence) 디스플레이 등이다. 단말기 표시부(214)는, 단말기 처리부(215)로부터 공급된 영상 데이터에 따른 영상이나, 화상 데이터에 따른 화상 등을 표시한다.
단말기 처리부(215)는 1개 또는 복수개의 프로세서 및 그 주변 회로를 구비한다. 단말기 처리부(215)는, 유저의 단말 장치(2)의 전체적인 동작을 통괄적으로 제어하는 것이며, 예를 들어 CPU이다. 단말기 처리부(215)는, 유저의 단말 장치(2)의 각종 처리가 단말기 기억부(212)에 기억되어 있는 프로그램이나 단말기 조작부(213)의 조작 등에 기초하여 적절한 수순으로 실행되도록, 단말기 통신부(211)나 단말기 표시부(214) 등의 동작을 제어한다. 단말기 처리부(215)는, 단말기 기억부(212)에 기억되어 있는 프로그램(오퍼레이팅 시스템 프로그램이나 드라이버 프로그램, 애플리케이션 프로그램 등)에 기초하여 처리를 실행한다. 또한, 단말기 처리부(215)는 복수의 프로그램(애플리케이션 프로그램 등)을 병렬로 실행할 수 있다.
단말기 처리부(215)는, 유저의 단말 장치(2)의 외부로부터 수신한 화면 표시 정보를 유저에게 열람 가능한 화면 표시로서 처리를 하는 기능이나, 유저로부터의 단말기 조작부(213)의 조작 내용에 기초하는 처리를 유저의 단말 장치(2)의 외부에 송신 가능한 신호로 변환하여 단말기 통신부(211)에 보내는 기능을 구비한다. 이들 기능은, 단말기 처리부(215)가 구비하는 프로세서에서 실행되는 프로그램에 의해 실현되는 기능 모듈이다. 혹은, 이들 각 부는, 독립된 집적 회로, 마이크로프로세서, 또는 펌웨어로서 유저의 단말 장치(2)에 실장되어도 된다.
(유저의 단말 장치(2)의 처리)
유저의 단말 장치(2)는 유저에 의해 조작된다. 유저는, 단말기 조작부(213)를 조작하여 특허성의 판정을 행하고 싶은 발명 문장을 유저의 단말 장치(2)에 입력한다. 필요에 따라서 단말기 처리부(215)가 발명 문장의 오기 수정을 행하거나, 문법의 수정을 행하거나 해도 된다.
또한, 유저의 단말 장치(2)는 기업의 단말 장치나 기업 전체의 네트워크여도 된다. 또한 유저의 단말 장치(2)는, 특허청의 단말 장치나 특허청 전체의 네트워크여도 된다.
(특허 문장 데이터베이스(3)의 구성)
특허 문장 데이터베이스(3)는, 서버(4)의 요구에 따라서 원하는 특허 문장군을 서버(4)에 제공한다. 즉, 특허 문장 데이터베이스(3)는, 서버(4)로부터 수신한 검색 조건에 기초하여 당해 검색 조건에 해당하는 특허 문장군을 추출하여, 서버(4)에 송신한다. 특허 문장 데이터베이스(3)는, 서버(4)로부터의 요구가 있을 때마다 특허 문장을 검색하여 서버(4)에 송신해도 되고, 정기적으로 대표적인 검색 결과에 대하여 특허 문장 데이터베이스(3)가 특허 문장을 서버(4)에 송신해도 된다. 특별히 도시하지 않지만, 특허 문장 데이터베이스(3)는 처리부, 통신부 및 기억부 등의 서버로서의 구성 요소를 구비하고 있으면 된다.
또한, 서버(4)가 특허 문장 데이터베이스(3)를 겸하고 있는 경우, 특허 문장 데이터베이스(3)는 특허 문장을 서버(4)에 송신하여 서버(4)의 서버 기억부(411) 등이 특허 문장을 기억한다. 특허 문장 데이터베이스(3)는, 서버(4)로부터의 요구에 따라서 특허 문장을 서버(4)에 송신해도 되고, 특허 문장 데이터베이스(3)의 주동에 의해 특허 문장을 서버(4)에 송신해도 된다. 이 경우, 서버(4)는 서버(4) 내에서 검색 및 판정을 완결할 수 있기 때문에, 처리 속도를 자유롭게 조정할 수 있다.
특허 문장 데이터베이스(3)는 새롭게 공개된 공개 특허 공보나 등록 특허 공보를 축적하여 기억하고 있다. 특허 문장 데이터베이스(3)는 과거의 특허 문장 모두에 있어서, 항목 분류되어 있으면 된다. 예를 들어, 요약, 특허 청구 범위(청구항), 전문 등으로 나누어져 있으면 된다. 본 실시 형태에서 특허 평가 판정 시스템(1)은, 후술하는 대로 전문 검색 및 청구항에 포함되는 검색 키워드의 프리워드 검색을 행한다.
(서버(4)의 개략 구성)
도 4는 서버(4)의 개략 구성의 일례를 도시하는 도면이다.
서버(4)는 서버(4)의 기억 영역인 서버 기억부(411)를 포함한다. 또한, 검색 키워드 추출부(412), 특허 문장군 추출부(413), 판정부(414) 및 생성부(415)를 포함하는 서버 처리부(416)를 더 구비한다. 또한, 서버(4)는 유저의 단말 장치(2) 및 특허 문장 데이터베이스(3)와 통신하기 위해 서버 통신부(417)를 구비한다.
서버 기억부(411)는, 예를 들어 반도체 메모리, 자기 디스크 장치 및 광 디스크 장치 중 적어도 하나를 갖고, 버스를 통해 서버(4)와 접속된다. 서버 기억부(411)는 서버 처리부(416)에 의한 처리에 사용되는 드라이버 프로그램, 오퍼레이팅 시스템 프로그램, 애플리케이션 프로그램, 데이터 등을 기억한다. 예를 들어, 서버 기억부(411)는, 드라이버 프로그램으로서, 서버 통신부(417)를 제어하는 통신 디바이스 드라이버 프로그램 등을 기억한다. 컴퓨터 프로그램은, 예를 들어 CD-ROM, DVD-ROM 등의 컴퓨터 판독 가능한 가반형 기록 매체로부터, 공지의 셋업 프로그램 등을 사용하여 서버 기억부(411)에 인스톨되어도 된다. 또한, 서버 기억부(411)는 특허 문장 테이블 등을 기억한다. 또한, 서버 기억부(411)는 본 발명의 기억부에 상당할 수 있다.
서버 처리부(416)는 검색 키워드 추출부(412), 특허 문장군 추출부(413), 판정부(414) 및 생성부(415)를 포함한다. 서버 처리부(416)에 의한 기능은, 서버 처리부(416)가 구비하는 프로세서에서 실행되는 프로그램에 의해 실현되는 기능 모듈이다. 혹은, 이들 각 부는, 독립된 집적 회로, 마이크로프로세서 또는 펌웨어로서 서버(4)에 실장되어도 된다. 또한, 서버 처리부(416)의 처리 내용은 후술한다. 또한, 서버 처리부(416)의 구성 요소의 구별은, 일례이며, 어느 구성 요소가 어느 처리를 행하는지는, 본 실시 형태의 기재에 한정되지 않는다.
검색 키워드 추출부(412)는, 유저의 단말 장치(2)로부터 서버 통신부(417)가 수신한 발명 문장에 포함되는 복수의 단어로부터 특허 문장군을 검색하기 위한 검색 키워드를 추출한다. 검색 키워드 추출부(412)는, 수신된 발명 문장을 요소마다 분할한다. 구체적으로는, 소용어 해석을 사용하면 된다. 즉, 발명 문장을 복수의 단어 단위로 분할하고, 어느 단어가 어느 단어를 수식하고 있는지의 수식 관계를 추출한다. 발명 문장이 영문 등인 경우에는, 피리어드, 콜론, 세미콜론, 콤마나 관계 대명사의 우선 순위로 분할을 하는 딜리미터 처리를 행하면 된다. 그리고, 발명 문서 중에 포함되는 복수의 단어 중에서 검색 키워드를 추출한다. 예를 들어, 출현 빈도가 높은 단어를 검색 키워드로서 추출해도 되고, 단어의 수식 관계로부터 중요한 용어를 검색 키워드로서 추출해도 된다. 즉, 검색 키워드는, 유저가 입력한 발명 문장이 속하는 기술분야를 1단어로 나타내기 위한 용어이다. 또한, 검색 키워드는, 통상 1개의 단어이지만, 검색 키워드를 1개로 좁히기 어려운 경우 등은, 복수의 단어로 해도 된다. 입력된 발명 문장으로부터 검색 키워드를 추출하는 기술은, 일반적인 기술을 사용하면 되고, 상기 방법에는 한정되지 않는다.
이와 같이, 발명 문장에 있어서 중요한 검색 키워드를 발명 문장으로부터 추출함으로써 특허 문장군 추출부(413)가 용이하게 특허 문장군을 추출할 수 있다. 또한, 특허 평가 판정 시스템(1)으로서, 특허성의 평가 판정을 신속하게 처리할 수 있다.
특허 문장군 추출부(413)는, 검색 키워드 추출부(412)가 추출한 검색 키워드를 사용하여 입력된 발명 문장과 유사한 특허 문장군을 추출한다. 특허 문장군의 추출은, 특허 문장 데이터베이스(3)에 포함되는 특허 문장을 간단히 키워드 검색에 의해 검색해도 된다. 예를 들어, 검색 키워드가 특허 문장의 전문에 기재되어 있는 특허 문장군을 검색 결과로 해도 되고, 검색 키워드가 전체 청구항에 기재되어 있는 특허 문장군을 검색 결과로서 추출해도 되고, 청구항 1에 검색 키워드가 기재되어 있는 특허 문장군을 검색 결과로서 추출해도 된다. 본 실시 형태에 있어서는, 특허 문장의 전문에 있어서 검색 키워드가 검출되는 검색 결과를 특허 문장군으로 하고 있지만, 본 발명은 검색 대상 개소에 한정되지 않는다. 검색 대상 문장이 짧을수록, 처리가 간단해지기 때문에, 간이 조사로서 청구항 1만을 검색 대상으로 할 수도 있다.
특허 문장군 추출부(413)는, 검색 키워드가 포함되는 특허 문장군 중에서 당해 검색 키워드의 중요도를 고려하여 특허 문장군의 정밀도를 올려도 된다. 예를 들어, 특허 문장군 추출부(413)는, TF-IDF법 등을 사용하여, 검색 키워드가 특허 문장군에 포함되는 문장에 있어서 어느 정도의 중요도가 있는지를 평가한다. 여기에서는, 검색 키워드가 1개의 특허 문장 전체에 있어서 출현하는 특허 문장은, 중요도가 낮다고 가정하고, 1개의 특허 문장에 있어서 특정한 문장에만 출현하는 경우에는, 중요도가 높다고 가정한다. 또한, TF-IDF법 등을 사용하여, 검색 키워드에 대한 특허 문장군의 추출은, 유저가 단말 장치(2)에 발명 문장을 입력하고, 검색 키워드가 얻어졌을 때에 행해져도 되고, 대표적인 검색 키워드에 대한 특허 문장군을 미리 서버 기억부(411) 내에 기억해 두어도 된다.
이와 같이, 특허 문장군 추출부(413)는, 간단히 프리워드 검색에 있어서 추출된 특허 문장군과 비교하여, 검색 키워드의 중요도를 고려한 후에 특허 문장군을 추출할 수 있기 때문에, 불필요한 처리를 하지 않고 정밀도가 높은 특허 평가 판정을 특허 평가 판정 시스템(1)이 실시할 수 있다. 또한, 보다 최적의 특허 문장군을 추출함으로써, 특허 평가 판정 시스템(1)은 특허성의 평가 판정을 신속하게 처리할 수 있다.
판정부(414)는, 특허 문장군 추출부(413)가 추출한 특허 문장군에 포함되는 문장의 전문(이후 「특허 문장군의 전문」으로 기재하는 경우도 있음)과 발명 문장을 비교하여 유사도를 구한다. 판정부(414)는, 특허 문장군에 포함되는 문장의 전문 및 발명 문장을 최소의 문장 단위(이후 최소문이라 칭함)로 분할하고, 이들 최소문끼리의 유사도를 구한다. 즉, 발명 문장에 포함되는 구성 요소 단위로 문장을 최소문으로 분할하고, 구성 요소가 특허 문장군에 개시되어 있는지 여부를 판정함으로써 유사도를 구한다. 또한, 판정부(414)는, 발명 문장에 포함되는 최소문이 1개의 특허 문장에 포함되어 있는지, 복수의 특허 문장에 나누어져 기재되어 있는지를 유사도에 반영시켜도 된다. 1개의 문장에 모든 최소문이 개시되어 있는 경우, 입력된 발명 문장의 신규성이 결여되어 있다고 판정할 수 있다. 또한, 복수의 특허 문장에 걸쳐 최소문이 기재되어 있는 경우에는, 입력된 특허 문장에 진보성이 결여되어 있다고 판정할 수 있다.
이와 같이, 판정부(414)는 미리 최소문으로 발명 문장 및 특허 문장을 구획한 후에, 발명 문장 및 특허 문장군의 비교를 행하기 때문에, 발명 문장의 전체 및 특허 문장 전체를 비교하는 것보다도 소규모로 문장끼리의 유사 판정이 가능하다. 따라서, 특허 평가 판정 시스템(1)에 의한 유사 판정의 정밀도가 향상된다.
판정부(414)는, 유사도를 구할 때에, 이하의 유사도의 스코어 산출식에 의해 스코어 부여를 행한다. 또한, 이 스코어 산출은, 최소문끼리를 기초로 산출되지만, 발명 문장 전체 및 특허 문장군의 전문의 편집 거리를 구하는 구성으로 해도 된다.
유사도의 스코어 산출식=(발명 문장의 길이 페널티)×(최소문의 단어 단위에서의 함유율)×(문자열 레벨에서의 편집 거리의 역수)
여기서, 편집 거리란 2개의 문자열이 있었을 때, 1개의 문자열을 다른 1개로 편집할 때의 거리이다. 즉, 1문자의 추가 또는 삭제는, 스코어가 1이 되고, 1문자 삭제하고 추가한 경우에는 스코어가 2가 되도록 산출된다. 본 발명의 특허성의 판정에 편집 거리를 사용하는 것은, 표기 흔들림(차이)을 흡수하기 위해서이다.
또한, 발명문의 길이 페널티는, 너무 짧은 문장끼리를 비교하였을 때에 편집 거리가 너무 작아지기 때문에, 보정을 가하기 위한 계수이다.
이와 같이, 판정부(414)는, 편집 거리를 사용하여 발명 문장과 특허 문장군의 유사한 판정을 행함으로써, 단어나 문자 단위로 상세하게 문장끼리의 유사도를 정확하게 산출할 수 있다. 통상의 특허 평가 판정 방법에서는, 유사한 단어가 몇 개 포함되어 있는지에 따라서 특허성의 판정을 행하고 있지만, 편집 거리를 사용함으로써 문장으로서 의미까지도 유사한지 판정하는 것이 가능해진다.
판정부(414)는, 상기한 바와 같이 특허 문장군에 대하여 유사도를 구하고, 유사도가 높은 특허 문장과 발명 문장의 유사도에 따라서 특허성의 판정 결과의 산출을 행한다. 유사도로부터 최종적인 특허성의 판정을 행하는 방법은, 다양한 방법이 있고, 본 발명은 이들 방법에는 한정되지 않는다.
예를 들어, 유저에 의해 입력된 발명 문장의 최소문과 유사도가 높은 특허 문장의 전문의 최소문의 편집 거리에 기초하여 산출된 스코어 및 분산 표현 공간에서 합치하고 있는 특허 문장의 전문의 스코어를 합산하고, 특허 문장의 전문의 구성 요소인 최소문마다 스코어를 판정한다. 그리고, 판정부(414)는 스코어를 0 내지 1로 정규화하여 퍼센트로서 출력한다.
또한, 판정부(414)에 의한 랭크 부여는 A 내지 D의 4단계로 한 경우, A는 특허성이 가장 높고, B 내지 D로 단계적으로 특허성이 내려간다. 이 랭크 부여의 판단은, 발명 문장의 요소 모두에 대한 스코어에 의해 산출된다.
판정부(414)는 유사도가 높은 특허 문장을 복수 추출해도 된다. 본 실시 형태에 있어서는, 3건의 유사 특허 문장을 추출하는 구성으로 하고 있다. 예를 들어, 유사 특허 문장의 전문의 최소문인 구성 요소 중, 최대 스코어(3건의 특허 문장에서의 최대 유사도)가 1개라도 소정값보다도 낮은 것이 있으면 B랭크 이상으로 하고, 2개 이상 소정값보다 낮은 것이 있으면 A랭크로 한다. 또한, 최대 스코어의 최솟값(어느 구성 요소도 특허 문장의 어느 것에 기재가 있음)이 소정값보다 높으면 D랭크로 한다. 또한, 구성 요소의 대부분의 스코어가 소정값보다 낮은 경우에는, B랭크로 하고, 구성 요소의 반수가 높지 않으면 C랭크로 한다. 이들 중 어느 조건에도 해당되지 않는 경우, 판정부(414)는 문서 전체의 키워드 일치율이나, 벡터 유사도로부터 랭크를 부여해도 된다.
특허성을 랭크 부여에 의해 표시함으로써 유저는, 간단하게 특허성의 판정을 파악할 수 있다. 또한, 1건이라도 유사도가 높은 특허 문장이 추출된 경우에는 랭크를 떨어뜨림으로써 정확한 특허성 판단 결과를 유저의 단말 장치(2)에 송신할 수 있다.
도 5는 판정부(414)에 의한 발명 문장의 유사 특허와의 유사 스코어를 나타내는 표의 일례이다. 발명 문장은, 구성 요소 AAA, 구성 요소 BBB, 구성 요소 CCC 및 구성 요소 DDD의 4개의 구성 요소로 분할되어 있고, 유사 특허 X, 유사 특허 Y 및 유사 특허 Z와의 유사도가 퍼센트로 나타내어져 있다. 상기 랭크 부여 룰에 의하면, 발명 문장의 랭크는 C랭크가 되고, 유사도와 함께 판정 결과로서 산출된다.
생성부(415)는 유저의 단말 장치(2)에 송신되는 다양한 표시 화면을 생성한다. 특히, 판정부(414)가 판정한 특허성의 판정 결과를 포함하는 화면을 생성하여, 서버 통신부(417)를 통해 유저의 단말 장치(2)에 송신한다.
생성부(415)가 생성한 특허성의 판정 결과는, 서버 기억부(411)에 기억되어도 된다. 그러나, 발명 문장의 기밀 관점에서 발명 문장의 내용 및 특허성의 판정 결과도 서버 기억부(411)에 기억하지 않고, 이들 정보를 일시적인 보존 영역(메모리)에 기억하고, 유저의 단말 장치(2)에 송신하는 구성으로 하는 편이 바람직하다. 이 일시적인 보존 영역도 서버 기억부(411)가 담당해도 된다.
서버 통신부(417)는 서버(4)를 인터넷(5)에 접속하기 위한 통신 인터페이스 회로를 갖는다. 서버 통신부(417)는 유저의 단말 장치(2)로부터 특허성의 판정을 구하는 발명 문장을 수신하고, 판정부(414)에 의한 판정 결과를 유저의 단말 장치(2)에 송신한다. 또한, 서버 통신부(417)는 특허 문장 데이터베이스(3)로부터 특허 문장의 제공을 받을 때에, 정보를 수신한다. 서버 통신부(417)는, 필요에 따라서 유저의 단말 장치(2)와 다양한 통신을 행하고, 서버 통신부(417)는 필요에 따라서 특허 문장 데이터베이스(3)와 다양한 통신을 행한다.
(특허 평가 판정 시스템(1)에 의한 처리)
도 6은 본 실시 형태에 관한 특허 평가 판정 시스템(1)에 의한 유저의 단말 장치(2)로부터 발명 문장의 판정 요구에 따라서, 당해 발명 문장의 특허성을 판정하고, 판정 결과를 유저의 단말 장치(2)에 송신할 때까지의 일련의 흐름의 동작 시퀀스의 일례를 도시하는 도면이다.
이하에 설명하는 동작 시퀀스는, 미리 서버 기억부(411)에 기억되어 있는 프로그램에 기초하여, 주로 서버 처리부(416)에 의해, 서버(4)의 각 요소와 협동하여 실행된다. 또한, 이하에 설명하는 동작 시퀀스에 있어서, 서버(4)는 서버 통신부(417)를 통해 유저의 단말 장치(2)와 각종 정보를 송수신한다.
처음에 서버(4)의 서버 통신부(417)는, 유저의 단말 장치(2)로부터 특허성의 판정을 행하고 싶은 발명 문장을 수신한다(스텝 S101). 또한, 본 처리는, 발명 문장을 서버 통신부(417)가 유저의 단말 장치(2)로부터 수신하였을 때에 개시된다.
계속해서, 서버 처리부(416)는 발명 문장이 특허성의 판정을 행하기 위해 알맞은 형식으로 기술되어 있는지를 서버 처리부(416)는 판정한다(스텝 S102). 예를 들어, 본 실시 형태에서는, 발명 문장이 1개의 발명을 포함하고 있을 필요가 있기 때문에, 쉼표가 복수 존재하는 문장이면, 서버 처리부(416)는 에러 정보를, 서버 통신부(417)를 통해 유저의 단말 장치(2)에 송신한다. 발명 문장이 잘못된 형식으로 기술되어 있는 경우(스텝 S102가 "아니오")에는, 서버 처리부(416)는, 에러 정보를 유저의 단말 장치(2)에 송신하고(스텝 S103) 처리가 종료된다. 그리고, 서버 처리부(416)는 형식이 수정된 발명 문장, 또는 다음의 발명 문장의 수신을 대기한다.
발명 문장이 올바른 형식으로 기술되어 있는 경우(스텝 S102가 "예"), 서버 처리부(416)는 유저의 단말 장치(2)로부터 수신한 발명 문장이 속하는 기술분야를 1단어로 나타내기 위한 용어를 추출한다(스텝 S104). 서버 처리부(416)는 발명 문장을 복수의 단어 단위로 분할하고, 어느 단어가 어느 단어를 수식하고 있는지의 수식 관계를 추출하고, 단어의 수식 관계로부터 중요한 용어를 검색 키워드로서 추출한다.
계속해서, 서버 처리부(416)는, 추출된 검색 키워드를 사용하여 입력된 발명 문장과 유사한 특허 문장군을 추출한다(스텝 S105). 구체적으로는, 서버 처리부(416)는, 특허 문장 데이터베이스(3)로부터 검색 키워드가 특허 문장의 전문에 기재되어 있는 특허 문장군을 검색 결과로서 추출한다. 이때, 서버 처리부(416)는, 검색 키워드가 개개의 특허 문장에 있어서 어느 정도 중요한 단어인지를 판정한 후에, 관련성이 높은 특허 문장만을 특허 문장군으로서 추출한다.
그리고, 서버 처리부(416)는, 특허 문장군의 전문과 발명 문장을 비교하여 유사도를 구한다(스텝 S106). 구체적으로는, 서버 처리부(416)는, 발명 문장에 포함되는 구성 요소 단위로 문장을 최소문으로 분할하여, 구성 요소가 특허 문장군에 개시되어 있는지 여부를 판정함으로써 유사도를 구한다. 서버 처리부(416)는, 유사도의 스코어를 각각의 특허 문장군에 포함되는 특허 문장에 대하여 산출하고, 유사도의 스코어가 높은 특허 문장을 3건 추출한다. 여기서, 서버 처리부(416)는 유저의 단말 장치(2)로부터 입력된 발명 문장의 길이를 고려하여, 너무 짧은 경우에는 유사도가 높게 나오도록 유사도의 스코어를 보정해도 된다.
또한, 서버 처리부(416)는, 추출된 3건의 유사도의 스코어가 높은 특허 문장의 최소문과 유저의 단말 장치(2)로부터 입력된 발명 문장의 최소문의 편집 거리에 기초하여 입력된 발명 문장의 특허성의 판정을 행한다(스텝 S107). 여기서, 서버 처리부(416)는, 유저의 단말 장치(2)에 입력된 발명 문장의 특허성의 판정을 랭크로서 산출한다. 즉, 특허성의 평가를 A 내지 D의 랭크로 평가하여 판정 결과로서 유저의 단말 장치에 송신한다(스텝 S108).
(유저의 단말 장치(2)의 기능)
도 7은 유저의 단말 장치(2)의 단말기 표시부(214)에 의해 표시되는 발명 문장 입력 화면(200)의 일례를 도시하는 도면이다.
도 7은 유저의 단말 장치(2)에 표시되는 발명 문장의 입력 화면의 일례를 도시하는 도면이다. 발명 문장 입력 화면(200)은, 유저가 단말 장치(2)를 사용하여 발명 문장을 입력하여 특허성의 판정을 요구하기 위한 화면이다. 발명 문장 입력 화면(200)에는, 임의의 발명 문장을 입력하는 입력란을 형성하는 영역인 발명 문장 입력 영역(201) 및 입력된 발명 문장이 정확하게 입력되어 있는지를 확인하기 위한 확인 화면으로 진행하기 위한 확인 버튼(202)이 표시되어 있다.
도 8은 유저의 단말 장치(2)의 단말기 표시부(214)에 의해 표시되는 발명 문장 표시 화면(300)의 일례를 도시하는 도면이다.
도 8에 도시한 바와 같이, 발명 문장 표시 화면(300)은, 유저가 단말 장치(2)를 사용하여 입력한 발명 문장이 정확하게 입력되었는지를 나타내는 화면이다. 발명 문장 표시 화면(300)에는, 입력된 발명 문장을 구성 요소마다 구분하여 표시한다. 도 8의 예에서는, 구성 요소 AAA, 구성 요소 BBB, 구성 요소 CCC 및 구성 요소 DDD의 4개의 구성 요소를 포함하는 발명 문장을 도 7의 발명 문장 입력 영역(201)에 입력하고, 확인 버튼(202)을 유저가 마우스에 의한 클릭 동작 등으로 누른 경우에 표시되는 화면을 모식하고 있다. 즉, 도 8의 예에서는, 구성 요소 AAA, 구성 요소 BBB, 구성 요소 CCC 및 구성 요소 DDD의 4개의 구성 요소를 포함하는 발명 문장으로 나누어진 상태로 발명 문장이 표시되어 있다. 발명 문장 표시 화면(300)에는, 발명 문장이 표시되는 표시란을 형성하는 영역인 발명 문장 표시 영역(301) 및 당해 발명 문장 표시 영역(301)에 표시되어 있는 발명 문장에 대하여 특허성의 판정을 행하기 위한 판정 개시 버튼(302)이 표시되어 있다.
도 9는 유저의 단말 장치(2)의 단말기 표시부(214)에 의해 표시되는 발명 문장 평가 화면(400)의 일례를 도시하는 도면이다.
도 9는 유저의 단말 장치(2)에 표시되는 발명 문장 평가 화면(400)의 일례를 도시하는 도면이다. 발명 문장 평가 화면(400)은, 유저가 단말 장치(2)를 사용하여 입력한 발명 문장이 정확하게 입력되었는지를 나타내는 화면이다. 발명 문장 평가 화면(400)에는, 입력된 발명 문장을 구성 요소마다 구분하고, 각각의 구성 요소마다 유사도가 높은 특허 문장과의 비교 결과를 퍼센트로 나타내고 있는 비교 결과 표시 영역(401)이 포함된다. 또한, 발명 문장 평가 화면(400)에는, 이들 비교 결과로부터 산출되는 발명 문장의 특허성의 판정 결과를 A 내지 D의 랭크로 표시하는 랭크 표시 영역(402)이 포함된다. 도 9의 예에서는, 구성 요소 AAA, 구성 요소 BBB, 구성 요소 CCC 및 구성 요소 DDD의 4개의 구성 요소 및 유사 특허 문장과의 비교 결과로부터 산출되는 발명 문장의 특허성의 판정 결과는, C랭크로 되어 있다.
이상 설명한 바와 같이, 본 실시 형태에 관한 특허 평가 판정 시스템(1)은, 복수의 유저의 단말 장치(2)로부터의 요구에 포함되는 발명 문장의 특허성을 판정할 수 있다. 또한, 특허 평가 판정 시스템(1)은, 발명 문장 및 유사 특허 문장의 전문의 최소문끼리를 문자의 편집 거리로 하여 유사도를 산출하고 있기 때문에, 단순히 동일한 단어가 특허 문장군에 포함되어 있는지를 판정하는 방법과 비교하여 높은 정밀도로 발명 문장의 특허성을 판정할 수 있다.
또한, 본 발명은, 특허 평가 판정 시스템(1)으로서, 유저의 단말 장치(2), 특허 문장 데이터베이스(3) 및 서버(4)가 각각 독립되어 있는 시스템으로서 기재하고 있지만, 이들 기능이 모두 1개소에 존재하는 판정 장치로 해도 마찬가지의 효과를 발휘할 수 있다. 또한, 이들 기능을 유저의 단말 장치 등에 인스톨시키기 위한 프로그램으로서 제공하는 것도 가능하다.
당업자는, 본 발명의 정신 및 범위로부터 벗어나지 않고, 다양한 변경, 치환 및 수정을 이것에 가하는 것이 가능한 것을 이해하기 바란다. 이하에 설명하는 변형예에 있어서는, 각각의 변형예끼리가 조합되어 본 발명을 실시 가능한 것도 이해하기 바란다.
(변형예 1)
서버 처리부(416)의 특허 문장군 추출부(413)는, 특허 문장군의 정밀도를 올리기 위해 이하의 처리를 행할 수 있다. 서버 처리부(416)의 특허 문장군 추출부(413)는, 추출된 특허 문장군의 특허 문장에 부여되어 있는 특허 분류(예를 들어, IPC나 CPC)를 추출하여, 히스토그램을 작성하고, 상위의 수건의 특허 분류를 선택한다. 그리고, 선택된 특허 분류를 사용하여 다시 검색 키워드와의 AND 검색을 행한다. 여기서, 검색 키워드에 의한 검색은, 간단히 프리워드 검색이어도 되지만, 상술한 바와 같이 TF-IDF법 등을 사용하여, 검색 키워드가 특허 문장군에 포함되는 문장에 있어서 어느 정도의 중요도가 있는지를 평가한 후에 검색 결과를 얻는 편이 바람직하다. 이 검색 결과를 발명 문장과의 비교에 사용하는 특허 문장군으로서 갱신한다. 이 처리에 의해, 특허 문장군의 집합체로서의 정밀도가 올라가고, 특허성의 판정의 정밀도도 올라간다. 즉, 특허 문장군 추출부(413)는, 특허 분류를 사용함으로써 집합체로서의 망라성이 올라감으로써 특허 문장의 추출 누락이 감소된다.
도 10은 본 실시 형태의 변형예 1에 관한 특허 평가 판정 시스템(1)에 의한 유저의 단말 장치(2)로부터 발명 문장의 판정 요구에 따라서, 당해 발명 문장의 특허성을 판정하고, 판정 결과를 유저의 단말 장치(2)에 송신할 때까지의 일련의 흐름의 동작 시퀀스의 일례를 도시하는 도면이다.
스텝 S105에서, 추출된 검색 키워드를 사용하여 입력된 발명 문장과 유사한 특허 문장군을 추출한 후, 서버 처리부(416)는 특허 문장군으로부터 특허 분류를 추출하여 추출수가 많은 상위 특허 분류를 선택한다(스텝 S109). 계속해서 서버 처리부(416)는, 검색 키워드 및 선택된 상위 특허 분류를 사용하여 특허 문장군을 재추출한다(스텝 S110). 또한, 이 특허 분류에 의한 검색은, 특허 분류를 복수 포함하는 경우에는, OR 검색으로 함으로써 특허 문장군에 확장성을 부여할 수 있다.
(변형예 2)
서버 처리부(416)의 특허 문장군 추출부(413)는, 특허 문장군의 정밀도를 올리기 위해 이하의 처리를 행할 수 있다. 서버 처리부(416)의 특허 문장군 추출부(413)는, 추출된 특허 문장군의 각각의 특허 문장에 포함되는 문장의 전문에 대하여, 분산 표현 공간에서 검색 키워드와 근접하는 것을 추출하고, 추출된 결과를 발명 문장과의 비교에 사용하는 특허 문장군으로서 갱신한다. 즉, 특허 문장군 추출부(413)는, 기계 학습에 의해 유사한 문장끼리에서 사용되고 있는 단어끼리는 비슷한 개념을 갖고 있다고 가정하고, 유사 단어를 동일 벡터로 하여 시뮬레이션한다. 이 처리에 의해, 유사 키워드도 벡터가 동일하다고 인식할 수 있다. 이 처리에 의해, 특허 문장군의 집합체로서의 정밀도가 올라가고, 특허성의 판정의 정밀도도 올라간다. 즉, 특허 문장군 추출부(413)는, 분산 표현 공간에서 검색 키워드와 근접하는 특허 문장을 추출하고 있기 때문에, 검색 키워드와 유사한 문언을 구비하는 특허 문장도 추출할 수 있다.
도 11은, 본 실시 형태의 변형예 2에 관한 특허 평가 판정 시스템(1)에 의한 유저의 단말 장치(2)로부터 발명 문장의 판정 요구에 따라서, 당해 발명 문장의 특허성을 판정하고, 판정 결과를 유저의 단말 장치(2)에 송신할 때까지의 일련의 흐름의 동작 시퀀스의 일례를 도시하는 도면이다.
스텝 S105에서, 추출된 검색 키워드를 사용하여 입력된 발명 문장과 유사한 특허 문장군을 추출한 후, 서버 처리부(416)는 분산 표현 공간에 있어서의 상기 검색 키워드와 근접하는 특허군으로 좁힌 결과를 특허 문장군으로서 추출한다(스텝 S111).
또한, 본 변형예 2의 처리와 변형예 1의 처리를 조합하는 경우에는, 변형예 1의 스텝 S110 후에 변형예 2의 스텝 S111을 서버 처리부(416)가 실시하면 특허 문장군으로서 정밀도가 높아진다. 물론, 서버 처리부(416)는 변형예 2의 스텝 S111 후에 변형예 1의 스텝 S110을 실시하는 처리로 하는 것도 가능하다.
(변형예 3)
본 실시 형태에 있어서, 발명 문장은, 출원 전의 발명 내용을 발명 문장으로서 설명하였지만, 출원 후의 특허 출원 등에 포함되는 청구항의 특허성의 판정에 특허 평가 판정 시스템(1)을 사용할 수도 있다. 이 경우, 특허 문장군 추출부(413)는, 특허성의 판정을 행하는 특허 출원 등의 출원일을 고려하여, 출원일보다도 전에 공개된 특허 문장으로부터 특허 문장군을 추출한다. 이 출원일은, 특허 문장 데이터베이스(3)가 기억하고 있는 출원일이어도 되고, 유저에 의해 단말 장치(2)에 직접 입력되는 날짜여도 된다.
1 : 특허 평가 판정 시스템
2 : 유저의 단말 장치
211 : 단말기 통신부
212 : 단말기 기억부
213 : 단말기 조작부
214 : 단말기 표시부
215 : 단말기 처리부
3 : 특허 문장 제공 장치
4 : 서버
411 : 서버 기억부
412 : 검색 키워드 추출부
413 : 특허 문장군 추출부
414 : 판정부
415 : 생성부
416 : 서버 처리부
417 : 서버 통신부
5 : 인터넷

Claims (9)

  1. 발명에 관한 발명 문장의 입력을 접수하는 발명 입력 스텝과,
    상기 입력된 발명 문장을 단어 단위로 구문 분석을 행한 후에, 상기 발명 문장에 있어서의 임의의 검색 키워드를 추출하는 키워드 추출 스텝과,
    상기 추출된 검색 키워드를 사용하여 당해 검색 키워드가 포함되는 특허 문장군을 데이터베이스로부터 추출하는 특허 문장군 추출 스텝과,
    상기 발명 문장 및 상기 특허 문장군에 포함되는 문장을 비교하여 상기 발명 문장의 특허성을 판정하는 판정 스텝
    을 포함하는 것을 특징으로 하는 특허 평가 판정 방법.
  2. 제1항에 있어서,
    상기 판정 스텝은, 상기 발명 문장 및 상기 특허 문장군에 포함되는 문장의 편집 거리를 기초로 상기 발명 문장의 특허성을 판정하는 것을 특징으로 하는 특허 평가 판정 방법.
  3. 제2항에 있어서,
    상기 판정 스텝은, 상기 특허 문장군에 포함되는 문장의 편집 거리의 역수에 상기 발명 문장의 길이 지수 및 상기 검색 키워드의 함유율을 승산한 결과를 기초로 상기 발명 문장의 특허성을 판정하는 것을 특징으로 하는 특허 평가 판정 방법.
  4. 제2항 또는 제3항에 있어서,
    상기 판정 스텝은, 상기 발명 문장을 구성 요소마다 구분한 후에, 구분된 상기 구성 요소마다 상기 특허 문장군에 포함되는 문장과의 편집 거리를 기초로 상기 발명 문장의 특허성을 판정하는 것을 특징으로 하는 특허 평가 판정 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 특허 문장군 추출 스텝은, 상기 특허 문장군에 부여되어 있는 특허 분류를 추출하고, 당해 추출된 특허 분류 중에서 추출수가 많은 상위 특허 분류를 선택하고, 상기 검색 키워드 및 상기 선택된 상위 특허 분류를 사용하여 상기 특허 문장군을 재추출하는 것을 특징으로 하는 특허 평가 판정 방법.
  6. 제5항에 있어서,
    상기 특허 문장군 추출 스텝은, 상기 검색 키워드 및 상기 선택된 상위 특허 분류를 사용하여 얻어진 상기 특허 문장군 중에서 분산 표현 공간에 있어서의 상기 검색 키워드와 근접하는 특허군으로 좁힌 결과를 상기 특허 문장군으로서 추출하는 것을 특징으로 하는 특허 평가 판정 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 판정 스텝은, 상기 발명 문장 및 상기 특허 문장군에 포함되는 문장을 비교하여 상기 발명 문장과 유사한 특허 문장을 추출하고, 상기 발명 문장 및 당해 추출된 특허 문장과의 유사도를 판정함으로써 상기 발명 문장의 특허성을 판정하는 것을 특징으로 하는 특허 평가 판정 방법.
  8. 발명에 관한 발명 문장의 입력을 접수하는 발명 입력부와,
    상기 입력된 발명 문장을 단어 단위로 구문 분석을 행한 후에, 상기 발명 문장에 있어서의 임의의 검색 키워드를 추출하는 키워드 추출부와,
    상기 추출된 검색 키워드를 사용하여 당해 검색 키워드가 포함되는 특허 문장군을 데이터베이스로부터 추출하는 특허 문장군 추출부와,
    상기 발명 문장 및 상기 특허 문장군에 포함되는 문장을 비교하여 상기 발명 문장의 특허성을 판정하는 판정부
    를 포함하는 것을 특징으로 하는 특허 평가 판정 장치.
  9. 컴퓨터에,
    발명에 관한 발명 문장의 입력을 접수하는 발명 입력 기능과,
    상기 입력된 발명 문장을 단어 단위로 구문 분석을 행한 후에, 상기 발명 문장에 있어서의 임의의 검색 키워드를 추출하는 키워드 추출 기능과,
    상기 추출된 검색 키워드를 사용하여 당해 검색 키워드가 포함되는 특허 문장군을 데이터베이스로부터 추출하는 특허 문장군 추출 기능과,
    상기 발명 문장 및 상기 특허 문장군에 포함되는 문장을 비교하여 상기 발명 문장의 특허성을 판정하는 판정 기능
    을 실현시키는 것을 특징으로 하는 특허 평가 판정 프로그램.
KR1020197002518A 2018-07-31 2018-07-31 특허 평가 판정 방법, 특허 평가 판정 장치 및 특허 평가 판정 프로그램을 기록한 기록 매체 KR20200014716A (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/028760 WO2020026366A1 (ja) 2018-07-31 2018-07-31 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム

Publications (1)

Publication Number Publication Date
KR20200014716A true KR20200014716A (ko) 2020-02-11

Family

ID=66324240

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197002518A KR20200014716A (ko) 2018-07-31 2018-07-31 특허 평가 판정 방법, 특허 평가 판정 장치 및 특허 평가 판정 프로그램을 기록한 기록 매체

Country Status (5)

Country Link
US (1) US20200349204A1 (ko)
JP (1) JP6506489B1 (ko)
KR (1) KR20200014716A (ko)
CN (1) CN111194457A (ko)
WO (1) WO2020026366A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7193890B2 (ja) * 2020-01-30 2022-12-21 株式会社AI Samurai 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム
JP7453895B2 (ja) * 2020-11-11 2024-03-21 株式会社日立製作所 探索条件提示装置、探索条件提示方法、及び探索条件提示プログラム
US11847169B2 (en) * 2020-12-18 2023-12-19 Shanghai Henghui Intellectual Property Service Co., Ltd. Method for data processing and interactive information exchange with feature data extraction and bidirectional value evaluation for technology transfer and computer used therein
JP7421740B1 (ja) 2023-09-12 2024-01-25 Patentfield株式会社 分析プログラム、情報処理装置、および分析方法
CN117151052B (zh) * 2023-11-01 2024-01-23 北京知呱呱科技有限公司 一种基于大语言模型和图算法的专利查询报告生成方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009238074A (ja) 2008-03-28 2009-10-15 Nomura Research Institute Ltd 特許性予測装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030033295A1 (en) * 2001-07-11 2003-02-13 Adler Marc Stephen Method for analyzing and recording innovations
JP2005078210A (ja) * 2003-08-28 2005-03-24 Webstar Co Ltd 発明提案書作成統合インターフェイス装置
JP4872079B2 (ja) * 2006-05-19 2012-02-08 国立大学法人長岡技術科学大学 文章更新量評価プログラム
JP2009043051A (ja) * 2007-08-09 2009-02-26 Ntt Advanced Technology Corp 文章処理方法および装置
CN101695082B (zh) * 2009-09-30 2012-08-22 北京航空航天大学 基于关系挖掘的服务组织方法及装置
US9836805B2 (en) * 2012-01-17 2017-12-05 Sackett Solutions & Innovations, LLC System for search and customized information updating of new patents and research, and evaluation of new research projects' and current patents' potential
CN106528583A (zh) * 2015-11-14 2017-03-22 孙燕群 一种网页正文提取比对方法
CN106815196B (zh) * 2015-11-27 2020-07-31 北京国双科技有限公司 软文展现次数统计方法和装置
CN106528846B (zh) * 2016-11-21 2019-09-17 广州华多网络科技有限公司 一种检索方法及装置
US20180189909A1 (en) * 2016-12-30 2018-07-05 At&T Intellectual Property I, L.P. Patentability search and analysis
JP6308708B1 (ja) * 2017-08-25 2018-04-11 和之 白井 特許要件適否予測装置および特許要件適否予測プログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009238074A (ja) 2008-03-28 2009-10-15 Nomura Research Institute Ltd 特許性予測装置

Also Published As

Publication number Publication date
WO2020026366A1 (ja) 2020-02-06
JPWO2020026366A1 (ja) 2020-08-06
JP6506489B1 (ja) 2019-04-24
US20200349204A1 (en) 2020-11-05
CN111194457A (zh) 2020-05-22

Similar Documents

Publication Publication Date Title
JP6506489B1 (ja) 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム
KR101368594B1 (ko) 관련어 등록 장치, 정보 처리 장치, 관련어 등록 방법 및 기록 매체
CN108959383A (zh) 网络舆情的分析方法、装置及计算机可读存储介质
WO2021218322A1 (zh) 段落搜索方法、装置、电子设备及存储介质
US9805120B2 (en) Query selection and results merging
JP2010055159A (ja) 情報検索装置、情報検索方法、およびプログラム
JP6507541B2 (ja) 情報表示機器、情報表示プログラムおよび情報表示方法
EP2720156B1 (en) Information processing device, information processing method, program for information processing device, and recording medium
JP2006522382A (ja) 検索エンジンで登録されたウェブサイトを管理するための方法およびそのシステム
US9690797B2 (en) Digital information analysis system, digital information analysis method, and digital information analysis program
JP2021064132A (ja) 質問文出力方法、コンピュータプログラム及び情報処理装置
JP2010055155A (ja) サーバ装置、情報処理方法およびプログラム
US10496711B2 (en) Method of and system for processing a prefix associated with a search query
JP2020021455A (ja) 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム
JP5072792B2 (ja) 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ
JP6618103B1 (ja) 文章生成装置、文章生成方法、および文章生成プログラム
JP4860439B2 (ja) 質問文の自動生成システム
WO2017134760A1 (ja) 情報検索方法及び情報検索装置並びに情報検索システム
JP2021149600A (ja) 情報処理装置及びプログラム
JP2009294768A (ja) 情報共有装置及び情報共有プログラム
JP5843235B2 (ja) Web情報処理装置、web情報処理方法、およびプログラム
TW202319985A (zh) 產生創意素材的系統及方法
JP5853090B2 (ja) デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム
JP2019212193A (ja) 企業検索装置、端末装置、及びプログラム
JP2020112663A (ja) 情報処理装置、サーバの制御方法、およびサーバの制御プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application