KR20190050406A - 기술정보 추출장치 및 방법 - Google Patents

기술정보 추출장치 및 방법 Download PDF

Info

Publication number
KR20190050406A
KR20190050406A KR1020170145781A KR20170145781A KR20190050406A KR 20190050406 A KR20190050406 A KR 20190050406A KR 1020170145781 A KR1020170145781 A KR 1020170145781A KR 20170145781 A KR20170145781 A KR 20170145781A KR 20190050406 A KR20190050406 A KR 20190050406A
Authority
KR
South Korea
Prior art keywords
extracting
effect
structures
sao
extracted
Prior art date
Application number
KR1020170145781A
Other languages
English (en)
Other versions
KR102546476B1 (ko
Inventor
이성주
김규웅
Original Assignee
아주대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아주대학교산학협력단 filed Critical 아주대학교산학협력단
Priority to KR1020170145781A priority Critical patent/KR102546476B1/ko
Publication of KR20190050406A publication Critical patent/KR20190050406A/ko
Application granted granted Critical
Publication of KR102546476B1 publication Critical patent/KR102546476B1/ko

Links

Images

Classifications

    • G06F17/2705
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/11Patent retrieval

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

기술정보 추출 장치 및 방법을 개시한다. 본 발명의 일 실시예에 따른 기술정보 추출장치는, 특허 문서로부터 SAO(Subject-Action-Object)구조들을 추출하는 SAO 추출부, 상기 추출된 SAO구조들의 AO구조들로부터 목적/효과를 추출하는 기술정보 추출부, 목적/효과를 의미하는 패턴에 기초하여, 상기 SAO구조들을 포함하는 문장들에서 목적/효과를 확장하는 목적/효과 확장부를 포함한다.

Description

기술정보 추출장치 및 방법{Apparatus and method for extracting technology Information}
본 발명은 기술정보 추출 장치 및 방법에 관한 것으로, 특히 특허 문서로부터 기술구성, 개발분야 및 개발의 목적/효과를 추출하는 기술정보 추출 장치 및 방법에 관한 것이다.
특허는 기술의 진보를 반영하는 신뢰성 있는 최신정보이며, 따라서 특허분석은 기술동향 파악과 기술개발 전략의 수립에 필수적인 요소로 인식되어 왔다. 특허분석을 위한 다양한 도구들 중 특허 네트워크 분석은 특허문서로부터 정보를 추출하고 가공하여 특허들 간의 관계를 시각화함으로써 기술관련 종사자들이 지적 재산권에 대한 추세를 한눈에 파악할 수 있도록 한다는 점에서 매우 유용한 도구이다.
특허는 국가 또는 기업의 R&D 활동 산출물로, 기술 개발자나 R&D 전략기획자들은 특허를 기술 부문의 의사 결정을 돕기 위한 신뢰 높은 정보 원천으로서 활용하고 있다. 기업들은 특허 데이터를 분석함으로써, 자사 기술 경쟁력 강화나 기술혁신에 대한 신호 감지 등의 기술 기회를 포착하기 위해 노력하고 있다.
그러나, 급증하는 특허 출원에 따라 대용량의 특허 데이터로부터 신속하고 의미있는 정보를 추출하려는 필요성이 요구되고 있다.
이에, 최근에는 텍스트 마이닝을 통해 특허 문서로부터 의미 있는 정보를 추출하고자 하는 연구가 이루어지고 있다. 특허 문서는 서지적 정보(예: 출원인, 등록연도, 기술분류 등), 기술적 정보(예: 초록, 발명의 내용 등), 권리적 정보(예: 청구항) 등 기술의 실질적이고 구체적인 정보를 포함한다.
특허 문서로부터 의미있는 정보 추출 시, Subject-Action-Object(SAO)구조를 통한 분석을 이용한다. SAO 구조를 통한 분석은 키워드(Subject, Object) 간 관계를 정의하는데 Action을 함께 고려함으로써, 'key words'가 아닌 'key concept'을 도출할 수 있다. 이러한 SAO 분석을 통하여 다양한 기술적 Insight, 예컨대, 기술 트리 개발, 특허침해 확인, 기술 로드맵 개발, 기술 트랜드 및 공백 기술 확인 등을 제공하고 있다.
그러나, 기술의 다양화가 가속되는 시점에서 기술개발의 목적 및 효과를 추출하는 것에 대한 중요성은 매우 커졌지만, 단순히 Action type에 의한 결과물은 활용이 제한적인 단점이 있다.
또한, 종래에는 SAO를 추출하는 과정에 있어 상용 소프트웨어를 사용하기 때문에, 분석의 유연성이 떨어지는 문제가 있다.
이에 관련하여, 발명의 명칭이 "의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템 및 이를 이용한 특허 네트워크 분석 방법"인 한국등록특허 제10-1327514호가 존재한다.
본 발명이 해결하고자 하는 기술적 과제는 특허문서로부터 의미있는 기술정보를 가진 SAO를 추출할 수 있는 기술정보 추출 장치 및 방법을 제공하는 것이다.
본 발명이 해결하고자 하는 다른 기술적 과제는 특허문서에서 다양한 관점의 기술 개발 목적 및 효과에 대한 정보를 풍부하고 면밀하게 제공할 수 있는 기술정보 추출 장치 및 방법을 제공하는 것이다.
본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
상기 기술적 과제를 해결하기 위한 본 발명의 일 실시예에 따른 기술정보 추출장치는, 특허 문서로부터 SAO(Subject-Action-Object)구조들을 추출하는 SAO 추출부, 상기 추출된 SAO구조들의 AO구조들로부터 목적/효과를 추출하는 기술정보 추출부, 목적/효과를 의미하는 패턴에 기초하여, 상기 SAO구조들을 포함하는 문장들에서 목적/효과를 확장하는 목적/효과 확장부를 포함한다.
바람직하게는, 상기 SAO 추출부는, 상기 특허 문서에서 기 정의된 기술대체용어들(S)을 포함하는 문장들을 추출하는 분석대상 문장 추출모듈을 포함할 수 있다.
바람직하게는, 상기 SAO 추출부는, 기 정의된 기술 파라미터(Engineering parameters)에 근거하여, 상기 추출된 문장들에서 AO구조들을 추출하는 AO구조 추출모듈을 포함할 수 있다.
바람직하게는, 상기 AO구조 추출모듈은, 상기 기술 파라미터에 근거하여, 각 문장에서 제1 Object(O)를 추출하고, 상기 제1 Object(O)에 대응하는 제1 Action(A)을 추출하는 제1 추출동작을 수행한 후, 각 문장에서 상기 제1 Action(A)에 대응하는 제2 Object(O)를 추출하는 제2 추출동작을 수행하며, 상기 제1 추출동작 및 제2 추출동작을 반복 수행하되, 새로운 Action 또는 새로운 Object가 추출되지 않을 때까지 또는 기 설정된 일정 회수 반복 수행할 수 있다.
바람직하게는, 상기 기술정보 추출부는, Action 타입에 근거하여 상기 AO구조들로부터 목적/효과를 추출하고, 상기 Action 타입에 근거하여 상기 AO구조들로부터 기술구성 또는 개발분야를 더 추출할 수 있다.
바람직하게는, 상기 패턴은, 동명사 형태의 Object, for 구문, to 구문, thus 구문 중 적어도 하나를 포함할 수 있다.
바람직하게는, 상기 목적/효과 확장부는, 상기 문장들에서 상기 동명사 형태의 Object, for 구문, to 구문, thus 구문 중 적어도 하나의 패턴에 대응하는 구문을 추출하고, 상기 추출된 구문에서 AO구조를 추출하며, 상기 추출된 AO구조로부터 목적/효과를 추출할 수 있다.
바람직하게는, 상기 목적/효과 확장부는, 상기 SAO구조들의 Object(O)에 근거하여 상기 추출된 AO구조를 필터링하고, 상기 필터링된 AO구조로부터 목적/효과를 추출할 수 있다.
상기 기술적 과제들을 해결하기 위한 본 발명의 다른 실시예에 따른 기술정보 추출방법은, 기술정보 추출장치가 특허 문서로부터 기술정보를 추출하는 방법에 있어서, 상기 특허 문서로부터 SAO(Subject-Action-Object)구조들을 추출하는 단계, 상기 추출된 SAO구조들의 AO구조들로부터 목적/효과를 추출하는 단계, 목적/효과를 의미하는 패턴에 기초하여, 상기 SAO구조들을 포함하는 문장들에서 목적/효과를 확장하는 단계를 포함한다.
바람직하게는, 상기 SAO구조들을 추출하는 단계는, 상기 특허 문서에서 기 정의된 기술대체용어들(S)을 포함하는 문장들을 추출하는 단계를 포함할 수 있다.
바람직하게는, 상기 SAO구조들을 추출하는 단계는, 기 정의된 기술 파라미터(Engineering parameters)에 근거하여, 상기 추출된 문장들에서 AO구조들을 추출하는 단계를 포함할 수 있다.
바람직하게는, 상기 AO구조들을 추출하는 단계는, 상기 기술 파라미터에 근거하여, 각 문장에서 제1 Object(O)를 추출하고, 상기 제1 Object(O)에 대응하는 제1 Action(A)을 추출하는 제1 추출단계, 각 문장에서 상기 제1 Action(A)에 대응하는 제2 Object(O)를 추출하는 제2 추출단계, 상기 제1 추출단계 및 제2 추출단계를 반복 수행하는 단계를 포함하되, 상기 반복 수행하는 단계는, 새로운 Action 또는 새로운 Object가 추출되지 않을 때까지 또는 기 설정된 일정 회수 반복 수행할 수 있다.
바람직하게는, 상기 AO구조들로부터 목적/효과를 추출하는 단계는, Action 타입에 근거하여 상기 AO구조들로부터 목적/효과를 추출하고, 상기 Action 타입에 근거하여 상기 AO구조들로부터 기술구성 또는 개발분야를 더 추출할 수 있다.
바람직하게는, 상기 패턴은, 동명사 형태의 Object, for 구문, to 구문, thus 구문 중 적어도 하나를 포함할 수 있다.
바람직하게는, 상기 목적/효과를 확장하는 단계는, 상기 문장들에서 상기 동명사 형태의 Object, for 구문, to 구문, thus 구문 중 적어도 하나의 패턴에 대응하는 구문을 추출하는 단계, 상기 추출된 구문에서 AO구조를 추출하는 단계, 상기 추출된 AO구조로부터 목적/효과를 추출하는 단계를 포함할 수 있다.
바람직하게는, 상기 목적/효과를 추출하는 단계는, 상기 SAO구조들의 Object(O)에 근거하여 상기 추출된 AO구조를 필터링하는 단계, 상기 필터링된 AO구조로부터 목적/효과를 추출하는 단계를 포함할 수 있다.
본 발명에 따르면, 특허문서에서 기술대체용어와 TRIZ의 Engineering parameters를 기반으로 Subject-Action-Object(SAO)를 추출함으로써, 의미있는 기술 정보를 가진 SAO set을 구축할 수 있다.
또한, 본 발명에 따르면, 특허문서에서 추출된 SAO 분석을 통해 기술개발의 목적 및 효과를 추출함은 물론, R프로그래밍을 통하여 Object 상세 분류, For/To 가 활용된 수식어구를 분석함으로써, 기술개발의 목적 및 효과에 대한 정보를 풍부하고 면밀하게 제공할 수 있다.
본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 기술정보 추출 시스템을 나타낸 도면이다.
도 2는 본 발명의 일 실시예에 따른 기술정보 추출장치의 구성을 개략적으로 나타낸 블록도이다.
도 3은 본 발명의 일 실시예에 따른 수집된 특허문서를 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른 분석대상 문장을 추출하는 방법을 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른 AO구조를 추출하는 방법을 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따른 Action 타입에 따른 기술정보를 설명하기 위한 도면이다.
도 7은 본 발명의 일 실시예에 따른 목적/효과를 확장하는 방법을 설명하기 위한 도면이다.
도 8은 본 발명의 일 실시예에 따른 목적/효과 추출결과를 설명하기 위한 도면이다.
도 9는 본 발명의 일 실시예에 따른 기술정보 추출장치가 기술정보를 추출하는 방법을 나타낸 흐름도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
본 명세서에 기재된 '목적/효과'는 기술 개발의 목적 및/또는 효과를 의미할 수 있다.
본 발명은 기술에 대한 정보가 기록된 문서로부터 SAO(Subject-Action-Object)구조들을 추출하고, 추출된 SAO구조들의 AO구조들로부터 기술내용, 개발분야, 기술개발의 목적/효과를 추출하고, 목적/효과를 의미하는 패턴에 기초하여, SAO구조들을 포함하는 문장들에서 목적/효과를 확장하는 것이다. 여기서, 기술에 대한 정보가 기록된 문서는 특허문서, 학술문헌 등을 포함하나, 본 실시예에서는 특허문서를 예로하여 설명하기로 한다.
이하에서는 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 기술정보 추출 시스템을 나타낸 도면이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 기술정보 추출 시스템은 분석대상이 되는 특허문서들이 저장된 특허 데이터베이스(200), 특허 데이터베이스(200)로부터 특허문서를 수집하여 기술정보를 추출하는 기술정보 추출장치(100)를 포함한다.
특허 데이터베이스(200)는 특허문서가 저장된 구성으로, 기술정보 추출 장치의 외부에 존재할 수 있다. 특허 데이터베이스(200)는 예컨대, KIPO(Korean Intellectual Property Office), USPTO(United States Patent and Trademark Office), EPO(European Patent Office) 등에 구비될 수 있다.
기술정보 추출장치(100)는 특허 데이터베이스(200)로부터 특허 문서를 수집하고, 수집된 문서로부터 SAO(Subject-Action-Object)구조들을 추출하며, 추출된 SAO구조들에 근거하여 의미있는 기술정보를 추출한다. 여기서, 기술정보는 기술구성, 개발분야, 개발의 목적 및/또는 효과(이하, '목적/효과'라 칭함)를 포함할 수 있다.
또한, 기술정보 추출장치(100)는 SAO구조들을 포함하는 문장들에서 목적/효과를 의미하는 패턴에 기초하여 목적/효과를 추가로 더 추출할 수 있다. 이를 통해, 다양한 관점의 기술 개발의 목적/효과에 대한 정보를 풍부하고 면밀하게 제공할 수 있다.
한편, 기술정보 추출장치(100)는 개인용 컴퓨터(예를 들어, 데스크탑 컴퓨터, 노트북 컴퓨터, 태블릿 컴퓨터, 팜톱 컴퓨터 등), 워크스테이션, PDA, 웹 패드, 이동 전화기 등과 같은 디지털 기기에 포함되거나 연결될 수 있을 것이다.
이러한 기술정보 추출장치(100)에 대한 상세한 설명은 도 2를 참조하기로 한다.
도 2는 본 발명의 일 실시예에 따른 기술정보 추출장치의 구성을 개략적으로 나타낸 블록도, 도 3은 본 발명의 일 실시예에 따른 수집된 특허문서를 설명하기 위한 도면, 도 4는 본 발명의 일 실시예에 따른 분석대상 문장을 추출하는 방법을 설명하기 위한 도면, 도 5는 본 발명의 일 실시예에 따른 AO구조를 추출하는 방법을 설명하기 위한 도면, 도 6은 본 발명의 일 실시예에 따른 Action 타입에 따른 기술정보를 설명하기 위한 도면, 도 7은 본 발명의 일 실시예에 따른 목적/효과를 확장하는 방법을 설명하기 위한 도면, 도 8은 본 발명의 일 실시예에 따른 목적/효과 추출결과를 설명하기 위한 도면이다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 기술정보 추출장치(100)는 특허문서 수집부(110), SAO 추출부(120), 기술정보 추출부(130), 목적/효과 확장부(140), 데이터베이스(150), 제어부(160)를 포함한다.
특허문서 수집부(110)는 특허 데이터베이스에서 특허문서를 검색하여 수집한 후 데이터베이스(150)에 저장한다. 즉, 특허문서 수집부(110)는 사용자 인터페이스를 통해 입력받은 키워드를 사용하여 특허 데이터베이스에서 특허문서를 검색하여 수집한 후 데이터베이스(150)에 저장한다.
또한, 특허문서 수집부(110)는 수집된 특허문서에서 명세서(Description) 부분을 추출한다. 여기서, 명세서 부분은 기술적 정보(예: 초록, 발명의 내용 등), 권리적 정보(예: 청구항)를 포함하는 발명의 내용을 제3자에게 공개하는 기술문헌임과 동시에 독점 배타적인 기술적 범위를 나타내는 권리서 즉, 해당 발명의 기술 설명서라고 할 수 있다. 이러한 명세서(description)에 대한 분석은 특허 내에서 해당 발명의 목적/효과를 파악하기에 가장 용이한 부분이라고 할 수 있다. 특허문서 수집부(110)는 데이터 구문분석 기법(data parsing technique)을 이용하여 특허문서로부터 명세서 부분을 추출할 수 있다. 구문분석 기법은 다양한 방식이 있을 수 있으며, 예를 들면, 낱말 분석(lexical analysis) 결과로 만들어진 토큰들을 문법에 따라 분석하는 파싱(parsing) 작업을 수행하여 파싱 트리를 구성하는 방식이 될 수 있다.
예컨대, 특허문서 수집부(110)는 특허문서로부터 도 3과 같은 Description 부분을 추출할 수 있다.
또한, 특허문서 수집부(110)는 수집된 특허문서를 포맷 변환하여 데이터베이스(150)에 저장할 수 있다. 포맷을 변환할 때, 특허문서들의 명세서 부분을 추출하여 텍스트 파일 형식으로 변환할 수 있다.
SAO 추출부(120)는 특허문서 수집부(110)에서 수집된 특허 문서로부터 SAO(Subject-Action-Object)구조들을 추출한다. 여기서, 'S'는 문장의 주어로서 해당 발명·기술 자체를 대변하는 키워드로, '기술대체용어'일 수 있다. AO구조는 'S(기술대체용어)'를 포함하는 문장에서 추출된 Action-Object일 수 있다.
SAO 추출부(120)는 분석 대상 문장 추출모듈(122), AO구조 추출모듈(124)을 포함한다.
분석대상 문장 추출모듈(122)은 특허 문서에서 기 정의된 기술대체용어들(S)을 포함하는 문장들을 추출한다. 여기서, 기술대체용어는 invention, Method, Disclosure 등과 같이 문장의 주어로서 해당 발명·기술 자체를 대변하는 키워드를 의미한다. 기술대체용어는 그 자체가 기술적, 제품적 특징을 나타내지 않기 때문에, 종래의 SAO 분석에서는 이를 좋은 결과물로써 활용하기 어렵다. 그러나, 키워드가 아닌 문장을 단위로 접근하였을 때, 기술대체용어를 포함한 문장은 해당 발명의 특징을 가장 잘 설명하고 있는 문장일 수 있다. 따라서, 특허문서에서 기술정보를 추출하기 위해, 분석대상 문장 추출모듈(122)은 기술대체용어를 포함하는 문장을 분석 대상 문장으로 추출할 수 있다.
예를 들어, 도 4와 같은 문장을 포함하는 특허문서의 경우, 분석대상 문장 추출모듈(122)은 기술대체용어인 "present disclosure"를 포함하는 문장(A)을 추출하고, 기술대체용어를 포함하지 않은 문장(B)은 추출하지 않는다.
한편, 기술대체용어는 기술대체용어 사전에 미리 등록된 키워드일 수 있다. 기술대체용어 사전의 기술대체용어들은 사용자가 직접 등록 또는 자동으로 등록될 수 있다.
AO구조 추출모듈(124)은 기 정의된 기술 파라미터(Engineering parameters)에 근거하여, 분석대상 문장 추출모듈(122)에서 추출된 문장들에서 AO구조들을 추출한다. 이때, 기술 파라미터는 예컨대, TRIZ의 39 Engineering parameters일 수 있으나, 이에 한정되는 것은 아니다. TRIZ는 Altshuller, G에 의해 개발된 창조적 문제해결 방법론으로서, 해결되어야 하는 공학적 변수들을 도 5의 (a)에 도시된 바와 같이 39개 Engineering parameters로 정의하고 있다. 따라서, AO구조 추출모듈(124)은 '공학적 변수에 대해 특허가 어떻게 대처하고 있는가'를 탐색하기 위하여, 39개 Engineering parameters를 토대로 Object와 Action을 추출할 수 있다.
한편, 특허문서는 작성자에 따라 다양한 키워드로 작성되므로, 39 Engineering parameters에 기초한 키워드와 동일(또는 유사)한 의미이나, 다른 키워드로 작성될 수 있다. 예컨대, 39 Engineering parameters에 기초한 'speed'의 경우, 작성자에 따라 'velocity', 'pace' 등으로 작성될 수 있다. 즉, 특허문서에는 TRIZ의 39 Engineering parameters에 기초하여 추출된 Object 또는 Action와 동일(또는 유사)한 의미이나 다른 키워드가 존재할 수 있다.
따라서, 의미있는 기술정보를 추출하기 위해서는 TRIZ의 39 Engineering parameters에 기초하여 추출된 Object 또는 Action와 동일한 의미이나 다른 키워드를 추출해야 한다. 이를 위해, AO구조 추출모듈(124)은 Object와 Action를 추출하는 동작을 반복 수행할 수 있다.
즉, AO구조 추출모듈(124)은 기술 파라미터에 근거하여, 각 문장에서 제1 Object(O)를 추출하고, 제1 Object(O)에 대응하는 제1 Action(A)을 추출하는 제1 추출동작을 수행한다. 그런 후, AO구조 추출모듈(124)은 각 문장에서 제1 Action(A)에 대응하는 제2 Object(O)를 추출하는 제2 추출동작을 수행한다. AO구조 추출모듈(124)은 이러한 제1 추출동작 및 제2 추출동작을 반복 수행한다. 이때, AO구조 추출모듈(124)은 새로운 Action 또는 새로운 Object가 추출되지 않을 때까지 또는 기 설정된 일정 회수 반복 수행할 수 있다. AO구조 추출모듈(124)은 Action과 Object를 추출하는 동작을 반복 수행함으로써, TRIZ의 39 Engineering parameters에 기초하여 추출된 Object 또는 Action와 동일(또는 유사)한 의미이나 다른 키워드를 추출할 수 있다.
AO구조 추출모듈(124)이 특정 특허문서로부터 Object와 Action을 추출하는 방법에 대해 도 5를 참조하여 설명하기로 한다. 도 5를 참조하면, AO구조 추출모듈(124)은 특정 특허 문서에서 (a)와 같은 TRIZ의 39 Engineering parameters에 기초하여 (b)와 같은 제1 Object(O)에 대응하는 제1 Action(A)를 추출한다. 예컨대, AO구조 추출모듈(124)은 (b)와 같이 Length(O)에 대응하는 Extend(A), Speed(O)에 대응하는 Enhance(A), Speed(O)에 대응하는Reduce(A)를 추출할 수 있다. 이때, (O)의 'O'는 Object를 의미하고, (A)의 'A'는 Action을 의미할 수 있다.
그런 후, AO구조 추출모듈(124)은 각 문장에서 제1 Action(A)에 대응하는 제2 Object(O)를 추출한다. 예컨대, AO구조 추출모듈(124)은 (c)와 같이 Extend(A)에 대응하는 Validity(O), Enhance(A)에 대응하는 Usability(O), Reduce(A)에 대응하는 Anxiety(O)를 추출할 수 있다. 그런 후, AO구조 추출모듈(124)은 (c)에서 추출된 제2 Object(O)인 Validity, Usability, Anxiety 각각에 대응하는 제2 Action(A)을 각각 추출할 수 있다. AO구조 추출모듈(124)은 상술한 동작을 새로운 Action 또는 새로운 Object가 추출되지 않을 때까지 또는 기 설정된 일정 회수 반복 수행할 수 있다.
상술한 SAO 추출부(120)는 기술대체용어들(S)을 포함하는 문장들로부터 의미있는 기술정보를 가진 SAO set을 구축할 수 있다.
기술정보 추출부(130)는 SAO 추출부(120)에서 추출된 SAO구조들의 AO구조들로부터 목적/효과를 추출한다. 이때, 기술정보 추출부(130)는 Action 타입에 근거하여 AO구조들로부터 목적/효과를 추출할 수 있다. 또한, 기술정보 추출부(130)는 Action 타입에 근거하여 AO구조들로부터 기술구성 또는 개발분야를 추출할 수 있다. Action 타입은 기술구성 타입, 개발분야 타입, 효과/목적 타입으로 나뉠 수 있다.
이하에서는 도 6을 참조하여 Action 타입에 따른 AO구조들에 대해 살펴보기로 한다. 기술구성 타입의 AO구조는 기술구성을 설명하는 동사(A)와 기술구성을 나타내는 명사(O)로 구성된다. 기술구성을 설명하는 동사는 예컨대, include, comprise, composed, provide, have, based on 등을 포함하나, 이에 한정되는 것은 아니다. 기술구성을 나타내는 명사(O)는 단순 명사형태일 수 있다.
개발분야 타입의 AO구조는 개발분야를 설명하는 동사와 개발분야를 나타내는 명사로 구성된다. 개발분야를 설명하는 동사는 예컨대, relate to, is, describe, present, disclose 등을 포함하나, 이에 한정되는 것은 아니다. 개발분야를 나타내는 명사(O)는 단순 명사형태일 수 있다.
목적/효과 타입의 AO구조는 목적/효과를 설명하는 동사와 목적/효과를 나타내는 명사로 구성된다. 목적/효과를 설명하는 동사는 예컨대, enable, interact, limit, control, allow, determine 등을 포함하나, 이제 한정되는 것은 아니다. 목적/효과를 나타내는 명사(O)는 단순 명사형태일 수 있다.
기술구성을 설명하는 동사, 개발분야를 설명하는 동사, 목적/효과를 설명하는 동사 각각은 사전으로 구축될 수 있다.
기술정보 추출부(130)는 기술구성 추출모듈(132), 개발분야 추출모듈(134), 목적/효과 추출모듈(136)을 포함한다.
기술구성 추출모듈(132)은 AO구조 추출모듈(124)에서 추출된 AO구조에서 Action 타입에 근거하여 Object를 '기술구성'으로 추출할 수 있다. 이때, 기술구성에 대한 Action은 예컨대, include, comprise, composed, provide, have, based on 등을 포함할 수 있다.
개발분야 추출모듈(134)은 AO구조 추출모듈(124)에서 추출된 AO구조에서 Action 타입에 근거하여 Object를 '개발분야'로 추출할 수 있다. 이때, 기술분야에 대한 Action은 예컨대, relate to, is, describe, present, disclose 등을 포함할 수 있다.
목적/효과 추출모듈(136)은 AO구조 추출모듈(124)에서 추출된 AO구조에서 Action 타입에 근거하여 Object를 '목적/효과'로 추출할 수 있다. 이때, 목적/효과에 대한 Action은 예컨대, enable, interact, limit, control, allow, determine 등을 포함할 수 있다.
한편, 특허 문서에는 기술구성, 개발분야, 목적/효과 각각을 설명하는 동사를 이용하여 기술구성, 개발분야, 목적/효과가 기재되어 있기도 하지만, 목적/효과를 의미하는 수식어구, 동명사 등을 이용하여 목적/효과가 기재되어 있기도 한다. 따라서, 목적/효과를 의미하는 수식어구, 동명사 등을 이용하여 기재된 목적/효과를 추출할 필요가 있다.
이에, 목적/효과 확장부(140)는 목적/효과를 의미하는 패턴에 기초하여, SAO 추출부(120)에서 추출된 SAO구조들을 포함하는 문장들에서 목적/효과를 확장한다. 이때, 목적/효과를 의미하는 패턴은 동명사 형태의 Object, for 구문, to 구문, thus 구문 등을 포함하나, 이에 한정하는 아니다. 동명사 형태의 Object는 '~ing + N(명사)'형태이고, for 구문은 'for+ ~ing + N(명사)'형태이며, to 구문은 'to+V(동사)+ N(명사)'형태이고, thus 구문은 'thus+ ~ing + N(명사)'형태일 수 있다.
목적/효과 확장부(140)는 SAO구조들을 포함하는 문장들에서 동명사 형태의 Object, for 구문, to 구문, thus 구문 등의 패턴에 매칭되는 구문을 추출하고, 추출된 구문에서 AO구조를 추출한다. 그런 후, 목적/효과 확장부(140)는 추출된 AO구조로부터 목적/효과를 추출한다.
목적/효과를 확장하는 방법에 대해 도 7을 참조하여 설명하기로 한다.
도 7을 참조하면, 동명사 형태의 Object('~ing + N(명사))에서는 '~ing'에서 'A'를 추출하고, 'N'를 'O'로 추출한다. 예를 들어, "The method includes detecting a touch gesture"의 경우, 'detecting + touch gesture'를 추출하고, 'detecting'에서 "detect"를 A로 추출하고, "touch gesture"를 O로 추출할 수 있다. 또한, 'for+ ~ing + N(명사)'에서는 '~ing'에서 A를 추출하고, N를 O로 추출할 수 있다. 또한, 'to+V(동사)+ N(명사)'에서는 'V'를 A로 추출하고, N를 O로 추출할 수 있다. 또한, 'thus+ ~ing + N(명사)'에서는 '~ing'에서 A를 추출하고, N를 O로 추출할 수 있다.
한편, 목적/효과를 의미하는 패턴에 기초하여 AO구조들을 추출하면, 추출된 AO구조들 중에서 목적/효과를 의미하지 않은 AO구조가 존재할 수 있다. 이러한 노이즈를 제거하기 위해, 목적/효과 확장부(140)는 Object(O)를 SAO구조들의 Object(O)로 한정하여, AO구조들을 추출할 수 있다.
목적/효과 확장부(140)는 SAO구조들의 Object(O)에 근거하여 목적/효과를 의미하는 패턴에 기초하여 추출된 AO구조를 필터링하고, 필터링된 AO구조로부터 목적/효과를 추출한다. 즉, 목적/효과 확장부(140)는 목적/효과를 의미하는 패턴에 기초하여 추출된 AO구조들 중에서 SAO구조들의 Object(O)가 아닌 Object(O)를 포함하는 AO구조들을 제거할 수 있다.
이처럼 목적/효과 확장부(140)를 통해 목적/효과를 확장시키면, 종래 SAO 추출을 통해 추출된 목적/효과보다 3배 정도를 더 많은 목적/효과를 추출할 수 있다.
예를 들면, 도 8을 참조하면, "service" 관련 목적/효과를 검색한 경우, 종래 SAO 추출결과는 (a)와 같으나, 목적/효과를 의미하는 패턴을 활용한 경우 (b)와 같은 목적/효과를 추출할 수 있다.
전술한 바와 같이, 목적/효과 확장부(140)는 종래 특허 분석에서 활용되었던 SAO 추출의 한계점을 극복하고자 R 프로그래밍을 통하여 Object 상세 분류, For/To 가 활용된 수식어구를 분석함으로써, 기술개발의 목적/효과에 대한 정보를 풍부하고 면밀하게 제공할 수 있다.
제어부(160)는 기술정보 추출장치(100)의 다양한 구성부들의 동작을 제어한다.
한편, 본 발명에 따른 기술정보 추출 장치는 기술정보 추출을 위한 프로그램 또는 애플리케이션이 저장된 저장부(미도시)를 더 포함할 수 있다. 또한, 저장부는 기술정보 추출과 관련된 다양한 알고리즘들을 저장할 수 있다. 이러한 경우, 제어부(160)는 저장부를 호출하여 필요한 알고리즘을 획득할 수 있다.
본 발명의 일 실시예에 따르면, 특허문서 수집부(110), SAO 추출부(120), 기술정보 추출부(130), 목적/효과 확장부(140)는 그 중 적어도 일부가 외부 단말 장치나 외부 서버 등과 통신하는 프로그램 모듈들일 수 있다. 이러한 프로그램 모듈들은 운영 시스템, 응용 프로그램 모듈 및 기타 프로그램 모듈로서 기술정보 추출장치(100)에 포함될 수 있으며, 물리적으로는 여러 가지 공지의 기억 장치상에 저장될 수 있다. 또한, 이러한 프로그램 모듈들은 기술정보 추출장치(100)와 통신 가능한 원격 기억 장치에 저장될 수도 있다. 한편, 이러한 프로그램 모듈들은 본 발명에 따라 전술한 특정 동작을 수행하거나 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포괄하지만, 이에 제한되지는 않는다.
도 9는 본 발명의 일 실시예에 따른 기술정보 추출장치가 기술정보를 추출하는 방법을 나타낸 흐름도이다.
도 9를 참조하면, 기술정보 추출장치는 특허 문서를 수집하고(S910), 수집된 특허 문서에서 기 정의된 기술대체용어들을 포함하는 문장들을 추출한다(S920). 이때, 기술대체용어는 'S(Subject)'를 나타낸다.
단계 S920의 수행 후, 기술정보 추출장치는 기 정의된 기술 파라미터에 근거하여, 상기 추출된 문장들에서 AO구조들을 추출한다(S930). 이때, 기술정보 추출 장치는 새로운 Action 또는 새로운 Object가 추출되지 않을 때까지 또는 기 설정된 일정 회수만큼 각 문장에서 Object와 Action를 추출하는 동작을 반복 수행할 수 있다.
단계 S930이 수행되면, 기술정보 추출장치는 추출된 AO구조들의 Action 타입에 근거하여 기술정보를 추출한다(S940). 즉, 기술정보 추출장치는 Action 타입에 근거하여 AO구조들로부터 기술구성, 개발분야, 목적/효과를 추출할 수 있다.
단계 S940이 수행되면, 기술정보 추출장치는 목적/효과를 의미하는 패턴에 기초하여, 상기 SAO구조들을 포함하는 문장들에서 목적/효과를 확장한다(S950). 즉, 기술정보 추출장치는 SAO구조들을 포함하는 문장들에서 동명사 형태의 Object, for 구문, to 구문, thus 구문 등의 패턴에 매칭되는 구문을 추출하고, 추출된 구문에서 AO구조를 추출한다. 그런 후, 기술정보 추출장치는 추출된 AO구조로부터 목적/효과를 추출한다. 이때, 기술정보 추출장치는 노이즈를 제거하기 위해, Object(O)를 SAO구조들의 Object(O)로 한정하여 목적/효과를 추출할 수 있다. 즉, 기술정보 추출장치는 SAO구조들의 Object(O)에 근거하여 목적/효과를 의미하는 패턴에 기초하여 추출된 AO구조를 필터링하고, 필터링된 AO구조로부터 목적/효과를 추출할 수 있다.
상기의 과정을 통해, 기술정보 추출장치는 다양한 관점에서 기술개발의 목적 및/또는 효과를 파악할 수 있고, 이를 통해 폭넓은 분야의 기술 기회를 탐색할 수 있다.
또한, 본 발명에 따른 기술정보 추출장치는 관심 기술개발 목적/효과에 근거하여 기술구성 및 개발분야에 대한 유망성을 평가할 수 있다.
또한, 본 발명에 따른 기술정보 추출장치는 기술개발의 목적/효과에 근거하여 기술기회를 탐색함으로써, 기존 기술을 적용할 수 있는 새로운 분야를 찾거나 신기술을 예측할 수 있다.
또한, 본 발명에 따른 기술정보 추출 장치는 기술적 관점뿐만 아니라 사용자 관점에서의 기술효과와 목적을 도출할 수 있으므로, 다양한 기술 기회를 탐색할 수 있도록 할 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
100 : 기술정보 추출장치
110 : 특허문서 수집부
120 : SAO 추출부
130 : 기술정보 추출부
140 : 목적/효과 확장부
150 : 데이터베이스
160 : 제어부
200 : 특허 데이터베이스

Claims (16)

  1. 특허 문서로부터 SAO(Subject-Action-Object)구조들을 추출하는 SAO 추출부;
    상기 추출된 SAO구조들의 AO구조들로부터 목적/효과를 추출하는 기술정보 추출부; 및
    목적/효과를 의미하는 패턴에 기초하여, 상기 SAO구조들을 포함하는 문장들에서 목적/효과를 확장하는 목적/효과 확장부;
    를 포함하는 기술정보 추출장치.
  2. 제1항에 있어서,
    상기 SAO 추출부는,
    상기 특허 문서에서 기 정의된 기술대체용어들(S)을 포함하는 문장들을 추출하는 분석대상 문장 추출모듈을 포함하는 것을 특징으로 하는 기술정보 추출장치.
  3. 제2항에 있어서,
    상기 SAO 추출부는,
    기 정의된 기술 파라미터(Engineering parameters)에 근거하여, 상기 추출된 문장들에서 AO구조들을 추출하는 AO구조 추출모듈을 포함하는 것을 특징으로 하는 기술정보 추출장치.
  4. 제3항에 있어서,
    상기 AO구조 추출모듈은,
    상기 기술 파라미터에 근거하여, 각 문장에서 제1 Object(O)를 추출하고, 상기 제1 Object(O)에 대응하는 제1 Action(A)을 추출하는 제1 추출동작을 수행한 후, 각 문장에서 상기 제1 Action(A)에 대응하는 제2 Object(O)를 추출하는 제2 추출동작을 수행하며, 상기 제1 추출동작 및 제2 추출동작을 반복 수행하되,
    새로운 Action 또는 새로운 Object가 추출되지 않을 때까지 또는 기 설정된 일정 회수 반복 수행하는 것을 특징으로 하는 기술정보 추출장치.
  5. 제1항에 있어서,
    상기 기술정보 추출부는,
    Action 타입에 근거하여 상기 AO구조들로부터 목적/효과를 추출하고,
    상기 Action 타입에 근거하여 상기 AO구조들로부터 기술구성 또는 개발분야를 더 추출하는 것을 특징으로 하는 기술정보 추출장치.
  6. 제1항에 있어서,
    상기 패턴은,
    동명사 형태의 Object, for 구문, to 구문, thus 구문 중 적어도 하나를 포함하는 것을 특징으로 하는 기술정보 추출장치.
  7. 제6항에 있어서,
    상기 목적/효과 확장부는,
    상기 문장들에서 상기 동명사 형태의 Object, for 구문, to 구문, thus 구문 중 적어도 하나의 패턴에 대응하는 구문을 추출하고, 상기 추출된 구문에서 AO구조를 추출하며, 상기 추출된 AO구조로부터 목적/효과를 추출하는 것을 특징으로 하는 기술정보 추출장치.
  8. 제7항에 있어서,
    상기 목적/효과 확장부는,
    상기 SAO구조들의 Object(O)에 근거하여 상기 추출된 AO구조를 필터링하고, 상기 필터링된 AO구조로부터 목적/효과를 추출하는 것을 특징으로 하는 기술정보 추출장치.
  9. 기술정보 추출장치가 특허 문서로부터 기술정보를 추출하는 방법에 있어서,
    상기 특허 문서로부터 SAO(Subject-Action-Object)구조들을 추출하는 단계;
    상기 추출된 SAO구조들의 AO구조들로부터 목적/효과를 추출하는 단계; 및
    목적/효과를 의미하는 패턴에 기초하여, 상기 SAO구조들을 포함하는 문장들에서 목적/효과를 확장하는 단계;
    를 포함하는 기술정보 추출방법.
  10. 제9항에 있어서,
    상기 SAO구조들을 추출하는 단계는,
    상기 특허 문서에서 기 정의된 기술대체용어들(S)을 포함하는 문장들을 추출하는 단계를 포함하는 것을 특징으로 하는 기술정보 추출방법.
  11. 제10항에 있어서,
    상기 SAO구조들을 추출하는 단계는,
    기 정의된 기술 파라미터(Engineering parameters)에 근거하여, 상기 추출된 문장들에서 AO구조들을 추출하는 단계를 포함하는 것을 특징으로 하는 기술정보 추출방법.
  12. 제11항에 있어서,
    상기 AO구조들을 추출하는 단계는,
    상기 기술 파라미터에 근거하여, 각 문장에서 제1 Object(O)를 추출하고, 상기 제1 Object(O)에 대응하는 제1 Action(A)을 추출하는 제1 추출단계;
    각 문장에서 상기 제1 Action(A)에 대응하는 제2 Object(O)를 추출하는 제2 추출단계; 및
    상기 제1 추출단계 및 제2 추출단계를 반복 수행하는 단계를 포함하되,
    상기 반복 수행하는 단계는, 새로운 Action 또는 새로운 Object가 추출되지 않을 때까지 또는 기 설정된 일정 회수 반복 수행하는 것을 특징으로 하는 기술정보 추출방법.
  13. 제9항에 있어서,
    상기 AO구조들로부터 목적/효과를 추출하는 단계는,
    Action 타입에 근거하여 상기 AO구조들로부터 목적/효과를 추출하고,
    상기 Action 타입에 근거하여 상기 AO구조들로부터 기술구성 또는 개발분야를 더 추출하는 것을 특징으로 하는 기술정보 추출방법.
  14. 제9항에 있어서,
    상기 패턴은,
    동명사 형태의 Object, for 구문, to 구문, thus 구문 중 적어도 하나를 포함하는 것을 특징으로 하는 기술정보 추출방법.
  15. 제14항에 있어서,
    상기 목적/효과를 확장하는 단계는,
    상기 문장들에서 상기 동명사 형태의 Object, for 구문, to 구문, thus 구문 중 적어도 하나의 패턴에 대응하는 구문을 추출하는 단계;
    상기 추출된 구문에서 AO구조를 추출하는 단계; 및
    상기 추출된 AO구조로부터 목적/효과를 추출하는 단계를 포함하는 것을 특징으로 하는 기술정보 추출방법.
  16. 제15항에 있어서,
    상기 목적/효과를 추출하는 단계는,
    상기 SAO구조들의 Object(O)에 근거하여 상기 추출된 AO구조를 필터링하는 단계; 및
    상기 필터링된 AO구조로부터 목적/효과를 추출하는 단계를 포함하는 것을 특징으로 하는 기술정보 추출방법.









KR1020170145781A 2017-11-03 2017-11-03 기술정보 추출장치 및 방법 KR102546476B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170145781A KR102546476B1 (ko) 2017-11-03 2017-11-03 기술정보 추출장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170145781A KR102546476B1 (ko) 2017-11-03 2017-11-03 기술정보 추출장치 및 방법

Publications (2)

Publication Number Publication Date
KR20190050406A true KR20190050406A (ko) 2019-05-13
KR102546476B1 KR102546476B1 (ko) 2023-06-27

Family

ID=66581902

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170145781A KR102546476B1 (ko) 2017-11-03 2017-11-03 기술정보 추출장치 및 방법

Country Status (1)

Country Link
KR (1) KR102546476B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120122588A (ko) * 2011-04-29 2012-11-07 포항공과대학교 산학협력단 특허지도 생성 시스템 및 그 방법
KR20120123781A (ko) * 2011-05-02 2012-11-12 서울대학교산학협력단 의미기반 특허 청구항 분석에 기반한 특허 침해 판단 장치 및 그 방법
KR20130013510A (ko) * 2011-07-28 2013-02-06 포항공과대학교 산학협력단 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템 및 이를 이용한 특허 네트워크 분석 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120122588A (ko) * 2011-04-29 2012-11-07 포항공과대학교 산학협력단 특허지도 생성 시스템 및 그 방법
KR20120123781A (ko) * 2011-05-02 2012-11-12 서울대학교산학협력단 의미기반 특허 청구항 분석에 기반한 특허 침해 판단 장치 및 그 방법
KR20130013510A (ko) * 2011-07-28 2013-02-06 포항공과대학교 산학협력단 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템 및 이를 이용한 특허 네트워크 분석 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
최성철 et al. "기술로드맵핑을 위한 특허정보의 SAO 기반 텍스트 마이닝 접근 방법." 기술혁신연구 20.1 (2012): 199-234.* *

Also Published As

Publication number Publication date
KR102546476B1 (ko) 2023-06-27

Similar Documents

Publication Publication Date Title
KR102123974B1 (ko) 유사 특허 검색 서비스 시스템 및 방법
Sintoris et al. Extracting business process models using natural language processing (NLP) techniques
Efstathiou et al. Semantic source code models using identifier embeddings
Luciv et al. Detecting near duplicates in software documentation
CN101529418A (zh) 用于获取、分析和挖掘数据和信息的系统和方法
CN104298683A (zh) 主题挖掘方法和设备、以及查询扩展方法和设备
Kamalabalan et al. Tool support for traceability of software artefacts
Papanikolaou et al. Protest event analysis: A longitudinal analysis for Greece
Nazir et al. Authorship attribution for a resource poor language—Urdu
KR101476225B1 (ko) 자연어 및 수식 색인화 방법과 그를 위한 장치 및 컴퓨터로 읽을 수 있는 기록매체
CN104298676A (zh) 主题挖掘方法和设备、以及查询扩展方法和设备
JP2013101679A (ja) テキストセグメンテーション装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体
KR102519955B1 (ko) 토픽 키워드의 추출 장치 및 방법
CN108614821B (zh) 地质资料互联互查系统
JP4148247B2 (ja) 語彙獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
KR20190050406A (ko) 기술정보 추출장치 및 방법
JP4877930B2 (ja) 文書処理装置及び文書処理方法
Zhu et al. A N-gram based approach to auto-extracting topics from research articles1
KR100862565B1 (ko) 사용자 맞춤형 특허정보 데이터베이스 구축시스템
RU2758683C2 (ru) Система и способ аугментации обучающей выборки для алгоритмов машинного обучения
KR100504632B1 (ko) 비구조 문서에서 사용자가 요구하는 정보를 추출하는 장치및 그 방법
KR100659370B1 (ko) 시소러스 매칭에 의한 문서 db 형성 방법 및 정보검색방법
Uddin et al. Information and relation extraction for semantic annotation of ebook texts
De Virgilio et al. A reverse engineering approach for automatic annotation of Web pages
Rybak et al. Machine learning-enhanced text mining as a support tool for research on climate change: theoretical and technical considerations

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)