KR102029916B1 - Intellectual property right document based bigdata analyzing method for design material search - Google Patents

Intellectual property right document based bigdata analyzing method for design material search Download PDF

Info

Publication number
KR102029916B1
KR102029916B1 KR1020180037216A KR20180037216A KR102029916B1 KR 102029916 B1 KR102029916 B1 KR 102029916B1 KR 1020180037216 A KR1020180037216 A KR 1020180037216A KR 20180037216 A KR20180037216 A KR 20180037216A KR 102029916 B1 KR102029916 B1 KR 102029916B1
Authority
KR
South Korea
Prior art keywords
keyword
intellectual property
documents
technology
document
Prior art date
Application number
KR1020180037216A
Other languages
Korean (ko)
Inventor
최승욱
최지민
반지훈
하종은
조성현
김하경
Original Assignee
주식회사 디 파트너스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 디 파트너스 filed Critical 주식회사 디 파트너스
Priority to KR1020180037216A priority Critical patent/KR102029916B1/en
Application granted granted Critical
Publication of KR102029916B1 publication Critical patent/KR102029916B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services; Handling legal documents
    • G06Q50/184Intellectual property management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/11Patent retrieval

Abstract

The present invention provides a computer implemented method for design material search and analysis based on intellectual property right (IPR) documents, comprising: a step of conducting search in an IPR document database (DB) by using received keywords after receiving the at least two keywords among a material keyword, a technology keyword and an emotion keyword; a step of conducting data mining of documents in a search collection group, which are collected by the search, and acquiring material-technology related IPR documents in which association is evaluated to exist between the material keyword and the technology keyword according to a fixed criterion; a step of conducting opinion mining of the documents in the search collection group, which are collected by the search, and acquiring material-emotion related IPR documents in which association is evaluated to exist between the material keyword and the emotion keyword according to the fixed criterion; a step of acquiring material-technology-emotion related IPR documents corresponding to intersection of the material-technology related IPR documents and the material-emotion related IPR documents; and a step of generating a material-technology-emotion matrix DB in which the acquired material-technology-emotion related IPR documents are structured into a matrix shape according to the material keyword, the technology keyword and the emotion keyword. Therefore, the computer implemented method can be actively utilized in developing a product and a new material for improvement of emotional quality of design.

Description

디자인 소재 검색을 위한 지식재산권 문서 기반의 빅데이터 분석 방법{INTELLECTUAL PROPERTY RIGHT DOCUMENT BASED BIGDATA ANALYZING METHOD FOR DESIGN MATERIAL SEARCH} INTELLECTUAL PROPERTY RIGHT DOCUMENT BASED BIGDATA ANALYZING METHOD FOR DESIGN MATERIAL SEARCH}

본 발명은 빅데이터 분석 방법에 관련된 것으로서 보다 구체적으로는 디자인 소재 검색을 위한 지식재산권(특허/디자인) 문서 기반의 빅데이터 분석 방법에 관한 것이다.
The present invention relates to a big data analysis method, and more particularly, to a big data analysis method based on intellectual property (patent / design) document for design material search.

최근 디자인 혁신에 있어서 창의적인 소재, 표면 처리 등 감성 품질의 중요성이 대두되고 있다. 소재의 활용 및 응용에 대한 창의적인 아이디어를 구체화하는 디자인의 역할이 점점 증가하고 있기 때문이다. 이와 같은 관점에서 최근 글로벌 기업, 선도 기업들은 신제품을 출시할 때마다 디자인 외형은 물론 컬러, 소재, 공법 등의 차별화 전략으로 제품 경쟁력을 강화시키고 있다.Recently, the importance of emotional quality, such as creative materials, surface treatment, has emerged in the design innovation. This is because design plays an increasing role in shaping creative ideas about the application and application of materials. In this regard, global companies and leading companies are reinforcing their product competitiveness with differentiated strategies such as design, color, material, and method every time they launch new products.

반면 국내 대다수의 중소기업들은 이에 관한 정보 부재, R&D 역량 부족, 디자인 완성도에 대한 중요성 인식 부족으로 기존 제품들과 차별화된 경쟁력 있는 제품을 디자인 및 제조하는데 어려움을 겪고 있다. 그러나 이는 단순히 국내 중소기업들의 인적/자산적/기술적 역량 부족에만 기인하고 있는 것은 아니며, 디자인 방법론적인 한계 및 기술 전문성의 한계에서도 비롯된다.On the other hand, most of SMEs in Korea are having difficulty in designing and manufacturing competitive products that are differentiated from existing products due to lack of information, lack of R & D capability, and lack of awareness of design completion. However, this is not only due to the lack of human, asset and technical capacity of domestic SMEs, but also from the limitations of design methodology and technical expertise.

예컨대, 기존의 디자인 방법론으로서 CMF에 관한 연구는 대부분 색상(Color) 영역에 집중되어 있어, 새로운 소재(Material), 공법(Methods), 마감(Finishing) 등에 대한 요소를 도출하는데 한계가 있었다. 이를 개선하기 위한 방법론 중에 하나로서 선행 지식재산권 문서(특허/디자인)를 통해서 신규 소재/공법/마감 등에 관한 정보를 획득하려는 노력도 있어 왔으나, 이는 기술 전문가 또는 특허 전문가에 의한 숙련된 검색 노하우가 필요하였으며, 또한 기술적 관점에서의 검색만이 주를 이루고 있어 해당 디자인 요소에 관한 감성 품질 관점에서의 검색에는 어려움이 있어왔다.For example, research on CMF as a conventional design methodology is mostly concentrated in the color area, and thus there is a limit in deriving elements for new materials, methods, and finishing. As one of the methodologies to improve this, there have been efforts to obtain information on new materials, processes, and finishes through advanced intellectual property documents (patents / designs), but this requires skilled search know-how by technical experts or patent experts. In addition, since only the search from a technical point of view is dominant, there has been a difficulty in searching from an emotional quality point of view for the corresponding design element.

따라서 디자인 요소로서 MMF(Material / Methods / Finishing) 디자인 과정에서 감성 품질을 동시에 향상시킬 수 있으면서도, 관련 특허기술, 디자인 원천 데이터를 특허 전문가의 관점이 아닌 일반 연구원 또는 디자이너의 관점에서 데이터베이스화하고 이를 보다 쉽게 확인 및 활용할 수 있도록 하는 분석 방법론의 개발이 절실히 요구된다.
As a design element, it is possible to simultaneously improve the emotional quality in the MMF (Material / Methods / Finishing) design process, while the related patent technology and design source data are databased from the point of view of the general researcher or designer, not from the point of view of the patent expert. There is an urgent need for the development of analytical methodologies that can be easily identified and utilized.

본 발명은 지식재산권(특허/디자인) 문서 기반의 빅데이터 검색 및 분석을 활용하여 산업/제품 디자인 과정에서 디자이너 또는 연구원에 필요한 소재(material) 정보를 보다 쉽게 획득할 수 있도록 함으로써, 디자인의 감성 품질 향상을 위한 제품 및 신소재 개발에 적극 활용할 수 있도록 하기 위한 것이다.
The present invention utilizes big data retrieval and analysis based on intellectual property (patent / design) documents to make it easier to obtain material information required for designers or researchers in the industrial / product design process. It is intended to be actively utilized in developing products and new materials for improvement.

본 발명의 일 측면에 따르면, 지식재산권 문서 기반의 디자인 소재 검색 및 분석에 관한 컴퓨터 구현 방법(Computer implemented Method)로서,According to an aspect of the present invention, as a computer implemented method (Computer implemented method) for searching and analyzing design material based on intellectual property document,

소재 키워드, 기술 키워드, 감성 키워드 중 적어도 2개의 키워드가 수신됨에 따라, 수신된 키워드를 이용하여 지식재산권 문서 DB(Database)에서 검색을 수행하는 단계-여기서, 상기 소재 키워드는 소재(material)의 명칭을 나타내는 키워드이고, 상기 기술 키워드는 소재의 재질적 속성에 따라 결정되는 기능적 특징(예를 들어, 해당 소재의 재질에 따른 물성과 관련된 물리적, 화학적, 생물학적, 전기적 특징 등)을 표현하는 키워드이며, 상기 감성 키워드는 소재의 재질적 속성에 따라 발현되는 외관적 특징(예를 들어, 표면 특징, 컬러 특징, 인지적/직관적/감성적 특징 등)을 표현하는 키워드임-;In response to receiving at least two keywords of a material keyword, a technology keyword, and an emotional keyword, performing a search in the intellectual property document DB using the received keyword—wherein the material keyword is a name of a material. The technical keyword is a keyword for expressing a functional characteristic (for example, physical, chemical, biological, electrical, etc. related to physical properties of the material of the material) determined by the material property of the material, The emotional keyword is a keyword expressing an external feature (eg, surface feature, color feature, cognitive / intuitive / emotional feature, etc.) expressed according to the material property of the material;

상기 검색을 통해 수집된 검색 모집단 내의 문서들을 대상으로 데이터 마이닝을 수행하여, 소정 기준에 따라 소재 키워드와 기술 키워드 간의 연관도가 존재하는 것으로 평가되는 소재-기술 연관 지식재산권 문서들을 획득하는 단계; Performing data mining on documents in the search population collected through the search to obtain material-technical related intellectual property documents which are evaluated to have an association between a material keyword and a technology keyword according to a predetermined criterion;

상기 검색을 통해 수집된 검색 모집단 내의 문서들을 대상으로 오피니언 마이닝을 수행하여, 소정 기준에 따라 소재 키워드와 감성 키워드 간의 연관도가 존재하는 것으로 평가되는 소재-감성 연관 지식재산권 문서들을 획득하는 단계;Performing opinion mining on the documents in the search population collected through the search to obtain material-emotional-related intellectual property documents which are evaluated to have an association between the material keyword and the emotional keyword according to a predetermined criterion;

상기 소재-기술 연관 지식재산권 문서들과 상기 소재-감성 연관 지식재산권 문서들의 교집합에 해당하는 소재-기술-감성 연관 지식재산권 문서들을 획득하는 단계; Obtaining a material-technology-emotional associated intellectual property document corresponding to an intersection of the material-technical intellectual property documents and the material-emotional associated intellectual property documents;

상기 획득된 소재-기술-감성 연관 지식재산권 문서들을 소재 키워드, 기술 키워드, 감성 키워드에 따라 매트릭스 형태로 구조화한 소재-기술-감성 매트릭스 DB를 생성하는 단계를 포함하는 컴퓨터 구현 방법이 제공된다.
A computer-implemented method is provided that includes generating the material-technology-emotional matrix DB structured in the form of a matrix according to the material keyword, technology keyword, and emotional keyword.

본 발명의 실시예에 의하면, 지식재산권(특허/디자인) 문서 기반의 빅데이터 검색 및 분석을 활용하여 산업/제품 디자인 과정에서 디자이너 또는 연구원에 필요한 소재(material) 정보를 보다 쉽게 획득할 수 있도록 함으로써, 디자인의 감성 품질 향상을 위한 제품 및 신소재 개발에 적극 활용할 수 있는 효과가 있다.According to an embodiment of the present invention, by using big data retrieval and analysis based on intellectual property (patent / design) document, it is possible to more easily obtain the material information required for designers or researchers in the industrial / product design process In addition, it has an effect that can be actively utilized in the development of products and new materials for improving the emotional quality of design.

또한 본 발명의 실시예에 따른 방법론에 의하면, 기술(기능)적 요소와 감성적 요소를 융합한 신소재 기획 및 개발의 효율성을 제고할 수 있고, 소재 감성 기술의 상용화를 위한 실질적인 검색 및 분석 모델을 제공할 수 있으며, 대상 소재의 감성 품질 진단 및 개선 전략 수립에 활용할 수 있어, 기업의 입장에서는 소비자와의 접점에서 활용 가능한 소재 감성 품질의 향상을 통해 개발 제품의 매출 증대 효과를 기대할 수 있다.
In addition, according to the methodology according to the embodiment of the present invention, it is possible to improve the efficiency of new material planning and development that combines technical (functional) elements and emotional elements, and provides a practical search and analysis model for commercialization of material sensitivity technology It can be used for diagnosing emotional quality of target materials and establishing improvement strategies. For companies, it is expected to increase sales of developed products by improving the quality of emotional materials available at the point of contact with consumers.

도 1은 본 발명의 실시예에 따른 디자인 소재 검색을 위한 지식재산권 문서 기반의 빅데이터 분석 방법을 전반적으로 도시한 도면.
도 2는 본 발명의 분석 방법에 원리적으로 도입된 데이터 마이닝 방법론 중 하나로서 문맥창(context window)의 기본 원리를 설명하기 위한 참조 도면.
도 3은 본 발명의 분석 방법에 원리적으로 도입된 데이터 마이닝 방법론 중 하나로서 동시 출현 빈도(Co-Occurrence)의 기본 원리를 설명하기 위한 참조 도면.
도 4 및 도 5는 본 발명의 분석 방법에 원리적으로 도입된 오피니언 마이닝 방법론 중 하나로서 워드넷(Wordnet) 및 이의 확장 버전(senti-Wordnet)의 기본 원리를 설명하기 위한 참조 도면.
도 6은 본 발명의 분석 방법에 의할 때 소재-기술 연관의 지식재산권 문서 및 마이닝 데이터를 획득하기 위한 일 실시예의 방식을 나타낸 도면.
도 7은 본 발명의 분석 방법에 의할 때 소재-감성 연관의 지식재산권 문서 및 마이닝 데이터를 획득하기 위한 일 실시예의 방식을 나타낸 도면.
도 8은 본 발명의 분석 방법에 의할 때 소재-기술-감성 연관의 지식재산권 문서 및 마이닝 데이터를 획득하기 위한 일 실시예의 방식을 나타낸 도면.
도 9는 소재-기술-감성 연관의 마이닝 데이터를 매트릭스화하였을 때 기술적 효과를 분산시켜 매트릭스 상에 표현한 가변 매트릭스 구조의 일 예.
도 10은 기술 효과 및 감성 효과 매트릭스 검색에 따라 획득된 소재 관련 유효 특허의 예시.
도 11 ~ 도 15는 일반적인 특허검색방식과 본 발명에 따른 방식(AMD : Advanced Design Material Discovery) 간을 비교한 비교 결과를 예시한 도면.
1 is a view generally showing a big data analysis method based on intellectual property documents for design material search according to an embodiment of the present invention.
2 is a reference diagram for explaining the basic principle of a context window as one of the data mining methodologies introduced in principle in the analysis method of the present invention;
3 is a reference diagram for explaining the basic principle of co-occurrence as one of the data mining methodologies introduced in principle in the analysis method of the present invention.
4 and 5 are reference drawings for explaining the basic principle of Wordnet and its extended version (Senti-Wordnet) as one of opinion mining methodologies introduced in principle in the analysis method of the present invention.
Figure 6 illustrates an embodiment of a method for obtaining mining data and intellectual property documents of a work-technology association according to the analysis method of the present invention.
7 illustrates an embodiment of a method for obtaining mining data and intellectual property documents of a material-emotional association according to the analysis method of the present invention.
8 illustrates an embodiment of a method for obtaining mining data and intellectual property documents of material-technology-emotional association according to the analytical method of the present invention.
9 is an example of a variable matrix structure in which a technical effect is distributed and expressed on a matrix when mining data of a material-technology-emotional relation is matrixed.
10 is an illustration of a valid patent relating to a material obtained according to a technical effect and emotional effect matrix search.
11 to 15 are views illustrating a comparison result between a general patent search method and the method according to the present invention (AMD: Advanced Design Material Discovery).

본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.As the invention allows for various changes and numerous embodiments, particular embodiments will be illustrated in the drawings and described in detail in the written description. However, this is not intended to limit the present invention to specific embodiments, it should be understood to include all transformations, equivalents, and substitutes included in the spirit and scope of the present invention.

본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 본 명세서의 설명 과정에서 이용되는 숫자(예를 들어, 제1, 제2 등)는 하나의 구성요소를 다른 구성요소와 구분하기 위한 식별기호에 불과하다. 또한, 명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.In describing the present invention, when it is determined that the detailed description of the related known technology may unnecessarily obscure the subject matter of the present invention, the detailed description thereof will be omitted. In addition, numerals (eg, first, second, etc.) used in the description process of the present specification are merely identification symbols for distinguishing one component from another component. In addition, throughout the specification, when a part is said to "include" a certain component, it means that it may further include other components, without excluding the other components unless otherwise stated.

이하, 첨부된 도면들을 참조하여 본 발명의 실시예를 상세히 설명한다.
Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 실시예에 따른 디자인 소재 검색을 위한 지식재산권 문서 기반의 빅데이터 분석 방법을 전반적으로 도시한 도면이다. 도 1을 참조하여 본 발명의 실시예에 따른 분석 방법의 전반적인 프로세스를 설명하면 다음과 같다.FIG. 1 is a diagram generally illustrating a big data analysis method based on an intellectual property document for design material search according to an embodiment of the present invention. Referring to Figure 1 describes the overall process of the analysis method according to an embodiment of the present invention.

먼저, 분석하고자 하는 타겟 키워드들(소재 키워드, 기술 키워드, 감성 키워드 중 적어도 2개 이상)이 선정되면, 그 타겟 키워드들을 이용하여 지식재산권 문서 DB(Database)에서 검색을 수행하고, 이와 같은 검색을 통해 수집된 검색 모집단 내의 문서들을 대상으로 데이터 마이닝 및 오피니언 마이닝을 수행하게 된다.First, when target keywords (at least two of material keywords, technical keywords, and emotional keywords) to be analyzed are selected, the target keywords are used to perform a search in the intellectual property document DB (Database). Data mining and opinion mining are performed on documents in the search population collected through the search.

즉, 본 발명의 분석 방법에서는 데이터 마이닝을 수행하여 소정 기준에 따라 소재 키워드와 기술 키워드 간의 연관도가 존재하는 것으로 평가되는 소재-기술 연관 지식재산권 문서들을 획득하고, 또한 오피니언 마이닝을 수행하여 소정 기준에 따라 소재 키워드와 감성 키워드 간의 연관도가 존재하는 것으로 평가되는 소재-감성 연관 지식재산권 문서들을 획득한다. 또한 이에 따라 획득된 상기 소재-기술 연관 지식재산권 문서들과 상기 소재-감성 연관 지식재산권 문서들의 교집합에 해당하는 소재-기술-감성 연관 지식재산권 문서들을 획득하게 된다. 이후, 상기 획득된 소재-기술-감성 연관 지식재산권 문서들을 소재 키워드, 기술 키워드, 감성 키워드에 따라 매트릭스 형태로 구조화한 소재-기술-감성 매트릭스 DB를 생성한다.That is, in the analysis method of the present invention, data mining is performed to obtain material-technical related intellectual property documents which are evaluated to have an association degree between a material keyword and a technology keyword according to a predetermined criterion, and further, opinion mining is performed to perform a predetermined criterion. Accordingly, obtains material-emotional-related intellectual property documents which are evaluated to have an association between the material keyword and the emotional keyword. In addition, the material-technological-related intellectual property documents obtained according to the intersection of the material-technical-related intellectual property documents and the material-sensitivity related intellectual property documents are obtained. Subsequently, a material-technology-emotion matrix DB is constructed in which the obtained material-technology-emotion-related intellectual property documents are structured in a matrix form according to a material keyword, a technology keyword, and an emotion keyword.

여기서, 상기 소재 키워드는 소재(material)의 명칭을 나타내는 키워드이고, 상기 기술 키워드는 소재의 재질적 속성에 따라 결정되는 기능적 특징(예를 들어, 해당 소재의 재질에 따른 물성과 관련된 물리적, 화학적, 생물학적, 전기적 특징 등)을 표현하는 키워드이며, 상기 감성 키워드는 소재의 재질적 속성에 따라 발현되는 외관적 특징(예를 들어, 표면 특징, 컬러 특징, 인지적/직관적/감성적 특징 등)을 표현하는 키워드를 의미한다.Here, the material keyword is a keyword indicating the name of the material (material), the technical keyword is a functional feature (for example, physical, chemical, related to the physical properties according to the material of the material determined according to the material properties of the material) Biological, electrical characteristics, etc.), and the emotional keyword expresses appearance characteristics (eg, surface characteristics, color characteristics, cognitive / intuitive / emotional characteristics, etc.) expressed according to material properties of the material. Means a keyword.

이때, 도 1에 도시된 본 발명의 분석 방법을 구현하는 과정에서, 도 2 ~ 도 5의 데이터 마이닝/오피니언 마이닝 방법론들이 원리적으로 적용되었다.At this time, in the process of implementing the analysis method of the present invention shown in Figure 1, the data mining / opinion mining methodologies of Figures 2 to 5 were applied in principle.

여기서, 도 2는 본 발명의 분석 방법에 원리적으로 도입된 데이터 마이닝 방법론 중 하나로서 문맥창(context window)의 기본 원리를 설명하기 위한 참조 도면이고, 도 3은 본 발명의 분석 방법에 원리적으로 도입된 데이터 마이닝 방법론 중 하나로서 동시 출현 빈도(Co-Occurrence)의 기본 원리를 설명하기 위한 참조 도면이다. 도 2에 도시된 문맥창 개념은 특정 기준 단어를 중심으로 그 주변에 인접 배치된 단어일수록 문맥적인 관점에서 연관도가 인정되거나 연관도가 높은 것으로 볼 수 있다는 원리가 적용된 것이다. 앞서 설명한 문맥창 개념에 따른 인접 연산만으로는 문맥상 연관관계를 담보할 수 없는 경우가 발생할 수 있는데, 이때에는 도 3에 도시된 동시 출현 빈도 개념을 적용함으로써 단어 간의 연관도를 보다 신뢰성 높게 확인하는데 사용할 수 있다. 즉, 동시 출현 빈도란 그 단어들이 얼마나 자주 동시에 또는 반복적으로 출현되느냐를 기준하여 단어 간의 연관도를 판단하는 데이터 마이닝 개념인 것이다.2 is a reference diagram for explaining the basic principle of the context window as one of the data mining methodologies introduced in principle to the analysis method of the present invention, and FIG. 3 is a principle diagram of the analysis method of the present invention. As a data mining methodology introduced as a reference figure for explaining a basic principle of co-occurrence. The concept of the context window illustrated in FIG. 2 is applied to the principle that a word placed adjacent to a specific reference word is recognized as a high degree of association or recognized as a contextual point of view. In some cases, the contextual relation cannot be secured only by the adjacent operation based on the concept of the context window described above. In this case, it is possible to apply the concept of simultaneous occurrence frequency shown in FIG. Can be. That is, the frequency of co-occurrence is a data mining concept that determines the degree of association between words based on how often the words appear simultaneously or repeatedly.

또한 본 발명에서는 오피니언 마이닝 방법으로서 워드넷(Wordnet) 및 이의 확장 버전(senti-Wordnet)이 원리적으로 적용되었다. 여기서, 도 4 및 도 5는 본 발명의 분석 방법에 원리적으로 도입된 오피니언 마이닝 방법론 중 하나로서 워드넷(Wordnet) 및 이의 확장 버전(senti-Wordnet)의 기본 원리를 설명하기 위한 참조 도면이다.In the present invention, Wordnet and its extended version (senti-Wordnet) are applied in principle as an opinion mining method. 4 and 5 are reference views for explaining the basic principle of Wordnet and its extended version (Senti-Wordnet) as one of the opinion mining methodologies introduced in principle in the analysis method of the present invention.

워드넷(WordNet)은 1985년 프린스턴 대학에서 시작된 영어 의미 어휘목록 구축 프로젝트로서, 수 많은 영어 단어들을 같은 뜻 별로 묶어서 synset이라는 것을 만들고 그 synset들 간의 관계를 정리해놓은 단어망 구조의 사전을 의미한다. 또한 SentiWordNet은 워드넷의 Synset에 감성 스코어를 매긴 어휘 사전으로서 감성 스코어는 긍정(P), 부정(N), 중립(O)으로 구성되며, 하나의 synset에 대해 P + N + O = 1으로 설계되어 있다. 여기서, P=1이면 그 synset은 강렬하게 긍정적인 의미를, 반대로 N=1이면 강렬하게 부정적인 의미를 나타내며, P =0, N = 0은 중립으로 판단된다. 본 발명에서는 감성 키워드에 관한 유의어 사전을 DB화 할 때, 이와 같은 워드넷 및 그 확정 버전의 기본 원리가 도입되었다. 다만, 상술한 데이터 마이닝/오피니언 마이닝 기법들은 그 기법들 그대로 본 발명에 적용된 것은 아니며, 위 기법들의 기본적 원리를 참조하되 본 발명에 따른 분석 방법에 맞춰 도입된 것임을 먼저 명확히 해둔다.
WordNet is an English semantic vocabulary building project started at Princeton University in 1985. It is a dictionary of word network structure that combines many English words by synonyms and makes synsets and organizes the relationships among the synsets. SentiWordNet is also a lexical dictionary that scores sentiment scores for WordNet's Synset, which consists of positive (P), negative (N), and neutral (O) and is designed with P + N + O = 1 for one synset. It is. Herein, if P = 1, the synset has an intensely positive meaning, whereas if N = 1, an intensely negative meaning, P = 0 and N = 0 are determined to be neutral. In the present invention, the basic principle of WordNet and its definite version is introduced when DB synonym dictionary of emotional keyword is made into DB. However, the above-described data mining / opinion mining techniques are not applied to the present invention as they are, but it is clearly clarified that they are introduced according to the analysis method according to the present invention with reference to the basic principles of the above techniques.

이상에서는 본 발명에 원리적으로 도입된 데이터 마이닝/오피니언 마이닝 방법론들에 관하여 설명하였는 바, 이하에서는 도 6 ~ 도 10을 참조하여 도 1에 도시된 본 발명의 분석 방법론에 관하여 구체적으로 설명한다. 후술할 본 발명의 실시예에 따른 분석 방법은 적어도 하나의 프로세서(processor) 및 메모리(memory)를 포함하는 컴퓨팅 장치 또는 시스템에 의해 처리될 수 있다.In the above, the data mining / opion mining methodologies introduced in principle to the present invention have been described. Hereinafter, the analysis methodology of the present invention shown in FIG. 1 will be described in detail with reference to FIGS. 6 to 10. An analysis method according to an embodiment of the present invention to be described below may be processed by a computing device or system including at least one processor and a memory.

앞서도 설명한 바와 같이, 본 발명에 따르면, 분석하고자 하는 타겟 키워드들(소재 키워드, 기술 키워드, 감성 키워드 중 적어도 2개 이상)이 선정된 경우, 그 타겟 키워드들을 이용하여 지식재산권 문서 DB(Database)에서 검색을 수행하고, 이와 같은 검색을 통해 수집된 검색 모집단 내의 문서들을 대상으로 데이터 마이닝 및 오피니언 마이닝을 수행하는 순서에 의하게 된다.As described above, according to the present invention, when the target keywords (at least two or more of material keywords, technology keywords, and emotional keywords) to be analyzed are selected, the target keywords are used in the intellectual property document DB (Database). A search is performed, and data mining and opinion mining are performed on documents in the search population collected through the search.

이를 테면, 도 1에 예시된 바와 같이, 플라스틱 소재로서 내구성이 강하면서 고급스럽거나 화려한 느낌을 주는 찾고자 하는 경우라면, 소재 키워드는 플라스틱, 기술 키워드는 내구성, 감성 키워드는 고급스러움 또는 화려함으로 선정될 수 있을 것이다. 본 명세서에서는 발명의 설명 및 이해의 편의를 위하여, 소재 키워드, 기술 키워드, 감성 키워드가 모두 선택(선정)된 경우를 가정하여 설명하지만, 경우에 따라서는 그 중 2개의 키워드만이 선정될 수도 있다.For example, as illustrated in FIG. 1, if a plastic material is to be durable and has a luxurious or luxurious feeling, the material keyword may be selected as plastic, the technology keyword as durable, and the emotional keyword as luxury or splendor. There will be. In the present specification, for convenience of explanation and understanding of the invention, it is assumed that the material keyword, the technical keyword, and the emotional keyword are all selected (selected). However, in some cases, only two keywords may be selected. .

일 예로 내구성이 강하면서 고급스러운 소재라면 소재에 관해서는 특별한 제한을 두지 않고(예를 들면, 플라스틱이든 금속이든 상관없이) 모두 조사를 해보고자 할 수도 있는데, 이러한 케이스에서는 기술 키워드 및 감성 키워드만이 결정되어 있을 수도 있다. 이러한 케이스에서는 후술할 소재 키워드에 관한 유의어 사전 DB 등을 참조하여 해당 키워드 사전에 포함된 모든 소재 키워드를 넣고 후술할 도 6 ~ 도 10에서와 같은 분석 방법론을 적용함으로써, 내구성이 강하면서 고급스러운 소재가 어떤 것이 있는지를 확인해볼 수도 있을 것이다. 이와 유사한 관점에서 볼 때, 소재 키워드와 기술 키워드만 또는 소재 키워드와 감성 키워드만이 결정된 상태에서 나머지 키워드는 해당 키워드 사전을 참조하여 조사를 수행할 수도 있음은 물론이다. 이를 더욱 확장한다면, 소재/기술/감성 중 어느 하나의 키워드만이 결정된 상태에서의 조사도 가능할 것이나, 이는 조사 및 연산 복잡도를 매우 높이게 되며, 디자이너 또는 연구원의 조사 의도와도 일반적으로는 맞지 않는 케이스인 바 이에 관해서는 본 명세서를 통한 별도의 설명은 생략하기로 한다.For example, if you have a durable and high-quality material, you may want to investigate all materials without particular limitations (for example, plastic or metal). In these cases, only technical keywords and emotional keywords It may be determined. In such a case, by inserting all the material keywords included in the keyword dictionary with reference to the synonym dictionary DB regarding the material keyword to be described later and applying the analysis methodology as shown in FIGS. You might want to check what's going on. From a similar point of view, while only the material keyword and the technology keyword or only the material keyword and the emotion keyword are determined, the remaining keywords may be searched by referring to the corresponding keyword dictionary. To further expand this, it would be possible to investigate in which only one keyword of material / technology / sensitivity was determined, but this would greatly increase the research and computational complexity and would not generally match the research intent of the designer or researcher. In this regard, a separate description through the present specification will be omitted.

상술한 바와 같이 소재/기술/감성 키워드가 결정되면 이를 기초로 지식재산권 문서의 검색 및 후술할 데이터 마이닝 및 오피니언 마이닝 과정을 거치게 되는데, 이때 검색 과정에서는 키워드 사전 DB가 활용될 수 있다. 물론 결정된(즉, 디자이너 또는 연구자가 직접 선택한) 해당 키워드(단어)만을 가지고 지식재산권 문서의 검색 및 마이닝이 이루어질 수도 있는 것이나, 이하에서는 키워드 사전 DB를 활용한 키워드 확장 검색에 관해서 설명하기로 한다.As described above, when the material / technology / sensitivity keyword is determined, a search for the intellectual property document and a data mining and opinion mining process to be described later are performed. In this case, the keyword dictionary DB may be used. Of course, the search and mining of the intellectual property document may be performed using only the keywords (words) determined (ie, directly selected by the designer or the researcher). Hereinafter, the keyword expansion search using the keyword dictionary DB will be described.

본 발명의 실시예에 의할 때, 상기 소재 키워드, 상기 기술 키워드, 상기 감성 키워드 별로 해당 키워드와 연관되는 유의어들을 그룹핑하되 특정 키워드로 대표명화하여 관리되도록 마련된 유의어 사전 DB(database)가 문서의 검색 및 마이닝 과정에 활용될 수 있다. 이에 의하면, 상기 키워드를 활용한 지식재산권 문서의 검색을 수행하는 과정에서, 상기 유의어 사전 DB에 따라 해당 키워드의 유의어들을 포함하는 확장 검색 및 마이닝이 이루어질 수 있게 된다.According to an embodiment of the present invention, a synonym dictionary DB (database) arranged to group the synonyms associated with the corresponding keyword by the material keyword, the technical keyword, and the emotional keyword is managed by representing a specific keyword. And mining processes. Accordingly, in the process of searching for the intellectual property document using the keyword, the extended search and mining including the synonyms of the corresponding keyword may be performed according to the thesaurus dictionary DB.

이를 테면, 앞선 예시에서와 같이 기술 키워드로서 "내구성"이 선택된 경우, "내구성"을 다르게 표현하는 다양한 유의어들로서, "강성이 높은", "단단한", "견고한", "hard", "strong" 등이 그룹핑되어 DB 관리될 수 있다. 다른 예로, 감성 키워드로서 "부드러운"이 선택된 경우, 이를 다르게 표현하는 다양한 유의어들로서, "소프트한", "유연한", "매끈한", "soft", "smooth" 등이 함께 그룹핑되어 DB 관리될 수 있는 것이다. 이때, 대표 키워드를 어떤 단어로 선정할 지는 시스템 설계자에 의해 직접 선택되거나 또는 해당 단어의 통계적 대표성 혹은 기술용어로서의 관용성 등에 따라 자동으로 선택될 수도 있을 것인 바, 이에 관해서는 별도의 설명은 생략하기로 한다.For example, when "durability" is selected as the technical keyword as in the previous example, various synonyms expressing "durability" differently include "high rigidity", "hard", "hard", "hard", "strong" Etc. can be grouped and managed DB. As another example, when "soft" is selected as an emotional keyword, as various synonyms expressing this differently, "soft", "flexible", "smooth", "soft", "smooth", etc., may be grouped together and managed by DB. It is. In this case, which word to select a representative keyword may be directly selected by the system designer or may be automatically selected according to statistical representativeness of the word or idiomaticity as a technical term. Shall be.

또한 본 발명의 다른 실시예에 의하면, 상기 소재 키워드에 관한 유의어 사전 DB 내의 어느 하나의 소재 키워드가 상위 개념의 키워드로서 해당 키워드에 속하는 복수의 하위 개념의 소재 키워드를 포함하는 경우, 해당 사전 DB 내에서 상위 개념의 키워드와 하위 개념의 키워드가 연계 관리될 수 있다. 이에 의하면 상기 키워드를 활용한 지식재산권 문서의 검색을 수행하는 과정에서, 해당 소재 키워드와 연계 관리된 하위 개념의 소재 키워드를 포함하는 확장 검색 및 마이닝이 이루어질 수 있게 된다.Further, according to another embodiment of the present invention, when any one of the material keywords in the synonym dictionary DB for the material keyword includes a material keyword of a plurality of sub-concepts belonging to the keyword as a higher-level keyword, in the dictionary DB In the upper-level keyword and the lower-level keyword can be linked management. Accordingly, in the process of searching for the intellectual property document using the keyword, the extended search and mining including the material keyword of the subordinate concept managed in association with the corresponding material keyword can be performed.

예를 들어, 소재 키워드로서 "플라스틱"은 이에 관한 하위 개념의 소재 키워드인 "PC", "PET", "PP", "PPE", "PA" 등을 포함하는 상위 개념이므로, 시스템 설계 방식에 따라 상위 개념의 소재 키워드에 관한 검색 및 마이닝 과정에서 이와 연계된 하위 개념의 소재 키워드도 함께 확장하여 검색 및 마이닝하도록 설계할 수도 있음이 바로 그것이다. 이러한 개념을 보다 확장한다면, 소재 키워드로서 "PC"가 선택되었을 때, 사용자 인터페이스 화면을 통해서 '연관 소재 확장" 버튼 등을 사용자에게 제시함으로써, 그 상위 개념인 소재 키워드인 "플라스틱" 혹은 그 대체 개념인 소재 키워드인 "PET", "PA" 등도 함께 선택할 수 있도록 시스템 설계할 수도 있음은 물론이다.
For example, the material keyword "plastic" is a higher concept that includes the material keywords "PC", "PET", "PP", "PPE", "PA", etc. of the subordinate concept. Therefore, in the search and mining process of the material keyword of the upper concept, the material keyword of the lower concept associated with it may be expanded and searched and mined. To further expand this concept, when "PC" is selected as the material keyword, the user is presented with a "expansion of associated material" button through the user interface screen, and the upper concept material keyword "plastic" or its alternative concept. It is also possible to design the system so that the in-material keywords "PET" and "PA" can be selected together.

상술한 바와 유사한 관점에서, 향후 설명될 마이닝 과정에서의 각 STEP들도 시스템 설계 방식에 따라 그 모든 STEP들이 다 적용되는 것이 아니라, 그 중 일부 STEP만이 적용되거나 혹은 후술할 합집한/교집합 관계를 도 6 ~ 도 8에 예시한 방식에서와 다르게 변경할 수도 있음을 본 명세서를 읽는 해당 기술분야의 통상의 기술자라면 쉽게 이해할 수 있을 것이다. 따라서, 이하에서는 설명의 편의 및 집중을 위해 도 6 ~ 도 8에 예시된 방식(STEP들)을 중심으로만 설명하며, 그 외의 다양한 변형례들에 관해서는 별도의 설명은 생략하기로 한다.From the viewpoint similar to the above, each step in the mining process to be described later does not apply all the STEPs according to the system design method, but only some STEPs are applied or a combined / intersected relationship to be described later. It will be readily understood by one of ordinary skill in the art reading the present disclosure that the modifications may be different from those illustrated in FIGS. 6 to 8. Therefore, hereinafter, only the method (STEPs) illustrated in FIGS. 6 to 8 will be described for convenience and focus of the description, and a description thereof will be omitted for other various modifications.

본 발명의 분석 방법에 의할 때, 상술한 방법론을 이용하여 지식재산권 문서들이 검색되었을 때 그 검색 모집단을 대상으로 한 데이터 마이닝 및 오피니언 마이닝을 수행하게 되며, 이에 따라 소재 키워드와 기술 키워드 간의 연관도가 존재하는 것으로 평가되는 소재-기술 연관 지식재산권 문서들을 획득하고[도 6의 방법론 참조], 소재 키워드와 감성 키워드 간의 연관도가 존재하는 것으로 평가되는 소재-감성 연관 지식재산권 문서들을 획득하며[도 7의 방법론 참조], 이에 따라 획득된 상기 소재-기술 연관 지식재산권 문서들과 상기 소재-감성 연관 지식재산권 문서들의 교집합에 해당하는 소재-기술-감성 연관 지식재산권 문서들을 획득하게 된다[도 8의 방법론 참조].
According to the analysis method of the present invention, when the intellectual property documents are searched using the methodology described above, data mining and opinion mining for the search population are performed, and thus the correlation between the material keyword and the technical keyword is performed. Obtains material-technical association intellectual property documents that are evaluated as present (see methodology of FIG. 6), obtains material-emotional association intellectual property documents where association between material keyword and sentiment keyword is estimated to exist [Fig. Methodology of FIG. 7], thereby obtaining the material-technology-emotional-related intellectual property documents corresponding to the intersection of the material-technical-related intellectual property documents and the material-emotional-related intellectual property documents (FIG. 8). See methodology].

먼저, 도 6에는 상기 소재-기술 연관 지식재산권 문서들을 획득하기 위한 데이터 마이닝 방법의 일 예가 도시되고 있다. 각 STEP을 설명하면 다음과 같다.First, FIG. 6 illustrates an example of a data mining method for obtaining the material-technology related intellectual property documents. Each STEP is explained as follows.

[STEP 1] 지식재산권 문서의 데이터 필드 중 [발명의 명칭] 필드에서, 상기 소재 키워드와 상기 기술 키워드를 동시에 포함하는 지식재산권 문서를 획득한다.[STEP 1] In the [Name of Invention] field of the data field of the intellectual property document, an intellectual property document including the material keyword and the technology keyword is obtained at the same time.

[STEP 2] 지식재산권 문서의 데이터 필드 중 [요약] 필드에서, 상기 소재 키워드를 포함하는 지식재산권 문서를 획득한다.[STEP 2] In the [Summary] field of the data field of the IP document, an IP document including the material keyword is obtained.

[STEP 3] 지식재산권 문서의 데이터 필드 중 [요약], [기술분야], [발명의 효과], [해결과제] 필드 중 적어도 하나에 전후방 인접 연산자를 이용하여, 상기 소재 키워드와 상기 기술 키워드가 전후방에서 사전 지정된 제1 개수의 단어 내에 인접하여 배치되어 있는 지식재산권 문서를 획득한다.[STEP 3] The material keyword and the technical keyword may be entered using at least one of the Summary, Technical Field, Effect of Invention, and Challenge fields in the data field of the IP document. Acquire an intellectual property document that is arranged adjacently within the first predetermined number of words in the front and rear.

여기서, 도 6에서 'near'는 상기 전후방 인접 연산자를 나타내고, "near3"는 앞뒤로(즉, 소재 키워드와 기술 키워드가 그 배치 순서와 상관없이) 3개 단어 내에서 인접하여 배치하는 것을 추출해내라는 연산식을 나타낸다.Here, in FIG. 6, 'near' denotes the front and rear adjacent operators, and "near3" denotes the extraction of adjacent arrangements within three words back and forth (i.e., the material keyword and the description keyword are irrelevant to their arrangement order). Represents an expression.

이하에서도 마찬가지이지만, 몇 개의 단어 내에서 인접하여 배치된 것을 추출해낼 것인지는 시스템 설계자 또는 사용자에 의해 적절히 선택될 수 있을 것이다. 인접 배치의 기준 조건으로서 전후 단어의 숫자 혹은 후방 단어의 숫자를 큰 값으로 하면 할수록 재현성은 높아질 것이며(즉, 보다 많은 관련 문서가 추출될 것이며), 작은 값으로 하면 할수록 정확성이 높아질 것인 바(즉, 보다 높은 연관도의 문서만이 추출될 것인 바), 이는 선택의 문제로서 본 발명의 핵심 기술적 원리와는 무관하다 할 것이다. 따라서 이하에서 예시된 인접 연산의 기준 조건으로서의 숫자는 다양한 변형이 가능함을 명확히 해둔다.The same applies to the following, but it may be appropriately selected by the system designer or the user to extract a contiguous arrangement within a few words. The larger the number of front and rear words or the back word as a reference condition for adjacent placement, the higher the reproducibility (ie, more relevant documents will be extracted), and the smaller the value, the higher the accuracy ( That is, only documents of higher relevance will be extracted), which is a matter of choice and irrelevant to the core technical principles of the present invention. Therefore, the numbers as reference conditions of the adjacent operation illustrated below make it clear that various modifications are possible.

[STEP 4] 지식재산권 문서의 데이터 필드 중 [요약], [기술분야], [발명의 효과], [해결과제] 필드 중 적어도 하나에 후방 인접 연산자를 이용하여, 상기 소재 키워드를 기준으로 상기 기술 키워드가 후방에서 사전 지정된 제2 개수의 단어 내에 인접하여 배치되어 있는 지식재산권 문서를 획득한다.[STEP 4] The description is based on the material keyword by using a rear neighbor operator in at least one of the [Summary], [Technical Field], [Effects of the Invention], and [Solution] fields of the data field of the intellectual property document. Obtain a intellectual property document in which a keyword is arranged adjacently within a second predetermined number of words behind.

여기서, 도 6에서 'adj'는 상기 후방 인접 연산자를 나타내고, "adj6"는 소재 키워드를 기준으로 뒤로 6개 단어 내에서 기술 키워드가 인접하여 배치하는 것을 추출해내라는 연산식을 나타낸다.Here, in FIG. 6, 'adj' denotes the backward adjoining operator, and “adj6” denotes an expression for extracting the adjacent arrangement of the description keyword within six words based on the material keyword.

[STEP 5] 상기 STEP 1에 따라 획득된 지식재산권 문서들, 상기 STEP 2에 따라 획득됨과 동시에 상기 STEP 3에 따라서도 획득되는 지식재산권 문서들, 상기 STEP 2에 따라 획득됨과 동시에 상기 STEP 4에 따라서도 획득되는 지식재산권 문서들을 합집합으로 하는 제1 그룹의 지식재산권 문서들을 획득한다.[STEP 5] Intellectual Property Documents acquired in accordance with STEP 1, Intellectual Property Documents obtained in accordance with STEP 2 and acquired in accordance with STEP 2, and in accordance with STEP 4 simultaneously in accordance with STEP 2 Also, a first group of intellectual property documents obtained by unioning the obtained intellectual property documents is obtained.

[STEP 6] 지식재산권 문서의 데이터 필드 중 [요약], [기술분야], [발명의 효과], [해결과제] 필드 중 적어도 하나에 전후방 인접 연산자를 이용하여, 해당 지식재산권 문서에 핵심 기술적 특징으로서 기재된 발명 고유의 내용을 지칭하는 사전 지정된 관용어 키워드와 상기 소재 키워드가 전후방에서 사전 지정된 제3 개수(본 예에서는 4개)의 단어 내에 인접하여 배치되어 있는 지식재산권 문서를 획득한다. 예를 들어, 상기 관용어 키워드로는 "본 발명", "본원 발명", "발명의 핵심" 등이 여기에 해당할 수 있다.[STEP 6] Key technical features of the intellectual property document by using forward and backward adjacent operators on at least one of the Summary, Technical Field, Effect of Invention, and Challenge fields of the data field. A pre-specified idiom keyword referring to the contents unique to the invention described as and the material keyword are acquired in the front and rear adjacently in a third predetermined number (four in this example) of the intellectual property document. For example, the idiom keyword may correspond to the present invention, the present invention, the core of the invention, and the like.

[STEP 7] 지식재산권 문서의 데이터 필드 중 [요약], [기술분야], [발명의 효과], [해결과제] 필드 중 적어도 2개 이상에서, 상기 소재 키워드와 상기 기술 키워드를 동시에 포함하는 지식재산권 문서를 획득한다. [STEP 7] Knowledge of simultaneously including the material keyword and the technology keyword in at least two of the [Summary], [Technical Field], [Effects of the Invention], and [Solution] fields in the data field of the intellectual property document. Obtain a property document.

[STEP 8] 상기 STEP 2에 따라 획득된 지식재산권 문서들, 상기 STEP 6에 따라 획득됨과 동시에 상기 STEP 7에 따라서도 획득되는 지식재산권 문서들을 교집합으로 하는 제2 그룹의 지식재산권 문서들을 획득한다.[STEP 8] A second group of intellectual property documents acquired in accordance with STEP 2, and a second group of intellectual property documents acquired in accordance with STEP 6 and acquired in accordance with STEP 7, are acquired.

[STEP 9] 상기 STEP 5에 따라 획득된 제1 그룹 및 상기 STEP 8에 따라 획득된 제2 그룹의 지식재산권 문서들을 합집합으로 함으로써, 상기 소재-기술 연관 지식재산권 문서들을 획득한다.
[STEP 9] The material-technology-related intellectual property documents are obtained by combining the first group acquired according to STEP 5 and the second group acquired according to STEP 8 in a union.

다음으로, 도 7에는 상기 소재-감성 연관 지식재산권 문서들을 획득하기 위한 오피니언 마이닝 방법의 일 예가 도시되고 있다. 각 STEP을 설명하면 다음과 같다. 여기서, 도 7의 [STEP 1]에 관해서는 앞서 감성 키워드에 관한 유의어 사전 DB로 이미 설명하였는 바 이에 관한 중복되는 설명은 생략한다.Next, FIG. 7 illustrates an example of an opinion mining method for obtaining the material-emotional associated intellectual property documents. Each STEP is explained as follows. Here, since [STEP 1] of FIG. 7 has already been described above as a synonym dictionary DB regarding emotion keywords, duplicate description thereof will be omitted.

[STEP 2] 지식재산권 문서의 데이터 필드 중 [요약], [기술분야], [발명의 효과], [해결과제] 필드 중 적어도 2개 이상에서, 상기 소재 키워드와 상기 감성 키워드를 동시에 포함하는 지식재산권 문서를 획득한다.[STEP 2] Knowledge of simultaneously including the material keyword and the emotional keyword in at least two of the [Summary], [Technical Field], [Effects of the Invention], and [Solution] fields in the data field of the intellectual property document. Obtain a property document.

[STEP 3] 지식재산권 문서의 데이터 필드 중 [요약], [기술분야], [발명의 효과], [해결과제] 필드 중 적어도 하나에 전후방 인접 연산자를 이용하여, 상기 소재 키워드와 상기 감성 키워드가 전후방에서 사전 지정된 제4 개수(본 예에서는 5개)의 단어 내에 인접하여 배치되어 있는 지식재산권 문서를 획득한다.[STEP 3] The material keyword and the emotional keyword are generated by using front and rear adjacent operators in at least one of the fields of [Summary], [Technical Field], [Effects of the Invention] and [Solution] among the data fields of the intellectual property document. Obtains the intellectual property document arranged adjacent to each other in the fourth predetermined number (five in this example) in the front and rear directions.

또한, 지식재산권 문서의 데이터 필드 중 [요약], [기술분야], [발명의 효과], [해결과제] 필드 중 적어도 하나에 후방 인접 연산자를 이용하여, 상기 소재 키워드를 기준으로 상기 감성 키워드가 후방에서 사전 지정된 제5 개수(본 예에서는 8개)의 단어 내에 인접하여 배치되어 있는 지식재산권 문서를 획득한다.In addition, the emotional keyword is based on the material keyword by using a rear neighbor operator in at least one of the Summary, Technical Field, Effect of Invention, and Challenge fields of the data field of the intellectual property document. Acquiring the intellectual property document arranged adjacently within the fifth predetermined number of words (eight in this example) in the rear.

이후, 상기 STEP 2에 따라 획득된 지식재산권 문서들, 상기 STEP 3의 위 2개의 방식에 따라 획득된 지식재산권 문서들을 합집합으로 함으로써, 상기 소재-감성 연관 지식재산권 문서들을 획득한다.Thereafter, the intellectual property documents obtained according to the STEP 2, the intellectual property documents obtained according to the above two methods of STEP 3 are combined to obtain the material-emotional related intellectual property documents.

이에 따라, 도 8에 도시된 바와 같이, 상술한 바와 같이 획득된 소재-기술 연관 지식재산권 문서들과 소재-감성 연관 지식재산권 문서들의 교집합인 소재-기술-감성 연관 지식재산권 문서들이 획득될 수 있다.
Accordingly, as shown in FIG. 8, the material-technology-emotional-related intellectual property documents which are the intersection of the material-technology-related intellectual property documents and the material-emotional-related intellectual property documents obtained as described above may be obtained. .

이후, 상기 획득된 소재-기술-감성 연관 지식재산권 문서들을 소재 키워드, 기술 키워드, 감성 키워드에 따라 매트릭스 형태로 구조화한 소재-기술-감성 매트릭스 DB를 생성한다. 이때, 상기 소재-기술-감성 매트릭스 DB를 생성하는 단계는 다음과 같은 방식이 이용될 수 있다.Subsequently, a material-technology-emotion matrix DB is constructed in which the obtained material-technology-emotion-related intellectual property documents are structured in a matrix form according to a material keyword, a technology keyword, and an emotion keyword. At this time, the step of generating the material-technology-sensitive matrix DB may be used as follows.

일반적으로, 상기 소재-기술-감성 연관 지식재산권 문서에서는 상기 소재 키워드 및 상기 감성 키워드를 기준으로 이와 관련된 기술 키워드가 복수개 존재하는 경우가 많이 발생한다. 특허 기술은 하나의 문서 내에서도 기술적 효과가 중복되어 표기되는 경우가 많이 발생하는 바, 이를 효율적으로 DB화하여 관리할 필요가 있다.In general, in the material-technology-emotional-related intellectual property document, a plurality of technology keywords related to the material keyword and the emotion keyword may exist. Patent technology is often duplicated in the technical effect within a single document, it is necessary to efficiently manage the DB.

따라서, 본 발명의 실시예에 따른 상기 소재-기술-감성 매트릭스 DB는, 상기 소재 키워드 및 상기 감성 키워드를 데이터 필터값으로 정렬 적용하였을 때 상기 복수개의 기술 키워드가 하나의 데이터 행 내에서 분산 배열되는 가변 매트릭스 구조를 갖도록 설계될 수 있다. 이에 관한 예시가 도 9 및 도 10에 도시되어 있다.Accordingly, the material-technology-emotion matrix DB according to an embodiment of the present invention is arranged such that the plurality of description keywords are distributed and arranged in one data row when the material keyword and the emotion keyword are sorted and applied as a data filter value. It can be designed to have a variable matrix structure. An example of this is shown in FIGS. 9 and 10.

여기서, 도 9는 소재-기술-감성 연관의 마이닝 데이터를 매트릭스화하였을 때 기술적 효과를 분산시켜 매트릭스 상에 표현한 가변 매트릭스 구조의 일 예이며, 도 10은 기술 효과 및 감성 효과 매트릭스 검색에 따라 획득된 소재 관련 유효 특허의 예시이다.
Here, FIG. 9 is an example of a variable matrix structure in which technical effects are dispersed and expressed on a matrix when mining data of a material-technology-emotional relation is matrixed, and FIG. 10 is obtained by searching for a technical effect and emotional effect matrix. This is an example of a material-related valid patent.

또한, 도 11 ~ 도 15는 일반적인 특허검색방식과 본 발명에 따른 방식(AMD : Advanced Design Material Discovery) 간을 비교한 비교 결과를 예시한 도면이다.11 to 15 illustrate a comparison result between a general patent search method and an advanced design material discovery (AMD) method according to the present invention.

먼저, 도 11에 의할 때, 일반적인 특허검색방식에서는 소재/기술/감성 키워드를 모두 교집합(즉, AND 조건)으로 포함하는 특허를 검색하게 되는 반면, 본 발명의 AMD 분석 방식에서는 앞서 설명한 도 6 ~ 도 8의 검색 및 마이닝 방식으로 특허를 추출하게 된다. 이에 의할 때, 일반적인 특허검색방식에서는 도 14의 좌측 도면에서와 같은 상당수의 노이즈(즉, 유효하지 않은 데이터)가 발생된다. 왜냐하면, 소재와 기술, 소재와 감성 간이 강하게 묶인 연관도 높은 기술 이외에도 단순 교집합에 해당하는 특허들이 상당수 검색될 수 있기 때문이다. 예를 들어, 단순히 해당 소재 키워드가 특허 문서 내에 포함되어 있을 뿐 해당 특허의 본질적인 내용으로서 사용되지 않은 특허문서들도 상당수 검색되는 것이 바로 그것이다.First, according to FIG. 11, in the general patent search method, a patent including all materials / technologies / sensitivity keywords as an intersection (that is, an AND condition) is searched, whereas in the AMD analysis method of FIG. The patent is extracted through the search and mining method of FIG. 8. Accordingly, in the general patent retrieval method, a large number of noises (that is, invalid data) as in the left figure of FIG. 14 are generated. This is because a large number of patents corresponding to simple intersections can be searched in addition to a highly related technology in which material and technology, material and emotion are strongly bound. For example, it is simply that the material keyword is included in a patent document and a large number of patent documents that are not used as essential contents of the patent are searched.

반면에 본 발명의 AMD 분석 방식에 의하면, 소재와 기술, 소재와 감성 간이 강하게 묶인 연관도 높은 특허문서가 검색될 가능성이 높기 때문에, 정확도 측면에서 상당히 우수함을 확인할 수 있다[도 14의 우측 도면 참조].On the other hand, according to the AMD analysis method of the present invention, since it is highly likely to search for a highly related patent document strongly bound between material and technology, material and emotion, it can be confirmed that it is quite excellent in terms of accuracy (see the right figure in FIG. 14). ].

본 발명의 AMD 분석 방식에 의한 검색 및 마이닝의 성능은 도 12에 기재된 정확도, 재현율, 이에 관한 조화 평균값의 산출을 통해 확인할 수 있다. 이러한 관점에서 위의 성능 평가 지표인 정확도, 재현율, 조화 평균값을 사전에 샘플링 테스트 해보는 방법으로 본 발명의 AMD 분석 방법의 성능을 보다 개선시킬 수도 있을 것이다. 즉, 도 13에서 예시된 바와 같이 일반적인 검색 방식과 본 발명의 AMD 방식에 따라 각각 획득된 특허문서들을 합친 후, 이에 관하여 도 15의 방식의 샘플링 테스트를 진행한 결과(즉, 산출된 3가지 성능 평가 지표)를 대조해보는 방식을 취하게 되면, 보다 감도가 높은 AMD 방식을 선택해낼 수 있다. 예를 들어, 앞서 설명한 인접 연산자에 따른 연산 조건으로서 전후방 또는 후방 몇 개의 단어 내에서 검색 및 마이닝을 하는 것이 보다 우수한 성능의 결과물을 도출해내는지에 관한 샘플링 테스트를 몇 차례 사전에 수행해본 후, 이에 따른 성능 평가 지표를 감안하여 실제 연산 조건을 선택해내는데 이용하는 것이 바로 그것이다.The performance of searching and mining by the AMD analysis method of the present invention can be confirmed through the calculation of the accuracy, recall, and a harmonic mean value related thereto described in FIG. 12. In this regard, the performance of the AMD analysis method of the present invention may be further improved by performing a sampling test on the above-mentioned performance evaluation indicators such as accuracy, recall, and harmonic mean value in advance. That is, as illustrated in FIG. 13, after combining the general search method and the patent documents acquired according to the AMD method of the present invention, the sampling test of the method of FIG. 15 is performed (ie, three performances calculated). By comparing the evaluation indicators, you can choose a more sensitive AMD method. For example, after performing a sampling test several times before and after the search and mining within a few words before and after as the operation condition according to the adjacent operator described above, the performance is better. That's what we use to select the actual computational conditions, given the performance metrics.

이외에도 이상에서는 단일의 소재 키워드, 단일의 기술 키워드, 단일의 감성 키워드를 이용한 검색 및 마이닝이 수행되는 경우를 중심으로 설명하였지만, 속성별(소재/기술/감성)로 복수개의 키워드가 검색에 활용될 수도 있음은 물론이다. 이 경우, 동일 속성의 복수개의 키워드는 교집합 관계로 검색 및 마이닝될 수도 있고, 합집합 관계로 검색 및 마이닝될 수도 있다. 즉, 이는 시스템 설계 구현 방식에 따라 상이해질 수 있다.In addition to the above, the above description focuses on a case in which a search and mining using a single material keyword, a single technology keyword, and a single emotional keyword is performed. However, a plurality of keywords may be used for searching by attributes (material / technology / sensitivity). Of course you can. In this case, a plurality of keywords having the same attribute may be searched and mined in an intersection relationship, or may be searched and mined in a union relationship. That is, this may be different depending on how the system design is implemented.

또한 경우에 따라서, 디자이너 또는 연구자가 특정의 소재/기술/감성 키워드를 이용한 1차적인 검색 및 마이닝을 완료한 이후, 특정의 소재/기술/감성 키워드 중 적어도 하나에 관한 추가적인 키워드를 다시 적용하고자 할 수도 있는데, 이러한 케이스에서도 앞서 설명한 도 6 ~ 도 9에서와 유사한 검색 및 마이닝 방식이 재적용될 수도 있음은 물론이다. 이때, 1차적으로 획득된 소재-기술-감성 연관 지식재산권 문서들 내에서 추가 검색 및 마이닝을 요구하는 경우라면, 1차 획득된 지식재산권 문서들을 대상으로만 재검색 및 마이닝이 수행되게 될 것이다.
Also, in some cases, after a designer or researcher completes the first search and mining using a specific material, technology, or emotion keyword, he or she may want to reapply additional keywords regarding at least one of the specific material, technology, and emotion keyword. In this case, the search and mining methods similar to those described above with reference to FIGS. 6 to 9 may be applied again. In this case, if additional search and mining is required in the material-technical-sensitivity-related intellectual property documents obtained primarily, re-searching and mining will be performed only on the first acquired intellectual property documents.

상술한 본 발명의 실시예에 따른 디자인 소재 검색을 위한 지식재산권 문서 기반의 빅데이터 분석 방법은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체로는 컴퓨터 시스템에 의하여 해독될 수 있는 데이터가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있을 수 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 읽을 수 있는 코드로서 저장되고 실행될 수 있다. The big data analysis method based on the intellectual property document for design material search according to the embodiment of the present invention can be implemented as computer readable code on a computer readable recording medium. Computer-readable recording media include all kinds of recording media having data stored thereon that can be decrypted by a computer system. For example, there may be a read only memory (ROM), a random access memory (RAM), a magnetic tape, a magnetic disk, a flash memory, an optical data storage device, and the like. The computer readable recording medium can also be distributed over computer systems connected over a computer network, stored and executed as readable code in a distributed fashion.

이상에서는 본 발명의 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 쉽게 이해할 수 있을 것이다.Although the above has been described with reference to embodiments of the present invention, those skilled in the art may variously modify the present invention without departing from the spirit and scope of the present invention as set forth in the claims below. And can be changed easily.

Claims (7)

컴퓨터에서 수행되는 지식재산권 문서 기반의 디자인 소재 검색 및 분석에 관한 컴퓨터 구현 방법(Computer implemented Method)로서,
소재 키워드, 기술 키워드, 감성 키워드가 수신됨에 따라, 수신된 키워드를 이용하여 지식재산권 문서 DB(Database)에서 검색을 수행하는 단계-여기서, 상기 소재 키워드는 소재(material)의 명칭을 나타내는 키워드이고, 상기 기술 키워드는 소재의 재질적 속성에 따라 결정되는 기능적 특징을 표현하는 키워드이며, 상기 감성 키워드는 소재의 재질적 속성에 따라 발현되는 외관적 특징을 표현하는 키워드임-; 상기 검색을 통해 수집된 검색 모집단 내의 문서들을 대상으로, 소정 기준에 따라 소재 키워드와 기술 키워드 간의 연관도가 존재하는 것으로 평가되는 소재-기술 연관 지식재산권 문서들을 획득하는 단계; 상기 검색을 통해 수집된 검색 모집단 내의 문서들을 대상으로, 소정 기준에 따라 소재 키워드와 감성 키워드 간의 연관도가 존재하는 것으로 평가되는 소재-감성 연관 지식재산권 문서들을 획득하는 단계; 상기 소재-기술 연관 지식재산권 문서들과 상기 소재-감성 연관 지식재산권 문서들의 교집합에 해당하는 소재-기술-감성 연관 지식재산권 문서들을 획득하는 단계; 상기 획득된 소재-기술-감성 연관 지식재산권 문서들을 소재 키워드, 기술 키워드, 감성 키워드에 따라 매트릭스 형태로 구조화한 소재-기술-감성 매트릭스 DB를 생성하는 단계를 포함하되,
상기 소재-기술 연관 지식재산권 문서들을 획득하는 단계는,
지식재산권 문서의 데이터 필드 중 [발명의 명칭] 필드에서, 상기 소재 키워드와 상기 기술 키워드를 동시에 포함하는 지식재산권 문서를 획득하는 제1 방식을 적용하는 단계; 지식재산권 문서의 데이터 필드 중 [요약] 필드에서, 상기 소재 키워드를 포함하는 지식재산권 문서를 획득하는 제2 방식을 적용하는 단계; 지식재산권 문서의 데이터 필드 중 [요약], [기술분야], [발명의 효과], [해결과제] 필드 중 적어도 하나에 전후방 인접 연산자를 이용하여, 상기 소재 키워드와 상기 기술 키워드가 전후방에서 사전 지정된 제1 개수의 단어 내에 인접하여 배치되어 있는 지식재산권 문서를 획득하는 제3 방식을 적용하는 단계; 지식재산권 문서의 데이터 필드 중 [요약], [기술분야], [발명의 효과], [해결과제] 필드 중 적어도 하나에 후방 인접 연산자를 이용하여, 상기 소재 키워드를 기준으로 상기 기술 키워드가 후방에서 사전 지정된 제2 개수의 단어 내에 인접하여 배치되어 있는 지식재산권 문서를 획득하는 제4 방식을 적용하는 단계; 지식재산권 문서의 데이터 필드 중 [요약], [기술분야], [발명의 효과], [해결과제] 필드 중 적어도 하나에 전후방 인접 연산자를 이용하여, 해당 지식재산권 문서에 핵심 기술적 특징으로서 기재된 발명 고유의 내용을 지칭하는 사전 지정된 관용어 키워드와 상기 소재 키워드가 전후방에서 사전 지정된 제3 개수의 단어 내에 인접하여 배치되어 있는 지식재산권 문서를 획득하는 제5 방식을 적용하는 단계; 지식재산권 문서의 데이터 필드 중 [요약], [기술분야], [발명의 효과], [해결과제] 필드 중 적어도 2개 이상에서, 상기 소재 키워드와 상기 기술 키워드를 동시에 포함하는 지식재산권 문서를 획득하는 제6 방식을 적용하는 단계; 상기 제1 방식에 따라 획득된 지식재산권 문서들, 상기 제2 방식에 따라 획득됨과 동시에 상기 제3 방식에 따라서도 획득되는 지식재산권 문서들, 상기 제2 방식에 따라 획득됨과 동시에 상기 제4 방식에 따라서도 획득되는 지식재산권 문서들을 합집합으로 하는 제1 그룹의 지식재산권 문서들을 획득하는 단계; 상기 제2 방식에 따라 획득된 지식재산권 문서들, 상기 제5 방식에 따라 획득됨과 동시에 상기 제6 방식에 따라서도 획득되는 지식재산권 문서들을 교집합으로 하는 제2 그룹의 지식재산권 문서들을 획득하는 단계; 및 상기 제1 그룹 및 제2 그룹의 지식재산권 문서들을 합집합으로 하여 상기 소재-기술 연관 지식재산권 문서들을 획득하는 단계를 포함하고,
상기 소재-감성 연관 지식재산권 문서들을 획득하는 단계는,
지식재산권 문서의 데이터 필드 중 [요약], [기술분야], [발명의 효과], [해결과제] 필드 중 적어도 2개 이상에서, 상기 소재 키워드와 상기 감성 키워드를 동시에 포함하는 지식재산권 문서를 획득하는 제7 방식을 적용하는 단계; 지식재산권 문서의 데이터 필드 중 [요약], [기술분야], [발명의 효과], [해결과제] 필드 중 적어도 하나에 전후방 인접 연산자를 이용하여, 상기 소재 키워드와 상기 감성 키워드가 전후방에서 사전 지정된 제4 개수의 단어 내에 인접하여 배치되어 있는 지식재산권 문서를 획득하는 제8 방식을 적용하는 단계; 지식재산권 문서의 데이터 필드 중 [요약], [기술분야], [발명의 효과], [해결과제] 필드 중 적어도 하나에 후방 인접 연산자를 이용하여, 상기 소재 키워드를 기준으로 상기 감성 키워드가 후방에서 사전 지정된 제5 개수의 단어 내에 인접하여 배치되어 있는 지식재산권 문서를 획득하는 제9 방식을 적용하는 단계; 상기 제7 방식에 따라 획득된 지식재산권 문서들, 상기 제8 방식에 따라 획득된 지식재산권 문서들, 상기 제9 방식에 따라 획득된 지식재산권 문서들을 합집합으로 하는 상기 소재-감성 연관 지식재산권 문서들을 획득하는 단계를 포함하는, 컴퓨터 구현 방법.
A computer implemented method for searching and analyzing design material based on intellectual property documents performed on a computer.
As a material keyword, a technology keyword, and an emotion keyword are received, performing a search in the intellectual property document DB using the received keyword—wherein the material keyword is a keyword indicating a name of the material, The technical keyword is a keyword expressing a functional feature determined according to the material property of the material, and the emotional keyword is a keyword expressing an external feature expressed according to the material property of the material; Obtaining material-technology-related intellectual property documents, which are evaluated to have an association between a material keyword and a technology keyword according to a predetermined criterion, on documents in the search population collected through the search; Acquiring material-emotional-related intellectual property documents, which are estimated to have an association between a material keyword and an emotional keyword according to a predetermined criterion, for documents in the search population collected through the search; Obtaining a material-technology-emotional associated intellectual property document corresponding to an intersection of the material-technical intellectual property documents and the material-emotional associated intellectual property documents; Generating a material-technology-emotion matrix DB structured in the form of a matrix according to the material keyword, technology keyword, and emotion keyword.
Acquiring the material-technology related intellectual property documents,
Applying a first method of acquiring an intellectual property document including the material keyword and the technical keyword in the [name of invention] field of the data field of the intellectual property document; Applying a second method of acquiring an intellectual property document including the location keyword in the [Summary] field of the data field of the intellectual property document; The material keyword and the technical keyword are pre-assigned in front and rear using at least one of a summary, a technical field, an effect of the invention, and a task in the data fields of the IP document. Applying a third manner of obtaining an intellectual property document disposed adjacent within a first number of words; The technical keyword is rearwarded based on the material keyword by using a rear adjacency operator in at least one of the [Summary], [Technical Field], [Effects of the Invention] and [Solution] fields of the data field of the IP document. Applying a fourth manner of obtaining an intellectual property document disposed adjacent in a second predetermined number of words; Inherent to the invention as described as a key technical feature in the intellectual property document using at least one of the Summary, Technical Field, Effect of Invention, and Challenge fields in the data field of the intellectual property document. Applying a fifth method of acquiring a pre-designated idiom keyword indicating the content of the subject matter and the subject keyword in the vicinity of the pre-designated third number of words; Acquiring an intellectual property document including the material keyword and the technical keyword simultaneously in at least two of the [Summary], [Technical Field], [Effects of the Invention], and [Solution] fields of the data field of the intellectual property document. Applying a sixth scheme to do so; IPR documents acquired in accordance with the first scheme, IPR documents acquired in accordance with the second scheme and acquired in accordance with the third scheme, acquired in accordance with the second scheme, and acquired in the fourth scheme. Acquiring the first group of intellectual property documents, the union of the obtained intellectual property documents; Acquiring a second group of intellectual property documents obtained according to the second method, and intersecting the intellectual property documents acquired according to the fifth method and also obtained according to the sixth method; And combining the first group and the second group of intellectual property documents to obtain the material-technical associated intellectual property documents,
Acquiring the material-emotional IP document,
Acquiring an intellectual property document that includes the material keyword and the emotional keyword simultaneously in at least two of the [Summary], [Technical Field], [Effects of the Invention], and [Solution] fields of the data field of the intellectual property document. Applying a seventh manner to do; The material keyword and the emotional keyword are pre-assigned in front and rear using at least one of a summary, technical field, effect of invention, and task in the data field of the IP document. Applying an eighth manner of obtaining an intellectual property document disposed adjacent within a fourth number of words; The emotional keyword is rearward based on the material keyword by using a rear neighbor operator in at least one of the Summary, Technical Field, Effect of Invention, and Challenge fields of the data field of the intellectual property document. Applying a ninth manner of acquiring the intellectual property document disposed adjacent in the fifth predetermined number of words; The material-emotional related intellectual property documents which combine the intellectual property documents acquired according to the seventh method, the intellectual property documents acquired according to the eighth method, and the intellectual property documents acquired according to the ninth method. And acquiring.
제1항에 있어서,
상기 소재 키워드, 상기 기술 키워드, 상기 감성 키워드 별로 해당 키워드와 연관되는 유의어들을 그룹핑하되 특정 키워드로 대표명화하여 관리되는 유의어 사전 DB(database)이 마련되되,
상기 키워드를 활용한 지식재산권 문서의 검색을 수행하는 과정에서, 상기 유의어 사전 DB에 따라 해당 키워드의 유의어들을 포함하는 확장 검색이 이루어지는 것을 특징으로 하는, 컴퓨터 구현 방법.
The method of claim 1,
A synonym dictionary DB (database), which is managed by grouping the synonyms associated with the keyword by the material keyword, the technical keyword, and the emotional keyword, is represented by a specific keyword.
And performing an extended search including the synonyms of the corresponding keyword according to the synonym dictionary DB in the process of searching for the intellectual property document using the keyword.
제2항에 있어서,
상기 소재 키워드에 관한 유의어 사전 DB 내의 어느 하나의 소재 키워드가 상위 개념의 키워드로서 해당 키워드에 속하는 복수의 하위 개념의 소재 키워드를 포함하는 경우, 해당 키워드 사전 DB 내에서 상위 개념의 키워드와 하위 개념의 키워드가 연계 관리되되,
상기 키워드를 활용한 지식재산권 문서의 검색을 수행하는 과정에서, 해당 소재 키워드와 연계 관리된 하위 개념의 소재 키워드를 포함하는 확장 검색이 이루어지는 것을 특징으로 하는, 컴퓨터 구현 방법.
The method of claim 2,
When any one material keyword in the synonym dictionary DB regarding the material keyword includes a material keyword of a plurality of sub-concepts belonging to the keyword as a higher-level keyword, the keyword of the higher-concept and the lower-concept in the keyword dictionary DB Keywords are linked and managed,
And searching for the intellectual property document using the keyword, and performing an extended search including a material keyword of a subordinate concept managed in association with the corresponding material keyword.
삭제delete 삭제delete 삭제delete 제1항에 있어서,
상기 소재-기술-감성 매트릭스 DB를 생성하는 단계는,
상기 소재-기술-감성 연관 지식재산권 문서에서, 상기 소재 키워드 및 상기 감성 키워드를 기준으로 이와 관련된 기술 키워드가 복수개 존재하는 경우,
상기 소재-기술-감성 매트릭스 DB는, 상기 소재 키워드 및 상기 감성 키워드를 데이터 필터값으로 정렬 적용하였을 때 상기 복수개의 기술 키워드가 하나의 데이터 행 내에서 분산 배열되는 가변 매트릭스 구조를 갖는 것을 특징으로 하는, 컴퓨터 구현 방법.
The method of claim 1,
The step of generating the material-technology-sensibility matrix DB,
In the material-technological-related intellectual property document, when there are a plurality of technical keywords related to the material keyword and the emotional keyword,
The material-technology-emotion matrix DB has a variable matrix structure in which the plurality of technology keywords are distributed and arranged in one data row when the material keyword and the emotion keyword are sorted and applied as data filter values. , Computer implemented method.
KR1020180037216A 2018-03-30 2018-03-30 Intellectual property right document based bigdata analyzing method for design material search KR102029916B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180037216A KR102029916B1 (en) 2018-03-30 2018-03-30 Intellectual property right document based bigdata analyzing method for design material search

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180037216A KR102029916B1 (en) 2018-03-30 2018-03-30 Intellectual property right document based bigdata analyzing method for design material search

Publications (1)

Publication Number Publication Date
KR102029916B1 true KR102029916B1 (en) 2019-10-08

Family

ID=68209110

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180037216A KR102029916B1 (en) 2018-03-30 2018-03-30 Intellectual property right document based bigdata analyzing method for design material search

Country Status (1)

Country Link
KR (1) KR102029916B1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070047544A (en) * 2005-11-02 2007-05-07 김정진 Method for searching patent document by applying degree of similarity and system thereof
KR20100060734A (en) * 2008-11-28 2010-06-07 한국과학기술원 System for visualization of patent information by forming the keyword based semantic network and method therefor
KR101712291B1 (en) * 2015-12-14 2017-03-13 강원대학교산학협력단 System for recommending a user-customized famous place based on opinion mining and Method of the Same
JP2017138931A (en) * 2016-02-05 2017-08-10 雲拓科技有限公司 Patent search method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070047544A (en) * 2005-11-02 2007-05-07 김정진 Method for searching patent document by applying degree of similarity and system thereof
KR20100060734A (en) * 2008-11-28 2010-06-07 한국과학기술원 System for visualization of patent information by forming the keyword based semantic network and method therefor
KR101712291B1 (en) * 2015-12-14 2017-03-13 강원대학교산학협력단 System for recommending a user-customized famous place based on opinion mining and Method of the Same
JP2017138931A (en) * 2016-02-05 2017-08-10 雲拓科技有限公司 Patent search method

Similar Documents

Publication Publication Date Title
US8280886B2 (en) Determining candidate terms related to terms of a query
US8108405B2 (en) Refining a search space in response to user input
JP5391633B2 (en) Term recommendation to define the ontology space
US9317593B2 (en) Modeling topics using statistical distributions
US8060505B2 (en) Methodologies and analytics tools for identifying white space opportunities in a given industry
US20040049499A1 (en) Document retrieval system and question answering system
US8543380B2 (en) Determining a document specificity
CN111680173A (en) CMR model for uniformly retrieving cross-media information
EP2410445A1 (en) A method for creating a dynamic relationship
CN109726274A (en) Problem generation method, device and storage medium
Li et al. Context-based diversification for keyword queries over XML data
Landthaler et al. Extending Full Text Search for Legal Document Collections Using Word Embeddings.
Maiya et al. Topic similarity networks: visual analytics for large document sets
Wang et al. Data-driven approach for bridging the cognitive gap in image retrieval
Petras et al. Cultural heritage in clef (chic) 2013
CN103942232B (en) For excavating the method and apparatus being intended to
AL-Khassawneh et al. Improving triangle-graph based text summarization using hybrid similarity function
KR102029916B1 (en) Intellectual property right document based bigdata analyzing method for design material search
CN106372147B (en) Heterogeneous topic network construction and visualization method based on text network
Hopfgartner et al. Simulated evaluation of faceted browsing based on feature selection
Irshad et al. SwCS: Section-Wise Content Similarity Approach to Exploit Scientific Big Data.
CN114328895A (en) News abstract generation method and device and computer equipment
Bruggmann et al. Spatializing a digital text archive about history
EP2090992A2 (en) Determining words related to a given set of words
Mukherjee et al. Automatic extraction of significant terms from the title and abstract of scientific papers using the machine learning algorithm: A multiple module approach

Legal Events

Date Code Title Description
GRNT Written decision to grant