KR20210091591A - 원천 기술의 평가 방법을 포함하는 전자 장치 - Google Patents

원천 기술의 평가 방법을 포함하는 전자 장치 Download PDF

Info

Publication number
KR20210091591A
KR20210091591A KR1020200004962A KR20200004962A KR20210091591A KR 20210091591 A KR20210091591 A KR 20210091591A KR 1020200004962 A KR1020200004962 A KR 1020200004962A KR 20200004962 A KR20200004962 A KR 20200004962A KR 20210091591 A KR20210091591 A KR 20210091591A
Authority
KR
South Korea
Prior art keywords
data
neural network
processor
artificial neural
network model
Prior art date
Application number
KR1020200004962A
Other languages
English (en)
Other versions
KR102406375B1 (ko
Inventor
이창용
김영춘
Original Assignee
울산과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 울산과학기술원 filed Critical 울산과학기술원
Priority to KR1020200004962A priority Critical patent/KR102406375B1/ko
Publication of KR20210091591A publication Critical patent/KR20210091591A/ko
Application granted granted Critical
Publication of KR102406375B1 publication Critical patent/KR102406375B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Technology Law (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

전자 장치가 개시된다. 다양한 실시예에 따른 전자 장치는 인공 신경망 모델 학습을 위한 훈련 데이터를 입력하기 위한 입력부, 훈련 데이터를 이용하여 인공 신경망 모델을 훈련시키는 프로세서와, 인공 신경망 모델이 저장되고, 다양한 데이터를 기록하는 메모리를 포함하고, 메모리는, 복수의 인스트럭션들을 저장하고, 복수의 인스터럭션들은, 적어도 하나의 프로세서에 의해 실행될 때에, 프로세서가, 외부 서버로부터 데이터를 수집하고 전처리하고, 수집되어 전처리된 데이터를 메모리에 포함된 데이터베이스에 저장하고, 데이터베이스에 저장된 데이터를 바탕으로, 특성 값(characteristic value) 매트릭스를 획득하고, 획득된 매트릭스를 바탕으로, 인공 신경망 모델을 형성하고, 인공 신경망 모델을 통하여, 가치 평가를 수행하도록 제어할 수 있다.

Description

원천 기술의 평가 방법을 포함하는 전자 장치{AN ELECTRONIC DEVICE INCLUDING EVALUATION OPERATION OF ORIGINATED TECHNOLOGY}
다양한 실시예들은 원천 기술의 평가 방법 및 이를 포함하는 전자 장치에 관한 것이다. 구체적으로, 원천 기술의 평가 방법 및 이를 포함하는 전자 장치는 새로운 가치 평가 알고리즘을 적용하여 정확도를 높인 방법을 제공할 수 있다.
원천 기술은 초기 단계 및 기본 기술의 상업화와 관련된 높은 수준의 불확실성으로 인해 경제적 가치를 평가하는 데 어려움을 가진다.
기술의 경제적 평가는 다양한 요인에 영향을 받고, 상업화 이후에만 현실화될 수 있어, 기술 평가는 다루기 힘든 과제이다. 특히, 초기 단계의 기술 및 발명에 있어서, 기술 가치 평가는 더욱 힘든 현실이다.
연구자가 만든 기술의 경제적 가치를 평가하기 위해, 직관적인 판단에서 복잡한 실제 옵션 이론에 이르기까지, 다양한 기술 평가 방법과 같은 정량적 데이터와 과학적 방법을 사용하는 방법에 대한 다양한 연구가 지속되고 있다.
다양한 연구속에서, 직관적인 판단에서 복잡한 실제 옵션 이론에 이르기까지 다양한 기술 평가 방법이 제시되고 있다. 이전의 방법을 검토 한 결과 단일 모델의 사용은 연구자 집단에 의해 개발된 기술의 평가에 적합하지 않을 수 있으나 기존의 평가 방법을 통합하면 시너지를 창출하고 각각의 현재 한계를 극복할 수 있다.
가치 평가의 접근 방식은 상대적 선호도 나 기술적 특성이 아닌 기술의 금전적 가치를 측정하여 실질적인 도움을 제공해야한다. 기술이 상용화에서 가장 중요한 고려 사항이기 때문에 기술의 평가에 뚜렷한 기술적 특성을 포함할 수 있다. 그러나 기술 특성과 기술의 경제적 가치 사이의 관계에 대한 이론적 이해가 부족하거나, 기술 평가와 관련된 복잡성과 비선형성으로 인하여 이러한 평가가 쉽지 않다. 접근 방법의 성능과 유용성은 외부의 유효성을 보장하기 위해 광범위한 프로그램을 통해 평가되여야 한다. 가치 평가 접근 방식은 광범위한 기술을 신속하게 분석하고 수용 가능한 수준의 시간과 비용으로 의사 결정을 지원해야한다.
다양한 실시예에 따르는 원천 기술의 평가 방법은 기술 가치 평가를 위한 금전적 가치와 특허 가치 모델을 통합 한 기술의 가치 평가에 대한 제안하는 알고리즘을 채택할 수 있다. 다양한 실시예에 따르는 원천 기술의 평가 방법은 정량적 지표에 의해 포착된 기술적 특성 또는 우수성과 관련된 경제적 가치에 대한 정보를 제공할 수 있다.
다양한 실시예에 따르는 원천 기술의 평가 방법은 기술 가치 평가의 정확성 및 신뢰성을 높일 수 있고, 이를 통한 개발된 원천 기술의 가치를 바탕으로 다양한 과제를 수행할 수 있다.
다양한 실시예에 따른 전자 장치는 인공 신경망 모델 학습을 위한 훈련 데이터를 입력하기 위한 입력부, 훈련 데이터를 이용하여 인공 신경망 모델을 훈련시키는 프로세서와, 인공 신경망 모델이 저장되고, 다양한 데이터를 기록하는 메모리를 포함하고, 메모리는, 복수의 인스트럭션들을 저장하고, 복수의 인스터럭션들은, 적어도 하나의 프로세서에 의해 실행될 때에, 프로세서가, 외부 서버로부터 데이터를 수집하고 전처리하고, 수집되어 전처리된 데이터를 메모리에 포함된 데이터베이스에 저장하고, 데이터베이스에 저장된 데이터를 바탕으로, 특성 값(characteristic value) 매트릭스를 획득하고, 획득된 매트릭스를 바탕으로, 인공 신경망 모델을 형성하고, 인공 신경망 모델을 통하여, 가치 평가를 수행하도록 제어할 수 있다.
다양한 실시예에 따른 전자 장치는, 기술의 가치 평가를 적절하게 수행할 수 있다.
다양한 실시예에 따르는 전자 장치는, 임의적으로 선택된 샘플을 통하여 형성된 트리로부터 분류를 수행하여, 정확도를 높일 수 있다.
다양한 실시예에 따르는 전자 장치가 포함하는 원천 기술의 평가 방법은 정량적 지표에 의해 포착된 기술적 특성 또는 우수성과 관련된 경제적 가치에 대한 정보를 제공할 수 있다.
도 1은, 다양한 실시에에 따르는 네트워크 환경에서의 전자 장치의 블록도이다.
도 2는, 다양한 실시예에 따르는 가치 평가를 위한 전자 장치의 동작을 나타내는 흐름도이다.
도 1은, 다양한 실시예들에 따른, 신경망 학습 장치(100)의 블럭도이다.
인공 신경망은 입력에 대하여 일반화된 출력(generalized output)을 제공하기 위한 하드웨어, 소프트웨어 또는 이들의 조합을 의미할 수 있다.
예를 들어, 인공 신경망은, 합성곱 신경망 (CNN, Convolutional Neural Network), 마르코프 체인(Markov Chain), 또는 이진화 신경망 (BNN, binarized neural network) 등을 시뮬레이션하기 위한 어플리케이션 및 상기 어플리케이션을 실행하기 위한 프로세서에 기반하여 작동할 수 있다.
도 1을 참조하면, 신경망 학습 장치(100)는 훈련을 통하여 머신 러닝을 수행할 수 있는 장치로서, 인공 신경망으로 구성된 모델을 이용하여 학습하는 장치를 포함할 수 있다. 예를 들면, 신경망 장치(100)는 데이터 마이닝, 데이터 분석, 및 머신 러닝 알고리즘(예: 딥 러닝 알고리즘 (deep learning algorithm))을 위해 이용되는 정보를 입력, 출력, 데이터 베이스 구축 및 저장하도록 구성될 수 있다.
신경망 장치(100)는 통신부(미도시)를 통하여 외부 전자 장치(미도시)와 데이터를 송수신할 수 있고, 외부 전자 장치로부터 전달받은 데이터를 분석하거나 학습하여 결과값을 도출할 수 있다. 신경망 장치(100)는 외부 전자 장치의 연산을 분산하여 처리할 수 있다.
신경망 장치(100)는 서버로 구현될 수 있다. 또한 신경망 장치(100)는 복수로 구성되어 신경망 장치 세트를 이룰 수 있다. 각각의 신경망 장치(100)는 연산을 분산하여 처리할 수 있고, 분산 처리된 데이터를 바탕으로 데이터 분석 및 학습을 통하여 결과값을 도출할 수 있다. 신경망 장치(100)는 머신 러닝 알고리즘 등을 이용하여 획득한 결과값을 외부 전자 장치 또는 다른 신경망 장치로 전송할 수 있다.
다양한 실시예에 따르면, 신경망 장치(100)는 입력부(110), 프로세서(120), 메모리(130), 및 러닝 프로세서(140)를 포함할 수 있다.
다양한 실시예에 따르면, 입력부(110)는 인공 신경망 모델 학습을 통한 출력값을 도출하기 위한 입력 데이터를 획득할 수 있다. 입력부(110)는 가공되지 않은 입력 데이터를 획득할 수 있다. 프로세서(120) 또는 러닝 프로세서(140)는 가공되지 않은 입력데이터를 전처리하여 인공 신경망 모델 학습에 입력 가능한 훈련 데이터를 생성할 수 있다. 상기 전처리는 입력 데이터로부터 특징점을 추출하는 것일 수 있다. 상술한 바와 같이 입력부(110)는 통신부(미도시)를 통하여 데이터를 수신하여 입력 데이터를 획득하거나 데이터를 전처리할 수 있다.
다양한 실시예에 따르면, 프로세서(120)는 신경망 학습 장치(100)에서 사용 히스토리 정보를 수집하여 메모리(130)에 저장할 수 있다. 프로세서(120)는 저장된 사용 히스토리 정보 및 예측 모델링을 통하여 특정 기능을 실행하기 위한 최상의 조합을 결정할 수 있다. 프로세서(120)는 입력부(110)로부터 이미지 정보, 오디오 정보, 데이터 또는 사용자 입력 정보를 수신할 수 있다.
다양한 실시예에 따르면, 프로세서(120)는 정보를 실시간으로 수집하고 정보를 처리 또는 분류하고, 처리된 정보를 메모리(130), 메모리(130)의 데이터 베이스 또는 러닝 프로세서(140)에 저장할 수 있다.
다양한 실시예에 따르면, 신경망 학습 장치(100)의 동작이 데이터 분석 및 머신 러닝 알고리즘을 바탕으로 결정될 때, 프로세서(120)는 결정된 동작을 실행하기 위해 신경망 학습 장치(100)의 구성요소를 제어할 수 있다. 그리고, 프로세서(120)는 제어 명령에 따라 신경망 학습 장치(100)를 제어하여 결정된 동작을 수행할 수 있다.
프로세서(120)는 특정 동작이 수행되는 경우, 데이터 분석 및 머신 러닝 알고리즘 및 기법을 통해 특정 동작의 실행을 나타내는 이력 정보를 분석하고, 분석된 정보에 기초하여 이전에 학습한 정보의 업데이트를 수행할 수 있다. 프로세서(120)는 러닝 프로세서(140)과 함께, 업데이트 된 정보에 기초하여 데이터 분석 및 머신 러닝 알고리즘 및 성능의 정확성을 향상시킬 수 있다.
다양한 실시예에 따르면, 메모리(130)는 입력부(110)에서 획득한 입력 데이터, 학습된 데이터, 또는 학습 히스토리 등을 저장할 수 있다. 메모리(130)는 인공 신경망 모델(131)을 저장할 수 있다.
다양한 실시예에 따르면, 인공 신경망 모델(131)은 메모리(130)에 할당된 공간에 저장될 수 있다. 상기 메모리(130)에 할당된 공간은 러닝 프로세서(140)를 통하여 학습 중 또는 학습된 인공 신경망 모델(131)을 저장하며, 학습을 통하여 인공 신경망 모델(131)이 갱신되면, 갱신된 인공 신경망 모델(131)을 저장할 수 있다. 상기 메모리(130)에 할당된 공간은 학습된 모델을 학습 시점 또는 학습 진척도 등에 따라 복수의 버전으로 구분하여 저장할 수 있다.
다양한 실시예에 따르면, 메모리(130)는 입력부(110)에서 획득한 입력 데이터, 학습된 데이터를 저장, 분류가능한 데이터 베이스를 포함할 수 있다.
다양한 실시예에 따르면, 러닝 프로세서(140)는 프로세서(120)가 입력부(110)를 통해 획득한 입력 데이터를 전처리한 데이터를 바로 획득하여 인공 신경망 모델(131)을 학습하거나, 메모리(130)의 데이터 베이스에 저장된 전처리된 입력 데이터를 획득하여 인공 신경망 모델(131)을 학습할 수 있다. 예를 들면, 러닝 프로세서(140)는 다양한 학 습 기법을 이용하여 인공 신경망 모델(131)을 반복적으로 학습시켜 최적화된 인경 신경망 모델(131) 파라미터를 획득할 수 있다.
다양한 실시예에 따르면, 학습된 모델은 데이터 베이스에서 인공 신경망 모델(131)을 갱신할 수 있다. 러닝 프로세서(140)는 신경망 학습 장치(100)에 통합되거나, 메모리(130)에 구현될 수 있다. 구체적으로 러닝 프로세서(140)는 메모리(130)를 사용하여 구현될 수 있다.
다양한 실시예에 따르면, 러닝 프로세서(140)는 일반적으로 감독 또는 감독되지 않은 학습, 데이터 마이닝, 예측 분석 또는 다른 장치에서 사용하기 위해 데이터를 식별, 색인화, 카테고리화, 조작, 저장, 검색 및 출력하기 위해 데이터를 하나 이상의 데이터베이스에 저장하도록 구성될 수 있다. 여기서, 데이터베이스는 메모리(130), 클라우드 컴퓨팅 환경에서 유지되는 메모리, 또는 네트워크와 같은 통신 방식을 통해 단말기에 의해 액세스 가능한 다른 원격 메모리 위치를 이용하여 구현될 수 있다 러닝 프로세서(140)에 저장된 정보는 다양한 상이한 유형의 데이터 분석 알고리즘 및 기계 학습 알고리즘 중 임의의 것을 사용하여 프로세서(120)에 의해 이용될 수 있다. 예를 들면, 이러한, 알고리즘의 예로는, k-최근 인접 시스템, 퍼지 논리 (예: 가능성 이론), 신경 회로망, 볼츠만 기계, 벡터 양자화, 펄스 신경망, 지원 벡터 기계, 최대 마진 분류기, 힐 클라이밍, 유도 논리 시스템 베이지안 네트워크, 페리트넷 (예: 유한 상태 머신, 밀리 머신, 무어 유한 상태 머신), 분류기 트리 (예: 퍼셉트론 트리, 지원 벡터 트리, 마코프 트리, 의사 결정 트리 포리스트, 임의의 포리스트), 판독 모델 및 시스템, 인공 융합, 센서 융합, 이미지 융합, 보강 학습, 증강 현실, 패턴 인식, 자동화 된 계획 등을 포함한다.
본 문서에 개시된 다양한 실시예들에 따른 외부 전자 장치 또는 전자 장치는 다양한 형태의 장치가 될 수 있다. 전자 장치는, 예를 들면, 휴대용 통신 장치 (예: 스마트폰), 컴퓨터 장치, 휴대용 의료 기기, 카메라, 웨어러블 장치, 또는 가전 장치를 포함할 수 있다. 본 문서의 실시예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다.
본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술적 특징들을 특정한 실시예들로 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 또는 관련된 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 아이템에 대응하는 명사의 단수 형은 관련된 문맥상 명백하게 다르게 지시하지 않는 한, 상기 아이템 한 개 또는 복수 개를 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및 B 중 적어도 하나", "A 또는 B 중 적어도 하나,""A, B 또는 C," "A, B 및 C 중 적어도 하나,"및 "A, B, 또는 C 중 적어도 하나"와 같은 문구들 각각은 그 문구들 중 해당하는 문구에 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", 또는 "첫째" 또는 "둘째"와 같은 용어들은 단순히 해당 구성요소를 다른 해당 구성요소와 구분하기 위해 사용될 수 있으며, 해당 구성요소들을 다른 측면(예: 중요성 또는 순서)에서 한정하지 않는다. 어떤(예: 제 1) 구성요소가 다른(예: 제 2) 구성요소에, "기능적으로" 또는 "통신적으로"라는 용어와 함께 또는 이런 용어 없이, "커플드" 또는 "커넥티드"라고 언급된 경우, 그것은 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로(예: 유선으로), 무선으로, 또는 제 3 구성요소를 통하여 연결될 수 있다는 것을 의미한다.
본 문서에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로 등의 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일실시예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다.
본 문서의 다양한 실시예들은 기기(machine)(예: 전자 장치(101)) 의해 읽을 수 있는 저장 매체(storage medium)(예: 내장 메모리(136) 또는 외장 메모리(138))에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예: 프로그램(140))로서 구현될 수 있다. 예를 들면, 기기(예: 전자 장치(101))의 프로세서(예: 프로세서(120))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장매체는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, ‘비일시적'은 저장매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.
일실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두개의 사용자 장치들(예: 스마트폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.
다양한 실시예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있다. 다양한 실시예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.
도 2는, 다양한 실시예에 따르는 가치 평가를 위한 전자 장치의 동작을 나타내는 흐름도이다.
도 2를 참조하면, 프로세서(예: 도1의 프로세서(120)) 또는 러닝 프로세서(예: 도 1의 러닝 프로세서(140))은 메모리(예: 도 1의 메모리(130))에 저장된 인공 신경망 모델(예: 도 1의 인공 신경망 모델(131))이 데이터의 수집 및 전처리 동작(preprocessing), 기술적 특성 가치 매트릭스(a technological characteristics-value matrix)의 구축 동작 및 원천기술의 가치 평가 동작을 수행하도록 설정될 수 있다.
다양한 실시예에 따르면, 메모리에 저장된 인공 신경망 모델(131)은 기술의 가치 평가를 위한 모델을 학습하는 알고리즘을 포함할 수 있다. 인공 신경망 모델(131)에 포함된 가치 평가를 위한 방법은 우선, 데이터의 수집과 전처리 동작을 할 수 있다(S201). 데이터의 수집과 전치리는 데이터 크롤링(data crawling) 및 파싱(parsing) 기술을 이용할 수 있다. 메모리(130)에 저장된 기술 거래 데이터베이스(210), 특허 데이터베이스(220), 및 간행물 데이터베이스(230) 내에 설정된 기술에 대한 관련 특허는 특허 번호를 사용하여 발행된 특허를 구별하는 식별자인 특허 번호를 기초로 수집될 수 있다. 수집된 특허 문서는 HTML이나 XML 형식의 정형화되거나 비정형화된 데이터들의 혼합물일 수 있다. 따라서 문서는 정보 유형(예: 특허 번호, 출원인, 양수인 및 클래스)에 따라 구문 분석되어(parsed) 구조화된 데이터베이스에 저장될 수 있다. 상술한 데이터 베이스는 메모리(130)에 저장될 수 있다. 프로세서(120) 또는 러닝 프로세서(140)는 메모리(130)에 저장된 기술 거래 데이터 베이스(210), 특허 데이터베이스(220) 및 간행물 데이터베이스(230)의 발명자 또는 연구자에 의해 발행된 특허 및 저널 논문은 발명자 또는 연구자의 개발 노력 및 능력 및 선행 학업 성취를 분석하기 위해 수집되고 전처리를 수행하도록 설정될 수 있다. 또한, 프로세서(120) 또는 러닝 프로세서(140)는 기술 거래 데이터 베이스(210), 특허 데이터베이스(220) 및 간행물 데이터베이스(230)를 인용하는 특허 또는 발행물을 수집하고 전처리하여 이후 동작에서 다양한 데이터를 분석할 수 있다.
다양한 실시예에 따르면, 프로세서는 수집된 데이터 및 전처리된 데이터를 바탕으로, 기술 특성 값 매트릭스를 수립하는 동작을 수행하도록 설정될 수 있다(S202). 특성 값 매트릭스 구축은 참고문헌 및 특허의 분석을 통하여 동작할 수 있다.
다양한 실시예에 따르는 가치 평가를 위한 방법은 정량적 지표에 의해 측정된 기술적 특성과 기술 평가를 통합할 수 있다. 프로세서(120) 또는 러닝 프로세서(140)는 가치 평가를 위한 방법을 세가지 파트로 구분된 기술적 특성 값 매트릭스를 형성하도록 설정할 수 있다. 기술적 특성 값 매트릭스는 기술의 식별자, 이전 단계에서 구성된 데이터베이스(예: 기술 거래 데이터 베이스(210), 특허 데이터베이스(220) 및 간행물 데이터베이스(230))에서 추출된 23 개의 지표 및 시장에서 거래되는 기술의 경제적 가치로 구성될 수 있다.
이전에는, 특허의 품질과 관련 기술의 경제적 가치를 나타내는 수많은 특허 지표가 제시되었다. 상기 특허 지표는 원천 기술의 평가에 사용될 수 없다. 예를 들어, 특허 가치 모델에서 결정적인 변수인 특허의 피인용은, 최신 특허가 인용 또는 인용 실패 되기에 충분한 시간이 필요하기 때문에, 연구자 또는 발명자가 개발한 원천 기술의 평가에 사용될 수 없다. 가치 평가를 위한 방법은 지표 측정 및 데이터베이스에서 추출할 수 있는 시점을 고려하여 총 23 개의 지표를 정의할 수 있다. 이 지표는 특성 및 시사점에 따라 (1) 기술 분야 및 범위, (2) 신규성 및 독창성, (3) 보호 및 시장 커버리지, (4) 개발 노력 및 역량, (5) 학업 성취도와 같은 다섯 가지 범주에 포함될 수 있다.
동일한 범주에 속하는 상기 지표들은 유사한 개념 (예: 핵심 영역 강도 및 주변 영역 강도)을 측정하거나 서로 다른 레벨(예: 클래스 수준 독창성 및 메인 라인 하위 클래스 수준 독창성)에서 동일한 개념을 측정하여 세부적인 특성 분석할 수 있다.
참고문헌으로부터 유래된 첫 번째 네 가지 범주(기술 분야 및 범위, 신규성 및 독창성, 보호 및 시장 커버리지, 및 개발 노력 및 역량)는 특허 데이터베이스(220)에 의존하는 반면 다섯 번째 범주인 학업 성취도는 간행물 데이터베이스(230)를 사용할 수 있다. 중요한 것은 관련 기술이 서버에 등록된 직후 데이터베이스에서 모든 지표를 추출할 수 있으므로 발명자 집단이 생성 한 기술의 가치를 조기에 평가할 수 있다. 표 1은 지표의 운영상의 정의를 보다 자세한 정보를 얻기 위한 출발점으로 사용할 수 있는 참고 자료와 지표를 요약한 것이다.
다양한 실시예에 따르면, 프로세서(120) 또는 러닝 프로세서(140)는 가치 평가를 위한 방법은 발명자 집단의 원천 기술의 경제적 가치 평가를 수행할 수 있다(S203). 발명자 집단의 원천 기술의 경제적 가치 평가는 다양한 실시예에 따르는 알고리즘에 따라 구현될 수 있다.
카테고리 서브 카테고리 지표 작업
기술분야 및 범위 기술분야 주요분야(main field) 특허 주요 분류
기술범위 특허 개수(patent count, PC) 해당 기술 특허 개수
Class level scope(CS) 보유특허가 속한 클래스 개수
Mainline subclass-level scope(MS) 보유 특허가 속한 mainline subclass 수
신규성 및 독착성 신규성 출판 년도(PY) 특허 발행 년도
종래 기술(PK) 특허 피인용수
과학 기술(SK) 특허에 대한 비특허 참고 문헌 수
기술 주기(TCT) 인용된 특허의 중간 값
독창성 Class level originality (CO) 인용 특허의 클래스에 관한 헤르핀달 지수(Herfindahl index)
Mainline subclass-level originality (MO) 인용 특허의 mainline subclass에 관한 헤르핀달 지수
보호 범위 및 시장 범위 보호범위 독립항(IC) 특허의 독립항 수
종속항(DC) 특허의 종속항 수
시장 범위 패밀리 특허(PF) 동일 발명의 범위와 관련하여 타 국가에 등록된 특허의 수
개발 개발 협동(Col) 개발 집단에서 적어도 하나이상의 출원인을 포함하면 1,
아니면, 0을 부여
능력 맨파워 인력 특허 발명자 수
개발 능력 총 노하우(TKH) 출원인에 의해 발행된 특허의 수
노하우의 코어 영역 출원인에 의해 발행된 기술적 관심 분야에서의 특허의 수
노하우의 주변 영역 출원인에 의해 발행된 타 기술분야에서의 특허의 수
전체 기술 영향(TTS) 출원인에 의해 발행된 피인용 특허의 수
코어 기술 영향(CTS) 출원인에 의해 발행된 관심분야에서의 피인용 특허의 수
주변 기술 영향(PTS) 출원인에 의해 발행된 다른 분야에서의 피인용 특허의 수
종래의 학문적 성과 연구 역량 연구의 양적 지표 주요 발명자에 의해 발행된 문헌의 인용 횟수
연구의 질적 지표 주요 발명자에 의해 발행된 문헌의 수
연구소 또는 대학과 같은 발명자 집단이 개발한 기술의 경제적 가치는 여러 요인의 영향을 받으므로 정확하게 산출하기 어렵다. 기술 사업화 종사자들은 A, B, C와 같은 등급을 사용하여 연구소 또는 대학과 같은 발명자 집단에서 유래된 기술의 경제적 가치를 대략적으로 평가할 수밖에 없다. 다양한 실시예에 따르는 가치 평가를 위한 방법은 후술할 알고리즘을 사용하여 이전 섹션에서 정의된 지표에 기초하여 추정된 경제 가치에 따라 기술을 분류할 수 있다. 다양한 실시예에 따르면, 후술할 알고리즘은 인공 신경망 모델(131)에 의해 구현될 수 있으며, 알고리즘은 프로세서(120) 또는 러닝 프로세서(140)에 의해 동작이 제어될 수 있다.
다양한 실시예에 따르는 알고리즘은, 예를 들면, 이전 단계(S202)에서 정의된 지표
Figure pat00001
가 P차원 입력 벡터로 입력될 때, 의사 결정 트리의 집합
Figure pat00002
으로 구성된 머신 러닝 모델일 수 있다.
표준 의사 결정 트리와 비교하여, 학습 과정에 임의의 미세 변동(perturbations)을 도입하고, 단일 학습 세트에서 생성된 다양한 모델의 예측을 결합하여 일반적인 오류를 크게 줄일 수 있다. 구체적으로, 이 방법은 최종 예측
Figure pat00003
를 제공하기 위해 집계되는 개별 결정 트리
Figure pat00004
에서
Figure pat00005
출력을 생성할 수 있다. 분류 문제의 경우, 최종 예측
Figure pat00006
는 다수결 원칙{majority rule}을 사용하여 결정될 수 있다.
다양한 실시예에 따르는 알고리즘의 동작은 다음의 세가지 단계를 포함할 수 있다. 첫번째 단계는 원래 데이터로부터
Figure pat00007
부트스트랩(bootstrap) 샘플을 가져올 수 있다(즉, 무작위로 교체 샘플). 두 번째 단계는 각 부트스트랩 샘플에 관한 완전히 성숙되되, 정리되지 않은 의사 결정 트리를 구성할 수 있다. 여기서, 모든 입력 변수들 중에서 최상의 분할이 선택된 표준 결정 트리와 달리, 다양한 실시예에 따르는 알고리즘은 무작위로 선택된 입력 변수들 중에서 최상의 분할로 선택할 수 있다.
마지막으로, 새로운 데이터는
Figure pat00008
결정 트리
Figure pat00009
(회귀 분석을 위한 과정 및 분류에 관한 다수결 원칙을 사용)의 예측을 집계하여 분류될 수 있다.
부트스트랩 기법의 사용은 임의 알고리즘 모델에서 아웃 오브 백(out-of-bag, OOB) 샘플(
Figure pat00010
로 불리는 남은 샘플을 사용하여 중요한 통계의 중요한 통계의 내부 추정치를 제공할 수 있다. 평균적으로, 각 결정 트리는 샘플의 대략
Figure pat00011
를 사용하여 성장하며,
Figure pat00012
을 OOB 샘플로 남겨둘 수 있다. 일반화 오류의 경우, OOB 샘플(예: 입력 변수
Figure pat00013
및 해당 클래스 레이블
Figure pat00014
)의 데이터는 부트스트랩 샘플 θm에
Figure pat00015
가 포함되지 않은 개별 결정 트리
Figure pat00016
에 의해 예측될 수 있다.
Figure pat00017
와 오차율은 정의대로 OOB 예측에 대한 오차율을 집계하여 계산할 수 있다.
Figure pat00018
여기서 I는 인디케이터 함수이며, m은 부트스트랩 샘플 θm에
Figure pat00019
Figure pat00020
가 포함되지 않은 개별 결정 트리
Figure pat00021
의 개수이며, n은 샘플 개수이다. 또한, 이 방법은 아래와 같이 OOB 샘플 내에서
Figure pat00022
값이 무작위로 치환될 때 예측 오차가 얼마나 증가하는지 조사하여 입력 변수
Figure pat00023
의 중요성을 평가할 수 있다.
Figure pat00024
상기 식에서,
Figure pat00025
는 OOB 샘플에서 단일 의사 결정 트리
Figure pat00026
의 오류를 나타내고,
Figure pat00027
, i는 OOB의
Figure pat00028
값이 치환된 교란된 샘플에서 의사 결정 트리
Figure pat00029
의 오류를 나타낼 수 있다.
다양한 실시예에 따르는, 상기 알고리즘을 포함하는 가치 평가 모델은 아래의 효과를 가질 수 있다. 다중 선형 회귀 및 로지스틱 회귀 분석과 같은 기존의 통계 모델과 달리, 경험적, 회귀적, 반복 학습 과정을 통하여 비선형 수학 모델로 구성된, 상기의 가치 평가 모델은 사전 결정된 곡선 및 확률 분포에 대한 가정없이 기술 평가와 관련된 복잡성 및 비선형성을 처리할 수 있다. 상기의 가치 평가 모델은 일반화 오류에 관한 신뢰할 만한 추정치와 변수의 중요도를 제공할 수 있어, 상기의 가치 평가 모델과 관련되지 않는 입력 변수를 무시할 수 있고, 기술 특성 및 기술의 가치에 대한 이론적 이해가 없이 탐색할 수 있다. 마지막으로, 상기의 가치 평가 모델은 다른 방법보다 일관되게 일반화 오류가 낮으므로 문제를 피하고 누락된 데이터를 효과적으로 처리하여 실제로 적용성을 향상시킬 수 있다.
다양한 실시예에 따르면, 알고리즘은 각각의 지표들을 이용하여, 입력된 의사 결정트리로부터 개별 결정 트리
Figure pat00030
Figure pat00031
출력을 생성할 수 있다.
다양한 실시예에 따르면, 가치 평가를 위한 방법은 상술한 알고리즘들을 바탕으로 산출된
Figure pat00032
값들을 검증할 수 있다(S204). 검증(validation)은 상술한 알고리즘의 결과값으로 성능 평가를 통하여 수행할 수 있다.
접근 방식의 성능과 유용성은 다양한 분류 문제와 관련된 경제적 가치에 따른 연구자 집단의 원천기술의 분류 능력과 관련될 수 있다. 이를 고려하여, 가치 평가를 위한 방법은 몇 가지 성능 메트릭을 사용하여 제안된 방법의 정확성과 신뢰성을 조사할 수 있다. 먼저, 다양한 실시예에 따르는 가치 평가를 위한 방법은 아래의 수식에 정의 된대로 클래스 당 정확도와 제안된 접근법의 전체 정확도를 측정할 수 있다.
Figure pat00033
Figure pat00034
여기서, 변수들은 클래스 i에 대한 정확하게 분류된 positive sample인 TP(true positive)의 수
Figure pat00035
, 클래스 i에 대하여, 정확하게 분류된 negative sample인 TN(true negative)의 수
Figure pat00036
, 클래스 i에 대하여, 부정확하게 분류된 positive sample인 FP(false positive)의 수
Figure pat00037
및 클래스 i에 대하여, 부정확하게 분류된 negative sample인 FN(false negative)의 수
Figure pat00038
이고, l은 클래스 수일 수 있다. 사례 연구에서 가중치가 다른 클래스를 보완하고 데이터 세트의 불균형으로 인해 정밀도 (양(positive)의 예측 값), 리콜 (true positive 비율 또는 민감도) 및 진단 확률 비 (DOR, diagnostic odds ratio)를 추가할 수 있다. 정밀도는 TP 결과 값을 모든 양성(positive) 결과 값으로 나눈 값이고, 리콜은 TP 결과 값 반환되는 양성 결과 값으로 나눈 것일 수 있다.
DOR은 분류 자의 전반적인 효율을 측정한 것일 수 있다. 피험자가 실제로 음성 인 경우 분류가 양성일 가능성이 높은 경우, DOR은 피험자가 실제로 음성임에도, 양성으로 분류할 가능성에 대한 비율로 정의될 수 있다.
Figure pat00039
여기서 감도와 리콜은 동일하지만, specificity는 정확하게 식별된 네거티브의 비율일 수 있다. DOR은 출현률(prevalence) 또는 균형 잡힌 세트(balanced set)와 독립적이고, DOR의 범위는 0에서 무한대일 수 있다. 하나의 수단인 DOR은 테스트가 실제 조건에 관계없이 부정확한 긍정적인 결과를 예측하여 정보를 제공하지 않음을 예상되는 수치로 나타낸다. DOR이 높음은 성능의 우수성을 나타낼 수 있다.
다양한 실시예에 따르는 가치 평가를 위한 알고리즘은 상술한 표 1의 지표를 바탕으로 상술한 동작으로 수행될 수 있다. 데이터 수집 및 전처리 동작(S201)의 경우, 특허 데이터베이스는 각국의 특허청은 데이터 소스의 역할을 할 수 있다. 관련 특허를 자동으로 다운로드 할 수 있다. 다운 받은 데이터는 구조에 따라 구문 분석되어 각 데이터를 내용으로 구분할 수 있다. 특허 번호, 양수인, 인용, 클레임, 클래스 및 기타 정보에 대한 세부 정보는 데이터 베이스 프로그램을 사용하여 구축한 특허 데이터 베이스에 저장될 수 있다.
다양한 실시예에 따르는 가치 평가를 위한 알고리즘이 수집된 데이터 및 전처리된 데이터를 바탕으로, 기술 특성 값 매트릭스를 수립하는 동작(S202)을 수행하는 경우, 기술들은 예측되는 경제적 가치에 따라 분류될 수 있다. 예를 들면, 가치 평가를 위한 알고리즘은 표 2에 나타난 대로, 예측되는 경제적 가치에 따라 세개의 카테고리로 그룹을 형성할 수 있다.
카테고리 예측되는 경제적 가치 포함된 기술의 개수
L1 $500,000 이상 83 (3.8%)
L2 $50,000 내지 $500,000 356 (16.1%)
L3 0 내지 $50,000 1772 (80.1%)
합계 2211 (100%)
여기서, 카테고리 L1은 가장 가치가 높고, 반면에 카테고리 L3는 가치가 가장 낮을 수 있다. L1 기술에는 83 개의 기술 (3.8 %)만이 포함되어 있으나, 총 수익의 58 %를 차지할 수 있다. 알고리즘 입력을 위한, 통합 데이터베이스에서 총 23 개의 지표를 추출하여 기술적 특성 값 매트릭스를 구성할 수 있다.
결과값으로 형성된 기술적 특성 값 매트릭스는 2212 x 25 매트릭스로, 랜덤 포레스트 모델을 훈련시키는 데 사용될 수 있다. 표 3을 살펴보면, 형성된 매트릭스의 일부를 나타낸다.
Figure pat00040
표 3에서 첫 번째 열은 23 개의 입력 표시기 뒤에 기술 식별자(Technology ID)를 표시하고 마지막 열은 분류된 기술 카테고리를 나타낼 수 있다. 여러 특허가 있는 기술 (예: 03-274, 14-276)의 경우 기술 지표는 특허 지표의 평균을 계산하거나 다수를 식별하여 파악됩니다. 예를 들어, 기술 03-274에는 2010 년, 2013 년 및 2013 년에 발행된 각각 US 특허 클래스 606, 606 및 218 (1 차 클래스)에 속하는 3 개의 특허를 포함할 수 있다. 이 기술은 독창성, 특허 패밀리, 학술 논문 및 인용 횟수와 같은 많은 지표에 대해 높은 가치를 가지며 L1 기술로 분류될 수 있다. 이에 반하여, 기술 03-278은2011 년에 발행된 하나의 특허를 보유하고 있으며 기술주기 시간, 독창성 및 특허 제품군과 같은 주요 지표에 대한 값이 낮은 L3 기술로 분류될 수 있다.
상술한 기술 가치 평가 알고리즘은 아래의 방법으로 원천기술의 가치를 평가할 수 있다(S203). 먼저 트리 수 (
Figure pat00041
)와 각 노드의 랜덤 하위 집합에있는 변수 수(
Figure pat00042
)를 결정할 수 있다. 1 ~ 500개의 tree를 10 개의 tree 단위로 무작위 포리스트(forest)를 구성할 수 있다. 100 이상으로 tree로 구축하는 경우, 성능이 크게 향상되지는 않았지만 실행 시간이 상당히 늘어날 수 있다. 실행 시간과 분류 성능 사이의 균형을 고려하여 tree 수는 100으로 설정될 수 있다.
상기와 같이 설정된 기술 가치 평가 알고리즘은 예측된 경제적 가치에 따라 기술을 분류할 수 있다. 기술 가치 평가 알고리즘은 OOB 예측 외에도 각 범주의 기술 수가 불균형하기 때문에 철저한 성능 평가를 위해 5 가지 계층화된 샘플링 기법을 채용할 수 있다. 구체적으로, 특허 인용 횟수 (즉, L1, L2 및 L3)에 따라 기술을 균질 한 지층으로 나눈 후 샘플링으로 각 계층 내에서 랜덤 샘플링을 적용했습니다. 기술의 총 80 %가 훈련 데이터 세트로 사용되었으며 나머지 20 %는 테스트 데이터 세트로 사용될 수 있다.
표 3의 마지막 열은 해당 기술이 테스트 데이터 세트에 사용될 때 예측된 경제적 가치를 나타냅니다. 예를 들어, 2010 년에 발표된 3 개의 특허를 가지고 있고 독창성, 특허 패밀리, 학술 논문 및 인용 횟수와 같은 많은 지표에 대해 높은 가치를 갖는 기술 03-274는 L1 기술로 분류되지만, 기술 03-278은 2011 년에 발표된 하나의 특허를 보유하고 있으며 기술주기 시간, 독창성 및 특허 제품군과 같은 주요 지표에 대한 값이 낮으며 L3 기술로 분류될 수 있다.
상술한 기술 가치 평가 알고리즘은 아래의 방법으로 성능을 평가할 수 있다. 5가지 교차 검증 기술을 이용한 몇가지 메트릭들(metrics)은 복합 행렬을 구성한 후 성능 평가의 접근을 위하여 표 4와 같이 평가될 수 있다.
Figure pat00043
표 4의 (b)에 개시된 바와 같이, 다양한 실시예에 따르는 알고리즘에 따른 접근법의 전체 정확도는 81 %이며 수동적인 방법으로 수행한 방법의 정확도64 % 보다 높을 수 있다. 수동적인 접근법은 각각 93 % (L1), 72 % (L2) 및 65 % (L3) 정확도를 나타낼 수 있다. 다양한 실시예에 따르는 알고리즘에 따른 접근법은 기술이 데이터 베이스에 등록된 직후에 정의되고 추출할 수 있는 제한된 지표가 주어짐으로 원천 기술의 경제적 가치를 효과적으로 평가할 수 있다. 정밀성 및 리콜 척도는 다양한 실시예에 따르는 알고리즘에 따른 접근법이 연구자 집단의 원천기술을 분류하는 경우, 정확성과 신뢰성을 줄 수 있다. 특히 다양한 실시예에 따르는 접근법은 라이센스가 부여될 가능성이 가장 적은 기술을 식별하는 데 효과적일 수 있다. DOR은 제안된 접근 방식이 기술을 분류하는 데 효과적이라는 것을 보여줄 수 있다. DOR이 높을수록 긍정(positive)를 부정확하게 나타내는 것이 적어지므로, 성능의 신뢰성이 높아 질 수 있다.
또한 DOR은 제안된 접근 방식이 원천 기술을 분류하는 데 효과적이지만 다른 클래스에 따라 분류 효과의 정도에는 차이가 있을 수 있지만, 다양한 실시예에 따르는 접근 방법은 가치있는 기술을 선별하는 데 효과적일 수 있다.
일부 기술은 데이터 세트에 전문가 평가 결과가 없을 수 있어, 전문가 평가를 위한 복합 행렬의 기술 개수는 제안된 접근법과 다를 수 있다. DOR에 따르면, 전문가 평가는 가장 귀중한 기술을 잘 식별하지만 정확성과 신뢰성 측면에서 제안된 접근 방식에 비해 성능이 저하된다는 점에서 우리의 방법과는 다른 평가 방식일 수 있다.
전문가에 의해 수동으로 수행된 조사의 경우에도, L1과 같이 기술의 가치가 높은 경우에는 평가의 정확도가 높을 수 있으나, 다양한 실시예에 따르는 접근 방식의 정확도는 전체적으로 수동적인 평가의 정확도보다 높아 보다 안정적인 예측을 제공할 수 있다.
또한, 많은 다른 머신 러닝 모델이 이러한 목적으로 사용될 수 있다는 것을 고려하여, 다양한 실시예에 따르는 접근법의 성능은 표 4 (e)에 나타난 바와 같이 2 가지 주요 분류 모델 (신경망 및 지원 벡터 머신)의 성능과 비교된다.
다양한 실시예에 따르는 가치 평가 모델은 데이터 셋에서 다른 분류 모델보다 우수한 성능을 보여줄 수 있다. 정확도에 있어서, 신경망 모델 또는 지원 벡터 머신 모델과 유사하거나 높음을 알 수 있다. 필요에 따라 적절하게 다른 알고리즘의 지원으로 정확도를 보완할 수 있다.
상술한 다양한 실시예에 따르는 전자 장치는, 인공 신경망 모델 학습을 위한 훈련 데이터를 입력하기 위한 입력부, 상기 훈련 데이터를 이용하여 상기 인공 신경망 모델을 훈련시키는 프로세서와, 상기 인공 신경망 모델이 저장되고, 다양한 데이터를 기록하는 메모리를 포함하고, 상기 메모리는, 복수의 인스트럭션들을 저장하고, 상기 복수의 인스터럭션들은, 상기 적어도 하나의 프로세서에 의해 실행될 때에, 상기 프로세서가, 외부 서버로부터 데이터를 수집하고 전처리하고, 상기 수집되어 전처리된 데이터를 메모리에 포함된 데이터베이스에 저장하고, 상기 데이터베이스에 저장된 상기 데이터를 바탕으로, 특성 값(characteristic value) 매트릭스를 획득하고, 상기 획득된 매트릭스를 바탕으로, 상기 인공 신경망 모델을 형성하고, 상기 인공 신경망 모델을 통하여, 가치 평가를 수행할 수 있다.
다양한 실시예에 따르면, 상기 복수의 인스터럭션들은, 상기 적어도 하나의 프로세서에 의해 실행될 때에, 상기 프로세서가, 외부 서버로부터 데이터를 바탕으로, 데이터 크롤링(data crawling) 및 파싱(parsing)을 통하여 전처리하도록 제어할 수 있다.
다양한 실시예에 따르면, 상기 기술 특성 값 매트릭스는, 상기 데이터를 식별하기 위한 식별자, 상기 데이터베이스를 바탕으로 형성된 복수의 지표 및, 상기 데이터베이스를 바탕으로 획득된 결과값을 포함할 수 있다.
다양한 실시예에 따르면, 상기 복수의 인스터럭션들은, 상기 적어도 하나의 프로세서에 의해 실행될 때에, 상기 프로세서가, 상기 결과값을 바탕으로, 상기 식별자를 분류하도록 제어할 수 있다.
다양한 실시예에 따르면, 상기 복수의 인스터럭션들은, 상기 적어도 하나의 프로세서에 의해 실행될 때에, 상기 프로세서가, 성능 평가를 이용하여, 상기 결과값을 바탕으로 성능 검정을 하도록 제어할 수 있다.
다양한 실시예에 따르면, 상기 복수의 인스터럭션들은, 상기 적어도 하나의 프로세서에 의해 실행될 때에, 상기 프로세서가, 상기 데이터베이스를 바탕으로 입력 벡터를 형성하고, 상기 입력 벡터는 의사 결정 트리의 집합으로 형성된 상기 인공 신경망 모델을 통하여 개별 결정 트리를 획득하고, 상기 개별 결정 트리를 바탕으로 상기 결과값을 획득하도록 제어할 수 있다.
다양한 실시예에 따르면, 상기 인공 신경망 모델은 상기 획득된 매트릭스를 바탕으로, 의사 결정 트리의 집합을 포함할 수 있다.
다양한 실시예에 따르면, 상기 복수의 인스터럭션들은, 상기 적어도 하나의 프로세서에 의해 실행될 때에, 상기 프로세서가, 상기 인공 신경망 모델을 통하여, 상기 데이터베이스의 데이터로부터, 무작위로 샘플을 선택하도록 제어할 수 있다.
본 개시의 청구항 또는 명세서에 기재된 실시 예들에 따른 방법들은 하드웨어, 소프트웨어, 또는 하드웨어와 소프트웨어의 조합의 형태로 구현될(implemented) 수 있다.
소프트웨어로 구현하는 경우, 하나 이상의 프로그램(소프트웨어 모듈)을 저장하는 컴퓨터 판독 가능 저장 매체가 제공될 수 있다. 컴퓨터 판독 가능 저장 매체에 저장되는 하나 이상의 프로그램은, 전자 장치(device) 내의 하나 이상의 프로세서에 의해 실행 가능하도록 구성된다(configured for execution). 하나 이상의 프로그램은, 전자 장치로 하여금 본 개시의 청구항 또는 명세서에 기재된 실시 예들에 따른 방법들을 실행하게 하는 명령어(instructions)를 포함한다.
이러한 프로그램(소프트웨어 모듈, 소프트웨어)은 랜덤 액세스 메모리 (random access memory), 플래시(flash) 메모리를 포함하는 불휘발성(non-volatile) 메모리, 롬(ROM: Read Only Memory), 전기적 삭제가능 프로그램가능 롬(EEPROM: Electrically Erasable Programmable Read Only Memory), 자기 디스크 저장 장치(magnetic disc storage device), 컴팩트 디스크 롬(CD-ROM: Compact Disc-ROM), 디지털 다목적 디스크(DVDs: Digital Versatile Discs) 또는 다른 형태의 광학 저장 장치, 마그네틱 카세트(magnetic cassette)에 저장될 수 있다. 또는, 이들의 일부 또는 전부의 조합으로 구성된 메모리에 저장될 수 있다. 또한, 각각의 구성 메모리는 다수 개 포함될 수도 있다.
또한, 상기 프로그램은 인터넷(Internet), 인트라넷(Intranet), LAN(Local Area Network), WLAN(Wide LAN), 또는 SAN(Storage Area Network)과 같은 통신 네트워크, 또는 이들의 조합으로 구성된 통신 네트워크를 통하여 접근(access)할 수 있는 부착 가능한(attachable) 저장 장치(storage device)에 저장될 수 있다. 이러한 저장 장치는 외부 포트를 통하여 본 개시의 실시 예를 수행하는 장치에 접속할 수 있다. 또한, 통신 네트워크상의 별도의 저장장치가 본 개시의 실시 예를 수행하는 장치에 접속할 수도 있다.
상술한 본 개시의 구체적인 실시 예들에서, 개시에 포함되는 구성 요소는 제시된 구체적인 실시 예에 따라 단수 또는 복수로 표현되었다. 그러나, 단수 또는 복수의 표현은 설명의 편의를 위해 제시한 상황에 적합하게 선택된 것으로서, 본 개시가 단수 또는 복수의 구성 요소에 제한되는 것은 아니며, 복수로 표현된 구성 요소라 하더라도 단수로 구성되거나, 단수로 표현된 구성 요소라 하더라도 복수로 구성될 수 있다.
한편 본 개시의 상세한 설명에서는 구체적인 실시 예에 관해 설명하였으나, 본 개시의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 개시의 범위는 설명된 실시 예에 국한되어 정해져서는 아니 되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.
100 : 입력부
120: 프로세서
130 : 메모리
131 : 인공 신경망 모델
140 : 러닝 프로세서

Claims (8)

  1. 전자 장치에 있어서,
    인공 신경망 모델 학습을 위한 훈련 데이터를 입력하기 위한 입력부;
    상기 훈련 데이터를 이용하여 상기 인공 신경망 모델을 훈련시키는 프로세서; 및
    상기 인공 신경망 모델이 저장되고, 다양한 데이터를 기록하는 메모리;를 포함하고,
    상기 메모리는, 복수의 인스트럭션들을 저장하고,
    상기 복수의 인스터럭션들은, 상기 적어도 하나의 프로세서에 의해 실행될 때에, 상기 프로세서가,
    외부 서버로부터 데이터를 수집하고 전처리하고,
    상기 수집되어 전처리된 데이터를 메모리에 포함된 데이터베이스에 저장하고.
    상기 데이터베이스에 저장된 상기 데이터를 바탕으로, 특성 값(characteristic value) 매트릭스를 획득하고,
    상기 획득된 매트릭스를 바탕으로, 상기 인공 신경망 모델을 형성하고,
    상기 인공 신경망 모델을 통하여, 가치 평가를 수행하도록 제어하는 전자 장치.
  2. 제1항에 있어서,
    상기 복수의 인스터럭션들은, 상기 적어도 하나의 프로세서에 의해 실행될 때에, 상기 프로세서가,
    외부 서버로부터 데이터를 바탕으로, 데이터 크롤링(data crawling) 및 파싱(parsing)을 통하여 전처리하도록 제어하는 전자 장치.
  3. 제1항에 있어서,
    상기 기술 특성 값 매트릭스는,
    상기 데이터를 식별하기 위한 식별자, 상기 데이터베이스를 바탕으로 형성된 복수의 지표 및, 상기 데이터베이스를 바탕으로 획득된 결과값을 포함하는 전자 장치.
  4. 제3항에 있어서,
    상기 복수의 인스터럭션들은, 상기 적어도 하나의 프로세서에 의해 실행될 때에, 상기 프로세서가,
    상기 결과값을 바탕으로, 상기 식별자를 분류하도록 제어하는 전자 장치.
  5. 제3항에 있어서,
    상기 복수의 인스터럭션들은, 상기 적어도 하나의 프로세서에 의해 실행될 때에, 상기 프로세서가,
    성능 평가를 이용하여, 상기 결과값을 바탕으로 성능 검정을 하도록 제어하는 전자 장치.
  6. 제3항에 있어서,
    상기 복수의 인스터럭션들은, 상기 적어도 하나의 프로세서에 의해 실행될 때에, 상기 프로세서가,
    상기 데이터베이스를 바탕으로 입력 벡터를 형성하고,
    상기 입력 벡터는 의사 결정 트리의 집합으로 형성된 상기 인공 신경망 모델을 통하여 개별 결정 트리를 획득하고,
    상기 개별 결정 트리를 바탕으로 상기 결과값을 획득하도록 제어하는 전자 장치.
  7. 제1항에 있어서,
    상기 인공 신경망 모델은 상기 획득된 매트릭스를 바탕으로, 의사 결정 트리의 집합을 포함하는 전자 장치.
  8. 제7항에 있어서,
    상기 복수의 인스터럭션들은, 상기 적어도 하나의 프로세서에 의해 실행될 때에, 상기 프로세서가,
    상기 인공 신경망 모델을 통하여, 상기 데이터베이스의 데이터로부터, 무작위로 샘플을 선택하도록 제어하는 전자 장치.
KR1020200004962A 2020-01-14 2020-01-14 원천 기술의 평가 방법을 포함하는 전자 장치 KR102406375B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200004962A KR102406375B1 (ko) 2020-01-14 2020-01-14 원천 기술의 평가 방법을 포함하는 전자 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200004962A KR102406375B1 (ko) 2020-01-14 2020-01-14 원천 기술의 평가 방법을 포함하는 전자 장치

Publications (2)

Publication Number Publication Date
KR20210091591A true KR20210091591A (ko) 2021-07-22
KR102406375B1 KR102406375B1 (ko) 2022-06-07

Family

ID=77158135

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200004962A KR102406375B1 (ko) 2020-01-14 2020-01-14 원천 기술의 평가 방법을 포함하는 전자 장치

Country Status (1)

Country Link
KR (1) KR102406375B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116128378A (zh) * 2023-04-04 2023-05-16 北京佰信蓝图科技股份有限公司 一种城市体检评估方法、系统、存储介质及电子设备
CN117352169A (zh) * 2023-09-08 2024-01-05 四川互慧软件有限公司 基于神经网络模型的蛇伤康复评价方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180127622A (ko) * 2017-12-07 2018-11-29 최윤진 텍스트 데이터 수집 및 분석을 위한 시스템
KR20190049549A (ko) * 2017-10-30 2019-05-09 한국과학기술원 집단지성과 실시간 인공지능학습엔진을 이용한 확률기반 기술가치평가 및 기술거래 온라인플랫폼
KR20190070702A (ko) * 2017-12-13 2019-06-21 주식회사 한류에이아이센터 텍스트 마이닝 기반 보안 이벤트 자동 검증 시스템 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190049549A (ko) * 2017-10-30 2019-05-09 한국과학기술원 집단지성과 실시간 인공지능학습엔진을 이용한 확률기반 기술가치평가 및 기술거래 온라인플랫폼
KR20180127622A (ko) * 2017-12-07 2018-11-29 최윤진 텍스트 데이터 수집 및 분석을 위한 시스템
KR20190070702A (ko) * 2017-12-13 2019-06-21 주식회사 한류에이아이센터 텍스트 마이닝 기반 보안 이벤트 자동 검증 시스템 및 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116128378A (zh) * 2023-04-04 2023-05-16 北京佰信蓝图科技股份有限公司 一种城市体检评估方法、系统、存储介质及电子设备
CN117352169A (zh) * 2023-09-08 2024-01-05 四川互慧软件有限公司 基于神经网络模型的蛇伤康复评价方法、装置及电子设备

Also Published As

Publication number Publication date
KR102406375B1 (ko) 2022-06-07

Similar Documents

Publication Publication Date Title
Molnar et al. Pitfalls to avoid when interpreting machine learning models
WO2019165673A1 (zh) 一种报销单风险预测方法、装置、终端设备及存储介质
CN102792327A (zh) 用于进行消费者调查的方法
CN106875206A (zh) 信息获取、评估、问卷调查方法、装置及服务器
CN107230108A (zh) 业务数据的处理方法及装置
CN112116184A (zh) 使用历史检验数据的工厂风险估计
CN111582538A (zh) 一种基于图神经网络的社群价值预测方法及系统
CN111797320B (zh) 数据处理方法、装置、设备及存储介质
KR102406375B1 (ko) 원천 기술의 평가 방법을 포함하는 전자 장치
US20220114685A1 (en) Method and system of evaluating attribution of patent content using classification information
CN108885628A (zh) 数据分析方法候选决定装置
CN112116168B (zh) 一种用户行为的预测方法、装置及电子设备
CN110866832A (zh) 一种风险控制方法、系统、存储介质及计算设备
Frey et al. Modeling ecological success of common pool resource systems using large datasets
CN113253709B (zh) 一种适用于轨道交通车辆健康诊断方法及装置
CN114548494A (zh) 一种可视化造价数据预测智能分析系统
CN113962160A (zh) 基于用户画像的互联网卡用户流失预测方法及系统
CN111695625A (zh) 一种基于多级注意力机制网络的移动应用流行度预测方法
CN112789636A (zh) 信息处理装置、信息处理方法和程序
CN116308486A (zh) 一种目标卷烟销量预测方法、装置、电子设备及存储介质
CN113837266B (zh) 一种基于特征提取和Stacking集成学习的软件缺陷预测方法
CN113656692B (zh) 基于知识迁移算法的产品推荐方法、装置、设备及介质
Rashid et al. Software Cost and Effort Estimation: Current Approaches and Future Trends
CN110472680B (zh) 目标分类方法、装置和计算机可读存储介质
CN114610590A (zh) 作业运行时长确定方法、装置、设备及存储介质

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant