KR101318923B1 - 자료 특징 추출 시스템 및 자료 특징 추출 방법 - Google Patents

자료 특징 추출 시스템 및 자료 특징 추출 방법 Download PDF

Info

Publication number
KR101318923B1
KR101318923B1 KR1020110144773A KR20110144773A KR101318923B1 KR 101318923 B1 KR101318923 B1 KR 101318923B1 KR 1020110144773 A KR1020110144773 A KR 1020110144773A KR 20110144773 A KR20110144773 A KR 20110144773A KR 101318923 B1 KR101318923 B1 KR 101318923B1
Authority
KR
South Korea
Prior art keywords
data
random variable
variable set
set data
connection strength
Prior art date
Application number
KR1020110144773A
Other languages
English (en)
Other versions
KR20130076257A (ko
Inventor
강윤섭
최승진
Original Assignee
포항공과대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 포항공과대학교 산학협력단 filed Critical 포항공과대학교 산학협력단
Priority to KR1020110144773A priority Critical patent/KR101318923B1/ko
Publication of KR20130076257A publication Critical patent/KR20130076257A/ko
Application granted granted Critical
Publication of KR101318923B1 publication Critical patent/KR101318923B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

본 발명은 자료 특징 추출 시스템 및 자료 특징 추출 방법으로서, 구체적으로 자료 특징 추출 시스템은 복수의 정보를 포함하는 원본 자료 데이터를 입력받고 상기 복수의 정보별로 제1 확률 변수 집합 데이터를 추출하는 다중 정보 데이터 추출부, 상기 제1 확률 변수 집합 데이터로부터, 상기 복수의 정보가 공유하는 공통 특징 벡터와 상기 복수의 정보 각각의 고유한 고유 특징 벡터를 포함하는 제2 확률 변수 집합 데이터를 생성하는 특징 벡터 추출부, 상기 제1 확률 변수 집합 데이터와 상기 제2 확률 변수 집합 데이터의 확률 분포에서 반복적으로 샘플링하여 상기 제1 확률 변수 집합 데이터와 상기 공통 특징 벡터 간의 공통 연결 강도 행렬의 값 및 상기 제1 확률 변수 집합 데이터와 상기 고유 특징 벡터 간의 고유 연결 강도 행렬의 값을 연산하고 각각 서로 다른 값을 가지도록 보상하는 연결 강도 행렬 형성부, 및 상기 제1 확률 변수 집합 데이터, 제2 확률 변수 집합 데이터, 매개 변수, 및 연결 강도 행렬을 이용하여 상기 원본 자료 데이터에 대한 자료 분포 모델을 형성하는 자료 분포 모델링부를 포함한다.

Description

자료 특징 추출 시스템 및 자료 특징 추출 방법{SYSTEM AND METHOD FOR DATA FEATURE EXTRACTION}
본 발명은 자료 특징 추출 시스템 및 자료 특징 추출 방법에 관한 것으로서, 특히 여러 개의 정보를 갖는 멀티 뷰(multi-view) 자료에서의 안정적인 특징 추출 시스템과 그 방법에 관한 것이다.
컴퓨터의 연산 능력 증대와 통신 속도 증가에 따라 텍스트뿐 아니라 이미지와 비디오 등의 여러 종류의 정보를 포함하는 자료의 양이 기하급수적으로 증가하고 있다. 또한, 하나의 자료에 포함되는 정보의 종류도 과거에 비해 월등히 늘어나고 있다.
이렇게 여러 개의 정보를 포함하는 자료를 멀티 뷰 자료(multi-view data)(이하 다중 뷰로 칭함)라고 부르며, 각각의 정보를 뷰(view)라고 일컫는다. 그런데 이러한 다중 뷰 자료와 또 다른 다중 뷰 자료를 비교함에 있어서 기존에 개발된 단일 정보 간 비교를 위한 특징 추출 기법을 적용하는 것이 어렵다. 이러한 상황 속에서 여러 종류의 정보를 아울러서 특징을 추출하는 기술이 중요하게 부각되고 있다.
이러한 자료의 특징 추출 기법은 학습 신경망 모델에 사용되고 있으며, 종국적으로는 인공지능을 구현하기 위한 인공 신경망의 수학적 학습 모델의 근간으로 이용되고 있다.
인공 신경망의 지도 학습 모델로서 최초로 퍼셉트론(perceptron)이 개발된 이래, 칼텍에서 개발된 홉필드 네트워크(Hopfield network) 등이 개발되어 왔다.
퍼셉트론은 레이블과 데이터가 입력으로 주어졌을 때 레이블과 데이터의 값을 서로 다른 층의 뉴런들에 할당하고, 최소한의 분류 작업 오차를 내도록 뉴런 간의 연결을 조정하는 지도 학습 모델이다.
또한 홉필드 네트워크는 동시에 발화하는 1의 값을 가지는 뉴런들의 연결을 강화하는 방식으로 데이터의 분포를 학습하고, 학습에 사용된 데이터 샘플에 약간의 노이즈를 더해서 입력해도 원래의 데이터를 복원해 내는 방식이다. 하지만, 홉필드 네트워크는 모든 뉴런이 입력을 받아들이는 데 사용되고 뉴런 간의 관계가 두 뉴런 사이의 연결 강도 값 하나로 완전히 결정되기 때문에 복잡한 패턴을 학습시키는 데에는 한계가 있었다. 그리고 뉴런의 값은 다른 뉴런들의 값에 의해 결정론적으로 정해지기 때문에 실 세계의 데이터에 존재하는 노이즈를 모델링하는 데에도 한계가 있었다.
따라서, 복잡하고 방대한 다중 뷰 자료에서 그 특성을 정확하게 반영하는 특징을 추출하기 위한 개선된 모델을 개발할 필요가 있다.
본 발명은 상기와 같은 기술적 과제를 해결하기 위한 것으로서, 복잡하고 방대한 다중 뷰 자료에서 정확하게 특징을 추출할 수 있는 모델을 형성하는 자료 특징 추출 시스템 및 방법을 제공하고자 한다.
특히 기존의 특징 추출 방법보다 명시적으로 정보 간의 부분적 연관성을 모델링하고, 모델을 다층으로 쌓아 더 높은 차원에서의 자료 특징을 추출하여 정보를 처리할 수 있는 시스템과 방법을 제공하고자 한다.
그래서 방대한 다중 뷰 자료를 토대로 패턴 인식 또는 인공 지능의 모델을 구성하고 이를 이용하여 다양한 자료 분석 및 활용 시스템을 구축하고자 한다.
본 발명이 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 본 발명의 기재로부터 당해 분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
상기 목적을 달성하기 위한 본 발명의 일 실시 예에 따른 자료 특징 추출 시스템은, 복수의 정보를 포함하는 원본 자료 데이터를 입력받고 상기 복수의 정보별로 제1 확률 변수 집합 데이터를 추출하는 다중 정보 데이터 추출부, 상기 제1 확률 변수 집합 데이터로부터, 상기 복수의 정보가 공유하는 공통 특징 벡터와 상기 복수의 정보 각각의 고유한 고유 특징 벡터를 포함하는 제2 확률 변수 집합 데이터를 생성하는 특징 벡터 추출부, 상기 제1 확률 변수 집합 데이터와 상기 제2 확률 변수 집합 데이터의 확률 분포에서 반복적으로 샘플링하여, 상기 제1 확률 변수 집합 데이터와 상기 공통 특징 벡터 간의 공통 연결 강도 행렬의 값 및 상기 제1 확률 변수 집합 데이터와 상기 고유 특징 벡터 간의 고유 연결 강도 행렬의 값을 연산하고 각각 서로 다른 값을 가지도록 보상하하는 연결 강도 행렬 형성부, 및 상기 제1 확률 변수 집합 데이터, 제2 확률 변수 집합 데이터, 매개 변수, 및 연결 강도 행렬을 이용하여 상기 원본 자료 데이터에 대한 자료 분포 모델을 형성하는 자료 분포 모델링부를 포함한다.
이때 상기 특징 벡터 추출부는, 상기 자료 분포 모델링부에서 형성한 자료 분포 모델에 사용된 연결 강도 행렬을 이용하여 신규한 원본 자료 데이터에 대응하는 상기 제2 확률 변수 집합 데이터를 생성한다.
이때 상기 특징 벡터 추출부는 상기 공통 특징 벡터 및 상기 고유 특징 벡터를 상기 제1 확률 변수 집합 데이터의 조건부 확률 분포에서 추출할 수 있다.
상기 연결 강도 행렬 형성부는 상기 반복적 샘플링을 통하여 상기 제1 확률 변수 집합 데이터와 상기 제2 확률 변수 집합 데이터 사이의 연결 강도 행렬인 매개변수 값의 변화가 없을 때까지 연산하여 매개변수의 최적값을 산출한다.
이때, 상기 최적값은 상기 반복적 샘플링을 통하여 근사한 그래디언트 상승을 반복 적용하여 산출된다.
상기 연결 강도 행렬 형성부는, 상기 공통 연결 강도 행렬과 상기 고유 연결 강도 행렬의 각 행이 서로 직교하도록 보상된 수식을 이용하여 상기 공통 연결 강도 행렬의 값과 상기 고유 연결 강도 행렬의 값을 연산한다.
그리고, 상기 자료 분포 모델은, 상기 제1 확률 변수 집합 데이터 및 제2 확률 변수 집합 데이터로 이루어진 층상 구조 모델로서, 상기 제2 확률 변수 집합 데이터는 상기 층상 구조 모델의 상향 확장을 위한 입력 자료로 재입력될 수 있다. 그래서 2층 구조 외에도 3층 이상의 다층 구조로 이루어진 자료 분포 모델을 형성할 수 있다.
상기 목적을 달성하기 위한 본 발명의 일 실시 예에 따른 자료 특징 추출 방법은, 복수의 정보를 포함하는 원본 자료 데이터가 입력되는 단계, 상기 복수의 정보별로 제1 확률 변수 집합 데이터를 추출하는 단계, 상기 제1 확률 변수 집합 데이터로부터, 상기 복수의 정보가 공유하는 공통 특징 벡터와 상기 복수의 정보 각각의 고유한 고유 특징 벡터를 추출하는 단계, 상기 제1 확률 변수 집합 데이터와 상기 제2 확률 변수 집합 데이터의 확률 분포에서 반복적으로 샘플링 하여 상기 제1 확률 변수 집합 데이터와 상기 제2 확률 변수 집합 데이터 사이의 매개변수를 연산하는 단계, 상기 제1 확률 변수 집합 데이터, 제2 확률 변수 집합 데이터, 및 매개 변수를 이용하여 상기 원본 자료 데이터에 대한 자료 분포 모델을 형성하는 단계, 및 신규 입력 자료 데이터에 상기 자료 분포 모델을 적용하여 상기 모델의 최상층에 대응하는 확률 변수 집합 데이터로부터 자료 특징을 추출하는 단계를 포함한다.
상기 매개 변수는 상기 제1 확률 변수 집합 데이터와 상기 공통 특징 벡터 간의 공통 연결 강도 행렬 및 상기 제1 확률 변수 집합 데이터와 상기 고유 특징 벡터 간의 고유 연결 강도 행렬을 포함한다.
상기 공통 특징 벡터 및 상기 고유 특징 벡터를 상기 제1 확률 변수 집합 데이터의 조건부 확률 분포에서 추출할 수 있다.
상기 매개변수를 연산하는 단계는, 상기 반복적 샘플링을 통하여 상기 매개변수 값의 변화가 없을 때까지 연산하여 매개변수의 최적값을 산출하는 것을 특징으로 한다.
그리고, 본 발명의 자료 특징 추출 방법은 상기 제1 확률 변수 집합 데이터를 추출하는 단계 이후에, 난수값을 이용하여 자료 분포 모델의 층간 연결 강도를 나타내는 행렬을 초기화하는 단계를 더 포함할 수 있다.
상기 매개변수를 연산하는 단계 이후에, 상기 매개변수 중 상기 제1 확률 변수 집합 데이터와 상기 공통 특징 벡터 간의 공통 연결 강도 행렬의 값 및 상기 제1 확률 변수 집합 데이터와 상기 고유 특징 벡터 간의 고유 연결 강도 행렬의 값을 업데이트하고 각각 서로 다른 값을 가지도록 보상하는 단계를 더 포함할 수 있다.
상기 보상하는 단계는, 상기 공통 연결 강도 행렬과 상기 고유 연결 강도 행렬의 각 행이 서로 직교하도록 보상된 수식을 이용하여 상기 공통 연결 강도 행렬의 값과 상기 고유 연결 강도 행렬의 값을 연산한다.
또한 상기 자료 분포 모델을 형성하는 단계는, 상기 제1 확률 변수 집합 데이터 및 제2 확률 변수 집합 데이터로 이루어진 층상 구조 모델로서, 상기 제2 확률 변수 집합 데이터는 상기 층상 구조 모델의 상향 확장을 위한 입력 자료로 재입력되는 것을 특징으로 한다.
본 발명의 자료 특징 추출 시스템과 그 방법에 의하면 복잡하고 방대한 다중 뷰 자료에서 정확하게 특징을 추출할 수 있는 모델을 제공할 수 있다.
특히 본 발명에 의하면 기존의 특징 추출 방법보다 명시적으로 정보 간의 부분적 연관성을 모델링하고, 모델을 다층으로 쌓아 더 높은 차원에서의 자료 특징을 추출하여 정보를 처리할 수 있다.
그리고 본 발명의 자료 특징 추출 시스템과 방법에 의해서 현대 사회에서의 복잡하고 방대한 자료들 속에서 패턴 인식, 자료 분류, 군집화 등의 자료 처리를 수행할 수 있다.
도 1은 본 발명의 일 실시 예에 따른 자료 특징 추출 시스템의 블록도.
도 2는 본 발명의 일 실시 예에 따른 자료 특징 추출 시스템에서 특징 벡터를 추출하는 것을 개략적으로 나타낸 도면.
도 3은 본 발명의 일 실시 예에 따른 자료 특징 추출 시스템에서 추출된 특징 벡터를 이용한 자료 분포 모델을 개략적으로 나타낸 도면.
도 4는 본 발명의 일 실시 예에 따른 자료 특징 추출을 위한 자료 분포 모델 형성 방법을 나타낸 흐름도.
도 5는 도 4의 자료 분포 모델을 이용한 자료 특징 추출 방법을 나타낸 흐름도.
이하, 첨부한 도면을 참고로 하여 본 발명의 실시 예들에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예들에 한정되지 않는다.
또한, 여러 실시 예들에 있어서, 동일한 구성을 가지는 구성요소에 대해서는 동일한 부호를 사용하여 대표적으로 제1 실시 예에서 설명하고, 그 외의 실시 예에서는 제1 실시 예와 다른 구성에 대해서만 설명하기로 한다.
본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 동일 또는 유사한 구성요소에 대해서는 동일한 참조 부호를 붙이도록 한다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
도 1은 본 발명의 일 실시 예에 따른 자료 특징 추출 시스템의 블록도이다. 본 발명의 일 실시 예에 따른 자료 특징 추출 시스템은 다중 뷰 자료에서 특징의 추출을 보다 향상시키기 위하여 특징 추출 모델을 포함하는 자료 분포의 모델링을 수행하는 시스템이다.
도 1을 참조하면, 자료 특징 추출 시스템(100)은 자료 데이터 입력부(10), 다중 정보 데이터 추출부(20), 특징 벡터 추출부(30), 연결 강도 행렬 형성부(40), 및 자료 분포 모델링부(50)를 포함한다. 도 1의 구성수단은 일 실시 형태에 따른 것이므로 이에 반드시 제한되지 않으며, 각 구성수단의 실행 기능을 수행할 수 있는 한도에서 다양한 구성 수단의 추가, 구성 수단의 생략, 구성 수단의 변경 및 재배치가 가능할 것이다.
자료 데이터 입력부(10)는 자료 추출의 대상이 되는 다중 정보를 포함하는 원본 자료 데이터를 입력받는 수단이다. 도 2는 본 발명의 일 실시 예에 따른 자료 특징 추출 시스템에서 특징 벡터를 추출하는 것을 개략적으로 나타낸 도면인데, 도 2를 참조하면 상기 자료 데이터 입력부(10)는 다수의 정보(이하에서 '뷰'라고도 칭함)를 포함하는 복수 개의 원본 자료 데이터(DATA)를 전달받는다.
원본 자료 데이터(DATA)는 C개의 정보를 가지는 복수 개의 자료를 포함한다. 도 2의 실시 예에서는 설명에 대한 이해를 위해 단순화시켜 2개의 정보, 즉 d와 s로 표시되는 두 종류의 정보를 포함하는 k 개의 자료가 입력되는 것으로 도시하였다.
일례로 상기 d와 s로 표시되는 두 종류의 정보는 서로 형태가 상이한 정보로 이루어진 데이터일 수 있다. 즉, 그림과 그 그림을 설명하는 문서로 이루어진 다중 뷰 데이터가 원본 자료 데이터(DATA)로 입력되는 경우, d는 영상 정보이고 s는 영상 정보에 관련된 텍스트 정보일 수 있다.
한편, 원본 자료 데이터(DATA)에 포함된 다중 정보의 구분 방식은 상술한 바와 같은 정보의 형태로만 분류되는 것이 아니라, 컨텐츠, 정보 자체가 알려주는 내용 등에 따라 임의대로 다양하게 구분될 수 있음은 물론이다.
다중 정보 데이터 추출부(20)는 자료 데이터 입력부(10)에서 입력된 원본 자료 데이터로부터 각각의 정보별로 데이터를 추출한다. 도 2를 참조하면 k개의 자료가 입력되면 각각의 자료에서 정보에 따른 데이터를 추출한다. 즉, 입력 자료 데이터에서 영상 정보(d(1) 내지 d(k))를 각각 추출하고, 텍스트 정보(s(1) 내지 s(k))를 각각 추출한다. 이때 추출되는 정보 데이터들은 확률 변수일 수 있다.
다중 정보 데이터 추출부(20)에서 추출하는 데이터들은 본 발명의 시스템에 의해 형성되는 자료 분포 모델의 가장 하위 층(1층)을 구성하는 가시 노드 집합(visible node sets)을 구성한다.
본 발명에서 "노드 집합(node sets)"이란, 본 발명의 특징 추출을 위한 자료 분포 모델에서 정의되는 확률 변수들의 모음을 말한다. 자료 분포 모델에서 각 지점에 해당하는 확률 변수들의 모음이 하나의 노드 집합을 나타내고, 하나의 노드 집합 안에는 여러 개의 실수값(real number value)이 들어갈 수 있다. 즉, 본 발명의 이하의 설명에서 노드 집합은 하나의 특징 벡터를 지칭한다. 도 2의 예에서 다중 정보 데이터 추출부(20)는 첫 번째 다중 뷰 원본 자료 데이터에서 추출되는 영상 정보 d(1)으로부터 이에 대한 확률 변수들의 모임인 노드 집합 x(1)을 추출할 수 있는데, 상기 노드 집합 x(1)은 소정의 개수의 실수값을 포함한다. 예를 들어 n개의 실수값이 들어갈 경우 상기 노드 집합 x(1)은 n차원 벡터로 표시할 수 있다. 다시 말해 각 노드 집합은 각각 확률 변수의 다차원 벡터로 나타낼 수 있다.
한편 "가시 노드 집합(visible node sets)"이란 자료 분포 모델의 관찰자 입장에서 눈에 보이는 노드의 집합으로 정의한다. 즉, 자료 분포 모델의 노드 집합 중에서도 도 1의 다중 정보 데이터 추출부(20)에서 입력된 자료 데이터를 바탕으로 추출해내는 다중 정보 데이터를 나타내는 확률 변수의 모음이다.
특징 벡터 추출부(30)는 다중 정보 데이터 추출부(20)에서 추출된 다중 뷰 데이터로부터 모든 뷰가 공유하는 특징 벡터와 각 뷰에 고유한 특징 벡터를 조건부 확률 분포에서 샘플링함으로써 특징 추출을 수행한다. 다시 말해, 다중 정보 데이터 추출부(20)에서 추출된 가시 노드 집합으로부터 소정의 수식을 이용하여 은닉 노드 집합을 산출한다. 본 발명의 시스템에 의해 형성되는 자료 분포 다층 모델 구조에서 상기 가시 노드 집합은 하위층인 1층을 구성하는데, 그 위의 층을 이루는 은닉 노드 집합을 산출한다.
예를 들어 도 2의 모델을 사용한다고 할 때, 특징 벡터 추출부(30)는 입력 자료 데이터가 2개의 벡터로 이루어져 있을 경우 모델의 가시 노드 집합인 x(1)과 x(2)에 각각 상기 2개의 벡터 값을 대입하고, 이후에 설명될 소정의 수식을 따라 나머지 은닉 노드 집합의 값을 구한다. 이때 입력 자료 데이터에서 추출되는 정보 데이터는 확률 변수일 수 있으며, x(1)과 x(2)와 같은 가시 노드 집합은 확률 변수의 집합일 수 있다.
본 발명에서 "은닉 노드 집합(hidden node sets)"이란 자료 분포 다층 모델에서 숨겨진 노드의 집합으로 정의한다. 즉 자료 분포 모델의 노드 집합 중에서도 도 1의 특징 벡터 추출부(30)에 의해 산출되는 노드 집합으로서, 상기 도 2의 가시 노드 집합인 x(1), x(2)를 제외한 모든 노드 집합을 말한다.
도 3은 본 발명의 일 실시 예에 따른 자료 특징 추출 시스템에서 추출된 특징 벡터를 이용하여 자료 분포 모델을 확장하는 것을 개략적으로 나타낸 도면인데, 도 3을 참조하면, 각 노드 집합 중 1층을 이루는 가시 노드 집합인 x(1), x(2)을 제외한 모든 노드 집합(h(1), h(c), h(2) 등)이 은닉 노드 집합에 해당한다.
본 발명에서 도 3과 같이 노드 집합이 이루는 행을 노드 층(node layer)으로 명명할 수 있다. 도 3의 자료 분포 모델에서 제1 노드 층(L1)에는 가시 노드 집합 x(1), x(2)가 위치하고, 제2 노드 층(L2) 내지 제4 노드 층(L4)에는 각각 은닉 노드 집합이 위치한다. 구체적으로 제2 노드 층(L2)에 h1(1), h1(c), h1(2)의 은닉 노드 집합, 제3 노드 층(L3)에 h2(1), h2(c), h2(2)의 은닉 노드 집합, 및 제4 노드 층(L4)에 h3(1), h3(c), h3(2)의 은닉 노드 집합이 위치한다.
만일 본 발명의 시스템을 통해 자료 분포 모델이 2층으로 형성될 경우, 은닉 노드 집합은 제1 노드 층(L1)을 제외한 나머지 제2 노드 층(L2)에 형성되는 뷰 데이터의 특징 벡터 값을 나타낸다. 만일 도 3과 같은 실시 형태로서 본 발명의 시스템을 통해 3층 이상의 다층 모델로 자료 분포 모델을 형성할 경우라면, 최상층의 은닉 노드 집합은 모델의 출력값으로서, 이는 모델의 결과값인 특징 벡터가 된다.
특징 벡터 추출부(30)에서 산출되는 은닉 노드 집합은 다중 뷰 데이터로의 각 뷰에 고유한 특징 벡터인 고유 은닉 노드 집합과 모든 뷰에 공통된 특징 벡터인 공통 은닉 노드 집합을 포함한다.
본 발명에 따르면 다중 뷰 데이터의 특징 추출을 수행할 때 모델의 각 층에 모든 정보가 공유하는 공통 은닉 노드 집합 외에 각 정보에만 연결되는 고유 은닉 노드 집합을 산출하여 추가시키므로, 방대한 입력 자료에서 정보가 서로 부분적으로만 연관되는 자료를 정확히 표현할 수 있게 된다. 다시 말해, 본 발명에 의해 형성되는 자료 분포 모델의 은닉 노드 층은 각각의 정보를 공통 은닉 노드 집합과 고유 은닉 노드 집합의 조합으로 표현되므로 다중 뷰 자료의 정확한 분포에서 비롯한 특징 추출의 성능이 향상된다.
도 2 및 도 3과 관련된 상기의 일례에서, 다중 정보 데이터로서 영상 정보(x(1))와 텍스트 정보(x(2))가 주어졌을 때, 둘 사이의 연관된 부분의 특징을 나타내는 것이 공통 은닉 노드 집합(h(c))이 되고, 각 정보의 고유한 특징을 나타내는 것이 각 정보의 고유한 은닉 노드 집합(h(1), h(2))이다. 이들을 하나의 층(제2 노드 층, L2)에 표현하는데, 공통 은닉 노드 집합(h(c))은 소정의 대상에 대한 표현에 있어서 그림의 영상 정보(x(1))와 문서의 텍스트 정보(x(2))가 서로 연관된 부분의 특징을 나타낸 것이다. 또한 고유 은닉 노드 집합(h(1), h(2)) 각각은 그림의 영상 정보(x(1))만이 가지는 고유한 특징 또는 문서의 텍스트 정보(x(2))만이 가지는 고유한 특징을 나타낸다.
영상의 정보를 텍스트 정보로 완벽히 표현하는 것은 불가능하고, 또한 문서의 내용에도 글쓴이의 추가적인 감상 등이 포함됨으로써 영상에 포함되지 않은 정보가 들어갈 수 있다. 영상 정보와 텍스트 정보 간의 연관된 부분 외에 텍스트 정보로는 설명되지 않는 고유한 영상의 정보와 영상 정보로는 설명되지 않는 고유한 텍스트 정보를 함께 모델링함으로써 데이터를 조금 더 정확히 표현할 수 있다.
한편, 상기 자료 데이터 입력부(10), 다중 정보 데이터 추출부(20), 및 특징 벡터 추출부(30)의 구성 수단은 초기의 학습 과정을 반복하여 자료 특징을 추출하기 위한 자료 분포 모델을 형성하기 위하여 기능할 뿐만 아니라, 이후에 학습 과정을 통해 자료 모델링이 완성된 후 연산해낸 연결 강도 행렬을 이용하여 입력되는 대상 원본 자료 데이터를 적용 및 처리함에 있어서도 각각 동일하게 기능한다.
도 1의 연결 강도 행렬 형성부(40)는 다중 정보 데이터 추출부(20)와 특징 벡터 추출부(30)로부터 각각 산출된 다중 뷰 데이터 및 공통 특징 벡터와 고유 특징 벡터의 확률 분포를 최적화하는 연결 강도를 비롯한 매개변수를 계산한다. 특히 상기 매개변수 중에서 공통 연결 강도 행렬과 각 뷰에만 연결되는 연결 강도 행렬을 형성할 수 있다.
여기서, 공통 연결 강도 행렬을 {W(1)...W(C)}으로 표시하고, 각 뷰에만 연결되는 연결 강도 행렬을 {V(1)...V(C)}로 표시할 수 있다. 공통 연결 강도 행렬 {W(1)...W(C)}은 서로 다른 뷰 상호간에 연관된 정보를 추출하고, 각 뷰에만 연결되는 연결 강도 행렬 {V(1)...V(C)}은 자체 뷰에 연관된 정보를 추출한 것이다.
본 발명에서 연결 강도는 도 3의 자료 분포 모델을 참조할 경우 각 노드 집합을 연결하는 직선에 대응하는 행렬을 의미한다. 즉 두 노드 집합에 포함되는 노드(일례로 확률 변수) 사이의 연결의 강도를 저장하는 행렬을 말한다. 예를 들어, 가시 노드 집합 x(1)이 확률 변수의 5차원 벡터, 고유 은닉 노드 집합 h1(1)이 확률 변수의 4차원 벡터로 표시될 경우, 상기 가시 노드 집합 x(1)과 그의 고유 은닉 노드 집합 h1(1)의 연결 강도 행렬 CW(1)은 5x4 차원 행렬로 표시된다. 본 발명의 실시 예에 따른 연결 강도 행렬 형성부(50)에서는 학습 알고리즘에 의한 반복 학습으로 연결 강도 행렬을 적절한 값으로 얻는다. 이때 반복 학습을 통해 구해지는 가시 노드 집합과 공통 은닉 노드 집합 간의 연결 강도 행렬(공통 연결 강도 행렬)의 값, 및 가시 노드 집합과 고유 은닉 노드 집합 간의 연결 강도 행렬(고유 연결 강도 행렬)의 값은 서로 다른 값을 가지도록 보상될 수 있다. 즉, 공통 연결 강도 행렬과 고유 연결 강도 행렬의 각 행의 값은 반복 학습 과정에서 업데이트 될 수 있고, 각 행이 서로 직교하도록 업데이트의 공식에 벌칙항을 추가하여 계산될 수 있다.
자료 분포 모델링부(50)는 상기 자료 추출 시스템(100)의 구성 수단으로부터 전달된 다중 뷰 데이터, 특징 벡터, 매개 변수, 및 연결 강도 행렬을 이용하여 입력되는 원본 자료에 대한 자료 분포 모델을 형성한다. 그리고 각 노드 층별 네트워크 학습 알고리즘을 이용하여 연결 강도 행렬의 값을 구하고, 이를 이용하여 특징을 추출할 수 있다.
이때 상기 자료 분포 모델은, 상기 다중 뷰 데이터와 상기 특징 벡터로 이루어진 층상 구조 모델일 수 있다. 즉, 다중 뷰 데이터가 1층, 그 위에 특징 벡터로 이루어진 데이터가 2층인 구조로 형성될 수 있다. 다른 실시 예로서 상기 특징 벡터들은 상기 층상 구조 모델의 상향 확장을 위한 원본 자료 데이터로서 재입력되어 상기 네트워크 학습 알고리즘을 반복적으로 진행시켜 층상 구조 모델을 완성할 수 있다.
도 4는 본 발명의 일 실시 예에 따른 자료 특징 추출을 위한 자료 분포 모델 형성 방법을 나타낸 흐름도이다. 특히 도 4는 2개의 층으로 이루어진 자료 특징 추출 모델을 형성하는 학습 과정을 도시한 것이다.
먼저 자료 데이터 입력부(10)에서 원본 자료 데이터를 입력받는다(S1). 원본 자료 데이터는 다중 정보가 포함된 하나의 자료가 복수 개 포함된 데이터일 수 있다.
이들 원본 자료 데이터로부터 다중 정보 데이터가 추출된다(S2). 즉, 복수 개의 자료 데이터 속에 포함된 각각의 다중 뷰 데이터들이 추출되는 것인데, 확률 변수의 모음인 가시 노드 집합의 형태(상기 예에서 x(1), x(2))로 표시된다. 본 발명의 일 실시 예에 따른 자료 특징 추출 시스템에서 생성하는 모델 형성의 초기작업으로서, 상기 다중 정보 데이터의 모델 분포 샘플 값들을 각각 훈련 자료 세트 X(1), X(2)...X(C)의 값으로 초기화한다. 여기서 훈련 자료 세트란 모델을 학습시켜서 연결 강도 행렬의 값을 데이터에 맞게 조절하기 위하여 미리 준비된 데이터를 지칭하는 것으로서, 각각의 자료 정보 아이템 별로 추출된 가시 노드 집합과는 구분된 개념이다.
복수 개의 입력된 자료로부터 다중 정보 데이터를 추출하고 난 후, 각 정보별로 가시 노드 집합을 형성한다(S3).
구체적으로 본 발명의 일 실시 예에 따른 다중 뷰 자료의 자료 분포 모델은 확률 그래프 모델로서, 각 정보의 성질에 따라 각 정보의 확률 분포를 지수 가족 분포(Exponential family distribution)의 형태로 가정할 수 있다.
일례로 아래의 수학식 1은 K번째 뷰 x(K)의 주변 확률 분포(marginal distribution)를 나타낸다.
(수학식 1)
Figure 112011104515552-pat00001
상기 수학식 1에서
Figure 112011104515552-pat00002
는 확률 분포의 매개 변수,
Figure 112011104515552-pat00003
Figure 112011104515552-pat00004
의 충분통계량(sufficient statistics), A(K)는 로그-분배 함수(log-partition function)이다. 대부분의 경우에 매개변수와 충분통계량은 각각 한 개씩만 필요하므로 앞으로의 서술에서 두 번째 인덱스인 a는 생략하기로 한다.
가시 노드 집합의 형성(S3)과 동시에 혹은 상기 S3 단계의 시간과 상관없이 연결 강도 행렬이 초기화될 수 있다(S4). 상기 초기화 과정은 상기 S1 및 S2 단계에서 주어진 원본 자료로부터 다중 뷰 데이터 x(1), x(2),...x(C)(이때, 정보의 종류에 따른 개수가 C개임)를 구성하고 난 후 난수값을 이용하여 연결 강도 행렬을 초기화 하는 과정이다. 이때 연결 강도 행렬은 공통 연결 강도 행렬 {W(1)...W(C)}, 및 각 뷰에만 연결되는 연결 강도 행렬 {V(1)...V(C)}를 포함할 수 있다.
그리고 다음으로 모든 자료 데이터에 대하여 각 정보 고유의 특징 벡터와 각 정보 공통의 특징 벡터를 샘플링한다(S5). 즉, 각 정보의 종류에 따른 전체 개수가 C 개인 경우, 정보 고유의 은닉 노드 집합(h(1) 내지 h(C))과 공통 은닉 노드 집합(h(c))의 값을 다음의 수학식들을 이용하여 자료 분포 모델의 샘플로 사용할 수 있다. 본 발명에서는 상기 C개의 정보 중에서 대표값으로 K번째 정보를 상정하여 이하 소개될 공식들을 표현하고자 한다. 따라서 아래의 수학식 2에서 h(K)는 상기 정보 고유의 은닉 노드 집합(h(1) 내지 h(C))을 대표하여 나타낸 것이다. 아래의 수학식 2는 상기 고유 은닉 노드 집합과 공통 은닉 노드 집합을 업데이트할 때 이용되는 공식이다.
(수학식 2)
h(K)~p(h(K)|{x(K)},θ)
h(c)~p(h(c)|{x(K)},θ)
본 발명의 자료 추출 시스템을 통하여 생성하는 다중 뷰 자료의 자료 분포 모델에서 입력 자료의 특징을 나타낼 특징 벡터 {h(1)...h(C)}와 h(c)의 주변 확률 분포 역시 유사하게 정의한다. 수학식 3은 K번째 정보의 특징 벡터 h(K)와 공통 특징 벡터 h(c)의 주변 확률 분포를 나타낸다.
(수학식 3)
Figure 112011104515552-pat00005
이때 상기 수학식 3에서
Figure 112011104515552-pat00006
는 확률 분포의 매개 변수,
Figure 112011104515552-pat00007
(
Figure 112011104515552-pat00008
)는 h(K)의 충분통계량(sufficient statistics), B(K)는 로그-분배 함수(log-partition function)이다. 상기 수학식 1에서의 x(K)의 경우와 같은 이유로 앞으로의 서술에서 두 번째 인덱스 bc는 생략하기로 한다.
상기 수학식 2를 이용하여 업데이트 하고 난 뒤, 각 고유 은닉 노드 집합과 공통 은닉 노드 집합은 자료 분포 모델의 샘플로 사용되고, 이로부터 다중 정보 데이터의 특징 벡터들을 구할 수 있다(S6).
이후 S7 단계로서, 상기 S5 및 S6 과정을 적당한 횟수만큼 반복한다. 이러한 반복 알고리즘을 통해 산출되는 {x(1)...x(C)}, {h(1)...h(C)}, h(c)의 값을 모델 분포 p({x(K)}, {h(K)},h(c) |θ)의 샘플로 사용한다.
상기 S7의 반복 과정과 샘플링을 통해 매개변수를 최적화한다(S8).
구체적으로 상기 수학식 1과 수학식 3에서 정의한 각 확률 변수의 분포와 연결 강도 행렬들을 이용해 이들의 결합 확률 분포를 아래 수학식 4와 같이 정의할 수 있다.
(수학식 4)
Figure 112011104515552-pat00009
위 결합 확률 분포를 특징 벡터 변수들에 대해 적분하고 로그 함수를 적용함으로써 모델의 로그 우도를 아래 수학식 5와 같이 계산할 수 있다.
(수학식 5)
Figure 112011104515552-pat00010
Z는 모델의 우도의 분배 함수(partition function)이며, 수학식 6에서 새로이 등장한 변위된 매개변수
Figure 112011104515552-pat00011
Figure 112011104515552-pat00012
는 아래 수학식 6과 같이 정의한다.
(수학식 6)
Figure 112011104515552-pat00013
본 발명의 자료 추출 시스템을 통하여 생성하는 다중 뷰 자료의 자료 분포 모델은, 모델이 생성하는 자료의 분포가 실제 자료의 분포와 갖는 차이가 최소가 되게 하는 매개변수 θ를 구한다.
이때 θ는 다음의 수학식 7과 같다.
(수학식 7)
Figure 112011104515552-pat00014
상기 매개변수 θ는 근사한 그래디언트(gradient)를 사용한 그래디언트 상승을 반복 적용하여 계산된다.
이 문제를 그래디언트 상승 (gradient ascent) 기법으로 풀기 위해 각 매개변수 θ에 대하여 수학식 5에 서술한 모델의 로그-우도(log-likelihood)의 그래디언트를 유도한다. 로그-우도(log-likelihood)의 그래디언트는 아래 수학식 8과 같이 계산할 수 있다.
(수학식 8)
Figure 112011104515552-pat00015
상기 수학식 8에 의하면 로그-우도의 그래디언트는 두 개의 항의 차로 표현되며, 제1항과 제2항 각각은 자료 분포에 대한 로그-우도의 그래디언트의 기댓값, 모델 분포에 대한 기댓값을 나타낸다. 자료 분포에 대한 기댓값은 훈련 자료 세트 {X(1)...X(C)}에 대한 평균값으로써 구할 수 있으나, 모델 분포에 대한 기댓값은 수학식 5에도 언급된 모델 분포의 분배 함수 Z의 계산을 필요로 하며 이는 일반적으로 다루기 힘들다. 따라서 상기 수학식 4에서의 모델 분포 p({x(K)}, {h(K)},h(c) |θ)를 근사하게 된다. 모델 분포의 근사를 얻기 위하여 다음의 방식으로 샘플링을 수 회 수행할 수 있다. 이러한 방식은 깁스 샘플링(gibbs sampling)으로서 절차가 간단하다.
구체적으로 깁스 샘플링 방식으로 모델 분포 p({x(K)}, {h(K)}, h(c) |θ)를 얻는 과정은 다음과 같다.
1. 원본 자료 데이터에서 추출된 다중 뷰 데이터 {x(1)...x(C)}의 모델 분포 샘플 값들을 각각 훈련 자료 세트 X(1)...X(C)의 값으로 초기화한다.
2. 상기 1의 결과를 활용하여 {h(1)...h(C)}와 h(c)의 샘플 값들은 상기 수학식 2와 같은 조건부 확률 분포에서 샘플링한다.
3. 상기 2의 결과를 활용하여 {x(1)...x(C)}의 모델 분포 샘플 값들을 다시 조건부 확률 분포에서 아래의 수학식 9와 같이 샘플링한다.
(수학식 9)
x(K)~p(x(K)|{h(K)}, h(c), θ)
4. 상기 3의 결과를 활용하여 각 정보 고유의 특징 벡터 {h(1)...h(C)}와 각 정보 공통의 특징 벡터 h(c)의 샘플 값들을 상기 2에서 사용한 상기 수학식 2와 같은 조건부 확률 분포와 동일한 확률 분포에서 샘플링한다.
5. 상기 3, 4를 소정의 횟수만큼 반복하고 난 후 얻어진 {x(1)...x(C)}, {h(1)...h(C)}, h(c)의 값을 모델 분포 p({x(K)}, {h(K)},h(c) |θ)의 샘플로써 사용한다.
샘플링을 통해 모델 분포 p({x(K)}, {h(K)},h(c) |θ)의 값을 이용하여 상기 수학식 8에서 로그-우도 그래디언트를 계산하고, 근사한 그래디언트를 사용한 그래디언트 상승 기법을 반복 적용하여 매개변수 θ를 최적화할 수 있다.
수학식 8을 사용하여 각 매개변수에 대한 로그-우도의 그래디언트를 계산하고, 매개변수를 다음 수학식 10을 사용하여 업데이트한다.
(수학식 10)
Figure 112011104515552-pat00016
그리고 더 이상 매개 변수의 값의 변화가 없을 때까지 상기 S5 내지 S6의 과정을 반복(S7)할 수 있다. 이때 상기 수학식 10을 사용한 업데이트 과정에서 상기 수학식 8을 반영하면 향상된 다중 뷰 자료의 자료 분포 모델이 완성될 수 있다.이러한 학습 과정을 수행하고 난 뒤 얻어지는 매개 변수 중에 공통 연결 강도 행렬 {W(1)...W(C)}, 및 각 뷰에만 연결되는 연결 강도 행렬 {V(1)...V(C)}을 업데이트하고 소정의 W(K)와 V(K)가 서로 다른 값을 갖도록 보상할 수 있다(S9). 본 발명의 자료 특징 추출 방법에 있어서 추출되는 특징 벡터의 크기가 커질수록 공통 은닉 노드 집합과 고유의 추가 은닉 노드 집합에서 추출되는 특징이 유사해져 모델의 장점이 희석될 수 있으므로 이를 보완하기 위하여 K번째 뷰에 대한 소정의 공통 연결 강도 행렬 W(K)와 K번째 뷰에만 연결되는 고유 연결 강도 행렬 V(K)가 서로 직교하도록 보상하는 것이다.
이를 위해 V(K)의 업데이트 공식에 벌칙항을 추가한다. 수정된 V(K)의 업데이트 공식은 수학식 11과 같다.
(수학식 11)
Figure 112011104515552-pat00017
본 발명의 다양한 실시 형태에 따라 상기 S9의 보상 과정은 생략될 수 있다.
상기 S1 내지 S8 또는 S1 내지 S9의 과정을 통해 다중 뷰 자료의 자료 분포 모델, 특히 2개 층으로 이루어진 자료 분포 모델을 완성한다(S10).
만일 3개 층 이상으로 된 자료 분포 모델의 학습 과정인 경우라면, 상기 S5 내지 S9의 과정을 반복하여 각 노드 층(도 3의 실시 예에서, L1 내지 L4) 간의 연결 강도를 학습하여 다층 자료 분포 모델을 완성할 수 있다. 즉, 도 3의 모델 구조를 참조할 경우, 처음 S5 내지 S9의 과정을 통해 L1과 L2 노드 층 사이의 연결 강도를 학습하고, 그 다음에는 L2와 L3 노드 층 사이의 연결 강도, 그리고 그 다음에는 L3와 L4 노드 층 사이의 연결 강도를 학습하여 S10 단계에서의 자료 분포 모델을 완성할 수 있다.한편, 도 5는 도 4의 자료 분포 모델을 이용한 자료 특징 추출 방법을 나타낸 흐름도이다.
자료의 특징을 분석하기 위하여 추출하는 과정은 도 4의 모델링 형성 과정을 적용하는 과정이므로 도 4와 크게 다르지 않다.
도 5는 도 4의 학습 과정을 통해 각 노드 층 간의 연결 강도를 구한 자료 추출 모델에 분석하고자 하는 대상 원본 자료 데이터(DATA')를 적용시켜 자료 특징을 추출하는 과정이다.
먼저 대상 원본 자료 데이터(DATA')를 입력하고(S101), 그로부터 다중 정보 데이터를 추출한다(S102). 또한 각 정보 별로 가시 노드 집합을 형성한다(S103).
상기 가시 노드 집합을 제1 노드 층(L1)으로 적용하여 이들 다중 뷰 데이터(x(1), x(2)...x(C)}로부터 고유 특징 벡터(h(1) 내지 h(C))와 공통 특징 벡터(h(c))를 계산하여 추출한다(S104). 이때 도 4에서 학습 과정을 통해 계산된 연결 강도 행렬을 이용할 수 있다. 즉, 학습 모델링 과정을 거쳐 추출한 공통 연결 강도 행렬 {W(1)...W(C)} 및 각 뷰에만 연결되는 연결 강도 행렬 {V(1)...V(C)}를 이용하여 상기 공통 특징 벡터와 고유 특징 벡터를 구한다.
그러면 상위 노드 층에 해당하는 제2 노드 층(L2)에 대응하는 특징 벡터의 결과값을 형성할 수 있다(S105).
상기 S105 단계까지의 과정은 2개 층의 자료 추출 모델에 적용되는 것이고, 본 발명의 일 실시 예에 따라서는 2개 층의 최소 모델로도 자료 특징을 추출할 수 있다. 그러나, 도 4의 다른 실시 예로서 다층의 자료 추출 모델을 구했을 경우라면 상기 S104 내지 S105 단계를 반복하면서 대응하는 연결 강도 행렬을 적용하여 상위 노드 층을 구해 나갈 수 있다.
상기 S104 내지 S105 단계의 반복은 도 4에서 구한 자료 추출 모델의 층수에 대응하여 반복될 수 있다.
노드 층을 4층으로 구한 자료 추출 모델일 경우, 상기 S105 단계에서 구한 특징 벡터들의 결과값을 입력 값으로 하여 S104 단계로 돌아가서 제2 노드 층과 제3 노드 층 사이의 연결 강도 행렬을 이용하여 대응하는 고유 특징 벡터 및 공통 특징 벡터를 각각 추출한다. 각 뷰에서 추출된 특징 벡터 {h(1)...h(C)}의 값을 다시 새로운 모델의 입력 자료로 사용해 다시 산출된 특징 벡터들의 결과값은 제3 노드 층(L3)을 형성하고 다시 한번 더 S104 단계를 수행하면 제4 노드 층(L4)에 대응하는 특징 벡터 결과값을 형성할 수 있다.
상기 실시 예에서 최종적으로 제4 노드 층에 해당하는 각 노드 값, 즉 고유 특징 벡터 및 공통 특징 벡터를 취득하고(S106), 이로부터 대상 원본 자료 데이터(DATA')의 최종 특징 벡터의 결과값을 출력할 수 있다(S107).
자료의 크기와 성질에 따라 다층의 자료 추출 모델의 확장이 가능하고, 확장된 모델을 이용하여 더 복잡한 형태의 자료 로부터 더 효과적으로 특징을 추출할 수 있다.
지금까지 참조한 도면과 기재된 발명의 상세한 설명은 단지 본 발명의 예시적인 것으로서, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미 한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 용이하게 선택하여 대체할 수 있다. 또한 당업자는 본 명세서에서 설명된 구성요소 중 일부를 성능의 열화 없이 생략하거나 성능을 개선하기 위해 구성요소를 추가할 수 있다. 뿐만 아니라, 당업자는 공정 환경이나 장비에 따라 본 명세서에서 설명한 방법 단계의 순서를 변경할 수도 있다. 따라서 본 발명의 범위는 설명된 실시형태가 아니라 특허청구범위 및 그 균등물에 의해 결정되어야 한다.
100: 자료 특징 추출 시스템
10: 자료 데이터 입력부
20: 다중 정보 데이터 추출부
30: 특징 벡터 추출부
40: 연결 강도 행렬 형성부
50: 자료 분포 모델링부

Claims (15)

  1. 복수의 정보를 포함하는 원본 자료 데이터를 입력받고 상기 복수의 정보별로 제1 확률 변수 집합 데이터를 추출하는 다중 정보 데이터 추출부,
    상기 제1 확률 변수 집합 데이터로부터, 상기 복수의 정보가 공유하는 공통 특징 벡터와 상기 복수의 정보 각각의 고유한 고유 특징 벡터를 포함하는 제2 확률 변수 집합 데이터를 생성하는 특징 벡터 추출부,
    상기 제1 확률 변수 집합 데이터와 상기 제2 확률 변수 집합 데이터의 확률 분포에서 반복적으로 샘플링하여 상기 제1 확률 변수 집합 데이터와 상기 공통 특징 벡터 간의 공통 연결 강도 행렬의 값 및 상기 제1 확률 변수 집합 데이터와 상기 고유 특징 벡터 간의 고유 연결 강도 행렬의 값을 연산하고 각각 서로 다른 값을 가지도록 보상하는 연결 강도 행렬 형성부, 및
    상기 제1 확률 변수 집합 데이터, 제2 확률 변수 집합 데이터, 매개 변수, 및 연결 강도 행렬을 이용하여 상기 원본 자료 데이터에 대한 자료 분포 모델을 형성하는 자료 분포 모델링부를 포함하는 자료 특징 추출 시스템.
  2. 제 1항에 있어서,
    상기 특징 벡터 추출부는 상기 공통 특징 벡터 및 상기 고유 특징 벡터를 상기 제1 확률 변수 집합 데이터의 조건부 확률 분포에서 추출하는 것을 특징으로 하는 자료 특징 추출 시스템.
  3. 제 1항에 있어서,
    상기 특징 벡터 추출부는, 상기 자료 분포 모델링부에서 형성한 자료 분포 모델에 사용된 연결 강도 행렬을 이용하여 신규한 원본 자료 데이터에 대응하는 상기 제2 확률 변수 집합 데이터를 생성하는 것을 특징으로 하는 자료 특징 추출 시스템.
  4. 제 1항에 있어서,
    상기 연결 강도 행렬 형성부는 상기 반복적 샘플링을 통하여 상기 제1 확률 변수 집합 데이터와 상기 제2 확률 변수 집합 데이터 사이의 연결 강도 행렬인 매개변수 값의 변화가 없을 때까지 연산하여 상기 매개변수의 최적값을 산출하는 것을 특징으로 하는 자료 특징 추출 시스템.
  5. 제 4항에 있어서,
    상기 최적값은 상기 반복적 샘플링을 통하여 근사한 그래디언트 상승을 반복 적용하여 산출되는 것을 특징으로 하는 자료 특징 추출 시스템.
  6. 제 1항에 있어서,
    상기 연결 강도 행렬 형성부는, 상기 공통 연결 강도 행렬과 상기 고유 연결 강도 행렬의 각 행이 서로 직교하도록 보상된 수식을 이용하여 상기 공통 연결 강도 행렬의 값과 상기 고유 연결 강도 행렬의 값을 연산하는 것을 특징으로 하는 자료 특징 추출 시스템.
  7. 제 1항에 있어서,
    상기 자료 분포 모델은, 상기 제1 확률 변수 집합 데이터 및 제2 확률 변수 집합 데이터로 이루어진 층상 구조 모델로서, 상기 제2 확률 변수 집합 데이터는 상기 층상 구조 모델의 상향 확장을 위한 입력 자료로 재입력되는 것을 특징으로 하는 자료 특징 추출 시스템.
  8. 복수의 정보를 포함하는 원본 자료 데이터가 입력되는 단계,
    상기 복수의 정보별로 제1 확률 변수 집합 데이터를 추출하는 단계,
    상기 제1 확률 변수 집합 데이터로부터, 상기 복수의 정보가 공유하는 공통 특징 벡터와 상기 복수의 정보 각각의 고유한 고유 특징 벡터를 포함하는 제2 확률 변수 집합 데이터를 생성하는 단계,
    상기 제1 확률 변수 집합 데이터와 상기 제2 확률 변수 집합 데이터의 확률 분포에서 반복적으로 샘플링 하여 상기 제1 확률 변수 집합 데이터와 상기 제2 확률 변수 집합 데이터 사이의 매개변수를 연산하는 단계,
    상기 제1 확률 변수 집합 데이터, 제2 확률 변수 집합 데이터, 및 매개 변수를 이용하여 상기 원본 자료 데이터에 대한 자료 분포 모델을 형성하는 단계, 및
    신규 입력 자료 데이터에 상기 자료 분포 모델을 적용하여 상기 모델의 최상층에 대응하는 확률 변수 집합 데이터로부터 자료 특징을 추출하는 단계를 포함하는 자료 특징 추출 방법.
  9. 제 8항에 있어서,
    상기 매개 변수는 상기 제1 확률 변수 집합 데이터와 상기 공통 특징 벡터 간의 공통 연결 강도 행렬 및 상기 제1 확률 변수 집합 데이터와 상기 고유 특징 벡터 간의 고유 연결 강도 행렬을 포함하는 자료 특징 추출 방법.
  10. 제 8항에 있어서,
    상기 공통 특징 벡터 및 상기 고유 특징 벡터를 상기 제1 확률 변수 집합 데이터의 조건부 확률 분포에서 추출하는 것을 특징으로 하는 자료 특징 추출 방법.
  11. 제 8항에 있어서,
    상기 매개변수를 연산하는 단계는, 상기 반복적 샘플링을 통하여 상기 매개변수 값의 변화가 없을 때까지 연산하여 매개변수의 최적값을 산출하는 것을 특징으로 하는 자료 특징 추출 방법.
  12. 제 8항에 있어서,
    상기 제1 확률 변수 집합 데이터를 추출하는 단계 이후에,
    난수값을 이용하여 자료 분포 모델의 층간 연결 강도를 나타내는 행렬을 초기화하는 단계를 더 포함하는 자료 특징 추출 방법.
  13. 제 8항에 있어서,
    상기 매개변수를 연산하는 단계 이후에,
    상기 매개변수 중 상기 제1 확률 변수 집합 데이터와 상기 공통 특징 벡터 간의 공통 연결 강도 행렬의 값 및 상기 제1 확률 변수 집합 데이터와 상기 고유 특징 벡터 간의 고유 연결 강도 행렬의 값을 업데이트하고 각각 서로 다른 값을 가지도록 보상하는 단계를 더 포함하는 자료 특징 추출 방법.
  14. 제 13항에 있어서,
    상기 보상하는 단계는,
    상기 공통 연결 강도 행렬과 상기 고유 연결 강도 행렬의 각 행이 서로 직교하도록 보상된 수식을 이용하여 상기 공통 연결 강도 행렬의 값과 상기 고유 연결 강도 행렬의 값을 연산하는 것을 특징으로 하는 자료 특징 추출 방법.
  15. 제 8항에 있어서,
    상기 자료 분포 모델을 형성하는 단계는,
    상기 제1 확률 변수 집합 데이터 및 제2 확률 변수 집합 데이터로 이루어진 층상 구조 모델로서, 상기 제2 확률 변수 집합 데이터는 상기 층상 구조 모델의 상향 확장을 위한 입력 자료로 재입력되는 것을 특징으로 하는 자료 특징 추출 방법.
KR1020110144773A 2011-12-28 2011-12-28 자료 특징 추출 시스템 및 자료 특징 추출 방법 KR101318923B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110144773A KR101318923B1 (ko) 2011-12-28 2011-12-28 자료 특징 추출 시스템 및 자료 특징 추출 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110144773A KR101318923B1 (ko) 2011-12-28 2011-12-28 자료 특징 추출 시스템 및 자료 특징 추출 방법

Publications (2)

Publication Number Publication Date
KR20130076257A KR20130076257A (ko) 2013-07-08
KR101318923B1 true KR101318923B1 (ko) 2013-10-17

Family

ID=48989895

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110144773A KR101318923B1 (ko) 2011-12-28 2011-12-28 자료 특징 추출 시스템 및 자료 특징 추출 방법

Country Status (1)

Country Link
KR (1) KR101318923B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101638114B1 (ko) 2015-11-27 2016-07-11 중앙대학교 산학협력단 근사치를 이용한 다중 레이블 특징 선별 가속화 장치 및 방법

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102059500B1 (ko) * 2017-09-21 2019-12-27 한국과학기술원 Sampling기반의 DNA 데이터 보상 알고리즘
KR102066157B1 (ko) * 2018-06-12 2020-01-14 중앙대학교 산학협력단 다중 레이블 패턴 분류를 위한 특징 하위 집합 생성 방법 및 그 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006285672A (ja) * 2005-03-31 2006-10-19 Toshiba Corp データ分析装置
US20070038418A1 (en) 2005-08-12 2007-02-15 Samsung Electronics Co., Ltd. Method and apparatus for modeling multivariate parameters having constants and same pattern and method of fabricating semiconductor using the same
JP2007183927A (ja) * 2005-12-05 2007-07-19 Sony Corp 情報処理装置および方法、並びにプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006285672A (ja) * 2005-03-31 2006-10-19 Toshiba Corp データ分析装置
US20070038418A1 (en) 2005-08-12 2007-02-15 Samsung Electronics Co., Ltd. Method and apparatus for modeling multivariate parameters having constants and same pattern and method of fabricating semiconductor using the same
JP2007183927A (ja) * 2005-12-05 2007-07-19 Sony Corp 情報処理装置および方法、並びにプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101638114B1 (ko) 2015-11-27 2016-07-11 중앙대학교 산학협력단 근사치를 이용한 다중 레이블 특징 선별 가속화 장치 및 방법

Also Published As

Publication number Publication date
KR20130076257A (ko) 2013-07-08

Similar Documents

Publication Publication Date Title
CN110070183B (zh) 一种弱标注数据的神经网络模型训练方法及装置
CN111291212B (zh) 基于图卷积神经网络的零样本草图图像检索方法和系统
Kim et al. Emi: Exploration with mutual information
Amer et al. A review of modularization techniques in artificial neural networks
CN112989064B (zh) 一种聚合知识图神经网络和自适应注意力的推荐方法
EP3572985A1 (en) System and method for generating explainable latent features of machine learning models
Zhou et al. Sparse invariant risk minimization
US9704257B1 (en) System and method for semantic segmentation using Gaussian random field network
CN107944410B (zh) 一种基于卷积神经网络的跨领域面部特征解析方法
Balestriero et al. Mad max: Affine spline insights into deep learning
CN112381179B (zh) 一种基于双层注意力机制的异质图分类方法
Serratosa et al. Interactive graph-matching using active query strategies
CN114492992A (zh) 一种基于Transformer的自适应时空图神经网络交通流预测方法及系统
Liang et al. Survey of graph neural networks and applications
Suzuki et al. Adversarial example generation using evolutionary multi-objective optimization
CN113987236B (zh) 基于图卷积网络的视觉检索模型的无监督训练方法和装置
KR101318923B1 (ko) 자료 특징 추출 시스템 및 자료 특징 추출 방법
CN115858848A (zh) 图文互检方法及装置、训练方法及装置、服务器、介质
CN114863213B (zh) 一种基于因果解耦生成模型的域泛化图像识别方法
Krusinga et al. Understanding the (un) interpretability of natural image distributions using generative models
CN113807176A (zh) 一种基于多知识融合的小样本视频行为识别方法
Gao et al. Learning from multiple annotator noisy labels via sample-wise label fusion
Cho et al. Genetic evolution processing of data structures for image classification
CN114492601A (zh) 资源分类模型的训练方法、装置、电子设备及存储介质
CN113705402A (zh) 视频行为预测方法、系统、电子设备及存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee