KR20210120977A

KR20210120977A - 제한적 볼츠만 머신 구동 기반의 인터랙티브 맞춤형 검색 방법

Info

Publication number: KR20210120977A
Application number: KR1020217011962A
Authority: KR
Inventors: 린 바오; 위보 티엔; 전카이 장; 민 왕; 궈쥔 마; 시아오치아오 덩
Original assignee: 지앙수 유니버시티 오브 사이언스 앤드 테크놀로지
Priority date: 2020-03-25
Filing date: 2020-04-22
Publication date: 2021-10-07
Also published as: KR102600697B1; WO2021189583A1; CN111339428B; CN111339428A

Abstract

본 발명은 제한적 볼츠만 머신 구동 기반의 인터랙티브 맞춤형 검색 방법을 개시한 것으로, (1) 사용자

의 히스토리 평가 데이터를 획득하고, 상기 히스토리 평가 데이터에는 사용자

가 이미 평가한 모든 항목과 각 항목에 대한 평점과 평가 텍스트가 포함되며, 평가 텍스트에 대해 벡터화를 수행하고; (2) 평점이 소정 평점 임계값보다 큰 항목을 우위 항목 세트

으로 구성하고; (3) RBM 기반의 사용자 선호도 특성 추출 모델을 구축하며; (4) 사용자 선호도 확률 모델을 구축하며; (5) N개 신규 항목을 생성하고 각 항목의 카테고리 태그를 설정하고; (6) 검색 공간에서 각각 N개 신규 항목 카테고리 태그 벡터

와 유사도가 가장 높은 N개 항목을 선택하고, 추천할 항목 세트

를 구성하고; (7)

중 각 항목의 적응값을 계산하고; (8)

중 적응값이 최대인 앞

개 항목을 검색 결과로 선택한다. 해당 방법은 사용자가 맞춤형 검색을 수행하는 방향을 효과적으로 인도할 수 있고, 사용자가 자신이 만족스러운 결과를 검색하도록 최대한 지원함으로써 맞춤형 검색 알고리즘의 종합 성능을 향상시킬 수 있다.

Description

제한적 볼츠만 머신 구동 기반의 인터랙티브 맞춤형 검색 방법

본 발명은 데이터 마이닝(data mining) 기술 분야에 속하며, 더욱 상세하게는 인터랙티브 맞춤형 검색 방법에 관한 것이다.

빅데이터, 클라우드 컴퓨팅 등 기술이 급성장함에 따라, 정보도 폭발적으로 증가하였다. 다양한 인터넷 응용 프로그램에 대량의 사용자 생성 콘텐츠가 수집되면서 사용자에게 새로운 정보가 제공되기도 하나, 동시에 사용자가 유효 정보를 선별하고 최종적으로 의사 결정을 내리는 난이도도 증가하였다. 맞춤형 검색은 사용자와 정보를 연결하는 가교 역할을 수행하여, 사용자가 신속하게 검색하도록 안내하고 사용자가 방대한 정보 속에서 자신이 흥미를 가진 콘텐츠를 빠르게 선별하도록 보조함으로써, 정보 과부하를 효과적으로 완화시킬 수 있다.

사용자 생성 콘텐츠에는 사용자 행동 데이터, 사용자 정보, 프로젝트 정보 등 사용자가 제공하는 수많은 정보가 포함된다. 이러한 멀티-소스 이종 데이터(Multi-Source Heterogeneous Data)는 상이한 관점에서 사용자의 관심과 기호가 반영되어 있으므로, 이러한 정보를 충분히 이용하면 맞춤형 검색의 품질을 효과적으로 개선할 수 있다. 사용자 생성 콘텐츠가 가진 데이터 희소성, 불완전성, 동적 성질 등 복잡한 특성으로 인해, 멀티-소스 이종 사용자 생성 콘텐츠 데이터를 융합하여 처리하는 맞춤형 검색 문제는 난이도가 더욱 높다. 인터랙티브 진화 연산(interactive evolutionary computation)은 최적화 문제에 대한 사용자의 주관적 평가와 의사결정을 효과적으로 이용하여 인류 지능 평가 정보와 종래의 진화 최적화 알고리즘을 결합한, 멀티-소스 이종 데이터를 융합하여 맞춤형 검색 문제를 해결하는 효과적인 방법이다.

출원 번호 201410202346.X의 중국 특허는 심리학 도서 맞춤형 신속 검색을 위한 인터랙티브 진화 최적화 방법을 공개하였다. 이는 사용자가 신속하게 만족스러운 도서를 찾도록 안내한다. 상기 방법은 사용자의 검색 기록과 군집 공통 검색 정보를 이용하여 사용자 선호도 모델을 구축하나, 사용자 히스토리 데이터에 내포된 선호도 특성을 충분히 발굴하지 않는다. 출원 번호 201910151051.7의 중국 특허는 맞춤형 상품 추천 방법을 공개하였다. 상기 방법은 사용자의 분류에 따라 상품을 추천하므로, 상이한 유형의 사용자 간의 개별성 차이만 구현할 수 있으며, 구체적인 사용자를 위한 맞춤화는 구현할 수 없다. 출원 번호 201910431441.X의 중국 특허는 상호 데이터 클러스터링 기반의 맞춤형 추천 방법 및 시스템을 공개하였다. 여기에서 맞춤형 추천 방법은 사용자 클러스터링을 통해 유사 사용자의 관심 지점을 획득함으로써 사용자에 대한 맞춤형 추천을 수행하지만, 마찬가지로 동일 유형 사용자의 선호도를 구현한다.

본 발명의 목적은 상기 종래 기술의 문제를 보완하기 위해 제한적 볼츠만 머신(Boltzmann machine) 구동 기반의 인터랙티브 맞춤형 검색 방법을 제공하는 데에 있다. 상기 방법은 현재 사용자가 맞춤형 검색을 수행하도록 안내한다.

본 발명은 하기와 같은 기술적 해결책을 채택한다.

제한적 볼츠만 머신 구동 기반의 인터랙티브 맞춤형 검색 방법은 하기 단계를 포함한다.

(1) 사용자

의 히스토리 평가 데이터를 획득한다. 상기 히스토리 평가 데이터에는 사용자

가 이미 평가한 모든 항목, 각 항목에 대한 평점과 평가 텍스트가 포함되며, 평가 텍스트에 대해 벡터화를 수행한다.

(2) 평점이 소정 평점 임계값보다 큰 항목을 우위 항목 세트

으로 구성하고, 샘플 세트

를 구성한다. 여기에서

이고,

는 항목

의 카테고리 태그 벡터이고, 길이는 카테고리 총 수

이고,

는 사용자

의 항목

에 대한 평가 텍스트 벡터화 표시이고, 길이는

이고;

,

이고,

는

중의 항목 수를 나타낸다.

(3) RBM 기반의 사용자 선호도 특성 추출 모델을 구축하며, 상기 사용자 선호도 특성 추출 모델은 우위 항목 세트

에 따라 사용자의 선호도 특성을 추출한다.

(4) 사용자 선호도 확률 모델을 구축하며, 상기 사용자 선호도 확률 모델은 사용자의 각 카테고리 항목에 대한 선호도 확률을 나타내는 데 사용된다.

(5) 군체 크기 N을 설정하고, 분포 예측 알고리즘을 채택하여 N개 신규 항목을 생성하고 각 항목의 카테고리 태그를 설정한다.

(6) 검색 공간에서 각각 N개 신규 항목 카테고리 태그 벡터

를 구성한다.

(7) 추천할 항목 세트

중 각 항목의 적응값을 계산한다.

(7.1) 사용자

의

중 각 항목에 대한 맞춤형 선호도 평점

를 예측한다.

여기에서,

는 현재 사용자

와의 유사도가 임계값보다 큰 사용자

의 항목

에 대한 평가 에너지 함수이다.

와

은 각각 추천할 항목 세트

의 모든 항목 중 획득한 에너지 함수의 최댓값과 최솟값이다.

(7.2)

중 각 항목의 적응값을 계산한다.

여기에서

는 정규화 함수이다.

(8)

중 적응값이 최대인 앞

개 항목을 검색 결과로 선택한다.

본 발명의 유익한 효과는 다음과 같다. 본 발명에 개시된 인터랙티브 맞춤형 검색 방법은 사용자 생성 콘텐츠의 멀티-소스 이종 데이터를 충분히 이용하며, 여기에는 사용자 평점, 텍스트 태그, 텍스트 평론 등 정보가 포함된다. 사용자 선호도 특성이 반영된 사용자 선호도 특성 추출 모델을 구축하고, 이 모델을 기반으로 사용자 선호도 확률 모델을 구축한다. 구축된 모델을 통해 사용자 선호도가 포함된 신규 항목을 생성하며, 그 중 사용자 선호도에 가장 매칭되는 항목을 검색 결과로 선택한다. 상기 방법은 멀티-소스 이종 복잡 데이터 환경 하의 사용자 맞춤형 검색 문제를 더욱 잘 해결할 수 있으며, 사용자가 맞춤형 검색을 수행하는 방향을 효과적으로 인도할 수 있고, 사용자가 자신이 만족스러운 결과를 검색하도록 최대한 지원함으로써 맞춤형 검색 알고리즘의 종합 성능을 향상시킬 수 있다.

도 1은 본 발명에서 개시한 인터랙티브 맞춤형 검색 방법의 흐름도이다.
도 2는 제한적 볼츠만 머신 기반의 사용자 선호도 모델의 구조도이다.

이하에서는 첨부 도면과 구체적인 실시 방식을 참고하여 본 발명을 더욱 상세하게 설명한다.

도 1에 도시된 바와 같이, 본 발명은 제한적 볼츠만 머신(Restricted Boltzmann Machine, RBM) 구동 기반의 인터랙티브 맞춤형 검색 방법을 개시하였으며 하기 단계를 포함한다.

단계 1: 사용자

본 실시예에서 평가 텍스트에 대해 벡터화를 수행하는 단계는 다음과 같다. 즉, 먼저 텍스트 중 문장 부호, 스톱 워드(stop word)를 제거한 다음 문헌 Le Q, Mikolov T. Distributed representations of sentences and documents[C]//International conference on machine learning. 2014: 1188-1196 중의 doc2vec 텍스트 벡터화 표시 모델을 채택하여, 사용자의 평가 텍스트에 대한 벡터화를 수행한다.

단계 2: 평점이 소정 평점 임계값보다 큰 항목을 우위 항목 세트

로 구성한다.

샘플 세트

를 구성하며, 여기에서

이고,

는 항목

의 카테고리 태그 벡터이고, 길이는 카테고리 총 수

이다.

중 각 원소

는 바이너리 변수이다.

=1은 항목

가 제

류 태그를 가짐을 나타내며,

,

이다. 주목할 점은 본 발명에서 상이한 카테고리 사이는 상호 배척하지 않으며, 하나의 항목은 동시에 복수 카테고리 태그에서 1로 동시에 존재할 수 있다. 예를 들어 서적 검색에 있어서, 항목이 서적인 경우, 한 권의 책에는 복수 카테고리 태그가 있을 수 있다. 예를 들어 <장거정전(

)>은 동시에 인물 전기, 중국 역사의 몇몇 태그가 있을 수 있으며 대응하는 카테고리 태그가 1이다. 영상 검색에 있어서, 항목이 영상 작품인 경우, 하나의 영상 작품도 복수 카테고리 태그가 있을 수도 있다. 예를 들어 <삼국연의(

)>는 동시에 TV 드라마, 역사의 몇몇 카테고리 태그가 있을 수 있으며 마찬가지로 대응하는 카테고리 태그가 1이다.

는 사용자

의 항목

에 대한 평가 텍스트 벡터화 표시이고, 길이는

이고,

,

이고,

는

중의 항목 수를 나타낸다.

단계 3: RBM 기반의 사용자 선호도 특성 추출 모델을 구축한다. 도 2에 도시된 바와 같이, 사용자 선호도 특성 추출 모델은 제1 가시층

, 제2 가시층

, 은닉층 h을 포함한다. 상기 제1 가시층에는

개 가시 유닛이 있고, 각 가시 유닛은 바이너리 변수이다. 제2 가시층은

개 가시 유닛이 있고, 각 가시 유닛은 실수이다. 상기 은닉층은 m개 은닉 유닛이 있고, 각 은닉 유닛은 실수이다. 상기 사용자 선호도 특성 추출 모델의 파라미터는

이다. 여기에서 w¹, w²는 각각 제1 가시층 중 가시 유닛과 은닉층 중 은닉 유닛, 제2 가시층 중 가시 유닛과 은닉층 중 은닉 유닛 사이의 연결 가중치를 나타낸다. a¹, a²는 각각 제1 가시층 중 가시 유닛, 제2 가시층 중 가시 유닛의 오프셋이다. b는 은닉층 중 은닉 유닛의 오프셋이다. 은닉층 중 은닉 유닛 개수 m은 카테고리 총수

의 0.8 내지 1.2배이다. 본 실시예에서

를 설정하며,

는 정수 올림 연산이다.

샘플 세트 중 각 샘플의

와

를 사용자 선호도 특성 추출 모델의 제1 가시층과 제2 가시층에 입력하고, 대조적 발산(Contrastive Divergence) 학습 알고리즘을 채택해 상기 모델을 학습시키고, 모델 파라미터

를 최적화하여, 학습된 사용자 선호도 특성 추출 모델을 획득한다. 여기에서 은닉 유닛의 상태는 현재 사용자

의 선호도 특성을 나타낸다.

단계 4: 학습된 사용자 선호도 특성 추출 모델을 기반으로 사용자 선호도 확률 모델을 구축한다.

여기에서,

는 사용자

가 선호하는 항목이 제

류 태그 항목의 확률이 있음을 나타내며, 계산 단계는 하기와 같다.

(4.1) 사용자가 선호하는 제

류 태그 항목을 가진 절대 확률을 예측한다.

여기에서,

은 항목

의 제

개 카테고리 태그

의 주변 분포( marginal distribution)이고,

는 항목

의 제

개 카테고리 태그

의 주변 분포이고,

는

중 모든 샘플의 평균 주변 분포이다.

,

,

,

여기에서

는 벡터

의 제

개 원소이고,

는 제

개 샘플 중 항목의 카테고리 태그 벡터

의 제

개 은닉 유닛에서의 에너지값이며, 그 계산식은 하기와 같다.

예를 들어, 항목에는 2개 카테고리 태그가 있고, 즉

=2이고, 3개 샘플이 있으며,

이고, 카테고리 태그 벡터는 각각

,

이다.

계산 시

와

를 계산해야 하고,

계산 시

의 샘플만 고려하며, 즉 제1, 제2 샘플이며

이다.

계산 시

의 샘플만 고려하며, 즉 제3 샘플이며

이다.

(4.2) 사용자 선호도에 제

류 태그 항목이 있는 절대 확률에 대해 정규화를 수행한다.

획득한

는 사용자

의 사용자 선호도 확률 모델이며,

값이 클수록 사용자 선호도가 제

류 태그의 항목을 가진다.

단계 5: 군체 크기 N을 설정하고, 분포 예측 알고리즘(Estimation of Distribution Algorithms, EDA)을 채택하여 N개 신규 항목을 생성하고, 신규 항목의 카테고리 태그 벡터

(

)의 설정 단계는 하기와 같다.

(5.1) n=1로 한다.

(5.2)

사이의 난수 z를 생성한다. 만약

이며, 제n개 신규 항목의 카테고리 태그 벡터

의 제

개 원소는 1이며, 그렇지 않으면 0이다.

(5.3) n에 1을 더하고,

이 될 때까지 단계 (5.2)를 반복한다.

이때 N개 신규 항목은 카테고리 태그 벡터만 확정하였으며, 구체적인 항목 내용은 확정하지 않았음에 유의한다.

단계 6: 검색 공간에서 각각 N개 신규 항목 카테고리 태그 벡터

를 구성한다. 본 실시예에 있어서 유크리드 거리를 유사도로 사용한 계산에서 두 벡터 사이의 유크리드 거리가 짧을수록 둘의 유사도가 높다.

이때 N개 신규 항목의 내용이 확정되면 하기 단계에서 이에 대해 추가적 선별을 수행한다.

단계 7: 추천할 항목 세트

중 각 항목의 적응값을 계산한다.

(7.1) 사용자

의

중 각 항목의 맞춤형 선호도 평점

을 예측한다.

여기에서

는 현재 사용자

와의 유사도가 임계값보다 큰 사용자

의 항목

에 대한 평가 에너지 함수이며, 그 계산식은 하기와 같다.

여기에서

는 x 카테고리 태그 벡터 중 제

개 원소이다.

는 사용자

의 x에 대한 평가 텍스트 벡터화의 제

개 원소이다.

는 사용자 선호도 특성 추출 모델 중 제1 가시층 중 가시 유닛의 오프셋

의 제

개 원소이다.

는 사용자 선호도 특성 추출 모델 중 제2 가시층 중 가시 유닛의 오프셋

의 제

개 원소이다.

은 사용자 선호도 특성 추출 모델 중 은닉층 중 은닉 유닛의 오프셋 b의 제

개 원소이다.

은 제1 가시층 중 제

개 가시 유닛과 은닉층 중 제

개 은닉 유닛 간의 연결 가중치이다.

은 제2 가시층 중 제

개 가시 유닛과 은닉층 중 제

개 은닉 유닛 간의 연결 가중치이다.

의 계산식에서 알 수 있듯이, 항목

에너지 함수의 크기는 사용자의 그에 대한 평가 텍스트와 관련이 있기 때문에, 본 단계에서 현재 사용자

와 유사한 사용자를 선택해야 하며, 현재 사용자

와 모든 사용자 중 어느 하나의 사용자

의 유사도

계산식은 하기와 같다.

여기에서

는 사용자

와

가 모두 평가한 항목 세트를 나타낸다.

는 사용자

의

중 항목

에 대한 평점이다.

는 사용자

의

에 대한 평점이다.

는 사용자

의 이미

에 의해 평가된 모든 항목의 평균 평점이다.

는 사용자

의 이미

에 의해 평가된 모든 항목의 평균 평점이다.

와

은 각각 추천할 항목 세트

의 모든 항목 중 획득된 에너지 함수의 최댓값과 최솟값이다.

(7.2)

중 각 항목의 적응값을 계산한다.

사용자의 개성과 사용자가 소재한 군체를 충분히 이용하기 위하여, 본 실시예에서의 적응값에는 사용자

의 맞춤형 평가, 및 사용자

와 유사한 사용자의 군체 평가가 포함되며, 구체적인 계산 단계는 하기와 같다.

(7.2.1) 모든 사용자 중에서 사용자

와 유사도가 가장 높은 앞

개 사용자를 선택하여, 사용자

의 이웃 사용자 세트

를 구성하며,

의

중 항목

에 대한 가중치 평균 평점을 계산한다.

여기에서

는

중의 사용자

의

중 항목

에 대한 평점이다. 만약 사용자

가 항목

에 대해 평점이 없으면

=0이다.

(7.2.2)

중 항목

의 적응값은 하기와 같다.

여기에서

는 개인 예측 평점에 대한 사회적 지식의 기여도를 조정하는 데 사용되는 계수이다. 만약 군체 평가를 고려하지 않는다면,

를 1로 설정하면 된다.

는 정규화 함수이다.

단계 8:

중 적응값이 최대인 앞

개 항목을 검색 결과로 선택한다.

사용자 관심 선호도의 다양성과 동적인 변화 특성으로 인해, 인터랙티브 맞춤형 검색 과정의 초기 단계에서 우위 항목 세트에 포함된 현재 사용자의 선호도 정보가 충분하지 않으며, 학습된 RBM 기반의 사용자 선호도 특성 추출 모델을 이용하여 추출한 사용자의 선호도 특성은 비교적 조악하다. 또한 사용자의 항목에 대한 인지도와 선호도는 주관적이고 모호하며 점진적이며 불확실하다. 사용자가 맞춤형 검색을 수행하는 과정에서 환경 변화, 정보량 증가 등 요인의 영향에 따라, 사용자 수요와 흥미 선호도가 점차 명확해지고 심지어 변화가 일어날 수 있다. 따라서 정확하고 동적으로 변화하는 사용자 선호도 특성을 획득하기 위해, 사용자 인터랙티브형 검색 과정의 추진과 사용자 행위의 동적 변화에 따라, 현재 사용자와 가장 가까운 평가 데이터에 의거하여, 다시 멀티-소스 이종 데이터를 융합한 제한적 볼츠만 머신 기반의 사용자 선호도 특성 추출 모델을 학습하여, 추출된 사용자 선호도 특성을 동적으로 업데이트하고, 동시에 사용자 선호도 확률 모델을 업데이트하여, 즉시 현재 사용자의 선호도를 추적함으로써, 인터랙티브 맞춤형 검색 과정의 전진 방향을 효과적으로 안내하여 사용자가 순조롭게 맞춤형 검색을 완료하도록 보장한다.

Claims

제한적 볼츠만 머신 구동 기반의 인터랙티브 맞춤형 검색 방법에 있어서,
(1) 사용자
의 히스토리 평가 데이터를 획득하고, 상기 히스토리 평가 데이터에는 사용자
가 이미 평가한 모든 항목, 각 항목에 대한 평점과 평가 텍스트가 포함되며, 평가 텍스트에 대해 벡터화를 수행하고;
(2) 평점이 소정 평점 임계값보다 큰 항목을 우위 항목 세트
으로 구성하고, 샘플 세트
를 구성하고, 여기에서
이고,
는 항목
의 카테고리 태그 벡터이고, 길이는 카테고리 총 수
이고;
는 사용자
의 항목
에 대한 평가 텍스트 벡터화 표시이고, 길이는
이고;
,
이고,
는
중의 항목 수를 나타내고;
(3) RBM 기반의 사용자 선호도 특성 추출 모델을 구축하며, 상기 사용자 선호도 특성 추출 모델은 우위 항목 세트
에 따라 사용자의 선호도 특성을 추출하고;
(4) 사용자 선호도 확률 모델을 구축하며, 상기 사용자 선호도 확률 모델은 사용자의 각 카테고리 항목에 대한 선호도 확률을 나타내는 데 사용되고;
(5) 군체 크기 N을 설정하고, 분포 예측 알고리즘을 채택하여 N개 신규 항목을 생성하고 각 항목의 카테고리 태그를 설정하고;
(6) 검색 공간에서 각각 N개 신규 항목 카테고리 태그 벡터
와 유사도가 가장 높은 N개 항목을 선택하고, 추천할 항목 세트
를 구성하고;
(7) 추천할 항목 세트
중 각 항목의 적응값을 계산하고;
(7.1) 사용자
의
중 각 항목에 대한 맞춤형 선호도 평점
를 예측하고,

여기에서,
는 현재 사용자
와의 유사도가 임계값보다 큰 사용자
의 항목
에 대한 평가 에너지 함수이고;
와
은 각각 추천할 항목 세트
의 모든 항목 중 획득한 에너지 함수의 최댓값과 최솟값이고;
(7.2)
중 각 항목의 적응값을 계산하고;

여기에서
는 정규화 함수이고;
(8)
중 적응값이 최대인 앞
개 항목을 검색 결과로 선택하는 것을 특징으로 하는 제한적 볼츠만 머신 구동 기반의 인터랙티브 맞춤형 검색 방법.
제1항에 있어서,
사용자 선호도 특성 추출 모델은 제1 가시층, 제2 가시층, 은닉층을 포함하고; 상기 제1 가시층에는
개 가시 유닛이 있고, 각 가시 유닛은 바이너리 변수이고; 제2 가시층은
개 가시 유닛이 있고, 각 가시 유닛은 실수이고; 상기 은닉층은 m개 은닉 유닛이 있고, 각 은닉 유닛은 실수이고; 상기 사용자 선호도 특성 추출 모델의 파라미터는
이고, 여기에서 w¹, w²는 각각 제1 가시층 중 가시 유닛과 은닉층 중 은닉 유닛, 제2 가시층 중 가시 유닛과 은닉층 중 은닉 유닛 사이의 연결 가중치를 나타내고; a¹, a²는 각각 제1 가시층 중 가시 유닛, 제2 가시층 중 가시 유닛의 오프셋이고; b는 은닉층 중 은닉 유닛의 오프셋이고;
샘플 세트 중 각 샘플의
와
를 사용자 선호도 특성 추출 모델의 제1 가시층과 제2 가시층에 입력하고, 대조적 발산(Contrastive Divergence) 학습 알고리즘을 채택해 상기 모델을 학습시키고, 모델 파라미터
를 최적화하여, 학습된 사용자 선호도 특성 추출 모델을 획득하는 것을 특징으로 하는 인터랙티브 맞춤형 검색 방법.
제2항에 있어서,
사용자 선호도 확률 모델을 구축하고;

여기에서,
는 사용자
가 선호하는 항목이 제
류 태그 항목의 확률이 있음을 나타내는 것을 특징으로 하는 인터랙티브 맞춤형 검색 방법.
제3항에 있어서,

의 계산 단계는 하기와 같고,
(4.1) 사용자가 선호하는 제
류 태그 항목을 가진 절대 확률을 예측하고;

여기에서,
은 항목
의 제
개 카테고리 태그
의 주변 분포( marginal distribution)이고,
는 항목
의 제
개 카테고리 태그
의 주변 분포이고,
는
중 모든 샘플의 평균 주변 분포이고;

,

,

,
여기에서
는 벡터
의 제
개 원소이고,
는 제
개 샘플 중 항목의 카테고리 태그 벡터
의 제
개 은닉 유닛에서의 에너지값이며, 그 계산식은 하기와 같고,

(4.2) 사용자 선호도에 제
류 태그 항목이 있는 절대 확률에 대해 정규화를 수행하고,

획득한
는 사용자
의 사용자 선호도 확률 모델인 것을 특징으로 하는 인터랙티브 맞춤형 검색 방법.
제2항에 있어서,
사용자
의 항목
에 대한 평가 에너지 함수이며, 그 계산식은 하기와 같고;

여기에서
는 x 카테고리 태그 벡터 중 제
개 원소이고;
는 사용자
의 x에 대한 평가 텍스트 벡터화의 제
개 원소이고;
는 사용자 선호도 특성 추출 모델 중 제1 가시층 중 가시 유닛의 오프셋
의 제
개 원소이고;
는 사용자 선호도 특성 추출 모델 중 제2 가시층 중 가시 유닛의 오프셋
의 제
개 원소이고;
은 사용자 선호도 특성 추출 모델 중 은닉층 중 은닉 유닛의 오프셋 b의 제
개 원소이고;
은 제1 가시층 중 제
개 가시 유닛과 은닉층 중 제
개 은닉 유닛 간의 연결 가중치이고;
은 제2 가시층 중 제
개 가시 유닛과 은닉층 중 제
개 은닉 유닛 간의 연결 가중치인 것을 특징으로 하는 인터랙티브 맞춤형 검색 방법.
제1항에 있어서,
상기 단계 (5)에서 신규 항목의 카테고리 태그 벡터
의 설정 단계는 하기와 같고,
(5.1) n=1로 하고;
(5.2)
사이의 난수 z를 생성하고; 만약
이며, 제n개 신규 항목의 카테고리 태그 벡터
의 제
개 원소는 1이며, 그렇지 않으면 0이고;
(5.3) n에 1을 더하고,
이 될 때까지 단계 (5.2)를 반복하는 것을 특징으로 하는 인터랙티브 맞춤형 검색 방법.
제1항에 있어서,
상기 단계 (7.2) 중 각 항목의 적응값은 사용자의 군체 평가가 포함되며, 구체적인 계산 단계는 하기와 같고,
(7.2.1) 모든 사용자 중에서 사용자
와 유사도가 가장 높은 앞
개 사용자를 선택하여, 사용자
의 이웃 사용자 세트
를 구성하며,
의
중 항목
에 대한 가중치 평균 평점을 계산하고,

여기에서
는
중의 사용자
의
중 항목
에 대한 평점이고; 만약 사용자
가 항목
에 대해 평점이 없으면
=0이고;
(7.2.2)
중 항목
의 적응값은 하기와 같고,

여기에서
는 개인 예측 평점에 대한 사회적 지식의 기여도를 조정하는 데 사용되는 계수인 것을 특징으로 하는 인터랙티브 맞춤형 검색 방법.
제2항에 있어서,
상기 은닉층 중 은닉 유닛 개수 m은 카테고리 총 수
의 0.8 내지 1.2배인 것을 특징으로 하는 인터랙티브 맞춤형 검색 방법.
제1항에 있어서,
사용자
와 공동 평점 항목이 존재하는 사용자
,
,
와
의 유사도
계산식은 하기와 같고,

여기에서
는 사용자
와
가 모두 평가한 항목 세트를 나타내고;
는 사용자
의
중 항목
에 대한 평점이고,
는 사용자
의
에 대한 평점이고;
는 사용자
의 이미
에 의해 평가된 모든 항목의 평균 평점이고;
는 사용자
의 이미
에 의해 평가된 모든 항목의 평균 평점인 것을 특징으로 하는 인터랙티브 맞춤형 검색 방법.