KR102600697B1 - 제한적 볼츠만 머신 구동 기반의 인터랙티브 맞춤형 검색 방법 - Google Patents

제한적 볼츠만 머신 구동 기반의 인터랙티브 맞춤형 검색 방법 Download PDF

Info

Publication number
KR102600697B1
KR102600697B1 KR1020217011962A KR20217011962A KR102600697B1 KR 102600697 B1 KR102600697 B1 KR 102600697B1 KR 1020217011962 A KR1020217011962 A KR 1020217011962A KR 20217011962 A KR20217011962 A KR 20217011962A KR 102600697 B1 KR102600697 B1 KR 102600697B1
Authority
KR
South Korea
Prior art keywords
user
item
items
visible
hidden
Prior art date
Application number
KR1020217011962A
Other languages
English (en)
Other versions
KR20210120977A (ko
Inventor
린 바오
위보 티엔
전카이 장
민 왕
궈쥔 마
시아오치아오 덩
Original Assignee
지앙수 유니버시티 오브 사이언스 앤드 테크놀로지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 지앙수 유니버시티 오브 사이언스 앤드 테크놀로지 filed Critical 지앙수 유니버시티 오브 사이언스 앤드 테크놀로지
Publication of KR20210120977A publication Critical patent/KR20210120977A/ko
Application granted granted Critical
Publication of KR102600697B1 publication Critical patent/KR102600697B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/58Random or pseudo-random number generators
    • G06F7/588Random number generators, i.e. based on natural stochastic processes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 제한적 볼츠만 머신 구동 기반의 인터랙티브 맞춤형 검색 방법을 개시한 것으로, (1) 사용자 의 히스토리 평가 데이터를 획득하고, 상기 히스토리 평가 데이터에는 사용자 가 이미 평가한 모든 항목과 각 항목에 대한 평점과 평가 텍스트가 포함되며, 평가 텍스트에 대해 벡터화를 수행하고; (2) 평점이 소정 평점 임계값보다 큰 항목을 우위 항목 세트 으로 구성하고; (3) RBM 기반의 사용자 선호도 특성 추출 모델을 구축하며; (4) 사용자 선호도 확률 모델을 구축하며; (5) N개 신규 항목을 생성하고 각 항목의 카테고리 태그를 설정하고; (6) 검색 공간에서 각각 N개 신규 항목 카테고리 태그 벡터 와 유사도가 가장 높은 N개 항목을 선택하고, 추천할 항목 세트 를 구성하고; (7) 중 각 항목의 적응값을 계산하고; (8) 중 적응값이 최대인 앞 개 항목을 검색 결과로 선택한다. 해당 방법은 사용자가 맞춤형 검색을 수행하는 방향을 효과적으로 인도할 수 있고, 사용자가 자신이 만족스러운 결과를 검색하도록 최대한 지원함으로써 맞춤형 검색 알고리즘의 종합 성능을 향상시킬 수 있다.

Description

제한적 볼츠만 머신 구동 기반의 인터랙티브 맞춤형 검색 방법
본 발명은 데이터 마이닝(data mining) 기술 분야에 속하며, 더욱 상세하게는 인터랙티브 맞춤형 검색 방법에 관한 것이다.
빅데이터, 클라우드 컴퓨팅 등 기술이 급성장함에 따라, 정보도 폭발적으로 증가하였다. 다양한 인터넷 응용 프로그램에 대량의 사용자 생성 콘텐츠가 수집되면서 사용자에게 새로운 정보가 제공되기도 하나, 동시에 사용자가 유효 정보를 선별하고 최종적으로 의사 결정을 내리는 난이도도 증가하였다. 맞춤형 검색은 사용자와 정보를 연결하는 가교 역할을 수행하여, 사용자가 신속하게 검색하도록 안내하고 사용자가 방대한 정보 속에서 자신이 흥미를 가진 콘텐츠를 빠르게 선별하도록 보조함으로써, 정보 과부하를 효과적으로 완화시킬 수 있다.
사용자 생성 콘텐츠에는 사용자 행동 데이터, 사용자 정보, 프로젝트 정보 등 사용자가 제공하는 수많은 정보가 포함된다. 이러한 멀티-소스 이종 데이터(Multi-Source Heterogeneous Data)는 상이한 관점에서 사용자의 관심과 기호가 반영되어 있으므로, 이러한 정보를 충분히 이용하면 맞춤형 검색의 품질을 효과적으로 개선할 수 있다. 사용자 생성 콘텐츠가 가진 데이터 희소성, 불완전성, 동적 성질 등 복잡한 특성으로 인해, 멀티-소스 이종 사용자 생성 콘텐츠 데이터를 융합하여 처리하는 맞춤형 검색 문제는 난이도가 더욱 높다. 인터랙티브 진화 연산(interactive evolutionary computation)은 최적화 문제에 대한 사용자의 주관적 평가와 의사결정을 효과적으로 이용하여 인류 지능 평가 정보와 종래의 진화 최적화 알고리즘을 결합한, 멀티-소스 이종 데이터를 융합하여 맞춤형 검색 문제를 해결하는 효과적인 방법이다.
출원 번호 201410202346.X의 중국 특허는 심리학 도서 맞춤형 신속 검색을 위한 인터랙티브 진화 최적화 방법을 공개하였다. 이는 사용자가 신속하게 만족스러운 도서를 찾도록 안내한다. 상기 방법은 사용자의 검색 기록과 군집 공통 검색 정보를 이용하여 사용자 선호도 모델을 구축하나, 사용자 히스토리 데이터에 내포된 선호도 특성을 충분히 발굴하지 않는다. 출원 번호 201910151051.7의 중국 특허는 맞춤형 상품 추천 방법을 공개하였다. 상기 방법은 사용자의 분류에 따라 상품을 추천하므로, 상이한 유형의 사용자 간의 개별성 차이만 구현할 수 있으며, 구체적인 사용자를 위한 맞춤화는 구현할 수 없다. 출원 번호 201910431441.X의 중국 특허는 상호 데이터 클러스터링 기반의 맞춤형 추천 방법 및 시스템을 공개하였다. 여기에서 맞춤형 추천 방법은 사용자 클러스터링을 통해 유사 사용자의 관심 지점을 획득함으로써 사용자에 대한 맞춤형 추천을 수행하지만, 마찬가지로 동일 유형 사용자의 선호도를 구현한다.
본 발명의 목적은 상기 종래 기술의 문제를 보완하기 위해 제한적 볼츠만 머신(Boltzmann machine) 구동 기반의 인터랙티브 맞춤형 검색 방법을 제공하는 데에 있다. 상기 방법은 현재 사용자가 맞춤형 검색을 수행하도록 안내한다.
본 발명은 하기와 같은 기술적 해결책을 채택한다.
제한적 볼츠만 머신 구동 기반의 인터랙티브 맞춤형 검색 방법은 하기 단계를 포함한다.
(1) 사용자 의 히스토리 평가 데이터를 획득한다. 상기 히스토리 평가 데이터에는 사용자 가 이미 평가한 모든 항목, 각 항목에 대한 평점과 평가 텍스트가 포함되며, 평가 텍스트에 대해 벡터화를 수행한다.
(2) 평점이 소정 평점 임계값보다 큰 항목을 우위 항목 세트 으로 구성하고, 샘플 세트 를 구성한다. 여기에서 이고, 는 항목 의 카테고리 태그 벡터이고, 길이는 카테고리 총 수 이고, 는 사용자 의 항목 에 대한 평가 텍스트 벡터화 표시이고, 길이는 이고; , 이고, 중의 항목 수를 나타낸다.
(3) RBM 기반의 사용자 선호도 특성 추출 모델을 구축하며, 상기 사용자 선호도 특성 추출 모델은 우위 항목 세트 에 따라 사용자의 선호도 특성을 추출한다.
(4) 사용자 선호도 확률 모델을 구축하며, 상기 사용자 선호도 확률 모델은 사용자의 각 카테고리 항목에 대한 선호도 확률을 나타내는 데 사용된다.
(5) 군체 크기 N을 설정하고, 분포 예측 알고리즘을 채택하여 N개 신규 항목을 생성하고 각 항목의 카테고리 태그를 설정한다.
(6) 검색 공간에서 각각 N개 신규 항목 카테고리 태그 벡터 와 유사도가 가장 높은 N개 항목을 선택하고, 추천할 항목 세트 를 구성한다.
(7) 추천할 항목 세트 중 각 항목의 적응값을 계산한다.
(7.1) 사용자 중 각 항목에 대한 맞춤형 선호도 평점 를 예측한다.
여기에서, 는 현재 사용자 와의 유사도가 임계값보다 큰 사용자 의 항목 에 대한 평가 에너지 함수이다. 은 각각 추천할 항목 세트 의 모든 항목 중 획득한 에너지 함수의 최댓값과 최솟값이다.
(7.2) 중 각 항목의 적응값을 계산한다.
여기에서 는 정규화 함수이다.
(8) 중 적응값이 최대인 앞 개 항목을 검색 결과로 선택한다.
본 발명의 유익한 효과는 다음과 같다. 본 발명에 개시된 인터랙티브 맞춤형 검색 방법은 사용자 생성 콘텐츠의 멀티-소스 이종 데이터를 충분히 이용하며, 여기에는 사용자 평점, 텍스트 태그, 텍스트 평론 등 정보가 포함된다. 사용자 선호도 특성이 반영된 사용자 선호도 특성 추출 모델을 구축하고, 이 모델을 기반으로 사용자 선호도 확률 모델을 구축한다. 구축된 모델을 통해 사용자 선호도가 포함된 신규 항목을 생성하며, 그 중 사용자 선호도에 가장 매칭되는 항목을 검색 결과로 선택한다. 상기 방법은 멀티-소스 이종 복잡 데이터 환경 하의 사용자 맞춤형 검색 문제를 더욱 잘 해결할 수 있으며, 사용자가 맞춤형 검색을 수행하는 방향을 효과적으로 인도할 수 있고, 사용자가 자신이 만족스러운 결과를 검색하도록 최대한 지원함으로써 맞춤형 검색 알고리즘의 종합 성능을 향상시킬 수 있다.
도 1은 본 발명에서 개시한 인터랙티브 맞춤형 검색 방법의 흐름도이다.
도 2는 제한적 볼츠만 머신 기반의 사용자 선호도 모델의 구조도이다.
이하에서는 첨부 도면과 구체적인 실시 방식을 참고하여 본 발명을 더욱 상세하게 설명한다.
도 1에 도시된 바와 같이, 본 발명은 제한적 볼츠만 머신(Restricted Boltzmann Machine, RBM) 구동 기반의 인터랙티브 맞춤형 검색 방법을 개시하였으며 하기 단계를 포함한다.
단계 1: 사용자 의 히스토리 평가 데이터를 획득한다. 상기 히스토리 평가 데이터에는 사용자 가 이미 평가한 모든 항목, 각 항목에 대한 평점과 평가 텍스트가 포함되며, 평가 텍스트에 대해 벡터화를 수행한다.
본 실시예에서 평가 텍스트에 대해 벡터화를 수행하는 단계는 다음과 같다. 즉, 먼저 텍스트 중 문장 부호, 스톱 워드(stop word)를 제거한 다음 문헌 Le Q, Mikolov T. Distributed representations of sentences and documents[C]//International conference on machine learning. 2014: 1188-1196 중의 doc2vec 텍스트 벡터화 표시 모델을 채택하여, 사용자의 평가 텍스트에 대한 벡터화를 수행한다.
단계 2: 평점이 소정 평점 임계값보다 큰 항목을 우위 항목 세트 로 구성한다.
샘플 세트 를 구성하며, 여기에서 이고, 는 항목 의 카테고리 태그 벡터이고, 길이는 카테고리 총 수 이다. 중 각 원소 는 바이너리 변수이다. =1은 항목 가 제류 태그를 가짐을 나타내며, ,이다. 주목할 점은 본 발명에서 상이한 카테고리 사이는 상호 배척하지 않으며, 하나의 항목은 동시에 복수 카테고리 태그에서 1로 동시에 존재할 수 있다. 예를 들어 서적 검색에 있어서, 항목이 서적인 경우, 한 권의 책에는 복수 카테고리 태그가 있을 수 있다. 예를 들어 <장거정전()>은 동시에 인물 전기, 중국 역사의 몇몇 태그가 있을 수 있으며 대응하는 카테고리 태그가 1이다. 영상 검색에 있어서, 항목이 영상 작품인 경우, 하나의 영상 작품도 복수 카테고리 태그가 있을 수도 있다. 예를 들어 <삼국연의()>는 동시에 TV 드라마, 역사의 몇몇 카테고리 태그가 있을 수 있으며 마찬가지로 대응하는 카테고리 태그가 1이다.
는 사용자 의 항목 에 대한 평가 텍스트 벡터화 표시이고, 길이는 이고, , 이고, 중의 항목 수를 나타낸다.
단계 3: RBM 기반의 사용자 선호도 특성 추출 모델을 구축한다. 도 2에 도시된 바와 같이, 사용자 선호도 특성 추출 모델은 제1 가시층 , 제2 가시층 , 은닉층 h을 포함한다. 상기 제1 가시층에는 개 가시 유닛이 있고, 각 가시 유닛은 바이너리 변수이다. 제2 가시층은 개 가시 유닛이 있고, 각 가시 유닛은 실수이다. 상기 은닉층은 m개 은닉 유닛이 있고, 각 은닉 유닛은 실수이다. 상기 사용자 선호도 특성 추출 모델의 파라미터는 이다. 여기에서 w1, w2는 각각 제1 가시층 중 가시 유닛과 은닉층 중 은닉 유닛, 제2 가시층 중 가시 유닛과 은닉층 중 은닉 유닛 사이의 연결 가중치를 나타낸다. a1, a2는 각각 제1 가시층 중 가시 유닛, 제2 가시층 중 가시 유닛의 오프셋이다. b는 은닉층 중 은닉 유닛의 오프셋이다. 은닉층 중 은닉 유닛 개수 m은 카테고리 총수 의 0.8 내지 1.2배이다. 본 실시예에서 를 설정하며, 는 정수 올림 연산이다.
샘플 세트 중 각 샘플의 를 사용자 선호도 특성 추출 모델의 제1 가시층과 제2 가시층에 입력하고, 대조적 발산(Contrastive Divergence) 학습 알고리즘을 채택해 상기 모델을 학습시키고, 모델 파라미터 를 최적화하여, 학습된 사용자 선호도 특성 추출 모델을 획득한다. 여기에서 은닉 유닛의 상태는 현재 사용자 의 선호도 특성을 나타낸다.
단계 4: 학습된 사용자 선호도 특성 추출 모델을 기반으로 사용자 선호도 확률 모델을 구축한다.
여기에서, 는 사용자 가 선호하는 항목이 제류 태그 항목의 확률이 있음을 나타내며, 계산 단계는 하기와 같다.
(4.1) 사용자가 선호하는 제류 태그 항목을 가진 절대 확률을 예측한다.
여기에서, 은 항목 의 제개 카테고리 태그 의 주변 분포( marginal distribution)이고, 는 항목 의 제개 카테고리 태그 의 주변 분포이고, 중 모든 샘플의 평균 주변 분포이다.
,
,
,
여기에서 는 벡터 의 제개 원소이고, 는 제개 샘플 중 항목의 카테고리 태그 벡터 의 제개 은닉 유닛에서의 에너지값이며, 그 계산식은 하기와 같다.
예를 들어, 항목에는 2개 카테고리 태그가 있고, 즉 =2이고, 3개 샘플이 있으며, 이고, 카테고리 태그 벡터는 각각 , , 이다.
계산 시 를 계산해야 하고, 계산 시 의 샘플만 고려하며, 즉 제1, 제2 샘플이며 이다. 계산 시 의 샘플만 고려하며, 즉 제3 샘플이며 이다.
(4.2) 사용자 선호도에 제류 태그 항목이 있는 절대 확률에 대해 정규화를 수행한다.
획득한 는 사용자 의 사용자 선호도 확률 모델이며, 값이 클수록 사용자 선호도가 제류 태그의 항목을 가진다.
단계 5: 군체 크기 N을 설정하고, 분포 예측 알고리즘(Estimation of Distribution Algorithms, EDA)을 채택하여 N개 신규 항목을 생성하고, 신규 항목의 카테고리 태그 벡터 ()의 설정 단계는 하기와 같다.
(5.1) n=1로 한다.
(5.2) 사이의 난수 z를 생성한다. 만약 이며, 제n개 신규 항목의 카테고리 태그 벡터 의 제개 원소는 1이며, 그렇지 않으면 0이다.
(5.3) n에 1을 더하고, 이 될 때까지 단계 (5.2)를 반복한다.
이때 N개 신규 항목은 카테고리 태그 벡터만 확정하였으며, 구체적인 항목 내용은 확정하지 않았음에 유의한다.
단계 6: 검색 공간에서 각각 N개 신규 항목 카테고리 태그 벡터 와 유사도가 가장 높은 N개 항목을 선택하고, 추천할 항목 세트 를 구성한다. 본 실시예에 있어서 유크리드 거리를 유사도로 사용한 계산에서 두 벡터 사이의 유크리드 거리가 짧을수록 둘의 유사도가 높다.
이때 N개 신규 항목의 내용이 확정되면 하기 단계에서 이에 대해 추가적 선별을 수행한다.
단계 7: 추천할 항목 세트 중 각 항목의 적응값을 계산한다.
(7.1) 사용자 중 각 항목의 맞춤형 선호도 평점 을 예측한다.
여기에서 는 현재 사용자 와의 유사도가 임계값보다 큰 사용자 의 항목 에 대한 평가 에너지 함수이며, 그 계산식은 하기와 같다.
여기에서 는 x 카테고리 태그 벡터 중 제개 원소이다. 는 사용자 의 x에 대한 평가 텍스트 벡터화의 제개 원소이다. 는 사용자 선호도 특성 추출 모델 중 제1 가시층 중 가시 유닛의 오프셋 의 제개 원소이다. 는 사용자 선호도 특성 추출 모델 중 제2 가시층 중 가시 유닛의 오프셋 의 제개 원소이다. 은 사용자 선호도 특성 추출 모델 중 은닉층 중 은닉 유닛의 오프셋 b의 제개 원소이다. 은 제1 가시층 중 제개 가시 유닛과 은닉층 중 제개 은닉 유닛 간의 연결 가중치이다. 은 제2 가시층 중 제개 가시 유닛과 은닉층 중 제개 은닉 유닛 간의 연결 가중치이다.
의 계산식에서 알 수 있듯이, 항목 에너지 함수의 크기는 사용자의 그에 대한 평가 텍스트와 관련이 있기 때문에, 본 단계에서 현재 사용자 와 유사한 사용자를 선택해야 하며, 현재 사용자 와 모든 사용자 중 어느 하나의 사용자 의 유사도 계산식은 하기와 같다.
여기에서 는 사용자 가 모두 평가한 항목 세트를 나타낸다. 는 사용자 중 항목 에 대한 평점이다. 는 사용자 에 대한 평점이다. 는 사용자 의 이미 에 의해 평가된 모든 항목의 평균 평점이다. 는 사용자 의 이미 에 의해 평가된 모든 항목의 평균 평점이다.
은 각각 추천할 항목 세트 의 모든 항목 중 획득된 에너지 함수의 최댓값과 최솟값이다.
(7.2) 중 각 항목의 적응값을 계산한다.
사용자의 개성과 사용자가 소재한 군체를 충분히 이용하기 위하여, 본 실시예에서의 적응값에는 사용자 의 맞춤형 평가, 및 사용자 와 유사한 사용자의 군체 평가가 포함되며, 구체적인 계산 단계는 하기와 같다.
(7.2.1) 모든 사용자 중에서 사용자 와 유사도가 가장 높은 앞 개 사용자를 선택하여, 사용자 의 이웃 사용자 세트 를 구성하며, 중 항목 에 대한 가중치 평균 평점을 계산한다.
여기에서 중의 사용자 중 항목 에 대한 평점이다. 만약 사용자 가 항목 에 대해 평점이 없으면 =0이다.
(7.2.2) 중 항목 의 적응값은 하기와 같다.
여기에서 는 개인 예측 평점에 대한 사회적 지식의 기여도를 조정하는 데 사용되는 계수이다. 만약 군체 평가를 고려하지 않는다면, 를 1로 설정하면 된다. 는 정규화 함수이다.
단계 8: 중 적응값이 최대인 앞 개 항목을 검색 결과로 선택한다.
사용자 관심 선호도의 다양성과 동적인 변화 특성으로 인해, 인터랙티브 맞춤형 검색 과정의 초기 단계에서 우위 항목 세트에 포함된 현재 사용자의 선호도 정보가 충분하지 않으며, 학습된 RBM 기반의 사용자 선호도 특성 추출 모델을 이용하여 추출한 사용자의 선호도 특성은 비교적 조악하다. 또한 사용자의 항목에 대한 인지도와 선호도는 주관적이고 모호하며 점진적이며 불확실하다. 사용자가 맞춤형 검색을 수행하는 과정에서 환경 변화, 정보량 증가 등 요인의 영향에 따라, 사용자 수요와 흥미 선호도가 점차 명확해지고 심지어 변화가 일어날 수 있다. 따라서 정확하고 동적으로 변화하는 사용자 선호도 특성을 획득하기 위해, 사용자 인터랙티브형 검색 과정의 추진과 사용자 행위의 동적 변화에 따라, 현재 사용자와 가장 가까운 평가 데이터에 의거하여, 다시 멀티-소스 이종 데이터를 융합한 제한적 볼츠만 머신 기반의 사용자 선호도 특성 추출 모델을 학습하여, 추출된 사용자 선호도 특성을 동적으로 업데이트하고, 동시에 사용자 선호도 확률 모델을 업데이트하여, 즉시 현재 사용자의 선호도를 추적함으로써, 인터랙티브 맞춤형 검색 과정의 전진 방향을 효과적으로 안내하여 사용자가 순조롭게 맞춤형 검색을 완료하도록 보장한다.

Claims (9)

  1. 컴퓨팅 장치에 의해 수행되는 제한적 볼츠만 머신 구동 기반의 인터랙티브 맞춤형 검색 방법에 있어서,
    (1) 사용자 의 히스토리 평가 데이터를 획득하고, 상기 히스토리 평가 데이터에는 사용자 가 이미 평가한 모든 항목, 각 항목에 대한 평점과 평가 텍스트가 포함되며, 평가 텍스트에 대해 벡터화를 수행하고;
    (2) 평점이 소정 평점 임계값보다 큰 항목을 우위 항목 세트 으로 구성하고, 샘플 세트 를 구성하고, 여기에서 이고, 는 항목 의 카테고리 태그 벡터이고, 길이는 카테고리 총 수 이고; 는 사용자 의 항목 에 대한 평가 텍스트 벡터화 표시이고, 길이는 이고; , 이고, 중의 항목 수를 나타내고;
    (3) RBM 기반의 사용자 선호도 특성 추출 모델을 구축하며, 상기 사용자 선호도 특성 추출 모델은 우위 항목 세트 에 따라 사용자의 선호도 특성을 추출하고;
    (4) 사용자 선호도 확률 모델을 구축하며, 상기 사용자 선호도 확률 모델은 사용자의 각 카테고리 항목에 대한 선호도 확률을 나타내는 데 사용되고;
    (5) 군체 크기 N을 설정하고, 분포 예측 알고리즘을 채택하여 N개 신규 항목을 생성하고 각 항목의 카테고리 태그를 설정하고;
    (6) 검색 공간에서 각각 N개 신규 항목 카테고리 태그 벡터 와 유사도가 가장 높은 N개 항목을 선택하고, 추천할 항목 세트 를 구성하고;
    (7) 추천할 항목 세트 중 각 항목의 적응값을 계산하고;
    (7.1) 사용자 중 각 항목에 대한 맞춤형 선호도 평점 를 예측하고,

    여기에서, 는 현재 사용자 와의 유사도가 임계값보다 큰 사용자 의 항목 에 대한 평가 에너지 함수이고; 은 각각 추천할 항목 세트 의 모든 항목 중 획득한 에너지 함수의 최댓값과 최솟값이고;
    (7.2) 중 각 항목의 적응값을 계산하고;

    여기에서 는 정규화 함수이고;
    (8) 중 적응값이 최대인 앞 개 항목을 검색 결과로 선택하는 것을 특징으로 하는 제한적 볼츠만 머신 구동 기반의 인터랙티브 맞춤형 검색 방법.
  2. 제1항에 있어서,
    사용자 선호도 특성 추출 모델은 제1 가시층, 제2 가시층, 은닉층을 포함하고; 상기 제1 가시층에는 개 가시 유닛이 있고, 각 가시 유닛은 바이너리 변수이고; 제2 가시층은 개 가시 유닛이 있고, 각 가시 유닛은 실수이고; 상기 은닉층은 m개 은닉 유닛이 있고, 각 은닉 유닛은 실수이고; 상기 사용자 선호도 특성 추출 모델의 파라미터는 이고, 여기에서 w1, w2는 각각 제1 가시층 중 가시 유닛과 은닉층 중 은닉 유닛, 제2 가시층 중 가시 유닛과 은닉층 중 은닉 유닛 사이의 연결 가중치를 나타내고; a1, a2는 각각 제1 가시층 중 가시 유닛, 제2 가시층 중 가시 유닛의 오프셋이고; b는 은닉층 중 은닉 유닛의 오프셋이고;
    샘플 세트 중 각 샘플의 를 사용자 선호도 특성 추출 모델의 제1 가시층과 제2 가시층에 입력하고, 대조적 발산(Contrastive Divergence) 학습 알고리즘을 채택해 상기 모델을 학습시키고, 모델 파라미터 를 최적화하여, 학습된 사용자 선호도 특성 추출 모델을 획득하는 것을 특징으로 하는 인터랙티브 맞춤형 검색 방법.
  3. 제2항에 있어서,
    사용자 선호도 확률 모델을 구축하고;

    여기에서, 는 사용자 가 선호하는 항목이 제류 태그 항목의 확률이 있음을 나타내는 것을 특징으로 하는 인터랙티브 맞춤형 검색 방법.
  4. 제3항에 있어서,
    의 계산 단계는 하기와 같고,
    (4.1) 사용자가 선호하는 제류 태그 항목을 가진 절대 확률을 예측하고;

    여기에서, 은 항목 의 제개 카테고리 태그 의 주변 분포( marginal distribution)이고, 는 항목 의 제개 카테고리 태그 의 주변 분포이고, 중 모든 샘플의 평균 주변 분포이고;
    ,
    ,
    ,
    여기에서 는 벡터 의 제개 원소이고, 는 제개 샘플 중 항목의 카테고리 태그 벡터 의 제개 은닉 유닛에서의 에너지값이며, 그 계산식은 하기와 같고,

    (4.2) 사용자 선호도에 제류 태그 항목이 있는 절대 확률에 대해 정규화를 수행하고,

    획득한 는 사용자 의 사용자 선호도 확률 모델인 것을 특징으로 하는 인터랙티브 맞춤형 검색 방법.
  5. 제2항에 있어서,
    사용자 의 항목 에 대한 평가 에너지 함수이며, 그 계산식은 하기와 같고;

    여기에서 는 x 카테고리 태그 벡터 중 제개 원소이고; 는 사용자 의 x에 대한 평가 텍스트 벡터화의 제개 원소이고; 는 사용자 선호도 특성 추출 모델 중 제1 가시층 중 가시 유닛의 오프셋 의 제개 원소이고; 는 사용자 선호도 특성 추출 모델 중 제2 가시층 중 가시 유닛의 오프셋 의 제개 원소이고; 은 사용자 선호도 특성 추출 모델 중 은닉층 중 은닉 유닛의 오프셋 b의 제개 원소이고; 은 제1 가시층 중 제개 가시 유닛과 은닉층 중 제개 은닉 유닛 간의 연결 가중치이고; 은 제2 가시층 중 제개 가시 유닛과 은닉층 중 제개 은닉 유닛 간의 연결 가중치인 것을 특징으로 하는 인터랙티브 맞춤형 검색 방법.
  6. 제1항에 있어서,
    상기 단계 (5)에서 신규 항목의 카테고리 태그 벡터 의 설정 단계는 하기와 같고,
    (5.1) n=1로 하고;
    (5.2) 사이의 난수 z를 생성하고; 만약 이며, 제n개 신규 항목의 카테고리 태그 벡터 의 제개 원소는 1이며, 그렇지 않으면 0이고;
    (5.3) n에 1을 더하고, 이 될 때까지 단계 (5.2)를 반복하는 것을 특징으로 하는 인터랙티브 맞춤형 검색 방법.
  7. 제1항에 있어서,
    상기 단계 (7.2) 중 각 항목의 적응값은 사용자의 군체 평가가 포함되며, 구체적인 계산 단계는 하기와 같고,
    (7.2.1) 모든 사용자 중에서 사용자 와 유사도가 가장 높은 앞 개 사용자를 선택하여, 사용자 의 이웃 사용자 세트 를 구성하며, 중 항목 에 대한 가중치 평균 평점을 계산하고,

    여기에서 중의 사용자 중 항목 에 대한 평점이고; 만약 사용자 가 항목 에 대해 평점이 없으면 =0이고;
    (7.2.2) 중 항목 의 적응값은 하기와 같고,

    여기에서 는 개인 예측 평점에 대한 사회적 지식의 기여도를 조정하는 데 사용되는 계수인 것을 특징으로 하는 인터랙티브 맞춤형 검색 방법.
  8. 제2항에 있어서,
    상기 은닉층 중 은닉 유닛 개수 m은 카테고리 총 수 의 0.8 내지 1.2배인 것을 특징으로 하는 인터랙티브 맞춤형 검색 방법.
  9. 제1항에 있어서,
    사용자 와 공동 평점 항목이 존재하는 사용자 , , 의 유사도 계산식은 하기와 같고,

    여기에서 는 사용자 가 모두 평가한 항목 세트를 나타내고; 는 사용자 중 항목 에 대한 평점이고, 는 사용자 에 대한 평점이고; 는 사용자 의 이미 에 의해 평가된 모든 항목의 평균 평점이고; 는 사용자 의 이미 에 의해 평가된 모든 항목의 평균 평점인 것을 특징으로 하는 인터랙티브 맞춤형 검색 방법.
KR1020217011962A 2020-03-25 2020-04-22 제한적 볼츠만 머신 구동 기반의 인터랙티브 맞춤형 검색 방법 KR102600697B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202010216557.4A CN111339428B (zh) 2020-03-25 2020-03-25 基于受限玻尔兹曼机驱动的交互式个性化搜索方法
CN202010216557.4 2020-03-25
PCT/CN2020/086202 WO2021189583A1 (zh) 2020-03-25 2020-04-22 基于受限玻尔兹曼机驱动的交互式个性化搜索方法

Publications (2)

Publication Number Publication Date
KR20210120977A KR20210120977A (ko) 2021-10-07
KR102600697B1 true KR102600697B1 (ko) 2023-11-10

Family

ID=71186157

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217011962A KR102600697B1 (ko) 2020-03-25 2020-04-22 제한적 볼츠만 머신 구동 기반의 인터랙티브 맞춤형 검색 방법

Country Status (3)

Country Link
KR (1) KR102600697B1 (ko)
CN (1) CN111339428B (ko)
WO (1) WO2021189583A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113127737B (zh) * 2021-04-14 2021-09-14 江苏科技大学 融合注意力机制的个性化搜索方法和搜索系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160188726A1 (en) 2014-12-31 2016-06-30 TCL Research America Inc. Scalable user intent mining using a multimodal restricted boltzmann machine
CN106777359A (zh) 2017-01-18 2017-05-31 安徽农业大学 一种基于受限玻尔兹曼机的文本业务推荐方法
CN110162706A (zh) 2019-05-22 2019-08-23 南京邮电大学 一种基于交互数据聚类的个性化推荐方法及系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324690A (zh) * 2013-06-03 2013-09-25 焦点科技股份有限公司 基于因子化条件受限玻尔兹曼机的混合推荐方法
CN105302873A (zh) * 2015-10-08 2016-02-03 北京航空航天大学 一种基于条件受限波尔兹曼机的协同过滤优化方法
CN105574216A (zh) * 2016-03-07 2016-05-11 达而观信息科技(上海)有限公司 基于概率模型和用户行为分析的个性化推荐方法、系统
CN106202519A (zh) * 2016-07-22 2016-12-07 桂林电子科技大学 一种结合用户评论内容和评分的项目推荐方法
CN106951434B (zh) * 2017-02-06 2020-03-10 广东神马搜索科技有限公司 一种用于搜索引擎的搜索方法、装置及可编程设备
CN107133321B (zh) * 2017-05-04 2020-06-12 广东神马搜索科技有限公司 页面的搜索特性的分析方法和分析装置
CN107944049A (zh) * 2017-12-19 2018-04-20 北京工业大学 一种基于深度学习的电影推荐方法
CN108256093B (zh) * 2018-01-29 2020-06-19 华南理工大学 一种基于用户多兴趣及兴趣变化的协同过滤推荐算法
US11050656B2 (en) * 2018-05-10 2021-06-29 Dell Products L.P. System and method to learn and prescribe network path for SDN
CN109147807B (zh) * 2018-06-05 2023-06-23 安克创新科技股份有限公司 一种基于深度学习的音域平衡方法、装置及系统
CN108846479A (zh) * 2018-07-13 2018-11-20 河海大学 基于rbm模型的推荐方法、rbm模型的训练方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160188726A1 (en) 2014-12-31 2016-06-30 TCL Research America Inc. Scalable user intent mining using a multimodal restricted boltzmann machine
CN106777359A (zh) 2017-01-18 2017-05-31 安徽农业大学 一种基于受限玻尔兹曼机的文本业务推荐方法
CN110162706A (zh) 2019-05-22 2019-08-23 南京邮电大学 一种基于交互数据聚类的个性化推荐方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Restricted Boltzmann Machine-Assisted Estimation of Distribution Algorithm for Complex Problems", Complexity Vol. no. 2018, November 2018.

Also Published As

Publication number Publication date
CN111339428A (zh) 2020-06-26
CN111339428B (zh) 2021-02-26
WO2021189583A1 (zh) 2021-09-30
KR20210120977A (ko) 2021-10-07

Similar Documents

Publication Publication Date Title
CN108959603B (zh) 基于深度神经网络的个性化推荐系统及方法
CN110046304B (zh) 一种用户推荐方法和装置
CN110969516B (zh) 一种商品推荐方法及装置
CN112214685B (zh) 一种基于知识图谱的个性化推荐方法
CN110263265B (zh) 用户标签生成方法、装置、存储介质和计算机设备
CN110717098B (zh) 基于元路径的上下文感知用户建模方法、序列推荐方法
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN109785062B (zh) 一种基于协同过滤模型的混合神经网络推荐系统
Abdollahi et al. Explainable restricted boltzmann machines for collaborative filtering
CN105893609B (zh) 一种基于加权混合的移动app推荐方法
CN107357793B (zh) 信息推荐方法和装置
CN112115377B (zh) 一种基于社交关系的图神经网络链路预测推荐方法
CN112991017A (zh) 基于用户评论解析的标签体系精准推荐方法
Li et al. Content-based filtering recommendation algorithm using HMM
CN110321473B (zh) 基于多模态注意力的多样性偏好信息推送方法、系统、介质及设备
CN112256965A (zh) 一种基于lambdaMart的神经协同过滤模型推荐方法
Babu et al. An implementation of the user-based collaborative filtering algorithm
CN110083766B (zh) 一种基于元路径引导嵌入的查询推荐方法及装置
CN117216281A (zh) 一种基于知识图谱的用户兴趣扩散推荐方法及系统
Hassan et al. Performance analysis of neural networks-based multi-criteria recommender systems
KR102600697B1 (ko) 제한적 볼츠만 머신 구동 기반의 인터랙티브 맞춤형 검색 방법
CN108491477B (zh) 基于多维云和用户动态兴趣的神经网络推荐方法
CN110085292A (zh) 药品推荐方法、装置及计算机可读存储介质
Jalal Big data and intelligent software systems
Eyjolfsdottir et al. Moviegen: A movie recommendation system

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant