KR20180091043A

KR20180091043A - 사용자 포트레이트를 획득하는 방법 및 장치

Info

Publication number: KR20180091043A
Application number: KR1020187019164A
Authority: KR
Inventors: 멍핑 루
Original assignee: 텐센트 테크놀로지(센젠) 컴퍼니 리미티드
Priority date: 2016-04-29
Filing date: 2017-04-25
Publication date: 2018-08-14
Also published as: JP2019503006A; US20180316776A1; WO2017186106A1; CN110378731A; CN110378731B; US11394798B2; CN107341679A; KR102122373B1; JP6615362B2

Abstract

사용자 포트레이트를 획득하는 방법과 장치로서 정보 처리 기술분야에 속한다. 상기 방법은, 사용자 행위 로그들에 따라 상기 M개의 트레이닝 샘플들을 얻는 것(101), 여기서, 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하는데 이용하며 상기M은 양의 정수이고, M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 W_m _×k와 태그 파라메터 행렬 H_k _×n을 수정하여 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n을 얻는 것(102), 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n에 따라 사용자 포트레이트 행렬 P_m _×n을 얻는 것(103)을 포함한다. 사용자와 태그를 파라메터화하고, 데이터 피팅 모델을 이용하여 사용자 파라메터 행렬과 태그 파라메터 행렬을 수정하여 그것으로 트레이닝 샘플들을 피팅하므로서 태그에 상응한 태그 무게를 수동적으로 설정할 필요가 없고, 사용자의 행위 로그에 따라 데이터 피팅 방법을 이용하여 사용자 포트레이트를 자동적으로 획득하므로서 시간과 인력 원가를 절약하면서도 사용자 포트레이트를 정확하고 유효하게 얻는 기술 효과를 달성하였다.

Description

사용자 포트레이트를 획득하는 방법 및 장치

본 출원은 2016년 4월29일 중국특허국에 제출된 출원번호가 201610284124.6이고 발명명칭이 "사용자 포트레이트를 획득하는 방법 및 장치"인 중국특허출원의 우선권을 요구하며, 그의 전부 내용은 인용의 방식으로 본 출원에 결합된다.

본 발명의 실시예는 정보 처리 기술분야에 관한 것으로, 특히 사용자 포트레이트를 획득하는 방법 및 장치에 관한 것이다.

사용자 각색(Persona)이라고도 하는 사용자 포트레이트는 타겟 사용자를 묘사하고 사용자의 요구와 설계 방향을 연계시켜 주는 유효한 도구로서 여러 분야에서 광범히 응용되고 있다. 구체적인 실현 시 사용자 포트레이트는 사용자의 특징을 묘사하는 태그(tag) 세트으로 표시할 수 있는데 이 태그 세트은 사용자의 사회 속성, 생활 습관, 소비 행위 등의 각도에서 사용자의 특징을 묘사하는 태그들을 포함할 수 있다. 예를 들어, 연령과 성별, 지역, 학력과 사용자의 기호 등의 태그들이다.

종래 기술에서 사용자 포트레이트를 획득하는 방법을 제공하였다. 사전에 여러개의 태그들을 설정하고 매 태그에 상응한 태그 무게를 수동적으로 설정하는데, 여기서 태그 무게는 실제 응용의 요구나 경험에 따라 사전에 설정할 수 있다. 매 태그에 대하여 전체 물품들 중에서 이 태그를 구비한 물품들이 차지하는 점유율에 따라 이 태그에 대응하는 태그 무게를 설정할 수 있다. 일반적으로 상기 점유율과 태그 무게 사이에는 부의 상관 관계가 존재하는데 상기 점유율이 커지면 태그 무게는 작아지고 상기 점유율이 작아지면 태그 무게는 커진다. 다음 사용자 행위 로그들을 얻는다. 사용자의 행위 로그들에는 사용자가 매 물품에 대하여 실행한 각종 행위들이 기록되어 있는데, 예를 들면 사용자 1이 물품 1을 열람하였다는 것, 사용자 2가 물품 1을 구매했다는 것, 사용자 1이 물품 2를 구매하였다는 것 등이다. 그다음 매 물품이 구비한 태그와, 사용자가 매 물품에 대하여 실행한 행위에 따라 매 태그에 대한 사용자의 행위 무게를 확정한다. 끝으로 매 태그에 대응되는 태그 무게와 행위 무게에 따라 이 태그에 대한 사용자의 선호 정도를 계산하고 매 태그에 대한 사용자의 선호 정도를 정합하여 사용자의 포트레이트를 얻어낸다. 예를 들면, 어느 한 태그에 대한 사용자의 선호 정도는 이 태그의 대응하는 태그 무게와 행위 무게의 적으로 표시할 수 있다.

그러나 종래 기술들에서는 매 태그에 대하여 상응한 태그 무게들을 수동적으로 설정해야 하고 또한 태그의 수량이 항상 비교적 많은 것으로 하여 대량의 시간과 인력 자원을 소비하는 것이 필요하며, 사용자의 포트레이트를 얻는데 낭비되는 시간과 인력 원가가 비교적 높다. 또한 태그 무게의 수동 설정 방식에서는 오차를 피하기 어려운 것으로 하여 수동 설정된 태그 무게와 실제 업무가 부합된다는 것을 보증하기 힘들고 최종적으로 획득한 사용자의 포트레이트의 정확도가 비교적 낮은 결과가 초래되었다.

종래 기술에서 제공한 사용자 포트레이트 획득 방법들에서 낭비되는 시간과 인력 원가가 비교적 높고 획득한 사용자 포트레이트의 정확도가 비교적 낮은 문제를 해결하는 것이다. 본 발명의 실시예는 사용자 포트레이트를 획득하는 방법 및 장치를 제공하였는데, 상기 기술방안은 하기와 같다.

본 발명의 실시예의 첫째 측면에 따르면, 사용자 포트레이트 획득 방법을 제공하였는데, 상기 방법은,

사용자 행위 로그들에 따라 상기 M개의 트레이닝 샘플들을 얻는 것, 여기서, 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하는데 이용하며 상기M은 양의 정수이고,

상기 M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 W_m _×k와 초기화된 태그 파라메터 행렬 H_k _×n을 수정하여 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n을 얻는 것, 여기서,상기 m은 사용자의 수를 표시하고,상기 k는 인자의 수를 표시하고, 상기n은 태그의 수를 표시하고, 상기 m은 양의 정수이고, 성기 k는 양의 정수이고, 상기 n은 1보다 큰 정수이고,

상기 최종 사용자 파라메터 행렬 W_m _×k와 상기 최종 태그 파라메터 행렬 H_k _×n에 따라 상기 사용자 포트레이트 행렬 P_m _×n을 얻는 것을 포함하며, 여기서 상기 사용자 포트레이트 행렬 P_m _×n의 제u행제t렬의 원소 P_ut는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 상기u는 1≤u≤m인 정수이고, 상기 t는 1≤t≤n인 정수이다.

본 발명의 실시예의 둘째 측면에 따르면, 사용자 포트레이트 획득 장치를 제공하였는데, 상기 장치는,

사용자 행위 로그들에 따라 상기 M개의 트레이닝 샘플들을 얻는데 이용되는 샘플 획득 모듈과, 여기서, 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하는데 이용하며 성기 M은 양의 정수이고,

상기 M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 W_m _×k와 초기화된 태그 파라메터 행렬 H_k _×n을 수정하여 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n을 얻는데 이용되는 행렬 수정 모듈과, 여기서,상기 m은 사용자의 수를 표시하고, 상기 k는 인자의 수를 표시하고,상기 n은 태그의 수를 표시하고, m은 양의 정수이고,상기 k는 양의 정수이고,상기 n은 1보다 큰 정수이고,

상기 최종 사용자 파라메터 행렬 W_m _×k와 상기 최종 태그 파라메터 행렬 H_k _×n에 따라 사용자 포트레이트 행렬 P_m _×n을 얻는데 이용되는 포트레이트 획득 모듈을 포함하고, 여기서, 상기 사용자 포트레이트 행렬 P_m _×n의 제u행제t렬의 원소 P_ut는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 상기 u는 1≤u≤m인 정수이고, 상기 t는 1≤t≤n인 정수이다.

본 발명의 실시예의 셋째 측면에 따르면, 사용자 포트레이트를 획득하는 장치를 제공하였는데, 상기 장치는,

한개 혹은 여러개의 프로세서와,

상기 한개 혹은 여러개의 프로세서들과 상호 연결된 메모리를 포함하며, 상기 메모리에는 상기 한개 또는 여러개의 프로세서들에서 실행하도록 구성된 한개 혹은 여러개의 프로그램들이 기억되어 있고 상기 한개 혹은 여러개의 프로그램에는,

사용자의 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻는 조작과, 여기서, 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하는데 이용하며 상기M은 양의 정수이고,

상기 M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 W_m _×k와 초기화된 태그 파라메터 행렬 H_k _×n을 수정하여 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n을 얻는 조작, 여기서,상기 m은 사용자의 수를 표시하고,상기 k는 인자의 수를 표시하고, 상기n은 태그의 수를 표시하고, 상기 m은 양의 정수이고, 성기 k는 양의 정수이고, 상기 n은 1보다 큰 정수이고,

상기 최종 사용자 파라메터 행렬 W_m _×k와 상기 최종 태그 파라메터 행렬 H_k _×n에 따라 사용자 포트레이트 행렬 P_m _×n을 얻는 조작을 진행하는데 이용되는 지령들이 포함되어 있으며, 여기서 상기 사용자 포트레이트 행렬 P_m _×n의 제u행제t렬의 원소 P_ut는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 상기 u는 1≤u≤m인 정수이고, 상기 t는 1≤t≤n인 정수이다.

본 발명의 실시예가 제공하는 기술방안이 가져다 준 유익한 효과는,

사용자의 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻고, 상기 M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 W_m _×k와 태그 파라메터 행렬 H_k _×n을 수정하여 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n을 얻은 다음, 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n에 따라 사용자 포트레이트 행렬 P_m _×n을 얻는 것을 통하여, 종래 기술이 제공한 사용자 포트레이트 획득 방법들에서 시간과 비용이 낭비되는 문제와 획득한 사용자 포트레이트의 정확도가 비교적 낮은 문제들을 해결하였으며, 사용자와 태그를 파라메터화하고, 데이터 피팅 모델을 이용하여 사용자 파라메터 행렬과 태그 파라메터 행렬을 수정하여 그것으로 트레이닝 샘플들을 피팅하므로서 태그에 상응한 태그 무게를 수동적으로 설정할 필요가 없고, 사용자의 행위 로그에 따라 데이터 피팅 방법을 이용하여 사용자 포트레이트를 자동적으로 획득하므로서 시간과 인력 원가를 절약하면서도 사용자 포트레이트를 정확하고 유효하게 얻는 효과를 달성한 것을 포함한다.

본 발명의 실시예의 기술방안을 보다 정확하게 설명하기 위하여 이하 실시예의 서술에서 사용해야 할 도면들에 대하여 간단히 소개하는데, 분명히 할 것은 이하 서술 중의 도면은 단지 본 발명의 실시예들이며, 이 기술분야에서 당업자라면 창조성 노동을 들이지 않는 전제하에서 이 도면들에 따라 기타 도면을 획득할 수도 있다는 것이다.
도 1은 본 발명의 일 실시예가 제공하는 사용자 포트레이트 획득 방법의 흐름도이다.
도 2는 본 발명의 다른 일 실시예가 제공하는 사용자 포트레이트 획득 방법의 흐름도이다.
도 3은 도 2에서 보여준 실시예의 201 단계의 서브단계의 흐름도이다.
도4는 본 발명의 실시예가 제공하는 사용자 유사도 행렬을 생성하는 흐름도이다.
도 5는 본 발명의 일 실시예가 제공하는 사용자 포트레이트 획득 장치의 구조 골격도이다.
도 6은 본 발명의 다른 일 실시예가 제공하는 사용자 포트레이트 획득 장치의 구조 골격도이다.
도7은 본 발명의 일 실시예가 제공하는 서버의 구조 개략도이다.

본 발명의 목적, 기술방안과 우점들을 보다 명확히 하기 위하여, 본 발명의 실시 방식에 대하여 도면을 결합하여 이하 보다 상세히 설명하도록 한다.

이해를 도모하기 위하여, 우선 본문 중의 관련 있는 일부 명사들에 대하여 소개하고 설명한다.

물품

물품은 실체 물품과 가상 물품을 포함한다. 실체 물품은 실지 존재하는 물품을 가리키는 것으로서 사무, 생활 소비와 관련되는 물건, 예를 들어 의복, 음식물, 사무용품 등이며, 가상 물품은 현실 생활에서 만질 수 없는 물품들로서 각종 비디오, 오디오, 이미지, 응용 소프트웨어, 웨이 보와 같은 인터넷 제품이나 내용, 혹은 가상 네트워크 세계에서 유래되는 제품, 유희 도구, 회원, 아이콘 등이다.

태그

태그는 물품의 속성을 서술하는데 이용되는 키워드이다. 예를 들어, 의복의 태그에는 색갈로부터 모양, 크기 등의 측면을 서술하는 키워드가 포함될 수 있으며, 비디오의 태그에는 년도로부터 국가, 유형, 배우 등의 측면을 서술하는 키워드가 포함될 수 있으며, 유희 도구의 태그에는 분류로부터 기능 등의 측면을 서술하는 키워드가 포함될 수 있다.

사용자의 행위 유형

사용자의 행위 유형은 물품에 대하여 사용자가 실행하는 행위를 가리킨다. 예를 들어, 열람, 쇼핑, 수집, 삭제, 사용, 중계, 좋아하기, 깎아내림, 논평등이다. 서로 다른 물품들을 비추어 볼 때 사용자가 이 물품들에 대하여 실행할 수 있는 행위는 서로 같을 수도 있고 다를 수도 있다. 예를 들어 의복에 대하여 볼 때 이 물품에 대하여 사용자가 실행할 수 있는 행위에는 열람, 쇼핑, 수집 등이 포함될 수 있고, 비디오에 대하여 예를 들면 이 물품에 대하여 사용자가 실행할 수 있는 행위에는 열람, 프리뷰, 관람, 쇼핑, 수집 등이 포함될 수 있으며, 웨이 보에 대하여 예를 들면 이 물품에 대하여 사용자가 실행할 수 있는 행위에는 열람, 중계, 수집 등이 포함될 수 있다. 사용자의 행위 유형에는 또한 "미지" 유형도 선택적으로 포함될 수 있는데 이것은 물품에 대하여 사용자가 어떠한 행위들을 실행하지 않는 것을 표시하는데 이용된다. 물품에 대한 사용자의 행위 유형은 물품에 대한 사용자의 선호 정도를 반영하는데 2개의 물품에 대한 사용자의 행위 유형에 따라 이 2개의 물품에 대한 사용자의 선호 정도의 차이를 확정하면 된다.

본 발명의 실시예에 대한 상세한 해설에 앞서 먼저 본 발명의 실시예의 응용 상황에 대하여 소개한다. 사용자 포트레이트는 사용자의 특징을 묘사하는 태그 세트으로 표시할 수 있고 이 태그 세트은 사용자의 사회 속성, 생활 습관, 소비 행위 등의 각도에서 사용자의 특징을 묘사하는 태그들을 포함할 수 있으므로 이로 하여 사용자 포트레이트는 사용자의 특징을 가리키는데 이용할 수 있다. 사용자의 특징을 통하여 사용자의 기호와 습관 등을 확정할 수 있으므로 사용자의 포트레이트를 얻은 후 사용자의 포트레이트를 여러가지 응용 상황에 응용할 수 있다.

예를 들어, 한가지 응용 상황에서는 사용자 포트레이트에 따라 사용자의 기호를 확정하여 사용자에게 어떤 물품, 예를 들어, 의복, 식품, 전자 제품 등을 추천할 수 있다. 이런 방법으로 서로 다른 사용자에게 서로 다른 물품들을 추천할 수 있어 추천의 개성화를 실현하여 물품 추천의 정확도를 제고한다. 또 다른 한가지 응용 상황에서는 사용자 포트레이트에 따라 전자 제품 등에 대한 사용자의 사용 습관을 확정하고, 가령 사용자가 매번 얼마만 한 시간마다 전자 제품에 대한 안전성 체크를진행하는가, 또는 웹 페이지를 열람한 후 열람 흔적에 대한 청소를 진행하는 등을 확정하여 사용자의 사용 습관에 따라 이런 조작을 자동적으로 진행하므로서 사용자의 수동 조작을 없애여 사용자 점성을 제고한다.

물론 실제 응용에서 사용자 포트레이트는 기타 상황에서도 응용할 수 있는데 본 발명의 실시예는 상기 두가지 응용 상황들을 예를 들어 설명하였으며, 여기서 기타 상황들에 대하여 일일이 더 열거하지 않는다.

본 발명의 실시예가 제공한 방법에서 매 단계의 실행 주체는 서버와 같이 데이터 기억과 계산 기능이 구비된 전자 설비일 수 있다. 이하 서술하는 방법의 실시예에서는 매 단계의 실행 주체가 서버인 경우를 예를 들어 설명하였지만 이에 대해 제한하지 않는다.

도 1에서는 본 발명의 일 실시예가 제공하는 사용자 포트레이트 획득 방법의 흐름도를 도시하였다. 이 방법은 이하 몇개의 단계들을 포함할 수 있다.

사용자 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻고, 여기서 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하며 M은 양의 정수인 101 단계.

M개의 트레이닝 샘플들에 따라 데이터 피팅(fitting) 모델을 이용하여 초기화된 사용자 파라메터 행렬 W_m _×k와 초기화된 태그 파라메터 행렬 H_k _×n을 수정하여 최종 사용자 파라메터 행렬 W_m×k와 최종 태그 파라메터 행렬 H_k×n을 얻는102 단계.

여기서 m은 사용자의 수를 표시하는 양의 정수이고, k는 인자의 수를 표시하는 양의 정수이고, n은 태그의 수를 표시하는 1보다 큰 정수이다.

최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n에 따라 사용자 포트레이트 행렬 P_m _×n을 얻는 103단계.

여기서 사용자 포트레이트 행렬 P_m _×n의 u행t렬의 원소 P_ut는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 u와 t는 1≤u≤m, 1≤t≤n인 정수들이다.

요약하면, 본 실시예가 제공하는 방법에서는 사용자 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻고, 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 W_m _×k와 태그 파라메터 행렬 H_k _×n을 수정하여 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n을 얻은 다음, 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n에 따라 사용자 포트레이트 행렬 P_m _×n을 얻는 것을 통하여, 종래 기술이 제공한 사용자 포트레이트 획득 방법들에서 제기되는 낭비되는 시간과 인력 원가가 비교적 높은 문제와 획득한 사용자 포트레이트의 정확도가 비교적 낮은 문제를 해결하였으며, 사용자와 태그를 파라메터화하고, 데이터 피팅 모델을 이용하여 사용자 파라메터 행렬과 태그 파라메터 행렬을 수정하여 그것으로 트레이닝 샘플들을 피팅하므로서 태그에 상응한 태그 무게를 수동적으로 설정할 필요가 없고, 사용자의 행위 로그에 따라 데이터 피팅 방법을 이용하여 사용자 포트레이트를 자동적으로 획득하므로서 시간과 인력 원가를 절약하면서도 사용자 포트레이트를 정확하고 유효하게 얻는 기술 효과를 달성하였다.

도 2에서는 본 발명의 다른 일 실시예가 제공한 사용자 포트레이트 획득 방법의 흐름도를 도시하였다. 본 실시예에서는 매 단계의 실행 주체가 서버인 경우를 예를 들어 설명한다. 이 방법은 이하 몇개의 단계들을 포함할 수 있다.

사용자 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻는 201 단계.

트레이닝 샘플은 <u, i, j>에 의해 표시하고 트레이닝 샘플<u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하며 M은 양의 정수이다.

사용자 행위 로그는 사용자의 물품에 대한 조작 행위를 기록하는데 이용된다. 사용자 행위 로그에는 사용자 표식과 사용자의 행위 유형, 물품 표식과 물품 태그 정보들이 포함된다. 여기서 사용자 표식은 사용자 신분을 식별하는데 이용되는 표식 번호로서, 사용자 계정 번호라고도 부르며 어떤 시스템에서 상대적으로 유일한 코드이다. 사용자의 행위 유형은 사용자가 물품에 대하여 실행하는 행위들을 가리키는데 예하면 열람, 쇼핑, 수집, 삭제, 사용, 중계, 좋아하기, 깎아내림, 논평, 미지 등을 들 수 있다. 사용자의 행위 유형의 종류는 실제 응용의 요구에 따라 설정할 수 있다. 물품 표식은 사용자 표식과 유사한데 물품의 표식 번호를 식별하는데 이용된다. 매 물품에는 대응되는 유일한 물품 표식이 존재한다. 물품 태그 정보는 물품의 속성에 대한 키워드를 가리키는데 이용되며 한개 물품은 한개 또는 여러개의 태그를 포함할 수 있다. 사용자 행위 로그들을 얻는 방식에는 서버가 단말에서의 사용자의 조작 행위들을 수집하거나 단말에서 서버에 사용자의 조작 행위들을 보고하는 방식들이 있다.

트레이닝 샘플 <u, i, j>는 사용자 u의 물품 i와 물품 j에 대한 선호 정도의 차이를 반영한다. 가능한 실시방식에서는 트레이닝 샘플 <u, i, j>를 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 크다는 것을 반영하는데 이용하며, 다른 가능한 실시방식에서는 트레이닝 샘플 <u, i, j>를 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 작다는 것을 반영하는데 이용된다. 물품에 대한 사용자의 행위 유형은 물품에 대한 사용자의 선호 정도를 반영하며 두가지 물품에 대한 사용자의 행위 유형에 따라 이 두가지 물품에 대한 사용자의 선호 정도의 차이를 확정하면 된다.

사용자의 지불 비용에 따라 행위 유형의 무게에 대한 기준을 결정할 수 있으며 행위 유형의 무게에 따라 전체 행위 유형들 사이의 상대적 크기 관계를 확정할 수 있다. 예를 들면, "구매" 행위 유형의 무게는 "열람" 행위 유형의 무게보다 크다. 만일 사용자가 물품에 대하여 아직 어떠한 행위를 실행하지 않는다면 사용자의 행위 유형은 "미지" 유형으로 된다. 일반적으로 말한다면 사용자가 모종의 행위를 실행한 물품에 대한 사용자의 선호 정도는 어떠한 행위도 실행하지 않은 물품에 대한 선호 정도보다 크며, 따라서 "미지" 행위 유형의 무게는 최소로서 "열람", "구매" 행위 유형의 무게보다 작다. 예를 들면, 사용자 u가 물품 i에 대하여 모종의 행위를 실행하고 물품 j에 대하여 그 어떤 행위도 실행하지 않았다면 물품 i에 대한 사용자 u의 선호 정도는 물품 j에 대한 선호 정도보다 크다.

예하면 트레이닝 샘플 <u, i, j>는 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 크다는 것을 반영하는데 이용되는 경우 만일 사용자 u가 물품 i를 좋아하는 정도가 물품 j를 좋아하는 정도보다 크다면 얻어진 트레이닝 샘플은 <u, i, j>이며 이와 반대인 경우에 얻어지는 트레이닝 샘플은 <u, j, i>이다. 예를 들면 사용자 u가 물품 i를 구매하고 물품 j를 열람하였다면 획득한 트레이닝 샘플은 <u, i, j>이며, 사용자 u가 물품 i를 열람하고 물품 j를 구매하였다면 획득한 트레이닝 샘플은 <u, j, i>이다. 또한 사용자가 물품 i를 열람하고 물품 j에 대하여 그 어떤 행위도 실행하지 않았다면 획득한 트레이닝 샘플은 <u, i, j>이다. 한명의 사용자에 대하여 한개 혹은 여러개의 트레이닝 샘플들을 획득할 수 있으며 만일 사용자 1이 물품 2를 열람하고 물품 1, 물품 3과 물품 4에 대하여 그 어떤 행위도 실행하지 않았다면 얻어진 트레이닝 샘플들에는 <1, 2, 1>, <1, 2, 3>, <1, 2, 4>가 포함된다.

가능한 실시방식에서는, 도 3에 도시한 바와 같이 201단계는 이하 여러개의 서브단계들을 포함할 수 있다.

사용자 행위 로그들에 따라 m명의 사용자들 중의 매 사용자의 h개의 물품들 중의 매 물품에 대한 행위 유형을 얻는 201a 단계.

여기서 m은 사용자의 수를 나타내는 양의 정수이고, h는 물품의 수를 나타내는 1보다 큰 정수이다.

매 사용자의 매 물품에 대한 행위 유형에 따라 M개의 트레이닝 샘플들을 얻는 201b 단계.

가능한 실시방식으로서, 201b 단계는 이하의 것을 포함할 수 있다.

1. 사용자의 행위 유형에 따라 사용자 물품 행렬을 얻는 것.

선택적으로, 사용자 물품 행렬을 R_m _×h으로 표시하고 사용자 물품 행렬 R_m _×h의 행은 사용자를, 렬은 물품을 표시하면 m은 사용자의 수를, h는 물품의 수를, 원소 R_ui는 사용자 u가 물품 i에 대하여 모종의 행위를 실행하였는가를 가리킨다. 예를 들어 사용자 물품 행렬 R_m _×h의 원소들을 0이나 1로 표시하면 1은 사용자가 물품에 대하여 모종의 행위를 실행하였음을 가리키며, 0은 사용자가 물품에 대하여 그 어떤 행위도 실행하지 않았음을 가리킨다. 예를 들어 사용자의 수가 3이고 물품의 수가 4일 때 사용자 물품 행렬 R_m _×h은

이며, 여기서 1행2렬의 1은 사용자 1이 물품 2에 대하여 모종의 행위를 실행하였음을 보여준다.

2. 사용자의 행위 유형과 사용자 물품 행렬에 따라 M개의 트레이닝 샘플들을 얻는 것.

사용자 물품 행렬에 따라 사용자가 물품에 대하여 모종의 행위를 실행하였는가를 알수 있고 사용자 u에 대하여 행위 유형에 따라 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 큰가하는 것을 확정할 수 있으므로 한개의 트레이닝 샘플을 얻는다. 예를 들어 사용자 물품 행렬 R_3×4의 1행으로부터 사용자 1이 물품 2에 대하여 모종의 행위를 실행하였다는 것과 사용자 1이 물품 1, 물품 3과 물품 4에 대하여 그 어떤 행위도 실행하지 않았다는 것을 알고 있으므로 트레이닝 샘플 <u, i, j>을 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 크다는 것을 반영하는데 이용되는 예에서는 얻어진 사용자 1의 트레이닝 샘플에 <1, 2, 1>, <1, 2, 3>, <1, 2, 4>들이 포함된다.

설명할 필요가 있는 것은, 일반적인 정황하에서 사용자가 모종의 행위를 실행한 물품에 대한 사용자의 선호 정도가 그 어떤 행위도 실행하지 않은 물품에 대한 선호 정도보다 크다는 것이다. 그러나 기타 가능한 정황하에서는 사용자가 모종의 행위를 실행한 물품에 대한 사용자의 선호 정도가 그 어떤 행위도 실행하지 않은 물품에 대한 선호 정도보다 작을 수도 있다. 물품이 비디오인 경우의 예에서 비디오 A에 대하여 사용자가 깎아내림 행위를, 비디오 B에 대하여서는 그 어떤 행위도 실행하지 않았다면 비디오 A에 대한 사용자의 선호 정도가 비디오 B에 대한 선호 정도보다 작다고 인식한다.

이외에 사용자의 수가 m이고, 물품의 수가 h이므로 리론상

개의 샘플들을 만들 수 있으며 실제 조작 시 샘플링 방식을 이용하여 상기

개의 샘플들 중에서 비교적 믿음성있는 일부 샘플들을 선택하여 트레이닝 샘플들로 이용된다. 예를 들어, 사용자 u가 물품 i와 j에 대하여 그 어떤 행위도 실행하지 않았거나 사용자 u가 물품 i와 물품 j에 대하여 실행한 행위의 유형이 같다면 사용자 u의 물품 i와 물품 j에 대한 선호 정도의 차이가 명확하 지 않으며 이런 유형의 샘플들은 트레이닝 샘플로 이용할 수 없다. 또 다른 예를 들면 매 물품의 실행 가능성을 얻을 수 있다. 한개 물품에 대한 실행 가능성은 사용자가 이 물품에 대하여 행위를 실행할 가능성을 가리킨다. 실행 가능성은 전체 시스템에서 물품의 출현 확률, 유행도, 추천도, 전시 등급 등의 요인을 따라 확정할 수 있다. 예를 들어, 전체 시스템에서 물품의 출현 확률이 점점 커지고 사용자가 이 물품을 아주 쉽게 얻게 된다면 이 물품의 실행 가능성은 점점 커지며, 반대로 전체 시스템에서 물품의 출현 확률이 점점 작아지고 사용자가 이 물품을 얻기가 아주 힘들다면 이 물품의 실행 가능성은 점점 작아진다. 트레이닝 샘플들을 얻을 때 만일 한명의 사용자 u가 행위를 실행한 물품과 한명의 사용자 u가 행위를 실행하지 않은 물품을 선택하여 트레이닝 샘플을 만든다면 사용자 u가 행위를 실행하지 않은 물품들 중에서 실행 가능성이 비교적 큰 물품들을 선택하여 트레이닝 샘플들을 만들 수 있다. 상기 방식을 통하여 얻은 트레이닝 샘플들은 2개의 물품에 대한 사용자의 선호 정도의 차이를 보다 정확하게 반영한다는 것을 담보하며 트레이닝 샘플의 오차 위험을 줄이고 믿음성을 제고할 수 있다.

초기화된 사용자 파라메터 행렬 W_m _×k와 초기화된 태그 파라메터 행렬 H_k _×n을 발생시킨 202단계.

여기서 m은 사용자의 수를 표시하는 양의 정수이고, k는 인자의 수를 표시하는 양의 정수이고, n은 태그의 수를 표시하는 1보다 큰 정수이다. 가능한 실시방식에서는 정규 분포를 띠는 난수 발생 방식을 이용하여 초기화된 사용자 파라메터 행렬 W_m _×k와 태그 파라메터 행렬 H_k _×n을 구성한다. 초기화된 사용자 파라메터 행렬 W_m _×k 중의 원소들이 정규 분포를 띠는 난수들이고, 초기화된 태그 파라메터 행렬 H_k _×n 중의 원소들도 정규 분포를 띠는 난수들이다.

선택적으로, 인자의 수인 k의 값은 미리 설정할 수도 있거나 또는 많은 실험을 통하여 얻은 경험값으로 정할 수도 있다.

선택적으로,정규 분포의 평균값은 0으로 정하며 분산(variance)은 0.01로 설정할 수 있다.

예시적으로, 임의로 생성된 사용자 파라메터 행렬 W_m _×k와 태그 파라메터 행렬 H_k _×n은 하기와 같다.

여기서 사용자 파라메터 행렬 W_m _×k의 매 행은 한 사용자의 인자 벡터에 대응하고, 태그 파라메터 행렬 H_k _×n의 매 렬은 한개 태그의 인자 벡터에 대응한다.

이하 203 단계 ~ 207단계를 통하여 초기화된 사용자 파라메터 행렬 W_m _×k와 초기화된 태그 파라메터 행렬 H_k _×n을 수정한다. 우선 a=0이라고 하고 이하203 단계를 실행한다.

a번째 수정 후의 사용자 파라메터 행렬 W_m _×k와 a번째 수정 후의 태그 파라메터 행렬 H_k _×n에 따라 m명의 사용자들 중의 매 사용자의 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산하는 203 단계.

여기서 a는 0과 같거나 큰 정수이며 0번째 수정 후의 사용자 파라메터 행렬 W_m×k는 초기화된 사용자 파라메터 행렬 W_m _×k로 하고, 0번째 수정 후의 태그 파라메터 행렬 H_k×n은 초기화된 태그 파라메터 행렬 H_k _×n로 한다.

a=0일 때 초기화된 사용자 파라메터 행렬 W_m _×k와 초기화된 태그 파라메터 행렬 H_k _×n에 따라 m개 사용자 중의 매 사용자의 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산한다.

선택적으로, 사용자 u의 태그 t에 대한 선호 정도 계산 공식은 하기와 같다.

예를 들어, 상기 예시적으로 초기화된 사용자 파라메터 행렬 W와 초기화된 태그 파라메터 행렬 H에서 사용자 1의 태그 1에 대한 선호 정도는

이며, 사용자 3의 태그 5에 대한 선호 정도는

이다.

m명의 사용자들 중의 매 사용자의 n개의 태그들 중의 매 태그에 대한 선호 정도와 물품 태그 행렬 A_h×n에 따라 m명의 사용자들 중의 매 사용자의 h개의 물품들 중의 매 물품에 대한 선호 정도를 계산하는 204 단계.

초기화된 사용자 파라메터 행렬 W_m _×k와 초기화된 태그 파라메터 행렬 H_k _×n에 따라 매 사용자의 매 태그에 대한 선호 정도를 계산해낸 후 물품 태그 행렬을 결합한데 따라 m명의 사용자들 중의 매 사용자의 h개의 물품들 중의 매 물품에 대한 선호 정도를 계산한다.

여기서 물품 태그 행렬A_h _×n은 사용자 행위 로그에 포함한 물품 표식과 물품 태그들에 따라 얻어진 행렬이다.

선택적으로, 물품 태그 행렬 A_h×n의 행은 물품을, 렬은 태그를 가리킨다. 예시적으로,물품 태그 행렬 A_h×n 중의 원소들을 0이나 1로 표시한다. 0은 물품이태그가 서술하는속성을 가지고 있지 않다는 것을 가리키며, 1은 물품이태그가 서술하는 속성을 가지고 있다는 것을 가리킨다. 물품의 개수는 4, 태그의 개수는 5라고 하면 예에서 보여준 물품 태그 행렬 A_h×n은

이며, 여기서 물품 태그 행렬 A₁은 물품 태그 행렬의 1행을 표시하고 물품 1이 태그 1과 태그 2가 서술하는 속성을 가지고 있다는 것과, 물품 1이 태그 3, 태그 4, 태그 5가 서술하는 속성을가지고 있지 않다는 것을 알수 있다.

사용자가 어떤 물품을 좋아한다면 일반적으로 이 물품은 사용자가 선호한다는 태그(즉 태그가 서술하는 속성)를 가지고 있으므로, 물품에 대한 사용자의 선호는 이 물품이 가지고 있는 태그들에 대한 사용자의 선호 정도의 종합으로 볼 수 있다. 사용자 u의 물품 i에 대한 선호 정도는 물품 i가 가지고 있는 태그들에 대한 사용자 u의 선호 정도에 따라 계산된다.

선택적으로, 본 발명의 실시예에서는 물품 i가 가지고 있는 태그들에 대한 사용자 u의 선호 정도를 합계하여 물품 i에 대한 사용자 u의 선호 정도를 계산하고 계산공식은

이다.

예를 들어, 상기와 같이 예시적으로 초기화된 사용자 파라메터 행렬 W_m _×k와 초기화된 태그 파라메터 행렬 H_k _×n 중에서 물품 1에 대한 사용자 1의 선호 정도는

이고 물품 2에 대한 사용자 3의 선호 정도는

이다.

m명의 사용자들 중의 매 사용자의 h개 물품들 중의 매 물품에 대한 선호 정도에 따라 매 트레이닝 샘플에 대응하는 확률을 얻는 205 단계.

여기서 트레이닝 샘플 <u, i, j>에 대응하는 확률은 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 클 확률이다.

선택적으로,사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 클 확률에 대한 계산 과정은 하기와 같다.

단계 1. 계산된 매 물품에 대한 매 사용자의 선호 정도에 따라 물품 i에 대한 사용자 u의 선호 정도와 물품 j에 대한 사용자 u의 선호 정도의 차값

을 계산한다.

단계 2. 로지스틱 함수

에 따라 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 클 확률

을 계산한다.

M개의 트레이닝 샘플들에 각각 대응하는 확률들을 데이터 피팅 모델의 입력 파라메터로 하여 데이터 피팅 모델의 출력 결과를 계산하는 206 단계.

선택적으로,데이터 피팅 모델은 베이즈 최대 피팅 추정(Bayesian maximum fitting estimation) 방법을 이용하여 구성한 모델로서 구체적인 데이터 피팅 모델을 이하 보여준다.

여기서 λ _W , λ _H 와 λ _S 는 양의 실수로서 오버 피팅을 방지하는데 쓰이는 정규화 파라메터이고,

는 행렬의 2노르마이며, D _s 는 M개의 트레이닝 샘플들의 세트를 가리킨다. 트레이닝 샘플 <u, i, j>에 대응하는 확률은

이며

은 사용자 u의 물품 i에 대한 선호 정도와 물품 j에 대한 선호 정도의 차값이고,

는 로지스틱 함수를 가리키며, N _u 는 사용자 u와 관련 사용자 세트를 나타낸다. S _uv 는 사용자 유사도 행렬 S _m _×m 의 u행v렬의 원소로서 사용자 u와 사용자 v 사이의 유사도를 나타낸다. W _u 는 상기 a번째 수정 후의 사용자 파라메터 행렬W_m _×k의 u행에 대응하는 행 벡터이며 W _v 는 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k의 v행에 대응하는 행 벡터이다.

N _u 는 사용자 u의 관련 사용자 세트를 가리키며 사용자 u와 관련 관계가 있는 기타 사용자들의 세트를 가리킨다. 여기서 관련 관계는 친구 관계일 수 있다. 예를 들어, 어느 한 사용자 v와 사용자 u가 소셜 유형의 응용 중의 친구라면 사용자 u와 사용자 v 사이에는 우호 관계가 존재하며 사용자 u와 사용자 v는 관련 사용자들이거나 혹은 관련 관계는 비 친구 관계일 수도 있다. 예를 들어, 소셜 유형의 응용 중의 같은 그룹에 속해있다면 사용자 u와 사용자 v는 관련 사용자들이라고 한다. 설명할 필요가 있는 것은, 사용자 유사도 행렬 S _m _×m 을 구성할 때 사용자 유사도 행렬 S _m _×m 의 임의의 두명의 사용자들은 친구 관계를 가지고 있는 사용자들일 수도 있고 친구 관계를 이루지 못한 사용자들(동일한 그룹에 속해있으면서 전혀 모르는 사이인 낯선 사용자)일 수도 있다는 것이다.

사용자 유사도 행렬 S_m _×m에는 m명의 사용자들 중 2명의 사용자들 사이의 유사도가 포함된다. 선택적으로, 행렬 S의 대각 원소들을 S_uu = 0으로 하고, 끝으로 행에 따라정규화(normalization)를 진행하여

이 되도록 한다.

만일 출력 결과가 사전 설정 조건에 부합되지 않는다면 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k를 수정하여 a+1번째 수정 후의 사용자 파라메터 행렬 W_m _×k를 얻으며 또한 a번째 수정 후의 태그 파라메터 행렬 H_k _×n를 수정하여 a+1번째 수정 후의 태그 파라메터 행렬 H_k _×n을 얻고 a=a+1로 하고 상기 203 단계 ~ 206 단계를 실행하는 207 단계.

사전 설정 조건에는 본 순환의 출력 결과와 이전 순환의 출력 결과 사이의 차값이 예정 역치(threshold)보다 작다는 것과/혹은 사용자 파라메터 행렬과 태그 파라메터 행렬들에 대한 수정 회수가 예정 회수에 이르렀다는 것이 포함된다. 여기서 예정 역치과 예정 회수는 수정 정도와 수정 효율을 종합하게 고려한 후에 설정한다.

선택적으로,a번째 수정 후의 사용자 파라메터 행렬 W_m _×k에 따라 이하 공식에 의해 a+1번째 수정 후의 사용자 파메터 행렬 W_m _×k를 계산할 수 있다.

여기서

는 a+1번째 수정 후의 사용자 파라메터 행렬 W_m _×k의 u행에 대응하는 행 벡터이며

는 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k의 u행에 대응하는 행 벡터,

는 a번째 수정 후의 태그 파라메터 행렬 H_k _×n의 l렬에 대응하는 렬 벡터의 전치(轉置) 벡터를 가리킨다. l은 1≤l≤n인 정수이다.

는 정의 실수로서 학습 효율을 나타낸다.

는 미리 설정한 경험값인데 수정 속도와 수정 정확도를 종합하게 고려한 후 설정할 수 있다. 선택적으로,a번째 수정 후의 태그 파라메터 행렬 H_k _×n에 따라 이하 공식에 의해 a+1번째 수정 후의 태그 파라메터 행렬 H_k×n을 계산할 수 있다.

여기서,

는 a+1번째 수정 후의 태그 파라메터 행렬 H_k _×n의 f행에 대응하는 행 벡터를 가리키며,

는 a번째 수정 후의 태그 파라메터 행렬 H_k _×n의 f행에 대응하는 행 벡터를 가리킨다. f는 1≤f≤k인 정수이다.

는 양의 실수로서 학습 효율을 나타낸다.

는 미리 설정한 경험값인데 수정 속도와 수정 정확도를 종합하게 고려한 후 설정할 수 있다.

매번의 수정 과정에 M개의 트레이닝 샘플들 중의 매 트레이닝 샘플에 대응하는

들을 하나하나 차례로 상기 공식에 대입하여 사용자 파라메터 행렬과 태그 파라메터 행렬에 대하여 M차의 수정을 진행한다.

즉 사용자 파라메터 행렬과 태그 파라메터 행렬에 대한 a번째 수정 과정에 x=1로 하고 제x개의 트레이닝 샘플에 대응하는

과 제 x-1차 수정 후의 사용자 파라메터 행렬과 제x-1차 수정 후의 태그 파라메터 행렬을 상기 사용자 파라메터 행렬의 수정 공식에 대입하여 제x차 수정 후의 사용자 파라메터 행렬을 계산하고,제 x개의 트레이닝 샘플들에 대응하는

을 제x-1차 수정 후의 태그 파라메터 행렬과 제x차 수정 후의 사용자 파라메터 행렬을 상기 태그 파라메터 행렬의 수정 공식에 대입하여 제x차 수정 후의 태그 파라메터 행렬을 계산하며, x=x+1로 하고 x가 M보다 크지 않은가를 체크하고, 만일 크지 않다면, 상기 제x개의 트레이닝 샘플들에 대응하는

과 제x-1차 수정 후의 사용자 파라메터 행렬과 제x-1차 수정 후의 태그 파라메터 행렬을 상기 사용자 파라메터 행렬의 수정 공식에 대입하여 제x차 수정 후의 사용자 파라메터 행렬을 계산하는 단계를 실행하기 시작하며, 만일 크다면 이 공정을 결속하고, a번째 수정을 완성한다. 여기서 제0차 수정 후의 사용자 파라메터 행렬은 a-1번째 수정 후의 사용자 파라메터 행렬이며, 0번째 수정 후의 사용자 파라메터 행렬은 바로 초기화된 사용자 파라메터 행렬로, a번째 수정 과정에서 얻어진 제M차 수정 후의 사용자 파라메터 행렬은 바로 a번째 수정 후의 사용자 파라메터 행렬로 되며, 제0차 수정 후의 태그 파라메터 행렬은 a-1번째 수정 후의 태그 파라메터 행렬이고, 0번째 수정 후의 태그 파라메터 행렬은 바로 초기화된 태그 파라메터 행렬로, a번째 수정 과정에 얻어진 제M차 수정 후의 태그 파라메터 행렬은 a번째 수정 후의 태그 파라메터 행렬로 된다.

만일 출력 결과가 사전 설정 조건에 부합된다면 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k와 a번째 수정 후의 태그 파라메터 행렬 H_k _×n을 각각 최종 사용자 파라메터 행렬 W_m×k와 최종 태그 파라메터 행렬 H_k×n로 확정하는 208 단계.

데이터 피팅 모델의 출력 결과가 사전 설정 조건에 부합될 때 사용자 파라메터 행렬 W_m _×k와 태그 파라메터 행렬 H_k _× _n에 대한 수정을 중지하고, 현재의 사용자 파라메터 행렬 W_m _×k을 최종 사용자 파라메터 행렬 W_m _×k로 확정하고_, 현재의 태그 파라메터 행렬 H_k×n을 최종 태그 파라메터 행렬 H_k×n로 확정한다.

최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n에 따라 사용자 포트레이트 행렬 P_m _×n을 얻는 209 단계.

여기서 사용자 포트레이트 행렬 P_m _×n의 u행t렬의 원소 P_ut는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 u와 t는 각각 1≤u≤m, 1≤t≤n인 정수들이다.

사용자 파라메터 행렬과 태그 파라메터 행렬을 반복 수정한 후, 최종 사용자 파라메터 행렬과 최종 태그 파라메터 행렬을 얻고 최종 사용자 파라메터 행렬과 최종 태그 파라메터 행렬에 따라 태그에 대한 사용자의 선호 정도를 출력한다.

예시적으로, 트레이닝 샘플들을 피팅시켜 얻은 최종 사용자 파라메터 행렬과 최종 태그 파라메터 행렬들이 각각

이라고 할 때 계산 결과로 얻어진 사용자 포트레이트 행렬은

이다.

선택적으로, 본 실시예가 제공하는 방법은 이하 210 단계를 더 포함할 수 있다.

얻어진 사용자 포트레이트 행렬 P_m _×n과 타겟 물품이 가지고 있는 태그들에 따라 사용자 u의 타겟 물품에 대한 선호 정도를 계산하는 210 단계.

요약하면, 본 실시예가 제공하는 방법에서는 사용자 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻고, M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 W_m _×k와 태그 파라메터 행렬 H_k _×n을 수정하여 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n을 얻은 다음, 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n에 따라 사용자 포트레이트 행렬 P_m _×n을 얻는 것을 통하여, 종래 기술이 제공한 사용자 포트레이트 획득 방법들에서 제기되는 낭비되는 시간과 인력 원가가 비교적 높은 문제와 획득한 사용자 포트레이트의 정확도가 비교적 낮은 문제를 해결하였으며, 사용자와 태그를 파라메터화하고, 데이터 피팅 모델을 이용하여 사용자 파라메터 행렬과 태그 파라메터 행렬을 수정하여 그것으로 트레이닝 샘플들을 피팅하므로서 태그에 상응한 태그 무게를 수동적으로 설정할 필요가 없고, 사용자의 행위 로그에 따라 데이터 피팅 방법을 이용하여 사용자 포트레이트를 자동적으로 획득하므로서 시간과 인력 원가를 절약하면서도 사용자 포트레이트를 정확하고 유효하게 얻는 기술 효과를 달성하였다.

이외에, 기계 학습 방식을 이용하여 사용자 파라메터 행렬과 태그 파라메터 행렬에 대한 수정을 진행하므로서 트레이닝 샘플들을 피팅하므로서 사용자 포트레이트를 자동적으로 획득하고 그 정확성과 유효성을 더욱 제고하였다.

이외에, 물품들을 부류별로, 사람들을 컬렉션으로 분류하는 아이디어에 기초하여 유사도가 아주 높은, 즉 기호가 매우 비슷한 2명의 사용자들에 대하여, 데이터 피팅 모델에서 제약 조건으로서 사용자 유사도 행렬을 증가시키므로서 단순히 사용자 행위 로그들에 의거하여서만 사용자 포트레이트를 얻는 것이 아니라 사용자 파라메터 행렬의 수정시 사용자 유사도 행렬을 고려하여 사용자의 파라메터 벡터와 그의 관련 사용자의 사용자 파라메터 벡터 사이의 강한 상관성을 체현하므로서 사용자 포트레이트 획득의 정확성을 더욱 제고하였다.

도 4에 도시한 바와 같이 이하 단계를 통하여 유사도 행렬 S_m _×m을 얻을 수 있다.

m명의 사용자들 중의 매 사용자의 소셜 네트워크 정보를 얻는 401 단계.

소셜 네트워크 정보에는 사용자 표식, 사용자의 관련 사용자 리스트, 사용자와 관련사용자 사이의 유사도가 포함된다.

여기서 사용자 표식은 사용자 신분을 식별하는 표식 번호로서 사용자 계정 번호라고도 부르며 어떤 시스템에서 상대적으로 유일한 코드이다. 사용자의 관련 사용자 리스트에는 사용자의 매 관련 사용자, 즉 사용자와 관련 관계를 가지고 있는 기타 사용자들도 포함된다. 사용자와 관련 사용자들 사이의 유사도는 사용자와 관련 사용자들 사이의 상관성을 가리킨다. 여기서 사용자와 관련 사용자들 사이의 유사도는 이하 한개 항목, 또는 여러 항목의 파라메터들에 따라 확정할 수 있다. 사용자와 관련 사용자 사이의 교제 회수, 사용자와 관련 사용자 사이의 관계가 친구 관계인가, 사용자와 관련 사용자 사이가 같은 사교권을 가지고 있는가, 사용자와 관련 사용자 사이가 같은 인구 속성을 가지고 있는가, 사용자와 관련 사용자 사이가 같은 기호를 가지고 있는가 등등이다.

m명의 사용자의 소셜 네트워크 정보들에 따라 사용자 유사도 행렬 S_m _×m을 생성하는 402 단계.

m명의 사용자의 소셜 네트워크 정보에 따라 두 사용자 사이의 유사도를 얻고 사용자 유사도 행렬 S_m _×m을 생성한다. 사용자 유사도 행렬 S_m _×m의 행과 렬은 사용자들을 가리킨다. 예하면 사용자 유사도 행렬 S_m _×m의 2행3렬은 사용자 2와 사용자 3 사이의 유사도를 가리킨다.

예시적으로, 사용자의 수가 3일 때 사용자 유사도 행렬 S_m _×m은

이다.

여기서 제1행의 0.6은 사용자 1과 사용자 2 사이의 유사도를 나타내며, 0.4는 사용자 1과 사용자 3 사이의 유사도를 나타낸다. 사용자 유사도 행렬 S_m _×m을 생성할 때 사용자와 관련 사용자 사이의 유사도만을 고려하고, 사용자와 그 자신 사이의 유사도는 고려하지 않으므로 사용자 유사도 행렬 S_m _×m의 대각 원소들 S_uu는 0으로 된다.

요약하면, 사용자 유사도 행렬을 데이터 피팅 모델의 제약 조건으로, 동시에 사용자 파라메터 행렬을 수정하는 한개의 파라메터로 인입하므로서 사용자 포트레이트에 대한 최종 획득의 정확성을 더욱 제고하였다. 이외에, 상기 실시예에서는 사용자들 사이의 유사도만을 데이터 피팅 모델에 제약 조건으로서 인입하고 사용자 파라메터 벡터와 그의 관련 사용자 파라메터 벡터들 사이의 강한 상관성을 구현한다. 기타 가능한 실시예에서도 요구에 따라 기타 데이터들을 데이터 피팅 모델에 제약 조건으로서 인입시킬수 있다. 예를 들어, 태그들 사이의 유사도를 데이터 피팅 모델에 제약 조건으로서 인입하여 태그 유사도 행렬을 구성하는데, 태그 유사도 행렬의 행과 렬은 모두 태그들을 표시하고, 매 원소는 대응하는 행과 렬이 가리키는 2개의 태그들 사이의 유사도를 표시하고, 태그들 사이의 유사도는 태그들이 표현하는 의미의 근사 정도에 따라 확정할 수 있다. 예를 들어, 2개의 의미가 근사할수록 태그들 사이의 유사도가 더 높아지므로 태그 파라메터 벡터와 그와 유사한 태그의 태그 파라메터 벡터 사이의 강한 상관성을 구현하게 된다. 이로 하여 상기 데이터 피팅 모델은 사용자 파라메터 벡터와 태그 파라메터 벡터들을 자동적으로 학습하여 물품에 대한 사용자의 선호 정도를 얻는 구조로서 비교적 많이 통용되고 있으며 요구에 따라 기타 데이터들을 이 모델에 추가할 수 있다.

도 5에서는 본 발명의 일 실시예가 제공한 사용자 포트레이트 획득 장치의 구조 골격도를 도시하였다. 이 장치는 소프트웨어나 하드웨어, 또는 양자 결합을 통하여 서버의 부분 또는 전부를 실현한다. 이 장치는 샘플 획득 모듈 520, 행렬 수정 모듈 540, 포트레이트 획득 모듈 560을 포함할 수 있다.

샘플 획득 모듈 520은 사용자 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻는데 이용하며, 여기서 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하며 M은 양의 정수이다.

행렬 수정 모듈 540은 샘플 획득 모듈 520에서 얻어진 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 W_m _×k와 초기화된 태그 파라메터 행렬 H_k _×n을 수정하여 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n을 얻는데 이용하며, 여기서 m은 사용자의 수를 표시하는 양의 정수이고, k는 인자의 수를 표시하는 양의 정수이고, n은 태그의 수를 표시하는 1보다 큰 정수이다.

포트레이트 획득 모듈 560은 행렬 수정 모듈 540에서 얻어진 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n에 따라 사용자 포트레이트 행렬 P_m _×n을 얻는데 이용하며, 여기서 사용자 포트레이트 행렬 P_m _×n의 제u행 제t렬의 원소 P_ut는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 u와 t는 1≤u≤m, 1≤t≤n인 정수들이다.

요약하면, 본 실시예가 제공하는 장치에서는 사용자 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻고, 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 Wm×k와 태그 파라메터 행렬 H_k _×n을 수정하여 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n을 얻은 다음, 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n에 따라 사용자 포트레이트 행렬 P_m _×n을 얻는 것을 통하여, 종래 기술이 제공한 사용자 포트레이트 획득 방법들에서 제기되는 낭비되는 시간과 인력 원가가 비교적 높은 문제와 획득한 사용자 포트레이트의 정확도가 비교적 낮은 문제를 해결하였으며, 사용자와 태그를 파라메터화하고, 데이터 피팅 모델을 이용하여 사용자 파라메터 행렬과 태그 파라메터 행렬을 수정하여 그것으로 트레이닝 샘플들을 피팅하므로서 태그에 상응한 태그 무게를 수동적으로 설정할 필요가 없고, 사용자의 행위 로그에 따라 데이터 피팅 방법을 이용하여 사용자 포트레이트를 자동적으로 획득하므로서 시간과 인력 원가를 절약하면서도 사용자 포트레이트를 정확하고 유효하게 얻는 기술 효과를 달성하였다.

도 6에서는 본 발명의 다른 일 실시예가 제공한 사용자 포트레이트 획득 장치의 구조 골격도를 도시하였다. 이 장치는 소프트웨어나 하드웨어, 또는 양자 결합을 통하여 서버의 부분 또는 전부를 실현한다. 이 장치는 샘플 획득 모듈 610, 행렬 수정 모듈 650, 포트레이트 획득 모듈 660을 포함할 수 있다.

샘플 획득 모듈 610은 사용자 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻는데 이용하며, 여기서 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하는데 이용하며 M은 양의 정수이다.

가능한 실시방식에서 샘플 획득 모듈 610은 행위 획득 유닛 611과 샘플 획득 유닛 612를 포함한다.

행위 획득 유닛 611은 사용자 행위 로그들에 따라 m명의 사용자들 중의 매 사용자의 h개 물품들 중의 매 물품에 대한 행위 유형을 얻는데 이용하며 h는 1보다 큰 정수이다.

샘플 획득 유닛 612은 행위 획득 유닛 611에서 얻어진 매 사용자의 매 물품에 대한 행위 유형에 따라 M개의 트레이닝 샘플들을 얻는데 이용된다.

선택적으로, 이 장치는 제2 생성 모듈 620을 더 포함할 수도 있다.

제2 생성 모듈 620는 초기화된 사용자 파라메터 행렬 W_m _×k와 초기화된 태그 파라메터 행렬H_k _×n을 생성하는데 이용된다. 여기서 초기화된 사용자 파라메터 행렬 W_m _×k의 원소들은 정규 분포를 띠는 난수들로 하고, 초기화된 태그 파라메터 행렬H_k _×n의 원소들은 정규 분포를 띠는 난수들로 한다.

선택적으로, 이 장치는 정보 획득 모듈 630과 제1 생성 모듈 640을 더 포함할 수 있다.

정보 획득 모듈 630은 m명의 사용자들 중의 매 사용자의 소셜 네트워크 정보를 얻는데 이용된다.

제1 생성 모듈 640은 정보 획득 모듈 630에서 얻어진 m명의 사용자들의 소셜 네트워크 정보에 따라 사용자 유사도 행렬 S_m _×m을 생성하는데 이용된다.

행렬 수정 모듈 650은 샘플 획득 모듈 610에서 얻어진 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 제2 생성 모듈 620에서 생성한 초기화된 사용자 파라메터 행렬 W_m _×k와 초기화된 태그 파라메터 행렬H_k _×n을 수정하여 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n을 얻는데 이용되며 여기서 m은 사용자의 수를 표시하는 양의 정수이고, k는 인자의 수를 표시하는 양의 정수이고, n은 태그의 수를 표시하는 1보다 큰 정수이다.

가능한 실시방식에서, 행렬 수정 모듈 650은 제1 계산 유닛 651과 제2 계산 유닛 652, 확률 획득 유닛 653, 제3 계산 유닛 654, 행렬 확정 유닛 655, 행렬 수정 유닛 656을 포함한다.

제1 계산 유닛 651은 a=0이라고 하고 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k와 a번째 수정 후의 태그 파라메터 행렬 H_k _×n에 따라 m명의 사용자들 중의 매 사용자의 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산하는데 이용된다. 여기서 a는 0과 같거나 큰 정수이며 0번째 수정 후의 사용자 파라메터 행렬 W_m _×k는 초기화된 사용자 파라메터 행렬 W_m _×k로, 0번째 수정 후의 태그 파라메터 행렬 H_k _×n은 초기화된 태그 파라메터 행렬 H_k _×n로 한다.

제2 계산 유닛 652는 m명의 사용자들 중의 매 사용자의 n개의 태그들 중의 매 태그에 대한 선호 정도와 물품 태그 행렬 A_h×n에 따라 m명의 사용자들 중의 매 사용자의 h개의 물품들 중의 매 물품에 대한 선호 정도를 계산하는데 이용되며, 여기서 h는 물품의 개수를 표시하는 1보다 큰 정수이다.

확률 획득 유닛653은 m명의 사용자들 중의 매 사용자의 h개 물품들 중의 매 물품에 대한 선호 정도에 따라 M개의 트레이닝 샘플 중의 매 트레이닝 샘플에 대응하는 확률을 얻는데 이용되며, 여기서 트레이닝 샘플 <u, i, j>에 대응하는 확률은 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 클 확률이다.

제3 계산 유닛 654는 M개의 트레이닝 샘플들에 각각 대응하는 확률들을 데이터 피팅 모델의 입력 파라메터로 하여 데이터 피팅 모델의 출력 결과를 계산하는데 이용된다.

선택적으로, 데이터 피팅 모델은,

일 수 있으며, 여기서 λ _W , λ _H 와 λ _S 는 양의 실수로서 오버 피팅을 방지하는데 쓰이는 정규화 파라메터이고,

이며

는 로지스틱 함수를 가리키며, N _u 는 사용자 u와 관련 사용자들의 세트를 나타낸다. S _uv 는 사용자 유사도 행렬 S _m _×m 의 제u행 제v렬의 원소로서 사용자 u와 사용자 v 사이의 유사도를 나타낸다. W _u 는 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k의 제u행에 대응하는 행 벡터이며 W _v 는 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k의 제v행에 대응하는 행 벡터이다.

행렬 확정 유닛 655는 출력 결과가 사전 설정 조건에 부합되는 경우, a번째 수정 후의 사용자 파라메터 행렬 W_m _×k와 a번째 수정 후의 태그 파라메터 행렬 H_k _×n을 각각 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n로 확정하는데 이용된다.

행렬 수정 유닛 656은 출력 결과가 사전 설정 조건에 부합되지 않는 경우, a번째 수정 후의 사용자 파라메터 행렬 W_m _×k를 수정하여 a+1번째 수정 후의 사용자 파라메터 행렬 W_m _×k를 얻고 또한 a번째 수정 후의 태그 파라메터 행렬 H_k _×n를 수정하여 a+1번째 수정 후의 태그 파라메터 행렬 H_k _×n을 얻으며, a=a+1로 하고 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k와 a번째 수정 후의 태그 파라메터 행렬 H_k _×n에 따라 m명의 사용자들 중의 매 사용자의 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산하는 단계로부터 상기 단계들을 다시 실행하기 시작하는데 이용한다.

가능한 실현방식에서, 행렬 수정 유닛656은 구체적으로 이하 공식에 의해 a+1번째 수정 후의 사용자 파라메터 행렬 W_m _×k를 계산하는데 이용된다.

여기서

는 a+1번째 수정 후의 사용자 파라메터 행렬 W_m _×k의 제u행에 대응하는 행 벡터이고

는 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k의 제u행에 대응하는 행 벡터이며,

는 a번째 수정 후의 태그 파라메터 행렬 H_k _×n의 제l렬에 대응하는 렬 벡터의 전치 벡터를 가리킨다. l은 1≤l≤n인 정수이다.

는 양의 실수로서 학습 효율을 나타낸다.

가능한 실현방식에서, 행렬 수정 유닛 656은 구체적으로 이하 공식에 의해 a+1번째 수정 후의 태그 파라메터 행렬 H_k _×n을 계산하는데 이용된다.

여기서

는 a+1번째 수정 후의 태그 파라메터 행렬 H_k _×n의 제f행에 대응하는 행 벡터를 가리키며,

는 a번째 수정 후의 태그 파라메터 행렬 H_k _×n의 제f행에 대응하는 행 벡터를 가리킨다. f는 1≤f≤k인 정수이며

는 양의 실수로서 학습 효율을 나타낸다.

포트레이트 획득 모듈 660은 행렬 수정 모듈 650에서 얻어진 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n에 따라 사용자 포트레이트 행렬 P_m _×n을 얻는데 이용되며, 여기서 사용자 포트레이트 행렬 P_m _×n의 제u행 제t렬의 원소 P_ut는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 u와 t는 각각 1≤u≤m, 1≤t≤n인 정수들이다.

선택적으로, 이 장치는 선호 계산 모듈 670을 더 포함할 수 있다.

선호 계산 모듈 670은 포트레이트 획득 모듈 660에서 얻어진 사용자 포트레이트 행렬 P_m _×n과 타겟 물품이 가지고 있는 태그들에 따라 사용자 u의 타겟 물품에 대한 선호 정도를 계산하는데 이용된다.

요약하면, 본 실시예가 제공하는 장치에서는 사용자 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻고, 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 W_m _×k와 태그 파라메터 행렬 H_k _×n을 수정하여 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n을 얻은 다음, 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n에 따라 사용자 포트레이트 행렬 P_m _×n을 얻는 것을 통하여, 종래 기술이 제공한 사용자 포트레이트 획득 방법들에서 제기되는 낭비되는 시간과 인력 원가가 비교적 높은 문제와 획득한 사용자 포트레이트의 정확도가 비교적 낮은 문제를 해결하였으며, 사용자와 태그를 파라메터화하고, 데이터 피팅 모델을 이용하여 사용자 파라메터 행렬과 태그 파라메터 행렬을 수정하여 그것으로 트레이닝 샘플들을 피팅하므로서 태그에 상응한 태그 무게를 수동적으로 설정할 필요가 없고, 사용자의 행위 로그에 따라 데이터 피팅 방법을 이용하여 사용자 포트레이트를 자동적으로 획득하므로서 시간과 인력 원가를 절약하면서도 사용자 포트레이트를 정확하고 유효하게 얻는 기술 효과를 달성하였다.

이외에, 물품들을 부류별로, 사람들을 컬렉션으로 분류하는 아이디어에 기초하여 유사도가 아주 높은, 즉 기호가 매우 비슷한 2명의 사용자들에 대하여 데이터 피팅 모델에서 제약 조건으로서 사용자 유사도 행렬을 증가시키므로서 단순히 사용자 행위 로그들에 의거하여서만 사용자 포트레이트를 얻는 것이 아니라 사용자 파라메터 행렬의 수정시 사용자 유사도 행렬을 고려하여 사용자의 파라메터 벡터와 그의 관련 사용자의 사용자 파라메터 벡터 사이의 강한 상관성을 구현하므로서 사용자 포트레이트 획득의 정확성을 더욱 제고하였다.

설명할 필요가 있는 것은, 상기 실시예가 제공한 장치는 그 기능들을 실현할 때 각 기능 모듈들을 구분하여 예를 들어 설명하였을뿐이고 실제 응용에서는 상기 기능들을 요구에 따라 할당하여 서로 다른 기능 모듈들로 완성할 수 있으며, 장치의 내부 구조를 서로 다른 기능 모듈들로 구분하여 상기 서술한 전부 또는 일부 기능들을 완성하게 된다. 이외에 상기 실시예가 제공하는 사용자 포트레이트 획득 장치와 사용자 포트레이트 획득 방법 실시예는 동일한 구상에 속하며 그의 구체적인 실현 과정은 방법 실시예를 상세히 보면 되므로 여기서 다시 언급하지 않는다.

도 7에서는 본 발명의 일 실시예가 제공한 서버의 구조 개략도를 도시하였다. 이 서버는 상기 실시예에서 제공한 사용자 포트레이트 획득 방법을 실시하는데 이용된다. 구체적으로 보면,

상기 서버 700은 중앙 처리 유닛(CPU) 701과, 랜덤 액세스 메모리(RAM) 702와 읽기 전용 메모리(ROM) 703을 포함하는 시스템 메모리 704, 시스템 메모리 704와 중앙 처리 유닛 701을 연결하는 시스템 버스 705를 포함한다. 상기 서버 700은 또한 컴퓨터안의 매 요소 사이의 정보 전송을 방조하는 기본 입력/출력 시스템(I/O시스템) 706과, 조작 시스템 713, 응용 프로그램 714 과기타 프로그램 모듈 715을 기억하는데 이용되는 대용량 기억 설비 707을 포함한다.

상기 기본 입력/출력 시스템 706은 정보를 현시하는데 쓰이는 디스플레이 708과 사용자의 정보 입력에 이용되는 마우스와 키보드와 같은 입력 설비 709를 포함한다. 여기서 상기 디스플레이 708과 입력 설비 709는 모두 시스템 버스 705에 연결된 입출력 컨트롤러 710을 통하여 중앙 처리 유닛 701과 연결된다. 상기 기본 입력/출력 시스템 706은 입출력 컨트롤러 710을 더 포함하여 키보드나 마우스, 혹은 전자 터치 조종 펜 등 여러가지 기타 설비의 입력을 수신 및 처리하는데 이용될 수 있다. 이와 유사하게, 입력/출력 컨트롤러 710은 또한 디스플레이나 프린터 혹은 기타 유형의 출력 설비들에 출력을 제공한다.

상기 대용량 기억 설비 707은 시스템 버스 705에 연결된 대용량 기억 컨트롤러(도시되지 않음)를 통하여 중앙 처리 유닛 701에 연결된다.상기 대용량 기억 설비 707및 그와 관련된 컴퓨터 리더블 매체들은 서버 700에 비휘발성저장을 제공한다. 다시 말하여, 상기 대용량 기억 설비 707에는 하드 디스크나 CD-ROM 구동기와 같은 컴퓨터 리더블 매체들(도시되지 않음)이 포함된다.

일반성을 잃음이 없이, 상기 컴퓨터 리더블 매체에는 컴퓨터 기억 매체와 통신 매체들이 포함될 수 있다. 컴퓨터 기억 매체에는 컴퓨터 리더블 지령들과 데이터 구조, 프로그램 모듈이나 기타 데이터 등과 같은 정보들을 기억하는 임의의 방법이나 기술 실현에 이용되는 휘발성 및 비휘발성, 이동 가능 및 이동 불가능 매체들이 포함된다. 컴퓨터 기억 매체에는 RAM이나 ROM, EPROM, EEPROM, 플래시 메모리 혹은 기타 고체 상태 저장 기술, CD-ROM, DVD 혹은 기타 옵티컬 기억, 카세트,자기 테이프, 자기 디스크 메모리 혹은 기타 자성 기억 설비들이 포함된다. 물론 이 기술분야의 당업자라면, 상기 컴퓨터 기억 매체들이 상기 몇가지 종류에만 국한되지 않는다는 것을 알 수 있다. 상기 시스템 메모리 704와 대용량 기억 설비 707을 메모리라고 부를 수 있다.

본 발명의 각종 실시예들에 따라 상기 서버 700은 또한 인터넷 등과 같은 여러 네트워크를 통하여 네트워크에 연결된 원격 컴퓨터로 운영될 수 있다. 즉 서버 700은 상기 시스템 버스 705상에서 연결된 네트워크 인터페이스 유닛 711을 통하여 네트워크 712에 연결될 수 있으며 또는 네트워크 인터페이스 유닛711을 사용하여 기타 유형의 네트워크나 원격 컴퓨터 시스템(도시되지 않음)에 연결될 수 있다.

상기 메모리는 한개 또는 한개 이상의 프로그램들을 더 포함할 수 있는데 상기 한개 혹은 한개 이상의 프로그램들은 메모리에 기억되고 한개 혹은 한개 이상의 프로세서들에 의해 실행된다. 상기 한개 혹은 한개 이상의 프로그램들에는 상기 방법을 실행하는데 이용되는 지령들이 포함되어 있다.

예시적인 실시예에서는, 또한 지령들을 포함하는 비 임시성 컴퓨터 리더블 기억 매체, 예하면 지령들을 포함하는 메모리를 제공하였는데, 상기 지령들은 서버의 프로세서에서 실행되여 상기 사용자 포트레이트 획득 방법을 완성할 수 있다. 예를 들면 상기 비 임시성 컴퓨터 리더블 기억 매체들은 ROM, 랜덤 액세스 메모리(RAM), CD-ROM, 자기 테이프, 플로피 디스크, 옵티컬 데이터 기억 설비 등일 수 있다.

응당 이해할 것은 본문에서 "여러개"라고 언급한 것들은 2개 혹은 2개 이상을 가리킨다는 것이다. "와/혹은"은 관련 대상들의 관련 관계를 서술하며 3가지 관계들이 존재할 수 있다는 것을 보여준다. 예하면 A 와/혹은 B 는 A가 단독으로 존재하는 경우, A와 B가 동시에 존재하는 경우, B가 단독으로 존재하는 경우의 3가지 상황들을 표시할 수 있다. 부호 "/"는 일반적으로 전후 관련 대상들이 일종의 "혹은"의 관계이라는 것을 가리킨다.

상기 본 발명의 실시예의 순서번호는 다만 서술을 위한것일뿐이고 실시예의 우렬을 대표하는 것은 아니다.

이 기술분야의 당업자라면, 상기 실시예의 전부 혹은 일부 단계를 하드웨어를 통하여 실현할 수 있으며 프로그램을 통하여 관련된 하드웨어에 지령을 주어 완성할 수도 있고, 상기 프로그램은 일종의 컴퓨터 리더블 기억 매체에 기억될 수 있으며 상기 언급된 기억 매체는 읽기 전용 메모리, 자기 디스크, 혹은 옵티컬 디스크 등일 수 있다는 것을 이해할 수 있다.

상기 서술한 것은 본 발명의 바람직한 실시예일뿐 본 발명을 제한하지 않으며, 본 발명의 정신과 원칙내에서 진행하는 모든 임의의 수정, 동등치환, 개진 등은 응당 본 발명의 보호범위안에 포함되여야 한다.

Claims

사용자 행위 로그들에 따라 상기 M개의 트레이닝 샘플들을 얻는 것, 여기서, 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하는데 이용하며 상기M은 양의 정수이고,
상기 M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 W_m _×k와 초기화된 태그 파라메터 행렬 H_k _×n을 수정하여 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n을 얻는 것, 여기서,상기 m은 사용자의 수를 표시하고,상기 k는 인자의 수를 표시하고, 상기n은 태그의 수를 표시하고, 상기 m은 양의 정수이고, 성기 k는 양의 정수이고, 상기 n은 1보다 큰 정수이고,
상기 최종 사용자 파라메터 행렬 W_m _×k와 상기 최종 태그 파라메터 행렬 H_k _×n에 따라 상기 사용자 포트레이트 행렬 P_m _×n을 얻는 것을 포함하고, 여기서, 상기 사용자 포트레이트 행렬 P_m _×n의 제u행제t렬의 원소 P_ut는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 상기u는 1≤u≤m인 정수이고, 상기 t는 1≤t≤n인 정수인 것을 특정으로 하는 사용자 포트레이트 획득 방법.
청구항 1에 있어서,
상기 M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 W_m _×k와 초기화된 태그 파라메터 행렬 H_k _×n을 수정하여 최종 사용자 파라메터 행렬 W_m×k와 최종 태그 파라메터 행렬 H_k×n을 얻는 것은,
상기 a=0으로 하고 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k와 a번째 수정 후의 태그 파라메터 행렬 H_k _×n에 따라 상기 m명의 사용자들 중의 매 사용자의 상기 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산하는 것,여기서, 상기a는 0과 같거나 큰 정수이고, 0번째 수정 후의 사용자 파라메터 행렬 W_m _×k은 상기 초기화된 사용자 파라메터 행렬 W_m _× _k이고, 0번째 수정 후의 태그 파라메터 행렬 H_k _×n은 상기 초기화된 태그 파라메터 행렬 H_k×n이고,
상기 m명의 사용자들 중의 매 사용자의 상기 n개의 태그들 중의 매 태그에 대한 선호 정도와 물품 태그 행렬 A_h×n에 따라 상기m명의 사용자들 중의 매 사용자의 상기 h개의 물품들 중의 매 물품에 대한 선호 정도를 계산하는 것, 여기서, 상기 h는 물품의 개수를 나타내고, 상기 h는1보다 큰 정수이고,
상기 m명의 사용자들 중의 매 사용자의 상기 h개 물품들 중의 매 물품에 대한 선호 정도에 따라 상기 M개의 트레이닝 샘플들 중의 매 트레이닝 샘플에 대응하는 확률을 얻는 것, 여기서, 상기 트레이닝 샘플 <u, i, j>에 대응하는 확률은 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 큰 확률이고,
상기 M개의 트레이닝 샘플들에 각각 대응하는 확률들을 상기 데이터 피팅 모델의 입력 파라메터들로 하여 상기 데이터 피팅 모델의 출력 결과를 계산하는 것,
만일 상기 출력 결과가 사전 설정 조건에 부합된다면, 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k와 상기 a번째 수정 후의 태그 파라메터 행렬 H_k _×n을 각각 상기 최종 사용자 파라메터 행렬 W_m _×k와 상기 최종 태그 파라메터 행렬 H_k _×n로 확정하는 것,
만일 상기 출력 결과가 사전 설정 조건에 부합되지 않는다면, 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k를 수정하여 a+1번째 수정 후의 사용자 파라메터 행렬 W_m _×k를 얻으며 또한 상기 a번째 수정 후의 태그 파라메터 행렬 H_k _×n를 수정하여 a+1번째 수정 후의 태그 파라메터 행렬 H_k _×n을 얻으며, a=a+1으로 하고 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _× _k와 a번째 수정 후의 태그 파라메터 행렬 H_k×n에 따라 상기 m명의 사용자들 중의 매 사용자의 상기 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산하는 단계로부터 상기 단계들을 다시 실행하는 것을 포함하는 것을 특징으로 하는방법.
청구항 2에 있어서,
상기 데이터 피팅 모델은,

이며, 여기서 상기 λ _W , λ _H 와 λ _S 는 오버 피팅을 방지하는데 쓰이는 정규화 파라메터이고, 상기 λ _W , λ _H 와 λ _S 는 양의 실수이고,
은 행렬의 2노르마이고, 상기 D _s 는 상기 M개의 트레이닝 샘플들의 세트를 나타내며, 상기 트레이닝 샘플 <u, i, j>에 대응하는 확률
이고, 상기
은 상기 사용자 u의 물품 i에 대한 선호 정도와 상기 사용자 u의 물품 j에 대한 선호 정도의 차값이고, 상기
는 로지스틱 함수이고, 상기 N _u 는 상기 사용자 u와 관련 사용자들의 세트이고, 상기 S _uv 는 사용자 유사도 행렬 S_m _×m의 제u행제v렬의 원소이고, 상기 S _uv 는 상기 사용자 u와 상기 사용자 v 사이의 유사도를 나타내고, 상기 W _u 가 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k의 제u행에 대응하는 행 벡터이고, 상기 W _v 가 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k의 제v행에 대응하는 행 벡터인 것을 특징으로 하는 방법.
청구항 3에 있어서,
상기 m명의 사용자들 중의 매 사용자의 소셜 네트워크 정보를 획득하는 것과,
상기 m명의 사용자들의 소셜 네트워크 정보에 따라 상기 사용자 유사도 행렬 S_m×m를 생성하는 것을 더 포함하는 것을 특징으로 하는 방법.
청구항 3에 있어서,
상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k를 수정하여 a+1번째 수정 후의 사용자 파라메터 행렬 W_m _×k를 얻는 것은
이하 공식

에 의해 상기 a+1번째 수정 후의 사용자 파라메터 행렬 W_m _×k를 계산하는 것을 포함하며, 여기서 상기
는 상기 a+1번째 수정 후의 사용자 파라메터 행렬 W_m _×k의 제u행에 대응하는 행 벡터이고, 상기
는 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k의 제u행에 대응하는 행 벡터이고, 상기
는 상기 a번째 수정 후의 태그 파라메터 행렬 H_k _×n의 제l렬에 대응하는 렬 벡터의 전치 벡터이고, 상기 l은 1≤l≤n인 정수이고, 상기
는 학습 효율이고, 상기
는 양의 실수인 것을 특징으로 하는 방법.
청구항 3에 있어서,
상기 a번째 수정 후의 태그 파라메터 행렬 H_k _×n를 수정하여 a+1번째 수정 후의 태그 파라메터 행렬 H_k _×n을 얻는 것은,
이하 공식

에 의해 상기 a+1번째 수정 후의 태그 파라메터 행렬 H_k _×n을 계산하는 것을 포함하며, 여기서 상기
는 상기 a+1번째 수정 후의 태그 파라메터 행렬 H_k _×n의 제f행에 대응하는 행 벡터이고, 상기
는 상기 a번째 수정 후의 태그 파라메터 행렬 H_k _×n의 제f행에 대응하는 행 벡터이고, 상기 f는 1≤f≤k인 정수이고, 상기
는 학습 효율을 나타내고, 상기
는 양의 실수인 것을 특징으로 하는 방법.
청구항 1 내지 청구항6 중의 어느 한항에 있어서,
상기 사용자 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻는 것은,
상기 사용자 행위 로그들에 따라 상기 m명의 사용자들 중의 매 사용자의 h개의 물품들 중의 매 물품에 대한 행위 유형을 얻는 것, 여기서 h는 1보다 큰 정수이고,
매 사용자의 매 물품에 대한 행위 유형에 따라 M개의 트레이닝 샘플들을 얻는 것을 특징으로 하는 포함하는 것을 특징으로 하는 방법.
청구항 1 내지 청구항 6 중의 어느 한항에 있어서,
상기 M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 W_m _×k와 태그 파라메터 행렬 H_k _×n을 수정하여 최종 사용자 파라메터 행렬 W_m×k와 최종 태그 파라메터 행렬 H_k×n을 얻기 전에,
상기 초기화된 사용자 파라메터 행렬 W_m _×k와 상기 초기화된 태그 파라메터 행렬 H_k _×n을 생성하는 것을 더 포함하며, 여기서 상기 초기화된 사용자 파라메터 행렬 W_m _×k의 원소들이 정규 분포를 띠는 난수들이고 상기 초기화된 태그 파라메터 행렬 H_k×n의 원소들이 정규 분포를 띠는 난수들인 것을 특징으로 하는 방법.
청구항 1 내지 청구항6 중의 어느 한항에 있어서,
상기 최종 사용자 파라메터 행렬 W_m _×k와 상기 최종 태그 파라메터 행렬 H_k _×n에 따라 사용자 포트레이트 행렬 P_m _×n을 얻은 후,
상기 사용자 포트레이트 행렬 P_m _×n과 타겟 물품이 가지고 있는 태그들에 따라 상기 사용자 u의 상기 타겟 물품에 대한 선호 정도를 계산하는 것을 더 포함하는 것을 특징으로 하는 방법.
사용자 행위 로그들에 따라 상기 M개의 트레이닝 샘플들을 얻는데 이용되는 샘플 획득 모듈과, 여기서, 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하는데 이용하며 성기 M은 양의 정수이고,
상기 M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 W_m _×k와 초기화된 태그 파라메터 행렬 H_k _×n을 수정하여 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n을 얻는데 이용되는 행렬 수정 모듈과, 여기서,상기 m은 사용자의 수를 표시하고, 상기 k는 인자의 수를 표시하고,상기 n은 태그의 수를 표시하고, m은 양의 정수이고,상기 k는 양의 정수이고,상기 n은 1보다 큰 정수이고,
상기 최종 사용자 파라메터 행렬 W_m _×k와 상기 최종 태그 파라메터 행렬 H_k _×n에 따라 사용자 포트레이트 행렬 P_m _×n을 얻는데 이용되는 포트레이트 획득 모듈을 포함하고, 여기서, 상기 사용자 포트레이트 행렬 P_m _×n의 제u행제t렬의 원소 P_ut는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 상기 u는 1≤u≤m인 정수이고, 상기 t는 1≤t≤n인 정수인 것을 특정으로 하는 사용자 포트레이트 획득 장치.
청구항 10에 있어서,
상기 행렬 수정 모듈이,
a=0으로 하고 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k와 a번째 수정 후의 태그 파라메터 행렬 H_k _×n에 따라 상기 m명의 사용자들 중의 매 사용자의 상기 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산하는데 이용되는 제1 계산 유닛, 여기서,상기 a는 0과 같거나 큰 정수이고, 0번째 수정 후의 사용자 파라메터 행렬 W_m _×k은 상기 초기화된 사용자 파라메터 행렬 W_m _× _k이고, 0번째 수정 후의 태그 파라메터 행렬 H_k×n은 상기 초기화된 태그 파라메터 행렬 H_k×n이고,
상기 m명의 사용자들 중의 매 사용자의 상기 n개의 태그들 중의 매 태그에 대한 선호 정도와 물품 태그 행렬 A_h×n에 따라 상기 m명의 사용자들 중의 매 사용자의 h개의 물품들 중의 매 물품에 대한 선호 정도를 계산하는데 이용되는 제2 계산 유닛, 여기서, h는 물품의 개수를 나타내고, h는 1보다 큰 정수이고,
상기 m명의 사용자들 중의 매 사용자의 상기 h개 물품들 중의 매 물품에 대한 선호 정도에 따라 상기 M개의 트레이닝 샘플들 중의 매 트레이닝 샘플에 대응하는 확률을 얻는데 이용되는 확률 획득 유닛, 여기서, 상기 트레이닝 샘플 <u, i, j>에 대응하는 확률은 상기 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 큰 확률이고,
상기 M개의 트레이닝 샘플들에 각각 대응하는 확률들을 상기 데이터 피팅 모델의 입력 파라메터로 하여 상기 데이터 피팅 모델의 출력 결과를 계산하는데 이용되는 제3 계산 유닛,
상기 출력 결과가 사전 설정 조건에 부합되는 경우 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k과 상기 a번째 수정 후의 태그 파라메터 행렬 H_k _×n을 각각 상기 최종 사용자 파라메터 행렬 W_m _×k과 상기 최종 태그 파라메터 행렬 H_k _×n로 확정하는데 이용되는 행렬 확정 유닛,
상기 출력 결과가 사전 설정 조건에 부합되지 않는 경우 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k를 수정하여 상기 a+1번째 수정 후의 사용자 파라메터 행렬 W_m _×k를 얻고 또한 상기 a번째 수정 후의 태그 파라메터 행렬 H_k _×n을 수정하여 상기 a+1번째 수정 후의 태그 파라메터 행렬 H_k _×n을 얻으며, a=a+1로 하고 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k과 a번째 수정 후의 태그 파라메터 행렬 H_k×n에 따라 상기 m명의 사용자들 중의 매 사용자의 상기 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산하는 단계로부터 상기 단계들을 다시 실행하는데 이용되는 행렬 수정 유닛을 포함하는 것을 특정으로 하는 장치.
청구항 11에 있어서,
상기 데이터 피팅 모델은,

이며, 여기서 상기 λ _W , λ _H 와 λ _S 는 오버 피팅을 방지하는데 쓰이는 정규화 파라메터이고, 상기 λ _W , λ _H 와 λ _S 는 양의 실수이고,
은 행렬의 2노르마이고, 상기 D _s 는 상기 M개의 트레이닝 샘플들의 세트를 나타내며, 상기 트레이닝 샘플 <u, i, j>에 대응하는 확률
이고, 상기
은 상기 사용자 u의 물품 i에 대한 선호 정도와 상기 사용자 u의 물품 j에 대한 선호 정도의 차값이고, 상기
는 로지스틱 함수이고, 상기 N _u 는 상기 사용자 u와 관련 사용자들의 세트이고, 상기 S _uv 는 사용자 유사도 행렬 S_m _×m의 제u행 제v렬의 원소이고, 상기 S _uv 는 상기 사용자 u와 상기 사용자 v 사이의 유사도를 나타내고, 상기 W _u 가 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k의 제u행에 대응하는 행 벡터이고, 상기 W _v 가 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k의 제v행에 대응하는 행 벡터인 것을 특징으로 하는 장치.
청구항 12에 있어서,
상기 m명의 사용자들 중의 매 사용자의 소셜 네트워크 정보를 얻는데 이용되는 정보 획득 모듈과,
상기 m명의 사용자들의 소셜 네트워크 정보에 따라 상기 사용자 유사도 행렬 S_m _×m을 생성하는데 이용되는 제1 생성 모듈을 더 포함하는 것을 특징으로 하는 장치.
청구항 12에 있어서,
상기 행렬 수정 유닛은 구체적으로,
이하 공식

에 의해 상기a+1번째 수정 후의 사용자 파라메터 행렬 W_m _×k를 계산하며, 여기서 상기
는 상기 a+1번째 수정 후의 사용자 파라메터 행렬 W_m _×k의 제u행에 대응하는 행 벡터이고, 상기
는 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k의 제u행에 대응하는 행 벡터이고, 상기
는 상기 a번째 수정 후의 태그 파라메터 행렬 H_k _×n의 제l렬에 대응하는 렬 벡터의 전치 벡터이고, 상기 l은 1≤l≤n인 정수이고, 상기
는 학습 효율이고, 상기
는 양의 실수인 것을 특징으로 하는 장치.
청구항 12에 있어서,
상기 행렬 수정 유닛은 구체적으로,
이하 공식

에 의해 상기 a+1번째 수정 후의 태그 파라메터 행렬 H_k _×n을 계산하며, 여기서 상기
는 상기 a+1번째 수정 후의 태그 파라메터 행렬 H_k _×n의 제f행에 대응하는 행 벡터이고, 상기
는 상기 a번째 수정 후의 태그 파라메터 행렬 H_k _×n의 제f행에 대응하는 행 벡터이고, 상기 f는 1≤f≤k인 정수이고, 상기
는 학습 효율을 나타내고, 상기
는 양의 실수인 것을 특징으로 하는장치.
청구항 10 내지 청구항15 중의 어느 한항에 있어서,
상기 샘플 획득 모듈이,
상기 사용자 행위 로그들에 따라 상기 m명의 사용자들 중의 매 사용자의 h개 물품들 중의 매 물품에 대한 행위 유형을 얻는데 이용되는 행위 획득 유닛, 여기서 h는 1보다 큰 정수이고,
매 사용자의 매 물품에 대한 행위 유형에 따라 상기M개의 트레이닝 샘플들을 얻는데 이용되는 샘플 획득 유닛을 포함하는 것을 특징으로 하는 장치.
청구항 10 내지 청구항15 중의 어느 한항에 있어서,
상기 초기화된 사용자 파라메터 행렬 W_m _×k와 상기 초기화된 태그 파라메터 행렬H_k×n을 생성하는데 이용되는 제2 생성 모듈을 더 포함하며,
여기서, 상기 초기화된 사용자 파라메터 행렬 W_m _×k의 원소들은 정규 분포를 띠는 난수이고, 상기 초기화된 태그 파라메터 행렬 H_k _×n의 원소들은 정규 분포를 띠는 난수들인 것을 특징으로 하는 장치.
청구항 10 내지 청구항15 중의 어느 한항에 있어서,
상기 사용자 포트레이트 행렬 P_m _×n과 타겟 물품이 가지고 있는 태그들에 따라 상기 사용자 u의 상기 타겟 물품에 대한 선호 정도를 계산하는데 이용되는 선호 계산 모듈을 더 포함하는 것을 특징으로 하는 장치.
한개 혹은 여러개의 프로세서와,
상기 한개 혹은 여러개의 프로세서들과 상호 연결된 메모리를 포함하며, 상기 메모리에는 상기 한개 또는 여러개의 프로세서들에서 실행하도록 구성된 한개 혹은 여러개의 프로그램들이 기억되어 있고 상기 한개 혹은 여러개의 프로그램에는,
사용자의 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻는 조작과, 여기서, 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하는데 이용하며 상기M은 양의 정수이고,
상기 M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 W_m _×k와 초기화된 태그 파라메터 행렬 H_k _×n을 수정하여 최종 사용자 파라메터 행렬 W_m _×k와 최종 태그 파라메터 행렬 H_k _×n을 얻는 조작, 여기서,상기 m은 사용자의 수를 표시하고,상기 k는 인자의 수를 표시하고, 상기n은 태그의 수를 표시하고, 상기 m은 양의 정수이고, 성기 k는 양의 정수이고, 상기 n은 1보다 큰 정수이고,
상기 최종 사용자 파라메터 행렬 W_m _×k와 상기 최종 태그 파라메터 행렬 H_k _×n에 따라 사용자 포트레이트 행렬 P_m _×n을 얻는 조작을 진행하는데 이용되는 지령들이 포함되어 있으며, 여기서 상기 사용자 포트레이트 행렬 P_m _×n의 제u행제t렬의 원소 P_ut는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 상기 u는 1≤u≤m인 정수이고, 상기 t는 1≤t≤n인 정수인 것을 특정으로 하는 사용자 포트레이트 획득 장치.
청구항 19에 있어서,
상기 한개 혹은 여러개의 프로그램들이,
a=0으로 하고 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k와 a번째 수정 후의 태그 파라메터 행렬 H_k _×n에 따라 상기 m명의 사용자들 중의 매 사용자의 상기 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산하는 조작과, 여기서, 상기a는 0과 같거나 큰 정수이고, 0번째 수정 후의 사용자 파라메터 행렬 W_m _×k은 상기 초기화된 사용자 파라메터 행렬 W_m _× _k이고, 0번째 수정 후의 태그 파라메터 행렬 H_k _×n은 상기 초기화된 태그 파라메터 행렬 H_k×n이고,
상기 m명의 사용자들 중의 매 사용자의 상기 n개의 태그들 중의 매 태그에 대한 선호 정도와 물품 태그 행렬 A_h×n에 따라 상기m명의 사용자들 중의 매 사용자의 상기 h개의 물품들 중의 매 물품에 대한 선호 정도를 계산하는 조작, 여기서,상기 h는 물품의 개수를 나타내고, 상기 h는1보다 큰 정수이고,
상기 m명의 사용자들 중의 매 사용자의 상기 h개 물품들 중의 매 물품에 대한 선호 정도에 따라 상기 M개의 트레이닝 샘플들 중의 매 트레이닝 샘플에 대응하는 확률을 얻는 조작, 여기서, 상기 트레이닝 샘플 <u, i, j>에 대응하는 확률은 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 큰 확률이고,
상기 M개의 트레이닝 샘플들에 각각 대응하는 확률들을 데이터 피팅 모델의 입력 파라메터들로 하여 상기 데이터 피팅 모델의 출력 결과를 계산하는 조작,
만일 상기 출력 결과가 사전 설정 조건에 부합된다면, 상기a번째 수정 후의 사용자 파라메터 행렬 W_m _×k와 상기 a번째 수정 후의 태그 파라메터 행렬 H_k _×n을 각각 상기 최종 사용자 파라메터 행렬 W_m _×k와 상기 최종 태그 파라메터 행렬 H_k _×n로 확정하는 조작,
만일 상기 출력 결과가 사전 설정 조건에 부합되지 않는다면, 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k를 수정하여 a+1번째 수정 후의 사용자 파라메터 행렬 W_m _×k를 얻고 또한 상기 a번째 수정 후의 태그 파라메터 행렬 H_k _×n를 수정하여 a+1번째 수정 후의 태그 파라메터 행렬 H_k _×n을 얻으며, a=a+1으로 하고 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k와 상기 a번째 수정 후의 태그 파라메터 행렬 H_k _×n에 따라 상기 m명의 사용자들 중의 매 사용자의 상기 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산하는 단계로부터 상기 단계들을 다시 실행하는 조작을 진행하는데 이용되는 지령을 더 포함하는 것을 특징으로 하는장치.
청구항 20에 있어서,
상기 데이터 피팅 모델은,

이며, 여기서 상기 λ _W , λ _H 와 λ _S 는 오버 피팅을 방지하는데 쓰이는 정규화 파라메터이고, 상기 λ _W , λ _H 와 λ _S 는 양의 실수이고,
은 행렬의 2노르마이고, 상기 D _s 는 상기 M개의 트레이닝 샘플들의 세트를 나타내며, 상기 트레이닝 샘플 <u, i, j>에 대응하는 확률
이고, 상기
은 상기 사용자 u의 물품 i에 대한 선호 정도와 상기 사용자 u의 물품 j에 대한 선호 정도의 차값이고, 상기
는 로지스틱 함수이고, 상기 N _u 는 상기 사용자 u와 관련 사용자들의 세트이고, 상기 S _uv 는 사용자 유사도 행렬 S_m _×m의 제u행제v렬의 원소이고 상기 S _uv 는 상기 사용자 u와 사용자 v 사이의 유사도를 나타내고, 상기 W _u 가 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k의 제u행에 대응하는 행 벡터이고, 상기 W _v 가 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k의 제v행에 대응하는 행 벡터인 것을 특징으로 하는 장치.
청구항 21에 있어서,
상기 한개 혹은 여러개의 프로그램들이,
상기 m명의 사용자들 중의 매 사용자의 소셜 네트워크 정보를 얻는 것과,
상기 m명의 사용자들의 소셜 네트워크 정보에 따라 상기 사용자 유사도 행렬 S_m _×m을 생성하는 조작을 진행하는데 이용되는 지령을 더 포함하는 것을 특징으로 하는 장치.
청구항 21에 있어서,
상기 한개 혹은 여러개의 프로그램들이,
이하 공식

에 의해 상기 a+1번째 수정 후의 사용자 파라메터 행렬 W_m _×k를 계산하는 조작을 진행하는데 이용되는 지령을 더 포함하며,
여기서 상기
는 상기 a+1번째 수정 후의 사용자 파라메터 행렬 W_m _×k의 제u행에 대응하는 행 벡터이고, 상기
는 상기 a번째 수정 후의 사용자 파라메터 행렬 W_m _×k의 제u행에 대응하는 행 벡터이고, 상기
는 상기 a번째 수정 후의 태그 파라메터 행렬 H_k _×n의 제l렬에 대응하는 렬 벡터의 전치 벡터이고, 상기 l은 1≤l≤n인 정수이고, 상기
는 학습 효율이고, 상기
는 양의 실수인 것을 특징으로 하는 장치.
청구항 21에 있어서,
상기 한개 혹은 여러개의 프로그램들이,
이하 공식

에 의해 상기 a+1번째 태그 파라메터 행렬H_k _×n을 계산하는 조작을 진행하는데 이용되는 지령을 더 포함하며,
여기서 상기
는 상기 a+1번째 수정 후의 태그 파라메터 행렬 H_k _×n의 제f행에 대응하는 행 벡터이고, 상기
는 상기 a번째 수정 후의 태그 파라메터 행렬 H_k×n의 제f행에 대응하는 행 벡터이고, 상기 f는 1≤f≤k인 정수이고, 상기
는 학습 효율이고, 상기
는 양의 실수인 것을 특징으로 하는

장치.
청구항 19내지 청구항24 중의 어느 한항에 있어서,
상기 한개 혹은 여러개의 프로그램들이,
상기 사용자 행위 로그들에 따라 상기 m명의 사용자들 중의 매 사용자의 상기 h개의 물품들 중의 매 물품에 대한 행위 유형을 얻는 것과, 여기서 h는 1보다 큰 정수이고,
매 사용자의 매 물품에 대한 행위 유형에 따라 상기 M개의 트레이닝 샘플들을 얻는 조작을 진행하는데 이용되는 지령을 더 포함하는 갓을 특징으로 하는 장치.
청구항 19내지 청구항24 중의 어느 한항에 있어서,
상기 한개 혹은 여러개의 프로그램들이,
상기 초기화된 사용자 파라메터 행렬 W_m _×k와 상기 초기화된 태그 파라메터 행렬 H_k _×n을 생성하는 조작을 진행하는데 이용되는 지령을 더 포함하고,
여기서, 상기 초기화된 사용자 파라메터 행렬 W_m _×k의 원소들은 정규 분포를 띠는 난수이고, 상기 초기화된 태그 파라메터 행렬 H_k _×n의 원소들은 정규 분포를 띠는 난수들인 것을 특징으로 하는 장치.
청구항 19 내지 청구항24 중의 어느 한항에 있어서,
상기 한개 혹은 여러개의 프로그램들이,
상기 사용자 포트레이트 행렬 P_m _×n과 타겟 물품이 가지고 있는 태그들에 따라 상기 사용자 u의 상기 타겟 물품에 대한 선호 정도를 계산하는 조작을 진행하는데 이용되는 지령을 더 포함하는 것을 특징으로 하는 장치.