KR20180091043A - 사용자 포트레이트를 획득하는 방법 및 장치 - Google Patents

사용자 포트레이트를 획득하는 방법 및 장치 Download PDF

Info

Publication number
KR20180091043A
KR20180091043A KR1020187019164A KR20187019164A KR20180091043A KR 20180091043 A KR20180091043 A KR 20180091043A KR 1020187019164 A KR1020187019164 A KR 1020187019164A KR 20187019164 A KR20187019164 A KR 20187019164A KR 20180091043 A KR20180091043 A KR 20180091043A
Authority
KR
South Korea
Prior art keywords
user
parameter matrix
tag
matrix
preference
Prior art date
Application number
KR1020187019164A
Other languages
English (en)
Other versions
KR102122373B1 (ko
Inventor
멍핑 루
Original Assignee
텐센트 테크놀로지(센젠) 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 filed Critical 텐센트 테크놀로지(센젠) 컴퍼니 리미티드
Publication of KR20180091043A publication Critical patent/KR20180091043A/ko
Application granted granted Critical
Publication of KR102122373B1 publication Critical patent/KR102122373B1/ko

Links

Images

Classifications

    • G06F17/30867
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24317Piecewise classification, i.e. whereby each classification requires several discriminant rules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Biology (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Heterocyclic Carbon Compounds Containing A Hetero Ring Having Oxygen Or Sulfur (AREA)

Abstract

사용자 포트레이트를 획득하는 방법과 장치로서 정보 처리 기술분야에 속한다. 상기 방법은, 사용자 행위 로그들에 따라 상기 M개의 트레이닝 샘플들을 얻는 것(101), 여기서, 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하는데 이용하며 상기M은 양의 정수이고, M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 Wm ×k와 태그 파라메터 행렬 Hk ×n을 수정하여 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n을 얻는 것(102), 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n에 따라 사용자 포트레이트 행렬 Pm ×n을 얻는 것(103)을 포함한다. 사용자와 태그를 파라메터화하고, 데이터 피팅 모델을 이용하여 사용자 파라메터 행렬과 태그 파라메터 행렬을 수정하여 그것으로 트레이닝 샘플들을 피팅하므로서 태그에 상응한 태그 무게를 수동적으로 설정할 필요가 없고, 사용자의 행위 로그에 따라 데이터 피팅 방법을 이용하여 사용자 포트레이트를 자동적으로 획득하므로서 시간과 인력 원가를 절약하면서도 사용자 포트레이트를 정확하고 유효하게 얻는 기술 효과를 달성하였다.

Description

사용자 포트레이트를 획득하는 방법 및 장치
본 출원은 2016년 4월29일 중국특허국에 제출된 출원번호가 201610284124.6이고 발명명칭이 "사용자 포트레이트를 획득하는 방법 및 장치"인 중국특허출원의 우선권을 요구하며, 그의 전부 내용은 인용의 방식으로 본 출원에 결합된다.
본 발명의 실시예는 정보 처리 기술분야에 관한 것으로, 특히 사용자 포트레이트를 획득하는 방법 및 장치에 관한 것이다.
사용자 각색(Persona)이라고도 하는 사용자 포트레이트는 타겟 사용자를 묘사하고 사용자의 요구와 설계 방향을 연계시켜 주는 유효한 도구로서 여러 분야에서 광범히 응용되고 있다. 구체적인 실현 시 사용자 포트레이트는 사용자의 특징을 묘사하는 태그(tag) 세트으로 표시할 수 있는데 이 태그 세트은 사용자의 사회 속성, 생활 습관, 소비 행위 등의 각도에서 사용자의 특징을 묘사하는 태그들을 포함할 수 있다. 예를 들어, 연령과 성별, 지역, 학력과 사용자의 기호 등의 태그들이다.
종래 기술에서 사용자 포트레이트를 획득하는 방법을 제공하였다. 사전에 여러개의 태그들을 설정하고 매 태그에 상응한 태그 무게를 수동적으로 설정하는데, 여기서 태그 무게는 실제 응용의 요구나 경험에 따라 사전에 설정할 수 있다. 매 태그에 대하여 전체 물품들 중에서 이 태그를 구비한 물품들이 차지하는 점유율에 따라 이 태그에 대응하는 태그 무게를 설정할 수 있다. 일반적으로 상기 점유율과 태그 무게 사이에는 부의 상관 관계가 존재하는데 상기 점유율이 커지면 태그 무게는 작아지고 상기 점유율이 작아지면 태그 무게는 커진다. 다음 사용자 행위 로그들을 얻는다. 사용자의 행위 로그들에는 사용자가 매 물품에 대하여 실행한 각종 행위들이 기록되어 있는데, 예를 들면 사용자 1이 물품 1을 열람하였다는 것, 사용자 2가 물품 1을 구매했다는 것, 사용자 1이 물품 2를 구매하였다는 것 등이다. 그다음 매 물품이 구비한 태그와, 사용자가 매 물품에 대하여 실행한 행위에 따라 매 태그에 대한 사용자의 행위 무게를 확정한다. 끝으로 매 태그에 대응되는 태그 무게와 행위 무게에 따라 이 태그에 대한 사용자의 선호 정도를 계산하고 매 태그에 대한 사용자의 선호 정도를 정합하여 사용자의 포트레이트를 얻어낸다. 예를 들면, 어느 한 태그에 대한 사용자의 선호 정도는 이 태그의 대응하는 태그 무게와 행위 무게의 적으로 표시할 수 있다.
그러나 종래 기술들에서는 매 태그에 대하여 상응한 태그 무게들을 수동적으로 설정해야 하고 또한 태그의 수량이 항상 비교적 많은 것으로 하여 대량의 시간과 인력 자원을 소비하는 것이 필요하며, 사용자의 포트레이트를 얻는데 낭비되는 시간과 인력 원가가 비교적 높다. 또한 태그 무게의 수동 설정 방식에서는 오차를 피하기 어려운 것으로 하여 수동 설정된 태그 무게와 실제 업무가 부합된다는 것을 보증하기 힘들고 최종적으로 획득한 사용자의 포트레이트의 정확도가 비교적 낮은 결과가 초래되었다.
종래 기술에서 제공한 사용자 포트레이트 획득 방법들에서 낭비되는 시간과 인력 원가가 비교적 높고 획득한 사용자 포트레이트의 정확도가 비교적 낮은 문제를 해결하는 것이다. 본 발명의 실시예는 사용자 포트레이트를 획득하는 방법 및 장치를 제공하였는데, 상기 기술방안은 하기와 같다.
본 발명의 실시예의 첫째 측면에 따르면, 사용자 포트레이트 획득 방법을 제공하였는데, 상기 방법은,
사용자 행위 로그들에 따라 상기 M개의 트레이닝 샘플들을 얻는 것, 여기서, 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하는데 이용하며 상기M은 양의 정수이고,
상기 M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 Wm ×k와 초기화된 태그 파라메터 행렬 Hk ×n을 수정하여 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n을 얻는 것, 여기서,상기 m은 사용자의 수를 표시하고,상기 k는 인자의 수를 표시하고, 상기n은 태그의 수를 표시하고, 상기 m은 양의 정수이고, 성기 k는 양의 정수이고, 상기 n은 1보다 큰 정수이고,
상기 최종 사용자 파라메터 행렬 Wm ×k와 상기 최종 태그 파라메터 행렬 Hk ×n에 따라 상기 사용자 포트레이트 행렬 Pm ×n을 얻는 것을 포함하며, 여기서 상기 사용자 포트레이트 행렬 Pm ×n의 제u행제t렬의 원소 Put는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 상기u는 1≤u≤m인 정수이고, 상기 t는 1≤t≤n인 정수이다.
본 발명의 실시예의 둘째 측면에 따르면, 사용자 포트레이트 획득 장치를 제공하였는데, 상기 장치는,
사용자 행위 로그들에 따라 상기 M개의 트레이닝 샘플들을 얻는데 이용되는 샘플 획득 모듈과, 여기서, 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하는데 이용하며 성기 M은 양의 정수이고,
상기 M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 Wm ×k와 초기화된 태그 파라메터 행렬 Hk ×n을 수정하여 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n을 얻는데 이용되는 행렬 수정 모듈과, 여기서,상기 m은 사용자의 수를 표시하고, 상기 k는 인자의 수를 표시하고,상기 n은 태그의 수를 표시하고, m은 양의 정수이고,상기 k는 양의 정수이고,상기 n은 1보다 큰 정수이고,
상기 최종 사용자 파라메터 행렬 Wm ×k와 상기 최종 태그 파라메터 행렬 Hk ×n에 따라 사용자 포트레이트 행렬 Pm ×n을 얻는데 이용되는 포트레이트 획득 모듈을 포함하고, 여기서, 상기 사용자 포트레이트 행렬 Pm ×n의 제u행제t렬의 원소 Put는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 상기 u는 1≤u≤m인 정수이고, 상기 t는 1≤t≤n인 정수이다.
본 발명의 실시예의 셋째 측면에 따르면, 사용자 포트레이트를 획득하는 장치를 제공하였는데, 상기 장치는,
한개 혹은 여러개의 프로세서와,
상기 한개 혹은 여러개의 프로세서들과 상호 연결된 메모리를 포함하며, 상기 메모리에는 상기 한개 또는 여러개의 프로세서들에서 실행하도록 구성된 한개 혹은 여러개의 프로그램들이 기억되어 있고 상기 한개 혹은 여러개의 프로그램에는,
사용자의 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻는 조작과, 여기서, 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하는데 이용하며 상기M은 양의 정수이고,
상기 M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 Wm ×k와 초기화된 태그 파라메터 행렬 Hk ×n을 수정하여 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n을 얻는 조작, 여기서,상기 m은 사용자의 수를 표시하고,상기 k는 인자의 수를 표시하고, 상기n은 태그의 수를 표시하고, 상기 m은 양의 정수이고, 성기 k는 양의 정수이고, 상기 n은 1보다 큰 정수이고,
상기 최종 사용자 파라메터 행렬 Wm ×k와 상기 최종 태그 파라메터 행렬 Hk ×n에 따라 사용자 포트레이트 행렬 Pm ×n을 얻는 조작을 진행하는데 이용되는 지령들이 포함되어 있으며, 여기서 상기 사용자 포트레이트 행렬 Pm ×n의 제u행제t렬의 원소 Put는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 상기 u는 1≤u≤m인 정수이고, 상기 t는 1≤t≤n인 정수이다.
본 발명의 실시예가 제공하는 기술방안이 가져다 준 유익한 효과는,
사용자의 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻고, 상기 M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 Wm ×k와 태그 파라메터 행렬 Hk ×n을 수정하여 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n을 얻은 다음, 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n에 따라 사용자 포트레이트 행렬 Pm ×n을 얻는 것을 통하여, 종래 기술이 제공한 사용자 포트레이트 획득 방법들에서 시간과 비용이 낭비되는 문제와 획득한 사용자 포트레이트의 정확도가 비교적 낮은 문제들을 해결하였으며, 사용자와 태그를 파라메터화하고, 데이터 피팅 모델을 이용하여 사용자 파라메터 행렬과 태그 파라메터 행렬을 수정하여 그것으로 트레이닝 샘플들을 피팅하므로서 태그에 상응한 태그 무게를 수동적으로 설정할 필요가 없고, 사용자의 행위 로그에 따라 데이터 피팅 방법을 이용하여 사용자 포트레이트를 자동적으로 획득하므로서 시간과 인력 원가를 절약하면서도 사용자 포트레이트를 정확하고 유효하게 얻는 효과를 달성한 것을 포함한다.
본 발명의 실시예의 기술방안을 보다 정확하게 설명하기 위하여 이하 실시예의 서술에서 사용해야 할 도면들에 대하여 간단히 소개하는데, 분명히 할 것은 이하 서술 중의 도면은 단지 본 발명의 실시예들이며, 이 기술분야에서 당업자라면 창조성 노동을 들이지 않는 전제하에서 이 도면들에 따라 기타 도면을 획득할 수도 있다는 것이다.
도 1은 본 발명의 일 실시예가 제공하는 사용자 포트레이트 획득 방법의 흐름도이다.
도 2는 본 발명의 다른 일 실시예가 제공하는 사용자 포트레이트 획득 방법의 흐름도이다.
도 3은 도 2에서 보여준 실시예의 201 단계의 서브단계의 흐름도이다.
도4는 본 발명의 실시예가 제공하는 사용자 유사도 행렬을 생성하는 흐름도이다.
도 5는 본 발명의 일 실시예가 제공하는 사용자 포트레이트 획득 장치의 구조 골격도이다.
도 6은 본 발명의 다른 일 실시예가 제공하는 사용자 포트레이트 획득 장치의 구조 골격도이다.
도7은 본 발명의 일 실시예가 제공하는 서버의 구조 개략도이다.
본 발명의 목적, 기술방안과 우점들을 보다 명확히 하기 위하여, 본 발명의 실시 방식에 대하여 도면을 결합하여 이하 보다 상세히 설명하도록 한다.
이해를 도모하기 위하여, 우선 본문 중의 관련 있는 일부 명사들에 대하여 소개하고 설명한다.
물품
물품은 실체 물품과 가상 물품을 포함한다. 실체 물품은 실지 존재하는 물품을 가리키는 것으로서 사무, 생활 소비와 관련되는 물건, 예를 들어 의복, 음식물, 사무용품 등이며, 가상 물품은 현실 생활에서 만질 수 없는 물품들로서 각종 비디오, 오디오, 이미지, 응용 소프트웨어, 웨이 보와 같은 인터넷 제품이나 내용, 혹은 가상 네트워크 세계에서 유래되는 제품, 유희 도구, 회원, 아이콘 등이다.
태그
태그는 물품의 속성을 서술하는데 이용되는 키워드이다. 예를 들어, 의복의 태그에는 색갈로부터 모양, 크기 등의 측면을 서술하는 키워드가 포함될 수 있으며, 비디오의 태그에는 년도로부터 국가, 유형, 배우 등의 측면을 서술하는 키워드가 포함될 수 있으며, 유희 도구의 태그에는 분류로부터 기능 등의 측면을 서술하는 키워드가 포함될 수 있다.
사용자의 행위 유형
사용자의 행위 유형은 물품에 대하여 사용자가 실행하는 행위를 가리킨다. 예를 들어, 열람, 쇼핑, 수집, 삭제, 사용, 중계, 좋아하기, 깎아내림, 논평등이다. 서로 다른 물품들을 비추어 볼 때 사용자가 이 물품들에 대하여 실행할 수 있는 행위는 서로 같을 수도 있고 다를 수도 있다. 예를 들어 의복에 대하여 볼 때 이 물품에 대하여 사용자가 실행할 수 있는 행위에는 열람, 쇼핑, 수집 등이 포함될 수 있고, 비디오에 대하여 예를 들면 이 물품에 대하여 사용자가 실행할 수 있는 행위에는 열람, 프리뷰, 관람, 쇼핑, 수집 등이 포함될 수 있으며, 웨이 보에 대하여 예를 들면 이 물품에 대하여 사용자가 실행할 수 있는 행위에는 열람, 중계, 수집 등이 포함될 수 있다. 사용자의 행위 유형에는 또한 "미지" 유형도 선택적으로 포함될 수 있는데 이것은 물품에 대하여 사용자가 어떠한 행위들을 실행하지 않는 것을 표시하는데 이용된다. 물품에 대한 사용자의 행위 유형은 물품에 대한 사용자의 선호 정도를 반영하는데 2개의 물품에 대한 사용자의 행위 유형에 따라 이 2개의 물품에 대한 사용자의 선호 정도의 차이를 확정하면 된다.
본 발명의 실시예에 대한 상세한 해설에 앞서 먼저 본 발명의 실시예의 응용 상황에 대하여 소개한다. 사용자 포트레이트는 사용자의 특징을 묘사하는 태그 세트으로 표시할 수 있고 이 태그 세트은 사용자의 사회 속성, 생활 습관, 소비 행위 등의 각도에서 사용자의 특징을 묘사하는 태그들을 포함할 수 있으므로 이로 하여 사용자 포트레이트는 사용자의 특징을 가리키는데 이용할 수 있다. 사용자의 특징을 통하여 사용자의 기호와 습관 등을 확정할 수 있으므로 사용자의 포트레이트를 얻은 후 사용자의 포트레이트를 여러가지 응용 상황에 응용할 수 있다.
예를 들어, 한가지 응용 상황에서는 사용자 포트레이트에 따라 사용자의 기호를 확정하여 사용자에게 어떤 물품, 예를 들어, 의복, 식품, 전자 제품 등을 추천할 수 있다. 이런 방법으로 서로 다른 사용자에게 서로 다른 물품들을 추천할 수 있어 추천의 개성화를 실현하여 물품 추천의 정확도를 제고한다. 또 다른 한가지 응용 상황에서는 사용자 포트레이트에 따라 전자 제품 등에 대한 사용자의 사용 습관을 확정하고, 가령 사용자가 매번 얼마만 한 시간마다 전자 제품에 대한 안전성 체크를진행하는가, 또는 웹 페이지를 열람한 후 열람 흔적에 대한 청소를 진행하는 등을 확정하여 사용자의 사용 습관에 따라 이런 조작을 자동적으로 진행하므로서 사용자의 수동 조작을 없애여 사용자 점성을 제고한다.
물론 실제 응용에서 사용자 포트레이트는 기타 상황에서도 응용할 수 있는데 본 발명의 실시예는 상기 두가지 응용 상황들을 예를 들어 설명하였으며, 여기서 기타 상황들에 대하여 일일이 더 열거하지 않는다.
본 발명의 실시예가 제공한 방법에서 매 단계의 실행 주체는 서버와 같이 데이터 기억과 계산 기능이 구비된 전자 설비일 수 있다. 이하 서술하는 방법의 실시예에서는 매 단계의 실행 주체가 서버인 경우를 예를 들어 설명하였지만 이에 대해 제한하지 않는다.
도 1에서는 본 발명의 일 실시예가 제공하는 사용자 포트레이트 획득 방법의 흐름도를 도시하였다. 이 방법은 이하 몇개의 단계들을 포함할 수 있다.
사용자 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻고, 여기서 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하며 M은 양의 정수인 101 단계.
M개의 트레이닝 샘플들에 따라 데이터 피팅(fitting) 모델을 이용하여 초기화된 사용자 파라메터 행렬 Wm ×k와 초기화된 태그 파라메터 행렬 Hk ×n을 수정하여 최종 사용자 파라메터 행렬 Wm×k와 최종 태그 파라메터 행렬 Hk×n을 얻는102 단계.
여기서 m은 사용자의 수를 표시하는 양의 정수이고, k는 인자의 수를 표시하는 양의 정수이고, n은 태그의 수를 표시하는 1보다 큰 정수이다.
최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n에 따라 사용자 포트레이트 행렬 Pm ×n을 얻는 103단계.
여기서 사용자 포트레이트 행렬 Pm ×n의 u행t렬의 원소 Put는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 u와 t는 1≤u≤m, 1≤t≤n인 정수들이다.
요약하면, 본 실시예가 제공하는 방법에서는 사용자 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻고, 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 Wm ×k와 태그 파라메터 행렬 Hk ×n을 수정하여 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n을 얻은 다음, 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n에 따라 사용자 포트레이트 행렬 Pm ×n을 얻는 것을 통하여, 종래 기술이 제공한 사용자 포트레이트 획득 방법들에서 제기되는 낭비되는 시간과 인력 원가가 비교적 높은 문제와 획득한 사용자 포트레이트의 정확도가 비교적 낮은 문제를 해결하였으며, 사용자와 태그를 파라메터화하고, 데이터 피팅 모델을 이용하여 사용자 파라메터 행렬과 태그 파라메터 행렬을 수정하여 그것으로 트레이닝 샘플들을 피팅하므로서 태그에 상응한 태그 무게를 수동적으로 설정할 필요가 없고, 사용자의 행위 로그에 따라 데이터 피팅 방법을 이용하여 사용자 포트레이트를 자동적으로 획득하므로서 시간과 인력 원가를 절약하면서도 사용자 포트레이트를 정확하고 유효하게 얻는 기술 효과를 달성하였다.
도 2에서는 본 발명의 다른 일 실시예가 제공한 사용자 포트레이트 획득 방법의 흐름도를 도시하였다. 본 실시예에서는 매 단계의 실행 주체가 서버인 경우를 예를 들어 설명한다. 이 방법은 이하 몇개의 단계들을 포함할 수 있다.
사용자 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻는 201 단계.
트레이닝 샘플은 <u, i, j>에 의해 표시하고 트레이닝 샘플<u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하며 M은 양의 정수이다.
사용자 행위 로그는 사용자의 물품에 대한 조작 행위를 기록하는데 이용된다. 사용자 행위 로그에는 사용자 표식과 사용자의 행위 유형, 물품 표식과 물품 태그 정보들이 포함된다. 여기서 사용자 표식은 사용자 신분을 식별하는데 이용되는 표식 번호로서, 사용자 계정 번호라고도 부르며 어떤 시스템에서 상대적으로 유일한 코드이다. 사용자의 행위 유형은 사용자가 물품에 대하여 실행하는 행위들을 가리키는데 예하면 열람, 쇼핑, 수집, 삭제, 사용, 중계, 좋아하기, 깎아내림, 논평, 미지 등을 들 수 있다. 사용자의 행위 유형의 종류는 실제 응용의 요구에 따라 설정할 수 있다. 물품 표식은 사용자 표식과 유사한데 물품의 표식 번호를 식별하는데 이용된다. 매 물품에는 대응되는 유일한 물품 표식이 존재한다. 물품 태그 정보는 물품의 속성에 대한 키워드를 가리키는데 이용되며 한개 물품은 한개 또는 여러개의 태그를 포함할 수 있다. 사용자 행위 로그들을 얻는 방식에는 서버가 단말에서의 사용자의 조작 행위들을 수집하거나 단말에서 서버에 사용자의 조작 행위들을 보고하는 방식들이 있다.
트레이닝 샘플 <u, i, j>는 사용자 u의 물품 i와 물품 j에 대한 선호 정도의 차이를 반영한다. 가능한 실시방식에서는 트레이닝 샘플 <u, i, j>를 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 크다는 것을 반영하는데 이용하며, 다른 가능한 실시방식에서는 트레이닝 샘플 <u, i, j>를 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 작다는 것을 반영하는데 이용된다. 물품에 대한 사용자의 행위 유형은 물품에 대한 사용자의 선호 정도를 반영하며 두가지 물품에 대한 사용자의 행위 유형에 따라 이 두가지 물품에 대한 사용자의 선호 정도의 차이를 확정하면 된다.
사용자의 지불 비용에 따라 행위 유형의 무게에 대한 기준을 결정할 수 있으며 행위 유형의 무게에 따라 전체 행위 유형들 사이의 상대적 크기 관계를 확정할 수 있다. 예를 들면, "구매" 행위 유형의 무게는 "열람" 행위 유형의 무게보다 크다. 만일 사용자가 물품에 대하여 아직 어떠한 행위를 실행하지 않는다면 사용자의 행위 유형은 "미지" 유형으로 된다. 일반적으로 말한다면 사용자가 모종의 행위를 실행한 물품에 대한 사용자의 선호 정도는 어떠한 행위도 실행하지 않은 물품에 대한 선호 정도보다 크며, 따라서 "미지" 행위 유형의 무게는 최소로서 "열람", "구매" 행위 유형의 무게보다 작다. 예를 들면, 사용자 u가 물품 i에 대하여 모종의 행위를 실행하고 물품 j에 대하여 그 어떤 행위도 실행하지 않았다면 물품 i에 대한 사용자 u의 선호 정도는 물품 j에 대한 선호 정도보다 크다.
예하면 트레이닝 샘플 <u, i, j>는 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 크다는 것을 반영하는데 이용되는 경우 만일 사용자 u가 물품 i를 좋아하는 정도가 물품 j를 좋아하는 정도보다 크다면 얻어진 트레이닝 샘플은 <u, i, j>이며 이와 반대인 경우에 얻어지는 트레이닝 샘플은 <u, j, i>이다. 예를 들면 사용자 u가 물품 i를 구매하고 물품 j를 열람하였다면 획득한 트레이닝 샘플은 <u, i, j>이며, 사용자 u가 물품 i를 열람하고 물품 j를 구매하였다면 획득한 트레이닝 샘플은 <u, j, i>이다. 또한 사용자가 물품 i를 열람하고 물품 j에 대하여 그 어떤 행위도 실행하지 않았다면 획득한 트레이닝 샘플은 <u, i, j>이다. 한명의 사용자에 대하여 한개 혹은 여러개의 트레이닝 샘플들을 획득할 수 있으며 만일 사용자 1이 물품 2를 열람하고 물품 1, 물품 3과 물품 4에 대하여 그 어떤 행위도 실행하지 않았다면 얻어진 트레이닝 샘플들에는 <1, 2, 1>, <1, 2, 3>, <1, 2, 4>가 포함된다.
가능한 실시방식에서는, 도 3에 도시한 바와 같이 201단계는 이하 여러개의 서브단계들을 포함할 수 있다.
사용자 행위 로그들에 따라 m명의 사용자들 중의 매 사용자의 h개의 물품들 중의 매 물품에 대한 행위 유형을 얻는 201a 단계.
여기서 m은 사용자의 수를 나타내는 양의 정수이고, h는 물품의 수를 나타내는 1보다 큰 정수이다.
매 사용자의 매 물품에 대한 행위 유형에 따라 M개의 트레이닝 샘플들을 얻는 201b 단계.
가능한 실시방식으로서, 201b 단계는 이하의 것을 포함할 수 있다.
1. 사용자의 행위 유형에 따라 사용자 물품 행렬을 얻는 것.
선택적으로, 사용자 물품 행렬을 Rm ×h으로 표시하고 사용자 물품 행렬 Rm ×h의 행은 사용자를, 렬은 물품을 표시하면 m은 사용자의 수를, h는 물품의 수를, 원소 Rui는 사용자 u가 물품 i에 대하여 모종의 행위를 실행하였는가를 가리킨다. 예를 들어 사용자 물품 행렬 Rm ×h의 원소들을 0이나 1로 표시하면 1은 사용자가 물품에 대하여 모종의 행위를 실행하였음을 가리키며, 0은 사용자가 물품에 대하여 그 어떤 행위도 실행하지 않았음을 가리킨다. 예를 들어 사용자의 수가 3이고 물품의 수가 4일 때 사용자 물품 행렬 Rm ×h
Figure pct00001
이며, 여기서 1행2렬의 1은 사용자 1이 물품 2에 대하여 모종의 행위를 실행하였음을 보여준다.
2. 사용자의 행위 유형과 사용자 물품 행렬에 따라 M개의 트레이닝 샘플들을 얻는 것.
사용자 물품 행렬에 따라 사용자가 물품에 대하여 모종의 행위를 실행하였는가를 알수 있고 사용자 u에 대하여 행위 유형에 따라 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 큰가하는 것을 확정할 수 있으므로 한개의 트레이닝 샘플을 얻는다. 예를 들어 사용자 물품 행렬 R3×4의 1행으로부터 사용자 1이 물품 2에 대하여 모종의 행위를 실행하였다는 것과 사용자 1이 물품 1, 물품 3과 물품 4에 대하여 그 어떤 행위도 실행하지 않았다는 것을 알고 있으므로 트레이닝 샘플 <u, i, j>을 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 크다는 것을 반영하는데 이용되는 예에서는 얻어진 사용자 1의 트레이닝 샘플에 <1, 2, 1>, <1, 2, 3>, <1, 2, 4>들이 포함된다.
설명할 필요가 있는 것은, 일반적인 정황하에서 사용자가 모종의 행위를 실행한 물품에 대한 사용자의 선호 정도가 그 어떤 행위도 실행하지 않은 물품에 대한 선호 정도보다 크다는 것이다. 그러나 기타 가능한 정황하에서는 사용자가 모종의 행위를 실행한 물품에 대한 사용자의 선호 정도가 그 어떤 행위도 실행하지 않은 물품에 대한 선호 정도보다 작을 수도 있다. 물품이 비디오인 경우의 예에서 비디오 A에 대하여 사용자가 깎아내림 행위를, 비디오 B에 대하여서는 그 어떤 행위도 실행하지 않았다면 비디오 A에 대한 사용자의 선호 정도가 비디오 B에 대한 선호 정도보다 작다고 인식한다.
이외에 사용자의 수가 m이고, 물품의 수가 h이므로 리론상
Figure pct00002
개의 샘플들을 만들 수 있으며 실제 조작 시 샘플링 방식을 이용하여 상기
Figure pct00003
개의 샘플들 중에서 비교적 믿음성있는 일부 샘플들을 선택하여 트레이닝 샘플들로 이용된다. 예를 들어, 사용자 u가 물품 i와 j에 대하여 그 어떤 행위도 실행하지 않았거나 사용자 u가 물품 i와 물품 j에 대하여 실행한 행위의 유형이 같다면 사용자 u의 물품 i와 물품 j에 대한 선호 정도의 차이가 명확하 지 않으며 이런 유형의 샘플들은 트레이닝 샘플로 이용할 수 없다. 또 다른 예를 들면 매 물품의 실행 가능성을 얻을 수 있다. 한개 물품에 대한 실행 가능성은 사용자가 이 물품에 대하여 행위를 실행할 가능성을 가리킨다. 실행 가능성은 전체 시스템에서 물품의 출현 확률, 유행도, 추천도, 전시 등급 등의 요인을 따라 확정할 수 있다. 예를 들어, 전체 시스템에서 물품의 출현 확률이 점점 커지고 사용자가 이 물품을 아주 쉽게 얻게 된다면 이 물품의 실행 가능성은 점점 커지며, 반대로 전체 시스템에서 물품의 출현 확률이 점점 작아지고 사용자가 이 물품을 얻기가 아주 힘들다면 이 물품의 실행 가능성은 점점 작아진다. 트레이닝 샘플들을 얻을 때 만일 한명의 사용자 u가 행위를 실행한 물품과 한명의 사용자 u가 행위를 실행하지 않은 물품을 선택하여 트레이닝 샘플을 만든다면 사용자 u가 행위를 실행하지 않은 물품들 중에서 실행 가능성이 비교적 큰 물품들을 선택하여 트레이닝 샘플들을 만들 수 있다. 상기 방식을 통하여 얻은 트레이닝 샘플들은 2개의 물품에 대한 사용자의 선호 정도의 차이를 보다 정확하게 반영한다는 것을 담보하며 트레이닝 샘플의 오차 위험을 줄이고 믿음성을 제고할 수 있다.
초기화된 사용자 파라메터 행렬 Wm ×k와 초기화된 태그 파라메터 행렬 Hk ×n을 발생시킨 202단계.
여기서 m은 사용자의 수를 표시하는 양의 정수이고, k는 인자의 수를 표시하는 양의 정수이고, n은 태그의 수를 표시하는 1보다 큰 정수이다. 가능한 실시방식에서는 정규 분포를 띠는 난수 발생 방식을 이용하여 초기화된 사용자 파라메터 행렬 Wm ×k와 태그 파라메터 행렬 Hk ×n을 구성한다. 초기화된 사용자 파라메터 행렬 Wm ×k 중의 원소들이 정규 분포를 띠는 난수들이고, 초기화된 태그 파라메터 행렬 Hk ×n 중의 원소들도 정규 분포를 띠는 난수들이다.
선택적으로, 인자의 수인 k의 값은 미리 설정할 수도 있거나 또는 많은 실험을 통하여 얻은 경험값으로 정할 수도 있다.
선택적으로,정규 분포의 평균값은 0으로 정하며 분산(variance)은 0.01로 설정할 수 있다.
예시적으로, 임의로 생성된 사용자 파라메터 행렬 Wm ×k와 태그 파라메터 행렬 Hk ×n은 하기와 같다.
Figure pct00004
여기서 사용자 파라메터 행렬 Wm ×k의 매 행은 한 사용자의 인자 벡터에 대응하고, 태그 파라메터 행렬 Hk ×n의 매 렬은 한개 태그의 인자 벡터에 대응한다.
이하 203 단계 ~ 207단계를 통하여 초기화된 사용자 파라메터 행렬 Wm ×k와 초기화된 태그 파라메터 행렬 Hk ×n을 수정한다. 우선 a=0이라고 하고 이하203 단계를 실행한다.
a번째 수정 후의 사용자 파라메터 행렬 Wm ×k와 a번째 수정 후의 태그 파라메터 행렬 Hk ×n에 따라 m명의 사용자들 중의 매 사용자의 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산하는 203 단계.
여기서 a는 0과 같거나 큰 정수이며 0번째 수정 후의 사용자 파라메터 행렬 Wm×k는 초기화된 사용자 파라메터 행렬 Wm ×k로 하고, 0번째 수정 후의 태그 파라메터 행렬 Hk×n은 초기화된 태그 파라메터 행렬 Hk ×n로 한다.
a=0일 때 초기화된 사용자 파라메터 행렬 Wm ×k와 초기화된 태그 파라메터 행렬 Hk ×n에 따라 m개 사용자 중의 매 사용자의 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산한다.
선택적으로, 사용자 u의 태그 t에 대한 선호 정도 계산 공식은 하기와 같다.
Figure pct00005
예를 들어, 상기 예시적으로 초기화된 사용자 파라메터 행렬 W와 초기화된 태그 파라메터 행렬 H에서 사용자 1의 태그 1에 대한 선호 정도는
Figure pct00006
이며, 사용자 3의 태그 5에 대한 선호 정도는
Figure pct00007
이다.
m명의 사용자들 중의 매 사용자의 n개의 태그들 중의 매 태그에 대한 선호 정도와 물품 태그 행렬 Ah×n에 따라 m명의 사용자들 중의 매 사용자의 h개의 물품들 중의 매 물품에 대한 선호 정도를 계산하는 204 단계.
초기화된 사용자 파라메터 행렬 Wm ×k와 초기화된 태그 파라메터 행렬 Hk ×n에 따라 매 사용자의 매 태그에 대한 선호 정도를 계산해낸 후 물품 태그 행렬을 결합한데 따라 m명의 사용자들 중의 매 사용자의 h개의 물품들 중의 매 물품에 대한 선호 정도를 계산한다.
여기서 물품 태그 행렬Ah ×n은 사용자 행위 로그에 포함한 물품 표식과 물품 태그들에 따라 얻어진 행렬이다.
선택적으로, 물품 태그 행렬 Ah×n의 행은 물품을, 렬은 태그를 가리킨다. 예시적으로,물품 태그 행렬 Ah×n 중의 원소들을 0이나 1로 표시한다. 0은 물품이태그가 서술하는속성을 가지고 있지 않다는 것을 가리키며, 1은 물품이태그가 서술하는 속성을 가지고 있다는 것을 가리킨다. 물품의 개수는 4, 태그의 개수는 5라고 하면 예에서 보여준 물품 태그 행렬 Ah×n
Figure pct00008
이며, 여기서 물품 태그 행렬 A1 물품 태그 행렬의 1행을 표시하고 물품 1이 태그 1과 태그 2가 서술하는 속성을 가지고 있다는 것과, 물품 1이 태그 3, 태그 4, 태그 5가 서술하는 속성을가지고 있지 않다는 것을 알수 있다.
사용자가 어떤 물품을 좋아한다면 일반적으로 이 물품은 사용자가 선호한다는 태그(즉 태그가 서술하는 속성)를 가지고 있으므로, 물품에 대한 사용자의 선호는 이 물품이 가지고 있는 태그들에 대한 사용자의 선호 정도의 종합으로 볼 수 있다. 사용자 u의 물품 i에 대한 선호 정도는 물품 i가 가지고 있는 태그들에 대한 사용자 u의 선호 정도에 따라 계산된다.
선택적으로, 본 발명의 실시예에서는 물품 i가 가지고 있는 태그들에 대한 사용자 u의 선호 정도를 합계하여 물품 i에 대한 사용자 u의 선호 정도를 계산하고 계산공식은
Figure pct00009
이다.
예를 들어, 상기와 같이 예시적으로 초기화된 사용자 파라메터 행렬 Wm ×k와 초기화된 태그 파라메터 행렬 Hk ×n 중에서 물품 1에 대한 사용자 1의 선호 정도는
Figure pct00010
이고 물품 2에 대한 사용자 3의 선호 정도는
Figure pct00011
이다.
m명의 사용자들 중의 매 사용자의 h개 물품들 중의 매 물품에 대한 선호 정도에 따라 매 트레이닝 샘플에 대응하는 확률을 얻는 205 단계.
여기서 트레이닝 샘플 <u, i, j>에 대응하는 확률은 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 클 확률이다.
선택적으로,사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 클 확률에 대한 계산 과정은 하기와 같다.
단계 1. 계산된 매 물품에 대한 매 사용자의 선호 정도에 따라 물품 i에 대한 사용자 u의 선호 정도와 물품 j에 대한 사용자 u의 선호 정도의 차값
Figure pct00012
을 계산한다.
단계 2. 로지스틱 함수
Figure pct00013
에 따라 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 클 확률
Figure pct00014
을 계산한다.
M개의 트레이닝 샘플들에 각각 대응하는 확률들을 데이터 피팅 모델의 입력 파라메터로 하여 데이터 피팅 모델의 출력 결과를 계산하는 206 단계.
선택적으로,데이터 피팅 모델은 베이즈 최대 피팅 추정(Bayesian maximum fitting estimation) 방법을 이용하여 구성한 모델로서 구체적인 데이터 피팅 모델을 이하 보여준다.
Figure pct00015
여기서 λ W , λ H λ S 는 양의 실수로서 오버 피팅을 방지하는데 쓰이는 정규화 파라메터이고,
Figure pct00016
는 행렬의 2노르마이며, D s 는 M개의 트레이닝 샘플들의 세트를 가리킨다. 트레이닝 샘플 <u, i, j>에 대응하는 확률은
Figure pct00017
이며
Figure pct00018
은 사용자 u의 물품 i에 대한 선호 정도와 물품 j에 대한 선호 정도의 차값이고,
Figure pct00019
는 로지스틱 함수를 가리키며, N u 는 사용자 u와 관련 사용자 세트를 나타낸다. S uv 는 사용자 유사도 행렬 S m ×m 의 u행v렬의 원소로서 사용자 u와 사용자 v 사이의 유사도를 나타낸다. W u 는 상기 a번째 수정 후의 사용자 파라메터 행렬Wm ×k의 u행에 대응하는 행 벡터이며 W v 는 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k의 v행에 대응하는 행 벡터이다.
N u 는 사용자 u의 관련 사용자 세트를 가리키며 사용자 u와 관련 관계가 있는 기타 사용자들의 세트를 가리킨다. 여기서 관련 관계는 친구 관계일 수 있다. 예를 들어, 어느 한 사용자 v와 사용자 u가 소셜 유형의 응용 중의 친구라면 사용자 u와 사용자 v 사이에는 우호 관계가 존재하며 사용자 u와 사용자 v는 관련 사용자들이거나 혹은 관련 관계는 비 친구 관계일 수도 있다. 예를 들어, 소셜 유형의 응용 중의 같은 그룹에 속해있다면 사용자 u와 사용자 v는 관련 사용자들이라고 한다. 설명할 필요가 있는 것은, 사용자 유사도 행렬 S m ×m 을 구성할 때 사용자 유사도 행렬 S m ×m 의 임의의 두명의 사용자들은 친구 관계를 가지고 있는 사용자들일 수도 있고 친구 관계를 이루지 못한 사용자들(동일한 그룹에 속해있으면서 전혀 모르는 사이인 낯선 사용자)일 수도 있다는 것이다.
사용자 유사도 행렬 Sm ×m에는 m명의 사용자들 중 2명의 사용자들 사이의 유사도가 포함된다. 선택적으로, 행렬 S의 대각 원소들을 Suu = 0으로 하고, 끝으로 행에 따라정규화(normalization)를 진행하여
Figure pct00020
이 되도록 한다.
만일 출력 결과가 사전 설정 조건에 부합되지 않는다면 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k를 수정하여 a+1번째 수정 후의 사용자 파라메터 행렬 Wm ×k를 얻으며 또한 a번째 수정 후의 태그 파라메터 행렬 Hk ×n를 수정하여 a+1번째 수정 후의 태그 파라메터 행렬 Hk ×n을 얻고 a=a+1로 하고 상기 203 단계 ~ 206 단계를 실행하는 207 단계.
사전 설정 조건에는 본 순환의 출력 결과와 이전 순환의 출력 결과 사이의 차값이 예정 역치(threshold)보다 작다는 것과/혹은 사용자 파라메터 행렬과 태그 파라메터 행렬들에 대한 수정 회수가 예정 회수에 이르렀다는 것이 포함된다. 여기서 예정 역치과 예정 회수는 수정 정도와 수정 효율을 종합하게 고려한 후에 설정한다.
선택적으로,a번째 수정 후의 사용자 파라메터 행렬 Wm ×k에 따라 이하 공식에 의해 a+1번째 수정 후의 사용자 파메터 행렬 Wm ×k를 계산할 수 있다.
Figure pct00021
여기서
Figure pct00022
는 a+1번째 수정 후의 사용자 파라메터 행렬 Wm ×k의 u행에 대응하는 행 벡터이며
Figure pct00023
는 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k의 u행에 대응하는 행 벡터,
Figure pct00024
는 a번째 수정 후의 태그 파라메터 행렬 Hk ×nl렬에 대응하는 렬 벡터의 전치(轉置) 벡터를 가리킨다. l은 1≤l≤n인 정수이다.
Figure pct00025
는 정의 실수로서 학습 효율을 나타낸다.
Figure pct00026
는 미리 설정한 경험값인데 수정 속도와 수정 정확도를 종합하게 고려한 후 설정할 수 있다. 선택적으로,a번째 수정 후의 태그 파라메터 행렬 Hk ×n에 따라 이하 공식에 의해 a+1번째 수정 후의 태그 파라메터 행렬 Hk×n을 계산할 수 있다.
Figure pct00027
여기서,
Figure pct00028
는 a+1번째 수정 후의 태그 파라메터 행렬 Hk ×n의 f행에 대응하는 행 벡터를 가리키며,
Figure pct00029
는 a번째 수정 후의 태그 파라메터 행렬 Hk ×n의 f행에 대응하는 행 벡터를 가리킨다. f는 1≤f≤k인 정수이다.
Figure pct00030
는 양의 실수로서 학습 효율을 나타낸다.
Figure pct00031
는 미리 설정한 경험값인데 수정 속도와 수정 정확도를 종합하게 고려한 후 설정할 수 있다.
매번의 수정 과정에 M개의 트레이닝 샘플들 중의 매 트레이닝 샘플에 대응하는
Figure pct00032
들을 하나하나 차례로 상기 공식에 대입하여 사용자 파라메터 행렬과 태그 파라메터 행렬에 대하여 M차의 수정을 진행한다.
즉 사용자 파라메터 행렬과 태그 파라메터 행렬에 대한 a번째 수정 과정에 x=1로 하고 제x개의 트레이닝 샘플에 대응하는
Figure pct00033
과 제 x-1차 수정 후의 사용자 파라메터 행렬과 제x-1차 수정 후의 태그 파라메터 행렬을 상기 사용자 파라메터 행렬의 수정 공식에 대입하여 제x차 수정 후의 사용자 파라메터 행렬을 계산하고,제 x개의 트레이닝 샘플들에 대응하는
Figure pct00034
을 제x-1차 수정 후의 태그 파라메터 행렬과 제x차 수정 후의 사용자 파라메터 행렬을 상기 태그 파라메터 행렬의 수정 공식에 대입하여 제x차 수정 후의 태그 파라메터 행렬을 계산하며, x=x+1로 하고 x가 M보다 크지 않은가를 체크하고, 만일 크지 않다면, 상기 제x개의 트레이닝 샘플들에 대응하는
Figure pct00035
과 제x-1차 수정 후의 사용자 파라메터 행렬과 제x-1차 수정 후의 태그 파라메터 행렬을 상기 사용자 파라메터 행렬의 수정 공식에 대입하여 제x차 수정 후의 사용자 파라메터 행렬을 계산하는 단계를 실행하기 시작하며, 만일 크다면 이 공정을 결속하고, a번째 수정을 완성한다. 여기서 제0차 수정 후의 사용자 파라메터 행렬은 a-1번째 수정 후의 사용자 파라메터 행렬이며, 0번째 수정 후의 사용자 파라메터 행렬은 바로 초기화된 사용자 파라메터 행렬로, a번째 수정 과정에서 얻어진 제M차 수정 후의 사용자 파라메터 행렬은 바로 a번째 수정 후의 사용자 파라메터 행렬로 되며, 제0차 수정 후의 태그 파라메터 행렬은 a-1번째 수정 후의 태그 파라메터 행렬이고, 0번째 수정 후의 태그 파라메터 행렬은 바로 초기화된 태그 파라메터 행렬로, a번째 수정 과정에 얻어진 제M차 수정 후의 태그 파라메터 행렬은 a번째 수정 후의 태그 파라메터 행렬로 된다.
만일 출력 결과가 사전 설정 조건에 부합된다면 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k와 a번째 수정 후의 태그 파라메터 행렬 Hk ×n을 각각 최종 사용자 파라메터 행렬 Wm×k와 최종 태그 파라메터 행렬 Hk×n로 확정하는 208 단계.
데이터 피팅 모델의 출력 결과가 사전 설정 조건에 부합될 때 사용자 파라메터 행렬 Wm ×k와 태그 파라메터 행렬 Hk × n에 대한 수정을 중지하고, 현재의 사용자 파라메터 행렬 Wm ×k을 최종 사용자 파라메터 행렬 Wm ×k로 확정하고, 현재의 태그 파라메터 행렬 Hk×n을 최종 태그 파라메터 행렬 Hk×n로 확정한다.
최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n에 따라 사용자 포트레이트 행렬 Pm ×n을 얻는 209 단계.
여기서 사용자 포트레이트 행렬 Pm ×n의 u행t렬의 원소 Put는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 u와 t는 각각 1≤u≤m, 1≤t≤n인 정수들이다.
사용자 파라메터 행렬과 태그 파라메터 행렬을 반복 수정한 후, 최종 사용자 파라메터 행렬과 최종 태그 파라메터 행렬을 얻고 최종 사용자 파라메터 행렬과 최종 태그 파라메터 행렬에 따라 태그에 대한 사용자의 선호 정도를 출력한다.
예시적으로, 트레이닝 샘플들을 피팅시켜 얻은 최종 사용자 파라메터 행렬과 최종 태그 파라메터 행렬들이 각각
Figure pct00036
이라고 할 때 계산 결과로 얻어진 사용자 포트레이트 행렬은
Figure pct00037
이다.
선택적으로, 본 실시예가 제공하는 방법은 이하 210 단계를 더 포함할 수 있다.
얻어진 사용자 포트레이트 행렬 Pm ×n과 타겟 물품이 가지고 있는 태그들에 따라 사용자 u의 타겟 물품에 대한 선호 정도를 계산하는 210 단계.
요약하면, 본 실시예가 제공하는 방법에서는 사용자 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻고, M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 Wm ×k와 태그 파라메터 행렬 Hk ×n을 수정하여 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n을 얻은 다음, 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n에 따라 사용자 포트레이트 행렬 Pm ×n을 얻는 것을 통하여, 종래 기술이 제공한 사용자 포트레이트 획득 방법들에서 제기되는 낭비되는 시간과 인력 원가가 비교적 높은 문제와 획득한 사용자 포트레이트의 정확도가 비교적 낮은 문제를 해결하였으며, 사용자와 태그를 파라메터화하고, 데이터 피팅 모델을 이용하여 사용자 파라메터 행렬과 태그 파라메터 행렬을 수정하여 그것으로 트레이닝 샘플들을 피팅하므로서 태그에 상응한 태그 무게를 수동적으로 설정할 필요가 없고, 사용자의 행위 로그에 따라 데이터 피팅 방법을 이용하여 사용자 포트레이트를 자동적으로 획득하므로서 시간과 인력 원가를 절약하면서도 사용자 포트레이트를 정확하고 유효하게 얻는 기술 효과를 달성하였다.
이외에, 기계 학습 방식을 이용하여 사용자 파라메터 행렬과 태그 파라메터 행렬에 대한 수정을 진행하므로서 트레이닝 샘플들을 피팅하므로서 사용자 포트레이트를 자동적으로 획득하고 그 정확성과 유효성을 더욱 제고하였다.
이외에, 물품들을 부류별로, 사람들을 컬렉션으로 분류하는 아이디어에 기초하여 유사도가 아주 높은, 즉 기호가 매우 비슷한 2명의 사용자들에 대하여, 데이터 피팅 모델에서 제약 조건으로서 사용자 유사도 행렬을 증가시키므로서 단순히 사용자 행위 로그들에 의거하여서만 사용자 포트레이트를 얻는 것이 아니라 사용자 파라메터 행렬의 수정시 사용자 유사도 행렬을 고려하여 사용자의 파라메터 벡터와 그의 관련 사용자의 사용자 파라메터 벡터 사이의 강한 상관성을 체현하므로서 사용자 포트레이트 획득의 정확성을 더욱 제고하였다.
도 4에 도시한 바와 같이 이하 단계를 통하여 유사도 행렬 Sm ×m을 얻을 수 있다.
m명의 사용자들 중의 매 사용자의 소셜 네트워크 정보를 얻는 401 단계.
소셜 네트워크 정보에는 사용자 표식, 사용자의 관련 사용자 리스트, 사용자와 관련사용자 사이의 유사도가 포함된다.
여기서 사용자 표식은 사용자 신분을 식별하는 표식 번호로서 사용자 계정 번호라고도 부르며 어떤 시스템에서 상대적으로 유일한 코드이다. 사용자의 관련 사용자 리스트에는 사용자의 매 관련 사용자, 즉 사용자와 관련 관계를 가지고 있는 기타 사용자들도 포함된다. 사용자와 관련 사용자들 사이의 유사도는 사용자와 관련 사용자들 사이의 상관성을 가리킨다. 여기서 사용자와 관련 사용자들 사이의 유사도는 이하 한개 항목, 또는 여러 항목의 파라메터들에 따라 확정할 수 있다. 사용자와 관련 사용자 사이의 교제 회수, 사용자와 관련 사용자 사이의 관계가 친구 관계인가, 사용자와 관련 사용자 사이가 같은 사교권을 가지고 있는가, 사용자와 관련 사용자 사이가 같은 인구 속성을 가지고 있는가, 사용자와 관련 사용자 사이가 같은 기호를 가지고 있는가 등등이다.
m명의 사용자의 소셜 네트워크 정보들에 따라 사용자 유사도 행렬 Sm ×m을 생성하는 402 단계.
m명의 사용자의 소셜 네트워크 정보에 따라 두 사용자 사이의 유사도를 얻고 사용자 유사도 행렬 Sm ×m을 생성한다. 사용자 유사도 행렬 Sm ×m의 행과 렬은 사용자들을 가리킨다. 예하면 사용자 유사도 행렬 Sm ×m의 2행3렬은 사용자 2와 사용자 3 사이의 유사도를 가리킨다.
예시적으로, 사용자의 수가 3일 때 사용자 유사도 행렬 Sm ×m
Figure pct00038
이다.
여기서 제1행의 0.6은 사용자 1과 사용자 2 사이의 유사도를 나타내며, 0.4는 사용자 1과 사용자 3 사이의 유사도를 나타낸다. 사용자 유사도 행렬 Sm ×m을 생성할 때 사용자와 관련 사용자 사이의 유사도만을 고려하고, 사용자와 그 자신 사이의 유사도는 고려하지 않으므로 사용자 유사도 행렬 Sm ×m의 대각 원소들 Suu는 0으로 된다.
요약하면, 사용자 유사도 행렬을 데이터 피팅 모델의 제약 조건으로, 동시에 사용자 파라메터 행렬을 수정하는 한개의 파라메터로 인입하므로서 사용자 포트레이트에 대한 최종 획득의 정확성을 더욱 제고하였다. 이외에, 상기 실시예에서는 사용자들 사이의 유사도만을 데이터 피팅 모델에 제약 조건으로서 인입하고 사용자 파라메터 벡터와 그의 관련 사용자 파라메터 벡터들 사이의 강한 상관성을 구현한다. 기타 가능한 실시예에서도 요구에 따라 기타 데이터들을 데이터 피팅 모델에 제약 조건으로서 인입시킬수 있다. 예를 들어, 태그들 사이의 유사도를 데이터 피팅 모델에 제약 조건으로서 인입하여 태그 유사도 행렬을 구성하는데, 태그 유사도 행렬의 행과 렬은 모두 태그들을 표시하고, 매 원소는 대응하는 행과 렬이 가리키는 2개의 태그들 사이의 유사도를 표시하고, 태그들 사이의 유사도는 태그들이 표현하는 의미의 근사 정도에 따라 확정할 수 있다. 예를 들어, 2개의 의미가 근사할수록 태그들 사이의 유사도가 더 높아지므로 태그 파라메터 벡터와 그와 유사한 태그의 태그 파라메터 벡터 사이의 강한 상관성을 구현하게 된다. 이로 하여 상기 데이터 피팅 모델은 사용자 파라메터 벡터와 태그 파라메터 벡터들을 자동적으로 학습하여 물품에 대한 사용자의 선호 정도를 얻는 구조로서 비교적 많이 통용되고 있으며 요구에 따라 기타 데이터들을 이 모델에 추가할 수 있다.
도 5에서는 본 발명의 일 실시예가 제공한 사용자 포트레이트 획득 장치의 구조 골격도를 도시하였다. 이 장치는 소프트웨어나 하드웨어, 또는 양자 결합을 통하여 서버의 부분 또는 전부를 실현한다. 이 장치는 샘플 획득 모듈 520, 행렬 수정 모듈 540, 포트레이트 획득 모듈 560을 포함할 수 있다.
샘플 획득 모듈 520은 사용자 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻는데 이용하며, 여기서 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하며 M은 양의 정수이다.
행렬 수정 모듈 540은 샘플 획득 모듈 520에서 얻어진 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 Wm ×k와 초기화된 태그 파라메터 행렬 Hk ×n을 수정하여 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n을 얻는데 이용하며, 여기서 m은 사용자의 수를 표시하는 양의 정수이고, k는 인자의 수를 표시하는 양의 정수이고, n은 태그의 수를 표시하는 1보다 큰 정수이다.
포트레이트 획득 모듈 560은 행렬 수정 모듈 540에서 얻어진 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n에 따라 사용자 포트레이트 행렬 Pm ×n을 얻는데 이용하며, 여기서 사용자 포트레이트 행렬 Pm ×n의 제u행 제t렬의 원소 Put는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 u와 t는 1≤u≤m, 1≤t≤n인 정수들이다.
요약하면, 본 실시예가 제공하는 장치에서는 사용자 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻고, 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 Wm×k와 태그 파라메터 행렬 Hk ×n을 수정하여 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n을 얻은 다음, 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n에 따라 사용자 포트레이트 행렬 Pm ×n을 얻는 것을 통하여, 종래 기술이 제공한 사용자 포트레이트 획득 방법들에서 제기되는 낭비되는 시간과 인력 원가가 비교적 높은 문제와 획득한 사용자 포트레이트의 정확도가 비교적 낮은 문제를 해결하였으며, 사용자와 태그를 파라메터화하고, 데이터 피팅 모델을 이용하여 사용자 파라메터 행렬과 태그 파라메터 행렬을 수정하여 그것으로 트레이닝 샘플들을 피팅하므로서 태그에 상응한 태그 무게를 수동적으로 설정할 필요가 없고, 사용자의 행위 로그에 따라 데이터 피팅 방법을 이용하여 사용자 포트레이트를 자동적으로 획득하므로서 시간과 인력 원가를 절약하면서도 사용자 포트레이트를 정확하고 유효하게 얻는 기술 효과를 달성하였다.
도 6에서는 본 발명의 다른 일 실시예가 제공한 사용자 포트레이트 획득 장치의 구조 골격도를 도시하였다. 이 장치는 소프트웨어나 하드웨어, 또는 양자 결합을 통하여 서버의 부분 또는 전부를 실현한다. 이 장치는 샘플 획득 모듈 610, 행렬 수정 모듈 650, 포트레이트 획득 모듈 660을 포함할 수 있다.
샘플 획득 모듈 610은 사용자 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻는데 이용하며, 여기서 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하는데 이용하며 M은 양의 정수이다.
가능한 실시방식에서 샘플 획득 모듈 610은 행위 획득 유닛 611과 샘플 획득 유닛 612를 포함한다.
행위 획득 유닛 611은 사용자 행위 로그들에 따라 m명의 사용자들 중의 매 사용자의 h개 물품들 중의 매 물품에 대한 행위 유형을 얻는데 이용하며 h는 1보다 큰 정수이다.
샘플 획득 유닛 612은 행위 획득 유닛 611에서 얻어진 매 사용자의 매 물품에 대한 행위 유형에 따라 M개의 트레이닝 샘플들을 얻는데 이용된다.
선택적으로, 이 장치는 제2 생성 모듈 620을 더 포함할 수도 있다.
제2 생성 모듈 620는 초기화된 사용자 파라메터 행렬 Wm ×k와 초기화된 태그 파라메터 행렬Hk ×n을 생성하는데 이용된다. 여기서 초기화된 사용자 파라메터 행렬 Wm ×k의 원소들은 정규 분포를 띠는 난수들로 하고, 초기화된 태그 파라메터 행렬Hk ×n의 원소들은 정규 분포를 띠는 난수들로 한다.
선택적으로, 이 장치는 정보 획득 모듈 630과 제1 생성 모듈 640을 더 포함할 수 있다.
정보 획득 모듈 630은 m명의 사용자들 중의 매 사용자의 소셜 네트워크 정보를 얻는데 이용된다.
제1 생성 모듈 640은 정보 획득 모듈 630에서 얻어진 m명의 사용자들의 소셜 네트워크 정보에 따라 사용자 유사도 행렬 Sm ×m을 생성하는데 이용된다.
행렬 수정 모듈 650은 샘플 획득 모듈 610에서 얻어진 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 제2 생성 모듈 620에서 생성한 초기화된 사용자 파라메터 행렬 Wm ×k와 초기화된 태그 파라메터 행렬Hk ×n을 수정하여 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n을 얻는데 이용되며 여기서 m은 사용자의 수를 표시하는 양의 정수이고, k는 인자의 수를 표시하는 양의 정수이고, n은 태그의 수를 표시하는 1보다 큰 정수이다.
가능한 실시방식에서, 행렬 수정 모듈 650은 제1 계산 유닛 651과 제2 계산 유닛 652, 확률 획득 유닛 653, 제3 계산 유닛 654, 행렬 확정 유닛 655, 행렬 수정 유닛 656을 포함한다.
제1 계산 유닛 651은 a=0이라고 하고 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k와 a번째 수정 후의 태그 파라메터 행렬 Hk ×n에 따라 m명의 사용자들 중의 매 사용자의 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산하는데 이용된다. 여기서 a는 0과 같거나 큰 정수이며 0번째 수정 후의 사용자 파라메터 행렬 Wm ×k는 초기화된 사용자 파라메터 행렬 Wm ×k로, 0번째 수정 후의 태그 파라메터 행렬 Hk ×n은 초기화된 태그 파라메터 행렬 Hk ×n로 한다.
제2 계산 유닛 652는 m명의 사용자들 중의 매 사용자의 n개의 태그들 중의 매 태그에 대한 선호 정도와 물품 태그 행렬 Ah×n에 따라 m명의 사용자들 중의 매 사용자의 h개의 물품들 중의 매 물품에 대한 선호 정도를 계산하는데 이용되며, 여기서 h는 물품의 개수를 표시하는 1보다 큰 정수이다.
확률 획득 유닛653은 m명의 사용자들 중의 매 사용자의 h개 물품들 중의 매 물품에 대한 선호 정도에 따라 M개의 트레이닝 샘플 중의 매 트레이닝 샘플에 대응하는 확률을 얻는데 이용되며, 여기서 트레이닝 샘플 <u, i, j>에 대응하는 확률은 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 클 확률이다.
제3 계산 유닛 654는 M개의 트레이닝 샘플들에 각각 대응하는 확률들을 데이터 피팅 모델의 입력 파라메터로 하여 데이터 피팅 모델의 출력 결과를 계산하는데 이용된다.
선택적으로, 데이터 피팅 모델은,
Figure pct00039
일 수 있으며, 여기서 λ W , λ H λ S 는 양의 실수로서 오버 피팅을 방지하는데 쓰이는 정규화 파라메터이고,
Figure pct00040
는 행렬의 2노르마이며, D s 는 M개의 트레이닝 샘플들의 세트를 가리킨다. 트레이닝 샘플 <u, i, j>에 대응하는 확률은
Figure pct00041
이며
Figure pct00042
은 사용자 u의 물품 i에 대한 선호 정도와 물품 j에 대한 선호 정도의 차값이고,
Figure pct00043
는 로지스틱 함수를 가리키며, N u 는 사용자 u와 관련 사용자들의 세트를 나타낸다. S uv 는 사용자 유사도 행렬 S m ×m 의 제u행 제v렬의 원소로서 사용자 u와 사용자 v 사이의 유사도를 나타낸다. W u 는 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k의 제u행에 대응하는 행 벡터이며 W v 는 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k의 제v행에 대응하는 행 벡터이다.
행렬 확정 유닛 655는 출력 결과가 사전 설정 조건에 부합되는 경우, a번째 수정 후의 사용자 파라메터 행렬 Wm ×k와 a번째 수정 후의 태그 파라메터 행렬 Hk ×n을 각각 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n로 확정하는데 이용된다.
행렬 수정 유닛 656은 출력 결과가 사전 설정 조건에 부합되지 않는 경우, a번째 수정 후의 사용자 파라메터 행렬 Wm ×k를 수정하여 a+1번째 수정 후의 사용자 파라메터 행렬 Wm ×k를 얻고 또한 a번째 수정 후의 태그 파라메터 행렬 Hk ×n를 수정하여 a+1번째 수정 후의 태그 파라메터 행렬 Hk ×n을 얻으며, a=a+1로 하고 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k와 a번째 수정 후의 태그 파라메터 행렬 Hk ×n에 따라 m명의 사용자들 중의 매 사용자의 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산하는 단계로부터 상기 단계들을 다시 실행하기 시작하는데 이용한다.
가능한 실현방식에서, 행렬 수정 유닛656은 구체적으로 이하 공식에 의해 a+1번째 수정 후의 사용자 파라메터 행렬 Wm ×k를 계산하는데 이용된다.
Figure pct00044
여기서
Figure pct00045
는 a+1번째 수정 후의 사용자 파라메터 행렬 Wm ×k의 제u행에 대응하는 행 벡터이고
Figure pct00046
는 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k의 제u행에 대응하는 행 벡터이며,
Figure pct00047
는 a번째 수정 후의 태그 파라메터 행렬 Hk ×n의 제l렬에 대응하는 렬 벡터의 전치 벡터를 가리킨다. l은 1≤l≤n인 정수이다.
Figure pct00048
는 양의 실수로서 학습 효율을 나타낸다.
가능한 실현방식에서, 행렬 수정 유닛 656은 구체적으로 이하 공식에 의해 a+1번째 수정 후의 태그 파라메터 행렬 Hk ×n을 계산하는데 이용된다.
Figure pct00049
여기서
Figure pct00050
는 a+1번째 수정 후의 태그 파라메터 행렬 Hk ×n의 제f행에 대응하는 행 벡터를 가리키며,
Figure pct00051
는 a번째 수정 후의 태그 파라메터 행렬 Hk ×n의 제f행에 대응하는 행 벡터를 가리킨다. f는 1≤f≤k인 정수이며
Figure pct00052
는 양의 실수로서 학습 효율을 나타낸다.
포트레이트 획득 모듈 660은 행렬 수정 모듈 650에서 얻어진 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n에 따라 사용자 포트레이트 행렬 Pm ×n을 얻는데 이용되며, 여기서 사용자 포트레이트 행렬 Pm ×n의 제u행 제t렬의 원소 Put는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 u와 t는 각각 1≤u≤m, 1≤t≤n인 정수들이다.
선택적으로, 이 장치는 선호 계산 모듈 670을 더 포함할 수 있다.
선호 계산 모듈 670은 포트레이트 획득 모듈 660에서 얻어진 사용자 포트레이트 행렬 Pm ×n과 타겟 물품이 가지고 있는 태그들에 따라 사용자 u의 타겟 물품에 대한 선호 정도를 계산하는데 이용된다.
요약하면, 본 실시예가 제공하는 장치에서는 사용자 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻고, 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 Wm ×k와 태그 파라메터 행렬 Hk ×n을 수정하여 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n을 얻은 다음, 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n에 따라 사용자 포트레이트 행렬 Pm ×n을 얻는 것을 통하여, 종래 기술이 제공한 사용자 포트레이트 획득 방법들에서 제기되는 낭비되는 시간과 인력 원가가 비교적 높은 문제와 획득한 사용자 포트레이트의 정확도가 비교적 낮은 문제를 해결하였으며, 사용자와 태그를 파라메터화하고, 데이터 피팅 모델을 이용하여 사용자 파라메터 행렬과 태그 파라메터 행렬을 수정하여 그것으로 트레이닝 샘플들을 피팅하므로서 태그에 상응한 태그 무게를 수동적으로 설정할 필요가 없고, 사용자의 행위 로그에 따라 데이터 피팅 방법을 이용하여 사용자 포트레이트를 자동적으로 획득하므로서 시간과 인력 원가를 절약하면서도 사용자 포트레이트를 정확하고 유효하게 얻는 기술 효과를 달성하였다.
이외에, 기계 학습 방식을 이용하여 사용자 파라메터 행렬과 태그 파라메터 행렬에 대한 수정을 진행하므로서 트레이닝 샘플들을 피팅하므로서 사용자 포트레이트를 자동적으로 획득하고 그 정확성과 유효성을 더욱 제고하였다.
이외에, 물품들을 부류별로, 사람들을 컬렉션으로 분류하는 아이디어에 기초하여 유사도가 아주 높은, 즉 기호가 매우 비슷한 2명의 사용자들에 대하여 데이터 피팅 모델에서 제약 조건으로서 사용자 유사도 행렬을 증가시키므로서 단순히 사용자 행위 로그들에 의거하여서만 사용자 포트레이트를 얻는 것이 아니라 사용자 파라메터 행렬의 수정시 사용자 유사도 행렬을 고려하여 사용자의 파라메터 벡터와 그의 관련 사용자의 사용자 파라메터 벡터 사이의 강한 상관성을 구현하므로서 사용자 포트레이트 획득의 정확성을 더욱 제고하였다.
설명할 필요가 있는 것은, 상기 실시예가 제공한 장치는 그 기능들을 실현할 때 각 기능 모듈들을 구분하여 예를 들어 설명하였을뿐이고 실제 응용에서는 상기 기능들을 요구에 따라 할당하여 서로 다른 기능 모듈들로 완성할 수 있으며, 장치의 내부 구조를 서로 다른 기능 모듈들로 구분하여 상기 서술한 전부 또는 일부 기능들을 완성하게 된다. 이외에 상기 실시예가 제공하는 사용자 포트레이트 획득 장치와 사용자 포트레이트 획득 방법 실시예는 동일한 구상에 속하며 그의 구체적인 실현 과정은 방법 실시예를 상세히 보면 되므로 여기서 다시 언급하지 않는다.
도 7에서는 본 발명의 일 실시예가 제공한 서버의 구조 개략도를 도시하였다. 이 서버는 상기 실시예에서 제공한 사용자 포트레이트 획득 방법을 실시하는데 이용된다. 구체적으로 보면,
상기 서버 700은 중앙 처리 유닛(CPU) 701과, 랜덤 액세스 메모리(RAM) 702와 읽기 전용 메모리(ROM) 703을 포함하는 시스템 메모리 704, 시스템 메모리 704와 중앙 처리 유닛 701을 연결하는 시스템 버스 705를 포함한다. 상기 서버 700은 또한 컴퓨터안의 매 요소 사이의 정보 전송을 방조하는 기본 입력/출력 시스템(I/O시스템) 706과, 조작 시스템 713, 응용 프로그램 714 과기타 프로그램 모듈 715을 기억하는데 이용되는 대용량 기억 설비 707을 포함한다.
상기 기본 입력/출력 시스템 706은 정보를 현시하는데 쓰이는 디스플레이 708과 사용자의 정보 입력에 이용되는 마우스와 키보드와 같은 입력 설비 709를 포함한다. 여기서 상기 디스플레이 708과 입력 설비 709는 모두 시스템 버스 705에 연결된 입출력 컨트롤러 710을 통하여 중앙 처리 유닛 701과 연결된다. 상기 기본 입력/출력 시스템 706은 입출력 컨트롤러 710을 더 포함하여 키보드나 마우스, 혹은 전자 터치 조종 펜 등 여러가지 기타 설비의 입력을 수신 및 처리하는데 이용될 수 있다. 이와 유사하게, 입력/출력 컨트롤러 710은 또한 디스플레이나 프린터 혹은 기타 유형의 출력 설비들에 출력을 제공한다.
상기 대용량 기억 설비 707은 시스템 버스 705에 연결된 대용량 기억 컨트롤러(도시되지 않음)를 통하여 중앙 처리 유닛 701에 연결된다.상기 대용량 기억 설비 707및 그와 관련된 컴퓨터 리더블 매체들은 서버 700에 비휘발성저장을 제공한다. 다시 말하여, 상기 대용량 기억 설비 707에는 하드 디스크나 CD-ROM 구동기와 같은 컴퓨터 리더블 매체들(도시되지 않음)이 포함된다.
일반성을 잃음이 없이, 상기 컴퓨터 리더블 매체에는 컴퓨터 기억 매체와 통신 매체들이 포함될 수 있다. 컴퓨터 기억 매체에는 컴퓨터 리더블 지령들과 데이터 구조, 프로그램 모듈이나 기타 데이터 등과 같은 정보들을 기억하는 임의의 방법이나 기술 실현에 이용되는 휘발성 및 비휘발성, 이동 가능 및 이동 불가능 매체들이 포함된다. 컴퓨터 기억 매체에는 RAM이나 ROM, EPROM, EEPROM, 플래시 메모리 혹은 기타 고체 상태 저장 기술, CD-ROM, DVD 혹은 기타 옵티컬 기억, 카세트,자기 테이프, 자기 디스크 메모리 혹은 기타 자성 기억 설비들이 포함된다. 물론 이 기술분야의 당업자라면, 상기 컴퓨터 기억 매체들이 상기 몇가지 종류에만 국한되지 않는다는 것을 알 수 있다. 상기 시스템 메모리 704와 대용량 기억 설비 707을 메모리라고 부를 수 있다.
본 발명의 각종 실시예들에 따라 상기 서버 700은 또한 인터넷 등과 같은 여러 네트워크를 통하여 네트워크에 연결된 원격 컴퓨터로 운영될 수 있다. 즉 서버 700은 상기 시스템 버스 705상에서 연결된 네트워크 인터페이스 유닛 711을 통하여 네트워크 712에 연결될 수 있으며 또는 네트워크 인터페이스 유닛711을 사용하여 기타 유형의 네트워크나 원격 컴퓨터 시스템(도시되지 않음)에 연결될 수 있다.
상기 메모리는 한개 또는 한개 이상의 프로그램들을 더 포함할 수 있는데 상기 한개 혹은 한개 이상의 프로그램들은 메모리에 기억되고 한개 혹은 한개 이상의 프로세서들에 의해 실행된다. 상기 한개 혹은 한개 이상의 프로그램들에는 상기 방법을 실행하는데 이용되는 지령들이 포함되어 있다.
예시적인 실시예에서는, 또한 지령들을 포함하는 비 임시성 컴퓨터 리더블 기억 매체, 예하면 지령들을 포함하는 메모리를 제공하였는데, 상기 지령들은 서버의 프로세서에서 실행되여 상기 사용자 포트레이트 획득 방법을 완성할 수 있다. 예를 들면 상기 비 임시성 컴퓨터 리더블 기억 매체들은 ROM, 랜덤 액세스 메모리(RAM), CD-ROM, 자기 테이프, 플로피 디스크, 옵티컬 데이터 기억 설비 등일 수 있다.
응당 이해할 것은 본문에서 "여러개"라고 언급한 것들은 2개 혹은 2개 이상을 가리킨다는 것이다. "와/혹은"은 관련 대상들의 관련 관계를 서술하며 3가지 관계들이 존재할 수 있다는 것을 보여준다. 예하면 A 와/혹은 B 는 A가 단독으로 존재하는 경우, A와 B가 동시에 존재하는 경우, B가 단독으로 존재하는 경우의 3가지 상황들을 표시할 수 있다. 부호 "/"는 일반적으로 전후 관련 대상들이 일종의 "혹은"의 관계이라는 것을 가리킨다.
상기 본 발명의 실시예의 순서번호는 다만 서술을 위한것일뿐이고 실시예의 우렬을 대표하는 것은 아니다.
이 기술분야의 당업자라면, 상기 실시예의 전부 혹은 일부 단계를 하드웨어를 통하여 실현할 수 있으며 프로그램을 통하여 관련된 하드웨어에 지령을 주어 완성할 수도 있고, 상기 프로그램은 일종의 컴퓨터 리더블 기억 매체에 기억될 수 있으며 상기 언급된 기억 매체는 읽기 전용 메모리, 자기 디스크, 혹은 옵티컬 디스크 등일 수 있다는 것을 이해할 수 있다.
상기 서술한 것은 본 발명의 바람직한 실시예일뿐 본 발명을 제한하지 않으며, 본 발명의 정신과 원칙내에서 진행하는 모든 임의의 수정, 동등치환, 개진 등은 응당 본 발명의 보호범위안에 포함되여야 한다.

Claims (27)

  1. 사용자 행위 로그들에 따라 상기 M개의 트레이닝 샘플들을 얻는 것, 여기서, 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하는데 이용하며 상기M은 양의 정수이고,
    상기 M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 Wm ×k와 초기화된 태그 파라메터 행렬 Hk ×n을 수정하여 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n을 얻는 것, 여기서,상기 m은 사용자의 수를 표시하고,상기 k는 인자의 수를 표시하고, 상기n은 태그의 수를 표시하고, 상기 m은 양의 정수이고, 성기 k는 양의 정수이고, 상기 n은 1보다 큰 정수이고,
    상기 최종 사용자 파라메터 행렬 Wm ×k와 상기 최종 태그 파라메터 행렬 Hk ×n에 따라 상기 사용자 포트레이트 행렬 Pm ×n을 얻는 것을 포함하고, 여기서, 상기 사용자 포트레이트 행렬 Pm ×n의 제u행제t렬의 원소 Put는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 상기u는 1≤u≤m인 정수이고, 상기 t는 1≤t≤n인 정수인 것을 특정으로 하는 사용자 포트레이트 획득 방법.
  2. 청구항 1에 있어서,
    상기 M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 Wm ×k와 초기화된 태그 파라메터 행렬 Hk ×n을 수정하여 최종 사용자 파라메터 행렬 Wm×k와 최종 태그 파라메터 행렬 Hk×n을 얻는 것은,
    상기 a=0으로 하고 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k와 a번째 수정 후의 태그 파라메터 행렬 Hk ×n에 따라 상기 m명의 사용자들 중의 매 사용자의 상기 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산하는 것,여기서, 상기a는 0과 같거나 큰 정수이고, 0번째 수정 후의 사용자 파라메터 행렬 Wm ×k은 상기 초기화된 사용자 파라메터 행렬 Wm × k이고, 0번째 수정 후의 태그 파라메터 행렬 Hk ×n은 상기 초기화된 태그 파라메터 행렬 Hk×n이고,
    상기 m명의 사용자들 중의 매 사용자의 상기 n개의 태그들 중의 매 태그에 대한 선호 정도와 물품 태그 행렬 Ah×n에 따라 상기m명의 사용자들 중의 매 사용자의 상기 h개의 물품들 중의 매 물품에 대한 선호 정도를 계산하는 것, 여기서, 상기 h는 물품의 개수를 나타내고, 상기 h는1보다 큰 정수이고,
    상기 m명의 사용자들 중의 매 사용자의 상기 h개 물품들 중의 매 물품에 대한 선호 정도에 따라 상기 M개의 트레이닝 샘플들 중의 매 트레이닝 샘플에 대응하는 확률을 얻는 것, 여기서, 상기 트레이닝 샘플 <u, i, j>에 대응하는 확률은 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 큰 확률이고,
    상기 M개의 트레이닝 샘플들에 각각 대응하는 확률들을 상기 데이터 피팅 모델의 입력 파라메터들로 하여 상기 데이터 피팅 모델의 출력 결과를 계산하는 것,
    만일 상기 출력 결과가 사전 설정 조건에 부합된다면, 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k와 상기 a번째 수정 후의 태그 파라메터 행렬 Hk ×n을 각각 상기 최종 사용자 파라메터 행렬 Wm ×k와 상기 최종 태그 파라메터 행렬 Hk ×n로 확정하는 것,
    만일 상기 출력 결과가 사전 설정 조건에 부합되지 않는다면, 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k를 수정하여 a+1번째 수정 후의 사용자 파라메터 행렬 Wm ×k를 얻으며 또한 상기 a번째 수정 후의 태그 파라메터 행렬 Hk ×n를 수정하여 a+1번째 수정 후의 태그 파라메터 행렬 Hk ×n을 얻으며, a=a+1으로 하고 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm × k와 a번째 수정 후의 태그 파라메터 행렬 Hk×n에 따라 상기 m명의 사용자들 중의 매 사용자의 상기 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산하는 단계로부터 상기 단계들을 다시 실행하는 것을 포함하는 것을 특징으로 하는방법.
  3. 청구항 2에 있어서,
    상기 데이터 피팅 모델은,
    Figure pct00053

    이며, 여기서 상기 λ W , λ H λ S 는 오버 피팅을 방지하는데 쓰이는 정규화 파라메터이고, 상기 λ W , λ H λ S 는 양의 실수이고,
    Figure pct00054
    은 행렬의 2노르마이고, 상기 D s 는 상기 M개의 트레이닝 샘플들의 세트를 나타내며, 상기 트레이닝 샘플 <u, i, j>에 대응하는 확률
    Figure pct00055
    이고, 상기
    Figure pct00056
    은 상기 사용자 u의 물품 i에 대한 선호 정도와 상기 사용자 u의 물품 j에 대한 선호 정도의 차값이고, 상기
    Figure pct00057
    는 로지스틱 함수이고, 상기 N u 는 상기 사용자 u와 관련 사용자들의 세트이고, 상기 S uv 는 사용자 유사도 행렬 Sm ×m의 제u행제v렬의 원소이고, 상기 S uv 는 상기 사용자 u와 상기 사용자 v 사이의 유사도를 나타내고, 상기 W u 가 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k의 제u행에 대응하는 행 벡터이고, 상기 W v 가 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k의 제v행에 대응하는 행 벡터인 것을 특징으로 하는 방법.
  4. 청구항 3에 있어서,
    상기 m명의 사용자들 중의 매 사용자의 소셜 네트워크 정보를 획득하는 것과,
    상기 m명의 사용자들의 소셜 네트워크 정보에 따라 상기 사용자 유사도 행렬 Sm×m를 생성하는 것을 더 포함하는 것을 특징으로 하는 방법.
  5. 청구항 3에 있어서,
    상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k를 수정하여 a+1번째 수정 후의 사용자 파라메터 행렬 Wm ×k를 얻는 것은
    이하 공식
    Figure pct00058

    에 의해 상기 a+1번째 수정 후의 사용자 파라메터 행렬 Wm ×k를 계산하는 것을 포함하며, 여기서 상기
    Figure pct00059
    는 상기 a+1번째 수정 후의 사용자 파라메터 행렬 Wm ×k의 제u행에 대응하는 행 벡터이고, 상기
    Figure pct00060
    는 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k의 제u행에 대응하는 행 벡터이고, 상기
    Figure pct00061
    는 상기 a번째 수정 후의 태그 파라메터 행렬 Hk ×n의 제l렬에 대응하는 렬 벡터의 전치 벡터이고, 상기 l은 1≤l≤n인 정수이고, 상기
    Figure pct00062
    는 학습 효율이고, 상기
    Figure pct00063
    는 양의 실수인 것을 특징으로 하는 방법.
  6. 청구항 3에 있어서,
    상기 a번째 수정 후의 태그 파라메터 행렬 Hk ×n를 수정하여 a+1번째 수정 후의 태그 파라메터 행렬 Hk ×n을 얻는 것은,
    이하 공식
    Figure pct00064

    에 의해 상기 a+1번째 수정 후의 태그 파라메터 행렬 Hk ×n을 계산하는 것을 포함하며, 여기서 상기
    Figure pct00065
    는 상기 a+1번째 수정 후의 태그 파라메터 행렬 Hk ×n의 제f행에 대응하는 행 벡터이고, 상기
    Figure pct00066
    는 상기 a번째 수정 후의 태그 파라메터 행렬 Hk ×n의 제f행에 대응하는 행 벡터이고, 상기 f는 1≤f≤k인 정수이고, 상기
    Figure pct00067
    는 학습 효율을 나타내고, 상기
    Figure pct00068
    는 양의 실수인 것을 특징으로 하는 방법.
  7. 청구항 1 내지 청구항6 중의 어느 한항에 있어서,
    상기 사용자 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻는 것은,
    상기 사용자 행위 로그들에 따라 상기 m명의 사용자들 중의 매 사용자의 h개의 물품들 중의 매 물품에 대한 행위 유형을 얻는 것, 여기서 h는 1보다 큰 정수이고,
    매 사용자의 매 물품에 대한 행위 유형에 따라 M개의 트레이닝 샘플들을 얻는 것을 특징으로 하는 포함하는 것을 특징으로 하는 방법.
  8. 청구항 1 내지 청구항 6 중의 어느 한항에 있어서,
    상기 M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 Wm ×k와 태그 파라메터 행렬 Hk ×n을 수정하여 최종 사용자 파라메터 행렬 Wm×k와 최종 태그 파라메터 행렬 Hk×n을 얻기 전에,
    상기 초기화된 사용자 파라메터 행렬 Wm ×k와 상기 초기화된 태그 파라메터 행렬 Hk ×n을 생성하는 것을 더 포함하며, 여기서 상기 초기화된 사용자 파라메터 행렬 Wm ×k의 원소들이 정규 분포를 띠는 난수들이고 상기 초기화된 태그 파라메터 행렬 Hk×n의 원소들이 정규 분포를 띠는 난수들인 것을 특징으로 하는 방법.
  9. 청구항 1 내지 청구항6 중의 어느 한항에 있어서,
    상기 최종 사용자 파라메터 행렬 Wm ×k와 상기 최종 태그 파라메터 행렬 Hk ×n에 따라 사용자 포트레이트 행렬 Pm ×n을 얻은 후,
    상기 사용자 포트레이트 행렬 Pm ×n과 타겟 물품이 가지고 있는 태그들에 따라 상기 사용자 u의 상기 타겟 물품에 대한 선호 정도를 계산하는 것을 더 포함하는 것을 특징으로 하는 방법.
  10. 사용자 행위 로그들에 따라 상기 M개의 트레이닝 샘플들을 얻는데 이용되는 샘플 획득 모듈과, 여기서, 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하는데 이용하며 성기 M은 양의 정수이고,
    상기 M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 Wm ×k와 초기화된 태그 파라메터 행렬 Hk ×n을 수정하여 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n을 얻는데 이용되는 행렬 수정 모듈과, 여기서,상기 m은 사용자의 수를 표시하고, 상기 k는 인자의 수를 표시하고,상기 n은 태그의 수를 표시하고, m은 양의 정수이고,상기 k는 양의 정수이고,상기 n은 1보다 큰 정수이고,
    상기 최종 사용자 파라메터 행렬 Wm ×k와 상기 최종 태그 파라메터 행렬 Hk ×n에 따라 사용자 포트레이트 행렬 Pm ×n을 얻는데 이용되는 포트레이트 획득 모듈을 포함하고, 여기서, 상기 사용자 포트레이트 행렬 Pm ×n의 제u행제t렬의 원소 Put는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 상기 u는 1≤u≤m인 정수이고, 상기 t는 1≤t≤n인 정수인 것을 특정으로 하는 사용자 포트레이트 획득 장치.
  11. 청구항 10에 있어서,
    상기 행렬 수정 모듈이,
    a=0으로 하고 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k와 a번째 수정 후의 태그 파라메터 행렬 Hk ×n에 따라 상기 m명의 사용자들 중의 매 사용자의 상기 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산하는데 이용되는 제1 계산 유닛, 여기서,상기 a는 0과 같거나 큰 정수이고, 0번째 수정 후의 사용자 파라메터 행렬 Wm ×k은 상기 초기화된 사용자 파라메터 행렬 Wm × k이고, 0번째 수정 후의 태그 파라메터 행렬 Hk×n은 상기 초기화된 태그 파라메터 행렬 Hk×n이고,
    상기 m명의 사용자들 중의 매 사용자의 상기 n개의 태그들 중의 매 태그에 대한 선호 정도와 물품 태그 행렬 Ah×n에 따라 상기 m명의 사용자들 중의 매 사용자의 h개의 물품들 중의 매 물품에 대한 선호 정도를 계산하는데 이용되는 제2 계산 유닛, 여기서, h는 물품의 개수를 나타내고, h는 1보다 큰 정수이고,
    상기 m명의 사용자들 중의 매 사용자의 상기 h개 물품들 중의 매 물품에 대한 선호 정도에 따라 상기 M개의 트레이닝 샘플들 중의 매 트레이닝 샘플에 대응하는 확률을 얻는데 이용되는 확률 획득 유닛, 여기서, 상기 트레이닝 샘플 <u, i, j>에 대응하는 확률은 상기 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 큰 확률이고,
    상기 M개의 트레이닝 샘플들에 각각 대응하는 확률들을 상기 데이터 피팅 모델의 입력 파라메터로 하여 상기 데이터 피팅 모델의 출력 결과를 계산하는데 이용되는 제3 계산 유닛,
    상기 출력 결과가 사전 설정 조건에 부합되는 경우 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k과 상기 a번째 수정 후의 태그 파라메터 행렬 Hk ×n을 각각 상기 최종 사용자 파라메터 행렬 Wm ×k과 상기 최종 태그 파라메터 행렬 Hk ×n로 확정하는데 이용되는 행렬 확정 유닛,
    상기 출력 결과가 사전 설정 조건에 부합되지 않는 경우 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k를 수정하여 상기 a+1번째 수정 후의 사용자 파라메터 행렬 Wm ×k를 얻고 또한 상기 a번째 수정 후의 태그 파라메터 행렬 Hk ×n을 수정하여 상기 a+1번째 수정 후의 태그 파라메터 행렬 Hk ×n을 얻으며, a=a+1로 하고 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k과 a번째 수정 후의 태그 파라메터 행렬 Hk×n에 따라 상기 m명의 사용자들 중의 매 사용자의 상기 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산하는 단계로부터 상기 단계들을 다시 실행하는데 이용되는 행렬 수정 유닛을 포함하는 것을 특정으로 하는 장치.
  12. 청구항 11에 있어서,
    상기 데이터 피팅 모델은,
    Figure pct00069

    이며, 여기서 상기 λ W , λ H λ S 는 오버 피팅을 방지하는데 쓰이는 정규화 파라메터이고, 상기 λ W , λ H λ S 는 양의 실수이고,
    Figure pct00070
    은 행렬의 2노르마이고, 상기 D s 는 상기 M개의 트레이닝 샘플들의 세트를 나타내며, 상기 트레이닝 샘플 <u, i, j>에 대응하는 확률
    Figure pct00071
    이고, 상기
    Figure pct00072
    은 상기 사용자 u의 물품 i에 대한 선호 정도와 상기 사용자 u의 물품 j에 대한 선호 정도의 차값이고, 상기
    Figure pct00073
    는 로지스틱 함수이고, 상기 N u 는 상기 사용자 u와 관련 사용자들의 세트이고, 상기 S uv 는 사용자 유사도 행렬 Sm ×m의 제u행 제v렬의 원소이고, 상기 S uv 는 상기 사용자 u와 상기 사용자 v 사이의 유사도를 나타내고, 상기 W u 가 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k의 제u행에 대응하는 행 벡터이고, 상기 W v 가 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k의 제v행에 대응하는 행 벡터인 것을 특징으로 하는 장치.
  13. 청구항 12에 있어서,
    상기 m명의 사용자들 중의 매 사용자의 소셜 네트워크 정보를 얻는데 이용되는 정보 획득 모듈과,
    상기 m명의 사용자들의 소셜 네트워크 정보에 따라 상기 사용자 유사도 행렬 Sm ×m을 생성하는데 이용되는 제1 생성 모듈을 더 포함하는 것을 특징으로 하는 장치.
  14. 청구항 12에 있어서,
    상기 행렬 수정 유닛은 구체적으로,
    이하 공식
    Figure pct00074

    에 의해 상기a+1번째 수정 후의 사용자 파라메터 행렬 Wm ×k를 계산하며, 여기서 상기
    Figure pct00075
    는 상기 a+1번째 수정 후의 사용자 파라메터 행렬 Wm ×k의 제u행에 대응하는 행 벡터이고, 상기
    Figure pct00076
    는 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k의 제u행에 대응하는 행 벡터이고, 상기
    Figure pct00077
    는 상기 a번째 수정 후의 태그 파라메터 행렬 Hk ×n의 제l렬에 대응하는 렬 벡터의 전치 벡터이고, 상기 l은 1≤l≤n인 정수이고, 상기
    Figure pct00078
    는 학습 효율이고, 상기
    Figure pct00079
    는 양의 실수인 것을 특징으로 하는 장치.
  15. 청구항 12에 있어서,
    상기 행렬 수정 유닛은 구체적으로,
    이하 공식
    Figure pct00080

    에 의해 상기 a+1번째 수정 후의 태그 파라메터 행렬 Hk ×n을 계산하며, 여기서 상기
    Figure pct00081
    는 상기 a+1번째 수정 후의 태그 파라메터 행렬 Hk ×n의 제f행에 대응하는 행 벡터이고, 상기
    Figure pct00082
    는 상기 a번째 수정 후의 태그 파라메터 행렬 Hk ×n의 제f행에 대응하는 행 벡터이고, 상기 f는 1≤f≤k인 정수이고, 상기
    Figure pct00083
    는 학습 효율을 나타내고, 상기
    Figure pct00084
    는 양의 실수인 것을 특징으로 하는장치.
  16. 청구항 10 내지 청구항15 중의 어느 한항에 있어서,
    상기 샘플 획득 모듈이,
    상기 사용자 행위 로그들에 따라 상기 m명의 사용자들 중의 매 사용자의 h개 물품들 중의 매 물품에 대한 행위 유형을 얻는데 이용되는 행위 획득 유닛, 여기서 h는 1보다 큰 정수이고,
    매 사용자의 매 물품에 대한 행위 유형에 따라 상기M개의 트레이닝 샘플들을 얻는데 이용되는 샘플 획득 유닛을 포함하는 것을 특징으로 하는 장치.
  17. 청구항 10 내지 청구항15 중의 어느 한항에 있어서,
    상기 초기화된 사용자 파라메터 행렬 Wm ×k와 상기 초기화된 태그 파라메터 행렬Hk×n을 생성하는데 이용되는 제2 생성 모듈을 더 포함하며,
    여기서, 상기 초기화된 사용자 파라메터 행렬 Wm ×k의 원소들은 정규 분포를 띠는 난수이고, 상기 초기화된 태그 파라메터 행렬 Hk ×n의 원소들은 정규 분포를 띠는 난수들인 것을 특징으로 하는 장치.
  18. 청구항 10 내지 청구항15 중의 어느 한항에 있어서,
    상기 사용자 포트레이트 행렬 Pm ×n과 타겟 물품이 가지고 있는 태그들에 따라 상기 사용자 u의 상기 타겟 물품에 대한 선호 정도를 계산하는데 이용되는 선호 계산 모듈을 더 포함하는 것을 특징으로 하는 장치.
  19. 한개 혹은 여러개의 프로세서와,
    상기 한개 혹은 여러개의 프로세서들과 상호 연결된 메모리를 포함하며, 상기 메모리에는 상기 한개 또는 여러개의 프로세서들에서 실행하도록 구성된 한개 혹은 여러개의 프로그램들이 기억되어 있고 상기 한개 혹은 여러개의 프로그램에는,
    사용자의 행위 로그들에 따라 M개의 트레이닝 샘플들을 얻는 조작과, 여기서, 트레이닝 샘플 <u, i, j>은 물품 i와 물품 j에 대한 사용자 u의 선호 정도의 차이를 반영하는데 이용하며 상기M은 양의 정수이고,
    상기 M개의 트레이닝 샘플들에 따라 데이터 피팅 모델을 이용하여 초기화된 사용자 파라메터 행렬 Wm ×k와 초기화된 태그 파라메터 행렬 Hk ×n을 수정하여 최종 사용자 파라메터 행렬 Wm ×k와 최종 태그 파라메터 행렬 Hk ×n을 얻는 조작, 여기서,상기 m은 사용자의 수를 표시하고,상기 k는 인자의 수를 표시하고, 상기n은 태그의 수를 표시하고, 상기 m은 양의 정수이고, 성기 k는 양의 정수이고, 상기 n은 1보다 큰 정수이고,
    상기 최종 사용자 파라메터 행렬 Wm ×k와 상기 최종 태그 파라메터 행렬 Hk ×n에 따라 사용자 포트레이트 행렬 Pm ×n을 얻는 조작을 진행하는데 이용되는 지령들이 포함되어 있으며, 여기서 상기 사용자 포트레이트 행렬 Pm ×n의 제u행제t렬의 원소 Put는 태그 t에 대한 사용자 u의 선호 정도를 표시하며 상기 u는 1≤u≤m인 정수이고, 상기 t는 1≤t≤n인 정수인 것을 특정으로 하는 사용자 포트레이트 획득 장치.
  20. 청구항 19에 있어서,
    상기 한개 혹은 여러개의 프로그램들이,
    a=0으로 하고 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k와 a번째 수정 후의 태그 파라메터 행렬 Hk ×n에 따라 상기 m명의 사용자들 중의 매 사용자의 상기 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산하는 조작과, 여기서, 상기a는 0과 같거나 큰 정수이고, 0번째 수정 후의 사용자 파라메터 행렬 Wm ×k은 상기 초기화된 사용자 파라메터 행렬 Wm × k이고, 0번째 수정 후의 태그 파라메터 행렬 Hk ×n은 상기 초기화된 태그 파라메터 행렬 Hk×n이고,
    상기 m명의 사용자들 중의 매 사용자의 상기 n개의 태그들 중의 매 태그에 대한 선호 정도와 물품 태그 행렬 Ah×n에 따라 상기m명의 사용자들 중의 매 사용자의 상기 h개의 물품들 중의 매 물품에 대한 선호 정도를 계산하는 조작, 여기서,상기 h는 물품의 개수를 나타내고, 상기 h는1보다 큰 정수이고,
    상기 m명의 사용자들 중의 매 사용자의 상기 h개 물품들 중의 매 물품에 대한 선호 정도에 따라 상기 M개의 트레이닝 샘플들 중의 매 트레이닝 샘플에 대응하는 확률을 얻는 조작, 여기서, 상기 트레이닝 샘플 <u, i, j>에 대응하는 확률은 사용자 u의 물품 i에 대한 선호 정도가 물품 j에 대한 선호 정도보다 큰 확률이고,
    상기 M개의 트레이닝 샘플들에 각각 대응하는 확률들을 데이터 피팅 모델의 입력 파라메터들로 하여 상기 데이터 피팅 모델의 출력 결과를 계산하는 조작,
    만일 상기 출력 결과가 사전 설정 조건에 부합된다면, 상기a번째 수정 후의 사용자 파라메터 행렬 Wm ×k와 상기 a번째 수정 후의 태그 파라메터 행렬 Hk ×n을 각각 상기 최종 사용자 파라메터 행렬 Wm ×k와 상기 최종 태그 파라메터 행렬 Hk ×n로 확정하는 조작,
    만일 상기 출력 결과가 사전 설정 조건에 부합되지 않는다면, 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k를 수정하여 a+1번째 수정 후의 사용자 파라메터 행렬 Wm ×k를 얻고 또한 상기 a번째 수정 후의 태그 파라메터 행렬 Hk ×n를 수정하여 a+1번째 수정 후의 태그 파라메터 행렬 Hk ×n을 얻으며, a=a+1으로 하고 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k와 상기 a번째 수정 후의 태그 파라메터 행렬 Hk ×n에 따라 상기 m명의 사용자들 중의 매 사용자의 상기 n개의 태그들 중의 매 태그에 대한 선호 정도를 계산하는 단계로부터 상기 단계들을 다시 실행하는 조작을 진행하는데 이용되는 지령을 더 포함하는 것을 특징으로 하는장치.
  21. 청구항 20에 있어서,
    상기 데이터 피팅 모델은,
    Figure pct00085

    이며, 여기서 상기 λ W , λ H λ S 는 오버 피팅을 방지하는데 쓰이는 정규화 파라메터이고, 상기 λ W , λ H λ S 는 양의 실수이고,
    Figure pct00086
    은 행렬의 2노르마이고, 상기 D s 는 상기 M개의 트레이닝 샘플들의 세트를 나타내며, 상기 트레이닝 샘플 <u, i, j>에 대응하는 확률
    Figure pct00087
    이고, 상기
    Figure pct00088
    은 상기 사용자 u의 물품 i에 대한 선호 정도와 상기 사용자 u의 물품 j에 대한 선호 정도의 차값이고, 상기
    Figure pct00089
    는 로지스틱 함수이고, 상기 N u 는 상기 사용자 u와 관련 사용자들의 세트이고, 상기 S uv 는 사용자 유사도 행렬 Sm ×m의 제u행제v렬의 원소이고 상기 S uv 는 상기 사용자 u와 사용자 v 사이의 유사도를 나타내고, 상기 W u 가 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k의 제u행에 대응하는 행 벡터이고, 상기 W v 가 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k의 제v행에 대응하는 행 벡터인 것을 특징으로 하는 장치.
  22. 청구항 21에 있어서,
    상기 한개 혹은 여러개의 프로그램들이,
    상기 m명의 사용자들 중의 매 사용자의 소셜 네트워크 정보를 얻는 것과,
    상기 m명의 사용자들의 소셜 네트워크 정보에 따라 상기 사용자 유사도 행렬 Sm ×m을 생성하는 조작을 진행하는데 이용되는 지령을 더 포함하는 것을 특징으로 하는 장치.
  23. 청구항 21에 있어서,
    상기 한개 혹은 여러개의 프로그램들이,
    이하 공식
    Figure pct00090

    에 의해 상기 a+1번째 수정 후의 사용자 파라메터 행렬 Wm ×k를 계산하는 조작을 진행하는데 이용되는 지령을 더 포함하며,
    여기서 상기
    Figure pct00091
    는 상기 a+1번째 수정 후의 사용자 파라메터 행렬 Wm ×k의 제u행에 대응하는 행 벡터이고, 상기
    Figure pct00092
    는 상기 a번째 수정 후의 사용자 파라메터 행렬 Wm ×k의 제u행에 대응하는 행 벡터이고, 상기
    Figure pct00093
    는 상기 a번째 수정 후의 태그 파라메터 행렬 Hk ×n의 제l렬에 대응하는 렬 벡터의 전치 벡터이고, 상기 l은 1≤l≤n인 정수이고, 상기
    Figure pct00094
    는 학습 효율이고, 상기
    Figure pct00095
    는 양의 실수인 것을 특징으로 하는 장치.
  24. 청구항 21에 있어서,
    상기 한개 혹은 여러개의 프로그램들이,
    이하 공식
    Figure pct00096

    에 의해 상기 a+1번째 태그 파라메터 행렬Hk ×n을 계산하는 조작을 진행하는데 이용되는 지령을 더 포함하며,
    여기서 상기
    Figure pct00097
    는 상기 a+1번째 수정 후의 태그 파라메터 행렬 Hk ×n의 제f행에 대응하는 행 벡터이고, 상기
    Figure pct00098
    는 상기 a번째 수정 후의 태그 파라메터 행렬 Hk×n의 제f행에 대응하는 행 벡터이고, 상기 f는 1≤f≤k인 정수이고, 상기
    Figure pct00099
    는 학습 효율이고, 상기
    Figure pct00100
    는 양의 실수인 것을 특징으로 하는
    Figure pct00101
    Figure pct00102
    장치.
  25. 청구항 19내지 청구항24 중의 어느 한항에 있어서,
    상기 한개 혹은 여러개의 프로그램들이,
    상기 사용자 행위 로그들에 따라 상기 m명의 사용자들 중의 매 사용자의 상기 h개의 물품들 중의 매 물품에 대한 행위 유형을 얻는 것과, 여기서 h는 1보다 큰 정수이고,
    매 사용자의 매 물품에 대한 행위 유형에 따라 상기 M개의 트레이닝 샘플들을 얻는 조작을 진행하는데 이용되는 지령을 더 포함하는 갓을 특징으로 하는 장치.
  26. 청구항 19내지 청구항24 중의 어느 한항에 있어서,
    상기 한개 혹은 여러개의 프로그램들이,
    상기 초기화된 사용자 파라메터 행렬 Wm ×k와 상기 초기화된 태그 파라메터 행렬 Hk ×n을 생성하는 조작을 진행하는데 이용되는 지령을 더 포함하고,
    여기서, 상기 초기화된 사용자 파라메터 행렬 Wm ×k의 원소들은 정규 분포를 띠는 난수이고, 상기 초기화된 태그 파라메터 행렬 Hk ×n의 원소들은 정규 분포를 띠는 난수들인 것을 특징으로 하는 장치.
  27. 청구항 19 내지 청구항24 중의 어느 한항에 있어서,
    상기 한개 혹은 여러개의 프로그램들이,
    상기 사용자 포트레이트 행렬 Pm ×n과 타겟 물품이 가지고 있는 태그들에 따라 상기 사용자 u의 상기 타겟 물품에 대한 선호 정도를 계산하는 조작을 진행하는데 이용되는 지령을 더 포함하는 것을 특징으로 하는 장치.
KR1020187019164A 2016-04-29 2017-04-25 사용자 포트레이트를 획득하는 방법 및 장치 KR102122373B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610284124.6 2016-04-29
CN201610284124.6A CN107341679A (zh) 2016-04-29 2016-04-29 获取用户画像的方法及装置
PCT/CN2017/081928 WO2017186106A1 (zh) 2016-04-29 2017-04-25 获取用户画像的方法及装置

Publications (2)

Publication Number Publication Date
KR20180091043A true KR20180091043A (ko) 2018-08-14
KR102122373B1 KR102122373B1 (ko) 2020-06-12

Family

ID=60160755

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187019164A KR102122373B1 (ko) 2016-04-29 2017-04-25 사용자 포트레이트를 획득하는 방법 및 장치

Country Status (5)

Country Link
US (1) US11394798B2 (ko)
JP (1) JP6615362B2 (ko)
KR (1) KR102122373B1 (ko)
CN (2) CN107341679A (ko)
WO (1) WO2017186106A1 (ko)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019208564A1 (ja) * 2018-04-26 2019-10-31 日本電信電話株式会社 ニューラルネットワーク学習装置、ニューラルネットワーク学習方法、プログラム
CN109063059B (zh) * 2018-07-20 2021-07-27 腾讯科技(深圳)有限公司 行为日志处理方法、装置及电子设备
CN109241461B (zh) * 2018-08-10 2020-05-22 新华三信息安全技术有限公司 一种用户画像构建方法及装置
CN109447717A (zh) * 2018-11-12 2019-03-08 万惠投资管理有限公司 一种标签的确定方法及系统
CN109785034A (zh) * 2018-11-13 2019-05-21 北京码牛科技有限公司 用户画像生成方法、装置、电子设备及计算机可读介质
CN111506617B (zh) * 2019-01-31 2023-10-20 华为技术有限公司 一种基于用户数据生成标签的方法及装置
CN109949076B (zh) * 2019-02-26 2022-02-18 北京首钢自动化信息技术有限公司 建立超球面映射模型的方法、信息推荐方法及装置
CN110049446B (zh) * 2019-03-25 2020-12-29 每日互动股份有限公司 一种基于移动终端数据获取终端用户属性标签的服务器
CN110069706A (zh) * 2019-03-25 2019-07-30 华为技术有限公司 数据处理的方法、端侧设备、云侧设备和端云协同系统
CN110020201B (zh) * 2019-03-26 2021-05-25 中国科学院软件研究所 一种基于用户画像聚类的用户类型自动化标注系统
CN110196849B (zh) * 2019-06-05 2023-04-18 普元信息技术股份有限公司 基于大数据治理技术实现用户画像构建处理的系统及其方法
CN110245296A (zh) * 2019-06-14 2019-09-17 浙江华坤道威数据科技有限公司 一种基于大数据的pas用户画像分析系统及其方法
CN110852338A (zh) * 2019-07-26 2020-02-28 平安科技(深圳)有限公司 用户画像的构建方法及装置
CN110765170A (zh) * 2019-09-26 2020-02-07 维沃移动通信有限公司 一种用户画像的生成方法及可穿戴设备
CN110851581B (zh) * 2019-11-19 2022-11-11 东软集团股份有限公司 一种模型参数确定方法、装置、设备及存储介质
CN110992096B (zh) * 2019-12-03 2023-08-29 秒针信息技术有限公司 预测模型训练方法、装置以及媒体标识预测方法及装置
CN112989179B (zh) * 2019-12-13 2023-07-28 北京达佳互联信息技术有限公司 模型训练、多媒体内容推荐方法和装置
CN111652767B (zh) * 2020-05-21 2021-12-31 上海松鼠课堂人工智能科技有限公司 用户画像构建方法、装置、计算机设备和存储介质
CN111881191B (zh) * 2020-08-05 2021-06-11 留洋汇(厦门)金融技术服务有限公司 移动互联网下的客户画像关键特征挖掘系统与方法
CN112507185B (zh) * 2020-10-22 2022-08-19 复旦大学 用户肖像的确定方法和装置
CN112364008A (zh) * 2020-11-20 2021-02-12 国网江苏省电力有限公司营销服务中心 一种面向电力物联网智能终端的设备画像构建方法
CN112732880A (zh) * 2020-12-30 2021-04-30 平安科技(深圳)有限公司 用户画像生成方法、装置、计算机设备及存储介质
CN113781088A (zh) * 2021-02-04 2021-12-10 北京沃东天骏信息技术有限公司 一种用户标签处理方法、装置和系统
CN112949746B (zh) * 2021-03-23 2022-02-25 中科柏诚科技(北京)股份有限公司 应用于用户行为分析的大数据处理方法及人工智能服务器
CN113033685A (zh) * 2021-04-01 2021-06-25 安徽理工大学 一种航空旅客付费选座意愿画像及分析的方法
CN113065069B (zh) * 2021-04-21 2023-02-28 山大地纬软件股份有限公司 一种基于数据画像的双向就业推荐方法和装置
CN113592590A (zh) * 2021-07-27 2021-11-02 中国联合网络通信集团有限公司 一种用户画像生成方法及装置
US11556935B1 (en) 2021-07-28 2023-01-17 International Business Machines Corporation Financial risk management based on transactions portrait
CN114119058B (zh) * 2021-08-10 2023-09-26 国家电网有限公司 用户画像模型的构建方法、设备及存储介质
CN114722281B (zh) * 2022-04-07 2024-04-12 平安科技(深圳)有限公司 基于用户画像及用户选课行为的培训课程配置方法、装置
CN115567227B (zh) * 2022-12-02 2023-04-07 华南师范大学 一种基于大数据安全的身份认证方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190084866A (ko) * 2016-11-15 2019-07-17 핑안 테크놀로지 (션젼) 컴퍼니 리미티드 시간 인자와 결합한 협업 필터링 방법, 장치, 서버 및 저장 매체

Family Cites Families (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240055B2 (en) * 2003-12-11 2007-07-03 Xerox Corporation Method and system for expertise mapping based on user activity in recommender systems
US7698270B2 (en) * 2004-12-29 2010-04-13 Baynote, Inc. Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge
GB0506618D0 (en) * 2005-04-01 2005-05-11 Wine Science Ltd A method of supplying information articles at a website and system for supplying such articles
JP4353933B2 (ja) * 2005-10-11 2009-10-28 ソニー・エリクソン・モバイルコミュニケーションズ株式会社 通信装置およびコンピュータプログラム
JP4730114B2 (ja) * 2006-01-30 2011-07-20 日本電気株式会社 メッセージ作成支援方法及び携帯端末
US20080235216A1 (en) * 2007-03-23 2008-09-25 Ruttenberg Steven E Method of predicitng affinity between entities
JPWO2009104324A1 (ja) * 2008-02-22 2011-06-16 日本電気株式会社 能動計量学習装置、能動計量学習方法およびプログラム
US20090265328A1 (en) * 2008-04-16 2009-10-22 Yahool Inc. Predicting newsworthy queries using combined online and offline models
JP2009289092A (ja) * 2008-05-30 2009-12-10 Sony Corp 情報処理装置、推薦方法、プログラム及び記録媒体
US8386519B2 (en) * 2008-12-30 2013-02-26 Expanse Networks, Inc. Pangenetic web item recommendation system
US8108406B2 (en) * 2008-12-30 2012-01-31 Expanse Networks, Inc. Pangenetic web user behavior prediction system
US9600581B2 (en) * 2009-02-19 2017-03-21 Yahoo! Inc. Personalized recommendations on dynamic content
US8812362B2 (en) * 2009-02-20 2014-08-19 Yahoo! Inc. Method and system for quantifying user interactions with web advertisements
US8306940B2 (en) * 2009-03-20 2012-11-06 Microsoft Corporation Interactive visualization for generating ensemble classifiers
CN101751448B (zh) * 2009-07-22 2012-06-27 中国科学院自动化研究所 一种基于情景信息的个性化资源信息的推荐方法
US8838587B1 (en) * 2010-04-19 2014-09-16 Google Inc. Propagating query classifications
US8874727B2 (en) * 2010-05-31 2014-10-28 The Nielsen Company (Us), Llc Methods, apparatus, and articles of manufacture to rank users in an online social network
US8606787B1 (en) * 2010-09-15 2013-12-10 Google Inc. Social network node clustering system and method
JP5647500B2 (ja) * 2010-12-06 2014-12-24 富士通テン株式会社 コンテンツ提供サーバ、及び端末装置
BR112013026814A2 (pt) * 2011-04-19 2017-01-10 Nokia Corp método, aparelho, meio de armazenamento legível por computador e produto de programa de computador
US20120297038A1 (en) * 2011-05-16 2012-11-22 Microsoft Corporation Recommendations for Social Network Based on Low-Rank Matrix Recovery
US20150089409A1 (en) * 2011-08-15 2015-03-26 Equal Media Limited System and method for managing opinion networks with interactive opinion flows
US8793593B2 (en) * 2011-09-21 2014-07-29 Facebook, Inc. Integrating structured objects and actions generated on external systems into a social networking system
US9116997B2 (en) * 2011-09-22 2015-08-25 Alibaba.Com Limited Presenting user preference activities
US9082082B2 (en) * 2011-12-06 2015-07-14 The Trustees Of Columbia University In The City Of New York Network information methods devices and systems
US8463295B1 (en) * 2011-12-07 2013-06-11 Ebay Inc. Systems and methods for generating location-based group recommendations
US20130159100A1 (en) * 2011-12-19 2013-06-20 Rajat Raina Selecting advertisements for users of a social networking system using collaborative filtering
US9697529B2 (en) * 2012-03-13 2017-07-04 American Express Travel Related Services Company, Inc. Systems and methods for tailoring marketing
US20130268595A1 (en) * 2012-04-06 2013-10-10 Telefonaktiebolaget L M Ericsson (Publ) Detecting communities in telecommunication networks
CN103377200B (zh) * 2012-04-17 2018-09-04 腾讯科技(深圳)有限公司 用户偏好信息采集方法和装置
US20130311222A1 (en) * 2012-05-21 2013-11-21 Vantage Agora Inc. Social Networking System For Organization Management
CN102722552B (zh) * 2012-05-28 2014-02-26 重庆大学 一种协同过滤推荐模型中调整学习速率的方法
US8984082B2 (en) * 2012-08-29 2015-03-17 Wetpaint.Com, Inc. Personalization based upon social value in online media
CN108648010B (zh) * 2012-09-18 2021-11-05 北京一点网聚科技有限公司 用于向用户提供内容的方法、系统及相应介质
US9058303B2 (en) * 2012-11-30 2015-06-16 Xerox Corporation Convex collective matrix factorization
US9721019B2 (en) * 2012-12-10 2017-08-01 Aol Inc. Systems and methods for providing personalized recommendations for electronic content
JP6101477B2 (ja) * 2012-12-10 2017-03-22 日本放送協会 コンテンツ推薦装置、及びプログラム
US20140214895A1 (en) * 2013-01-31 2014-07-31 Inplore Systems and method for the privacy-maintaining strategic integration of public and multi-user personal electronic data and history
US9002755B2 (en) * 2013-02-05 2015-04-07 scenarioDNA System and method for culture mapping
US10467327B1 (en) * 2013-03-15 2019-11-05 Matan Arazi Real-time event transcription system and method
EP2860940B1 (en) * 2013-09-27 2016-09-14 Alcatel Lucent Method for caching
CN104090886B (zh) * 2013-12-09 2015-09-09 深圳市腾讯计算机系统有限公司 构建用户实时画像的方法及装置
US20150178282A1 (en) * 2013-12-23 2015-06-25 Yahoo! Inc. Fast and dynamic targeting of users with engaging content
CN104750731B (zh) * 2013-12-30 2018-09-21 华为技术有限公司 一种获取完整用户画像的方法及装置
CN103744966B (zh) * 2014-01-07 2018-06-22 Tcl集团股份有限公司 一种物品推荐方法、装置
US9852208B2 (en) * 2014-02-25 2017-12-26 International Business Machines Corporation Discovering communities and expertise of users using semantic analysis of resource access logs
US20190066020A1 (en) * 2014-03-31 2019-02-28 Kountable, Inc. Multi-Variable Assessment Systems and Methods that Evaluate and Predict Entrepreneurial Behavior
EP3126997A4 (en) * 2014-03-31 2017-08-30 Kountable, Inc. Multi-variable assessment systems and methods that evaluate and predict entrepreneurial behavior
US10832349B2 (en) * 2014-06-02 2020-11-10 International Business Machines Corporation Modeling user attitudes toward a target from social media
CN104111969B (zh) * 2014-06-04 2017-06-20 百度移信网络技术(北京)有限公司 一种相似性度量的方法以及系统
US20150379609A1 (en) * 2014-06-30 2015-12-31 Kobo Incorporated Generating recommendations for unfamiliar users by utilizing social side information
US9953086B2 (en) * 2014-07-15 2018-04-24 Microsoft Technology Licensing, Llc Prioritizing media based on social data and user behavior
CN105574730A (zh) * 2014-10-10 2016-05-11 中兴通讯股份有限公司 基于物联网大数据平台的智能用户画像方法及装置
US20160191450A1 (en) * 2014-12-31 2016-06-30 Socialtopias, Llc Recommendations Engine in a Layered Social Media Webpage
US10430829B2 (en) * 2015-10-02 2019-10-01 American Express Travel Related Services Company, Inc. Systems and methods for generating curated and custom content for data-driven applications using closed-loop data
CN105302890A (zh) * 2015-10-16 2016-02-03 海信集团有限公司 一种多媒体内容在线推荐的方法及其辅助方法和装置
US10191988B2 (en) * 2015-10-28 2019-01-29 Sony Mobile Communications Inc. System and method for returning prioritized content

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190084866A (ko) * 2016-11-15 2019-07-17 핑안 테크놀로지 (션젼) 컴퍼니 리미티드 시간 인자와 결합한 협업 필터링 방법, 장치, 서버 및 저장 매체

Also Published As

Publication number Publication date
JP2019503006A (ja) 2019-01-31
US20180316776A1 (en) 2018-11-01
WO2017186106A1 (zh) 2017-11-02
CN110378731A (zh) 2019-10-25
CN110378731B (zh) 2021-04-20
US11394798B2 (en) 2022-07-19
CN107341679A (zh) 2017-11-10
KR102122373B1 (ko) 2020-06-12
JP6615362B2 (ja) 2019-12-04

Similar Documents

Publication Publication Date Title
KR20180091043A (ko) 사용자 포트레이트를 획득하는 방법 및 장치
US10958748B2 (en) Resource push method and apparatus
Sarkar et al. Hands-On Transfer Learning with Python: Implement advanced deep learning and neural network models using TensorFlow and Keras
US10055391B2 (en) Method and apparatus for forming a structured document from unstructured information
CN110363213B (zh) 服装图像的认知分析和分类的方法和系统
US11403532B2 (en) Method and system for finding a solution to a provided problem by selecting a winner in evolutionary optimization of a genetic algorithm
CN111177569A (zh) 基于人工智能的推荐处理方法、装置及设备
EP4181026A1 (en) Recommendation model training method and apparatus, recommendation method and apparatus, and computer-readable medium
CN110147882B (zh) 神经网络模型的训练方法、人群扩散方法、装置及设备
CN111767466B (zh) 基于人工智能的推荐信息推荐方法、装置及电子设备
CN109359247A (zh) 内容推送方法及存储介质、计算机设备
CN108984555A (zh) 用户状态挖掘和信息推荐方法、装置以及设备
Yun et al. Ranking via robust binary classification
CN116821475B (zh) 基于客户数据的视频推荐方法、装置及计算机设备
CN116894711A (zh) 商品推荐理由生成方法及其装置、电子设备
CN111325200A (zh) 图像标注方法、装置、设备及计算机可读存储介质
KR102119518B1 (ko) 인공지능을 이용하여 생성되는 스타일 공간에 기반한 상품 추천 방법 및 시스템
US20230384910A1 (en) Using Attributes for Font Recommendations
CN111737920A (zh) 基于循环神经网络的数据处理方法、设备及介质
US11068802B2 (en) High-capacity machine learning system
CN111340605B (zh) 训练用户行为预测模型、用户行为预测的方法和装置
CN113515701A (zh) 信息推荐方法及装置
CN113076475A (zh) 信息推荐方法、模型训练方法及相关设备
Lakshmi Chetana et al. CF-AMVRGO: Collaborative Filtering based Adaptive Moment Variance Reduction Gradient Optimizer for Movie Recommendations
CN110837596A (zh) 一种智能推荐方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant