KR20220154062A - 내용 추천 및 정렬 모델 훈련 방법, 장치, 기기, 저장 매체 및 컴퓨터 프로그램 - Google Patents
내용 추천 및 정렬 모델 훈련 방법, 장치, 기기, 저장 매체 및 컴퓨터 프로그램 Download PDFInfo
- Publication number
- KR20220154062A KR20220154062A KR1020220144752A KR20220144752A KR20220154062A KR 20220154062 A KR20220154062 A KR 20220154062A KR 1020220144752 A KR1020220144752 A KR 1020220144752A KR 20220144752 A KR20220144752 A KR 20220144752A KR 20220154062 A KR20220154062 A KR 20220154062A
- Authority
- KR
- South Korea
- Prior art keywords
- model
- sub
- feature data
- scene
- training
- Prior art date
Links
- 238000012549 training Methods 0.000 title claims abstract description 142
- 238000000034 method Methods 0.000 title claims abstract description 107
- 238000004590 computer program Methods 0.000 title claims description 17
- 238000012163 sequencing technique Methods 0.000 title abstract 2
- 230000006399 behavior Effects 0.000 claims abstract description 26
- 230000009471 action Effects 0.000 claims description 102
- 230000032683 aging Effects 0.000 claims description 43
- 230000006870 function Effects 0.000 claims description 21
- 238000004891 communication Methods 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 45
- 238000013135 deep learning Methods 0.000 abstract description 2
- 239000000463 material Substances 0.000 description 32
- 238000012545 processing Methods 0.000 description 15
- 230000000694 effects Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 239000010410 layer Substances 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 5
- 238000013136 deep learning model Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000003542 behavioural effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007087 memory ability Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/045—Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
본 개시는 내용 추천 및 정렬 모델 훈련 방법, 장치, 기기 및 저장 매체를 제공하며, 컴퓨터 기술 분야에 관한 것으로, 특히 빅데이터, 딥러닝, 스마트 검색 기술 분야에 관한 것이다. 구체적인 구현 방안은, 추천 예정 장면을 결정하고; 적어도 2개의 서브 모델로부터 추천 예정 장면에 대응되는 타깃 서브 모델을 선택하며; 여기서, 적어도 2개의 서브 모델은 적어도 2개 차원의 서브 모델을 포함하고, 적어도 2개 차원에 대해, 적어도 2개 차원의 서브 모델은 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터에 기반하여 훈련하여 얻는 것이며; 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터는 행위 정보에 기반하여 생성되는 것이고; 행위 정보는 적어도 2개 장면의 행위 정보를 포함하며; 각 타깃 서브 모델의 조합을 사용하여, 추천 예정 장면에 대해 내용 추천을 진행하는 것이다. 본 개시는 각 장면에 대해 모두 하나의 정렬 모델을 생성할 필요 없으므로, 모델 훈련 및 추천 과정을 간략화할 수 있다.
Description
본 개시는 컴퓨터 기술 분야에 관한 것으로, 특히 빅데이터, 딥러닝, 스마트 검색 기술 분야에 관한 것이다.
컴퓨터 기술이 신속하게 발전함에 따라, 점점 많은 내용(즉, 콘텐츠)은 컴퓨터 처리를 통해 취득되고, 처리 완료 후 네트워크를 통해 전송해야 하며, 점점 많은 장면에서 사용자에게 내용 추천을 진행해야 하며, 예를 들면, 뉴스, 비디오 또는 광고 등의 추천이다.
본 개시는 내용 추천 및 정렬 모델 훈련 방법, 장치, 기기 및 저장 매체를 제공한다.
본 개시의 제1 측면에 따르면,
추천 예정 장면을 결정하는 단계;
적어도 2개의 서브 모델로부터 상기 추천 예정 장면에 대응되는 타깃 서브 모델을 선택하는 단계;
각 타깃 서브 모델의 조합을 이용하여, 상기 추천 예정 장면에 대해 내용 추천을 진행하는 단계
를 포함하되, 상기 적어도 2개의 서브 모델은 적어도 2개 차원의 서브 모델을 포함하고, 적어도 2개 차원에 있어서, 상기 적어도 2개 차원의 서브 모델은 범용 특징 데이터 및 상기 적어도 2개 차원의 특징 데이터에 기반하여 훈련하여 얻은 것이며, 상기 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터는 행위 정보에 기반하여 생성되는 것이고, 행위 정보는 적어도 2개 장면의 행위 정보를 포함하는 내용 추천 방법을 제공한다.
본 개시의 제2 측면에 따르면,
적어도 2개 장면의 행위 정보를 취득하는 단계;
상기 행위 정보에 기반하여, 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터를 포함하는 특징 데이터를 생성하는 단계;
적어도 2개 차원에 대해, 상기 범용 특징 데이터 및 상기 적어도 2개의 특징 데이터에 기반하여 상기 적어도 2개 차원의 서브 모델을 훈련하는 단계를 포함하는 정렬 모델 훈련 방법을 제공한다.
본 개시의 제3 측면에 따르면,
추천 예정 장면을 결정하기 위한 결정 모듈;
적어도 2개의 서브 모델로부터 상기 추천 예정 장면에 대응되는 타깃 서브 모델을 선택하기 위한 선택 모듈;
각 타깃 서브 모델의 조합을 이용하여, 상기 추천 예정 장면에 대해 내용 추천을 진행하기 위한 추천 모듈
을 포함하되, 상기 적어도 2개의 서브 모델은 적어도 2개 차원의 서브 모델을 포함하고, 적어도 2개 차원에 있어서, 상기 적어도 2개 차원의 서브 모델은 범용 특징 데이터 및 상기 적어도 2개 차원의 특징 데이터에 기반하여 훈련하여 얻은 것이며, 상기 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터는 행위 정보에 기반하여 생성되는 것이며, 행위 정보는 적어도 2개 장면의 행위 정보를 포함하는 내용 추천 장치를 제공한다.
본 개시의 제4 측면에 따르면,
적어도 2개 장면의 행위 정보를 취득하기 위한 취득 모듈;
상기 행위 정보에 기반하여, 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터를 포함하는 특징 데이터를 생성하기 위한 특징 생성 모듈;
적어도 2개 차원에 대해, 상기 범용 특징 데이터 및 상기 적어도 2개 차원의 특징 데이터에 기반하여 상기 적어도 2개 차원의 서브 모델을 훈련하기 위한 서브 모델 훈련 모듈을 포함하는 정렬 모델 훈련 장치를 제공한다.
본 개시의 제5 측면에 따르면, 적어도 하나의 프로세서; 및 상기 적어도 하나의 프로세서와 통신 연결되는 메모리를 포함하며,
상기 메모리에는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령어가 저장되어 있고, 상기 명령어는 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서로 하여금 제1 측면에 따른 방법을 실행할 수 있게 하는 전자 기기를 제공한다.
본 개시의 제6 측면에 따르면,
적어도 하나의 프로세서; 및
상기 적어도 하나의 프로세서와 통신 연결되는 메모리
를 포함하되, 상기 메모리에는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령어가 저장되어 있고, 상기 명령어는 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서로 하여금 제2 측면에 따른 방법을 실행할 수 있게 하는 전자 기기를 제공한다.
본 개시의 제7 측면에 따르면, 컴퓨터로 하여금 제1 측면에 따른 방법을 실행하게 하기 위한 컴퓨터 명령어가 저장된 비휘발성 컴퓨터 판독가능 저장 매체를 제공한다.
본 개시의 제8 측면에 따르면, 컴퓨터로 하여금 제2 측면에 따른 방법을 실행하게 하기 위한 컴퓨터 명령어가 저장된 비휘발성 컴퓨터 판독가능 저장 매체를 제공한다.
본 개시의 제9 측면에 따르면, 컴퓨터 프로그램을 포함하며, 상기 컴퓨터 프로그램은 프로세서에 의해 실행될 경우, 제1 측면에 따른 방법을 구현하는 컴퓨터 프로그램 제품을 제공한다.
본 개시의 제10 측면에 따르면, 컴퓨터 프로그램을 포함하며, 상기 컴퓨터 프로그램은 프로세서에 의해 실행될 경우, 제2 측면에 따른 방법을 구현하는 컴퓨터 프로그램 제품을 제공한다.
본 개시는 복수의 서브 모델에 기반하여 유연하게 조합하여, 장면 각각에 대해 별도로 정렬 모델을 구성할 필요없이, 각 장면에 대한 타깃성 추천을 구현할 수 있다.
이해해야 할 것은, 본 부분에서 설명되는 내용은 본 개시의 실시예의 핵심적인 특징 또는 중요한 특징을 표시하기 위한 것이 아니며, 본 개시의 범위를 한정하기 위한 것도 아니다. 본 개시의 다른 특징은 아래의 명세서를 통해 쉽게 이해하게 될 것이다.
도면은 본 기술방안을 더 잘 이해하기 위한 것이며, 본 개시를 한정하기 위한 것은 아니다. 여기서,
도 1은 본 개시의 실시예에 의해 제공되는 내용 추천 방법의 흐름도이고;
도 2는 본 개시의 실시예에 의해 제공되는 내용 추천 방법의 다른 흐름도이고;
도 3은 본 개시의 실시예에 의해 제공되는 내용 추천 방법의 또 다른 흐름도이고;
도 4는 본 개시의 실시예에 의해 제공되는 정렬 모델 훈련 방법의 흐름도이고;
도5는 본 개시의 실시예에 의해 제공되는 정렬 모델 훈련 방법을 적용한 예시도이고;
도 6은 본 개시의 실시예에 의해 제공되는 내용 추천 장치의 구조의 예시도이고;
도 7은 본 개시의 실시예에 의해 제공되는 내용 추천 장치의 다른 구조의 예시도이고;
도 8은 본 개시의 실시예에 의해 제공되는 내용 추천 장치의 또 다른 구조의 예시도이고;
도 9는 본 개시의 실시예에 의해 제공되는 정렬 모델 훈련 장치의 구조의 예시도이고;
도 10은 본 개시의 실시예에 의해 제공되는 정렬 모델 훈련 장치의 다른 구조의 예시도이고;
도 11은 본 개시 실시예의 내용 추천 방법을 구현하기 위한 전자 기기의 블록도이며;
도 12는 본 개시 실시예의 정렬 모델 훈련 방법을 구현하기 위한 전자 기기의 블록도이다.
도 1은 본 개시의 실시예에 의해 제공되는 내용 추천 방법의 흐름도이고;
도 2는 본 개시의 실시예에 의해 제공되는 내용 추천 방법의 다른 흐름도이고;
도 3은 본 개시의 실시예에 의해 제공되는 내용 추천 방법의 또 다른 흐름도이고;
도 4는 본 개시의 실시예에 의해 제공되는 정렬 모델 훈련 방법의 흐름도이고;
도5는 본 개시의 실시예에 의해 제공되는 정렬 모델 훈련 방법을 적용한 예시도이고;
도 6은 본 개시의 실시예에 의해 제공되는 내용 추천 장치의 구조의 예시도이고;
도 7은 본 개시의 실시예에 의해 제공되는 내용 추천 장치의 다른 구조의 예시도이고;
도 8은 본 개시의 실시예에 의해 제공되는 내용 추천 장치의 또 다른 구조의 예시도이고;
도 9는 본 개시의 실시예에 의해 제공되는 정렬 모델 훈련 장치의 구조의 예시도이고;
도 10은 본 개시의 실시예에 의해 제공되는 정렬 모델 훈련 장치의 다른 구조의 예시도이고;
도 11은 본 개시 실시예의 내용 추천 방법을 구현하기 위한 전자 기기의 블록도이며;
도 12는 본 개시 실시예의 정렬 모델 훈련 방법을 구현하기 위한 전자 기기의 블록도이다.
아래 도면을 결합하여 본 개시의 예시적인 실시예에 대해 설명한다. 이해를 돕기 위해, 설명에서는 본 개시 실시예의 다양한 세부사항을 포함하며, 이를 단지 예시적인 것으로 간주해야 한다. 따라서, 당업자는 본 개시의 범위 및 사상을 벗어나는 것이 없이, 여기에서 설명되는 실시예에 대해 다양한 변경 및 수정을 진행할 수 있음을 인식해야 한다. 마찬가지로, 명확하고 간결한 설명을 위해, 아래의 설명에서 공지의 기능 및 구조에 대한 설명은 생략한다.
직접 동일한 추천 모델을 사용하여 내용 추천을 진행하거나 또는 각 추천 장면에 대해 별도로 추천 모델을 구축하여 내용 추천을 진행할 수 있다. 하지만, 모든 추천 장면에서 모두 동일한 추천 모델을 직접 사용할 경우, 각 장면에서 사용자의 관심 선호도, 자료 유형 등의 서로 다름에 적응할 수 없으므로, 추천 효과가 좋지 않다. 각 장면에 대해 추천 모델을 각각 구축할 경우, 구축 과정에서, 하나의 장면 추천 모델에 대한 구축은, 해당 장면에서 발생되는 히스토리 사용자 행위 데이터만을 훈련 데이터로 이용하여 훈련을 진행할 수 있으므로, 각 독립 장면에서 사용자 행위 데이터가 비교적 적고, 훈련 데이터가 비교적 적으므로, 모델 러닝에 불리하며, 서로 다른 장면에서의 공통점을 이용할 수 없다.
모든 추천 장면에 대해 모두 동일한 추천 모델을 직접 사용하면, 각 장면에서 사용자의 관심 선호도, 자료 유형 등의 서로 다름에 적응할 수 없으므로, 추천 효과가 좋지 않은 문제가 있다. 그리고, 각 장면에 대해 추천 모델을 독립적으로 훈련하면, 로버스트 딥러닝 모델을 훈련하기 어려운 문제가 있다. 본 개시의 실시예에서는, 서로 다른 장면의 데이터를 함께 융합하여 훈련을 진행하면, 더 큰 훈련 데이터 세트를 생성할 수 있어, 모델 러닝을 도울 수 있으며, 서로 다른 모델의 공통점을 이용하여, 사용자의 관심을 더 전면적으로 반영할 수 있음을 고려하였다.
이에 기반하여, 본 개시의 실시예에서 다중 장면의 사용자 행위 데이터를 사용하여 계층화 모델을 일회적으로 훈련한다. 즉 적어도 2개 차원의 적어도 2개의 서브 모델은, 서로 다른 장면에서 유연한 설정을 통해 치중하는 점이 서로 다른 정렬 모델을 얻으며, 즉 복수의 서브 모델에 기반하여 유연하게 조합함으로써, 각 장면에 대한 타깃성 추천을 구현한다. 예를 들면, 장면과 매칭되는 정렬 모델을 얻을 수 있으다. 이와 같이, 각 장면에 대해 정렬 모델을 별도로 구성할 필요가 없다. 또한, 복수의 장면 데이터를 사용할 경우, 사용자를 더 전면적으로 묘사할 수 있고, 심층적인 사용자의 특징을 발굴할 수 있어, 추천의 효과를 향상할 수 있다.
아래는 본 개시의 실시예에 의해 제공되는 내용 추천 방법에 대해 상세하게 설명한다.
본 개시의 실시예에 의해 제공되는 내용 추천 방법은 전자 기기에 적용될 수 있으며, 구체적으로, 전자 기기는 서버, 단말 기기 등을 포함할 수 있다.
본 개시의 실시예는 내용 추천 방법을 제공하며, 상기 방법은,
추천 예정 장면을 결정하며,
적어도 2개의 서브 모델로부터 추천 예정 장면에 대응되는 타깃 서브 모델을 선택하되, 여기서, 상기 적어도 2개의 서브 모델은 적어도 2개 차원의 서브 모델을 포함하며, 적어도 2개 차원에 대해, 적어도 2개 차원의 서브 모델은 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터를 기반으로 훈련하여 얻은 것이고, 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터는 행위 정보에 기반하여 생성되는 것이며, 행위 정보는 적어도 2개 장면의 행위 정보를 포함하며,
각 타깃 서브 모델의 조합을 이용하여, 추천 예정 장면에 대해 내용 추천을 진행하는 것을 포함할 수 있다.
본 개시의 실시예에서, 추천 예정 장면을 결정한 후, 적어도 2개의 사전에 훈련된 서브 모델로부터 추천 예정 장면에 대응되는 타깃 서브 모델을 선택하고, 각 타깃 서브 모델의 조합을 이용하여, 추천 예정 장면에 대해 내용 추천을 진행할 수 있다. 즉, 복수의 서브 모델에 기반하여 조합하여 상기 추천 예정 장면에 대해 추천을 진행할 수 있다. 이럴 경우, 장면 각각에 대해 모두 하나의 정렬 모델을 생성할 필요가 없으므로, 추천 과정을 간략화할 수 있다.
동시에, 각 장면에서 동일한 정렬 모델을 사용할 경우, 각 장면에서 사용자의 관심 선호도, 자료 유형 등이 서로 다른 것에 적응할 수 없음으로 인해 추천 효과가 좋지 않은 문제를 방지할 수도 있어, 추천 효과를 향상할 수 있다.
또한, 복수 장면의 행위 정보를 이용하여 특징 데이터를 생성하고, 이러한 특징 데이터에 기반하여 서로 다른 차원의 서브 모델을 훈련하여 얻으며, 수량이 비교적 많은 훈련 데이터를 사용하여 모델 훈련을 진행할 수 있고, 각 장면에서의 행위 정보를 충분히 이용하여 모델의 훈련을 진행할 수 있어, 모델의 러닝 능력을 향상할 수 있고, 훈련하여 얻은 모델의 성능을 더 좋게 하고, 나아가 정렬 및 추천 성능을 더 좋게 할 수 있다.
도 1은 본 개시의 실시예에 의해 제공되는 내용 추천 방법의 흐름도이다. 도 1을 참조하면, 본 개시의 실시예에 의해 제공되는 내용 추천 방법은 아래의 단계를 포함할 수 있다.
S101에서, 추천 예정 장면을 결정한다.
간단하게 이해하면, 추천 예정 장면은 어떠한 장면에서 사용자에게 내용을 추천 예정임을 나타낼 수 있다.
구현 가능한 방식에서, 각 추천 장면의 장면 정보를 사전에 저장하고, 현재 추천 장면의 장면 정보를 취득한 후, 해당 장면 정보를 이미 저장된 각 추천 장면 정보와 비교하며, 이 장면 정보는 어느 한 추천 장면의 장면 정보와의 매칭도가 사전에 설정된 매칭도 임계값보다 크면, 현재 추천 예정 장면이 해당 장면 정보와의 매칭도가 사전에 설정된 매칭도 임계값보다 큰 장면 정보에 대응되는 추천 장면인 것으로 결정할 수 있다.
추천 예정 장면은 임의의 추천해야 할 장면일 수 있다. 예를 들면, 내부 교육 비디오의 추천 장면, 포럼 게시물 추천 장면, 동료 동적 추천 장면 등과 같은 사무 분야에서의 추천 장면을 포함할 수 있다.
S102에서, 적어도 2개의 서브 모델로부터 추천 예정 장면에 대응되는 타깃 서브 모델을 선택한다.
여기서, 적어도 2개의 서브 모델은 적어도 2개 차원의 서브 모델을 포함한다.
적어도 2개 차원에 있어서, 적어도 2개 차원의 서브 모델은 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터를 기반으로 훈련하여 얻는 것이다.
간단하게 이해하면, 각 차원의 서브 모델에 있어서, 해당 차원의 서브 모델은 범용 특징 데이터 및 해당 차원의 특징 데이터를 기반으로 훈련하여 얻는 것이다.
범용 특징 데이터 및 적어도 2개 차원의 특징 데이터는 행위 정보에 기반하여 생성되는 것이며, 행위 정보는 적어도 2개 장면의 행위 정보를 포함한다.
행위 정보는 복수의 자료에 대한 복수의 사용자의 행위 정보를 나타낼 수 있다.
예를 들면, 서브 모델은 서브 모델1, 서브 모델2, 서브 모델3 및 서브 모델4를 포함하면, 상기 추천 예정 장면에 대해, 타깃 서브 모델인 서브 모델1, 서브 모델2 및 서브 모델3을 선택하여 해당 추천 예정 장면의 타깃 서브 모델로 한다.
서로 다른 서브 모델의 치중점은 서로 다르며, 실제 적용에서 추천 예정 장면과 각 서브 모델의 관련도에 따라 추천 예정 장면의 타깃 서브 모델을 선택할 수 있다. 여기서, 서로 다른 장면은 추천해야 할 데이터의 유형(비디오, 이미지, 문자)이 서로 다르고, 추천해야 할 데이터의 주제가 서로 다르고, 사용자의 선호도 등이 서로 다르다. 추천 예정 장면에서 추천해야 할 데이터의 유형, 추천해야 할 데이터의 주제 및 사용자의 선호도 등에 기반하여, 추천 장면과 서로 다른 서브 모델의 관련도를 결정할 수 있다.
구현 가능한 방식에서, 본 개시의 실시예에서 사전에 훈련하여 얻은 서브 모델은 사교 서브 모델, 기능 서브 모델, 관심 서브 모델 및 시효 서브 모델을 포함한다. 여기서, 사교 서브 모델, 기능 서브 모델, 관심 서브 모델 및 시효 서브 모델을 훈련하여 얻는 과정은, 복수 장면의 행위 정보를 취득하며, 행위 정보에 기반하여 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터를 포함하는 특징 데이터를 생성하되 여기서, 범용 특징 데이터는 행위 정보에서 사용자 및 자료의 식별자 정보를 포함하며, 범용 특징 데이터 및 사교 특징 데이터에 기반하여 사교 서브 모델을 훈련하는 것을 포함한다. 범용 특징 데이터 및 기능 특징 데이터에 기반하여 기능 서브 모델을 훈련한다. 범용 특징 데이터 및 관심 특징 데이터에 기반하여 관심 서브 모델을 훈련한다. 범용 특징 데이터 및 시효 특징 데이터에 기반하여 시효 서브 모델을 훈련한다.
서로 다른 장면은 추천해야 할 데이터의 유형(비디오, 이미지, 문자)이 서로 다르고, 추천해야 할 데이터의 주제가 서로 다르고, 사용자의 선호도 등이 서로 다르다. 예를 들면, 내부 교육 비디오의 추천 장면에 대해, 추천해야 할 데이터의 주제는 일반적으로 기술 교육 유형의 데이터이며, 이 장면에서 사용자의 선호도는 사용자의 직위와 밀접하게 연관된다. 포럼 게시물 추천 장면에 대해, 추천해야 할 데이터의 주제는 일반적으로 생활, 제품 등 토론 유형의 데이터이며, 이 장면에서 사용자의 선호도는 사용자의 생활에 대한 관심과 밀접하게 연관된다. 동료 동적 추천 장면에 대해, 추천해야 할 데이터의 유형은 일반적으로 짧은 텍스트, 이미지, 짧은 비디오이고, 추천해야 할 데이터의 주제는 일반적으로 사용자가 주동적으로 공유하는 생활 및 일에 관련되는 데이터이며, 이 장면에서 사용자의 선호도는 사용자의 사교 관계와 밀접하게 연관된다.
추천 예정 장면의 추천해야 할 데이터의 유형, 추천해야 할 데이터의 주제, 사용자의 선호도 등에 기반하여 추천 장면과 서로 다른 서브 모델의 관련도를 결정할 수 있다. 나아가, 추천 예정 장면과 서로 다른 서브 모델의 관련도에 기반하여 추천 예정 장면의 타깃 서브 모델을 선택할 수 있다. 예를 들면, 동료 동적 장면과 사교 차원, 관심 차원 및 시효 차원의 관련도가 비교적 높을 경우, 사교 차원에 대응되는 사교 서브 모델, 관심 차원에 대응되는 관심 서브 모델 및 시효 차원에 대응되는 시효 서브 모델을 선택하여, 동료 동적 장면에 대응되는 타깃 서브 모델로 할 수 있다. 예를 들면, 교유 비디오 추천 장면과 사교 차원, 기능 차원, 관심 차원 및 시효 차원의 관련도가 모두 비교적 높을 경우, 사교 차원에 대응되는 사교 서브 모델, 기능 차원에 대응되는 기능 서브 모델, 관심 차원에 대응도는 관심 서브 모델 및 시효 차원에 대응되는 시효 서브 모델을 선택하여 교육 비디오 추천 장면에 대응되는 타깃 서브 모델로 할 수 있다.
S103에서, 각 타깃 서브 모델의 조합을 이용하여, 추천 예정 장면에 대해 내용 추천을 진행한다.
모든 서브 모델을 선택하여 타깃 서브 모델로 하고, 모든 서브 모델에 기반하여 조합하며, 모든 서브 모델의 조합을 이용하여 추천을 진행할 수 있다. 또는, 서브 모델에서의 일부 서브 모델을 선택하여 타깃 서브 모델로 하고, 일부 서브 모델에 기반하여 조합하며, 일부 서브 모델의 조합을 이용하여 추천을 진행할 수도 있다.
예를 들면, 각 자료에 대해, 해당 자료를 각 타깃 서브 모델에 각각 입력한 다음, 각 타깃 서브 모델의 출력에 기반하여 사용자가 자료에 대한 행위를 계산하여 예측한다. 예를 들면, 타깃 서브 모델 각각은 모두 하나의 예측 점수를 출력할 수 있으며, 모든 타깃 서브 모델의 예측 점수에 기반하여 최종적으로 하나의 예측 점수를 산출하여 해당 자료에 대한 사용자의 점수로 한다. 각 자료의 해당 점수에 대해 정렬을 진행하고, 정렬 결과에 기반하여 내용 추천을 진행하며, 예를 들면, 점수가 가장 높은 자료를 선택하여 사용자에게 추천한다.
조합을 진행하는 과정에서, 서로 다른 타깃 서브 모델의 비율은 서로 다르며, 구체적으로는 타깃 서브 모델의 가중치를 통해 구현될 수 있다. 구체적으로, 각 자료에 대해, 각 타깃 서브 모델의 모델 가중치를 결합하여 모든 타깃 서브 모델의 예측 점수의 가중 점수, 예를 들면, 타깃 서브 모델 각각에서 출력되는 예측 점수와 해당 타깃 서브 모델의 모델 가중치의 곱셈의 합을 산출할 수 있다. 각 자료의 가중 점수에 대해 정렬을 진행하여, 정렬 결과에 기반하여 추천을 진행한다. 예를 들면, 가중 점수이 가장 높은 자료를 사용자에게 추천한다.
여기서, 모델 가중치는 타깃 서브 모델을 선택한 후 각 타깃 서브 모델에 대해 대응되는 모델 가중치를 설정할 수 있다. 또는, 타깃 서브 모델을 선택하는 과정에서 모델 가중치를 설정할 수 있다. 타깃 서브 모델의 모델 가중치는 추천 예정 장면과 타깃 서브 모델의 관련도의 높낮이 정도에 기반하여 결정할 수 있다. 예를 들면, 추천 예정 장면과 타깃 서브 모델의 관련도가 높을수록, 해당 타깃 서브 모델의 모델 가중치는 더 크고, 추천 예정 장면과 타깃 서브 모델의 관련도가 낮을수록, 해당 타깃 서브 모델의 모델 가중치는 더 작다.
선택적인 실시예에서, 본 개시의 실시예에서 각 타깃 서브 모델의 조합을 이용하여 해당 추천 예정 장면에 대응되는 정렬 모델을 얻은 다음, 해당 정렬 모델을 이용하여 해당 추천 예정 장면에 대해 내용 추천을 진행한다. 간단하게 이해하면, 먼저 타깃 서브 모델에 기반하여 정렬 모델을 생성한 다음, 해당 정열 모델을 이용하여 해당 추천 예정 장면에 대해 내용 추천을 진행한다.
예를 들면, 동료 동적 장면에 대해, 사교 차원에 대응되는 사교 서브 모델, 관심 차원에 대응되는 관심 서브 모델 및 시효 차원에 대응되는 시효 서브 모델을 선택하여 조합함으로써 동료 동적 장면의 최종적인 정렬 모델을 얻으며, 이 정렬 모델을 이용하여 동료 동적 장면에 대해 내용 추천을 진행한다.
예를 들면, 교육 비디오 추천 장면에 대해, 사교 차원에 대응되는 사교 서브 모델, 기능 차원에 대응되는 기능 서브 모델, 관심 차원에 대응되는 관심 서브 모델 및 시효 차원에 대응되는 시효 서브 모델을 선택하여 조합함으로써 교육 비디오 추천 장면의 최종적인 정렬 모델을 얻으며, 상기 정렬 모델을 이용하여 교육 비디오 추천 장면에 대해 내용 추천을 진행한다.
구현 가능한 방식에서, 각 사용자에 대해, 정렬 모델을 이용하여 복수의 자료에 대한 해당 사용자의 행위에 대해 점수를 예측하고, 점수가 비교적 높은 자료를 선택하여 해당 사용자에게 추천할 수 있다. 예를 들면, 가장 높은 점수에 대응되는 자료를 선택하여 해당 사용자에게 추천할 수 있다.
다른 일 구현 가능한 방식에서, 타깃 서브 모델에 대해 서로 다른 모델 가중치를 설정하며, 각 타깃 서브 모델 및 해당 타깃 서브 모델의 모델 가중치에 기반하여 추천 예정 장면에 대응되는 정렬 모델을 생성할 수 있다. 즉 타깃 서브 모델 및 타깃 서브 모델의 모델 가중치에 기반하여 정렬 모델을 생성하고, 정렬 모델을 이용하여 추천 예정 장면에 대해 내용 추천을 진행할 수 있다.
복수의 자료에 대해, 해당 자료를 추천 예정 장면에 대응되는 타깃 서브 모델에 각각 입력하고, 각 서브 모델에 의해 상기 자료에 대한 예측 점수를 각각 출력할 수 있다. 이 예측 점수는 사용자가 자료에 대해 행위 동작을 진행할 수 있는 확률을 나타낼 수 있고, 해당 정렬 모델은 각 타깃 서브 모델에 의해 출력되는 예측 점수의 가중 점수를 산출하기 위한 것이다.
본 개시의 실시예에서, 복수 장면의 행위 정보로부터 특징 데이터를 생성하고, 이러한 특징 데이터에 기반하여 적어도 2개의 서브 모델을 생성하며, 서로 다른 장면에서 서브 모델을 선택하여 조합을 진행하여, 정렬 및 추천을 진행할 수 있다. 이와 같을 경우, 장면 각각에 대해 모두 하나의 정렬 모델을 생성할 필요가 없으므로, 추천 과정을 간략화할 수 있다. 또한, 각 장면의 데이터를 사용하여 훈련 데이터로 하여, 각 서브 모델을 훈련함으로써, 사용자를 더 전면적으로 설명할 수 있으며, 이와 같이, 이러한 서브 모델에 기반하여 추천을 진행함으로써 추천 효과를 향상할 수 있다.
선택적인 실시예에서, 도 2에 도시된 바와 같이, 본 개시의 실시예에 의해 제공되는 내용 추천 방법은 아래의 단계를 더 포함할 수 있다.
S201에서, 각 서브 모델의 모델 가중치를 수신한다.
예를 들면, 입력 인터페이스를 제공하며, 입력 인터페이스를 이용하여 입력되는 각 서브 모델의 모델 가중치를 수신할 수 있다.
구현 가능한 방식에서, 입력 인터페이스에는 각 서브 모델에 대응되는 모델 가중치 입력란을 포함할 수 있다. 내용 제공자의 백그라운드 측, 예를 들면, 백그라운드 작업자는 입력란에 해당 추천 예정 장면에서의 각 서브 모델의 모델 가중치를 입력할 수 있다. 이와 같이, 전자 기기는 입력 인터페이스를 이용하여 입력되는 각 서브 모델의 모델 가중치를 수신할 수 있다.
서로 다른 장면의 치중점은 서로 다르다. 즉 서로 다른 장면과 서로 다른 서브 모델의 관련도는 서로 다른 것으로 이해할 수 있다. 장면과 서로 다른 서브 모델의 관련도에 따라 서브 모델에 대해 대응되는 모델 가중치를 설정할 수 있다. 이해를 돕고, 계산하기 편리하도록, 일반적인 상황에서, 모델 가중치의 범위는 (0, 1)이고, 각 서브 모델의 모델 가중치의 합은 1이다. 여기서, 서브 모델의 가중치가 0일 경우, 추천 예정 장면과 해당 서브 모델은 관련되지 않음을 나타낸다. 해당 추천 예정 장면에 대해, 해당 추천 예정 장면의 타깃 서브 모델로서 상기 서브 모델을 선택하지 않는 것으로 이해할 수 있다. 다시 말하면, 본 개시의 실시예에서, 서브 모델 가중치가 0이 아닌 서브 모델을 해당 추천 예정 장면에 대응되는 타깃 서브 모델로 한다.
S102는 아래의 단계를 포함할 수 있다.
각 서브 모델에 대해, 서브 모델의 모델 가중치가 0이 아닌 것에 응답하여, 서브 모델을 타깃 서브 모델로 한다.
타깃 서브 모델을 선택하여 얻은 후, 타깃 서브 모델 및 타깃 서브 모델의 모델 가중치의 조합에 기반하여, 해당 추천 예정 장면에 대해 내용 추천을 진행할 수 있다.
복수의 자료에 대해, 해당 자료를 각 타깃 서브 모델에 각각 입력하고, 각 타깃 서브 모델은 해당 자료에 대한 예측 점수를 각각 출력하며, 이 예측 점수는 사용자가 자료에 대해 행위 동작을 진행할 수 있는 확률을 나타낼 수 있다. 그 다음, 타깃 서브 모델 각각의 예측 점수와 상기 타깃 서브 모델의 모델 가중치의 곱셈을 산출하며, 각 타깃 서브 모델에 대응되는 곱셈을 덧셈하여, 각 타깃 서브 모델에 의해 출력되는 예측 점수의 가중 점수를 얻는다. 자료 각각에 대해서는, 그에 대응되는 가중 점수를 각각 산출하여 얻으며, 모든 자료의 가중 점수를 정렬하고, 정렬 결과에 따라 추천을 진행할 수 있다. 예를 들면, 가중 점수이 가장 높은 자료를 선택하여 사용자에게 추천할 수 있다.
구현 가능한 방식에서, 타깃 서브 모델 및 타깃 서브 모델의 모델 가중치에 기반하여, 정렬 모델을 구축할 수 있다.
입력 인터페이스를 이용하여 입력되는 각 서브 모델의 모델 가중치를 수신한 후, 먼저 각 서브 모델의 모델 가중치가 0인지 여부를 판단하며, 모델 가중치가 0이 아닌 서브 모델을 선택하여 추천 예정 장면의 타깃 서브 모델로 할 수 있고, 그 다음, 모델 가중치에 기반하여, 각 타깃 서브 모델을 조합하여 추천 예정 장면에 대응되는 정렬 모델을 얻을 수 있다.
이러한 상황에서, 추천 예정 장면에 대해 각 서브 모델의 모델 가중치를 유연하게 설정 가능하며, 나아가 추천 예정 장면에 대응되는 타깃 서브 모델을 결정할 수 있으며, 서브 모델 및 모델 가중치 조합에 기반하여 추천 예정 장면에 대응되는 정렬 모델을 얻을 수 있으므로, 각 장면에 대해 정렬 모델을 별도로 훈련할 필요 없으며, 모델 훈련 및 추천 과정을 간략화할 수 있다. 또한 타깃 서브 모델 및 타깃 서브 모델의 모델 가중치 조합에 기반하여 추천 예정 장면과 매칭되는 정렬 모델을 얻을 수 있으므로, 이 정렬 모델에 기반하여 추천을 진행하면 상기 추천 예정 장면에 더 적합할 수 있게 하고, 추천 결과를 향상할 수 있다.
선택적인 다른 일 실시예에서, 도 3에 도시된 바와 같이, 본 개시의 실시예에 의해 제공되는 내용 추천 방법은 아래의 단계를 더 포함할 수 있다.
S301에서, 사전에 훈련하여 얻은 각 서브 모델의 범용 모델 가중치를 취득한다.
여기서, 각 서브 모델의 범용 모델 가중치는 각 서브 모델 및 서브 모델을 훈련할 시 사용되는 모든 특징 데이터에 기반하여 훈련하여 얻은 것일 수 있고, 구체적으로 범용 모델 가중치를 훈련하여 얻는 과정은 하기 실시예에서 상세하게 설명될 것이며, 여기에서 반복하여 설명하지 않는다.
S302에서, 추천 예정 장면에 대해, 사전에 훈련하여 얻은 각 서브 모델의 범용 모델 가중치를 조정하여, 추천 예정 장면에 대응되는 각 타깃 서브 모델의 모델 가중치를 얻는다.
범용 모델 가중치의 기초상에서 조정을 진행할 수 있으며, 각 서브 모델의 범용 모델 가중치의 크기 비율 관계에 따라, 각 추천 예정 장면과 각 서브 모델의 관련도를 이용하여 범용 모델 가중치를 조정함으로써, 추천 예정 장면에 대응되는 각 모델 가중치를 얻을 수 있다. 예를 들면, 3개의 서브 모델을 포함하며, 3개의 서브 모델에 각각 대응되는 범용 모델 가중치는 0.1, 0.3 및 0.6이고, 하나의 추천 예정 장면에 대해, 추천 예정 장면의 추천해야 할 데이터의 유형, 추천해야 할 데이터의 주제, 사용자의 선호도 등에 기반하여 추천 장면과 서브 모델2의 관련도가 낮은 것으로 결정할 경우, 서브 모델2의 모델 가중치를 높게 조정할 수 있으며, 예를 들면, 0.2, 0.2 및 0.6으로 조정할 수 있다.
이와 같이, 타깃 서브 모델 및 타깃 서브 모델의 모델 가중치의 조합에 기반하여, 해당 추천 예정 장면에 대해 콘텐츠 추천을 진행할 수 있다.
구현 가능한 방식에서, 타깃 서브 모델 및 타깃 서브 모델의 모델 가중치에 기반하여, 정렬 모델을 구축할 수 있다.
본 개시의 실시예에서, 사전에 훈련하여 얻은 각 서브 모델의 범용 모델 가중치를 참조하여 추천 예정 장면에 대해, 조정하여 추천 예정 장면에 대응되는 각 타깃 서브 모델의 모델 가중치를 얻을 수 있다.
본 개시의 실시예에 의해 제공되는 정렬 모델 훈련 방법은,
적어도 2개 장면의 행위 정보를 취득하는 단계;
행위 정보에 기반하여, 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터를 포함하는 특징 데이터를 생성하는 단계;
적어도 2개 차원에 대해, 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터에 기반하여 적어도 2개 차원의 서브 모델을 훈련하는 단계를 포함할 수 있다.
본 개시의 실시예에서, 적어도 2개 장면의 행위 정보를 이용하여 특징 데이터를 생성하며, 이러한 특징 데이터에 기반하여 적어도 2개 차원의 적어도 2개의 서브 모델을 훈련하여 얻을 수 있고, 범용의 서브 모델을 훈련하여 얻을 수 있다. 이와 같을 경우, 추천 예정 과정에서, 서로 다른 추천 장면에 대해 서브 모델을 유연하게 선택하여 조합 및 추천을 진행할 수 있으며, 각 추천 장면에 대해 정렬 모델을 다시 각각 훈련할 필요 없으므로, 정렬 및 추천 과정이 간략화된다.
또한, 선택될 각 서브 모델은 복수 장면의 행위 정보에 의해 생성된 특징 데이터에 기반하여 훈련하여 얻은 것이고, 수량이 비교적 많은 훈련 데이터를 이용하여 모델 훈련을 진행하여 각 장면에서의 행위 정보를 충분히 이용하여 모델 훈련을 진행하며, 모델의 훈련 능력을 향상함으로써, 훈련하여 얻은 모델 성능을 더 좋아지게 하고, 정렬 및 추천 성능을 더 좋아지게 할 수 있다. 이와 동시에, 각 장면에서 동일한 정렬 모델을 사용함으로 인해, 각 장면에서 사용자의 관심 선호도, 자료 유형 등의 서로 다름에 적응하지 못하며, 추천 효과가 좋지 않은 문제를 방지할 수도 있어, 추천 효과를 향상할 수 있다.
도 4는 본 개시의 실시예에 의해 제공되는 정렬 모델 훈련 방법의 흐름도이다. 도 4를 참조하면, 본 개시의 실시예에 의해 제공되는 정렬 모델 훈련 방법은 아래의 단계를 포함할 수 있다.
S401에서, 적어도 2개 장면의 행위 정보를 취득한다.
여기서, 행위 정보는 자료에 대한 사용자의 행위 정보를 나타낸다.
장면 각각에 대해, 모두 복수의 행위 정보를 취득할 수 있다. 하나의 행위 정보는 하나의 자료에 대한 한 사용자의 행위 정보를 나타내며, 복수의 행위 정보는 복수의 자료에 대한 복수 사용자의 행위 정보를 나타내는 것으로 이해할 수 있다.
적어도 2개 장면의 행위 정보는 훈련 데이터로 이해될 수도 있다. 즉 다중 장면 이벤트 트래킹 로그를 사용하여 훈련 데이터를 생성할 수 있다.
각 장면에 대해, 해당 장면의 행위 로그를 수집할 수 있으며, 해당 장면에서의 행위 정보를 수집하는 것으로 이해할 수도 있다.
적어도 2개 장면의 행위 정보는, 각 장면에 대해, 해당 장면에서 사용자의 id(식별자), 자료의 id, 초상화, 자료의 특징, 대응되는 장면 id, 행위의 시간 및 클릭, 좋아요 누르기, 댓글 쓰기, 즐겨찾기 추가 등과 같은 구체적인 행위를 포함할 수 있다.
S402에서, 행위 정보에 기반하여 특징 데이터를 생성한다.
특징 데이터는 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터를 포함한다.
여기서, 범용 특징 데이터는 행위 정보 중 사용자와 자료의 식별자 정보를 포함한다.
각 행위 정보에 대해, 상기 행위 정보는 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터를 포함하는 것으로 이해할 수 있으며, 여기서, 서로 다른 각도에서 차원을 구분할 수 있다. 예를 들면, 차원은 사용자 차원 및 자료 차원을 포함할 수 있으며 또는, 사교 차원, 기능 차원, 시효 차원 및 관심 차원 등을 포함할 수도 있다.
행위 정보에 기반하여 특징 데이터를 생성하며, 구체적으로, 각 행위 정보에 대해, 범용 각도 및 적어도 2개 차원으로부터, 해당 행위 정보에서 해당 차원에서의 특징 데이터를 추출할 수 있다. 행위 정보 각각에 대해, 해당 행위 정보를 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터를 포함하도록 구분하는 것으로 이해할 수도 있다.
범용 특징 데이터는 복수의 행위 정보에서 추출되는 범용 특징 데이터를 포함하고, 적어도 2개 차원의 특징 데이터도 복수의 행위 정보에서 각각 추출되는 해당 차원에서의 특징 데이터를 포함한다.
S403에서, 적어도 2개 차원에 대해, 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터에 기반하여 적어도 2개 차원의 서브 모델을 훈련한다.
각 차원에 대해, 범용 특징 데이터 및 해당 차원의 특징 데이터에 기반하여 해당 차원의 서브 모델을 훈련하는 것일 수 있다. 이와 같을 경우, 적어도 2개 차원 중 각 차원의 서브 모델을 훈련하여 얻을 수 있다.
서브 모델은 자료에 대한 사용자의 행위를 예측하기 위한 것일 수 있다. 예를 들면, 서브 모델은 사용자가 자료에 대해 진행한 행위의 예측 점수를 출력할 수 있다.
예를 들면, 차원1, 차원2 및 차원3을 포함할 경우, 차원1에 대해, 범용 특징 데이터 및 차원1의 특징 데이터에 기반하여 차원1의 서브 모델을 훈련하고, 즉 범용 특징 데이터 및 복수의 행위 정보로부터 각각 추출되는 차원1에서의 특징 데이터에 기반하여, 차원1의 서브 모델을 훈련하며, 이 서브 모델은 차원1 서브 모델이라고 칭할 수 있다. 차원2에 대해, 범용 특징 데이터 및 차원2의 특징 데이터에 기반하여 차원2의 서브 모델을 훈련하고, 즉 범용 특징 데이터 및 복수의 행위 정보로부터 각각 추출되는 차원2에서의 특징 데이터에 기반하여, 차원2의 서브 모델을 훈련하며, 이 서브 모델은 차원2 서브 모델이라고 칭할 수 있다. 차원3에 대해, 범용 특징 데이터 및 차원3의 특징 데이터에 기반하여 차원3의 서브 모델을 훈련하고, 즉 범용 특징 데이터 및 복수의 행위 정보로부터 각각 추출되는 차원3에서의 특징 데이터에 기반하여, 차원3의 서브 모델을 훈련하며, 이 서브 모델은 차원3 서브 모델이라고 칭할 수 있다. 이와 같을 경우, 3개 차원에 각각 대응되는 서브 모델 차원1 서브 모델, 차원2 서브 모델 및 차원3 서브 모델을 훈련하여 얻을 수 있다.
이와 같이, 추천 과정에서, 추천 예정 장면을 결정한 다음, 적어도 2개의 서브 모델에서 추천 예정 장면에 대응되는 타깃 서브 모델을 선택할 수 있다. 예를 들면, 차원1 서브 모델, 차원2 서브 모델 및 차원3 서브 모델에서 추천 예정 장면에 대응되는 타깃 서브 모델을 선택하고, 타깃 서브 모델에 기반하여 추천 예정 장면에 대응되는 정렬 모델을 구축하며, 정렬 모델을 이용하여 추천 예정 장면에 대해 내용 추천을 진행할 수 있다. 구체적으로, 적어도 2개의 서브 모델에서 타깃 서브 모델을 선택하여 추천 예정 장면에 대응되는 정렬 모델을 구축하고, 추천을 진행하는 과정은 상기 실시예에서 이미 설명되었으며, 여기에서 반복하여 설명하지 않는다.
서브 모델은 딥러닝 모델일 수 있으며, 본 개시의 실시예는 서브 모델의 구조 등에 대해 한정하지 않는다. 구현 가능한 방식에서, 서브 모델은 와이드-앤-딥(wide&deep) 모델로서, 단일층의 와이드(wide) 부분과 복수층의 딥(deep) 부분으로 구성되는 혼합 모델일 수 있다. 여기서, wide 부분의 주요 작용은 모델이 비교적 강한 "기억 능력"을 갖게 하는 것이고, deep 부분의 주요 작용은 모델이 "일반화 능력"을 갖게 하는 것이다. 이러한 구조 특점은, 모델이 로지스틱 회귀와 심층 신경망의 장점을 동시에 구비하게 한다. 본 개시의 실시예에서 서브 모델은 이러한 구조를 적용하며, 서브 모델이 로지스틱 회귀와 심층 신경망을 동시에 구비 가능하도록 할 수 있다.
구현 가능한 방식에서, 특징 데이터를 라벨링할 수 있으며, 예를 들면, 각 차원의 특징 데이터에 대해, 해당 차원의 특징 데이터에 대한 사용자 행위를 라벨링할 수 있으며, 라벨링된 해당 차원의 특징 데이터에 대한 사용자 행위를 진릿값으로 이해할 수 있다.
구체적으로, 어느 한 차원에 대해, 먼저 하나의 딥러닝 모델을 선택하여 초기 모델로 하고, 범용 특징 데이터와 해당 차원의 특징 데이터 및 대응되는 진릿값을 해당 초기 모델에 입력하고, 모델 파라미터를 조정하여, 초기 모델의 출력과 해당 진릿값 사이의 차이가 사전에 설정되는 차이값보다 작게 한다. 해당 차원에서의 복수의 특징 데이터에 대해 상기 모델 파라미터를 조정하는 과정을 각각 실행한다. 해당 차원에서의 하나의 특징 데이터에 대해 상기 모델 파라미터를 조정하는 과정을 실행하는 것을 한차례의 반복적인 것으로 이해할 수 있다. 반복 횟수가 사전에 설정되는 횟수에 도달하거나 모델의 출력과 진릿값 사이의 차이 수렴되어, 여러번의 반복을 거쳐 모델의 출력과 진릿값 사이의 차이가 더 이상 변화하지 않으면, 훈련 과정을 종료하고, 이미 훈련된 해당 차원에서의 서브 모델을 얻을 수 있다. 상기 구체적인 사전에 설정되는 횟수는 실제 수요 또는 경험 등에 따라 결정될 수 있으며, 예를 들어, 1000회, 2000회 등이다.
여기에서 어느 한 차원에서의 서브 모델에 대한 훈련 과정은 단지 예시적인 설명일 뿐이고, 본 개시의 실시예에서는 임의의 구현할 수 있는 모델의 훈련 과정을 적용할 수 있으며, 본 개시의 실시예에서는 구체적인 훈련 방식에 대해 한정하지 않는다. 각 차원에 대응되는 서브 모델의 훈련 과정은 모두 상기 모델의 훈련 과정을 참조할 수 있으며, 또는, 서로 다른 차원의 대응되는 서브 모델을 훈련하는 훈련 과정은 서로 다른 훈련 방식을 적용할 수 있다.
이와 같을 경우, 복수의 장면에서의 행위 정보에 기반하여 서로 다른 차원의 서브 모델을 훈련하여 얻을 수 있다. 서브 모델 각각의 훈련 과정에서는 모두 복수의 장면에서의 행위 정보를 고려하여, 모델 훈련 과정에서 의존하는 훈련 데이터가 더 풍부하도록 하고, 모델의 러닝 능력을 향상할 수 있으며, 훈련하여 얻은 모델의 성능을 향상할 수 있다. 또한 복수의 장면에서의 행위 정보를 종합적으로 고려함으로써, 사용자를 더 풍부하게 묘사할 수 있고, 복수의 장면에서 행위 정보 사이의 공통점 및 연관성을 고려함으로써, 모델이 보다 더 정확하게 훈련되도록 할 수 있으며, 따라서 이러한 서브 모델에 따라 추천할 시의 추천 효과를 향상할 수 있다.
근무 분야에서, 각 추천 장면 사이에 다른 점이 존재하며, 서로 다른 장면의 추천해야 할 데이터의 유형(비디오, 이미지, 문자)이 서로 다르고, 추천해야 할 데이터의 주제가 서로 다르며, 사용자의 선호도 등이 서로 다르다. 예를 들면, 내부 교육 비디오의 추천 장면에 대해, 추천해야 할 데이터의 주제는 일반적으로 기술 교육 유형의 데이터이고, 이 장면에서 사용자의 선호도는 사용자의 직위와 밀접하게 연관된다. 포럼 게시물 추천 장면에 대해, 추천해야 할 데이터의 주제는 일반적으로 생활, 제품 등 토론 유형의 데이터이며, 이 장면에서 사용자의 선호도는 사용자의 생활 관심과 밀접하게 연관된다. 동료 동적 추천 장면에 대해, 추천해야 할 데이터의 유형은 일반적으로 짧은 텍스트, 이미지, 짧은 비디오이고, 추천해야 할 데이터의 주제는 일반적으로 사용자가 주동적으로 공유하는 생활 및 일에 관련되는 데이터이며, 이장면에서 사용자의 선호도는 사용자의 사교 관계와 밀접하게 연관된다. 동시에, 각 추천 장면 사이에도 연관이 존재하며, 예를 들면, 각 추천 장면의 사용자의 집합이 일치하며, 모두 회사 내부 직원이고, 또한 서로 다른 추천 장면의 관심은 교집합 및 심층 연관이 존재한다. 이에 기반하여, 선택적인 실시예에서, 본 개시의 실시예에 의해 제공되는 정렬 모델 훈련 방법은 근무 분야에 적용될 수 있으며, 장면은 근무 분야에서의 내부 교육 비디오의 추천 장면, 포럼 게시물 추천 장면, 동료 동적 추천 장면 등을 포함할 수 있다.
본 개시의 실시예에서 복수의 장면의 행위 정보를 취득하는 단계는, 내부 교육 비디오의 추천 장면, 포럼 게시물 추천 장면, 동료 동적 추천 장면 등의 행위 정보를 취득하며, 이러한 장면에서의 행위 정보에 기반하여 서브 모델을 훈련하는 것을 포함할 수 있다.
S402는, 아래의 것을 포함할 수 있다.
각 행위 정보에 대해, 행위 정보에서의 식별자 정보를 추출하여, 행위 정보에 대응되는 범용 특징 데이터로 하고; 적어도 2개 차원으로부터 행위 정보 중 적어도 2개 차원과 일일이 대응되는 특징 데이터를 각각 추출한다.
여기서, 적어도 2개 차원은 사교 차원, 기능 차원, 관심 차원, 시효 차원 중 적어도 2개 항목을 포함한다.
구체적으로, 각 행위 정보에 대해, 행위 정보에서의 사용자 식별자 정보, 자료 식별자 정보, 자료 작가 식별자 정보 및 장면 식별자 정보를 추출하며, 행위 정보에서의 사용자 식별자 정보, 자료 식별자 정보, 자료 작가 식별자 정보 및 장면 식별자 정보를 행위 정보에 대응되는 범용 특징 데이터로 할 수 있다.
예를 들면, 범용 특징은, 사용자의 유일한 식별자, 자료의 유일한 식별자, 자료 작가의 유일한 식별자, 장면 id이다.
사교 특징은, 동일한 부서의 사용자의 집합, 친밀한 사용자의 집합 및 자료에 대한(발포, 라이크, 댓글 쓰기) 사용자의 행위를 통해 계산하고, 동일한 부서의 사용자의 가중치는 1이며, 친밀한 사용자의 가중치는 친밀도(0~1)이고, 친밀한 사용자의 데이터는 채팅 데이터 등으로부터 발굴할 수 있으며, 최종 특징은 자료 발포자의 가중치, 좋아요를 누른 자의 수량 및 가중치의 덧셈, 댓글을 쓴 자의 수량 및 가중치의 덧셈 등이다.
기능 특징은, 직위 정보, 부서 기능 라벨, 개인 기능 라벨, 자료 부서 라벨, 자료 기능 라벨이다.
관심 특징은, 사용자 관심 라벨, 자료 관심 라벨이며, 라벨은, 예를 들면, 큰 입도 라벨, 작은 입도 라벨 등과 같은 여러 각도의 설명 라벨로 나뉜다.
시효 특징은, 행위 시간, 자료 발포 시간, 자료가 댓글 받은 시간 및/또는 좋아요로 눌러 받은 시간이다.
S403은 아래의 단계를 포함할 수 있다.
사교 차원에 대해, 범용 특징 데이터 및 사교 특징 데이터에 기반하여 사교 서브 모델을 훈련한다.
기능 차원에 대해, 범용 특징 데이터 및 기능 특징 데이터에 기반하여 기능 서브 모델을 훈련한다.
관심 차원에 대해, 범용 특징 데이터 및 관심 특징 데이터에 기반하여 관심 서브 모델을 훈련한다.
시효 차원에 대해, 범용 특징 데이터 및 시효 특징 데이터에 기반하여 시효 서브 모델을 훈련한다.
구체적으로, 각 차원에 대해 해당 차원에 대응되는 서브 모델을 훈련하여 얻는 과정은 상기 실시예에서 이미 상세하게 설명되었으며, 사교 차원에 대해 사교 서브 모델을 훈련하는 과정, 기능 차원에 대해 기능 서브 모델을 훈련하는 과정, 관심 차원에 대해 관심 서브 모델을 훈련하는 과정, 시효 차원에 대해 시효 서브 모델을 훈련하는 과정은, 상기 각 차원에 대해 해당 차원에 대응되는 서브 모델을 훈련하여 얻는 과정을 참조할 수 있으며, 여기에서 반복하여 설명하지 않는다.
사교 차원에 대해, 범용 특징 데이터 및 사교 특징 데이터에 기반하여 사교 서브 모델을 훈련할 경우, 차원을 구체적으로 사교 차원으로 하고, 훈련하는 과정에서 사용되는 차원에 대응되는 특징 데이터를 구체적으로 사교 특징 데이터로 하며, 범용 특징 데이터 및 사교 특징 데이터에 기반하여, 사교 서브 모델을 훈련하여 얻을 수 있다.
기능 차원에 대해, 범용 특징 데이터 및 기능 특징 데이터에 기반하여 기능 서브 모델을 훈련할 경우, 차원을 구체적으로 기능 차원으로 하고, 훈련하는 과정에서 사용되는 차원에 대응되는 특징 데이터를 구체적으로 기능 특징 데이터로 하며, 범용 특징 데이터 및 기능 특징 데이터에 기반하여 기능 서브 모델을 훈련하여 얻을 수 있다.
관심 차원에 대해, 범용 특징 데이터 및 관심 특징 데이터에 기반하여 관심 서브 모델을 훈련할 경우, 차원을 구체적으로 관심 차원으로 하고, 훈련하는 과정에서 사용되는 차원에 대응되는 특징 데이터를 구체적으로 관심 특징 데이터로 하며, 범용 특징 데이터 및 관심 특징 데이터에 기반하여, 관심 서브 모델을 훈련하여 얻을 수 있다.
시효 차원에 대해, 범용 특징 데이터 및 시효 특징 데이터에 기반하여 시효 서브 모델을 훈련할 경우, 차원을 구체적으로 시효 차원으로 하고, 훈련하는 과정에서 사용되는 차원에 대응되는 특징 데이터를 구체적으로 시효 특징 데이터로 하며, 범용 특징 데이터 및 시효 특징 데이터에 기반하여, 시효 서브 모델을 훈련하여 얻을 수 있다.
복수의 자료로부터 자료를 선택하여 사용자에게 추천할 수 있으며, 자료는 사용자에게 추천할 내용으로 이해할 수 있다. 예를 들면, 비디오, 문자, 오디오 등일 수 있다.
하나의 자료에 있어서, 자료의 자료 식별자 정보는 해당 자료와 다른 자료를 구분하기 위한 것이다. 자료 작가 식별자 정보는 자료를 창작하고 업로드하는 사용자의 정보일 수 있다.
사교 차원, 기능 차원, 관심 차원 및 시효 차원으로부터, 행위 정보에서 사교 차원에 대응되는 사교 특징 데이터, 기능 차원에 대응되는 기능 특징 데이터, 관심 차원에 대응되는 관심 특징 데이터 및 시효 차원에 대응되는 시효 특징 데이터를 각각 추출한다.
사교 차원은 사용자의 사교 속성의 각도에서 고려한 차원이다. 예를 들면, 해당 사용자와 빈번하게 인터랙션하는 사용자의 행위, 해당 사용자와 동일한 부서인 사용자와의 행의 등 정보를 고려한 차원이다.
범용 특징 데이터 및 사교 특징 데이터에 기반하여 훈련하여 얻은 사교 서브 모델은, 사교 차원에 대응되는 사교 서브 모델이 사교 속성으로부터 자료에 대한 사용자의 행위를 예측하는 것을 치중점으로 하는 것으로 이해할 수 있으며, 사교 특징 데이터를 이용하여 사용자에게 내용을 추천하는 것을 치중점으로 하는 것으로 이해할 수도 있다.
기능 차원은 사용자의 기능 정보를 고려한 차원이며, 예를 들면, 사용자의 기능, 비디오 생성 부서와 관련되는 비디오 처리 기능과 같은 사용자가 있는 부서의 기능 등 정보를 고려한 차원을 가리킨다.
범용 특징 데이터 및 기능 특징 데이터에 기반하여 훈련하여 얻은 기능 서브 모델은, 기능 차원에 대응되는 기능 서브 모델이며, 기능 정보의 차원으로부터 자료에 대한 사용자의 행위를 예측하는 것을 치중점으로 하는 것으로 이해할 수 있으며, 기능 특징 데이터를 이용하여 사용자에게 내용을 추천하는 것을 치중점으로 하는 것으로 이해할 수도 있다.
시효 차원은 사용자의 행위 시간, 자료와 관련되는 시간, 예를 들면 자료 발포 시간, 좋아요를 누른 시간 및/또는 댓글을 쓴 시간 등과 같은 정보를 고려한 차원을 가리킨다.
범용 특징 데이터 및 시효 특징 데이터에 기반하여 훈련하여 얻은 시효 서브 모델은, 시효 차원에 대응되는 시효 서브 모델이며, 시간의 차원으로부터 자료에 대한 사용자의 행위를 예측하는 것을 치중점으로 하는 것으로 이해할 수 있으며, 시효 특징 데이터를 이용하여 사용자에게 내용을 추천하는 것을 치중점으로 하는 것으로 이해할 수도 있다.
관심 차원은, 예를 들면, 사용자가 빈번하게 클릭하는 자료 등과 같은 사용자 관심을 고려한 차원을 가리킨다.
범용 특징 데이터 및 관심 특징 데이터에 기반하여 훈련하여 얻은 관심 서브 모델은, 관심 차원에 대응되는 관심 서브 모델이며, 관심 있는 각도로부터 자료에 대한 사용자의 행위를 예측하는 것을 치중점으로 하는 것으로 이해할 수 있으며, 관심 특징 데이터를 이용하여 사용자에게 내용을 추천하는 것을 치중점으로 하는 것으로 이해할 수도 있다.
도5에 도시된 바와 같이, 복수 장면의 행위 정보를 통해, 생성되는 사용자 및 자료의 특징은, 사교 특징, 기능 특징, 관심 특징, 시효 특징 및 범용 특징을 포함하며, 사교 특징 및 범용 특징에 기반하여 사교 서브 모델을 훈련하여 얻고, 기능 특징 및 범용 특징에 기반하여 기능 서브 모델을 훈련하여 얻고, 관심 특징 및 범용 특징에 기반하여 관심 서브 모델을 훈련하여 얻으며, 시효 특징 및 범용 특징에 기반하여 시효 서브 모델을 훈련하여 얻는다.
근무 분야에서 복수의 추천 장면의 차이점 및 연관성을 이용하여, 근무 분야의 서브 모델에 적용되는 사교 서브 모델, 기능 서브 모델, 관심 서브 모델 및 시효 서브 모델을 훈련하여 얻을 수 있다. 근무 분야에서의 추천 장면의 경우, 각추천 장면에 대해, 서브 모델을 유연하게 선택하여 조합할 수 있어, 근무 분야에서의 추천 장면에 대해 더 잘 매칭되는 추천을 진행하도록 할 수 있고, 추천 효과를 향상할 수 있으며, 또한 각 추천 장면에 대해 모두 하나의 정렬 모델을 훈련하는 것을 방지하여, 훈련 과정을 간략화 할 수 있고, 따라서 추천 과정을 간략화 할 수 있다. 또한, 서브 모델 각각의 훈련 과정에서 모두 근무 분야의 복수 장면에서의 행위 정보를 고려하여, 모델 훈련 과정에서 의존하는 훈련 데이터가 더 풍부해지고, 모델의 러닝 능력을 향상하며, 훈련하여 얻은 모델의 성능을 향상한다. 또한 복수의 장면에서의 행위 정보를 종합적으로 고려함으로써, 사용자를 더 풍부하게 묘사할 수 있고, 복수의 장면에서 행위 정보 사이의 공통점 및 연관성을 고려함으로써, 모델이 더 정확하게 훈련될 수 있으며, 따라서 이러한 서브 모델에 따라 추천할 시의 추천 효과를 향상할 수 있다.
구체적인 추천 과정에서 각 서브 모델의 전부 또는 일부의 조합에 따라 추천을 진행할 수 있다.
간단하게 이해하면, 각 서브 모델은 하위 계층 모델로 이해할 수 있으며, 나아가 하나의 상위 계층 모델을 훈련할 수 있다. 본 개시의 실시예에서 정렬 모델은 계층화 모델로 이해할 수 있다. 여기서, 상위 계층 모델을 훈련하는 과정은 각 서브 모델에 의해 한세트의 범용 모델 가중치를 훈련하는 것으로 이해할 수 있으며, 상기 상위 계층 모델은 각 서브 모델 및 각 서브 모델에 각각 대응되는 모델 가중치로 구성될 수 있다.
도5에 도시된 바와 같이, 사교 서브 모델, 기능 서브 모델, 관심 서브 모델 및 시효 서브 모델을 이용하여 가중 점수를 산출할 수 있다. 예를 들면, 각 자료에 대해, 해당 자료를 사교 서브 모델, 기능 서브 모델, 관심 서브 모델 및 시효 서브 모델에 각각 입력하고, 사교 서브 모델, 기능 서브 모델, 관심 서브 모델 및 시효 서브 모델에 의해 하나의 예측 점수를 각각 출력하고, 그 다음, 사교 서브 모델, 기능 서브 모델, 관심 서브 모델 및 시효 서브 모델에 기반하여 하나의 예측 점수를 최종적으로 산출하여 해당 자료에 대한 사용자의 점수로 할 수 있다. 각 자료의 해당 점수를 정렬하여, 정렬 결과에 기반하여 내용 추천을 진행한다. 예를 들면, 점수가 가장 높은 자료를 선택하여 사용자에게 추천한다.
선택적인 일 실시예에서, 본 개시의 실시예에 의해 제공되는 정렬 모델의 훈련 방법은 아래의 단계를 더 포함할 수 있다.
적어도 2개 차원의 서브 모델 및 범용 특징 데이터, 적어도 2개 차원의 특징 데이터에 기반하여, 각 서브 모델의 범용 모델 가중치를 훈련한다.
구체적으로, 각 서브 모델을 훈련하여 얻은 후, 각 차원의 서브 모델 및 범용 특징 데이터, 각 차원의 특징 데이터에 기반하여, 각 서브 모델의 범용 모델 가중치를 훈련한다.
각 서브 모델의 범용 모델 가중치 및 각 서브 모델은 공동으로 하나의 상위 계층 정렬 모델을 구성한다. 상위 계층 모델, 즉 상기 상위 계층의 정렬 모델은 모든 서브 모델의 점수를 가중한 총 모델로 이해할 수 있다.
구현 가능한 방식에서, 각 서브 모델의 모델 가중치를 해당 서브 모델의 모델 파라미터로 각각 이해할 수 있다.
범용 모델 가중치를 훈련하는 과정은 모델 파라미터를 조정하는 과정과 유사하다.
구체적으로, 각 특징 데이터에 대해, 특징 데이터를 각 차원의 서브 모델에 각각 입력하고, 각 서브 모델의 범용 모델 가중치를 조정하며, 사전에 설정된 반복 조건에 도달할 경우, 훈련된 각 서브 모델의 범용 모델 가중치를 얻을 수 있다.
범용 모델 가중치를 훈련하는 과정은 범용 특징 데이터 및 각 차원의 특징 데이터를 종합하였으며, 모든 이러한 데이터는 범용 모델 가중치를 훈련하는 훈련 데이터를 구성한다.
예를 들면, 특징 데이터(범용 특징 데이터 및 각 차원의 특징 데이터를 포함) 각각에 대해, 해당 특징 데이터를 각 서브 모델에 각각 입력하고, 각 서브 모델의 모델 가중치를 조정하여, 특징 데이터의 자료 진릿값에 대응되는 각 서브 모델의 최종적인 가중 점수이 가장 높도록 한다.
이와 같이, 각 서브 모델의 범용 모델 가중치를 포함하는 한세트의 모델 가중치를 훈련하여 얻을 수 있다. 이 한 세트의 모델 가중치를 저장하여, 추천 과정에서, 이 한 세트의 모델 가중치를 취득하며, 서로 다른 장면에 대해, 이 한 세트의 모델 가중치에 기반하여 조정을 진행함으로써, 서로 다른 장면에 대응되는 모델 가중치를 얻을 수 있고, 따라서 각 서브 모델 및 모델 가중치에 기반하여 해당 장면에 대한 추천을 진행할 수 있다.
본 개시의 실시예에서, 근무 분야에서 다중 장면을 지원하는 정렬 모델을 위한 생성 방식을 제공할 수 있고, 근무 분야의 추천 장면에서, 통일된 서브 모델을 훈련하여 얻을 수 있으며, 하위 계층화 모델로 이해할 수 있다. 그 다음, 각 추천 장면에 대해, 서로 다른 치중점을 갖고 추천 장면과 매칭되는 정렬 모델을 유연하게 설정하여 추천할 수 있다. 구체적으로, 다중 장면 정렬 모델을 위해 훈련 데이터를 일회적으로 생성할 수 있으며, 딥러닝 모델을 이용하여 통일된 계층화 정렬 모델을 구축할 수 있고, 다중 장면에서 하위 계층 모델을 유연하게 구축함으로써 서로 다른 장면, 서로 다른 특점에 적응되는 상위 계층 정렬 모델을 설정하여 추천을 진행할 수 있다.
본 개시의 실시예는 내용 추천 장치를 더 제공하며, 도 6에 도시된 바와 같이, 아래의 모듈을 포함할 수 있다.
결정 모듈(601)은, 추천 예정 장면을 결정하기 위한 것이다.
선택 모듈(602)은, 적어도 2개의 서브 모델로부터 추천 예정 장면에 대응되는 타깃 서브 모델을 선택하기 위한 것이며, 여기서, 적어도 2개의 서브 모델은 적어도 2개 차원의 서브 모델을 포함하고, 적어도 2개 차원에 있어서, 적어도 2개 차원의 서브 모델은 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터를 기반으로 훈련하여 얻는 것이며, 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터는 행위 정보에 기반하여 생성되는 것이며, 행위 정보는 적어도 2개 장면의 행위 정보를 포함한다.
추천 모듈(603)은, 각 타깃 서브 모델의 조합을 이용하여, 추천 예정 장면에 대해 내용 추천을 진행하기 위한 것이다.
선택적으로, 도 7에 도시된 바와 같이, 상기 내용 추천 장치는 아래의 모듈을 더 포함한다.
수신 모듈(701)은, 각 서브 모델의 모델 가중치를 수신하기 위한 것이다.
선택 모듈(602)은, 구체적으로 각 서브 모델에 대해, 서브 모델의 모델 가중치가 0이 아닌 것에 응답하여, 서브 모델을 타깃 서브 모델로 하기 위한 것이다.
추천 모듈(603)은, 구체적으로 타깃 서브 모델 및 타깃 서브 모델의 모델 가중치의 조합에 기반하여, 추천 예정 장면에 대해 내용 추천을 진행하기 위한 것이다.
선택적으로, 도 8에 도시된 바와 같이, 상기 내용 추천 장치는 아래의 모듈을 더 포함한다.
취득 모듈(801)은, 사전에 훈련하여 얻은 각 서브 모델의 범용 모델 가중치를 취득하기 위한 것이다.
조정 모듈(802)은, 추천 예정 장면에 대해, 사전에 훈련하여 얻은 각 서브 모델의 범용 모델 가중치를 조정하여, 추천 예정 장면에 대응되는 각 타깃 서브 모델의 모델 가중치를 얻기 위한 것이다.
추천 모듈(603)은, 구체적으로 타깃 서브 모델 및 타깃 서브 모델의 모델 가중치의 조합에 기반하여, 추천 예정 장면에 대해 내용 추천을 진행하기 위한 것이다.
본 개시의 실시예에서는 정렬 모델 훈련 장치를 더 제공하며, 도 9에 도시된 바와 같이, 아래의 모듈을 포함할 수 있다.
취득 모듈(901)은, 적어도 2개 장면의 행위 정보를 취득하기 위한 것이다.
특징 생성 모듈(902)은, 행위 정보에 기반하여 특징 데이터를 생성하기 위한 것이며, 특징 데이터는 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터를 포함한다.
서브 모델 훈련 모듈(903)은, 적어도 2개 차원에 대해, 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터에 기반하여 적어도 2개 차원의 서브 모델을 훈련하기 위한 것이다.
선택적으로, 특징 생성 모듈(902)은, 구체적으로, 각 행위 정보에 대해, 행위 정보에서의 식별자 정보를 추출하여, 행위 정보에 대응되는 범용 특징 데이터로 하고, 적어도 2개 차원으로부터 행위 정보 중 적어도 2개 차원과 일일이 대응되는 특징 데이터를 각각 추출하기 위한 것이며, 여기서, 적어도 2개 차원은 사교 차원, 기능 차원, 관심 차원, 시효 차원 중 적어도 2항을 포함한다.
선택적으로, 도 10에 도시된 바와 같이, 상기 정렬 모델 훈련 장치는 아래의 모듈을 더 포함한다.
모델 가중치 훈련 모듈(1001)은, 적어도 2개 차원의 서브 모델 및 범용 특징 데이터, 적어도 2개 차원의 특징 데이터에 기반하여, 각 서브 모델의 범용 모델 가중치를 훈련하기 위한 것이다.
본 개시의 기술방안에서, 언급되는 사용자 개인 정보의 수집, 저장, 사용, 가공, 전송, 제공 및 공개 등 처리는, 모두 관련 법률 법규의 규정에 부합되며, 또한 공서양속에 어긋나지 않는다.
본 개시의 실시예에 따르면, 본 개시는 전자 기기, 판독 가능 저장 매체 및 컴퓨터 프로그램 제품을 더 제공한다.
도 11은 본 개시의 실시예를 구현할 수 있는 전자 기기(1100)의 블록도를 예시적으로 도시하는 것이다. 전자 기기는 랩톱 컴퓨터, 데스크톱 컴퓨터, 워크 스테이션, 개인 휴대 정보 단말기, 서버, 블레이드 서버, 메인 프레임 컴퓨터 및 다른 적합한 컴퓨터 등 다양한 형태의 디지털 컴퓨터를 의미한다. 전자 기기는 개인 디지털 프로세서, 셀룰러 전화, 스마트 폰, 웨어러블 디바이스 및 다른 유형의 컴퓨팅 장치 등 다양한 형태의 이동 장치를 의미할 수도 있다. 본 문장에 개시되는 부품, 이들의 연결과 관계 및 이들의 기능은 오직 예시일 뿐이고, 본 문장에서 설명 및/또는 요구되는 본 개시의 구현을 제한하는 것은 아니다.
도 11에 도시된 바와 같이, 전자 기기(1100)에는 리드 온리 메모리(ROM,1102)에 저장된 컴퓨터 프로그램 또는 저장 유닛(1108)으로부터 랜덤 액세스 메모리(RAM,1103)로 로딩되는 컴퓨터 프로그램에 근거하여 여러가지 적합한 동작과 처리를 실행할 수 있는 컴퓨팅 유닛(1101)이 포함된다. RAM(1103)에는, 전자 기기(1100)의 동작에 필요한 다양한 프로그램 및 데이터가 더 저장될 수 있다. 컴퓨팅 유닛(1101), ROM(1102) 및 RAM(1103)은 버스(1104)를 통해 서로 연결된다. 입력/출력(I/O) 인터페이스(1105)도 버스(1104)에 연결된다.
전자 기기(1100)에서의 복수의 부품은 I/O 인터페이스(1105)에 연결되며, 상기 부품에는, 예를 들면 키보드, 마우스 등과 같은 입력 유닛(1106), 예를 들면 다양한 유형의 디스플레이, 스피커 등과 같은 출력 유닛(1107), 예를 들면 디스크, 광 디스크 등과 같은 저장 유닛(1108); 및 예를 들면 네트워크 카드, 모뎀(modem), 무선통신 송수신기 등과 같은 통신 유닛(1109)이 포함된다. 통신 유닛(1109)은 전자 기기(1100)로 하여금 인터넷과 같은 컴퓨터 네트워크 및/또는 다양한 텔레콤 네트워크를 통해 기타 기기와 정보/데이터를 교환할 수 있게 한다.
컴퓨팅 유닛(1101)은 처리 능력과 컴퓨팅 능력을 갖는 다양한 범용 및/또는 전용 처리 컴포넌트일 수 있다. 컴퓨팅 유닛(1101)의 일부 예시에는, 중앙 처리 유닛(CPU), 그래픽 처리 유닛(GPU), 다양한 전용 인공지능(AI) 컴퓨팅 칩, 머신 러닝 모델 알고리즘을 실행하는 다양한 컴퓨팅 유닛, 디지털 신호 프로세서(DSP) 및 임의의 적합한 프로세서, 컨트롤러, 마이크로 컨트롤러 등이 포함되지만 이에 한정되는 것은 아니다. 컴퓨팅 유닛(1101)은, 예를 들면, 내용 추천 방법과 같은 위에서 설명된 각 방법과 처리를 실행한다. 예를 들면, 일부 실시예에서, 내용 추천 방법은 컴퓨터 소프트웨어 프로그램으로 구현되어, 저장 유닛(1108)과 같은 기계 판독가능 매체에 유형적으로 포함될 수 있다. 일부 실시예에서, 컴퓨터 프로그램의 일부 또는 전부는 ROM(1102) 및/또는 통신 유닛(1109)을 거쳐 전자 기기(1100)에 로딩 및/또는 설치될 수 있다. 컴퓨터 프로그램이 RAM(1103)에 로딩되어 컴퓨팅 유닛(1101)에 의해 실행될 경우, 위에서 설명한 내용 추천 방법의 하나 이상의 단계를 실행할 수 있다. 선택적으로, 기타 실시예에서, 컴퓨팅 유닛(1101)은 기타 임의의 적합한 방식(예를 들면, 펌웨어를 이용함)을 통해 내용 추천 방법을 실행하도록 구성될 수 있다.
도 12는 본 개시의 실시예를 구현할 수 있는 전자 기기(1200)의 블록도를 예시적으로 도시하는 것이다. 전자 기기는 랩톱 컴퓨터, 데스크톱 컴퓨터, 워크 스테이션, 개인 휴대 정보 단말기, 서버, 블레이드 서버, 메인 프레임 컴퓨터 및 다른 적합한 컴퓨터 등 다양한 형태의 디지털 컴퓨터를 의미한다. 전자 기기는 개인 디지털 프로세서, 셀룰러 전화, 스마트 폰, 웨어러블 디바이스 및 다른 유형의 컴퓨팅 장치 등 다양한 형태의 이동 장치를 의미할 수도 있다. 본 문장에 개시되는 부품, 이들의 연결과 관계 및 이들의 기능은 오직 예시일 뿐이고, 본 문장에서 설명 및/또는 요구되는 본 개시의 구현을 제한하는 것은 아니다.
도 12에 도시된 바와 같이, 전자 기기(1200)에는 리드 온리 메모리(ROM,1202)에 저장된 컴퓨터 프로그램 또는 저장 유닛(1208)으로부터 랜덤 액세스 메모리(RAM,1203)로 로딩되는 컴퓨터 프로그램에 근거하여 여러가지 적합한 동작과 처리를 실행할 수 있는 컴퓨팅 유닛(1201)이 포함된다. RAM(1203)에는, 전자 기기(1200)의 동작에 필요한 다양한 프로그램 및 데이터가 더 저장될 수 있다. 컴퓨팅 유닛(1201), ROM(1202) 및 RAM(1203)은 버스(1204)를 통해 서로 연결된다. 입력/출력(I/O) 인터페이스(1205)도 버스(1204)에 연결된다.
전자 기기(1200)에서의 복수의 부품은 I/O 인터페이스(1205)에 연결되며, 상기 부품에는, 예를 들면 키보드, 마우스 등과 같은 입력 유닛(1206), 예를 들면 다양한 유형의 디스플레이, 스피커 등과 같은 출력 유닛(1207), 예를 들면 디스크, 광 디스크 등과 같은 저장 유닛(1208); 및 예를 들면 네트워크 카드, 모뎀(modem), 무선통신 송수신기 등과 같은 통신 유닛(1209)이 포함된다. 통신 유닛(1209)은 전자 기기(1200)로 하여금 인터넷과 같은 컴퓨터 네트워크 및/또는 다양한 텔레콤 네트워크를 통해 기타 기기와 정보/데이터를 교환할 수 있게 한다.
컴퓨팅 유닛(1201)은 처리 능력과 컴퓨팅 능력을 갖는 다양한 범용 및/또는 전용 처리 컴포넌트일 수 있다. 컴퓨팅 유닛(1201)의 일부 예시에는, 중앙 처리 유닛(CPU), 그래픽 처리 유닛(GPU), 다양한 전용 인공지능(AI) 컴퓨팅 칩, 머신 러닝 모델 알고리즘을 실행하는 다양한 컴퓨팅 유닛, 디지털 신호 프로세서(DSP) 및 임의의 적합한 프로세서, 컨트롤러, 마이크로 컨트롤러 등이 포함되지만 이에 한정되는 것은 아니다. 컴퓨팅 유닛(1201)은, 예를 들면, 정렬 모델 훈련 방법과 같은 위에서 설명된 각 방법과 처리를 실행한다. 예를 들면, 일부 실시예에서, 정렬 모델 훈련 방법은 컴퓨터 소프트웨어 프로그램으로 구현되어, 저장 유닛(1208)과 같은 기계 판독가능 매체에 유형적으로 포함될 수 있다. 일부 실시예에서, 컴퓨터 프로그램의 일부 또는 전부는 ROM(1202) 및/또는 통신 유닛(1209)을 거쳐 전자 기기(1200)에 로딩 및/또는 설치될 수 있다. 컴퓨터 프로그램이 RAM(1203)에 로딩되어 컴퓨팅 유닛(1201)에 의해 실행될 경우, 위에서 설명한 정렬 모델 훈련 방법의 하나 이상의 단계를 실행할 수 있다. 선택적으로, 기타 실시예에서, 컴퓨팅 유닛(1201)은 기타 임의의 적합한 방식(예를 들면, 펌웨어를 이용함)을 통해 정렬 모델 훈련 방법을 실행하도록 구성될 수 있다.
본 문에서 상기 설명한 시스템 및 기술의 다양한 실시형태는 디지털 전자 회로 시스템, 집적 회로 시스템, 현장 프로그래밍 가능 게이트 어레이(FPGA), 전용 집적 회로(ASIC), 전용 표준 제품(ASSP), 시스템 온 칩 시스템(SOC), 복잡 프로그래밍 가능 로직 디바이스(CPLD), 컴퓨터 하드웨어, 펌웨어, 소프트웨어 및/또는 이들의 조합에서 구현될 수 있다. 상기 다양한 실시형태는 다음과 같은 내용을 포함할 수 있다. 하나 이상의 컴퓨터 프로그램에서 실시되고, 상기 하나 이상의 컴퓨터 프로그램은 적어도 하나의 프로그래밍 가능 프로세서를 포함하는 프로그래밍 가능 시스템에서 실행 및/또는 해석될 수 있다. 상기 프로그래밍 가능 프로세서는 전용 또는 범용 프로그래밍 가능 프로세서일 수 있으며, 저장 시스템, 적어도 하나의 입력 장치 및 적어도 하나의 출력 장치로부터 데이터 및 명령어를 수신하며, 또한 상기 저장 시스템, 적어도 하나의 입력 장치 및 적어도 하나의 출력 장치에 데이터 및 명령어를 전송할 수 있다.
본 개시의 방법을 실시하기 위한 프로그램 코드는 하나 이상의 프로그래밍 언어의 임의의 조합을 적용하여 작성할 수 있다. 프로그램 코드가 프로세서 또는 컨트롤러에 의해 실행될 시 흐름도 및/또는 블록도에서 규정된 기능/동작이 실시되도록, 이러한 프로그램 코드를 범용 컴퓨터, 전용 컴퓨터 또는 기타 프로그래밍 가능 데이터 처리 장치의 프로세서 또는 컨트롤러에 제공할 수 있다. 프로그램 코드는 완전히 기계에서 실행되거나, 부분적으로 기계에서 실행되거나, 개별적인 소프트웨어 패키지(Software Package)로서 부분적으로 기계에서 실행되며, 부분적으로 원격 기계에서 실행되거나, 완전히 원격 기계 또는 서버에서 실행될 수 있다.
본 개시의 콘텍스트에서, 기계 판독가능 매체는 유형적인 매체일 수 있다. 상기 기계 판독가능 매체에는, 명령어 실행 시스템, 장치 또는 기기에 사용되거나 또는 명령어 실행 시스템, 장치 또는 기기와 결합하여 사용되게끔 제공되는 프로그램이 포함되거나 저장될 수 있다. 기계 판독가능 매체는 기계 판독가능 신호 매체 또는 기계 판독가능 저장 매체일 수 있다. 기계 판독가능 매체에는, 전자, 자성, 광학, 전자기, 적외선 또는 반도체 시스템, 장치 또는 기기, 또는 상기 내용의 임의의 적합한 조합이 포함될 수 있지만 이에 한정되는 것은 아니다. 기계 판독가능 저장 매체의 더 구체적인 예시에는 하나 이상의 와이어에 의한 전기적인 연결, 휴대용 컴퓨터 디스크, 하드디스크, 랜덤 액세스 메모리(RAM), 리드 온리 메모리(ROM), 소거 가능 및 프로그램 가능 리드 온리 메모리(EPROM 또는 플래시 메모리), 광섬유,휴대용 콤팩트 디스크 리드 온리 메모리(CD-ROM), 광학 저장 장치, 자기 저장 장치 또는 상기 내용의 임의의 적합한 조합이 포함될 수 있다.
사용자와의 인터랙션을 제공하기 위해, 여기에서 설명하는 시스템과 기술을 컴퓨터에서 실행할 수 있다. 상기 컴퓨터는 사용자에게 정보를 표시하기 위한 디스플레이 장치(예를 들면, CRT(음극선관) 또는 LCD(액정 디스플레이) 모니터) 및 키보드, 포인팅 장치(예를 들면, 마우스 또는 트랙 볼)를 포함한다. 사용자는 상기 키보드 및 포인팅 장치를 통해 입력을 컴퓨터에 제공한다. 기타 종류의 장치는 사용자와의 인터랙션을 제공하기 위해 사용될 수도 있다. 예를 들면, 사용자에게 제공하는 피드백은 임의의 형태의 센싱 피드백(예를 들면, 시각 피드백, 청각 피드백 또는 촉각 피드백)일 수 있으며, 또한 사용자로부터의 입력은 임의의 형태(소리 입력, 음성 입력 또는 촉각 입력을 포함)로 수신될 수 있다.
여기에서 설명하는 시스템 및 기술을 백그라운드 부품을 포함하는 컴퓨팅 시스템(예를 들면, 데이터 서버), 또는 미들웨어 부품을 포함하는 컴퓨팅 시스템(예를 들면, 애플리케이션 서버), 또는 프론트 부품을 포함하는 컴퓨팅 시스템(예를 들면, 그래픽 유저 인터페이스 또는 웹 브라우저를 구비하는 사용자 컴퓨터, 사용자는 상기 그래픽 유저 인터페이스 또는 웹 브라우저를 통해 여기에서 설명하는 시스템 및 기술의 실시형태와 인터랙션을 진행할 수 있음), 또는 상기 백그라운드 부품, 미들웨어 부품 또는 프론트 부품의 임의의 조합을 포함하는 컴퓨팅 시스템에서 실행할 수 있다. 임의의 형태 또는 매체의 디지털 데이터 통신(예를 들면, 통신 네트워크)을 통해 시스템의 부품을 서로 연결할 수 있다. 통신 네트워크의 예시는 근거리 통신망(LAN), 광대역 통신망(WAN) 및 인터넷을 포함한다.
컴퓨터 시스템은 클라이언트 및 서버를 포함한다. 클라이언트 및 서버는 일반적으로 서로 멀리 떨어져 있으며, 통신망을 통해 인터랙션을 진행한다. 해당 컴퓨터에서 실행되고, 또한 서로 클라이언트-서버 관계를 갖는 컴퓨터 프로그램을 통해 클라이언트 및 서버의 관계를 생성한다. 서버는 클라우드 서버일 수 있으며, 분산 시스템의 서버, 또는 블록체인을 결합한 서버일 수도 있다.
상기의 다양한 형태의 프로세스를 이용하여, 단계를 다시 순서 배열, 추가 또는 삭제할 수 있음을 이해해야 한다. 예를 들면, 본 개시에 기재된 각 단계는 병행하여 실행할 수 있고, 순서대로 실행할 수도 있으며, 서로 다른 순서로 실행할 수도 있는데, 본 개시에 의해 개시되는 기술방안이 기대하는 결과를 구현할 수만 있다면, 이에 대해 제한하지 않는다.
상기 구체적인 실시형태는 본 개시의 보호 범위에 대해 제한하지 않는다. 당업자는 설계 요구와 기타 요인에 따라 다양한 수정, 조합, 서브 조합 및 대체를 진행할 수 있음을 이해해야 한다. 본 개시의 사상 및 원칙 내에서 진행되는 수정, 균등한 교체 및 개선 등은 모두 본 개시의 보호 범위에 포함되어야 한다.
Claims (15)
- 내용 추천 방법으로서,
추천 예정 장면을 결정하는 단계;
적어도 2개의 서브 모델로부터 상기 추천 예정 장면에 대응되는 타깃 서브 모델을 선택하는 단계;
각 타깃 서브 모델의 조합을 이용하여, 상기 추천 예정 장면에 대해 내용 추천을 진행하는 단계
를 포함하되, 상기 적어도 2개의 서브 모델은 적어도 2개 차원의 서브 모델을 포함하고, 적어도 2개 차원에 있어서, 상기 적어도 2개 차원의 서브 모델은 범용 특징 데이터 및 상기 적어도 2개 차원의 특징 데이터에 기반하여 훈련하여 얻은 것이며, 상기 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터는 행위 정보에 기반하여 생성된 것이고, 행위 정보는 적어도 2개 장면의 행위 정보를 포함하는, 내용 추천 방법. - 청구항 1에 있어서,
각 서브 모델의 모델 가중치를 수신하는 단계를 더 포함하되,
상기 적어도 2개의 서브 모델로부터 상기 추천 예정 장면에 대응되는 타깃 서브 모델을 선택하는 단계는,
각 서브 모델에 대해, 상기 서브 모델의 모델 가중치가 0이 아닌 것에 응답하여, 상기 서브 모델을 타깃 서브 모델로 하는 단계를 포함하고,
상기 각 타깃 서브 모델의 조합을 이용하여, 상기 추천 예정 장면에 대해 내용 추천을 진행하는 단계는,
상기 타깃 서브 모델 및 상기 타깃 서브 모델의 모델 가중치의 조합에 기반하여, 상기 추천 예정 장면에 대해 내용 추천을 진행하는 단계를 포함하는, 내용 추천 방법. - 청구항 1에 있어서,
사전에 훈련하여 얻은 각 서브 모델의 범용 모델 가중치를 취득하는 단계;
상기 추천 예정 장면에 대해, 사전에 훈련하여 얻은 각 서브 모델의 범용 모델 가중치를 조정하여, 상기 추천 예정 장면에 대응되는 각 타깃 서브 모델의 모델 가중치를 얻는 단계
를 더 포함하되, 상기 각 타깃 서브 모델의 조합을 이용하여, 상기 추천 예정 장면에 대해 내용 추천을 진행하는 단계는,
상기 타깃 서브 모델 및 상기 타깃 서브 모델의 모델 가중치의 조합에 기반하여, 상기 추천 예정 장면에 대해 내용 추천을 진행하는 단계를 포함하는, 내용 추천 방법. - 정렬 모델 훈련 방법으로서,
적어도 2개 장면의 행위 정보를 취득하는 단계;
상기 행위 정보에 기반하여, 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터를 포함하는 특징 데이터를 생성하는 단계;
적어도 2개 차원에 대해, 상기 범용 특징 데이터 및 상기 적어도 2개의 특징 데이터에 기반하여 적어도 2개 차원의 서브 모델을 훈련하는 단계
를 포함하는, 정렬 모델 훈련 방법. - 청구항 4에 있어서,
상기 행위 정보에 기반하여 특징 데이터를 생성하는 단계는,
각 행위 정보에 대해, 상기 행위 정보에서의 식별자 정보를 추출하여, 상기 행위 정보에 대응되는 범용 특징 데이터로 하는 단계;
적어도 2개 차원으로부터 상기 행위 정보 중 상기 적어도 2개 차원과 일일이 대응되는 특징 데이터를 각각 추출하는 단계
를 포함하되, 상기 적어도 2개 차원은 사교 차원, 기능 차원, 관심 차원, 시효 차원 중 적어도 2항을 포함하는, 정렬 모델 훈련 방법. - 청구항 4에 있어서,
적어도 2개 차원의 서브 모델 및 상기 범용 특징 데이터, 적어도 2개 차원의 특징 데이터에 기반하여, 각 서브 모델의 범용 모델 가중치를 훈련하는 단계를 더 포함하는, 정렬 모델 훈련 방법. - 내용 추천 장치로서,
추천 예정 장면을 결정하기 위한 결정 모듈;
적어도 2개의 서브 모델로부터 상기 추천 예정 장면에 대응되는 타깃 서브 모델을 선택하기 위한 선택 모듈;
각 타깃 서브 모델의 조합을 이용하여, 상기 추천 예정 장면에 대해 내용 추천을 진행하기 위한 추천 모듈
을 포함하되, 상기 적어도 2개의 서브 모델은 적어도 2개 차원의 서브 모델을 포함하고, 적어도 2개 차원에 있어서, 상기 적어도 2개 차원의 서브 모델은 범용 특징 데이터 및 상기 적어도 2개 차원의 특징 데이터에 기반하여 훈련하여 얻은 것이며, 상기 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터는 행위 정보에 기반하여 생성된 것이며, 행위 정보는 복수 장면의 행위 정보를 포함하는, 내용 추천 장치. - 청구항 7에 있어서,
각 서브 모델의 모델 가중치를 수신하기 위한 수신 모듈을 더 포함하며,
상기 선택 모듈은, 구체적으로 각 서브 모델에 대해, 상기 서브 모델의 모델 가중치가 0이 아닌 것에 응답하여, 상기 서브 모델을 타깃 서브 모델로 하기 위한 것이고,
상기 추천 모듈은, 구체적으로 상기 타깃 서브 모델 및 상기 타깃 서브 모델의 모델 가중치의 조합에 기반하여, 상기 추천 예정 장면에 대해 내용 추천을 진행하기 위한 것인, 내용 추천 장치. - 청구항 7에 있어서,
사전에 훈련하여 얻은 각 서브 모델의 범용 모델 가중치를 취득하기 위한 취득 모듈;
상기 추천 예정 장면에 대해, 사전에 훈련하여 얻은 각 서브 모델의 범용 모델 가중치를 조정하여, 상기 추천 예정 장면에 대응되는 각 타깃 서브 모델의 모델 가중치를 얻기 위한 조정 모듈
을 포함하되, 상기 추천 모듈은, 구체적으로 상기 타깃 서브 모델 및 상기 타깃 서브 모델의 모델 가중치의 조합에 기반하여, 상기 추천 예정 장면에 대해 내용 추천을 진행하기 위한 것인, 내용 추천 장치. - 정렬 모델 훈련 장치로서,
적어도 2개 장면의 행위 정보를 취득하기 위한 취득 모듈;
상기 행위 정보에 기반하여, 범용 특징 데이터 및 적어도 2개 차원의 특징 데이터를 포함하는 특징 데이터를 생성하기 위한 특징 생성 모듈;
적어도 2개 차원에 대해, 상기 범용 특징 데이터 및 상기 적어도 2개 차원의 특징 데이터에 기반하여 상기 적어도 2개 차원의 서브 모델을 훈련하기 위한 서브 모델 훈련 모듈을 포함하는, 정렬 모델 훈련 장치. - 청구항 10에 있어서,
상기 특징 생성 모듈은, 구체적으로, 각 행위 정보에 대해, 상기 행위 정보에서의 식별자 정보를 추출하여, 상기 행위 정보에 대응되는 범용 특징 데이터로 하고, 적어도 2개 차원으로부터 상기 행위 정보 중 상기 적어도 2개 차원과 일일이 대응되는 특징 데이터를 각각 추출하기 위한 것이며,
상기 적어도 2개 차원은 사교 차원, 기능 차원, 관심 차원, 시효 차원 중 적어도 2항을 포함하는, 정렬 모델 훈련 장치. - 청구항 11에 있어서,
적어도 2개 차원의 서브 모델 및 상기 범용 특징 데이터, 적어도 2개 차원의 특징 데이터에 기반하여, 각 서브 모델의 범용 모델 가중치를 훈련하기 위한 모델 가중치 훈련 모듈을 더 포함하는, 정렬 모델 훈련 장치. - 전자 기기로서,
적어도 하나의 프로세서; 및
상기 적어도 하나의 프로세서와 통신 연결되는 메모리
를 포함하되, 상기 메모리에는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령어가 저장되어 있고, 상기 명령어는 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서로 하여금 청구항 1 내지 청구항 6 중 어느 한 항에 따른 방법을 실행할 수 있게 하는, 전자 기기. - 컴퓨터로 하여금 청구항 1 내지 청구항 6 중 어느 한 항에 따른 방법을 실행하게 하기 위한 컴퓨터 명령어가 저장된, 비휘발성 컴퓨터 판독가능 저장 매체.
- 저장 매체에 저정되어 있으며, 프로세서에 의해 실행될 경우, 청구항 1 내지 청구항 6 중 어느 한 항에 따른 방법을 구현하는, 컴퓨터 프로그램.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111443352.0A CN114036398B (zh) | 2021-11-30 | 2021-11-30 | 内容推荐和排序模型训练方法、装置、设备以及存储介质 |
CN202111443352.0 | 2021-11-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220154062A true KR20220154062A (ko) | 2022-11-21 |
Family
ID=80139245
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220144752A KR20220154062A (ko) | 2021-11-30 | 2022-11-02 | 내용 추천 및 정렬 모델 훈련 방법, 장치, 기기, 저장 매체 및 컴퓨터 프로그램 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP4134900A3 (ko) |
JP (1) | JP7498248B2 (ko) |
KR (1) | KR20220154062A (ko) |
CN (1) | CN114036398B (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116610745A (zh) * | 2023-06-08 | 2023-08-18 | 云南庸目科技有限公司 | 应用数字孪生技术的ai场景信息推送处理方法及系统 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116204700A (zh) * | 2022-08-03 | 2023-06-02 | 北京百度网讯科技有限公司 | 目标排序模型的训练方法、目标排序方法及装置 |
CN115293291B (zh) * | 2022-08-31 | 2023-09-12 | 北京百度网讯科技有限公司 | 排序模型的训练方法、排序方法、装置、电子设备及介质 |
CN115423559B (zh) * | 2022-09-06 | 2024-05-14 | 湖南恒达讯飞科技有限公司 | 一种基于虚拟vr技术的家居产品线上展览展示方法 |
CN117455573B (zh) * | 2023-10-26 | 2024-08-09 | 深圳市维卓数字营销有限公司 | 一种互联网数据分析方法及系统 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101324948B (zh) * | 2008-07-24 | 2015-11-25 | 阿里巴巴集团控股有限公司 | 一种信息推荐的方法及装置 |
JP5409268B2 (ja) * | 2009-10-30 | 2014-02-05 | 株式会社日立ソリューションズ | 情報提示装置及び携帯端末 |
US9582547B2 (en) | 2013-11-18 | 2017-02-28 | Palo Alto Research Center Incorporated | Generalized graph, rule, and spatial structure based recommendation engine |
US10904360B1 (en) | 2015-12-02 | 2021-01-26 | Zeta Global Corp. | Method and apparatus for real-time personalization |
CN109783539A (zh) * | 2019-01-07 | 2019-05-21 | 腾讯科技(深圳)有限公司 | 用户挖掘及其模型构建方法、装置及计算机设备 |
CN110162703B (zh) | 2019-05-13 | 2024-08-20 | 深圳市雅阅科技有限公司 | 内容推荐方法、训练方法、装置、设备及存储介质 |
CN111008332B (zh) * | 2019-12-03 | 2023-04-07 | 深圳市雅阅科技有限公司 | 内容项推荐方法、装置、服务器以及存储介质 |
CN111950593A (zh) * | 2020-07-13 | 2020-11-17 | 华为技术有限公司 | 一种推荐模型训练的方法及装置 |
CN113536105A (zh) * | 2020-11-05 | 2021-10-22 | 腾讯科技(深圳)有限公司 | 推荐模型训练方法和装置 |
CN112950328A (zh) * | 2021-03-24 | 2021-06-11 | 第四范式(北京)技术有限公司 | 一种组合对象推荐方法、装置、系统和存储介质 |
-
2021
- 2021-11-30 CN CN202111443352.0A patent/CN114036398B/zh active Active
-
2022
- 2022-11-02 KR KR1020220144752A patent/KR20220154062A/ko unknown
- 2022-11-04 JP JP2022177444A patent/JP7498248B2/ja active Active
- 2022-11-30 EP EP22210615.5A patent/EP4134900A3/en not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116610745A (zh) * | 2023-06-08 | 2023-08-18 | 云南庸目科技有限公司 | 应用数字孪生技术的ai场景信息推送处理方法及系统 |
CN116610745B (zh) * | 2023-06-08 | 2023-12-26 | 深圳市巨灵数字有限公司 | 应用数字孪生技术的ai场景信息推送处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
JP2023017921A (ja) | 2023-02-07 |
EP4134900A2 (en) | 2023-02-15 |
CN114036398B (zh) | 2024-02-13 |
CN114036398A (zh) | 2022-02-11 |
JP7498248B2 (ja) | 2024-06-11 |
EP4134900A3 (en) | 2023-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7127106B2 (ja) | 質問応答処理、言語モデルの訓練方法、装置、機器および記憶媒体 | |
CN111931062B (zh) | 一种信息推荐模型的训练方法和相关装置 | |
KR20220154062A (ko) | 내용 추천 및 정렬 모델 훈련 방법, 장치, 기기, 저장 매체 및 컴퓨터 프로그램 | |
KR102476056B1 (ko) | 아이템 추천방법, 시스템, 전자기기 및 기록매체 | |
US20200218780A1 (en) | Automated contextual dialog generation for cognitive conversation | |
JP2022023776A (ja) | オンライン予測モデルのトレーニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム | |
KR20210040892A (ko) | 융합 관계 네트워크에 기반한 정보 추천 방법, 장치, 전자 장비, 비 일시적 컴퓨터 판독가능 저장 매체 및 컴퓨터 프로그램 | |
EP3353670A1 (en) | Regularized model adaptation for in-session recommendations | |
JP7488871B2 (ja) | 対話推薦方法、装置、電子機器、記憶媒体ならびにコンピュータプログラム | |
US10936601B2 (en) | Combined predictions methodology | |
US20200004827A1 (en) | Generalized linear mixed models for generating recommendations | |
CN113301442A (zh) | 确定直播资源的方法、设备、介质及程序产品 | |
US20210279269A1 (en) | Content Fragments Aligned to Content Criteria | |
CN111512299A (zh) | 用于内容搜索的方法及其电子设备 | |
CN111563198A (zh) | 一种物料召回方法、装置、设备及存储介质 | |
US20180253694A1 (en) | Generating job recommendations using member profile similarity | |
EP3861483A1 (en) | Nudging neural conversational model with domain knowledge | |
CN117312630A (zh) | 推荐信息的获取方法、模型训练方法、装置、电子设备及存储介质 | |
US20180137587A1 (en) | Contextual personalized list of recommended courses | |
US11303683B2 (en) | Methods and systems for managing distribution of online content based on content maturity | |
Qi et al. | Design of graph neural network social recommendation algorithm based on coupling influence | |
CN117651950A (zh) | 具有上下文感知的经阐明的自然语言人工产物重组 | |
CN114970494A (zh) | 一种评论生成方法、装置、电子设备和存储介质 | |
CN112905896A (zh) | 一种推荐个数模型的训练方法、混合内容推荐方法及装置 | |
US20170344644A1 (en) | Ranking news feed items using personalized on-line estimates of probability of engagement |