KR20210122213A

KR20210122213A - 리소스 추천 및 파라미터 결정 방법, 장치, 설비 및 매체

Info

Publication number: KR20210122213A
Application number: KR1020210123619A
Authority: KR
Inventors: 자오쉬 왕; 즈밍 펑; 쇼케 친; 나이페이 송; 샤오위 후; 닝신 추이
Original assignee: 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드
Priority date: 2020-10-09
Filing date: 2021-09-16
Publication date: 2021-10-08
Also published as: JP7350815B2; EP3905069A3; JP2022063224A; CN112163159A; US20210406327A1; EP3905069A2; CN112163159B

Abstract

본 출원은 리소스 추천 및 파라미터 결정 방법, 장치, 설비 및 매체를 개시하며, 지능 검색 및 추천 분야에 관한 것이다. 구체적인 구현방안으로, 타겟 사용자의 추천 참조 특성을 결정하고; 적어도 두 개의 리소스 추천 모델을 기반으로, 타겟 사용자의 추천 참조 특성에 따라, 타겟 사용자를 위해 리소스 추천 결과를 결정하며; 여기서, 적어도 두 개의 리소스 추천 모델에서 적어도 두 개의 추천 전략 파라미터는 과거 사용자의 추천 행동 데이터에 따라 공동으로 결정되고, 적어도 두 개의 리소스 추천 모델에 관련된 리소스 처리 단계는 상이하다. 본 출원의 실시예는 적어도 두 개의 리소스 추천 모델에서 적어도 두 개의 추천 전략 파라미터를 공동으로 결정하는 것을 통해, 단일 전략 파라미터의 단독 결정으로 인해 각 전략 파라미터가 매칭되지 못하는 문제를 방지하여, 각 추천 전략 파라미터 사이의 상호 작용을 병행하고, 나아가 리소스 추천 결과의 정확성 및 리소스 추천 결과와 타겟 사용자의 매칭도를 향상하며, 사용자 만족도를 향상한다.

Description

리소스 추천 및 파라미터 결정 방법, 장치, 설비 및 매체{Resource recommendation and parameter determination method and device, equipment and medium}

본 출원은 데이터 처리 기술분야에 관한 것이고, 특히 지능 검색 및 추천 기술에 관한 것이며, 구체적으로 리소스 추천 및 파라미터 결정 방법, 장치, 설비 및 매체에 관한 것이다.

모바일 인터넷의 심도 있는 발전에 따라, 리소스 추천 시스템의 광범위한 적용에 기반을 마련하였다. 현실 생활에서는, 사용자가 관심을 가지는 정보를 더 많이 제공하거나 사용자가 빠르게 검색할 수 있도록 하기 위해 여행, 쇼핑, 동영상, 뉴스, 사교 등 많은 애플리케이션에서 리소스 추천 시스템을 사용하고 있다.

그러나, 기존 리소스 추천 시스템은 리소스 추천을 수행할 때, 추천 결과가 좋지 않고, 사용자 경험이 떨어진다.

본 출원은 리소스 추천 결과가 더 좋은 리소스 추천 및 파라미터 결정 방법, 장치, 설비 및 매체를 제공한다.

본 출원의 한 측면으로, 리소스 추천 방법을 제공하며,

타겟 사용자의 추천 참조 특성을 결정하는 단계;

적어도 두개의 리소스 추천 모델을 기반으로, 상기 타겟 사용자의 추천 참조 특성에 따라, 상기 타겟 사용자를 위해 리소스 추천 결과를 결정하는 단계; 를 포함하되,

여기서, 상기 적어도 두 개의 리소스 추천 모델에서의 적어도 두 개의 추천 전략 파라미터는 과거 사용자의 추천 행동 데이터에 따라 공동으로 결정되고, 상기 적어도 두 개의 리소스 추천 모델에 관련된 리소스 처리 단계는 상이하다.

본 출원의 실시예의 다른 측면으로, 파라미터 결정 방법을 더 제공하며,

과거 사용자의 추천 행동 데이터를 결정하는 단계;

상기 과거 사용자의 추천 행동 데이터에 따라, 적어도 두 개의 추천 전략 파라미터를 공동으로 결정하는 단계; 를 포함하되,

여기서, 상기 추천 전략 파라미터는 적어도 두 개의 리소스 추천 모델에서의 사용 파라미터이고, 상기 적어도 두 개의 리소스 추천 모델에 관련된 리소스 처리 단계는 상이하다.

본 출원의 다른 측면으로, 리소스 추천 장치를 더 제공하며,

타겟 사용자의 추천 참조 특성을 결정하는 추천 참조 특성 결정 모듈;

적어도 두 개의 리소스 추천 모델을 기반으로, 상기 타겟 사용자의 추천 참조 특성에 따라, 상기 타겟 사용자를 위해 리소스 추천 결과를 결정하는 리소스 추천 결과 결정 모듈; 을 포함하되,

본 출원의 다른 측면으로, 파라미터 결정 장치를 더 제공하며,

과거 사용자의 추천 행동 데이터를 결정하는 추천 행동 데이터 결정 모듈;

상기 과거 사용자의 추천 행동 데이터에 따라, 적어도 두 개의 추천 전략 파라미터를 공동으로 결정하는 추천 전략 파라미터 결정 모듈; 을 포함하되,

본 출원의 다른 측면으로, 전자 설비를 더 제공하며,

적어도 하나의 프로세서; 및

상기 적어도 하나의 프로세서와 통신 연결되는 메모리; 를 포함하되, 여기서,

상기 메모리는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령을 저장하고, 상기 명령은 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서가 본 출원의 어느 하나의 실시예에서 제공하는 리소스 추천 방법, 및/또는, 본 출원의 어느 하나의 실시예에서 제공하는 파라미터 결정 방법을 실행하도록 한다.

본 출원의 다른 한 측면으로, 컴퓨터 명령이 저장된 비일시적 컴퓨터 판독가능 저장매체를 더 제공하고, 상기 컴퓨터 명령은 상기 컴퓨터가 본 출원의 어느 하나의 실시예에서 제공하는 리소스 추천 방법, 및/또는, 본 출원의 어느 하나의 실시예에서 제공하는 파라미터 결정 방법을 실행하도록 한다.

본 출원의 기술에 따라, 리소스 추천 결과와 타겟 사용자의 매칭도를 향상시킬 수 있다.

이 부분에서 설명된 내용은 본 개시의 실시예의 핵심 또는 중요한 특성을 식별하기 위한 것이 아니며, 본 개시의 범위를 한정하기 위한 것이 아님을 이해해야 한다. 본 개시의 기타 특성은 이하 명세서를 통해 쉽게 이해될 수 있을 것이다.

본 발명에 따르면, 적어도 두 개의 리소스 추천 모델에서 적어도 두 개의 추천 전략 파라미터를 공동으로 결정하는 것을 통해, 단일 전략 파라미터의 단독 결정으로 인해 각 전략 파라미터가 매칭되지 못하는 문제를 방지하여, 각 추천 전략 파라미터 사이의 상호 작용을 병행하고, 나아가 리소스 추천 결과의 정확성 및 리소스 추천 결과와 타겟 사용자의 매칭도를 향상하며, 사용자 만족도를 향상시킬 수 있는 효과가 있다.

도면은 본 방안을 보다 잘 이해하도록 하기 위해 제공되며, 본 출원에 대한 한정을 구성하지 않는다. 여기서:
도 1은 본 출원의 실시예에 의해 제공된 리소스 추천 방법의 흐름도이다.
도 2는 본 출원의 실시예에 의해 제공된 파라미터 결정 방법의 흐름도이다.
도 3은 본 출원의 실시예에 의해 제공된 다른 파라미터 결정 방법의 흐름도이다.
도 4A는 본 출원의 실시예에 의해 제공된 리소스 추천 시스템의 구조도이다.
도 4B는 본 출원의 실시예에 의해 제공된 온라인 추천 시스템의 프레임 구조 개략도이다.
도 4C는 본 출원의 실시예에 의해 제공된 파라미터 최적화 모델의 구조 개략도이다.
도 4D는 본 출원의 실시예에 의해 제공된 다른 리소스 추천 방법의 흐름도이다.
도 5는 본 출원의 실시예에 의해 제공된 리소스 추천 장치의 구조도이다.
도 6은 본 출원의 실시예에 의해 제공된 파라미터 결정 장치의 구조도이다.
도 7은 본 출원의 실시예의 리소스 추천 방법 및/또는 파라미터 결정 방법을 구현하기 위한 전자 설비의 블록도이다.

이하 도면을 결합하여 본 출원의 예시적인 실시예를 설명하며, 이해를 돕기 위해 본 출원의 실시예의 다양한 세부 사항을 포함하되, 이는 단지 예시적인 것으로 간주되어야 한다. 따라서, 본 분야의 당업자는 본 출원의 범위 및 사상을 벗어나지 않고, 하기에서 설명되는 실시예에 대해 다양한 개변 및 수정을 수행할 수 있음을 인식해야 한다. 마찬가지로, 명확하고 간단하게 설명하기 위해, 아래의 설명에서는 공지 기능 및 구조에 대한 설명을 생략하도록 한다.

본 출원의 실시예에 의해 개시된 여러 리소스 추천 방법은, 데이터 처리 기술분야에서 리소스 추천 시스템을 사용하여 타겟 사용자에게 리소스를 추천하는데 적용된다. 본 출원의 실시예에 의해 개시된 리소스 추천 방법은, 리소스 추천 장치에 의해 실행될 수 있고, 해당 장치는 소프트웨어 및/또는 하드웨어를 사용하여 구현되고, 구체적으로 리소스 추천 기능을 구비한 전자 설비에 구성된다.

도 1은 본 출원의 실시예에 의해 제공된 리소스 추천 방법의 흐름도이고, 해당 방법은 다음 단계를 포함한다.

단계(S101), 타겟 사용자의 추천 참조 특성을 결정한다.

여기서, 타겟 사용자는 리소스 추천을 수행하는 추천 대기 사용자로 이해할 수 있다.

여기서, 추천 참조 특성은 리소스 추천 과정에 의존하는 특성 데이터로 이해할 수 있다. 예시적으로, 추천 참조 특성은 시나리오 특성, 사용자 기본 특성 및 사용자 선호 특성 등 중 적어도 하나를 포함할 수 있다.

예시적으로, 시나리오 특성은 타겟 사용자에 대해 리소스 추천을 수행할 때의 시나리오 상태 데이터를 특성화하는데 사용되고, 예를 들어, 새로 고침 횟수, 새로 고침 상태, 새로 고침 크기, 네트워크 상태 및 새로 고침 시간대 중 적어도 하나를 포함한다. 이해할 수 있는 것은, 추천 참조 특성에 시나리오 특성을 도입하는 것을 통해, 후속 리소스 추천을 수행할 때, 상이한 시나리오에 대해 타겟 사용자에게 상이한 추천 대기 리소스를 추천하여, 시나리오의 개인화 추천의 목적을 달성할 수 있다.

예시적으로, 사용자 기본 특성은 사용자 자신의 기본 속성을 특성화하도록 사용되고, 예를 들어, 사용자 성별, 연령, 학력, 사용자 활약도 및 사용자 과거의 좋아요 클릭률 중 적어도 하나를 포함한다. 이해할 수 있는 것은, 추천 참조 특성에 사용자 특성을 도입하는 것을 통해, 후속 리소스 추천을 수행할 때, 타겟 사용자의 개인화 추천을 구현하여, 리소스 추천 결과와 타겟 사용자 자신의 매칭도를 향상하고, 사용자 만족도를 향상한다.

예시적으로, 사용자 선호 특성은 타겟 사용자가 상이한 종류의 리소스에서 상이한 종류의 리소스 콘텐츠에 대한 좋아하는 정도를 특성화하도록 사용된다. 이해할 수 있는 것은, 추천 참조 특성에 사용자 특성을 도입하는 것을 통해, 후속 리소스 추천을 수행할 때, 타겟 사용자에게 관심있는 내용을 추천할 수 있어, 사용자 만족도를 향상한다.

선택적으로, 타겟 사용자의 추천 참조 특성을 로컬 전자 설비, 전자 설비와 관련된 다른 전자 설비 또는 클라우드에 미리 저장할 수 있다. 대응하게, 리소스 추천이 필요할 때 타겟 사용자의 식별자정보에 따라, 로컬 전자 설비, 전자 설비와 관련된 다른 전자 설비 또는 클라우드로부터 타겟 사용자의 추천 참조 특성을 획득한다.

또는 선택적으로, 로컬 전자 설비, 전자 설비와 관련된 다른 전자 설비 또는 클라우드에 추천 참조 데이터를 미리 저장할 수도 있고; 대응하게, 리소스 추천이 필요할 때, 타겟 사용자의 식별자정보에 따라 로컬 전자 설비, 전자 설비와 관련된 다른 전자 설비 또는 클라우드로부터 타겟 사용자의 추천 참조 데이터를 판독하며, 추천 참조 데이터에 특성 추출을 수행하여, 구조화 표시된 추천 참조 특성을 생성한다. 여기서, 타겟 사용자의 추천 참조 특성은 시나리오 특성, 사용자 기본 특성 및 사용자 선호 특성 등 데이터를 포함하지만 이에 한정되지 않는다.

단계(S102), 적어도 두 개의 리소스 추천 모델을 기반으로, 타겟 사용자의 추천 참조 특성에 따라, 타겟 사용자를 위해 리소스 추천 결과를 결정하고; 여기서, 적어도 두 개의 리소스 추천 모델에서 적어도 두 개의 추천 전략 파라미터는 과거 사용자의 추천 행동 데이터에 따라 공동으로 결정되고, 적어도 두 개의 리소스 추천 모델에 관련된 리소스 처리 단계는 상이하다.

본 출원의 실시예에 관련된 적어도 두 개의 리소스 추천 모델은 리소스 추천 시스템을 구성할 수 있고, 상이한 리소스 처리 단계의 리소스 추천 모델 상호 캐스케이드의 방식을 통해, 타겟 사용자에게 리소스 추천을 수행하는데 사용된다. 여기서 하나의 리소스 추천 모델은 추천 대기 리소스 또는 전 캐스케이드의 리소스 추천 모델의 출력 결과에 대해 리소스 선택을 수행하고, 선택된 리소스를 후속 캐스케이드의 리소스 추천 모델의 입력으로 하거나, 또는 리소스 추천 결과로서 타겟 사용자에게 보여준다.

일 실시예에서, 리소스 추천 단계는 리소스 회수 단계, 리소스 러프(rough) 배열 단계, 리소스 정밀 배열 단계 및 리소스 재배열 단계를 포함하지만 이에 한정되지 않는다. 대응하게, 리소스 추천 모델은 리소스 회수 모델, 리소스 러프 배열 모델, 리소스 정밀 배열 모델과 리소스 재배열 모델을 포함하지만 이에 한정되지 않는다. 설명해야 할 것은, 상기 리소스 추천 시스템은 수요에 따라 리소스 추천 단계와 대응하는 리소스 추천 모델에 대해 증가, 삭제 또는 조정을 수행할 수 있다. 물론, 실제 수요에 따라, 적어도 하나의 리소스 처리 단계를 적어도 하나의 서브 단계를 포함하는 것으로 설치할 수 있고, 예를 들어, 리소스 재배열 단계는 후보 리소스 시퀀스 생성 단계와 타겟 리소스 시퀀스 생성 당계 등을 포함할 수 있다.

본 출원의 실시예에서, 각 리소스 추천 모델에서 적어도 하나의 추천 전략을 사용하여, 리소스 추천 모델의 추천 결과에 대해 제약하는데 사용하고; 대응하게, 각 추천 전략에서 적어도 하나의 추천 전략 파라미터를 포함하며, 여기서, 상이한 추천 전략 파라미터는 대응되는 리소스 추천 모델의 추천 성능에 영향을 줄 수 있다.

일 선택적 실시예에서, 추천 전략은 리소스 카테고리 비율 전략, 리소스 콘텐츠 다양화 전략과 다중 추천 인덱스 균형 전략을 포함하지만 이에 한정되지 않는다. 대응하게, 상기 추천 전략 파라미터는 카테고리 비율 파라미터, 다양화 가중치 조정 파라미터, 다중 추천 인덱스 융합 파라미터와 같은 파라미터를 포함하지만 이에 한정되지 않는다.

선택적으로, 리소스 카테고리 비율 전략은 리소스 추천을 수행할 때, 적어도 두 가지 유형의 리소스의 종합 추천의 전략을 설정하여, 사용자가 리소스 추천 결과에 대한 만족도를 향상하는 것으로 이해할 수 있다. 예를 들어, 정보 흐름 추천할 때, 사진과 기사, 동영상, 짧은 영상, 등 리소스를 종합하여 추천한다. 대응하게, 리소스 카테고리 비율 전략에서의 사용 파라미터는 카테고리 비율 파라미터일 수 있다.

선택적으로, 리소스 콘텐츠 다양화 전략은 리소스 추천을 수행할 때, 동일한 유형 리소스가 추천 리소스 콘텐츠의 다양성을 제공하는 것을 확보하여, 리소스 콘텐츠가 단일함으로 인해 발생한 과적합문제를 방지하고, 동일한 유형의 리소스의 커버 영역을 증가하여, 사용자 경험 만족도를 향상하는 것으로 이해할 수 있다. 대응하게, 리소스 콘텐츠 다양화 전략에서 사용된 파라미터는 다양화에 사용된 가중치 조정 공식 중의 다양화 가중치 조정 파라미터일 수 있다. 여기서, 다양화 가중치 조정 파라미터는 동일한 유형 리소스에서 상이한 리소스 콘텐츠 유별의 비율 가중치를 설정하는데 사용된다. 여기서, 가중치 조정 공식은 기술자가 필요 또는 경험에 의해 결정하거나, 또는 대량 실험을 통해 반복적으로 결정할 수 있다.

선택적으로, 다중 추천 인덱스 균형 전략은 리소스 추천을 수행할 때, 상이한 리소스 추천 인덱스 요구를 충족하는 전략을 의미한다. 예를 들어 추천 인덱스는 클릭률, 랜딩 페이지 지속 시간, 리스트 페이지 지속 시간, 댓글, 좋아요 및 공유 중 적어도 하나를 포함할 수 있다. 상이한 리소스 추천 인덱스 사이에 상호 제약하는 상황이 존재하으로, 다중 추천 인덱스 균형을 병행하는 방식을 통해, 상이한 추천 인덱스 사이의 영향을 밸런싱할 수 있다. 대응하게, 다중 추천 인덱스 균형 전략의 사용 파라미터는, 다중 추천 인덱스 추천에 사용된 융합 공식의 다중 추천 인덱스 융합 파라미터일 수 있다. 여기서, 융합 공식은 기술자가 필요 또는 경험에 따라 결정하거나, 또는 대량 실험을 통해 반복적으로 결정할 수 있다.

본 실시예에서, 타겟 사용자의 추천 참조 특성을 리소스 추천 시스템의 첫 번째에 위치한 리소스 추천 모델의 입력 데이터로 하고, 첫 번째에 위치한 리소스 추천 모델의 출력 데이터를 후속 캐스케이드의 리소스 추천 모델의 입력 데이터로 하며, 최종으로 마지막에 위치한 리소스 추천 모델을 통해 타겟 사용자의 리소스 추천 결과를 출력하여, 타겟 사용자에게 리소스 추천을 수행하는 목적을 구현한다.

여기서, 과거 사용자의 추천 행동 데이터는 과거 사용자에게 리소스 추천을 수행할 때 의존하는 추천 참조 특성, 과거 사용자의 리소스 추천 결과 및 과거 사용자가 리소스 추천 결과에 대해 응답할 때의 행동 데이터 등을 포함하지만 이에 한정되지 않는다.

이해할 수 있는 것은, 과거 사용자의 추천 행동 데이터를 통해 리소스 추천 모델에서 적어도 두 개의 추천 전략 파라미터를 결정하는 것을 수행하여, 결정된 리소스 추천 파라미터가 리소스 추천 모델에 더 잘 적응하도록 할 수 있다. 또한 추천 전략 파라미터의 기능을 결정하는 것을 통해, 각 추천 전략 파라미터의 상호 작용을 병행할 수 있고, 리소스 추천 모델 추천 결과의 정확성을 향상하는데 기반을 마련하였다.

본 출원의 실시예는 타겟 사용자의 추천 참조 특성을 결정하는 것을 통해, 적어도 두 개의 리소스 추천 모델을 기반으로, 타겟 사용자의 추천 참조 특성에 따라, 타겟 사용자를 위해 리소스 추천 결과를 결정한다. 여기서, 적어도 두 개의 리소스 추천 모델에서 적어도 두 개의 리소스 추천 파라미터는 과거 사용자의 추천 행동 데이터에 따라 공동으로 결정되고, 적어도 두 개의 리소스 추천 모델에 관련된 리소스 처리 단계는 상이하다. 상기 기술방안은 적어도 두 개의 리소스 추천 모델에서 적어도 두 개의 추천 전략 파라미터를 공동으로 결정하는 것을 통해, 상이한 리소스 처리 단계에 대한 각 추천 전략 파라미터의 동적 결정과 자동 조정을 구현하고, 인위적으로 설정된 파라미터가 정확하지 못하여 리소스 추천 결과가 좋지 않은 문제를 방지하며; 또한, 각 추천 전략 파라미터의 공동 결정을 통해, 단일 추천 전략 파라미터가 단독으로 결정되어 각 추천 전략 파라미터가 매칭되지 못하는 문제를 방지함으로써, 각 추천 전략 파라미터 사이의 상호 작용을 병행하고, 나아가 리소스 추천 결과의 정확성 및 리소스 추천 결과와 타겟 사용자의 매칭도와 사용자 만족도를 향상한다.

상기 각 실시예의 기술방안에 기초하여, 과거 사용자의 추천 행동 데이터를 과거 사용자의 추천 참조 특성과 사용자 피드백 데이터로 세부화하여, 리소스 추천 파라미터의 결정 메커니즘을 보완하고, 즉 과거 사용자의 추천 참조 특성과 사용자 피드백 데이터에 따라, 적어도 두 개의 추천 전략 파라미터를 공동으로 결정한다. 여기서, 적어도 두 개의 전략 추천 파라미터는 적어도 두 개의 리소스 추천 모델의 사용 파라미터이고; 적어도 두 개의 리소스 추천 모델에 관련된 리소스 처리 단계는 상이하다.

설명해야 할 것은, 리소스 추천을 수행할 때 사용한 전자 설비(리소스 추천 설비)와 추천 전략 파라미터를 결정하는 전자 설비(파라미터 결정 설비)는 동일하거나 상이한 전자 설비일 수 있고, 본 출원의 실시예는 이를 한정하지 않는다.

여기서, 사용자 피드백 데이터는 과거 사용자가 리소스 추천 결과에 대해 응답하여 생성한 데이터로 이해할 수 있다.

일 선택적 실시예에서, 추천 전략 파라미터는 파라미터 최적화 모델을 사용하고, 과거 사용자의 추천 참조 데이터와 사용자 피드백 데이터에 기반하여 결정될 수 있다. 여기서, 파라미터 최적화 모델은 진화 학습(Evolution Strategy, ES) 알고리즘을 기반으로 구현되거나 다른 알고리즘도 사용하여 구현될 수 있으며, 본 출원의 실시예는 이를 한정하지 않는다.

설명해야 할 것은, ES 알고리즘은, 자연 진화를 모방하여 전역 최적화를 수행하고, 자연선택과 적자생존에 의한 다윈의 진화론을 따르는 진화적 전략이다. 따라서, ES 알고리즘을 기반으로 구현된 파라미터 최적화 모델을 이용하여 추천 전략 파라미터를 결정할 때, 사용자 피드백 데이터에만 의존하고, 오차의 역전파에 의존하지 않으므로, 다단계 다전략을 포함한 리소스 추천 모델의 각 전략 파라미터의 최적화 과정에 적합하고, 또한, ES 알고리즘은 계산이 간단하고, 고도로 병행될 수 있으며, 리소스 손실이 적기 때문에, 전략 파라미터의 결정 효율성을 향상시킬 수 있다. 따라서, 일 바람직한 실시예에서, ES 알고리즘을 기반으로 구현된 파라미터 최적화 모델을 사용하여 추천 전략 파라미터를 결정할 수 있다.

일 선택적 실시예에서, 파라미터 최적화 모델의 네트워크 파라미터는, 파라미터 최적화 모델의 모델 출력 결과가 리소스 추천 모델의 추천 전략 파라미터에 대응하는 물리적 의의를 갖도록 사용자 피드백 데이터에 따라 조정될 수 있다. 또한, 과거 사용자의 추천 참조 특성을 사용하고, 조정된 파라미터 최적화 모델을 기반으로, 모델 출력 결과를 획득하여 추천 전략 파라미터를 결정함으로써, 파라미터 최적화 모델의 모델 출력 결과(즉 추천 전략 파라미터)와 리소스 추천 모델의 매칭도를 향상한다. 대응하게, 결정된 추천 전략 파라미터는 리소스 추천 시스템에서 대응하는 리소스 추천 모델에 적용되어 리소스 추천 모델을 업데이트하고, 업데이트된 리소스 추천 모델을 사용하여 타겟 사용자에게 리소스 추천을 수행한다.

추천 전략 파라미터의 결정 동작은 미리 실행할 수 있고, 획득한 각 추천 전략 파라미터가 저장된다는 것을 이해해야 한다. 대응하게, 리소스 추천 모델을 사용할 때, 추천 전략 파라미터의 저장 영역에서 추천 전략 파라미터를 획득하여 사용한다.

추천 전략 파라미터의 시효성을 확보하기 위해, 일반적으로, 사용자 피드백 데이터는 타겟 사용자에게 리소스 추천을 수행하기 전, 설정된 시간대 내에 과거 사용자에게 과거 리소스 추천을 수행한 후 결정된 사용자 피드백 데이터일 수 있다. 대응하게, 실시간으로 또는 정기적으로 추천 전략 파라미터를 재결정하여, 리소스 추천 모델에서 각 추천 전략 파라미터를 업데이트한다.

본 출원의 실시예는 파라미터 결정 모델을 도입하여 추천 전략 파라미터를 결정하는 것을 통해, 각 전략 파라미터의 공동 최적화(Joint optimization)를 구현하며, 리소스 처리 단계의 단일 추천 전략 파라미터 최적화가 필요 없고, 파라미터 최적화 과정에서 데이터 계산량을 줄이고, 추천 전략 파라미터의 결정 효율을 향상시키고, 리소스 추천 모델에서 각 추천 전략 파라미터의 온라인 실시간 업데이트 가능성을 제공한다. 또한, 공동 최적화 과정에서 상이한 추천 전략 파라미터 사이의 상호 작용을 종합적으로 감안하여, 단독으로 단일 추천 전략 파라미터를 결정할 때 전략 파라미터의 상호 제약으로 인한 리소스 추천 시스템의 불안정성을 방지한다. 또한, 과거 사용자의 사용자 피드백 데이터를 도입하여 파라미터 최적화 모델의 훈련 과정을 안내하는 것을 통해, 파라미터 최적화 모델의 출력 결과가 추천 전략 파라미터의 물리적 의미를 가지고, 추천 전략 파라미터의 공동 최적화를 위해 기반을 마련하였다. 또한, 과거 피드백 사용자의 추천 참조 특성을 통해 전략 파라미터를 결정하여, 추천 전략 파라미터를 결정하는 과정에서 사용한 데이터와 리소스 추천 모델을 이용하여 리소스 추천을 수행할 때 사용한 데이터가 상호 적응하게 하여, 최종적으로 결정된 추천 전략 파라미터와 리소스 추천 모델의 매칭도를 향상한다.

사용자 피드백 데이터에 기반한 추천 전략 파라미터의 결정 메커니즘을 더 보완하기 위해, 사용자 피드백 데이터의 생성 과정은 후술되는 선택적 실시예에서 상세히 설명한다.

예시적으로, 사용자 피드백 데이터는 리소스 추천 설비 또는 파라미터 결정 설비를 통해, 과거 사용자가 트래픽 인덱스에서 과거 리소스 추천 결과에 대한 응답 행동 데이터 통계값을 결정하고, 여기서, 트래픽 인덱스는 리소스 추천 모델이 사용하는 인덱스이고; 각 트래픽 인덱스에 따른 응답 행동 데이터 통계값에 따라, 사용자 피드백 데이터를 결정하는 방식으로 결정한다.

여기서, 트래픽 인덱스는 리소스 추천에서 만족해야 하는 추천 인덱스 요구인 것으로 이해할 수 있다. 예시적으로 트래픽 인덱스는 추천 인덱스일 수 있고, 클릭률, 랜딩 페이지 지속 시간, 리스트 페이지 지속 시간, 댓글 수, 좋아요 수 및 공유 수 중 적어도 하나를 포함할 수 있고, 또는 상기 적어도 하나의 파라미터를 기반하여 추천 인덱스를 결정한다.

선택적으로, 트래픽 인덱스는 시간 응답 인덱스를 표시하고, 리소스 추천 시스템의 응답 시간, 또는 리소스 추천 시스템과 과거 사용자 사이의 상호작용 시간을 특성화하는데 사용된다.

선택적으로, 트래픽 인덱스는 상호 작용 동작의 상호 작용 응답 인덱스를 포함할 수 있으며, 리소스 추천 시스템이 리소스 추천을 수행한 후, 리소스 추천 결과에 대한 과거 사용자의 상호 작용을 특성화하는데 사용된다.

물론, 상기 트래픽 인덱스가 포함하는 내용에 대해서만 예시적으로 설명하고, 트래픽 인덱스는 또한 리소스 추천 시스템의 실제 트래픽 요구에 따라, 다른 인덱스 파라미터로 결정될 수 있고, 여기서 반복하여 설명하지 않는다.

예시적으로, 응답 행동 데이터 통계값은 지속 시간 응답 데이터에 대한 지속 시간 누적값을 포함할 수 있고; 또는 선택적으로, 응답 행동 데이터 통계값은 상호 작용 응답 데이터에 대한 빈도 파라미터의 빈도 누적값을 포함할 수 있다.

하나의 구체적인 구현방식에서, 트래픽 인덱스가 시간 응답 인덱스를 포함하면; 대응하게, 각 트래픽 인덱스에 따른 응답 행동 데이터 통계값에 따라, 사용자 피드백 데이터를 결정하는 단계는, 시간 응답 인덱스에 따른 응답 행동 데이터 통계값에 따라, 총 리소스 응답 지속 시간을 결정하는 단계; 및 총 리소스 응답 지속 시간에 따라, 각 과거 사용자의 사용자 피드백 데이터를 결정하는 단계; 일 수 있다.

이해할 수 있는 것은, 시간 응답 인덱스에 따른 응답 행동 데이터 통계값을 기반으로, 사용자 피드백 데이터를 결정하는 것은, 리소스 추천 모델에 대한 과거 사용자의 시간 점도를 간접적으로 특성화할 수 있다. 따라서, 후속 시간 점도와 관련된 사용자 피드백 데이터를 사용하여 리소스 추천 모델의 추천 전략 파라미터를 결정하여, 결정된 추천 전략 파라미터를 리소스 추천 시스템에 적용할 때, 리소스 추천 결과가 시간 응답 인덱스에 더 가까울 수 있다.

예시적으로, 과거 사용자의 단일 새로 고침 총 지속 시간을 시간 응답 인덱스로 할 수 있다. 대응하게, 과거 사용자가 단일 새로 고침을 수행할 때의 랜딩 페이지 지속 시간과 리스트 페이지 지속 시간의 합을 총 리소스 응답 지속 시간으로 하고; 총 리소스 응답 지속 시간에 따라, 사용자 피드백 데이터를 결정한다. 예를 들어, 총 리소스 응답 지속 시간은 사용자 피드백 데이터로 직접 사용된다.

리소스 추천 시스템에서, 총 리소스 응답 지속 시간을 도입하는 것을 통해, 사용자의 단일 새로 고침 지속 시간이 충분히 길어짐으로써, 리소스 추천 시스템에 관련된 응용 프로그램에 대한 타겟 사용자의 사용 점도가 향상됨을 이해해야 한다. 여기서, 리소스 추천 시스템은 즉 상기 상이한 리소스 처리 단계와 관련된 적어도 두 개의 리소스 추천 모델로 구성된 시스템이다.

다른 구체적인 구현방식에서, 트래픽 인덱스가 적어도 하나의 상호 작용 동작의 상호 작용 응답 인덱스를 포함하면; 대응하게, 각 트래픽 인덱스에 따른 응답 행동 데이터 통계값에 따라, 사용자 피드백 데이터를 결정하는 단계는, 상호 작용 응답 인덱스에 따른 응답 행동 데이터 통계값에 따라, 상호 작용 응답 데이터를 결정하는 단계; 및 상호 작용 응답 데이터에 따라, 사용자 피드백 데이터를 결정하는 단계; 일 수 있다. 여기서, 상호 작용 동작은, 클릭, 새로 고침, 댓글 달기, 좋아요 및 공유 중 적어도 하나를 포함할 수 있다.

상호 작용 응답 인덱스에 따른 응답 행동 데이터 통계값에 기반하여 결정된 상호 작용 응답 데이터를 통해, 과거 사용자가 리소스 추천 시스템에 대한 상호 작용을 간접적으로 특성화할 수 있음을 이해해야 하며, 해당 사용자 상호 작용과 관련된 사용자 피드백 데이터를 기반으로, 리소스 추천 모델의 추천 전략 파라미터를 결정하여, 결정된 추천 전략 파라미터를 리소스 추천 시스템에 적용할 때, 리소스 추천 결과가 상호 작용 응답 인덱스에 더 가까울 수 있다.

예시적으로, 단일 새로 고침 동안의 좋아요 수, 공유 수, 댓글 수 및 클릭 열람 수 중 적어도 하나를 기설정된 공식에 따라, 상호 작용 응답 데이터를 결정하고, 해당 상호 작용 응답 데이터를 사용자 피드백 데이터로 집접 사용할 수 있다. 여기서, 기설정된 공식은 각 변수의 증분 공식이다. 여기서, 변수는 좋아요 수, 공유 수, 댓글 수 및 클릭 열람 수 등 파라미터를 포함하지만 이에 한정되지 않는다.

이해할 수 있는 것은, 리소스 추천 시스템에서, 상호 작용 응답 데이터를 도입하는 것을 통해, 사용자가 리소스 추천 시스템과 관련된 응용 프로그램을 단일 새로 고침을 수행할 때, 응용 프로그램과의 상호 작용 횟수가 충분히 크므로, 해당 응용 프로그램에 대한 사용자의 선호도가 향상된다.

다른 하나의 구체적인 구현방식에서, 시간 응답 인덱스와 상호 작용 응답 인덱스 간에 일정한 제약 관계가 존개할 수 있기에, 트래픽 인덱스는 시간 응답 인덱스와 상호 작용 응답 인덱스를 포함할 수 있다. 예를 들어, 리소스 추천 시스템에서, 총 리소스 응답 지속 시간을 도입하는 것을 통해, 사용자의 단일 새로 고침 지속 시간이 충분히 길어지는 것을 확보하지만, 시스템 추천의 단일 리소스의 리소스 지속 시간이 너무 긴 경우가 존재할 수 있으며; 상호 작용 응답 데이터를 도입하는 것을 통해, 단일 새로 고침으로 사용자의 상호 작용 횟수가 충분히 많은 것을 확보하지만, 시스템 추천의 단위 리소스의 지속 시간이 너무 짧은 상황이 존재할 수 있다. 한편, 실제 추천 과정에서, 사용자의 실제 리소스 열람 지속 시간과 리소스 추천시 전체 추천 리소스의 열람 지속 시간이 일치하지 않은 상황도 존재하고, 예를 들어 사용자가 추천 리소스의 일부만 열람하거나, 하나의 리소스의 일부 내용만 열람하여, 추천 결과와 사용자의 실제 열람 결과의 차이가 커진다. 양자를 함께 구현하여, 최종적으로 결정된 추천 전략 파라미터가 더 합리하도록 확보하는 것을 통해 사용자의 사용 경험을 향상하기 위한 기반을 마련하기 위해, 각 트래픽 인덱스에 따른 응답 행동 데이터 통계값에 따라, 사용자 피드백 데이터를 결정하는 단계는, 시간 응답 인덱스에 따른 응답 행동 데이터 통계값에 따라, 총 리소스 응답 지속 시간을 결정하는 단계; 상호 작용 응답 인덱스에 따른 응답 행동 데이터 통계값과 과거 응답 지속 시간에 따라, 지속 시간 보정량을 결정하는 단계; 및 지속 시간 보정량과 총 리소스 응답 지속 시간에 따라, 각 과거 사용자의 사용자 피드백 데이터를 결정하는 단계; 일 수도 있다.

여기서, 과거 응답 지속 시간은 설정된 시간대의 총 리소스 응답 지속 시간의 평균 레벨을 특성화하는데 사용된다. 여기서, 설정된 시간대는 기술자가 필요 또는 경험치에 따라 결정하거나, 또는 대량 실험을 통해 반복적으로 결정할 수 있다. 예를 들어, 설정된 시간대는 타겟 사용자에 대해 리소스 추천을 수행하는 전날의 총 리소스에 대한 각 과거 사용자에게 추천된 리소스의 총 리소스 응답 지속 시간의 비율일 수 있다.

이해할 수 있는 것은, 지속 시간 보정량을 도입하는 것을 통해, 상호 작용 응답 인덱스와 시간 응답 인덱스를 함께 실현하여, 후속 생성된 추천 전략 파라미터가 더 합리하도록 하고, 리소스 추천 시스템의 추천 기능을 향상하기 위한 기반을 마련하였으며, 사용자의 사용 경험을 향상하는 것에 대한 보장을 제공한다.

예시적으로, 과거 사용자가 단일 새로 고침을 수행할 때의 랜딩 페이지 지속 시간과 리스트 페이지 지속 시간의 합을 총 리소스 응답 지속 시간으로 하고; 적어도 하나의 상호 작용 행동의 통계적 횟수와 평균 리소스 페이지 지속 시간의 곱을 지속 시간 보정량으로 하며; 총 리소스 응답 지속 시간과 지속 시간 보정량의 합을 결정하고, 해당 합을 사용자 피드백 데이터로 하여, 후속 추천 전략 파라미터를 결정하는 것을 안내하도록 사용한다.

상기 기술방안에 기초하여, 사용자 피드백 데이터의 재사용을 용이하게 하기 위해, 사용자 피드백 데이터를 파라미터 결정 설비 로컬에, 또는 파라미터 결정 설비와 관련된 다른 저장 설비 및 클라우드에 미리 저장할 수 있고, 대응하게, 리소스 추천을 수행할 때, 파라미터 결정 설비 로컬로부터, 또는 파라미터 결정 설비와 관련된 다른 저장 설비 및 클라우드로부터 사용자 피드백 데이터를 획득하여, 획득한 사용자 피드백 데이터에 따라, 추천 전략 파라미터를 결정한다.

본 출원의 실시예에서, 과거 사용자의 응답 행동 데이터 통계값을 과거 리소스 추천 결과에 도입하는 것을 통해, 사용자 피드백 데이터를 결정하고, 사용자 피드백 데이터의 결정 메커니즘을 보완한다. 또한, 트래픽 인덱스를 통해 응답 행동 데이터 통계값에 대해 한정하고, 결정된 사용자 피드백 데이터가 트래픽 인덱스 수요를 특성화하여, 사용자 피드백 데이터를 기반으로 결정된 전략 추천 파라미터를 통해, 트래픽 인덱스 수요에 더욱 매칭되고, 결정된 추천 전략 파라미터와 리소스 추천 시스템의 매칭도를 향상하여, 리소스 추천 시스템의 추천 기능을 향상하는 것에 기반을 마련하였으며, 사용자의 사용 경험을 향상하는 것에 대한 보장을 제공한다.

상기 각 선택적 실시예에서의 기술방안은, 리소스 추천 방법의 구체적인 구현 방식에 대해 상세히 설명한다. 이해를 돕기 위해, 이하 선택적 실시예를 통해 리소스 추천 방법에 관련된 리소스 추천 모델에서 추천 전략 파라미터의 구체적인 결정 과정을 상세히 설명한다. 본 실시예에 의해 제공된 파라미터 결정 방법은, 파리미터 결정 장치에 의해 실행될 수 있고, 해당 장치는 소프트웨어 및/또는 하드웨어를 사용하여 구현하고, 구체적으로 파라미터 결정 능력을 구비한 전자 설비, 즉 파라미터 결정 설비에 구성된다. 설명해야 할 것은, 파라미터 결정 설비는 상기 리소스 추천 설비와 동일하거나 상이한 설비일 수 있다.

도 2에 도시된 파라미터 결정 설비에 응용되는 파라미터 결정 방법을 참조하면, 해당 방법은 다음 단계를 포함한다.

단계(S201), 과거 사용자의 추천 행동 데이터를 결정한다.

여기서, 과거 사용자의 추천 행동 데이터는 과거 사용자에 대한 리소스 추천을 기반으로 하는 추천 참조 특성, 과거 사용자의 리소스 추천 결과 및 과거 사용자가 리소스 추천 결과에 대해 응답할 때의 행동 데이터 등을 포함하지만 이에 한정되지 않는다.

단계(S202), 과거 사용자의 추천 행동 데이터에 따라, 적어도 두 개의 추천 전략 파라미터를 공동으로 결정하고; 여기서, 추천 전략 파라미터는 적어도 두 개의 리소스 추천 모델에서의 사용 파라미터이고, 적어도 두 개의 리소스 추천 모델에 관련된 리소스 처리 단계는 상이하다.

본 출원의 실시예에 관련된 적어도 두 개의 리소스 추천 모델은 리소스 추천 시스템을 구성할 수 있고, 상이한 리소스 처리 단계의 리소스 추천 모델을 캐스케이딩하는 방식을 통해, 타겟 사용자에게 리소스 추천을 수행하도록 사용된다. 여기서 하나의 리소스 추천 모델은 추천 대기 리소스 또는 이전 캐스케이드의 리소스 추천 모델의 출력 결과서 리소스 선택을 수행하고, 선택된 리소스를 다음 캐스케이드의 리소스 추천 모델의 입력으로 하거나, 또는 리소스 추천 결과로 타겟 사용자에게 제공한다.

일 실시예에서, 리소스 추천 단계는 리소스 회수 단계, 리소스 러프(rough) 배열 단계, 리소스 정밀 배열 단계 및 리소스 재배열 단계를 포함하지만 이에 한정되지 않는다. 대응하게, 리소스 추천 모델은 리소스 회수 모델, 리소스 러프 배열 모델, 리소스 정밀 배열 모델과 리소스 재배열 모델을 포함하지만 이에 한정되지 않는다. 설명해야 할 것은, 상기 리소스 추천 시스템은 수요에 따라 리소스 추천 단계와 대응하는 리소스 추천 모델에 대해 증가, 삭제 또는 조정을 수행할 수 있다. 물론, 실제 수요에 따라, 적어도 하나의 리소스 처리 단계를 적어도 하나의 서브 단계를 포함하도록 설정될 수 있고, 예를 들어, 리소스 재배열 단계는 후보 리소스 시퀀스 생성 단계와 타겟 리소스 시퀀스 생성 단계를 포함할 수 있다.

본 출원의 실시예에서, 각 리소스 추천 모델에서 적어도 하나의 추천 전략을 사용하여, 리소스 추천 모델의 추천 결과에 대해 제한하고; 대응하게, 각 추천 전략은 적어도 하나의 추천 전략 파라미터를 포함하며, 여기서, 상이한 추천 전략 파라미터는 대응되는 리소스 추천 모델의 추천 성능에 영향을 줄 수 있다.

선택적으로, 리소스 카테고리 비율 전략은 리소스 추천을 수행할 때, 적어도 두 가지 유형의 리소스의 종합 추천의 전략을 설정함으로써, 리소스 추천 결과에 대한 사용자의 만족도를 향상하는 것으로 이해할 수 있다. 예를 들어, 정보 흐름을 추천할 때, 사진과 기사, 동영상, 짧은 영상, 등 리소스를 종합하여 추천한다. 대응하게, 리소스 카테고리 비율 전략에서의 사용 파라미터는 카테고리 비율 파라미터일 수 있다.

선택적으로, 리소스 콘텐츠 다양화 전략은 리소스 추천을 수행할 때, 동일한 유형의 리소스에 의해 제공되는 추천 리소스 콘텐츠의 다양성을 확보함으로써, 리소스의 단일성으로 인해 발생한 과적합 문제를 방지하고, 동일한 유형의 리소스에 대한 커버 범위를 증가하여, 사용자 경험과 만족도를 향상하는 것으로 이해할 수 있다. 대응하게, 리소스 콘텐츠 다양화 전략에서 사용 파라미터는 다양화를 위해 사용한 가중치 조정 공식에서 다양화 가중치 조정 파라미터일 수 있다. 여기서, 다양화 가중치 조정 파라미터는 동일한 유형 리소스에서 상이한 리소스 콘텐츠 범주의 비율 가중치를 설정하는데 사용된다. 여기서, 조정 공식은 기술자가 필요 또는 경험에 따라 결정하거나, 또는 대량 실험을 통해 반복적으로 결정할 수 있다.

선택적으로, 다중 추천 인덱스 균형 전략은 리소스 추천을 수행할 때, 상이한 리소스 추천 인덱스 요구를 충족하는 전략을 의미한다. 예를 들어, 추천 인덱스는 클릭률, 랜딩 페이지 지속 시간, 리스트 페이지 지속 시간, 댓글, 좋아요 및 공유 중 적어도 하나를 포함할 수 있다. 상이한 리소스 추천 인덱스 사이에 상호 제약하는 상황이 존재하으로, 다중 추천 인덱스 균형을 병행하는 방식을 통해, 상이한 추천 인덱스 사이의 영향을 밸런싱할 수 있다. 대응하게, 다중 추천 인덱스 균형 전략의 사용 파라미터는, 다중 추천 인덱스 추천에서 사용한 융합 공식의 다중 추천 인덱스 융합 파라미터일 수 있다. 여기서, 융합 공식은 기술자가 필요 또는 경험에 따라 결정하거나, 또는 대량 실험을 통해 반복적으로 결정할 수 있다.

본 출원의 실시예는 과거 사용자의 추천 행동 데이터를 결정하는 것을 통해, 과거 사용자의 추천 행동 데이터에 따라, 적어도 두 개의 추천 전략 파라미터를 공동으로 결정하고; 여기서 추천 전략 파라미터는 적어도 두 개의 리소스 추천 모델에서의 사용 파라미터이고, 적어도 두 개의 리소스 추천 모델에 관련된 리소스 처리 단계는 상이하다. 상기 기술방안은 적어도 두 개의 리소스 추천 모델에서 적어도 두 개의 추천 전략 파라미터를 공동으로 결정하는 것을 통해, 상이한 리소스 처리 단계에서 각 추천 전략 파라미터의 동적 결정과 자동 조정을 구현하고, 인위적으로 설정된 파라미터가 부정확성으로 인해 리소스 추천 결과가 좋지 않은 문제를 방지하며; 또한, 각 추천 전략 파라미터의 공동 결정을 통해, 단일 추천 전략 파라미터의 단독 결정으로 인한 각 추천 전략 파라미터가 매칭되지 못하는 문제를 방지하여, 각 추천 전략 파라미터 사이의 상호 작용을 함께 실현하고, 나아가 리소스 추천 결과의 정확성 및 리소스 추천 결과와 타겟 사용자의 매칭도와 사용자 만족도를 향상한다.

상기 각 기술방안에 기초하여, 일 선택적 실시예에서, 과거 사용자의 추천 행동 데이터를 과거 사용자의 추천 참조 특성과 사용자 피드백 데이터를 포함하는 것으로 세부화하여, 과거 사용자의 추천 참조 특성과 사용자 피드백 데이터를 기반으로, 추천 전략 파라미터를 결정하고, 추천 전략 파라미터의 결정 메커니즘을 보완한다.

도 3에 도시된 파라미터 결정 방법을 참조하면, 해당 방법은 다음 단계를 포함한다.

단계(S301), 과거 사용자의 추천 참조 특성과 사용자 피드백 데이터를 결정한다.

여기서, 추천 참조 특성은 리소스 추천 과정에 따른 특성 데이터로 이해할 수 있다. 예시적으로, 추천 참조 특성은 시나리오 특성, 사용자 기본 특성 및 사용자 선호 특성 등 중 적어도 하나를 포함하지만 이에 한정되지 않는다.

설명해야 할 것은, 여기서 파라미터를 결정할 때 사용한 추천 참조 특성은, 리소스 추천 모델을 기반으로 리소스 추천 결과를 결정하는데 사용되는 추천 참조 특성과 일치하다.

예시적으로, 시나리오 특성은 과거 사용자에 대해 리소스 추천을 실행할 때 시나리오 상태 데이터를 특성화하는데 사용되고, 예를 들어, 새로 고침 횟수, 새로 고침 상태, 새로 고침 크기, 네트워크 상태 및 새로 고침 시간대 중 적어도 하나를 포함한다. 이해할 수 있는 것은, 추천 참조 특성에 시나리오 특성을 도입하는 것을 통해, 후속 결정된 추천 전략 파라미터가 리소스 추천 모델에 적용될 때, 리소스 추천 모델이 상이한 시나리오에 대해 타겟 사용자에게 상이한 추천 대기 리소스를 추천하는 능력을 구비하도록 하여, 시나리오의 개인화 추천의 목적을 달성할 수 있다.

예시적으로, 사용자 기본 특성은 사용자 자신의 기본 속성을 특성화하는데 사용되고, 예를 들어, 사용자의 성별, 연령, 학력, 사용자 활약도 및 사용자 과거의 좋아요 클릭률 중 적어도 하나를 포함한다. 이해할 수 있는 것은, 추천 참조 특성에 시나리오 특성을 도입하는 것을 통해, 후속 결정된 추천 전략 파라미터가 리소스 추천 모델에 적용될 때, 리소스 추천 모델이 타겟 사용자를 기반으로 개인화 추천을 수행할 수 있는 능력을 구비하게 하여, 리소스 추천 결과와 타겟 사용자 자신의 매칭도를 향상하고, 나아가 사용자 만족도를 향상한다.

예시적으로, 사용자 선호 특성은 타겟 사용자가 상이한 유형의 리소스에서 상이한 카테고리의 리소스 콘텐츠에 대한 선호도를 특성화하는데 사용된다. 이해할 수 있는 것은, 추천 참조 특성에 사용자 선호 특성을 도입하는 것을 통해, 후속 결정된 추천 전략 파라미터가 리소스 추천 모델에 적용될 때, 리소스 추천 모델이 타겟 사용자에게 관심 콘텐츠를 추천하는 능력을 구비하게 하여, 사용자 만족도를 향상한다.

선택적으로, 과거 사용자의 추천 참조 특성을 로컬 전자 설비, 전자 설비와 관련된 다른 전자 설비 또는 클라우드에 미리 저장할 수 있다. 대응하게, 파라미터를 결정해야 할 때, 로컬 전자 설비, 전자 설비와 관련된 다른 전자 설비 또는 클라우드에서, 과거 사용자의 식별자정보에 따라, 과거 사용자의 추천 참조 특성을 획득한다.

또는 선택적으로, 로컬 전자 설비, 전자 설비와 관련된 다른 전자 설비 또는 클라우드에서 추천 참조 데이터를 저장할 수도 있고; 대응하게, 리소스 추천이 필요할 때, 로컬 전자 설비, 전자 설비와 관련된 다른 전자 설비 또는 클라우드에서, 과거 사용자의 식별 정보에 따라 과거 사용자의 추천 참조 데이터를 판독하며, 추천 참조 데이터에 대해 특성 추출하고, 구조화된 형태로 표현되는 추천 참조 특성을 생성한다. 여기서, 추천 참조 특성은 시나리오 특성, 사용자 기본 특성 및 사용자 선호 특성 등 데이터를 포함하지만 이에 한정되지 않는다.

여기서, 사용자 피드백 데이터는 과거 사용자가 리소스 추천 결과에 응답하여 생성된 데이터로 이해할 수 있다.

여기서, 트래픽 인덱스는 리소스 추천을 수행할 때, 만족해야 하는 추천 인덱스 요구인 것을 이해할 수 있다. 예시적으로 트래픽 인덱스는 추천 인덱스일 수 있고, 클릭률, 랜딩 페이지 지속 시간, 리스트 페이지 지속 시간, 댓글 수, 좋아요 수 및 공유 수 중 적어도 하나를 포함할 수 있고, 또는 상기 적어도 하나의 파라미터를 기반하여 추천 인덱스를 결정한다.

선택적으로, 트래픽 인덱스는 상호 작용 동작의 상호 작용 응답 인덱스를 포함하고, 리소스 추천 시스템에서 리소스 추천을 수행한 후, 과거 사용자가 리소스 추천 결과의 상호 작용을 특성화하는데 사용된다.

물론, 상기 트래픽 인덱스가 포함하는 내용에 대해서만 예시적으로 설명하고, 트래픽 인덱스는 또한 리소스 추천 시스템의 실제 트래픽 요구에 따라, 다른 인덱스 파라미터로 결정될 수도 있고, 여기서 반복하여 설명하지 않는다.

하나의 구체적인 구현방식에서, 트래픽 인덱스가 시간 응답 인덱스를 포함하면; 대응하게, 각 트래픽 인덱스에 따른 응답 행동 데이터 통계값에 따라, 사용자 피드백 데이터를 결정하는 단계는, 시간 응답 인덱스에 따른 응답 행동 데이터 통계값에 따라, 총 리소스 응답 지속 시간을 결정하는 단계; 총 리소스 응답 지속 시간에 따라, 각 과거 사용자의 사용자 피드백 데이터를 결정하는 단계; 일 수 있다.

이해할 수 있는 것은, 시간 응답 인덱스에 따른 응답 행동 데이터 통계값을 기반으로, 사용자 피드백 데이터를 결정하는 것은, 리소스 추천 모델에 대한 과거 사용자의 시간 점도를 간접적으로 특성화할 수 있다. 따라서, 후속 시간 점도와 관련된 사용자 피드백 데이터를 사용하여 리소스 추천 모델의 추천 전략 파라미터를 결정하여, 결정된 추천 전략 파라미터가 리소스 추천 시스템에 적용될 때, 리소스 추천 결과가 시간 응답 인덱스에 더 가까울 수 있다.

예시적으로, 과거 사용자 단일 새로 고침 총 지속 시간을 시간 응답 인덱스로 할 수 있다. 대응하게, 과거 사용자가 단일 새로 고침을 수행할 때의 랜딩 페이지 지속 시간과 리스트 페이지 지속 시간의 합을 총 리소스 응답 지속 시간으로 하고; 총 리소스 응답 지속 시간에 따라, 사용자 피드백 데이터를 결정한다. 예를 들어, 총 리소스 응답 지속 시간은 사용자 피드백 데이터로 직접 사용된다.

다른 하나의 구체적인 구현방식에서, 시간 응답 인덱스와 상호 작용 응답 인덱스 간에 일정한 제약 관계가 존개할 수 있기에, 트래픽 인덱스는 시간 응답 인덱스와 상호 작용 응답 인덱스를 포함할 수 있다. 예를 들어, 리소스 추천 시스템에서, 총 리소스 응답 지속 시간을 도입하는 것을 통해, 사용자 단일 새로 고침 지속 시간이 충분히 길어지는 것을 확보하지만, 시스템 추천의 단일 리소스의 리소스 지속 시간이 너무 긴 경우가 존재할 수 있으며; 상호 작용 응답 데이터를 도입하는 것을 통해, 단일 새로 고침으로 사용자의 상호 작용 횟수가 충분히 많은 것을 확보하지만, 시스템 추천의 단위 리소스의 지속 시간이 너무 짧은 상황이 존재할 수 있다. 한편, 실제 추천 과정에서, 사용자가 실제 리소스 열람 지속 시간과 리소스 추천시 전체 추천 리소스의 열람 지속 시간이 일치하지 않은 상황도 존재하고, 예를 들어 사용자가 추천 리소스의 일부만 열람하거나, 하나의 리소스의 일부 내용만 열람하여, 추천 결과와 사용자의 실제 열람 결과의 차이가 커진다. 양자를 함께 구현하여, 최종적으로 결정된 추천 전략 파라미터가 더 합리하도록 확보하는 것을 통해 사용자의 사용 경험을 향상하기 위한 기반을 마련하기 위해, 각 트래픽 인덱스에 따른 응답 행동 데이터 통계값에 따라, 사용자 피드백 데이터를 결정하는 단계는, 시간 응답 인덱스에 따른 응답 행동 데이터 통계값에 따라, 총 리소스 응답 지속 시간을 결정하는 단계; 상호 작용 응답 인덱스에 따른 응답 행동 데이터 통계값과 과거 응답 지속 시간에 따라, 지속 시간 보정량을 결정하는 단계; 및 지속 시간 보정량과 총 리소스 응답 지속 시간에 따라, 각 과거 사용자의 사용자 피드백 데이터를 결정하는 단계; 일 수도 있다.

상기 기술방안에 기초하여, 사용자 피드백 데이터의 재사용을 용이하게 하기 위해, 사용자 피드백 데이터를 파라미터 결정 설비 로컬에, 또는 파라미터 결정 설비와 관련된 다른 저장 설비 및 클라우드에 미리 저장할 수 있고, 대응하게, 리소스 추천을 수행할 때, 파라미터 결정 설비 로컬로부터, 또는 파라미터 결정 설비와 관련된 가른 저장 설비 및 클라우드로부터 사용자 피드백 데이터를 획득하여, 획득한 사용자 피드백 데이터에 따라, 추천 전략 파라미터를 결정한다.

설명해야 할 것은, 상기 기술방안은 과거 사용자의 응답 행동 데이터 통계값을 과거 리소스 추천 결과에 도입하는 것을 통해, 사용자 피드백 데이터를 결정하고, 사용자 피드백 데이터의 결정 메커니즘을 보완한다. 또한, 트래픽 인덱스를 통해 응답 행동 데이터 통계값에 대해 한정하고, 결정된 사용자 피드백 데이터가 트래픽 인덱스 수요를 특성화하여, 사용자 피드백 데이터를 기반으로 결정된 전략 추천 파라미터를 통해, 트래픽 인덱스 수요에 더욱 매칭되고, 결정된 추천 전략 파라미터와 리소스 추천 시스템의 매칭도를 향상하여, 리소스 추천 시스템의 추천 기능을 향상하는 것에 기반을 마련하였으며, 사용자의 사용 경험을 향상하는 것에 대한 보장을 제공한다.

단계(S302), 사용자 피드백 데이터에 따라, 파라미터 최적화 모델에서의 네트워크 파라미터를 조정한다.

여기서, 파라미터 최적화 모델은 진화 학습 알고리즘을 기반으로 구현하거나, 다른 알고리즘을 사용하여 구현될 수 있으며, 본 출원의 실시예는 이를 한정하지 않는다.

본 출원의 실시예의 하나의 선택적 실시방식에서, 사용자 피드백 데이터에 따라, 파라미터 최적화 모델에서의 네트워크 파라미터를 조정하는 단계는, 과거 사용자의 계정 정보와 시간 정보에 따라, 교란 데이터 그룹을 생성하고; 사용자 피드백 데이터와 교란 데이터 그룹에 따라, 파라미터 조정 스텝 크기를 결정하며; 파라미터 조정 스텝 크기에 따라, 파라미터 최적화 모델에서의 네트워크 파라미터를 조정하는 단계; 일 수 있다.

여기서, 계정 정보는 리소스 추천 시스템의 과거 사용자의 로그인 계정일 수 있고, 사용자 신원을 고유하게 특성화하는데 사용된다. 여기서, 시간 정보는 과거 사용자가 리소스 추천 시스템을 사용하는 시간대를 특성화하는데 사용된다. 여기서, 시간 정보의 측정 단위는 기술자가 수요에 따라 설정할 수 있고, 예를 들어, 시간을 최소 측정 단위로 사용한다.

일 선택적 실시방식에서, 과거 사용자의 계정 정보와 시간 정보에 따라, 교란 데이터 그룹을 생성하는 단계는, 과거 사용자의 계정 정보와 시간 정보에 따라, 해싱 연산을 수행하여, 난수 씨드를 획득하고; 분포 함수를 사용하고 난수 씨드를 기반으로 교란 데이터 그룹을 생성하는 단계; 일 수 있다. 여기서, 교란 데이터 그룹의 교란 데이터 수는 상이한 전략 파라미터에서 무작위 교란을 특성화하는데 사용되는 추천 전략 파라미터의 수량와 동일하다. 여기서, 분포 함수는 기술자가 필요 또는 경험치에 따라 결정하거나, 또는 대량 실험을 통해 반복적으로 결정할 수 있다. 예시적으로, 분포 함수는 가우스 분포 함수일 수 있다.

설명해야 할 것은, 리소스 추천 시스템이 겨냥성과 시효성을 구비함으로 인해, 예를 들어, 상이한 사용자에게 추천한 리소스 콘텐츠가 상이하고, 동일한 사용자에 대해 동일한 시간대에 추천한 리소스 콘텐츠가 동일하며, 동일한 사용자에 대해 상이한 시간대에 추천한 리소스 콘텐츠도 상이하다. 따라서, 교란 데이터 그룹을 생성할 때, 과거 사용자의 계정 정보와 시간 정보를 도입하여, 생성된 난수 씨드가 동일한 사용자에 대해 동일한 시간대에서 동일한 값을 가지므로, 동일한 시간대에 상이한 사용자에 대한 값이 상이하며, 상이한 시간대에 동일한 사용자에 대한 값이 상이하여, 난수 씨드를 기반으로 생성된 교란 데이터 그룹은 리소스 추천 시스템에 더 잘 적응할 수 있다.

난수 씨드의 재사용을 달성하기 위해, 각 과거 사용자에 대해 상이한 시간대에서 난수 씨드를 생성한 후, 난수 씨드를 포함한 데이터가 후속 작업을 위해 저장될 수 있음을 이해해야 한다.

선택적으로, 과거 사용자의 로그인 계정, 계정 로그인 일자와 시간에 대해 해싱 계산을 수행하여, 난수 씨드를 획득하고; 가우스 분포 함수를 사용하고 난수 씨드를 기반으로, 교란 데이터 그룹을 생성한다.

일 선택적 실시예에서, 사용자 피드백 데이터와 교란 데이터 그룹에 따라, 파라미터 조정 스텝 크기를 결정하는 단계는, 교란 데이터 그룹에 따라 초기 파라미터 조정 스텝 크기를 결정하고; 사용자 피드백 데이터에 따라 초기 스텝 크기를 보정하여, 최종 파라미터 조정 스텝 크기를 획득하는 단계; 일 수 있다.

다른 선택적 실시예에서, 사용자 피드백 데이터와 교란 데이터 그룹에 따라, 파라미터 조정 스텝 크기를 결정하는 단계는, 사용자 피드백 데이터에 따라, 교란 데이터 그룹의 각 교란 데이터에 대해 가중하여, 교란 강화 데이터를 획득하고; 교란 강화 데이터에 따라, 파라미터 조정 스텝 크기를 결정하는 단계; 일 수 있다.

이해할 수 있는 것은, 교란 데이터 그룹을 도입하는 것을 통해 파라미터 조정 스텝 크기를 결정하고, 사용자 피드백 데이터를 도입하는 것을 통해 각 전략 파라미터에 대응하는 교란을 강화하거나 약화하여, 최종적으로 결정된 교란 강화 데이터가, 리소스 추천 시스템에서 현재 사용하는 전략 파라미터에 더 잘 적응하여, 후속 교란 강화 데이터를 기반으로 결정된 파라미터 조정 스텝 크기의 정확도와 합리성에 기반을 마련한다.

선택적으로, 사용자 피드백 데이터에 따라, 교란 데이터 그룹의 각 교란 데이터에 대해 가중하여, 교란 강화 데이터를 회득 하는 단계는, 과거 사용자의 과거 피드백 데이터에 따라, 사용자 피드백 데이터에 대해 표준화 처리를 수행하여, 사용자 피드백 데이터를 업데이트하는 단계; 업데이트된 사용자 피드백 데이터에 따라, 교란 데이터 그룹의 각 교란 데이터에 대해 가중을 수행하여, 교란 강화 데이터를 획득하는 단계; 를 포함한다.

예시적으로, 과거 사용자의 과거 피드백 데이터에 따라, 사용자 피드백 데이터에 대해 표준화 처리를 하여, 사용자 피드백 데이터를 업데이트하는 단계는, 각 과거 피드백 사용자에 대해, 해당 과거 피드백 사용자의 과거 피드백 데이터에 따라, 해당 과거 피드백 사용자의 과거 피드백 통계값을 결정하고; 과거 피드백 통계값에 따라, 과거 피드백 사용자의 사용자 피드백 데이터를 표준화 처리하여, 사용자 피드백 데이터를 업데이트하는 단계; 일 수 있다.

예시적으로, 과거 사용자의 과거 피드백 데이터에 따라, 사용자 피드백 데이터에 대해 표준화 처리를 하여, 사용자 피드백 데이터를 업데이트하는 단계는, 각 과거 피드백 사용자에 대해, 해당 과거 피드백 사용자의 과거 피드백 데이터에 따라, 과거 피드백 사용자가 현재 시간대에서의 피드백 예측치를 결정하고; 피드백 예측치에 따라, 과거 피드백 사용자의 사용자 피드백 데이터를 표준화 처리하여, 사용자 피드백 데이터를 업데이트하는 단계; 일 수 있다.

예시적으로, 과거 사용자의 과거 피드백 데이터에 따라, 사용자 피드백 데이터에 대해 표준화 처리를 하여, 사용자 피드백 데이터를 업데이트하는 단계는, 각 과거 피드백 사용자에 대해, 해당 과거 피드백 사용자의 과거 피드백 데이터에 따라, 해당 과거 피드백 사용자의 표준 피드백 데이터를 결정하고; 사용자 피드백 데이터와 표준 피드백 데이터의 차이값을 결정하고, 해당 차이값을 업데이트된 후의 사용자 피드백 데이터로 하는 단계; 일 수도 있다. 여기서, 표준 피드백 데이터는 과거 피드백 통계값의 평균값 또는 피드백 예측치일 수 있다.

예시적으로, 과거 사용자의 과거 피드백 데이터에 따라, 사용자 피드백 데이터에 대해 표준화 처리를 하여, 사용자 피드백 데이터를 업데이트하는 단계는, 각 과거 피드백 사용자에 대해, 해당 과거 피드백 사용자의 과거 피드백 데이터에 따라, 해당 과거 피드백 사용자의 표준 피드백 데이터를 결정하고; 사용자 피드백 데이터와 표준 피드백 데이터의 차이값을 결정하고, 결정된 차이값과 대응하는 표준 피드백의 비율값을 결정하며; 해당 비율값을 업데이트된 사용자 피드백 데이터로 하는 단계; 일 수도 있다. 여기서, 표준 피드백 데이터는 과거 피드백 통계값의 평균값 또는 피드백 예측치일 수 있다.

물론, 본 출원의 실시예는 기존 기술의 다른 방식을 더 사용하여 사용자 피드백 데이터에 대해 표준화 처리를 할 수 있으며, 여기서 반복하여 설명하지 않는다.

설명해야 할 것은, 사용자 피드백 데이터에 대해 표준화 처리하여, 상이한 피드백 사용자가 자신과 리소스 추천 시스템 사이의 견고성으로 인해 사용자 피드백 데이터 차이가 분명한 상황이 발생하는 경우를 제거하여, 비정상적 활성 사용자와 비정상적 비활성 사용자의 사용자 피드백 데이터가 교란 강화 데이터의 정확도에 영향주는 것을 방지하여, 나아가 각 추천 전략 파라미터의 정확도에 대한 최종 결정에 영향주는 것을 방지한다. 여기서, 과거 피드백 통계값은 최대값, 최소값, 평균값, 평방 편차와 표준 편차 중 적어도 하나를 포함할 수 있다.

일 실시예에서, 결정된 파라미터 조정 스텝 크기는 조정 진폭과 조정 방향을 포함한다. 여기서, 조정 진폭은 파라미터 최적화 모델에서 네트워크 파라미터에 대해 조정의 수치 크기를 특성화하는데 사용되고; 조정 방향은 파라미터 최적화 모델에서 네트워크 파라미터에 대해 정방향 조정 또는 부방향 조정을 특성화하는데 사용된다. 일반적으로, 조정 방향은 플러스 또는 마이너스 기호를 통해 구분한다.

예시적으로, 파라미터 조정 스텝 크기에 따라, 파라미터 최적화 모델에서 네트워크 파라미터를 조정하는 단계는, 파라미터 조정 스텝 크기와 파라미터 최적화 모델이 최근 사용한 네트워크 파라미터 사이의 합을 결정하고, 결정된 합을 새로운 네트워크 파라미터로 하는 단계일 수 있다.

이해할 수 있는 것은, 과거 사용자의 계정 정보와 시간 정보를 통해, 교란 데이터 그룹을 생성하여, 파라미터 조정 스텝 크기를 결정하는데 사용하고, 나아가 파라미터 조정 스텝 크기에 따라 파라미터 최적화 모델의 네트워크 파라미터를 조정하여, 네트워크 파라미터의 조정 방식을 보완하고, 전략 파라미터 생성을 위한 데이터 지원을 제공하며, 또한 전략 파라미터와 리소스 추천 시스템의 매칭도를 향상을 위해 기반을 마련한다.

단계(S303), 과거 사용자의 추천 참조 특성을 조정한 후의 파라미터 최적화 모델에 입력하여, 적어도 두 개의 추천 전략 파라미터를 획득한다. 여기서, 추천 전략 파라미터는 적어도 두 개의 리소스 추천 모델에서 사용한 파라미터이고, 적어도 두 개의 리소스 추천 모델에 관련된 리소스 처리 단계는 상이하다.

여기서, 파라미터 최적화 모델은 추천 전략 파라미터를 결정하는데 사용된다. 여기서, 파라미터 최적화 모델의 모델 입력 데이터는 과거 사용자의 추천 참조 특성이고; 모델 출력 데이터는 리소스 추천 모델의 각 추천 전략 파라미터이다. 여기서, 추천 참조 특성은 시나리오 특성, 사용자 기본 특성 및 사용자 선호 특성을 포함하지만 이에 한정되지 않는다. 추천 전략 파라미터와 리소스 추천 모델의 매칭도를 확보하기 위해, 파라미터를 결정할 때 사용한 과거 사용자의 추천 참조 특성은 리소스 추천을 수행할 때, 리소스 추천 모델이 사용한 타겟 사용자의 추천 참조 특성에서 포함된 데이터와 대응되고, 즉 데이터 유형이 일치한 것이 바람직하다.

구체적으로, 과거 사용자의 추천 참조 특성을 조정한 후의 파라미터 최적화 모델에 입력하여, 새로운 각 추천 전략 파라미터를 획득하고, 리소스 추천 모델에 적용하며, 타겟 사용자에게 리소스 추천을 수행하는데 사용된다. 대응하게, 타겟 사용자가 리소스 추천 결과에 대한 피드백 상황을 획득하고, 해당 피드백 상황을 기반으로 사용자 피드백 데이터를 결정하며, 후속 파라미터 최적화 모델의 네트워크 파라미터에 대한 조정 과정을 안내하고, 모델 훈련의 마감 족건을 충족할 때까지 반복하며, 점차적으로 리소스 추천 모델과 매칭도가 높은 전략 파라미터를 획득한다.

본 출원의 실시예의 일 선택적 실시방식에서, 모델 훈련 마감 조건은 설정된 훈련 횟수에 도달하거나, 파라미터 최적화 모델이 안정되는 것일 수 있다.

설명해야 할 것은, 리소스 추천 시스템이 리소스 추천을 수행할 때, 리소스 자체의 성능 또는 추천 환경 등 많은 요소의 영향을 받을 수 있으므로, 파라미터 최적화 모델 자신이 안정된 후, 재변동하는 상황이 발생할 수도 있으므로, 대응되는 파라미터 최적화 모델이 결정한 추천 전략 파라미터와 리소스 추천 시스템의 각 리소스 추천 모델 사이의 매칭도도 감소될 수 있다.

상기 상황이 리소스 추천 모델의 추천 성능에 영향을 주는 것을 감소하고, 나아가 사용자가 리소스 추천 결과에 대한 만족도를 향상하기 위해, 파라미터 최적화 모델이 안전된 후, 계속하여 파라미터 최적화 모델을 훈련할 수 있다. 훈련 과정에서, 우선 파라미터 최적화 모델의 안정 상황을 확정하고; 파라미터 최적화 모델 변동이 설정된 임계값보다 크면, 파라미터 최적화 모델이 불안정한 것을 나타내고, 따라서 계속하여 파라미터 최적화 모델의 네트워크 파라미터를 조정할 필요가 있으며, 조정된 파라미터 최적화 모델을 기반으로, 추천 전략 파라미터의 재결정을 수행하고 사용하며; 파라미터 최적화 모델 변동이 설정된 임계값보다 크지 않으면, 파라미터 최적화 모델이 상대적으로 안정한 것을 나타내고, 따라서 원래의 네트워크 파라미터를 유지하며, 원래의 파라미터 최적화 모델을 기반으로 전략 파라미터의 재결정을 수행하고 사용한다. 또는 선택적으로, 파라미터 최적화 모델에 대해 주기적 초기화를 수행할 수 있으며, 즉 파라미터 최적화 모델의 사용 주기에 도달한 후, 파라미터 최적화 모델의 적어도 일부 네트워크 파라미터에 대해 초기화하며, 그 후 초기화된 파라미터 최적화 모델에 대해 상응한 사용 주기에서 재훈련을 수행한다. 여기서, 설정된 임계값과 사용 주기는 기술자가 필요 또는 경험치에 따라 결정하거나, 또는 대량 실험을 통해 반복적으로 결정할 수 있다.

본 출원의 실시예는 파라미터 결정 모델을 도입하고 추천 전략 파라미터를 결정하는 것을 통해, 각 전략 파라미터의 공동 최적화(Joint optimization)를 구현하며, 리소스 처리 단계의 단일 추천 전략 파라미터 최적화가 필요 없고, 파라미터 최적화 과정의 데이터 계산량을 줄이며, 추천 전략 파라미터의 결정 효율을 향상시키고, 리소스 추천 모델에서 각 추천 전략 파라미터의 온라인 실시간 업데이트 가능성을 제공한다. 또한, 공동 최적화 과정에서 상이한 추천 전략 파라미터 사이의 상호 작용을 종합적으로 감안하여, 단독으로 단일 추천 전략 파라미터를 결정할 때 전략 파라미터가 상호 제약으로 인한, 리소스 추천 시스템의 불안정성을 방지한다. 또한, 과거 사용자의 사용자 피드백 데이터를 도입하여 파라미터 최적화 모델의 훈련 과정을 안내하는 것을 통해, 파라미터 최적화 모델의 출력 결과가 추천 전략 파라미터의 물리적 의미를 가지고, 추천 전략 파라미터의 공동 최적화를 위해 기반을 마련하였다. 또한, 과거 피드백 사용자의 추천 참조 특성을 통해 전략 파라미터를 결정하여, 추천 전략 파라미터를 결정하는 과정에서 사용한 데이터와 리소스 추천 모델을 이용하여 리소스 추천을 수행할 때 사용한 데이터가 상호 적응하게 하여, 최종적으로 결정된 추천 전략 파라미터와 리소스 추천 모델의 매칭도를 향상한다.

본 출원의 실시예는 상기 각 기술방안에 기초하여, 하나의 바람직한 실시예를 더 제공한다. 본 실시예의 기술방안을 명확하게 설명하기 위해, 우선 본 출원의 실시예에 따른 리소스 추천 시스템을 명확하게 설명한다.

도 4A에 도시된 리소스 추천 시스템을 참조하면, 온라인 추천 시스템(100)과 온라인 진화 시스템(200)을 포함하고, 여기서, 온라인 추천 시스템(100)에는 적어도 두 개의 캐스케이드 리소스 추천 모델이 설치되고, 각 리소스 추천 모델의 리소스 처리 단계는 상이하다. 여기서, 각 리소스 처리 단계는 처리될 리소스를 선택하고, 최종 선택된 처리될 리소스를 리소스 추천 결과로 타겟 사용자에게 피드백하는데 사용된다. 여기서, 첫 번째 리소스 추천 모델의 처리될 리소스는 리콜 대기 리소스이고; 마지막 리소스 추천 모델의 선택 결과는 타겟 사용자의 리소스 추천 결과이다. 여기서, 온라인 진화 시스템(200)에서 ES 알고리즘을 기반으로 구현된 파라미터 최적화 모델을 설치하고, 리소스 추천 결과에 대한 과거 사용자의 사용자 피드백 데이터에 기반하여, 리소스 추천 모델 그룹에서 사용된 추천 전략에서의 추천 전략 파라미터를 공동으로 결정하고, 결정된 추천 전략 파라미터를 온라인 추천 시스템에서 설정된 각 리소스 추천 모델에 적용하며, 새로운 타겟 사용자에게 리소스 추천을 수행하는데 사용한다.

도 4B에 도시된 온라인 추천 시스템의 프레임 구조 개략도를 참조하면, 해당 온라인 추천 시스템은 하나의 깔때기 모양의 구조이며, 리소스 회수 단계, 리소스 러프 배열 단계, 리소스 정밀 배열 단계와 리소스 재배열 단계, 즉 네개의 리소스 처리 단계를 포함한다. 대응하게, 리소스 추천 모델은 리소스 회수 모델, 리소스 러프 배열 모델, 리소스 정밀 배열 모델과 리소스 재배열 모델을 포함한다. 여기서, 각 리소스 처리 단계는 수요에 따라 적어도 하나의 서브 단계를 설정할 수 있다. 예를 들어, 리소스 재배열 단계는 후보 리소스 시퀀스 생성 서브 단계와 타겟 리소스 시퀀스 생성 서브 단계를 포함하는 것으로 설정할 수 있다.

상기 각 리소스 처리 단계의 리소스 추천 모델에서, 적어도 하나의 추천 전략을 사용하여, 리소스 추천에 대해 제한하는데사용한다. 여기서, 추천 전략은 리소스 카테고리 비율 전략, 리소스 콘텐츠 다양화 전략과 다중 추천 인덱스 균형 전략을 포함하지만 이에 한정되지 않는다.

여기서, 리소스 카테고리 비율 전략은 리소스 추천을 수행할 때, 적어도 두 가지 유형의 리소스의 종합 추천의 전략을 설정하여, 사용자가 리소스 추천 결과에 대한 만족도를 향상하는 것으로 이해할 수 있다. 예를 들어, 정보 흐름 추천할 때, 사진과 기사, 동영상, 짧은 영상, 등 리소스를 종합하여 추천한다. 대응하게, 리소스 카테고리 비율 전략에서의 사용 파라미터는 리소스 비율 파라미터일 수 있다.

여기서, 리소스 콘텐츠 다양화 전략은 리소스 추천을 수행할 때, 동일한 유형 리소스가 추천 리소스 콘텐츠의 다양성을 제공하는 것을 확보하여, 리소스 콘텐츠가 단일함으로 인해 발생한 과적합문제를 방지하고, 동일한 유형의 리소스의 커버 영역을 증가하여, 사용자 경험 만족도를 향상하는 것으로 이해할 수 있다. 대응하게, 리소스 콘텐츠 다양화 전략에서 사용된 파라미터는 댜양화에 사용된 가중치 조정 공식 중의 다양화 가중치 조정 파라미터일 수 있다. 여기서, 다양화 가중치 조정 파라미터는 동일한 유형 리소스에서 상이한 리소스 콘텐츠 유별의 비율 가중치를 설정하는데 사용된다. 여기서, 가중치 조정 공식은 기술자가 필요 또는 경험에 의해 결정하거나, 또는 대량 실험을 통해 반복적으로 결정할 수 있다.

여기서, 다중 추천 인덱스 균형 전략은 리소스 추천을 수행할 때, 상이한 리소스 추천 인덱스 요구를 충족하는 전략을 의미한다. 예를 들어 추천 인덱스는 클릭률, 랜딩 페이지 지속 시간, 리스트 페이지 지속 시간, 댓글, 좋아요 및 공유 중 적어도 하나를 포함할 수 있다. 상이한 리소스 추천 인덱스 사이에 상호 제약하는 상황이 존재하므로, 다중 추천 인덱스 균형을 병행하는 방식을 통해, 상이한 추천 인덱스 사이의 영향을 밸런싱할 수 있다. 대응하게, 다중 추천 인덱스 균형 전략의 사용 파라미터는, 다중 추천 인덱스 추천에 사용된 융합 공식의 다중 추천 인덱스 융합 파라미터일 수 있다. 여기서, 융합 공식은 기술자가 필요 또는 경험에 따라 결정하고, 또는 대량 실험을 통해 반복적으로 결정할 수 있다.

도 4C에 도시된 파라미터 최적화 모델의 구조 개략도를 참조하면, 해당 파라미터 최적화 모델은 ES 학습 알고리즘에 기반하여 구축한 DNN(Deep Neural Networks, 심층 신경망)모델이며, 입력층, 은닉층 및 출력층을 포함한다. 여기서, 입력층은 과거 사용자의 시나리오 특성, 사용자 기본 특성과 사용자 선호 특성을 입력하고, 과거 사용자의 시나리오 특성, 사용자 기본 특성과 사용자 선호 특성을 포함하는 추천 참조 특성을 은닉층으로 입력하며; 은닉층은 과거 사용자의 추천 참조 특성의 각 특성에 대해 처리하는데 사용되고; 출력층은 은닉층의 출력 데이터에 따라, 온라인 추천 시스템에서 각 리소스 추천 모델의 추천 전략 파라미터를 결정하는데 사용된다.

여기서, 시나리오 특성은 새로 고침 횟수, 새로 고침 상태, 새로 고침 크기, 네트워크 상태 및 새로 고침 시간대 등을 포함하지만 이에 한정되지 않는다. 사용자 기본 특성은 타겟 사용자의 성별, 연령, 학력, 사용자 활약도, 사용자 과거의 좋아요 클릭률 및 사용자 리소스 선호 등을 포함하지만 이에 한정되지 않는다. 사용자 선호 특성은 타겟 사용자가 상이한 종류의 리소스에서 상이한 종류의 리소스 콘텐츠에 대한 좋아하는 정도를 포함하지만 이에 한정되지 않는다.

이하, 도 4A 내지 도 4C에 기초하여, 본 실시예에서의 리소스 추천 방법을 상세히 설명한다.

도 4D에 도시된 리소스 추천 방법을 참조하면, 해당 방법은:

사용자 피드백 데이터 결정 단계(S410);

교란 데이터 생성 단계(S420);

네트워크 파라미터 진화 딘계(S430);

리소스 추천 단계(S440); 를 포함한다.

예시적으로, 사용자 피드백 데이터 결정 단계는 다음 단계를 포함한다.

단계(S411), 이전에 생성한 추천 전략 파라미터를 온라인 추천 시스템에 적용한 후, 과거 사용자의 단일 새로 고침의 랜딩 페이지 지속 시간, 리스트 페이지 지속 시간과 클릭수를 획득한다.

단계(S412), 각 과거 사용자에 대해, 평균 리소스 페이지 지속시간과 클릭수의 곱을 결정하고, 해당 곱 및 랜딩 페이지 지속 시간과 리스트 페이지 지속 시간의 합을 사용자 피드백 데이터로 한다.

구체적으로, 이하의 공식에 따라, 사용자 피드백 데이터를 결정한다.

Reward= Sum(랜딩 페이지 지속 시간+리스트 페이지 지속 시간) +평균 리소스 페이지 지속 시간*클릭수.

여기서, Reward는 피드백 사용자가 현재 시간대에 단일 새로 고침에 대응하는 사용자 피드백 데이터이고; Sum()은 합산 공식이며; 평균 리소스 페이지 지속 시간은 전날 추천 시스템이 하루 종일 추천한 리소스의 총 지속 시간의 평균값이다.

단계(S413), 각 과거 사용자의 사용자 피드백 데이터와 해당 과거 사용자의 피드백 데이터 예측치의 차이값을 결정하고, 해당 차이값을 새로운 사용자 피드백 데이터로 한다.

여기서, 피드백 데이터 예측치는 과거 사용자가 과거 시간대의 피드백 데이터를 통해, 현재 시간대의 사용자 피드백 상황을 예측하는 예측 결과로 이해할 수 있다.

구체적으로, 이하의 공식에 따라, 사용자 피드백 데이터를 업데이트한다.

△Reward = Reward-re_base;

여기서, Reward는 현재 시간대의 피드백 사용자의 사용자 피드백 데이터이고; re_base는 현재 시간대의 피드백 사용자의 피드백 데이터의 예측치이며; △Reward는 현재 시간대의 피드백 사용자의 업데이트한 후의 사용자 피드백 데이터이다.

예시적으로, 교란 데이터를 생성하는 단계는 다음 단계를 포함한다.

단계(S421), 과거 사용자의 로그인 계정과 로그인 시간에 대해 해시 계산을 수행하여, 난수 씨드를 생성한다.

단계(S422), 난수 씨드를 기반으로, 가우스 분포 함수를 사용하여, 네트워크 파라미터와 매칭되는 교란 데이터 그룹을 생성한다.

여기서, 교란 데이터 그룹에 포함된 교란 데이터의 수와 네트워크 파라미터의 수는 동일하고, 각 네트워크 파라미터와 교란 데이터는 일대일 대응한다.

예시적으로, 네트워크 파라미터 진화 단계는 다음 단계를 포함한다.

단계(S431), 교란 데이터 그룹의 각 교란 데이터와 대응하는 파라미터 최적화 모델의 마지막 반복의 네트워크 파라미터의 합을 결정하고, 새로운 네트워크 파라미터를 획득한다.

예시적으로, 이하의 공식을 사용하여 새로운 네트워크 파라미터를 결정한다.

w_i'＝w_i + e_i;

여기서, w_i는 파라미터 최적화 모델에서 제i 번째의 네트워크 파라미터이고; e_i는 교란 데이터 그룹에서 제i 번째의 네트워크 파라미터와 대응하는 교란 데이터이며; w_i'는 제i 번째의 네트워크 파라미터에 대응하는 새로운 네트워크 파라미터이다.

단계(S432), 새로운 사용자 피드백 데이터를 사용하여 교란 데이터 그룹의 각 교란 데이터에 대해 가중을 수행하여, 교란 강화 데이터를 획득한다.

예시적으로, 이하의 공식을 사용하여 교란 강화 데이터를 결정한다.

Step_list= append(e_i*△Reward);

여기서, Step_list는 교란 강화 데이터로 형성된 어레이이고; 해당 어레이의 길이는 교란 데이터 수와 사용자 피드백 데이터 수의 곱이다. 여기서, 사용자 피드백 데이터의 수는 현재 시간대의 과거 사용자 수와 새로 고침 횟수의 곱이다.

단계(S433), 교란 강화 데이터의 합과 교란 강화 데이터의 비율값에 따라, 파라미터 조정 스텝 크기를 결정한다.

예시적으로, 이하의 공식을 사용하여 파라미터 조정 스텝 크기를 결정한다.

Step= Sum(Step_list) / len(Step_list) * learning_rate;

여기서, Step는 결정된 파라미터 조정 스텝 크기이고; len()은 어레이 길이 결정 함수이며;

learning_rate는 학습률이고, 어레이는 경험치이다.

단계(S434), 새로운 네트워크 파라미터에 대응하는 파라미터 조정 스텝 크기를 누적하여, 이번 반복의 네트워크 파라미터를 획득한다.

예시적으로, 리소스 추천 단계는 다음 단계를 포함한다.

단계(S441), 타겟 사용자의 추천 참조 특성을 이번 반복의 네트워크 파라미터의 파라미터 최적화 모델에 입력하여 이번 반복의 추천 전략 파라미터를 획득한다.

여기서, 타겟 사용자의 추천 참조 특성은 시나리오 특성, 사용자 기본 특성 및 사용자 선호 특성을 포함하지만 이에 한정되지 않는다. 설명해야 할 것은, 온라인 추천 시스템의 리소스 추천 결과와 타겟 사용자 매칭도를 향상하기 위해, 리소스 추천 단계에서 사용하는 타겟 사용자의 추천 참조 특성에 포함되는 내용은 파라미터 최적화 모델 입력층에서 사용하는 과거 사용자의 추천 참조 특성에 포함되는 내용과 동일하거나 대응된다.

단계(S442), 이번 반복의 추천 전략 파라미터를 온라인 추천 시스템에 적용한 후, 타겟 사용자의 단일 새로 고침의 랜딩 페이지 지속 시간, 리스트 페이지 지속 시간과 클릭수를 수집한다. 리턴하여 단계(S411)를 실행한다.

본 출원의 실시예는 온라인 진화 학습을 통해 추천 시스템에서 전부 처리 전략의 각 전략 파라미터의 글러벌 조합 최적화를 구현하고, 전부 시스템의 목표가 일치하며, 최종적으로 결정된 전략 파라미터와 추천 시스템이 더 잘 매칭되게 한다. 또한, 전략 파라미터를 결정할 때, 시나리오 특성과 사용자 특성 등을 도입하여, 추천 모델이 심층 개인화의 시나리오 자동 적응 추천 능력을 구비하게 한다.

설명해야 할 것은, 본 출원의 실시예에 관련된 리소스 추천 방법은, 적어도 하나의 리소스 처리 단계를 포함하는 경우 즉 각 리소스 처리 단계는 적어도 하나의 처리 전략을 사용하고, 각 처리 전략은 적어도 하나의 전략 파라미터의 기타 리소스 처리 시스템을 포함하며, 리소스 처리 시스템을 통해 리소스를 처리하는 상황에도 마찬가지로 적용된다. 본 출원은 리소스 추천 방법의 예로 예시적으로 설명하고 있지만, 이에 대한 한정으로 이해하면 않된다.

상기 각 리소스 추천 방법의 구현으로서, 본 출원은 리소스 추천 방법을 실행하기 위한 가상 장치의 하나의 실시예를 더 제공한다. 더 나아가, 도 5에 도시된 리소스 추천 장치의 구조도를 참조하면, 해당 리소스 추천 장치(500)는, 추천 참조 특성 결정 모듈(501)과 리소스 추천 결과 결정 모듈(502)을 포함한다. 여기서,

추천 참조 특성 결정 모듈(501)은 타겟 사용자의 추천 참조 특성을 결정하는데 사용되고;

리소스 추천 결과 결정 모듈(502)은 적어도 두 개의 리소스 추천 모델에 기반하여, 상기 타겟 사용자의 추천 참조 특성에 따라, 상기 타겟 사용자를 위해 리소스 추천 결과를 결정하는데 사용되고;

여기서, 적어도 두 개의 리소스 추천 모델에서 적어도 두 개의 추천 전략 파라미터는 과거 사용자의 추천 행동 데이터에 따라 공동으로 결정되고, 적어도 두 개의 리소스 추천 모델에 관련된 리소스 처리 단계는 상이하다.

본 출원의 실시예는 추천 참조 특성 결정 모델을 통해 타겟 사용자의 추천 참조 특성을 결정하고; 리소스 추천 결과 결정 모델을 통해 적어도 두 개의 리소스 추천 모델을 기반으로, 타겟 사용자의 추천 참조 특성에 따라, 타겟 사용자를 위해 리소스 추천 결과를 결정한다. 여기서, 적어도 두 개의 리소스 추천 모델에서 적어도 두 개의 리소스 추천 파라미터는 과거 사용자의 추천 행동 데이터에 따라 공동으로 결정되고, 적어도 두 개의 리소스 추천 모델이 관련된 리소스 처리 단계는 상이하다. 상기 기술 방안은 적어도 두 개의 리소스 추천 모델에서 적어도 두 개의 추천 전략 파라미터를 공동으로 결정하는 것을 통해, 상이한 리소스 처리 단계에 대한 각 추천 전략 파라미터의 동적 결정과 자동 조정을 구현하고, 인위적으로 설정된 파라미터가 정확하지 못하여 리소스 추천 결과가 좋지 않은 문제를 방지하며; 또한, 각 추천 전략 파라미터의 공동 결정을 통해, 단일 추천 전략 파라미터가 단독으로 결정되어 각 추천 전략 파라미터가 매칭되지 못하는 문제를 방지함으로써, 각 추천 전략 파라미터 사이의 상호 작용을 병행하고, 나아가 리소스 추천 결과의 정확성 및 리소스 추천 결과와 타겟 사용자의 매칭도와 사용자 만족도를 향상한다.

더 나아가, 과거 사용자의 추천 행동 데이터는 과거 사용자의 추천 참조 특성과 사용자 피드백 데이터를 포함한다.

사용자 피드백 데이터는 파라미터 최적화 모델의 네트워크 파라미터를 조정하는데 사용되고; 파라미터 최적화 모델은 진화 학습 알코리즘을 기반으로 구현된다.

추천 전략 파라미터는 조정된 파라미터 최적화 모델을 기반으로 과거 사용자의 추천 참조 특성에 따라 결정된다.

더 나아가, 장치는 사용자 피드백 데이터를 결정하는데 사용되는 사용자 피드백 데이터 결정 모듈을 더 포함하고;

사용자 피드백 데이터 결정 모듈은, 구체적으로,

과거 사용자가 트래픽 인덱스에서 과거 리소스 추천 결과에 대한 응답 행동 데이터 통계값을 결정하는데 사용되는 응답 행동 데이터 통계값 결정 유닛-여기서, 트래픽 인덱스는 리소스 추천 모델이 사용한 인덱스임-;

각 트래픽 인덱스에 따른 응답 행동 데이터 통계값에 따라, 사용자 피드백 데이터를 결정하는데 사용되는 사용자 피드백 데이터 결정 유닛; 을 포함한다.

더 나아가, 트래픽 인덱스는 시간 응답 인덱스 및/또는 상호 작용 응답 인덱스를 포함하고;

사용자 피드백 데이터 결정 유닛은,

시간 응답 인덱스에 따른 응답 행동 데이터 통계값에 따라, 총 리소스 응답 지속 시간을 결정하는데 사용되는 총 리소스 응답 지속 시간 결정 서브 유닛;

상호 작용 응답 인덱스에 따른 응답 행동 데이터 통계값과 과거 응답 지속 시간에 따라, 지속 시간 보정량을 결정하는데 사용되는 지속 시간 억제량 결정 서브 유닛;

총 리소스 응답 지속 시간에 따라, 각 과거 사용자의 사용자 피드백 데이터를 결정하고; 또는, 지속 시간 보정량과 총 리소스 응답 지속 시간에 따라, 각 과거 사용자의 사용자 피드백 데이터를 결정하는데 사용되는 사용자 피드백 데이터 결정 서브 유닛; 을 포함한다.

더 나아가, 추천 전략은 리소스 카테고리 비율 전략, 리소스 콘텐츠 다양화 전략과 다중 추천 인덱스 균형 전략 중 적어도 하나를 포함하고;

추천 전략 파라미터는 카테고리 비율 파라미터, 다양화 가중치 조정 파라미터와 다중 추천 인덱스 융합 파라미터중 적어도 하나를 포함한다.

더 나아가, 리소스 처리 단계는 리소스 회수 단계, 리소스 러프 배열 단계, 리소스 정밀 배열 단계 및 리소스 재배열 단계 중 적어도 두 개를 포함하고;

리소스 추천 모델은 리소스 회수 모델, 리소스 러프 배열 모델, 리소스 정밀 배열 모델 및 리소스 재배열 모델 중 적어도 두 개를 포함한다.

더 나아가, 추천 참조 특성은 시나리오 특성, 사용자 기본 특성 및 사용자 선호 특성 중 적어도 하나를 포함한다.

상기 리소스 추천 장치는 본 발명의 어느 하나의 실시예에서 제공하는 리소스 추천 방법을 실행할 수 있으며, 리소스 추천 방법을 실행할 수 있는 상응한 기능 모듈과 유익한 효과를 가진다.

상기 파라미터 결정 방법의 구현으로서, 본 출원은 파라미터 결정 방법을 실행하는 가상 장치의 하나의 실시예를 더 제공한다. 더 나아가, 도 6에 도시된 파라미터 결정 장치의 구조도를 참조하면, 해당 파라미터 졀정 장치(600)는, 추천 행동 데이터 결정 모듈(601)과 추천 전략 파라미터 결정 모듈(602)를 포함한다. 여기서,

추천 행동 데이터 결정 모듈(601)은 과거 사용자의 추천 행동 데이터를 결정하는데 사용되고;

추천 전략 파라미터 결정 모듈(602)은 상기 과거 사용자의 추천 행동 데이터에 따라, 적어도 두 개의 추천 전략 파라미터를 공동으로 결정하는데 사용되고;

여기서, 추천 전략 파라미터는 적어도 두 개의 리소스 추천 모델의 사용 파라미터이고, 적어도 두 개의 리소스 추천 모델에 관련된 리소스 처리 단계는 상이하다.

본 출원의 실시예는 추천 행동 데이터 결정 모델을 통해 과거 사용자의 추천 행동 데이터를 결정하고; 과거 사용자의 추천 행동 데이터에 따라, 적어도 두 개의 추천 전략 파라미터를 공동으로 결정하며; 여기서 추천 전략 파라미터는 적어도 두 개의 리소스 추천 모델에서의 사용 파라미터이고, 적어도 두 개의 리소스 추천 모델에 관련된 리소스 처리 단계는 상이하다. 상기 기술방안은 적어도 두 개의 리소스 추천 모델에서 적어도 두 개의 추천 전략 파라미터를 공동으로 결정하는 것을 통해, 상이한 리소스 처리 단계에 대한 각 추천 전략 파라미터의 동적 결정과 자동 조정을 구현하고, 인위적으로 설정된 파라미터가 정확하지 못하여 리소스 추천 결과가 좋지 않은 문제를 방지하며; 또한, 각 추천 전략 파라미터의 공동 결정을 통해, 단일 추천 전략 파라미터가 단독으로 결정되어 각 추천 전략 파라미터가 매칭되지 못하는 문제를 방지함으로써, 각 추천 전략 파라미터 사이의 상호 작용을 병행하고, 나아가 리소스 추천 결과의 정확성 및 리소스 추천 결과와 타겟 사용자의 매칭도와 사용자 만족도를 향상한다.

추천 전략 파라미터 결정 모듈(602)은,

사용자 피드백 데이터에 따라, 파라미터 최적화 모델의 네트워크 파라미터를 조정하는데 사용되는 네트워크 파라미터 조정 유닛-여기서, 파라미터 최적화 모델은 진화 학습 알코리즘을 기반으로 구현함-;

과거 사용자의 추천 참조 특성을 조정한 후의 파라미터 최적화 모델에 입력하여, 적어도 두 개의 추천 전략 파라미터를 획득하는데 사용되는 추천 전략 파라미터 획득 유닛; 을 포함한다.

더 나아가, 네트워크 파라미터 조정 유닛은,

과거 사용자의 계정 정보와 시간 정보에 따라, 교란 데이터 그룹을 생성하는데 사용되는 교란 데이터 그룹 생성 서브 유닛;

사용자 피드백 데이터와 교란 데이터 그룹에 따라, 파라미터 조정 스텝 크기를 결정하는데 사용되는 파라미터 조정 스텝 크기 결정 서브 유닛;

파라미터 조정 스텝 크기에 따라, 파라미터 최적화 모델에서의 네트워크 파라미터를 조정하는데 사용되는 네트워크 파라미터 조정 서브 유닛; 을 포함한다.

더 나아가, 파라미터 조정 스텝 크기 결정 서브 유닛은,

사용자 피드백 데이터에 따라, 교란 데이터 그룹의 각 교란 데이터에 대해 가중을 수행하여, 교란 강화 데이터를 획득하는데 사용되는 교란 강화 데이터 획득 슬레이브 서브-유닛;

교란 강화 데이터에 따라, 파라미터 조정 스텝 크기를 결정하는데 사용되는 파라미터 조정 스텝 크기 결정 서브-슬레이브(slave) 유닛; 을 포함한다.

더 나아가, 교란 강화 데이터 획득 슬레이브 서브-유닛은,

과거 사용자의 과거 피드백 데이터에 따라, 사용자 피드백 데이터에 대해 표준화 처리를 수행하여, 사용자 피드백 데이터를 업데이트하는데 사용되는 사용자 피드백 데이터 업데이트 서브 슬레이브 유닛;

업데이트된 사용자 피드백 데이터에 따라, 교란 데이터 그룹의 각 교란 데이터에 대해 가중을 수행하여, 교란 강화 데이터를 획득하는데 사용되는 교란 강화 데이터 획득 서브 슬레이브 유닛; 을 포함한다.

사용자 피드백 데이터 결정 모듈은, 구체적으로,

과거 사용자가 트래픽 인덱스 하의 과거 리소스 추천 결과에 대한 응답 행동 데이터 통계값을 결정하는데 사용되는 응답 행동 데이터 통계값 결정 유닛-여기서, 트래픽 인덱스는 리소스 추천 모델이 사용한 인덱스임-;

사용자 피드백 데이터 결정 유닛은,

상기 파라미터 결정 장치는 본 발명의 어느 하나의 실시예에서 제공하는 파라미터 결정 방법을 실행할 수 있으며, 파라미터 결정 방법을 실행할 수 있는 상응한 기능 모듈과 유익한 효과를 가진다.

본 출원의 실시예에 따르면, 본 출원은 전자 설비 및 판독가능 저장매체를 더 제공한다.

도 7에 도시된 바와 같이, 이는 본 출원의 실시예에 의해 제공된 리소스 추천 방법 및/또는 파라미터 결정 방법을 구현하기 위한 전자 설비의 블록도이다. 전자 설비는 여러 가지 형태의 디지컬 컴퓨터를 표시하며, 예를 들어, 랩톱 컴퓨터, 데스크톱 컴퓨터, 워크스테이션, 개인용 정보 단말기(Personal Digital Assistant), 서버, 블레이드 서버, 메인프레임 컴퓨터 및 기타 적합한 컴퓨터를 말한다. 전자 설비는 또한 여러 가지 형태의 모바일 장치를 표시할 수 있으며, 예를 들어, 개인 휴대 단말기, 셀 폰, 스마트 폰, 웨어러블 설비 및 기타 유사한 컴퓨팅 장치를 표시할 수 있다. 본문에 설명된 부재, 이들의 연결과 관계, 및 이들의 기능은 단지 예시적인 것일 뿐, 본문에서 설명되는 및/또는 요구되는 본 개시의 구현을 한정하지 않는다.

도 7에 도시된 바와 같이, 해당 전자 설비는 하나 이상의 프로세서(701), 메모리(702) 및 다양한 구성요소를 연결하기 위한 인터페이스를 포함하며, 상기 인터페이스는 고속 인터페이스 및 저속 인터페이스를 포함한다. 다양한 구성요소는 서로 다른 버스를 사용하여 서로 연결되며 공통 메인보드에 장착되거나 필요에 따라 다른 방식으로 장착될 수 있다. 프로세서는 메모리에 저장되거나 또는 메모리에 저장되어 외부 입/출력 장치(예: 인터페이스에 연결된 디스플레이 장치)에 GUI의 그래픽 정보를 표시하기 위한 명령을 포함하는 전자 설비에서 실행되는 명령을 처리할 수 있다. 다른 실시형태에서, 필요한 경우, 복수의 프로세서 및/또는 복수의 버스가 복수의 메모리와 함께 사용될 수 있다. 마찬가지로, 여러 전자 설비를 연결할 수 있으며 각 장치는 일부 필요한 작업(예: 서버 어레이, 블레이드 서버 그룹 또는 다중 프로세서 시스템)을 제공한다. 도 7은 하나의 프로세서(701)를 예를 들어 설명한다.

메모리(702)는 본 출원에서 제공하는 비일시적 컴퓨터 판독가능 저장매체이다. 메모리는 적어도 하나의 프로세서에 의해 실행 가능한 명령을 저장하여, 적어도 하나의 프로세서가 본 출원에 의해 제공된 리소스 추천 방법 및/또는 파라미터 결정 방법을 실행하도록 한다. 본 출원의 비일시적 컴퓨터 판독가능 저장매체에는 컴퓨터 명령이 저장되며, 해당 컴퓨터 명령은 컴퓨터가 본 출원에서 제공하는 리소스 추천 방법 및/또는 파라미터 결정 방법을 실행하도록 한다.

메모리(702)는 비일시적 컴퓨터 판독가능 저장매체로써, 비일시적 소프트웨어 프로그램, 비일시적 컴퓨터 실행 가능 프로그램 및 모듈을 저장하는 데 사용되며, 예를 들어, 본 출원의 실시예에서의 리소스 추천 방법에 대응하는 프로그램 명령어/모듈(예를 들어, 도 5에 도시된 추천 참조 특성 결정 모듈(501)과 리소스 추천 결과 결정 모듈(502)); 또는 본 출원의 실시예에서의 파라미터 결정 방법에 대응하는 프로그램 명령어/모듈(예를 들어, 도 6에 도시된 추천 행동 데이터 결정 모듈(601)과 추천 전략 파라미터 결정 모듈(602))을 저장하는데 사용된다. 프로세서(701)는 메모리(702)에 저장된 비일시적 소프트웨어 프로그램, 명령 및 모듈을 실행함으로써, 서버의 다양한 기능 애플리케이션 및 데이터 처리를 실행하고, 즉, 상술한 방법 실시예 중의 리소스 추천 방법 및/또는 파라미터 결정 방법을 구현한다.

메모리(702)는 시스템, 적어도 하나의 기능에 필요한 어플리케이션을 저장할 수 있는 프로그램 저장 영역, 및 리소스 추천 방법 및/또는 파라미터 결정 방법에 따른 전자 설비의 사용에 따라 생성된 데이터 등를 저장할 수 있는 데이터 저장 영역을 포함할 수 있다. 또한, 메모리(702)는 고속 랜덤 액세스 메모리를 포함할 수 있고, 적어도 하나의 자기 디스크 저장 장치, 플래시 메모리 장치, 또는 다른 비일시적 고체 상태 저장 장치와 같은 비휘발성 메모리를 포함할 수도 있다. 일부 실시예에서, 메모리(702)는 프로세서(701)에 대해 원격으로 설치된 메모리를 선택적으로 포함할 수 있고, 이러한 원격 메모리는 네트워크를 통해 리소스 추천 방법 및/또는 파라미터 결정 방법을 구현하는 전자 설비에 연결될 수 있다. 상기 네트워크의 예시로는 인터넷, 기업 인트라넷, 근거리 통신망, 이동 통신망 및 이들의 조합이 포함되지만 이에 한정되지 않는다.

리소스 추천 방법 및/또는 파라미터 결정 방법을 구현하는 전자 설비는 입력 장치(703) 및 출력 장치(704)를 더 포함할 수 있다. 프로세서(701), 메모리(702), 입력 장치(703) 및 출력 장치(704)는 버스 또는 기타 방식을 통해 연결될 수 있으며, 도 7에서는 버스를 통해 연결되는 것을 예로 들어 설명한다.

입력 장치(703)는 입력되는 디지털 또는 문자(Character) 정보를 수신하고, 터치 스크린, 키패드, 마우스, 트랙 패드, 터치 패드, 포인팅 스틱, 하나 이상의 마우스 버튼, 트랙볼, 조이스틱 등 입력 장치와 같은 리소스 추천 방법 및/또는 파라미터 결정 방법을 구현하는 전자 설비의 사용자 설정 및 기능 제어와 관련된 키 신호 입력을 생성할 수 있다. 출력 장치(704)는 디스플레이 장치, 보조 조명 장치(예: LED), 촉각 피드백 장치(예: 진동 모터) 등을 포함할 수 있다. 해당 디스플레이 장치는 액정 디스플레이(LCD), 발광 다이오드(LED) 디스플레이, 플라즈마 디스플레이 등을 포함할 수 있지만, 이에 한정되지 않는다. 일부 실시예에서, 디스플레이 장치는 터치 스크린일 수 있다.

여기에 설명된 시스템 및 기술의 다양한 실시형태는 디지털 전자 회로 시스템, 집적 회로 시스템, 주문형 집적 회로(ASIC), 컴퓨터 하드웨어, 펌웨어, 소프트웨어 및/또는 이들의 조합으로 구현될 수 있다. 이러한 다양한 실시형태는 하나 이상의 컴퓨터 프로그램에서 구현되는 방식을 포함할 수 있으며, 해당 하나 또는 복수의 컴퓨터 프로그램은 적어도 하나의 프로그램 가능한 프로세서를 포함하는 프로그램 가능한 시스템에서 실행 및/또는 해석(interpretating)될 수 있으며, 해당 프로그램 가능한 프로세서는 전용 또는 범용 프로그램 가능한 프로세서일 수 있고, 저장 시스템, 적어도 하나의 입력 장치 및 적어도 하나의 출력 장치로부터 데이터 및 명령을 수신할 수 있으며, 데이터 및 명령을 상기 저장 시스템, 상기 적어도 하나의 입력 장치 및 상기 적어도 하나의 출력 장치로 전송할 수 있다.

이러한 컴퓨팅 프로그램(프로그램, 소프트웨어, 소프트웨어 애플리케이션 또는 코드라고도 함)에는 프로그램 가능한 프로세서의 기계 명령이 포함되며 고급 프로세스 및/또는 객체 지향 프로그램 가능한 언어 및/또는 어셈블리/기계 언어를 사용하여 컴퓨팅 프로그램을 실시할 수 있다. 본 문서에 사용된 "기계 판독가능 매체" 및 "컴퓨터 판독가능 매체"라는 용어는 기계 명령 및/또는 데이터를 프로그램 가능한 프로세서에 제공하는 모든 컴퓨터 프로그램 제품, 설비 및/또는 장치(예를 들어, 디스크, 광 디스크, 메모리, 프로그램 가능한 논리 장치(PLD))를 의미하며, 기계 판독가능 신호인 기계 명령을 수신하는 기계 판독가능 매체를 포함한다. “기계 판독가능 신호”라는 용어는 기계 명령 및/또는 데이터를 프로그램 가능한 프로세서에 제공하는데 사용되는 모든 신호를 의미한다.

사용자와의 상호 작용을 위해, 여기에서 설명된 시스템 및 기술은 컴퓨터 상에서 구현될 수 있으며, 해당 컴퓨터는, 사용자에게 정보를 디스플레이 하기 위한 디스플레이 장치(예를 들어, 음극선관(CRT) 또는 액정디스플레이(LCD) 모니터) 및 키보드와 포인팅 장치(예를 들어, 마우스 또는 트랙볼)를 구비하며, 사용자는 해당 키보드 및 해당 포인팅 장치를 통해 컴퓨터에 입력을 제공할 수 있다. 기타 유형의 장치도 사용자와의 상호 작용을 제공할 수 있으며, 예를 들어, 사용자에게 제공되는 피드백은 시각 피드백, 청각 피드백 또는 햅틱 피드백과 같은 임의의 형태의 센싱 피드백일 수 있으며, 사운드 입력, 음성 입력 또는 햅틱 입력과 같은 임의의 형태를 사용하여 사용자로부터의 입력을 수신할 수 있다.

여기에서 설명된 시스템 및 기술은 백엔드 구성 요소(back-end component)를 포함하는 컴퓨팅 시스템(예를 들어, 데이터 서버)에서 구현될 수 있거나, 미들웨어 구성 요소(middleware component)를 포함하는 컴퓨팅 시스템(예를 들어, 애플리케이션 서버) 구현될 수 있거나, 프론트엔드 구성 요소(front-end component)를 포함하는 컴퓨팅 시스템(예를 들어, 그래픽 사용자 인터페이스 또는 웹브라우저를 구비하는 사용자 컴퓨터, 사용자는 해당 그래픽 사용자 인터페이스 또는 해당 웹브라우저를 통해 여기에서 설명된 시스템 및 기술의 실시형태와 상호 작용할 수 있음)에서 구현될 수 있거나, 이러한 백엔드 구성 요소, 미들웨어 구성 요소 또는 프론트엔드 구성 요소의 임의의 조합을 포함하는 컴퓨팅 시스템에서 구현될 수 있다. 시스템의 구성 요소는 임의의 형태 또는 매체의 디지털 데이터 통신(예를 들어, 통신 네트워크)을 통해 서로 연결될 수 있다. 통신 네트워크의 예시에는 근거리 통신망(LAN), 원거리 통신망(WAN), 블록 체인 네트워크 및 인터넷이 포함된다.

컴퓨터 시스템에는 클라이언트단과 서버가 포함될 수 있다. 클라이언트단과 서버는 일반적으로 서로 멀리 떨어져 있으며, 통상적으로 통신 네트워크를 통해 상호 작용을 수행한다. 클라이언트단과 서버 간의 관계는 대응되는 컴퓨터 상에서 실행되고 서로 클라이언트단-서버 관계를 구비하는 컴퓨터 프로그램을 통해 발생한다. 서버는 클라우드 서버일 수 있으며, 클라우드 컴퓨팅 서버 또는 클라우드 호스트라고도 한다. 클라우드 서버는 클라우드 컴퓨팅 서비스 체계 중의 하나의 호스트 제품으로, 전통적인 물리적 호스트와 VPS 서버에 존재하는 관리 난이도가 크고, 트래픽 확장성이 약한 결함을 해결한다.

본 출원의 실시예의 기술 방안에 따르면, 적어도 두 개의 리소스 추천 모델에서 적어도 두 개의 추천 전략 파라미터를 공동으로 결정하는 것을 통해, 상이한 리소스 처리 단계에 대한 각 추천 전략 파라미터의 동적 결정과 자동 조정을 구현하고, 인위적으로 설정된 파라미터가 정확하지 못하여 리소스 추천 결과가 좋지 않은 문제를 방지하며; 또한, 각 추천 전략 파라미터의 공동 결정을 통해, 단일 추천 전략 파라미터의 단독 결정으로 인해 각 추천 전략 파라미터가 매칭되지 못하는 문제를 방지하여, 각 추천 전략 파라미터 사이의 상호 작용을 병행하고, 나아가 리소스 추천 결과의 정확성 및 리소스 추천 결과와 타겟 사용자의 매칭도와 사용자 만족도를 향상한다.

상기에 언급된 여러 가지 형태의 프로세스를 사용하여 재배열하거나, 단계를 증가 또는 삭제할 수 있음을 이해해야 한다. 예를 들어, 본 개시에 기재된 각각의 단계는 병행으로 수행될 수도 있고, 순서대로 수행될 수도 있으며, 상이한 순서로 수행될 수도 있는데, 본 개시의 기술방안이 원하는 결과를 구현할 수 있기만 하면, 본문에서는 이에 대해 한정하지 않는다.

상기 구체적인 실시형태는 본 개시의 보호 범위에 대해 한정하지 않는다. 본 분야의 당업자는 설계 요구 및 기타 요소에 따라 여러 가지 수정, 조합, 서브 조합 및 대체를 수행할 수 있음을 알아햐 한다. 본 개시의 사상과 원칙 내에서 진행한 임의의 수정, 동등한 교체 및 개선 등은 모두 본 개시의 보호범위에 포함되어야 한다.

500 --- 리소스 추천 장치
501 --- 추천 참조 특성 결정 모듈
502 --- 리소스 추천 결과 결정 모듈
600 --- 파라미터 결정 장치
601 --- 추천 행동 데이터 결정 모듈
602 --- 추천 전략 파라미터 결정 모듈
701 --- 프로세서
702 --- 메모리
703 --- 입력 장치
704 --- 출력 장치

Claims

타겟 사용자의 추천 참조 특성을 결정하는 단계;
적어도 두개의 리소스 추천 모델을 기반으로, 상기 타겟 사용자의 추천 참조 특성에 따라, 상기 타겟 사용자를 위해 리소스 추천 결과를 결정하는 단계; 를 포함하되,
여기서, 상기 적어도 두 개의 리소스 추천 모델에서 적어도 두 개의 추천 전략 파라미터는 과거 사용자의 추천 행동 데이터에 따라 공동으로 결정되고, 상기 적어도 두 개의 리소스 추천 모델에 관련된 리소스 처리 단계는 상이한 것을 특징으로 하는 리소스 추천 방법.
제1 항에 있어서,
상기 과거 사용자의 추천 행동 데이터는 상기 과거 사용자의 추천 참조 특성과 사용자 피드백 데이터를 포함하고;
상기 사용자 피드백 데이터는 파라미터 최적화 모델에서 네트워크 파라미터를 조정하는데 사용되고; 상기 파라미터 최적화 모델은 진화 학습 알코리즘을 기반으로 구현되며;
상기 추천 전략 파라미터는 조정된 파라미터 최적화 모델을 기반으로 과거 사용자의 추천 참조 특성에 따라 결정되는 것을 특징으로 하는 리소스 추천 방법.
제2 항에 있어서,
상기 사용자 피드백 데이터는,
상기 과거 사용자가 트래픽 인덱스에 따른 과거 리소스 추천 결과에 대한 응답 행동 데이터 통계값을 결정하는 방식-여기서, 상기 트래픽 인덱스는 상기 리소스 추천 모델이 사용한 인덱스임-;
각 상기 트래픽 인덱스에 따른 응답 행동 데이터 통계값에 따라, 상기 사용자 피드백 데이터를 결정하는 방식; 을 통해 결정되는 것을 특징으로 하는 리소스 추천 방법.
제3 항에 있어서,
상기 트래픽 인덱스는 시간 응답 인덱스 및/또는 상호 작용 응답 인덱스를 포함하고;
상기 각 상기 트래픽 인덱스에 따른 응답 행동 데이터 통계값에 따라, 상기 사용자 피드백 데이터를 결정하는 단계는,
상기 시간 응답 인덱스에 따른 응답 행동 데이터 통계값에 따라, 총 리소스 응답 지속 시간을 결정하는 단계;
상기 상호 작용 응답 인덱스에 따른 응답 행동 데이터 통계값과 과거 응답 지속 시간에 따라, 지속 시간 보정량을 결정하는 단계;
상기 총 리소스 응답 지속 시간에 따라, 각 상기 과거 사용자의 사용자 피드백 데이터를 결정하는 단계; 또는, 상기 지속 시간 보정량과 상기 총 리소스 응답 지속 시간에 따라, 각 상기 과거 사용자의 사용자 피드백 데이터를 결정하는 단계; 를 포함하는 것을 특징으로 하는 리소스 추천 방법.
제1 항 내지 제4 항 중 어느 한 항에 있어서,
추천 전략은 리소스 카테고리 비율 전략, 리소스 콘텐츠 다양화 전략과 다중 추천 인덱스 균형 전략 중 적어도 하나를 포함하고;
상기 추천 전략 파라미터는 카테고리 비율 파라미터, 다양화 가중치 조정 파라미터와 다중 추천 인덱스 융합 파라미터 중 적어도 하나를 포함하는 것; 을 특징으로 하는 리소스 추천 방법.
제1항 내지 제4항 중 어느 한 항에 있어서,
상기 리소스 처리 단계는 리소스 회수 단계, 리소스 러프 배열 단계, 리소스 정밀 배열 단계 및 리소스 재배열 단계 중 적어도 두 개를 포함하고;
상기 리소스 추천 모델은 리소스 회수 모델, 리소스 러프 배열 모델, 리소스 정밀 배열 모델 및 리소스 재배열 모델 중 적어도 두 개를 포함하는 것; 을 특징으로 하는 리소스 추천 방법.
제1항 내지 제4항 중 어느 한 항에 있어서,
상기 추천 참조 특성은 시나리오 특성, 사용자 기본 특성 및 사용자 선호 특성 중 적어도 하나를 포함하는 것을 특징으로 하는 리소스 추천 방법.
과거 사용자의 추천 행동 데이터를 결정하는 단계;
상기 과거 사용자의 추천 행동 데이터에 따라, 적어도 두 개의 추천 전략 파라미터를 공동으로 결정하는 단계; 를 포함하되,
여기서, 상기 추천 전략 파라미터는 적어도 두 개의 리소스 추천 모델에서의 사용 파라미터이고, 상기 적어도 두 개의 리소스 추천 모델에 관련된 리소스 처리 단계는 상이하는 것을 특징으로 하는 파라미터 결정 방법.
제8 항에 있어서,
상기 과거 사용자의 추천 행동 데이터는 상기 과거 사용자의 추천 참조 특성과 사용자 피드백 데이터를 포함하고;
상기 과거 사용자의 추천 행동 데이터에 따라, 적어도 두 개의 추천 전략 파라미터를 공동으로 결정하는 단계는,
상기 사용자 피드백 데이터에 따라, 파라미터 최적화 모델에서의 네트워크 파라미터를 조정하는 단계-여기서, 상기 파라미터 최적화 모델은 진화 학습 알코리즘을 기반으로 구현함-;
상기 과거 사용자의 추천 참조 특성을 조정된 파라미터 최적화 모델에 입력하여, 상기 적어도 두 개의 추천 전략 파라미터를 획득하는 단계; 를 포함하는 것을 특징으로 하는 파라미터 결정 방법.
제9 항에 있어서,
상기 사용자 피드백 데이터에 따라, 파라미터 최적화 모델에서의 네트워크 파라미터를 조정하는 단계는,
과거 사용자의 계정 정보와 시간 정보에 따라, 교란 데이터 그룹을 생성하는 단계;
상기 사용자 피드백 데이터와 상기 교란 데이터 그룹에 따라, 파라미터 조정 스텝 크기를 결정하는 단계;
상기 파라미터 조정 스텝 크기에 따라, 상기 파라미터 최적화 모델에서의 네트워크 파라미터를 조정하는 단계; 를 포함하는 것을 특징으로 하는 파라미터 결정 방법.
제10 항에 있어서,
상기 사용자 피드백 데이터와 상기 교란 데이터 그룹에 따라, 파라미터 조정 스텝 크기를 결정하는 단계는,
상기 사용자 피드백 데이터에 따라, 상기 교란 데이터 그룹의 각 교란 데이터에 대해 가중을 수행하여, 교란 강화 데이터를 획득하는 단계;
상기 교란 강화 데이터에 따라, 상기 파라미터 조정 스텝 크기를 결정하는 단계; 를 포함하는 것을 특징으로 하는 파라미터 결정 방법.
제11 항에 있어서,
상기 사용자 피드백 데이터에 따라, 상기 교란 데이터 그룹의 각 교란 데이터에 대해 가중을 수행하여, 교란 강화 데이터를 획득하는 단계는,
상기 과거 사용자의 과거 피드백 데이터에 따라, 상기 사용자 피드백 데이터에 대해 표준화 처리를 수행하여, 상기 사용자 피드백 데이터를 업데이트하는 단계;
업데이트된 사용자 피드백 데이터에 따라, 상기 교란 데이터 그룹의 각 교란 데이터에 대해 가중을 수행하여, 교란 강화 데이터를 획득하는 단계; 를 포함하는 것을 특징으로 하는 파라미터 결정 방법.
제9 항 내지 제12 항 중 어느 한 항에 있어서,
상기 사용자 피드백 데이터는,
상기 과거 사용자가 트래픽 인덱스에 따른 과거 리소스 추천 결과에 대한 응답 행동 데이터 통계값을 결정하는 방식-여기서, 상기 트래픽 인덱스는 상기 리소스 추천 모델이 사용한 인덱스임-;
각 상기 트래픽 인덱스에 따른 응답 행동 데이터 통계값에 따라, 상기 사용자 피드백 데이터를 결정하는 방식; 을 통해 결정되는 것을 특징으로 하는 파라미터 결정 방법.
제13 항에 있어서,
상기 트래픽 인덱스는 시간 응답 인덱스 및/또는 상호 작용 응답 인덱스를 포함하고;
상기 각 상기 트래픽 인덱스에 따른 응답 행동 데이터 통계값에 따라, 상기 사용자 피드백 데이터를 결정하는 단계는,
상기 시간 응답 인덱스에 따른 응답 행동 데이터 통계값에 따라, 총 리소스 응답 지속 시간을 결정하는 단계;
상기 상호 작용 응답 인덱스에 따른 응답 행동 데이터 통계값과 과거 응답 지속 시간에 따라, 지속 시간 보정량을 결정하는 단계;
상기 총 리소스 응답 지속 시간에 따라, 각 상기 과거 사용자의 사용자 피드백 데이터를 결정하는 단계; 또는, 상기 지속 시간 보정량과 상기 총 리소스 응답 지속 시간에 따라, 각 상기 과거 사용자의 사용자 피드백 데이터를 결정하는 단계; 를 포함하는 것을 특징으로 하는 파라미터 결정 방법.
제8 항 내지 제12 항 중 어느 한 항에 있어서,
추천 전략은 리소스 카테고리 비율 전략, 리소스 콘텐츠 다양화 전략과 다중 추천 인덱스 균형 전략 중 적어도 하나를 포함하고;
상기 추천 전략 파라미터는 카테고리 비율 파라미터, 다양화 가중치 조정 파라미터와 다중 추천 인덱스 융합 파라미터중 적어도 하나를 포함하는 것; 을 특징으로 하는 파라미터 결정 방법.
제9 항 내지 제12 항 중 어느 한 항에 있어서,
상기 추천 참조 특성은 시나리오 특성, 사용자 기본 특성 및 사용자 선호 특성 중 적어도 하나를 포함하는 것을 특징으로 하는 파라미터 결정 방법.
타겟 사용자의 추천 참조 특성을 결정하는데 사용되는 추천 참조 특성 결정 모듈;
적어도 두 개의 리소스 추천 모델을 기반으로, 상기 타겟 사용자의 추천 참조 특성에 따라, 상기 타겟 사용자를 위해 리소스 추천 결과를 결정하는데 사용되는 리소스 추천 결과 결정 모듈; 을 포함하고,
여기서, 상기 적어도 두 개의 리소스 추천 모델에서의 적어도 두 개의 추천 전략 파라미터는 과거 사용자의 추천 행동 데이터에 따라 공동으로 결정되고, 상기 적어도 두 개의 리소스 추천 모델에 관련된 리소스 처리 단계는 상이한 것을 특징으로 하는 리소스 추천 장치.
제17 항에 있어서,
상기 과거 사용자의 추천 행동 데이터는 상기 과거 사용자의 추천 참조 특성과 사용자 피드백 데이터를 포함하고;
상기 사용자 피드백 데이터는 파라미터 최적화 모델에서의 네트워크 파라미터를 조정하는데 사용되고; 상기 파라미터 최적화 모델은 진화 학습 알코리즘을 기반으로 구현되며;
상기 추천 전략 파라미터는 조정된 파라미터 최적화 모델을 기반으로 과거 사용자의 추천 참조 특성에 따라 결정되는 것을 특징으로 하는 리소스 추천 장치.
제18 항에 있어서,
상기 장치는 상기 사용자 피드백 데이터를 결정하는데 사용되는 사용자 피드백 데이터 결정 모듈을 더 포함하고;
상기 사용자 피드백 데이터 결정 모듈은, 구체적으로,
상기 과거 사용자가 트래픽 인덱스에 따른 과거 리소스 추천 결과에 대한 응답 행동 데이터 통계값을 결정하는데 사용되는 응답 행동 데이터 통계값 결정 유닛-여기서, 상기 트래픽 인덱스는 상기 리소스 추천 모델이 사용한 인덱스임-;
각 상기 트래픽 인덱스에 따른 응답 행동 데이터 통계값에 따라, 상기 사용자 피드백 데이터를 결정하는데 사용되는 사용자 피드백 데이터 결정 유닛; 을 포함하는 것을 특징으로 하는 리소스 추천 장치.
제19 항에 있어서,
상기 트래픽 인덱스는 시간 응답 인덱스 및/또는 상호 작용 응답 인덱스를 포함하고;
상기 사용자 피드백 데이터 결정 유닛은,
상기 시간 응답 인덱스에 따른 응답 행동 데이터 통계값에 따라, 총 리소스 응답 지속 시간을 결정하는데 사용되는 총 리소스 응답 지속 시간 결정 서브 유닛;
상기 상호 작용 응답 인덱스에 따른 응답 행동 데이터 통계값과 과거 응답 지속 시간에 따라, 지속 시간 보정량을 결정하는데 사용되는 지속 시간 억제량 결정 서브 유닛;
상기 총 리소스 응답 지속 시간에 따라, 각 상기 과거 사용자의 사용자 피드백 데이터를 결정하고; 또는, 상기 지속 시간 보정량과 상기 총 리소스 응답 지속 시간에 따라, 각 상기 과거 사용자의 사용자 피드백 데이터를 결정하는데 사용되는 사용자 피드백 데이터 결정 서브 유닛; 을 포함하는 것을 특징으로 하는 리소스 추천 장치.
제17 항 내지 제20 항 중 어느 한 항에 있어서,
추천 전략은 리소스 카테고리 비율 전략, 리소스 콘텐츠 다양화 전략과 다중 추천 인덱스 균형 전략 중 적어도 하나를 포함하고;
상기 추천 전략 파라미터는 카테고리 비율 파라미터, 다양화 가중치 조정 파라미터와 다중 추천 인덱스 융합 파라미터중 적어도 하나를 포함하는 것; 을 특징으로 하는 리소스 추천 장치.
제17 항 내지 제20 항 중 어느 한 항에 있어서,
상기 리소스 처리 단계는 리소스 회수 단계, 리소스 러프 배열 단계, 리소스 정밀 배열 단계 및 리소스 재배열 단계 중 적어도 두 개를 포함하고;
상기 리소스 추천 모델은 리소스 회수 모델, 리소스 러프 배열 모델, 리소스 정밀 배열 모델 및 리소스 재배열 모델 중 적어도 두 개를 포함하는 것; 을 특징으로 하는 리소스 추천 장치.
제17 항 내지 제20 항 중 어느 한 항에 있어서,
상기 추천 참조 특성은 시나리오 특성, 사용자 기본 특성 및 사용자 선호 특성 중 적어도 하나를 포함하는 것을 특징으로 하는 리소스 추천 장치.
과거 사용자의 추천 행동 데이터를 결정하는데 사용되는 추천 행동 데이터 결정 모듈;
상기 과거 사용자의 추천 행동 데이터에 따라, 적어도 두 개의 추천 전략 파라미터를 공동으로 결정하는데 사용되는 추천 전략 파라미터 결정 모듈; 을 포함하고,
여기서, 상기 추천 전략 파라미터는 적어도 두 개의 리소스 추천 모델에서의 사용 파라미터이고, 상기 적어도 두 개의 리소스 추천 모델에 관련된 리소스 처리 단계는 상이한 것을 특징으로 하는 파라미터 결정 장치.
제24 항에 있어서,
상기 과거 사용자의 추천 행동 데이터는 상기 과거 사용자의 추천 참조 특성과 사용자 피드백 데이터를 포함하고;
상기 추천 전략 파라미터 결정 모듈은,
상기 사용자 피드백 데이터에 따라, 파라미터 최적화 모델에서의 네트워크 파라미터를 조정하는데 사용되는 네트워크 파라미터 조정 유닛-여기서, 상기 파라미터 최적화 모델은 진화 학습 알코리즘을 기반으로 구현함-;
상기 과거 사용자의 추천 참조 특성을 조정된 파라미터 최적화 모델에 입력하여, 상기 적어도 두 개의 추천 전략 파라미터를 획득하는데 사용되는 추천 전략 파라미터 획득 유닛; 을 포함하는 것을 특징으로 하는 파라미터 결정 장치.
제25 항에 있어서,
상기 네트워크 파라미터 조정 유닛은,
과거 사용자의 계정 정보와 시간 정보에 따라, 교란 데이터 그룹을 생성하는데 사용되는 교란 데이터 그룹 생성 서브 유닛;
상기 사용자 피드백 데이터와 상기 교란 데이터 그룹에 따라, 파라미터 조정 스텝 크기를 결정하는데 사용되는 파라미터 조정 스텝 크기 결정 서브 유닛;
상기 파라미터 조정 스텝 크기에 따라, 상기 파라미터 최적화 모델에서의 네트워크 파라미터를 조정하는데 사용되는 네트워크 파라미터 조정 서브 유닛; 을 포함하는 것을 특징으로 하는 파라미터 결정 장치.
제26 항에 있어서,
상기 파라미터 조정 스텝 크기 결정 서브 유닛은,
상기 사용자 피드백 데이터에 따라, 상기 교란 데이터 그룹의 각 교란 데이터에 대해 가중을 수행하여, 교란 강화 데이터를 획득하는데 사용되는 교란 강화 데이터 획득 슬레이브 서브-유닛;
상기 교란 강화 데이터에 따라, 상기 파라미터 조정 스텝 크기를 결정하는데 사용되는 파라미터 조정 스텝 크기 결정 서브-슬레이브 유닛; 을 포함하는 것을 특징으로 하는 파라미터 결정 장치.
제27 항에 있어서,
상기 교란 강화 데이터 획득 슬레이브 서브-유닛은,
상기 과거 사용자의 과거 피드백 데이터에 따라, 상기 사용자 피드백 데이터에 대해 표준화 처리를 수행하여, 상기 사용자 피드백 데이터를 업데이트하는데 사용되는 사용자 피드백 데이터 업데이트 서브 슬레이브 유닛;
업데이트된 사용자 피드백 데이터에 따라, 상기 교란 데이터 그룹의 각 교란 데이터에 대해 가중을 수행하여, 교란 강화 데이터를 획득하는데 사용되는 교란 강화 데이터 획득 서브 슬레이브 유닛; 을 포함하는 것을 특징으로 하는 파라미터 결정 장치.
제25 항 내지 제28 항 중 어느 한 항에 있어서,
상기 장치는 사용자 피드백 데이터를 결정하는데 사용되는 사용자 피드백 데이터 결정 모듈을 더 포함하고;
상기 사용자 피드백 데이터 결정 모듈은, 구체적으로,
상기 과거 사용자가 트래픽 인덱스에 따른 과거 리소스 추천 결과에 대한 응답 행동 데이터 통계값을 결정하는데 사용되는 응답 행동 데이터 통계값 결정 유닛-여기서, 상기 트래픽 인덱스는 상기 리소스 추천 모델이 사용한 인덱스임-;
각 상기 트래픽 인덱스에 따른 응답 행동 데이터 통계값에 따라, 상기 사용자 피드백 데이터를 결정하는데 사용되는 사용자 피드백 데이터 결정 유닛; 을 포함하는 것을 특징으로 하는 파라미터 결정 장치.
제29 항에 있어서,
상기 트래픽 인덱스는 시간 응답 인덱스 및/또는 상호 작용 응답 인덱스를 포함하고;
상기 사용자 피드백 데이터 결정 유닛은,
상기 시간 응답 인덱스에 따른 응답 행동 데이터 통계값에 따라, 총 리소스 응답 지속 시간을 결정하는데 사용되는 총 리소스 응답 지속 시간 결정 서브 유닛;
상기 상호 작용 응답 인덱스에 따른 응답 행동 데이터 통계값과 과거 응답 지속 시간에 따라, 지속 시간 보정량을 결정하는데 사용되는 지속 시간 억제량 결정 서브 유닛;
상기 총 리소스 응답 지속 시간에 따라, 각 상기 과거 사용자의 사용자 피드백 데이터를 결정하고; 또는, 상기 지속 시간 보정량과 상기 총 리소스 응답 지속 시간에 따라, 각 상기 과거 사용자의 사용자 피드백 데이터를 결정하는데 사용되는 사용자 피드백 데이터 결정 서브 유닛; 을 포함하는 것을 특징으로 하는 파라미터 결정 장치.
제24 항 내지 제28 항 중 어느 한 항에 있어서,
추천 전략은 리소스 카테고리 비율 전략, 리소스 콘텐츠 다양화 전략과 다중 추천 인덱스 균형 전략 중 적어도 하나를 포함하고;
상기 추천 전략 파라미터는 카테고리 비율 파라미터, 다양화 가중치 조정 파라미터와 다중 추천 인덱스 융합 파라미터중 적어도 하나를 포함하는 것; 을 특징으로 하는 파라미터 결정 장치.
제25 항 내지 제28 항 중 어느 한 항에 있어서,
상기 추천 참조 특성은 시나리오 특성, 사용자 기본 특성 및 사용자 선호 특성 중 적어도 하나를 포함하는 것을 특징으로 하는 파라미터 결정 장치.
적어도 하나의 프로세서; 및
상기 적어도 하나의 프로세서와 통신 연결되는 메모리; 를 포함하되, 여기서,
상기 메모리는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령을 저장하고, 상기 명령은 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서가 제1 항 내지 제7 항 중 어느 한 항에 따른 리소스 추천 방법; 및/또는 제8 항 내지 제16 항 중 어느 한 항에 따른 파라미터 결정 방법을 실행하도록 하는 것을 특징으로 하는 전자 설비.
컴퓨터 명령이 저장되어 있는 비일시적 컴퓨터 판독가능 저장매체에 있어서,
상기 컴퓨터 명령은, 컴퓨터가 제1 항 내지 제7 항 중 어느 한 항에 따른 리소스 추천 방법; 및/또는 제8 항 내지 제16 항 중 어느 한 항에 따른 파라미터 결정 방법을 실행하도록 하는 것을 특징으로 하는 컴퓨터 명령이 저장된 비일시적 컴퓨터 판독가능 저장매체.
컴퓨터 판독가능 저장매체에 저장된 컴퓨터 프로그램에 있어서,
상기 컴퓨터 프로그램 중의 명령이 프로세서에 의해 실행될 경우, 제 1 항 내지 제 7 항 중 어느 한 항에 따른 리소스 추천 방법, 및/또는 제8 항 내지 제16 항 중 어느 한 항에 따른 파라미터 결정 방법을 구현하는 것을 특징으로 하는 컴퓨터 프로그램.