KR102591421B1 - 의도 추천 방법, 장치, 기기 및 저장매체 - Google Patents

의도 추천 방법, 장치, 기기 및 저장매체 Download PDF

Info

Publication number
KR102591421B1
KR102591421B1 KR1020210036066A KR20210036066A KR102591421B1 KR 102591421 B1 KR102591421 B1 KR 102591421B1 KR 1020210036066 A KR1020210036066 A KR 1020210036066A KR 20210036066 A KR20210036066 A KR 20210036066A KR 102591421 B1 KR102591421 B1 KR 102591421B1
Authority
KR
South Korea
Prior art keywords
intent
intention
recommendation list
user
target
Prior art date
Application number
KR1020210036066A
Other languages
English (en)
Other versions
KR20210038860A (ko
Inventor
양 장
슈앙촨 양
이 시예
창 류
Original Assignee
베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드 filed Critical 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드
Publication of KR20210038860A publication Critical patent/KR20210038860A/ko
Application granted granted Critical
Publication of KR102591421B1 publication Critical patent/KR102591421B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • G06F16/24542Plan optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • Operations Research (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 출원은 의도 추천 방법, 장치, 기기 및 저장매체를 개시하며, 컴퓨터 기술분야 중의 빅 데이터, 인공 지능, 스마트 검색, 정보 스트림, 딥 러닝 기술분야에 관한 것이다. 구체적인 구현 방안은, 의도 키워드와 사용자 식별자가 휴대된 의도 검색 요청을 수신하고, 해당 의도 키워드와 미리 구성된 의도 라이브러리에 따라 제1 추천 리스트를 확정할 수 있으며, 의도 라이브러리는 적어도 하나의 트리형 의도 집합을 포함하고, 각 트리형 의도 집합은 적어도 하나의 계층 의도를 포함하며, 사용자 식별자에 대응되는 의도 전략 정보를 이용하여 제1 추천 리스트 중의 의도에 대해 처리하여, 목표 추천 리스트를 획득하고 출력한다. 해당 기술 방안에서, 미리 구성된 의도 라이브러리를 기초로, 의도 검색 요청과의 관련성이 높은 의도를 확정할 수 있으며, 사용자 식별자 기반 의도 전략 정보는 개성화 추천 결과를 향상시킬 수 있기에, 의도 추천의 정확도와 개성화 정밀도를 향상시킨다.

Description

의도 추천 방법, 장치, 기기 및 저장매체{INTENT RECOMMENDATION METHOD, APPARATUS, DEVICE AND STORAGE MEDIUM}
본 출원의 실시예는 컴퓨터 기술분야 중의 빅 데이터, 인공 지능, 스마트 검색, 정보 스트림, 딥 러닝 기술분야에 관한 것으로, 특히 의도 추천 방법, 장치, 기기 및 저장매체에 관한 것이다.
인터넷 기술의 급속한 발전에 따라 사용자 행위 데이터와 수집 데이터를 기반으로 목표 대상에 대해 정보 연구 판단과 관계 연구 판단을 수행하고 목표 대상에 대한 의도 정보를 획득하여 의도 추천을 실행할 수 있다.
종래 기술에서 의도 추천 방법은 주로 규칙 또는 전략 또는 사용자의 행위 등에 기반하여 적절한 의도를 확정하고 추천한다. 하지만 해당 방안에서는 규칙, 전략 또는 사용자 행위 추천 처리 과정이 모두 적용되는 시나리오를 고려해야 하므로 적용 범위가 제한되고 추천 정확도가 낮은 문제가 있다.
본 출원은 의도 추천 방법, 장치, 기기 및 저장매체를 제공한다.
본 출원의 제1 측면에 따르면, 의도 추천 방법을 제공하며, 상기 방법은,
의도 키워드와 사용자 식별자가 휴대된 의도 검색 요청을 수신하는 단계;
상기 의도 키워드와 미리 구성된 의도 라이브러리에 따라, 제1 추천 리스트를 확정하되, 상기 의도 라이브러리는 적어도 하나의 트리형 의도 집합을 포함하고, 각 트리형 의도 집합은 적어도 하나의 계층 의도를 포함하는 단계;
상기 사용자 식별자에 대응되는 의도 전략 정보를 이용하여 상기 제1 추천 리스트 중의 의도에 대해 처리하여, 목표 추천 리스트를 획득하는 단계;
상기 목표 추천 리스트를 출력하는 단계를 포함한다.
본 출원의 제2 측면에 따르면, 의도 추천 장치를 제공하며, 상기 장치는, 수신 모듈, 제1 처리 모듈, 제2 처리 모듈과 출력 모듈을 포함하며;
상기 수신 모듈은, 의도 키워드와 사용자 식별자가 휴대된 의도 검색 요청을 수신하기 위한 것이고;
상기 제1 처리 모듈은, 상기 의도 키워드와 미리 구성된 의도 라이브러리에 따라, 제1 추천 리스트를 확정하되, 상기 의도 라이브러리는 적어도 하나의 트리형 의도 집합을 포함하고, 각 트리형 의도 집합은 적어도 하나의 계층 의도를 포함하며;
상기 제2 처리 모듈은, 상기 사용자 식별자에 대응되는 의도 전략 정보를 이용하여 상기 제1 추천 리스트 중의 의도에 대해 처리하여, 목표 추천 리스트를 획득하기 위한 것이고;
상기 출력 모듈은, 상기 목표 추천 리스트를 출력하기 위한 것이다.
본 출원의 제3 측면에 따르면, 전자기기를 제공하며, 상기 전자기기는,
적어도 하나의 프로세서; 및
상기 적어도 하나의 프로세서와 통신 연결되는 메모리;를 포함하고, 여기서,
상기 메모리에는 상기 적어도 하나의 프로세서에 의해 실행될 수 있는 명령이 저장되고, 상기 명령이 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서가 제1 측면 및 제1 측면에 따른 각 가능한 설계에 따른 방법을 수행할 수 있도록 한다.
본 출원의 제4 측면에 따르면, 컴퓨터 명령이 저장된 비일시적 컴퓨터 판독 가능 저장매체를 제공하며, 상기 컴퓨터 명령은 컴퓨터가 제1 측면 및 제1 측면의 각 가능한 설계에 따른 방법을 수행하도록 하기 위한 것이다.
본 출원의 제5 측면에 따르면, 의도 추천 방법을 제공하며, 상기 방법은,
수신된 의도 검색 요청과 의도 유형 규칙에 따라, 제1 추천 리스트를 확정하는 단계;
기설정된 의도 개입 전략을 이용하여 상기 제1 추천 리스트 중의 의도에 대해 처리하여, 목표 추천 리스트를 획득하는 단계를 포함한다.
제6 측면에 따르면 컴퓨터 판독 가능 저장매체에 저장된 컴퓨터 프로그램을 제공하며, 전자기기의 적어도 하나의 프로세서는 상기 컴퓨터 판독 가능 저장매체 중의 상기 컴퓨터 프로그램을 판독하여 상기 적어도 하나의 프로세서가 상기 컴퓨터 프로그램을 실행하여 상기 전자기기로 하여금제1 측면 및 제1 측면의 각 가능한 설계에 따른 방법을 수행하도록 하기 위한 것이다.
본 출원의 실시예에 따른 의도 추천 방법, 장치, 기기 및 저장매체는, 의도 키워드와 사용자 식별자가 휴대된 의도 검색 요청을 수신하고, 해당 의도 키워드와 미리 구성된 의도 라이브러리에 따라 제1 추천 리스트를 확정할 수 있으며, 해당 의도 라이브러리는 적어도 하나의 트리형 의도 집합을 포함하고, 각 트리형 의도 집합은 적어도 하나의 계층 의도를 포함하며, 사용자 식별자에 대응되는 의도 전략 정보를 이용하여 제1 추천 리스트 중의 의도에 대해 처리하여, 목표 추천 리스트를 획득하고, 마지막으로 해당 목표 추천 리스트를 출력한다. 해당 기술 방안에서, 미리 구성된 의도 라이브러리를 기초로, 의도 검색 요청과의 관련성이 높은 의도를 확정할 수 있으며, 사용자 식별자 기반 의도 전략 정보는 개성화 추천 결과를 향상시킬 수 있기에, 의도 추천의 정확도와 개성화 정밀도를 향상시킨다.
본 부분에서 설명된 내용은 본 출원의 실시예의 관건적 또는 중요한 특징을 명시하고자 하는 것이 아니며, 본 출원의 범위를 한정하고자 하는 것도 아니다는 것을 이해해야 한다. 본 출원의 기타 특징은 아래 명세서에 의해 쉽게 이해될 것이다.
첨부된 도면은 본 해결수단에 대한 더 충분한 이해를 돕기 위한 것으로서, 본 출원에 대해 한정하지 않는다. 여기서,
도 1은 본 출원의 실시예에 따른 의도 추천 방법의 시스템 구조도이다.
도 2는 본 출원의 제1 실시예에 따른 의도 추천 방법의 흐름도이다.
도 3은 본 출원의 제2 실시예에 따른 의도 추천 방법의 흐름도이다.
도 4는 본 출원의 제3 실시예에 따른 의도 추천 방법의 흐름도이다.
도 5는 본 출원의 제4 실시예에 따른 의도 추천 방법의 흐름도이다.
도 6은 본 출원의 제5 실시예에 따른 의도 추천 방법의 흐름도이다.
도 7은 도 6에 도시된 실시예 중에서 사용자 행위 유사도 매트릭스 및/또는 의도 유사도 매트릭스의 훈련 과정을 나타내는 도면이다.
도 8은 본 출원의 제6 실시예에 따른 의도 추천 방법의 흐름도이다.
도 9는 본 출원의 실시예에 따른 의도 추천 장치의 구조도이다
도 10은 본 출원의 실시예의 의도 추천 방법을 구현하기 위한 전자기기의 블록도이다.
아래 첨부 도면과 결합하여 본 출원의 예시적인 실시예에 대하여 설명하며, 이해를 돕기 위하여 이 중에는 본 출원의 실시예의 각 세부 사항을 포함하며, 이들을 예시적인 것으로만 간주되어야 한다. 따라서, 본 분야의 통상적인 지식을 가진 자라면, 여기에 설명된 실시예에 대하여 다양한 변경과 수정을 가할 수 있으며, 이는 본 출원의 실시예의 범위와 정신을 벗어나지 않음을 이해하여야 할 것이다. 마찬가지로, 명확성과 간결성을 위하여, 아래 설명에서는 공지 기능과 구조에 대한 설명을 생략한다.
본 출원의 기술 방안을 소개하기 전에, 우선 본 출원의 실시예에 관련된 용어에 대해 해석한다.
의도: 사용자에 의해 입력된 간단하고 모호한 검색 요청에 대응되는 실제로 희망하는 의미를 표시하는 것을 말한다.
전술: 다양한 경우에 겨냥하여 창조된 응용 전략과 기능을 말한다.
판독 가능성/해석 가능성: 의도의 표현이 응용 환경에 더욱 부합되는 표현 습관이며, 단지 복수의 단어 또는 구절의 간단한 축적이 아님을 말한다.
사용자 행위 기반의 협업 필터링 알고리즘: 사용자와의 행위가 유사한 기타 사용자의 의도를 사용자에게 추천하기 위한 것이다.
의도 기반의 협업 필터링 알고리즘: 사용자가 전에 가지고 있던 의도와 유사한 의도를 사용자에게 추천하기 위한 것이다.
아래에서는 본 출원의 기술 방안과 시스템의 구조를 소개하기 전에, 우선 본 출원의 기술 방안의 응용 배경에 대해 소개한다.
인터넷의 대 환경과 각종 모니터링, 관문 등의 수집 기기가 빠르게 일반화됨에 따라, 매일마다 대량의 사용자 데이터가 생성되거나 획득된다.
선택적으로, 사용자 데이터는 사용자 행위 데이터와 사용자 신분 데이터를 포함할 수 있다. 여기서, 사용자 행위 데이터는 호텔 숙박 행위 데이터(각종 호텔, 셋집, 시간제 임대, 장기 임대 등), 교통 여행 행위 데이터(기차, 고속열차, 비행기, 페리 등 탑승), 통화 행위 데이터(핸드폰 SMS, 유선 전화 통화정보, 이동 전화 통화정보 등), 택배 행위 데이터, 범죄 구금 행위(각 감옥 징역 기록 정보)를 포함할 수 있다. 사용자의 신분 데이터는 얼굴 데이터(예를 들면, 교통 CCTV, 호텔 CCTV, 사용자 자체로 장착한 CCTV 등을 통해 수집된 얼굴 정보), 인터넷 상의 각종 신분 식별번호(identity document, ID)(기기 ID, 예컨대 국제 모바일 기기 인식코드(international mobile equipment identity, IMEI), 광고 식별부호(identifier for advertising, IDFA) 등; 네트워크 ID, 예컨대 인터넷 프로토콜(internet protocol, IP) 주소, 액세스 포인트(access point, AP), 서비스 세트 식별자(service set identifier, SSID) 등)를 포함할 수 있다.
실제 응용 중의 경찰 업무 시나리오에서, 사용자 행위 데이터와 사용자 신분 데이터를 기반으로, 경찰측은 목표 대상의 정보와 관계의 연판(연구와 판단)을 수행할 수 있다. 선택적으로, 연판의 과정 자체는 하나의 전술의 검색과 추천 과정이며, 연판의 의도는 연관 관계 의도(동행, 합숙, 통화, 택배, 셀 메이트); 인당 1건 정보 의도(여행 기록, 숙박 기록, 통화 기록, 택배 기록, 구금 기록); 메세지 요소 의도(텍스트 정보, 기밀, 노트); 중대 정치 핫이슈 의도(어느 나라의 국제 공항, 어느 지방의 소동); 라벨 의도(인구 라벨) 등을 포함할 수 있다.
하지만, 수집 또는 획득된 사용자 데이터가 끊임없이 누적됨에 따라, 중점 대상/혐의 대상의 행위 궤적이 급격하게 팽창하며, 정확한 전술 의도 추천을 수행하기 위하여, 아래의 도전적인 문제를 해결하야 한다.
리소스 계산과 저장: PB급의 데이터 처리 문제를 해결하고, 여기서, PB는 petabyte를 말하며, 이는 보다 고급의 저장 단위이며, 1PB=1024TB 이다. 즉, 매일마다 많은 량의 검색과 클릭 로그 데이터가 생성되기 때문에, 대량의 로그 전처리와 데이터 계산을 수행해야 한다.
경찰 업무 사용 시나리오: 다양한 경찰 유형, 댜양한 시나리오의 전술 의도 추천은 완전히 동일하지 않을 것이며 동시에 서로 보완해야 한다.
전술 의도 확장: 안정 유지 및 대테러 형세가 심화됨에 따라 새롭고 효과적인 전술이 지속적으로 업데이트 및 추가되고 있으며, 새로운 전술에 대한 적응 및 확장이 필요함과 동시에 효율성이 낮은 전술은 폐기 및 도태시켜야 한다.
배경 기술의 소개로부터, 종래 기술의 의도 추천 방법은 주로 규칙이나 전략 또는 사용자 행위 등에 기반하여 적절한 의도를 확정하고 추천하는 것을 알 수 있다.
구체적으로, 추천 개성화와 유사도로부터 구분할 때, 의도 추천 방법은 주로 사용자 행위 기반 추천, 검색 결과 기반 추천, 핫스팟 기반 추천으로 구분된다. 이 중, 사용자 행위 기반 추천이란 서로 다른 사용자의 검색 및 클릭 행위을 기반으로 사용자 유사도 모델을 학습하고 유사한 사용자의 검색 결과를 추천하는 것을 말한다. 검색 결과 기반 추천이란 결과 세트의 다양한 특징에 따라 결과 세트 유사도 모델을 학습하고 검색 결과와 유사한 다른 내용을 추천하는 것을 말한다. 핫스팟 기반 추천이란 최근에 발생한 주요 핫스팟 내용을 추천하고, 이는 검색한 사용자의 행위 및 검색하는 내용과 거의 관련이 없다.
추천 모델의 알고리즘으로부터 구분할 때, 의도 추천 방법은 주로 규칙 기반 알고리즘, 감독 알고리즘, 무감독 알고리즘으로 나뉜다. 이 중 규칙 기반 알고리즘은 주로, 구체적인 규칙을 사전에 만들고, 예를 들어 어느 유형의 사용자가 어느 유형의 특정 의도를 검색하면 어느 규칙이 적중되고, 이에 따라 미리 만들어진 내용를 추천한다. 감독 알고리즘은 주로 지원 벡터 머신 알고리즘, 뉴런 네트워크 알고리즘, 로지스틱 회귀 알고리즘 등을 포함한다. 사용자 행위를 예측하거나 내용의 라벨 유형을 검색한 다음, 동일한 유형의 내용을 추천한다. 무감독 알고리즘은 주로 클러스터링 알고리즘, KNN(K-Nearest Neighbor) 알고리즘, 유사도 매트릭스 등을 포함한다. 유사도 또는 분류를 계산하여 유사도 사용자 또는 결과를 추천한다.
전술과 의도로부터 추천 방법으로부터 구분할 때, 의도 추천 방법은 주로 전술을 기반으로 한 추천을 의미한다. 즉, 서로 다른 검색 의도는 서로 다른 전술을 구성한다. 추천의 의도 자체는 어떤 잠재적인 전술을 구성하여 어느 유형의 문제를 해결한다.
하지만, 상술한 서로 다른 추천 방법은 모두 일정한 문제가 있으며, 아래에는 각각 규칙 기반, 전략 기반, 사용자 행위 기반 등 측면에서 설명한다.
선택적으로, 규칙 기반 방안에서는, 비록 규칙의 작성은 추천 결과를 빠르게 생성할 수 있지만 보다 단일적이며; 규칙의 정의는 적용되는 시나리오와 적용되지 않는 시나리오를 고려해야 하며, 사용자의 증가, 행위 데이터의 증가, 전술의 확장에 따라 규칙의 작성 및 유지가 매우 어려워진다. 규칙의 일반화 능력이 제한되어 있고 전부 나열하기 어려우며; 복잡한 장면은 규칙을 추상화하기 어렵고 비용이 높다.
전략 기반 방안에서는 비록 머신 러닝이나 다른 모델 알고리즘을 사용하여 모델의 일반화 능력을 높이고 규칙의 작성량을 줄일 수 있지만, 추천의 결과가 유사도가 높은 의도인지 아니면 개성화된 의도인지에 개입하기 어려우며; 서로 다른 추천 유형은 데이터 수집 후의 분포가 균일하지 않아 추천이 편향될 수 있으며; 전략 모델의 마이그레이션 비용이 높고 일반적으로 재훈련이 필요하다.
사용자 행위 기반 추천 방식에서는 유사 사용자를 발굴하고, 이의 클릭 및 검색한 결과를 추천함으로써, 새로운 전술과 의도를 발견하는데 도움이 되지만, 많은 사용자 행위 데이터에 의존하며, 추천 시스템이 콜드 부팅될 때 사용자 수량이 적기에 효과가 떨어지고, 사용자 수량이 특별히 많고 결과 세트가 적은 시나리오의 경우, 사용자 유사도 계산에 더 많은 리소스가 점용된다.
상기 분석을 종합하면 규칙, 전략 또는 사용자 행위에 기반한 추천 처리 과정은 모두 적용되는 시나리오를 고려해야 하고 적용 범위가 제한되고 추천 정확도가 낮은 문제가 있음을 알 수 있다.
상술한 문제점에 대해, 본 출원의 실시예는 의도 추천 방법을 제공하며, 예를 들어 경찰 업무 시나리오에서의 의도 검색 요청의 경우, 자연어 기반으로 구현할 수 있으며, 구체적으로 의도 검색 요청(검색문) 중에 존재하는 의도 키워드와 사용자 식별자를 추출하고, 우선 해당 의도 키워드와 미리 구성된 의도 라이브러리를 기초로 제1 추천 리스트를 확정하고, 해당 의도 라이브러리는 적어도 하나의 트리형 의도 집합을 포함하고, 각 트리형 의도 집합은 적어도 하나의 계층 의도를 포함하고, 다음, 사용자 식별자에 해당되는 의도 전략 정보를 이용하여 제1 추천 리스트 중의 의도에 대하여 처리하여 목표 추천 리스트를 획득하고, 마지막으로 해당 목표 추천 리스트를 출력한다. 미리 구성된 의도 라이브러리에 기반하여, 우선, 의도 검색 요청과 관련성이 높은 의도를 확정하고, 사용자 식별자에 기반한 의도 전략 정보는 개성화 추천 결과를 향상시켜, 의도 추천의 정확도와 개성화 정밀도를 향상시킬 수 있다.
또한, 본 출원의 실시예의 방안은 또한 협업 필터링 기술을 사용하여 전술 의도의 추천을 수행할 수 있다. 구체적으로, 사용자의 매번의 의도 검색 요청은 모두 어떤 전술의 구성 요소가 될 수 있으며, 내장 전술을 통해 기타 사용자 행위의 전술을 분석, 학습하여 관련 의도를 추천할 수 있어, 사용자가 적은 양의 입력과 클릭 조작만으로 사용자가 검색하고자 하는 전부 의도를 "추측" 및 "예측"할 수 있다.
선택적으로, 실제 응용에서, 의도 검색 요청을 수신한 후, 먼저 해당 의도 검색 요청에 대응되는 개체(사람, 사물, 시간, 장소 등) 유형, 개체 사이의 배열 조합 순서 및 사용자의 신분 ID를 분석함으로써 사용자의 검색 특징 벡터를 생성한 후, 협업 필터링 관련 알고리즘과 오프라인으로 훈련된 추천 모델을 통해 유사도 검색을 수행하고, 개성화 전술 의도 규칙을 통해 개입 및 강화하여 추천 결과 세트를 획득한다.
아래에서는 본 출원의 기술 방안을 소개하기 전에, 우선 본 출원의 기술 방안의 시스템 구조에 대해 설명한다. 도 1은 본 출원의 실시예에 따른 의도 추천 방법의 시스템 구조도이다. 도 1에 도시된 바를 참조하면, 해당 시스템 구조는 데이터 소스 부분(11), 데이터 처리부분(12), 데이터 저장부분(13)과 추천 그레이딩 부분(14)을 포함한다.
여기서, 데이터 소스 부분(11)은 주로 사용자 데이터 세트의 생성 단계와 데이터 소스를 말한다. 본 출원의 실시예에서, 사용자 데이터 세트는 인터넷의 가상 데이터와 진실 데이터를 포함할 수 있다. 선택적으로, 가상 데이터는 검색 유량 데이터, 지도 측위 데이터, 쇼핑 데이터, 광고 데이터 등을 포함할 수 있으며, 진실 데이터는 호텔 숙박 데이터, 여행 데이터(고속 열차, 비행기, 페리 등), 통화 데이터와 SMS 데이터, SNS 데이터 등을 포함할 수 있다.
선택적으로, 사용자 데이터 세트의 저장 시스템은 주로 관계형 데이터베이스 시스템(relational database management system, RMDB), 비관계형 데이터베이스(NoSQL), 파일 시스템(file)과 분포식 파일 시스템(hadoop distributed file system, HDFS) 등을 포함한다. 다양한 저장 시스템으로부터 사용자 데이터를 획득할 수 있도록, 기설정된 구성 정보를 획득하고, 기설정된 구성 정보에 따라 다양한 저장 시스템으로부터 사용자 데이터를 획득해야 한다.
선택적으로, 데이터 소스 부분(11)은 주로 사용자 행위의 원시 데이터를 생성하기 위한 것이다. 데이터 처리부분(12)은 주로 수신된 의도 검색 요청에 기반하여, 데이터 소스 부분(11)으로부터 사용자 데이터 세트를 획득하고, 사용자 데이터 세트에 대해 처리하여 사용자ID, 인터페이스 경로, 인터페이스 리턴 파라미터, 인터페이스 입력 파라미터와 시간 스탬프 등 정보를 획득하고, 획득된 사용자ID, 인터페이스 경로, 인터페이스 리턴 파라미터, 인터페이스 입력 파라미터와 시간 스탬프 등 정보를 기반으로 데이터 정화 등 처리를 수행하여 목표 데이터 세트를 획득하고, 데이터 저장부분(13)에 저장한다.
선택적으로, 추천 그레이딩 부분(14)은 주로 데이터 처리부분(12)으로부터 의도 검색 요청을 획득하고 데이터 저장부분(13)으로부터 미리 처리된 목표 데이터 세트를 획득하며, 해당 의도 검색 요청과 목표 데이터 세트를 기반으로, 협업 필터링, 내용 추천과 개성화 개입 등 규칙에 따라, 목표 추천 리스트를 확정하고, 데이터 저장부분(13)에 저장함과 동시에, 해당 목표 추천 리스트를 출력한다.
상술한 도 1에 따른 시스템 구조도는 예시적인 설명이라는 것을 이해할 수 있을 것이다. 실제 응용에서, 실제 수요에 따라 조정할 수 있으며, 본 출원의 실시예는 이에 대해 한정하지 않는다.
선택적으로, 본 출원의 실시예의 실행 주체는 전자기기, 예를 들면, 컴퓨터, 태블릿 PC 등 단말기일 수 있고, 예를 들면, 백그라운드의 처리 플랫폼과 같은 서버일 수도 있다. 따라서, 본 실시예는 단말기와 서버를 전자기기로 통칭하여 해석하고 설명하며, 해당 전자기기가 구체적으로 단말기인지 아니면 서버인지에 대해서는 실제 상황에 따라 확정될 수 있다.
선택적으로, 본 출원의 실시예는 의도 추천 방법을 제공하고, 컴퓨터 기술분야 중의 빅 데이터, 인공 지능, 스마트 검색, 정보 스트림, 딥 러닝 기술분야에 적용되며, 주로 데이터 수집, 데이터 모델 계산, 추천 그레이딩 전략 등 여러 부분에 관련되며, 민영화 배치를 지원하며, 여러 경찰 유형의 여러 시나리오에 용이하게 사용됨으로써, 의도 추천의 정확성과 개성화 정밀도를 향상시킨다.
아래, 구체적인 실시예를 통해 본 출원의 기술 방안에 대해 상세하게 설명한다. 설명해야 할 바로는, 아래의 몇개의 구체적인 실시예는 서로 결합 가능하며, 동일하거나 유사한 개념 또는 과정은 일부 실시예에서는 중복 설명하지 않을 수 있다.
도 2는 본 출원의 제1 실시예에 따른 의도 추천 방법의 흐름도이다. 도 2에 도시된 바와 같이, 해당 방법은 아래의 단계를 포함할 수 있다.
S201, 의도 키워드와 사용자 식별자가 휴대된 의도 검색 요청을 수신한다.
본 출원의 실시예는, 사용자가 검색 수요가 있을 때, 의도 검색 요청을 발송하여, 의도 검색 요청을 처리할 것을 전자기기에 요청하여, 해당 사용자가 진정으로 얻고자 하는 정보, 즉 의도를 출력할 수 있다.
선택적으로, 전자기기는 사용자가 다양한 방식, 예를 들면, 문자 방식, 음성 방식 등으로 발송한 의도 검색 요청을 수신할 수 있다. 본 실시예는 사용자가 의도 검색 요청을 발송하는 방식에 대해 한정하지 않으며, 실제 시나리오에 따라 확정할 수 있고, 여기서는 중복 설명하지 않는다.
선택적으로, 전자기기가 목적성을 갖고 의도 검색을 수행하도록 하기 위하여, 해당 의도 검색 요청에는 의도 키워드가 휴대될 수 있으며, 또한 사용자의 개성화 의도를 확정하기 위하여, 해당 의도 검색 요청에는 해당 사용자 식별자가 휴대될 수 있다. 해당 사용자 식별자는 사용자가 의도 검색 요청을 발송한 기기 식별자, 네트워크 식별자 등을 통해 표시할 수 있으며, 본 출원의 실시예는 사용자 식별자의 구체적인 표현 형식에 대해 한정하지 않으며, 실제 시나리오에 따라 확정할 수 있다는 것을 이해할 수 있을 것이다.
예를 들면, 사용자는 하나의 단말기를 통해 의도 검색 요청을 발송하고, 선택적으로, 해당 의도 검색 요청은 하나의 검색문, 예를 들면, "XX지방의 날씨는 어때요"이면, 해당 의도 검색 요청에 대응되는 의도 키워드는 "XX"와 "날씨"이고, 이에 휴대되는 사용자 식별자는 해당 단말기의 식별자를 이용하여 표시될 수 있다.
S202, 해당 의도 키워드와 미리 구성된 의도 라이브러리를 기초로, 제1 추천 리스트를 확정한다.
여기서, 해당 의도 라이브러리는 적어도 하나의 트리형 의도 집합을 포함하고, 각 트리형 의도 집합은 적어도 하나의 계층 의도를 포함한다.
실제 응용에서, 전자기기에는 의도 라이브러리가 미리 구성되어 있을 수 있고, 해당 의도 라이브러리 중의 의도는 시스템에 내장될 수 있고, 사용자에 의해 자체 정의될 수도 있다. 본 출원의 실시예는 의도의 구체적인 형성 방식에 대해 한정하지 않으며, 실제 시나리오에 따라 확정할 수 있다.
선택적으로, 의도의 정밀 정도를 표시하기 위하여, 본 출원의 실시예에서, 의도 라이브러리 중의 의도는 트리형 구조를 사용하여 저장될 수 있으며, 따라서, 의도 라이브러리는 적어도 하나의 트리형 의도 집합을 포함하고, 각 트리형 의도 집합은 적어도 하나의 등급 의도를 포함한다. 예를 들면, 각 트리형 의도 집합은 메인 의도, 2급 의도, 3급 의도 등을 포함하고, 각 트리형 의도 중의 각 브랜치는 모두 유일한 하나의 의도 코드를 구비한다.
선택적으로, 트리는 일종의 데이터 구조로서, 적어도 하나의 유한한 노드로 하나의 계층 관계를 구비하는 집합을 구성한다. 본 출원의 실시예에서, 트리형 의도 집합은 아래의 특징을 가지고 있다. 즉, 각 계층의 의도는 0개 또는 복수의 서브 의도를 구비하고, 페어런트 의도가 없는 의도를 메인 의도라고 부르고, 메인 의도가 아닌 각 의도는 단지 하나의 페어런트 의도만 가지고, 메인 의도 외에 각 서브 의도는 복수의 사귀지 않는 트리형 의도 집합으로 나뉠 수 있다.
본 출원의 실시예에서, 전자기기는 의도 검색 요청을 수신한 후, 해당 의도 검색 요청에 대해 분석하여, 해당 의도 검색 요청에 대응되는 의도 키워드를 확정할 수 있으며, 나아가 해당 의도 키워드에 따라, 미리 구성된 의도 라이브러리에서 검색하여, 해당 의도 키워드가 속하는 계층 의도와 해당 계층 의도가 속하는 트리형 의도 집합을 확정하고, 이어서 기설정된 정렬 규칙에 따라, 해당 의도 키워드가 속하는 트리형 의도 집합에 포함된 모든 의도에 대해 정렬하여 해당 제1 추천 리스트를 생성한다.
S203, 해당 사용자 식별자에 대응되는 의도 전략 정보를 사용하여 제1 추천 리스트 중의 의도에 대해 처리하여, 목표 추천 리스트를 획득한다.
실제 응용에서, 시간의 흐름에 따라, 전자기기 중에 미리 구성된 의도 라이브러리는 지속적으로 업데이트되고, 예를 들면, 사용자의 수요에 따라 새로운 의도를 생성하여 해당 의도 라이브러리에 추가하고, 낙후한 의도 등을 포기한다. 따라서, 의도 추천의 정확도를 향상시키기 위해 전자기기에 미리 개성화 의도 개입 전략 정보가 설정되어 있고, 즉 서로 다른 사용자는 서로 다른 의도 전략 정보에 대응될 수 있다.
본 출원의 실시예에서, 전자기기는 의도 검색 요청을 수신하고 해당 의도 검색 요청에 대응되는 사용자 식별자를 확정하고, 해당 사용자 식별자를 기초로, 전자기기 중에 미리 구성된 개성화 의도 개입 전략 정보를 검색하여, 해당 사용자 식별자에 대응되는 의도 전략 정보를 확정할 수 있다.
상응하게, 전자기기는 해당 사용자에 대응되는 의도 전략 정보를 사용하여 상술한 확정된 제1 추천 리스트 중의 의도에 대해 개입할 수 있으며, 예를 들면, 일부 의도를 포기하고, 의도의 순서에 대해 재정렬 등을 수행하여, 처리된 추천 리스트, 즉, 목표 추천 리스트를 획득한다.
S204, 상술한 목표 추천 리스트를 출력한다.
본 출원의 실시예에서, 전자기기는 의도 검색 요청에 따라 목표 추천 리스트를 확정한 후 출력할 수 있으며, 예를 들면, 목표 추천 리스트를 사용자 식별자에 대응되는 사용자의 단말기에 푸쉬하여 사용자로 하여금 볼 수 있도록 한다.
본 출원의 실시예에 따른 의도 추천 방법은, 의도 키워드와 사용자 식별자가 휴대된 의도 검색 요청을 수신하고, 해당 의도 키워드와 미리 구성된 의도 라이브러리에 따라 제1 추천 리스트를 확정할 수 있으며, 해당 의도 라이브러리는 적어도 하나의 트리형 의도 집합을 포함하고, 각 트리형 의도 집합은 적어도 하나의 계층 의도를 포함하며, 사용자 식별자에 대응되는 의도 전략 정보를 이용하여 제1 추천 리스트 중의 의도에 대해 처리하여, 목표 추천 리스트를 획득하고, 마지막으로 해당 목표 추천 리스트를 출력한다. 해당 기술 방안에서, 미리 구성된 의도 라이브러리를 기초로, 의도 검색 요청과의 관련성이 높은 의도를 확정할 수 있으며, 사용자 식별자 기반 의도 전략 정보는 개성화 추천 결과를 향상시킬 수 있기에, 의도 추천의 정확도와 개성화 정밀도를 향상시킨다.
예시적으로, 상술한 실시예의 기초 상에서, 도 3은 본 출원의 제2 실시예에 따른 의도 추천 방법의 흐름도이다. 도 3에 도시된 바와 같이, 본 실시예에서, 상술한 S202는 아래의 단계를 통해 구현될 수 있다.
S301, 해당 의도 키워드에 대해 시맨틱 분석하여, 해당 사용자 식별자에 대응되는 사용자의 목표 의도를 확정한다.
본 출원의 실시예에서, 사용자에 의해 발송된 의도 검색 요청은 통상적으로 자연어이고, 구어에 가까우며, 해당 자연어에 대해 분석하여 실질 내용을 획득하고, 즉, 해당 사용자 식별자에 대응되는 사용자의 목표 의도를 확정한다.
예시적으로, 사용자는 다양한 방식으로 의도 검색 요청을 발송할 수 있기에, 서로 다른 방식에 대해 서로 다른 분석 방법을 사용할 수 있다. 예시적으로, 사용자가 음성 방식으로 해당 의도 검색 요청을 발송하면, 전자기기는 음성 형식의 의도 검색 요청을 획득한 후, 우선 이를 문자 정보로 전환하고, 해당 문자 정보 중의 의도 키워드를 확정하고, 나아가 해당 의도 키워드에 대해 시맨틱 분석을 수행하여, 해당 의도 키워드에 대응되는 시간, 지점, 인물, 사건 등 요소를 확정함으로써, 해당 사용자 식별자에 대응되는 사용자의 목표 의도를 획득한다.
S302, 해당 목표 의도에 따라, 미리 구성된 의도 라이브러리를 검색하고, 해당 목표 의도가 위치한 계층 정보와 트리 정보를 확정한다.
선택적으로, 본 출원의 실시예에서, 의도 라이브러리에는 적어도 하나의 트리형 의도 집합이 저정되어 있고, 각 트리형 의도 집합은 적어도 하나의 계층을 포함하고, 각 트리형 의도 중의 각 브랜치는 모두 유일한 하나의 의도 코드를 구비하고, 해당 의도 코드 자체는 의도의 분류 계층을 나타낸다. 의도의 계층이 높을 수록, 의도의 분류가 정밀하다는 것을 이해할 수 있다.
예시적으로, [표 1]에는 3급 의도를 구비한 트리형 의도 집합이 표시되어 있다. [표 1]에 표시된 바와 같이, 해당 트리형 의도 집합은 3급 의도, 즉, 메인 의도―A, 2급 의도―B, 3급 의도―C를 포함하고, 상응하게, 2급 의도는 연관 관계 의도 ―B1과 인당 1건의 의도 ―B2를 포함하고, 3급 의도는 동행―C1과 여행―C2를 포함하기에, 해당 트리형 의도 집합은 두개의 브랜치를 포함하고 각각 의도 코드A1B1C1-tongxing와 의도 코드A1B2C2-chuixing를 사용하여 표시한다.
3급 의도를 구비한 트리형 의도 집합
메인 의도―A 2급 의도―B 3급 의도―C 코드
인원 연판 의도―A1 연관 관계 의도―B1 동행―C1 A1B1C1-tongxing
인당 1건 의도―B2 여행―C2 A1B2C2-chuixing
본 출원의 실시예에서, 전자기기는 사용자 식별자에 대응되는 목표 의도를 확정한 후, 미리 구성된 의도 라이브러리에서 검색하고, 목표 의도가 위치한 계층 및 트리를 확정하여, 해당 목표 의도가 위치한 계층 정보와 트리 정보를 획득한다.
예시적으로, 사용자의 목표 의도가 여행―C2라고 가정하면, 우선 해당 목표 의도의 계층이 3급 의도이고, 이에 대응되는 2급 의도는 인당 1건 의도―B2이고, 메인 의도는 인원 연판 의도―A1인 것을 확정할 수 있다.
S303, 해당 목표 의도가 위치한 계층 정보와 트리 정보, 트리 정보에 대응되는 트리형 의도 집합에 따라, 해당 제1 추천 리스트를 획득한다.
본 출원의 실시예에서, 전자기기가 목표 의도가 위치한 계층 정보와 트리 정보를 확정하면, 상응하게 해당 트리 정보에 대응되는 트리형 의도 집합, 즉, 해당 목표 의도가 속한 트리형 의도 집합이 확정되고, 이어서 해당 트리형 의도 집합 중 각 계층의 의도 정보에 따라, 제1 추천 리스트를 생성할 수 있다.
예시적으로, 본 출원의 실시예에서, 해당 S303은 아래의 단계를 통해 구현될 수 있다.
A1, 해당 목표 의도에 대응되는 초기 추천 리스트를 생성한다.
선택적으로, 사용자에게 사용자가 원하는 의도를 추천하기 위하여, 전자기기는 목표 의도를 확정한 후, 우선 해당 목표 의도를 기초로, 초기 추천 리스트를 생성할 수 있다. 선택적으로, 해당 목표 의도는 해당 초기 추천 리스트의 헤더에 위치한다.
예시적으로, 전자기기는 수신된 의도 검색 요청에 기반하여, 확정된 목표 의도가 xx-code라고 가정하면, 해당 xx-code를 포함하는 초기 추천 리스트를 생성할 수 있다.
A2, 해당 목표 의도가 위치한 계층 정보와 트리 정보에 따라, 해당 목표 의도의 적어도 하나의 연관 의도를 확정한다.
A3, 동일 계층, 부속 계층, 트리 계층의 선후 순서에 따라, 해당 목표 의도의 적어도 하나의 연관 의도를 순차적으로 초기 추천 리스트에 추가하여, 제1 추천 리스트를 획득한다.
본 출원의 실시예에서, 트리형 의도 집합은 복수의 서로 다른 계층을 포함할 수 있고, 각 계층은 적어도 하나의 의도를 구비한다. 따라서, 본 출원의 실시예에서, 해당 목표 의도가 위치한 계층 정보에 따라, 해당 목표 의도와 동일 계층, 각 부속 계층, 트리 계층에 있는 적어도 하나의 연관 의도를 순차적으로 확정한 후, 우선 동일 계층, 그 후 부속 계층, 마지막으로 트리 계층인 선후 순서에 따라, 순차적으로 목표 의도의 적어도 하나의 연관 의도를 초기 추천 리스트에 추가하여, 해당 제1 추천 리스트를 획득한다.
예시적으로, xx-code의도가 3급 의도라고 가정하면, 우선 xx-code의도의 동일 그룹의 3급 의도 아이템을 상술한 초기 추천 리스트에 추가하고, xx-code의도가 종속된 2급 의도에 소속된 전부 3급 의도를 초기 추천 리스트에 추가하고, 마지막으로 xx-code의도가 종속된 메인 의도에 소속된 전부 3급 의도를 초기 추천 리스트에 추가하여, 최종적으로 획득된 추천 리스트는 제1 추천 리스트이다.
예시적으로, 표 1에 표시된 트리형 의도 집합에 있어서, 목표 의도는 여행―C2이고, 해당 여행―C2와 동일 그룹인 의도, 여행―C2가 종속된 2급 의도(인당 1건 의도―B2)에 소속된 전부 3급 의도는 모두 존재하지 않고, 여행―C2가 종속된 메인 의도(인원 연판 의도―A1)에 소속된 전부 3급 의도(동행―C1)를 추천 리스트에 추가하고, 이로부터 획득된 제1 추천 리스트는 여행―C2, 동행―C1을 포함한다.
본 실시예에서, 제1 추천 리스트를 생성할 때, 먼저 동일 계층, 후에 부속 계층, 마지막에 트리 계층인 선후 순서에 따라, 목표 의도의 적어도 하나의 연관 의도를 순차적으로 초기 추천 리스트에 추가하며, 이때 목표 의도와 연관성이 가장 큰 의도를 추천 리스트의 앞에 정렬할 수 있고, 일정한 정도에서 의도 추천의 정확도를 향상시킬 수 있다.
본 출원의 실시예에 따른 의도 추천 방법은, 해당 의도 키워드에 대해 시맥틱 분석하여, 해당 사용자 식별자에 대응되는 사용자의 목표 의도를 확정하고, 다음 해당 목표 의도에 따라, 미리 구성된 의도 라이브러리를 검색하고, 해당 목표 의도가 위치한 계층 정보와 트리 정보를 확정하고, 마지막으로 해당 목표 의도가 위치한 계층 정보와 트리 정보, 트리 정보에 대응되는 트리형 의도 집합에 따라, 해당 제1 추천 리스트를 획득한다. 해당 기술 방안은, 의도 라이브러리 중의 신규 증가 의도의 관련성 추천 순서를 높일 수 있으며, 신규 증가 의도의 검색과 클릭량이 매우 적음으로 인한 신규 증가 의도의 순위가 하위에 머무는 문제를 해결한다.
선택적으로, 상술한 실시예의 기초 상에서, 도4는 본 출원의 제3 실시예에 따른 의도 추천 방법의 흐름도이다. 도 4에 도시된 바와 같이, 본 실시예에서, 상술한 S203은 아래의 단계를 통해 구현될 수 있다.
S401, 해당 사용자 식별자에 대응되는 의도 전략 정보를 확정하되, 해당 의도 전략 정보는 의도의 유효 범위 정보와 유효 순서 정보를 지시하기 위한 것이다.
실제 응용에서, 예를 들면, 경찰 업무 시나리오에서, 복잡하고 끊임없이 변화하는 전술 수요에 대응하기 위하여, 의도 라이브러리에는 지속적으로 새로운 의도가 추가되고, 동시에 낙후한 의도를 포기해야 한다. 따라서, 본 출원의 실시예에서, 전자기기는 서로 다른 사용자에 대해 서로 다른 의도 전략 정보, 즉 개성화 개입 전략이 설정되어 있다.
예시적으로, 해당 개성화 개입 전략은 전역 유효와 특정 사용자 유효의 개입 전략, 블랙-화이트 리스트가 효력을 발생하는 개입 전략으로부터 설정하고, 이로부터 개성화 개입 전략에 대응되는 구성 아이템은 전역 유효한 화이트 리스트 의도, 전역 유효한 블랙 리스트 의도, 오직 특정 사용자에 대해 유효한 화이트 리스트 의도, 오직 특정 사용자에 대해 유효한 블랙 리스트 의도 등을 포함할 수 있다.
예시적으로, 구성 아이템의 표현 방식은 아래와 같다.
Whitelist는 전역 유효한 화이트 리스트 의도를 표시하고; blacklist는 전역 유효한 블랙 리스트 의도를 표시하고; personal은 개성화 개입 구성을 표시하고; personal.userToken은 사용자id를 표시하고; personal.whitelist는 단지 특정 사용자에 대해 유효한 화이트 리스트 의도를 표시하고, personal.blacklist는 단지 특정 사용자에 대해 유효한 블랙 리스트 의도를 표시한다.
선택적으로, 본 출원의 실시예에서, 서로 다른 사용자에 대해 의도의 유효 범위 정보와 유효 순서 정보를 확정하기 위하여, 전자기기에는 서로 다른 구성 아이템의 우선 순위와 수행 유효 순서가 더 설정될 수 있다. 예를 들면, 개입 전략의 우선 순위의 크기의 구분은 블랙리스트 > 화이트리스트, 개성화 구성 > 전역 구성 이다. 상응하게, 개입 전략의 수행 유효 순서는 전역 화이트 리스트 - 전역 블랙 리스트 - 개성화 화이트 리스트 - 개성화 블랙 리스트이다.
본 출원의 실시예에서, 전자기기는 우선 사용자 식별자와 의도 전략 정보의 대응 관계에 따라, 해당 사용자 식별자에 대응되는 의도 전략 정보를 확정하고, 나아가 해당 의도 전략 정보가 지시하는 의도의 유효 범위 정보와 유효 순서 정보를 확정한다.
S402, 해당 의도 전략 정보가 지시하는 의도의 유효 범위 정보에 따라, 제1 추천 리스트 중 유효한 의도 집합을 확정한다.
본 출원의 실시예에서, 전자기기는 해당 사용자 식별자에 대응되는 의도 전략 정보에 따라, 우선 이에 의해 지시되는 의도의 유효 범위 정보를 확정하고, 예를 들면, 블랙 리스트 유효인지, 화이트 리스트 유효인지, 아니면 해당 사용자에 대응되는 개성화 화이트 리스트 유효인지, 또는 해당 사용자에 대응되는 개성화 블랙 리스트 유효인지 등을 확정한다.
상응하게, 본 실시예에서, 전자기기는 사용자 식별자에 대응되는 의도의 유효 범위 정보에 따라, 제1 추천 리스트 중 유효 의도 집합을 확정할 수 있다. 예를 들면, 의도 전략 정보가 화이트 리스트 유효를 지시하면, 전자기기는 상술한 제1 추천 리스트에서 전역 화이트 리스트와 사용자 화이트 리스트에 대응되는 의도 집합을 선별해낸다.
S403, 해당 의도 전략 정보가 지시하는 의도의 유효 순서 정보에 따라, 상술한 의도 집합 중의 모든 의도에 대해 정렬하여, 목표 추천 리스트를 획득한다.
예시적으로, 전자기기는 또한 해당 사용자 식별자에 대응되는 의도 전략 정보에 따라, 이에 의해 지시되는 의도의 유효 순서 정보를 확정할 수 있으며, 예를 들면, 개입 전략에서, 개성화 구성의 우선 순위가 전역 구성된 우선 순위보다 크고, 개입 전략의 유효 실행 순서는 우선 전역 화이트 리스트, 그 후 개성화 화이트 리스트이다.
따라서, 본 실시예에서 전자기기는 확정된 의도의 유효 순서 정보에 따라, 제1 추천 리스트에서 선별된 전역 화이트 리스트와 사용자 화이트 리스트에 대응되는 의도 집합 중의 의도에 대해 정렬하여 해당 목표 추천 리스트를 생성할 수 있다.
본 출원의 실시예에 따른 의도 추천 방법은, 사용자 식별자에 대응되는 의도 전략 정보를 확정하고, 해당 의도 전략 정보는 의도의 유효 범위 정보와 유효 순서 정보를 지시하기 위한 것이며, 다시 해당 의도 전략 정보가 지시한 의도의 유효 범위 정보에 따라, 제1 추천 리스트 중 유효 의도 집합을 확정하고, 마지막으로 해당 의도 전략 정보가 지시한 의도의 유효 순서 정보에 따라, 상술한 의도 집합 중의 모든 의도에 대해 정렬하여, 목표 추천 리스트를 획득한다. 해당 기술 방안에서, 개성화 의도 개입 전략에 따라, 개성화 의도 집합을 선별해낼 수 있으며, 의도 집합 중의 의도에 대해서도 정렬할 수 있으며, 의도 추천의 정확도와 목적성을 향상시킨다.
나아가, 상술한 실시예의 기초 상에서, 도 5는 본 출원의 제4 실시예에 따른 의도 추천 방법의 흐름도이다. 도 5에 도시된 바와 같이, 본 실시예에서, 해당 방법은 아래의 단계를 더 포함할 수 있다.
S501, 협업 필터링 알고리즘에 기반하여 상술한 의도 검색 요청과 미리 확정된 유사도 매트릭스에 대해 처리하여, 제2 추천 리스트를 획득한다.
여기서, 제2 추천 리스트는 사용자 행위 기반의 협업 필터링 알고리즘을 사용하여 의도 검색 요청과 미리 확정된 사용자 행위 유사도 매트릭스에 대해 처리하여 획득된 것, 및/또는, 의도 기반의 협업 필터링 알고리즘을 사용하여 의도 검색 요청과 미리 확정된 의도 유사도 매트릭스에 대해 처리하여 획득된 것이다.
선택적으로, 해당 단계는 상술한 S202 전에 또는 S202 후에 실행될 수 있으며, 본 출원의 실시예는 해당 단계(S501)의 구체적인 실행 순서를 한정하지 않는다. 본 실시예는 해당 단계가 S202 후에 실행되는 것에 대해 설명한다.
실제 응용에서, 인터넷 기술이 발전함에 따라 더욱 많은 사용자 데이터가 획득될 수 있으며, 네트워크 상의 사용자 데이터에 대해 분석하여, 암시적 전술과 관련 의도를 발견할 수 있다. 따라서, 본 출원의 실시예에서, 협업 필터링 알고리즘을 사용하여 획득된 의도 검색 요청과 대량의 사용자 데이터에 기반하여 생성된 유사도 매트릭스에 대해 처리하여 여러개의 관련 의도를 확정할 수 있다.
본 출원의 실시예의 가능한 설계에서, 해당 단계(S501)는 아래의 단계를 통해 구현될 수 있다.
사용자 행위 기반의 협업 필터링 알고리즘을 이용하여 상술한 의도 검색 요청 및 미리 생성된 사용자 행위 유사도 매트릭스에 대해 처리하여, 제2 추천 리스트를 획득한다.
구체적으로, 우선, 해당 사용자 식별자와 미리 생성된 사용자 행위 유사도 매트릭스에 따라, 제1 사용자 집합을 확정하고, 해당 제1 사용자 집합은 목표 사용자(사용자 식별자에 대응되는 사용자)와의 행위 유사도가 가장 높은 K개의 사용자를 포함하고, K는 양의 정수이고, 다음, 해당 사용자 식별자에 대응되는 사용자의 행위 특징 정보에 따라, 목표 사용자에 대응되는 제1 의도 집합을 확정하고, 다음, 해당 제1 의도 집합 중의 임의의 하나의 의도에 대해, 해당 의도에 대응되는 제2 사용자 집합을 확정하고, 해당 목표 사용자와 제1 사용자 집합 중 각 사용자 사이의 유사도 값 및 상기 의도에 대한 각 사용자의 선호 정보에 따라, 해당 의도에 대한 목표 사용자의 선호 득점을 확정하고, 마지막으로 제1 의도 집합 중 각 의도에 대한 해당 목표 사용자의 선호 득점에 따라, 제2 추천 리스트를 확정한다.
예시적으로, 제1 의도 집합 중의 임의의 하나의 의도 x에 있어서, 의도 x에 대한 사용자a의 관심 정도 득점(선호 득점)은 아래 수식으로 표시한다.
여기서, 는 사용자a와 행위 유사도가 가장 높은 상위 K개의 사용자를 표시하고, 제1 사용자 집합이라고 부르며, 이는 사용자 식별자와 미리 확정된 사용자 행위 유사도 매트릭스에 따라 확정된 것이다. N(x)는 동시에 의도 x에 대응되는 행위를 구비하는 사용자 집합을 표시하고, 제2 사용자 집합으로 부른다. 는 사용자a와 사용자b 사이의 유사도 값을 표시한다. 는 의도 x에 대한 사용자b의 선호 득점을 표시한다.
상술한 방법으로 제1 의도 집합 중 각 의도에 대한 해당 사용자의 선호 득점을 확정할 수 있으며, 마지막으로 사용자의 차원에서 제1 의도 집합 중의 각 의도의 득점에 대해 내림 순으로 정렬하여 제2 추천 리스트를 획득할 수 있다.
본 출원의 실시예의 다른 가능한 설계에서, 해당 단계(S501)는 아래의 단계를 통해 구현될 수 있다.
의도 기반의 협업 필터링 알고리즘을 사용하여 상술한 의도 검색 요청 및 미리 생성된 의도 유사도 매트릭스에 대해 처리하여, 제2 추천 리스트를 획득한다.
구체적으로, 우선, 사용자 식별자와 미리 생성된 의도 유사도 매트릭스에 따라, 제2 의도 집합을 확정하고, 해당 제2 의도 집합은 의도 검색 요청과 대응되는 의도와의 의도 유사도가 가장 높은 K개 의도를 포함하고; 다음, 목표 사용자(사용자 식별자에 대응되는 사용자)의 행위 특징 정보에 따라, 목표 사용자의 제3 의도 집합을 확정하고, 다음, 해당 제3 의도 집합 중의 임의의 하나의 의도에 대해, 해당 의도와 제2 의도 집합 중의 각 의도 사이의 유사도 값 및 의도에 대한 목표 사용자의 선호 정보에 따라, 해당 의도에 대한 목표 사용자의 선호 득점을 확정하고, 마지막으로 제3 의도 집합 중 각 의도에 대한 해당 목표 사용자의 선호 득점에 따라, 제2 추천 리스트를 확정한다.
예시적으로, 제3 의도 집합 중의 임의의 하나의 의도 x에 있어서, 의도 x에 대한 사용자a의 관심 정도 득점(선호 득점)은 아래 수식으로 표시한다.
여기서, 는 의도 y와 가장 유사한 k개 의도를 표시하고, 제2 의도 집합이라고 부르며, 여기서, 의도 y는 의도 검색 요청을 기반으로 확정된 의도이고; N(a)은 사용자a가 좋아하는 의도의 집합이고, 제3 의도 집합으로 부른다. 는 의도 x와 의도 y의 유사도 값을 표시하고, 는 의도 y에 대한 사용자a의 선호 득점을 표시한다.
상술한 방법으로 제3 의도 집합 중 각 의도에 대한 해당 목표 사용자의 선호 득점을 확정할 수 있으며, 마지막으로 사용자 차원에서 제3 의도 집합 중 각 의도의 득점에 대해 내림순으로 정렬하여, 제2 추천 리스트를 획득할 수 있다.
본 출원의 실시예의 또 다른 가능한 설계에서, 해당 단계(S501)는 아래의 단계를 통해 구현될 수 있다.
사용자 행위 기반의 협업 필터링 알고리즘을 사용하여 의도 검색 요청 및 미리 생성된 사용자 행위 유사도 매트릭스에 대해 처리하고, 의도 기반의 협업 필터링 알고리즘을 사용하여 상술한 의도 검색 요청 및 미리 생성된 의도 유사도 매트릭스에 대해 처리하여, 제2 추천 리스트를 획득한다.
구체적으로, 본 출원의 실시예에서, 사용자 행위 기반의 협업 필터링 알고리즘으로 확정된 사용자 행위 추천 리스트와 사용자 행위 기반의 협업 필터링 알고리즘으로 확정된 의도 추천 리스트를 정합하여, 해당 제2 추천 리스트를 획득할 수 있다. 사용자 행위 추천 리스트와 의도 추천 리스트의 생성 방법은 상술한 가능한 설계의 기재를 참조할 수 있으며, 여기서는 중복 설명하지 않는다.
상응하게, 도 5에 도시된 바와 같이, 상술한 S203은 아래 단계로 교체될 수 있다.
S502, 해당 사용자 식별자에 대응되는 의도 전략 정보를 이용하여 제1 추천 리스트 중의 의도, 제2 추천 리스트 중의 의도에 대해 처리하여 해당 목표 추천 리스트를 획득한다.
본 출원의 실시예에서, 상술한 도 2에 도시된 실시예 중의 S203의 기재를 바탕으로, 전자기기는 우선 해당 사용자 식별자에 대응되는 의도 전략 정보를 확정할 수 있다. 다음, 해당 사용자에 대응되는 의도 전략 정보를 이용하여 상술한 확정된 제1 추천 리스트와 제2 추천 리스트 중의 의도에 대해 개입하여, 예를 들면, 일부 의도를 포기하고, 의도의 순서에 대해 재정렬 등을 수행하여 처리 후의 추천 리스트, 즉 목표 추천 리스트를 획득한다.
선택적으로, 전자기기는 사용자 설정에 따라 제1 추천 리스트와 제2 추천 리스트에 대한 처리 순서를 확정할 수 있다. 예를 들면, 어느 지표, 예컨대, 관심량 크기, 생성 시간 등 지표에 따라, 제1 추천 리스트와 제2 추천 리스트에 포함된 모든 의도에 대해 정합한 후, 다시 사용자 식별자에 대응되는 의도 전략 정보를 사용하여 이에 대해 처리함으로써 목표 추천 리스트를 획득한다.
본 출원의 실시예에 따른 의도 추천 방법은 협업 필터링 알고리즘에 기반하여 상술한 의도 검색 요청과 미리 확정된 유사도 매트릭스에 대해 처리하여, 제2 추천 리스트를 획득하고, 해당 사용자 식별자에 대응되는 의도 전략 정보를 사용하여 제1 추천 리스트 중의 의도 및 제2 추천 리스트 중의 의도에 대해 처리하여, 해당 목표 추천 리스트를 획득한다. 해당 기술 방안에서, 대량의 사용자 행위 데이터와 협업 필터링을 이용하여 추천하면, 암시적 전술과 관련 의도를 발견할 수 있고, 의도 내용 유형 기반의 추천을 결합하면 신규 증가 의도가 빠르게 유효되며, 개성화 의도 전략 정보를 통해 추천의 정확성과 목적성을 향상시킬 수 있다.
선택적으로, 상술한 각 실시예의 기초 상에서, 도 6은 본 출원의 제5 실시예에 따른 의도 추천 방법의 흐름도이다. 도 6에 도시된 바와 같이, 본 실시예에서, 해당 방법은 아래의 단계를 더 포함할 수 있다.
S601, 사용자 데이터 세트를 획득한다.
본 출원의 실시예는, 인터넷의 대 환경에서, 네트워크에서 생성되는 사용자 행위 데이터는 수없이 많고, 선택적으로, 사용자 데이터 세트는 사용자ID, 사용자 검색 내용, 검색 인터페이스, 의도 정보, 검색 결과, 시간 스탬프 등 정보를 포함할 수 있다. 여기서, 데이터 소스는 연관 관계 인터페이스, 인당 1건 인터페이스 등 여러 로그를 포함하고, 정규 매칭과 필터링을 통해, 원시 사용자 행위 데이터를 추출한다. 예시적으로, 아래에서는 다양한 데이터 포맷을 나열한다.
사용자id:{"userToken": "192.0.25.64"}
검색 인터페이스:{"apiUrl": "/api/to/path"}
검색 내용:{"apiParmas": {"query": "blabla.."}}
의도 정보:{"intentionCode": "A1B1C1-tongxing"}
시간 스탬프:{"timeStamp": 1521402351}
검색 결과:{"apiResponse": {...}}
선택적으로, 원시 로그는 상술한 정보의 구조화 정보를 포함하고, 행에 따른 정규 매칭을 통해, 각 항목의 구체 내용을 획득한 후 csv 타입의 텍스트 문서에 입력하고, schema정보는 아래와 같다. userToken \t apiUrl \t apiParams \t intentionCode \t timestamp \t apiResponse.
선택적으로, 전자기기는 기설정된 데이터 구성에 따라 사용자 데이터 세트를 획득할 수 있다. 예시적으로, 기설정된 구성 정보는 데이터 소스 유형(HDFS, HIVE, MYSQL, NoSQL??), 데이터 소스 경로(호스트:포트(host:port), hdfspath??), 추출 방식, 추출 주기를 포함할 수 있다. 여기서, 데이터 소스 유형은 사용자 신분 데이터를 저장하는 시스템 유형을 표시하기 위한 것이고, 데이터 소스 경로는 사용자 신분 데이터를 추출 시 경과하는 노선을 표시하기 위한 것이고, 추출 방식은 어떤 방식을 사용하여 데이터를 추출(증량 또는 전량)을 수행할 것인지 표시하기 위한 것이고, 추출 주기는 얼마 동안마다 자동으로 데이터를 한번 추출하는 지를 표시하기 위한 것이다. 해당 추출 주기는, 일 레벨, 시간 레벨 또는 한번 사용자 데이터 추출 임무를 수행하도록 지시하기 위한 스케줄링 빈도(실행 주기)로 간주될 수 있다.
선택적으로, 시스템의 로그의 생성 방식은 일반적으로 롤링 로그이기에, 매일마다 하나의 새로운 로그 문서가 생성되므로, 데이터 수집 주기는 기설정된 시간(예를 들면, 1일)마다 한번 실행하고, 증량 방식으로 설정할 것을 제안한다.
구체적으로, 전자기기는 구성된 내용을 기반으로, 서로 다른 데이터 소스 경로에 따라 서로 다른 데이터 소스를 판독할 수 있다. 만약 증량의 데이터 수집 방식을 사용하면, 증량 매칭 결과는 히스토리 전량 데이터와 융합해야 한다. 만약 전량 데이터 수집 방식을 사용하면, 전량 매칭의 결과로 직접 히스토리 전량 데이터를 커버해야 한다.
나아가, 본 출원의 실시예에서, 네트워크로부터 획득된 원시 사용자 데이터에는, 데이터 불정확, 데이터 지연, 데이터 결실 등 경우가 존재할 수 있으므로, 수집된 원시 사용자 데이터의 품질을 확보하지 못하게 된다. 선택적으로, 이런 저품질 데이터에 대해, 전자기기는 엄격한 필터링 조건을 사용하여 요구에 완전히 부합되는 데이터만을 보류함으로써, 데이터의 노이즈의 추후 사용에 대한 영향을 최대한으로 감소할 수 있다. 데이터 결실과 데이터 지연에 대하여, 수동 수행 모드를 제공하여 정기적으로 누락된 데이터를 백 추적하여 데이터의 전면성을 향상시킬 수 있다.
상술한 분석으로부터, 본 출원의 실시예에서 제공되는 자동화 데이터 수집 방안은, 사용자 행위 수집의 수출-전환-로드(Extract-Transform-Load, etl) 공정 방안을 도입하여, 데이터가 소스측으로부터 추출(extract), 전환(transform), 로드(load)를 거쳐 목적측까지의 과정을 기술하였으며, 이는 구성화와 자동화를 구현하고 증량, 전량의 데이터 수집을 지원하고 인공적인 데이터 백 추적을 지원하고, 데이터 수집 원가를 감소시킨다.
S602, 해당 사용자 데이터 세트에 따라, 사용자 행위 유사도 매트릭스 및/또는 의도 유사도 매트릭스를 생성한다.
여기서, 해당 사용자 행위 유사도 매트릭스는 사용자 데이터 세트에 관련된 사용자 사이의 행위 유사도를 표시하기 위한 것이며, 해당 의도 유사도 매트릭스는 사용자 데이터 세트에 관련된 의도 사이의 유사도를 표시하기 위한 것이다.
본 출원의 실시예에서, 협업 필터링의 목적은 여러 사용자, 여러 시나리오에서의 검색 의도를 분석하여, 추천 리스트에서 관심 없는 의도를 필터링하여 제거함으로써, 관심있고 새로운 의도를 획득하도록 한다. 따라서, 사용자에 대해 개성화 추천이 필요할 때, 우선 해당 사용자의 행위와 유사한 기타 사용자를 찾아야 하고, 다음 이런 사용자의 좋아하고 검색하는 의도를 추천 리스트에 추가한다.
구체적으로, 전자기기는 우선 사용자의 원시 행위 데이터에 따라, 각 사용자의 행위 특징 벡터를 계산한다. 선택적으로, 해당 사용자의 행위 특징 벡터는 검색의 apiUrl(즉, 검색 인터페이스)와 의도 코드 이 두가지 특징을 포함할 수 있다. 예시적으로, 사용자의 행위 특징 벡터는 히스토그램 특징(bag of feature)으로 표시될 수 있다:[apiUrl(1), apiUrl(2), ??, apiUrl(m), intention(1), intention(2), ??, intention(n)]. 여기서, apiUrl(m)은 사용자가 방문한 제m개 api의 url경로의 횟수를 표시하고, intention(n)는 사용자가 검색한 제n 개 의도의 횟수를 표시하며, 양자는 모두 사용자의 특징 성분을 표시한다.
본 실시예에서, 사용자 데이터 세트 중 임의의 두 사용자 사이의 행위 유사도 값은 아래 코사인 유사도 수식에 의해 얻을 수 있다.
여기서, 는 사용자a와 사용자b의 행위 유사도 값을 표시하고, n은 특징 벡터의 차원수를 표시하고, 는 사용자a의 특징 성분을 표시하고, 는 사용자b의 특징 성분을 표시한다.
사용자 데이터 세트 중 임의의 두 사용자에 대해 모두 상술한 방식을 사용하여 행위 유사도 값을 계산하고, 따라서, 사용자 데이터 세트에 대응되는 사용자 행위 유사도 매트릭스를 계산하여 획득할 수 있다.
마찬가지로, 의도에 대한 여러 사용자의 검색 클릭 행위를 분석하여, 각 의도의 사용자 선호 벡터를 획득할 수 있다. 따라서, 각 의도의 사용자 선호 벡터를 기반으로 의도 사이의 유사도 매트릭스를 계산할 수 있다. 예시적으로, 각 의도의 사용자 선호의 히스토그램 특징을 아래 식:[user(1), user(2), ??, user(n)]으로 표시할 수 있다. 여기서, user(n)은 현재 의도에 대한 제n번째 사용자의 검색 클릭 횟수를 표시한다.
본 실시예에서, 사용자 데이터 세트 중 임의의 두개의 의도 사이의 의도 유사도 값은 코사인 유사도 수식에 따라 얻을 수 있다.
여기서, 는 의도 p와 의도 q의 유사도 값을 표시하고, n은 사용자의 수량을 표시하고, 는 의도 p의 특징 성분을 표시하고, 는 의도 q의 특징 성분을 표시한다.
사용자 데이터 세트 중의 임의의 두 의도에 대해 모두 상술한 방식으로 의도 유사도 값을 계산하고, 따라서, 사용자 데이터 세트에 대응되는 의도 유사도 매트릭스를 계산하여 얻을 수 있다.
S603, 해당 사용자 행위 유사도 매트릭스 및/또는 의도 유사도 매트릭스를 저장한다.
본 출원의 실시예에서, 사용자 데이터 세트에 대응되는 사용자 행위 유사도 매트릭스 및/또는 의도 유사도 매트릭스를 확정한 후 저장하여, 추후의 의도 추천 시에 직접 사용하도록 하며 추천 효율을 향상시킨다.
예시적으로, 도 7은 도 6에 도시된 실시예 중 사용자 행위 유사도 매트릭스 및/또는 의도 유사도 매트릭스의 훈련 과정의 도면이다. 도 7에 도시된 바와 같이, 본 출원의 실시예에서, 오프라인으로 훈련된 데이터 소스는 검색 API데이터, 연관 관계 데이터, 인당 1건 데이터와 라벨 데이터를 포함할 수 있으며, 상응하게, 데이터 수집 방식은 증량 방식, 즉 사용자 행위 증량 데이터를 획득한 후, 누적의 방식으로 사용자 행위 전량 데이터를 획득하고, 이어서 사용자 행위 유사도 매트릭스와 의도 유사도 매트릭스를 각각 훈련하여 획득하고, 마지막으로 획득된 사용자 행위 유사도 매트릭스와 의도 유사도 매트릭스를 데이터베이스에 저장하여 추후에 사용하도록 한다.
본 출원의 실시예에 따른 의도 추천 방법은, 사용자 데이터 세트를 획득하고, 해당 사용자 데이터 세트에 따라, 사용자 행위 유사도 매트릭스 및/또는 의도 유사도 매트릭스를 생성하되, 해당 사용자 행위 유사도 매트릭스는 사용자 데이터 세트에 관련된 사용자 사이의 행위 유사도를 표시하기 위한 것이고, 의도 유사도 매트릭스는 사용자 데이터 세트에 관련된 의도 사이의 유사도를 표시하기 위한 것이며, 사용자 행위 유사도 매트릭스 및/또는 의도 유사도 매트릭스를 저장한다. 해당 기술 방안에서, 수집된 사용자 데이터 세트에 따라 사용자 행위 유사도 매트릭스 및/또는 의도 유사도 매트릭스를 계산하기에, 추후의 사용에 편의를 제공하고 의도 추천의 효율과 정밀도를 향상시킨다.
상술한 바와 같이, 본 출원의 실시예는 사용자에게 정확한 의도를 추천하기 위하여 그레이딩 추천 전략을 사용하였으며, 우선 협업 필터링 방법을 사용하여 사용자의 의도의 관련성 결과 세트를 획득하고, 다음 의도 유형 규칙(즉, 기설정된 의도 라이브러리)을 이용하여 관련 의도를 추가적으로 리콜하고, 추천 리스트에 추가하며, 마지막으로 유효 개성화 개입 전략을 통해, 특정 의도를 추가와 삭제, 전역 또는 지정 사용자 유효 방식으로, 정밀도가 보다 높은 목표 추천 리스트를 획득하는 것을 알 수 있다.
예시적으로, 도 8은 본 출원의 제6 실시예에 따른 의도 추천 방법의 흐름도이다. 도 8에 도시된 바와 같이, 본 출원의 실시예에서, 온라인 검색 과정은 정보 입력 단계, 추천 모델 계산 단계, 정렬 합병 단계, 개성화 개입 단계를 거친 후 추천 결과를 출력할 수 있다.
예시적으로, 전자기기는 정보 입력 단계에서 사용자에 의해 입력된 사용자 정보를 획득하여 목표 의도를 획득하고, 다음 추천 모델 계산 단계에서 해당 목표 의도에 대해 사용자 행위 기반의 협업 필터링, 의도 기반의 협업 필터링, 의도 분류 추천 등 처리를 수행하여, 출력된 추천 리스트를 정렬 합병 단계에 입력하고, 정렬 합병 단계에서 의도 중복 제거, 교차 추천 등 방식의 처리를 거쳐, 처리 결과를 개성화 개입 단계에 입력하고, 전역 화이트 리스트 추가, 전역 블랙 리스트 추가, 개성화 화이트 리스트 추가, 개성화 블랙 리스트 추가 등 처리를 수행한 후 마지막으로 추천 결과를 출력한다.
상술한 분석으로부터, 본 출원의 실시예는 협업 필터링 의도 추천 방안을 제시하였고, 여러 사용자의 검색 클릭 의도 행위를 학습하여, 각 사용자의 의도 추천 결과 세트를 획득하고, 많은 사용자가 함께 사용하는 시나리오에서 양호한 정확률과 리콜률을 얻을 수 있으며, 의도 기반의 내용 추천 방안으로, 의도에 대해 분류하여 직접적으로 의도가 유사한 기타 의도를 추천하며, 새로운 의도가 분류 시스템에 가입될 때, 해당 방안은 신속하께 새로운 의도를 관련되게 추천하며, 이로부터 협업 필터링의 결과와 서로 보완한다. 즉, 그레이딩 추천 전략을 제안하여 협업 필터링 추천, 의도 내용 추천과 개성화 개입 전략을 통해, 시스템이 콜드 부팅될 때에도 추천 결과 세트에 데이터가 존재하며, 새로운 의도가 가입되면 신속하게 나타날 수 있으며, 또한 해당 방법의 사용에 따라 추천의 결과가 다양하고 더욱 정확하다.
이상에서는 본 출원의 실시예에 따른 의도 추천 방법의 구체적인 구현을 소개하였으며, 아래에는 본 출원의 방법 실시예를 실행할 수 있는 본 출원의 장치 실시예이다. 본 출원의 장치 실시예에서 개시되지 않은 세부 사항은 본 출원의 방법 실시예를 참조할 수 있다.
도 9는 본 출원의 실시예에 따른 의도 추천 장치의 구조도이다. 해당 장치는 전자기기에 집적되거나 전자기기를 통해 구현될 수 있으며, 해당 전자기기는 단말기일 수 있고, 서버일 수도 있다. 도 9에 도시된 바와 같이, 본 실시예에서, 해당 의도 추천 장치(90)는,
의도 키워드와 사용자 식별자가 휴대된 의도 검색 요청을 수신하기 위한 수신 모듈(901);
상기 의도 키워드와 미리 구성된 의도 라이브러리에 따라, 제1 추천 리스트를 확정하되, 상기 의도 라이브러리는 적어도 하나의 트리형 의도 집합을 포함하고, 각 트리형 의도 집합은 적어도 하나의 계층 의도를 포함하는 제1 처리 모듈(902);
상기 사용자 식별자에 대응되는 의도 전략 정보를 이용하여 상기 제1 추천 리스트 중의 의도에 대해 처리하여, 목표 추천 리스트를 획득하기 위한 제2 처리 모듈(903);
상기 목표 추천 리스트를 출력하기 위한 출력 모듈(904)을 포함한다.
본 출원의 실시예의 가능한 설계에서, 제1 처리 모듈(902)은 구체적으로,
상기 의도 키워드에 대하여 시맨틱 분석을 수행하여, 상기 사용자 식별자에 대응되는 사용자의 목표 의도를 확정하고;
상기 목표 의도에 따라, 미리 구성된 상기 의도 라이브러리를 검색하여, 상기 목표 의도가 위치한 계층 정보와 트리 정보를 확정하고;
상기 목표 의도가 위치한 계층 정보와 트리 정보, 상기 트리 정보에 대응되는 트리형 의도 집합에 따라, 상기 제1 추천 리스트를 획득하기 위한 것이다.
여기서, 제1 처리 모듈(902)은 구체적으로,
상기 목표 의도에 대응되는 초기 추천 리스트를 생성하고;
상기 목표 의도가 위치한 계층 정보와 트리 정보에 따라, 상기 목표 의도의 적어도 하나의 연관 의도를 확정하고;
동일 계층, 부속 계층, 트리 계층의 선후 순서에 따라, 상기 목표 의도의 적어도 하나의 연관 의도를 순차적으로 상기 초기 추천 리스트에 추가하여, 상기 제1 추천 리스트를 획득하기 위한 것이다.
본 출원의 실시예의 다른 가능한 설계에서, 제2 처리 모듈(903)은 구체적으로,
상기 사용자 식별자에 대응되는 의도 전략 정보를 확정하되, 상기 의도 전략 정보는 의도의 유효 범위 정보와 유효 순서 정보를 지시하고;
상기 의도 전략 정보에서 지시하는 의도의 유효 범위 정보에 따라, 상기 제1 추천 리스트 중의 유효한 의도 집합을 확정하고;
상기 의도 전략 정보에서 지시하는 의도의 유효 순서 정보에 따라, 상기 의도 집합 중의 모든 의도에 대해 정렬하여, 상기 목표 추천 리스트를 획득하기 위한 것이다.
본 출원의 실시예의 또 다른 가능한 설계에서, 제1 처리 모듈(902)은 또한, 협업 필터링 알고리즘에 기반하여 상기 의도 검색 요청과 미리 확정된 유사도 매트릭스에 대해 처리하여, 제2 추천 리스트를 획득하기 위한 것이고;
제2 처리 모듈(903)은 구체적으로, 상기 사용자 식별자에 대응되는 의도 전략 정보를 이용하여 상기 제1 추천 리스트 중의 의도 및 상기 제2 추천 리스트 중의 의도에 대해 처리하여, 상기 목표 추천 리스트를 획득하기 위한 것이다.
여기서, 상기 제2 추천 리스트는 사용자 행위 기반의 협업 필터링 알고리즘을 이용하여 상기 의도 검색 요청과 미리 확정된 사용자 행위 유사도 매트릭스에 대해 처리하여 획득된 것 및/또는 의도 기반의 협업 필터링 알고리즘을 이용하여 상기 의도 검색 요청과 미리 확정된 의도 유사도 매트릭스에 대해 처리하여 획득된 것이다 .
본 출원의 실시예의 또 다른 가능한 설계에서, 제1 처리 모듈(902)은 또한,
사용자 데이터 세트를 획득하고;
상기 사용자 데이터 세트에 따라, 사용자 행위 유사도 매트릭스 및/또는 의도 유사도 매트릭스를 생성하되, 상기 사용자 행위 유사도 매트릭스는 상기 사용자 데이터 세트에 관련된 사용자 사이의 행위 유사도를 표시하기 위한 것이고, 상기 의도 유사도 매트릭스는 상기 사용자 데이터 세트에 관련된 의도 사이의 유사도를 표시하기 위한 것이고;
상기 사용자 행위 유사도 매트릭스 및/또는 상기 의도 유사도 매트릭스를 저장하기 위한 것이다.
본 출원의 실시예에 따른 장치는, 도 2 내지 도 8에 도시된 실시예의 방법을 실행할 수 있으며, 그 구현 원리와 기술효과는 유하시기에 여기서는 중복 설명하지 않는다.
설명해야 할 바로는, 이상 장치의 각 모듈의 구분은 단지 논리 기능의 구분이며 실제적으로 구현 시 전부 또는 부분은 하나의 물리 개체 상에 집적될 수 있고, 물리적으로 분리될 수도 있다. 그리고 이런 모듈은 모두 처리 소자에 의해 스케줄링되는 소프트웨어 형식으로 구현될 수 있으며, 전부 하드웨어 형식으로 구현될 수도 있고, 부분 모듈은 처리 소자에 의해 스케줄링되는 소프트웨어 형식으로 구현되고 부분 모듈은 하드웨어 형식으로 구현될 수도 있다. 이외에 이런 모듈의 전부 또는 부분은 하나로 집적될 수 있고, 독립적으로 구현될 수도 있다. 여기에서 설명되는 처리 소자는 신호 처리 능력을 구비한 집적회로일 수 있다. 구현 과정에서, 상술한 방법의 각 단계 또는 상술한 각 모듈은 프로세서 소자 중의 하드웨어의 집적 논리 회로 또는 소프트웨어 형식의 명령으로 구현될 수 있다
본 출원의 실시예에 따르면, 본 출원은 컴퓨터 판독 가능 저장매체에 저장된 컴퓨터 프로그램을 제공하며, 전자기기의 적어도 하나의 프로세서는 컴퓨터 판독 가능 저장매체 중의 컴퓨터 프로그램을 판독하여 적어도 하나의 프로세서가 컴퓨터 프로그램을 실행하여 전자기기로 하여금 상술한 실시예에 따른 방법을 실행하도록 한다.
본 출원의 실시예에 따르면, 본 출원은 전자 기기와 판독 가능 저장매체를 더 제공한다.
도 10은 본 출원의 실시예에 따른 의도 추천 방법을 구현하기 위한 전자 기기의 블록도이다. 전자 기기는 다양한 형태의 디지털 컴퓨터, 예컨대, 랩톱 컴퓨터, 데스크톱 컴퓨터, 워크스테이션, 개인 정보 단말기, 서버, 블레이드 서버, 대형 컴퓨터, 및 기타 적합한 컴퓨터를 나타내기 위한 것이다. 전자기기는 다양한 형태의 이동장치, 예컨대, 개인 디지털 단말기, 셀폰, 스마트 폰, 웨어러블 기기 및 기타 유사한 컴퓨팅 장치를 더 나타낼 수 있다. 본문에 설명된 부재, 이들의 연결 및 관계, 및 이들의 기능은 단지 예시적인 것이며, 본문에 설명된 것 및/또는 요구하는 본 출원의 구현을 한정하려는 의도가 아니다.
도 10에 도시된 바와 같이, 해당 전자기기는 하나 또는 복수의 프로세서(1001), 메모리(1002), 및 각 부재를 연결시키기 위한 고속 인터페이스와 저속 인터페이스를 포함하는 인터페이스를 포함한다. 각각의 부재는 서로 다른 버스를 통해 서로 연결되며, 공통 메인보드에 장착되거나 수요에 따라 기타 방식으로 장착될 수 있다. 프로세서는 전자기기 내에서 실행되는 명령을 처리할 수 있으며, 메모리 내 또는 메모리 상에 저장되어 외부 입력/출력 장치(예컨대, 인터페이스에 커플링된 디스플레이 기기) 상에 그래픽 유저 인터페이스(Graphical User Interface, GUI)의 그래픽 정보를 표시하는 명령을 포함할 수 있다. 기타 실시형태에서, 수요에 따라, 복수의 프로세서 및/또는 복수의 버스와 복수의 메모리를 함께 사용할 수 있다. 마찬가지로, 복수의 전자기기를 연결할 수 있으며, 각각의 기기는 부분 필요한 조작을 제공한다(예를 들어, 서버 어레이, 한 세트의 블레이드 서버, 또는 멀티 프로세서 시스템으로서). 도 10은 하나의 프로세서(1001)를 예로 든다.
메모리(1002)는 바로 본 출원에 따른 비일시적 컴퓨터 판독 가능 저장매체이다. 여기서, 상기 메모리는 적어도 하나의 프로세서에 의해 실행될 수 있는 명령이 저장되어, 상기 적어도 하나의 프로세서가 본 출원의 실시예에 따른 의도 추천 방법을 수행하도록 한다. 본 출원의 비일시적 컴퓨터 판독 가능 저장매체는 컴퓨터 명령을 저장하고, 해당 컴퓨터 명령은 컴퓨터가 본 출원의 실시예에 따른 의도 추천 방법을 수행하도록 한다.
메모리(1002)는 비일시적 컴퓨터 판독 가능 저장매체로서, 비일시적 소프트웨어 프로그램, 비일시적 컴퓨터 실행 가능 프로그램 및 모듈, 예컨대 본 출원의 실시예에 따른 의도 추천 방법에 대응되는 프로그램 명령/모듈을 저장할 수 있다. 프로세서(1001)는 메모리(1002)에 저장된 비일시적 소프트웨어 프로그램, 명령 및 모듈을 실행하여, 서버의 다양한 기능 응용 및 데이터 처리를 수행한다. 즉, 상술한 방법 실시예 중 의도 추천 방법을 구현한다.
메모리(1002)는 프로그램 저장 영역과 데이터 저장 영역을 포함할 수 있다. 여기서, 프로그램 저장 영역은 운영체제, 적어도 하나의 기능에 필요한 응용 프로그램을 저장할 수 있다. 데이터 저장 영역은 의도 추천 전자기기의 사용에 따라 구축되는 데이터 등을 저장할 수 있다. 한편, 메모리(1002)는 고속 랜덤 액세스 메모리를 포함할 수 있고, 예를 들어 적어도 하나의 자기 저장장치, 플래시 메모리, 또는 기타 비일시적 솔리드 스테이트 저장장치와 같은 비일시적 메모리를 포함할 수도 있다. 일부 실시예에서, 메모리(1002)는 선택적으로 프로세서(1001)에 대해 원격으로 설치된 메모리를 포함할 수 있다. 이러한 원격 메모리는 네트워크를 통해 의도 추천 전자기기에 연결될 수 있다. 상술한 네트워크의 실예로서 인터넷, 인트라넷, 랜, 이동 통신망 및 그 조합을 포함하지만 이에 한정되지 않는다.
의도 추천 방법을 구현하기 위한 전자기기는 입력장치(1003)와 출력장치(1004)를 포함할 수 있다. 프로세서(1001), 메모리(1002), 입력장치(1003)와 출력장치(1004)는 버스 또는 기타 방식으로 연결될 수 있으며, 도 10에서는 버스를 통해 연결되는 것을 예시하고 있다.
입력장치(1003)는 입력되는 숫자 또는 문자 부호 정보를 수신할 수 있고, 의도 추천 전자기기의 사용자 설정 및 기능 제어에 대한 키 신호 입력을 생성할 수 있다. 예를 들어 터치 스크린, 키패드, 마우스, 트랙패드, 터치패널, 지시레버, 하나 또는 복수의 마우스 버튼, 트랙볼, 조종레버 등 입력장치를 포함할 수 있다. 출력장치(1004)는 디스플레이 기기, 보조 조명 장치(예를 들어, LED) 및 촉각 피드백 장치(예를 들어, 진동모터) 등을 포함할 수 있다. 해당 디스플레이 기기는, 액정 디스플레이(LCD), 발광 다이오드(LED) 디스플레이와 플라즈마 디스플레이 등을 포함할 수 있지만 이에 한정되지 않는다. 일부 실시형태에서, 디스플레이 기기는 터치 스크린일 수 있다.
여기에 기재되는 시스템 및 기술의 다양한 실시형태는 디지털 전자 회로 시스템, 집적 회로 시스템, 전용 ASIC(전용 집적 회로), 컴퓨터 하드웨어, 펌웨어, 소프트웨어, 및/또는 이들의 조합에서 구현될 수 있다. 이러한 다양한 실시형태는 하나 또는 복수의 컴퓨터 프로그램에서 구현되는 것을 포함할 수 있고, 해당 하나 또는 복수의 컴퓨터 프로그램은 적어도 하나의 프로그래머블 프로세서를 포함하는 프로그래머블 시스템 상에서 실행 및/또는 해석될 수 있으며, 해당 프로그래머블 프로세서는 전용 또는 범용 프로그래머블 프로세서일 수 있고, 저장 시스템, 적어도 하나의 입력장치, 및 적어도 하나의 출력장치로부터 데이터와 명령을 수신할 수 있으며, 데이터와 명령을 해당 저장 시스템, 해당 적어도 하나의 입력장치, 및 해당 적어도 하나의 출력장치로 전송한다.
이러한 컴퓨터 프로그램(프로그램, 소프트웨어, 소프트웨어 응용, 또는 코드라고도 불리운다)은 프로그래머블 프로세서의 기계적 명령을 포함하고, 고급 프로세스 및/또는 객체 지향 프로그래밍 언어, 및/또는 어셈블리/기계적 언어를 이용하여 이러한 컴퓨터 프로그램을 실행할 수 있다. 예컨대 본문에서 사용되는 용어 "기계 판독 가능 매체"와 "컴퓨터 판독 가능 매체"는 기계적 명령 및/또는 데이터를 프로그래머블 프로세서로 제공하기 위한 임의의 컴퓨터 프로그램 또는 데이터를 프로그래머블 프로세서로 제공하기 위한 임의의 컴퓨터 프로그램 제품, 기기, 및/또는 장치(예를 들어, 자기 디스크, 광 디스크, 메모리, 프로그래머블 논리 디바이스(PLD))를 가리키고, 기계 판독 가능 신호인 기계적 명령을 수신하는 기계 판독 가능 매체를 포함한다. 용어 "기계 판독 가능 신호"는 기계적 명령 및/또는 데이터를 프로그래머블 프로세서로 제공하기 위한 임의의 신호를 가리킨다.
사용자와의 인터랙션을 제공하기 위하여, 컴퓨터 상에서 여기에 기재되는 시스템 및 기술을 실시할 수 있으며, 해당 컴퓨터는 사용자에게 정보를 표시하기 위한 표시장치(예를 들어, CRT(캐소드레이 튜브) 또는 LCD(액정 디스플레이) 모니터); 및 키보드 지향 장치(예를 들어, 마우스 또는 트랙볼)를 구비하고, 사용자는 해당 키보드와 해당 지향장치를 통해 입력을 컴퓨터로 제공할 수 있다. 기타 종류의 장치는 또한 사용자와의 인터랙션을 제공할 수도 있다. 예를 들어, 사용자에게 제공되는 피드백은 임의의 형태의 센싱 피드백(예를 들어, 시각적 피드백, 청각적 피드백, 또는 촉각적 피드백)일 수 있고; 임의의 형태(사운드 입력, 음성 입력 또는 촉각 입력)을 통해 사용자로부터의 입력을 수신할 수 있다.
여기에 기재되는 시스템과 기술은 백그라운드 부재를 포함하는 컴퓨팅 시스템(예를 들어, 데이터 서버로서), 또는 중간부재를 포함하는 컴퓨팅 시스템(예를 들어, 응용 서버), 또는 프론트 엔드 부재를 포함하는 컴퓨팅 시스템(예를 들어, 그래픽 유저 인터페이스 또는 인터넷 브라우저를 구비하는 사용자 컴퓨터, 사용자는 해당 그래픽 유저 인터페이스 또는 해당 인터넷 브라우저를 통해 여기에 기재되는 시스템 및 기술의 실시방식과 인터랙션할 수 있다), 또는 이러한 백그라운드 부재, 중간 부재, 또는 프론트 엔드 부재를 포함하는 임의의 컴퓨팅 시스템에서 실시될 수 있다. 임의의 형태 또는 매체의 디지털 데이터 통신(예를 들어, 통신망)을 통해 시스템의 부재를 서로 연결시킬 수 있다. 통신망의 예시로서, 랜(LAN), 광역 통신망(WAN) 및 인터넷을 포함한다.
컴퓨팅 시스템은 클라이언트와 서버를 포함할 수 있다. 클라이언트와 서버는 일반적으로 서로 멀리 떨어져 있으며 통상적으로 통신망을 통해 인터랙션한다. 상응한 컴퓨터 상에서 실행되며 서로 클라이언트-서버 관계를 가지는 컴퓨터 프로그램을 통해 클라이언트와 서버의 관계를 생성한다.
본 출원의 실시예는 의도 추천 방법을 더 제공하며 상기 방법은,
수신된 의도 검색 요청과 의도 유형 규칙에 따라, 제1 추천 리스트를 확정하는 단계;
기설정된 의도 개입 전략을 이용하여 상기 제1 추천 리스트 중의 의도에 대해 처리하여, 목표 추천 리스트를 획득하는 단계를 포함한다.
본 출원의 실시예의 기술 방안은, 수신된 의도 검색 요청과 의도 유형 규칙에 따라, 제1 추천 리스트를 확정하되, 기설정된 의도 개입 전략을 이용하여 상기 제1 추천 리스트 중의 의도에 대해 처리하여, 목표 추천 리스트를 획득하고, 의도 검색 요청과의 관련성이 보다 높은 의도를 확정할 수 있으며, 사용자 식별자 기반 의도 전략 정보는 개성화 추천 결과를 향상시킬 수 있기에, 의도 추천의 정확도와 개성화 정밀도를 향상시킨다.
상술한 다양한 형태의 프로세스를 사용하여 단계를 재배열, 추가 또는 삭제할 수 있음을 이해해야 한다. 예를 들어, 본 출원에 기재된 각 단계는 병열로 수행될 수 있고 순차적으로 수행될 수도 있고 서로 다른 순서로 수행될 수도 있으며, 본 출원의 기술적 해결수단이 원하는 결과를 얻을 수만 있다면, 본문에서는 여기서 한정하지 않는다.
상술한 구체적인 실시형태는, 본 출원의 보호범위에 대한 한정이 아니다. 본 분야의 통상의 지식을 가진 자라면, 설계 수요와 기타 요소를 기초로, 다양한 수정, 조합, 서브 조합 및 대체를 가할 수 있음을 이해할 수 있을 것이다. 본 출원의 정신과 원칙 내에서 이루어진 모든 수정, 동등한 치환 등은 모두 본 출원의 보호 범위 내에 속한다.

Claims (18)

  1. 의도 키워드와 사용자 식별자가 적재된 의도 검색 요청을 수신하는 단계;
    상기 의도 키워드와 미리 구성된 의도 라이브러리에 따라, 제1 추천 리스트를 확정하되, 상기 의도 라이브러리는 적어도 하나의 트리형 의도 집합을 포함하고, 각 트리형 의도 집합은 적어도 하나의 계층 의도를 포함하는 단계;
    상기 사용자 식별자에 대응되는 의도 전략 정보를 이용하여 상기 제1 추천 리스트 중의 의도에 대해 처리하여, 목표 추천 리스트를 획득하는 단계;
    상기 목표 추천 리스트를 출력하는 단계를 포함하고,
    상기 사용자 식별자에 대응되는 의도 전략 정보를 이용하여 상기 제1 추천 리스트 중의 의도에 대해 처리하여, 목표 추천 리스트를 획득하는 상기 단계는,
    상기 사용자 식별자에 대응되는 의도 전략 정보를 확정하되, 상기 의도 전략 정보는 의도의 유효 범위 정보와 유효 순서 정보를 지시하기 위한 것인 단계;
    상기 의도 전략 정보에서 지시하는 의도의 유효 범위 정보에 따라, 상기 제1 추천 리스트 중의 유효한 의도 집합을 확정하는 단계;
    상기 의도 전략 정보에서 지시하는 의도의 유효 순서 정보에 따라, 상기 의도 집합 중의 모든 의도에 대해 정렬하여, 상기 목표 추천 리스트를 획득하는 단계를 포함하는 의도 추천 방법.
  2. 제1항에 있어서,
    상기 의도 키워드와 미리 구성된 의도 라이브러리에 따라, 제1 추천 리스트를 확정하는 상기 단계는,
    상기 의도 키워드에 대하여 시맨틱 분석을 수행하여, 상기 사용자 식별자에 대응되는 사용자의 목표 의도를 확정하는 단계;
    상기 목표 의도에 따라, 미리 구성된 상기 의도 라이브러리를 검색하여, 상기 목표 의도가 위치한 계층 정보와 트리 정보를 확정하는 단계;
    상기 목표 의도가 위치한 계층 정보와 트리 정보 및 상기 트리 정보에 대응되는 트리형 의도 집합에 따라, 상기 제1 추천 리스트를 획득하는 단계를 포함하는 방법.
  3. 제2항에 있어서,
    상기 목표 의도가 위치한 계층 정보와 트리 정보 및 상기 트리 정보에 대응되는 트리형 의도 집합에 따라, 상기 제1 추천 리스트를 획득하는 상기 단계는,
    상기 목표 의도에 대응되는 초기 추천 리스트를 생성하는 단계;
    상기 목표 의도가 위치한 계층 정보와 트리 정보에 따라, 상기 목표 의도의 적어도 하나의 연관 의도를 확정하는 단계;
    동일 계층, 부속 계층, 트리 계층의 선후 순서에 따라, 상기 목표 의도의 적어도 하나의 연관 의도를 순차적으로 상기 초기 추천 리스트에 추가하여, 상기 제1 추천 리스트를 획득하는 단계를 포함하는 방법.
  4. 삭제
  5. 제1항에 있어서, 상기 방법은,
    협업 필터링 알고리즘에 기반하여 상기 의도 검색 요청과 미리 확정된 유사도 매트릭스에 대해 처리하여, 제2 추천 리스트를 획득하는 단계를 더 포함하고;
    상기 사용자 식별자에 대응되는 의도 전략 정보를 이용하여 상기 제1 추천 리스트 중의 의도에 대해 처리하여, 목표 추천 리스트를 획득하는 상기 단계는,
    상기 사용자 식별자에 대응되는 의도 전략 정보를 이용하여 상기 제1 추천 리스트 중의 의도 및 상기 제2 추천 리스트 중의 의도에 대해 처리하여, 상기 목표 추천 리스트를 획득하는 단계를 포함하는 방법.
  6. 제5항에 있어서,
    상기 제2 추천 리스트는 사용자 행위 기반의 협업 필터링 알고리즘을 이용하여 상기 의도 검색 요청과 미리 확정된 사용자 행위 유사도 매트릭스에 대해 처리하여 획득된 것, 및/또는, 의도 기반의 협업 필터링 알고리즘을 이용하여 상기 의도 검색 요청과 미리 확정된 의도 유사도 매트릭스에 대해 처리하여 획득된 것인 방법.
  7. 제5항에 있어서, 상기 방법은,
    사용자 데이터 세트를 획득하는 단계;
    상기 사용자 데이터 세트에 따라, 사용자 행위 유사도 매트릭스 및/또는 의도 유사도 매트릭스를 생성하되, 상기 사용자 행위 유사도 매트릭스는 상기 사용자 데이터 세트에 관련된 사용자 사이의 행위 유사도를 표시하기 위한 것이고, 상기 의도 유사도 매트릭스는 상기 사용자 데이터 세트에 관련된 의도 사이의 유사도를 표시하기 위한 것인 단계;
    상기 사용자 행위 유사도 매트릭스 및/또는 상기 의도 유사도 매트릭스를 저장하는 단계를 더 포함하는 방법.
  8. 수신 모듈, 제1 처리 모듈, 제2 처리 모듈과 출력 모듈을 포함하고;
    상기 수신 모듈은, 의도 키워드와 사용자 식별자가 적재된 의도 검색 요청을 수신하기 위한 것이고;
    상기 제1 처리 모듈은, 상기 의도 키워드와 미리 구성된 의도 라이브러리에 따라, 제1 추천 리스트를 확정하기 위한 것이며, 상기 의도 라이브러리는 적어도 하나의 트리형 의도 집합을 포함하고, 각 트리형 의도 집합은 적어도 하나의 계층 의도를 포함하고;
    상기 제2 처리 모듈은, 상기 사용자 식별자에 대응되는 의도 전략 정보를 이용하여 상기 제1 추천 리스트 중의 의도에 대해 처리하여, 목표 추천 리스트를 획득하기 위한 것이고;
    상기 출력 모듈은, 상기 목표 추천 리스트를 출력하기 위한 것이고,
    상기 제2 처리 모듈은 구체적으로,
    상기 사용자 식별자에 대응되는 의도 전략 정보를 확정하되, 상기 의도 전략 정보는 의도의 유효 범위 정보와 유효 순서 정보를 지시하고,
    상기 의도 전략 정보에서 지시하는 의도의 유효 범위 정보에 따라, 상기 제1 추천 리스트 중의 유효한 의도 집합을 확정하고;
    상기 의도 전략 정보에서 지시하는 의도의 유효 순서 정보에 따라, 상기 의도 집합 중의 모든 의도에 대해 정렬하여, 상기 목표 추천 리스트를 획득하기 위한 것인 의도 추천 장치.
  9. 제8항에 있어서,
    상기 제1 처리 모듈은 구체적으로,
    상기 의도 키워드에 대하여 시맨틱 분석을 수행하여, 상기 사용자 식별자에 대응되는 사용자의 목표 의도를 확정하고;
    상기 목표 의도에 따라, 미리 구성된 상기 의도 라이브러리를 검색하여, 상기 목표 의도가 위치한 계층 정보와 트리 정보를 확정하고;
    상기 목표 의도가 위치한 계층 정보와 트리 정보, 상기 트리 정보에 대응되는 트리형 의도 집합에 따라, 상기 제1 추천 리스트를 획득하기 위한 것인 장치.
  10. 제9항에 있어서,
    상기 제1 처리 모듈은 구체적으로,
    상기 목표 의도에 대응되는 초기 추천 리스트를 생성하고;
    상기 목표 의도가 위치한 계층 정보와 트리 정보에 따라, 상기 목표 의도의 적어도 하나의 연관 의도를 확정하고;
    동일 계층, 부속 계층, 트리 계층의 선후 순서에 따라, 상기 목표 의도의 적어도 하나의 연관 의도를 순차적으로 상기 초기 추천 리스트에 추가하여, 상기 제1 추천 리스트를 획득하기 위한 것인 장치.
  11. 삭제
  12. 제8항에 있어서,
    상기 제1 처리 모듈은 또한, 협업 필터링 알고리즘에 기반하여 상기 의도 검색 요청과 미리 확정된 유사도 매트릭스에 대해 처리하여, 제2 추천 리스트를 획득하기 위한 것이고;
    상기 제2 처리 모듈은 구체적으로, 상기 사용자 식별자에 대응되는 의도 전략 정보를 이용하여 상기 제1 추천 리스트 중의 의도 및 상기 제2 추천 리스트 중의 의도에 대해 처리하여, 상기 목표 추천 리스트를 획득하기 위한 것인 장치.
  13. 제12항에 있어서,
    상기 제2 추천 리스트는 사용자 행위 기반의 협업 필터링 알고리즘을 이용하여 상기 의도 검색 요청과 미리 확정된 사용자 행위 유사도 매트릭스에 대해 처리하여 획득된 것, 및/또는, 의도 기반의 협업 필터링 알고리즘을 이용하여 상기 의도 검색 요청과 미리 확정된 의도 유사도 매트릭스에 대해 처리하여 획득된 것인 장치.
  14. 제12항에 있어서,
    상기 제1 처리 모듈은 또한,
    사용자 데이터 세트를 획득하고;
    상기 사용자 데이터 세트에 따라, 사용자 행위 유사도 매트릭스 및/또는 의도 유사도 매트릭스를 생성하되, 상기 사용자 행위 유사도 매트릭스는 상기 사용자 데이터 세트에 관련된 사용자 사이의 행위 유사도를 표시하기 위한 것이고, 상기 의도 유사도 매트릭스는 상기 사용자 데이터 세트에 관련된 의도 사이의 유사도를 표시하기 위한 것이고;
    상기 사용자 행위 유사도 매트릭스 및/또는 상기 의도 유사도 매트릭스를 저장하기 위한 것인 장치.
  15. 적어도 하나의 프로세서; 및
    상기 적어도 하나의 프로세서와 통신 연결되는 메모리;를 포함하고,
    상기 메모리에 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령이 저장되고, 상기 명령은 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서가 제1항 내지 제3항, 제5항 내지 제7항 중 어느 한 항에 따른 방법을 수행할 수 있도록 하는 전자기기.
  16. 컴퓨터 명령이 저장된 비일시적 컴퓨터 판독 가능 저장매체에 있어서, 상기 컴퓨터 명령은 컴퓨터가 제1항 내지 제3항, 제5항 내지 제7항 중 어느 한 항에 따른 방법을 수행하도록 하는 것을 특징으로 하는 비일시적 컴퓨터 판독 가능 저장매체.
  17. 삭제
  18. 컴퓨터 판독 가능 저장매체에 저장된 컴퓨터 프로그램에 있어서,
    상기 컴퓨터 프로그램이 프로세서에 의해 실행될 경우, 제1항 내지 제3항, 제5항 내지 제7항 중 임의의 한 항에 따른 방법을 수행하도록 하는 컴퓨터 판독 가능 저장매체에 저장된 컴퓨터 프로그램.
KR1020210036066A 2020-06-29 2021-03-19 의도 추천 방법, 장치, 기기 및 저장매체 KR102591421B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010604365.0 2020-06-29
CN202010604365.0A CN111782965B (zh) 2020-06-29 2020-06-29 意图推荐方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
KR20210038860A KR20210038860A (ko) 2021-04-08
KR102591421B1 true KR102591421B1 (ko) 2023-10-18

Family

ID=72760186

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210036066A KR102591421B1 (ko) 2020-06-29 2021-03-19 의도 추천 방법, 장치, 기기 및 저장매체

Country Status (5)

Country Link
US (1) US11580104B2 (ko)
EP (1) EP3819792A3 (ko)
JP (1) JP7201730B2 (ko)
KR (1) KR102591421B1 (ko)
CN (1) CN111782965B (ko)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112231577B (zh) * 2020-11-06 2022-06-03 重庆理工大学 一种融合文本语义向量和神经协同过滤的推荐方法
CN112685546B (zh) * 2020-12-29 2023-10-31 王福山 人机多轮对话方法、装置及计算机可读存储介质
WO2022154403A1 (ko) * 2021-01-12 2022-07-21 삼성전자 주식회사 검색어를 제공하는 방법 및 이를 지원하는 전자 장치
US11816137B2 (en) 2021-01-12 2023-11-14 Samsung Electronics Co., Ltd Method for providing search word and electronic device for supporting the same
US11592973B2 (en) 2021-01-27 2023-02-28 Paypal, Inc. Goal-based dynamic modifications to user interface content
CN112764128B (zh) * 2021-03-16 2023-07-28 北京墨迹风云科技股份有限公司 显示天气数据的方法、服务器、计算机设备及可读介质
CN113126765A (zh) * 2021-04-22 2021-07-16 北京云迹科技有限公司 一种多模态输入交互方法、装置、机器人和存储介质
CN113434643A (zh) * 2021-05-20 2021-09-24 华为技术有限公司 一种信息推荐方法以及相关设备
CN113157892A (zh) * 2021-05-24 2021-07-23 中国平安人寿保险股份有限公司 用户意图处理方法、装置、计算机设备及存储介质
CN113360218B (zh) * 2021-06-16 2024-06-07 抖音视界有限公司 一种业务方案选择方法、装置、设备以及存储介质
CN113434633B (zh) * 2021-06-28 2022-09-16 平安科技(深圳)有限公司 基于头像的社交话题推荐方法、装置、设备及存储介质
CN113408920B (zh) * 2021-06-29 2024-01-12 北京百度网讯科技有限公司 迁徙方式确定方法、装置、设备以及存储介质
CN113722322A (zh) * 2021-08-30 2021-11-30 咪咕数字传媒有限公司 信息流数据生成方法、装置及电子设备
CN113947290A (zh) * 2021-09-26 2022-01-18 海南电网有限责任公司 基于人工智能的配网可研评审辅助方法及系统
CN116419293A (zh) * 2021-12-29 2023-07-11 华为技术有限公司 意图冲突处理的方法及其装置
CN114647756A (zh) * 2022-03-11 2022-06-21 北京百度网讯科技有限公司 基于图像的搜索方法、装置、电子设备及存储介质
CN114493377B (zh) * 2022-04-06 2022-07-12 广州平云小匠科技有限公司 一种工单派单方法及系统
CN114791915B (zh) * 2022-06-22 2022-09-27 深圳高灯计算机科技有限公司 数据归集方法、装置、计算机设备和存储介质
CN115167161A (zh) * 2022-06-27 2022-10-11 青岛海尔科技有限公司 灯具关联关系的确定方法和装置、存储介质及电子装置
US12010075B2 (en) * 2022-06-29 2024-06-11 Chime Financial, Inc. Utilizing machine learning models to generate interactive digital text threads with personalized digital text reply options
CN115203598B (zh) * 2022-07-20 2023-09-19 贝壳找房(北京)科技有限公司 房产领域的信息排序方法、电子设备及存储介质
CN115457979A (zh) * 2022-09-22 2022-12-09 赵显阳 一种视频语音分析识别处理方法及系统
CN117972184A (zh) * 2022-10-24 2024-05-03 中兴通讯股份有限公司 用户偏好分析方法及装置
US11936814B1 (en) 2022-11-22 2024-03-19 Chime Financial, Inc. Utilizing machine learning models to generate interactive digital text threads with personalized agent escalation digital text reply options
CN116244413B (zh) * 2022-12-27 2023-11-21 北京百度网讯科技有限公司 新意图确定方法、设备和存储介质
CN116595249B (zh) * 2023-04-28 2024-03-22 广东津虹数字科技有限公司 个性推荐方法、系统、电子设备以及计算机程序产品
CN116823410B (zh) * 2023-08-29 2024-01-12 阿里巴巴(成都)软件技术有限公司 数据处理方法、对象处理方法、推荐方法及计算设备
CN117573896A (zh) * 2023-12-05 2024-02-20 苏州中格软件有限公司 基于意图识别的事项筛查方法、平台、设备及存储介质
CN117455631A (zh) * 2023-12-20 2024-01-26 浙江口碑网络技术有限公司 信息展示方法及系统
CN117892000A (zh) * 2024-01-17 2024-04-16 湖北旭志信息技术有限公司 基于用户特征的云数据统筹管理系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942204A (zh) * 2013-01-18 2014-07-23 佳能株式会社 用于挖掘意图的方法和设备
JP2017097914A (ja) * 2017-01-30 2017-06-01 株式会社エヌ・ティ・ティ・データ マーケティング装置、マーケティング方法およびプログラム
US20190197185A1 (en) * 2017-12-22 2019-06-27 Sap Se Intelligent natural language query processor

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130117367A1 (en) 2009-10-26 2013-05-09 Nec Corporation Content recommendation system, recommendation method and information recording medium recording recommendation program
US9460237B2 (en) 2012-05-08 2016-10-04 24/7 Customer, Inc. Predictive 411
US20140019285A1 (en) * 2012-07-13 2014-01-16 Venkateswaran Subramanian Karthik Dynamic Listing Recommendation
US11023947B1 (en) * 2013-03-15 2021-06-01 Overstock.Com, Inc. Generating product recommendations using a blend of collaborative and content-based data
US9367880B2 (en) * 2013-05-03 2016-06-14 Facebook, Inc. Search intent for queries on online social networks
CN105159977B (zh) 2015-08-27 2019-01-25 百度在线网络技术(北京)有限公司 信息交互处理方法及装置
US20170250930A1 (en) * 2016-02-29 2017-08-31 Outbrain Inc. Interactive content recommendation personalization assistant
JP6806879B2 (ja) 2016-08-16 2021-01-06 イーベイ インク.Ebay Inc. 次のユーザプロンプトタイプの選択
US10891673B1 (en) * 2016-12-22 2021-01-12 A9.Com, Inc. Semantic modeling for search
US11048764B2 (en) * 2016-12-30 2021-06-29 Verizon Media Inc. Managing under—and over-represented content topics in content pools
CN110020140B (zh) * 2017-11-15 2023-02-21 腾讯科技(深圳)有限公司 推荐内容显示方法、装置及系统
CN108536852B (zh) * 2018-04-16 2021-07-23 上海智臻智能网络科技股份有限公司 问答交互方法和装置、计算机设备及计算机可读存储介质
KR102607666B1 (ko) * 2018-08-08 2023-11-29 삼성전자 주식회사 전자 장치에서 사용자 의도 확인을 위한 피드백 제공 방법 및 장치
US10963316B2 (en) * 2019-03-25 2021-03-30 Flaist, Inc. Artificial intelligence-powered cloud for the financial services industry
CN110162776A (zh) * 2019-03-26 2019-08-23 腾讯科技(深圳)有限公司 交互消息处理方法、装置、计算机设备和存储介质
US10996944B2 (en) * 2019-05-06 2021-05-04 Red Hat, Inc. Automated software selection using matrix factorization
US11526801B2 (en) * 2019-05-30 2022-12-13 International Business Machines Corporation Conversational search in content management systems
CN110377716B (zh) * 2019-07-23 2022-07-12 百度在线网络技术(北京)有限公司 对话的交互方法、装置及计算机可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942204A (zh) * 2013-01-18 2014-07-23 佳能株式会社 用于挖掘意图的方法和设备
JP2017097914A (ja) * 2017-01-30 2017-06-01 株式会社エヌ・ティ・ティ・データ マーケティング装置、マーケティング方法およびプログラム
US20190197185A1 (en) * 2017-12-22 2019-06-27 Sap Se Intelligent natural language query processor

Also Published As

Publication number Publication date
EP3819792A2 (en) 2021-05-12
KR20210038860A (ko) 2021-04-08
CN111782965B (zh) 2023-08-11
EP3819792A3 (en) 2021-10-06
US11580104B2 (en) 2023-02-14
JP7201730B2 (ja) 2023-01-10
US20210209109A1 (en) 2021-07-08
JP2021108183A (ja) 2021-07-29
CN111782965A (zh) 2020-10-16

Similar Documents

Publication Publication Date Title
KR102591421B1 (ko) 의도 추천 방법, 장치, 기기 및 저장매체
US11640494B1 (en) Systems and methods for construction, maintenance, and improvement of knowledge representations
US9535902B1 (en) Systems and methods for entity resolution using attributes from structured and unstructured data
US11670288B1 (en) Generating predicted follow-on requests to a natural language request received by a natural language processing system
US10725981B1 (en) Analyzing big data
Oussalah et al. A software architecture for Twitter collection, search and geolocation services
US11886430B1 (en) Intent-based natural language processing system
US20230333919A1 (en) Flexible and scalable artificial intelligence and analytics platform with advanced content analytics and data ingestion
US9361320B1 (en) Modeling big data
Doyle et al. Forecasting significant societal events using the embers streaming predictive analytics system
Mottaghinia et al. A review of approaches for topic detection in Twitter
US20210342541A1 (en) Stable identification of entity mentions
US11475053B1 (en) Providing completion recommendations for a partial natural language request received by a natural language processing system
WO2016200667A1 (en) Identifying relationships using information extracted from documents
US20180227352A1 (en) Distributed applications and related protocols for cross device experiences
Zhu et al. A five-layer architecture for big data processing and analytics
Kim et al. TwitterTrends: a spatio-temporal trend detection and related keywords recommendation scheme
CN111400456A (zh) 资讯推荐方法及装置
Ali et al. A state of art survey for big data processing and nosql database architecture
US9984108B2 (en) Database joins using uncertain criteria
US11314793B2 (en) Query processing
CN111753199B (zh) 用户画像构建方法及设备、电子设备和介质
CN114428834A (zh) 检索方法、装置、电子设备及存储介质
Li [Retracted] An Advertising Recommendation Algorithm Based on Deep Learning Fusion Model
US20160162572A1 (en) Alerting system based on newly disambiguated features

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant