KR102258484B1 - 쿼리를 처리하는 방법, 장치 및 컴퓨터 판독가능 매체 - Google Patents

쿼리를 처리하는 방법, 장치 및 컴퓨터 판독가능 매체 Download PDF

Info

Publication number
KR102258484B1
KR102258484B1 KR1020190158016A KR20190158016A KR102258484B1 KR 102258484 B1 KR102258484 B1 KR 102258484B1 KR 1020190158016 A KR1020190158016 A KR 1020190158016A KR 20190158016 A KR20190158016 A KR 20190158016A KR 102258484 B1 KR102258484 B1 KR 102258484B1
Authority
KR
South Korea
Prior art keywords
target candidate
candidate entity
entity
query
determining
Prior art date
Application number
KR1020190158016A
Other languages
English (en)
Other versions
KR20200102334A (ko
Inventor
지아준 루
즈난 린
Original Assignee
베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. filed Critical 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Publication of KR20200102334A publication Critical patent/KR20200102334A/ko
Application granted granted Critical
Publication of KR102258484B1 publication Critical patent/KR102258484B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/83Querying
    • G06F16/835Query processing
    • G06F16/8373Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Abstract

본 개시는 쿼리를 처리하는 방법을 제공하는바, 당해 방법은, 수신된, 문자열을 포함하는 쿼리 요청에 따라 쿼리 피드백을 결정하는 단계; 쿼리 피드백, 문자열 및 미리 설정된 지식 베이스에 따라 목표 후보 엔티티 집합을 결정하는 단계; 목표 후보 엔티티 집합 중의 각 목표 후보 엔티티를 평가하여 평가 결과를 획득하는 단계; 및 각 목표 후보 엔티티의 평가 결과에 따라 각 목표 후보 엔티티의 유형을 결정하는 단계; 를 포함한다. 당해 방법은 사용자에 의하여 입력되는 쿼리의 유형을 정확하게 판단하는 기술 효과 및 사용자의 검색 비용을 절감하고 리콜률을 향상시키는 기술효과를 구현한다. 본 개시는 쿼리를 처리하는 장치, 컴퓨터 판독가능 매체를 더 제공한다.

Description

쿼리를 처리하는 방법, 장치 및 컴퓨터 판독가능 매체{QUERY PROCESSING METHOD, DEVICE, AND COMPUTER READABLE MEDIUM}
본 개시의 실시예는 인공 지능 기술 분야에 관한 것으로, 특히 쿼리를 처리하는 방법, 장치 및 컴퓨터 판독가능 매체에 관한 것이다.
최근 몇 년 동안, 인공 지능 기술이 발전됨에 따라, 컴퓨터의 자연어 이해에 있어서 응용 가치가 있는 수많은 성과가 취득되었다.
의미와 문장구조의 다양성과 복잡성으로 인해, 텍스트에 대한 직접적인 추출에는 일정한 어려움이 있게 된다. 종래 기술에서의 기존 방법은, 많이는 텍스트에서 키워드를 추출하는 것이 위주이고, 주로 통계적 분석에 의한 방법과 의미 분석에 의한 방법으로 나뉜다.
본 개시의 실시예는 쿼리를 처리하는 방법, 장치 및 컴퓨터 판독가능 매체를 제공한다.
본 개시의 실시예의 일 측면에 따르면, 본 개시의 실시예는 쿼리를 처리하는 방법을 제공하는바, 당해 방법은,
수신된, 문자열을 포함하는 쿼리 요청에 따라 쿼리 피드백을 결정하는 단계;
상기 쿼리 피드백, 상기 문자열 및 미리 설정된 지식 베이스에 따라 목표 후보 엔티티(Entity) 집합을 결정하는 단계;
상기 목표 후보 엔티티 집합 중의 각 목표 후보 엔티티를 평가하여 평가 결과를 획득하는 단계 - 하나의 상기 목표 후보 엔티티가 하나의 평가 결과에 대응됨 - ; 및
각 상기 목표 후보 엔티티의 평가 결과에 따라 각 상기 목표 후보 엔티티의 유형을 결정하는 단계; 를 포함한다.
일부 실시예에서, 상기 쿼리 피드백, 상기 문자열 및 미리 설정된 지식 베이스에 따라 목표 후보 엔티티 집합을 결정하는 단계는,
상기 쿼리 피드백과 상기 문자열에 따라 제1 후보 엔티티 서브집합을 결정하는 단계;
상기 문자열에 따라 상기 지식 베이스에서 제2 후보 엔티티 서브집합을 결정하는 단계; 및
상기 제1 후보 엔티티 서브집합과 상기 제2 후보 엔티티 서브집합에 따라 상기 목표 후보 엔티티 집합을 결정하는 단계; 를 포함한다.
일부 실시예에서, 상기 목표 후보 엔티티 집합 중의 각 목표 후보 엔티티를 평가하는 단계는,
상기 목표 후보 엔티티 집합과 상기 쿼리 피드백을 각각 이중 경로 모델에 입력하여, 각 목표 후보 엔티티에 대응되는 평가 결과를 획득하는 단계를 포함한다.
일부 실시예에서, 상기 각 상기 목표 후보 엔티티의 평가 결과에 따라 각 상기 목표 후보 엔티티의 유형을 결정하는 단계는,
각 상기 목표 후보 엔티티의 평가 결과를 각각 미리 설정된 결과와 비교하는 단계; 및
목표 후보 엔티티의 평가 결과가 상기 미리 설정된 결과보다 좋은 조건 또는 목표 후보 엔티티의 평가 결과가 상기 미리 설정된 결과와 같은 조건 중의 적어도 하나를 충족시키는 상응한 목표 후보 엔티티를 상기 제1 유형의 엔티티로 결정하는 단계; 를 포함한다.
일부 실시예에서, 상기 각 상기 목표 후보 엔티티의 평가 결과를 각각 미리 설정된 결과와 비교하는 단계 이후,
상기 미리 설정된 결과보다 열등한 평가 결과에 대응되는 목표 후보 엔티티를 제2 유형의 엔티티로 결정하는 단계를 더 포함한다.
일부 실시예에서, 목표 후보 엔티티의 평가 결과가 상기 미리 설정된 결과보다 좋은 조건 또는 목표 후보 엔티티의 평가 결과가 상기 미리 설정된 결과와 같은 조건 중의 적어도 하나를 충족시키는 상응한 목표 후보 엔티티를 상기 제1 유형의 엔티티로 결정하는 단계 이후,
각 상기 목표 후보 엔티티에 대응되는 평가 결과와 상기 목표 후보 엔티티 집합에 따라, 상기 쿼리 요청에 대응되는 검색 의도 엔티티를 결정하는 단계를 더 포함한다.
일부 실시예에서, 상기 각 상기 목표 후보 엔티티에 대응되는 평가 결과와 상기 목표 후보 엔티티 집합에 따라, 상기 쿼리 요청에 대응되는 검색 의도 엔티티를 결정하는 단계는,
상기 각 목표 후보 엔티티에 대응되는 평가 결과로부터 가장 좋은 평가 결과를 선택하는 단계; 및
상기 가장 좋은 평가 결과에 대응되는 목표 후보 엔티티를 상기 검색 의도 엔티티로 결정하는 단계; 를 포함한다.
일부 실시예에서, 상기 쿼리 피드백은 뉴스, 정보, 연관 검색, 백과 사전 및 티에바(Tieba) 중의 하나 또는 복수를 포함한다.
본 개시의 실시예의 다른 측면에 따르면, 본 개시의 실시예는 쿼리를 처리하는 장치를 더 제공하는바, 당해 장치는,
수신된, 문자열을 포함하는 쿼리 요청에 따라 쿼리 피드백을 결정하는 검색 모듈;
상기 쿼리 피드백, 상기 문자열 및 미리 설정된 지식 베이스에 따라 목표 후보 엔티티 집합을 결정하는 집합 결정 모듈;
상기 목표 후보 엔티티 집합 중의 각 목표 후보 엔티티를 평가하여 평가 결과를 획득하는 평가 모듈 - 하나의 상기 목표 후보 엔티티가 하나의 평가 결과에 대응됨 - ; 및
각 상기 목표 후보 엔티티의 평가 결과에 따라 각 상기 목표 후보 엔티티의 유형을 결정하는 유형 구분 모듈; 을 포함한다.
일부 실시예에서, 상기 집합 결정 모듈은,
상기 쿼리 피드백과 상기 문자열에 따라 제1 후보 엔티티 서브집합을 결정하고;
상기 문자열에 따라 상기 지식 베이스에서 제2 후보 엔티티 서브집합을 결정하고;
상기 제1 후보 엔티티 서브집합과 상기 제2 후보 엔티티 서브집합에 따라 상기 목표 후보 엔티티 집합을 결정한다.
일부 실시예에서, 상기 평가 모듈은, 상기 목표 후보 엔티티 집합과 상기 쿼리 피드백을 각각 이중 경로 모델에 입력하여, 각 목표 후보 엔티티에 대응되는 평가 결과를 획득한다.
일부 실시예에서, 상기 유형 구분 모듈은,
각 상기 목표 후보 엔티티의 평가 결과를 각각 미리 설정된 결과와 비교하고;
목표 후보 엔티티의 평가 결과가 상기 미리 설정된 결과보다 좋은 조건 또는 목표 후보 엔티티의 평가 결과가 상기 미리 설정된 결과와 같은 조건 중의 적어도 하나를 충족시키는 상응한 목표 후보 엔티티를 상기 제1 유형의 엔티티로 결정한다.
일부 실시예에서, 상기 유형 구분 모듈은,
상기 미리 설정된 결과보다 열등한 평가 결과에 대응되는 목표 후보 엔티티를 제2 유형의 엔티티로 결정한다.
일부 실시예에서, 상기 유형 구분 모듈은 또한,
각 상기 목표 후보 엔티티의 평가 결과와 상기 목표 후보 엔티티 집합에 따라, 상기 쿼리 요청에 대응되는 검색 의도 엔티티를 결정한다.
일부 실시예에서, 상기 유형 구분 모듈은,
상기 각 목표 후보 엔티티에 대응되는 평가 결과로부터 가장 좋은 평가 결과를 선택하고;
상기 가장 좋은 평가 결과에 대응되는 목표 후보 엔티티를 상기 검색 의도 엔티티로 결정한다.
본 개시의 실시예의 다른 측면에 따르면, 본 개시의 실시예는 컴퓨터 프로그램이 저장되어 있는 컴퓨터 판독가능 매체를 더 제공하는바, 상기 프로그램이 프로세서에 의해 실행되는 경우, 상기 방법이 구현된다.
본 개시의 실시예에 의하여 제공되는 기술안은, 쿼리(Query)의 유형을 판단할 수 있고 사용자에 의해 입력되는 쿼리의 의도를 정확하게 결정할 수 있는바, 진행할 쿼리의 비용을 절감하고, 예를 들어, 계산 자원, 네트워크 자원, 쿼리 시간 등을 절약함으로써 사용자 경험(User Experience)을 향상시킨다.
구체적으로, 본 개시의 실시예에 따라 적용되는 목표 후보 엔티티 집합을 획득하는 방안은, 쿼리 피드백과 지식 베이스 등의 특징을 결합하므로 쿼리에 대응되는 목표 후보 엔티티를 정확하게 선택할 수 있다. 또한, 본 개시의 실시예에 따라 적용되는 각 목표 후보 엔티티의 평가 결과를 획득하는 방안은, 고효율적이고 정확하게 각 목표 후보 엔티티를 평가하는 것을 구현할 수 있고, 나아가 쿼리의 유형을 정확하게 판단하는 기술 효과를 구현할 수 있다. 쿼리의 유형을 정확하게 구분할 수 있으므로 나아가 검색 효율을 향상시키고 사용자의 검색 비용을 절감시킬 수 있다. 또한, 쿼리의 유형을 정확하게 판단할 수 있으므로 사용자한테 푸시되는 결과의 정확성을 향상시킬 수 있고 리콜률을 향상시킨다.
첨부 도면은 본 개시의 실시예에 대한 한층 심화된 이해를 제공하고자 하는 것으로, 명세서의 일부분을 구성하며 본 개시의 실시예와 더불어 본 개시를 해석하는바, 본 개시를 한정하지 않는다. 첨부 도면을 참조하여 상세한 예시적 실시예를 설명함으로써 위의 및 기타의 특징과 이점은 당업자에 있어서 더욱 자명해질것인바, 첨부 도면에서
도1은 본 개시의 실시예에 따른 쿼리를 처리하는 방법의 개략도이다.
도2는 본 개시의 실시예에 따른 목표 후보 엔티티 집합을 결정하는 방법의 개략도이다.
도3은 본 개시의 실시예에 따른 각 목표 후보 엔티티의 유형을 결정하는 방법의 개략도이다.
도4는 본 개시의 실시예에 따른 쿼리를 처리하는 장치의 개략도이다.
도5는 본 개시의 실시예에 따른 쿼리를 처리하는 장치의 프레임워크의 개략도이다.
당업자한테 본 발명의 기술안을 더 잘 이해시키기 위하여, 아래, 첨부도면을 결부하여 본 발명에 의하여 제공되는 쿼리를 처리하는 방법, 장치 및 컴퓨터 판독가능 매체에 대하여 상세히 설명하고자 한다.
아래, 첨부 도면을 결부하여 예시적인 실시예에 대하여 더 충분하게 설명하고자 하는데, 상기 예시적인 실시예는 다양한 형식으로 구현 가능한바, 본 명세서에 기술되는 실시예에 한정되는 것으로 해석되어서는 안된다. 반대로, 이러한 실시예를 제공하는 목적은 본 개시를 투철하고 완전하도록 하려는 데 있고 당업자한테 본 개시의 범위를 충분히 이해시키려는 데 있다.
본 명세서에서 사용한 바와 같이, 용어 '및/또는'은 하나 또는 복수의 관련 열거 조목의 임의의 그리고 모든 조합을 포함한다.
본 명세서에서 사용되는 용어는 단지 특정된 실시예를 설명하기 위한 것으로, 본 개시를 한정하려는 것이 아니다. 본 명세서에서 사용한 바와 같이, 단수 형식인 '하나' 및 '당해'는 별도로 명확한 지적이 있지 않은 한, 복수 형식도 포함한다. 본 명세서에서 용어 '포함한다' 및/또는 '??로 제조된다'가 사용되는 경우, 이는 상기 특징, 전일체, 단계, 조작, 소자 및/또는 컴포넌트가 존재함을 가리키는 것이나, 하나 또는 복수의 기타의 특징, 전일체, 단계, 조작, 소자, 컴포넌트 및/또는 이들의 그룹이 존재하거나 추가되는 것을 배제하지 않는다는 것을 또한 이해하여야 한다
본 명세서의 실시예는 본 개시의 이상적인 개략도를 빌어, 그리고 평면도 및/또는 단면도를 참조하여 설명된다. 따라서, 제조 기술 및/또는 마진에 따라 예시적인 도면에 대해 수정할 수 있다. 그러므로 실시예는 첨부 도면에 도시한 실시예에 한정되는 것이 아니고 제조 공정에 따라 초래되는 구성에 대한 수정을 포함한다. 때문에, 첨부 도면에 예시로서 도시한 영역은 예시적인 속성을 가지며, 도면에 도시한 영역의 형상은 소자 영역의 구체 형상을 예시로서 도시하지만 한정하려는 목적은 아니다.
별도의 한정이 있지 않은 한, 본 명세서에 사용되는 모든 용어(기술 용어 및 과학 용어를 포함함)의 함의는 당업자가 통상적으로 이해하는 함의와 동일하다. 예를 들면, 상용 사전에서 한정하는 용어는 관련 기술에서의 및 본 개시의 배경에서의 함의와 일치한 함의를 가지는 것으로 해석되어야 하고, 명세서에 명확한 한정이 있지 않은 한, 이상화된 또는 과도하게 형식적인 함의를 가지는 것으로 해석되어서는 안된다는 것을 또한 이해하여야 한다.
본 개시의 실시예의 일 측면에 따르면, 본 개시의 실시예는 쿼리를 처리하는 방법을 제공한다.
도1을 참조하면, 도1은 본 개시의 실시예에 따른 쿼리를 처리하는 방법의 개략도이고, 당해 방법은 쿼리를 처리하는 장치, 예를 들어 서버 장치에 적용된다.
도1에 도시한 바와 같이, 당해 방법은 다음과 같은 단계를 포함한다.
단계S1: 수신된, 문자열을 포함하는 쿼리 요청에 따라 쿼리 피드백을 결정한다.
실시예에서, 사용자는 단말을 통해 서버 장치로 쿼리 요청, 즉, query를 송신한다. 구체적으로, 단말은 이동 기기, 예를 들어 휴대전화, 랩톱 컴퓨터, 태블릿 컴퓨터, 개인 휴대 정보 단말기(Personal Digital Assistant)일 수도 있고 고정 기기, 예를 들어, 데스크톱 컴퓨터 등일 수도 있다. 쿼리 요청은 문자열로 구성된다. 본 명세서에 기재된 '문자열'은 텍스트 형식의 문자, 숫자, 자모(Letter), 부호 등 중의 하나 또는 복수의 시퀀스를 포함할 수 있음을 이해할 수 있다. 서버 장치는 사용자 쿼리에 따라 검색을 개시하여, 사용자 쿼리에 대응되는 쿼리 피드백을 획득한다. 검색은 네트워크를 통해, 예를 들어 웹페이지 등의 네트워크 자원에 따라 수행될 수도 있고, 로컬에서 로컬에 저장된 여러 가지 데이터베이스에 따라 수행될 수도 있음을 이해할 수 있다.
일부 실시예에서, 쿼리 피드백은 사용자 쿼리에 대한 검색으로 획득되는 대응되는 결과를 가리키는바, 예를 들어 뉴스, 정보, 연관 검색 쿼리, 인터넷 게시판 등의 정보 중의 하나 또는 복수이다. 쿼리 피드백은 통상적으로는 사용자에 의해 액세스 가능한 것이다. 따라서, 쿼리 피드백은 대량적인 사용자 행동에 따라 변화될 수 있는바, 예를 들면, 사용자 클릭률이 보다 높은 정보는 쿼리 피드백으로 되어 쿼리 요청의 결과로서 사용자한테 표시되지만, 사용자 클릭률이 보다 낮은 정보는 간과될 수 있다. 쿼리 피드백의 표시는 단지 사용자 클릭률만을 근거로 하는 것이 아니며, 기타의 근거도 포함될 수 있음을 이해할 수가 있는바, 이에 대하여서는 한정하지 않는다.
쿼리 피드백은 대량적인 사용자 행동에 따라 변화될 수 있으므로 쿼리 피드백은 적시성을 가진다. 부동한 시간대에 동일한 쿼리 요청으로 획득되는 쿼리 피드백은 부동할 수 있다. 또한, 동일한 쿼리 피드백이 부동한 시간대에 받게 되는 관심의 정도도 부동하다. 아래, 쿼리 요청 '범블비'를 예로 들어 설명하고자 한다. 영화 <범블비>의 개봉 이전부터 '범블비'는 이미 트랜스포머 중의 가상 인물로 대중에게 공지되어 있었다. 즉, 트랜스포머가 이미 공개되고 영화 <범블비>는 개봉되기 이전에, '범블비'는 이미 트랜스포머중의 가상 인물로 대중에게 공지되어 있었다. 그러나, 영화 <범블비>가 개봉된 후, '범블비'는 영화로서 사람들에 의해 검색될 가능성이 더 높게 된다. 다시 말해, 시간의 흐름에 따라, 대량적인 사용자 행동(예를 들면, 클릭)은 부단히 변화할 것이며, 쿼리 피드백도 상응하게 부단히 업데이트될 것이다. 따라서, 본 개시의 실시예의 기술안을 적용하는 경우, 동일한 쿼리 요청에 있어서, 부동한 시간에 부동한 쿼리 피드백을 획득할 수 있다. 즉, 본 개시의 실시예에 의하여 제공되는 방안에 따르면 쿼리 피드백의 적시성을 향상시킬 수 있다.
단계S2: 쿼리 피드백, 문자열 및 미리 설정된 지식 베이스에 따라 목표 후보 엔티티 집합을 결정한다.
당해 단계에서, 쿼리 피드백과 지식 베이스에 따라 문자열에 대응되는 목표 후보 엔티티 집합을 결정할 수 있다. 용어 '지식 베이스'는 그래프와 유사한 데이터 구조를 가리키는 것으로, 노드와 간선으로 구성되는바, 예를 들면, 지식 그래프 또는 기타의 적합한 데이터 베이스가 있다. 지식 베이스에서 각 노드는 현실 세계에 존재하는 '엔티티'를 표시하고, 각 간선은 엔티티와 엔티티 사이의 '관계'를 표시한다. 지식 베이스는 관계의 효과적인 표시 방식이다. 바꾸어 말해, 지식 베이스는 여러 가지 정보를 하나로 연결하여 하나의 관계 네트워크를 얻게 되는데, 이는 '관계'의 시각에서 문제를 분석하는 능력을 제공한다.
도2를 결부하여 알 수 있는바, 일부 실시예에서, 단계S2는 다음과 같은 단계를 포함할 수 있다.
단계S2-1: 쿼리 피드백과 문자열에 따라 제1 후보 엔티티 서브집합을 결정한다. 제1 후보 엔티티 서브집합은 당해 문자열에 대응되는 후보 엔티티를 포함한다. 후보 엔티티는 특정 문자열에 대응되는 모든 후보 엔티티 또는 일부 후보 엔티티일 수 있다. 일부 후보 엔티티의 선택은 부동한 상황에 따라 수행될 수 있는바, 예를 들면, 계산 자원 또는 네트워크 자원이 제한적인 상황에서, 각 후보 엔티티 또는 각 엔티티 의항(屢淃)의 가중치 또는 기타 파라미터에 따라 우선 순위가 보다 높은 몇몇 후보 엔티티 또는 엔티티 의항을 선택할 수 있다. 본 명세서에서는 구체적인 선택 방식에 대하여 한정하지 않는다.
실시예에서, 제1 후보 엔티티 서브집합은 쿼리 피드백 및 문자열에 대한 계산으로 획득할 수 있다. 구체적으로, 예를 들어 멀티모드 매칭 알고리즘을 적용하여 문자열과 쿼리 피드백을 매칭시킴으로써 상응한 쿼리 피드백 중의 모든 또는 일부의 후보 엔티티을 추출할 수 있다. 문자열과 쿼리 피드백을 매칭시켜 후보 엔티티를 획득하는 알고리즘은 당해 기능을 구현할 수 있는 임의의 알고리즘일 수 있음을 이해할 수 있는바, 본 명세서에서는 이에 대해 한정하지 않는다.
단계S2-2: 문자열에 따라 지식 베이스에서 제2 후보 엔티티 서브집합을 결정한다. 제2 후보 엔티티 서브집합은 당해 문자열에 대응되는 후보 엔티티 및 후보 엔티티에 대응되는 엔티티 의항을 포함한다. 의항은 예를 들어 단어 항목, 조목 등일 수 있는바, 이는 각각의 부동한 개념과 의미를 가지는 사물에 대한 서술 내용을 가리킨다. 후보 엔티티의 엔티티 의항은 당해 후보 엔티티에 대응되는 모든 엔티티 의항 또는 일부 엔티티 의항일 수 있다. 일부 후보 엔티티 및 엔티티 의항에 대한 선택은 부동한 상황에 따를 수 있다. 본 명세서에서는 구체적인 선택 방식에 대하여 한정하지 않는다.
바람직하게, 지식 베이스 중에서 이미 상호 관계를 가지는 각 엔티티의 정보에 따라 지식 베이스로부터 문자열과 연관 관계를 가지는 복수의 엔티티 의항을 선택하는바, 복수의 엔티티 의항으로 구성되는 집합이 바로 제2 후보 엔티티 서브집합이다.
단계S2-3: 제1 후보 엔티티 서브집합과 제2 후보 엔티티 서브집합에 따라 목표 후보 엔티티 집합을 결정한다. 구체적으로, 2개의 서브집합을 취하는바, 즉 제1 후보 엔티티 서브집합과 제2 후보 엔티티 서브집합의 합집합이 바로 목표 후보 엔티티 집합이다.
설명하고자 하는 바는, 단계S2-1과단계S2-2 사이에는 필연적인 선후 순서가 존재하지 않는다. 즉, 제1 후보 엔티티 서브집합을 획득하는 단계를 우선 수행할 수도 있고, 제2 후보 엔티티 서브집합을 획득하는 단계를 우선 수행할 수도 있고, 제1 후보 엔티티 서브집합을 획득하는 단계와 제2 후보 엔티티 서브집합을 획득하는 단계를 동시에 수행할 수도 있다.
단계S3: 목표 후보 엔티티 집합 중의 각 목표 후보 엔티티를 평가하여, 평가 결과를 획득하는바, 하나의 목표 후보 엔티티가 하나의 평가 결과에 대응된다. 종래 기술에서의 평가 방법을 적용하여 목표 후보 엔티티 집합 중의 각 목표 후보 엔티티를 평가할 수 있다. 예를 들면, 목표 후보 엔티티 집합 중의 각 목표 후보 엔티티에 대하여 순서를 정렬하거나, 또는 목표 후보 엔티티 집합 중의 각 목표 후보 엔티티의 점수를 계산할 수 있다. 여기서는 구체적인 평가 방식에 대하여 한정하지 않기로 한다.
일부 실시예에서, 단계S3은 다음과 같은 단계를 포함한다.
목표 후보 엔티티 집합과 쿼리 피드백을 각각 이중 경로 모델(dual-route model)에 입력하여, 각 목표 후보 엔티티에 대응되는 평가 결과를 획득한다.
구체적으로, 목표 후보 엔티티 집합과 쿼리 피드백을 각각 이중 경로 모델에 입력함으로써 각 목표 후보 엔티티에 대응되는 평가 결과를 출력한다. 바람직하게, 이중 경로 모델은 이중 경로 LSTM 모델이다. 여기서, 이중 경로 LSTM 모델은 바로 이중 경로 LSTM(Long-Short Term Memory) 모델이다. 이중 경로 LSTM 모델은 목표 후보 엔티티 집합 중의 각 목표 후보 엔티티를 정확하게 구분하여, 각 목표 후보 엔티티에 대응되는 평가 결과를 출력할 수 있다.
이중 경로 LSTM 모델을 적용하여 각 목표 후보 엔티티를 평가하는 경우, 획득되는 평가 결과가 점수이다.
구체적으로, 목표 후보 엔티티 집합을 이중 경로 LSTM 모델의 일단(즉, 이중 경로 LSTM 모델의 한 경로)에 입력하고, 쿼리 피드백을 이중 경로 LSTM 모델의 타단(즉, 이중 경로 LSTM 모델의 다른 한 경로)에 입력한다. 본 개시의 실시예에서는, 이중 경로 LSTM 모델, 쿼리 피드백 및 지식 베이스를 이용함으로써, 쿼리 처리 분야에서의 엔티티 명칭, 엔티티 별명, 엔티티+정보(즉, 지식 정보) 및 착오 정정 관련 문제를 해결한다.
단계S4: 각 목표 후보 엔티티평가 결과에 따라 각 목표 후보 엔티티의 유형을 결정한다.
일부 실시예에서, 유형은 인지적 수요와 비인지적 수요를 포함한다. 인지적 수요의 엔티티는 엔티티 명칭과 엔티티 정보를 포함하는바, 즉, 인지적 수요의 엔티티는 명확한 정의를 가지는 엔티티이다. 비인지적 수요의 엔티티는 명확한 정의를 가지지 않은 엔티티이다.
구체적으로, 단계S2 이후, 목표 후보 엔티티 집합을 획득한다. 목표 후보 엔티티 집합은 제1 후보 엔티티 서브집합과 제2 후보 엔티티 서브집합을 포함한다. 제1 후보 엔티티 서브집합은 복수의 목표 후보 엔티티을 포함한다. 제2 후보 엔티티 서브집합은 복수의 목표 후보 엔티티 및 각 목표 후보 엔티티에 대응되는 엔티티 의항을 포함한다. 하나의 목표 후보 엔티티가 적어도 하나의 엔티티 의항에 대응되므로, 하나의 엔티티 의항은 오직 하나의 목표 후보 엔티티에만 대응된다. 따라서 목표 후보 엔티티 집합에 따라, 목표 후보 엔티티 집합에서 각 목표 후보 엔티티와 각 엔티티 의항 사이의 연관 관계를 결정할 수 있다. 평가 과정은 바로 목표 후보 엔티티 집합 중의 각 목표 후보 엔티티를(어느 한 목표 후보 엔티티가 적어도 하나의 엔티티 의항을 포함하는 경우에는, 당해 목표 후보 엔티티 및 이에 대응되는 각 엔티티 의항을) 각각 쿼리 피드백에 매칭시키는 과정이다. 또한, 본 개시의 실시예에서는, 엔티티 의항과 목표 후보 엔티티를 결합시키는 방식을 적용하여 쿼리 피드백과의 매칭을 수행하는바, 매칭 결과의 포괄성과 충분성을 구현할 수 있다. 매칭 결과가 바로 평가 결과이다. 구체적으로, 계산의 방식(예를 들면, 유사도 계산)으로 매칭할 수도 있고 모델의 방식(예를 들면, 신경망 모델)으로 매칭할 수도 있는바, 여기서는 매칭 방법에 대하여 한정하지 않는다.
여기서, 계산의 방식으로 매칭을 수행하는 구체적인 구현 방식 중 하나는 다음과 같다. 쿼리 피드백에 있어서, 목표 후보 엔티티 집합 중의 임의의 목표 후보 엔티티와의 유사도 계산을 수행하여(목표 후보 엔티티가 적어도 하나의 엔티티 의항을 포함하는 경우, 당해 목표 후보 엔티티 및 이에 대응되는 각 엔티티 의항을 일체로 하여 쿼리 피드백에 매칭시킨다) 당해 목표 후보 엔티티와의 유사도(즉, 평가 결과)를 획득한다. 유사도와 미리 설정된 유사도 역치(즉, 미리 설정된 결과)를 비교한다. 유사도가 유사도 역치보다 크거나 같다면 목표 후보 엔티티를 인지적 수요의 엔티티로 결정한다. 유사도가 유사도 역치보다 작다면 당해 목표 후보 엔티티를 비인지적 수요의 엔티티로 결정한다.
여기서, 모델 방식으로 매칭을 수행하는 구체적인 구현 방식 중 하나는 다음과 같다. 목표 후보 엔티티 집합 중의 각 목표 후보 엔티티를 모두 이중 경로 LSTM 모델의 한 경로을 통해 이중 경로 LSTM 모델에 입력하고, 쿼리 피드백을 이중 경로 LSTM 모델의 다른 한 경로을 통해 이중 경로 LSTM 모델에 입력한다. 이중 경로 LSTM 모델은 쿼리 피드백에 따라 각 목표 후보 엔티티를 평가한다. 평가 방법은 각 목표 후보 엔티티에 대하여 평점 처리하는 것을 포함하나 이에 한정되지 않는다. 즉, 이중 경로 LSTM 모델은 쿼리 피드백에 따라 각 목표 후보 엔티티에 대응되는 점수(즉, 평가 결과)를 출력한다. 구체적으로, 이중 경로 LSTM 모델에 의하여 출력되는 어느 한 목표 후보 엔티티의 점수(즉, 당해 목표 후보 엔티티의 평가 결과)가 C이고, 미리 설정된 점수 역치(즉, 미리 설정된 결과)가 D라면, C?D인 경우, 목표 후보 엔티티를 인지적 수요의 엔티티로 결정하고, C<D인 경우, 목표 후보 엔티티를 비인지적 수요의 엔티티로 결정한다.
도3을 결부하여 알 수 있는바, 일부 실시예에서, 단계S4는 다음과 같은 단계를 포함한다.
단계S4-1: 각 목표 후보 엔티티의 평가 결과를 각각 미리 설정된 결과와 비교하는바, 목표 후보 엔티티의 평가 결과가 미리 설정된 결과보다 좋은 경우 또는 미리 설정된 결과와 같은 경우, 단계S4-2를 수행하고, 아닌 경우, 단계S4-3을 수행한다.
단계S4-2: 평가 결과가 미리 설정된 결과보다 좋은 경우 또는 미리 설정된 결과와 같은 경우에 대응되는 목표 후보 엔티티를 제1 유형의 엔티티로 결정한다.
단계S4-3: 미리 설정된 결과보다 열등한 평가 결과에 대응되는 목표 후보 엔티티를 제2 유형의 엔티티로 결정한다.
여기서, 제1 유형의 엔티티는 인지적 수요의 엔티티이고, 제2 유형의 엔티티는 비인지적 수요의 엔티티이다.
본 개시의 실시예에서, 목표 후보 엔티티 집합에 도합 m개의 목표 후보 엔티티가 있는 경우, m개의 목표 후보 엔티티 중의 각 목표 후보 엔티티의 평가 결과를 모두 미리 설정된 결과와 비교한다.
어느 한 목표 후보 엔티티의 평가 결과를 미리 설정된 결과와 비교하여 얻게 되는 비교 결과에는 다음과 같은 2가지 가능성이 존재한다는 것을 이해할 수 있다. 첫번째 가능성은, 당해 목표 후보 엔티티의 평가 결과가 미리 설정된 결과보다 좋은 경우 또는 미리 설정된 결과와 같은 경우이고; 두번째 가능성은 당해 목표 후보 엔티티의 평가 결과가 미리 설정된 결과보다 열등한 경우이다. 첫번째 비교 결과인 경우, 당해 목표 후보 엔티티를 제1 유형의 엔티티로 결정하고; 두번째 비교 결과인 경우, 당해 목표 후보 엔티티를 제2 유형의 엔티티로 결정한다.
본 개시의 실시예에 의하여 제공되는 방안에 따르면, 본 개시의 실시예에 따라 적용되는 목표 후보 엔티티 집합을 획득하는 방안은, 쿼리 피드백과 지식 베이스 등의 특징을 결합하므로 쿼리에 대응되는 목표 후보 엔티티를 정확하게 선택할 수 있다. 또한, 본 개시의 실시예에 따라 적용되는 각 목표 후보 엔티티의 평가 결과를 획득하는 방안은, 고효율적이고 정확하게 각 목표 후보 엔티티를 평가하는 것을 구현할 수 있고, 나아가 쿼리의 유형을 정확하게 판단하는 기술 효과를 구현할 수 있다. 쿼리의 유형을 정확하게 구분할 수 있으므로 나아가 검색 효율을 향상시키고 사용자의 검색 비용을 절감시킬 수 있다. 또한, 쿼리의 유형을 정확하게 판단할 수 있으므로 사용자한테 푸시되는 결과의 정확성을 향상시킬 수 있고 리콜률을 향상시킨다.
도3을 결부하여 알 수 있는바, 일부 실시예에서, 단계S4-2 이후, 당해 방법은 다음과 같은 단계를 더 포함한다.
단계S4-4: 각 목표 후보 엔티티에 대응되는 평가 결과와 목표 후보 엔티티 집합에 따라, 쿼리 요청에 대응되는 검색 의도 엔티티를 결정한다. 검색 의도 엔티티는 쿼리 요청을 가장 잘 나타낼 수 있는 상응한 엔티티를 가리킨다. 다시 말해, 검색 의도 엔티티는 사용자가 원하는 쿼리 결과를 가장 잘 나타낼 수 있는 상응한 엔티티이다.
도3을 결부하여 알 수 있는바, 일부 실시예에서, 단계S4-4는 구체적으로 다음과 같은 단계를 포함한다.
단계S4-4-1: 각 목표 후보 엔티티에 대응되는 평가 결과로부터 가장 좋은 평가 결과를 선택한다.
단계S4-4-2: 가장 좋은 평가 결과에 대응되는 목표 후보 엔티티를 검색 의도 엔티티로 결정한다.
본 개시의 실시예에서, 하나의 목표 후보 엔티티가 하나의 평가 결과(부동한 목표 후보 엔티티에 대응되는 평가 결과가 같게 되는 상황이 있을 수 있음)에 대응되는바, 즉, m개의 목표 후보 엔티티는 도합 m개의 평가 결과를 가진다. m개의 평가 결과를 내림차순 또는 오름차순으로 정렬하여 가장 좋은 평가 결과를 선택한다. 가장 좋은 평가 결과에 대응되는 목표 후보 엔티티를 검색 의도 엔티티로 결정한다. 즉, 가장 좋은 평가 결과에 대응되는 목표 후보 엔티티(즉, 검색 의도 엔티티)는 쿼리 요청의 진실한 검색 의도를 가장 잘 대표할 수 있는 엔티티이다. 본 개시의 실시예에 의하여 제공되는 방안에 따르면, 고효율적이고 정확하게 사용자의 진실한 의도를 결정하는 것을 구현할 수 있고 따라서 사용자한테 상응한 카드를 피드백 함으로써 사용자의 검색 경험을 강화시킬 수 있다.
본 개시의 실시예의 다른 측면에 따르면, 본 개시의 실시예는 쿼리를 처리하는 장치를 더 개시한다.
도4를 참조하면, 도4는 본 개시의 실시예에 따른 쿼리를 처리하는 장치의 개략도이다.
도4에 도시한 바와 같이, 당해 장치는
수신된, 문자열을 포함하는 쿼리 요청에 따라 쿼리 피드백을 결정하는 검색 모듈(1);
쿼리 피드백, 문자열 및 미리 설정된 지식 베이스에 따라 목표 후보 엔티티 집합을 결정하는 집합 결정 모듈(2);
목표 후보 엔티티 집합 중의 각 목표 후보 엔티티를 평가하여 평가 결과를 획득하는 평가 모듈(3) - 하나의 목표 후보 엔티티가 하나의 평가 결과에 대응됨 - ; 및
각 목표 후보 엔티티의 평가 결과에 따라 각 목표 후보 엔티티의 유형을 결정하는 유형 구분 모듈(4); 을 포함한다.
일부 실시예에서, 집합 결정 모듈(2)은 구체적으로
쿼리 피드백과 문자열에 따라 제1 후보 엔티티 서브집합을 결정하고;
문자열에 따라 지식 베이스에서 제2 후보 엔티티 서브집합을 결정하고;
제1 후보 엔티티 서브집합과 제2 후보 엔티티 서브집합에 따라 목표 후보 엔티티 집합을 결정한다.
일부 실시예에서, 평가 모듈은 구체적으로, 목표 후보 엔티티 집합과 쿼리 피드백을 각각 이중 경로 모델에 입력하여, 각 목표 후보 엔티티에 대응되는 평가 결과를 획득한다.
일부 실시예에서, 유형 구분 모듈(4)은 구체적으로
각 목표 후보 엔티티의 평가 결과를 각각 미리 설정된 결과와 비교하고;
목표 후보 엔티티의 평가 결과가 상기 미리 설정된 결과보다 좋은 조건 또는 목표 후보 엔티티의 평가 결과가 상기 미리 설정된 결과와 같은 조건 중의 적어도 하나를 충족시키는 상응한 목표 후보 엔티티를 상기 제1 유형의 엔티티로 결정한다.
일부 실시예에서, 유형 구분 모듈(4)은 또한 구체적으로
미리 설정된 결과보다 열등한 평가 결과에 대응되는 목표 후보 엔티티를 제2 유형의 엔티티로 결정한다.
일부 실시예에서, 유형 구분 모듈(4)은 또한
각 목표 후보 엔티티의 평가 결과와 목표 후보 엔티티 집합에 따라, 쿼리 요청에 대응되는 검색 의도 엔티티를 결정한다.
일부 실시예에서, 유형 구분 모듈(4)은 구체적으로
각 목표 후보 엔티티에 대응되는 평가 결과로부터 가장 좋은 평가 결과를 선택하고;
가장 좋은 평가 결과에 대응되는 목표 후보 엔티티를 검색 의도 엔티티로 결정한다.
일부 실시예에서, 쿼리 피드백은 뉴스, 정보, 연관 검색, 백과 사전 및 티에바 중의 하나 또는 복수를 포함한다.
도5를 참조하면, 도5는 본 개시의 실시예에 따른 쿼리를 처리하는 장치의 프레임워크의 개략도.
도5에 도시한 쿼리를 처리하는 장치는 단지 하나의 실시예일 뿐, 본 발명의 실시예의 기능 및 사용 범위에 대하여 어떠한 한정이 되어서도 안된다.
도5에 도시한 바와 같이, 쿼리를 처리하는 장치는 범용 컴퓨팅 기기의 형식으로 표현된다. 쿼리를 처리하는 장치의 컴포넌트는 하나 또는 복수의 프로세서 또는 처리 유닛(11), 메모리(12), 서로 다른 컴포넌트(메모리(12) 및 처리 유닛(11) 포함)를 연결하는 버스(13)를 포함할 수 있으나 이에 한정되지 않는다.
버스(13)는 여러 유형의 버스 구조 중의 한 가지 또는 여러 가지 가지를 표시하는바, 메모리 버스 또는 메모리 제어기, 주변 버스, 가속 그래픽 포트, 프로세서 또는 복수 가지 버스 구조에서의 임의 버스 구조를 사용하는 로컬 버스를 포함한다. 예를 들면, 이러한 아키텍처는 산업 표준 아키텍처(ISA) 버스, 마이크로 채널 아키텍처 버스(MCA) 버스, 확장 ISA버스, 비디오 전자공학 표준위원회(VESA) 로컬 버스 및 주변 컴포넌트 상호 연결(PCI) 버스를 포함하나 이에 한정되지 않는다.
쿼리를 처리하는 장치는 전형적으로 복수 가지 컴퓨터 시스템 판독 가능 매체를 포함한다. 이러한 매체는 임의의 쿼리를 처리하는 장치에 의하여 액세스될 수 있는 사용 가능 매체일 수 있는바, 휘발성 및 비휘발성 매체, 제거 가능한 및 제거 불가능한 매체를 포함할 수 있다.
메모리(12)는 휘발성 메모리 형식의 컴퓨터 시스템 판독 가능 매체, 예컨대 랜덤 액세스 메모리(RAM)(14) 및/또는 고속 캐시(15)(즉, 고속 캐시 메모리)를 포함할 수 있다. 쿼리를 처리하는 장치는 기타 제거 가능한/제거 불가능한, 휘발성/비휘발성 컴퓨터 시스템 저장 매체를 나아가 더 포함할 수 있다. 그냥 예로 들면, 저장 시스템(16)은 제거 불가능한, 비휘발성 자기 매체(도5에 미도시, 통상적으로는 '하드 디스크 드라이브'임)에 대해 판독 및 기록하기 위한 것일 수 있다. 비록 도5에는 미도시하였지만, 제거 가능한 비휘발성 자기 디스크(예컨대 '플로피 디스크')에 대해 판독 및 기록하기 위한 자기 디스크 드라이브, 그리고 제거 가능한 비휘발성 광디스크(예컨대 CD-ROM, DVD-ROM 또는 기타 광 매체)에 대해 판독 및 기록하기 위한 광디스크 드라이브가 제공될 수 있다. 이러한 상황에서, 매개 드라이브는 하나 또는 복수의 데이터 매체 인터페이스를 통해 버스(13)와 상호 연결될 수 있다. 메모리(12)는 프로그램 제품을 적어도 하나 포함할 수 있는바, 당해 프로그램 제품은 한 그룹(예컨대 적어도 하나)의 프로그램 컴포넌트를 구비하는바, 이러한 프로그램 컴포넌트는 본 발명의 각 실시예의 기능을 실행하도록 구성된다.
한 그룹(적어도 하나)의 프로그램 컴포넌트(17)를 구비하는 프로그램/유틸리티 도구(18)는 예컨대 메모리(12)에 저장될 수 있는바, 이러한 프로그램 컴포넌트(17)는 운영 체제, 하나 또는 복수 응용 프로그램, 기타 프로그램 컴포넌트 및 프로그램 데이터를 포함하나 이에 한정되지 않고, 이러한 예시에서의 매 한 개 또는 일종의 조합에는 네트워크 환경의 구현이 포함될 수 있다. 프로그램 컴포넌트(17)는 통상적으로 본 발명에서 설명된 실시예 중의 기능 및/또는 방법을 실행한다.
쿼리를 처리하는 장치는 하나 또는 복수의 주변 기기(19)(예컨대 키보드, 위치 지정 도구, 디스플레이(20) 등)와 통신할 수도 있고, 또한 하나 또는 복수 사용자가 당해 쿼리를 처리하는 장치와 인터렉션 가능하도록 하는 기기와 통신할 수도 있고, 및/또는 당해 쿼리를 처리하는 장치가 하나 또는 복수 기타 컴퓨팅 기기와 통신을 진행할 수 있도록 하는 임의 기기(예컨대 네트워크 카드, 모뎀 등)와 통신할 수도 있다. 이러한 통신은 입력/출력(I/O) 인터페이스(21)를 통해 진행할 수 있다. 그리고, 쿼리를 처리하는 장치는 또한 네트워크 어댑터(22)를 통해 하나 또는 복수의 네트워크(예컨대 근거리 통신망(LAN), 광역 통신망(WAN) 및/또는 공용 네트워크, 예컨대 인터넷)와 통신할 수 있다. 도시한 바와 같이, 네트워크 어댑터(22)는 버스(13)를 통해 쿼리를 처리하는 장치의 기타 모듈과 통신한다. 알아야 할 것은, 비록 도시되지 않았지만, 쿼리를 처리하는 장치에 결합하여 기타 하드웨어 및/또는 소프트웨어 모듈를 사용할 수 있는바, 마이크로코드, 기기 드라이버, 리던던트 처리 유닛, 외장 자기 디스크 드라이브 어레이, RAID 시스템, 자기 테이프 드라이브 및 데이터 백업 저장 시스템 등이 포함되나 이에 한정되지 않는다.
처리 유닛(11)은 메모리(12)에 저장되어 있는 복수의 프로그램 중의 적어도 하나를 작동시키는 것을 통해 각 종 기능 애플리케이션 및 데이터 처리를 실행하는바, 예를 들면 본 발명의 실시예에 의하여 제공되는 쿼리를 처리하는 방법을 실행한다.
본 개시의 실시예의 다른 측면에 따르면, 본 개시의 실시예는 컴퓨터 프로그램이 저장되어 있는 컴퓨터 판독가능 매체를 더 제공하는바, 상기 프로그램은 프로세서에 의해 실행되는 경우, 상기 방법을 구현한다.
당업자라면, 본 명세서에 개시되는 방법에서 전체 또는 일부의 단계, 시스템, 장치 중의 기능 모듈/유닛은 소프트웨어, 펌웨어, 하드웨어 및 이들의 적당한 조합으로 구현될 수 있음을 이해할 수 있다. 펌웨어의 구현 방식에서, 위의 설명에서 언급된 기능 모듈/유닛 사이의 구획은 반드시 물리적인 컴포넌트의 구획에 대응되는 것은 아닌바; 예를 들어, 하나의 물리적인 컴포넌트가 복수의 기능을 구비할 수도 있고 하나의 기능 또는 단계가 몇개의 물리적인 컴포넌트의 협동으로 수행될 수도 있다. 일부 물리적인 컴포넌트 또는 모든 물리적인 컴포넌트는 프로세서, 예를 들면 중앙 처리 장치, 디지털 신호 프로세서 또는 마이크로프로세서에 의하여 실행되는 소프트웨어로 구현될 수도 있고 하드웨어로 구현될 수도 있고 집적회로, 예를 들면 주문형 집적회로(Application Specific Integrated Circuit)로 구현될 수도 있다. 이러한 소프트웨어는 컴퓨터 판독가능 매체에 분포될 수 있고, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체(또는 비임시성 매체)를 포함할 수 있다. 예를 들면, 당업자에게 공지된 용어 컴퓨터 저장 매체는, 정보(예를 들어 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터)를 저장하는 임의의 방법 또는 기술에서 구현되는 휘발성인 및 비휘발성인, 제거 가능한 및 제거 불가능한 매체를 포함한다. 컴퓨터 저장 매체는 RAM, ROM, EEPROM, 플래시 메모리 또는 기타의 메모리 기술; CD-ROM, 디지털 다기능 디스크(DVD) 또는 기타의 광디스크 저장; 자기 카트리지, 자기 테이프, 자기 디스크 저장 또는 기타의 자기 저장 장치; 또는 원하는 정보를 저장하고 컴퓨터에 의하여 액세스 가능한 임의의 다른 매체를 포함하나 이에 한정되지 않는다.
본 명세서에는 이미 예시적인 실시예가 개시되었고 또 비록 구체적인 용어가 적용되었지만 이러한 것은 단지 일반적 설명의 함의로 사용되는 것으로, 그러하게 해석되어야 하며 한정을 위한 목적이 아니다. 일부 실시예에 있어서, 별도의 명확한 지적이 있지 않은 한, 특정 실시예에 결부되어 설명되는 특징, 특성 및/또는 요소는 단독 사용이 가능하다는 것은 당업자에게 자명한 바이다, 따라서, 당업자라면, 첨부되는 특허청구범위에 명시되는 본 개시의 범위를 벗어나지 않는 전제하에 여러 가지 형식상의 및 디테일적인 변경이 가능하다는 것을 이해할 수 있다.
1: 검색 모듈, 2: 집합 결정 모듈, 3: 평가 모듈, 4: 유형 구분 모듈, 11: 처리 유닛(또는 프로세서), 12: 메모리, 13: 버스, 14: RAM, 15: 고속 캐시, 16: 저장 시스템, 17: 프로그램 컴포넌트, 18: 유틸리티 도구, 19: 외부 기기, 20: 디스플레이, 21: I/O 인터페이스, 22: 네트워크 어댑터.

Claims (15)

  1. 쿼리를 처리하는 방법에 있어서,
    검색 모듈이, 수신된, 문자열을 포함하는 쿼리 요청에 따라 쿼리 피드백을 결정하는 단계;
    집합 결정 모듈이 상기 쿼리 피드백, 상기 문자열 및 미리 설정된 지식 베이스에 따라 목표 후보 엔티티 집합을 결정하는 단계;
    평가 모듈이 상기 목표 후보 엔티티 집합 중의 각 목표 후보 엔티티를 평가하여, 평가 결과를 획득하는 단계 - 하나의 상기 목표 후보 엔티티가 하나의 평가 결과에 대응됨 - ; 및
    유형 구분 모듈이 각 상기 목표 후보 엔티티의 평가 결과에 따라 각 상기 목표 후보 엔티티의 유형을 결정하는 단계; 를 포함하고,
    상기 평가 모듈이 상기 목표 후보 엔티티 집합 중의 각 목표 후보 엔티티를 평가하는 단계는,
    상기 평가 모듈이 상기 목표 후보 엔티티 집합과 상기 쿼리 피드백을 각각 이중 경로 모델에 입력하여, 각 목표 후보 엔티티에 대응되는 평가 결과를 획득하는 단계를 포함하는,
    것을 특징으로 하는 쿼리를 처리하는 방법.
  2. 제1항에 있어서,
    상기 집합 결정 모듈이 상기 쿼리 피드백, 상기 문자열 및 미리 설정된 지식 베이스에 따라 목표 후보 엔티티 집합을 결정하는 단계는,
    상기 집합 결정 모듈이 상기 쿼리 피드백과 상기 문자열에 따라 제1 후보 엔티티 서브집합을 결정하는 단계;
    상기 집합 결정 모듈이 상기 문자열에 따라 상기 지식 베이스에서 제2 후보 엔티티 서브집합을 결정하는 단계; 및
    상기 집합 결정 모듈이 상기 제1 후보 엔티티 서브집합과 상기 제2 후보 엔티티 서브집합에 따라 상기 목표 후보 엔티티 집합을 결정하는 단계; 를 포함하는,
    것을 특징으로 하는 쿼리를 처리하는 방법.
  3. 삭제
  4. 제1항에 있어서,
    유형 구분 모듈이 각 상기 목표 후보 엔티티의 평가 결과에 따라 각 상기 목표 후보 엔티티의 유형을 결정하는 단계는,
    상기 유형 구분 모듈이 각 상기 목표 후보 엔티티의 평가 결과를 각각 미리 설정된 결과와 비교하는 단계; 및
    상기 유형 구분 모듈이 목표 후보 엔티티의 평가 결과가 상기 미리 설정된 결과보다 좋은 조건 또는 목표 후보 엔티티의 평가 결과가 상기 미리 설정된 결과와 같은 조건 중의 적어도 하나를 충족시키는 상응한 목표 후보 엔티티를 제1 유형의 엔티티로 결정하는 단계; 를 포함하는,
    것을 특징으로 하는 쿼리를 처리하는 방법.
  5. 제4항에 있어서,
    상기 각 상기 목표 후보 엔티티의 평가 결과를 각각 미리 설정된 결과와 비교하는 단계 이후,
    상기 유형 구분 모듈이 상기 미리 설정된 결과보다 열등한 평가 결과에 대응되는 목표 후보 엔티티를 제2 유형의 엔티티로 결정하는 단계를 더 포함하는,
    것을 특징으로 하는 쿼리를 처리하는 방법.
  6. 제4항에 있어서,
    목표 후보 엔티티의 평가 결과가 상기 미리 설정된 결과보다 좋은 조건 또는 목표 후보 엔티티의 평가 결과가 상기 미리 설정된 결과와 같은 조건 중의 적어도 하나를 충족시키는 상응한 목표 후보 엔티티를 제1 유형의 엔티티로 결정하는 단계 이후,
    상기 유형 구분 모듈이 각 상기 목표 후보 엔티티에 대응되는 평가 결과와 상기 목표 후보 엔티티 집합에 따라, 상기 쿼리 요청에 대응되는 검색 의도 엔티티를 결정하는 단계를 더 포함하는,
    것을 특징으로 하는 쿼리를 처리하는 방법.
  7. 제6항에 있어서,
    상기 유형 구분 모듈이 각 상기 목표 후보 엔티티에 대응되는 평가 결과와 상기 목표 후보 엔티티 집합에 따라, 상기 쿼리 요청에 대응되는 검색 의도 엔티티를 결정하는 단계는,
    상기 유형 구분 모듈이 상기 각 목표 후보 엔티티에 대응되는 평가 결과로부터 가장 좋은 평가 결과를 선택하는 단계; 및
    상기 유형 구분 모듈이 상기 가장 좋은 평가 결과에 대응되는 목표 후보 엔티티를 상기 검색 의도 엔티티로 결정하는 단계; 를 포함하는,
    것을 특징으로 하는 쿼리를 처리하는 방법.
  8. 쿼리를 처리하는 장치에 있어서,
    수신된, 문자열을 포함하는 쿼리 요청에 따라 쿼리 피드백을 결정하는 검색 모듈;
    상기 쿼리 피드백, 상기 문자열 및 미리 설정된 지식 베이스에 따라 목표 후보 엔티티 집합을 결정하는 집합 결정 모듈;
    상기 목표 후보 엔티티 집합 중의 각 목표 후보 엔티티를 평가하여 평가 결과를 획득하는 평가 모듈 - 하나의 상기 목표 후보 엔티티가 하나의 평가 결과에 대응됨 - ; 및
    각 상기 목표 후보 엔티티의 평가 결과에 따라 각 상기 목표 후보 엔티티의 유형을 결정하는 유형 구분 모듈; 을 포함하고,
    상기 평가 모듈은,
    상기 목표 후보 엔티티 집합과 상기 쿼리 피드백을 각각 이중 경로 모델에 입력하여, 각 목표 후보 엔티티에 대응되는 평가 결과를 획득하는,
    것을 특징으로 하는 쿼리를 처리하는 장치.
  9. 제8항에 있어서,
    상기 집합 결정 모듈은,
    상기 쿼리 피드백과 상기 문자열에 따라 제1 후보 엔티티 서브집합을 결정하고;
    상기 문자열에 따라 상기 지식 베이스에서 제2 후보 엔티티 서브집합을 결정하고;
    상기 제1 후보 엔티티 서브집합과 상기 제2 후보 엔티티 서브집합에 따라 상기 목표 후보 엔티티 집합을 결정하는,
    것을 특징으로 하는 쿼리를 처리하는 장치.
  10. 삭제
  11. 제8항 또는 제9항에 있어서,
    상기 유형 구분 모듈은,
    각 상기 목표 후보 엔티티의 평가 결과를 각각 미리 설정된 결과와 비교하고;
    목표 후보 엔티티의 평가 결과가 상기 미리 설정된 결과보다 좋은 조건 또는 목표 후보 엔티티의 평가 결과가 상기 미리 설정된 결과와 같은 조건 중의 적어도 하나를 충족시키는 상응한 목표 후보 엔티티를 제1 유형의 엔티티로 결정하는,
    것을 특징으로 하는 쿼리를 처리하는 장치.
  12. 제11항에 있어서,
    상기 유형 구분 모듈은 또한,
    상기 미리 설정된 결과보다 열등한 평가 결과에 대응되는 목표 후보 엔티티를 제2 유형의 엔티티로 결정하는,
    것을 특징으로 하는 쿼리를 처리하는 장치.
  13. 제11항에 있어서,
    상기 유형 구분 모듈은 또한
    각 상기 목표 후보 엔티티에 대응되는 평가 결과와 상기 목표 후보 엔티티 집합에 따라, 상기 쿼리 요청에 대응되는 검색 의도 엔티티를 결정하는,
    것을 특징으로 하는 쿼리를 처리하는 장치.
  14. 제13항에 있어서,
    상기 유형 구분 모듈은,
    상기 각 목표 후보 엔티티에 대응되는 평가 결과로부터 가장 좋은 평가 결과를 선택하고;
    상기 가장 좋은 평가 결과에 대응되는 목표 후보 엔티티를 상기 검색 의도 엔티티로 결정하는,
    것을 특징으로 하는 쿼리를 처리하는 장치.
  15. 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램에 있어서,
    상기 컴퓨터 프로그램이 프로세서에 의해 실행되는 경우, 제1항, 제2항, 제4항 내지 제7항 중 어느 한 항의 방법이 구현되는,
    것을 특징으로 하는 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
KR1020190158016A 2019-02-21 2019-12-02 쿼리를 처리하는 방법, 장치 및 컴퓨터 판독가능 매체 KR102258484B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910130355.5A CN109902149B (zh) 2019-02-21 2019-02-21 查询处理方法和装置、计算机可读介质
CN201910130355.5 2019-02-21

Publications (2)

Publication Number Publication Date
KR20200102334A KR20200102334A (ko) 2020-08-31
KR102258484B1 true KR102258484B1 (ko) 2021-05-28

Family

ID=66945255

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190158016A KR102258484B1 (ko) 2019-02-21 2019-12-02 쿼리를 처리하는 방법, 장치 및 컴퓨터 판독가능 매체

Country Status (5)

Country Link
US (1) US11397788B2 (ko)
EP (1) EP3699781A1 (ko)
JP (1) JP6902131B2 (ko)
KR (1) KR102258484B1 (ko)
CN (1) CN109902149B (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160117405A1 (en) * 2014-02-24 2016-04-28 Huawei Technologies Co., Ltd. Information Processing Method and Apparatus

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6175829B1 (en) * 1998-04-22 2001-01-16 Nec Usa, Inc. Method and apparatus for facilitating query reformulation
US6363378B1 (en) * 1998-10-13 2002-03-26 Oracle Corporation Ranking of query feedback terms in an information retrieval system
US7747648B1 (en) * 2005-02-14 2010-06-29 Yahoo! Inc. World modeling using a relationship network with communication channels to entities
US20090299990A1 (en) * 2008-05-30 2009-12-03 Vidya Setlur Method, apparatus and computer program product for providing correlations between information from heterogenous sources
US20110307482A1 (en) * 2010-06-10 2011-12-15 Microsoft Corporation Search result driven query intent identification
US8600979B2 (en) 2010-06-28 2013-12-03 Yahoo! Inc. Infinite browse
US8972387B2 (en) * 2011-07-28 2015-03-03 International Business Machines Corporation Smarter search
US8909581B2 (en) * 2011-10-28 2014-12-09 Blackberry Limited Factor-graph based matching systems and methods
US20130110992A1 (en) * 2011-10-28 2013-05-02 Research In Motion Limited Electronic device management using interdomain profile-based inferences
CN103106220B (zh) * 2011-11-15 2016-08-03 阿里巴巴集团控股有限公司 一种搜索方法、搜索装置及一种搜索引擎系统
US20130212081A1 (en) * 2012-02-13 2013-08-15 Microsoft Corporation Identifying additional documents related to an entity in an entity graph
US9183310B2 (en) * 2012-06-12 2015-11-10 Microsoft Technology Licensing, Llc Disambiguating intents within search engine result pages
US9594831B2 (en) * 2012-06-22 2017-03-14 Microsoft Technology Licensing, Llc Targeted disambiguation of named entities
KR20140075428A (ko) * 2012-12-11 2014-06-19 한국전자통신연구원 시맨틱 검색 키워드 추천 방법 및 시스템
CN104239340B (zh) * 2013-06-19 2018-03-16 北京搜狗信息服务有限公司 搜索结果筛选方法与装置
US9852448B2 (en) * 2013-09-19 2017-12-26 Samsung Electronics Co., Ltd. Identifying gaps in search results
US9754210B2 (en) * 2014-04-01 2017-09-05 Microsoft Technology Licensing, Llc User interests facilitated by a knowledge base
CN103995880B (zh) * 2014-05-27 2019-03-12 百度在线网络技术(北京)有限公司 交互式搜索方法和装置
US9418128B2 (en) * 2014-06-13 2016-08-16 Microsoft Technology Licensing, Llc Linking documents with entities, actions and applications
US20150370787A1 (en) 2014-06-18 2015-12-24 Microsoft Corporation Session Context Modeling For Conversational Understanding Systems
US20160041986A1 (en) * 2014-08-08 2016-02-11 Cuong Duc Nguyen Smart Search Engine
US20170193099A1 (en) * 2015-12-31 2017-07-06 Quixey, Inc. Machine Identification of Grammar Rules That Match a Search Query
WO2017134093A1 (en) * 2016-02-02 2017-08-10 Koninklijke Philips N.V. Cognitive patient care event reconstruction
US20170330080A1 (en) * 2016-05-13 2017-11-16 Cognitive Scale, Inc. Universal Cognitive Graph Architecture
US10380169B2 (en) * 2016-07-29 2019-08-13 Rovi Guides, Inc. Systems and methods for determining an execution path for a natural language query
CN108280081B (zh) * 2017-01-06 2023-02-24 百度在线网络技术(北京)有限公司 生成网页的方法和装置
US11157490B2 (en) * 2017-02-16 2021-10-26 Microsoft Technology Licensing, Llc Conversational virtual assistant
WO2019027992A1 (en) * 2017-08-03 2019-02-07 Telepathy Labs, Inc. PROACTIVE, INTELLIGENT AND OMNICANAL VIRTUAL AGENT
US11893500B2 (en) * 2017-11-28 2024-02-06 International Business Machines Corporation Data classification for data lake catalog
US20190197176A1 (en) * 2017-12-21 2019-06-27 Microsoft Technology Licensing, Llc Identifying relationships between entities using machine learning
CN108345702A (zh) * 2018-04-10 2018-07-31 北京百度网讯科技有限公司 实体推荐方法和装置
US10782986B2 (en) * 2018-04-20 2020-09-22 Facebook, Inc. Assisting users with personalized and contextual communication content
CN108733779B (zh) * 2018-05-04 2022-10-04 百度在线网络技术(北京)有限公司 文本配图的方法和装置
US20190347358A1 (en) * 2018-05-10 2019-11-14 Microsoft Technology Licensing, Llc Query Formulation Using Networked Device Candidates
CN109033140B (zh) * 2018-06-08 2020-05-29 北京百度网讯科技有限公司 一种确定搜索结果的方法、装置、设备和计算机存储介质
CN108959613B (zh) * 2018-07-17 2021-09-03 杭州电子科技大学 一种面向rdf知识图谱的语义近似查询方法
CN109344174A (zh) * 2018-09-13 2019-02-15 深圳易投云智能科技有限公司 金融分析方法和系统
CN109299289B (zh) * 2018-11-30 2021-04-06 国信优易数据股份有限公司 一种查询图构建方法、装置、电子设备及计算机存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160117405A1 (en) * 2014-02-24 2016-04-28 Huawei Technologies Co., Ltd. Information Processing Method and Apparatus

Also Published As

Publication number Publication date
US20200272675A1 (en) 2020-08-27
CN109902149B (zh) 2021-08-13
KR20200102334A (ko) 2020-08-31
US11397788B2 (en) 2022-07-26
CN109902149A (zh) 2019-06-18
JP2020135900A (ja) 2020-08-31
EP3699781A1 (en) 2020-08-26
JP6902131B2 (ja) 2021-07-14

Similar Documents

Publication Publication Date Title
US11361243B2 (en) Recommending machine learning techniques, features, and feature relevance scores
CN109815308B (zh) 意图识别模型的确定及检索意图识别方法、装置
US11093854B2 (en) Emoji recommendation method and device thereof
CN110704743B (zh) 一种基于知识图谱的语义搜索方法及装置
US10089576B2 (en) Representation learning using multi-task deep neural networks
US8918348B2 (en) Web-scale entity relationship extraction
JP6799152B1 (ja) クリックグラフ上のベクトル伝播モデルに基づくインテリジェントなカスタマーサービス
US7937397B2 (en) Apparatus and method for term context modeling for information retrieval
US20180240013A1 (en) Cooperatively training and/or using separate input and subsequent content neural networks for information retrieval
US20220083874A1 (en) Method and device for training search model, method for searching for target object, and storage medium
JP2009093650A (ja) 文書の段落分析によるその文書のタグの選択
CN110147421B (zh) 一种目标实体链接方法、装置、设备及存储介质
US10366108B2 (en) Distributional alignment of sets
US10147020B1 (en) System and method for computational disambiguation and prediction of dynamic hierarchical data structures
JP2012230713A (ja) 検索方法、類似度計算方法、類似度計算及び同一文書照合システムと、そのプログラム
CN113988157A (zh) 语义检索网络训练方法、装置、电子设备及存储介质
Sukumar et al. Semantic based sentence ordering approach for multi-document summarization
Medvet et al. Brand-related events detection, classification and summarization on twitter
Wei et al. Online education recommendation model based on user behavior data analysis
CN114116997A (zh) 知识问答方法、装置、电子设备及存储介质
CN107665442B (zh) 获取目标用户的方法及装置
Komninos et al. Structured generative models of continuous features for word sense induction
US9547701B2 (en) Method of discovering and exploring feature knowledge
KR102258484B1 (ko) 쿼리를 처리하는 방법, 장치 및 컴퓨터 판독가능 매체
Passaro et al. Evaluating context selection strategies to build emotive vector space models

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant