KR20220032999A - 데이터 검색 방법, 장치, 시스템, 기기 및 컴퓨터 판독 가능 저장 매체 - Google Patents

데이터 검색 방법, 장치, 시스템, 기기 및 컴퓨터 판독 가능 저장 매체 Download PDF

Info

Publication number
KR20220032999A
KR20220032999A KR1020210015722A KR20210015722A KR20220032999A KR 20220032999 A KR20220032999 A KR 20220032999A KR 1020210015722 A KR1020210015722 A KR 1020210015722A KR 20210015722 A KR20210015722 A KR 20210015722A KR 20220032999 A KR20220032999 A KR 20220032999A
Authority
KR
South Korea
Prior art keywords
information
search term
search
timeliness
obtaining
Prior art date
Application number
KR1020210015722A
Other languages
English (en)
Other versions
KR102455379B1 (ko
Inventor
다 시에
뱌오 판
지순 정
지아지에 천
샤오용 뤼
전 전
두오 리
총 순
Original Assignee
바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 filed Critical 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Publication of KR20220032999A publication Critical patent/KR20220032999A/ko
Application granted granted Critical
Publication of KR102455379B1 publication Critical patent/KR102455379B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24552Database cache management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • G06F16/24565Triggers; Constraints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

이 개시는 데이터 검색 방법을 제공하며, 컴퓨터 기술 분야에 관련된다.
이 방법은: 수신된 검색어에 대한 의미 이해를 통해, 검색어에 대응하는 의미 이해 정보를 결정하고; 의미 이해 정보에 따라, 검색어의 적시성 요구 정보를 분석하여 획득하고; 검색어의 적시성 요구 정보를 기반으로, 검색어에 대응하는 리소스 결과의 획득 방식을 결정하며; 선택한 획득 방식에 따라, 검색어에 대응하는 리소스 결과를 획득하는 것을 포함한다. 이 개시는 또한 데이터 장치, 시스템, 기기, 컴퓨터 판독 가능 저장 매체 및 컴퓨터 프로그램을 제공한다.

Description

데이터 검색 방법, 장치, 시스템, 기기 및 컴퓨터 판독 가능 저장 매체{METHOD AND APPARATUS FOR DATA SEARCH, SYSTEM, DEVICE AND COMPUTER READABLE STORAGE MEDIUM}
이 개시는 컴퓨터 기술 분야에 관련되며, 특히 데이터 검색 방법, 장치, 시스템, 기기, 컴퓨터 판독 가능 저장 매체 및 컴퓨터 프로그램에 관련된다.
검색 엔진을 이용하여 검색을 수행하는 과정에서, 일반적으로 검색 결과에 대응하는 리소스에 대해 고정된 만료 시간을 설정하며, 만료 시간에 도달하면 캐시(Cache)가 백엔드로 침투하여 새로운 리소스를 획득할 수 있다. 고정 만료 시간을 기반으로 검색을 수행하는 경우, 검색 엔진의 기계 비용과 검색 결과의 적시성 양자 간에 충돌이 존재한다.
이 개시의 실시예는 데이터 검색 방법, 장치, 시스템, 기기, 컴퓨터 판독 가능 저장 매체 및 컴퓨터 프로그램을 제공한다.
제1 양태에서, 이 개시의 실시예는 데이터 검색 방법을 제공하며, 이 방법은: 수신된 검색어에 대한 의미 이해를 통해, 상기 검색어에 대응하는 의미 이해 정보를 결정하고; 상기 의미 이해 정보에 따라, 상기 검색어의 적시성 요구 정보를 분석하여 획득하고; 상기 검색어의 적시성 요구 정보를 기반으로, 상기 검색어에 대응하는 리소스 결과의 획득 방식을 결정하며; 선택한 획득 방식에 따라, 상기 검색어에 대응하는 리소스 결과를 획득하는 것을 포함한다.
제2 양태에서, 이 개시의 실시예는 데이터 검색 장치를 제공하며, 이 장치는: 수신된 검색어에 대한 의미 이해를 통해 상기 검색어에 대응하는 의미 이해 정보를 결정하는데 사용하는, 정보 획득 모듈; 상기 의미 이해 정보에 따라 상기 검색어의 적시성 요구 정보를 분석하여 획득하는데 사용되는, 정보 분석 모듈; 상기 검색어의 적시성 요구 정보에 기반하여 상기 검색어에 대응하는 리소스 결과의 획득 방식을 결정하는데 사용되는, 방식 결정 모듈; 선택된 획득 방식에 따라 상기 검색어에 대응하는 리소스 결과를 획득하는데 사용되는, 결과 획득 모듈;을 포함한다.
제3 양태에서, 이 개시의 실시예는 데이터 서비스 시스템을 제공하며, 이 시스템은 입력된 검색어를 수신하는데 사용되는, 입력 모듈; 수신된 검색어에 따라 전술한 어느 하나의 데이터 검색 방법을 실행하여 검색어에 대응하는 리소스 결과의 획득 방식 및 리소스 결과를 획득하는데 사용되는, 처리 모듈;을 포함한다.
제4 양태에서, 이 개시의 실시예는 전자 기기를 제공하며, 이 기기는: 하나 이상의 프로세서; 그 위에 하나 이상의 프로그램을 저장하고, 하나 이상의 프로그램이 하나 이상의 프로세서에 의해 실행될 때, 하나 이상의 프로세서는 전술한 어느 하나의 데이터 검색 방법을 구현하는 메모리; 프로세서와 메모리 사이에 연결되고, 프로세서와 상기 메모리 사이의 정보 인터랙션을 구현하도록 구성되는 하나 이상의 I/O 인터페이스를 포함한다.
제5 양태에서, 이 개시의 실시예는 컴퓨터 판독 가능 저장 매체를 제공하며, 이 매체는: 그 위에 컴퓨터 프로그램이 저장되며, 컴퓨터 프로그램이 프로세서에 의해 실행될 때 전술한 어느 하나의 데이터 검색 방법을 구현한다.
제6 양태에서, 이 개시의 실시예는 컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램을 제공하며, 컴퓨터 프로그램이 프로세서에 의해 실행될 때 전술한 어느 하나의 데이터 검색 방법을 구현한다.
이 개시의 실시예가 제공하는 데이터 검색 방법, 장치, 시스템, 기기, 컴퓨터 판독 가능 저장 매체 및 컴퓨터 프로그램은, 검색어의 의미 이해 정보에 따라 상기 검색어의 적시성 요구 정보를 분석하여 획득하고, 또한 분석하여 획득한 적시성 요구 정보에 따라 리소스 결과의 획득 방식을 결정하여, 그 획득 방식에 대응하는 리소스 결과를 획득한다. 이 개시의 실시예에 따른 데이터 검색 방법에서, 검색어에 대한 적시성 분석을 통해, 검색어의 적시성에 대해 정확한 판정을 수행하여, 검색어의 적시성과 일치하는 리소스 결과의 획득 방식을 선택할 수 있으므로, 검색 엔진의 기계 비용과 적시성 효과 모두에서 균형과 상생을 실현할 수 있다.
첨부 도면은 이 개시의 실시예에 대한 이해를 돕기 위해 제공되고, 명세서의 일부를 구성하며, 이 개시의 실시예와 함께 이 개시를 해석하기 위해 사용되는 것으로, 이 개시를 제한하는 것이 아니다. 첨부 도면을 참조하여 상세한 예시적인 실시예를 설명함으로써, 상기 및 기타 특징 및 장점이 이 분야의 기술자에게 더욱 명백해질 것이다. 첨부 도면에서:
도 1은 이 개시의 실시예에 의해 제공되는 시나리오의 개략도이다.
도 2는 이 개시의 실시예에 의해 제공되는 데이터 검색 방법의 흐름도이다.
도 3은 이 개시의 실시예에 따른 검색 시스템의 아키텍처의 개략도이다.
도 4는 이 개시의 실시예에 의해 제공되는 데이터 검색 장치의 구성 블록도이다.
도 5는 이 개시의 실시예에 의해 제공되는 정보 서비스 시스템의 구성 블록도이다.
도 6은 이 개시의 실시예에 의해 제공되는 전자 기기의 구성 블록도이다.
도 7은 이 개시의 실시예에 의해 제공되는 컴퓨터 판독 가능 저장 매체의 구성 블록도이다.
이 분야의 기술자가 이 개시의 기술 방안을 보다 잘 이해할 수 있도록 하기 위해, 다음은 첨부 도면을 참조하여 이 개시에 의해 제공되는 데이터 검색 방법, 장치, 시스템, 기기 및 컴퓨터 판독 가능 저장 매체 및 컴퓨터 프로그램에 대해 상세하게 설명한다.
이하에서 첨부 도면을 참조하여 예시적인 실시예를 보다 상세하게 설명하지만, 예시적인 실시예는 다른 형태로 구현될 수 있으며, 여기에서 설명하는 실시예로 제한하는 것으로 해석해서는 안 된다. 달리 말하면, 이러한 실시예를 제공하는 목적은 이 개시를 철저하고 완전하게 만들고, 또한 이 분야의 기술자가 이 개시의 범위를 완전히 이해할 수 있도록 하는 것이다.
상충되지 않는 한, 이 개시의 실시예 및 실시예 중의 각 특징은 서로 결합될 수 있다.
이 명세서에서 사용되는 용어 "및/또는"은 하나 이상의 관련된 나열된 항목의 임의의 조합 및 모든 조합을 포함한다.
이 명세서에서 사용된 용어는 특정 실시예를 설명하기 위해서만 사용되며, 이 개시를 제한하려는 의도는 아니다. 이 명세서에서 사용된 바와 같이, 단수 형태의 "하나" 및 "그"는 문맥상 명백하게 달리 지시하지 않는 한 복수 형태를 포함하도록 의도된다. 또한 이 명세서에서 "포함하는" 및/또는 "구성되는"이라는 용어가 사용될 때, 설명된 특징, 전체, 단계, 조작, 요소 및/또는 구성 요소의 존재를 지정하는 것이지만, 하나 이상의 다른 특징, 전체, 단계, 조작, 요소, 구성 요소 및/또는 그 그룹의 존재 또는 추가를 배제하지 않는다는 것을 이해할 것이다.
달리 정의되지 않는 한, 여기서 사용되는 모든 용어의 의미(기술 용어 및 과학 용어를 포함)는 이 분야의 기술자가 일반적으로 이해하는 것과 동일하다. 또한 일반적으로 사용되는 사전에서 정의된 용어와 같은 용어는 관련 기술 및 이 개시의 배경에서의 의미와 일치되는 의미를 갖는 것으로 해석되어야 하며, 또한 이 명세서가 명확하게 정의하지 않는 한 이상화되거나 과도하게 형식적인 의미를 갖는 것으로 해석하지 않아야 한다는 것을 이해할 것이다.
도 1은 이 개시의 실시예에 따른 시나리오의 개략도이다. 도 1에 도시된 시나리오에서. 사용자(10), 단말(20), 정보 서비스 시스템(30) 및 백엔드 서버(40)를 포함하며, 단말(20)에서는 검색 엔진의 애플리케이션 프로그램을 실행할 수 있다.
그 중에서, 사용자(10)는 단말(20)을 이용하여 인터넷에 접속하고, 또한 단말(20)에서 검색 엔진을 실행하여 검색어에 대한 네트워크 검색을 수행할 수 있다. 예시적으로, 단말(10)은 휴대폰, 개인용 컴퓨터, 태블릿 컴퓨터, 스마트 웨어러블 장치, 데스크톱 컴퓨터, 노트북 컴퓨터 등을 포함할 수 있으나 이에 제한되지 않는다. 이들은 모두 검색 엔진의 애플리케이션 프로그램을 설치하고 실행할 수 있다.
계속해서 도 1을 참조하면, 이 개시의 실시예의 정보 서비스 시스템(30)은 검색 엔진을 통해 입력된 검색어를 수신할 수 있으며, 또한 검색어에 대응하는 의미 이해(semantic understanding) 정보와 시스템 정보에 대해 분석을 수행하여, 분석 후 업데이트된 리소스 결과를 획득하기 위해 캐시를 침투해야 하는 경우, 캐시 침투 처리를 트리거해야 한다; 백엔드 서버(40)는 검색어에 대한 리콜, 정렬, 융합 및 데이터 액세스 등과 같은 처리를 제공하는데 사용될 수 있다.
도 1의 설명을 통해 알 수 있듯이, 이 개시의 실시예에 따른 정보 서비스 시스템(30)은: 프론트엔드 검색 엔진에 대응하는 서버와 백엔드 서버(40) 사이에 위치하여, 검색 엔진에서 획득한 검색어에 대해 정보 처리를 수행하고, 또한 처리 결과에 따라 최신의 리소스 결과의 서비스 시스템을 획득하기 위해 백엔드 서버(40)를 트리거해야 하는지 여부를 결정하는데 사용되는 것으로 이해할 수 있다. 이하의 실시예의 설명에서, 정보 서비스 시스템(30)은 또한 정보 센터 시스템으로 지칭될 수 있다.
일부 시나리오에서, 검색 엔진을 사용하여 검색을 수행할 때, 검색어에 따라 크롤링된 리소스 결과를 캐시에 저장할 수 있으며, 또한 침투 메커니즘의 만료 시간을 설정하여, 침투 만료 시간에 도달하지 않으면, 캐시 중의 리소스 결과에 따라 검색어의 검색 결과를 획득하고, 침투 만료 시간에 도달한 후에는, 침투 처리를 수행하여 그 검색어의 최신 리소스 결과를 획득할 수 있다.
이 응용 시나리오에서, 고정된 정적 구성 만료 시간을 갖는 침투 메커니즘은, 일반적으로 고정된 만료 시간을 기반으로 하여 무분별한 침투를 수행하므로, 기계의 비용과 적시성 효과 면에서 모순과 갈등이 발생하기 쉬워, 상생을 얻기가 어렵다.
예를 들어, 검색 중에 캐시가 백엔드로 침투하여 새 리소스를 더 많이 획득할수록 검색 엔진이 검색 결과를 획득하는 적시성은 더 향상되지만, 기계 비용은 오히려 크게 증가한다; 반대로, 검색 중에 캐시에 직접 적중하여 리소스를 획득하면, 검색 엔진의 기계 비용은 낮아 지지만, 검색 엔진이 검색 결과를 획득하는 적시성 효과에 영향을 미칠 수 있다.
따라서, 검색 엔진의 검색 적시성을 향상시키기 위해서는 일반적으로 기계 비용의 통제를 희생해야 하고, 검색 엔진의 기계 비용을 줄이기 위해서는 검색 엔진의 검색 적시성을 희생해야 한다.
이 개시는 의미 이해 정보와 시스템 정보 구조의 두가지 유형 정보를 결합하여 검색 시스템의 침투 메커니즘에 작용하여, 현재 검색어의 트래픽에 대한 침투 처리 수행 여부를 종합 판단할 수 있는 데이터 검색 방법, 장치, 시스템, 기기, 컴퓨터 판독 가능 저장 매체 및 컴퓨터 프로그램을 제공한다.
이하의 실시예는 모두 이 실시예의 시스템 아키텍처에 적용될 수 있음을 이해해야 한다. 간결한 설명을 위해, 이하의 각 실시예는 서로를 참조하고 인용할 수 있다.
도 2는 이 개시의 실시예에 따른 데이터 검색 방법의 흐름도이다.
제 1 양태에서, 도 2를 참조하면, 그 개시의 실시예는 데이터 검색 방법을 제공하고, 이 데이터 검색 방법은 다음 단계를 포함할 수 있다.
S110 단계: 수신된 검색어에 대한 의미 이해를 통해, 검색어에 대응하는 의미 이해 정보를 결정한다.
S120 단계: 의미 이해 정보에 따라, 검색어의 적시성 요구 정보를 분석하여 획득한다.
S130 단계: 검색어의 적시성 요구 정보를 기반으로, 검색어에 대응하는 리소스 결과의 획득 방식을 결정한다.
S140 단계: 선택한 획득 방식에 따라, 검색어에 대응하는 리소스 결과를 획득한다.
이 개시의 실시예에 따른 데이터 검색 방법에 따르면, 검색어의 의미 이해 정보에 따라, 상기 검색어의 적시성 요구 정보를 분석하여 획득함으로써, 검색어에 대한 적시성 분석을 통해, 검색어의 적시성에 대해 정확한 판정을 수행하여, 검색어의 적시성과 일치하는 리소스 결과의 획득 방식을 선택할 수 있으므로, 검색 엔진의 기계 비용과 적시성 효과 모두에서 균형과 상생을 실현할 수 있다.
일부 실시예에서, S120 단계는 구체적으로 다음을 포함할 수 있다: 상기 의미 이해 정보 중의 정보 항목, 및 상기 의미 이해 정보 중의 정보 항목에 대응하는 사전 설정된 가중치 계수에 따라, 상기 검색어의 적시성 요구 정보를 계산하여 획득한다.
그 중에서, 상기 의미 이해 정보는: 문자적 의미, 의미 완성도 및 돌발성 키워드 확률의 정보 항목 중 적어도 하나의 포함할 수 있다.
예를 들어, "장산 이혼" 및 "특정 도시의 지진"이라는 검색어의 경우, 검색어의 문자적 의미를 통해 검색어의 적시성 요구 정보를 분석하여 획득할 수 있다. 예를 들어, "장산 이혼"은 문자적 의미에서 적시성이 약한 요구일 가능성이 높고, "특정 도시의 지진"은 문자적 의미에서 적시성이 강한 요구일 가능성이 높다.
예를 들어, “특정 스타의 영화 상영”이라는 검색어의 의미 완성도는 상대적으로 강하고, “특정 스타의” 의미 완성도는 상대적으로 약하기 때문에, “특정 스타의”에 비해 “특정 스타의 영화 상영”은 적시성 요구가 높다.
예를 들어, 돌발성 키워드는 돌발성 사건의 키워드 또는 돌발성 화제의 키워드로 이해될 수 있으며, 제1 검색어가 돌발성 키워드이고 또한 사람 검색을 통해 얻은 키워드인 것으로 감지되고, 제2 검색어가 돌발성 키워드로 감지되고 또한 기계 검색을 통해 얻은 키워드인 것으로 감지되면, 제1 검색어의 돌발성 키워드 확률이 제2 검색어의 돌발성 키워드 확률보다 높으므로, 제1 검색어의 적시성 요구가 제2 검색어의 적시성 요구보다 높다.
이 실시예에서, 문자적 의미, 의미 완성도 및 돌발성 키워드 확률 중 하나 이상을 결합하여, 검색어의 적시성 요구 정보를 종합적으로 판정할 수 있다.
하나의 실시예에서, S130 단계는 구체적으로 다음을 포함할 수 있다: 계산하여 획득한 상기 검색어의 적시성 요구 정보의 값이 미리 설정된 제 1 점수보다 큰 경우, 상기 검색어에 대응하는 리소스 결과의 획득 방식은 다음과 같이 결정된다: 미리 정해진 캐시의 침투를 트리거하여 업데이트된 리소스 결과를 획득한다. 계산하여 획득한 상기 검색어의 적시성 요구 정보의 값이 미리 설정된 제1 점수보다 작은 경우, 상기 검색어에 대응하는 리소스 결과의 획득 방식은 다음과 같이 결정된다: 미리 정해진 캐시에서 기존의 리소스 결과를 획득한다.
이 실시예에서, 검색어의 의미 이해 정보에 따라, 상기 검색어의 적시성 요구 정보를 분석하여 획득함으로써, 검색어의 적시성 요건 분석 값을 통해 검색어의 적시성에 대해 정확한 판정을 수행하여, 검색어의 적시성과 일치하는 리소스 결과의 획득 방식을 결정할 수 있다.
일부 실시예에서, 상기 S130 단계는 구체적으로 다음 단계를 포함할 수 있다.
S11 단계: 상기 검색어에 대응하는 시스템 정보를 결정한다.
S12 단계: 상기 검색어의 적시성 요구 정보와 상기 시스템 정보에 따라, 상기 검색어의 적시성과 기계 비용에 대해 종합 분석을 수행하여, 상기 검색어의 종합 분석 결과를 획득한다.
S13 단계: 상기 검색어의 종합 분석 결과에 따라, 상기 검색어에 대응하는 리소스 결과의 획득 방식을 결정한다.
이 실시예에서, 종합 분석 결과의 값이 미리 결정된 제 2 점수보다 크거나 같으면, 상기 선택된 획득 방식은 미리 정해진 캐시의 침투를 트리거하여 업데이트된 리소스 결과를 획득하는 것으로 결정되고; 검색어의 점수가 미리 정해진 제2 점수보다 낮으면, 상기 선택된 획득 방식은 미리 정해진 캐시에서 기존의 리소스 결과를 획득하는 것으로 결정된다.
이 개시의 실시예에서 제 1 점수와 제 2 점수는 사전 설정된 경험 값일 수 있고, 또한 제 1 점수와 제 2 점수는 동일하거나 상이할 수 있으며, 이 개시의 실시예는 이를 특별히 제한하지 않는다.
전술한 S11-S13 단계를 통해, 의미 이해 정보와 시스템 정보를 결합하여 상기 검색어의 적시성 및 기계 비용에 대해 종합 분석을 수행함으로써, 의미 이해 정보와 시스템 정보의 두 방면에서 현재 검색어와 일치하는 리소스 결과의 획득 방식을 종합적으로 결정하여, 검색 엔진의 기계 비용과 적시성 효과 모두에서 균형과 상생을 얻을 수 있다.
일부 실시예에서, S12 단계는 구체적으로 다음 단계를 포함할 수 있다.
S21 단계: 상기 의미 이해 정보 중의 정보 항목, 및 상기 의미 이해 정보 중의 정보 항목에 대응하는 사전 설정된 가중치 계수에 따라, 상기 검색어의 적시성 요구 정보를 계산하여 획득한다.
S22 단계: 상기 시스템 정보 중의 정보 항목, 및 상기 시스템 정보 중의 정보 항목에 대응하는 사전 결정된 가중치 계수에 따라 상기 검색어의 기계 비용 정보를 계산하여 획득한다.
S23 단계: 상기 검색어의 적시성 요구 정보와 상기 검색어의 기계 비용 정보를 결합하여, 상기 검색어의 종합 분석 결과를 획득한다.
전술한 S21-S23 단계를 통해, 의미 이해 정보와 시스템 정보, 및 대응하는 정보 항목의 가중치 계수를 결합하여, 각 검색어에 대해 가중 합산처리를 수행하여, 검색어의 점수를 획득하고, 또한 검색어의 점수에 따라 검색어에 대응하는 리소스 결과의 획득 방식을 결정한다. 이와 같이, 검색어에 대응하는 의미 이해 정보와 시스템 정보를 결합하여 검색 시스템의 검색 침투 메커니즘에 작용하여, 의미 이해 정보와 시스템 정보 두 방면에서 현재 검색어 트래픽에 대해 어떤 처리 방식을 선택해야 하는지를 종합적으로 판단함으로써, 엔진의 기계 비용과 적시성 효과 모두에서 균형과 상생을 얻는다.
전술한 S120 단계 또는 전술한 S21 단계에서, 상기 검색어의 적시성 요구 정보를 계산하여 획득한 후에, 다음 단계를 더 포함할 수 있다.
S31 단계: 상기 검색어의 검색 관련 정보를 결정하고, 상기 검색 관련 정보는 상기 검색어의 검색 빈도 및 상기 검색어에 대응하는 리콜 결과 수 중 적어도 하나를 포함한다.
S32 단계: 상기 검색 관련 정보, 및 상기 검색 관련 정보에 대응하는 사전 결정된 가중치 계수에 따라, 상기 검색어의 적시성 관련 정보를 계산하여 획득한다.
S33 단계: 계산하여 획득한 상기 검색어의 적시성 요구 정보와 상기 적시성 관련 정보를 상기 검색어의 적시성 요구 정보로 사용한다.
전술한 S31-S33 단계를 통해, 검색어의 검색 빈도, 리콜 횟수, 및 검색어의 의미 이해 정보에 따라, 검색어의 적시성 요구 정보를 공동으로 결정할 수 있다.
일부 실시예에서, S12 단계 이전에, 다음 단계를 더 포함할 수 있다.
S30 단계: 상기 적시성 정보와 상기 시스템 정보에 대해 전처리를 수행하고, 그 중에서, 상기 전처리는 데이터 정규화 처리 및 특징 표준화 처리 중 적어도 하나를 포함한다.
이 실시예에서, 특징 표준화 처리를 통해, 적시성 정보 및 시스템 정보를 동일한 특징 차원으로 변환할 수 있으므로, 동일한 특징 차원에서 정보 처리를 수행할 수 있다; 그리고, 정규화 처리를 통해 의미 이해 정보와 시스템 정보의 값을 0-1 사이로 규정할 수 있으므로, 대응하는 가중치 계수를 사용하여 전처리된 의미 이해 정보와 시스템 정보에 대해 가중치 합산 처리를 수행하여, 검색어의 종합 분석 결과를 획득할 수 있다.
이 개시의 실시예에서, S120 단계 이전에 다음을 더 포함할 수 있다: 상기 의미 이해 정보 중의 정보 항목에 대해 전처리를 수행한다. 그 전처리는 S30 단계에서 적시성 정보의 전처리의 구체적인 내용과 일치하므로, 이 개시의 실시예는 반복 설명하지 않는다.
일부 실시예에서, 검색어에 대응하는 리소스 결과는 미리 정해진 백엔드 처리에 대응하는 리소스 결과이고, 미리 정해진 캐시는 미리 정해진 백엔드 처리에 대응하는 캐시이다.
일부 실시예에서, 상기 리소스 결과의 획득 방식은 미리 정해진 캐시에서 기존의 리소스 결과를 획득하는 것과, 미리 정해진 캐시의 침투를 트리거하여 업데이트된 리소스 결과를 획득하는 것을 포함하고; 상기 미리 정해진 캐시는 미리 정해진 백엔드 처리 과정에 대응하는 캐시이고, 상기 백엔드 처리 과정은: 리콜 계층 처리, 정렬 계층 처리, 융합 계층 처리 및 액세스 계층 처리 중 적어도 하나를 포함하며; 상기 미리 정해진 캐시는: 융합 계층 캐시 및 정렬 계층 캐시 중 적어도 하나를 포함한다.
이 실시예에서, 상이한 백엔드 처리 과정에 대응하는 의미 이해 정보 중의 정보 항목은 상이할 수 있고, 상이한 백엔드 처리 과정에 대응하는 시스템 정보 내의 정보 항목도 상이 할 수 있다. 상이한 백엔드 처리 과정에 대응하는 의미 이해 정보 항목의 가중치와 대응하는 시스템 정보 항목의 가중치를 기반으로, 검색어를 채점하여, 미리 정해진 백엔드 처리에 대응하는 검색어의 점수를 획득한다.
일부 실시예에서, 의미 이해 정보에 포함된 정보 항목에 대응하는 가중치 계수는, 적시성 요구 정보에 대한 의미 이해 정보 중의 각 정보 항목의 영향 정도에 따라 결정되는 가중치 계수이고; 시스템 정보에 포함된 정보 항목에 대응하는 가중치 계수는, 시스템 성능에 대한 시스템 정보 중의 각 정보 항목의 영향 정도에 따라 결정되는 가중치 계수이다.
하나의 실시예에서, 상기 시스템 정보 중의 정보 항목은: 시스템 용량, 시스템 응답 시간, 시스템 응답 속도, 시스템 부하 및 리소스 요청량 중 적어도 하나를 포함한다;
또한, 그 중에서, 각 백엔드 처리 과정에 대응하는 시스템 정보는 상이하고, 또한 검색어의 상이한 검색 시간에, 시스템 정보에 포함된 정보 항목에 대응하는 가중치 계수는 상이할 수 있다.
일부 실시예에서, 상기 의미 이해 정보 중의 각 정보 항목의 가중치 계수 및 시스템 정보 중의 각 정보 항목의 가중치 계수는 사용자가 미리 설정한 경험 값일 수도 있다.
일부 실시예에서, 상기 검색어에 대응하는 리소스 결과의 획득 방식은: 미리 정해진 캐시에서 기존의 리소스 결과를 획득하는 방식과, 미리 정해진 캐시의 침투를 트리거하여 업데이트된 리소스 결과를 획득하는 방식 중 하나이다.
이 개시의 실시예의 데이터 검색 방법에 따르면, 의미 이해 정보와 시스템 정보의 두 가지 유형 정보를 결합하여 검색 시스템의 침투 메커니즘에 작용하여, 시스템의 현재 모듈의 검색어에 대응하는 트래픽에 대해 점수를 매기고, 현재 트래픽이 계속해서 다운 스트림으로 침투하는지 종합적으로 판단하여, 결과의 적시성 및 리소스 비용에서 계속적으로 전체적인 최적을 유지한다.
이 개시의 데이터 검색 방법을 보다 잘 이해하기 위해, 다음은 도 3을 참조하여, 이 개시의 실시예에 따른 데이터 검색 방법의 처리 과정을 설명한다. 도 3은 이 개시의 실시예의 검색 시스템의 아키텍처의 개략도이다. 도 1의 구성 요소와 동일하거나 동등한 도 3의 구성 요소는 동일한 참조 번호를 사용한다.
도 3에 도시된 바와 같이, 백엔드 서버(40)는: 로직 레벨에서 적어도 리콜 계층 모듈(41), 분류 계층 모듈(42), 융합 계층 모듈(43) 및 액세스 계층 모듈(44)과 같은 처리 모듈을 포함할 수 있다. 그 중에서, 백엔드 서버(40)는 또한 정렬 계층 캐시(45) 및 융합 계층 캐시(46)와 같은 캐시 모듈을 포함할 수 있다.
실제 응용 시나리오에서, 백엔드 서버(40)는 또한 로직 레벨의 다른 계층 모듈과 다른 계층의 캐시 모듈을 포함할 수 있으며, 이는 이 개시의 실시예에서 특별히 제한되지 않는다.
일부 실시예에서, 검색 엔진의 미리 정해진 백엔드 처리 과정은: 리콜 계층 모듈(41)에 대응하는 리콜 계층 처리, 정렬 계층 모듈(42)에 대응하는 정렬 계층 처리, 융합 계층 모듈(43)에 대응하는 융합 계층 처리 및 액세스 계층 모듈(44)에 대응하는 액세스 계층 처리 중 적어도 하나를 포함할 수 있다. 미리 정해진 캐시는: 융합 계층 캐시(46) 및 정렬 계층 캐시(45) 중 적어도 하나를 포함한다.
예시적으로, 상기 리콜 계층 처리는: 예를 들어 수신된 검색어에 대해, 검색 엔진을 통해 기존의 검색 기술을 기반으로 리콜 처리를 수행하여, 리콜된 검색 결과를 획득하는 것을 포함한다; 정렬 계층 처리는: 예를 들어 검색어에 따른 백엔드 리콜 결과에 대해 적시성 인식을 수행하고, 적시성 인식 결과에 따라 적시성이 높은 순서에서 낮은 순서로 정렬하여, 검색어에 대응하는 정렬 계층 리소스 결과를 획득하고, 또한 정렬 계층 리소스 결과를 정렬 계층 캐시에 저장한다; 융합 계층 처리는: 예를 들어 정렬 계층 리소스 결과에 미리 정해진 디스플레이 콘텐츠를 융합하여, 융합 계층 리소스 결과를 획득하고, 또한 융합 계층 리소스 결과를 융합 계층 캐시에 저장한다; 액세스 계층 처리는: 예를 들어 검색어의 검색에 대해 부하 밸런싱 및 재해 복구 처리를 수행하는 것을 포함할 수 있다.
예시적으로, 액세스 계층 처리 과정에서, 정적 웹 페이지의 액세스 속도를 향상시키기 위해, 검색 요청을 여러 서버로 전달하여, 부하 밸런싱의 목적을 달성할 수 있다.
계속해서 도 3을 참조하면, 정보 서비스 시스템(즉, 정보 센터 시스템)(30)은 의미 이해 정보와 시스템 정보의 두 가지 유형 정보를 결합하여 검색 시스템의 백엔드 서버의 상이한 계층의 침투 메커니즘에 작용할 수 있다.
이 개시의 실시예에서, 백엔드 서버(40)의 리콜 계층 모듈(41), 정렬 계층 모듈(42), 융합 계층 모듈(43) 및 액세스 계층 모듈(44)은 상이한 침투 메커니즘을 가질 수 있다.
즉, 이 실시예에서, 정보 센터 시스템(30) 중의 의미 이해 정보와 시스템 정보는 모두 복수의 정보 항목을 포함할 수 있다. 이에 상응하게, 리콜 계층 모듈(41), 정렬 계층 모듈(42), 융합 계층 모듈(43) 및 액세스 계층 모듈(44)은 각각 상이한 의미 이해 정보 항목 및 상이한 시스템 정보 항목에 대응할 수 있으며, 각 모듈은 대응하는 의미 정보 항목과 시스템 정보 항목에 따라 각자 상이한 침투 메커니즘을 실현할 수 있다.
이 개시의 실시예에서, 설명을 단순화하기 위해, 아래에 설명되는 실시예는 도 3의 정렬 계층 모듈에 대응하는 데이터 처리를 예로 하여, 정보 센터의 검색 침투 메커니즘에 기반한 백엔드 처리 모듈 중의 데이터 처리 방법을 설명한다. 그러나, 이 설명은 이 방안의 범위나 구현 가능성을 제한하는 것으로 해석할 수 없으며, 정렬 계층 모듈 이외의 다른 백엔드 처리 모듈의 처리 방법은 정렬 계층 모듈의 처리 방법과 일치한다.
일부 실시예에서, 정렬 계층 모듈에 적용될 때, 정보 서비스 시스템의 검색 침투 메커니즘에 기반한 데이터 처리 방법은 다음 단계를 포함할 수 있다.
S51단계: 구축된 정보 서비스 시스템에서, 현재 검색어의 트래픽에 대해, 미리 설정된 의미 이해 정보와 시스템 정보로부터, 정렬 계층 모듈에 대응하는 의미 이해 정보 항목과 시스템 정보 항목을 결정한다.
S52단계: 각 의미 이해 정보 항목의 가중치 계수와 각 시스템 정보 항목의 가중치 계수를 획득한다.
S53단계: 획득한 각 의미 이해 정보 항목의 가중치 계수와 획득한 각 시스템 정보 항목의 가중치 계수에 따라, 정렬 계층 모듈에 대응하는 의미 이해 하위 정보와 시스템 정보 항목에 대해 가중 합산 처리를 수행하여, 정렬 계층 모듈에서 현재 검색어의 점수를 획득한다.
S54단계: 정렬 계층 모듈에서 현재 검색어의 점수가 미리 설정된 제1 점수를 초과하면, 그 검색어의 트래픽에 대해 침투 처리를 수행한다.
예시적으로, 점수가 미리 설정된 제1 점수를 초과하면, 그 검색어의 적시성이 강하여, 침투 처리를 통해 최신의 리콜 결과를 획득해야 한다고 결정할 수 있다. 점수가 제1 점수를 초과하지 않으면, 적시성 요구가 낮거나 또는 현재 시스템 아키텍처가 높은 성능을 유지해야 한다는 것을 의미하므로, 전술한 침투 처리를 수행할 필요가 없다.
전술한 S51-S54 단계를 통해, 의미 이해 정보 집합 중의 문자적 의미 정보를 통해, 검색어가 높은 확률로 적시성이 높은 요구일 수 있다고 판단하면, 시스템 정보에서 시스템 현재 실시간의 용량 정보를 결합하여 현재 요청이 다운 스트림으로 침투해서 업데이트된 리소스 결과를 획득해야만 하는 것인지 여부를 종합적으로 판단하여, 최신의 결과를 사용자에게 더 빠르게 표시할 수 있다.
도 4는 이 개시의 실시예에 따른 데이터 검색 장치의 구성 블록도이다.
제 2 양태에서, 도 4를 참조하면, 이 개시의 실시예는 데이터 검색 장치를 제공하며, 그 데이터 검색 장치는 다음과 같은 모듈을 포함할 수 있다.
정보 획득 모듈(210)은, 수신된 검색어에 대한 의미 이해를 통해 상기 검색어에 대응하는 의미 이해 정보를 결정하는데 사용된다.
정보 분석 모듈(220)은, 상기 의미 이해 정보에 따라 상기 검색어의 적시성 요구 정보를 분석하여 획득하는데 사용된다.
방식 결정 모듈(230)은, 상기 검색어의 적시성 요구 정보에 기반하여 상기 검색어에 대응하는 리소스 결과의 획득 방식을 결정하는데 사용된다.
결과 획득 모듈(240)은, 선택된 획득 방식에 따라 상기 검색어에 대응하는 리소스 결과를 획득하는데 사용된다.
이 개시의 실시예에 따른 데이터 검색 장치에 따르면, 검색어의 의미 이해 정보에 따라 상기 검색어의 적시성 요구 정보를 분석하여 획득함으로써, 검색어에 대한 적시성 분석을 통해, 검색어의 적시성에 대해 정확한 판정을 수행하여, 검색어의 적시성과 일치하는 리소스 결과의 획득 방식을 결정하여, 검색 엔진의 기계 비용과 적시성 효과 모두에서 균형과 상생을 실현할 수 있다.
일부 실시예에서, 정보 분석 모듈(220)은: 구체적으로 상기 의미 이해 정보 중의 정보 항목, 및 상기 의미 이해 정보 내의 정보 항목에 대응하는 사전 설정된 가중치 계수에 따라 상기 검색어의 적시성 요구 정보를 계산하여 획득하는데 사용된다; 그 중에서, 상기 의미 이해 정보는: 문자적 의미, 의미 완성도 및 돌발성 키워드 확률 중 적어도 하나를 포함한다.
일부 실시예에서, 정보 획득 모듈(210)은, 또한 상기 검색어에 대응하는 시스템 정보를 결정하는데 사용된다; 방식 결정 모듈(230)은, 또한 상기 검색어의 적시성 요구 정보와 상기 시스템 정보에 따라 상기 검색어의 적시성 및 기계 비용에 대한 종합 분석을 수행하여 상기 검색어의 종합 분석 결과를 획득하는데 사용된다. 결과 획득 모듈(240)은, 또한 상기 검색어의 종합 분석 결과에 따라 상기 검색어에 대응하는 리소스 결과의 획득 방식을 결정하는데 사용된다.
일부 실시예에서, 정보 분석 모듈(220)은, 또한 상기 의미 이해 정보 중의 정보 항목, 및 상기 의미 이해 정보 중의 정보 항목에 대응하는 사전 설정된 가중치 계수에 따라 상기 검색어의 적시성 요구 정보를 계산하여 획득하고; 상기 시스템 정보 중의 정보 항목 및 상기 시스템 정보 중의 정보 항목에 대응하는 사전 결정된 가중치 계수에 따라 상기 검색어의 기계 비용 정보를 계산하여 획득하며; 상기 검색어의 적시성 요구 정보와 상기 검색어의 기계 비용 정보를 결합하여 상기 검색어의 종합 분석 결과를 획득하는데 사용된다.
일부 실시예에서, 정보 분석 모듈(220)은 구체적으로 상기 검색어의 적시성 요구 정보를 계산하여 획득하는데 사용된 후에, 또한 상기 검색어의 검색 관련 정보를 결정하는데 사용되며, 상기 검색 관련 정보는 상기 검색어의 검색 빈도와 상기 검색어에 대응하는 리콜 결과의 수 중 적어도 하나를 포함하며; 상기 검색 관련 정보, 및 상기 검색 관련 정보에 대응하는 사전 결정된 가중치 계수에 따라 상기 검색어의 적시성 관련 정보를 계산하여 획득하며; 계산하여 획득한 상기 검색어의 적시성 요구 정보와 상기 적시성 관련 정보를 상기 검색어의 적시성 요구 정보로 사용한다.
일부 실시예에서, 데이터 검색 장치는 또한 전처리 모듈을 포함할 수 있으며, 이 모듈은 상기 검색어의 적시성 요구 정보와 상기 시스템 정보에 따라 상기 검색어의 적시성과 기계 비용에 대해 종합 분석을 수행하기 전에, 상기 적시성 정보와 상기 시스템 정보에 대해 전처리를 수행하는데 사용되며, 그 중에서, 상기 전처리는 데이터 정규화 처리 및 특징 표준화 처리 중 적어도 하나를 포함한다.
일부 실시예에서, 상기 리소스 결과의 획득 방식은 미리 정해진 캐시에서 기존의 리소스 결과를 획득하는 것과, 미리 정해진 캐시의 침투를 트리거하여 업데이트된 리소스 결과를 획득하는 것을 포함하고; 상기 미리 정해진 캐시는 미리 정해진 백엔드 처리 과정에 대응하는 캐시이고, 상기 백엔드 처리 과정은: 리콜 계층 처리, 정렬 계층 처리, 융합 계층 처리 및 액세스 계층 처리 중 적어도 하나를 포함하며; 상기 미리 정해진 캐시는: 융합 계층 캐시 및 정렬 계층 캐시 중 적어도 하나를 포함한다.
일부 실시예에서, 상기 시스템 정보 중의 정보 항목은: 시스템 용량, 시스템 응답 시간, 시스템 응답 속도, 시스템 부하 및 리소스 요청량 중 적어도 하나를 포함한다; 또한, 그 중에서, 각 백엔드 처리 과정에 대응하는 의미 이해 정보 중의 정보 항목은 상이하고, 대응하는 시스템 정보 중의 정보 항목은 상이하며, 또한 상기 검색어의 상이한 검색 시간에서, 상기 시스템 정보 중의 정보 항목에 대응하는 가중치 계수는 상이하다.
이 개시의 실시예에 따른 데이터 검색 장치에 따르면, 의미 이해 정보와 시스템 정보를 결합하여 각 검색어에 대해 종합 분석을 수행하고, 또한 종합 분석 결과에 따라, 현재 검색 요청이 캐시를 적중하는 것으로 결정하여 대응하는 캐시 중의 리소스 결과를 직접 반환하거나, 또한, 침투 처리를 수행하여 그 검색어에 대응하는 업데이트된 리소스 결과를 획득함으로써, 검색 엔진의 기계 비용과 적시성 효과 모두에서 균형과 상생을 얻을 수 있다.
제 3 양태에서, 도 5를 참조하면, 이 개시의 실시예는 정보 서비스 시스템을 제공하며, 그 시스템은 다음을 포함한다: 입력 모듈(310)은, 입력된 검색어를 수신하는데 사용된다; 처리 모듈(320)은, 수신된 검색어에 따라 이 개시의 실시예의 데이터 검색 방법을 실행하여 검색어에 대응하는 리소스 결과의 획득 방식 및 리소스 결과를 획득하는데 사용된다.
이 개시의 실시예에 의해 구축된 정보 서비스 시스템을 통해, 의미 이해 정보와 시스템 정보의 두 가지 유형 정보를 결합하여 검색 시스템의 침투 메커니즘에 작용하여 시스템의 현재 모듈의 각 트래픽에 대해 종합 분석을 수행하여, 기계 비용과 적시성 효과의 균형과 상생을 달성할 수 있다.
실제 응용 시나리오에서, "전국 노동 조합 고용 서비스 플랫폼"과 같은 입력된 검색어에 대해, 이 개시의 실시예에서 제공하는 정보 센터 시스템이 온라인 상태가 되기 전에, 검색 시스템이 고정된 정적 구성의 만료 시간을 채택한다면, 일반적으로 고정된 만료 시간에 기반하여 무분별한 침투를 진행하며, 이때 그 검색어의 검색 결과는 최신의 리소스 결과가 아니다.
정보 센터 시스템이 온라인 상태가 된 후, "전국 노동 조합 고용 서비스 플랫폼"의 길고 차가운(문자가 길고 또한 검색량이 적은) 검색어에 대해, 이 개시의 실시예에서의 데이터 검색 방법을 통해, 의미 이해 정보와 시스템 정보를 결합하여 검색어에 대해 점수를 매기고, 점수 결과에 따라, 특정 순간에 그 검색어가 적시성 속성을 가진 돌발성 검색어로 변했음을 신속하게 인식하고, 마지막으로 최신의 리소스 결과를 사용자에게 표시함으로써, 검색 엔진의 기계 비용과 적시성 효과 모두에서 균형과 상생을 얻는 효과를 실현할 수 있다.
이 개시의 실시예의 데이터 검색 방법, 장치, 시스템, 기기, 컴퓨터 판독 가능 저장 매체 및 컴퓨터 프로그램에 따르면, 정보 센터 시스템을 구축하여, 검색어에 대응하는 다차원 정보를 마이닝하고, 검색어에 대응하는 데이터 트래픽에 대해 지능적 강화 및 동적 침투의 방안을 수행함으로써, 많은 기계 비용을 절감하는 동시에, 검색어 적시성의 전체적인 돌발성 효과, 1 차 요구 급증 및 2 차 요구 급증 등의 차원에서 표현이 모두 탁월하므로, 검색 엔진의 기계 비용과 적시성 효과 모두에서 균형과 상생을 얻을 수 있다.
이 개시가 상기 실시예에서 설명되고 또한 도면에 도시된 특정 구성 및 처리에만 제한되지 않음에 유의할 필요가 있다. 설명의 편의성과 간결성을 위해, 데이터 처리 모듈의 데이터 검색 방법의 구체적인 작업 과정은 전술한 방법 실시예의 데이터 검색 방법의 대응 과정을 참조할 수 있으므로, 여기서는 반복 설명하지 않는다.
제4 양태에서, 도 6을 참조하면, 이 개시의 하나의 실시예는 다음을 포함하는 전자 기기를 제공한다:
하나 이상의 프로세서(401);
메모리(402)는 그 위에 하나 이상의 프로그램을 저장하고, 하나 이상의 프로그램이 하나 이상의 프로세서에 의해 실행될 때, 하나 이상의 프로세서는 전술한 어느 하나의 데이터 검색 방법을 구현한다;
하나 이상의 I/O 인터페이스(403)는 프로세서와 메모리 사이에 연결되고, 프로세서와 메모리 사이의 정보 인터랙션을 구현하도록 구성된다.
그 중에서, 프로세서(401)는 데이터 처리 능력을 가진 장치이고, 이는 중앙 처리 장치(CPU) 등을 포함하지만, 이에 제한되지는 않는다; 메모리(402)는 데이터 저장 기능을 가진 장치이며, 이는 랜덤 액세스 메모리(RAM, 보다 구체적으로는 SDRAM, DDR 등), 읽기 전용 메모리(ROM), 전기적으로 소거 가능 프로그래머블 읽기 전용 메모리(EEPROM), 플래시 메모리(FLASH)를 포함하지만, 이에 제한되지는 않는다; I/O 인터페이스(읽기-쓰기 인터페이스)(403)는 프로세서(401)와 메모리(402) 사이에 연결되어, 프로세서(401)와 메모리(402) 사이의 정보 인터랙션을 구현할 수 있으며, 이는 데이터 버스(Bus) 등을 포함하지만, 이에 제한되지는 않는다.
일부 실시예에서, 프로세서(401), 메모리(402) 및 I/O 인터페이스(403)는 버스를 통해 서로 연결되고, 컴퓨팅 장치의 다른 구성 요소에 추가로 연결된다.
제5 양태에서, 도 7을 참조하면, 이 개시의 실시예는 그 위에 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능 저장 매체를 제공하며, 프로그램이 프로세서에 의해 실행될 때 전술한 어느 하나의 데이터 검색 방법이 구현된다.
이 분야의 기술자는 위에서 공개된 방법 중의 전부 또는 일부 단계와, 시스템 및 장치 중의 기능 모듈/유닛이 소프트웨어, 펌웨어, 하드웨어 및 이들의 적절한 조합으로 구현될 수 있음을 이해할 수 있다. 하드웨어 구현에서, 위 설명에서 언급된 기능 모듈/유닛 간의 구분은 반드시 물리적 구성 요소의 구분과 일치하지는 것은 아니다; 예를 들어, 하나의 물리적 구성 요소는 여러 기능을 가질 수 있거나 하나의 기능 또는 단계가 여러 물리적 구성 요소의 협력에 의해 실행될 수 있다. 일부 물리적 구성 요소 또는 모든 물리적 구성 요소는 중앙 처리 장치, 디지털 신호 프로세서 또는 마이크로 프로세서와 같은 프로세서에 의해 실행되는 소프트웨어로 구현되거나, 하드웨어로 구현되거나 또는 전용 집적 회로와 같은 집적 회로로 구현될 수 있다. 이러한 소프트웨어는 컴퓨터 판독 가능 매체에 배포될 수 있으며, 컴퓨터 판독 가능 매체는 컴퓨터 저장 매체(또는 비 일시적 매체) 및 통신 매체(또는 일시적인 매체)를 포함할 수 있다. 이 분야의 기술자에게 잘 알려진 바와 같이, 컴퓨터 저장 매체라는 용어는 정보(예를 들면, 컴퓨터 판독 가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터)를 저장하기 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성,이동식 및 비 이동식 매체를 포함한다. 컴퓨터 저장 매체에는 RAM, ROM, EEPROM, 플래시 메모리 또는 기타 메모리 기술, CD-ROM, 디지털 다용도 디스크(DVD) 또는 기타 광 디스크 스토리지, 자기 카세트, 자기 테이프, 자기 디스크 스토리지 또는 기타 자기 저장 장치, 또는 원하는 정보를 저장하는데 사용되며 컴퓨터에서 액세스 할 수 있는 기타 모든 매체가 포함되지만, 이에 제한되지는 않는다. 또한, 이 분야의 기술자에게 잘 알려진 바와 같이, 통신 매체는 일반적으로 컴퓨터 판독 가능 명령어, 데이터 구조, 프로그램 모듈 또는 반송파 또는 기타 전송 메커니즘과 같은 변조된 데이터 신호의 기타 데이터를 포함하고, 또한 임의의 정보 전달 매체를 포함할 수 있다.
제6 양태에서, 이 개시의 실시예는 컴퓨터 판독 가능 매체에 저장된 컴퓨터 프로그램을 제공하며, 컴퓨터 프로그램이 프로세서에 의해 실행될 때 전술한 어느 하나의 데이터 검색 방법을 구현한다.
이 개시의 방법을 구현하기 위한 프로그램 코드는 하나 이상의 프로그래밍 언어의 임의의 결합으로 작성될 수 있다. 이러한 프로그램 코드는 범용 컴퓨터, 전용 컴퓨터 또는 기타 프로그램 가능 데이터 처리 장치의 프로세서 또는 컨트롤러에 제공될 수 있으므로 프로그램 코드가 프로세서 또는 컨트롤러에 의해 실행될 때 순서도 및/또는 블록 다이어그램에 지정된 기능/작업이 구현된다. 프로그램 코드는 전체적으로 기기에서 실행되거나, 부분적으로 기기에서 실행되고, 독립 소프트웨어 패키지로서 부분적으로 기기에서 실행되고 부분적으로 원격 기기에서 실행되거나, 또는 전체적으로 원격 기기 또는 서버에서 실행될 수 있다.
이 명세서에는 예시적인 실시예가 공개되고, 특정 용어가 채택되었지만, 이들은 단지 일반적인 설명적 의미로만 사용되고 해석되어야 하며, 제한적인 목적으로 사용되지는 않는다. 일부 실시예에서, 달리 명확하게 지시되지 않는 한, 특정 실시예와 결합하여 설명된 특징, 특성 및/또는 요소가 단독으로 사용될 수 있거나, 다른 실시예와 결합하여 설명된 특징, 특성 및/또는 요소의 조합이 사용될 수 있다는 것은 이 분야의 기술자에게 명백하다. 따라서, 이 분야의 기술자는 청구 범위에 의해 제시된 이 개시 내용의 범위를 벗어나지 않고 형태 및 세부 사항의 다양한 변경이 이루어질 수 있음을 이해할 수 있을 것이다.

Claims (14)

  1. 수신된 검색어에 대한 의미 이해를 통해, 상기 검색어에 대응하는 의미 이해 정보를 결정하고;
    상기 의미 이해 정보에 따라, 상기 검색어의 적시성 요구 정보를 분석하여 획득하고;
    상기 검색어의 적시성 요구 정보를 기반으로, 상기 검색어에 대응하는 리소스 결과의 획득 방식을 결정하며;
    선택한 획득 방식에 따라, 상기 검색어에 대응하는 리소스 결과를 획득하는 것을 포함하는, 데이터 검색 방법.
  2. 청구항 1에 있어서, 상기 의미 이해 정보에 따라, 상기 검색어의 적시성 요구 정보를 분석하여 획득하는 것은:
    상기 의미 이해 정보 중의 정보 항목, 및 상기 의미 이해 정보 중의 정보 항목에 대응하는 사전 설정된 가중치 계수에 따라, 상기 검색어의 적시성 요구 정보를 계산하여 획득하는 것을 포함하며; 그 중에서, 상기 의미 이해 정보는: 문자적 의미, 의미 완성도 및 돌발성 키워드 확률의 정보 항목 중 적어도 하나를 포함하는, 데이터 검색 방법.
  3. 청구항 1에 있어서, 상기 검색어의 적시성 요구 정보를 기반으로, 상기 검색어에 대응하는 리소스 결과의 획득 방식을 결정하는 것은:
    상기 검색어에 대응하는 시스템 정보를 결정하고;
    상기 검색어의 적시성 요구 정보와 상기 시스템 정보에 따라, 상기 검색어의 적시성과 기계 비용에 대해 종합 분석을 수행하여, 상기 검색어의 종합 분석 결과를 획득하며;
    상기 검색어의 종합 분석 결과에 따라, 상기 검색어에 대응하는 리소스 결과의 획득 방식을 결정하는 것을 포함하는, 데이터 검색 방법.
  4. 청구항 3에 있어서, 상기 검색어의 적시성 요구 정보와 상기 시스템 정보에 따라, 상기 검색어의 적시성과 기계 비용에 대해 종합 분석을 수행하여, 상기 검색어의 종합 분석 결과를 획득하는 것은:
    상기 의미 이해 정보 중의 정보 항목, 및 상기 의미 이해 정보 중의 정보 항목에 대응하는 사전 설정된 가중치 계수에 따라, 상기 검색어의 적시성 요구 정보를 계산하여 획득하고;
    상기 시스템 정보 중의 정보 항목, 및 상기 시스템 정보 중의 정보 항목에 대응하는 사전 결정된 가중치 계수에 따라, 상기 검색어의 기계 비용 정보를 계산하여 획득하며;
    상기 검색어의 적시성 요구 정보와 상기 검색어의 기계 비용 정보를 결합하여, 상기 검색어의 종합 분석 결과를 획득하는 것을 포함하는, 데이터 검색 방법.
  5. 청구항 2에 있어서, 상기 검색어의 적시성 요구 정보를 계산하여 획득한 후에, 상기 방법은:
    검색 관련 정보를 결정하고-상기 검색 관련 정보는 상기 검색어의 검색 빈도 및 상기 검색어에 대응하는 리콜 결과 수 중 적어도 하나를 포함함-;
    상기 검색 관련 정보, 및 상기 검색 관련 정보에 대응하는 사전 결정된 가중치 계수에 따라, 상기 검색어의 적시성 관련 정보를 계산하여 획득하며:
    계산하여 획득한 상기 검색어의 적시성 요구 정보와 상기 적시성 관련 정보를 상기 검색어의 적시성 요구 정보로 사용하는 것을 더 포함하는 하는, 데이터 검색 방법.
  6. 청구항 3에 있어서, 상기 검색어의 적시성 요구 정보와 상기 시스템 정보에 따라, 상기 검색어의 적시성과 기계 비용에 대해 종합 분석을 수행하기 전에:
    상기 적시성 정보와 상기 시스템 정보에 대해 전처리를 수행하는 것을 포함하며, 그 중에서, 상기 전처리는 데이터 정규화 처리 및 특징 표준화 처리 중 적어도 하나를 포함하는, 데이터 검색 방법.
  7. 청구항 4에 있어서, 상기 검색어의 적시성 요구 정보를 계산하여 획득한 후에, 상기 방법은:
    검색 관련 정보를 결정하고-상기 검색 관련 정보는 상기 검색어의 검색 빈도 및 상기 검색어에 대응하는 리콜 결과 수 중 적어도 하나를 포함함-;
    상기 검색 관련 정보, 및 상기 검색 관련 정보에 대응하는 사전 결정된 가중치 계수에 따라, 상기 검색어의 적시성 관련 정보를 계산하여 획득하며;
    계산하여 획득한 상기 검색어의 적시성 요구 정보와 상기 적시성 관련 정보를 상기 검색어의 적시성 요구 정보로 사용하는 것을 더 포함하는, 데이터 검색 방법.
  8. 청구항 1에 있어서,
    상기 리소스 결과의 획득 방식은 미리 정해진 캐시에서 기존의 리소스 결과를 획득하는 것과, 상기 미리 정해진 캐시의 침투를 트리거하여 업데이트된 리소스 결과를 획득하는 것을 포함하고;
    상기 미리 정해진 캐시는 미리 정해진 백엔드 처리 과정에 대응하는 캐시이고, 상기 백엔드 처리 과정은: 리콜 계층 처리, 정렬 계층 처리, 융합 계층 처리 및 액세스 계층 처리 중 적어도 하나를 포함하며;
    상기 미리 정해진 캐시는: 융합 계층 캐시 및 정렬 계층 캐시 중 적어도 하나를 포함하는, 데이터 검색 방법.
  9. 청구항 8에 있어서,
    상기 검색어에 대응하는 시스템 정보 중의 정보 항목은: 시스템 용량, 시스템 응답 시간, 시스템 응답 속도, 시스템 부하 및 리소스 요청량 중 적어도 하나를 포함하며;
    또한, 그 중에서, 각 백엔드 처리 과정에 대응하는 의미 이해 정보 중의 정보 항목은 상이하고, 대응하는 시스템 정보 중의 정보 항목은 상이하며,
    또한 상기 검색어의 상이한 검색 시간에서, 상기 시스템 정보 중의 정보 항목에 대응하는 가중치 계수는 상이한, 데이터 검색 방법.
  10. 수신된 검색어에 대한 의미 이해를 통해 상기 검색어에 대응하는 의미 이해 정보를 결정하는데 사용하는, 정보 획득 모듈;
    상기 의미 이해 정보에 따라 상기 검색어의 적시성 요구 정보를 분석하여 획득하는데 사용되는, 정보 분석 모듈;
    상기 검색어의 적시성 요구 정보에 기반하여 상기 검색어에 대응하는 리소스 결과의 획득 방식을 결정하는데 사용되는, 방식 결정 모듈;
    선택된 획득 방식에 따라 상기 검색어에 대응하는 리소스 결과를 획득하는데 사용되는, 결과 획득 모듈;을 포함하는, 데이터 검색 장치.
  11. 입력된 검색어를 수신하는데 사용되는, 입력 모듈;
    수신된 상기 검색어에 따라 청구항 1 내지 청구항 9 중 어느 하나의 상기 방법을 실행하여 상기 검색어에 대응하는 리소스 결과의 획득 방식 및 리소스 결과를 획득하는데 사용되는, 처리 모듈;을 포함하는, 데이터 서비스 시스템.
  12. 하나 이상의 프로세서;
    그 위에 하나 이상의 프로그램을 저장하고, 상기 하나 이상의 프로그램이 상기 하나 이상의 프로세서에 의해 실행될 때, 상기 하나 이상의 프로세서는 청구항 1 내지 청구항 9 중 어느 하나의 상기 데이터 검색 방법을 구현하는 메모리;
    상기 프로세서와 메모리 사이에 연결되고, 상기 프로세서와 상기 메모리 사이의 정보 인터랙션을 구현하도록 구성되는 하나 이상의 I/O 인터페이스를 포함하는, 전자 기기.
  13. 그 위에 컴퓨터 프로그램이 저장되며, 상기 프로그램이 프로세서에 의해 실행될 때 청구항 1 내지 청구항 9 중 어느 하나의 상기 데이터 검색 방법을 구현하는, 컴퓨터 판독 가능 저장 매체.
  14. 프로세서에 의해 실행될 때 청구항 1내지 청구항 9 중 어느 하나의 상기 데이터 검색 방법을 구현하는, 컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램.
KR1020210015722A 2020-09-08 2021-02-03 데이터 검색 방법, 장치, 시스템, 기기 및 컴퓨터 판독 가능 저장 매체 KR102455379B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010937376.0 2020-09-08
CN202010937376.0A CN112084774B (zh) 2020-09-08 2020-09-08 数据搜索方法、装置、系统、设备和计算机可读存储介质

Publications (2)

Publication Number Publication Date
KR20220032999A true KR20220032999A (ko) 2022-03-15
KR102455379B1 KR102455379B1 (ko) 2022-10-18

Family

ID=73732121

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210015722A KR102455379B1 (ko) 2020-09-08 2021-02-03 데이터 검색 방법, 장치, 시스템, 기기 및 컴퓨터 판독 가능 저장 매체

Country Status (5)

Country Link
US (1) US11636155B2 (ko)
EP (1) EP3964982A1 (ko)
JP (1) JP7241789B2 (ko)
KR (1) KR102455379B1 (ko)
CN (1) CN112084774B (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113626462B (zh) * 2021-07-15 2022-11-15 北京百度网讯科技有限公司 即时通讯对象的搜索方法、装置、电子设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020078300A1 (en) * 1999-08-16 2002-06-20 Chanda Dharap Semantics-based caching policy to minimize latency
JP2003015938A (ja) * 2001-06-28 2003-01-17 Hitachi Ltd 輻輳制御方法
JP2015060568A (ja) * 2013-09-20 2015-03-30 ヤフー株式会社 検索システム、検索方法、端末装置および検索プログラム
JP2016212498A (ja) * 2015-04-30 2016-12-15 シャープ株式会社 データを収集するシステム、サーバ装置、通信機器、データを収集する方法およびプログラム
US20170255681A1 (en) * 2016-03-03 2017-09-07 Tic Talking Holdings Inc. Interest based content distribution
US20200065424A1 (en) * 2018-08-22 2020-02-27 International Business Machines Corporation Reducing database stress using cognitive data caching

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102117320B (zh) * 2011-01-11 2012-07-25 百度在线网络技术(北京)有限公司 一种结构化数据搜索的方法和装置
CN104239513B (zh) * 2014-09-16 2019-03-08 西安电子科技大学 一种面向领域数据的语义检索方法
CN107180093B (zh) * 2017-05-15 2020-05-19 北京奇艺世纪科技有限公司 信息搜索方法及装置和时效性查询词识别方法及装置
CN109670019A (zh) * 2018-11-19 2019-04-23 广州搜料信息技术有限公司 基于综合语义识别的智能检索方法及装置
CN111310017B (zh) * 2018-12-11 2023-05-12 阿里巴巴集团控股有限公司 一种时效性场景内容的生成方法及装置
CN112840627B (zh) * 2018-12-19 2022-03-15 深圳市欢太科技有限公司 一种信息处理的方法及相关装置、计算机可读存储介质
JP7384713B2 (ja) * 2020-03-10 2023-11-21 株式会社日立製作所 データ補完システム、およびデータ補完方法
CN111597449B (zh) * 2020-05-20 2023-03-28 抖音视界有限公司 用于搜索的候选词构建方法、装置、电子设备及可读介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020078300A1 (en) * 1999-08-16 2002-06-20 Chanda Dharap Semantics-based caching policy to minimize latency
JP2003015938A (ja) * 2001-06-28 2003-01-17 Hitachi Ltd 輻輳制御方法
JP2015060568A (ja) * 2013-09-20 2015-03-30 ヤフー株式会社 検索システム、検索方法、端末装置および検索プログラム
JP2016212498A (ja) * 2015-04-30 2016-12-15 シャープ株式会社 データを収集するシステム、サーバ装置、通信機器、データを収集する方法およびプログラム
US20170255681A1 (en) * 2016-03-03 2017-09-07 Tic Talking Holdings Inc. Interest based content distribution
US20200065424A1 (en) * 2018-08-22 2020-02-27 International Business Machines Corporation Reducing database stress using cognitive data caching

Also Published As

Publication number Publication date
JP7241789B2 (ja) 2023-03-17
JP2022045313A (ja) 2022-03-18
CN112084774A (zh) 2020-12-15
EP3964982A1 (en) 2022-03-09
KR102455379B1 (ko) 2022-10-18
US11636155B2 (en) 2023-04-25
US20220075828A1 (en) 2022-03-10
CN112084774B (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
US9779356B2 (en) Method of machine learning classes of search queries
US9460117B2 (en) Image searching
US8626786B2 (en) Dynamic language checking
US20150058308A1 (en) Generating cache query requests
CN109992601B (zh) 待办事项信息的推送方法、装置和计算机设备
US9721015B2 (en) Providing a query results page
US20120203759A1 (en) Method, system and computer-readable recording medium for writing new image and its information onto image database
US8745043B2 (en) Determining sort order by distance
US9002832B1 (en) Classifying sites as low quality sites
CN113204621A (zh) 文档入库、文档检索方法,装置,设备以及存储介质
CN111314063A (zh) 一种基于物联网大数据信息管理方法、系统及装置
CN113660541A (zh) 新闻视频的摘要生成方法及装置
KR102455379B1 (ko) 데이터 검색 방법, 장치, 시스템, 기기 및 컴퓨터 판독 가능 저장 매체
US20180300392A1 (en) Accumulated retrieval processing method, device, terminal, and storage medium
CN107622090B (zh) 对象的获取方法、装置及系统
CN107220260A (zh) 一种页面显示的方法及装置
CN112363814A (zh) 任务调度方法、装置、计算机设备及存储介质
US20230153286A1 (en) Method and system for hybrid query based on cloud analysis scene, and storage medium
CN111159213A (zh) 一种数据查询方法、装置、系统和存储介质
CN104392000B (zh) 确定移动站点抓取配额的方法和装置
CN110633430B (zh) 事件发现方法、装置、设备和计算机可读存储介质
CN112527802B (zh) 基于键值数据库的软链接方法及装置
CN110134377B (zh) 电力行业管理信息系统的数据请求处理方法、装置及设备
CN111241430B (zh) 搜索场景中数据的隐藏方法、装置、存储介质及电子设备
US20220358095A1 (en) Managing data requests to a data shard

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant