KR20170129219A - Method and apparatus for determining user demand - Google Patents

Method and apparatus for determining user demand Download PDF

Info

Publication number
KR20170129219A
KR20170129219A KR1020177029821A KR20177029821A KR20170129219A KR 20170129219 A KR20170129219 A KR 20170129219A KR 1020177029821 A KR1020177029821 A KR 1020177029821A KR 20177029821 A KR20177029821 A KR 20177029821A KR 20170129219 A KR20170129219 A KR 20170129219A
Authority
KR
South Korea
Prior art keywords
user
time sequence
association rule
search
similarity
Prior art date
Application number
KR1020177029821A
Other languages
Korean (ko)
Inventor
준 쭈
펑 리
Original Assignee
바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 filed Critical 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Publication of KR20170129219A publication Critical patent/KR20170129219A/en

Links

Images

Classifications

    • G06F17/30867
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

사용자 수요를 확정하는 방법 및 장치를 제공하며, 해당 방법은, 사용자의 과거 검색 기록에 따라 상응한 시간 서열 기반의 사용자 검색 연관 규칙을 조회하는 단계(S101); 및 사용자 검색 연관 규칙에 따라 사용자의 수요 정보를 확정하는 단계(S102);를 포함한다. 본 방법은 사용자를 도와 그가 수요하는 정보를 더욱 편리하고 빠르게 찾을 수 있도록 할 수 있다.A method and apparatus for determining user demand, the method comprising: querying (S101) a user search association rule based on a corresponding time sequence according to a user's past search history; And determining the demand information of the user according to the user search association rule (S102). This method can help the user to find the information he needs more conveniently and quickly.

Description

사용자 수요를 확정하는 방법 및 장치Method and apparatus for determining user demand

본 출원은 2015년 10월 12일에 제출한 발명의 명칭이 “사용자 수요를 확정하는 방법 및 장치”인 제201510659433.2호 중국 특허 출원의 우선권을 주장하는 바, 해당 선 출원의 모든 내용은 참조로서 본원에 원용된다.This application claims the priority of the Chinese patent application No. 201510659433.2, entitled "Method and Apparatus for Determining User Demand," filed on October 12, 2015, the contents of which are incorporated herein by reference .

본 발명은 전자 정보 분야에 관한 것으로, 특히는 사용자 수요를 확정하는 방법 및 장치에 관한 것이다.The present invention relates to the field of electronic information, and more particularly to a method and apparatus for determining user demand.

전자 상거래 및 이동 통신망이 흥행됨에 따라, 인터넷은 일상 생활속으로 점점 더 가까이 파고들어, 사람들이 인터넷 상에서 각종 유형의 정보를 검색하여 각종 상품과 서비스를 구매하는 경우가 증가되고 있다. 따라서, 어떻게 사용자로 하여금 각자 요구하는 정보를 더욱 빠르게 획득하도록 할 수 있는가 하는 것이 큰 과제가 되고 있으나, 종래의 기술에서, 웹 페이지에는 항상 우리들에게 이전에 검색했었던 물품 또는 서비스를 표시하는 바, 예컨대, 사용자가 신발을 구매한 후, 웹 페이지는 일부 신발 또는 신발 매점을 사용자에게 표시하고 있으나, 대부분의 경우, 사용자가 신발을 더 구매하고자 하는 수요가 더이상 존재하지 않으며, 이는 사용자를 돕지 못할 뿐만 아니라, 번잡하고 중복된 정보로 인해 사용자의 시간을 낭비하게 된다.As e-commerce and mobile communication networks become popular, the Internet is getting closer and closer to everyday life, and people are increasingly searching for various types of information on the Internet to purchase various goods and services. Therefore, it is a big problem how to enable users to acquire information required by each user more quickly. However, in the conventional technology, the web page always displays the goods or services that have been searched for in the past, , The web page displays some shoe or shoe stores to the user after the user purchases the shoes, but in most cases there is no longer a need for the user to purchase more shoes, which does not help the user , The user's time is wasted due to complicated and redundant information.

본 발명은 사용자를 도와 더욱 편리하고 빠르게 각자 요구하는 정보를 찾을 수 있는 사용자 수요를 확정하는 방법 및 장치를 제공하는 것을 목적으로 한다.It is an object of the present invention to provide a method and an apparatus for assisting a user to determine a user demand that can find information required by each user more conveniently and quickly.

본 발명에 따른 일 양태에 있어서, 사용자 수요를 확정하는 방법을 제공하며, 해당 방법은, In one aspect of the present invention, there is provided a method of determining user demand,

사용자의 과거 검색 기록에 따라 상응한 시간 서열 기반의 사용자 검색 연관 규칙을 조회하는 단계; 및 Querying a user search association rule based on a time sequence based on a user's past search history; And

사용자 검색 연관 규칙에 따라 사용자의 수요 정보를 확정하는 단계;를 포함한다.And determining the demand information of the user according to the user search association rule.

본 발명에 따른 다른 일 양태에 있어서, 사용자의 수요 정보를 확정하는 장치를 더 제공하며, 해당 장치는, According to another aspect of the present invention, there is further provided an apparatus for determining demand information of a user,

사용자의 과거 검색 기록에 따라 상응한 시간 서열 기반의 사용자 검색 연관 규칙을 조회하도록 구성된 장치; 및An apparatus configured to query a user search association rule based on a time sequence based on a past search history of a user; And

사용자 검색 연관 규칙에 따라 사용자의 수요 정보를 확정하도록 구성된 장치;를 포함한다.And a device configured to determine demand information of the user according to a user search association rule.

종래의 기술과 비교시, 본 발명은 아래와 같은 장점들을 갖고있다. 본 발명은 시간 서열 (또는 동적 수열) 기반의 연관 규칙을 이용하여 사용자의 수요를 확정하며, 시간 서열은 동일한 통계 지수의 수치를 해당 발생의 시간적 전후 순서에 따라 배열하여 형성된 수열이고, 시간 서열 기반의 분석은 기존의 과거 데이터에 근거하여 미래에 대해 예측을 진행하는 것을 주요 목적으로 한다. 구체적으로, 사람들이 실제로 물품 및 서비스를 검색 시, 정보에 대한 수요는 흔히 시간 상의 전후 순서를 갖고 있으므로, 본 기술적 방안은 시간 서열을 기반으로 하고, 사용자가 웹페이지를 브라우징할 경우, 본 방법은 해당 사용자의 과거 검색 기록 및 사전 설정된 연관 규칙에 따라, 미래 지향적으로 일부 과거 검색 기록에 관련된 정보를 푸시할 수 있어, 사용자들로 하여금 각자 수요하는 정보를 더욱 편리하고 빠르게 찾을 수 있도록 한다.Compared with the prior art, the present invention has the following advantages. The present invention determines a user's demand using a time sequence (or dynamic sequence) -based association rule. A time sequence is a sequence formed by arranging numerical values of the same statistical index in a temporal order of occurrence of a corresponding occurrence, The main purpose of the analysis is to predict the future based on existing historical data. Specifically, when people actually search for goods and services, because the demand for information often has a temporal order in time, the technical idea is based on time sequence, and when a user browses a web page, Information related to some past search records can be pushed forward in accordance with a past search history of the user and a predetermined association rule so that users can find information they need more conveniently and quickly.

이하 첨부된 도면들을 참조하여 진행한 비 한정적인 실시예에 대한 상세한 설명으로부터, 본 발명의 기타 특징, 목적 및 장점들은 더욱 명확해 질 것이다.
도 1은 본 발명의 일 실시예에 따른 사용자 수요를 확정하는 방법의 흐름도이다.
도 2는 본 발명의 일 실시예에 따른 사용자 수요를 확정하는 방법 중의 사용자 검색 연관 규칙의 생성 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 사용자 수요를 확정하는 장치의 예시도이다.
첨부된 도면에서 동일하거나 유사한 참조부호는 동일하거나 유사한 부재를 가리킨다.
Other features, objects, and advantages of the present invention will become more apparent from the following detailed description of non-limiting embodiments, which proceeds with reference to the accompanying drawings.
1 is a flow diagram of a method for determining user demand in accordance with an embodiment of the present invention.
FIG. 2 is a flowchart for generating a user search association rule as a method for determining a user demand according to an embodiment of the present invention.
3 is an illustration of an apparatus for determining user demand according to an embodiment of the present invention.
In the accompanying drawings, the same or similar reference numerals indicate the same or similar members.

예시적 실시예에 대한 보다 상세한 설명을 진행하기 전에 미리 언급하고자 하는 것은, 일부 실시예들이 흐름도로 도시된 처리 또는 방법으로 설명된다는 것이다. 비록, 흐름도는 각각의 동작을 순차적인 처리로 설명하였으나, 그중의 상당한 동작들은 병행으로, 병렬로 또는 동시에 실행될 수 있다. 여기서, 각 동작의 순서는 재배치될 수 있다. 이러한 동작들이 완료될 경우, 상기 처리가 정지될 수 있으나, 도면에 포함되지 않은 부가적인 단계들이 존재할 수도 있다. 상기 처리는 방법, 함수, 절차, 서브 루틴, 서브 프로그램 등에 대응될 수 있다.It is to be noted that prior to proceeding with a more detailed description of the exemplary embodiment, some embodiments are described in terms of a process or method illustrated in the flowchart. Although the flowcharts have described each operation as a sequential process, considerable operations therein may be performed in parallel, in parallel, or concurrently. Here, the order of each operation can be rearranged. When these operations are completed, the processing can be stopped, but there may be additional steps not included in the figure. The processing may correspond to a method, a function, a procedure, a subroutine, a subprogram, and the like.

본 원에서 “컴퓨터 장치”로 지칭되거나 “컴퓨터”로 지칭되는 것은 소정의 프로그램 또는 명령어를 실행하여 수치 컴퓨팅 및/또는 로직 컴퓨팅 등 소정의 처리 과정을 실행할 수 있는 지능형 전자 장치를 가리키며, 이는 프로세서와 저장 장치를 포함할 수 있으며, 프로세서로 저장 장치에 사전에 저장된 존속 명령어를 실행하여 소정의 처리 과정을 실행하거나, ASIC, FPGA, DSP 등 하드웨어로 소정의 처리 과정을 실행하거나, 상술한 양자의 조합으로 구현될 수 있다. 컴퓨터 장치는 서버, 개인용 컴퓨터, 노트북, 태블릿 PC, 스마트폰 등을 포함하나, 이에 한정되지 않는다.Referred to herein as a " computer device " refers to an intelligent electronic device that is capable of executing certain processes, such as numerical computing and / or logic computing, by executing certain programs or instructions, And may execute a predetermined processing process by executing a surviving instruction stored in advance in the storage device by the processor or may execute a predetermined processing process with hardware such as ASIC, FPGA, DSP, or the like, Lt; / RTI > Computer devices include, but are not limited to, servers, personal computers, laptops, tablet PCs, smart phones, and the like.

상기 컴퓨터 장치는 사용자 기기 및 네트웨크 기기를 포함한다. 여기서, 상기 사용자 기기는 컴퓨터, 스마트폰, PDA 등을 포함하고, 상기 네트워크 기기는 단일의 네트워크 서버, 다수의 네트워크 서버로 구성된 서버그룹 또는 클라우드 컴퓨팅(Cloud Computing) 기반의 대용량 컴퓨터 또는 네트워크 서버로 구성된 클라우드를 포함하나, 이에 한정되지 않으며, 여기서, 클라우드 컴퓨팅은 분포식 컴퓨팅의 하나로서, 소결합(loose coupling)의 일 그룹의 컴퓨터 집합으로 구성된 슈퍼 가상 컴퓨터이다. 여기서, 상기 컴퓨터 장치는 단독으로 운행되어 본 발명을 실현할 수 있으며, 네트워크에 접속하여 네트워크 상의 기타 컴퓨터 장치와의 인터렉션 동작을 통해 본 발명을 실현할 수도 있다. 여기서, 상기 컴퓨터 장치가 위치한 네트워크는 인터넷, WAN, MAN, LAN, VPN 네트워크 등을 포함하나, 이에 한정되지 않는다.The computer device includes a user device and a network device. Here, the user equipment includes a computer, a smart phone, a PDA, and the like. The network equipment may be a single network server, a server group composed of a plurality of network servers, or a cloud computing-based large- But not limited to, a cloud, where cloud computing is one of distributed computing, a super virtual machine consisting of a group of computers in a loose coupling. Here, the computer device may be operated independently to realize the present invention, and the present invention may be realized through an interaction operation with other computer devices on the network by connecting to a network. Here, the network in which the computer device is located includes, but is not limited to, the Internet, WAN, MAN, LAN, VPN network, and the like.

특별히 설명하고자 하는 것은, 상기 사용자 기기, 네트워크 기기 및 네트워크 등은 다만 예시로서, 기타 기존의 또는 미래에 나타나게 될 컴퓨터 기기 또는 네트워크는 본 발명에 적용 가능할 경우, 본 발명의 보호 범위 내에 원용되어야 하며, 참조로서 본원 출원에 원용되어야 한다.Specifically, the user equipment, the network equipment, and the network are merely examples, and any other existing or future computer equipment or network should be used within the protection scope of the present invention, if applicable to the present invention, Which is hereby incorporated by reference.

이하 설명하는 방법(여기서, 일부는 흐름도를 통해 도시됨)은 하드웨어, 소프트웨어, 펌웨어, 미들웨어, 마이크로 코드, 하드웨어 기술 언어 또는 이들의 임의의 조합으로 구현할 수 있다. 소프트웨어, 펌웨어, 미들웨어, 마이크로 코드로 실시할 경우, 필수 타스크를 실행하기 위한 프로그램 코드 또는 코드 세그먼트는 기계 또는 컴퓨터 판독 가능한 매체(예컨대 저장 매체)에 저장될 수 있다. (하나 또는 다수의) 프로세서는 필수 타스크를 실행할 수 있다.The method described here (some of which are shown in the flowchart) may be implemented in hardware, software, firmware, middleware, microcode, hardware description language, or any combination thereof. When implemented in software, firmware, middleware, microcode, program code or code segments for executing the required tasks may be stored in a machine or computer readable medium (e.g., a storage medium). (One or more) processors may execute mandatory tasks.

본 명세서에 개시된 구체적인 구조 및 기능의 세부 사항들은 단지 대표적인 것으로서 본 발명의 예시적 실시예를 설명하는 것을 목적으로 한다. 그러나, 본 발명은 다양한 대체 형식으로 구체적으로 구현될 수 있으며, 여기에 기재된 실시예에 한정되는 것으로 해석하여서는 아니된다.The details of the specific structure and functionality disclosed herein are merely exemplary and are intended to illustrate exemplary embodiments of the invention. However, the present invention can be embodied in various alternative forms, and is not to be construed as being limited to the embodiments described herein.

여기서 용어 “제1”, “제2” 등을 이용하여 각 유닛들을 설명하였으나, 이러한 유닛들은 상기와 같은 용어에 한정되지 않음을 이해하여야 한다. 이러한 용어는 단지 하나의 유닛과 다른 하나의 유닛과 구별하기 위하여 이용된다. 예를 들어, 예시적 실시예의 범위를 벗어나지 않는 한, 제1 유닛은 제2 유닛으로 지칭될 수 있으며, 유사하게, 제2 유닛은 제1 유닛으로 지칭될 수 있다. 본 명세서에서 사용되는 용어 “및/또는”는 나열된 관련 항목 중의 하나 또는 다수의 임의의 또는 모든 조합을 포함한다.Although the units have been described using the terms " first ", " second ", etc., it should be understood that these units are not limited to such terms. These terms are used only to distinguish one unit from another. For example, a first unit may be referred to as a second unit, and a second unit may be referred to as a first unit, as long as the scope of the exemplary embodiment does not depart from the scope. The term " and / or " as used herein includes any or all combinations of one or more of the listed related items.

하나의 유닛이 다른 하나의 유닛에 “연결”되거나 “결합”된다고 지칭될 경우, 상기 다른 하나의 유닛에 직접적으로 연결되거나 결합될 수 있으며, 또는 중간 유닛이 존재할 수도 있다. 이와 대응되게, 하나의 유닛이 다른 하나의 유닛에 “직접적으로 연결”되거나 “직접적으로 결합”된다고 지칭될 경우, 중간 유닛이 존재하지 않는다. 유닛들 사이의 관계를 설명하기 위한 기타 단어(예컨대 “…사이에 위치한다”와 “직접적으로 … 사이에 위치한다”, “…에 인접한다”와 “직접적으로 … 에 인접한다”)도 유사한 방식에 따라 해석하여야 한다.When one unit is referred to as being " connected " or " coupled " to another unit, it may be directly coupled or coupled to the other unit, or an intermediate unit may be present. Correspondingly, when one unit is referred to as being " directly connected " or " directly coupled " to another unit, there is no intermediate unit. Other words to describe the relationship between units (eg, "located between ..." and "directly between ...", "adjacent to ..." and "directly adjacent to ..." .

본 명세서에 사용되는 용어는 단지 구체적인 실시예를 설명하기 위한 것을 뿐, 예시적 실시예를 한정하기 위한 것이 아니다. 상하 문맥에 명확히 다르게 기재되지 않는 한, 본 명세서에서 사용되는 단수형 “하나”, “한 항”은 복수형을 포함하기도 한다. 본 명세서에서 사용되는 용어 “포함한다” 및/또는 “구비한다”는 기재된 특징, 정수, 단계, 동작, 유닛 및/또는 부재의 존재를 규정할 뿐, 하나 또는 다수의 기타 특징, 정수, 단계, 조작, 유닛, 부재 및/또는 이들의 조합의 존재 또는 추가를 배제하지 않음을 이해하여야 한다.The terminology used herein is for the purpose of describing specific embodiments only, and is not intended to limit the exemplary embodiments. Unless specifically stated otherwise in the context, the singular forms "a", "an" and "the" The use of the terms " comprises " and / or " comprising " as used herein should be interpreted as defining the presence of stated features, integers, steps, operations, units and / But does not preclude the presence or addition of other features, operations, units, members and / or combinations thereof.

일부 대체적인 구현 방식에 있어서, 기재한 기능/동작들은 도면에 도시된 순서와 다른 순서로 발생할 수 있음을 유의하여야 한다. 예를 들어, 관련된 기능/동작에 따라, 순차적으로 도시된 2개의 도면은 사실상 대체적으로 동시에 실행되거나 반대된 순서에 따라 실행될 수도 있다.It should be noted that, in some alternative implementations, the described functions / operations may occur in an order different from that shown in the figures. For example, depending on the function / operation involved, the two figures shown in sequence may in fact be executed substantially concurrently or in reverse order.

이하 첨부된 도면들을 결부하여 본 발명에 대한 더 상세한 설명을 진행하기로 한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Reference will now be made in detail to the preferred embodiments of the present invention, examples of which are illustrated in the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 사용자 수요를 확정하는 방법의 흐름도이며, 해당 방법은,1 is a flow chart of a method for determining a user demand according to an embodiment of the present invention,

S101: 사용자의 과거 검색 기록에 따라 상응한 시간 서열 기반의 사용자 검색 연관 규칙을 조회하는 단계; 및 S101: Querying a user search association rule based on a corresponding time sequence in accordance with a past search history of a user; And

S102: 사용자 검색 연관 규칙에 따라 사용자의 수요 정보를 확정하는 단계;를 포함한다.S102: Determining the demand information of the user according to the user search association rule.

기존의 기술과 비교시, 본 발명에 따른 방법은 아래와 같은 장점들을 갖고있다. 시간 서열 (또는 동적 수열) 기반의 연관 규칙을 이용하여 사용자의 수요를 확정하며, 시간 서열은 동일한 통계 지수의 수치를 해당 발생의 시간적 전후 순서에 따라 배열하여 형성된 수열이고, 시간 서열 기반의 분석은 기존의 과거 데이터에 따라 미래에 대해 예측을 진행하는 것을 주요 목적으로 하며; 구체적으로, 사람들이 실제로 물품 및 서비스를 검색 시, 정보에 대한 수요는 흔히 시간 상의 전후 순서를 갖고 있으므로, 본 발명에 따른 방법은 시간 서열을 기반으로 하고, 사용자가 웹페이지를 브라우징할 경우, 해당 사용자의 과거 검색 기록 및 사전에 설정된 연관 규칙에 따라, 미래 지향적으로 일부 과거 검색 기록에 관련된 정보를 푸시할 수 있어, 사용자들로 하여금 각자 수요하는 정보를 더욱 편리하고 빠르게 찾을 수 있도록 한다.Compared with the prior art, the method according to the present invention has the following advantages. The time series is a sequence formed by arranging the numerical values of the same statistical index according to the temporal order of occurrence of the corresponding occurrence, and the time series based analysis is used to determine the user's demand using the time sequence (or dynamic sequence) The main objective is to make forecasts for the future based on existing historical data; Specifically, when people actually search for goods and services, the demand for information often has a temporal order in time, so that the method according to the present invention is based on time sequences, and when a user browses a web page, According to the past search history of the user and association rules set in advance, information related to some past search records can be pushed forward, so that users can find information they need more conveniently and quickly.

도 2는 본 발명의 일 실시예에 따른 사용자 수요를 확정하는 방법 중의 사용자 검색 연관 규칙의 생성 흐름도이다. 아래에, 도 1 및 도 2를 결부하여 해당 실시예에 대한 설명을 진행하기로 한다.FIG. 2 is a flowchart for generating a user search association rule as a method for determining a user demand according to an embodiment of the present invention. 1 and Fig. 2 will be described below to explain the embodiments.

여기서, 도 1에 도시된 사용자의 과거 기록에 따라 상응한 시간 서열 기반의 연관 규칙을 조회하는 단계(S101)이전에, Here, before the step S101 of querying the association rule based on the corresponding time sequence according to the past record of the user shown in FIG. 1,

S201: 사용자로부터 조회 요청이 수신될 경우, 해당 사용자의 과거 기록으로부터 해당 사용자의 과거 검색 시간 및 키워드를 획득하는 단계;S201: acquiring the past search time and keyword of the user from the past record of the user when the inquiry request is received from the user;

S202: 해당 사용자의 과거 검색 시간 및 키워드에 따라, 과거 검색 시간에 따라 배열된 키워드를 포함하는 해당 사용자의 과거 검색의 시간 서열을 생성하는 단계; S202: generating a time sequence of the past search of the user including the keywords arranged according to the past search time according to the past search time and keyword of the user;

S203: 시간 서열의 유사도를 측정하는 단계; 및 S203: measuring the similarity of the time sequence; And

S204: 상기 측정 결과에 따라 사용자 검색의 연관 규칙을 생성하는 단계;를 더 포함한다.S204: generating association rule of user search according to the measurement result.

여기서, 과거 기록은 다종다양하며, 과거 기록 사이에 전후 순서가 존재하지 않더라도, 과거 기록 사이에 필연코 인과 관계가 존재하기 마련이며, 본 기술적 방안은 시간 서열의 유사도를 측정함으로써, 번잡한 시간 서열에서 인과 관계 및 시간 상의 전후 순서가 존재하는 시간 서열들을 서로 연관시켜, 미래 지향적으로 수요 정보를 푸시하는 정확성을 향상시킨다.Here, there are many kinds of past records, and even if there is no back and forth order between past records, there is necessarily a causal relationship between past records. The present technical idea is to measure the similarity of time sequences, Causal relationships, and time sequences in which temporal precedence sequences exist together to improve the accuracy of pushing demand information in the future.

구체적으로, 상기 측정 결과에 따라 사용자 검색 연관 규칙을 생성하는 단계(S204)는, More specifically, the step S204 of generating a user search association rule according to the measurement result includes:

시간 서열에 기반하여, 패턴으로 표현한 일 세트의 패턴 서브 시퀸스를 생성하는 단계; Generating a set of pattern subsequences represented as a pattern based on the time sequence;

해당 세트의 패턴 서브 시퀸스 사이의 유사도를 산출하는 단계; 및 Calculating a similarity between pattern subsections of the set; And

패턴 서브 시퀸스 사이의 유사도를 기반으로 사용자 검색 연관 규칙을 생성하는 단계;를 포함한다.And generating a user search association rule based on the similarity between the pattern subsequences.

더욱 상세하게, 본 발명에 따른 방법에 있어서, 단조 거리법(Monotonic distance method), 벡터 거리법(Vector Distance Algorithm) 등 알고리즘을 이용하여 유사도 측정 함수를 정의하여 패턴 서브 시퀸스 사이의 유사도를 산출하되, 여기서 알고리즘은 상술한 단조 거리법, 벡터 거리법에 한정되지 않는다. 유사도를 측정한 후, 어떤 패턴 서브 시퀸스들이 동일한 빈발 패턴(frequent pattern)으로 통합될 수 있는지를 결정하고, Apriori 알고리즘 등 방법을 이용하여 빈발 패턴을 획득하고 상응한 연관 규칙을 생성하되, 여기서, 방법은 상술한 Apriori 알고리즘에 한정되지 않는다. 시간 서열은 비록 동일한 통계 지수의 수치를 그의 발생 시간적 전후 순서에 따라 배열하여 형성된 수열을 가리키나, 시간 서열은 많은 경우에 유사도 측정을 직접적으로 진행할 수 없거나, 유사도 측정이 상대적으로 어렵기 때문에, 먼저 이를 패턴 서브 시퀸스로 변환시키면 편리하게 유사도를 계산할 수 있다. Apriori 알고리즘은 연관 규칙의 빈발 항목 집합(frequent item set)을 마이닝하는 알고리즘으로서, 후보 집합의 생성 및 플롯의 하향 폐쇄 감지(downward closed detection) 두 단계를 통해 빈발 항목 집합을 마이닝하는 것을 핵심적인 개념으로 한다.In more detail, in the method according to the present invention, a degree of similarity measurement function is defined using an algorithm such as a monotonic distance method or a vector distance algorithm to calculate a degree of similarity between pattern subsequences, Here, the algorithm is not limited to the forged distance method and the vector distance method described above. After measuring the similarity, it is determined which pattern subsequences can be integrated into the same frequent pattern, a frequent pattern is acquired using a method such as Apriori algorithm, and a corresponding association rule is generated, Is not limited to the Apriori algorithm described above. Although the time sequence refers to a sequence formed by arranging the numerical values of the same statistical index in accordance with the order of occurrence before and after the occurrence of the sequence, the similarity measure can not be directly conducted in many cases or the similarity measurement is relatively difficult. You can easily calculate the similarity by converting it to a pattern subsequence. The Apriori algorithm is an algorithm that mines a frequent item set of association rules. It is a core concept to mine frequent item sets through two steps: creation of candidate sets and downward closed detection of the plots. do.

여기서, 시퀸스 패턴는 서로 다른 서열들로 이루어진 하나의 집합이 주어지는 것을 가리키는 바, 여기서, 각 서열은 서로 다른 요소들이 순서에 따라 순서 배열되고, 각 요소(거래)는 서로 다른 항목들로 이루어지며, 동시에 사용자가 지정한 하나의 최소 지원도 역치가 주어진다. 시퀸스 패턴 마이닝은 즉 모든 빈발 서브 시퀸스를 찾아내는 것이며, 즉, 해당 서브 시퀸스는 시퀸스 집합에서 나타나는 빈도가 사용자가 지정한 최소 지원도 역치보다 낮지 않은 모든 빈발 서브 시퀸스를 찾아내는 것이다. 본 발명은 이러한 시퀸스 패턴를 참조로 한다.Herein, the sequence pattern indicates that a set consisting of different sequences is given, wherein each sequence is arranged in order of different elements, each element (transaction) is composed of different items, and simultaneously One minimum supported threshold value specified by the user is given. Sequence pattern mining is to find all frequent subsequences, that is, the subsequence finds all frequent subsequences whose frequency in the sequence set is not lower than the user-specified minimum support threshold. The present invention refers to such a sequence pattern.

선택적으로, 도 2에 도시된 바와 같이, 사용자 검색 연관 규칙을 생성하는 단계(S204) 이후, Alternatively, as shown in FIG. 2, after step S204 of creating a user search association rule,

S205: 생성된 사용자 검색 연관 규칙에 대해 검증을 진행하는 단계; 및S205: Proceeding with the generated user search association rule; And

S206: 검증 결과를 기반으로, 생성된 사용자 검색 연관 규칙으로부터 부분적인 또는 모든 사용자 검색 연관 규칙을 선별하는 단계;를 더 포함할 수 있다. 구체적으로, 단계(S206)에서, 테스트 데이터 검증 및 인공 평가를 결부하여, 생성된 사용자 검색 연관 규칙에 대해 평가와 검증을 진행하고, 그중 해석 가능성 및 신뢰도가 상대적으로 높은 규칙을 저장함으로써, 정보 지향을 가이드하고, 사용자를 도와 수요 정보를 빠르게 확정하도록 할 수 있다.S206: Selecting partial or all user search association rules from the generated user search association rule based on the verification result. Concretely, in step S206, test data verification and artificial evaluation are associated with each other, evaluation and verification are performed on the generated user search association rule, and by storing a rule having a relatively high interpretability and reliability, And can help the user to quickly determine demand information.

선택적으로, 해당 부분적인 또는 모든 사용자 검색 연관 규칙을 선별하는 단계에서, 미리 설정된 시간 간격에 따라 사용자 검색 연관 규칙의 유효성을 검측하여, 실효된 사용자 검색 연관 규칙을 제거하고, 그중의 실효되지 않은 부분적인 또는 모든 사용자 검색 연관 규칙을 보류할 수 있다.Alternatively, in the step of selecting the partial or all of the user retrieval association rules, the validity of the user retrieval association rule is detected according to a preset time interval, the removed user retrieval association rule is removed, Or all user search association rules can be suspended.

구체적으로, 상기 사용자 검색 연관 규칙의 유효성을 검측하는 조작 과정은 아래와 같은 단계를 포함한다.Specifically, the operation of detecting the validity of the user search association rule includes the following steps.

정보 CTR의 변화 상황을 모니터링하여 CTR에 발생한 변화가 미리 설정된 역치를 초과할 경우, 상응한 연관 규칙이 실효된 것으로 판정한다. 정보 CTR에 미리 설정된 역치를 초과하는 변화가 발생할 경우, 현재 또는 대응되는 연관 규칙이 이미 실효되거나 미래 지향성이 부족한 것을 설명하고, 이로써, 실효된 연관 규칙을 제거함으로써 용이하게 연관 규칙을 추가 및 업데이트할 수 있고, 아울러, 설명 가능성 및 높은 신뢰도를 구비한 연관 규칙으로 사용자에게 더 양호하고 빠른 서비스를 제공하여 사용자가 편리하게 사용하도록 한다. ADWIN 슬라이딩 윈도우 알고리즘을 이용하여 정보 CTR의 변화 상황에 대한 모니터링을 진행한다.When the change in the information CTR is monitored and the change in the CTR exceeds a predetermined threshold value, it is determined that the corresponding association rule has been invalidated. If the information CTR has a change exceeding a predetermined threshold value, the current or corresponding association rule is already invalidated or the future orientation is insufficient, thereby easily adding and updating the association rule by removing the invalid association rule In addition, a better and faster service is provided to the user with an association rule having explanatory feasibility and high reliability, so that the user can conveniently use the service. We use ADWIN sliding window algorithm to monitor the change of information CTR.

선택적으로, 시간 서열의 유사도를 측정하는 단계는, Optionally, the step of measuring the similarity of the time-

시간 서열에 대해 사전 처리를 진행하고 데이터의 노이즈를 제거하여 노이즈가 제거된 시간 서열을 생성하는 단계; 및Pre-processing the time sequence and removing noise of the data to generate a noise-removed time sequence; And

노이즈가 제거된 시간 서열의 유사도를 측정하는 단계;를 포함한다.And measuring the similarity of the noise-removed time sequence.

여기서, 해당 시간 서열은 우리가 필요한 사용자의 과거 기록 내용을 포함할 뿐만 아니라, 불가피하게 일부 유효한 데이터 이외의 간섭 데이터를 포함하므로, 시간 서열에 대해 진행하는 노이즈 제거 처리는 후속적인 시간 서열 기반의 처리 및 조작이 효율적으로 진행될 수 있도록 확보할 수 있을 뿐만 아니라, 사용자 수요 정보를 확정하는 정확도를 향상시키는데 도움될 수 있다.Here, since the time sequence includes not only the past record contents of the user as we need but also inevitably contains interference data other than some valid data, the noise elimination processing proceeding with respect to the time sequence is performed based on the subsequent time sequence based processing And operations can be efficiently performed, and can also help to improve the accuracy of determining user demand information.

선택적으로, 제거된 노이즈는 우도 비율(likelihood ratio) 또는 확율 통계 등 방식으로 산출된 기대치를 벗어난 노이즈 데이터이다. 산출을 통해, 일부 기대치를 벗어난 데이터를 찾아낼 수 있고, 이러한 데이터가 곧 제거하여야 할 노이즈 데이터이다.Alternatively, the removed noise is noise data that is out of the expected value calculated by a likelihood ratio or probability statistics method. Through the calculation, we can find data that is out of some expectation, and this data is noise data that should be removed soon.

데이터가 기대치를 벗어난 정도가 미리 설정된 역치에 도달할 경우, 해당 데이터를 노이즈 데이터로 볼 수 있다. 일부 데이터는 기대치를 벗어나나, 기대치를 너무 많이 벗어나지 않을 수 있으며, 이러할 경우, 해당 데이터는 유효한 데이터일 가능성이 높으며, 단지 전송 및 산출 과정에서의 오차로 인해 기대치를 벗어난 것으로, 기대치의 역치를 설정함으로써, 오차가 존재하는 일부의 유효한 데이터를 보류하는데 도움되고, 유효한 데이터가 제거되어 후속적인 처리 및 산출에 더욱 큰 오차를 초래하는 상황을 저감시킬 수 있다.When the degree of the data out of the expectation reaches a predetermined threshold value, the corresponding data can be regarded as noise data. Some data may be out of expectations, but may not exceed expectations too much. If this is the case, the data is likely to be valid data and is simply out of the expectation due to errors in the transmission and calculation process. Thereby helping to hold some valid data in which an error exists and reduce the situation in which valid data is removed resulting in greater errors in subsequent processing and computation.

선택적으로, 시간 서열에 대해 사전 처리를 진행하고 데이터의 노이즈를 제거하여 노이즈가 제거된 시간 서열을 생성하는 단계 이후, 먼저 노이즈가 제거된 시간 서열에 대해 압축 처리를 진행하여 압축된 시간 서열을 생성하고; Alternatively, the step of preprocessing the time sequence and removing the noise of the data to generate the noise-removed time sequence, the compression process is first performed on the noise-removed time sequence to generate a compressed time sequence and;

이어서 압축된 시간 서열의 유사도를 측정할 수 있다.The similarity of the compressed time sequence can then be measured.

여기서, 시간 서열, 특히는 대량의 시간 서열만이 정보 지향 및 표시의 정확도를 확보할 수 있으나, 대량의 데이터는 데이터 체증, 프로세서의 과부하 및 처리 속도의 저하 등 문제를 초래할 수 있으며; 시간 서열에 대해 압축 처리를 진행함으로써, 연관 규칙 마이닝 시 처리 시간을 단축시킬 수 있고; 해당 압축 처리 과정에서 시간 서열을 일련의 패턴으로 표현한 서브 시퀸스로 변환시킬 수 있으므로, 후속적인 규칙 마이닝에 도움이 된다.Here, only time sequences, especially a large number of time sequences, can ensure the accuracy of information orientation and display, but large amounts of data can cause problems such as data congestion, processor overload and degradation of processing speed; By carrying out the compression process on the time sequence, the processing time in association rule mining can be shortened; In the compression process, the time sequence can be converted into a subsequence represented by a series of patterns, which is helpful for subsequent rule mining.

선택적으로, 압축 처리는 평균치 압축법 또는 세그먼트 압축법을 이용한다.Alternatively, the compression process uses an average compression method or a segment compression method.

여기서, 선택적으로, 상기 사용자 검색 연관 규칙에 따라 확정한 사용자 수요 정보는 미래의 적어도 2개의 상이한 시간 기간 내의 사용자 수요 정보를 포함하고; 여기서, 전술한 단계(S102) 이후,Optionally, the user demand information determined according to the user search association rule comprises user demand information in at least two different time periods of the future; Here, after the above-described step S102,

서로 다른 시간 기간 내에 상응한 사용자 수요 정보를 각각 사용자가 이용하는 클라이언트에 제공하여 표시하는 단계;를 더 포함한다.And providing corresponding user demand information within a different time period to a client using the user and displaying the same.

구체적으로, 사용자 검색 연관 규칙에 따라 확정한 사용자 수요 정보는 미래의 적어도 2개의 상이한 시간 기간 내의 사용자 수요 정보를 포함하고, 서로 다른 시간 기간 내에 각각 자동적으로 로딩하여 표시한다. 예를 들어, 누군가가 인터넷 상에서 차량의 범퍼 스티커, 차량 시트 등 물품을 검색하였을 경우, 이는 흔히 그가 새차를 금방 구입하였음을 의미한다. 이러할 경우, 앞으로 1개월 내에, 그는 새차를 위해 운행 기록계, 타이어 압력계, 소화기 등 물품을 더 구입하여야 할 가능성이 존재한다. 앞으로 몇개월 뒤에 새차가 차량 정비 기간에 들어서게 되면서, 기계 오일, 기계 필터 등 물품을 구매하여야 할 가능성이 존재한다. 상이한 시간 기간에 따라, 각각 상이한 수요 정보를 매칭시켜 자동으로 로딩시킴으로써, 사용자로 하여금 그의 수요에 더욱 부합되는 정보를 볼수 있게 하여, 사용자에게 편리를 도모함과 동시에, 정보 게시자로 하여금 정보를 더욱 정확하고 필요한 군중에게 표시할 수 있게 한다. 또한, 광고주에게 있어서, 단기간의 수요에 있어서는 효과에 대한 광고가 우선적이고, 중 장기간의 수요에 대해서는 표시적인 광고가 우선적이다. 따라서, 본 기술적 방안은 시간 기간에 따라 사용자에게 서로 다른 수요 정보를 자동으로 로딩하여 표시함으로써, 사용자가 수요 정보를 찾는데 편리를 도모한다.Specifically, the user demand information determined in accordance with the user search association rule includes user demand information in at least two different time periods of the future, and automatically loads and displays each of them in different time periods. For example, if someone searches the Internet for bumper stickers, car seats, and other items on the Internet, it often means that he has just bought a new car. If this is the case, within the next month, he may have to purchase more goods for the new car, such as travel recorders, tire pressure gauges and fire extinguishers. In the next few months, as the new car enters the maintenance period, there is a possibility that it may be necessary to purchase items such as machine oil and machine filters. By automatically loading and matching different demand information according to different time periods, it is possible to allow the user to view information more in accordance with his demand, thereby making it convenient for the user, and at the same time, Make it visible to the crowd needed. For advertisers, advertisements for effects are given preference for short-term demand, and display advertisements are preferred for medium and long-term demand. Accordingly, the present technical idea automatically loads and displays different demand information to the user according to the time period, thereby making it convenient for the user to find the demand information.

선택적으로, 본 방법은, Optionally, the method further comprises:

수요 정보에 대해 신뢰도 측정을 진행하는 단계; Performing reliability measurement on demand information;

상기 수요 정보의 신뢰도가 미리 설정된 조건에 도달할 경우, 사용자가 이용하는 클라이언트가 대기 정경에 처해 있는지 여부를 판단하는 단계; 및Determining whether a client used by a user is in a standby state when the reliability of the demand information reaches a preset condition; And

해당 클라이언트가 대기 정경에 처해 있을 경우, 상기 사용자 수요 정보를 해당 클라이언트에 제공하여 표시하는 단계;를 더 포함한다.And providing the user demand information to the client and displaying the user demand information if the client is in a waiting queue.

구체적으로, 해당 대기 정경은 PC 또는 모바일 측 대형 데이터 전송 정경, 웹 페이지 새로 고침 정경 및 응용 설치 대기 정경 등일 수 있다.Specifically, the waiting queue may be a PC or a mobile-side large data transmission window, a web page refresh window, and an application installation waiting window.

웹 페이지 차원으로 구체화하면, 웹 페이지에 다수개의 수요 정보를 표시할 경우, 아래와 같은 방식으로 표시할 수 있다.When the demand information is displayed on a web page, it can be displayed in the following manner.

사용자의 수요의 시간 순서에 따라, 미리 설정된 시간 간격으로 교대로 표시를 진행한다. 예를 들어, 교대로 표시하는 방식으로 광고를 표시할 경우, 사용자의 최근 수요를 만족시키는 광고를 최우선으로 표시한다.The display progresses alternately at predetermined time intervals according to the time order of the demand of the user. For example, when displaying an advertisement in an alternating manner, the advertisement that satisfies the user's latest demand is displayed as a top priority.

웹 페이지의 용량이 한정되어 있으므로, 미리 설정된 시간 간격에 따라 교대로 표시함으로써, 한정된 레이아웃에 더욱 많은 내용을 표시할 수 있을 뿐만 아니라, 내용을 표시하는데 소요되는 면적을 저감시킬 수 있어, 사용자에게 광고 등 내용들만 보여 귀찮아하는 상황을 피면할 수 있다.Since the capacity of the web page is limited, it is possible to display more contents on a limited layout by alternately displaying in accordance with a predetermined time interval, and also it is possible to reduce the area required for displaying contents, You can avoid situations that are annoying by showing only the contents.

선택적으로, 웹 페이지에 다수개의 수요 정보를 표시할 경우, 시간 순서에 따라 왼쪽으로부터 오른쪽으로 또는 위로부터 아래로 배열하여 표시할 수 있다. 예를 들어, 광고를 왼쪽으로부터 오른쪽으로 배열하여, 최근 수요를 만족하는 광고를 제일 왼쪽에 표시한다. 또한, 광고의 하부에 사용자 수요의 대체적인 시간을 시간축으로 표기할 수도 있다.Optionally, when a plurality of pieces of demand information are displayed on a web page, they can be arranged from left to right or from top to bottom according to time order. For example, you can arrange your ads from left to right to show the most recent demand on the left-most. In addition, an alternative time of user demand may be indicated in the lower part of the advertisement on the time axis.

선택적으로, 광고를 배열 표시함에 있어서 수요 시간 정보를 추가로 표기할 수 있다.Optionally, the demand time information may be additionally indicated in displaying the advertisements.

상대적으로 무미건조한 롤링 대기에 비해, 이러한 계기를 이용하여 사용자의 미래 수요를 만족시키는 정보를 자동으로 오픈하여 표시할 수 있다. 예를 들어, 생동하고 발랄한 형식의 광고(미니 게임)를 표시할 수 있다. 이러한 방법은 사용자의 인상을 강화시키고, 사용자가 초조해 하는 것을 저감시키고, 사용자 경험을 향상시키고, 전환율을 향상시킬 수 있다.Compared to a relatively dry rolling atmosphere, information that meets the user's future demand can be automatically opened and displayed using these instruments. For example, you can display animated and sporty ads (mini-games). This method can enhance the impression of the user, reduce the user's irritation, improve the user experience, and improve the conversion rate.

도 3은 본 발명의 다른 일 실시예에 따른 사용자 수요를 확정하는 장치이며, 해당 장치(1)는, FIG. 3 is a device for determining a user demand according to another embodiment of the present invention,

사용자의 과거 검색 기록에 따라 상응한 시간 서열 기반의 사용자 검색 연관 규칙을 조회하도록 구성된 장치("조회 장치(2)"로 약칭됨); 및 An apparatus (abbreviated as "inquiry apparatus 2") configured to inquire a user search association rule based on a corresponding time sequence according to a user's past search history; And

사용자 검색 연관 규칙에 따라 사용자의 수요 정보를 확정하도록 구성된 장치("수요 정보 확정 장치(3)"로 약칭됨);를 포함한다.And a device (abbreviated as "demand information confirmation device 3") configured to determine the demand information of the user according to the user search association rule.

기존의 기술과 비교시, 본 발명에 따른 장치는 아래와 같은 장점들을 구비한다. 시간 서열 (또는 동적 수열) 기반의 연관 규칙을 이용하여 사용자의 수요를 확정하며, 시간 서열은 동일한 통계 지수의 수치를 발생의 시간적 전후 순서에 따라 배열하여 형성된 수열이고, 시간 서열 기반의 분석은 기존의 과거 데이터에 따라 미래에 대해 예측을 진행하는 것을 주요 목적으로 하며; 구체적으로, 사람들이 실제적으로 물품 및 서비스를 검색 시 해당 정보 수요는 흔히 시간 상의 전후 순서를 구비하므로, 본 발명에 따른 장치는 시간 서열을 기반으로 하고, 사용자가 웹페이지를 브라우징할 경우, 그의 과거 검색 기록 및 사전에 설정된 연관 규칙에 따라, 미래 지향적으로 일부 과거 검색 기록에 관련된 정보를 푸시할 수 있어, 사용자로 하여금 자신이 수요하는 정보를 더욱 편리하고 빠르게 찾을 수 있도록 한다. 본 발명에 따른 장치는 일반적으로 클라우드 측의 네트워크 장치를 이용한다.Compared with existing technologies, the device according to the present invention has the following advantages. The time sequence is a sequence formed by arranging the numerical values of the same statistical index according to the temporal order of occurrence, and the time sequence based analysis is based on the existing sequence index The main objective is to make forecasts for the future based on historical data of the future; Specifically, when people actually search for goods and services, the demand for information often has an order in time before and after. Therefore, the device according to the present invention is based on time sequence, and when a user browses a web page, According to the search history and association rules set in advance, information related to some past search records can be pushed forward, so that the user can find the information he / she needs more conveniently and quickly. The device according to the present invention generally uses a network device on the cloud side.

선택적으로, 해당 장치(1)는, Optionally, the device 1 may,

사용자로부터 조회 요청을 수신할 경우, 해당 사용자의 과거 기록으로부터 해당 사용자의 과거 검색 시간 및 키워드를 획득하도록 구성된 장치(미도시); An apparatus (not shown) configured to acquire a past search time and a keyword of the user from a past record of the user when receiving an inquiry request from the user;

해당 사용자의 과거 검색 시간 및 키워드에 따라, 과거 검색 시간에 따라 배열된 키워드를 포함하는 해당 사용자의 과거 검색의 시간 서열을 생성하도록 구성된 장치(미도시); A device (not shown) configured to generate a time sequence of past searches of the user including the keywords arranged according to the past search time according to the past search time and keyword of the user;

상기 시간 서열의 유사도를 측정하도록 구성된 장치(미도시); 및 An apparatus (not shown) configured to measure the similarity of the time sequence; And

상기 측정 결과에 따라 사용자 검색의 연관 규칙을 생성하도록 구성된 장치(미도시);를 더 포함한다.And an apparatus (not shown) configured to generate an association rule of a user search according to the measurement result.

여기서, 과거 기록은 다종다양하며, 과거 기록 사이에 전후 순서 존재하지 않더라도, 과거 기록 사이에 필연코 인과 관계가 존재하며, 본 발명에 따른 장치시간 서열의 유사도를 측정함으로써, 번잡한 시간 서열에서 인과 관계 및 시간 상의 전후 순서가 존재하는 시간 서열들을 서로 연관시켜, 미래 지향적으로 수요 정보를 푸시하는 정확성을 향상시킨다.Here, there are many kinds of past records, and causal relationships exist between past records even if there is no precedence sequence between past records. By measuring the similarity of the device time sequence according to the present invention, And the temporal order in which temporal precedence sequences exist, thereby improving the accuracy of pushing demand information in the future.

여기서, 상기 측정 결과에 따라 사용자 검색 연관 규칙을 생성하도록 구성된 장치는, Here, the apparatus configured to generate the user search association rule according to the measurement result,

시간 서열에 기반하여, 패턴으로 표현한 일 세트의 패턴 서브 시퀸스를 생성하도록 구성된 장치(미도시); An apparatus (not shown) configured to generate a set of pattern subsequences represented as a pattern based on a time sequence;

해당 세트의 패턴 서브 시퀸스 사이의 유사도를 산출하도록 구성된 장치(미도시); 및 An apparatus (not shown) configured to calculate a degree of similarity between pattern subsections of the set; And

패턴 서브 시퀸스 사이의 유사도를 기반으로 사용자 검색 연관 규칙을 생성하도록 구성된 장치(미도시);를 포함한다.And an apparatus (not shown) configured to generate a user search association rule based on the similarity between the pattern subsequences.

더욱 상세하게, 본 발명에 따른 방법에 있어서, 단조 거리법, 벡터 거리법 등 알고리즘을 이용하여 유사도 측정 함수를 정의하여 패턴 서브 시퀸스 사이의 유사도를 산출하되, 여기서 알고리즘은 상술한 단조 거리법, 벡터 거리법에 한정되지 않고; 유사도 측정 이후에, 어떠한 패턴 서브 시퀸스가 동일한 빈발 패턴으로 통합될 수 있는지를 결정하고, Apriori 알고리즘 등 방법을 이용하여 빈발 패턴을 획득하고 상응한 연관 규칙을 생성하되, 여기서, 방법은 상술한 Apriori 알고리즘에 한정되지 않는다. 비록, 시간 서열이 동일한 통계 지수의 수치를 해당 발생의 시간적 전후 순서에 따라 배열하여 형성된 수열을 가리키나, 시간 서열은 많은 경우에 유사도 측정을 직접적으로 진행할 수 없거나, 유사도 측정이 상대적으로 어려우므로, 먼저 이를 패턴 서브 시퀸스로 변환시킴으로써, 편리하게 유사도를 계산할 수 있다. Apriori 알고리즘은 연관 규칙의 빈발 항목 집합을 마이닝하는 알고리즘으로서, 후보 집합의 생성 및 플롯의 하향 폐쇄 감지의 두 단계를 통해 빈발 항목 집합을 마이닝하는 것을 핵심 개념으로 한다.In more detail, in the method according to the present invention, the degree of similarity between pattern subsequences is calculated by defining a similarity measure function using an algorithm such as a forgone distance method or a vector distance method, Not limited to the street method; After determining the similarity measure, it is determined which pattern subsequences can be integrated into the same frequent pattern, and a frequent pattern is obtained using a method such as Apriori algorithm and a corresponding association rule is generated, . Although the time series indicates the sequence formed by arranging the numerical values of the statistical indices having the same time sequence in accordance with the temporal order of occurrence of the corresponding occurrence, the time sequence can not directly measure the similarity in many cases, or the similarity measurement is relatively difficult, First, by converting it to a pattern subsequence, the similarity can be conveniently calculated. The Apriori algorithm is an algorithm for mining a frequent item set of association rules. It is based on the concept of mining a frequent item set through two steps: generation of a candidate set and detection of a downward closure of a plot.

선택적으로, 측정 결과에 따라 사용자 검색 연관 규칙을 생성하도록 구성된 장치는, Optionally, the apparatus configured to generate a user search association rule according to the measurement result,

생성된 사용자 검색 연관 규칙에 대해 검증을 진행하도록 구성된 장치(미도시);를 더 포함하며, And an apparatus (not shown) configured to conduct verification for the generated user search association rule,

여기서, 상기 생성된 사용자 검색 연관 규칙에 대해 검증을 진행하도록 구성된 장치는, 검증 결과를 기반으로, 생성된 사용자 검색 연관 규칙으로부터 부분적인 또는 모든 사용자 검색 연관 규칙을 선별한다.Here, the apparatus configured to perform the verification for the generated user search association rule selects partial or all user search association rules from the generated user search association rule based on the verification result.

구체적으로, 상기 생성된 사용자 검색 연관 규칙에 대해 검증을 진행하도록 구성된 장치는, 정보 지향을 가이드하여 사용자를 도와 수요 정보를 빠르게 확정하도록, 테스트 데이터 검증 및 인공 평가를 결부하여 생성된 사용자 검색 연관 규칙에 대해 평가와 검증을 진행하고, 그중의 해석 가능성 및 신뢰도가 상대적으로 높은 규칙을 저장할 수 있다.Specifically, the apparatus configured to perform the verification for the generated user search association rule includes a user search association rule generated by associating test data verification and artificial evaluation so as to guide the information orientation and help the user to quickly determine demand information, , And can store a rule having relatively high interpretability and reliability among them.

선택적으로, 해당 생성된 사용자 검색 연관 규칙에 대해 검증을 진행하도록 구성된 장치는, 미리 설정된 시간 간격에 따라 사용자 검색 연관 규칙의 유효성을 검측하여, 실효된 사용자 검색 연관 규칙을 제거하도록 더 구성된다.Alternatively, the apparatus configured to perform the verification for the generated user search association rule may further be configured to detect the validity of the user search association rule according to a predetermined time interval, and to remove the user search association rule that has been invalidated.

구체적으로, 상기 사용자 검색 연관 규칙의 유효성을 검측하는 조작 과정은 아래와 같다.Specifically, the operation procedure for checking the validity of the user search association rule is as follows.

정보 CTR의 변화 상황을 모니터링하여 CTR에 발생한 변화가 미리 설정된 역치를 초과할 경우, 상응한 연관 규칙이 실효된 것으로 판정한다. 정보 CTR에 미리 설정된 역치를 초과하는 변화가 발생할 경우, 현재 또는 대응되는 연관 규칙이 이미 실효되거나 미래 지향성이 부족한 것을 설명하고, 이로써, 실효된 연관 규칙을 제거함으로써 용이하게 연관 규칙을 추가 및 업데이트할 수 있고, 아울러, 설명 가능성 및 높은 신뢰도를 구비한 연관 규칙으로 사용자에게 더 양호하고 빠른 서비스를 제공하여 사용자가 편리하게 사용하도록 한다. ADWIN 슬라이딩 윈도우 알고리즘을 이용하여 정보 CTR의 변화 상황에 대한 모니터링을 진행한다.When the change in the information CTR is monitored and the change in the CTR exceeds a predetermined threshold value, it is determined that the corresponding association rule has been invalidated. If the information CTR has a change exceeding a predetermined threshold value, the current or corresponding association rule is already invalidated or the future orientation is insufficient, thereby easily adding and updating the association rule by removing the invalid association rule In addition, a better and faster service is provided to the user with an association rule having explanatory feasibility and high reliability, so that the user can conveniently use the service. We use ADWIN sliding window algorithm to monitor the change of information CTR.

선택적으로, 해당 시간 서열의 유사도를 측정하도록 구성된 장치는, Optionally, the apparatus configured to measure the similarity of the time sequence,

시간 서열에 대해 사전 처리를 진행하고 데이터의 노이즈를 제거하여 노이즈가 제거된 시간 서열을 생성하도록 구성된 서브 장치(미도시); 및A sub-device (not shown) configured to pre-process the time sequence and remove the noise of the data to generate a noise-removed time sequence; And

노이즈가 제거된 시간 서열의 유사도를 측정하도록 구성된 서브 장치(미도시);를 포함한다.And a sub-device (not shown) configured to measure the degree of similarity of the noise-removed time sequence.

여기서, 해당 시간 서열은 우리가 필요한 사용자의 과거 기록 내용을 포함할 뿐만 아니라, 불가피하게 일부 유효한 데이터 이외의 간섭 데이터를 포함하므로, 시간 서열에 대해 진행하는 노이즈 제거 처리는 후속적인 시간 서열 기반의 처리 및 조작이 효율적으로 진행될 수 있도록 확보할 수 있을 뿐만 아니라, 사용자 수요 정보를 확정하는 정확도를 향상시키는데 도움될 수 있다.Here, since the time sequence includes not only the past record contents of the user as we need but also inevitably contains interference data other than some valid data, the noise elimination processing proceeding with respect to the time sequence is performed based on the subsequent time sequence based processing And operations can be efficiently performed, and can also help to improve the accuracy of determining user demand information.

선택적으로, 제거된 노이즈는 우도 비율 또는 확율 통계 등 방식으로 산출된 기대치를 벗어난 노이즈 데이터이다. 산출을 통해, 일부 기대치를 벗어난 데이터를 찾아낼 수 있고, 이러한 데이터가 곧 제거하여야 할 노이즈 데이터이다.Alternatively, the removed noise is noise data that is out of the expected value calculated by a likelihood ratio or probability statistics. Through the calculation, we can find data that is out of some expectation, and this data is noise data that should be removed soon.

데이터가 기대치를 벗어난 정도가 미리 설정된 역치에 도달할 경우, 해당 데이터를 노이즈 데이터로 볼 수 있다. 일부 데이터는 기대치를 벗어나나, 기대치를 너무 많이 벗어나지 않을 수 있으며, 이러할 경우, 해당 데이터는 유효한 데이터일 가능성이 높으며, 단지 전송 및 산출 과정에서의 오차로 인해 기대치를 벗어난 것으로, 기대치의 역치를 설정함으로써, 오차가 존재하는 일부의 유효한 데이터를 보류하는데 도움되고, 유효한 데이터가 제거되어 후속적인 처리 및 산출에 더욱 큰 오차를 초래하는 상황을 저감시킬 수 있다.When the degree of the data out of the expectation reaches a predetermined threshold value, the corresponding data can be regarded as noise data. Some data may be out of expectations, but may not exceed expectations too much. If this is the case, the data is likely to be valid data and is simply out of the expectation due to errors in the transmission and calculation process. Thereby helping to hold some valid data in which an error exists and reduce the situation in which valid data is removed resulting in greater errors in subsequent processing and computation.

선택적으로, 상기 시간 서열의 유사도를 측정하도록 구성된 장치는, Optionally, the apparatus configured to measure the similarity of the time sequence comprises:

시간 서열에 대해 사전 처리를 진행하여 데이터의 노이즈를 제거하도록 구성된 서브 장치(미도시); A sub-device (not shown) configured to pre-process the time sequence to remove noise of the data;

노이즈가 제거된 시간 서열을 생성하도록 구성된 서브 장치(미도시); A sub-device (not shown) configured to generate a noise-removed time sequence;

노이즈가 제거된 시간 서열에 대해 압축 처리를 진행하여 압축된 시간 서열을 생성하도록 구성된 서브 장치(미도시); 및 A sub-device (not shown) configured to perform a compression process on the time-sequence from which the noise is removed to generate a compressed time sequence; And

압축된 시간 서열의 유사도를 측정하도록 구성된 서브 장치(미도시);를 포함한다.And a sub-device (not shown) configured to measure the similarity of the compressed time sequence.

여기서, 시간 서열, 특히는 대량의 시간 서열만이 정보 지향 및 표시의 정확도를 확보할 수 있으나, 대량의 데이터는 데이터 체증, 프로세서의 과부하 및 처리 속도의 저하 등 문제를 초래할 수 있으며; 시간 서열에 대해 압축 처리를 진행함으로써, 연관 규칙 마이닝 시 처리 시간을 단축시킬 수 있고; 해당 압축 처리 과정에서 시간 서열을 일련의 패턴으로 표현한 서브 시퀸스로 변환시킬 수 있으므로, 후속적인 규칙 마이닝에 도움이 된다.Here, only time sequences, especially a large number of time sequences, can ensure the accuracy of information orientation and display, but large amounts of data can cause problems such as data congestion, processor overload and degradation of processing speed; By carrying out the compression process on the time sequence, the processing time in association rule mining can be shortened; In the compression process, the time sequence can be converted into a subsequence represented by a series of patterns, which is helpful for subsequent rule mining.

선택적으로, 압축 처리는 평균치 압축법 또는 세그먼트 압축법을 이용한다.Alternatively, the compression process uses an average compression method or a segment compression method.

선택적으로, 사용자 수요를 확정하도록 구성된 장치는, Optionally, a device configured to determine user demand,

서로 다른 시간 기간 내에 상응한 사용자 수요 정보를 각각 사용자가 이용하는 클라이언트에 제공하여 표시하도록 구성된 장치("표시 장치(4)"로 약칭됨);를 더 포함한다.(Abbreviated as "display device 4") configured to provide and display corresponding user demand information in a different time period to a client used by the user, respectively.

구체적으로, 상기 사용자 검색 연관 규칙에 따라 사용자 수요 정보를 확정하도록 구성된 장치는, 미래의 적오도 2개의 상이한 시간 기간 내의 사용자 수요 정보를 확정한다. 예를 들어, 누군가가 인터넷 상에서 차량의 범퍼 스티커, 차량 시트 등 물품을 검색하였을 경우, 이는 흔히 그가 새차를 금방 구입하였음을 의미한다. 이러할 경우, 앞으로 1개월 내에, 그는 새차를 위해 운행 기록계, 타이어 압력계, 소화기 등 물품을 더 구입하여야 할 가능성이 존재한다. 앞으로 몇개월 뒤에 새차가 차량 정비 기간에 들어서게 되면서, 기계 오일, 기계 필터 등 물품을 구매하여야 할 가능성이 존재한다. 상이한 시간 기간에 따라, 각각 상이한 수요 정보를 매칭시켜 자동으로 로딩시킴으로써, 사용자로 하여금 그의 수요에 더욱 부합되는 정보를 볼수 있게 하여, 사용자에게 편리를 도모함과 동시에, 정보 게시자로 하여금 정보를 더욱 정확하고 필요한 군중에게 표시할 수 있게 한다. 또한, 광고주에게 있어서, 단기간의 수요에 있어서는 효과에 대한 광고가 우선적이고, 중 장기간의 수요에 대해서는 표시적인 광고가 우선적이다. 따라서, 본 기술적 방안은 시간 기간에 따라 사용자에게 서로 다른 수요 정보를 자동으로 로딩하여 표시함으로써, 사용자가 수요 정보를 찾는데 편리를 도모한다.Specifically, the apparatus configured to determine the user demand information according to the user search association rule determines user demand information within two different time periods in the future. For example, if someone searches the Internet for bumper stickers, car seats, and other items on the Internet, it often means that he has just bought a new car. If this is the case, within the next month, he may have to purchase more goods for the new car, such as travel recorders, tire pressure gauges and fire extinguishers. In the next few months, as the new car enters the maintenance period, there is a possibility that it may be necessary to purchase items such as machine oil and machine filters. By automatically loading and matching different demand information according to different time periods, it is possible to allow the user to view information more in accordance with his demand, thereby making it convenient for the user, and at the same time, Make it visible to the crowd needed. For advertisers, advertisements for effects are given preference for short-term demand, and display advertisements are preferred for medium and long-term demand. Accordingly, the present technical idea automatically loads and displays different demand information to the user according to the time period, thereby making it convenient for the user to find the demand information.

선택적으로, 상기 사용자 수요를 확정하는 장치는, Optionally, the apparatus for determining user demand comprises:

수요 정보에 대해 신뢰도 측정을 진행하도록 구성된 장치; 를 더 포함하되, An apparatus configured to perform reliability measurement on demand information; Further comprising:

수요 정보의 신뢰도가 미리 설정된 조건에 도달할 경우, 사용자가 이용하는 클라이언트가 대기 정경에 처해 있는지 여부를 판단하고; When the reliability of demand information reaches a preset condition, it is judged whether or not the client used by the user is in a standby state;

해당 클라이언트가 대기 정경에 처해 있을 경우, 상기 사용자 수요 정보를 해당 클라이언트에 제공하여 표시한다.If the client is in the waiting queue, the user demand information is provided to the client and displayed.

구체적으로, 해당 대기 정경은 PC 또는 모바일 측 대형 데이터 전송 정경, 웹 페이지 새로 고침 정경 및 응용 설치 대기 정경 등일 수 있다.Specifically, the waiting queue may be a PC or a mobile-side large data transmission window, a web page refresh window, and an application installation waiting window.

웹 페이지 차원으로 구체화하면, 웹 페이지에 다수개의 수요 정보를 표시할 경우, 아래와 같은 방식으로 표시할 수 있다.When the demand information is displayed on a web page, it can be displayed in the following manner.

사용자의 수요의 시간 순서에 따라, 미리 설정된 시간 간격으로 교대로 표시를 진행한다. 예를 들어, 교대로 표시하는 방식으로 광고를 표시할 경우, 사용자의 최근 수요를 만족시키는 광고를 최우선으로 표시한다.The display progresses alternately at predetermined time intervals according to the time order of the demand of the user. For example, when displaying an advertisement in an alternating manner, the advertisement that satisfies the user's latest demand is displayed as a top priority.

웹 페이지의 용량이 한정되어 있으므로, 미리 설정된 시간 간격에 따라 교대로 표시함으로써, 한정된 레이아웃에 더욱 많은 내용을 표시할 수 있을 뿐만 아니라, 내용을 표시하는데 소요되는 면적을 저감시킬 수 있어, 사용자에게 광고 등 내용들만 보여 귀찮아하는 상황을 피면할 수 있다.Since the capacity of the web page is limited, it is possible to display more contents on a limited layout by alternately displaying in accordance with a predetermined time interval, and also it is possible to reduce the area required for displaying contents, You can avoid situations that are annoying by showing only the contents.

선택적으로, 웹 페이지에 다수개의 수요 정보를 표시할 경우, 시간 순서에 따라 왼쪽으로부터 오른쪽으로 또는 위로부터 아래로 배열하여 표시할 수 있다. 예를 들어, 광고를 왼쪽으로부터 오른쪽으로 배열하여, 최근 수요를 만족하는 광고를 제일 왼쪽에 표시한다. 또한, 광고의 하부에 사용자 수요의 대체적인 시간을 시간축으로 표기할 수도 있다.Optionally, when a plurality of pieces of demand information are displayed on a web page, they can be arranged from left to right or from top to bottom according to time order. For example, you can arrange your ads from left to right to show the most recent demand on the left-most. In addition, an alternative time of user demand may be indicated in the lower part of the advertisement on the time axis.

선택적으로, 광고를 배열 표시함에 있어서 수요 시간 정보를 추가로 표기할 수 있다.Optionally, the demand time information may be additionally indicated in displaying the advertisements.

상대적으로 무미건조한 롤링 대기에 비해, 이러한 계기를 이용하여 사용자의 미래 수요를 만족시키는 정보를 자동으로 오픈하여 표시할 수 있다. 예를 들어, 생동하고 발랄한 형식으로 광고(미니 게임)를 표시할 수 있다. 이러한 방법은 사용자의 인상을 강화시키고, 사용자가 초조해 하는 것을 저감시키고, 사용자 경험을 향상시키고, 전환율을 향상시킬 수 있다.Compared to a relatively dry rolling atmosphere, information that meets the user's future demand can be automatically opened and displayed using these instruments. For example, advertisements (mini games) can be displayed in a lively and sporty format. This method can enhance the impression of the user, reduce the user's irritation, improve the user experience, and improve the conversion rate.

본 발명은 소프트웨어 및/또는 소프트웨어와 하드웨어의 조합체에서 구현될 수 있으며, 예컨대 주문형 집적 회로(ASIC), 범용 목적의 컴퓨터 또는 임의의 기타 유사한 하드웨어 장치를 이용하여 구현될 수도 있음을 유의하여야 한다. 일 실시예에 있어서, 본 발명의 소프트웨어 프로그램은 상술한 단계 또는 기능을 실행하도록 프로세서로 수행될 수 있다. 마찬가지로, 본 발명의 소프트웨어 프로그램(관련된 데이터 구조)은 컴퓨터 판독 가능한 기록 매체에 저장될 수 있으며, 예컨대 RAM 저장 장치, 자기 또는 광 구동 장치 또는 플로피 디스켓 및 유사한 장치에 저장될 수 있다. 또한, 본 발명의 일부 단계 또는 기능들은 하드웨어를 이용하여 구현할 수 있는바, 예컨대 프로세서와 배합하여 각 단계 또는 기능을 실행하는 회로를 이용하여 구현할 수 있다.It should be noted that the present invention may be implemented in software and / or a combination of software and hardware and may be implemented using, for example, an application specific integrated circuit (ASIC), a general purpose computer, or any other similar hardware device. In one embodiment, a software program of the present invention may be executed by a processor to perform the steps or functions described above. Likewise, a software program (associated data structure) of the present invention may be stored on a computer-readable recording medium and stored on, for example, a RAM storage device, a magnetic or optical drive device, or a floppy diskette and similar device. In addition, some of the steps or functions of the present invention may be implemented using hardware, for example, a circuit that executes each step or function in combination with a processor.

해당 기술분야에서의 당업자들에게 있어서, 본 발명은 상술한 예시적인 실시예들의 세부 사항에 한정되지 않으며, 본 발명의 정신 또는 기본적인 특징을 위배하지 않는 한, 본 발명은 기타 구체적인 형식으로 구현될 수 있음은 자명한 것이다. 따라서, 어떠한 방면에서든, 실시예들은 모두 예시적이고 비 한정적인 것으로 보아야 하며, 본 발명의 범위는 상술한 설명에 의해 한정되는 것이 아니라 첨부된 특허 청구 범위로 정의되어야 하며, 따라서, 특허 청구 범위의 동등한 요건의 함의 및 범위 내의 변화들은 모두 본 발명 내에 포함되어야 한다. 특허 청구 범위 중의 임의의 도면 부호를 해당 청구항을 한정하는 것으로 간주하지 말아야 한다. 또한, 용어 “포함한다”가 기타 유닛 또는 단계를 배제하지 않으며, 홀수가 복수를 배제하지 않는 것도 역시 자명한 것이다. 장치 청구항들에 기재된 다수의 유닛 또는 장치들은 하나의 유닛 또는 장치로 소프트웨어 또는 하드웨어를 통해 구현될 수 있다. 용어 “제1”, “제2” 등은 명칭을 표시할 뿐 그 어떠한 특정된 순서를 표시하지 않는다.It will be understood by those skilled in the art that the present invention is not limited to the details of the above-described exemplary embodiments, and that the present invention may be embodied in other specific forms without departing from the spirit or essential characteristics thereof. It is self-evident. Accordingly, in all respects, the embodiments are to be considered as illustrative and not restrictive, and the scope of the present invention should not be limited by the above description but should be defined in the appended claims, All changes that come within the meaning and range of the requirements are to be embraced within the invention. Any reference signs in the claims shall not be construed as limiting the claim. It is also to be understood that the term " comprises " does not exclude other units or steps, and that an odd number does not exclude a plurality. The plurality of units or devices described in the device claims may be implemented in software or hardware as a unit or device. The terms " first ", " second ", and the like denote names but do not indicate any particular order.

Claims (19)

사용자의 과거 검색 기록에 따라 상응한 시간 서열 기반의 사용자 검색 연관 규칙을 조회하는 단계; 및
사용자 검색 연관 규칙에 따라 사용자의 수요 정보를 확정하는 단계;를 포함하는 것을 특징으로 하는 사용자 수요를 확정하는 방법.
Querying a user search association rule based on a time sequence based on a user's past search history; And
And determining the demand information of the user according to the user search association rule.
제1항에 있어서,
상기 사용자의 과거 기록에 따라 상응한 시간 서열 기반의 연관 규칙을 조회하는 단계 이전에,
사용자로부터 조회 요청이 수신될 경우, 상기 사용자의 과거 기록으로부터 상기 사용자의 과거 검색 시간 및 키워드를 획득하는 단계;
상기 사용자의 과거 검색 시간 및 키워드에 따라, 과거 검색 시간에 따라 배열된 키워드를 포함하는 상기 사용자의 과거 검색의 시간 서열을 생성하는 단계;
상기 시간 서열의 유사도를 측정하는 단계; 및
상기 측정 결과에 따라 사용자 검색의 연관 규칙을 생성하는 단계;를 더 포함하는 것을 특징으로 하는 사용자 수요를 확정하는 방법.
The method according to claim 1,
Before the step of querying the association rule based on the corresponding time sequence according to the past record of the user,
Acquiring the past search time and keyword of the user from the past record of the user when an inquiry request is received from the user;
Generating a time sequence of the user's past search including a keyword arranged according to a past search time according to the past search time and keyword of the user;
Measuring the similarity of the time sequence; And
And generating an association rule of a user search according to the measurement result.
제2항에 있어서,
상기 측정 결과에 따라 사용자 검색의 연관 규칙을 생성하는 단계는,
시간 서열에 기반하여, 패턴으로 표현한 일 세트의 패턴 서브 시퀸스를 생성하는 단계;
상기 세트의 패턴 서브 시퀸스 사이의 유사도를 산출하는 단계; 및
패턴 서브 시퀸스 사이의 유사도를 기반으로 사용자 검색 연관 규칙을 생성하는 단계;를 포함하는 것을 특징으로 하는 사용자 수요를 확정하는 방법.
3. The method of claim 2,
Wherein the generating of the association rule of the user search according to the measurement result comprises:
Generating a set of pattern subsequences represented as a pattern based on the time sequence;
Calculating a similarity between the pattern subsequences of the set; And
And generating a user search association rule based on the similarity between the pattern subsequences.
제2항 또는 제3항에 있어서,
상기 측정 결과에 따라 사용자 검색의 연관 규칙을 생성하는 단계는,
생성된 사용자 검색 연관 규칙에 대해 검증을 진행하는 단계; 및
검증 결과를 기반으로, 생성된 사용자 검색 연관 규칙으로부터 부분적인 또는 모든 사용자 검색 연관 규칙을 선별하는 단계;를 포함하는 것을 특징으로 하는 사용자 수요를 확정하는 방법.
The method according to claim 2 or 3,
Wherein the generating of the association rule of the user search according to the measurement result comprises:
Proceeding with the verification of the generated user search association rule; And
And selecting partial or all user search association rules from the generated user search association rule based on the verification result.
제2항 내지 제4항 중 어느 한 항에 있어서,
상기 시간 서열의 유사도를 측정하는 단계는,
시간 서열에 대해 사전 처리를 진행하고 데이터의 노이즈를 제거하여 노이즈가 제거된 시간 서열을 생성하는 단계; 및
노이즈가 제거된 시간 서열의 유사도를 측정하는 단계;를 포함하는 것을 특징으로 하는 사용자 수요를 확정하는 방법.
5. The method according to any one of claims 2 to 4,
Wherein the step of measuring the similarity of the time sequence comprises:
Pre-processing the time sequence and removing noise of the data to generate a noise-removed time sequence; And
And measuring the similarity of the noise-removed time sequence. ≪ Desc / Clms Page number 19 >
제2항 내지 제5항 중 어느 한 항에 있어서,
상기 시간 서열의 유사도를 측정하는 단계는,
시간 서열에 대해 사전 처리를 진행하고 데이터의 노이즈를 제거하여 노이즈가 제거된 시간 서열을 생성하는 단계;
노이즈가 제거된 시간 서열에 대해 압축 처리를 진행하여 압축된 시간 서열을 생성하는 단계; 및
압축된 시간 서열의 유사도를 측정하는 단계;를 포함하는 것을 특징으로 하는 사용자 수요를 확정하는 방법.
6. The method according to any one of claims 2 to 5,
Wherein the step of measuring the similarity of the time sequence comprises:
Pre-processing the time sequence and removing noise of the data to generate a noise-removed time sequence;
Performing compression processing on the noise-removed time sequence to generate a compressed time sequence; And
And measuring the similarity of the compressed time sequence. ≪ RTI ID = 0.0 > 11. < / RTI >
제1항 내지 제6항 중 어느 한 항에 있어서,
상기 사용자 검색 연관 규칙에 따라 확정한 사용자 수요 정보는 미래의 적어도 2개의 상이한 시간 기간 내의 사용자 수요 정보를 포함하고,
서로 다른 시간 기간 내에 각각 상응한 사용자 수요 정보를 사용자가 이용하는 클라이언트에 제공하여 표시하는 단계;를 더 포함하는 것을 특징으로 하는 사용자 수요를 확정하는 방법.
7. The method according to any one of claims 1 to 6,
Wherein the user demand information determined according to the user search association rule includes user demand information in at least two different time periods in the future,
And providing the corresponding user demand information to the client using the user in different time periods and displaying the user demand information.
제1항 내지 제7항 중 어느 한 항에 있어서,
상기 수요 정보에 대해 신뢰도 측정을 진행하는 단계;
상기 수요 정보의 신뢰도가 미리 설정된 조건에 도달할 경우, 사용자가 이용하는 클라이언트가 대기 정경에 처해 있는지 여부를 판단하는 단계; 및
상기 클라이언트가 대기 정경에 처해 있을 경우, 상기 사용자 수요 정보를 상기 클라이언트에 제공하여 표시하는 단계;를 더 포함하는 것을 특징으로 하는 사용자 수요를 확정하는 방법.
8. The method according to any one of claims 1 to 7,
Performing reliability measurement on the demand information;
Determining whether a client used by a user is in a standby state when the reliability of the demand information reaches a preset condition; And
And providing and displaying the user demand information to the client when the client is in the waiting queue.
사용자의 과거 검색 기록에 따라 상응한 시간 서열 기반의 사용자 검색 연관 규칙을 조회하도록 구성된 장치; 및
사용자 검색 연관 규칙에 따라 사용자의 수요 정보를 확정하도록 구성된 장치;를 포함하는 것을 특징으로 하는 사용자 수요를 확정하는 장치.
An apparatus configured to query a user search association rule based on a time sequence based on a past search history of a user; And
And a device configured to determine demand information of the user according to a user search association rule.
제9항에 있어서,
사용자로부터 조회 요청을 수신할 경우, 상기 사용자의 과거 기록으로부터 상기 사용자의 과거 검색 시간 및 키워드를 획득하도록 구성된 장치;
상기 사용자의 과거 검색 시간 및 키워드에 따라, 과거 검색 시간에 따라 배열된 키워드를 포함하는 상기 사용자의 과거 검색의 시간 서열을 생성하도록 구성된 장치;
상기 시간 서열의 유사도를 측정하도록 구성된 장치; 및
상기 측정 결과에 따라 사용자 검색의 연관 규칙을 생성하도록 구성된 장치;를 더 포함하는 것을 특징으로 하는 사용자 수요를 확정하는 장치.
10. The method of claim 9,
An apparatus configured to acquire the user's past search time and keyword from the past record of the user when receiving a query request from the user;
An apparatus configured to generate a time sequence of the user's past search including a keyword arranged according to a past search time according to the past search time and keyword of the user;
An apparatus configured to measure a similarity of the time sequence; And
And a device configured to generate an association rule of a user search according to the measurement result.
제10항에 있어서,
상기 측정 결과에 따라 사용자 검색의 연관 규칙을 생성하도록 구성된 장치는,
시간 서열에 기반하여, 패턴으로 표현한 일 세트의 패턴 서브 시퀸스를 생성하도록 구성된 장치;
상기 세트의 패턴 서브 시퀸스 사이의 유사도를 산출하도록 구성된 장치; 및
패턴 서브 시퀸스 사이의 유사도를 기반으로 사용자 검색 연관 규칙을 생성하도록 구성된 장치;를 포함하는 것을 특징으로 하는 사용자 수요를 확정하는 장치.
11. The method of claim 10,
An apparatus configured to generate an association rule of a user search according to the measurement result,
An apparatus configured to generate a set of pattern subsequences represented as a pattern based on a time sequence;
An apparatus configured to calculate a degree of similarity between pattern subsequences of the set; And
And a device configured to generate a user search association rule based on the similarity between the pattern subsequences.
제10항 또는 제11항에 있어서,
상기 측정 결과에 따라 사용자 검색의 연관 규칙을 생성하도록 구성된 장치는,
생성된 사용자 검색 연관 규칙에 대해 검증을 진행하도록 구성된 장치; 및
상기 생성된 사용자 검색 연관 규칙에 대해 검증을 진행하고, 검증 결과를 기반으로, 생성된 사용자 검색 연관 규칙으로부터 부분적인 또는 모든 사용자 검색 연관 규칙을 선별하도록 구성된 장치;를 포함하는 것을 특징으로 하는 사용자 수요를 확정하는 장치.
The method according to claim 10 or 11,
An apparatus configured to generate an association rule of a user search according to the measurement result,
A device configured to proceed with verification for the generated user search association rule; And
And a device configured to perform the verification on the generated user search association rule and to select partial or all user search association rules from the generated user search association rule based on the verification result .
제10항 내지 제12항 중 어느 한 항에 있어서,
상기 시간 서열의 유사도를 측정하도록 구성된 장치는,
시간 서열에 대해 사전 처리를 진행하고 데이터의 노이즈를 제거하여 노이즈가 제거된 시간 서열을 생성하도록 구성된 서브 장치; 및
노이즈가 제거된 시간 서열의 유사도를 측정하도록 구성된 서브 장치;를 포함하는 것을 특징으로 하는 사용자 수요를 확정하는 장치.
13. The method according to any one of claims 10 to 12,
An apparatus configured to measure the similarity of the time sequence,
A sub-device configured to process the time sequence and generate noise-canceled time sequence by removing noise of the data; And
And a sub-device configured to measure the similarity of the noise-removed time sequence.
제10항 내지 제13항 중 어느 한 항에 있어서,
상기 시간 서열의 유사도를 측정하도록 구성된 장치는,
시간 서열에 대해 사전 처리를 진행하여 데이터의 노이즈를 제거하도록 구성된 서브 장치;
노이즈가 제거된 시간 서열을 생성하도록 구성된 서브 장치;
노이즈가 제거된 시간 서열에 대해 압축 처리를 진행하여 압축된 시간 서열을 생성하도록 구성된 서브 장치; 및
압축된 시간 서열의 유사도를 측정하도록 구성된 서브 장치;를 포함하는 것을 특징으로 하는 사용자 수요를 확정하는 장치.
14. The method according to any one of claims 10 to 13,
An apparatus configured to measure the similarity of the time sequence,
A sub-apparatus configured to pre-process the time sequence to remove noise of the data;
A sub-apparatus configured to generate a noise-removed time sequence;
A subdevice configured to perform a compression process on the noise-removed time sequence to generate a compressed time sequence; And
And a sub-device configured to measure the similarity of the compressed time sequence.
제9항 내지 제14항 중 어느 한 항에 있어서,
상기 사용자 검색 연관 규칙에 따라 확정한 사용자 수요 정보는 미래의 적어도 2개의 상이한 시간 기간 내의 사용자 수요 정보를 포함하고,
서로 다른 시간 기간 내에 각각 상응한 사용자 수요 정보를 사용자가 이용하는 클라이언트에 제공하여 표시하도록 구성된 장치;를 더 포함하는 것을 특징으로 하는 사용자 수요를 확정하는 장치.
15. The method according to any one of claims 9 to 14,
Wherein the user demand information determined according to the user search association rule includes user demand information in at least two different time periods in the future,
Further comprising a device configured to provide and display corresponding user demand information to the user using the user within a different time period. ≪ RTI ID = 0.0 > 31. < / RTI >
제9항 내지 제15항 중 어느 한 항에 있어서,
상기 수요 정보에 대해 신뢰도 측정을 진행하도록 구성된 장치;
상기 수요 정보의 신뢰도가 미리 설정된 조건에 도달할 경우, 사용자가 이용하는 클라이언트가 대기 정경에 처해 있는지 여부를 판단하도록 구성된 장치; 및
상기 클라이언트가 대기 정경에 처해 있을 경우, 상기 사용자 수요 정보를 상기 클라이언트에 제공하여 표시하도록 구성된 장치;를 더 포함하는 것을 특징으로 하는 사용자 수요를 확정하는 장치.
16. The method according to any one of claims 9 to 15,
An apparatus configured to perform reliability measurement on the demand information;
An apparatus configured to determine whether a client used by a user is in a standby state when the reliability of the demand information reaches a predetermined condition; And
Further comprising: a device configured to provide and display the user demand information to the client when the client is in a waiting queue.
비 휘발성 컴퓨터 판독 가능한 매체에 있어서,
상기 비 휘발성 컴퓨터 판독 가능한 매체는 컴퓨터 코드를 포함하되, 상기 컴퓨터 코드가 실행될 경우, 제1항 내지 제8항 중 어느 한 항의 방법이 실행되는 것을 특징으로 하는 비 휘발성 컴퓨터 판독 가능한 매체.
In a non-volatile computer readable medium,
Wherein the non-volatile computer-readable medium comprises computer code, wherein when the computer code is executed, the method of any one of claims 1 to 8 is executed.
컴퓨터 프로그램 제품에 있어서,
상기 컴퓨터 프로그램 제품이 컴퓨터 장치에 의해 실행될 경우, 제1항 내지 제8항 중 어느 한 항의 방법이 실행되는 것을 특징으로 하는 컴퓨터 프로그램 제품.
In a computer program product,
9. A computer program product, characterized in that the method of any one of claims 1 to 8 is executed when the computer program product is executed by a computer device.
컴퓨터 장치에 있어서,
저장 장치; 및
프로세서;를 포함하되,
상기 저장 장치에는 컴퓨터 코드가 저장되고,
상기 프로세서는 상기 컴퓨터 코드를 실행하여 제1항 내지 제8항 중 어느 한 항의 방법을 실행하도록 구성되는 것을 특징으로 하는 컴퓨터 장치.
A computer device comprising:
A storage device; And
A processor,
The computer code is stored in the storage device,
Wherein the processor is configured to execute the computer code and to execute the method of any one of claims 1-8.
KR1020177029821A 2015-10-12 2016-07-20 Method and apparatus for determining user demand KR20170129219A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510659433.2A CN105302879B (en) 2015-10-12 2015-10-12 For determining the method and apparatus of user demand
CN201510659433.2 2015-10-12
PCT/CN2016/090750 WO2017063420A1 (en) 2015-10-12 2016-07-20 User demand determining method and apparatus

Publications (1)

Publication Number Publication Date
KR20170129219A true KR20170129219A (en) 2017-11-24

Family

ID=55200149

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177029821A KR20170129219A (en) 2015-10-12 2016-07-20 Method and apparatus for determining user demand

Country Status (4)

Country Link
JP (1) JP6653374B2 (en)
KR (1) KR20170129219A (en)
CN (1) CN105302879B (en)
WO (1) WO2017063420A1 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106227764A (en) * 2016-07-17 2016-12-14 合肥赑歌数据科技有限公司 A kind of intelligence system of big data cognitive Decision
CN106878372B (en) 2016-11-07 2020-10-02 阿里巴巴集团控股有限公司 Information pushing method and device
CN107330041A (en) * 2017-06-27 2017-11-07 达而观信息科技(上海)有限公司 A kind of relevant search word method for digging decayed based on the time and system
CN110493722A (en) * 2019-07-18 2019-11-22 平安科技(深圳)有限公司 The method, apparatus and computer equipment of offer Weather information based on data analysis
CN111324707A (en) * 2020-02-05 2020-06-23 贝壳技术有限公司 User interaction method and device, computer-readable storage medium and electronic equipment
CN113657958B (en) * 2021-08-03 2023-10-13 浙江大学 Customized product demand conversion method based on association rule oriented optimization

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10222493A (en) * 1997-02-06 1998-08-21 Kokusai Denshin Denwa Co Ltd <Kdd> Mutual causality analysis system
US6236978B1 (en) * 1997-11-14 2001-05-22 New York University System and method for dynamic profiling of users in one-to-one applications
SG91861A1 (en) * 1999-04-27 2002-10-15 Ibm Data mining for association rules and sequential patterns within data of inhomogeneous type
US6473757B1 (en) * 2000-03-28 2002-10-29 Lucent Technologies Inc. System and method for constraint based sequential pattern mining
CN101286150B (en) * 2007-04-10 2010-09-15 阿里巴巴集团控股有限公司 Method and device for creating updated parameter, method and device for displaying relevant key words
US8290921B2 (en) * 2007-06-28 2012-10-16 Microsoft Corporation Identification of similar queries based on overall and partial similarity of time series
US8161052B2 (en) * 2008-01-30 2012-04-17 Hewlett-Packard Development Company, L.P. Information module recommendation
US8001166B2 (en) * 2008-03-28 2011-08-16 International Business Machines Corporation Methods and apparatus for optimizing keyword data analysis
CN101355504B (en) * 2008-08-14 2012-08-08 成都市华为赛门铁克科技有限公司 Method and apparatus for confirming user behavior
US8515966B2 (en) * 2009-01-09 2013-08-20 Ebay Inc. Analyzing queries to generate product intention rules
JP5056802B2 (en) * 2009-06-30 2012-10-24 株式会社Jvcケンウッド Information providing server and information providing method
CN101667197A (en) * 2009-09-18 2010-03-10 浙江大学 Mining method of data stream association rules based on sliding window
JP5752245B2 (en) * 2011-05-26 2015-07-22 株式会社日立製作所 Information search method, information search device, and storage medium
CN102760163B (en) * 2012-06-12 2015-04-29 北京奇虎科技有限公司 Personalized recommendation method and device of characteristic information
CN103399883B (en) * 2013-07-19 2017-02-08 百度在线网络技术(北京)有限公司 Method and system for performing personalized recommendation according to user interest points/concerns
CN104376021A (en) * 2013-08-16 2015-02-25 捷达世软件(深圳)有限公司 File recommending system and method
WO2015036817A1 (en) * 2013-09-15 2015-03-19 Yogesh Chunilal Rathod Structured updated status, requests, user data & programming based presenting & accessing of connections
CN104598475B (en) * 2013-10-31 2018-02-23 中国移动通信集团公司 Storage and indexing means and system based on driving dosage model event
CN104778176A (en) * 2014-01-13 2015-07-15 阿里巴巴集团控股有限公司 Data search processing method and device
CN104317945A (en) * 2014-10-31 2015-01-28 亚信科技(南京)有限公司 E-commerce website commodity recommending method on basis of search behaviors

Also Published As

Publication number Publication date
WO2017063420A1 (en) 2017-04-20
CN105302879B (en) 2019-03-08
JP6653374B2 (en) 2020-02-26
JP2018514047A (en) 2018-05-31
CN105302879A (en) 2016-02-03

Similar Documents

Publication Publication Date Title
KR20170129219A (en) Method and apparatus for determining user demand
US20200364731A1 (en) Subscription churn prediction
US20230177579A1 (en) System and method for computing features that apply to infrequent queries
US9846885B1 (en) Method and system for comparing commercial entities based on purchase patterns
CN109242044A (en) Training method, device, storage medium and the electronic equipment of vehicle and goods matching model
WO2014190032A1 (en) System and method for predicting an outcome by a user in a single score
CN105893406A (en) Group user profiling method and system
US20180053206A1 (en) Matching products with service scenarios
EP3513579A1 (en) Venue detection
US10185972B2 (en) Predicting purchase session behavior using the shopping funnel model stages
EP4107679A1 (en) Machine learning platform
US10614101B2 (en) Virtual agent for improving item identification using natural language processing and machine learning techniques
EP3819851A1 (en) Electronic device and method for controlling same
US11651291B2 (en) Real-time predictions based on machine learning models
CN117693756A (en) Systems, methods, and computer program products for anomaly detection in a multivariate time series
CN111209351A (en) Object relation prediction method and device, object recommendation method and device, electronic equipment and medium
JP2016177583A (en) Traffic line processing system and traffic line processing method
CN110348947B (en) Object recommendation method and device
Zhong et al. Advancing Android activity recognition service with Markov smoother: Practical solutions
CN111522888A (en) Method and device for mining competitive relationship between interest points
CN113139115A (en) Information recommendation method, search method, device, client, medium and equipment
CN114065063A (en) Information processing method, information processing apparatus, storage medium, and electronic device
US20240054058A1 (en) Ensemble models for anomaly detection
Yin et al. A new Wasserstein distance-and cumulative sum-dependent health indicator and its application in prediction of remaining useful life of bearing
CN112214663A (en) Method, system, device, storage medium and mobile terminal for obtaining public opinion volume

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
E601 Decision to refuse application
E801 Decision on dismissal of amendment