KR20240079334A - Apparatus And Method For Removing Invalid Spectator Trajectory Fake Big Data - Google Patents

Apparatus And Method For Removing Invalid Spectator Trajectory Fake Big Data Download PDF

Info

Publication number
KR20240079334A
KR20240079334A KR1020220162141A KR20220162141A KR20240079334A KR 20240079334 A KR20240079334 A KR 20240079334A KR 1020220162141 A KR1020220162141 A KR 1020220162141A KR 20220162141 A KR20220162141 A KR 20220162141A KR 20240079334 A KR20240079334 A KR 20240079334A
Authority
KR
South Korea
Prior art keywords
data
fake
trajectory
content
time
Prior art date
Application number
KR1020220162141A
Other languages
Korean (ko)
Inventor
권준호
김구
변경수
Original Assignee
부산대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 부산대학교 산학협력단 filed Critical 부산대학교 산학협력단
Priority to KR1020220162141A priority Critical patent/KR20240079334A/en
Publication of KR20240079334A publication Critical patent/KR20240079334A/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/094Adversarial learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • Z01A10/00

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 무효한 관람객 궤적 모조 빅데이터 제거를 위한 장치 및 그 방법에 관한 것으로, 보다 구체적으로 ID, 시간 및 임의의 공간에서의 물리적 위치가 정해진 콘텐츠를 포함하는 실제 궤적 데이터를 획득하는 실제 궤적 데이터 획득부, 딥러닝 모델을 이용하여 상기 실제 궤적 데이터와 동일한 칼럼을 갖는 모조 데이터를 생성하는 모조 데이터 생성부 및 상기 모조 데이터 중에서 상기 실제 궤적 데이터를 기준으로 물리적으로 매칭(Matching)될 수 없는 모조 데이터를 필터링(Filtering)하는 필터링부를 포함하는 무효한 관람객 궤적 모조 빅데이터 제거를 위한 장치 및 그 방법에 관한 것이다.The present invention relates to an apparatus and method for removing invalid visitor trajectory imitation big data, and more specifically, to obtain real trajectory data including content whose ID, time, and physical location in arbitrary space are determined. An acquisition unit, a fake data generator that generates fake data having the same column as the actual trajectory data using a deep learning model, and fake data that cannot be physically matched based on the actual trajectory data among the fake data. It relates to an apparatus and method for removing invalid visitor trajectory imitation big data including a filtering unit for filtering.

Description

무효한 관람객 궤적 모조 빅데이터 제거를 위한 장치 및 그 방법 {Apparatus And Method For Removing Invalid Spectator Trajectory Fake Big Data}Apparatus And Method For Removing Invalid Spectator Trajectory Fake Big Data}

본 발명은 무효한 관람객 궤적 모조 빅데이터 제거를 위한 장치 및 그 방법에 관한 것이다.The present invention relates to an apparatus and method for removing invalid visitor trace imitation big data.

여가시간의 증가로 인해 남녀노소 문화생활에 대한 관심이 높아지고 있으며, 이로 인해 다양한 전시들이 개최되고 있다. 최근 전시는 기술 발전에 따라 인터넷 및 스마트 기술과의 융복합을 통한 다각적 관람 경험이 제공되고 있고, 관람객의 문화 수준 증가에 발맞춰 전시의 양적, 질적 수준도 향상되고 있어 점차 전시의 전문화 및 다양화가 이루어지고 있다. Due to the increase in leisure time, interest in cultural life is increasing among people of all ages and genders, and as a result, various exhibitions are being held. Recently, exhibitions are providing a multifaceted viewing experience through the convergence of the Internet and smart technology in accordance with technological developments, and the quantitative and qualitative levels of exhibitions are improving in line with the increase in the cultural level of visitors, leading to gradual specialization and diversification of exhibitions. It is being done.

이때, 스마트 기술과의 접목을 통해서 사용자 경험의 향상과 전시 운영하기 위해서는 수많은 데이터들이 필요하고, 수많은 데이터들이 데이터셋이 되어 인공지능 모델이 학습될 수 있다. 이때, 실제에서 획득할 수 있는 데이터의 양은 인공지능 모델이 학습되는데 충분하지 못하므로 인공적으로 데이터의 양을 늘릴 필요가 있고, 이러한 과정에서 부적합한 데이터를 포함할 수 있는데, 어떠한 처리 및 보정 과정 없이 인공지능 모델을 학습하게 되면 잘못된 결과가 반복적으로 출력될 수 있다. 따라서 본 기술 분야에서는 전시 운영에 필요한 수많은 관람객의 궤적 데이터를 생성, 처리 및 보정할 수 있는 기술이 절실히 필요한 실정이다.At this time, a lot of data is needed to improve user experience and operate exhibitions through integration with smart technology, and a lot of data becomes a dataset from which artificial intelligence models can be learned. At this time, the amount of data that can be acquired in reality is not enough for the artificial intelligence model to learn, so it is necessary to artificially increase the amount of data. In this process, inappropriate data may be included, and artificial intelligence models can be learned without any processing or correction. When an intelligence model is trained, incorrect results may be output repeatedly. Therefore, in this field of technology, there is an urgent need for technology that can generate, process, and correct the trajectory data of numerous visitors required for exhibition operation.

대한민국 특허등록공보 제10-1902315호Republic of Korea Patent Registration No. 10-1902315 대한민국 공개특허공보 제10-2022-0049165호Republic of Korea Patent Publication No. 10-2022-0049165

본 발명은 상기와 같은 문제점을 해결하기 위한 것으로 전시 운영에 필요한 수많은 관람객의 궤적 모조 빅데이터를 처리 및 보정하여 보다 정확한 출력값을 제공하는 인공지능 모델을 생성할 수 있도록 실제 궤적 데이터와 동일한 칼럼을 갖는 모조 데이터를 생성하고, 모조 데이터를 대상으로 물리적으로 매칭될 수 없는 시간 및 콘텐츠 중 적어도 하나를 포함하는 모조 데이터를 필터링하는 무효 관람객 궤적 모조 빅데이터 제거를 위한 장치 및 그 방법을 얻고자 하는 것을 목적으로 한다.The present invention is intended to solve the above problems, and has the same column as the actual trajectory data to create an artificial intelligence model that provides more accurate output values by processing and correcting big data that simulates the trajectories of numerous visitors required for exhibition operation. The purpose is to obtain an apparatus and method for removing invalid visitor trajectory fake big data that generates fake data and filters fake data containing at least one of time and content that cannot be physically matched to the fake data. Do this.

본 발명이 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 본 발명의 기재로부터 당해 분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있다.The technical problems to be achieved by the present invention are not limited to the technical problems mentioned above, and other technical problems not mentioned can be clearly understood by those skilled in the art from the description of the present invention.

상기 목적을 달성하기 위하여, 본 발명의 무효한 관람객 궤적 모조 빅데이터 제거를 위한 장치는 ID, 시간 및 임의의 공간에서의 물리적 위치가 정해진 콘텐츠를 포함하는 실제 궤적 데이터를 획득하는 실제 궤적 데이터 획득부; 딥러닝 모델을 이용하여 상기 실제 궤적 데이터와 동일한 칼럼을 갖는 모조 데이터를 생성하는 모조 데이터 생성부; 및 상기 모조 데이터 중에서 상기 실제 궤적 데이터를 기준으로 물리적으로 매칭(Matching)될 수 없는 모조 데이터를 필터링(Filtering)하는 필터링부;를 제공한다.In order to achieve the above object, the apparatus for removing invalid visitor trajectory imitation big data of the present invention is an actual trajectory data acquisition unit that acquires actual trajectory data including content whose ID, time, and physical location in an arbitrary space are determined. ; a fake data generator that generates fake data having the same columns as the actual trajectory data using a deep learning model; and a filtering unit that filters out fake data that cannot be physically matched with the actual trajectory data among the fake data.

상기 목적을 달성하기 위하여, 본 발명의 무효한 관람객 궤적 모조 빅데이터 제거를 위한 방법은 실제 궤적 데이터 획득부에 의하여, ID, 시간 및 임의의 공간에서의 물리적 위치가 정해진 콘텐츠를 포함하는 실제 궤적 데이터가 획득되는 실제 궤적 데이터 획득단계; 모조 데이터 생성부에 의하여, 딥러닝 모델이 이용되어 상기 실제 궤적 데이터와 동일한 칼럼을 갖는 모조 데이터가 생성되는 모조 데이터 생성단계; 및 필터링부에 의하여, 상기 모조 데이터 중에서 상기 실제 궤적 데이터가 기준이 되어 물리적으로 매칭(Matching)될 수 없는 모조 데이터가 필터링(Filtering)되는 필터링단계;를 제공한다.In order to achieve the above object, the method for removing invalid visitor trajectory imitation big data of the present invention is to obtain actual trajectory data including content whose ID, time, and physical location in an arbitrary space are determined by the actual trajectory data acquisition unit. An actual trajectory data acquisition step in which is acquired; A fake data generation step in which fake data having the same column as the actual trajectory data is generated by a fake data generator using a deep learning model; and a filtering step in which, by a filtering unit, fake data that cannot be physically matched is filtered out of the fake data using the actual trajectory data as a standard.

이상과 같이 본 발명에 의하면 실제 궤적 데이터와 동일한 칼럼을 갖는 모조 데이터를 생성하고, 모조 데이터를 대상으로 물리적으로 매칭될 수 없는 시간 및 콘텐츠 중 적어도 하나를 포함하는 모조 데이터를 필터링함으로써, 전시 운영에 필요한 수많은 관람객의 궤적 모조 빅데이터를 처리 및 보정할 수 있는 현저한 효과가 있다.As described above, according to the present invention, fake data having the same column as actual trajectory data is generated, and fake data containing at least one of time and content that cannot be physically matched to the fake data is filtered, thereby improving exhibition operation. There is a remarkable effect in processing and correcting the necessary big data to simulate the trajectories of numerous visitors.

또한, 본 발명은 처리 및 보정된 궤적 모조 빅데이터를 이용하여 인공지능 모델을 학습함으로써, 보다 정확한 출력값을 제공하는 인공지능 모델을 생성할 수 있는 효과가 있다.In addition, the present invention has the effect of creating an artificial intelligence model that provides more accurate output values by learning an artificial intelligence model using processed and corrected trajectory imitation big data.

본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 상세한 설명 및 청구범위의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.The effects of the present invention are not limited to the effects mentioned above, and other effects not mentioned will be clearly understood by those skilled in the art from the detailed description and claims.

도 1은 본 발명의 무효한 관람객 궤적 모조 빅데이터 제거를 위한 장치 구성도이다.
도 2는 본 발명의 일실시예에 따라 타당한(Valid) 모조 데이터와 타당하지 않은(Invalid) 모조 데이터를 표시한 도면이다.
도 3은 본 발명의 무효한 관람객 궤적 모조 빅데이터 제거를 위한 방법 흐름도이다.
Figure 1 is a diagram illustrating the configuration of an apparatus for removing invalid visitor trajectory fake big data according to the present invention.
Figure 2 is a diagram showing valid and invalid fake data according to an embodiment of the present invention.
Figure 3 is a flowchart of a method for removing invalid visitor trajectory fake big data according to the present invention.

본 명세서에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.The terms used in this specification are general terms that are currently widely used as much as possible while considering the function in the present invention, but this may vary depending on the intention or precedent of a person working in the art, the emergence of new technology, etc. In addition, in certain cases, there are terms arbitrarily selected by the applicant, and in this case, the meaning will be described in detail in the description of the relevant invention. Therefore, the terms used in the present invention should be defined based on the meaning of the term and the overall content of the present invention, rather than simply the name of the term.

다르게 정의되지 않는 한 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless otherwise defined, all terms used herein, including technical or scientific terms, have the same meaning as generally understood by a person of ordinary skill in the technical field to which the present invention pertains. Terms defined in commonly used dictionaries should be interpreted as having a meaning consistent with the meaning in the context of the related technology, and unless clearly defined in the present application, should not be interpreted in an ideal or excessively formal sense. No.

이하, 본 발명에 따른 실시예를 첨부한 도면을 참조하여 상세히 설명하기로 한다. 도 1은 본 발명의 무효한 관람객 궤적 모조 빅데이터 제거를 위한 장치 구성도이다. 도 2는 본 발명의 일실시예에 따라 타당한(Valid) 모조 데이터와 타당하지 않은(Invalid) 모조 데이터를 표시한 도면이다. 도 3은 본 발명의 무효한 관람객 궤적 모조 빅데이터 제거를 위한 방법 흐름도이다.Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings. Figure 1 is a diagram illustrating the configuration of an apparatus for removing invalid visitor trajectory fake big data according to the present invention. Figure 2 is a diagram showing valid and invalid fake data according to an embodiment of the present invention. Figure 3 is a flowchart of a method for removing invalid visitor trajectory fake big data according to the present invention.

무효한 관람객 궤적 모조 빅데이터 제거를 위한 장치Device for removing invalid visitor trajectories and fake big data

우선, 도 1을 보면, 본 발명의 무효한 관람객 모조 빅데이터 제거를 위한 장치는 실제 궤적 데이터 획득부(100), 모조 데이터 생성부(200) 및 필터링부(300)를 포함한다.First, looking at Figure 1, the apparatus for removing invalid fake visitor big data of the present invention includes an actual trajectory data acquisition unit 100, a fake data generation unit 200, and a filtering unit 300.

보다 구체적으로, 상기 실제 궤적 데이터 획득부(100)는 ID, 시간 및 임의의 공간에서의 물리적 위치가 정해진 콘텐츠를 포함하는 실제 궤적 데이터를 획득한다. More specifically, the real trajectory data acquisition unit 100 acquires real trajectory data including content whose ID, time, and physical location in an arbitrary space are determined.

본 발명에서 언급하는 ID는 관람객 개인을 인식할 수 있도록 부여되는 고유한 숫자 및 문자 중 적어도 하나일 수 있다. 본 발명에서 언급하는 시간은 관람객이 임의의 공간에서의 물리적 위치에 도착한 시간이다. 시간은 일실시예에 따라 년, 월, 일, 시, 분, 초 단위까지 포함할 수 있다. 상기 임의의 공간은 2차원 좌표로 구현될 수 있고, 이에 따라 임의의 공간에서 콘텐츠의 물리적 위치가 지정될 수 있다. 즉, 일정한 방향에 따라 콘텐츠의 순서를 확인할 수 있다. 그리고 상기 실제 궤적 데이터(Real data)는 전시회, 과학관 등 관람객이 관람할 수 있는 전시가 이루어지는 임의의 공간에서 실제로 다수의 관람객으로부터 획득한 데이터이다. 상기 실제 궤적 데이터(Real data)의 일실시예는 하기 [표 1]과 같다.The ID referred to in the present invention may be at least one of unique numbers and letters given to recognize individual visitors. The time referred to in the present invention is the time when a visitor arrives at a physical location in a certain space. Depending on one embodiment, time may include units of years, months, days, hours, minutes, and seconds. The arbitrary space may be implemented as two-dimensional coordinates, and thus the physical location of content in the arbitrary space may be specified. In other words, the order of content can be confirmed according to a certain direction. And the real trajectory data (real data) is data actually obtained from a large number of visitors in any space where exhibitions that visitors can view, such as exhibitions or science museums, are held. An example of the real trajectory data (Real data) is shown in [Table 1] below.

IDID 시간hour 콘텐츠contents 1One 220915:12:36220915:12:36 AA 1One 220915:15:07220915:15:07 BB 22 220915:11:10220915:11:10 CC .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

또한, 상기 실제 궤적 데이터 획득부(100)는 상기 실제 궤적 데이터를 ID별 시간 순으로 콘텐츠를 나열하는 것을 특징으로 한다. 이는, 부분별하게 획득된 데이터를 획득한 순서대로 나열하게 되면, ID별로 시간에 종속된 콘텐츠의 순서 및 개수를 확인하기 어렵고 이를 확인하기 위해서 상당한 시간이 소요됨으로, 이는, 데이터 처리 속도 및 효율성을 향상시키기 위함이다.In addition, the actual trajectory data acquisition unit 100 is characterized by arranging contents of the actual trajectory data in chronological order by ID. This is because, when separately acquired data is listed in the order in which it was acquired, it is difficult to check the order and number of time-dependent content by ID, and it takes a considerable amount of time to check this, which reduces data processing speed and efficiency. It is to improve.

다음으로, 상기 모조 데이터 생성부(200)는 딥러닝 모델을 이용하여 상기 실제 궤적 데이터와 동일한 칼럼을 갖는 모조 데이터를 생성한다. Next, the fake data generator 200 uses a deep learning model to generate fake data having the same columns as the actual trajectory data.

상기 모조 데이터(Synthetic data)는 상기 실제 궤적 데이터와 동일하게 ID, 시간 및 임의의 공간에서의 물리적 위치가 정해진 콘텐츠를 포함할 수 있다. 다만, 임의의 공간에서 실제 관람객으로부터 획득한 데이터가 아닌, 상기 딥러닝 모델을 이용하여 인공적으로 생성된 데이터이다.The synthetic data may include content with the same ID, time, and physical location in arbitrary space as the actual trajectory data. However, this is not data obtained from actual visitors in a random space, but data artificially generated using the deep learning model.

이때, 상기 모조 데이터 생성부(200)는, 상기 딥러닝 모델이 CTGAN(Conditional Tabular GAN) 모델인 것을 특징으로 한다. 일반적으로, GAN 모델은 상호적대적인 식별자(Discriminator)와 생성자(Generator)를 활용하여 이산 데이터를 포함하는 실제 궤적 데이터와 비슷한 데이터를 인공적으로 생성하는 네트워크이고, 기계학습에서 비지도 학습에 속하는 모델이다. 즉, 기존의 GAN 모델은 이산 데이터에는 적용이 불가능한 것을 보완한 모델이다. At this time, the fake data generator 200 is characterized in that the deep learning model is a CTGAN (Conditional Tabular GAN) model. In general, the GAN model is a network that artificially generates data similar to actual trajectory data including discrete data by utilizing mutually adversarial discriminators and generators, and is a model that belongs to unsupervised learning in machine learning. In other words, it is a model that complements the fact that the existing GAN model cannot be applied to discrete data.

다음으로, 상기 필터링부(300)는 상기 모조 데이터 중에서 상기 실제 궤적 데이터를 기준으로 물리적으로 매칭(Matching)될 수 없는 모조 데이터를 필터링(Filtering)한다.Next, the filtering unit 300 filters fake data that cannot be physically matched with the actual trajectory data among the fake data.

본 발명에서 언급하는 실제 궤적 데이터는 임의의 공간에서의 특정 위치인콘텐츠(C)에 따른 시간(t) 값이 있다. 상기 모조 데이터 생성부(200) 내 딥러닝 모델인 CTGAN으로부터 생성되는 모조 데이터는 이러한 궤적 데이터에 특징에 위배되는 무효한 데이터가 포함될 수 있다. 모조 데이터 속성 중 특정 위치에 해당하는 모조 시간 값이 실제 궤적 데이터의 전후 상관관계를 봤을 때 생성될 수 없는 값이 생성되어 있다면, 상기 필터링부(300)는 이러한 모조 데이터를 타탕하지 않은(Invalid) 모조 데이터 및 물리적으로 매칭(Matching)될 수 없는 모조 데이터로 판단하여 제거할 수 있다. The actual trajectory data referred to in the present invention has a time (t) value according to content (C), which is a specific location in arbitrary space. The fake data generated from CTGAN, a deep learning model in the fake data generator 200, may include invalid data that violates the characteristics of the trajectory data. If the fake time value corresponding to a specific position among the fake data properties is a value that cannot be generated when looking at the front-end correlation of the actual trajectory data, the filtering unit 300 determines that the fake data is invalid (Invalid). It can be removed as it is judged to be fake data or fake data that cannot be physically matched.

구체적으로 상기 필터링부(300)는, 임의의 모조 데이터의 시간이 임의의 실제 궤적 데이터의 시간범위 내 존재하고 임의의 모조 데이터의 콘텐츠가 임의의 실제 궤적 데이터의 콘텐츠범위 내 존재한다면 타당한(Valid) 모조 데이터로 판단하는 시간 필터모듈(310) 및 임의의 모조 데이터의 콘텐츠가 임의의 실제 궤적 데이터의 콘텐츠 내 존재하고 임의의 모조 데이터의 시간이 임의의 실제 궤적 데이터의 시간범위 내 존재한다면 타당한(Valid) 모조 데이터로 판단하는 콘텐츠 필터모듈(320)을 포함하는 것을 특징으로 한다.Specifically, the filtering unit 300 is valid if the time of any fake data is within the time range of any real trajectory data and the content of any fake data is within the content range of any real trajectory data. If the content of the time filter module 310 and the arbitrary fake data that are determined to be fake data exist within the content of the random real trajectory data and the time of the random fake data exists within the time range of the random real trajectory data, it is valid. ) It is characterized by including a content filter module 320 that determines it to be fake data.

도 2의 일실시예를 보면, 임의의 공간은 물리적 위치가 정해진 모든 콘텐츠(C0-Cn)를 포함할 수 있다. 또한, 실제 궤적 데이터 획득부(100)는 1번 ID를 대상으로 시간(t0-tn)에 종속된 다수 개의 콘텐츠(C0-Cn)를 포함하는 실제 궤적 데이터를 획득할 수 있다. 즉, 상기 실제 궤적 데이터는 t0 시간에서의 C0 콘텐츠, t1에서의 C2 콘텐츠, t2에서의 C5 콘텐츠, tn-1 시간에서의 Cn-1 콘텐츠 및 tn에서의 Cn 콘텐츠를 포함할 수 있다. 또한, 상기 모조 데이터 생성부(200)는 1번 ID를 대상으로 시간(tx1-txm)에 종속된 다수 개의 콘텐츠(Cy1-Cm)를 포함하는 모조 데이터를 생성할 수 있다. 여기서, n, m은 양의 정수이다. 즉, 상기 모조 데이터는 tx1 시간에서의 Cy1 콘텐츠, tx2 시간에서의 Cy2 콘텐츠를 포함할 수 있다. Looking at the embodiment of FIG. 2, an arbitrary space may include all contents (C0-Cn) whose physical locations are determined. Additionally, the real trajectory data acquisition unit 100 may acquire real trajectory data including a plurality of contents (C0-Cn) dependent on time (t0-tn) targeting ID 1. That is, the actual trajectory data may include C0 content at time t0, C2 content at t1, C5 content at t2, Cn-1 content at time tn-1, and Cn content at tn. Additionally, the fake data generator 200 may generate fake data including a plurality of contents (Cy1-Cm) dependent on time (tx1-txm) targeting ID 1. Here, n and m are positive integers. That is, the fake data may include Cy1 content at time tx1 and Cy2 content at time tx2.

만약, tx1 시간이 to 내지 t1 범위 내 존재한다면, Cy1 콘텐츠는 C1 콘텐츠일 수 있으나, C3 내지 Cn 중 하나의 콘텐츠일 수 없다. 즉, Cy1 콘텐츠는 C3 내지 Cn 중 하나의 콘텐츠라면 물리적으로 매칭될 수 없는 것이다. 즉, 상기 시간 필터모듈(310)은 일실시예에 따라 상기 모조 데이터가 tx1 시간에서의 Cy1 콘텐츠가 C5라면 타당하지 않고(Invalid), 물리적으로 매칭(Matching)될 수 없는 모조 데이터인 것으로 판단하여 해당하는 모조 데이터를 제거할 수 있다. 따라서 상기 시간 필터모듈(310)은 시간을 기준으로 콘텐츠의 매칭여부를 판단할 수 있다.If the tx1 time is within the range from to to t1, Cy1 content can be C1 content, but cannot be one of C3 to Cn content. In other words, Cy1 content cannot be physically matched if it is one of C3 to Cn content. That is, according to one embodiment, the time filter module 310 determines that the fake data is invalid if the Cy1 content at time tx1 is C5 and is fake data that cannot be physically matched. The corresponding fake data can be removed. Therefore, the time filter module 310 can determine whether content is matched based on time.

또한 만약, Cy2 콘텐츠는 C2 콘텐츠 내지 C5 콘텐츠 범위 이내에 있다면, tx2 시간은 t1 내지 t2 시간범위 내 존재해야 한다. 즉, tx2 시간이 t1 내지 t2 범위 이외에 존재하는 것은 물리적으로 매칭될 수 없는 것이다. 즉, 상기 콘텐츠 필터모듈(320)은 일실시예에 따라 Cy2 콘텐츠의 tx2 시간이 t1 내지 t2에 존재하지 않고 t5라면 타당하지 않고(Invalid), 물리적으로 매칭(Matching)될 수 없는 모조 데이터인 것으로 판단하여 해당하는 모조 데이터를 제거할 수 있다. 따라서 상기 콘텐츠 필터모듈(320)은 콘텐츠를 기준으로 시간의 매칭여부를 판단할 수 있다.Also, if Cy2 content is within the range of C2 content to C5 content, tx2 time must exist within the t1 to t2 time range. In other words, if the tx2 time is outside the t1 to t2 range, it cannot be physically matched. That is, according to one embodiment, the content filter module 320 determines that if the tx2 time of the Cy2 content does not exist in t1 to t2 but is t5, it is invalid and is fake data that cannot be physically matched. You can judge and remove the corresponding fake data. Therefore, the content filter module 320 can determine whether or not time matches based on the content.

무효한 관람객 궤적 모조 빅데이터 제거를 위한 방법Method for removing invalid visitor trajectories and fake big data

도 3을 보면, 본 발명의 무효한 관람객 궤적 모조 빅데이터 제거를 위한 방법은 실제 궤적 데이터 획득단계(S100), 모조 데이터 생성단계(S200) 및 필터링단계(S300)를 포함한다.Referring to Figure 3, the method for removing invalid visitor trajectory fake big data of the present invention includes an actual trajectory data acquisition step (S100), a fake data generation step (S200), and a filtering step (S300).

보다 구체적으로, 상기 실제 궤적 데이터 획득단계(S100)는 실제 궤적 데이터 획득부(100)에 의하여, ID, 시간 및 임의의 공간에서의 물리적 위치가 정해진 콘텐츠를 포함하는 실제 궤적 데이터가 획득된다.More specifically, in the actual trajectory data acquisition step (S100), real trajectory data including content whose ID, time, and physical location in an arbitrary space are determined is acquired by the real trajectory data acquisition unit 100.

본 발명에서 언급하는 ID는 관람객 개인을 인식할 수 있도록 부여되는 고유한 숫자 및 문자 중 적어도 하나일 수 있다. 본 발명에서 언급하는 시간은 관람객이 임의의 공간에서의 물리적 위치에 도착한 시간이다. 시간은 일실시예에 따라 년, 월, 일, 시, 분, 초 단위까지 포함할 수 있다. 상기 임의의 공간은 2차원 좌표로 구현될 수 있고, 이에 따라 임의의 공간에서 콘텐츠의 물리적 위치가 지정될 수 있다. 즉, 일정한 방향에 따라 콘텐츠의 순서를 확인할 수 있다. 그리고 상기 실제 궤적 데이터(Real data)는 전시회, 과학관 등 관람객이 관람할 수 있는 전시가 이루어지는 임의의 공간에서 실제로 다수의 관람객으로부터 획득한 데이터이다. 상기 실제 궤적 데이터(Real data)의 일실시예는 상기 [표 1]과 같다. The ID referred to in the present invention may be at least one of unique numbers and letters provided to recognize individual visitors. The time referred to in the present invention is the time when a visitor arrives at a physical location in a certain space. Depending on one embodiment, time may include units of years, months, days, hours, minutes, and seconds. The arbitrary space may be implemented as two-dimensional coordinates, and thus the physical location of content in the arbitrary space may be specified. In other words, the order of content can be confirmed according to a certain direction. And the real trajectory data (real data) is data actually obtained from a large number of visitors in any space where exhibitions that visitors can view, such as exhibitions or science museums, are held. An example of the real trajectory data is shown in [Table 1].

또한, 상기 실제 궤적 데이터 획득단계(S100)는 상기 실제 궤적 데이터가 ID별 시간 순으로 콘텐츠가 나열되는 것을 특징으로 한다. 이는, 부분별하게 획득된 데이터를 획득한 순서대로 나열하게 되면, ID별로 시간에 종속된 콘텐츠의 순서 및 개수를 확인하기 어렵고 이를 확인하기 위해서 상당한 시간이 소요됨으로, 이는, 데이터 처리 속도 및 효율성을 향상시키기 위함이다.In addition, the actual trajectory data acquisition step (S100) is characterized in that the contents of the actual trajectory data are arranged in time order by ID. This is because, when separately acquired data is listed in the order in which it was acquired, it is difficult to check the order and number of time-dependent content by ID, and it takes a considerable amount of time to check this, which reduces data processing speed and efficiency. It is to improve.

다음으로, 상기 모조 데이터 생성단계(S200)는 모조 데이터 생성부(200)에 의하여, 딥러닝 모델이 이용되어 상기 실제 궤적 데이터와 동일한 칼럼을 갖는 모조 데이터가 생성된다.Next, in the fake data generation step (S200), the fake data generator 200 uses a deep learning model to generate fake data having the same columns as the actual trajectory data.

이때, 상기 모조 데이터 생성단계(S200)는, 상기 딥러닝 모델이 CTGAN(Conditional Tabular GAN) 모델인 것을 특징으로 한다. 일반적으로, GAN 모델은 상호적대적인 식별자(Discriminator)와 생성자(Generator)를 활용하여 이산 데이터를 포함하는 실제 궤적 데이터와 비슷한 데이터를 인공적으로 생성하는 네트워크이고, 기계학습에서 비지도 학습에 속하는 모델이다. 즉, 기존의 GAN 모델은 이산 데이터에는 적용이 불가능한 것을 보완한 모델이다. At this time, the fake data generation step (S200) is characterized in that the deep learning model is a CTGAN (Conditional Tabular GAN) model. In general, the GAN model is a network that artificially generates data similar to actual trajectory data including discrete data by utilizing mutually adversarial discriminators and generators, and is a model that belongs to unsupervised learning in machine learning. In other words, it is a model that complements the fact that the existing GAN model cannot be applied to discrete data.

다음으로, 상기 필터링단계(S300)는 상기 필터링부(300)에 의하여, 상기 모조 데이터 중에서 상기 실제 궤적 데이터가 기준이 되어 물리적으로 매칭(Matching)될 수 없는 모조 데이터가 필터링(Filtering)된다.Next, in the filtering step (S300), the filtering unit 300 filters out fake data that cannot be physically matched based on the actual trajectory data among the fake data.

본 발명에서 언급하는 실제 궤적 데이터는 임의의 공간에서의 특정 위치인콘텐츠(C)에 따른 시간(t) 값이 있다. 상기 모조 데이터 생성단계(S200)로부터 상기 딥러닝 모델인 CTGAN을 통해서 생성되는 모조 데이터는 이러한 궤적 데이터에 특징에 위배되는 무효한 데이터가 포함될 수 있다. 모조 데이터 속성 중 특정 위치에 해당하는 모조 시간 값이 실제 궤적 데이터의 전후 상관관계를 봤을 때 생성될 수 없는 값이 생성되어 있다면, 상기 필터링단계(S300)는 이러한 모조 데이터가 타탕하지 않은(Invalid) 모조 데이터 및 물리적으로 매칭(Matching)될 수 없는 모조 데이터로 판단되어 제거될 수 있다. The actual trajectory data referred to in the present invention has a time (t) value according to content (C), which is a specific location in arbitrary space. The fake data generated through CTGAN, the deep learning model, from the fake data generation step (S200) may include invalid data that violates the characteristics of the trajectory data. If the fake time value corresponding to a specific position among the fake data properties is a value that cannot be generated when looking at the front-end correlation of the actual trajectory data, the filtering step (S300) determines that the fake data is invalid. It may be removed as it is judged to be fake data or fake data that cannot be physically matched.

구체적으로 상기 필터링단계(S300)는, 상기 필터링부(300) 내 시간 필터모듈(310)에 의하여, 임의의 모조 데이터의 시간이 임의의 실제 궤적 데이터의 시간범위 내 존재하고 임의의 모조 데이터의 콘텐츠가 임의의 실제 궤적 데이터의 콘텐츠범위 내 존재한다면 타당한(Valid) 모조 데이터로 판단되는 시간 기준 판단단계(S310) 및 상기 필터링부(300) 내 콘텐츠 필터모듈(320)에 의하여, 임의의 모조 데이터의 콘텐츠가 임의의 실제 궤적 데이터의 콘텐츠 내 존재하고 임의의 모조 데이터의 시간이 임의의 실제 궤적 데이터의 시간범위 내 존재한다면 타당한(Valid) 모조 데이터로 판단되는 콘텐츠 기준 판단단계(S320)를 포함하는 것을 특징으로 한다.Specifically, in the filtering step (S300), the time of any fake data is within the time range of any real trajectory data by the time filter module 310 in the filtering unit 300, and the content of any fake data is If it exists within the content range of any actual trajectory data, it is judged to be valid fake data. By the time standard judgment step (S310) and the content filter module 320 in the filtering unit 300, the random fake data If the content exists within the content of random real trajectory data and the time of the random fake data exists within the time range of random real trajectory data, it includes a content standard judgment step (S320) in which it is judged to be valid fake data. It is characterized by

도 2의 일실시예를 보면, 임의의 공간은 물리적 위치가 정해진 모든 콘텐츠(C0-Cn)를 포함할 수 있다. 또한, 실제 궤적 데이터 획득단계(S100)는 1번 ID를 대상으로 시간(t0-tn)에 종속된 다수 개의 콘텐츠(C0-Cn)를 포함하는 실제 궤적 데이터가 획득될 수 있다. 즉, 상기 실제 궤적 데이터는 t0 시간에서의 C0 콘텐츠, t1에서의 C2 콘텐츠, t2에서의 C5 콘텐츠, tn-1 시간에서의 Cn-1 콘텐츠 및 tn에서의 Cn 콘텐츠를 포함할 수 있다. 또한, 상기 모조 데이터 생성단계(S200)는 1번 ID를 대상으로 시간(tx1-txm)에 종속된 다수 개의 콘텐츠(Cy1-Cm)를 포함하는 모조 데이터가 생성될 수 있다. 여기서, n, m은 양의 정수이다. 즉, 상기 모조 데이터는 tx1 시간에서의 Cy1 콘텐츠, tx2 시간에서의 Cy2 콘텐츠를 포함할 수 있다.Looking at the embodiment of FIG. 2, an arbitrary space may include all contents (C0-Cn) whose physical locations are determined. Additionally, in the actual trajectory data acquisition step (S100), actual trajectory data including a plurality of contents (C0-Cn) dependent on time (t0-tn) may be acquired targeting ID 1. That is, the actual trajectory data may include C0 content at time t0, C2 content at t1, C5 content at t2, Cn-1 content at time tn-1, and Cn content at tn. Additionally, in the fake data generation step (S200), fake data including a plurality of contents (Cy1-Cm) dependent on time (tx1-txm) may be generated targeting ID 1. Here, n and m are positive integers. That is, the fake data may include Cy1 content at time tx1 and Cy2 content at time tx2.

만약, tx1 시간이 to 내지 t1 범위 내 존재한다면, Cy1 콘텐츠는 C1 콘텐츠일 수 있으나, C3 내지 Cn 중 하나의 콘텐츠일 수 없다. 즉, Cy1 콘텐츠는 C3 내지 Cn 중 하나의 콘텐츠라면 물리적으로 매칭될 수 없는 것이다. 즉, 상기 시간 기준 판단단계(S310)는 일실시예에 따라 상기 모조 데이터가 tx1 시간에서의 Cy1 콘텐츠가 C5라면 타당하지 않고(Invalid), 물리적으로 매칭(Matching)될 수 없는 모조 데이터인 것으로 판단되어 해당하는 모조 데이터가 제거될 수 있다. 따라서 상기 시간 기준 판단단계(S310)는 시간을 기준으로 콘텐츠의 매칭여부가 판단될 수 있다.If the tx1 time is within the range from to to t1, Cy1 content can be C1 content, but cannot be one of C3 to Cn content. In other words, Cy1 content cannot be physically matched if it is one of C3 to Cn content. That is, according to one embodiment, the time reference determination step (S310) determines that the fake data is invalid if the Cy1 content at time tx1 is C5 and is fake data that cannot be physically matched. This allows the corresponding fake data to be removed. Therefore, in the time-based determination step (S310), whether or not the content matches can be determined based on time.

또한 만약, Cy2 콘텐츠는 C2 콘텐츠 내지 C5 콘텐츠 범위 이내에 있다면, tx2 시간은 t1 내지 t2 시간범위 내 존재해야 한다. 즉, tx2 시간이 t1 내지 t2 범위 이외에 존재하는 것은 물리적으로 매칭될 수 없는 것이다. 즉, 상기 콘텐츠 기준 판단단계(S320)는 일실시예에 따라 Cy2 콘텐츠의 tx2 시간이 t1 내지 t2에 존재하지 않고 t5라면 타당하지 않고(Invalid), 물리적으로 매칭(Matching)될 수 없는 모조 데이터인 것으로 판단되어 해당하는 모조 데이터가 제거될 수 있다. 따라서 상기 콘텐츠 기준 판단단계(S320)는 콘텐츠를 기준으로 시간의 매칭여부가 판단될 수 있다.Also, if Cy2 content is within the range of C2 content to C5 content, tx2 time must exist within the t1 to t2 time range. In other words, if the tx2 time is outside the t1 to t2 range, it cannot be physically matched. That is, the content standard determination step (S320) is invalid if the tx2 time of the Cy2 content does not exist in t1 to t2 and is t5 according to one embodiment, and is fake data that cannot be physically matched. It is determined that the corresponding fake data may be removed. Therefore, in the content standard determination step (S320), whether or not time matches can be determined based on the content.

따라서 본 발명에 의하면, 실제 궤적 데이터와 동일한 칼럼을 갖는 모조 데이터를 생성하고, 모조 데이터를 대상으로 물리적으로 매칭될 수 없는 시간 및 콘텐츠 중 적어도 하나를 포함하는 모조 데이터를 필터링함으로써, 전시 운영에 필요한 수많은 관람객의 궤적 모조 빅데이터를 처리 및 보정할 수 있는 현저한 효과가 있다. Therefore, according to the present invention, by generating fake data having the same column as the actual trajectory data and filtering the fake data containing at least one of time and content that cannot be physically matched to the fake data, the necessary information for exhibition operation is provided. It has a remarkable effect in processing and correcting big data that simulates the trajectories of numerous visitors.

즉, 종래에는 실제 궤적 데이터(Real data)를 실제 학습 데이터(Real training data)와 실제 테스트 데이터(Real test data)로 분리하여 신경망 네트워크(Neural Network), 결정트리(Decision Tree) 및 SVM 모델 중 적어도 하나를 포함하는 인공지능 모델(DNN 1)을 학습하였다. That is, conventionally, real trajectory data (Real data) is separated into real training data (Real training data) and real test data (Real test data) and at least one of the Neural Network, Decision Tree, and SVM models is used. An artificial intelligence model (DNN 1) including one was learned.

본 발명은 상기 필터링부(300)로부터 필터링 되어 타당한 모조 데이터(Valid synthetic data)와 실제 궤적 데이터 중 실제 테스트 데이터(Real test data)를 이용하여 신경망 네트워크(Neural Network), 결정트리(Decision Tree) 및 SVM 모델 중 적어도 하나를 포함하는 인공지능 모델(DNN 2)을 학습할 수 있다. 이에 따라 종래 학습방식으로 학습된 DNN 1보다 본 발명의 일실시예에 따라 학습된 DNN 2가 보다 정확한 출력값을 도출할 수 있는 현저한 효과가 있다.The present invention uses real test data among valid synthetic data and actual trajectory data filtered from the filtering unit 300 to create a neural network, decision tree, and You can learn an artificial intelligence model (DNN 2) that includes at least one of the SVM models. Accordingly, DNN 2 learned according to an embodiment of the present invention has the remarkable effect of deriving more accurate output values than DNN 1 learned using a conventional learning method.

실시예들은 하드웨어, 소프트웨어, 펌웨어, 미들웨어, 마이크로코드, 하드웨어 기술 언어, 또는 이들의 임의의 조합에 의해 구현될 수 있다. 소프트웨어, 펌웨어, 미들웨어 또는 마이크로코드로 구현되는 경우, 필요한 작업을 수행하는 프로그램 코드 또는 코드 세그먼트들은 컴퓨터 판독 가능 저장 매체에 저장되고 하나 이상의 프로세서에 의해 실행될 수 있다.Embodiments may be implemented by hardware, software, firmware, middleware, microcode, hardware description language, or any combination thereof. When implemented as software, firmware, middleware, or microcode, program code or code segments that perform necessary tasks may be stored in a computer-readable storage medium and executed by one or more processors.

그리고 본 명세서에 설명된 주제의 양태들은 컴퓨터에 의해 실행되는 프로그램 모듈 또는 컴포넌트와 같은 컴퓨터 실행 가능 명령어들의 일반적인 맥락에서 설명될 수 있다. 일반적으로, 프로그램 모듈 또는 컴포넌트들은 특정 작업을 수행하거나 특정 데이터 형식을 구현하는 루틴, 프로그램, 객체, 데이터 구조를 포함한다. 본 명세서에 설명된 주제의 양태들은 통신 네트워크를 통해 링크되는 원격 처리 디바이스들에 의해 작업들이 수행되는 분산 컴퓨팅 환경들에서 실시될 수도 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈들은 메모리 저장 디바이스들을 포함하는 로컬 및 원격 컴퓨터 저장 매체에 둘 다에 위치할 수 있다.And aspects of the subject matter described herein may be described in the general context of computer-executable instructions, such as program modules or components that are executed by a computer. Typically, program modules or components include routines, programs, objects, and data structures that perform specific tasks or implement specific data types. Aspects of the subject matter described herein may be practiced in distributed computing environments where tasks are performed by remote processing devices that are linked through a communications network. In a distributed computing environment, program modules may be located in both local and remote computer storage media, including memory storage devices.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 으로 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.As described above, although the embodiments have been described with limited examples and drawings, various modifications and variations can be made by those skilled in the art from the above description. For example, the described techniques are performed in an order different from the described method, and/or the components of the described system, structure, device, circuit, etc. are combined or combined in a different form than the described method, or in a different configuration. Appropriate results may be achieved through substitution or substitution by elements or equivalents.

그러므로 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Therefore, other implementations, other embodiments, and equivalents to the claims also fall within the scope of the claims described below.

100.. 실제 궤적 데이터 획득부
200.. 모조 데이터 생성부
300.. 필터링부
310.. 시간 필터모듈
320.. 콘텐츠 필터모듈
100.. Actual trajectory data acquisition unit
200.. Fake data generation unit
300.. Filtering unit
310.. Time filter module
320.. Content filter module

Claims (5)

ID, 시간 및 임의의 공간에서의 물리적 위치가 정해진 콘텐츠를 포함하는 실제 궤적 데이터를 획득하는 실제 궤적 데이터 획득부;
딥러닝 모델을 이용하여 상기 실제 궤적 데이터와 동일한 칼럼을 갖는 모조 데이터를 생성하는 모조 데이터 생성부; 및
상기 모조 데이터 중에서 상기 실제 궤적 데이터를 기준으로 물리적으로 매칭(Matching)될 수 없는 모조 데이터를 필터링(Filtering)하는 필터링부;를 포함하는 무효한 관람객 궤적 모조 빅데이터 제거를 위한 장치.
a real trajectory data acquisition unit that acquires real trajectory data including content whose ID, time, and physical location in an arbitrary space are determined;
a fake data generator that generates fake data having the same columns as the actual trajectory data using a deep learning model; and
A filtering unit for filtering fake data that cannot be physically matched with the actual trajectory data among the fake data. An apparatus for removing invalid visitor trajectory fake big data including a.
제 1항에 있어서,
상기 실제 궤적 데이터 획득부는,
상기 실제 궤적 데이터를 ID별 시간 순으로 콘텐츠를 나열하는 것을 특징으로 하는 무효한 관람객 궤적 모조 빅데이터 제거를 위한 장치.
According to clause 1,
The actual trajectory data acquisition unit,
A device for removing invalid visitor trajectory imitation big data, characterized in that the actual trajectory data is arranged in chronological order by ID.
제 1항에 있어서,
상기 모조 데이터 생성부는,
상기 딥러닝 모델이 CTGAN(Conditional Tabular GAN) 모델인 것을 특징으로 하는 무효한 관람객 궤적 모조 빅데이터 제거를 위한 장치.
According to clause 1,
The fake data generator,
A device for removing invalid visitor trajectory imitation big data, characterized in that the deep learning model is a CTGAN (Conditional Tabular GAN) model.
제 1항에 있어서,
상기 필터링부는,
임의의 모조 데이터의 시간이 임의의 실제 궤적 데이터의 시간범위 내 존재하고 임의의 모조 데이터의 콘텐츠가 임의의 실제 궤적 데이터의 콘텐츠범위 내 존재한다면 타당한(Valid) 모조 데이터로 판단하는 시간 필터모듈; 및
임의의 모조 데이터의 콘텐츠가 임의의 실제 궤적 데이터의 콘텐츠 내 존재하고 임의의 모조 데이터의 시간이 임의의 실제 궤적 데이터의 시간범위 내 존재한다면 타당한(Valid) 모조 데이터로 판단하는 콘텐츠 필터모듈;을 포함하는 것을 특징으로 하는 무효한 관람객 궤적 모조 빅데이터 제거를 위한 장치.
According to clause 1,
The filtering unit,
a time filter module that determines the fake data to be valid if the time of the random fake data is within the time range of the random real trajectory data and the content of the random fake data is within the content range of the random real trajectory data; and
Includes a content filter module that determines that the content of any fake data is valid if the content of the fake data exists within the content of the random real trajectory data and the time of the random fake data exists within the time range of the random real trajectory data. A device for removing invalid visitor trajectory imitation big data.
실제 궤적 데이터 획득부에 의하여, ID, 시간 및 임의의 공간에서의 물리적 위치가 정해진 콘텐츠를 포함하는 실제 궤적 데이터가 획득되는 실제 궤적 데이터 획득단계;
모조 데이터 생성부에 의하여, 딥러닝 모델이 이용되어 상기 실제 궤적 데이터와 동일한 칼럼을 갖는 모조 데이터가 생성되는 모조 데이터 생성단계; 및
필터링부에 의하여, 상기 모조 데이터 중에서 상기 실제 궤적 데이터가 기준이 되어 물리적으로 매칭(Matching)될 수 없는 모조 데이터가 필터링(Filtering)되는 필터링단계;를 포함하는 무효한 관람객 궤적 모조 빅데이터 제거를 위한 방법.
A real trajectory data acquisition step in which real trajectory data including content whose ID, time, and physical location in an arbitrary space are determined is acquired by a real trajectory data acquisition unit;
A fake data generation step in which fake data having the same column as the actual trajectory data is generated by a fake data generator using a deep learning model; and
A filtering step in which fake data that cannot be physically matched is filtered using the actual trajectory data as a standard among the fake data by the filtering unit; for removing invalid visitor trajectory fake big data including a method.
KR1020220162141A 2022-11-29 2022-11-29 Apparatus And Method For Removing Invalid Spectator Trajectory Fake Big Data KR20240079334A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220162141A KR20240079334A (en) 2022-11-29 2022-11-29 Apparatus And Method For Removing Invalid Spectator Trajectory Fake Big Data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220162141A KR20240079334A (en) 2022-11-29 2022-11-29 Apparatus And Method For Removing Invalid Spectator Trajectory Fake Big Data

Publications (1)

Publication Number Publication Date
KR20240079334A true KR20240079334A (en) 2024-06-05

Family

ID=91470735

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220162141A KR20240079334A (en) 2022-11-29 2022-11-29 Apparatus And Method For Removing Invalid Spectator Trajectory Fake Big Data

Country Status (1)

Country Link
KR (1) KR20240079334A (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101902315B1 (en) 2017-08-04 2018-09-28 주식회사 이너프미디어 Participatory Exhibition Guide System Using Augmented Reality
KR20220049165A (en) 2020-10-14 2022-04-21 삼성에스디에스 주식회사 System and method for enhancing inference models based on prediction data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101902315B1 (en) 2017-08-04 2018-09-28 주식회사 이너프미디어 Participatory Exhibition Guide System Using Augmented Reality
KR20220049165A (en) 2020-10-14 2022-04-21 삼성에스디에스 주식회사 System and method for enhancing inference models based on prediction data

Similar Documents

Publication Publication Date Title
Cappellari et al. Calculation of multivariate normal probabilities by simulation, with applications to maximum simulated likelihood estimation
Belo et al. Broadband in school: Impact on student performance
Hobday Innovation in Asian industrialization: A Gerschenkronian perspective
CN106354872B (en) Text clustering method and system
EP3218811B1 (en) Testing insecure computing environments using random data sets generated from characterizations of real data sets
Aliabadi et al. Storing sparse messages in networks of neural cliques
Davis Analyzing contingency tables with linear flow graphs: D systems
KR20070060862A (en) Apparatus and method for learning data construction
US20200380286A1 (en) Automatic optical character recognition (ocr) correction
CN109165564B (en) Electronic photo album, generation method, system, storage medium and computer equipment
CN110516815A (en) The characteristic processing method, apparatus and electronic equipment of artificial intelligence recommended models
CN111160568A (en) Machine reading understanding model training method and device, electronic equipment and storage medium
CN107451106A (en) Text method and device for correcting, electronic equipment
CN112418304B (en) OCR (optical character recognition) model training method, system and device
US20190138617A1 (en) Automation Of Media Content Tag Selection
CN104320719A (en) Television program interaction participating method and system based on audio watermarking
Mannan Macro determinants of remittance: Relationship between remittance and economic growth in Bangladesh
KR20240079334A (en) Apparatus And Method For Removing Invalid Spectator Trajectory Fake Big Data
Wu et al. Learning data transformation rules through examples: Preliminary results
CN111931852B (en) Target pricing method and device
Van Der Ploeg Inefficiency of credible strategies in oligopolistic resource markets with uncertainty
CN105373568A (en) Method and device for automatically learning question answers
CN106294115A (en) The method of testing of a kind of application system animal migration and device
Crofts Progress and future challenges for geoconservation in protected and conserved areas
CN108846386A (en) A kind of hand drawing pattern intelligent recognition and correcting method