KR20160140353A - Method for evaluating value of used car - Google Patents

Method for evaluating value of used car Download PDF

Info

Publication number
KR20160140353A
KR20160140353A KR1020160028980A KR20160028980A KR20160140353A KR 20160140353 A KR20160140353 A KR 20160140353A KR 1020160028980 A KR1020160028980 A KR 1020160028980A KR 20160028980 A KR20160028980 A KR 20160028980A KR 20160140353 A KR20160140353 A KR 20160140353A
Authority
KR
South Korea
Prior art keywords
vehicle
value
car
data
used car
Prior art date
Application number
KR1020160028980A
Other languages
Korean (ko)
Inventor
이한나
Original Assignee
이한나
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이한나 filed Critical 이한나
Priority to KR1020160028980A priority Critical patent/KR20160140353A/en
Publication of KR20160140353A publication Critical patent/KR20160140353A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0283Price estimation or determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0206Price or cost determination based on market factors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0265Vehicular advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0281Customer communication at a business location, e.g. providing product or service information, consulting

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

Disclosed are a method and a device for evaluating a value of a used car. The method for evaluating the value of the used car comprises: a step of receiving used car selling data including a selling price of the used car, and a value of a continuous variable corresponding to the selling price; a step of performing linearization transformation of the continuous variable; a step of receiving information for the used car which is subject to value evaluation; a step of calculating a prediction price of the used car by using a result of regression analysis and information for the used car which is subject to the value evaluation; a step of converting the used car which is subject to the value evaluation, and the used car selling data to a coordinate of a multidimensional space; a step of searching the used car which is subject to the value evaluation and a similar car; and a step of calculating an indirect prediction price of the used car by using a relative distance of the used car selling data on the multidimensional space. The device for evaluating the value of the used car comprises: a communicating unit; a used car selling database, and a controlling unit.

Description

중고차량 가치 평가 방법{Method for evaluating value of used car}{Method for evaluating used car}

본 발명은 회귀분석을 통해 중고차량의 예측가를 산출하는 중고차량 가치 평가 방법 및 시스템에 대한 것이다.The present invention relates to a method and system for evaluating a used vehicle value, which calculates a predicted value of a used vehicle through regression analysis.

중고차량의 매입 가격을 결정하는 것은 경험 많은 사람의 직관을 필요로 한다. 이러한 가격 결정은 결국 최근 거래된 유사한 차량을 바탕으로 해당 차량 가격을 유추함으로써 이루어지는데, 그 방법이 정형화되어 있지 않고 경험과 추측에 의존하므로 견적가가 사람마다 다르게 된다는 문제가 있다.Determining the purchase price of a used car requires the intuition of an experienced person. These pricing decisions are made by estimating the vehicle prices based on similar vehicles that have recently been traded. However, the method is not standardized and depends on experience and speculation.

본 발명은 상기와 같은 종래 기술의 문제점을 해소하기 위한 것으로, 회귀 분석을 이용해 정량화된 방식으로 중고차의 정확한 예상 가격을 제시할 수 있는 방법과 장치를 제공하는 것을 목적으로 한다.SUMMARY OF THE INVENTION It is an object of the present invention to provide a method and an apparatus for presenting an accurate estimated price of a used car in a quantified manner using regression analysis.

또한, 본 발명은 전문가가 아닌 비 전문가도 쉽게 차량 견적을 산출할 수 있도록 스마트폰 등의 단말에 간단한 정보를 입력하는 것만으로 중고차의 예측가를 볼 수 있는 방법과 장치를 제공하는 것을 목적으로 한다.It is another object of the present invention to provide a method and apparatus for viewing predicted value of a used car by simply inputting simple information to a terminal such as a smart phone so that a non-specialist and a non-specialist can easily calculate a vehicle estimate.

상기와 같은 목적을 달성하기 위하여, 본 발명의 일 실시예에 따른 중고차량 가치 평가 방법은, 중고차량의 판매 가격과 상기 판매 가격에 대응하는 연속형 변수의 값을 포함하는 중고차량 판매 데이터를 입력 받는 단계와; x축이 상기 연속형 변수에 0을 제외한 -2부터 2까지의 임의의 수를 거듭제곱한 값을 나타내고 y축이 상기 판매 가격을 나타내는 복수의 산점도 중에서, 산점도 상의 각 점과 회귀직선 상의 대응 좌표 간의 y축 기준 거리의 합계를 최소화하는 산점도에 적용된 거듭제곱수를 도출함으로써 상기 연속형 변수의 선형화 변환을 수행하는 단계와; 상기 판매 가격을 종속 변수 y로 하고 상기 연속형 변수를 독립 변수 x 중 하나로 포함하여 상기 중고차량 판매 데이터에 대한 다중 회귀 분석을 수행하되, 상기 선형화 변환의 결과를 적용하는 단계와; 가치 평가의 대상이 되는 중고차량에 대한 정보를 입력 받는 단계와; 상기 회귀 분석의 결과와 상기 가치 평가의 대상이 되는 중고차량에 대한 정보를 이용하여 상기 중고차량의 예측가를 산출하는 단계를 포함할 수 있다. According to an aspect of the present invention, there is provided a method for evaluating a used vehicle value, comprising: inputting used vehicle sales data including a selling price of a used vehicle and a value of a continuous variable corresponding to the selling price; Receiving; wherein the x-axis represents a value obtained by multiplying the continuous variable by an arbitrary number from -2 to 2 excluding 0 and a y-axis represents a value obtained by multiplying each point on the scattergram and corresponding coordinates on the regression line Performing a linear transformation of the continuous variable by deriving a power sum applied to a scattergram that minimizes a sum of y-axis-based distances between the centers; Performing a multiple regression analysis on the used-car sales data by including the selling price as a dependent variable y and the continuous variable as one of the independent variables x, and applying the result of the linearization conversion; Inputting information on a used vehicle to be evaluated; And calculating the predicted value of the used car by using the result of the regression analysis and the information on the used car that is the subject of the valuation.

본 발명의 다른 실시예에 따른 중고차량 가치 평가 방법은, 중고차량의 판매 가격과 상기 판매 가격에 대응하는 연속형 변수의 값을 포함하는 중고차량 판매 데이터를 입력 받는 단계와; x축이 상기 연속형 변수에 0을 제외한 -2부터 2까지의 임의의 수를 거듭제곱한 값을 나타내고 y축이 상기 판매 가격을 나타내는 복수의 산점도 중에서, 산점도 상의 각 점과 회귀직선 상의 대응 좌표 간의 y축 기준 거리를 한 변의 길이로 하는 정사각형의 면적의 합계를 최소화하는 산점도에 적용된 거듭제곱수를 도출함으로써 상기 연속형 변수의 선형화 변환을 수행하는 단계와; 상기 판매 가격을 종속 변수 y로 하고 상기 연속형 변수를 독립 변수 x 중 하나로 포함하여 상기 중고차량 판매 데이터에 대한 다중 회귀 분석을 수행하되, 상기 선형화 변환의 결과를 적용하는 단계와; 가치 평가의 대상이 되는 중고차량에 대한 정보를 입력 받는 단계와; 상기 회귀 분석의 결과와 상기 가치 평가의 대상이 되는 중고차량에 대한 정보를 이용하여 상기 중고차량의 예측가를 산출하는 단계를 포함할 수 있다.According to another aspect of the present invention, there is provided a method for evaluating a used vehicle value, comprising: receiving used vehicle sales data including a selling price of a used vehicle and a value of a continuous variable corresponding to the selling price; wherein the x-axis represents a value obtained by multiplying the continuous variable by an arbitrary number from -2 to 2 excluding 0 and a y-axis represents a value obtained by multiplying each point on the scattergram and corresponding coordinates on the regression line Performing a linear transformation of the continuous variable by deriving a power sum applied to a scattergram that minimizes a sum of areas of a square having a length of a side of the y axis as a length of one side; Performing a multiple regression analysis on the used-car sales data by including the selling price as a dependent variable y and the continuous variable as one of the independent variables x, and applying the result of the linearization conversion; Inputting information on a used vehicle to be evaluated; And calculating the predicted value of the used car by using the result of the regression analysis and the information on the used car that is the subject of the valuation.

본 발명의 또 다른 실시예에 따른 중고차량 가치 평가 방법은, 중고차량의 판매 가격과 상기 판매 가격에 대응하는 연속형 변수의 값을 포함하는 중고차량 판매 데이터를 입력 받는 단계와; x축이 상기 연속형 변수에 0을 제외한 -2부터 2까지의 임의의 수를 거듭제곱한 값을 나타내고 y축이 상기 판매 가격을 나타내는 복수의 산점도 중에서, 산점도 상의 각 점과 회귀직선 상의 대응 좌표 간의 y축 기준 거리를 한 변의 길이로 하는 정육면체의 부피의 합계를 최소화하는 산점도에 적용된 거듭제곱수를 도출함으로써 상기 연속형 변수의 선형화 변환을 수행하는 단계와; 상기 판매 가격을 종속 변수 y로 하고 상기 연속형 변수를 독립 변수 x 중 하나로 포함하여 상기 중고차량 판매 데이터에 대한 다중 회귀 분석을 수행하되, 상기 선형화 변환의 결과를 적용하는 단계와; 가치 평가의 대상이 되는 중고차량에 대한 정보를 입력 받는 단계와; 상기 회귀 분석의 결과와 상기 가치 평가의 대상이 되는 중고차량에 대한 정보를 이용하여 상기 중고차량의 예측가를 산출하는 단계를 포함할 수 있다.According to another aspect of the present invention, there is provided a method for evaluating a used vehicle value, comprising: receiving used vehicle sales data including a selling price of a used vehicle and a value of a continuous variable corresponding to the selling price; wherein the x-axis represents a value obtained by multiplying the continuous variable by an arbitrary number from -2 to 2 excluding 0 and a y-axis represents a value obtained by multiplying each point on the scattergram and corresponding coordinates on the regression line Performing a linear transformation of the continuous variable by deriving a power sum applied to a scattergram that minimizes the sum of the volumes of the cubes having the length of one side of the y axis as a reference distance; Performing a multiple regression analysis on the used-car sales data by including the selling price as a dependent variable y and the continuous variable as one of the independent variables x, and applying the result of the linearization conversion; Inputting information on a used vehicle to be evaluated; And calculating the predicted value of the used car by using the result of the regression analysis and the information on the used car that is the subject of the valuation.

본 발명의 또 다른 실시예에 따른 중고차량 가치 평가 방법은, 중고차량의 판매 가격과 상기 판매 가격에 대응하는 연속형 변수의 값을 포함하는 중고차량 판매 데이터를 입력 받는 단계와; x축이 상기 연속형 변수에 0을 제외한 -2부터 2까지의 임의의 수를 거듭제곱한 값을 나타내고 y축이 상기 판매 가격을 나타내는 복수의 산점도 중에서, y축을 기준으로 회귀직선으로부터 가장 짧은 거리의 범위 내에 모든 점이 포함되는 산점도에 적용된 거듭제곱수를 도출함으로써 상기 연속형 변수의 선형화 변환을 수행하는 단계와; 상기 판매 가격을 종속 변수 y로 하고 상기 연속형 변수를 독립 변수 x 중 하나로 포함하여 상기 중고차량 판매 데이터에 대한 다중 회귀 분석을 수행하되, 상기 선형화 변환의 결과를 적용하는 단계와; 가치 평가의 대상이 되는 중고차량에 대한 정보를 입력 받는 단계와; 상기 회귀 분석의 결과와 상기 가치 평가의 대상이 되는 중고차량에 대한 정보를 이용하여 상기 중고차량의 예측가를 산출하는 단계를 포함할 수 있다.According to another aspect of the present invention, there is provided a method for evaluating a used vehicle value, comprising: receiving used vehicle sales data including a selling price of a used vehicle and a value of a continuous variable corresponding to the selling price; the x-axis represents a value obtained by multiplying the continuous variable by an arbitrary number from -2 to 2 excluding 0, and the y-axis represents the shortest distance from the regression line Performing a linear transformation of the continuous variable by deriving a power sum applied to a scattergram including all the points within a range of < RTI ID = 0.0 > Performing a multiple regression analysis on the used-car sales data by including the selling price as a dependent variable y and the continuous variable as one of the independent variables x, and applying the result of the linearization conversion; Inputting information on a used vehicle to be evaluated; And calculating the predicted value of the used car by using the result of the regression analysis and the information on the used car that is the subject of the valuation.

본 발명의 또 다른 실시예에 따른 중고차량 가치 평가 방법은, 중고차량의 판매 가격과 상기 판매 가격에 대응하는 연속형 변수의 값을 포함하는 중고차량 판매 데이터를 입력 받는 단계와; x축이 상기 연속형 변수에 0을 제외한 -2부터 2까지의 임의의 수를 거듭제곱한 값을 나타내고 y축이 상기 판매 가격을 나타내는 복수의 산점도 중에서, 각 산점도를 가장 잘 표현하는 지수함수 형태의 회귀곡선 상의 임의의 한 점을 기준으로 Y축 기준으로 위아래로 일정 거리 만큼 떨어진 지점의 각 접선의 기울기의 차이가 가장 작은 산점도에 적용된 거듭제곱수를 도출함으로써 상기 연속형 변수의 선형화 변환을 수행하는 단계와; 상기 판매 가격을 종속 변수 y로 하고 상기 연속형 변수를 독립 변수 x 중 하나로 포함하여 상기 중고차량 판매 데이터에 대한 다중 회귀 분석을 수행하되, 상기 선형화 변환의 결과를 적용하는 단계와; 가치 평가의 대상이 되는 중고차량에 대한 정보를 입력 받는 단계와; 상기 회귀 분석의 결과와 상기 가치 평가의 대상이 되는 중고차량에 대한 정보를 이용하여 상기 중고차량의 예측가를 산출하는 단계를 포함할 수 있다.According to another aspect of the present invention, there is provided a method for evaluating a used vehicle value, comprising: receiving used vehicle sales data including a selling price of a used vehicle and a value of a continuous variable corresponding to the selling price; wherein the x-axis represents a value obtained by multiplying the continuous variable by an arbitrary number from -2 to 2, except for 0, and the y-axis represents the selling price, The linear transformation of the continuous variable is performed by deriving the power multiplication applied to the scatter diagram having the smallest gradient of the tangents of the tangents at a position spaced apart by a predetermined distance on the Y axis with respect to an arbitrary point on the regression curve of the continuous variable ; Performing a multiple regression analysis on the used-car sales data by including the selling price as a dependent variable y and the continuous variable as one of the independent variables x, and applying the result of the linearization conversion; Inputting information on a used vehicle to be evaluated; And calculating the predicted value of the used car by using the result of the regression analysis and the information on the used car that is the subject of the valuation.

상기 중고차량 가치 평가 방법은, 상기 중고차량 판매 데이터에 포함된 변수들 중 소정 수의 변수를 선택하고, 각 중고차량의 판매 정보를, 상기 선택된 각각의 변수를 각 축으로 하는 다차원 공간의 좌표로 변환하는 단계와; 상기 가치 평가의 대상이 되는 중고차량에 대한 정보를 상기 다차원 공간의 좌표로 변환하는 단계와; 상기 중고차량 판매 데이터로부터 변환된 좌표들 중 상기 가치 평가의 대상이 되는 중고차량의 좌표와 가까운 좌표에 대응하는 중고차량의 판매 가격을 사용자에게 제공하는 단계를 더 포함할 수 있다.The method for evaluating a used vehicle value includes the steps of: selecting a predetermined number of variables among variables included in the used-for-sale vehicle sales data; setting sales information of each used vehicle as coordinates of a multi- Converting; Converting information on the used vehicle that is the subject of the valuation to coordinates in the multidimensional space; And providing the user with a selling price of the used car corresponding to the coordinates close to the coordinates of the used car that is the subject of the value evaluation among the coordinates converted from the used car sales data.

상기 중고차량 가치 평가 방법은, 상기 중고차량 판매 데이터에 포함된 변수들 중 소정 수의 변수를 선택하고, 각 중고차량의 판매 정보를, 상기 선택된 각각의 변수를 각 축으로 하는 다차원 공간의 좌표로 변환하는 단계와; 상기 가치 평가의 대상이 되는 중고차량에 대한 정보를 상기 다차원 공간의 좌표로 변환하는 단계와; 상기 변환된 다차원 공간 상 데이터 좌표들을 이용하여 상기 가치 평가의 대상이 되는 중고차량과, 변환된 중고차량 판매 데이터들과의 거리에 반비례하여 각각의 가중치를 구하는 단계와; 상기 가치 평가의 대상이 되는 중고차량과, 중고차량 판매 데이터들과의 편차를 구하는 단계와; 상기 각 중고차량 판매 데이터의 판매 금액과, 상기 편차와 해당 중고차량의 회귀계수와의 곱합(Sumproduct) 연산과의 차를 구하는 단계와; 상기 중고차량 판매 데이터들에 대한 각각의 가중치와 그에 대한 상기 차의 곱을 모두 더하여 상기 가치 평가의 대상이 되는 중고차량의 상대적 예측가를 산출하는 단계와; 상기 산출된 상대적 예측가인 상대가격과, 상기 다중 회귀분석을 통한 예측가인 절대가격 중 소정의 기준을 만족하는 예측가를 사용자에게 제공하는 단계를 더 포함할 수 있다.The method for evaluating a used vehicle value includes the steps of: selecting a predetermined number of variables among variables included in the used-for-sale vehicle sales data; setting sales information of each used vehicle as coordinates of a multi- Converting; Converting information on the used vehicle that is the subject of the valuation to coordinates in the multidimensional space; Obtaining respective weights in inverse proportion to the distance between the used vehicle that is the value evaluation target and the used used vehicle sales data using the transformed multi-dimensional spatial data coordinates; Obtaining a deviation between the used vehicle and the used-for-sale data, which is the object of the valuation; Obtaining a difference between a sale amount of each of the used-for-sale vehicle sales data and a sumproduct operation of the deviation and a regression coefficient of the corresponding used vehicle; Calculating a relative predicted value of the used vehicle that is the subject of the value evaluation by adding both the weights of the used vehicle sales data and the product of the differences to the weight of the used vehicle sales data; The method may further include the step of providing the user with a predicted value that satisfies a predetermined criterion among the relative price calculated as the relative predicted value and the predicted absolute price through the multiple regression analysis.

상기 소정의 기준을 만족하는 예측가는, 상기 산출된 상대가격과 상기 다중 회귀분석을 통한 절대가격 중 낮은 예측가일 수 있다. The predictor satisfying the predetermined criterion may be a low predicted value among the calculated relative price and the absolute price through the multiple regression analysis.

상기와 같은 본 발명에 의하면, 다중 회귀 분석을 이용해 정량화된 방식으로 중고차량의 정확한 예상 가격을 제시할 수 있다.According to the present invention as described above, it is possible to present an accurate estimated price of a used car in a quantified manner using a multiple regression analysis.

또한, 본 발명에 의하면, 회귀 분석을 통한 절대 가격 외에 다차원 공간상의 기존 판매 데이터와의 거리를 이용해 견적 대상이 되는 중고차량과 유사한 차량들의 검색 결과 및 견적 대상이 되는 중고차량의 상대 가격을 사용자에게 제공할 수 있다.In addition, according to the present invention, by using the distance from the existing sales data in the multidimensional space in addition to the absolute price through the regression analysis, the search result of the vehicles similar to the used car which is the object of the estimate, and the relative price of the used vehicle, .

도 1은 본 발명의 일 실시예에 따른 중고차량 가치평가 시스템의 네트워크 구성을 설명하기 위한 도면이다.
도 2는 본 발명의 일 실시예에 따른 중고차량 가치평가 시스템의 구성을 설명하기 위한 기능 블록도이다.
도 3은 본 발명의 일 실시예에 따라 특정 차종의 판매가격과 주행거리 간의 관계를 나타내는 산점도의 일 예를 도시한 것이다.
도 4는 본 발명의 일 실시예에 따라 특정 차종의 판매가격과 주행거리 간의 관계를 나타내는 산점도의 다른 예를 도시한 것이다.
도 5는 본 발명의 일 실시예에 따라 선형성을 가장 향상시킬 수 있는 지수에 의해 도 3의 판매가격과 주행거리 간의 관계를 나타낸 그래프를 수정한 예이다.
도 6은 본 발명의 일 실시예에 따라 선형성을 가장 향상시킬 수 있는 지수에 의해 도 4의 판매가격과 주행거리 간의 관계를 나타낸 그래프를 수정한 예이다.
도 7은 본 발명의 일 실시예에 따라 선형화된 변수들을 이용하여 다중 회귀분석을 수행한 결과를 예시한 것이다.
도 8 내지 11은 본 발명의 일 실시예에 따른 사용자 인터페이스 화면을 예시한 것이다.
도 12는 본 발명의 다른 실시예에 따른 중고차량 가치 평가 장치의 구성을 설명하기 위한 기능 블록도이다.
도 13은 본 발명의 일 실시예에 따른 중고차량 가치 평가 방법을 설명하기 위한 순서도이다.
1 is a diagram illustrating a network configuration of a used vehicle value evaluation system according to an embodiment of the present invention.
2 is a functional block diagram illustrating a configuration of a used vehicle value evaluation system according to an embodiment of the present invention.
3 illustrates an example of a scatter diagram illustrating a relationship between a selling price and a mileage of a specific vehicle according to an embodiment of the present invention.
FIG. 4 illustrates another example of a scattergram showing a relationship between a selling price and a mileage of a specific vehicle according to an embodiment of the present invention.
FIG. 5 is an example of a modification of the graph showing the relationship between the selling price and the running distance of FIG. 3 by an index capable of improving the linearity most in accordance with an embodiment of the present invention.
FIG. 6 is an example of a modification of the graph showing the relationship between the selling price and the mileage of FIG. 4 according to an index capable of improving the linearity in the embodiment of the present invention.
FIG. 7 illustrates a result of performing multiple regression analysis using linearized variables according to an embodiment of the present invention.
8 to 11 illustrate a user interface screen according to an embodiment of the present invention.
12 is a functional block diagram for explaining a configuration of a used vehicle value evaluating apparatus according to another embodiment of the present invention.
13 is a flowchart illustrating a method for evaluating a used vehicle value according to an embodiment of the present invention.

본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 발명에 대해 구체적으로 설명하기로 한다. The terms used in this specification will be briefly described and the present invention will be described in detail.

본 발명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다. While the present invention has been described in connection with what is presently considered to be the most practical and preferred embodiment, it is to be understood that the invention is not limited to the disclosed embodiments. Also, in certain cases, there may be a term selected arbitrarily by the applicant, in which case the meaning thereof will be described in detail in the description of the corresponding invention. Therefore, the term used in the present invention should be defined based on the meaning of the term, not on the name of a simple term, but on the entire contents of the present invention.

명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "...수단", "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.When an element is referred to as "including" an element throughout the specification, it is to be understood that the element may include other elements as well, without departing from the spirit or scope of the present invention. The term " means ", "part "," module ", etc. in the specification means units for processing at least one function or operation, Lt; / RTI >

아래에서는 첨부한 도면을 참고하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art can easily carry out the present invention. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein. In order to clearly illustrate the present invention, parts not related to the description are omitted, and similar parts are denoted by like reference characters throughout the specification.

도 1은 본 발명의 일 실시예에 따른 중고차량 가치 평가 시스템의 네트워크 구성을 설명하기 위한 도면이다.1 is a diagram illustrating a network configuration of a used vehicle value evaluation system according to an embodiment of the present invention.

도 1을 참조하면, 중고차량 가치 평가 시스템은 네트워크를 통해 서로 데이터를 주고 받는 중고차량 가치 평가 장치(100)와 사용자 단말(110)로 구성된다. Referring to FIG. 1, the used vehicle value evaluation system includes a used vehicle value evaluation device 100 and a user terminal 110 that exchange data with each other through a network.

사용자 단말(110)은 스마트폰, 태블릿 PC, 개인용 컴퓨터 등 네트워크를 통해 가치 평가 장치(100)에 접속하여 사용자가 입력한 차량 정보를 전송하고 그 결과로서 해당 중고 차량의 예측가를 수신하여 사용자에게 제공하는 컴퓨팅 장치이다.The user terminal 110 accesses the value evaluation apparatus 100 via a network such as a smart phone, a tablet PC, a personal computer, and transmits the vehicle information input by the user. As a result, the user terminal 110 receives the predicted value of the used vehicle Lt; / RTI >

중고차량 가치 평가 장치(100)는 사용자 단말(110)에 중고차량 가치 평가 서비스를 제공하는 서버로서, 요청된 중고 차량의 가치를 평가하여 예측가를 도출하기 위해 차종별로 중고차량의 판매 데이터를 수집 및 저장하고 회귀 분석을 수행한다. 중고차량 가치 평가 장치(100)는 사용자 단말(110)이 네트워크를 통해 접속할 수 있도록 인터넷 웹 사이트, 모바일 웹 사이트 등을 운영할 수 있으며, 전용 애플리케이션을 제작하여 배포할 수도 있다. The used vehicle value evaluation apparatus 100 is a server for providing a used vehicle value evaluation service to the user terminal 110. The used vehicle value evaluation apparatus 100 collects sales data of the used vehicle for each vehicle type to estimate the value of the requested used vehicle, Store and perform regression analysis. The used vehicle value evaluation apparatus 100 may operate an Internet web site, a mobile web site, or the like so that the user terminal 110 can access the network through the network, or may make and distribute a dedicated application.

네트워크는 근거리 통신망(Local Area Network: LAN), 광역 통신망(Wide Area Network: WAN) 등의 유선 네트워크나, 이동 통신망, 위성 통신망, WIFI, 블루투스 등의 무선 네트워크일 수 있으며, 어느 한 형태의 통신망으로 제한되지 않는다.The network may be a wired network such as a local area network (LAN), a wide area network (WAN), or a wireless network such as a mobile communication network, a satellite communication network, a WIFI, or a Bluetooth network. It is not limited.

도 2는 본 발명의 일 실시예에 따른 중고차량 가치 평가 시스템의 구성을 설명하기 위한 기능 블록도이며, 화살표는 데이터의 흐름을 나타낸다.FIG. 2 is a functional block diagram for explaining a configuration of a used vehicle value evaluation system according to an embodiment of the present invention, and arrows indicate the flow of data.

도 2를 참조하면, 중고차량 가치 평가 시스템은 스마트폰 등의 원격 UI(User Interface) 입력 폼(210), 원격 수신장치(220), 중고차량 판매 데이터베이스(230), 예측가 산출수단(240), 판매데이터 분석수단(250)을 포함할 수 있다.2, the used vehicle value evaluation system includes a remote UI (User Interface) input form 210 such as a smart phone, a remote receiving device 220, a used vehicle sales database 230, a predictive value calculating means 240, And sales data analysis means 250.

중고차량 판매 데이터베이스(230)는 중고차량 판매 이력 즉 소정의 기간 동안 판매되었던 중고차량에 대한 데이터를 저장하며, 판매데이터 분석수단(250)은 중고차량 판매 데이터베이스(230)의 판매 데이터를 이용하여 회귀분석을 통한 절대가격 산출 및 판매 데이터의 다차원 공간상 좌표 변환을 통한 유사 차량 검색 및 상대 가격의 산출을 수행하기 위한 것으로 요인집단 산출 모듈(251), 데이터 수치화 및 선형 정규화 모듈(252), 다중 회귀분석 모듈(253), 데이터 다차원 좌표화 모듈(254), 유사차량 검색 모듈(255) 및 상대가격 산출 모듈(256)을 포함할 수 있다.The used-vehicle sales database 230 stores the used-vehicle sales history, that is, data on the used-for-sale vehicle that has been sold for a predetermined period of time. The sales data analyzing means 250 uses the sales data of the used- A factor group calculation module 251, a data quantization and linear normalization module 252, and a multiple regression module 252 for performing an analogous vehicle search and calculating a relative price through multidimensional spatial coordinate transformation of sales data and analysis An analysis module 253, a data multidimensional coordinates module 254, a similar vehicle search module 255, and a relative price calculation module 256.

요인집단 산출 모듈(251)은 중고차량 판매 데이터베이스(230)로부터 중고 차량의 가격에 영향을 미치는 요인을 도출한다. 차량 가격과 연관이 있을 수 있는 모든 요인들을 나열한 후 경험적인 방법, 또는 상관 분석 등의 기법을 활용하여 차량의 가치에 조금이라도 영향을 미친다고 여겨지는 요인들로 압축한다.The factor group calculation module 251 derives a factor that affects the price of the used car from the used car sales database 230. After listing all factors that may be related to vehicle price, we use empirical method or correlation analysis to compress the factors that are considered to have a slight effect on the value of the vehicle.

예를 들면 "차종/트림 레벨/차량 등록일/주행거리/연료의 종류/차량 상태/사고 이력/수출 여부/색상/사용 용도/각종 옵션의 유무 여부/구조 변경/전손·침수이력"과 같은 요인 집단을 산출할 수 있다.Factors such as "vehicle type / trim level / vehicle registration date / mileage / fuel type / vehicle status / accident history / export status / color / usage purpose / existence of various options / structure change / total loss / immersion history" Group can be calculated.

특정 차량에 대해서 얻어진 요인 집단은 해당 차량의 특성을 반영하므로, 법규 등 외부적 환경 요인의 변화로 인한 불가피한 요인 재설정의 경우가 발생하지 않는 한, 해당 차량이 시장에서 더 이상 거래되지 않을 때까지 계속해서 사용할 수 있다.Since the factor group obtained for a specific vehicle reflects the characteristic of the vehicle, unless the inevitable factor caused by a change in external environmental factors such as laws or regulations occurs, the vehicle continues to be in the market Can be used.

데이터 수치화 및 선형 정규화 모듈(252)은 선정된 요인들에 대한 데이터 수치화 및 선형 정규화를 수행한다.The data quantization and linear normalization module 252 performs data quantization and linear normalization on the selected factors.

특정 차종의 가격에 영향을 미치는 1차 요인 선정이 끝나면 선정된 요인들과 판매 가격이 포함된 데이터 집단을 중고 차량의 판매에 대한 정보를 저장한 중고 차량 판매 데이터베이스(230) 상에서 추출하게 된다. 이 데이터 군은 컴퓨터가 인식할 수 있도록 수치화 과정을 거쳐야만 한다. Once the primary factors affecting the price of a particular car are selected, the data group containing the selected factors and the sales price is extracted on the used car sales database 230, which stores information about the sale of the used car. This group of data must be digitized to be recognizable by the computer.

각 요인들은 크게 연속형 변수와 이산형인 더미(0 또는 1) 변수로 구분할 수 있는데, 연속형 변수가 아닌 더미 변수의 경우 분석을 위해 컴퓨터가 인식할 수 있도록 수치화 과정이 반드시 필요하다. 이때 차종의 경우는 데이터 집단을 구분하는 기준이 되므로 변수에 해당되지 않으며, 나머지 요인들은 분석할 수 있게 수치화하여 변환한다.Each factor can be divided into a continuous variable and a discrete dummy variable (0 or 1). In the case of a dummy variable, not a continuous variable, a quantification process is necessary to allow the computer to recognize it for analysis. In this case, the model is not a variable because it is used as a criterion for distinguishing data groups, and the remaining factors are converted into numerical values for analysis.

예를 들어, '그랜저 (5G)'의 트림 레벨이 총 5종이라고 했을 경우, 아래 표 1과 같이 각 트림 레벨의 해당 컬럼값을 해당사항의 유무를 나타내는 이산형 변수인 0 또는 1의 값을 가지는 더미 변수로 지정할 수 있다. For example, if the trim level of 'Grandeur (5G)' is 5 in total, the corresponding column value of each trim level can be set to a discrete variable, 0 or 1, Can be specified as a dummy variable.

Figure pat00001
Figure pat00001

즉, 표 1과 같이, 럭셔리 급의 경우 트림레벨1 컬럼: 1, 트림레벨2 컬럼: 0, 트림레벨3 컬럼: 0, 트림레벨4 컬럼: 0, 트림레벨5 컬럼: 0과 같이 모든 컬럼의 더미 변수를 포함하여야 트림별 분석이 가능해진다. 이와 같이 트림별로 세분화 하여 분석 대상을 쪼개지 않고 각 트림을 변수화 하여 한꺼번에 분석하면 비교적 적은 데이터로도 좋은 결과를 내는 회귀식을 도출할 수 있다. That is, as shown in Table 1, in the case of the luxury grade, all the columns such as the trim level 1 column: 1, the trim level 2 column: 0, the trim level 3 column: 0, the trim level 4 column: 0, It is necessary to include the dummy variable to be able to analyze by the trim. In this way, it is possible to derive a regression equation that produces good results even if relatively small data is obtained by dividing each trim by the trim,

또한, 차량의 년식의 경우도 차량의 가격에 큰 영향을 미친다고 볼 수 있다. 실제로 중고차의 시세 책자 등에는 각 연식별로 해당 차량의 대표 시세를 표기하기 ‹š문에 연식 또한 차량 가격 결정의 중요한 요인이 된다. 그러나 우리나라의 경우 차량의 연식을 해당 출시 연도보다 미래의 연도로 기재하는 차량 업계의 관행으로 인해 중고차 업계에서는 등록 년식을 더 중요하게 여긴다. 본 발명에서는 특정 차량의 등록 년월과 판매 년월의 차이 개월수를 변수화하여 분석한다.In addition, the annual cost of the vehicle also has a significant effect on the price of the vehicle. In fact, in the case of used cars, the yearly price is also an important factor in determining the price of the vehicle. However, in Korea, the registration age is more important in the used car industry due to the industry practice of recording the year of the vehicle in the future year than the release year. In the present invention, the number of months between the registration date and the sales year and month of a specific vehicle is parameterized and analyzed.

또한, 차량의 매각 당시 상태를 변수화하여 분석에 함께 활용할 수 있다. 표 2는 평가 방법의 구체적인 예를 든 것이다. 이를 통해 차량의 사고 평가점(A~F), 외관 상태를 포함한 종합 평가점(9~1)을 산출하는데, 이 두 값을 수치화한 곱의 값을 본 발명에서 차량상태 변수로 활용할 수 있다.In addition, the status of the vehicle at the time of sale can be used as parameters for analysis. Table 2 shows specific examples of the evaluation method. Through this, the accident evaluation points (A to F) of the vehicle and the comprehensive evaluation point (9 to 1) including the appearance state are calculated. The product value obtained by quantifying these two values can be used as the vehicle state variable in the present invention.

Figure pat00002
Figure pat00002

주행 거리의 경우, 해당 데이터가 이미 연속형 데이터이므로 분석에 그대로 활용할 수 있다. 요약하면, 중고차량의 가격에 영향을 미치는 요인들은, 특정 차량의 등록 년월과 판매 년월의 차이 개월수(이하 AGE), 주행거리(이하 KM), 차량상태 및 사고이력(이하 CHK) 등의 연속형 변수와, 트림레벨(TRIM), 연료의 종류, 수출여부, 색상, 사용용도, 각종 옵션 유무, 구조변경, 전손·침수이력 등의 이산형 변수로 분류될 수 있다.In the case of mileage, the data is already continuous data and can be used for analysis. In summary, the factors affecting the price of a used car are a series of consecutive months including the number of months (AGE), mileage (KM), vehicle condition and accident history (CHK) Type variable such as type variable, trim level (TRIM), type of fuel, whether or not it is exported, color, usage, various options, structure change, total loss and immersion history.

그러나 회귀분석의 가정인 선형성(linearity: 독립변수와 종속변수는 선형 관계를 보유)을 만족하는지 확인을 위해 산점도를 그려보면 도 3이나 도 4와 같은 결과를 얻을 수 있다.However, in order to check whether the linearity of the regression analysis satisfies the linearity (independent and dependent variables have a linear relationship), the results of the scatter plot can be obtained as shown in FIG. 3 or FIG.

도 3은 최근 2개월간 소정의 매장에서 판매된 그랜져 HG 차종의 주행거리와 판매가격 간의 관계를 나타낸 것이다.FIG. 3 shows the relationship between the running distance and the selling price of the Grandeur HG model sold in a predetermined store for the past two months.

도 3을 참조하면, 주행 거리가 늘어날수록 판매 가격이 감소하는 경향을 보이나 그 감소의 폭이 점점 줄어드는 것을 확인할 수 있다. 즉 주행 거리와 판매 가격의 관계는 선형이라고 볼 수 없다.Referring to FIG. 3, the selling price tends to decrease as the distance traveled increases, but the decrease in the selling price tends to decrease. That is, the relationship between mileage and selling price is not linear.

도 4는 최근 6개월간 소정 매장에서 판매된 에쿠스(VI) 차종의 주행거리와 판매가격 간의 관계를 나타낸 것이다.FIG. 4 shows the relationship between the distance traveled and the selling price of an EXEX (VI) vehicle sold in a predetermined store for the past six months.

도 3의 예와 비교할 때 정도의 차이는 있지만, 도 4에 나타난 다른 차량에 있어서도 유사하게 주행거리와 판매가격의 관계가 선형으로 나타나지 않음을 알 수 있다. Although there is a difference in degree as compared with the example of FIG. 3, it can be seen that the relationship between the mileage and the selling price similarly does not appear linearly in the other vehicles shown in FIG.

즉, 다른 조건이 모두 동일하고 주행 거리의 차이만 있을 때, 각각, 1만km과 2만km 사용한 차량의 가격 차이가 각각, 11만km과 12만km을 주행한 차량의 가격 차이보다 클 수 있다는 것이다. 따라서, 주행거리를 적절히 보정해주지 않으면 회귀분석 후 예측시에 주행 거리가 긴 차량의 경우 값이 실제보다 작게 예측되는 왜곡 현상이 나타나게 될 것 이다. That is, when the other conditions are all the same and there is a difference in mileage, the price difference between the vehicles using 10,000 km and 20,000 km is larger than the difference between the prices of vehicles driving 110,000 km and 120,000 km, respectively It is. Therefore, if the mileage is not properly corrected, a distortion phenomenon will be expected in the case of a vehicle having a long driving distance at the time of prediction after the regression analysis.

이를 보정하기 위해 본 발명의 실시예에 따른 연속형 변수의 선형화 변환을 수행하는 단계를 따르며, 컴퓨터 알고리즘을 통해 이 과정을 자동화하여 중고차량 가치 평가 시스템에 포함하고자 하는 모든 차종에 대하여 선형성을 가장 향상시킬 수 있는 지수를 산출해 낼 수 있다. 이와 같은 지수의 산출에 의해 도 3 및 도 4에 도시된 특정 차종의 주행거리 및 판매가격의 관계가 개선된 그래프가 도 5 및 도 6에 도시되어 있다. 이와 같이 주행거리 등의 연속형 변수를 먼저 선형화한 후 회귀분석에 활용하여야 보다 향상된 결과를 얻을 수 있다In order to compensate for this, according to the embodiment of the present invention, the linearization conversion of the continuous variable is performed, and this process is automated through a computer algorithm to improve the linearity of all the vehicles to be included in the used vehicle evaluation system Can be calculated. A graph in which the relationship between the mileage and the selling price of the specific vehicle type shown in Figs. 3 and 4 is improved by calculation of such an index is shown in Fig. 5 and Fig. In this way, continuous variables such as mileage are firstly linearized and then used for regression analysis to obtain better results

다중 회귀분석 모듈(253)은 상기와 같이 선형화된 변수를 이용하여 회귀분석을 수행한다. 즉, 상기와 같이 변환된 데이터와 요인들을 가지고 다중 회귀분석을 실행할 수 있으며 최근 2개월간 판매된 그랜져 HG 차량의 경우 도 7과 같은 회귀분석 결과를 산출할 수 있다.The multiple regression analysis module 253 performs regression analysis using the linearized variables as described above. That is, a multiple regression analysis can be performed using the data and factors as described above, and in the case of a Grandeur HG vehicle sold for the past two months, the regression analysis result as shown in FIG. 7 can be calculated.

도 7에서, NA의 결과는 해당 변수가 분석된 데이터와 관계 없음, 즉 제외될 수 있는 변수임을 나타낸다. 그러나 트림레벨을 나타내는 더미변수 LV1~LV9에서의 LV9 값은 다른 LV1~LV8 값이 모두 0인 경우와 같다고 간주하므로 LV9 변수가 필요 없음을 나타낸다.In FIG. 7, the result of NA indicates that the variable is irrelevant to the analyzed data, i.e., can be excluded. However, the LV9 values in the dummy variables LV1 to LV9 indicating the trim levels are considered to be the same as those in other LV1 to LV8 values, indicating that the LV9 variable is not necessary.

도 7의 결과에서, 도출된 조정결정계수는 R^2 = 0.9518 로써 위 회귀방정식 모델이 판매가격의 변동을 95.18% 만큼 설명하고 있음을 알 수 있다. 이 모델에 포함되지 않는 경우로 인해 발생된 변동이 4.82%에 불과할 만큼 실제 판매가격을 잘 반영하고 있음을 알 수 있다. 도 8에 도시된 실시예에서 각 변수의 의미는 아래와 같다.From the result of Fig. 7, it can be seen that the derived regression coefficient is R ^ 2 = 0.9518, and the regression equation model explains the fluctuation of the selling price by 95.18%. It can be seen that the fluctuation caused by not included in this model reflects the actual selling price just 4.82%. In the embodiment shown in FIG. 8, the meaning of each variable is as follows.

Figure pat00003
Figure pat00003

상기 실시예의 그랜져 HG차량의 경우, LPG 연료에 대해서는 트림레벨을 별도로 구분하여 분석함으로써 연료의 구분에 해당하는 변수가 없으나, LPG 차량을 장애인이 등록 후 5년이 경과하게 되면 일반인에게 이전등록이 가능해지는 법규로 인해 만5년차 LPG 자가 차량의 경우 가격이 급상승하는 경향이 있으므로 어떤 차종의 경우에는 연료 변수를 더미변수로써 추가하여야 하며, 일반 LPG인 경우와 LPG(자가) 인 경우를 각각 더미 변수로써 두고 분석하여야 한다. In the case of the Granger HG vehicle of the embodiment, there is no variable corresponding to the classification of the fuel by separately analyzing the trim level for the LPG fuel. However, if the LPG vehicle is passed five years after the registration of the disabled person, In the case of a five-year LPG, the price of a vehicle tends to rise sharply. Therefore, in some vehicles, the fuel parameter should be added as a dummy variable. In the case of ordinary LPG and LPG (self) Should be analyzed.

데이터 다차원 좌표화 모듈(254)은 중고차량 판매 데이터에 포함된 변수들 중 소정 수의 변수를 선택하고, 각 중고차량의 판매 정보를, 상기 선택된 각각의 변수를 각 축으로 하는 다차원 공간의 좌표로 변환하고, 가치 평가의 대상이 되는 중고차량에 대한 정보를 상기 다차원 공간의 좌표로 변환한다.The data multi-dimensional coordinate conversion module 254 selects a predetermined number of variables included in the used-car sales data, and stores the sales information of each used-used vehicle as coordinates of the multi-dimensional space having the respective selected axes as respective axes And converts the information on the used vehicle that is the subject of the valuation to the coordinates of the multidimensional space.

유사차량 검색 모듈은(255) 상기 데이터 다차원 좌표화 모듈(254)을 통해 중고차량 판매 데이터로부터 변환된 좌표들 중 상기 가치 평가의 대상이 되는 중고차량의 좌표와 가까운 좌표에 대응하는 유사차량의 검색 기능을 제공하여 실제 거래된 가격을 확인할 수 있도록 하므로 상기 가치 평가 대상이 되는 중고차량의 견적을 돕는다.The similar vehicle search module 255 searches for the similar vehicle corresponding to the coordinates close to the coordinates of the used vehicle that is the target of the value evaluation among the coordinates converted from the used-car sales data through the data multi-dimensional coordinate conversion module 254 Function, so that it can confirm the actual transaction price, thereby helping to estimate the value of the used vehicle.

상대가격 산출 모듈(256)은 상기 데이터 다차원 좌표화 모듈(254)을 통해 상기 가치 평가의 대상이 되는 중고차량의 좌표와의 상대적 거리에 반비례하여 각 데이터에 가중치를 부여하고, 각 데이터의 실거래가로부터 회귀 계수를 이용해 상기 가치 평가 대상이 되는 중고차량을 유추하여 도출한 예상 가격과 가중 합산하여 산출한간접 예측가격인 상대가격을 사용자에게 제공할 수 있다.The relative price calculation module 256 assigns a weight to each data in inverse proportion to the relative distance to the coordinates of the used vehicle that is the subject of the value evaluation through the data multidimensional coordinate module 254, It is possible to provide the user with a relative price, which is an indirect predicted price calculated by weighted summing up the estimated value derived by deducing the used vehicle as the value evaluation target from the regression coefficient.

상기 추가 정보 제공에 대해 아래에서 구체적으로 설명하기로 한다,The provision of the additional information will be described in detail below.

데이터 다차원 좌표화 모듈은(254) 중고차량 판매 데이터로부터 도출된 상기 변수들 중 차량 가격에 가장 큰 영향을 미친다고 여겨지는 연속형 변수 3개(AGE, KM, CK)와 이산형 변수 중 트림레벨(TRIM)의 총 4개 변수들을 묶어 데이터를 다차원 공간 위에 시각화하는 기준으로 삼을 수 있다. 이 기준 변수들은 사용자의 필요에 따라 증감될 수 있으며 변수의 종류가 늘어날수록 데이터의 분포를 나타낼 공간의 차원 수도 늘어나게 된다. 여기서는 편의상 상기 4개의 변수를 가지고 데이터를 4차원 공간에 PLOT 하게 된다.The data multidimensional coordinate module (254) comprises three consecutive variables (AGE, KM, CK) which are considered to have the greatest effect on the vehicle price among the variables derived from the used vehicle sales data (AGE, KM, CK) (TRIM), can be used as a basis for visualizing data on multidimensional space. These reference variables can be increased or decreased according to the user 's needs. As the number of variables increases, the number of dimensions of the space to represent the distribution of data also increases. Here, the data is PLOTed in the four-dimensional space with the four variables for convenience.

차량 데이터를 다차원 공간 위에 표현하기 위해 이제 아래와 같은 단계를 거칠 수 있다.The following steps can now be taken to represent the vehicle data on multidimensional space.

먼저, 사용자가 임의의 차량에 대하여 상기 변수들의 조건을 지정하여 검색을 질의할 때 시스템은 해당 데이터를 데이터 수치화 및 선형 정규화 모듈(252)을 통해 상기 "변수 수치화 과정"을 거쳐 임시 변수에 저장한다.First, when the user queries a search for a condition of the variable with respect to an arbitrary vehicle, the system stores the data in the temporary variable through the " variable quantification process "through the data quantization and linear normalization module 252 .

다음으로, 사용자가 가격 분석 또는 검색을 요하는 특정 차종으로 한정된 데이터셋에서 상기 4개의 각 변수들의 최대값을 찾는다. 예컨대, 사용자가 입력한 차량이 그랜저 HG라면 해당 차량의 데이터 셋에서, AGE_MAX: 24, KM_MAX: 217,388, CHK_MAX: 40, TRIM_MAX: 13을 도출한다.Next, the user finds the maximum value of each of the four parameters in a data set limited to a specific model requiring price analysis or search. For example, if the vehicle inputted by the user is a Grandeur HG, AGE_MAX: 24, KM_MAX: 217, 388, CHK_MAX: 40, TRIM_MAX: 13 are derived from the data set of the corresponding vehicle.

또는, 연산시간의 단축을 위해, 사용자의 검색 및 분석 요청 전에 데이터베이스 상 모든 차종별로 상기 4개의 각 변수들의 최대값을 찾아 둘 수도 있다.Alternatively, to shorten the computation time, the maximum value of each of the four variables may be searched for every vehicle type in the database before the user's search and analysis request.

다음으로, 다차원 공간상에 차량 데이터에를 시각화하여 표현하기 위해, 데이터셋의 차량들을 좌표로 표현하여야 한다. 변수 AGE, KM, CHK, TRIM을 각 축으로 하는 4차원 공간에 특정 차종 데이터셋의 각 데이터를 표현하게 되는데, 이를 위해 각 데이터의 해당 변수를 앞서 구한 최대값으로 나눈 값이 바로 특정 차량의 좌표가 된다. 이렇게 계산된 좌표를 (AGE_C, KM_C, CHK_C, TRIM_C) 라고 하면, 좌표로 표준화된 변수값은 아래 수학식 1과 같은 관계를 가진다. Next, in order to visualize and express the vehicle data on the multidimensional space, the vehicles of the data set should be expressed in coordinates. The data of a specific vehicle data set is expressed in a four-dimensional space having the axes AGE, KM, CHK, and TRIM as axes. For this purpose, the value obtained by dividing the corresponding variable of each data by the maximum value obtained is the coordinates . Assuming that the coordinates thus calculated are (AGE_C, KM_C, CHK_C, TRIM_C), the variable values normalized to the coordinates have the relationship as shown in the following Equation (1).

Figure pat00004
Figure pat00004

상기와 같이 오리지널 데이터를 최대값으로 나누어 좌표로 변환하는 이유는 다음과 같다. 첫째, 이러한 변환 과정이 없이 기존 값을 그대로 사용할 경우 다른 변수 대비 상대적으로 큰 수를 가지는 요인(예: KM 등)으로 인해 데이터를 다차원 공간상에 균일하게 표현하기 어렵고 산포가 한쪽으로 치우치기 때문이다. 둘째, 각 변수의 절대적 크기가 아닌 최대값 대비 상대적 크기, 즉 상대적 영향력으로서 다른 데이터와의 비교를 위함이다. The reason why the original data is divided into the maximum values and converted into the coordinates as described above is as follows. First, it is difficult to uniformly express the data in the multidimensional space due to a relatively large number of factors (for example, KM, etc.) compared with other variables when the existing values are used without such conversion process, . Second, it is for comparison with other data as relative magnitude relative to maximum value, that is, relative influence, not absolute magnitude of each variable.

다음으로, 임시변수에 저장되어 있던 사용자의 입력 데이터도 "차량 데이터 시각화"와 동일한 과정을 거쳐 다차원 공간상의 좌표로 변환한다. 이렇게 변환된 좌표를 (AGE_N, KM_N, CHK_N, TRIM_N) 이라고 하자. Next, the input data of the user stored in the temporary variable is converted into the coordinates in the multidimensional space through the same process as the "vehicle data visualization ". Let the translated coordinates be (AGE_N, KM_N, CHK_N, TRIM_N).

이제 4차원 공간에는 N 개의 기존 판매 데이터를 변환한 좌표인 (AGE_C1, KM_C1, CHK_C1, TRIM_C1), (AGE_C2, KM_C2, CHK_C2, TRIM_C2), … , (AGE_CN, KM_CN, CHK_CN, TRIM_CN)과, 사용자의 입력 데이터를 변환한 좌표인 (AGE_N, KM_N, CHK_N, TRIM_N)의 총 N+1 개의 데이터가 존재한다.(AGE_C 1 , KM_C 1 , CHK_C 1 , TRIM_C 1 ), (AGE_C 2 , KM_C 2 , CHK_C 2 , TRIM_C 2 ), and , There is a total of N + 1 pieces of data of (N AGE_C, KM_C N, N CHK_C, TRIM_C N) and, after conversion to the user of the input data coordinates (AGE_N, KM_N, CHK_N, TRIM_N).

이제 기존 판매 데이터로부터 변환된 각 좌표와 사용자 입력 데이터로부터 변환된 좌표 간의 기하학적 거리를 유사차량 검색 모듈(255)을 통해 구한다. i번째 판매 데이터와 사용자 입력 데이터의 거리 Di는 수학식 2와 같이 구할 수 있다.Now, the similar vehicle search module 255 obtains the geometric distance between each coordinate converted from the existing sales data and the coordinates converted from the user input data. the distance D i between the i-th sales data and the user input data can be obtained as shown in equation (2).

Figure pat00005
Figure pat00005

이 거리가 짧은 판매 데이터가, 사용자가 입력한 특정 차량과 가까이 있는 데이터라는 의미가 된다. 다시 말해, 사용자가 입력한 특정 차량과 유사한 차량이라는 의미이다. 이제 기존의 중고차량 판매 데이터베이스로부터, 사용자가 입력한 특정 차량과 가장 유사한 차량을 찾을 수 있게 되었다.This short sales data means data that is close to the specific vehicle entered by the user. In other words, it means a vehicle similar to the specific vehicle entered by the user. Now, from the existing used vehicle sales database, it is possible to find the vehicle most similar to the specific vehicle entered by the user.

사용자가 임의의 차량을 입력하면 시스템은 상기 "다차원 PLOT 과정" 절차를 거쳐 다차원 공간상에서의 가장 작은 D를 가진 데이터를 1순위부터 순서대로 디스플레이할 수 있다. 이를 통해 사용자는 자신이 입력한 차량과 가장 유사한 차량의 판매 이력, 즉 판매 가격을 확인하여 자신의 차량의 가격을 유추하는데 활용할 수 있다.When the user inputs an arbitrary vehicle, the system can display the data having the smallest D in the multidimensional space in order from the first order through the "multidimensional PLOT procedure" Through this, the user can check the sales history of the vehicle most similar to the vehicle he entered, that is, the selling price, and utilize it to deduce the price of his own vehicle.

상대가격 산출 모듈은(256) 가장 가까이 있는 데이터에 가장 큰 가중치를 주기 위해, 유사차량 검색 모듈(255)을 통해 구한 데이터 거리 D의 역수를 취할 수 있다. 역수는 1/D1, 1/D2, … 1/DN 과 같으며 이것을 각각 E1, E2, … , EN 이라고 하자. 이렇게 하면 가장 짧은 거리 D가 가장 큰 수치 E를 가지게 된다.The relative price calculation module may take the reciprocal of the data distance D obtained through the similar vehicle search module 255 to give the largest weight to the data closest to (256). The reciprocal is 1 / D 1 , 1 / D 2 , ... 1 / D N , which are denoted as E 1 , E 2 , ... , E N. In this way, the shortest distance D has the largest value E.

상대적 거리합 RSUM은 수학식 3에 의해 구할 수 있다.The relative distance sum RSUM can be obtained by Equation (3).

Figure pat00006
Figure pat00006

도출된 회귀식에 피예측 차량의 데이터를 대입하는 것으로 도출하는 가격을 여기서는 "절대(ABSOLUTE) 가격"이라 한다면, 이 절대 가격과 비교를 위한 "상대(RELATIVE) 가격"을 도출하는 방법이 다차원 공간상의 거리를 이용하는 방법이다. 상대 가격은 아래와 같은 방법에 따라 도출된다.If the price derived from substituting the data of the predicted vehicle into the derived regression equation is referred to as "ABSOLUTE price ", the method of deriving the" RELATIVE price " Is the method of using the distance on the plane. Relative prices are derived by the following method.

먼저, 차종별 회귀분석을 통해 1차적으로 각 차종별 "회귀 계수"를 산출하여 데이터베이스에 저장한다. 이때 회귀분석을 통해 저장되는 회귀계수는 사용자 질의가 있을 때마다 수행되는 것이 아니라 신규 차량 데이터 업로드와 함께 다중 회귀분석 모듈(253)에서 주기적으로 실시되어 저장되는 데이터이다. First, the "regression coefficient" for each vehicle type is firstly calculated by regression analysis by vehicle type and stored in the database. At this time, the regression coefficient stored through the regression analysis is not performed every time a user query is made but is data that is periodically executed and stored in the multiple regression analysis module 253 together with the upload of new vehicle data.

다음으로, 사용자가 원하는 차량에 대하여 변수들의 조건을 지정하여 검색을 질의할 때 시스템은 해당 데이터를 데이터 수치화 및 선형 정규화 모듈(252)을 통해 상기 "변수 수치화 과정"을 거쳐 임시 변수에 저장하며 상기 "다차원 PLOT 과정"과 동일한 과정을 거쳐 좌표로 변환한다.Next, when querying the search by specifying the condition of the variables for the vehicle desired by the user, the system stores the data in the temporary variable through the " variable valuation process "through the data quantification and linear normalization module 252, It is converted into coordinates through the same process as "multidimensional PLOT process ".

다음으로, 유사차량 검색 모듈을 통해(255) 기존 차량들의 판매 이력이 저장된 데이터베이스에서, 사용자가 입력한 차종과 일치하는 데이터들 중 최근 특정 기간 이내에 판매된 데이터들에 대하여 해당 각 판매 데이터들과 사용자 입력 데이터간 거리를 상기 "다차원 PLOT 과정"과 동일한 과정을 거쳐 데이터 거리 D와 D의 역수인 E까지 도출한다.Next, through the similar vehicle search module (255), in the database storing the sales history of the existing vehicles, data corresponding to the vehicle type inputted by the user, The distance between the input data is derived through the same process as the above-mentioned " multidimensional PLOT process " to the data distance D and the reciprocal number E of D.

다음으로, 사용자가 질의하여 임시 변수에 저장된 데이터와 실제 판매된 차량의 데이터인 "사용자가 입력한 차종과 일치하는 데이터들 중 최근 특정 기간 이내에 판매된 데이터"들과의 변수별 편차를 구한다. 예컨대, 사용자가 입력한 차량 데이터와 데이터 셋 상 특정 차량의 편차는 아래 표 4와 같이 도출된다,Next, the data of the data stored in the temporary variable and the data of the actually sold vehicle, which is inquired by the user, and the data "sold within the latest specific period of the data matching the vehicle type inputted by the user" are found. For example, the deviation between the vehicle data inputted by the user and the specific vehicle on the data set is derived as shown in Table 4 below,

Figure pat00007
Figure pat00007

표 4에서 "편차" 는 각 변수별 "데이터셋의 임의의 데이터 - 사용자 입력값"으로 도출되는 결과이다. 여기서 "가격" 변수를 제외한 나머지는 독립변수, "가격" 변수는 종속변수가 되며 독립변수만 편차를 구하면 된다. 이와 같은 방법으로 "사용자가 입력한 차종과 일치하는 데이터들 중 최근 특정 기간 이내에 판매된 데이터"에 해당하는 모든 차량에 대한 편차를 구한다.In Table 4, the "deviation" is the result of "any data in the dataset - user input value" for each variable. Here, the remainder excluding the "price" variable is the independent variable, the "price" variable is the dependent variable, and only the independent variable is calculated. In this way, the deviation for all the vehicles corresponding to the "data sold within the recent specific period of the data matching the vehicle type inputted by the user" is obtained.

다음으로, 사용자가 입력한 차종과 일치하는 데이터들 중 최근 특정 기간 이내에 판매된 데이터 의 각 차량 판매 데이터 N개의 실제 판매된 가격, 즉 종속변수값(상기 표의 최우측 변수) 을 BASE1, BASE2, … , BASEN 이라고 하고, 상기 [상대가격 도출 과정]의 첫번째 단계를 통해 기 도출되어 저장되있던 해당 차량의 "각 변수별 회귀계수"와, "사용자가 입력한 차종과 일치하는 데이터들 중 최근 특정 기간 이내에 판매된 데이터"들의 각 차량의 "편차" 와의 SUMPRODUCT 연산을 통해 도출된 값들을 ADJ1, ADJ2, … , ADJN 라고 하자. Next, the actually sold price of each vehicle sales data N, that is, the dependent variable value (the rightmost variable in the above table), of data sold within a recent specific period among the data matching the vehicle type inputted by the user is expressed as BASE 1 , BASE 2 , ... , BASE N , and the "regression coefficient for each variable " of the corresponding vehicle stored and stored through the first step of the " relative price derivation process" ADJ 1 , ADJ 2 , ..., < RTI ID = 0.0 > ... < / RTI & gt ; derived from the SUMPRODUCT operation with each vehicle ' , ADJ N.

여기서 SUMPRODUCT 연산은 (럭셔리 변수 회귀계수) * (럭셔리 변수 편차N) + (프라임 변수 회귀계수) * (프라임 변수 편차N) + … + (네비 변수 회귀계수) * (네비 변수 편차N) 와 같이 산출한다.Here, the SUMPRODUCT operation is the (luxury variable regression coefficient) * (the luxury variable deviation N ) + (the prime variable regression coefficient) * (the prime variable deviation N ) + ... + (Navigational regression coefficient) * (navigation variable deviation N ).

상기 도출된 결과들을 통해 수학식 4의 연산을 수행한다. And performs the operation of Equation (4) through the derived results.

Figure pat00008
Figure pat00008

수학식 4에서 ∑ 연산시에 각 (BASEn-ADJn)마다 En/RSUM을 곱해주는 이유는, 사용자가 가격을 알고자 질의한 차량과 기하학적으로 제일 가까이 있는 데이터에 제일 큰 가중치를 주어 연산을 하기 위해서이다. 만약 EN과 같이 역수를 취하지 않고 그대로 데이터 간 기하학적 거리인 DN을 사용한다면 가장 가까이 있는 차량에게 가장 적게 가중치를 주게 되고 가장 멀리 있는 차량에게 가장 큰 가중치를 주게 되어 정확한 결과를 도출할 수 없기 때문이다.The reason why En / RSUM is multiplied for each (BASEn-ADJn) in the calculation of Equation (4) is that when the user knows the price, the user carries the most weighted data with the geometric closest data to be. If we use D N , which is the geometric distance between data without taking a reciprocal number like E N , we give the least weight to the nearest vehicle and give the largest weight to the farthest vehicle, to be.

상대 가격은 최근 최근 특정 기간 이내에 판매된 차량의 가격을 통한 간접 가격 예측이라는 점에서 최근의 경향을 더 잘 반영할 수 있다는 강점을 가진다. 이때 신규차량 데이터의 추출 기간을 어떻게 지정하는지에 따라 최근 경향을 더 반영할 것인지, 덜 반영할 것인지도 조절할 수 있다. 예를 들어 최근 경향을 더 적극적으로 반영하고자 한다면 신규차량 데이터의 추출 기간을 짧게 하면 된다. 다만 데이터의 추출 기간이 짧아지면 추출되는 데이터의 양도 적어지므로 상대적으로 변동성이 커질 위험성이 있다.Relative pricing has the advantage of being able to better reflect recent trends in that it is an indirect pricing forecast through the price of vehicles sold within a specific period of time recently. At this time, depending on how the extraction period of the new vehicle data is designated, it is possible to adjust whether to reflect more recent trends or less. For example, if the current tendency is more positively reflected, the extraction period of new vehicle data can be shortened. However, if the extraction period of the data is short, the amount of data to be extracted is small, so that there is a risk that the variability becomes relatively large.

예측가 산출수단(240)은 분석결과 데이터를 이용하여 사용자가 요구하는 중고차량의 예측가를 산출하며, 사용자 데이터베이스(241) 및 연산로직(242)을 포함할 수 있다.The predictive value calculation means 240 may calculate the predicted value of the used vehicle requested by the user using the analysis result data, and may include a user database 241 and calculation logic 242. [

사용자가 스마트폰 등의 원격 UI 입력폼(210)을 통해 입력한 가치 평가가 요구되는 중고차량에 대한 정보는 사용자 데이터베이스(240)에 저장될 수 있다. 사용자는 중고차량에 대한 정보 외에 예측가 산출 결과를 수신할 수 있는 연락처 정보 등의 사용자 정보를 입력할 수 있으며, 이 정보도 사용자 데이터베이스(241)에 저장될 수 있다. Information on a used car that the user inputs through a remote UI input form 210 such as a smart phone is required to be stored in the user database 240. The user can input user information such as contact information that can receive the predicted value calculation result in addition to information on the used vehicle, and this information can also be stored in the user database 241. [

연산로직(242)은 추출된 상대 가격과 절대 가격을 모두 사용자에게 제공할 수 있다. 그러나, 추출된 상대 가격과 절대 가격 중 낮은 가격을 사용자에게 최종 가격으로 제시할 수도 있는데, 이는 시간이 흐를수록 전반적으로 감소 추세를 띄는 중고차 시세의 성향 자체로 인하여 보수적인 관점에서 가격을 제시하는 것이, 사용자에게 실제 거래 시점을 지연시킬 수 있는 여지를 줄 수 있기 때문이다.The arithmetic logic 242 can provide both the extracted relative price and the absolute price to the user. However, the lower price of the extracted relative price and the absolute price may be presented to the user as the final price because the tendency of the used car market to have a decreasing tendency as time goes by itself, , It can give the user a chance to delay the actual transaction timing.

스마트폰 등의 원격 UI 입력폼(210)은 사용자가 견적을 원하는 중고차량에 대한 정보를 입력하기 위한 인터페이스이다. 본 발명의 일 실시예에 따라 입력폼(210)을 통해 아래 표 6와 같은 예제 데이터를 입력하였을 때, 2426 만원의 결과값을 얻을 수 있었다.A remote UI input form 210 such as a smart phone is an interface for a user to input information on a used car desired to be quote. According to the embodiment of the present invention, when the example data shown in Table 6 below is inputted through the input form 210, the result value of 24.26 million won can be obtained.

Figure pat00009
Figure pat00009

최종 예측값은 실제 판매가격 2380만원 대비 1.9%의 오차를 가질 뿐이며 여기에 특정 마진율을 곱하여 예측가보다 실제 판매가가 낮을 수 있는 리스크를 회피할 수 있다.The final estimate only has an error of 1.9% compared to the actual sales price of 23.8 million won, which can be multiplied by a specific margin rate to avoid the risk that the actual selling price may be lower than the forecasted price.

도 8 내지 11은 본 발명의 일 실시예에 따른 사용자 인터페이스 화면을 예시한 것으로, 사용자가 스마트폰 등의 기기를 통해 접근하게 되는 입력폼의 예이다.8 to 11 illustrate user interface screens according to an embodiment of the present invention, and are examples of input forms that a user accesses through a device such as a smart phone.

도 8 내지 11에 도시된 바와 같이 사용자 인터페이스 화면은 4개의 페이지로 구성되어 있으며, 각 페이지를 통해 사용자로부터 정보를 입력받을 수 있다.As shown in FIGS. 8 to 11, the user interface screen is composed of four pages, and information can be received from the user through each page.

사용자가 입력한 데이터에 대응하는 중고차량의 가격 예측 결과는 상기 사용자 인터페이스 화면을 통해 제공되거나, SMS 등의 방법으로 원격 수신장치(220)에서 회신할 수 있다.The result of the estimation of the price of the used vehicle corresponding to the data input by the user may be provided through the user interface screen or may be returned from the remote receiving device 220 by means of SMS or the like.

도 8 내지 도 11에서 보여지는 차량 상태 문답은 차량의 상태점수만을 반영하고 사고점수를 반영하지 못하는 점 및 사용자의 주관에 의해 결과가 좌우될 수 있는 가능성을 배제하기 위해 해당 문답형 대신 도면을 통한 직접 입력 방법으로 대체될 수 있다.The vehicle status dialogue shown in FIGS. 8 to 11 reflects only the vehicle status score and does not reflect the accident score, and the possibility of the result being influenced by the subject of the user, Can be replaced by a direct input method.

도 12는 본 발명의 다른 실시예에 따른 중고차량 가치 평가 장치의 구성을 설명하기 위한 기능 블록도이다.12 is a functional block diagram for explaining a configuration of a used vehicle value evaluating apparatus according to another embodiment of the present invention.

도 12를 참조하면, 중고차량 평가 장치는 사용자 단말로부터 가치 평가의 대상이 되는 중고차량에 대한 정보를 수신하고 상기 중고차량의 예측가를 전송하기 위한 통신부(1310), 판매 가격과 상기 판매 가격에 대응하는 연속형 변수의 값을 포함하는 중고차량 판매 데이터를 저장하는 중고차량 판매 데이터베이스(1330), 중고차량 판매 데이터를 이용하여 사용자가 요구하는 중고차량의 예측가를 산출하는 제어부(1320)를 포함할 수 있다.Referring to FIG. 12, the used vehicle evaluation apparatus includes a communication unit 1310 for receiving information on a used vehicle that is a subject of valuation from a user terminal and transmitting a predicted value of the used vehicle, A used car sales database 1330 for storing used car sales data including the value of the continuous type variable to be used by the user, and a control unit 1320 for calculating the predicted value of the used car requested by the user using the used car sales data have.

제어부(1320)는 중고차량 판매 데이터베이스(1330)의 데이터를 이용하여 회귀분석을 수행하는 판매데이터 분석수단(1321)과 상기 회귀 분석의 결과와 상기 가치 평가의 대상이 되는 중고 차량에 대한 정보를 이용하여 사용자가 원하는 중고 차량의 예측가를 산출하는 예측가 산출수단(1322)으로 구성될 수 있다.The control unit 1320 includes a sales data analysis unit 1321 that performs regression analysis using data of the used vehicle sales database 1330 and a sales data analysis unit 1321 that uses the result of the regression analysis and the information about the used vehicle And a predictive value calculating means 1322 for calculating the predicted value of the used vehicle desired by the user.

도 13은 본 발명의 일 실시예에 따른 중고차량 가치 평가 방법을 설명하기 위한 순서도이다.13 is a flowchart illustrating a method for evaluating a used vehicle value according to an embodiment of the present invention.

도 13을 참조하면, 먼저 중고차량의 판매 가격과 상기 판매 가격에 대응하는 연속형 변수의 값을 포함하는 중고차량 판매 데이터를 입력 받는다(S1402). 중고차량 판매 데이터는 중고차량 판매 데이터베이스(1330)로부터 도출될 수 있다.Referring to FIG. 13, the used car sales data including the sales price of the used car and the value of the continuous variable corresponding to the selling price is inputted (S1402). The used-car sales data can be derived from the used-vehicle sales database 1330.

다음으로, 판매 데이터 분석수단(1321)은 회귀분석에 사용되는 연속형 변수를 선형화 변환하기 위해 5가지 방법 중 적어도 하나를 이용하며(S1404), 이들 방법에 대해서는 수학식 5~9를 참조하여 아래에서 상세히 설명하기로 한다.Next, the sales data analysis unit 1321 uses at least one of the five methods (S1404) to linearize and convert the continuous variables used in the regression analysis (S1404) Will be described in detail below.

중고차량의 판매 가격을 종속 변수 y로 하고 상기 연속형 변수를 독립 변수 x로 하여 중고차량 판매 데이터에 대한 회귀 분석을 수행하되, 연속형 변수의 선형화 변환의 결과를 적용한다(S1406).The sales price of the used car is set as the dependent variable y and the continuous variable is set as the independent variable x, and the result of the linearization of the continuous variable is applied (S1406).

사용자 단말을 통해 사용자가 입력한, 가치평가의 대상이 되는 중고차량에 대한 정보가 수신되면(S1408), 회귀분석의 결과와 가치평가의 대상이 되는 중고차량에 대한 정보를 이용하여 사용자가 견적 요청한 중고차량의 예측가를 산출한다(S1410).When the information about the used car which is inputted by the user through the user terminal is received (S1408), the user is requested to estimate the used car by using the result of the regression analysis and the information about the used car, The predicted value of the used vehicle is calculated (S1410).

본 발명에서 사용되는 수식 참고 기호는 다음과 같다.The formula reference symbols used in the present invention are as follows.

(Xi_hat, Yi_hat) : 산점도상 i번째 데이터의 예측 좌표(회귀직선상 값)(X i hat, Y i hat): Predicted coordinates (regression linear value) of i th data on scatter map

(Xi, Yi): 산점도상 i번째 데이터의 실제 좌표(실제 데이터)(X i , Y i ): Actual coordinates (actual data) of the ith data on the scattergram

A: 단순회귀직선의 기울기A: Slope of simple regression line

B: 단순회귀직선의 상수항B: constant linear of the simple regression line

ABS(): 절대값ABS (): Absolute value

x 값, 즉 연속형 변수의 변화에 따른 y 값인 판매가격의 관계를 산점도에 도시하면, 특정 x 값에 대한 실제 관측치 Y 와, 해당 산점도의 데이터를 통해 도출된 회귀직선상의 특정 x 값에 대응하는 예측치 Y_hat 에는 필연적으로 차이가 발생하게 된다. 따라서 특정 x 값에 대한 실제 관측치 y와 회귀직선상의 예측값 y의 "y축 기준 거리"의 합계가 최소가 되게 하는 거듭제곱수를 찾음으로써, 선형성을 극대화 할 수 있는 거듭제곱수를 찾을 수 있다. The relationship between the x value, that is, the sales price, which is the y value according to the change of the continuous variable, is shown in the scatter diagram. The actual observation value Y for the specific x value and the corresponding x value corresponding to the specific x value on the regression line A difference is inevitably generated in the predicted value Y_hat. Thus, by finding the power multiplication factor that minimizes the sum of the "y-axis-based distance" of the actual observation y and the predicted value y on the regression line for a particular x value, we can find the power multiplier that maximizes linearity.

상기와 같은 점에 착안하여 본 발명에서는 선형성을 최대화하는 거듭제곱수를 찾는 방법으로 아래와 같은 5가지 방법을 제안하고자 한다.Considering the above points, the present invention proposes the following five methods as a method of finding the power multiplication which maximizes the linearity.

첫번째 방법은, x축이 상기 연속형 변수에 0을 제외한 -2부터 2까지의 임의의 수를 거듭제곱한 값을 나타내고 y축이 상기 판매 가격을 나타내는 복수의 산점도 중에서, 산점도 상의 각 점과 회귀직선 상의 대응 좌표 간의 y축 기준 거리의 합계를 최소화하는 산점도에 적용된 거듭제곱수를 도출함으로써 상기 연속형 변수의 선형화 변환을 수행하는 것이다. 이 방법을 수학식으로 나타내면 수학식 5와 같다.The first method is a method in which the x-axis represents a value obtained by squaring an arbitrary number from -2 to 2 except for 0 in the continuous variable and a y-axis represents the selling price, The linear transformation of the continuous variable is performed by deriving the power multiplication applied to the scattergram which minimizes the sum of the y-axis reference distances between corresponding coordinates on the straight line. This method can be expressed by the following equation (5).

Figure pat00010
Figure pat00010

두번째 방법은, x축이 상기 연속형 변수에 0을 제외한 -2부터 2까지의 임의의 수를 거듭제곱한 값을 나타내고 y축이 상기 판매 가격을 나타내는 복수의 산점도 중에서, 산점도 상의 각 점과 회귀직선 상의 대응 좌표 간의 y축 기준 거리를 한 변의 길이로 하는 정사각형의 면적의 합계를 최소화하는 산점도에 적용된 거듭제곱수를 도출함으로써 상기 연속형 변수의 선형화 변환을 수행하는 것이다. 이 방법을 수학식으로 나타내면 수학식 6과 같다.The second method is a method in which among the plurality of scattergrams in which the x-axis represents the value obtained by squaring an arbitrary number from -2 to 2 except 0 in the continuous variable and the y-axis represents the selling price, The linear transformation of the continuous variable is performed by deriving the power multiplication applied to the scatter diagram which minimizes the sum of the areas of the squares having the length of one side of the y-axis reference distance between corresponding coordinates on the straight line. This method can be expressed by Equation (6).

Figure pat00011
Figure pat00011

세번째 방법은, x축이 상기 연속형 변수에 0을 제외한 -2부터 2까지의 임의의 수를 거듭제곱한 값을 나타내고 y축이 상기 판매 가격을 나타내는 복수의 산점도 중에서, 산점도 상의 각 점과 회귀직선 상의 대응 좌표 간의 y축 기준 거리를 한 변의 길이로 하는 정육면체의 부피의 합계를 최소화하는 산점도에 적용된 거듭제곱수를 도출함으로써 상기 연속형 변수의 선형화 변환을 수행하는 것이다. 이 방법을 수학식으로 나타내면 수학식 7과 같다.The third method is a method in which the x-axis represents a value obtained by squaring an arbitrary number from -2 to 2 except for 0 in the continuous variable and a y-axis represents the selling price, The linear transformation of the continuous variable is performed by deriving the power multiplication applied to the scatter diagram which minimizes the sum of the volumes of the cubes having the length of one side of the y-axis reference distance between corresponding coordinates on the straight line. This method can be expressed by Equation (7).

Figure pat00012
Figure pat00012

네번째 방법은, x축이 상기 연속형 변수에 0을 제외한 -2부터 2까지의 임의의 수를 거듭제곱한 값을 나타내고 y축이 상기 판매 가격을 나타내는 복수의 산점도 중에서, y축을 기준으로 회귀직선으로부터 가장 짧은 거리의 범위 내에 모든 점이 포함되는 산점도에 적용된 거듭제곱수를 도출함으로써 상기 연속형 변수의 선형화 변환을 수행하는 것이다. The fourth method is a method of calculating a sales price by multiplying an arbitrary number of powers of -2 to 2 except for 0 in the continuous variable by a power of a certain number, The linear transformation of the continuous variable is performed by deriving a power multiplication applied to the scattergram including all the points within the range of the shortest distance from the straight line.

즉, 각 산점도의 회귀직선에서부터 (y축 기준으로) 일정거리 떨어진 만큼의 임의의 범위 안에 모든 데이터가 포함되는 산점도의 집합에서부터 시작하여, 점차 범위를 좁혀나가 유일한 하나의 산점도가 도출될 때 해당 산점도에 적용된 거듭제곱지수를 통해 해당 변수의 선형화 변환을 적용하는 것이다. 이 방법을 수학식으로 나타내면 수학식 8과 같다.That is, starting from a set of scattergrams in which all the data are contained within an arbitrary range as far as a certain distance from the regression line of each scatter plot (on the y-axis basis), when the range is gradually narrowed and only one scatter plot is derived, To apply a linear transformation of the variable through a power exponent applied to the variable. This method can be expressed by Equation (8).

Figure pat00013
Figure pat00013

Figure pat00014
Figure pat00014

다섯번째 방법은, x축이 상기 연속형 변수에 0을 제외한 -2부터 2까지의 임의의 수를 거듭제곱한 값을 나타내고 y축이 상기 판매 가격을 나타내는 복수의 산점도 중에서, 각 산점도를 가장 잘 표현하는 지수함수 형태의 회귀곡선 상의 임의의 한 점을 기준으로 Y축 기준으로 위아래로 일정 거리 만큼 떨어진 지점의 각 접선의 기울기의 차이가 가장 작은 산점도에 적용된 거듭제곱수를 도출함으로써 상기 연속형 변수의 선형화 변환을 수행하는 것이다. 이 방법을 수학식으로 나타내면 수학식 9와 같다.In the fifth method, the x-axis represents a value obtained by multiplying an arbitrary number from -2 to 2 except for 0 in the continuous variable, and the y-axis represents the selling price. By taking a power point applied to the scatter diagram having the smallest difference in the slopes of the respective tangents at a certain distance apart at a certain distance up and down with respect to an arbitrary point on the regression curve of the exponential function form to be expressed, And performs a linear transformation. This method can be expressed by the following equation (9).

Figure pat00015
Figure pat00015

본 발명의 일 실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. The method according to an embodiment of the present invention can be implemented in the form of a program command which can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, and the like, alone or in combination. The program instructions recorded on the medium may be those specially designed and constructed for the present invention or may be available to those skilled in the art of computer software. Examples of computer-readable media include magnetic media such as hard disks, floppy disks and magnetic tape; optical media such as CD-ROMs and DVDs; magnetic media such as floppy disks; Magneto-optical media, and hardware devices specifically configured to store and execute program instructions such as ROM, RAM, flash memory, and the like. Examples of program instructions include machine language code such as those produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter or the like.

이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속한다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments, It belongs to the scope of right.

Claims (3)

중고차량의 판매 가격과 상기 판매 가격에 대응하는 연속형 변수의 값을 포함하는 중고차량 판매 데이터를 입력 받는 단계와;
가치 평가의 대상이 되는 중고차량에 대한 정보를 입력 받는 단계와;
상기 가치 평가의 대상이 되는 중고차량에 대한 정보를 이용하여 상기 중고차량의 예측가를 산출하는 단계와;
상기 중고차량 판매 데이터에 포함된 변수들 중 소정 수의 변수를 선택하고, 각 중고차량의 판매 정보를, 상기 선택된 각각의 변수를 각 축으로 하는 다차원 공간의 좌표로 변환하는 단계와;
상기 가치 평가의 대상이 되는 중고차량에 대한 정보를 상기 다차원 공간의 좌표로 변환하는 단계와;
상기 중고차량 판매 데이터로부터 변환된 좌표들 중 상기 가치 평가의 대상이 되는 중고차량의 좌표와 가까운 좌표에 대응하는 중고차량의 정보를 사용자에게 제공하는 단계;를 포함하는 것을 특징으로 하는 중고차량 가치 평가 방법.
Receiving the used vehicle sales data including the selling price of the used car and the value of the continuous variable corresponding to the selling price;
Inputting information on a used vehicle to be evaluated;
Calculating a predicted value of the used car by using information on the used car to be evaluated;
Selecting a predetermined number of variables included in the used-car sales data, and converting sales information of each used car into coordinates of a multi-dimensional space having each axis selected as each axis;
Converting information on the used vehicle that is the subject of the valuation to coordinates in the multidimensional space;
And providing the user with the information of the used car corresponding to the coordinates close to the coordinates of the used car that is the subject of the value evaluation among the coordinates converted from the used car sales data Way.
중고차량의 판매 가격과 상기 판매 가격에 대응하는 연속형 변수의 값을 포함하는 중고차량 판매 데이터를 입력 받는 단계와;
가치 평가의 대상이 되는 중고차량에 대한 정보를 입력 받는 단계와;
상기 가치 평가의 대상이 되는 중고차량에 대한 정보를 이용하여 상기 중고차량의 예측가를 산출하는 단계와;
상기 중고차량 판매 데이터에 포함된 변수들 중 소정 수의 변수를 선택하고, 각 중고차량의 판매 정보를, 상기 선택된 각각의 변수를 각 축으로 하는 다차원 공간의 좌표로 변환하는 단계와;
상기 가치 평가의 대상이 되는 중고차량에 대한 정보를 상기 다차원 공간의 좌표로 변환하는 단계와;
상기 변환된 다차원 공간 상 데이터 좌표들을 이용하여 상기 가치 평가의 대상이 되는 중고차량과, 변환된 중고차량 판매 데이터들과의 거리에 반비례하여 각각의 가중치를 구하는 단계와;
상기 가치 평가의 대상이 되는 중고차량과, 중고차량 판매 데이터들과의 편차를 구하는 단계와;
상기 각 중고차량 판매 데이터의 판매 금액과, 상기 편차와 해당 중고차량의 회귀계수와의 곱합(Sumproduct) 연산과의 차를 구하는 단계와;
상기 중고차량 판매 데이터들에 대한 각각의 가중치와 그에 대한 상기 차의 곱을 모두 더하여 상기 가치 평가의 대상이 되는 중고차량의 상대적 예측가를 산출하는 단계와;
상기 산출된 상대적 예측가인 상대가격과, 상기 가치 평가의 대상이 되는 중고차량에 대한 정보를 이용하여 산출된 예측가인 절대가격 중 소정의 기준을 만족하는 예측가를 사용자에게 제공하는 단계를 더 포함하는 것을 특징으로 하는 중고차량 가치 평가 방법.
Receiving the used vehicle sales data including the selling price of the used car and the value of the continuous variable corresponding to the selling price;
Inputting information on a used vehicle to be evaluated;
Calculating a predicted value of the used car by using information on the used car to be evaluated;
Selecting a predetermined number of variables included in the used-car sales data, and converting sales information of each used car into coordinates of a multi-dimensional space having each axis selected as each axis;
Converting information on the used vehicle that is the subject of the valuation to coordinates in the multidimensional space;
Obtaining respective weights in inverse proportion to the distance between the used vehicle that is the value evaluation target and the used used vehicle sales data using the transformed multi-dimensional spatial data coordinates;
Obtaining a deviation between the used vehicle and the used-for-sale data, which is the object of the valuation;
Obtaining a difference between a sale amount of each of the used-for-sale vehicle sales data and a sumproduct operation of the deviation and a regression coefficient of the corresponding used vehicle;
Calculating a relative predicted value of the used vehicle that is the subject of the value evaluation by adding both the weights of the used vehicle sales data and the product of the differences to the weight of the used vehicle sales data;
And providing the user with a predicted value that satisfies a predetermined criterion among the relative price calculated as the relative predicted value and the absolute value of the predictive value calculated using the information on the used vehicle that is the subject of the value evaluation Used vehicle valuation method characterized by.
제2항에 있어서,
상기 소정의 기준을 만족하는 예측가는, 상기 산출된 상대가격과, 상기 가치 평가의 대상이 되는 중고차량에 대한 정보를 이용하여 산출된 예측가인 절대가격 중 낮은 예측가인 것을 특징으로 하는 중고차량 가치 평가 방법.
3. The method of claim 2,
Wherein the predicted value satisfying the predetermined criterion is a lower predicted value among the calculated relative price and the absolute value of the predictive value calculated using the information on the used vehicle that is the subject of the value evaluation Way.
KR1020160028980A 2016-03-10 2016-03-10 Method for evaluating value of used car KR20160140353A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160028980A KR20160140353A (en) 2016-03-10 2016-03-10 Method for evaluating value of used car

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160028980A KR20160140353A (en) 2016-03-10 2016-03-10 Method for evaluating value of used car

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020150074838A Division KR101606322B1 (en) 2015-05-28 2015-05-28 Method and apparatus for evaluating value of used car

Publications (1)

Publication Number Publication Date
KR20160140353A true KR20160140353A (en) 2016-12-07

Family

ID=57572805

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160028980A KR20160140353A (en) 2016-03-10 2016-03-10 Method for evaluating value of used car

Country Status (1)

Country Link
KR (1) KR20160140353A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052633A (en) * 2021-03-26 2021-06-29 中国第一汽车股份有限公司 Vehicle residual value evaluation method, device, equipment and medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052633A (en) * 2021-03-26 2021-06-29 中国第一汽车股份有限公司 Vehicle residual value evaluation method, device, equipment and medium

Similar Documents

Publication Publication Date Title
US10733639B2 (en) System and method for analysis and presentation of used vehicle pricing data
Nahm et al. New rating methods to prioritize customer requirements in QFD with incomplete customer preferences
KR101606322B1 (en) Method and apparatus for evaluating value of used car
US10685363B2 (en) System, method and computer program for forecasting residual values of a durable good over time
US20120303536A1 (en) Property complexity scoring system, method, and computer program storage device
CN110910180B (en) Information pushing method and device, electronic equipment and storage medium
CN102004982A (en) Model optimization system using variable scoring
US20210158382A1 (en) System and method for dealer evaluation and dealer network optimization using spatial and geographic analysis in a network of distributed computer systems
US20220335359A1 (en) System and method for comparing enterprise performance using industry consumer data in a network of distributed computer systems
Shang et al. Intraday forecasts of a volatility index: Functional time series methods with dynamic updating
CN103714238A (en) System and method for rating computer model relative to empirical results for dynamic systems
KR102370650B1 (en) real estate investment curation system based on artificial neural network and method therefor
CN109615414A (en) House property predictor method, device and storage medium
US20220058673A1 (en) System and method for determination and use of spatial and geography based metrics in a network of distributed computer systems
JP6012860B2 (en) Work time estimation device
CN114493443A (en) Data processing method and device, electronic equipment and computer readable storage medium
KR20160140353A (en) Method for evaluating value of used car
US20190318371A1 (en) Computing systems and methods for improving content quality for internet webpages
KR101689499B1 (en) New thesis recommendation method and new thesis recommendation system for performing the method
US20230195969A1 (en) Method for automatic design concept definition and archetype selection for large sets of designs respecting multiple description spaces
CN103180850A (en) Calculator system and information presentation method using calculator system
US7552105B2 (en) Importance degree calculation program, importance degree calculation method, and importance degree calculation apparatus
CN116523539A (en) Option pricing method, system, equipment and storage medium based on neural network
Hu et al. Distributional utility preference robust optimization models in multi-attribute decision making
JP2024025056A (en) Information management system and information management method

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right