WO2023287073A1 - 매장 운영 예측 시스템 및 그 방법 - Google Patents

매장 운영 예측 시스템 및 그 방법 Download PDF

Info

Publication number
WO2023287073A1
WO2023287073A1 PCT/KR2022/009423 KR2022009423W WO2023287073A1 WO 2023287073 A1 WO2023287073 A1 WO 2023287073A1 KR 2022009423 W KR2022009423 W KR 2022009423W WO 2023287073 A1 WO2023287073 A1 WO 2023287073A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
sales
module
prediction
time
Prior art date
Application number
PCT/KR2022/009423
Other languages
English (en)
French (fr)
Inventor
강찬
이민우
서정환
정민재
이경준
Original Assignee
주식회사 식파마
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020210111273A external-priority patent/KR20230011193A/ko
Application filed by 주식회사 식파마 filed Critical 주식회사 식파마
Publication of WO2023287073A1 publication Critical patent/WO2023287073A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/30Payment architectures, schemes or protocols characterised by the use of specific devices or networks
    • G06Q20/34Payment architectures, schemes or protocols characterised by the use of specific devices or networks using cards, e.g. integrated circuit [IC] cards or magnetic cards
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Definitions

  • the present invention relates to a store operation prediction system and method. Specifically, the present invention relates to a system and method for predicting sales of an affiliated store using a time series analysis deep learning model.
  • Sales forecasting is one of the most important fields in many types of industries, such as the restaurant industry. Through sales forecasting, it is an important task and duty of the owner to identify the demand for materials and to confirm the size and timing of capital that can be invested in the future.
  • An object of the present invention is to provide a sales forecasting system using time series analysis that derives accurate results by precisely configuring input data through correlation analysis with various external factors.
  • Another object of the present invention is to provide a store operation prediction method that derives accurate results by precisely configuring input data through correlation analysis with various external factors.
  • the store operation prediction system for solving the above problems is a POS data processing module for receiving POS data composed of time series data from an affiliated store and extracting sales data, and receiving external data composed of time series data to An external data processing module that generates external data that is reconstructed and processed in the same time unit as the sales data, determines the correlation according to the time point of the sales data and the processed external data, and matches them to a time point having a high correlation,
  • a data adjustment module for generating adjustment data in the form of a two-dimensional table, an input data reconstruction module for generating input data by converting the adjustment data into a preset format, and a deep learning model, learning using the input data; Includes a time series forecasting module that derives sales forecasting data.
  • the POS data includes card payment details
  • the POS data processing module includes a revisit value calculation module that calculates a revisit value from the card payment details and a sales data calculation module that calculates the sales data can do.
  • the data adjustment module may include a data stabilization module generating stabilization data by displaying the sales data and the processed external data as an increase or decrease through a difference, and a vector auto regression (VAR) method for the stabilization data
  • VAR vector auto regression
  • an error rate determination module for calculating error rate information by comparing the sales prediction data and the sales data is further included, and the time series prediction module determines whether modeling of the deep learning model is performed according to the error rate information.
  • the external data may include at least one of public data, data provided by a private open API, and economic indicator data.
  • the sales prediction data may include predicted sales data for each menu, and may further include a food material recommendation order information module that analyzes food material demand according to the sales prediction data and generates food material recommendation order information.
  • the store operation prediction method for solving the other problems is to extract sales data by receiving POS data, receive external data, and process the external data reconstructed in the same time unit as the sales data. data is generated, the correlation between the sales data and the processed external data according to the time point is analyzed, and adjustment data matched with the time point of high correlation is generated, and the adjustment data is converted into a preset format to obtain input data.
  • the method may further include providing food material recommendation order information by estimating food material demand based on the sales prediction data.
  • the POS data includes card payment details, extracts revisit details from the card payment details, and further comprises generating revisit data by classifying the revisit details according to revisit intervals, Generating the data may include analyzing a correlation between the sales data, the processed external data, and the revisit data according to time points.
  • generating the adjustment data is to generate stabilization data by differentiating the sales data and the processed external data, check the data at a point in time with a high correlation using the stabilization data using a VAR method, and It may include generating the adjustment data by combining data of points in time with a high relationship.
  • the store operation prediction system and method of the present invention may predict sales according to various external factors by using various external data as learning data.
  • FIG. 1 is a conceptual diagram illustrating a store operation prediction system according to some embodiments of the present invention.
  • FIG. 2 is a block diagram illustrating the first sales prediction server of FIG. 1 in detail.
  • FIG. 3 is a conceptual diagram for explaining POS data and external data of FIG. 1 .
  • FIG. 4 is a block diagram for explaining the POS data processing module of FIG. 2 in detail.
  • FIG. 5 is a block diagram illustrating the data adjustment module of FIG. 2 in detail.
  • FIG. 6 and 7 are intermediate views for explaining that the data stabilization module of FIG. 5 stabilizes data.
  • FIG. 8 is an exemplary diagram for explaining that the VAR analysis module of FIG. 5 analyzes a correlation according to time points.
  • FIG. 9 is a block diagram for explaining the input data reconstruction module of FIG. 2 in detail.
  • FIG. 10 is an exemplary view of the adjustment data of FIG. 9 .
  • FIG. 11 is an exemplary view of the scaled data of FIG. 9 .
  • FIG. 12 is a block diagram for explaining the time series prediction module of FIG. 2 in detail.
  • FIG. 13 is a conceptual diagram illustrating a store operation prediction system according to some embodiments of the present invention.
  • FIG. 14 is a block diagram illustrating the second sales prediction server of FIG. 13 in detail.
  • 15 is a flowchart illustrating a store operation prediction method according to some embodiments of the present invention.
  • FIG. 16 is a flowchart for explaining in detail the revisit data generation step of FIG. 15 .
  • FIG. 17 is a flowchart for explaining in detail the adjustment data generation step of FIG. 15 .
  • FIG. 18 is a flowchart illustrating a store operation prediction method according to some embodiments of the present invention.
  • first, second, A, and B used in this specification and claims may be used to describe various components, but the components should not be limited by the terms. These terms are only used for the purpose of distinguishing one component from another. For example, a first element may be termed a second element, and similarly, a second element may be termed a first element, without departing from the scope of the present invention.
  • the term 'and/or' includes a combination of a plurality of related recited items or any one of a plurality of related recited items.
  • each configuration, process, process or method included in each embodiment of the present invention may be shared within a range that does not contradict each other technically.
  • FIGS. 1 to 10 a store operation prediction system according to some embodiments of the present invention will be described with reference to FIGS. 1 to 10 .
  • FIG. 1 is a conceptual diagram illustrating a store operation prediction system according to some embodiments of the present invention.
  • a store operation forecasting system includes a first sales prediction server 200, and the first sales prediction server 200 includes an affiliated store 100 and an external institution 300 ) and can exchange data.
  • the affiliated store 100 may be a company that requires sales prediction.
  • the affiliated store 100 may be, for example, a restaurant or restaurant operating a restaurant business, but the present embodiment is not limited thereto.
  • the affiliated store 100 has a POS (Point of Sale) terminal installed therein, through which POS data (DP) can be generated.
  • the POS data DP may include sales records recorded over time.
  • the sales details may include at least one of a sold menu, a sales amount, a sales time, and a payment method.
  • the POS data DP may include card details in the case of card payment. At this time, in order to protect personal information, the details of the card may be stored with some seats de-identified. However, this embodiment is not limited thereto.
  • the affiliate store 100 may transmit POS data DP to the first sales prediction server 200 .
  • the POS data DP may be time-series data, that is, data that is continuously generated temporally. Accordingly, the affiliated store 100 may continuously send the POS data DP to the first sales prediction server 200 instead of one-time. At this time, the affiliated store 100 may periodically send the POS data DP to the first sales prediction server 200 or continuously send the POS data DP to the first sales prediction server 200 in real time. . Of course, it may also be possible for the affiliated store 100 to send the POS data DP to the first sales prediction server 200 irregularly.
  • the external agency 300 may be an organization that generates data on various factors related to sales of the affiliated store 100 .
  • the external organ 300 is shown as a single organ in FIG. 1, the present embodiment is not limited thereto. That is, the external organ 300 may be one or two or more organs.
  • the external agency 300 may generate and transmit external data De to the first sales prediction server 200 .
  • the external data De may include various types of data according to the type of the external organization 300 .
  • the external data De may mean various data that may affect sales of the affiliated store 100 .
  • external data includes public data, data provided by a private open application programming interface (API), market interest rate data, KOSPI data, economic policy uncertainty data, consumer price index data, producer price index data, and consumer trend index data. , at least one of economic sentiment index data, lodging and restaurant production index data, and GDP data.
  • API application programming interface
  • the living population data may be time series data on the floating population according to a specific time in a specific location range.
  • the external organization 300 that provides living population data may be, for example, a telecommunications company operator or a public organization that provides data for big data utilization. However, this embodiment is not limited thereto.
  • Living population data may be aggregated for nearby locations of the affiliated store 100 .
  • the living population data may be time series data on the floating population within a range of 0 to 1 km from the affiliated store 100 . If the range is too wide, the sales of the affiliated store 100 may be less relevant, so the range may be appropriately set in advance.
  • the external data De may include public data.
  • Public data may include, for example, public holiday/season data, weather information data, local festival schedule data, and data on the number of confirmed diseases.
  • holiday data and seasonal data may be included.
  • the holiday data may be data indicating whether a corresponding time is a holiday or not in a binary format. That is, it may be data for determining whether it is a holiday by displaying 1 when it is a holiday and 0 when it is not.
  • Seasonal data may be data for determining 24 solar terms such as Ipchun, Ichuchu, and Winter Solstice. Seasonal data may simply be displayed as whether or not it corresponds to the 24 solar terms, or may include 24 pieces of data on whether or not each of the 24 solar terms corresponds to each of the 24 solar terms. Also, it may be generated only for some of the 24 solar terms. In this case, the season in which data is to be generated may be determined in advance by determining which season is highly related to sales.
  • holiday/seasonal data may include data on dates other than holidays and 24 solar terms.
  • Chobok, Jungbok, and Malbok are not 24 solar terms, but may be related to sales of menus such as Samgyetang. Accordingly, binary data for Chobok, Duongbok, and Malbok may be generated individually or together.
  • Weather information data may be collected using the Korea Meteorological Administration as an external agency 300 .
  • Weather information data may include various types of weather information.
  • the weather information data may include at least one of weather data, temperature data, humidity data, precipitation data, rainfall data, wind speed data, sunrise/sunset time data, and insolation data.
  • this embodiment is not limited thereto.
  • the weather information data may include weather change data created by processing the above basic data.
  • weather determination in various ways, such as data on whether it snowed and the temperature rose by 5° C. or higher, whether it rained in the morning and the day was clear before lunchtime, may be preset in a binary data format. This may be data on weather changes that have an empirical effect on sales for a specific menu.
  • Local festival schedule data may be data about schedules of local festivals held near the affiliated store 100 .
  • the external organization 300 may be a public organization or a private organization holding the festival.
  • this embodiment is not limited thereto. Local festival schedule data greatly affects the floating population, so it can naturally affect the sales of the affiliated store 100.
  • the external institution 300 may be a government public institution. Since disease information, such as the number of confirmed disease patients, can have a great impact on the floating population, it can naturally affect the sales of the affiliated store 100, which can be regarded as an external factor to be considered.
  • the external data De may include private open API provided data.
  • Data provided by a private open API may include, for example, keyword search frequencies of portal sites.
  • keyword search frequency is determined as the external data De.
  • the name of the affiliated store 100, the menu name of the affiliated store 100, and a superordinate concept of the menu name of the affiliated store 100 may be included in the keyword. That is, if the affiliated store 100 called 'rich gimbap' sells 'tuna gimbap', the keywords may include 'rich gimbap', 'tuna gimbap', and 'gimbap'.
  • the keyword search frequency data may be normalized and provided. That is, the keyword search frequency data may be collected as a number between 0 and 100 with a maximum value of 100 and a minimum value of 0 according to preset criteria.
  • this embodiment is not limited thereto.
  • the external data De may include economic indicator data. Economic indicator data may include daily data and monthly data. However, this embodiment is not limited thereto.
  • the daily unit data may include market interest rate data and stock price data.
  • Stock price data includes domestic KOSPI (KOrea Composite Stock Price Index) index data, KOSDAQ (Korea Securities Dealers Automated Quotation) index data, US NASDAQ (National Association of Securities Dealers Automated Quotation) index data, and Dow Jones index data. may include at least one of them.
  • this stock price data is provided as real-time data, since the change is too fast, it can be provided as daily data.
  • the index at the time the market closes can be defined as stock price data.
  • this embodiment is not limited thereto.
  • the economic index data may include data on the value of various virtual currencies and exchange rates.
  • Monthly data includes economic policy uncertainty (EPU) index data, consumer price index data, producer price index data, consumer trend index data, economic sentiment index data, lodging and restaurant production index data, and Gross domestic product (GDP) data. At least one of the data may be included.
  • EPU economic policy uncertainty
  • GDP Gross domestic product
  • the first sales prediction server 200 may receive POS data DP and external data De, and generate sales prediction data Des.
  • the first sales prediction server 200 may transmit sales prediction data Des to the affiliated store 100 .
  • the first sales prediction server 200 is a workstation, a data center, an internet data center (IDC), a direct attached storage (DAS) system, a storage area network (SAN) system, and a network attached NAS (network attached). storage) system and at least one of a redundant array of inexpensive disks (RAID) system and a redundant array of independent disks (RAID) system, but the present embodiment is not limited thereto.
  • IDC internet data center
  • DAS direct attached storage
  • SAN storage area network
  • NAS network attached
  • storage and at least one of a redundant array of inexpensive disks (RAID) system and a redundant array of independent disks (RAID) system, but the present embodiment is not limited thereto.
  • the first sales prediction server 200 may transmit data to the affiliated store 100 through a network.
  • the network may include a network based on wired Internet technology, wireless Internet technology, and short-range communication technology.
  • Wired Internet technology may include, for example, at least one of a local area network (LAN) and a wide area network (WAN).
  • Wireless Internet technologies include, for example, Wireless LAN (WLAN), Digital Living Network Alliance (DLNA), Wireless Broadband (Wibro), World Interoperability for Microwave Access (Wimax), and High Speed Downlink Packet (HSDPA). Access), High Speed Uplink Packet Access (HSUPA), IEEE 802.16, Long Term Evolution (LTE), Long Term Evolution-Advanced (LTE-A), Wireless Mobile Broadband Service (WMBS) And it may include at least one of 5G New Radio (NR) technology.
  • NR 5G New Radio
  • Short-range communication technologies include, for example, Bluetooth, Radio Frequency Identification (RFID), Infrared Data Association (IrDA), Ultra-Wideband (UWB), ZigBee, Near Field Communication: At least one of NFC), Ultra Sound Communication (USC), Visible Light Communication (VLC), Wi-Fi, Wi-Fi Direct, and 5G NR (New Radio) can include However, this embodiment is not limited thereto.
  • RFID Radio Frequency Identification
  • IrDA Infrared Data Association
  • UWB Ultra-Wideband
  • ZigBee ZigBee
  • Near Field Communication At least one of NFC
  • Ultra Sound Communication USC
  • VLC Visible Light Communication
  • Wi-Fi Wi-Fi Direct
  • 5G NR New Radio
  • the first revenue prediction server 200 communicating through the network may comply with technical standards and standard communication methods for mobile communication.
  • standard communication methods include GSM (Global System for Mobile communication), CDMA (Code Division Multi Access), CDMA2000 (Code Division Multi Access 2000), EV-DO (Enhanced Voice-Data Optimized or Enhanced Voice-Data Only)
  • WCDMA Wideband CDMA
  • HSDPA High Speed Downlink Packet Access
  • HSUPA High Speed Uplink Packet Access
  • LTE Long Term Evolution-Advanced
  • NR 5G New Radio
  • this embodiment is not limited thereto.
  • FIG. 2 is a block diagram illustrating the first sales prediction server of FIG. 1 in detail
  • FIG. 3 is a conceptual diagram illustrating POS data and external data of FIG. 1
  • 4 is a block diagram for explaining the POS data processing module of FIG. 2 in detail
  • FIG. 5 is a block diagram for explaining the data adjustment module of FIG. 2 in detail
  • 6 and 7 are intermediate diagrams for explaining that the data stabilization module of FIG. 5 stabilizes data
  • FIG. 8 is an exemplary diagram for explaining that the VAR analysis module of FIG. 5 analyzes correlation according to time points.
  • FIG. 9 is a block diagram for explaining the input data reconstruction module of FIG. 2 in detail
  • FIG. 10 is an exemplary view of the adjustment data of FIG. 9
  • FIG. 11 is an exemplary diagram of the scaled data of FIG. 9, and
  • FIG. 12 is a block diagram for explaining the time series prediction module of FIG. 2 in detail.
  • the first sales prediction server 200 includes a POS data processing module 210, an external data processing module 220, a data adjustment module 230, an input data reconstruction module 240, a time series prediction module ( 250) and an error rate determination module 260.
  • the POS data processing module 210 may receive POS data DP.
  • the POS data processing module 210 may generate revisit data Dr and sales data Ds from the POS data DP.
  • the external data processing module 220 may receive external data De and generate processed external data Dep.
  • POS data DP and external data De may be time series data. That is, it may be data made continuously in time.
  • the POS data DP may include first POS data Dp1 and second POS data Dp2.
  • the first POS data Dp1 may be POS data DP from the first time point t1 to the second time point t2.
  • the second POS data Dp2 may be POS data DP from the second time point t2 to the third time point t3.
  • the first time point t1 may be earlier than the second time point t2, and the third time point t3 may be earlier than the second time point t2.
  • the external data De may include first external data De1 and second external data De2.
  • the first external data De1 may be external data De from the first time point t1 to the second time point t2.
  • the second external data De2 may be external data De from the second time point t2 to the third time point t3.
  • the data received by the POS data processing module 210 and the external data processing module 220 may be first POS data Dp1 and first external data De1, respectively.
  • the first sales prediction server 200 first generates sales prediction data (Des) for the first POS data (Dp1) and the first external data (De1), and later generates the second sales prediction data (Des) up to the third point in time (t3).
  • Final sales forecasting data Des may be generated using the POS data DP and the external data De, in which the POS data Dp2 and the second external data De2 are updated. This will be explained in more detail later.
  • the POS data processing module 210 may include a revisit value calculation module 211 and a sales data calculation module 212 .
  • the revisit value calculation module 211 and the sales data calculation module 212 may commonly perform an outlier removal task.
  • the removal of outliers may be performed in the revisit value calculation module 211 and the sales data calculation module 212, respectively, or may be shared after being performed in one module.
  • the outlier removal operation may include an operation of searching for approval cases in which cancellation occurred among card payment details, identifying approval cases paired with cancellations, and removing all of them. That is, cancellation and approval can be deleted in a 1:1 correspondence.
  • the removal of the outlier may include determining that the card payment is an illegal discount loan and removing it when the card payment is made continuously and rapidly.
  • An illegal discount loan can refer to an illegal act of receiving cash after pretending to pay with a credit card.
  • the outlier elimination task may be set to perform a detailed review when the data calculated by the card payment details is too high or low compared to past data. For example, if a value distributed in the lower 25% or upper 25% interval based on IQR (InterQuartile Range) appears, a detailed review may be performed on this.
  • IQR InterQuartile Range
  • the revisit number calculation module 211 may receive the POS data DP and calculate revisit data Dr.
  • the revisit value calculation module 211 may use card payment details from which outliers in the POS data DP have been removed.
  • the revisit number calculation module 211 may identify the same user by using a non-identified number among card payment details.
  • the revisit value calculation module 211 may extract overlapping revisit details from card payment details.
  • the revisit numerical calculation module 211 may classify the revisit details according to revisit intervals. For example, the revisit value calculation module 211 classifies data with an interval of 30 days or less as revisit data within 1 month, classifies data with an interval of 31 days or more and 60 days or less as revisit data every 2 months, and This data of 61 days or more and 90 days or less can be classified as revisit data every 3 months. In addition, intervals of 91 days or more can be additionally classified as revisit data with intervals of 4 months or more. Each revisit data may include a numerical value corresponding thereto.
  • the above four classification schemes are merely examples, and the present embodiment is not limited thereto.
  • the revisit data Dr may be calculated as hourly data, or as daily and monthly data. That is, in the case of hourly data, revisit data within 1 month, revisit data every 2 months, revisit data every 3 months, and revisit data at an interval of 4 months or more may be respectively generated. In the same way, daily and monthly data can also be calculated.
  • the sales data calculation module 212 may calculate sales data Ds from the POS data DP.
  • the sales data Ds may be time-series data in which sales are recorded hourly.
  • the sales data Ds naturally includes data on total sales, but may also include data on sales by menu. That is, when the affiliate store 100 sells 'gukbap' as a menu, sales data for 'gukbap' may be included in the sales data Ds.
  • the external data processing module 220 may receive external data De and generate processed external data Dep.
  • the processed external data (Dep) may be reconstructed in the same time unit as the time unit of the sales data (Ds).
  • Ds the time unit of the sales data
  • the sales data Ds is a unit of time
  • external data De of daily and monthly units may be reconstructed in units of time.
  • the daily external data De may be maintained at the same value throughout the day, and the monthly external data De may be maintained at the same value throughout the month. If the sales data Ds is a daily unit, the processed external data Dep may also be reconstructed by a daily unit.
  • the data adjustment module 230 may include a data stabilization module 231 and a vector auto regression (VAR) analysis module 232 .
  • VAR vector auto regression
  • the data stabilization module 231 may receive revisit data Dr, sales data Ds, and processed external data Dep.
  • the data stabilization module 231 may re-edit the revisit data (Dr), the sales data (Ds), and the processed external data (Dep) into one table type data.
  • FIG. 6 illustratively shows a re-edited form of the sales data Ds and the processed external data Dep.
  • KOSPI index data and market interest rate data which are some of the processed external data (Dep), are displayed, but the present embodiment is not limited thereto.
  • the sales data Ds and the processed external data Dep constitute different columns, and one row may mean the same time period.
  • the data stabilization module 231 may perform data stabilization. That is, when the difference in absolute values of each column is large, as in the data of FIG. 6 , data stabilization may be performed to speed up the operation and reduce the amount of operation. Specifically, the data stabilization module 231 may take a natural logarithm of each data value and perform a difference. In this case, the difference is to fill in the value obtained by subtracting the value of the previous time zone from the value of a certain time zone, and the increase or decrease for the previous time zone may be displayed in each time zone. That is, data can be vectorized. The data stabilization module 231 may generate stabilization data Dst through data stabilization.
  • time series prediction model 252 learns later, it is possible to prevent weights from being biasedly updated for a particular variable. Through this, the performance of the time series prediction model 252 may be further improved.
  • FIG. 7 shows an example of stabilization data Dst that has undergone data stabilization. Referring to Figure 7, it can be seen that in the sales column of 2017-11-29, the value obtained by subtracting the value of 2017-11-29 from the value of 2017-11-29 after taking the natural logarithm of the original value is displayed.
  • the VAR analysis module 232 may receive stabilization data Dst.
  • the VAR analysis module 232 may analyze a correlation between the sales data Ds and other data. That is, the VAR analysis module 232 may analyze the correlation between the sales data Ds and revisit data Dr, and the sales data Ds and the processed external data Dep. At this time, not only the correlation between data of the same point in time is simply analyzed, but also the correlation between different points in time can be analyzed.
  • the “coefficient” part means the correlation coefficient. If this number is +, it can mean a positive correlation, and if it is -, it can mean a negative correlation.
  • the “prob” part is a p value, and when the reliability is set to 95%, it can be confirmed that the above “coefficient” is valid only when it is 0.05 or less.
  • “L1. The row in which “merchant” appears is a row showing the correlation between the current sales data (Ds) and the sales data (Ds) of the day before.
  • “L2. Merchant” is the correlation between current and two days ago sales data (Ds).
  • KOSPI may indicate a correlation between KOSPI index data from 4 days ago and sales data (Ds).
  • Ds sales data
  • Adjustment data Da may be data composed of current sales data Ds and market interest rate data of 8 days ago in a tabular form.
  • other processed external data (Dep) and revisit data (Dr) can also be combined into adjusted data (Da) by finding a time point having the highest correlation with current sales data (Ds).
  • the adjustment data Da may be in a state in which the stabilization work has not been performed. That is, the stabilization task is a task for VAR analysis, and the later adjustment data Da may undergo a scaling step by the scaling module 241 .
  • the present embodiment finds the most influential time point among the time points of time series data of various factors and uses it for analysis, so that very precise and accurate prediction can be made.
  • the input data reconstruction module 240 may include a scaling module 241 , a data separation module 242 and a 3D data reconstruction module 243 .
  • the scaling module 241 may perform a scaling operation by receiving the adjustment data Da.
  • the scaling module 241 may mean an operation of normalizing the adjustment data Da. That is, since each data has a range of values, the speed may be slowed down and the amount of calculation may be increased during subsequent calculations. 10 is an exemplary view of the adjustment data Da, and it can be seen that the range of values of each column is very diverse.
  • the scaling module 241 may normalize all data values to values between 0 and 1 through a min-max scaling technique. Through this, the size of data can be reduced and the processing speed can be dramatically increased. Furthermore, it is possible to prevent in advance various problems that may occur due to the large size of the numerical value. That is, the scaling module 241 may generate scaled data Das through scaling. 11 is an example of the scaled data Das, and it can be seen that the values of all columns are scaled between 0 and 1.
  • normalization of data also reduces the deviation between data variables, so that when the time series prediction model 252 learns later, it is possible to prevent weights from being biasedly updated for a specific variable. Through this, the performance of the time series prediction model 252 may be further improved.
  • the scaling module 241 may perform scaling by employing any one of a standard scaling technique, a max abs scaling technique, and a robust scaling technique in addition to the min-max scaling technique.
  • this embodiment is not limited thereto.
  • the data separation module 242 may receive the scaled data Das and separate it into training data, validation data, and test data.
  • the separated data may be included in the separated data Das_sep.
  • the training data may be used to tune the weight or bias, that is, parameters of the deep learning module. That is, it can be used for learning the deep learning module.
  • Validation data may mean a data set necessary to adjust hyperparameters.
  • the hyperparameters may refer to parameters to be adjusted based on human experience and intuition, such as a learning rate, a weight decay, a cost function, and the number of convolution filters. That is, the hyperparameters can be adjusted while evaluating the loss and accuracy of the model using the validation data.
  • the test data may be a data set for testing without affecting the learning of the deep learning module.
  • the separated data Das_sep includes these three types of data and can be used for learning the time series prediction model 252 in the future.
  • the 3D data reconstruction module 243 may receive the separated data Das_sep and reconstruct it into input data Di.
  • the 3D data reconstruction module 243 may reconstruct 2D separated data Das_sep into 3D input data Di.
  • the input data (Di) may also be separated into training data, validation data, and test data.
  • the input data (Di) is data obtained by stacking two-dimensional data of a row representing time and each feature, that is, a column according to the type of data, in a three-dimensional form according to the batch size.
  • the batch size may be determined according to the amount of data to be trained at one time.
  • a time series prediction module 250 may include a modeling module 251 and a time series prediction model 252 .
  • the modeling module 251 may receive the error rate information Re, reset the hyperparameter HP of the time series prediction model 252, and perform modeling of the time series prediction model 252.
  • the parameters of the current time series prediction model 252 may be stored as they are. That is, modeling of the hyperparameter HP and the time series prediction model 252 may be reset only when the error rate information Re is higher than the reference error rate preset in the modeling module 251 .
  • the time series prediction model 252 may receive input data Di as a deep learning model. Parameters of the time series prediction model 252 may be adjusted and evaluated through training data, validation data, and test data included in the input data Di. The time series prediction model 252 may derive sales prediction data Des according to the input data Di.
  • the time series prediction model 252 may use, for example, a Long Short Term Memory (LSTM) layer as an input layer and a dense layer as an output layer. However, this embodiment is not limited thereto.
  • the time series prediction model 252 may employ a Convolution Neural Network (CNN)-LSTM layer using a convolution layer or a Bi LSTM (Bi-LSTM) layer.
  • CNN Convolution Neural Network
  • Bi-LSTM Bi LSTM
  • An activation function of the dense layer may include one of Rectified Linear Unit (ReLU) and LeakyReLU.
  • ReLU Rectified Linear Unit
  • LeakyReLU LeakyReLU
  • the modeling module 251 may check a loss metric using validation data and search for an optimal hyperparameter (HP). At this time, the modeling module 251 may search for an optimal hyperparameter (HP) using an automated tool on software.
  • the optimal hyperparameter (HP) may be a value that minimizes the loss measure.
  • the error rate determination module 260 may receive sales prediction data Des from the time series prediction module 250 .
  • the error rate determination module 260 may generate error rate information Re by comparing the sales prediction data Des and the sales data Ds.
  • sales prediction data Des generated by the time series prediction module 250 may be sales prediction data Des between a second time point t2 and a third time point t3 . That is, the time series prediction module 250 is based on the first POS data Dp1 and the first external data De1, the POS data processing module 210, the external data processing module 220, the data adjustment module 230 , Sales prediction data Des may be generated using the input data Di prepared through the input data reconstruction module 240 .
  • the error rate determination module 260 may receive the second POS data Dp2, compare it with the sales prediction data Des, and determine an error rate. Accordingly, the error rate determination module 260 may generate error rate information Re. Generation of the error rate information Re by the error rate determination module 260 may be a separate step from error rate determination based on the test data.
  • the modeling module 251 may re-model the time series prediction model 252 if the error rate included in the error rate information Re is higher than the preset reference error rate. If the error rate included in the error rate information (Re) is lower than the preset reference error rate, since the time series prediction model 252 is sufficiently reliable, the modeling module 251 may store and determine the parameters of the time series prediction model 252. can In this case, the standard error rate may be 7%, but the present embodiment is not limited thereto.
  • a more precise and accurate predictive model can be generated by determining the error again by the error rate determination module 260 separately from the error rate determination based on the test data.
  • the time series prediction module 250 updates the POS data DP and external data to the latest information. Sales prediction data Des may be regenerated using (De), and such sales prediction data Des may be provided to the affiliated store 100 .
  • the POS data DP used in this case may be the latest data among data including both the first POS data Dp1 and the second POS data Dp2.
  • the external data De used in this case may be the latest data among data including both the first external data De1 and the second external data De2.
  • the sales forecast data Des is time-series data and may include a forecast of sales over time.
  • the sales prediction data Des may also include a predicted value of sales according to menus when the affiliated store 100 is a restaurant business.
  • the store operation prediction system performs precise sales forecasting by predicting sales through various external factors, analyzes the correlation between each external factor and sales at each point in time, builds input data for the highest correlation, It is provided to the time series prediction model 252 to calculate sales prediction data Des having high accuracy.
  • Des more accurate and reliable sales prediction data
  • FIG. 13 is a conceptual diagram illustrating a store operation prediction system according to some embodiments of the present invention
  • FIG. 14 is a block diagram illustrating a second sales prediction server of FIG. 13 in detail.
  • the store operation prediction system may include a second sales prediction server 201 .
  • the second sales prediction server 201 receives POS data (DP) from the affiliated store 100, receives external data (De) from the external institution 300, and then places an order for recommending food materials together with the sales prediction data (Des)
  • the information Df may be provided to the affiliated store 100 .
  • the second sales prediction server 201 may further include a food material recommendation order information module 270 .
  • the food material recommendation order information module 270 may receive sales prediction data Des and generate food material recommendation order information Df. Specifically, the food material recommendation ordering information module 270 may store information on the quantity of food materials included in each menu and detailed food material information such as delivery period and expiration date when ordering food materials.
  • the food material recommendation order information module 270 may identify a sales forecast for each menu according to the sales prediction data Des, and calculate demand for food materials accordingly.
  • food material recommendation order information Df may be provided to the affiliated store 100 at an appropriate time according to food material ordering scheduling according to the food material demand.
  • the affiliated store 100 can order the necessary amount of food materials at an appropriate time. Accordingly, it is possible to reduce wasted food materials and to reduce a situation in which food materials are urgently purchased at high prices due to lack of food materials, thereby increasing safety of store operation and minimizing costs.
  • FIGS. 1 to 12 and 15 to 17 Parts overlapping with the above-described embodiment are simplified or omitted.
  • FIG. 15 is a flowchart for explaining a method for predicting store operation according to some embodiments of the present invention
  • FIG. 16 is a flowchart for explaining in detail the step of generating revisit data of FIG. 15
  • FIG. 17 is a flowchart for explaining in detail the adjustment data generation step of FIG. 15 .
  • the store operation prediction method receives POS data and external data and generates sales data, revisit data, and processed external data (S100).
  • the sales data calculation module 212 may calculate sales data Ds from POS data DP.
  • the sales data Ds may be time-series data in which sales are recorded hourly.
  • the sales data Ds naturally includes data on total sales, but may also include data on sales by menu. That is, when the affiliate store 100 sells 'gukbap' as a menu, sales data for 'gukbap' may be included in the sales data Ds.
  • the external data processing module 220 may receive external data De and generate processed external data Dep. At this time, the processed external data (Dep) may be reconstructed in the same time unit as the time unit of the sales data (Ds).
  • the revisit details are extracted from the card payment details (S110). Subsequently, a numerical value according to the revisit interval is calculated (S120).
  • the revisit value calculation module 211 may receive POS data DP and calculate revisit data Dr.
  • the revisit value calculation module 211 may use card payment details from which outliers in the POS data DP have been removed.
  • the revisit number calculation module 211 may identify the same user by using a non-identified number among card payment details.
  • the revisit value calculation module 211 may extract overlapping revisit details from card payment details.
  • the revisit numerical calculation module 211 may classify the revisit details according to revisit intervals.
  • the correlation according to the viewpoint of data is analyzed to generate the adjustment data according to the viewpoint (S200).
  • the data stabilization module 231 may receive revisit data Dr, sales data Ds, and processed external data Dep.
  • the data stabilization module 231 may re-edit the revisit data (Dr), the sales data (Ds), and the processed external data (Dep) into one table type data.
  • FIG. 6 illustratively shows a re-edited form of the sales data Ds and the processed external data Dep.
  • the data stabilization module 231 may perform data stabilization.
  • the data stabilization module 231 may take a natural logarithm of each data value and perform a difference. In this case, the difference is to fill in the value obtained by subtracting the value of the previous time zone from the value of a certain time zone, and the increase or decrease for the previous time zone may be displayed in each time zone. That is, data can be vectorized.
  • the data stabilization module 231 may generate stabilization data Dst through data stabilization. 7 shows an example of stabilization data Dst that has undergone data stabilization.
  • the VAR analysis module 232 may receive stabilization data Dst.
  • the VAR analysis module 232 may analyze a correlation between the sales data Ds and other data. That is, the VAR analysis module 232 may analyze the correlation between the sales data Ds and revisit data Dr, and the sales data Ds and the processed external data Dep. At this time, not only the correlation between data of the same point in time is simply analyzed, but also the correlation between different points in time can be analyzed. 8 shows exemplary results of correlation analysis.
  • the VAR analysis module 232 may generate the adjustment data Da by finding a time point having the highest correlation and reliability.
  • Adjustment data Da may be data composed of current sales data Ds and market interest rate data of 8 days ago in a tabular form.
  • other processed external data (Dep) and revisit data (Dr) can also be combined into adjusted data (Da) by finding a time point having the highest correlation with current sales data (Ds).
  • the adjustment data is reconstructed into input data (S300).
  • the scaling module 241 may perform a scaling operation by receiving the adjustment data Da.
  • the scaling module 241 may generate scaled data Das through scaling.
  • 11 is an example of the scaled data Das, and it can be seen that the values of all columns are scaled between 0 and 1.
  • the data separation module 242 may receive the scaled data Das and separate it into training data, validation data, and test data.
  • the separated data may be included in the separated data Das_sep.
  • the 3D data reconstruction module 243 may receive the separated data Das_sep and reconstruct it into input data Di.
  • the 3D data reconstruction module 243 may reconstruct 2D separated data Das_sep into 3D input data Di.
  • time series prediction modeling is performed in parallel with steps S100 to S300 (S400).
  • the time series prediction model 252 may use, for example, an LSTM layer as an input layer and a dense layer as an output layer.
  • the activation function of the dense layer may include LeakyReLU.
  • the modeling module 251 may search for and set an optimal hyperparameter (HP).
  • a time series prediction model is learned (S500).
  • the time series prediction model 252 may receive input data Di as a deep learning model. Parameters of the time series prediction model 252 may be adjusted and evaluated through training data, validation data, and test data included in the input data Di. The time series prediction model 252 may derive sales prediction data Des according to the input data Di.
  • the error rate determination module 260 may receive sales prediction data Des from the time series prediction module 250 .
  • the error rate determination module 260 may generate error rate information Re by comparing the sales prediction data Des and the sales data Ds.
  • the error rate determination module 260 may receive the second POS data Dp2, compare it with the sales prediction data Des, and determine an error rate. Accordingly, the error rate determination module 260 may generate error rate information Re.
  • the modeling module 251 may re-model the time series prediction model 252 if the error rate included in the error rate information Re is higher than the preset reference error rate. That is, it may return to step S400 of FIG. 15 again.
  • the time series prediction model 252 is sufficiently reliable.
  • time series prediction is performed by storing the time series prediction model (S700).
  • the time series prediction module 250 may regenerate sales forecast data (Des) using the POS data (DP) and external data (De) updated to the latest information, and such sales
  • the prediction data Des may be provided to the affiliate store 100 .
  • steps S100 to S700 may be the same as those of FIG. 15 .
  • the store operation prediction method according to some embodiments of the present invention predicts food material demand and provides food material recommendation order information (S800).
  • the food material recommendation order information module 270 may receive sales prediction data Des and generate food material recommendation order information Df. Specifically, the food material recommendation ordering information module 270 may store information on the quantity of food materials included in each menu and detailed food material information such as delivery period and expiration date when ordering food materials.
  • the food material recommendation order information module 270 may identify a sales forecast for each menu according to the sales prediction data Des, and calculate demand for food materials accordingly.
  • food material recommendation order information Df may be provided to the affiliated store 100 at an appropriate time according to food material ordering scheduling according to the food material demand.

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Physics (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Educational Administration (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 매장 운영 예측 시스템 및 그 방법을 개시한다. 상기 매장 운영 예측 시스템은, 가맹점으로부터 시계열 데이터로 구성된 POS 데이터를 수신하여 매출 데이터를 추출하는 POS 데이터 처리 모듈, 시계열 데이터로 구성된 외부 데이터를 수신하여 상기 매출 데이터와 동일한 시간 단위로 재구성하여 처리된 외부 데이터를 생성하는 외부 데이터 처리 모듈, 상기 매출 데이터 및 상기 처리된 외부 데이터의 시점에 따른 상관관계를 판단하여 높은 상관관계를 가지는 시점으로 매칭시키고, 2차원 테이블 형식의 조정 데이터를 생성하는 데이터 조정 모듈, 상기 조정 데이터를 미리 설정된 형식으로 변환하여 입력 데이터를 생성하는 입력 데이터 재구성 모듈 및 딥러닝 모델을 포함하고, 상기 입력 데이터를 이용하여 학습하고, 매출 예측 데이터를 도출하는 시계열 예측 모듈을 포함한다.

Description

매장 운영 예측 시스템 및 그 방법
본 발명은 매장 운영 예측 시스템 및 그 방법에 관한 것이다. 구체적으로, 본 발명은 시계열 분석 딥러닝 모델을 이용하여 가맹점의 매출을 예측하는 시스템 및 방법에 대한 발명이다.
외식업 등 여러 종류의 업종에서는 매출 예측이 매우 중요한 분야 중의 하나이다. 매출 예측을 통해서, 자재의 수요를 파악하고, 앞으로 투자할 수 있는 자본의 규모 및 투자 시기 등을 확인하는 것이 해당 업주의 중요한 과제이자 의무이다.
하지만, 현재의 매출 예측은 정밀하지 않고, 단순히 감이나 경험에 의존하고 있다. 특히, 매출과 관련된 요인은 단순히 업체의 위치, 제공 메뉴 등 내부 요인에 국한되는 것이 아니라 날씨나 경제 상황 등 수많은 외부 요인이 존재할 수 있다.
따라서, 이러한 내부 요인과 외부 요인을 모두 고려하여 매출을 정확히 예측하는 것은 불가능에 가깝고, 특히 어떠한 요인이 매출에 영향을 미치기까지 걸리는 시기가 다양할 수 있기에 그러한 효과를 모두 고려하는 것도 쉽지 않다.
따라서, 이러한 다양한 요인과 효과가 적용되는 시기까지 모두 고려하여 정확한 매출을 예측하는 기술에 대한 논의가 더 필요한 시점이다.
본 발명의 과제는, 다양한 외부 요인과의 상관관계 분석을 통해서 정밀하게 입력 데이터를 구성하여 정확한 결과를 도출하는 시계열 분석을 이용한 매출 예측 시스템을 제공하는 것이다.
또한, 본 발명의 다른 과제는, 다양한 외부 요인과의 상관관계 분석을 통해서 정밀하게 입력 데이터를 구성하여 정확한 결과를 도출하는 매장 운영 예측 방법을 제공하는 것이다.
본 발명의 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있고, 본 발명의 실시예에 의해 보다 분명하게 이해될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.
상기 과제를 해결하기 위한 본 발명의 몇몇 실시예에 따른 매장 운영 예측 시스템은, 가맹점으로부터 시계열 데이터로 구성된 POS 데이터를 수신하여 매출 데이터를 추출하는 POS 데이터 처리 모듈, 시계열 데이터로 구성된 외부 데이터를 수신하여 상기 매출 데이터와 동일한 시간 단위로 재구성하여 처리된 외부 데이터를 생성하는 외부 데이터 처리 모듈, 상기 매출 데이터 및 상기 처리된 외부 데이터의 시점에 따른 상관관계를 판단하여 높은 상관관계를 가지는 시점으로 매칭시키고, 2차원 테이블 형식의 조정 데이터를 생성하는 데이터 조정 모듈, 상기 조정 데이터를 미리 설정된 형식으로 변환하여 입력 데이터를 생성하는 입력 데이터 재구성 모듈 및 딥러닝 모델을 포함하고, 상기 입력 데이터를 이용하여 학습하고, 매출 예측 데이터를 도출하는 시계열 예측 모듈을 포함한다.
또한, 상기 POS 데이터는 카드 결제 내역을 포함하고, 상기 POS 데이터 처리 모듈은, 상기 카드 결제 내역에서 재방문 수치를 산출하는 재방문 수치 산출 모듈과, 상기 매출 데이터를 산출하는 매출 데이터 산출 모듈을 포함할 수 있다.
또한, 상기 데이터 조정 모듈은, 상기 매출 데이터 및 상기 처리된 외부 데이터를 차분을 통한 증감량으로 표시하여 안정화 데이터를 생성하는 데이터 안정화 모듈과, 상기 안정화 데이터를 VAR(Vector Auto Regression) 방식을 이용하여 상기 매출 데이터와 상기 외부 데이터의 최적의 시점을 판단하고, 그에 따라 상기 조정 데이터를 생성하는 VAR 분석 모듈을 포함할 수 있다.
또한, 상기 매출 예측 데이터와 상기 매출 데이터를 비교하여 오차율 정보를 산출하는 오차율 판단 모듈을 더 포함하고, 상기 시계열 예측 모듈은 상기 오차율 정보에 따라 상기 딥러닝 모델의 모델링의 수행여부를 판단할 수 있다.
또한, 상기 외부 데이터는 공공 데이터, 민간 공개 API 제공 데이터 및 경제 지표 데이터 중 적어도 하나를 포함할 수 있다.
또한, 상기 매출 예측 데이터는 메뉴별 예측 매출 데이터를 포함하고, 상기 매출 예측 데이터에 따라 식자재 수요를 분석하고, 식자재 추천 발주 정보를 생성하는 식자재 추천 발주 정보 모듈을 더 포함할 수 있다.
상기 다른 과제를 해결하기 위한 본 발명의 몇몇 실시예에 따른 매장 운영 예측 방법은, POS 데이터를 수신하여 매출 데이터를 추출하고, 외부 데이터를 수신하여 상기 매출 데이터와 동일한 시간 단위로 재구성된 처리된 외부 데이터를 생성하고, 상기 매출 데이터와 상기 처리된 외부 데이터의 시점에 따른 상관관계를 분석하여 높은 상관관계의 시점으로 매칭된 조정 데이터를 생성하고, 상기 조정 데이터를 미리 설정된 형식으로 변환하여 입력 데이터를 생성하고, 상기 입력 데이터를 이용하여 딥러닝 모델을 포함하는 시계열 예측 모델을 학습시키고, 상기 시계열 예측 모델을 통해서 매출 예측 데이터를 도출하고, 상기 매출 예측 데이터의 오차율이 기준 오차율 이하인지를 판단하고, 만일 상기 오차율이 상기 기준 오차율 이하인 경우 그대로 매출 예측 데이터를 생성하고, 만일 상기 오차율이 상기 기준 오차율 초과인 경우 상기 시계열 예측 모델의 모델링을 다시 수행하는 것을 포함한다.
또한, 상기 매출 예측 데이터에 의해서 식자재 수요를 예측하여, 식자재 추천 발주 정보를 제공하는 것을 더 포함할 수 있다.
또한, 상기 POS 데이터는 카드 결제 내역을 포함하고, 상기 카드 결제 내역에서 재방문 내역을 추출하고, 상기 재방문 내역을 재방문 간격에 따라 분류하여 재방문 데이터를 생성하는 것을 더 포함하고, 상기 조정 데이터를 생성하는 것은, 상기 매출 데이터와, 상기 처리된 외부 데이터 및 상기 재방문 데이터의 시점에 따른 상관관계를 분석하는 것을 포함할 수 있다.
또한, 상기 조정 데이터를 생성하는 것은, 상기 매출 데이터 및 상기 처리된 외부 데이터를 차분하여 안정화 데이터를 생성하고, 상기 안정화 데이터를 VAR 방식을 이용하여 상관관계가 높은 시점의 데이터를 확인하고, 상기 상관관계가 높은 시점의 데이터를 결합하여 상기 조정 데이터를 생성하는 것을 포함할 수 있다.
본 발명의 매장 운영 예측 시스템 및 그 방법은, 다양한 외부 데이터를 학습 데이터로 사용하여 다양한 외부 요인에 따른 매출을 예측할 수 있다.
또한, 외부 요인과 매출의 상관관계를 통해서 외부 요인이 매출에 영향을 주는 가장 적절한 시간을 확인하여 더욱 정밀하고 적절한 예측을 도출할 수 있다.
나아가,
상술한 내용과 더불어 본 발명의 구체적인 효과는 이하 발명을 실시하기 위한 구체적인 사항을 설명하면서 함께 기술한다.
도 1은 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 시스템을 설명하기위한 개념도이다.
도 2는 도 1의 제1 매출 예측 서버를 세부적으로 설명하기 위한 블록도이다.
도 3은 도 1의 POS 데이터 및 외부 데이터를 설명하기 위한 개념도이다.
도 4는 도 2의 POS 데이터 처리 모듈을 세부적으로 설명하기 위한 블록도이다.
도 5는 도 2의 데이터 조정 모듈을 세부적으로 설명하기 위한 블록도이다.
도 6 및 도 7은 도 5의 데이터 안정화 모듈이 데이터를 안정화하는 것을 설명하기 위한 중간 도면들이다.
도 8은 도 5의 VAR 분석 모듈이 시점에 따른 상관관계를 분석하는 것을 설명하기 위한 예시도이다.
도 9는 도 2의 입력 데이터 재구성 모듈을 세부적으로 설명하기 위한 블록도이다.
도 10은 도 9의 조정 데이터의 예시도이다.
도 11은 도 9의 스케일링된 데이터의 예시도이다.
도 12는 도 2의 시계열 예측 모듈을 세부적으로 설명하기 위한 블록도이다.
도 13은 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 시스템을 설명하기위한 개념도이다.
도 14는 도 13의 제2 매출 예측 서버를 세부적으로 설명하기 위한 블록도이다.
도 15는 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 방법을 설명하기위한 순서도이다.
도 16은 도 15의 재방문 데이터 생성 단계를 세부적으로 설명하기 위한 순서도이다.
도 17은 도 15의 조정 데이터 생성 단계를 세부적으로 설명하기 위한 순서도이다.
도 18은 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 방법을 설명하기위한 순서도이다.
본 명세서 및 특허청구범위에서 사용된 용어나 단어는 일반적이거나 사전적인 의미로 한정하여 해석되어서는 아니된다. 발명자가 그 자신의 발명을 최선의 방법으로 설명하기 위해 용어나 단어의 개념을 정의할 수 있다는 원칙에 따라, 본 발명의 기술적 사상과 부합하는 의미와 개념으로 해석되어야 한다. 또한, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명이 실현되는 하나의 실시예에 불과하고, 본 발명의 기술적 사상을 전부 대변하는 것이 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형 및 응용 가능한 예들이 있을 수 있음을 이해하여야 한다.
본 명세서 및 특허청구범위에서 사용된 제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. '및/또는' 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
본 명세서 및 특허청구범위에서 사용된 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서 "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해서 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.
일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
또한, 본 발명의 각 실시예에 포함된 각 구성, 과정, 공정 또는 방법 등은 기술적으로 상호 간 모순되지 않는 범위 내에서 공유될 수 있다.
이하, 도 1 내지 도 10을 참조하여, 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 시스템을 설명한다.
도 1은 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 시스템을 설명하기위한 개념도이다.
도 1을 참조하면, 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 시스템은 제1 매출 예측 서버(200)를 포함하고, 제1 매출 예측 서버(200)는 가맹점(100) 및 외부 기관(300)과 데이터를 주고받을 수 있다.
가맹점(100)은 매출 예측이 필요한 업체일 수 있다. 가맹점(100)은 예를 들어, 외식업을 운영하는 식당이나 레스토랑일 수 있으나, 본 실시예가 이에 제한되는 것은 아니다.
가맹점(100)은 내부에 설치된 POS(Point of Sale) 단말기가 있고, 이를 통해서 POS 데이터(DP)를 생성할 수 있다. POS 데이터(DP)는 시간에 따라 기록된 판매 내역을 포함할 수 있다. 이때, 판매 내역은 팔린 메뉴, 판매 금액, 판매 시간 및 결제 방식 중 적어도 하나를 포함할 수 있다.
또한, POS 데이터(DP)는 카드 결제의 경우 카드 내역을 포함할 수 있다. 이때, 개인정보 보호를 위해서 카드 내역은 일부 자리가 비식별화되어 저장될 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.
가맹점(100)은 제1 매출 예측 서버(200)로 POS 데이터(DP)를 전송할 수 있다. 이때, POS 데이터(DP)는 시계열 데이터 즉, 시간적으로 연속적으로 생성되는 데이터일 수 있다. 따라서, 가맹점(100)은 제1 매출 예측 서버(200)로 POS 데이터(DP)를 1회성으로 보내는 것이 아니라 연속적으로 보낼 수 있다. 이때, 가맹점(100)이 주기적으로 POS 데이터(DP)를 제1 매출 예측 서버(200)로 보낼 수도 있고, 실시간으로 계속해서 POS 데이터(DP)를 제1 매출 예측 서버(200)로 보낼 수도 있다. 물론, 가맹점(100)이 POS 데이터(DP)를 비정기적으로 제1 매출 예측 서버(200)로 보내는 것도 가능할 수 있다.
외부 기관(300)은 가맹점(100)의 매출과 관련된 여러 요인에 대한 데이터를 생성하는 기관일 수 있다. 도 1에서는 외부 기관(300)이 단일 기관인 것처럼 도시되어 있지만, 본 실시예가 이에 제한되는 것은 아니다. 즉, 외부 기관(300)은 1개 또는 2개 이상의 기관일 수 있다.
외부 기관(300)은 외부 데이터(De)를 생성하여 제1 매출 예측 서버(200)로 전송할 수 있다. 외부 데이터(De)는 외부 기관(300)의 종류에 따라 여러 종류의 데이터를 포함할 수 있다. 외부 데이터(De)는 가맹점(100)의 매출에 영향을 줄 만한 다양한 데이터를 의미할 수 있다.
예를 들어, 외부 데이터(De)는 공공 데이터, 민간 공개 API(Application Programming Interface) 제공 데이터, 시장 금리 데이터, KOSPI 데이터, 경제정책불확실성 데이터, 소비자물가지수 데이터, 생산자물가지수 데이터, 소비자동향지수 데이터, 경제심리지수 데이터, 숙박 및 음식점 생산지수 데이터 및 GDP 데이터 중 적어도 하나를 포함할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.
외부 데이터(De) 중 생활 인구 데이터는 특정 위치 범위에서의 특정 시간에 따른 유동인구에 대한 시계열 데이터일 수 있다. 생활 인구 데이터를 제공하는 외부 기관(300)은 예를 들면, 통신사 사업자이거나 빅데이터 활용을 위해 데이터를 제공하는 공공 기관일 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.
생활 인구 데이터는 가맹점(100)의 근처 위치에 대해서 집계될 수 있다. 예를 들어 생활 인구 데이터는 가맹점(100)으로부터 0~1km 이내의 범위에서의 유동인구에 대한 시계열 데이터일 수 있다. 상기 범위가 너무 넓은 경우에는 가맹점(100)의 매출과 관련성이 떨어질 수 있으므로 상기 범위를 적절하게 미리 설정할 수 있다.
다른 예로, 외부 데이터(De)는 공공 데이터를 포함할 수 있다. 공공 데이터는 예를 들어, 공휴일/절기 데이터, 기상 정보 데이터, 지역 축제 일정 데이터 및 질병 확진자 수 데이터를 포함할 수 있다.
공휴일/절기 데이터의 경우에는 공휴일 데이터와 절기 데이터를 포함할 수 있다. 공휴일 데이터는 해당 시간이 공휴일인지 아닌지의 데이터를 이진법으로 표시한 데이터일 수 있다. 즉, 공휴일인 경우 1, 아닌 경우 0과 같이 표시하여 공휴일 여부를 판단하는 데이터일 수 있다.
절기 데이터는 입춘, 입추 및 동지와 같은 24 절기를 판단하는 데이터일 수 있다. 절기 데이터는 단순히 24절기에 해당되느냐 아니냐로 표시될 수도 있고, 24절기 각각에 해당되는지 여부에 대한 24개의 데이터를 각각 포함할 수 있다. 또한, 24 절기 중 일부에 대해서만 생성될 수도 있다. 이 경우, 어느 절기가 매출과 관련성이 높은지에 대한 판단을 통해서 미리 데이터가 생성될 절기가 결정될 수 있다.
또한, 공휴일/절기 데이터는 공휴일과 24절기가 아닌 날짜에 대한 데이터도 포함할 수 있다. 예를 들어, 초복, 중복 및 말복은 24절기는 아니지만 삼계탕과 같은 메뉴의 매출과 관련이 있을 수 있다. 따라서, 초복, 중복 및 말복인지에 대한 이진 데이터가 각각 혹은 같이 생성될 수 있다.
기상 정보 데이터는 기상청을 외부 기관(300)으로 하여 수집될 수 있다. 기상 정보 데이터는 다양한 날씨 정보를 포함할 수 있다. 예를 들어, 기상 정보 데이터는 날씨 데이터, 기온 데이터, 습도 데이터, 강수량 데이터, 강우량 데이터, 풍속 데이터, 일출/일몰 시간 데이터, 일사량 데이터 중 적어도 하나를 포함할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.
또한, 기상 정보 데이터는 위의 기본적인 데이터를 가공하여 만든 날씨 변화 데이터를 포함할 수도 있다. 예를 들어, 눈이 오고 기온이 5℃ 이상 상승하였는지, 오전에 비가 오고 점심 시간 이전에 날이 개었는지에 대한 데이터 등 다양한 방식의 기상 판단이 이진 데이터 형식으로 미리 설정될 수 있다. 이는 경험적으로 특정 메뉴에 대한 매출에 영향이 있는 날씨의 변화에 대한 데이터일 수 있다.
지역 축제 일정 데이터는 가맹점(100) 근처에서 개최되는 지역 축제의 일정에 대한 데이터일 수 있다. 이 경우 외부 기관(300)은 축제를 개최하는 공공 기관 또는 민간 기관일 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다. 지역 축제 일정 데이터는 유동 인구에 크게 영향을 미치므로 가맹점(100)의 매출에도 당연히 영향을 미칠 수 있다.
질병 확진자 수 데이터의 경우 외부 기관(300)은 정부 공공 기관일 수 있다. 질병 확진자 수와 같은 질병 정보는 유동 인구에 큰 영향을 미칠 수 있으므로 가맹점(100)의 매출에도 당연히 영향을 미칠 수 있어 고려해야하는 외부 요인으로 볼 수 있다.
또한, 외부 데이터(De)는 민간 공개 API 제공 데이터를 포함할 수 있다. 민간 공개 API 제공 데이터는 예를 들어, 포털 사이트의 키워드 검색 빈도를 포함할 수 있다.
이때, 어떤 키워드에 대한 검색 빈도를 외부 데이터(De)로 판단하는 지는 미리 결정될 수 있다. 예를 들어, 가맹점(100)의 명칭, 가맹점(100)의 메뉴 명칭 및 가맹점(100) 메뉴 명칭의 상위 개념이 키워드에 포함될 수 있다. 즉, 만약 '부자 김밥'이라는 가맹점(100)이 '참치 김밥'을 판매한다면, 키워드는 '부자 김밥', '참치 김밥' 및 '김밥'을 포함할 수 있다.
이때, 키워드 검색 빈도 데이터는 정규화되어 제공될 수도 있다. 즉, 키워드 검색 빈도 데이터는 미리 설정된 기준에 따라 최대값을 100, 최소값을 0으로 하여 0~100 사이의 수로 수집될 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.
외부 데이터(De)는 경제 지표 데이터를 포함할 수 있다. 경제 지표 데이터는 일단위 데이터 및 월단위 데이터를 포함할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.
일단위 데이터는 시장금리 데이터, 주가 데이터를 포함할 수 있다. 주가 데이터는 국내의 KOSPI(KOrea Composite Stock Price Index) 지수 데이터, KOSDAQ(Korea Securities Dealers Automated Quotation) 지수 데이터, 미국의 NASDAQ(National Association of Securities Dealers Automated Quotation) 지수 데이터, 다우존스(Dow Jones) 지수 데이터 중 적어도 하나를 포함할 수 있다.
이러한 주가 데이터는 실시간 데이터로 제공되긴 하지만, 변화가 너무 빠르므로 일단위 데이터로 제공받을 수 있다. 이 경우, 장이 마감되는 시점의 지수를 주가 데이터로 정의할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.
이 외에도, 경제 지표 데이터는 각종 가상화폐의 가치에 대한 데이터 및 환율 등을 포함할 수도 있다.
월단위 데이터는 경제정책불확실성(EPU; Economic Policy Uncertainty) 지수 데이터, 소비자물가지수 데이터, 생산자물가지수 데이터, 소비자동향지수 데이터, 경제심리지수 데이터, 숙박 및 음식점 생산지수 데이터 및 GDP(Gross domestic product) 데이터 중 적어도 하나를 포함할 수 있다.
이러한 경제 지표 데이터는 당연히 대중들의 소비에 영향을 미치므로 가맹점(100)의 매출을 예측할 때 고려해야할 요인이 될 수 있다.
제1 매출 예측 서버(200)는 POS 데이터(DP) 및 외부 데이터(De)를 수신하고, 매출 예측 데이터(Des)를 생성할 수 있다. 제1 매출 예측 서버(200)는 가맹점(100)에게 매출 예측 데이터(Des)를 전송할 수 있다.
제1 매출 예측 서버(200)는 워크스테이션(workstation), 데이터 센터, 인터넷 데이터 센터(internet data center(IDC)), DAS(direct attached storage) 시스템, SAN(storage area network) 시스템, NAS(network attached storage) 시스템 및 RAID(redundant array of inexpensive disks, or redundant array of independent disks) 시스템 중 적어도 하나로 구현될 수 있으나, 본 실시예가 이에 제한되는 것은 아니다.
제1 매출 예측 서버(200)는 가맹점(100)으로 네트워크를 통해서 데이터를 전송할 수 있다. 네트워크는 유선 인터넷 기술, 무선 인터넷 기술 및 근거리 통신 기술에 의한 네트워크를 포함할 수 있다. 유선 인터넷 기술은 예를 들어, 근거리 통신망(LAN, Local area network) 및 광역 통신망(WAN, wide area network) 중 적어도 하나를 포함할 수 있다.
무선 인터넷 기술은 예를 들어, 무선랜(Wireless LAN: WLAN), DLNA(Digital Living Network Alliance), 와이브로(Wireless Broadband: Wibro), 와이맥스(World Interoperability for Microwave Access: Wimax), HSDPA(High Speed Downlink Packet Access), HSUPA(High Speed Uplink Packet Access), IEEE 802.16, 롱 텀 에볼루션(Long Term Evolution: LTE), LTE-A(Long Term Evolution-Advanced), 광대역 무선 이동 통신 서비스(Wireless Mobile Broadband Service: WMBS) 및 5G NR(New Radio) 기술 중 적어도 하나를 포함할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.
근거리 통신 기술은 예를 들어, 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(Infrared Data Association: IrDA), UWB(Ultra-Wideband), 지그비(ZigBee), 인접 자장 통신(Near Field Communication: NFC), 초음파 통신(Ultra Sound Communication: USC), 가시광 통신(Visible Light Communication: VLC), 와이 파이(Wi-Fi), 와이 파이 다이렉트(Wi-Fi Direct), 5G NR (New Radio) 중 적어도 하나를 포함할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.
네트워크를 통해서 통신하는 제1 매출 예측 서버(200)는 이동통신을 위한 기술표준 및 표준 통신 방식을 준수할 수 있다. 예를 들어, 표준 통신 방식은 GSM(Global System for Mobile communication), CDMA(Code Division Multi Access), CDMA2000(Code Division Multi Access 2000), EV-DO(Enhanced Voice-Data Optimized or Enhanced Voice-Data Only), WCDMA(Wideband CDMA), HSDPA(High Speed Downlink Packet Access), HSUPA(High Speed Uplink Packet Access), LTE(Long Term Evolution), LTEA(Long Term Evolution-Advanced) 및 5G NR(New Radio) 중 적어도 하나를 포함할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.
도 2는 도 1의 제1 매출 예측 서버를 세부적으로 설명하기 위한 블록도이고, 도 3은 도 1의 POS 데이터 및 외부 데이터를 설명하기 위한 개념도이다. 도 4는 도 2의 POS 데이터 처리 모듈을 세부적으로 설명하기 위한 블록도이고, 도 5는 도 2의 데이터 조정 모듈을 세부적으로 설명하기 위한 블록도이다. 도 6 및 도 7은 도 5의 데이터 안정화 모듈이 데이터를 안정화하는 것을 설명하기 위한 중간 도면들이고, 도 8은 도 5의 VAR 분석 모듈이 시점에 따른 상관관계를 분석하는 것을 설명하기 위한 예시도이다. 도 9는 도 2의 입력 데이터 재구성 모듈을 세부적으로 설명하기 위한 블록도이고, 도 10은 도 9의 조정 데이터의 예시도이다. 도 11은 도 9의 스케일링된 데이터의 예시도이고, 도 12는 도 2의 시계열 예측 모듈을 세부적으로 설명하기 위한 블록도이다.
도 2를 참조하면, 제1 매출 예측 서버(200)는 POS 데이터 처리 모듈(210), 외부 데이터 처리 모듈(220), 데이터 조정 모듈(230), 입력 데이터 재구성 모듈(240), 시계열 예측 모듈(250) 및 오차율 판단 모듈(260)을 포함할 수 있다.
POS 데이터 처리 모듈(210)은 POS 데이터(DP)를 수신할 수 있다. POS 데이터 처리 모듈(210)은 POS 데이터(DP)로부터 재방문 데이터(Dr) 및 매출 데이터(Ds)를 생성할 수 있다. 외부 데이터 처리 모듈(220)은 외부 데이터(De)를 수신하여 처리된 외부 데이터(Dep)를 생성할 수 있다.
도 3을 참조하면, POS 데이터(DP) 및 외부 데이터(De)는 시계열 데이터일 수 있다. 즉, 시간적으로 연속적으로 이루어진 데이터일 수 있다. POS 데이터(DP)는 제1 POS 데이터(Dp1) 및 제2 POS 데이터(Dp2)를 포함할 수 있다. 제1 POS 데이터(Dp1)는 제1 시점(t1)에서부터 제2 시점(t2)까지의 POS 데이터(DP)일 수 있다. 제2 POS 데이터(Dp2)는 제2 시점(t2)에서부터 제3 시점(t3)까지의 POS 데이터(DP)일 수 있다. 제1 시점(t1)은 제2 시점(t2)보다 과거일 수 있고, 제3 시점(t3)은 제2 시점(t2)보다 과거일 수 있다.
유사하게, 외부 데이터(De)는 제1 외부 데이터(De1) 및 제2 외부 데이터(De2)를 포함할 수 있다. 제1 외부 데이터(De1)는 제1 시점(t1)에서부터 제2 시점(t2)까지의 외부 데이터(De)일 수 있다. 제2 외부 데이터(De2)는 제2 시점(t2)에서부터 제3 시점(t3)까지의 외부 데이터(De)일 수 있다.
가장 먼저 POS 데이터 처리 모듈(210)과 외부 데이터 처리 모듈(220)에 수신되는 데이터는 각각 제1 POS 데이터(Dp1) 및 제1 외부 데이터(De1)일 수 있다. 제1 매출 예측 서버(200)는 먼저, 제1 POS 데이터(Dp1) 및 제1 외부 데이터(De1)에 대해서 매출 예측 데이터(Des)를 생성하고, 추후에 제3 시점(t3)까지의 제2 POS 데이터(Dp2) 및 제2 외부 데이터(De2)가 업데이트된 POS 데이터(DP) 및 외부 데이터(De)를 이용하여 최종적인 매출 예측 데이터(Des)를 생성할 수 있다. 이에 대해서는 추후에 더 자세히 설명한다.
도 4를 참조하면, POS 데이터 처리 모듈(210)은 재방문 수치 산출 모듈(211) 및 매출 데이터 산출 모듈(212)을 포함할 수 있다.
재방문 수치 산출 모듈(211) 및 매출 데이터 산출 모듈(212)은 이상치 제거 작업을 공통적으로 수행할 수 있다. 이상치 제거 작업은 재방문 수치 산출 모듈(211) 및 매출 데이터 산출 모듈(212)에서 각각 진행될 수도 있고, 하나의 모듈에서 진행된 이후에 서로 공유될 수도 있다.
이상치 제거 작업은 카드 결제 내역 중 취소가 발생한 승인 건에 대해서 검색하고, 취소와 쌍을 이루는 승인 건을 확인하여 모두 제거하는 작업을 포함할 수 있다. 즉, 취소 건과 승인 건은 1:1로 대응되어 삭제될 수 있다.
또한, 이상치 제거 작업은 카드 결제가 연속으로 빠르게 이루어진 경우에는 이를 불법 할인대출로 판단하여 제거하는 작업을 포함할 수 있다. 불법 할인 대출이란, 신용카드로 결제하는 것처럼 꾸민 뒤 현금을 받는 불법 행위를 의미할 수 있다.
또한, 이상치 제거 작업은 카드 결제 내역에 의해서 산출된 데이터가 과거의 데이터에 비해서 지나치게 높거나 낮은 경우 정밀 검토를 수행하도록 설정될 수 있다. 예를 들어, IQR(InterQuartile Range) 기반 하위 25%나 상위 25% 구간에 분포하는 값이 나타난다면 이에 대해서 정밀 검토가 수행될 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.
재방문 수치 산출 모듈(211)은 POS 데이터(DP)를 수신하고, 재방문 데이터(Dr)를 산출할 수 있다. 재방문 수치 산출 모듈(211)은 POS 데이터(DP)의 이상치가 제거된 카드 결제 내역을 이용할 수 있다. 재방문 수치 산출 모듈(211)은 카드 결제 내역 중 비식별화되지 않은 숫자를 이용하여 동일한 사용자를 식별할 수 있다.
즉, 재방문 수치 산출 모듈(211)은 카드 결제 내역 중 중복되는 재방문 내역을 추출할 수 있다. 그리고, 재방문 수치 산출 모듈(211) 이러한 재방문 내역을 재방문 간격에 따라 분류할 수 있다. 예를 들어, 재방문 수치 산출 모듈(211)은 간격이 30일 이하인 데이터를 1달 이내 재방문 데이터로 분류하고, 간격이 31일 이상 60일 이하인 데이터를 2달마다 재방문 데이터로 분류하고, 간격이 61일 이상 90일 이하인 데이터를 3달마다 재방문 데이터로 분류할 수 있다. 또한, 추가적으로 91일 이상의 간격은 4달 이상 간격 재방문 데이터로 분류할 수 있다. 각각의 재방문 데이터는 그에 해당하는 수치를 포함할 수 있다. 위의 4가지로의 분류 방식은 예시에 불과하고, 본 실시예가 이에 제한되는 것은 아니다.
재방문 데이터(Dr)는 시간별 데이터로도 산출 가능하고, 일별, 월별 데이터로도 산출 가능할 수 있다. 즉, 시간별 데이터인 경우 시간별로 1달 이내 재방문 데이터, 2달마다 재방문 데이터, 3달마다 재방문 데이터 및 4달 이상 간격 재방문 데이터가 각각 생성될 수 있다. 같은 방식으로 일별, 월별 데이터로도 산출이 가능할 수 있다.
매출 데이터 산출 모듈(212)은 POS 데이터(DP)에서 매출 데이터(Ds)를 산출할 수 있다. 매출 데이터(Ds)는 시간별로 매출이 기록된 시계열 데이터일 수 있다. 매출 데이터(Ds)는 전체 매출에 대한 데이터도 당연히 포함하지만, 메뉴별 매출에 대한 데이터도 포함할 수 있다. 즉, 가맹점(100)이 '국밥'을 메뉴로 파는 경우 '국밥'에 대한 매출 데이터가 매출 데이터(Ds)에 포함될 수 있다.
다시, 도 2를 참조하면, 외부 데이터 처리 모듈(220)은 외부 데이터(De)를 수신하여 처리된 외부 데이터(Dep)를 생성할 수 있다. 이때, 처리된 외부 데이터(Dep)는 매출 데이터(Ds)의 시간 단위와 동일한 시간 단위로 재구성될 수 있다. 예를 들어, 매출 데이터(Ds)가 시간 단위인 경우, 일단위 및 월단위의 외부 데이터(De)는 시간 단위로 재구성될 수 있다. 일단위의 외부 데이터(De)는 하루 종일 동일한 값으로 유지될 수 있고, 월단위의 외부 데이터(De)는 한달 내내 동일한 값으로 유지될 수 있다. 만일 매출 데이터(Ds)가 일단위인 경우 처리된 외부 데이터(Dep)도 일단위로 재구성될 수 있다.
도 5 내지 도 8을 참조하면, 데이터 조정 모듈(230)은 데이터 안정화 모듈(231) 및 VAR(Vector Auto Regression) 분석 모듈(232)을 포함할 수 있다.
데이터 안정화 모듈(231)은 재방문 데이터(Dr), 매출 데이터(Ds), 처리된 외부 데이터(Dep)를 수신할 수 있다. 데이터 안정화 모듈(231)은 재방문 데이터(Dr), 매출 데이터(Ds), 처리된 외부 데이터(Dep)를 하나의 테이블 형태의 데이터로 재편집할 수 있다. 도 6은 매출 데이터(Ds) 및 처리된 외부 데이터(Dep)가 재편집된 형태를 예시적으로 나타낸다.
도 6에서는 처리된 외부 데이터(Dep) 중 일부인 KOSPI 지수 데이터와 시장 금리 데이터만이 표시되었으나, 본 실시예가 이에 제한되는 것은 아니다. 매출 데이터(Ds)와 처리된 외부 데이터(Dep)는 각각 서로 다른 열(column)을 구성하고, 하나의 행(row)은 동일한 시간대를 의미할 수 있다.
데이터 안정화 모듈(231)은 데이터 안정화를 수행할 수 있다. 즉, 도 6의 데이터와 같이 각 열의 절대값의 차이가 큰 경우에는 연산의 속도를 높이고, 연산량을 줄이기 위해서 데이터 안정화를 수행할 수 있다. 구체적으로, 데이터 안정화 모듈(231)은 각 데이터의 값에 자연 로그를 취하고 차분을 진행할 수 있다. 이때, 차분이란 어떤 시간대의 값에 바로 전 시간대의 값을 빼 준 값을 대신 채워주는 것으로 각 시간대에는 전시간대에 대한 증감량이 표시될 수 있다. 즉, 데이터가 벡터화될 수 있다. 데이터 안정화 모듈(231)은 데이터 안정화를 통해서 안정화 데이터(Dst)를 생성할 수 있다.
또한, 이러한 데이터 안정화는 데이터 변수 간의 편차를 줄여줌으로써, 추후 시계열 예측 모델(252)이 학습할 때, 어느 특정 변수에 대해 가중치가 편향적으로 업데이트되는 것을 방지할 수 있다. 이를 통해서, 시계열 예측 모델(252)의 성능이 더욱 향상될 수 있다.
도 7은 데이터 안정화가 된 안정화 데이터(Dst)의 예시를 나타내고 있다. 도 7을 살펴보면 2017-11-29의 매출란에는 원래의 값에 자연 로그를 취한 뒤 2017-11-29의 값에서 2017-11-28의 값을 뺀 값이 표시된 것을 확인할 수 있다.
VAR 분석 모듈(232)은 안정화 데이터(Dst)를 수신할 수 있다. VAR 분석 모듈(232)은 매출 데이터(Ds)와 다른 데이터와의 상관관계를 분석할 수 있다. 즉, VAR 분석 모듈(232)은 매출 데이터(Ds)와 재방문 데이터(Dr), 매출 데이터(Ds)와 처리된 외부 데이터(Dep)의 상관관계를 분석할 수 있다. 이때, 단순히 같은 시점의 데이터 간의 상관관계를 분석할 뿐만 아니라 서로 다른 시점 간의 상관관계도 분석할 수 있다.
도 8은 매출 데이터(Ds)와 처리된 외부 데이터(Dep) 즉, KOSPI 데이터 및 시장 금리 데이터와의 상관관계가 나타나 있다. “coefficient” 부분은 상관계수를 의미한다. 이 수치가 +이면 양의 상관관계, -이면 음의 상관관계를 의미할 수 있다.
“prob” 부분은 p value로서 신뢰도 95%로 설정할 경우 0.05 이하일 때만 위의 “coefficient”가 유효한 것으로 확인할 수 있다. “L1. 상인”이 나타난 행은 현재 매출 데이터(Ds)와 하루 전의 매출 데이터(Ds)의 상관관계를 나타낸 행이다. 유사하게, “L2. 상인”은 현재와 이틀 전의 매출 데이터(Ds)의 상관관계이다.
마찬가지로, “L4. KOSPI”는 4일 전의 KOSPI 지수 데이터와 매출 데이터(Ds) 사이의 상관관계를 나타낼 수 있다. 상관계수가 높은 “L8. 금리”를 확인해보면 p value도 0.05 이하이므로 유효할 수 있다. 따라서, 매출 데이터(Ds)와 처리된 외부 데이터(Dep) 중 시장 금리 데이터는 8일 정도의 시간 간격이 상관관계가 높은 것을 확인할 수 있다. 즉, 시장 금리 데이터가 변동하면 그에 따라 8일 후에 매출에 영향을 가장 크게 미치는 것을 확인할 수 있다.
이와 같이 VAR 분석 모듈(232)은 가장 상관관계가 크고 신뢰할 수 있는 시점을 찾아서 조정 데이터(Da)를 생성할 수 있다. 조정 데이터(Da)는 현재 매출 데이터(Ds)와 8일전의 시장 금리 데이터가 테이블 형식으로 구성된 데이터일 수 있다. 마찬가지로, 다른 처리된 외부 데이터(Dep) 및 재방문 데이터(Dr)도 현재 매출 데이터(Ds)와 가장 상관관계가 높은 시점을 찾아서 조정 데이터(Da)로 결합될 수 있다. 이때, 조정 데이터(Da)는 상기 안정화 작업이 되어있지 않은 상태일 수 있다. 즉, 안정화 작업은 VAR 분석을 위한 작업이고, 추후 조정 데이터(Da)는 스케일링 모듈(241)에 의해서 스케일링 단계를 거칠 수 있다.
본 실시예는 이를 통해서, 여러가지 요인의 시계열 데이터의 시점 중 가장 영향이 많은 시점을 찾아내어 분석에 사용하므로 매우 정밀하고 정확한 예측이 가능할 수 있다.
도 2 및 도 9 내지 도 11을 참조하면, 입력 데이터 재구성 모듈(240)은 스케일링 모듈(241), 데이터 분리 모듈(242) 및 3차원 데이터 재구성 모듈(243)을 포함할 수 있다.
스케일링 모듈(241)은 조정 데이터(Da)를 수신하여 스케일링 작업을 수행할 수 있다. 스케일링 모듈(241)은 조정 데이터(Da)를 정규화하는 작업을 의미할 수 있다. 즉, 각각의 데이터가 값의 범위가 다양하므로 추후 연산할 때 속도가 느려지고, 연산량이 많아질 수 있다. 도 10은 조정 데이터(Da)의 예시도로, 각각의 컬럼의 값의 범위가 매우 다양함을 확인할 수 있다.
따라서, 스케일링 모듈(241)은 min-max 스케일링 기법을 통해서 모든 데이터의 값을 0~1 사이의 값으로 정규화할 수 있다. 이를 통해서 데이터의 크기를 줄이고 처리 속도를 비약적으로 높일 수 있다. 나아가, 수치의 크기가 커서 발생할 수 있는 여러 문제점을 사전에 방지할 수 있다. 즉, 스케일링 모듈(241)은 스케일링을 통해서 스케일링된 데이터(Das)를 생성할 수 있다. 도 11은 스케일링된 데이터(Das)의 예시도로, 모든 컬럼의 값이 0에서 1 사이로 스케일링된 것을 확인할 수 있다.
또한, 상술한 바와 같이 데이터의 정규화도 데이터 변수 간의 편차를 줄여줌으로써, 추후 시계열 예측 모델(252)이 학습할 때, 어느 특정 변수에 대해 가중치가 편향적으로 업데이트되는 것을 방지할 수 있다. 이를 통해서, 시계열 예측 모델(252)의 성능이 더욱 향상될 수 있다.
이때, 스케일링 모듈(241)은 min-max 스케일링 기법 외에도 standard 스케일링 기법, max abs 스케일링 기법, robust 스케일링 기법 중 어느 하나를 채용하여 스케일링을 수행할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.
데이터 분리 모듈(242)은 스케일링된 데이터(Das)를 수신하여 트레이닝 데이터, 밸리데이션 데이터 및 테스트 데이터로 분리할 수 있다. 이렇게 분리된 데이터는 분리 데이터(Das_sep)에 포함될 수 있다.
트레이닝 데이터는 딥러닝 모듈의 가중치(weight)나 바이어스(bias) 즉, 파라미터를 조율하는데 사용될 수 있다. 즉, 딥러닝 모듈의 학습에 사용될 수 있다. 밸리데이션 데이터는 하이퍼 파라미터를 조절하기 위해서 필요한 데이터 세트를 의미할 수 있다. 이때, 하이퍼 파라미터는 학습률(learning rate), 가중치 감쇠(weight decay), 비용 함수(cost function), 컨볼루션 필터의 개수 등 사람의 경험 및 직관으로 조절해야 되는 파라미터를 의미할 수 있다. 즉, 밸리데이션 데이터를 이용하여 모델의 오차(loss), 정확도(accuracy)를 평가하면서 하이퍼 파라미터를 조절할 수 있다.
테스트 데이터는 딥러닝 모듈의 학습에는 영향을 주지 않고, 테스트를 위한 데이터 세트일 수 있다. 분리 데이터(Das_sep)는 이러한 3가지 종류의 데이터를 포함하여 추후 시계열 예측 모델(252)의 학습에 사용될 수 있다.
3차원 데이터 재구성 모듈(243)은 분리 데이터(Das_sep)를 수신하여 입력 데이터(Di)로 재구성할 수 있다. 3차원 데이터 재구성 모듈(243)은 2차원의 분리 데이터(Das_sep)를 3차원의 입력 데이터(Di)로 재구성할 수 있다. 이때, 당연히 입력 데이터(Di)도 트레이닝 데이터, 밸리데이션 데이터 및 테스트 데이터로 분리되어 있을 수 있다.
입력 데이터(Di)는 시간을 나타내는 행(row)과 각 특징(feature) 즉, 데이터의 종류에 따른 열(column)의 2차원 데이터를 배치 사이즈(batch size)에 맞추어 3차원 형태로 적층한 데이터일 수 있다. 이때, 행의 수는 어느 정도의 시간을 학습시킬지에 따라 미리 정해질 수 있다. 또한, 열의 수는 학습 변수의 개수에 따라 결정될 수 있다. 배치 사이즈는 한 번에 학습시킬 데이터의 양에 따라 결정될 수 있다.
도 2 및 도 12를 참조하면, 시계열 예측 모듈(250)은 모델링 모듈(251) 및 시계열 예측 모델(252)을 포함할 수 있다.
모델링 모듈(251)은 오차율 정보(Re)를 수신하여 시계열 예측 모델(252)의 하이퍼 파라미터(HP)를 재설정하고, 시계열 예측 모델(252)의 모델링을 수행할 수 있다. 이때, 오차율 정보(Re)가 모델링 모듈(251)에 미리 설정된 기준 오차율보다 낮은 경우에는 현재의 시계열 예측 모델(252)의 파라미터를 그대로 저장할 수 있다. 즉, 오차율 정보(Re)가 모델링 모듈(251)에 미리 설정된 기준 오차율보다 높은 경우에만 하이퍼 파라미터(HP) 및 시계열 예측 모델(252)의 모델링이 재설정될 수 있다.
시계열 예측 모델(252)은 딥러닝 모델로서 입력 데이터(Di)를 수신할 수 있다. 시계열 예측 모델(252)은 입력 데이터(Di)에 포함된 트레이닝 데이터, 밸리데이션 데이터 및 테스트 데이터를 통해서 파라미터가 조절되고 평가될 수 있다. 시계열 예측 모델(252)은 입력 데이터(Di)에 따라 매출 예측 데이터(Des)를 도출할 수 있다.
시계열 예측 모델(252)은 예를 들어, LSTM(Long Short Term Memory) 레이어를 입력 레이어로 하고, 출력 레이어로 덴스(Dense) 레이어를 사용할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다. 시계열 예측 모델(252)은 컨볼루션 레이어를 이용하여 CNN(Convolution Neural Network)-LSTM 레이어를 채용할 수도 있고, 양방향 LSTM(Bi LSTM) 레이어를 채용할 수도 있다.
덴스 레이어의 활성화 함수(activation function)는 ReLU(Rectified Linear Unit) 및 LeakyReLU 중 어느 하나를 포함할 수 있다. 이때, LeakyReLU를 사용하는 경우 매출이라는 연속적인 값을 예측하는 과정에서 가중치가 음수가 되는 경우를 차단할 수 있다. 이 경우에는 기울기가 0이 되어서 데이터(gradient)가 손실되는 경우를 방지할 수 있다.
모델링 모듈(251)은 밸리데이션 데이터를 이용하여 손실 측도(loss metric)를 확인하고 최적의 하이퍼 파라미터(HP)를 탐색할 수 있다. 이때, 모델링 모듈(251)은 소프트웨어 상의 자동화 도구를 사용하여 최적의 하이퍼 파라미터(HP)를 탐색할 수 있다. 최적의 하이퍼 파라미터(HP)는 손실 측도가 최소가 되는 값일 수 있다.
다시, 도 2를 참조하면, 오차율 판단 모듈(260)은 시계열 예측 모듈(250)로부터 매출 예측 데이터(Des)를 수신할 수 있다. 오차율 판단 모듈(260)은 매출 예측 데이터(Des)와 매출 데이터(Ds)를 비교하여 오차율 정보(Re)를 생성할 수 있다.
도 2 및 도 3을 참조하면, 시계열 예측 모듈(250)이 생성한 매출 예측 데이터(Des)는 제2 시점(t2) 및 제3 시점(t3) 사이의 매출 예측 데이터(Des)일 수 있다. 즉, 시계열 예측 모듈(250)은 제1 POS 데이터(Dp1) 및 제1 외부 데이터(De1)를 기초로, POS 데이터 처리 모듈(210), 외부 데이터 처리 모듈(220), 데이터 조정 모듈(230), 입력 데이터 재구성 모듈(240)을 거쳐서 준비된 입력 데이터(Di)를 이용하여 매출 예측 데이터(Des)를 생성할 수 있다.
오차율 판단 모듈(260)은 제2 POS 데이터(Dp2)를 수신하여 매출 예측 데이터(Des)와 비교하고 오차율을 판단할 수 있다. 이에 따라, 오차율 판단 모듈(260)은 오차율 정보(Re)를 생성할 수 있다. 오차율 판단 모듈(260)의 오차율 정보(Re) 생성은 테스트 데이터에 의한 오차율 판단과는 별개의 단계일 수 있다.
도 1 내지 도 3 및 도 12를 참조하면, 모델링 모듈(251)은 미리 설정된 기준 오차율보다 오차율 정보(Re)에서 포함된 오차율이 높다면 시계열 예측 모델(252)의 모델링을 다시 수행할 수 있다. 만일 미리 설정된 기준 오차율보다 오차율 정보(Re)에서 포함된 오차율이 낮다면, 시계열 예측 모델(252)이 충분히 신뢰할 수 있으므로, 모델링 모듈(251)은 시계열 예측 모델(252)의 파라미터를 저장하고 확정할 수 있다. 이때, 기준 오차율은 7%일 수 있으나, 본 실시예가 이에 제한되는 것은 아니다.
즉, 본 실시예는 테스트 데이터에 의한 오차율의 판단과 별개로 다시 오차율 판단 모듈(260)에 의해서 오차를 판단하여 더욱 정밀하고 정확한 예측 모델을 생성할 수 있다.
이런 단계의 반복 속에 최종적으로 오차율 정보(Re)의 오차율이 기준 오차율보다 낮아서 시계열 예측 모델(252)이 확정된 경우에는 시계열 예측 모듈(250)은 최신 정보까지 업데이트된 POS 데이터(DP) 및 외부 데이터(De)를 이용하여 매출 예측 데이터(Des)가 다시 생성될 수 있고, 이러한 매출 예측 데이터(Des)는 가맹점(100)에 제공될 수 있다.
즉, 이 경우 이용되는 POS 데이터(DP)는 제1 POS 데이터(Dp1) 및 제2 POS 데이터(Dp2)를 모두 포함한 데이터 중 최신의 데이터일 수 있다. 마찬가지로, 이 경우 이용되는 외부 데이터(De)는 제1 외부 데이터(De1) 및 제2 외부 데이터(De2)를 모두 포함한 데이터 중 최신의 데이터일 수 있다.
매출 예측 데이터(Des)는 시계열 데이터로 시간의 흐름에 따른 매출의 예측치를 포함할 수 있다. 또한, 매출 예측 데이터(Des)는 가맹점(100)이 외식업인 경우 메뉴에 따른 매출의 예측치도 포함할 수 있다.
본 실시예에 따른 매장 운영 예측 시스템은 여러 외부 요인을 통해서 매출을 예측하여 정밀한 매출 예측을 수행하고, 각 외부 요인과 매출의 상관관계를 시점별로 분석하여 가장 높은 상관관계에 대한 입력 데이터를 구축하여 시계열 예측 모델(252)에 제공하여 높은 정확도를 가지는 매출 예측 데이터(Des)를 산출할 수 있다.
나아가, 오차율의 판단을 여러 번하여 최적의 파라미터를 가지는 모델을 확정함으로써 더욱 정확하고 신뢰성 높은 매출 예측 데이터(Des) 제공할 수 있다.
이하, 도 13 및 도 14를 참조하여, 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 시스템을 설명한다. 상술한 실시예와 중복되는 부분은 간략히 하거나 생략한다.
도 13은 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 시스템을 설명하기위한 개념도이고, 도 14는 도 13의 제2 매출 예측 서버를 세부적으로 설명하기 위한 블록도이다.
도 13을 참조하면, 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 시스템은 제2 매출 예측 서버(201)를 포함할 수 있다. 제2 매출 예측 서버(201)는 가맹점(100)으로부터 POS 데이터(DP)를 수신하고, 외부 기관(300)으로부터 외부 데이터(De)를 수신한 뒤, 매출 예측 데이터(Des)와 함께 식자재 추천 발주 정보(Df)를 가맹점(100)에게 제공할 수 있다.
도 14를 참조하면, 제2 매출 예측 서버(201)는 식자재 추천 발주 정보 모듈(270)을 더 포함할 수 있다.
식자재 추천 발주 정보 모듈(270)은 매출 예측 데이터(Des)를 수신하고, 식자재 추천 발주 정보(Df)를 생성할 수 있다. 구체적으로, 식자재 추천 발주 정보 모듈(270)은 각각의 메뉴에 들어가는 식자재의 수량에 대한 정보와 식자재의 발주시 배송 기간, 유통 기한 등의 식자재 세부 정보를 저장할 수 있다.
식자재 추천 발주 정보 모듈(270)은 매출 예측 데이터(Des)에 따라서, 메뉴별 매출 예측을 식별하고, 그에 따른 식자재 수요를 산출할 수 있다. 또한, 이러한 식자재 수요에 따른 식자재 발주 스케쥴링에 따라 적절한 시기에 가맹점(100)에게 식자재 추천 발주 정보(Df)를 제공할 수 있다.
이에 따라, 가맹점(100)은 적절한 시기에 필요한 식자재를 필요한 양만큼 주문할 수 있다. 이에 따라, 낭비되는 식자재를 줄이고, 식자재가 부족하여 급하게 비싼 값으로 식자재를 구입하여야 하는 상황도 줄여 매장 운용의 안전성을 높이고 비용도 최소화할 수 있다.
이하, 도 1 내지 도 12 및 도 15 내지 도 17을 참조하여, 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 방법을 설명한다. 상술한 실시예와 중복되는 부분은 간략히 하거나 생략한다.
도 15는 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 방법을 설명하기위한 순서도이고, 도 16은 도 15의 재방문 데이터 생성 단계를 세부적으로 설명하기 위한 순서도이다. 도 17은 도 15의 조정 데이터 생성 단계를 세부적으로 설명하기 위한 순서도이다.
도 15를 참조하면, 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 방법은 POS 데이터 및 외부 데이터를 수신하여 매출 데이터, 재방문 데이터 및 처리된 외부 데이터를 생성한다(S100).
구체적으로, 도 4를 참조하면, 매출 데이터 산출 모듈(212)은 POS 데이터(DP)에서 매출 데이터(Ds)를 산출할 수 있다. 매출 데이터(Ds)는 시간별로 매출이 기록된 시계열 데이터일 수 있다. 매출 데이터(Ds)는 전체 매출에 대한 데이터도 당연히 포함하지만, 메뉴별 매출에 대한 데이터도 포함할 수 있다. 즉, 가맹점(100)이 '국밥'을 메뉴로 파는 경우 '국밥'에 대한 매출 데이터가 매출 데이터(Ds)에 포함될 수 있다.
또한, 도 2를 참조하면, 외부 데이터 처리 모듈(220)은 외부 데이터(De)를 수신하여 처리된 외부 데이터(Dep)를 생성할 수 있다. 이때, 처리된 외부 데이터(Dep)는 매출 데이터(Ds)의 시간 단위와 동일한 시간 단위로 재구성될 수 있다.
또한, 재방문 데이터(Dr)에 대해서 세부적으로 설명하기 위해서 도 16을 참조하면, 먼저 카드 결제 내역 중 재방문 내역을 추출한다(S110). 이어서, 재방문 간격에 따른 수치를 산출한다(S120).
구체적으로, 도 4를 참조하면, 재방문 수치 산출 모듈(211)은 POS 데이터(DP)를 수신하고, 재방문 데이터(Dr)를 산출할 수 있다. 재방문 수치 산출 모듈(211)은 POS 데이터(DP)의 이상치가 제거된 카드 결제 내역을 이용할 수 있다. 재방문 수치 산출 모듈(211)은 카드 결제 내역 중 비식별화되지 않은 숫자를 이용하여 동일한 사용자를 식별할 수 있다. 재방문 수치 산출 모듈(211)은 카드 결제 내역 중 중복되는 재방문 내역을 추출할 수 있다. 그리고, 재방문 수치 산출 모듈(211) 이러한 재방문 내역을 재방문 간격에 따라 분류할 수 있다.
다시, 도 15를 참조하면, 데이터의 시점에 따른 상관관계를 분석하여 시점에 따른 조정 데이터를 생성한다(S200).
자세히 도 17을 참조하면, 먼저 데이터를 안정화한다(S1210).
구체적으로, 도 5 내지 도 7을 참조하면, 데이터 안정화 모듈(231)은 재방문 데이터(Dr), 매출 데이터(Ds), 처리된 외부 데이터(Dep)를 수신할 수 있다. 데이터 안정화 모듈(231)은 재방문 데이터(Dr), 매출 데이터(Ds), 처리된 외부 데이터(Dep)를 하나의 테이블 형태의 데이터로 재편집할 수 있다. 도 6은 매출 데이터(Ds) 및 처리된 외부 데이터(Dep)가 재편집된 형태를 예시적으로 나타낸다.
데이터 안정화 모듈(231)은 데이터 안정화를 수행할 수 있다. 데이터 안정화 모듈(231)은 각 데이터의 값에 자연 로그를 취하고 차분을 진행할 수 있다. 이때, 차분이란 어떤 시간대의 값에 바로 전 시간대의 값을 빼 준 값을 대신 채워주는 것으로 각 시간대에는 전시간대에 대한 증감량이 표시될 수 있다. 즉, 데이터가 벡터화될 수 있다. 데이터 안정화 모듈(231)은 데이터 안정화를 통해서 안정화 데이터(Dst)를 생성할 수 있다. 도 7은 데이터 안정화가 된 안정화 데이터(Dst)의 예시를 나타내고 있다.
다시, 도 17을 참조하면, VAR 분석을 통해서 상관관계가 높은 시점의 데이터를 확인하고(S220), 조정 데이터를 생성한다(S230).
구체적으로, 도 5 및 도 8을 참조하면, VAR 분석 모듈(232)은 안정화 데이터(Dst)를 수신할 수 있다. VAR 분석 모듈(232)은 매출 데이터(Ds)와 다른 데이터와의 상관관계를 분석할 수 있다. 즉, VAR 분석 모듈(232)은 매출 데이터(Ds)와 재방문 데이터(Dr), 매출 데이터(Ds)와 처리된 외부 데이터(Dep)의 상관관계를 분석할 수 있다. 이때, 단순히 같은 시점의 데이터 간의 상관관계를 분석할 뿐만 아니라 서로 다른 시점 간의 상관관계도 분석할 수 있다. 도 8은 상관관계 분석의 예시적인 결과를 도시하였다.
VAR 분석 모듈(232)은 가장 상관관계가 크고 신뢰할 수 있는 시점을 찾아서 조정 데이터(Da)를 생성할 수 있다. 조정 데이터(Da)는 현재 매출 데이터(Ds)와 8일전의 시장 금리 데이터가 테이블 형식으로 구성된 데이터일 수 있다. 마찬가지로, 다른 처리된 외부 데이터(Dep) 및 재방문 데이터(Dr)도 현재 매출 데이터(Ds)와 가장 상관관계가 높은 시점을 찾아서 조정 데이터(Da)로 결합될 수 있다.
다시, 도 15를 참조하면, 조정 데이터를 입력 데이터로 재구성한다(S300).
구체적으로, 도 2 및 도 9 내지 도 11을 참조하면, 스케일링 모듈(241)은 조정 데이터(Da)를 수신하여 스케일링 작업을 수행할 수 있다. 스케일링 모듈(241)은 스케일링을 통해서 스케일링된 데이터(Das)를 생성할 수 있다. 도 11은 스케일링된 데이터(Das)의 예시도로, 모든 컬럼의 값이 0에서 1 사이로 스케일링된 것을 확인할 수 있다.
데이터 분리 모듈(242)은 스케일링된 데이터(Das)를 수신하여 트레이닝 데이터, 밸리데이션 데이터 및 테스트 데이터로 분리할 수 있다. 이렇게 분리된 데이터는 분리 데이터(Das_sep)에 포함될 수 있다.
3차원 데이터 재구성 모듈(243)은 분리 데이터(Das_sep)를 수신하여 입력 데이터(Di)로 재구성할 수 있다. 3차원 데이터 재구성 모듈(243)은 2차원의 분리 데이터(Das_sep)를 3차원의 입력 데이터(Di)로 재구성할 수 있다.
다시, 도 15를 참조하면, S100 내지 S300 단계와 병렬적으로 시계열 예측 모델링한다(S400).
구체적으로, 도 12를 참조하면, 시계열 예측 모델(252)은 예를 들어, LSTM 레이어를 입력 레이어로 하고, 출력 레이어로 덴스 레이어를 사용할 수 있다. 덴스 레이어의 활성화 함수는 LeakyReLU를 포함할 수 있다. 모델링 모듈(251)은 최적의 하이퍼 파라미터(HP)를 탐색하여 설정할 수 있다.
다시, 도 15를 참조하면, 시계열 예측 모델을 학습한다(S500).
구체적으로, 도 12를 참조하면, 시계열 예측 모델(252)은 딥러닝 모델로서 입력 데이터(Di)를 수신할 수 있다. 시계열 예측 모델(252)은 입력 데이터(Di)에 포함된 트레이닝 데이터, 밸리데이션 데이터 및 테스트 데이터를 통해서 파라미터가 조절되고 평가될 수 있다. 시계열 예측 모델(252)은 입력 데이터(Di)에 따라 매출 예측 데이터(Des)를 도출할 수 있다.
다시, 도 15를 참조하면, 오차율이 기준 오차율 이하인지 판단한다(S600).
구체적으로, 도 2를 참조하면, 오차율 판단 모듈(260)은 시계열 예측 모듈(250)로부터 매출 예측 데이터(Des)를 수신할 수 있다. 오차율 판단 모듈(260)은 매출 예측 데이터(Des)와 매출 데이터(Ds)를 비교하여 오차율 정보(Re)를 생성할 수 있다.
오차율 판단 모듈(260)은 제2 POS 데이터(Dp2)를 수신하여 매출 예측 데이터(Des)와 비교하고 오차율을 판단할 수 있다. 이에 따라, 오차율 판단 모듈(260)은 오차율 정보(Re)를 생성할 수 있다.
도 1 내지 도 3 및 도 12를 참조하면, 모델링 모듈(251)은 미리 설정된 기준 오차율보다 오차율 정보(Re)에서 포함된 오차율이 높다면 시계열 예측 모델(252)의 모델링을 다시 수행할 수 있다. 즉, 도 15의 S400 단계로 다시 돌아갈 수 있다.
만일 미리 설정된 기준 오차율보다 오차율 정보(Re)에서 포함된 오차율이 낮다면, 시계열 예측 모델(252)이 충분히 신뢰할 수 있다.
이 경우 다시, 도 15를 참조하면, 시계열 예측 모델을 저장하여 시계열 예측을 수행한다(S700).
구체적으로, 도 2를 참조하면, 시계열 예측 모듈(250)은 최신 정보까지 업데이트된 POS 데이터(DP) 및 외부 데이터(De)를 이용하여 매출 예측 데이터(Des)가 다시 생성될 수 있고, 이러한 매출 예측 데이터(Des)는 가맹점(100)에 제공될 수 있다.
이하, 도 13, 도 14 및 도 18을 참조하여, 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 방법을 설명한다. 상술한 실시예와 중복되는 부분은 간략히 하거나 생략한다.
도 18을 참조하면, S100 내지 S700 단계는 도 15와 동일할 수 있다. 이어서, 본 발명의 몇몇 실시예들에 따른 매장 운영 예측 방법은 식자재 수요를 예측하여 식자재 추천 발주 정보를 제공한다(S800).
구체적으로, 도 13 및 도 14를 참조하면, 식자재 추천 발주 정보 모듈(270)은 매출 예측 데이터(Des)를 수신하고, 식자재 추천 발주 정보(Df)를 생성할 수 있다. 구체적으로, 식자재 추천 발주 정보 모듈(270)은 각각의 메뉴에 들어가는 식자재의 수량에 대한 정보와 식자재의 발주시 배송 기간, 유통 기한 등의 식자재 세부 정보를 저장할 수 있다.
식자재 추천 발주 정보 모듈(270)은 매출 예측 데이터(Des)에 따라서, 메뉴별 매출 예측을 식별하고, 그에 따른 식자재 수요를 산출할 수 있다. 또한, 이러한 식자재 수요에 따른 식자재 발주 스케쥴링에 따라 적절한 시기에 가맹점(100)에게 식자재 추천 발주 정보(Df)를 제공할 수 있다.
이상의 설명은 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (10)

  1. 가맹점으로부터 시계열 데이터로 구성된 POS 데이터를 수신하여 매출 데이터를 추출하는 POS 데이터 처리 모듈;
    시계열 데이터로 구성된 외부 데이터를 수신하여 상기 매출 데이터와 동일한 시간 단위로 재구성하여 처리된 외부 데이터를 생성하는 외부 데이터 처리 모듈;
    상기 매출 데이터 및 상기 처리된 외부 데이터의 시점에 따른 상관관계를 판단하여 높은 상관관계를 가지는 시점으로 매칭시키고, 2차원 테이블 형식의 조정 데이터를 생성하는 데이터 조정 모듈;
    상기 조정 데이터를 미리 설정된 형식으로 변환하여 입력 데이터를 생성하는 입력 데이터 재구성 모듈; 및
    딥러닝 모델을 포함하고, 상기 입력 데이터를 이용하여 학습하고, 매출 예측 데이터를 도출하는 시계열 예측 모듈을 포함하는 매장 운영 예측 시스템.
  2. 제1 항에 있어서,
    상기 POS 데이터는 카드 결제 내역을 포함하고,
    상기 POS 데이터 처리 모듈은,
    상기 카드 결제 내역에서 재방문 수치를 산출하는 재방문 수치 산출 모듈과,
    상기 매출 데이터를 산출하는 매출 데이터 산출 모듈을 포함하는 매장 운영 예측 시스템.
  3. 제1 항에 있어서,
    상기 데이터 조정 모듈은,
    상기 매출 데이터 및 상기 처리된 외부 데이터를 차분을 통한 증감량으로 표시하여 안정화 데이터를 생성하는 데이터 안정화 모듈과,
    상기 안정화 데이터를 VAR(Vector Auto Regression) 방식을 이용하여 상기 매출 데이터와 상기 외부 데이터의 최적의 시점을 판단하고, 그에 따라 상기 조정 데이터를 생성하는 VAR 분석 모듈을 포함하는 매장 운영 예측 시스템.
  4. 제1 항에 있어서,
    상기 매출 예측 데이터와 상기 매출 데이터를 비교하여 오차율 정보를 산출하는 오차율 판단 모듈을 더 포함하고,
    상기 시계열 예측 모듈은 상기 오차율 정보에 따라 상기 딥러닝 모델의 모델링의 수행여부를 판단하는 매장 운영 예측 시스템.
  5. 제1 항에 있어서,
    상기 외부 데이터는 공공 데이터, 민간 공개 API 제공 데이터 및 경제 지표 데이터 중 적어도 하나를 포함하는 매장 운영 예측 시스템.
  6. 제1 항에 있어서,
    상기 매출 예측 데이터는 메뉴별 예측 매출 데이터를 포함하고,
    상기 매출 예측 데이터에 따라 식자재 수요를 분석하고, 식자재 추천 발주 정보를 생성하는 식자재 추천 발주 정보 모듈을 더 포함하는 매장 운영 예측 시스템.
  7. POS 데이터를 수신하여 매출 데이터를 추출하고, 외부 데이터를 수신하여 상기 매출 데이터와 동일한 시간 단위로 재구성된 처리된 외부 데이터를 생성하고,
    상기 매출 데이터와 상기 처리된 외부 데이터의 시점에 따른 상관관계를 분석하여 높은 상관관계의 시점으로 매칭된 조정 데이터를 생성하고,
    상기 조정 데이터를 미리 설정된 형식으로 변환하여 입력 데이터를 생성하고,
    상기 입력 데이터를 이용하여 딥러닝 모델을 포함하는 시계열 예측 모델을 학습시키고, 상기 시계열 예측 모델을 통해서 매출 예측 데이터를 도출하고,
    상기 매출 예측 데이터의 오차율이 기준 오차율 이하인지를 판단하고,
    만일 상기 오차율이 상기 기준 오차율 이하인 경우 그대로 매출 예측 데이터를 생성하고,
    만일 상기 오차율이 상기 기준 오차율 초과인 경우 상기 시계열 예측 모델의 모델링을 다시 수행하는 것을 포함하는 시계열 분석을 이용한 매출 예측 방법.
  8. 제7 항에 있어서,
    상기 매출 예측 데이터에 의해서 식자재 수요를 예측하여, 식자재 추천 발주 정보를 제공하는 것을 더 포함하는 매장 운영 예측 방법.
  9. 제7 항에 있어서,
    상기 POS 데이터는 카드 결제 내역을 포함하고,
    상기 카드 결제 내역에서 재방문 내역을 추출하고,
    상기 재방문 내역을 재방문 간격에 따라 분류하여 재방문 데이터를 생성하는 것을 더 포함하고,
    상기 조정 데이터를 생성하는 것은, 상기 매출 데이터와, 상기 처리된 외부 데이터 및 상기 재방문 데이터의 시점에 따른 상관관계를 분석하는 것을 포함하는 매장 운영 예측 방법.
  10. 제7 항에 있어서,
    상기 조정 데이터를 생성하는 것은,
    상기 매출 데이터 및 상기 처리된 외부 데이터를 차분하여 안정화 데이터를 생성하고,
    상기 안정화 데이터를 VAR 방식을 이용하여 상관관계가 높은 시점의 데이터를 확인하고,
    상기 상관관계가 높은 시점의 데이터를 결합하여 상기 조정 데이터를 생성하는 것을 포함하는 매장 운영 예측 방법.
PCT/KR2022/009423 2021-07-13 2022-06-30 매장 운영 예측 시스템 및 그 방법 WO2023287073A1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20210091368 2021-07-13
KR10-2021-0091368 2021-07-13
KR1020210111273A KR20230011193A (ko) 2021-07-13 2021-08-23 매장 운영 예측 시스템 및 그 방법
KR10-2021-0111273 2021-08-23

Publications (1)

Publication Number Publication Date
WO2023287073A1 true WO2023287073A1 (ko) 2023-01-19

Family

ID=84920488

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2022/009423 WO2023287073A1 (ko) 2021-07-13 2022-06-30 매장 운영 예측 시스템 및 그 방법

Country Status (1)

Country Link
WO (1) WO2023287073A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116662766A (zh) * 2023-08-01 2023-08-29 浙江大学 基于数据二维重构的风速预测方法及装置、电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140139466A (ko) * 2014-11-12 2014-12-05 변동삼 데이터 크롤링 및 관리자 입력에 기반한 판매 예측 자동화 장치
JP2015043167A (ja) * 2013-08-26 2015-03-05 株式会社日立システムズ 売上予測システム及び売上予測方法
KR20180059996A (ko) * 2016-11-28 2018-06-07 주식회사 리테일영 매출데이터 기반의 식자재 관리방법 및 시스템
KR101932608B1 (ko) * 2017-09-21 2018-12-27 충남대학교산학협력단 자전거 대여 시스템 관리 방법, 자전거 대여 시스템의 관리 서버, 및 컴퓨터 판독가능 기록 매체
KR102205215B1 (ko) * 2019-03-11 2021-01-19 한전케이디엔주식회사 딥 러닝 기반 자원 가격 예측 방법
KR20210061560A (ko) * 2019-11-20 2021-05-28 (주)한국해양기상기술 기상기후데이터를 기반으로 한 인공지능 화장품 매출 예측 방법 및 이를 사용한 서버

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015043167A (ja) * 2013-08-26 2015-03-05 株式会社日立システムズ 売上予測システム及び売上予測方法
KR20140139466A (ko) * 2014-11-12 2014-12-05 변동삼 데이터 크롤링 및 관리자 입력에 기반한 판매 예측 자동화 장치
KR20180059996A (ko) * 2016-11-28 2018-06-07 주식회사 리테일영 매출데이터 기반의 식자재 관리방법 및 시스템
KR101932608B1 (ko) * 2017-09-21 2018-12-27 충남대학교산학협력단 자전거 대여 시스템 관리 방법, 자전거 대여 시스템의 관리 서버, 및 컴퓨터 판독가능 기록 매체
KR102205215B1 (ko) * 2019-03-11 2021-01-19 한전케이디엔주식회사 딥 러닝 기반 자원 가격 예측 방법
KR20210061560A (ko) * 2019-11-20 2021-05-28 (주)한국해양기상기술 기상기후데이터를 기반으로 한 인공지능 화장품 매출 예측 방법 및 이를 사용한 서버

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116662766A (zh) * 2023-08-01 2023-08-29 浙江大学 基于数据二维重构的风速预测方法及装置、电子设备
CN116662766B (zh) * 2023-08-01 2023-10-03 浙江大学 基于数据二维重构的风速预测方法及装置、电子设备

Similar Documents

Publication Publication Date Title
CN109509030B (zh) 销量预测方法及其模型的训练方法、装置和电子系统
WO2019059717A1 (ko) 기업 분석 기반 연계 서비스 매칭 플랫폼 제공 시스템
JP7319757B2 (ja) データ処理システム及びデータ処理方法
Krishna et al. Sales-forecasting of retail stores using machine learning techniques
US20220277140A1 (en) Artificial intelligence-based legal document analysis system and method
WO2023287073A1 (ko) 매장 운영 예측 시스템 및 그 방법
CN113888235B (zh) 一种销量预测模型的训练方法、销量预测方法及相关装置
CN106327002A (zh) 需求预测方法和需求预测装置
EP3750115A1 (en) Machine learning on a blockchain
WO2021145722A1 (ko) 보조지표를 활용한 주식 및 상품 투자 가격 예측시스템 및 방법
Wood Hourly-averaged solar plus wind power generation for Germany 2016: Long-term prediction, short-term forecasting, data mining and outlier analysis
WO2018174319A1 (ko) 아시아 컨테이너 해상운임지수를 제공하기 위한 해상운임지수 산출 방법 및 그를 이용한 해운정보 중개서비스 방법
WO2023153692A1 (ko) 외부 데이터를 고려한 신용 평가 방법 및 이러한 방법을 수행하는 장치
WO2017116215A1 (ko) 평가지표 자율제안에 의한 연구개발과제 선정 시스템 및 방법
WO2023058973A1 (ko) 인공지능과 기계 학습 기반 해외 공공조달 맞춤형 입찰정보 제공 서비스 시스템 및 방법
CN114723543B (zh) 一种跨境电商的财务档案大数据管理系统及方法
WO2024025220A1 (ko) 온라인 광고 컨텐트 플랫폼을 제공하기 위한 시스템
WO2022173272A1 (ko) 식단 제공 장치 및 방법
CN113706015A (zh) 基于区块链的企业资产整理用数据收集系统
Wahyudi et al. Implementation of Data Mining Prediction Delivery Time Using Linear Regression Algorithm
WO2023153680A1 (ko) Wms의 이커머스 물류 이동 프로세스에서 발생하는 데이터 기반의 신용 평가 방법 및 이러한 방법을 수행하는 장치
CN114203200A (zh) 一种语音质检方法、装置、计算机设备和存储介质
WO2017200195A1 (ko) 판매관리 방법 및 이를 위한 컴퓨터 프로그램 기록매체
WO2023153681A1 (ko) 이커머스 솔루션의 구매, 판매, 재고, 물류, 유통, 정산 과정에서 발생하는 엔드 투 엔드 데이터 기반의 신용 평가 방법 및 이러한 방법을 수행하는 장치
CN106779245B (zh) 基于事件的民航需求预测方法和装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22842335

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE