WO2024005242A1 - Method for processing art work transaction-related data - Google Patents

Method for processing art work transaction-related data Download PDF

Info

Publication number
WO2024005242A1
WO2024005242A1 PCT/KR2022/009501 KR2022009501W WO2024005242A1 WO 2024005242 A1 WO2024005242 A1 WO 2024005242A1 KR 2022009501 W KR2022009501 W KR 2022009501W WO 2024005242 A1 WO2024005242 A1 WO 2024005242A1
Authority
WO
WIPO (PCT)
Prior art keywords
work
data
price
calculating
works
Prior art date
Application number
PCT/KR2022/009501
Other languages
French (fr)
Korean (ko)
Inventor
이은우
이승행
김항주
신규식
최윤정
이유정
최정아
Original Assignee
주식회사 투게더아트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 투게더아트 filed Critical 주식회사 투게더아트
Publication of WO2024005242A1 publication Critical patent/WO2024005242A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0206Price or cost determination based on market factors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/56Information retrieval; Database structures therefor; File system structures therefor of still image data having vectorial format
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0605Supply or demand aggregation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/08Auctions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/40Image enhancement or restoration by the use of histogram techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects

Definitions

  • the present invention relates to a method of processing data related to art trade, and more specifically, to a method of calculating the predicted purchase price of an artwork using machine learning.
  • An object of the present invention relates to a method of processing data related to art trade to calculate the predicted purchase price of an artwork using machine learning.
  • a method of processing data related to art trade that calculates a predicted purchase price of an artwork using machine learning may be provided.
  • FIG 1 is an environmental diagram of an art trade service providing system according to an embodiment.
  • Figure 2 is a block diagram of a server providing an art trading service according to an embodiment.
  • Figure 3 is a flowchart of a method for processing data related to art trade according to an embodiment.
  • Figure 4 is a flowchart of a raw data preprocessing method according to an embodiment.
  • Figure 5 is an example to explain raw data preprocessing according to an embodiment.
  • Figure 6 is a flowchart of a raw data preprocessing method according to another embodiment.
  • Figure 7 is an example to explain raw data preprocessing according to another embodiment.
  • Figure 8 is an example to explain raw data preprocessing according to another embodiment.
  • Figure 9 is a flowchart of a method for selecting and providing works according to an embodiment.
  • Figure 10 is a flowchart of a method for calculating a predicted purchase price and rate of return according to an embodiment.
  • Figure 11 is a flowchart of a method for calculating a predicted purchase price and rate of return according to another embodiment.
  • Figure 12 is a flowchart of a method for recruiting joint buyers according to an embodiment.
  • Figure 13 is a diagram showing an example screen of an art trading service according to an embodiment.
  • a method of processing art trade-related data is a method of processing art trade-related data performed by at least one processor, which includes calculating text similarity and image similarity for raw data containing information about a plurality of works. Generating work data including classification or similar information for the plurality of works through data preprocessing; Obtaining search conditions including at least one of the work name, artist name, image, category, size, price, and production year; providing selection data including information about at least one work based on the work data and the search conditions; And it may include calculating a first predicted purchase price for the first work included in the selection data using machine learning based on first price data including price information over time.
  • generating the work data includes vectorizing text included in the raw data; Calculating text similarity for each item based on the vectorized text; and grouping works for each item based on the text similarity.
  • generating the work data includes extracting feature points of the image included in the raw data; calculating image similarity based on the feature points; and grouping works based on the image similarity.
  • the step of generating the work data includes generating a histogram based on pixel values of the image included in the raw data; calculating image similarity based on the histogram; and grouping works based on the image similarity.
  • the step of generating the work data includes extracting a density distribution based on the pixel value of the image included in the raw data; calculating image similarity based on the density distribution; and grouping works based on the image similarity.
  • the step of providing the selection data may include, if there is no work matching the search condition, selecting a similar work that matches at least one item among the items included in the search condition.
  • calculating the first predicted purchase price includes extracting a first autocorrelation function and a first partial autocorrelation function based on the first price data; setting an autoregressive order, a difference order, and a moving average order based on the first price data, the first autocorrelation function, and the first partial autocorrelation function; Calculating second price data by log-transforming or differentiating the first price data using the autoregressive order, the difference order, and the moving average order; Confirming the normality of the second price data and adjusting the autoregressive order, the difference order, and the moving average order; and calculating the first predicted purchase price for the first work based on the adjusted autoregressive order, difference order, and moving average order.
  • the first price data is price data for a second work that is a similar work that matches at least one item among the items included in the information on the first work. You can.
  • the first price data is price data for a second work that is a similar work that matches at least one item among the items included in the information on the first work. You can.
  • the method may further include calculating a future price trend and rate of return for the first work based on the adjusted autoregressive order, difference order, moving average order, and the first predicted purchase price.
  • the step of calculating a future price trend and rate of return for the first work may be further included based on the calculated hidden layer and the first predicted purchase price.
  • a computer program stored in a computer-readable recording medium may be provided to execute the art trade-related data processing method.
  • an art trade service providing system may include a server 1000 and at least one user terminal 2000.
  • the server 1000 is a central component of the art trade service provision system and can function as an overall control unit of the art trade service provision system.
  • the server 1000 is connected to at least one user terminal 2000 and can transmit and receive data.
  • the server 1000 is a server of an art trading platform and can provide information about art works, information about art auctions, information about joint purchases of art works, etc. to the user terminal 2000.
  • the user terminal 2000 may be a device of a consumer using an art trading platform. Specifically, the user terminal 2000 may be the consumer's mobile device or a server of the consumer's computer.
  • a consumer who is a user of the user terminal 2000 can use the service provided by the server 1000 through the user terminal 2000. Specifically, the user can search for art works, obtain information about art works, purchase art works, receive recommendations for art works, and receive predicted purchase prices for art works through the user terminal 2000.
  • the first terminal and the second terminal may communicate directly, and the first terminal or the second terminal may each receive information from the server 1000.
  • the server 1000 is implemented in the form of a program (e.g., an application) installed on the first terminal or the second terminal, thereby implementing an art trading platform in which only bilateral communication between the first terminal and the second terminal is performed. It can be.
  • the number of servers 1000 is shown as one, but the number is not limited to this, and a plurality of servers may exist according to each role.
  • Figure 2 is a block diagram of a server providing an art trading service according to an embodiment.
  • the server 1000 may include a control unit 1100, a communication unit 1200, an analysis unit 1300, a storage unit 1400, and a display unit 1500.
  • FIG. 2 shows five components included in the server 1000, but the illustrated components are not essential, and the server 1000 may have more or fewer components. Additionally, each component of the server 1000 may be physically included in one server, or may be a distributed server distributed for each function.
  • the control unit 1100 may oversee the operation of the server 1000. Specifically, the control unit 1100 includes at least one processor and can execute the operations of each department by sending control commands to the communication unit 1200, analysis unit 1300, storage unit 1400, and display unit 1500. there is.
  • the control unit 1100 may be a program instruction executed by a computer device.
  • the operation of the server 1000 may be interpreted as being performed under the control of the control unit 1100. Additionally, in the specification of the present invention, the performance of the control unit 1100 may be described with the processor as the main agent.
  • the communication unit 1200 can connect the server 1000 and an external device to communicate. That is, the communication unit 1200 can transmit and receive data with an external device. For example, the communication unit 1200 may exchange data with the user terminal 2000.
  • the communication unit 1200 may be a program instruction executed by a computer device.
  • the communication unit 1200 may receive information about a work of art from the user terminal 2000. Additionally, the communication unit 1200 may receive information about the artwork selected or selected by the user from the user terminal 2000.
  • the communication unit 1200 may receive data including search conditions entered by the user in a search box to search for a work of art from the user terminal 2000. Additionally, the communication unit 1200 may receive user information about the user's gender, age, artist of interest, favorite painting style, taste, etc. from the user terminal 2000.
  • the communication unit 1200 may be a communication module that supports at least one of a wired communication method and a wireless communication method.
  • the communication unit 1200 may acquire data from an external device using communication methods such as Bluetooth, Zigbee, BLE (Bluetooth Low Energy), and RFID.
  • the analysis unit 1300 may perform calculations such as searching for a work of art or calculating an expected purchase price of a work of art based on data received from the user terminal 2000. Additionally, the analysis unit 1300 can predict the sale price and sale time according to the expected rate of return of the artwork, based on price data including information on the price of the artwork.
  • the analysis unit 1100 may be a program instruction executed by a computer device.
  • the analysis unit 1300 may perform each step included in the art transaction-related data processing method shown in FIG. 3. Details about this will be described later.
  • the storage unit 1400 can store various data and programs necessary for the server 1000 to operate.
  • the storage unit 1400 may store information acquired by the server 1000.
  • the storage unit 1400 may be a program instruction executed by a computer device.
  • the storage unit 1400 may store data received from the user terminal 2000 acquired by the communication unit 1200. Specifically, the storage unit 1400 may store user data including user information and preferences. Additionally, the storage unit 1400 may store information about the user's search history and purchase history based on the user's search conditions and the user's purchase history.
  • the storage unit 1400 may store data including past art transaction details necessary for the server 1000 to provide services.
  • the past art transaction history data stored in the storage unit 1400 may be updated by information received by the communication unit 1200 or continuously added/modified by the server 1000 itself.
  • the storage unit 1400 can store data temporarily or semi-permanently.
  • Examples of the storage unit 1400 include a hard disk drive (HDD), solid state drive (SSD), flash memory, read-only memory (ROM), and random access memory (RAM). Or there may be cloud storage, etc.
  • the storage unit 1400 is not limited to this and may be implemented with various modules for storing data.
  • the display unit 1500 can output visual information.
  • the display unit 1500 may be connected to a mobile application display or a computer display to output visual information related to an art trading service.
  • the display unit 1500 may be a program instruction executed by a computer device.
  • the display unit 1500 may be connected to the display of the user terminal 2000 and output information about the work of art and analysis of the work of art. Additionally, the display unit 1500 may output a screen containing information about the joint purchase of artwork.
  • Figure 3 is a flowchart of a method for processing data related to art trade according to an embodiment.
  • a method of processing data related to art trade includes preprocessing raw data (S100), obtaining search conditions entered by the user to search for art (S200), and applying the search conditions to the search conditions.
  • a step of selecting works based on the work and providing information about the work (S300), a step of calculating the predicted purchase price and rate of return for the selected works (S400), and a step of recruiting joint buyers for joint purchase of art works (S500) ) may include.
  • the raw data preprocessing step (S100) may be a step of organizing transaction data (raw data) of past artworks according to certain standards. At this time, raw data may be offline/online transaction details or auction details for multiple works of art.
  • Transaction details or auction details for multiple works of art may be sorted or organized differently for each business partner. For example, a specific author's name or work name may be written in English or in Korean. Therefore, a preprocessing step to organize raw data according to certain standards may be necessary.
  • Preprocessing of raw data may be based on text or images of the work.
  • the text may include at least one of the artist's name for the work, the artist's year of birth, work name, production year, category, size (horizontal, vertical), estimated lower price, estimated upper price, transaction/successful bid, transaction date, and customer.
  • the step of acquiring the search conditions entered by the user to search for a work of art may be a step of obtaining a search keyword entered by the user into the user terminal 2000.
  • Search conditions may be text-based, image-based, or include both text and images.
  • the search condition must be at least one of the following: artist name, artist's year of birth, work name, production year, category, size (width, height), estimated lower price, estimated upper price, transaction price/successful bid, transaction date, and customer. It can be included.
  • the search condition is an image
  • the search condition may be a work image or may include at least part of the work image.
  • the step of selecting works based on search conditions and providing information about the works is a step of selecting works that match the search conditions obtained in step S200 and providing information about the works to the user about the selected works. It can be.
  • step S300 if there is a work matching the search condition, the processor may provide information about the matching work to the user. However, if there are no works matching the search conditions, the processor may select works similar to the search conditions and provide information about the selected works to the user.
  • the processor selects at least one work that matches the search conditions from the work data generated by preprocessing the raw data and provides it to the user. Information can be provided to. However, if there is no work matching the search conditions in the work data, the processor may select at least one work similar to the search conditions and provide information to the user.
  • the step of calculating the predicted purchase price and rate of return for the selected works is a step of calculating the predicted purchase price and rate of return for the selected works using machine learning based on price data including past price information. You can. At this time, if there is past price data for the selected work, the price data is the price data for the selected work. However, if there is no past price data for the selected work, the price data may be price data for works similar to the selected work.
  • step S400 the processor can calculate the predicted purchase price of the work through time-series analysis using machine learning.
  • the rate of return and sale period over time can be predicted and information provided to the user.
  • the step of recruiting joint buyers for joint purchase of an artwork may be a step performed in the process of a user purchasing a work after step S400. Specifically, if the price of the work is greater than the user's budget or if the user wishes to make a joint purchase, the processor may perform step S500.
  • the step of recruiting joint buyers may be a step of recruiting other users who want to jointly purchase the work selected by the user.
  • the processor may advertise information about the work using a banner or the like on an art trading platform.
  • other users similar to the user's work tastes may be selected and information about the work may be provided to the other users.
  • Figure 4 is a flowchart of a raw data preprocessing method according to an embodiment. Specifically, Figure 4 is a flowchart of a method for preprocessing raw data based on text.
  • the raw data preprocessing method includes a step of vectorizing text (S110), a step of calculating text similarity (S120), and a step of grouping works based on text similarity (S130). can do.
  • the step of vectorizing the text (S110) is the text included in the raw data: author's name, author's year of birth, work name, production year, category, size (horizontal, vertical), estimated lower price, estimated upper price, transaction price/successful bid, transaction date, and customer. This may be a step of vectorizing at least one of the steps. Before the step of vectorizing the text (S110) is performed, morphological analysis of the text may be performed.
  • the processor can generate a text vector corresponding to the text by adding up all one-hot vectors corresponding to each of the characters included in the raw data.
  • the processor can use Word2Vec to generate a text vector corresponding to the text.
  • the processor can generate a text vector included in each item of raw data (author's name, work title, production year, etc.).
  • the step of calculating text similarity may be a step of calculating text similarity based on the text vector generated in step S110.
  • the processor can calculate the similarity between texts based on the cosine similarity or singular value decomposition of the vector.
  • the processor may calculate the similarity between texts included in each item. At this time, by calculating the text similarity, the processor can confirm that the author's name, work title, etc. written differently due to spacing, capitalization, etc. are the same text.
  • the step of grouping works based on text similarity may be a step of classifying works corresponding to texts whose text similarity is above a certain value into one group based on the text similarity calculated in step S120.
  • the text similarity between the first author's name and the second author's name may be 90% or more.
  • the processor may determine that the first author name and the second author name are author names for the same author, and classify the first work corresponding to the first author name and the second work corresponding to the second author name into the same group.
  • the reason why the processor groups works may be to select similar works when no works match the search conditions, or to recruit joint buyers.
  • the processor may provide the user with information about the works of the group classified as works of the first author. Additionally, in order to recruit joint buyers for the first work, the processor may select users who have a history of purchasing works by the first author of the first work.
  • the processor can group works with text similarity above a certain value based on the text. At this time, the processor can group the works by item (author's name, work title, production year, etc.).
  • Figure 5 is an example to explain raw data preprocessing according to an embodiment.
  • Figure 5 you can check the work data created by the processor preprocessing the raw data according to the items (transaction date, author, author's year of birth, title, production year, etc.).
  • Figure 5 may show data for a group classified as 'writer'. However, in Figure 5 as well, the works can be reclassified/regrouped again by production year, size, or business partner.
  • the processor can collect and organize transaction data scattered offline/online through data preprocessing to generate work data including classification or similar information for a plurality of works.
  • similar information may include information on the group to which the work belongs.
  • similar information may include information about a group in which works with similar items (author, work name, production year, etc.) are classified.
  • Figure 6 is a flowchart of a raw data preprocessing method according to another embodiment.
  • Figure 6 is a flowchart of a method for preprocessing raw data based on the image of the work.
  • the raw data preprocessing method includes extracting feature points, histograms, or density distributions of images (S140), calculating image similarity (S150), and selecting works based on the image similarity.
  • a grouping step (S160) may be included.
  • the step of extracting feature points, histograms, or density distributions of an image may be a step of analyzing pixel values of the image.
  • the processor can extract edges that can be characteristic points of the image based on differences in pixel values of the image. Additionally, the processor can generate a histogram using pixel values of the image. Additionally, the processor may extract a density distribution based on the pixel value of the image and the density of the pixel value.
  • the processor may extract the edge of the image based on the difference in pixel values between neighboring pixels of the image. Additionally, the processor can generate a histogram according to the brightness of the image or a histogram according to RGB. Additionally, the processor can generate a density distribution based on the feature points, corners, and colors of the image using the mean-shift algorithm.
  • the step of calculating image similarity may be a step of calculating the similarity between images based on the feature points, histogram, or density distribution extracted in step S140.
  • the processor may calculate the image similarity between the first image and the second image based on the feature points extracted in step S140. Specifically, the processor may compare a feature point of a first image at a specific location with a pixel of the specific location at a second location, and calculate image similarity by contrasting the feature points. Additionally, the processor may calculate image similarity based on the distance between the first and second feature points included in the first image and the distance between the third and fourth feature points included in the second image.
  • the processor may calculate the image similarity between the first image and the second image based on the histogram generated in step S140. Specifically, the processor may calculate image similarity by comparing the distribution and value of a histogram generated based on brightness and RGB in the first image and the second image. At this time, the processor can compensate for the fact that the histogram may be unrelated to the pixel location by considering all histograms generated based on brightness, R, G, and B.
  • the processor may calculate the image similarity between the first image and the second image based on the density distribution generated in step S140. Specifically, the processor may compare the density distribution of the feature points of the first image with the density distribution of the feature points of the second image. Additionally, the processor may compare the color-based density distribution of the first image with the color-based density distribution of the second image.
  • the processor may calculate image similarity based on each of the feature points, histogram, and density distribution, or may calculate image similarity based on a combination of two or more of the feature point, histogram, and density distribution.
  • the step of grouping works based on image similarity may be a step of classifying images with image similarity above a certain value into one group based on the image similarity calculated in step S150.
  • the image similarity between the first image and the second image may be 90% or more.
  • the processor may determine that the first image and the second image are images of the same work, and classify the first work corresponding to the first image and the second work corresponding to the second image into the same group.
  • the processor can group works with image similarity above a certain value based on the image. At this time, the processor can group the works by item (author's name, work title, production year, etc.).
  • Figure 7 is an example to explain raw data preprocessing according to another embodiment.
  • Figure 7 is an example of a method for calculating image similarity based on feature points of the image.
  • the processor can extract feature points 110 of the two images.
  • the processor can determine the similarity of the images by comparing the extracted feature points.
  • a work 140 that is similar to the sample work 120 and a work 130 that is dissimilar may be selected based on feature point extraction.
  • Figure 8 is an example to explain raw data preprocessing according to another embodiment.
  • Figure 8 is an example of a method for calculating image similarity based on a histogram.
  • the processor may generate a brightness histogram 220, an R histogram 230, a G histogram 240, and a B histogram 250, respectively, of the sample image 210.
  • the processor may select an image similar to the sample image 210 based on the plurality of histograms 220, 230, 240, and 250.
  • Figure 9 is a flowchart of a method for selecting and providing works according to an embodiment.
  • Figure 9 is a flowchart of a method for recommending similar works when there are no works that match the search conditions.
  • a method of selecting and providing works includes the steps of distinguishing items included in a search condition (S310) and selecting a group that matches the first search condition for the first item. (S320), a step of selecting a work that matches the second search condition for the second item among the selected group (S330), and a step of providing information about the selected work (S340).
  • the step S310 of classifying items included in the search condition may be a step of classifying the items of the search condition in order to search for groups classified in step S130 or step S160.
  • the search conditions are Author - Alena Shymchonak, Production Year - 2020, Size (Width) - 40 or more, Size (Height) - 60 or more, Category - Oil
  • the processor has the items necessary to select the works. You can check the author, production year, size (horizontal), size (vertical), and category.
  • the step of selecting a group that matches the first search condition for the first item may be a step of confirming a group that matches the search condition for the item classified in step S310.
  • the processor may select a group classified by the author 'Alena Shymchonak'.
  • the step (S330) of selecting works that match the second search conditions for the second item among the selected groups selects works that match the search conditions for the second item from among the works included in the group selected in step S320. This may be a selection stage.
  • the processor can select works of the category 'Oil'.
  • the processor may select works with a production year of 2020 from a group classified by author 'Alena Shymchonak'.
  • the processor provides the artist's name, year of birth, work name, production year, category, size (width, height), estimated lower limit price, and estimated upper limit price for the work selected in step S330.
  • This may be a step of transmitting data including at least one of the predicted purchase price, rate of return, transaction price/successful bid, transaction date, and customer to the user terminal 2000.
  • the processor provides the user with information about the matched work, or if there is no matching work, the processor provides the user with information about similar works that satisfy part of the search conditions. You can (recommend works).
  • Figure 10 is a flowchart of a method for calculating a predicted purchase price and rate of return according to an embodiment.
  • Figure 10 is a flowchart of a method for calculating the predicted purchase price and rate of return by machine learning using the ARIMA model.
  • the method of calculating the predicted purchase price and rate of return includes obtaining and analyzing price data (S411), extracting an autocorrelation function and a partial autocorrelation function (S412), and autoregressive Setting the order, difference order, and moving average order (S413), performing log transformation or difference (S414), adjusting the autoregressive order, difference order, and moving average order (S415), calculating the predicted purchase price It may include a step (S416) and a step of calculating future price trends and rates of return (S417).
  • the step of acquiring and analyzing price data may be a step of acquiring price data including a time-series price change trend based on past transaction history for the work and pre-processing and/or analyzing it.
  • past price data of the first work can be analyzed.
  • the predicted purchase price and rate of return for the first work can be calculated using past price data for the second work similar to the first work. For example, if there is no historical price data for the first work by artist A, the processor can use historical price data for the second work produced in the same year as the first work by artist A.
  • the step of extracting the autocorrelation function and the partial autocorrelation function may be a step of extracting a function for using the ARIMA (Autoregressive Integrated Moving Average) model based on the price data obtained in step S411.
  • ARIMA Automatic Integrated Moving Average
  • AutoCorrelation Function refers to a series of autocorrelation according to time lag, and can be calculated using [Equation 1] below.
  • the processor can determine the normality of price data using the autocorrelation function. At this time, stationary may mean that the average and variance are constant over time. Because non-stationary data is difficult to analyze, the processor may perform log transformation and/or differencing to ensure that the price data is stationary.
  • Partial AutoCorrelation Function refers to a series of partial autocorrelations according to time lag, and can be calculated using [Equation 2] and [Equation 3] below.
  • the processor can determine only the correlation between the first price and the second price by removing the influence of prices at other times between the first price at the first time and the second price at the second time. You can.
  • the step of setting the autoregressive order, the difference order, and the moving average order may be a step of setting parameters to perform log transformation or difference.
  • the autoregressive order (p) refers to the number of time lags
  • the difference order (d) refers to the number of times data has been subtracted from the past value
  • the moving average order (q) refers to the order of the moving average model. You can.
  • the difference order can be determined by the degree of normality of the price data.
  • the processor log-transforms the price data obtained in step S414 based on the set autoregressive order, difference order, and moving average order, or difference ( differential), or it may be a step that performs both log transformation and difference.
  • Price data that has been log-transformed or differenced may exhibit stationarity.
  • the processor can confirm normality by recalculating the autocorrelation function and partial autocorrelation function of the price data on which log transformation or difference has been performed.
  • the step (S415) of adjusting the autoregressive order, difference order, and moving average order is performed when the stationarity of the price data on which the log transformation or difference was performed in step S414 is not confirmed, the parameters autoregressive order, difference order, and moving average.
  • This may be a step of setting the order to be different from the value in step S413. For example, if the normality of the price data is not confirmed in step S414, the processor may increase the difference order and increase the number of times log transformation or difference is performed.
  • the step of calculating the predicted purchase price may be a step of calculating the predicted purchase price of the work using converted or differentiated price data when the normality of the price data is confirmed in step S414 and/or step S415.
  • the processor may input price data into a machine learning model modeled by a regression order, difference order, and moving average order with adjusted values, and output a predicted purchase price.
  • the step of calculating the future price trend and rate of return may be a step of calculating the predicted purchase price for a future point in time and the rate of return at that point based on the machine learning model used in step S416.
  • the processor may reflect the predicted purchase price output in step S416 back into the model, remodel it, and then predict the purchase price and rate of return at a future point in time.
  • the processor may set a new autoregressive order, difference order, and moving average order for the normality of the new price data including the predicted purchase price output in step S416.
  • Figure 11 is a flowchart of a method for calculating a predicted purchase price and rate of return according to another embodiment.
  • Figure 11 is a flowchart of a method for calculating the predicted purchase price and rate of return by machine learning using the GRU model.
  • a method of calculating the predicted purchase price and rate of return includes obtaining and analyzing price data (S421), inputting the price data into a forget gate and an update gate (S422), and forgetting.
  • a step of calculating a candidate group based on the output result of the gate (S423), a step of calculating a hidden layer based on the output result of the update gate and the calculated candidate group (S424), and a step of calculating a predicted purchase price based on the calculated hidden layer It may include steps S425) and calculating future price trends and rates of return (S426).
  • the step of acquiring and analyzing price data (S421), similar to step S411 of FIG. 10, is a step of acquiring price data including a time-series price change trend based on past transaction history for the work and pre-processing and/or analyzing it. You can. However, if there is no past price data for a specific work, past price data for works similar to the specific work may be used.
  • the step of inputting price data into the forget gate and the update gate is the step of inputting the price data into the forget gate to initialize a certain portion of the price data and inputting it into the update gate to determine the reflection ratio of past price information and current price information. It can be.
  • the processor may initialize a certain portion of the price data by multiplying the previous hidden layer by a value of 0 or 1 using the output of the sigmoid function in the forget gate. Additionally, the processor may determine the ratio of past and present information reflection by multiplying the output of the sigmoid by the current price information and multiplying the past price information by 1 minus the output of the sigmoid in the update gate.
  • the step of calculating a candidate group based on the output result of the forgetting gate may be a step of calculating a candidate group of the predicted purchase price using price data partially initialized by the forgetting gate.
  • the processor calculates the candidate group by using the output result of the forgetting gate rather than using the past hidden layer information as is.
  • the step of calculating a hidden layer based on the output result of the update gate and the calculated candidate group may be a step of calculating a hidden layer based on the price data considering the past and present reflection ratios and the candidate group calculated in step S423. .
  • the step of calculating the predicted purchase price based on the calculated hidden layer may be a step of inputting price data into a machine learning model modeled with the hidden layer calculated in step S424 and outputting the predicted purchase price.
  • the step of calculating the future price trend and rate of return may be a step of calculating the predicted purchase price for a future point in time and the rate of return at that point in time, based on the machine learning model used in step S425.
  • the processor may reflect the predicted purchase price output in step S425 back into the model, remodel it, and then predict the purchase price and rate of return at a future point in time.
  • the processor may recalculate the candidate group and hidden layer calculated in steps S424 and S425 in order to use new price data including the predicted purchase price output in step S425 for remodeling.
  • the processor can calculate the predicted purchase price using both the ARIMA model of FIG. 10 and the GRU model of FIG. 11 and then measure the accuracy of the two models. At this time, accuracy can be measured by confirmation of past data, expert opinion, actual transaction or auction price, etc.
  • the processor can provide the user with a predicted purchase price output from the model with higher accuracy among the two models.
  • Figure 12 is a flowchart of a method for recruiting joint buyers according to an embodiment.
  • a method of recruiting joint buyers may include extracting users (S510) and providing information related to joint purchasing to the extracted users (S520).
  • the user extraction step (S510) may be a step of extracting users who are likely to have a purchase intention for a specific work. Specifically, when the first user enters the first search condition and selects to purchase the first work, the processor may extract a second user who has entered the first search condition in the past. Alternatively, the processor may extract a second user who has previously entered a search condition in which the detailed search condition for at least one item among the items included in the first search condition is the same. Alternatively, in addition to searches, the processor can also extract users with purchase/auction history.
  • the processor will use the same search conditions as the above search conditions. You can extract users who have searched in the past.
  • the processor can extract users who have searched in the past for the following search terms: Author - Alena Shymchonak, Production Year - 2020. That is, the processor may extract a second user who has previously entered a second search condition that matches only part of the search condition searched by the first user.
  • the processor may extract other users matching part of the user information based on the user information (including gender, age, artist of interest, favorite painting style, taste, etc.) acquired by the communication unit 1200. It may be possible.
  • the step of providing information related to a group purchase to the extracted users may be a step of providing information suggesting a group purchase to the users extracted in step S510.
  • the processor may transmit data containing information about the predicted purchase price, rate of return, sale period, and group purchase solicitation status of the work to the extracted user's terminal.
  • the processor can extract users who have similar tastes or are likely to purchase the specific work, and provide data for joint purchase to the extracted users. there is.
  • Figure 13 is a diagram showing an example screen of an art trading service according to an embodiment.
  • the art trading platform of the present invention can provide not only information about the work (production year, category, size, etc.), but also future price trends, predicted purchase price, and rate of return when searching for a work or artist.
  • Information provided by the platform can be provided to users in the form of tables or graphs.
  • the method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded on a computer-readable medium.
  • the computer-readable medium may include program instructions, data files, data structures, etc., singly or in combination.
  • Program instructions recorded on the medium may be specially designed and configured for the embodiment or may be known and available to those skilled in the art of computer software.
  • Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floptical disks.
  • program instructions include machine language code, such as that produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter, etc.
  • the hardware devices described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.

Abstract

A method for processing art work transaction-related data of the present invention, may comprise the steps of: generating work data including classification or similarity information for a plurality of works through data preprocessing of calculating text similarity and image similarity of raw data including information about the plurality of works; obtaining a search condition including at least one of a work name, an author name, an image, a category, a size, a price, and a production year; providing selection data including information about at least one work, on the basis of the work data and the search condition; and calculating a first predicted purchase price for a first work included in the selection data, by using machine learning on the basis of first price data including price information according to time.

Description

미술품 거래 관련 데이터 처리 방법How we process data related to art transactions
본 발명은 미술품 거래 관련 데이터 처리 방법에 관한 것으로, 보다 상세하게는, 머신 러닝을 이용하여 작품의 예측 구매가를 산출하는 방법에 관한 것이다.The present invention relates to a method of processing data related to art trade, and more specifically, to a method of calculating the predicted purchase price of an artwork using machine learning.
최근, 미술품에 대한 투자 관심도가 높아지면서, 미술품 거래 또는 미술품 경매에 대한 관심도 증가하였다. 또한, 미술품을 조각 단위로 나누어, 다수의 인원이 작품을 소유하는 거래 형태도 빈번해지고 있다. 최근에는 미술품 거래 또는 경매에 '온라인 경매'플랫폼을 적용되어, 온라인 상의 미술품 거래 서비스도 제공되고 있다.Recently, as interest in investing in art has increased, interest in art trading or art auctions has also increased. In addition, transactions in which artworks are divided into pieces and owned by multiple people are becoming more frequent. Recently, the 'online auction' platform has been applied to art trading or auctions, and online art trading services are also being provided.
그러나, 미술품 거래 데이터가 온라인 및 오프라인상에 혼재되어 있어, 가치가 얼마인지, 얼마만큼의 구매가가 적당한지에 대해 개인적으로 알기에는 쉽지 않다. 또한, 현재 구매가로 미래에 어느 정도의 수익률을 낼 수 있는지, 매각 시기는 언제가 적당한지에 대해서도 개인적으로 알기가 어렵다. 따라서, 혼재되어 있는 거래 데이터를 수집하여 정리 및 분석을 통해 예측 구매가 및 수익률을 제공하는 플랫폼이 필요하다.However, because art transaction data is mixed online and offline, it is not easy to personally know how much it is worth or how much is an appropriate purchase price. Additionally, it is difficult to personally know how much profit can be made in the future at the current purchase price and when is the right time to sell. Therefore, a platform is needed that collects mixed transaction data, organizes and analyzes it, and provides predicted purchase prices and returns.
본 발명의 일 과제는 머신 러닝을 이용하여 작품의 예측 구매가를 산출하는 미술품 거래 관련 데이터 처리 방법에 관한 것이다.An object of the present invention relates to a method of processing data related to art trade to calculate the predicted purchase price of an artwork using machine learning.
본 발명의 일 실시예에 따르면 머신 러닝을 이용하여 작품의 예측 구매가를 산출하는 미술품 거래 관련 데이터 처리 방법이 제공될 수 있다.According to an embodiment of the present invention, a method of processing data related to art trade that calculates a predicted purchase price of an artwork using machine learning may be provided.
도 1은 일 실시예에 따른 미술품 거래 서비스 제공 시스템의 환경도이다.1 is an environmental diagram of an art trade service providing system according to an embodiment.
도 2는 일 실시예에 따른 미술 거래 서비스를 제공하는 서버의 블록도이다.Figure 2 is a block diagram of a server providing an art trading service according to an embodiment.
도 3은 일 실시예에 따른 미술품 거래 관련 데이터 처리 방법의 순서도이다.Figure 3 is a flowchart of a method for processing data related to art trade according to an embodiment.
도 4는 일 실시예에 따른 로데이터 전처리 방법의 순서도이다.Figure 4 is a flowchart of a raw data preprocessing method according to an embodiment.
도 5는 일 실시예에 따른 로데이터 전처리를 설명하기 위한 예시이다.Figure 5 is an example to explain raw data preprocessing according to an embodiment.
도 6은 다른 일 실시예에 따른 로데이터 전처리 방법의 순서도이다.Figure 6 is a flowchart of a raw data preprocessing method according to another embodiment.
도 7은 다른 일 실시예에 따른 로데이터 전처리를 설명하기 위한 예시이다.Figure 7 is an example to explain raw data preprocessing according to another embodiment.
도 8은 또 다른 일 실시예에 따른 로데이터 전처리를 설명하기 위한 예시이다.Figure 8 is an example to explain raw data preprocessing according to another embodiment.
도 9는 일 실시예에 따른 작품을 선별 및 제공하는 방법의 순서도이다.Figure 9 is a flowchart of a method for selecting and providing works according to an embodiment.
도 10은 일 실시예에 따른 예측 구매가 및 수익률을 산출하는 방법의 순서도이다.Figure 10 is a flowchart of a method for calculating a predicted purchase price and rate of return according to an embodiment.
도 11은 다른 일 실시예에 따른 예측 구매가 및 수익률을 산출하는 방법의 순서도이다.Figure 11 is a flowchart of a method for calculating a predicted purchase price and rate of return according to another embodiment.
도 12는 일 실시예에 따른 공동 구매자를 모집하는 방법의 순서도이다.Figure 12 is a flowchart of a method for recruiting joint buyers according to an embodiment.
도 13은 일 실시예에 따른 미술품 거래 서비스의 화면 예시를 나타낸 도면이다.Figure 13 is a diagram showing an example screen of an art trading service according to an embodiment.
일 실시예에 따른 미술품 거래 관련 데이터 처리 방법은 적어도 하나 이상의 프로세서에 의해 수행되는 미술품 거래 관련 데이터 처리 방법에 있어서, 복수의 작품에 대한 정보를 포함하는 로데이터에 대한 텍스트 유사도 및 이미지 유사도를 산출하는 데이터 전처리를 통해, 상기 복수의 작품에 대한 분류 또는 유사 정보를 포함하는 작품 데이터를 생성하는 단계; 작품명, 작가명, 이미지, 카테고리, 사이즈, 가격 및 제작년도 중 적어도 하나 이상을 포함하는 검색 조건을 획득하는 단계; 상기 작품 데이터 및 상기 검색 조건에 기초하여, 적어도 하나 이상의 작품에 대한 정보를 포함하는 선별 데이터를 제공하는 단계; 및 시간에 따른 가격 정보를 포함하는 제1 가격 데이터를 기반으로 머신 러닝을 이용하여 상기 선별 데이터에 포함된 제1 작품에 대한 제1 예측 구매가를 산출하는 단계를 포함할 수 있다.A method of processing art trade-related data according to an embodiment is a method of processing art trade-related data performed by at least one processor, which includes calculating text similarity and image similarity for raw data containing information about a plurality of works. Generating work data including classification or similar information for the plurality of works through data preprocessing; Obtaining search conditions including at least one of the work name, artist name, image, category, size, price, and production year; providing selection data including information about at least one work based on the work data and the search conditions; And it may include calculating a first predicted purchase price for the first work included in the selection data using machine learning based on first price data including price information over time.
여기서, 상기 작품 데이터를 생성하는 단계는, 상기 로데이터에 포함된 텍스트를 벡터화하는 단계; 벡터화된 텍스트에 기초하여 항목마다 텍스트 유사도를 산출하는 단계; 및 상기 텍스트 유사도에 기초하여 항목마다 작품들을 그룹화하는 단계를 포함할 수 있다.Here, generating the work data includes vectorizing text included in the raw data; Calculating text similarity for each item based on the vectorized text; and grouping works for each item based on the text similarity.
여기서, 상기 작품 데이터를 생성하는 단계는, 상기 로데이터에 포함된 이미지의 특징점을 추출하는 단계; 상기 특징점에 기초하여 이미지 유사도를 산출하는 단계; 및 상기 이미지 유사도에 기초하여 작품들을 그룹화하는 단계를 포함할 수 있다.Here, generating the work data includes extracting feature points of the image included in the raw data; calculating image similarity based on the feature points; and grouping works based on the image similarity.
여기서, 상기 작품 데이터를 생성하는 단계는, 상기 로데이터에 포함된 이미지의 픽셀값을 기초로 히스토그램을 생성하는 단계; 상기 히스토그램에 기초하여 이미지 유사도를 산출하는 단계; 및 상기 이미지 유사도에 기초하여 작품들을 그룹화하는 단계를 포함할 수 있다.Here, the step of generating the work data includes generating a histogram based on pixel values of the image included in the raw data; calculating image similarity based on the histogram; and grouping works based on the image similarity.
여기서, 상기 작품 데이터를 생성하는 단계는, 상기 로데이터에 포함된 이미지의 픽셀값을 기초로 밀도 분포를 추출하는 단계; 상기 밀도 분포에 기초하여 이미지 유사도를 산출하는 단계; 및 상기 이미지 유사도에 기초하여 작품들을 그룹화하는 단계를 포함할 수 있다.Here, the step of generating the work data includes extracting a density distribution based on the pixel value of the image included in the raw data; calculating image similarity based on the density distribution; and grouping works based on the image similarity.
여기서, 상기 선별 데이터를 제공하는 단계는, 상기 검색 조건에 매칭되는 작품이 없는 경우, 상기 검색 조건에 포함된 항목들 중 적어도 하나 이상의 항목이 매칭되는 유사한 작품을 선별하는 단계를 포함할 수 있다.Here, the step of providing the selection data may include, if there is no work matching the search condition, selecting a similar work that matches at least one item among the items included in the search condition.
여기서, 상기 제1 예측 구매가를 산출하는 단계는, 상기 제1 가격 데이터에 기초하여 제1 자기상관함수 및 제1 편자기상관함수를 추출하는 단계; 상기 제1 가격 데이터, 상기 제1 자기상관함수 및 상기 제1 편자기상관함수에 기초하여, 자기회귀 차수, 차분 차수 및 이동평균 차수를 설정하는 단계; 상기 자기회귀 차수, 상기 차분 차수 및 상기 이동평균 차수를 이용하여 상기 제1 가격 데이터를 로그 변환 또는 차분하여 제2 가격 데이터를 산출하는 단계; 상기 제2 가격 데이터의 정상성을 확인하여, 상기 자기회귀 차수, 상기 차분 차수 및 상기 이동평균 차수를 조정하는 단계; 및 조정된 자기회귀 차수, 차분 차수 및 이동평균 차수에 기초하여, 상기 제1 작품에 대한 상기 제1 예측 구매가를 산출하는 단계를 포함할 수 있다.Here, calculating the first predicted purchase price includes extracting a first autocorrelation function and a first partial autocorrelation function based on the first price data; setting an autoregressive order, a difference order, and a moving average order based on the first price data, the first autocorrelation function, and the first partial autocorrelation function; Calculating second price data by log-transforming or differentiating the first price data using the autoregressive order, the difference order, and the moving average order; Confirming the normality of the second price data and adjusting the autoregressive order, the difference order, and the moving average order; and calculating the first predicted purchase price for the first work based on the adjusted autoregressive order, difference order, and moving average order.
여기서, 상기 제1 작품에 대한 가격 데이터가 없는 경우, 상기 제1 가격 데이터는 상기 제1 작품의 정보에 포함된 항목들 중 적어도 하나 이상의 항목이 매칭되는 유사한 작품인 제2 작품에 대한 가격 데이터일 수 있다.Here, when there is no price data for the first work, the first price data is price data for a second work that is a similar work that matches at least one item among the items included in the information on the first work. You can.
여기서, 상기 제1 가격 데이터를 망각 게이트 및 업데이트 게이트에 입력시키는 단계; 상기 망각 게이트의 출력 결과에 기초하여 후보군을 산출하는 단계; 상기 업데이트 게이트의 출력 결과 및 산출된 후보군에 기초하여 은닉층을 산출하는 단계; 및 산출된 은닉층에 기초하여, 상기 제1 작품에 대한 상기 제1 예측 구매가를 산출하는 단계를 포함할 수 있다.Here, inputting the first price data into a forget gate and an update gate; calculating a candidate group based on the output result of the forgetting gate; calculating a hidden layer based on the output result of the update gate and the calculated candidate group; and calculating the first predicted purchase price for the first work based on the calculated hidden layer.
여기서, 상기 제1 작품에 대한 가격 데이터가 없는 경우, 상기 제1 가격 데이터는 상기 제1 작품의 정보에 포함된 항목들 중 적어도 하나 이상의 항목이 매칭되는 유사한 작품인 제2 작품에 대한 가격 데이터일 수 있다.Here, when there is no price data for the first work, the first price data is price data for a second work that is a similar work that matches at least one item among the items included in the information on the first work. You can.
여기서, 과거에 상기 검색 조건을 입력했던 사용자 또는 상기 검색 조건에 포함된 항목들 중 적어도 하나 이상의 항목이 매칭되는 유사한 작품을 구매한 이력이 있는 사용자를 추출하는 단계; 및 상기 제1 작품의 공동 구매를 위해, 상기 사용자의 단말기에 상기 제1 작품에 대한 정보, 상기 제1 예측 구매가 및 공동 구매자 모집 현황에 대한 정보를 포함하는 공동 구매 제안 데이터를 전송하는 단계를 포함할 수 있다.Here, extracting a user who has entered the search condition in the past or a user who has a history of purchasing a similar work that matches at least one item among the items included in the search condition; And for group purchase of the first work, transmitting group purchase proposal data including information about the first work, the first predicted purchase price, and information on the joint buyer recruitment status to the user's terminal. It can be included.
여기서, 조정된 자기회귀 차수, 차분 차수, 이동평균 차수 및 상기 제1 예측 구매가에 기초하여, 상기 제1 작품에 대한 미래 가격 추이 및 수익률을 산출하는 단계를 더 포함할 수 있다.Here, the method may further include calculating a future price trend and rate of return for the first work based on the adjusted autoregressive order, difference order, moving average order, and the first predicted purchase price.
여기서, 산출된 은닉층 및 상기 제1 예측 구매가에 기초하여, 상기 제1 작품에 대한 미래 가격 추이 및 수익률을 산출하는 단계를 더 포함할 수 있다.Here, the step of calculating a future price trend and rate of return for the first work may be further included based on the calculated hidden layer and the first predicted purchase price.
여기서, 상기 미술품 거래 관련 데이터 처리 방법을 실행시키도록 컴퓨터로 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램이 제공될 수 있다.Here, a computer program stored in a computer-readable recording medium may be provided to execute the art trade-related data processing method.
본 명세서에 기재된 실시예는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 본 발명의 사상을 명확히 설명하기 위한 것이므로, 본 발명이 본 명세서에 기재된 실시예에 한정되는 것은 아니며, 본 발명의 범위는 본 발명의 사상을 벗어나지 아니하는 수정예 또는 변형예를 포함하는 것으로 해석되어야 한다.The embodiments described in this specification are intended to clearly explain the idea of the present invention to those skilled in the art to which the present invention pertains, and the present invention is not limited to the embodiments described in this specification, and the present invention is not limited to the embodiments described in this specification. The scope should be construed to include modifications or variations that do not depart from the spirit of the present invention.
본 명세서에서 사용되는 용어는 본 발명에서의 기능을 고려하여 가능한 현재 널리 사용되고 있는 일반적인 용어를 선택하였으나 이는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자의 의도, 판례 또는 새로운 기술의 출현 등에 따라 달라질 수 있다. 다만, 이와 달리 특정한 용어를 임의의 의미로 정의하여 사용하는 경우에는 그 용어의 의미에 관하여 별도로 기재할 것이다. 따라서 본 명세서에서 사용되는 용어는 단순한 용어의 명칭이 아닌 그 용어가 가진 실질적인 의미와 본 명세서의 전반에 걸친 내용을 토대로 해석되어야 한다.The terms used in this specification are general terms that are currently widely used as much as possible in consideration of their function in the present invention, but this may vary depending on the intention of those skilled in the art, precedents, or the emergence of new technology in the technical field to which the present invention belongs. You can. However, if a specific term is defined and used with an arbitrary meaning, the meaning of the term will be described separately. Therefore, the terms used in this specification should be interpreted based on the actual meaning of the term and the overall content of this specification, not just the name of the term.
본 명세서에 첨부된 도면은 본 발명을 용이하게 설명하기 위한 것으로 도면에 도시된 형상은 본 발명의 이해를 돕기 위하여 필요에 따라 과장되어 표시된 것일 수 있으므로 본 발명이 도면에 의해 한정되는 것은 아니다.The drawings attached to this specification are intended to easily explain the present invention, and the shapes shown in the drawings may be exaggerated as necessary to aid understanding of the present invention, so the present invention is not limited by the drawings.
본 명세서에서 본 발명에 관련된 공지의 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에 이에 관한 자세한 설명은 필요에 따라 생략하기로 한다.In this specification, if it is determined that a detailed description of a known configuration or function related to the present invention may obscure the gist of the present invention, the detailed description thereof will be omitted as necessary.
도 1은 일 실시예에 따른 미술품 거래 서비스 제공 시스템의 환경도이다.1 is an environmental diagram of an art trade service providing system according to an embodiment.
도 1을 참조하면, 일 실시예에 따른 미술품 거래 서비스 제공 시스템은 서버(1000) 및 적어도 하나 이상의 사용자 단말기(2000)를 포함할 수 있다.Referring to FIG. 1, an art trade service providing system according to an embodiment may include a server 1000 and at least one user terminal 2000.
서버(1000)는 미술품 거래 서비스 제공 시스템의 중심적인 구성으로, 미술품 거래 서비스 제공 시스템의 전체적인 제어부 역할을 수행할 수 있다.The server 1000 is a central component of the art trade service provision system and can function as an overall control unit of the art trade service provision system.
서버(1000)는 적어도 하나 이상의 사용자 단말기(2000)와 연결되어 데이터를 송수신할 수 있다. 일 실시예에 따르면, 서버(1000)는 미술품 거래 플랫폼의 서버로서, 미술품에 대한 정보, 미술품 경매에 대한 정보, 미술품 공동 구매에 대한 정보 등을 사용자 단말기(2000)에 제공할 수 있다.The server 1000 is connected to at least one user terminal 2000 and can transmit and receive data. According to one embodiment, the server 1000 is a server of an art trading platform and can provide information about art works, information about art auctions, information about joint purchases of art works, etc. to the user terminal 2000.
사용자 단말기(2000)는 미술품 거래 플랫폼을 이용하는 수요자의 디바이스일 수 있다. 구체적으로, 사용자 단말기(2000)는 수요자의 모바일이거나 수요자의 컴퓨터의 서버일 수 있다.The user terminal 2000 may be a device of a consumer using an art trading platform. Specifically, the user terminal 2000 may be the consumer's mobile device or a server of the consumer's computer.
사용자 단말기(2000)의 사용자인 수요자는 사용자 단말기(2000)를 통해 서버(1000)가 제공하는 서비스를 이용할 수 있다. 구체적으로, 사용자는 사용자 단말기(2000)를 통해 미술품을 검색하고, 미술품에 대한 정보를 획득하고, 미술품을 구매하고, 미술품을 추천받고, 미술품에 대한 예측 구매가를 제공받을 수 있다.A consumer who is a user of the user terminal 2000 can use the service provided by the server 1000 through the user terminal 2000. Specifically, the user can search for art works, obtain information about art works, purchase art works, receive recommendations for art works, and receive predicted purchase prices for art works through the user terminal 2000.
위에서 본원 발명의 일 실시예에 따른 미술품 거래 서비스 제공 시스템에 대해서 개략적으로 설명하였으나, 각 구성 요소간의 연결 관계는 변형되어 실시될 수 있다.Although the art trade service providing system according to an embodiment of the present invention has been briefly described above, the connection relationship between each component may be modified and implemented.
예를 들어, 제1 단말기와 제2 단말기가 직접 통신하고, 제1 단말기 또는 제2 단말기는 각각 서버(1000)로부터 정보를 수신할 수 있다. 또한 예를 들어, 서버(1000)는 제1 단말기 또는 제2 단말기에 설치된 프로그램(예, 어플리케이션)의 형태로 구현되어, 제1 단말기 및 제2 단말기간의 양자간 통신만 수행되는 미술품 거래 플랫폼이 구현될 수 있다.For example, the first terminal and the second terminal may communicate directly, and the first terminal or the second terminal may each receive information from the server 1000. Also, for example, the server 1000 is implemented in the form of a program (e.g., an application) installed on the first terminal or the second terminal, thereby implementing an art trading platform in which only bilateral communication between the first terminal and the second terminal is performed. It can be.
또한, 도 1에는 서버(1000)의 개수가 하나인 것으로 도시되었으나, 이에 한정되지 않고, 각 역할에 따라 복수의 서버들이 존재할 수도 있다.Additionally, in FIG. 1, the number of servers 1000 is shown as one, but the number is not limited to this, and a plurality of servers may exist according to each role.
도 2는 일 실시예에 따른 미술 거래 서비스를 제공하는 서버의 블록도이다.Figure 2 is a block diagram of a server providing an art trading service according to an embodiment.
도 2를 참조하면, 서버(1000)는 제어부(1100), 통신부(1200), 분석부(1300), 저장부(1400) 및 디스플레이부(1500)를 포함할 수 있다.Referring to FIG. 2, the server 1000 may include a control unit 1100, a communication unit 1200, an analysis unit 1300, a storage unit 1400, and a display unit 1500.
도 2는 서버(1000)에 포함되는 다섯 가지 구성 요소를 도시하고 있으나, 도시된 구성 요소들이 필수적인 것은 아니고, 서버(1000)는 그보다 많은 구성 요소를 갖거나 그보다 적은 구성 요소를 가질 수 있다. 또한, 서버(1000)의 각 구성 요소는 물리적으로 하나의 서버에 포함될 수도 있고, 각각의 기능 별로 분산된 분산 서버일 수 있다.Figure 2 shows five components included in the server 1000, but the illustrated components are not essential, and the server 1000 may have more or fewer components. Additionally, each component of the server 1000 may be physically included in one server, or may be a distributed server distributed for each function.
제어부(1100)는 서버(1000)의 동작을 총괄할 수 있다. 구체적으로, 제어부(1100)는 적어도 하나 이상의 프로세서를 포함하여, 통신부(1200), 분석부(1300), 저장부(1400) 및 디스플레이부(1500)에 제어 명령을 보내 각 부서의 동작을 실행할 수 있다. 제어부(1100)는 컴퓨터 장치에 의해 실행되는 프로그램 명령(program instruction)일 수 있다.The control unit 1100 may oversee the operation of the server 1000. Specifically, the control unit 1100 includes at least one processor and can execute the operations of each department by sending control commands to the communication unit 1200, analysis unit 1300, storage unit 1400, and display unit 1500. there is. The control unit 1100 may be a program instruction executed by a computer device.
이하에서 특별한 언급이 없는 경우에는, 서버(1000)의 동작은 제어부(1100)의 제어에 의해 수행되는 것으로 해석될 수 있다. 또한 본원 발명의 명세서에서 제어부(1100)의 수행은 프로세서를 주체로 하여 서술될 수 있다.Unless otherwise specified below, the operation of the server 1000 may be interpreted as being performed under the control of the control unit 1100. Additionally, in the specification of the present invention, the performance of the control unit 1100 may be described with the processor as the main agent.
통신부(1200)는 서버(1000)와 외부 기기를 연결하여 통신하도록 할 수 있다. 즉, 통신부(1200)는 외부 기기와 데이터를 송수신할 수 있다. 예를 들어, 통신부(1200)는 사용자 단말기(2000)와 데이터를 주고받을 수 있다. 통신부(1200)는 컴퓨터 장치에 의해 실행되는 프로그램 명령(program instruction)일 수 있다.The communication unit 1200 can connect the server 1000 and an external device to communicate. That is, the communication unit 1200 can transmit and receive data with an external device. For example, the communication unit 1200 may exchange data with the user terminal 2000. The communication unit 1200 may be a program instruction executed by a computer device.
일 실시예에 따르면, 통신부(1200)는 사용자 단말기(2000)로부터 미술품에 대한 정보를 수신할 수 있다. 또한, 통신부(1200)는 사용자 단말기(2000)로부터 사용자에 의해 선별된 또는 선택된 미술품에 대한 정보를 수신할 수 있다.According to one embodiment, the communication unit 1200 may receive information about a work of art from the user terminal 2000. Additionally, the communication unit 1200 may receive information about the artwork selected or selected by the user from the user terminal 2000.
일 실시예에 따르면, 통신부(1200)는 사용자 단말기(2000)로부터 미술품을 검색하기 위해 사용자가 검색창에 입력한 검색 조건을 포함하는 데이터를 수신할 수 있다. 또한, 통신부(1200)는 사용자 단말기(2000)로부터 사용자의 성별, 나이, 관심있는 작가, 좋아하는 화풍, 취향 등에 대한 사용자 정보를 수신할 수 있다.According to one embodiment, the communication unit 1200 may receive data including search conditions entered by the user in a search box to search for a work of art from the user terminal 2000. Additionally, the communication unit 1200 may receive user information about the user's gender, age, artist of interest, favorite painting style, taste, etc. from the user terminal 2000.
통신부(1200)는 유선 통신 방식 및 무선 통신 방식 중 적어도 하나의 통신 방식을 지원하는 통신 모듈일 수 있다. 예를 들어, 통신부(1200)는 블루투스(Bluetooth), 지그비(Zigbee), BLE(Bluetooth Low Energy) 및 알에프아이디(RFID) 등의 통신 방식으로 외부 장치로부터 데이터를 획득할 수 있다.The communication unit 1200 may be a communication module that supports at least one of a wired communication method and a wireless communication method. For example, the communication unit 1200 may acquire data from an external device using communication methods such as Bluetooth, Zigbee, BLE (Bluetooth Low Energy), and RFID.
분석부(1300)는 사용자 단말기(2000)로부터 수신한 데이터에 기초하여, 미술품을 검색하거나 미술품의 예상 구매가를 계산하는 등의 연산을 수행할 수 있다. 또한, 분석부(1300)는 미술품의 가격에 대한 정보를 포함하는 가격 데이터에 기초하여, 미술품의 예상 수익률에 따른 매각가 및 매각 시기를 예측할 수 있다. 분석부(1100)는 컴퓨터 장치에 의해 실행되는 프로그램 명령(program instruction)일 수 있다.The analysis unit 1300 may perform calculations such as searching for a work of art or calculating an expected purchase price of a work of art based on data received from the user terminal 2000. Additionally, the analysis unit 1300 can predict the sale price and sale time according to the expected rate of return of the artwork, based on price data including information on the price of the artwork. The analysis unit 1100 may be a program instruction executed by a computer device.
분석부(1300)는 도 3에 도시된 미술품 거래 관련 데이터 처리 방법에 포함된 각 단계들을 수행할 수 있다. 이에 대한 자세한 내용은 후술한다.The analysis unit 1300 may perform each step included in the art transaction-related data processing method shown in FIG. 3. Details about this will be described later.
저장부(1400)는 서버(1000)가 동작하는데 필요한 각종 데이터 및 프로그램을 저장할 수 있다. 저장부(1400)는 서버(1000)가 획득하는 정보를 저장할 수 있다. 저장부(1400)는 컴퓨터 장치에 의해 실행되는 프로그램 명령(program instruction)일 수 있다.The storage unit 1400 can store various data and programs necessary for the server 1000 to operate. The storage unit 1400 may store information acquired by the server 1000. The storage unit 1400 may be a program instruction executed by a computer device.
예를 들어, 저장부(1400)는 통신부(1200)가 획득한 사용자 단말기(2000)로부터 수신한 데이터를 저장할 수 있다. 구체적으로, 저장부(1400)는 사용자의 정보 및 취향을 포함하는 사용자 데이터를 저장할 수 있다. 또한, 저장부(1400)는 사용자의 검색 조건과 사용자의 구매 내역을 기반으로 사용자의 검색 이력 및 구매 이력에 대한 정보를 저장할 수 있다.For example, the storage unit 1400 may store data received from the user terminal 2000 acquired by the communication unit 1200. Specifically, the storage unit 1400 may store user data including user information and preferences. Additionally, the storage unit 1400 may store information about the user's search history and purchase history based on the user's search conditions and the user's purchase history.
또한 예를 들어, 저장부(1400)는 서버(1000)가 서비스를 제공하기 위해 필요한 과거 미술품 거래 내역을 포함하는 데이터를 저장할 수 있다. 이때, 저장부(1400)에 저장된 과거 미술품 거래 내역 데이터는 통신부(1200)에 의해 수신되는 정보에 의해 또는 서버(1000) 자체적으로 계속 추가/수정되도록 업데이트될 수 있다.Also, for example, the storage unit 1400 may store data including past art transaction details necessary for the server 1000 to provide services. At this time, the past art transaction history data stored in the storage unit 1400 may be updated by information received by the communication unit 1200 or continuously added/modified by the server 1000 itself.
저장부(1400)는 데이터를 임시적으로 또는 반영구적으로 저장할 수 있다. 저장부(1400)의 예로는 하드디스크(HDD: Hard Disk Drive), SSD(Solid State Drive), 플래쉬 메모리(flash memory), 롬(ROM: Read-Only Memory), 램(RAM: Random Access Memory) 또는 클라우드 스토리지(Cloud Storage) 등이 있을 수 있다. 다만, 이에 한정되지 않고, 저장부(1400)는 데이터를 저장하기 위한 다양한 모듈로 구현될 수 있다.The storage unit 1400 can store data temporarily or semi-permanently. Examples of the storage unit 1400 include a hard disk drive (HDD), solid state drive (SSD), flash memory, read-only memory (ROM), and random access memory (RAM). Or there may be cloud storage, etc. However, the storage unit 1400 is not limited to this and may be implemented with various modules for storing data.
디스플레이부(1500)는 시각적인 정보를 출력할 수 있다. 예를 들어, 디스플레이부(1500)는 모바일 어플리케이션의 디스플레이나, 컴퓨터의 디스플레이와 연결되어, 미술품 거래 서비스와 관련된 시각적인 정보를 출력할 수 있다. 디스플레이부(1500)는 컴퓨터 장치에 의해 실행되는 프로그램 명령(program instruction)일 수 있다.The display unit 1500 can output visual information. For example, the display unit 1500 may be connected to a mobile application display or a computer display to output visual information related to an art trading service. The display unit 1500 may be a program instruction executed by a computer device.
예를 들어, 디스플레이부(1500)는 사용자 단말기(2000)의 디스플레이와 연결되어, 미술품에 대한 정보 및 미술품에 대한 분석 내용을 출력할 수 있다. 또한, 디스플레이부(1500)는 미술품의 공동 구매에 대한 정보를 담은 화면을 출력할 수 있다.For example, the display unit 1500 may be connected to the display of the user terminal 2000 and output information about the work of art and analysis of the work of art. Additionally, the display unit 1500 may output a screen containing information about the joint purchase of artwork.
도 3은 일 실시예에 따른 미술품 거래 관련 데이터 처리 방법의 순서도이다.Figure 3 is a flowchart of a method for processing data related to art trade according to an embodiment.
도 3을 참조하면, 일 실시예에 따른 미술품 거래 관련 데이터 처리 방법은 로데이터를 전처리하는 단계(S100), 미술품을 검색하기 위해 사용자가 입력한 검색 조건을 획득하는 단계(S200), 검색 조건에 기초하여 작품을 선별하고 작품에 대한 정보를 제공하는 단계(S300), 선별된 작품에 대한 예측 구매가 및 수익률을 산출하는 단계(S400) 및 미술품의 공동 구매를 위한 공동 구매자를 모집하는 단계(S500)를 포함할 수 있다.Referring to FIG. 3, a method of processing data related to art trade according to an embodiment includes preprocessing raw data (S100), obtaining search conditions entered by the user to search for art (S200), and applying the search conditions to the search conditions. A step of selecting works based on the work and providing information about the work (S300), a step of calculating the predicted purchase price and rate of return for the selected works (S400), and a step of recruiting joint buyers for joint purchase of art works (S500) ) may include.
로데이터를 전처리하는 단계(S100)는 과거 미술품의 거래 데이터(raw data, 로데이터)들을 일정한 기준에 따라 정리하는 단계일 수 있다. 이때, 로데이터는 복수의 미술품에 대한 오프라인/온라인 상의 거래 내역 또는 경매 내역일 수 있다.The raw data preprocessing step (S100) may be a step of organizing transaction data (raw data) of past artworks according to certain standards. At this time, raw data may be offline/online transaction details or auction details for multiple works of art.
복수의 미술품에 대한 거래 내역 또는 경매 내역은 거래처마다 다르게 정렬 또는 정리되어 있을 수 있다. 예를 들어, 특정 작가의 이름 또는 작품 명이 영문명으로 기재되어 있거나, 국문으로 기재되어 있을 수 있다. 따라서, 일정 기준을 가지고 로데이터를 정리하는 전처리 단계가 필요할 수 있다.Transaction details or auction details for multiple works of art may be sorted or organized differently for each business partner. For example, a specific author's name or work name may be written in English or in Korean. Therefore, a preprocessing step to organize raw data according to certain standards may be necessary.
로데이터의 전처리는 텍스트를 기반으로 할 수도 있고, 작품의 이미지를 기반으로 할 수 있다. 이때, 텍스트는 작품에 대한 작가명, 작가의 생년, 작품명, 제작년도, 카테고리, 사이즈(가로, 세로), 추정 하한가, 추정 상한가, 거래가/낙찰가, 거래일 및 거래처 중 적어도 하나를 포함할 수 있다.Preprocessing of raw data may be based on text or images of the work. At this time, the text may include at least one of the artist's name for the work, the artist's year of birth, work name, production year, category, size (horizontal, vertical), estimated lower price, estimated upper price, transaction/successful bid, transaction date, and customer.
로데이터의 전처리에 대해서는 도 4 내지 도 8을 참조하여 후술한다.Preprocessing of raw data will be described later with reference to FIGS. 4 to 8.
미술품을 검색하기 위해 사용자가 입력한 검색 조건을 획득하는 단계(S200)는 사용자가 사용자 단말기(2000)에 입력한 검색 키워드를 획득하는 단계일 수 있다. 검색 조건은 텍스트 기반일 수도 있고, 이미지 기반일 수도 있고, 텍스트와 이미지를 모두 포함할 수도 있다.The step of acquiring the search conditions entered by the user to search for a work of art (S200) may be a step of obtaining a search keyword entered by the user into the user terminal 2000. Search conditions may be text-based, image-based, or include both text and images.
이때, 검색 조건이 텍스트일 경우, 검색 조건은 작가명, 작가의 생년, 작품명, 제작년도, 카테고리, 사이즈(가로, 세로), 추정 하한가, 추정 상한가, 거래가/낙찰가, 거래일 및 거래처 중 적어도 하나를 포함할 수 있다. 검색 조건이 이미지일 경우, 검색 조건은 작품 이미지이거나, 작품 이미지 중 적어도 일부를 포함할 수 있다.At this time, if the search condition is text, the search condition must be at least one of the following: artist name, artist's year of birth, work name, production year, category, size (width, height), estimated lower price, estimated upper price, transaction price/successful bid, transaction date, and customer. It can be included. When the search condition is an image, the search condition may be a work image or may include at least part of the work image.
검색 조건에 기초하여 작품을 선별하고 작품에 대한 정보를 제공하는 단계(S300)는 단계 S200에서 획득한 검색 조건과 매칭되는 작품을 선별하고, 선별된 작품에 대해 사용자에게 작품의 정보를 제공하는 단계일 수 있다.The step of selecting works based on search conditions and providing information about the works (S300) is a step of selecting works that match the search conditions obtained in step S200 and providing information about the works to the user about the selected works. It can be.
단계 S300에서, 프로세서는 검색 조건과 매칭되는 작품이 있는 경우, 매칭되는 작품에 대한 정보를 사용자에게 제공할 수 있다. 그러나, 검색 조건과 매칭되는 작품이 없는 경우, 프로세서는 검색 조건과 유사한 작품을 선별하여 선별된 작품에 대한 정보를 사용자에게 제공할 수 있다.In step S300, if there is a work matching the search condition, the processor may provide information about the matching work to the user. However, if there are no works matching the search conditions, the processor may select works similar to the search conditions and provide information about the selected works to the user.
예를 들어, 단계 S200에서 획득한 검색 조건이 작가-Alena Shymchonak, 제작년도-2020년일 경우, 프로세서는 로데이터를 전처리하여 생성된 작품 데이터에서 상기 검색 조건과 매칭되는 작품을 적어도 하나 이상 선별하여 사용자에게 정보를 제공할 수 있다. 그러나, 프로세서는 작품 데이터에서 상기 검색 조건과 매칭되는 작품이 없는 경우, 상기 검색 조건과 유사한 작품을 적어도 하나 이상 선별하여 사용자에게 정보를 제공할 수 있다.For example, if the search conditions obtained in step S200 are author - Alena Shymchonak, production year - 2020, the processor selects at least one work that matches the search conditions from the work data generated by preprocessing the raw data and provides it to the user. Information can be provided to. However, if there is no work matching the search conditions in the work data, the processor may select at least one work similar to the search conditions and provide information to the user.
검색 조건과 유사한 작품을 선별하는 과정은 도 9를 참조하여 후술한다.The process of selecting works similar to the search conditions will be described later with reference to FIG. 9.
선별된 작품에 대한 예측 구매가 및 수익률을 산출하는 단계(S400)는 과거의 가격 정보를 포함하는 가격 데이터를 기반으로 머신 러닝을 이용하여 선별된 작품에 대한 예측 구매가 및 수익률을 산출하는 단계일 수 있다. 이때, 선별된 작품의 과거 가격 데이터가 있는 경우 상기 가격 데이터는 선별된 작품의 가격 데이터이다. 그러나, 선별된 작품의 과거 가격 데이터가 없는 경우, 상기 가격 데이터는 선별된 작품과 유사한 작품의 가격 데이터일 수 있다.The step of calculating the predicted purchase price and rate of return for the selected works (S400) is a step of calculating the predicted purchase price and rate of return for the selected works using machine learning based on price data including past price information. You can. At this time, if there is past price data for the selected work, the price data is the price data for the selected work. However, if there is no past price data for the selected work, the price data may be price data for works similar to the selected work.
단계 S400에서, 프로세서는 머신러닝을 이용한 시계열적인 분석을 통해, 작품의 예측 구매가를 산출할 수 있다. 또한, 예측 구매가를 기반으로, 시간에 따른 수익률과 매각시기를 예측하여 사용자에게 정보를 제공할 수 있다.In step S400, the processor can calculate the predicted purchase price of the work through time-series analysis using machine learning. In addition, based on the predicted purchase price, the rate of return and sale period over time can be predicted and information provided to the user.
머신러닝을 이용하여 작품에 대한 예측 구매가 및 수익률을 산출하는 단계는 도 10 및 도 11을 참조하여 후술한다.The step of calculating the predicted purchase price and rate of return for a work using machine learning will be described later with reference to FIGS. 10 and 11.
미술품의 공동 구매를 위한 공동 구매자를 모집하는 단계(S500)는 단계 S400 이후, 사용자가 작품을 구매하는 과정에서 수행되는 단계일 수 있다. 구체적으로, 작품가가 사용자의 예산보다 클 경우 또는 사용자가 공동 구매를 원할 경우 프로세서는 단계 S500을 수행할 수 있다.The step of recruiting joint buyers for joint purchase of an artwork (S500) may be a step performed in the process of a user purchasing a work after step S400. Specifically, if the price of the work is greater than the user's budget or if the user wishes to make a joint purchase, the processor may perform step S500.
공동 구매자를 모집하는 단계(S500)는 사용자가 선택한 작품에 대해 공동 구매를 원하는 다른 사용자를 모집하는 단계일 수 있다. 일 실시예에 따르면, 프로세서는 미술품 거래 플랫폼에 배너 등을 이용하여 상기 작품에 대한 정보를 광고할 수 있다. 다른 일 실시예에 따르면, 사용자의 작품 취향과 유사한 다른 사용자를 선별하여, 상기 다른 사용자에게 상기 작품에 대한 정보를 제공할 수도 있다.The step of recruiting joint buyers (S500) may be a step of recruiting other users who want to jointly purchase the work selected by the user. According to one embodiment, the processor may advertise information about the work using a banner or the like on an art trading platform. According to another embodiment, other users similar to the user's work tastes may be selected and information about the work may be provided to the other users.
다른 사용자를 선별하는 내용에 대해서는 도 12를 참조하여 후술한다.The details of selecting other users will be described later with reference to FIG. 12.
도 4는 일 실시예에 따른 로데이터 전처리 방법의 순서도이다. 구체적으로, 도 4는 텍스트를 기반으로 로데이터를 전처리하는 방법의 순서도이다.Figure 4 is a flowchart of a raw data preprocessing method according to an embodiment. Specifically, Figure 4 is a flowchart of a method for preprocessing raw data based on text.
도 4를 참조하면, 일 실시예에 따른 로데이터 전처리 방법은 텍스트를 벡터화하는 단계(S110), 텍스트 유사도를 산출하는 단계(S120) 및 텍스트 유사도에 기초하여 작품들을 그룹화하는 단계(S130)를 포함할 수 있다.Referring to FIG. 4, the raw data preprocessing method according to one embodiment includes a step of vectorizing text (S110), a step of calculating text similarity (S120), and a step of grouping works based on text similarity (S130). can do.
텍스트를 벡터화하는 단계(S110)는 로데이터에 포함된 텍스트인 작가명, 작가의 생년, 작품명, 제작년도, 카테고리, 사이즈(가로, 세로), 추정 하한가, 추정 상한가, 거래가/낙찰가, 거래일 및 거래처 중 적어도 하나를 벡터화하는 단계일 수 있다. 텍스트를 벡터화하는 단계(S110)가 수행되기 전, 텍스트의 형태소 분석이 수행될 수도 있다.The step of vectorizing the text (S110) is the text included in the raw data: author's name, author's year of birth, work name, production year, category, size (horizontal, vertical), estimated lower price, estimated upper price, transaction price/successful bid, transaction date, and customer. This may be a step of vectorizing at least one of the steps. Before the step of vectorizing the text (S110) is performed, morphological analysis of the text may be performed.
구체적으로, 프로세서는 로데이터에 포함된 문자들 각각에 대응되는 원-핫 벡터(One-Hot Vector)를 모두 합산함으로써, 텍스트에 대응되는 텍스트 벡터를 생성할 수 있다. 또는 프로세서는 워드투벡터(Word2Vec)를 이용하여, 텍스트에 대응되는 텍스트 벡터를 생성할 수 있다. 프로세서는 로데이터의 항목(작가명, 작품명, 제작년도 등)마다 항목에 포함된 텍스트 벡터를 생성할 수 있다.Specifically, the processor can generate a text vector corresponding to the text by adding up all one-hot vectors corresponding to each of the characters included in the raw data. Alternatively, the processor can use Word2Vec to generate a text vector corresponding to the text. The processor can generate a text vector included in each item of raw data (author's name, work title, production year, etc.).
텍스트 유사도를 산출하는 단계(S120)는 단계 S110에서 생성한 텍스트 벡터에 기초하여, 텍스트 유사도를 산출하는 단계일 수 있다. 구체적으로, 프로세는 벡터의 코사인 유사도 또는 특잇값 분해(Singular Value Decomposition)에 기초하여, 텍스트간의 유사도를 산출할 수 있다.The step of calculating text similarity (S120) may be a step of calculating text similarity based on the text vector generated in step S110. Specifically, the processor can calculate the similarity between texts based on the cosine similarity or singular value decomposition of the vector.
구체적으로, 프로세서는 항목마다 항목에 포함된 텍스트간의 유사도를 산출할 수 있다. 이때, 프로세서는 텍스트 유사도를 산출함으로써, 띄어쓰기, 대소문자 등에 의해 상이하게 기재된 작가명, 작품명 등을 동일한 텍스트인 것으로 확인할 수 있다.Specifically, the processor may calculate the similarity between texts included in each item. At this time, by calculating the text similarity, the processor can confirm that the author's name, work title, etc. written differently due to spacing, capitalization, etc. are the same text.
텍스트 유사도에 기초하여 작품들을 그룹화하는 단계(S130)는 단계 S120에서 산출한 텍스트 유사도에 기초하여, 텍스트 유사도가 일정값 이상인 텍스트에 대응되는 작품끼리 하나의 그룹으로 분류하는 단계일 수 있다.The step of grouping works based on text similarity (S130) may be a step of classifying works corresponding to texts whose text similarity is above a certain value into one group based on the text similarity calculated in step S120.
예를 들어, 제1 작가명 및 제2 작가명 간의 텍스트 유사도는 90% 이상일 수 있다. 이때, 프로세서는 제1 작가명 및 제2 작가명이 동일한 작가에 대한 작가명인 것으로 확인하고, 제1 작가명에 대응되는 제1 작품과 제2 작가명에 대응되는 제2 작품을 동일한 그룹으로 분류할 수 있다.For example, the text similarity between the first author's name and the second author's name may be 90% or more. At this time, the processor may determine that the first author name and the second author name are author names for the same author, and classify the first work corresponding to the first author name and the second work corresponding to the second author name into the same group.
프로세서가 작품을 그룹화하는 이유는, 검색 조건에 매칭되는 작품이 없는 경우, 유사한 작품을 선별하기 위해서일 수도 있고, 공동 구매자를 모집하기 위해서일 수도 있다.The reason why the processor groups works may be to select similar works when no works match the search conditions, or to recruit joint buyers.
구체적으로, 제1 검색 조건에 매칭되는 작품이 없는 경우, 제1 검색 조건에 포함된 제1 작가의 작품을 선별할 수 있다. 이때, 프로세서는 제1 작가의 작품으로 분류된 그룹의 작품들에 대한 정보를 사용자에게 제공할 수 있다. 또한, 제1 작품에 대한 공동 구매자를 모집하기 위해, 프로세서는 제1 작품의 제1 작가의 작품을 구매한 이력이 있는 사용자를 선별할 수도 있다.Specifically, if there is no work that matches the first search condition, the work of the first author included in the first search condition may be selected. At this time, the processor may provide the user with information about the works of the group classified as works of the first author. Additionally, in order to recruit joint buyers for the first work, the processor may select users who have a history of purchasing works by the first author of the first work.
위와 같이, 프로세서는 텍스트를 기반으로 텍스트 유사도가 일정값 이상인 작품들을 그룹화할 수 있다. 이때, 프로세서는 작품들을 항목(작가명, 작품명, 제작 년도 등)별로 그룹화할 수 있다.As above, the processor can group works with text similarity above a certain value based on the text. At this time, the processor can group the works by item (author's name, work title, production year, etc.).
도 5는 일 실시예에 따른 로데이터 전처리를 설명하기 위한 예시이다.Figure 5 is an example to explain raw data preprocessing according to an embodiment.
도 5를 참조하면, 프로세서가 항목(거래일, 작가, 작가 생년, 제목, 제작년도 등)에 따라 로데이터를 전처리하여 생성한 작품 데이터를 확인할 수 있다. 도 5에서는 '작가'로 분류된 그룹에 대한 데이터를 나타낸 것일 수도 있다. 그러나, 도 5에서도, 제작 년도, 사이즈 또는 거래처 등으로 다시 작품을 재분류/재그룹화할 수도 있다.Referring to Figure 5, you can check the work data created by the processor preprocessing the raw data according to the items (transaction date, author, author's year of birth, title, production year, etc.). Figure 5 may show data for a group classified as 'writer'. However, in Figure 5 as well, the works can be reclassified/regrouped again by production year, size, or business partner.
도 5와 같이, 프로세서는 데이터 전처리를 통해, 오프라인/온라인에 산재되어 있는 거래 데이터들을 수집하고 정리함으로써 복수의 작품에 대한 분류 또는 유사 정보를 포함하는 작품 데이터를 생성할 수 있다. 이때, 유사 정보란 작품이 속한 그룹 정보를 포함할 수 있다. 구체적으로, 유사 정보는 항목(작가, 작품명, 제작 년도 등)이 유사한 작품끼리 분류된 그룹에 대한 정보를 포함할 수 있다.As shown in Figure 5, the processor can collect and organize transaction data scattered offline/online through data preprocessing to generate work data including classification or similar information for a plurality of works. At this time, similar information may include information on the group to which the work belongs. Specifically, similar information may include information about a group in which works with similar items (author, work name, production year, etc.) are classified.
도 6은 다른 일 실시예에 따른 로데이터 전처리 방법의 순서도이다. 도 6은 작품 이미지를 기반으로 로데이터를 전처리하는 방법의 순서도이다.Figure 6 is a flowchart of a raw data preprocessing method according to another embodiment. Figure 6 is a flowchart of a method for preprocessing raw data based on the image of the work.
도 6을 참조하면, 다른 일 실시예에 따른 로데이터 전처리 방법은 이미지의 특징점, 히스토그램 또는 밀도 분포를 추출하는 단계(S140), 이미지 유사도를 산출하는 단계(S150) 및 이미지 유사도에 기초하여 작품들을 그룹화하는 단계(S160)를 포함할 수 있다.Referring to FIG. 6, the raw data preprocessing method according to another embodiment includes extracting feature points, histograms, or density distributions of images (S140), calculating image similarity (S150), and selecting works based on the image similarity. A grouping step (S160) may be included.
이미지의 특징점, 히스토그램 또는 밀도 분포를 추출하는 단계(S140)는 이미지의 픽셀값을 분석하는 단계일 수 있다. 프로세서는 이미지의 픽셀값 차이에 기초하여, 이미지의 특징점이 될 수 있는 엣지를 추출할 수 있다. 또한, 프로세서는 이미지의 픽셀값을 이용하여 히스토그램을 생성할 수 있다. 또한, 프로세서는 이미지의 픽셀값 및 픽셀값의 밀도에 기초하여, 밀도 분포를 추출할 수 있다.The step of extracting feature points, histograms, or density distributions of an image (S140) may be a step of analyzing pixel values of the image. The processor can extract edges that can be characteristic points of the image based on differences in pixel values of the image. Additionally, the processor can generate a histogram using pixel values of the image. Additionally, the processor may extract a density distribution based on the pixel value of the image and the density of the pixel value.
구체적으로, 프로세서는 이미지의 이웃한 픽셀간의 픽셀값 차이에 기초하여, 이미지의 엣지를 추출할 수 있다. 또한, 프로세서는 이미지의 밝기에 따른 히스토그램 또는 RGB에 따른 히스토그램을 생성할 수 있다. 또한, 프로세서는 Mean-shift 알고리즘 등을 이용하여, 이미지의 특징점, 코너 및 색상을 기반으로 밀도 분포를 생성할 수 있다.Specifically, the processor may extract the edge of the image based on the difference in pixel values between neighboring pixels of the image. Additionally, the processor can generate a histogram according to the brightness of the image or a histogram according to RGB. Additionally, the processor can generate a density distribution based on the feature points, corners, and colors of the image using the mean-shift algorithm.
이미지 유사도를 산출하는 단계(S150)는 단계 S140에서 추출한 특징점, 히스토그램 또는 밀도 분포에 기초하여, 이미지간의 유사도를 산출하는 단계일 수 있다.The step of calculating image similarity (S150) may be a step of calculating the similarity between images based on the feature points, histogram, or density distribution extracted in step S140.
프로세서는 단계 S140에서 추출한 특징점에 기초하여 제1 이미지 및 제2 이미지간의 이미지 유사도를 산출할 수 있다. 구체적으로, 프로세서는 특정 위치에 있는 제1 이미지의 특징점과 제2 위치의 상기 특정 위치의 픽셀을 비교하여, 특징점을 서로 대비함으로써 이미지 유사도를 산출할 수 있다. 또한, 프로세서는 제1 이미지에 포함된 제1 특징점 및 제2 특징점간의 거리와, 제2 이미지에 포함된 제3 특징점 및 제4 특징점간의 거리에 기초하여, 이미지 유사도를 산출할 수 있다.The processor may calculate the image similarity between the first image and the second image based on the feature points extracted in step S140. Specifically, the processor may compare a feature point of a first image at a specific location with a pixel of the specific location at a second location, and calculate image similarity by contrasting the feature points. Additionally, the processor may calculate image similarity based on the distance between the first and second feature points included in the first image and the distance between the third and fourth feature points included in the second image.
프로세서는 단계 S140에서 생성한 히스토그램에 기초하여, 제1 이미지 및 제2 이미지간의 이미지 유사도를 산출할 수 있다. 구체적으로, 프로세서는 제1 이미지 및 제2 이미지에서 밝기 및 RGB에 기초하여 생성된 히스토그램의 분포와 값을 대비하여 이미지 유사도를 산출할 수 있다. 이때, 프로세서는 밝기, R, G 및 B를 기반으로 생성된 히스토그램을 모두 고려하여, 히스토그램이 픽셀 위치와 무관할 수 있다는 점을 보완할 수 있다.The processor may calculate the image similarity between the first image and the second image based on the histogram generated in step S140. Specifically, the processor may calculate image similarity by comparing the distribution and value of a histogram generated based on brightness and RGB in the first image and the second image. At this time, the processor can compensate for the fact that the histogram may be unrelated to the pixel location by considering all histograms generated based on brightness, R, G, and B.
프로세서는 단계 S140에서 생성한 밀도 분포에 기초하여, 제1 이미지 및 제2 이미지간의 이미지 유사도를 산출할 수 있다. 구체적으로, 프로세서는 제1 이미지의 특징점의 밀도 분포와 제2 이미지의 특징점의 밀도 분포를 비교할 수 있다. 또한, 프로세서는 제1 이미지의 색상 기반 밀도 분포와 제2 이미지의 색상 기반 밀도 분포를 비교할 수 있다.The processor may calculate the image similarity between the first image and the second image based on the density distribution generated in step S140. Specifically, the processor may compare the density distribution of the feature points of the first image with the density distribution of the feature points of the second image. Additionally, the processor may compare the color-based density distribution of the first image with the color-based density distribution of the second image.
프로세서는 특징점, 히스토그램 및 밀도 분포 각각을 기반으로 이미지 유사도를 산출할 수도 있고, 특징점, 히스토그램 및 밀도 분포 중 2개 이상의 조합을 기반으로 이미지 유사도를 산출할 수도 있다.The processor may calculate image similarity based on each of the feature points, histogram, and density distribution, or may calculate image similarity based on a combination of two or more of the feature point, histogram, and density distribution.
이미지 유사도에 기초하여 작품들을 그룹화하는 단계(S160)는 단계 S150에서 산출한 이미지 유사도에 기초하여, 이미지 유사도가 일정값 이상인 이미지끼리 하나의 그룹으로 분류하는 단계일 수 있다.The step of grouping works based on image similarity (S160) may be a step of classifying images with image similarity above a certain value into one group based on the image similarity calculated in step S150.
예를 들어, 제1 이미지 및 제2 이미지의 이미지 유사도는 90% 이상일 수 있다. 이때, 프로세서는 제1 이미지 및 제2 이미지가 동일한 작품의 이미지인 것으로 확인하고, 제1 이미지에 대응되는 제1 작품과 제2 이미지에 대응되는 제2 작품을 동일한 그룹으로 분류할 수 있다.For example, the image similarity between the first image and the second image may be 90% or more. At this time, the processor may determine that the first image and the second image are images of the same work, and classify the first work corresponding to the first image and the second work corresponding to the second image into the same group.
위와 같이, 프로세서는 이미지를 기반으로 이미지 유사도가 일정값 이상인 작품들을 그룹화할 수 있다. 이때, 프로세서는 작품들을 항목(작가명, 작품명, 제작 년도 등)별로 그룹화할 수 있다.As above, the processor can group works with image similarity above a certain value based on the image. At this time, the processor can group the works by item (author's name, work title, production year, etc.).
도 7은 다른 일 실시예에 따른 로데이터 전처리를 설명하기 위한 예시이다. 도 7은 이미지의 특징점을 기반으로 이미지 유사도를 산출하는 방법의 예시이다.Figure 7 is an example to explain raw data preprocessing according to another embodiment. Figure 7 is an example of a method for calculating image similarity based on feature points of the image.
도 7을 참조하면, 프로세서는 두 이미지의 특징점(110)을 추출할 수 있다. 프로세서는 추출된 특징점을 서로 대비하여, 이미지의 유사도를 판단할 수 있다. 도 7에서, 특징점 추출을 기반으로, 샘플 작품(120)과 유사한 작품(130)과 비유사한 작품(140)을 선별할 수 있다.Referring to FIG. 7, the processor can extract feature points 110 of the two images. The processor can determine the similarity of the images by comparing the extracted feature points. In FIG. 7, a work 140 that is similar to the sample work 120 and a work 130 that is dissimilar may be selected based on feature point extraction.
도 8은 또 다른 일 실시예에 따른 로데이터 전처리를 설명하기 위한 예시이다. 도 8은 히스토그램을 기반으로 이미지 유사도를 산출하는 방법의 예시이다.Figure 8 is an example to explain raw data preprocessing according to another embodiment. Figure 8 is an example of a method for calculating image similarity based on a histogram.
도 8을 참조하면, 프로세서는 샘플 이미지(210)의 밝기 히스토그램(220), R 히스토그램(230), G 히스토그램(240) 및 B 히스토그램(250)을 각각 생성할 수 있다. 프로세서는 복수의 히스토그램(220, 230, 240, 250)에 기초하여, 샘플 이미지(210)와 유사한 이미지를 선별할 수 있다.Referring to FIG. 8 , the processor may generate a brightness histogram 220, an R histogram 230, a G histogram 240, and a B histogram 250, respectively, of the sample image 210. The processor may select an image similar to the sample image 210 based on the plurality of histograms 220, 230, 240, and 250.
도 9는 일 실시예에 따른 작품을 선별 및 제공하는 방법의 순서도이다. 도 9는 검색 조건에 매칭되는 작품이 없는 경우, 유사한 작품을 추천하는 방법에 대한 순서도이다.Figure 9 is a flowchart of a method for selecting and providing works according to an embodiment. Figure 9 is a flowchart of a method for recommending similar works when there are no works that match the search conditions.
도 9를 참조하면, 일 실시예에 따른 작품을 선별 및 제공하는 방법은 검색 조건에 포함된 항목을 구분하는 단계(S310), 제1 항목에 대한 제1 검색 조건과 매칭되는 그룹을 선별하는 단계(S320), 선별된 그룹 중 제2 항목에 대한 제2 검색 조건과 매칭되는 작품을 선별하는 단계(S330) 및 선별된 작품에 대한 정보를 제공하는 단계(S340)를 포함할 수 있다.Referring to FIG. 9, a method of selecting and providing works according to an embodiment includes the steps of distinguishing items included in a search condition (S310) and selecting a group that matches the first search condition for the first item. (S320), a step of selecting a work that matches the second search condition for the second item among the selected group (S330), and a step of providing information about the selected work (S340).
검색 조건에 포함된 항목을 구분하는 단계(S310)는 단계 S130 또는 단계 S160에서 분류된 그룹들을 검색하기 위해, 검색 조건의 항목들을 구분하는 단계일 수 있다. 예를 들어, 검색 조건이 작가-Alena Shymchonak, 제작년도-2020년, 사이즈(가로)-40 이상, 사이즈(세로)-60 이상, 카테고리-Oil인 경우, 프로세서는 작품을 선별하기 위해 필요한 항목이 작가, 제작년도, 사이즈(가로), 사이즈(세로), 카테고리인 것으로 확인할 수 있다.The step S310 of classifying items included in the search condition may be a step of classifying the items of the search condition in order to search for groups classified in step S130 or step S160. For example, if the search conditions are Author - Alena Shymchonak, Production Year - 2020, Size (Width) - 40 or more, Size (Height) - 60 or more, Category - Oil, the processor has the items necessary to select the works. You can check the author, production year, size (horizontal), size (vertical), and category.
제1 항목에 대한 제1 검색 조건과 매칭되는 그룹을 선별하는 단계(S320)는 단계 S310에서 구분된 항목에 대한 검색 조건과 매칭되는 그룹을 확인하는 단계일 수 있다. 위 예시에서, 제1 항목이 작가인 경우, 프로세서는 작가 'Alena Shymchonak'의 기준으로 분류된 그룹을 선별할 수 있다.The step of selecting a group that matches the first search condition for the first item (S320) may be a step of confirming a group that matches the search condition for the item classified in step S310. In the above example, if the first item is an author, the processor may select a group classified by the author 'Alena Shymchonak'.
선별된 그룹 중 제2 항목에 대한 제2 검색 조건과 매칭되는 작품을 선별하는 단계(S330)는 단계 S320에서 선별된 그룹에 포함된 작품들 중에서, 제2 항목에 대한 검색 조건과 매칭되는 작품을 선별하는 단계일 수 있다.The step (S330) of selecting works that match the second search conditions for the second item among the selected groups selects works that match the search conditions for the second item from among the works included in the group selected in step S320. This may be a selection stage.
위 예시에서, 프로세서는 작가 'Alena Shymchonak'의 기준으로 분류된 그룹에서, 제2 항목이 카테고리인 경우, 프로세서는 카테고리 'Oil'인 작품을 선별할 수 있다. 또는 제2 항목이 제작년도인 경우, 프로세서는 작가 'Alena Shymchonak'의 기준으로 분류된 그룹에서 제작년도가 2020년인 작품을 선별할 수 있다.In the example above, if the second item is a category in the group classified by the artist 'Alena Shymchonak', the processor can select works of the category 'Oil'. Alternatively, if the second item is a production year, the processor may select works with a production year of 2020 from a group classified by author 'Alena Shymchonak'.
선별된 작품에 대한 정보를 제공하는 단계(S340)는 프로세서가 단계 S330에서 선별된 작품에 대한 작가명, 작가의 생년, 작품명, 제작년도, 카테고리, 사이즈(가로, 세로), 추정 하한가, 추정 상한가, 예측 구매가, 수익률, 거래가/낙찰가, 거래일 및 거래처 중 적어도 하나를 포함하는 데이터를 사용자 단말기(2000)로 전송하는 단계일 수 있다.In the step (S340) of providing information about the selected work, the processor provides the artist's name, year of birth, work name, production year, category, size (width, height), estimated lower limit price, and estimated upper limit price for the work selected in step S330. , This may be a step of transmitting data including at least one of the predicted purchase price, rate of return, transaction price/successful bid, transaction date, and customer to the user terminal 2000.
위와 같이, 프로세서는 검색 조건에 매칭되는 작품이 있는 경우, 매칭된 작품에 대한 정보를 사용자에게 제공하거나, 매칭되는 작품이 없는 경우, 검색 조건의 일부를 만족하는 유사한 작품에 대한 정보를 사용자에게 제공(작품 추천)할 수 있다.As above, if there is a work that matches the search conditions, the processor provides the user with information about the matched work, or if there is no matching work, the processor provides the user with information about similar works that satisfy part of the search conditions. You can (recommend works).
도 10은 일 실시예에 따른 예측 구매가 및 수익률을 산출하는 방법의 순서도이다. 도 10은 ARIMA 모델을 이용한 머신 러닝에 의해 예측 구매가 및 수익률을 산출하는 방법에 대한 순서도이다.Figure 10 is a flowchart of a method for calculating a predicted purchase price and rate of return according to an embodiment. Figure 10 is a flowchart of a method for calculating the predicted purchase price and rate of return by machine learning using the ARIMA model.
도 10을 참조하면, 일 실시예에 따른 예측 구매가 및 수익률을 산출하는 방법은 가격 데이터 획득 및 분석하는 단계(S411), 자기상관함수 및 편자기상관함수를 추출하는 단계(S412), 자기회귀 차수, 차분 차수 및 이동평균 차수를 설정하는 단계(S413), 로그 변환 또는 차분을 수행하는 단계(S414), 자기회귀 차수, 차분 차수 및 이동평균 차수를 조정하는 단계(S415), 예측 구매가를 산출하는 단계(S416) 및 미래 가격 추이 및 수익률을 산출하는 단계(S417)를 포함할 수 있다.Referring to FIG. 10, the method of calculating the predicted purchase price and rate of return according to an embodiment includes obtaining and analyzing price data (S411), extracting an autocorrelation function and a partial autocorrelation function (S412), and autoregressive Setting the order, difference order, and moving average order (S413), performing log transformation or difference (S414), adjusting the autoregressive order, difference order, and moving average order (S415), calculating the predicted purchase price It may include a step (S416) and a step of calculating future price trends and rates of return (S417).
가격 데이터 획득 및 분석하는 단계(S411)는 작품에 대한 과거 거래 내역에 기반하여 시계열적인 가격 변동 추이를 포함하는 가격 데이터를 획득하고 이를 전처리 및/또는 분석하는 단계일 수 있다. 제1 작품에 대한 예측 구매가 및 수익률을 산출할 때, 제1 작품의 과거 가격 데이터를 분석할 수 있다.The step of acquiring and analyzing price data (S411) may be a step of acquiring price data including a time-series price change trend based on past transaction history for the work and pre-processing and/or analyzing it. When calculating the predicted purchase price and rate of return for the first work, past price data of the first work can be analyzed.
그러나, 제1 작품에 대한 과거 가격 데이터가 없는 경우, 제1 작품과 유사한 제2 작품의 과거 가격 데이터를 이용하여 제1 작품의 예측 구매가 및 수익률을 산출할 수 있다. 예를 들어, A작가의 제1 작품에 대한 과거 가격 데이터가 없는 경우, 프로세서는 A작가의 제1 작품과 동일한 년도에 제작된 제2 작품의 과거 가격 데이터를 이용할 수 있다.However, if there is no past price data for the first work, the predicted purchase price and rate of return for the first work can be calculated using past price data for the second work similar to the first work. For example, if there is no historical price data for the first work by artist A, the processor can use historical price data for the second work produced in the same year as the first work by artist A.
자기상관함수 및 편자기상관함수를 추출하는 단계(S412)는 단계 S411에서 획득한 가격 데이터에 기초하여, ARIMA(Autoregressive Integrated Moving Average) 모델을 이용하기 위한 함수를 추출하는 단계일 수 있다.The step of extracting the autocorrelation function and the partial autocorrelation function (S412) may be a step of extracting a function for using the ARIMA (Autoregressive Integrated Moving Average) model based on the price data obtained in step S411.
자기상관함수(AutoCorrelation Function, ACF)는 시차에 따른 일련의 자기상관을 의미하는 것으로, 아래의 [수학식 1]에 의해 산출될 수 있다.AutoCorrelation Function (ACF) refers to a series of autocorrelation according to time lag, and can be calculated using [Equation 1] below.
Figure PCTKR2022009501-appb-img-000001
Figure PCTKR2022009501-appb-img-000001
프로세서는 자기상관함수에 의해 가격 데이터의 정상성을 판단할 수 있다. 이때, 정상성(Stationary)은 평균, 분산이 시간에 따라 일정한 성질을 의미하는 것일 수 있다. 정상성을 나타내지 않는 데이터는 분석하기 어렵기 때문에, 프로세서는 가격 데이터가 정상성을 갖도록 로그 변환 및/또는 차분을 수행할 수 있다.The processor can determine the normality of price data using the autocorrelation function. At this time, stationary may mean that the average and variance are constant over time. Because non-stationary data is difficult to analyze, the processor may perform log transformation and/or differencing to ensure that the price data is stationary.
편자기상관함수(Partial AutoCorrelation Function, PACF)는 시차에 따른 일련의 편자기상관을 의미하는 것으로, 아래의 [수학식 2] 및 [수학식 3]에 의해서 산출될 수 있다.Partial AutoCorrelation Function (PACF) refers to a series of partial autocorrelations according to time lag, and can be calculated using [Equation 2] and [Equation 3] below.
Figure PCTKR2022009501-appb-img-000002
Figure PCTKR2022009501-appb-img-000002
Figure PCTKR2022009501-appb-img-000003
Figure PCTKR2022009501-appb-img-000003
프로세서는 편자기상관함수를 산출함으로써, 제1 시점의 제1 가격과 제2 시점의 제2 가격 사이의 다른 시점의 가격으로부터의 영향을 제거하여 제1 가격 및 제2 가격 사이의 상관관계만을 파악할 수 있다.By calculating the partial autocorrelation function, the processor can determine only the correlation between the first price and the second price by removing the influence of prices at other times between the first price at the first time and the second price at the second time. You can.
자기회귀 차수, 차분 차수 및 이동평균 차수를 설정하는 단계(S413)는 로그 변환 또는 차분을 수행하기 위해, 파라미터를 설정하는 단계일 수 있다. 구체적으로, 자기회귀 차수(p)는 시간 지연 수를 의미하고, 차분 차수(d)는 데이터가 과거 값을 뺀 횟수를 의미하고, 이동평균 차수(q)는 이동 평균 모델의 순서를 의미하는 것일 수 있다. 이때, 차분 차수는 가격 데이터의 정상성 정도에 의해 정해질 수 있다.The step of setting the autoregressive order, the difference order, and the moving average order (S413) may be a step of setting parameters to perform log transformation or difference. Specifically, the autoregressive order (p) refers to the number of time lags, the difference order (d) refers to the number of times data has been subtracted from the past value, and the moving average order (q) refers to the order of the moving average model. You can. At this time, the difference order can be determined by the degree of normality of the price data.
로그 변환 또는 차분을 수행하는 단계(S414)는 가격 데이터의 정상성을 위해, 프로세서가 설정된 자기회귀 차수, 차분 차수 및 이동평균 차수를 기반으로 단계 S414에서 획득한 가격 데이터를 로그 변환하거나, 차분(differential)하거나, 로그 변환과 차분을 모두 수행하는 단계일 수 있다. 로그 변환 또는 차분이 수행된 가격 데이터는 정상성을 나타낼 수 있다. 구체적으로, 프로세서는 로그 변환 또는 차분이 수행된 가격 데이터의 자기상관함수 및 편자기상관함수를 다시 산출함으로써, 정상성을 확인할 수 있다.In the step of performing log transformation or difference (S414), for stationarity of the price data, the processor log-transforms the price data obtained in step S414 based on the set autoregressive order, difference order, and moving average order, or difference ( differential), or it may be a step that performs both log transformation and difference. Price data that has been log-transformed or differenced may exhibit stationarity. Specifically, the processor can confirm normality by recalculating the autocorrelation function and partial autocorrelation function of the price data on which log transformation or difference has been performed.
자기회귀 차수, 차분 차수 및 이동평균 차수를 조정하는 단계(S415)는 단계 S414에서 로그 변환 또는 차분이 수행된 가격 데이터의 정상성이 확인되지 않는 경우, 파라미터인 자기회귀 차수, 차분 차수 및 이동평균 차수를 단계 S413의 수치와 다르게 설정하는 단계일 수 있다. 예를 들어, 단계 S414에서 가격 데이터의 정상성이 확인되지 않는 경우, 프로세서는 차분 차수를 늘려, 로그 변환 또는 차분을 수행하는 횟수를 증가시킬 수 있다.The step (S415) of adjusting the autoregressive order, difference order, and moving average order is performed when the stationarity of the price data on which the log transformation or difference was performed in step S414 is not confirmed, the parameters autoregressive order, difference order, and moving average. This may be a step of setting the order to be different from the value in step S413. For example, if the normality of the price data is not confirmed in step S414, the processor may increase the difference order and increase the number of times log transformation or difference is performed.
예측 구매가를 산출하는 단계(S416)는 단계 S414 및/또는 단계 S415에 의해 가격 데이터의 정상성이 확인되는 경우, 변환 또는 차분된 가격 데이터를 이용하여 작품의 예측 구매가를 산출하는 단계일 수 있다. 구체적으로, 프로세서는 조정된 수치를 가지는 자귀회귀 차수, 차분 차수 및 이동평균 차수에 의해 모델링된 머신 러닝 모델에 가격 데이터를 입력하여, 예측 구매가를 출력할 수 있다.The step of calculating the predicted purchase price (S416) may be a step of calculating the predicted purchase price of the work using converted or differentiated price data when the normality of the price data is confirmed in step S414 and/or step S415. Specifically, the processor may input price data into a machine learning model modeled by a regression order, difference order, and moving average order with adjusted values, and output a predicted purchase price.
미래 가격 추이 및 수익률을 산출하는 단계(S417)는 단계 S416에서 사용한 머신 러닝 모델에 기초하여, 미래 시점에 대한 예측 구매가와 그 시점에서의 수익률을 산출하는 단계일 수 있다. 이때, 프로세서는 단계 S416에서 출력한 예측 구매가를 다시 모델에 반영하여 재모델링한 후, 미래 시점에서의 구매가와 수익률을 예측할 수도 있다. 이때, 프로세서는 재모델링을 위해, 단계 S416에서 출력한 예측 구매가를 포함한 새로운 가격 데이터의 정상성을 위한 새로운 자기회귀 차수, 차분 차수 및 이동평균 차수를 설정할 수 있다.The step of calculating the future price trend and rate of return (S417) may be a step of calculating the predicted purchase price for a future point in time and the rate of return at that point based on the machine learning model used in step S416. At this time, the processor may reflect the predicted purchase price output in step S416 back into the model, remodel it, and then predict the purchase price and rate of return at a future point in time. At this time, for remodeling, the processor may set a new autoregressive order, difference order, and moving average order for the normality of the new price data including the predicted purchase price output in step S416.
도 11은 다른 일 실시예에 따른 예측 구매가 및 수익률을 산출하는 방법의 순서도이다. 도 11은 GRU 모델을 이용한 머신 러닝에 의해 예측 구매가 및 수익률을 산출하는 방법에 대한 순서도이다.Figure 11 is a flowchart of a method for calculating a predicted purchase price and rate of return according to another embodiment. Figure 11 is a flowchart of a method for calculating the predicted purchase price and rate of return by machine learning using the GRU model.
도 11을 참조하면, 다른 일 실시예에 따른 예측 구매가 및 수익률을 산출하는 방법은 가격 데이터 획득 및 분석하는 단계(S421), 가격 데이터를 망각 게이트 및 업데이트 게이트에 입력하는 단계(S422), 망각 게이트의 출력 결과에 기초하여 후보군을 산출하는 단계(S423), 업데이트 게이트의 출력 결과 및 산출한 후보군에 기초하여 은닉층을 산출하는 단계(S424), 산출한 은닉층에 기초하여 예측 구매가를 산출하는 단계(S425) 및 미래 가격 추이 및 수익률을 산출하는 단계(S426)를 포함할 수 있다.Referring to FIG. 11, a method of calculating the predicted purchase price and rate of return according to another embodiment includes obtaining and analyzing price data (S421), inputting the price data into a forget gate and an update gate (S422), and forgetting. A step of calculating a candidate group based on the output result of the gate (S423), a step of calculating a hidden layer based on the output result of the update gate and the calculated candidate group (S424), and a step of calculating a predicted purchase price based on the calculated hidden layer ( It may include steps S425) and calculating future price trends and rates of return (S426).
가격 데이터 획득 및 분석하는 단계(S421)는 도 10의 단계 S411에서와 마찬가지로 작품에 대한 과거 거래 내역에 기반하여 시계열적인 가격 변동 추이를 포함하는 가격 데이터를 획득하고 이를 전처리 및/또는 분석하는 단계일 수 있다. 그러나, 특정 작품에 대한 과거 가격 데이터가 없는 경우, 상기 특정 작품과 유사한 작품의 과거 가격 데이터를 이용할 수도 있다.The step of acquiring and analyzing price data (S421), similar to step S411 of FIG. 10, is a step of acquiring price data including a time-series price change trend based on past transaction history for the work and pre-processing and/or analyzing it. You can. However, if there is no past price data for a specific work, past price data for works similar to the specific work may be used.
가격 데이터를 망각 게이트 및 업데이트 게이트에 입력하는 단계(S422)는 가격 데이터를 일정 부분 초기화시키기 위해 망각 게이트에 입력하고, 과거 가격 정보와 현재 가격 정보의 반영 비율을 결정하기 위해 업데이트 게이트에 입력하는 단계일 수 있다.The step of inputting price data into the forget gate and the update gate (S422) is the step of inputting the price data into the forget gate to initialize a certain portion of the price data and inputting it into the update gate to determine the reflection ratio of past price information and current price information. It can be.
구체적으로, 프로세서는 망각 게이트에서, 시그모이드 함수의 출력을 이용해 0 또는 1 값을 이전 은닉층에 곱함으로써, 가격 데이터의 일정 부분을 초기화시킬 수 있다. 또한, 프로세서는 업데이트 게이트에서, 시그모이드의 출력을 현재 가격 정보에 곱하고, 1에서 시그모이드의 출력을 뺀 값을 과거 가격 정보에 곱함으로써, 과거와 현재의 정보 반영 비율을 결정할 수 있다.Specifically, the processor may initialize a certain portion of the price data by multiplying the previous hidden layer by a value of 0 or 1 using the output of the sigmoid function in the forget gate. Additionally, the processor may determine the ratio of past and present information reflection by multiplying the output of the sigmoid by the current price information and multiplying the past price information by 1 minus the output of the sigmoid in the update gate.
망각 게이트의 출력 결과에 기초하여 후보군을 산출하는 단계(S423)는 망각 게이트에 의해 일정 부분이 초기화된 가격 데이터를 이용하여 예측 구매가의 후보군을 산출하는 단계일 수 있다. 프로세서는 과거 은닉층 정보를 그대로 이용하지 않고, 망각 게이트의 출력 결과를 이용함으로써, 후보군을 계산한다.The step of calculating a candidate group based on the output result of the forgetting gate (S423) may be a step of calculating a candidate group of the predicted purchase price using price data partially initialized by the forgetting gate. The processor calculates the candidate group by using the output result of the forgetting gate rather than using the past hidden layer information as is.
업데이트 게이트의 출력 결과 및 산출한 후보군에 기초하여 은닉층을 산출하는 단계(S424)는 과거와 현재의 반영 비율을 고려한 가격 데이터와 단계 S423에서 산출한 후보군에 기초하여, 은닉층을 계산하는 단계일 수 있다.The step of calculating a hidden layer based on the output result of the update gate and the calculated candidate group (S424) may be a step of calculating a hidden layer based on the price data considering the past and present reflection ratios and the candidate group calculated in step S423. .
산출한 은닉층에 기초하여 예측 구매가를 산출하는 단계(S425)는 단계 S424에서 산출한 은닉층으로 모델링된 머신 러닝 모델에 가격 데이터를 입력하여, 예측 구매가를 출력하는 단계일 수 있다.The step of calculating the predicted purchase price based on the calculated hidden layer (S425) may be a step of inputting price data into a machine learning model modeled with the hidden layer calculated in step S424 and outputting the predicted purchase price.
미래 가격 추이 및 수익률을 산출하는 단계(S426)는 단계 S425에서 사용한 머신 러닝 모델에 기초하여, 미래 시점에 대한 예측 구매가와 그 시점에서의 수익률을 산출하는 단계일 수 있다. 이때, 프로세서는 단계 S425에서 출력한 예측 구매가를 다시 모델에 반영하여 재모델링한 후, 미래 시점에서의 구매가와 수익률을 예측할 수도 있다. 이때, 프로세서는 재모델링을 위해, 단계 S425에서 출력한 예측 구매가를 포함한 새로운 가격 데이터를 활용하기 위해, 단계 S424 및 S425에서 산출한 후보군과 은닉층을 다시 산출할 수 있다.The step of calculating the future price trend and rate of return (S426) may be a step of calculating the predicted purchase price for a future point in time and the rate of return at that point in time, based on the machine learning model used in step S425. At this time, the processor may reflect the predicted purchase price output in step S425 back into the model, remodel it, and then predict the purchase price and rate of return at a future point in time. At this time, the processor may recalculate the candidate group and hidden layer calculated in steps S424 and S425 in order to use new price data including the predicted purchase price output in step S425 for remodeling.
프로세서는 도 10의 ARIMA 모델과 도 11의 GRU 모델을 모두 사용하여 예측 구매가를 산출한 후, 두 모델의 정확도를 측정할 수 있다. 이때, 정확도는 과거 데이터의 확인, 전문가의 의견, 실제 거래 또는 경매 호가 등에 의해 측정될 수 있다. 프로세서는 두 모델 중 정확도가 높은 모델에서 출력된 예측 구매가를 사용자에게 제공할 수 있다.The processor can calculate the predicted purchase price using both the ARIMA model of FIG. 10 and the GRU model of FIG. 11 and then measure the accuracy of the two models. At this time, accuracy can be measured by confirmation of past data, expert opinion, actual transaction or auction price, etc. The processor can provide the user with a predicted purchase price output from the model with higher accuracy among the two models.
도 12는 일 실시예에 따른 공동 구매자를 모집하는 방법의 순서도이다.Figure 12 is a flowchart of a method for recruiting joint buyers according to an embodiment.
도 12를 참조하면, 일 실시예에 따른 공동 구매자를 모집하는 방법은 사용자를 추출하는 단계(S510) 및 추출된 사용자에게 공동 구매와 관련된 정보를 제공하는 단계(S520)를 포함할 수 있다.Referring to FIG. 12, a method of recruiting joint buyers according to an embodiment may include extracting users (S510) and providing information related to joint purchasing to the extracted users (S520).
사용자를 추출하는 단계(S510)는 특정 작품에 대해 구매 의사가 있을 가능성이 높은 사용자를 추출하는 단계일 수 있다. 구체적으로, 프로세서는 제1 사용자가 제1 검색 조건을 입력하여 제1 작품을 구매하기로 선택한 경우, 상기 제1 검색 조건을 과거에 입력한 적이 있는 제2 사용자를 추출할 수 있다. 또는 프로세서는 상기 제1 검색 조건에 포함되는 항목들 중 적어도 하나 이상의 항목의 세부 검색 조건이 동일한 검색 조건을 과거에 입력한 적이 있는 제2 사용자를 추출할 수 있다. 또는 검색뿐만 아니라, 프로세서는 구매/경매 이력이 있는 사용자도 추출할 수 있다.The user extraction step (S510) may be a step of extracting users who are likely to have a purchase intention for a specific work. Specifically, when the first user enters the first search condition and selects to purchase the first work, the processor may extract a second user who has entered the first search condition in the past. Alternatively, the processor may extract a second user who has previously entered a search condition in which the detailed search condition for at least one item among the items included in the first search condition is the same. Alternatively, in addition to searches, the processor can also extract users with purchase/auction history.
예를 들어, 검색 조건이 작가-Alena Shymchonak, 제작년도-2020년, 사이즈(가로)-40 이상, 사이즈(세로)-60 이상, 카테고리-Oil인 경우, 프로세서는 상기 검색 조건과 동일한 검색 조건을 과거에 검색한 이력이 있는 사용자를 추출할 수 있다.For example, if the search conditions are writer-Alena Shymchonak, production year-2020, size (width)-40 or more, size (height)-60 or more, and category-Oil, the processor will use the same search conditions as the above search conditions. You can extract users who have searched in the past.
또한 위 예시에서, 프로세서는 작가-Alena Shymchonak, 제작년도-2020년의 검색 조건을 과거에 검색한 이력이 있는 사용자를 추출할 수 있다. 즉, 프로세서는 제1 사용자가 검색한 검색 조건의 일부만 일치하는 제2 검색 조건을 과거에 입력한 이력이 있는 제2 사용자를 추출할 수도 있다.Also, in the above example, the processor can extract users who have searched in the past for the following search terms: Author - Alena Shymchonak, Production Year - 2020. That is, the processor may extract a second user who has previously entered a second search condition that matches only part of the search condition searched by the first user.
또는, 프로세서는 통신부(1200)에 의해 획득된 사용자 정보(성별, 나이, 관심있는 작가, 좋아하는 화풍, 취향 등을 포함함)를 기초로, 상기 사용자 정보의 일부가 일치하는 다른 사용자를 추출할 수도 있다.Alternatively, the processor may extract other users matching part of the user information based on the user information (including gender, age, artist of interest, favorite painting style, taste, etc.) acquired by the communication unit 1200. It may be possible.
추출된 사용자에게 공동 구매와 관련된 정보를 제공하는 단계(S520)는 단계 S510에서 추출된 사용자에게 공동 구매를 제안하는 정보를 제공하는 단계일 수 있다. 구체적으로, 프로세서는 추출된 사용자의 단말기에 작품의 예측 구매가, 수익률, 매각 시기, 공동 구매 모집 현황에 관한 정보를 포함하는 데이터를 전송할 수 있다.The step of providing information related to a group purchase to the extracted users (S520) may be a step of providing information suggesting a group purchase to the users extracted in step S510. Specifically, the processor may transmit data containing information about the predicted purchase price, rate of return, sale period, and group purchase solicitation status of the work to the extracted user's terminal.
위와 같이, 프로세서는 사용자가 특정 작품의 공동 구매를 원할 경우, 사용자의 취향이 유사하거나, 상기 특정 작품의 구매 가능성이 높은 사용자를 추출하여, 상기 추출된 사용자에게 공동 구매를 위한 데이터를 제공할 수 있다.As above, if a user wants to jointly purchase a specific work, the processor can extract users who have similar tastes or are likely to purchase the specific work, and provide data for joint purchase to the extracted users. there is.
도 13은 일 실시예에 따른 미술품 거래 서비스의 화면 예시를 나타낸 도면이다.Figure 13 is a diagram showing an example screen of an art trading service according to an embodiment.
도 13을 참조하면, 본원 발명의 미술품 거래 플랫폼은 작품 또는 작가를 검색하면 작품에 대한 정보(제작년도, 카테고리, 사이즈 등)뿐만 아니라, 미래 가격 추이, 예측 구매가 및 수익률을 제공할 수 있다. 플랫폼이 제공하는 정보는 표나 그래프 형태로 사용자에게 제공될 수 있다.Referring to FIG. 13, the art trading platform of the present invention can provide not only information about the work (production year, category, size, etc.), but also future price trends, predicted purchase price, and rate of return when searching for a work or artist. Information provided by the platform can be provided to users in the form of tables or graphs.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다The method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded on a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, etc., singly or in combination. Program instructions recorded on the medium may be specially designed and configured for the embodiment or may be known and available to those skilled in the art of computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floptical disks. -Includes optical media (magneto-optical media) and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, etc. Examples of program instructions include machine language code, such as that produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter, etc. The hardware devices described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.As described above, although the embodiments have been described with limited examples and drawings, various modifications and variations can be made by those skilled in the art from the above description. For example, the described techniques are performed in a different order than the described method, and/or components of the described system, structure, device, circuit, etc. are combined or combined in a different form than the described method, or other components are used. Alternatively, appropriate results may be achieved even if substituted or substituted by an equivalent.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Therefore, other implementations, other embodiments, and equivalents of the claims also fall within the scope of the claims described below.

Claims (14)

  1. 적어도 하나 이상의 프로세서에 의해 수행되는 미술품 거래 관련 데이터 처리 방법에 있어서,In a method of processing data related to art trades performed by at least one processor,
    복수의 작품에 대한 정보를 포함하는 로데이터에 대한 텍스트 유사도 및 이미지 유사도를 산출하는 데이터 전처리를 통해, 상기 복수의 작품에 대한 분류 또는 유사 정보를 포함하는 작품 데이터를 생성하는 단계;Generating work data including classification or similar information for a plurality of works through data preprocessing to calculate text similarity and image similarity for raw data containing information about a plurality of works;
    작품명, 작가명, 이미지, 카테고리, 사이즈, 가격 및 제작년도 중 적어도 하나 이상을 포함하는 검색 조건을 획득하는 단계;Obtaining search conditions including at least one of the work name, artist name, image, category, size, price, and production year;
    상기 작품 데이터 및 상기 검색 조건에 기초하여, 적어도 하나 이상의 작품에 대한 정보를 포함하는 선별 데이터를 제공하는 단계; 및providing selection data including information about at least one work based on the work data and the search conditions; and
    시간에 따른 가격 정보를 포함하는 제1 가격 데이터를 기반으로 머신 러닝을 이용하여 상기 선별 데이터에 포함된 제1 작품에 대한 제1 예측 구매가를 산출하는 단계를 포함하는Comprising the step of calculating a first predicted purchase price for the first work included in the selection data using machine learning based on first price data including price information over time.
    미술품 거래 관련 데이터 처리 방법.How we process data related to art transactions.
  2. 제1항에 있어서,According to paragraph 1,
    상기 작품 데이터를 생성하는 단계는,The step of generating the work data is,
    상기 로데이터에 포함된 텍스트를 벡터화하는 단계;vectorizing text included in the raw data;
    벡터화된 텍스트에 기초하여 항목마다 텍스트 유사도를 산출하는 단계; 및Calculating text similarity for each item based on the vectorized text; and
    상기 텍스트 유사도에 기초하여 항목마다 작품들을 그룹화하는 단계를 포함하는Including the step of grouping works for each item based on the text similarity.
    미술품 거래 관련 데이터 처리 방법.How we process data related to art transactions.
  3. 제1항에 있어서,According to paragraph 1,
    상기 작품 데이터를 생성하는 단계는,The step of generating the work data is,
    상기 로데이터에 포함된 이미지의 특징점을 추출하는 단계;extracting feature points of images included in the raw data;
    상기 특징점에 기초하여 이미지 유사도를 산출하는 단계; 및calculating image similarity based on the feature points; and
    상기 이미지 유사도에 기초하여 작품들을 그룹화하는 단계를 포함하는Including grouping works based on the image similarity.
    미술품 거래 관련 데이터 처리 방법.How we process data related to art transactions.
  4. 제1항에 있어서,According to paragraph 1,
    상기 작품 데이터를 생성하는 단계는,The step of generating the work data is,
    상기 로데이터에 포함된 이미지의 픽셀값을 기초로 히스토그램을 생성하는 단계;generating a histogram based on pixel values of the image included in the raw data;
    상기 히스토그램에 기초하여 이미지 유사도를 산출하는 단계; 및calculating image similarity based on the histogram; and
    상기 이미지 유사도에 기초하여 작품들을 그룹화하는 단계를 포함하는Including grouping works based on the image similarity.
    미술품 거래 관련 데이터 처리 방법.How we process data related to art transactions.
  5. 제1항에 있어서,According to paragraph 1,
    상기 작품 데이터를 생성하는 단계는,The step of generating the work data is,
    상기 로데이터에 포함된 이미지의 픽셀값을 기초로 밀도 분포를 추출하는 단계;extracting a density distribution based on pixel values of images included in the raw data;
    상기 밀도 분포에 기초하여 이미지 유사도를 산출하는 단계; 및calculating image similarity based on the density distribution; and
    상기 이미지 유사도에 기초하여 작품들을 그룹화하는 단계를 포함하는Including grouping works based on the image similarity.
    미술품 거래 관련 데이터 처리 방법.How we process data related to art transactions.
  6. 제1항에 있어서,According to paragraph 1,
    상기 선별 데이터를 제공하는 단계는,The step of providing the selection data is,
    상기 검색 조건에 매칭되는 작품이 없는 경우, 상기 검색 조건에 포함된 항목들 중 적어도 하나 이상의 항목이 매칭되는 유사한 작품을 선별하는 단계를 포함하는If there is no work matching the search conditions, selecting similar works that match at least one item among the items included in the search conditions.
    미술품 거래 관련 데이터 처리 방법.How we process data related to art transactions.
  7. 제1항에 있어서,According to paragraph 1,
    상기 제1 예측 구매가를 산출하는 단계는,The step of calculating the first predicted purchase price is,
    상기 제1 가격 데이터에 기초하여 제1 자기상관함수 및 제1 편자기상관함수를 추출하는 단계;extracting a first autocorrelation function and a first partial autocorrelation function based on the first price data;
    상기 제1 가격 데이터, 상기 제1 자기상관함수 및 상기 제1 편자기상관함수에 기초하여, 자기회귀 차수, 차분 차수 및 이동평균 차수를 설정하는 단계;setting an autoregressive order, a difference order, and a moving average order based on the first price data, the first autocorrelation function, and the first partial autocorrelation function;
    상기 자기회귀 차수, 상기 차분 차수 및 상기 이동평균 차수를 이용하여 상기 제1 가격 데이터를 로그 변환 또는 차분하여 제2 가격 데이터를 산출하는 단계;Calculating second price data by log-transforming or differentiating the first price data using the autoregressive order, the difference order, and the moving average order;
    상기 제2 가격 데이터의 정상성을 확인하여, 상기 자기회귀 차수, 상기 차분 차수 및 상기 이동평균 차수를 조정하는 단계; 및Confirming the normality of the second price data and adjusting the autoregressive order, the difference order, and the moving average order; and
    조정된 자기회귀 차수, 차분 차수 및 이동평균 차수에 기초하여, 상기 제1 작품에 대한 상기 제1 예측 구매가를 산출하는 단계를 포함하는Comprising the step of calculating the first predicted purchase price for the first work based on the adjusted autoregressive order, difference order, and moving average order.
    미술품 거래 관련 데이터 처리 방법.How we process data related to art transactions.
  8. 제7항에 있어서,In clause 7,
    상기 제1 작품에 대한 가격 데이터가 없는 경우, 상기 제1 가격 데이터는 상기 제1 작품의 정보에 포함된 항목들 중 적어도 하나 이상의 항목이 매칭되는 유사한 작품인 제2 작품에 대한 가격 데이터인If there is no price data for the first work, the first price data is price data for a second work that is a similar work that matches at least one item among the items included in the information on the first work.
    미술품 거래 관련 데이터 처리 방법.How we process data related to art transactions.
  9. 제1항에 있어서,According to paragraph 1,
    상기 제1 가격 데이터를 망각 게이트 및 업데이트 게이트에 입력시키는 단계;Inputting the first price data into a forget gate and an update gate;
    상기 망각 게이트의 출력 결과에 기초하여 후보군을 산출하는 단계;calculating a candidate group based on the output result of the forgetting gate;
    상기 업데이트 게이트의 출력 결과 및 산출된 후보군에 기초하여 은닉층을 산출하는 단계; 및calculating a hidden layer based on the output result of the update gate and the calculated candidate group; and
    산출된 은닉층에 기초하여, 상기 제1 작품에 대한 상기 제1 예측 구매가를 산출하는 단계를 포함하는Comprising the step of calculating the first predicted purchase price for the first work based on the calculated hidden layer.
    미술품 거래 관련 데이터 처리 방법.How we process data related to art transactions.
  10. 제9항에 있어서,According to clause 9,
    상기 제1 작품에 대한 가격 데이터가 없는 경우, 상기 제1 가격 데이터는 상기 제1 작품의 정보에 포함된 항목들 중 적어도 하나 이상의 항목이 매칭되는 유사한 작품인 제2 작품에 대한 가격 데이터인If there is no price data for the first work, the first price data is price data for a second work that is a similar work that matches at least one item among the items included in the information on the first work.
    미술품 거래 관련 데이터 처리 방법.How we process data related to art transactions.
  11. 제1항에 있어서,According to paragraph 1,
    과거에 상기 검색 조건을 입력했던 사용자 또는 상기 검색 조건에 포함된 항목들 중 적어도 하나 이상의 항목이 매칭되는 유사한 작품을 구매한 이력이 있는 사용자를 추출하는 단계; 및extracting users who have entered the search conditions in the past or users who have a history of purchasing similar works that match at least one item among the items included in the search conditions; and
    상기 제1 작품의 공동 구매를 위해, 상기 사용자의 단말기에 상기 제1 작품에 대한 정보, 상기 제1 예측 구매가 및 공동 구매자 모집 현황에 대한 정보를 포함하는 공동 구매 제안 데이터를 전송하는 단계를 포함하는For group purchase of the first work, transmitting group purchase proposal data including information on the first work, the first predicted purchase price, and information on the joint buyer recruitment status to the user's terminal. doing
    미술품 거래 관련 데이터 처리 방법.How we process data related to art transactions.
  12. 제7항에 있어서,In clause 7,
    조정된 자기회귀 차수, 차분 차수, 이동평균 차수 및 상기 제1 예측 구매가에 기초하여, 상기 제1 작품에 대한 미래 가격 추이 및 수익률을 산출하는 단계를 더 포함하는Based on the adjusted autoregressive order, difference order, moving average order, and the first predicted purchase price, further comprising calculating a future price trend and rate of return for the first work.
    미술품 거래 관련 데이터 처리 방법.How we process data related to art transactions.
  13. 제9항에 있어서,According to clause 9,
    산출된 은닉층 및 상기 제1 예측 구매가에 기초하여, 상기 제1 작품에 대한 미래 가격 추이 및 수익률을 산출하는 단계를 더 포함하는Based on the calculated hidden layer and the first predicted purchase price, further comprising calculating a future price trend and rate of return for the first work.
    미술품 거래 관련 데이터 처리 방법.How we process data related to art transactions.
  14. 제1항 내지 제13항에 기재된 미술품 거래 관련 데이터 처리 방법을 실행시키도록 컴퓨터로 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램.A computer program stored in a computer-readable recording medium to execute the art trade-related data processing method according to claims 1 to 13.
PCT/KR2022/009501 2022-07-01 2022-07-01 Method for processing art work transaction-related data WO2024005242A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020220081054A KR20240003772A (en) 2022-07-01 2022-07-01 Method for processing data related to art transaction
KR10-2022-0081054 2022-07-01

Publications (1)

Publication Number Publication Date
WO2024005242A1 true WO2024005242A1 (en) 2024-01-04

Family

ID=89380768

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2022/009501 WO2024005242A1 (en) 2022-07-01 2022-07-01 Method for processing art work transaction-related data

Country Status (2)

Country Link
KR (1) KR20240003772A (en)
WO (1) WO2024005242A1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140082126A (en) * 2012-12-23 2014-07-02 전남대학교산학협력단 System and method for image classification using color histogram
KR20200140588A (en) * 2019-06-07 2020-12-16 한국과학기술연구원 System and method for providing image-based service to sell and buy product
WO2021002543A1 (en) * 2019-07-04 2021-01-07 (주)크래프트테크놀로지스 Device, method, and computer program for predicting price of asset on basis of artificial intelligence
KR20210042709A (en) * 2019-10-10 2021-04-20 고려대학교 산학협력단 Method and server for stock movement prediction using corporate relation data
KR20210056072A (en) * 2019-11-08 2021-05-18 (주)투데이칩스 Smart group buying relay apparatus, system and method thereof

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140082126A (en) * 2012-12-23 2014-07-02 전남대학교산학협력단 System and method for image classification using color histogram
KR20200140588A (en) * 2019-06-07 2020-12-16 한국과학기술연구원 System and method for providing image-based service to sell and buy product
WO2021002543A1 (en) * 2019-07-04 2021-01-07 (주)크래프트테크놀로지스 Device, method, and computer program for predicting price of asset on basis of artificial intelligence
KR20210042709A (en) * 2019-10-10 2021-04-20 고려대학교 산학협력단 Method and server for stock movement prediction using corporate relation data
KR20210056072A (en) * 2019-11-08 2021-05-18 (주)투데이칩스 Smart group buying relay apparatus, system and method thereof

Also Published As

Publication number Publication date
KR20240003772A (en) 2024-01-10

Similar Documents

Publication Publication Date Title
CN109118336B (en) Information recommendation method and device, computer equipment and storage medium
WO2016013914A1 (en) Method, apparatus, system and computer program for providing and displaying product information
WO2010119996A1 (en) Method and apparatus for providing moving image advertisements
WO2016167424A1 (en) Answer recommendation device, and automatic sentence completion system and method
WO2019027259A1 (en) Apparatus and method for providing summarized information using an artificial intelligence model
WO2012134180A2 (en) Emotion classification method for analyzing inherent emotions in a sentence, and emotion classification method for multiple sentences using context information
JP5682569B2 (en) Color analysis apparatus, color analysis method, and color analysis program
EP3602334A1 (en) Apparatus and method for providing summarized information using an artificial intelligence model
WO2020222623A9 (en) System and method for automatically constructing content for strategic sales
WO2018225939A1 (en) Method, device, and computer program for providing image-based advertisement
WO2024025220A1 (en) System for providing online advertisement content platform
WO2014137118A1 (en) Method and apparatus for recommending affiliated store by using reverse auction
WO2020175732A1 (en) Commercial product recommendation method and device therefor
WO2022019641A1 (en) Method and system for presenting sale price of agricultural products
WO2021071121A1 (en) Image-based purchasing behavior recognition system and method
WO2020168606A1 (en) Advertisement video optimising method, apparatus and device and computer readable storage medium
WO2014119873A1 (en) Method for generating and identifying preferred image id code, and method for providing information using same
WO2018043859A1 (en) Device for automatically analyzing rental item preference by means of user image, and method using same
WO2024005242A1 (en) Method for processing art work transaction-related data
US20220180400A1 (en) Information processing apparatus, display system, and information processing method
WO2019142990A1 (en) System for providing business target matching platform via linkage to customer database
WO2020213936A1 (en) Method, device, and system for controlling knowledge sharing platform
WO2023195579A1 (en) Server and method for providing recommended investment item on basis of investment portfolio of investor
WO2020060012A1 (en) A computer implemented platform for providing contents to an augmented reality device and method thereof
WO2022154213A1 (en) Method and device for generating user-advertisement matching list for online advertisement

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22949535

Country of ref document: EP

Kind code of ref document: A1