KR20220130945A - Apparatus, method and computer program for executing assignment of logistics vehicles - Google Patents
Apparatus, method and computer program for executing assignment of logistics vehicles Download PDFInfo
- Publication number
- KR20220130945A KR20220130945A KR1020210035825A KR20210035825A KR20220130945A KR 20220130945 A KR20220130945 A KR 20220130945A KR 1020210035825 A KR1020210035825 A KR 1020210035825A KR 20210035825 A KR20210035825 A KR 20210035825A KR 20220130945 A KR20220130945 A KR 20220130945A
- Authority
- KR
- South Korea
- Prior art keywords
- vehicle
- information
- dispatch
- unit
- order information
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 44
- 238000004590 computer program Methods 0.000 title claims description 16
- 238000004088 simulation Methods 0.000 claims abstract description 51
- 230000006870 function Effects 0.000 claims abstract description 48
- 239000000872 buffer Substances 0.000 claims abstract description 40
- 230000002787 reinforcement Effects 0.000 claims abstract description 33
- 239000003795 chemical substances by application Substances 0.000 claims abstract description 25
- 230000009471 action Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 3
- 230000008569 process Effects 0.000 description 14
- 230000007704 transition Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Images
Classifications
-
- G06Q50/28—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
본 발명은 물류 차량의 배차를 수행하는 장치, 방법 및 컴퓨터 프로그램에 관한 것이다. The present invention relates to an apparatus, method and computer program for distributing a logistics vehicle.
물류(logistics)란 재화나 서비스를 생산자로부터 소비자 또는 특정한 지역으로 이동시키는 행위, 또는 이를 위한 재고계획, 배송계획, 조달계획 등을 포괄적으로 의미한다. 물류 서비스는 운송의 용이성을 위해 행정 구역의 구/동 단위로 운송 지점에 대한 클러스터(cluster)를 생성한다. 여기서, 물류 회사의 담당자가 클러스터 내 배송 지점 수, 밀집도 등을 직접 설정함으로써, 인력기반의 노하우에 의존적이었다. Logistics refers to the act of moving goods or services from producers to consumers or a specific region, or inventory planning, delivery planning, procurement planning, etc. for this purpose. Logistics service creates clusters for transportation points in districts/dong units of administrative districts for ease of transportation. Here, the person in charge of the logistics company directly set the number and density of delivery points in the cluster, so it was dependent on the manpower-based know-how.
최근에는 알고리즘에 의해 물류 운송 계획을 실시간으로 수립하고 있으며, 이와 관련하여 선행기술인 한국공개특허 제 2010-0062848호는 물류 운영 방법 및 그 시스템을 개시하고 있다. Recently, a logistics transportation plan is established in real time by an algorithm, and in this regard, Korea Patent Publication No. 2010-0062848, which is a prior art, discloses a logistics operation method and a system thereof.
물류 운송 기사들은 물류 운송 계획에 기초하여 주문된 물품의 배차를 지시받게 된다. 그러나 물류 운송 기사들은 물품의 품목, 배송 위치 등에 대하여 서로 선호도가 다르므로, 이로 인해, 자신이 물품을 운송할 배차 경로에 대한 만족도가 달라질 수 있다. 이러한 점을 고려하여, 최근에는 AI(Artificial Intelligence) 또는 휴리스틱한 방식의 자동 배차 시스템을 이용한 자동 배차가 이용되고 있으나, 실시간으로 주문이 발생하는 업종의 경우에는 배차를 효율적으로 지시할 수 없다는 단점을 가지고 있다. Logistics transport drivers are instructed to dispatch the ordered goods based on the logistic transport plan. However, since the logistics and transport drivers have different preferences with respect to the item of the article, the delivery location, and the like, satisfaction with the dispatch route through which they will transport the article may vary. In consideration of this, automatic dispatch using AI (Artificial Intelligence) or heuristic automatic dispatch system has been used recently. Have.
가상의 주문 정보 및 차량 정보에 기초하여 물류 차량의 배차 여부를 결정하고, 물류 차량의 배차 여부에 기초하여 기설정된 자동배차 모델을 통해 물류 차량을 배차하고, 물류 차량의 배차 결과에 기초하여 버퍼에 저장된 차량 정보를 갱신하도록 물류 차량의 배차 시점을 시뮬레이션하는 장치, 방법 및 컴퓨터 프로그램을 제공하고자 한다.Determines whether to dispatch a logistics vehicle based on virtual order information and vehicle information, dispatches a logistics vehicle through a preset automatic dispatch model based on whether the logistics vehicle is dispatched, and stores in a buffer based on the distribution result of the logistics vehicle An object of the present invention is to provide an apparatus, a method, and a computer program for simulating the dispatch time of a logistics vehicle to update stored vehicle information.
시뮬레이션의 결과에 기초하여 실시간 주문 정보에 대하여 물류 차량의 배차 시점을 결정하고, 물류 차량의 배차 시점에 기초하여 물류 차량의 배차를 지시하는 장치, 방법 및 컴퓨터 프로그램을 제공하고자 한다. An object of the present invention is to provide an apparatus, a method, and a computer program for determining a dispatch time of a logistics vehicle with respect to real-time order information based on a simulation result and instructing the dispatch of a logistics vehicle based on the dispatch time of the logistics vehicle.
GBP(Generator, Buffer, Processor)의 모델이 강화학습 모델의 환경(Environment)으로 기능함과 동시에 강화학습 모델의 에이전트(Agent)로 기능하도록 하는 장치, 방법 및 컴퓨터 프로그램을 제공하고자 한다.It is intended to provide an apparatus, method, and computer program that enables the GBP (Generator, Buffer, Processor) model to function as an environment for the reinforcement learning model and as an agent for the reinforcement learning model.
다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다. However, the technical problems to be achieved by the present embodiment are not limited to the technical problems described above, and other technical problems may exist.
상술한 기술적 과제를 달성하기 위한 수단으로서, 본 발명의 일 실시예는, 과거 운송 데이터에 기초하여 가상의 주문 정보를 생성하는 주문 정보 생성부, 상기 가상의 주문 정보 및 물류 차량의 차량 정보를 버퍼에 저장하는 저장부, 상기 가상의 주문 정보 및 상기 차량 정보에 기초하여 상기 물류 차량의 배차 여부를 결정하는 결정부 및 상기 물류 차량의 배차 여부에 기초하여 기설정된 자동배차 모델을 통해 상기 물류 차량을 배차하고, 상기 물류 차량의 배차 결과에 기초하여 상기 버퍼에 저장된 차량 정보를 갱신하는 갱신부를 포함하여 상기 물류 차량의 배차 시점을 시뮬레이션하는 시뮬레이션부 및 상기 시뮬레이션의 결과에 기초하여 실시간 주문 정보에 대하여 상기 물류 차량의 배차 시점을 결정하는 배차 시점 결정부 및 상기 물류 차량의 배차 시점에 기초하여 상기 물류 차량의 배차를 지시하는 배차 지시부를 포함하고, 상기 주문 정보 생성부, 상기 저장부 및 상기 시뮬레이션부는 강화학습 모델의 환경(Environment)으로 기능하고, 상기 결정부는 상기 강화학습 모델의 에이전트(Agent)로 기능하는 배차 수행 장치를 제공할 수 있다. As a means for achieving the above-described technical problem, an embodiment of the present invention is an order information generating unit that generates virtual order information based on past transportation data, and buffers the virtual order information and vehicle information of the distribution vehicle. The logistics vehicle through a storage unit to store in, a determination unit for determining whether to dispatch the distribution vehicle based on the virtual order information and the vehicle information, and a preset automatic distribution model based on whether the distribution vehicle is dispatched A simulation unit simulating the dispatch time of the distribution vehicle, including an update unit for distributing the vehicle, and updating the vehicle information stored in the buffer based on the distribution result of the distribution vehicle, and the real-time order information based on the result of the simulation and a dispatch time determining unit for determining the dispatch time of the distribution vehicle and a dispatch instruction unit for instructing the dispatch of the distribution vehicle based on the dispatch time of the distribution vehicle, wherein the order information generation unit, the storage unit, and the simulation unit are reinforced It may provide a vehicle dispatching device that functions as an environment of the learning model, and the determining unit functions as an agent of the reinforcement learning model.
본 발명의 다른 실시예는, 주문 정보 생성부에 의해 과거 운송 데이터에 기초하여 가상의 주문 정보를 생성하는 단계, 저장부에 의해 상기 가상의 주문 정보 및 물류 차량의 차량 정보를 버퍼에 저장하는 단계, 시뮬레이션부의 결정부에 의해 상기 가상의 주문 정보 및 상기 차량 정보에 기초하여 상기 물류 차량의 배차 여부를 결정하고, 상기 시뮬레이션부의 갱신부에 의해 상기 물류 차량의 배차 여부에 기초하여 기설정된 자동배차 모델을 통해 상기 물류 차량을 배차하고, 상기 물류 차량의 배차 결과에 기초하여 상기 버퍼에 저장된 차량 정보를 갱신하도록 상기 물류 차량의 배차 시점을 시뮬레이션하는 단계, 상기 시뮬레이션의 결과에 기초하여 실시간 주문 정보에 대하여 상기 물류 차량의 배차 시점을 결정하는 단계 및 상기 물류 차량의 배차 시점에 기초하여 상기 물류 차량의 배차를 지시하는 단계를 포함하고, 상기 주문 정보 생성부, 상기 저장부 및 상기 시뮬레이션부는 강화학습 모델의 환경으로 기능하고, 상기 결정부는 상기 강화학습 모델의 에이전트로 기능하는 배차 수행 방법을 제공할 수 있다. Another embodiment of the present invention includes the steps of generating virtual order information based on past transportation data by an order information generating unit, and storing the virtual order information and vehicle information of a logistics vehicle in a buffer by a storage unit , determines whether the distribution vehicle is dispatched based on the virtual order information and the vehicle information by the determining unit of the simulation unit, and a preset automatic dispatch model based on whether the distribution vehicle is dispatched by the update unit of the simulation unit distributing the logistics vehicle through and simulating the dispatch timing of the logistics vehicle to update the vehicle information stored in the buffer based on the dispatch result of the logistics vehicle, based on the result of the simulation for real-time order information Determining the dispatch time of the distribution vehicle and instructing the distribution of the distribution vehicle based on the dispatch time of the distribution vehicle, wherein the order information generation unit, the storage unit, and the simulation unit of the reinforcement learning model It functions as an environment, and the determining unit may provide a method for performing dispatch that functions as an agent of the reinforcement learning model.
본 발명의 또 다른 실시예는, 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우, 주문 정보 생성부에 의해 과거 운송 데이터에 기초하여 가상의 주문 정보를 생성하고, 저장부에 의해 상기 가상의 주문 정보 및 물류 차량의 차량 정보를 버퍼에 저장하고, 시뮬레이션부의 결정부에 의해 상기 가상의 주문 정보 및 상기 차량 정보에 기초하여 상기 물류 차량의 배차 여부를 결정하고, 상기 시뮬레이션부의 갱신부에 의해 상기 물류 차량의 배차 여부에 기초하여 기설정된 자동배차 모델을 통해 상기 물류 차량을 배차하고, 상기 물류 차량의 배차 결과에 기초하여 상기 버퍼에 저장된 차량 정보를 갱신하도록 상기 물류 차량의 배차 시점을 시뮬레이션하고, 배차 시점 결정부에 의해 상기 시뮬레이션의 결과에 기초하여 실시간 주문 정보에 대하여 상기 물류 차량의 배차 시점을 결정하고, 배차 지시부에 의해 상기 물류 차량의 배차 시점에 기초하여 상기 물류 차량의 배차를 지시하고, 상기 주문 정보 생성부, 상기 저장부 및 상기 시뮬레이션부는 강화학습 모델의 환경으로 기능하고, 상기 결정부는 상기 강화학습 모델의 에이전트로 기능하도록 하는 명령어들의 시퀀스를 포함하는 매체에 저장된 컴퓨터 프로그램을 제공할 수 있다. Another embodiment of the present invention, when the computer program is executed by the computing device, generates virtual order information based on past transportation data by the order information generating unit, and the virtual order information and logistics by the storage unit Storing the vehicle information of the vehicle in a buffer, determining whether to dispatch the distribution vehicle based on the virtual order information and the vehicle information by the determination unit of the simulation unit, and dispatching the distribution vehicle by the update unit of the simulation unit Dispatching the distribution vehicle through a preset automatic distribution model based on whether or not, simulates the dispatch time of the distribution vehicle to update the vehicle information stored in the buffer based on the dispatch result of the distribution vehicle, and a dispatch time determination unit determines the dispatch time of the distribution vehicle with respect to the real-time order information based on the result of the simulation, and instructs the dispatch of the distribution vehicle based on the dispatch time of the distribution vehicle by the dispatch instructing unit, and generates the order information The unit, the storage unit, and the simulation unit may provide a computer program stored in a medium including a sequence of instructions to function as an environment of the reinforcement learning model, and the determination unit to function as an agent of the reinforcement learning model.
상술한 과제 해결 수단은 단지 예시적인 것으로서, 본 발명을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 기재된 추가적인 실시예가 존재할 수 있다.The above-described problem solving means are merely exemplary, and should not be construed as limiting the present invention. In addition to the exemplary embodiments described above, there may be additional embodiments described in the drawings and detailed description.
전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 가상의 주문 정보 및 물류 차량의 차량 정보를 생성하여 버퍼에 저장하고, 버퍼에 저장된 주문 정보 및 차량 정보를 이용하는 강화학습 모델을 기반으로 물류 차량의 배차 여부를 결정하도록 학습하는 장치, 방법 및 컴퓨터 프로그램을 제공할 수 있다.According to any one of the above-described problem solving means of the present invention, virtual order information and vehicle information of a logistics vehicle are generated and stored in a buffer, and a logistics vehicle based on a reinforcement learning model using the order information and vehicle information stored in the buffer It is possible to provide an apparatus, a method and a computer program for learning to determine whether to dispatch or not.
도 1은 본 발명의 일 실시예에 따른 배차 수행 장치의 구성도이다.
도 2는 본 발명의 일 실시예에 따른 가상의 주문 정보를 생성하는 과정을 설명하기 위한 예시적인 도면이다.
도 3은 본 발명의 일 실시예에 따른 가상의 주문 정보 및 물류 차량의 차량 정보를 버퍼에 저장하는 과정을 설명하기 위한 예시적인 도면이다.
도 4는 본 발명의 일 실시예에 따른 주문 정보 및 차량 정보에 기초하여 물류 차량의 배차 여부를 결정하는 과정을 설명하기 위한 예시적인 도면이다.
도 5는 본 발명의 일 실시예에 따른 물류 차량의 배차 시점을 시뮬레이션하는 과정을 설명하기 위한 예시적인 도면이다.
도 6은 본 발명의 일 실시예에 따른 배차 수행 장치에서 물류 차량의 배차를 수행하는 방법의 순서도이다. 1 is a block diagram of an apparatus for performing a vehicle dispatch according to an embodiment of the present invention.
2 is an exemplary diagram for explaining a process of generating virtual order information according to an embodiment of the present invention.
3 is an exemplary view for explaining a process of storing virtual order information and vehicle information of a logistics vehicle in a buffer according to an embodiment of the present invention.
4 is an exemplary view for explaining a process of determining whether to dispatch a logistics vehicle based on order information and vehicle information according to an embodiment of the present invention.
5 is an exemplary view for explaining a process of simulating a dispatch time of a logistics vehicle according to an embodiment of the present invention.
6 is a flowchart of a method for distributing a logistics vehicle in the distributing apparatus according to an embodiment of the present invention.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다. DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art can easily carry out the present invention. However, the present invention may be embodied in several different forms and is not limited to the embodiments described herein. And in order to clearly explain the present invention in the drawings, parts irrelevant to the description are omitted, and similar reference numerals are attached to similar parts throughout the specification.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다. Throughout the specification, when a part is "connected" with another part, this includes not only the case of being "directly connected" but also the case of being "electrically connected" with another element interposed therebetween. . Also, when a part "includes" a certain component, it means that other components may be further included, rather than excluding other components, unless otherwise stated, and one or more other features However, it is to be understood that the existence or addition of numbers, steps, operations, components, parts, or combinations thereof is not precluded in advance.
본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다.In this specification, a "part" includes a unit realized by hardware, a unit realized by software, and a unit realized using both. In addition, one unit may be implemented using two or more hardware, and two or more units may be implemented by one hardware.
본 명세서에 있어서 단말 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말 또는 디바이스에서 수행될 수도 있다.Some of the operations or functions described as being performed by the terminal or device in this specification may be instead performed by a server connected to the terminal or device. Similarly, some of the operations or functions described as being performed by the server may also be performed in a terminal or device connected to the corresponding server.
이하 첨부된 도면을 참고하여 본 발명의 일 실시예를 상세히 설명하기로 한다. Hereinafter, an embodiment of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 본 발명의 일 실시예에 따른 배차 수행 장치의 구성도이다. 도 1을 참조하면, 배차 수행 장치(100)는 주문 정보 생성부(120), 저장부(130), 시뮬레이션부(140)를 포함하는 GBP 모델(110), 배차 시점 결정부(150) 및 배차 지시부(160)를 포함할 수 있다. 1 is a block diagram of an apparatus for performing a vehicle dispatch according to an embodiment of the present invention. Referring to FIG. 1 , the
GBP(Generator-Buffer-Processor) 모델(110)은 대표적인 DEVS(Discrete Event System Specification) 모델링 구조로, 일반적으로 업무부하를 생성(Generator), 대기 열에서 대기(Buffer), 업무처리(Processor)의 작업흐름으로 모델링하는 이산사건모델을 의미한다. 여기서, 업무부하의 생성(Generator)은 주문 정보 생성부(120)에 의해 수행되고, 대기(Buffer)는 저장부(130)에 의해 수행되고, 업무처리(Processor)는 시뮬레이션부(140)에 의해 수행될 수 있다. 주문 정보 생성부(120), 저장부(130) 및 시뮬레이션부(140)는 강화학습 모델의 환경(Environment)으로 기능할 수 있다.The GBP (Generator-Buffer-Processor)
이러한 GBP 모델(110)은 외부 천이 함수, 내부 천이 함수, 출력 함수, 시간 진행 함수를 이용하여 이벤트 기반으로 시뮬레이션을 수행할 수 있다. The
본 발명에 따르면, 강화학습 모델의 환경으로서, 강화학습 모델과 함께 갱신 가능한 GBP 모델(110)을 이용하여 현장 상황을 반영한 파라미터(예컨대, 상태(State) 정보, 리워드(Reward) 등)를 에이전트(Agent)로 제공함으로써 강화학습 모델의 학습 속도 및 배차 시점 예측의 성능을 향상시킬 수 있다.According to the present invention, as an environment of the reinforcement learning model, parameters (eg, state information, rewards, etc.) reflecting the field situation using the
주문 정보 생성부(120)는 과거 운송 데이터에 기초하여 가상의 주문 정보를 생성할 수 있다. 가상의 주문 정보를 생성하는 과정에 대해서는 도 2를 통해 상세히 설명하도록 한다. The
도 2는 본 발명의 일 실시예에 따른 가상의 주문 정보를 생성하는 과정을 설명하기 위한 예시적인 도면이다. 도 2를 참조하면, 주문 정보 생성부(120)는 물류 차량의 상차지 및 하차지를 포함하는 운송 경로(201) 및 주문 정보(202)를 포함하는 과거 운송 데이터를 이용하여 과거 운송 데이터의 시공간적 특성이 반영된 가상의 주문 정보(220)를 생성할 수 있다. 2 is an exemplary diagram for explaining a process of generating virtual order information according to an embodiment of the present invention. Referring to FIG. 2 , the order
주문 정보 생성부(120)는 단위 시간 동안 평균 L번 발생하는 사건을 근사할 수 있는 포아송 분포(Poisson Distribution)를 이용하여 과거 운송 데이터와 유사한 가상의 주문 정보를 생성할 수 있다. The order
예를 들어, 주문 정보 생성부(120)는 시간과 요일에 따라 주문의 발생 빈도가 다르므로, 시간과 요일에 따라 서로 다른 모수인 λ를 따르는 비동질 포아송 모델의 확률질량함수를 통해 시간과 요일에 따른 주문 빈도를 계산할 수 있다.For example, since the order
여기서, 비동질 포아송모델이란 일정한 에러율을 가지는 동질 포아송 과정과 달리, 에러율이 일정하지 않아 일정한 추세(trend)를 가지고 있는 모수 통계 모형(parametric statistical model)으로서, 수학식 1로 표현될 수 있다. 이때, λ는 전체 물량의 발생 평균을 의미하며, 수학식 1은 0 이상의 정수 x에 대하여, 특정 시간과 요일에 발생할 사건의 확률값을 나타낸다.Here, the inhomogeneous Poisson model is a parametric statistical model having a constant trend because the error rate is not constant, unlike the homogeneous Poisson process having a constant error rate, and can be expressed by
예를 들어, 주문 정보 생성부(120)는 공간에 따라 서로 다른 모수인 λ를 따르는 공간포아송모델의 확률질량함수를 통해 공간에 따른 주문 빈도를 계산할 수 있다.For example, the order
이는, 상차지 및 하차지 중 적어도 하나가 일정하지 않은 경우, 시간뿐만 아니라, 공간적으로 발생하는 빈도 또한 모델링해야 하기 때문이다. 구체적으로, 상차지 및 하차지 중 적어도 하나가 고정되지 않은 경우, 관심 영역을 기설정된 크기의 복수의 격자로 분할하고, 공간포아송모델로 각 격자에서 주문이 발생할 확률을 근사할 수 있다. 이는, 전체 영역과 각 격자에 해당하는 영역의 비율에 따라, 사건의 발생 빈도를 샘플링할 수 있는 확률 과정을 의미할 수 있다.This is because, when at least one of the loading and unloading stations is not constant, the frequency of occurrence in space as well as time must be modeled. Specifically, when at least one of the loading and unloading locations is not fixed, the region of interest may be divided into a plurality of grids having a predetermined size, and the probability of occurrence of an order in each grid may be approximated using a spatial Poisson model. This may mean a probabilistic process capable of sampling the frequency of occurrence of an event according to the ratio of the entire area to the area corresponding to each grid.
여기서, 공간포아송모델의 확률질량함수는 수학식 2와 같이 표현될 수 있다. 이때, λ는 전체 물량의 발생 평균을 의미하며, 수학식 2는 0 이상의 정수 x에 대하여, 특정 격자에 해당하는 영역에 발생할 사건의 확률값을 나타낸다.Here, the probability mass function of the spatial Poisson model can be expressed as Equation (2). In this case, λ denotes an average of occurrences of all quantities, and
주문 정보 생성부(120)는 비동질 포아송 모델의 확률질량함수를 통해 계산된 시간과 요일에 따른 주문 빈도 및 공간포아송모델의 확률질량함수를 통해 계산된 공간에 따른 주문 빈도에 기초하여 가상의 주문 정보를 생성할 수 있다.The order
이와 같이, 주문 정보 생성부(120)는 과거 운송 데이터를 시공간적으로 반영한 운송 분포에 기초하여 가상의 주문 정보를 생성함으로써, 실제 상황과 유사한 운송 데이터를 확보할 수 있다는 장점을 제공할 수 있다. In this way, the order
다시 도 1로 돌아와서, 저장부(130)는 가상의 주문 정보 및 물류 차량의 차량 정보를 버퍼에 저장할 수 있다. 가상의 주문 정보 및 물류 차량의 차량 정보를 버퍼에 저장하는 과정에 대해서는 도 3을 통해 상세히 설명하도록 한다. Returning to FIG. 1 again, the
도 3은 본 발명의 일 실시예에 따른 가상의 주문 정보 및 물류 차량의 차량 정보를 버퍼에 저장하는 과정을 설명하기 위한 예시적인 도면이다. 도 3을 참조하면, 저장부(130)는 가상의 주문 정보(301) 및 현재 운용 가능한 물류 차량의 차량 정보(302)를 버퍼(300)에 저장할 수 있다. 3 is an exemplary view for explaining a process of storing virtual order information and vehicle information of a logistics vehicle in a buffer according to an embodiment of the present invention. Referring to FIG. 3 , the
또한, 버퍼(300)는 갱신부(143)에 의해 갱신된 가상의 주문 정보와 상태가 변경된 차량 정보를 관리할 수 있다. 예를 들어, 저장부(130)는 자동 배차의 수행에 필요한 갱신된 물류 차량의 위치 정보, 적재율, 업무시간 정보 등을 포함하는 차량 정보를 관리할 수 있다. In addition, the buffer 300 may manage the virtual order information updated by the
시뮬레이션부(140)는 물류 차량의 배차 시점을 시뮬레이션할 수 있다. 이러한 시뮬레이션부(140)는 추출부(141), 결정부(142) 및 갱신부(143)를 포함할 수 있다. 여기서, 결정부(142)는 강화학습 모델의 에이전트로 기능할 수 있다.The
에이전트로 주문 정보 및 차량 정보를 포함하는 상태 정보가 주어지고, 에이전트는 기설정된 리워드 함수를 만족하도록 상태 정보에 기초하여 물류 차량의 배차 여부에 대하여 행동(Action)할 수 있다. State information including order information and vehicle information is given to the agent, and the agent may act on whether the logistics vehicle is dispatched based on the state information to satisfy a preset reward function.
에이전트는 리워드 함수를 만족하는 정책(policy)을 결정하고 결정된 정책에 기초하여 행동할 수 있다. 정책이란 예를 들어, 주어진 상태 정보에 기초하여 행동을 취할 확률을 모든 상태와 행동에 대해 명시한 것을 의미한다. 여기서, 에이전트는 리워드 함수가 최대가 되도록 하는 행동을 선택할 수 있으며, 기설정된 리워드 함수는 예를 들어, '총 비용/가용 물류 차량의 수', '총 운송 거리/총 운송 시간', '상/하차지 대기 시간' 등에 기초하여 도출될 수 있다. The agent may determine a policy that satisfies the reward function and act based on the determined policy. A policy means, for example, specifying for all states and actions the probability of taking an action based on given state information. Here, the agent may select an action to maximize the reward function, and the preset reward function is, for example, 'total cost/number of available logistics vehicles', 'total transport distance/total transport time', 'top/ It may be derived based on the 'waiting time at the drop-off point'.
시뮬레이션부(140)는 시뮬레이션을 통해 강화학습 모델을 학습시킬 수 있다. 강화학습 모델은 현재의 상태에서 어떤 행동을 취하는 것이 최적인지를 학습하여, 시행착오를 통해 학습하고 누적된 경험을 통해 시행착오를 감소시키도록 하는 모델을 의미한다. 여기서, 시뮬레이션부(140)는 강화학습 모델의 환경의 일부로 기능함으로써, 에이전트가 행동을 선택하는 경우, 리워드를 에이전트에게 부여함으로써 에이전트가, 리워드가 최대화되는 방향으로 학습되도록 할 수 있다.The
추출부(141)는 차량 정보를 제 1 학습 모델에 입력하여 제 1 특징 정보를 추출하고, 주문 정보를 제 2 학습 모델에 입력하여 제 2 특징 정보를 추출할 수 있다. The
결정부(142)는 가상의 주문 정보 및 차량 정보에 기초하여 물류 차량의 배차 여부를 결정할 수 있다. 예를 들어, 결정부(142)는 외부 상태 천이 함수를 이용하여 버퍼에 저장된 주문 정보 및 차량 정보에 기초하여 물류 차량의 배차 여부를 결정할 수 있다.The
결정부(142)는 제 1 특징 정보 및 제 2 특징 정보에 기초하여 물류 차량의 배차 또는 대기 중 어느 하나를 결정할 수 있다. 물류 차량의 배차 여부를 결정하는 과정에 대해서는 도 4를 통해 상세히 설명하도록 한다. The
도 4는 본 발명의 일 실시예에 따른 주문 정보 및 차량 정보에 기초하여 물류 차량의 배차 여부를 결정하는 과정을 설명하기 위한 예시적인 도면이다. 도 4를 참조하면, 추출부(141)는 차량 정보를 구성하는 물류 차량의 위치 정보, 적재 정보 및 업무 시간 정보 각각의 2차원 행렬에 기초하여 표현된 3차원 이미지를 제 1 학습 모델인 CNN(400, Convolution Neural Network) 모델에 입력하여 제 1 특징 정보(401)를 추출할 수 있다. 또한, 추출부(141)는 주문 정보를 구성하는 시간의 흐름에 따른 잔여 주문의 상차지 정보, 하차지 정보 및 물량 정보를 연속된 행렬로 제 2 학습 모델인 RCNN(410, Recurrent Convolution Neural Network) 모델에 입력하여 제 2 특징 정보(411)를 추출할 수 있다. 4 is an exemplary view for explaining a process of determining whether to dispatch a logistics vehicle based on order information and vehicle information according to an embodiment of the present invention. Referring to Figure 4, the
결정부(142)는 제 1 특징 정보(401) 및 제 2 특징 정보(411)를 병합하는 MLP(420, Multilayer Perceptron) 층을 이용하여, 최종적으로 분류를 수행할 수 있다. 여기서, MLP 층은 분류 문제를 해결하는 신경망으로, 결정부(142)가 에이전트의 가치함수(Value Function) 또는 정책에 근사하여 물류 차량의 배차 여부(422)에 대한 의사 결정을 내리도록 할 수 있다. The
예를 들어, 결정부(142)는 추출된 최종 특징 정보가 '1'인 경우, 물류 차량의 배차를 결정할 수 있다. 다른 예를 들어, 결정부(142)는 추출된 최종 특징 정보가 '0'인 경우, 물류 차량의 대기를 결정할 수 있다. For example, when the extracted final characteristic information is '1', the
즉, GBP 모델(110)의 프로세서에 해당하는 시뮬레이션부(140)는 결정부(142)에 의해 결정된 실행값에 기초하여 물류 차량의 배차 여부를 결정할 수 있다. That is, the
다시 도 1로 돌아와서, 갱신부(143)는 물류 차량의 배차 여부에 기초하여 기설정된 자동배차 모델을 통해 물류 차량을 배차하고, 물류 차량의 배차 결과에 기초하여 버퍼에 저장된 차량 정보를 갱신할 수 있다. Returning to FIG. 1 again, the
갱신부(143)는 내부 상태 천이 함수를 이용하여 물류 차량의 배차 결과에 기초하여 운송 스케쥴을 산출하고, 운송 스케쥴에 기초하여 차량 정보로서 물류 차량의 위치와 상태를 갱신할 수 있다. The
예를 들어, 갱신부(143)는 운송 스케쥴에 기초하여 차량 정보로서 물류 차량의 상태를 위치, 현재 적재율, 잉여 업무시간 등에 기초하여 버퍼에 저장된 차량 정보와 관련된 상태를 갱신할 수 있다. 여기서, 갱신부(143)는 시간 진행 함수를 이용하여 주문 정보에 기초하여 차량의 이동 시간을 관리할 수 있다. For example, the
다른 예를 들어, 갱신부(143)는 운송 스케쥴에 기초하여 주문 정보로서 대기→배차완료→상차완료→운송중→하차완료(종료)의 순으로 버퍼에 저장된 주문 정보와 관련된 상태를 갱신할 수 있다. As another example, the
이러한 과정을 통해, 갱신부(143)는 출력 함수를 이용하여 물류 차량의 시간, 공간, 가용 정보 등과 관련된 갱신된 차량 정보 및 주문 정보의 상태를 버퍼로 전달할 수 있다. Through this process, the
배차 시점 결정부(150)는 시뮬레이션의 결과에 기초하여 실시간 주문 정보에 대하여 물류 차량의 배차 시점을 결정할 수 있다. 예를 들어, 배차 시점 결정부(150)는 학습된 강화학습 모델을 이용하여 물류 차량의 배차 시점을 결정할 수 있다. The dispatch
배차 시점 결정부(150)는 시뮬레이션의 결과에 기초하여 실시간 주문 정보에 대해 배차를 즉각적으로 지시하지 않고, 실시간 주문 정보에 대한 배차를 최대한 연기할 수 있는 범위 내에서 물류 차량의 수를 최소화하면서, 이동 거리 및 비용이 최소화되는 시점으로 물류 차량의 배차 시점을 결정할 수 있다. 이에 따라, 혼적, 합짐이 가능한 업종 또는 상하차가 빈번하게 반복되는 업종 등에서도 최적의 배차 시점을 제공할 수 있다.The dispatch
배차 지시부(160)는 물류 차량의 배차 시점에 기초하여 물류 차량의 배차를 지시할 수 있다. The
도 5는 본 발명의 일 실시예에 따른 물류 차량의 배차 시점을 시뮬레이션하는 과정을 설명하기 위한 예시적인 도면이다. 도 5를 참조하면, 배차 수행 장치(100)는 외부 상태 천이 함수를 이용하여 버퍼에 저장된 가상의 주문 정보 및 물류 차량의 차량 정보를 판단하여 물류 차량의 배차 여부를 결정할 수 있다. 이 때, 물류 차량의 배차를 결정하지 않은 경우, 기배차된 물류 차량의 차량 정보에 대해서만 내부 상태 천이가 발생될 수 있으며, 물류 차량의 배차를 결정한 경우, 현재 버퍼에 존재하는 주문을 버퍼에 존재하는 물류 차량으로 배송할 수 있도록 하는 운송 경로(500)가 산정될 수 있다.5 is an exemplary view for explaining a process of simulating a dispatch time of a logistics vehicle according to an embodiment of the present invention. Referring to FIG. 5 , the
배차 수행 장치(100)는 물류 차량의 배차 결과에 기초하여 운송 스케쥴(510)을 산출할 수 있다. 예를 들어, 배차 수행 장치(100)는 '서울02차1234'의 물류 차량(511)에 대해 'No.0 주문'에 대한 배차 시간을 '19시 30분'으로 산출하고, 'No.1 주문'에 대한 배차 시간을 '19시 45분'으로 산출하고, 'No.2 주문'에 대한 배차 시간을 '20시10분'으로 산출할 수 있다. The
배차 수행 장치(100)는 내부 상태 천이 함수를 이용하여 산출된 운송 스케쥴에 기초하여 시간의 흐름에 따라 물류 차량의 차량 정보 및 주문 정보를 갱신(520)할 수 있다. 예를 들어, 배차 수행 장치(100)는 물류 차량의 위치, 현재 적재율, 잉여 업무 시간 등과 관련된 물류 차량의 상태를 갱신하고, 대기, 배차완료, 상차완료, 운송중, 하차완료 등의 순으로 주문 상태를 갱신할 수 있다. The
배차 수행 장치(100)는 시간 진행 함수를 이용하여 주문 건별로 이동 시간을 관리할 수 있다. The
배차 수행 장치는 출력 함수를 이용하여 갱신된 물류 차량의 상태 및 주문 상태와 관련된 정보를 버퍼로 전달함으로써, 버퍼에 저장된 물류 차량의 상태 및 주문 상태와 관련된 정보가 지속적으로 갱신(530)되도록 할 수 있다. The dispatch execution device transmits the updated information related to the status of the logistics vehicle and the order status to the buffer using the output function, so that the information related to the status and order status of the logistics vehicle stored in the buffer is continuously updated (530). have.
이러한 배차 수행 장치(100)는 물류 차량의 배차를 수행하는 명령어들의 시퀀스를 포함하는 매체에 저장된 컴퓨터 프로그램에 의해 실행될 수 있다. 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우, 주문 정보 생성부(120)에 의해 과거 운송 데이터에 기초하여 가상의 주문 정보를 생성하고, 저장부(130)에 의해 가상의 주문 정보 및 물류 차량의 차량 정보를 버퍼에 저장하고, 시뮬레이션부(140)의 결정부(142)에 의해 가상의 주문 정보 및 차량 정보에 기초하여 물류 차량의 배차 여부를 결정하고, 시뮬레이션부(140)의 갱신부(143)에 의해 물류 차량의 배차 여부에 기초하여 기설정된 자동배차 모델을 통해 물류 차량을 배차하고, 물류 차량의 배차 결과에 기초하여 버퍼에 저장된 차량 정보를 갱신하도록 물류 차량의 배차 시점을 시뮬레이션하고, 배차 시점 결정부(150)에 의해 시뮬레이션의 결과에 기초하여 실시간 주문 정보에 대하여 물류 차량의 배차 시점을 결정하고, 배차 지시부(160)에 의해 물류 차량의 배차 시점에 기초하여 물류 차량의 배차를 지시하고, 주문 정보 생성부(120), 저장부(130) 및 시뮬레이션부(140)는 강화학습 모델의 환경으로 기능하고, 결정부(142)는 강화학습 모델의 에이전트로 기능하도록 하는 명령어들의 시퀀스를 포함할 수 있다. The
도 6은 본 발명의 일 실시예에 따른 배차 수행 장치에서 물류 차량의 배차를 수행하는 방법의 순서도이다. 이러한 배차 수행 장치(100)에서 물류 차량의 배차를 수행하는 방법은 도 1 내지 도 5에 도시된 실시예에 따라 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하 생략된 내용이라고 하더라도 도 1 내지 도 5에 도시된 실시예에 따른 배차 수행 장치(100)에서 물류 차량의 배차를 수행하는 방법에도 적용된다. 6 is a flowchart of a method for distributing a logistics vehicle in the distributing apparatus according to an embodiment of the present invention. The method for distributing a logistics vehicle in the
단계 S610에서 배차 수행 장치(100)는 주문 정보 생성부(120)에 의해 과거 운송 데이터에 기초하여 가상의 주문 정보를 생성할 수 있다. In step S610 , the
단계 S620에서 배차 수행 장치(100)는 저장부(130)에 의해 가상의 주문 정보 및 물류 차량의 차량 정보를 버퍼에 저장할 수 있다. In step S620 , the
단계 S630에서 배차 수행 장치(100)는 시뮬레이션부(140)의 결정부(142)에 의해 가상의 주문 정보 및 차량 정보에 기초하여 물류 차량의 배차 여부를 결정하고, 시뮬레이션부(140)의 갱신부(143)에 의해 물류 차량의 배차 여부에 기초하여 기설정된 자동배차 모델을 통해 물류 차량을 배차하고, 물류 차량의 배차 결과에 기초하여 버퍼에 저장된 차량 정보를 갱신하도록 물류 차량의 배차 시점을 시뮬레이션할 수 있다. 여기서, 시뮬레이션부(140)는 강화학습 모델의 환경으로 기능하고, 결정부(142)는 강화학습 모델의 에이전트로 기능할 수 있다. In step S630 , the
단계 S640에서 배차 수행 장치(100)는 시뮬레이션의 결과에 기초하여 실시간 주문 정보에 대하여 물류 차량의 배차 시점을 결정할 수 있다. In operation S640, the
단계 S650에서 배차 수행 장치(100)는 물류 차량의 배차 시점에 기초하여 물류 차량의 배차를 지시할 수 있다. In step S650 , the
상술한 설명에서, 단계 S610 내지 S650은 본 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 전환될 수도 있다.In the above description, steps S610 to S650 may be further divided into additional steps or combined into fewer steps, according to an embodiment of the present invention. In addition, some steps may be omitted as necessary, and the order between the steps may be switched.
도 1 내지 도 6을 통해 설명된 배차 수행 장치에서 물류 차량의 배차를 수행하는 방법은 컴퓨터에 의해 실행되는 매체에 저장된 컴퓨터 프로그램 또는 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 또한, 도 1 내지 도 6을 통해 설명된 배차 수행 장치에서 물류 차량의 배차를 수행하는 방법은 컴퓨터에 의해 실행되는 매체에 저장된 컴퓨터 프로그램의 형태로도 구현될 수 있다. The method of performing the dispatch of the logistics vehicle in the dispatching performing apparatus described through FIGS. 1 to 6 may also be implemented in the form of a recording medium including a computer program stored in a medium executed by a computer or instructions executable by a computer. can In addition, the method for distributing a logistics vehicle in the distributing apparatus described with reference to FIGS. 1 to 6 may be implemented in the form of a computer program stored in a medium executed by a computer.
컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. Computer-readable media can be any available media that can be accessed by a computer and includes both volatile and nonvolatile media, removable and non-removable media. Also, computer-readable media may include computer storage media. Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다. The foregoing description of the present invention is for illustration, and those of ordinary skill in the art to which the present invention pertains can understand that it can be easily modified into other specific forms without changing the technical spirit or essential features of the present invention. will be. Therefore, it should be understood that the embodiments described above are illustrative in all respects and not restrictive. For example, each component described as a single type may be implemented in a distributed manner, and likewise components described as distributed may also be implemented in a combined form.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다. The scope of the present invention is indicated by the following claims rather than the above detailed description, and all changes or modifications derived from the meaning and scope of the claims and their equivalent concepts should be interpreted as being included in the scope of the present invention. do.
100: 배차 수행 장치
120: 주문 정보 생성부
130: 저장부
140: 시뮬레이션부
141: 추출부
142: 결정부
143: 갱신부
150: 배차 시점 결정부
160: 배차 지시부100: dispatch execution device
120: order information generation unit
130: storage
140: simulation unit
141: extraction unit
142: decision part
143: update
150: dispatch time decision unit
160: dispatch instruction unit
Claims (15)
과거 운송 데이터에 기초하여 가상의 주문 정보를 생성하는 주문 정보 생성부;
상기 가상의 주문 정보 및 물류 차량의 차량 정보를 버퍼에 저장하는 저장부;
상기 가상의 주문 정보 및 상기 차량 정보에 기초하여 상기 물류 차량의 배차 여부를 결정하는 결정부 및 상기 물류 차량의 배차 여부에 기초하여 기설정된 자동배차 모델을 통해 상기 물류 차량을 배차하고, 상기 물류 차량의 배차 결과에 기초하여 상기 버퍼에 저장된 차량 정보를 갱신하는 갱신부를 포함하여 상기 물류 차량의 배차 시점을 시뮬레이션하는 시뮬레이션부;
상기 시뮬레이션의 결과에 기초하여 실시간 주문 정보에 대하여 상기 물류 차량의 배차 시점을 결정하는 배차 시점 결정부; 및
상기 물류 차량의 배차 시점에 기초하여 상기 물류 차량의 배차를 지시하는 배차 지시부
를 포함하고,
상기 주문 정보 생성부, 상기 저장부 및 상기 시뮬레이션부는 강화학습 모델의 환경(Environment)으로 기능하고, 상기 결정부는 상기 강화학습 모델의 에이전트(Agent)로 기능하는 것인, 배차 수행 장치.
In an apparatus for distributing a logistics vehicle,
an order information generation unit for generating virtual order information based on past transportation data;
a storage unit for storing the virtual order information and vehicle information of the logistics vehicle in a buffer;
Distributing the distribution vehicle through a predetermined automatic distribution model based on a determination unit that determines whether the distribution vehicle is dispatched based on the virtual order information and the vehicle information and whether the distribution vehicle is dispatched, the distribution vehicle a simulation unit for simulating a dispatch time of the distribution vehicle, including an update unit for updating vehicle information stored in the buffer based on a dispatch result of
a dispatch time determining unit configured to determine a dispatch time of the logistics vehicle with respect to real-time order information based on the simulation result; and
A dispatch instructing unit for instructing the dispatch of the distribution vehicle based on the dispatch time of the distribution vehicle
including,
The order information generating unit, the storage unit, and the simulation unit will function as an environment of the reinforcement learning model, and the determining unit will function as an agent of the reinforcement learning model.
상기 에이전트로 상기 주문 정보 및 상기 차량 정보를 포함하는 상태(State) 정보가 주어지고, 상기 에이전트는 기설정된 리워드(Reward) 함수를 만족하도록 상기 상태 정보에 기초하여 상기 물류 차량의 배차 여부에 대하여 행동(Action)하는 것인, 배차 수행 장치.
The method of claim 1,
State information including the order information and the vehicle information is given to the agent, and the agent acts on whether the logistics vehicle is dispatched based on the state information to satisfy a preset reward function (Action), the dispatching device.
상기 갱신부는 상기 물류 차량의 배차 결과에 기초하여 운송 스케쥴을 산출하고, 상기 운송 스케쥴에 기초하여 상기 차량 정보로서 상기 물류 차량의 위치와 상태를 갱신하는 것인, 배차 수행 장치.
The method of claim 1,
The update unit calculates a transportation schedule based on a dispatch result of the distribution vehicle, and updates the location and state of the distribution vehicle as the vehicle information based on the transportation schedule.
상기 시뮬레이션부는 상기 시뮬레이션을 통해 상기 강화학습 모델을 학습시키고,
상기 배차 시점 결정부는 상기 학습된 강화학습 모델을 이용하여 상기 물류 차량의 배차 시점을 결정하는 것인, 배차 수행 장치.
The method of claim 1,
The simulation unit learns the reinforcement learning model through the simulation,
The dispatch time determining unit is to determine the dispatch time of the distribution vehicle by using the learned reinforcement learning model, dispatch performing apparatus.
상기 시뮬레이션부는 상기 차량 정보를 제 1 학습 모델에 입력하여 제 1 특징 정보를 추출하고,
상기 주문 정보를 제 2 학습 모델에 입력하여 제 2 특징 정보를 추출하는 추출부를 더 포함하는 것인, 배차 수행 장치.
5. The method of claim 4,
The simulation unit extracts first characteristic information by inputting the vehicle information into a first learning model,
Further comprising an extraction unit for extracting second characteristic information by inputting the order information into a second learning model, the dispatching apparatus.
상기 차량 정보는 상기 물류 차량의 위치 정보, 적재 정보 및 업무 시간 정보 중 적어도 하나를 포함하고,
상기 주문 정보는 시간의 흐름에 따른 잔여 주문의 상차지 정보, 하차지 정보 및 물량 정보 중 적어도 하나를 포함하는 것인, 배차 수행 장치.
6. The method of claim 5,
The vehicle information includes at least one of location information, loading information, and business hours information of the logistics vehicle,
The order information will include at least one of loading information, unloading location information, and quantity information of the remaining orders according to the passage of time.
상기 결정부는 상기 제 1 특징 정보 및 상기 제 2 특징 정보에 기초하여 상기 물류 차량의 배차 또는 대기 중 어느 하나를 결정하는 것인, 배차 수행 장치.
6. The method of claim 5,
Wherein the determining unit determines any one of dispatch or standby of the distribution vehicle based on the first characteristic information and the second characteristic information.
주문 정보 생성부에 의해 과거 운송 데이터에 기초하여 가상의 주문 정보를 생성하는 단계;
저장부에 의해 상기 가상의 주문 정보 및 물류 차량의 차량 정보를 버퍼에 저장하는 단계;
시뮬레이션부의 결정부에 의해 상기 가상의 주문 정보 및 상기 차량 정보에 기초하여 상기 물류 차량의 배차 여부를 결정하고, 상기 시뮬레이션부의 갱신부에 의해 상기 물류 차량의 배차 여부에 기초하여 기설정된 자동배차 모델을 통해 상기 물류 차량을 배차하고, 상기 물류 차량의 배차 결과에 기초하여 상기 버퍼에 저장된 차량 정보를 갱신하도록 상기 물류 차량의 배차 시점을 시뮬레이션하는 단계;
상기 시뮬레이션의 결과에 기초하여 실시간 주문 정보에 대하여 상기 물류 차량의 배차 시점을 결정하는 단계; 및
상기 물류 차량의 배차 시점에 기초하여 상기 물류 차량의 배차를 지시하는 단계
를 포함하고,
상기 주문 정보 생성부, 상기 저장부 및 상기 시뮬레이션부는 강화학습 모델의 환경으로 기능하고, 상기 결정부는 상기 강화학습 모델의 에이전트로 기능하는 것인, 배차 수행 방법.
In the method of performing the dispatch of a logistics vehicle in the dispatch performing apparatus,
generating virtual order information based on past transportation data by an order information generating unit;
storing the virtual order information and vehicle information of a logistics vehicle in a buffer by a storage unit;
Determine whether the distribution vehicle is dispatched based on the virtual order information and the vehicle information by the determining unit of the simulation unit, and a preset automatic distribution model based on whether the distribution vehicle is dispatched by the update unit of the simulation unit distributing the logistics vehicle through, and simulating the dispatch time of the logistics vehicle to update the vehicle information stored in the buffer based on the dispatch result of the logistics vehicle;
determining a dispatch time of the logistics vehicle with respect to real-time order information based on a result of the simulation; and
Instructing the dispatch of the logistics vehicle based on the dispatch time of the logistics vehicle
including,
The order information generating unit, the storage unit and the simulation unit function as an environment of the reinforcement learning model, and the determining unit functions as an agent of the reinforcement learning model.
상기 에이전트로 상기 주문 정보 및 상기 차량 정보를 포함하는 상태 정보가 주어지고, 상기 에이전트는 기설정된 리워드 함수를 만족하도록 상기 상태 정보에 기초하여 상기 물류 차량의 배차 여부에 대하여 행동(Action)하는 것인, 배차 수행 방법.
9. The method of claim 8,
State information including the order information and the vehicle information is given to the agent, and the agent acts on whether the logistics vehicle is dispatched based on the state information to satisfy a preset reward function , how to perform dispatch.
상기 버퍼에 저장된 차량 정보를 갱신하는 단계는,
상기 물류 차량의 배차 결과에 기초하여 운송 스케쥴을 산출하고, 상기 운송 스케쥴에 기초하여 상기 차량 정보로서 상기 물류 차량의 위치와 상태를 갱신하는 단계를 포함하는 것인, 배차 수행 방법.
10. The method of claim 9,
Updating the vehicle information stored in the buffer comprises:
Calculating a transportation schedule based on a dispatch result of the distribution vehicle, and updating the location and state of the distribution vehicle as the vehicle information based on the transportation schedule.
상기 시뮬레이션을 통해 상기 강화학습 모델을 학습시키는 단계; 및
상기 학습된 강화학습 모델을 이용하여 상기 물류 차량의 배차 시점을 결정하는 단계를 더 포함하는 것인, 배차 수행 방법.
10. The method of claim 9,
learning the reinforcement learning model through the simulation; and
The method further comprising the step of determining a dispatch time of the logistics vehicle by using the learned reinforcement learning model.
상기 차량 정보를 제 1 학습 모델에 입력하여 제 1 특징 정보를 추출하는 단계;
상기 주문 정보를 제 2 학습 모델에 입력하여 제 2 특징 정보를 추출하는 단계를 더 포함하는 것인, 배차 수행 방법.
12. The method of claim 11,
extracting first characteristic information by inputting the vehicle information into a first learning model;
The method further comprising the step of inputting the order information into a second learning model to extract second characteristic information.
상기 차량 정보는 상기 물류 차량의 위치 정보, 적재 정보 및 업무 시간 정보 중 적어도 하나를 포함하고,
상기 주문 정보는 시간의 흐름에 따른 잔여 주문의 상차지 정보, 하차지 정보 및 물량 정보 중 적어도 하나를 포함하는 것인, 배차 수행 방법.
13. The method of claim 12,
The vehicle information includes at least one of location information, loading information, and business hours information of the logistics vehicle,
Wherein the order information includes at least one of loading information, unloading location information, and quantity information of the remaining orders according to the passage of time.
상기 물류 차량의 배차 여부를 결정하는 단계는,
상기 제 1 특징 정보 및 상기 제 2 특징 정보에 기초하여 상기 물류 차량의 배차 또는 대기 중 어느 하나를 결정하는 것인, 배차 수행 방법.
13. The method of claim 12,
The step of determining whether to dispatch the logistics vehicle,
How to determine any one of dispatch or standby of the distribution vehicle based on the first characteristic information and the second characteristic information.
상기 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우,
주문 정보 생성부가에 의해 과거 운송 데이터에 기초하여 가상의 주문 정보를 생성하고,
저장부에 의해 상기 가상의 주문 정보 및 물류 차량의 차량 정보를 버퍼에 저장하고,
시뮬레이션부의 결정부에 의해 상기 가상의 주문 정보 및 상기 차량 정보에 기초하여 상기 물류 차량의 배차 여부를 결정하고, 상기 시뮬레이션부의 갱신부에 의해 상기 물류 차량의 배차 여부에 기초하여 기설정된 자동배차 모델을 통해 상기 물류 차량을 배차하고, 상기 물류 차량의 배차 결과에 기초하여 상기 버퍼에 저장된 차량 정보를 갱신하도록 상기 물류 차량의 배차 시점을 시뮬레이션하고,
배차 시점 결정부에 의해 상기 시뮬레이션의 결과에 기초하여 실시간 주문 정보에 대하여 상기 물류 차량의 배차 시점을 결정하고,
배차 지시부에 의해 상기 물류 차량의 배차 시점에 기초하여 상기 물류 차량의 배차를 지시하고,
상기 주문 정보 생성부, 상기 저장부 및 상기 시뮬레이션부는 강화학습 모델의 환경으로 기능하고, 상기 결정부는 상기 강화학습 모델의 에이전트로 기능하도록 하는 명령어들의 시퀀스를 포함하는, 매체에 저장된 컴퓨터 프로그램.A computer program stored in a medium including a sequence of instructions for performing dispatch of a logistics vehicle, the computer program comprising:
When the computer program is executed by a computing device,
Generates virtual order information based on the past transportation data by the order information generation unit,
Storing the virtual order information and vehicle information of the logistics vehicle in a buffer by the storage unit,
Determine whether the distribution vehicle is dispatched based on the virtual order information and the vehicle information by the determining unit of the simulation unit, and a preset automatic distribution model based on whether the distribution vehicle is dispatched by the update unit of the simulation unit dispatching the logistics vehicle through, and simulating the dispatch time of the logistics vehicle to update the vehicle information stored in the buffer based on the dispatch result of the logistics vehicle,
Determine the dispatch time of the logistics vehicle with respect to the real-time order information based on the result of the simulation by the dispatch time determining unit,
Instructing the dispatch of the distribution vehicle based on the dispatch time of the distribution vehicle by the dispatch instruction unit,
The order information generating unit, the storage unit, and the simulation unit function as an environment of the reinforcement learning model, the determining unit comprising a sequence of instructions to function as an agent of the reinforcement learning model, the computer program stored in the medium.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210035825A KR20220130945A (en) | 2021-03-19 | 2021-03-19 | Apparatus, method and computer program for executing assignment of logistics vehicles |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210035825A KR20220130945A (en) | 2021-03-19 | 2021-03-19 | Apparatus, method and computer program for executing assignment of logistics vehicles |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220130945A true KR20220130945A (en) | 2022-09-27 |
Family
ID=83451808
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210035825A KR20220130945A (en) | 2021-03-19 | 2021-03-19 | Apparatus, method and computer program for executing assignment of logistics vehicles |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20220130945A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117724432A (en) * | 2024-02-07 | 2024-03-19 | 中国电子工程设计院股份有限公司 | Method and device for generating layout of automatic semiconductor material handling system |
KR102673897B1 (en) * | 2022-11-30 | 2024-06-10 | 주식회사 컨테인어스 | Method and system for dispatching freight car based on weight and stratification of reward function in reinforcement learning |
-
2021
- 2021-03-19 KR KR1020210035825A patent/KR20220130945A/en active Search and Examination
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102673897B1 (en) * | 2022-11-30 | 2024-06-10 | 주식회사 컨테인어스 | Method and system for dispatching freight car based on weight and stratification of reward function in reinforcement learning |
CN117724432A (en) * | 2024-02-07 | 2024-03-19 | 中国电子工程设计院股份有限公司 | Method and device for generating layout of automatic semiconductor material handling system |
CN117724432B (en) * | 2024-02-07 | 2024-05-10 | 中国电子工程设计院股份有限公司 | Method and device for generating layout of automatic semiconductor material handling system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Joe et al. | Deep reinforcement learning approach to solve dynamic vehicle routing problem with stochastic customers | |
Bertsimas et al. | Online vehicle routing: The edge of optimization in large-scale applications | |
Wang et al. | Modeling and optimization of a road–rail intermodal transport system under uncertain information | |
JP6823136B2 (en) | Continuous delivery | |
US20210278825A1 (en) | Real-Time Production Scheduling with Deep Reinforcement Learning and Monte Carlo Tree Research | |
CN104335232B (en) | Continuous time, spike neutral net was based on the simulation of event | |
KR20220130945A (en) | Apparatus, method and computer program for executing assignment of logistics vehicles | |
Jahanshahi et al. | A deep reinforcement learning approach for the meal delivery problem | |
Zou et al. | Online food ordering delivery strategies based on deep reinforcement learning | |
JP2022509384A (en) | Reinforcement learning system and reinforcement learning method for inventory management and optimization | |
Bozanta et al. | Courier routing and assignment for food delivery service using reinforcement learning | |
CN115330095A (en) | Mine car dispatching model training method, device, chip, terminal, equipment and medium | |
Lee et al. | Lagrangian dual decomposition for the ambulance relocation and routing considering stochastic demand with the truncated Poisson | |
Shihab et al. | A deep reinforcement learning approach to seat inventory control for airline revenue management | |
Nnene et al. | A simulation-based optimization approach for designing transit networks | |
Cai et al. | A survey of dynamic pickup and delivery problems | |
KR102477717B1 (en) | Big data-based carbon emission calculation for each situation and automatic trading method, device and system based on artificial intelligence | |
Wu et al. | The optimizing-simulator: An illustration using the military airlift problem | |
Powell et al. | Strategic, tactical and real-time planning of locomotives at Norfolk Southern using approximate dynamic programming | |
CN110377769A (en) | Modeling Platform system, method, server and medium based on graph data structure | |
US20220292434A1 (en) | Resource planning for delivery of goods | |
Yuan et al. | Flexible real-time railway crew rescheduling using depth-first Search | |
Burtea et al. | Constrained continuous-action reinforcement learning for supply chain inventory management | |
de Berardinis et al. | Actor-based macroscopic modeling and simulation for smart urban planning | |
Reddy | Agent based simulation of the dial-a-flight problem |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |