KR102556070B1 - 항구별 컨테이너 할당을 위한 강화학습 장치 및 방법 - Google Patents
항구별 컨테이너 할당을 위한 강화학습 장치 및 방법 Download PDFInfo
- Publication number
- KR102556070B1 KR102556070B1 KR1020220075608A KR20220075608A KR102556070B1 KR 102556070 B1 KR102556070 B1 KR 102556070B1 KR 1020220075608 A KR1020220075608 A KR 1020220075608A KR 20220075608 A KR20220075608 A KR 20220075608A KR 102556070 B1 KR102556070 B1 KR 102556070B1
- Authority
- KR
- South Korea
- Prior art keywords
- port
- reinforcement learning
- agent
- containers
- service
- Prior art date
Links
- 230000002787 reinforcement Effects 0.000 title claims abstract description 132
- 238000000034 method Methods 0.000 title claims abstract description 20
- 230000009471 action Effects 0.000 claims description 46
- 238000004088 simulation Methods 0.000 claims description 42
- 238000012937 correction Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
- G06Q10/043—Optimisation of two dimensional placement, e.g. cutting of clothes or wood
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
- G06Q10/06375—Prediction of business process outcome or impact based on a proposed change
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/087—Inventory or stock management, e.g. order filling, procurement or balancing against orders
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
도2는 본 발명의 일 실시 예에 따른 항구별 컨테이너 할당을 위한 강화학습 장치를 설명하기 위해 나타낸 블록도.
도3은 본 발명의 일 실시 예에 따른 항구별 컨테이너 할당을 위한 강화학습 방법을 설명하기 위해 나타낸 흐름도.
도4는 도3의 실시 예에 따른 항구별 컨테이너 할당을 위한 강화학습 방법에서 컨네이너 총량을 결정하기 위한 항구별 포트 매트릭스를 나타낸 예시도.
도5는 본 발명의 일 실시 예에 따른 항구별 컨테이너 할당을 위한 강화학습 방법의 에피소드를 설명하기 위해 나타낸 예시도.
도6은 본 발명의 일 실시 예에 따른 항구별 컨테이너 할당을 위한 강화학습 방법의 에피소드를 설명하기 위해 나타낸 다른 예시도.
110 : 시뮬레이션 엔진
120 : 강화학습 에이전트
121 : 서비스 에이전트 1
122 : 서비스 에이전트 2
123 : 서비스 에이전트 n
130 : 에피소드 저장부
200 : 포트 할당 테이블
210 : POD(Port Of Discharge)
Claims (11)
- 강화학습 에이전트(120)에서 제공된 액션(Action)에 대하여 선적항(Port Of Loading, POL)에서 하나 이상의 도착항(Port Of Discharge, POD) 별로 할당된 컨테이너 수량을 기반으로 운항 서비스에 따른 시뮬레이션을 수행하고, 강화학습에 이용될 상태(State) 정보와, 할당된 컨테이너 수량을 기반으로 계산된 보상(Reward) 정보를 상기 강화학습 에이전트(120)에 제공하는 시뮬레이션 엔진(110);
상기 시뮬레이션 엔진(110)으로부터 제공받은 상태 정보와 보상 정보를 이용한 에피소드를 기반으로 강화학습을 수행하여, 선적항 및 도착항이 수출 중심항 또는 수입 중심항인지 여부에 따른 항구별 특징과, 사용 가능한 컨테이너 수량, 이전 운항 서비스에서 하역된 컨테이너 수량을 기반으로 선적항에서 개별 도착항으로 실어 보낼 컨테이너의 총수량을 결정하는 액션을 생성하는 강화학습 에이전트(120); 및
상기 시뮬레이션 엔진(110)이 강화학습 에이전트(120)의 서로 다른 복수의 운항 서비스에 대하여 개별 강화학습을 수행하는 서비스 에이전트 1(121), 서비스 에이전트 2(122) 내지 서비스 에이전트 n(123)에서 개별 생성한 액션에 기반하여 1항차씩 운항 서비스를 완료하면 1 에피소드(Episode)로 종료하고, 상기 에피소드의 결과를 저장하는 에피소드 저장부(130);를 포함하고,
상기 강화학습 에이전트(120)는 서비스 에이전트 1 내지 n(121, 122, 123)으로 구성된 다중 에이전트 중에서 임의의 서비스 에이전트를 랜덤(Random)하게 선택하여 강화학습을 수행하되,
상기 서비스 에이전트 1 내지 n(121, 122, 123)은 서로 다른 선적항마다 설정되고, 각 선적항에서 개별 도착항들에 대한 운항 서비스에 대하여 서로 다른 상태 정보와 보상 정보를 기반으로 운항 서비스에 대한 강화학습을 수행하여 액션을 생성하며,
상기 시뮬레이션 엔진(110)은 에피소드 저장부(130)에 저장된 에피소드의 결과를 기반으로 다음 선적항에 대한 상태 정보와, 복수의 운항 서비스가 항구를 공유하여 컨테이너 할당으로 발생되는 공유 정보(Shared Info)와, 현재 선적항에 대한 비율(at), 현재 선적항에서 할당에 대한 이익 및 컨테이너 불균형 비용(rt), 포트 할당 테이블(Port allocation table, 200)이 포함된 보정 정보를 보상 정보와 함께 강화학습 에이전트(120)로 업데이트하여 다음 강화학습 네트워크에 반영되도록 하는 것을 특징으로 하는 항구별 컨테이너 할당을 위한 강화학습 장치. - 삭제
- 삭제
- 삭제
- 삭제
- 제 1 항에 있어서,
상기 강화학습 에이전트(120)는 컨테이너의 총량이 결정되면, LP(Liner Programing) 알고리즘에 기반하여 각 도착항 별로 가는 컨테이너의 수량을 할당하되,
각 도착항 별로 풀컨테이너(Full Container)와 빈컨테이너(Empty Container)를 포함하여 할당하는 것을 특징으로 하는 항구별 컨테이너 할당을 위한 강화학습 장치. - a) 강화학습 에이전트(120)가 강화학습에 이용될 액션에 대한 상태(State) 정보와 보상(Reward) 정보를 시뮬레이션 엔진(110)으로부터 수집하고, 상기 수집된 상태 정보와 보상 정보를 이용한 에피소드를 기반으로 강화학습을 수행하는 단계;
b) 상기 강화학습 에이전트(120)가 선적항 및 도착항이 수출 중심항 또는 수입 중심항인지 여부에 따른 항구별 특징과, 사용 가능한 컨테이너 수량, 이전 운항 서비스에서 하역된 컨테이너 수량을 기반으로 선적항에서 개별 도착항으로 실어 보낼 컨테이너의 총수량을 결정하는 액션을 생성하는 단계;
c) 상기 시뮬레이션 엔진(110)이 생성된 액션에 기반하여 선적항(Port Of Loading, POL)에서 하나 이상의 도착항(Port Of Discharge, POD) 별로 할당된 컨테이너 수량을 기반으로 운항 서비스에 따른 시뮬레이션을 수행하는 단계; 및
d) 상기 시뮬레이션 엔진(110)이 시뮬레이션 결과에 기반하여 강화학습에 이용될 상태 정보와, 할당된 컨테이너 수량을 기반으로 계산된 보상 정보를 상기 강화학습 에이전트(120)로 제공하되, 강화학습 에이전트(120)의 서로 다른 복수의 운항 서비스에 대하여 개별 강화학습을 수행하는 서비스 에이전트 1(121), 서비스 에이전트 2(122) 내지 서비스 에이전트 n(123)에서 개별 생성한 액션에 기반하여 1항차씩 운항 서비스를 완료하면 1 에피소드(Episode)로 종료하고, 상기 에피소드의 결과를 에피소드 저장부(130)에 저장하는 단계;를 포함하고,
상기 강화학습 에이전트(120)는 서로 다른 복수의 운항 서비스에 대하여 개별 강화학습을 수행하는 서비스 에이전트 1(121), 서비스 에이전트 2(122) 내지 서비스 에이전트 n(123)으로 구성된 다중 에이전트 중에서 임의의 서비스 에이전트를 랜덤(Random) 선택하여 강화학습을 수행하되,
상기 서비스 에이전트 1 내지 n(121, 122, 123)은 서로 다른 선적항마다 설정되고, 각 선적항에서 개별 도착항들에 대한 운항 서비스에 대하여 서로 다른 상태 정보와 보상 정보를 기반으로 운항 서비스에 대한 강화학습을 수행하여 액션을 생성하며,
상기 시뮬레이션 엔진(110)은 에피소드 저장부(130)에 저장된 에피소드의 결과를 기반으로 다음 선적항에 대한 상태 정보와, 복수의 운항 서비스가 항구를 공유하여 컨테이너 할당으로 발생되는 공유 정보(Shared Info)와, 현재 선적항에 대한 비율(at), 현재 선적항에서 할당에 대한 이익 및 컨테이너 불균형 비용(rt), 포트 할당 테이블(Port allocation table, 200)이 포함된 보정 정보를 보상 정보와 함께 강화학습 에이전트(120)로 업데이트하여 다음 강화학습 네트워크에 반영되도록 하는 것을 특징으로 하는 항구별 컨테이너 할당을 위한 강화학습 방법. - 삭제
- 제 7 항에 있어서,
상기 b) 단계는 강화학습 에이전트(120)가 컨테이너의 총량을 결정하면, LP(Liner Programing) 알고리즘에 기반하여 각 도착항 별로 가는 컨테이너의 수량을 할당하되,
각 도착항 별로 풀컨테이너(Full Container)와 빈컨테이너(Empty Container)를 포함하여 할당하는 것을 특징으로 하는 항구별 컨테이너 할당을 위한 강화학습 방법. - 삭제
- 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220075608A KR102556070B1 (ko) | 2022-06-21 | 2022-06-21 | 항구별 컨테이너 할당을 위한 강화학습 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220075608A KR102556070B1 (ko) | 2022-06-21 | 2022-06-21 | 항구별 컨테이너 할당을 위한 강화학습 장치 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102556070B1 true KR102556070B1 (ko) | 2023-07-19 |
Family
ID=87425593
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220075608A KR102556070B1 (ko) | 2022-06-21 | 2022-06-21 | 항구별 컨테이너 할당을 위한 강화학습 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102556070B1 (ko) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102264571B1 (ko) * | 2020-10-30 | 2021-06-15 | 주식회사 애자일소다 | 계층 구조를 갖는 의사결정 에이전트 |
KR20210083661A (ko) | 2019-12-27 | 2021-07-07 | 소프트온넷(주) | 인공지능 플래닝 기술 기반 선사 선적 네트워크의 공컨테이너 재배치 최적화 시스템 및 방법 |
KR102325608B1 (ko) * | 2020-11-18 | 2021-11-15 | 김태호 | 컨테이너 터미널의 프리-마셜링의 심층 강화학습 적용을 위한 인공 신경망의 학습 데이터 생성 방법, 및 인공 신경망의 학습 데이터 생성 방법을 실행할 수 있는 컴퓨터 프로그램을 기록한 저장매체 |
KR102365168B1 (ko) * | 2021-09-17 | 2022-02-18 | 주식회사 애자일소다 | 설계 데이터 기반의 물체의 위치 최적화를 위한 강화학습 장치 및 방법 |
-
2022
- 2022-06-21 KR KR1020220075608A patent/KR102556070B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210083661A (ko) | 2019-12-27 | 2021-07-07 | 소프트온넷(주) | 인공지능 플래닝 기술 기반 선사 선적 네트워크의 공컨테이너 재배치 최적화 시스템 및 방법 |
KR102264571B1 (ko) * | 2020-10-30 | 2021-06-15 | 주식회사 애자일소다 | 계층 구조를 갖는 의사결정 에이전트 |
KR102325608B1 (ko) * | 2020-11-18 | 2021-11-15 | 김태호 | 컨테이너 터미널의 프리-마셜링의 심층 강화학습 적용을 위한 인공 신경망의 학습 데이터 생성 방법, 및 인공 신경망의 학습 데이터 생성 방법을 실행할 수 있는 컴퓨터 프로그램을 기록한 저장매체 |
KR102365168B1 (ko) * | 2021-09-17 | 2022-02-18 | 주식회사 애자일소다 | 설계 데이터 기반의 물체의 위치 최적화를 위한 강화학습 장치 및 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
McFarlane et al. | Intelligent logistics: Involving the customer | |
Cordeau et al. | Recent models and algorithms for one-to-one pickup and delivery problems | |
Ancele et al. | Toward a more flexible VRP with pickup and delivery allowing consolidations | |
Rebollo et al. | A multi-agent system for the automation of a port container terminal | |
Pérez Rivera et al. | Integrated scheduling of drayage and long-haul operations in synchromodal transport | |
Sarasola et al. | Adaptive large neighborhood search for the vehicle routing problem with synchronization constraints at the delivery location | |
Wu et al. | Integrated cross-supplier order and logistic scheduling in cloud manufacturing | |
Schmid et al. | Mixed model assembly line feeding with discrete location assignments and variable station space | |
Guo et al. | Storage assignment for newly arrived items in forward picking areas with limited open locations | |
Tirado et al. | Improved solutions to dynamic and stochastic maritime pick-up and delivery problems using local search | |
Fontes et al. | A bi-objective multi-population biased random key genetic algorithm for joint scheduling quay cranes and speed adjustable vehicles in container terminals | |
Kronmueller et al. | On-demand grocery delivery from multiple local stores with autonomous robots | |
Müller et al. | Decision support and data visualization for liner shipping fleet repositioning | |
KR102556070B1 (ko) | 항구별 컨테이너 할당을 위한 강화학습 장치 및 방법 | |
Veeravalli et al. | Design and analysis of optimal material distribution policies in flexible manufacturing systems using a single AGV | |
US20240062137A1 (en) | Import gateway optimization model | |
KR102458105B1 (ko) | 다중 에이전트 기반의 경로 설정 강화학습 장치 및 방법 | |
Bruni et al. | Bin Packing Methodologies for Capacity Planning in Freight Transportation and Logistics | |
Movassaghi et al. | Multiple cross-docks scheduling with multiple doors using fuzzy approach and metaheuristic algorithms | |
Perez et al. | A metaheuristic search technique for solving the warehouse stock management problem and the routing problem in a real company | |
Kronmueller et al. | Pooled grocery delivery with tight deadlines from multiple depots | |
Antunes et al. | Assigning and scheduling service visits in a mixed urban/rural setting | |
Yang et al. | Substitution-based equipment balancing in service networks with multiple equipment types | |
Zehendner et al. | Solving the resource allocation problem in a multimodal container terminal as a network flow problem | |
Büsing et al. | The dial-a-ride problem in primary care with flexible scheduling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20220621 |
|
PA0201 | Request for examination | ||
PA0302 | Request for accelerated examination |
Patent event date: 20220630 Patent event code: PA03022R01D Comment text: Request for Accelerated Examination Patent event date: 20220621 Patent event code: PA03021R01I Comment text: Patent Application |
|
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20220919 Patent event code: PE09021S01D |
|
PE0902 | Notice of grounds for rejection |
Comment text: Final Notice of Reason for Refusal Patent event date: 20230113 Patent event code: PE09021S02D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20230710 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20230711 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20230712 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |