KR100697689B1 - 비정형 데이터베이스의 정형화 장치를 이용한 정형화 방법 - Google Patents

비정형 데이터베이스의 정형화 장치를 이용한 정형화 방법 Download PDF

Info

Publication number
KR100697689B1
KR100697689B1 KR1020050073090A KR20050073090A KR100697689B1 KR 100697689 B1 KR100697689 B1 KR 100697689B1 KR 1020050073090 A KR1020050073090 A KR 1020050073090A KR 20050073090 A KR20050073090 A KR 20050073090A KR 100697689 B1 KR100697689 B1 KR 100697689B1
Authority
KR
South Korea
Prior art keywords
information
string
address
database
unit
Prior art date
Application number
KR1020050073090A
Other languages
English (en)
Other versions
KR20070018412A (ko
Inventor
김성민
Original Assignee
(주)공영디비엠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)공영디비엠 filed Critical (주)공영디비엠
Priority to KR1020050073090A priority Critical patent/KR100697689B1/ko
Publication of KR20070018412A publication Critical patent/KR20070018412A/ko
Application granted granted Critical
Publication of KR100697689B1 publication Critical patent/KR100697689B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/60Business processes related to postal services

Landscapes

  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 비정형주소 정보를 저장하는 비정형 데이터베이스부(102)와 상기 비정형 데이터베이스부(102)의 정보의 문자패턴으로 분석하도록 이루어진 패턴분석부(104)와 상기 패턴분석부(104)에서 분석된 정보를 세부사항으로 나누어 패턴에 따른 세부 주소정보를 추출하는 정보추출부(106)와 상기 정보추출부(106)에서 각 패턴에 따라 세부정보로 나누어진 주소정보와 우편번호 데이터베이스부(108)에 저장된 우편번호 정보와 매핑하는 것으로 이루어지며, 과거주소 및 상세주소 정보를 포함하여 최신주소와 상세주조 정보에 매핑이 가능한 것을 포함하는 매핑부(112)와 상기 매핑부(112)에서 주소정보와 우편번호 정보와 매핑된 데이터베이스를 정제하도록 이루어지는 데이터베이스 정제부(114)와 상기 데이터베이스 정제부(114)에서 정제된 데이터베이스 결과를 확인하기 위한 정제표시부(116)와 상기 정제표시부(116)에서 정제된 데이터베이스를 확인하고, 오류주소를 수정하는 수정정보입력부(118)와 상기 데이터베이스 정제부(114)에서 정제된 데이터베이스와 상기 수정정보입력부(118)에서 오류주소를 수정하여 저장하는 정형 데이터베이스부(120)로 이루어진다.
비정형, 데이터베이스, 정형화, 고객정보, 우편번호, 주소정보, 정제

Description

비정형 데이터베이스의 정형화 장치를 이용한 정형화 방법{METHOD OF FIXING OF ATYPICAL DATABASE USING FIXED FORM APPARATUS}
도1은 본 발명에 따른 비정형 데이터베이스의 정형화 장치를 나타낸 구성도이다.
도2는 본 발명에 따른 비정형 데이터베이스의 정형화 방법을 나타낸 흐름도이다.
도3은 상기 도2의 비정형 주소를 문자패턴으로 분석하는 방법을 나타낸 흐름도이다.
도4는 본 발명에 따른 주소정제의 결과를 확인하기 위한 검증 방법을 나타낸 흐름도이다.
도5는 본 발명에 따른 고속변환을 위한 레퍼런스 데이터베이스 색인방법을 나타낸 흐름도이다.
※ 도면의 주요부분의 부호에 대한 설명 ※
102 : 비정형 데이터베이스부 104 : 패턴분석부
106 : 정보추출부 108 : 우편번호 데이터베이스부
110 : 신(新)정보입력부 112 : 매핑부
114 : 데이터베이스 정제부 116 : 정제표시부
118 : 수정정보 입력부 120 : 정형 데이터베이스부
본 발명은 비정형의 데이터베이스를 정형화된 자료로 정리하기 위한 것으로서, 보다 상세하게는 비정형의 주소정보 데이터베이스를 정형화된 주소로 정리할 수 있는 정형화 장치 및 상기 정형화 장치를 이용한 정형화 방법에 관한 것이다.
일반적으로 기업에서 고객의 주소정보는 주문한 물건을 배송하거나 각종 고지서 및 제품 홍보를 위한 DM(Direct Mail) 우편물을 고객에게 정확히 전달하기 위해서 필수적으로 필요한 정보이다.
상기 주소정보는 기업의 입장에서 정확성과 신뢰성이 가장 중요한 정보이나 대부분의 고객들은 자신의 주소를 기업에 제공할 때, 주소의 일부분을 생략하거나 축약어, 동의어 등을 사용하여 비정형적인 표현방법을 사용함으로써 기업들은 정확한 우편번호를 부여하지 못하고 있었다.
대부분의 기업들은 자사의 고객관리 시스템에 저장된 주소정보에 대해서 정보통신부에서 년 3 ∼4회 마다 신규 생성, 통합, 폐지되는 우편번호를 즉시 반영하지 못하고 있으며 이로인하여 주소정보의 정확성과 신뢰성이 떨어지고 있었다.
또한, 기업내의 주소정보는 다음과 같은 세가지 문제점이 있었다.
첫번째, 고객들이 기업의 홈페이지에 직접 주소를 입력하여 행정시, 행정동의 순서로 이루어진 주소를 법정동으로 표기하여 정확한 우편번호를 부여하지 못하는 문제점이 있었다. 예를 들면, 구로1동, 구로2동을 구로동으로 입력하거나, 종로1가, 종로2가를 종로로 입력하여 해당되는 정확한 우편번호를 부여하지 못하였다.
두번째, 정보통신부에서는 년 3∼4회 마다 행정구역변경, 건물, 아파트 등의 건물 신축에 맞추어 신규 우편번호를 부여하거나, 과거의 우편번호를 통폐합하고 있었다. 그러나 기업들은 고객 데이터베이스에 기록된 주소정보를 즉시 반영하지 못하고 있었다.
상기의 문제점으로 인하여 고객의 주소정보는 과거 우편번호로 관리되고 있었으며, 이를 이용하여 대량 우편물 발송 시 변경된 새로운 우편번호 사용에 따른 추가 감액 혜택을 못 받을 뿐 아니라, 우편물 반송 등으로 추가비용이 발생하는 문제점이 있었다.
세번째, 고객은 주소정보 입력 시에 각기 다른 표기 방법으로 입력하여 (예: 동일한 아파트 명칭에 대하여, 삼성아파트, 삼성2차아파트, 삼성2차, 삼성2차APT, 삼성2차@, 삼성래미안아파트, 삼성래미안2차@ 등) 정형화되지 않은 형태로 기업의 고객 데이터베이스에 저장되어 우편물 발송 및 물류 배송 시, 반송 또는 배송시간 지연 등의 문제점이 발생하였다.
상기의 문제점을 해결하기 위하여 본 발명은 비정형적인 주소 또는 과거의 주소정보를 신(新) 우편번호 체계에 맞도록 정형화된 데이터베이스로 변경하여 신(新) 우편번호를 부여하여 고객 주소정보의 활용을 극대화할 수 있도록 비정형 데이터베이스의 정형화 장치 및 그 장치를 이용한 정형화 방법을 제공하는 것이다.
본 발명은 비정형주소에 대한 문자패턴을 분석하여 패턴에 의한 주소구성을 개별항목으로 분리하여 레퍼런스 정보와 매핑하여 최신우편번호를 찾아내도록 이루어진다.
상기 비정형주소 정보를 저장하는 비정형 데이터베이스부(102)와 상기 비정형 데이터베이스부(102)의 정보의 문자패턴으로 분석하도록 이루어진 패턴분석부(104)와 상기 패턴분석부(104)에서 분석된 정보를 세부사항으로 나누어 패턴에 따 른 세부 주소정보를 추출하는 정보추출부(106)와 상기 정보추출부(106)에서 각 패턴에 따라 세부정보로 나누어진 주소정보와 우편번호 데이터베이스부(108)에 저장된 우편번호 정보와 매핑하는 것으로 이루어지며, 과거주소 및 상세주소 정보를 포함하여 최신주소와 상세주소 정보에 매핑이 가능한 것을 포함하는 매핑부(112)와 상기 매핑부(112)에서 주소정보와 우편번호 정보와 매핑된 데이터베이스를 정제하도록 이루어지는 데이터베이스 정제부(114)와 상기 데이터베이스 정제부(114)에서 정제된 데이터베이스 결과를 확인하기 위한 정제표시부(116)와 상기 정제표시부(116)에서 정제된 데이터베이스를 확인하고, 오류주소를 수정하는 수정정보입력부(118)와 상기 데이터베이스 정제부(114)에서 정제된 데이터베이스와 상기 수정정보입력부(118)에서 오류주소를 수정하여 저장하는 정형 데이터베이스부(120)로 이루어진다.
상기 우편번호 데이터베이스부(108)의 정형화된 주소정보의 주기적인 변환을 위하여 신(新)정보입력부(110)에서 정보통신부에서 고시하는 변경된 우편번호정보를 입력하여 최신정보를 저장하는 것으로 이루어진다.
이하, 본 발명의 구체적인 구성을 첨부된 도면에 의해 상세히 설명하면 다음과 같다.
도1은 본 발명에 따른 비정형 데이터베이스의 정형화 장치를 나타낸 구성도 이다. 상기 비정형주소 정보를 저장하는 비정형 데이터베이스부(102)와 상기 비정형 데이터베이스부(102)의 주소정보를 문자패턴으로 분석하도록 이루어진 패턴분석부(104)와 상기 패턴분석부(104)에서 분석된 정보를 세부사항으로 나누어 패턴에 따른 세부 주소정보를 추출하는 정보추출부(106)와 상기 정보추출부(106)에서 각 패턴에 따라 세부정보로 나누어진 주소정보와 우편번호 데이터베이스부(108)에 저장된 우편번호 정보와 매핑하는 것으로 이루어지며, 과거주소 및 상세주소 정보를 포함하여 최신주소와 상세주소 정보에 매핑이 가능한 것을 포함하는 매핑부(112)와 상기 매핑부(112)에서 주소정보와 우편번호 정보와 매핑된 데이터베이스를 정제하도록 이루어지는 데이터베이스 정제부(114)와 상기 데이터베이스 정제부(114)에서 정제된 데이터베이스 결과를 확인하기 위한 정제표시부(116)와 상기 정제표시부(116)에서 정제된 데이터베이스를 확인하고, 오류주소를 수정하는 수정정보입력부(118)와 상기 데이터베이스 정제부(114)에서 정제된 데이터베이스와 상기 수정정보입력부(118)에서 오류주소를 수정하여 저장하는 정형 데이터베이스부(120)로 이루어진다.
상기 우편번호 데이터베이스부(108)의 정형화된 주소정보의 주기적인 변환을 위하여 신(新)정보입력부(110)에서 정보통신부에서 고시하는 변경된 우편번호정보를 입력하여 최신정보를 저장하는 것으로 이루어진다.
또한, 상기 신(新)정보입력부(110)에는 레퍼런스 데이터베이스를 더 포함하여, 정보통신부에서 고시한 최신 우편번호, 행정구역 변경이력, 축약어, 동의어 정 보를 저장하여 다양한 표기법으로 입력한 주소정보 및 과거 행정구역의 주소 정보라도 최신 우편번호로 검색할 수 있다.
도2는 본 발명에 따른 비정형 데이터베이스의 정형화 방법을 나타낸 흐름도이다.
비정형 데이터베이스에 저장된 주소정보를 문자열 정형화 시키는 제1단계와 상기 제1단계에서 정형화된 주소정보의 문자열의 길이가 설정된 문자열 길이보다 큰 경우, 단어단위로 해석하여 패턴화하는 제2단계와 상기 제1단계에서 정형화된 주소정보의 문자열의 길이가 설정된 문자열 길이보다 작은 경우, 동호의 표기법을 변경하는 제3단계와, 상기 제3단계에서 변경된 정보를 패턴유형 특성에 저장하는 제4단계와 ,상기 제4단계에서 저장된 패턴유형에 따라 문자열 특성에 저장하는 제5단계와
상기 제5단계에서 문자열 특성에 저장 후, 패턴이 동일한 값을 패턴 테이블에서 검색하는 제6단계와 상기 제6단계에서 검색된 정보가 패턴유형과 동일한지 확인하는 제7단계와 상기 제7단계에서 패턴유형과 동일한 경우, 패턴 테이블의 처리식이 존재하는지 확인하는 제8단계와 상기 제8단계에서 처리식이 존재하는 경우, 패턴의 처리를 실행하는 제9단계로 이루어진다.
또한, 상기 제7단계에서 패턴유형과 동일하지 않는 경우, 상기 제6단계 검색된 정보가 패턴유형과 동일한지 재확인하는 제26단계 및, 상기 제8단계에서 처리식 이 존재하지 않는 경우, 패턴유형에 따라 문자열 특성에 저장하는 제5단계로 재 전송되는 제27단계를 더 포함하여 이루어진다.
상기 제1단계 내지 제5단계에서 세분화 패턴 정보를 이용하여 입력된 주소를 세분화한 후, 상기 세분화된 패턴 정보를 제6단계에서 검색하여 동일한 패턴 정보가 존재할 경우 이를 이용하여 주소를 세분화한다.
아래 표1은 세분화 패턴 정보의 관리 구조를 나타낸 것이다.
번호 컬럼명 설명 유형 길이 비고
1 ISWORK 사용여부 숫자형 4 0:否, 1:與
2 관리번호 일련번호 숫자형 4
3 정확도 정확도 숫자형 4
4 패턴형태 패턴형태 문자형 30 9-99-9Z9
5 조건 조건 문자형 2000 if 조건에 해당
6 처리 처리 문자형 2000 조건에 따른 처리 방법
7 예제 예제 문자형 254 처리될 패턴의 예
상기 표1에 관리구조로 분리된 주소정보의 패턴별 추출항목을 명시한 코드정보의 예는 다음과 같다.
<패턴형태> : 9-99-9Z9
<조건> :
this.pPattern05 == '동' AND this.pPattern07 == '/'
<처리> :
this.outBunji1=this.pPattern01|this.outBunji2=this.pPattern03|
this.outStory=this.pPattern04|this.outUnit=this.pPattern06|
this.outPart=this.pPattern08
<예제> :
1750-13 1동 9/2
도3은 상기 도2의 비정형 주소를 문자패턴으로 분석하는 방법을 나타낸 흐름도이다.
상기 제2단계에서 단어단위로 해석하여 패턴화 후, 상기 단어단위의 문자열이 숫자인지 확인하는 제10단계와 상기 제10단계에서 문자열이 숫자인 경우, 숫자“9”로 표기하여 세분화하는 제11단계와 상기 제11단계에서 세분화된 정보를 저장 후 상기 제1단계의 문자열 정형화 값을 “1”증가시켜서 문자열 길이를 비교하는 제12단계로 이루어진다.
상기 제10단계에서 문자열이 숫자가 아닌 경우, 상기 제2단계의 단어단위 문자열이 한글인지 확인하는 제13단계와 상기 제13단계에서 문자열이 한글인 경우, “H”로 표기하여 세분화하는 제14단계와 상기 제14단계에서 세분화된 정보를 저장 후 상기 제12단계의 문자열 정형화 값을 “1”증가시켜서 문자열 길이를 비교하는 제15단계로 이루어진다.
상기 제13단계에서 문자열이 한글이 아닌 경우, 상기 제2단계의 단어단위 문자열이 알파벳인지 확인하는 제16단계와 상기 제16단계에서 문자열이 알파벳인 경우, “A”로 표기하여 세분화하는 제17단계와 상기 제17단계에서 세분화된 정보를 저장 후 상기 제15단계의 문자열 정형화 값을 “1”증가시켜서 문자열 길이를 비교하는 제18단계로 이루어진다.
상기 제16단계에서 문자열이 알파벳이 아닌 경우, 상기 제2단계의 단어단위 문자열이 기호인지 확인하는 제19단계와 상기 제19단계에서 문자열이 기호인 경우, “-”로 표기하여 세분화하는 제20단계와 상기 제20단계에서 세분화된 정보를 저장 후 상기 제18단계의 문자열 정형화 값을 “1”증가시켜서 문자열 길이를 비교하는 제21단계로 이루어진다.
상기 제19단계에서 문자열이 기호가 아닌 경우, 상기 제2단계에서 단어단위 문자열이 공백인지 확인하는 제22단계와 상기 제22단계에서 문자열이 공백인 경우, “S”로 표기하여 세분화하는 제23단계와 상기 제23단계에서 세분화된 정보를 저장 후 상기 제21단계의 문자열 정형화 값을 “1”증가시켜서 문자열 길이를 비교하는 제24단계로 이루어진다.
상기 제22단계에서 문자열이 공백이 아닌 경우, 상기 제2단계에서 단어단위의 문자열이 확인 불가능 문자이면 상기 제24단계의 문자열 정형화 값을 “1”증가시켜서 문자열 길이를 비교하는 제25단계로 세분화하여 패턴을 구하는 방법으로 이루어진다.
아래 표2는 추출된 정보와 매핑할 수 있는 레퍼런스 데이터베이스 구조를 나타낸 것이다.
번호 컬럼명 설명 유형 크기 비고
1 ZIPCODE 유일key 문자형 10 우편번호(6)+번지구분(1)+동일우편번호Seq(3)(e.g. 121862-4-001)
2 ORGZIP 원본Zipcode 문자형 10 원본Zipcode
3 우편번호 우편번호 문자형 6 우편번호
4 STATE 시도 문자형 10 시도(서울시,울산시,제주도,경북)
5 CITY 시군 문자형 20 시구군(영등포구,수원시,예산군)
6 LOCAL1 동면 문자형 30 구읍면동/사서함(일산구,문산읍,적성면,상도동,서울중앙우체국사서함)
7 LOCAL2 동리 문자형 30 동/사서함(대화동,고양일산우체국사서함)
8 LOCAL3 리/도서 문자형 50 리/도서(구정리/대횡간도)
9 BUILDING 건물명 문자형 44 다량배달처(아파트,빌딩,학교등)
10 건물번지 건물번지 문자형 10 다량배달처 또는 소량 배달처의 건물에 대한 번지(102-1)
11 DDD DDD 문자형 4 전화DDD번호
12 시작번지 시작번지 문자형 20 시작번지/건물 시작동(번지구분이4일경우는 번지, 3 or 9일경우는 아파트 동)
13 종료번지 종료번지 문자형 20 종료번지/건물 시작동(번지구분이4일경우는 번지, 3 or 9일경우는 아파트 동)
14 지역우편 지역우편 문자형 6 동단위 우편번호의 대표번호(인사동 대일빌딩의 경우 인사동의 우편번호): 법정동의미
15 번지구분 번지구분 문자형 1 1-동우편번호, 2-사서함, 3-다량배달처, 4-번지, 리 우편번호, 9-소량배달처
16 산번지 산번지 문자형 4 산번지 인가 아닌가? '산'이면 산번지
17 메모 메모 문자형 50 소량배달처등의 자료 추가시 기록메모
18 원본여부 원본여부 문자형 2 동:동의어, 소:소량배달처, 원:정보통신부고시자료
19 표준건물명 표준건물명 문자형 50 동의어로 구축된 다량배달처의 경우 정보통신부에서 고시한 건물명
각 행정구역 단위별로 세분화하여 주소정보를 세분화하여 쉽게 검색이 가능하도록 레퍼런스 데이터베이스를 구성한다. 또한, 건물번지, 번지구분처럼 정보통신부에서 고시하지 않은 추가정보를 포함하여 구성한다.
또한, 과거주소를 최신주소로 연결하기 위하여, 과거 주소정보일 경우에는 최신 정보로 찾아주기 위하여 ORGZIP 컬럼을 생성한다. 상기 ORGZIP 컬럼을 이용하여 행정구역 변경 등으로 우편번호가 변경될 경우, 과거의 우편번호와 신규 우편번호를 연결한다.
상기 레퍼런스 데이터베이스를 구성에 나타난 바와 같이, 비정형 건물명에 대한 동의어에 대하여 다른 표기법으로 불리어진 아파트 명을 동의어로 관리하여 주소 세분화 후 추출된 건물명을 이용하여 레퍼런스 정보에서 우편번호를 찾을 수 있다. 또한, 원본 주소의 건물명이 동의어 형태인 경우, 정보통신부에서 고시한 표준화된 건물명으로 변경이 가능하다.
도4는 본 발명에 따른 주소정제의 결과를 확인하기 위한 검증 방법을 나타낸 흐름도이다.
주소정보 데이터베이스를 입수하는 제28단계와 상기 제28단계에서 입수된 정보를 포맷시키는 제29단계와 상기 제29단계에서 포맷 후, 정제 엔진의 최신버전을 확인하는 제30단계와 상기 제30단계에서 정제 엔진의 최신버전을 확인 후, 정제대상을 입력하는 제31단계와,
상기 제31단계에서 입력된 정제대상정보로 INDATA테이블을 생성하는 제32단계와 상기 제31단계에서 정제 엔진의 실행 환경파일을 설정하는 제33단계와 상기 제33단계에서 환경파일 설정 후, 주소정제 및 우편번호를 검색하는 제34단계와 상기 제34단계에서 주소정제 및 우편번호 검색의 결과를 상기 제33단계에서 설정된 파일로 생성하는 제35단계와,
상기 제34단계에서 주소정제 및 우편번호 검색의 결과를 OUTDATA테이블로 생성하는 제36단계와 상기 제35단계에서 파일 생성 후, 인증확인 없이 정제된 결과를 확인하는 제37단계와 상기 제35단계에서 파일 생성 후, 우편 집중국에서 대량 우편물 사전 인증 설정으로 감면 혜택을 받기 위하여 인증을 받는 제38단계와 상기 제38단계에서 인증 설정 후, 오류내용을 추출하는 제39단계와 상기 제39단계에서 추출된 오류내용을 업데이트하여 최종 정제된 결과를 확인하는 제40단계로 이루어진다.
상기 주소정제방법으로 XML Web Service, COM(Common Object Model) DLL, TCP/IP Socket 통신 방식 등을 지원하여 다양한 외부 애플리케이션들과 실시간 통신을 통하여 정제가 가능하다.
특히, XML Web Service를 이용하는 경우 해당 시스템이 어떤 플랫폼 상에서 운영되더라도 쉽게 연동이 가능하다.
또한, 상기 제39단계에서 오류내용 추출은 홈페이지를 통하여 주소정보 입력 시 오류주소를 입력하는 경우, 오류여부를 즉시 알 수 있도록 오류 코드를 반환하는 것을 포함한다.
도5는 본 발명에 따른 고속변환을 위한 레퍼런스 데이터베이스 색인방법을 나타낸 흐름도이다.
변환속도 향상을 위하여 동이상 우편번호, 사서함, 구/군 단위 빌딩 우편번호, 유일하게 존재하는 동,리 우편번호 정보를 레퍼런스 데이터베이스를 이용하여 최소한의 검색으로 변환할 수 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재된 특허청구범위의 균등범위내에 다양한 수정 및 변형이 가능하다.
이상에서 살펴본 바와 같이, 본 발명에 의하여 다음과 같은 효과가 있다.
첫번째, 비정형적인 주소 또는 과거의 주소정보를 신(新) 우편번호 체계에 맞도록 정형화된 데이터베이스로 변경하여 신(新) 우편번호를 부여하여 고객 주소정보의 활용을 극대화할 수 있는 효과가 있다.
두번째, 최신우편번호로 정리된 자료를 통하여 우편물의 정확한 배송으로 대량우편발송물의 반송률을 줄여 비용을 절감할 수 있는 효과가 있다.
세번째, 정형화된 주소를 이용하여 배송경로를 설정할 수 있으며, 상기 배송경로 설정으로 통합배송이 가능하게 되며, 기업의 고객정보 분석이나 주소정보를 기반으로한 분석의 정확성을 향상할 수 있는 효과가 있다.
네번째, 정형화된 최신 주소정보의 구성으로 지리정보시스템(GIS:Geographic Information System)의 연동을 효과적으로 수행할 수 있다.

Claims (7)

  1. 삭제
  2. 삭제
  3. 비정형 데이터베이스에 저장된 주소정보를 문자열 정형화 시키는 제1단계;
    상기 제1단계에서 정형화된 주소정보의 문자열의 길이가 설정된 문자열 길이보다 큰 경우, 단어단위로 해석하여 패턴화하는 제2단계;
    상기 제1단계에서 정형화된 주소정보의 문자열의 길이가 설정된 문자열 길이보다 작은 경우, 동호의 표기법을 변경하는 제3단계;
    상기 제3단계에서 변경된 정보를 패턴유형 특성에 저장하는 제4단계;
    상기 제4단계에서 저장된 패턴유형에 따라 문자열 특성에 저장하는 제5단계;
    상기 제5단계에서 문자열 특성에 저장 후, 패턴이 동일한 값을 패턴 테이블에서 검색하는 제6단계;
    상기 제6단계에서 검색된 정보가 패턴유형과 동일한지 확인하는 제7단계;
    상기 제7단계에서 패턴유형과 동일한 경우, 패턴 테이블의 처리식이 존재하는지 확인하는 제8단계;
    상기 제8단계에서 처리식이 존재하는 경우, 패턴의 처리를 실행하는 제9단계;
    상기 제9단계에서 패턴의 처리를 실행한 후, 처리 결과를 확인하기 위하여 주소정보를 데이터베이스를 입수하는 제28단계;
    상기 제28단계에서 입수된 정보를 포맷시키는 제29단계;
    상기 제29단계에서 포맷 후, 정제 엔진의 최신버전을 확인하는 제30단계;
    상기 제30단계에서 정제 엔진의 최신버전을 확인 후, 정제대상을 입력하는
    제31단계;
    상기 제31단계에서 입력된 정제대상정보로 INDATA테이블을 생성하는
    제32단계;
    상기 제31단계에서 입력된 정제대상정보의 환경파일을 설정하는 제33단계;
    상기 제33단계에서 환경파일 설정 후, 주소정제 및 우편번호를 검색하는
    제34단계;
    상기 제34단계에서 주소정제 및 우편번호 검색의 결과를 상기 제33단계에서 설정된 파일로 생성하는 제35단계;
    상기 제34단계에서 주소정제 및 우편번호 검색의 결과를 OUTDATA테이블로 생성하는 제36단계;
    상기 제35단계에서 파일 생성 후, 인증확인 없이 정제된 결과를 확인하는 제37단계;
    상기 제35단계에서 파일 생성 후, 우편 집중국에서 대량 우편물 사전 인증 설정으로 감면 혜택을 받기 위하여 인증을 받는 제38단계;
    상기 제38단계에서 인증 설정 후, 오류내용을 추출하는 제39단계; 및
    상기 제39단계에서 추출된 오류내용을 업데이트하여 최종 정제된 결과를
    확인하는 제40단계로 이루어지는 것을 특징으로 하는 비정형 데이터베이스의 정형화 방법.
  4. 제 3 항에 있어서,
    상기 제2단계에서 단어단위로 해석하여 패턴화 후, 상기 단어단위의 문자열이 숫자인지 확인하는 제10단계;
    상기 제10단계에서 문자열이 숫자인 경우, 숫자“9”로 표기하여 세분화하는 제11단계;
    상기 제11단계에서 세분화된 정보를 저장 후 상기 제1단계의 문자열 정형화 값을 “1”증가시켜서 문자열 길이를 비교하는 제12단계;
    상기 제10단계에서 문자열이 숫자가 아닌 경우, 상기 제2단계의 단어단위 문자열이 한글인지 확인하는 제13단계;
    상기 제13단계에서 문자열이 한글인 경우, “H”로 표기하여 세분화하는 제14단계;
    상기 제14단계에서 세분화된 정보를 저장 후 상기 제12단계의 문자열 정형화 값을 “1”증가시켜서 문자열 길이를 비교하는 제15단계;
    상기 제13단계에서 문자열이 한글이 아닌 경우, 상기 제2단계의 단어단위 문자열이 알파벳인지 확인하는 제16단계;
    상기 제16단계에서 문자열이 알파벳인 경우, “A”로 표기하여 세분화하는 제17단계;
    상기 제17단계에서 세분화된 정보를 저장 후 상기 제15단계의 문자열 정형화 값을 “1”증가시켜서 문자열 길이를 비교하는 제18단계;
    상기 제16단계에서 문자열이 알파벳이 아닌 경우, 상기 제2단계의 단어단위 문자열이 기호인지 확인하는 제19단계;
    상기 제19단계에서 문자열이 기호인 경우, “-”로 표기하여 세분화하는 제20단계;
    상기 제20단계에서 세분화된 정보를 저장 후 상기 제18단계의 문자열 정형화 값을 “1”증가시켜서 문자열 길이를 비교하는 제21단계;
    상기 제19단계에서 문자열이 기호가 아닌 경우, 상기 제2단계에서 단어단위 문자열이 공백인지 확인하는 제22단계;
    상기 제22단계에서 문자열이 공백인 경우, “S”로 표기하여 세분화하는 제23단계;
    상기 제23단계에서 세분화된 정보를 저장 후 상기 제21단계의 문자열 정형화 값을 “1”증가시켜서 문자열 길이를 비교하는 제24단계;
    상기 제22단계에서 문자열이 공백이 아닌 경우, 상기 제2단계에서 단어단위의 문자열이 확인 불가능 문자이면 상기 제24단계의 문자열 정형화 값을 “1”증가시켜서 문자열 길이를 비교하는 제25단계;
    로 세분화하는 것을 특징으로 하는 비정형 데이터베이스의 정형화 방법.
  5. 제 3 항에 있어서,
    상기 제7단계에서 패턴유형과 동일하지 않는 경우, 상기 제6단계 검색된 정보가 패턴유형과 동일한지 재확인하는 제26단계; 및,
    상기 제8단계에서 처리식이 존재하지 않는 경우, 패턴유형에 따라 문자열 특성에 저장하는 제5단계로 재 전송되는 제27단계;
    를 더 포함하는 것을 특징으로 하는 비정형 데이터베이스의 정형화 방법.
  6. 삭제
  7. 제 3 항에 있어서,
    상기 40단계에서 오류내용을 추출 후, 오류내용이 없는 경우에 최종 정제된 결과를 확인하여, 동이상 우편번호, 사서함, 구/군 단위 빌딩 우편번호, 유일하게 존재하는 동,리 우편번호 정보로 검색하여 정렬하는 제41단계;
    를 더 포함하는 것으로 이루어진 비정형 데이터베이스의 정형화 방법.
KR1020050073090A 2005-08-10 2005-08-10 비정형 데이터베이스의 정형화 장치를 이용한 정형화 방법 KR100697689B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020050073090A KR100697689B1 (ko) 2005-08-10 2005-08-10 비정형 데이터베이스의 정형화 장치를 이용한 정형화 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050073090A KR100697689B1 (ko) 2005-08-10 2005-08-10 비정형 데이터베이스의 정형화 장치를 이용한 정형화 방법

Publications (2)

Publication Number Publication Date
KR20070018412A KR20070018412A (ko) 2007-02-14
KR100697689B1 true KR100697689B1 (ko) 2007-03-20

Family

ID=41563822

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050073090A KR100697689B1 (ko) 2005-08-10 2005-08-10 비정형 데이터베이스의 정형화 장치를 이용한 정형화 방법

Country Status (1)

Country Link
KR (1) KR100697689B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100286163B1 (ko) * 1994-08-08 2001-04-16 가네꼬 히사시 주소인식방법, 주소인식장치 및 지엽류 자동처리 시스템
KR20010056247A (ko) * 1999-12-14 2001-07-04 이계철 지번도를 이용한 지리정보체계 데이터베이스 구축 방법
KR20040017824A (ko) * 2004-01-20 2004-02-27 (주)나우정보통신 웹 문서와 리스트정보의 패턴을 이용한 패턴예상분석에따른 정보검색시스템
JP2005050226A (ja) * 2003-07-31 2005-02-24 Kokusai Kogyo Co Ltd 住所データマッチング処理システム及びマッチング処理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100286163B1 (ko) * 1994-08-08 2001-04-16 가네꼬 히사시 주소인식방법, 주소인식장치 및 지엽류 자동처리 시스템
KR20010056247A (ko) * 1999-12-14 2001-07-04 이계철 지번도를 이용한 지리정보체계 데이터베이스 구축 방법
JP2005050226A (ja) * 2003-07-31 2005-02-24 Kokusai Kogyo Co Ltd 住所データマッチング処理システム及びマッチング処理方法
KR20040017824A (ko) * 2004-01-20 2004-02-27 (주)나우정보통신 웹 문서와 리스트정보의 패턴을 이용한 패턴예상분석에따른 정보검색시스템

Also Published As

Publication number Publication date
KR20070018412A (ko) 2007-02-14

Similar Documents

Publication Publication Date Title
CN107656913B (zh) 地图兴趣点地址提取方法、装置、服务器和存储介质
US7769778B2 (en) Systems and methods for validating an address
KR100911762B1 (ko) 주소표준화 시스템 및 방법
RU2695420C1 (ru) Способ сбора логистической информации и система межгосударственных перевозок
WO2006020088B1 (en) Location codes for destination routing
KR20140097805A (ko) 좌표(x, y)위치 값을 이용한 체계적인 블록번호 생성 및 그 이용한 주소매칭 서비스 방법
USRE48213E1 (en) Techniques for synchronized address coding and print sequencing
CN110990520A (zh) 一种地址编码方法、装置、电子设备和存储介质
CN106777377A (zh) 物流单号生成方法及装置
WO2009005492A1 (en) Systems and methods for validating an address
US20120317152A1 (en) Multiple Address Verification System for Delivery Routing
JP5192413B2 (ja) データ統合装置及びデータ統合方法
CN111190976B (zh) 快件签收方法、手持终端的快件签收方法及存储介质
KR100697689B1 (ko) 비정형 데이터베이스의 정형화 장치를 이용한 정형화 방법
US8380766B2 (en) Systems and methods for handling addresses within a database application
JP5046107B2 (ja) Poi情報の住所データ更新システム及びプログラム
CN110852620A (zh) 物流订单的处理方法及装置、电子设备、存储介质
CN114840631A (zh) 空间文本查询方法、装置、电子设备及存储介质
US20040254799A1 (en) Systems and method for providing address template application programming interfaces
CN113157890A (zh) 智能问答方法、装置、电子设备及可读存储介质
CN116384948B (zh) 一种标讯项目所在地的抽取方法、装置、设备及介质
CN112395874A (zh) 订单信息的校正方法、装置、设备及存储介质
CN106681524A (zh) 一种信息处理的方法及装置
KR101013883B1 (ko) 배송분류정보 생성방법 및 장치, 그에 따른 운송장
KR20120019706A (ko) 우편물 주소 인식 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120110

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee