KR100513994B1 - Auto classifying method of irregular maritime email message to regular database - Google Patents

Auto classifying method of irregular maritime email message to regular database Download PDF

Info

Publication number
KR100513994B1
KR100513994B1 KR10-2003-0032479A KR20030032479A KR100513994B1 KR 100513994 B1 KR100513994 B1 KR 100513994B1 KR 20030032479 A KR20030032479 A KR 20030032479A KR 100513994 B1 KR100513994 B1 KR 100513994B1
Authority
KR
South Korea
Prior art keywords
mail
mail server
client
server
shipping
Prior art date
Application number
KR10-2003-0032479A
Other languages
Korean (ko)
Other versions
KR20040100214A (en
Inventor
박기현
Original Assignee
(주)씨퓨처
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)씨퓨처 filed Critical (주)씨퓨처
Priority to KR10-2003-0032479A priority Critical patent/KR100513994B1/en
Publication of KR20040100214A publication Critical patent/KR20040100214A/en
Application granted granted Critical
Publication of KR100513994B1 publication Critical patent/KR100513994B1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/60Business processes related to postal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 해운업의 대표적인 커뮤니케이션 수단인 이메일 문서의 비정형 데이터를 문서분류기를 이용하여 1차적으로 업무관련메일로 분류하고, 분류된 업무메일을 지능형 정보 에이전트를 이용하여 2차적으로 클라이언트측에서 정형화된 데이터베이스로 만들어 XML 또는 ebXML 포맷의 특정양식(mCard)[도 5]으로 메일을 발송하는 장치에 관한 것이다.The present invention classifies unstructured data of an email document, which is a representative communication means of the shipping industry, into a work-related mail primarily by using a document classifier, and classifies the classified work mail into a client-structured database secondly by using an intelligent information agent. The present invention relates to a device for sending mail in a specific form (mCard) [FIG. 5] in XML or ebXML format.

본 발명은 독자적인 웹메일 서버에서 작동되거나 MS Outlook이라는 마이크로소프트사의 메일 클라이언트 프로그램[도 2]과 호환 연동되어 작동한다. 이메일 도착시, 클라이언트 프로그램에 장착된 지능형문서분류기(Intelligent Documents Clustering Agent)[도 4]에 의해 해운전용메시지를 1차적으로 구분, 2차적으로 메시지 내용에 포함된 Key Word를 시스템에서 인식하여, 자동으로 클라이언트측 프로그램에서 비정형 이메일 메시지를 정형화된 데이터베이스로 변환하여 해운전용메일양식인 mCard [도 5 ]를 만들어 자체 이메일 서버 또는 제3자 이메일 서버를 통한 mCard 형태의 정형 이메일을 발송 한다. 또 e-Market Place[도 6] 및 기타 전자게시판에 바로 전송하여 자동 또는 수종으로 게시할 있는 메시지 표준을 특징으로 한다. The present invention operates in a proprietary webmail server or works in conjunction with a Microsoft mail client program [Fig. 2] called MS Outlook. Upon arrival of the e-mail, the Intelligent Documents Clustering Agent (FIG. 4) attached to the client program first classifies the message for decommissioning, and automatically recognizes the key word included in the message content in the system. The client-side program converts the unstructured e-mail message into a standardized database to create a mCard [Fig. 5], which is a decommissioning e-mail form, and sends a fixed e-mail in the form of mCard through its own e-mail server or a third-party e-mail server. It also features a message standard that can be sent directly to e-Market Place [FIG. 6] and other electronic bulletin boards for automatic or species posting.

Description

자동분류를 통한 해운업 비정형 이메일 메시지의 정형 데이터베이스화 방법{Auto classifying method of irregular maritime email message to regular database}Auto classifying method of irregular maritime email message to regular database}

보통 이메일이란 컴퓨터나 기타 통신 장비(이동전화기,PDA,IMT-2000)등을 이용하여 온라인 상에서 메시지를 주고 받는 형태를 말하는데,주로 SMTP(Simple Mail Transfer Protocol)이나 POP3(Post Office Protocol v3)등의 프로토콜을 이용하여 MS Outlook Express, MS Outlook등의 이메일 전용 브라우저를 통해 이메일을 송신 또는 수신할 수 있는 이메일 클라이언트 방식과 메일 서버를 구비한 웹서버에서 접속하여 공간적인 제약에서 벗어나 어느 곳에 있더라도 인터넷으로 연결만 되면 이메일을 전송할 수 있는 웹메일 방식이 있다.In general, e-mail is a form of sending and receiving messages online using a computer or other communication device (mobile phone, PDA, IMT-2000), mainly SMTP (Simple Mail Transfer Protocol) or POP3 (Post Office Protocol v3). By using the protocol, the client can send and receive e-mails through an e-mail-only browser such as MS Outlook Express, MS Outlook, etc., and access from a web server equipped with a mail server. There is a webmail method that can send an e-mail if required.

SMTP(Simple Mail Transfer Protocol)란 인터넷으로 이메일을 보내기 위해 서버와 클라이언트 사이에 오고 가는 표준화된 메시지들이며 POP3(Post Office Protocol v3)는 전자우편을 수신하기 위한 표준 프로토콜로서 가장 최신 버전이다. 이 POP3는 인터넷 서버가 클라이언트를 위해 전자우편을 수신하고 그 내용을 보관하기 위해 사용되는 클라이언트/서버 프로토콜이다.또한 POP3에 대안으로 사용될 수 있는 프로토콜 IMAP(Internet Messaging Access Protocol)인데 IMAP는 클라이언트가 메일 서버에서 메일을 읽기 위한 인터넷 표준 프로토콜의 하나로써 POP3보다 유연하고 뛰어나다고 할 수 있다.Simple Mail Transfer Protocol (SMTP) is a standardized message sent and received between a server and a client to send email over the Internet, and Post Office Protocol v3 (POP3) is the latest protocol for receiving e-mail. POP3 is a client / server protocol used by Internet servers to receive and archive e-mail for clients. It is also an alternative to POP3, the Internet Messaging Access Protocol (IMAP). One of the standard Internet protocols for reading mail on a server is more flexible and superior to POP3.

근래 들어, 상기와 같은 이메일 서비스를 이용하여 각종 CP(Content Provider)로부터 메일링 서비스를 제공받는 식의 환경이 클라이언트측에 보편화가 되어 있으며, 이를 제공하는 웹메일 호스팅 업체 또한 수를 헤아릴 수 없을 만큼 많아 스팸메일을 포함, 하루에도 수십에서 많게는 수백통의 업무와 전혀 관련 업는 메일로 클라이언트 입장에서 보면 수신된 이메일을 일일이 정리하기가 무척 힘든 불편함에 있다.Recently, an environment in which mailing services are provided by various content providers (CPs) using the above-described email service has become common on the client side, and webmail hosting companies that provide them are also innumerable. There are many spam mails, including dozens or even hundreds of jobs a day, which is very difficult to clean up the received emails from the client's point of view.

또한, 90% 이상의 업무가 커뮤니케이션에 의존한 해운업에 종사하는 클라이언트는 메일을 일일이 확인해야하는 업무특성상 메시지 분류는 가장 필수적인 요소임에도 불구하고 기존 이메일 서비스 제공 웹서버와 MS Outlook등과 같은 메일전용 브라우저에서는 단순한 필터링과 형식적인 측면에서의 무작위적인 분류기술만 현재 제공되고 있을 뿐이다. In addition, even if 90% or more of the clients in the shipping industry rely on communication, the message classification is the most essential factor due to the task of checking mail. However, the filtering is simple in a mail-only browser such as an existing web service provider web server and MS Outlook. Only random classification techniques in terms of form and formality are currently available.

뿐만 아니라, 해운 업무와 관련된 메일의 내용은 80~90% 이상이 정형화 될 수 있으나 마땅한 표준이 없기 때문에 그 데이터를 재사용, 데이터마이닝, 또는 분석하기가 어렵다.In addition, more than 80-90% of the mail contents related to the shipping business can be formalized, but it is difficult to reuse, data min, or analyze the data because there is no suitable standard.

본 발명은 해운업이라는 특정 산업분야의 현재 주도적인 커뮤니케이션 수단으로 사용되고 있는 이메일을 업무메일로 자동 분류하고 분류된 데이터를 2차적으로 클라이언트에서 재가공 해서 사용할 수 있는 자동 데이터 베이스 구축에 관한 시스템이다. The present invention is a system for automatic database construction that can automatically classify e-mails, which are currently used as a leading communication means in a specific industry, such as the shipping industry, as work mails, and reprocess the classified data in a client.

아주 오랜 기간동안 전 세계를 상대로 비즈니스를 하는 해운업무 특성상 다양한 커뮤니케이션 수단을 사용하였으며, 표준화 시키고 메시지 정보를 클라이언트측에서 자동으로 정형데이터로 구축 해 주는 시스템은 필수적인 요소이나 현재까지 이러한 시스템은 아직 나타나지 않았다. Due to the nature of the shipping business that has been doing business with the whole world for a very long time, various communication means have been used, and the system for standardizing and automatically constructing the message information into the structured data on the client side is an essential element, but such a system has not yet appeared. .

정보화시대에 온라인상의 커뮤니케이션을 이메일이 주도 하면서 전 세계적으로 이메일의 사용량이 기하급수적으로 증대함과 동시에 스팸메일이 난무하는 정보화시대에 메일의 발송의 측면 이외에 수용의 측면에서 자기가 원하는 정보를 가장 빨리, 가장 정확하게 관리하는 것이 중요한 핵심요소로 부각되고 있다. 본 발명은 특정산업분야 즉, 해운업 업무관련 전용메일서비스를 통해 주고 받는 업무관련 메시지를 자동 분류, 각 클라이언트별 정형 DB 생성,재가공,분석 할 수 있게 한다. 그렇게 하여 본 발명은 결과적으로 전 세계 해운업의 이메일 메시지를 비정형에서 정형화하여 해운업 분야의 국제적인 커뮤니케이션을 비정형에서 정형화하고 표준화함을 그 목적으로 한다. In the information age, e-mail has led online communication, and the use of e-mail has grown exponentially worldwide. However, the most precise management is emerging as an important key element. The present invention enables the automatic classification of work-related messages sent and received through a specific industrial field, that is, a dedicated mail service related to shipping business, the formation of a DB for each client, reprocessing, and analysis. As a result, the present invention aims to formally standardize and standardize international communication in the shipping industry by unstructured e-mail messages of the global shipping industry.

또한, 본 발명의 목적은 일반메일, 스팸메일 등에서 메시지 도착 시 제공된 클라이언트 프로그램에 탑재된 지능형문서분류기(Intelligent Documents Clustering Agent)[도 3]가 규칙기반(Rule-Based)과 기계학습(Machine Learning)된 자료를 토대로 메시지의 내용을 분석하여 자동으로 정해진 업무메일로 분류하는 기능을 수행하여 업무메일 디렉터리 사서함으로 1차적으로 분류하여 클라이언트측에서 보다 간편하고 효과적으로 업무메일과 일반메일을 구분하여 사서함을 관리 할 수 있도록 하는 방법을 제공함에 있다. In addition, an object of the present invention is an Intelligent Documents Clustering Agent (FIG. 3) mounted in a client program provided when a message arrives in general mail, spam mail, etc., and is rule-based and machine learning. It analyzes the contents of the message based on the collected data and automatically classifies it into the designated work mail, and classifies it as the work mail directory mailbox first, and manages the mailbox by separating work mail and general mail more easily and effectively on the client side. To provide a way to do this.

또한, 본 발명의 목적은 제공된 클라이언트 프로그램에 탑재된 지능형 문서분류기(Intelligent Documents Clustering Agent)[도 3]에서 업무메일로 1차적으로 분류된 비정형메시지는 클라이언트 프로그램에 탑재된 지능형정보에이전트(Intelligent Information Agent)[도 4]가 2차적으로 각 메시지별 Keyword를 컴퓨터가 인식하고 해당 Keyword별 Data Value 값 (적정 수치)을 적용 클라이언트 프로그램에서 Local DB생성하며 저장된 Local DB를 클라이언트 프로그램에서 제공된 Keyword값의 범위검색 인터페이스에서 저장된 데이터를 검색, 요구사항에 적합한 정형화된 데이터를 추출하여 해운업관련 모든 메일을 정형화된 메일편집 Format 즉,mCard [도 5 ]로 표준화시킴에 있다.In addition, an object of the present invention is an intelligent information agent (Intelligent Information Agent) that is primarily classified as a work mail in the intelligent document classifier (Intelligent Documents Clustering Agent) [FIG. 3] provided in the provided client program 4] Secondly, the computer recognizes the keyword for each message and applies the data value (appropriate value) for each keyword. Local DB is generated in the client program, and the stored local DB is searched for the range of keyword values provided by the client program. Searching the stored data in the interface, and extracts the standardized data suitable for the requirements to standardize all mails related to shipping business in a standardized mail editing format, that is, mCard [Fig. 5].

또한, 본 발명은 표준화 된 메시지를 활용 간단한 인터페이스로 클라이언트 자신만의 고유 데이터 관리 간편화, 데이터 분석, 해운업무 전용 메신저(실시간 1:1 혹은 1:다수 온라인 채팅을 할 수 있는 클라이언트 소프트웨어의 일종 )와 e-Market Place(온라인상에서 상거래를 할 수 있는 인터넷상의 공간)[도 6]에 적용시켜 빠르고 편리하고 정확한 정보를 교환 가능하게 하여 한층 더 높은 비즈니스 퀄러티를 제공함에 있다. In addition, the present invention is a simple interface utilizing a standardized message, simplifying the client's own data management, data analysis, shipping-only messenger (real time 1: 1 or 1: a kind of client software that can chat online) and It is applied to an e-Market Place (a space on the Internet where commerce can be carried out online) [FIG. 6], thereby enabling a faster, convenient and accurate information exchange to provide a higher business quality.

본 발명은 해운업의 대표적인 커뮤니케이션 수단인 이메일 문서의 비정형 데이터를 1차적으로 업무관련메일로 분류하고, 2차적으로 분류된 업무메일을 클라이언트측에서 정형화된 데이터베이스로 만들어 검색 및 시스템에서 제공하는 특정양식(m-card)[도 5]으로 메일을 발송하는 시스템에 관한 것으로, 클라이언트측 프로그램[도 2]과 웹메일서버의 호환연동으로 작동 된다.The present invention primarily classifies the unstructured data of an email document, which is a representative communication means of the shipping industry, as a work-related mail, and the second form of the classified business mail as a standardized database on the client side to provide a search and a system. m-card) [FIG. 5] relates to a system for sending mail, and works by interoperating with a client-side program [FIG. 2] and a webmail server.

클라이언트 프로그램에서 MS Outlook 또는 MS Outlook Express 등의 메일사서함과 웹메일 사서함을 로딩시키고 클라이언트의 요구에 따라 각각 사서함의 비정형메시지를 검출하여 분류한다. The client program loads mail mailboxes and webmail mailboxes such as MS Outlook or MS Outlook Express, and detects and classifies the unstructured messages of the mailboxes according to the client's requirements.

즉,클라이언트 프로그램에서는 국제해운용어사전에 근거한 해운용어기반으로 기계학습(Machine Learning)시킨 자료를 토대로 지능형문서분류기(Intelligent Documents Clustering Agent)[도 3]가 작동하여 메일의 수신 시 일반메일과 업무관련 메일을 구분 시킨다In other words, in the client program, an Intelligent Documents Clustering Agent (FIG. 3) operates based on data acquired by machine learning based on a marine terminology based on an international terminology dictionary. Distinguish mail

상기와 같이 1차 메시지 분류 후 클라이언트 요구에 따라 간단한 사용자 인터페이스 (프로그램내 그림 단축아이콘)로 1차적으로 분류된 메시지를 지능형정보에이전트(Intelligent Information Agent)가 미리 기계학습시켜 놓은 메시지의 Keyword 문자패턴을 분석,각 메시지의 Keyword 문자의 데이터 값 (Data Values)을 2차적으로 분류함과 동시에 정형화된 새로운 클라이언트측 데이터 값을 생성 클라이언트 프로그램[도 2]과는 별도의 DB에 저장된다.As described above, after the first message classification, the keyword text pattern of the message which is pre-machined by the Intelligent Information Agent is first classified into a simple user interface (picture shortcut in the program) according to the client's request. Analysis and classification of Data Values of Keyword Characters of each Message Secondarily and at the same time, Newly Formed New Client-Side Data Values are Stored in a Separate DB from the Client Program [Figure 2].

상기와 같은 클라이언트측에 저장된 정형데이터는 국제해운업에서 요구하는 해운전용메일양식 M-Card [도 5]형식으로 저장된다.The structured data stored in the client side as described above is stored in the form of a mail form M-Card [Fig. 5] for sea operation required by the international shipping industry.

저장된 M-CARD 정형데이터 값의 중복되는 메시지 항목 대해서는 클라이언트 프로그램에서 중복항목을 인식,비교하여 중복항목의 최신 값을 자동 업데이트 한다 Duplicate message items of the stored M-CARD structured data values are automatically updated by the client program by recognizing and comparing the duplicate items.

또한, 상기와 같이 분류 저장된 정형데이터를 클라이언트의 요구에 따라 필요한 데이터정보를 검색하여 불러온 다음,클라이언트의 필요에 따라 데이터를 수정하게 된다.In addition, the retrieved and retrieved necessary data information according to the request of the client, and then modify the data according to the client's needs.

이러한 과정의 반복으로 인하여 클라이언트는 비정형화된 텍스트 문자가 아니라 카드형태의 정형화된 데이터정보가 된다.Due to the repetition of this process, the client becomes standardized data information in the form of a card rather than unstructured text characters.

첨부된 [도 1]을 참조 해보면 본 발명은 각 클라이언트는 Web Browser(100)를 통하여 웹서버(110)에 접속, 웹어플리케이션(130)에서 제공되는 웹메일 사서함 과 Outlook(105)의 메일 사서함을 클라이언트 프로그램에 각각 탑재된 Outlook용 문서분류기(145),웹어플리케이션용 문서분류기(140)을 통하여 일반 메일과 업무메일로 구분하게 된다.Referring to the attached [FIG. 1] the present invention, each client is connected to the web server 110 through the Web Browser (100), the web mail mailbox provided in the web application 130 and the mail mailbox of the Outlook 105 The document sorter 145 for Outlook and the document sorter 140 for web applications respectively mounted in the client program are classified into general mail and work mail.

분류된 업무메일은 클라이언트의 요구에 따라 클라이언트프로그램의 지능형정보정보에이전트(150)에서 업무메일의 Keyword와 그 Keyword에 해당하는 값(Values)들의 패턴을 인식하여 로컬 DB 저장소에 M-Card 형식(160)으로 분류 저장하게 된다. 저장된 데이터는 크라이언트의 필요에 따라 검색하여 볼 수 있다.The classified work mail recognizes the keyword of the work mail and the values corresponding to the keyword in the intelligent information information agent 150 of the client program according to the client's request. Will be saved as). Stored data can be retrieved and viewed as needed by the client.

[도면2]는 사용자(클라이언트)에 설치되는 프로그램 메뉴 구성도이다. 2 is a diagram of a program menu installed in a user (client).

메인페이지(210)는 각 서브 메뉴로 들어갈 수 있는 첫페이지이다. The main page 210 is the first page to enter each sub menu.

사용자는 첫 로그인을 실행한 후에 메인페이지를 보게되며, 전체 메일을 확인하고자 할 때는 받은편지함(221), 분류기에 의해 자동분류된 메일은 자동분류함(222)에서 확인할 수 있다. 보낸편지함(223)에서는 사용자가 보낸 메일을 확인할 수 있으며, 수신확인도 지원한다. The user sees the main page after executing the first login, and when the user wants to check the entire mail, the inbox 221 and the mail classified automatically by the classifier can be checked in the Priority Inbox 222. Sent mail 223 can check the user sent mail, it also supports acknowledgment.

편지보내기(224)는 일반적인 메일을 보낼 수 있는 일반편지 발송(240)과 TCT(Time Charter Travelling), Cargo, Tonnage 등 업무용 메일을 XML 형식으로 보낼 수 있는 mCard 발송(270) 두가지로 나뉘어 진다. 삭제한 메일을 확인할 수 있는 휴지통(225)이 있으며 서명 관리, 포워딩 설정, 외부 POP3 설정 및 가져오기 등을 할 수 있는 환경설정(226)을 제공한다. The letter sending 224 is divided into a general mail sending 240 to send a general mail and mCard sending (270) to send a business mail in XML format, such as Time Charter Traveling (TCT), Cargo, Tonnage. There is a recycle bin (225) to check the deleted mail and provides a preference (226) that can manage the signature, forwarding settings, external POP3 settings and the like.

[도면3] 지능형 문서분류기는 받은편지함(도면2-221)에 메일이 도착하면(310) TCT, Cargo, Tonnage와 관련된 메일에 들어 있어야 하는 키워드를 그 메일이 포함하고 있는지 확인한다(320). 키워드가 포함되어 있지 않으면 그대로 받은편지함(321)에 저장하고, 키워드가 포함되어 있으면 그 메일이 포함되어야 할 분류를 분석한다(330). When the mail arrives in the inbox (Fig. 2-221) (310), the intelligent document classifier checks whether the mail includes keywords that should be included in the mail related to TCT, Cargo, and Tonnage (320). If the keyword is not included, it is stored in the inbox 321 as it is.

분석된 분류가 Tonnage인 경우에는 Tonnage메일함(331)으로 복사하고, TCT인 경우에는 TCT메일함(332)로 복사하며, Cargo인 경우에는 Cargo메일함(333)으로 복사한다. 복사된 메일은 메일의 내용 중에 필요한 데이터를 mCard 형태로 변환시키기 위해 지능형 정보 에이전트로 전달된다.If the analyzed classification is Tonnage, it is copied to Tonnage mailbox 331, if it is TCT, it is copied to TCT mailbox 332, and if it is Cargo, it is copied to Cargo mailbox 333. The copied mail is delivered to the intelligent information agent to convert the necessary data in the contents of the mail into mCard form.

[도면4] TCT메일함, Cargo메일함, Tonnage메일함 등의 메일함에 메일이 도착하게 되면(410), 키워드와 키워드값의 위치를 패턴분석을 통하여 분석한다(420).[Figure 4] When a mail arrives in a mailbox such as a TCT mailbox, a cargo mailbox, or a tonnage mailbox (410), the position of the keyword and the keyword value is analyzed through pattern analysis (420).

분석된 키워드와 키워드값을 mCard 형태로 변환하기 위하여 분리하고(430), 분리가 실패하면 문서분류기에서 분류한 그대로 메일함에 보관한다(441).The analyzed keyword and the keyword value are separated in order to be converted into an mCard form (430). If the separation fails, the keyword is stored in the mailbox as classified in the document classifier (441).

성공적으로 키워드와 키워드값이 분리되면 데이터의 활용을 위하여 그 값을 DB에 저장한다(450).When the keyword and the keyword value are successfully separated, the value is stored in the DB for data utilization (450).

[도면5]에서 [도면7]까지는 mCard 형태로 메일의 내용을 저장하는 예제를 다루고 있다. [Fig. 5] to [Fig. 7] show an example of storing contents of an e-mail in the form of mCard.

[도면5]는 Cargo와 관련된 메일이 mCard 형식으로 변환된 것을 보여준다.Figure 5 shows the Cargo-related mail converted to mCard format.

mCard는 XML 형식으로 구성되며, (501)에서 보이는 내용을 분석하여 (502)에서 보이는 XML 태그에 맵핑되며 그 규칙은 다음과 같다. The mCard is configured in XML format, and the content shown in 501 is analyzed and mapped to the XML tag shown in 502. The rules are as follows.

메일의 내용Content of the mail XML 태그(TAG) - 복수XML TAG-Multiple XML 태그(TAG) - 단수XML Tag (TAG)-Singular 보낸사람Sender SenderListSenderList SenderSender 받는사람Recipient RUserListRUserList RUserRUser 참조인Reference CCUserListCCUserList CCUserCCUser 제목title SubjectSubject 본문내용Skip to content CargoCargo The Kind Of CargoThe Kind Of Cargo KindOfCargoKindOfCargo Loading PortLoading Port LoadingPortLoadingPort Discharging PortDischarging Port DischargingPortDischargingPort LayCanLayCan LayCanLayCan Loading RateLoading Rate LoadingRateLoading Rate Discharging RateDischarging Rate DischargingRateDischarging Rate FreightFreight FreightFreight Total CommitionTotal Commition TotalCommitionTotalCommition Additional CommitionAdditional Commition AddCommitionAddCommition

[도면6]는 Vessel Tonnage와 관련된 메일이 mCard 형식으로 변환된 것을 보여준다.Figure 6 shows the mail associated with Vessel Tonnage converted to mCard format.

XML 태그에 맵핑되는 규칙은 다음과 같다.The rules that map to XML tags are as follows:

메일의 내용Content of the mail XML 태그(TAG) - 복수XML TAG-Multiple XML 태그(TAG) - 단수XML Tag (TAG)-Singular 보낸사람Sender SenderListSenderList SenderSender 받는사람Recipient RUserListRUserList RUserRUser 참조인Reference CCUserListCCUserList CCUserCCUser 제목title SubjectSubject Vessel NameVessel Name VesselNameVesselName BuiltBuilt BuiltBuilt Dead WeightDead Weight DeadWeightDeadWeight FlagFlag FlagFlag DraftDraft DraftDraft Gross TonnageGross tonnage GrossTonnageGrosstonnage Net TonnageNet tonnage NetTonnageNettonnage Grain CapacityGrain capacity GrainCapacityGraincapacity Bale CapacityBale capacity BaleCapacityBalecapacity Hold/HatchHold / Hatch HoldNHatchHoldNHatch CraneCrane CraneCrane Speed BallastSpeed ballast SpeedBallastSpeedballast Speed LadenSpeed laden SpeedLadenSpeedladen

[도면7]은 TCT와 관련된 메일이 mCard 형식으로 변환된 것을 보여준다.Figure 7 shows that the TCT-related mail is converted into mCard format.

XML 태그에 맵핑되는 규칙은 다음과 같다.The rules that map to XML tags are as follows:

메일의 내용Content of the mail XML 태그(TAG) - 복수XML TAG-Multiple XML 태그(TAG) - 단수XML Tag (TAG)-Singular 보낸사람Sender SenderListSenderList SenderSender 받는사람Recipient RUserListRUserList RUserRUser 참조인Reference CCUserListCCUserList CCUserCCUser 제목title SubjectSubject 본문 내용Skip to content TCTTCT AccountAccount AccountAccount Dead WeightDead Weight DeadWeightDeadWeight BuiltBuilt BuiltBuilt Delivery AreaDelivery Area DeliveryAreaDeliveryArea Redelivery AreaRedelivery area Redelivery AreaRedelivery area LayCanLayCan LayCanLayCan DurationDuration DurationDuration Total CommitionTotal Commition Total CommitionTotal Commition

메시지자동분류 및 메시지 변환, 데이터베이스 구축 이러한 기능이 가능한 본 발명은 해운종사자들이 기존의 Text 메시지를 자동으로 정형화된 자신만의 DB로 변환하여 하나의 메시지를 한 개의 정형화된 포맷,즉 mCard 만들 수 있게 한다. 이러한 정형 Card 형태로 빠르고 ,정확하고,편리하게 정보를 주고 받을 수 가 있게 되며, mCard가 쌓이게 되면 원하는 형태로 정렬하고,검색,분석하여 언제라도 활용할 수 있는 자신의 DB를 구축할 수 있고 더 많은 비즈니스 기회를 만들 수 있게 된다. Automatic message classification, message conversion, and database construction The present invention enables shipping operators to automatically convert existing text messages into their own standardized DB to create one standardized format, that is, mCard. do. You can quickly and accurately send and receive information in the form of a fixed card, and when mCards are stacked, you can build your own DB that can be sorted, searched, analyzed, and utilized at any time. Create business opportunities.

이는 성숙해 있는 메일 기술과 한참 발전하고 있는 메신저 기술을 새로운 신기술 중의 하나인 자연어처리기술,DB 자동화 기술과 조합하여 실제 업무의 불편함을 해소 하고 새로운 업무방향을 제시하는 제3의 어플리케이션을 개발한다는 측면에서 의의가 있다.It combines the mature mail technology and the messenger technology that is well developed with natural language processing technology and DB automation technology, one of the new new technologies, to develop a third application that solves the inconvenience of actual work and suggests new business direction. There is significance in.

새로운 기술을 개발하는 것도 중요하지만, 여러 가지 기술을 응용하여 현실생활이나 업무의 불편한 점,부족한 점을 획기적으로 개선할 수 있고 새로운 비즈니스 기회를 만들어 줄 수 있는 솔루션의 개발 역시 중요하다. It is also important to develop new technologies, but it is also important to develop solutions that can dramatically improve the inconveniences and shortcomings of real life, work, and create new business opportunities by applying various technologies.

본 발명을 통하여 특히, 정보화 작업이 부족한 해운업계에 과거 TELEX 메시지를 커뮤니케이션 도구로 단일화 했던 것처럼 이메일을 업무형태로 전환하여 해운 국제 표준에 초석을 다지게 되며, 이메일이 일반적인 통신수단인 형태를 떠나 새로운 커뮤니케이션 형태의 수단으로 정착하게 되어 각층의 산업 분야의 정보화에 활력을 줄 것이고, 또 다른 성공을 노리는 활발한 응용 기술개발 시도가 뒤를 이을 것으로 전망된다. Through the present invention, in particular, in the shipping industry lacking informatization work, as the unified TELEX message as a communication tool in the past, the e-mail is transformed into a work form, thereby laying the groundwork for the international standard of shipping, and e-mail is a general communication means, and new communication It will be settled as a form of means, and it will revitalize informatization of various industries, followed by active attempts to develop applied technologies aiming for another success.

또한, 본 발명은 커뮤니케이션으로 시작하여 커뮤니케이션으로 끝나는 해운업무의 특수성을 획기적인 형식으로 정의 하여 편리하고,정확하고,신속한 업무를 가능하게 할 뿐아니라 DB의 분석으로 통해서 고부가가치의 비즈니스 기회를 찾아 생산성을 극대화 시킬 수 있다. In addition, the present invention not only enables convenient, accurate and rapid work by defining the specificity of the shipping business that starts with communication and ends with communication, but also finds high-value-added business opportunities through DB analysis and improves productivity. It can be maximized.

또한, 본 발명은 세계 해운업 메시징 처리의 표준의 초석이 됨으로써 커뮤니케이션에 보다 많이 의존하는 물류 및 타 분야의 산업에 연계 및 응용 사업( e-Market Place 등) 을 주도 할 수 있게 된다. In addition, the present invention can become a cornerstone of the world's shipping industry messaging processing standards, leading to linkage and application business (e-Market Place, etc.) in the logistics and other industries that rely more on communication.

도 1은 본 발명의 전체적인 시스템 구성도이다.1 is an overall system configuration of the present invention.

도 2는 클라이언트 프로그램의 메뉴 구성도이다.2 is a menu configuration diagram of a client program.

도 3은 지능형문서분류기(Intelligent Documents Clustering Agent)의 Flow Chart이다.3 is a flow chart of an Intelligent Documents Clustering Agent.

도 4는 지능형정보에이전트(Intelligent Information Agent)의 Flow Chart이다.4 is a flow chart of an intelligent information agent.

도 5 ~ 도 7은 mCard라는 정형양식 도면이다.5 to 7 is a standard form of mCard.

(도면의 주요부분 설명)(Explanation of main parts of drawing)

100 : Web Browser: 월드 와이드 웹(www)에서 모든 정보를 볼 수 있도록 해주는 응용 프로그램이다100: Web Browser: An application that allows you to view all the information on the World Wide Web (www).

105 : MS Outlook : 마이크로소프트사의 클라이언트용의 상용 메일 브라우저105: MS Outlook: Commercial mail browser for Microsoft clients

110 : Web Server : 웹 서비스를 가능하도록 해 주는 서버 프로그램110: Web Server: Server program that enables web service

120 : JSP Engine : JSP(Java Server Page)로 작성된 프로그램을 운영할 수 있도록 하는 서버 프로그램120: JSP Engine: a server program that allows you to operate a program written in JSP (Java Server Page)

130 : Web Application : 동적으로 웹 페이지를 생성할 수 있는 프로그램130: Web Application: a program that can dynamically generate a web page

140 : Web Application용 문서분류기 : 웹메일 사서함의 일반 메일을 업무메일과 구분,분류하는 분류처리기140: Document classifier for web applications: Classifier that classifies and classifies general mails from webmail mailboxes into work mails.

145 : MS Outlook용 문서분류기 : MS Outlook이라는 클라이언트 상용 이메일 브라우저의 이메일사서함에 도착되는 이메일 메시지를 정의된 기준에 따라 자동구분, 분류하는 1차 분류처리기145: Document sorter for MS Outlook: Primary sorting processor that automatically classifies and classifies email messages arriving at the mailbox of the client's commercial email browser, MS Outlook, according to defined criteria.

150 : 지능형 정보 에이전트 : 분류된 비정형 이메일에 포함된 Keyword와 그 형식패턴을 자동 인식하여 2차 정형 데이타베이스로 바꾸어 주는 역활을 담당하는 DB 생성기150: Intelligent information agent: DB generator that plays a role of automatically recognizing keyword and format pattern included in classified unstructured e-mail into secondary structured database

160 : mCard DB : 지능형 정보 에이전트에 의해 생성된 데이터 파일을 가리키며 국제 해운용어를 기반으로 한 Virtual Card형식의 정형화된 데이터 베이스 형식160: mCard DB: Refers to a data file created by an intelligent information agent, and is a standardized database format in the form of a virtual card based on international shipping terms.

180 : Mail Server : 메일을 송수신 할 수 있는 서버 프로그램180: Mail Server: Server program that can send and receive mail

삭제delete

185 : 외부 MTA : 외부에 존재하는 메일 서버 프로그램 185: external MTA: external mail server program

Claims (4)

인터넷을 통하여 메일을 송/수신 하는 메일서버 및 인터넷을 통하여 상기 메일서버와 접속하는 메일서버 접속수단; 해운업 관련 메일의 내용이 소정 규격으로 저장되는 데이터베이스 저장소 및 상기 메일서버의 수신된 메일을 상기 메일서버 접속수단을 통하여 키워드에 의해 상기 해운업 관련 메일과 일반메일로 분류하는 지능형 문서 분류기와 상기 지능형 문서 분류기에 의해 분류된 상기 해운업 관련 메일의 내용을 확인하여 특정 키워드에 상응하는 값을 소정 규격에 맞춰 상기 데이터베이스 저장소에 저장하는 지능형 정보 에이전트로 이루어진 클라이언트 프로그램이 구비된 컴퓨터 사이에서 클라이언트 프로그램에 의해 수행되며,A mail server for transmitting / receiving mail through the Internet and mail server access means for connecting with the mail server through the Internet; Intelligent document classifier and intelligent document classifier which classify the database storage and the mail received from the mail server into the shipping-related mail and general mail by keywords through the mail server access means. It is performed by a client program between computers equipped with a client program comprising an intelligent information agent that checks the contents of the shipping-related mail classified by and stores the value corresponding to a specific keyword in the database storage according to a predetermined standard. (a) 상기 메일서버 접속수단을 통하여 상기 메일서버에 접속하는 단계;(a) accessing the mail server through the mail server access means; (pb) 상기 지능형 문서 분류기에 의해 TCT, Cargo및 Tonnage를 키워드로 하여 상기 메일서버에 수신된 메일을 일반메일과 해운업 관련메일로 분류하는 단계;(pb) classifying mail received at the mail server into general mail and shipping related mail by the intelligent document classifier using TCT, Cargo and Tonnage as keywords; (b) 상기 지능형 문서 분류기에 의해 상기 분류된 해운업 관련메일을 복사하여 상기 지능형 정보 에이전트로 전달하는 단계;(b) copying the classified shipping-related mail by the intelligent document classifier and delivering it to the intelligent information agent; (c) 상기 지능형 정보 에이전트에 의해 상기 전달된 해운업 관련 메일의 내용을 확인한 후 소정 규격에 맞게 상기 데이터베이스 저장소에 저장하는 단계를 포함하여 이루어진 자동분류를 통한 해운업 비정형 이메일 메시지의 정형 데이터베이스화 방법.and (c) identifying the contents of the shipping-related mail delivered by the intelligent information agent and storing the contents in the database storage according to a predetermined standard. 제 1 항에 있어서,The method of claim 1, 상기 메일서버 접속수단은 상기 메일서버와 POP3로 연결되어 상기 메일서버로 송/수신되는 메일을 관리하는 상용 메일관리 프로그램인 것을 특징으로 하는 자동분류를 통한 해운업 비정형 이메일 메시지의 정형 데이터베이스화 방법.The mail server access means is a formal database management method for unstructured email messages by automatic classification, characterized in that the commercial mail management program for managing the mail sent to and received from the mail server connected to POP3. 제 1 항에 있어서,The method of claim 1, 상기 메일서버 접속수단은 상기 메일서버와 IMAP로 연결되어 상기 메일서버로 송/수신되는 메일을 관리하는 웹서버와 연결되는 웹브라우저인 것을 특징으로 하는 자동분류를 통한 해운업 비정형 이메일 메시지의 정형 데이터베이스화 방법.The mail server access means is a web browser that is connected to the mail server by IMAP and a web browser connected to a web server that manages mail sent / received by the mail server. Way. 삭제delete
KR10-2003-0032479A 2003-05-22 2003-05-22 Auto classifying method of irregular maritime email message to regular database KR100513994B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2003-0032479A KR100513994B1 (en) 2003-05-22 2003-05-22 Auto classifying method of irregular maritime email message to regular database

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2003-0032479A KR100513994B1 (en) 2003-05-22 2003-05-22 Auto classifying method of irregular maritime email message to regular database

Publications (2)

Publication Number Publication Date
KR20040100214A KR20040100214A (en) 2004-12-02
KR100513994B1 true KR100513994B1 (en) 2005-09-08

Family

ID=37377632

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2003-0032479A KR100513994B1 (en) 2003-05-22 2003-05-22 Auto classifying method of irregular maritime email message to regular database

Country Status (1)

Country Link
KR (1) KR100513994B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101631032B1 (en) * 2015-07-21 2016-06-16 한국과학기술원 Data storing system and method based on unstructured data filtering and common format conversion

Also Published As

Publication number Publication date
KR20040100214A (en) 2004-12-02

Similar Documents

Publication Publication Date Title
US8161125B2 (en) Message data management
US8725811B2 (en) Message organization and spam filtering based on user interaction
US6021427A (en) Method and system for preventing routing maelstrom loops of automatically routed electronic mail
US7386591B2 (en) Correspondent-centric management email system for associating message identifiers with instances of properties already stored in database
US9600806B2 (en) Electronic message systems and methods
CN101079827B (en) Email management method and system
US7461129B2 (en) Methods and systems for end-user extensible electronic mail
US20080147818A1 (en) Email enhancement
US8804178B2 (en) Systems and methods for routing a facsimile confirmation based on content
US20020107926A1 (en) System and method for routing an electronic mail to a best qualified recipient by using machine learning
CN1863170A (en) Method for processing junk E-mail and computer readable memory medium
CN1774706A (en) Framework to enable integration of anti-spam technologies
CN114143282A (en) Mail processing method, device, equipment and storage medium
CN101388859B (en) System and method preventing junk mail
US7720921B2 (en) System and method for soliciting and retrieving a complete email thread
CN111010336A (en) Massive mail analysis method and device
US11036976B2 (en) Methods and systems of handwriting recognition in virtualized-mail services
KR100513994B1 (en) Auto classifying method of irregular maritime email message to regular database
US20070150541A1 (en) Inbox management for threaded message views
JP2010198143A (en) Electronic mail management device, electronic mail management method, program and recording medium
CN1355499A (en) Method for processing e-mail
WO2002013470A2 (en) Recipient-specified automated processing of electronic messages
JPH02116242A (en) Electronic mail system
JPH06284145A (en) Electronic mail system
JP3399071B2 (en) Electronic mail receiving apparatus and method

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
N231 Notification of change of applicant
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080806

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee