KR20080093605A - Intelligent ecm system based on the ontology - Google Patents
Intelligent ecm system based on the ontology Download PDFInfo
- Publication number
- KR20080093605A KR20080093605A KR1020070037529A KR20070037529A KR20080093605A KR 20080093605 A KR20080093605 A KR 20080093605A KR 1020070037529 A KR1020070037529 A KR 1020070037529A KR 20070037529 A KR20070037529 A KR 20070037529A KR 20080093605 A KR20080093605 A KR 20080093605A
- Authority
- KR
- South Korea
- Prior art keywords
- semantic
- module
- ontology
- management module
- document
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/123—Storage facilities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
Abstract
Description
도 1은 본 발명의 바람직한 실시예에 따른 온톨로지 기반의 인텔리전트 ECM 시스템의 구성을 개략적으로 나타낸 도면.1 is a view schematically showing the configuration of an ontology-based intelligent ECM system according to a preferred embodiment of the present invention.
도 2는 본 발명의 바람직한 실시예에 따른 온톨로지 기반의 인텔리전트 ECM 시스템의 응용 계층의 구성을 개략적으로 나타낸 도면.2 is a diagram schematically illustrating the configuration of an application layer of an ontology-based intelligent ECM system according to a preferred embodiment of the present invention.
도 3은 본 발명의 바람직한 실시예에 따른 온톨로지 기반의 인텔리전트 ECM 시스템의 시스템 계층의 구성을 개략적으로 나타낸 도면.3 is a diagram schematically showing the configuration of a system layer of an ontology-based intelligent ECM system according to a preferred embodiment of the present invention.
도 4는 본 발명의 바람직한 실시예에 따른 온톨로지 기반의 인텔리전트 ECM 시스템의 저장소 계층의 구성을 개략적으로 나타낸 도면.4 is a diagram schematically illustrating a configuration of a storage layer of an ontology-based intelligent ECM system according to a preferred embodiment of the present invention.
본 발명은 온톨로지 기반의 인텔리전트 ECM 시스템에 관한 것이다.The present invention relates to an ontology-based intelligent ECM system.
전사적 콘텐츠 관리 시스템인 ECM(Enterprise Content Management) 시스템은 웹 사이트의 콘텐츠뿐만 아니라, 일반 문서, 각종 멀티미디어 자료 등과 같은 비정형화된 콘텐츠를 통합 관리하는 시스템을 의미한다. 최근 ECM은 기업 내부의 콘텐 츠의 양과 종류가 급격한 속도로 증가하는 상황에서, 이에 대한 체계적인 관리가 기업 경쟁력 강화 및 생산성 향상에 크게 기여한다는 점에서 주목받고 있다. 또한 기업을 둘러싼 법률 규제(Compliance)가 더욱더 강화되고 있어서 콘텐츠 관리의 필요성이 점차 증가되고 있는 추세에 따라서, ECM에 대한 관심이 증폭되고 있다. 전 산업에 걸쳐서 정보 기술화가 진행되면서, 기업들은 자사가 보유하고 있는 파일 시스템, DM/XML, 문서, 미디어, ERP(Enterprise Resource Planning) 등의 디지털 콘텐츠에 대한 효율적인 관리에 대한 고민을 하고 있다. 특히 e-비즈니스 도입으로 발생되는 새로운 비즈니스 모델의 환경에서 효율적인 콘텐츠의 관리 여부가 비즈니스 성패를 가늠하는 중요한 잣대가 되고 있으며, 기업들이 효율적인 콘텐츠 관리를 통하여 자사가 보유하는 정보를 구성원들이 쉽게 공유하고, 경영진의 의사 결정이 적절히 활용될 수 있는 방향으로 콘텐츠 관리 시스템의 필요성이 증대되고 있는 측면에서, ECM의 중요성이 더욱더 대두되고 있다.The enterprise content management (ECM) system, which is an enterprise-wide content management system, refers to a system that integrates and manages unstructured content such as general documents and various multimedia materials, as well as contents of a web site. In recent years, ECM has attracted attention because the amount and type of content inside a company is rapidly increasing, and the systematic management of it greatly contributes to strengthening corporate competitiveness and improving productivity. In addition, due to the ever-increasing legal compliance surrounding companies, the need for content management is gradually increasing, thereby increasing interest in ECM. As information technology advances across industries, companies are concerned about the efficient management of their digital content, including file systems, DM / XML, documents, media, and enterprise resource planning (ERP). In particular, in the new business model environment created by the introduction of e-business, the management of effective content becomes an important criterion for determining the success or failure of the business, and the members can easily share the information they own through efficient content management. As the need for content management systems increases in the direction that management decisions can be properly utilized, the importance of ECM is even more important.
기업의 경영 활동을 궁극적으로 데이터의 관리와 프로세스라고 볼 때, 과거에는 주로 ERP, SCM(Supply Chain Management), CRM(Customer Relationship Management), DW(Data Warehouse) 등의 정형화된 데이터 관리가 중심이었지만, 최근에는 기업의 구성원 개개인의 노하우 등이 기록된 문서, 멀티미디어 데이터를 포함하는 비정형화된 데이터의 통합 관리가 중요하다. 더욱이 비즈니스가 가속화됨에 따라서, 관리해야 할 콘텐츠의 양이 급속히 증가하며, 기존의 IT 시스템으로서는 이에 대한 관리가 점점 어려워지고 있는 상황에서, ECM을 통한 비정형화된 데이터의 체계적인 관리가 더욱 필요하다. In the past, corporate management activities were ultimately the management and process of data. In the past, formal data management such as ERP, Supply Chain Management (SCM), Customer Relationship Management (CRM), and Data Warehouse (DW) was the focus. In recent years, integrated management of unstructured data, including documents and multimedia data, in which the company's individual know-how is recorded is important. Moreover, as the business accelerates, the amount of content to manage rapidly increases, and it is increasingly difficult to manage it with existing IT systems, which requires more systematic management of unstructured data through ECM.
따라서 기업들은 일반 문서, 스프레드 시트, 계약서, 도면 등의 각종 양식의 관리를 위한 EDM(Engineering Data Management), HTML/SGML/WML/XML/웹 양식 등의 웹 콘텐츠의 관리를 위한 WCM(Web Content Management), 이미지, 비디오, 오디오, 프리젠테이션 등의 멀티미디어 콘텐츠의 관리를 위한 DAM(Digital Asset Management), 비정형 콘텐츠의 관리를 위한 ERM 및 협업 콘텐츠의 관리를 위한 CCM(Category Consumer Management) 등을 포함한 전사적 콘텐츠 관리 시스템인 ECM 시스템을 채택하는 경향이 증대되고 있다.As a result, WCM (Web Content Management) for the management of web contents such as Engineering Data Management (EDM), HTML / SGML / WML / XML / Web forms, etc. for the management of various forms such as general documents, spreadsheets, contracts, and drawings. Enterprise-wide content including Digital Asset Management (DAM) for managing multimedia content such as images, video, audio, and presentations, ERM for managing unstructured content, and Category Consumer Management (CCM) for managing collaborative content. There is an increasing tendency to adopt ECM systems, which are management systems.
ECM 시스템에 대한 주된 수요가 대용량 콘텐츠 관리의 필요성을 가지며, 전체적인 통합 능력 및 실행 능력을 보유하는 공공 기관 및 대기업을 중심으로 나타나고 있다. 그러나 ECM 시스템을 도입하지 않고서는 경쟁력을 갖추기 힘든 상황임에 따라서, 중견 기업에 의한 ECM 시스템의 수요가 점차 증가하고 있다.The main demand for ECM systems is the need for large-capacity content management, centered on public institutions and large enterprises with overall integration and execution capabilities. However, as it is difficult to be competitive without introducing an ECM system, the demand for ECM systems by mid-sized companies is gradually increasing.
그러나 종래의 ECM 시스템은 콘텐츠의 생성, 등록 및 관리 부분에 초점을 맞추어 개발되어 있기 때문에, 콘텐츠에 대한 검색 및 조회 부분에 대한 기능이 열악한 문제점이 있다. 즉 사용자는 종래의 ECM 시스템을 통하여, 통상적으로 게시판 상에서 콘텐츠에 대한 검색 및 조회를 할 수 있을 뿐이다. 또한 종래의 ECM 시스템은 게시판 상에서 콘텐츠에 대한 검색 및 조회 기능을 제공하더라도, 단어 중심의 검색 기능만을 제공하기 때문에, 데이터의 양이 늘어날수록 부정확한 검색이 이루어질 수밖에 없는 문제점을 가지고 있다.However, since the conventional ECM system has been developed with a focus on the generation, registration, and management of content, there is a problem in that a function for searching and inquiring about content is poor. That is, the user can only search and search for contents on a bulletin board through the conventional ECM system. In addition, even if the conventional ECM system provides a search and inquiry function for the content on the bulletin board, it provides only a word-centered search function, so that an incorrect search is inevitable as the amount of data increases.
본 발명은 종래의 문제점을 극복하기 위하여 안출된 것으로, 시맨틱 웹(Semantic Web)의 온톨로지 기법(Ontology)을 기반으로 디지털 콘텐츠의 의미를 추론하고, 의미론에 따라서 검색을 수행하는 온톨로지 기반의 인텔리전트 ECM 시스템을 제공하는 것을 목적으로 한다.The present invention has been made to overcome the problems of the prior art, an ontology-based intelligent ECM system that infers the meaning of digital content based on the ontology of semantic web (Ontology), and performs a search according to semantics The purpose is to provide.
본 발명의 다른 목적은 시맨틱 웹의 온톨로지 기법에 따라서, 의미론에 따라서 검색된 결과를 단일 화면으로 출력하여, 사용자가 용이하게 조회할 수 있는 온톨로지 기반의 인텔리전트 ECM 시스템을 제공하는 것이다.Another object of the present invention is to provide an ontology-based intelligent ECM system that can be easily searched by a user by outputting a searched result according to semantics according to the semantic web ontology technique.
본 발명의 또 다른 목적은 시맨틱 웹의 온톨로지 기법을 이용하여 의미 단위의 문서 헤더를 저장하여, 검색시 해당 문서 헤더만을 참조함으로써, 검색시 부하 발생을 최소화시키는 온톨로지 기반의 인텔리전트 ECM 시스템을 제공하는 것이다.It is still another object of the present invention to provide an ontology-based intelligent ECM system that minimizes load generation when searching by storing document headers in semantic units using the semantic web ontology technique and referring only to the corresponding document headers when searching. .
본 발명의 또 다른 목적은 시맨틱 웹의 온톨로지 기법을 이용하여, 의미 단위의 문서 헤더를 저장함으로써, 문서가 갖는 다의성 문제를 해결하고, 문서와 문서의 의미 관계(Semantic Relation)를 정의하여, 검색의 효율성을 증가시키는 시맨틱 저장소(Semantic Repository)를 이용하는 온톨로지 기반의 인텔리전트 ECM 시스템을 제공하는 것이다.Another object of the present invention is to use the semantic web ontology technique to store the document header in the semantic unit, thereby solving the problem of multiplicity of the document, defining the semantic relation between the document, It is to provide an ontology-based intelligent ECM system that uses the Semantic Repository to increase efficiency.
상기의 목적들을 달성하기 위하여 본 발명의 일 측면에 따르면, 입력되는 디지털 콘텐츠를 단어와 빈도수를 바탕으로 정렬하며, 각 디지털 콘텐츠에 식별자를 부여한 후, 상기 디지털 콘텐츠를 대표하는 단어를 추출하는 시맨틱 추출 모듈, 상기 시맨틱 추출 모듈에서 추출한 단어를 바탕으로 의미를 추론하며, 상기 추론된 의미를 바탕으로 의미 분류 정보를 생성하며, 상기 의미 및 상기 의미 분류 정보 중 적어도 하나를 포함하는 의미 단위의 문서 헤더를 생성하는 시맨틱 생성 모듈 및 상기 시맨틱 생성 모듈에서 생성한 복수의 문서 헤더 사이의 유사성을 분석하여 의미 관계 테이블을 정의 및 생성하는 시맨틱 관계 테이블을 포함하는 저장소 계층을 포함하는 온톨로지 기반의 인텔리전트 ECM 시스템을 제공할 수 있다.According to an aspect of the present invention in order to achieve the above objects, semantic extraction for sorting the input digital content based on the word and frequency, assigning an identifier to each digital content, and extracting a word representing the digital content Module, the semantic extracting module deduces meaning based on the word, generates semantic classification information based on the deduced meaning, and includes a document header of a semantic unit including at least one of the semantic and semantic classification information. Provides an ontology-based intelligent ECM system including a storage layer including a semantic relation table that defines and generates a semantic relation table by analyzing similarities between a generated semantic generation module and a plurality of document headers generated by the semantic generation module can do.
바람직한 실시예에서, 상기 저장소 계층은 상기 시맨틱 관계 테이블에서 생성된 복수의 의미 관계 테이블을 바탕으로 유사한 의미의 문서들을 통합하여 관리하는 시맨틱 통합 모듈을 더 포함한다. 또한 상기 저장소 모듈은 상기 디지털 콘텐츠를 외부로부터 입력받는 I/O 모듈을 더 포함한다. 또한 상기 저장소 모듈은 상기 추출된 단어, 상기 문서 헤더 및 상기 의미 관계 테이블 중 적어도 하나를 저장하는 스토리지를 더 포함한다. 또한 상기 시맨틱 생성 모듈은 RDF(Resource Description Framework)를 이용하여 상기 문서 헤더를 생성하는 것을 특징으로 한다. 또한 상기 시맨틱 추출 모듈은 상기 디지털 콘텐츠에 상응하는 택소노미(taxonomy)에서 불용어(stopword)와 무의어(noise)를 제거함으로써, 상기 단어를 추출하는 것을 특징으로 한다. 또한 상기 시맨틱 관계 테이블은 벡터 공간 모델을 이용하여 상기 시맨틱 생성 모듈에서 생성한 각 문서 헤더 사이의 유사성을 분석하여 상기 의미 관계 테이블을 정의 및 생성하는 것을 특징으로 한다. 또한 온톨로지 기반의 인텔리전트 ECM 시스템은 ECM 엔진(engine) 부분인 시스템 계층 및 사용자 인터페이스 부분인 응용 계층을 더 포함한다. 또한 상기 시스템 계층은 반입/반출 관리 모듈, 문서 관리 모듈, 프로토콜 관리 모듈, 문서 제어 모듈, 암호화 관리 모듈, 사용자 관리 모듈, ACL(Access Control List) 관리 모듈, 버전 관리 모듈, 압 축 관리 모듈, 저장소 관리 모듈, 환경 관리 모듈, 보안 관리 모듈, 폴더 관리 모듈 및 기록 관리 모듈 중 적어도 하나를 포함한다. 또한 상기 응용 계층은 웹 퍼블리셔 모듈, 임포트 매니저 모듈, 스캔 스테이션 모듈, 통합 뷰어 모듈, 폴더 관리 모듈 및 문서 관리 모듈 중 적어도 하나를 포함한다. 또한 상기 통합 뷰어 모듈은 사용자의 검색 요청에 응답하여 상기 저장소 계층에서 상기 문서 헤더 및 상기 의미 관계 테이블 중 적어도 하나를 바탕으로 추출한 검색 결과를 단일 화면으로 출력하는 것을 특징으로 한다.In a preferred embodiment, the storage layer further includes a semantic integration module that integrates and manages documents of similar meanings based on a plurality of semantic relationship tables generated in the semantic relationship table. The storage module may further include an I / O module for receiving the digital content from the outside. The storage module may further include storage for storing at least one of the extracted word, the document header, and the semantic relation table. The semantic generation module may generate the document header using a resource description framework (RDF). The semantic extraction module may extract the word by removing stopwords and noises from a taxonomy corresponding to the digital content. The semantic relation table may define and generate the semantic relation table by analyzing similarities between document headers generated by the semantic generation module using a vector space model. In addition, the ontology-based intelligent ECM system further includes an application layer that is a system layer and a user interface part that is an ECM engine part. In addition, the system layer includes import / export management module, document management module, protocol management module, document control module, encryption management module, user management module, access control list (ACL) management module, version management module, compression management module, storage At least one of a management module, an environment management module, a security management module, a folder management module, and a record management module. The application layer also includes at least one of a web publisher module, an import manager module, a scan station module, an integrated viewer module, a folder management module, and a document management module. The integrated viewer module may output a search result extracted from the storage layer based on at least one of the document header and the semantic relation table in a single screen in response to a user's search request.
이하, 본 발명의 실시예에 대한 구성 및 그 작용을 첨부한 도면을 참조하면서 상세히 설명하기로 한다. 도면이나 도면에 대한 설명은 본 발명의 예를 든 것으로 이로써 본 발명의 범위를 한정하는 것은 아니다.Hereinafter, with reference to the accompanying drawings, the configuration and operation of the embodiment of the present invention will be described in detail. The drawings and the description of the drawings are examples of the present invention, which does not limit the scope of the present invention.
도 1은 본 발명의 바람직한 실시예에 따른 온톨로지 기반의 인텔리전트 ECM 시스템의 구성을 개략적으로 나타낸 도면이다.1 is a view schematically showing the configuration of an ontology-based intelligent ECM system according to a preferred embodiment of the present invention.
도 1을 참조하면, 본 발명에 따른 온톨로지 기반의 인텔리전트(intelligent) ECM 시스템은 응용 계층(Application Layer; 100), 시스템 계층(System Layer; 110), 저장소 계층(Repository Layer; 130), J2EE 플랫폼(Java 2 Enterprise Edition Platform; 140) 및 OS/VM(Operating System/Virtual Machine; 150)를 포함한다. 사용자 인터페이스 부분인 응용 계층(100)은 도 2를 참조하여, 본 발명에 따른 온톨로지 기반의 인텔리전트 ECM의 엔진 부분인 시스템 계층(110)은 도 3을 참조하여, 시맨틱 저장소(Semantic Repository)인 저장소 계층(130)은 도 4를 참조하여 상세히 설명하기로 한다.Referring to FIG. 1, an ontology-based intelligent ECM system according to the present invention includes an application layer (100), a system layer (110), a repository layer (130), a J2EE platform ( Java 2 Enterprise Edition Platform (140) and Operating System / Virtual Machine (OS / VM) 150. The
상기 J2EE 플랫폼(140)은 본 발명에 따른 온톨로지 기반의 인텔리전트 ECM 시스템이 자바 환경에서 구동될 수 있도록 하는 플랫폼이다. 본 발명에 따른 상기 J2EE 플랫폼(140)은 JSP(Java ServerPages) 및 서블릿(Servlet), XML, Web Service 프로토콜, SOAP(Simple Object Access Protocol), J2EE API를 지원한다. 상기 OS/VM(150)은 본 발명에 따른 온톨로지 기반의 인텔리전트 ECM 시스템의 운영 체계로서 Unix, Linux 및/또는 Windows를 채택하며, 분할 사용이나, 운영 체계 등의 구성을 달리하여 운영하기 위하여 VM을 채택한다.The J2EE
도 2는 본 발명의 바람직한 실시예에 따른 온톨로지 기반의 인텔리전트 ECM 시스템의 응용 계층의 구성을 개략적으로 나타낸 도면이다. 2 is a diagram schematically showing the configuration of an application layer of an ontology-based intelligent ECM system according to a preferred embodiment of the present invention.
도 2를 참조하면, 본 발명의 온톨로지 기반의 인텔리전트 ECM 시스템의 응용 계층은 웹 퍼블리셔 모듈(Web Publisher; 101), 임포트 매니저 모듈(Import Manager; 102), 스캔 스테이션 모듈(Scan Station; 103), 통합 뷰어 모듈(Viewer; 104), 폴더 관리 모듈(105) 및 문서 관리 모듈(106)을 포함한다.Referring to FIG. 2, the application layer of the ontology-based intelligent ECM system of the present invention includes a web publisher module (Web Publisher) 101, an import manager module (102), a scan station module (Scan Station) 103, and an integration layer.
상기 웹 퍼블리셔 모듈(101)은 HTML이나 XML에 대한 전문적인 지식이 없는 사용자도 정의된 템플릿(Template)을 통하여 용이하게 사용할 수 있도록 브라우저 기반 인터페이스를 제공한다. 구체적으로 상기 웹 퍼블리셔 모듈(101)은 상기 사용자에게 브라우저 기반의 익숙한 편집 도구를 제공하며, XML을 이용한 콘텐츠와 레이아웃을 분리한다. The
상기 임포트 매니저 모듈(102)은 오피스 문서, 오디오 파일, 비디오 파일과 같은 멀티미디어 파일 등 모든 전자 파일 형태의 문서를 일괄적으로 임포트하고 메 타 정보를 관리한다. 구체적으로 상기 임포트 매니저 모듈(102)은 드래그/드롭(Drag/Drop) 기능을 이용하여 사용자가 문서를 용이하게 임포트할 수 있도록 구성되며, 하나의 파일에 복수의 도큐먼트를 결합하는 기능(One File Multi-Document)을 지원한다. The
상기 스캔 스테이션 모듈(103)은 종이 문서를 전자화하기 위한 스캐너, 팩스 등의 디바이스를 제어하여, 스캔 이미지를 보정하며 저장할 수 있는 기능을 제공한다. 구체적으로 상기 스캔 스테이션 모듈(103)은 스캔 문서를 일괄적으로 등록할 수 있는 기능, TWIN, ISIS 등의 표준 드라이버 및 원격 스캔 기능을 지원한다.The
상기 통합 뷰어 모듈(104)은 기업 내의 다양한 AUTOCAD, JPEG, GIF, TIF 등의 이미지 파일, MS-WORD, PDF 등의 문서 파일 등을 통합적으로 출력하는 기능을 제공한다. 또한 상기 통합 뷰어 모듈(104)은 사용자의 검색 요청에 따라서 시맨틱 웹의 온톨로지 기법의 적용에 따라서 검색된 결과를 단일 화면에서 출력하는 기능을 제공한다. 사용자는 상기 통합 뷰어 모듈(104)에서 제공하는 단일 화면에서 모든 디지털 콘텐츠를 조회할 수 있다.The
상기 폴더 관리 모듈(105) 및 문서 관리 모듈(106)은 사용자가 기존에 익숙하게 사용하던 폴더 관리 기능 및 문서 관리 기능을 제공한다.The
도 3은 본 발명의 바람직한 실시예에 따른 온톨로지 기반의 인텔리전트 ECM 시스템의 시스템 계층의 구성을 개략적으로 나타낸 도면이다. 3 is a diagram schematically showing the configuration of a system layer of an ontology-based intelligent ECM system according to a preferred embodiment of the present invention.
도 3을 참조하면, 본 발명의 온톨로지 기반의 인텔리전트 ECM 시스템의 시스템 계층은 반입/반출 관리 모듈(Check In/Out Management; 111), 문서 관리 모 듈(Document Management; 112), 프로토콜 관리 모듈(Protocol Management; 113), 문서 제어 모듈(Doc. Control Management; 114), 암호화 관리 모듈(Encryption Management; 115), 사용자 관리 모듈(User Management; 116), ACL 관리 모듈(ACL(Access Control List) Management; 117), 버전 관리 모듈(Version Management; 118), 압축 관리 모듈(Compress Management; 119), 저장소 관리 모듈(Repository Management; 120), 환경 관리 모듈(Environment Management; 121), 보안 관리 모듈(Security Management; 122), 폴더 관리 모듈(Folder Management; 123) 및 기록 관리 모듈(Record Management; 124)을 포함한다.Referring to FIG. 3, the system layer of the ontology-based intelligent ECM system of the present invention includes an import / export management module (Check In / Out Management) 111, a
상기 반입/반출 관리 모듈(111)은 문서의 반입 및 반출 기능을 담당한다. 구체적으로, 상기 반입/반출 관리 모듈(111)은 문서의 반입시 새로운 버전(Version)을 생성하는 기능, 반출 문서에 대한 잠금(Lock) 기능, 반출 문서의 사용자를 확인하는 기능, 반출 문서의 복사본 읽기 기능 및 반입/반출에 대한 상태를 표시하는 기능을 제공한다.The import /
상기 문서 관리 모듈(112)은 문서의 등록, 수정 및 삭제 기능을 담당한다. 구체적으로, 상기 문서 관리 모듈(112)은 문서 등록 정보(속성)의 입력 기능, 계층 구조에 따른 문서 등록 기능, 다중 문서의 일괄 등록 기능, 등록 문서의 수정 기능, 삭제 문서의 임시 보관 기능, 삭제 문서의 폐기 및 복구 기능, 문서 목록 및 원본 인쇄 설정 기능을 제공한다.The
상기 프로토콜 관리 모듈(113)은 문서를 포함하는 콘텐츠의 전송 방식인 프로토콜의 관리 및 이에 따른 전송을 담당한다. 구체적으로, 상기 프로토콜 관리 모 듈(113)은 RMI(Remote Method Invocation) 클라이언트 기능, 소켓(Socket) 기능, XML 파서(Parser) 기능, DRM(Digital Right Management) 인터페이스 기능, SOAP 기능 및 Web Service 기능을 제공한다.The
상기 문서 제어 관리 모듈(114)은 특정 디지털 콘텐츠의 포맷에 대하여 해당하는 조회 방식(Viewing)을 관리한다. 구체적으로 상기 문서 제어 관리 모듈(114)은 빌트-인(Built-In) 기능, 플러그-인(Plug-In) 기능, OLE(Object Linking and Embedding) 기능, API 후킹(Hooking) 기능 및 파일 필터(File Filter) 기능을 제공한다.The document
상기 암호화 관리 모듈(115)은 중요 정보에 대한 암호화 기능을 담당한다. 구체적으로 상기 암호화 관리 모듈(115)은 폴더명, 메타 데이터, 문서 등에 대한 암호화 기능을 제공한다.The
상기 사용자 관리 모듈(116)은 사용자 계정의 등록, 수정 및 삭제 기능을 담당한다. 구체적으로 상기 사용자 관리 모듈(116)은 로그인 명칭/비밀번호 설정 기능, 소속 그룹의 설정 기능, 등급/권한/보안 등의 설정 기능을 제공한다.The
상기 ACL 관리 모듈(117)은 사용자별/그룹별 문서, 문서함, 타사용자/그룹에 대한 생성/수정/삭제/조회/권한 부여 등의 기능을 담당한다. 구체적으로, 상기 ACL 관리 모듈(117)은 프로파일(Profile) 레벨, 문서 유형 레벨, 업무 레벨에 따른 보안 지원 기능, 문서함 및 문서에 기본 보안 유형 설정 기능, 사용자 및 그룹에 대한 보안 유형 설정 기능을 제공한다.The
상기 버전 관리 모듈(118)은 문서의 생성/폐기/복원/이관 등의 모든 라이프 사이클에 대한 이력을 관리하는 기능을 담당한다. 구체적으로 상기 버전 관리 모듈(118)은 인가된 사용자의 로그 조회 기능, 작성자, 등록자, 수정한 사람, 행위 시간, 설명 등을 버전 내역으로 확인하는 기능, 문서를 반입할 경우, 새로운 버전으로 자동 생성하는 기능을 제공한다.The
상기 압축 관리 모듈(119)은 이미지 파일 등의 대용량 정보를 안정적으로 관리하는 기능을 담당한다. 구체적으로 상기 압축 관리 모듈(119)은 Tiff Group4로 1차 압축한 후, Jbig로 2차 압축하며, Jpeg으로 1차 압축한 후, J2k로 2차 압축한다.The
상기 저장소 관리 모듈(120)은 콘텐츠를 저장/보관/관리하기 위한 저장소(Repository)를 관리하는 기능을 담당한다. 구체적으로 상기 저장소 관리 모듈(120)은 볼륨 관리를 통한 문서의 이관 및 보관 기능, 보존 연한 관리 및 경과 문서 폐기 기능, 증분 백업(Incremental Backup) 및 기간별 백업을 위한 일자별 볼륨 관리 기능, 상용 소프트웨어와의 인터페이스 기능을 제공한다.The
상기 환경 관리 모듈(121)은 시스템 관리자 또는 사용자가 기업의 문서 관리 정책에 따라서 시스템 사용시 다양한 조건을 파라미터 방식으로 설정하여 활용하는 기능을 담당한다. 구체적으로 상기 환경 관리 모듈(121)은 폴더/문서/사용자 등에 관련된 설정 기능, 문서 검색/보존 연한 처리와 관련된 설정 기능, 첨부 파일 관리 및 파일 전송과 관련된 설정 기능, 사용자 화면에 표시되는 문서 목록과 관련된 설정 기능, 사용자별/부서별/기능별 사용 제한과 관련된 설정 기능을 제공한다.The
상기 보안 관리 모듈(122)은 문서에 대한 보안 관리 기능을 담당한다. 구체 적으로 상기 보안 관리 모듈(122)은 문서의 등록/수정/조회에 있어서 문서에 대한 사용자별/그룹별 권한을 설정하는 기능, 문서 유형(Type)별 권한 부여 기능, ACL을 통한 조직 및 개인의 보안 유형 관리 기능을 제공한다.The
상기 폴더 관리 모듈(123)은 문서의 저장 체계를 폴더라는 계층적인 구조로 관리할 수 있도록 제반 기능을 관리하는 기능을 담당한다. 구체적으로 상기 폴더 관리 모듈(123)은 폴더명, 폴더 타입, 상위 폴더, 등록 일자, 분류 체계, 보존 연한, 폴더 권한 정보의 설정 기능을 제공한다.The
상기 기록 관리 모듈(124)은 콘텐츠를 기록물로서 보관이 필요할 경우에, 기록물의 보관 주기 등을 라이프 사이클에 따라서 관리하는 기능을 제공한다. 구체적으로 상기 기록 관리 모듈(124)은 콘텐츠에 대한 생산/이관/평가/목록/매체/서가/점검/분류/통계 기능을 제공한다.The
도 4는 본 발명의 바람직한 실시예에 따른 온톨로지 기반의 인텔리전트 ECM 시스템의 저장소 계층의 구성을 개략적으로 나타낸 도면이다. 상기 저장소 계층은 시맨틱 저장소(Semantic Repository)에 상응한다.4 is a diagram schematically illustrating a configuration of a storage layer of an ontology-based intelligent ECM system according to a preferred embodiment of the present invention. The repository layer corresponds to the Semantic Repository.
도 4를 참조하면, 본 발명의 온톨로지 기반의 인텔리전트 ECM 시스템의 저장소 계층은 시맨틱 추출 모듈(Semantic Extract Module; 131), 시맨틱 통합 모듈(Semantic Classification Module; 132), 시맨틱 생성 모듈(Semantic Generation Module; 133) 및 시맨틱 관계 테이블(Semantic Relation Table; 134)을 포함한다.Referring to FIG. 4, the storage layer of the ontology-based intelligent ECM system of the present invention may include a
상기 시맨틱 추출 모듈(131)은 모든 디지털 콘텐츠(설명의 편의상 문서라 칭함)를 문서 데이터베이스(135)로부터 I/O 모듈(136)을 통하여 입력받으면, 이를 단 어와 빈도수를 중심으로 정렬하며, 각각에 대하여 고유한 식별자를 부여한 후, 상기 디지털 콘텐츠에 상응하는 택소노미(taxonomy)에서 불용어(stopword)와 무의어(noise)를 제거함으로써, 상기 디지털 콘텐츠를 대표하는 단어를 추출하여 상기 식별자에 연결하여 스토리지(137)에 저장한다.When the
상기 시맨틱 생성 모듈(133)은 상기 시맨틱 추출 모듈(131)에 의하여 상기 스토리지(137)에 저장된 상기 단어를 바탕으로 의미를 추론하여 추출하며, 상기 추출된 의미로부터 의미 분류 정보를 생성하며, RDF(Resource Description Framework)를 이용하여 상기 의미 및 상기 의미 분류 정보 중 적어도 하나를 포함하는 의미 단위의 문서 헤더를 생성한다. 그 후, 상기 시맨틱 생성 모듈(133)은 상기 스토리지(137)에 상기 식별자에 연결하여 상기 문서 헤더를 저장하며, 상기 시맨틱 관계 테이블(134)에 전달할 수 있다. The
상기 시맨틱 관계 테이블(134)은 일반화된 벡터 공간 모델을 이용하여 각 문서 헤더 사이의 유사성을 분석하여 의미 관계 테이블을 정의 및 생성하며, 생성된 의미 관계 테이블을 상기 스토리지(137)에 저장한다.The semantic relationship table 134 analyzes the similarity between document headers using a generalized vector space model to define and generate a semantic relationship table, and stores the generated semantic relationship table in the
상기 시맨틱 통합 모듈(132)은 상기 스토리지(137)에 저장된 복수의 의미 관계 테이블을 바탕으로 유사한 의미의 문서들을 통합하여 관리한다.The semantic integration module 132 integrates and manages documents of similar meanings based on a plurality of semantic relation tables stored in the
사용자가 본 발명에 따른 온톨로지 기반의 인텔리전트 ECM 시스템을 사용하여 검색을 요청할 때, 상기 ECM 시스템은 상기 시맨틱 저장소 계층에 저장된 상기 문서 헤더 및 의미 관계 테이블 중 적어도 어느 하나만을 참조하여, 검색 결과를 추출하며, 추출된 검색 결과는 상술한 통합 뷰어를 통하여 단일 화면으로 출력한 다. 검색시 의미 단위의 문서 헤더만을 참조함으로써, 실제 검색에서 발생하는 인덱스 생성에 따른 부하를 감소시킬 수 있으며, 다른 형식의 의미를 부여하여 디지털 콘텐츠, 즉 문서가 갖는 다의성 문제를 해결할 수 있다. 또한 의미 관계(Semantic Relation)가 정의된 의미 관계 테이블을 사용하여 검색을 실행함으로써, 문서 검색의 효율성을 높일 수 있다.When a user requests a search using an ontology-based intelligent ECM system according to the present invention, the ECM system extracts a search result by referring to at least one of the document header and semantic relation table stored in the semantic storage layer. The extracted search results are output on a single screen through the integrated viewer described above. By only referring to the document header of the semantic unit in the search, the load caused by the index generation that occurs in the actual search can be reduced, and the meaning of the digital format, that is, the document, can be solved by assigning different types of meaning. In addition, by performing a search using a semantic relation table in which semantic relation is defined, the efficiency of document retrieval can be improved.
본 발명은 상기 실시예에 한정되지 않으며, 많은 변형이 본 발명의 사상 내에서 당 분야에서 통상의 지식을 가진 자에 의하여 가능함은 물론이다. The present invention is not limited to the above embodiments, and many variations are possible by those skilled in the art within the spirit of the present invention.
본 발명에 의하여, 시맨틱 웹(Semantic Web)의 온톨로지 기법(Ontology)을 기반으로 디지털 콘텐츠의 의미를 추론하고, 의미론에 따라서 검색을 수행하는 온톨로지 기반의 인텔리전트 ECM 시스템을 제공할 수 있다.According to the present invention, it is possible to provide an ontology-based intelligent ECM system that infers the meaning of digital content based on the ontology of the Semantic Web and performs a search according to semantics.
또한 본 발명에 의하여, 시맨틱 웹의 온톨로지 기법에 따라서, 의미론에 따라서 검색된 결과를 단일 화면으로 출력하여, 사용자가 용이하게 조회할 수 있는 온톨로지 기반의 인텔리전트 ECM 시스템을 제공할 수 있다.In addition, according to the present invention, an ontology-based intelligent ECM system that can be easily inquired by a user by outputting a search result according to semantics according to the semantic web ontology technique can be provided.
또한 본 발명에 의하여, 시맨틱 웹의 온톨로지 기법을 이용하여 의미 단위의 문서 헤더를 저장하여, 검색시 해당 문서 헤더만을 참조함으로써, 검색시 부하 발생을 최소화시키는 온톨로지 기반의 인텔리전트 ECM 시스템을 제공할 수 있다.In addition, the present invention can provide an ontology-based intelligent ECM system that minimizes load generation by searching by storing document headers in a semantic unit by using the ontology technique of the semantic web and referring only to the corresponding document headers when searching. .
또한 본 발명에 의하여, 시맨틱 웹의 온톨로지 기법을 이용하여, 의미 단위의 문서 헤더를 저장함으로써, 문서가 갖는 다의성 문제를 해결하고, 문서와 문서의 의미 관계(Semantic Relation)를 정의하여, 검색의 효율성을 증가시키는 시맨틱 저장소(Semantic Repository)를 이용하는 온톨로지 기반의 인텔리전트 ECM 시스템을 제공할 수 있다.In addition, according to the present invention, by using the semantic web ontology technique, by storing the document header in the semantic unit, solve the multiplicity problem of the document, define the semantic relation between the document, the efficiency of the search It is possible to provide an ontology-based intelligent ECM system that uses a Semantic Repository to increase.
Claims (11)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070037529A KR101137243B1 (en) | 2007-04-17 | 2007-04-17 | Intelligent ECM system based on the ontology |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070037529A KR101137243B1 (en) | 2007-04-17 | 2007-04-17 | Intelligent ECM system based on the ontology |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080093605A true KR20080093605A (en) | 2008-10-22 |
KR101137243B1 KR101137243B1 (en) | 2012-04-20 |
Family
ID=40154086
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070037529A KR101137243B1 (en) | 2007-04-17 | 2007-04-17 | Intelligent ECM system based on the ontology |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101137243B1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101134073B1 (en) * | 2009-12-22 | 2012-04-13 | 최진근 | Search Method for using word association between search keyword and search result and system thereof |
US8954437B2 (en) | 2012-01-26 | 2015-02-10 | International Business Machines Corporation | Monitoring content repositories, identifying misclassified content objects, and suggesting reclassification |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000276487A (en) | 1999-03-26 | 2000-10-06 | Mitsubishi Electric Corp | Method and device for instance storage and retrieval, computer readable recording medium for recording instance storage program, and computer readable recording medium for recording instance retrieval program |
JP2003030204A (en) * | 2001-07-17 | 2003-01-31 | Takami Yasuda | Server for providing video contents, device and method for preparing file for video contents retrieval, computer program and device and method for supporting video clip preparation |
JP2004287670A (en) * | 2003-03-20 | 2004-10-14 | Dainippon Printing Co Ltd | Image database preparing device, image database preparing method, program, and recording medium |
US7213022B2 (en) * | 2004-04-29 | 2007-05-01 | Filenet Corporation | Enterprise content management network-attached system |
-
2007
- 2007-04-17 KR KR1020070037529A patent/KR101137243B1/en not_active IP Right Cessation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101134073B1 (en) * | 2009-12-22 | 2012-04-13 | 최진근 | Search Method for using word association between search keyword and search result and system thereof |
US8954437B2 (en) | 2012-01-26 | 2015-02-10 | International Business Machines Corporation | Monitoring content repositories, identifying misclassified content objects, and suggesting reclassification |
US8954436B2 (en) | 2012-01-26 | 2015-02-10 | International Business Machines Corporation | Monitoring content repositories, identifying misclassified content objects, and suggesting reclassification |
Also Published As
Publication number | Publication date |
---|---|
KR101137243B1 (en) | 2012-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11755628B2 (en) | Data relationships storage platform | |
CN100504858C (en) | Sharing computer object with association | |
US6266682B1 (en) | Tagging related files in a document management system | |
CN102741803B (en) | For the system and method promoting data to find | |
US7610285B1 (en) | System and method for classifying objects | |
US6330573B1 (en) | Maintaining document identity across hierarchy and non-hierarchy file systems | |
McCray et al. | Principles for digital library development | |
US6240429B1 (en) | Using attached properties to provide document services | |
US9298702B1 (en) | Systems and methods for pairing of a semantic network and a natural language processing information extraction system | |
Lavoie | The open archival information system reference model: Introductory guide | |
US7761443B2 (en) | Implementing access control for queries to a content management system | |
US7865873B1 (en) | Browser-based system and method for defining and manipulating expressions | |
CN100478947C (en) | Document information processing apparatus and document information processing method | |
US6324551B1 (en) | Self-contained document management based on document properties | |
CN101587528B (en) | Information processing apparatus and control method therefor | |
US7792945B2 (en) | Method and apparatus for managing the disposition of data in systems when data is on legal hold | |
Douglis et al. | Tracking and Viewing Changes on the Web. | |
CA2667264A1 (en) | Systems and methods for information organization | |
CN101441688A (en) | User authority allocation method and user authority control method | |
WO2012005730A1 (en) | System and method for document policy enforcement | |
KR101137243B1 (en) | Intelligent ECM system based on the ontology | |
Schmidt et al. | Linguistic and architectural requirements for personalized digital libraries | |
US7310643B2 (en) | Automatic capture of associations between content within a content framework system | |
CN102932574A (en) | Information processing apparatus, information processing method and system | |
Day | Preservation metadata |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
J201 | Request for trial against refusal decision | ||
B701 | Decision to grant | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |