KR101796972B1 - Document collection apparatus, method and computer program - Google Patents

Document collection apparatus, method and computer program Download PDF

Info

Publication number
KR101796972B1
KR101796972B1 KR1020160062968A KR20160062968A KR101796972B1 KR 101796972 B1 KR101796972 B1 KR 101796972B1 KR 1020160062968 A KR1020160062968 A KR 1020160062968A KR 20160062968 A KR20160062968 A KR 20160062968A KR 101796972 B1 KR101796972 B1 KR 101796972B1
Authority
KR
South Korea
Prior art keywords
document
event
relevance value
collection
relevance
Prior art date
Application number
KR1020160062968A
Other languages
Korean (ko)
Inventor
이정원
백두산
이병정
Original Assignee
서울시립대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울시립대학교 산학협력단 filed Critical 서울시립대학교 산학협력단
Priority to KR1020160062968A priority Critical patent/KR101796972B1/en
Application granted granted Critical
Publication of KR101796972B1 publication Critical patent/KR101796972B1/en

Links

Images

Classifications

    • G06F17/21
    • G06F17/30011
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

The present invention relates to a document collection providing apparatus which comprises: an event collection unit for receiving user input data, and determining whether the user input data is a document operation event related to a document operation; a document operation event analysis unit for generating or updating document relevance information between executing documents based on the document operation event; and a document collection provision unit for receiving a document collection request on a main operation document, and providing the main operation document and document collection on the main operation document based on the document relevance information. The document collection providing apparatus provides and generates document collection based on a document operation behavior without user intervention.

Description

문서 콜렉션 제공 장치, 방법 및 컴퓨터 프로그램{DOCUMENT COLLECTION APPARATUS, METHOD AND COMPUTER PROGRAM}[0001] DOCUMENT COLLECTION APPARATUS, METHOD AND COMPUTER PROGRAM [0002]

본 발명은 문서 콜렉션 제공 장치, 방법 및 컴퓨터 프로그램에 관한 것이다.The present invention relates to an apparatus, a method and a computer program for providing a document collection.

전자 문서라 함은 정보처리시스템에 의하여 전자적 형태로 작성, 송 수신 또는 저장된 정보를 말한다. 이러한 정보는 보통 웹의 형태 혹은 워드 프로세서, 아래아 한글과 같은 문서 작성 어플리케이션으로 작성된 문서의 형태를 취할 수 있다. 문서 작성 어플리케이션으로 작성된 문서의 형태를 취하는 전자 문서의 포맷은 PDF, DOC, XLS, HWP, PPT, TXT, HTML, XML 등이 있으며, 각각의 전자 문서는 확장자로 구분되는 포맷에 맞추어 사용자가 사용하는 어플리케이션에 맵핑되어 실행될 수 있다.Electronic document means information created, transmitted, received or stored in electronic form by an information processing system. Such information can be in the form of a web, or in the form of a document created by a word processing application, such as a word processor or a Hangul word processor. The format of the electronic document that takes the form of the document created by the document creation application is PDF, DOC, XLS, HWP, PPT, TXT, HTML, and XML. Each electronic document has a format Can be mapped to an application and executed.

한편, 전자 문서를 이용하는 사용자는 서로 다른 전자 문서를 열람, 작성 및 수정하기를 원하며, 운영체제는 스케쥴링을 통한 멀티태스킹을 지원하여 이를 가능하게 한다. 구체적으로 사용자는 화면을 분할하여 동시에 여러 전자 문서를 열람하기 위해서 혹은 전자 문서 열람을 위한 문서 작성 어플리케이션의 재실행 소요 시간, 번거로움을 피하기 위해서 운영체제 상에서 동일한 혹은 서로 다른 어플리케이션을 다수 실행시켜 복수 전자 문서 작업 환경을 구성하고 전자 문서 관련 작업을 할 수 있다.On the other hand, a user who uses an electronic document wants to view, create and modify different electronic documents, and the operating system supports multitasking through scheduling, thereby making it possible. Specifically, in order to divide a screen and view multiple electronic documents at the same time, or to avoid the time and hassle of redoing a document creating application for browsing electronic documents, a plurality of identical or different applications are executed on the operating system, You can configure the environment and work on electronic documents.

하지만, 수행하고 있던 전자 문서 관련 작업을 종료하고, 추후 이전의 복수 전자 문서 작업 환경을 재구성할 시, 사용자는 사용자의 기억을 토대로 열람, 작성 및 수정을 위한 여러 전자 문서를 다수 실행 시켜야 하는 번거로움이 있다.However, when the work related to the electronic document that has been performed is terminated, and the user subsequently reconfigures the previous plural electronic document work environment, the user has to perform many electronic documents for browsing, creating and modifying based on the user's memory .

위와 같은 문제를 직접적으로 혹은 간접적으로 해결하기 위한 방법(복수 전자 문서 작업 환경을 편리하게 구성할 수 있도록 하는)으로서 문서 콜렉션(혹은 그룹핑)에 관한 기술들(혹은 특허들)이 연구, 개발되고 있다.Techniques (or patents) about document collection (or grouping) have been researched and developed as methods for directly or indirectly solving the above problems (allowing for convenient configuration of multiple electronic document work environments) .

예를 들면, 몇몇 운영체제 혹은 EDMS(Electric Document Management System; 전자 문서 관리 시스템)에서는 사용자에게 파일 별 태깅 및 태그 기반 문서 콜렉션의 출력을 지원하고 있다. 사용자는 도 1에 도시된 바와 같이 복수 전자 문서 작업 환경에서 사용되는 문서 콜렉션을 구성할 수 있다. 태그를 통한 문서 콜렉션 관리 방법은 하나의 파일을 대상으로 다양한 태그를 추가할 수 있기 때문에 디렉토리를 통한 관리에 비해서 다양한 분류 기준을 취할 수 있는 장점을 가질 수 있다. 하지만, 디렉토리를 통한 관리와 마찬가지로 사용자의 수동적인 조작이 필수적으로 필요하며, 사용자의 상황 변화에 적응하지 못하여 실질적으로 많이 사용되고 있지 못하고 있다.For example, some operating systems or electronic document management systems (EDMS) support file-by-file tagging and tag-based document collection output. The user can configure a document collection used in a plurality of electronic document work environments as shown in Fig. Since the document collection management method using the tag can add various tags to one file, it can have a merit that various classification criteria can be taken as compared with the management through the directory. However, as in the case of management through a directory, a passive operation of the user is indispensably required, and it is not practically used because the user can not adapt to the situation change.

또한, 문서 유사도에 기반하여 문서 콜렉션을 생성하는 방법에 관한 연구가 있다(예를 들면, 선행 문헌 1). 문서 유사도에 기반하여 문서 콜렉션을 생성하는 방법은 정보 검색 정확도를 증가시키고, 불필요한 사용자의 개입을 줄일 수 있다. 하지만, 문서 유사도는 여러 문서 중에서 유사한 콘텐츠를 갖고 있는 문서를 식별하기 위한 수단으로서, 서로 다른 콘텐츠를 갖는 문서들을 대상으로 복수 전자 문서 작업 환경을 갖추기 위한 문서 콜렉션을 구성하려 할 때에는 활용이 불가능한 문제점이 있다. 더불어, 현재 가장 많이 사용하고 있는 bag-of-words를 통한 백터 공간 모델 상의 유사도 측정 등의 알고리즘은 콘텐츠의 형태가 텍스트인 경우에 한하여 동작이 가능하기 때문에 그림, 표 등을 대상으로는 해당 기법을 적용 할 수 없는 문제점이 있다,There is also a study on a method of generating a document collection based on document similarity (for example, Prior Art 1). A method of creating a document collection based on document similarity can increase the accuracy of information retrieval and reduce unnecessary user intervention. However, the document similarity is a means for identifying a document having similar contents among a plurality of documents. Therefore, there is a problem in that it is not applicable when a document collection for equipping a plurality of electronic document work environments with documents having different contents is configured have. In addition, algorithms such as similarity measurement on the vector space model using bag-of-words, which are currently used most frequently, can be operated only when the content type is text. Therefore, There is a problem that can not be applied,

또한, 메타 정보에 기반하여 문서 콜렉션을 생성하는 방법에 관한 연구가 있다(예를 들면, 선행 문헌 2). 메타 정보를 통한 전자 문서 검색은 복수 전자 문서 작업 환경을 갖추기 위한 문서 콜렉션을 구성하는 것을 보조할 수 있다. 하지만, 사용자가 복수 전자 문서 작업 환경을 구성하기 위해 메타 정보 기반의 검색까지 수행해야 하며, 복잡한 개입을 필요로 하여 사용성이 떨어지는 문제점이 있다. 더불어, 검색을 위해서는 검색의 내용을 사용자의 기억에 의존해야 하기 때문에 실효성이 떨어진다는 문제점이 있다.There is also a study on a method of generating a document collection based on meta information (for example, Prior Art 2). Electronic document retrieval via meta information can assist in constructing a document collection to accommodate multiple electronic document work environments. However, there is a problem that a user must perform a search based on meta information in order to configure a plurality of electronic document work environments, which requires complex intervention, resulting in poor usability. In addition, there is a problem in that the effectiveness of the search is deteriorated because the contents of the search must depend on the user's memory.

선행 문헌 1: 등록특허공보10-0459379호Prior Art 1: Registered Patent Publication No. 10-0459379

선행 문헌 2: 공개특허공보10-2014-0008156호Prior Art 2: Published Patent Publication No. 10-2014-0008156

본 발명은 상기 문제점을 해결하고자 하는 것으로, 수행하고 있던 전자 문서 관련 작업을 종료하고, 추후에 기존의 수행하고 있던 전자 문서 관련 작업에 기초하여, 사용자의 개입없이 이전의 복수 전자 문서 작업 환경을 재구성하는 문서 콜렉션 제공 장치, 방법 및 컴퓨터 프로그램을 제공하고자 한다.SUMMARY OF THE INVENTION The present invention has been made to solve the above problem, and it is an object of the present invention to provide a method and apparatus for ending an electronic document related work that has been performed and reorganizing a previous plural electronic document work environment without user intervention based on an existing electronic document related work To provide a document collection providing apparatus, method, and computer program.

또한, 문서 작업 행동 기반으로 전자 문서 콜렉션을 생성하고 제공함으로써, 종래 기술인 유사성 분석을 기반으로는 불가능하였던 유사 콘텐츠를 갖고 있지 않는 문서들을 대상으로도 이전의 복수 전자 문서 작업 환경을 재구성하는 문서 콜렉션 제공 장치, 방법 및 컴퓨터 프로그램을 제공하고자 한다.In addition, by creating and providing an electronic document collection based on a document operation behavior, a document collection for reconstructing a previous multiple electronic document working environment is also provided for documents that have no similar contents that were impossible based on the similarity analysis of the related art An apparatus, a method, and a computer program.

또한, 사용자의 개입 없이 문서 작업 행동 기반 문서 콜렉션을 생성 및 제공하는 문서 콜렉션 제공 장치, 방법 및 컴퓨터 프로그램을 제공하고자 한다. 다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.It is also an object of the present invention to provide a document collection providing apparatus, method, and computer program for creating and providing a document collection based on a document operation behavior without user intervention. It is to be understood, however, that the technical scope of the present invention is not limited to the above-described technical problems, and other technical problems may exist.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 일 실시예는 사용자 입력 데이터를 수신하고, 상기 사용자 입력 데이터가 문서 작업과 관계된 문서 작업 이벤트인지 여부를 결정하는 이벤트 수집부, 상기 문서 작업 이벤트에 기초하여 실행 중인 문서간의 문서 연관성 정보를 생성 또는 갱신하는 문서 작업 이벤트 분석부 및 메인 작업 문서에 대한 문서 콜렉션 요청을 수신하고, 상기 문서 연관성 정보에 기초하여 상기 메인 작업 문서 및 상기 메인 작업 문서에 대한 문서 콜렉션을 제공하는 문서 콜렉션 제공부를 포함하는 것인, 문서 콜렉션 제공 장치를 제공할 수 있다.According to an aspect of the present invention, there is provided an information processing apparatus including an event collecting unit that receives user input data and determines whether the user input data is a document operation event related to a document operation, A document operation event analysis unit for generating or updating document relevance information between the active document based on the event and a document collection request for the main operation document, and for receiving the document collection request for the main operation document and the main operation document And a document collection providing unit for providing a document collection for the document collection providing unit.

또한, 본 발명의 다른 실시예는 사용자 입력 데이터를 수신하고, 상기 사용자 입력 데이터가 문서 작업과 관계된 문서 작업 이벤트인지 여부를 결정하는 단계, 상기 문서 작업 이벤트에 기초하여 실행 중인 문서간의 문서 연관성 정보를 생성 또는 갱신하는 단계 및 메인 작업 문서에 대한 문서 콜렉션 요청을 수신하고, 상기 문서 연관성 정보에 기초하여 상기 메인 작업 문서 및 상기 메인 작업 문서에 대한 문서 콜렉션을 제공하는 단계를 포함하는 것인, 문서 콜렉션 제공 방법을 제공할 수 있다.Yet another embodiment of the present invention is a method for receiving user input data, the method comprising: receiving user input data; determining whether the user input data is a document operation event related to a document operation; Generating and updating a document, and receiving a document collection request for a main working document, and providing a document collection for the main working document and the main working document based on the document relevance information. Providing method.

또한, 본 발명의 또 다른 실시예는 제 1 문서, 제 2 문서 및 제 3 문서가 실행 중인 문서 작업 환경에서 사용자 입력 데이터를 수신하고, 상기 사용자 입력 데이터가 문서 작업과 관계된 문서 작업 이벤트인지 여부를 결정하는 이벤트 수집부, 상기 문서 작업 이벤트에 기초하여 상기 제 1 문서와 상기 제 2 문서간의 연관성을 나타내는 제 1 연관성 값을 산출하고, 상기 제 1 문서와 상기 제 3 문서간의 연관성을 나타내는 제 2 연관성 값을 산출하고, 상기 제 2 문서와 상기 제 3 문서간의 연관성을 나타내는 제 3 연관성 값을 산출하는 연관성 값 산출부 및 상기 제 1 문서와 상기 제 2 문서간의 제 1 누적 연관성 값에 상기 제 1 연관성 값을 누적하여 상기 제 1 누적 연관성 값을 갱신하고, 상기 제 1 문서와 상기 제 3 문서간의 제 2 누적 연관성 값에 상기 제 2 연관성 값을 누적하여 상기 제 2 누적 연관성 값을 갱신하고, 상기 제 2 문서와 상기 제 3 문서간의 제 3 누적 연관성 값에 상기 제 3 연관성 값을 누적하여 상기 제 3 누적 연관성 값을 갱신하는 연관성 정보 갱신부를 포함하는 것인, 문서 콜렉션 제공 장치를 제공할 수 있다.Yet another embodiment of the present invention is a method for receiving user input data in a document work environment in which a first document, a second document, and a third document are being executed and determining whether the user input data is a document work event related to the document work An event collecting unit for determining an association between the first document and the second document, a first association value indicating a relationship between the first document and the second document based on the document operation event, A relevance value calculation unit operable to calculate a first relevance value between the first document and the second document and to calculate a third relevance value indicating a relationship between the second document and the third document, Accumulates the first cumulative relevance value to update the first cumulative relevance value, and updates the second cumulative relevance value between the first document and the third document, And updating the third cumulative relevance value by accumulating the third cumulative relevance value to a third cumulative relevance value between the second document and the third document to update the third cumulative relevance value And a document collection providing unit.

또한, 본 발명의 또 다른 실시예는 컴퓨팅 장치와 결합되어 문서 콜렉션을 제공하는 시퀀스를 포함하는 매체에 저장된 컴퓨터 프로그램에 있어서, 상기 컴퓨팅 장치에 의해 실행될 때,상기 컴퓨팅 장치가, 제 1 문서, 제 2 문서 및 제 3 문서가 실행 중인 문서 작업 환경에서 사용자 입력 데이터를 수신하고, 상기 사용자 입력 데이터가 문서 작업과 관계된 문서 작업 이벤트인지 여부를 결정하고, 상기 문서 작업 이벤트에 기초하여 상기 제 1 문서와 상기 제 2 문서간의 연관성을 나타내는 제 1 연관성 값을 산출하고, 상기 제 1 문서와 상기 제 3 문서간의 연관성을 나타내는 제 2 연관성 값을 산출하고, 상기 제 2 문서와 상기 제 3 문서간의 연관성을 나타내는 제 3 연관성 값을 산출하고, 상기 제 1 문서와 상기 제 2 문서간의 제 1 누적 연관성 값에 상기 제 1 연관성 값을 누적하여 상기 제 1 누적 연관성 값을 갱신하고, 상기 제 1 문서와 상기 제 3 문서간의 제 2 누적 연관성 값에 상기 제 2 연관성 값을 누적하여 상기 제 2 누적 연관성 값을 갱신하고, 상기 제 2 문서와 상기 제 3 문서간의 제 3 누적 연관성 값에 상기 제 3 연관성 값을 누적하여 상기 제 3 누적 연관성 값을 갱신하는 것인, 매체에 저장된 컴퓨터 프로그램을 제공할 수 있다.Yet another embodiment of the present invention is a computer program stored in a medium including a sequence of providing a collection of documents in association with a computing device, the computer program being executable by the computing device to: 2 < / RTI > document and a third document are running; determining whether the user input data is a document operation event related to a document operation; Calculating a first relevance value indicating a relation between the first document and the second document, calculating a second relevance value indicating a relation between the first document and the third document, calculating a second relevance value indicating a relation between the second document and the third document, Calculating a first relevance value between the first document and the second document, Updating the first cumulative relevance value by accumulating the first relevance value and accumulating the second cumulative relevance value with a second cumulative relevance value between the first document and the third document, And accumulating the third relevance value to a third cumulative relevance value between the second document and the third document to update the third cumulative relevance value.

전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 수행하고 있던 전자 문서 관련 작업을 종료하고, 추후에 기존의 수행하고 있던 전자 문서 관련 작업에 기초하여, 사용자의 개입없이 이전의 복수 전자 문서 작업 환경을 재구성하는 문서 콜렉션 제공 장치, 방법 및 컴퓨터 프로그램을 제공할 수 있다.According to any one of the above-described tasks of the present invention, it is possible to terminate the electronic document-related operation that has been performed, and to perform, based on the existing electronic document- A document collection providing apparatus, a method, and a computer program for reconfiguring the environment can be provided.

또한, 문서 작업 행동 기반으로 전자 문서 콜렉션을 생성하고 제공함으로써, 종래 기술인 유사성 분석을 기반으로는 불가능하였던 유사 콘텐츠를 갖고 있지 않는 문서들을 대상으로도 이전의 복수 전자 문서 작업 환경을 재구성하는 문서 콜렉션 제공 장치, 방법 및 컴퓨터 프로그램을 제공할 수 있다.In addition, by creating and providing an electronic document collection based on a document operation behavior, a document collection for reconstructing a previous multiple electronic document working environment is also provided for documents that have no similar contents that were impossible based on the similarity analysis of the related art Apparatus, method, and computer program product.

사용자의 개입 없이 문서 작업 행동 기반 문서 콜렉션을 생성 및 제공하는 문서 콜렉션 제공 장치, 방법 및 컴퓨터 프로그램을 제공할 수 있다.A document collection providing apparatus, a method, and a computer program for creating and providing a document collection based on a document operation behavior without user intervention can be provided.

도 1은 OS X 운영체제에서 지원하는 Finder를 사용하여 태깅을 수행하는 것을 나타낸 도면이다.
도 2는 본 발명의 일 실시예에 따른 문서 콜렉션 제공 장치의 블록도이다.
도 3은 본 발명의 일 실시예에 따른 문서간의 문서 연관성 정보를 생성 또는 갱신하는 방법을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른 서브 작업 문서를 추출하는 방법을 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른 메인 작업 문서 및 메인 작업 문서에 대한 문서 콜렉션을 제공하는 방법을 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따른 문서 콜렉션 제공 방법을 나타낸 흐름도이다.
1 is a diagram illustrating tagging using a finder supported by an OS X operating system.
2 is a block diagram of a document collection providing apparatus according to an embodiment of the present invention.
3 is a diagram for explaining a method of generating or updating document relevance information between documents according to an embodiment of the present invention.
4 is a diagram for explaining a method of extracting a sub-task document according to an embodiment of the present invention.
5 is a diagram illustrating a method of providing a document collection for a main working document and a main working document according to an embodiment of the present invention.
6 is a flowchart illustrating a method of providing a document collection according to an embodiment of the present invention.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다. Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings, which will be readily apparent to those skilled in the art. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein. In order to clearly illustrate the present invention, parts not related to the description are omitted, and similar parts are denoted by like reference characters throughout the specification.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다. Throughout the specification, when a part is referred to as being "connected" to another part, it includes not only "directly connected" but also "electrically connected" with another part in between . Also, when an element is referred to as "including" an element, it is to be understood that the element may include other elements as well as other elements, And does not preclude the presence or addition of one or more other features, integers, steps, operations, components, parts, or combinations thereof.

본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다.In this specification, the term " part " includes a unit realized by hardware, a unit realized by software, and a unit realized by using both. Further, one unit may be implemented using two or more hardware, or two or more units may be implemented by one hardware.

본 명세서에 있어서 단말 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말 또는 디바이스에서 수행될 수도 있다.In this specification, some of the operations or functions described as being performed by the terminal or the device may be performed in the server connected to the terminal or the device instead. Similarly, some of the operations or functions described as being performed by the server may also be performed on a terminal or device connected to the server.

이하 첨부된 도면을 참고하여 본 발명의 일 실시예를 상세히 설명하기로 한다. Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 2는 본 발명의 일 실시예에 따른 문서 콜렉션 제공 장치의 블록도이다. 도 2를 참조하면, 문서 콜렉션 제공 장치(100)는 이벤트 수집부(200), 문서 작업 이벤트 분석부(210), 문서 콜렉션 제공부(220)를 포함할 수 있다. 또한, 문서 작업 이벤트 분석부(210)는 이벤트 발생 횟수 산출부(230), 가중치 추출부(240), 연관성 값 산출부(250) 및 연관성 갱신부(260)을 포함할 수 있다. 또한, 문서 콜렉션 제공부(220)는 문서 콜렉션 요청 수신부(270), 서브 작업 문서 추출부(280), 문서 콜렉션 출력부(290)를 포함할 수 있다.2 is a block diagram of a document collection providing apparatus according to an embodiment of the present invention. Referring to FIG. 2, the document collection providing apparatus 100 may include an event collecting unit 200, a document operation event analyzing unit 210, and a document collection providing unit 220. The document operation event analysis unit 210 may include an event occurrence frequency calculation unit 230, a weight extraction unit 240, a relevance value calculation unit 250, and a relevancy updating unit 260. The document collection providing unit 220 may include a document collection request receiving unit 270, a sub-working document extracting unit 280, and a document collection outputting unit 290.

이벤트 수집부(200)는 사용자 입력 데이터를 수신하고, 사용자 입력 데이터가 문서 작업과 관계된 문서 작업 이벤트인지 여부를 결정할 수 있다. 이벤트 수집부(200)에서 수행되는 작업은 서비스 응용 프로그램과 같이 지속적으로 운용체제에 상주하여 수행될 수 있고, 혹은 문서 작성 어플리케이션에 포함된 유틸리티 프로그램으로서 어플리케이션이 실행할 경우에 한하여 수행될 수도 있다.The event collecting unit 200 receives the user input data and can determine whether the user input data is a document operation event related to the document operation. The task performed by the event collecting unit 200 may be performed continuously in the operating system, such as a service application program, or may be performed only when the application is executed as a utility program included in the document creating application.

사용자 입력 데이터는 어플리케이션 교체, 창 종료, 창 넓힘, 콘텐츠 복사(윈도우즈 제공 API를 이용하는 등의) 등과 같은 보다 추상화된 이벤트를 의미할 수 있다.User input data may refer to more abstracted events such as application replacement, window termination, window widening, content copying (such as using a Windows-provided API), and the like.

문서 작업 이벤트는 문서간의 콘텐츠 공유 이력, 활성 상태 변경 이력, 동일 디렉토리 저장 이력, 동시 문서 작업 이력 및 문서의 종료 이력을 포함할 수 있다. 여기서, 콘텐츠 공유 이력은 콘텐츠 복사, 잘라내기 및 붙여넣기를 포함할 수 있다. 활성 상태 변경 이력은 문서를 위한 어플리케이션이 활성 창에서 비활성 창으로 또는 비활성 창에서 활성 창으로 변경되는 이력을 포함할 수 있다. The document operation event may include a content sharing history between documents, an active state change history, the same directory storage history, a simultaneous document operation history, and a document end history. Here, the content sharing history may include content copying, cutting, and pasting. The active state change history may include history that the application for the document is changed from the active window to the inactive window or from the inactive window to the active window.

문서 작업 이벤트 분석부(210)는 문서 작업 이벤트에 기초하여 실행 중인 문서간의 문서 연관성 정보를 생성 또는 갱신할 수 있다. 문서 연관성 정보는 상기 실행 중인 문서의 식별자 정보 및 및 상기 실행 중인 문서간의 누적 연관성 값을 포함할 수 있다. 여기서, 식별자 정보는 URI (Uniform Resource Identifier)일 수 있다.The document operation event analysis unit 210 may generate or update document relevance information between the active documents based on the document operation event. The document relevance information may include the identifier information of the executing document and the cumulative relevance value between the executing documents. Here, the identifier information may be a URI (Uniform Resource Identifier).

문서 작업 이벤트 분석부(210)는 이벤트 발생 횟수 산출부(230), 가중치 추출부(240), 연관성 값 산출부(250) 및 연관성 갱신부(260)을 포함할 수 있다. The document operation event analysis unit 210 may include an event occurrence frequency calculation unit 230, a weight extraction unit 240, a relevance value calculation unit 250, and a relevancy updating unit 260.

이벤트 발생 횟수 산출부(230)는 기설정된 시간동안 각 문서 작업 이벤트의 발생 횟수를 산출할 수 있다. 이벤트 발생 횟수 산출부(230)는 기설정된 시간(예를 들면, 1분 또는 5분 등)마다 각 문서 작업 이벤트의 발생 횟수를 산출할 수 있다. 예를 들면, 이벤트 발생 횟수 산출부(230)는 콘텐츠 공유 이벤트, 동시 문서 작업 이벤트, 동일 디렉토리 저장 이벤트, 동시 문서 작업을 위한 문서 간 전환 이벤트 및 단순 동시 실행 이벤트 각각의 발생 횟수를 기설정된 시간 마다 산출할 수 있다. The event occurrence frequency calculation unit 230 may calculate the occurrence frequency of each document operation event for a predetermined time. The event occurrence frequency calculation unit 230 may calculate the occurrence frequency of each document operation event every predetermined time (for example, one minute or five minutes). For example, the event occurrence frequency calculation unit 230 calculates the occurrence frequency of each of the content sharing event, the simultaneous document operation event, the same directory storage event, the inter-document switching event for simultaneous document operation, and the simple concurrent event, Can be calculated.

가중치 추출부(240)는 문서 작업 이벤트에 해당하는 기설정된 가중치를 추출할 수 있다. 예를 들면, 문서간의 연관성에 영향을 미치는 정도에 기초하여 문서 작업 이벤트마다 가중치가 상이할 수 있다. 가중치는 양의 값 또는 음의 값을 가질 수 있다.The weight extracting unit 240 may extract a predetermined weight corresponding to a document job event. For example, the weights may be different for each document operation event based on the degree of influence on the association between documents. The weight may have a positive or negative value.

예를 들면, 콘텐츠 공유 이벤트에 대한 가중치는 0.8일 수 있고, 동시 문서 작업 이벤트는 0.2일 수 있고, 동일 디렉토리 저장 이벤트는 0.1일 수 있고, 동시 문서 작업을 위한 문서 간 전환 이벤트는 0.05일 수 있고, 단순 동시 실행 이벤트는 -0.25일 수 있다.For example, the weight for the content sharing event may be 0.8, the concurrent document activity event may be 0.2, the same directory storage event may be 0.1, the inter-document conversion event for concurrent document work may be 0.05 , And the simple concurrent event may be -0.25.

문서 작업 이벤트마다 가중치를 달리하여 문서간의 실제적인 연관성이 산출될 수 있다. 또한, 적어도 하나의 문서 작업 이벤트의 가중치(예를 들어, 단순 동시 실행 이벤트)가 음의 값을 가짐으로써, 연관성이 없는 문서임에도 불구하고 특정 문서 작업 이벤트(동시 문서 작업 이벤트)에 따라 가중치 값이 증가하는 것을 상쇄시킬 수 있다. The actual relevance between documents can be calculated by varying the weights for each document activity event. In addition, since the weight of at least one document operation event (e. G., A simple concurrent event) has a negative value, it is possible to obtain a weight value according to a specific document operation event Can be offset.

예를 들면, 문서 a, 문서 b 및 문서 c가 실행중인 경우, 문서 a, 문서 b 및 문서 c는 동시 문서 작업 이벤트에 따라 기설정된 시간 마다 가중치 값 0.2가 고려될 수 있다. 하지만, 문서 c는 아무런 작업이 수행되지 않고 있는 경우에, 단순 동시 실행 이벤트에 따라 가중치 값 -0.25가 고려될 수 있다.For example, if document a, document b, and document c are running, document a, document b, and document c may be weighted value 0.2 every predetermined time according to a concurrent document operation event. However, if the document c is not performing any operation, the weight value -0.25 may be considered according to the simple concurrent event.

연관성 값 산출부(250)는 기설정된 시간 마다 각 작업 이벤트의 발생 횟수, 각 작업 이벤트의 가중치에 기초하여 문서간의 연관성 값을 산출할 수 있다.The relevance value calculating unit 250 may calculate relevance values between documents based on the number of occurrences of each task event and the weight of each task event at predetermined time intervals.

예를 들면, 연관성 값 산출부(250)는 각 문서 작업 이벤트의 발생 횟수를 포함하는 문서 작업 행동 이벤트 횟수 벡터; 및 각 문서 작업 이벤트의 가중치를 포함하는 문서 작업 행동 이벤트 가중치 벡터를 내적함으로써 문서간의 연관성 값을 산출할 수 있다.For example, the relevance value calculating unit 250 may include a document operation behavior event count vector including the number of occurrences of each document operation event; And a document operation behavior event weight vector including a weight of each document operation event, thereby calculating a relevance value between documents.

예를 들면, 문서간의 연관성 값은 아래와 같이 표현될 수 있다.For example, the relevance value between documents can be expressed as:

Figure 112016049388744-pat00001
Figure 112016049388744-pat00001

여기서, 문서 작업 행동 이벤트 횟수 벡터

Figure 112016049388744-pat00002
는 문서 i와 문서 j의 각 문서 작업 행동 이벤트(1 내지 n)의 발생 횟수를 나타내는 벡터일 수 있다. Here, the document operation behavior event count vector
Figure 112016049388744-pat00002
May be a vector indicating the number of occurrences of each of the document action behavior events (1 to n) of document i and document j.

문서 작업 행동 이벤트 가중치 벡터

Figure 112016049388744-pat00003
는 각 문서 작업 행동 이벤트(1 내지 n)의 가중치를 나타내는 벡터일 수 있다.Document action behavior event weight vector
Figure 112016049388744-pat00003
May be a vector representing the weight of each document action behavior event (1 to n).

연관성 갱신부(260)는 문서간의 누적 연관성 값에 연관성 값을 누적하여 문서간의 연관성 정보를 기설정된 시간마다 갱신할 수 있다. 누적 연관성 값을 아래와 같이 표현될 수 있다.The relevancy updating unit 260 may update association information between documents by a predetermined time by accumulating association values in a cumulative relevance value between documents. The cumulative relevance value can be expressed as:

Figure 112016049388744-pat00004
Figure 112016049388744-pat00004

Figure 112016049388744-pat00005
Figure 112016049388744-pat00006
Figure 112016049388744-pat00005
Figure 112016049388744-pat00006

이와 관련하여, 잠시 도 3을 참조하여 문서 연관성 정보를 생성 또는 갱신하는 방법을 설명하기로 한다. 도 3은 본 발명의 일 실시예에 따른 문서간의 문서 연관성 정보를 생성 또는 갱신하는 방법을 설명하기 위한 도면이다.In this regard, a method for generating or updating document relevance information will be described with reference to FIG. 3 for a while. 3 is a diagram for explaining a method of generating or updating document relevance information between documents according to an embodiment of the present invention.

도 3을 참조하면, 문서 작업 행동 이벤트는 콘텐츠 공유 이벤트(300), 동시 문서 작업 이벤트(302), 동일 디렉토리 저장 이벤트(304), 동시 문서 작업을 위한 문서 간 전환 이벤트(306) 및 단순 동시 실행 이벤트(308)를 포함할 수 있다, 3, the document action behavior event includes a content sharing event 300, a concurrent document action event 302, an identical directory store event 304, an inter-document switching event 306 for concurrent document operations, Event 308,

여기서, 콘텐츠 공유 이벤트(300)는 문서 i의 콘텐츠를 문서 j와 공유한 횟수와 이와 역의 경우의 횟수 합을 포함할 수 있다. 공유는 콘텐츠 복사, 잘라내기 및 붙여넣기를 포함할 수 있다. 또한, 동시 문서 작업 이벤트(302)는 문서 i가 실행 중 문서 j를 실행하고 기설정된 분(예를 들면 1분) 이상 경과 한 횟수와 이와 역의 경우의 횟수 합을 포함할 수 있다. 또한, 동일 디렉토리 저장 이벤트(304)는 문서 i를 새롭게 저장하거나, 이동하여 문서 j의 디렉토리와 동일한 디렉토리에 위치한 횟수와 이와 역의 경우의 횟수 합을 포함할 수 있다. 또한, 동시 문서 작업을 위한 문서 간 전환 이벤트(306)는 문서 i를 위한 어플리케이션이 활성 창에서 비활성 창으로 변경되며, 이로부터 기설정된 초(예를 들면, 10초) 이내 문서 j를 위한 어플리케이션이 비활성 창에서 활성 창으로 변경되었을 경우의 횟수와 이와 역의 경우의 횟수 합을 포함할 수 있다. 또한, 단순 동시 실행 이벤트(308)는 동시 문서 작업 이벤트(302) 발생 후, 문서 i 혹은 문서 j를 위한 문서 작업 행동(스크롤을 통한 열람, 키보드의 입력을 통한 문서 작성 혹은 수정 등을 포함)이 없이 종료한 횟수를 포함할 수 있다.Here, the content-sharing event 300 may include the number of times of sharing the content of the document i with the document j and the number of times of the reverse. Sharing can include copying, cutting, and pasting content. In addition, the simultaneous document operation event 302 may include the number of times that the document i has elapsed by a predetermined number of minutes (for example, one minute) and the number of times in the reverse case when the document i is executed. In addition, the same directory store event 304 may include the number of times the document i is newly stored or moved and located in the same directory as the directory of the document j, and the number of times in the reverse case. In addition, the inter-document switching event 306 for the simultaneous document operation changes the application for the document i from the active window to the inactive window, and an application for the document j within a predetermined second (for example, 10 seconds) And may include the number of times when the window is changed from the inactive window to the active window and vice versa. Simultaneous concurrent events 308 may also be used to determine whether a document action (for example, scrolling through the document, creating or modifying a document via input of a keyboard, etc.) for document i or document j And the number of times of ending without ending.

콘텐츠 공유 이벤트(300)에 대한 가중치 값(310)은 0.8일 수 있고, 동시 문서 작업 이벤트(302)에 대한 가중치 값(312)는 0.2일 수 있고, 동일 디렉토리 저장 이벤트(304)눈 0.1일 수 있고, 동시 문서 작업을 위한 문서 간 전환 이벤트(306)는 0.05일 수 있고, 단순 동시 실행 이벤트(308)는 -0.25일 수 있다.The weight value 310 for the content sharing event 300 may be 0.8, the weight value 312 for the synchronous document event 302 may be 0.2, and the same directory store event 304 may be the number of days 0.1 , The inter-document switch event 306 for concurrent document work may be 0.05, and the simple concurrent event 308 may be -0.25.

본 발명에서는 문서 작업 이벤트마다 가중치를 달리하여 문서간의 실제적인 연관성이 산출될 수 있다. 또한, 적어도 하나의 문서 작업 이벤트의 가중치(예를 들어, 단순 동시 실행 이벤트(308))가 음의 값을 가짐으로써, 연관성이 없는 문서임에도 불구하고 특정 문서 작업 이벤트(동시 문서 작업 이벤트(302))에 따라 가중치 값이 증가하는 것을 상쇄시킬 수 있다. In the present invention, the actual relevance between documents can be calculated by varying weights for each document operation event. In addition, certain document work events (such as concurrent document event 302) may be generated even though the weight of at least one document work event (e.g., simple concurrent event 308) has a negative value, ), The increase of the weight value can be canceled.

도 3과 같이 각 문서 작업 이벤트마다 문서 작업 행동 이벤트 횟수 벡터, 가중치 벡터 및 가중치 값이 설정되어 있는 경우, 문서 a와 문서 b의 문서 작업 행동 이벤트 횟수 벡터가

Figure 112016049388744-pat00007
와 같이 주어져있다면, 문서 연관성 값은 아래와 같이 표현될 수 있다.As shown in FIG. 3, when the document operation behavior event count vector, the weight vector, and the weight value are set for each document operation event, the document operation behavior event count vector of document a and document b is
Figure 112016049388744-pat00007
, The document relevance value can be expressed as follows.

Figure 112016049388744-pat00008
Figure 112016049388744-pat00008

다시 도 2로 돌아와서, 문서 콜렉션 제공부(220)는 메인 작업 문서에 대한 문서 콜렉션 요청을 수신하고, 문서 연관성 정보에 기초하여 메인 작업 문서 및 메인 작업 문서에 대한 문서 콜렉션을 제공할 수 있다.Returning to FIG. 2, the document collection providing unit 220 may receive a document collection request for the main working document, and may provide a document collection of the main working document and the main working document based on the document relevance information.

문서 콜렉션 제공부(220)는 문서 콜렉션 제공부(220)는 문서 콜렉션 요청 수신부(270), 서브 작업 문서 추출부(280), 문서 콜렉션 출력부(290)를 포함할 수 있다.The document collection providing unit 220 may include a document collection request receiving unit 270, a sub-working document extracting unit 280, and a document collection outputting unit 290.

문서 콜렉션 요청 수신부(270)는 문서 콜렉션 제공부는 메인 작업 문서에 대한 문서 콜렉션 요청을 수신할 수 있다.The document collection request receiving unit 270 may receive the document collection request for the main working document.

서브 작업 문서 추출부(280)는 메인 작업 문서와의 누적 연관성 값이 기설정된 값 이상인 서브 작업 문서를 추출할 수 있다. 이와 관련하여, 도 4를 참조하여, 서브 작업 문서를 추출하는 방법에 대해 설명하기로 한다.The sub-work document extracting unit 280 may extract a sub-work document having a cumulative relevance value with the main work document equal to or greater than a predetermined value. In this regard, a method of extracting a sub-task document will be described with reference to FIG.

도 4를 참조하면, 문서 A와 문서 B간의 누적 연관성 값(401)이 1이고, 문서 A와 문서 C간의 문서 연관성 값(403)이 3이고, 문서 B와 문서 C간의 누적 연관성 값(405)이 5이고, 문서 A와 문서 D간의 누적 연관성 값(407)이 7이고, 문서 B와 문서 E간의 누적 연관성 값(409)이 6이고, 문서 A와 문서 F간의 누적 연관성 값(411)이 5이고, 문서 A와 문서 G간의 누적 연관성 값(413)이 4일 수 있다.4, if the cumulative relevance value 401 between document A and document B is 1, the document relevance value 403 between document A and document C is 3, the cumulative relevance value 405 between document B and document C, Is 5, the cumulative relevance value 407 between document A and document D is 7, the cumulative relevance value 409 between document B and document E is 6, and the cumulative relevance value 411 between document A and document F is 5 , And the cumulative relevance value 413 between the document A and the document G may be four.

이 경우, 서브 작업 문서 추출부(280)는 메인 문서 A와의 누적 연관성 값이 기설정된 값 2 이상인 서브 작업 문서로서, 문서 C, 문서 D, 문서 F, 문서 G를 추출할 수 있다.In this case, the sub-work document extracting unit 280 can extract the document C, the document D, the document F, and the document G as the sub-work documents having the accumulated relevance value with the main document A equal to or greater than a predetermined value 2.

다시 도 2로 돌아와서, 문서 콜렉션 출력부(290)는 메인 작업 문서를 출력하는 제 1 영역, 제 1 영역에 인접하는 영역에 메인 작업 문서의 노드, 서브 작업 문서의 노드, 노드 간의 연결선을 출력하는 제 2 영역을 출력할 수 있다.2, the document collection output unit 290 outputs a first area for outputting the main work document, a node for the main work document, a node for the sub work document, and a connection line between the nodes in an area adjacent to the first area It is possible to output the second area.

이와 관련하여, 도 5를 참조하여, 메인 작업 문서 및 메인 작업 문서에 대한 문서 콜렉션을 제공하는 방법을 설명하기로 한다. 도 5는 본 발명의 일 실시예에 따른 메인 작업 문서 및 메인 작업 문서에 대한 문서 콜렉션을 제공하는 방법을 설명하기 위한 도면이다.In this regard, referring to FIG. 5, a method of providing a document collection for the main working document and the main working document will be described. 5 is a diagram illustrating a method of providing a document collection for a main working document and a main working document according to an embodiment of the present invention.

도 5를 참조하면, 문서 콜렉션 출력부(290)는 메인 작업 문서(530)를 출력하는 제 1 영역(500) 및 제 1 영역에 인접하는 영역에 제 2 영역(510)을 출력할 수 있다. 문서 콜렉션 출력부(290)는 제 2 영역(510)에 메인 작업 문서의 노드(540), 제 1 서브 작업 문서의 노드(550), 제 2 서브 작업 문서의 노드(560), 제 3 서브 작업 문서의 노드(570), 제 4 서브 작업 문서의 노드(580) 및 노드 간의 연결선을 출력할 수 있다.Referring to FIG. 5, the document collection output unit 290 may output a first area 500 for outputting the main working document 530 and a second area 510 to an area adjacent to the first area. The document collection outputting unit 290 outputs the node 540 of the main work document, the node 550 of the first sub-work document, the node 560 of the second sub-work document, A node 570 of the document, a node 580 of the fourth sub-work document, and a connection line between the nodes.

여기서, 서브 작업 문서의 노드의 크기는 메인 작업 문서(530)와의 누적 연관성 값에 따라 상이할 수 있다. 예를 들면, 제 3 서브 작업 문서의 노드(570), 제 2 서브 작업 문서의 노드(560), 제 4 서브 작업 문서의 노드(580), 제 1 서브 작업 문서의 노드(550) 순으로 메인 작업 문서(530)와의 연관성 값이 클 수 있다.Here, the size of the node of the sub-task document may differ depending on the cumulative relevance value with the main task document 530. [ For example, the node 570 of the third sub-work document, the node 560 of the second sub-work document, the node 580 of the fourth sub-work document, and the node 550 of the first sub- The relevance value to the working document 530 may be large.

또한, 메인 작업 문서의 노드(540)와 서브 작업 문서의 노드 간의 연결선의 길이는 메인 작업 문서(530)와 해당 서브 작업 문서와 동시에 작업이 수행된 누적 시간에 비례할 수 있다. 예를 들면, 제 1 서브 작업 문서의 노드(550), 제 2 서브 작업 문서의 노드(560), 제 3 서브 작업 문서의 노드(570), 제 4 서브 작업 문서의 노드(580) 순으로 메인 작업 문서(530)와 동시에 작업이 수행된 누적 시간이 길 수 있다.In addition, the length of the connection line between the node 540 of the main work document and the node of the sub work document may be proportional to the cumulative time at which the work is performed simultaneously with the main work document 530 and the corresponding sub work document. For example, the node 550 of the first sub-work document, the node 560 of the second sub-work document, the node 570 of the third sub-work document, and the node 580 of the fourth sub- The cumulative time at which the job is performed simultaneously with the working document 530 may be long.

문서 콜렉션 출력부(290)는 서브 작업 문서의 노드가 선택된 경우, 선택된 서브 작업 문서의 식별자 정보에 기초하여 선택된 서브 작업 문서를 제 1 영역(500)에 출력할 수 있다.The document collection output unit 290 may output the selected sub-task document to the first area 500 based on the identifier information of the selected sub-task document when the node of the sub-task document is selected.

상술한 실시예는 본 발명의 일 실시예에 불과할 뿐, 다양한 실시예가 존재할 수 있다. 예를 들면, 문서 콜렉션 출력부(290)는 제 1 영역(500)에 메인 작업 문서(530)와 추출된 서브 작업 문서를 모두 출력할 수도 있다. 예를 들면, 문서 콜렉션 출력부(290)는 메인 작업 문서(530)와의 누적 연관성 값에 따라 제 1 영역(500)에 출력되는 서브 작업 문서의 크기 또는 배치 순서를 결정할 수 있다. The above-described embodiments are only examples of the present invention, and various embodiments may exist. For example, the document collection output unit 290 may output both the main work document 530 and the extracted sub-work document in the first area 500. For example, the document collection output unit 290 can determine the size or arrangement order of the sub-task documents output to the first area 500 according to the cumulative relevance value with the main work document 530.

예를 들면, 메인 작업 문서(530)와 메인 작업 문서(530)와 연관도 값이 가장 큰 제 3 서브 작업 문서의 노드(570)를 제 1 영역(500)의 좌측에 동일한 크기로 배치하고, 제 2 서브 작업 문서의 노드(560) 및 제 4 서브 작업 문서의 노드(580)를 제 1 영역(500)의 우측에 동일한 크기로 배치하고, 메인 작업 문서(530)와 연관도 값이 가장 작은 제 1 서브 작업 문서의 노드(550)는 비활성 상태로 메인 작업 문서(530) 및 복수의 서브 작업 문서의 후방에 배치할 수 있다.For example, the nodes 570 of the third sub-work document having the largest association value with the main work document 530 and the main work document 530 are arranged at the same size on the left side of the first area 500, The node 560 of the second sub-work document and the node 580 of the fourth sub-work document are arranged at the same size on the right side of the first area 500 and the node 560 of the fourth sub- The node 550 of the first sub-work document may be placed behind the main work document 530 and the plurality of sub-work documents in an inactive state.

도 2를 통해 설명된 문서 콜렉션 제공 장치(100)에서 수행되는 일련의 기능 및 컴퓨터 프로그램은 별도의 서비스 응용 프로그램을 통해 제공될 수 있다. 이와 달리, 문서 콜렉션 제공 장치(100)에서 수행되는 일련의 기능 및 컴퓨터 프로그램은 문서 작성 어플리케이션에서 유틸리티 프로그램으로서 제공될 수도 있다.A series of functions and computer programs performed in the document collection providing apparatus 100 described with reference to FIG. 2 may be provided through a separate service application program. Alternatively, the series of functions and the computer program executed in the document collection providing apparatus 100 may be provided as a utility program in a document creation application.

도 6은 본 발명의 일 실시예에 따른 문서 콜렉션 제공 방법을 나타낸 흐름도이다. 도 6에 도시된 일 실시예에 따른 문서 콜렉션 제공 방법은 도 2에 도시된 문서 콜렉션 제공 장치에서 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하 생략된 내용이라고 하더라도 도 2에 도시된 일 실시예에 따라 수행되는 문서 콜렉션 제공 방법에도 적용된다.6 is a flowchart illustrating a method of providing a document collection according to an embodiment of the present invention. The document collection providing method according to the embodiment shown in FIG. 6 includes steps that are processed in a time-series manner in the document collection providing apparatus shown in FIG. Therefore, even the contents omitted below are applied to the document collection providing method performed according to the embodiment shown in Fig.

도 6을 참조하면, 단계 S600에서, 문서 콜렉션 제공 장치는 사용자 입력 데이터를 수신하고, 사용자 입력 데이터가 문서 작업과 관계된 문서 작업 이벤트인지 여부를 결정할 수 있다.Referring to Fig. 6, in step S600, the document collection providing apparatus receives user input data and can determine whether the user input data is a document operation event related to the document operation.

단계 S610에서, 문서 콜렉션 제공 장치는 문서 작업 이벤트에 기초하여 실행 중인 문서간의 문서 연관성 정보를 생성 또는 갱신할 수 있다.In step S610, the document collection providing apparatus can generate or update the document relevance information between the executing documents based on the document operation event.

단계 S620에서, 문서 콜렉션 제공 장치는 메인 작업 문서에 대한 문서 콜렉션 요청을 수신하고, 문서 연관성 정보에 기초하여 메인 작업 문서 및 메인 작업 문서에 대한 문서 콜렉션을 제공할 수 있다.In step S620, the document collection providing apparatus receives a document collection request for the main working document, and may provide a document collection of the main working document and the main working document based on the document relevance information.

도 6을 통해 설명된 문서 콜렉션 제공 방법(도 2에 도시된 문서 콜렉션 제공 장치에서 시계열적으로 처리되는 단계들을 포함)은 매체에 저장된 컴퓨터 프로그램의 형태로 구현되거나, 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. The document collection providing method described in FIG. 6 (including the steps of the document collection providing apparatus shown in FIG. 2, which is processed in a time-series manner) may be implemented in the form of a computer program stored in a medium, But may also be embodied in the form of a recording medium including instructions executable by the same computer. Computer readable media can be any available media that can be accessed by a computer and includes both volatile and nonvolatile media, removable and non-removable media. The computer-readable medium may also include computer storage media. Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다. It will be understood by those skilled in the art that the foregoing description of the present invention is for illustrative purposes only and that those of ordinary skill in the art can readily understand that various changes and modifications may be made without departing from the spirit or essential characteristics of the present invention. will be. It is therefore to be understood that the above-described embodiments are illustrative in all aspects and not restrictive. For example, each component described as a single entity may be distributed and implemented, and components described as being distributed may also be implemented in a combined form.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.The scope of the present invention is defined by the appended claims rather than the detailed description and all changes or modifications derived from the meaning and scope of the claims and their equivalents are to be construed as being included within the scope of the present invention do.

100: 문서 콜렉션 제공 장치100: Document collection provider

Claims (15)

문서 콜렉션 제공 장치에 있어서,
사용자 입력 데이터를 수신하고, 상기 사용자 입력 데이터가 문서 작업과 관계된 문서 작업 이벤트인지 여부를 결정하는 이벤트 수집부;
상기 문서 작업 이벤트에 기초하여 실행 중인 문서간의 문서 연관성 정보를 생성 또는 갱신하는 문서 작업 이벤트 분석부; 및
메인 작업 문서에 대한 문서 콜렉션 요청을 수신하고, 상기 문서 연관성 정보에 기초하여 상기 메인 작업 문서 및 상기 메인 작업 문서에 대한 문서 콜렉션을 제공하는 문서 콜렉션 제공부
를 포함하는 것인, 문서 콜렉션 제공 장치.
A document collection providing apparatus comprising:
An event collecting unit receiving user input data and determining whether the user input data is a document operation event related to a document operation;
A document operation event analyzer for generating or updating document relevance information between the documents being executed based on the document operation event; And
Receiving a document collection request for a main working document and providing a document collection for the main working document and the main working document based on the document relevance information;
The document collection providing apparatus comprising:
제 1 항에 있어서,
상기 실행 중인 문서는 제 1 문서 및 제 2 문서를 포함하고,
상기 문서 작업 이벤트는 상기 제 1 문서와 상기 제 2 문서간의 콘텐츠 공유 이력, 활성 상태 변경 이력, 동일 디렉토리 저장 이력, 동시 문서 작업 이력, 상기 제 1 문서의 종료 이력 및 상기 제 2 문서의 종료 이력을 포함하는 것인, 문서 콜렉션 제공 장치.
The method according to claim 1,
Wherein the running document comprises a first document and a second document,
Wherein the document operation event includes a content sharing history between the first document and the second document, an active state change history, the same directory storage history, a simultaneous document operation history, an ending history of the first document and an ending history of the second document The document collection providing device.
제 1 항에 있어서,
상기 문서 연관성 정보는 상기 실행 중인 문서의 식별자 정보 및 및 상기 실행 중인 문서간의 누적 연관성 값을 포함하는 것인, 문서 콜렉션 제공 장치.
The method according to claim 1,
Wherein the document relevance information comprises identifier information of the executing document and a cumulative relevance value between the executing documents.
제 3 항에 있어서,
상기 문서 작업 이벤트 분석부는,
상기 문서 작업 이벤트에 해당하는 기설정된 가중치를 추출하는 가중치 추출부; 및
상기 문서 작업 이벤트 및 상기 추출된 가중치에 기초하여 상기 문서 연관성 정보를 산출하는 연관성 값 산출부
를 포함하는 것인, 문서 콜렉션 제공 장치.
The method of claim 3,
The document operation event analyzing unit analyzes,
A weight extraction unit for extracting a predetermined weight corresponding to the document operation event; And
A document relevance information calculation unit for calculating the document relevance information based on the document operation event and the extracted weight,
The document collection providing apparatus comprising:
제 4 항에 있어서,
상기 문서 작업 이벤트는 제 1 문서 작업 이벤트 및 제 2 문서 작업 이벤트를 포함하고,
상기 실행 중인 문서는 제 1 문서 및 제 2 문서를 포함하고,
상기 문서 작업 이벤트 분석부는,
기설정된 시간동안 상기 제 1 문서 작업 이벤트의 발생 횟수 및 상기 제 2 문서 작업 이벤트의 발생 횟수를 산출하는 이벤트 발생 횟수 산출부
를 더 포함하고,
상기 가중치 추출부는 상기 제 1 문서 작업 이벤트에 대한 제 1 가중치 및 상기 제 2 문서 작업 이벤트에 대한 제 2 가중치를 추출하는 것인, 문서 콜렉션 제공 장치.
5. The method of claim 4,
Wherein the document action event includes a first document action event and a second document action event,
Wherein the running document comprises a first document and a second document,
The document operation event analyzing unit analyzes,
An event occurrence count calculation unit for calculating the occurrence count of the first document operation event and the occurrence count of the second document operation event during a predetermined time,
Further comprising:
Wherein the weight extraction unit extracts a first weight for the first document job event and a second weight for the second document job event.
제 5 항에 있어서,
상기 연관성 값 산출부는,
상기 제 1 문서 작업 이벤트의 발생 횟수 및 상기 제 2 문서 작업 이벤트의 발생 횟수를 포함하는 문서 작업 행동 이벤트 횟수 벡터; 및 상기 제 1 가중치 및 상기 제 2 가중치를 포함하는 문서 작업 행동 이벤트 가중치 벡터를 내적함으로써 상기 제 1 문서와 상기 제 2 문서간의 연관성 값을 산출하는 것인, 문서 콜렉션 제공 장치.
6. The method of claim 5,
The association value calculation unit calculates,
A document operation behavior event count vector including the number of occurrences of the first document operation event and the occurrence count of the second document operation event; And calculating a relevance value between the first document and the second document by discarding a document action behavior event weight vector including the first weight and the second weight.
제 6 항에 있어서,
상기 문서 작업 이벤트 분석부는,
상기 제 1 문서와 상기 제 2 문서간의 누적 연관성 값에 상기 연관성 값을 누적하여 상기 상기 제 1 문서와 상기 제 2 문서간의 연관성 정보를 상기 기설정된 시간마다 갱신하는 연관성 정보 갱신부
를 더 포함하는 것인, 문서 콜렉션 제공 장치.
The method according to claim 6,
The document operation event analyzing unit analyzes,
A relevance information updating unit for accumulating the relevance value in a cumulative relevance value between the first document and the second document to update association information between the first document and the second document at the predetermined time,
The document collection providing apparatus further comprising:
제 5 항 내지 제 6 항 중 어느 하나에 있어서,
상기 제 1 가중치 및 상기 제 2 가중치 중 적어도 하나는 음의 값을 가지는 것인, 문서 콜렉션 제공 장치.
7. The method according to any one of claims 5 to 6,
Wherein at least one of the first weight and the second weight has a negative value.
제 3 항에 있어서,
상기 문서 콜렉션 제공부는 메인 작업 문서에 대한 문서 콜렉션 요청을 수신하는 문서 콜렉션 요청 수신부; 및
상기 메인 작업 문서와의 누적 연관성 값이 기설정된 값 이상인 서브 작업 문서를 추출하는 서브 작업 문서 추출부
를 포함하는 것인, 문서 콜렉션 제공 장치.
The method of claim 3,
The document collection providing unit may include a document collection request receiving unit that receives a document collection request for the main working document; And
A sub-task document extracting unit for extracting a sub-task document having a cumulative relevance value with the main task document equal to or greater than a predetermined value,
The document collection providing apparatus comprising:
삭제delete 삭제delete 삭제delete 문서 콜렉션 제공 방법에 있어서,
사용자 입력 데이터를 수신하고, 상기 사용자 입력 데이터가 문서 작업과 관계된 문서 작업 이벤트인지 여부를 결정하는 단계;
상기 문서 작업 이벤트에 기초하여 실행 중인 문서간의 문서 연관성 정보를 생성 또는 갱신하는 단계; 및
메인 작업 문서에 대한 문서 콜렉션 요청을 수신하고, 상기 문서 연관성 정보에 기초하여 상기 메인 작업 문서 및 상기 메인 작업 문서에 대한 문서 콜렉션을 제공하는 단계
를 포함하는 것인, 문서 콜렉션 제공 방법.
A method of providing a document collection,
Receiving user input data and determining whether the user input data is a document operation event related to a document operation;
Generating or updating document associativity information between the executing document based on the document operation event; And
Receiving a document collection request for a main working document and providing a document collection for the main working document and the main working document based on the document relevance information
The document collection providing method comprising:
문서 콜렉션 제공 장치에 있어서,
제 1 문서, 제 2 문서 및 제 3 문서가 실행 중인 문서 작업 환경에서 사용자 입력 데이터를 수신하고, 상기 사용자 입력 데이터가 문서 작업과 관계된 문서 작업 이벤트인지 여부를 결정하는 이벤트 수집부;
상기 문서 작업 이벤트에 기초하여 상기 제 1 문서와 상기 제 2 문서간의 연관성을 나타내는 제 1 연관성 값을 산출하고, 상기 제 1 문서와 상기 제 3 문서간의 연관성을 나타내는 제 2 연관성 값을 산출하고, 상기 제 2 문서와 상기 제 3 문서간의 연관성을 나타내는 제 3 연관성 값을 산출하는 연관성 값 산출부; 및
상기 제 1 문서와 상기 제 2 문서간의 제 1 누적 연관성 값에 상기 제 1 연관성 값을 누적하여 상기 제 1 누적 연관성 값을 갱신하고, 상기 제 1 문서와 상기 제 3 문서간의 제 2 누적 연관성 값에 상기 제 2 연관성 값을 누적하여 상기 제 2 누적 연관성 값을 갱신하고, 상기 제 2 문서와 상기 제 3 문서간의 제 3 누적 연관성 값에 상기 제 3 연관성 값을 누적하여 상기 제 3 누적 연관성 값을 갱신하는 연관성 정보 갱신부
를 포함하는 것인, 문서 콜렉션 제공 장치.
A document collection providing apparatus comprising:
An event collector for receiving user input data in a document work environment in which the first document, the second document, and the third document are being executed, and determining whether the user input data is a document operation event related to the document operation;
Calculating a first relevance value indicating a relation between the first document and the second document based on the document operation event, calculating a second association value indicating a relation between the first document and the third document, A relevance value calculation unit for calculating a third relevance value indicating a relation between the second document and the third document; And
Updating the first cumulative relevance value by accumulating the first relevance value to a first cumulative relevance value between the first document and the second document and updating a second cumulative relevance value between the first document and the second document Accumulating the second relevance value to update the second cumulative relevance value, accumulating the third relevance value to a third cumulative relevance value between the second document and the third document, and updating the third cumulative relevance value Lt; RTI ID = 0.0 >
The document collection providing apparatus comprising:
문서 콜렉션을 제공하는 방법을 컴퓨팅 장치에서 실행시키기 위한 매체에 저장된 컴퓨터 프로그램에 있어서,
상기 컴퓨팅 장치에 의해 실행될 때,
상기 컴퓨팅 장치가,
제 1 문서, 제 2 문서 및 제 3 문서가 실행 중인 문서 작업 환경에서 사용자 입력 데이터를 수신하고, 상기 사용자 입력 데이터가 문서 작업과 관계된 문서 작업 이벤트인지 여부를 결정하고,
상기 문서 작업 이벤트에 기초하여 상기 제 1 문서와 상기 제 2 문서간의 연관성을 나타내는 제 1 연관성 값을 산출하고, 상기 제 1 문서와 상기 제 3 문서간의 연관성을 나타내는 제 2 연관성 값을 산출하고, 상기 제 2 문서와 상기 제 3 문서간의 연관성을 나타내는 제 3 연관성 값을 산출하고,
상기 제 1 문서와 상기 제 2 문서간의 제 1 누적 연관성 값에 상기 제 1 연관성 값을 누적하여 상기 제 1 누적 연관성 값을 갱신하고, 상기 제 1 문서와 상기 제 3 문서간의 제 2 누적 연관성 값에 상기 제 2 연관성 값을 누적하여 상기 제 2 누적 연관성 값을 갱신하고, 상기 제 2 문서와 상기 제 3 문서간의 제 3 누적 연관성 값에 상기 제 3 연관성 값을 누적하여 상기 제 3 누적 연관성 값을 갱신하는 것인, 매체에 저장된 컴퓨터 프로그램.
A computer program stored in a medium for executing a method of providing a collection of documents on a computing device,
When executed by the computing device,
The computing device comprising:
Receiving user input data in a document work environment in which a first document, a second document, and a third document are running, determining whether the user input data is a document work event related to the document work,
Calculating a first relevance value indicating a relation between the first document and the second document based on the document operation event, calculating a second association value indicating a relation between the first document and the third document, Calculating a third relevance value indicating a relation between the second document and the third document,
Updating the first cumulative relevance value by accumulating the first relevance value to a first cumulative relevance value between the first document and the second document and updating a second cumulative relevance value between the first document and the second document Accumulating the second relevance value to update the second cumulative relevance value, accumulating the third relevance value to a third cumulative relevance value between the second document and the third document, and updating the third cumulative relevance value A computer program stored on a medium.
KR1020160062968A 2016-05-23 2016-05-23 Document collection apparatus, method and computer program KR101796972B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160062968A KR101796972B1 (en) 2016-05-23 2016-05-23 Document collection apparatus, method and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160062968A KR101796972B1 (en) 2016-05-23 2016-05-23 Document collection apparatus, method and computer program

Publications (1)

Publication Number Publication Date
KR101796972B1 true KR101796972B1 (en) 2017-11-13

Family

ID=60385988

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160062968A KR101796972B1 (en) 2016-05-23 2016-05-23 Document collection apparatus, method and computer program

Country Status (1)

Country Link
KR (1) KR101796972B1 (en)

Similar Documents

Publication Publication Date Title
Diouf et al. Web scraping: state-of-the-art and areas of application
CN113220724B (en) Method, system and computer readable storage medium for processing a data stream
US8413044B2 (en) Method and system of retrieving Ajax web page content
US20160224600A1 (en) Systems And Methods For Managing Allocation Of Machine Data Storage
CN103530292B (en) Webpage display process and device
CN111143286B (en) Cloud platform log management method and system
US10614087B2 (en) Data analytics on distributed databases
CN108520007B (en) Web page information extracting method, storage medium and computer equipment
CN113268403B (en) Time series analysis and prediction method, device, equipment and storage medium
CN110546633A (en) Named entity based category tag addition for documents
US8781876B2 (en) Computer product, charge calculating apparatus, and charge calculating method
CN107704620B (en) Archive management method, device, equipment and storage medium
CN105117489B (en) Database management method and device and electronic equipment
JP4750628B2 (en) Information ranking method and apparatus, program, and computer-readable recording medium
Yu et al. Web content information extraction based on DOM tree and statistical information
JP2008158589A (en) Updated information notification device, and updated information notification program
CN113158118A (en) Page buried point data acquisition method, device and system
KR101796972B1 (en) Document collection apparatus, method and computer program
Jin Research on data retrieval and analysis system based on Baidu reptile technology in big data era
CN110737691B (en) Method and apparatus for processing access behavior data
JP6668271B2 (en) Business specification analysis support apparatus, business specification analysis support method, and program
CN113220530B (en) Data quality monitoring method and platform
US11593451B2 (en) System and method for comparing zones for different versions of a website based on performance metrics
CN110287394B (en) Website resource crawling method and device, computer equipment and storage medium
Schenkel Integrating and Exploiting Public Metadata Sources in a Bibliographic Information System.

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant