KR20220145319A - 문서 주석화 장치 및 방법 - Google Patents

문서 주석화 장치 및 방법 Download PDF

Info

Publication number
KR20220145319A
KR20220145319A KR1020220134896A KR20220134896A KR20220145319A KR 20220145319 A KR20220145319 A KR 20220145319A KR 1020220134896 A KR1020220134896 A KR 1020220134896A KR 20220134896 A KR20220134896 A KR 20220134896A KR 20220145319 A KR20220145319 A KR 20220145319A
Authority
KR
South Korea
Prior art keywords
document
text
reference sign
element text
annotating
Prior art date
Application number
KR1020220134896A
Other languages
English (en)
Inventor
원동식
김현민
김성칠
김상규
이성인
Original Assignee
주식회사 워트인텔리전스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 워트인텔리전스 filed Critical 주식회사 워트인텔리전스
Priority to KR1020220134896A priority Critical patent/KR20220145319A/ko
Publication of KR20220145319A publication Critical patent/KR20220145319A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/0486Drag-and-drop
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Document Processing Apparatus (AREA)

Abstract

소정 문서 파일의 제 1 범위에서 텍스트를 인식하는 단계; 인식된 텍스트 중 레퍼런스 부호 및 그에 대응하는 엘리먼트 텍스트를 추출하는 단계; 추출된 엘리먼트 텍스트와 레퍼런스 부호를 매핑한 매핑 테이블을 구성하는 단계; 매핑 테이블에 포함된 엘리먼트 텍스트를 소정 문서 파일의 제 2 범위 내에 배치하고, 매핑 테이블에 포함된 레퍼런스 부호를 소정 문서 파일의 제 3 범위 내에 배치하는 단계; 매핑 테이블을 이용하여, 제 3 범위에 배치된 레퍼런스 부호와 제 2 범위 내에 배치된 엘리먼트 텍스트 사이의 대응 관계를 결정하는 단계; 및 제 3 범위 내의 일정 영역과 제 2 범위 내의 일정 영역을 표시하면서, 서로 간에 대응하는 레퍼런스 부호와 엘리먼트 텍스트를 연결하는 라인(line)을 표시하는 단계를 포함하는 것을 특징으로 하는 본 발명의 일 실시예에 따른 문서 주석화 방법이 개시된다.

Description

문서 주석화 장치 및 방법{APPARATUS AND METHOD FOR ANNOTATING DOCUMENT}
본 발명은 문서의 주석화 장치 및 방법에 관한 것이다. 보다 구체적으로, 본 발명은 특허 문서 등의 문서를 주석화하는 장치 및 방법에 관한 것이다.
공중에 공개되는 특허 문서는 일정한 포맷으로 구성된다. 예를 들어, 특허 문서는 '발명의 배경', '발명의 구체적인 설명'(또는 발명의 상세한 설명 또는 발명을 실시하기 위한 구체적인 내용), '특허청구범위' 및 '도면'으로 구성된다. '발명의 구체적인 설명'은 '도면'을 참조하여 발명의 내용을 설명하는 부분으로서, '도면'에 도시된 각 엘리먼트들을 지칭하는 레퍼런스 부호를 포함한다.
도 1a는 일반적인 특허 문서에서 '발명의 구체적인 설명' 부분(10)을 도시하는 도면이고, 도 1b는 일반적인 특허 문서에서 '도면'(20)을 도시하는 도면으로서, 도 1a에 도시된 바와 같이, '발명의 구체적인 설명' 부분(10)은 해당하는 발명을 설명하기 위해 각 엘리먼트의 명칭(11)과 해당 명칭(11)에 인접하여 배치된 레퍼런스 부호(12)를 포함한다. 또한, 도 1b에 도시된 바와 같이, '도면'(20)에는 '발명의 구체적인 설명' 부분(10)에 포함된 엘리먼트 명칭(11)의 구체적인 형태와 해당 형태를 지칭하는 레퍼런스 부호(21)를 포함한다.
특허 문서의 내용을 파악하고자 하는 사용자는 '발명의 구체적인 설명'(10)과 '도면'(20)을 함께 보면서, 특정 엘리먼트 명칭(11)이 어떠한 형태인지를 레퍼런스 부호(12)를 참조하여 '도면'(20)으로부터 판단한다.
그러나, 일반적인 특허 문서에서 '도면'(20)에는 레퍼런스 부호(21)만이 포함되어 있어 '도면'(20)만으로 발명의 파악이 어려우므로, 사용자는 '도면'(20)의 레퍼런스 부호(21)가 가리키는 엘리먼트 명칭(11)이 무엇인지를 '발명의 구체적 설명'(10)에서 파악하여 '도면'(20)의 레퍼런스 부호(21)에 주석화하는 작업 등을 수행한다.
그러나, 위와 같은 수동적인 주석화 작업은 사용자에게 큰 부담이 되며, 빠르게 특허 문서를 파악하는데 장애가 된다.
본 발명의 일 실시예에 따른 문서 주석화 장치 및 방법은 문서의 주석화 작업을 간편하게 수행할 수 있게 하는 것을 목적으로 한다.
또한, 본 발명의 일 실시예에 따른 문서 주석화 장치 및 방법은 사용자로 하여금 문서의 내용을 보다 빠르게 파악할 수 있게 하는 것을 목적으로 한다.
또한, 본 발명의 일 실시예에 따른 문서 주석화 장치 및 방법은 다양한 방식의 문서 편집 기능을 제공함으로써, 사용자로 하여금 문서를 다양한 형태로 활용할 수 있게 하는 것을 목적으로 한다.
본 발명의 일 실시예에 따른 문서의 주석화 방법은,
소정 문서 파일의 제 1 범위에서 텍스트를 인식하는 단계; 상기 인식된 텍스트 중 레퍼런스 부호 및 그에 대응하는 엘리먼트 텍스트를 추출하는 단계; 상기 추출된 엘리먼트 텍스트와 레퍼런스 부호를 매핑한 매핑 테이블을 구성하는 단계; 상기 매핑 테이블에 포함된 엘리먼트 텍스트를 상기 소정 문서 파일의 제 2 범위 내에 배치하고, 상기 매핑 테이블에 포함된 레퍼런스 부호를 상기 소정 문서 파일의 제 3 범위 내에 배치하는 단계; 상기 매핑 테이블을 이용하여, 상기 제 3 범위에 배치된 레퍼런스 부호와 상기 제 2 범위 내에 배치된 엘리먼트 텍스트 사이의 대응 관계를 결정하는 단계; 및 상기 제 3 범위 내의 일정 영역과 상기 제 2 범위 내의 일정 영역을 표시하면서, 서로 간에 대응하는 레퍼런스 부호와 엘리먼트 텍스트를 연결하는 라인(line)을 표시하는 단계를 포함할 수 있다.
상기 소정 문서 파일은, 특허 문서 파일을 포함하고, 상기 제 3 범위 내의 일정 영역은, 소정 특허청구범위를 포함하고, 상기 제 2 범위 내의 일정 영역은, 소정 도면을 포함할 수 있다.
상기 문서의 주석화 방법은, 상기 소정 특허청구범위에는 배치되었지만, 상기 소정 도면에는 그에 대응하는 엘리먼트 텍스트가 존재하지 않는 레퍼런스 부호가 존재하는 경우, 해당 레퍼런스 부호에 대응하는 엘리먼트 텍스트가 배치된 다른 도면 또는 다른 도면의 식별 정보를 표시하는 단계를 더 포함할 수 있다.
상기 문서의 주석화 방법은, 상기 소정 도면에는 배치되었지만, 상기 소정 특허청구범위에는 그에 대응하는 레퍼런스 번호가 존재하지 않는 엘리먼트 텍스트가 존재하는 경우, 해당 엘리먼트 텍스트에 대응하는 레퍼런스 번호가 배치된 다른 특허청구범위 또는 다른 특허청구범위의 식별 정보를 표시하는 단계를 더 포함할 수 있다.
상기 문서의 주석화 방법은, 사용자로부터 상기 소정 특허청구범위를 선택받는 단계; 및 상기 특허 문서 파일의 도면 부분에 포함된 도면들 중 상기 선택받은 소정 특허청구범위에 배치된 레퍼런스 부호에 대응하는 엘리먼트 텍스트가 가장 많이 배치된 도면을 상기 소정 도면으로 선택하는 단계를 더 포함할 수 있다.
상기 문서의 주석화 방법은, 상기 선택받은 소정 특허청구범위에 배치된 레퍼런스 부호에 대응하는 엘리먼트 텍스트가 가장 많이 배치된 도면이 복수 개인 경우, 상기 선택받은 소정 특허청구범위에 배치된 레퍼런스 부호의 개수와 가장 근접한 개수로 상기 엘리먼트 텍스트가 배치된 도면을 상기 소정 도면으로 선택하는 단계를 포함할 수 있다.
상기 문서의 주석화 방법은, 사용자로부터 상기 소정 도면을 선택받는 단계; 및 상기 특허 문서 파일의 청구범위 부분에 포함된 특허청구범위들 중 상기 선택받은 소정 도면에 배치된 엘리먼트 텍스트에 대응하는 레퍼런스 번호가 가장 많이 배치된 특허청구범위를 상기 소정 특허청구범위로 선택하는 단계를 더 포함할 수 있다.
상기 문서의 주석화 방법은, 상기 선택받은 소정 도면에 배치된 엘리먼트 텍스트에 대응하는 레퍼런스 번호가 가장 많이 배치된 특허청구범위가 복수 개인 경우, 상기 선택받은 소정 도면에 배치된 엘리먼트 텍스트의 개수와 가장 근접한 개수로 상기 레퍼런스 부호가 배치된 특허청구범위를 상기 소정 특허청구범위로 선택하는 단계를 포함할 수 있다.
상기 제 3 범위 내의 일정 영역과 상기 제 2 범위 내의 일정 영역을 표시하는 단계는, 상기 제 3 범위 내의 일정 영역과 상기 제 2 범위 내의 일정 영역을 좌우 배치하여 표시하거나, 상기 제 3 범위 내의 일정 영역과 상기 제 2 범위 내의 일정 영역을 상하 배치하여 표시하는 단계를 포함할 수 있다.
상기 문서의 주석화 방법은, 상기 라인이 표시된 후, 사용자의 선택에 따라 상기 라인의 시작점 및 종료점 중 적어도 하나의 위치를 변경하는 단계를 더 포함할 수 있다.
상기 문서의 주석화 방법은, 상기 라인이 표시된 후, 상기 제 2 범위 내에 배치된 엘리먼트 텍스트 및 상기 제 3 범위에 배치된 레퍼런스 부호 중 적어도 하나를 삭제하는 단계를 더 포함할 수 있다.
본 발명의 다른 실시예에 따른 문서 주석화 방법은,
소정 문서 파일의 제 1 범위에서 텍스트를 인식하는 단계; 상기 인식된 텍스트 중 레퍼런스 부호 및 그에 대응하는 엘리먼트 텍스트를 추출하는 단계; 상기 추출된 엘리먼트 텍스트와 레퍼런스 부호를 매핑한 매핑 테이블을 구성하는 단계; 상기 매핑 테이블에 포함된 엘리먼트 텍스트를 상기 소정 문서 파일의 제 2 범위 내에 배치하는 단계; 상기 소정 문서 파일의 제 3 범위에서 텍스트를 인식하여 상기 매핑 테이블에 포함된 엘리먼트 텍스트에 대응하는 엘리먼트 텍스트를 추출하는 단계; 상기 제 3 범위 내의 일정 영역과 상기 제 2 범위 내의 일정 영역을 표시하면서, 서로 간에 대응하는 엘리먼트 텍스트를 연결하는 라인(line)을 표시하는 단계를 포함할 수 있다.
본 발명의 다른 실시예에 따른 문서 주석화 장치는,
소정 문서 파일의 제 1 범위에서 텍스트를 인식하고, 상기 인식된 텍스트 중 레퍼런스 부호 및 그에 대응하는 엘리먼트 텍스트를 추출하는 문서 인식부; 상기 추출된 엘리먼트 텍스트와 레퍼런스 부호를 매핑한 매핑 테이블을 구성하는 테이블 구성부; 및 상기 매핑 테이블에 포함된 엘리먼트 텍스트를 상기 소정 문서 파일의 제 2 범위 내에 배치하고, 상기 매핑 테이블에 포함된 레퍼런스 부호를 상기 소정 문서 파일의 제 3 범위 내에 배치하는 문서 편집부를 포함하되, 상기 테이블 구성부는, 상기 매핑 테이블을 이용하여, 상기 제 3 범위에 배치된 레퍼런스 부호와 상기 제 2 범위 내에 배치된 엘리먼트 텍스트 사이의 대응 관계를 결정하고, 상기 문서 편집부는, 상기 제 3 범위 내의 일정 영역과 상기 제 2 범위 내의 일정 영역을 표시하면서, 서로 간에 대응하는 레퍼런스 부호와 엘리먼트 텍스트를 연결하는 라인(line)을 표시할 수 있다.
본 발명의 일 실시예에 따른 문서 주석화 장치 및 방법은 문서의 주석화 작업을 간편하게 수행할 수 있게 한다.
또한, 본 발명의 일 실시예에 따른 문서 주석화 장치 및 방법은 사용자로 하여금 문서의 내용을 보다 빠르게 파악할 수 있게 한다.
또한, 본 발명의 일 실시예에 따른 문서 주석화 장치 및 방법은 문서를 주석화하는데 있어 텍스트 인식 오류를 현저하게 감소시켜 정확한 문서 주석화가 가능하게 한다.
또한, 본 발명의 일 실시예에 따른 문서 주석화 장치 및 방법은 다양한 방식의 문서 편집 기능을 제공함으로써, 사용자로 하여금 문서를 다양한 형태로 활용할 수 있게 한다.
다만, 본 발명의 일 실시예에 따른 문서 주석화 장치 및 방법이 달성할 수 있는 효과는 이상에서 언급한 것들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1a는 일반적인 특허 문서에 포함된 '발명의 구체적인 설명' 부분을 도시하는 예시적인 도면이다.
도 1b는 일반적인 특허 문서에 포함된 '도면' 부분을 도시하는 예시적인 도면이다.
도 2는 본 발명의 일 실시예에 따른 문서 주석화 방법을 설명하기 위한 순서도이다.
도 3은 본 발명의 일 실시예에 따라 구성된 매핑 테이블을 도시하는 예시적인 도면이다.
도 4는 본 발명의 일 실시예에 따른 문서 주석화를 위한 사용자 단말의 화면을 도시하는 예시적인 도면이다.
도 5는 '도면'에 배치된 엘리먼트 텍스트 또는 매핑 테이블에 포함된 엘리먼트 텍스트의 수정을 위한 사용자 단말의 화면을 도시하는 예시적인 도면이다.
도 6은 다른 실시예에 따른 문서 주석화를 위한 사용자 단말의 화면을 도시하는 예시적인 도면이다.
도 7은 매핑 테이블에서 사용자에 의해 선택된 엘리먼트 텍스트에 대응하는 문장을 표시하는 사용자 단말의 화면을 도시하는 예시적인 도면이다.
도 8은 또 다른 실시예에 따른 문서 주석화를 위한 사용자 단말의 화면을 도시하는 예시적인 도면이다.
도 9는 '특허청구범위'에 배치된 레퍼런스 부호와 '도면'에 배치된 엘리먼트 텍스트를 이용하여 '특허청구범위'와 '도면'의 매핑 관계를 표시하는 사용자 단말의 화면을 도시하는 예시적인 도면이다.
도 10은 '특허청구범위'에 배치된 레퍼런스 부호와 '도면'에 배치된 엘리먼트 텍스트를 이용하여 '특허청구범위'와 '도면'의 매핑 관계를 표시하는 사용자 단말의 화면을 도시하는 예시적인 도면이다.
도 11은 '특허청구범위'와 '도면'의 매핑 관계를 표시하는 사용자 단말의 화면을 도시하는 예시적인 도면이다.
도 12는 '특허청구범위'에 배치된 레퍼런스 부호 또는 엘리먼트 텍스트를 이용하여 '도면'에서 대응 부분을 검색하는 사용자 단말의 화면을 도시하는 예시적인 도면이다.
도 13은 본 발명의 일 실시예에 따른 문서 주석화 장치의 구성을 나타내는 블록도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고, 이를 상세한 설명을 통해 상세히 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명은 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 본 명세서의 설명 과정에서 이용되는 숫자(예를 들어, 제 1, 제 2 등)는 하나의 구성요소를 다른 구성요소와 구분하기 위한 식별기호에 불과하다.
또한, 본 명세서에서, 일 구성요소가 다른 구성요소와 "연결된다" 거나 "접속된다" 등으로 언급된 때에는, 상기 일 구성요소가 상기 다른 구성요소와 직접 연결되거나 또는 직접 접속될 수도 있지만, 특별히 반대되는 기재가 존재하지 않는 이상, 중간에 또 다른 구성요소를 매개하여 연결되거나 또는 접속될 수도 있다고 이해되어야 할 것이다.
또한, 본 명세서에서 '~부(유닛)', '모듈' 등으로 표현되는 구성요소는 2개 이상의 구성요소가 하나의 구성요소로 합쳐지거나 또는 하나의 구성요소가 보다 세분화된 기능별로 2개 이상으로 분화될 수도 있다. 또한, 이하에서 설명할 구성요소 각각은 자신이 담당하는 주기능 이외에도 다른 구성요소가 담당하는 기능 중 일부 또는 전부의 기능을 추가적으로 수행할 수도 있으며, 구성요소 각각이 담당하는 주기능 중 일부 기능이 다른 구성요소에 의해 전담되어 수행될 수도 있음은 물론이다.
한편, 본 명세서에서는 발명 내용의 혼란을 방지하기 위해, 주석화의 대상이 되는 문서의 특허청구범위, 청구항, 도면 등의 용어는 작은따옴표(single quotation mark)를 부기하여 '특허청구범위', '청구항', '도면' 등으로 기재하고, 본 명세서의 특허청구범위, 청구항, 도면 등의 용어는 작은따옴표의 부기없이 그대로 기재된다.
또한, 본 명세서에서는 문서로서, 특허 문서를 중심으로 설명하지만, 당업자에게 자명한 범위 내에서 본 발명의 일 실시예는 특허 문서 이외에 논문, 제품 설명서 등의 다양한 문서에도 적용될 수 있다.
이하에서는, 도면을 참조하여 본 발명의 기술적 사상에 따른 예시적인 실시예들에 대해 설명한다.
도 2는 본 발명의 일 실시예에 따른 문서 주석화 방법을 설명하기 위한 순서도이다. 도 2는 문서 주석화 장치에 의해 수행되는 과정을 도시하고 있는데, 문서 주석화 장치는 사용자 단말에 설치되거나 서버에 설치되어 본 발명의 일 실시예에 따른 문서 주석화 방법을 수행할 수 있다.
S210 단계에서, 문서 주석화 장치는 소정 문서 파일의 제 1 범위에서 텍스트를 인식한다. 문서 주석화 장치는 사용자 단말에 저장된 소정 문서 파일을 사용자로부터 선택받거나, 소정 문서 파일의 식별 정보(예를 들어, 특허등록번호, 특허공개번호, 특허출원번호)를 입력받고, 입력된 식별 정보에 따라 사용자 단말, 인터넷 등에서 검색하여 상기 소정 문서 파일을 획득할 수 있다.
아래에서 살펴볼 바와 같이, 소정 문서 파일은 복수의 범위(예를 들어, 제 1 범위, 제 2 범위, 제 3 범위)로 구분될 수 있는데, 문서 주석화 장치는 각 범위의 제목 등을 통해 소정 문서 파일의 각 범위를 인식할 수 있다.
상기 소정 문서 파일의 제 1 범위는 특허 문서의 '도면' 부분을 제외한 부분들 중 적어도 일부(예를 들어, '발명의 구체적 설명' 부분)를 포함할 수 있으나, 이에 한정되지는 않는다. 문서 주석화 장치는 텍스트를 인식할 부분을 사용자로부터 입력받고, 입력받은 부분에 포함된 텍스트를 인식할 수도 있다.
문서 주석화 장치는 다양한 방식으로 텍스트를 인식할 수 있다. 일반적으로, 특허 문서에서 '도면' 부분을 제외한 '발명의 배경', '발명의 구체적 설명' 부분은 텍스트 형식으로 이루어져 있으므로, 텍스트의 복사, 편집 등이 용이하며 텍스트 인식 정확도도 매우 우수하다. 구현예에 따라서는, 소정 문서 파일의 제 1 범위가 이미지 형식인 경우, 문서 주석화 장치는 OCR(optical character reader)을 통해 텍스트를 인식할 수도 있다.
S220 단계에서, 문서 주석화 장치는 인식된 텍스트 중 레퍼런스 부호 및 그에 대응하는 엘리먼트 텍스트를 추출한다.
문서 주석화 장치는 인식된 텍스트에서 특정 형식의 텍스트를 레퍼런스 부호로 인식할 수 있는데, 예를 들어, 문서 주석화 장치는 두 개의 괄호 내에 포함된 텍스트를 레퍼런스 부호로 인식할 수 있으며, 볼드(bold)체의 텍스트를 레퍼런스 부호로 인식할 수 있다. 레퍼런스 부호는 영문 알파벳, 숫자 등의 다양한 텍스트를 포함할 수 있다.
또한, 문서 주석화 장치는 레퍼런스 텍스트에 인접한 텍스트를 엘리먼트 텍스트로 인식할 수 있다. 일 예로서, 문서 주석화 장치는 레퍼런스 텍스트의 앞에 위치하는 단어 또는 문구를 엘리먼트 텍스트로 인식할 수 있다.
텍스트들로부터 특정 형식의 텍스트와 그에 인접한 단어(또는 문구)를 추출하는 것은 텍스트 처리 알고리즘에서 자명하게 활용되고 있으므로 구체적인 방법의 설명은 본 명세서에서 생략한다.
S230 단계에서, 문서 주석화 장치는 추출된 엘리먼트 텍스트와 레퍼런스 부호를 매핑한 매핑 테이블을 구성한다. 도 3은 도 1a에 도시된 '발명의 구체적인 설명'(10) 부분에서 인식된 텍스트들로부터 구성된 매핑 테이블(300)을 도시하고 있는데, 도 3에 도시된 바와 같이, 엘리먼트 텍스트들과 레퍼런스 부호들이 1:1로 매핑되어 구성될 수 있다.
다시 도 2를 보면, S240 단계에서, 문서 주석화 장치는 사용자가 매핑 테이블에서 선택한 엘리먼트 텍스트를, 소정 문서 파일의 제 2 범위 내에 사용자가 선택한 위치에 배치할 수 있다.
소정 문서 파일의 제 2 범위는 예를 들어, 특허 문서의 '도면' 부분을 포함할 수 있으며, 사용자는 매핑 테이블(300)을 이용하여 '도면'에 표시된 레퍼런스 부호의 주석화를 위해 해당 레퍼런스 부호에 인접하여 엘리먼트 텍스트를 배치할 수 있다.
도 4는 본 발명의 일 실시예에 따른 문서 주석화를 위한 사용자 단말의 화면(400)을 도시하는 예시적인 도면이다.
도 4를 참조하면, 사용자 단말의 화면(400)에는 엘리먼트 텍스트와 레퍼런스 부호가 매핑된 매핑 테이블(300)과, 사용자에 의해 선택된 '도면'(20)이 표시될 수 있다. 사용자는 소정 문서의 페이지를 넘기면서 주석화를 할 '도면'(20)이 화면(400)에 표시되도록 할 수 있다.
사용자(100)는 입력 수단(예를 들어, 마우스, 키보드, 트랙볼, 터치펜, 핑거)을 이용하여 매핑 테이블(300)에서 어느 하나의 엘리먼트 텍스트(410)를 선택하고, '도면'(20)의 특정 위치에 해당 엘리먼트 텍스트를 배치할 수 있다.
일 예로서, 도 4에 도시된 바와 같이, 사용자(100)는 매핑 테이블(300)에서 입력 수단을 이용하여 엘리먼트 텍스트(410)를 선택한 후, 입력 수단으로 엘리먼트 텍스트(410)를 배치할 위치까지 드래그 앤 드랍을 하여 엘리먼트 텍스트를 배치할 수 있다.
다른 예로서, 사용자(100)는 매핑 테이블(300)에서 클릭 또는 터치 등의 방법으로 엘리먼트 텍스트(410)를 선택한 다음, 배치할 위치를 클릭 또는 터치 등으로 선택하여 엘리먼트 텍스트(410)를 해당 위치에 배치할 수도 있다.
일반적으로, '도면'은 이미지 형식으로 이루어져 있으므로, '도면'에 포함된 레퍼런스 부호를 인식하는 것은 어려운 면이 존재하나, 본 발명의 일 실시예에서는 '도면' 부분을 제외한 다른 부분의 텍스트를 인식하기 때문에 주석화의 정확도가 향상될 수 있다.
도 5는 '도면'(20)에 배치된 엘리먼트 텍스트(510) 또는 매핑 테이블(300)에 포함된 엘리먼트 텍스트(520)의 수정을 위한 사용자 단말의 화면(500)을 도시하는 예시적인 도면이다.
사용자는 '도면'(20)에 배치된 엘리먼트 텍스트(510)를 선택한 다음 선택한 엘리먼트 텍스트(510)를 수정할 수 있다. 도 4에 도시된 상부내측용기라는 엘리먼트 텍스트를 도 5에서와 같이 상부용기(510)로 수정한 경우, 그에 따라 매핑 테이블(300)에 포함된 엘리먼트 텍스트(520)가 상부용기로 수정될 수 있으며, 전체 '도면' 부분의 다른 위치에 배치된 상부내측용기의 엘리먼트 텍스트들 역시 상부용기로 함께 수정될 수 있다.
반대로, 사용자는 도 4의 매핑 테이블(300)에 포함된 상부내측용기라는 엘리먼트 텍스트를 도 5에서와 같이 상부용기(520)로 수정할 수도 있는데, 이 경우, '도면' 부분에 배치된 상부내측용기의 엘리먼트 텍스트가 모두 상부용기로 수정될 수 있다.
도 6은 다른 실시예에 따른 문서 주석화를 위한 사용자 단말의 화면(600)을 도시하는 예시적인 도면이다.
앞서 설명한 바와 같이, 사용자는 매핑 테이블(300)에서 어느 하나의 엘리먼트 텍스트를 선택한 다음 '도면'의 특정 위치에 해당 엘리먼트 텍스트를 배치할 수도 있지만, '도면'에 표시된 레퍼런스 부호에 대응하는 엘리먼트 텍스트가 무엇인지 알고자 하는 경우에는 '도면'에서 특정 영역을 선택하여 해당 영역에 대응하는 엘리먼트 텍스트를 배치할 수도 있다.
일 예로서, 도 6에 도시된 바와 같이, '도면'(20)에 표시된 125라는 레퍼런스 부호를 포함하는 영역(610)을 사용자가 선택한 경우, 문서 주석화 장치는 선택된 영역(610)을 OCR을 통해 텍스트 인식하여 해당하는 레퍼런스 부호를 인식하고, 인식된 레퍼런스 부호에 대응하는 엘리먼트 텍스트(630)를 매핑 테이블(300)로부터 추출하여 '도면'(20)에 배치할 수 있다.
다른 예로서, 사용자가 '도면'(20)에 표시된 125라는 레퍼런스 부호를 포함하는 영역(610)을 선택한 경우, 문서 주석화 장치는 125라는 레퍼런스 부호에 대응하는 엘리먼트 텍스트(630)를 매핑 테이블(300)로부터 확인하여 해당 엘리먼트 텍스트(630)에 강조 표시(예를 들어, 엘리먼트 텍스트를 굵게 표시하거나, 엘리먼트 텍스트의 글자색을 다른 엘리먼트 글자색과 다르게 표시하는 등)를 하여 사용자로 하여금 대응 엘리먼트 텍스트가 무엇인지를 쉽게 인지시킬 수 있다.
만약, 사용자가 선택한 영역(610)에서 인식된 레퍼런스 부호에 대응하는 엘리먼트 텍스트가 매핑 테이블(300)에 존재하지 않는 경우, 문서 주석화 장치는 해당 레퍼런스 부호를 매핑 테이블(300)에 추가시켜 사용자로 하여금 대응하는 엘리먼트 텍스트를 직접 작성하게 할 수도 있다.
일반적으로 '도면'이 이미지 형식으로 이루어져 있어 텍스트 인식이 어려운 점이 있으나, 본 발명의 일 실시예에서는 문서의 전체 '도면' 부분의 텍스트 인식을 하는 것이 아닌, 사용자가 선택한 일정 영역만을 대상으로 OCR을 통해 텍스트 인식을 하므로, 텍스트 인식의 정확성이 유지될 수 있는 것이다.
도 7은 매핑 테이블(300)에서 사용자에 의해 선택된 엘리먼트 텍스트(710)에 대응하는 문장(720)을 표시하는 사용자 단말의 화면(700)을 도시하는 예시적인 도면이다.
사용자(100)는 매핑 테이블(300)에서 엘리먼트 텍스트 또는 레퍼런스 부호를 선택할 수 있으며, 문서 주석화 장치는 '도면' 부분을 제외한 다른 부분에서 사용자에 의해 선택된 엘리먼트 텍스트 또는 레퍼런스 부호를 포함하는 문장을 추출하여 화면에 표시할 수도 있다.
도 7을 참조하면, 사용자(100)가 매핑 테이블(300)에서 제1경사면이라는 엘리먼트 텍스트(710)를 선택한 경우, 문서 주석화 장치는 제1경사면(730)을 포함하는 문장(720)을 '도면' 부분 이외의 부분에서 검색하여 화면에 표시할 수 있다. 문서 주석화 장치는 제1경사면을 포함하는 문장이 복수 개인 경우, 가장 최초에 위치하는 문장을 화면(700)에 표시할 수 있다.
문서 주석화 장치는 사용자(100)에 의해 선택된 엘리먼트 텍스트 또는 레퍼런스 부호를 포함하는 문장을 화면(700)에 표시할 때, 문장 내에서 사용자(100)에 의해 선택된 엘리먼트 텍스트 및 레퍼런스 부호 중 적어도 하나에 강조 표시를 할 수도 있다.
또한, 도 7을 참조하면, 화면(700)에는 이전 메뉴(740a) 및 다음 메뉴(740b)가 포함될 수 있으며, 사용자(100)가 이전 메뉴(740a)를 선택한 경우, 문서 주석화 장치는 화면(700)에 표시된 문장의 이전에 위치하며, 상기 제1경사면을 포함하는 다른 문장을 화면(700)에 표시할 수 있고, 사용자(100)가 다음 메뉴(740b)를 선택한 경우, 화면(700)에 표시된 문장의 이후에 위치하며, 상기 제1경사면을 포함하는 다른 문장을 화면(700)에 표시할 수 있다.
도 8은 또 다른 실시예에 따른 문서 주석화를 위한 사용자 단말의 화면(800)을 도시하는 예시적인 도면이다.
앞서 살펴본 바와 같이, 문서 주석화 장치는 매핑 테이블(300)을 통해 소정 문서의 제 2 범위(예를 들어, '도면' 부분)를 주석화할 수 있는 이외에 소정 문서의 제 3 범위(예를 들어, '특허청구범위' 부분)도 주석화할 수 있다. '특허청구범위'는 권리의 핵심이 되는 부분으로서, 사용자들은 '특허청구범위'와 '도면'을 비교하며 발명의 내용을 파악하고자 하는 경우가 있다.
특허 문서의 '도면' 부분과 달리 '특허청구범위' 부분에는 레퍼런스 부호가 포함되어 있지 않는 경우가 많으므로, 문서 주석화 장치는 매핑 테이블(300)에 포함된 레퍼런스 부호를 '특허청구범위'에 포함된 엘리먼트 텍스트에 인접하여 배치할 수 있다. 도 8을 참조하면, '특허청구범위'(30)의 각 엘리먼트 텍스트에 인접하여 레퍼런스 부호(810)가 배치된 것을 알 수 있다.
배치 방법의 일 예로서, 문서 주석화 장치는 매핑 테이블(300)에서 사용자에 의해 선택된 레퍼런스 부호를, '특허청구범위'(30) 내 특정 위치에 배치할 수 있다. 도 4와 관련하여 설명한 바와 같이, 사용자는 드래그 앤 드랍, 클릭, 터치 등의 방법으로 레퍼런스 부호를 '특허청구범위'(30) 내 특정 위치에 배치할 수 있다.
다른 예로서, 문서 주석화 장치는 '특허청구범위'(30)의 텍스트를 인식하여 매핑 테이블(300)에 포함된 엘리먼트 텍스트와 동일한 엘리먼트 텍스트를 추출하고, 매핑 테이블에 포함된 레퍼런스 부호를 '특허청구범위'의 대응 엘리먼트 텍스트에 인접시켜 자동 배치할 수도 있다.
도 9는 '특허청구범위'(30)에 배치된 레퍼런스 부호(910)와 '도면'(20)에 배치된 엘리먼트 텍스트(920)를 이용하여 '특허청구범위'(30)와 '도면'(20)의 매핑 관계를 표시하는 사용자 단말의 화면(900)을 도시하는 예시적인 도면이다.
특허 문서의 '특허청구범위'(30)에 레퍼런스 부호(910)가 배치되고, '도면'(20)에 엘리먼트 텍스트(920)가 배치되면, 문서 주석화 장치는 사용자 단말의 화면(900)에 '특허청구범위'(30)의 레퍼런스 부호(910)와 '도면'(20)의 엘리먼트 텍스트(920)의 대응 관계를 시각화하여 표시할 수 있다.
문서 주석화 장치는 사용자로부터 소정의 '특허청구범위'(도면에서는 '청구항 1')와 소정의 '도면'(도면에서는 '도 2)을 선택받으면, 매핑 테이블(300)을 이용하여 '특허청구범위'(30)에 배치된 레퍼런스 부호(또는 레퍼런스 부호에 인접한 엘리먼트 텍스트)(910)와 '도면'(20)에 배치된 엘리먼트 텍스트(또는 엘리먼트 텍스트에 인접한 레퍼런스 부호)(920)를 연결하는 라인(930)을 표시할 수 있다.
사용자는 도 9에 도시된 화면(900)을 보고, '특허청구범위'(30)에 기재된 각 엘리먼트들(910)이 '도면'(20)의 어느 부분에 대응하는지를 직관적으로 알 수 있다.
구현예에 따라서는, 문서 주석화 장치는 사용자로부터 소정의 '특허청구범위'가 선택되면, 선택된 '특허청구범위'에 배치된 레퍼런스 부호에 대응하는 엘리먼트 텍스트를 가장 많이 포함하는 '도면'을 선택하여 '특허청구범위'에 배치된 레퍼런스 부호와 '도면'에 배치된 엘리먼트 텍스트를 라인으로 연결할 수 있다. 구체적으로, 사용자가 '청구항 1'(30)을 선택한 경우, 문서 주석화 장치는 '청구항 1'(30)에 배치된 레퍼런스 부호(910)를 가장 많이 포함하는 '도면'(20)을 전체 '도면' 부분에서 검색하여 검색된 '도면'(20)을 사용자에 의해 선택된 '청구항 1'(30)과 함께 화면에 표시할 수 있다.
만약, 사용자에 의해 선택된 '청구항'에 배치된 레퍼런스 부호에 대응하는 엘리먼트 텍스트를 가장 많이 포함하는 '도면'이 복수 개인 경우, 문서 주석화 장치는 '청구항'에 배치된 레퍼런스 부호의 개수와 가장 근접한 개수의 엘리먼트 텍스트가 배치된 '도면'을 선택할 수 있다. 이는, '청구항'에 배치된 레퍼런스 부호의 개수와 가장 근접한 개수의 엘리먼트 텍스트가 배치된 '도면'이 해당 '청구항'을 보다 명확히 표현하기 때문이다.
또한, 구현예에 따라서는, 문서 주석화 장치는 사용자로부터 소정의 '도면'이 선택되면, 선택된 '도면'에 배치된 엘리먼트 텍스트에 대응하는 레퍼런스 부호를 가장 많이 포함하는 '특허청구범위'를 선택하여 '도면'에 배치된 엘리먼트 텍스트와 '특허청구범위'에 배치된 레퍼런스 부호를 라인으로 연결할 수 있다. 구체적으로, 사용자가 '도 1'(20)을 선택한 경우, 문서 주석화 장치는 '도 1'(20)에 배치된 엘리먼트 텍스트(920)를 가장 많이 포함하는 '특허청구범위'을 전체 '특허청구범위' 부분에서 검색하여 '특허청구범위'(30)를 사용자에 의해 선택된 '도 1'(20)과 함께 화면에 표시할 수 있다.
만약, 사용자에 의해 선택된 '도면'에 배치된 엘리먼트 텍스트에 대응하는 레퍼런스 부호를 가장 많이 포함하는 '특허청구범위'가 복수 개인 경우, 문서 주석화 장치는 '도면'에 배치된 엘리먼트 부호의 개수와 가장 근접한 개수의 레퍼런스 부호가 배치된 '특허청구범위'를 선택할 수 있다. 이는, '도면'에 배치된 레퍼런스 부호의 개수와 가장 근접한 개수의 레퍼런스 부호가 배치된 '특허청구범위'가 해당 '도면'을 대표화하여 작성된 것이기 때문이다.
한편, 문서 주석화 장치는 '도면'에 배치된 엘리먼트 텍스트에 대응하는 레퍼런스 부호를 가장 많이 포함하는 '특허청구범위' 또는 '도면'에 배치된 레퍼런스 부호의 개수와 가장 근접한 개수의 레퍼런스 부호가 배치된 '특허청구범위'를 선택하는 데 있어, '특허청구범위'가 종속 청구항인 경우에는, 해당 종속 청구항이 인용하고 있는 독립 청구항 또는 종속 청구항을 모두 고려하여 '특허청구범위'를 선택할 수 있다. 예를 들어, '청구항 2'가 '청구항 1'을 인용하고 있는 경우, 문서 주석화 장치는 '청구항 2'에 배치된 레피런스 부호뿐만 아니라, '청구항 1'에 배치된 레퍼런스 부호를 모두 고려하여 '특허청구범위'를 선택할 수 있는 것이다.
문서 주석화 장치는 '특허청구범위'(30)와 '도면'(20)의 대응 관계를 시각화하여 표시할 때, '특허청구범위'(30)와 '도면'(20)을 도 9에서와 같이 좌우 배치하여 표시하거나, 상하 배치하여 표시할 수 있다.
도 10은 '특허청구범위'(30)에 배치된 레퍼런스 부호(1010)와 '도면'(20)에 배치된 엘리먼트 텍스트(1020)를 이용하여 '특허청구범위'(30)와 '도면'(20)의 매핑 관계를 표시하는 사용자 단말의 화면(1000)을 도시하는 예시적인 도면이다.
도 10은 사용자에 의해 '종속 청구항'이 선택된 경우에 '도면'과의 대응 관계를 시각화하는 도면인데, 도 10에 도시된 바와 같이, 사용자에 의해 '청구항 3'(30)이 선택되고, '청구항 3'(30)이 '청구항 1'을 인용하고 있는 경우, 문서 주석화 장치는 '청구항 3'(30)과 '청구항 1'을 모두 화면(1000)에 표시하고, '도면'(20)과의 대응 관계를 시각화하여 표시할 수 있다.
도 9 및 도 10과 같이, '특허청구범위'에 배치된 레퍼런스 부호(1010)와 '도면'에 배치된 엘리먼트 텍스트(1020)를 연결하는 경우, '특허청구범위'에는 배치되었으나, 그에 대응하는 엘리먼트 텍스트(1020)가 '도면'(20)에는 배치되지 않은 레퍼런스 부호(1040)의 경우, 도 10의 우측 하부에 도시된 바와 같이, '특허청구범위'(30)에 배치된 레퍼런스 부호(또는 그에 대응하는 엘리먼트 텍스트)(1040)가 다른 '도면'에 도시되어 있다는 메시지(1050)를 화면(1000)에 표시할 수 있다. 즉, 도 10에 도시된 바와 같이, '특허청구범위'(30)에 배치된 160의 레퍼런스 부호(1040) 및 그에 인접한 단열용기가 '도 3'에 도시되어 있다는 메시지(1050)가 화면에 표시될 수 있다. 문서 주석화 장치는 다른 '도면'에 도시되어 있다는 메시지(1050) 대신 해당하는 다른 '도면'을 화면(1000)에 함께 표시할 수도 있다.
반대로, '도면'에는 배치되었으나, 그에 대응하는 레퍼런스 부호가 '특허청구범위'에는 배치되지 않은 엘리먼트 텍스트의 경우, 문서 주석화 장치는 '도면'에 배치된 엘리먼트 텍스트(또는 그에 인접한 레퍼런스 부호)가 다른 '특허청구범위'에 배치되어 있다는 메시지를 화면에 표시할 수 있다. 구현예에 따라서, 문서 주석화 장치는 다른 '특허청구범위'에 배치되어 있다는 메시지 대신 해당하는 다른 '특허청구범위'를 화면에 함께 표시할 수도 있다.
한편, 특허 문서의 '특허청구범위'(30) 부분은 텍스트 형식으로 구성되어 있으므로, 도 9 및 도 10과 관련하여 설명한 것과 달리, '특허청구범위'(30) 부분에 레퍼런스 부호(910, 1010)가 배치되어 있지 않더라도 문서 주석화 장치는 소정의 '특허청구범위'(30)와 소정의 '도면'(20)의 매핑 관계를 시각화하여 화면에 표시할 수도 있다.
도 11은 '특허청구범위'(30)과 '도면'(20)의 매핑 관계를 표시하는 사용자 단말의 화면(1100)을 도시하는 예시적인 도면이다.
문서 주석화 장치는 소정의 '특허청구범위'(30) 내의 텍스트를 인식하고, 인식된 텍스트 중 매핑 테이블(300)에 포함된 엘리먼트 텍스트와 동일한 엘리먼트 텍스트들(1110)을 추출할 수 있다. 그리고, 문서 주석화 장치는 추출된 엘리먼트 텍스트들(1110)과 소정 '도면'(20)에 배치된 엘리먼트 텍스트(1120)를 라인(1130)으로 연결하여 화면에 표시할 수 있다.
도 11을 보면, '청구항 1'(30)에서 인식된 엘리먼트 텍스트(1110)와 '도 2'(20)에 배치된 엘리먼트 텍스트(1120)가 라인(1130)으로 연결된 것을 알 수 있다.
한편, 도 9 내지 도 11과 관련하여 '특허청구범위'에 배치된 레퍼런스 부호(또는 '특허청구범위'에서 인식된 엘리먼트 텍스트)와 '도면'에 배치된 엘리먼트 텍스트를 연결하는 라인이 표시되면, 문서 주석화 장치는 사용자의 선택에 따라 라인의 시작점 및 종료점 중 적어도 하나를 수정할 수도 있다. 예를 들어, 사용자가 라인의 종료점이 '도면'에 배치된 엘리먼트 텍스트가 아닌 해당 엘리먼트 텍스트의 형태를 나타내는 지점에 위치시키고자 하는 경우, 문서 주석화 장치는 사용자의 선택에 따라 라인의 종료점의 위치를 변경할 수 있다.
또한, 도 9 내지 도 11과 같이, '특허청구범위'에 배치된 레퍼런스 부호와 '도면'에 배치된 엘리먼트 텍스트를 연결하는 라인이 표시되면, 문서 주석화 장치는 사용자의 선택에 따라 '특허청구범위'에 배치된 레퍼런스 부호와 '도면'에 배치된 엘리먼트 텍스트를 삭제할 수도 있다. 이는, '특허청구범위'에서는 엘리먼트 텍스트의 확인이 가능하고, '도면'에서는 레퍼런스 부호의 확인이 가능하기 때문에, 화면에 표시된 라인만으로 엘리먼트 텍스트와 레퍼런스 부호의 대응 관계가 확인되기 때문이다. 구현예에 따라서는, 문서 주석화 장치는 앞서 설명한 바와 같이, 라인의 시작점 및 종료점 중 적어도 하나의 수정이 완료된 이후에 '특허청구범위'에 배치된 레퍼런스 부호와 '도면'에 배치된 엘리먼트 텍스트를 삭제할 수도 있다.
도 12는 '특허청구범위'(30)에 배치된 레퍼런스 부호(1220) 또는 엘리먼트 텍스트(1210)를 이용하여 '도면'(20)에서 대응 부분을 검색하는 사용자 단말의 화면(1200)을 도시하는 예시적인 도면이다.
사용자(100)는 '특허청구범위'(30)에 배치된 레퍼런스 부호(1220) 또는 엘리먼트 텍스트(1210)를 선택하여, 선택된 레퍼런스 부호(1220) 또는 엘리먼트 텍스트(1210)가 어느 '도면'의 어느 부분에 대응하는지를 쉽게 확인할 수도 있다.
도 12를 보면, 사용자(100)가 '청구항 1'(30)에서 110c의 레퍼런스 부호(1220) 또는 제1경사면의 엘리먼트 텍스트(1210)를 선택한 경우, 문서 주석화 장치는 '도면'(20) 배치된 엘리먼트 텍스트들 중 사용자에 의해 선택된 것에 대응하는 엘리먼트 텍스트(1230)에 강조 표시를 하여 화면(1200)에 표시할 수 있다.
도 12에는 도시되어 있지 않지만, 사용자 단말의 화면(1200)에는 이전 메뉴 및 다음 메뉴가 포함될 수 있으며, 사용자는 이전 메뉴 및 다음 메뉴를 선택하여, '특허청구범위'(30) 부분에 배치된 레퍼런스 부호 또는 엘리먼트 텍스트에 대응하는 엘리먼트 텍스트가 배치된 '도면'을 차례로 확인할 수도 있다.
구현예에 따라서는, 문서 주석화 장치는 사용자에 의해 '특허청구범위'에 배치된 레퍼런스 부호 또는 엘리먼트 텍스트가 선택된 경우, 선택된 레퍼런스 부호 또는 엘리먼트 텍스트에 대응하는 엘리먼트 텍스트를 갖는 '도면' 자체가 아닌 해당 '도면'의 식별 정보(예를 들어, '도면'의 번호)를 화면에 표시할 수도 있다.
도 13은 본 발명의 일 실시예에 따른 문서 주석화 장치의 구성(1300)을 나타내는 블록도이다.
도 13을 참조하면, 본 발명의 일 실시예에 따른 문서 주석화 장치(1300)는 문서 획득부(1310), 텍스트 인식부(1330), 테이블 구성부(1350) 및 문서 편집부(1370)를 포함할 수 있다. 문서 획득부(1310), 텍스트 인식부(1330), 테이블 구성부(1350) 및 문서 편집부(1370)는 적어도 하나의 프로세서로 구성될 수 있으며, 또는, 문서 획득부(1310), 텍스트 인식부(1330), 테이블 구성부(1350) 및 문서 편집부(1370)는 프로그램으로 구현되어 사용자 단말을 동작시킬 수도 있다. 또는 문서 획득부(1310), 텍스트 인식부(1330), 테이블 구성부(1350) 및 문서 편집부(1370)는 프로그램으로 구현되되, 서버에서 동작하여, 서버에 접속한 사용자 단말에게 문서 주석화 서비스를 제공할 수도 있다.
문서 획득부(1310)는 소정 문서 파일을 획득한다. 문서 획득부(1310)는 사용자 단말에 저장된 소정 문서 파일을 사용자로부터 선택받거나, 소정 문서 파일의 식별 정보(예를 들어, 특허등록번호, 특허공개번호, 특허출원번호)를 입력받고, 입력된 식별 정보에 따라 사용자 단말, 인터넷 등에서 검색하여 상기 소정 문서 파일을 획득할 수 있다.
텍스트 인식부(1330)는 소정 문서 파일의 제 1 범위(예를 들어, 특허 문서에서 '도면' 부분을 제외한 부분 중 적어도 일부)에서 텍스트를 인식하고, 상기 인식된 텍스트 중 레퍼런스 부호 및 그에 대응하는 엘리먼트 텍스트를 추출한다.
테이블 구성부(1350)는 추출된 엘리먼트 텍스트와 레퍼런스 부호를 매핑한 매핑 테이블을 구성한다.
문서 편집부(1370)는 도 4와 관련하여 설명한 바와 같이, 매핑 테이블에서 선택한 엘리먼트 텍스트를 상기 소정 문서 파일의 제 2 범위 내 상기 사용자가 선택한 위치에 배치하여 표시한다. 문서 편집부(1370)는 주석화가 완료된 소정 문서 파일을 소정 파일 형식(예를 들어, PDF 파일 형식 또는 JPG 등의 이미지 파일 형식)으로 저장할 수 있게 할 수도 있다.
문서 편집부(1370)는 도 5와 관련하여 설명한 바와 같이, 제 2 범위 내에 배치된 엘리먼트 텍스트 또는 매핑 테이블에 포함된 엘리먼트 텍스트 등에 대한 수정 요청이 사용자로부터 입력되면, 수정 요청에 따라 제 2 범위 내에 배치된 엘리먼트 텍스트 및 매핑 테이블에 포함된 엘리먼트 텍스트를 수정할 수도 있다.
또한, 문서 편집부(1370)는 도 6과 관련하여 설명한 바와 같이, 제 2 범위에서 사용자에 의해 일정 영역이 선택되면, 텍스트 인식부(1310)를 통해 상기 선택된 영역에서 인식된 텍스트(예를 들어, 레퍼런스 부호)에 대응하는 엘리먼트 텍스트를 제 1 범위 및 매핑 테이블 중 적어도 하나에서 검색하여 상기 제 2 범위에 배치할 수도 있다.
또한, 문서 편집부(1370)는 도 7 및 도 12와 관련하여 설명한 바와 같이, 매핑 테이블에서 어느 하나의 엘리먼트 텍스트가 사용자에 의해 선택되면, 제 1 범위에서 해당 엘리먼트 텍스트를 포함하는 문장을 검색하여 화면에 표시할 수도 있고, 제 3 범위에서 엘리먼트 텍스트 또는 레퍼런스 부호가 선택되면, 해당 엘리먼트 텍스트 또는 레퍼런스 부호에 대응하는 엘리먼트 텍스트가 배치된 제 2 범위의 적어도 일부를 화면에 표시할 수 있다.
또한, 문서 편집부(1370)는 도 8 내지 도 11와 관련하여 설명한 바와 같이, 소정 문서의 제 3 범위 내에 레퍼런스 부호를 배치할 수 있으며, 제 3 범위에 배치된 레퍼런스 부호와 제 2 범위에 배치된 엘리먼트 텍스트의 매핑 관계를 시각화하여 표시할 수도 있다.
한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 작성된 프로그램은 매체에 저장될 수 있다.
매체는 컴퓨터로 실행 가능한 프로그램을 계속 저장하거나, 실행 또는 다운로드를 위해 임시 저장하는 것일 수도 있다. 또한, 매체는 단일 또는 수개 하드웨어가 결합된 형태의 다양한 기록수단 또는 저장수단일 수 있는데, 어떤 컴퓨터 시스템에 직접 접속되는 매체에 한정되지 않고, 네트워크 상에 분산 존재하는 것일 수도 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. 또한, 다른 매체의 예시로, 애플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다
첨부된 도면을 참조하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.
1300: 문서 주석화 장치
1310: 문서 획득부
1330: 텍스트 인식부
1350: 테이블 구성부
1370: 문서 편집부

Claims (16)

  1. 문서 데이터의 이미지를 표시하는 단계
    상기 이미지의 레퍼런스 부호를 인식하는 단계;
    상기 문서 데이터의 텍스트에서 상기 레퍼런스 부호에 대응하는 엘리먼트 텍스트를 추출하는 단계;
    상기 이미지의 레퍼런스 부호 및 상기 레퍼런스 부호에 대응하는 엘리먼트 텍스트의 매핑 정보를 상기 이미지와 구별되는 소정 영역에 표시하는 단계
    를 포함하는 문서의 주석화 방법.
  2. 제1항에 있어서,
    상기 엘리먼트 텍스트는,
    상기 문서 데이터의 텍스트로부터 추출된 상기 레퍼런스 부호의 주석인 문서의 주석화 방법.
  3. 제1항에 있어서,
    상기 매핑 정보에서 엘리먼트 텍스트에 대한 선택을 입력받는 단계;
    상기 이미지에서, 상기 선택된 엘리먼트 텍스트에 매핑된 레퍼런스 부호와 관련된 위치에 상기 엘리먼트 텍스트를 표시하는 단계
    를 더 포함하는 문서의 주석화 방법.
  4. 제3항에 있어서,
    상기 매핑 정보에서 선택된 엘리먼트 텍스트는, 상기 매핑 정보에서 선택되지 않은 다른 엘리먼트 텍스트와 구분되도록 표시되는 문서의 주석화 방법.
  5. 제1항에 있어서,
    상기 매핑 정보에서 레퍼런스 부호에 대한 선택을 입력받는 단계;
    상기 선택된 레퍼런스 부호에 대응하는 엘리먼트 텍스트를 상기 이미지에서 레퍼런스 부호와 관련된 위치에 표시하는 단계
    를 더 포함하는 문서의 주석화 방법.
  6. 제1항에 있어서,
    상기 문서 데이터의 텍스트에서 상기 이미지의 레퍼런스 부호에 대응하는 엘리먼트 텍스트를 강조하여 표시하는 단계
    를 더 포함하는 문서의 주석화 방법.
  7. 제1항에 있어서,
    상기 문서 데이터의 텍스트에서 상기 엘리먼트 텍스트에 대응하는 레퍼런스 부호를 강조하여 표시하는 단계
    를 더 포함하는 문서의 주석화 방법.
  8. 제1항에 있어서,
    상기 매핑 정보에서 엘리먼트 텍스트에 대한 선택을 입력받는 단계;
    상기 문서 데이터의 텍스트로부터 상기 선택된 엘리먼트 텍스트를 포함하는 문장을 추출하는 단계
    상기 추출된 문장을 표시하는 단계
    를 더 포함하는 문서의 주석화 방법.
  9. 제1항에 있어서,
    상기 매핑 정보에서 레퍼런스 부호에 대한 선택을 입력받는 단계;
    상기 문서 데이터의 텍스트로부터 상기 선택된 레퍼런스 부호에 대응하는 엘리먼트 텍스트를 포함하는 문장을 추출하는 단계
    상기 추출된 문장을 표시하는 단계
    를 더 포함하는 문서의 주석화 방법.
  10. 제1항에 있어서,
    상기 텍스트에서 엘리먼트 텍스트에 대응하는 레퍼런스 부호에 대한 선택을 입력받는 단계;
    상기 선택된 레퍼런스 부호에 대응하는 엘리먼트 텍스트를 상기 이미지에서 레퍼런스 부호와 관련된 위치에 표시하는 단계
    를 더 포함하는 문서의 주석화 방법.
  11. 제1항에 있어서,
    상기 텍스트에서 레퍼런스 부호에 대응하는 엘리먼트 텍스트에 대한 선택을 입력받는 단계;
    상기 레퍼런스 부호에 대응하는 엘리먼트 텍스트를 상기 이미지에서 레퍼런스 부호와 관련된 위치에 표시하는 단계
    를 더 포함하는 문서의 주석화 방법.
  12. 제1항에 있어서,
    상기 이미지에서 레퍼런스 부호에 대한 선택을 입력받는 단계;
    상기 레퍼런스 부호에 대응하는 엘리먼트 텍스트를 상기 이미지에서 레퍼런스 부호와 관련된 위치에 표시하는 단계
    를 더 포함하는 문서의 주석화 방법.
  13. 제1항에 있어서,
    상기 이미지에서 레퍼런스 부호에 대한 선택을 입력받는 단계;
    상기 매핑 정보에서 상기 레퍼런스 부호에 대응하는 엘리먼트 텍스트를 강조하여 표시하는 단계
    를 더 포함하는 문서의 주석화 방법.
  14. 문서 데이터의 이미지를 표시하는 단계
    상기 이미지의 레퍼런스 부호 및 상기 이미지의 레퍼런스 부호 및 상기 레퍼런스 부호에 대응하는 엘리먼트 텍스트의 매핑 정보를 상기 이미지와 구별되는 소정 영역에 표시하는 단계
    상기 매핑 정보 또는 상기 이미지에서 레퍼런스 부호에 대한 선택을 입력받는 단계;
    상기 레퍼런스 부호에 대응하는 엘리먼트 텍스트를 상기 레퍼런스 부호와 관련된 위치에 표시하는 단계
    를 포함하는 문서의 주석화 방법.
  15. 제14항에 있어서,
    상기 엘리먼트 텍스트에 대한 선택을 입력받는 단계;
    상기 엘리먼트 텍스트에 대해 사용자의 드래그 앤 드랍을 통해 상기 이미지에서 특정 위치로 배치하는 단계
    를 더 포함하는 문서의 주석화 방법.
  16. 제1항 내지 제15항 중 어느 하나의 항의 문서의 주석화 방법을 실행하기 위하여 컴퓨팅 장치에서 읽기 가능한 매체에 저장된 프로그램.
KR1020220134896A 2016-11-08 2022-10-19 문서 주석화 장치 및 방법 KR20220145319A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220134896A KR20220145319A (ko) 2016-11-08 2022-10-19 문서 주석화 장치 및 방법

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020160148416A KR102458191B1 (ko) 2016-11-08 2016-11-08 문서 주석화 장치 및 방법
KR1020220134896A KR20220145319A (ko) 2016-11-08 2022-10-19 문서 주석화 장치 및 방법

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020160148416A Division KR102458191B1 (ko) 2016-11-08 2016-11-08 문서 주석화 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20220145319A true KR20220145319A (ko) 2022-10-28

Family

ID=62452254

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020160148416A KR102458191B1 (ko) 2016-11-08 2016-11-08 문서 주석화 장치 및 방법
KR1020220134896A KR20220145319A (ko) 2016-11-08 2022-10-19 문서 주석화 장치 및 방법

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020160148416A KR102458191B1 (ko) 2016-11-08 2016-11-08 문서 주석화 장치 및 방법

Country Status (1)

Country Link
KR (2) KR102458191B1 (ko)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7266765B2 (en) 2001-08-31 2007-09-04 Fuji Xerox Co., Ltd. Detection and processing of annotated anchors
KR100736759B1 (ko) * 2005-10-04 2007-07-09 (주)윕스 문서 표시 시스템 및 그 표시 방법
KR20070090321A (ko) * 2006-03-02 2007-09-06 (주)윕스 문서 정보 추출 시스템과 그 추출 방법 및 이를 기록한기록매체
US20110289118A1 (en) 2010-05-20 2011-11-24 Microsoft Corporation Mapping documents to a relational database table with a document position column
KR101253502B1 (ko) * 2011-01-18 2013-04-15 대한민국 출원문서 표시 시스템

Also Published As

Publication number Publication date
KR20180051297A (ko) 2018-05-16
KR102458191B1 (ko) 2022-10-24

Similar Documents

Publication Publication Date Title
Edhlund et al. NVivo 12 essentials
US11294968B2 (en) Combining website characteristics in an automatically generated website
CN108073555B (zh) 用于从电子文档生成虚拟现实环境的方法和系统
Edhlund et al. Nvivo 11 essentials
US10318646B2 (en) Generating a structured document guiding view
US10204085B2 (en) Display and selection of bidirectional text
US20070061703A1 (en) Method and apparatus for annotating a document
US10417267B2 (en) Information processing terminal and method, and information management apparatus and method
US20140304579A1 (en) Understanding Interconnected Documents
CN115238214A (zh) 展示方法、装置、计算机设备、存储介质及程序产品
US20130262968A1 (en) Apparatus and method for efficiently reviewing patent documents
US20170109442A1 (en) Customizing a website string content specific to an industry
US9141867B1 (en) Determining word segment boundaries
US20240143163A1 (en) Digital ink processing system, method, and program
KR20210135195A (ko) 문서 주석화 장치 및 방법
KR20140007233A (ko) 전자문서에 대한 키워드맵 제공 방법 및 이를 위한 키워드맵 제공 프로그램을 기록한 컴퓨터로 판독가능한 기록매체
KR101397562B1 (ko) 사용자 주석 처리 장치 및 그를 위한 전자책 서비스 시스템 및 방법
CN111602129B (zh) 针对注释和墨迹的智能搜索
KR102458191B1 (ko) 문서 주석화 장치 및 방법
US11663398B2 (en) Mapping annotations to ranges of text across documents
CN112906359A (zh) 基于人机交互的叠加信息处理方法及相关装置
US20140304118A1 (en) Product comparison apparatus and method
JP2015069597A (ja) 関連文書検索装置、方法およびプログラム
KR101079766B1 (ko) 인터넷 검색과 연동하여 부가적인 설명이나 링크 관련 메타 데이터 입력이 자유로운 문서 편집 방법 및 시스템
KR20150015570A (ko) 사용자의 개별학습을 위한 전자책 뷰어 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체 및 전자책 뷰어 단말 장치

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right