KR100323607B1 - 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료 변환방법 - Google Patents

기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료 변환방법 Download PDF

Info

Publication number
KR100323607B1
KR100323607B1 KR1019990006685A KR19990006685A KR100323607B1 KR 100323607 B1 KR100323607 B1 KR 100323607B1 KR 1019990006685 A KR1019990006685 A KR 1019990006685A KR 19990006685 A KR19990006685 A KR 19990006685A KR 100323607 B1 KR100323607 B1 KR 100323607B1
Authority
KR
South Korea
Prior art keywords
data
master table
text file
record
file
Prior art date
Application number
KR1019990006685A
Other languages
English (en)
Other versions
KR20000056924A (ko
Inventor
김미호
조찬호
이성규
소호영
Original Assignee
김덕중
사단법인 고등기술연구원 연구조합
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김덕중, 사단법인 고등기술연구원 연구조합 filed Critical 김덕중
Priority to KR1019990006685A priority Critical patent/KR100323607B1/ko
Publication of KR20000056924A publication Critical patent/KR20000056924A/ko
Application granted granted Critical
Publication of KR100323607B1 publication Critical patent/KR100323607B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/11Patent retrieval

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

특허 또는 기술자료 검색시스템으로부터 다운로드 받은 텍스트파일을 특허정보 또는 기술정보 분석용 마스터테이블로 자동 변환하기 위한 방법이 개시된다. 마스터테이블은 기술주제별로 작성된다. 변환대상인 텍스트파일, 기술주제 및 중복레코드의 처리방식을 컴퓨터화면상에서 사용자가 선택하면, 선택된 텍스트파일이 변환가능한 파일인지를 파일구분자를 이용하여 먼저 확인한 후, 그에 대응하는 변환모듈을 인에이블시킨다. 인에이블된 변환모듈은 텍스트파일을 열어 라인단위로 파싱해나가면서 레코드구분자와 필드구분자를 찾아 미리 설정된 구분자정보와 비교하면서 레코드단위로 필드데이타를 어레이에 임시저장한다. 이후, 어레이에 저장된 레코드와 마스터테이블에 이미 존재하는 레코드간의 중복여부를 검사하고, 사용자가 설정해둔 중복레코드 처리방식에 따라 통합(merge), 대체(replace) 또는 어레이리셋 중 어느 하나의 방식에 따라 어레이에 저장된 데이터를 마스터테이블에 임포트(import)시킨다. 이러한 과정은 파일의 끝을 만날 때가지 계속한다. 적용가능한 검색시스템은 다양할 수 있으며, 각 검색시스템이 출력하는 텍스트파일의 포맷에 맞게 변환모듈을 별도로 작성해둔다.

Description

기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료변환방법{DATA CONVERSION METHOD FOR CONVERTING TEXT FILE SEARCHED FOR ART DATA INTO MASTER TABLE FOR ART INFORMATION ANALYSIS}
본 발명은 특허 또는 기술정보에 관한 검색자료들을 특허 또는 기술정보 분석용 마스터테이블로 자동변환하는 방법에 관한 것으로, 보다 상세하게는, 국내외적으로 널리 이용되고 있는 다양한 특허검색 시스템을 활용하여 얻어진 특허에 관한 검색자료들을 특허정보 분석용 마스터테이블이라는 특허정보 데이터베이스의 데이터로 자동변환하여 주는 방법에 관한 것이다.
오늘날 산업활동을 함에 있어서 특허권이나 실용신안권 등과 같은 산업재산권의 지위는 날로 그 중요성이 높아지고 있다. 특허권 등을 앞세운 기업은 그렇지 못한 기업에 비해 기술경쟁과 시장개척 등의 면에서 보다 유리한 조건을 확보할 수 있는 가능성을 더 많이 가진다. 따라서, 기업활동에 있어서 특허권 등과 같은 산업재산권에 관한 정보를 효과적으로 활용하는 것은 아무리 강조해도 지나치지 않을 것이다.
산업재산권에 관한 정보는 다양한 형태로 이용되고 있으며, 특히 중복연구나 중복투자를 회피하기 위한 유력한 도구로 이용되고 있다. 산업재산권에 관한 정보는 일차적으로 특허자료 검색시스템을 통해 구할 수 있다. 예컨데, 각국의 특허청 또는 특허자료 검색 서비스업체의 홈페이지에 접속하여 이들 기관들이 제공하는 특허자료 검색시스템을 이용한 정보검색 혹은 영리업체가 제공하는 특허자료 검색용 시디-롬(CD-ROM)을 통한 정보검색 등이 그 예이다.
그렇지만 위와 같은 검색시스템들은 자료검색 서비스를 제공해주는 데 그칠 뿐, 기업들이 요구하는 보다 유익한 정보들을 제공해주지는 못한다. 기존의 특허권과의 중복연구 및 중복투자의 회피, 침해의 검색 또는 회피 및 경쟁기업체의 연구개발의 정도 및 개발방향 등과 같은 2차적인 정보는 위의 일차 정보를 분석 가공하여 얻어질 수밖에 없는 것이다.
이와 같은 2차적인 정보는 특허정보 분석 전문가가 검색된 자료를 직접 분석하는 매뉴얼방식에 의해 얻어질 수 있지만 효율성이 낮다. 따라서, 컴퓨터의 자료처리기능을 이용하여 검색된 자료를 가공 분석하는 별도의 분석시스템을 이용하는 것이 보다 효율적이다. 이를 위한 선행적인 과정은 검색자료를 데이터베이스화하는 작업이 된다. 즉, 특허자료 검색시스템을 통해 얻을 수 있는 검색자료는 텍스트정보와 이미지정보가 될 수 있는데, 그 중에서 특히 텍스트정보를 일정한 데이터구조를 갖는 데이터베이스로 자료변환을 하여 특허자료 분석용 마스터테이블을 구축하는 작업을 우선적으로 하여야 한다. 마스터테이블은 기술주제별로 각각 별도로 구축하면 보다 유용할 것이다. 나아가 위 마스터데이블에는 특허자료 뿐 만 아니라 각종의 기술관련 논문자료 검색시스템을 통해 얻어진 기술자료 등도 함께 정리되어 있으면 그 유용성이 더욱 강화될 수 있을 것이다.
본 발명은 위와 같은 요구에 부응하기 위한 것으로서, 현존하는 다양한 특허자료 혹은 기술자료 검색 시스템들을 통하여 획득된 다양한 형식의 컴퓨터파일에 담겨진 특허 및 기술 정보를 컴퓨터를 이용하여 일정한 데이터구조를 갖는 특허 및 기술 정보 분석용 마스터테이블의 데이터로 자동변환시켜 주는 자료변환방법을 제공함을 그 목적으로 한다.
나아가, 본 발명은 위와 같은 자료변환방법을 컴퓨터에서 실행가능하게 해주는 프로그램이 기록된 컴퓨터용 기록매체를 제공함을 또 다른 목적으로 한다.
도 1은 본 발명에 의한 자료변환방법을 적용할 수 있는 시스템의 구성을 예시적으로 도시한 도면이다.
도 2는 본 발명에 의한 자료변환방법의 실행순서를 도시한 흐름도이다.
도 3은 특허자료 검색용 검색시스템으로부터 검색한 자료를 이용하여 기술주제별 마스터테이블을 구축하는 본 발명의 개념을 설명하기 위한 도면이다.
도 4는 검색결과를 다운로드받아 확보된 텍스트파일을 마스터테이블로 구축하는 방법을 구체적으로 도시한 도면이다.
도 5는 중복레코드가 존재하는 경우 중복레코드의 필드통합을 실행하는 개념을 도시한 도면이다.
도 6은 중복레코드가 존재하는 경우 중복레코드의 필드대체를 실행하는 개념을 도시한 도면이다.
도 7은 본 발명에 따른 자료변환방법을 수행시 컴퓨터모니터에 표시되는 주메뉴화면의 구성을 도시한다.
도 8은 도 7의 주메뉴화면에서 사용자가 '변환화일선택' 버튼을 실행하여 자료변환 대상파일을 선택하기 위한 화면을 도시한다.
도 9는 사용자가 자료변환 대상파일을 선택한 경우 그에 따른 자료변환의 실행개시를 묻기 위한 화면을 도시한다.
도 10은 자료변환의 실행을 모두 끝마친 후 그 변환결과를 나타내는 도면으로서 특히 중복레코드가 없는 경우를 도시한다.
도 11은 자료변환의 실행을 모두 끝마친 후 그 변환결과를 나타내는 도면으로서 특히 중복레코드가 있는 경우를 도시한다.
도 12는 도 11의 화면에서 변환파일명을 더블클릭한 경우 중복된 레코드의 리스트를 화면에 부가표시하는 도면이다.
<도면의 주요부분에 대한 부호의 설명>
100A : 특허자료 검색시스템 100B : 기술논문 검색시스템
100C : 시디-롬 130 : 컴퓨터 본체
140 : 모니터 150 : 입력수단
160 : 보조기억수단 400 : 텍스트파일
410 : 어레이 420 : 마스터테이블
본 발명의 첫번째 목적을 달성하기 위한 본 발명에 따르면, 기술자료검색 텍스트파일을 특허 및 기술 정보 분석용 마스터테이블로 변환하는 자료변환방법은, 적어도 중앙연산처리장치와 메모리와 보조기억수단을 구비한 컴퓨터본체, 컴퓨터모니터, 입력수단을 구비한 컴퓨터시스템에 있어서,
상기 컴퓨터모니터에는 적어도 사용자가 기술주제를 신규로 설정하거나 기설정된 기술주제를 선택할 수 있는 기술주제설정메뉴, 사용자가 선택한 기술주제에 대응하는 마스터테이블의 데이터내용을 디스플레이해주는 윈도우, 상기 마스터테이블로 변환입력시켜야 할 검색데이타를 포함하고 있는 변환대상 텍스트파일을 선택할 수 있는 파일선택메뉴를 구비한 화면을 표시해주는 제1 단계;
사용자가 선택한 기술주제에 대응되는 마스터테이블이 보조기억수단에 존재하면 그 마스터테이블을 열고, 존재하지 않으면 동일한 데이터구조를 갖는 신규 마스터테이블을 생성한 후 그 마스터테이블을 여는 제2 단계;
사용자가 상기 파일선택메뉴를 통해 선택한 상기 변환대상 텍스트파일을 상기 보조기억수단에서 찾아서 변환가능한 파일인지를 파일구분자를 이용하여 검사하는 제3 단계;
변환가능한 파일이면 상기 변환대상 텍스트파일에 대응하는 소정의 변환모듈을 인이에블시켜 상기 변환대상 텍스트파일을 여는 제4 단계;
상기 변환대상 텍스트파일을 라인단위로 파싱(parsing)하여 필드구분자를 찾고, 레코드구분자를 만날 때까지 각 필드구분자에 대응되는 필드데이타들을 어레이에 임시저장하고, 상기 어레이에 저장된 레코드데이타를 상기 마스터테이블에 임포트(import)시키는 제5 단계; 및
상기 제5 단계를 상기 텍스트파일의 끝을 만날 때까지 반복하는 제6 단계를 구비하여, 상기 변환대상 텍스트파일은 적어도 하나 이상의 특허 기술 검색시스템의 검색기능을 이용하여 얻어진 것이며, 각 검색시스템별로 얻어진 변환대상 텍스트파일은 서로 상이한 포맷을 가질 수 있는 것을 특징으로 하는 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료변환방법이 제공된다.
상기 자료변환방법은 상기 제5 단계의 실행중, 상기 어레이에 저장된 레코드데이타와 중복되는 레코드가 상기 마스터테이블에 존재하는지를 검사하는 중복검사단계를 더 구비한다. 이를 위해, 상기 제1 단계에 관련된 상기 컴퓨터모니터의 화면은 상기 어레이에 저장된 레코드데이타와 중복되는 레코드가 상기 마스터테이블에 존재하는 경우 이를 처리하는 기준을 설정하는 중복처리메뉴를 더 구비하며, 상기 중복처리메뉴는, 상기 어레이와 상기 마스터테이블간에 레코드 중복이 검출될 경우, 상기 어레이가 저장하고 있는 필드데이타들중 상기 마스터테이블에는 널(null)인 필드에 대응하는 필드데이타들만을 상기 마스터테이블에 통합(merge)할 것을 지정하는 통합버튼(merge button)과 상기 마스터테이블와 상기 어레이 사이의 널이 아닌 중복필드가 존재하면 상기 마스터테이블의 중복필드를 상기 어레이에 저장된 필드데이타로 대체할 것을 지정하는 대체버튼(replace button)을 구비한다.
본 발명의 다른 목적을 달성하기 위한 본 발명에 따르면, 적어도 중앙연산처리장치와 메모리와 보조기억수단을 구비한 컴퓨터본체, 컴퓨터모니터, 입력수단을 구비한 컴퓨터시스템에 적용가능하며,
상기 컴퓨터모니터는 적어도 사용자가 기술주제를 신규로 설정하거나 기설정된 기술주제를 선택할 수 있는 기술주제설정메뉴, 사용자가 선택한 기술주제에 대응하는 마스터테이블의 데이터내용을 디스플레이해주는 윈도우, 상기 마스터테이블로 변환입력시켜야 할 검색데이타를 포함하고 있는 변환대상 텍스트파일을 선택할 수 있는 파일선택메뉴를 구비한 화면을 표시해주게 하고,상기 변환대상 텍스트파일은 적어도 하나 이상의 특허 기술 검색시스템의 검색기능을 이용하여 얻어진 것이며, 각 검색시스템별로 얻어진 변환대상 텍스트파일은 서로 상이한 포맷을 가질 수 있으며,
사용자가 선택한 기술주제에 대응되는 마스터테이블이 보조기억수단에 존재하면 그 마스터테이블을 열고, 존재하지 않으면 동일한 데이터구조를 갖는 신규 마스터테이블을 생성한 후 그 마스터테이블을 열며,
사용자가 상기 파일선택메뉴를 통해 선택한 상기 변환대상 텍스트파일을 상기 보조기억수단에서 찾아서 변환가능한 파일인지를 파일구분자를 이용하여 검사하며,
변환가능한 파일이면 상기 변환대상 텍스트파일에 대응하는 소정의 변환모듈을 인이에블시켜 상기 변환대상 텍스트파일을 열고,
상기 변환대상 텍스트파일을 라인단위로 파싱(parsing)하여 필드구분자를 찾고, 레코드구분자를 만날 때까지 각 필드구분자에 대응되는 필드데이타들을 어레이에 임시저장하고, 상기 어레이에 저장된 레코드데이타를 상기 마스터테이블에 임포트(import)시키며, 이 과정을 상기 텍스트파일의 끝을 만날 때까지 반복하므로써,
기술자료검색 텍스트파일을 특허정보 분석용 마스터테이블로 자동변환시켜주는 기능을 갖는 프로그램이 기록된 컴퓨터용 기록매체를 제공한다.
상기 컴퓨터용 기록매체는 시디-롬(CD-ROM)이 될 수 있다.
이하에서는 첨부한 도면을 참조하여 본 발명의 바람직한 실시예에 관하여 상세하게 설명하기로 한다.
도 1은 본 발명에 의한 자료변환방법을 적용할 수 있는 시스템의 구성을 예시한 도면이며, 도 3은 도 1에 도시된 특허/기술자료 검색용 시디-롬이나 컴퓨터통신을 통해 억세스한 특허/기술자료 검색시스템으로부터 검색한 자료를 이용하여 기술주제별 마스터테이블을 구축하는 본 발명의 개념을 설명하기 위한 도면이다. 또한, 도 4는 검색결과를 다운로드받아 보조기억수단에 미리 저장된 텍스트파일을 본 발명에 의한 자료변환방법을 이용하여 마스터테이블로 자동으로 변환하는 방법을 구체적으로 도시한 도면이다.
본 발명에 의한 자료변환방법을 실행하기 위해서는, 특허/기술자료 검색용 데이타베이스(300)로부터 다운로드받은 텍스트파일(310)을 마스터테이블(320)로 자동변환하기 위하여, 적어도 컴퓨터 모니터(140), 하드디스크와 같은 보조기억수단(160), 키보드 및 마우스 등과 같은 입력수단(150), 그리고 중앙연산처리장치(CPU)(132) 및 메인메모리(134) 등과 같은 자원을 구비한 통상의 컴퓨터장치를 필요로 한다. 위 컴퓨터장치는, 텍스트파일(310)을 특허/기술자료 검색용 데이터베이스(300)를 포함하는 특허/기술자료 검색시스템(100A, 100B) 및 시디-롬(100C)으로부터 다운로드받기 위해, 컴퓨터통신을 가능하게 해주는 모뎀(110)및 시디-롬(100C)을 구동하기 위한 시디-롬 드라이버(120)를 더 구비하면 편리하다.
도 1에 예시된 컴퓨터장치를 이용하여 본 발명이 추구하는 마스터테이블(320)로 자료변환을 실행하기 위해서는 우선, 특허/기술자료 검색용 데이터베이스(300)를 이용하여 자료변환 대상인 텍스트파일(310)을 다운로드 받아 보조기억수단(160)에 저장해두어야 한다. 따라서, 컴퓨터통신 혹은 시디-롬을 통하여 서비스되는 상기 검색시스템(100A, 100B, 100C)들은 변환대상 텍스트파일(310)이 적어도 하나 이상의 레코드를 포함하도록 하고 레코드가 복수개의 필드구분자(404)들과 이들 필드구분자(404)에 대응하는 필드데이타(406)들로 구성되도록 하며 필드구분자(404)들과 필드데이타(406)들을 일정한 규칙에 따라 변환대상 텍스트파일내에 기록하는 텍스트파일 출력기능을 가지는 검색시스템이어야 한다. 본 발명이 적용가능한 특허자료 검색시스템의 예로서는, 한국, 일본, 미국 및 유럽특허청의 홈페이지에서 제공해주는 각국의 특허검색서비스 시스템외에도, QPAT, KIPRIS, PATROM Windows 5.0 버젼, KINITI-IR 한국공개특허/실용, PatentView CD, PAJ-CD, DACOM-DERWENT WPI, KINITI-IR WPI, Dialog DB (348번, 347번, 351번), IBM 미국특허 검색시스템 등이며, 기술논문자료 검색시스템의 예로서는 FSTA, MEDLINE, Food & Human Nutrition, KFRI-문헌정보, JOIS, COMPENDEX, SAE Paper 등이다. 사용자에게 편리성을 제공해주기 위해 본 발명이 적용될 수 있는 검색시스템에 관한 정보는 도 7에 도시된 메인메뉴화면의 하단에 표시해준다. 본 발명이 적용가능한 검색시스템은 계속적으로 추가가 가능하다. 한편, 도 7에 도시된 메인메뉴 화면에는 기술자료 검색시스템이 인터넷웹(internet web)상에서 서비스되는 것인 경우에는 사용자의 컴퓨터를 바로 해당 검색시스템의 홈페이지에 연결시켜주는 연결버튼(740)을 더 마련한다.
사용자는 이들 검색시스템을 이용하여, 도 3에 도시된 바와 같이, 기술주제별로 특허/기술자료를 검색하여 텍스트파일을 미리 다운로드를 받아둔다. 예컨데, 특허 데이터베이스(A)로부터 DRAM에 관한 특허자료를 파일(S)로, 그리고 텔레비젼에 관한 특허자료를 파일(B)로 각각 다운로드 받는다. 또한 특허 데이터베이스(B)로부터는 DRAM에 관한 특허자료를 파일(K)로 다운로드를 받으며, 기술자료 데이터베이스(N)로부터 텔레비젼기술에 관한 논문검색자료를 파일(A)로 다운로드 받는다. 이와 같이 다운로드 받은 파일들(A, B, K, S)은 보조기억수단(160)에 저장되어 있어야 한다.
다운로드받은 텍스트파일들은 검색시스템들의 출력기능에 따라 다양한 형태의 파일구조를 가지며, 그 파일을 열어 포함된 문자정보를 취할 수 있는 한 파일의 종류 내지 형식이 단순 텍스트파일로 제한되지 않는다. 예컨데, 상기 텍스트파일에는 하이퍼 텍스트파일의 형식을 갖는 것도 가능하다. 따라서, 다양한 파일구조의 텍스트파일들을 동일 데이터구조의 마스터테이블(320)로 자료변환을 위해서는 각 검색시스템별로 텍스트파일의 파일구조를 분석하여 텍스트파일에 쓰여진 단어나 표시자들중에서 파일구분자(408), 레코드구분자(402) 및 필드구분자(404)를 미리 정의해두어야 한다. 여기서, 파일구분자(408)라 함은 검색시스템을 유니크하게 대표할 수 있는 단어나 표시자이어야 한다. 예컨데, QPAT의 미국특허 검색시스템을 이용하여 다운로드 받은 텍스트파일에는 'United States Patent'라는 단어가 한 레코드안에 규칙적으로 존재하면서 다른 검색시스템에 의해 다운로드 받은 텍스트파일에는 포함되지 않은 단어이므로 이를 파일구분자로 할 수 있다. 또 다른 예로 KINITI-IR의 한국공개특허 검색시스템을 이용하여 다운로드 받은 텍스트파일에는 'KUPA'라는 단어가 파일구분자로 활용할 수 있을 것이다. 위에서 예로 들은 파일구분자들은 앞서 설명한 조건을 만족하는 한 다른 단어나 표시자를 이용할 수 도 있음은 물론이다. 레코드는 특허자료 1건에 관련된 필드정보들, 예컨데, 출원번호, 출원일자, 우선권번호, 우선권주장일, 발명의 명칭, 발명자, 출원인, 국제특허분류, 특허번호, 초록, 검색어, 청구범위 등과 같은 필드구분자(404)들에 각각 짝지워져 기록된 실제 데이타들(406)의 집합을 의미하며, 이들 레코드는 하나의 텍스트파일(310)내에 적어도 한 개 이상이 포함되어 있다. 복수개의 레코드를 각각 레코드단위로 자료변환을 하기 위해서는 레코드구분자(402)를 정의해두어야 한다. 레코드구분자(402)는 상기 파일구분자(408)가 레코드단위로 반복되는 경우에는 그 파일구분자를 레코드구분자로 사용할 수 있을 것이며, 그렇지 않는 경우에는 첫 번째 필드구분자(F1)를 레코드구분자로 사용할 수도 있을 것이다. 필드구분자(404)들은 텍스트파일(310)내에서 필드데이타들(406)과 짝을 이루어 기록되어 있으므로 텍스트파일을 분석하면 용이하게 정의할 수 있을 것이다.
마스터테이블(320)의 구조는 '표 1' 에 예시한 구조로 할 수 있다.
필드 이름 데이터 형식 필드크기 설 명 비 고
ANMP 문자열 12 출원번호 기본키
ADMP 날짜/시간 출원일자
ANPR(1-3) 문자열 15 우선권번호
ADPR(1-3) 날짜/시간 우선권주장일
ACO 문자열 2 우선권주장국가코드
CO 문자열 2 국가코드
PT 문자열 8 특허분류
TI 문자열 200 발명의 명칭
IV(1-3) 문자열 20 발명자
PA(1-3) 문자열 50 출원인
PC(1-3) 문자열 13 국제특허분류
TC 문자열 4 기술코드
PN 문자열 12 공개번호
PD 날짜/시간 공개일자
PNE 문자열 12 공고번호
PDE 날짜/시간 공고일자
RN 문자열 12 등록번호
RD 날짜/시간 등록일자
GR 문자열 1 중요도
CR 문자열 50 권리상황
RF 문자열 250 검토의견
ECV 문자열 3 저촉예측값
TS 문자열 20 Tempst
RCI 문자열 200 대응특허
AB 메모 초록
EC 메모 청구범위
CP 문자열 200 인용특허
DS 문자열 200 지정국
KW 문자열 100 키워드
PT_FG 예/아니오 특허/논문여부 특허 : 예
AP 문자열 20 관련특허(중복체크)
INSERT_DT 날짜/시간 자료입력일
UPDATE_DT 날짜/시간 자료수정일
'표 1'에 데이터구조는 보다 유용한 특허정보의 관리, 가공 및 분석을 위해 포괄적으로 작성한 것으로, 이 데이터구조는 필요에 따라 변화를 가할 수도 있을 것이다.
이상과 같은 준비를 전제로 하여, 본 발명에 의한 자료변환방법은 도 2에 도시된 실행순서에 의거하여 자료변환을 수행한다. 도 7 내지 도 12는 자료변환의 각단계별로 모니터(140)에 표시되는 화면 구성을 도시한다.
우선, 기술주제별로 마스터테이블을 선택하는 단계(S100)를 수행한다. 이는 도 7에 도시된 메인메뉴에서 수행한다. 즉, 사용자는 기술주제설정메뉴(700)를 통해 원하는 기술주제에 해당하는 마스터테이블의 이름을 설정한다. 마우스를 이용하여 기술주제설정메뉴(700)를 클릭하여 이미 존재하는 이름을 선택하거나 혹은 신규 이름을 입력한다. 기존 이름을 선택하면 그 이름에 대응하는 마스터테이블(320)을 보조기억수단(160)으로부터 오픈하며, 신규 이름을 입력한 경우에는 '표 1'의 데이터구조를 갖는 마스터테이블을 새로이 보조기억수단에 생성한다. 예컨데, 'EDLC'라는 이름을 갖는 기존의 마스터테이블을 설정하면 'EDLC' 마스터테이블이 가지고 있는 데이타내용이 마스터테이블창(710)에 표시된다. 설정된 마스터테이블은 데이터입력 또는 갱신이 가능한 인에이블상태로 전환된다.
이와 같은 상태에서, 사용자가 메인메뉴의 하단에 마련된 '변환화일선택버튼'(730)을 마우스로 클릭하면, 도 8과 같이 자료변환 대상인 텍스트파일을 선택하기 위한 파일선택창(800)이 표시된다. 사용자는 파일선택창(800)을 통해 보조기억수단에 미리 다운로드 받아 저장되어 있는 텍스트파일을 선택하고 '열기' 버튼을 클릭하여 실행하면 도 9와 같이 선택한 텍스트파일명(예 : PAJ01.txt)과 이 파일을 출력해준(export) 검색시스템의 이름(예: PAJ-CD 일본특허)을 표시하여 사용자의 확인을 구하기 위한 확인창(900)을 표시한다(S110).
사용자가 확인창(900)의 확인버튼을 마우스로 클릭하면, 컴퓨터장치는 사용자가 선택한 텍스트파일(400)을 보조기억수단(160)에서 찾아 그 파일을 열고 파일의 처음부터 라인단위로 파싱(parsing)하여 파일구분자를 찾는 작업을 수행하므로써 선택된 텍스트파일(400)이 변환가능한 파일인지를 검사한다(S120). 이 검사를 위해 보조기억수단(160)에는 변환가능한 파일의 파일구분자들을 모아둔 파일구분자 리스트를 미리 저장해두거나 혹은 이 파일구분자 리스트를 프로그램내에 직접 정리해두던지 해야 한다. 결국, 라인단위로 파싱하여 얻어진 단어들을 파일구분자테이블의 내용과 비교하므로써 위 검사의 목적은 달성될 수 있다.
검사결과 파싱된 단어들이 상기 파일구분자 리스트에 기록된 단어가 아니면 자료변환이 불가능하다는 뜻을 메시지로 표시하고 프로그램의 실행을 종료한다(S130).
그러나, 자료변환이 가능한 경우에는 변환대상인 텍스트파일(400)의 종류에 대응하는 변환모듈을 인에이블 시킨다(S140). 변환모듈은 검색시스템별로 마련한다. 즉, 텍스트파일의 구조가 다르면 별도의 변환모듈을 적용하여 자료변환을 한다. 도 7의 하부에는 '사용가능한 DB명'을 나타내는 창(720) 즉, 자료변환이 가능한 텍스트파일을 다운로드시켜주는 검색시스템의 목록을 나타내는 창이 제공되는데, 이 목록에 열거된 검색시스템별로 별도의 변환모듈을 마련해둔다.
인에이블된 변환모듈은 다시 텍스트파일(400)을 연 다음 라인단위로 파싱해나가면서 하나의 레코드에 해당하는 필드데이타들(406)을 메모리(134)에 설정된 어레이(410)에 임시로 저장한다(S150). 여기서, 어레이에의 임시저장은 마스터테이블에 데이터를 임포트(import)하는 속도를 향상시키기 위한 방편으로 활용된다. 데이터를 어레이에 임시저장하는 과정을 생략하고 곧바로 마스터테이블로 임포트시키는것도 가능하다. 마스터테이블이 데이터베이스 형식을 가지므로 어레이를 활용하지 않으면, 각 필드데이타를 임포트할 때마다 마스터테이블의 열기와 닫기를 반복하여야 하고 그 결과 데이터처리 속도가 느려지는 문제가 생길 수 있으며, 마스터테이블의 엔진의 기능에 따라 그 영향은 달라질 수 있다. 인에이블된 변환모듈은 우선 파싱되는 텍스트파일(400)의 내용으로부터 레코드구분자(408)를 찾아 레코드의 시작을 알아낸다. 그후 계속적인 파싱을 수행해나가면서 필드구분자(F1, F2, ... , Fi, ..)(404)를 찾고 그에 대응되는 필드데이타(FD1, FD2, ... , FDi, ..)를 읽어서 어레이(410)에 저장한다. 이후, 어레이(410)에 저장된 하나의 레코드에 관한 데이터(FD1, FD2, ... , FDi, ..)는 마스터테이블(420)로 임포트시킨다(S190).
이와 같은 어레이에의 저장에서 마스터테이블로의 임포트까지의 과정은 파일의 마지막을 만나지 않는 한 다음번 레코드구분자(409)를 만날 때까지 순환적으로 반복한다(S160, S190, S220, S150 루프). 여기서, 텍스트파일(400)의 파싱된 내용중 무엇이 레코드구분자(408)이고 무엇이 필드구분자(404) 인지는 상설한 파일구분자 검사방법과 같은 방법을 이용한다. 즉, 레코드구분자 리스트 및 필드구분자 리스트를 보조기억수단(160)에 미리 저장해두거나 각 변환모듈이 이에 관한 정보를 가지게 하여 파싱된 단어와 위 정보를 비교하여 그 단어가 레코드 또는 필드구분자인지를 알아낸다.
어레이(410)에 저장된 레코드와 중복되는 레코드가 마스터테이블(420)에 존재하는 지를 검사하여 그 결과에 따른 일정한 처리를 하는 중복레코드 처리기능을 부가하려면, 레코드 구분자를 검사하는 단계(S160)와 파일의 마지막을 만났는 지를검사하는 단계(S200) 사이에서 그 절차(S170, S180, S190)를 수행하면 된다.
중복된 레코드를 처리하는 방안은 크게 세가지로 나눌 수 있다. 첫째는 중복레코드는 마스터테이블에 임포트시키지 않는 방안(스킵 모드), 둘째는 중복레코드를 마스터테이블에 임포트시키되 어레이(410)에 저장된 필드데이타들중 마스터테이블(420)의 어느 필드가 널(null)인 경우에만 그 필드에 대응하는 어레이의 필드데이타를 마스터테이블(420)로 통합(merge)시키는 방안(통합 모드), 셋째는 마스터테이블(420)과 어레이(410) 간에 널(null)이 아닌 중복필드가 존재할 경우 마스터테이블(420)의 중복필드의 데이터를 어레이(410)의 중복필드 데이터로 대체(replace)시키는 방안(대체 모드)이 있을 수 있다.
이들 방안을 구현하기 위해, 도 7에 도시된 메인메뉴의 하단부에는 '통합(merge)' 버튼(750)과 '대체(replace)' 버튼(760)을 마련한다. 사용자는 '통합(merge)' 버튼(750) 및 '대체(replace)' 버튼(760) 중 어느 하나를 택일할 수 있고, 그 선택된 방안대로 중복레코드의 처리가 이루어진다. 아무 버튼도 선택하지 않을 경우에는 위 첫째 방안으로 처리하도록 한다. 텍스트파일와 마스터테이블간, 결국 어레이에 저장된 레코드와 마스터테이블간에 레코드 중복이 검출될 경우, '통합' 버튼(750)은 텍스트파일내의 중복된 레코드의 필드데이타들중 마스터테이블에는 널(null)인 필드에 대응하는 필드데이타들만을 마스터테이블에 통합(merge)할 것을 지정한다. '대체' 버튼(760)이 선택되면 텍스트파일내의 중복된 레코드의 필드데이타 전부를 상기 마스터테이블의 해당 필드에 임포트하여 마스터테이블의 기존 데이타를 대체할 것을 지정하게 된다.
도 5는 중복레코드가 존재하는 경우 중복레코드의 통합(merge)을 실행하는 개념을 도시한 도면이며, 도 6은 중복레코드가 존재하는 경우 중복레코드의 교체(replace)를 실행하는 개념을 도시한 도면이다. 도 5와 도 6은, 특허 데이터베이스(A)(500)를 통해 다운로드받은 텍스트파일을 이용하여 마스터테이블(520)을 일차적으로 구축한 다음, 다른 특허 데이터베이스(B)(510)를 통해 다운로드받은 동일한 기술주제에 관한 텍스트파일을 이용하여 상기 마스터테이블(520)의 내용을 갱신하고자 하는 경우를 가정한다.
여기서, 사용자가 '통합(merge)' 버튼(750)을 선택해두었으면, 변환모듈은 이를 확인하고(S170), 어레이(410)에 저장된 특허 데이터베이스(B)로부터 기원한 필드데이타들 중 '공고번호'와 '초록' 필드데이타를 마스터테이블(520)의 해당 레코드에 추가시킨다(S190).
만약, 사용자가 '대체(replace)' 버튼(760)을 선택해둔 경우에는 변환모듈은 역시 이를 확인하고(S170), 마스터테이블(620)에 저장되어 있는 특허 데이터베이스(A)로부터 획득된 필드데이터 중 특허 데이터베이스(B)의 데이터와 중복되는 필드데이타(예: 초록(A))는 특허 데이터베이스(B)의 필드데이타(예: 초록(A'))로 교체시킨다(S190). 따라서, 교체후의 마스터테이블(630)은 '출원번호'와 '청구범위'의 데이터내용은 특허 데이터베이스(A)로부터 취득한 것이며, '초록'의 데이터는 특허 데이터베이스(B)로부터 취득한 것이 된다.
한편, 사용자가 '통합(merge)' 버튼(750) 및 '대체(replace)' 버튼(760) 중 어느 것도 선택하지 않았으면, 어레이를 리셋시켜 임시저장된 데이터를유실시키고(S180), 파일의 마지막을 만났는 지를 검사하면서(S200) 다음 레코드의 필드데이터를 다시 파싱하여 어레이에 저장하는 절차를 수행한다(S150).
한편, 어레이에 데이터를 임시 저장하는 절차를 생략하더라도 위에서 설명한 중복 레코드의 처리는 가능하다. 즉, 텍스트파일에서 라인을 파싱하면서 찾아낸 특정 레코드의 키 필드 데이터와 마스터테이블에 저장된 키필드 데이터를 서로 비교하여 양자의 동일 여부를 검사하므로써 중복여부를 확인할 수 있다. 중복이 확인된 레코드의 처리 즉, 스킵 모드, 통합 모드 및 대체 모드는 상설한 바와 같이 사용자에 의한 설정조건에 따른다.
이를 상설하면, 통합모드가 선택된 경우, 텍스트파일내의 중복된 레코드의 필드데이타들중 마스터테이블에는 널(null)인 필드에 대응하는 필드데이타들만을 상기 마스터테이블에 통합(merge)한다. 대체 모드의 경우에는 텍스트파일내의 중복된 레코드의 필드데이타 전부를 마스터테이블의 해당 필드에 임포트하여 마스터테이블의 기존 데이타를 대체한다. 상기 통합버튼과 상기 대체버튼중 어느 것도 선택되지 않으면 스킵 모드가 되므로 중복되는 텍스트파일의 레코드는 마스터테이블로 임포트(import)하지 않고 버린다.
이와 같은 인에이블된 변환모듈에 의한 자료변환과정(S150에서 S200)은 텍스트파일(400)의 끝을 만날 때까지 레코드단위별로 반복적으로 실행한다. 파싱동작중 텍스트파일(400)의 끝을 만나면, 도 10에 도시된 바와 같이 자료변환의 결과를 모니터에 표시한다(S210). 즉, 변환대상이 된 텍스트파일명, 이 텍스트파일을 다운로드받은 검색시스템명, 변환된 레코드건수 및 중복이 발생한 레코드건수 등에 관한정보를 보고한다. 도 10은 중복이 하나도 일어나지 않은 경우를 의미한다. 만약, 이미 자료변환과정을 거친 텍스트파일을 한 번 더 자료변환을 실행하면 전체 레코드가 중복이 발생할 것인데, 이 경우를 도 11이 도시하고 있다. 중복된 레코드에 관한 구체적인 정보를 알고 싶을 경우에 대비하여, 도 11의 화면에서 변환파일명을 더블클릭한 경우 중복된 레코드의 출원번호 리스트 등이 화면에 부가표시되는 데, 도 12는 이를 도시하고 있다.
이상과 같은 자료변환방법은 컴퓨터 프로그램으로 구현가능하며, 이를 예컨데, 시디-롬(CD-ROM)과 같은 기록매체에 기록해두면 범용적이고 편리한 사용이 가능할 것이다. 또한, 변환대상 텍스트파일을 한 번에 하나씩 선택하여 위와 같이 자료변환 할 수도 있지만, 텍스트파일을 한 번에 복수개 선택하여 각 텍스트파일을 순차적으로 자료변환 할 수도 있다.
이상과 같은 본 발명의 자료변환방법을 이용하면, 다종다양한 특허 또는 기술 자료 검색시스템으로부터 검색결과를 다운로드받아 획득된 텍스트파일을 기술주제별로 동일한 마스터테이블로 구축할 수 있다. 기술주제별로 구축된 마스터테이블은 이후 추가 검색된 자료를 이용하여 갱신하므로써 그 내용을 보다 풍부하게 할 수 있다. 나아가, 마스터테이블이 일정한 데이터구조로 정리되어 있으므로 특허 또는 기술 정보 분석기능의 부가가 용이하여 예컨데, 특허맵(patent map)의 작성이나 각종 통계자료를 추출하는 데 편리하게 활용할 수 있다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims (21)

  1. 중앙연산처리장치와 메모리와 보조기억수단을 구비한 컴퓨터본체, 컴퓨터모니터, 입력수단을 구비한 컴퓨터시스템에 있어서,
    상기 컴퓨터모니터에는 사용자가 기술주제를 신규로 설정하거나 기설정된 기술주제를 선택할 수 있는 기술주제설정메뉴와 상기 마스터테이블로 변환입력시켜야 할 검색데이타를 포함하고 있는 변환대상 텍스트파일을 선택할 수 있는 파일선택메뉴를 구비한 화면을 표시해주는 제1 단계;
    사용자가 상기 기술주제설정메뉴를 통해 선택한 기술주제에 대응되는 마스터테이블이 보조기억수단에 존재하면 그 마스터테이블을 열고, 존재하지 않으면 동일한 데이터구조를 갖는 신규 마스터테이블을 생성한 후 그 마스터테이블을 여는 제2 단계;
    사용자가 상기 파일선택메뉴를 통해 선택한 상기 변환대상 텍스트파일을 상기 보조기억수단에서 찾아서 변환가능한 파일인지를 파일구분자를 이용하여 검사하는 제3 단계;
    변환가능한 파일이면 상기 변환대상 텍스트파일에 대응하는 소정의 변환모듈을 인이에블시켜 상기 변환대상 텍스트파일을 여는 제4 단계;
    상기 변환대상 텍스트파일을 라인단위로 파싱(parsing)하여 필드구분자를 찾고, 레코드구분자를 만날 때까지 각 필드구분자에 대응되는 필드데이타들을 상기 마스터테이블에 임포트(import)시키는 제5 단계; 및
    상기 제5 단계를 상기 텍스트파일의 끝을 만날 때까지 반복하는 제6 단계를 구비하여, 상기 변환대상 텍스트파일은 적어도 하나 이상의 특허 기술 검색시스템의 검색기능을 이용하여 얻어진 것이며, 각 검색시스템별로 얻어진 변환대상 텍스트파일은 서로 상이한 포맷을 가질 수 있는 것을 특징으로 하는 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료변환방법.
  2. 제 1항에 있어서, 상기 변환대상 텍스트파일은 적어도 한 종류이상의 기술자료 검색시스템들로부터 검색결과를 다운로드받은 텍스트파일이며, 상기 기술자료 검색시스템은 상기 변환대상 텍스트파일이 적어도 하나 이상의 레코드를 포함하도록 하고 상기 레코드가 복수개의 필드구분자들과 상기 필드구분자에 대응하는 필드데이타들로 구성되도록 하며 상기 필드구분자들과 상기 필드데이타들이 일정한 규칙에 따라 상기 변환대상 텍스트파일내에 기록되도록 하는 텍스트파일 출력기능을 가지는 검색시스템임을 특징으로 하는 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료변환방법.
  3. 제 1항에 있어서, 상기 제 3 단계의 변환대상 텍스트파일을 복수개 선택하여 각 텍스트파일을 순차적으로 한꺼번에 자료변환 할 수 있음을 특징으로 하는 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료변환방법.
  4. 제 1항에 있어서, 상기 제1 단계의 상기 컴퓨터모니터의 화면은 상기 기술자료 검색시스템이 인터넷웹(internet web)상에서 서비스되는 것인 경우에는 사용자의 컴퓨터를 바로 해당 검색시스템의 홈페이지에 연결시켜주는 연결버튼을 더 구비함을 특징으로 하는 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료변환방법.
  5. 제 1항에 있어서, 상기 파일구분자는 상기 변환대상 텍스트파일에 기록된 단어인 동시에 상기 변환대상 텍스트파일을 생성시키는 기술자료 검색시스템들 각각을 구분할 수 있는 대표어들 중에서 정하여짐을 특징으로 하는 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료변환방법.
  6. 제 1항에 있어서, 상기 방법은 상기 변환대상 텍스트파일의 종류에 각각 대응하는 적어도 하나 이상의 상기 변환모듈들을 구비함을 특징으로 하는 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료변환방법.
  7. 제 6항에 있어서, 상기 변환모듈들 각각은 그에 대응되는 변환대상 텍스트파일의 구조에 따라 개별적으로 정해진 상기 레코드구분자와 상기필드구분자에 관한 정보에 의거하여 파싱된 라인에 포함된 상기 필드구분자 및/또는 상기 레코드구분자를 찾음을 특징으로 하는 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료변환방법.
  8. 제 1항에 있어서, 상기 제1 단계에 관련된 상기 컴퓨터모니터의 화면은 상기 텍스트파일에 기록된 레코드데이타와 중복되는 레코드가 상기 마스터테이블에 존재하는 경우 이를 처리하는 기준을 설정하는 중복처리메뉴를 더 구비함을 특징으로 하는 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료변환방법.
  9. 제 8항에 있어서, 상기 자료변환방법은 상기 제5 단계의 실행중, 상기 텍스트파일에 기록된 레코드데이타와 중복되는 레코드가 상기 마스터테이블에 존재하는지를 검사하는 중복검사단계를 더 구비함을 특징으로 하는 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료변환방법.
  10. 제 9항에 있어서, 상기 자료변환방법은 상기 제 6단계를 수행한 다음, 상기 텍스트파일에 기록된 레코드데이타와 상기 마스터테이블에 이미 존재하고 있던 레코드데이타 간에 발생한 레코드의 중복에 관한 정보를 상기 컴퓨터모니터를 통해 표시해주는 단계를 더 구비함을 특징으로 하는 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료변환방법.
  11. 제 9항에 있어서, 상기 중복처리메뉴는, 상기 텍스트파일과 상기 마스터테이블간에 레코드 중복이 검출될 경우, 상기 텍스트파일내의 중복된 레코드의 필드데이타들중 상기 마스터테이블에는 널(null)인 필드에 대응하는 필드데이타들만을 상기 마스터테이블에 통합(merge)할 것을 지정하는 통합버튼(merge button)과, 상기 텍스트파일내의 중복된 레코드의 필드데이타 전부를 상기 마스터테이블의 해당 필드에 임포트하여 마스터테이블의 기존 데이타를 대체할 것을 지정하는 대체버튼(replace button)을 구비함을 특징으로 하는 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료변환방법.
  12. 제 11항에 있어서, 상기 통합버튼과 상기 대체버튼은 택일적으로 선택되는 버튼이며, 상기 통합버튼과 상기 대체버튼중 어느 것도 선택되지 않으면 중복되는 상기 텍스트파일의 레코드를 상기 마스터테이블로 임포트(import)하지 않음을 특징으로 하는 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료변환방법.
  13. 제 1항에 있어서, 상기 제 5 단계는 상기 각 필드구분자에 대응되는 필드데이타들을 어레이에 임시저장하고, 상기 어레이에 저장된 필드데이타들을 레코드단위로 상기 마스터테이블에 임포트시키는 절차를 더 거침을 특징으로 하는 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료변환방법.
  14. 제 13항에 있어서, 상기 제1 단계에 관련된 상기 컴퓨터모니터의 화면은 상기 어레이에 저장된 레코드데이타와 중복되는 레코드가 상기 마스터테이블에 존재하는 경우 이를 처리하는 기준을 설정하는 중복처리메뉴를 더 구비함을 특징으로 하는 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료변환방법.
  15. 제 14항에 있어서, 상기 자료변환방법은 상기 제5 단계의 실행중, 상기 어레이에 저장된 레코드데이타와 중복되는 레코드가 상기 마스터테이블에 존재하는지를 검사하는 중복검사단계를 더 구비함을 특징으로 하는 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료변환방법.
  16. 제 15항에 있어서, 상기 중복처리메뉴는, 상기 어레이와 상기 마스터테이블간에 레코드 중복이 검출될 경우, 상기 어레이가 저장하고 있는 필드데이타들중 상기 마스터테이블에는 널(null)인 필드에 대응하는 필드데이타들만을 상기 마스터테이블에 통합(merge)할 것을 지정하는 통합버튼(merge button)과, 상기 어레이에 저장된 중복된 레코드의 필드데이타 전부를 상기 마스터테이블의 해당 필드에 임포트하여 마스터테이블의 기존 데이타를 대체할 것을 지정하는 대체버튼(replace button)을 구비함을 특징으로 하는 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료변환방법.
  17. 제 16항에 있어서, 상기 통합버튼과 상기 대체버튼은 택일적으로 선택되는 버튼이며, 상기 통합버튼과 상기 대체버튼중 어느 것도 선택되지 않으면 상기 어레이를 리셋시켜 중복 레코드를 상기 마스터테이블에 임포트(import)하지 않음을 특징으로 하는 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료변환방법.
  18. 적어도 중앙연산처리장치와 메모리와 보조기억수단을 구비한 컴퓨터본체, 컴퓨터모니터, 입력수단을 구비한 컴퓨터시스템에 적용가능하며,
    상기 컴퓨터모니터는 적어도 사용자가 기술주제를 신규로 설정하거나 기설정된 기술주제를 선택할 수 있는 기술주제설정메뉴와 상기 마스터테이블로 변환입력시켜야 할 검색데이타를 포함하고 있는 변환대상 텍스트파일을 선택할 수 있는 파일선택메뉴를 구비한 화면을 표시해주게 하고,
    상기 변환대상 텍스트파일은 적어도 하나 이상의 특허 기술 검색시스템의 검색기능을 이용하여 얻어진 것이며, 각 검색시스템별로 얻어진 변환대상 텍스트파일은 서로 상이한 포맷을 가질 수 있으며,
    사용자가 상기 기술주제설정메뉴를 통해 선택한 선택한 기술주제에 대응되는 마스터테이블이 보조기억수단에 존재하면 그 마스터테이블을 열고, 존재하지 않으면 동일한 데이터구조를 갖는 신규 마스터테이블을 생성한 후 그 마스터테이블을 열며,
    사용자가 상기 파일선택메뉴를 통해 선택한 상기 변환대상 텍스트파일을 상기 보조기억수단에서 찾아서 변환가능한 파일인지를 파일구분자를 이용하여 검사하며,
    변환가능한 파일이면 상기 변환대상 텍스트파일에 대응하는 소정의 변환모듈을 인이에블시켜 상기 변환대상 텍스트파일을 열고,
    상기 변환대상 텍스트파일을 라인단위로 파싱(parsing)하여 필드구분자를 찾고, 레코드구분자를 만날 때까지 각 필드구분자에 대응되는 필드데이타들을 상기 마스터테이블에 임포트(import)시키며, 이 과정을 상기 텍스트파일의 끝을 만날 때까지 반복하므로써,
    기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 자동변환시켜주는 기능을 갖는 프로그램이 기록된 컴퓨터용 기록매체.
  19. 제 18항에 있어서, 상기 프로그램은 상기 파싱동작 후 상기 임포트동작 전 상기 텍스트파일에 기록된 레코드데이타와 중복되는 레코드가 상기 마스터테이블에 존재하는지를 검사하고, 중복된 레코드는 버리거나 마스터테이블의 해당 레코드에 통합시키거나 상기 해당레코드를 대체하는 것 중 어느 하나의 방안중 사용자가 설정한 어느 하나의 방안에 따라 처리하는 중복처리기능을 더 구비함을 특징으로 하는 컴퓨터용 기록매체.
  20. 제 18항에 있어서, 상기 프로그램은 상기 파싱동작 후 상기 임포트동작 전에, 상기 각 필드구분자에 대응되는 필드데이타들을 어레이에 임시저장하고, 상기 어레이에 저장된 필드데이타들을 레코드단위로 상기 마스터테이블에 임포트시키는 절차를 더 수행함을 특징으로 하는 컴퓨터용 기록매체.
  21. 제 18항 내지 제 20항 중 어느 하나의 항에 있어서, 상기 컴퓨터용 기록매체는 시디-롬(CD-ROM)임을 특징으로 하는 컴퓨터용 기록매체.
KR1019990006685A 1999-02-27 1999-02-27 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료 변환방법 KR100323607B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990006685A KR100323607B1 (ko) 1999-02-27 1999-02-27 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료 변환방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990006685A KR100323607B1 (ko) 1999-02-27 1999-02-27 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료 변환방법

Publications (2)

Publication Number Publication Date
KR20000056924A KR20000056924A (ko) 2000-09-15
KR100323607B1 true KR100323607B1 (ko) 2002-03-02

Family

ID=19575293

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990006685A KR100323607B1 (ko) 1999-02-27 1999-02-27 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료 변환방법

Country Status (1)

Country Link
KR (1) KR100323607B1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010037609A (ko) * 1999-10-19 2001-05-15 전주범 특허 맵 생성 방법 및 장치
KR20040039994A (ko) * 2002-11-05 2004-05-12 사단법인 고등기술연구원 연구조합 특허정보 검색사이트로부터의 특허정보의 수집과 수집된정보에 대한 사용자 키워드 등록방법
KR100743150B1 (ko) * 2004-05-17 2007-07-27 재단법인서울대학교산학협력재단 작성 목적에 따른 기술 로드맵 자동 생성 시스템
KR20060114569A (ko) * 2005-05-02 2006-11-07 (주) 위즈도메인 특허정보시스템의 작동방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06231141A (ja) * 1993-01-29 1994-08-19 Hitachi Software Eng Co Ltd パテントマップ作成支援システム
JPH08221435A (ja) * 1995-02-14 1996-08-30 Hitachi Ltd 特許マップ生成方法
KR970076333A (ko) * 1997-06-10 1997-12-12 배순훈 검색 시스템에서 특허 검색 결과를 특허 지도로 매핑하기 위한 방법
WO1998055945A1 (en) * 1997-06-02 1998-12-10 Aurigin Systems, Inc. System, method and computer program product for patent-centric and group-oriented data processing, including using hyperbolic trees to visualize data
JPH1139330A (ja) * 1997-07-22 1999-02-12 Hitachi Ltd 情報検索システムにおける処理支援方法及び情報検索システムにおける処理支援プログラムを記録した記録媒体
JPH11353313A (ja) * 1998-05-23 1999-12-24 Lg Electronics Inc 情報検索方法及び情報自動分類方法並びに情報分析方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06231141A (ja) * 1993-01-29 1994-08-19 Hitachi Software Eng Co Ltd パテントマップ作成支援システム
JPH08221435A (ja) * 1995-02-14 1996-08-30 Hitachi Ltd 特許マップ生成方法
WO1998055945A1 (en) * 1997-06-02 1998-12-10 Aurigin Systems, Inc. System, method and computer program product for patent-centric and group-oriented data processing, including using hyperbolic trees to visualize data
KR970076333A (ko) * 1997-06-10 1997-12-12 배순훈 검색 시스템에서 특허 검색 결과를 특허 지도로 매핑하기 위한 방법
JPH1139330A (ja) * 1997-07-22 1999-02-12 Hitachi Ltd 情報検索システムにおける処理支援方法及び情報検索システムにおける処理支援プログラムを記録した記録媒体
JPH11353313A (ja) * 1998-05-23 1999-12-24 Lg Electronics Inc 情報検索方法及び情報自動分類方法並びに情報分析方法

Also Published As

Publication number Publication date
KR20000056924A (ko) 2000-09-15

Similar Documents

Publication Publication Date Title
US11972203B1 (en) Using anchors to generate extraction rules
US11068452B2 (en) Column-based table manipulation of event data to add commands to a search query
CN100541493C (zh) 用于结构化文档管理的装置和方法
US10061824B2 (en) Cell-based table manipulation of event data
US20180060418A1 (en) Defining fields from particular occurences of field labels in events
US6708166B1 (en) Method and apparatus for storing data as objects, constructing customized data retrieval and data processing requests, and performing householding queries
US6915308B1 (en) Method and apparatus for information mining and filtering
US7130867B2 (en) Information component based data storage and management
US6327586B1 (en) System method and computer program product to automate the management and analysis of heterogeneous data
US9519636B2 (en) Deduction of analytic context based on text and semantic layer
EP0883848B1 (en) Automatic transmission of legacy system data
US6925462B2 (en) Database management system, and query method and query execution program in the database management system
US20070100823A1 (en) Techniques for manipulating unstructured data using synonyms and alternate spellings prior to recasting as structured data
US7921359B2 (en) Computer-implemented system and method for tagged and rectangular data processing
US8930303B2 (en) Discovering pivot type relationships between database objects
JP2005503616A (ja) データの内容と属性に基づいてデータをリストアする技法
JP2005190163A (ja) 構造化データ検索方法、構造化データ検索装置およびプログラム
KR100323607B1 (ko) 기술자료검색 텍스트파일을 기술정보 분석용 마스터테이블로 변환하는 자료 변환방법
JP4879193B2 (ja) システムログ管理支援装置およびシステムログ管理支援方法
JPH08314763A (ja) ログ情報解析装置
CN110222169A (zh) 一种可视化数据处理解析系统及其处理方法
JP2000090093A (ja) 全文検索方法及び全文検索システム並びに全文検索プログラムを記録した記録媒体
JPH11161656A (ja) データベース検索・抽出システムおよびデータベース検索・抽出用制御プログラムを記録した記録媒体
JPH05334363A (ja) データベース検索システム
KR100532823B1 (ko) 데이터 무결성 관리장치와 관리방법 그리고 그 방법을컴퓨터 상에서 실행하는 프로그램을 기록한 기록매체

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20061228

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee