KR101560756B1 - 전자 문서 콜렉션을 검색하기 위한 방법, 시스템, 및 장치 - Google Patents

전자 문서 콜렉션을 검색하기 위한 방법, 시스템, 및 장치 Download PDF

Info

Publication number
KR101560756B1
KR101560756B1 KR1020117028646A KR20117028646A KR101560756B1 KR 101560756 B1 KR101560756 B1 KR 101560756B1 KR 1020117028646 A KR1020117028646 A KR 1020117028646A KR 20117028646 A KR20117028646 A KR 20117028646A KR 101560756 B1 KR101560756 B1 KR 101560756B1
Authority
KR
South Korea
Prior art keywords
profile
collection
document
delete delete
query
Prior art date
Application number
KR1020117028646A
Other languages
English (en)
Other versions
KR20120027285A (ko
Inventor
제이슨 데이비드 레스닉
랜디 더블유. 라카세
Original Assignee
씨피에이 소프트웨어 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 씨피에이 소프트웨어 리미티드 filed Critical 씨피에이 소프트웨어 리미티드
Publication of KR20120027285A publication Critical patent/KR20120027285A/ko
Application granted granted Critical
Publication of KR101560756B1 publication Critical patent/KR101560756B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/11Patent retrieval

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

전자 문서 콜렉션을 효율적이고 효과적으로 검색하기 위한 방법, 시스템, 및 품목이 제공된다. 콜렉션내의 문서들 각각은 서브섹션들로 사전-분할된다. 하나 이상의 프로파일들이 생성되며, 각 프로파일은 콜렉션내의 문서들의 섹션들 중 하나 이상의 선택을 포함한다. 또한, 프로파일내의 선택된 섹션들 각각에 가중치가 부여된다. 쿼리의 파라미터들 및 프로파일의 선택을 기반으로 하여, 각 문서의 서브 섹션들은 쿼리 데이터와 기본적인 문서 콜렉션의 비교에 이용된다. 전송된 프로파일에서 식별되는 것과 같은 문서의 섹션들내의 쿼리 데이터와 매칭되는 데이터를 갖는 모든 문서들을 기반으로 하여 문서들의 컴필레이션이 생성된다.

Description

전자 문서 콜렉션을 검색하기 위한 방법, 시스템, 및 장치{METHOD, SYSTEM, AND APPARATUS FOR SEARCHING AN ELECTRONIC DOCUMENT COLLECTION}
본 발명은 전자 문서 콜렉션, 및 쿼리의 수신에 따른 콜렉션의 검색에 관한 것이다. 보다 구체적으로, 본 발명은 검색될 지적재산 문서의 각 섹션에 강조를 두는 것에 의한 검색 프로파일들의 생성, 및 검색 프로파일들 중 적어도 하나의 선택에 반응하는 쿼리의 처리에 관한 것이다.
세계속의 특허청들 중 어느 것(이하 특허청)의 선택에 앞서 심사를 위해 제출되는 모든 지적재산 문서들은, 각 지적재산 문서가 새롭고, 유용하고, 비자명한 것으로 간주되어야 한다는 것을 포함하여, 일정한 요건들을 충족하여야 한다. 심사를 위해 지적재산 문서를 적절히 준비하기 위하여, 발명에 대하여 단 하나의 지적재산 문서만이 등록될 수 있기 때문에, 관련 기술분야에 있는 종래의 지적재산 문서들(즉, 종래 기술)에 대한 지식을 얻는 것이 유용하다. 종래기술의 확인 과정은 검색으로서 알려져 있다. 일반적으로 검색 결과들은 어떤 다음의 지적재산 출원의 드래프터들이 특허가능하거나 또는 그렇지 않으면 보호가능한 주제로 보이고 또한 지적재산 권리들의 발명자 또는 소유자의 목적을 달성하기 위한 적절한 전략의 개발을 돕는 것에 그들의 노력을 집중하는데 도움을 준다.
현재의 전자 정보 시대로의 기술의 발전에 앞서, 지적재산 검색들이 수동으로 행해졌다는 것이 알려졌다. 검색자는 개시물을 검토하고, 분류 시스템을 기반으로 하여, 개시물이 분류되어야 하는 곳을 확인하고, 그 후 검색을 수행한다. 수행되는 한정된 범위의 검색을 기반으로 하여 검색자가 지적재산 문서의 적절한 섹션들을 시각적으로 검토할 수 있다는 것이 인식되었다. 정보 기술의 출현으로, 대부분의 지적재산 허여물들 및 공개 출원들은 전자 형태로만 이용가능하기 때문에, 대부분의 관할권들에서 수동 검색들은 더 이상 이용할 수 없다. 전자 형태의 지적재산 문서의 출현으로, 수동 검색과 함께 이용되는 유사한 전략들이 전자 지적재산 데이터베이스의 검색에 사용될 수 있다.
다른 결과들을 얻기 위하여 다른 검색 분류들이 의뢰될 수 있다. 예를 들면, 지적재산 자산을 출원할지 여부를 확인하기 위해 신규성 검색이 의뢰될 수 있다. 제품이 현재의 지적재산 자산의 청구범위하에 보호되는지 여부를 확인하기 위해 제품 허가 검색이 의뢰될 수 있다. 지적재산 자산의 등록 청구범위가 유효한지 여부 등을 판단하기 위해 무효성 검색이 의뢰될 수 있다. 종래의 전자 지적재산 문서 검색 툴들은 다른 검색 분류들을 지원하지 않는다. 오히려, 검색 범위를 기반으로 하여 검색에서 검토될 지적재산 문서의 섹션들을 제한하는 것은 검색을 수행하는 사람(검색자)에게 부담이 된다. 데이터베이스내에 있는 허여된 지적재산 권리들 및 계류중인 공개 지적재산 출원물들의 양이 증가함에 따라, 각 검색을 위하여 보다 많은 관련 문서들이 검토될 필요가 있기 때문에 검색 부담이 증가된다.
따라서, 검색 및 관련 검색 범위와 관련된 부담들을 경감시키거나 회피하고 전자 형태의 지적재산 문서들의 장점을 얻기 위하여 검색자에 의해 사용될 툴 및 기술에 대한 요구가 있다. 이 툴은 정확하고 바람직한 검색 결과들을 보다 효율적이고 효과적으로 얻기 위하여 검색자로 하여금 검색동안 지적재산 문서의 서로다른 섹션들을 강화할 수 있게 하여야 한다.
본 발명은 특허 문서들의 콜렉션을 효율적이고 효과적으로 검색하기 위한 방법, 시스템, 및 품목을 포함한다.
본 발명의 하나의 측면에 있어서, 전자 문서 콜렉션을 검색하기 위한 컴퓨터 방법이 제공된다. 특허 문서의 콜렉션은 컴파일링 및 인덱싱되며, 콜렉션내의 특허 문서들 각각은 복수의 섹션들로 이루어진다. 콜렉션내의 각 특허의 각 섹션이 식별된다. 문서 콜렉션을 위하여 검색 프로파일이 조직된다. 검색 프로파일은 콜렉션내의 각 문서의 각 식별 섹션들의 선택을 포함한다. 각 프로파일에 대하여, 선택된 섹션들 각각에 가중치가 부여된다. 콜렉션으로의 쿼리의 전송시, 검색 프로파일이 선택되고 쿼리 데이터는 선택된 프로파일에서 식별되고 가중치가 부여된 문서 콜렉션의 섹션들 각각의 데이터와 비교된다. 부여된 가중치를 갖는 각 프로파일 섹션과 쿼리 데이터의 매치는 검색 결과들의 일부로서 복귀될 문서들의 컴필레이션을 만든다.
본 발명의 또 하나의 측면에 있어서, 컴퓨터 시스템은 저장 매체와 통신하는 프로세서를 구비하며, 저장 매체에 전자 문서 콜렉션이 유지되어 있다. 전자 문서 콜렉션은 지적 재산 문서들의 컴필레이션이다. 지적 재산 문서들의 특성들을 기반으로 하여, 콜렉션내의 문서들 각각은 복수의 섹션들을 갖는다. 디렉터는 문서들의 콜렉션을 인덱싱 및 컴파일링하는데 이용된다. 디렉터는 콜렉션내의 문서들의 각 섹션을 식별하는 문서 관리자와 통신한다. 또한, 문서 콜렉션을 위한 검색 프로파일을 조직하기 위해 프로파일 관리자가 제공된다. 프로파일 관리자는 문서 관리자와 통신하며 컴파일링된 콜렉션내에 각 문서의 식별 섹션 각각의 선택을 포함시키기 위해 검색 프로파일을 이용한다. 프로파일내에 포함시키기 위한 특정 섹션들의 선택에 더하여, 프로파일 관리자는 각 프로파일내의 선택된 섹션들 각각에 가중치를 부여한다. 가중치는 관련 섹션에 대한 강조의 반영이다. 쿼리 시간에, 쿼리 관리자는 문서 콜렉션으로 쿼리를 전송한다. 쿼리는 적어도 하나의 검색 프로파일의 선택을 포함하며 쿼리 데이터를 프로파일내에 반영된 문서의 섹션들 각각의 데이터와 비교한다. 쿼리 관리자에 의한 전송에 이어, 관련 특허 문서들의 컴필레이션이 복귀되며, 컴필레이션은 부여된 가중치를 갖는 적어도 각 식별 프로파일 섹션내의 데이터와 쿼리의 매치를 포함한다.
본 발명의 또 하나의 측면에 있어서, 품목은 컴퓨터 메모리에서 전자 문서 콜렉션을 검색하도록 구성된 컴퓨터 프로그램 명령들을 포함하는 컴퓨터-읽기가능 캐리어를 구비한다. 컴퓨터-읽기가능 캐리어는 문서 콜렉션을 통해 쿼리를 수행하기 위한 컴퓨터 프로그램 명령들을 포함한다. 지적재산 문서들의 콜렉션을 컴파일링 및 인덱싱하기 위한 명령들이 제공된다. 콜렉션내의 특허 문서들 각각은 복수의 섹션들로 분할된다. 콜렉션의 인덱싱에 이어, 콜렉션내의 각 문서의 섹션들 각각을 식별하기 위한 명령들이 제공된다. 문서들의 섹션들이 식별되면, 문서 콜렉션을 위한 검색 프로파일을 조직하기 위한 명령들이 제공된다. 검색 프로파일은 콜렉션내의 각 문서의 각 식별 섹션들의 선택이다. 부가적으로, 검색 프로파일내에서 식별된 섹션들 각각에 가중치를 부여하기 위한 명령들이 제공된다. 문서 콜렉션으로의 쿼리의 전송시, 적어도 하나의 검색 프로파일을 선택하고 프로파일내에서 식별된 콜렉션내의 문서들의 섹션들내의 데이터와 쿼리 데이터를 비교하기 위한 명령들이 제공된다. 쿼리 전송의 결과들은 적어도 각 식별 프로파일 섹션내의 쿼리 데이터와 기본적인 콜렉션내의 하나 이상의 문서들의 매치를 기반으로 하여 복귀된 관련 문서들의 컴필레이션을 포함한다.
본 발명의 다른 특징들 및 장점들은 첨부한 도면들과 관련된 본 발명의 바람직한 실시예의 아래의 상세한 설명으로부터 명백할 것이다.
여기에 참조된 도면들은 명세서의 일부를 이룬다. 도면들에 도시된 특징들은 본 발명의 일부 실시예들만의 예시를 위한 것으로, 명확히 나타낸 것이 아니라면 본 발명의 모든 실시예들이 아니다. 그렇지 않다면, 그에 반대되는 의미는 이루어질 수 없다.
도 1은 하나 이상의 프로파일들의 생성을 위해 특허 문서의 섹션들을 식별하기 위한 프로세스를 예시한 흐름도이다.
도 2는 하나 이상의 프로파일들을 위한 이차 가중치를 생성하기 위한 프로세스를 예시한 흐름도이다.
도 3은 스트링 매치가 발생하는 각 프로파일 섹션들내의 위치를 반영하기 위해 이차 가중치를 이용하기 위한 프로세스를 예시한 흐름도이다.
도 4는 프로파일의 생성을 지원하기 위한 사용자 인터페이스의 블록도이다.
도 5는 본 발명의 바람직한 실시예에 따른 컴파일링 및 인덱싱된 문서 콜렉션에 쿼리를 전송하기 위한 프로세스를 예시한 흐름도로서, 등록 특허의 첫번째 페이지에 프린팅하기 위해 제안된다.
도 6은 검색 프로파일을 생성하고 프로파일에서 식별되는 기본적인 문서 콜렉션의 서로다른 섹션들에 하나 이상의 가중치들을 부여하기 위해 이용되는 한 세트의 툴들을 예시한 블록도이다.
전체적으로 설명되고 도면들에 예시된 본 발명의 구성요소들이 광범위한 다른 구성들로 배열 및 설계될 수 있다는 것을 쉽게 이해할 것이다. 따라서, 도면들에 제공된 본 발명의 장치, 시스템, 및 방법의 실시예들의 다음의 상세한 설명은 청구된 바와 같이 본 발명의 범위를 한정하려는 것이 아니고, 단지 본 발명의 선택된 실시예들을 나타낸다.
이 명세서에 기재된 기능 유닛들은 관리자들 및 디렉터들로서 분류된다. 관리자 및/또는 디렉터는 프로그램가능 하드웨어 디바이스들(예를 들면, FPGA(Field Programmable Gate Arrays), PAL(Programmable Array Logic), PLD(Programmable Logic Deivces) 등)로 구현될 수 있다. 관리자 및/또는 디렉터는 다양한 종류의 프로세서들에 의해 실행되는 소프트웨어로도 구현될 수 있다. 예를 들면, 식별된 관리자 및/또는 디렉터의 실행가능 코드는, 예를 들어 객체, 프로시져, 함수, 또는 다른 컨스트럭트로 조직될 수 있는 하나 이상의 컴퓨터 명령 로직 블록들을 포함할 수 있다. 그럼에도 불구하고, 식별된 관리자 및/또는 디렉터의 실행가능물들은 물리적으로 함께 위치할 필요는 없지만, 논리적으로 함께 결합되면 관리자 및/또는 디렉터를 포함하는 서로다른 위치들에 저장된 다른 명령들을 포함하여 관리자 및/또는 디렉터의 설명한 목적을 달성할 수 있다.
실제로, 관리자 및/또는 디렉터의 실행가능 코드는 단일 명령이거나 또는 많은 명령들일 수 있으며, 수개의 서로다른 코드 세그먼트들에 걸쳐, 서로다른 애플리케이션들중에, 및 수개의 메모리 디바이스들에 걸쳐 분배될 수도 있다. 마찬가지로, 운용 데이터가 관리자 및/또는 디렉터내에서 식별 및 예시될 수 있으며, 어떤 적절한 형태로 구체화되어 어떤 적절한 타입의 데이터 구조내에 조직될 수 있다. 운용 데이터는 단일 데이터 세트로서 수집되거나, 또는 다른 저장 디바이스를 포함하는 다른 위치들을 통해 제공될 수 있으며, 적어도 부분적으로, 시스템 또는 네트워크상의 전자 신호들로서 존재할 수 있다.
이 명세서 전반에 걸쳐 "선택 실시예", "일실시예", 또는 "실시예"는, 실시예와 관련하여 기재된 특정 특징, 구조, 또는 특성이 본 발명의 적어도 하나의 실시예에 포함된다는 것을 의미한다. 따라서, 이 명세서 전반에 걸쳐 다양한 위치에 있는 문구들 "선택 실시예", "일실시예에 있어서", 또는 "실시예에 있어서"의 등장은 반드시 동일한 실시예를 나타낸 것은 아니다.
또한, 설명된 특징들, 구조들, 또는 특성들은 어떤 적절한 방식으로 하나 이상의 실시예들에 결합될 수 있다. 아래의 설명에서, 본 발명의 실시예들의 완전한 이해를 제공하기 위해 많은 특정 상세들이 제공된다. 하지만, 특정 상세들 중 하나 이상이 없이 또는 다른 방법들, 구성요소들, 요소들 등으로 본 발명이 실행될 수 있다는 것을 이 기술분야의 당업자는 이해할 것이다. 다른 예들에 있어서, 본 발명의 애매한 측면들을 회피하기 위하여 잘 알려진 구조들, 요소들, 또는 동작들이 상세히 도시되거나 설명되지 않았다.
본 발명의 예시된 실시예들은, 동일한 부분들은 동일한 부호들로 나타낸 도면들을 참조하면 가장 잘 이해될 것이다. 다음의 설명은 오로지 예시를 위한 것으로, 여기에 청구된 발명과 일치하는 디바이스들, 시스템들, 및 프로세서들의 어떤 선택된 실시예들을 나타낸다.
지적재산 문서 콜렉션은 등록 및 공개된 출원들의 컴필레이션(compilation)이다. 특허 문서 콜렉션은 지적재산 문서 콜렉션의 서브셋이다. 특허 문서들은 등록 특허 및 공개 특허의 형태로 나타난다. 문서들의 두개의 카테고리들 사이의 차이는 그것들의 실시가능한 가치를 식별한다. 보다 구체적으로, 등록 특허는 재판소에서 강제될 수 있는 실제 재산권인 반면에, 공개 특허는 계류중인 특허권인 계류중인 출원이다. 각 특허 문서는 복수의 섹션들로 분석되는데, 스트링 데이터로도 알려진 각 섹션은 쓰여진 워드들 및 프레이즈들을 포함한다. 콜렉션의 검색을 수용하기 위해, 콜렉션내의 각 문서는 각 문서내의 섹션들을 기반으로 하여 분석되며, 지적재산 문서들의 분석된 섹션들 각각에 가중치가 부여된다. 가중치는 쿼리를 위해 문서의 하나 이상의 특정 섹션들에 배치된 강조의 수치적인 측정값이다. 선택된 섹션들에 부여된 가중치들과 함께 문서 섹션들의 선택은 검색 프로파일을 생성한다. 검색 범위에 따라, 문서들의 특성 섹션들로 검색이 제한되거나 또는 문서의 각 섹션내의 쿼리 데이터의 매칭에 다른 강조가 배치될 수 있다. 따라서, 검색 프로파일의 생성 및 선택은 검색 결과들과 직접 관련되어 있다.
쿼리 스트링의 문서 콜렉션에의 전송에 앞서, 의도된 검색 범위를 기반으로 하여 적어도 하나의 검색 프로파일이 선택된다. 매칭 문서들의 컴필레이션은 선택된 프로파일에 지시된 것과 같은 부여 가중치를 갖는 특허 문서의 각 섹션내의 문서 스트링 데이터와 쿼리 스트링 데이터 사이의 데이터 매칭을 기반으로 하여 복귀된다. 따라서, 콜렉션에 전송된 쿼리와 관계 있는 데이터로 결과 세트를 효율적이고 효과적으로 생성하기 위해 특허 문서 콜렉션내의 특허 문서의 하나 이상의 섹션들에 가중치들이 부여되는데, 결과 세트는 제로 이상으로 가중치 값이 부여된 섹션내의 전송된 쿼리 스트링을 매칭시키는 스트링을 갖는 특허 문서 콜렉션내에 하나 이상의 문서들을 포함한다.
다음의 실시예들의 설명에서, 본 명세서의 일부를 이루는 첨부한 도면들에 대한 언급이 있으며, 이는 발명이 실시될 수 있는 특정 실시예를 예로서 나타낸다. 본 발명의 범위를 일탈하지 않고 구조적인 변형물들이 이루어질 수 있기 때문에 다른 실시예들이 이용될 수 있다는 것이 이해되어야 한다.
등록 및 공개된 지적재산 문서들을 기술한 문서들이 복수의 섹션들로 분할된다는 것이 인식된다. 각 섹션은 완료된 출원의 전송을 위해 필요하며, 각 섹션은 목적을 갖는다. 기본적인 지적재산의 각 섹션의 상세들은 여기에서 논의되지 않을 것이다. 하지만, 개시의 목적으로, 특허의 서로다른 섹션들이 지적재산 문서의 예로서 식별될 것이다. 대체로, 각 특허 출원은 명칭, 우선일, 요약서, 배경설명, 서머리(summary), (만약에 있다면) 도면의 간단한 설명, (만약에 있다면) 도면들, 발명의 상세한 설명, 및 청구범위를 포함한다. 검색 목적에 따라 특허 아레나(arena)에서 이용되는 서로다른 검색 카테고리들이 있다. 예를 들면, 침해 및/또는 제품 허가 검색은 청구범위의 언어와 관련되며, 따라서 본질적으로 문서 콜렉션에서 제공된 청구범위로 안내되어야 한다. 유효성 및/또는 무효성 검색은 알려진 종래기술과 관련되어 있어 특허 문서의 우선일의 확인을 필요로 한다. 특허 출원의 제출에 앞서 또는 특허 출원의 제출에 이어 발명자(들)이 그들의 발명의 신규성을 판단하려 하면, 발명자들 또는 그/그녀의 대리인 또는 대표자는 신규성 검색을 의뢰할 수 있다. 이러한 검색은 청구범위를 중요시하지 않고 발명의 상세한 설명에 초점을 맞출 수 있다. 따라서, 여기에 도시된 것처럼, 각 검색은 문서 콜렉션내의 특허 문서의 서로다른 섹션들에 강조를 둔다.
도 1은 하나 이상의 프로파일들의 생성을 위해 특허 문서의 섹션들을 식별하기 위한 과정을 나타낸 흐름도(100)이다. 현재의 법규하에서, 미국 특허청에 제출된 각 특허 문서는 섹션들(title, background(technical field 및 description of the prior art를 포함), summary of the invention, brief description of the drawing figures, drawing figures, detail description of the preferred embodiment(s), claims, 및 abstract)을 포함할 것이다. 일실시예에 있어서, 예를 들어 케미컬 프렉티스 및 어떤 국제 특허들 및 특허 문서들에서 모든 특허 문서들이 도면을 포함하지는 않는다. 마찬가지로, 다른 국가들 및 지역 관청들에서 또한 이전의 국내 프랙티스에서, 특허 문서에 다른 수량의 섹션들이 있거나 또는 섹션들이 다른 순서로 제공될 수 있다. 따라서, 쿼리를 갖는 콜렉션내의 특허 문서의 하나 이상의 섹션들에 강조를 두기 전에, 문서들의 기원, 문서들의 다른 섹션들, 및 콜렉션내에서 섹션들이 조직되는 순서가 확인될 필요가 있다.
처음에, 특허 문서들의 콜렉션은 컴파일링 및 익덱싱된다(102). 특허들 및 특허 공보들은 복수의 섹션들로 이루어진다는 것이 인식된다. 문서들의 컴필레이션에 이어, 문서들의 콜렉션내의 각 특허의 각 섹션이 확인된다(104). 변수 NTotal이 특허 문서내의 섹션들의 개수에 부여된다(106). 다른 검색 요구들을 어드레싱하기 위해 다른 프로파일들이 생성된다. 특허 문서들의 섹션들의 서로다른 조합에 강조를 두고, 및/또는 제로 값을 섹션에 부여함으로써 검색 동안의 고려사항에서 문서의 하나 이상의 섹션들을 생략함으로써 프로파일이 생성된다. 프로파일 기반 검색을 지원하기 위해, 적어도 하나의 프로파일이 생성된다. 하지만, 일실시예에 있어서, 검색 요구사항들을 충족시키기 위해 프로파일의 선택을 지원하도록 생성된 복수의 프로파일들이 있다. 특허 문서들의 섹션들이 단계(106)에서 확인되면, 프로파일 지정과 관련된 카운팅 변수 X는 초기화되고 정수 1에 부여되고(108) 특허 문서의 섹션들에 관한 카운팅 변수 N은 정수 1에 부여된다(110). 특허 문서 콜렉션의 sectionN으로 시작하면, sectionN이 생성되는 프로파일 profileX의 일부로서 이용될지가 판정된다(112). 단계(112)에서의 판정에서 "예" 이면 sectionN을 profileX에 결합한다(114). sectionN의 선택으로, sectionN에 주요 가중치가 부여된다(116). 주여 가중치는 어떤 이전에 선택된 섹션들 및 결합될 또는 프로파일에서 생략될 다른 섹션들을 포함하여 특허 문서 콜렉션의 다른 섹션들에 대하여 sectionN 대 profileX의 중요도를 나타내는 수치적인 값이다. 단계(116) 또는 단계(112)에서의 판정에 대한 "아니오"에 이어, 특허 문서의 섹션들과 관련된 변수 N가 증분된다(118). 그리고, 컴파일링 및 인덱싱된 콜렉션내의 특허 문서들의 모든 식별 섹션들이 결합 또는 profileX로부터의 생략을 위해 평가된다(120). 단계(120)에서의 판정에 대하여 "예"이면 profileX를 위한 프로파일 생성 프로세스를 완료한다(122). 반대로, 단계(120)에서의 판정에 대하여 "아니오" 이면 profileX를 위한 콜렉션내의 추가 섹션들의 고려를 위한 단계(112)로 복귀된다. 그리고, 문서 콜렉션을 생성하기 위한 어떤 부가적인 프로파일들이 있는지가 판정된다(124). 단계(124)에서의 판정에 대하여 "예" 이면 카운팅 변수 X의 증분(126) 및 단계(110)으로의 복귀가 따른다. 반대로, 단계(124)에서의 판정에 대하여 "아니오" 이면 X와 관련된 개수의 변수 XTotal로의 부여를 갖는 프로파일들의 생성을 완료한다(128). 따라서, 특허 문서 콜렉션을 위한 하나 이상의 프로파일들이 생성될 수 있으며, 각 프로파일은 특허 문서 콜렉션내의 하나 이상의 식별 섹션들에 강조를 둔다.
도 1에 도시된 바와 같이, 검색 과정동안 특허 문서들의 선택 섹션들의 이용을 강조하거나 또는 강조하지 않도록 하나 이상의 프로파일들이 생성될 수 있다. 도 2는 각 생성된 프로파일에 부가될 수 있는 강조의 부가된 치수를 보여주는 흐름도(200)이다. 보다 구체적으로, 이차 가중치 형태의 부가된 가중치는 각 프로파일의 선택 섹션들내의 매칭 스트링들의 양을 기반으로 하여 가중치 스코어를 부가하거나 가중치 스코어에서 차감하는데 이용될 수 있다. 도 1에 도시된 바와 같이, 변수 XTotal은 생성된 프로파일들의 양을 나타내기 위해 부여되고(202), 카운팅 변수 X는 정수 1에 부여된다(204). 그 후, 도 1에 도시한 바와 같이, 가중치 부여를 갖는 profileX내의 섹션들의 양을 나타내기 위해 변수 YTotal이 부여된다(206). 프로파일의 개별적인 섹션들을 평가하기 위해, 카운팅 변수 Y가 정수 1에 부여된다(208). 그리고, 이차 가중치가 profileX의 sectionY에 부가될지가 판정된다(210). 단계(210)에서의 판정에 대하여 "아니오" 이면, 만약에 있다면 프로파일내의 다음 섹션을 평가하기 위한 단계(230)로의 점프가 따른다. 반대로, 단계(210)에서의 판정에 대하여 "예" 이면 이차 가중치 부여가 단계적 구조인지를 판정하기 위한 이차 쿼리가 따른다(212). 보다 구체적으로, 각 프로파일은 선택된 프로파일을 갖는 검색 과정동안 복귀된 데이터 스트링 매치들의 양에 따라 가중치 값들의 계층을 포함할 수 있다. 단계(212)에서의 판정에 대하여 "아니오" 이면, sectionY에의 이차 가중치 부여를 이용하기 위해 복귀되어야 하는 데이터 스트링 매치들의 최소 임계치 설정이 따른다(214). 단계(214)에 이어, profileXsectionY를 위해 이차 가중치 값이 세트된다(216). 단계들(214) 및 (216)에서의 입력은 단계(212)에서 설정된 이차 가중치 구조를 만족시키는 파라미터들을 세트하는 것이다. 따라서, 각 프로파일 섹션에 대하여, 매치들의 임계값이 초과되면 검색 결과들에 강조를 제공하기 위해 이차 가중치 값이 세트될 수 있다.
한개의 이차 가중치 값의 세팅에 더하여, 프로파일의 각 선택 섹션은 이차 가중치 임계값들의 계층을 수용하도록 구성될 수 있다. 단계(212)에서의 판정에 대하여 "예" 이면, 변수 ZTotal은 progileX,sectionY에 부여될 계층적 임계값들의 양에 부여되고(218), 단계 카운팅 변수 Z는 정수 1에 세트된다(220). 단계(220)에 이어, profileX,sectionY,tierZ에의 이차 가중치 부여를 이용하기 위해 복귀되어야 하는 데이터 스트링 매치들의 최소 임계값이 세트되고(222), profileXsectionYtierZ를 위하여 이차 가중치 값이 세트된다(224). 선택 tTierZ를 위해 가중치 값이 세트되면, 단계 카운팅 변수 Z는 증분되고(226), profileX,sectionY에 대한 모든 단계들을 위해 모든 가중치 값들이 세트되었는지를 판정한다(228). 단계(228)에서의 판정에 대하여 "아니오" 이면 단계(222)로의 복귀가 따른다. 반대로, 단계(228)에서의 판정에 대하여 "예"이거나 또는 다음 단계(216) 후, 선택 프로파일의 다음 섹션의 평가로 진행하기 위해 카운팅 변수 Y의 증분이 따른다(230). 그리고, 선택 프로파일의 모든 섹션들이 이차 가중치 임계값들의 계층의 부여를 위해 평가되었는지가 판정된다(232). 단계(232)에서의 판정에 대하여 "아니오" 이면, 단계(210)으로의 복귀가 따르고, 단계(232)에서의 판정에 대하여 "예" 이면, 프로파일 카운팅 변수 X의 증분이 따른다(234). 단계(234)에 이어, 생성된 모든 프로파일들이 이차 가중치의 부여를 위해 평가되었는지가 판정된다(236). 단계(236)에서의 판정에 대하여 "아니오" 이면, 단계(206)로의 복귀가 이어지고, 단계(236)에서의 판정에 대하여 "예" 이면 생성된 프로파일들의 섹션들을 선택하기 위해 이차 가중치 임계값들의 계층의 부여를 완료한다(238). 따라서, 각 프로파일은 각 프로파일의 선택 섹션들 뿐만 아니라 프로파일내의 매칭 스트링들의 양에 강조를 두기 위해 이차 가중치들의 계층으로 구성될 수 있다.
도 2에 도시된 바와 같이, 이차 가중치들의 계층, 즉 단계들은 프로파일의 개개의 섹션에 적용될 수 있는데, 이차 가중치들은 쿼리 스트링과 분석되는 문서 콜렉션내의 데이터 사이의 매치량에 대한 하나 이상의 임계값들을 기반으로 한다. 또 하나의 실시예에 있어서, 이차 가중치는 도 3에 도시된 바와 같이 스트링 매치가 일어나는 하나 이상의 프로파일 섹션들내의 위치를 반영할 수 있다. 이 이차 가중치는 도 2에 도시된 이차 가중치로부터 분리되어 있거나 이차 가중치에 추가될 수 있다. 도 1에 도시된 바와 같이, 변수 XTotal은 생성된 프로파일들의 양을 나타내도록 부여되고(302), 카운팅 변수 X는 정수 1에 부여된다(304). 그 후, 변수 YTotal은 가중치 부여를 갖는 profileX내의 섹션들의 양을 나타내기 위해 부여되고(306), 카운팅 변수 Y는 정수 1에 부여된다(308). 그리고, 이차 가중치가 profileX,sectionY에 부가될지가 판정된다(310). 단계(310)에서의 판정에 대하여 "예" 이면, profileX,sectionY의 복수의 서브섹션들로의 분할이 이어진다(312). 단계(312)에서의 분할을 위해 이용될 수 있는 서로다른 실시예들이 있다. 예를 들면, 일실시예에 있어서, 제1 문장으로 한정되는 제1 서브섹션, 마지막 문장으로 한정되는 제3 서브섹션, 및 제1 서브섹션과 제3 서브섹션 사이에 위치하는 모든 데이터로 한정되는 제2 서브섹션을 갖는 3개의 서브섹션들이 있을 수 있다. 마찬가지로, 또 하나의 실시예에 있어서, profileX,sectionY는 복수의 섹션들로 분할될 수 있는데, 각 섹션 길이는 전체로서 profileX,sectionY의 비율과 관련되어 있다. 서브섹션들의 양을 결정하기 위해 사용되는 방법에 관계없이, 각 profileX,sectionY는 profileX,sectionY에 있는 매칭 스트링 뿐만 아니라 선택 서브섹션내의 매치의 위치를 반영시키기 위해 부여된 이차 가중치를 갖는 둘 이상의 서브섹션들로 분할될 수 있다.
단계(312)에 이어, 변수 ZTotal이 profileX,sectionY를 위해 생성된 서브섹션들의 양에 부여되고(314), 카운팅 변수 Z가 정수 1에 부여된다(316). 이차 가중치는 profileX,sectionY,subsectionZ에 부여된다(318). 단계(318)에서의 부여에 이어, 카운팅 변수 Z가 증분되고(320), 이차 가중치 부여를 위해 평가되지 않은 profileX,sectionY내에 더 이상의 서브섹션들이 있는지에 대하여 판정된다(322). 단계(322)에서의 판정에 대하여 "아니오" 이면 단계(318)로의 복귀가 이어진다. 반대로, 단계(322)에서의 판정에 대하여 "예"이거나 또는 단계(310)에서의 판정에 대하여 "아니오" 이면 카운팅 변수 Y의 증분이 따른다(324). 그리고, 이차 가중치의 부여를 위해 평가되지 않은 profileX내에 어떤 섹션들이 있는지가 판정된다(326). 단계(326)에서의 판정에 대하여 "아니오" 이면, 단계(310)로의 복귀가 따른다. 반대로, 단계(326)에서의 판정에 대하여 "예" 이면, 카운팅 변수 X의 증분(328), 및 모든 프로파일들이 이차 가중치 부여를 위해 평가되어야하는지에 대한 판정(330)이 따른다. 단계(330)에서의 판정에 대하여 "아니오" 이면, 단계(306)로의 복귀가 따르고, "예" 이면 이차 가중치 부여 과정을 완료한다. 따라서, 프로파일 섹션은 그들의 물리적인 위치를 기반으로 하여 복수의 서브섹션들로 재분할될 수 있는데, 이차 가중치는 식별된 서브섹션들 중 하나 이상에 부여된다.
도 4는 지적재산 문서 콜렉션에 전송될 검색을 위해 프로파일의 생성을 지원하기 위한 유저 인터페이스의 블록도(400)이다. 유저 인터페이스는 기본적인 문서들의 섹션들에의 가중치들의 적용을 위한 기본적인 코드에의 베니어(veneer)로서 기능한다. 도시된 바와 같이, 인터페이스내에 제공된 복수의 블록들이 있는데, 각 박스는 문서 콜렉션내에서 식별되는 섹션과 관련되어 있다. 보다 구체적으로, 여기에 도시된 예에서 5개의 박스들(410),(420),(430),(440), 및 (450)이 있으며, 각 박스는 콜렉션내의 기본적인 문서들의 각 섹션들을 식별하는 표시를 갖는다. 제1 박스(410)는 문서들(412)에 제공된 제1 섹션과 관련되어 있고, 제2 박스(420)는 특허 문서들(422)에 있는 제2 섹션과 관련되어 있고, 제3 박스(430)는 특허 문서들(432)내에 있는 제3 섹션과 관련되어 있고, 제4 박스(440)는 특허 문서들(442)내에 있는 제4 섹션과 관련되어 있고, 제5 박스(450)는 특허 문서들내에 있는 제5 섹션과 관련되어 있다. 여기에서 제공된 인터페이스가 5개의 섹션들로 분할된 콜렉션내의 기본적인 문서들만 나타내고 있지만, 본 발명은 이 수량에 한정되지 않아야 한다. 일실시예에 있어서, 문서 콜렉션은 큰 수량 또는 적은 수량의 섹션들로 분석될 수 있는데, 각 섹션은 인터페이스(400)내에서 제공된다.
파싱(parsing)을 위해 인터페이스내에서 식별되는 기본적인 문서의 각 섹션에 대하여, 관련 섹션에 할당될 가중치를 높이거나 낮추기 위한 슬라이드 메커니즘이 제공된다. 그것으로서, 제1 박스(410)는 슬라이드(414)를 구비하고, 제2 박스(420)는 슬라이드(424)를 구비하고, 제3 박스(430)는 슬라이드(434)를 구비하고, 제4 박스(440)는 슬라이드(444)를 구비하고, 제5 박스(450)는 슬라이드(454)를 구비한다. 일실시예에 있어서, 각 박스(410)-(450)는 문서들의 특정 섹션내에 있는 데이터와 쿼리의 매치에 적용될 가중치를 나타내는 슬라이드의 위치로 스케일링된다. 가중치들의 수치적인 표시가 여기에 도시되어 있지는 않지만, 일실시예에 있어서, 수치적인 표시가 각 박스(410)-(450)의 수직축에 제공될 수 있다. 각 박스의 개개의 슬라이드가 올라감에 따라, 관련 섹션의 가중치는 증가된다. 마찬가지로, 각 박스의 개개의 슬라이드가 낮아짐에 따라, 관련 섹션의 가중치는 감소된다. 따라서, 인터페이스는 프로파일의 생성을 위해 지적재산 문서들의 서로다른 섹션들에 대한 가중치들의 할당을 지원하기 위한 그래픽 툴을 제공한다.
프로파일들이 생성되고 일차 및/또는 이차 가중치들이 프로파일내에서 식별된 서로다른 섹션들 및 서브섹션들에 부여되면, 문서 쿼리로부터의 관련 문서들의 컴필레이션을 생성하기 위해 프로파일들이 이용될 수 있다. 도 5는 컴파일링 및 인덱싱된 문서 콜렉션에의 쿼리의 전송을 위한 과정을 예시한 흐름도(500)이다. 먼저, 쿼리(502)와 함께 쿼리 전송을 위한 프로파일(504)을 수신하기 위해 하나 이상의 문서 콜렉션들이 선택된다. 적절히 선택된 프로파일이 문서 쿼리 전송의 의도된 범위를 반영할 것이라는 것이 이해된다. 즉, 청구범위로 한정된 검색은 문서 콜렉션을 청구범위 섹션으로 실질적으로 제한하는 프로파일을 반영하여야 한다. 따라서, 전체로서 문서 섹션들을 검색하도록 의도되지 않은 검색은 적절히 카테고리화된 프로파일의 선택을 포함하여야 한다. 단계들(502) 및 (504)이 완료되면, 검색자는 쿼리를 제공하고 그것을 문서 콜렉션으로 전송한다(506). 변수 XTotal은 쿼리에서 전송된 데이터와 매치하기 위해 판정되는 문서들의 양에 부여되고(508), 관련 카운팅 변수 X는 정수 1에 부여된다(510). 마찬가지로, 변수 NTotal은 쿼리 입력의 적어도 하나의 발생으로 선택된 프로파일내에서 식별되는 섹션들의 양에 부여되고(512), 관련 카운팅 변수 N가 정수 1에 부여된다(514). 다음의 수학 공식을 기반으로 하여 documentX,sectionN에 대한 스코어가 계산된다(516).
documentX,sectionN = (섹션 N에서의 매치 개수)(섹션 N에 부여된 가중치)
단계(516)에 이어, 변수 N이 증분된 후(518), 프로파일내의 모든 섹션들이 문서 X에 대하여 평가되었는지에 대하여 판정된다(520). 단계(520)에서의 판정에 대하여 "아니오" 이면, 단계(516)으로의 복귀가 따른다. 반대로, 단계(520)에서의 판정에 대하여 "예" 이면, 문서내의 섹션들 각각에 대한 documentX,sectionN의 가중된 스코어 값의 합으로서 문서 X에 대한 스코어를 통합한다(522). 이 통합은 쿼리 입력과의 매치를 갖는 콜렉션내의 각 특허 문서에 대하여 컴파일링된다. 단계(522)에 이어, 변수 X가 증분되고(524), 매치를 갖는 모든 문서들에 대하여 가중치가 계산되었는지의 판정이 따른다(526). 단계(526)에서의 판정에 대하여 "아니오" 이면 단계(514)로의 복귀가 따른다. 반대로, 단계(526)에서의 판정에 대하여 "예" 이면, 가중치가 계산되어 선택된 프로파일에 근거하여 콜렉션내의 각 문서에 부여된다(528). 따라서, 문서들의 컴필레이션은 검색에 이용되는 프로파일을 기반으로 하여 문서의 관련성을 반영하는 부여 가중치로 복귀된다.
도 5의 컴필레이션은 선택된 쿼리의 이용으로 문서 콜렉션으로 전송된 쿼리를 기반으로 한다. 일실시예에 있어서, 쿼리 선택은 동적으로 수정될 수 있다. 문선 콜렉션의 복귀에 이어, 프로파일이 조정되는데, 쿼리는 선택된 문서 콜렉션으로 재전송된다. 다른 프로파일을 선택함으로써, 문서들의 복귀된 컴필레이션의 형태로 검색 결과들은 다를 수 있다. 마찬가지로, 일실시예에 있어서, 프로파일은 동일한 검색 쿼리를 위해 문서들의 서로다른 컴필레이션을 요청하기 위해 도 4에 도시된 그래픽 유저 인터페이스를 통해 동적으로 조정될 수 있다. 따라서, 복귀된 문서들의 서로다른 컴필레이션의 복귀를 요청하기 위해 동일한 검색 쿼리는 쿼리 프로파일의 동적 수정으로 문서 콜렉션으로 전송될 수 있다.
상술한 바와 같이, 문서 콜렉션내의 각 특허는 지적재산 문서들의 복귀된 컴필레이션의 특정 섹션들에서의 데이터 매치값을 강조하거나 강조하지 않기 위해 파싱될 수 있다. 도 6은 검색 프로파일들의 생성 및 검색 프로파일에서 식별된 지적재산 문서들의 서로다른 섹션들에의 가중치들의 부여를 위한 한 세트의 툴들을 나타낸 블록도(600)이다. 도시된 바와 같이, 컴퓨터 시스템(602)은 버스 구조(608)에 의해 메모리(606)에 연결된 프로세서 유닛(604)을 구비한다. 단 하나의 프로세서 유닛(604)이 도시되어 있지만, 일실시예에 있어서, 보다 많은 프로세서 유닛들이 확장형 설계로 제공될 수 있다. 문서 콜렉션(642)을 수용하도록 구성된 저장매체(640)와 통신하는 시스템(602)이 도시되어 있다. 일실시예에 있어서, 전자 문서 콜렉션은, 등록 특허들 및 공개 특허들을 포함하여 특허 문서들의 컴필레이션을 포함한다. 저장 매체(640)는 프로세서 유닛(604)과 통신한다. 또한, 영상 데이터의 제공을 위해 영상 디스플레이(650)와 통신하는 시스템이 도시되어 있다. 여기에 도시되고 설명된 요소들 각각은 문서 콜렉션(642)에의 쿼리 전송을 지원한다.
컴퓨터 시스템(602)내에 있고 메모리(606)와 통신하는 디렉터(660)가 제공된다. 디렉터(660)는 문서 콜렉션(642)을 컴파일링 및 인덱싱한다. 디렉터(660)는 콜렉션내의 각 문서의 각 섹션을 식별하는 문서 관리자(662)와 통신한다. 상술한 바와 같이, 특허 문서 콜렉션의 경우에, 각 특허 또는 공개 특허는 일정한 특정 섹션들로 구성된다. 하지만, 모든 특허 문서 콜렉션들이 일정한 배치를 갖는 것은 아니다. 그것으로서, 문서 관리자(662)는 콜렉션내의 문서들의 섹션들, 및 일실시예에 있어서, 식별 섹션들의 제공 순서를 식별하도록 이용된다. 문서 관리자(662)와 통신하는 프로파일 관리자(664)가 제공된다. 프로파일 관리자(664)는 문서 콜렉션(642)을 위한 검색 프로파일을 조직한다. 보다 구체적으로, 프로파일 관리자(664)는 쿼리내에 포함시키기 위해 문서 관리자(662)에 의해 식별된 문서들의 하나 이상의 섹션들의 선택을 용이하게 하고, 각 선택 섹션에 가중치를 부여한다. 일실시예에 있어서, 가중치는 선택된 섹션(들)내의 매칭 데이터의 중요도를 확인하기 위한 수치적인 값이다. 따라서, 프로파일 관리자(664)에 의해 조직된 검색 프로파일은 쿼리와 관계있는 문서 콜렉션의 섹션들에 대한 윤곽을 제공한다.
쿼리 관리자(666)는 프로파일 관리자(664)와 통신하고, 컴퓨터 시스템(602)내에 제공되고, 메모리(606)와 통신한다. 쿼리 관리자(664)는 문서 콜렉션(642)으로의 쿼리의 전송으로 적어도 하나의 검색 프로파일의 선택을 담당한다. 보다 구체적으로, 쿼리 관리자(666)는 프로파일내에서 식별되고 가중치가 부여된 문서 콜렉션(642)의 섹션들내의 데이터와 쿼리 데이터를 비교한다. 쿼리 관리자(666)에 의해 수행되는 비교는 관련 특허 문서들(646)의 컴필레이션을 생성한다. 일실시예에 있어서, 컴필레이션은 영상 디스플레이(650)에 제공된다. 마찬가지로, 일실시예에 있어서, 컴필레이션은 휘발성 또는 비휘발성 스토리지에 유지될 수 있다.
일실시예에 있어서, 디렉터(660), 문서 관리자(662), 프로파일 관리자(664), 및 쿼리 관리자(666)는 컴퓨터 시스템(602)내의 메모리(606)에 존재할 수 있다. 하지만, 본 발명은 이 실시예에 한정되지 않는다. 예를 들면, 일실시예에 있어서, 디렉터, 문서 관리자, 프로파일 관리자, 및 쿼리 관리자(660)-(666)은 국부 메모리(606)의 외부에 있는 하드웨어 툴들로서 각각 존재하거나 또는 하드웨어와 소프트웨어의 결합물로서 구현될 수 있다. 마찬가지로, 일실시예에 있어서, 디렉터 및 관리자들(660)-(666)은 저장매체(640)와 통신하는 원격 시스템에 존재할 수 있다. 따라서, 디렉터 및 관리자들은 관련 특허 문서들의 컴필레이션을 생성하기 위해 하나 이상의 쿼리들의 전자 특허 문서 콜렉션에의 전송을 지원하기 위한 소프트웨어 툴 또는 하드웨어 툴로서 구현될 수 있다.
일실시예에 있어서, 본 발명은, 그에 한정되지는 않지만, 펌웨어, 상주 소프트웨어, 마이크로코드 등을 포함하는 소프트웨어로 구현된다. 본 발명은 컴퓨터 또는 어떤 명령 실행 시스템에 의해 또는 컴퓨터 또는 어떤 명령 실행 시스템과 관련되어 사용하기 위한 프로그램 코드를 제공하는 컴퓨터-이용가능 또는 컴퓨터-읽기가능 매체로부터 액세스가능한 컴퓨터 프로그램 제품의 형태를 취할 수 있다. 이 설명을 목적으로, 컴퓨터-이용가능 또는 컴퓨터-읽기가능 매체는 명령 실행 시스템, 장치, 또는 디바이스에 의해 또는 명령 실행 시스템, 장치, 또는 디바이스와 관련하여 사용하기 위한 프로그램을 포함, 저장, 통신, 전파, 또는 전송할 수 있는 모든 장치일 수 있다.
본 발명의 범위내에 있는 실시예들은 인코딩된 프로그램 코드가 내장된 프로그램 저장 수단을 포함하는 제조 물품도 포함한다. 이러한 프로그램 저장 수단은 범용 또는 특수 목적 컴퓨터에 의해 액세스될 수 있는 모든 이용가능한 매체일 수 있다. 예로서, 제한 없이, 이러한 프로그램 저장 수단은 RAM, ROM, EEPROM, CD-ROM, 또는 다른 광 디스크 스토리지, 자기 디스크 스토리지, 또는 다른 자기 저장 디바이스들, 또는 원하는 프로그램 코드 수단을 저장하는데 사용될 수 있고 범용 또는 특수 목적 컴퓨터에 의해 액세스될 수 있는 어떤 다른 매체를 포함할 수 있다. 상술한 것의 결합물들도 프로그램 저장 수단의 범위내에 포함되어야 한다.
매체는 전자, 자기, 광학, 전자기, 적외선, 또는 반도체 시스템(또는 장치 또는 디바이스) 또는 전파 매체일 수 있다. 컴퓨터-읽기가능 매체의 예들은 반도체 또는 고체 상태 메모리, 자기 테이프, 분리식 컴퓨터 디스켓, RAM, ROM, 강성 자기 디스크, 및 광학 디스크를 포함한다. 광학 디스크들의 현재의 예들은 컴팩트 디스크 B 읽기 전용(CD-ROM), 컴팩트 디스크 B 읽기/쓰기(CD-R/W) 및 DVD를 포함한다.
프로그램 코드를 저장 및/또는 실행하기에 적합한 데이터 처리 시스템은 시스템 버스를 통해 메모리 소자들에 직접 또는 간접적으로 연결된 적어도 하나의 프로세서를 포함할 것이다. 메모리 소자들은 프로그램 코드의 실제 실행동안 이용되는 국부 메모리, 벌크 스토리지, 및 실행동안 코드가 벌크 스토리지로부터 검색되어야 하는 회수를 줄이기 위해 적어도 일부 프로그램 코드의 임시 저장을 제공하는 캐시 메모리들을 포함할 수 있다.
입/출력 또는 I/O 디바이스들(그에 한정되지는 않지만, 키보드들, 디스플레이들, 포인팅 디바이스들 등을 포함)은 직접 또는 중개 I/O 컨트롤러들을 통해 시스템에 연결될 수 있다. 데이터 처리 시스템이 중개 사설 또는 공중 네트워크들을 통해 다른 데이터 처리 시스템들 또는 원격 프린터들 또는 저장 디바이스들에 연결될 수 있도록 네트워크 어댑터들이 시스템에 연결될 수 있다.
소프트웨어 구현은 컴퓨터 또는 어떤 명령 실행 시스템에 의해 또는 컴퓨터 또는 어떤 명령 실행 시스템과 관련하여 사용하기 위한 프로그램 코드를 제공하는 컴퓨터-이용가능 또는 컴퓨터-읽기가능 매체로부터 액세스가능한 컴퓨터 프로그램 제품의 형태를 취할 수 있다.
각 지적재산 문서는 법률적인 출원 요건들을 충족시키는데 필요한 섹션들의 정의된 개요를 갖는 것으로 이 기술에서 알려져 있다. 문서 콜렉션에의 쿼리의 전송을 수월하게 하기 위해 하나 이상의 프로파일들이 생성된다. 각 프로파일은 문서내의 식별 섹션들 중 하나 이상에 가중치를 부여한다. 가중치는 식별 섹션의 중요도를 나타내며 복귀된 컴필레이션내의 각 문서에 값을 부가한다. 모든 쿼리들이 동일한 것은 아니다. 예를 들면, 화학 기술들에 대한 지적재산 문서들은 만약에 있다면 한정된 도면수를 갖는다는 것이 인식된다. 그것으로서, 화학 기술에 대한 쿼리는 도면들을 강조하지 않고, 쓰여진 본문에 보다 큰 강조를 둘 수 있다. 다른 결과들을 얻기 위해 다른 쿼리들이 콜렉션으로 전송된다. 따라서, 각 프로파일이 식별 섹션들의 서로다른 선택을 이용하고 다른 선택된 섹션들에 다른 가중치들을 부여하는 복수의 프로파일들의 생성은 쿼리 전송이 효율적이고 효과적으로 처리될 수 있게 하여 문서 결과들의 집중된 컴필레이션을 생성한다.
본 발명의 특정 실시예들이 예시의 목적으로 여기에 설명되었지만, 본 발명의 정신과 범위를 일탈하지 않고 다양한 변형물들이 이루어질 수 있다는 것이 이해될 것이다. 특히, 특허들, 상표들, 및 저작권들을 포함하여, 다른 형태의 지적재산 문서들이 있다. 특허 문서들의 카테고리내에는, 등록 특허들, 공개 특허, 특허 요약서들, 및 등록 실용신안들을 포함하여, 문서들의 추가 분류가 있다. 이들 문서들 중 일부는 동일한 순서로 동일한 수량의 섹션들을 포함할 수 있으며, 나머지들은 다른 수량의 섹션들 및/또는 다른 순서를 가질 것이다. 프로파일들은 제공된 섹션들, 및 반드시는 아니지만 기본적인 문서에서 그것들이 나타나는 순서를 기반으로 하여 독립적으로 생성된다.
또한, 등록 특허들과 공개 특허들, 상표 등록과 출원, 및 저작권 등록물들과 출원들을 포함하여, 지적재산 문서들에 관한 전자문서 콜렉션이 구체적으로 설명되었다. 하지만, 본 발명은 이러한 특정 카테고리들의 전자 문서들에 한정되지 않아야 한다. 일실시예에 있어서, 전자 문서 콜렉션은 한정된 복수의 섹션들을 갖는 모든 타입의 문서를 포함할 수 있다. 이는 관리자들이 문서들을 한정된 섹션들로 분석하고, 한정된 섹션들 중 하나 이상에 대한 관련 가중치들을 갖는 복수의 프로파일들을 생성하고, 선택된 프로파일을 갖는 문서 콜렉션에의 쿼리의 전송을 가능하게 한다. 위에 설명된 바와 같이, 쿼리 프로파일의 선택은 동적으로 수정될 수 있다. 일실시예에 있어서, 쿼리 컨텐츠를 유지하는 동안의 쿼리 프로파일의 수정은 컴필레이션에서 복귀된 문서들 뿐만 아니라 컴필레이션내의 문서들이 제공되는 순서도 변경할 수 있다. 따라서, 본 발명의 보호 범위는 다음의 청구범위 및 그 균등물들에 의해서만 한정된다.

Claims (46)

  1. 전자 문서 콜렉션을 검색하기 위한 컴퓨터 구현 방법으로서,
    프로세서에 의해 특허 문서들의 콜렉션을 컴파일링 및 인덱싱하는 단계로서, 상기 콜렉션내의 상기 문서들 각각은 복수의 섹션들을 갖는 컴파일링 및 인덱싱 단계;
    상기 프로세서에 의해 상기 콜렉션내의 각각의 문서의 섹션들 각각을 식별하는 단계;
    상기 프로세서에 의해 상기 문서 콜렉션을 위한 검색 프로파일을 조직하는 단계로서, 상기 검색 프로파일은 상기 컴파일링된 콜렉션내의 각각의 문서의 식별된 섹션들 중 적어도 하나의 선택을 포함하는 검색 프로파일 조직 단계;
    상기 조직된 검색 프로파일내에서, 상기 프로세서에 의해 상기 식별 및 선택된 섹션들 각각에 가중치를 부여하는 단계로서, 상기 가중치는 쿼리에 대하여 각각의 문서의 선택된 섹션들 상에 배치된 강조의 수치 측정값인, 가중치 부여 단계;
    쿼리 시간에, 적어도 하나의 검색 프로파일의 선택을 포함하여 상기 특허 문서 콜렉션에 쿼리를 전송하고, 부여된 가중치를 갖는 상기 콜렉션내의 상기 선택된 프로파일의 상기 문서 섹션들 각각의 데이터와 쿼리 데이터를 비교하는 단계;
    상기 가중치가 부여되는 각각의 상기 식별 및 선택된 섹션들 중 하나의 섹션과 매칭되는 쿼리의 양에 기초하여, 상기 가중치로부터 하나 이상의 이차 가중치를 부가 또는 차감함으로써, 상기 프로세서에 의해, 각각의 상기 식별 및 선택된 섹션들 중 상기 하나의 섹션에 부여되는 상기 가중치를 수정하는 단계로서, 상기 이차 가중치는 상기 선택된 섹션들에서 쿼리 스트링과 데이터 사이의 매치량에 대한 하나 이상의 임계치에 기초하는, 가중치 수정 단계; 및
    부여된 가중치를 갖는 적어도 하나의 식별된 프로파일 섹션내의 데이터와 상기 전송된 쿼리의 매치를 포함하여 상기 쿼리 전송으로부터 발생된 관련 문서들의 컴필레이션을 상기 프로세서에 의해 생성하는 단계를 포함하는, 컴퓨터 구현 방법.
  2. 제1항에 있어서,
    검색 프로파일내의 적어도 하나의 식별된 섹션을 적어도 두개의 서브섹션들로 재분할하고 상기 두개의 서브섹션들 중 적어도 하나에 이차 가중치를 부여하는 단계를 더 포함하는, 컴퓨터 구현 방법.
  3. 제1항에 있어서,
    관련 문서들의 상기 컴필레이션내의 각각의 문서에 대한 스코어를 계산하는 단계를 더 포함하고, 상기 스코어는 그 섹션에 대하여 부여된 가중치를 갖는 상기 선택된 프로파일의 각각의 프로파일 섹션에서의 매치량의 곱의 종합인, 컴퓨터 구현 방법.
  4. 제1항에 있어서,
    상기 콜렉션내의 각각의 특허 문서의 적어도 하나의 식별된 섹션에 부여된 가중치를 동적으로 수정하는 단계를 더 포함하는, 컴퓨터 구현 방법.
  5. 제4항에 있어서,
    상기 부여된 가중치들을 수정하기 위한 계층으로서 그래픽 유저 인터페이스를 이용하는 단계를 더 포함하고,
    상기 그래픽 유저 인터페이스는, 특허 문서의 각각의 식별된 섹션을 위한 필드 및 각각의 식별된 섹션에 대한 대응하는 슬라이드 바를 포함하는, 컴퓨터 구현 방법.
  6. 제1항에 있어서,
    상기 부여된 가중치들은 정적인 것인, 컴퓨터 구현 방법.
  7. 제1항에 있어서,
    상기 문서 콜렉션에 전송될 상기 쿼리의 범위를 기반으로 하여 특허 문서들의 콜렉션의 식별된 섹션들을 위한 사전-프로그래밍 가중치 프로파일들을 더 포함하는, 컴퓨터 구현 방법.
  8. 메모리 및 저장 매체와 통신하는 프로세서;
    상기 저장 매체에 유지된 특허 문서들의 콜렉션으로서, 상기 콜렉션내의 상기 문서들 각각은 복수의 섹션들을 갖는 콜렉션;
    문서들의 상기 콜렉션을 컴파일링 및 인덱싱하기 위한 디렉터;
    상기 디렉터와 통신하고, 상기 콜렉션내의 각각의 문서의 각각의 섹션을 식별하기 위한 문서 관리자;
    상기 문서 관리자와 통신하고, 상기 문서 콜렉션에 대한 검색 프로파일을 조직하기 위한 프로파일 관리자로서, 상기 검색 프로파일은 상기 컴파일링된 콜렉션내의 각각의 문서의 식별된 섹션들 중 적어도 하나의 선택을 포함하고, 상기 프로파일 관리자는 상기 조직된 검색 프로파일을 갖는 상기 식별 및 선택된 섹션 각각에 가중치를 부여하며, 상기 가중치는 쿼리에 대하여 각각의 문서의 선택된 섹션들 상에 배치된 강조의 수치 측정값인, 프로파일 관리자; 및
    쿼리 시간에, 쿼리를 상기 문서 콜렉션에 전송하기 위한 쿼리 관리자로서, 상기 쿼리는 적어도 하나의 검색 프로파일의 선택 및 부여된 가중치를 갖는 상기 콜렉션내의 선택된 프로파일의 문서 섹션들 각각의 데이터와 쿼리 데이터의 비교를 포함하는, 쿼리 관리자; 및
    상기 쿼리 전송으로부터 발생되고 상기 쿼리 관리자로부터 복귀된 관련 문서들의 컴필레이션을 표시하도록 구성되는 영상 디스플레이로서, 각각의 문서는 부여된 가중치를 갖는 적어도 하나의 식별 프로파일 섹션내의 데이터와 상기 쿼리의 매치를 갖는, 영상 디스플레이
    를 포함하고,
    상기 프로파일 관리자는, 상기 가중치가 부여되는 각각의 상기 식별 및 선택된 섹션들 중 하나의 섹션과 매칭되는 쿼리의 양에 기초하여, 상기 가중치로부터 하나 이상의 이차 가중치를 부가 또는 차감함으로써, 각각의 상기 식별 및 선택된 섹션들 중 상기 하나의 섹션에 부여되는 상기 가중치를 수정하며, 상기 이차 가중치는 상기 선택된 섹션들에서 쿼리 스트링과 데이터 사이의 매치량에 대한 하나 이상의 임계치에 기초하는 시스템.
  9. 제8항에 있어서,
    상기 프로파일 관리자는 적어도 하나의 검색 프로파일내의 적어도 하나의 식별된 섹션을 적어도 두개의 서브섹션들로 재분할하고 상기 두개의 서브섹션들 중 적어도 하나에 이차 가중치를 부여하는 시스템.
  10. 제8항에 있어서,
    상기 쿼리 관리자는 관련 문서들의 상기 컴필레이션내의 각각의 문서에 대한 스코어를 계산하고, 상기 스코어는 그 섹션에 대하여 부여된 가중치를 갖는 상기 선택된 프로파일의 각각의 프로파일 섹션에서의 매치량의 곱의 종합인 시스템.
  11. 제8항에 있어서,
    상기 프로파일 관리자는 상기 콜렉션내의 각각의 특허 문서의 적어도 하나의 식별된 섹션에 부여된 가중치의 동적 수정을 지원하는 시스템.
  12. 제11항에 있어서,
    상기 부여된 가중치들을 수정하기 위한 계층으로서 그래픽 유저 인터페이스를 더 포함하고,
    상기 그래픽 유저 인터페이스는 특허 문서의 각각의 식별된 섹션을 위한 필드 및 각각의 식별된 섹션에 대한 대응하는 슬라이드 바를 포함하는 시스템.
  13. 제8항에 있어서,
    상기 부여된 가중치들은 정적인 것인 시스템.
  14. 제8항에 있어서,
    상기 문서 콜렉션에 전송될 상기 쿼리의 범위를 기반으로 하여 특허 문서들의 콜렉션의 식별된 섹션들에 대한 사전-프로그래밍된 가중치 프로파일들을 더 포함하는 시스템.
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
  35. 삭제
  36. 삭제
  37. 삭제
  38. 삭제
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
KR1020117028646A 2009-05-07 2009-05-07 전자 문서 콜렉션을 검색하기 위한 방법, 시스템, 및 장치 KR101560756B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2009/043174 WO2010128967A1 (en) 2009-05-07 2009-05-07 Method, system, and apparatus for searching an electronic document collection

Publications (2)

Publication Number Publication Date
KR20120027285A KR20120027285A (ko) 2012-03-21
KR101560756B1 true KR101560756B1 (ko) 2015-10-15

Family

ID=41328521

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020117028646A KR101560756B1 (ko) 2009-05-07 2009-05-07 전자 문서 콜렉션을 검색하기 위한 방법, 시스템, 및 장치

Country Status (7)

Country Link
EP (1) EP2427830B1 (ko)
KR (1) KR101560756B1 (ko)
CN (1) CN102483744A (ko)
AU (1) AU2009345822A1 (ko)
CA (1) CA2761713A1 (ko)
NZ (1) NZ596369A (ko)
WO (1) WO2010128967A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5534266B2 (ja) * 2009-07-22 2014-06-25 ファンデーションアイピー,エルエルシー 電子文書コレクションからクエリ結果を送付する方法、システム及び装置
GB2520936A (en) * 2013-12-03 2015-06-10 Ibm Method and system for performing search queries using and building a block-level index
CN104572620B (zh) * 2014-12-31 2018-11-23 百度在线网络技术(北京)有限公司 一种用于显示章节内容的方法和装置
CN106156111B (zh) * 2015-04-03 2021-10-19 北京中知智慧科技有限公司 专利文件检索方法、装置和系统
KR101762252B1 (ko) * 2016-04-08 2017-07-31 (주)윕스 아이디어 창출 지원 방법 및 이를 위한 지원 장치
CN114528369A (zh) * 2016-12-21 2022-05-24 伊姆西Ip控股有限责任公司 创建索引的方法和设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2369698A (en) 2000-07-21 2002-06-05 Ford Motor Co Theme-based system and method for classifying patent documents

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003241487A1 (en) * 2002-05-14 2003-12-02 Verity, Inc. Apparatus and method for region sensitive dynamically configurable document relevance ranking
US7406458B1 (en) * 2002-09-17 2008-07-29 Yahoo! Inc. Generating descriptions of matching resources based on the kind, quality, and relevance of available sources of information about the matching resources
JP4972358B2 (ja) * 2006-07-19 2012-07-11 株式会社リコー 文書検索装置、文書検索方法、文書検索プログラム及び記録媒体。

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2369698A (en) 2000-07-21 2002-06-05 Ford Motor Co Theme-based system and method for classifying patent documents

Also Published As

Publication number Publication date
CA2761713A1 (en) 2010-11-11
NZ596369A (en) 2014-02-28
KR20120027285A (ko) 2012-03-21
AU2009345822A1 (en) 2011-12-01
CN102483744A (zh) 2012-05-30
EP2427830B1 (en) 2015-06-24
WO2010128967A1 (en) 2010-11-11
EP2427830A1 (en) 2012-03-14

Similar Documents

Publication Publication Date Title
KR101481680B1 (ko) 전자적 문서 집합으로부터 질의의 결과를 산출하는 방법, 시스템 및 장치
TWI396984B (zh) 使用網路文件的偏擊距離之排序功能
KR101560756B1 (ko) 전자 문서 콜렉션을 검색하기 위한 방법, 시스템, 및 장치
US7917511B2 (en) Query system using iterative grouping and narrowing of query results
US8285702B2 (en) Content analysis simulator for improving site findability in information retrieval systems
US8364679B2 (en) Method, system, and apparatus for delivering query results from an electronic document collection
US20100287177A1 (en) Method, System, and Apparatus for Searching an Electronic Document Collection
WO2006022739B1 (en) Method and system for processing grammar-based legality expressions
US20100287148A1 (en) Method, System, and Apparatus for Targeted Searching of Multi-Sectional Documents within an Electronic Document Collection
CN101458692A (zh) 一种战略物资行业知识库的平台及其构建方法
JP5552582B2 (ja) コンテンツ検索装置
KR101683138B1 (ko) 정보검색장치 및 그 동작 방법
US20110295861A1 (en) Searching using taxonomy
JP5516916B2 (ja) 電子ドキュメントコレクション内の複数選択ドキュメントを標的調査する方法、システムおよび装置
CN115982429B (zh) 一种基于流程控制的知识管理方法及系统
EP2577495A1 (en) Searching using taxonomy
US20090187572A1 (en) Systems and methods for providing access to instructional content
Mohan et al. Ipac: an interactive approach to access control for semi-structured data
Hoashi et al. Implementation of relevance feedback for content-based music retrieval based on user prefences
Garcia-Alvarado et al. ONTOCUBO: cube-based ontology construction and exploration
Batcheller et al. Automating geospatial metadata using ESRI’s ArcGIS and Microsoft’s .NET
Barat Design and implementation of content based text retrieval system
WO2016006998A1 (en) Method and system to retrieve relevant data based on linked-up service with embedded access control

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180918

Year of fee payment: 4