KR101487561B1 - 소스 검색 엔진 - Google Patents

소스 검색 엔진 Download PDF

Info

Publication number
KR101487561B1
KR101487561B1 KR1020087030879A KR20087030879A KR101487561B1 KR 101487561 B1 KR101487561 B1 KR 101487561B1 KR 1020087030879 A KR1020087030879 A KR 1020087030879A KR 20087030879 A KR20087030879 A KR 20087030879A KR 101487561 B1 KR101487561 B1 KR 101487561B1
Authority
KR
South Korea
Prior art keywords
documents
source
search
interface
organizations
Prior art date
Application number
KR1020087030879A
Other languages
English (en)
Other versions
KR20090035487A (ko
Inventor
요른 리세그겐
Original Assignee
요른 리세그겐
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=38724036&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR101487561(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 요른 리세그겐 filed Critical 요른 리세그겐
Publication of KR20090035487A publication Critical patent/KR20090035487A/ko
Application granted granted Critical
Publication of KR101487561B1 publication Critical patent/KR101487561B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Peptides Or Proteins (AREA)

Abstract

인터페이스(64)(예를 들어, 개인용 컴퓨터 상의 웹 브라우져)로부터 적어도 하나의 검색 용어(예를 들어, HIV)를 수신하는 것을 포함하는 방법. 상기 방법은 검색 용어의 적어도 일부분을 포함하는 문서(예를 들어, 웹 페이지들)들을 네트워크(66)에서 검색할 수 있다. 상기 방법은 소스(예를 들어, 내셔널 지오그래픽 또는 내셔널 인콰이어러와 같은 뉴스발행처들)를 결정하고, 문서들의 소스에 기초하여 문서들을 정렬할 수 있다. 검색 엔진은 문서들의 소스에 기초하여 검색 결과들을 평가(예를 들어, 정렬)하기 위해 소스를 사용하는 방법을 실행할 수 있다.
검색 엔진, 소스(source), 자격 평가(qualifying)

Description

소스 검색 엔진{Source search engine}
2006년 5월 19일 미국특허상표청에 가출원된 미국 특허 가출원 제 60/747,735에 대하여 우선권이 주장되며, 상기 가출원 전체를 본 출원에 원용한다.
본 실시 예는 인터페이스(예를 들어, 개인용 컴퓨터 상의 웹 브라우져)로부터 적어도 하나의 검색 용어(예를 들어, HIV)를 수신하는 것을 포함하는 방법에 관한 것이다.
컴퓨터, 정보 네트워크 및 인터넷의 발달로 인해, 많은 수의 문서들이 사용자에게 평가될 수 있게 되었다. 예를 들어, 인터넷 사용자는 전 세계에 걸쳐 존재하는 막대한 수의 자원들로부터 웹 페이지들을 엑세스할 수 있다. 많은 양의 문서들 및/또는 컨텐츠가 시간이 지남에 따라 급속도로 증가되고 있기 때문에, 관심 있는 주제들에 관련된 문서들을 찾는 것이 사용자들에게는 도전이 되고 있다.
따라서, 인터넷 및 다른 네트워크들(예를 들어, 인트라넷 네트워크들)의 출현과 함께 검색 엔진들이 개발되어왔다. 검색 엔진들은 검색 용어를 입력하는 것을 사용자들에게 허용했고, 이러한 검색 용어들로부터 문서들에 대한 참조(예를 들어, 인터넷 링크)을 수신할 수 있다. 이러한 참조들은 사용자의 웹 브라우져가 인터넷을 통해 관심 있는 문서(예를 들어, 웹 페이지)를 다운로드할 수 있도록 가리키는 인터넷 링크들의 형태로 될 수 있다.
그러나, 많은 검색 엔진들이 비능률적이어서 검색 엔진의 결과가 쓸모없게 될 수 있다. 예를 들면, 사용자가 검색 용어(예를 들어, "HIV")를 입력할 때, 검색 엔진은 상기 검색 용어의 주제와 관련 있는 많은 페이지들을 산출할 것이다. 그러나, 거기에는 검색 용어와 연관 있는 소화할 수 없는 양의 문서들이 있을 것이므로, 검색 엔진은 사용자에게 가장 흥미 있을 문서로 엑세스하도록 하기 위해 찾아낸 문서들의 연관성의 순위를 매기려고 시도할 것이다. 유감스럽게도, 어떤 검색 엔진들은 항상 가장 확실하고 연관 있는 정보를 사용자에게 제공하지는 않는 프로세스(예를 들어, 알고리즘들)를 사용할 수도 있다. 따라서, 비록 어떤 검색 엔진들이 존재하는 웹페이지들을 찾는데 사용자들에게 도움을 줄지라도, 이들 검색 엔진들은 사용자들이 그들에게 가장 유용할 수 있는 문서들 또는 정보를 발견하는 것을 돕거나 제공하는데에 여전히 효과적이지 않을 수 있다. 예를 들어, 만일 사용자가 검색 엔진으로 검색 용어 "HIV"를 입력하면, 결과들의 양은 굉장할 것이고, 처음 사용자의 눈에 보이는 결과물들의 연관성은 매우 제한될 수 있다.
따라서, 많은 검색 엔진들의 한 가지 한계는 문서들의 연관성의 순위를 매기는 방법(예를 들어, 문서들이 검색 엔진 결과에 나타나는 순서)에 있다. 검색 엔진의 검색으로부터 생성되는 문서들의 연관성은 임의적으로 나타날 수 있다. 연관성은 해당 페이지로 링크하는 사용자들의 수, 페이지와 연관된 링크들의 수, 또는 또 다른 경험적인 수단들에 근거할 수 있다. 그러나, 신뢰성 있는 연관성 랭킹을 갖는 검색 엔진 결과를 가져다줄 수 있는, 네트워크에서 엑세스 가능한 문서들의 실질적인 연관성 특징들을 많은 검색 엔진들이 사용하고 있지 않다. 예를 들어, 많은 검색 엔진들은 검색 엔진 결과들의 연관성의 순위를 매기는 인자로 문서들의 소스(예를 들어, 저자)를 사용하지 않는다.
실시 예들은 인터페이스로부터 적어도 하나의 검색 용어를 수신하는 것을 포함하는 방법들에 관한 것이다. 실시 예에서, 인터페이스는 인터넷 인터페이스가 될 수 있다. 실시 예에서, 인터페이스는 인트라넷 인터페이스가 될 수 있다. 실시 예에서 인터페이스는 검색 용어들의 입력을 허용하는 어떤 다른 종류의 컴퓨터 인터페이스 또는 개인용 인터페이스가 될 수 있다. 실시 예에서, 검색 용어는 단어들 및/또는 파일들의 입력을 포함할 수 있다. 입력 단어들은 검색될 용어들, 소스들의 리스트 또는 다른 연관 있는 정보를 포함할 수 있다.
실시 예들은 입력 검색 용어의 적어도 일부분을 포함하는 문서들을 네트워크에서 검색하는 것을 포함하는 방법에 관한 것이다. 실시 예에서, 네트워크는 인터넷 네트워크가 될 수 있다. 실시 예에서, 네트워크는 인트라넷 네트워크가 될 수 있다. 실시 예에서, 네트워크는 개방형 네트워크 및 폐쇄형 네트워크를 포함하는 어떤 종류의 컴퓨터 네트워크가 될 수 있다. 실시 예에서, 검색 엔진은 소스 검색 엔진 및/또는 다른 종류의 검색 엔진들이 될 수 있다. 실시 예에서, 네트워크는 컴퓨터 시스템 상에서 저장된 정보를 찾는 것을 돕기 위해 설계된 정보 검색 시스템이 될 수 있다.
실시 예에서, 문서들은 웹 페이지들을 포함할 수 있다. 실시 예에서, 문서들은 발표된 기사들을 포함할 수 있다. 실시 예에서, 문서들은 오디오 클립들을 포함할 수 있다. 실시 예에서, 문서들은 비디오 클립들을 포함할 수 있다. 실시 예에서, 문서들은 물리적인 문서들을 포함할 수 있다. 실시 예에서, 문서들은 전자 문서들을 포함할 수 있다. 실시 예에서, 문서들은 네트워크상에서 엑세스 가능하거나 식별 가능한 다른 어떤 종류의 컨텐츠도 포함할 수 있다.
실시 예들은 문서들의 소스를 결정하는 것을 포함하는 방법에 관한 것이다. 실시 예에서, 소스는 문서를 작성한 사람이 될 수 있다. 실시 예에서, 소스는 문서를 발표한 사람이 될 수 있다. 실시 예에서, 소스는 문서에 인용된 사람이 될 수 있다. 실시 예에서, 소스는 검색 용어와 연관된 사람이 될 수 있다. 실시 예에서, 소스는 문서를 작성한 조직이 될 수 있다. 실시 예에서, 소스는 문서를 발표한 조직이 될 수 있다. 실시 예에서, 소스는 문서에 인용된 조직이 될 수 있다. 실시 예에서, 소스는 검색 용어와 연관된 조직이 될 수 있다.
실시 예들은 문서들의 소스에 기초하여 문서들을 정렬하는 것을 포함하는 방법에 관한 것이다. 실시 예에서, 어떤 방법은 문서의 소스에 기초하여 문서들의 연관성을 결정하는 것을 포함할 수 있다. 실시 예에서, 문서들의 소스에 기초하여 문서들의 연관성을 결정하는 것은 문서들의 소스에 기초하여 문서들을 정렬하는 것에 포함될 수 있다. 실시 예에서, 문서들의 연관성을 결정하는 것은 문서의 소스를 토대로 할 수 있다. 실시 예에서, 연관성을 결정하는 것은 문서들의 매치품질(match quality)을 토대로 할 수 있다. 실시 예에서, 문서의 연관성을 결정하는 것은 문서의 소스와 문서의 매치품질을 토대로 할 수 있다.
실시 예에서, 문서의 연관성을 결정하는 것은 문서의 소스의 자격을 평가하는 것을 포함할 수 있다. 문서의 소스의 자격을 평가하는 것은 경험적으로(예를 들어, 문서들 및 관련된 문서들의 통계 분석) 실행될 수 있다. 실시 예에서, 문서의 자격평가는 사용자 입력 또는 검색 엔진 파라미터들을 토대로 할 수 있다. 사용자 입력은 사용자에게 가장 흥미 있는 사전 자격 평가된 소스들을 포함할 수 있다. 실시 예에서, 검색 엔진은 연관 있는 문서들을 찾기 위해 사전 자격 평가된 소스들에 동등성을 사용할 수 있다. 실시 예에서, 사용자 인터페이스는 가장 연관 있다고 결정된 것부터 가장 연관 없다고 결정된 것까지 순서대로 문서들의 리스트를 디스플레이할 수 있다.
실시 예에서, 인터페이스는 소스의 상대적 자격 평가에 기초하는 방법으로 문서들의 소스의 ID를 출력할 수 있다. 실시 예에서, 좀더 높게 자격이 평가된 소스들은 좀더 낮게 자격이 평가된 소스들 전에 나열될 수 있다. 실시 예에서, 문서들은 소스에 의해 그룹화될 수 있다.
실시 예에서, 문서들은 선택 가능한 소스들로서 사용자 인터페이스로 출력할 수 있다. 사용자는 소스들을 선택하여 선택된 소스와 연관된 문서들의 출력을 허용할 수 있다.
실시 예에서, 소스의 자격을 평가하는 것은 소스의 평판을 토대로 할 수 있다. 실시 예에서, 소스의 평판은 소스의 문서들을 작성한 사람들의 신뢰도를 토대로 할 수 있다. 실시 예에서, 소스의 평판은 소스로부터 문서들을 발표한 사람들의 신뢰도를 토대로 할 수 있다. 실시 예에서, 평판은 소스로부터 문서에 인용된 사람들의 신뢰도를 토대로 할 수 있다. 실시 예에서, 평판은 소스로부터 문서 내의 검색 용어와 연관된 사람들의 신뢰도를 토대로 할 수 있다. 실시 예에서, 소스의 평판은 소스로부터 문서들을 작성한 조직들의 신뢰도를 토대로 할 수 있다. 실시 예에서, 소스의 평판은 소스로부터 문서들을 발표한 조직들의 신뢰도를 토대로 할 수 있다. 실시 예에서, 소스의 평판은 소스에 의해 문서들내에 인용된 조직들의 신뢰도를 토대로 할 수 있다. 실시 예에서, 소스의 평판은 소스로부터 문서들 내의 하나의 검색 용어와 연관된 조직들의 신뢰도를 토대로 할 수 있다. 이 기술분야에서 통상의 지식을 지닌 자라면 소스의 평판을 다른 방법으로 할당할 수 있음을 이해할 것이다.
실시 예에서, 문서들의 소스의 자격 평가를 하는 것은 소스로부터 검색하는 동안 발견된 문서들의 상대적 양을 토대로 할 수 있다. 실시 예에서, 문서들의 소스의 자격 평가는 적어도 하나의 선호되는 소스 중 하나인 소스를 토대로 할 수 있다. 선호되는 소스의 실시 예들은 관리자들에 의해 검색 엔진으로 알고리즘에 의해 할당되거나 검색 엔진의 특정 사용자에 의해 결정될 수 있다.
도 1-9는 실시 예에 따른 입력들 및 출력들의 예를 포함하는 소스 검색 엔진 인터페이스를 나타낸다.
도 9-15는 실시 예에 따른 소스 검색 엔진에 의해 실행될 수 있는 프로세스의 블록 다이어그램 플로우차트를 나타낸다.
도 16-19는 실시 예에 따른 사용자 인터페이스와 네트워크들 간의 인터랙션 블록 다이어그램을 나타낸다.
도 1-9는 실시 예들에 따른 소스 검색 엔진의 인터페이스 예를 나타낸다. 검색 엔진(18)은 컴퓨터 하드웨어(예를 들어, 서버, 개인용 컴퓨터 또는 다른 전자 장치)내에 포함될 수 있다. 사용자 터미널(예를 들어, 웹 브라우져를 갖는 개인용 컴퓨터, 그래픽 사용자 인터페이스(GUI), 키패드 입력을 갖는 휴대폰 또는 다른 컴퓨팅 인터페이스 메커니즘)은 네트워크(16)(예를 들어, 인터넷, 인트라넷 네트워크 또는 다른 컴퓨터 네트워크)를 통해 검색 엔진으로 연결되거나 검색 엔진(18)으로 직접 연결될 수 있다. 검색 용어 입력(10)은 사용자 터미널(14)로 입력될 수 있다. 이와 마찬가지로, 검색 출력(20)은 사용자 터미널(14)로부터 출력될 수 있다.
도 1은 검색 용어 입력에 응하여 문서들의 리스트를 출력하는 소스 검색 엔진을 나타낸다. 윈도우(12)는 검색 용어(예를 들어, "HIV")가 입력된 사용자 터미널(14)에서 사용자 인터페이스의 스크린 샷 예이다. 검색 용어가 네트워크(16)를 통하여 사용자 터미널(14)로부터 검색 엔진(18)으로 전송된 후, 검색 결과들(예를 들어, 문서 결과의 형태로)은 검색 출력(20)을 통하여 사용자 터미널(14)로부터 출 력될 것이다. 윈도우(22)는 검색 용어 "HIV"에 대응하여 소스 검색 엔진을 통해 출력하는 연관된 문서들의 스크린 샷 예를 나타낸다. 윈도우(22)에 나타낸 것처럼, "History of HIV"라는 제목이 붙여진 문서는 문서들의 리스트 내에 첫 번째에 나타나고, "HIV Drug Analysis"라는 제목이 붙여진 문서가 뒤따르고, 그 다음에 "HIV Came from Aliens!"라는 제목이 붙여진 문서가 뒤따른다. 이러한 예시적인 검색 결과는 실시 예에 따라 문서들의 소스에 기초하는 연관성에 따라 순위가 매겨진다.
도 2는 도 1에 나타낸 실시 예와 유사하다. 그러나, 검색 출력(20)은 문서의 제목과 함께 문서의 소스 표시를 포함하는 윈도우(24)를 가질 수 있다. 예를 들어, "History of HIV"라는 제목이 붙여진 문서는 정기 간행의 내셔널 지오그래픽으로부터 온 것으로 표시되어 있다. 이와 마찬가지로, "HIV Drug Analysis"라는 제목이 붙여진 문서는 정부 소스인 국립보건원(National Institute of Health:NIH)로부터 온 것으로 표시되어 있다. 또한, "HIV Came from Aliens!"라는 제목이 붙여진 기사는 정기 간행의 내셔널 인콰이어러로부터 유래된 것임이 표시되어 있다. 문서들의 소스 표시는 연관성의 순위를 매기는데 사용될 수 있으며, 사용자가 그들의 관심에 가장 관련 있는 문서를 선택하도록 도울 수 있다.
도 1 및 도 2에서 도시한 실시 예에서, 기사들의 제목은 네트워크 상에서 엑세스 될 이 문서들에 대한 링크를 포함할 수 있다.
도 3은 도 1 및 도 2에 도시한 실시 예와 유사한 실시 예를 나타내지만, 검색 용어 입력(10) 및 검색 출력(20)은 사용자가 검색 용어 입력(10)에 소스들을 지정하도록 할 수 있다. 윈도우(26)에 나타낸 것처럼, 소스 검색 엔진은 사용자가 관 심 있는 검색 용어 및 소스들의 입력을 허용한다. 윈도우(26)에 나타낸 예에서, 검색 용어는 "HIV"이고 소스들은 "National Geographic"과 "NIH"와 같이 표시된다. 예시적인 윈도우(28)에 표시한 것처럼, 리스트된 문서들은 "National Geographic"과 "NIH"로부터의 것들뿐이다. 실시 예에서, 윈도우(26)에 입력된 소스들은 사용자로 하여금 어떤 정보 소스가 가장 관련 있는 검색 결과를 출력하도록 사용될 수 있는지 자격을 줄 수 있도록 한다는 점에서 미리 적격화된(pre-qualified) 소스라고 생각할 수도 있을 것이다. 실시 예에서, 검색 엔진은 입력 소스와 동등하다고 생각되는 다른 소스를 대치하여 관련 있는 검색 결과를 출력하도록 할 수도 있다.
도 4는 도 1-3의 실시 예와 유사하지만, 검색 출력(20)이 문서 결과들 대신 소스 결과들을 출력한다. 윈도우(30)에 나타낸 것처럼, 검색 용어 "HIV"의 입력으로 소스 결과들이 출력된다. 이 예에서, 검색 용어 "HIV"로부터 소스 결과들은 "National Geographic", "National Institute of Health" 및 "National Enquirer"와 같이 표시된다. 실시 예에서, 사용자는 해당 소스로부터의 문서들의 리스트를 보기 위해 소스들 중 하나를 선택할 수 있다. 소스들은 소스들의 확립된 신뢰도, 소스들에 의해 엑세스 가능한 문서들의 수, 소스들의 다른 중요한 사전 결정된 특성들, 다른 경험적인 데이터 및/또는 인자들의 결합에 기초하여 순위가 매겨질 수 있다. 실시 예에서, 사용자는 소스를 선택할 수 있으므로, 사용자는 그들의 요구들과 가장 연관 있는 문서들을 엑세스 할 수 있을 것이다.
도 5는 도 4에 나타낸 실시 예와 유사한 실시 예들을 나타낸다. 윈도우(32)에 나타낸 것처럼, 소스 결과들의 출력은 소스와 연관된 문서들에 관한 다른 정보 를 줄 것이다. 예를 들어, 소스 결과들 내에 소스와 연관될 문서들의 수가 표시될 것이다. 예를 들어, 윈도우(32)에는 검색 용어 "HIV"로부터 정기 간행의 "National Geographic"과 연관된 두 개의 문서들이 결과로 나옴이 표시된다. 마찬가지로, 소스 "National Institute of Health"로부터 하나의 문서가, 소스 "National Enquirer"로부터 하나의 문서가 있음이 표시된다. 마찬가지로, 도 6에서, 윈도우(34)에 나타낸 소스 결과들은 소스의 자격 수준을 표시할 것이다. 예를 들어, 윈도우(34)에서 소스 결과들은 National Geographic과 National Institute of Health는 "높은 자격"을 갖는 것으로 보여주는 반면, National Enquirer는 "낮은 자격"을 갖는 것으로 표시된다. 어떤 것을 자격이 높거나 낮다고 평가하거나 또는 계량화하여 평가하는 것은 사용자들로부터의 피드백, 검색 엔진 알고리즘에서 사용되는 중요한 결정 및/또는 경험적인 데이터에 기초하여 결정될 수 있다. 경험적인 데이터의 예는 그 소스로부터의 기사들에 대한 엑세스의 총 수, 엑세스의 패턴, 문서들을 보는데 사용된 시간 및/또는 다른 요인들이 될 수 있다.
도 7은 도 1-6에 나타낸 실시 예들과 유사한 실시 예들을 나타낸다. 여기서, 검색 출력은 소스 및 소스와 연관된 문서들 둘 다의 표시를 포함한다. 윈도우(36)에 나타낸 것처럼, 소스는 소스와 연관된 문서들의 리스트를 디스플레이하기 위해 선택될 수 있다. 이 예에서, 소스 "National Geographic"은 선택되어 "History of HIV" 및 "Impact of HIV in Africa"라는 제목의 기사들을 디스플레이한다. 비록 "National Institute of Health" 및 "National Enquirer"인 소스가 선택되지 않더라도, 그들은 여전히 검색 결과로서 볼 수 있을 것이다. 도 7에서 나타낸 실시 예 들과 유사한, 도 8에 나타낸 실시 예들은 모든 문서들 또는 선택된 문서들 또는 소스 결과들과 연관된 가장 높게 자격 평가된 문서들을 보일 수 있다.
소스들은 검색 용어와 연관된 문서들을 작성한 사람들, 문서들에 인용된 사람들, 문서들을 작성한 단체(예를 들어, 회사, 협회, 정부단체 또는 어떤 다른 조직), 문서들에 인용된 단체 및/또는 다른 어떠한 사람(및/또는 단체)를 포함할 수 있다. 실시 예에서, 소스들은 중요성(예를 들어, 문서들과 연계된 빈도수, 문서를 발표하는 미디어 출처의 신뢰도, 문서와 연관된 조직의 신뢰도 등)의 순서대로 알고리즘에 의해 순위가 매겨질 수 있다.
도 9-15는 실시 예에 따라 검색 엔진에서 구현될 수 있는 알고리즘들을 나타낸다. 본 기술 분야에서 통상적인 지식을 가진 자에게는 상기 알고리즘의 수정이 본 실시 예의 사상으로부터 벗어남 없이 행해질 것임이 명백할 것이다. 도 9에 나타낸 것처럼, 검색 엔진은 인터페이스로부터 검색 용어들을 수신할 수 있다(블록 40). 검색 엔진은 문서들을 네트워크에서 검색할 수 있다(블록 42). 검색 엔진은 문서들의 소스를 결정할 수 있다(블록 44). 검색 엔진은 소스에 기초하여 문서들을 정렬할 수 있다(블록 46). 검색 엔진은 인터페이스로 검색 결과들을 출력할 수 있다(블록 48).
도 10에 나타낸 실시 예에서, 소스에 기초하여 문서들을 정렬하는 것은 소스에 기초하여 문서들의 연관성을 결정하는 것을 포함할 수 있다(블록 50). 도 11에 나타낸 것처럼 소스에 기초하여 문서들을 정렬하는 것은 소스 및 검색 용어에 기초하여 문서들의 연관성을 결정하는 것을 포함할 수 있다(블록 52). 도 12에 나타낸 것처럼, 소스에 기초하여 문서들을 정렬하는 것은 실시 예에 따라 소스들의 자격 평가를 하는 것(블록 54) 및/또는 소스에 기초하여 문서들의 연관성을 결정하는 것(블록 56)이 포함될 수 있다.
도 13-15에 나타낸 실시 예에서, 인터페이스로 검색 결과들을 출력하는 것은 다른 방법들로 수행될 수도 있다. 도 13에 나타낸 것처럼, 검색 결과들은 도 1과 유사하게 인터페이스로 문서들의 ID(identification)가 출력되는 것에 의해 인터페이스로 출력된다(블록 58). 도 14에 나타낸 것처럼, 인터페이스로 검색 결과를 출력하는 것은 도 3-6과 유사하게 인터페이스로 소스들의 ID를 출력하는 것을 포함할 수 있다(블록 60). 도 15에 나타낸 것처럼, 인터페이스로 검색 결과들을 출력하는 것은 도 7-8과 유사하게 인터페이스로 소스 및 문서들의 ID를 출력하는 것을 포함할 수 있다(블록 62).
도 16-18은 실시 예에 따른 사용자 인터페이스(64)와 네트워크(66) 간의 인터랙션을 나타낸다. 도 16에 나타낸 것처럼, 검색 용어가 사용자 인터페이스(64)로 입력되고 나서 네트워크(66)를 통하여 통신될 수 있다. 네트워크는 검색 엔진과 인터랙트하여 사용자에게 디스플레이되는 사용자 인터페이스(64)로 문서 리스트를 출력할 수 있다. 도 17에 나타낸 것처럼, 실시 예에 따라 검색 용어는 사용자 인터페이스(64)로 입력될 수 있다. 사용자 인터페이스는 네트워크(66)를 통하여 검색 엔진으로 그 검색 용어를 전달할 수 있고, 그럼으로써 사용자 인터페이스(64)로 소스 리스트를 출력하여 사용자에게 디스플레이 되도록 한다. 도 18에 나타낸 것처럼, 검색 용어는 사용자 인터페이스(64)로 입력될 수 있다. 검색 용어는 사용자 인터페이스(64)로부터 네트워크(66)로 전달될 수 있다. 네트워크(66)는 사용자에게 디스플레이 되도록 사용자 인터페이스(64)로 소스 및 문서 리스트들을 출력하는 검색 엔진을 포함할 수 있다.
도 19는 실시 예에 따른 사용자 인터페이스(68)와 사용자의 인터랙션을 나타낸다. 도시한 것처럼, 사용자는 사용자 인터페이스(68)로 검색 용어를 입력할 수 있다. 사용자 인터페이스는 실시 예에 따라 소스 리스트를 출력할 수 있다. 사용자는 사용자 인터페이스(68)로 소스 리스트로부터 소스를 입력(예를 들어, 선택)함으로써 문서 리스트를 디스플레이하도록 할 수 있다. 실시 예에서, 사용자가 소스 리스트로부터 소스를 선택하는 것이 불필요할 수도 있다. 실시 예에서, 소스 리스트는 문서 리스트를 포함한다. 기술 분야에서 통상의 지식을 가진 자는 검색 엔진으로부터 가장 연관 있는 문서들을 수신하기 위하여 사용자에 의해 선택된 소스들과 검색 용어들과 소스 리스트들과 문서 리스트들의 다양한 조합을 이해할 것이다.
앞서 말한 실시 예들(예를 들어, 소스 검색 엔진) 및 이점들은 단지 예에 불과하고, 부가되는 청구항들을 제한하는 것으로 해석되지 않는다. 상기 교시들은 다른 장치들 및 방법들에 적용될 수 있으며, 이는 본 기술 분야에서 통상의 지식을 가진 자들이 이해할 것이다. 다양한 대체, 변경 및 변화는 본 기술 분야의 지식을 가진 자들에게는 명백할 것이다.
본 실시 예는 인터페이스(64)(예를 들어, 개인용 컴퓨터 상의 웹 브라우져)로부터 적어도 하나의 검색 용어(예를 들어, HIV)를 수신하는 것을 포함하는 방법에 관한 것이다. 상기 방법은 검색 용어의 적어도 일부분을 포함하는 문서(예를 들어, 웹 페이지들)들을 네트워크(66)에서 검색할 수 있다. 상기 방법은 소스(예를 들어, 내셔널 지오그래픽 또는 내셔널 인콰이어러와 같은 뉴스발행처들)를 결정하고, 문서들의 소스에 기초하여 문서들을 정렬할 수 있다. 따라서, 실시 예들에 따르면, 검색 엔진은 문서들의 소스에 기초하여 검색 결과들을 평가(예를 들어, 정렬)하기 위해 소스를 사용하는 방법을 실행할 수 있다. 예를 들어, (다수에 의해 종종 신뢰성 있는 뉴스원으로 간주되는) 내셔널 지오그래픽으로부터 발표된 "HIV" 주제와 관련된 기사들이 (신뢰성 없는 뉴스원으로 종종 간주되는) 내셔널 인콰이어러에 의해 발표된 기사들보다 더 많은 연관성을 줄 것이다.
소스에 기초하여 문서들을 정렬함으로써, 보다 연관 있는 검색 결과들이 사용자에게 제공될 수 있다. 실시 예들에서, 연관성 정렬을 위해 소스를 사용하는 검색 엔진과 함께 그래픽 사용자 인터페이스는 최종 사용자에게 유용한 좀 더 연관성 있는 검색 결과를 가져올 수 있을 것이다. 실시 예들에서, 검색 엔진으로부터의 검색 결과들은 사용자에게 소스들을 나열함에 의해 강화될 수 있다. 실시 예에 따르면 소스는 검색 결과들과 함께 표시될 수 있다. 사용자는 실시 예에 따라 소스를 선택함으로써, 소스에 기초하여 가장 연관성 있는 문서들로 사용자를 안내하도록 할 수 있다. 따라서, 실시 예들에 따라 소스 검색 엔진을 사용함으로써 사용자는 인터넷 상에서 늘어나고 있는 굉장히 많은 문서들을 보다 효과적이고 효율적으로 엑세스할 수 있다.

Claims (20)

  1. 인터넷 인터페이스 또는 인트라넷 인터페이스 중의 적어도 하나로부터 적어도 하나의 검색 용어를 수신하는 단계;
    상기 적어도 하나의 검색 용어 중 적어도 일부분을 포함하는 문서들을 인터넷 또는 인트라넷 중의 적어도 하나에서 검색하는 단계;
    상기 검색의 결과 문서들의 소스를 결정하는 단계;
    적어도 상기 결과 문서들의 소스에 기초하여 상기 결과 문서들의 연관성을 결정하는 단계로서, 적어도
    소스의 평판, 및
    사용자에 의해 입력된 적어도 하나의 미리 적격화된(pre-qualified) 소스에 대한 동등성
    에 기초하여 상기 결과 문서들의 소스의 자격 평가를 하는 것을 구비하는 단계; 및
    적어도 상기 문서들의 소스의 자격 평가에 기초하여 상기 문서들을 정렬하는 단계
    를 포함하는 컴퓨터로 구현되는 방법.
  2. 삭제
  3. 제 1항에 있어서,
    인터넷 또는 인트라넷 중의 적어도 하나에서 검색하는 상기 단계는 검색 엔진에 의해 수행되는 것인 방법.
  4. 제 1항에 있어서, 문서들은
    웹페이지;
    발표된 기사들;
    오디오 클립들;
    비디오 클립들;
    물리적인 문서들; 및
    전자 문서들
    중 적어도 하나를 포함하는 방법.
  5. 제 1항에 있어서, 소스는
    문서들을 작성한 사람들;
    문서들을 발표한 사람들;
    문서들에 인용된 사람들;
    상기 적어도 하나의 검색 용어와 연관된 사람들;
    문서들을 작성한 조직들(organizations);
    문서들을 발표한 조직들;
    문서들에 인용된 조직들; 및
    상기 적어도 하나의 검색 용어와 연관된 조직들
    중 적어도 하나인 방법.
  6. 삭제
  7. 삭제
  8. 삭제
  9. 제 1항에 있어서, 상기 문서들의 연관성에 기초하는 방법으로 상기 문서들의 ID를 인터페이스로 출력하는 것을 구비하는 방법.
  10. 제 9항에 있어서, 상기 문서들의 연관성에 기초하는 상기 방법은 연관성의 순위에 따라 상기 문서들을 나열하는 것을 구비하는 방법.
  11. 제 1항에 있어서, 소스의 자격 평가에 기초하는 방식으로 상기 문서들의 소스의 ID를 인터페이스로 출력하는 것을 구비하는 방법.
  12. 제 11항에 있어서, 소스의 자격 평가에 기초하는 상기 방식은 가장 자격이 되는 것부터 가장 자격이 안 되는 것까지의 순서에 따라 소스들을 나열하는 것을 구비하는 방법.
  13. 제 11항에 있어서, 소스의 자격 평가에 기초하는 방식으로 상기 문서들의 소스에 의해 그룹화된 문서들의 ID를 인터페이스로 출력하는 것을 구비하는 방법.
  14. 제 11항에 있어서, 상기 출력은
    상기 문서들의 적어도 하나의 소스를 출력하는 것;
    상기 적어도 하나의 소스 중 적어도 하나에 대한 선택을 수신하는 것; 및
    상기 적어도 하나의 선택된 소스와 연관된 상기 문서들 중 적어도 하나를 출력하는 것
    을 구비하는 방법.
  15. 제 14항에 있어서, 상기 문서들 중 적어도 하나의 소스를 출력하는 것은 상기 적어도 하나의 소스의 자격 수준을 출력하는 것을 구비하는 방법.
  16. 삭제
  17. 제 1항에 있어서, 소스의 평판은
    문서들을 작성한 사람들의 신뢰도;
    문서들을 발표한 사람들의 신뢰도;
    문서들에 인용된 사람들의 신뢰도;
    상기 적어도 하나의 검색 용어와 연관된 사람들의 신뢰도;
    문서들을 작성한 조직들의 신뢰도;
    문서들을 발표한 조직들의 신뢰도;
    문서들에 인용된 조직들의 신뢰도; 및
    상기 적어도 하나의 검색 용어와 연관된 조직들의 신뢰도
    중 적어도 하나를 토대로 하는 방법.
  18. 제 1항에 있어서, 상기 문서들의 소스의 자격 평가는 상기 소스로부터 상기 검색 동안 발견한 문서들의 상대적 양(quantity)을 토대로 하는 것인 방법.
  19. 삭제
  20. 삭제
KR1020087030879A 2006-05-19 2007-05-18 소스 검색 엔진 KR101487561B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US74773506P 2006-05-19 2006-05-19
US60/747,735 2006-05-19
PCT/US2007/069263 WO2007137171A2 (en) 2006-05-19 2007-05-18 Source search engine

Publications (2)

Publication Number Publication Date
KR20090035487A KR20090035487A (ko) 2009-04-09
KR101487561B1 true KR101487561B1 (ko) 2015-01-29

Family

ID=38724036

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087030879A KR101487561B1 (ko) 2006-05-19 2007-05-18 소스 검색 엔진

Country Status (10)

Country Link
US (2) US20080005099A1 (ko)
EP (1) EP2021913A4 (ko)
JP (1) JP5118693B2 (ko)
KR (1) KR101487561B1 (ko)
CN (2) CN105608110A (ko)
AU (1) AU2007253724A1 (ko)
BR (1) BRPI0712593A2 (ko)
CA (1) CA2652409A1 (ko)
WO (1) WO2007137171A2 (ko)
ZA (1) ZA200809919B (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140101551A1 (en) * 2012-10-05 2014-04-10 Google Inc. Stitching videos into an aggregate video

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6314420B1 (en) 1996-04-04 2001-11-06 Lycos, Inc. Collaborative/adaptive search engine
JP2004029943A (ja) 2002-06-21 2004-01-29 Recruit Co Ltd 検索支援方法
JP2004206571A (ja) * 2002-12-26 2004-07-22 Nippon Telegr & Teleph Corp <Ntt> 文書情報提示方法及び装置並びにプログラム及び記録媒体
US6910003B1 (en) 1999-09-17 2005-06-21 Discern Communications, Inc. System, method and article of manufacture for concept based information searching

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6023694A (en) * 1996-01-02 2000-02-08 Timeline, Inc. Data retrieval method and apparatus with multiple source capability
US5802511A (en) * 1996-01-02 1998-09-01 Timeline, Inc. Data retrieval method and apparatus with multiple source capability
US5926811A (en) * 1996-03-15 1999-07-20 Lexis-Nexis Statistical thesaurus, method of forming same, and use thereof in query expansion in automated text searching
US6148289A (en) * 1996-05-10 2000-11-14 Localeyes Corporation System and method for geographically organizing and classifying businesses on the world-wide web
US5924090A (en) * 1997-05-01 1999-07-13 Northern Light Technology Llc Method and apparatus for searching a database of records
US6067539A (en) * 1998-03-02 2000-05-23 Vigil, Inc. Intelligent information retrieval system
US6356899B1 (en) * 1998-08-29 2002-03-12 International Business Machines Corporation Method for interactively creating an information database including preferred information elements, such as preferred-authority, world wide web pages
US6334131B2 (en) * 1998-08-29 2001-12-25 International Business Machines Corporation Method for cataloging, filtering, and relevance ranking frame-based hierarchical information structures
US6385602B1 (en) * 1998-11-03 2002-05-07 E-Centives, Inc. Presentation of search results using dynamic categorization
US6584464B1 (en) * 1999-03-19 2003-06-24 Ask Jeeves, Inc. Grammar template query system
US6886129B1 (en) * 1999-11-24 2005-04-26 International Business Machines Corporation Method and system for trawling the World-wide Web to identify implicitly-defined communities of web pages
US6546388B1 (en) * 2000-01-14 2003-04-08 International Business Machines Corporation Metadata search results ranking system
US6594654B1 (en) 2000-03-03 2003-07-15 Aly A. Salam Systems and methods for continuously accumulating research information via a computer network
US6560600B1 (en) * 2000-10-25 2003-05-06 Alta Vista Company Method and apparatus for ranking Web page search results
US20020133365A1 (en) * 2001-03-19 2002-09-19 William Grey System and method for aggregating reputational information
US6904428B2 (en) * 2001-04-18 2005-06-07 Illinois Institute Of Technology Intranet mediator
US7567953B2 (en) * 2002-03-01 2009-07-28 Business Objects Americas System and method for retrieving and organizing information from disparate computer network information sources
US6829599B2 (en) * 2002-10-02 2004-12-07 Xerox Corporation System and method for improving answer relevance in meta-search engines
US6944612B2 (en) * 2002-11-13 2005-09-13 Xerox Corporation Structured contextual clustering method and system in a federated search engine
US7617203B2 (en) 2003-08-01 2009-11-10 Yahoo! Inc Listings optimization using a plurality of data sources
US20050160107A1 (en) * 2003-12-29 2005-07-21 Ping Liang Advanced search, file system, and intelligent assistant agent
US8676837B2 (en) * 2003-12-31 2014-03-18 Google Inc. Systems and methods for personalizing aggregated news content
DE102005051429A1 (de) * 2004-10-27 2006-06-14 Elsevier B.V. Verfahren und Software zur Analyse von Forschungsveröffentlichungen
CA2500573A1 (en) * 2005-03-14 2006-09-14 Oculus Info Inc. Advances in nspace - system and method for information analysis
US8280882B2 (en) * 2005-04-21 2012-10-02 Case Western Reserve University Automatic expert identification, ranking and literature search based on authorship in large document collections
US7933897B2 (en) * 2005-10-12 2011-04-26 Google Inc. Entity display priority in a distributed geographic information system
US7603350B1 (en) * 2006-05-09 2009-10-13 Google Inc. Search result ranking based on trust

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6314420B1 (en) 1996-04-04 2001-11-06 Lycos, Inc. Collaborative/adaptive search engine
US6910003B1 (en) 1999-09-17 2005-06-21 Discern Communications, Inc. System, method and article of manufacture for concept based information searching
JP2004029943A (ja) 2002-06-21 2004-01-29 Recruit Co Ltd 検索支援方法
JP2004206571A (ja) * 2002-12-26 2004-07-22 Nippon Telegr & Teleph Corp <Ntt> 文書情報提示方法及び装置並びにプログラム及び記録媒体

Also Published As

Publication number Publication date
EP2021913A4 (en) 2009-12-16
JP5118693B2 (ja) 2013-01-16
CN101501631A (zh) 2009-08-05
CN105608110A (zh) 2016-05-25
US20080005099A1 (en) 2008-01-03
ZA200809919B (en) 2010-02-24
AU2007253724A1 (en) 2007-11-29
EP2021913A2 (en) 2009-02-11
JP2009537913A (ja) 2009-10-29
WO2007137171A3 (en) 2008-12-18
KR20090035487A (ko) 2009-04-09
BRPI0712593A2 (pt) 2012-07-03
WO2007137171A2 (en) 2007-11-29
CA2652409A1 (en) 2007-11-29
US20150310111A1 (en) 2015-10-29

Similar Documents

Publication Publication Date Title
Castillo et al. A reference collection for web spam
US8799280B2 (en) Personalized navigation using a search engine
Jansen et al. Determining the informational, navigational, and transactional intent of Web queries
US8060487B2 (en) Searching for and launching data files not associated with an application
JP5431727B2 (ja) 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム
Noll et al. Telling experts from spammers: expertise ranking in folksonomies
US9892096B2 (en) Contextual hyperlink insertion
US9779139B1 (en) Context-based filtering of search results
US20090119572A1 (en) Systems and methods for finding information resources
US20080313142A1 (en) Categorization of queries
CN103020106A (zh) 混合移动搜索结果
JP2010517196A (ja) 個人情報の識別および変更
Rawat et al. Efficient focused crawling based on best first search
Liebling et al. Anticipatory search: using context to initiate search
US20120246134A1 (en) Detection and analysis of backlink activity
JP4912384B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
KR101487561B1 (ko) 소스 검색 엔진
CN104035933B (zh) 一种阅读源订阅方法及系统
CN111382331A (zh) 一种基于大数据的处理舆情话题的方法、装置和系统
Takahashi et al. A ranking method for web search using social bookmarks
AU2013214496A1 (en) A Search Method
Budura et al. Deriving expertise profiles from tags
JP2009537913A5 (ko)
Totar et al. Search techniques, strategies and the results: A comparative analysis of five search engines
AU2013201300A1 (en) Source search engine

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20171219

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20190116

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20200103

Year of fee payment: 6