KR20000049427A

KR20000049427A - 인터넷 정보 검색 방법 및 그의 엔진

Info

Publication number: KR20000049427A
Application number: KR1020000012144A
Authority: KR
Inventors: 김종민
Original assignee: 김종민
Priority date: 2000-03-10
Filing date: 2000-03-10
Publication date: 2000-08-05

Abstract

본 발명은 인터넷 정보 검색에 관한 것으로, 나날이 다양해지고 광범위해지는 사용자들의 요구를 수용하여 검색 대상이나 추출 결과물들에 대한 다양한 통계적 고찰과 생명체의 신경망 이론에 의거한 다양한 알고리즘 등을 채택하여 정보의 수집 과정과 축적, 그리고 검색 결과와 그에 따른 처리 과정에 응용 도입하여 좀 더 효율적인 결과물들을 사용자들에게 노출시켜 일반 사용자는 물론 전문가들도 만족할 수 있는 질 높은 검색 결과물을 제공할 수 있는 인터넷 정보 검색 방법 및 그의 엔진을 제공하는데 그 목적이 있다. 상기 방법에 있어서, 인공 지능 학습 이론을 근거로 하여 인터넷 정보들을 수집하고, 상기 수집된 인터넷 정보들에 대한 데이터베이스를 구축한다. 사용자에 의해 입력된 정보 검색어를 분석한다. 상기 분석된 상기 정보 검색어가 문장 또는 단어인 지를 판단한다. 상기 분석된 정보 검색어가 상기 단어인 경우, 상기 단어가 동음 이의어, 의성어, 또는 상품어인 지를 판단한다. 상기 단어가 상기 동음 이의어인 경우, 상기 인터넷 정보를 기초로 하여 상기 정보 검색어에 해당하는 정보의 각 동음 이의어에 가중치를 가하여 상기 데이터 베이스를 갱신한다.

Description

인터넷 정보 검색 방법 및 그의 엔진{INTERNET INFORMATION SEARCHING METHOD AND ENGINE}

본 발명은 인터넷 정보 검색에 관한 것으로, 특히, 인공 지능 학습 능력을 근거로 하여 사용자가 요구한 정보를 인터넷을 통하여 제공하는 인터넷 정보 검색 방법 및 엔진에 관한 것이다.

기존에 존재하는 검색 엔진들의 경우 모두 대동 소이한 검색 결과와 그에 따른 결과물들을 출력하고 그 알고리즘 역시 커다란 차이가 없어 개발에 착수하였으며, 생명체의 학습 능력과 사고 패턴을 접목함으로써 좀 더 효율적이고 고성능 및 고기능의 망 검색 엔진을 만들기 위해 개발에 착수하였다.

종래의 검색 엔진들의 경우는 크게 두가지 방식으로 분류될 수 있는데, 하나는 디렉토리 방식과 에이전트 방식이다. 디렉토리 방식의 선두 주자로는 미국의 야후사와 한국의 야후 코리아가 있다. 기본적으로 이들은 검색 대상이 되는 사이트를 인간이 인위적으로 선별 가공하여 특징적인 데이터 베이스를 구축하여 이를 토대로 검색 엔진을 제공하는 방식이다. 이러한 방식은 나날이 늘어 나는 인터넷 정보들을 수용하는데 그 한계가 명백히 있으며 그에 따른 정보 축적 과정 역시 상당히 고정적인 측면이 강하여 안정적인 검색 엔진을 제공할 수는 있겠으나 깊이는 있는 정보나 희귀한 정보를 검색하기에는 적합하지 않다. 하지만, 인간이 인위적인 노력에 의해 구축되어진 정보이기 때문에 축적된 정보의 질이 상대적으로 평균 이상을 유지할 수 있으며 그에 따른 사용자들의 신뢰도를 높일 수 있다.

에이전트 방식의 대표적인 검색 엔진으로는 미국의 알타비스타사와 국내의 알타비스타 코리아가 있다. 이러한 에이전트 방식의 경우는 검색 대상이 되는 사이트는 물론 사이트내의 문서들도 추출 검색하여 정보들이 광범위하게 존재하는 인터넷의 특성을 반영하는 검색 엔진으로 정보의 분산에 따른 검색의 어려움을 대처하려는 노력이 돋보이는 검색 엔진이다. 따라서 기본적인 정보의 축적 과정과 검색 엔진의 성능 역시 에이전트의 성능에 크게 좌우되는 것은 물론 검색 대상이 되는 비슷한 정보들의 광범위한 축적은 정보의 질들을 사용자가 파악할 수 없도록 하며 오히려 사용을 꺼리게 만드는 요소이기도 하다. 특히 에이전트의 문서 수집은 통제되지 않은 상태에서 쿼리의 질의어에 대해서만 해당 단어 검색 추출 방식을 사용하고 있어 그에 따른 질의어나 검색 대상물에 대한 필터링이 존재하지 않아 그 사용과 결과가 일반 사용자들에게는 상대적으로 용이하지 않다. 하지만 정보 축적 과정의 특이성에 기인하여 희귀한 정보나 깊은 정보를 검색하는데 상대적으로 효율적이다.

상기에 나열한 종래의 두 방식의 검색 엔진들의 경우 검색 대상의 정보 축적 과정과 검색을 처리하는 과정에서 여러 가지 한계점들이 보이고 있다. 정보 축적 과정에서 무분별하게 수집된 정보들은 그 효용성에 의심이 갈 수밖에 없으며 천편 일률적인 검색 결과의 노출은 사용자들로 하여금 선택의 폭을 제한하는 것은 물론 실제 광범위하고 신뢰성이 떨어지고 사용자들의 의도가 전혀 개입되지 않는 검색 결과물들이 출력되는 한계점이 있다.

이에 본 발명은 이와같은 종래의 문제점을 해결하기 위한 것으로, 나날이 다양해지고 광범위해지는 사용자들의 요구를 수용하여 검색 대상이나 추출 결과물들에 대한 다양한 통계적 고찰과 생명체의 신경망 이론에 의거한 다양한 알고리즘 등을 채택하여 정보의 수집 과정과 축적, 그리고 검색 결과와 그에 따른 처리 과정에 응용 도입하여 좀 더 효율적인 결과물들을 사용자들에게 노출시켜 일반 사용자는 물론 전문가들도 만족할 수 있는 질 높은 검색 결과물을 제공할 수 있는 인터넷 정보 검색 방법 및 그의 엔진을 제공하는데 그 목적이 있다.

상기 목적을 달성하기 위하여, 본 발명은 i) 인공 지능 학습 이론을 근거로 하여 인터넷 정보들을 수집하고, 상기 수집된 인터넷 정보들에 대한 데이터베이스를 구축하는 단계;

ii) 사용자에 의해 입력된 정보 검색어를 분석하는 단계;

iii) 단계 ii)에서 분석된 상기 정보 검색어가 문장 또는 단어인 지를 판단하는 단계;

iv) 상기 분석된 정보 검색어가 상기 단어인 경우, 상기 단어가 동음 이의어, 의성어, 또는 상품어인 지를 판단하는 단계; 및

v) 상기 단어가 상기 동음 이의어인 경우, 상기 인터넷 정보들을 기초로 하여 상기 정보 검색어에 해당하는 정보의 각 동음 이의어에 가중치를 가하여 상기 데이터 베이스를 갱신하는 단계를 포함하는 것을 특징으로 하는 인터넷 정보 검색 방법을 제공한다.

단계 v)는 vi) 단계 v)의 결과에 기초로 하여 상기 인터넷 정보들에서 사용자 선호도 또는 이용 빈도가 낮은 정보를 도태시키는 단계; 및 vii) 강제 학습 패턴을 기초로 하여 유의미한 정보 검색어에 대한 단계 vi)에서 도태된 정보를 저장하는 단계를 더 포함하는 것이 바람직하다. 단계 iv)의 판단 결과, 상기 단어가 상기 상품명인 경우, 단계 iv)는 iv-1) 상기 상품명이 단계 ii)에서 구축된 데이터 베이스의 인터넷 정보들에 포함되어 있는 지를 검색하는 단계; 및 iv-2) 상기 상품명이 단계 ii)에서 구축된 데이터 베이스의 인터넷 정보들에 포함되어 있는 경우, 상기 상품명에 해당하는 인터넷 정보를 출력하고, 상기 상품명이 단계 ii)에서 구축된 데이터 베이스의 인터넷 정보들에 포함되어 있지 않은 경우, 상기 상품명에 해당하는 정보를 상기 인터넷 정보들에 추가하는 단계를 포함하는 것이 더욱 바람직하다,

본 발명은 또한 인공 지능 학습 이론을 근거로 하여 인터넷 정보들을 수집하기 위한 정보 수집부;

상기 정보 수집부에 의해 수집된 상기 인터넷 정보들에 대한 데이터 베이스를 구축하기 위한 데이터 베이스 구축부;

사용자에 의해 입력된 정보 검색어를 분석하는 분석부;

상기 분석부에 의해 분석된 상기 정보 검색어가 문장 또는 단어인 지를 판단하고, 상기 정보 검색어가 단어인 경우 상기 단어가 동음 이의어, 의성어, 또는 상품명인 지를 판단하고, 상기 단어가 상기 동음 이의어인 경우 상기 인터넷 정보를 기초로 하여 상기 정보 검색어에 해당하는 정보의 각 동음 이의어에 가중치를 부가하여 상기 데이터 베이스를 갱신하는 제어부를 포함하는 것을 특징으로 하는 인터넷 검색 엔진을 제공한다.

상기 인터넷 검색 엔진은 강제 학습 패턴을 기초로 하여 유의미한 정보 검색어에 대한 상기 데이터 베이스 구축부로부터 도태된 상기 정보를 저장하는 메모리를 더 포함하는 것이 바람직하다.

도 1은 본 발명의 바람직한 실시예에 따른 인터넷 정보 검색 엔진의 구성을 나타낸 블록도이다.

도 2는 본 발명의 바람직한 실시예에 따른 인터넷 정보 검색 방법을 설명하는 흐름도이다.

〈도면의 주요 부분에 대한 부호의 설명〉

100: 정보 제공 컴퓨터 102: 정보 수집부

104: 데이터 베이스 구축부 106: 분석부

107: 사용자 서버 108: 제어부

110: 메모리

이하, 본 발명의 바람직한 실시예를 첨부된 도면을 참고로 하여 상세히 설명하면 다음과 같다. 도 1에는 본 발명의 바람직한 실시예에 따른 인터넷 정보 검색 엔진(10)의 구성이 도시되어 있다. 상기 인터넷 정보 검색 엔진(10)은 정보 수집부(102), 데이터 베이스 구축부(104), 분석부(106), 및 제어부(108)를 포함한다.

정보 수집부(102)는 정보 수집 에이전트를 이용하여 인공 지능 학습 이론을 근거로 하여 인터넷 정보들을 수집한다.

데이터 베이스 구축부(104)는 상기 정보 수집부에 의해 수집된 상기 인터넷 정보들에 대한 데이터 베이스를 구축한다.

분석부(106)는 사용자에 의해 입력된 정보 검색어를 분석한다.

제어부(108)는 상기 분석부(106)에 의해 분석된 상기 정보 검색어가 문장 또는 단어인 지를 판단한다. 상기 정보 검색어가 단어인 경우 상기 제어부(106)는 상기 단어가 동음 이의어, 의성어, 또는 상품명인 지를 판단한다. 상기 단어가 상기 동음 이의어인 경우 제어부(108)는 상기 인터넷 정보를 기초로 하여 상기 정보 검색어에 해당하는 정보의 각 동음 이의어에 가중치를 부가한다. 제어부(108)는 상기 가중치 부가에 의한 결과에 기초로 하여 상기 인터넷 정보들에서 사용자 선호도가 낮은 정보를 도태시킨다. 상기 단어가 상기 상품명인 경우, 상기 제어부(108)는 상기 상품명이 상기 데이터 베이스의 인터넷 정보들에 포함되어 있는 지를 검색하고, 상기 검색 결과에 따라 상기 상품명에 해당하는 인터넷 정보를 출력하고 상기 상품명에 해당하는 정보를 상기 데이터 베이스의 인터넷 정보들에 추가한다.

이하, 본 발명에 따른 정보 검색 방법을 도 2를 참조하여 설명한다. 도 2는 본 발명의 바람직한 실시예에 따른 인터넷 정보 검색 방법을 설명하는 흐름도이다.

단계 S201에서, 정보 수집부(102)는 내장된 정보 수집 에이전트를 이용하여 인공 지능 학습 이론을 근거로 하여 정보를 보유하고 있는 다수의 인터넷 정보 제공 컴퓨터들(100)의 인터넷 정보들을 수집한다. 또한 문서 수집시 상기 정보 수집부(102)는 상기 다수의 인터넷 정보 제공 컴퓨터들(100)을 진단하여 상기 인터넷 정보 제공 컴퓨터들(100)에 대한 사용자 반응 속도 및 네트워크 회선 상태를 점검하여 사용자에게 알려 줄 수 있도록 상기 인터넷 정보들에 대한 이차 정보들을 수집하게 된다. 상기 다수의 인터넷 정보 제공 컴퓨터들(100)의 인터넷 정보 및 이차 정보는 데이터 베이스 구축부(104)로 전송한다.

단계 S202에서, 상기 데이터 베이스 구축부(104)는 상기 정보 수집부(102)로부터의 상기 인터넷 정보 및 이차 정보에 대한 데이터 베이스를 구축한다. 상기 데이터베이스는 기존에 구축되어진 정보들과 비교 분석되어 적절한 공간에 새롭게 배치된다. 다시 말하면, 인공 신경망에 의거한 학습 능력과 그에 따르는 판단 기준이 설정되며 이에 따라 적절한 정보들을 수집하게 되고 이처럼 수집된 정보들이 배치되어 사용자들의 요구를 수렴할 수 있는 상태인 준비 상태가 된다.

단계 S203에서, 사용자는 사용자 서버(107)를 이용하여 원하는 정보 검색어를 입력한다. 상기 입력된 정보 검색어는 분석부에 전송된다.

상기 분석부(106)는 사용자 서버(107)로부터의 상기 입력 정보 검색어를 분석한다(단계 S204).

단계 S205에서, 제어부(108)는 상기 분석부(108)에 의해 분석된 상기 정보 검색어가 문장인 지의 여부를 판단한다.

단계 S205의 판단 결과, 상기 정보 검색어가 상기 문장인 경우, 상기 분석부(108)는 상기 문장에 대하여 자연어 처리를 위한 문자 구조 분석 파악하고 의미를 추출한다(단계 S206). 이와는 반대로, 단계 205에서 상기 정보 검색어가 문장이 아닌 것으로 판단된 경우, 제어부(108)는 상기 정보 검색어가 단어인 지의 여부를 판단한다(단계 S207).

단계 S207의 판단 결과, 상기 정보 검색어가 단어가 아닌 경우, 상기 제어부(108)는 상기 사용자 서버(107)에 다른 검색어 입력을 지시하고(단계 S208)하고, 처리 루틴은 단계 S203으로 복귀한다.

한편, 단계 S207에서, 상기 정보 검색어가 단어인 것으로 판단된 경우, 제어부(108)는 상기 단어가 동음 이의어인 지의 여부를 판단한다(단계 S209).

단계 S209의 판단 결과, 상기 단어가 동음 이의어가 아닌 경우, 제어부(108)는 상기 단어가 의성어인 지의 여부를 판단한다(단계 S210).

단계 S210의 판단 결과, 상기 단어가 의성어인 경우, 처리 루틴은 단계 208을 수행한다. 이와는 반대로, 단계 S201에서 상기 단어가 의성어가 아닌 것으로 판단된 경우, 상기 단어가 상품명 중의 하나인 지의 여부를 판단한다(단계 S211).

단계 S211의 판단 결과, 상기 단어가 상기 상품명 중의 하나가 아닌 경우, 처리 루틴은 단계 S208을 수행한다. 이와는 반대로 단계 211에서 상기 단어가 상품명인 경우, 제어부(108)는 상기 상품명이 상기 데이터 베이스 구축부(104)에 구축된 데이터 베이스의 인터넷 정보들에 포함되어 있는 지를 검색한다(단계 S212).

단계 S212의 검색 결과, 상기 상품명이 상기 구축된 데이터 베이스의 인터넷 정보들에 포함되어 있지 않는 경우, 상기 상품명에 해당하는 정보를 상기 인터넷 정보들에 추가하여 상기 데이터 베이스를 갱신한다(단계 S213). 이와는 반대로, 단계 212에서 상기 상품명이 상기 데이터 구축부(104)에 구축된 데이터 베이스의 인터넷 정보들에 포함되어 있는 경우, 상기 제어부(108)는 상기 상품명에 해당하는 인터넷 정보를 사용자 서버(107)로 출력하여 사용자가 해당 상품 정보를 얻을 수 있도록 한다(단계 S214).

한편, 단계 S209의 판단 결과, 상기 단어가 동음 이의어인 경우, 제어부(108)는 데이터 베이스 구축부(104)에 구축된 데이터 베이스의 인터넷 정보를 기초로 하여 상기 정보 검색어에 해당하는 정보의 각 동음이의어에 가중치를 가한다(단계 S215). 이때 상기 가중치는 사용자 선호도에 따라 상이하게 적용된다.

그 후, 제어부는 단계 S215의 결과에 기초로 하여 저장된 상기 인터넷 정보들에서 사용자 선호도 및 이용 빈도가 낮은 정보를 도태시킨다(단계 S216). 이때, 정보 검색 엔진의 세부 카테고리에 근거한 사용자 선호도는 정보 검색어에 해당하는 정보의 범주에 속하지 않는 결과물들을 점차로 도태시켜 나가는 반면, 사용이 빈번하고 의미있는 결과물들은 계속적인 생존의 기회를 부여 받아 생명력과 존속성이 강해진다. 도태의 범주 양태로서는 먼저 다른 분류 코드를 부여하여 검색 엔진 알고리즘에서 생존의 검색 엔진 알고리즘에서 생존의 기회 부여-의미가 있는 결과물의 도태를 막는다. 한편, 강력한 도태 유발-불필요하고 선정적인 결과물 또는 그에 상응하는 결과물은 창조자에 의하여 돌연 변이로 취급되어, 생존의 기회를 강하게 억압받는다.

그후, 제어부(108)은 사용자의 자연적 오류를 방지하기 위하여 사용자들의 피동적이고 비선험적인 학습 양태를 보정하기 위한 통제자에 의한 강제 학습 패턴으로 의미 있는 질의어에 대한 적절한 결과물을 학습 대상에 정기적으로 포함시켜 검색 효율의 효율성을 강화함은 물론 정보 생존의 기회를 부여하여 상기 도태된 정보에서 유용한 정보를 메모리(110)에 저장한다(단계 S217). 즉, 인위적인 학습의 범주 링크 빈도와 정보의 질을 판단-연관 링크의 범주를 나누어 그 빈도를 측정함으로써 정보의 질을 판단한다. 정보를 많이 다루는 사이트를 분석 및 기억하여 처리한다.

그 후 제어부(108)은 사용자에 의해 선택된 정보가 상기 정보 검색어에 해당하는 다수의 정보중 마지막 정보인지의 여부를 판단한다(단계 218).

단계 S218의 판단 결과, 사용자에 의해 선택된 정보가 상기 정보 검색어에 해당하는 다수의 정보중 마지막 정보가 아닌 경우 모든 동작을 종료된다. 이와는 반대로, 단계 S218에서 사용자에 의해 선택된 정보가 상기 정보 검색어에 해당하는 다수의 정보중 마지막 정보인 경우, 제어부(108)는 상기 마지막 정보에 최대 가중치를 부가한다(단계 S219). 즉, 사용자가 상기 단계를 통한 사용자의 반응이 만족스럽지 못한 경우, 사용자는 계속해서 질의어를 입력하거나 검색 엔진의 활용 빈도가 한정된 시간 안에 증가할 것이다. 이러한 것을 학습 이론으로 적용시켜 의미 있는 검색 결과물의 생존력을 높여 다음 검색이나 다른 사용자의 검색 결과에 반영하여 검색 효율을 높여 나간다. 즉, 사용자가 최종으로 사용하거나 얻은 정보를 양질의 정보로 판단하고 이를 여행 정보 검색 엔진에 적용한다. 마지막 사용 정보를 근간으로 다시 학습을 실행하며, 이 정보들을 기존의 학습 결과물들과 비교하여 학습을 계속한다.

상기 모든 학습 이론에 의해 얻어지는 생존율은 특정 가중치로 수치화되어 비교, 분류, 및 분석되어진다. 이렇게 분류 수치화된 자료들은 통계적 분석을 통해 신경망 모델을 통해 안정화되며 적절한 정보 군락이 생존하게 된다. 이러한 일련의 과정을 거쳐서 형성된 정보 군락은 고정 불변한 정보 군락이 아니며, 언제나 끊임없이 사용자들의 외부 자극에 의해 변화 적응하는 살아 있는 정보 군락으로 기존의 검색 엔진이 가졌던 고정적인 정보의 한계를 극복하고 있다.

인공 지능이라 함은 생명체의 기본적인 특성인 생존 욕구와 진화 발달상의 특성으로 전체의 검색 엔진이 유기적인 구조를 가지고 계속적으로 진화 생존해 나가는 구조를 가지고 있다고 볼 수 있다. 이러한 의미는 검색 엔진 자체가 사용자들에 의하여 실시간으로 학습 진화한다고 볼 수 있으며, 적자 생존에 의한 도태를 발생시켜 검색 효율의 최적화를 꾀하는 것이 그 본 발명의 목적이다. 이러한 것을 토대로 본 발명에서는 특화된 여행 정보 검색 엔진을 지향하고 있는 바, 여행이라는 특화된 주제에 대하여 수 많은 정보들을 효율적으로 취합 및 구축하여 검색 엔진을 사용하는 모든 사용자들을 대상을 서비스한다. 넓디 넓은 정보의 홍수 속에서 독특한 학습 알고리즘과 인공 지능에 의거한 정보의 선별 작업은 사용자들로 하여금 효율적인 여행 정보만을 검색하도록 도와 주는데, 특정한 검색어에 해당되는 다양한 관련 정보들을 훈련을 통하여 이끌어 낼 수 있으며, 그 효율을 계속 높여가는 것은 물론 부족한 정보를 취합 보충하도록 설계되었다.

이러한 기능은 문서나 관련 정보 수집 과정과 별개로 조절 작동된다. 이처럼 실시간 수집된 회선 상태는 검색 결과 출력시 함께 표시되어 사용자는 정보 원천지에 대한 접근 가능 여부와 접속 속도를 파악하여 좀 더 빠른 인터넷 검색을 사용자들에게 제시할 수 있게 된다. 또 수집된 정보는 해당 정보의 기본 사이트와 하부 페이지가 유기적으로 분류 축적되기 때문에 종래의 검색 엔진들이 보여 주었던 사이트와 해당 문서가 따로 검색 출력되는 방식의 불편함을 극복하고 있다. 즉, 검색 대상들에 대한 유무형의 종합적 분석 결과가 출력되기 때문에 사용자는 최종적으로 검색을 원하는 대상물에 대한 이성적 파악이 용이해지고 가장 합리적이고 효율적인 검색 대상물들을 선택할 수 있으며, 이러한 점들이 종래의 검색 엔진과 크게 다른 점이라 할 수 있다. 이러한 검색 기법 외에 본인의 검색 엔진은 배너 엔진을 장착하여 해당 검색 결과들과 가장 근접한 내용을 담은 광고를 해당 결과물과 함께 제시하는 방식을 채택하고 있다. 이러한 방식은 그동안 상단과 하단의 광고만 뿌려 주었던 것과 비교해 훨씬 정확하고 타켓이 분명한 광고 엔진으로써 최종 결과물들에 대한 광고 효과를 극대화 시킬 수 있다. 이러한 광고 엔진은 기본적으로 상단과 하단의 광고 엔진과도 맞물려 그 효과를 극대화하고 있으며 광고 엔진 역시 잘 통제되는 광고 엔진과 관련 데이터베이스에 의해 운영되어진다. 또한 스칼라 데이터 방식을 배너 광고 엔진에 적용하여 사용자가 원하는 상품이 존재할 경우 검색과 동시에 상품 판매나 예약이 한 페이지 내에서 이루어지도록 유도하여 판매의 효과를 극대화시킬 수 있다.

또한, 본 발명에 따른 검색 엔진은 사용자들이 입력한 검색어나 질의어에 대한 분석을 하여 이에 대한 특성과 통계적 기법을 적용 산술화하는 것은 물론, 이를 실시간으로 사용자에게 보여 주어 사용자들 서로 간의 작은 커뮤니케이션을 유도할 수 있으며, 다양한 학습 이론에 근거한 피드백 시스템에 의하여 사용자 질의에 적합한 정보들을 계속적으로 추가 확장하여 실시간으로 업데이트하도록 설계되어 있다. 이러한 기능은 매우 강력한 기능으로 실제 사용자가 어떠한 계층에 있거나 상관없이 혹은 운용자의 지식 한계를 극복하여 능동적으로 정보를 축적하는 방법이다. 본 발명에 따른 검색 엔진은 사용자들에 대한 정보 선호도를 분석하여 이를 토대로 다수의 사용자가 원하는 정보들을 우선 순위로 노출시키는 것은 물론 그에 따른 편차를 줄이기 위한 학습 알고리즘을 사용하여 접근 정도가 낮은 정보물들에 대해서도 무작위적인 훈련 과정을 통해 자체 엔진의 노출과 선호도를 최고로 유지하도록 구성되어 있다. 이러한 검색 엔진의 학습을 위해 현재 다양한 이론들, 즉 경쟁 학습 이론, 백프로퍼게이션 학습 이론, 홉필드 망 이론, 코호넨 망 이론, 디엔에이 알고리즘, 카오스 학습 이론, 및 씨피지 학습 이론이 수용되고 있으며, 이중 주로 사용되는 학습 이론은 백프로퍼게이션 학습 이론과 혼돈 이론에 근거한 씨피지 신경망 학습 이론의 적용이다. 다시 이러한 학습 이론 자체는 초기 에이전트 활동의 지표가 되며 전반적인 네트워크를 보다 더 생명체의 사고 방식과 근접하게 만들고자 하는 의도에서 비롯되었다.

또한 본 발명에 따른 검색 엔진은 검색 대상에 대한 샘플 정보를 에이전트 혹은 사람이 수집 가공하여 정보를 보유 구축하고 미리 보기 혹은 샘플 보기가 가능하여, 회선이 느리거나 접속이 되지 않는 검색 대상물에 대한 보조적인 기능을 제공할 수 있다. 또한 각종 통계 조사나 실시간으로 수집 처리된 리서치 결과들과 뉴스 엔진에 의한 정보의 노출은 종래의 검색 엔진이 단순히 엔진 대상에 대한 문서 정보나 웹 사이트 정보를 노출시키는 것과 달리 좀 더 적극적이며 능동적으로 관련 정보들을 분선, 추출, 및 제시한다고 볼 수 있다. 다시 말해 검색 대상에 대한 광범위한 정보들을 최대한도로 분석 재가공한 후 사용자들에게 노출시켜 광범위한 정보의 선택으로 고심하는 사용자들에게 보다 효율적이고 종합적인 정보들을 제시할 수 있다. 더욱이, 본 발명에 따른 검색 엔진은 발달된 서버 기술과 용합된, 검색, 광고 엔진으로 필요에 따라 다양한 프로그래밍 언어들로 구성되어 있어서, 각 프로그래밍 언어의 특징들을 최대한 반영하도록 설계되어 있다.

예를 들면 본 발명에 의한 방법 및 엔진에 의하면, 검색 대상이 여행인 경우 정보 검색어를 분석하여 여행에 필요한 인터넷 정보, 각 국가 환율, 국가 정보, 및 개인적 특성과 같은 여행 정보를 제공하는 여행 정보 검색 엔진 및 그의 동작 방법에 관한 것이다.

본 발명에 의한 여행 전문 검색 엔진은 인공 지능 학습 능력을 바탕으로 사용자 질의어를 분석하여 여행에 필요한 인터넷 정보, 각 국가 환율, 국가 정보, 및 개인적 특성을 최대한 분석 사용자의 편의를 제공하여 준다.

이상에서는 본 발명을 특정의 바람직한 실시예에 대하여 도시하고 설명하였으나, 본 발명은 상기한 실시예에 한정되지 아니하며, 특허 청구의 범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형이 가능할 것이다.

Claims

i) 인공 지능 학습 이론을 근거로 하여 인터넷 정보들을 수집하고, 상기 수집된 인터넷 정보들에 대한 데이터베이스를 구축하는 단계;

ii) 사용자에 의해 입력된 정보 검색어를 분석하는 단계;

iii) 단계 ii)에서 분석된 상기 정보 검색어가 문장 또는 단어인 지를 판단하는 단계;

iv) 상기 분석된 정보 검색어가 상기 단어인 경우, 상기 단어가 동음 이의어, 의성어, 또는 상품어인 지를 판단하는 단계; 및

v) 상기 단어가 상기 동음 이의어인 경우, 상기 인터넷 정보들을 기초로 하여 상기 정보 검색어에 해당하는 정보의 각 동음이의어에 가중치를 가하여 상기 데이터 베이스를 갱신하는 단계를 포함하는 것을 특징으로 하는 인터넷 정보 검색 방법.
제1항에 있어서, 단계 v)는 vi) 단계 v)의 결과에 기초로 하여 상기 인터넷 정보들에서 사용자 선호도 또는 이용 빈도가 낮은 정보를 도태시키는 단계를 포함하는 것을 특징으로 하는 인터넷 정보 검색 방법.
제2항에 있어서, 단계 vi)에서 유의미한 결과물의 도태를 방지하기 위하여 상기 사용자 선호도에 따라 상기 인터넷 정보들 각각에 다른 분류 코드를 부여하여 생존의 기회를 부여하는 것을 특징으로 하는 인터넷 정보 검색 방법
제2항에 있어서, 단계 v)는 vii) 강제 학습 패턴을 기초로 하여 유의미한 정보 검색어에 대한 단계 vi)에서 도태된 정보를 저장하는 단계를 더 포함하는 것을 특징으로 하는 인터넷 정보 검색 방법.
제1항에 있어서, 사용자에 의해 선택된 정보가 상기 정보 검색어에 해당하는 다수의 정보 중 마지막 정보인 경우, 상기 마지막 정보에 최대 가중치를 부가하는 단계를 포함하는 것을 특징으로 하는 인터넷 정보 검색 방법.
제1항에 있어서, 단계 iv)의 판단 결과, 상기 단어가 상기 상품명인 경우,

iv-1) 상기 상품명이 단계 ii)에서 구축된 데이터 베이스의 인터넷 정보들에 포함되어 있는 지를 검색하는 단계; 및

iv-2) 상기 상품명이 단계 ii)에서 구축된 데이터 베이스의 인터넷 정보들에 포함되어 있는 경우, 상기 상품명에 해당하는 인터넷 정보를 출력하고, 상기 상품명이 단계 ii)에서 구축된 데이터 베이스의 인터넷 정보들에 포함되어 있지 않은 경우, 상기 상품명에 해당하는 정보를 상기 인터넷 정보들에 추가하는 단계를 포함하는 것을 특징으로 하는 정보 검색 서비스 방법.
인공 지능 학습 이론을 근거로 하여 인터넷 정보들을 수집하기 위한 정보 수집부;

상기 정보 수집부에 의해 수집된 상기 인터넷 정보들에 대한 데이터 베이스를 구축하기 위한 데이터 베이스 구축부;

사용자에 의해 입력된 정보 검색어를 분석하는 분석부;

상기 분석부에 의해 분석된 상기 정보 검색어가 문장 또는 단어인 지를 판단하고, 상기 정보 검색어가 단어인 경우 상기 단어가 동음 이의어, 의성어, 또는 상품명인 지를 판단하고, 상기 단어가 상기 동음 이의어인 경우 상기 인터넷 정보를 기초로 하여 상기 정보 검색어에 해당하는 정보의 각 동음 이의어에 가중치를 부가하여 상기 데이터 베이스를 갱신하는 제어부를 포함하는 것을 특징으로 하는 인터넷 정보 검색 엔진.
제7항에 있어서, 상기 제어부는 상기 가중치 부가에 의한 결과에 기초로 하여 상기 인터넷 정보들에서 사용자 선호도 또는 이용 빈도가 낮은 정보를 도태시키는 것을 특징으로 인터넷 정보 검색 엔진.
제8항에 있어서, 강제 학습 패턴을 기초로 하여 유의미한 정보 검색어에 대한 상기 도태된 정보를 저장하는 단계를 더 포함하는 것을 특징으로 하는 인터넷 정보 검색 방법.
제7항에 있어서, 상기 단어가 상기 상품명인 경우, 상기 제어부는 상기 상품명이 상기 데이터 베이스의 인터넷 정보들에 포함되어 있는 지를 검색하고, 상기 검색 결과에 따라 상기 상품명에 해당하는 인터넷 정보를 출력하고 상기 상품명에 해당하는 정보를 상기 데이터 베이스의 인터넷 정보들에 추가하는 것을 특징으로 하는 인터넷 정보 검색 엔진.
제7항에 있어서, 강제 학습 패턴을 기초로 하여 유의미한 정보 검색어에 대한 상기 데이터 베이스 구축부로부터 도태된 상기 정보를 저장하는 메모리를 더 포함하는 것을 특징으로 하는 인터넷 정보 검색 엔진.