KR101416291B1

KR101416291B1 - 규칙기반 다중 에이전트를 이용한 감성 분류 시스템 및 그 방법

Info

Publication number: KR101416291B1
Application number: KR1020120115788A
Authority: KR
Inventors: 김정호; 정찬호; 신석훈; 이은복; 채수환; 지승도
Original assignee: 한국항공대학교산학협력단
Priority date: 2012-10-18
Filing date: 2012-10-18
Publication date: 2014-07-09
Also published as: KR20140049680A

Abstract

실제 사람의 사고 흐름을 모방하여 온라인 텍스트 데이터(블로그, 댓글, 트위터, 기타 등등)로부터 사람의 감성(긍정, 부정)을 정확하게 분류하도록 한 규칙기반 다중 에이전트를 이용한 감성 분류 시스템 및 그 방법이 개시된다.
개시된 규칙기반 가중 에이전트를 이용한 감성분류 방법은, 사용자의 질의에 해당하는 분류 대상을 인식하여 해당 규칙 베이스를 참조하는 분류대상 인식단계와; 인식한 분류 대상에 대해 사람들이 감성을 표현하는 분류 대상의 특성들을 파악하고, 유사한 성격을 지니는 특성끼리 묶어 집합을 만드는 평가항목 인식 단계와; 상기 평가항목 인식단계에서 파악한 평가항목들에 대한 사람들의 의견을 파악하여 긍정 및 부정적인 성향을 분석하는 평가내용 분석단계와; 상기 평가내용 분석단계의 긍정적인 성향 분석 결과 또는 부정적인 성향 분석결과를 강조하거나 반전시켜 결과에 대한 보정과 평가항목별 추론 결과를 결합하여 분류 대상에 대한 최종 감성을 분류하는 감성분류 단계로 이루어진다.

Description

규칙기반 다중 에이전트를 이용한 감성 분류 시스템 및 그 방법{Sentiment classification system using rule-based multi agents}

본 발명은 규칙기반 다중 에이전트(multi agents)를 이용한 감성 분류에 관한 것으로서, 더욱 상세하게는 실제 사람의 사고 흐름을 모방하여 온라인 텍스트 데이터(트윗, 페이스북, 블로그, 댓글 등)로부터 사람의 감성(긍정, 부정)을 정확하게 추론하도록 한 규칙기반 다중 에이전트를 이용한 감성 분류 시스템 및 그 방법에 관한 것이다.

다시 말해, 텍스트 데이터의 처리 대상이 되는 텍스트 데이터 내에 존재하는 단어(키워드)를 단서로 논리적인 추론 과정을 통해 텍스트 내에 내포되어 있는 감성 정보를 추론하기 위한 규칙기반 다중 에이전트를 이용한 감성 분류 시스템 및 그 방법에 관한 것이다.

일반적으로, 인터넷을 기반으로 한 정보화시대에서 대부분의 사람은 인터넷상의 온라인 텍스트 데이터(블로그, 댓글, 트위터, 등)로부터 원하는 정보를 얻고, 반대로 텍스트 데이터로부터 정보를 제공한다. 이러한 추세에 따라 다양한 이슈에 대한 사람들의 감성 동향을 파악하기 위해 온라인상의 텍스트 데이터로부터 사람들의 감성을 인식하고 분류하는 기술이 요구되고 있다.

이러한 요구에 의해 온라인상의 텍스트 데이터로부터 사람들의 감성을 인식 및 분류하기 위한 다양한 종래기술이 제안되고 있으며, 이를 간략히 살펴보면 다음과 같다.

대한민국특허청 공개특허공보 공개번호 10-2010-0098014호(2010.09.06. 공개)(발명의 명칭: 여론 분석 장치 및 문서 분석을 통한 여론 평가 방법)에는, 여론 분석 장치가 주어진 주제에 대한 문서를 수집하고, 수집한 문서들을 필터링하여 유효 문서를 추출한 후, 각 유효 문서의 형태소 분석을 통해 감성 표현을 추출하고, 각 감성 표현의 감성벡터 값을 결정하여 그 감성벡터 값을 근거로 주제에 대한 여론 평가 결과를 도출하게 된다. 예컨대, 인터넷상의 문서와 댓글을 수집하고, 특정 주제에 대한 찬/반 의견을 분석하여 그 결과만을 사용자에게 신속하게 제공할 수 있다.

대한민국특허청 공개특허공보 공개번호 10-2010-0035940호(2010.04.07. 공개)(발명의 명칭: 웹 문서에서의 의견 추출 및 분석장치 및 그 방법)에는, 인터넷상에 존재하는 여러 웹사이트에 흩어져 있는 웹 문서에서 사용자 의견 정보를 자동으로 추출 및 분석함으로써, 긍정/부정 의견별로 검색 및 통계를 확인할 수 있으며, 의견 검색 사용자들은 특정 키워드에 대하여 다른 사용자들의 의견을 손쉽게 한눈에 검색 및 모니터링할 수 있다.

대한민국특허청 공개특허공보 공개번호 10-2010-0034140호(2010.04.01. 공개)(발명의 명칭: 인터넷을 이용한 의견 검색 시스템 및 그 방법)에는, 인터넷상에 존재하는 여러 웹사이트에 흩어져 있는 사용자 의견 정보들을 자동으로 추출 및 분석함으로써, 긍정/부정 의견별로 검색 및 통계를 확인할 수 있는 의견 검색 서비스를 제공해줌으로써, 의견 검색 사용자들은 특정 키워드에 대하여 다른 사용자들의 의견을 손쉽게 한눈에 검색 및 모니터링할 수 있어, 다른 사용자들의 의견을 검색하기 위해서 들였던 많은 시간을 단축할 수 있게 된다.

황재원, 고영중, "효과적인 감정 자질을 이용한 한국어 문서 감정 분류 시스템", 2007, 한국정보과학회 가을 학술발표논문집, 제34권 제2호에는, 감성 분류를 위해 감성 판단 기준이 되는 감성 단어를 정의하고, 감성 분류는 문서 내에 정의한 감성 단어를 추출하여, 추출한 감성 단어의 누적 가중치로 최종 감성을 분류한다.

정유철, 최윤정, 맹상현, "감정기반 블로그 문서분류를 위한 부정어 처리 및 단어 가중치 적용 기법의 효과에 대한 연구", 2008, 인지과학, 제19권 제4호 pp, 477~497에는, 단일 감성 단어뿐만 아니라 부정문을 고려하기 위한 n-gram 단어 패턴을 정의하고 이를 사용하여 감성 분류를 수행한다.

서형원, 김형철, 김재훈, "기계학습 방법을 이요한 댓글의 감정 인식", 2009, 한국마린엔지니어링학회에는 감성을 띄는 단어 패턴을 반자동으로 구축하고, 이를 사용하여 감성분류를 수행한다. 단어 패턴은 분류 대상의 특성과 분류 대상의 특성을 서술하는 서술어의 쌍으로 정의한다.

1. 대한민국특허청 공개특허공보 공개번호 10-2010-0098014호(2010.09.06. 공개)(발명의 명칭: 여론 분석 장치 및 문서 분석을 통한 여론 평가 방법) 2. 대한민국특허청 공개특허공보 공개번호 10-2010-0035940호(2010.04.07. 공개)(발명의 명칭: 웹 문서에서의 의견 추출 및 분석장치 및 그 방법) 3. 대한민국특허청 공개특허공보 공개번호 10-2010-0034140호(2010.04.01. 공개)(발명의 명칭: 인터넷을 이용한 의견 검색 시스템 및 그 방법)

1. 황재원, 고영중, "효과적인 감정 자질을 이용한 한국어 문서 감정 분류 시스템", 2007, 한국정보과학회 가을 학술발표논문집, 제34권 제2호 2. 정유철, 최윤정, 맹상현, "감정기반 블로그 문서분류를 위한 부정어 처리 및 단어 가중치 적용 기법의 효과에 대한 연구", 2008, 인지과학, 제19권 제4호 pp,477~497 3. 서형원, 김형철, 김재훈, "기계학습 방법을 이요한 댓글의 감정 인식", 2009, 한국마린엔지니어링학회

그러나 상기와 같은 종래기술들은 기계 학습을 통해 학습 데이터로부터 '좋다', '싫다.' 등과 같은 감성 어휘와, '화면 크다', '속도 빠르다.' 등과 같이 어휘들의 조합인 감성 패턴을 추출하고, 이를 텍스트와의 단순 매칭으로 감성을 인식하여 분류한다. 따라서 단순히 텍스트 내의 감성 어휘와 패턴의 존재 유무의 판단만으로 감성 분류를 수행하기 때문에, 사람의 사고 흐름을 전혀 고려하지 않아 텍스트에 포함된 심층 심리를 파악할 수 없는 단점이 있다.

또한, 상기와 같은 종래기술들은 단일 시스템 구조이므로, 기하급수적으로 증가하는 온라인 텍스트 데이터를 효율적으로 처리하기 위한 노력이 부족한 단점이 있다.

이에 본 발명은 상기와 같은 종래기술들에서 발생하는 제반 문제점들을 해결하기 위해서 제안된 것으로서,

본 발명이 해결하고자 하는 과제는 실제 사람의 사고 흐름을 모방하여 온라인 텍스트 데이터(블로그, 댓글, 트위터, 기타 등등)로부터 사람의 감성(긍정, 부정)을 정확하게 분류하도록 한 규칙기반 다중 에이전트를 이용한 감성 분류 시스템 및 그 방법을 제공하는 데 있다.

본 발명이 해결하고자 하는 다른 과제는 사람들의 사고 흐름을 모방하여 정의한 감성 추론과, 단계별 규칙을 기반으로 감성을 분류하도록 한 규칙기반 다중 에이전트를 이용한 감성 분류 시스템 및 그 방법을 제공하는 데 있다.

본 발명이 해결하고자 하는 또 다른 과제는 기하급수적으로 증가하는 인터넷상의 텍스트 데이터의 빠른 감성 분류를 위해 감성 추론을 기준으로 감성 분류 작업을 분할하여 분산 처리하는 다중 에이전트 시스템과 규칙 베이스의 분산 관리를 위한 다중 에이전트 시스템을 제공해주도록 한 규칙기반 다중 에이전트를 이용한 감성 분류 시스템 및 그 방법을 제공하는 데 있다.

상기와 같은 과제들을 해결하기 위한 본 발명에 따른 "규칙기반 다중 에이전트를 이용한 감성 분류 시스템"은,

감성 분류 대상을 기준으로 분산된 분산 구조를 가지는 상위 다중 에이전트;

상기 상위 다중 에이전트와 연결되며, 사람의 사고 흐름을 모방한 계층 구조를 통해 분류 대상별 감성을 분류하는 하위 다중 에이전트를 포함한다.

상기 상위 다중 에이전트 중 각각의 상위 에이전트는,

사용자 또는 다른 에이전트와 통신하여 질의 정보를 수신하는 외부 인터페이스;

감성 추론 규칙이 저장된 규칙 베이스;

상기 외부 인터페이스와 연결되며, 감성 추론 규칙을 생성하여 상기 규칙 베이스에 저장하며, 생성한 감성 추론 규칙을 학습하는 학습모듈;

수신한 질의 정보에 따라 분류 대상을 판별하고, 분류 대상을 평가항목별로 하위 에이전트로 작업을 분산시키고, 상기 규칙 베이스에 저장된 감성 추론 규칙을 이용하여 분류 대상에 대한 감성을 추론하는 추론 엔진;

상기 추론 엔진과 하위 에이전트와의 통신을 담당하는 내부 인터페이스를 포함하는 것을 특징으로 한다.

상기 하위 다중 에이전트 중 각각의 하위 에이전트는,

상기 상의 다중 에이전트와 통신을 위한 내부 인터페이스;

감성 추론 규칙이 저장된 규칙 베이스;

상기 감성 추론 규칙을 생성하여 상기 규칙 베이스에 저장하며, 생성한 감성 추론 규칙을 학습하는 학습모듈;

상기 규칙 베이스에 저장된 감성 추론 규칙을 이용하여 평가항목별로 분류 대상의 감성을 추론하는 추론 엔진을 포함하는 것을 특징으로 한다.

상기와 같은 과제들을 해결하기 위한 본 발명에 따른 "규칙기반 다중 에이전트를 이용한 감성 분류 방법"은,

(a) 사용자의 질의에 해당하는 분류 대상을 판별하여 해당 규칙 베이스를 참조하는 분류대상 인식단계;

(b) 인식한 분류 대상에 대해 사람들이 감성을 표현하는 분류 대상의 특성들을 파악하고, 특성정보를 이용하여 집합을 만드는 평가항목 인식 단계;

(c) 상기 평가항목 인식단계에서 파악한 평가항목들에 대한 사람들의 의견을 파악하여 긍정 및 부정적인 성향을 분석하는 평가내용 분석단계;

(d) 상기 평가내용 분석단계의 긍정적인 성향 분석 결과 또는 부정적인 성향 분석결과를 강조하거나 반전시켜 결과에 대한 보정과 평가항목별 추론 결과를 결합하여 분류 대상에 대한 최종 감성을 분류하는 감성분류 단계를 포함하여 이루어짐을 특징으로 한다.

본 발명에 따르면, 사람의 사고 흐름 및 과정을 모방하여 감성 추론 과정을 단계별로 구성하고, 각 단계별 규칙을 정의하며, 구성한 단계별 감성 추론 과정을 통해 감성을 추론함으로써 다양한 경우의 감성 정보를 파악하여 텍스트에서 표층적으로 보이는 감성뿐만 아니라 심층적으로 내재된 감성을 인식하고 추론할 수 있는 장점이 있다.

또한, 상기와 같은 장점으로 인해 설득력 있는 감성 분류의 결과를 제공할 수 있으며, 그 결과에 대한 상세한 해설을 사람의 사고방식에 맞춰 제공할 수 있는 장점이 있다.

또한, 본 발명에 따르면 각 단계별 규칙은 그 분야 전문가에 의해 구성되며, 확신도 이론을 바탕으로 최대한 신뢰할 수 있는 결과를 제공할 수 있는 장점이 있다.

또한, 본 발명에 따르면 자동 규칙 학습 모듈로 규칙을 갱신하기 때문에 자체 발전이 가능하고, 추론 단계를 기준으로 분류 작업을 분산화하고 이를 위한 분산 계층 구조를 가지는 에이전트를 사용함으로써 대량의 데이터를 효율적으로 처리하여 분류 작업의 효율을 높일 수 있는 장점이 있다.

또한, 본 발명에 따르면 추가로 분산 구조를 가지는 다중 에이전트로 규칙 베이스를 분산관리할 수 있기 때문에, 분류 대상의 다양성 및 시스템의 확장성을 높일 수 있는 장점이 있다.

도 1은 본 발명에 따른 규칙기반 다중 에이전트를 이용한 감성 분류 시스템의 전체 구성도이고,
도 2는 도 1의 다중 에이전트 중 상위 에이전트의 세부 구성도이며,
도 3은 도 1의 다중 에이전트 중 하위 에이전트의 세부 구성도이고,
도 4는 본 발명에 따른 규칙기반 다중 에이전트를 이용한 감성 분류 방법을 보인 흐름도이고,
도 5는 도 4의 단계별 규칙들의 집합인 규칙베이스의 예시도이며,
도 6은 본 발명에서 감성 분류를 위한 전반적인 작업 흐름도이고,
도 7은 본 발명에서 규칙 생성 방법을 보인 흐름도이고,
도 8은 본 발명에서 규칙 학습 방법을 보인 흐름도이고,
도 9는 본 발명에서 품사별 태그의 예시도이며,
도 10은 본 발명에서 분류 대상 '영화"에 대한 추론 단계별 규칙 예시도이다.

이하 본 발명의 바람직한 실시 예를 첨부한 도면에 의거 상세히 설명하면 다음과 같다. 본 발명을 설명하기에 앞서 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그에 대한 상세한 설명은 생략한다.

본 발명에서 감성 추론은 각 추론 과정별 규칙들이 순차적으로, 연쇄적으로 실행(Action)되면서 이루어지며, 본 발명에서 사용하는 규칙의 형태는 "IF절-THEN절"형태로 IF 절에 조건부, THEN 절에 조건에 따른 결과부로 구성된다. 결과부의 결과는 확신도 값(Certainty Factor,cf)을 가지며 이는 규칙이 실행되어 나온 결과가 얼마만큼 신뢰할 수 있는 결과인지 그 정도를 나타내는 수치이다. 확신도 값은 1.0 ~ 1.0 사이의 값을 가진다.

규칙이 실행되는 방법은 다음과 같다. IF 절의 조건부가 참이면, THEN 절의 결과부가 참이 되며 그 결과가 규칙으로부터 얻어낸 새로운 정보 또는 사실이 된다(이때 나온 결과에 대한 신뢰 정도를 확신도 값으로 측정한다). 규칙 실행으로 얻은 새로운 정보 또는 사실은 또 다른 규칙의 조건부의 조건이 될 수 있으며, 이와 같이 특정 규칙의 결과부와 또 다른 규칙의 조건부가 연결됨으로써 논리적인 추론 과정이 이루어진다.

추론 과정 중에서 각 단계별 규칙의 결과와 그 결과의 확신도 값은 다음 단계의 규칙으로 연결되면서 다음 단계의 규칙의 확신도 값과 결합한다. 결합하는 방법은 두 확신도 값의 곱으로 이루어지며, 실제 두 규칙의 연결은 추후 구체적으로 설명하기로 한다.

앞서 언급한 바와 같이, 텍스트 내의 단어가 규칙(IF절-THEN절)의 조건부(IF절)의 단서가 되어 감성 추론 규칙들을 실행시켜 그 결과(THEN절)를 얻는다. 또한 실행 된 규칙들의 결과는 다음 단계의 규칙의 단서로 사용됨으로써 각 단계 간의 연결 고리 역할을 한다. 감성 추론 단계는 1) 분류 대상 인식, 2) 평가 항목 인식, 3) 평가 내용 인식, 4) 임의 규칙(강조, 감소, 반전) 적용 등의 4가지 단계로 구성되며, 각 단계의 규칙 구조는 아래의 [표1]과 같다.

규칙단계	IF 절	THEN절
(1) 분류 대상 인식	<질의어>	<분류대상>
(2) 평가 항목 인식	<분류대상> AND <평가항목>	<평가항목그룹>
(3) 평가 내용 인식	<평가항목그룹> AND <평가내용>	<평가항목그룹[긍정∥부정]>
(4) 임의 규칙	<평가항목그룹[긍정∥부정]> AND <평가내용>

상기 [표 1]의 (1)첫 번째 줄인 분류 대상 인식 규칙들은 사용자가 입력한 질의어가 IF절의 조건부로 사용된다. 그리고 결과인 THEN 절은 질의어에 해당하는 분류대상이다.

(2)두 번째 줄인 평가항목인식 규칙들은 IF절의 조건부를 앞 단계인 분류대상인식 규칙으로부터 나온 결과인 분류대상과 텍스트 데이터 내에 존재하는 평가항목을 한 쌍으로 구성한다. 그리고 결과인 THEN절은 유사한 평가항목들끼리 묶어 놓은 평가항목그룹으로 구성된다.

여기서 평가항목그룹은 동일한 평가내용을 가지는 항목끼리 묶어 생성한다. 평가항목과 평가내용을 구분 짓는 가장 큰 이유는 동일한 평가 내용을 가지더라도 서로 다른 감성을 가지는 경우가 존재하기 때문이다. 예를 들면, "모니터가 크다"에서 "크다"가 "모니터"라는 평가 항목의 평가 내용이며 긍정이라는 감성을 가진다. 하지만 "얼굴이 크다"에서 "크다"는 "얼굴"이라는 평가 항목과 결합하며 부정이라는 이전 "모니터"와 다른 감성을 가진다. 어떤 평가항목과 결합하느냐에 따라 가지게 되는 감성이 다르므로, 평가항목그룹을 생성 시엔 서로 동일한 감성을 가지는 평가항목끼리 묶어 그룹을 생성한다.

(3)세 번째 줄인 평가내용인식 규칙들은 IF절의 조건부는 앞 단계인 평가항목인식 규칙으로부터 나온 결과인 평가항목그룹과 텍스트 데이터 내에 존재하는 평가항목을 한 쌍으로 가진다. 결과인 THEN절은 평가항목그룹과 그에 대한 감성(긍정 또는 부정)을 결과로 가진다.

(4)네 번째 줄인 임의규칙들은 (3)세 번째 규칙의 (평가항목, 평가내용)쌍과 결합되는 수식어를 조건부로 가진다. 수식어는 감성의 강조(증가)와 반전의 역할을 한다. 예를 들면, "모니터가 정말 크다"에서 부사 "정말"이 수식어로 "모니터가 크다"를 수식하며 긍정 감성을 강조한다. 수식어의 종류는 다음 [표 2]와 같다.

종류	단어
강조	너무, 가장, 되게, 진짜, 아주, 정말, 상당히, 매우, 무척, 몹시, ...
반전	드디어, 결코, 아무도, 전혀, 도저히, 도무지, 하나도, 조금도, ...

반전에 대한 수식어는 긍정극어와 부정극어이며, 긍정극어는 긍정과 어울리는 특성을 가진 단어이고 부정극어란 부정과 어울리는 특성을 가진 단어이다. 예를 들어 "전혀"와 같은 부정극어는 "화면이 전혀 크지 않다"와 같이 부정적인 문장에서 사용된다. 위 예에서는"크다"가 부정극어 "전혀"와 구조적으로 연관되어 있기 때문에 "화면이 크다"의 기존 긍정 감성이 아닌 부정 감성을 가짐을 알 수 있습니다.

결론적으로, 네 번째(4) 추론 단계의 규칙은 위와 같이 세 번째(3) 추론 단계 규칙의 결과가 구조적으로 부정극어 혹은 긍정극어와 연관되어 있다면 그 감성을 반전시킨다. 감성을 반전시키는 방법은 세 번째 추론 단계의 규칙과 네 번째 추론 단계의 규칙의 실행이 서로 연결되면서 이루어지는 확신도 값의 결합(곱)으로 이루어진다. 네 번째 규칙의 확신도 값은 음의 값을 가지며, 이 음의 확신도 값을 곱해 줌으로써 세 번째 규칙의 확신도 값의 부호가 바뀌어 최종 감성 정보가 반전된다.

이하에서는 상기와 같은 본 발명의 개념을 기반으로, 본 발명의 바람직한 실시 예들을 구체적으로 설명한다.

도 1은 본 발명에 따른 규칙기반 다중 에이전트를 이용한 감성 분류 시스템의 전체 구성도로서, 계층 구조 및 분산 구조를 가지는 규칙기반 다중 에이전트(100)를 적용한 감성 분류 시스템이다.

규칙기반 다중 에이전트(100)는 감성 분류 대상을 기준으로 분산된 분산 구조를 가지는 상위 다중 에이전트(110)와; 상기 상위 다중 에이전트(110)와 연동하며, 사람의 사고 흐름을 모방한 계층 구조를 통해 분류 대상별 감성을 분류하는 하위 다중 에이전트(120)를 포함한다.

여기서 상위 다중 에이전트(110)는 다수의 상위 에이전트(111)(상위 에이전트 1 ~ 상위 에이전트N)으로 이루어지고, 하위 다중 에이전트(120)는 다수의 하위 에이전트(121)(하위 에이전트 1 ~ 하위 에이전트 M)으로 이루어진다.

여기서 상위 다중 에이전트(110) 내의 각각의 상위 에이전트의 구성 및 작용은 동일하고, 하위 다중 에이전트(120) 내의 각각의 하위 에이전트의 구성 및 작용은 동일하므로, 이하에서는 설명의 편의를 위해 하나의 상위 에이전트(111)와 하위 에이전트(121)에 대해서만 설명하기로 한다.

상위 에이전트(111)는 도 2에 도시한 바와 같이, 외부 인터페이스(210), 추론 엔진(220), 규칙 베이스(230), 학습모듈(240), 내부 인터페이스(250)로 구성된다.

외부 인터페이스(210)는 사용자 또는 다른 에이전트와 통신하여 질의 정보를 수신하는 역할을 하며, 규칙 베이스(230)는 감성 추론 규칙을 저장하는 데이터베이스(DB) 역할을 한다. 학습 모듈(240)은 상기 외부 인터페이스(210)와 연동하며, 감성 추론 규칙을 자동/반자동으로 생성하여 상기 규칙 베이스(230)에 저장하고, 생성한 감성 추론 규칙을 학습하는 역할을 한다.

추론엔진(220)은 수신한 질의 정보에 따라 분류 대상을 인식하고, 분류 대상을 평가항목별로 하위 에이전트로 작업을 분산시키고, 상기 규칙 베이스(230)에 저장된 감성 추론 규칙을 이용하여 분류 대상에 대한 감성을 추론하는 역할을 한다.

내부 인터페이스(250)는 상기 추론 엔진(220)과 하위 에이전트와의 통신을 담당하는 역할을 한다.

이렇게 구성되는 상위 에이전트(111)는 사용자 혹은 다른 상위 에이전트에게 질의를 받아 분류 대상을 인식하고, 분류 대상의 평가항목별로 하위 에이전트로 작업을 분산시킨다. 하위 에이전트(121)는 상위 에이전트(111)로부터 할당된 평가항목에 대한 분류 작업을 수행한다. 여기서 분류 대상이란 사람들의 감성 표현의 대상이며, '핸드폰', '카메라', '삼성', '현대', '자동차' 등이 해당된다. 또한, 분류 대상의 평가항목이란 실제 사람들이 감성을 표현하는 구체적인 분류 대상의 특성을 의미하며, '액정(핸드폰)', '렌즈(카메라)', '주가(삼성)' 등이 해당된다.

주지한 하위 에이전트(121)는 도 3에 도시한 바와 같이, 내부 인터페이스(310), 규칙 베이스(330), 학습모듈(340), 추론 엔진(320)을 포함한다.

내부 인터페이스(310)는 상기 상위 다중 에이전트와 통신을 하여 분류 대상의 평가항목별 감성 분류에 대한 데이터를 수신하게 되고, 규칙 베이스(330)는 감성 추론 규칙을 저장하는 역할을 한다.

학습모듈(340)은 상기 감성 추론 규칙을 자동/반자동으로 생성하여 상기 규칙 베이스(330)에 저장하며, 생성한 감성 추론 규칙을 학습하는 역할을 한다.

추론 엔진(320)은 상기 규칙 베이스(330)에 저장된 감성 추론 규칙을 이용하여 평가항목별로 분류 대상의 감성을 추론하는 역할을 한다.

도 4는 본 발명에 따른 규칙기반 다중 에이전트를 이용한 감성 분류 방법을 보인 흐름도로서, 감성 추론 규칙은 사람의 사고 흐름을 모방하여 계층 구조를 가진다. 이러한 감성 추론 규칙은 (a) 사용자의 질의에 해당하는 분류 대상을 인식하여 해당 규칙 베이스를 참조하는 분류대상 인식단계(S110)와; (b) 인식한 분류 대상에 대해 사람들이 감성을 표현하는 분류 대상의 특성들을 파악하고, 유사한 성격을 지니는 특성끼리 묶어 집합을 만드는 평가항목 인식 단계(S120)와; (c) 상기 평가항목 인식단계에서 파악한 평가항목들에 대한 사람들의 의견을 파악하여 긍정 및 부정적인 성향을 분석하는 평가내용 분석단계(S130)와; (d) 상기 평가내용 분석단계의 긍정적인 성향 분석 결과 또는 부정적인 성향 분석결과를 강조하거나 반전시켜 결과에 대한 보정과 평가항목별 추론 결과를 결합하여 분류 대상에 대한 최종 감성을 분류하는 감성분류 단계(S140)로 이루어진다.

분류대상 인식 단계(S110)는 사용자의 질의에 해당하는 분류 대상을 인식하여 해당 규칙 베이스를 참조하는 단계이다.

분류 대상을 인식하기 위한 규칙(Rule)들이 규칙베이스에 존재한다. 사용자가 특정 질의어로 질의를 할 시, 입력된 질의어가 어떤 분야(분류 대상에 대한)인지 규칙베이스의 규칙으로부터 추론해 낸다. 아래 [표 3] 안의 내용은 규칙베이스에 존재하는 분류 대상 인식을 위한 규칙들의 한 예(영화에 대한 단편적인 예)이다.

분류대상인식	해운대, NNG	영화, MOVIE	1.0
	코리아, NNG	영화, MOVIE	1.0
	어벤져스, NNG	영화, MOVIE	1.0
	. . .	. . .	. . .

예를 들어, 사용자가 영화의 제목 "광해"를 질의어로 질의를 하면, 규칙베이스의 규칙 "'IF'광해.NNG 'THEN''영화.MOVIE'"에 의해 입력된 질의어는 '영화'분야에 속한다는 것을 인식한다.

위 분류 대상 인식을 위한 규칙들의 입력은 두 가지 방법으로 이루어진다.

1) 전문가가 직접 입력하거나, 2) 영화와 관련된 다양한 문서로부터 데이터 마이닝을 통해 영화와 연관된 단어들을 추출하여 자동으로 규칙을 생성하는 방법이 있다. 두 번째 방법을 사용할 시 자동으로 추출된 규칙들 중 잘못된(분류 대상을 제대로 인식할 수 없는) 규칙들은 제거시킨다.

다음으로, 평가항목 인식단계(S120)는 정해진 분류대상에 대해 사람들이 감성을 표현하는 분류 대상의 특성들을 파악하고 유사한 성격을 지니는 특성끼리 묶어 집합을 만드는 단계이다. 상기 분류 대상의 특성들을 평가항목이라 하며, 평가항목 집합이 분류 작업의 분산 기준이다.

상기 분류 대상 인식 단계에서 분류 대상이 인식되어 그 대상이 정해지면, 정해 진 분류대상을 단서로 하는 그와 관련된 평가항목인식 단계의 규칙들만이 추론을 위해 사용된다(그 외의 다른 분류대상과 관련된 평가항목인식 규칙들은 애초에 IF절의 조건을 만족할 수 없으므로 제외된다).

사용자가 입력한 질의어의 분류 대상 인식이 완료되면, 인식된 분류 대상과 관련된 평가항목들을 텍스트 데이터로부터 추출한다. 이는 텍스트 데이터 내의 모든 단어들을 단서로 하여 두 번째 단계의 규칙의 조건절과 비교하여 조건을 만족하는 규칙이 실행되는 식으로 이루어진다.

도 10에서 보면, 분류 대상(예, '영화')가 인식되고, 인식된 분류 대상과 그와 관련된 평가 항목들을 조건부로 가지는 다음 평가항목인식 단계의 규칙들이 분류 대상의 평가항목들을 인식하기 위해 사용된다.

이후, 평가내용 분석단계(S130)는 앞선 평가항목 인식 단계(S120)에서 파악한 평가항목들에 대한 사람들의 의견을 파악하여 긍정적인 또는 부정적인 성향을 분석하는 단계이다.

평가항목은 유사한 성격을 지니는 평가항목끼리 묶어 그룹을 만들고, 이를 기준으로 하위 에이전트에 작업을 분산시킨다. 평가항목을 묶는 기준은 평가항목과 결합하는 평가내용이 유사한 것이며, 이는 평가항목에 사용되는 평가내용이 동일하며 그때 가지는 감성이 동일한 것을 말한다. 예를 들면, 사람과 연관된 평가항목들(배우, 연기자, 감독, 관객 등)은 CHARACTER 라는 그룹으로 묶어 준다.

평가항목그룹은 사전에 전문가가 정의하며, 그룹에 대한 정보는 상위 에이전트가 시스템 내부적으로 가지고 있다. 위 정보는 평가항목그룹과 하위에이전트 쌍으로 저장되어 있다. 이 정보가 의미하는 바는 특정 그룹평가항목을 쌍을 이루는 하위에이전트로 작업을 전달하라는 것이다. 고른 작업을 위해 평가항목그룹들은 하위에이전트들로 균등하게 분배된다.

평가항목인식 단계에서 평가항목그룹이 정해지면 상위 에이전트는 저장된 평가항목그룹과 그에 해당하는 하위에이전트 쌍의 정보를 통해 하위에이전트로 남은 감성 추론 작업(평가내용인식 및 임의규칙 단계)을 전달한다.

마지막 단계인 감성 분류 단계(S140)는 앞선 평가내용 분석단계(S130)의 긍정적인 또는 부정적인 감성 분류 결과를 강조하거나 반전시키는 등 결과에 대한 보정과 평가항목 별 추론 결과를 결합하여 분류 대상에 대한 최종 감성을 분류하는 단계이다.

분류 대상의 특성들이 분류 대상의 평가항목이 된다. 텍스트 문서로부터 분류 대상의 특성들을 파악하는 방법은 문서 내에 존재하는 단어들과 두 번째 추론 단계인 평가항목인식 단계의 규칙들을 사용하는 것이다.

평가항목인식 규칙 및 평가내용인식 규칙을 구성하는 평가항목(특성)들과 대응하는 평가내용은 학습용 텍스트 문서로부터 추출한다. 이때, 수동으로 전문가가 직접 규칙베이스에 입력하거나, 자연어 처리 기법을 사용하여 자동으로 추출하여 입력한다.

자동으로 규칙을 생성하여 입력하는 과정은, 자연어 처리를 통해 품사가 명사인 단어와 이와 문장 구조적으로 연결된 형용사 혹은 동사 단어를 결합하여 후보 집합을 생성하고, 이로부터 전문가가 개입하여 후보 집합으로부터 적절한 규칙들을 선택하여 입력한다. 전문가가 개입하지 않아도 차후 학습 모듈의 규칙베이스 학습을 통해 적합하지 않은 규칙은 제거되거나 실제 감성 추론 시에 미치는 영향력이 낮아지게 된다.

평가항목에 대한 평가내용이 사람들이 평가항목들에 대해 가지는 의견이다. 그리고 그 긍정 및 부정적인 성향은 총 네 단계의 추론 과정을 거쳐 분석되며, 그 중 세 번째 또는 네 번째 추론 단계 규칙의 결과와 결과에 대한 확신도(Certainty Factor, cf)로 분석된다. 세 번째 그리고 네 번째 단계의 규칙의 결과부(THEN절)는 "긍정.POSITIVE"를 결과로 가지고 있으며, 그에 대한 확신도 값(cf)을 가지고 있다. 결과인"긍정.POSITIVE"에 대한 확신도 값이 양의 값을 가지면 해당 평가항목에 대한 평가내용이 긍정적인 감성을 가지는 것으로 분석하며, 반대로 음의 값을 가지면 부정적인 감성을 가지는 것으로 분석한다. 그리고 긍정 혹은 부정 감성의 정도(크기)는 확신도 값의 크기로 분석됩니다. 확신도 값은 - 1.0 ~ 1.0 사이의 값을 가지며 1에 가까울수록 강한 긍정, -1에 가까울수록 강한 부정 감성을 가지는 것으로 분석된다.

긍정 및 부정적인 성향 분석 결과의 강조 및 반전은 단계별 규칙들이 실행되면서 이루어지는 각 단계별 결과에 대한 확신도 값의 결합에 의해 이루어진다.

예를 들어, 세 번째 단계의 규칙 "IF 그래픽.SCENE AND 화려하다.VA THEN 그래픽.POSITIVE(1.0)"가 실행되고, 네 번째 단계의 규칙 "IF 그래픽.POSITIVE AND 별로.MAG THEN 긍정.POSITIVE(-1.0)"이 실행된 세 번째 규칙과 연결되어 실행되면 두 규칙의 확신도 값의 곱으로 최종 결과 확신도 값을 구한다. 즉, -1.0 × 1.0 = -1.0 이 되어 최종 결과에 대한 확신 도는 1.0 음의 값을 가지며 부정 감성을 결과로 도출한다.

강조의 경우는 네 번째 규칙의 확신도 값이 1.0 이상의 값을 가지게 되며 세 번째 규칙의 결과 확신 도와 결합(곱)해짐으로써 최종 결과 확신도 값이 커지는 식으로 이루어진다.

예컨대, 분류 대상이 영화라고 할 경우 규칙 베이스의 일 예가 도 5에 도시된다. 분류 대상 인식(510), 분류 대상의 평가항목(520), 평가항목에 대한 평가내용(530)으로서, 감성 분류 단계는 생략된 세 단계의 규칙베이스를 보인다.

규칙 베이스의 추론 규칙은 세 부분으로 구성된다. 조건이라고 하는 IF 부분과, 행동이라고 하는 THEN 부분, 그리고 규칙의 신뢰 정도를 측정하는 수치인 확신도(certainty factor; cf)로 구성된다. IF 부분의 조건이 참일 경우 THEN 부분의 행동이 실행되어 그 결과가 확신도 만큼의 신뢰도를 가지면서 참이 되는 방법으로 규칙이 수행된다.

확신도 값은 해당 분야 전문가에 의해 측정되며 최소값 -1.0(확실히 거짓)과 최대값 1.0(확실히 참) 사이의 값을 가진다. 만약, 특정 규칙의 확신도 값이 0.8을 가질 시 그 규칙의 결과를 매우 신뢰할 수 있다는 것을 의미하고, 반대로 -0.8일 경우 매우 신뢰할 수 없다는 것을 의미한다. 확신도 값에 의해 규칙의 결과에 대한 확신(신뢰) 정도를 수치로 보임으로써 더욱 세분화된 분류 결과를 보일 수 있다.

IF 부분에는 AND(논리곱)나 OR(논리합) 혹은 둘을 조합한 여러 조건이 있을 수 있고, THEN의 행동도 여러 절이 있을 수 있다. THEN의 행동 결과는 다른 규칙의 조건일 수 있다. 이러한 규칙의 결과와 다른 규칙의 조건의 연결로 추론 단계를 구성한다. 규칙의 기본 문법은 다음과 같다.

규칙 : IF <조건1>

AND <조건2>

.

AND <조건n>

THEN <행동1>

<행동2>

.

<행동m> (cf)

규칙의 조건에는 단어와 단어의 품사 쌍인 <단어, 품사>가 들어간다. "IF <영화, NNG>"는 텍스트 문서 내에 'NNG' 품사를 가지는 단어 '영화'가 존재하는지 여부를 의미한다. 'NNG'는 단어의 품사 중 명사 품사를 의미하는 태그이며, 규칙에서 사용되는 품사와 대응하는 태그는 도 9와 같다. 조건이 AND로 조합되는 "IF <영화, NNG> AND <재밌다, VA>"의 경우는 NNG 품사를 가지는 단어 '영화'와 VA 품사를 가지는 단어 '재밌다'가 텍스트 문서 내에 존재하며, 두 단어가 수식 관계 혹은 서술 관계를 가지는지 그 여부를 의미한다. 이처럼 IF의 단어 혹은 단어의 조합이 텍스트 문서 내에 존재하면 해당 규칙의 조건이 만족하여 THEN의 행동이 실행되고 그 결과가 참이 된다.

규칙의 행동은 전에 정의한 추론 단계별 결과를 의미하며, IF의 조건이 참일 경우 행동이 실행되고 그 결과가 참이 된다. "IF <영화, NNG> AND <재밌다, VA> THEN <긍정, POSITIVE> (cf 0.8)"의 경우, IF의 두 단어의 조합이 텍스트 문서 내에 존재할 시 '긍정'이라는 매우 신뢰할 수 있는 결과를 얻는다. 만약, cf값이 음수 (예, -0.8)을 가지면 긍정이라는 결과에 반대되는 거짓을 의미하므로 그 결과는 매우 신뢰할 수 있는 '부정' 결과를 얻는다. 상기 규칙의 예는 감성 추론 단계 중 평가내용 분석 단계로, 텍스트 문서에 긍정적인 의견이 포함되어 있다는 것을 의미한다.

감성 추론 과정의 마지막 단계의 규칙의 THEN 절은 '긍정::POSITIVE (cf 값)'이다. 확신도 값의 부호에 따라 양의 확신도 값을 가지는 결과는 긍정, 음의 확신도 값을 가지는 결과는 부정으로 간주하며, 두 결과에 대한 신뢰 정도는 확신도 값의 절대값인 |확신도값|으로 판단한다. 이 같은 이유로 조건을 만족하여 여러 추론 규칙이 수행되면 그 결과는 모두 동일한 결과(긍정 또는 부정)를 낸다. 이를 하나로 결합하기 위해 확신도 결합 법칙을 사용한다. 확신도 결합을 위한 계산식은 하기의 [수식 1]과 같으며, 위에서부터 각각 확신도 값이 모두 양인 경우(긍정)와 반대인 경우(부정)에 대한 결합 계산식이다. 감성 추론의 최종 결과는 모든 긍정 결과의 확신도 값을 결합한 최종 긍정 결과와 모든 부정 결과의 확신도 값을 결합한 최종 부정 결과이다.

규칙의 문법과 정의한 감성 추론 단계에 맞춰 단계별 규칙을 정의한 예는 다음 도 10에서 보이며, 이는 도 5의 분류 범주 '영화'에 대한 추론 단계별 규칙의 예이다. 단계별 규칙의 결과를 다음 단계의 조건으로 가지게 함으로써 정의한 순서에 맞게 감성을 추론해 나간다. 추가적인 부분은 분류 대상 인식을 위한 태그와, 유사한 성격을 가지는 평가항목들을 묶기 위한 평가항목 집합 태그를 정의한 것이다. 예를 들면, 도 10의 분류대상 인식 단계에서는 영화제목(해운대, 코리아 등)이 분류 질의로 입력될 시 분류대상인식 규칙에 의해 <영화, MOVIE>라는 공통의 결과를 얻는다. 또한, 평가항목 인식 단계에서는 분류 대상의 특정 평가항목이 존재할 시 그 결과는 평가항목에 적절한 평가항목 집합 태그(예, CHARACTER(인물), SCENE(장면), FEEL(느낌) 등)를 붙인다.

규칙의 학습모듈은 두 가지 세부 모듈로 구성된다. 각각 단계별 감성 추론 규칙을 생성하는 규칙생성모듈과 규칙베이스의 규칙의 확신도 값을 갱신하는 규칙학습모듈이다. 상위 에이전트의 학습모듈은 두 세부 모듈을 모두 가지고 있지만 하위 에이전트의 학습모듈은 규칙학습모듈만 가진다. 이는 규칙 생성은 하위 에이전트가 아닌 상위 에이전트에서만 이루어지고, 생성된 규칙 중 평가내용분석 단계의 규칙만이 하위 에이전트의 규칙 베이스에 저장된다.

규칙생성모듈은 그래프 랭킹 알고리즘을 이용하여 학습 문서로부터 주요 단어들의 랭크를 구하고, 상위 랭크를 가지는 단어들 중 감성을 표현하는 단어를 전문가 혹은 사용자가 직접 추출하고 이를 사용하여 규칙을 생성하는 생성 단계를 가진다. 그래프 랭킹 알고리즘은 문서의 단어를 노드로 단어와 단어 사이의 관계를 엣지(노드 간의 연결 선)으로 하여 그래프를 생성하고, 생성한 그래프에 페이지랭킹(Page Rank) 알고리즘을 사용하여 그래프 구조상 가장 많은 관계를 가지는 단어에 높은 랭크를 매기는 방법이다. 상위 랭크를 가지는 단어들로 규칙 후보 집합을 생성하고, 이로부터 전문가 또는 사용자가 직접 추론 단계별 규칙을 생성한다.

감성 분류를 위한 구체적인 과정이 도 6에 도시된다.

도 6에 도시된 바와 같이, 사용자가 분류 대상을 입력하면(S610) 분류 대상과 관련된 온라인 텍스트 데이터를 수집하여 시스템에 입력한다(S620). 사용자로부터 분류 대상을 입력받은 상위 에이전트는 이에 해당하는 추론 규칙을 갖고 있는지 검사하여(S630), 없을 경우 해당 규칙베이스를 가지는 다른 상위 에이전트에, 반대의 경우 바로 감성 분류를 수행한다. 예를 들어, '해운대'를 사용자가 입력하면 "IF '해운대. NNG' THEN '영화. MOVIE'" 규칙이 실행되어 분류 대상을 '영화. MOVIE'로 인식하고 감성 분류를 시작한다.

감성 분류 작업은 입력받은 분류 대상의 평가항목을 인식하고(S650), 인식 된 전체 평가 항목 집합을 중복 없는 부분 집합으로 나누어 하위 에이전트로 작업을 분할한다(S660). 하위 에이전트는 할당받은 평가항목에 대한 평가내용을 분석하여 감성을 추론한다(S670). 감성 추론은 상위 에이전트는 각 하위 에이전트의 감성 추론 결과를 결합하고(S680), 그 결과에 대한 강조 및 반전 규칙을 통해 최종 감성을 결정하여 분류한다(S690).

분산 구조를 가지는 상위 다중 에이전트(110)를 통해 규칙 베이스를 공유하고(S640), 계층 구조를 가지는 하위 다중 에이전트(120)를 통해 분류 대상의 평가 항목을 기준으로 분류 작업을 분할하여(S660) 분산 처리하는 것이 주요 포인트이다.

감성 분류를 위한 추론 규칙 생성은 도 7과 같다.

도 7에 도시한 바와 같이, 생성할 추론 규칙의 분류 대상을 결정하고(S710), 결정된 분류 대상과 관련된 학습 문서를 수집한다(S720). 수집한 학습 문서로부터 분류 대상의 평가 항목을 추출하기 위해 자연어 처리기법을 사용한다(S730). 평가 항목은 분류 대상이 가지는 특징으로 주로 품사가 명사이므로, 명사 품사를 가지는 단어 중 학습 문서 내에서 출현 빈도가 높고 다른 단어와의 구조적인 관계가 많은 단어를 추출하고 그 중 수작업으로 분류 대상의 평가 항목을 추려낸다. 추려낸 평가 항목과 연관된 평가내용 역시 수집한 학습 문서로부터 추출하여 감성 추론 과정의 각 단계별 규칙 후보 집합을 생성한다(S740). 평가 항목과 연관된 평가 내용의 추출 역시 자연어 처리를 통해 평가 내용과 구조적, 의미적으로 연결된, 품사가 용안(동사, 형용사)인 단어를 추출한다. 생성한 규칙 후보 집합으로부터 현재 규칙 베이스에 규칙의 존재 여부를 판단하여 규칙 베이스에 존재하지 않는 신규 규칙 후보 집합을 생성한다(S750). 신규 규칙 후보 집합으로부터 전문가에 의해 감성 분류에 필요한 최종 분류 규칙을 추출하고 새로운 규칙을 생성하여 규칙 베이스에 추가한다(S760).

규칙 학습은 특정 분류 대상에 대한 감성 분류 규칙들이 감성 분류에 미치는 정확도를 측정하여, 높은 정확도를 가지는 규칙들의 확신도 값을 높여(1 또는 1에 가까운 값으로) 생존시키고, 낮은 정확도를 가지는 규칙들은 확신도 값을 낮추어(0에 가까운 값으로) 퇴보시키는 작업이다.

규칙 학습은 도 8과 같은 순서로 수행된다.

도 8에 도시한 바와 같이, 규칙 학습은 학습할 규칙의 분류 대상을 선택하고(S810), 해당 분류 대상과 관련된 학습 문서를 입력한다(S820). 학습 문서는 이미 분류 정답을 알고 있는 문서이다. 학습 문서를 입력으로 감성 분류를 수행하여(S830) 분류 결과를 얻는다. 분류 결과와 실제 학습 문서의 분류 정답을 비교하여(S840) 정확도를 측정한다. 올바른 결과를 도출한 분류 규칙들의 확신도 값을 증가시키고, 틀린 결과를 도출한 분류 규칙들의 확신도 값을 낮추어 규칙들을 갱신시킨다(S850).

본 발명은 상술한 특정의 바람직한 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.

100… 규칙기반 다중 에이전트
110… 상위 다중 에이전트
120… 하위 다중 에이전트
111… 상위 에이전트
121… 하위 에이전트
210… 외부 인터페이스
220… 추론 엔진
230… 규칙 베이스
240… 학습모듈
250… 내부 인터페이스

Claims

감성 분류 대상을 기준으로 분산된 분산 구조를 가지며, 분류 대상을 평가항목별로 분산시키는 상위 다중 에이전트;
상기 상위 다중 에이전트와 연결되며, 분류 대상별 감성을 분류하는 하위 다중 에이전트를 포함하고;
상기 상위 다중 에이전트는,
사용자 또는 다른 에이전트와 통신하여 질의 정보를 수신하는 외부 인터페이스;
감성 추론 규칙이 저장된 규칙 베이스;
상기 외부 인터페이스와 연결되며, 감성 추론 규칙을 생성하여 상기 규칙 베이스에 저장하며, 생성한 감성 추론 규칙을 학습하는 학습모듈;
수신한 질의 정보에 따라 분류 대상을 판단하고, 분류 대상을 평가항목별로 하위 에이전트로 작업을 분산시키고, 상기 규칙 베이스에 저장된 감성 추론 규칙을 이용하여 분류 대상에 대한 감성을 추론하는 추론 엔진;
상기 추론 엔진과 하위 에이전트와의 통신을 담당하는 내부 인터페이스를 포함하는 것을 특징으로 하는 규칙기반 다중 에이전트를 이용한 감성 분류 시스템.
삭제
청구항 1에 있어서, 상기 하위 다중 에이전트 중 각각의 하위 에이전트는,
상기 상위 다중 에이전트와 통신을 위한 내부 인터페이스;
감성 추론 규칙이 저장된 규칙 베이스;
상기 감성 추론 규칙을 생성하여 상기 규칙 베이스에 저장하며, 생성한 감성 추론 규칙을 학습하는 학습모듈;
상기 규칙 베이스에 저장된 감성 추론 규칙을 이용하여 평가항목별로 분류 대상의 감성을 추론하는 추론 엔진을 포함하는 것을 특징으로 하는 규칙기반 다중 에이전트를 이용한 감성 분류 시스템.
(a) 사용자의 질의에 해당하는 분류 대상을 판별하여 해당 규칙 베이스를 참조하는 분류대상 인식단계;
(b) 인식한 분류 대상에 대해 사람들이 감성을 표현하는 분류 대상의 특성들을 파악하고, 파악한 특성 정보를 이용하여 집합을 만드는 평가항목 인식 단계;
(c) 상기 평가항목 인식단계에서 파악한 평가항목들에 대한 사람들의 의견을 파악하여 긍정 및 부정적인 성향을 분석하는 평가내용 분석단계;
(d) 상기 평가내용 분석단계의 긍정적인 성향 분석 결과 또는 부정적인 성향 분석결과를 강조하거나 반전시켜 결과에 대한 보정과 평가항목별 추론 결과를 결합하여 분류 대상에 대한 최종 감성을 분류하는 감성분류 단계를 포함하고;
상기 (a)단계는,
(a-1) 사용자에 의해 분류 대상이 입력되면, 상기 분류 대상과 관련된 온라인 텍스트 데이터를 수집하는 단계;
(a-2) 상기 분류 대상에 대한 규칙 베이스가 존재하는지를 확인하여, 규칙 베이스가 존재하지 않을 경우 다른 상위 에이전트에 분류 대상을 전달하고, 상기 규칙베이스가 존재할 경우 분류 대상을 판별하는 단계를 포함하는 것을 특징으로 하는 규칙기반 다중 에이전트를 이용한 감성 분류방법.
삭제
청구항 4에 있어서, 상기 (b)단계는,
입력받은 분류 대상의 평가항목을 판별하고, 판별된 전체 평가 항목 집합을 중복 없는 부분 집합으로 나누어 하위 에이전트로 작업을 분할하는 것을 특징으로 하는 규칙기반 다중 에이전트를 이용한 감성 분류방법.
삭제
청구항 4에 있어서, 상기 규칙 베이스는,
생성할 추론 규칙의 분류 대상을 결정하고, 결정된 분류 대상과 관련된 학습 문서를 수집하는 단계;
상기 수집한 학습 문서로부터 분류 대상의 평가 항목을 추출하기 위해 자연어 처리기법을 적용하여 평가 항목을 추출하는 단계;
상기 추출한 평가 항목과 연관된 평가내용을 수집한 학습 문서로부터 추출하여 감성 추론 과정의 각 단계별 규칙 후보 집합을 생성하는 단계;
상기 생성한 규칙 후보 집합으로부터 현재 규칙 베이스에 규칙의 존재 여부를 판단하여 규칙 베이스에 존재하지 않는 신규 규칙 후보 집합을 생성하는 단계;
상기 신규 규칙 후보 집합으로부터 규칙 학습을 통해 전문가에 의해 감성 분류에 필요한 최종 분류 규칙을 추출하고 새로운 규칙을 생성하여 규칙 베이스에 추가하는 단계를 포함하는 것을 특징으로 하는 규칙기반 다중 에이전트를 이용한 감성 분류방법.
삭제
청구항 8에 있어서, 상기 규칙 학습은 학습할 규칙의 분류 대상을 선택하고, 해당 분류 대상과 관련된 학습 문서를 입력받은 후, 학습 문서를 입력으로 감성 분류를 수행하여 분류 결과를 획득하고, 상기 분류 결과와 실제 학습 문서의 분류 정답을 비교하여 정확도를 측정하며, 상기 정확도를 기반으로 올바른 결과를 도출한 분류 규칙들의 확신도 값을 증가시키고, 틀린 결과를 도출한 분류 규칙들의 확신도 값을 낮추어 규칙들을 갱신시키는 것을 특징으로 하는 규칙기반 다중 에이전트를 이용한 감성 분류방법.