KR20100020678A - 양태 분석 장치, 양태 분석 방법, 저장 매체, 정보 제공 시스템, 정보 제공 서비스 서버 및 정보 제공 방법 - Google Patents
양태 분석 장치, 양태 분석 방법, 저장 매체, 정보 제공 시스템, 정보 제공 서비스 서버 및 정보 제공 방법 Download PDFInfo
- Publication number
- KR20100020678A KR20100020678A KR1020080079372A KR20080079372A KR20100020678A KR 20100020678 A KR20100020678 A KR 20100020678A KR 1020080079372 A KR1020080079372 A KR 1020080079372A KR 20080079372 A KR20080079372 A KR 20080079372A KR 20100020678 A KR20100020678 A KR 20100020678A
- Authority
- KR
- South Korea
- Prior art keywords
- information
- aspect analysis
- analysis
- sentence
- morpheme
- Prior art date
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
본 발명은 양태 분석 장치, 양태 분석 방법, 저장 매체, 정보 제공 시스템, 정보 제공 서비스 서버 및 정보 제공 방법에 관한 것으로, 문장에 포함된 심리적 태도를 분석하여 문장을 세밀하게 이해할 수 있도록, 본 발명에 따른 양태 분석 장치는, 사용자로부터 양태 분석 대상을 입력받는 입력부; 상기 양태 분석 대상에서 마지막 문장을 분리하는 문장 분리부; 형태소품사열, 양태코드 및 가중치를 포함하는 정보가 저장된 양태 분석 규칙 사전 DB; 상기 문장 분리부에서 분리된 마지막 문장에 대해 상기 양태 분석 규칙 사전 DB의 형태소품사열과 비교하는 문자열 비교부; 및 상기 문자열 비교부에서 일치된 형태소품사열에 대한 가중치를 양태코드별로 합산하는 가중치 합산부;를 포함한다.
문장, 양태, 형태소, 양태코드, 가중치
Description
본 발명은 양태 분석 장치, 양태 분석 방법, 저장 매체, 정보 제공 시스템, 정보 제공 서비스 서버 및 정보 제공 방법에 관한 것으로, 보다 상세하게는 문장에 포함된 심리적 태도를 분석하여 문장을 세밀하게 이해할 수 있는 기술에 관한 것이다.
문장의 양태는 지각, 추측, 희망, 금지, 의지, 능력, 선호 등과 같이 다양하게 구분되며, 문장에 포함된 심리적 태도를 나타낸다.
언어학 분야에서 문장의 양태를 어떤 종류로 나눌 것인지에 대한 연구는 있었지만, 한국어 문장에서 양태를 체계적으로 분석한 연구가 이루어지지 않고 있는 실정이다.
예를 들어, '비빔밥을 먹었어야 했는데'와 '비빔밥을 먹고 싶다'는 두 문장 이 있으면, 종래의 문장 분석은 술어로 '먹다'를 목적어로 '비빔밥'을 분석하게 된다. 따라서 첫번째 문장의 양태가 '후회'이고, 두번째 문장의 양태가 '희망'임을 판단할 수 없으므로, 문장의 의미적인 차이나 심리적 태도를 알 수 없게 된다.
따라서, 대화형 인터페이스나 채팅 서비스를 제공하는 서비스 로봇은 전술된 두 가지 문장에 대해 동일한 판단 결과를 얻어내고, 동일한 응답을 출력하기 때문에 효과적인 의사 소통이 불가능한 문제가 발생한다.
본 발명은 전술된 종래기술에 따른 문제점을 해결하기 위하여 도출된 것으로서, 문장에 포함된 양태를 분석할 수 있는 기술의 제공을 목적으로 한다.
본 발명의 다른 목적은 대화형 인터페이스나 채팅 서비스를 제공하는 서비스 로봇이 효과적인 의사 소통을 수행할 수 있도록 하는 것이다.
본 발명의 또 다른 목적은 분석중에 오류가 발생하더라도 다른 분석에 오류가 전파되지 않는 양태 분석 기술을 제공하는 것이다.
전술된 목적을 달성하기 위하여, 본 발명의 실시형태에 따른 양태 분석 장치는, 사용자로부터 양태 분석 대상을 입력받는 입력부; 상기 양태 분석 대상에서 마지막 문장을 분리하는 문장 분리부; 형태소품사열, 양태코드 및 가중치를 포함하는 정보가 저장된 양태 분석 규칙 사전 DB; 상기 문장 분리부에서 분리된 마지막 문장에 대해 상기 양태 분석 규칙 사전 DB의 형태소품사열과 비교하는 문자열 비교부; 및 상기 문자열 비교부에서 일치된 형태소품사열에 대한 가중치를 양태코드별로 합산하는 가중치 합산부;를 포함한다.
본 실시형태에서, 외부와 데이타를 송수신하는 통신부를 추가로 포함하고, 상기 통신부를 통해 양태 분석 대상을 수신하여 양태를 분석할 수 있다.
본 실시형태에서, 상기 가중치 합산부에서 합산된 결과에 따라 양태코드를 정렬하는 결과 정렬부;를 추가로 포함할 수 있다.
전술된 목적을 달성하기 위하여, 본 발명의 다른 실시형태에 따른 양태 분석 방법은, 문장 분리부가 양태 분석 대상에서 마지막 문장을 분리하는 분리 단계; 문자열 비교부가 상기 분리 단계에서 분리된 마지막 문장에 대해 양태 분석 규칙 사전 DB의 형태소품사열과 비교하는 비교 단계; 및 가중치 합산부가 상기 비교 단계에서 일치된 형태소품사열에 대한 가중치를 양태코드별로 합산하는 합산 단계;를 포함한다.
본 실시형태에서, 상기 분리 단계는: 상기 양태 분석 대상에 존재하는 문장 부호를 검색하는 분리1단계; 상기 분리1단계에서 검색된 문장 부호 다음에 다른 형태소가 있는지 조사하는 분리2단계; 상기 분리2단계의 조사에서, 다른 형태소가 있는 경우 이 형태소가 문장 부호인지 조사하는 분리3단계; 및 상기 분리3단계의 조사에서, 문장 부호인 경우 문장을 분리하는 분리4단계;를 포함할 수 있다.
본 실시형태에서, 상기 비교 단계는: 양태 분석 규칙 사전 DB를 호출하는 비교1단계; 상기 분리 단계에서 분리된 문장에 양태 분석 규칙 사전 DB에 있는 형태소 품사열이 있는지 조사하는 비교2단계; 및 상기 비교2단계의 조사에서, 형태소 품사열이 있는 경우 분리된 문장과 양태 분석 규칙 사전 DB에 있는 형태소 품사열을 비교하는 비교3단계;를 포함할 수 있다.
본 실시형태에서, 상기 비교2단계의 조사에서, 형태소 품사열이 없는 경우 양태 없음을 나타내는 양태코드를 결과로서 출력하는 비교4단계;를 추가로 포함할 수 있다.
본 실시형태에서, 상기 합산 단계는: 가중치의 값이 0인 양태가 있는지 조사하는 합산1단계; 및 상기 합산1단계의 조사에서 가중치의 값이 0인 양태가 없는 경우, 양태별로 가중치를 합산하는 합산2단계;를 포함할 수 있다.
본 실시형태에서, 상기 합산1단계의 조사에서 가중치의 값이 0인 양태가 있는 경우, 해당 양태의 가중치의 값을 0으로 고정하고 합산 2단계로 이동하는 합산3단계;를 추가로 포함할 수 있다.
본 실시형태에서, 상기 합산 단계의 수행 이후, 결과 정렬부가 합산 단계에서 합산된 결과에 따라 양태코드를 정렬하는 정렬 단계;를 추가로 포함할 수 있다.
본 실시형태에서, 상기 정렬 단계는: 모든 양태를 가중치를 기반으로 정렬하는 정렬1단계; 및 사용자가 지정한 양태 출력 개수에 따라 양태를 선택하는 정렬2단계;를 포함할 수 있다.
전술된 목적을 달성하기 위하여, 본 발명의 또 다른 실시형태에 따른 저장 매체는, 전술된 양태 분석 방법을 프로그램으로 저장한다.
전술된 목적을 달성하기 위하여, 본 발명의 또 다른 실시형태에 따른 정보 제공 시스템은, 통신망을 통해 상호 연결되며, 양태 분석 대상을 분석하여 양태 분석 결과를 도출하는 양태 분석 장치; 및 상기 채팅 창에 입력된 내용을 양태 분석 대상으로서 상기 양태 분석 장치로 전달하고, 양태 분석 결과가 '희망' 또는 '선 호'일 경우 양태 분석 대상에 포함된 상품 단어를 추출하여 부가 정보 DB를 검색하여 일치하는 상품 정보, 쇼핑몰 정보 또는 지역 정보를 상기 채팅 창에 입력시키는 서비스 서버;를 포함한다.
전술된 목적을 달성하기 위하여, 본 발명의 또 다른 실시형태에 따른 정보 제공 서비스 서버는, 통신망 및 양태 분석 장치와 데이타를 송수신하는 통신부; 상기 통신부가 양태 분석 대상을 양태 분석 장치로 송신하도록 하고 양태 분석 장치로부터 양태 정보를 수신하도록 하고, 수신된 양태 분석 결과가 '희망' 또는 '선호'일 경우 양태 분석 대상에 포함된 상품 단어를 추출하여 상품 정보 DB 또는 쇼핑몰 정보 DB를 검색하여 일치하는 정보를 도출하여 채팅 서버에서 제공하는 채팅 창에 전달하는 제어부; 및 양태에 따른 부가 정보가 저장된 부가 정보 DB;를 포함할 수 있다.
본 실시형태에서, 상기 부가 정보 DB는: 상품 정보가 저장된 상품 정보 DB; 및 쇼핑몰 정보가 저장된 쇼핑몰 정보 DB;를 포함할 수 있다.
본 실시형태에서, 상기 부가 정보 DB는 지역 정보가 저장된 지역 정보 DB를 추가로 포함하고, 상기 제어부는 수신된 양태 분석 결과가 '희망' 또는 '선호'일 경우 양태 분석 대상에 포함된 지역 단어를 추출하여 지역 정보 DB를 검색하여 일치하는 정보를 도출하여 채팅 서버에서 제공하는 채팅 창에 전달할 수 있다.
전술된 목적을 달성하기 위하여, 본 발명의 또 다른 실시형태에 따른 정보 제공 방법은, 채팅 서버에서 제공하는 채팅창에 입력된 내용을 양태 분석 대상으로서 양태 분석 장치로 전달하는 양태 분석 대상 수신 단계; 상기 양태 분석 장치로부터 양태 분석 결과를 수신하는 양태 분석 결과 수신 단계; 및 양태 분석 결과가 '희망' 또는 '선호'일 경우 양태 분석 대상에 포함된 상품 또는 지역 단어를 추출하고, 상품 정보 DB, 쇼핑몰 정보 DB 또는 지역 정보 DB를 검색하여 일치하는 정보를 도출하여 채팅 서버에서 제공하는 채팅 창에 전달하는 제공 단계;를 포함한다.
본 실시형태에서, 상기 제공 단계는: 양태 분석 결과가 '희망' 또는 '선호'인지 조사하는 제공1단계; 상기 제공1단계의 조사에서 양태 분석 결과가 '희망' 또는 '선호'인 경우, 양태 분석 대상에 포함된 상품 또는 지역 단어를 추출하는 제공2단계; 상기 제공2단계에서 추출된 상품 또는 지역 단어를 상품 정보 DB, 쇼핑몰 정보 DB 또는 지역 정보 DB에서 검색하는 제공3단계; 및 상기 제공3단계의 검색 결과를 채팅 서버에서 제공하는 채팅 창에 전달하는 제공4단계;를 포함할 수 있다.
본 발명에 따르면 양태 분석 규칙 사전 DB의 내용과 문장을 비교하여, 비교 결과에 따라 문장에 포함된 양태를 분석할 수 있는 기술을 제공할 수 있다.
또한 본 발명에 따르면, 문장에 포함된 다양한 형태소품사열의 가중치들을 더하는 것에 의해 양태가 결정되므로 형태소분석 및 품사 부착의 오류에 견고한 양태 분석 기술을 제공할 수 있다.
또한 본 발명에 따르면, 양태의 분석이 독립적으로 이루어지기 때문에 각 분 석간에 오류가 전파되지 않는다.
또한 본 발명에 따르면, 관리자의 필요에 따라 형태소품사열이나 가중치의 수정이 용이하여 관리가 쉽다.
이하에서, 첨부된 도면들을 참조하여 본 발명의 실시예가 기술된다.
하기에서 본 발명을 설명함에 있어서, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략될 것이다. 또한 후술되는 용어들은 본 발명에서의 기능을 고려하여 설정된 용어들로서 이 용어들은 제품을 생산하는 생산자의 의도 또는 관례에 따라 달라질 수 있으며, 용어들의 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
(양태 분석 장치)
먼저 첨부된 도면 도1을 참조로 본 발명의 실시예에 따른 양태 분석 장치를 설명한다.
도1은 본 발명의 실시예에 따른 양태 분석 장치의 블럭도이다.
도1에 도시된 바와 같이, 본 실시예에 따른 양태 분석 장치(100)는 입력부(110), 통신부(120), 양태 분석 규칙 사전 DB(130: 이하에서 설명의 편의를 위하여, 별다른 설명이 없는 한 '양태 분석 규칙 사전 DB'는 간략히 '사전 DB'라 한다 ), 문장 분리부(140), 문자열 비교부(150), 가중치 합산부(160) 및 결과 정렬부(170)를 포함한다.
입력부(110)는 사용자로부터 양태 분석 대상을 입력받는다.
통신부(120)는 외부와 데이타를 송수신하여 양태 분석 대상을 수신한다. 즉, 본 실시예에 따른 양태 분석 장치(100)는 입력부(110)에 의해 입력되거나, 통신부(120)를 통해 수신된 양태 분석 대상에 대해 양태를 분석하게 되는 것이다. 그러나 본 발명은 이에 특별히 한정될 필요는 없으며, 별도의 저장 장치에 저장된 양태 분석 대상을 호출하여 양태를 분석할 수도 있음에 유의한다.
문장 분리부(140)는 양태 분석 대상에서 마지막 문장을 분리한다. 양태 분석 대상은 통상 1~2개의 문장으로 이루어지고, 한국어에서 양태는 주로 뒷부분에 나타나기 때문에, 문장 분리부(140)는 양태가 나타날 가능성이 높은 마지막 문장을 분리하게 되는 것이다.
사전 DB(130)는 형태소품사열, 양태코드 및 가중치를 포함하는 정보가 저장된다. 예를 들어 사전 DB(130)는 하기의 표1과 같은 형태로 구성될 수 있을 것이다.
형태소품사열 양태코드 가중치 알/VV+어/E SEN(지각) 2 이/VCP+겠/EP+지/E GUS(추측) 2 VV+고/EC 싶/VX+어/E HOP(희망) 2 XSA+지/EC 말/VX+아/E BAN(금지) 2 VV+ㄹ까/EC 보/VX+아/E WIL(의지) 2 VV+을/ETM 줄/NNB 알/VV+ㄴ다/E CAP(능력) 2 귀엽/VA+어/E LIK(선호) 2 안/MAG*/VV+아/E WIL(의지) 2 못/MAG*/VV+겠/EP+어/E CAP(능력) 2 안/MAG 졸리/VV WIL(의지) 0 VV+게/E*V WIL(의지) 0 보이/VV*V GUS(추측) 0 |
표1의 형태소품사열에서, VV는 동사, E는 어미, VCP는 긍정지정사, EP는 선어말어미, XSA는 형용사파생접미사를 의미하는 것이며, 이와 같은 품사 기호는 국립국어원에서 분류한 '세종 품사 집합'을 따른다. 그러나 본 발명은 이와 같은 분류체계에 한정될 필요는 없음에 유의한다.
문자열 비교부(150)는 문장 분리부(140)에서 분리된 마지막 문장에 대해 사전 DB(130)의 형태소품사열과 비교한다. 문자열 비교부(150)는 사전 DB(130)의 형태소품사열과 일치하는 모든 형태소를 비교하여 검출하게 된다.
가중치 합산부(160)는 문자열 비교부(150)에서 일치된 형태소품사열에 대한 가중치를 양태코드별로 합산한다. 가중치 합산부(160)에서 가중치가 합산되면, 가장 높은 가중치 합산값을 갖는 양태(들)가 도출되게 된다.
결과 정렬부(170)는 가중치 합산부(160)에서 합산된 결과에 따라 양태코드를 정렬한다. 결과 정렬부(170)는 사용자가 요청한 양태의 결과값 개수만큼 가장 높은 가중치 합산값을 갖는 양태코드부터 내림차순으로 결과를 정렬하게 된다.
(양태 분석 방법)
이하에서 첨부된 도면 도2를 참조로 본 발명의 실시예에 따른 양태 분석 방법을 설명한다.
도2는 본 발명의 실시예에 따른 양태 분석 방법의 흐름도이다.
도2에 도시된 바와 같이, 본 실시예에 따른 양태 분석 방법은 분리 단계(S100), 비교 단계(S200), 합산 단계(S300) 및 정렬 단계(S400)를 포함한다.
분리 단계(S100)는 문장 분리부가 양태 분석 대상에서 마지막 문장을 분리하는 단계이다.
이하에서 첨부된 도면 도3을 참조로 분리 단계(S100)를 상세히 설명한다.
도3은 도2에서 분리 단계의 세부 흐름도이다.
도3에 도시된 바와 같이, 분리 단계(S100)는 3개의 단계로 이루어질 수 있으며, 분리1단계, 양태 분석 대상에 존재하는 문장 부호를 검색한다(S110).
분리2단계, 분리1단계에서 검색된 문장 부호 다음에 다른 형태소가 있는지 조사한다(S120).
분리3단계, 분리2단계의 조사에서, 다른 형태소가 있는 경우 이 형태소가 문장 부호인지 조사한다(S130).
분리4단계, 분리3단계의 조사에서, 문장 부호인 경우 문장을 분리한다.
예를 들어, 양태 분석 대상이 '아 나는 정말 몰랐어! 그랬단 말야?'인 경우, 분리1단계에 의해 '!'가 검색된다.
이후, 분리2단계에 의해 '!'뒤에 존재하는 '그랬단 말야?'가 검색된다.
이후, 분리3단계에 의해 '?'이 검색된다.
이후, 분리4단계에 의해 '그랬단 말야?'가 분리된다.
물론, '그랬단 말야?' 뒤에 문장이 추가로 있을 경우에는 전술된 분리2단계 이후의 과정이 반복될 것이다.
한편, 양태 분석 대상으로 '그랬단 말야?! 나는 정말 몰랐어'가 입력될 경우, 분리1단계에 의해 '?'가 검색된다.
이후, 분리2단계에 의해 '?' 뒤에 존재하는 '!'가 검색된다.
분리2단계를 다시 수행하여 '그랬단 말야?'가 검색된다.
이후, 분리3단계에 의해 '그랬단 말야?'에 있는 '?'가 검색된다.
이후, 분리4단계에 의해 '그랬단 말야?'가 분리된다. 즉, 본 발명은 문장부호가 연속적으로 위치한 경우에도 오류(마지막 문장을 문장부호만으로 된 것으로 인식하여 분리하는 것) 없이 마지막 문장을 분리할 수 있게 된다.
비교 단계(S200)는 문자열 비교부가 분리 단계(S100)에서 분리된 마지막 문장에 대해 양태 분석 규칙 사전 DB의 형태소품사열과 비교하는 단계이다.
이하에서 첨부된 도면 도4를 참조로 비교 단계를 상세히 설명한다.
도4는 도2에서 비교 단계의 세부 흐름도이다.
도4에 도시된 바와 같이, 비교 단계(S200)는 4개의 단계로 이루어질 수 있으며, 비교1단계, 사전 DB를 호출한다(S210).
사전 DB는 형태소품사열, 양태코드 및 가중치로 구성된다. 형태소품사열은 양태 분석의 근거가 되는 형태소 열이다. 형태소품사열은 다양한 문장에 적용할 수 있도록 와일드카드 문자를 지원하는 것이 바람직하다. 양태 코드는 문장에서 형태소품사열에 대응하는 표현이 등장했을 경우에, 어떤 양태에 가중치를 부여할 것인지를 지정한다. 가중치는 해당 양태에 부여할 가중치 값이다. 또한, 사전 DB에서 공통적으로 나타날 수 있는 표현에 대해서는 중의성을 고려하여 가중치가 작게 부여된다. 더불어, 가중치는 음수 또는 0의 값을 가질 수도 있다.
비교2단계, 분리 단계(S100)에서 분리된 문장에 사전 DB에 있는 형태소 품사열이 있는지 조사한다(S220).
비교3단계, 비교2단계의 조사에서, 형태소 품사열이 있는 경우 분리된 문장과 사전 DB에 있는 형태소 품사열을 비교한다(S230).
비교4단계, 비교2단계의 조사에서, 형태소 품사열이 없는 경우 양태 없음을 나타내는 양태코드를 결과로서 출력한다(S225).
합산 단계(S300)는 가중치 합산부가 비교 단계(S200)에서 일치된 형태소품사열에 대한 가중치를 양태코드별로 합산하는 단계이다.
이하에서 첨부된 도면 도5를 참조로 합산 단계를 상세히 설명한다.
도5는 도2에서 합산 단계의 세부 흐름도이다.
도5에 도시된 바와 같이, 합산 단계(S300)는 3개의 단계로 이루어질 수 있으며, 합산1단계, 가중치의 값이 0인 양태가 있는지 조사한다.
합산2단계, 합산1단계의 조사에서 가중치의 값이 0인 양태가 없는 경우, 양태별로 가중치를 합산한다(S320).
합산3단계, 합산1단계의 조사에서 가중치의 값이 0인 양태가 있는 경우, 해당 양태의 가중치의 값을 0으로 고정하고 합산 2단계로 이동한다(S315). 가중치의 값이 0인 것을 예외처리를 위한 것이다. 예를 들어, 사전 DB에 '보이/VV GUS(추측) 2'이 있다면, '보여주고 싶어'란 표현에 대해 추측으로 잘못 분석할 수 있다. 이러한 경우를 방지하기 위하여, '보이/VV*V GUS(추측) 0'을 마련하여, '보이/VV'라는 동사 뒤에 다른 동사가 오면 이 문장은 추측으로 분석되지 않게 된다. 이러한 규칙은 안긴문장, 명사를 수식하는 구나 절 등의 예외 처리에 특히 유용하게 사용될 수 있다.
정렬 단계(S400)는 결과 정렬부가 합산 단계(S300)에서 합산된 결과에 따라 양태코드를 정렬하는 단계이다.
이하에서 첨부된 도면 도6을 참조로 정렬 단계를 상세히 설명한다.
도6은 도2에서 정렬 단계의 세부 흐름도이다.
도6에 도시된 바와 같이, 정렬 단계(S400)는 2개의 단계로 이루어질 수 있으며, 정렬1단계, 모든 양태를 가중치를 기반으로 정렬한다(S410).
정렬2단계, 사용자가 지정한 양태 출력 개수에 따라 양태를 선택한다(S420)
이에 의해 정확도가 높은 양태가 선택되어 표시될 수 있다.
한편, 이와 같은 양태 분석 방법은, 저장 매체에 의해 프로그램으로 저장될 수 있다.
(적용예)
이하에서 첨부된 도면 도7을 참조로 본 발명의 적용예를 설명한다.
도7은 본 발명에 따른 양태 분석의 적용예를 도시한 것이다.
제1단계, 입력부를 통해 양태 분석 대상(10)이 입력된다. 즉, '아~ 가수 A에 대해 알고싶어'가 양태 분석 대상으로 입력되는 것이다. 이 문장은 '아/IC + ~/SS 가수 A에/NF 대하/VV + 아/EC 알/VV + 고/EC 싶/VX + 어/EF'의 형태소로 구분되게 된다. 여기서, IC는 감탄사, SS는 따옴표, 괄호표 또는 줄표, NF는 명사추정범주, VV는 동사, EC는 연결어미, VX는 보조용언 그리고 EF는 종결어미를 의미하는 품사 기호이다. 이와 같은 품사 기호는 국립국어원에서 분류한 '세종 품사 집합'을 따른다. 그러나 본 발명은 이와 같은 분류체계에 한정될 필요는 없음에 유의한다.
제2단계, 문장 분리부가 양태 분석 대상(10)에서 문장 부호(11)를 발견한다. 즉, 문장 부호 '~'이 문장부호(SS)로서 발견된다.
제3단계, 문장 분리부가 문장 부호(11) 이후의 문장을 분리하여, 마지막 문장(20)을 추출한다. 이에 의해 '가수 A에/NF 대하/VV + 아/EC 알/VV + 고/EC 싶/VX + 어/EF'가 마지막 문장으로 추출된다.
제4단계, 문자열 비교부가 사전 DB(30)를 호출한다. 사전 DB(30)는 형태소품사열, 양태코드 및 가중치로 구성되며, 본 적용예에서 사전 DB(30)는 '알/VV+고/E SEN 2', 'VV+고/EC 싶/VX+어/E HOP 2' 및 '고/EC 싶/VX HOP 1'가 포함되어 있는 것으로 가정한다. 물론, 실제 다양한 문장에 적용하기 위해 사전 DB는 보다 많은 표현으로 구성되며, 필요에 따라 관리자에 의해 표현이 추가될 수도 있음에 유의한다.
제5단계, 문자열 비교부가 마지막 문장(20)에서 사전 DB(30)와 일치하는 표현들(21,22,23)을 검색한다. 즉, '알/VV+고/E SEN 2', 'VV+고/EC 싶/VX+어/E HOP 2' 및 '고/EC 싶/VX HOP 1'이 일치하는 표현들로 검색된다.
제6단계, 가중치 합산부가 양태 코드의 가중치를 합산한다.
본 적용예에서, 사전 DB(30)와 일치하는 표현들(21,22,23)의 가중치는 사전 DB(30)에서, '알/VV+고/E SEN 2', 'VV+고/EC 싶/VX+어/E HOP 2' 그리고 '고/EC 싶/VX HOP 1'이 등록되어 있으므로, 이를 양태코드별로 더하면, SEN(41)은 2, HOP(42)는 3이 된다. 여기서, '고/EC 싶/VX HOP 1'에는 가중치가 '1'이 할당되어 있음에 유의한다. 즉, '고/EC 싶/VX'은 'VV+고/EC 싶/VX+어/E'의 일부와 동일하기 때문에 중의성을 고려하여 가중치가 작게 할당되어 있는 것이다.
제7단계, 결과 정렬부가 가중치가 높은 순서대로 결과(50)를 정렬한다. 본 적용예에서는 희망(HOP)의 가중치가 3이고, 지각(SEN)의 가중치가 2이므로, 희망이란 양태가 지각이란 양태보다 먼저 출력된다. 한편, 사용자가 3개의 결과값을 요청한 경우, 본 적용예와 같이 2개의 양태만 존재하면 존재하는 2개의 양태만 출력하고, 4개 이상의 양태가 존재할 경우에는 높은 가중치를 갖는 3개의 양태만이 결과값으로 나타날 수 있다. 여기서, 사용자가 요청할 수 있는 결과값의 수는 특별히 한정되지 않음에 유의한다.
(정보 제공 시스템)
이하에서 첨부된 도면 도8을 참조로 본 발명의 실시예에 따른 정보 제공 시스템을 설명한다.
도8은 본 발명의 실시예에 따른 정보 제공 시스템의 블럭도이다.
도8에 도시된 바와 같이, 본 실시예에 따른 정보 제공 시스템(200)은 통신망(250)을 통해 상호 연결된 채팅 서버(210), 서비스 서버(220), 양태 분석 장치(100), 사용자 단말기(260), 쇼핑몰 서버(270) 및 지역 정보 제공 서버(280)를 포함한다.
양태 분석 장치(100)는 양태 분석 대상을 분석하여 양태 분석 결과를 도출한다.
채팅 서버(210)는 채팅 창을 통한 채팅 서비스를 제공한다.
사용자 단말기(260)는 채팅 창을 통해 채팅 서비스를 이용한다.
서비스 서버(220)는 채팅 창에 입력된 내용을 양태 분석 대상으로서 양태 분석 장치(100)로 전달하고, 양태 분석 결과를 기반으로 상품 정보, 쇼핑몰 정보 또는 지역 정보를 채팅 창에 입력시킨다. 한편, 서비스 서버(220)는 양태 분석 장치(100)를 서비스 서버(220)의 내부에 포함할 수도 있다.
쇼핑몰 서버(270)는 서비스 서버(220)가 채팅창에 입력시킬 상품 정보와 쇼핑몰 정보를 제공한다.
지역 정보 제공 서버(280)는 서비스 서버(220)가 채팅창에 입력시킬 지역 정보를 제공한다. 한편, 서비스 서버(220)는 쇼핑몰 서버(270) 또는 지역 정보 제공 서버(280)에 포함될 수도 있음에 유의한다.
이와 같은 구성을 갖는 정보 제공 시스템(200)은, 사용자가 채팅창에 입력한 내용을 기반으로, 입력된 내용의 양태가 특히 '희망' 또는 '선호'로 판단될 경우, 사용자가 희망하거나 선호하는 상품이나 지역 정보를 자동으로 제공할 수 있게 된다.
(서비스 서버)
이하에서 첨부된 도면 도9를 참조로 본 발명의 실시예에 따른 서비스 서버를 설명한다.
도9는 본 발명의 실시예에 따른 서비스 서버의 블럭도이다.
도9에 도시된 바와 같이, 본 실시예에 따른 서비스 서버(220)는 통신부(222), 제어부(224), 부가 정보 DB(225)를 포함한다.
통신부(222)는 통신망 및 양태 분석 장치와 데이타를 송수신한다.
제어부(224)는 통신부(222)가 양태 분석 대상을 양태 분석 장치로 송신하도록 하고 양태 분석 장치로부터 양태 정보를 수신하도록 한다. 또한 제어부(224)는 수신된 양태 분석 결과가 '희망' 또는 '선호'일 경우 양태 분석 대상에 포함된 상품 또는 지역 단어를 추출하여 상품 정보 DB(226), 쇼핑몰 정보 DB(228) 또는 지역 정보 DB(230)를 검색하여 일치하는 정보를 도출하여 채팅 서버에서 제공하는 채팅 창에 전달한다.
부가 정보 DB(225)는 양태에 따른 부가 정보가 저장된다. 부가 정보 DB(225)는 상품 정보 DB(226), 쇼핑몰 정보 DB(228) 및 지역 정보 DB(230)을 포함한다.
상품 정보 DB(226)는 쇼핑몰 서버로부터 수집한 상품 정보가 저장된다.
쇼핑몰 정보 DB(228)는 상품 정보를 제공한 쇼핑몰 서버의 정보가 저장된다.
지역 정보 DB(230)는 지역 정보 제공 서버로부터 수집한 지역 정보가 저장된다.
(정보 제공 방법)
이하에서 첨부된 도면 도10 및 도11을 참조로 본 발명의 실시예에 따른 정보 제공 방법을 설명한다.
도10은 본 발명의 실시예에 따른 정보 제공 방법의 흐름도이고, 도11은 도10에서 제공 단계의 세부 흐름도이다.
도시된 바와 같이, 본 실시예에 따른 정보 제공 방법은, 양태 분석 대상 수신 단계(S500), 양태분석 결과 수신 단계(S600) 및 제공 단계(S700)를 포함한다.
양태 분석 대상 수신 단계(S500)는 채팅 서버에서 제공하는 채팅창에 입력된 내용을 양태 분석 대상으로서 양태 분석 장치로 전달하는 단계이다. 기본적으로 채팅창의 대화 내용은 사생활 보호를 위해 외부에서 열람이 불가능하다. 따라서 서비스 서버는 채팅 서버와의 계약 및 사용자와의 계약을 통해 채팅창의 내용을 가져오는 것이 바람직하다.
양태 분석 결과 수신 단계(S600)는 양태 분석 장치로부터 양태 분석 결과를 수신하는 단계이다.
제공 단계(S700)는 양태 분석 결과가 '희망' 또는 '선호'일 경우 양태 분석 대상에 포함된 상품 또는 지역 단어를 추출하고, 상품 정보 DB, 쇼핑몰 정보 DB 또는 지역 정보 DB를 검색하여 일치하는 정보를 도출하여 채팅 서버에서 제공하는 채팅 창에 전달하는 단계이다.
제공 단계(S700)를 도11을 참조로 상세히 설명하면, 제공1단계, 양태 분석 결과가 '희망' 또는 '선호'인지 조사한다(S710).
제공2단계, 제공1단계의 조사에서 양태 분석 결과가 '희망' 또는 '선호'인 경우, 양태 분석 대상에 포함된 상품 또는 지역 단어를 추출한다(S720).
제공3단계, 제공2단계에서 추출된 상품 또는 지역 단어를 상품 정보 DB, 쇼핑몰 정보 DB 또는 지역 정보 DB에서 검색한다(S730).
제공4단계, 제공3단계의 검색 결과를 채팅 서버에서 제공하는 채팅 창에 전달한다(S740).
이하에서 본 정보 제공 기술의 적용예를 설명한다.
제1단계, 사용자가 채팅 서버(또는 메신저 서버)에서 제공하는 채팅창을 통해 다른 사용자 또는 채팅 로봇과 채팅하면서 문장을 입력한다.
제2단계, 서비스 서버가 입력된 문장을 양태 분석 장치로 전달한다. 본 적용예에서 입력된 문장은 '용산 전자 상가에 가서 소형 노트북을 사고 싶어'인 것으로 가정한다.
제3단계, 양태 분석 장치는 문장의 양태가 '희망'인 것으로 판단하고, 이를 서비스 서버에 전달한다.
제4단계, 서비스 서버는 입력된 문장에서 '용산 전자 상가'와 '소형 노트북'을 추출하고, 상품 정보 DB와 지역 정보 DB를 검색한다.
제5단계, 서비스 서버가 검색된 소형 노트북 정보와 용산 전자 상가에서 소형 노트북을 취급하는 업체 정보를 채팅창에 전달한다.
이상의 단계를 통해, 사용자는 별도의 포탈 서비스 업체에 접속하여 검색하지 않고도, 서비스 서버로부터 원하는 정보를 전달받게 된다.
이상으로 본 발명의 실시예를 첨부된 도면을 참조로 기술하였다.
그러나 본 발명은 전술된 실시예에만 특별히 한정되는 것은 아니며, 필요에 따라, 당업자에 의해, 첨부된 청구범위의 정신과 사상 내에서 다양한 수정 및 변경이 가능함에 유의해야 한다.
도1은 본 발명의 실시예에 따른 양태 분석 장치의 블럭도이다.
도2는 본 발명의 실시예에 따른 양태 분석 방법의 흐름도이다.
도3은 도2에서 분리 단계의 세부 흐름도이다.
도4는 도2에서 비교 단계의 세부 흐름도이다.
도5는 도2에서 합산 단계의 세부 흐름도이다.
도6은 도2에서 정렬 단계의 세부 흐름도이다.
도7은 본 발명에 따른 양태 분석의 적용예를 도시한 것이다.
도8은 본 발명의 실시예에 따른 정보 제공 시스템의 블럭도이다.
도9는 본 발명의 실시예에 따른 서비스 서버의 블럭도이다.
도10은 본 발명의 실시예에 따른 정보 제공 방법의 흐름도이다.
도11은 도10에서 제공 단계의 세부 흐름도이다.
<도면의 주요 부분에 대한 부호의 설명>
100: 양태 분석 장치 110: 입력부
120: 통신부 130: 양태 분석 규칙 사전 DB
140: 문장 분리부 150: 문자열 비교부
160: 가중치 합산부 170: 결과 정렬부
Claims (18)
- 사용자로부터 양태 분석 대상을 입력받는 입력부;상기 양태 분석 대상에서 마지막 문장을 분리하는 문장 분리부;형태소품사열, 양태코드 및 가중치를 포함하는 정보가 저장된 양태 분석 규칙 사전 DB;상기 문장 분리부에서 분리된 마지막 문장에 대해 상기 양태 분석 규칙 사전 DB의 형태소품사열과 비교하는 문자열 비교부; 및상기 문자열 비교부에서 일치된 형태소품사열에 대한 가중치를 양태코드별로 합산하는 가중치 합산부;를 포함하는 양태 분석 장치.
- 제 1 항에 있어서, 외부와 데이타를 송수신하는 통신부를 추가로 포함하고,상기 통신부를 통해 양태 분석 대상을 수신하여 양태를 분석하는 것을 특징으로 하는 양태 분석 장치.
- 제 1 항에 있어서,상기 가중치 합산부에서 합산된 결과에 따라 양태코드를 정렬하는 결과 정렬 부;를 추가로 포함하는 것을 특징으로 하는 양태 분석 장치.
- 문장 분리부가 양태 분석 대상에서 마지막 문장을 분리하는 분리 단계;문자열 비교부가 상기 분리 단계에서 분리된 마지막 문장에 대해 양태 분석 규칙 사전 DB의 형태소품사열과 비교하는 비교 단계; 및가중치 합산부가 상기 비교 단계에서 일치된 형태소품사열에 대한 가중치를 양태코드별로 합산하는 합산 단계;를 포함하는 양태 분석 방법.
- 제 4 항에 있어서, 상기 분리 단계는:상기 양태 분석 대상에 존재하는 문장 부호를 검색하는 분리1단계;상기 분리1단계에서 검색된 문장 부호 다음에 다른 형태소가 있는지 조사하는 분리2단계;상기 분리2단계의 조사에서, 다른 형태소가 있는 경우 이 형태소가 문장 부호인지 조사하는 분리3단계; 및상기 분리3단계의 조사에서, 문장 부호인 경우 문장을 분리하는 분리4단계;를 포함하는 것을 특징으로 하는 양태 분석 방법.
- 제 4 항에 있어서, 상기 비교 단계는:양태 분석 규칙 사전 DB를 호출하는 비교1단계;상기 분리 단계에서 분리된 문장에 양태 분석 규칙 사전 DB에 있는 형태소 품사열이 있는지 조사하는 비교2단계; 및상기 비교2단계의 조사에서, 형태소 품사열이 있는 경우 분리된 문장과 양태 분석 규칙 사전 DB에 있는 형태소 품사열을 비교하는 비교3단계;를 포함하는 것을 특징으로 하는 양태 분석 방법.
- 제 6 항에 있어서,상기 비교2단계의 조사에서, 형태소 품사열이 없는 경우 양태 없음을 나타내는 양태코드를 결과로서 출력하는 비교4단계;를 추가로 포함하는 것을 특징으로 하는 양태 분석 방법.
- 제 4 항에 있어서, 상기 합산 단계는:가중치의 값이 0인 양태가 있는지 조사하는 합산1단계; 및상기 합산1단계의 조사에서 가중치의 값이 0인 양태가 없는 경우, 양태별로 가중치를 합산하는 합산2단계;를 포함하는 것을 특징으로 하는 양태 분석 방법.
- 제 8 항에 있어서,상기 합산1단계의 조사에서 가중치의 값이 0인 양태가 있는 경우, 해당 양태의 가중치의 값을 0으로 고정하고 합산 2단계로 이동하는 합산3단계;를 추가로 포함하는 것을 특징으로 하는 양태 분석 방법.
- 제 4 항에 있어서,상기 합산 단계의 수행 이후, 결과 정렬부가 합산 단계에서 합산된 결과에 따라 양태코드를 정렬하는 정렬 단계;를 추가로 포함하는 것을 특징으로 하는 양태 분석 방법.
- 제 10 항에 있어서, 상기 정렬 단계는:모든 양태를 가중치를 기반으로 정렬하는 정렬1단계; 및사용자가 지정한 양태 출력 개수에 따라 양태를 선택하는 정렬2단계;를 포함하는 것을 특징으로 하는 양태 분석 방법.
- 제 4 항 내지 제 11 항 중 어느 한 항에 따른 양태 분석 방법을 프로그램으로 저장한 저장 매체.
- 통신망을 통해 상호 연결되며,양태 분석 대상을 분석하여 양태 분석 결과를 도출하는 양태 분석 장치;채팅 창을 통한 채팅 서비스를 제공하는 채팅 서버; 및상기 채팅 창에 입력된 내용을 양태 분석 대상으로서 상기 양태 분석 장치로 전달하고, 양태 분석 결과가 '희망' 또는 '선호'일 경우 양태 분석 대상에 포함된 상품 단어를 추출하여 부가 정보 DB를 검색하여 일치하는 상품 정보, 쇼핑몰 정보 또는 지역 정보를 상기 채팅 창에 입력시키는 서비스 서버;를 포함하는 정보 제공 시스템.
- 통신망 및 양태 분석 장치와 데이타를 송수신하는 통신부;상기 통신부가 양태 분석 대상을 양태 분석 장치로 송신하도록 하고 양태 분석 장치로부터 양태 정보를 수신하도록 하고, 수신된 양태 분석 결과가 '희망' 또는 '선호'일 경우 양태 분석 대상에 포함된 상품 단어를 추출하여 상품 정보 DB 또는 쇼핑몰 정보 DB를 검색하여 일치하는 정보를 도출하여 채팅 서버에서 제공하는 채팅 창에 전달하는 제어부; 및양태에 따른 부가 정보가 저장된 부가 정보 DB;를 포함하는 정보 제공 서비스 서버.
- 제 14 항에 있어서, 상기 부가 정보 DB는:상품 정보가 저장된 상품 정보 DB; 및쇼핑몰 정보가 저장된 쇼핑몰 정보 DB;를 포함하는 것을 특징으로 하는 정보 제공 서비스 서버.
- 제 14 항에 있어서,상기 부가 정보 DB는 지역 정보가 저장된 지역 정보 DB를 추가로 포함하고,상기 제어부는 수신된 양태 분석 결과가 '희망' 또는 '선호'일 경우 양태 분석 대상에 포함된 지역 단어를 추출하여 지역 정보 DB를 검색하여 일치하는 정보를 도출하여 채팅 서버에서 제공하는 채팅 창에 전달하는 것을 특징으로 하는 정보 제공 서비스 서버.
- 채팅 서버에서 제공하는 채팅창에 입력된 내용을 양태 분석 대상으로서 양태 분석 장치로 전달하는 양태 분석 대상 수신 단계;상기 양태 분석 장치로부터 양태 분석 결과를 수신하는 양태 분석 결과 수신 단계; 및양태 분석 결과가 '희망' 또는 '선호'일 경우 양태 분석 대상에 포함된 상품 또는 지역 단어를 추출하고, 상품 정보 DB, 쇼핑몰 정보 DB 또는 지역 정보 DB를 검색하여 일치하는 정보를 도출하여 채팅 서버에서 제공하는 채팅 창에 전달하는 제공 단계;를 포함하는 정보 제공 방법.
- 제 17 항에 있어서, 상기 제공 단계는:양태 분석 결과가 '희망' 또는 '선호'인지 조사하는 제공1단계;상기 제공1단계의 조사에서 양태 분석 결과가 '희망' 또는 '선호'인 경우, 양태 분석 대상에 포함된 상품 또는 지역 단어를 추출하는 제공2단계;상기 제공2단계에서 추출된 상품 또는 지역 단어를 상품 정보 DB, 쇼핑몰 정보 DB 또는 지역 정보 DB에서 검색하는 제공3단계; 및상기 제공3단계의 검색 결과를 채팅 서버에서 제공하는 채팅 창에 전달하는 제공4단계;를 포함하는 것을 특징으로 하는 정보 제공 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20080079372A KR101164292B1 (ko) | 2008-08-13 | 2008-08-13 | 양태 분석 장치, 양태 분석 방법, 저장 매체, 정보 제공 시스템, 정보 제공 서비스 서버 및 정보 제공 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20080079372A KR101164292B1 (ko) | 2008-08-13 | 2008-08-13 | 양태 분석 장치, 양태 분석 방법, 저장 매체, 정보 제공 시스템, 정보 제공 서비스 서버 및 정보 제공 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100020678A true KR20100020678A (ko) | 2010-02-23 |
KR101164292B1 KR101164292B1 (ko) | 2012-07-09 |
Family
ID=42090637
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR20080079372A KR101164292B1 (ko) | 2008-08-13 | 2008-08-13 | 양태 분석 장치, 양태 분석 방법, 저장 매체, 정보 제공 시스템, 정보 제공 서비스 서버 및 정보 제공 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101164292B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220090675A (ko) * | 2020-12-22 | 2022-06-30 | 경북대학교 산학협력단 | 사용자의 선호도를 분석하는 대화 매칭 장치 및 방법 |
-
2008
- 2008-08-13 KR KR20080079372A patent/KR101164292B1/ko active IP Right Grant
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220090675A (ko) * | 2020-12-22 | 2022-06-30 | 경북대학교 산학협력단 | 사용자의 선호도를 분석하는 대화 매칭 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR101164292B1 (ko) | 2012-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9373075B2 (en) | Applying a genetic algorithm to compositional semantics sentiment analysis to improve performance and accelerate domain adaptation | |
US12131827B2 (en) | Knowledge graph-based question answering method, computer device, and medium | |
US7742922B2 (en) | Speech interface for search engines | |
US20100332217A1 (en) | Method for text improvement via linguistic abstractions | |
US20140351228A1 (en) | Dialog system, redundant message removal method and redundant message removal program | |
KR101983975B1 (ko) | 문장 분류에 기반하는 문서 자동분류 방법 및 그 장치 | |
MXPA04001729A (es) | Metodos y sistemas para traduccion de idiomas. | |
WO2006083939A2 (en) | Prioritization of search responses system and method | |
CN110096599B (zh) | 知识图谱的生成方法及装置 | |
JP4967037B2 (ja) | 情報検索装置、情報検索方法、端末装置、およびプログラム | |
JP2002230011A (ja) | 感情認識システム | |
US20220365956A1 (en) | Method and apparatus for generating patent summary information, and electronic device and medium | |
KR20240003389A (ko) | 챗봇 시스템의 키워드 기반 랭킹 알고리즘을 이용한 의도 분류 방법 | |
US20140358969A1 (en) | Method for searching in a database | |
CN113157887B (zh) | 知识问答意图识别方法、装置、及计算机设备 | |
KR20200136636A (ko) | 형태소 기반 ai 챗봇 및 그의 문장의도 결정 방법 | |
US20050086214A1 (en) | Computer system and method for multilingual associative searching | |
CN113157888A (zh) | 支持多知识来源的询问答复方法、装置和电子设备 | |
JPWO2019167281A1 (ja) | 応答処理プログラム、応答処理方法、応答処理装置および応答処理システム | |
KR101164292B1 (ko) | 양태 분석 장치, 양태 분석 방법, 저장 매체, 정보 제공 시스템, 정보 제공 서비스 서버 및 정보 제공 방법 | |
JP4499179B1 (ja) | 端末装置 | |
JPH0962684A (ja) | 情報検索方法及び情報検索装置と、情報案内方法及び情報案内装置 | |
JP2017059014A (ja) | 解析装置およびデータ検索装置,ならびにこれらの制御方法 | |
JP3123836B2 (ja) | テキスト型データベース装置 | |
JP2017220179A (ja) | コンテンツ処理装置、コンテンツ処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
N231 | Notification of change of applicant | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20150630 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20160701 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20170703 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20180703 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20190702 Year of fee payment: 8 |