KR101286296B1 - 워드그래프 관리 방법 및 시스템 - Google Patents

워드그래프 관리 방법 및 시스템 Download PDF

Info

Publication number
KR101286296B1
KR101286296B1 KR1020120136905A KR20120136905A KR101286296B1 KR 101286296 B1 KR101286296 B1 KR 101286296B1 KR 1020120136905 A KR1020120136905 A KR 1020120136905A KR 20120136905 A KR20120136905 A KR 20120136905A KR 101286296 B1 KR101286296 B1 KR 101286296B1
Authority
KR
South Korea
Prior art keywords
word
word graph
level test
distance
wordgraph
Prior art date
Application number
KR1020120136905A
Other languages
English (en)
Inventor
김건오
Original Assignee
김건오
트윈워드 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김건오, 트윈워드 주식회사 filed Critical 김건오
Priority to KR1020120136905A priority Critical patent/KR101286296B1/ko
Application granted granted Critical
Publication of KR101286296B1 publication Critical patent/KR101286296B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 워드그래프(wordgraph) 관리 방법 및 시스템에 관한 것으로서, 본 발명의 워드그래프 관리 방법은, 관리 서버에 미리 저장된 워드그래프에 기초하여, 클라이언트 디바이스상에서 레벨테스트를 실행하는 단계; 상기 관리 서버가 상기 클라이언트 디바이스로부터 상기 레벨테스트에 의한 결과를 수신하는 단계; 상기 수신한 레벨테스트의 결과를 분석하여, 각 단어 쌍(pair)별로 정답률 또는 오답률을 추출하는 단계; 상기 추출한 정답률 또는 오답률에 따라 상기 단어 쌍의 의미 거리를 연산하는 단계; 및 상기 연산된 의미 거리를 이용하여 상기 미리 저장된 워드그래프를 갱신하거나 새로운 워드그래프를 생성하는 단계를 포함할 수 있다.

Description

워드그래프 관리 방법 및 시스템{METHOD AND SYSTEM FOR MANAGING A WORDGRAPH}
본 발명은 워드그래프(Wordgraph)를 관리하는 방법 및 시스템으로서, 더 상세하게는, 클라이언트 디바이스들에서 수행되는 연상어 레벨 테스트 결과를 분석하여 기존의 워드그래프를 유지 보수하거나 갱신하는 방법 및 시스템에 관한 것이다.
워드그래프란, 단어 간의 의미 관계를 네트워크 형태로 기록한 것으로서, 상대적으로 유사한 의미의 단어일수록 가까운 거리로 기록되고, 비유사한 의미를 가진 단어일수록 먼 거리에 기록되어 저장된 자료이며, 워드맵(wordmap)이라고도 한다. 가장 대표적으로 알려진 워드그래프는 프린스턴 대학의 인지 과학 연구소에서 만들어진 워드넷(Wordnet)과 인공지능 프로젝트 Cyc에 의한 OpenCyc 등이 있다. 유의어 사전인 시소러스(Thesaurus)도 일종의 워드그래프라고 할 수 있으며, 이와 같이 워드그래프는 단어와 단어 사이의 의미 관계 및 거리를 컴퓨터가 처리할 수 있는 형태로 저장함으로써 컴퓨터가 인공지능 관련 알고리즘 처리 시 유익한 지식 베이스의 역할을 수행하도록 해준다.
예를 들어, 대화 시스템에서 "음료수는 무엇으로 하시겠습니까?"라는 질문에 대하여 응답할 때, 음료수에 대하여 콜라, 사이다, 주스 등의 정보가 저장된 워드그래프를 활용하여 응답을 출력할 수 있는 것처럼, 워드그래프는 지식베이스의 일종으로 그 역할의 중요성이 더욱 증대되고 있는 실정이다.
그러나 워드그래프는 구축이 힘들뿐만 아니라, 시간이 지남에 따라 변하는 언어적 특성으로 인해 유지 보수와 갱신에도 초기 구축만큼 방대한 시간과 노력이 필요하다는 문제점이 있다. 본 발명은 이러한 문제점을 해결하기 위한 목적으로, 워드그래프를 자동으로 유지보수할 수 있는 시스템을 제공할 수 있다. 특히, 본 발명의 시스템을 통해 일반 사용자들과의 상호작용을 통해 사용자들의 연상어 개념을 반영한 워드그래프의 구축과 갱신이 가능하도록 한다.
또한 언어는 지역별로 시간에 따라 상이하게 변하는 특성이 있기 때문에 지역별 특성을 반영한 워드그래프의 구축 및 갱신이 필요함에도, 이러한 요구가 충족되지 못하고 있다. 따라서, 본 발명에 따른 워드그래프 관리 방법 및 시스템을 통해 지역별 워드그래프의 생성과 갱신을 용이하도록 하는 것을 목적으로 한다.
상술한 문제점들을 해결하기 위하여, 본 발명의 일 측면은, 워드그래프(wordgraph) 관리 방법을 제공하고, 상기 관리 방법은, 관리 서버에 미리 저장된 워드그래프에 기초하여, 클라이언트 디바이스상에서 레벨테스트를 실행하는 단계; 상기 관리 서버가 상기 클라이언트 디바이스로부터 상기 레벨테스트에 의한 결과를 수신하는 단계; 상기 수신한 레벨테스트의 결과를 분석하여, 각 단어 쌍(pair)별로 정답률 또는 오답률을 추출하는 단계; 상기 추출한 정답률 또는 오답률에 따라 상기 단어 쌍의 의미 거리를 연산하는 단계; 및 상기 연산된 의미 거리를 이용하여 상기 미리 저장된 워드그래프를 갱신하거나 새로운 워드그래프를 생성하는 단계를 포함할 수 있다.
또한 본 발명의 다른 측면은, 워드그래프(wordgraph) 관리 시스템을 제공할 수 있고, 상기 시스템은 워드그래프 데이터베이스; 상기 워드그래프 데이터베이스에 저장된 워드그래프에 기초하여 레벨테스트를 출제하는 레벨테스트 출제부; 상기 레벨테스트를 클라이언트 디바이스에 제공하고, 상기 클라이언트 디바이스에서 실행한 상기 레벨테스트의 결과를 수신하는 데이터 입출력부; 상기 수신한 레벨테스트 결과를 분석하여, 각 단어 쌍(pair)별로 정답률 또는 오답률을 분석하는 오답률 분석부; 상기 추출한 정답률 또는 오답률에 따라 상기 단어 쌍의 의미 거리를 연산하는 의미 거리 연산부; 및 상기 연산된 의미 거리를 이용하여 상기 저장된 워드그래프를 갱신하거나 새로운 워드그래프를 생성하는 워드그래프 갱신부를 포함할 수 있다.
본 발명의 워드 그래프 관리 방법 및 시스템에 의하면, 레벨테스트와 같이 일반 사용자와의 상호작용을 통한 정보를 수집, 분석함으로써, 워드 그래프를 자동으로 구축, 갱신할 수 있으므로, 관리자의 노력을 경감시킬 수 있고, 구축된 워드그래프는 검색 엔진, 광고 플랫폼, 질의응답 시스템 등 사람의 언어와 연관된 다양한 시스템 및 어플리케이션에 활용될 수 있다.
또한 본 발명은 여러 지역의 사용자들과의 상호작용을 통해 정보를 수집, 분석할 수 있으므로, 시간이 지남에 따라 지속적으로 변하는 언어의 특성을 워드그래프에 반영할 수 있고, 지역 및 시간의 변화에 따라 다양한 워드그래프 생성이 가능하므로, 저비용으로 워드그래프의 구축 및 갱신이 달성될 수 있다.
이러한 워드그래프를 활용함으로써 레벨테스트의 문제 생성 또한 용이하며, 정확한 사용자별 어휘 수준의 측정이 가능하게 된다.
도 1은 본 발명의 일 실시예에 따른 워드그래프 관리 시스템을 도시한 것이다.
도 2는 본 발명의 일 실시예에 따른 워드그래프 관리 서버의 구성요소를 도시한 블록도이다.
도 3은 본 발명의 제1 실시예에 따른 워드그래프 관리 방법을 도시한 것이다.
도 4는 본 발명의 제2 실시예에 따른 워드그래프 관리 방법을 도시한 것이다.
도 5는 본 발명의 일 실시예에 따른 연상어 레벨테스트의 디스플레이를 도시한 것이다.
도 6은 본 발명의 일 실시예에 따른 연상어 레벨테스트의 통계추출을 위한 화면을 도시한 것이다.
도 7은 본 발명의 일 실시예에 따른 워드그래프의 일부를 도시한 것이다.
이하 다수의 도면에서 동일한 참조번호는 동일한 구성요소를 가리킨다.
이하, 본 발명의 실시 예를 첨부된 도면을 참조하여 상세하게 설명한다. 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명의 실시 예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 실시 예에 대한 이해를 방해한다고 판단되는 경우에는 그 상세한 설명은 생략한다. 본 명세서에서, 어떤 부분이 어떤 구성요소를 포함한다고 언급되는 경우에, 이는 그 외의 다른 구성요소를 더 포함할 수도 있다는 것을 의미한다.
도 1은 본 발명의 일 실시예에 따른 워드그래프 관리 시스템을 도시한 것이다. 도 1을 참조하면, 워드그래프의 관리를 위한 관리 서버(200)는 다수의 클라이언트 디바이스(110 내지 140)와 통신망을 통해 연결되고, 일부 경우에 광고 서버(310, 320)와도 연결될 수 있다.
클라이언트 디바이스(110 내지 140)는 통신망을 통해 관리 서버(200)에 접속하여 워드그래프에 따른 연상어 레벨테스트 프로그램을 실행가능한 디바이스로서, 개인용 컴퓨터(PC), PDA(Personal Digital Assistance, 개인 휴대 단말기), 태블릿 컴퓨터(Tablet Computer), 넷북(Netbook), 스마트폰(smart phone)등의 컴퓨팅 디바이스일 수 있다. 이러한 클라이언트 디바이스(110 내지 140)는 3G, LTE(Long Term Evolution), Wi-Fi(Wireless Fidelity) 등과 같은 다양한 데이터 통신을 통해 관리 서버(200)에 접속하여 관리 서버(200)가 제공하는 레벨테스트를 실행할 수 있다. 일례로 클라이언트 디바이스(110 내지 140)는 관리 서버(200)에 접속한 상태에서 실시간으로 레벨테스트를 진행하여 결과 정보를 송수신할 수도 있고, 클라이언트 디바이스(110 내지 140)에 저장된 프로그램(예컨대, 스마트폰의 어플리케이션)을 이용하여 레벨테스트를 수행한 후, 소정의 시간 후에. 소정의 테스트 완료 후에, 또는 사용자의 선택에 의해 결과 정보를 송수신하도록 구현할 수도 있다. 이처럼, 본 발명은 클라이언트 디바이스(110 내지 140)의 사용자(즉, 일반 대중)들에게 레벨테스트와 같은 상호작용 가능한 정보를 제공하고, 그에 따른 피드백으로 돌아오는 결과 정보들을 수집, 분석함으로써, 사용자들의 인식(즉, 연상어에 대한 언어적 지식)을 반영한 워드그래프의 구축이 가능해진다.
관리 서버(200)는 클라이언트 디바이스(110 내지 140)로부터 레벨테스트 결과를 수신하여 분석하고, 클라이언트 디바이스(110 내지 140)에는 분석에 따른 결과(즉, 결과 레벨, 문제 풀이 등)을 전송해주는 한편, 분석 내용을 통해 연상어들 간의 의미 거리를 연산할 수 있다. 관리 서버(200)는 클라이언트 디바이스(110 내지 140)로부터 수신한 결과 정보를 분석하여 통계를 추출하고, 추출한 통계를 이용하여 기존의 워드그래프를 갱신할 수 있다. 즉, 관리 서버(200)가 클라이언트 디바이스들로부터 수집한 피드백 정보(즉, 레벨테스트에 대한 결과 정보)를 이용하여 워드그래프를 갱신하기 때문에, 레벨테스트 결과와 연상어 간의 관계를 이용하여 워드그래프 갱신의 자동화가 실현될 수 있다.
일 실시예로서, 관리 서버(200)는 광고 서버들(310, 320)과 연동할 수 있다. 관리 서버(200)는 레벨테스트의 결과 정보를 분석하여 획득한 통계에 기초하여 워드그래프를 갱신하고, 이러한 워드그래프 정보를 광고 서버에 일부 또는 전부를 제공함으로써, 연상어에 기반한 광고가 가능하다. 특히, 워드그래프를 지역별 특성에 따라 맞춤형으로 생성함으로써, 지역별로 연상어 기반의 광고를 제공할 수 있다. 예를 들어, 한국에서는 '치킨'과 '맥주'가 연상어 관계에 있을 수 있고, 특정 블로그나 웹페이지에 '치킨'이라는 단어가 들어가면, '맥주'광고를 삽입하도록 구현할 수 있다. 이처럼 관리 서버(200)와 적어도 하나의 광고 서버(310, 320) 간의 연동을 통해, 맞춤형 광고를 제공할 수 있다. 기존의 워드래프는 이러한 지역성까지 고려할 수 없었고, 일반적인(공통적인) 연상 관계만을 기반으로 워드그래프를 구축해왔다. 하지만, 본 발명은 연상어들에 대한 지역적 의미까지 고려하여 구축할 수 있으므로, 워드그래프의 활용도를 더욱 높일 수 있다.
도 2는 본 발명의 일 실시예에 따른 워드그래프 관리 서버(200)의 구성요소를 도시한 것이다. 본 발명의 워드그래프 관리 서버(200)는 레벨테스트를 분석하고 이를 이용하여 워드그래프를 유지보수하기 위한 서버 기능의 컴퓨터로서, 다른 디바이스들과 데이터를 송수신하는 데이터 입출력부(210), 수신한 데이터를 분석하고, 다른 구성요소들을 제어하는 제어부(220), 생성된 워드그래프를 저장하는 워드그래프 데이터베이스(230), 및 지역별로 생성된 적어도 하나의 워드그래프를 저장하는 지역별 워드그래프 데이터베이스(240)를 포함한다. 그 외 본 발명의 기능을 수행하기 위한 다른 구성요소들을 포함할 수 있으며, 그에 대한 설명은 본 명세서에서 생략한다.
데이터 입출력부(210)는 관리 서버(200)가 다른 디바이스들과 연동하기 위하여, 데이터를 수신하여 입력을 받거나, 데이터를 출력하여 다른 디바이스에 송신하는 기능을 한다. 일례로, 클라이언트 디바이스(110)이 레벨테스트 수행 요청을 하면, 요청 데이터를 입력받은 후, 제어부(220)에 요청을 전달하고, 클라이언트 디바이스(110)에 레벨테스트를 실시하기 위한 데이터를 출력할 수 있다. 즉, 레벨테스트는 사용자에게 재미와 정보제공의 목적으로 제공됨과 동시에, 워드그래프에 필요한 정보를 수집하기 위해 제공된다. 이러한 레벨테스트를 클라이언트 디바이스에 제공하고, 그에 상응하는 사용자가 선택 입력한 결과 정보를 수신함으로써 자동적인 정보의 수집을 가능하게 한다.
제어부(220)는 일종의 프로세서로서, 데이터 입출력부(210)로부터 수신한 정보들을 분석, 가공하여, 워드그래프 데이터베이스(230)에 저장된 기존의 워드그래프를 유지, 보수, 또는 갱신하거나, 새로운 워드그래프를 생성하는 기능을 한다. 제어부(220)는 본 발명의 기능을 구현하기 위한 레벨테스트 출제부(222), 오답률 분석부(224), 의미 거리 연산부(226), 및 워드그래프 갱신부(228)를 포함할 수 있다.
레벨테스트 출제부(222)는 워드그래프 데이터베이스(230)에 저장된 워드그래프를 이용하여 각 레벨별로 레벨테스트 문제(즉, 퀴즈)를 출제할 수 있다. 이는 클라이언트 디바이스(110 내지 140)로부터 요청을 받을 때 실시간으로 문제를 생성, 출제될 수 있고, 미리 저장된 문제(예컨대, 특정 주기마다 갱신하여 미리 저장한 문제들) 출력하는 방식을 가질 수 있다. 또는 워드그래프 데이터베이스(230)가 갱신될 때 레벨테스트 문제도 함께 갱신하도록 구현할 수도 있다.
레벨테스트 출제부(222)가 출제하는 문제의 레벨은, 연상어들 간의 의미 거리에 기초하여 레벨을 지정한 것으로서, 의미거리가 짧을수록 오답률이 높고, 의미거리가 길수록 오답률이 낮다는 인지심리학의 원리를 이용한다. 예를 들어, 문제에서 {tail, animal, lion}을 제시하고, dog와 sheep 중 정답을 선택입력하라고 하면 사람들이 혼란스러워하는 반면, dog와 computer 중 정답을 선택입력하라고 하면 쉽게 dog을 선택하는 원리와 같다. 이는 dog와 sheep의 의미 거리가 짧고, dog와 computer는 의미 거리가 멀기 때문에 발생하는 인지심리학적인 반응이다. 이러한 원리를 이용하여 높은 레벨일수록 의미 거리가 짧은 단어들을 선택문항으로 제시하도록 출제할 수 있다.
여기서, '의미 거리'는 단어들간의 의미의 유사성에 기초하여 이를 물리적인 거리로 나타낸 것으로서, 도 7에 도시한 것처럼, 단어들을 가깝거나 멀리 배치하여 워드그래프(즉, 워드맵)를 구성하며, 단어들은 여러 단어들과 의미의 유사성을 가질 수 있다. 이러한 의미 거리에 기초한 레벨테스트를 출제하면, 데이터 입출력부(210)에서 레벨테스트를 요청한 클라이언트 디바이스에 레벨테스트 문제를 송신한다. 클라이언트 디바이스(110 내지 140)에서 문제에 대한 정답을 입력하면, 예컨대, 한 문제마다, 또는 레벨테스트가 완료된 후에 레벨테스트에 대한 응답이 관리 서버(200)에 송신되고, 데이터 입출력부(210)를 통해 입력된다.
제어부(220)는 데이터 입출력부(210)로부터 레벨테스트 결과를 수신하여, 오답률 분석부(224)에 전달할 수 있다. 오답률 분석부(224)는 레벨테스트 결과를 분석하여, 각 단어 쌍(pair)에 대한 오답률 또는 정답률을 추출할 수 있고, 추가적으로, 추출된 오답률을 통계 자료로 생성할 수 있다. 여기서, 통계 자료는 어느 정도의 결과가 수집된 이후에 이루어질 수 있고, 오답률이 높을수록 연상어(또는 유사어, 관련어, 유의어) 관계에 있는 것으로 통계적인 추출을 한다. 예를 들어, 특정 단어쌍에 대하여 10회 이상의 결과가 수집된 후에 통계 자료를 설정하도록 생성한 경우, 동일하거나 상이한 클라이언트 디바이스들로부터 그 단어쌍에 대한 문제 결과를 10회 수신한 경우, 오답률 또는 정답률에 대한 통계 자료를 새로작성하거나 갱신할 수 있다. 이는 적정 수준의 횟수 이상이 되었을 때, 유의미한 오답률 통계가 생성되기 때문이다. 한편, 오답률 분석부(224)는 오답률 또는 정답률을 분석하여, 클라이언트 디바이스(100 내지 140)에게 결과 레벨을 통보해줄 수 있으며, 추가적으로 문제 풀이 등의 정보를 전달할 수 있다.
의미 거리 연산부(226)는 오답률 분석부(224)로부터 오답률 또는 정답률에 대한 통계 자료를 받아 각 단어쌍에 대한 의미 거리를 연산한다. 상술한 것처럼, 각 단어 쌍들에 대해서, 오답률이 높을수록 연상어 관계도가 높다는 통계적 결과를 기반으로, 오답률이 높을수록 의미 거리는 짧아지도록 미리 결정된 규칙에 의해 연산된다. 예를 들어, 의미 거리 연산 시, 오답률(예컨대, 백분율)이 낮을수록 큰 수의 가중치를 적용하여 의미 거리를 나타내는 값이 더 커지도록 연산할 수 있다. 이러한 의미 거리는 지역, 연령 등에 따라 서로 상이하게 나타날 수 있으므로, 이러한 특징을 반영하여, 카테고리별로 연산된 의미 거리들을 별도로 생성, 저장할 수 있다.
연산된 의미 거리는 기존의 워드그래프에 반영하기 위해, 워드그래프 갱신부(228)에 전달되고, 워드그래프 갱신부(228)는 워드그래프 데이터베이스(230) 및/또는 지역별 워드그래프 데이터베이스(240)에 저장된 워드그래프들을 갱신할 수 있다. 즉, 기존의 워드그래프에 대해 새로 생성된 의미 거리는 병합하고, 새로 연산된 의미 거리들을 반영하여 워드그래프를 그대로 유지하거나 수정, 변경할 수 있다. 워드그래프는 통합된 형태로 워드그래프 데이터베이스(230)에 저장될 수 있고, 또는 지역별로 다르게 생성된 워드그래프들을 저장하는 지역별 워드그래프 데이터베이스(240)를 추가로 구비할 수 있다.
이처럼, 레벨테스트의 오답률(또는 정답률) 분석을 통해 워드그래프의 유지 보수를 자동화함으로써, 방대한 양의 워드그래프를 용이하게 갱신할 수 있으며, 예컨대, 지역과 같은 카테고리별로 다양한 워드그래프를 생성하여 워드그래프의 활용도를 높일 수 있다.
도 3은 본 발명의 제1 실시예에 따른 워드그래프 관리 방법을 도시한 것이다. 도 1 및 2에서 살펴본 바와 같이, 본 발명에 따른 워드그래프 관리 방법은 적어도 하나의 클라이언트 디바이스(110 내지 140)와 관리 서버(200)가 연동하여 구현될 수 있다. 편의를 위해 도 1 및 도 2의 구성요소들을 참조하여 설명한다.
관리 서버(200)의 워드그래프 데이터베이스(230) 또는 지역별 워드그래프 데이터베이스(240)에는 레벨테스트에 필요한 워드그래프가 미리 저장되어 있다(S313). 클라이언트 서버로부터 레벨테스트 실행을 위한 요청을 수신하면(S320), 기존에 저장된 워드그래프를 이용하여 레벨테스트를 출제하게 된다. 예를 들어, 관리 서버(200)는 출제된 레벨테스트 문제와 함께, 클라이언트 디바이스상에서 실행되도록 하기 위한 실행 명령(예컨대, 프로그래밍 언어로 구성된 실행 명령)을 출력하여 클라이언트 디바이스(110 내지 140)상에서 출제된 레벨테스트가 실행되도록 한다(S330).
클라이언트 디바이스(110 내지 140)는 관리 서버(200)로부터 수신한 레벨테스트를 실행한다. 예를 들어, 클라이언트 디바이스가 스마트폰인 경우 스마트폰상에서 어플리케이션 형태로 실행될 수 있고, 클라이언트 디바이스가 개인용 컴퓨터(PC)인 경우 관리 서버(200)가 운영하는 웹사이트에 접속하여 레벨테스트를 실행할 수도 있다. 레벨테스트가 디스플레이 화면에 출력되면, 사용자는 클라이언트 디바이스의 입력장치를 통해 정답을 입력할 수 있고, 입력(선택)된 정답이 레벨테스트에 대한 결과 정보가 된다. 이러한 레벨테스트 방식에 대해서는 도 5를 참조하여 더 상세히 설명하도록 한다.
일 실시예로서 레벨테스트가 종료되면, 클라이언트 디바이스는 입력된 정답 즉, 레벨테스트에 대한 결과를 관리 서버(200)에 전송한다(S340). 관리 서버(200)는 데이터 입출력부(210)를 통해 레벨 테스트에 대한 결과를 수신하면, 입력된 데이터들을 제어부(220)에 전달한다(S350). 이처럼, 레벨테스트의 결과 정보를 이용함에 따라, 워드그래프 갱신에 필요한 정보의 수집이 용이할 뿐만 아니라, 워드그래프의 자동 유지보수가 실현될 수 있다.
관리 서버(200)의 제어부(220)는 레벨 테스트의 결과에 대해 정답률 또는 오답률을 분석하고, 각 단어쌍별로 정답률 또는 오답률의 통계치를 산출할 수 있다(S360). 이 때, 유의미한 통계치를 도출하기 위하여, 정답률 또는 오답률의 분석은 특정 단어쌍에 대한 레벨테스트의 결과(즉, 클라이언트 디바이스의 입력 정보)가 일정 수 이상 수집된 경우에 행해질 수 있다. 예컨대, 10회이상의 결과 수신시 통계치를 산출한다고 할 때, pencil과 ballpoint pen 단어쌍에 대하여 10회의 결과가 수신되면 그 단어쌍에 대해 분석을 실시하여 정답률 또는 오답률에 대한 통계치를 새로 연산할 수 있다. 이러한 연산은 기 저장된 워드그래프에 대해 변경된 정보를 자동으로 반영하기 위함이며, 이러한 규칙에 따라 워드그래프의 유지 보수를 용이하게 할 수 있다.
한편, 통계치를 산출하기 위한 정답률 또는 오답률의 분석 이외에, 관리 서버(200)는 레벨테스트의 결과를 분석하여 클라이언트 디바이스(100 내지 140)에게 레벨테스트의 결과 레벨을 제공한다(S370). 또한 각 문제에 대한 풀이를 함께 제공할 수 있고, 클라이언트 디바이스(100 내지 140)는 결과 레벨과 풀이를 확인할 수 있고, 이후 사용자의 선택에 따라 또는 자동으로 다음 레벨에 도전할 수 있다.
S350 단계가 실행되면, 정답률 또는 오답률에 대한 통계치가 의미 거리 연산부(226)에 전달되고, 의미 거리 연산부(226)는 수신한 통계치를 기반으로 미리 결정된 규칙에 따라 각 단어쌍들 간의 의미 거리를 연산한다(S380). 상술한 것처럼, 오답률이 높을수록 워드그래프상에서의 의미 거리가 가깝도록 구현하기 위하여, 오답률에 따라 가중치를 달리 부여함으로써, 본 발명에서 의도하는 단어들 간의 의미 거리를 산출할 수 있다.
산출된 의미 거리는 기존의 워드그래프(예컨대, 도 3의 제1 워드 그래프)에 병합, 수정 등의 방식으로 반영됨으로써, 워드그래프를 갱신할 수 있다(S390). 기존의 워드그래프에서 특정 단어들이 의미 거리를 갖지 않았는데, 새로 도출된 의미 거리가 있다면, 이를 반영하여 산출된 의미 거리로 두 단어를 연결하도록 구현할 수 있고, 분야에 따라 다른 워드그래프(예컨대, 도 3의 제2 워드 그래프)를 새로 생성하도록 구현될 수도 있다. 이러한 과정을 통해 워드그래프를 자동 갱신함으로써, 기존의 방대한 데이터를 가진 워드그래프를 신속하고 편리하게 유지보수할 수 있다.
도 4는 본 발명의 제2 실시예에 따른 워드그래프 관리 방법을 도시한 것이다. 도 4에 도시된 제2 실시예는 도 3의 S310 내지 S390 단계를 공통적으로 수행하되, 지역 광고 서버(310, 320)에 워드그레프를 제공하는 차이점(S492, S493)을 갖는다. 도 4는 도 3에서 설명한 것과 마찬가지로, 기존의 워드그래프를 기반으로클라이언트 디바이스상에서 레벨테스트를 실행하고(S410 내지 S450), 수신한 레벨테스트를 분석하여 워드그래프를 생신할 수 있다(S460 내지 S490).
다만, 클라이언트 디바이스(110 내지 140)의 위치를 파악하거나, 클라이언트 디바이스(110 내지 140)로부터 위치 정보를 수신하여, 지역별로 정답률 또는 오답률의 분석을 수행할 수 있다. 이는 시간이 흐름에 따라 지역별로 언어의 특성과 의미 관계가 다르게 변해가는 특징을 반영한 것으로, 의미 거리를 지역별로 산출하기 위함이다. 관리 서버(200)는 미리 정해둔 지역 카테고리(예컨대, 행정구역 또는 국가 등)에 대해 오답률의 통계치를 산출하고 단어별 의미거리를 각각 연산할 수 있다(S480).
지역별 의미 거리가 각각 연산됨에 따라, 지역별 워드그래프를 생성할 수 있고(S492), 기존에 저장된 지역별 워드그래프를 갱신할 수도 있다(S490). 이와 같이, 갱신되거나 새로 생성된 지역별 워드그래프는 자체 데이터베이스(예컨대, 도 2의 지역별 워드그래프 데이터베이스)에 저장될 수 있다. 저장된 지역별 워드그래프는, 예컨대, 주기적으로, 갱신 시, 또는 광고 서버로부터의 요청에 의해, 지역 광고 서버(310, 320)에서 제공될 수 있고, 지역 광고 서버는 이를 활용하여 의미 거리에 기반한 광고를 제공할 수 있다. 예를 들어, '독일'에서는 '맥주'와 의미거리가 가장 가까운 연상어가 '소세지'일 수 있고, '한국'에서는 '치킨'일 수 있다. 이러한 경우, '맥주'에 대한 글이 게제된 웹페이지가 독일 지역에서 디스플레이되면 '소세지'에 관한 광고를 출력하고, 한국 지역에서 그 웹페이지가 디스플레이되면 '치킨'에 관한 광고를 출력하도록 활용할 수 있다. 이러한 연상어 기반의 광고가 가능하도록 구현함으로써, 광고 효과를 극대화시키고 광고주와 사용자를 모두 만족시킬 수 있는 효과가 있다. 이처럼 본 발명의 워드그래프 관리 방법과 광고 방법을 연계하여, 워드그래프의 활용도를 더 높일 수 있다.
도 5 내지 도 7은 본 발명의 일 실시예에 따른 레벨테스트 및 워드그래프의 일례를 나타내는 도면들이다. 도 5는 본 발명의 일 실시예에 따른 연상어 레벨테스트의 디스플레이를 도시한 것이다. 도 5에 도시된 것처럼, 하나 이상의 단어들을 제시하고 그와 관련된 연상어를 선택하는 형식으로 문제를 출제할 수 있다. 이 때, 제시되는 단어는 동일하고 선택문항의 단어들만 교체하여 문제를 출제할 수 있고, 동일한 문제에 대해 선택한 정답 결과 등의 오답률을 통해 선택문항의 단어들 간의 의미 거리를 연산할 수 있다. 다른 실시예로서, 제시된 단어를 보고 떠오르는 연상어를 직접 입력하도록 구현할 수도 있다. 또한 연상어 문제 옆에 정답률 또는 오답률을 표시하여 문제를 푸는 이에게 해당 문제의 레벨(즉, 오답률)을 알 수 있도록 해준다.
도 5와 같은 문제를 통해, 레벨테스트가 완료되면, 도 6에 도시된 것처럼, 클라이언트 디바이스로부터 선택 입력된 레벨테스트의 결과 정보가 관리 서버(200)에 전달될 수 있다. 도 6은 본 발명의 일 실시예에 따른 연상어 레벨테스트의 통계추출을 위한 화면을 도시한 것으로서, 각 단어쌍별로 정답률 또는 오답률의 분석을 통해 백분율로 나타날 수 있다. 상술한 것처럼, 단어쌍별 오답률(또는 정답률)의 분석을 일정 수 이상의 결과 수신 후 통계치로서 추출될 수 있고, 추출된 통계치를 이용하여 의미 거리가 연산될 수 있다. 즉, 도 6에서 dog와 가장 의미 거리가 가까운 단어는 sheep이고, 가장 의미 거리가 긴 단어는 computer로 도출된다.
도 7은 본 발명의 일 실시예에 따른 워드그래프의 일부를 도시한 것이다. 도 6과 같은 오답률로부터 의미 거리가 연산되면, 이 의미 거리를 기반으로 도 7과 같은 워드그래프가 생성될 수 있다. 즉, 의미 거리의 수치가 크게 연산된 경우에는 도 7과 같은 워드그래프에서 물리적으로 멀리 떨어져 배치되고, 의미 거리 수치가 작은 수로 연산되었다면 상대적으로 서로 가까운 곳에 배치된다. 도 7에는 극히 일부의 워드그래프를 도시하였지만, 워드그래프는 수많은 단어들로 이루어진 방대한 사이즈의 지도 또는 그래프형태일 수 있다. 따라서, 기존에는 구축 및 갱신에 엄청난 노력을 투자하여야 했지만, 본 발명과 같은 방식을 통해 신속하고 용이하게 워드그래프의 구축과 유지보수가 가능하게 되었다. 또한 본 발명의 워드 그래프 관리 방법 및 시스템에 의하면, 워드 그래프를 용이하게 구축, 갱신할 수 있으므로, 검색 엔진, 광고 플랫폼, 질의응답 시스템 등 사람의 언어와 연관된 다양한 시스템 및 어플리케이션에 활용될 수 있다.
상술한 것처럼, 본 발명의 워드 그래프 관리 방법 및 시스템에 의하면, 레벨테스트와 같이 일반 사용자와의 상호작용을 통한 정보를 수집, 분석함으로써, 워드 그래프를 자동으로 구축, 갱신할 수 있으므로, 관리자의 노력을 경감시킬 수 있고, 구축된 워드그래프는 검색 엔진, 광고 플랫폼, 질의응답 시스템 등 사람의 언어와 연관된 다양한 시스템 및 어플리케이션에 활용될 수 있다.
또한 본 발명은 여러 지역의 사용자들과의 상호작용을 통해 정보를 수집, 분석할 수 있으므로, 시간이 지남에 따라 지속적으로 변하는 언어의 특성을 워드그래프에 반영할 수 있고, 지역 및 시간의 변화에 따라 다양한 워드그래프 생성이 가능하므로, 저비용으로 워드그래프의 구축 및 갱신이 달성될 수 있다. 더불어, 이러한 워드그래프를 활용함으로써 레벨테스트의 문제 생성 또한 용이하며, 정확한 사용자별 어휘 수준의 측정이 가능하게 된다.
본 발명은 이해를 돕기 위해 상기 구체적인 예에 대해서만 상세히 설명되었으므로 본 명세서에서 나타낸 구성요소, 그들의 접속 및 관계, 및 그들의 기능들은 단지 예시적인 것을 의미한다. 본 발명의 상세한 설명에서는 구체적인 실시 예를 들어 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한 각 실시 예는 여러 가지 형태로 변형될 수 있다. 예를 들어, 관리 서버(200)의 데이터 입출력부(210), 제어부(220), 데이터베이스(230, 240)는 분리되어 도시되었지만, 이들 전체 또는 일부 구성요소가 일체화된 형태로 구현될 수 있으며, 별도의 장치로서 구현될 수도 있다.
이상에서 실시예를 통해 설명한 본 발명의 기술적 범위는 상기 기재된 실시예에 한정되는 것은 아니고 본 발명의 사상 및 범위를 벗어나지 않는 범위에서 다양하게 수정 및 변형될 수 있음은 본 발명이 속한 기술 분야에서 통상의 지식을 가진 자에게 명백하다. 따라서 그러한 변형예 또는 수정예들은 본 발명의 특허청구범위에 기재된 발명의 범위에 속한다 해야 할 것이다.
110 내지 140: 클라이언트 디바이스
200: 관리 서버
210: 데이터 입출력부
220: 제어부
230: 워드그래프 데이터베이스
240: 지역별 워드그래프 데이터베이스
310, 320: 광고 서버

Claims (10)

  1. 워드그래프(wordgraph) 관리 방법으로서,
    관리 서버에 미리 저장된 워드그래프에 기초하여, 클라이언트 디바이스상에서 레벨테스트를 실행하는 단계;
    상기 관리 서버가 상기 클라이언트 디바이스로부터 상기 레벨테스트에 의한 결과를 수신하는 단계;
    상기 수신한 레벨테스트의 결과를 분석하여, 각 단어 쌍(pair)별로 정답률 또는 오답률을 추출하는 단계;
    상기 추출한 정답률 또는 오답률에 따라 상기 단어 쌍의 의미 거리를 연산하는 단계; 및
    상기 연산된 의미 거리를 이용하여 상기 미리 저장된 워드그래프를 갱신하거나 새로운 워드그래프를 생성하는 단계를 포함하는 워드그래프 관리 방법.
  2. 청구항 1에 있어서,
    상기 워드그래프는, 상기 단어 쌍별 오답률 추출 단계 또는 상기 의미 거리 연산 단계가 미리 결정된 횟수 이상 수행된 경우에 자동으로 갱신되는 것을 특징으로 하는 워드그래프 관리 방법.
  3. 청구항 1에 있어서,
    상기 의미 거리를 연산하는 단계는, 상기 오답률이 높을수록 상기 의미 거리가 길고, 상기 오답률이 낮을수록 상기 의미 거리가 짧도록 가중치를 부여하여 연산하는 것을 특징으로 하는 워드그래프 관리 방법.
  4. 청구항 1에 있어서,
    상기 연산된 의미 거리에 기초하여, 지역별 의미 관계 정보 및 거리를 추가적으로 연산하는 단계; 및
    상기 지역별 의미 관계 정보 및 거리에 기초하여 적어도 하나의 지역별 워드그래프를 생성하는 단계를 더 포함하는 워드그래프 관리 방법.
  5. 청구항 4에 있어서,
    상기 적어도 하나의 지역별 워드그래프를 지역 광고 서버에 제공하는 단계를 더 포함하는 워드그래프 관리 방법.
  6. 워드그래프(wordgraph) 관리 시스템으로서,
    워드그래프 데이터베이스;
    상기 워드그래프 데이터베이스에 저장된 워드그래프에 기초하여 레벨테스트를 출제하는 레벨테스트 출제부;
    상기 레벨테스트를 클라이언트 디바이스에 제공하고, 상기 클라이언트 디바이스에서 실행한 상기 레벨테스트의 결과를 수신하는 데이터 입출력부;
    상기 수신한 레벨테스트 결과를 분석하여, 각 단어 쌍(pair)별로 정답률 또는 오답률을 분석하는 오답률 분석부;
    상기 추출한 정답률 또는 오답률에 따라 상기 단어 쌍의 의미 거리를 연산하는 의미 거리 연산부; 및
    상기 연산된 의미 거리를 이용하여 상기 저장된 워드그래프를 갱신하거나 새로운 워드그래프를 생성하는 워드그래프 갱신부를 포함하는 워드그래프 관리 시스템.
  7. 청구항 6에 있어서,
    상기 워드그래프 갱신부는, 상기 단어 쌍별 오답률 추출 또는 상기 의미 거리 연산이 미리 결정된 횟수 이상 수행된 경우에, 상기 워드그래프를 자동으로 갱신하는 것을 특징으로 하는 워드그래프 관리 시스템.
  8. 청구항 6에 있어서,
    상기 의미 거리 연산부는, 상기 오답률이 높을수록 상기 의미 거리가 길고, 상기 오답률이 낮을수록 상기 의미 거리가 짧도록 가중치를 부여하여 연산하는 것을 특징으로 하는 워드그래프 관리 시스템.
  9. 청구항 6에 있어서,
    상기 연산된 의미 거리에 기초하여, 지역별 의미 관계 정보 및 거리를 추가적으로 연산하는 지역별 정보 연산부; 및
    상기 지역별 의미 관계 정보 및 거리에 기초하여 적어도 하나의 지역별 워드그래프를 생성하는 지역별 워드그래프 생성부를 더 포함하는 워드그래프 관리 시스템.
  10. 청구항 9에 있어서,
    상기 데이터 입출력부는 상기 적어도 하나의 지역별 워드그래프를 지역 광고 서버에 제공하는 것을 특징으로 하는 워드그래프 관리 시스템.
KR1020120136905A 2012-11-29 2012-11-29 워드그래프 관리 방법 및 시스템 KR101286296B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120136905A KR101286296B1 (ko) 2012-11-29 2012-11-29 워드그래프 관리 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120136905A KR101286296B1 (ko) 2012-11-29 2012-11-29 워드그래프 관리 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR101286296B1 true KR101286296B1 (ko) 2013-07-15

Family

ID=48997411

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120136905A KR101286296B1 (ko) 2012-11-29 2012-11-29 워드그래프 관리 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR101286296B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015093651A1 (en) * 2013-12-19 2015-06-25 Twinword Inc. Method and system for managing a wordgraph
WO2016186362A1 (ko) * 2015-05-19 2016-11-24 트윈워드 주식회사 글에 반영된 사용자의 심리 상태 정보 제공 장치 및 그 방법
WO2016186363A1 (ko) * 2015-05-19 2016-11-24 트윈워드 주식회사 성격 검사 장치 및 그 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080087994A (ko) * 2007-03-28 2008-10-02 인하대학교 산학협력단 엑스엠엘 문서 유사도 측정 장치 및 그 방법
KR20090069275A (ko) * 2006-09-19 2009-06-30 알까뗄 루슨트 자연언어로 된 텍스트로부터 존재론을 전개하기 위한, 컴퓨터들에 의해 사용되는 방법
KR101049358B1 (ko) 2008-12-08 2011-07-13 엔에이치엔(주) 유사어 결정 방법 및 시스템

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090069275A (ko) * 2006-09-19 2009-06-30 알까뗄 루슨트 자연언어로 된 텍스트로부터 존재론을 전개하기 위한, 컴퓨터들에 의해 사용되는 방법
KR20080087994A (ko) * 2007-03-28 2008-10-02 인하대학교 산학협력단 엑스엠엘 문서 유사도 측정 장치 및 그 방법
KR101049358B1 (ko) 2008-12-08 2011-07-13 엔에이치엔(주) 유사어 결정 방법 및 시스템

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
최용석, 최기선, "과도한 지식을 요구하지 않는 공통기반축에 의한 용어 번역과 한영 교차정보검색에의 응용."한국인지과학회 논문지, 제14권, 제1호, pp. 29-40, 2003. 03. *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015093651A1 (en) * 2013-12-19 2015-06-25 Twinword Inc. Method and system for managing a wordgraph
WO2016186362A1 (ko) * 2015-05-19 2016-11-24 트윈워드 주식회사 글에 반영된 사용자의 심리 상태 정보 제공 장치 및 그 방법
WO2016186363A1 (ko) * 2015-05-19 2016-11-24 트윈워드 주식회사 성격 검사 장치 및 그 방법
KR20160136054A (ko) * 2015-05-19 2016-11-29 트윈워드 주식회사 글에 반영된 사용자의 심리 상태 정보 제공 장치 및 그 방법
KR101713258B1 (ko) * 2015-05-19 2017-03-09 트윈워드 주식회사 글에 반영된 사용자의 심리 상태 정보 제공 장치 및 그 방법
KR101731561B1 (ko) * 2015-05-19 2017-05-02 트윈워드 주식회사 성격 검사 장치 및 그 방법

Similar Documents

Publication Publication Date Title
US9824321B2 (en) System and method for categorization of social media conversation for response management
JP6846390B2 (ja) ドメイン間の文法スロットによる分類
US20130311409A1 (en) Web-Based Education System
CN103917968A (zh) 用于管理具有交互式评论流的评论网络的系统和方法
KR102438057B1 (ko) 오케팅을 이용한 마케팅 전략 제공 시스템, 마케팅 전략 제공 방법 및 기록 매체에 저장된 브랜드 평가 프로그램
US11934977B2 (en) Dynamic and continuous onboarding of service providers in an online expert marketplace
Dragoni A three-phase approach for exploiting opinion mining in computational advertising
Chamberlain Groupsourcing: Distributed problem solving using social networks
KR102322668B1 (ko) 콘텐츠 크리에이터의 창작활동 활성화를 위한 다중 플랫폼 서비스 제공 시스템
KR102510023B1 (ko) 사용자의 행동 데이터 또는 입력 데이터를 이용하여 사용자의 심리 상태를 판별하는 방법 및 컴퓨터 프로그램
US20170032253A1 (en) Information processing apparatus, control method, and program
JP2020052463A (ja) 情報処理方法および情報処理装置
CN103514162A (zh) 智能课件推荐系统
CN109831488A (zh) 信息推荐方法及系统、可读存储介质
KR101286296B1 (ko) 워드그래프 관리 방법 및 시스템
CN114862520A (zh) 产品推荐方法、装置、计算机设备及存储介质
KR20220091948A (ko) 소셜 미디어 활동 분석을 통한 추천 서비스 제공 장치 및 방법
Żytniewski et al. The outcomes of the research in areas of application and impact of software agents societies to organizations so far. Examples of implementation in Polish companies
US20160314701A1 (en) Method and system for managing a wordgraph
KR20210052746A (ko) 제품화 대상 콘텐츠의 예상 판매량 추정 방법, 장치 및 컴퓨터프로그램
Lappeman et al. Exploring online sentiment (OS) as a measure of customer experience (CX) for telecommunication services
Papoutsoglou et al. Mining DEV for social and technical insights about software development
Al Said et al. Data mining in education: managing digital content with social media analytics in medical education
Aljaber et al. A guidance and evaluation approach for mHealth education applications
Bai et al. Prioritizing user requirements for digital products using explainable artificial intelligence: A data-driven analysis on video conferencing apps

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161219

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170705

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180704

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190708

Year of fee payment: 7