KR20110026154A - 시맨틱 메타데이터를 통한 인터넷 상의 개인 특성 및 행위 분석 기술 - Google Patents

시맨틱 메타데이터를 통한 인터넷 상의 개인 특성 및 행위 분석 기술 Download PDF

Info

Publication number
KR20110026154A
KR20110026154A KR1020090083933A KR20090083933A KR20110026154A KR 20110026154 A KR20110026154 A KR 20110026154A KR 1020090083933 A KR1020090083933 A KR 1020090083933A KR 20090083933 A KR20090083933 A KR 20090083933A KR 20110026154 A KR20110026154 A KR 20110026154A
Authority
KR
South Korea
Prior art keywords
data
semantic
database
metadata
user
Prior art date
Application number
KR1020090083933A
Other languages
English (en)
Inventor
정지웅
Original Assignee
주식회사 플라이팬
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 플라이팬 filed Critical 주식회사 플라이팬
Priority to KR1020090083933A priority Critical patent/KR20110026154A/ko
Publication of KR20110026154A publication Critical patent/KR20110026154A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 개인 사용자가 인터넷상에 남긴 다양한 데이터를 검출하고 정형화된 시맨틱 데이터로 변환, 이 데이터에 기반해 개인별 특성 및 행위를 분석하는 분석 기술에 관한 것이다. 본 발명에 의하면 기존의 특성 및 행위 데이터베이스가 없이도, 사용자 데이터에서 추출한 시맨틱 메타데이터에 따라 사용자의 행위 및 특성을 분류함으로써, 사용자의 행위 및 특성을 의미적 기준에 따라 분석 할 수 있는 장점이 있다.
시맨틱웹 메타데이터 특성분석 행위분석

Description

시맨틱 메타데이터를 통한 인터넷 상의 개인 특성 및 행위 분석 기술 { Analyzation of Internet User Behavior and Character using Semantic Metadata }
본 발명은 개인 사용자가 인터넷상에 남긴 다양한 데이터를 검출하고 정형화된 시맨틱 데이터로 변환, 이 데이터에 기반해 개인별 특성 및 행위를 분석하는 분석 기술에 관한 것이다.
사용자의 데이터로부터 행위 패턴과 특성 패턴을 파악하는 기존의 방법은, 사용자 데이터를 데이터 간의 유사도에 따라 동일한 범주의 군집으로 분류하는 방법 혹은 데이터의 평균 표준분포에 따라 유사한 범주의 군집으로 분류하는 방법 등이 있다.
전자의 방법은 데이터를 데이터의 특성에 따라, 군집으로 분류해주는 방법으로서 기존에 특성 데이터에 대한 사전 데이터베이스가 구축되어 있어야 한다는 한계가 있다. 후자는 데이터를 특정 기준에 따라 수학적 기준으로 나타내고, 이 기준의 분포 정도를 표준분포에 따른 범주의 군집으로 분류하는 방법으로서, 사전 데이터베이스가 없이도 자동으로 처리 할 수 있다는 장점이 있으나, 결과가 무의미한 단순 군집에 그치기 때문에 유의미한 분석이 어렵다는 문제점이 있다.
본 발명은 인터넷 상에서 취득한 사용자 데이터로부터 개인에 특화된 데이터를 검출하고, 사전 데이터 및 기존에 축적된 시맨틱 데이터베이스의 자료와 비교해, 사용자의 행위 패턴과 특성 패턴을 파악할 수 있도록 하는 시맨틱 메타 데이터를 이용한 사용자 특성 및 행위 분석 장치 및 방법에 대한 것이다.
본 발명은 인터넷 상에서 개인 사용자가 남긴 데이터를 실시간으로 수집하는 수집부와, 수집된 데이터로부터 데이터의 내용을 특징짓기 위한 데이터 추출부와, 상기 추출된 시맨틱 데이터 정보를 데이터베이스에 효율적으로 저장하기 위한 시맨틱 데이터베이스 색인화부와, 색인화된 데이터를 기반으로 특성 및 행위 별 데이터 군집을 생성해주는 데이터베이스 분류화부 , 군집화되어 구성된 시맨틱 메타데이터를 이용한 분석 장치 및 방법을 통해 사용자 데이터를 의미적 기준에 따라 분류하고 분석하고자 한다.
따라서, 본 발명은 상기의 문제점을 개선하기 위한 것으로 인터넷 상에서 개인 사용자가 남긴 데이터를 실시간으로 수집하고, 수집된 데이터로부터 데이터의 내용을 특징짓기 위한 데이터 추출하고, 상기 추출된 시맨틱 데이터 정보를 데이터베이스에 효율적으로 저장하고, 색인화된 시맨틱 메타 데이터를 기반으로 의미적 기준에 따른 특성 및 행위 별 데이터 군집을 생성할 수 있도록 하는, 의미적 정보를 이용 한 분석 장치 및 방법을 제공하는데 목적이 있다.
상술한 목적을 달성하기 위한 본 발명에 따른 시맨틱 메타데이터를 이용한 사용자 행위 및 특성 분석 방법은 인터넷 상에서 개인 사용자가 남긴 데이터를 실시간으로 수집하는 단계와, 수집된 데이터로부터 데이터의 내용을 특징짓기 위한 데이터 추출 단계와, 상기 추출된 시맨틱 데이터 정보를 데이터베이스에 효율적으로 저장하는 색인화 단계와 색인화된 데이터를 기반으로 특성 및 행위 별 데이터 군집을 생성해주는 데이터베이스 분류를 담당하는 단계와 , 군집화되어 구성된 시맨틱 메타데이터를 이용해 분석을 수행하는 단계를 포함하여 이루어진 것을 특징으로 한다.
상기와 같이 이루어지는 본 발명은 인터넷상의 사용자 정보, 즉 사용자의 글 , 사용자의 태그 , 사용자의 관심 키워드 , 사용자의 추천,투표와 같은 피드백 등을 추출하고, 시맨틱 메타데이터를 사용하여 사용자 데이터를 의미적 유사도에 따라 색인화하고, 분류해서 최종적으로 의미적 기준에 따라 분석할 수 있게 해주는 장점을 가진다.
이하 본 발명의 일 실시 예에 관하여 첨부된 도면을 참조하여 상세히 설명한다.
도1은 본 발명에 따른 시맨틱 메타데이터를 이용한 분석 장치의 구성도로써, 실시간 데이터 수집부 (1) , 데이터 추출부 (2) , 시맨틱 데이터 베이스 색인화부 (3) , 시맨틱 메타데이터 데이터베이스 (4) , 시맨틱 데이터베이스 분류화부 (5) , 시맨틱 메타데이터 분석부 (6) 로 구성된다.
도1과 같이 구성된 시맨틱 메타데이터를 이용한 분석 장치의 동작을 설명하면 다음과 같다.
실시간 데이터 수집부 (1)는 인터넷상의 다양한 데이터소스(소셜 네트워크 서비스, 블로그 , 게시판 서비스)로부터 사용자 데이터를 짧은 주기로 지속적으로 수집해서 데이터 추출부(2)로 전달한다. 데이터 추출부(2)는 수집한 원본 데이터 중에서 메타데이터에 해당하는 부분을 추출하여 시맨틱 데이터베이스 색인화부(3)으로 전달한다. 시맨틱 데이터베이스 색인화부는 메타데이터를 특성에 따라 각각의 색인으로 나누고, 시맨틱 메타데이터 데이터베이스(4)에 색인 데이터로 저장한다. 시맨틱 메타데이터 데이터베이스는 메타 데이터들을 의미적 기준에 따라 분류한 메타데이터들의 집합을 저장하고 있는 저장소로써, 신규로 유입된 메타데이터들이 어떤 의미적 기준에 해당하는지의 여부를 판단해 시맨틱 데이터베이스 분류화부(5)에 필요한 정보를 전달한다. 시맨틱 데이터베이스 분류화부(5)는 전달 받은 정보와 , 실시간 데이터 수집부(1)를 통해 전달받은 해당 사용자의 원본 데이터를 비교 분석해, 해당 사용자가 의미적 분류의 어떤 위치에 해당하는지의 여부를 판단하고 해당 분류에 배열하게 된다. 배열이 끝난 데이터는 시맨틱 메타데이터 분석부(6)에 전달된다. 시맨틱 메타데이터 분석부(6)는 분류가 끝난채로 전달된 사용자 데이터를 의미적 기준에 의한 판단과정과 통계수치 정보에 따른 부가 분석 과정을 통해 분석한다. 최종적으로 분석이 끝나면 해당 사용자가 속한 특성 패턴과 행위 패턴에 대한 정보를 출력하고, 분석 결과를 다시 시맨틱 메타데이터 데이터베이스에 저장해, 이후의 분석에 도움이 되는 자료로 활용한다.

Claims (1)

  1. 인터넷 상에서 개인 사용자가 남긴 데이터를 실시간으로 수집하는 수집부
    상기 수집된 데이터로부터 데이터의 내용을 특징짓기 위한 데이터 추출부
    상기 추출된 시맨틱 데이터 정보를 데이터베이스에 효율적으로 저장하기 위한 시맨틱 데이터베이스 색인부
    상기 색인화된 데이터를 기반으로 특성 및 행위 별 데이터 군집을 생성해주는 데이터베이스 분류부 ,
    상기 군집화를 통해 구성된 시맨틱 메타데이터를 이용한 사용자 행위 및 특성 분석 장치
KR1020090083933A 2009-09-07 2009-09-07 시맨틱 메타데이터를 통한 인터넷 상의 개인 특성 및 행위 분석 기술 KR20110026154A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090083933A KR20110026154A (ko) 2009-09-07 2009-09-07 시맨틱 메타데이터를 통한 인터넷 상의 개인 특성 및 행위 분석 기술

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090083933A KR20110026154A (ko) 2009-09-07 2009-09-07 시맨틱 메타데이터를 통한 인터넷 상의 개인 특성 및 행위 분석 기술

Publications (1)

Publication Number Publication Date
KR20110026154A true KR20110026154A (ko) 2011-03-15

Family

ID=43933294

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090083933A KR20110026154A (ko) 2009-09-07 2009-09-07 시맨틱 메타데이터를 통한 인터넷 상의 개인 특성 및 행위 분석 기술

Country Status (1)

Country Link
KR (1) KR20110026154A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101320481B1 (ko) * 2011-12-20 2013-10-23 신선 메타데이터 수집 방법과 이를 이용한 온라인 이용자의 성향분석 방법 및 메타데이터를 이용한 성향 분석 장치
CN106789136A (zh) * 2015-11-19 2017-05-31 北大方正集团有限公司 基于用户行为的运营分析实现方法及装置
CN108121715A (zh) * 2016-11-28 2018-06-05 中国移动通信集团公司 一种文字标签方法及文字标签装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101320481B1 (ko) * 2011-12-20 2013-10-23 신선 메타데이터 수집 방법과 이를 이용한 온라인 이용자의 성향분석 방법 및 메타데이터를 이용한 성향 분석 장치
CN106789136A (zh) * 2015-11-19 2017-05-31 北大方正集团有限公司 基于用户行为的运营分析实现方法及装置
CN108121715A (zh) * 2016-11-28 2018-06-05 中国移动通信集团公司 一种文字标签方法及文字标签装置
CN108121715B (zh) * 2016-11-28 2022-01-25 中国移动通信集团公司 一种文字标签方法及文字标签装置

Similar Documents

Publication Publication Date Title
CN109189901B (zh) 一种智能客服系统中自动发现新分类以及对应语料的方法
CN110209764B (zh) 语料标注集的生成方法及装置、电子设备、存储介质
Halibas et al. Application of text classification and clustering of Twitter data for business analytics
CN106021410A (zh) 一种基于机器学习的源代码注释质量评估方法
CN107491435B (zh) 基于计算机自动识别用户情感的方法及装置
CN110263141A (zh) 一种基于bert的客服问答系统
CN106649258A (zh) 一种智能的问答系统
CN110852095B (zh) 语句热点提取方法及系统
CN114896305A (zh) 一种基于大数据技术的智慧互联网安全平台
CN110909542A (zh) 智能语义串并分析方法及系统
CN113094512A (zh) 一种工业生产制造中故障分析系统及方法
CN115238154A (zh) 搜索引擎优化系统
CN109660656A (zh) 一种智能终端应用程序识别方法
CN115794803A (zh) 一种基于大数据ai技术的工程审计问题监测方法与系统
KR20110026154A (ko) 시맨틱 메타데이터를 통한 인터넷 상의 개인 특성 및 행위 분석 기술
CN110738047A (zh) 基于图文数据与时间效应的微博用户兴趣挖掘方法及系统
CN106372083B (zh) 一种有争议性新闻线索自动发现的方法及系统
CN106709824B (zh) 一种基于网络文本语义分析的建筑评价方法
KR102345410B1 (ko) 빅데이터 지능형 수집 방법 및 장치
CN102999523A (zh) 一种才智数字化的方法
CN107291952B (zh) 一种提取有意义串的方法及装置
CN112132368A (zh) 信息处理方法以及装置、计算设备、存储介质
CN113869355A (zh) 一种基于XGBoost的人员危险性评估方法
CN112988972A (zh) 一种基于数据模型的行政处罚案卷评查方法及系统
CN108052503B (zh) 一种置信度的计算方法及装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application
E601 Decision to refuse application