KR20190061667A - 태그 추천 및 태그화 방법 - Google Patents

태그 추천 및 태그화 방법 Download PDF

Info

Publication number
KR20190061667A
KR20190061667A KR1020170160288A KR20170160288A KR20190061667A KR 20190061667 A KR20190061667 A KR 20190061667A KR 1020170160288 A KR1020170160288 A KR 1020170160288A KR 20170160288 A KR20170160288 A KR 20170160288A KR 20190061667 A KR20190061667 A KR 20190061667A
Authority
KR
South Korea
Prior art keywords
tag
user
tagging method
recommendation
present
Prior art date
Application number
KR1020170160288A
Other languages
English (en)
Inventor
김정식
Original Assignee
(주)타이거컴퍼니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)타이거컴퍼니 filed Critical (주)타이거컴퍼니
Priority to KR1020170160288A priority Critical patent/KR20190061667A/ko
Publication of KR20190061667A publication Critical patent/KR20190061667A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

사용자들이 명시적으로 함축한 해시태그 사전을 축적하고, 활용해서 자연어 이해 및 처리를 해서 사용자의 의도 파악을 하고, 적절한 태그 추천을 할 수 있도록 하는 태그 추천 및 태그화 방법을 제시한다. 제시된 방법은 사용자가 작성한 피드 본문 내용을 파악하는 단계, 사용자 본문 분석해서 태그를 추천하는 단계, 및 해당 사이트별 이슈 키워드를 조회하는 단계를 포함한다.

Description

태그 추천 및 태그화 방법{Tag referral and tagging method}
본 발명은 태그 추천 및 태그화 방법에 관한 것으로, 보다 상세하게는 피드 본문의 해시태그 키워드를 추출해서 축적한 지식 사전 기반으로 업무 공유 정보에서 태그 추천 및 태그화 방법에 관한 것이다.
소셜 서비스가 대중화되면서 사용자들은 기존의 정형화된 글 작성 방식에서 좀 더 간단하게 축약되면서, 글 작성 표현이 많이 바뀌고 있다. 도메인별 약어, 전문 용어, 신조어, 줄임말 등 다양한 표현을 표준 사전으로는 의미 파악을 할 수 없다. 다양한 기계학습 알고리즘을 통해 추천 태그 기법들이 소개되고 있으나, 도메인 특성에 따라 정답률이 천차만별이고 만족할만한 성과를 못 내고 있는 것이 현실이다. 가장 큰 문제는 도메인별 특화된 사전이 선행되어야 한다는 것이다.
사용자들의 해시태그는 함축적으로 키워드를 표현하는 수단이여서, 해당 해시태그 사전을 통해서 사용자 피드를 분석하고 추천하는 것이 가장 추천 태그에 확률을 높이는 방법이라고 본다.
선행기술 1 : 대한민국 등록특허 제10-1657585호(모바일 애플리케이션을 이용한 해시 태그 기반 상품 거래 추천 시스템 및 방법) 선행기술 2 : 대한민국 등록특허 제10-1782590호(이미지 분석기반의 관계형 태그생성 및 추천 방법) 선행기술 3 : 대한민국 등록특허 제10-1644036호(개인 관심 이슈 트래킹 장치 및 방법)
본 발명은 상기한 종래의 문제점을 해결하기 위해 제안된 것으로, 사용자들이 명시적으로 함축한 해시태그 사전을 축적하고, 활용해서 자연어 이해 및 처리를 해서 사용자의 의도 파악을 하고, 적절한 태그 추천을 할 수 있도록 하는 태그 추천 및 태그화 방법을 제공함에 그 목적이 있다.
상기와 같은 목적을 달성하기 위하여 본 발명의 바람직한 실시양태에 따른 태그 추천 및 태그화 방법은, 사용자가 작성한 피드 본문 내용을 파악하는 단계; 사용자 본문 분석해서 태그를 추천하는 단계; 및 해당 사이트별 이슈 키워드를 조회하는 단계;를 포함한다.
이러한 구성의 본 발명에 따르면, 사용자들이 명시적으로 함축한 해시태그 사전을 축적하고, 활용해서 자연어 이해 및 처리를 해서 사용자의 의도 파악을 하고, 적절한 태그 추천을 할 수 있다.
온라인으로 많은 일을 처리하고 정보를 주고 받으면서, 현재 이슈, 업무적 이슈 등 주변에서 발생하고 있는 많은 일들을 확인할 필요가 있다. 그런데, 그 정리를 시스템이 자동으로 해 주는 것은 이제 일상화되어 있다. 사용자들이 온라인에서 입력하고 조회하기 때문이다. 네이버나 다음 포털에서 전체 뉴스만 보는 것이 아니라, 내가 속한 회사, 그룹에서도 일상적으로 받을 수 있는 서비스가 되었다고 본다.
도 1은 본 발명의 실시예에 따른 태그 추천 및 태그화 방법에서 사용자가 작성한 피드 본문 내용을 파악하는 단계에 채용되는 화면 예이다.
도 2는 본 발명의 실시예에 따른 태그 추천 및 태그화 방법에서 사용자 본문 분석해서 태그를 추천하는 단계에 채용되는 화면 예이다.
도 3은 본 발명의 실시예에 따른 태그 추천 및 태그화 방법에서 해당 사이트별 이슈 키워드 조회하는 단계에 채용되는 화면 예이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 상세하게 설명하고자 한다.
그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가진 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 본 발명을 설명함에 있어 전체적인 이해를 용이하게 하기 위하여 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
사용자 해시태그는 일반적인 사전이 아닐 수 있고 문법에 맞지 않을 수 있다. 일반적인 자연어 처리는 문장 구조, 어휘, 어절 레벨로 나누어서 사전과 매칭해서 파악한다. 사용자 해시태그가 문법에 맞지 않는 경우 의미가 완전 퇴색될 수 있다.
본 발명은 사용자 피드 본문의 자연어 처리 사전인 전처리 과정에서 우선 해시태그 기반의 텍스트를 추출한다. 그리고, 전처리 이후 자연어 처리 및 토픽을 추출하는 방식으로 절차를 재정의해서 사용자 피드를 이해하고 태그를 추천하는 방식으로 하고자 한다. 본 발명은 일반적인 토픽 추천 방식보다 태그 추천 확률을 높이는 방법이라고 본다.
본 발명의 실시예에 따른 태그 추천 및 태그화 방법은, 사용자가 작성한 피드 본문 내용을 파악하는 단계; 사용자 본문 분석해서 태그를 추천하는 단계; 및 해당 사이트별 이슈 키워드를 조회하는 단계;를 포함한다.
도 1은 본 발명의 실시예에 따른 태그 추천 및 태그화 방법에서 사용자가 작성한 피드 본문 내용을 파악하는 단계에 채용되는 화면 예이고, 도 2는 본 발명의 실시예에 따른 태그 추천 및 태그화 방법에서 사용자 본문 분석해서 태그를 추천하는 단계에 채용되는 화면 예이고, 도 3은 본 발명의 실시예에 따른 태그 추천 및 태그화 방법에서 해당 사이트별 이슈 키워드 조회하는 단계에 채용되는 화면 예이다.
본 발명의 실시예에 따른 태그 추천 및 태그화 방법은, 먼저 도 1에 예시된 화면을 통해 사용자가 작성한 피드 본문 내용을 파악한다. 즉, 사용자 작성 본문에서 해시태그 텍스트를 추출하고 나서, 사전화되어 있는 해시태그 값이 본문에 매칭되면 우선 추출한다. 그리고, 자연어 처리를 통해서 명사 중심으로 문장을 정리한다(조사 제거). 이후, 토픽 모델링을 통해 가장 중심 키워드를 추출한다.
이어, 도 2에 예시된 화면에서와 같이 사용자 본문 분석해서 태그를 추천한다. 다시 말해서, 해시태그 작성하면 태그 사전에 등록하고, 없으면 일반적인 자연어 처리를 한다. 그리고, 사용자 해시태그 사전 및 토픽 모델링 중심 키워드를 서열화해서 정리한 후에 추천 태그를 통해서 태깅화하도록 유도한다.
이후, 도 3에 예시된 화면에서와 같이 해당 사이트별 이슈 키워드 조회한다. 즉, 사용자가 등록한 해시태그 및 토픽 추출 키워드를 빈도수 기반으로 축적하고 나서, 사용자 해시태그 값에 가중치를 더한다. 그리고, 이슈는 최근 등록한 글의 수를 기준으로 시점별로 산정해서 추출한다.
또한, 상술한 본 발명의 태그 추천 및 태그화 방법은, 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광데이터 저장장치 등이 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 상기 방법을 구현하기 위한 기능적인(function) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
이상에서와 같이 도면과 명세서에서 최적의 실시예가 개시되었다. 여기서 특정한 용어들이 사용되었으나, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미 한정이나 청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로, 본 기술 분야의 통상의 지식을 가진자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호범위는 첨부된 청구범위의 기술적 사상에 의해 정해져야 할 것이다.

Claims (1)

  1. 사용자가 작성한 피드 본문 내용을 파악하는 단계;
    사용자 본문 분석해서 태그를 추천하는 단계; 및
    해당 사이트별 이슈 키워드를 조회하는 단계;를 포함하는 것을 특징으로 하는 태그 추천 및 태그화 방법.
KR1020170160288A 2017-11-28 2017-11-28 태그 추천 및 태그화 방법 KR20190061667A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170160288A KR20190061667A (ko) 2017-11-28 2017-11-28 태그 추천 및 태그화 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170160288A KR20190061667A (ko) 2017-11-28 2017-11-28 태그 추천 및 태그화 방법

Publications (1)

Publication Number Publication Date
KR20190061667A true KR20190061667A (ko) 2019-06-05

Family

ID=66845051

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170160288A KR20190061667A (ko) 2017-11-28 2017-11-28 태그 추천 및 태그화 방법

Country Status (1)

Country Link
KR (1) KR20190061667A (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101644036B1 (ko) 2015-02-24 2016-07-29 국민대학교산학협력단 개인 관심 이슈 트래킹 장치 및 방법
KR101657585B1 (ko) 2015-11-13 2016-09-19 (주)제이케이소프트 모바일 애플리케이션을 이용한 해시 태그 기반 상품 거래 추천 시스템 및 방법
KR101782590B1 (ko) 2016-05-23 2017-10-23 주식회사 즐라이몬스터 이미지 분석기반의 관계형 태그생성 및 추천 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101644036B1 (ko) 2015-02-24 2016-07-29 국민대학교산학협력단 개인 관심 이슈 트래킹 장치 및 방법
KR101657585B1 (ko) 2015-11-13 2016-09-19 (주)제이케이소프트 모바일 애플리케이션을 이용한 해시 태그 기반 상품 거래 추천 시스템 및 방법
KR101782590B1 (ko) 2016-05-23 2017-10-23 주식회사 즐라이몬스터 이미지 분석기반의 관계형 태그생성 및 추천 방법

Similar Documents

Publication Publication Date Title
Bergsma et al. Stylometric analysis of scientific articles
US9779388B1 (en) Disambiguating organization names
US8452772B1 (en) Methods, systems, and articles of manufacture for addressing popular topics in a socials sphere
US9830386B2 (en) Determining trending topics in social media
US20160012331A1 (en) Scoring concept terms using a deep network
US8577155B2 (en) System and method for duplicate text recognition
US10664759B2 (en) Dynamic business rule creation using scored sentiments
US10740406B2 (en) Matching of an input document to documents in a document collection
CN104699737A (zh) 用于管理搜索的方法和系统
GB2555207A (en) System and method for identifying passages in electronic documents
CN111191428A (zh) 评论信息处理方法、装置、计算机设备和介质
US9779363B1 (en) Disambiguating personal names
CN107368489A (zh) 一种资讯数据处理方法及装置
CN115982376A (zh) 基于文本、多模数据和知识训练模型的方法和装置
CN111339773A (zh) 信息处理方法、自然语言处理方法以及信息处理设备
CN107168966A (zh) 一种搜索引擎索引构建方法及装置
Sitaula A hybrid algorithm for stemming of Nepali text
CN110489740B (zh) 语义解析方法及相关产品
CN109960752B (zh) 应用程序内的查询方法、装置、计算机设备和存储介质
US20090216739A1 (en) Boosting extraction accuracy by handling training data bias
US20230090601A1 (en) System and method for polarity analysis
US9946765B2 (en) Building a domain knowledge and term identity using crowd sourcing
Dadoun et al. Sentiment Classification Techniques Applied to Swedish Tweets Investigating the Effects of translation on Sentiments from Swedish into English
Khritankov et al. Discovering text reuse in large collections of documents: A study of theses in history sciences
US20190205934A1 (en) Advertising device and method thereof