KR101415634B1 - 온라인 커뮤니티의 언어 거동에 텍스트 컨텐트를 적응시키기 위한 방법 및 시스템 - Google Patents

온라인 커뮤니티의 언어 거동에 텍스트 컨텐트를 적응시키기 위한 방법 및 시스템 Download PDF

Info

Publication number
KR101415634B1
KR101415634B1 KR1020127026562A KR20127026562A KR101415634B1 KR 101415634 B1 KR101415634 B1 KR 101415634B1 KR 1020127026562 A KR1020127026562 A KR 1020127026562A KR 20127026562 A KR20127026562 A KR 20127026562A KR 101415634 B1 KR101415634 B1 KR 101415634B1
Authority
KR
South Korea
Prior art keywords
semantic
text content
concept
online community
community
Prior art date
Application number
KR1020127026562A
Other languages
English (en)
Other versions
KR20120139791A (ko
Inventor
요한 스탄
하킴 하시드
Original Assignee
알까뗄 루슨트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 알까뗄 루슨트 filed Critical 알까뗄 루슨트
Publication of KR20120139791A publication Critical patent/KR20120139791A/ko
Application granted granted Critical
Publication of KR101415634B1 publication Critical patent/KR101415634B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Computer Hardware Design (AREA)
  • Primary Health Care (AREA)
  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)

Abstract

온라인 커뮤니티의 언어 거동(language behavior)에 텍스트 컨텐트를 적응시키기 위한 방법을 개시하며, 상기 방법은: - 온라인 커뮤니티의 의미론상의 태그 클라우드의 확립 단계; - 의미론상의 태그 클라우드에 기초하여, 텍스트 컨텐트의 적어도 하나의 개념의 적어도 하나의 의미론상의 이웃을 결정하는 단계; - 결정된 의미론상의 이웃의 도움으로 텍스트 컨텐트를 재설정(reformulate)하는 단계를 포함한다.

Description

온라인 커뮤니티의 언어 거동에 텍스트 컨텐트를 적응시키기 위한 방법 및 시스템{METHOD AND SYSTEM FOR ADAPTING A TEXTUAL CONTENT TO THE LANGUAGE BEHAVIOUR OF AN ON-LINE COMMUNITY}
본 발명은 온라인 커뮤니티 내의 그룹 전자 통신에 관한 것이다.
본 명세서에서 용어 "온라인(online)"은 커뮤니티의 멤버들과 상호작용하기 위한 계산 및 전자 디바이스들의 간단한 이용을 나타낸다. 온라인 커뮤니티들은 예를 들면 메일링 리스트들, 토론 포럼들, 또는 소셜 네트워크들과 같은 인터넷(Web 2.0)을 통해, 또는 회사의 공동 작업 공간, 실행 커뮤니티들(community of practice) 등과 같은 인트라넷/엑스트라넷 네트워크를 통해 액세스 가능하다.
하나 이상의 관리자들에 의해 생성되는 온라인 커뮤니티는 또한, 예를 들면 특성상 사회적, 상업적 또는 교육적이 될 수 있는 특정 테마에 관심이 있는 자들 사이의 실시간이 아닌(비동기적 상호작용들) 그룹(집단) 전자 통신 공간을 표현하는 가상 커뮤니티라고도 알려져 있다. 이러한 주제에 관심이 있는 임의의 사용자는 커뮤니티에 참여할 수 있고 그에 의해 멤버들과 상호작용할 수 있다. 이들은 텍스트 컨텐트, 멀티미디어, 또는 더욱 일반적으로 말해서 데이터를 교환(게시 및/또는 보기)할 수 있다. 일부 온라인 커뮤니티들에서, 패스워드에 의해 식별되는 등록된 사용자들만 컨텐트를 게시하고 및/또는 볼 수 있다.
이들 온라인 커뮤니티들은 기록 전자 통신이 주로 사용자들의 그룹이 커뮤니티를 형성하기 위한 유일한 방법이라는 점에서 주로 언어-기반이다.
이것은, 멤버들이 관심 있어 하는 주제 외에도, 온라인 커뮤니티가 일반적으로, 이러한 그룹 전자 통신 공간에서 특정한 상호작용 언어 거동을 채택하여 실천하는 그룹에 의해 생성되기 때문이다. 이것은 일부 언어 실천들(language practice)이 온라인 커뮤니티 내에서 시간에 걸쳐 의례화되게 하여, 결과적으로 그 커뮤니티에 속하는 레벨을 마킹한다.
즉, 온라인 커뮤니티에 속하는 것은 어휘, 언어 사용영역(language register), 언어 관습들, 약칭들, 두문자어들, 통신 프로토콜들, 코드들, 구문론적 특징들, 및 멤버들에 의할 뿐만 아니라 통상적인 언어 규범들에 의해 집단적으로 인식되고, 예상되는 개념들을 공유할 때 커뮤니티를 드러낸다. 예로서, 일부 온라인 커뮤니티들은:
- 프랑스의 수도는 "에펠 타워 시티"라고 칭해지고; 팀의 리더(예를 들면, 인트라넷 상의 공동 작업 공간에서)는 "보스"라고 칭해지고, "롱 텀 에볼루션"의 표현은 "LTE"라고 칭해지고, 단어 "good morning"은 "gm"이라고 칭해지고, 상대 축구팀은 "루저들"이라고 칭해지고, 온라인 커뮤니티에 의해 구성된 게임에서의 승자 팀은 "킹"이라고 칭해진다;
- 메시지는 "모두들 안녕하세요"로 시작하고, 질문은 "미리 감사합니다" 또는 "당신의 응답들에 감사합니다"로 끝난다;
- 형식에 얽매이지 않는 T-폼들(프랑스어 또는 스페인어와 같은 언어들에서)이 이용된다.
이들 언어 실천들은 그 자체로 언어학적 타당성을 거의 가지지 않지만, 이들은 온라인 커뮤니티에 특정한 개념들, 어휘, 및 특히 의미론들에서 발견됨을 유념해야 한다. 이것은 온라인 커뮤니티의 정규 멤버들에 의해서만 공유되는 언어 문화이다. 이 경우, 이것은 하나의 생태계로 간주된다.
따라서, 온라인 커뮤니티에 대한 커뮤니티 연결은 그 커뮤니티에 특정한 언어 및 공통 코드를 채택하여 이용하는 것을 수반한다.
특정 온라인 커뮤니티에서의 새로운 멤버에 대해, 기록 통신(메시지, 주석, 코멘트, 질문, 또는 더욱 일반적으로 전자 텍스트)을 게시하는 것은 그 자구(wording)가 그 커뮤니티의 정규 멤버들에 의해 예상되는 것인 경우에만 성공적이다. 등가의 방식으로, 그 온라인 커뮤니티에 의해 이미 공개된 기록 통신은 그 새로운 멤버가 그 온라인 커뮤니티의 언어 실천을 인식(디코딩)하는 경우에만 판독시 최적으로 이해된다. 그렇지 않으면, 임의의 새로운 멤버는 그 온라인 커뮤니티에서 배척되게 느낄 것이다.
이것은 사용자가 온라인 커뮤니티에 참여할 때 사용자가 맞닥뜨리는 주요 핸디캡들 중 하나가 그 커뮤니티의 "실제(real)" 멤버가 되는데 필요한 적응 노력들임이 분명하기 때문이다. 이 적응은 특히 그 커뮤니티의 언어 거동에 비추어 기록 문자를 신속한 이해 및/또는 정확한 말로의 표현을 통해 드러난다.
새로운 멤버 - 따라서 그 커뮤니티의 어휘 및 의미론들에 아직 친밀하지 않은- 에 의해 게시된 메시지들(특히 질문들)의 온라인 커뮤니티의 멤버들에 의한 해석은 많은 시간이 걸릴 수 있고 결과적으로 그 커뮤니티의 반응성을 변경할 수 있다. 새로운 사용자(또는 새로운 멤버)는 또한 그 온라인 커뮤니티로부터 나오는 통신을 이해하는데 더 많은 시간을 필요로 할 것이다.
본 발명의 일 목적은 상술된 결함들을 개선하기 위한 것이다.
본 발명의 다른 목적은 온라인 커뮤니티의 사용자들에게 새로운 부가 가치 서비스를 제안하는 것이다.
본 발명의 다른 목적은 온라인 커뮤니티의 언어 거동과 기록 전자 통신의 컨텐트를 적응(일치)시키기 위한 것이다.
본 발명의 다른 목적은 온라인 커뮤니티의 통신 공간들의 컨텐트의 균일한 표현을 보장하는 것이다.
본 발명의 다른 목적은 회사의 네트워크 내에서 정보 공유의 효율성을 장려 및 개선하기 위한 것이다.
본 발명의 다른 목적은 새로운 멤버들의 온라인 커뮤니티로의 통합을 용이하게 하기 위한 것이다.
본 발명의 다른 목적은 언어학적 관점으로부터 온라인 커뮤니티들을 특징짓기 위한 것이다.
본 발명의 다른 목적은 온라인 커뮤니티들의 성공을 장려하기 위한 것이다.
본 발명의 다른 목적은 새로운 사용자의 가상 커뮤니티에 속하는 센스의 발생을 장려하기 위한 것이다.
본 발명의 다른 목적은 온라인 커뮤니티들 내에서 통신들의 긴급을 장려하는 사회-기술적 장치(socio-technical device)를 제안하기 위한 것이다.
본 발명의 다른 목적은 그룹 전자 통신들의 효율성을 개선하기 위한 것이다.
본 발명의 다른 목적은 온라인 커뮤니티들의 언어 거동들을 식별하기 위한 것이다.
이를 위해, 본 발명은 제 1 양태에 따라, 온라인 커뮤니티의 언어 거동에 텍스트 컨텐트를 적응시키기 위한 방법에 관한 것이고, 상기 방법은:
- 온라인 커뮤니티의 의미론상의 태그 클라우드(semantic tag cloud)의 확립 단계;
- 의미론상의 태그 클라우드에 기초하여, 텍스트 컨텐트의 적어도 하나의 개념의 적어도 하나의 의미론상의 부근을 결정하는 단계;
- 결정된 의미론상의 부근의 도움으로 텍스트 컨텐트를 재설정(reformulate)하는 단계를 포함한다.
본 발명은 제 2 양태에 따라, 온라인 커뮤니티의 언어 거동에 텍스트 컨텐트를 적응시키기 위한 디바이스에 관한 것이고, 상기 디바이스는:
- 온라인 커뮤니티의 의미론상의 태그 클라우드를 확립하도록 구성된 의미 분석기(semantic analyzer);
- 의미론상의 태그 클라우드에 기초하여, 적어도 하나의 텍스트 컨텐트 개념의 적어도 하나의 의미론상의 부근을 결정하도록 구성된 의미 근접 계산기(semantic proximity calculator);
- 결정된 의미론상의 부근을 이용하여 텍스트 컨텐트의 의미 재설정기(semantic reformulator)를 포함한다.
제 3 양태에 따라, 본 발명은 메모리 매체 상에서 구현되는 컴퓨터 프로그램 제품에 관한 것이고, 상기 컴퓨터 프로그램 제품은 컴퓨터 처리 유닛 내에서 구현될 수 있고 상기에 요약된 방법을 구현하기 위한 명령들을 포함한다.
본 발명의 다른 특징들 및 이점들은, 첨부된 도면들을 참조하여 행해지는 양호한 실시예들의 하기의 기술을 판독시 더욱 분명해지고 완전히 명확해질 것이다.
본 발명은, 온라인 커뮤니티의 언어 거동에 텍스트 컨텐트를 적응시키기 위한 방법 및 디바이스를 제공하여, 온라인 커뮤니티들의 성공을 장려하고, 그룹 전자 통신들의 효율성을 개선한다.
도 1은 특정 언어 거동에 텍스트 컨텐트의 조각을 의미론적으로 적응시키기 위한 디바이스의 모듈들을 개략적으로 도시한 도면.
도 2는 특정 언어 거동에 텍스트 컨텐트의 조각을 의미론적으로 적응시키기 위한 디바이스의 비제한적인 기능 아키텍처를 개략적으로 도시한 도면.
도 1은 온라인 커뮤니티(51)와 상호작용하도록 진행하는 사용자(20)를 도시한다. 여기서 "온라인 커뮤니티와의 상호작용(interacting with an online community)"은 그 커뮤니티의 전자 통신 공간에서 전자 텍스트 컨텐트를 게시 및/또는 판독하는 것을 나타낸다. 개략적인 예들로서, 온라인 커뮤니티(51)는:
- "Facebook
Figure 112012082495814-pct00001
", "Twitter
Figure 112012082495814-pct00002
", "MySpace
Figure 112012082495814-pct00003
", 또는 "hi5
Figure 112012082495814-pct00004
"와 같은 소셜 네트워크;
- "delicious
Figure 112012082495814-pct00005
", "youtube
Figure 112012082495814-pct00006
", "flickr
Figure 112012082495814-pct00007
", 또는 "yoolink
Figure 112012082495814-pct00008
"과 같은 폭소노미(소셜 태깅)라고도 또한 알려진 개인 인덱싱 서비스;
- www.commentcamarche.net, http://forum.hardware.fr/, 또는 http://voyageforum.com/과 같은 온라인 토론 포럼; 또는
- 공동 작업 공간과 같은 인트라넷 또는 엑스트라넷 네트워크 상의 사용자들의 그룹이다.
온라인 커뮤니티들(5) 중 하나와 사용자의 상호작용에서, 사용자(20)는 의미론상의 어댑터(10)에 의해 지원받는다.
의미론상의 어댑터(10)는 온라인 커뮤니티(51)의 언어 실천들에 관해 사용자(20)에 의해 생성된 텍스트 컨텐트의 의미론상의 투영을 하도록 구성된다. 이 의미론상의 투영은 특히, 사용자(20)가 게시하기 원하는 텍스트 컨텐트를 온라인 커뮤니티(51)의 언어 실천들에 최상으로 적응시키기 위한 것이다.
이를 위해, 의미론상의 어댑터(10)에는 의미 분석기(1), 의미 근접 계산기(2), 및 의미 재설정기(3)를 포함하는 복수의 모듈들이 장착된다.
의미 재설정기(3)는 온라인 커뮤니티(51)의 태그들(또는 키워드들)의 의미론상의 클라우드를 확립하도록 구성된다.
이를 위해, 의미 재설정기(1)는 온라인 커뮤니티(51)에 공개된 텍스트 교환들의 통상적인 분석을 한다. 이들 교환들은 일반적으로 토론 스레드들(예를 들면, 포럼에서의 단일 토론 주제, "Flickr
Figure 112014025252678-pct00009
"에서의 단일 콜렉션, 공동 작업 공간에서의 단일 프로젝트, "Facebook
Figure 112014025252678-pct00010
" 상의 친구들의 그룹에 의해 공개된 컨텐트의 조각)로 구성된다.
의미 분석기(1)에 의해 확립된 의미론상의 태그 클라우드는 온라인 커뮤니티(51)의 특징적 용어들의 의미론상의 축합(semantic condensation)이다. 이들 용어들은 그 온라인 커뮤니티(51)의 언어 실천들에서 중요성을 하이라이팅하기 위해 적어도 하나의 메트릭이 갖추어진다.
예로서, 메트릭은 그 온라인 커뮤니티(51) 내에서 이미 게시된 상호작용들에서 특정 개념을 이용하는 빈도일 수 있다. 이 경우, 각각의 개념은 이 온라인 커뮤니티(51)에서의 발생을 반영하는 가중에 의해 특징지워진다.
변형에서 또는 조합에서, 이 메트릭은 또한, 예를 들면 개념이 포함하는 정보량을 반영하는 정보 이론으로부터의 샤논 분포(Shannon distribution)와 같은 다른 특성들을 나타낼 수 있다. 이러한 방식으로, 이 의미론상의 태그 클라우드는 단지 온라인 커뮤니티(51)에서 가장 흔하게 이용되는 용어들의 리스트가 아니라, 이것의 실제의 의미론상의 축합이다. 예로서, 의미론상의 태그 클라우드는 텍스트 컨텐트뿐만 아니라 그 컨텐트 내의 의미론상의 근접들(트리 구조의 의미론상의 태그 클라우드, 3D 의미론상의 태그 클라우드)의 조각의 가장 빈번한 개념들을 동시에 반영할 수 있다.
이들 개념들은 예를 들면 다음을 관련시킬 수 있다:
- 예의의 규칙들(메시지의 도입 및 결말, 인사말 메시지들, 미리 감사);
- 약칭들;
- 언어 사용영역 및 어휘(예를 들면, 비즈니스 어휘, 공용/형식적/친숙한/인기있는/속어 사용영역);
- 준언어 인덱스들(스마일리들 또는 이모티콘들);
- 표현 구두법(대문자로 기록, 의견 또는 느낌의 강도를 전달하기 위한 동일 기호의 복사(예를 들면, 다수의 감탄 부호들));
- 상호작용들의 화용론(제 1 이름들의 이용, 형식에 얽매이지 않은 T-형식들의 이용).
유리하게, 의미론상의 태그 클라우드는 단지 이에 특정한 언어 실천들의 도움으로, 온라인 커뮤니티(51)의 복잡한 컨텐트를 요약하는 것을 가능하게 한다. 즉, 의미 분석기(1)는 거기서 흔히 실천되는 것에 기초하여 온라인 커뮤니티(51)의 의미론상의 이미지를 획득하는 것을 가능하게 한다.
온라인 커뮤니티(51)의 의미론상의 태그 클라우드는 사용자가 그 커뮤니티에서 게시/판독하기 원하는 임의의 텍스트 컨텐트와 무관하게 획득된다.
의미 근접 계산기(2)는 의미 분석기(1)에 의해 확립된 의미론상의 태그 클라우드에 기초하여, 미리 규정된 의미론상의 근접 보고들(예를 들면, 동의성, 준동의성, 또는 주관적인 논리들의 분석)에 기초하여 사용자(20)에 의해 생성되는 텍스트 컨텐트의 조각의 의미론상의 부근을 제공하도록 동작한다.
의미 근접 계산기(2)는 각각 의미론상의 태그 클라우드에서, 사용자에 의해 생성된 텍스트 컨텐트에서 식별되는 개념들 중 가장 대표적인 개념들/용어들로 구성된 의미론상의 부근들을 결정하도록 구성된다. 즉, 각각 결정된 의미론상의 부근은 사용자에 의해 생성된 텍스트 컨텐트에서 식별된 개념에 의미론적으로 근접한 복수의 개념들을 우선적으로 포함한다.
우선적으로, 의미 근접 계산기(2)는 온톨로지 메타데이터(4)(WordNet
Figure 112014025252678-pct00011
, SentiWordNet
Figure 112014025252678-pct00012
, ConceptNet
Figure 112014025252678-pct00013
의 것들과 같은) 및/또는 사용자(20)에 의해 미리 규정되거나 자동으로 생성된 어휘를 이용한다. 이러한 메타데이터(4)는 사용자에 의해 생성되는 텍스트 컨텐트에 포함되는 개념들을 식별하는데 있어서 의미 근접 계산기(2)를 지원하고, 그 각각의 의미론상의 부근들은 의미론상의 태그 클라우드에서 발견되는 것으로 간주된다.
더욱 일반적으로 말해서, 의미 근접 계산기(2)는 텍스트 컨텐트의 특정 조각에 관련된 요청에 응답하여 적어도 하나의 의미론상의 부근을 제공하는 기능이 주어지는 "의미론상의 프록시(semantic proxy)"이다.
이 의미론상의 프록시는 온라인 통신 플랫폼들, 특히 소셜 시스템들("Facebook
Figure 112012082495814-pct00014
" 또는 "Flickr
Figure 112012082495814-pct00015
"과 같은 소셜 네트워크들 및 소셜 "태깅(tagging)" 시스템들)에 이르는 온톨로지 메타데이터 또는 게이트웨이 메타데이터의 조각이다.
의미 재설정기(3)는
- 의미론상의 태그 클라우드로부터, 의미 근접 계산기(2)에 따라, 사용자(20)에 의해 생성된 컨텐트의 용어들/개념들에 의미론적으로 가장 근접한 용어들/개념들을 검색하고;
- 그에 따라, 검색된 용어들/개념들의 도움으로 사용자(20)에 의해 생성된 텍스트 컨텐트를 재설정하는 것을 가능하게 한다.
사용자(20)에 의해 생성된 컨텐트는 따라서, 의미론상의 태그 클라우드로부터 선택된 의미론상의 부근의 도움으로 적응되고, 그 후 사용자(20)에게 제시된다.
적응된 텍스트 컨텐트가 사용자(20)에 의해 거절되는 경우에, 이전 적응과 상이한 새로운 적응이 사용자에게 우선적으로 제공된다. 이를 위해, 의미 재설정기(3)는 하기의 단계들을 포함하는 의미론상의 근접의 측정을 계속함으로써 사용자(20)에 의해 생성된 컨텐트에 대해, 의미 근접 계산기(2)에 의해 결정되는 의미론상의 부근들의 개념의 계층을 조사한다:
- 사용자(20)에 의해 생성된 개념 C와 온라인 커뮤니티(51)의 의미론상의 클라우드 NS 사이의 의미론상의 거리를 평가하는 단계;
- C'C 사이의 의미론상의 거리가 최소가 되도록 개념 C의 부근에서 다른 개념 C'를 검색하는 단계;
- 개념 C를 대체할 개념 C'의 추천 단계로서, C'는 그 커뮤니티의 언어 거동에 더욱 적응되는, 상기 추천 단계.
예를 들면, (2007년
Figure 112012082495814-pct00016
에 발표된 M.Z MAALA 등에 의한"
Figure 112012082495814-pct00017
Figure 112012082495814-pct00018
")에서 의미론상의 거리를 측정하기 위한 상이한 기술들이 기술되었다. 의미론상의 관계의 정도 또는 의미론상의 유사성의 측정도 또한 이용될 수 있다.
이제 우리는 온라인 커뮤니티(51)와의 사용자 상호작용의 절차를 도시한 도 2를 참조한다.
온라인 커뮤니티(51)의 언어 거동에 텍스트 컨텐트의 조각을 의미론적으로 적응시키기 위한 절차는 다음의 방식으로 상술된 기능적 모델들을 요청한다:
- 사용자의 요청시 또는 텍스트 주석(21)을 포함하는 컨텐트의 임의의 게시 전에 자동으로, 그 주석은 온라인 커뮤니티(51)의 언어 거동에 텍스트 컨텐트를 적응시키기 위한 디바이스에 통신된다(도 2의 단계(11));
- 온톨로지 메타데이터(4)를 이용하여(도 2의 단계(12)), 의미 근접 계산기(2)는 주석(21)에서의 적어도 하나의 개념을 식별한다;
- 다시 온톨로지 메타데이터(4)를 이용하여(도 2의 단계(12)), 의미 근접 계산기(2)는 온라인 커뮤니티(51)의 의미론상의 태그 클라우드(31)에서, 텍스트 주석(21)에 식별된 각각의 개념의 적어도 하나의 의미론상의 부근을 검색한다(도 2의 단계(13));
- 의미 재설정기(3)의 도움으로, 의미 근접 계산기(2)에 따라 가장 의미론적으로 근접한 태그 클라우드 개념들(31)이 검색된 다음, 주석(21)에 제공되어, 온라인 커뮤니티(51)의 언어 거동에 적응되는 주석(22)을 유발한다. 적응된 주석(22)은 사용자(20)에 송신된다(도 2의 단계(14));
- 사용자는 주석(21)에 이루어진 변화들의 전체 또는 일부를 승인 또는 취소할 수 있다(도 2의 단계(15)).
우선적으로, 사용자(20)에 의해 생성된 오리지널 컨텐트에서 수정된 개념들은 이루어진 변화들의 식별을 용이하게 하기 위해 사용자(20)에 대해 잠깐 하이라이팅되고, 그에 의해 사용자(30)에 의해 이들 개념들(20)의 전용(appropriation)을 가속화하고, 이것은 새로운 사용자(20)에서 온라인 커뮤니티(51)에 속하는 센스의 발생을 유발한다.
타겟된 온라인 커뮤니티의 언어 거동에 적응된 텍스트 컨텐트는 사용자(20)가 무시하거나 거절할 수 있는 제안일 뿐임을 유념한다. 즉, 편집된 텍스트 컨텐트는 사용자의 명시적인 승인없이 직접 게시될 수 없다.
또한, 상술된 방법은 또한, 그 커뮤니티 통신 공간에서 텍스트 컨텐트의 식별된 조각(예를 들면 선택된)을 온라인 커뮤니티의 언어 거동에 비추어 명확히 하기 위해 이용될 수 있다. 예로서, 온라인 커뮤니티에 특정한 사전의 이용은 그 커뮤니티에 의해 공개된 텍스트 컨텐트의 조각을 그 커뮤니티와 친숙하지 않은 임의의 다른 사용자(예를 들면, 그 커뮤니티의 멤버들과 매우 상이한 연령의 사용자)에게 명확하게 하는 것을 가능하게 한다.
방금 기술된 방법은 상이한 작업 팀들 사이의 통신을 개선하고 용이하게 한다는 점에서 비즈니스 네트워크에서 특히 응용 가능하다. 이러한 방법으로 인해, 상이한 비즈니스 어휘들/문화들을 가진 비즈니스간 공동 작업 공간의 멤버들은 더욱 양호하게 상호 이해할 것이다. 이 방법은 또한 이용된 어휘를 조화롭게 하는 것(예를 들면, 동일한 약칭들, 동일한 기술적 용어들)을 가능하게 한다.
방금 기술된 방법은 특정 수의 이점들을 보여준다. 이것은 텍스트의 전자 컨텐트의 조각의 온톨로지를 타겟된 온라인 커뮤니티의 것과 제휴시키는 것을 가능하게 하고, 이것은 그 커뮤니티의 멤버들에 의해 이러한 온톨로지가 직접적으로 이해될 수 있게 한다.
이 디바이스는 웹 브라우저와 연관된 익스텐션(extension) 또는 기능의 형태로 구현될 수 있고, 그 사용은 자동 또는 사용자의 직관일 수 있다. 그 디바이스에 의해 적응된 텍스트 컨텐트는 예를 들면, 오리지널 텍스트 컨텐트의 위치와 동일한 위치에, 새로운 윈도우/탭에, 또는 팩트 버블(fact bubble)에 디스플레이될 수 있고,
- 우선적으로, 이루어진 변화들을 구별하는 것을 가능하게 하고;
- 사용자가 그 제안을 승인하거나 무시(또는 심지어 그 적응 익스텐션/기능을 디스에이블)할 수 있게 한다.
1; 의미 분석기
2; 의미 근접 계산기
3; 의미 재설정기
4; 온톨로지 메타데이터
20; 사용자
51; 온라인 커뮤니티

Claims (10)

  1. 온라인 커뮤니티의 언어 거동(language behavior)에 텍스트 컨텐트를 적응시키기 위한 방법에 있어서:
    - 상기 온라인 커뮤니티의 의미론상의 태그 클라우드(semantic tag cloud)의 확립 단계;
    - 상기 의미론상의 태그 클라우드에 기초하여, 상기 텍스트 컨텐트의 적어도 하나의 개념의 적어도 하나의 의미론상의 부근(semantic vicinity)을 결정하는 단계;
    - 상기 결정된 의미론상의 부근의 도움으로 상기 텍스트 컨텐트를 재설정(reformulate)하는 단계를 포함하는, 텍스트 컨텐트 적응 방법.
  2. 제 1 항에 있어서,
    온톨로지 메타데이터(ontology metadata)의 도움으로, 상기 텍스트 컨텐트 내에 포함된 적어도 하나의 개념을 식별하는 단계를 더 포함하는 것을 특징으로 하는, 텍스트 컨텐트 적응 방법.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 적어도 하나의 의미론상의 부근을 결정하는 단계는 미리 규정된 의미론상의 근접 보고들(semantic proximity reports)에 따라 행해지는 것을 특징으로 하는, 텍스트 컨텐트 적응 방법.
  4. 제 1 항 또는 제 2 항에 있어서,
    상기 결정된 의미론상의 부근은, 상기 텍스트 컨텐트에서 식별된 상기 개념에 의미론적으로 근접한 복수의 개념들을 포함하는 것을 특징으로 하는, 텍스트 컨텐트 적응 방법.
  5. 제 1 항 또는 제 2 항에 있어서,
    상기 텍스트 컨텐트의 재설정은 상기 텍스트 컨텐트에서 식별된 상기 개념을 대체할 결정된 의미론상의 클라우드 개념을 선택하는 단계를 포함하는 것을 특징으로 하는, 텍스트 컨텐트 적응 방법.
  6. 제 5 항에 있어서,
    상기 선택된 개념은 상기 텍스트 컨텐트에서 식별된 상기 개념에 의미론적으로 근접한 것인 것을 특징으로 하는, 텍스트 컨텐트 적응 방법.
  7. 온라인 커뮤니티의 언어 거동에 텍스트 컨텐트를 적응시키기 위한 디바이스에 있어서:
    - 상기 온라인 커뮤니티(51)의 의미론상의 태그 클라우드를 확립하도록 구성된 의미 분석기(semantic analyzer)(1);
    - 상기 의미론상의 태그 클라우드에 기초하여, 적어도 하나의 텍스트 컨텐트 개념의 적어도 하나의 의미론상의 부근을 결정하도록 구성된 의미 근접 계산기(semantic proximity calculator)(2);
    - 상기 결정된 의미론상의 부근을 이용하는 상기 텍스트 컨텐트의 의미 재설정기(semantic reformulator)(3)를 포함하는, 텍스트 컨텐트 적응 디바이스.
  8. 제 7 항에 있어서,
    상기 텍스트 컨텐트 내에 포함되는 적어도 하나의 개념을 식별하는 것을 가능하게 하는 온톨로지 메타데이터(4)를 더 포함하는 것을 특징으로 하는, 텍스트 컨텐트 적응 디바이스.
  9. 컴퓨터 프로그램 제품을 저장한 컴퓨터 판독 가능한 저장매체에 있어서,
    상기 컴퓨터 프로그램 제품은, 컴퓨터 처리 유닛 내에서 구현될 수 있고 제 1 항 또는 제 2 항에 따른 방법을 구현하기 위한 명령들을 포함하는, 컴퓨터 판독 가능한 저장매체.
  10. 제 9 항에 있어서,
    상기 컴퓨터 프로그램 제품은 웹 브라우저와 연관된 익스텐션(extension)인 것을 특징으로 하는, 컴퓨터 판독 가능한 저장매체.
KR1020127026562A 2010-04-27 2011-04-14 온라인 커뮤니티의 언어 거동에 텍스트 컨텐트를 적응시키기 위한 방법 및 시스템 KR101415634B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR1001793A FR2959333B1 (fr) 2010-04-27 2010-04-27 Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne
FR1001793 2010-04-27
PCT/EP2011/055968 WO2011134804A1 (fr) 2010-04-27 2011-04-14 Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne

Publications (2)

Publication Number Publication Date
KR20120139791A KR20120139791A (ko) 2012-12-27
KR101415634B1 true KR101415634B1 (ko) 2014-07-09

Family

ID=43125621

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127026562A KR101415634B1 (ko) 2010-04-27 2011-04-14 온라인 커뮤니티의 언어 거동에 텍스트 컨텐트를 적응시키기 위한 방법 및 시스템

Country Status (7)

Country Link
US (1) US20130096910A1 (ko)
EP (1) EP2564362A1 (ko)
JP (1) JP5940056B2 (ko)
KR (1) KR101415634B1 (ko)
CN (1) CN102844775A (ko)
FR (1) FR2959333B1 (ko)
WO (1) WO2011134804A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9959340B2 (en) * 2012-06-29 2018-05-01 Microsoft Technology Licensing, Llc Semantic lexicon-based input method editor
US10289727B2 (en) 2015-09-17 2019-05-14 International Business Machines Corporation Incorporation of semantic attributes within social media
US10878473B1 (en) * 2017-11-16 2020-12-29 Amazon Technologies, Inc. Content modification
US11010179B2 (en) * 2018-04-20 2021-05-18 Facebook, Inc. Aggregating semantic information for improved understanding of users
CN108664998A (zh) * 2018-04-27 2018-10-16 上海爱优威软件开发有限公司 一种释义加强的图片训练方法及系统
US11176322B2 (en) * 2018-05-22 2021-11-16 International Business Machines Corporation Predicting if a message will be understood by recipients

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008021512A2 (en) * 2006-08-17 2008-02-21 Neustar, Inc. System and method for handling jargon in communication systems
JP2008522332A (ja) 2004-12-01 2008-06-26 ホワイトスモーク,インク. 自動的に文書を拡充するシステムおよび方法
JP2009043288A (ja) 2008-11-10 2009-02-26 Japan Science & Technology Agency コミュニティ依存型情報検索システム及び方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09245038A (ja) * 1996-03-07 1997-09-19 Just Syst Corp 文章作成装置
US6161083A (en) * 1996-05-02 2000-12-12 Sony Corporation Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation
EP0914637B1 (en) * 1996-07-03 2001-10-17 Sopheon N.V. Document producing support system
AU2001275845A1 (en) * 2000-06-26 2002-01-08 Onerealm Inc. Method and apparatus for normalizing and converting structured content
US20040044517A1 (en) * 2002-08-30 2004-03-04 Robert Palmquist Translation system
EP1588283A2 (en) * 2002-11-22 2005-10-26 Transclick, Inc. System and method for language translation via remote devices
US8155951B2 (en) * 2003-06-12 2012-04-10 Patrick William Jamieson Process for constructing a semantic knowledge base using a document corpus
US20060020447A1 (en) * 2004-07-26 2006-01-26 Cousineau Leo E Ontology based method for data capture and knowledge representation
US7860873B2 (en) * 2004-07-30 2010-12-28 International Business Machines Corporation System and method for automatic terminology discovery
US7653528B2 (en) * 2005-03-08 2010-01-26 Microsoft Corporation Resource authoring incorporating ontology
US7702665B2 (en) * 2005-06-14 2010-04-20 Colloquis, Inc. Methods and apparatus for evaluating semantic proximity
US7664629B2 (en) * 2005-07-19 2010-02-16 Xerox Corporation Second language writing advisor
CN100349161C (zh) * 2005-07-29 2007-11-14 中国科学院声学研究所 一种用于句子分析中动词歧义结构消解的语义分析方法
US20080040094A1 (en) * 2006-08-08 2008-02-14 Employease, Inc. Proxy For Real Time Translation of Source Objects Between A Server And A Client
US7640233B2 (en) * 2006-08-29 2009-12-29 International Business Machines Corporation Resolution of abbreviated text in an electronic communications system
US8145473B2 (en) * 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
US9275036B2 (en) * 2006-12-21 2016-03-01 International Business Machines Corporation System and method for adaptive spell checking
US7869987B2 (en) * 2007-12-03 2011-01-11 International Business Machines Corporation Methods involving translating text emphasis
US20100030551A1 (en) * 2008-07-31 2010-02-04 Ark Wendy S Jargon translation in an instant messaging environment
US8359191B2 (en) * 2008-08-01 2013-01-22 International Business Machines Corporation Deriving ontology based on linguistics and community tag clouds
US9009022B2 (en) * 2010-03-30 2015-04-14 Young Hee Yi E-book reader language mapping system and method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008522332A (ja) 2004-12-01 2008-06-26 ホワイトスモーク,インク. 自動的に文書を拡充するシステムおよび方法
WO2008021512A2 (en) * 2006-08-17 2008-02-21 Neustar, Inc. System and method for handling jargon in communication systems
JP2009043288A (ja) 2008-11-10 2009-02-26 Japan Science & Technology Agency コミュニティ依存型情報検索システム及び方法

Also Published As

Publication number Publication date
WO2011134804A1 (fr) 2011-11-03
EP2564362A1 (fr) 2013-03-06
FR2959333B1 (fr) 2014-05-23
US20130096910A1 (en) 2013-04-18
KR20120139791A (ko) 2012-12-27
CN102844775A (zh) 2012-12-26
FR2959333A1 (fr) 2011-10-28
JP5940056B2 (ja) 2016-06-29
JP2013530437A (ja) 2013-07-25

Similar Documents

Publication Publication Date Title
Khan et al. Multi-class sentiment analysis of urdu text using multilingual BERT
Li et al. Question identification on twitter
US8612469B2 (en) Network-accessible collaborative annotation tool
US11080346B2 (en) System and method for automated responses to information needs on websites
JP2019504413A (ja) 絵文字を提案するためのシステムおよび方法
KR101415634B1 (ko) 온라인 커뮤니티의 언어 거동에 텍스트 컨텐트를 적응시키기 위한 방법 및 시스템
US9710829B1 (en) Methods, systems, and articles of manufacture for analyzing social media with trained intelligent systems to enhance direct marketing opportunities
Cvijikj et al. Understanding the user generated content and interactions on a Facebook brand page
Verheijen et al. Collecting Facebook posts and WhatsApp chats: corpus compilation of private social media messages
Benamara et al. Introduction to the special issue on language in social media: exploiting discourse and other contextual information
Mangal et al. Analysis of users’ interest based on tweets
Sun et al. Linguistic studies on social media: A bibliometric analysis
KR101007284B1 (ko) 인터넷을 이용한 의견 검색 시스템 및 그 방법
Saif et al. Sentiment analysis in social streams
Balali et al. A supervised approach to predict the hierarchical structure of conversation threads for comments
Ugheoke et al. Detecting the gender of a tweet sender
Firouzjaei et al. Effect of readability of political tweets on positive user engagement
Patro et al. Is this word borrowed? An automatic approach to quantify the likeliness of borrowing in social media
Cardoso et al. Aspect Based Sentiment Analysis Annotation Methodology for Group Decision Making Problems: An Insight on the Baseball Domain
Lou et al. Research on micro-blog sentiment analysis
Gitau An approach for using twitter to perform sentiment analysis in Kenya
Kershaw Language change and evolution in online social networks
TWI643080B (zh) 能對網路資料進行解析並據以模擬特定對象之方法
Guo Understanding Interaction and Persuasion in Online Argumentative Discussions
Alsaedi et al. FB-SEC-1: A Social Emotion Cause Dataset

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170623

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20190530

Year of fee payment: 6