KR100918599B1 - 잠재적 수신자를 식별하는 방법 및 장치 - Google Patents

잠재적 수신자를 식별하는 방법 및 장치 Download PDF

Info

Publication number
KR100918599B1
KR100918599B1 KR1020080095559A KR20080095559A KR100918599B1 KR 100918599 B1 KR100918599 B1 KR 100918599B1 KR 1020080095559 A KR1020080095559 A KR 1020080095559A KR 20080095559 A KR20080095559 A KR 20080095559A KR 100918599 B1 KR100918599 B1 KR 100918599B1
Authority
KR
South Korea
Prior art keywords
message
recipient
knowledge
recipients
user
Prior art date
Application number
KR1020080095559A
Other languages
English (en)
Other versions
KR20080093954A (ko
Inventor
미쿠엘 마르틴
에르뇌 코박스
Original Assignee
닛본 덴끼 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 닛본 덴끼 가부시끼가이샤 filed Critical 닛본 덴끼 가부시끼가이샤
Publication of KR20080093954A publication Critical patent/KR20080093954A/ko
Application granted granted Critical
Publication of KR100918599B1 publication Critical patent/KR100918599B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/48Message addressing, e.g. address format or anonymous messages, aliases
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computer Hardware Design (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Primary Health Care (AREA)
  • Information Transfer Between Computers (AREA)
  • Telephonic Communication Services (AREA)

Abstract

텍스트 메시지를 포함하고 전자 형태인 메시지의 잠재적 수신자를 식별하는 방법은 -가능한 간단한 사용성과 사용자 친숙성을 고려해서-설계되고 메시지의 내용이 텍스트 분석을 거치고 텍스트 분석에 기초해서 잠재적 수신자 또는 잠재적 수신자의 그룹이 수신자 목록으로부터 식별되는 방식으로 더 개발된다.
텍스트 메시지, 잠재적 수신자, 텍스트 분석, 수신자 목록

Description

잠재적 수신자를 식별하는 방법 및 장치{METHOD AND APPARATUS FOR IDENTIFYING POTENTIAL RECIPIENTS}
본 발명은 메시지의 잠재적 수신자를 식별하는 방법에 관한 것으로, 메시지는 기본적으로 텍스트 메시지를 포함하고, 메시지는 전자 형태이다.
문자 메시지는 인간의 의사소통에 일반적이고 중요한 도구이다. 서신 형태의 인쇄된 메시지, 팩스 또는 유사한 메시지 이외에, 전자 형태의 메시지가 수적으로 증가해왔다. 몇몇 예를 들면, 전자 메일 (e-mail), SMS (short message service), 인스턴트 메시징 또는 인터넷의 공개토론 등을 들 수 있다. 모든 메시지는 작성자에 의해 생성되고 1명 이상의 수신자에게 전달된다. 전송을 위해서, 수신자(들) 각각의 올바른 식별자가 필요하다. 이메일에 대해서, 올바른 이메일 주소를 삽입해야하고, SMS에 대해서는 그에 대응하는 전화 번호를 삽입해야 한다.
각각의 식별자의 삽입을 간소화하기 위해서, 전화번호부 및/또는 주소록을 일반적으로 소유한다. 여기서, 식별자는 리스트, 데이터베이스 또는 유사한 수단에 일단 입력된다. 저장된 정보를 복구할 때, 요청된 엔트리만 전화/주소록 으로부터 선택되어야 한다. 전화/주소록에 많은 엔트리가 있다면, 올바른 수신자 식별자를 찾는 것은 시간을 많이 소비할 수 있다.
이러한 이유로, 많은 현재의 이용가능한 이메일 프로그램은 이메일 주소의 자동 완성을 제공한다. 사용자는 주소란에 이메일의 첫 글자를 입력해야 하고, 프로그램으로부터 그 글자의 표시된 시리즈로 시작하는 주소 제시를 수신한다. 여기서 문제는 사용자가 각각의 주소를 매우 정확히 알아야 한다는 것이다.
이메일 주소가 생성되는 상이한 전략에 기인해서, 이것이 어려워질 수 있다. 또한, 만약, 그러한 특정한 이메일 주소가 사용자에 의해 거의 사용되지 않는다면, 사용자는 그 주소를 기억하지 않을 것이기 때문에 이 자동 완성은 특히 쓸모없는 것이 된다. 또한, 그러한 자동 완성은 표시된 엔트리가 예상 엔트리와 유사하다면 사용자가 단어를 간과하는 경향이 있으므로 에러가 나기 쉽다. 만약 급하다면, 이메일이 잘못된 수신자에게 의도하지 않게 전송될 수 있다.
따라서, 본 발명은 가능한 쉽게 이용가능하고, 사용자에게 친숙하며 하나 이상의 수신자를 선택할 때 에러를 검출할 수 있는 잠재적 수신자의 식별을 위한 상술한 종류의 방법을 디자인하고 또한 개발하기 위한 태스크에 기초한다.
본 발명에 따르면, 상술한 태스크는 청구항 1의 특징을 나타내는 방법에 의해 해결된다. 이에 따르면, 이 방법은 메시지의 내용이 텍스트 분석을 거치고, 텍스트 분석의 결과에 기초해서 잠재적 수신자 또는 잠재적 수신자의 그룹이 수신자 목록으로부터 식별되는 것을 특징으로 한다.
본 발명에 따르면, 우선 모든 메시지는 그 스타일과 주제가 각각의 수신자에 따라 변하며 이 정보는 잠재적 수신자를 식별할 때 고려될 수 있다는 것을 식별하였다. 상업 통신은 더 형식적인 스타일이기 쉬우며, 업무상 구체적인 내용을 언급할 수도 있다. 또한, 사업 파트너를 대응 어드레싱하는 것은 동료에게 보내는 메시지보다 더 형식적일 것이다. 그러한 차이점은 또한 사생활에도 존재한다.
본 발명에 따르면, 이 정보는 잠재적 수신자를 식별하는데 고려될 수 있음을 인식하였다. 그렇게 하면, 메시지의 내용을 텍스트 분석하고 텍스트 분석의 결과는 하나 이상의 잠재적 수신자를 식별하는데 사용된다. 이를 위해서, 수신자 또는 수신자의 그룹은 수신자 목록으로부터 대응되어 선택된다.
수신자의 목록은 여기서 포괄적인 용어로 이해되어야 한다. 목록은 개별 접촉 정보의 목록에만 관련될 수 있지만, 전화번호부, 주소록, 주소 데이터 뱅크 또는 다른 접촉 식별자를 저장하는 수단에 관련될 수 있다. 동일한 방식으로, 용어 "주소" 또는 "식별자"는 수신자를 명확하게 식별하기 쉬운 임의의 가능성을 언급한다. 이는 예를 들면, 전화 번호, 이동전화 번호, 이메일 주소, 인터넷 공개토론의 식별자, 인스턴트 메시징 식별자 등을 포함할 수 있다.
유리한 방식으로, 텍스트 분석은 개별 특징을 추출한다. 특징은 여기서 메시지의 특성의 많은 다양성을 지칭한다. 이런 의미에서, 구체적 단어의 출현을 검색할 수 있다. 메시지가 예를 들어, 미팅에 관한 언급을 포함한다면, 이것은 사업 내용의 메시지를 강하게 표시한다. 또한, 만약, 더욱 비형식적인 스타일이 사용된다면, 동료와의 미팅에 대한 언급일 가능성이 크다. 또한, 특정한 인사말이나 맺음 구문이 검색될 수도 있다. 대응하는 수신자를 특징짓는 다른 특성 또한 특징으로 사용될 수 있다. 예를 들면, 문장의 최대 또는 평균 길이를 체크할 수 있다.
사생활에서, 일반적으로 짧은 문장은 사업상에서보다 형식화될 것이다. 또한, 예를 들면, 최대 또는 평균 단어 길이, 서명의 사용, 워드 래핑 (word-wrapping) 의 수 또는 다른 특징이 중요할 수 있다.
모든 특징은 메시지의 대응하는 작성자에 의존할 수 있다. 각각의 사용자는 메시지를 쓸 때 특정한 승인된 규정을 만족시킬 것이지만, 작성자는 특정한 개인적 특성 또한 나타낼 것이다. 따라서, 일반적으로 사용되는 특징 외에, 텍 스트 분석은 사용자의 특정한 특징을 언급할 수 있다.
분석된 메시지로부터 추출된 이들 특징은 잠재적 수신자의 특징과 비교되고 결합될 수 있다. 그렇게 함으로써, 분류가 수행될 수 있고, 최적의 경우에, 분석된 메시지의 수신자일 가능성이 가장 높은 수신자가 식별될 수 있다. 특징의 추출 및/또는 분류는 다수의 분석 알고리즘 또는 분류 알고리즘에 의해 수행될 수 있다.
바람직하게, 기계-학습 알고리즘이 적용된다. 이 방법을 한정하지 않는 예를 하나 들면, 신경 회로망의 사용, SVM (Support Vector Machine), MFU (최대 사용 빈도수) 알고리즘 또는 베이시안 (Bayesian) 분류자 등을 언급할 수 있다. 예를 들면, 하기 참조:
(1) O. De Vel, A. Anderson, M. Corney, 및 G. Mohay "Mining Email Content for Author Identification Forensics" SIGMOD Record, Vol. 30, No. 4, pp. 55-64, 2001년 12월;
(2) Paul Graham, "A Plan for Spam" (http://www.paulgraham.com/spam.html
), 2002년 8월;
(3) Bryan Klimt, Yiming Yang, "Introducing the Enron Corpus" First Conference on Email and Anti-Spam (CEAS), Proceedings 2004년 7월;
(4) I. Rish, "An emperical study of the Naive Bayes classifier" 17th International Joint Conference on Artificial Inteligence, 2001년 8월; 및
(5) R. B. Segal, J.O. Kephart "MailCat: An Intelligent Assistant for Organizing E-Mail" Proceedings of the National Conference on Artificial Intelligence, 1999.
이용가능한 컴퓨팅 전력에 따라, 추출할 특징의 수, 식별된 잠재적 수신자의 요구되는 정확도 또는 대응하는 적절한 알고리즘의 다른 종속 조건이 선택될 수 있다. 운영 상황에 따라 변경될 수 있는 몇몇 알고리즘의 애플리케이션이 계획될 수도 있다.
베이시안 분류자를 사용할 때, 더 양호한 계산가능성의 이유로 단순 베이시안 분류자를 사용하는 것이 현명하다. 정통 베이시안 분류자와 반대로, 단순 베이시안 분류자의 경우 개별 특징이 서로 의존적인 것으로 간주되지 않고, 베이시안 분류자의 계산 포뮬러에서 조건부 확률에 기인한 팩트 (fact) 는 대응하는 특징에만 의존해서 개별 조건부 확률로 나누어진다. 이 가정이 현실에 거의 적용되지 않더라도, 실용적인 단순 베이시안 분류자는 종종 좋은 결과를 달성한다. 개별 특징이 상관관계가 낮을 때 그렇다. 또한, 메시지를 고려할 때, 개별 텍스트 특징은 서로 완전히 독립적이지 않을 것이다. 하지만, 특징들은 충분히 상관도가 낮아서 단순 베이시안 분류자의 애플리케이션을 정당화한다.
공지된 분석 및/또는 분류 알고리즘은 그것들이 이미 수행되고 바람직하게 증명된 메시지와 수신자의 상호 상관관계로부터의 결과인 지식을 언급한다는 공통점을 갖는다. 바람직하게, 이 지식은 트레이닝에 의해 발생한다. 이를 위해, 사용자에 의해 작성된 개별 메시지는 텍스트를 분석하고, 그것을 사용자가 수동으로 선택한 수신자에 일치시킴으로써 트레이닝을 위해 사용된다.
트레이닝 자체는 분류의 좋은 결과를 달성하기 위해 상당히 많은 메시지를 필요로 하기 때문에, 시스템은 사용자에 의해 이미 작성된 메시지로 트레이닝될 수 있으며, 따라서 수신자 목록의 하나 이상의 수신자와 상관될 수도 있다. 새로이 작성된 메시지의 사용 때문에, 지식은 계속 증가하고, 그 결과 그러한 지식에 기초한 분석 및/또는 분류는 더 좋은 결과를 제공하고, 사용자의 변화 습관에 적응한다.
특히, 수신자를 향한 가능한 커뮤니케이션 행동 변경에 대해서, 더 최근의 지식이 오래된 지식보다 중요할 수 있다. 예를 들면, 사업 파트너와 더 개인적인 관계가 구축될 수 있으며, 그것은 메시지의 더 비형식적인 구조의 결과를 낳을 수 있다. 이에 의해, 사용자의 변화된 행동이 평가될 수 있다. 최근의 지식은 잠재적 수신자의 식별에 대한 더 강한 영향력을 갖는다. 최근의 지식은 지식을 사용하기 이전의 소정 기간 동안 형성된 (built up) 지식이고 오래된 지식은 소정 기간 이전에 형성된 지식일 수 있다. 소정 기간이란, 예를 들어, 10 분, 1 주일, 또는 1 년이 될 수도 있으며, 본 발명의 실시형태에 따라서 당업자에 의해 용이하게 결정될 수 있다.
지식을 구축할 때 노력을 더 감소하기 위해서, 메시지의 거의 모든 작성자에게 존재하는 상이한 특징이 기본 지식과 통합될 수 있다. 그러한 기본 지식은 프리-트레이닝으로 사용되거나 러닝 시스템에 직접 삽입될 수 있다.
본 발명에 따른 방법의 제 1 사용의 효율성을 더 증가시키기 위해서, 사용자는 수신자 목록에 수신자를 삽입할 때 수신자에 대해서 상세사항을 더 제공하게 할 수 있다. 이는 예를 들면, 각각의 수신자의 범주화 (사업, 동료, 개인, 친구, 가족 등) 를 포함할 수 있다. 또한, 사용자는 유사한 방법으로 수신자의 목록에 기존 엔트리를 분류하도록 요청될 수 있다. 그렇게 함으로써, 제 1 선택은 메시지의 단순 분석에 의해 수행될 수 있고, 많은 수신자가 매우 초기 단계에서 제외될 수 있다.
이에 의해, 메시지의 가장 가능성 있는 수신자가 식별될 수 있다. 한편, 분석된 메시지의 수신자일 가능성이 매우 낮은 수신자가 식별될 수 있다.
이 방법으로 식별된 수신자는 표시되어 사용자에게 제시될 수 있다. 제시된 수신자는 그 확률에 따라 정렬되고 표시될 수 있다. 부적절한 수신자는 리스트로부터 제외될 수 있다.
이것은 메시지의 수신자를 삽입할 때 삽입의 보정이 체크되는 방식으로 사용될 수 있다. 텍스트 분석은 메시지가 표시된 수신자에게 실제로 어드레스되는 가능성을 결정할 수 있다. 한편, 사용자에 의해 표시된 수신자는 식별된 수신자와 비교될 수 있다. 이 방법으로, 올바른 수신자가 표시될 확률을 결정할 수 있다. 확률이 너무 낮다면, 사용자가 두 경우 모두에서 적절한 방법을 공지받을 수 있거나, 수신자가 더 큰 가능성을 갖는 수신자로 교체될 수 있다.
실시형태의 다른 예에 대해서, 식별된 수신자는 수신자의 접촉 데이터의 자동 완성을 위해 사용될 수 있다. 사용자가 메시지를 작성하고 접촉 데이터를 삽입한 후, 메시지의 수신자일 가능성이 가장 높고, 사용자에 의해 표시된 캐릭터의 조합으로 시작할 가능성이 있는 수신자가 제시될 수 있다. 이에 의해 자동 완성에 의한 수신자의 삽입에 의해 잘못된 수신자에게 메시지를 전송하는 것을 효율적으로 피할 수 있다.
본 발명의 다른 실시형태에서, 메시지를 작성한 후, 사용자에게 모든 잠재적 수신자를 포함하는 수신자의 그룹에 대해 표시할 수 있다.
사용자는 텍스트로부터 추출된 특징이 수신자의 특징과 일치해야 한다는 정도를 나타내는 임계치를 정의할 수 있다. 이 임계치보다 높은 일치도를 갖는 모든 수신자들은 수신자의 그룹의 잠재적 멤버로서 표시될 수 있다. 이렇게 함으로써, 수신자를 사용자가 초기에 망각했을 수도 있는 그룹에 통합시킬 수 있다.
이 발명의 다른 실시형태에서, 시스템은 동일한 토픽에 대한 메시지를 계속 수신하는 사용자들을 간단히 모니터할 수 있고, 한 세트의 개인들이 하나의 토픽 그룹이라고 결론짓는다. 이 정보는 사용자 또는 다른 애플리케이션에 이용가능하도록 만들 수 있으며, 작업 그룹에 대한 정보를 사용하는 더 좋은 사용자 애플리케이션 등에 필요한 임의의 방식으로 사용할 수 있다.
실시형태의 다른 예에서, 본 발명에 따른 방법은 인터넷 공개토론 또는 많은 수의 메시지가 처리되어야 하는 다른 환경의 콘텍스트에서 적용될 수 있다. 서버에서 들어오는 메시지는 그 내용을 간주해서 분석될 수 있다. 분석의 결과에 기초해서, 유사한 메시지를 자주 검색하는 수신자를 식별할 수 있다. 따라서 이들 메시지는 그들의 사용자에 대해 흥미가 있기 때문에 언급될 수 있다. 바람직한 내용에 대한 지식은 계속해서 업데이트될 수 있다.
실시형태의 모든 예에서, 사용자는 식별된 수신자로부터 개별 식별자를 의도 적으로 삭제할 수 있다. 인터넷 공개토론 또는 유사한 환경의 콘텍스트에서, 고유의 수신자 식별자가 식별된 수신자로부터 삭제될 수 있다. 그렇게 삭제함으로써, 분석 및/또는 분류를 수행하기 위한 지식을 동시에 업데이트할 수 있다.
이하, 본 발명의 교시를 유리한 방식으로 디자인하고 또한 개발하는 방법의 몇몇 옵션을 하기한다. 이러한 목적으로, 한편으로는 청구항 1의 종속항을 참조해야 하며, 다른 한편으로는 도면과 함께 본 발명의 방법의 실시형태의 바람직한 실시예의 하기 설명을 참조해야 한다.
실시형태의 바람직한 실시예와 도면의 설명과 함께, 본 교시에 대한 일반적으로 바람직한 디자인의 개발도 설명한다.
본 발명에 따른 잠재적 수신자의 식별 방법은 가능한 쉽게 이용가능하고, 사용자에게 친숙하며 하나 이상의 수신자를 선택할 때 에러를 검출할 수 있다.
도 1은 본 발명에 따른 방법의 구현의 플로우차트를 도시한다. 개별 프로세스들은 일반적으로 특징의 추출 및/또는 분류를 수행하기 위해 적용된 알고리즘으로부터 독립적이다. 먼저, 사용자는 단계 1에서 메시지를 생성한다. 메시지의 내용은 단계 2에서 분석되고 이어서 단계 3에서, 분석의 결과가 분류 알고리즘에 제공된다. 마지막으로, 단계 4에서 제시된 수신자 중 하나를 선택하거나 제시에 포함되지 않은 수신자를 교체하는 사용자에 대한 제시가 생성된다. 그러한 방식으로 수행되는 분석된 메시지와 사용자의 상관관계는 분류에 필요한 지식을 업데이트하는데 사용된다. 이를 위해, 단계 5에서 지식의 업데이트가 시작된다. 추출된 특징과 선택된 수신자 사이의 접속이 성립되고 대응하는 수신자에 대해 수집한 정보와 결합된다. 그 후, 메시지가 추가로 단계 6에서 대기된다.
도 2a 및 도 2b는 베이시안 분류자로부터 유도될 수 있는 단순 베이시안 분류자와 함께 본 발명에 따른 방법을 사용한 2개의 플로우차트를 도시한다. 베이시안 분류자는 원칙적으로 조건부 확률과 관계된 베이시안 정리에 기초한다. 주어진 예에서 확률은 메시지 Mi가 수신자 Rj에게 어드레스되는 확률과 함께 계산될 수 있다. 이 확률은 특징 Ta, Tb, Tc, ....가 메시지 Mi에서 발생하기 때문에 조건부이다. 따라서 조건부 확률은 다음 식에 의해 계산된다:
Figure 112008068386520-pat00001
P(Ta, Tb, Tc, ...│Mi⊂Rj)는 특징 Ta, Tb, Tc,...가 수신자 Rj에 어드레스된 메시지에 포함된 확률을 계산한다. 일반적으로, 특징들 Ta, Tb, Tc, ... 사이에 의존성이 있다. 단순 베이시안 분류자의 경우, 개별특징이 메시지에 서로 독립적으로 존재할 수 있다고 가정된다. 조건부 확률 P(Ta, Tb, Tc, ...│Mi⊂Rj)은 개별 특징에 대한 조건부 확률의 곱으로 대체될 수 있다. 상기 식에서 분모 P(Ta, Tb, Tc, ...) 가 수신자와 독립적이기 때문에, 이 부분은 수신자 Rj에 대한 메 시지 Mi의 관계를 결정할 경우 무시될 수 있다. 따라서, 하기 부분이 계산되어야 한다:
Figure 112008068386520-pat00002
개별 팩터들은 메시지 Mi에서 수신자 Rj에 대한 개별 특징들 Ta, Tb, Tc, ...이 존재하는 확률이다.
도 2a는 이 단순 베이시안 분류자의 애플리케이션에 대한 본 발명에 따른 방법의 구현을 도시한다. 여기서, 이 방법의 애플리케이션에 대한 일반적인 프로세스가 플로우차트에 도시된다. 우선, 사용자는 메시지를 생성한다 (단계 7). 그 후, 메시지의 특징이 단계 8의 분석 알고리즘에 의해 추출된다. 특징들 Ta, Tb, Tc, ...이 잘 선택된다면, 특징들 중 적어도 일부는 메시지에 포함될 것이다.
이하, 잠재적 수신자의 목록에 저장된 개별 수신자가 개별 특징들의 관계에 대해 분석되고 이에 기초해서 수신자에 대한 메시지의 관계가 계산된다. 단계 9에서, 수신자 목록에 체크되지 않은 수신자가 포함되어 있는지를 우선 체크한다. 체크되지 않은 수신자가 포함되어 있다면, 단계 10에서 특징들의 관계에 대한 데이터가 검색되고 단계 11에서 단순 베이시안 분류자에 제공된다. 그 다음, 단계 9가 계속된다. 수신자 목록의 모든 수신자가 처리되었을 때에만, 루프가 남고 단계 12에서 사용자에 대한 제시가 생성된다. 이 제시는 분석 및 분류에 따른 수신자로 간주되어야 하는 하나 이상의 잠재적 수신자를 나타낸다.
마지막으로, 계산된 모든 데이터가 지식을 확장하는데 사용되고 특징들과 상관 수신자(들)의 조합이 기존의 지식과 결합된다 (단계 13). 그 후, 추가 메시지가 처리될 수 있다 (단계 14). 도 2b는 트레이닝 과정을 수행하기 위한 플로우차트를 도시한다. 이 과정은 지식의 업데이트 뿐만 아니라 지식의 1차 형성 (built up) 에 적용될 수 있다. 단계 15에서, 메시지가 수용된다. 단계 16과 함께, 수신자 목록이 이미 메시지의 수신자를 포함하고 있는지 여부 및 그에 따라 수신자가 공지되어 있는지를 체크한다. 수신자가 공지되지 않았다면, 새로운 엔트리가 생성된다 (단계 17). 양자의 경우 (수신자가 공지된 경우 및 수신자가 공지되지 않은 경우) 모두 수신자에게 전송된 메시지에 대한 카운터는 이후에 증가한다 (단계 18). 이하, 메시지에 포함된 개별 특징들이 처리되고 수신자와 관련해서 범주화된다. 이를 위해, 단계 19는 먼저 처리되지 않은 특징이 아직 남아있는지 여부를 체크한다. 만약, 처리되지 않은 특징이 남아있다면, 처리되지 않은 특징을 단계 20에서 수신자에 추가하고 처리를 단계 19와 함께 계속한다. 모든 특징들을 이런식으로 처리한 후, 루프가 남는다. 그 후, 프로그램 플로우가 종료되고 추가로 메시지가 처리될 수 있다.
하나의 가능한 예를 하기한다: 사용자가 다음의 메시지를 타이핑할 경우:
"John 에게, 나는 다음주 월요일 우리의 품질 제어 테스트에 대해 요청된 리포트를 첨부합니다. 나는 당신을 테스팅 시설에서 직접 만날 것입니다. 그럼 이만, Andrew".
텍스트 분석은 단어들 "John", "품질", "제어" 및 "만나다" 를 검색하고 (분 류를 통해) John@foo.com을 가능한 수신자로서 제시할 수 있으며, 그 이유는 사용자 (Andrew) 가 보통 John과 품질 제어 주제에 대해서 논의하기 때문이다. 마찬가지로, 메시지의 형식, 단어 "만나다"와 평일의 언급인 "월요일"은 Andrew의 상사 또는 그의 비서에게 제안된 수신자를 제안할 수 있다.
도 3에 도시한 바와 같이, 정보 처리 장치에는 사용자가 메시지 입력, 잠재적 수신자의 선택 또는 교체 등을 수행할 수 있는 입력 섹션 (102) 을 통해 메시지의 텍스트를 제공하는 메시징 툴 (101) 이 제공된다. 장치가 수신자를 예측할 뿐만 아니라, 사용자 입력에 기초해서 보정 또는 제시를 한다면, 메시징 툴 (101) 은 사용자에 의해 전송된 임시 수신자 목록을 제공할 수도 있다. 그 후 입력 메시지는 선택된 수신자와 관련해서 메시지 특징의 출현의 빈도를 저장하는 텍스트 분석 모듈 (103) 로 패스되어 빈도표 (104) 로 입력된다. 분류는 그 후 잠재적 수신자 목록을 생성하는 분류자 (105) 에 의해 수행되고, 결과 통보자 (106) 를 통해서 메시징 툴 (101) 로 전송된다. 사용자가 잠재적 수신자를 선택하거나 교체함으로써, 빈도표 (104) 가 업데이트된다. 베이시안 분류자 이외의 메커니즘을 사용하는 경우, 메시지 순서가 상이할 수 있으며, 몇몇 블록이 상이하게 구현되거나, 제거되거나 또는 새로운 블록이 추가될 수 있다.
마지막으로, 상술한 실시형태의 완전히 임의로 선택된 예는 본 발명에 따른 교시의 예를 들 뿐, 본 실시형태의 주어진 예의 후자를 제한하는 것은 아니라는 것을 특히 주의해야 한다.
도 1은 본 발명에 따른 방법의 구현을 나타내는 플로우차트.
도 2a는 단순 베이시안 분류자와 함께 본 발명에 따른 방법의 구현을 위한 애플리케이션을 나타내는 플로우차트.
도 2b는 단순 베이시안 분류자와 함께 본 발명에 따른 방법의 구현을 위한 트레이닝을 나타내는 플로우차트.
도 3은 본 발명에 따른 방법이 구현되는 정보 처리 장치를 도시한 블록도.
*도면의 주요 부호에 대한 설명*
101: 메시징 툴 102: 입력 섹션
103: 텍스트 분석 모듈 104: 빈도표
105: 분류자 106: 결과 통보자

Claims (1)

  1. 정보 처리 장치에 의해 수행되는, 메시지의 잠재적 수신자를 식별하는 방법으로서,
    상기 메시지는 기본적으로 텍스트 메시지를 포함하고,
    상기 메시지는 전자 형태이며,
    상기 메시지의 내용은 텍스트 분석되고,
    상기 텍스트 분석의 결과에 기초해서 잠재적 수신자 또는 잠재적 수신자의 그룹이 수신자 목록으로부터 식별되고,
    상기 텍스트 분석에서의 상기 메시지의 분석 및/또는 분류를 위해서, 이전까지 수행된 잠재적 수신자 식별에서 메시지 전송자에 의해 결정된 수신자의 선택, 삽입 또는 제거로부터 형성된, 메시지와 상기 수신자 목록의 수신자들 사이의 상관관계에 대한 지식이 사용되며,
    상기 잠재적 수신자를 식별하기 위한 상기 지식에의 반영비율에 있어서, 최근의 지식이 오래된 지식보다 큰 가중치를 가지고,
    상기 최근의 지식은 상기 지식의 사용 이전의 소정 기간 동안에 형성된 (built up) 것이고, 상기 오래된 지식은 상기 소정 기간 이전에 형성된 지식인, 잠재적 수신자 식별 방법.
KR1020080095559A 2005-12-05 2008-09-29 잠재적 수신자를 식별하는 방법 및 장치 KR100918599B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102005058110.2A DE102005058110B4 (de) 2005-12-05 2005-12-05 Verfahren zum Ermitteln möglicher Empfänger
DE102005058110.2 2005-12-05

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020060122189A Division KR100943870B1 (ko) 2005-12-05 2006-12-05 잠재적 수신자를 식별하는 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20080093954A KR20080093954A (ko) 2008-10-22
KR100918599B1 true KR100918599B1 (ko) 2009-09-25

Family

ID=38120109

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020060122189A KR100943870B1 (ko) 2005-12-05 2006-12-05 잠재적 수신자를 식별하는 방법 및 장치
KR1020080095559A KR100918599B1 (ko) 2005-12-05 2008-09-29 잠재적 수신자를 식별하는 방법 및 장치

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020060122189A KR100943870B1 (ko) 2005-12-05 2006-12-05 잠재적 수신자를 식별하는 방법 및 장치

Country Status (5)

Country Link
US (1) US20070130368A1 (ko)
JP (1) JP2007157152A (ko)
KR (2) KR100943870B1 (ko)
CN (1) CN1983942A (ko)
DE (1) DE102005058110B4 (ko)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7774421B2 (en) * 2005-10-14 2010-08-10 International Business Machines Corporation Mitigating address book weaknesses that permit the sending of e-mail to wrong addresses
US20080016168A1 (en) * 2006-07-13 2008-01-17 Siemens Medical Solutions Usa, Inc. Email Routing System
US7996456B2 (en) * 2006-09-20 2011-08-09 John Nicholas and Kristin Gross Trust Document distribution recommender system and method
US20090204676A1 (en) * 2008-02-11 2009-08-13 International Business Machines Corporation Content based routing of misaddressed e-mail
US8364767B2 (en) * 2008-06-11 2013-01-29 International Business Machines Corporation Message processing in a messaging service client device
US8306809B2 (en) * 2008-07-17 2012-11-06 International Business Machines Corporation System and method for suggesting recipients in electronic messages
US8527530B2 (en) * 2010-03-22 2013-09-03 Sony Corporation Destination prediction using text analysis
CN102622372B (zh) 2011-01-31 2015-01-28 国际商业机器公司 推荐短消息接收人的方法和装置
US9385982B2 (en) 2011-10-19 2016-07-05 International Business Machines Corporation Identification to a recipient of an electronic communication of another user who has accessed the electronic communication
US9172671B2 (en) * 2012-04-18 2015-10-27 International Business Machines Corporation Filtering message posts in a social network
US10346411B1 (en) 2013-03-14 2019-07-09 Google Llc Automatic target audience suggestions when sharing in a social network
KR101581918B1 (ko) * 2013-05-01 2016-01-04 주식회사 조이맥스 온라인 게임에서의 SNS(Social Network Service) 메시지 전달 방법 및 그 시스템
US20160062984A1 (en) * 2014-09-03 2016-03-03 Lenovo (Singapore) Pte. Ltd. Devices and methods for determining a recipient for a message
US10264081B2 (en) 2015-04-28 2019-04-16 Microsoft Technology Licensing, Llc Contextual people recommendations
US10042961B2 (en) 2015-04-28 2018-08-07 Microsoft Technology Licensing, Llc Relevance group suggestions
US10230677B2 (en) * 2015-11-23 2019-03-12 International Business Machines Corporation Identifying an entity associated with an online communication
JP2019139536A (ja) * 2018-02-13 2019-08-22 日本電気株式会社 メール自動配送制御装置、メール自動配送制御方法、およびプログラム
GB2572801A (en) 2018-04-11 2019-10-16 Checkrecipient Ltd Method for recipient address selection
US11784948B2 (en) * 2020-01-29 2023-10-10 International Business Machines Corporation Cognitive determination of message suitability
US11575638B2 (en) * 2021-03-25 2023-02-07 International Business Machines Corporation Content analysis message routing
US20230161962A1 (en) * 2021-11-23 2023-05-25 Microsoft Technology Licensing, Llc System for automatically augmenting a message based on context extracted from the message
US11777893B1 (en) * 2022-06-16 2023-10-03 Microsoft Technology Licensing, Llc Common group suggested message recipient
KR102529213B1 (ko) * 2022-09-01 2023-05-08 김현오 사용자에게 인터넷 홈페이지를 이용한 메시지 발송 서비스를 제공하기 위한 장치 및 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050060495A (ko) * 2003-12-16 2005-06-22 엘지전자 주식회사 이동 통신 단말기의 문자 다이얼링 방법
KR20060060629A (ko) * 2006-03-17 2006-06-05 이승재 이동통신단말기의 데이터 저장 및 검색 방법
KR20060112563A (ko) * 2005-04-27 2006-11-01 주식회사 팬택 휴대폰에서의 일괄검색 서비스 방법

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001256132A (ja) * 2000-03-14 2001-09-21 Casio Comput Co Ltd メール送信装置、及び記憶媒体
FI20001552A (fi) * 2000-06-29 2001-12-30 Nokia Mobile Phones Ltd Sähköisten viestien lähettäminen
US6901398B1 (en) * 2001-02-12 2005-05-31 Microsoft Corporation System and method for constructing and personalizing a universal information classifier
US7050822B2 (en) * 2002-10-31 2006-05-23 Nokia Corporation Method for providing a best guess for an intended recipient of a message
US7747690B2 (en) * 2003-12-29 2010-06-29 International Business Machines Corporation Method for extracting and managing message addresses
JP2005250594A (ja) * 2004-03-01 2005-09-15 Ntt Docomo Inc 宛先推定装置及び宛先推定方法
JP2005267146A (ja) * 2004-03-18 2005-09-29 Nec Corp 画像認識機能を利用した電子メール作成方法および装置
US7577651B2 (en) * 2005-04-28 2009-08-18 Yahoo! Inc. System and method for providing temporal search results in response to a search query
US7853656B2 (en) * 2005-09-01 2010-12-14 Research In Motion Limited Method and device for predicting message recipients

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050060495A (ko) * 2003-12-16 2005-06-22 엘지전자 주식회사 이동 통신 단말기의 문자 다이얼링 방법
KR20060112563A (ko) * 2005-04-27 2006-11-01 주식회사 팬택 휴대폰에서의 일괄검색 서비스 방법
KR20060060629A (ko) * 2006-03-17 2006-06-05 이승재 이동통신단말기의 데이터 저장 및 검색 방법

Also Published As

Publication number Publication date
KR100943870B1 (ko) 2010-02-24
CN1983942A (zh) 2007-06-20
KR20080093954A (ko) 2008-10-22
US20070130368A1 (en) 2007-06-07
JP2007157152A (ja) 2007-06-21
DE102005058110A1 (de) 2007-07-26
KR20070058990A (ko) 2007-06-11
DE102005058110B4 (de) 2016-02-11

Similar Documents

Publication Publication Date Title
KR100918599B1 (ko) 잠재적 수신자를 식별하는 방법 및 장치
JP4742618B2 (ja) 情報処理システム、プログラム及び情報処理方法
US9183535B2 (en) Social network model for semantic processing
US7827165B2 (en) Providing a social network aware input dictionary
US9443226B2 (en) Electronic assistant for making predictions based on user messages
KR101627025B1 (ko) 소셜 네트워크에서의 맞춤형 리액션에 대한 제안의 자동 생성
US9977777B2 (en) System and method for read-ahead enhancements
JP4742619B2 (ja) 情報処理システム、プログラム及び情報処理方法
US20070050456A1 (en) Automated creation of e-mail distribution lists
US20150215253A1 (en) System and method for automatically mining corpus of communications and identifying messages or phrases that require the recipient's attention, response, or action
KR20080024165A (ko) 정보 검색 및 디스플레이 방법과 컴퓨터 판독가능 매체
US20160142359A1 (en) Item importance indication
US9774553B2 (en) Systems and methods for estimating message similarity
US8521825B2 (en) Electronic message monitoring
JP2006293573A (ja) 電子メール処理装置および電子メールフィルタリング方法および電子メールフィルタリングプログラム
CN107925610B (zh) 一种用于提供对话修改的计算设备、方法和计算机可读存储器设备
JP2001331422A (ja) メール評価装置
JP2003067304A (ja) 電子メールフィルタリングシステム、電子メールフィルタリング方法、電子メールフィルタリングプログラム及びそれを記録した記録媒体
US11956197B2 (en) Method for providing an email user experience by contacts instead of folders
Sneiders Automated email answering by text pattern matching
JP6651668B1 (ja) メール解析サーバ、メール解析方法、及びプログラム
Ogundeji et al. Naive Bayes algorithm for document classification
JP2003067307A (ja) 電子メール監視システム、電子メール監視方法、電子メール監視プログラム及びそれを記録した記録媒体
Kasturi et al. 1. E-Mail Spam Classification using Machine Learning Algorithms and Natural Language Processing
Rao et al. SPAM IDENTITY IN E-MAIL USING ML

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120821

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130822

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140826

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20150820

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee