KR100918599B1

KR100918599B1 - 잠재적 수신자를 식별하는 방법 및 장치

Info

Publication number: KR100918599B1
Application number: KR1020080095559A
Authority: KR
Inventors: 미쿠엘 마르틴; 에르뇌 코박스
Original assignee: 닛본 덴끼 가부시끼가이샤
Priority date: 2005-12-05
Filing date: 2008-09-29
Publication date: 2009-09-25
Also published as: KR100943870B1; CN1983942A; KR20080093954A; US20070130368A1; JP2007157152A; DE102005058110A1; KR20070058990A; DE102005058110B4

Abstract

텍스트 메시지를 포함하고 전자 형태인 메시지의 잠재적 수신자를 식별하는 방법은 -가능한 간단한 사용성과 사용자 친숙성을 고려해서-설계되고 메시지의 내용이 텍스트 분석을 거치고 텍스트 분석에 기초해서 잠재적 수신자 또는 잠재적 수신자의 그룹이 수신자 목록으로부터 식별되는 방식으로 더 개발된다.

텍스트 메시지, 잠재적 수신자, 텍스트 분석, 수신자 목록

Description

잠재적 수신자를 식별하는 방법 및 장치{METHOD AND APPARATUS FOR IDENTIFYING POTENTIAL RECIPIENTS}

본 발명은 메시지의 잠재적 수신자를 식별하는 방법에 관한 것으로, 메시지는 기본적으로 텍스트 메시지를 포함하고, 메시지는 전자 형태이다.

문자 메시지는 인간의 의사소통에 일반적이고 중요한 도구이다. 서신 형태의 인쇄된 메시지, 팩스 또는 유사한 메시지 이외에, 전자 형태의 메시지가 수적으로 증가해왔다. 몇몇 예를 들면, 전자 메일 (e-mail), SMS (short message service), 인스턴트 메시징 또는 인터넷의 공개토론 등을 들 수 있다. 모든 메시지는 작성자에 의해 생성되고 1명 이상의 수신자에게 전달된다. 전송을 위해서, 수신자(들) 각각의 올바른 식별자가 필요하다. 이메일에 대해서, 올바른 이메일 주소를 삽입해야하고, SMS에 대해서는 그에 대응하는 전화 번호를 삽입해야 한다.

각각의 식별자의 삽입을 간소화하기 위해서, 전화번호부 및/또는 주소록을 일반적으로 소유한다. 여기서, 식별자는 리스트, 데이터베이스 또는 유사한 수단에 일단 입력된다. 저장된 정보를 복구할 때, 요청된 엔트리만 전화/주소록 으로부터 선택되어야 한다. 전화/주소록에 많은 엔트리가 있다면, 올바른 수신자 식별자를 찾는 것은 시간을 많이 소비할 수 있다.

이러한 이유로, 많은 현재의 이용가능한 이메일 프로그램은 이메일 주소의 자동 완성을 제공한다. 사용자는 주소란에 이메일의 첫 글자를 입력해야 하고, 프로그램으로부터 그 글자의 표시된 시리즈로 시작하는 주소 제시를 수신한다. 여기서 문제는 사용자가 각각의 주소를 매우 정확히 알아야 한다는 것이다.

이메일 주소가 생성되는 상이한 전략에 기인해서, 이것이 어려워질 수 있다. 또한, 만약, 그러한 특정한 이메일 주소가 사용자에 의해 거의 사용되지 않는다면, 사용자는 그 주소를 기억하지 않을 것이기 때문에 이 자동 완성은 특히 쓸모없는 것이 된다. 또한, 그러한 자동 완성은 표시된 엔트리가 예상 엔트리와 유사하다면 사용자가 단어를 간과하는 경향이 있으므로 에러가 나기 쉽다. 만약 급하다면, 이메일이 잘못된 수신자에게 의도하지 않게 전송될 수 있다.

따라서, 본 발명은 가능한 쉽게 이용가능하고, 사용자에게 친숙하며 하나 이상의 수신자를 선택할 때 에러를 검출할 수 있는 잠재적 수신자의 식별을 위한 상술한 종류의 방법을 디자인하고 또한 개발하기 위한 태스크에 기초한다.

본 발명에 따르면, 상술한 태스크는 청구항 1의 특징을 나타내는 방법에 의해 해결된다. 이에 따르면, 이 방법은 메시지의 내용이 텍스트 분석을 거치고, 텍스트 분석의 결과에 기초해서 잠재적 수신자 또는 잠재적 수신자의 그룹이 수신자 목록으로부터 식별되는 것을 특징으로 한다.

본 발명에 따르면, 우선 모든 메시지는 그 스타일과 주제가 각각의 수신자에 따라 변하며 이 정보는 잠재적 수신자를 식별할 때 고려될 수 있다는 것을 식별하였다. 상업 통신은 더 형식적인 스타일이기 쉬우며, 업무상 구체적인 내용을 언급할 수도 있다. 또한, 사업 파트너를 대응 어드레싱하는 것은 동료에게 보내는 메시지보다 더 형식적일 것이다. 그러한 차이점은 또한 사생활에도 존재한다.

본 발명에 따르면, 이 정보는 잠재적 수신자를 식별하는데 고려될 수 있음을 인식하였다. 그렇게 하면, 메시지의 내용을 텍스트 분석하고 텍스트 분석의 결과는 하나 이상의 잠재적 수신자를 식별하는데 사용된다. 이를 위해서, 수신자 또는 수신자의 그룹은 수신자 목록으로부터 대응되어 선택된다.

수신자의 목록은 여기서 포괄적인 용어로 이해되어야 한다. 목록은 개별 접촉 정보의 목록에만 관련될 수 있지만, 전화번호부, 주소록, 주소 데이터 뱅크 또는 다른 접촉 식별자를 저장하는 수단에 관련될 수 있다. 동일한 방식으로, 용어 "주소" 또는 "식별자"는 수신자를 명확하게 식별하기 쉬운 임의의 가능성을 언급한다. 이는 예를 들면, 전화 번호, 이동전화 번호, 이메일 주소, 인터넷 공개토론의 식별자, 인스턴트 메시징 식별자 등을 포함할 수 있다.

유리한 방식으로, 텍스트 분석은 개별 특징을 추출한다. 특징은 여기서 메시지의 특성의 많은 다양성을 지칭한다. 이런 의미에서, 구체적 단어의 출현을 검색할 수 있다. 메시지가 예를 들어, 미팅에 관한 언급을 포함한다면, 이것은 사업 내용의 메시지를 강하게 표시한다. 또한, 만약, 더욱 비형식적인 스타일이 사용된다면, 동료와의 미팅에 대한 언급일 가능성이 크다. 또한, 특정한 인사말이나 맺음 구문이 검색될 수도 있다. 대응하는 수신자를 특징짓는 다른 특성 또한 특징으로 사용될 수 있다. 예를 들면, 문장의 최대 또는 평균 길이를 체크할 수 있다.

사생활에서, 일반적으로 짧은 문장은 사업상에서보다 형식화될 것이다. 또한, 예를 들면, 최대 또는 평균 단어 길이, 서명의 사용, 워드 래핑 (word-wrapping) 의 수 또는 다른 특징이 중요할 수 있다.

모든 특징은 메시지의 대응하는 작성자에 의존할 수 있다. 각각의 사용자는 메시지를 쓸 때 특정한 승인된 규정을 만족시킬 것이지만, 작성자는 특정한 개인적 특성 또한 나타낼 것이다. 따라서, 일반적으로 사용되는 특징 외에, 텍 스트 분석은 사용자의 특정한 특징을 언급할 수 있다.

분석된 메시지로부터 추출된 이들 특징은 잠재적 수신자의 특징과 비교되고 결합될 수 있다. 그렇게 함으로써, 분류가 수행될 수 있고, 최적의 경우에, 분석된 메시지의 수신자일 가능성이 가장 높은 수신자가 식별될 수 있다. 특징의 추출 및/또는 분류는 다수의 분석 알고리즘 또는 분류 알고리즘에 의해 수행될 수 있다.

바람직하게, 기계-학습 알고리즘이 적용된다. 이 방법을 한정하지 않는 예를 하나 들면, 신경 회로망의 사용, SVM (Support Vector Machine), MFU (최대 사용 빈도수) 알고리즘 또는 베이시안 (Bayesian) 분류자 등을 언급할 수 있다. 예를 들면, 하기 참조:

(1) O. De Vel, A. Anderson, M. Corney, 및 G. Mohay "Mining Email Content for Author Identification Forensics" SIGMOD Record, Vol. 30, No. 4, pp. 55-64, 2001년 12월;

(2) Paul Graham, "A Plan for Spam" (http://www.paulgraham.com/spam.html

), 2002년 8월;

(3) Bryan Klimt, Yiming Yang, "Introducing the Enron Corpus" First Conference on Email and Anti-Spam (CEAS), Proceedings 2004년 7월;

(4) I. Rish, "An emperical study of the Naive Bayes classifier" 17th International Joint Conference on Artificial Inteligence, 2001년 8월; 및

(5) R. B. Segal, J.O. Kephart "MailCat: An Intelligent Assistant for Organizing E-Mail" Proceedings of the National Conference on Artificial Intelligence, 1999.

이용가능한 컴퓨팅 전력에 따라, 추출할 특징의 수, 식별된 잠재적 수신자의 요구되는 정확도 또는 대응하는 적절한 알고리즘의 다른 종속 조건이 선택될 수 있다. 운영 상황에 따라 변경될 수 있는 몇몇 알고리즘의 애플리케이션이 계획될 수도 있다.

베이시안 분류자를 사용할 때, 더 양호한 계산가능성의 이유로 단순 베이시안 분류자를 사용하는 것이 현명하다. 정통 베이시안 분류자와 반대로, 단순 베이시안 분류자의 경우 개별 특징이 서로 의존적인 것으로 간주되지 않고, 베이시안 분류자의 계산 포뮬러에서 조건부 확률에 기인한 팩트 (fact) 는 대응하는 특징에만 의존해서 개별 조건부 확률로 나누어진다. 이 가정이 현실에 거의 적용되지 않더라도, 실용적인 단순 베이시안 분류자는 종종 좋은 결과를 달성한다. 개별 특징이 상관관계가 낮을 때 그렇다. 또한, 메시지를 고려할 때, 개별 텍스트 특징은 서로 완전히 독립적이지 않을 것이다. 하지만, 특징들은 충분히 상관도가 낮아서 단순 베이시안 분류자의 애플리케이션을 정당화한다.

공지된 분석 및/또는 분류 알고리즘은 그것들이 이미 수행되고 바람직하게 증명된 메시지와 수신자의 상호 상관관계로부터의 결과인 지식을 언급한다는 공통점을 갖는다. 바람직하게, 이 지식은 트레이닝에 의해 발생한다. 이를 위해, 사용자에 의해 작성된 개별 메시지는 텍스트를 분석하고, 그것을 사용자가 수동으로 선택한 수신자에 일치시킴으로써 트레이닝을 위해 사용된다.

트레이닝 자체는 분류의 좋은 결과를 달성하기 위해 상당히 많은 메시지를 필요로 하기 때문에, 시스템은 사용자에 의해 이미 작성된 메시지로 트레이닝될 수 있으며, 따라서 수신자 목록의 하나 이상의 수신자와 상관될 수도 있다. 새로이 작성된 메시지의 사용 때문에, 지식은 계속 증가하고, 그 결과 그러한 지식에 기초한 분석 및/또는 분류는 더 좋은 결과를 제공하고, 사용자의 변화 습관에 적응한다.

특히, 수신자를 향한 가능한 커뮤니케이션 행동 변경에 대해서, 더 최근의 지식이 오래된 지식보다 중요할 수 있다. 예를 들면, 사업 파트너와 더 개인적인 관계가 구축될 수 있으며, 그것은 메시지의 더 비형식적인 구조의 결과를 낳을 수 있다. 이에 의해, 사용자의 변화된 행동이 평가될 수 있다. 최근의 지식은 잠재적 수신자의 식별에 대한 더 강한 영향력을 갖는다. 최근의 지식은 지식을 사용하기 이전의 소정 기간 동안 형성된 (built up) 지식이고 오래된 지식은 소정 기간 이전에 형성된 지식일 수 있다. 소정 기간이란, 예를 들어, 10 분, 1 주일, 또는 1 년이 될 수도 있으며, 본 발명의 실시형태에 따라서 당업자에 의해 용이하게 결정될 수 있다.

지식을 구축할 때 노력을 더 감소하기 위해서, 메시지의 거의 모든 작성자에게 존재하는 상이한 특징이 기본 지식과 통합될 수 있다. 그러한 기본 지식은 프리-트레이닝으로 사용되거나 러닝 시스템에 직접 삽입될 수 있다.

본 발명에 따른 방법의 제 1 사용의 효율성을 더 증가시키기 위해서, 사용자는 수신자 목록에 수신자를 삽입할 때 수신자에 대해서 상세사항을 더 제공하게 할 수 있다. 이는 예를 들면, 각각의 수신자의 범주화 (사업, 동료, 개인, 친구, 가족 등) 를 포함할 수 있다. 또한, 사용자는 유사한 방법으로 수신자의 목록에 기존 엔트리를 분류하도록 요청될 수 있다. 그렇게 함으로써, 제 1 선택은 메시지의 단순 분석에 의해 수행될 수 있고, 많은 수신자가 매우 초기 단계에서 제외될 수 있다.

이에 의해, 메시지의 가장 가능성 있는 수신자가 식별될 수 있다. 한편, 분석된 메시지의 수신자일 가능성이 매우 낮은 수신자가 식별될 수 있다.

이 방법으로 식별된 수신자는 표시되어 사용자에게 제시될 수 있다. 제시된 수신자는 그 확률에 따라 정렬되고 표시될 수 있다. 부적절한 수신자는 리스트로부터 제외될 수 있다.

이것은 메시지의 수신자를 삽입할 때 삽입의 보정이 체크되는 방식으로 사용될 수 있다. 텍스트 분석은 메시지가 표시된 수신자에게 실제로 어드레스되는 가능성을 결정할 수 있다. 한편, 사용자에 의해 표시된 수신자는 식별된 수신자와 비교될 수 있다. 이 방법으로, 올바른 수신자가 표시될 확률을 결정할 수 있다. 확률이 너무 낮다면, 사용자가 두 경우 모두에서 적절한 방법을 공지받을 수 있거나, 수신자가 더 큰 가능성을 갖는 수신자로 교체될 수 있다.

실시형태의 다른 예에 대해서, 식별된 수신자는 수신자의 접촉 데이터의 자동 완성을 위해 사용될 수 있다. 사용자가 메시지를 작성하고 접촉 데이터를 삽입한 후, 메시지의 수신자일 가능성이 가장 높고, 사용자에 의해 표시된 캐릭터의 조합으로 시작할 가능성이 있는 수신자가 제시될 수 있다. 이에 의해 자동 완성에 의한 수신자의 삽입에 의해 잘못된 수신자에게 메시지를 전송하는 것을 효율적으로 피할 수 있다.

본 발명의 다른 실시형태에서, 메시지를 작성한 후, 사용자에게 모든 잠재적 수신자를 포함하는 수신자의 그룹에 대해 표시할 수 있다.

사용자는 텍스트로부터 추출된 특징이 수신자의 특징과 일치해야 한다는 정도를 나타내는 임계치를 정의할 수 있다. 이 임계치보다 높은 일치도를 갖는 모든 수신자들은 수신자의 그룹의 잠재적 멤버로서 표시될 수 있다. 이렇게 함으로써, 수신자를 사용자가 초기에 망각했을 수도 있는 그룹에 통합시킬 수 있다.

이 발명의 다른 실시형태에서, 시스템은 동일한 토픽에 대한 메시지를 계속 수신하는 사용자들을 간단히 모니터할 수 있고, 한 세트의 개인들이 하나의 토픽 그룹이라고 결론짓는다. 이 정보는 사용자 또는 다른 애플리케이션에 이용가능하도록 만들 수 있으며, 작업 그룹에 대한 정보를 사용하는 더 좋은 사용자 애플리케이션 등에 필요한 임의의 방식으로 사용할 수 있다.

실시형태의 다른 예에서, 본 발명에 따른 방법은 인터넷 공개토론 또는 많은 수의 메시지가 처리되어야 하는 다른 환경의 콘텍스트에서 적용될 수 있다. 서버에서 들어오는 메시지는 그 내용을 간주해서 분석될 수 있다. 분석의 결과에 기초해서, 유사한 메시지를 자주 검색하는 수신자를 식별할 수 있다. 따라서 이들 메시지는 그들의 사용자에 대해 흥미가 있기 때문에 언급될 수 있다. 바람직한 내용에 대한 지식은 계속해서 업데이트될 수 있다.

실시형태의 모든 예에서, 사용자는 식별된 수신자로부터 개별 식별자를 의도 적으로 삭제할 수 있다. 인터넷 공개토론 또는 유사한 환경의 콘텍스트에서, 고유의 수신자 식별자가 식별된 수신자로부터 삭제될 수 있다. 그렇게 삭제함으로써, 분석 및/또는 분류를 수행하기 위한 지식을 동시에 업데이트할 수 있다.

이하, 본 발명의 교시를 유리한 방식으로 디자인하고 또한 개발하는 방법의 몇몇 옵션을 하기한다. 이러한 목적으로, 한편으로는 청구항 1의 종속항을 참조해야 하며, 다른 한편으로는 도면과 함께 본 발명의 방법의 실시형태의 바람직한 실시예의 하기 설명을 참조해야 한다.

실시형태의 바람직한 실시예와 도면의 설명과 함께, 본 교시에 대한 일반적으로 바람직한 디자인의 개발도 설명한다.

본 발명에 따른 잠재적 수신자의 식별 방법은 가능한 쉽게 이용가능하고, 사용자에게 친숙하며 하나 이상의 수신자를 선택할 때 에러를 검출할 수 있다.

도 1은 본 발명에 따른 방법의 구현의 플로우차트를 도시한다. 개별 프로세스들은 일반적으로 특징의 추출 및/또는 분류를 수행하기 위해 적용된 알고리즘으로부터 독립적이다. 먼저, 사용자는 단계 1에서 메시지를 생성한다. 메시지의 내용은 단계 2에서 분석되고 이어서 단계 3에서, 분석의 결과가 분류 알고리즘에 제공된다. 마지막으로, 단계 4에서 제시된 수신자 중 하나를 선택하거나 제시에 포함되지 않은 수신자를 교체하는 사용자에 대한 제시가 생성된다. 그러한 방식으로 수행되는 분석된 메시지와 사용자의 상관관계는 분류에 필요한 지식을 업데이트하는데 사용된다. 이를 위해, 단계 5에서 지식의 업데이트가 시작된다. 추출된 특징과 선택된 수신자 사이의 접속이 성립되고 대응하는 수신자에 대해 수집한 정보와 결합된다. 그 후, 메시지가 추가로 단계 6에서 대기된다.

도 2a 및 도 2b는 베이시안 분류자로부터 유도될 수 있는 단순 베이시안 분류자와 함께 본 발명에 따른 방법을 사용한 2개의 플로우차트를 도시한다. 베이시안 분류자는 원칙적으로 조건부 확률과 관계된 베이시안 정리에 기초한다. 주어진 예에서 확률은 메시지 M_i가 수신자 R_j에게 어드레스되는 확률과 함께 계산될 수 있다. 이 확률은 특징 T_a, T_b, T_c, ....가 메시지 M_i에서 발생하기 때문에 조건부이다. 따라서 조건부 확률은 다음 식에 의해 계산된다:

P(T_a, T_b, T_c, ...│M_i⊂R_j)는 특징 T_a, T_b, T_c,...가 수신자 R_j에 어드레스된 메시지에 포함된 확률을 계산한다. 일반적으로, 특징들 T_a, T_b, T_c, ... 사이에 의존성이 있다. 단순 베이시안 분류자의 경우, 개별특징이 메시지에 서로 독립적으로 존재할 수 있다고 가정된다. 조건부 확률 P(T_a, T_b, T_c, ...│M_i⊂R_j)은 개별 특징에 대한 조건부 확률의 곱으로 대체될 수 있다. 상기 식에서 분모 P(T_a, T_b, T_c, ...) 가 수신자와 독립적이기 때문에, 이 부분은 수신자 R_j에 대한 메 시지 M_i의 관계를 결정할 경우 무시될 수 있다. 따라서, 하기 부분이 계산되어야 한다:

개별 팩터들은 메시지 M_i에서 수신자 R_j에 대한 개별 특징들 T_a, T_b, T_c, ...이 존재하는 확률이다.

도 2a는 이 단순 베이시안 분류자의 애플리케이션에 대한 본 발명에 따른 방법의 구현을 도시한다. 여기서, 이 방법의 애플리케이션에 대한 일반적인 프로세스가 플로우차트에 도시된다. 우선, 사용자는 메시지를 생성한다 (단계 7). 그 후, 메시지의 특징이 단계 8의 분석 알고리즘에 의해 추출된다. 특징들 T_a, T_b, T_c, ...이 잘 선택된다면, 특징들 중 적어도 일부는 메시지에 포함될 것이다.

이하, 잠재적 수신자의 목록에 저장된 개별 수신자가 개별 특징들의 관계에 대해 분석되고 이에 기초해서 수신자에 대한 메시지의 관계가 계산된다. 단계 9에서, 수신자 목록에 체크되지 않은 수신자가 포함되어 있는지를 우선 체크한다. 체크되지 않은 수신자가 포함되어 있다면, 단계 10에서 특징들의 관계에 대한 데이터가 검색되고 단계 11에서 단순 베이시안 분류자에 제공된다. 그 다음, 단계 9가 계속된다. 수신자 목록의 모든 수신자가 처리되었을 때에만, 루프가 남고 단계 12에서 사용자에 대한 제시가 생성된다. 이 제시는 분석 및 분류에 따른 수신자로 간주되어야 하는 하나 이상의 잠재적 수신자를 나타낸다.

마지막으로, 계산된 모든 데이터가 지식을 확장하는데 사용되고 특징들과 상관 수신자(들)의 조합이 기존의 지식과 결합된다 (단계 13). 그 후, 추가 메시지가 처리될 수 있다 (단계 14). 도 2b는 트레이닝 과정을 수행하기 위한 플로우차트를 도시한다. 이 과정은 지식의 업데이트 뿐만 아니라 지식의 1차 형성 (built up) 에 적용될 수 있다. 단계 15에서, 메시지가 수용된다. 단계 16과 함께, 수신자 목록이 이미 메시지의 수신자를 포함하고 있는지 여부 및 그에 따라 수신자가 공지되어 있는지를 체크한다. 수신자가 공지되지 않았다면, 새로운 엔트리가 생성된다 (단계 17). 양자의 경우 (수신자가 공지된 경우 및 수신자가 공지되지 않은 경우) 모두 수신자에게 전송된 메시지에 대한 카운터는 이후에 증가한다 (단계 18). 이하, 메시지에 포함된 개별 특징들이 처리되고 수신자와 관련해서 범주화된다. 이를 위해, 단계 19는 먼저 처리되지 않은 특징이 아직 남아있는지 여부를 체크한다. 만약, 처리되지 않은 특징이 남아있다면, 처리되지 않은 특징을 단계 20에서 수신자에 추가하고 처리를 단계 19와 함께 계속한다. 모든 특징들을 이런식으로 처리한 후, 루프가 남는다. 그 후, 프로그램 플로우가 종료되고 추가로 메시지가 처리될 수 있다.

하나의 가능한 예를 하기한다: 사용자가 다음의 메시지를 타이핑할 경우:

"John 에게, 나는 다음주 월요일 우리의 품질 제어 테스트에 대해 요청된 리포트를 첨부합니다. 나는 당신을 테스팅 시설에서 직접 만날 것입니다. 그럼 이만, Andrew".

텍스트 분석은 단어들 "John", "품질", "제어" 및 "만나다" 를 검색하고 (분 류를 통해) John@foo.com을 가능한 수신자로서 제시할 수 있으며, 그 이유는 사용자 (Andrew) 가 보통 John과 품질 제어 주제에 대해서 논의하기 때문이다. 마찬가지로, 메시지의 형식, 단어 "만나다"와 평일의 언급인 "월요일"은 Andrew의 상사 또는 그의 비서에게 제안된 수신자를 제안할 수 있다.

도 3에 도시한 바와 같이, 정보 처리 장치에는 사용자가 메시지 입력, 잠재적 수신자의 선택 또는 교체 등을 수행할 수 있는 입력 섹션 (102) 을 통해 메시지의 텍스트를 제공하는 메시징 툴 (101) 이 제공된다. 장치가 수신자를 예측할 뿐만 아니라, 사용자 입력에 기초해서 보정 또는 제시를 한다면, 메시징 툴 (101) 은 사용자에 의해 전송된 임시 수신자 목록을 제공할 수도 있다. 그 후 입력 메시지는 선택된 수신자와 관련해서 메시지 특징의 출현의 빈도를 저장하는 텍스트 분석 모듈 (103) 로 패스되어 빈도표 (104) 로 입력된다. 분류는 그 후 잠재적 수신자 목록을 생성하는 분류자 (105) 에 의해 수행되고, 결과 통보자 (106) 를 통해서 메시징 툴 (101) 로 전송된다. 사용자가 잠재적 수신자를 선택하거나 교체함으로써, 빈도표 (104) 가 업데이트된다. 베이시안 분류자 이외의 메커니즘을 사용하는 경우, 메시지 순서가 상이할 수 있으며, 몇몇 블록이 상이하게 구현되거나, 제거되거나 또는 새로운 블록이 추가될 수 있다.

마지막으로, 상술한 실시형태의 완전히 임의로 선택된 예는 본 발명에 따른 교시의 예를 들 뿐, 본 실시형태의 주어진 예의 후자를 제한하는 것은 아니라는 것을 특히 주의해야 한다.

도 1은 본 발명에 따른 방법의 구현을 나타내는 플로우차트.

도 2a는 단순 베이시안 분류자와 함께 본 발명에 따른 방법의 구현을 위한 애플리케이션을 나타내는 플로우차트.

도 2b는 단순 베이시안 분류자와 함께 본 발명에 따른 방법의 구현을 위한 트레이닝을 나타내는 플로우차트.

도 3은 본 발명에 따른 방법이 구현되는 정보 처리 장치를 도시한 블록도.

*도면의 주요 부호에 대한 설명*

101: 메시징 툴 102: 입력 섹션

103: 텍스트 분석 모듈 104: 빈도표

105: 분류자 106: 결과 통보자

Claims

정보 처리 장치에 의해 수행되는, 메시지의 잠재적 수신자를 식별하는 방법으로서,

상기 메시지는 기본적으로 텍스트 메시지를 포함하고,

상기 메시지는 전자 형태이며,

상기 메시지의 내용은 텍스트 분석되고,

상기 텍스트 분석의 결과에 기초해서 잠재적 수신자 또는 잠재적 수신자의 그룹이 수신자 목록으로부터 식별되고,

상기 텍스트 분석에서의 상기 메시지의 분석 및/또는 분류를 위해서, 이전까지 수행된 잠재적 수신자 식별에서 메시지 전송자에 의해 결정된 수신자의 선택, 삽입 또는 제거로부터 형성된, 메시지와 상기 수신자 목록의 수신자들 사이의 상관관계에 대한 지식이 사용되며,

상기 잠재적 수신자를 식별하기 위한 상기 지식에의 반영비율에 있어서, 최근의 지식이 오래된 지식보다 큰 가중치를 가지고,

상기 최근의 지식은 상기 지식의 사용 이전의 소정 기간 동안에 형성된 (built up) 것이고, 상기 오래된 지식은 상기 소정 기간 이전에 형성된 지식인, 잠재적 수신자 식별 방법.