KR20220152256A - 랜덤 포레스트 분류기를 사용하여 관리 협정에 관련되는 예측을 생성하기 위해 다양한 시간적 특성을 갖는 데이터를 프로세싱하기 위한 방법 및 시스템 - Google Patents

랜덤 포레스트 분류기를 사용하여 관리 협정에 관련되는 예측을 생성하기 위해 다양한 시간적 특성을 갖는 데이터를 프로세싱하기 위한 방법 및 시스템 Download PDF

Info

Publication number
KR20220152256A
KR20220152256A KR1020227034385A KR20227034385A KR20220152256A KR 20220152256 A KR20220152256 A KR 20220152256A KR 1020227034385 A KR1020227034385 A KR 1020227034385A KR 20227034385 A KR20227034385 A KR 20227034385A KR 20220152256 A KR20220152256 A KR 20220152256A
Authority
KR
South Korea
Prior art keywords
data
management
entity
transformation
random forest
Prior art date
Application number
KR1020227034385A
Other languages
English (en)
Inventor
헤이든 토마스 루스
데이빗 앤드류 디치우루치오
로날드 잰슨
Original Assignee
유비에스 비즈니스 솔루션즈 아게
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 유비에스 비즈니스 솔루션즈 아게 filed Critical 유비에스 비즈니스 솔루션즈 아게
Publication of KR20220152256A publication Critical patent/KR20220152256A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • G06N7/005
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Medical Informatics (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)

Abstract

랜덤 포레스트 분류기를 사용하여 관리 협정에 관련되는 예측을 생성하기 위해 다양한 시간적 특성을 갖는 데이터를 프로세싱하기 위한 방법 및 시스템이 설명된다. 예를 들면, 시스템은 제1 엔티티의 제1 관리 협정 및 제2 엔티티의 제2 관리 협정에 관련되는 제1 데이터를 수신할 수도 있다. 시스템은 예측된 제2 관리 변환에 관련되는 랜덤 포레스트 분류기로부터의 출력을 수신할 수도 있다. 그 다음, 시스템은, 디스플레이를 위해, 유저 인터페이스에서, 예측된 제2 관리 변환에 기초한 예측을 생성할 수도 있다.

Description

랜덤 포레스트 분류기를 사용하여 관리 협정에 관련되는 예측을 생성하기 위해 다양한 시간적 특성을 갖는 데이터를 프로세싱하기 위한 방법 및 시스템
본 발명은 랜덤 포레스트 분류기를 사용하여 관리 협정(management arrangement)에 관련되는 예측을 생성하기 위해 다양한 시간적 특성을 갖는 데이터를 프로세싱하는 것에 관한 것이다.
최근 몇 년 동안, 데이터 프로세싱 및 데이터 프로세싱을 위한 기술은 다양한 목적을 위한 컴퓨터 애플리케이션에 대한 중요성 및 적용 가능성에서 증가를 확인하였다. 그럼에도 불구하고, 새로운 애플리케이션의 요구를 충족시키기 위해 이들 데이터 세트의 계속 증가하는 사이즈 및 이들 데이터 세트를 프로세싱하는 데 필요한 프로세싱 능력은 개발자에게 계속해서 문제를 제기하고 있다.
이러한 문제의 관점에서, 데이터 프로세싱에서의 개선을 위한 방법 및 시스템이 본원에서 개시된다. 특히, 이들 개선은 예측을 생성하기 위해 다양한 시간적 특성을 갖는 데이터를 프로세싱하는 것을 통해 달성된다. 앞서 언급된 데이터 프로세싱은 관리 협정에 관련되는 예측을 생성하기 위해 사용되는 애플리케이션에 특히 관련이 있다. 예를 들면, 엔티티의 관리 협정(예를 들면, 의사 결정 기구의 구성 및/또는 엔티티의 다른 제어 시스템) 및/또는 관리 변환(management transformation)(예를 들면, 투자자 행동 주의(activism)에 기초한 엔티티의 관리 협정에서의 변경)에 관련되는 애플리케이션은, 머신 러닝 모델이, 종종 제한된 트레이닝 데이터를 사용하여, 신뢰 가능한 예측을 생성해야만 하고, 예측을 담당하는 피쳐 및/또는 주어진 예측에 영향을 끼치는 피쳐에 대한 가시성을 제공해야만 한다는 점에서, 이들 모델에 대한 특정한 요건을 갖는다.
본원에서 설명되는 방법 및 시스템은 랜덤 포레스트 분류기에 기초한 모델의 사용에 또한 관련이 있다. 그러나, 관리 협정에 관련되는 애플리케이션에 랜덤 포레스트 분류기에 기초하는 모델의 사용은 추가적인 기술적 장애를 생성한다. 특히, 관리 협정에 관련되는 애플리케이션은 시간적 특성을 필요로 한다(즉, 데이터는 특정한 시간/날짜에 상관되고 모델은 예측을 행하기 위해 이 상관을 고려해야만 한다). 이 시간적 특성의 적절한 보존이 없으면, 관리 협정에 관련되는 애플리케이션은 달성될 수 없고 및/또는 미래의 시간 기간에 관련되는 예측이 이루어질 수 없다. 이것은 랜덤 포레스트 분류기에 기초하는 모델의 경우 특히 문제가 된다. 랜덤 포레스트 분류기는, 종래에는, 시계열의 미래 지점에 기초하여 예측을 행하는 그들의 능력에서 제한된다. 즉, 랜덤 포레스트 분류기는 현재의 시간의 분류로 제한된다. 예를 들면, 랜덤 포레스트 분류기는 시간을 인식하지 못한다. 대신, 랜덤 포레스트 분류기는 관측치를, 연속 종속성에 의해 특성 묘사되는 시계열 데이터와는 대조적으로, 독립적인 것으로 그리고 동일하게 분포되는 것으로 간주한다.
이 한계를 극복하기 위해, 랜덤 포레스트 분류기를 위한 데이터를 트레이닝시키는 시스템 및 방법은 각각의 피쳐 벡터를 시간 기준으로 인덱싱되게 만들도록 사전 프로세싱된다. 예를 들면, 주어진 엔티티에 대한 피쳐 벡터는, 기본 데이터(fundamental data), 소득 데이터(income data), 시장 데이터(market data), 거래량 데이터(trading volume data), 주주 권리 데이터(shareholder rights data), 구조 데이터(structure data), 보유권(tenure)의 사이즈/기간, 소속(affiliation)의 수, 및/또는 관리 협정에 관련되는 임의의 다른 데이터를 포함할 수도 있는 관리 협정 데이터를 포함할 수도 있다. 하기에서 설명하는 바와 같이, 이 사전 프로세싱은, 통계적 변환, 추세 제거(detrending), 시간 지연 임베딩, 또는 피쳐 엔지니어링 중 하나 이상을 포함할 수도 있다. 사전 프로세싱에 후속하여, 그 다음, 랜덤 포레스트 분류기를 사용하는 모델이 트레이닝될 수도 있다.
그 다음, 트레이닝된 모델은 관리 협정에 관련되는 애플리케이션에 적용될 때 하나 이상의 이점을 달성할 수도 있다. 첫째, 모델은 관리 변환의 있음직한 성공(예를 들면, 론칭된 행동 주의 캠페인의 성공의 가능성)뿐만 아니라, 관리 변환이 발생할 가능성이 얼마인지(예를 들면, 행동 주의 캠페인이 론칭될 가능성)에 대한 예측을 제공할 수도 있다. 둘째, 모델은, 현재 엔티티에 대한 예측을 제공하기 위해, 현재 엔티티 및/또는 그들 엔티티에 대한 관리 협정 및 관리 협정 데이터를, 관리 변환의 특색을 묘사한 엔티티의 과거의 관리 협정 및 관리 협정 데이터에 비교하는 다수의 해석 도구를 제공할 수도 있다. 추가적으로 또는 대안적으로, 모델은 관리 변환의 성공 또는 발생의 가능성에 대한 주어진 피쳐(예를 들면, 관리 협정 데이터의 카테고리 및/또는 값)의 영향을 식별하는 해석 도구를 제공할 수도 있다. 셋째, 모델이 특정한 환경에 대해 조정 가능하게 되는 것을 허용하기 위해, 모델은 사후 프로세싱을 통해 주어진 시계열뿐만 아니라 다른 요인(예를 들면, 지리적 고려 사항)에 기초하여 조정될 수도 있는 출력을 제공할 수도 있다.
몇몇 양태에서, 랜덤 포레스트 분류기를 사용하여 관리 협정에 관련되는 예측을 생성하기 위해 다양한 시간적 특성을 갖는 데이터를 프로세싱하기 위한 시스템 및 방법이 설명된다. 예를 들면, 시스템은 제1 엔티티의 제1 관리 협정에 관련되는 제1 데이터를 수신할 수도 있는데, 여기서 제1 데이터는 제1 엔티티의 제1 시간적 특성 및 제1 관리 변환을 포함한다. 시스템은 제1 데이터에 대한 제1 피쳐 벡터를 생성할 수도 있는데, 여기서 제1 피쳐 벡터의 제1 엘리먼트는 제1 시간적 특성에 대응한다. 시스템은 제1 데이터를 제1 관리 변환에 대응하는 것으로 분류하기 위해 제1 피쳐 벡터에 기초하여 랜덤 포레스트 분류기를 트레이닝시킬 수도 있다. 시스템은 제2 엔티티의 제2 관리 협정에 관련되는 제2 데이터를 수신할 수도 있는데, 여기서 제2 데이터는 제2 엔티티의 제2 시간적 특성 및 공지되지 않은(unknown) 관리 변환을 포함한다. 시스템은 제2 데이터에 대한 제2 피쳐 벡터를 생성할 수도 있는데, 여기서 제2 피쳐 벡터의 제2 엘리먼트는 제2 시간적 특성에 대응한다. 시스템은 제2 피쳐 벡터를 랜덤 포레스트 분류기에 입력할 수도 있다. 시스템은 예측된 제2 관리 변환에 관련되는 랜덤 포레스트 분류기로부터의 출력을 수신할 수도 있다. 시스템은, 디스플레이를 위해, 유저 인터페이스에서, 예측된 제2 관리 변환에 기초한 예측을 생성할 수도 있다.
본 발명의 다양한 다른 양태, 피쳐, 및 이점은 본 발명의 상세한 설명 및 본 발명에 첨부되는 도면을 통해 명백해질 것이다. 전술한 일반적인 설명 및 다음의 상세한 설명 둘 모두는 예이며 본 발명의 범위를 제한하지는 않는다는 것이 또한 이해되어야 한다. 본 명세서 및 청구범위에서 사용될 때, 단수 형태는, 문맥 상 명백하게 다르게 지시하지 않는 한, 복수의 지시 대상을 포함한다. 또한, 본 명세서 및 청구범위에서 사용될 때, 용어 "또는"은, 문맥에서 명백하게 달리 지시하지 않는 한, "및/또는"을 의미한다. 추가적으로, 본 명세서에서 사용될 때, "일부"는, 문맥 상 명백하게 다르게 지시하지 않는 한, 주어진 아이템(예를 들면, 데이터)의 일부 또는 전체(즉, 전체 부분)를 지칭한다.
도 1은, 하나 이상의 실시형태에 따른, 예측된 제2 관리 변환에 기초한 예측에 액세스하기 위한 유저 인터페이스의 예시적인 예를 도시한다.
도 2는, 하나 이상의 실시형태에 따른, 한 엔티티 및 다른 엔티티의, 그들의 유사성에 기초한 비교에 액세스하기 위한 유저 인터페이스의 다른 인스턴스의 예시적인 예를 도시한다.
도 3은, 하나 이상의 실시형태에 따른, 랜덤 포레스트 분류기를 사용하여 관리 협정에 관련되는 예측을 생성하기 위해 다양한 시간적 특성을 갖는 데이터를 프로세싱하기 위한 시스템을 도시한다.
도 4는, 하나 이상의 실시형태에 따른, 랜덤 포레스트 분류기를 사용하여 관리 협정에 관련되는 예측을 생성하기 위해 다양한 시간적 특성을 갖는 데이터를 프로세싱함에 있어서 수반되는 단계의 플로우차트를 도시한다.
도 5는, 하나 이상의 실시형태에 따른, 다양한 타입의 데이터를 사용하여 예측을 생성함에 있어서 수반되는 단계의 플로우차트를 도시한다.
도 6은, 하나 이상의 실시형태에 따른, 한 엔티티 및 다른 엔티티의, 그들의 유사성에 기초한 비교를 생성함에 있어서 수반되는 단계의 플로우차트를 도시한다.
다음의 설명에서, 설명의 목적을 위해, 본 발명의 실시형태의 완전한 이해를 제공하기 위해 다수의 특정한 세부 사항이 기술된다. 그러나, 본 발명의 실시형태가 이들 특정한 세부 사항 없이도 또는 등가의 배열을 가지고 실시될 수도 있다는 것이 기술 분야에서 기술을 가진 자에 의해 인식될 것이다. 다른 경우에, 본 발명의 실시형태를 불필요하게 모호하게 하는 것을 방지하기 위해, 널리 공지된 구조물 및 디바이스가 블록도 형태로 도시된다.
도 1은, 하나 이상의 실시형태에 따른, 예측된 제2 관리 변환에 기초한 예측에 액세스하기 위한 유저 인터페이스의 예시적인 예를 도시한다. 예를 들면, 시스템은 복수의 엔티티에 대한 관리 협정에 관련되는 공개적으로 이용 가능한 데이터에 기초하여 하나 이상의 엔티티에 대한 각각의 예측을 디스플레이를 위해 생성할 수도 있다. 추가적으로 또는 대안적으로, 시스템은 엔티티에 대한 예측 및 다른 각각의 예측의 비교에 기초하여 복수의 엔티티 중에서 한 엔티티를 순위 매김할 수도 있다. 예를 들면, 유저 인터페이스(100)는 엔티티의 관리 협정에 관련되는 다수의 예측 및 관리 협정 데이터 및 관리 변환을 포함한다. 유저 인터페이스(100)의 인스턴스는, 엔티티에 이용 가능한 다양한 액션이 관리 변환의 그 가능성에 어떻게 영향을 끼치는지를 정량화하는 분석을 나타낼 수도 있다. 도 3과 관련하여 논의되는 바와 같이, 모델 및/또는 모델에 의해 생성되는 예측은 역테스트되고(backtested) 사전에 행동 주의를 제공하고 예측할 수 있다. 본 출원은 예측을 생성할 뿐만 아니라, 또한, 관리 변환의 기저의 원인에 대한 고유의 통찰력과 함께 내장된 분석을 제공한다.
본원에서 언급되는 바와 같이, 엔티티의 관리 협정은 엔티티의 조직, 엔티티에 의해 사용되는 경영 방식(administration scheme), 및/또는 엔티티의 제어 또는 관리 이익을 점유하는 직원을 포함한다. 예를 들면, 엔티티의 관리 협정은, 엔티티가 기업이든, 비영리 조직이든, 또는 정부 기관이든 간에, 엔티티가 관리되는, 경영되는, 또는 편제되는 방법을 포함할 수도 있다. 관리는, 재정적, 자연적, 기술적 및 인적 리소스와 같은 가용 리소스의 적용을 통해 자신의 목적을 달성하기 위해, 조직의 전략을 설정하고 그 직원의(또는 봉사자의) 노력을 조정하는 활동을 포함한다. 관리 협정은 조직을 관리하는 사람들 및/또는 그들 사람들의 엔티티에서의 직위를 또한 지칭할 수도 있다. 엔티티는 임의의 기업, 파트너십, 비영리 조직, 정부 기관, 및/또는 목표를 위한 사람들 및 리소스의 다른 그룹화를 포함한다. 본원에서 언급되는 바와 같이, 관리 변환은 행동 주의 캠페인의 론칭을 포함한다. 행동 주의 캠페인은 투자자 또는 주주가, 엔티티의 관리 협정을 변경하기 위해 레버리지로서 사용할 엔티티의 부분적인 또는 지배적 지분을 획득하는 것을 포함할 수도 있다. 본원에서 언급되는 바와 같이, 관리 협정 데이터는 기본 데이터, 소득 데이터, 시장 데이터, 거래량 데이터, 주주 권리 데이터, 구조 데이터, 보유권의 사이즈/기간, 소속의 수, 및/또는 관리 협정에 관련되는 임의의 다른 데이터를 포함할 수도 있는 관리 협정 데이터를 포함할 수도 있다. 관리 협정 데이터는 시간 기준으로 인덱싱되도록 사전 프로세싱될 수도 있다.
예측(102)은 엔티티에 대한 관리 변환의 확률뿐만 아니라, 복수의 다른 엔티티 중에서 엔티티의 관리 변환의 가능성의 순위를 포함한다. 예를 들면, 유저 인터페이스(100)는 본원에서 설명되는 바와 같이 한 애플리케이션에 의해 생성될 수도 있다. 애플리케이션은, 엔티티가 행동 주의의 타겟이 될 및/또는 관리 변환을 겪을 위험을 정량화하기 위한 분석 플랫폼일 수도 있다. 유저 인터페이스(100)는, 공공 엔티티에 대한 대량의 데이터와 연계하여 과거의 관리 변환(예를 들면, 행동 주의 캠페인의 론칭)을 분석하는 (예를 들면, 하기의 도 3에서 논의되는 바와 같은) 머신 러닝 모델에 기초할 수도 있다. 애플리케이션은 분산된 지리적 영역에 있는 광범위한 공공 엔티티에 대한 관리 변환의 가능성을 계산할 수도 있다. 관리 협정 데이터(106)는 엔티티 이름 또는 다른 식별자 및/또는 주식 가격, 평가, 및/또는 다른 정보와 같은 엔티티에 대한 정보를 포함할 수도 있다.
예측(104 및 108)은 관리 변환에 대해 특별히 관련이 있는 또는 고도로 영향을 끼치는 피쳐(예를 들면, 관리 협정 데이터의 카테고리 및/또는 값)을 포함할 수도 있다. 예를 들면, 예측(108)은 관리 변환과 고도로 상관되는 주요한 정성적 또는 정량적 메트릭을 포함할 수도 있다. 예측(110)은 관리 변환의 과거의 확률을 포함할 수도 있다. 몇몇 실시형태에서, 예측(110)은(예를 들면, 하기의 도 3에서 논의되는 바와 같이) 시계열의 특정한 시점에 기초하는 확률 및 예측을 포함할 수도 있다.
도 2는, 하나 이상의 실시형태에 따른, 한 엔티티 및 다른 엔티티의, 그들의 유사성에 기초한 비교에 액세스하기 위한 유저 인터페이스의 다른 인스턴스의 예시적인 예를 도시한다. 예를 들면, 몇몇 실시형태에서, 시스템은 엔티티의 관리 협정에 관련되는 데이터를 수신할 수도 있는데, 여기서 데이터는 그 엔티티의 시간적 특성 및 관리 변환을 포함한다. 그 다음, 시스템은 데이터 및 다른 엔티티에 대한 데이터의 유사성을 결정할 수도 있다. 그 다음, 시스템은, 디스플레이를 위해, 유저 인터페이스(예를 들면, 유저 인터페이스(200))에서, 유사성에 기초하여 엔티티 및 다른 엔티티의 비교를 생성할 수도 있다. 몇몇 실시형태에서, 비교는 엔티티에 대한 관리 변환의 결과를 포함한다.
유저 인터페이스(200)는 비교 가능한 엔티티(202)를 포함한다. 비교 가능한 엔티티(202)는 (예를 들면, 도 6과 관련하여 하기에서 논의되는 바와 같이) 임계 유사성을 갖는 복수의 엔티티를 포함할 수도 있다. 유저 인터페이스(200)는 비교 가능한 엔티티(202)에 대한 관리 협정 데이터의 하나 이상의 카테고리(예를 들면, 카테고리(208))를 또한 포함할 수도 있다. 유저 인터페이스(200)는, 몇몇 실시형태에서, 비교 가능한 엔티티(202)에 대한 관리 협정 데이터의 카테고리에 대한 각각의 값 및/또는 각각의 값의 비교를 포함할 수도 있다. 유저 인터페이스(200)는 하나 이상의 카테고리에 대한 값(예를 들면, 값(204))을 더 포함할 수도 있다. 이들 값은 비교 가능한 엔티티(202) 각각이 카테고리(208)에 대응하는 정도 및/또는 그 존재의 정성적 또는 정성적 표현일 수도 있다.
유저 인터페이스(200)는 비교 가능한 엔티티(202)에 대한 관리 변환에 관련되는 하나 이상의 카테고리(예를 들면, 카테고리(210))를 또한 포함할 수도 있다. 유저 인터페이스(200)는, 몇몇 실시형태에서, 비교 가능한 엔티티(202)의 관리 변환에 대한 관리 협정 데이터의 카테고리에 대한 각각의 값 및/또는 각각의 값의 비교를 포함할 수도 있다. 유저 인터페이스(200)는 하나 이상의 카테고리에 대한 값(예를 들면, 값(212))을 더 포함할 수도 있다. 이들 값은 비교 가능한 엔티티(202) 각각이 카테고리(210)에 대응하는 정도 및/또는 그 존재의 정성적 또는 정성적 표현일 수도 있다.
유저 인터페이스(200)는 권장 사항(recommendation)(206)을 또한 포함할 수도 있다. 권장 사항(206)은 관리 협정 데이터, 관리 변환, 및/또는 카테고리 및 그 값의 비교에 기초할 수도 있다. 예를 들면, 권장 사항(206)은 관리 협정 데이터, 관리 변환, 및/또는 카테고리 및 그 값의 비교에 기초하여 정성적 또는 정량적 표현(예를 들면, 텍스트, 시각적, 그래픽, 등등의 표현)을 제공할 수도 있다.
도 3은, 하나 이상의 실시형태에 따른, 랜덤 포레스트 분류기를 사용하여 관리 협정에 관련되는 예측을 생성하기 위해 다양한 시간적 특성을 갖는 데이터를 프로세싱하기 위한 시스템을 도시한다. 도 3에서 도시되는 바와 같이, 시스템(300)은 유저 디바이스(322), 유저 디바이스(324), 및/또는 다른 컴포넌트를 포함할 수도 있다. 각각의 유저 디바이스는 임의의 타입의 이동 단말, 고정 단말, 또는 다른 디바이스를 포함할 수도 있다. 이들 디바이스 각각은 입력/출력(이하 "I/O") 경로를 통해 콘텐츠 및 데이터를 수신할 수도 있고 I/O 경로를 사용하여 커맨드, 요청, 및 다른 적절한 데이터를 전송 및 수신하기 위한 제어 회로부(circuitry) 및/또는 프로세서를 또한 포함할 수도 있다. 제어 회로부는 임의의 적절한 프로세싱 회로부로 구성될 수도 있다. 이들 디바이스 각각은, 데이터를 수신하고 디스플레이함에 있어서 사용하기 위한 유저 입력 인터페이스 및/또는 디스플레이(예를 들면, 유저 인터페이스(100)(도 1))를 또한 포함할 수도 있다. 예로서, 유저 디바이스(322) 및 유저 디바이스(324)는 데스크탑 컴퓨터, 서버, 또는 다른 클라이언트 디바이스를 포함할 수도 있다. 유저는, 예를 들면, 유저 디바이스 중 하나 이상을 활용하여, 서로, 하나 이상의 서버와, 또는 시스템(300)의 다른 컴포넌트와 상호 작용할 수도 있다. 하나 이상의 동작이 본원에서 시스템(300)의 특정한 컴포넌트에 의해 수행되는 것으로 설명되지만, 그들 동작은, 몇몇 실시형태에서, 시스템(300)의 다른 컴포넌트에 의해 수행될 수도 있다는 것을 유의해야 한다. 한 예로서, 하나 이상의 동작이 본원에서 유저 디바이스(322)의 컴포넌트에 의해 수행되는 것으로 설명되지만, 그들 동작은, 몇몇 실시형태에서, 유저 디바이스(324)의 컴포넌트에 의해 수행될 수도 있다. 시스템(300)은, 유저 디바이스(322) 및 유저 디바이스(324) 상에서 구현될 수도 있거나, 또는 통신 경로(328 및 330)에 의해 각각 액세스될 수도 있는 머신 러닝 모델(302)을 또한 포함한다. 몇몇 실시형태가 본원에서 머신 러닝 모델과 관련하여 설명되지만, 다른 실시형태에서는, 다른 예측 모델(예를 들면, 통계 모델 또는 다른 분석 모델)이, 머신 러닝 모델 대신에, 또는 머신 러닝 모델에 추가하여, 사용될 수도 있다는 것을 유의해야 한다(예를 들면, 하나 이상의 실시형태에서, 머신 러닝 모델을 대체하는 통계 모델 및 비 머신 러닝 모델(non-machine learning model)을 대체하는 비 통계 모델(non-statistical model)).
이들 디바이스 각각은 전자 스토리지의 형태의 메모리를 또한 포함할 수도 있다. 전자 스토리지는 정보를 전자적으로 저장하는 비일시적인 저장 매체를 포함할 수도 있다. 매체의 전자 스토리지는 (i) 서버 또는 클라이언트 디바이스와 일체로(예를 들면, 실질적으로 비착탈식(non-removable)) 제공되는 시스템 스토리지 및/또는 (ii) 예를 들면, 포트(예를 들면, USB 포트, 파이어와이어 포트, 등등) 또는 드라이브(예를 들면, 디스크 드라이브, 등등)을 통해 서버 또는 클라이언트 디바이스에 착탈 가능하게 연결 가능한 착탈식 스토리지(removable storage)를 포함할 수도 있다. 전자 스토리지는 광학적으로 판독 가능한 저장 매체(예를 들면, 광학 디스크, 등등), 자기적으로 판독 가능한 저장 매체(예를 들면, 자기 테이프, 자기 하드 드라이브, 플로피 드라이브, 등등), 전하 기반의 저장 매체(예를 들면, EEPROM, RAM, 등등), 솔리드 스테이트 저장 매체(예를 들면, 플래시 드라이브, 등등), 및/또는 다른 전자적으로 판독 가능한 저장 매체를 포함할 수도 있다. 전자 스토리지는 가상 스토리지 리소스(예를 들면, 클라우드 스토리지, 가상 사설망, 및/또는 다른 가상 스토리지 리소스)를 포함할 수도 있다. 전자 스토리지는 소프트웨어 알고리즘, 프로세서에 의해 결정되는 정보, 서버로부터 획득되는 정보, 클라이언트 디바이스로부터 획득되는 정보, 또는 본원에서 설명되는 바와 같은 기능성(functionality)을 가능하게 하는 다른 정보를 저장할 수도 있다.
몇몇 실시형태에서, 시스템(300)은, 소스 코드 프로그래밍 프로젝트에 대한 기여자 성능을 모니터링하기 위한 소프트웨어 개발 버전 제어 시스템을 제공하기 위한 다수의 클라우드 기반의 컴포넌트를 포함하는 클라우드 기반의 시스템을 나타낼 수도 있다. 클라우드 기반의 시스템은 메모리, 제어 회로부, 및/또는 I/O 회로부와 같은 컴포넌트를 포함할 수도 있다. 그러한 실시형태에서, 시스템(300) 및/또는 시스템(300)의 하나 이상의 기능은 복수의 위치 및/또는 디바이스에 걸쳐 분산될 수도 있다.
도 3은 통신 경로(328, 330, 및 332)를 또한 포함한다. 통신 경로(328, 330, 및 332)는 인터넷, 이동 전화 네트워크, 모바일 음성 또는 데이터 네트워크(예를 들면, 4G 또는 LTE 네트워크), 케이블 네트워크, 공중 교환식 전화망(public switched telephone network), 또는 다른 타입의 통신 네트워크 또는 통신 네트워크의 조합을 포함할 수도 있다. 통신 경로(328, 330, 및 332)는 하나 이상의 통신 경로, 예컨대 위성 경로, 광섬유 경로, 케이블 경로, 인터넷 통신(예를 들면, IPTV), (예를 들면, 브로드캐스트 또는 다른 무선 신호를 위한) 자유 공간 연결을 지원하는 경로, 또는 임의의 다른 적절한 유선 또는 무선 통신 경로 또는 그러한 경로의 조합을 포함할 수도 있다. 컴퓨팅 디바이스는 함께 동작하는 복수의 하드웨어, 소프트웨어, 및/또는 펌웨어 컴포넌트를 연결하는 추가적인 통신 경로를 포함할 수도 있다. 예를 들면, 컴퓨팅 디바이스는 컴퓨팅 디바이스로서 함께 동작하는 컴퓨팅 플랫폼의 클라우드에 의해 구현될 수도 있다.
한 예로서, 도 3과 관련하여, 머신 러닝 모델(302)은 입력(304)을 취하고 출력(306)을 제공할 수도 있다. 입력은 트레이닝 데이터 세트 및 테스트 데이터 세트와 같은 다수의 데이터 세트를 포함할 수도 있다. 복수의 데이터 세트(예를 들면, 입력(304)) 각각은 공통 특성을 갖는 데이터 서브세트를 포함할 수도 있다. 예를 들면, 입력(304)은 과거, 현재 및/또는 미래의 행동 주의 캠페인에 대한 정보를 포함할 수도 있다. 추가적으로 또는 대안적으로, 입력(304)은 관리 협정 데이터를 포함할 수도 있다. 본원에서 언급되는 바와 같이, 관리 협정 데이터는 기본 데이터, 소득 데이터, 시장 데이터, 거래량 데이터, 주주 권리 데이터, 구조 데이터, 보유권의 사이즈/기간, 소속의 수, 및/또는 관리 협정에 관련되는 임의의 다른 데이터를 포함할 수도 있는 관리 협정 데이터를 포함할 수도 있다. 관리 협정 데이터는 시간 기준으로 인덱싱되도록 사전 프로세싱될 수도 있다.
몇몇 실시형태에서, 머신 러닝 모델(302)은 랜덤 포레스트 분류기에 기초할 수도 있다. 랜덤 포레스트 분류기는 복수의 의사 결정 트리(decision tree)를 포함할 수도 있다. 각각의 의사 결정 트리는 개개의 분류를 제공할 수도 있다. 그 다음, 시스템은 다양한 개개의 분류를 평균화하는 것에 기초하여(또는 개개의 분류의 전체의 정성적 또는 정량적 평가를 제공하는 다른 동작 또는 기능을 사용하여) 클래스를 예측할 수도 있다. 랜덤 포레스트 분류기는 낮은 상관을 갖는 의사 결정 트리를 포함할 수도 있다. 예를 들면, 상관되지 않는(또는 다양한) 의사 결정 트리(또는 모델)의 사용은, 랜덤 포레스트 분류기에서 사용될 때, 더 정확한 예측을 제공할 수도 있다.
다양성을 보장하기 위해, 시스템은 각각의 개개의 의사 결정 트리가 대체물(replacement)을 갖는 데이터세트로부터 랜덤하게 샘플링될 수 있는 부트스트랩 집성(bootstrap aggregation)을 사용할 수도 있다. 예를 들면, 트레이닝 데이터 세트 사이즈가 N인 경우, 각각의 개개의 의사 결정 트리는, 대체물이 트레이닝 데이터 세트의 전체 사이즈가 N의 사이즈에서 유지되는 것을 보장하는 트레이닝 데이터 세트의 데이터의 서브세트에 대해 트레이닝될 수도 있다. 추가적으로 또는 대안적으로, 시스템은 다양성을 보장하기 위해 피쳐 랜덤성을 사용할 수도 있다. 예를 들면, 랜덤 포레스트의 각각의 의사 결정 트리는 (예를 들면, 모든 가능한 모든 피쳐와는 대조적으로) 피쳐의 랜덤 서브세트로부터만 선택될 수 있을 수도 있다.
그러나, 관리 협정에 관련되는 애플리케이션에 랜덤 포레스트 분류기에 기초하는 모델의 사용은 추가적인 기술적 장애를 생성한다. 특히, 관리 협정에 관련되는 애플리케이션은 시간적 특성을 필요로 한다(즉, 데이터는 특정한 시간/날짜에 상관되고 모델은 예측을 행하기 위해 이 상관을 고려해야만 한다). 따라서, 트레이닝을 위해 사용되는 각각의 피쳐 벡터는 시간 기준으로 인덱싱되어야만 한다.
이 시간적 특성의 적절한 보존이 없으면, 관리 협정에 관련되는 애플리케이션은 달성될 수 없고 및/또는 미래의 시간 기간에 관련되는 예측이 이루어질 수 없다. 이것은 랜덤 포레스트 분류기에 기초하는 모델의 경우 특히 문제가 된다. 랜덤 포레스트 분류기는, 종래에는, 시계열의 미래 지점에 기초하여 예측을 행하는 그들의 능력에서 제한된다. 즉, 랜덤 포레스트 분류기는 현재의 시간의 분류로 제한된다. 예를 들면, 랜덤 포레스트 분류기는 시간을 인식하지 못한다. 대신, 랜덤 포레스트 분류기는 관측치를, 연속 종속성에 의해 특성 묘사되는 시계열 데이터와는 대조적으로, 독립적인 것으로 그리고 동일하게 분포되는 것으로 간주한다.
이 한계를 극복하기 위해, 랜덤 포레스트 분류기를 위한 데이터를 트레이닝시키는 시스템 및 방법은 각각의 피쳐 벡터를 시간 기준으로 인덱싱되게 만들도록 사전 프로세싱된다. 예를 들면, 주어진 엔티티에 대한 피쳐 벡터는, 기본 데이터, 소득 데이터, 시장 데이터, 거래량 데이터, 주주 권리 데이터, 구조 데이터, 보유권의 사이즈/기간, 소속의 수, 및/또는 관리 협정에 관련되는 임의의 다른 데이터를 포함할 수도 있는 관리 협정 데이터를 포함할 수도 있다. 피쳐 벡터에 대한 시간 인덱스는 피쳐 벡터에서의 데이터의 시간에 대응할 수도 있다.
사전 프로세싱은 통계적 변환, 추세 제거, 시간 지연 임베딩, 또는 피쳐 엔지니어링 중 하나 이상을 포함할 수도 있다. 이 사전 프로세싱은 랜덤 포레스트 분류기에 의해 프로세싱될 시계열 정보를 축소할 수도 있다. 통계적 변환은 Box-Cox(박스-콕스) 변환(예를 들면, 비정규 종속 변수를 정상 형상으로 변환함) 또는 거듭제곱 변환(power transformation)(예를 들면, 멱함수(power function)를 사용한 데이터의 단조 변환)을 포함할 수도 있다. 추세 제거는 일련의 측정치를 시계열로서 프로세싱하는 것 및 측정치를 그들이 발생한 시간에 관련시키는 것에 의해, 추정을 행하고 데이터에서의 경향에 대한 진술을 정당화하기 위해 추세를 추정하는 것을 포함할 수도 있다. 추세 제거는 차분(differencing), STL, SEATS를 포함할 수도 있다. 차분은 시계열 데이터를 고정 상태로 만들기 위해 시계열 데이터에 적용되는 변환이다. 시간 지연 임베딩은 동적 시스템 모델에서 과거 정보를 포함하는 것에 관련이 있으며, 피쳐 엔지니어링은 지연, 롤링 통계, Fourier(푸리에) 항, 시간 더미, 등등을 모델에 도입하는 것을 포함할 수도 있다.
사전 프로세싱에 후속하여, 그 다음, 랜덤 포레스트 분류기를 사용하는 모델이 트레이닝될 수도 있다. 그 다음, 트레이닝된 모델은 관리 협정에 관련되는 애플리케이션에 적용될 때 하나 이상의 이점을 달성할 수도 있다. 첫째, 모델은 관리 변환의 있음직한 성공(예를 들면, 론칭된 행동 주의 캠페인의 성공의 가능성)뿐만 아니라, 관리 변환이 발생할 가능성이 얼마인지(예를 들면, 행동 주의 캠페인이 론칭될 가능성)에 대한 예측을 제공할 수도 있다. 둘째, 모델은, 현재 엔티티에 대한 예측을 제공하기 위해, 현재 엔티티 및/또는 그들 엔티티에 대한 관리 협정 및 관리 협정 데이터를, 관리 변환의 특색을 묘사한 엔티티의 과거의 관리 협정 및 관리 협정 데이터에 비교하는 다수의 해석 도구를 제공할 수도 있다. 추가적으로 또는 대안적으로, 모델은 관리 변환의 성공 또는 발생의 가능성에 대한 주어진 피쳐(예를 들면, 관리 협정 데이터의 카테고리 및/또는 값)의 영향을 식별하는 해석 도구를 제공할 수도 있다. 셋째, 모델이 특정한 환경에 대해 조정 가능하게 되는 것을 허용하기 위해, 모델은 사후 프로세싱을 통해 주어진 시계열뿐만 아니라 다른 요인(예를 들면, 지리적 고려 사항)에 기초하여 조정될 수도 있는 출력을 제공할 수도 있다.
사후 프로세싱은 랜덤 포레스트 분류기의 출력을 하나의 확률 모델로부터 다른 것으로 변환하는 것을 포함할 수도 있다. 예를 들면, 랜덤 포레스트 분류기의 출력은 어쩌면 가능성 비율(likelihood ratio)에 기초하여 예측될 수도 있다. 가능성 비율은, 주어진 테스트 결과가 타겟 클래스를 가지고 데이터에서 예상될 가능성 대 동일한 결과가 타겟 클래스가 없이 데이터에서 예상될 가능성이다. 몇몇 실시형태에서, 이 확률(또는 그 분포)은 관찰된 비율과는 상이할 수도 있다. 예를 들면, 시스템은 확률을 정규 분포 또는 베르누이 분포로부터, 랜덤 변수의 지수로서 나타나며 분포의 형상을 제어하는, α 및 β에 의해 나타내어지는 두 개의 양의 형상 파라미터에 의해 파리미터화되는 구간 [0, 1] 상에서 확률 분포가 정의되는 베타 분포로 변환할 수도 있다. 다른 예에서, 랜덤 포레스트 분류기의 출력은, 방향성 비순환 그래프(directed acyclic graph)를 통해 변수의 세트 및 그들의 조건부 종속성을 나타내는 Bayesian(베이지안) 네트워크로 변환될 수도 있다. 그 다음, 베이지안 네트워크는, 주어진 관리 변환에 대한 영향 피쳐를 결정하기 위해 사용될 수도 있다.
몇몇 실시형태에서, 출력(306)은 머신 러닝 모델(302)을 트레이닝시키기 위한 입력으로서 (예를 들면, 단독으로 또는 출력(306)의 정확도의 유저 지시(user indication), 입력과 관련되는 라벨, 또는 다른 참조 피드백 정보와 연계하여) 머신 러닝 모델(302)에 피드백될 수도 있다. 다른 실시형태에서, 머신 러닝 모델(302)은 자신의 예측(예를 들면, 출력(306))의 평가 및 참조 피드백 정보(예를 들면, 정확도의 유저 지시, 참조 라벨, 또는 다른 정보)에 기초하여 자신의 구성(예를 들면, 가중치, 편향, 또는 다른 파라미터)을 업데이트할 수도 있다. 머신 러닝 모델(302)이 신경망인 다른 실시형태에서, 신경망의 예측과 참조 피드백 사이의 차이를 조정하도록 연결 가중치가 조정될 수도 있다. 또 다른 사용 사례에서, 신경망의 하나 이상의 뉴런(또는 노드)은 업데이트 프로세스(예를 들면, 에러의 역전파)를 용이하게 하기 위해 그들 각각의 에러가 신경망을 통해 그들에게 역방향으로 전송되는 것을 규정할 수도 있다. 연결 가중치에 대한 업데이트는, 예를 들면, 순방향 전달이 완료된 이후 역방향으로 전파되는 에러의 크기를 반영할 수도 있다. 이러한 방식으로, 예를 들면, 머신 러닝 모델(302)은 더 나은 예측을 생성하도록 트레이닝될 수도 있다.
몇몇 실시형태에서, 머신 러닝 모델(302)은 인공 신경망을 포함할 수도 있다. 그러한 실시형태에서, 머신 러닝 모델(302)은 입력 계층 및 하나 이상의 은닉 계층을 포함할 수도 있다. 머신 러닝 모델(302)의 각각의 신경 단위는 머신 러닝 모델(302)의 많은 다른 신경 단위와 연결될 수도 있다. 그러한 연결은 연결된 신경 단위의 활성화 상태에 대한 그들의 영향을 보강할 수 있거나 또는 억제할 수 있다. 몇몇 실시형태에서, 각각의 개개의 신경 단위는 모든 자신의 입력의 값을 함께 결합하는 합산 함수를 가질 수도 있다. 몇몇 실시형태에서, 각각의 연결(또는 신경 단위 그 자체)은 신호가 다른 신경 단위로 전파되기 이전에 초과해야만 하는 임계 함수를 가질 수도 있다. 머신 러닝 모델(302)은, 명시적으로 프로그래밍되기보다는, 자가 학습 및 트레이닝될 수도 있으며, 전통적인 컴퓨터 프로그램과 비교하여, 문제 해결의 소정의 영역에서 훨씬 더 양호하게 수행할 수 있다. 트레이닝 동안, 머신 러닝 모델(302)의 출력 계층은 머신 러닝 모델(302)의 분류에 대응할 수도 있고 그 분류에 대응하는 것으로서 공지되어 있는 입력은 트레이닝 동안 머신 러닝 모델(302)의 입력 계층에 입력될 수도 있다. 테스팅 동안, 공지된 분류가 없는 입력이 입력 계층에 입력될 수도 있고, 결정된 분류가 출력될 수도 있다.
몇몇 실시형태에서, 머신 러닝 모델(302)은 다수의 계층(예를 들면, 신호 경로가 전방 계층으로부터 후방 계층으로 횡단하는 경우)을 포함할 수도 있다. 몇몇 실시형태에서, 역전파 기술은 "전방의" 신경 단위에 대한 가중치를 재설정하기 위해 순방향 자극이 사용되는 머신 러닝 모델(302)에 의해 활용될 수도 있다. 몇몇 실시형태에서, 머신 러닝 모델(302)에 대한 자극 및 억제는, 연결이 더 혼란스럽고 복잡한 방식으로 상호 작용하는 상태에서, 더 자유롭게 흐를 수도 있다. 테스팅 동안, 머신 러닝 모델(302)의 출력 계층은 주어진 입력이 머신 러닝 모델(302)의 분류에 대응하는지 또는 대응하지 않는지의 여부를 나타낼 수도 있다(예를 들면, 주어진 제1 해상도 타입에 대한 프로그래밍 시간의 결정된 평균 길이에 기초하여 프로그래밍 시간의 제1 길이를 결정함).
도 3에서 도시되는 바와 같이, 머신 러닝 모델(302)은 유저 디바이스(324) 상에서 디스플레이되는 예측(334)의 출력을 생성하였다. 예측(334)은 상기의 도 1 및 도 2에서 설명되는 정보뿐만 아니라 하기의 도 4 내지 도 6에서 설명되는 바와 같은 추가적인 정보를 포함할 수도 있다. 예를 들면, 몇몇 실시형태에서, 예측(334)은 유저 인터페이스(100)(도 1) 또는 유저 인터페이스(200)(도 2)의 인스턴스에 대응할 수도 있다.
도 4는, 하나 이상의 실시형태에 따른, 랜덤 포레스트 분류기를 사용하여 관리 협정에 관련되는 예측을 생성하기 위해 다양한 시간적 특성을 갖는 데이터를 프로세싱함에 있어서 수반되는 단계의 플로우차트를 도시한다. 예를 들면, 프로세스(400)는 도 1 내지 도 3에서 도시되는 바와 같이 하나 이상의 디바이스에 의해 취해지는 단계를 나타낼 수도 있다.
단계(402)에서, 프로세스(400)는 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 제1 엔티티의 제1 관리 협정에 관련되는 제1 데이터를 수신한다. 예를 들면, 시스템은, 제어 회로부를 사용하여, 제1 엔티티의 제1 관리 협정에 관련되는 제1 데이터를 수신할 수도 있는데, 여기서 제1 데이터는 제1 엔티티의 제1 시간적 특성(예를 들면, 날짜) 및 제1 관리 변환(예를 들면, 행동 주의 캠페인의 론칭)을 포함한다. 예를 들면, 제1 관리 변환은 제1 관리 협정에 대한 제1 행동 주의 캠페인의 론칭을 포함할 수도 있다. 시간적 특성은 과거 날짜에 관련될 수도 있다.
단계(404)에서, 프로세스(400)는 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 제1 데이터에 대한 제1 피쳐 벡터를 생성한다. 예를 들면, 시스템은, 제어 회로부를 사용하여, 제1 데이터에 대한 제1 피쳐 벡터를 생성할 수도 있는데, 여기서 제1 피쳐 벡터의 제1 엘리먼트는 제1 시간적 특성에 대응한다. 시간적 특성은 피쳐 벡터에서 인덱싱되는 시간 값에 대응할 수도 있다. 시간 값은 피쳐 벡터에 대응하는 관리 협정 데이터의 날짜를 나타낼 수도 있다.
단계(406)에서, 프로세스(400)는 제1 데이터를 제1 관리 변환에 대응하는 것으로서 분류하기 위해 제1 피쳐 벡터에 기초하여 랜덤 포레스트 분류기를 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 트레이닝시킨다. 예를 들면, 시스템은, 제어 회로부를 사용하여, 제1 데이터를 제1 관리 변환에 대응하는 것으로 분류하기 위해 제1 피쳐 벡터에 기초하여 랜덤 포레스트 분류기를 트레이닝시킬 수도 있다. 몇몇 실시형태에서, 제1 데이터를 제1 관리 변환에 대응하는 것으로 분류하기 위해 제1 피쳐 벡터에 기초하여 랜덤 포레스트 분류기를 트레이닝시키는 것은 과거의 관리 협정에 관련되는 과거의 데이터 및 과거의 관리 변환에 대해 랜덤 포레스트 분류기를 역테스트하는 것을 포함한다. 예를 들면, 시스템은 랜덤 포레스트 분류기의 성능을 마치 그것이 과거의 기간 동안 활용된 것처럼 역테스팅을 사용하여 추정할 수도 있다. 그러한 경우, 시스템은 과거 데이터를 사용하여 충분한 세부 정보를 가지고 과거 조건을 시뮬레이팅할 수도 있다. 몇몇 실시형태에서, 시스템은 과적합을 방지하기 위해 역테스팅을 제한할 수도 있고 및/또는 과적합을 방지하기 위해 추가적인 트레이닝 기술을 채택할 수도 있다.
몇몇 실시형태에서, 랜덤 포레스트 분류기는 시계열 분류기일 수도 있고, 예측된 제2 관리 변환은 다른 시간적 특성과는 구별되는 시간적 특성일 수도 있다. 예를 들면, 예측된 제2 관리 변환의 시간적 특성은 미래에 있을 수도 있다.
단계(408)에서, 프로세스(400)는 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 제2 엔티티의 제2 관리 협정에 관련되는 제2 데이터를 수신한다. 예를 들면, 시스템은, 제어 회로부를 사용하여, 제2 엔티티의 제2 관리 협정에 관련되는 제2 데이터를 수신할 수도 있는데, 여기서 제2 데이터는 제2 엔티티의 제2 시간적 특성(예를 들면, 날짜) 및 공지되지 않은 관리 변환(예를 들면, 행동 주의 캠페인이 론칭될 것인지 또는 아닐 것인지의 여부)을 포함한다. 시간적 특성은 현재 또는 미래 날짜에 관련될 수도 있다. 몇몇 실시형태에서, 시스템은 (예를 들면, 유저 인터페이스(100)(도 1) 또는 유저 인터페이스(200)(도 2)를 통해) 복수의 엔티티에 대한 관리 협정에 관련되는 공개적으로 이용 가능한 데이터의 리뷰를 개시하는 유저 입력을 수신할 수도 있다. 리뷰에 응답하여, 시스템은 제2 데이터에 대해 데이터 소스(예를 들면, 시스템(300)(도 3)에 통합되고 및/또는 그에 의해 액세스 가능한 데이터 소스)에게 질의할 수도 있는데, 여기서 제2 데이터는 질의에 응답하여 수신된다.
단계(410)에서, 프로세스(400)는 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 제2 데이터에 대한 제2 피쳐 벡터를 생성한다. 예를 들면, 시스템은, 제어 회로부를 사용하여, 제2 데이터에 대한 제2 피쳐 벡터를 생성할 수도 있는데, 여기서 제2 피쳐 벡터의 제2 엘리먼트는 제2 시간적 특성에 대응한다.
단계(412)에서, 프로세스(400)는 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 제2 피쳐 벡터를 랜덤 포레스트 분류기에 입력한다. 예를 들면, 시스템은, 제어 회로부를 사용하여, 제2 피쳐 벡터를 랜덤 포레스트 분류기에 입력할 수도 있다.
단계(414)에서, 프로세스(400)는 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 예측된 제2 관리 변환에 관련되는 랜덤 포레스트 분류기로부터의 출력을 수신한다. 예를 들면, 시스템은, 제어 회로부를 사용하여, 예측된 제2 관리 변환에 관련되는 랜덤 포레스트 분류기로부터의 출력을 수신할 수도 있다.
단계(416)에서, 프로세스(400)는 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 예측된 제2 관리 변환에 기초한 예측을 디스플레이를 위해 생성한다. 예를 들면, 시스템은, 디스플레이를 위해, 유저 인터페이스에서, 예측된 제2 관리 변환에 기초한 예측을 생성할 수도 있다. 몇몇 실시형태에서, 제1 관리 변환은 제1 관리 협정에 대한 제1 행동 주의 캠페인의 론칭을 포함할 수도 있고, 예측된 제2 관리 변환에 기초한 예측은 제2 관리 협정에 대한 제2 행동 주의 캠페인의 론칭의 확률을 포함할 수도 있다.
몇몇 실시형태에서, 시스템은 도 1 및 도 2에서 도시되는 바와 같은 하나 이상의 피쳐를 생성하기 위해 추가적인 단계를 추가로 수행할 수도 있다. 예를 들면, 시스템은 출력을 지수 분포로부터 Bayes(베이즈) 분류기에 기초한 확률로 변환할 수도 있는데, 여기서 예측은 확률을 포함한다. 추가적으로 또는 대안적으로, 시스템은 특정한 정보를 가지고 예측을 생성할 수도 있다. 예를 들면, 시스템은, 제1 데이터 중, 제1 관리 변환을 나타내는 제1 자료(datum)(예를 들면, 제1 엔티티의 주가 필드 또는 카테고리)를 결정할 수도 있다. 그 다음, 시스템은, 제2 데이터 중, 제1 자료에 대응하는 제2 자료(예를 들면, 제2 엔티티의 주가 필드 또는 카테고리)를 결정할 수도 있다. 그 다음, 시스템은, 디스플레이를 위해, 예측에서 제2 자료의 표현을 생성할 수도 있다. 추가적으로 또는 대안적으로, 시스템은 특정한 값(예를 들면, 주가 값)에 대한 정보를 생성할 수도 있다. 예를 들면, 시스템은 제1 관리 변환을 나타내는 제1 자료에 대한 제1 값(예를 들면, 제1 엔티티의 주가 값)을 결정할 수도 있다. 그 다음, 시스템은 제1 값에 대응하는 제2 자료의 제2 값(예를 들면, 제2 엔티티의 주가 값)을 결정할 수도 있다. 그 다음, 시스템은, 디스플레이를 위해, 예측에서 제2 값의 표현을 생성할 수도 있다.
도 4의 단계 또는 설명은 본 개시의 임의의 다른 실시형태와 함께 사용될 수도 있다는 것이 고려된다. 또한, 도 4와 관련하여 설명되는 단계 및 설명은 본 개시의 목적을 진전시키기 위해 대안적인 순서로 또는 병렬로 행해질 수도 있다. 예를 들면, 이들 단계 각각은 시스템 또는 방법의 속도를 증가시키기 위해 또는 지연을 감소시키기 위해 임의의 순서로 또는 병렬로 또는 실질적으로 동시에 수행될 수도 있다. 더구나, 도 1 내지 도 3과 관련하여 논의되는 디바이스 또는 기기 중 임의의 것은 도 4의 단계 중 하나 이상을 수행하기 위해 사용될 수 있다는 것을 유의해야 한다.
도 5는, 하나 이상의 실시형태에 따른, 다양한 타입의 데이터를 사용하여 예측을 생성함에 있어서 수반되는 단계의 플로우차트를 도시한다. 예를 들면, 시스템은 복수의 엔티티에 대한 관리 협정에 관련되는 공개적으로 이용 가능한 데이터에 기초하여 복수의 엔티티에 대한 각각의 예측을 디스플레이를 위해 생성할 수도 있다. 추가적으로 또는 대안적으로, 시스템은 예측 및 각각의 예측의 비교에 기초하여 복수의 엔티티 중에서 한 엔티티를 순위 매김할 수도 있다. 예를 들면, 프로세스(500)는 도 1 내지 도 3에서 도시되는 바와 같이 하나 이상의 디바이스에 의해 취해지는 단계를 나타낼 수도 있다.
단계(502)에서, 프로세스(500)는 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 제1 엔티티에 대한 예측을 위한 질의를 수신한다. 예를 들면, 질의는, 유저가 유저 인터페이스(100)(도 1)에 액세스하는 것 및/또는 유저 인터페이스(100)(도 1)에서 아이콘을 선택하는 것에 응답하여 시스템에 의해 생성될 수도 있다.
단계(504)에서, 프로세스(500)는 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 예측이 비교 가능한 엔티티를 포함하는지의 여부를 결정한다. 만약 그렇다면, 프로세스(500)는 단계(506)로 진행한다. 예를 들면, 시스템은, 예측에서 어떤 정보를 포함해야 하는지, 뿐만 아니라, 어떤 정보가 예측에 수반되어야 하는지를 결정할 때 다양한 기준을 사용할 수도 있다. 시스템은 유저 입력에 기초하여 또는 애플리케이션 설정에 기초하여 자동적으로 하나 이상의 기준을 선택할 수도 있다. 만약 그렇지 않다면, 프로세스(500)는 단계(512)로 진행한다.
단계(506)에서, 프로세스(500)는 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 예측을 생성함에 있어서 사용하기 위한 비교 가능한 엔티티를 결정한다. 예를 들면, 몇몇 실시형태에서, 이것은 하기의 도 6에서 논의되는 바와 같이 두 개의 엔티티 사이의 유사성을 결정하는 것을 포함할 수도 있다. 비교 가능한 엔티티를 결정하는 것에 응답하여, 시스템은 비교 가능한 엔티티(또는 비교 가능한 엔티티를 식별하는 정보)를 저장하고 단계(508)로 진행할 수도 있다.
단계(508)에서, 프로세스(500)는 예측이 비교 가능한 엔티티에 대한 관리 협정 데이터를 포함하는지의 여부를 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 결정한다. 만약 그렇다면, 프로세스(500)는 단계(510)로 진행한다. 만약 그렇지 않다면, 프로세스(500)는 단계(512)로 진행한다.
단계(510)에서, 프로세스(500)는 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 비교 가능한 엔티티에 대한 관리 협정 데이터를 결정한다. 예를 들면, 몇몇 실시형태에서, 이것은 정보를 제1 엔티티의 현재의 또는 과거의 정보에 비교함에 있어서 사용하기 위한 엔티티에 대한 정보를 결정하는 것을 포함할 수도 있다. 예를 들면, 시스템은, 제1 데이터 중, 제1 관리 변환을 나타내는 제1 자료(예를 들면, 제1 엔티티의 위원회 구성 필드(board composition field) 또는 카테고리)를 결정할 수도 있다. 그 다음, 시스템은, 제2 데이터 중, 제1 자료에 대응하는 제2 자료(예를 들면, 제2 엔티티의 위원회 구성 필드 또는 카테고리)를 결정할 수도 있다. 그 다음, 시스템은, 디스플레이를 위해, 예측에서 제2 자료의 표현을 생성할 수도 있다. 추가적으로 또는 대안적으로, 시스템은 특정한 값(예를 들면, 위원회 멤버의 수 및/또는 구성의 정량적 또는 정성적 평가를 나타내는 다른 값과 같은 위원회 구성을 나타내는 값)에 대한 정보를 생성할 수도 있다. 예를 들면, 시스템은 제1 관리 변환을 나타내는 제1 자료에 대한 제1 값(예를 들면, 제1 엔티티의 위원회 구성 값)을 결정할 수도 있다. 그 다음, 시스템은 제1 값에 대응하는 제2 자료의 제2 값(예를 들면, 제2 엔티티의 위원회 구성 값)을 결정할 수도 있다.
단계(512)에서, 프로세스(500)는 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 예측이 임의의 추가적인 정보를 포함하는지의 여부를 결정한다. 만약 그렇다면, 프로세스(500)는 단계(514)로 진행한다. 만약 그렇지 않다면, 프로세스(500)는 단계(516)로 진행한다.
단계(514)에서, 프로세스(500)는 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 제1 엔티티에 대한 추가적인 정보를 결정한다. 예를 들면, 추가적인 정보는 제1 엔티티에 관련되는 도 1 및 도 2에서 도시되는 정보 중 임의의 것을 포함할 수도 있다. 이것은 이름, 소득 데이터, 시장 데이터, 거래량, 주주 권리, 등등, 및/또는 관리 협정의 평가에 관련될 수도 있는 임의의 다른 정보를 포함할 수도 있다.
단계(516)에서, 프로세스(500)는 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 프로세스(500) 동안 결정되는 정보에 기초하여 예측을 생성한다. 예를 들면, 프로세스(500) 동안 결정되는 정보는 유저 인터페이스(예를 들면, 유저 인터페이스(100)(도 1) 또는 유저 인터페이스(200)(도 2))를 채우기 위해 시스템에 의해 사용될 수도 있다.
도 5의 단계 또는 설명은 본 개시의 임의의 다른 실시형태와 함께 사용될 수도 있다는 것이 고려된다. 또한, 도 5와 관련하여 설명되는 단계 및 설명은 본 개시의 목적을 진전시키기 위해 대안적인 순서로 또는 병렬로 행해질 수도 있다. 예를 들면, 이들 단계 각각은 시스템 또는 방법의 속도를 증가시키기 위해 또는 지연을 감소시키기 위해 임의의 순서로 또는 병렬로 또는 실질적으로 동시에 수행될 수도 있다. 더구나, 도 1 내지 도 3과 관련하여 논의되는 디바이스 또는 기기 중 임의의 것은 도 5의 단계 중 하나 이상을 수행하기 위해 사용될 수 있다는 것을 유의해야 한다.
도 6은, 하나 이상의 실시형태에 따른, 한 엔티티 및 다른 엔티티의, 그들의 유사성에 기초한 비교를 생성함에 있어서 수반되는 단계의 플로우차트를 도시한다. 예를 들면, 몇몇 실시형태에서, 시스템은 엔티티의 관리 협정에 관련되는 데이터를 수신할 수도 있는데, 여기서 데이터는 그 엔티티의 시간적 특성 및 관리 변환을 포함한다. 그 다음, 시스템은 데이터 및 다른 엔티티에 대한 데이터의 유사성을 결정할 수도 있다. 그 다음, 시스템은, 디스플레이를 위해, 유저 인터페이스(예를 들면, 유저 인터페이스(200)(도 2))에서, 유사성에 기초하여 엔티티 및 다른 엔티티의 비교를 생성할 수도 있다. 몇몇 실시형태에서, 비교는 엔티티에 대한 관리 변환의 결과를 포함한다. 예를 들면, 프로세스(600)는 도 1 내지 도 3에서 도시되는 바와 같이 하나 이상의 디바이스에 의해 취해지는 단계를 나타낼 수도 있다.
단계(602)에서, 프로세스(600)는 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 제1 엔티티의 관리 협정에 관련되는 데이터를 수신한다. 예를 들면, 주어진 엔티티에 대해, 시스템(예를 들면, 모델 302(도 3))은, 관리 협정, 관리 협정 데이터, 관리 변환, 및/또는 관리 변환 데이터에 관련되는 그들의 가장 관련이 있는 메트릭의 관점에서 가장 유사한, 및/또는 과거에 관리 변환(예를 들면, 행동 주의 캠페인)에 노출되었던 비교 가능한 엔티티를 식별한다.
단계(604)에서, 프로세스(600)는 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 제2 엔티티의 관리 협정에 관련되는 데이터를 수신한다. 몇몇 실시형태에서, 시스템은 유사한 산업으로부터 제2 엔티티를 검색할 수도 있다. 몇몇 실시형태에서, 시스템은 상이한 산업으로부터의 엔티티 사이의 유사성을 결정할 수도 있다(예를 들면, 시스템은 상이한 산업으로부터의 엔티티가 유사한 것으로 지정되는 것을 배제하지 않을 수도 있다). 예를 들면, 시스템은, 선행하는 관리 변환 상황의 맥락에서 기저의 관리 협정 데이터의 유사성에 기초하여 "유효한 동료 그룹"을 결정할 수도 있다.
단계(606)에서, 프로세스(600)는 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 제1 및 제2 엔티티에 대한 데이터의 유사성을 결정한다. 예를 들면, 과거에 타겟으로 되었던 엔티티와 제1 엔티티 사이의 유사성은, 제1 엔티티가 관리 변환의 대상이 될 가능성이 있는 특정한 이유를 나타낼 수 있다.
단계(608)에서, 프로세스(600)는 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 유사성이 임계치를 초과하는지의 여부를 결정한다. 예를 들면, 시스템은 엔티티의 수, 산업, 시간 기간, 및/또는 다른 요인에 기초하여 임계치를 검색할 수도 있다. 임계치는 산업 표준에 기초하여 결정될 수도 있고 및/또는 (예를 들면, 유저 인터페이스(100)(도 1)를 통해) 유저에 의해 조정될 수도 있다. 만약 그렇다면, 프로세스(600)는 단계(610)로 진행한다. 유사성이 임계치를 초과하지 않는 경우, 프로세스(600)는 단계(604)로 복귀하여 상이한 엔티티에 대한 데이터를 수신한다.
단계(610)에서, 프로세스(600)는 (예를 들면, 시스템(300)(도 3)의 하나 이상의 컴포넌트의 제어 회로부를 통해) 제1 엔티티 및 제2 엔티티가 비교 가능하다는 것을 결정한다. 예를 들면, 제1 엔티티 및 제2 엔티티가 비교 가능하다는 것을 결정하는 것에 응답하여, 시스템은 (예를 들면, 제1 엔티티 및 제2 엔티티의 비교를 생성함에 있어서 사용하기 위한) 제2 엔티티에 대한 추가적인 정보를 결정할 수도 있다. 몇몇 실시형태에서, 시스템은 (예를 들면, 도 2에서 도시되는 바와 같이) 유사한 엔티티를 비교하는 유저 인터페이스의 인스턴스에서 제2 엔티티를 사용할 것을 결정할 수도 있다. 예를 들면, 시스템은 "비교 가능한 과거의 행동 주의 상황"의 주어진 세트를 결정할 수도 있고, 시스템이 관리 변환을 트리거하였던 요인 및/또는 관리 변환에 대해 영향력이 있는 피쳐에 관련되는 유저에 대한 권장 사항(예를 들면, 권장 사항(206)(도 2))을 생성하는 것을 허용하는 관리 변환 사이의 공통점을 디스플레이를 위해 생성할 수도 있다.
몇몇 실시형태에서, 시스템은 (예를 들면, 유저 인터페이스(100)(도 1)에서 권장 사항으로서 제시되는) 포괄적인 서술을 갖는 예측을 생성하기 위해 큰 영향 피쳐 분석을 전통적인 메트릭의 동료 비교와 결합할 수도 있다. 예를 들면, 시스템은, 엔티티가 관리 변환을 가질 가능성을 더 많게 또는 더 적게 만드는 것에 대해 가장 큰 영향을 끼치는 피쳐를 나열할 수도 있다. 높은 영향 피쳐가 모델 출력(예를 들면, 관리 변환의 가능성)과 가장 강력한 통계적 관련성을 갖는 모델 입력이 되도록 시스템은 통계적 학습 모델을 사용할 수도 있다.
도 6의 단계 또는 설명은 본 개시의 임의의 다른 실시형태와 함께 사용될 수도 있다는 것이 고려된다. 또한, 도 6과 관련하여 설명되는 단계 및 설명은 본 개시의 목적을 진전시키기 위해 대안적인 순서로 또는 병렬로 행해질 수도 있다. 예를 들면, 이들 단계 각각은 시스템 또는 방법의 속도를 증가시키기 위해 또는 지연을 감소시키기 위해 임의의 순서로 또는 병렬로 또는 실질적으로 동시에 수행될 수도 있다. 더구나, 도 1 내지 도 3과 관련하여 논의되는 디바이스 또는 기기 중 임의의 것은 도 6의 단계 중 하나 이상을 수행하기 위해 사용될 수 있다는 것을 유의해야 한다.
본 개시의 상기에서 설명된 실시형태는 제한이 아니라 예시의 목적을 위해 제시되며, 본 개시는 후속하는 청구범위에 의해서만 제한된다. 더구나, 임의의 하나의 실시형태에서 설명되는 피쳐 및 제한은 본원의 임의의 다른 실시형태에 적용될 수도 있고, 하나의 실시형태에 관련되는 플로우차트 또는 예는, 상이한 순서로 행해지는, 또는 병렬로 행해지는 적절한 방식으로 임의의 다른 실시형태와 결합될 수도 있다는 것을 유의해야 한다. 또한, 본원에서 설명되는 시스템 및 방법은 실시간으로 수행될 수도 있다. 또한, 상기에서 설명되는 시스템 및/또는 방법은 다른 시스템 및/또는 방법에 적용될 수도 있거나, 또는 다른 시스템 및/또는 방법에 따라 사용될 수도 있다는 것을 유의해야 한다.
본 기술은 다음의 열거된 실시형태를 참조하여 더 잘 이해될 것이다:
1. 랜덤 포레스트 분류기를 사용하여 관리 협정에 관련되는 예측을 생성하기 위해 다양한 시간적 특성을 갖는 데이터를 프로세싱하는 방법으로서, 방법은 다음의 것을 포함한다: 제어 회로부를 사용하여, 제1 엔티티의 제1 관리 협정에 관련되는 제1 데이터 - 제1 데이터는 제1 엔티티의 제1 시간적 특성 및 제1 관리 변환을 포함함 - 를 수신하는 것; 제어 회로부를 사용하여, 제1 데이터에 대한 제1 피쳐 벡터 - 제1 피쳐 벡터의 제1 엘리먼트는 제1 시간적 특성에 대응함 - 를 생성하는 것; 제어 회로부를 사용하여, 제1 데이터를 제1 관리 변환에 대응하는 것으로 분류하기 위해 제1 피쳐 벡터에 기초하여 랜덤 포레스트 분류기를 트레이닝시키는 것; 제어 회로부를 사용하여, 제2 엔티티의 제2 관리 협정에 관련되는 제2 데이터 - 제2 데이터는 제2 엔티티의 제2 시간적 특성 및 공지되지 않은 관리 변환을 포함함 - 를 수신하는 것; 제어 회로부를 사용하여, 제2 데이터에 대한 제2 피쳐 벡터 - 제2 피쳐 벡터의 제2 엘리먼트는 제2 시간적 특성에 대응함 - 를 생성하는 것; 제어 회로부를 사용하여, 제2 피쳐 벡터를 랜덤 포레스트 분류기에 입력하는 것; 제어 회로부를 사용하여, 예측된 제2 관리 변환에 관련되는 랜덤 포레스트 분류기로부터의 출력을 수신하는 것; 및 디스플레이를 위해, 유저 인터페이스에서, 예측된 제2 관리 변환에 기초한 예측을 생성하는 것.
2. 실시형태 1의 방법으로서, 출력을 지수 분포로부터 베이즈 분류기에 기초한 확률로 변환하는 것을 더 포함하는데, 여기서 예측은 확률을 포함한다.
3. 실시형태 1 또는 2의 방법으로서, 다음의 것을 더 포함한다: 제1 데이터 중, 제1 관리 변환을 나타내는 제1 자료를 결정하는 것; 제2 데이터 중, 제1 자료에 대응하는 제2 자료를 결정하는 것; 및 디스플레이를 위해, 예측에서 제2 자료의 표현을 생성하는 것.
4. 실시형태 3의 방법으로서, 다음의 것을 더 포함한다: 제1 관리 변환을 나타내는 제1 자료에 대한 제1 값을 결정하는 것; 제1 값에 대응하는 제2 자료의 제2 값을 결정하는 것; 및 디스플레이를 위해, 예측에서 제2 값의 표현을 생성하는 것.
5. 실시형태 1-4 중 임의의 하나의 방법으로서, 랜덤 포레스트 분류기는 시계열 분류기이고, 예측된 제2 관리 변환은 제3 시간적 특성을 갖는다.
6. 실시형태 1-5 중 임의의 하나의 방법으로서, 제1 관리 변환은 제1 관리 협정에 대한 제1 행동 주의 캠페인의 론칭을 포함하고, 예측된 제2 관리 변환에 기초한 예측은 제2 관리 협정에 대한 제2 행동 주의 캠페인의 론칭의 확률을 포함한다.
7. 실시형태 1-6 중 임의의 하나의 방법으로서, 제1 데이터를 제1 관리 변환에 대응하는 것으로 분류하기 위해 제1 피쳐 벡터에 기초하여 랜덤 포레스트 분류기를 트레이닝시키는 것은 과거의 관리 협정에 관련되는 과거의 데이터 및 과거의 관리 변환에 대해 랜덤 포레스트 분류기를 역테스트하는 것을 포함한다.
8. 실시형태 1-7 중 임의의 하나의 방법으로서, 다음의 것을 더 포함한다: 복수의 엔티티에 대한 관리 협정에 관련되는 공개적으로 이용 가능한 데이터의 리뷰를 개시하는 유저 입력을 수신하는 것; 및 리뷰에 응답하여, 제2 데이터에 대한 데이터 소스를 질의하는 것 - 제2 데이터는 질의에 응답하여 수신됨 - .
9. 실시형태 1-8 중 임의의 하나의 방법으로서, 다음의 것을 더 포함한다: 복수의 엔티티에 대한 관리 협정에 관련되는 공개적으로 이용 가능한 데이터에 기초하여 복수의 엔티티에 대한 각각의 예측을 디스플레이를 위해 생성하는 것; 및 예측 및 각각의 예측의 비교에 기초하여 복수의 엔티티 중에서 제2 엔티티를 순위 매김하는 것.
10. 실시형태 1-9 중 임의의 하나의 방법으로서, 다음의 것을 더 포함한다: 제3 엔티티의 제3 관리 협정에 관련되는 제3 데이터 - 제3 데이터는 제3 엔티티의 제3 시간적 특성 및 제3 관리 변환을 포함함 - 를 수신하는 것; 제3 데이터 및 제2 데이터의 유사성을 결정하는 것; 및 디스플레이를 위해, 유저 인터페이스에서, 유사성에 기초하여 제2 엔티티와 제3 엔티티의 비교 - 비교는 제3 관리 변환의 결과를 포함함 - 를 생성하는 것.
11. 데이터 프로세싱 장치에 의해 실행될 때, 데이터 프로세싱 장치로 하여금, 실시형태 1-10 중 임의의 실시형태의 동작을 포함하는 동작을 수행하게 하는 명령어를 저장하는 유형의 비일시적인 머신 판독 가능 매체.
12. 다음의 것을 포함하는 시스템: 하나 이상의 프로세서; 및 프로세서에 의해 실행될 때, 프로세서로 하여금, 실시형태 1-10 중 임의의 실시형태의 동작을 포함하는 동작을 실현하게 하는 명령어를 저장하는 메모리.
13. 실시형태 1-10 중 임의의 실시형태를 수행하기 위한 수단을 포함하는 시스템.

Claims (20)

  1. 랜덤 포레스트 분류기(random forest classifier)를 사용하여 관리 협정(management arrangement)에 관련되는 예측을 생성하기 위해 다양한 시간적 특성을 갖는 데이터를 프로세싱하는 방법으로서,
    제어 회로부(circuitry)를 사용하여, 제1 엔티티의 제1 관리 협정에 관련되는 제1 데이터 - 상기 제1 데이터는 상기 제1 엔티티의 제1 시간적 특성 및 제1 관리 변환(management transformation)을 포함함 - 를 수신하는 단계;
    상기 제어 회로부를 사용하여, 상기 제1 데이터에 대한 제1 피쳐 벡터 - 상기 제1 피쳐 벡터의 제1 엘리먼트는 상기 제1 시간적 특성에 대응함 - 를 생성하는 단계;
    상기 제어 회로부를 사용하여, 상기 제1 데이터를 상기 제1 관리 변환에 대응하는 것으로 분류하기 위해 상기 제1 피쳐 벡터에 기초하여 랜덤 포레스트 분류기를 트레이닝시키는 단계;
    상기 제어 회로부를 사용하여, 제2 엔티티의 제2 관리 협정에 관련되는 제2 데이터 - 상기 제2 데이터는 상기 제2 엔티티의 제2 시간적 특성 및 공지되지 않은(unknown) 관리 변환을 포함함 - 를 수신하는 단계;
    상기 제어 회로부를 사용하여, 상기 제2 데이터에 대한 제2 피쳐 벡터 - 상기 제2 피쳐 벡터의 제2 엘리먼트는 상기 제2 시간적 특성에 대응함 - 를 생성하는 단계;
    상기 제어 회로부를 사용하여, 상기 제2 피쳐 벡터를 상기 랜덤 포레스트 분류기에 입력하는 단계;
    상기 제어 회로부를 사용하여, 예측된 제2 관리 변환에 관련되는 상기 랜덤 포레스트 분류기로부터의 출력을 수신하는 단계; 및
    디스플레이를 위해, 유저 인터페이스에서, 상기 예측된 제2 관리 변환에 기초한 예측을 생성하는 단계
    를 포함하는, 데이터를 프로세싱하는 방법.
  2. 제1항에 있어서,
    상기 출력을 지수 분포로부터 Bayes(베이즈) 분류기에 기초한 확률로 변환하는 단계
    를 더 포함하되,
    상기 예측은 확률을 포함하는 것인, 데이터를 프로세싱하는 방법.
  3. 제1항에 있어서,
    상기 제1 데이터 중, 상기 제1 관리 변환을 나타내는 제1 자료(datum)를 결정하는 단계;
    상기 제2 데이터 중, 상기 제1 자료에 대응하는 제2 자료를 결정하는 단계; 및
    디스플레이를 위해, 상기 예측에서 상기 제2 자료의 표현을 생성하는 단계
    를 더 포함하는, 데이터를 프로세싱하는 방법.
  4. 제3항에 있어서,
    상기 제1 관리 변환을 나타내는 상기 제1 자료에 대한 제1 값을 결정하는 단계;
    상기 제1 값에 대응하는 상기 제2 자료의 제2 값을 결정하는 단계; 및
    디스플레이를 위해, 상기 예측에서 상기 제2 값의 표현을 생성하는 단계
    를 더 포함하는, 데이터를 프로세싱하는 방법.
  5. 제1항에 있어서,
    상기 랜덤 포레스트 분류기는 시계열 분류기이고,
    상기 예측된 제2 관리 변환은 제3 시간적 특성을 갖는 것인, 데이터를 프로세싱하는 방법.
  6. 제1항에 있어서,
    상기 제1 관리 변환은 상기 제1 관리 협정에 대한 제1 행동 주의 캠페인(activism campaign)의 론칭을 포함하고,
    상기 예측된 제2 관리 변환에 기초한 상기 예측은 상기 제2 관리 협정에 대한 제2 행동 주의 캠페인의 론칭의 확률을 포함하는 것인, 데이터를 프로세싱하는 방법.
  7. 제1항에 있어서,
    상기 제1 데이터를 상기 제1 관리 변환에 대응하는 것으로 분류하기 위해 상기 제1 피쳐 벡터에 기초하여 상기 랜덤 포레스트 분류기를 트레이닝시키는 단계는 과거의 관리 협정에 관련되는 과거의 데이터 및 과거의 관리 변환에 대해 상기 랜덤 포레스트 분류기를 역테스트하는(backtesting) 단계를 포함하는 것인, 데이터를 프로세싱하는 방법.
  8. 제1항에 있어서,
    복수의 엔티티에 대한 관리 협정에 관련되는 공개적으로 이용 가능한 데이터의 리뷰를 개시하는 유저 입력을 수신하는 단계; 및
    상기 리뷰에 응답하여, 상기 제2 데이터에 대한 데이터 소스를 질의하는 단계
    를 더 포함하며,
    상기 제2 데이터는 상기 데이터 소스를 질의하는 것에 응답하여 수신되는 것인, 데이터를 프로세싱하는 방법.
  9. 제1항에 있어서,
    복수의 엔티티에 대한 관리 협정에 관련되는 공개적으로 이용 가능한 데이터에 기초하여 상기 복수의 엔티티에 대한 각각의 예측을 디스플레이를 위해 생성하는 단계; 및
    상기 예측 및 상기 각각의 예측의 비교에 기초하여 상기 복수의 엔티티 중에서 상기 제2 엔티티를 순위 매김하는 단계
    를 더 포함하는, 데이터를 프로세싱하는 방법.
  10. 제1항에 있어서,
    제3 엔티티의 제3 관리 협정에 관련되는 제3 데이터 - 상기 제3 데이터는 상기 제3 엔티티의 제3 시간적 특성 및 제3 관리 변환을 포함함 - 를 수신하는 단계;
    상기 제3 데이터 및 상기 제2 데이터의 유사성을 결정하는 단계; 및
    디스플레이를 위해, 상기 유저 인터페이스에서, 상기 유사성에 기초하여 상기 제2 엔티티와 상기 제3 엔티티의 비교 - 상기 비교는 상기 제3 관리 변환의 결과를 포함함 - 를 생성하는 단계
    를 더 포함하는, 데이터를 프로세싱하는 방법.
  11. 랜덤 포레스트 분류기를 사용하여 관리 협정에 관련되는 예측을 생성하기 위해 다양한 시간적 특성을 갖는 데이터를 프로세싱하기 위한 비일시적인 컴퓨터 판독 가능 매체로서, 상기 비일시적인 컴퓨터 판독 가능 매체는 명령어들을 포함하고, 상기 명령어들은, 하나 이상의 프로세서에 의해 실행될 때, 동작들을 야기시키고, 상기 동작들은,
    제1 엔티티의 제1 관리 협정에 관련되는 제1 데이터 - 상기 제1 데이터는 상기 제1 엔티티의 제1 시간적 특성 및 제1 관리 변환을 포함함 - 를 수신하는 것;
    상기 제1 데이터에 대한 제1 피쳐 벡터 - 상기 제1 피쳐 벡터의 제1 엘리먼트는 상기 제1 시간적 특성에 대응함 - 를 생성하는 것;
    상기 제1 데이터를 상기 제1 관리 변환에 대응하는 것으로 분류하기 위해 상기 제1 피쳐 벡터에 기초하여 랜덤 포레스트 분류기를 트레이닝시키는 것;
    제2 엔티티의 제2 관리 협정에 관련되는 제2 데이터 - 상기 제2 데이터는 상기 제2 엔티티의 제2 시간적 특성 및 공지되지 않은 관리 변환을 포함함 - 를 수신하는 것;
    상기 제2 데이터에 대한 제2 피쳐 벡터 - 상기 제2 피쳐 벡터의 제2 엘리먼트는 상기 제2 시간적 특성에 대응함 - 를 생성하는 것;
    상기 제2 피쳐 벡터를 상기 랜덤 포레스트 분류기에 입력하는 것;
    예측된 제2 관리 변환에 관련되는 상기 랜덤 포레스트 분류기로부터의 출력을 수신하는 것; 및
    디스플레이를 위해, 유저 인터페이스에서, 상기 예측된 제2 관리 변환에 기초한 예측을 생성하는 것
    을 포함하는 것인, 비일시적인 컴퓨터 판독 가능 매체.
  12. 제11항에 있어서,
    상기 명령어들은 또한, 상기 출력을 지수 분포로부터 베이즈 분류기에 기초한 확률로 변환하는 것을 포함하는 동작들을 야기시키되, 상기 예측은 상기 확률을 포함하는 것인, 비일시적인 컴퓨터 판독 가능 매체.
  13. 제11항에 있어서,
    상기 명령어들은 또한,
    상기 제1 데이터 중, 상기 제1 관리 변환을 나타내는 제1 자료를 결정하는 것;
    상기 제2 데이터 중, 상기 제1 자료에 대응하는 제2 자료를 결정하는 것; 및
    디스플레이를 위해, 상기 예측에서 상기 제2 자료의 표현을 생성하는 것
    을 포함하는 동작들을 야기시키는 것인, 비일시적인 컴퓨터 판독 가능 매체.
  14. 제13항에 있어서,
    상기 명령어들은 또한,
    상기 제1 관리 변환을 나타내는 상기 제1 자료에 대한 제1 값을 결정하는 것;
    상기 제1 값에 대응하는 상기 제2 자료의 제2 값을 결정하는 것; 및
    디스플레이를 위해, 상기 예측에서 상기 제2 값의 표현을 생성하는 것
    을 포함하는 동작들을 야기시키는 것인, 비일시적인 컴퓨터 판독 가능 매체.
  15. 제11항에 있어서,
    상기 랜덤 포레스트 분류기는 시계열 분류기이고,
    상기 예측된 제2 관리 변환은 제3 시간적 특성을 갖는 것인, 비일시적인 컴퓨터 판독 가능 매체.
  16. 제11항에 있어서,
    상기 제1 관리 변환은 상기 제1 관리 협정에 대한 제1 행동 주의 캠페인의 론칭을 포함하고,
    상기 예측된 제2 관리 변환에 기초한 상기 예측은 상기 제2 관리 협정에 대한 제2 행동 주의 캠페인의 론칭의 확률을 포함하는 것인, 비일시적인 컴퓨터 판독 가능 매체.
  17. 제11항에 있어서,
    상기 제1 데이터를 상기 제1 관리 변환에 대응하는 것으로 분류하기 위해 상기 제1 피쳐 벡터에 기초하여 상기 랜덤 포레스트 분류기를 트레이닝시키는 것은 과거의 관리 협정에 관련되는 과거의 데이터 및 과거의 관리 변환에 대해 상기 랜덤 포레스트 분류기를 역테스트하는 것을 포함하는 것인, 비일시적인 컴퓨터 판독 가능 매체.
  18. 제11항에 있어서,
    상기 명령어들은 또한,
    복수의 엔티티에 대한 관리 협정에 관련되는 공개적으로 이용 가능한 데이터의 리뷰를 개시하는 유저 입력을 수신하는 것; 및
    상기 리뷰에 응답하여, 상기 제2 데이터에 대한 데이터 소스를 질의하는 것 - 상기 제2 데이터는 상기 데이터 소스를 질의하는 것에 응답하여 수신됨 -
    을 포함하는 동작들을 야기시키는 것인, 비일시적인 컴퓨터 판독 가능 매체.
  19. 제11항에 있어서,
    상기 명령어들은 또한,
    복수의 엔티티에 대한 관리 협정에 관련되는 공개적으로 이용 가능한 데이터에 기초하여 상기 복수의 엔티티에 대한 각각의 예측을 디스플레이를 위해 생성하는 것; 및
    상기 예측 및 상기 각각의 예측의 비교에 기초하여 상기 복수의 엔티티 중에서 상기 제2 엔티티를 순위 매김하는 것
    을 포함하는 동작들을 야기시키는 것인, 비일시적인 컴퓨터 판독 가능 매체.
  20. 제11항에 있어서,
    상기 명령어들은 또한,
    제3 엔티티의 제3 관리 협정에 관련되는 제3 데이터 - 상기 제3 데이터는 상기 제3 엔티티의 제3 시간적 특성 및 제3 관리 변환을 포함함 - 를 수신하는 것;
    상기 제3 데이터 및 상기 제2 데이터의 유사성을 결정하는 것; 및
    디스플레이를 위해, 상기 유저 인터페이스에서, 상기 유사성에 기초하여 상기 제2 엔티티와 상기 제3 엔티티의 비교 - 상기 비교는 상기 제3 관리 변환의 결과를 포함함 - 를 생성하는 것
    을 포함하는 동작들을 야기시키는 것인, 비일시적인 컴퓨터 판독 가능 매체.
KR1020227034385A 2020-03-05 2021-03-04 랜덤 포레스트 분류기를 사용하여 관리 협정에 관련되는 예측을 생성하기 위해 다양한 시간적 특성을 갖는 데이터를 프로세싱하기 위한 방법 및 시스템 KR20220152256A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/810,724 2020-03-05
US16/810,724 US11775887B2 (en) 2020-03-05 2020-03-05 Methods and systems for processing data having varied temporal characteristics to generate predictions related to management arrangements using random forest classifiers
PCT/IB2021/051787 WO2021176380A1 (en) 2020-03-05 2021-03-04 Methods and systems for processing data having varied temporal characteristics to generate predictions related to management arrangements using random forest classifiers

Publications (1)

Publication Number Publication Date
KR20220152256A true KR20220152256A (ko) 2022-11-15

Family

ID=74859496

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227034385A KR20220152256A (ko) 2020-03-05 2021-03-04 랜덤 포레스트 분류기를 사용하여 관리 협정에 관련되는 예측을 생성하기 위해 다양한 시간적 특성을 갖는 데이터를 프로세싱하기 위한 방법 및 시스템

Country Status (7)

Country Link
US (1) US11775887B2 (ko)
EP (1) EP4115362A1 (ko)
JP (1) JP2023516035A (ko)
KR (1) KR20220152256A (ko)
AU (1) AU2021229692A1 (ko)
CA (1) CA3170599A1 (ko)
WO (1) WO2021176380A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116863410B (zh) * 2023-09-05 2023-12-22 深圳市中大合顺生物科技有限公司 基于有害生物防治的数据采集处理方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015084968A1 (en) * 2013-12-03 2015-06-11 University Of Massachusetts System and methods for predicting probable relationships between items
US10735274B2 (en) 2018-01-26 2020-08-04 Cisco Technology, Inc. Predicting and forecasting roaming issues in a wireless network
US11281999B2 (en) * 2019-05-14 2022-03-22 International Business Machines Corporation Armonk, New York Predictive accuracy of classifiers using balanced training sets
US20200394711A1 (en) * 2019-06-13 2020-12-17 Advisor Software, Inc. Predicting market actions, directions of actions and engagement via behavioral iq analysis
US20210035693A1 (en) * 2019-07-31 2021-02-04 Mckesson Corporation Methods, systems, and apparatuses for predicting the risk of hospitalization
US11157823B2 (en) * 2020-02-04 2021-10-26 Vignet Incorporated Predicting outcomes of digital therapeutics and other interventions in clinical research

Also Published As

Publication number Publication date
AU2021229692A1 (en) 2022-09-29
CA3170599A1 (en) 2021-09-10
US11775887B2 (en) 2023-10-03
WO2021176380A1 (en) 2021-09-10
US20210279598A1 (en) 2021-09-09
JP2023516035A (ja) 2023-04-17
EP4115362A1 (en) 2023-01-11

Similar Documents

Publication Publication Date Title
US10860858B2 (en) Utilizing a trained multi-modal combination model for content and text-based evaluation and distribution of digital video content to client devices
CN111768008A (zh) 联邦学习方法、装置、设备和存储介质
CA3134043A1 (en) Systems and methods for model fairness
CN110390408B (zh) 交易对象预测方法和装置
CN112905876B (zh) 基于深度学习的信息推送方法、装置和计算机设备
US11356389B2 (en) Systems and methods for a two-tier machine learning model for generating conversational responses
CN111369344B (zh) 一种动态生成预警规则的方法和装置
US20190258933A1 (en) Deep Forecasted Human Behavior from Digital Content
US11507757B2 (en) Systems and methods for generating dynamic conversational responses based on historical and dynamically updated information
CN111460384A (zh) 策略的评估方法、装置和设备
US11405337B2 (en) Systems and methods for generating dynamic conversational responses using ensemble prediction based on a plurality of machine learning models
US20200250623A1 (en) Systems and techniques to quantify strength of a relationship with an enterprise
US20240046922A1 (en) Systems and methods for dynamically updating machine learning models that provide conversational responses
Lukita et al. Predictive and analytics using data mining and machine learning for customer churn prediction
KR20220152256A (ko) 랜덤 포레스트 분류기를 사용하여 관리 협정에 관련되는 예측을 생성하기 위해 다양한 시간적 특성을 갖는 데이터를 프로세싱하기 위한 방법 및 시스템
GB2600817A (en) Systems and methods for generating dynamic interface options using machine learning models
US11868860B1 (en) Systems and methods for cohort-based predictions in clustered time-series data in order to detect significant rate-of-change events
US11704540B1 (en) Systems and methods for responding to predicted events in time-series data using synthetic profiles created by artificial intelligence models trained on non-homogenous time series-data
US11803464B2 (en) System for automatic identification and selection of optimization metrics and accompanying models in experimentation platforms
US20230305904A1 (en) Systems and methods for correlating probability models with non-homogenous time dependencies to generate time-specific data processing predictions
Rodpysh Model to predict the behavior of customers churn at the industry
US20240193401A1 (en) Systems and methods for responding to predicted events in time-series data using synthetic profiles created by artificial intelligence models trained on non-homogonous time-series data
Kart et al. Decision support system for a customer relationship management case study
CN116186622A (zh) 一种网络数据分类方法、系统、电子设备及存储介质
CN117194779A (zh) 基于人工智能的营销系统优化方法、装置及设备