KR20210143912A

KR20210143912A - 영화 성공-지수의 예측

Info

Publication number: KR20210143912A
Application number: KR1020217035356A
Authority: KR
Inventors: 아누브하브 스리바스타바; 산카란 케사반; 파라그 바이슈나바
Original assignee: 소니그룹주식회사
Priority date: 2019-05-20
Filing date: 2020-05-19
Publication date: 2021-11-29
Also published as: JP7208595B2; EP3956806A1; CN113748439B; KR102694722B1; WO2020234771A1; US20200372524A1; US11704495B2; JP2022533690A; CN113748439A

Abstract

영화의 성공-지수의 예측을 위한 정보 처리 디바이스 및 방법이 제공된다. 정보 처리 디바이스는, 제작을 위한 영화에 대한 영화 대본을 수신하고, 영화 대본의 텍스트 분석에 기반하여 영화 대본의 복수의 장면들을 식별하고, 복수의 장면들에 대한 장르 정보에 기반하여 영화 대본의 각각의 장면에 대한 제1 점수를 계산한다. 정보 처리 디바이스는 추가로, 영화 대본의 등장인물들의 목록을 식별하고, 등장인물들의 목록의 각각의 등장인물의 역할 연기에 대한 배우를 선택하고, 역할 연기에 대한 선택된 배우의 적합성을 표시하는 제2 점수를 계산한다. 제2 점수는, 이력적 영화 데이터베이스의 데이터포인트들에 대해 훈련되는 기계 학습 모델에 기반하여 계산된다. 정보 처리 디바이스는, 계산된 제1 점수 및 계산된 제2 점수에 기반하여 영화에 대한 성공-지수를 예측한다.

Description

영화 성공-지수의 예측

관련 출원들에 대한 상호 참조/인용에 의한 포함

본 출원은, 2019년 5월 20일자로 출원된 미국 가특허 출원 일련번호 제62/850,075호를 우선권으로 주장하며, 이로써 상기 출원의 전체 내용은 인용에 의해 본원에 포함된다.

본 개시내용의 다양한 실시예들은, 텍스트 처리, 자연 언어 처리(NLP), 및 기계 학습(ML) 방법들에 관한 것이다. 더 상세하게는, 본 개시내용의 다양한 실시예들은, 영화에 대한 성공-지수(success-quotient)의 예측을 위한 정보 처리 디바이스 및 방법에 관한 것이다.

영화 제작사는 전형적으로, 영화에 대한 잠재적 후보들로서 많은 영화 대본들을 수신한다. 이러한 영화 제작사들은 영화의 잠재적 성공 요인들에 대해 수신된 영화 대본을 각각 읽고, 이해하고, 분석하는 전담 팀을 갖는다. 일단 그러한 분석이 수행되면, 영화에서의 상이한 역할들에 대해 어느 배우들이 최상일 것인지를 결정하는 다른 팀들이 존재한다. 그러한 분석은 대부분 수작업으로 수행되기 때문에, 따라서, 적절한 배역 및 잠재적 성공 요인들의 선택은 인적 오류들의 영향을 받고, 주관적 의견들/성향들로 인해 최적이 아니다. 제작 전의 영화 대본의 불량한 분석 또는 불량한 배역 선택은 흥행에 있어서의 영화의 성공에 영향을 미칠 수 있다.

종래의 통상적인 접근법들의 추가적인 제한들 및 단점들은, 본 출원의 나머지 부분에서 도면들을 참조하여 기재된 바와 같은 본 개시내용의 일부 양상들에 따른 설명된 시스템들과의 비교를 통해 관련 기술분야의 통상의 기술자에게 명백해질 것이다.

영화 성공-지수의 예측을 위한 정보 처리 디바이스 및 방법은 실질적으로, 청구항들에서 더 완전히 기재되는 바로서, 도면들 중 적어도 하나에 도시되고/거나 그와 관련하여 설명된 바와 같이 제공된다.

본 개시내용의 이들 및 다른 특징들 및 장점들은, 전반에 걸쳐 동일한 참조 번호들이 동일한 부분들을 지칭하는 첨부된 도면들과 함께, 본 개시내용의 다음의 상세한 설명을 검토하는 것으로부터 인식될 수 있다.

도 1은 본 개시내용의 실시예에 따른, 영화의 성공-지수의 예측을 위한 예시적인 환경을 예시한다.
도 2는 본 개시내용의 실시예에 따른, 영화의 성공-지수의 예측을 위한 예시적인 정보 처리 디바이스를 예시하는 블록도이다.
도 3은 본 개시내용의 실시예에 따른, 영화 대본의 일부분을 예시하는 도면이다.
도 4는 본 개시내용의 실시예에 따른, 영화의 성공-지수의 예측을 위한 예시적인 동작들을 예시하는 도면이다.
도 5는 본 개시내용의 실시예에 따른, 영화의 성공-지수의 예측을 위한 예시적인 기계 학습(ML) 모델을 예시하는 도면이다.
도 6은 본 개시내용의 실시예에 따른, 어조 메트릭(tonal metric)들에 기반한 영화의 성공-지수의 예측을 위한 예시적인 동작들을 예시하는 도면이다.
도 7은 본 개시내용의 실시예에 따른, 영화 대본의 2개 이상의 버전의 비교를 위한 산업 전반 기준선 모델의 생성을 위한 예시적인 동작들을 예시하는 블록도이다.
도 8은 본 개시내용의 실시예에 따른, 영화 대본의 분석에 기반한, 영화에 사용될 색상들의 장르별 추천을 위한 예시적인 동작들을 예시하는 블록도이다.
도 9는 본 개시내용의 실시예에 따른, 영화의 성공-지수의 예측을 위한 예시적인 동작들을 예시하는 흐름도이다.
도 10은 본 개시내용의 적어도 하나의 실시예에 따른, 영화들의 성공-지수의 모의 및 분석을 위한 사용자 인터페이스를 예시하는 도면이다.
도 11은 본 개시내용의 적어도 하나의 실시예에 따른, 도 10의 사용자 인터페이스(UI)를 통한 배우 세부사항들의 시각화를 위한 UI 요소를 예시하는 도면이다.
도 12는 본 개시내용의 적어도 하나의 실시예에 따른, 영화의 성공-지수의 예측을 위해 고려되는 파라미터들에 대한 도 10의 사용자 인터페이스(UI)를 통한 가중치들의 선택을 위한 UI 요소를 예시하는 도면이다.

다음에 설명된 구현들은, 영화의 성공-지수의 예측을 위한 개시된 정보 처리 디바이스 및 방법에서 찾을 수 있다. 본 개시내용의 예시적인 양상들은 정보 처리 디바이스를 제공한다. 정보 처리 디바이스는, 영화 제작사가 흥행에 있어서의 더 나은 성공 가능성들을 갖는 영화 대본들를 선택하고, 영화에 적합한 배우들/제작진(crew)을 선택하고, 흥행에 있어서의 영화의 성공의 지표일 수 있는 성공-지수를 예측하는 데 도움을 줄 수 있다. 영화에 대한 성공-지수는, 영화 대본에 기반하여 생성된 영화가 흥행에 있어서(예컨대, 영화 평점(rating)들 또는 수입들의 관점에서) 어떻게 성과를 거둘 것인지 또는 특정 그룹 또는 인구의 인구통계학적 계층 내에서의 그 영화의 잠재적 인기의 척도를 표시할 수 있다.

개시된 정보 처리 디바이스는, 등장인물들, 장면들, 장면들의 장르 가중치, 주연 등장인물들 등을 식별하기 위해 자연 언어 처리(NLP) 알고리즘들을 사용하여 영화 대본을 텍스트적으로 분석할 수 있다. 이는, 대본 수준에서 영화의 제작에 대한 통찰을 제공할 수 있다. 기능적 데이터 부분에 대해, 과거 영화 데이터가 분석될 수 있고, 각각의 장르에 대해 각각의 배우, 감독, 지역, 계절에 점수가 책정된다. 또한, 영화 대본의 각각의 등장인물이 배우와 맵핑될 수 있다. 등장인물 맵핑은 상이한 장르들에서 각각의 배우에 대해 점수가 가중될 수 있다. 유사하게, 감독 또는 다른 제작진 구성원들이 맵핑되고 가중치가 부여될 수 있다. 성공-지수는, 위에 언급된 데이터에 대한 가중 조합 공식에 기반하여 획득될 수 있다. 정보 처리 디바이스는, 영화 대본의 통찰을 배우들, 감독들, 계절, 장르, 및 배우들 및 감독들에 대한 소셜 미디어 가중치에 관한 기능적 데이터와 고유하게 조합하여 영화 대본 그 자체로부터 예측 성공 점수를 제공할 수 있다. 또한, 정보 처리 디바이스는, 이력적 영화 데이터베이스(예컨대, 흥행 데이터)에 기반하여 영화에 대한 성공-지수를 예측할 수 있다.

다양한 제작사들이 수신하는 수백 개의 영화 대본들이 존재하며, 이들은 전형적으로 수작업으로 분석된다. 상이한 장면들의 분위기 또는 각각의 장면에서의 등장인물 관여 또는 장면들이 어느 장르에 분포되는지와 같은 다양한 양상들을 찾기 위해 각각의 그리고 모든 각각의 영화 대본을 판독하는 것은 시간이 지날수록 어려워졌다. 개시된 정보 처리 디바이스는, 영화의 성공에 대한 잠재성에 관한 지표를 제공하는 성공-지수 또는 점수를 제공하기 위해, 상이한 양상들, 이를테면, 장면들의 수, 등장인물들의 수, 상이한 장르들을 향한 각각의 장면의 양극성, 배우들의 이력 데이터와의 결합된 통찰, 및 소셜 버즈(social buzz)에서의 영화 대본의 통찰들을 제공할 수 있다. 성공-지수는, 배우들 및/또는 감독들 사이의 상성(chemistry)을 고려하여, 성공할 최대 가능성을 갖는 영화 대본들을 제작사들이 선택하는 것을 도울 수 있다.

성공-지수는, 영화 제작사들이 콘텐츠 구매, 권리 구매, 또는 영화 제작을 위한 영화 대본의 선택에 대한 결정을 내리는 데 도움을 줄 수 있다. 제작사들은, 더 나은 성공률을 위해 영화에 적합한 배우들 또는 제작진을 선택할 수 있고, 영화를 제작하거나 영화에 대한 권리들을 구입하기 전에 영화의 성공 가능성을 더 잘 인지할 수 있다. 제작사들은, 영화에 대한 성공 가능성이 더 나은 콘텐츠에 대해 더 효율적인 방식으로 자금을 집중할 수 있다.

도 1은 본 개시내용의 실시예에 따른, 영화의 성공-지수의 예측을 위한 예시적인 환경을 예시한다. 도 1을 참조하면, 네트워크 환경(100)이 도시된다. 네트워크 환경(100)은, 정보 처리 디바이스(102), 사용자 디바이스(104), 서버(106), 및 통신 네트워크(108)를 포함할 수 있다. 도 1을 참조하면, 예컨대, 정보 처리 디바이스(102) 상에 소프트웨어 애플리케이션의 일부로서 배치될 수 있는 기계 학습(ML) 모델(110)이 추가로 도시된다.

정보 처리 디바이스(102)는, 영화의 영화 대본에 기반하여 영화에 대한 성공-지수를 예측하도록 구성될 수 있는 적합한 로직, 제어 회로, 및 인터페이스들을 포함할 수 있다. 적어도 하나의 실시예에서, 정보 처리 디바이스(102)는, 정보 처리 디바이스(102)의 동작들을 수행하도록 집합적으로 기능할 수 있는 분산형 클라우드 서버들의 네트워크로서 구현될 수 있다. 대안적으로, 정보 처리 디바이스(102)는, 성공-지수를 예측하기 위한 명령어들 또는 프로그램 코드를 저장할 수 있는 소비자 전자 디바이스일 수 있다. 정보 처리 디바이스(102)의 예들은, 컴퓨터 워크스테이션, 모바일 디바이스, 태블릿, 데스크톱 컴퓨터, 랩톱, 메인프레임 기계, 서버, 이를테면 클라우드 서버, 서버들의 그룹, 또는 텍스트 처리 능력을 갖는 임의의 컴퓨팅 디바이스 또는 소비자 전자 디바이스를 포함할 수 있지만, 이에 제한되지 않는다.

사용자 디바이스(104)는, 정보 처리 디바이스(102)와 영화 대본을 공유하도록 구성될 수 있는 적합한 로직, 회로, 및 인터페이스들을 포함할 수 있다. 일부 예시들에서, 사용자 디바이스(104)는, 공유된 영화 대본에 기반한 제작을 위한 영화에 대한 예측된 성공-지수를 수신하기 위한 요청을 제공할 수 있다. 사용자 디바이스(104)의 예들은, 모바일 폰, 랩톱, 태블릿, 게이밍 디바이스, 메인프레임 기계, 서버, 컴퓨터 워크스테이션, 및/또는 임의의 다른 소비자 전자(CE) 디바이스를 포함할 수 있지만, 이에 제한되지 않는다.

서버(106)는, 이력적 영화 데이터베이스를 저장하도록 구성될 수 있는 적합한 로직, 회로, 및 인터페이스들을 포함할 수 있다. 적어도 하나의 실시예에서, 서버(106)는 또한 ML 모델(110)을 저장할 수 있으며, 이는 나중에, 영화에 대한 성공-지수를 예측하는 데 사용될 수 있다. 서버(106)는, 웹 애플리케이션들, 클라우드 애플리케이션들, HTTP 요청들, 저장소 동작들, 파일 전송 등을 통해 동작들을 실행할 수 있는 클라우드 서버로서 구현될 수 있다. 서버(106)의 다른 예들은, 제3자 서버, 데이터베이스 서버, 파일 서버, 웹 서버, 미디어 서버, 애플리케이션 서버, 메인프레임 서버, 클라우드 서버, 또는 다른 유형들의 서버들을 포함할 수 있지만, 이에 제한되지 않는다. 적어도 하나의 실시예에서, 서버(106)는, 관련 기술분야의 통상의 기술자들에게 잘 알려져 있는 여러 기술들의 사용에 의해 복수의 분산형 클라우드 기반 리소스들로서 구현될 수 있다. 관련 기술분야의 통상의 기술자는, 본 개시내용의 범위가 2개의 개별 엔티티로서의 서버(106) 및 정보 처리 디바이스(102)의 구현으로 제한되지 않을 수 있다는 것을 이해할 것이다. 특정 실시예들에서, 서버(106)의 기능성들은, 본 개시내용의 범위로부터 벗어나지 않으면서, 그 전체가 또는 적어도 부분적으로 정보 처리 디바이스(102)에 통합될 수 있다.

통신 네트워크(108)는, 정보 처리 디바이스(102), 사용자 디바이스(104), 및 서버(106)가 그를 통해 서로 통신할 수 있는 통신 매체를 포함할 수 있다. 통신 네트워크(108)는 유선 또는 무선 통신 네트워크일 수 있다. 통신 네트워크(108)의 예들은 인터넷, 클라우드 네트워크, 와이파이(Wi-Fi; Wireless Fidelity) 네트워크, 개인 영역 네트워크(PAN), 근거리 네트워크(LAN), 또는 대도시 영역 네트워크(MAN)을 포함할 수 있지만, 이에 제한되지 않는다. 네트워크 환경(100) 내의 다양한 디바이스들은, 다양한 유선 및 무선 통신 프로토콜에 따라 통신 네트워크(108)에 연결되도록 구성될 수 있다. 그러한 유선 및 무선 통신 프로토콜들의 예들은, 송신 제어 프로토콜 및 인터넷 프로토콜(TCP/IP), 사용자 데이터그램 프로토콜(UDP), 하이퍼텍스트 전송 프로토콜(HTTP), 파일 전송 프로토콜(FTP), 지그비(Zig Bee), EDGE, IEEE 802.11, 라이파이(Li-Fi; light fidelity), 802.16, IEEE 802.11s, IEEE 802.11g, 다중-홉 통신, 무선 액세스 포인트(AP), 디바이스 간 통신, 셀룰러 통신 프로토콜들, 및 블루투스(BT) 통신 프로토콜들 중 적어도 하나를 포함할 수 있지만, 이에 제한되지 않는다.

기계 학습(ML) 모델(110)은, 입력 데이터포인트들과 출력 라벨들 사이의 관계를 식별하도록 훈련될 수 있는 분류기 모델 또는 신경망 모델일 수 있다. ML 모델(110)은 이력적 영화 데이터베이스의 입력 데이터포인트들에 대해 훈련될 수 있고, 각각의 입력 데이터포인트에 대한 점수를 출력할 수 있다. ML 모델(110)은, 그의 하이퍼-파라미터들, 예컨대, 활성화 함수(들), 가중치들의 수, 비용 함수, 정규화 함수, 입력 크기, 계층들의 수 등에 의해 정의될 수 있다. ML 모델(110)의 하이퍼-파라미터들은 조정될 수 있고, 가중치들은 ML 모델(110)에 대한 비용 함수의 전역 최소치를 향해 이동하도록 업데이트될 수 있다. 입력 데이터포인트들에 대한 여러 기(epoch)의 훈련 후에, ML 모델(110)은 새로운 미지의 데이터포인트들에 대한 분류 결과를 출력하도록 훈련될 수 있다.

ML 모델(110)은, 예컨대 소프트웨어 구성요소로서 구현될 수 있는 전자 데이터를 포함할 수 있다. ML 모델(110)은, 처리 디바이스, 이를테면 정보 처리 디바이스(102)에 의한 실행을 위해 라이브러리들, 외부 스크립트들, 또는 다른 로직/명령어들에 의존할 수 있다. ML 모델(110)은, 컴퓨팅 디바이스, 이를테면 정보 처리 디바이스(102)가 하나 이상의 동작을 수행하여 상이한 입력 데이터포인트들, 예컨대, 영화에 대한 장면들 또는 배역에 대한 점수들을 계산할 수 있게 하는 코드 또는 루틴들을 포함할 수 있다. 부가적으로 또는 대안적으로, ML 모델(110)은, 프로세서, (예컨대, 하나 이상의 동작의 수행하거나 그의 수행을 제어하기 위한) 마이크로프로세서, 필드 프로그래밍가능 게이트 어레이(FPGA), 또는 주문형 집적 회로(ASIC)를 포함하는 하드웨어를 사용하여 구현될 수 있다. 대안적으로, 일부 실시예들에서, ML 모델(110)은 하드웨어와 소프트웨어의 조합을 사용하여 구현될 수 있다. ML 모델(110)의 예들은, 인공 신경망들, 심층 신경망들, 베이지안(Bayesian) 모델들, 서포트 벡터 기계들, 및 결정 트리들을 포함할 수 있지만, 이에 제한되지 않는다.

동작 시, 영화 제작사는 각본가에 의해 작성된 영화 대본을 수신할 수 있다. 영화 대본은, 예컨대, 장면들, 장면 위치들, 대화들, 등장인물 이름들, 무대 연출, 등장인물 행동들 등의 텍스트 설명들을 포함할 수 있다. 영화 제작사는 영화 대본에 기반하여 제작될 수 있는 영화에 대한 성공-지수를 예측하는 것에 관심이 있을 수 있다. 여기서, 성공-지수는 흥행에 있어서의 영화의 성과의 잠재성 또는 가능성을 표시할 수 있는 정보(예컨대, 0 내지 1 척도의 수)를 포함할 수 있다.

영화 대본은 사용자 디바이스(104)에 저장될 수 있다. 사용자 디바이스(104)는, 수신된 영화 대본을 통신 네트워크(108)를 통해 정보 처리 디바이스(102)에 송신할 수 있다. 일부 실시예들에서, 정보 처리 디바이스(102)는, 사용자 디바이스(104)의 웹 클라이언트(예컨대, 웹 브라우저)를 통해 액세스가능할 수 있는 웹 애플리케이션을 호스팅할 수 있다. 사용자는, 사용자 디바이스(104)의 웹 클라이언트를 통해 웹 애플리케이션 상에 영화 대본을 업로드할 수 있다.

정보 처리 디바이스(102)는 사용자 디바이스(104)로부터 영화 대본을 수신할 수 있다. 영화 대본은 제작을 위한 영화와 연관될 수 있다. 정보 처리 디바이스(102)는, 영화 대본의 텍스트 분석에 기반하여 영화 대본의 복수의 장면들을 식별할 수 있다. 예컨대, 텍스트 분석은 텍스트 마이닝 동작들을 포함할 수 있으며, 텍스트 마이닝 동작들은, 영화 대본의 텍스트를 스크레이핑(scrape)하고 사전 처리 동작들, 이를테면, 문장/단어 토큰화, 정규화 동작들(예컨대, 단어들에 대한 어간추출(stemming) 및 표제어처리(lemmatization)), 또는 필터링(예컨대, 불용어(stop word) 제거)을 수행하기 위한 자연 언어 처리(NLP) 기능들의 적용을 포함할 수 있다. 텍스트 마이닝 동작들은 또한, 벡터화, 의미적 맥락 분석, 단어 클러스터링, 품사(PoS; Part-of-Speech) 태깅, 및/또는 다른 관련된 동작들과 같은 동작들을 포함할 수 있다.

정보 처리 디바이스(102)는, 식별된 복수의 장면들의 각각의 장면의 장르 정보를 결정할 수 있다. 장르 정보는, 예컨대, 식별된 복수의 장면들의 각각의 장면의 장르 유형을 포함할 수 있다. 장르 유형은, 특정 유형의 영화, 장면 유형, 또는 다른 예술 형태들과 관련된 태그들에 대응할 수 있다. 장르 유형의 일반적인 예들은, 액션, 어드벤처, 애니메이션, 코미디, 법정, 범죄, 서사, 성애, 판타지, 느와르 영화, 역사, 공포, 미스터리, 철학, 정치, 종교, 로맨스, 대하소설, 풍자, 공상 과학 소설, 단편적 일상, 스파이, 초자연, 스릴러, 도시, 전쟁, 및 전기를 포함할 수 있지만, 이에 제한되지 않는다. 부가적으로 또는 대안적으로, 일부 실시예들에서, 모든 각각의 식별된 장면에 대한 장르 유형을 결정하기 위해, 세분 태그들, 이를테면, 플롯 유형들(예컨대, 코미디, 비극, 슈퍼히어로, 어드벤처 등), 극적인 상황들(예컨대, 재난, 반란, 사랑 범죄들, 회한 등), 스토리 유형들(예컨대, 액션, 애니메이션, 전기, 코미디, 범죄, 판타지 등), 및/또는 테마들(예컨대, 구원, 부활, 순결, 질투, 희생 등)이 영화 대본으로부터 도출될 수 있다.

식별된 복수의 장면들의 각각의 장면에 대해, 정보 처리 디바이스(102)는 복수의 장면들의 식별된 장르 정보에 기반하여 제1 점수를 계산할 수 있다. 제1 점수는, 각각의 장면에 대한 장르별 가중 점수일 수 있고, 따라서, 모든 각각의 장면에 대한 계산자(computer)일 수 있다. 예컨대, 영화 대본의 모든 각각의 장면은, 맥락, 예상되는 감정적 반응, 및 영화의 구상과 연관될 수 있고, 영화 대본의 특정 등장인물(들)을 포함할 수 있다. 따라서, 영화 대본의 장면에 대한 제1 점수는 장면의 중요도를 표시하고 영화에 대한 잠재적 성공 요인으로서 표시될 수 있다.

정보 처리 디바이스(102)는, 영화 대본의 텍스트 분석에 추가로 기반하여 영화 대본의 등장인물들의 목록을 식별할 수 있다. 이력적 영화 데이터베이스에 기반하여, 정보 처리 디바이스(102)는, 식별된 목록의 복수의 등장인물들의 각각의 등장인물의 역할 연기에 대한 배우를 선택한다. 예컨대, 이력적 영화 데이터베이스는, 배우들의 프로필들, 및 그러한 배우들에게 가장 적합할 수 있는 연관된 역할들/장르들을, 그 배우들의 과거의 연기력들, 경험들, 및/또는 그러한 역할들/장르들에 대한 성공들에 기반하여 포함할 것이다. 이력적 영화 데이터베이스 내의 모든 각각의 배우는, 상이한 장르들/영화 역할들에 대한 배우의 적합성을 표시하기 위해, 예컨대, 0 내지 1의 점수 또는 인덱스를 배정받을 수 있다.

정보 처리 디바이스(102)는, 이력적 영화 데이터베이스의 데이터포인트들에 대해 훈련될 수 있는 ML 모델(110)에 기반하여 역할 연기에 대해 선택된 모든 각각의 배우에 대한 제2 점수를 계산할 수 있다. 예컨대, 데이터포인트들은 상이한 장르들/역할들에 대해 특정된 배우들의 목록의 각각의 배우 및/또는 제작진 구성원(이를테면, 감독)의 등급을 포함할 수 있다. 정보 처리 디바이스(102)는, ML 모델(110)의 출력에 기반하여, 각각의 배우 및/또는 각각의 제작진 구성원에 대한 제2 점수를 결정하도록 구성될 수 있다. 제2 점수의 계산 방법은, 예컨대, 도 4에서 상세히 설명된다.

정보 처리 디바이스(102)는, 식별된 복수의 장면들의 각각의 장면에 대한 계산된 제1 점수 및 역할 연기에 대해 선택된 모든 각각의 배우에 대한 계산된 제2 점수에 기반하여 영화에 대한 성공-지수를 계산할 수 있다. 정보 처리 디바이스(102)의 동작의 세부사항들은, 예컨대, 도 3, 도 4, 및 도 5에서 추가로 제공된다.

도 2는 본 개시내용의 실시예에 따른, 영화의 성공-지수의 예측을 위한 예시적인 정보 처리 디바이스를 예시하는 블록도이다. 도 2는, 도 1의 요소들과 함께 설명된다. 도 2를 참조하면, 정보 처리 디바이스(102)의 블록도(200)가 도시된다. 정보 처리 디바이스(102)는, 영화의 성공-지수의 예측과 연관된 동작들을 수행할 수 있는 회로(202)를 포함할 수 있다. 정보 처리 디바이스(102)는, 메모리(204), 입력/출력(I/O) 디바이스(206), 및 네트워크 인터페이스(208)를 더 포함할 수 있다. 회로(202)는, 메모리(204), I/O 디바이스(206), 및 네트워크 인터페이스(208)에 통신가능하게 결합될 수 있다.

회로(202)는, 정보 처리 디바이스(102)에 의해 실행될 상이한 동작들과 연관된 프로그램 명령어들을 실행하도록 구성될 수 있는 적합한 로직, 회로, 및 인터페이스들을 포함할 수 있다. 예컨대, 동작들 중 일부는, 영화 대본의 장면들 및 등장인물들의 목록의 식별, 장면들에 대한 점수들의 계산, 등장인물들의 목록의 역할 연기들에 대한 배우들의 선택, 선택된 배우들에 대한 점수들의 계산, 및 장면들 및 선택된 배우들에 대한 계산된 점수들에 기반한 영화에 대한 성공-지수의 예측을 포함할 수 있다. 회로(202)는, 하나 이상의 특수화된 처리 유닛을 포함할 수 있다. 하나 이상의 특수화된 처리 유닛은, 하나 이상의 특수화된 처리 유닛의 기능들을 집합적으로 수행하는 통합 프로세서 또는 프로세서들의 클러스터로서 구현될 수 있다. 회로(202)는, 관련 기술분야에 알려져 있는 다수의 프로세서 기술들에 기반하여 구현될 수 있다. 회로(202)의 구현들의 예들은, x86 기반 프로세서, 그래픽 처리 유닛(GPU), 감소된 명령어 세트 컴퓨팅(RISC) 프로세서, 주문형 집적 회로(ASIC) 프로세서, 복잡한 명령어 세트 컴퓨팅(CISC) 프로세서, 코-프로세서, 마이크로제어기, 중앙 처리 유닛(CPU), 및/또는 이들의 조합을 포함할 수 있지만, 이에 제한되지 않는다.

메모리(204)는, 회로(202)에 의해 실행될 프로그램 명령어들을 저장하도록 구성될 수 있는 적합한 로직, 회로, 및 인터페이스들을 포함할 수 있다. 또한, 메모리(204)는, 영화 대본, ML 모델(110), 중간 결과들, 또는 회로(202)에 의해 실행되는 상이한 동작들과 연관된 최종 예측들/결과들을 저장하도록 구성될 수 있다. 메모리(204)의 구현의 예들은, 랜덤 액세스 메모리(RAM), 판독 전용 메모리(ROM), 전기적으로 소거가능한 프로그래밍가능 판독 전용 메모리(EEPROM), 하드 디스크 드라이브(HDD), 솔리드 스테이트 드라이브(SSD), CPU 캐시, 및/또는 보안 디지털(SD) 카드를 포함할 수 있지만, 이에 제한되지 않는다.

I/O 디바이스(206)는, 입력을 수신하고 수신된 입력에 기반하여 출력을 제공하도록 구성될 수 있는 적합한 로직, 회로, 및 인터페이스들을 포함할 수 있다. 다양한 입력 및 출력 디바이스들을 포함할 수 있는 I/O 디바이스(206)는 회로(202)와 통신하도록 구성될 수 있다. I/O 디바이스(206)의 예들은, 터치 스크린, 키보드, 마우스, 조이스틱, 마이크로폰, 디스플레이 디바이스, 및 스피커를 포함할 수 있지만, 이에 제한되지 않는다.

네트워크 인터페이스(208)는, 통신 네트워크(108)를 통해 회로(202), 사용자 디바이스(104), 및 서버(106) 사이의 통신을 용이하게 하도록 구성될 수 있는 적합한 로직, 회로, 및 인터페이스들을 포함할 수 있다. 네트워크 인터페이스(208)는, 정보 처리 디바이스(102)와 통신 네트워크(108)의 유선 또는 무선 통신을 지원하기 위한 다양한 알려져 있는 기술들의 사용에 의해 구현될 수 있다. 네트워크 인터페이스(208)는, 안테나, 무선 주파수(RF) 송수신기, 하나 이상의 증폭기, 튜너, 하나 이상의 발진기, 디지털 신호 프로세서, 코더-디코더(CODEC) 칩셋, 가입자 식별 모듈(SIM) 카드, 또는 로컬 버퍼 회로를 포함할 수 있지만, 이에 제한되지 않는다.

네트워크 인터페이스(208)는, 인터넷, 인트라넷, 또는 무선 네트워크, 이를테면, 셀룰러 텔레폰 네트워크, 무선 근거리 네트워크(LAN), 및 대도시 영역 네트워크(MAN)와 같은 유선 또는 무선 통신 네트워크들을 통해 통신을 용이하게 하도록 구성될 수 있다. 무선 통신은, 복수의 통신 표준들, 프로토콜들, 및 기술들, 이를테면, 모바일 통신들을 위한 전역 시스템(GSM), 향상된 데이터 GSM 환경(EDGE), 광대역 코드 분할 다중 액세스(W-CDMA), 롱 텀 에볼루션(LTE), 코드 분할 다중 액세스(CDMA), 시분할 다중 액세스(TDMA), 블루투스, 와이파이(Wi-Fi)(이를테면, IEEE 802.11a, IEEE 802.11b, IEEE 802.11g, 또는 IEEE 802.11n), 음성 인터넷 프로토콜(VoIP), 라이파이(Li-Fi), 마이크로파 액세스를 위한 범세계적 상호운용성(Wi-MAX), 이메일을 위한 프로토콜, 인스턴트 메시징, 및 단문 메시지 서비스(SMS) 중 하나 이상을 사용하도록 구성될 수 있다.

정보 처리 디바이스(102)에 의해 실행되는 기능들 또는 동작들은, 도 1에서 설명된 바와 같이, 회로(202)에 의해 수행될 수 있다. 회로(202)에 의해 실행되는 동작들은, 예컨대, 도 3, 도 4, 및 도 5에서 상세히 설명된다.

도 3은 본 개시내용의 실시예에 따른, 영화 대본의 일부분을 예시하는 도면이다. 도 3은, 도 1 및 도 2의 요소들과 함께 설명된다. 도 3을 참조하면, 그에 기반하여 영화의 몇몇 장면들이 제작될 수 있는 영화 대본의 페이지(300)가 도시된다. 페이지(300)는 영화 대본의 하나 이상의 장면에 대한 대사들 및 연출을 포함한다. 영화 대본은, 스토리 내의 장면들, 등장인물들, 행동들, 또는 등장인물들 사이의 대사들/대화들을 설명하기 위해 전형적으로 요구되는, 청각적, 시각적, 행동적, 또는 언어적 요소들을 통해 스토리를 기술하는 텍스트 기반 문서일 수 있다.

영화 대본은 각본가에 의해 작성될 수 있고, 각본가로부터 영화 제작사가 수신할 수 있다. 영화 제작사는 영화 대본에 기반한 영화에 대한 성공-지수를 예측하는 것에 관심이 있을 수 있다. 영화에 대한 성공-지수는, 영화 대본에 기반하여 생성된 영화가 흥행에 있어서(예컨대, 영화 평점들 또는 수입들의 관점에서) 어떻게 성과를 거둘 것인지 또는 특정 그룹 또는 인구의 인구통계학적 계층 내에서 그 영화의 잠재적 인기의 척도를 결정할 수 있다.

영화 대본의 텍스트 분석을 수행하기 위해, 정보 처리 디바이스(102)는, 영화 대본의 텍스트를 마이닝하고 마이닝된 텍스트로부터 주요 특징들을 추출하기 위해 하나 이상의 자연 언어 처리(NLP) 방법, 특히, ML 알고리즘들에 의존하는 통계적 NLP 방법을 구현할 수 있다. 예컨대, 주요 특징들 중 일부는, 장면들, 등장인물들의 목록, 주연 등장인물들, 장면 위치들, 장면별 장르 등을 포함할 수 있다.

도시된 바와 같이, 영화 대본의 페이지(300)는 3개의 장면, 즉, 제1 장면(302A), 제2 장면(302B), 및 제3 장면(302C)을 포함한다. 제1 장면(302A)은 장면 표제(304A) "EXT. GUGGENHEIM MUSEUM ― NIGHT"로 시작되며, 여기서, "EXT."는 제1 장면(302A)이 외부 환경에서 발생한다는 것을 의미할 수 있다. "GUGGENHEIM MUSEUM"은 제1 장면(302A)의 위치일 수 있고, "NIGHT"은 제1 장면(302A)의 시각을 표시할 수 있다. 제2 장면(302B)은, 장면 지점("GUGGENHEIM MUSEUM"의 "ROOF")이 또한 언급된다는 점을 제외하고는 제1 장면(302A)과 동일할 수 있다. 유사하게, 제3 장면(302C)의 장면 표제(304B)에서, "INT."는 실내 또는 내부 환경에 대응할 수 있다. 제3 장면(302C)은 밤 중의 어떤 시간에 취조실 내부에서 촬영되는 것으로 가정될 수 있다.

제한이 아닌 예로서, 정보 처리 디바이스(102)는, 영화 대본의 페이지(300) 상에서 제1 장면(302A), 제2 장면(302B), 및 제3 장면(302C)을 식별할 수 있다. 그러한 장면들은 각본 용어들에 기반하여 식별될 수 있다. 예컨대, 각각의 장면은 장면의 위치 및 시각의 짧은 설명에 대응할 수 있는 장면 표제로 시작될 수 있다. 부가적으로, 제2 장면(302B)과 제3 장면(302C) 사이의 "CUT TO:"와 같은 키워드들은 페이지(300) 상의 다음 문장에서 새로운 장면이 시작된다는 것을 표시할 수 있다. 정보 처리 디바이스(102)는, 영화 대본의 페이지(300) 상의 장면들, 이를테면, 제1 장면(302A), 제2 장면(302B), 및 제3 장면(302C)을 식별하기 위해 장면 표제들, 키워드들(예컨대, INT., EXT., CUT TO 등) 또는 위치 표지들에 의존할 수 있다.

정보 처리 디바이스(102)는 추가로, 영화 대본에서 등장인물들의 목록을 식별할 수 있다. 예컨대, 제1 장면(302A)에서, "Edwards"로 명명된 제1 등장인물(306A) 및 "Perp"으로 명명된 제2 등장인물(306B)이 있다. 일부 실시예들에서, 정보 처리 디바이스(102)는, 장면으로부터 문장들을 선택하고, 선택된 문장의 각각의 단어에 품사(PoS) 태그를 적용할 수 있다. 예컨대, 제1 장면(302A)에서, 2개의 문장, "Edwards runs over to the Museum, leans over the wall that surrounds it, and in the next instant..." 및 "The Perp flies past him..."이 존재한다. 여기서, "Edwards" 및 "Perp"에게는 "NNP"의 PoS 태그가 배정될 수 있고, 이는, "Edwards" 및 "Perp" 둘 모두가 고유 명사(단수)임을 나타낼 수 있다. 또한, 성별은 제1 장면(302A)의 다른 문장들 내의 "him/her"와 같은 인칭 대명사들에 기반하여 결정될 수 있다.

부가적으로 또는 대안적으로, 일부 실시예들에서, 각각의 장면이 분석되어, 개개의 장면에서의 대사들/대화들 및 연관된 문장/단락 구조에 기반하여 상이한 등장인물들을 식별할 수 있다. 예컨대, 모든 각각의 대사는 새로운 라인에서 개시될 수 있고, 대사를 말할 수 있는 등장인물의 이름으로 시작되어 대사가 이어진다.

정보 처리 디바이스(102)는, 제2 장면(302B)을 분석하여, 제2 장면(302B)의 등장인물들이 제1 등장인물(306A) 및 제2 등장인물(306B)과 동일하다는 것을 식별할 수 있다. 유사하게, 정보 처리 디바이스(102)는, 제3 장면(302C)을 분석하여, 2명의 새로운 등장인물, 즉, 제3 등장인물(306C) 및 제4 등장인물(306D)을 식별할 수 있다. 제3 등장인물(306C)은 "POLICE INSPECTOR"일 수 있고, 제4 등장인물(306D)은 "UNIFORMED SERGEANT"일 수 있다. 유사하게, 정보 처리 디바이스(102)는, 영화 대본의 모든 페이지들을 분석하여, 영화에 대한 등장인물들의 목록 및 총 등장인물 수를 식별할 수 있다.

일부 실시예들에서, 정보 처리 디바이스(102)는, 식별된 목록의 등장인물들로부터 1명 이상의 주연 등장인물을 식별할 수 있다. 예로서, 정보 처리 디바이스(102)는, 영화 대본의 모든 각각의 장면에서 등장인물의 이름 또는 등장인물의 대사가 발생하는 빈도 또는 수를 결정할 수 있다. 등장인물은, 등장인물(또는 등장인물의 이름)이 영화 대본의 거의 모든 장면들(예컨대, > 80 %)에 존재하고 영화 대본의 다른 등장인물들과 비교하여 더 많은 수의 대사들을 가질 수 있다는 결정에 기반하여 주연 등장인물로서 식별될 수 있다.

도 4는 본 개시내용의 실시예에 따른, 영화의 성공-지수의 예측을 위한 예시적인 동작들을 예시하는 도면이다. 도 4는, 도 1, 도 2, 및 도 3의 요소들과 함께 설명된다. 도 4를 참조하면, 블록도(400)가 도시된다. 예시적인 동작들은 402 내지 410일 수 있고, 임의의 컴퓨팅 시스템에 의해, 예컨대, 도 2의 정보 처리 디바이스(102)에 의해 수행될 수 있다.

402에서, 데이터 취득이 수행될 수 있다. 데이터 취득을 위해, 정보 처리 디바이스(102)는, 통신 네트워크(108)를 통해 소스(예컨대, 사용자 디바이스(104))로부터 영화 대본(402A)을 수신할 수 있다. 일부 실시예들에서, 영화 대본(402A)은 통신 네트워크(108)를 통해 웹 기반 소스, 이를테면 서버(106)로부터 수신될 수 있다. 영화 대본(402A)은, 스토리 내의 장면들, 등장인물들, 행동들, 또는 등장인물들 사이의 대사들/대화들을 설명하기 위해 전형적으로 요구되는, 청각적, 시각적, 행동적, 또는 언어적 요소들을 통해 스토리를 기술하는 텍스트 기반 문서일 수 있다. 영화 대본(402A)은 또한 영화에 대한 대사들 및 연출을 포함할 수 있다.

404에서, 텍스트 분석이 수행될 수 있다. 정보 처리 디바이스(102)는 영화 대본(402A)의 텍스트 분석을 수행할 수 있다. 제한이 아닌 예로서, 정보 처리 디바이스(102)는, 영화 대본(402A)의 텍스트를 마이닝하고 마이닝된 텍스트로부터 주요 특징들을 추출하기 위해 하나 이상의 자연 언어 처리(NLP) 방법, 특히, ML 알고리즘들에 의존하는 통계적 NLP 방법을 구현할 수 있다. 또한 도 3에서 설명된 바와 같이, 영화 대본(402A)의 텍스트 분석에 기반하여, 정보 처리 디바이스(102)는 수신된 영화 대본(402A)의 복수의 장면들 및 수신된 영화 대본(402A)의 등장인물들의 목록을 식별할 수 있다. 일부 실시예들에서, 정보 처리 디바이스(102)는 추가로, 식별된 복수의 장면들에 걸친 식별된 목록의 등장인물들의 분포를 식별할 수 있다. 예컨대, 분포는, 영화 대본(402A)의 각각의 개별 장면에 등장하는 등장인물들의 수 및 이름들을 포함할 수 있다.

부가적으로 또는 대안적으로, 정보 처리 디바이스(102)는, 영화 대본(402A)의 텍스트 분석에 기반하여, 식별된 복수의 장면들 중 하나 이상의 장면에서의 기념 이벤트 또는 계절성 이벤트의 묘사를 결정할 수 있다. 예컨대, 하나 이상의 장면은 기념 이벤트들, 이를테면, 크리스마스 파티 또는 할로윈 파티를 포함할 수 있다. 결정된 기념 이벤트 또는 계절성 이벤트의 묘사에 기반하여, 정보 처리 디바이스(102)는, (영화 대본(402A)에 기반하여 제작되는 경우) 영화에 대한 개봉일을 추정할 수 있다. 다른 요인들, 이를테면, 장면들의 수, 장면 위치들, 예산, 또는 예산 제약들이 또한 영화에 대한 개봉일을 추정하는 데 고려될 수 있다. 다른 요인들의 세부사항들은 간략화를 위해 본 개시내용에서 생략된다.

부가적으로 또는 대안적으로, 일부 실시예들에서, 정보 처리 디바이스(102)는, 영화 대본(402A)의 텍스트 분석에 기반하여, 식별된 목록의 등장인물들 중에서 1명 이상의 주연 등장인물을 식별할 수 있다. 예컨대, 도 3에서 또한 논의된 바와 같이, 영화 대본(402A)의 모든 각각의 장면에서 등장인물의 이름 또는 등장인물의 대사가 발생하는 빈도 또는 수가 결정될 수 있다. 등장인물은, 그 등장인물이 영화 대본(402A)의 임계 장면 수보다 많은 장면들(예컨대, > 80 %)에 존재하고 영화 대본(402A)의 다른 등장인물들(예컨대, 80 % 초과의 등장인물들)과 비교하여 더 많은 수의 대사들을 가질 수 있다는 결정에 기반하여 주연 등장인물로서 식별될 수 있다.

부가적으로 또는 대안적으로, 일부 실시예들에서, 정보 처리 디바이스(102)는 영화 대본(402A)의 텍스트 분석에 기반하여 영화에 대한 제작 변수들의 세트를 식별할 수 있다. 제작 변수들의 세트는, 예컨대, 장면 위치들의 수, 장면들의 수, 등장인물들의 수 등을 포함할 수 있다. 부가적으로, 정보 처리 디바이스(102)는 영화의 제작에 대한 예산 및 촬영 기간을 결정할 수 있다.

일부 실시예에서, 복수의 장면들, 등장인물들의 목록, 식별된 목록의 등장인물들의 분포, 1명 이상의 주연 등장인물, 장면 위치들의 수, 등장인물들의 수, 장면들의 수, 기념 이벤트 또는 계절성 이벤트의 묘사, 및 개봉일의 추정, 또는 제작 변수들의 세트에 점수가 책정되고 나중에 영화의 성공-지수의 예측을 위해 사용될 수 있다.

406에서, 선택 동작이 수행될 수 있다. 선택 동작에 대해서, 정보 처리 디바이스(102)는, 영화 대본(402A)에 기반하여, 제작될 영화에 대한 배역 및 제작진 구성원들을 선택할 수 있다. 선택 동작은, 배역 선택 동작(406A) 및 제작진 선택 동작(406B)을 포함할 수 있다.

적어도 하나의 실시예에서, 배역 및 제작진 구성원들이 선택될 수 있기 전에, 이력적 영화 데이터베이스(406C)가 예컨대 서버(106)로부터 검색될 수 있다. 이력적 영화 데이터베이스(406C)는, 배우들, 및 제작진 구성원들, 이를테면, 감독들 및 연출자들에 관한 정보, 및 과거 영화들에서의 그들 개개의 역할들 및 상이한 장르들과의 그들의 연관성을 포함할 수 있다. 이력적 영화 데이터베이스(406C)는 또한, 모든 각각의 배우 및 모든 각각의 제작진 구성원에 대한 인덱스를 포함할 수 있다. 배우에 대한 인덱스는, 특정 장르 유형들과 연관된 역할들에 대한 배우의 적합성을 표시할 수 있다. 예컨대, 배우 "Bruce"에 대한 인덱스는 다음과 같이 표 1에 의해 주어질 수 있다:

유사하게, 감독 "John"에 대한 인덱스는 다음과 같이 표 2에 의해 주어질 수 있다:

일부 실시예들에서, 이력적 영화 데이터베이스(406C)는 또한, 과거 영화들의 장면들, 과거 영화들의 평점들, 과거 영화들의 좋은 부분들/좋지 않은 부분들, 소셜 미디어 플랫폼들 상의 유행하는 장르들/이벤트들에 관한 정보를 포함할 수 있다. 그러한 장면들은 또한, 기념 이벤트들 및/또는 계절성 이벤트들과 관련된 장면들을 포함할 수 있다. 부가적으로, 일부 예시에서, 이력적 영화 데이터베이스(406C)는 또한, 과거 영화들의 각각의 장면 또는 장면들의 그룹에 대한 평점을 포함할 수 있다. 평점은 복수의 시청자들로부터 획득될 수 있고, 장면의 호평 점수 또는 인기 척도를 반영할 수 있다. 부가적으로 또는 대안적으로, 일부 예시들에서, 이력적 영화 데이터베이스(406C)는 또한, 과거 영화들에 대한 이전에 계산된 성공-지수들을 포함할 수 있다.

406A에서, 배역 선택 동작이 수행될 수 있다. 배역 선택 동작에 대해, 정보 처리 디바이스(102)는, 식별된 목록의 등장인물들의 각각의 등장인물의 역할 연기에 대한 배우를 선택할 수 있다. 배우는 이력적 영화 데이터베이스(406C)의 데이터포인트들에 기반하여 그 역할 연기에 선택될 수 있다. 일부 실시예들에서, 정보 처리 디바이스(102)는, 이력적 영화 데이터베이스(406C)에서 특정된 복수의 장르로부터 영화 대본(402A)의 장르를 선택할 수 있다. 선택된 장르에 기반하여, 이력적 영화 데이터베이스(406C)는 선택된 장르에 대해 인덱스가 최대치인 배우들의 목록을 추출하도록 필터링될 수 있다. 추출된 목록의 배우들은, 식별된 목록의 등장인물들 중 적어도 하나의 등장인물의 역할 연기에 대한 잠재적 후보들일 수 있다. 예컨대, 표 1에서, Bruce의 경우, 인덱스는 "액션" 장르에 대해 최대치이고, 영화 대본(402A)이 또한 "액션" 장르와 연관되는 경우에, "Bruce"는 그 영화의 역할 연기에 대한 잠재적 후보로서 식별될 수 있다.

406B에서, 제작진 선택 동작이 수행될 수 있다. 제작진 선택 동작에 대해, 정보 처리 디바이스(102)는 영화에 대한 주요 제작진 구성원들의 목록을 선택할 수 있다. 주요 제작진 구성원들의 목록의 선택은 이력적 영화 데이터베이스(406C)에 기반할 수 있다. 주요 제작진 구성원들은, 예컨대, 감독, 연출자, 촬영 감독, 카메라 감독, 카메라 보조, 장비 관리자(grip)들, 조명 감독들, 붐 오퍼레이터, 영화미술 감독, 대본 감독 등을 포함할 수 있다.

일부 실시예들에서, 이력적 영화 데이터베이스(406C)는 선택된 장르에 대해 인덱스가 최대치인 구성원들의 목록을 추출하도록 필터링될 수 있다. 추출된 목록의 구성원들은, 영화의 제작에서 영화 제작진과 연관된 적어도 하나의 역할에 대한 잠재적 후보일 수 있다. 예컨대, 표 2에서, John의 경우, 인덱스는 "액션" 장르에 대해 최대치이고, 영화 대본(402A)이 또한 "액션" 장르와 연관되는 경우에, "John"은 그 영화의 감독에 대한 잠재적 후보로서 식별될 수 있다.

예컨대, 영화의 제작의 모든 각각의 역할(연기 역할들 및 제작 역할들(예컨대, 연출, 예술, 영화촬영 등)을 포함함)에 대해, 이력적 영화 데이터베이스(406C)는 적어도 2명 이상의 배우 또는 잠재적 제작진 구성원의 프로필들의 세트를 포함할 수 있다. 장르(이를테면, 액션)에 대한 적합한 프로필들로 좁히기 위해, 정보 처리 디바이스(102)는, 프로필들의 세트에 장르에 대한 필터를 적용하여 그 장르(이를테면, 액션)에 대해서만 관련되는 필터링된 프로필들의 세트를 획득할 수 있다.

408에서, 점수 계산 동작이 수행될 수 있다. 정보 처리 디바이스(102)는, 본원에 설명된 바와 같이, 영화 대본(402A)의 텍스트 분석에 기반하여 식별된 다양한 세부사항들에 기반하여 점수들을 계산할 수 있다. 이어서, 계산된 점수들은, 영화에 대한 성공-지수를 예측하기 위해 통합 점수 책정 모델(예컨대, 수학적 점수 책정 함수)에 의해 사용될 수 있다.

정보 처리 디바이스(102)는, 식별된 복수의 장면들의 각각의 장면에 대한 제1 점수를 계산할 수 있다. 여기서, 각각의 장면에 대해, 제1 점수는 식별된 복수의 장면들의 개개의 장면에 대한 장르 정보에 기반하여 계산될 수 있다. 장르 정보의 예들은, 초현실적, 기묘함, 액션, 어드벤처, 코미디, 범죄, 드라마, 판타지, 역사, 역사 소설, 공포, 마법, 미스터리, 편집증, 상상, 철학, 정치, 로맨스, 대하소설, 풍자, 공상 과학, 사회, 사변, 스릴러, 도시, 및 서부를 포함할 수 있지만, 이에 제한되지 않는다. 먼저, 정보 처리 디바이스(102)는 각각의 장면에 대한 장르 정보를 결정할 수 있고, 이어서, 결정된 장르 정보에 기반하여, 식별된 복수의 장면들의 각각의 장면에 대한 제1 점수를 계산할 수 있다. 예로서 도시된 정규화된 장면별 점수 그래프(406D)는, 예시적인 영화 대본의 120개의 장면에 대해 0 내지 1의 제1 점수들을 포함하는 것으로 도시된다. 여기서, 정규화된 장면별 점수 그래프(406D)의 피크들은 영화 대본의 중요한 장면들을 표시할 수 있고, 영화에 대한 성공-지수의 예측에서 더 높은 가중치를 보유할 수 있다. 유사하게, 제1 점수들이 0 또는 약 0인 장면들은 영화에 대한 성공-지수의 예측에서 낮은 가중치를 보유하거나 가중치를 보유하지 않을 수 있다.

부가적으로 또는 대안적으로, 정보 처리 디바이스(102)는, 영화 대본(402A)의 텍스트 분석에 기반하여, 식별된 복수의 장면들에 걸쳐, 식별된 세트의 등장인물들(404에서 언급됨)의 분포를 식별할 수 있다. 식별된 복수의 장면들의 각각의 장면에 대한 제1 점수는 식별된 세트의 등장인물들의 분포에 추가로 기반하여 계산될 수 있다. 예컨대, 장면의 장르가 '액션'으로 결정되고 모든 주연 등장인물들이 장면의 일부인 경우, 동일한 장르이지만 조연 등장인물들(즉, 영화의 주연 등장인물들이 아닌 등장인물들)이 있는 다른 장면과 비교하여 그 장면에 대해 높은 점수가 계산될 수 있다.

정보 처리 디바이스(102)는, 영화 대본(402A)의 식별된 목록의 등장인물들의 역할 연기에 대해 선택된(예컨대, 406A에서 선택됨) 배우(들)에 대한 제2 점수를 계산할 수 있다. 계산된 제2 점수는 ML 모델(408A)에 기반하여 계산될 수 있고, 역할 연기에 대한 선택된 배우(들)의 적합성을 표시할 수 있다. ML 모델(408A)은, 이력적 영화 데이터베이스(406C)의 데이터포인트들에 대해 훈련될 수 있다. 예컨대, ML 모델(408A)이 특정 영화 장르들에 대한 출력 라벨들로서 배우 이름들 또는 배우 ID들 및 (역할 연기에 대한 적합성의 척도로서의) 연관된 인덱스 값들에 대해 훈련되는 경우, 선택된 배우(예컨대, 406A에서 선택됨)에 대한 출력 라벨들은 선택된 배우에 대한 제2 점수일 수 있다. ML 모델(408A)은 도 1의 ML 모델(110)과 동일할 수 있다. ML 모델(408A)의 예시적인 구현은, 예컨대, 도 5에서 상세히 설명된다.

부가적으로 또는 대안적으로, 정보 처리 디바이스(102)는, (404에서 또한 설명된 바와 같이) 식별된 복수의 장면들 중 하나 이상의 장면에서의 기념 이벤트 또는 계절성 이벤트의 묘사를 결정할 수 있다. 정보 처리 디바이스(102)는, 식별된 복수의 장면들 중 하나 이상의 장면의 결정된 기념 이벤트 또는 계절성 이벤트의 묘사에 대한 제3 점수를 계산할 수 있다. 예로서, 과거 영화들에서의 이러한 장면들의 영향이 제3 점수를 계산하기 위해 이력적 영화 데이터베이스(406C)에 기반하여 측정될 수 있다. 기념 이벤트 또는 계절성 이벤트에 기반한 장면들은 시청자들에게 영향력이 강하거나 매력적인 것으로 간주될 수 있기 때문에, 그러한 장면들에 대해 계산된 제3 점수는 영화에 대한 성공-지수의 평가에서 고려될 수 있다.

부가적으로 또는 대안적으로, 정보 처리 디바이스(102)는 제작될 영화에 대한 추정된 개봉일에 대해 제4 점수를 계산할 수 있다. 영화의 개봉일은 결정된 기념 이벤트 또는 계절성 이벤트의 묘사에 기반하여 추정될 수 있다. 예컨대, 크리스마스의 기념에 기반하는 다수의 장면들이 영화 대본(402A)에 존재하는 경우, 개봉일은 크리스마스 날 또는 새해의 날에 가깝거나 동일한 날로 정해질 수 있다. 개봉일을 추정하는 다른 요인들, 예컨대, 예산, 제작 스케줄, 배역 가능여부, 장면 위치들, 소셜 미디어 유행들, 축제들, 및 계절성 유행들이 존재할 수 있다. 특정 상황들에서, 추정 날짜가 주말에 속하는 경우, 제4 점수는, 추정 날짜가 평일에 속하는 상황들과 비교하여 더 높은 점수로 계산될 수 있다.

부가적으로 또는 대안적으로, 정보 처리 디바이스(102)는, 주요 제작진 구성원들의 목록 내의 각각의 주요 제작진 구성원에 대해 제5 점수를 계산할 수 있다. 주요 제작진 구성원들의 목록은 406B에서 정보 처리 디바이스(102)에 의해 선택될 수 있다. 제5 점수는, 영화의 제작에서의 작업에 대한 대응하는 주요 제작진 구성원의 적합성을 표시할 수 있고, ML 모델(408A)에 기반하여 계산될 수 있다. 예컨대, 표 2를 참조하면, John에 대한 높은 점수는 영화에 대한 감독으로서의 그의 적합성을 표시할 수 있다.

410에서, 영화에 대해 성공-지수가 예측될 수 있다. 정보 처리 디바이스(102)는, 영화 대본(402A)의 식별된 복수의 장면들의 각각의 장면에 대한 계산된 제1 점수 및 식별된 목록의 등장인물들에 대한 선택된 배우(들)에 대한 계산된 제2 점수에 기반하여 영화에 대한 성공-지수를 예측할 수 있다. 부가적으로 또는 대안적으로, 영화에 대한 성공-지수는, 영화 대본(402A)의 하나 이상의 장면에서의 기념 이벤트 또는 계절성 이벤트의 묘사에 대한 계산된 제3 점수, 추정된 개봉일에 대한 계산된 제4 점수, 또는 주요 제작진 구성원들의 목록 내의 각각의 주요 제작진 구성원에 대한 계산된 제5 점수에 추가로 기반하여 예측될 수 있다.

성공-지수는 흥행에 있어서의 영화의 성과의 예측일 수 있다. 성과는, 관객 호평 또는 인기 평점, (예컨대, 영화에 대한 제작 예산에 관한 수익/손실의 관점에서의) 금전적 이득, 영화 평점 등과 같은 변수들에 대한 표시자일 수 있다. 예컨대, 일부 예시들에서, 예측된 성공-지수의 값이 임계값(예컨대, 0.75 또는 75 %)보다 큰 경우, 영화 대본(402A)은 영화 제작사와 연관된 사용자(들)에게 추천될 수 있다.

일부 실시예들에서, 정보 처리 디바이스(102)는 영화 대본(402A)의 텍스트 분석에 기반하여 제작 변수들의 세트를 식별할 수 있다. 제작 변수들의 세트는, 예컨대, 영화 대본(402A) 내의 장면들의 수, 등장인물들의 수, 또는 장면 위치들의 수를 포함할 수 있다. 부가적으로, 다른 데이터 소스들로부터, 이를테면, 제작에 대한 예산 또는 예산 관련 제약들 및 촬영 기간 또는 스케줄이 결정될 수 있다. 정보 처리 디바이스(102)는, 식별된 제작 변수들의 세트에 대한 제1 가중치, 결정된 촬영 기간에 대한 제2 가중치, 및 결정된 예산에 대한 제3 가중치를 계산할 수 있다. 제1 가중치, 제2 가중치, 및 제3 가중치는 이력적 영화 데이터베이스(406C)에 기반하여 또는 ML 모델(408A)에 기반하여 결정될 수 있다.

일부 다른 실시예들에서, 정보 처리 디바이스(102)는, 사용자들의 소셜 미디어 활동들 및 과거 영화들에 대한 사용자들의 과거 활동들의 분석에 기반하여 영화 대본(402A)의 적어도 하나의 장면의 맥락 또는 장르의 인기 척도를 추정할 수 있다. 정보 처리 디바이스(102)는, 추정 인기 척도에 추가로 기반하여 영화에 대한 성공-지수를 예측할 수 있다. 예컨대, 영화 대본(402A)의 적어도 50개의 장면은 대통령 선거들의 맥락을 갖는다. 소셜 미디어 유행들(예컨대, 게시물들, 댓글들, 또는 다른 사용자 활동들)에 기반하여, 대통령 선거들에 대한 인기 척도는 높은 것(예컨대, 미국에서 상위 10개의 유행하는 인터넷 화제들)으로 추정될 수 있거나, 또는 텔레비전 미디어 플랫폼들에 기반하여 추정될 수 있고, 대통령 선거들은 영화에 대한 성공-지수의 예측에서 관련 요소로 간주될 수 있다.

적어도 하나의 실시예에서, 정보 처리 디바이스(102)는, 계산된 제1 점수, 계산된 제2 점수, 계산된 제3 점수, 계산된 제4 점수, 계산된 제5 점수, 제1 가중치, 제2 가중치, 제3 가중치, 및 추정 인기 척도에 대해 통합 점수 책정 모델을 적용할 수 있다. 예컨대, 통합 점수 책정 모델은 합산 함수 및 시그모이드 함수를 포함할 수 있다. 합산 함수는 계산된 점수들, 가중치들, 및 인기 척도의 합(예컨대, 가중 합)을 출력할 수 있는 반면, 시그모이드 함수는 출력 합에 기반하여 영화에 대한 예측으로서 성공-지수(예컨대, 0 내지 1)를 출력할 수 있다. 합산 함수 및 시그모이드 함수는 단지 통합 점수 책정 모델에 대한 예로서 제공된다는 것이 유의되어야 한다. 본 개시내용은 또한, 본 개시내용의 범위로부터 벗어나지 않으면서, 다른 수학적 함수들 또는 모델들(예컨대, 심층 신경망들)에 적용가능할 수 있다.

제한이 아닌 예로서, 정보 처리 디바이스(102)는 다음과 같이 제공되는 수학식 (1)에 기반하여 성공-지수를 예측할 수 있다:

성공-지수 =

(1)

여기서,

w1 = 영화 대본(402A)에 대한 장면별 장르 점수에 대한 가중치이고,

w_p = 각각의 기능적 파라미터, 이를테면, 배우 점수, 감독 점수, 계절성, 예산 등에 대한 가중치이고,

m = 영화 대본(402A) 내의 장면들의 수이고,

a_g = 장르(g)에 대한 장면 점수이고,

b_p = 감독 점수, 계절성, 예산 등의 기능적 파라미터(p)에 대한 점수, 예컨대, 선택된 배우 점수이고,

n = 기능적 파라미터들의 총 수이다.

가중치들은 정보 처리 디바이스(102)에 의해 각각의 새로운 영화 대본에 대해 동적으로 계산될 수 있다. 일부 예시들에서, 사용자에게는 사용자의 필요에 따라 가중치 파라미터들을 수정하는 옵션들이 제공될 수 있다.

실시예에 따르면, 정보 처리 디바이스(102)는, 예측된 성공-지수를 임계값과 비교할 수 있다. 예측된 성공-지수가 임계값보다 큰 경우에, 정보 처리 디바이스(102)는, 주요 제작진 구성원들의 선택된 목록을 영화에 대한 제작진으로서 추천할 수 있다. 부가적으로 또는 대안적으로, 정보 처리 디바이스(102)는, 예측된 성공-지수가 임계값보다 크다는 결정에 기반하여, 선택된 배우(들)를 영화에 대한 배역 구성원(들)으로서 추천할 수 있다. 배역 구성원(들)은 수신된 영화 대본(402A)에 기반하여 제작될 영화에서의 역할 연기에 적합할 수 있다. 특정 상황들에서, 정보 처리 디바이스(102)는, 예측된 성공-지수가 임계값 미만이라는 결정에 기반하여, 식별된 목록의 등장인물들의 각각의 등장인물의 역할 연기에 대해 이력적 영화 데이터베이스(406C)로부터 상이한 배우를 선택할 수 있다. 상이한 배우(들)의 선택에 기반하여, 정보 처리 디바이스(102)는, 406부터 410까지의 동작들을 반복적으로 수행하여 영화에 대한 성공-지수를 다시 예측할 수 있다. 배우(들) 및 제작진 구성원(들)의 선택은 예측된 성공-지수가 임계값을 초과할 때까지 모의로서 반복적으로 수행될 수 있다. 일단, 예측된 성공-지수가 임계값을 초과하면, 영화에 대한 배역 구성원들 및 제작진 구성원들의 최적의 목록이 획득될 수 있다.

도 5는 본 개시내용의 실시예에 따른, 영화의 성공-지수의 예측을 위한 예시적인 기계 학습(ML) 모델을 예시하는 도면이다. 도 5는, 도 1, 도 2, 도 3, 및 도 4의 요소들과 함께 설명된다. 도 5를 참조하면, 도 1의 ML 모델(110) 또는 도 4의 ML 모델(408A)의 예시적인 구현으로서 심층 신경망(DNN)(502)의 도면(500)이 도시된다. (특히, 계층들의 수 및 노드들의 수의 관점에서) DNN(502)은 단지 예로서 제공되고, 본 개시내용에 대한 제한으로서 해석되어서는 안된다는 것이 유의되어야 한다. 본 개시내용은 또한, 본 개시내용의 범위로부터 벗어나지 않으면서, DNN의 (예컨대, 노드들/계층들의 수에 있어서의) 다른 변형들에 적용가능할 수 있다.

DNN(502)은 계산 신경망 또는 인공 뉴런들의 시스템으로 지칭될 수 있으며, 여기서, DNN(502)의 각각의 계층은 노드들(504)로서 인공 뉴런들을 포함할 수 있다. DNN(502)은 복수의 계층들, 이를테면, 입력 계층(506), 하나 이상의 은닉 계층(집합적으로 중간 계층들(512)로 지칭되는, 제1 중간 계층(508) 및 제2 중간 계층(510)), 및 출력 계층(514)을 포함할 수 있다.

입력 계층(506)은, 제1 노드(506A), 제2 노드(506B), 제3 노드(506C), 및 제4 노드(506D)를 포함할 수 있다. 입력 계층(506)의 제1 노드(506A)는 장르 정보와 연관될 수 있고, 입력 계층(506)의 제2 노드(506B)는 식별된 목록의 등장인물들과 연관될 수 있고, 입력 계층(506)의 제3 노드(506C)는 식별된 복수의 장면들과 연관될 수 있으며, 입력 계층(506)의 제4 노드(506D)는 영화의 추정된 개봉일과 연관될 수 있다.

제1 중간 계층(508)은, 제1 노드(508A), 제2 노드(508B), 제3 노드(508C), 및 제4 노드(508D)를 포함할 수 있다. 제1 중간 계층(508)의 제1 노드(508A)는 영화 대본 내의 다수의 등장인물들과 연관될 수 있고, 제1 중간 계층(508)의 제2 노드(508B)는 영화 대본에서의 기념 또는 계절성 이벤트들의 묘사와 연관될 수 있고, 제1 중간 계층(508)의 제3 노드(508C)는 영화의 촬영 기간과 연관될 수 있으며, 제1 중간 계층(508)의 제4 노드(508D)는 영화의 예산과 연관될 수 있다. 유사하게, 제2 중간 계층(510)은, 제1 노드(510A) 및 제2 노드(510B)를 포함할 수 있다. 제2 중간 계층(510)의 제1 노드(510A)는, 점수들(예컨대, 도 4의 408에서 또한 계산되는 바와 같은, 제1 점수, 제2 점수, 또는 다른 점수들)과 연관될 수 있다. 제2 중간 계층(510)의 제2 노드(510B)는, 가중치들(예컨대, 410에서 또한 계산되는 바와 같은, 제1 가중치, 제2 가중치, 및 제3 가중치)과 연관될 수 있다. 출력 계층(514)은, 제1 노드(510A)와 연관된 점수들 및 제2 노드(510B)와 연관된 가중치들에 기반하여, 예컨대 0 내지 1의 예측 값으로서 영화에 대한 성공-지수를 출력할 수 있는 출력 노드(514A)를 포함할 수 있다.

DNN(502) 내의 모든 노드들(504)의 출력들은 DNN(502)의 선행 또는 후속 계층(들)의 적어도 하나의 노드에 결합될 수 있다. 유사하게, DNN(502) 내의 모든 노드들(504)의 입력들은 DNN(502)의 선행 또는 후속 계층(들)의 적어도 하나의 노드에 결합될 수 있다. DNN(502)의 출력 계층(514) 내의 노드(들)는 적어도 하나의 이전 계층으로부터 입력들을 수신할 수 있다. 계층들의 수 및 각각의 계층 내의 노드들(504)의 수는 DNN(502)의 네트워크 토폴로지 및 특정 하이퍼-파라미터들로부터 결정될 수 있다. 그러한 하이퍼-파라미터들은, 이력적 영화 데이터베이스의 데이터포인트들에 기반하여 구성되는 훈련 데이터세트에 대해 DNN(502)을 훈련하기 전에 또는 훈련하는 동안 설정될 수 있다.

DNN(502) 내의 각각의 노드는 DNN(502)이 훈련되는 동안 조정가능한 파라미터들의 세트를 갖는 수학적 함수에 대응할 수 있다. 이러한 파라미터들은, 예컨대, 가중치 파라미터, 정규화 파라미터 등을 포함할 수 있다. 각각의 노드는, DNN(502)의 다른 계층(들)(예컨대, 이전 계층(들)) 내의 노드들로부터의 하나 이상의 입력에 기반하여 출력을 계산하기 위해 수학적 함수를 사용할 수 있다. 도 1에서, DNN(502)의 간략화된 예가 제시된다. DNN(502)의 다른 예들은, 순환적 신경망(RNN), 콘볼루션 신경망(CNN)-재귀적 신경망(CNN-RNN), 인공 신경망(ANN), 장단기 메모리(LSTM) 네트워크, CNN+ANN, LSTM+ANN, 게이티 순환 유닛(GRU)-기반 RNN, 완전 연결 네트워크, 연결주의 시간 분류(CTC)-기반 RNN, 및/또는 그러한 네트워크들의 조합을 포함할 수 있지만, 이에 제한되지 않는다. 특정 실시예들에서, DNN(502)은 다수의 DNN들의 하이브리드 아키텍처에 기반할 수 있다.

DNN(502)은, 예컨대, 소프트웨어 프로그램의 소프트웨어 구성요소로서 구현될 수 있는 전자 데이터를 포함할 수 있다. DNN(502)은, 처리 디바이스, 이를테면 정보 처리 디바이스(102)에 의한 실행을 위해 라이브러리들, 외부 스크립트들, 또는 다른 로직/명령어들에 의존할 수 있다. 부가적으로 또는 대안적으로, DNN(502)은, 프로세서, (예컨대, 하나 이상의 동작의 수행하거나 그의 수행을 제어하기 위한) 마이크로프로세서, 필드 프로그래밍가능 게이트 어레이(FPGA), 또는 주문형 집적 회로(ASIC)와 같은 하드웨어를 사용하여 구현될 수 있다. 일부 실시예들에서, DNN(502)은 하드웨어와 소프트웨어 프로그램 둘 모두의 조합을 사용하여 구현될 수 있다.

정보 처리 디바이스(102)는 DNN(502)의 입력 계층(506)에 데이터세트를 입력할 수 있다. 더 구체적으로, 데이터세트는 입력 계층(506)의 제1 노드(506A), 제2 노드(506B), 제3 노드(506C), 및 제4 노드(506D)에 대한 입력으로서 제공될 수 있다. 데이터세트는, 예컨대, 영화 대본의 복수의 장면들과 연관된 장르 정보, 영화 대본의 식별된 목록의 등장인물들, 영화 대본의 식별된 복수의 장면들, 및 영화에 대한 개봉일을 포함할 수 있다. 입력 계층(506)의 출력은 가중 입력으로서 제1 중간 계층(508)에 제공될 수 있다. 입력 계층(506)으로부터의 가중 입력에 기반하여, 제1 중간 계층(508)의 제1 노드(508A), 제2 노드(508B), 제3 노드(508C), 및 제4 노드(508D)는 각각, 영화 대본의 다수의 등장인물들을 식별하고, 기념 이벤트들 또는 계절성 이벤트들과 연관된 장면들을 식별하고, 영화에 대한 촬영 시간, 및 영화에 대한 예산을 추정할 수 있다.

제2 중간 계층(510)의 제1 노드(510A)는 점수들, 이를테면, 식별된 복수의 장면들의 각각의 장면에 대한 제1 점수 및 영화 대본의 식별된 목록의 등장인물들의 역할 연기에 대해 선택된 배우(들)에 대한 제2 점수를 계산할 수 있다. 부가적으로 또는 대안적으로, 일부 실시예들에서, 제2 중간 계층들(510)의 다른 노드들(도시되지 않음)은, 영화 대본의 장면들에서의 기념 또는 계절성 이벤트들의 묘사에 대한 제3 점수, 추정된 개봉일에 대한 제4 점수, 및 주요 제작진 구성원들의 목록 내의 각각의 주요 제작진 구성원에 대한 제5 점수를 계산할 수 있다. DNN(502)의 제2 중간 계층(510)의 제2 노드(510B)는 가중치들, 이를테면, 제작 변수들의 세트에 대한 제1 가중치, 영화에 대한 촬영 기간에 대한 제2 가중치, 영화의 예산에 대한 제3 가중치를 계산할 수 있다.

출력 계층(514)의 출력 노드(514A)는, 계산된 점수들(제1, 제2, 제3, 제4, 또는 제5 점수들) 및/또는 가중치들(제1, 제2, 또는 제3 가중치들)을 입력으로서 수신할 수 있다. 출력 계층(514)의 출력 노드(514A)는, 영화 대본에 대한 예측으로서 성공-지수를 계산하기 위한 활성화 함수/점수 책정 함수를 포함할 수 있다. 제한이 아닌 예로서, 출력 노드(514A)는, 계산된 점수들 및 계산된 가중치들의 가중 평균을 계산하여 영화에 대한 성공-지수를 출력할 수 있다. 제한이 아닌 예로서, DNN(502)의 출력 계층(514)의 출력 노드(514A)는, 계산된 점수들 및/또는 가중치들에 시그모이드 활성화를 적용하여 영화에 대한 성공-지수를 출력할 수 있다.

가중 평균 또는 시그모이드 활성화는 단지 예로서 제공되고, 본 개시내용은 또한, 본 개시내용의 범위로부터 벗어나지 않으면서, 성공-지수를 예측하기 위한 다른 점수 책정 함수들에 적용가능할 수 있다는 것이 유의되어야 한다.

도 6은 본 개시내용의 실시예에 따른, 어조 메트릭들에 기반한 영화의 성공-지수의 예측을 위한 예시적인 동작들을 예시하는 도면이다. 도 6은, 도 1, 도 2, 도 3, 도 4, 및 도 5의 요소들과 함께 설명된다. 도 6을 참조하면, 블록도(600)가 도시된다. 예시적인 동작들은 602 내지 606일 수 있고, 임의의 컴퓨팅 시스템에 의해, 이를테면, 도 2의 정보 처리 디바이스(102)에 의해 수행될 수 있다.

602에서, 영화 대본(602A)로부터 어조 특징들의 세트가 추출될 수 있다. 일 실시예에서, 정보 처리 디바이스(102)는, 영화 대본(602A)의 텍스트 분석에 기반하여 어조의 세트를 추출할 수 있다. 어조 특징들의 세트는, 영화의 제작 단계 동안 대사들이 전달될 수 있는 방식을 설명할 수 있다. 추출된 어조 특징들의 세트는, 영화 대본(602A)의 등장인물의 내레이션 또는 상태, 텍스트 대문자 사용, 감탄사, 리듬, 운율, 또는 억양 중 하나 이상에 대응할 수 있다. 영화의 스토리라인의 텍스트 표현인 영화 대본(602A)과 관련하여, 단어들의 선택, 친화성, 반복성, 말장난 및 그의 맥락은 어조 또는 어조 특징들을 정의할 수 있다. 반면에, 실제 영화에서, 배우들의 얼굴 표정, 몸짓 언어, 음성 변조, 대사 전달, 및 억양은 함께 영화 중의 생활 속에서의 전반적인 의미에 기여할 수 있다. 어조의 미묘한 차이들은, 시청자들이 영화의 장면을 어떻게 인식하는지에 극적인 영향을 줄 수 있다. 예컨대, 코미디 등장인물은 약간의 변화들을 제외하고는 유사한 어조로 그대로 유지되어야 한다. 너무 많은 변동들 및 어조의 흔들림은 관객의 집중을 방해하고 영화 성공에 영향을 줄 수 있다.

전형적으로, 배우들이 영화 대본의 등장인물들을 연기하는 영화 제작 단계에서 어조 특징들이 결정될 수 있다. 그러나, 영화 대본은 또한 어조 특징들을 실제로 식별하기 위한 뉘앙스들을 포함한다. 영화 대본에서의 서술들은 대사가 등장인물에 의해 어떻게 전달되는지를 정의하는 것을 도울 수 있다. 내레이션의 일 예로서, 영화 대본(602A)의 일부분이 다음과 같이 제공된다:

BURT: That girl in the white dress always looks at me when I drive down on my bike.

JENNY: That's because you stare at her like a bloody stalker.

Just then Vicky comes plops noisily next to them.

He's suppressing a grin. Both of them look at him suspiciously.

이 부분에서, 내레이션 "He’s suppressing a grin. Both of them look at him suspiciously"가 분석되어, 대사가 나오기 전에 등장인물 "Vicky"의 상태가 추출될 수 있다. 내레이션의 다른 예로서, 영화 대본(602A)은 "The actor's delivery punches a triple 'g' sound in the original dialogue ― a humorous bit of alliteration that is replicated"와 같은 텍스트 부분을 포함할 수 있다. 이러한 텍스트 부분이 분석되어, 대사 이전의 등장인물의 상태가 추출될 수 있다. 텍스트 부분으로부터 몸짓 언어가 또한 추출될 수 있다. 다른 예로서, 영화 대본(602A)은 다음의 텍스트 부분을 포함할 수 있다:

"INHI: Old lady, what do you care WHAT I do?

HAG: Oh, and what do YOU care what I care?"

영화 대본(602A)의 텍스트 부분의 텍스트 분석에 기반하여, 정보 처리 디바이스(102)는, 대문자 텍스트("WHAT", "YOU"), 감탄사, 리듬, 운율 또는 억양을 포함하는 제1 세트의 어조 특징을 추출할 수 있다.

604에서, 복수의 어조 메트릭들이 계산될 수 있다. 복수의 어조 메트릭들은, 제1 어조 메트릭, 제2 어조 메트릭, 및 제3 어조 메트릭을 포함할 수 있다. 정보 처리 디바이스(102)는, 영화 대본(602A)의 복수의 장면들을 식별하고, 추출된 어조 특징들의 세트에 기반하여, 식별된 복수의 장면들의 각각의 장면에 대한 제1 어조 메트릭을 계산할 수 있다. 약 100개의 장면에 대한 계산자 어조 메트릭의 예가 제1 그래프(604A)에서 제공된다. 제1 그래프(604A)에서, 각각의 곡선은 영화 대본(602A)의 약 100개의 장면에 대한 특정 어조 수준(죄책감, 기쁨, 슬픔, 부끄러움, 혐오감, 분노, 및 두려움 중 하나)의 변동을 도시한다. 각각의 장면에 대해, 개개의 어조 수준과 연관된 곡선의 피크에 의해 표시되는 바와 같이, 어조 수준들 중 하나가 우세할 수 있다.

정보 처리 디바이스(102)는, 영화 대본(602A)에서 등장인물들의 목록을 식별하고, 식별된 목록의 등장인물들 중 제1 등장인물에 대한 제2 어조 메트릭을 계산할 수 있다. 제1 등장인물에 대해, 제2 어조 메트릭은 영화 대본(602A)의 식별된 복수의 장면들 전체에 걸친 제1 등장인물의 역할과 연관된 어조 수준들의 변동을 나타낼 수 있다. 이러한 어조 수준들은, 죄책감, 기쁨, 슬픔, 부끄러움, 혐오감, 분노, 및 두려움 중 하나 이상을 포함할 수 있다. 4명의 등장인물 "천사", "운전 기사", "로드" 및 "밀고자"에 대한 계산된 제2 어조 메트릭의 예가 제2 그래프(604B)에서 표시된다. 제2 그래프(604B)는, 4명의 등장인물 각각에 대한 죄책감, 기쁨, 슬픔, 부끄러움, 혐오감, 분노, 및 두려움와 같은 어조 수준들의 변동을 도시할 수 있다.

정보 처리 디바이스(102)는 추가로, 영화 대본(602A)의 어조 수준들의 변동에 대응하는 제3 어조 메트릭을 계산할 수 있다. 제3 어조 메트릭은 영화 대본(602A)의 전체 길이에 대한 것일 수 있고, 영화 대본(602A)의 모든 대사들의 어조를 결정할 수 있다.

606에서, 영화 대본(602A)에 기반하여 제작되어야 할 수 있는 영화에 대한 성공-지수가 예측될 수 있다. 성공-지수는, 계산된 제1 어조 메트릭, 계산된 제2 어조 메트릭, 또는 계산자 제3 어조 메트릭에 기반하여 예측될 수 있다. 예컨대, 계산된 제1 어조 메트릭, 계산된 제2 어조 메트릭, 또는 계산자 제3 어조 메트릭 각각이 정규화되고 시그모이드 함수로 전달되어 정규화된 어조 점수가 획득될 수 있다. 정규화된 어조 점수들이 (도 4 및 도 5에서 설명된 바와 같이) 다양한 기능적 파라미터들에 대한 나머지 점수들 및 가중치들과 조합되어 성공-지수가 예측될 수 있다.

일부 실시예들에서, 영화에 대한 성공-지수는, 제1 어조 메트릭, 제2 어조 메트릭, 및 제3 어조 메트릭과, 제1 점수(즉, 도 4에서 설명된 바와 같은, 장면별 장르 점수), 제2 점수(도 4에서 설명된 바와 같은, 등장인물/배역 점수), 제3 점수(도 4에서 설명된 바와 같은, 장면들에서의 기념 이벤트 또는 계절성 이벤트의 묘사에 대한 것), 제4 점수(추정된 개봉일에 대한 것), 및 제5 점수(영화의 제작에서의 작업에 대한 대응하는 주요 제작진 구성원의 적합성) 중 하나 이상의 조합에 기반하여 예측될 수 있다.

도 7은 본 개시내용의 실시예에 따른, 영화 대본의 2개 이상의 버전의 비교를 위한 산업 전반 기준선 모델의 생성을 위한 예시적인 동작들을 예시하는 블록도이다. 도 7은, 도 1, 도 2, 도 3, 도 4, 도 5, 및 도 6의 요소들과 함께 설명된다. 도 7을 참조하면, 블록도(700)가 도시된다. 동작들(702 내지 726)은 정보 처리 디바이스(102) 상에서 구현될 수 있다. 동작들은 702에서 시작되어 704로 진행될 수 있다.

704에서, 이력적 영화 데이터베이스(이를테면, 이력적 영화 데이터베이스(406C))가 검색되고 선택될 수 있다. 그 후, 이력적 영화 데이터베이스로부터의 점수 책정 정보가 추출될 수 있다. 추출된 점수 책정 정보는, 복수의 과거 영화들의 각각의 과거 영화에 대한 성공-지수를 포함할 수 있다. 일부 실시예들에서, 점수 책정 정보는, 특정 영화와 연관된 복수의 장르들 각각에 대응하는 점수를 포함할 수 있다.

706에서, 복수의 과거 영화들의 각각의 과거 영화에 대한 제1 세트의 장르별 점수들이, 추출된 점수 책정 정보에서의 개개의 성공-지수에 기반하여 결정될 수 있다. 제1 세트의 장르별 점수는 영화의 다수의 장르들의 점수들일 수 있다. 예컨대, 4개의 과거 영화 "알파", "베타", "감마", 및 "세타"에 대한 제1 세트의 장르별 점수들이 다음과 같이 표 3에서 제공된다:

708에서, 정규화된 점수들의 세트를 생성하기 위해, 결정된 제1 세트의 장르별 점수들이 복수의 과거 영화들 각각에 대해 정규화될 수 있다. 예컨대, 정규화된 점수들의 세트를 생성하기 위해, 시그모이드 함수가 결정된 제1 세트의 장르별 점수들에 적용될 수 있다. 생성된 세트의 정규화된 점수들 각각은 0 내지 1로 있을 수 있다.

710에서, 소셜 미디어 흔적(footprint)들을 포함하는 통계적 정보가 복수의 과거 영화들 각각에 대해 수집될 수 있다. 소셜 미디어 흔적들의 예들은, 과거 영화와 연관된 게시물들에 대한 좋아요(like)들 또는 댓글들의 수, (예컨대, 이모티콘 또는 댓글들을 통한) 감상 또는 정서적 감정가, 재게시물들의 수, 또는 과거 영화와 연관된 게시물들의 공유들의 수를 포함할 수 있지만, 이에 제한되지 않는다.

712에서, 평점 정보를 포함하는 통계적 정보가 복수의 과거 영화들 각각에 대해 수집될 수 있다. 예컨대, 평점 정보는 1 내지 10의 평점/점수를 포함할 수 있으며, 1은 최저 점수이고 10은 최고 점수이다. 평점은 사용자 투표들(평론가 투표들을 또한 포함할 수 있음)에 기반하여 계산될 수 있다.

714에서, 판매 정보를 포함하는 통계적 정보가 복수의 과거 영화들 각각에 대해 수집될 수 있다. 예컨대, 판매 정보는, 영화에 대한 총 흥행 수익, 총 매출액, 또는 영화 총 수익을 포함할 수 있다.

716에서, 수집된 소셜 미디어 흔적들에 대한 점수 값이 계산될 수 있다. 일부 실시예들에서, 점수 값은 소셜 미디어 흔적들에 포함된 값들에 대한 시그모이드 함수의 적용에 의해 계산될 수 있다. 일부 다른 실시예들에서, 점수 값들은 수집된 소셜 미디어 흔적들에 포함된 값들에 대한 소프트맥스(SoftMax) 함수의 적용에 의해 계산될 수 있다.

718에서, 수집된 평점 정보에 대한 점수 값이 계산될 수 있다. 일부 실시예들에서, 점수 값은 평점 정보에 포함된 값들에 대한 시그모이드 함수의 적용에 의해 계산될 수 있다. 일부 다른 실시예들에서, 점수 값들은 수집된 평점 정보에 포함된 값들에 대한 소프트맥스 함수의 적용에 의해 계산될 수 있다.

720에서, 수집된 판매 정보에 대한 점수 값이 계산될 수 있다. 일부 실시예들에서, 점수 값은 수집된 판매 정보에 포함된 값들에 대한 시그모이드 함수의 적용에 의해 계산될 수 있다. 일부 다른 실시예들에서, 점수 값들은 수집된 판매 정보에 포함된 값들에 대한 소프트맥스 함수의 적용에 의해 계산될 수 있다.

722에서, 복수의 과거 영화들의 각각의 과거 영화에 대한 정규화된 제1 세트의 장르별 점수들이 검증될 수 있다. 각각의 과거 영화에 대해, 그러한 검증은 716에서의 수집된 소셜 미디어 흔적들에 대한 계산된 점수 값, 718에서의 평점 정보에 대한 계산된 점수 값, 및 720에서의 판매 정보에 대한 계산자 점수에 기반할 수 있다.

724에서, 거리 기반 클러스터링 방법이 복수의 과거 영화들의 각각의 과거 영화에 대한 검증된 세트의 장르별 점수들에 대해 적용될 수 있다. 거리 기반 클러스터링 방법의 예들은, K-평균(K-means), 이상치들이 있는 설비 위치(FLO; Facility Location with Outliers), 잡음이 있는 애플리케이션들의 밀도 기반 공간적 클러스터링(DBSCAN; Density-based spatial clustering of applications with noise), 클러스터링 구조를 식별하기 위한 순서화 포인트들(OPTICS; Ordering points to identify the clustering structure), 평균 이동, 큰 공간적 데이터베이스들의 분산 기반 클러스터링(DBCLASD; Distribution-Based Clustering of Large Spatial Databases), 가우스 혼합 모델 클러스터링(GMM; Gaussian Mixture Models Clustering), 계층들을 사용하는 균형잡힌 반복 감소 및 클러스터링(BIRCH; Balanced Iterative Reducing and Clustering using Hierarchies), 대표값들을 사용한 클러스터링(CURE; Clustering Using Representatives), 링크들을 사용한 강건한 클러스터링(ROCK; Robust Clustering using Links), 퍼지 c-평균(FCM; Fuzzy c-means), 퍼지 응집성 및 분리성(FCS; Fuzzy Compactness and Separation), 또는 미니-모델 클러스터링(MM; Mini-Model Clustering)을 포함할 수 있지만, 이에 제한되지 않는다.

726에서, 클러스터링 모델은 거리-기반 클러스터링 방법의 적용에 기반하여 생성될 수 있다. 생성된 클러스터링 모델은 영화들에 대한 산업 전반 기준선 모델로서 간주될 수 있고, 복수의 과거 영화들을 복수의 데이터포인트 클러스터들로서 포함할 수 있다. 데이터포인트 클러스터들은, 대응하는 복수의 클러스터 중심들 주위에 클러스터링될 수 있다.

실시예에서, 영화 대본(602A)에 대한 제2 세트의 장르별 점수들이 결정될 수 있다. 영화 대본(602A)에 대한 제2 세트의 장르별 점수들은 영화 대본(602A)에 대한 예측된 성공-지수에 기반하여 결정될 수 있다. 영화 대본이 생성된 클러스터링 모델의 제1 데이터포인트 클러스터 내의 데이터포인트에 대응하는지 또는 이상치 데이터포인트에 대응하는지가 결정될 수 있다. 결정은, 결정된 제2 세트의 장르별 점수들에 기반할 수 있다. 그 후, 영화 대본이 생성된 클러스터링 모델의 제1 데이터포인트 클러스터의 데이터포인트 중 하나에 대응하거나 이상치 데이터포인트에 대응한다는 결정에 기반하여 영화 대본(602A)에 대한 비교 메트릭이 생성될 수 있다. 예컨대, 비교 메트릭은, 영화 대본(602A)에 대한 거리 값(예컨대, 오일러(Euler) 거리)일 수 있고, 영화 대본(602A)가 속할 수 있는 생성된 클러스터링 모델의 가장 가까운 데이터포인트 포인트 클러스터를 표시할 수 있다.

영화 대본(602A)의 2개 이상의 버전이 존재하는 경우에, 클러스터링 모델은 영화 대본(602A)의 2개 이상의 버전 사이의 거리를 결정하는 데 활용될 수 있다. 그러한 거리는, 영화 대본(602A)의 2개의 버전에 기반할 수 있는 향후의 영화의 2개의 버전에 대한 장르별 점수들 사이의 가능한 차이를 예측할 수 있다. 클러스터링 모델의 데이터포인트들로서, 영화 대본(602A)의 2개의 버전 사이의 거리가 임계치를 초과하는 경우, 그러한 거리를 표시하는 통지가 정보 처리 디바이스(102) 상에서 생성될 수 있다.

도 8은 본 개시내용의 실시예에 따른, 영화 대본의 분석에 기반한, 영화에 사용될 색상들의 장르별 추천을 위한 예시적인 동작들을 예시하는 블록도이다. 도 8은, 도 1, 도 2, 도 3, 도 4, 도 5, 도 6, 및 도 7의 요소들과 함께 설명된다. 도 8을 참조하면, 블록도(800)가 도시된다. 동작들(802 내지 812)은 정보 처리 디바이스(102) 상에서 구현될 수 있다. 동작들은 802에서 시작되어 804로 진행될 수 있다.

804에서, 감정들을 묘사하는 단어들의 그룹이 영화 대본(이를테면, 영화 대본(602A))의 장면에서 식별될 수 있다. 예컨대, 영화 대본의 장면에서의 적색 색상의 사용은, 분노, 사랑, 또는 증오를 상징할 수 있다. 정보 처리 디바이스(102)는, 영화 대본을 분석(NLP 분석)하여, 영화 대본의 장면에서의 감정들을 묘사하는 단어들(또는 심지어 영향력 있는 문장들)의 그룹을 식별할 수 있다.

806에서, 식별된 단어들의 그룹이, 장면(또는 전체 영화 대본)과 연관된 장르 또는 장면에서의 대사들의 어조에 기반하여 분류될 수 있다.

808에서, 복수의 장면들이, 복수의 장면들 각각과 연관된 장르에 기반하여 영화 대본에서 식별될 수 있다.

810에서, 영화 대본에 기반하여 제작될 영화의 장면에 포함될 객체들(예컨대, 의상들, 배경 색상, 소품들의 색상 등)에 대한 색상 조합이 추천될 수 있다. 색상 조합은 806에서의 분류(및/또는 808에서의 식별)에 기반하여 추천될 수 있다.

실시예에서, 추천된 색상 조합은, 그 특정 장르에 대한 시청자들에 대한 긍정적인 영향을 위해 (영화 대본에 기반하여) 영화의 제작에 사용되어야 할 가장 적합한 색상들의 선택을 포함할 수 있다. 예컨대, 장면에서 사용될 소품들 또는 장면들에서의 등장인물들의 의상 색상들에 대한 색상 조합이 추천될 수 있다. 부가적으로, 영화 대본의 상이한 장면들에 대해 색상 보정 또는 색상 조화 제안들이 추천될 수 있다.

812에서, 영화는 810에서의 추천들에 기반하여 제작될 수 있고, 동작들은 종료될 수 있다.

도 9는 본 개시내용의 실시예에 따른, 영화의 성공-지수의 예측을 위한 예시적인 동작들을 예시하는 흐름도이다. 도 8은, 도 1, 도 2, 도 3, 도 4, 도 5, 도 6, 도 7, 및 도 8의 요소들과 함께 설명된다. 도 9를 참조하면, 흐름도(900)가 도시된다. 동작들(902 내지 914)은 정보 처리 디바이스(102) 상에서 구현될 수 있다. 동작들은 902에서 시작되어 904로 진행될 수 있다.

904에서, 영화 대본의 복수의 장면들이, 제작을 위한 영화와 연관된 영화 대본의 텍스트 분석에 기반하여 식별될 수 있다. 실시예에 따르면, 정보 처리 디바이스(102)의 회로(202)는, 영화 대본의 텍스트 분석에 기반하여 영화 대본의 복수의 장면들을 식별하도록 구성될 수 있다.

906에서, 식별된 복수의 장면들의 각각의 장면에 대한 제1 점수가 계산될 수 있다. 제1 점수는 식별된 복수의 장면들에 대한 장르 정보에 기반하여 계산될 수 있다. 실시예에 따르면, 정보 처리 디바이스(102)의 회로(202)는, 식별된 복수의 장면들에 대한 장르 정보에 기반하여, 식별된 복수의 장면들의 각각의 장면에 대한 제1 점수를 계산하도록 구성될 수 있다.

908에서, 등장인물들의 목록이 영화 대본의 텍스트 분석에 기반하여 식별될 수 있다. 실시예에 따르면, 회로(202)는, 영화 대본의 텍스트 분석에 기반하여 영화 대본의 등장인물들의 목록을 식별하도록 구성될 수 있다.

910에서, 이력적 영화 데이터베이스에 기반하여, 식별된 목록의 등장인물들의 각각의 등장인물의 역할 연기에 대한 배우가 선택될 수 있다. 실시예에 따르면, 회로(202)는, 이력적 영화 데이터베이스에 기반하여, 식별된 목록의 등장인물들의 각각의 등장인물의 역할 연기에 대한 배우를 선택하도록 구성될 수 있다.

912에서, 역할 연기에 대한 선택된 배우의 적합성을 표시하는 제2 점수가 계산될 수 있다. 제2 점수는, 이력적 영화 데이터베이스의 데이터포인트들에 대해 훈련될 수 있는 ML 모델(110)에 기반하여 계산될 수 있다. 실시예에 따르면, 회로(202)는, 역할 연기에 대한 선택된 배우의 적합성의 표시자로서 제2 점수를 계산하도록 구성될 수 있다.

914에서, 식별된 복수의 장면들의 각각의 장면에 대한 계산된 제1 점수 및 선택된 배우에 대한 계산된 제2 점수에 기반하여 영화에 대한 성공-지수가 예측될 수 있다. 실시예에 따르면, 회로(202)는, 식별된 복수의 장면들의 각각의 장면에 대한 계산된 제1 점수 및 선택된 배우에 대한 계산된 제2 점수에 기반하여 영화에 대한 성공-지수를 예측하도록 구성될 수 있다. 제어는 종료로 넘어갈 수 있다.

도 10은 본 개시내용의 적어도 하나의 실시예에 따른, 영화들의 성공-지수의 모의 및 분석을 위한 사용자 인터페이스를 예시하는 도면이다. 도 10은, 도 1, 도 2, 도 3, 도 4, 도 5, 도 6, 도 7, 도 8, 및 도 9의 요소들과 함께 설명된다. 도 10을 참조하면, 사용자 인터페이스(UI)(1000)가 도시된다. UI(1000)는, 배우들이 영화 대본의 NLP 분석으로부터 식별된 등장인물들을 포함하는 영화에 대한 배역 구성원으로서 선택될 수 있는 배우들의 잠재적 목록을 표시하는 UI 요소(1002)를 포함한다. UI(1000)는, 1명 이상의 감독이 영화의 제작에 대한 주요 제작진으로서 선택될 수 있는 감독들의 잠재적 목록을 표시하는 UI 요소(1004)를 더 포함한다. UI(1000)는, 영화 대본에 대해 예측된 성공-지수의 표시를 위한 UI 요소(1006) 및 성공-지수의 예측을 위해 고려될 파라미터들을 열거하는 UI 요소(1008)를 더 포함한다. UI(1000)는, 성공-지수의 예측을 위해 고려되는 파라미터들에 대한 가중치들을 보고 수정하기 위한 UI 요소(1010), 영화에 대한 잠정적 예산(백만 US 달러 단위)을 보고 선택하기 위한 UI 요소(1012), 및 영화에 대한 개봉 계절을 선택하기 위한 UI 요소(1014)를 더 포함한다.

UI(1000)는, 사용자가 (예컨대, 배역 및 제작진에 대한 UI 요소(1008)의) 파라미터들을 미세 조정하여 성공-지수의 예측에서 그러한 파라미터들의 영향을 이해하는 것을 도울 수 있는 모의 애플리케이션의 프론트-엔드 UI일 수 있다. 그러한 이해로부터, 사용자는 영화에 대한 성공-지수를 개선하기 위해 최적의 파라미터들을 선택하기로 결정할 수 있다. 도시된 바와 같이, 예컨대, 다이하드(Diehard) 영화에 대해, 사용자는 성공-지수가 어떻게 변하는지를 시각화하기 위해 UI 요소(1002)로부터 배우들을 그리고 UI 요소(1004)로부터 감독들을 끌어놓기(drag and drop)할 수 있다.

UI 요소(1002), UI 요소(1004), UI 요소(1012), 및 UI 요소(1014)를 통해, 성공-지수의 예측을 위해 고려될 파라미터들 및 그러한 파라미터들의 값들이 선택될 수 있다. 유사하게, UI 요소(1010)를 통해, 선택된 파라미터들에 대한 가중치들이 특정될 수 있다. 성공-지수는, 특정된 가중치들 및 선택된 파라미터들/파라미터 값들에 기반하여 UI 요소(1006)에서 예측 및 업데이트될 수 있다.

파라미터들, 즉, 배우들, 감독들, 계절, 및 예산은 참조를 위해 도시되며, 본 개시내용에 대한 제한으로서 해석되어서는 안된다는 것이 유의되어야 한다. 본 개시내용은, 본 개시내용의 범위로부터 벗어나지 않으면서, 값들의 상이한 변동들을 갖는 더 많거나 더 적은 수의 파라미터들에 적용가능할 수 있다.

추가로, UI(1000)는 단지 영화들의 성공-지수의 모의 및 분석을 위한 예시적인 구현으로서 제공되며, 본 개시내용에 대한 제한으로서 해석되어서는 안된다는 것이 유의되어야 한다. 본 개시내용은, 본 개시내용의 범위로부터 벗어나지 않으면서, UI(1000) 상의 UI 요소들의 제시에 있어서 다른 변형들을 적용가능할 수 있다.

도 11은 본 개시내용의 적어도 하나의 실시예에 따른, 도 10의 사용자 인터페이스(UI)를 통한 배우 세부사항들의 시각화를 위한 UI 요소를 예시하는 도면이다. 도 11은, 도 1, 도 2, 도 3, 도 4, 도 5, 도 6, 도 7, 도 8, 도 9, 및 도 10의 요소들과 함께 설명된다. 도 11을 참조하면, 도 10의 UI(1000) 상에 오버레이된 UI(1000) 및 UI 요소(1100)가 도시된다. UI 요소(1100)는, UI 요소(1002)에서 배우들의 목록 중 하나에 대한 사용자 입력에 기반하여 표시될 수 있다. UI 요소(1100)는, 선택된 배우(또는 감독)의 상세한 프로필을 포함할 수 있다. 그러한 프로필은, 예컨대, 신상명세, 배우의 사진, 장르별 성공작들, 지역별 인기, 배우의 가장 높은 수익의 영화들의 목록, 흥행에 있어서 가장 성공하게 된 역할들, 및 다양한 소셜 미디어 플랫폼 상에서의 좋아요들과 같은 소셜 미디어 통계를 포함할 수 있다.

UI 요소(1100)는 단지 배우/연출 세부사항의 시각화를 위한 예시적인 구현으로서 제공되며, 본 개시내용에 대한 제한으로서 해석되어서는 안된다는 것이 유의되어야 한다. 본 개시내용은, 본 개시내용의 범위로부터 벗어나지 않으면서, UI 요소(1100) 상의 텍스트, 이미지들, 그래픽들, 또는 버튼들의 제시에 있어서 다른 변형들을 적용가능할 수 있다.

도 12는 본 개시내용의 적어도 하나의 실시예에 따른, 영화의 성공-지수의 예측을 위해 고려되는 파라미터들에 대한 도 10의 사용자 인터페이스(UI)를 통한 가중치들의 선택을 위한 UI 요소를 예시하는 도면이다. 도 12는, 도 1, 도 2, 도 3, 도 4, 도 5, 도 6, 도 7, 도 8, 도 9, 도 10, 및 도 11의 요소들과 함께 설명된다. 도 12를 참조하면, 도 10의 UI(1000) 상에 오버레이된 UI(1000) 및 UI 요소(1200)가 도시된다. UI 요소(1200)는, 성공-지수의 예측을 위해 고려되는 파라미터들에 대한 가중치들을 보고 수정하기 위해 UI 요소(1010) 중 선택된 것에 기반하여 표시될 수 있다. 예컨대, 사용자는, 슬라이드 바들을 사용하여, 배우 1에 대해 10 %, 배우 2에 대해 다른 10 %, 감독에 대해 15 %, 개봉 계절에 대해 10 %, 예산에 대해 5 %, 및 영화 대본에 대해 50 %의 가중치를 선택할 수 있다. UI 버튼 "산업 표준 사용"의 선택 시, 가중치들은 과거 영화들의 분석으로부터 획득된 가중치들의 기본 프로필에 기반하여 수정될 수 있다. UI 버튼 "모의"의 선택시, 슬라이드 바들에 기반하여 수정된 가중치들이 저장되어 영화에 대한 성공-지수의 예측에 사용될 수 있다.

UI 요소(1200)는 단지 가중치 선택/'수정에 대한 예시적인 구현으로서 제공되며, 본 개시내용에 대한 제한으로서 해석되어서는 안된다는 것이 유의되어야 한다. 본 개시내용은, 본 개시내용의 범위로부터 벗어나지 않으면서, UI 요소(1200) 상의 텍스트, 이미지들, 그래픽들, 또는 버튼들의 제시에 있어서 다른 변형들을 적용가능할 수 있다.

본 개시내용의 다양한 실시예들은, 정보 처리 디바이스를 동작시키기 위해 기계 및/또는 컴퓨터에 의해 실행가능한 명령어들이 저장되는 비-일시적인 컴퓨터 판독가능 매체 및/또는 저장 매체를 제공할 수 있다. 명령어들은, 기계 및/또는 컴퓨터로 하여금, 제작을 위한 영화와 연관된 영화 대본의 텍스트 분석에 기반하여 영화 대본의 복수의 장면들의 식별을 포함하는 동작들을 수행하게 할 수 있다. 동작들은, 식별된 복수의 장면들에 대한 장르 정보에 기반하는, 식별된 복수의 장면들의 각각의 장면에 대한 제1 점수의 계산, 및 영화 대본의 텍스트 분석에 기반한 영화 대본의 등장인물들의 목록의 식별을 더 포함한다. 동작들은, 이력적 영화 데이터베이스에 기반한, 식별된 목록의 등장인물들의 각각의 등장인물의 역할 연기에 대한 배우의 선택, 및 선택된 배우에 대한, 역할 연기에 대한 선택된 배우의 적합성을 지시하는 제2 점수의 계산을 더 포함한다. 제2 점수는, 이력적 영화 데이터베이스의 데이터포인트들에 대해 훈련되는 기계 학습 모델에 기반하여 계산된다. 동작들은, 식별된 복수의 장면들의 각각의 장면에 대한 계산된 제1 점수 및 선택된 배우에 대한 계산된 제2 점수에 기반한 영화에 대한 성공-지수의 예측을 더 포함한다.

본 개시내용의 예시적인 양상들은 정보 처리 디바이스(이를테면, 도 1의 정보 처리 디바이스(102))를 포함할 수 있다. 정보 처리 디바이스(102)는, 회로(이를테면, 회로(202)), 및 기계 학습(ML) 모델을 저장하도록 구성되는 메모리(이를테면, 메모리(204))를 포함할 수 있다. 회로는, 사용자 디바이스(이를테면, 사용자 디바이스(104))로부터 영화 대본(이를테면, 영화 대본(402A))을 수신하도록 구성될 수 있다. 회로는, 제작을 위한 영화와 연관되는 영화 대본의 텍스트 분석에 기반하여 영화 대본의 복수의 장면들을 식별하도록 구성될 수 있다. 회로는, 식별된 복수의 장면들에 대한 장르 정보에 기반하여, 식별된 복수의 장면들의 각각의 장면에 대한 제1 점수를 계산하고, 영화 대본의 텍스트 분석에 기반하여, 영화 대본의 등장인물들의 목록을 식별하도록 구성될 수 있다. 회로는, 이력적 영화 데이터베이스(이를테면, 이력적 영화 데이터베이스(406C))에 기반하여, 식별된 목록의 등장인물들의 각각의 등장인물의 역할 연기에 대한 배우를 선택하도록 추가로 구성될 수 있다. 회로는, 이력적 영화 데이터베이스의 데이터포인트들에 대해 훈련되는 기계 학습 모델에 기반하여, 선택된 배우에 대한 제2 점수를 계산하도록 추가로 구성될 수 있다. 그 후, 식별된 복수의 장면들의 각각의 장면에 대한 계산된 제1 점수 및 선택된 배우에 대한 계산된 제2 점수에 기반하여, 회로는 영화에 대한 성공-지수를 예측하도록 구성될 수 있다.

실시예에 따르면, 회로는, 영화 대본의 텍스트 분석에 기반하여, 식별된 복수의 장면들에 걸친 식별된 목록의 등장인물들의 분포를 식별하도록 추가로 구성될 수 있다. 식별된 분포에 기반하여, 회로는, 식별된 복수의 장면들의 각각의 장면에 대한 제1 점수를 계산하도록 구성될 수 있다.

실시예에 따르면, 회로는, 영화 대본의 텍스트 분석에 기반하여, 식별된 복수의 장면들 중 하나 이상의 장면에서의 기념 이벤트 또는 계절성 이벤트의 묘사를 결정하도록 추가로 구성될 수 있다. 회로는, 이력적 영화 데이터베이스에 기반하여, 결정된 묘사에 대한 제3 점수를 계산하고, 하나 이상의 장면에서의 결정된 묘사에 대한 계산된 제3 점수에 추가로 기반하여, 영화에 대한 성공-지수를 예측하도록 추가로 구성될 수 있다. 실시예에 따르면, 회로는, 기념 이벤트 또는 계절성 이벤트의 결정된 묘사에 기반하여 영화에 대한 개봉일을 추정하도록 추가로 구성될 수 있다. 추정된 개봉일에 대해, 회로는, 제4 점수를 계산하고, 계산된 제4 점수에 추가로 기반하여 영화에 대한 성공-지수를 예측하도록 추가로 구성될 수 있다.

실시예에 따르면, 회로는, 이력적 영화 데이터베이스로부터, 주요 제작진 구성원들의 목록을 선택하고, 주요 제작진 구성원들의 목록 내의 각각의 주요 제작진 구성원에 대한 제5 점수를 계산하도록 추가로 구성될 수 있다. 계산된 제5 점수는, 영화의 제작에서의 작업에 대한 대응하는 주요 제작진 구성원의 적합성을 표시할 수 있고, 이력적 영화 데이터베이스의 데이터포인트들에 대해 훈련되는 기계 학습 모델에 기반하여 계산될 수 있다. 실시예에 따르면, 회로는, 선택된 주요 제작진 구성원들의 목록 내의 각각의 주요 제작진 구성원에 대한 계산된 제5 점수에 추가로 기반하여 영화에 대한 성공-지수를 예측하도록 추가로 구성될 수 있다.

실시예에 따르면, 회로는, 예측된 성공-지수가 임계값보다 크다는 결정에 기반하여, 선택된 주요 제작진 구성원들의 목록을 그 영화에 대한 제작진으로서 추천하도록 추가로 구성될 수 있다. 유사하게, 회로는, 예측된 성공-지수가 임계값보다 크다는 결정에 기반하여, 선택된 배우를 그 영화에 대한 배역 구성원으로서 추천하도록 추가로 구성될 수 있다. 대안적으로, 회로는, 예측된 성공-지수가 임계값 미만이라는 결정에 기반하여, 식별된 목록의 등장인물들의 각각의 등장인물의 역할 연기에 대해 상이한 배우를 선택하도록 추가로 구성될 수 있다.

실시예에 따르면, 회로는, 영화 대본의 텍스트 분석에 기반하여, 식별된 목록의 등장인물들 중에서 1명 이상의 주연 등장인물을 식별하도록 추가로 구성될 수 있다. 회로는, 배우의 선택이 식별된 1명 이상의 주연 등장인물 중 하나의 역할 연기에 대한 것이라는 결정에 추가로 기반하여, 선택된 배우에 대한 제2 점수를 계산하도록 구성될 수 있다.

실시예에 따르면, 회로는, 영화 대본의 텍스트 분석에 기반하여 제작 변수들의 세트를 식별하도록 추가로 구성될 수 있다. 제작 변수들의 세트는, 영화 대본의 장면 위치들의 수, 장면들의 수, 및 등장인물들의 수를 포함할 수 있다. 부가적으로, 회로는, 영화의 제작에 대한 예산 및 촬영 기간을 결정하도록 구성될 수 있다. 그 후, 회로는, 식별된 제작 변수들의 세트에 대한 제1 가중치, 결정된 촬영 기간에 대한 제2 가중치, 및 결정된 예산에 대한 제3 가중치에 추가로 기반하여 영화에 대한 성공-지수를 예측하도록 추가로 구성될 수 있다.

실시예에 따르면, 회로는, 사용자들의 소셜 미디어 활동들 및 과거 영화들에 대한 사용자들의 과거 활동들의 분석에 기반하여, 식별된 복수의 장면들 중 적어도 하나의 장면의 맥락 또는 장르의 인기 척도를 추정하도록 추가로 구성될 수 있다. 회로는, 추정 인기 척도에 추가로 기반하여 영화에 대한 성공-지수를 예측하도록 추가로 구성될 수 있다.

실시예에 따르면, 회로는, 영화 대본의 텍스트 분석에 기반하여 어조 특징들의 세트를 추출하도록 구성될 수 있다. 추출된 어조 특징들의 세트는, 영화 대본의 등장인물의 내레이션 또는 상태, 텍스트 대문자 사용, 감탄사, 리듬, 운율, 또는 억양 중 하나 이상에 대응할 수 있다. 회로는, 추출된 어조 특징들의 세트에 기반하여, 식별된 복수의 장면들의 각각의 장면에 대한 제1 어조 메트릭을 계산하도록 추가로 구성될 수 있다. 회로는, 식별된 목록의 등장인물들 중 제1 등장인물에 대한 제2 어조 메트릭을 계산하도록 추가로 구성될 수 있다. 제2 어조 메트릭은 영화 대본의 식별된 복수의 장면들 전체에 걸친 제1 등장인물들의 역할과 연관된 어조 수준들의 변동을 나타낼 수 있다. 어조 수준들은, 죄책감, 기쁨, 슬픔, 부끄러움, 혐오감, 분노, 및 두려움 중 하나 이상을 포함할 수 있다. 회로는, 영화 대본의 어조 수준들의 변동에 대응하는 제3 어조 메트릭을 계산하도록 추가로 구성될 수 있다. 회로는, 계산된 제1 어조 메트릭, 계산된 제2 어조 메트릭, 또는 계산자 제3 어조 메트릭에 추가로 기반하여 영화에 대한 성공-지수를 예측하도록 추가로 구성될 수 있다.

실시예에 따르면, 회로는, 이력적 영화 데이터베이스로부터 복수의 과거 영화들의 각각의 과거 영화에 대한 성공-지수를 포함하는 점수 책정 정보를 추출하도록 구성될 수 있다. 회로는, 추출된 점수 책정 정보에 기반하여 복수의 과거 영화들의 각각의 과거 영화에 대한 제1 세트의 장르별 점수들을 결정하도록 추가로 구성될 수 있다. 회로는, 결정된 제1 세트의 장르별 점수들을 정규화하도록 추가로 구성될 수 있다. 회로는, 복수의 과거 영화들의 각각의 과거 영화에 대한 판매 정보, 평점 정보, 및 소셜 미디어 흔적들을 포함하는 통계적 정보를 수집하도록 추가로 구성될 수 있다. 회로는, 수집된 판매 정보, 평점 정보, 및 소셜 미디어 흔적들 각각에 대한 점수 값을 계산하도록 추가로 구성될 수 있다. 회로는, 복수의 과거 영화들의 개개의 과거 영화에 대한 계산된 점수 값들에 기반하여 복수의 과거 영화들의 각각의 과거 영화에 대한 정규화된 제1 세트의 장르별 점수들을 검증하도록 추가로 구성될 수 있다. 회로는, 영화들에 대한 산업 전반 기준선 모델로서 클러스터링 모델을 생성하도록 추가로 구성될 수 있다. 클러스터링 모델은, 복수의 과거 영화들의 각각의 과거 영화에 대한 검증된 세트의 장르별 점수들에 대한 거리 기반 클러스터링 방법의 적용에 기반하여 생성될 수 있다. 생성된 클러스터링 모델은, 복수의 과거 영화들을, 대응하는 복수의 클러스터 중심들 주위에 클러스터링되는 복수의 데이터포인트 클러스터들로서 포함할 수 있다.

실시예에 따르면, 회로는, 예측된 성공-지수에 기반하여 영화 대본에 대한 제2 세트의 장르별 점수들을 결정하도록 구성될 수 있다. 회로는, 영화 대본이 생성된 클러스터링 모델의 제1 데이터포인트 클러스터 내의 데이터포인트에 대응하는지 또는 이상치 데이터포인트에 대응하는지를 결정하도록 추가로 구성될 수 있다. 결정은, 결정된 제2 세트의 장르별 점수들에 기반할 수 있다. 회로는, 결정에 기반하여 영화 대본에 대한 비교 메트릭을 생성하도록 추가로 구성될 수 있다.

실시예에 따르면, 기계 학습 모델은, 복수의 계층들을 포함하는 심층 신경망(DNN)(이를테면, DNN(502))일 수 있다. 회로는, 장르 정보, 식별된 복수의 장면들, 및 식별된 목록의 등장인물들을 포함하는 데이터세트를 복수의 계층들의 입력 계층(이를테면, 입력 계층(506))에 입력하도록 구성될 수 있다. DNN의 중간 계층은, 식별된 복수의 장면들의 각각의 장면에 대한 제1 점수 및 식별된 목록의 등장인물들의 각각의 등장인물의 역할 연기에 대해 선택된 배우에 대한 제2 점수를 계산하도록 구성될 수 있다. 성공-지수는, 계산된 제1 점수 및 계산된 제2 점수에 기반하여 DNN의 출력 계층(이를테면, 출력 계층(514))의 출력으로서 영화에 대해 예측될 수 있다.

본 개시내용은, 하드웨어로, 또는 하드웨어와 소프트웨어의 조합으로 실현될 수 있다. 본 개시내용은, 중앙집중형 방식으로, 적어도 하나의 컴퓨터 시스템에서, 또는 상이한 요소들이 여러 상호연결된 컴퓨터 시스템들에 걸쳐 분포될 수 있는 분산형 방식으로 실현될 수 있다. 본원에 설명된 방법들을 수행하도록 적응되는 컴퓨터 시스템 또는 다른 장치가 적합할 수 있다. 하드웨어와 소프트웨어의 조합은, 로딩되고 실행될 때, 본원에 설명된 방법들을 컴퓨터 시스템이 수행하도록 컴퓨터 시스템을 제어할 수 있는 컴퓨터 프로그램을 갖는 범용 컴퓨터 시스템일 수 있다. 본 개시내용은 다른 기능들을 또한 수행하는 집적 회로의 일부분을 포함하는 하드웨어로 실현될 수 있다.

본 개시내용은 또한, 본원에 설명된 방법들의 구현을 가능하게 하는 모든 특징들을 포함하고 컴퓨터 시스템에 로딩될 때 이 방법들을 수행할 수 있는, 컴퓨터 프로그램 제품에 내장될 수 있다. 본 맥락에서, 컴퓨터 프로그램은, 정보 처리 능력을 갖는 시스템으로 하여금 특정 기능을, 직접 수행하게 하거나, 또는 a) 다른 언어, 코드, 또는 표기로의 변환; b) 상이한 자료 형태로의 재생성 중 어느 하나 또는 둘 모두의 이후에 수행하게 하도록 의도된 명령어들의 세트의 임의의 언어, 코드, 또는 표기로의 임의의 표현을 의미한다.

본 개시내용이 특정 실시예들을 참조하여 설명되지만, 본 개시내용의 범위로부터 벗어나지 않으면서 다양한 변경들이 이루어질 수 있고, 등가물들이 대체될 수 있다는 것이 관련 기술분야의 통상의 기술자들에 의해 이해될 것이다. 게다가, 본 개시내용의 범위로부터 벗어나지 않으면서, 본 개시내용의 교시들에 특정 상황 또는 재료를 적응시키도록 많은 수정들이 이루어질 수 있다. 따라서, 본 개시내용은 개시된 특정의 실시예로 제한되지 않고 본 개시내용은 첨부된 청구항들의 범위 내에 속하는 모든 실시예들을 포함할 것으로 의도된다.

Claims

정보 처리 디바이스로서,
회로
를 포함하며, 상기 회로는,
제작을 위한 영화와 연관되는 영화 대본의 텍스트 분석에 기반하여 상기 영화 대본의 복수의 장면들을 식별하고;
식별된 복수의 장면들에 대한 장르 정보에 기반하여 상기 식별된 복수의 장면들의 각각의 장면에 대한 제1 점수를 계산하고;
상기 영화 대본의 텍스트 분석에 기반하여 상기 영화 대본의 등장인물들의 목록을 식별하고;
이력적 영화 데이터베이스에 기반하여, 식별된 목록의 등장인물들의 각각의 등장인물의 역할 연기에 대한 배우를 선택하고;
선택된 배우에 대해, 상기 역할 연기에 대한 상기 선택된 배우의 적합성을 표시하는 제2 점수를 계산하고 ― 상기 제2 점수는 상기 이력적 영화 데이터베이스의 데이터포인트들에 대해 훈련되는 기계 학습 모델에 기반하여 계산됨 ―;
상기 식별된 복수의 장면들의 각각의 장면에 대한 계산된 제1 점수 및 상기 선택된 배우에 대한 계산된 제2 점수에 기반하여 상기 영화에 대한 성공-지수(success-quotient)를 예측하도록
구성되는, 정보 처리 디바이스.
제1항에 있어서,
상기 회로는,
상기 영화 대본의 텍스트 분석에 기반하여, 상기 식별된 복수의 장면들에 걸친 상기 식별된 목록의 등장인물들의 분포를 식별하고;
식별된 분포에 추가로 기반하여 상기 식별된 복수의 장면들의 각각의 장면에 대한 상기 제1 점수를 계산하도록
추가로 구성되는, 정보 처리 디바이스.
제1항에 있어서,
상기 회로는, 상기 영화 대본의 텍스트 분석에 기반하여, 상기 식별된 복수의 장면들 중 하나 이상의 장면에서의 기념 이벤트 또는 계절성 이벤트의 묘사를 결정하도록 추가로 구성되는, 정보 처리 디바이스.
제3항에 있어서,
상기 회로는,
상기 이력적 영화 데이터베이스에 기반하여, 결정된 묘사에 대한 제3 점수를 계산하고;
상기 하나 이상의 장면들에서의 상기 결정된 묘사에 대한 계산된 제3 점수에 추가로 기반하여 상기 영화에 대한 성공-지수를 예측하도록
추가로 구성되는, 정보 처리 디바이스.
제3항에 있어서,
상기 회로는,
결정된 기념 이벤트 또는 계절성 이벤트의 묘사에 기반하여 상기 영화에 대한 개봉일을 추정하고;
추정된 개봉일에 대한 제4 점수를 계산하고;
계산된 제4 점수에 추가로 기반하여 상기 영화에 대한 성공-지수를 예측하도록
추가로 구성되는, 정보 처리 디바이스.
제1항에 있어서,
상기 회로는,
상기 이력적 영화 데이터베이스로부터, 주요 제작진 구성원들의 목록을 선택하고;
상기 주요 제작진 구성원들의 목록 내의 각각의 주요 제작진 구성원에 대한 제5 점수를 계산하도록
추가로 구성되며,
계산된 제5 점수는, 상기 영화의 제작에서의 작업에 대한 대응하는 주요 제작진 구성원의 적합성을 표시하고,
상기 제5 점수는, 상기 이력적 영화 데이터베이스의 데이터포인트들에 대해 훈련되는 상기 기계 학습 모델에 기반하여 계산되는, 정보 처리 디바이스.
제6항에 있어서,
상기 회로는, 선택된 주요 제작진 구성원들의 목록 내의 각각의 주요 제작진 구성원에 대한 상기 계산된 제5 점수에 추가로 기반하여 상기 영화에 대한 성공-지수를 예측하도록 구성되는, 정보 처리 디바이스.
제7항에 있어서,
상기 회로는, 예측된 성공-지수가 임계값보다 크다는 결정에 기반하여, 상기 선택된 주요 제작진 구성원들의 목록을 상기 영화에 대한 제작진으로서 추천하도록 추가로 구성되는, 정보 처리 디바이스.
제1항에 있어서,
상기 회로는,
상기 영화 대본의 텍스트 분석에 기반하여 어조 특징들의 세트를 추출하고;
추출된 어조 특징들의 세트에 기반하여, 상기 식별된 복수의 장면들의 각각의 장면에 대한 제1 어조 메트릭을 계산하고;
상기 식별된 목록의 등장인물들 중 제1 등장인물에 대한 제2 어조 메트릭을 계산하고 ― 상기 제2 어조 메트릭은, 상기 영화 대본의 식별된 복수의 장면들 전체에 걸친 상기 제1 등장인물의 역할과 연관된 어조 수준들의 변동을 나타냄 ―;
상기 영화 대본의 어조 수준들의 변동에 대응하는 제3 어조 메트릭을 계산하고;
계산된 제1 어조 메트릭, 계산된 제2 어조 메트릭, 또는 계산자(computer) 제3 어조 메트릭에 추가로 기반하여 상기 영화에 대한 성공-지수를 예측하도록
추가로 구성되는, 정보 처리 디바이스.
제9항에 있어서,
상기 어조 수준들은, 죄책감, 기쁨, 슬픔, 부끄러움, 혐오감, 분노, 및 두려움 중 하나 이상을 포함하는, 정보 처리 디바이스.
제9항에 있어서,
추출된 어조 특징들의 세트는, 상기 영화 대본에서의 등장인물의 내레이션 또는 상태, 텍스트 대문자 사용, 감탄사, 리듬, 운율, 또는 억양 중 하나 이상에 대응하는, 정보 처리 디바이스.
제1항에 있어서,
상기 회로는,
상기 영화 대본의 텍스트 분석에 기반하여, 상기 식별된 목록의 등장인물들 중에서 1명 이상의 주연 등장인물을 식별하고;
상기 배우의 선택이 식별된 1명 이상의 주연 등장인물 중 하나의 역할 연기에 대한 것이라는 결정에 추가로 기반하여, 상기 선택된 배우에 대한 상기 제2 점수를 계산하도록
추가로 구성되는, 정보 처리 디바이스.
제1항에 있어서,
상기 회로는,
상기 영화 대본의 텍스트 분석에 기반하여 상기 영화 대본에서의 장면 위치들의 수, 장면들의 수, 및 등장인물들의 수를 포함하는 제작 변수들의 세트를 식별하고;
상기 영화의 제작에 대한 예산 및 촬영 기간을 결정하고;
식별된 제작 변수들의 세트에 대한 제1 가중치, 결정된 촬영 기간에 대한 제2 가중치, 및 결정된 예산에 대한 제3 가중치에 추가로 기반하여 상기 영화에 대한 성공-지수를 예측하도록
추가로 구성되는, 정보 처리 디바이스.
제1항에 있어서,
상기 회로는, 예측된 성공-지수가 임계값보다 크다는 결정에 기반하여, 상기 선택된 배우를 상기 영화에 대한 배역 구성원으로서 추천하도록 추가로 구성되는, 정보 처리 디바이스.
제1항에 있어서,
상기 회로는,
사용자들의 소셜 미디어 활동들 및 과거 영화들에 대한 사용자들의 과거 활동들의 분석에 기반하여, 상기 식별된 복수의 장면들 중 적어도 하나의 장면의 맥락 또는 장르의 인기 척도를 추정하고;
추정된 인기 척도에 추가로 기반하여 상기 영화에 대한 성공-지수를 예측하도록
추가로 구성되는, 정보 처리 디바이스.
제1항에 있어서,
상기 회로는, 예측된 성공-지수가 임계값 미만이라는 결정에 기반하여, 상기 식별된 목록의 등장인물들의 각각의 등장인물의 역할 연기에 대해 상이한 배우를 선택하도록 추가로 구성되는, 정보 처리 디바이스.
제1항에 있어서,
상기 기계 학습 모델을 더 포함하며, 상기 기계 학습 모델은 복수의 계층들을 포함하는 심층 신경망(DNN)인, 정보 처리 디바이스.
제17항에 있어서,
상기 회로는, 상기 장르 정보, 상기 식별된 복수의 장면들, 및 상기 식별된 목록의 등장인물들을 포함하는 데이터세트를 상기 복수의 계층들의 입력 계층에 입력하도록 추가로 구성되며,
상기 DNN의 중간 계층은,
상기 식별된 복수의 장면들의 각각의 장면에 대한 상기 제1 점수를 계산하고;
상기 식별된 목록의 등장인물들의 각각의 등장인물의 역할 연기에 대해 선택된 상기 배우에 대한 상기 제2 점수를 계산하도록 구성되고,
상기 DNN의 출력 계층은, 상기 계산된 제1 점수 및 상기 계산된 제2 점수에 기반하여 상기 영화에 대한 성공-지수를 예측하도록 구성되는, 정보 처리 디바이스.
제1항에 있어서,
상기 회로는,
상기 이력적 영화 데이터베이스로부터, 복수의 과거 영화들의 각각의 과거 영화에 대한 성공-지수를 포함하는 점수 책정 정보를 추출하고;
추출된 점수 책정 정보에 기반하여 상기 복수의 과거 영화들의 각각의 과거 영화에 대한 제1 세트의 장르별 점수들을 결정하고;
결정된 제1 세트의 장르별 점수들을 정규화하고;
상기 복수의 과거 영화들의 각각의 과거 영화에 대한 판매 정보, 평점(rating) 정보, 및 소셜 미디어 흔적(footprint)들을 포함하는 통계적 정보를 수집하고;
수집된 판매 정보, 영화 평점 정보, 및 소셜 미디어 흔적들 각각에 대한 점수 값을 계산하고;
상기 복수의 과거 영화들의 개개의 과거 영화에 대한 계산된 점수 값들에 기반하여 상기 복수의 과거 영화들의 각각의 과거 영화에 대한 정규화된 제1 세트의 장르별 점수들을 검증하고;
상기 복수의 과거 영화들의 각각의 과거 영화에 대한 검증된 세트의 장르별 점수들에 대한 거리 기반 클러스터링 방법의 적용에 기반하여, 영화들에 대한 산업 전반 기준선 모델로서 클러스터링 모델을 생성하도록
추가로 구성되며,
생성된 클러스터링 모델은, 상기 복수의 과거 영화들을, 대응하는 복수의 클러스터 중심들 주위에 클러스터링되는 복수의 데이터포인트 클러스터들로서 포함하는, 정보 처리 디바이스.
제19항에 있어서,
상기 회로는,
예측된 성공-지수에 기반하여 상기 영화 대본에 대한 제2 세트의 장르별 점수들을 결정하고;
결정된 제2 세트의 장르별 점수들에 기반하여, 상기 영화 대본이 생성된 클러스터링 모델의 제1 데이터포인트 클러스터 내의 데이터포인트에 대응하는지 또는 이상치 데이터포인트에 대응하는지를 결정하고,
상기 결정에 기반하여, 상기 영화 대본에 대한 비교 메트릭을 생성하도록
추가로 구성되는, 정보 처리 디바이스.
제1항에 있어서,
상기 회로는,
상기 영화 대본의 상기 식별된 복수의 장면들의 장면에서 감정을 묘사하는 단어들의 그룹을 식별하고;
상기 영화 대본의 상기 장면과 연관된 장르 또는 상기 장면에서의 대사들의 어조에 기반하여, 식별된 단어들의 그룹을 분류하고;
상기 분류에 기반하여, 상기 영화 대본에 기반하여 제작될 상기 영화의 상기 장면에 포함될 객체들에 대한 색상 조합을 추천하도록
추가로 구성되는, 정보 처리 디바이스.
방법으로서,
제작을 위한 영화와 연관되는 영화 대본의 텍스트 분석에 기반하여 상기 영화 대본의 복수의 장면들을 식별하는 단계;
식별된 복수의 장면들에 대한 장르 정보에 기반하여 상기 식별된 복수의 장면들의 각각의 장면에 대한 제1 점수를 계산하는 단계;
상기 영화 대본의 텍스트 분석에 기반하여 상기 영화 대본의 등장인물들의 목록을 식별하는 단계;
이력적 영화 데이터베이스에 기반하여, 식별된 목록의 등장인물들의 각각의 등장인물의 역할 연기에 대한 배우를 선택하는 단계;
선택된 배우에 대해, 상기 역할 연기에 대한 상기 선택된 배우의 적합성을 표시하는 제2 점수를 계산하는 단계 ― 상기 제2 점수는, 상기 이력적 영화 데이터베이스의 데이터포인트들에 대해 훈련되는 기계 학습 모델에 기반하여 계산됨 ―; 및
상기 식별된 복수의 장면들의 각각의 장면에 대한 계산된 제1 점수 및 상기 선택된 배우에 대한 계산된 제2 점수에 기반하여 상기 영화에 대한 성공-지수를 예측하는 단계
를 포함하는, 방법.
컴퓨터에 의해 구현되는 명령어들이 저장된 비-일시적인 컴퓨터 판독가능 매체로서, 상기 명령어들은, 정보 처리 디바이스에 의해 실행될 때, 상기 정보 처리 디바이스로 하여금 동작들을 실행하게 하고, 상기 동작들은,
제작을 위한 영화와 연관되는 영화 대본의 텍스트 분석에 기반하여 상기 영화 대본의 복수의 장면들을 식별하는 것;
식별된 복수의 장면들에 대한 장르 정보에 기반하여 상기 식별된 복수의 장면들의 각각의 장면에 대한 제1 점수를 계산하는 것;
상기 영화 대본의 텍스트 분석에 기반하여 상기 영화 대본의 등장인물들의 목록을 식별하는 것;
이력적 영화 데이터베이스에 기반하여, 식별된 목록의 등장인물들의 각각의 등장인물의 역할 연기에 대한 배우를 선택하는 것;
선택된 배우에 대해, 상기 역할 연기에 대한 상기 선택된 배우의 적합성을 표시하는 제2 점수를 계산하는 것 ― 상기 제2 점수는, 상기 이력적 영화 데이터베이스의 데이터포인트들에 대해 훈련되는 기계 학습 모델에 기반하여 계산됨 ―; 및
상기 식별된 복수의 장면들의 각각의 장면에 대한 계산된 제1 점수 및 상기 선택된 배우에 대한 계산된 제2 점수에 기반하여 상기 영화에 대한 성공-지수를 예측하는 것
을 포함하는, 비-일시적인 컴퓨터 판독가능 매체.