KR20230110584A

KR20230110584A - 정보 처리 시스템, 정보 처리 방법, 및 정보 처리 프로그램

Info

Publication number: KR20230110584A
Application number: KR1020237021006A
Authority: KR
Inventors: 교헤이 하나오카
Original assignee: 가부시끼가이샤 레조낙
Priority date: 2020-11-27
Filing date: 2021-11-22
Publication date: 2023-07-24
Also published as: EP4243026A4; US20240047018A1; JPWO2022113945A1; EP4243026A1; WO2022113945A1; CN116745850A

Abstract

일 실시형태에 관한 정보 처리 시스템은, 적어도 하나의 프로세서를 구비한다. 적어도 하나의 프로세서는, 복수의 성분 오브젝트의 각각에 대한 수치 표현 및 복합비를 취득하고, 복수의 수치 표현에 근거하여 기계 학습을 실행하여, 복수의 성분 오브젝트에 대응하는 복수의 회귀 파라미터를 산출하며, 복수의 회귀 파라미터에 의하여 정의되는 회귀 모델에 복수의 복합비를 적용하고, 복수의 성분 오브젝트를 복합시킴으로써 얻어지는 복합 오브젝트의 특성을 나타내는 예측값을 산출한다.

Description

정보 처리 시스템, 정보 처리 방법, 및 정보 처리 프로그램

본 개시의 일 측면은 정보 처리 시스템, 정보 처리 방법, 및 정보 처리 프로그램에 관한 것이다.

복수의 성분 오브젝트를 복합시킴으로써 얻어지는 복합 오브젝트를, 기계 학습을 이용하여 해석하는 수법이 이용되고 있다. 예를 들면, 특허문헌 1에는, 생체 고분자의 입체 구조와 화합물의 입체 구조의 결합성을 예측하는 방법이 기재되어 있다. 이 방법은, 생체 고분자의 입체 구조와 화합물의 입체 구조에 근거하여 생체 고분자와 화합물의 복합체의 예측 입체 구조를 생성하는 스텝과, 그 예측 입체 구조를, 상호 작용 패턴과의 대조 결과를 나타내는 예측 입체 구조 벡터로 변환하는 스텝과, 기계 학습 알고리즘을 이용하여 그 예측 입체 구조 벡터를 판별함으로써 생체 고분자의 입체 구조와 화합물의 입체 구조의 결합성을 예측하는 스텝을 포함한다.

특허문헌 1: 일본 공개특허공보 2019-28879호

성분 오브젝트가 다양하거나 다수 존재하거나 하는 경우에는, 이들 성분 오브젝트에 대하여 충분한 양의 데이터를 준비할 수 없으며, 그 결과, 복합 오브젝트의 해석의 정밀도가, 기대하는 수준에 도달하지 않을 가능성이 있다. 따라서, 성분 오브젝트에 대하여 충분한 양의 데이터를 준비할 수 없는 경우에도 복합 오브젝트의 해석의 정밀도를 높이기 위한 구조가 요망되고 있다.

본 개시의 일 측면에 관한 정보 처리 시스템은, 적어도 하나의 프로세서를 구비한다. 적어도 하나의 프로세서는, 복수의 성분 오브젝트의 각각에 대한 수치 표현 및 복합비를 취득하고, 복수의 수치 표현에 근거하여 기계 학습을 실행하여, 복수의 성분 오브젝트에 대응하는 복수의 회귀 파라미터를 산출하며, 복수의 회귀 파라미터에 의하여 정의되는 회귀 모델에 복수의 복합비를 적용하고, 복수의 성분 오브젝트를 복합시킴으로써 얻어지는 복합 오브젝트의 특성을 나타내는 예측값을 산출한다.

본 개시의 일 측면에 관한 정보 처리 방법은, 적어도 하나의 프로세서를 구비하는 정보 처리 시스템에 의하여 실행된다. 이 정보 처리 방법은, 복수의 성분 오브젝트의 각각에 대한 수치 표현 및 복합비를 취득하는 스텝과, 복수의 수치 표현에 근거하여 기계 학습을 실행하여, 복수의 성분 오브젝트에 대응하는 복수의 회귀 파라미터를 산출하는 스텝과, 복수의 회귀 파라미터에 의하여 정의되는 회귀 모델에 복수의 복합비를 적용하고, 복수의 성분 오브젝트를 복합시킴으로써 얻어지는 복합 오브젝트의 특성을 나타내는 예측값을 산출하는 스텝을 포함한다.

본 개시의 일 측면에 관한 정보 처리 프로그램은, 복수의 성분 오브젝트의 각각에 대한 수치 표현 및 복합비를 취득하는 스텝과, 복수의 수치 표현에 근거하여 기계 학습을 실행하여, 복수의 성분 오브젝트에 대응하는 복수의 회귀 파라미터를 산출하는 스텝과, 복수의 회귀 파라미터에 의하여 정의되는 회귀 모델에 복수의 복합비를 적용하고, 복수의 성분 오브젝트를 복합시킴으로써 얻어지는 복합 오브젝트의 특성을 나타내는 예측값을 산출하는 스텝을 컴퓨터에 실행시킨다.

이와 같은 측면에 있어서는, 각 성분 오브젝트의 데이터에 근거하여 기계 학습이 실행되어, 복수의 성분 오브젝트에 대응하는 복수의 회귀 파라미터가 산출된다. 그리고, 그 회귀 파라미터에 의하여 정의되는 회귀 모델에 복합비가 적용되어, 복합 오브젝트의 특성이 예측된다. 기계 학습 및 회귀 모델을 이용함으로써, 성분 오브젝트에 대하여 충분한 양의 데이터를 준비할 수 없는 경우에도 복합 오브젝트의 해석의 정밀도를 높이는 것이 가능해진다.

본 개시의 일 측면에 의하면, 성분 오브젝트에 대하여 충분한 양의 데이터를 준비할 수 없는 경우에도 복합 오브젝트의 해석의 정밀도를 높일 수 있다.

도 1은 실시형태에 관한 정보 처리 시스템을 구성하는 컴퓨터의 하드웨어 구성의 일례를 나타내는 도이다.
도 2는 실시형태에 관한 정보 처리 시스템의 기능 구성의 일례를 나타내는 도이다.
도 3은 실시형태에 관한 정보 처리 시스템의 동작의 일례를 나타내는 플로 차트이다.
도 4는 회귀 파라미터를 산출하는 수순의 일례를 나타내는 도이다.
도 5는 회귀 파라미터를 산출하는 수순의 다른 예를 나타내는 도이다.

이하, 첨부 도면을 참조하면서 본 개시에서의 실시형태를 상세하게 설명한다. 도면의 설명에 있어서 동일 또는 동등한 요소에는 동일한 부호를 붙이고, 중복되는 설명을 생략한다.

[시스템의 개요]

실시형태에 관한 정보 처리 시스템(10)은, 복수의 성분 오브젝트를 주어진 복합비로 복합시킴으로써 얻어지는 복합 오브젝트에 관한 해석을 실행하는 컴퓨터 시스템이다. 성분 오브젝트란, 복합 오브젝트를 생성하기 위하여 이용되는 유체물 또는 무체물을 말한다. 복합 오브젝트는 유체물 또는 무체물일 수 있다. 유체물의 예로서 임의의 물질 또는 물체를 들 수 있다. 무체물의 예로서 데이터 및 정보를 들 수 있다. "복수의 성분 오브젝트를 복합시킨다"란, 복수의 성분 오브젝트를 하나의 오브젝트, 즉 복합 오브젝트로 하는 처리를 말한다. 복합시키는 수법은 한정시키지 않고, 예를 들면, 배합, 조합(調合), 합성, 결합, 혼합, 합병, 조합(組合), 화합(化合), 또는 합체여도 되며, 다른 수법이어도 된다. 복합 오브젝트에 관한 해석이란, 복합 오브젝트의 어떠한 특성을 나타내는 데이터를 얻기 위한 처리를 말한다.

복수의 성분 오브젝트는 임의의 복수 종류의 재료여도 되고, 이 경우에는, 복합 오브젝트는 그들 재료에 의하여 생성되는 다성분 물질이다. 재료란 다성분 물질을 생성하기 위하여 이용되는 임의의 구성 요소이다. 예를 들면, 복수의 재료는 임의의 복수 종류의 분자 또는 원자여도 되고, 이 경우에는, 복합 오브젝트는, 그들의 분자 또는 원자를 임의의 수법으로 복합함으로써 얻어지는 다성분 물질이다. 예를 들면, 재료는 폴리머 또는 모노머여도 되고, 이에 대응하여, 다성분 물질은 폴리머 알로이여도 된다. 재료는 모노머여도 되고, 이에 대응하여, 다성분 물질은 폴리머여도 된다. 재료는 약물, 즉, 약리 작용을 갖는 화학 물질이어도 되고, 이에 대응하여, 다성분 물질은 약제여도 된다.

정보 처리 시스템(10)은 복합 오브젝트에 관한 해석을 위하여 기계 학습을 실행한다. 기계 학습이란, 부여된 정보에 근거하여 학습하여 법칙 또는 룰을 자율적으로 알아내는 수법이다. 기계 학습의 구체적인 수법은 한정되지 않는다. 예를 들면, 정보 처리 시스템(10)은, 뉴럴 네트워크를 포함하여 구성되는 계산 모델인 기계 학습 모델을 이용한 기계 학습을 실행해도 된다. 뉴럴 네트워크란, 인간의 뇌신경계의 구조를 모방한 정보 처리의 모델을 말한다. 보다 구체적인 예로서, 정보 처리 시스템(10)은, 그래프 뉴럴 네트워크(GNN), 컨볼루션 뉴럴 네트워크(CNN), 재귀형 뉴럴 네트워크(RNN), 어텐션 RNN(Attention RNN), 및 멀티 헤드·어텐션(Multi-Head Attention) 중 적어도 하나를 이용하여 기계 학습을 실행해도 된다.

[시스템의 구성]

정보 처리 시스템(10)은 1대 이상의 컴퓨터로 구성된다. 복수 대의 컴퓨터를 이용하는 경우에는, 이들 컴퓨터가 인터넷, 인트라넷 등의 통신 네트워크를 통하여 접속됨으로써, 논리적으로 하나의 정보 처리 시스템(10)이 구축된다.

도 1은, 정보 처리 시스템(10)을 구성하는 컴퓨터(100)의 일반적인 하드웨어 구성의 일례를 나타내는 도이다. 예를 들면, 컴퓨터(100)는, 오퍼레이팅 시스템, 애플리케이션·프로그램 등을 실행하는, CPU 등의 프로세서(101)와, ROM 및 RAM으로 구성되는 주기억부(102)와, 하드 디스크, 플래시 메모리 등으로 구성되는 보조 기억부(103)와, 네트워크 카드 또는 무선 통신 모듈로 구성되는 통신 제어부(104)와, 키보드, 마우스 등의 입력 장치(105)와, 모니터 등의 출력 장치(106)를 구비한다.

정보 처리 시스템(10)의 각 기능 요소는, 프로세서(101) 또는 주기억부(102) 상에 미리 정해진 프로그램을 읽어 들여 프로세서(101)에 그 프로그램을 실행시킴으로써 실현된다. 프로세서(101)는 그 프로그램에 따라, 통신 제어부(104), 입력 장치(105), 또는 출력 장치(106)를 동작시키고, 주기억부(102) 또는 보조 기억부(103)에 있어서의 데이터의 독출 및 기입을 행한다. 처리에 필요한 데이터 또는 데이터베이스는 주기억부(102) 또는 보조 기억부(103) 내에 저장된다.

도 2는 정보 처리 시스템(10)의 기능 구성의 일례를 나타내는 도이다. 정보 처리 시스템(10)은 기능 요소로서 취득부(11), 산출부(12), 및 예측부(13)를 구비한다.

취득부(11)는 복수의 성분 오브젝트에 관한 데이터를 취득하는 기능 요소이다. 구체적으로는, 취득부(11)는 복수의 성분 오브젝트의 각각에 대하여 수치 표현 및 복합비를 취득한다. 성분 오브젝트의 수치 표현이란, 성분 오브젝트의 임의의 속성을 복수의 수치를 이용하여 표현한 데이터를 말한다. 성분 오브젝트의 속성이란, 성분 오브젝트가 구비하는 성질 또는 특징을 말한다. 수치 표현은 다양한 수법으로 가시화되어도 되고, 예를 들면, 숫자, 영문자, 텍스트, 분자 그래프, 벡터, 화상, 시계열 데이터 등의 수법에 의하여 가시화되어도 되며, 이들 수법 중 임의의 2 이상의 조합에 의하여 가시화되어도 된다. 수치 표현을 구성하는 개개의 수치는, 10진법으로 나타나도 되고, 2진법, 16진법 등의 다른 표기법에 의하여 나타나도 된다. 성분 오브젝트의 복합비란, 복수의 성분 오브젝트의 사이의 비율을 말한다. 복합비의 구체적인 종류, 단위, 및 표현 방법은 한정되지 않고, 성분 오브젝트 또는 복합 오브젝트에 따라 임의로 정해져도 된다. 예를 들면 복합비는 백분율 등의 비율에 의하여 나타나도 되고, 히스토그램에 의하여 나타나도 되며, 개개의 성분 오브젝트의 절대량으로 나타나도 된다.

산출부(12)는, 복합 오브젝트의 특성을 예측하기 위한 회귀 모델의 회귀 파라미터를 산출하는 기능 요소이다. 구체적으로는, 산출부(12)는, 복수의 성분 오브젝트에 대응하는 복수의 수치 표현에 근거하여 기계 학습을 실행하여 회귀 파라미터를 산출한다. 회귀 모델이란, 1 이상의 설명 변수 x의 값이 주어진 경우에 1 이상의 목적 변수 y의 값을 구하기 위한 식을 말한다. 회귀 모델은 선형 회귀 모델이어도 되고 비선형 회귀 모델이어도 된다. 회귀 모델의 예로서 쉐페 다항식(Scheffe polynomial)을 들 수 있다. 그러나, 회귀 모델은 다른 파라메트릭 모델이어도 된다. 회귀 파라미터는, 회귀 모델에 포함되는 수치이다.

예측부(13)는, 복합 오브젝트의 특성을 예측하고, 그 예측값을 출력하는 기능 요소이다. 복합 오브젝트의 특성이란, 복합 오브젝트가 갖는 특유의 성질을 말한다. 구체적으로는, 예측부(13)는, 산출된 회귀 파라미터에 의하여 정의되는 회귀 모델에 복합비를 적용하여 예측값을 산출한다. 바꾸어 말하면, 예측부(13)는 그 회귀 모델에 복수의 복합비를 대입하여 예측값을 산출한다.

일례에서는, 산출부(12) 및 예측부(13)의 조합이 하나의 기계 학습 모델에 의하여 실현된다. 혹은, 산출부(12)가 기계 학습 모델에 의하여 실현되고, 예측부(13)가 기계 학습 모델을 이용하지 않는 알고리즘에 의하여 실현되어도 된다.

일례에서는, 본 실시형태에서 이용되는 적어도 하나의 기계 학습 모델의 각각은, 추정 정밀도가 가장 높다고 기대되는 학습 완료 모델이며, 따라서 "가장 양호한 기계 학습 모델"이라고 할 수 있다. 그러나, 이 학습 완료 모델은 "현실적으로 가장 양호하다"라고는 한정되지 않는 것에 유의해야 한다. 학습 완료 모델은, 입력 벡터와 라벨의 다수의 조합을 포함하는 교사 데이터를 주어진 컴퓨터가 처리함으로써 생성된다. 주어진 컴퓨터는, 입력 벡터를 기계 학습 모델에 입력하여 출력값을 산출하고, 그 출력값과 교사 데이터로 나타나는 라벨의 오차를 구한다. 출력값은 예를 들면 예측값이다. 출력값과 라벨의 오차는, 추정 결과와 정답의 차라고 할 수 있다. 컴퓨터는 그 오차에 근거하여 기계 학습 모델 내의 주어진 파라미터를 갱신한다. 컴퓨터는 이와 같은 학습을 반복함으로써 학습 완료 모델을 생성한다. 학습 완료 모델을 생성하는 컴퓨터는 한정되지 않고, 예를 들면 정보 처리 시스템(10)이어도 되며 다른 컴퓨터 시스템이어도 된다. 학습 완료 모델을 생성하는 처리는 학습 페이즈라고 할 수 있으며, 그 학습 완료 모델을 이용하는 처리는 운용 페이즈라고 할 수 있다.

일례에서는, 본 실시형태에서 이용되는 기계 학습 모델의 전체는, 입력의 순서에 의존하지 않는 함수에 의하여 기술되어도 된다. 이 구조에 의하여, 기계 학습에 있어서 복수의 벡터의 나열 순서의 영향을 배제할 수 있다.

[시스템의 동작]

도 3을 참조하면서, 정보 처리 시스템(10)의 동작을 설명함과 함께 본 실시형태에 관한 정보 처리 방법에 대하여 설명한다. 도 3은 정보 처리 시스템(10)의 동작의 일례를 처리 플로 S1로 하여 나타내는 플로 차트이다. 처리 플로 S1은 운용 페이즈에 상당한다.

스텝 S11에서는, 취득부(11)가, 복수의 성분 오브젝트의 각각에 대하여 수치 표현 및 복합비를 취득한다. 일례로서, 2개의 성분 오브젝트 Ea, Eb에 관한 정보가 입력된다고 한다면, 취득부(11)는 예를 들면, 성분 오브젝트 Ea의 수치 표현 {1, 1, 2, 3, 4, 3, 3, 5, 6, 7, 5, 4}와, 성분 오브젝트 Eb의 수치 표현 {1, 1, 5, 6, 4, 3, 3, 5, 1, 7, 0, 0}과, 성분 오브젝트 Ea, Eb의 복합비 {0.7, 0.3}을 취득한다. 이 예에서는, 각각의 수치 표현은 벡터로 나타나 있다. 복합비 {0.7, 0.3}은, 성분 오브젝트 Ea, Eb를 7:3의 비율로 이용하여 복합 오브젝트를 얻는 것을 의미한다.

취득부(11)는 복수의 성분 오브젝트의 각각의 데이터를 임의의 수법으로 취득해도 된다. 예를 들면, 취득부(11)는 주어진 데이터베이스에 액세스하여 데이터를 독출해도 되고, 다른 컴퓨터 또는 컴퓨터 시스템으로부터 데이터를 수신해도 되며, 정보 처리 시스템(10)의 유저에 의하여 입력된 데이터를 접수해도 된다. 혹은, 취득부(11)는 이들과 같은 수법 중 임의의 2 이상에 의하여 데이터를 취득해도 된다.

스텝 S12에서는, 산출부(12)가 복수의 성분 오브젝트의 각각에 대하여, 수치 표현에 근거하여 특징 벡터를 산출한다. 특징 벡터란, 성분 오브젝트의 특징을 나타내는 벡터를 말한다. 성분 오브젝트의 특징이란, 그 성분 오브젝트를 다른 오브젝트와 상이하게 하는 임의의 요소를 말한다. 벡터란, n개의 수치를 갖는 n차원의 양을 말하고, 1차원의 배열로서 표현할 수 있다.

스텝 S13에서는, 산출부(12)가, 산출된 복수의 특징 벡터에 근거하여, 복수의 성분 오브젝트에 대응하는 복수의 회귀 파라미터를 산출한다.

스텝 S14에서는, 예측부(13)가, 산출된 복수의 회귀 파라미터에 의하여 정의되는 회귀 모델을 이용하여, 복합 오브젝트의 특성을 나타내는 예측값을 산출한다. 회귀 파라미터에 의하여 정의되는 회귀 모델이란, 요컨대, 특정의 구체적인 수치가 회귀 파라미터로서 결정된 회귀 모델이다. 예측부(13)는 회귀 모델에 복수의 복합비를 적용하여 예측값을 산출한다.

스텝 S15에서는, 예측부(13)가 그 예측값을 출력한다. 예측값의 출력 방법은 한정되지 않는다. 예를 들면, 예측부(13)는 예측값을, 주어진 데이터베이스에 저장해도 되고, 다른 컴퓨터 또는 컴퓨터 시스템을 향하여 송신해도 되며, 표시 장치 상에 표시해도 된다. 혹은, 예측부(13)는 정보 처리 시스템(10)에서의 후속 처리를 위하여 예측값을 다른 기능 요소에 출력해도 된다.

도 4 및 도 5를 참조하면서, 회귀 모델에 관한 처리에 대하여 보다 상세하게 설명한다. 도 4 및 도 5는 모두, 회귀 파라미터를 산출하는 수순의 예를 나타내는 도이다. 어느 예에서도, 성분 오브젝트는, 폴리스타이렌, 폴리아크릴산, 및 폴리메타아크릴산 뷰틸이라는 3종류의 재료(폴리머)를 나타낸다. 이들 재료의 각각에 대하여, 임의의 형식의 수치 표현이 준비되어도 된다.

재료의 배합에 관한 문제에서는 상기의 쉐페 다항식이 자주 이용된다. 따라서, 도 4 및 도 5의 예에서는 회귀 모델이 쉐페 다항식인 것으로 한다.

도 4의 예에 대하여 설명한다. 스텝 S12의 일부인 스텝 S121에서는, 산출부(12)는, 벡터의 특징을 계산하기 위한 매립 함수(embedding function)용의 기계 학습 모델에 의하여, 복수의 성분 오브젝트의 각각에 대하여 수치 표현으로부터 특징 벡터 Z를 산출한다. 이 기계 학습 모델은 학습이 완료된 모델이다. 매립 함수에서는 입력 벡터와 출력 벡터는 1대 1의 관계에 있다. 이 예에서는, 입력 벡터는 수치 표현이며, 출력 벡터는 특징 벡터 Z이다. 산출부(12)는, 복수의 성분 오브젝트에 대응하는 복수의 수치 표현을 매립 함수용의 모델에 입력하여, 그 복수의 성분 오브젝트의 각각의 특징 벡터 Z를 산출한다. 일례에서는, 산출부(12)는, 복수의 성분 오브젝트의 각각에 대하여, 그 성분 오브젝트에 대응하는 수치 표현을 매립 함수용의 모델에 입력하여 그 성분 오브젝트의 특징 벡터 Z를 산출한다. 일례에서는, 매립 함수용의 모델은, 비정형 데이터인 수치 표현으로부터, 고정 길이 벡터인 특징 벡터 Z를 생성해도 된다. 비정형 데이터란, 고정 길이 벡터에 의하여 표현할 수 없는 데이터를 말한다. 도 4의 예에서는, 산출부(12)는 폴리스타이렌에 대응하는 특징 벡터 Z₁과, 폴리아크릴산에 대응하는 특징 벡터 Z₂와, 폴리메타크릴산 뷰틸에 대응하는 특징 벡터 Z₃을 산출한다.

매립 함수용의 기계 학습 모델은 한정되지 않고, 성분 오브젝트 및 복합 오브젝트의 종류 등의 요인을 고려하여 임의의 방침으로 결정되어도 된다. 예를 들면, 산출부(12)는 그래프 뉴럴 네트워크(GNN), 컨볼루션 뉴럴 네트워크(CNN), 또는 재귀형 뉴럴 네트워크(RNN)를 이용하여 매립 함수를 실행해도 된다.

스텝 S12의 일부인 스텝 S122에서는, 산출부(12)는, 복수의 벡터를 서로 작용시키기 위한 상호 작용 함수(interaction function)용의 기계 학습 모델에 의하여, 복수의 성분 오브젝트에 대하여 특징 벡터 Z로부터 다른 특징 벡터 M을 산출한다. 이 기계 학습 모델은 학습이 완료된 모델이다. 상호 작용 함수에서는 입력 벡터와 출력 벡터는 1대 1의 관계에 있다. 이 예에서는, 입력 벡터는 특징 벡터 Z이며, 출력 벡터는 특징 벡터 M이다. 일례에서는, 산출부(12)는, 복수의 성분 오브젝트에 대응하는 복수의 특징 벡터 Z의 집합을 상호 작용 함수용의 모델에 입력하여, 그 복수의 성분 오브젝트의 각각에 대하여 특징 벡터 M을 산출한다. 도 4의 예에서는, 산출부(12)는 폴리스타이렌에 대응하는 특징 벡터 M₁과, 폴리아크릴산에 대응하는 특징 벡터 M₂와, 폴리메타크릴산 뷰틸에 대응하는 특징 벡터 M₃을 산출한다.

상호 작용 함수용의 기계 학습 모델은 한정되지 않고, 성분 오브젝트 및 복합 오브젝트의 종류 등의 요인을 고려하여 임의의 방침으로 결정되어도 된다. 예를 들면, 산출부(12)는 어텐션 RNN(Attention RNN), 또는 멀티 헤드·어텐션(Multi-Head Attention)을 이용하여 상호 작용 함수용의 기계 학습을 실행해도 된다. 다른 예에서는, 산출부(12)는 학습 파라미터를 포함하지 않는 상호 작용 함수에 의하여 특징 벡터 M을 산출해도 된다.

도 4에 나타내는 스텝 S13에서는, 산출부(12)는 복수의 성분 오브젝트의 각각에 대하여 특징 벡터 M으로부터 선형 회귀 모델의 1차항의 회귀 파라미터 a를 산출한다. 일례에서는, 산출부(12)는 기계 학습 모델에 의하여 회귀 파라미터를 산출한다. 이 기계 학습 모델은 학습이 완료된 모델이다. 1차항의 회귀 파라미터를 산출하는 함수에서는, 입력 벡터와 출력값은 1대 1의 관계에 있다. 이 예에서는, 입력 벡터는 특징 벡터 M이며, 출력값은 회귀 파라미터 a이다. 일례에서는, 산출부(12)는, 복수의 성분 오브젝트에 대응하는 복수의 특징 벡터 M의 집합을 기계 학습 모델에 입력하여, 그 복수의 성분 오브젝트의 각각에 대하여 회귀 파라미터 a를 산출한다. 도 4의 예에서는, 산출부(12)는 폴리스타이렌에 대응하는 회귀 파라미터 a₁과, 폴리아크릴산에 대응하는 회귀 파라미터 a₂와, 폴리메타크릴산 뷰틸에 대응하는 회귀 파라미터 a₃을 산출한다.

회귀 파라미터를 산출하기 위한 기계 학습 모델은 한정되지 않고, 성분 오브젝트 및 복합 오브젝트의 종류 등의 요인을 고려하여 임의의 방침으로 결정되어도 된다. 예를 들면, 산출부(12)는 전체 결합 뉴럴 네트워크(FCNN)를 이용하여 회귀 파라미터를 산출해도 된다.

도 4에 나타내는 스텝 S14에서는, 예측부(13)는 3개의 회귀 파라미터 a₁, a₂, a₃에 의하여 정의되는 하기의 쉐페 다항식 (1)에 의하여 예측값 E를 산출한다. 회귀 파라미터 a는 식 (1)의 1차항의 회귀 계수라고도 할 수 있다. 예측값 E는, 폴리스타이렌, 폴리아크릴산, 및 폴리메타크릴산 뷰틸로부터 얻어지는 다성분 물질(폴리머 알로이)의 특성을 나타낸다. 식 (1)에 있어서의 변수 r은 복합비를 의미한다. 폴리스타이렌, 폴리아크릴산, 및 폴리메타크릴산 뷰틸의 복합비는 각각 r₁, r₂, r₃으로 나타난다.

[수학식 1]

도 5의 예에 대하여 설명한다. 도 5의 예에서는, 스텝 S121 및 스텝 S122를 포함하는 스텝 S12는 도 4의 예와 동일하고, 스텝 S13, S14는 도 4의 예와 상이하다.

도 5에 나타내는 스텝 S13에서는, 산출부(12)는 복수의 성분 오브젝트의 각각에 대하여 특징 벡터 M으로부터 선형 회귀 모델의 회귀 파라미터를 산출한다. 구체적으로는, 산출부(12)는 1차항의 회귀 파라미터 a 및 2차항의 회귀 파라미터 b를 산출한다. 일례에서는, 산출부(12)는 FCNN 등의 기계 학습에 의하여 회귀 파라미터를 산출한다. 기계 학습 모델은 선형 회귀 모델의 1차항 및 2차항의 각각에 대하여 준비된다.

도 4의 예와 동일하게, 1차항의 회귀 파라미터를 산출하는 함수에서는, 입력 벡터와 출력값은 1대 1의 관계에 있다. 이 예에서는, 입력 벡터는 특징 벡터 M이며, 출력값은 회귀 파라미터 a이다. 일례에서는, 산출부(12)는, 복수의 성분 오브젝트에 대응하는 복수의 특징 벡터 M의 집합을 기계 학습 모델에 입력하여, 그 복수의 성분 오브젝트의 각각에 대하여 회귀 파라미터 a를 산출한다. 도 5의 예에서도, 산출부(12)는 폴리스타이렌에 대응하는 회귀 파라미터 a₁과, 폴리아크릴산에 대응하는 회귀 파라미터 a₂와, 폴리메타크릴산 뷰틸에 대응하는 회귀 파라미터 a₃을 산출한다.

2차항의 회귀 파라미터를 산출하는 함수에서는, 개개의 입력 벡터는, 2개의 특징 벡터를 합성함으로써 얻어진다. 이 함수는, 2개의 벡터로부터 하나의 회귀 파라미터를 산출하는 함수이다. 이 예에서는, 2개의 특징 벡터 M이 합성된다. 도 5의 예에서는, 산출부(12)는 2개의 특징 벡터 M₁, M₂를 합성하여 제1 입력 벡터를 생성하고, 2개의 특징 벡터 M₁, M₃을 합성하여 제2 입력 벡터를 생성하며, 2개의 특징 벡터 M₂, M₃을 합성하여 제3 입력 벡터를 생성한다. 따라서, 제1 입력 벡터는 폴리스타이렌 및 폴리아크릴산에 대응하고, 제2 입력 벡터는 폴리스타이렌 및 폴리메타크릴산 뷰틸에 대응하며, 제3 입력 벡터는 폴리아크릴산 및 폴리메타크릴산 뷰틸에 대응한다. 2차항의 회귀 파라미터를 산출하는 함수에서도, 입력 벡터와 출력값은 1대 1의 관계에 있다. 이 예에서는, 입력 벡터는 2개의 특징 벡터 M의 합성이며, 출력값은 회귀 파라미터 b이다. 일례에서는, 산출부(12)는 입력 벡터의 모든 조합을 기계 학습 모델에 입력하여, 각각의 조합에 대하여 회귀 파라미터 b를 산출한다. 도 5의 예에서는, 산출부(12)는 폴리스타이렌 및 폴리아크릴산의 조합에 대응하는 회귀 파라미터 b₁₂와, 폴리스타이렌 및 폴리메타크릴산 뷰틸의 조합에 대응하는 회귀 파라미터 b₁₃과, 폴리아크릴산 및 폴리메타크릴산 뷰틸의 조합에 대응하는 회귀 파라미터 b₂₃을 산출한다.

도 5에 나타내는 스텝 S14에서는, 예측부(13)는 6개의 회귀 파라미터 a₁, a₂, a₃, b₁₂, b₁₃, b₂₃에 의하여 정의되는 하기의 쉐페 다항식 (2)에 의하여 예측값 E를 산출한다. 식 (2)에 있어서, 회귀 파라미터 a는 1차항의 회귀 계수라고도 할 수 있고, 회귀 파라미터 b는 2차항의 회귀 계수라고도 할 수 있다. 식 (2)에 있어서의 변수 r의 의미는, 식 (1)과 동일하게 복합비이다.

[수학식 2]

도 4 및 도 5에서는 3개의 성분 오브젝트를 나타내지만, 당연히 성분 오브젝트의 개수는 한정되지 않고, 정보 처리 시스템(10)은 임의의 개수의 성분 오브젝트를 처리해도 된다.

정보 처리 시스템(10)은, 3차 이상의 항 또는 다른 파라미터를 포함하는 회귀 모델에 대해서도 동일하게, 관련되는 모든 성분 오브젝트의 특징 벡터에 근거하여 개개의 회귀 파라미터를 출력하면 된다. 선형 회귀의 절편과 같이 특정 설명 변수에 의존하지 않는 회귀 파라미터를 산출하는 경우에는, 정보 처리 시스템(10)은, 모든 성분 오브젝트의 특징 벡터에 근거하여 하나의 회귀 파라미터를 출력해도 된다.

도 4 및 도 5의 예에서는 산출부(12)가 매립 함수 및 상호 작용 함수의 쌍방을 실행하지만, 이 2개의 함수 중 일방이 생략되어도 된다. 예를 들면, 산출부(12)는 매립 함수용의 기계 학습 모델에 의하여 얻어지는 특징 벡터 Z로부터 회귀 파라미터를 산출해도 된다. 어느 경우든, 산출부(12)는 기계 학습을 실행하여 회귀 파라미터를 산출한다.

일례에서는, 매립 함수용의 기계 학습 모델과, 상호 작용 함수용의 기계 학습 모델과, 회귀 파라미터용의 기계 학습 모델과, 회귀 모델은 하나의 뉴럴 네트워크에 의하여 구축되어도 되고, 복수의 뉴럴 네트워크의 집합에 의하여 구축되어도 된다. 혹은, 매립 함수용의 기계 학습 모델과, 상호 작용 함수용의 기계 학습 모델과, 회귀 파라미터용의 기계 학습 모델은 하나의 뉴럴 네트워크에 의하여 구축되어도 되고, 복수의 뉴럴 네트워크의 집합에 의하여 구축되어도 된다.

[프로그램]

컴퓨터 또는 컴퓨터 시스템을 정보 처리 시스템(10)으로서 기능시키기 위한 정보 처리 프로그램은, 그 컴퓨터 시스템을 취득부(11), 산출부(12), 및 예측부(13)로서 기능시키기 위한 프로그램 코드를 포함한다. 이 정보 처리 프로그램은, CD-ROM, DVD-ROM, 반도체 메모리 등의 유형(有形)의 기록 매체에 비일시적으로 기록된 후에 제공되어도 된다. 혹은, 정보 처리 프로그램은, 반송파에 중첩된 데이터 신호로서 통신 네트워크를 통하여 제공되어도 된다. 제공된 정보 처리 프로그램은 예를 들면 보조 기억부(103)에 기억된다. 프로세서(101)가 보조 기억부(103)로부터 그 정보 처리 프로그램을 독출하여 실행함으로써, 상기의 각 기능 요소가 실현된다.

[효과]

이상 설명한 바와 같이, 본 개시의 일 측면에 관한 정보 처리 시스템은, 적어도 하나의 프로세서를 구비한다. 적어도 하나의 프로세서는, 복수의 성분 오브젝트의 각각에 대한 수치 표현 및 복합비를 취득하고, 복수의 수치 표현에 근거하여 기계 학습을 실행하여, 복수의 성분 오브젝트에 대응하는 복수의 회귀 파라미터를 산출하며, 복수의 회귀 파라미터에 의하여 정의되는 회귀 모델에 복수의 복합비를 적용하고, 복수의 성분 오브젝트를 복합시킴으로써 얻어지는 복합 오브젝트의 특성을 나타내는 예측값을 산출한다.

일단 회귀 파라미터가 얻어지면, 복합비를 변경하여 복합 오브젝트의 특성을 회귀 모델에 의하여 즉시 재계산할 수 있다. 즉, 산출된 회귀 파라미터를 재이용할 수 있다. 기계 학습에 의하여 회귀 파라미터를 추정하는 수법을 채용함으로써, 복합비를 변경하면서 복합 오브젝트의 특성을 탐색하는 처리를 고속으로 실행하는 것이 가능해진다.

다른 측면에 관한 정보 처리 시스템에서는, 적어도 하나의 프로세서가, 복수의 수치 표현을 제1 기계 학습 모델에 입력하여, 복수의 성분 오브젝트에 대응하는 복수의 특징 벡터를 산출하고, 복수의 특징 벡터를 제2 기계 학습 모델에 입력하여 복수의 회귀 파라미터를 산출해도 된다. 이 일련의 수순에 의하여, 성분 오브젝트에 대하여 충분한 양의 데이터를 준비할 수 없는 경우에도, 복합 오브젝트의 해석의 정밀도를 더 높이는 것이 가능해진다.

다른 측면에 관한 정보 처리 시스템에서는, 제1 기계 학습 모델이, 매립 함수용의 기계 학습 모델과, 상호 작용 함수용의 기계 학습 모델을 포함해도 된다. 적어도 하나의 프로세서는, 복수의 수치 표현을 매립 함수용의 기계 학습 모델에 입력하여, 복수의 성분 오브젝트에 대응하는 복수의 제1 특징 벡터를 산출하고, 복수의 제1 특징 벡터를 상호 작용 함수용의 기계 학습 모델에 입력하여, 복수의 성분 오브젝트에 대응하는 복수의 제2 특징 벡터를 산출하며, 복수의 제2 특징 벡터를 제2 기계 학습 모델에 입력하여 복수의 회귀 파라미터를 산출해도 된다. 제1 기계 학습 모델을 이와 같이 구성함으로써, 성분 오브젝트에 대하여 충분한 양의 데이터를 준비할 수 없는 경우에도 복합 오브젝트의 해석의 정밀도를 더 높이는 것이 가능해진다.

다른 측면에 관한 정보 처리 시스템에서는, 매립 함수용의 기계 학습 모델이, 비정형 데이터인 수치 표현으로부터, 고정 길이 벡터인 제1 특징 벡터를 생성하는 기계 학습 모델이어도 된다. 이 기계 학습 모델을 이용함으로써, 고정 길이 벡터에 의하여 표현할 수 없는 수치 표현으로부터 특징 벡터를 얻을 수 있다.

다른 측면에 관한 정보 처리 시스템에서는, 회귀 모델이 쉐페 다항식이어도 된다. 적어도 하나의 프로세서가, 복수의 회귀 파라미터로서, 쉐페 다항식의 1차항의 복수의 회귀 계수를 산출해도 된다. 배합에 관한 문제로 자주 다루어지는 쉐페 다항식을 이용함으로써, 복수의 성분 오브젝트를 배합함으로써 얻어지는 복합 오브젝트를 양호한 정밀도로 해석할 수 있다. 또한, 1차항의 회귀 계수에 의하여, 성분 오브젝트의 단독의 영향도가 고려된 예측값을 산출할 수 있다.

다른 측면에 관한 정보 처리 시스템에서는, 적어도 하나의 프로세서가, 복수의 회귀 파라미터로서, 쉐페 다항식의 2차항의 복수의 회귀 계수를 더 산출해도 된다. 이 경우에는, 2차항의 회귀 계수에 의하여, 2개의 성분 오브젝트의 합성의 영향도가 더 고려된 예측값을 산출할 수 있다.

다른 측면에 관한 정보 처리 시스템에서는, 성분 오브젝트가 재료이며, 복합 오브젝트가 다성분 물질이어도 된다. 이 경우에는, 재료에 대하여 충분한 양의 데이터를 준비할 수 없는 경우에도 다성분 물질의 해석의 정밀도를 높이는 것이 가능해진다.

다른 측면에 관한 정보 처리 시스템에서는, 재료가 폴리머 또는 모노머이며, 다성분 물질이 폴리머 알로이여도 된다. 이 경우에는, 폴리머 또는 모노머에 대하여 충분한 양의 데이터를 준비할 수 없는 경우에도 폴리머 알로이의 해석의 정밀도를 높이는 것이 가능해진다. 폴리머 또는 모노머는 매우 다양하며, 이에 대응하여, 폴리머 알로이의 종류도 방대하다. 이와 같은 폴리머, 모노머, 및 폴리머 알로이에 대해서는, 일반적으로, 취득할 수 있는 조합의 일부에 대해서밖에 실험을 행할 수 없고, 따라서 충분한 양의 데이터가 얻어지지 않는 경우가 많다. 본 측면에 의하면, 이와 같이 데이터가 불충분한 경우에서도 양호한 정밀도로 폴리머 알로이를 해석하는 것이 가능해진다.

[변형예]

이상, 본 발명을 그 실시형태에 근거하여 상세하게 설명했다. 그러나, 본 발명은 상기 실시형태에 한정되는 것은 아니다. 본 발명은, 그 요지를 벗어나지 않는 범위에서 다양한 변형이 가능하다.

적어도 하나의 프로세서에 의하여 실행되는 정보 처리 방법의 처리 수순은 상기 실시형태에서의 예에 한정되지 않는다. 예를 들면, 상술한 스텝 또는 처리의 일부가 생략되어도 되고, 다른 순서로 각 스텝이 실행되어도 된다. 또, 상술한 스텝 중 임의의 2 이상의 스텝이 조합되어도 되고, 스텝의 일부가 수정 또는 삭제되어도 된다. 혹은, 상기의 각 스텝에 더하여 다른 스텝이 실행되어도 된다.

정보 처리 시스템 내에서 2개의 수치의 대소 관계를 비교할 때에는, "이상" 및 "보다 크다"라는 2개의 기준 중 어느 쪽을 이용해도 되고, "이하" 및 "미만"의 2개의 기준 중 어느 쪽을 이용해도 된다. 이와 같은 기준의 선택은, 2개의 수치의 대소 관계를 비교하는 처리에 대한 기술적 의의를 변경하는 것은 아니다.

본 개시에 있어서, "적어도 하나의 프로세서가, 제1 처리를 실행하고, 제2 처리를 실행하며, …제n 처리를 실행한다."라는 표현, 또는 이에 대응하는 표현은, 제1 처리부터 제n 처리까지의 n개의 처리를 실행하는 프로세서가 도중에 바뀌는 경우를 포함하는 개념을 나타낸다. 즉, 이 표현은, n개의 처리의 전부가 동일한 프로세서로 실행되는 경우와, n개의 처리에 있어서 프로세서가 임의의 방침으로 바뀌는 경우의 쌍방을 포함하는 개념을 나타낸다.

10…정보 처리 시스템
11…취득부
12…산출부
13…예측부

Claims

적어도 하나의 프로세서를 구비하며,
상기 적어도 하나의 프로세서가,
복수의 성분 오브젝트의 각각에 대한 수치 표현 및 복합비를 취득하고,
복수의 상기 수치 표현에 근거하여 기계 학습을 실행하여, 상기 복수의 성분 오브젝트에 대응하는 복수의 회귀 파라미터를 산출하며,
상기 복수의 회귀 파라미터에 의하여 정의되는 회귀 모델에 복수의 상기 복합비를 적용하여, 상기 복수의 성분 오브젝트를 복합시킴으로써 얻어지는 복합 오브젝트의 특성을 나타내는 예측값을 산출하는, 정보 처리 시스템.
청구항 1에 있어서,
상기 적어도 하나의 프로세서가,
상기 복수의 수치 표현을 제1 기계 학습 모델에 입력하여, 상기 복수의 성분 오브젝트에 대응하는 복수의 특징 벡터를 산출하고,
상기 복수의 특징 벡터를 제2 기계 학습 모델에 입력하여 상기 복수의 회귀 파라미터를 산출하는, 정보 처리 시스템.
청구항 2에 있어서,
상기 제1 기계 학습 모델이, 매립 함수용의 기계 학습 모델과, 상호 작용 함수용의 기계 학습 모델을 포함하고,
상기 적어도 하나의 프로세서가,
상기 복수의 수치 표현을 상기 매립 함수용의 기계 학습 모델에 입력하여, 상기 복수의 성분 오브젝트에 대응하는 복수의 제1 특징 벡터를 산출하며,
상기 복수의 제1 특징 벡터를 상기 상호 작용 함수용의 기계 학습 모델에 입력하여, 상기 복수의 성분 오브젝트에 대응하는 복수의 제2 특징 벡터를 산출하고,
상기 복수의 제2 특징 벡터를 상기 제2 기계 학습 모델에 입력하여 상기 복수의 회귀 파라미터를 산출하는, 정보 처리 시스템.
청구항 3에 있어서,
상기 매립 함수용의 기계 학습 모델이, 비정형 데이터인 상기 수치 표현으로부터, 고정 길이 벡터인 상기 제1 특징 벡터를 생성하는 기계 학습 모델인, 정보 처리 시스템.
청구항 1 내지 청구항 4 중 어느 한 항에 있어서,
상기 회귀 모델이 쉐페 다항식이며,
상기 적어도 하나의 프로세서가, 상기 복수의 회귀 파라미터로서, 상기 쉐페 다항식의 1차항의 복수의 회귀 계수를 산출하는, 정보 처리 시스템.
청구항 5에 있어서,
상기 적어도 하나의 프로세서가, 상기 복수의 회귀 파라미터로서, 상기 쉐페 다항식의 2차항의 복수의 회귀 계수를 더 산출하는, 정보 처리 시스템.
청구항 1 내지 청구항 6 중 어느 한 항에 있어서,
상기 성분 오브젝트가 재료이며, 상기 복합 오브젝트가 다성분 물질인, 정보 처리 시스템.
청구항 7에 있어서,
상기 재료가 폴리머 또는 모노머이며, 상기 다성분 물질이 폴리머 알로이인, 정보 처리 시스템.
적어도 하나의 프로세서를 구비하는 정보 처리 시스템에 의하여 실행되는 정보 처리 방법으로서,
복수의 성분 오브젝트의 각각에 대한 수치 표현 및 복합비를 취득하는 스텝과,
복수의 상기 수치 표현에 근거하여 기계 학습을 실행하여, 상기 복수의 성분 오브젝트에 대응하는 복수의 회귀 파라미터를 산출하는 스텝과,
상기 복수의 회귀 파라미터에 의하여 정의되는 회귀 모델에 복수의 상기 복합비를 적용하여, 상기 복수의 성분 오브젝트를 복합시킴으로써 얻어지는 복합 오브젝트의 특성을 나타내는 예측값을 산출하는 스텝을 포함하는 정보 처리 방법.
복수의 성분 오브젝트의 각각에 대한 수치 표현 및 복합비를 취득하는 스텝과,
복수의 상기 수치 표현에 근거하여 기계 학습을 실행하여, 상기 복수의 성분 오브젝트에 대응하는 복수의 회귀 파라미터를 산출하는 스텝과,
상기 복수의 회귀 파라미터에 의하여 정의되는 회귀 모델에 복수의 상기 복합비를 적용하여, 상기 복수의 성분 오브젝트를 복합시킴으로써 얻어지는 복합 오브젝트의 특성을 나타내는 예측값을 산출하는 스텝을 컴퓨터에 실행시키는 정보 처리 프로그램.