TWI677799B - 模型構築系統及模型構築方法 - Google Patents

模型構築系統及模型構築方法 Download PDF

Info

Publication number
TWI677799B
TWI677799B TW107106843A TW107106843A TWI677799B TW I677799 B TWI677799 B TW I677799B TW 107106843 A TW107106843 A TW 107106843A TW 107106843 A TW107106843 A TW 107106843A TW I677799 B TWI677799 B TW I677799B
Authority
TW
Taiwan
Prior art keywords
model
input variables
selected input
deformation
variable
Prior art date
Application number
TW107106843A
Other languages
English (en)
Other versions
TW201837761A (zh
Inventor
西田幸仁
Yukihito Nishida
安井英己
Hideki Yasui
Original Assignee
日商東芝股份有限公司
Kabushiki Kaisha Toshiba
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日商東芝股份有限公司, Kabushiki Kaisha Toshiba filed Critical 日商東芝股份有限公司
Publication of TW201837761A publication Critical patent/TW201837761A/zh
Application granted granted Critical
Publication of TWI677799B publication Critical patent/TWI677799B/zh

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本發明提供一種可抑制精度下降並且可構築泛化能力較高之模型之模型構築系統及模型構築方法。根據實施形態,模型構築系統具備基本模型構築部、類似度算出部、變形模型構築部及泛化能力算出部。上述基本模型構築部係構築表示自複數個輸入變數中選擇之選擇輸入變數與輸出變數之關係之基本模型。上述類似度算出部係算出上述複數個輸入變數之中除上述選擇輸入變數以外之非選擇輸入變數與上述選擇輸入變數之間之類似度。上述變形模型構築部係基於上述類似度,將上述選擇輸入變數之至少一部分替換成上述非選擇輸入變數,構築表示替換後之輸入變數與輸出變數之關係之變形模型。上述泛化能力算出部係算出上述基本模型及上述變形模型之泛化能力。

Description

模型構築系統及模型構築方法
本發明之實施形態一般而言係關於一種模型構築系統及模型構築方法。
出於使用複數個輸入變數(說明變數)預測某輸出變數(目的變數)之目的,一般進行表示複數個輸入變數與輸出變數之關係之模型之構築。於構築模型時,從多個輸入變數之中選擇一部分輸入變數,使用選擇之輸入變數與輸出變數構築模型。例如,輸入變數係以對輸出變數之預測誤差較小,可更高精度地預測輸出變數之方式選擇。 關於模型,除了精度以外,還要求較高之泛化能力。即,要求基於某範圍之資料(既存資料)構築之模型即便對於其他範圍之資料(未知之資料)亦具有良好之精度。然而,對於既存之資料具有較高之精度之模型未必具有較高之泛化能力。而且,亦有較之對於既存之資料精度最高之模型而精度某種程度上較低之模型於泛化能力上優異之情形。因此,期望開發一種可抑制精度之下降並且構築泛化能力較高之模型之技術。
本發明之實施形態係提供一種可抑制精度之下降並且構築泛化能力較高之模型之模型構築系統及模型構築方法。 根據本發明之實施形態,模型構築系統具備基本模型構築部、類似度算出部、變形模型構築部及泛化能力算出部。上述基本模型構築部係構築表示自複數個輸入變數中選擇之選擇輸入變數與輸出變數之關係之基本模型。上述類似度算出部係算出上述複數個輸入變數之中除上述選擇輸入變數以外之非選擇輸入變數與上述選擇輸入變數之間之類似度。上述變形模型構築部係基於上述類似度,將上述選擇輸入變數之至少一部分替換成上述非選擇輸入變數,構築表示替換後之輸入變數與輸出變數之關係之變形模型。上述泛化能力算出部係算出上述基本模型及上述變形模型之泛化能力。 根據上述構成之模型構築系統,可抑制精度之降低並且構築泛化能力較高之模型。
以下,一面參照圖式一面對本發明之各實施形態進行說明。 又,於本案說明書與各圖中,對與已經說明者同樣之要素標註相同符號,且省略詳細說明。 圖1係表示實施形態之模型構築系統1之構成之方塊圖。 圖2及圖3係說明實施形態之模型構築系統1之處理之一例之圖。 如圖1所示,模型構築系統1具備取得部100、基本模型構築部102、模型資訊保存部104、類似度算出部106、類似度資訊保存部108、變形模型構築部110、泛化能力算出部112、外部輸出部114、規定數資料庫120及變數資料庫122。 規定數資料庫120記憶規定數。規定數表示於模型構築系統1中構築之模型之數。規定數例如預先由使用者輸入。變數資料庫122記憶關於輸入變數及輸出變數之各變數之實測值即變數資料。 取得部100自規定數資料庫120及變數資料庫122分別取得規定數及變數資料。取得部100將取得之資訊輸出至基本模型構築部102。 基本模型構築部102從自取得部100輸出之複數個輸入變數中選擇一部分輸入變數。基本模型構築部102使用藉由取得部100取得之變數資料,構築表示選擇之輸入變數與輸出變數之關係之模型。輸入變數之選擇及模型之構築例如可使用最小絕對緊縮與選擇算子(Least Absolute Shrinkage and Selection Operator (Lasso))、 彈性網絡(Elastic Net)、 脊(Ridge)、最小角度回歸(Least Angle Regression (LARS))、非負絞殺法(Non Negative Garrote)、或平滑修剪絕對離差(Smoothly Clipped Absolute Deviation (SCAD))進行。或者,使用逐步、變量重要性投影(Variable Important in the Projection(VIP))、遺傳演算法、及最新相關魯汶方法(Nearest Correlation Louvain Method (NCLM))之任一者進行輸入變數之選擇,亦可使用複回歸或(部分最小平方Partial Least Squares (PLS))進行模型之構築。 於以下,將於利用基本模型構築部102進行模型構築時選擇之輸入變數稱作「選擇輸入變數」。將未選擇之變數稱為「非選擇輸入變數」。選擇輸入變數係藉由取得部100取得之複數個輸入變數中之一部分。非選擇輸入變數係複數個輸入變數之另一部分。非選擇輸入變數與選擇輸入變數不同。又,將藉由基本模型構築部102使用選擇輸入變數構築之模型稱為「基本模型」。基本模型表示包含複數個選擇輸入變數之輸入變數群與輸出變數之關係。 基本模型構築部102將構築之基本模型輸出至模型資訊保存部104。藉此,於模型資訊保存部104保存模型資訊。又,基本模型構築部102將基本模型亦輸出至類似度算出部106及變形模型構築部110。 類似度算出部106算出包含於基本模型之複數個選擇輸入變數之各者與複數個非選擇輸入變數之各者之間之複數個類似度。例如,可將相關係數、偏相關係數、正準相關或脊決定係數等作為類似度使用。類似度算出部106將算出之類似度輸出至類似度資訊保存部108。 變形模型構築部110自類似度資訊保存部108取得輸入變數之類似度資訊。變形模型構築部110基於該類似度資訊,將複數個選擇輸入變數之至少一部分替換為複數個非選擇輸入變數之至少一部分。藉此,產生其他輸入變數群。此時,變形模型構築部110亦可將包含於基本模型之複數個選擇輸入變數全部替換為複數個非選擇輸入變數之至少一部分。或,變形模型構築部110亦可將包含於基本模型之複數個選擇輸入變數之一部分替換為複數個非選擇輸入變數之至少一部分。變形模型構築部110係構築表示上述其他輸入變數群與輸出變數之關係之模型。於以下,將藉由變形模型構築部110構築之該模型稱為「變形模型」。 藉由變形模型構築部110構築之變形模型之模型資訊保存於模型資訊保存部104。又,變形模型構築部110判定藉由模型構築系統1構築之基本模型與變形模型之總數是否達到規定數。於構築之模型之總數未達到規定數之情形時,變形模型構築部110一面替換包含於變形模型之變數,一面進而反覆構築其他變形模型。 若基本模型及變形模型之總數達到規定數,則藉由泛化能力算出部112而算出構築之各模型之泛化能力。泛化能力算出部112取得保存於模型資訊保存部104之模型資訊(基本模型及變形模型),自變數資料庫122取得變數資料。此時,泛化能力算出部112取得與基本模型及變形模型之構築時不同範圍之變數資料(未知之資訊)。例如,泛化能力算出部112對未知之資料之輸入變數應用基本模型及變形模型。泛化能力算出部112比較各模型之預測值與輸出變數之實測值,算出預測之精度作為各模型之泛化能力。 作為一例,基本模型及變形模型係將於某製造裝置中獲得之各種資料(溫度、壓力、品質)作為輸入變數及輸出變數而構築。於該情形時,將各模型應用於在其他製造裝置中獲得之變數資料,且算出其精度作為各模型之泛化能力。 又,基本模型及變形模型係基於在某製造裝置之特定期間獲得之變數資料而構築。於該情形時,亦可將各模型應用於在該裝置之其他期間獲得之資料,算出其精度作為各模型之泛化能力。 泛化能力例如使用均方誤差(Mean Square Error (MSE))、均方根誤差(Root Mean Square Error(RMSE))、決定係數(R2 )、相關係數、赤池訊息準則(Akaike's Information Criterion (AIC))或貝氏訊息準則(Bayesian Information Criterion (BIC))等算出。泛化能力算出部112將針對各模型之泛化能力之算出結果輸出至外部輸出部114。 外部輸出部114使泛化能力最高之基本模型及變形模型之1個於顯示器上對使用者顯示,或以特定之檔案格式輸出。外部輸出部114亦可輸出包含具有最高泛化能力之模型之複數個模型。 此處,一面參照圖2及圖3,一面對複數個具體之例進行說明。 例如,將12個輸入變數Xi (i=1~12之自然數)與輸出變數Y之變數資料記憶於變數資料庫122。於該情形時,基本模型構築部102選擇12個輸入變數之一部分。基本模型構築部102於12個輸入變數之一部分與輸出變數Y之間,例如作成以如下之式(1)表示之基本模型。基本模型構築部102將該基本模型保存於模型資訊保存部104。 Y=b1 X1 +b2 X2 +b3 X3 +b0 (1) 其次,類似度算出部106於選擇輸入變數即X1 、X2 及X3 各者與非選擇輸入變數即X4 ~X12 各者之間,如圖2(a)所表示般算出類似度。於圖2(a)中,例示使用相關係數作為類似度之情形。 作為第1種方法,變形模型構築部110例如使用預先設定之閾值。變形模型構築部110針對各選擇輸入變數,抽取具有閾值以上之類似度之至少1個非選擇輸入變數。 於圖2(b)表示之例中,閾值設定為80%,抽取相對於各選擇輸入變數類似度較高之非選擇輸入變數。即,於該例中,對於變數X1 ,抽取變數X4 、X5 、X6 。對於變數X2 ,抽取變數X7 、X8 、X9 ,對於變數X3 ,抽取變數X10 、X11 、X12 。藉此,作成複數個之1個選擇輸入變數和與該1個選擇輸入變數類似度較高之非選擇輸入變數之組。於圖2(a)表示之例中,非選擇輸入變數X12 之類似度相對於選擇輸入變數X1 及X3 之兩者為80%以上。於該情形時,非選擇輸入變數X12 例如對類似度更高之選擇輸入變數X3 分配。 變形模型構築部110針對各組,例如將選擇輸入變數與非選擇輸入變數以一致之概率替換。變形模型構築部110基於替換後之選擇輸入變數與非選擇輸入變數之群而構築變形模型。變形模型構築部110將該變形模型保存於模型資訊保存部104。例如,於圖2(a)及圖2(b)表示之例中,變數X1 及X3 未被替換,變數X2 替換為變數X7 。於該情形時,變形模型構築部110基於該等之輸入變數而構築以如下之式(2)表示之變形模型,且保存於模型資訊保存部104。 Y=b5 X1 +b6 X7 +b7 X3 +b4 (2) 作為第2種方法,變形模型構築部110設定基於非選擇輸入變數之類似度之概率。變形模型構築部110根據該概率,替換至少1個選擇輸入變數與至少1個非選擇輸入變數。圖2(c)係將圖2(a)中表示之類似度之算出結果按照自相對於各選擇輸入變數類似度較高之非選擇輸入變數依序排列者。使用各非選擇輸入變數之類似度,將替換選擇輸入變數Xj (j=1、2、3)與非選擇輸入變數Xk (k=4~12)之概率Pjk 例如以如下之式(3)之方式設定。α係用於不替換之概率而設定之數值。變形模型構築部110根據以式(3)表示之概率替換選擇輸入變數與非選擇輸入變數。變形模型構築部110與式(2)同樣地構築變形模型,將該變形模型保存於模型資訊保存部104。根據該方法,與先前說明之方法相比,更忠實地反應類似度而構築變形模型。因此,與先前之方法相比,容易以相對於輸出變數之預測誤差更小之輸入變數X之組合構築變形模型。 或,作為第3種方法,變形模型構築部110亦可使用實驗計劃法構築變形模型。具體而言,變形模型構築部110首先如圖2(b)所表示般,抽取相對於各選擇輸入變數而類似度較高之非選擇輸入變數。其次,變形模型構築部110使用實驗計劃法,如圖3(a)所表示般作成正交表,基於該正交表依序構築變形模型。泛化能力算出部112針對基於正交表構築之各變形模型,如圖3(b)所表示般,算出泛化能力(MSE)。變形模型構築部110參照泛化能力之算出結果,算出替換變數之主要效果。而且,變形模型構築部110以泛化能力成為最高之方式,將複數個選擇輸入變數之至少一部分替換成主要效果最大之至少1個非選擇輸入變數而構築變形模型。變形模型構築部110將該變形模型輸出至外部。 於該方法中,變形模型構築部110亦可於作成正交表時,進行判定基於正交表構築之變形模型之數是否為規定數以下。於構築之變形模型之數為規定數以下之情形時,根據上述之方法進行變形模型之構築或主要效果之算出。於構築之變形模型之數超過規定數之情形時,模型構築系統1例如自外部輸出部114輸出錯誤,或切換成第1個或第2個方法而構築變形模型。 圖4係表示實施形態之模型構築方法之一例之流程圖。 圖5係表示實施形態之模型構築方法之另一例之流程圖。 於圖4表示之流程圖係對應於使用圖2(a)~圖2(c)說明之第1及第2個方法。圖5表示之流程圖係對應於使用圖3說明之第3個方法。 首先,對圖4表示之流程圖進行說明。 取得部100自規定數資料庫120及變數資料庫122取得規定數及變數資料(步驟S1)。基本模型構築部102選擇複數個輸入變數之一部分而構築基本模型(步驟S2)。基本模型構築部102將構築之基本模型之模型資訊保存於模型資訊保存部104(步驟S3)。 類似度算出部106算出用於基本模型之構築而選擇之複數個選擇輸入變數之各者與未選擇之複數個非選擇輸入變數之各者之間之類似度(步驟S4)。類似度算出部106將算出之該等變數間之類似度保存於類似度資訊保存部108(步驟S5)。變形模型構築部110將至少1個選擇輸入變數替換成與該至少1個選擇輸入變數類似度較高之非選擇輸入變數。變形模型構築部110基於替換後之選擇輸入變數群而構築變形模型(步驟S6)。 變形模型構築部110將構築之變形模型之模型資訊保存於模型資訊保存部104(步驟S7)。變形模型構築部110判定構築之模型數是否達到步驟S1取得之規定數(步驟S8)。於未達到規定數之情形時,重複步驟S6及S7直至達到規定數為止。 若構築之模型數達到規定數,則泛化能力算出部112自變數資料庫122取得用於算出構築之模型之泛化能力之變數資料(步驟S9)。又,泛化能力算出部112自模型資訊保存部104取得基本模型及變形模型之模型資訊,算出各模型之泛化能力(步驟S10)。外部輸出部114選擇泛化能力較高之模型並輸出至外部 (步驟S11)。 其次,基於圖5表示之流程圖進行說明。 與圖4表示之流程圖之步驟S1~S5同樣地執行步驟S1~S5。變形模型構築部110基於保存於類似度資訊保存部108之類似度而作成正交表(步驟S6)。變形模型構築部110判定基於正交表作成之變形模型之數是否為規定數以下(步驟S7)。於變形模型之數超過規定數之情形時,結束使用實驗計劃法之變形模型之構築。於變形模型之數為規定數以下之情形時,變形模型構築部110基於正交表而構築其他變形模型(步驟S8)。 變形模型構築部110將構築之變形模型之模型資訊保存於模型資訊保存部104(步驟S9)。泛化能力算出部112自變數資料庫122取得用於算出構築之模型之泛化能力之變數資料(步驟S10)。又,泛化能力算出部112自模型資訊保存部104取得基本模型及變形模型之模型資訊,算出各模型之泛化能力(步驟S11)。泛化能力算出部112參照泛化能力之算出結果,算出替換變數之主要效果(步驟S12)。變形模型構築部110將選擇輸入變數之至少一部分替換成主要效果最大之至少1個非選擇輸入變數而構築其他變形模型(步驟S13)。外部輸出部114將於步驟S13構築之其他變形模型作為泛化能力最高之模型輸出至外部 (步驟S14)。 圖6係例示用於實現實施形態之模型構築系統1之模型構築裝置2之構成之方塊圖。 模型構築裝置2例如具備輸入裝置200、輸出裝置202及電腦204。電腦204例如具有ROM(Read Only Memory,唯讀記憶體)206、RAM(Random Access Memory,隨機存取記憶體)208、CPU(Central Processing Unit:中央處理單元)210及記憶裝置HDD(Hard Disc Drive:硬碟驅動器)212。 輸入裝置200係供使用者用於對模型構築裝置2進行資訊輸入者。輸入裝置200為鍵盤或觸控面板等。 輸出裝置202係用於將藉由模型構築系統1獲得之輸出結果對使用者輸出者。輸出裝置202為顯示器或印表機等。 ROM206儲存有控制模型構築裝置2之動作之程式。ROM206儲存有用以使電腦204作為如圖1所表示之取得部100、基本模型構築部102、類似度算出部106、變形模型構築部110、泛化能力算出部112及外部輸出部114發揮功能之程式。 RAM208係作為將儲存於ROM206之程式展開之記憶區域而發揮功能。CPU210讀入儲存於ROM103之控制程式,根據該控制程式控制電腦204之動作。又,CPU210將藉由電腦204之動作而獲得之各種資料於RAM208展開。 HDD212收納圖1表示之規定數資料庫120及變數資料庫122。又,HDD212亦作為保存構築之模型或算出之類似度之模型資訊保存部104及類似度資訊保存部108發揮功能。 此處,對以上所說明之實施形態之效果進行說明。 根據本實施形態之模型構築系統1,首先,藉由基本模型構築部102,使用包含複數個選擇輸入變數之輸入變數群,構築可精度良好地預測輸出變數之基本模型。進而,藉由變形模型構築部110,基於複數個選擇輸入變數各者與複數個非選擇輸入變數各者之間之類似度,將複數個選擇輸入變數之至少一部分替換為複數個非選擇輸入變數之至少一部分。藉此,產生其他輸入變數群。使用該其他輸入變數群構築變形模型。藉由使用類似度替換複數個選擇輸入變數之至少一部分與複數個非選擇輸入變數之至少一部分,則使用上述其他輸入變數群構築之變形模型亦能以相對較高之精度預測輸出變數。而且,構築之基本模型及變形模型藉由泛化能力算出部112算出泛化能力。此時,藉由泛化能力算出部112算出之最高之泛化能力之模型係如上所述,能以相對較高之精度預測輸出變數。 即,根據本實施形態,可抑制精度降低並且可構築泛化能力較高之模型。 於選擇輸入變數與非選擇輸入變數之替換中,例如於圖2(a)及圖2(b)所表示,抽取特定閾值以上之非選擇輸入變數。而且,將抽取出之非選擇輸入變數根據概率替換成選擇輸入變數。根據該方法,由於僅將與選擇輸入變數類似度較高之非選擇輸入變數使用於變形模型之構築,故可抑制變形模型之精度下降。 或,如圖2(a)及圖2(c)所示,針對所有之非選擇輸入變數,設定基於類似度之替換之概率。亦可根據該概率而將複數個選擇輸入變數之至少一部分替換為複數個非選擇輸入變數之至少一部分。非選擇輸入變數之類似度越低,選擇輸入變數替換成該非選擇輸入變數之概率亦越為降低。因此,於該方法中,亦可抑制變形模型之精度下降。又,根據該方法,由於構築多種變形模型,故可構築泛化能力更高之模型。 或,亦可如圖3(a)及圖3(b)所表示般,基於正交表替換變數,算出泛化能力。以主要效果成為最高之方式將複數個選擇輸入變數之一部分替換為複數個非選擇輸入變數之至少一部分而構築變形模型。根據該方法,可抑制精度之降低並且可構築泛化能力更高之模型。又,根據該方法,無需針對選擇輸入變數與抽取之非選擇輸入變數之所有組合而構築變形模型,可更短時間且高效地構築高泛化能力之變形模型。 以下,針對具體之實施例進行說明。 (第1實施例) 於第1實施例中,於電子機器之製造裝置中,將加工後之工件之品質作為輸出變數。將設置於製造裝置之各種感測器之資料(溫度或壓力等)作為輸入變數。規定數設定為100。複數個輸入變數之選擇及基本模型之構築使用適應性最小絕對緊縮與選擇算子(Adaptive Lasso)。對於類似度,使用選擇輸入變數與非選擇輸入變數之間之相關係數。抽取相關係數為0.5以上之非選擇輸入變數,以統一之概率與選擇輸入變數進行替換。替換選擇輸入變數與非選擇輸入變數後之模型之構築使用複回歸。各模型係基於特定之構築期間T0之變數資料構築。泛化能力之算出係於相同之製造裝置中,使用構築期間T0之後之測試期間T1~T5之各期間之變數資料。 圖7係例示使用實施形態之模型構築系統1構築之模型之特性之曲線圖。 圖7(a)係表示各期間之R2 。圖7(b)係表示各期間之MSE。 於圖7(a)及圖7(b)中僅表示基本模型與泛化能力最高之變形模型。基本模型之結果係以〇(空心圓)表示。泛化能力最高之變形模型之結果以●(實心圓)表示。 自圖7(a)及圖7(b)之結果可知,變形模型與基本模型同樣,獲得較高之R2 及較小之MSE,且具有良好之精度。隨著測試期間向更未來推移,基本模型及變形模型之精度下降。於測試期間T4及T5中可知,變形模型之精度之下降與基本模型之精度之下降相比更緩慢,且具有更高之精度。即,自該結果可知,藉由本實施形態獲得之變形模型具有與基本模型大致相同之精度。進而,變形模型與基本模型相比相對於長期間之變數資料具有更高之精度,從而具備較高之泛化能力。 (實施例2) 於第2實施例中,於電子機器之製造裝置中,將加工後之工件之品質作為輸出變數。將設置於製造裝置之各種感測器之資料(加工時溫度或壓力等)作為輸入變數。品質係基於加工後之工件之尺寸及工件之加工率之至少任一者。規定數設定為1000。複數個輸入變數之選擇及基本模型之構築使用適應性最小絕對緊縮與選擇算子(Adaptive Lasso)。對於類似度,使用選擇輸入變數與非選擇輸入變數之間之相關係數。抽取相關係數為0.5以上之非選擇輸入變數,以統一之概率與選擇輸入變數進行替換。替換選擇輸入變數與非選擇輸入變數後之模型之構築使用複回歸。各模型係基於特定之構築期間T0之變數資料構築。泛化能力之算出係於相同之製造裝置中,使用構築期間T10之後之測試期間T11~T13之各期間之變數資料。 圖8係例示使用實施形態之模型構築系統1構築之模型之特性之曲線圖。 圖8(a)表示各期間之各模型之R2 。圖8(b)表示各期間之各模型之MSE。 於圖8(a)及圖8(b)中僅表示基本模型與泛化能力最高之變形模型。基本模型之結果係以〇(空心圓)表示。泛化能力最高之變形模型之結果以●(實心圓)表示。 自圖8(a)及圖8(b)之結果可知,於構築時,基本模型之R2 及MSE分別與變形模型之R2 及MSE大致相同。即,變形模型之精度與基本模型之精度相等。 而且,關於基本模型,隨著時間流逝,R2 越來越下降,且MSE越來越增大。與此相對,關於變形模型,R2 之下降於期間T12至T13停止。又,MSE自期間T12至T13下降。該等之結果表示,變形模型具有較高之精度,且變形模型之泛化能力較基本模型之泛化能力更高。 以上,雖例示了本發明之若干實施形態,但是此等實施形態僅係作為例示而提出者,並非意欲限制本發明之範圍。該等新穎實施形態可以其他各種形態實施,可於不脫離發明之主旨之範圍內進行各種省略、置換、變更等。該等實施形態及其變化例包含於發明之範圍及主旨,並且包含於申請專利範圍所記載之發明及其均等之範圍內。又,上述各實施形態係可互相組合而實施。本申請案以日本專利申請案2017-064791號(申請日:2017年3月29日)及日本專利申請案2017-249728(申請日2017年12月26日)為基礎,自該申請案享有優先利益。本申請案藉由參照該申請案而包含該申請案之所有內容。
1‧‧‧模型構築系統
2‧‧‧模型構築裝置
100‧‧‧取得部
102‧‧‧基本模型構築部
104‧‧‧模型資訊保存部
106‧‧‧類似度算出部
108‧‧‧類似度資訊保存部
110‧‧‧變形模型構築部
112‧‧‧泛化能力算出部
114‧‧‧外部輸出部
120‧‧‧規定數資料庫
122‧‧‧變數資料庫
200‧‧‧輸入裝置
202‧‧‧輸出裝置
204‧‧‧電腦
206‧‧‧ROM
208‧‧‧RAM
210‧‧‧CPU
212‧‧‧HDD
圖1係表示實施形態之模型構築系統之構成之方塊圖。 圖2(a)~(c)係說明實施形態之模型構築系統之處理之一例之圖。 圖3(a)、(b)係說明實施形態之模型構築系統之處理之一例之圖。 圖4係表示實施形態之模型構築方法之一例之流程圖。 圖5係表示實施形態之模型構築方法之另一例之流程圖。 圖6係例示用於實現實施形態之模型構築系統之模型構築裝置之構成之方塊圖。 圖7(a)、(b)係例示使用實施形態之模型構築系統構築之模型之特性之曲線圖。 圖8(a)、(b)係例示使用實施形態之模型構築系統構築之模型之特性之曲線圖。

Claims (9)

  1. 一種模型構築系統,其具備: 基本模型構築部,其構築表示輸入變數群與輸出變數之關係之基本模型,上述輸入變數群包含自複數個輸入變數中選擇之複數個選擇輸入變數; 類似度算出部,其算出複數個非選擇輸入變數與上述複數個選擇輸入變數之間之各者之類似度,上述複數個非選擇輸入變數包含於上述複數個輸入變數,上述複數個非選擇輸入變數與上述複數個選擇輸入變數不同; 變形模型構築部,其基於上述複數個類似度,將上述複數個選擇輸入變數中之至少一部分替換成上述複數個非選擇輸入變數之至少一部分而產生其他輸入變數群,構築表示上述其他輸入變數群與上述輸出變數之關係之變形模型;及 泛化能力算出部,其算出上述基本模型及上述變形模型之泛化能力。
  2. 如請求項1之模型構築系統,其中 上述複數個非選擇輸入變數之上述至少一部分之各者相對於上述複數個選擇輸入變數之至少1個具有特定之閾值以上之類似度。
  3. 如請求項2之模型構築系統,其中 上述變形模型構築部係 使用實驗計劃法作成正交表,上述正交表係關於上述複數個選擇輸入變數與上述複數個非選擇輸入變數之上述至少一部分,且 基於上述正交表而構築複數個上述變形模型,且 上述泛化能力算出部算出上述複數個變形模型各者之泛化能力, 上述變形模型構築部係 基於上述複數個泛化能力之算出結果而算出替換變數之主要效果, 以主要效果為最高之方式,將上述複數個選擇輸入變數之至少一部分替換為上述主要效果為最大之上述複數個非選擇輸入變數之至少一部分而構築其他變形模型。
  4. 如請求項1之模型構築系統,其中 上述變形模型構築部係 對於上述複數個選擇輸入變數各者,基於上述複數個類似度而設定替換為上述複數個非選擇輸入變數之各者之概率,且 根據上述複數個概率,將上述選擇輸入變數中之至少一部分替換成上述複數個非選擇輸入變數而構築上述變形模型。
  5. 如請求項1之模型構築系統,其進而具備將算出最高之上述泛化能力之上述基本模型或上述變形模型輸出至外部之外部輸出部。
  6. 一種模型構築方法,其構築表示輸入變數群與輸出變數之關係之基本模型,且上述輸入變數群包含自複數個輸入變數中選擇之複數個選擇輸入變數; 算出複數個非選擇輸入變數與上述複數個選擇輸入變數之間之各者之類似度; 基於上述複數個類似度,將上述複數個選擇輸入變數中之至少一部分替換成上述複數個非選擇輸入變數之至少一部分而產生其他輸入變數群,構築表示上述其他輸入變數群與輸出變數之關係之變形模型;及 算出上述基本模型及上述變形模型之泛化能力。
  7. 如請求項6之模型構築方法,其中 上述複數個非選擇輸入變數之上述至少一部分之各者相對於上述複數個選擇輸入變數之至少一者而具有特定閾值以上之類似度。
  8. 如請求項7之模型構築方法,其中 使用實驗計劃法作成正交表,上述正交表係關於上述複數個選擇輸入變數與上述複數個非選擇輸入變數之上述至少一部分,且 基於上述正交表而構築複數個上述變形模型, 上述泛化能力算出部係算出複數個上述變形模型之各者之泛化能力, 基於上述複數個泛化能力而算出替換變數之主要效果,且 以主要效果為最高之方式,將上述複數個選擇輸入變數之至少一部分替換為上述主要效果為最大之上述複數個非選擇輸入變數之至少一部分而構築其他變形模型。
  9. 如請求項6之模型構築方法,其中 對於上述複數個選擇輸入變數之各者,基於上述複數個類似度而設定替換為上述複數個非選擇輸入變數之各者之概率,且 根據上述複數個概率而將上述複數個選擇輸入變數之至少一部分替換為上述複數個非選擇輸入變數,構築上述變形模型。
TW107106843A 2017-03-29 2018-03-01 模型構築系統及模型構築方法 TWI677799B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2017-064791 2017-03-29
JP2017064791 2017-03-29
JP2017-249728 2017-12-26
JP2017249728A JP6767355B2 (ja) 2017-03-29 2017-12-26 モデル構築システムおよびモデル構築方法

Publications (2)

Publication Number Publication Date
TW201837761A TW201837761A (zh) 2018-10-16
TWI677799B true TWI677799B (zh) 2019-11-21

Family

ID=64018718

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107106843A TWI677799B (zh) 2017-03-29 2018-03-01 模型構築系統及模型構築方法

Country Status (2)

Country Link
JP (1) JP6767355B2 (zh)
TW (1) TWI677799B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7151604B2 (ja) * 2019-04-15 2022-10-12 日本電信電話株式会社 モデル学習装置、データ分析装置、モデル学習方法、及びプログラム
CN112464965B (zh) 2019-09-06 2024-06-21 富士通株式会社 估计模型的准确性和鲁棒性的方法及其装置
CN115879586B (zh) * 2022-01-11 2024-01-02 北京中关村科金技术有限公司 基于消融实验的投诉预测优化方法、装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060025925A1 (en) * 2004-07-28 2006-02-02 Hitachi, Ltd. Traffic information prediction device
TW200919613A (en) * 2007-09-11 2009-05-01 Advanced Micro Devices Inc Method and apparatus for dynamically determining tester recipes
US8473260B2 (en) * 2007-09-27 2013-06-25 Fujitsu Limited Model creation support system, model creation support method, and model creation support program
TW201506839A (zh) * 2013-03-15 2015-02-16 Proteus Digital Health Inc 基於多變量資料融合技術之狀態特徵化

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09167152A (ja) * 1995-12-19 1997-06-24 Hitachi Ltd 対話的モデル作成方法
JP2015087973A (ja) * 2013-10-31 2015-05-07 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 生成装置、生成方法、およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060025925A1 (en) * 2004-07-28 2006-02-02 Hitachi, Ltd. Traffic information prediction device
TW200919613A (en) * 2007-09-11 2009-05-01 Advanced Micro Devices Inc Method and apparatus for dynamically determining tester recipes
US8473260B2 (en) * 2007-09-27 2013-06-25 Fujitsu Limited Model creation support system, model creation support method, and model creation support program
TW201506839A (zh) * 2013-03-15 2015-02-16 Proteus Digital Health Inc 基於多變量資料融合技術之狀態特徵化

Also Published As

Publication number Publication date
JP6767355B2 (ja) 2020-10-14
JP2018169999A (ja) 2018-11-01
TW201837761A (zh) 2018-10-16

Similar Documents

Publication Publication Date Title
JP6562883B2 (ja) 特性値推定装置および特性値推定方法
TWI677799B (zh) 模型構築系統及模型構築方法
JP2022552980A (ja) 機械学習解釈可能性のためのシステム及び方法
US20180285317A1 (en) Model generation system and model generation method
US10445341B2 (en) Methods and systems for analyzing datasets
US11847389B2 (en) Device and method for optimizing an input parameter in a processing of a semiconductor
JP6484449B2 (ja) 予測装置、予測方法および予測プログラム
JP2017146888A (ja) 設計支援装置及び方法及びプログラム
WO2018001123A1 (en) Sample size estimator
KR102045415B1 (ko) 자동으로 최적의 통계 모델을 결정하는 방법 및 그 장치
WO2019111435A1 (ja) 異常判定装置、異常判定方法、及びプログラムが格納された非一時的なコンピュータ可読媒体
TWI557674B (zh) 品質管理裝置及其管理方法
JP2016045536A (ja) 設計支援装置
JP2024003643A (ja) ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム
KR101949448B1 (ko) 가우시안 프로세스 회귀분석을 이용한 클러스터링 방법 및 그 장치
JP3987059B2 (ja) 最適値探索支援装置、最適値探索支援方法、及び記録媒体
US11823083B2 (en) N-steps-ahead prediction based on discounted sum of m-th order differences
JP5600694B2 (ja) クラスタリング装置及び方法及びプログラム
JP7439923B2 (ja) 学習方法、学習装置及びプログラム
WO2023007848A1 (ja) データ解析方法、データ解析装置、及び、データ解析プログラム
JP7224263B2 (ja) モデル生成方法、モデル生成装置及びプログラム
KR20230031553A (ko) 데이터 탐색 방법 및 장치
JP7464891B2 (ja) トラフィック変動予測装置、及びトラフィック変動予測方法、並びにトラフィック変動予測プログラム
JP7010403B1 (ja) 情報処理装置及び情報処理方法
TWI713823B (zh) 模型構築系統及模型構築方法

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees