DE102014113988A1 - Erzeugungsvorrichtung, Erzeugungsverfahren und Programm - Google Patents

Erzeugungsvorrichtung, Erzeugungsverfahren und Programm Download PDF

Info

Publication number
DE102014113988A1
DE102014113988A1 DE201410113988 DE102014113988A DE102014113988A1 DE 102014113988 A1 DE102014113988 A1 DE 102014113988A1 DE 201410113988 DE201410113988 DE 201410113988 DE 102014113988 A DE102014113988 A DE 102014113988A DE 102014113988 A1 DE102014113988 A1 DE 102014113988A1
Authority
DE
Germany
Prior art keywords
model
input feature
unit
data
feature values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE201410113988
Other languages
English (en)
Inventor
Takayuki Katsuki
c/o IBM Corp. Morimura Tetsuro
c/o IBM Corp. Yanagisawa Hiroki
c/o IBM Corp. Tsuboi Yuta
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE102014113988A1 publication Critical patent/DE102014113988A1/de
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/14Travel agencies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

Problem
Ein abgeändertes Modell zu erzeugen, in dem ein durch Daten, die spezifisch für Trainingsdaten sind, verursachter Vorhersagefehler aus einem aus den Trainingsdaten erzeugten Vorhersagemodell verringert wird.
Mittel zum Lösen
Es werden eine Erzeugungsvorrichtung, die auf der Grundlage von Trainingsdaten ein Vorhersagemodell erzeugt, ein Erzeugungsverfahren und ein Programm bereitgestellt. Die Erzeugungsvorrichtung beinhaltet eine Modellerzeugungseinheit, die ein trainiertes Modell erzeugt, das durch Trainieren unter Verwenden der Trainingsdaten Ausgabemerkmalwerte aus Eingabemerkmalwerten vorhersagt, und eine Modellabänderungseinheit, die Grade von Auswirkungen einiger der Eingabemerkmalwerte in dem erzeugten trainierten Modell verringert und die ein abgeändertes Modell erzeugt, das tatsächlich für die Testdaten verwendet wird.

Description

  • Technisches Anwendungsgebiet
  • Die vorliegende Erfindung betrifft eine Erzeugungsvorrichtung, ein Erzeugungsverfahren und ein Programm.
  • Stand der Technik
  • In einem Vorhersageproblem nach dem Stand der Technik wird ein Vorhersagemodell beruhend auf Trainingsdaten erzeugt, und es werden tatsächliche, sich von den Trainingsdaten unterscheidende Daten auf das erzeugte Vorhersagemodell angewendet. Dann erhält man ein den tatsächlichen Daten entsprechendes Vorhersageergebnis (siehe zum Beispiel Patentliteratur 1 und 2).
  • Liste der zitierten Stellen
  • Patentliteratur
    • Ungeprüfte japanische Patentanmeldung mit der Veröffentlichungsnr. 2005-253708
    • Ungeprüfte japanische Patentanmeldung mit der Veröffentlichungsnr. 2013-140548
  • Kurzdarstellung der Erfindung
  • Technisches Problem
  • Wenn in derartigen Trainingsdaten in dem Vorhersageproblem jedoch konkrete Daten beinhaltet sind, die keinem vorherzusagenden Gebiet entsprechen, erhöht sich möglicherweise ein Fehler in einem durch das Vorhersagemodell erzeugten Vorhersageergebnis. Falls ein Vorhersagemodell für Hoteltarife und die Nachfrage zum Beispiel aus früheren Reservierungsinformationen der Hotels in einem ersten Gebiet erzeugt wird, und wenn Tarife und die Nachfrage für die Hotels in einem zweiten Gebiet unter Verwendung des Vorhersagemodells vorhergesagt werden, haben, wenn in den Trainingsdaten für das erste Gebiet spezifische (oder für die meisten Hotels nicht allgemein gültige) Daten beinhaltet sind, die spezifischen Daten möglicherweise eine Auswirkung auf einen Vorhersagefehler für die Hotels in dem zweiten Gebiet. Somit erhält man möglicherweise keine korrekten Vorhersageergebnisse.
  • Lösung des Problems
  • Gemäß einem ersten Aspekt der vorliegenden Erfindung werden eine Erzeugungsvorrichtung, ein Erzeugungsverfahren und ein Programm bereitgestellt. Die Erzeugungsvorrichtung beinhaltet eine Modellerzeugungseinheit und eine Modellabänderungseinheit. Die Modellerzeugungseinheit erzeugt ein trainiertes Modell, das durch Training unter Verwendung der Trainingsdaten aus Eingabemerkmalwerten Ausgabemerkmalwerte vorhersagt. Die Modellabänderungseinheit verringert Grade von Auswirkungen einiger der Eingabemerkmalwerte in dem erzeugten trainierten Modell und erzeugt ein abgeändertes Modell, das tatsächlich verwendet wird.
  • In der oben beschriebenen Zusammenfassung der vorliegenden Erfindung sind nicht alle der Merkmale der vorliegenden Erfindung aufgeführt. Eine Unterkombination aus den Merkmalen kann auch eine Erfindung darstellen.
  • Kurzbeschreibung der Zeichnungen
  • 1 veranschaulicht einen beispielhaften Überblick über Trainingsdaten und Testdaten in einem Vorhersageproblem gemäß der vorliegenden Ausführungsform.
  • 2 veranschaulicht eine beispielhafte Konfiguration einer Erzeugungsvorrichtung 100 gemäß der vorliegenden Ausführungsform.
  • 3 veranschaulicht eine beispielhafte Konfiguration eines Arbeitsablaufs der Erzeugungsvorrichtung 100 gemäß der vorliegenden Ausführungsform.
  • 4 veranschaulicht eine beispielhafte Abänderung der Erzeugungsvorrichtung 100 gemäß der vorliegenden Ausführungsform.
  • 5 veranschaulicht eine beispielhafte Hardware-Konfiguration eines als Erzeugungsvorrichtung 100 dienenden Computers 1900 gemäß der vorliegenden Ausführungsform.
  • Beschreibung von Ausführungsformen
  • Die vorliegende Erfindung wird nachfolgend unter Verwendung einer Ausführungsform der vorliegenden Erfindung beschrieben. Die Erfindung im Umfang der Ansprüche ist jedoch nicht auf die nachfolgend beschriebene Ausführungsform beschränkt. Außerdem sind nicht unbedingt alle Kombinationen der in der Ausführungsform beschriebenen Merkmale für die Lösung in der vorliegenden Erfindung erforderlich.
  • 1 veranschaulicht einen beispielhaften Überblick über Trainingsdaten und Testdaten in einem Vorhersageproblem gemäß der vorliegenden Ausführungsform. In einem Vorhersageproblem wird ein Vorhersagemodell unter Verwendung von in 1 veranschaulichten Trainingsdaten erzeugt. Dann werden in das erzeugte Vorhersagemodell sich von den Trainingsdaten unterscheidende Testdaten eingegeben, und man erhält ein den Testdaten entsprechendes Vorhersageergebnis.
  • Bei einer Zeitreihenvorhersage wird ein die Zukunft vorhersagendes Vorhersagemodell zum Beispiel beruhend auf Trainingsdaten erzeugt, für die Ergebnisse wie zum Beispiel frühere Daten bekannt sind, und man erhält ein Vorhersageergebnis durch das Eingeben von Daten in das Vorhersagemodell, für die kein Ergebnis bekannt ist, wie zum Beispiel tatsächliche oder zukünftige Daten. Die zukünftigen) Tarife und die Nachfrage für die Hotels in einem ersten Gebiet (zum Beispiel „Izu”) werden aus früheren Informationen über die Hotels in dem ersten Gebiet vorhergesagt, oder die zukünftige(n) Tarife und die Nachfrage für die Hotels in einem zweiten Gebiet (zum Beispiel „Atami”) werden aus früheren Informationen über die Hotels in dem ersten Gebiet vorhergesagt.
  • Für eine derartige Vorhersage verwendete Trainingsdaten beinhalten jedoch Daten mit hoher Allgemeingültigkeit, die zum Erzeugen eines Vorhersagemodells nützlich sind, d. h., Daten mit einem zukünftigen oder tatsächlichen Daten gemeinen Merkmal und Daten, die spezifisch für die Trainingsdaten sind, die sich von den zukünftigen oder tatsächlichen Daten unterscheiden. Außerdem können die zukünftigen oder tatsächlichen Daten spezifische Daten aufweisen. Es ist jedoch schwierig, vor einer Vorhersage vorab eine ausreichende Menge zukünftiger oder tatsächlicher Daten zu erhalten.
  • In der vorliegenden Ausführungsform wird ein Beispiel beschrieben, in dem ein Vorhersagemodell für Hoteltarife und die Nachfrage aus früheren Informationen über die Hotels in einem Gebiet A erzeugt wird und in dem Tarife und die Nachfrage für die Hotels in einem anderen Gebiet B vorhergesagt werden. In diesem Fall beinhalten die früheren Informationen (Trainingsdaten) über die Hotels in dem Gebiet A Daten mit hoher Allgemeingültigkeit, die nahe an Informationen über die Hotels in dem Gebiet B liegen (die zukünftigen oder tatsächlichen Daten), und Daten, die sich von den Informationen über die Hotels in dem Gebiet B unterscheiden und spezifisch für das Gebiet A sind.
  • Die für das Gebiet A spezifischen Daten geben zum Beispiel Hoteltarife und die Nachfrage an, die von den für das Gebiet A spezifischen Situationen (wie zum Beispiel der Landschaft und Ereignissen) abhängen. Ein Beispiel kann ein Fall darstellen, in dem in der Nähe eines bestimmten Hotels in dem Gebiet A an einem bestimmten Datum ein Feuerwerk stattfindet. Wenn ein Vorhersagemodell unter Verwendung derartiger für das Gebiet A spezifischer Daten erzeugt wird, tritt bei der Vorhersage der Tarife und der Nachfrage für die Hotels in dem Gebiet B ein Fehler auf. Deshalb ist es wünschenswert, derartige Daten bei dem Erzeugen des Vorhersagemodells zu löschen. Nach dem Stand der Technik ist das Löschen von lediglich spezifischen Daten jedoch schwierig, es sei denn, es sind Informationen über die Hotels in dem Gebiet B vorab bekannt.
  • Selbst wenn man annimmt, dass Daten spezifisch sind, ist ein Bestimmungskriterium darüber, ob die Daten zu löschen sind, unklar und hängt von der Erfahrung, einem Gefühl und dergleichen eines Benutzers ab. Wenn spezifische Daten vorhanden sind, ist es selbst für einen erfahrenen Benutzer schwierig, zu ermitteln, was aus den Daten zu löschen ist. Deshalb verringert eine Erzeugungsvorrichtung gemäß der vorliegenden Ausführungsform entsprechend eine durch spezifische Daten aus Trainingsdaten verursachte Auswirkung und erzeugt ein Vorhersagemodell, in dem ein Vorhersagefehler verringert wird.
  • 2 veranschaulicht eine beispielhafte Konfiguration einer Erzeugungsvorrichtung 100 gemäß der vorliegenden Ausführungsform. Die Erzeugungsvorrichtung 100 empfängt Trainingsdaten und erzeugt auf der Grundlage von den Trainingsdaten ein auf eine derartige Weise abgeändertes Vorhersagemodell, dass ein Vorhersagefehler verringert wird. Das heißt, die Erzeugungsvorrichtung 100 erzeugt Testdaten für das Testen eines trainierten Modells, das durch Lernen der empfangenen Trainingsdaten erhalten wurde, und ändert das trainierte Modell auf der Grundlage von dem Test des trainierten Modells ab. Die Erzeugungsvorrichtung 100 beinhaltet eine Erfassungseinheit 110, eine Speichereinheit 120, eine Modellerzeugungseinheit 130 und eine Modellabänderungseinheit 140.
  • Die Erfassungseinheit 110 gewinnt Trainingsdaten. Bei den Trainingsdaten handelt es sich zum Beispiel um Daten, die entsprechend ihrem Merkmal klassifiziert sind, und sie werden in einem Merkmalsvektor ausgedrückt, nachdem Eingabemerkmalwerte als Elemente empfangen wurden. Ein Merkmalsvektor ist zum Beispiel entsprechend seinem Merkmal klassifiziert, wie zum Beispiel im Falle eines Hotels einem Datum, der Anzahl der Gäste, Einrichtungen, einem Plan und Zimmerinformationen. In einem Merkmalsvektor ist jedes Merkmal weiter in Eingabemerkmalwerte unterteilt, und es wird ein dem Eingabemerkmalwert entsprechender spezifischer Wert als Element verwendet.
  • Das Merkmal eines Datums weist zum Beispiel Eingabemerkmalwerte wie zum Beispiel ein Datum der Unterbringung, einen Monat der Unterbringung und einen Wochentag als Elemente auf. Das Merkmal der Anzahl der Gäste weist Eingabemerkmalwerte wie zum Beispiel die Anzahl von Erwachsenen, die Anzahl von Kindern und die Anzahl von Kleinkindern als Elemente auf.
  • Die Trainingsdaten beinhalten Zielvektoren entsprechende Ausgabemerkmalwerte. Bei dem Ausgabemerkmalwert handelt es sich um einen den Elementen der Merkmalsvektoren entsprechenden Merkmalwert wie zum Beispiel einen Hoteltarif.
  • Die Erfassungseinheit 110 kann Trainingsdaten als Reaktion auf das direkte Eingeben von Eingabemerkmalwerten durch einen Benutzer gewinnen. Alternativ können Daten von Eingabemerkmalwerten, die in einem vorher festgelegten Format gespeichert sind, gelesen und gewonnen werden. Die Erfassungseinheit 110 kann mit einem Netzwerk oder dergleichen verbunden sein und die Trainingsdaten über das Netzwerk gewinnen. Die Erfassungseinheit 110 stellt der Speichereinheit 120 und der Modellerzeugungseinheit 130 die gewonnenen Trainingsdaten bereit.
  • Die Speichereinheit 120, die mit der Erfassungseinheit 110 verbunden ist, speichert die von der Erfassungseinheit 110 empfangenen Trainingsdaten. Die Speichereinheit 120 kann Vorhersagemodelle speichern, die in dem Prozess, in dem die Erzeugungsvorrichtung 100 ein Vorhersagemodell erzeugt, gewonnen wurden.
  • Die Modellerzeugungseinheit 130, die mit der Erfassungseinheit 110 verbunden ist, erzeugt ein trainiertes Modell, das durch Lernen unter Verwendung der von der Erfassungseinheit 110 empfangenen Trainingsdaten aus mehreren Eingabemerkmalwerten Ausgabemerkmalwerte vorhersagt. Die Modellerzeugungseinheit 130 erzeugt zum Beispiel auf der Grundlage von den Trainingsdaten und Daten von Ausgabemerkmalwerten, bei denen es sich um entsprechende Hotelunterbringungstarife handelt, ein trainiertes Modell, das Trainingsdaten verwendet, die spezifische Werte für frühere Reservierungsinformationsdaten von Hotels (ein Datum, die Anzahl von Gästen, Hotelattribute, Planattribute) als Eingabemerkmalsvektoren aufweisen, und das ein Vorhersageergebnis für einen entsprechenden Tarif (Ausgabemerkmalwert) ausgibt, wenn neue (zukünftige) Reservierungsinformationsdaten eingegeben werden.
  • Bei einem Ausgabemerkmalwert handelt es sich zum Beispiel um einen Eingabemerkmalwerten entsprechenden zukünftigen Merkmalwert (z. B. einen zukünftigen Tarif). Das heißt, in diesem Fall erzeugt die Modellerzeugungseinheit 130 eine Funktion f, so dass Hoteltarif = f(Datum, Anzahl von Gästen, Hotelattribute, Planattribute).
  • Die Modellerzeugungseinheit 130 erzeugt eine eine Eingabe/Ausgabe-Beziehung eindeutig darstellende Funktion als trainiertes Modell durch Lernen unter Verwendung von sämtlichen oder Teilen der empfangenen Trainingsdaten. Die Modellerzeugungseinheit 130 stellt der Modellabänderungseinheit 140 das erzeugte trainierte Modell bereit. Alternativ kann die Modellerzeugungseinheit 130 mit der Speichereinheit 120 verbunden sein. In diesem Fall wird das erzeugte trainierte Modell in der Speichereinheit 120 gespeichert, und die Modellabänderungseinheit 140 liest das trainierte Modell aus der Speichereinheit 120 aus.
  • Die Modellabänderungseinheit 140 verwendet Testdaten, die sich zumindest teilweise von den Trainingsdaten unterscheiden, zum Verringern der Grade der Auswirkungen einiger der Eingabemerkmalwerte in dem von der Modellerzeugungseinheit 130 erzeugten trainierten Modell und erzeugt ein abgeändertes Modell, das tatsächlich verwendet wird. Die Modellabänderungseinheit 140 erzeugt ein abgeändertes Modell, so dass eine durch eine Änderung in einigen der Eingabemerkmalwerte verursachte Änderung in dem Vorhersageergebnis verringert wird, wenn die Grade der Auswirkungen von den einigen der Eingabemerkmalwerte verringert werden.
  • Der Grad einer Auswirkung wird zum Beispiel unter Verwendung von Gewichtungskoeffizienten für Eingabemerkmalwerte in dem erzeugten trainierten Modell ermittelt. Ein Gewichtungswert liegt zum Beispiel zwischen 0 und 1. Je kleiner der Wert ist, desto kleiner ist eine Auswirkung, die von einem unter Verwendung des Werts gewichteten Eingabemerkmalwert auf das erzeugte trainierte Modell ausgeübt wird. Das heißt, in diesem Fall verringert die Modellabänderungseinheit 140 die Gewichtungswerte entsprechend einigen der Eingabemerkmalwerte, so dass die Gewichtungswerte nahe Null liegen. Entsprechend verringert die Modellabänderungseinheit 140 die Grade von durch die einigen der Merkmalwerte ausgeübten Auswirkungen auf das trainierte Modell, um aus dem trainierten Modell ein abgeändertes Modell zu erzeugen.
  • Die Modellabänderungseinheit 140 ändert zum Beispiel einen Gewichtungswert auf einen Wert, der gleich wie oder kleiner als die Hälfte ist. Die Modellabänderungseinheit 140 kann einen Gewichtungswert auf einen Wert ändern, der gleich wie oder kleiner als ein Viertel oder ein Achtel des Gewichtungswerts ist. Die Modellabänderungseinheit 140 kann einen zum Verringern des Grades einer Auswirkung verwendeten Parameter auf einen vorher festgelegten Wert setzen (z. B. den Durchschnitt, den Mindestwert oder einen spezifizierten Wert).
  • Die Modellabänderungseinheit 140 kann einige der Eingabemerkmalwerte in dem erzeugten trainierten Modell löschen und ein abgeändertes Modell erzeugen. Das heißt, die Modellabänderungseinheit 140 kann die Gewichtungen für einige der Eingabemerkmalwerte auf null setzen. Alternativ kann die Modellabänderungseinheit 140 für einige der Eingabemerkmalwerte die eingegebenen Objekte selbst löschen. Wenn das erzeugte abgeänderte Modell zum Erstellen einer Vorhersage verwendet wird, beseitigt folglich die Modellabänderungseinheit 140 eine durch eine Änderung in einigen der Merkmalwerte verursachte Änderung in dem Vorhersageergebnis. Die Modellabänderungseinheit 140 beinhaltet eine Testeinheit 142, eine Auswahleinheit 144 und eine Ermittlungseinheit 146.
  • Die Testeinheit 142 verwendet zum Testen des trainierten Modells Testdaten, die sich zumindest teilweise von Trainingsdaten unterscheiden. Die Testeinheit 142, die mit der Speichereinheit 120 verbunden ist, liest zum Beispiel die gespeicherten Trainingsdaten aus und verwendet einige der Trainingsdaten als Testdaten. Die Testeinheit 142 verwendet zum Beispiel einige der in den Trainingsdaten enthaltenen Merkmalsvektoren als Testdaten. Die Testeinheit 142 verwendet auch den einigen der Zielvektoren entsprechende Ausgabemerkmalwerte als Testdaten.
  • Die Testeinheit 142 wendet die Testdaten auf das durch die Modellerzeugungseinheit 130 erzeugte trainierte Modell an und testet das trainierte Modell. Die Testeinheit 142 berechnet das Vorhersageergebnis für die Testdaten, das erzeugt wird, wenn der Grad einer Auswirkung eines Eingabemerkmalwerts in dem trainierten Modell verringert wird. Die Testeinheit 142 verringert zum Beispiel nacheinander die Gewichtungen für die Eingabemerkmalwerte in dem trainierten Modell und berechnet entsprechend die entsprechenden Vorhersageergebnisse.
  • Die Auswahleinheit 144, die mit der Testeinheit 142 verbunden ist, wählt auf der Grundlage von dem Testergebnis des trainierten Modells einen Eingabemerkmalwert aus, für den der Grad der Auswirkung zu verringern ist. Die Auswahleinheit 144 verwendet die Testdaten zum Auswählen eines Eingabemerkmalwerts als Eingabemerkmalwert, für den der Grad der Auswirkung zu verringern ist, so dass man das näher an dem Ziel-Ausgabemerkmalwert liegende Vorhersageergebnis erhält, wenn der Grad einer Auswirkung in dem trainierten Modell verringert wird.
  • Die Ermittlungseinheit 146, die mit der Auswahleinheit 144 verbunden ist, ermittelt, ob die folgenden Arbeitsschritte fortlaufend durchgeführt werden: Ein Arbeitsschritt, in dem die Testeinheit 142 das Testen durchführt; und ein Arbeitsschritt, in dem die Auswahleinheit 144 das trainierte Modell durch Auswählen eines Eingabemerkmalwerts abändert, für den der Grad der Auswirkung zu verringern ist. Wenn die Genauigkeit des Modells, in dem die Grade der Auswirkungen von durch die Auswahleinheit 144 ausgewählten Eingabemerkmalwerten verringert werden, in einen vorher festgelegten Genauigkeitsbereich des trainierten Modells fallen, beendet die Ermittlungseinheit 146 das Abändern des trainierten Modells und gibt das abgeänderte Modell als abgeändertes Modell aus.
  • Die Erzeugungsvorrichtung 100 gemäß der oben beschriebenen vorliegenden Ausführungsform wendet auf das aus den Trainingsdaten erzeugte trainierte Modell sich von Trainingsdaten unterscheidende Testdaten an und verringert die Auswirkungen von Eingabemerkmalwerten in dem trainierten Modell, so dass man einen Vorhersagewert erhält, der näher an dem Zielwert der Testdaten liegt. Das heißt, die Erzeugungsvorrichtung 100 stellt fest, dass es sich bei einem Eingabemerkmalwert, der für die Trainingsdaten spezifisch ist und der verursacht, dass der Vorhersagewert sich weiter von dem Zielwert der Testdaten entfernt, um einen Eingabemerkmalwert handelt, der spezifische Daten verkörpert, die nicht für die Vorhersage geeignet sind, und verringert den Grad der Auswirkung in dem trainierten Modell.
  • 3 veranschaulicht eine beispielhafte Konfiguration eines Arbeitsablaufs der Erzeugungsvorrichtung 100 gemäß der vorliegenden Ausführungsform. Die Erfassungseinheit 110 gewinnt Trainingsdaten (S210). Die Erfassungseinheit 110 kann die Trainingsdaten durch eine Benutzereingabe gewinnen. Selbst wenn ein Benutzer vorher unklar ermittelt, ob es sich bei den Eingabedaten um spezifische Daten handelt, gibt ein Benutzer in diesem Fall in dieser Stufe vorzugsweise sämtliche gewonnene Daten ein.
  • Die Modellerzeugungseinheit 130 erzeugt ein trainiertes Modell entsprechend den gewonnenen Trainingsdaten (S220). Die Modellerzeugungseinheit 130 führt mit den Merkmalsvektoren eine lineare Regression/Klassenbildung, eine nichtlineare Regression/Klassenbildung und dergleichen durch und erzeugt ein trainiertes Modell. Die Modellerzeugungseinheit 130 ist mit der Speichereinheit 120 verbunden und kann das erzeugte trainierte Modell in der Speichereinheit 120 speichern.
  • Die Modellerzeugungseinheit 130 gewichtet zum Beispiel jeden der Eingabemerkmalwerte oder einen durch Anwenden einer ersten vorher festgelegten Funktion auf jeden der Eingabemerkmalwerte gewonnenen Wert mit einer entsprechenden der zu trainierenden Gewichtungen und wandelt sie unter Verwendung einer zweiten vorher festgelegten Funktion um, wodurch ein trainiertes Modell erzeugt wird, das für einen Ausgabemerkmalwert einen Vorhersagewert berechnet. Die Modellerzeugungseinheit 130 kann ein Verfahren verwenden, das auf einem verallgemeinerten linearen Modell, auf einer als nichtlineare Erweiterung des verallgemeinerten linearen Modells dienende Kernel-Regression/Klassenbildung und auf einem Modell mit Regularisierung für das verallgemeinerte lineare Modell beruht. In diesem Fall kann die Modellerzeugungseinheit 130 abhängig von den verwendeten Modellen die ermittelte erste und zweite Funktion verwenden.
  • Alternativ kann die Modellerzeugungseinheit 130 ein trainiertes Modell erzeugen, das einen Vorhersagewert berechnet, der je nachdem, ob die Eingabemerkmalwerte die zu trainierende Kondition erfüllen, unterschiedlich ist. Das heißt, die Modellerzeugungseinheit 130 kann Verfahren wie zum Beispiel einen Regressionsbaum/Entscheidungsbaum und zufällige Gesamtstrukturen (random forests) verwenden, bei denen es sich um ein kollektives Lernverfahren für einen Regressionsbaum/Entscheidungsbaum handelt.
  • Die Modellerzeugungseinheit 130 verwendet zum Beispiel alle der durch die Erfassungseinheit 110 gewonnenen Daten als Trainingsdaten zum Erzeugen eines trainierten Modells. Alternativ kann die Modellerzeugungseinheit 130 einige der gewonnenen Daten als Trainingsdaten zum Erzeugen eines trainierten Modells verwenden. Die Modellerzeugungseinheit 130 erzeugt eine Funktion f, die als trainiertes Modell Ausgabemerkmalwerte vorhersagt.
  • Die Trainingsdaten beinhalten Daten mit hoher Allgemeingültigkeit, die nahe an Informationen über die Hotels in dem Gebiet B liegen, und Daten, die spezifisch für das Gebiet A sind und sich von den Informationen über die Hotels in dem Gebiet B unterscheiden. Bei dem trainierten Modell handelt es sich um ein durch das Lernen derartiger Trainingsdaten erzeugtes Modell. Deshalb erzeugt das Vorhersagen von Informationen über die Hotels in dem Gebiet B unter Verwendung eines derartigen trainierten Modells einen großen Fehler.
  • Die Trainingsdaten können Daten mit hoher Allgemeingültigkeit beinhalten, die nahe an zukünftigen Informationen über die Hotels in dem Gebiet A liegen, und sie können auch Daten beinhalten, die spezifisch für die früheren Informationen für das Gebiet A sind und sich von den zukünftigen Informationen über die Hotels in dem Gebiet A unterscheiden. Bei dem trainierten Modell handelt es sich um ein durch das Lernen derartiger Trainingsdaten erzeugtes Modell. Deshalb erzeugt das Vorhersagen von zukünftigen Informationen oder dergleichen für das Gebiet A unter Verwendung des trainierten Modells einen großen Fehler.
  • Wenn andere Informationen als die Trainingsdaten wie zum Beispiel Testdaten für das Vorhersagen von Informationen über die Hotels in dem Gebiet B und Testergebnisse (d. h. Vorhersagen entsprechende Zielwerte) vorab gewonnen werden, kann zum geeigneten Trainieren eines Vorhersagemodells auf der Grundlage von derartigen Informationen ein Verfahren nach dem Stand der Technik wie zum Beispiel Übertragungslernen (transfer learning) verwendet werden. Wenn die Erfassungseinheit 110 jedoch lediglich die Trainingsdaten gewinnt, kann ein derartiges Verfahren nach dem Stand der Technik nicht verwendet werden.
  • Die Modellabänderungseinheit 140 nimmt einen Eingabemerkmalwert an, der spürbar durch spezifische Daten beeinflusst ist, und verringert die Auswirkung des angenommenen Eingabemerkmalwerts, um ein abgeändertes Modell zu erzeugen. Das heißt, die Testeinheit 142 verwendet die durch die Erfassungseinheit 110 gewonnenen Daten zum Testen des trainierten Modells (S230).
  • Die Testeinheit 142 verwendet zum Beispiel einige in den Trainingsdaten enthaltene Merkmalsvektoren als Testdaten. Wenn die Modellerzeugungseinheit 130 das trainierte Modell unter Verwendung von einigen der gewonnenen Daten als Trainingsdaten erzeugt, kann die Testeinheit 142 Daten als Testdaten verwenden, zu denen die restlichen Daten gehören. In diesem Fall kann die Testeinheit 142 die Trainingsdaten und die Testdaten verwenden, die sich nicht gegenseitig überschneiden. Das heißt, die Trainingsdaten können sich von den Testdaten unterscheiden. Alternativ kann die Testeinheit 142 die Trainingsdaten und die Testdaten verwenden, die sich gegenseitig überschneiden.
  • Die Testeinheit 142 wendet die Testdaten, die sich zumindest teilweise von den Trainingsdaten unterscheiden, auf das trainierte Modell an und berechnet einen Vorhersagewert für einen Ausgabemerkmalwert, der den Testdaten entspricht. Die Testeinheit 142 vergleicht den Ausgabemerkmalwert (d. h. den Zielwert) der Testdaten mit dem Vorhersageergebnis.
  • In den Trainingsdaten handelt es sich bei den für das Gebiet A spezifischen Daten im Vergleich zu den Daten mit hoher Allgemeingültigkeit um außergewöhnliche Daten wie zum Beispiel Daten für den Fall, in dem ein nur in dem Gebiet stattfindendes Ereignis zu einer Erhöhung der Hoteltarife führt, Daten für den Fall, in dem eine Reisezeit für ein für das Gebiet spezifisches Gebiet mit Sehenswürdigkeiten zu einer Erhöhung der Hotelnachfrage führt, oder Daten für den Fall, in dem eine in dem Gebiet unerwartet auftretende Katastrophe oder dergleichen dazu führt, dass die Hotels nicht betrieben werden. Das heißt, es wird erwartet, dass derartige außergewöhnliche Daten einen großen Vorhersagefehler in dem trainierten Modell erzeugen.
  • Wenn die Trainingsdaten oder/und die Testdaten derartige außergewöhnliche Daten beinhalten, weist deshalb das Vorhersageergebnis für den Testdaten entsprechende Ausgabemerkmalwerte, das man durch Vorhersage unter Verwendung des trainierten Modells erhält, einen großen Fehler hinsichtlich des Ausgabemerkmalwerts in den Testdaten auf. In dem Fall, in dem zumindest die Trainingsdaten keine derartigen spezifischen Daten beinhalten, ist im Gegensatz dazu, selbst wenn die sich von den Trainingsdaten unterscheidenden Testdaten verwendet werden, ein Fehler zwischen dem Vorhersageergebnis aus dem trainierten Modell und dem Ausgabemerkmalwert in den Testdaten schlimmstenfalls klein im Vergleich zu dem Fall, in dem spezifische Daten beinhaltet sind.
  • Wenn zum Beispiel ein Merkmalsvektor, in dem ein Ergebnis, in dem sich die Erhöhung der Hoteltarife aufgrund eines für das Gebiet spezifischen, speziellen Ereignisses, das an einem bestimmten Unterbringungsdatum stattfindet, widerspiegelt, in den in den Trainingsdaten beinhalteten Merkmalsvektoren beinhaltet ist, erzeugt die Modellerzeugungseinheit 130 ein trainiertes Modell, das ein Vorhersageergebnis ausgibt, in dem sich derartige spezifische Daten widerspiegeln. Wenn keine derartigen spezifischen Daten beinhaltende Testdaten ersetzt und auf das trainierte Modell angewendet werden, tritt zwischen dem Vorhersageergebnis und dem Ausgabemerkmalwert in den Testdaten ein Fehler auf.
  • Das heißt, bei dem Fehler zwischen dem Vorhersageergebnis und dem Ausgabemerkmalwert in den Testdaten handelt es sich um ein Ergebnis, in dem sich eine Auswirkung der sich von den Testdaten unterscheidenden spezifischen Trainingsdaten widerspiegelt. Deshalb verwendet die Testeinheit 142 den Ausgabemerkmalwert in den Testdaten als Zielvorhersageergebnis, berechnet einen Fehler zwischen dem Ziel- und dem Vorhersageergebnis aus dem trainierten Modell und testet eine Auswirkung der in den sich von den Testdaten unterscheidenden Daten beinhalteten spezifischen Daten.
  • Konkret berechnet die Testeinheit 142 einen Fehler in den Testdaten zwischen einem Vorhersageergebnis, das man erhält, wenn die Gewichtungen für die Eingabemerkmalwerte in dem trainierten Modell nacheinander verringert werden, und dem Zielvorhersageergebnis. Das heißt, die Testeinheit 142 berechnet zum Beispiel einen Fehler zwischen einem den Testdaten entsprechenden Vorhersageergebnis, das man erhält, wenn eine dem Eingabemerkmalwert des „Unterbringungsdatums” in dem trainierten Modell entsprechende Gewichtung verringert wird, und dem Zielvorhersageergebnis. Dann berechnet die Testeinheit 142 einen Fehler zwischen einem den Testdaten entsprechenden Vorhersageergebnis, das man erhält, wenn eine dem Eingabemerkmalwert des „Unterbringungsmonats” in dem trainierten Modell entsprechende Gewichtung verringert wird, und dem Zielvorhersageergebnis.
  • Somit verringert die Testeinheit 142 die Gewichtung für jeden der Eingabemerkmalwerte in dem trainierten Modell und berechnet einen Fehler zwischen einem entsprechenden Vorhersageergebnis und dem Zielvorhersageergebnis. Wünschenswerterweise verringert die Testeinheit 142 nacheinander die allen der Eingabemerkmalwerte entsprechenden Gewichtungen und berechnet einen Fehler zwischen einem entsprechenden Vorhersageergebnis und dem Zielvorhersageergebnis. Wenn die Testdaten mehrere Merkmalsvektoren beinhalten, wendet die Testeinheit 142 jeden der Merkmalsvektoren auf das trainierte Modell an, verringert nacheinander die den Eingabemerkmalwerten entsprechenden Gewichtungen und berechnet einen Fehler zwischen einem entsprechenden Vorhersageergebnis und dem Zielvorhersageergebnis.
  • Die Auswahleinheit 144 wählt auf der Grundlage von dem durch die Testeinheit 142 berechneten Fehler einen Eingabemerkmalwert aus, für den der Grad der Auswirkung zu verringern ist (S240). Für Testdaten wählt die Auswahleinheit 144 zum Beispiel einen Eingabemerkmalwert als Eingabemerkmalwert, für den der Grad der Auswirkung zu verringern ist, aus, der einen kleineren Fehler zwischen dem Vorhersageergebnis und dem Ziel-Ausgabemerkmalwert erzeugt, wenn der Grad der Auswirkung in dem trainierten Modell verringert wird. Das heißt, die Auswahleinheit 144 nimmt an, dass der Eingabemerkmalwert (z. B. das Unterbringungsdatum), für den eine Verringerung des Grades der Auswirkung einen kleineren Fehler verursacht, die spezifischen Trainingsdaten verkörpert, die nicht in den Testdaten des trainierten Modells beinhaltet sind, und wählt den Eingabemerkmalwert als Eingabemerkmalwert aus, für den der Grad der Auswirkung zu verringern ist.
  • Wenn die Testdaten mehrere Merkmalsvektoren beinhalten, wählt die Auswahleinheit 144 einen Eingabemerkmalwert, für den eine Verringerung des Grades der Auswirkung den kleinsten Fehler unter den durch die Testeinheit 142 berechneten Fehlern für die Merkmalsvektoren verursacht, als einen Eingabemerkmalwert aus, für den der Grad der Auswirkung zu verringern ist. Alternativ kann die Auswahleinheit 144 den Durchschnitt der Fehler für die mehreren Merkmalsvektoren gewinnen und einen Eingabemerkmalwert, für den eine Verringerung des Grades der Auswirkung einen kleineren Fehler im Sinne einer Statistik verursacht, wie zum Beispiel den durchschnittlichen Fehler oder andere Medianwerte als Eingabemerkmalwert auswählen, für den der Grad des Fehlers zu verringern ist.
  • Die Ermittlungseinheit 146 ermittelt, ob das trainierte Modell fortlaufend abzuändern ist (d. h., es ist ein Eingabemerkmalwert anzugeben, für den der Grad der Auswirkung zu verringern oder zu löschen ist), abhängig davon, ob die Genauigkeit des Vorhersageergebnisses des Vorhersagemodells verbessert wird, in dem eine dem ausgewählten Eingabemerkmalwert entsprechende Gewichtung verringert wird. Wenn ein Fehler zwischen einem Vorhersageergebnis des Vorhersagemodells und dem Ziel-Ausgabemerkmalwert zum Beispiel nicht in einen vorher festgelegten Fehlerbereich fällt, führt die Ermittlungseinheit 146 wiederholt den Schritt S230, in dem das trainierte Modell getestet wird, und den Schritt S240 durch, in dem ein Eingabemerkmalwert ausgewählt wird. Das heißt, die Ermittlungseinheit 146 veranlasst die Auswahleinheit 144 dazu, weiter einen Eingabemerkmalwert auszuwählen, für den der Grad der Auswirkung zu verringern ist, bis man ein abgeändertes Modell erhält, in dem die Genauigkeit des trainierten Modells verbessert wird.
  • In diesem Fall verringert die Auswahleinheit 144 fortlaufend die Grade der Auswirkungen durch Verwenden des trainierten Modells als anfängliches Vorhersagemodell, wodurch ein Eingabemerkmalwert ausgewählt wird, so dass das Vorhersageergebnis näher an dem Ziel-Ausgabemerkmalwert liegt. Jedes Mal dann, wenn ein Eingabemerkmalwert ausgewählt wird, verringert die Testeinheit 142 entsprechend den Grad der Auswirkung des ausgewählten Eingabemerkmalwerts in dem Vorhersagemodell, um ein abgeändertes Modell zu erzeugen. Das heißt, die Testeinheit 142 verringert den Wert der Gewichtung für den ausgewählten Eingabemerkmalwert in dem trainierten Modell.
  • Das heißt, die Auswahleinheit 144 wählt einen Eingabemerkmalwert aus, für den der Grad der Auswirkung in dem trainierten Modell zu verringern ist (S240). Wenn die Ermittlungseinheit 146 feststellt, dass das trainierte Modell fortlaufend abzuändern ist, stellt die Auswahleinheit 144 der Testeinheit 142 Informationen über den Eingabemerkmalwert bereit, für den der Grad der Auswirkung zu verringern ist. Die Testeinheit 142 ändert das Vorhersagemodell als neues trainiertes Modell so ab, dass die Gewichtung für den ausgewählten Eingabemerkmalwert verringert wird, und testet das abgeänderte trainierte Modell (S230). Die Testeinheit 142 kann das in der Speichereinheit 120 gespeicherte trainierte Modell abändern. Alternativ kann ein sich von dem in der Speichereinheit gespeicherten trainierten Modell unterscheidendes abgeändertes trainiertes Modell gespeichert werden.
  • Die Testeinheit 142 berechnet ein Vorhersageergebnis, das man erhält, wenn die Grade der Auswirkungen der Eingabemerkmalwerte, die nicht vor dem Abändern des trainierten Modells von der Auswahleinheit 144 ausgewählt wurden, nacheinander verringert werden, und berechnet ebenfalls einen Fehler zwischen dem Ziel- und dem Vorhersageergebnis in dem abgeänderten trainierten Modell. Die Auswahleinheit 144 wählt einen Eingabemerkmalwert aus, für den der Grad der Auswirkung in dem abgeänderten trainierten Modell zu verringern ist (S240). Die Ermittlungseinheit 146 führt wiederholt so lange die Schritte S230 und S240 durch, bis ein Fehler zwischen dem Vorhersageergebnis des Vorhersagemodells, in dem der Grad der Auswirkung des ausgewählten Eingabemerkmalwerts in dem trainierten Modell verringert wird, und dem Ziel-Ausgabemerkmalwert in einen vorher festgelegten Fehlerbereich fällt.
  • Wenn ein Fehler zwischen dem Vorhersageergebnis des Vorhersagemodells und dem Ziel-Ausgabemerkmalwert in den vorher festgelegten Fehlerbereich fällt, stellt die Ermittlungseinheit 146 fest, dass die Vorhersagegenauigkeit des trainierten Modells verbessert ist, und gibt das Vorhersagemodell als abgeändertes Modell aus. Durch das Durchführen des oben beschriebenen Arbeitsablaufs erhält die Erzeugungsvorrichtung 100 gemäß der vorliegenden Ausführungsform ein abgeändertes Modell, in dem der Grad der Auswirkung der spezifischen Daten in den Trainingsdaten verringert wird, und in dem der Grad der Auswirkung der Daten mit hoher Allgemeingültigkeit relativ erhöht wird. Durch Eingeben von Daten beruhend auf einem anderen Gebiet oder der Zukunft in das abgeänderte Modell kann man deshalb ein Vorhersageergebnis mit hoher Genauigkeit für das andere Gebiet oder die Zukunft erhalten.
  • Die Erzeugungsvorrichtung 100 kann aus von der Erfassungseinheit 110 gewonnenen Daten Trainingsdaten und Testdaten erzeugen und das trainierte Modell testen. Das heißt, die Erzeugungsvorrichtung 100 kann das trainierte Modell abändern, ohne Trainingsdaten oder Daten wie zum Beispiel Testdaten und Zielwerte zu verwenden.
  • Selbst wenn ein Benutzer vorher feststellt, dass es sich bei einem Eingabemerkmalwert um spezifische Daten handelt, ist es vorzuziehen, dass die Erzeugungsvorrichtung 100 es wagt, den Eingabemerkmalwert als Trainingsdaten zu verwenden, um einen Test durchzuführen. Das heißt, wenn das tatsächliche Verwenden von Daten als Daten mit hoher Allgemeingültigkeit, die vorher als spezifisch festgestellt wurden, möglich ist, wird durch Verwenden einer unklaren Feststellung wie zum Beispiel das Verwenden von Erfahrung und eines Gefühls eines Benutzers, dass derartige Daten spezifisch sind, ein Löschen derartiger Daten verhindert.
  • Es wird die Erzeugungsvorrichtung 100 gemäß der vorliegenden, oben beschriebenen Ausführungsform beschrieben, die eine Gewichtung für einen Eingabemerkmalwert verringert, für den der Grad der Auswirkung zu verringern ist. Alternativ kann die Erzeugungsvorrichtung 100 die Gewichtung auf null setzen oder das Element für den Eingabemerkmalwert löschen und ignorieren. Somit kann die Erzeugungsvorrichtung 100 die Auswirkung eines für spezifische Daten gehaltenen Eingabemerkmalwerts beseitigen und die Auswirkung von Daten mit hoher Allgemeingültigkeit relativ erhöhen.
  • In der Beschreibung der Erzeugungsvorrichtung 100 gemäß der vorliegenden, oben beschriebenen Ausführungsform ist ein Beispiel gegeben, in dem die Auswahleinheit 144 Eingabemerkmalwerte auswählt, für welche die Grade der Auswirkungen nacheinander zu verringern sind. Alternativ kann die Auswahleinheit 144 Änderungen bei Fehlern zwischen einem Vorhersageergebnis, das man erhält, wenn eine Gewichtung verringert wird, und dem Ziel-Ausgabemerkmalwert in absteigender Reihenfolge einstufen und Eingabemerkmalwerte in einem Bereich von der ersten Größenordnung zu der vorher festgelegten Größenordnung als Eingabemerkmalwerte auswählen, für welche die Grade der Auswirkungen zu verringern sind. Während die Gewichtungen für die ausgewählten Eingabemerkmalwerte verringert, ändert die Modellabänderungseinheit 140 somit das trainierte Modell ab, wodurch eine Verringerung der Zeit erreicht wird, die benötigt wird, bis die Vorhersagegenauigkeit verbessert wird.
  • In der Erzeugungsvorrichtung 100 gemäß der vorliegenden, oben beschriebenen Ausführungsform ermittelt die Ermittlungseinheit 146 beruhend darauf, ob ein Fehler zwischen einem Vorhersageergebnis des Vorhersagemodells und dem Ziel-Ausgabemerkmalwert in einen vorher festgelegten Fehlerbereich fällt, ob das trainierte Modell fortlaufend abzuändern ist. Alternativ kann die Ermittlungseinheit 146 das Abändern des trainierten Modells als Reaktion auf einen Zustand beenden, in dem ein Fehler zwischen einem Vorhersageergebnis und dem Ziel-Ausgabemerkmalwert nicht verringert wird, selbst wenn das trainierte Modell fortlaufend abgeändert wird. Somit kann die Ermittlungseinheit 146 ermitteln, ob das Abändern des trainierten Modells konvergent verläuft.
  • Alternativ kann die Ermittlungseinheit 146 das Abändern des trainierten Modells beenden, nachdem die Ermittlungseinheit 146 Arbeitsschritte in den Schritten S230 und S240 mehrere Male durchgeführt hat, wobei die Anzahl der Wiederholungen vorher festgelegt ist. Die Ermittlungseinheit 146 kann das Abändern des trainierten Modells beenden, wenn ein Eingabemerkmalwert, für den der Grad der Auswirkung zu verringern ist, nicht gefunden wird.
  • In der Beschreibung der Erzeugungsvorrichtung 100 gemäß der vorliegenden, oben beschriebenen Ausführungsform ist der Fall gegeben, in dem die Modellerzeugungseinheit 130 zum Erzeugen eines trainierten Modells eine lineare Regression/Klassenbildung durchführt. Alternativ kann die Modellerzeugungseinheit 130 zum Erzeugen eines trainierten Modells ein anderes allgemeines Verfahren wie zum Beispiel eine nichtlineare Regression/Klassenbildung durchführen.
  • In diesem Fall, zum Beispiel in dem Fall, in dem es von einem ausgewählten Eingabemerkmalwert in dem trainierten Modell abhängt, ob eine durch Training erhaltene Kondition erfüllt wird, nimmt die Testeinheit 142 an, dass die Kondition unabhängig von einem ausgewählten Eingabemerkmalwert erfüllt wird, wenn zumindest entweder in den Trainingsdaten oder/und den Testdaten die Häufigkeit, mit der die Kondition erfüllt wird, höher ist als die Häufigkeit, mit der die Kondition nicht erfüllt wird. Die Testeinheit 142 ändert das trainierte Modell so ab, dass die Kondition unabhängig von einem ausgewählten Eingabemerkmalwert nicht erfüllt wird, wenn die Häufigkeit, mit der die Kondition nicht erfüllt wird, höher ist als die Häufigkeit, mit der die Kondition erfüllt wird, und erzeugt ein abgeändertes Modell.
  • Es wird ein Beispiel eines auf Bäumen beruhenden, in der Modellerzeugungseinheit 130 erzeugten Regressionsmodells beschrieben. Wenn eine Kondition gC(x1, x2, x3) gleich 1 ist (gC(x1, x2, x3) == 1), wobei es sich bei x1, x2 und x3 um Eingabemerkmalwerte handelt, gibt die Modellerzeugungseinheit 130 y beruhend auf der Funktion fC(Ytrain, x1, x2, x3) aus.
  • In diesem Fall löscht die Testeinheit 142 x2 (verringert den Grad der Auswirkung des Eingabemerkmalwerts x2) und setzt die Kondition des abgeänderten Trainingsmodells auf eine Kondition g'0(X1, X3) == 1, wenn die Häufigkeit, mit der eine Kondition g0(X1, x2, X3) gleich 1 ist (g0(X1, x2, X3) == 1) höher ist, als die Kondition g0(X1, x2, X3) gleich 0 ist (g0(X1, x2, X3) == 0), und die Ausgabe y für X1 und X3 konstant ist. Wenn die Häufigkeit, mit der die Kondition g0(X1, x2, X3) gleich 1 ist, niedriger ist, als die Häufigkeit, mit der g0(X1, x2, X3) gleich 0 ist, setzt die Testeinheit 142 die Kondition des abgeänderten trainierten Modells auf eine Kondition g'0(X1, X3) == 0.
  • Somit kann die Modellabänderungseinheit 140 für das durch das Durchführen eines Verfahrens wie zum Beispiel einer nichtlinearen Regression/Klassenbildung erzeugte trainierte Modell einen Eingabemerkmalwert auswählen und so abändern, dass das unter Verwendung der Testdaten erzeugte Vorhersageergebnis näher an dem Ausgabemerkmalwert liegt, und kann ein abgeändertes Modell erzeugen.
  • In der Beschreibung der Erzeugungsvorrichtung 100 gemäß der vorliegenden, oben beschriebenen Ausführungsform ist ein Beispiel gegeben, in dem die Auswahleinheit 144 einen Eingabemerkmalwert auswählt, für den der Grad der Auswirkung zu verringern ist. Alternativ kann die Erzeugungsvorrichtung 100 einem Benutzer Änderungen bei Fehlern, die hinsichtlich des den Eingabemerkmalwerten entsprechenden Zielwerts auftreten, und die von der Testeinheit 142 berechnet werden, auf eine Weise anzeigen, dass die Änderungen mit den Eingabemerkmalwerten verbunden sind, für welche die Grade der Auswirkungen verringert wurden. Dann kann der Benutzer einen Eingabemerkmalwert auswählen, für den der Grad der Auswirkung zu verringern ist. In diesem Fall kann der Benutzer mehrere Eingabemerkmalwerte auswählen.
  • Somit kann ein Benutzer Änderungen bei Fehlern prüfen, die auftreten, wenn die Auswirkungen der Eingabemerkmalwerte verringert werden, und einen Eingabemerkmalwert auswählen, für den der Grad der Auswirkung nach dem Prüfen zu verringern ist. Deshalb kann die Erzeugungsvorrichtung 100 gemäß der vorliegenden Ausführungsform einen Benutzer dazu veranlassen, ein Auswählen beruhend auf dem objektiven Indikator durchzuführen, und kann einen von Erfahrung und einem Gefühl eines Benutzers abhängenden Aufwand verringern.
  • 4 veranschaulicht eine beispielhafte Abänderung der Erzeugungsvorrichtung 100 gemäß der vorliegenden Ausführungsform. In der Erzeugungsvorrichtung 100 der abgeänderten Ausführungsform sind Komponenten, die eine Funktion aufweisen, die im Wesentlichen gleich ist wie die der Erzeugungsvorrichtung 100 gemäß der in 2 veranschaulichten vorliegenden Ausführungsform, mit identischen Bezugszahlen bezeichnet und werden nicht beschrieben. Die Erzeugungsvorrichtung 100 der abgeänderten Ausführungsform beinhaltet ferner eine Vorhersageeinheit 150.
  • Die Vorhersageeinheit 150 gibt in das abgeänderte Modell einen Eingabemerkmalwert ein, der nicht gelöscht wurde und der sich unter den mehreren Eingabemerkmalwerten befindet, und berechnet einen Vorhersagewert. Das heißt, die Vorhersageeinheit 150, die mit der Modellabänderungseinheit 140 verbunden ist, berechnet Ausgabemerkmalwerte unter Verwendung des von der Modellabänderungseinheit 140 empfangenen abgeänderten Modells.
  • Die Vorhersageeinheit 150 gibt zum Beispiel Daten ein, bei denen sich einige der Eingabemerkmalwerte wie zum Beispiel ein Datum, die Anzahl von Gästen, Einrichtungen und ein Plan von den Trainingsdaten unterscheiden, und berechnet Ausgabemerkmalwerte. Selbst wenn ein Eingabemerkmalwert, für den der Grad der Auswirkung auf null gesetzt ist oder durch die Modellabänderungseinheit 140 gelöscht wird, abgeändert und eingegeben wird, spiegelt das Ergebnis in diesem Fall nicht den abgeänderten Eingabemerkmalwert wider. Deshalb ändert die Vorhersageeinheit 150 einen nicht gelöschten Eingabemerkmalwert und gibt diesen ein.
  • Die Vorhersageeinheit 150 kann zum Berechnen der Ausgabemerkmalwerte Daten verwenden, die gemäß der Zukunft, die der Benutzer vorhersagen möchte, neu aufbereitet werden. In diesem Fall kann die Vorhersageeinheit 150 mit der Erfassungseinheit 110 verbunden sein und neue, von der Erfassungseinheit 110 gewonnene Benutzerdaten empfangen. Somit kann die Erzeugungsvorrichtung 100 zum Berechnen eines Vorhersagewerts für die Zukunft der Hotels in dem Gebiet A und eines Vorhersagewerts für die Zukunft der Hotels in dem Gebiet B zum Beispiel ein abgeändertes Modell verwenden, das durch Abändern des trainierten Modells auf der Grundlage von den Trainingsdaten erhalten wurde.
  • Die Modellabänderungseinheit 140 der Erzeugungsvorrichtung 100 gemäß der abgeänderten Ausführungsform hat anstelle der Ermittlungseinheit 146 eine Auswirkungsverringerungseinheit 148. Die Auswirkungsverringerungseinheit 148, die mit der Auswahleinheit 144 verbunden ist, empfängt durch die Auswahleinheit 144 ausgewählte Eingabemerkmalwerte.
  • Die Auswahleinheit 144 wählt Eingabemerkmalwerte mit hoher Priorität aus den Eingabemerkmalwerten aus, so dass das Vorhersageergebnis näher an dem Ziel-Ausgabemerkmalwert liegt, wenn der Grad der Auswirkung in dem trainierten Modell verringert wird, und verwendet diese als Eingabemerkmalwerte, für welche die Grade der Auswirkungen in dem Vorhersagemodell zu verringern sind. Die Auswahleinheit 144 stuft die Eingabemerkmalwerte, von denen jeder einen kleineren Fehler zwischen dem Vorhersageergebnis und dem Ziel-Ausgabemerkmalwert erzeugt, wenn die Gewichtung verringert wird, in absteigender Reihenfolge ein und wählt Eingabemerkmalwerte in einem Bereich von der ersten Größenordnung zu der vorher festgelegten Größenordnung als Eingabemerkmalwerte aus, für welche die Grade der Auswirkungen zu verringern sind.
  • Die Auswahleinheit 144 kann die Anzahl von ausgewählten Eingabemerkmalwerten gemäß dem Ausmaß einer Änderung in einem Fehler ändern. Wenn zum Beispiel ein Eingabemerkmalwert vorliegt, für den der Fehler im Vergleich zu anderen merklich klein ist, kann die Auswahleinheit 144 den Eingabemerkmalwert als einen Wert unter den ausgewählten Eingabemerkmalwerten auswählen. Alternativ kann die Auswahleinheit 144 die Anzahl von ausgewählten Werten verringern (erhöhen), wenn eine Änderung in jedem der Fehler kleiner (größer) ist als ein vorher festgelegter Wert.
  • Die Auswirkungsverringerungseinheit 148 empfängt die durch die Auswahleinheit 144 ausgewählten Eingabemerkmalwerte und erzeugt ein Vorhersagemodell, bei dem die Grade der Auswirkungen der Eingabemerkmalwerte verringert sind, um dieses als abgeändertes Modell auszugeben. Somit kann die Modellabänderungseinheit 140 schnell ein abgeändertes Modell erzeugen.
  • 5 veranschaulicht eine beispielhafte Hardware-Konfiguration eines als Erzeugungsvorrichtung 100 dienenden Computers 1900 gemäß der vorliegenden Ausführungsform. Der Computer 1900 gemäß der vorliegenden Ausführungsform beinhaltet einen CPU-Peripherie-Abschnitt mit einer CPU 2000, einem RAM 2020, einer Grafiksteuereinheit 2075 und einer Anzeigevorrichtung 2080, die durch eine Host-Steuereinheit 2082 miteinander verbunden sind, einen Eingabe/Ausgabe-Abschnitt mit einer Datenübertragungsschnittstelle 2030, einem Festplattenlaufwerk 2040 und einem DVD-Laufwerk 2060, die über eine Eingabe/Ausgabe-Steuereinheit 2084 mit der Host-Steuereinheit 2082 verbunden sind, und einen traditionellen Eingabe/Ausgabe-Abschnitt mit einem ROM 2010, einem Diskettenlaufwerk 2050 und einem Eingabe/Ausgabe-Chip 2070, die mit der Eingabe/Ausgabe-Steuereinheit 2084 verbunden sind.
  • Die Host-Steuereinheit 2082 verbindet den RAM 2020 mit der CPU 2000 und der Grafiksteuereinheit 2075, die mit einer hohen Übertragungsgeschwindigkeit auf den RAM 2020 zugreifen. Die CPU 2000 arbeitet auf der Grundlage von in dem ROM 2010 und dem RAM 2020 gespeicherten Programmen und steuert die Einheiten. Die Grafiksteuereinheit 2075 gewinnt durch die CPU 2000 oder dergleichen in einem in dem RAM 2020 bereitgestellten Bildspeicher erzeugte Bilddaten und zeigt sie auf der Anzeigevorrichtung 2080 an. Alternativ kann die Grafiksteuereinheit 2075 einen Bildspeicher zum Speichern der durch die CPU 2000 oder dergleichen erzeugten Bilddaten innerhalb der Grafiksteuereinheit 2075 beinhalten.
  • Die Eingabe/Ausgabe-Steuereinheit 2084 verbindet die Host-Steuereinheit 2082 mit der Datenübertragungsschnittstelle 2030, dem Festplattenlaufwerk 2040 und dem DVD-Laufwerk 2060, bei denen es sich um Eingabe/Ausgabe-Vorrichtungen mit relativ hoher Geschwindigkeit handelt. Die Datenübertragungsschnittstelle 2030 tauscht mit anderen Vorrichtungen über ein Netzwerk Daten aus. Das Festplattenlaufwerk 2040 speichert Programme und Daten, die durch die CPU 2000 in dem Computer 1900 verwendet werden. Das DVD-Laufwerk 2060 liest Programme oder Daten von einer DVD-ROM 2095 aus und stellt die Programme oder die Daten über den RAM 2020 dem Festplattenlaufwerk 2040 bereit.
  • Die Eingabe/Ausgabe-Steuereinheit 2084 ist mit dem ROM 2010 und mit den mit relativ niedriger Geschwindigkeit arbeitenden Eingabe/Ausgabe-Vorrichtungen, d. h. dem Diskettenlaufwerk 2050 und dem Eingabe/Ausgabe-Chip 2070 verbunden. Der ROM 2010 speichert beim Starten des Computers 1900 ausgeführte Urladeprogramme, Programme, die von der Hardware des Computers 1900 abhängen und/oder dergleichen. Das Disketten-Laufwerk 2050 liest Programme oder Daten von der Diskette 2090 aus und stellt die Programme oder Daten über den RAM 2020 dem Festplattenlaufwerk 2040 bereit. Der Eingabe/Ausgabe-Chip 2070 verbindet das Diskettenlaufwerk 2050 mit der Eingabe/Ausgabe-Steuereinheit 2084 und verbindet verschiedene Eingabe/Ausgabe-Vorrichtungen mit der Eingabe/Ausgabe-Steuereinheit 2084 über einen parallelen Anschluss, einen seriellen Anschluss, einen Tastaturanschluss, einen Mausanschluss und dergleichen.
  • Die über den RAM 2020 dem Festplattenlaufwerk 2040 bereitgestellten Programme werden auf einem Aufzeichnungsmedium wie zum Beispiel einer Diskette 2090, der DVD-ROM 2095 oder einer IC-Karte gespeichert und einem Benutzer bereitgestellt. Die Programme werden aus dem Aufzeichnungsmedium ausgelesen, auf dem Festplattenlaufwerk 2040 in dem Computer 1900 über den RAM 2020 installiert und durch die CPU 2000 ausgeführt.
  • Die Programme sind in dem Computer 1900 installiert und veranlassen den Computer 1900 dazu, als Erfassungseinheit 110, Speichereinheit 120, Modellerzeugungseinheit 130, Modellabänderungseinheit 140 und Vorhersageeinheit 150 zu fungieren.
  • Durch das Auslesen von Programmen in den Computer 1900 fungiert die in den Programmen beschriebene Informationsverarbeitung als spezifisches Mittel, in dem Software und verschiedene Hardware-Ressourcen, die oben beschrieben sind, zusammenarbeiten, d. h. die Erfassungseinheit 110, die Speichereinheit 120, die Modellerzeugungseinheit 130, die Modellabänderungseinheit 140 und die Vorhersageeinheit 150. Das spezifische Mittel erreicht das Berechnen oder Verarbeiten von Informationen gemäß der Verwendung des Computers 1900 gemäß der vorliegenden Ausführungsform, wobei eine spezifische Erzeugungsvorrichtung 100 gemäß der Verwendung aufgebaut wird.
  • Wenn zum Beispiel der Computer 1900 mit externen Vorrichtungen Daten austauscht, führt die CPU 2000 in den RAM 2020 geladene Datenübertragungsprogramme aus und weist die Datenübertragungsschnittstelle 2030 an, die Datenübertragung auf der Grundlage der in dem Datenübertragungsprogramm beschriebenen Prozesse durchzuführen. Unter Steuerung durch die CPU 2000 liest die Datenübertragungsschnittstelle 2030 Sendedaten aus, die in einem Sendepuffer oder dergleichen gespeichert sind, der auf einem Speicher wie zum Beispiel dem RAM 2020, dem Festplattenlaufwerk 2040, der Diskette 2090 oder der DVD-ROM 2095 bereitgestellt wird, um sie an ein Netzwerk zu senden, oder sie schreibt von einem Netzwerk empfangene Daten in einen Empfangspuffer oder dergleichen, der auf einem Speicher bereitgestellt wird. Somit kann die Datenübertragungsschnittstelle 2030 unter Verwendung von direktem Speicherzugriff (DMA, direct memory access) empfangene/gesendete Daten von einem/an einen Speicher übertragen. Alternativ kann die CPU 2000 Daten von einem Speicher oder der Datenübertragungsschnittstelle 2030 auslesen, wobei es sich um eine Übertragungsquelle handelt, und die Daten in die Datenübertragungsschnittstelle 2030 oder einen Speicher schreiben, wobei es sich um ein Sendeziel handelt, so dass die gesendeten/empfangenen Daten übertragen werden.
  • Die CPU 2000 veranlasst, dass alle oder ein benötigter Teil einer Datei, einer Datenbank oder dergleichen, die in einem externen Speicher wie zum Beispiel dem Festplattenlaufwerk 2040, dem DVD-Laufwerk 2060 (DVD-ROM 2095) oder dem Diskettenlaufwerk 2050 (Diskette 2090) gespeichert sind, durch DMA-Übertragung oder dergleichen in den RAM 2020 geschrieben werden, und führt an Daten in dem RAM 2020 verschiedene Prozesse durch. Die CPU 2000 schreibt die verarbeiteten Daten zurück in die externe Speichervorrichtung durch DMA-Übertragung oder dergleichen. In einem derartigen Prozess kann der RAM 2020 als Speicher angesehen werden, der vorübergehend Daten von einer externen Vorrichtung speichert. Entsprechend werden in der vorliegenden Ausführungsform der RAM 2020, ein externer Speicher und dergleichen allgemein Hauptspeicher, eine Speichereinheit, ein Massenspeicher oder dergleichen genannt. Verschiedene Typen von Informationen wie zum Beispiel verschiedene Programme, Daten, Tabellen und Datenbanken werden in der vorliegenden Ausführungsform in einem derartigen Speicher gespeichert und sind Ziele von Informationsverarbeitung. Die CPU 2000 kann Teile der Informationen in dem RAM 2020, in einem Cachespeicher speichern und die Informationen aus dem Cachespeicher lesen und in diesen schreiben. In einer derartigen Konfiguration fungiert der Cachespeicher als Teil des RAM 2020. Entsprechend ist in der vorliegenden Ausführungsform ein Cachespeicher außer zur Unterscheidung auch in dem RAM 2020, einem Hauptspeicher und/oder einem Massenspeicher beinhaltet.
  • An Daten, die aus dem RAM 2020 gelesen werden, führt die CPU 2000 verschiedene Prozesse durch, zu denen verschiedene Berechnungen, Informationsverarbeitung, bedingte Feststellungen und das Suchen/Ersetzen von Informationen gehören, die in der vorliegenden Ausführungsform beschrieben sind und die unter Verwendung einer Anweisungsfolge in Programmen festgelegt werden, und schreibt die Daten zurück in den RAM 2020. Wenn zum Beispiel eine bedingte Feststellung durchgeführt wird, vergleicht die CPU 2000 verschiedene in der vorliegenden Ausführungsform beschriebene Variablen mit anderen Variablen oder Konstanten und ermittelt, ob eine Kondition wie zum Beispiel „größer als”, „kleiner als”, „gleich oder größer als”, „gleich oder kleiner als” oder „gleich” erfüllt ist. Wenn eine Kondition erfüllt ist (oder nicht erfüllt ist), verzweigt der Prozess zu einer anderen Anweisungsfolge oder ruft eine Subroutine auf.
  • Die CPU 2000 kann nach in den Dateien, den Datenbanken oder dergleichen gespeicherten Informationen in einem Speicher suchen. In dem Fall, in dem zum Beispiel mehrere Einträge, in denen der Wert eines ersten Attributes und der Wert eines zweiten Attributs verbunden sind, in einem Speicher gespeichert sind, sucht die CPU 2000 nach einem Eintrag, bei dem eine den Wert des ersten Attributs unter den mehreren in dem Speicher gespeicherten Einträgen festlegende Kondition übereinstimmt, und liest den Wert des in dem Eintrag gespeicherten zweiten Attributs aus. Entsprechend kann man den Wert des zweiten Attributs, der dem ersten, eine vorher festgelegte Kondition erfüllenden Attribut entspricht, erhalten.
  • Oben beschriebene Programme oder Module können in einem externen Aufzeichnungsmedium gespeichert sein. Als Aufzeichnungsmedium können die Diskette 2090 und die DVD-ROM 2095 sowie ein optisches Aufzeichnungsmedium wie zum Beispiel eine DVD, eine Blu-rayTM oder eine CD, ein magnetooptisches Aufzeichnungsmedium wie eine magnetooptische (MO) Platte, ein Bandmedium, ein Halbleiterspeicher wie zum Beispiel eine IC-Karte und dergleichen verwendet werden. Ein Speicher wie zum Beispiel eine Festplatte oder ein RAM, die in einem mit einem privaten Datenübertragungsnetzwerk oder dem Internet verbundenen Server bereitgestellt werden, kann als Aufzeichnungsmedium verwendet werden, und Programme können dem Computer 1900 über ein Netzwerk bereitgestellt werden.
  • Wie oben beschrieben, wird die vorliegende Erfindung unter Verwendung der Ausführungsform beschrieben. Der technische Umfang der vorliegenden Erfindung ist jedoch nicht auf den in der Ausführungsform beschriebenen Bereich beschränkt. Für einen Fachmann ist es klar, dass verschiedene Änderungen oder Verbesserungen an der oben beschriebenen Ausführungsform vorgenommen werden können. Aus der Beschreibung des Umfangs der Ansprüche ist klar, dass eine Ausführungsform, an der derartige Änderungen oder Verbesserungen vorgenommen werden, ebenfalls in dem technischen Umfang der vorliegenden Erfindung beinhaltet ist.
  • Bei der Reihenfolge des Ausführens der Prozesse wie zum Beispiel Arbeitsschritte, Abläufe, Schritte, Stufen und dergleichen in den Vorrichtungen, den Systemen, den Programmen und den Verfahren, die in, dem Umfang der Ansprüche, der Beschreibung und den Zeichnungen beschrieben sind, ist „vor”, „nach” oder dergleichen nicht konkret angegeben. Außerdem sei angemerkt, dass die Prozesse in einer beliebigen Reihenfolge durchgeführt werden können, so lange eine Ausgabe des vorhergehenden Prozesses nicht in dem nachfolgenden Prozess verwendet wird. Selbst wenn Arbeitsabläufe in dem Umfang der Ansprüche, der Beschreibung und der Zeichnungen unter Verwendung von „erste/erster/erstes”, „nächste/nächster/nächstes” und dergleichen der Einfachheit halber beschrieben werden, bedeutet dies nicht, dass es notwendig ist, die Prozesse in dieser Reihenfolge durchzuführen.
  • Bezugszeichenliste
  • 100
    Erzeugungsvorrichtung
    110
    Erfassungseinheit
    120
    Speichereinheit
    130
    Modellerzeugungseinheit
    140
    Modellabänderungseinheit
    142
    Testeinheit
    144
    Auswahleinheit
    146
    Ermittlungseinheit
    148
    Auswirkungsverringerungseinheit
    150
    Vorhersageeinheit
    1900
    Computer
    2000
    CPU
    2010
    ROM
    2020
    RAM
    2030
    Datenübertragungsschnittstelle
    2040
    Festplattenlaufwerk
    2050
    Diskettenlaufwerk
    2060
    DVD-Laufwerk
    2070
    Eingabe/Ausgabe-Chip
    2075
    Grafiksteuereinheit
    2080
    Anzeigevorrichtung
    2082
    Host-Steuereinheit
    2084
    Eingabe/Ausgabe-Steuereinheit
    2090
    Diskette
    2095
    DVD-ROM

Claims (11)

  1. Erzeugungsvorrichtung, die ein Vorhersagemodell auf der Grundlage von Trainingsdaten erzeugt, aufweisend: eine Modellerzeugungseinheit, die ein trainiertes Modell erzeugt, das durch Training unter Verwendung der Trainingsdaten, bei denen es sich um Sätze von früheren Ausgabemerkmalwerten und Eingabemerkmalwerten handelt, aus einer Vielzahl von Eingabemerkmalwerten Ausgabemerkmalwerte vorhersagt; und eine Modellabänderungseinheit, welche Grade von Auswirkungen einiger aus der Vielzahl von Eingabemerkmalwerten in dem erzeugten trainierten Modell verringert und die ein abgeändertes Modell erzeugt, das tatsächlich bei dem Vorhersagen von Testdaten verwendet wird.
  2. Erzeugungsvorrichtung nach Anspruch 1, wobei die Modellabänderungseinheit einige aus der Vielzahl von Eingabemerkmalwerten in dem erzeugten trainierten Modell löscht und das abgeänderte Modell erzeugt.
  3. Erzeugungsvorrichtung nach Anspruch 1 oder 2, wobei die Modellabänderungseinheit beinhaltet eine Testeinheit, die das trainierte Modell unter Verwendung von Testdaten, die sich zumindest teilweise von den Trainingsdaten unterscheiden, testet; und eine Auswahleinheit, die beruhend auf einem Testergebnis des trainierten Modells einen Eingabemerkmalwert auswählt, für den ein Grad einer Auswirkung zu verringern ist.
  4. Erzeugungsvorrichtung nach Anspruch 3, wobei die Auswahleinheit einen Eingabemerkmalwert in den Testdaten als Eingabemerkmalwert auswählt, für den ein Grad einer Auswirkung zu verringern ist, wobei es sich bei dem ausgewählten Eingabemerkmalwert um einen Wert handelt, für den ein Verringern eines Grads einer Auswirkung in dem trainierten Modell dazu führt, dass ein Vorhersageergebnis näher an Ziel-Ausgabemerkmalwerten liegt.
  5. Erzeugungsvorrichtung nach Anspruch 4, wobei die Auswahleinheit das trainierte Modell als anfängliches Vorhersagemodell verwendet, um Eingabemerkmalwerte nacheinander auszuwählen, wobei es sich bei den ausgewählten Eingabemerkmalwerten um Werte handelt, für die ein Verringern eines Grads einer Auswirkung dazu führt, dass ein Vorhersageergebnis näher an den Ziel-Ausgabemerkmalwerten liegt, und wobei jedes Mal dann, wenn ein Eingabemerkmalwert ausgewählt wird, die Testeinheit das abgeänderte Modell durch Verringern eines Grads einer Auswirkung des ausgewählten Eingabemerkmalwerts in dem Vorhersagemodell erzeugt.
  6. Erzeugungsvorrichtung nach Anspruch 3 oder 4, wobei die Auswahleinheit einen Eingabemerkmalwert mit hoher Priorität unter der Vielzahl von Eingabemerkmalwerten als Eingabemerkmalwert auswählt, für den ein Grad einer Auswirkung in dem Vorhersagemodell zu verringern ist, wobei es sich bei dem ausgewählten Eingabemerkmalwert um einen Wert handelt, für den ein Verringern eines Grads einer Auswirkung in dem trainierten Modell dazu führt, dass ein Vorhersageergebnis näher an Ziel-Ausgabemerkmalwerten liegt.
  7. Erzeugungsvorrichtung nach einem der Ansprüche 3 bis 6, wobei die Modellerzeugungseinheit das trainierte Modell erzeugt, das einen Vorhersagewert für Ausgabemerkmalwerte berechnet, indem es jeden aus der Vielzahl von Eingabemerkmalwerten oder einen durch Anwenden jedes aus der Vielzahl von Eingabemerkmalwerten gewonnenen Wert auf eine vorher festgelegte erste Funktion mit einer entsprechenden aus einer Vielzahl von zu trainierenden Gewichtungen gewichtet und ferner den gewichteten Wert unter Verwendung einer vorher festgelegten zweiten Funktion umwandelt, und wobei die Testeinheit einen Wert einer Gewichtung für den ausgewählten Eingabemerkmalwert in dem trainierten Modell verringert.
  8. Erzeugungsvorrichtung nach einem der Ansprüche 3 bis 6, wobei die Modellerzeugungseinheit das trainierte Modell erzeugt, das als Reaktion darauf, ob die Vielzahl von Eingabemerkmalwerten eine zu trainierende Kondition erfüllt, einen unterschiedlichen Vorhersagewert berechnet, wobei die Testeinheit in dem Fall, in dem es von einem ausgewählten Eingabemerkmalwert in dem trainierten Modell abhängt, ob eine durch Training erhaltene Kondition erfüllt wird, annimmt, dass die Kondition unabhängig von einem ausgewählten Eingabemerkmalwert erfüllt wird, wenn zumindest entweder in den Trainingsdaten oder/und den Testdaten eine Häufigkeit, mit der die Kondition erfüllt wird, höher ist als eine Häufigkeit, mit der die Kondition nicht erfüllt wird, und die Testeinheit, wenn die Häufigkeit, mit der die Kondition nicht erfüllt wird, höher ist als eine Häufigkeit, mit der die Kondition erfüllt wird, das trainierte Modell auf eine Weise abändert, dass die Kondition unabhängig von dem ausgewählten Eingabemerkmalwert nicht erfüllt wird, und ein abgeändertes Modell erzeugt.
  9. Erzeugungsvorrichtung nach einem der Ansprüche 1 bis 8, ferner aufweisend; eine Vorhersageeinheit, die aus der Vielzahl von Eingabemerkmalwerten einen Eingabemerkmalwert, der nicht gelöscht wurde, in das abgeänderte Modell eingibt und die einen Vorhersagewert berechnet.
  10. Erzeugungsverfahren zum Erzeugen eines Vorhersagemodells auf der Grundlage von Trainingsdaten, das Verfahren aufweisend: Erzeugen eines trainierten Modells, das durch Training unter Verwendung der Trainingsdaten, bei denen es sich um Sätze von früheren Ausgabemerkmalwerten und Eingabemerkmalwerten handelt, aus einer Vielzahl von Eingabemerkmalwerten Ausgabemerkmalwerte vorhersagt; und Verringern von Graden von Auswirkungen einiger der Eingabemerkmalwerte in dem erzeugten trainierten Modell und Erzeugen eines abgeänderten Modells, das tatsächlich bei dem Vorhersagen von Testdaten verwendet wird.
  11. Programmprodukt, das einen Computer dazu veranlasst, als Erzeugungsvorrichtung gemäß einem der Ansprüche 1 bis 9 zu fungieren.
DE201410113988 2013-10-31 2014-09-26 Erzeugungsvorrichtung, Erzeugungsverfahren und Programm Ceased DE102014113988A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2013226211A JP2015087973A (ja) 2013-10-31 2013-10-31 生成装置、生成方法、およびプログラム
JP2013-226211 2013-10-31

Publications (1)

Publication Number Publication Date
DE102014113988A1 true DE102014113988A1 (de) 2015-04-30

Family

ID=52811836

Family Applications (1)

Application Number Title Priority Date Filing Date
DE201410113988 Ceased DE102014113988A1 (de) 2013-10-31 2014-09-26 Erzeugungsvorrichtung, Erzeugungsverfahren und Programm

Country Status (3)

Country Link
JP (1) JP2015087973A (de)
CN (1) CN104598981A (de)
DE (1) DE102014113988A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095588A (zh) * 2015-08-05 2015-11-25 中国联合网络通信集团有限公司 移动互联网用户投诉的预测方法和装置

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6622150B2 (ja) 2016-06-29 2019-12-18 株式会社東芝 情報処理装置および情報処理方法
JP6633462B2 (ja) 2016-06-29 2020-01-22 株式会社東芝 情報処理装置および情報処理方法
JP6606050B2 (ja) * 2016-11-02 2019-11-13 日本電信電話株式会社 検知装置、検知方法および検知プログラム
JP6767355B2 (ja) * 2017-03-29 2020-10-14 株式会社東芝 モデル構築システムおよびモデル構築方法
JP6607885B2 (ja) * 2017-07-10 2019-11-20 株式会社三菱総合研究所 情報処理装置及び情報処理方法
US11475299B2 (en) * 2017-08-10 2022-10-18 Mitsubishi Electric Corporation Identification/classification device and identification/classification method
WO2020004049A1 (ja) * 2018-06-27 2020-01-02 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
EP3709230A4 (de) * 2018-07-30 2021-01-20 Rakuten, Inc. Beurteilungssystem, beurteilungsverfahren und programm
US11809966B2 (en) * 2019-03-07 2023-11-07 International Business Machines Corporation Computer model machine learning based on correlations of training data with performance trends
JP7188255B2 (ja) * 2019-04-16 2022-12-13 富士通株式会社 学習方法、学習プログラムおよび学習装置
JP7012696B2 (ja) * 2019-10-21 2022-01-28 株式会社三菱総合研究所 情報処理装置及び情報処理方法
WO2022107262A1 (ja) * 2020-11-18 2022-05-27 日本電信電話株式会社 判定装置、判定方法、および、判定プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005253708A (ja) 2004-03-12 2005-09-22 Fuji Photo Film Co Ltd 特徴量選択装置、異常陰影判別装置およびプログラム
JP2013140548A (ja) 2012-01-06 2013-07-18 Nippon Steel & Sumitomo Metal 操業状況評価装置、操業状況評価方法、コンピュータプログラムおよびコンピュータ読み取り可能な記憶媒体

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6954744B2 (en) * 2001-08-29 2005-10-11 Honeywell International, Inc. Combinatorial approach for supervised neural network learning
EP1515270A1 (de) * 2003-09-09 2005-03-16 Semeion Künstliches neuronales Netz
JP4321645B2 (ja) * 2006-12-08 2009-08-26 ソニー株式会社 情報処理装置および情報処理方法、認識装置および情報認識方法、並びに、プログラム
JP5130851B2 (ja) * 2007-09-27 2013-01-30 富士通株式会社 モデル作成支援システム、モデル作成支援方法、モデル作成支援プログラム
JP5071851B2 (ja) * 2007-10-31 2012-11-14 日本電信電話株式会社 時間情報を用いた予測装置、予測方法、予測プログラムおよびそのプログラムを記録した記録媒体
CN100587708C (zh) * 2008-01-25 2010-02-03 华中科技大学 一种分类器集成方法
CN101458732A (zh) * 2008-12-25 2009-06-17 浙江师范大学 面向饰品创新设计的知识应用方法
JP2011242923A (ja) * 2010-05-17 2011-12-01 Fuji Electric Co Ltd モデルの入力変数調整装置
CN103324981B (zh) * 2013-05-20 2015-12-02 浙江大学 基于神经网络的放化疗规范化质量控制的量化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005253708A (ja) 2004-03-12 2005-09-22 Fuji Photo Film Co Ltd 特徴量選択装置、異常陰影判別装置およびプログラム
JP2013140548A (ja) 2012-01-06 2013-07-18 Nippon Steel & Sumitomo Metal 操業状況評価装置、操業状況評価方法、コンピュータプログラムおよびコンピュータ読み取り可能な記憶媒体

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Castellano, G; Fanelli, A. M.: Variable selection using neural-network models. In: Neurocomputing, 31, 2000, 1-4, S. 1-13. - ISSN 0925-2312. http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.17.4126 [abgerufen am 03.12.2014] *
Geoffrey E. Hinton [u.a.]: Improving neural networks by preventing co-adaptation of feature detectors. In: CoRR, abs/1207.0580, 2012, S. 1-18. http://arxiv.org/abs/1207.0580 [abgerufen am 03.12.2014] *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095588A (zh) * 2015-08-05 2015-11-25 中国联合网络通信集团有限公司 移动互联网用户投诉的预测方法和装置
CN105095588B (zh) * 2015-08-05 2018-07-03 中国联合网络通信集团有限公司 移动互联网用户投诉的预测方法和装置

Also Published As

Publication number Publication date
JP2015087973A (ja) 2015-05-07
CN104598981A (zh) 2015-05-06

Similar Documents

Publication Publication Date Title
DE102014113988A1 (de) Erzeugungsvorrichtung, Erzeugungsverfahren und Programm
CN110956272B (zh) 实现数据处理的方法和系统
DE112018002822T5 (de) Klassifizieren neuronaler netze
US20140195466A1 (en) Integrated machine learning for a data management product
DE112016001796T5 (de) Feinkörnige bildklassifizierung durch erforschen von etiketten von einem bipartiten graphen
US20030208284A1 (en) Modular architecture for optimizing a configuration of a computer system
DE112017000670T5 (de) Beschleunigen eines Trainierens eines tiefen neuronalen Netzes mit einem inkonsistenten stochastischen Gradientenabfall
DE10311311A1 (de) Berechnung von Preiselastizität
DE202017107393U1 (de) Vorhersagen eines Suchmaschinen-Einordnungssignalwerts
DE102019004300A1 (de) Verwendung eines dynamischen speichernetzwerks zum verfolgen digitaler dialogzustände und erzeugen von antworten
DE112013000966T5 (de) Vorrichtung, Programm und Verfahren zum Clustern einer Vielzahl von Dokumenten
DE112013005993T5 (de) Verfahren, Vorrichtung und computerlesbares Medium für eine optimale Bestimmung von Daten-Teilmengen
DE112020001034T5 (de) Seltene fälle berücksichtigende trainingsdaten für künstliche intelligenz
DE10239292A1 (de) Konflikterfassung und -lösung in Zusammenhang mit einer Datenzuweisung
DE112020003050T5 (de) Fehlerkompensation in analogen neuronalen netzen
DE112008003854T5 (de) Raum-Zeit-Medienobjektlayouts
DE112020002372T5 (de) Schätzung einer realisierbarkeit von merkmalsvektoren
DE102015102034A1 (de) Verfahren zum Analysieren von Ergebnissen in einem Entwurfsautomatisierungsablauf für elektronische Systeme, Computersystem und Computerprogrammprodukt
US20180130002A1 (en) Requirements determination
CN108564237A (zh) 一种容量评估模型建立方法、容量评估方法及装置
DE112022000915T5 (de) Erstellen eines statistischen modells und auswerten der modellleistung
DE102021130117A1 (de) Diagnosemuster-erzeugungsverfahren und computer
DE112020003599T5 (de) Prüfvorrichtung, prüfverfahren, prüfprogramm, lernvorrichtung, lernverfahren und lernprogramm
US20220375014A1 (en) Evaluation system of intellectual property rights, evaluation method of intellectual property rights, evaluation program, and correction data
Luo Progress indication for machine learning model building: A feasibility demonstration

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06F0015180000

Ipc: G06N0005000000

R002 Refusal decision in examination/registration proceedings
R003 Refusal decision now final