DE202022101222U1

DE202022101222U1 - Ein automatisch skalierbares System für optimierte Arbeitsempfehlungen

Info

Publication number: DE202022101222U1
Application number: DE202022101222.9U
Authority: DE
Original assignee: Individual
Current assignee: Individual
Priority date: 2022-03-05
Filing date: 2022-03-05
Publication date: 2022-03-11
Anticipated expiration: 2032-03-06

Abstract

Ein automatisch skalierbares System für optimierte Arbeitsempfehlungen, wobei das System umfasst:eine Datenextraktionsverarbeitungseinheit, um strukturierte und unstrukturierte Daten aus verschiedenen Websites zu extrahieren, wobei der strukturierte und unstrukturierte Dateninput sowohl in verhaltensbezogener als auch in kontextbezogener Form verfügbar ist;eine Vorverarbeitungseinheit zur Umwandlung der strukturierten und unstrukturierten Daten in ein benutzerdefiniertes Format und zur Entfernung von Rauschen aus den markanten Merkmalen;eine Merkmalsextraktionseinheit zur Auswahl markanter Merkmale aus strukturierten und unstrukturierten Daten;eine Wort-Hashing-Einheit zum Erzeugen eines Phrasen-Trigramms für Job- und Qualifikationsmerkmale, um eine Qualifikationslücke zu reduzieren und verallgemeinerte Qualifikations- und Jobempfehlungen zu erzeugen, wobei die Wort-Hashing-Einheit eine graphbasierte Technik umfasst, die einen modifizierten Page-Rank-Ansatz verwendet, um eine geordnete Jobliste und Qualifikationsliste zu erzeugen; undeine Steuereinheit, die so konfiguriert ist, dass sie ein Trainingsmodell entwickelt, um eine optimierte Arbeitsempfehlung für eine zukünftige Beschäftigung bereitzustellen, wobei das Trainingsmodell eine Vielzahl von maschinellen Lerntechniken zur Bereitstellung von Arbeitsempfehlungen verwendet.

Description

BEREICH DER ERFINDUNG
Die vorliegende Offenlegung bezieht sich auf Arbeitsempfehlungssysteme. Im Einzelnen handelt es sich um ein automatisch skalierbares System für optimierte Arbeitsempfehlungen.
HINTERGRUND DER ERFINDUNG
Der bisherige Stand der Technik liefert Arbeitsempfehlungen auf eine langsame Art und Weise. Die größte Herausforderung ist die Nichtübereinstimmung von Fähigkeiten, und der Abgleich ist für ein Arbeitsempfehlungssystem unerlässlich. Es besteht die Notwendigkeit, ein neuartiges Job-Empfehlungssystem zu entwickeln und zu bewerten, das Empfehlungen und Vorschläge liefert, wenn die Profile nicht passen. Die vorliegende Erfindung schlägt ein skalierbares Job-Empfehlungssystem vor, das mit verschiedenen Datenkategorien und verschiedenen Aspekten des Profilabgleichs arbeitet. Es bietet Server- und Speicherfunktionalität, um die Arbeitslast des Systems anzupassen, ohne das bestehende System neu zu gestalten. Heutzutage sind die sozialen Medien eine allgegenwärtige Plattform für den Austausch von Daten und für die täglichen Aktivitäten von heute. Durch die enorme Nutzung verschiedener Internetquellen wie Mobiltelefone und intelligente Geräte können Internetnutzer eine Vielzahl von Informationen über Shopping, soziales Training und Online-Lernen erhalten. Wenn die Datenmenge und -vielfalt enorm ansteigt, steht der einzelne Nutzer vor dem Problem der Informationsüberflutung, die ihn in die Lage versetzt, die richtigen Entscheidungen zu treffen.
Empfehlungssysteme können eine Vielzahl von Problemen lösen, indem sie die wahrscheinlichen Anforderungen der Benutzer ermitteln und faszinierende Artikel aus einer großen Menge von Bewerberinformationen auswählen. Empfehlungssysteme sind hauptsächlich inhaltsbasiert (CB), kollaboratives Filtern (CF) und hybride Empfehlungssysteme. Die hybride Filterung wird auf drei Arten erstellt: Ensemble-Design, monolithisches Design und gemischtes Design. Ein wichtiges Empfehlungssystem für Bewerbungen ist die Suche nach den besten Talenten und die Bereitstellung von Qualifikationsvorschlägen. Das Ziel von Job-Empfehlungen ist es, die Anzahl der qualifizierten Bewerbungen zu erhöhen und die Zeit zu verkürzen, die für eine Bewerbung benötigt wird.
Ein intelligentes, personalisiertes Erlebnis für die Bewerber reduziert die Menge an irrelevanten Inhalten, die präsentiert werden. Die Netzwerkarchitektur der Job-Empfehlung wird ein wesentlicher Faktor sein, da sie die Daten verarbeitet, ohne die bestehende Hardware-Einrichtung und Parametereinstellung zu verändern. Sie bietet die Funktion der automatischen Skalierung, die die Geschwindigkeit und Latenz entsprechend den Systemanforderungen anpasst.
In Anbetracht der vorangegangenen Diskussion wird deutlich, dass ein Bedarf an einem automatisch skalierbaren System für optimierte Jobempfehlungen besteht.
ZUSAMMENFASSUNG DER ERFINDUNG
Die vorliegende Offenlegung zielt darauf ab, ein automatisch skalierbares System für optimierte Arbeitsempfehlungen bereitzustellen, das relevante Fähigkeiten für eine zukünftige Beschäftigung auf der Grundlage aktueller Fähigkeiten und Erfahrungen bereitstellt.
In einer Ausführungsform wird ein automatisch skalierbares System für optimierte Arbeitsempfehlungen offenbart. Das System umfasst eine Datenextraktionsverarbeitungseinheit, um strukturierte und unstrukturierte Daten aus verschiedenen Websites zu extrahieren, wobei der strukturierte und unstrukturierte Dateninput sowohl in verhaltensbezogener als auch in kontextbezogener Form verfügbar ist. Das System umfasst ferner eine Vorverarbeitungseinheit, um die strukturierten und unstrukturierten Daten in ein benutzerdefiniertes Format umzuwandeln und Rauschen aus den markanten Merkmalen zu entfernen. Das System umfasst ferner eine Merkmalsextraktionseinheit zur Auswahl auffälliger Merkmale aus strukturierten und unstrukturierten Daten. Das System umfasst ferner eine Wort-Hashing-Einheit, um ein Phrasen-Trigramm für Job- und Qualifikationsmerkmale zu erzeugen, um eine Qualifikationslücke zu verringern und verallgemeinerte Qualifikations- und Jobempfehlungen zu erstellen, wobei die Wort-Hashing-Einheit eine graphbasierte Technik umfasst, die einen modifizierten Page-Rank-Ansatz verwendet, um eine geordnete Jobliste und Qualifikationsliste zu erzeugen. Das System umfasst ferner eine Steuereinheit, die so konfiguriert ist, dass sie ein Trainingsmodell für die Bereitstellung optimierter Arbeitsempfehlungen für eine zukünftige Beschäftigung entwickelt, wobei das Trainingsmodell eine Vielzahl von maschinellen Lerntechniken für die Bereitstellung von Arbeitsempfehlungen verwendet.
In einer anderen Ausführungsform umfasst das System einen Cloud-Server für die Speicherung strukturierter und unstrukturierter Daten.
In einer anderen Ausführungsform wird die Skalierbarkeit des Systems durch einen automatischen Skalierungsprozess aufrechterhalten, der die Daten entsprechend der Systemkonfiguration automatisch und ohne Reengineering-Kosten verarbeitet.
In einer anderen Ausführungsform dient die Merkmalstechnik der Auswahl herausragender Merkmale und der Behandlung verrauschter Daten.
In einer anderen Ausführungsform wird die automatische Skalierung auf der Grundlage von Big-Data-Technologie und verteilter Datenverwaltung durchgeführt.
In einer anderen Ausführungsform beobachtet die automatische Skalierung das System und passt automatisch die vorhersehbare Leistung zu den geringstmöglichen Kosten stetig an, wobei die automatische Skalierung zugänglich ist, um die Anwendungsskalierung für mehrere Ressourcen über mehrere Dienste hinweg in Minuten einzurichten.
In einer anderen Ausführungsform umfasst das System eine Benutzerschnittstelle zur Erstellung von Plänen zur Skalierung von Ressourcen.
In einer anderen Ausführungsform werden die extrahierten Daten in einer Datenbank 306 gespeichert, die mit dem Cloud-Server in Form von verhaltensbezogenen und kontextbezogenen Daten verbunden ist, wobei die verhaltensbezogenen Daten wesentlich sind, um skalierbare und zukünftige Berufsempfehlungen zu geben.
In einer anderen Ausführungsform umfasst die Merkmalsextraktionseinheit mindestens zwei verschiedene Merkmalstechniken, die als ILA-3 und ILA-4 bezeichnet werden, die relevante Merkmale extrahieren und irrelevante und doppelte Merkmale ignorieren, wobei die mindestens zwei verschiedenen Merkmalstechniken verwendet werden, um fehlende und verrauschte Werte zu behandeln, indem die ILA-4-Technik überwunden wird.
In einer anderen Ausführungsform werden die fehlenden Werte durch eine induktive Technik verwaltet, die die komplexen Daten reduziert und eine schnelle Regelgenerierung ermöglicht, wobei die bereinigten und geordneten Merkmale in einem Spark-Datenrahmen für die weitere Verarbeitung von Word Trigram gespeichert werden.
Ein Ziel der vorliegenden Offenlegung ist es, ein automatisch skalierbares System und eine Technik vorzustellen, um Arbeitsempfehlungen und Qualifikationsvorschläge für Arbeitssuchende bereitzustellen.
Ein weiteres Ziel der vorliegenden Erfindung ist es, eine automatische Skalierbarkeit bereitzustellen, die das System für verschiedene Varianten und Größen des Datensatzwachstums skaliert.
Ein weiteres Ziel der vorliegenden Erfindung ist es, eine Methodik zur Extraktion verschiedener Eingangssignale für die Auftragsverarbeitung bereitzustellen.
Ein weiteres Ziel der vorliegenden Erfindung ist es, eine neuartige Lösung für den Umgang mit der Merkmalsextraktionstechnik und fehlenden Werten im Datensatz bereitzustellen.
Ein weiteres Ziel der vorliegenden Erfindung ist es, mehr Neuheit und überraschende Empfehlungen Methodik Wort Hashing für Job und Geschicklichkeit bieten.
Ein weiteres Ziel der vorliegenden Erfindung ist es, eine graphbasierte Technik zu entwickeln, die mit semantischen Daten arbeitet und die beste Einstufung von Jobs und Fähigkeiten liefert.
Ein weiteres Ziel der vorliegenden Erfindung ist es, die am besten geeignete Parameter- und Optimierungseinstellung für graphbasierte und induktive Lernmodelle bereitzustellen.
Ein weiteres Ziel der vorliegenden Erfindung ist es, eine wettbewerbsfähigere Empfehlungsgenauigkeit zu erreichen als der Stand der Technik bei graphbasierten Empfehlungstechniken.
Ein weiteres Ziel der vorliegenden Erfindung ist es, ein schnelles und kosteneffizientes Arbeitsempfehlungssystem bereitzustellen.
Zur weiteren Verdeutlichung der Vorteile und Merkmale der vorliegenden Offenbarung wird eine genauere Beschreibung der Erfindung durch Bezugnahme auf bestimmte Ausführungsformen gegeben, die in den beigefügten Figuren dargestellt sind. Es wird davon ausgegangen, dass diese Figuren nur typische Ausführungsformen der Erfindung darstellen und daher nicht als Einschränkung des Umfangs der Erfindung zu betrachten sind. Die Erfindung wird mit zusätzlicher Spezifität und Detail mit den beigefügten Figuren beschrieben und erläutert werden.
Figurenliste
Diese und andere Merkmale, Aspekte und Vorteile der vorliegenden Offenbarung werden besser verstanden, wenn die folgende detaillierte Beschreibung unter Bezugnahme auf die beigefügten Figuren gelesen wird, in denen gleiche Zeichen gleiche Teile in den Figuren darstellen, wobei:

1 ein Blockdiagramm eines automatisch skalierbaren Systems für optimierte Job-Empfehlungen in Übereinstimmung mit einer Ausführungsform der vorliegenden Offenbarung zeigt;
2 die Architektur eines skalierbaren Job-Empfehlungssystems in Übereinstimmung mit einer Ausführungsform der vorliegenden Offenbarung zeigt;
3 einen Server und eine Speicherverwaltungseinheit in Übereinstimmung mit einer Ausführungsform der vorliegenden Offenbarung zeigt;
4 eine Einheit zur Extraktion und Verarbeitung von Eingabedaten in Übereinstimmung mit einer Ausführungsform der vorliegenden Offenbarung zeigt;
5 einen Job-Trigram-Ansatz für Job-Empfehlungen und Qualifikationsvorschläge in Übereinstimmung mit einer Ausführungsform der vorliegenden Offenlegung veranschaulicht;
6 ein graphbasiertes Modell mit induktivem Lernen gemäß einer Ausführungsform der vorliegenden Offenbarung veranschaulicht; und
7 ein Modell für Berufs- und Qualifikationsempfehlungen in Übereinstimmung mit einer Ausführungsform der vorliegenden Offenlegung zeigt.

Der Fachmann wird verstehen, dass die Elemente in den Figuren der Einfachheit halber dargestellt sind und nicht unbedingt maßstabsgetreu gezeichnet wurden. Die Flussdiagramme veranschaulichen beispielsweise das Verfahren anhand der wichtigsten Schritte, um das Verständnis der Aspekte der vorliegenden Offenbarung zu verbessern. Darüber hinaus können ein oder mehrere Komponenten der Vorrichtung in den Figuren durch herkömmliche Symbole dargestellt sein, und die Figuren können nur die spezifischen Details zeigen, die für das Verständnis der Ausführungsformen der vorliegenden Offenbarung von Bedeutung sind, um die Figuren nicht mit Details zu verdecken, die für Fachleute mit normalen Kenntnissen, die von der vorliegenden Beschreibung profitieren, ohne weiteres erkennbar sind.
DETAILLIERTE BESCHREIBUNG
Zum besseren Verständnis der Grundsätze der Erfindung wird nun auf die in den Figuren dargestellte Ausführungsform Bezug genommen und diese in einer speziellen Sprache beschrieben. Es versteht sich jedoch von selbst, dass damit keine Einschränkung des Umfangs der Erfindung beabsichtigt ist, wobei solche Änderungen und weitere Modifikationen des dargestellten Systems und solche weiteren Anwendungen der darin dargestellten Prinzipien der Erfindung in Betracht gezogen werden, wie sie einem Fachmann auf dem Gebiet der Erfindung normalerweise einfallen würden.
Der Fachmann wird verstehen, dass die vorstehende allgemeine Beschreibung und die folgende detaillierte Beschreibung beispielhaft und erläuternd für die Erfindung sind und nicht als einschränkend angesehen werden.
Wenn in dieser Beschreibung von „einem Aspekt“, „einem anderen Aspekt“ oder ähnlichem die Rede ist, bedeutet dies, dass ein bestimmtes Merkmal, eine bestimmte Struktur oder eine bestimmte Eigenschaft, die im Zusammenhang mit der Ausführungsform beschrieben wird, in mindestens einer Ausführungsform der vorliegenden Offenbarung enthalten ist. Daher können sich die Ausdrücke „in einer Ausführungsform“, „in einer anderen Ausführungsform“ und ähnliche Ausdrücke in dieser Beschreibung alle auf dieselbe Ausführungsform beziehen, müssen es aber nicht.
Die Ausdrücke „umfasst“, „enthaltend“ oder andere Variationen davon sollen eine nicht ausschließliche Einbeziehung abdecken, so dass ein Verfahren oder eine Methode, die eine Liste von Schritten umfasst, nicht nur diese Schritte einschließt, sondern auch andere Schritte enthalten kann, die nicht ausdrücklich aufgeführt sind oder zu einem solchen Verfahren oder einer solchen Methode gehören. Ebenso schließen eine oder mehrere Vorrichtungen oder Teilsysteme oder Elemente oder Strukturen oder Komponenten, die mit „umfasst...a“ eingeleitet werden, nicht ohne weitere Einschränkungen die Existenz anderer Vorrichtungen oder anderer Teilsysteme oder anderer Elemente oder anderer Strukturen oder anderer Komponenten oder zusätzlicher Vorrichtungen oder zusätzlicher Teilsysteme oder zusätzlicher Elemente oder zusätzlicher Strukturen oder zusätzlicher Komponenten aus.
Sofern nicht anders definiert, haben alle hierin verwendeten technischen und wissenschaftlichen Begriffe die gleiche Bedeutung, wie sie von einem Fachmann auf dem Gebiet, zu dem diese Erfindung gehört, allgemein verstanden wird. Das System, die Methoden und die Beispiele, die hier angegeben werden, dienen nur der Veranschaulichung und sind nicht als Einschränkung gedacht.
Ausführungsformen der vorliegenden Offenbarung werden im Folgenden unter Bezugnahme auf die beigefügten Figuren im Detail beschrieben.
In 1 ist ein Blockdiagramm eines automatisch skalierbaren Systems für optimierte Arbeitsempfehlungen gemäß einer Ausführungsform der vorliegenden Offenbarung dargestellt. Das System 100 umfasst eine Datenextraktionsverarbeitungseinheit 102, um strukturierte und unstrukturierte Daten aus verschiedenen Websites 402 zu extrahieren, wobei der strukturierte und unstrukturierte Dateninput sowohl in verhaltensbezogener als auch in kontextbezogener Form verfügbar ist.
In einer Ausführungsform ist eine Vorverarbeitungseinheit 104 mit der Datenextraktionsverarbeitungseinheit 102 verbunden, um die strukturierten und unstrukturierten Daten in ein benutzerdefiniertes Format umzuwandeln und Rauschen aus den markanten Merkmalen zu entfernen.
In einer Ausführungsform ist eine Merkmalsextraktionseinheit 106 mit der Vorverarbeitungseinheit 104 verbunden, um markante Merkmale aus strukturierten und unstrukturierten Daten auszuwählen.
In einer Ausführungsform ist eine Wort-Hashing-Einheit 108 mit der Merkmalsextraktionseinheit 106 verbunden, um ein Phrasen-Trigramm für Job- und Qualifikationsmerkmale zu erzeugen, um eine Qualifikationslücke zu reduzieren und verallgemeinerte Qualifikations- und Jobempfehlungen zu erstellen, wobei die Wort-Hashing-Einheit 108 eine graphbasierte Technik umfasst, die einen modifizierten Page-Rank-Ansatz verwendet, um eine geordnete Jobliste und Qualifikationsliste zu erzeugen.
In einer Ausführungsform ist eine Steuereinheit 110 so konfiguriert, dass sie ein Trainingsmodell 112 entwickelt, um optimierte Arbeitsempfehlungen für eine zukünftige Beschäftigung bereitzustellen, wobei das Trainingsmodell 112 eine Vielzahl von maschinellen Lerntechniken zur Bereitstellung von Arbeitsempfehlungen verwendet.
In einer anderen Ausführungsform umfasst das System einen Cloud-Server 114 für die Speicherung strukturierter und unstrukturierter Daten.
In einer anderen Ausführungsform wird die Skalierbarkeit des Systems durch einen automatischen Skalierungsprozess aufrechterhalten, der die Daten entsprechend der Systemkonfiguration automatisch und ohne Reengineering-Kosten verarbeitet.
In einer anderen Ausführungsform dient die Merkmalstechnik der Auswahl herausragender Merkmale und der Behandlung verrauschter Daten.
In einer anderen Ausführungsform wird die automatische Skalierung auf der Grundlage von Big-Data-Technologie und verteilter Datenverwaltung durchgeführt.
In einer anderen Ausführungsform beobachtet die automatische Skalierung das System und passt automatisch die vorhersehbare Leistung zu den geringstmöglichen Kosten stetig an, wobei die automatische Skalierung zugänglich ist, um die Anwendungsskalierung für mehrere Ressourcen über mehrere Dienste hinweg in Minuten einzurichten.
In einer anderen Ausführungsform umfasst das System eine Benutzeroberfläche 116 zur Erstellung von Plänen für die Skalierung von Ressourcen.
In einer anderen Ausführungsform werden die extrahierten Daten in einer Datenbank 306 gespeichert, die mit dem Cloud-Server 114 in Form von Verhaltens- und Kontextdaten verbunden ist, wobei die Verhaltensdaten wesentlich sind, um skalierbare und zukünftige Berufsempfehlungen zu geben.
In einer anderen Ausführungsform umfasst die Merkmalsextraktionseinheit 106 mindestens zwei verschiedene Merkmalstechniken, die als ILA-3 und ILA-4 bezeichnet werden, die relevante Merkmale extrahieren und irrelevante und doppelte Merkmale ignorieren, wobei die mindestens zwei verschiedenen Merkmalstechniken verwendet werden, um fehlende und verrauschte Werte zu behandeln, indem die ILA-4-Technik überwunden wird.
In einer anderen Ausführungsform werden die fehlenden Werte durch eine induktive Technik verwaltet, die die komplexen Daten reduziert und eine schnelle Regelgenerierung ermöglicht, wobei die bereinigten und geordneten Merkmale in einem Spark-Datenrahmen für die weitere Verarbeitung von Word Trigram gespeichert werden.
2 veranschaulicht die Architektur eines skalierbaren Job-Empfehlungssystems in Übereinstimmung mit einer Ausführungsform der vorliegenden Offenlegung. Die grundlegende Empfehlungsarchitektur gibt einen kurzen Überblick über die im entwickelten System verwendeten Arbeitsempfehlungsdienste. Das System 100 extrahiert strukturierte und unstrukturierte Daten aus verschiedenen Websites 402. Die akzeptierten Daten werden in ein systemspezifisches Format umgewandelt und weiteren Vorverarbeitungsschritten zugeführt. Die bereinigten Daten werden für die weitere Modellentwicklung und zum Testen verwendet. Das Modell verwendet viele Techniken des maschinellen Lernens, die Arbeitsempfehlungen geben. Das bestehende Job-Empfehlungssystem weist viele Lücken auf. Um das aktuelle Systemproblem zu lösen, wurde das skalierbare Job-Empfehlungssystem erfunden, das in 2 dargestellt ist.
Die Architektur besteht aus vier Hauptblöcken. Der erste Block, die Server- und Speichereinheit 114, wird auch als Auto-Scaling-Einheit 114 bezeichnet. Die Funktionsweise dieses Blocks ist in 3 dargestellt. Auto Scaling beobachtet das System und passt automatisch die vorhersehbare Leistung zu den geringstmöglichen Kosten kontinuierlich an. Auto Scaling wird zugänglich sein, um Anwendungsskalierung für mehrere Ressourcen über mehrere Dienste hinweg in Minuten einzurichten. Der Dienst bietet eine einfache, leistungsstarke Benutzeroberfläche 116 zur Erstellung von Ressourcenskalierungsplänen. Auto Scaling vereinfacht die Skalierung mit Empfehlungen, die es Ihnen ermöglichen, Leistung und Kosten zu optimieren oder ein Gleichgewicht zwischen beidem herzustellen und Ihre Instances dynamisch zu skalieren. Sie können es jetzt mit AWS Auto Scaling kombinieren, um zusätzliche Ressourcen für andere AWS-Services zu skalieren. Mit AWSiAuto Scaling verfügen Ihre Anwendungen immer über die richtigen Ressourcen zur richtigen Zeit.
In einer anderen Ausführungsform verwendet die Merkmalsextraktionseinheit 106 zwei verschiedene Merkmalstechniken, die als ILA-3 und ILA-4 bezeichnet werden, die relevante Merkmale extrahieren und irrelevante und doppelte Merkmale ignorieren; die Technik behandelt auch fehlende und verrauschte Werte, indem sie die ILA-4-Technik überwindet.
3 veranschaulicht eine Server- und Speicherverwaltungseinheit gemäß einer Ausführungsform der vorliegenden Offenbarung. 3 umfasst eine Netzwerkschnittstelle 302, ein Netzwerk 304, die Steuereinheit/Prozessor 110 und eine Datenbank 306. Die Netzwerkschnittstelle ist ein Verbindungspunkt zwischen einem Computer und dem Netzwerk 304. Die Steuereinheit/Prozessor 110 ist über das Netzwerk 304 durch ein Kommunikationsmittel verbunden, um strukturierte und unstrukturierte Daten aus dem Computer über die Netzwerkschnittstelle 302 zu extrahieren. Die extrahierten strukturierten und unstrukturierten Daten werden ferner in einer Datenbank 306 gespeichert, die mit dem Cloud-Server 114 verbunden ist.
4 zeigt eine Einheit zur Extraktion und Verarbeitung von Eingabedaten in Übereinstimmung mit einer Ausführungsform der vorliegenden Offenbarung. Die Verarbeitungseinheit 102 zur Extraktion von Eingabedaten nimmt Eingaben von verschiedenen Websites 402 entgegen, die verhaltensbezogen und kontextbezogen sind. Die Verhaltensdaten sind wichtig, um skalierbare und künftige Empfehlungen für berufliche Qualifikationen zu geben. Bei den für das Eingangssignal verwendeten Ressourcen handelt es sich um LinkedIn-Profile und Daten in einem unstrukturierten Format, bei dem zweiten Signal um Klickdaten, die vom Benutzer stammen. Das Signal app wird ebenfalls aus der Benutzerdatendatei in einem strukturierten Layout gewonnen. Der letzte Block wird verwendet, um zwischen allen Einheiten zu unterscheiden, auch als DLM (Deep Learning Matcher) bezeichnet. Die extrahierten Daten werden in der MongoDB-Datenbank 306 zur weiteren Verarbeitung in Form von Verhaltens- und Kontextdaten gespeichert. Die Verhaltensdaten sind wichtig, um skalierbare und künftige Empfehlungen für berufliche Qualifikationen zu geben.
In einer anderen Ausführungsform sind die verarbeiteten Daten (PCAS-Eingabe) 404 der wesentliche Bestandteil der Job-Empfehlung, wobei sie die spezifische Technik für Empfehlungs- und Vorschlagszwecke auswählen. Der PCAS-Input 404 wird für das Feature Engineering 406 verwendet.
In einer anderen Ausführungsform wendet die Technik der induktiven Merkmalsextraktion 408 induktives Lernen für die Auswahl der besten Merkmale aus allen Datenkategorien an und erstellt die entsprechende Regel. Die ausgewählten Merkmale 410 werden verwendet, um die beste Fähigkeit und den besten Job zu finden und in der resultierenden Datenbank zu speichern. Ein neuer Ansatz behandelt den fehlenden Wert, der als fehlende induktive Lerntechnik 412 bezeichnet wird, die die komplexen Daten reduziert, eine schnelle Verarbeitung der Regelgenerierung ermöglicht und die Genauigkeit des Systems verbessert. Die bereinigten und geordneten Merkmale 414 werden für die weitere Verarbeitung von Worttrigrammen im Spark-Datenrahmen gespeichert.
5 veranschaulicht einen Job-Trigram-Ansatz für Job-Empfehlungen und Qualifikationsvorschläge in Übereinstimmung mit einer Ausführungsform der vorliegenden Offenlegung. Dieser Schritt setzt die vorherige Phase fort, in der die im Funken-Datenrahmen gespeicherten Merkmale 414 bereinigt wurden. Die Wort-Hashing-Einheit 108 wird auf den resultierenden Datensatz angewendet und erzeugt das Job-Trigramm. Die Termvektorschicht 502 erzeugt den Hash-Vektor 508 für die Stelle, und die Wahrnehmungsschicht 503 erstellt die Rangfolge der Kandidaten auf der Grundlage ihrer Punktzahl. Die endgültige Rangfolge der Stellen und der Qualifikationsvektor 510 werden von einer Ausgabeschicht 506 generiert und in der resultierenden Datenbank gespeichert, die als Eingabe für die Graphtechnik dient.
6 zeigt ein graphenbasiertes Modell mit induktivem Lernen in Übereinstimmung mit einer Ausführungsform der vorliegenden Offenbarung. 6 zeigt den graphbasierten Ansatz für eine skalierbare Empfehlung; die graphbasierte Technik ist vielfältig. Die Daten aus der Datenbank 306 und die Verhaltensdaten 602 werden in eine GraphX-Datenbank 604 eingespeist und dabei wird induktives Feature Engineering 606 zur Merkmalsextraktion angewendet.
In einer anderen Ausführungsform wird eine Graphtechnik-Auswahleinheit 608 zur Auswahl einer Graphtechnik eingesetzt, wobei die Page-Rank-Technik und die modifizierte Page-Rank-Technik für Analysezwecke ausgewählt werden. Die Page-Rank-Technik und die modifizierte Page-Rank-Technik sind für diesen Zweck konzipiert. Die Auswahl der Techniken des graphbasierten Modells mit induktivem Lernen wird in vier Kategorien zusammengefasst: erstens für die Seitenauswahl und zweitens für die Induktion. Die Berechnung des Seitenrangs erfolgt durch die Berechnung der Ähnlichkeit unter Verwendung notwendiger Approximationen. Es wird angenommen, dass alle Knoten mindestens einen Nachfolger haben, d-out(j) > 0. Dann kann die Übergangswahrscheinlichkeitsmatrix P wie folgt berechnet werden:
Berechnen Sie die Wahrscheinlichkeitsverteilung im nächsten Zyklus (unter Hinzufügung des Dämpfungsfaktors). Der Dämpfungsfaktor erhöht auch die Leistung des Page Rank, so dass die verschiedenen hier verwendeten Dämpfungsfaktoren wie unten dargestellt berechnet werden:
Die Page-Rank-Technik leidet unter Spamming, Indexmanipulation und erhöht die Position bestimmter Seiten, und die Websites wachsen weiter. Speicherplatzprobleme und die Matrix kann die Hauptspeicherkapazität übersteigen. Die Komprimierung der Daten und das modifizierte PageRank-Verfahren werden die bevorzugte Lösung sein.
Modifiziertes PageRank-Verfahren: Die Idee hinter dem modifizierten PageRank besteht darin, ein Anpassungsgewicht für jeden aus dem Datensatz entdeckten Vertex-Outlink festzulegen. In dieser Technik zählen, die Anzahl der Ereignisse von einem Job zu einem anderen normalisiert jede Position, seine Wahrscheinlichkeit zu vertreten. PageRank wird mit dem neuen Wert ausgeführt, und jede Seite hat Inlinks von Seiten, die neben ihr gekennzeichnet sind. Der Cache-Speicher spielt eine wesentliche Rolle bei der Beschleunigung des Prozesses, und der Page Rank-Vektor führt die Abfrageverarbeitung durch. Die modifizierte Version der PageRank-Technik wird für personalisierte Job-Empfehlungen verwendet, was sehr hilfreich sein wird. $\begin{array}{l} P (A) = \frac{1 - d}{N} + d \sum P (u) * M u^{T} \\ V e B u \end{array}$
Nach der Auswahl der Technik wählt eine Parameterberechnungseinheit 610 den spezifischen Parameter für die Graphenberechnung aus, wie z.B. die Punktzahl und die Rangfolge der Graphen, die die Popularität des Graphen anzeigt, und vergleicht die Graphenergebnisse mit den Ergebnissen des bestehenden Systems; Wenn eine Verbesserung festgestellt wird, erfolgt eine Parameterabstimmung und quantitative Bewertung durch eine Einheit 612 für die Parameterabstimmung und quantitative Bewertung; andernfalls verarbeitet das System weitere Daten. Danach wird die Auftragsempfehlung 614 mit ADAMS durchgeführt.
7 zeigt ein Job- und Qualifikationsempfehlungsmodell in Übereinstimmung mit einer Ausführungsform der vorliegenden Offenlegung. Das Job- und Qualifikationsempfehlungsmodell ist das primäre Empfehlungsmodell, in dem das System 100 zwei Arten von Empfehlungen ausspricht, eine für den Benutzer, der bereits arbeitet, und eine für einen neuen Benutzer, der sich zum ersten Mal für einen Job angemeldet hat. Bei der zweiten Art von Empfehlungen werden anhand von Empfehlungskriterien die Qualifikationslücken ermittelt und Vorschläge für die zukünftige Karriere auf der Grundlage der aktuellen Marktnachfrage gemacht.
In einer anderen Ausführungsform ist die Abstimmung der Hyper-Parameter und der Systemanforderungen das Herzstück der Job-Empfehlung. Diese Autoscaling-Funktion wird die Empfehlung Stream Entitäten ohne Reengineering der Systemanforderung geben.
In einer beispielhaften Ausführungsform wird ein Xavier-Initialisierer verwendet, um die Modellparameter und die Eingabe- und Ausgabeschicht zu initialisieren und das Modell mit dem Adam-Optimierer zu optimieren. Die XGBoost- und Mini-Batch-Größe und die Lernrate werden in [1024; 5120; 10240] bzw. [0:0001; 0:0005; 0:001] gesucht. Die Anzahl der Word-Hashing-Schichten in der Empfehlungskomponente und der Wissensgrapheneinbettungskomponente wird durchsucht [1; 2; 3]. Die 300-dimensionalen Worteinbettungen werden durch Wort-Hashing trainiert und erzeugen so die entsprechenden Satzvektoren unter Verwendung der semantischen Technik. Schließlich wird die Dimension aller Entitäten auf 64 festgelegt. Der gepaarte t-Test führte einen Signifikanztest mit Hilfe des gepaarten t-Tests durch. Unterschiede werden als statistisch signifikant angesehen, wenn der p-Wert kleiner als 0.05 ist.
Im Career Builder-Datensatz wird davon ausgegangen, dass eine Stellenbeschreibung parallel zu den Fähigkeiten der Nutzer vorliegt. Die großen Mengen der Job-Skill-Daten 702 und der Graphenempfehlungsdaten 704 werden einer induktiven Fehlwert- und Merkmalsauswahltechnik 706 zugeführt, um mindestens eine Technik auszuwählen, die anschließend in einer Funken-Speicherverwaltungseinheit 708 gespeichert wird und so zur Erstellung der endgültigen empfohlenen Jobliste 710 verwendet wird.
In einer Ausführungsform bieten ein autoskalierbares, effizientes Job-Empfehlungssystem und eine Methodik geeignete Job-Empfehlungen und Qualifikationsvorschläge für den zukünftigen Job auf der Grundlage der jüngsten Erfahrungen. Das Modul zur Datenspeicherung und - extraktion wird verwendet, um die Daten von verschiedenen Websites zu extrahieren und in einer kostenlosen Cloud-Quelle für die weitere Verarbeitung zu speichern. Azure AWS ist die beste Lösung für diese Aufgabe. Die Wort-Hashing-Technik wird verwendet, um die Semantik von Jobs und Fähigkeiten mit neuartigen Techniken zu extrahieren und die Ergebnisse in der Spark-Datenbank zu speichern.
Das entwickelte System erleichtert es, die Graphverarbeitungstechnik für eine Empfehlung für Job und Fähigkeiten bereitzustellen. Das entwickelte System ermöglicht ein automatisiertes Modul, um die Datengröße und das Format anzupassen und in einem kompakten Speicher zu speichern. Das entwickelte System verfügt über ein Modul zur Verarbeitung von Echtzeitdaten mit Hilfe von Deep-Learning-Methoden. Es bietet eine Schnittstelle für das Empfehlungsmodul, um empfohlene Jobs und Fähigkeiten aufzulisten.
In einer alternativen Ausführungsform wird ein Verfahren zur Erstellung eines effizienten, automatisch skalierbaren Job-Empfehlungssystems (EAJRs) auf der Grundlage der aktuellen Standorte der Benutzer bereitgestellt. EAJRs ist ein verallgemeinertes System, das verwendet werden kann, wenn die Skalierbarkeit der Daten oder des Systems ein wichtiger Faktor ist. Die herausragende Architektur des Systems umfasst vier Hauptblöcke, wobei jeder Block unabhängig arbeitet. Der erste Block dient der Anpassung des Arbeitsspeichers und der Speicherung sowie der Skalierbarkeit des gesamten Systems. Apache Spark ist die primäre Arbeitsumgebung für diese Phase; der zweite Block umfasst das Datenextraktionsmodul und das Feature Engineering. In diesem Block werden verschiedene Methoden und Techniken zur Extraktion von Daten ohne Verlust ihres Formats und ihrer Eigenschaften diskutiert. Bei der Datenextraktion werden Daten von Stellenbörsen wie LinkedIn, CareerBuilder usw. und Daten von der Website des Personalvermittlers, auf der die Stellenanforderungen aufgeführt sind, extrahiert. Diese beiden Datensätze werden in unserer System-Cloud gespeichert. Beide Datensätze werden mit einer fortschrittlichen Technik bereinigt und vorverarbeitet - die daraus resultierenden Daten werden als Input für das Modell verwendet. Die Eingabedaten sollten in beiden Formen vorliegen (verhaltensbezogen und kontextbezogen), und es wird die erweiterte DSSM-Technik auf die Eingabedaten angewendet. Das Ergebnis dieses Prozesses ist eine Rangfolge der Aufträge.
Die Skalierbarkeit des Systems wird durch ein automatisches Skalierungsverfahren aufrechterhalten, das die Daten entsprechend der Systemkonfiguration automatisch und ohne Reengineering-Kosten verarbeitet. Autoskalierung: Heutzutage arbeitet eine Empfehlungsmaschine in jedem Bereich, aber einige Dienste wie die automatische Skalierung des Servers und die Speicherverwaltung zur Laufzeit sind für das neue rs-Modell erforderlich. Autoscaling RS ist also eine Maschine, die Daten mehr als 1/m Benutzer skaliert. Dieser einfache Prozess erforderte keine zusätzliche Hardware-Einrichtung, da eine Technik zur Skalierung unseres vorhandenen Servers entsprechend unserer Nutzung verwendet wurde. Big-Data-Technologie und verteilte Datenverwaltung sind einzigartige Werkzeuge für diesen Zweck. Spark ist eine führende Lösung, da es viele APIs bietet, die Fehlertoleranz unterstützen und die Systemleistung verbessern. Die Sprache Scala und induktives Lernen werden eingesetzt, um den prozeduralen Code in ein einziges Repository zu refaktorieren. Induktives Lernen liefert automatisch Regeln für das Feature Engineering und die Validierung von Testfällen. Um dies zu erreichen, werden eine kontinuierliche Bereitstellung und viele Microservices verwendet.
Die Figuren und die vorangehende Beschreibung geben Beispiele für Ausführungsformen. Der Fachmann wird verstehen, dass eines oder mehrere der beschriebenen Elemente durchaus zu einem einzigen Funktionselement kombiniert werden können. Alternativ dazu können bestimmte Elemente in mehrere Funktionselemente aufgeteilt werden. Elemente aus einer Ausführungsform können einer anderen Ausführungsform hinzugefügt werden. So kann beispielsweise die Reihenfolge der hier beschriebenen Prozesse geändert werden und ist nicht auf die hier beschriebene Weise beschränkt. Außerdem müssen die Handlungen eines Flussdiagramms nicht in der gezeigten Reihenfolge ausgeführt werden; auch müssen nicht unbedingt alle Handlungen durchgeführt werden. Auch können diejenigen Handlungen, die nicht von anderen Handlungen abhängig sind, parallel zu den anderen Handlungen ausgeführt werden. Der Umfang der Ausführungsformen ist durch diese spezifischen Beispiele keineswegs begrenzt. Zahlreiche Variationen sind möglich, unabhängig davon, ob sie in der Beschreibung explizit aufgeführt sind oder nicht, wie z. B. Unterschiede in der Struktur, den Abmessungen und der Verwendung von Materialien. Der Umfang der Ausführungsformen ist mindestens so groß wie in den folgenden Ansprüchen angegeben.
Vorteile, andere Vorzüge und Problemlösungen wurden oben im Hinblick auf bestimmte Ausführungsformen beschrieben. Die Vorteile, Vorzüge, Problemlösungen und Komponenten, die dazu führen können, dass ein Vorteil, ein Nutzen oder eine Lösung auftritt oder ausgeprägter wird, sind jedoch nicht als kritisches, erforderliches oder wesentliches Merkmal oder Komponente eines oder aller Ansprüche zu verstehen.
Bezugszeichenliste

100: Ein automatisch skalierbares System für optimierte Arbeitsempfehlungen
102: Verarbeitungseinheit für Datenextraktion
104: Vorverarbeitungseinheit
106: Einheit zur Merkmalsextraktion
108: Wort-Hashing-Einheit
110: Steuereinheit/Prozessor
112: Trainingsmodell/ Job-Empfehlungseinheit
114: Server- und Speicherverwaltungseinheit/ Automatische Skalierungseinheit
116: Benutzerschnittstelle
302: Netzwerkschnittstelle
304: Netzwerk
306: Datenbank/ Bereinigte Datenbank
402: Verschiedene Websites
404: Verarbeitete Daten (PCAS-Einheit)
406: PCAS-Eingabe für Feature Engineering
408: Anwendung der induktiven Merkmalsextraktionstechnik
410: Ausgewählte Merkmale
412: Anwendung der induktiven Technik des fehlenden Lernens
414: Bereinigte Merkmale
502: Term-Vektor-Schicht
504: Wahrnehmungsschicht
506: Ausgabeschicht
508: Harshad-Vektor
510: Rangfolge der wichtigsten beruflichen Fähigkeiten
602: Verhaltensbasierte Daten
604: GraphX-Datenbank
606: Induktive Merkmalstechnik
608: Einheit zur Auswahl von Graphtechniken
610: Graph-Parameter-Berechnungseinheit
612: Parameterabstimmung und quantitative Auswertung
614: Job-Empfehlung
702: Job- und Qualifikationsdaten
704: Graphische Empfehlungsdaten
706: Induktives Verfahren zur Auswahl fehlender Werte und Merkmale
708: Spark-Speicherverwaltungseinheit
710: Endgültig empfohlene Jobliste

Claims

Ein automatisch skalierbares System für optimierte Arbeitsempfehlungen, wobei das System umfasst: eine Datenextraktionsverarbeitungseinheit, um strukturierte und unstrukturierte Daten aus verschiedenen Websites zu extrahieren, wobei der strukturierte und unstrukturierte Dateninput sowohl in verhaltensbezogener als auch in kontextbezogener Form verfügbar ist; eine Vorverarbeitungseinheit zur Umwandlung der strukturierten und unstrukturierten Daten in ein benutzerdefiniertes Format und zur Entfernung von Rauschen aus den markanten Merkmalen; eine Merkmalsextraktionseinheit zur Auswahl markanter Merkmale aus strukturierten und unstrukturierten Daten; eine Wort-Hashing-Einheit zum Erzeugen eines Phrasen-Trigramms für Job- und Qualifikationsmerkmale, um eine Qualifikationslücke zu reduzieren und verallgemeinerte Qualifikations- und Jobempfehlungen zu erzeugen, wobei die Wort-Hashing-Einheit eine graphbasierte Technik umfasst, die einen modifizierten Page-Rank-Ansatz verwendet, um eine geordnete Jobliste und Qualifikationsliste zu erzeugen; und eine Steuereinheit, die so konfiguriert ist, dass sie ein Trainingsmodell entwickelt, um eine optimierte Arbeitsempfehlung für eine zukünftige Beschäftigung bereitzustellen, wobei das Trainingsmodell eine Vielzahl von maschinellen Lerntechniken zur Bereitstellung von Arbeitsempfehlungen verwendet.
System nach Anspruch 1, wobei das System einen Cloud-Server für die Speicherung strukturierter und unstrukturierter Daten umfasst.
System nach Anspruch 1, wobei die Skalierbarkeit des Systems durch einen Autoskalierungsprozess aufrechterhalten wird, der automatisch Daten entsprechend der Systemkonfiguration ohne Reengineering-Kosten verarbeitet.
System nach Anspruch 1, wobei die Merkmalstechnik zur Auswahl herausragender Merkmale und zur Behandlung verrauschter Daten eingesetzt wird.
System nach Anspruch 3, wobei die automatische Skalierung auf der Grundlage von Big-Data-Technologie und verteiltem Datenmanagement durchgeführt wird.
System nach Anspruch 1, wobei die automatische Skalierung das System beobachtet und automatisch die vorhersehbare Leistung zu den geringstmöglichen Kosten stetig anpasst, wobei die automatische Skalierung zugänglich ist, um die Anwendungsskalierung für mehrere Ressourcen über mehrere Dienste hinweg in Minuten einzurichten.
System nach Anspruch 1, wobei das System eine Benutzerschnittstelle zur Erstellung von RessourcenSkalierungsplänen umfasst.
Das System nach Anspruch 1, wobei die extrahierten Daten in einer Datenbank gespeichert werden, die mit dem Cloud-Server in Form von Verhaltens- und Kontextdaten verbunden ist, wobei die Verhaltensdaten wesentlich sind, um skalierbare und zukünftige Empfehlungen für berufliche Fähigkeiten zu geben.
System nach Anspruch 1, wobei die Merkmalsextraktionseinheit mindestens zwei verschiedene Merkmalstechniken umfasst, die als ILA-3 und ILA-4 bezeichnet werden, die relevante Merkmale extrahieren und irrelevante und doppelte Merkmale ignorieren, wobei die mindestens zwei verschiedenen Merkmalstechniken verwendet werden, um fehlende und verrauschte Werte zu behandeln, indem die ILA-4-Technik überwunden wird.
Das System nach Anspruch 1, wobei die fehlenden Werte durch eine induktive Technik verwaltet werden, die die komplexen Daten reduziert und die schnelle Regelgenerierungsverarbeitung ermöglicht, wobei die bereinigten und geordneten Merkmale in einem Spark-Datenrahmen für die weitere Verarbeitung von Word Trigram gespeichert werden.