BE1027696A1 - ANALYSIS AND COMPARISON OF SIGN-CODED DIGITAL DATA, IN PARTICULAR FOR JOB MATCHING - Google Patents
ANALYSIS AND COMPARISON OF SIGN-CODED DIGITAL DATA, IN PARTICULAR FOR JOB MATCHING Download PDFInfo
- Publication number
- BE1027696A1 BE1027696A1 BE20205783A BE202005783A BE1027696A1 BE 1027696 A1 BE1027696 A1 BE 1027696A1 BE 20205783 A BE20205783 A BE 20205783A BE 202005783 A BE202005783 A BE 202005783A BE 1027696 A1 BE1027696 A1 BE 1027696A1
- Authority
- BE
- Belgium
- Prior art keywords
- concept
- job
- computer
- natural language
- concepts
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
- G06Q10/1053—Employment or hiring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Machine Translation (AREA)
Abstract
Computer-geïmplementeerde ‘job matching’ wordt geopenbaard. Op basis van een combinatie van patroonvergelijking en conceptextractie uit natuurlijke taalinformatie, wordt een template automatisch aangepast met een abstract concept van een conceptnetwerk. Conceptextractie is gebaseerd op het in verband brengen van een natuurlijke taaluiting met een abstract concept van een conceptnetwerk. Patroonvergelijking wordt gebruikt om onderscheid te maken tussen relevante en irrelevante natuurlijke taaluitingen op basis van de context van een natuurlijke taaluiting. Voor elk van de verschillende combinaties van een kandidaat en een job wordt automatisch een numerieke matchwaarde berekend op basis van de overeenkomstige kandidaat- en jobtemplates. Een geordende lijst geassocieerd met de meerdere verschillende combinaties wordt weergegeven via een visualisatiemiddel, of naar een gebruikersapparaat gestuurd voor weergave via een visualisatiemiddel. De lijst bevat een ordening op basis van de numerieke matchwaardes.Computer-implemented job matching is revealed. Based on a combination of pattern matching and concept extraction from natural language information, a template is automatically adapted with an abstract concept of a concept network. Concept extraction is based on associating a natural language utterance with an abstract concept of a concept network. Pattern matching is used to distinguish between relevant and irrelevant natural utterances based on the context of a natural utterance. For each of the different combinations of a candidate and a job, a numeric match value is automatically calculated based on the corresponding candidate and job templates. An ordered list associated with the multiple different combinations is displayed via a visualization means, or sent to a user device for display via a visualization means. The list contains an order based on the numerical match values.
Description
GEBIED VAN DE UITVINDING De onderhavige uitvinding heeft betrekking op computer-geïmplementeerde analyse en vergelijking van tekengecodeerde digitale gegevens, in het bijzonder lexicale, woordgroep en semantische analyse (GO6F 17/27), evenals natuurlijke-taalverwerking en -generatie (G06F 17/28).FIELD OF THE INVENTION The present invention relates to computer-implemented analysis and comparison of character-encoded digital data, in particular lexical, word group, and semantic analysis (GO6F 17/27), as well as natural language processing and generation (G06F 17/28) .
ACHTERGROND WO 2019/106 437 A2 beschrijft een computer-geïmplementeerde werkwijze voor het matchen van biedingen voor werk (bv. vacatures) met werkaanbiedingen (bv. cv's).BACKGROUND WO 2019/106 437 A2 describes a computer-implemented method for matching bids for work (eg vacancies) with job offers (eg resumes).
Natuurlijke taalverwerkingstechnieken worden gebruikt om werk specifieke terminologie uit de biedingen voor werk en/of werkaanbiedingen te interpreteren. De biedingen voor werk worden gematcht met de werkaanbiedingen op basis van een vooraf bepaalde afstandsmaat tussen de biedingen voor werk en de werkaanbiedingen.Natural language processing techniques are used to interpret job specific terminology from job bids and / or job offers. The bids for work are matched with the job offers based on a predetermined distance measure between the bids for work and the job offers.
WO 2019/106 437 A2 openbaart een gecompartimenteerde set van woordenschattermen (Jobzi Ontology), die gecontextualiseerd, in een hiërarchie geplaatst, synoniem-verrijkt en relatie-georiënteerd. Relaties tussen termen kunnen verschillende vormen aannemen, zoals ‘is een synoniem voor’, ‘maakt deel uit van’, ‘is een’, etc.WO 2019/106 437 A2 discloses a compartmentalized set of vocabulary terms (Jobzi Ontology) that are contextualized, hierarchical, synonym-enriched and relationship-oriented. Relationships between terms can take various forms, such as "is a synonym for", "is part of", "is a", etc.
WO 2019/106 437 A2 openbaart een met elkaar in verband brengen (Meta Work) van een functietitel met bijbehorende informatie zoals kennis, vaardigheden, cursussen en professionele vereisten, waaronder ervaring en salaris. Vaardigheden worden gewogen, wat het belang van een vaardigheid voor de functietitel aangeeft. Het matchen is gebaseerd op gewogen vaardigheden.WO 2019/106 437 A2 discloses a correlation (Meta Work) of a job title with associated information such as knowledge, skills, courses and professional requirements, including experience and salary. Skills are weighted, which indicates the importance of a skill to the job title. Matching is based on weighted skills.
WO 2019/106 437 A2 openbaart het straffen van het vervallen van ervaring, bijvoorbeeld 10 jaar geleden als ‘vrachtwagenchauffeur’ hebben gewerkt versus momenteel werken als ‘vrachtwagenchauffeur’.WO 2019/106 437 A2 discloses penalties for lapsing of experience, for example having worked as a "truck driver" 10 years ago versus currently working as a "truck driver".
WO 2019/106 437 A2 is echter niet geschikt voor het parsen van documenten met narratieve informatie, zoals ‘ik ben een marketingdirecteur, rapporterend aan de algemeen directeur’, zoals vaak wordt aangetroffen in een sollicitatiebrief. Met de methodologie van WO 2019/106 437 A2 zou het onduidelijk zijn of ‘marketingdirecteur’, ‘algemeen manager’, geen of beide relevant zijn.However, WO 2019/106 437 A2 is not suitable for parsing documents with narrative information, such as "I am a marketing director, reporting to the general manager", as is often found in a letter of application. With the methodology of WO 2019/106 437 A2, it would be unclear whether "marketing director", "general manager", neither or both are relevant.
WO 2019/106 437 A2 openbaart automatisch parsen van cv's en vacatures, maar zwijgt over verificatie van de geparsde informatie.WO 2019/106 437 A2 discloses automatic parsing of resumes and vacancies, but is silent about verification of the parsed information.
WO 2019/106 437 A2 beschrijft een ontologie, maar zwijgt over de creatie van de ontologie. Op een snel evoluerende arbeidsmarkt, met nieuwe functietitels en vaardigheden die opkomen en afnemen, is het handhaven van de ontologie arbeidsintensief.WO 2019/106 437 A2 describes an ontology, but is silent about the creation of the ontology. In a rapidly evolving job market, with new job titles and skills emerging and declining, maintaining ontology is labor-intensive.
WO 2019/106 437 A2 beschrijft een ontologie, maar zwijgt over het gebruik van meerdere talen.WO 2019/106 437 A2 describes an ontology, but is silent about the use of multiple languages.
Speer, Chin en Havasi, getiteld ‘ConceptNet 5.5: ‘An Open Multilingual Graph of General Knowledge’, in Proceedings of the Thirty-First AAA! Conference on Artificial Intelligence (AAAI-17), pagina’s 4444-4451 (2017) openbaart een meertalig conceptnetwerk. Een conceptnetwerk is een kennisgrafiek die woorden en woordgroepen verbindt met gelabelde randen (bv. ‘Synoniem’, ‘FormOf’). Meertalige functionaliteit wordt gerealiseerd in ConceptNet door termen te labelen met een taal (bv. ‘en’, ‘fr’, ‘it’) en woorden in verschillende talen te koppelen, bv. via een ‘synoniem’-relatie, bv. ‘polyglotte (fr)' zijnde een ‘synoniem’ van ‘meertalig (en)’.Speer, Chin and Havasi, entitled "ConceptNet 5.5:" An Open Multilingual Graph of General Knowledge ", in Proceedings of the Thirty-First AAA! Conference on Artificial Intelligence (AAAI-17), pages 4444-4451 (2017) discloses a multilingual concept network. A concept network is a knowledge graph that connects words and phrases with labeled edges (eg "Synonym", "FormOf"). Multilingual functionality is realized in ConceptNet by labeling terms with a language (e.g. 'en', 'fr', 'it') and linking words in different languages, e.g. via a 'synonym' relationship, e.g. 'polyglotte (fr) 'being a' synonym 'of' multilingual (en) '.
Een probleem met het conceptnetwerk van Speer (2017) is dat een meertalige diversiteit aan natuurlijke taaluitingen die als synoniemen kunnen worden aangeduid, elk één of meer typische gangbare betekenissen in een bepaalde taal kunnen omvatten, waarvan bijzonderheden of gedeeltelijke overlappingen verloren kunnen gaan in vertaling.A problem with Speer's (2017) concept network is that a multilingual diversity of natural language utterances that can be referred to as synonyms can each include one or more typical common meanings in a particular language, details or partial overlaps of which can be lost in translation.
De huidige uitvinding beoogt een oplossing te vinden voor ten minste enkele van bovenvermelde problemen.The present invention seeks to solve at least some of the above problems.
SAMENVATTING VAN DE UITVINDING In een eerste aspect voorziet de onderhavige uitvinding in een computer- geïmplementeerde werkwijze voor ‘job matching’, volgens conclusie 1.SUMMARY OF THE INVENTION In a first aspect, the present invention provides a computer-implemented job matching method according to claim 1.
In een tweede aspect voorziet de onderhavige uitvinding in een computersysteem voor ‘job matching’, waarbij het computersysteem, zoals een server, middelen omvat, zoals een processor, geconfigureerd om de werkwijze volgens het eerste aspect uit te voeren.In a second aspect, the present invention provides a computer system for "job matching", wherein the computer system, such as a server, includes means, such as a processor, configured to perform the method according to the first aspect.
In een derde aspect voorziet de onderhavige uitvinding in een computerprogramma voor ‘job matching’, waarbij het computerprogramma instructies omvat die, wanneer het computerprogramma wordt uitgevoerd door een computer, zoals een computersysteem volgens het tweede aspect, ervoor zorgen dat de computer de methode volgens het eerste aspect uitvoert.In a third aspect, the present invention provides a computer program for job matching, wherein the computer program includes instructions that, when the computer program is executed by a computer, such as a computer system according to the second aspect, cause the computer to perform the method according to the first aspect.
De onderhavige uitvinding kan verder voorzien in een fysieke, duurzame computerleesbare gegevensdrager, zoals een compact disc (CD), een harde schijf (HDD) of een solid state drive (SSD), die het computerprogramma omvat.The present invention can further provide a physical, durable computer-readable data carrier, such as a compact disc (CD), a hard disk (HDD), or a solid state drive (SSD), that contains the computer program.
De drie aspecten van de onderhavige uitvinding hangen met elkaar samen.The three aspects of the present invention are interrelated.
Daarom kan elk kenmerk dat hierboven of hieronder wordt beschreven, betrekking hebben op elk van de aspecten van de onderhavige uitvinding, zelfs als het is beschreven in samenhang met een bepaald aspect.Therefore, any feature described above or below may pertain to any of the aspects of the present invention, even if described in conjunction with a particular aspect.
De patroonvergelijking maakt het mogelijk om natuurlijke taalinformatie in narratieve vorm te verwerken, waardoor onderscheid wordt gemaakt tussen relevante en irrelevante natuurlijke taaluitingen.The pattern comparison makes it possible to process natural language information in narrative form, so that a distinction is made between relevant and irrelevant natural language utterances.
In de uiting ‘Ik ben een marketingdirecteur, rapporterend aan de algemeen directeur en nauw samenwerkend met een grafisch ontwerper’, kunnen bijvoorbeeld drie natuurlijke taaluitingen worden geïdentificeerd (bv. ‘marketingdirecteur (nl)’; ‘algemeen directeur (nl)'; en ‘grafisch ontwerper (nl)’) gerelateerd aan abstracte beroepconcepten (bv.For example, in the statement 'I am a marketing director, reporting to the CEO and working closely with a graphic designer', three natural language utterances can be identified (e.g. 'marketing director (nl)'; 'general manager (nl)'; and ' graphic designer (nl) ') related to abstract professional concepts (eg.
Marketing Directeur_OCC; Algemeen_ Directeur OCC; en Grafisch_Ontwerper_OCC). Via patroonvergelijking kan worden vastgesteld dat het beroep van de persoon geassocieerd met de narratieve tekst, meestal een kandidaat, marketing directeur is en niet algemeen directeur of grafisch ontwerper.Marketing Director_OCC; General_ Director of OCC; and Graphic_Designer_OCC). Pattern matching can determine that the person's profession associated with the narrative text is usually a candidate, marketing director and not general manager or graphic designer.
Dit moet worden gecontrasteerd met een template dat is ingevuld in een natuurlijke taal, waarbij a priori verbanden duidelijk zijn via de velden van het template, d.w.z. een natuurlijke taaluiting in het veld voor het huidige beroep zijnde natuurlijke taalinformatie van het huidige beroep van de kandidaat.This should be contrasted with a template completed in a natural language, where a priori relationships are clear through the fields of the template, i.e. a natural language utterance in the field for the current profession being natural language information of the candidate's current profession.
De onderhavige uitvinding voorziet in het bijzonder in het automatisch ten minste gedeeltelijk invullen van een template met abstracte concepten van een conceptnetwerk gebaseerd op natuurlijke taalinformatie in narratieve vorm, zoals een sollicitatiebrief of een vacature, gebaseerd op een combinatie van patroonvergelijking en conceptextractie uit de natuurlijke taalinformatie in narratieve vorm.In particular, the present invention provides for the automatic at least partial filling of a template with abstract concepts of a concept network based on natural language information in narrative form, such as a cover letter or a vacancy, based on a combination of pattern comparison and concept extraction from the natural language information. in narrative form.
De natuurlijke taalinformatie in narratieve vorm wordt geleverd als tekengecodeerde digitale gegevens. Deze automatisering vermindert de noodzaak om handmatig verschillende templates in te vullen. Templatewijziging kan worden uitgevoerd voor een kandidaat en/of een job, zoals een sollicitatiebrief van een kandidaat of een vacature voor een job.The natural language information in narrative form is provided as character-coded digital data. This automation reduces the need to manually fill in different templates. Template change can be performed for a candidate and / or a job, such as a candidate's cover letter or a job posting.
Verdere voordelen van de uitvinding, en in het bijzonder van voorkeursuitvoeringen, worden beschreven in de onderstaande gedetailleerde beschrijving.Further advantages of the invention, and in particular of preferred embodiments, are described in the detailed description below.
GEDETAI LLEERDE BESCHRIJVING VAN DE UITVINDING De onderhavige uitvinding heeft betrekking op een computer-geïmplementeerde werkwijze, een computersysteem en een computerprogramma voor ‘job matching’. De onderhavige uitvinding is samengevat in de overeenkomstige sectie hierboven. In wat volgt wordt de onderhavige uitvinding in detail beschreven, worden voorkeursuitvoeringen besproken en wordt de onderhavige uitvinding geïllustreerd door middel van niet-limitatieve voorbeelden.DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a computer-implemented method, a computer system and a computer program for job matching. The present invention is summarized in the corresponding section above. In the following, the present invention is described in detail, preferred embodiments are discussed, and the present invention is illustrated by means of non-limiting examples.
Tenzij anders gedefinieerd, hebben alle termen die worden gebruikt bij het openbaren van de uitvinding, met inbegrip van technische en wetenschappelijke termen, de betekenis zoals gewoonlijk begrepen door een gemiddelde vakman in het vakgebied waartoe deze uitvinding behoort. Bij wijze van verdere begeleiding, zijn term definities inbegrepen om de leer van de onderhavige uitvinding beter te waarderen.Unless defined otherwise, all terms used in disclosing the invention, including technical and scientific terms, have the meaning commonly understood by one of ordinary skill in the art to which this invention belongs. By way of further guidance, term definitions are included to better appreciate the teachings of the present invention.
‘Een’, ‘de’ en ‘het’, zoals ze hierin worden gebruikt, omvatten zowel enkelvoudige als meervoudige referenten, tenzij de context duidelijk anders aangeeft. Bij wijze van voorbeeld verwijst ‘een compartiment’ naar één of meer compartimenten."A," "the", and "the", as used herein, include both single and multiple referees unless the context clearly indicates otherwise. By way of example, "a compartment" refers to one or more compartments.
‘Omvatten’, ‘omvattende’ en ‘omvat’ en ‘bestaande uit’ zoals hier gebruikt, zijn synoniem met ‘bevatten’, ‘bevattende’ of ‘bevat’ en zijn inclusieve of open termen die de aanwezigheid specificeren van wat volgt (bv. een component) en sluiten de aanwezigheid van aanvullende, niet-genoemde componenten, kenmerken, elementen, delen, stappen, die welbekend zijn in de stand der techniek of daarin beschreven zijn, niet uit.'Include', 'comprising' and 'includes' and 'consisting of' as used herein are synonymous with 'contain', 'containing' or 'contains' and are inclusive or open terms specifying the presence of what follows (eg. a component) and do not preclude the presence of additional, unnamed components, features, elements, parts, steps, which are well known in the art or described therein.
‘Gebaseerd op’ zoals hierin gebruikt, is synoniem met ‘ten minste gedeeltelijk gebaseerd op’ en is een inclusieve of open term die de aanwezigheid van wat volgt aangeeft en sluit de aanwezigheid van aanvullende, niet-genoemde componenten, kenmerken, delen, stappen, die welbekend zijn in de stand der techniek of daarin beschreven zijn, niet uit.'Based on' as used herein is synonymous with 'based at least in part on' and is an inclusive or open term that indicates the presence of what follows and excludes the presence of additional, unnamed components, features, parts, steps, well known in the art or described therein.
5 Voor elke kandidaat van één of meer kandidaten, bij voorkeur meerdere kandidaten, wordt een kandidaattemplate automatisch aangepast op basis van tekengecodeerde digitale gegevens die kandidaatinformatie omvatten die in een natuurlijke taal is uitgedrukt. Voor elke job van een of meer jobs, bij voorkeur meerdere jobs, wordt een jobtemplate automatisch aangepast op basis van tekengecodeerde digitale gegevens die job informatie omvatten die in een natuurlijke taal is uitgedrukt. Voor elk van meerdere verschillende combinaties van een kandidaat en een job, wordt automatisch een numerieke matchwaarde berekend op basis van corresponderende kandidaat- en jobtemplates, bij voorkeur gebaseerd op vooraf bepaalde heuristische regels, meer bij voorkeur gebaseerd op een vooraf gedefinieerde afstandsmaat tussen de kandidaat- en jobtemplates. Een geordende lijst geassocieerd met de meerdere verschillende combinaties wordt weergegeven via een visualisatiemiddel, of naar een gebruikersapparaat gestuurd voor weergave via een visualisatiemiddel. De lijst bevat een ordening op basis van de numerieke waarden.For each candidate from one or more candidates, preferably several candidates, a candidate template is automatically adapted on the basis of character-coded digital data comprising candidate information expressed in a natural language. For each job of one or more jobs, preferably several jobs, a job template is automatically adapted based on character-coded digital data that includes job information expressed in a natural language. For each of several different combinations of a candidate and a job, a numerical match value is automatically calculated based on corresponding candidate and job templates, preferably based on predetermined heuristic rules, more preferably based on a predefined distance measure between the candidate and job templates. and job templates. An ordered list associated with the multiple different combinations is displayed via a visualization means, or sent to a user device for display via a visualization means. The list is ordered based on the numeric values.
Een template wordt automatisch aangepast door het ophalen van een abstract concept van een conceptnetwerk op basis van een combinatie van patroonvergelijking en conceptextractie uit de natuurlijke taalinformatie in de tekengecodeerde digitale gegevens en het invoegen van het abstracte concept in de template. Een kandidaattemplate kan automatisch worden gewijzigd door het ophalen van een abstract concept van een conceptnetwerk op basis van een combinatie van patroonvergelijking en conceptextractie uit kandidaatinformatie uitgedrukt in een natuurlijke taal, in het bijzonder in narratieve vorm, vervat in tekengecodeerde digitale gegevens en het invoegen van het abstracte concept in de kandidaattemplate. Een jobtemplate kan automatisch worden gewijzigd door het ophalen van een abstract concept van een conceptnetwerk op basis van een combinatie van patroonvergelijking en conceptextractie uit job-informatie uitgedrukt in een natuurlijke taal, in het bijzonder in narratieve vorm, vervat in tekengecodeerde digitale gegevens en het invoegen van het abstracte concept in de jobtemplate. Conceptextractie is gebaseerd op het in verband brengen van een natuurlijke taaluiting met een abstract concept van een conceptnetwerk. Patroonvergelijking wordt gebruikt om onderscheid te maken tussen relevante en irrelevante natuurlijke taaluitingen op basis van de context van een natuurlijke taaluiting, in het bijzonder op basis van woordgroep analyse en/of semantische analyse van een woordgroep en/of alinea die een natuurlijke taaluiting bevat.A template is automatically adapted by retrieving an abstract concept of a concept network based on a combination of pattern matching and concept extraction from the natural language information in the character-encoded digital data and inserting the abstract concept into the template. A candidate template can be automatically modified by retrieving an abstract concept from a concept network based on a combination of pattern comparison and concept extraction from candidate information expressed in a natural language, in particular in narrative form, contained in character-encoded digital data and inserting the abstract concept in the candidate template. A job template can be automatically modified by retrieving an abstract concept from a concept network based on a combination of pattern comparison and concept extraction from job information expressed in a natural language, especially in narrative form, contained in character-encoded digital data and insertion of the abstract concept in the job template. Concept extraction is based on associating a natural language utterance with an abstract concept of a concept network. Pattern matching is used to distinguish between relevant and irrelevant natural language utterances based on the context of a natural utterance, in particular based on phrase analysis and / or semantic analysis of a phrase and / or paragraph containing a natural utterance.
Een ‘conceptnetwerk’ zoals hierin gebruikt, is synoniem met ‘ontologie’ en verwijst naar een kennisgrafiek die knooppunten en gelabelde randen omvat. Een ‘knooppunt’ van het conceptnetwerk vertegenwoordigt een abstract concept of een uiting in een natuurlijke taal. Bij voorkeur is een abstract concept een natuurlijk taalonafhankelijk concept, in de zin dat het niet in een natuurlijke taal als zodanig wordt gebruikt. Marketing Directeur OCC is bijvoorbeeld een abstract beroepsconcept voor ‘marketingdirecteur (nl)’. De eerste wordt als zodanig niet in gelijk welke natuurlijke taal gebruikt, terwijl de laatste wel in de natuurlijke taal Nederlands kan worden gebruikt. Een niet-beperkende lijst van voorbeelden van abstracte concepttypen omvat beroepsconcepten, competentieconcepten, werkervaringsconcepten en kwalificatie- (of onderwijs) concepten. Een ‘rand’ of ‘verbinding’ van het conceptnetwerk verbindt twee knooppunten en omvat een relatietype. Een relatie kan symmetrisch of asymmetrisch zijn. Een niet-beperkende lijst van voorbeelden van symmetrische relatietypen omvat antoniem‘, ‘verschillend van’, ‘etymologisch gerelateerd aan’, ‘nabijgelegen’, ‘gerelateerd aan‘, ‘vergelijkbaar met’ en ‘synoniem’. Een niet-beperkende lijst van voorbeelden van asymmetrische relatietypen omvat ‘op locatie’, ‘in staat tot’, ‘oorzaken’, ‘veroorzaakt verlangen’, ‘gemaakt door’, ‘gedefinieerd als’, ‘afgeleid van’, ‘verlangt’, ‘impliceert’, ‘externe URL’, ‘vorm van’, ‘heeft een’, ‘heeft context’, ‘heeft eerste subgebeurtenis’, ‘heeft laatste subgebeurtenis’, ‘heeft voorwaarde’, ‘heeft eigenschap’, ‘voorbeeld van’, ‘is een’, ‘gemaakt van’, ‘manier van’, ‘gemotiveerd door doel’, ‘belemmerd door’, ‘deel van’, ‘ontvangt actie’, ‘strekking van’, ‘symbool van’ en ‘gebruikt voor’. Zo is ‘conceptnetwerk‘ een ‘synoniem’ voor ‘ontologie’: ‘koper’ is een ‘metaal’; en ‘wiel’ is een ‘deel van’ een ‘auto’. Bijzondere relaties die worden gebruikt in het conceptnetwerk van de onderhavige uitvinding zijn ‘connotatie’, ‘bovenliggend’, ‘onderliggend’ en ‘heeft domein’-relaties.A "concept network" as used herein is synonymous with "ontology" and refers to a knowledge graph that includes nodes and labeled edges. A "node" of the concept network represents an abstract concept or an expression in a natural language. Preferably, an abstract concept is a natural language independent concept, in the sense that it is not used in a natural language as such. Marketing Director OCC, for example, is an abstract professional concept for "marketing director (nl)". The former as such is not used in any natural language, while the latter can be used in the natural language Dutch. A non-limiting list of examples of abstract concept types includes professional concepts, competence concepts, work experience concepts and qualification (or education) concepts. An "edge" or "connection" of the concept network connects two nodes and includes a relationship type. A relationship can be symmetrical or asymmetrical. A non-limiting list of examples of symmetric relationship types includes antonym "," different from "," etymologically related to "," nearby "," related to "," similar to "and" synonym ". A non-limiting list of examples of asymmetric relationship types includes 'on location', 'capable of', 'causes', 'causes desire', 'created by', 'defined as', 'derived from', 'desires', 'implies', 'external URL', 'form of', 'has a', 'has context', 'has first sub event', 'has last sub event', 'has condition', 'has property', 'example of' , 'is a', 'made of', 'way of', 'motivated by purpose', 'hindered by', 'part of', 'receives action', 'scope of', 'symbol of' and 'used for '. For example, "concept network" is a "synonym" for "ontology": "copper" is a "metal"; and "wheel" is "part of" a "car". Special relationships used in the concept network of the present invention are "connotation", "parent", "child" and "has domain" relationships.
Bij voorkeur omvat het conceptnetwerk een veelvoud aan onderling verbonden abstracte concepten. Bij voorkeur omvat het conceptnetwerk voor elk concept een uiting in een natuurlijke taal. Bij voorkeur omvat het conceptnetwerk voor elk concept een uiting in elke natuurlijke taal van meerdere natuurlijke talen. Bij voorkeur omvatten de meervoudige natuurlijke talen tenminste twee van Engels, Duits, Frans, Chinees, Japans, Spaans, Portugees, Zweeds, Deens, Italiaans en Nederlands. Bij voorkeur omvatten de meervoudige natuurlijke talen tenminste Engels, Duits, Frans, Chinees, Japans, Spaans, Portugees, Zweeds, Deens, Italiaans en Nederlands.Preferably, the concept network comprises a plurality of interconnected abstract concepts. Preferably, the concept network comprises an utterance in a natural language for each concept. Preferably, for each concept, the concept network comprises an utterance in each natural language of several natural languages. Preferably, the plural natural languages include at least two of English, German, French, Chinese, Japanese, Spanish, Portuguese, Swedish, Danish, Italian and Dutch. Preferably, the plural natural languages include at least English, German, French, Chinese, Japanese, Spanish, Portuguese, Swedish, Danish, Italian and Dutch.
Dit is voordelig omdat het mogelijk maakt om een cv of sollicitatiebrief in een eerste natuurlijke taal te matchen met een vacature in een tweede natuurlijke taal die verschilt van de eerste natuurlijke taal. In meertalige landen of regio’s, zoals België of Zwitserland, of in meertalige omgevingen, zoals Engels zijnde een geprefereerde wetenschappelijke communicatietaal, ongeacht de natuurlijke taal van de plaats, vermijdt dit de noodzaak om handmatig of automatisch een cv, sollicitatiebrief of vacature te vertalen, voordat de matching kan worden uitgevoerd. Bij voorkeur is een natuurlijke taaluiting verbonden met een abstract concept. Bij voorkeur is een natuurlijke taaluiting verbonden met een abstract concept door een synoniemenverbinding. Bij voorkeur is een natuurlijke taaluiting verbonden met één of meer abstracte concepten. Bij voorkeur is een natuurlijke taaluiting alleen verbonden met abstracte concepten. Bij voorkeur is een natuurlijke taaluiting niet verbonden met een andere natuurlijke taaluiting.This is advantageous because it makes it possible to match a resume or cover letter in a first natural language with a vacancy in a second natural language different from the first natural language. In multilingual countries or regions, such as Belgium or Switzerland, or in multilingual environments, such as English being a preferred scientific communication language, regardless of the natural language of the place, this avoids the need to manually or automatically translate a resume, cover letter or vacancy before the matching can be performed. Preferably, a natural language expression is linked to an abstract concept. Preferably, a natural language utterance is linked to an abstract concept through a synonym connection. Preferably, a natural language utterance is associated with one or more abstract concepts. Preferably, natural language utterances are only associated with abstract concepts. Preferably, a natural language utterance is not linked to another natural language utterance.
Dit is voordelig omdat het foutieve vertalingen mitigeert als gevolg van slechts gedeeltelijk overlappende betekenissen voor verschillende natuurlijke taaluitingen, zowel voor dezelfde als voor verschillende natuurlijke talen. Waar een natuurlijke taaluiting meerdere betekenissen kan hebben, bijvoorbeeld een ‘klusjesman (nl) die een Zeeman_OCC of een Reparateur_OCC is, is de natuurlijke taaluiting verbonden met elk van de abstracte beroepsconcepten, maar met de meeste voorkeur niet met andere natuurlijke taaluitingen. Via patroonvergelijking en/of contextuele informatie kan het juiste abstracte beroepsconcept worden geïdentificeerd. Door het conceptnetwerk te doorkruisen via abstracte concepten, kunnen foutieve vertalingen of synoniemgebruik worden beperkt. Bij voorkeur omvat het conceptnetwerk een hiërarchie van abstracte beroepsconcepten. Bij voorkeur zijn abstracte concepten van een hiërarchie verbonden via ouder-kind verbindingen. Bij voorkeur is de hiërarchie van beroepconcepten gebaseerd op het Standard Occupational Classification (SOC) System. Bij voorkeur omvat het conceptnetwerk een veelvoud aan abstracte competentieconcepten. Bij voorkeur omvat het conceptnetwerk een hiërarchie van abstracte werkervaringsconcepten. Bij voorkeur is de veelheid aan competentieconcepten en/of de hiërarchie van werkervaringsconcepten gebaseerd op de International Standard Classification of Occupations (ISCO). Bij voorkeur wordt een beroepsconcept gekoppeld aan één of meer competentie- en/of werkervaringsconcepten. Bij voorkeur wordt een beroepsconcept verbonden met één of meer competentie- en/of werkervaringsconcepten via een connotatieverbinding. Bij voorkeur omvat het conceptnetwerk een hiërarchie van abstracte kwalificatieconcepten. Bij voorkeur wordt een kwalificatieconcept gekoppeld aan één of meerdere competentieconcepten. Bij voorkeur is een kwalificatieconcept via een connotatieverbinding verbonden met één of meer competentieconcepten.This is advantageous because it mitigates mistranslation due to only partially overlapping meanings for different natural language utterances, both for the same and for different natural languages. Where a natural language utterance can have multiple meanings, for example a "handyman (nl) who is a Zeeman_OCC or a Repairman_OCC, the natural language utterance is associated with each of the abstract professional concepts, but most preferably not with other natural language utterances. The correct abstract professional concept can be identified through pattern comparison and / or contextual information. By traversing the concept network through abstract concepts, erroneous translations or synonym use can be limited. Preferably, the concept network comprises a hierarchy of abstract professional concepts. Preferably, abstract concepts of a hierarchy are linked through parent-child connections. Preferably, the hierarchy of occupational concepts is based on the Standard Occupational Classification (SOC) System. Preferably, the concept network comprises a multitude of abstract competence concepts. Preferably, the concept network comprises a hierarchy of abstract work experience concepts. Preferably, the multitude of competence concepts and / or the hierarchy of work experience concepts is based on the International Standard Classification of Occupations (ISCO). Preferably, a professional concept is linked to one or more competence and / or work experience concepts. Preferably, a professional concept is linked to one or more competence and / or work experience concepts via a connotation connection. Preferably, the concept network includes a hierarchy of abstract qualification concepts. Preferably, a qualification concept is linked to one or more competence concepts. Preferably, a qualification concept is linked via a connotation connection to one or more competence concepts.
In een voorkeursuitvoering wordt een jobbatch omvattende een veelheid van digitale jobdocumenten voorzien en verwerkt. Elk digitaal jobdocument bevat tekengecodeerde digitale gegevens die jobinformatie omvatten die in een natuurlijke taal is uitgedrukt. Voor elk digitaal jobdocument van de jobbatch wordt automatisch een jobtemplate aangepast, zoals hierboven beschreven.In a preferred embodiment, a job batch comprising a plurality of digital job documents is provided and processed. Each digital job document contains character-encoded digital data that includes job information expressed in a natural language. A job template is automatically adjusted for each digital job document of the job batch, as described above.
In een voorkeursuitvoering wordt een kandidaatbatch omvattende een veelheid van digitale kandidaatdocumenten voorzien en verwerkt. Elk digitaal kandidaatdocument bevat tekengecodeerde digitale gegevens die kandidaatinformatie omvatten die in een natuurlijke taal is uitgedrukt. Voor elk digitaal kandidaatdocument van de kandidaatbatch wordt automatisch een kandidaattemplate aangepast, zoals hierboven beschreven. In een uitvoeringsvorm wordt een gewijzigd template handmatig geverifieerd. Bij voorkeur wordt uit het gewijzigde template verificatie-informatie automatisch gegenereerd. Bij voorkeur wordt de verificatie-informatie uitgedrukt in een natuurlijke taal. Bij voorkeur wordt daarbij elk abstract concept omgezet in een natuurlijke taaluiting. Bij voorkeur wordt de verificatie-informatie weergegeven via een visualisatiemiddel, of naar een gebruikersapparaat gestuurd voor weergave via een visualisatiemiddel. Bij voorkeur worden bevestigings- en/of correctiegegevens op basis van weergegeven verificatie-informatie verkregen via een gebruikersinvoerapparaat, of ontvangen van een gebruikersapparaat. In een voorkeursuitvoering worden filtergegevens verkregen. Bij voorkeur worden de filtergegevens verkregen via een grafische gebruikersinterface of vanaf een gebruikersapparaat op basis van invoer via een grafische gebruikersinterface. Een aangepaste geordende lijst wordt weergegeven via de visualisatiemiddelen, of naar het gebruikersapparaat gestuurd voor weergave via een visualisatiemiddel. De aangepaste geordende lijst is gebaseerd op de filtergegevens. Bij voorkeur zijn de filtergegevens gebaseerd op één of meer abstracte concepten van het conceptnetwerk. Bij voorkeur kan een gebruiker filteren op items in de geordende lijst op basis van één of meer abstracte concepten van het conceptnetwerk. Bij voorkeur is de grafische gebruikersinterface geassocieerd met de visualisatiemiddel. Bij voorkeur zijn de filtergegevens gebaseerd op ruimtelijke herconfiguratie, zoals slepen en neerzetten, bij voorkeur slepen en neerzetten met een cursorapparaat, van een weergegeven abstract concept naar een filtergebied dat wordt weergegeven via de visualisatiemiddel.In a preferred embodiment, a candidate batch comprising a plurality of candidate digital documents is provided and processed. Each candidate digital document contains character-encoded digital data that includes candidate information expressed in a natural language. A candidate template is automatically adjusted for each digital candidate document of the candidate batch, as described above. In one embodiment, a changed template is manually verified. Preferably, verification information is automatically generated from the changed template. Preferably, the verification information is expressed in a natural language. Preferably, every abstract concept is converted into a natural language expression. Preferably, the verification information is displayed via a visualization means, or sent to a user device for display via a visualization means. Preferably, confirmation and / or correction data based on displayed verification information is obtained via a user input device, or received from a user device. In a preferred embodiment, filter data is obtained. Preferably, the filter data is obtained via a graphical user interface or from a user device based on input via a graphical user interface. A custom ordered list is displayed via the visualization means, or sent to the user device for display via a visualization means. The custom ordered list is based on the filter data. Preferably, the filter data is based on one or more abstract concepts of the concept network. Preferably, a user can filter for items in the ordered list based on one or more abstract concepts of the concept network. Preferably, the graphical user interface is associated with the visualization means. Preferably, the filter data is based on spatial reconfiguration, such as drag and drop, preferably drag and drop with a cursor device, from a displayed abstract concept to a filter area displayed via the visualization means.
In een voorkeursuitvoering wordt automatisch een nieuw beroepsconcept gedetecteerd op basis van een corpus van documenten, bij voorkeur via machine learning, door het detecteren van clusters, bij voorkeur terugkerende clusters, van competentieconcepten in het corpus die in onvoldoende mate overeenkomen met een gangbaar beroepsconcept aanwezig in het concept netwerk.In a preferred embodiment, a new professional concept is automatically detected on the basis of a corpus of documents, preferably via machine learning, by detecting clusters, preferably recurring clusters, of competence concepts in the corpus that do not sufficiently correspond to a current professional concept present in the concept of network.
Een kandidaat kan worden geassocieerd met competentieconcepten. Een kandidaat kan direct worden geassocieerd met competentieconcepten, bijvoorbeeld wanneer competenties expliciet worden vermeld in natuurlijke taaluitingen in de tekengecodeerde digitale gegevens (bijvoorbeeld een sollicitatiebrief of cv), of indirect, bijvoorbeeld zoals geïmpliceerd door een kwalificatieconcept (bv. onderwijs) of een beroepsconcept uit een eerdere dienstbetrekking.A candidate can be associated with competence concepts. A candidate may be directly associated with competence concepts, for example when competencies are explicitly mentioned in natural language utterances in the character-encoded digital data (e.g., a cover letter or resume), or indirectly, e.g. as implied by a qualification concept (e.g. education) or a professional concept from a previous employment.
Een job kan worden geassocieerd met competentieconcepten. Een job kan direct worden geassocieerd met competentieconcepten, bijvoorbeeld wanneer competenties expliciet worden vermeld in natuurlijke taaluitingen in de tekengecodeerde digitale gegevens (bijvoorbeeld vacature), of indirect, bijvoorbeeld zoals geïmpliceerd door een kwalificatieconcept (bijvoorbeeld onderwijs) als vereist of een beroepsconcept als vereiste werkervaring.A job can be associated with competence concepts. A job may be directly associated with concepts of competence, for example, when competencies are explicitly stated in natural language utterances in the character-encoded digital data (for example, vacancy), or indirectly, for example, as implied by a qualification concept (for example, education) as required or a professional concept as required work experience.
In een voorkeursuitvoering wordt automatisch een kloof in competentieconcepten tussen een kandidaat en een job vastgesteld. Een kwalificatieconcept wordt automatisch bepaald om de kloof in competentieconcepten ten minste gedeeltelijk op te vullen. Een suggestie in een natuurlijke taal van het bepaalde kwalificatieconcept geassocieerd met de job wordt weergegeven via een visualisatiemiddel, of naar een gebruikersapparaat gestuurd voor weergave via een visualisatiemiddel.In a preferred embodiment, a gap in competence concepts between a candidate and a job is automatically identified. A qualification concept is automatically determined to at least partially fill the gap in competence concepts. A natural language suggestion of the particular qualification concept associated with the job is displayed via a visualization means, or sent to a user device for display via a visualization means.
In een voorkeursuitvoering hangt de berekening van een numerieke matchwaarde voor een kandidaat en een job ten minste gedeeltelijk af van de competentieconcepten en/of werkervaringsconcepten geassocieerd met de kandidaat en de competentieconcepten en/of werkervaringsconcepten geassocieerd met de job.In a preferred embodiment, the calculation of a numerical match value for a candidate and a job depends at least in part on the concepts of competence and / or work experience concepts associated with the candidate and the concepts of competence and / or work experience concepts associated with the job.
In een voorkeursuitvoering wordt automatisch een uiting in een eerste natuurlijke taal aan het conceptnetwerk toegevoegd, bij voorkeur via machine learning, op basis van vertaalparen van documenten van een corpus. Bij voorkeur is de eerste natuurlijke taal een ‘nieuwe’ natuurlijke taal, waarvoor de opname in het conceptnetwerk onvolledig is. Een vertaalpaar van documenten heeft betrekking op de eerste en een tweede natuurlijke taal, d.w.z. een document in de eerste natuurlijke taal en een document in de tweede natuurlijke taal, beide documenten zijnde vertalingen van elkaar. In een eerste document in de eerste natuurlijke taal wordt een eerste groep uitingen gedetecteerd. Een ‘onbekende’ uiting van de eerste groep zit niet in het conceptnetwerk. Minstens twee ‘bekende’ uitingen van de eerste groep zijn opgenomen in het conceptnetwerk. In een corresponderend tweede document in de tweede natuurlijke taal wordt een corresponderende tweede groep uitingen gedetecteerd, gebaseerd op locaties binnen de (eerste en tweede) documenten en/of de abstracte concepten geassocieerd met de bekende uitingen van de eerste groep. Een doeluiting in de tweede groep die overeenkomt met de onbekende uiting van de eerste groep wordt bepaald. De onbekende uiting van de eerste groep is verbonden met het abstracte concept geassocieerd met de doeluiting van de tweede groep.In a preferred embodiment, an utterance in a first natural language is automatically added to the concept network, preferably via machine learning, based on translation pairs of documents from a corpus. Preferably, the first natural language is a "new" natural language, for which the inclusion in the concept network is incomplete. A translation pair of documents refers to the first and a second natural language, i.e. a document in the first natural language and a document in the second natural language, both documents being translations of each other. In a first document in the first natural language, a first group of utterances is detected. An "unknown" expression from the first group is not in the concept network. At least two "known" utterances from the first group are included in the draft network. In a corresponding second natural language document, a corresponding second group of utterances is detected, based on locations within the (first and second) documents and / or the abstract concepts associated with the known utterances of the first group. A target utterance in the second group that matches the unknown utterance of the first group is determined. The unknown utterance of the first group is related to the abstract concept associated with the target utterance of the second group.
Dit is voordelig, aangezien het bootstrap verwerving van een nieuwe taal in het conceptnetwerk toelaat. Gebaseerd op een eerste set van natuurlijke taaluitingen in de nieuwe taal toegevoegd op basis van automatische vertaling en/of handmatige toevoeging, kunnen andere natuurlijke taaluitingen in de nieuwe taal automatisch worden toegevoegd zoals hierboven beschreven.This is advantageous as it allows bootstrap acquisition of a new language in the draft network. Based on an initial set of natural utterances in the new language added based on machine translation and / or manual addition, other natural utterances in the new language can be added automatically as described above.
De uitvinding wordt verder beschreven door de volgende niet-beperkende voorbeelden die de uitvinding verder illustreren, en niet zijn bedoeld, noch mogen worden geïnterpreteerd, om het bereik van de uitvinding te beperken.The invention is further described by the following non-limiting examples which further illustrate the invention, and are not intended, nor should be construed, to limit the scope of the invention.
VOORBEELD Een kandidaat uploadt via zijn gebruikersapparaat een document (bv. cv of sollicitatiebrief) naar een server volgens het tweede aspect van de onderhavige uitvinding. Het document omvat tekengecodeerde digitale gegevens, die worden geanalyseerd op de server, en op basis waarvan een kandidaattemplate dat bij de kandidaat hoort, wordt gewijzigd. Het document en de kandidaattemplate worden opgeslagen in een database van de server.EXAMPLE A candidate uploads a document (e.g. resume or cover letter) via his user device to a server according to the second aspect of the present invention. The document contains character-encoded digital data, which is analyzed on the server and on the basis of which a candidate template associated with the candidate is modified. The document and candidate template are stored in a database of the server.
Bedenk bijvoorbeeld dat het document de zin ‘Ik heb het metabolomics-project nauwlettend gevolgd.’ in de natuurlijke taal Engels. Via patroonvergelijking en conceptextractie worden de concepten ‘Initiatief’ en ‘Biomedische Technologie WE opgehaald uit het document en toegevoegd aan het kandidaattemplate. Via conceptextractie worden de natuurlijke taaluitingen ‘volgen (nl)" en ‘metabolomics- project (nl)’ in de zin geïdentificeerd, evenals hun respectieve bijbehorende concepten ‘Initiatief’ en ‘Biomedische Technologie WE van het conceptnetwerk. Via patroonherkenning wordt een mate van zekerheid verkregen dat de geïdentificeerde concepten betrekking hebben op de kandidaat, en indien de mate van zekerheid voldoende hoog is, worden de geïdentificeerde concepten toegevoegd aan het kandidaattemplate. Op deze manier wordt het document volledig geanalyseerd.For example, remember that the document contains the phrase "I have been closely following the Metabolomics Project." In the natural language English. Via pattern comparison and concept extraction, the concepts "Initiative" and "Biomedical Engineering WE are retrieved from the document and added to the candidate template. Through concept extraction, the natural language utterances' follow (nl) 'and' metabolomics-project (nl) 'in the sentence are identified, as well as their respective associated concepts' Initiative' and 'Biomedical Technology WE of the concept network. obtained that the identified concepts relate to the candidate, and if the degree of certainty is sufficiently high, the identified concepts are added to the candidate template, in order to fully analyze the document.
Het kandidaattemplate bestaat uit een detailgedeelte en een conceptgedeelte. Het detailgedeelte bevat velden die betrekking hebben op kandidaatdetails, zoals bijvoorbeeld naam, adres, verwijzingen naar geüploade bestanden, taal, anciënniteit, werktype, academisch niveau, werkdomein, adres en/of telefoonnummer. Deze details worden met de meeste voorkeur ook automatisch verkregen op basis van patroonvergelijking. Het detailgedeelte kan in het bijzonder geografische coördinaten omvatten, zoals breedte- en lengtegraad, om afstandsfiltering voor ‘job matching’ mogelijk te maken. Geografische coördinaten kunnen automatisch worden opgehaald op basis van een adres van de kandidaat. Het detailgedeelte kan in het bijzonder een kandidaat-ID omvatten (voor het ophalen van de database), dat bij voorkeur een tekenreeks is met alfanumerieke tekens en/of streepjes. Het conceptgedeelte is onderverdeeld in een veelvoud aan onderwerpen, waaronder bijvoorbeeld Ervaring, Taal, Onderwijs en Competenties. De concepten die uit het document zijn gehaald, zijn toegevoegd aan de bijbehorende onderwerpen. ‘Biomedische Technologie WE’ staat bijvoorbeeld voor werkervaring in biomedische technologie en wordt daarom toegevoegd aan het onderwerp Ervaring. Een concept kan een gewicht omvatten. Elk concept kan een gewicht omvatten. Een werkervaringsconcept kan een gewicht omvatten op basis van de lengte van de ervaring, bij voorkeur gecorrigeerd voor het bestraffen van ervaringsverval. Een competentieconcept kan een gewicht omvatten dat is gebaseerd op gewichten van verwante concepten, bv. werkervaringsconcepten, en/of prevalentie in het document.The candidate template consists of a detail part and a concept part. The detail section contains fields related to candidate details, such as name, address, references to uploaded files, language, seniority, work type, academic level, work domain, address and / or telephone number. Most preferably, these details are also obtained automatically based on pattern matching. Specifically, the detail portion may include geographic coordinates, such as latitude and longitude, to enable distance filtering for job matching. Geographic coordinates can be automatically retrieved based on a candidate's address. In particular, the detail portion may comprise a candidate ID (for fetching the database), which is preferably a character string with alphanumeric characters and / or dashes. The concept part is divided into a multitude of topics, including, for example, Experience, Language, Education and Competences. The concepts extracted from the document have been added to the corresponding topics. For example, "Biomedical Technology WE" stands for work experience in biomedical technology and is therefore added to the subject Experience. A concept can include a weight. Any concept can include a weight. A work experience concept can include a weight based on the length of the experience, preferably corrected for penalizing loss of experience. A competency concept may include a weight based on weights of related concepts, e.g., work experience concepts, and / or prevalence in the document.
De template omvat bij voorkeur ook in samenhang met elk concept de corresponderende natuurlijke taaluiting van het document en/of een corresponderende verwijzing naar een bepaald corresponderend deel van het document.The template preferably also includes in connection with each concept the corresponding natural language utterance of the document and / or a corresponding reference to a particular corresponding part of the document.
Er wordt een webpagina gegenereerd met verificatie-informatie. De verificatie- informatie wordt uitgedrukt in natuurlijke taal en afgeleid van het kandidaattemplate. Elk concept van het template wordt daarvoor geconverteerd naar een natuurlijke taaluiting die overeenkomt met de natuurlijke taal die is aangegeven in het detailgedeelte van het kandidaattemplate. De webpagina wordt naar het gebruikersapparaat van de kandidaat gestuurd en weergegeven via een scherm van het gebruikersapparaat. De webpagina is geconfigureerd om, naar keuze van de kandidaat, natuurlijke taaluitingen te wijzigen via een gebruikersinvoerapparaat van het gebruikersapparaat. De webpagina bevat verder een bevestigingsknop om de oorspronkelijk weergegeven en/of gewijzigde natuurlijke taaluitingen van de webpagina te bevestigen. Dit maakt het mogelijk om automatisch een tenminste gedeeltelijk ingevuld template te genereren en alleen handmatig te bewerken waar nodig. Bij voorkeur wordt gecorrigeerde informatie bewaard voor automatische verbetering, bij voorkeur via machine learning, of documentanalyse.A web page is generated with verification information. The verification information is expressed in natural language and derived from the candidate template. Each concept of the template is converted to a natural language utterance that corresponds to the natural language indicated in the detail section of the candidate template. The web page is sent to the candidate's user device and displayed through a screen of the user device. The web page is configured to modify natural language utterances, at the option of the candidate, through a user input device of the user device. The web page further contains a confirmation button to confirm the originally displayed and / or modified natural language utterances of the web page. This makes it possible to automatically generate an at least partially completed template and only edit it manually where necessary. Corrected information is preferably saved for automatic improvement, preferably via machine learning, or document analysis.
De kandidaat kan vervolgens op basis van het kandidaattemplate zoeken naar jobs. Voor een combinatie van het kandidaattemplate en een jobtemplate wordt een numerieke overeenkomende waarde verkregen. Er wordt een geordende lijst gegenereerd met job-identificaties en/of job-aanwijzingen, gerangschikt volgens overeenkomstige numerieke matchwaardes. Een webpagina met de geordende lijst wordt gegenereerd, naar het gebruikersapparaat gestuurd en via het scherm van het gebruikersapparaat aan de kandidaat gepresenteerd. De webpagina omvat verder functionaliteit om filters in of uit te schakelen en/of de lijst opnieuw te ordenen, zoals bijvoorbeeld op basis van afstand of numerieke matchwaarde. Bij selectie van een job-identificatie en/of verwijsadres in de geordende lijst op de webpagina, wordt informatie weergegeven die specifiek betrekking heeft op de job, zoals bijvoorbeeld numerieke matchwaarde voor elke conceptcategorie, een algemene numerieke matchwaarde, een vacature of een verwijsadres ernaar, en informatie die betrekking heeft op het jobtemplate. Het jobtemplate kan ook een detailgedeelte en een conceptgedeelte omvatten. Het detailgedeelte bevat velden die betrekking hebben op job-details, zoals bijvoorbeeld bedrijfsnaam, adres, verwijzingen naar geüploade bestanden, taal, anciënniteit, werktype, academisch niveau, werkdomein, adres en/of telefoonnummer. Deze details worden met de meeste voorkeur ook automatisch verkregen op basis van patroonvergelijking. Het detailgedeelte kan in het bijzonder geografische coördinaten omvatten, zoals breedte- en lengtegraad, om afstandsfiltering voor ‘job matching’ mogelijk te maken. Geografische coördinaten kunnen automatisch worden opgehaald op basis van een adres van de job. Het detailgedeelte kan in het bijzonder een job-ID omvatten (voor het ophalen van de database), dat bij voorkeur een tekenreeks is met alfanumerieke tekens en/of streepjes. Het conceptgedeelte is onderverdeeld in een veelvoud aan onderwerpen, waaronder bijvoorbeeld Ervaring,The candidate can then search for jobs based on the candidate template. A numeric matching value is obtained for a combination of the candidate template and a job template. An ordered list of job identifiers and / or job prompts is generated, arranged according to corresponding numeric match values. A web page with the ordered list is generated, sent to the user device and presented to the candidate through the screen of the user device. The web page further includes functionality to enable or disable filters and / or reorder the list, such as based on distance or numerical match value, for example. When selecting a job identification and / or referral address from the ordered list on the web page, information specific to the job is displayed, such as numeric match value for each concept category, a general numeric match value, a vacancy or a referral address to it, and information related to the job template. The job template can also include a detail part and a draft part. The detail section contains fields related to job details, such as, for example, company name, address, references to uploaded files, language, seniority, work type, academic level, work domain, address and / or telephone number. Most preferably, these details are also obtained automatically based on pattern matching. Specifically, the detail portion may include geographic coordinates, such as latitude and longitude, to enable distance filtering for job matching. Geographic coordinates can be automatically retrieved based on an address of the job. In particular, the detail portion may comprise a job ID (for fetching the database), which is preferably a character string with alphanumeric characters and / or dashes. The concept part is divided into a multitude of topics, including, for example, Experience,
Taal, Onderwijs en Competenties.Language, Education and Competences.
Een concept kan een gewicht omvatten.A concept can include a weight.
Elk concept kan een gewicht omvatten.Any concept can include a weight.
Als bepaalde competenties of opleidingen ontbreken om de kandidaat volledig te laten voldoen aan het volledige overzicht van de vacature, kunnen ook suggesties voor verdere kwalificatie en/of opleiding aan de kandidaat worden gepresenteerd.If certain competencies or training are lacking in order for the candidate to fully comply with the full overview of the vacancy, suggestions for further qualification and / or training may also be presented to the candidate.
Claims (25)
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2019/080286 WO2021089129A1 (en) | 2019-11-05 | 2019-11-05 | Analysis and comparison of character-coded digital data, in particular for job matching |
Publications (2)
Publication Number | Publication Date |
---|---|
BE1027696A1 true BE1027696A1 (en) | 2021-05-17 |
BE1027696B1 BE1027696B1 (en) | 2021-06-14 |
Family
ID=68503094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BE20205783A BE1027696B1 (en) | 2019-11-05 | 2020-11-02 | ANALYSIS AND COMPARISON OF CHARACTER-CODED DIGITAL DATA, PARTICULARLY FOR JOB MATCHING |
Country Status (2)
Country | Link |
---|---|
BE (1) | BE1027696B1 (en) |
WO (1) | WO2021089129A1 (en) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230343333A1 (en) | 2020-08-24 | 2023-10-26 | Unlikely Artificial Intelligence Limited | A computer implemented method for the aut0omated analysis or use of data |
US11989507B2 (en) | 2021-08-24 | 2024-05-21 | Unlikely Artificial Intelligence Limited | Computer implemented methods for the automated analysis or use of data, including use of a large language model |
US12067362B2 (en) | 2021-08-24 | 2024-08-20 | Unlikely Artificial Intelligence Limited | Computer implemented methods for the automated analysis or use of data, including use of a large language model |
US12073180B2 (en) | 2021-08-24 | 2024-08-27 | Unlikely Artificial Intelligence Limited | Computer implemented methods for the automated analysis or use of data, including use of a large language model |
US11989527B2 (en) | 2021-08-24 | 2024-05-21 | Unlikely Artificial Intelligence Limited | Computer implemented methods for the automated analysis or use of data, including use of a large language model |
US11977854B2 (en) | 2021-08-24 | 2024-05-07 | Unlikely Artificial Intelligence Limited | Computer implemented methods for the automated analysis or use of data, including use of a large language model |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019106437A2 (en) | 2017-11-30 | 2019-06-06 | Jobzi Inteligencia De Dados Na Internet, Ltda. | Matching bids for work with offers for work |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090276415A1 (en) * | 2008-05-01 | 2009-11-05 | Myperfectgig | System and method for automatically processing candidate resumes and job specifications expressed in natural language into a common, normalized, validated form |
US10331764B2 (en) * | 2014-05-05 | 2019-06-25 | Hired, Inc. | Methods and system for automatically obtaining information from a resume to update an online profile |
EP3224735A4 (en) * | 2014-11-26 | 2018-05-09 | Vobis Inc. | Systems and methods to determine and utilize conceptual relatedness between natural language sources |
-
2019
- 2019-11-05 WO PCT/EP2019/080286 patent/WO2021089129A1/en active Application Filing
-
2020
- 2020-11-02 BE BE20205783A patent/BE1027696B1/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019106437A2 (en) | 2017-11-30 | 2019-06-06 | Jobzi Inteligencia De Dados Na Internet, Ltda. | Matching bids for work with offers for work |
Non-Patent Citations (1)
Title |
---|
SPEERCHINHAVASI: "ConceptNet 5.5: An Open Multilingual Graph of General Knowledge", PROCEEDINGS OF THE THIRTY-FIRST AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE (AAAI-17), 2017, pages 4444 - 4451 |
Also Published As
Publication number | Publication date |
---|---|
BE1027696B1 (en) | 2021-06-14 |
WO2021089129A1 (en) | 2021-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BE1027696B1 (en) | ANALYSIS AND COMPARISON OF CHARACTER-CODED DIGITAL DATA, PARTICULARLY FOR JOB MATCHING | |
US10949472B2 (en) | Linking documents using citations | |
CN106663125B (en) | Question generation device and recording medium | |
US9910886B2 (en) | Visual representation of question quality | |
KR102199835B1 (en) | System for correcting language and method thereof, and method for learning language correction model | |
CN111417940B (en) | Method, system and medium for generating answers to questions | |
US20140351228A1 (en) | Dialog system, redundant message removal method and redundant message removal program | |
US9639522B2 (en) | Methods and apparatus related to determining edit rules for rewriting phrases | |
US20100114789A1 (en) | System and method for guiding users to candidate resumes and current in-demand job specification matches using predictive tag clouds of common, normalized elements for navigation | |
US20160117405A1 (en) | Information Processing Method and Apparatus | |
JP2005157524A (en) | Question response system, and method for processing question response | |
US11126783B2 (en) | Output apparatus and non-transitory computer readable medium | |
US20210397787A1 (en) | Domain-specific grammar correction system, server and method for academic text | |
JP4600045B2 (en) | Opinion extraction learning device and opinion extraction classification device | |
Modaresi et al. | Exploring the effects of cross-genre machine learning for author profiling in PAN 2016 | |
CN106610990B (en) | Method and device for analyzing emotional tendency | |
US20190057470A1 (en) | Intellectual property supporting apparatus, intellectual property supporting method, and intellectual property supporting program | |
US20190303437A1 (en) | Status reporting with natural language processing risk assessment | |
Vala et al. | Annotating characters in literary corpora: A scheme, the CHARLES tool, and an annotated novel | |
JPWO2009020092A1 (en) | Related information search system and related information search method | |
CN113157888A (en) | Multi-knowledge-source-supporting query response method and device and electronic equipment | |
KR20200064490A (en) | Server and method for automatically generating profile | |
Gimenes et al. | Spelling error patterns in Brazilian Portuguese | |
Alam et al. | Comparing named entity recognition on transcriptions and written texts | |
JP5877775B2 (en) | Content management apparatus, content management system, content management method, program, and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG | Patent granted |
Effective date: 20210614 |