<Desc/Clms Page number 1>
Werkwijze en systeem voor het opvolgen van de voortschrijding van een project, competenties of dergelijke. Deze uitvinding heeft betrekking op een werkwijze en een systeem voor het opvolgen, meer speciaal het zelf of extern opvolgen, van de voortschrijding van een project, competenties of dergelijke. Met een project wordt ook een projectontwikkeling, proces of dergelijke bedoeld.
Het is bekend dat wanneer projecten worden gerealiseerd, of competenties worden ontwikkeld, vooral bij grote projecten waaraan verschillende groepen of personen meewerken, het kan gebeuren dat door een onvoldoende coördinatie, een minder effectieve realisatie van zulk project plaatsvindt.
Zo bijvoorbeeld kan welbepaalde nuttige informatie van een groep of een persoon niet bij welbepaalde andere groepen of personen, waarvoor deze informatie nuttig is, terechtkomen.
Ook kan het gebeuren dat het project zich bij de verschillende groepen of personen ongewenst in uiteenlopende richtingen ontwikkelt, zonder dat de betreffende groepen of personen zich daarvan tijdig bewust zijn.
Het is ook bekend dat data, afkomstig van documenten, in een databestand kunnen worden ingebracht en op basis hiervan een zogenaamde thesaurus kan worden opgebouwd, waarbij deze thesaurus toelaat om bepaalde documenten terug te vinden. Hiertoe werden reeds verschillende systemen ontwikkeld. Voorbeelden voor het opbouwen van zulke thesaurus, voor het indexeren van documenten en dergelijke zijn onder meer bekend uit het EP 0. 952.535, WO 95/14973, WO 96/32686, US 5. 007.019 en US 5. 555.408. Tot op heden
<Desc/Clms Page number 2>
worden dergelijke systemen uitsluitend toegepast voor het classificeren en terugvinden van documenten.
De huidige uitvinding beoogt een werkwijze voor het opvolgen van de voortschrijding van een project, welke werkwijze bijdraagt tot het optimaliseren van de voortschrijding. Meer speciaal beoogt zij een werkwijze waardoor onder meer de kans dat de voornoemde ongewilde ontwikkelingen zich voordoen in een project vroegtijdig kan worden ontdekt en deze ontwikkelingen kunnen worden bijgestuurd.
De huidige uitvinding beoogt ook een werkwijze en een systeem waardoor zulke opvolging op een technische wijze kan worden gerealiseerd, door gebruik te maken van elektronische dataverwerking.
Hiertoe betreft de huidige uitvinding in eerste instantie een werkwijze voor het opvolgen van de voortschrijding van een project, met als kenmerk dat zij minstens bestaat in het in verschillende fasen van het project inbrengen van data, die met de betreffende fasen verband houden, in een elektronisch databestand en het in functie van de wijzigingen in dit databestand evalueren, bij voorkeur elektronisch evalueren, van het project.
Bij voorkeur zal hierbij voor het databestand gebruik worden gemaakt van een thesaurus-gebaseerd systeem.
Het is duidelijk dat door het inbrengen van data afkomstig uit verschillende fasen van een project, het verkregen databestand, en meer speciaal de inhoud en de daaruit gegenereerde classificatie, indeling en dergelijke van de thesaurus, zich permanent wijzigen en dat dankzij de
<Desc/Clms Page number 3>
uitvinding, door een evaluatie van de wijzigingen ook een evaluatie van de voortschrijding en ontwikkeling van zulk project kan worden gerealiseerd. Zulke evaluatie kan uiteraard op verschillende wijzen gebeuren, hetzij volgens hierna nog beschreven technieken van de uitvinding of andere, binnnen de kennis van een vakman gelegen technieken.
De keuze van de fasen met betrekking tot welke data in het databestand worden ingebracht, kunnen variëren in functie van de toepassingen en/of bepaalde doelstellingen. Bij voorkeur echter zullen data worden aangewend die betrekking hebben op vitale fasen van de ontwikkeling van het project, bijvoorbeeld met betrekking tot de startfase, de middenfase en de eindfase. Het feit dat volgens de uitvinding met fasen gewerkt wordt, betekent niet noodzakelijk dat er een duidelijke aflijning tussen deze fasen moet bestaan. Het is immers ook mogelijk om tijdens de voortschrijding van het project nagenoeg continu alle soorten documenten in te brengen en deze in functie van het tijdstip waarop zij werden geproduceerd te classificeren, zodat op deze wijze ook een evaluatie in functie van de tijd en de fase van het project kan worden uitgevoerd.
Het is duidelijk dat door de uitgebreidheid of beperktheid van het verkregen databestand, en meer speciaal van de hieruit opgebouwde thesaurus, een duidelijk beeld kan worden gevormd van de kwalitatieve en kwantitatieve eigenschappen van de voortschrijding, met andere woorden de ontwikkeling van een project of competentie.
De uitvinding kan uiteraard zowel worden toegepast om de ontwikkeling van een project tijdens de uitvoering van dit project op te volgen, of de ontwikkeling van een competentie op te volgen, teneinde eventueel in een
<Desc/Clms Page number 4>
bijsturing te voorzien, als om een project aan het einde ervan al dan niet extern te evalueren teneinde de efficiëntie waarmee dit project is uitgevoerd te bepalen en eventueel de verkregen resultaten aan te wenden met het oog op een betere uitvoering van latere projecten.
Voor de in te brengen data zal bij voorkeur minstens gebruik worden gemaakt van documenten die tijdens het project worden geproduceerd. Zulke documenten vormen immers een belangrijke bron van informatie. Voorbeelden van soorten documenten die kunnen worden aangewend zijn bijvoorbeeld: - rapporten met betrekking tot de doelstelling van het project; - rapporten en/of verslagen die tijdens het project worden geformuleerd; - communicaties tussen verschillende partijen of medewerkers van het project; - rapporten en/of communicaties in de vorm van e-mails.
Volgens de uitvinding kan, voor het inbrengen van data ook gebruik wordt gemaakt van tekeningen, afbeeldingen, foto's, audio- en/of videomateriaal, of dergelijke, al dan niet in combinatie met de voornoemde data die afgeleid zijn uit de voornoemde documenten.
Tevens kan voor het inbrengen van data ook gebruik worden gemaakt van tijdens vergaderingen en/of evaluaties ingebrachte of opgenomen gegevens.
De werkwijze volgens de uitvinding kan worden aangewend voor het evalueren van een project in zijn totaliteit, doch kan ook worden aangewend voor het tegenover elkaar afwegen van gegevens ingebracht door verschillende partijen,
<Desc/Clms Page number 5>
teneinde na te gaan in welke zin het werk, gepresteerd door deze partijen, ten opzichte van elkaar evolueert. In deze laatste toepassing kan worden opgevolgd of verschillende aan een project deelnemende partijen nog steeds in dezelfde lijn werkzaam zijn en kan bijgevolg, wanneer zal blijken de werkzaamheden van verschillende partijen ten nadele van de goede afloop van het project volledig uit elkaar groeien, tijdig worden ingegrepen. De werkwijze kan eventueel ook worden toegepast in het kader van een negotiatie-framework.
Verder kan de werkwijze volgens de uitvinding ook nog daardoor gekenmerkt zijn dat voor het databestand gebruik wordt gemaakt van een thesaurus-gebaseerd systeem of van terminologische woordlijsten, in beide gevallen aangevuld met collecties van relevante taalpatronen en uitdrukkingen, waarbij dit databestand zowel, enerzijds, statische, tijdsonafhankelijke data en lijsten bevat, die opgesteld worden in het begin van het project, als, anderzijds, dynamische, tijdsafhankelijke data en lijsten die gewijzigd en aangevuld worden tijdens het verloop van het project.
Bij voorkeur wordt een elektronische evaluatie uitgevoerd waartoe minstens gebruik wordt gemaakt van één of meer van volgende mogelijkheden: - een evaluatie doordat de evolutie van de verrijking van het databestand wordt opgevolgd, meer speciaal de verrijking van de woordenschat of de toename van bepaalde documenten, trefwoorden en concepten; - een hiërarchische evaluatie; - een relationele en/of conditionele evaluatie.
Bij een evaluatie op basis van de verrijking van het databestand wordt tijdens de voortschrijding van het project, statistisch nagezien in welke richting het project
<Desc/Clms Page number 6>
zich ontwikkeld, dit aan de hand van statistische informatie omtrent het aantal geproduceerde documenten, trefwoorden, concepten en dergelijke die werden geïndexeerd.
Het is duidelijk dat hierbij technieken voor het opbouwen van een databestand, meer speciaal thesaurus, kunnen worden aangewend waarbij automatisch een onderscheid wordt gemaakt tussen termen, "roots", trefwoorden en eventueel concepten en deze automatisch worden gerangschikt.
Bij een hiërarchische evaluatie wordt een rangschikking uitgevoerd volgens bredere en engere termen. Zo bijvoorbeeld vormt het woord "metaal" een bredere term ten opzichte van de woorden "ijzer" en "zilver".
Belangrijk is ook dat niet alleen een rangschikking plaatsvindt, doch ook rekening gehouden wordt met het aantal bredere termen ten opzichte van de engere of lagere termen. Ook is het nuttig om volgens de uitvinding rekening te houden met het aantal hiërarchische niveaus.
Bij een relationele en/of conditionele evaluatie, worden relationele en/of conditionele verbanden nagetrokken tussen de uitdrukkingen die in bepaalde documenten worden toegepast, en worden eventueel ook op basis van de hierdoor verkregen resultaten verbanden gelegd tussen verschillende documenten.
Volgens een bijzonder aspect van de huidige uitvinding, wordt bij het inbrengen van data en/of het beoordelen van ingebrachte data, de stijl van deze data in rekening gebracht. Het is immers zo dat bepaalde documenten, bijvoorbeeld informatieve e-mails tussen medewerkers van het project, een minder formele stijl kunnen hebben dan
<Desc/Clms Page number 7>
bijvoorbeeld documenten zoals tijdens het project uitgebrachte officiële verslagen. Door volgens de uitvinding hiermee rekening te houden, kan het databestand, en meer speciaal de thesaurus, worden geoptimaliseerd. Aan data, afkomstig van documenten met een minder formele stijl, kan immers een geringere gewichtigheid worden toegekend, terwijl aan data afkomstig van formelere documenten een grotere gewichtigheid kan worden toegekend.
Volgens een praktisch aspect van de uitvinding wordt voor het automatisch classificeren van documenten in het databestand, meer speciaal met behulp van de thesaurus, gebruik gemaakt van "intelligent agents". Dit zijn dataverwerkingsmiddelen die een automatische of semi-automatische classificatie toelaten.
Bij voorkeur worden hierbij gespecialiseerde modules gebruikt voor autonome analyse van de projectkenmerken gebaseerd op projectdocumentatie en op het voornoemde databestand, welke modules actief blijven in het aangewende computersysteem en automatisch de nodige analyses op bepaalde tijdstippen uitvoeren, bijvoorbeeld dagelijks, en/of wanneer nieuwe projectdocumenten in het toegepaste projectopvolgingssysteem worden ingevoegd en/of op aanvraag van de gebruiker.
De opbouw van zulke classificatie kan worden gebaseerd op verschillende technieken, waarbij, zowel een "top-down", als een "bottom up" benadering kan worden gerealiseerd. Met een "top-down" benadering wordt hierbij bedoeld dat eerst welbepaalde classificaties door de gebruiker worden vastgelegd, en vervolgens de in te brengen data, meer speciaal de in te brengen documenten, automatisch volgens deze classificatie worden gerangschikt. Met een "bottom up"
<Desc/Clms Page number 8>
benadering wordt bedoeld dat data, meer speciaal documenten worden ingebracht, en op basis van de gegevens van de data uit deze documenten automatisch een classificatie wordt gegenereerd en een "clustering" van de betreffende documenten op basis van deze classificatie wordt gerealiseerd.
In een praktische uitvoeringsvorm zal de voornoemde thesaurus worden ontwikkeld door opeenvolgend volgende stappen toe te passen: - het selecteren van "trainings"-voorbeelden, dat zijn een set van representatieve documenten die relevant zijn voor de te genereren thesaurus; - het realiseren van een "training", meer speciaal door de extractie van termen, het opbouwen van de thesaurus en het verzamelen van relevante taalpatronen; - het uitvoeren van een evaluatie door middel van een test op basis van de ingebrachte documenten; - het meermaals herhalen van de voorgaande drie stappen, teneinde de thesaurus en de patronencollectie te verfijnen.
Volgens een belangrijk voorkeurdragend aspect van de uitvinding, wordt, bij het inbrengen van data in het voornoemde databestand, en meer speciaal bij het daarbij opbouwen van een thesaurus, aan minstens een deel van de ingebrachte data een welbepaalde gewichtigheid of belangrijkheid toegekend in functie van de fase van het project. Zo bijvoorbeeld kunnen aan termen uit de thesaurus die verkregen zijn via data omtrent een prototype een geringere gewichtigheidsfactor toegekend worden in de begin- of conceptfase van het project, terwijl een grotere gewichtigheidsfactor kan worden toegekend aan deze termen tijdens de ontwikkelingsfase en de pre-exploitatiefase van
<Desc/Clms Page number 9>
het project.
Ook kan bijvoorbeeld aan termen uit de thesaurus die verkregen zijn via data afgeleid uit gegevens omtrent "research" en "analyses", een zeer grote gewichtigheidsfactor worden toegekend tijdens de ontwikkelingsfase, en kan hieraan eventueel geen enkele gewichtigheid meer worden toegekend van zodra het project in de ontwikkelingsfase komt.
Het is duidelijk dat de toekenning van verschillende gewichtigheidsfactoren aan bepaalde uitdrukkingen, termen, verbanden en dergelijke op verschillende wijzen kan worden gerealiseerd en niet noodzakelijk in samenhang moet zijn met bepaalde fasen van het project, doch ook kan gebeuren, zoals voornoemd, in functie van het formele of informele karakter van bepaalde gegevens, of ook nog in functie van andere nuttige criteria.
Volgens nog een bijzonder kenmerk is de werkwijze daardoor gekenmerkt dat een continu thesaurus gebaseerde taskanalyse wordt toegepast bij de uitvoering van het project, waarbij in deze werkwijze de voornoemde databestanden worden gebruikt om de conclusies te trekken, dit via automatische documentenanalyse met betrekking tot de volgende projectkenmerken: - welke projecttasks zijn in uitvoering en met welke intensiteit ; - welke projecttasks verlopen goed en welke projecttasks vertonen een risico op vertraging; - welke projecttasks divergeren.
Volgens een ander bijzonder aspect van de uitvinding, wordt ook gebruik gemaakt van het analyseren van "story based visual content", althans wanneer data omtrent het project beschikbaar zijn die zulks toelaten en wanneer verwacht
<Desc/Clms Page number 10>
wordt dat dit ook kan bijdragen tot een verbeterde automatische evaluatie van het project. Met "story based visual content" wordt informatie bedoeld die afbeeldingen bevat, welke afbeeldingen tevens een bepaald verhaal of bepaalde wijzigingen in functie van de tijd inhouden. Zo bijvoorbeeld kan het hierbij handelen om afbeeldingen in de vorm van stripverhalen, afbeeldingen afkomstig uit films, grafische voorstellingen van verschillende fasen uit een project, een filmopname van een vergadering en dergelijke.
De analyse kan hierbij, zowel automatisch, als semi-automatisch worden uitgevoerd. Met automatisch wordt bedoeld dat de betreffende beelden worden gescand en automatisch worden verwerkt tot bruikbare informatie. Met semi-automatisch wordt bedoeld dat in functie van bepaalde afbeeldingen gegevens door een operator in het systeem voor het realiseren van de uitvinding, worden ingebracht.
De analyse wordt bij voorkeur gebaseerd in functie van het scenario dat door de afbeeldingen wordt weergegeven.
Hiertoe kan de informatie van het scenario worden ingedeeld in basisbouwstenen, bijvoorbeeld : "setting"(tijd en plaats), "acteurs" en "actie". Door in functie van het verloop van het scenario gegevens omtrent deze basisbouwstenen te noteren en op te slaan in het databestand, kunnen verschillende analyses worden gerealiseerd. Deze bouwstenen worden ook gelinkt met een thesaurus zodanig dat de semantiek van de beeldgegevens automatisch kan worden bepaald. De link met de thesaurus laat taalgebaseerde "queries" toe op beeldmateriaal, alsook een meer gesofistikeerde interpretatie van beeldreeksen, gebruikmakende van thesaurusextenties tot metaniveau's van de scenario's.
<Desc/Clms Page number 11>
Verder kan in een optimalisatie van de "query" verwerking worden voorzien, zoals hierna uiteengezet.
Volgens een bekende implementatie van de index server wordt de keyword/concept query "get documents" in twee stappen uitgevoerd : in de eerste stap worden de docid's (document-identificaties) geselecteerd die gekoppeld zijn met de query term, in de tweede stap worden, voor elke docid gevonden in stap 1, de keywords en de concepten geselecteerd.
De verwerking van deze query, vooral van stap 2, kan een vertraging vertonen indien de lijst van de docid's, gevonden in stap 1, groot is.
Om een verbetering van de performantie te bekomen, worden volgens de uitvinding twee opties voorgesteld betreffende de optimalisatie van de index data- en database structuur: - aanvulling van de database met bijkomende tabellen; - gebruik van de gestructureerde storage.
Betreffende de eerste optie wordt opgemerkt dat een gebruikelijke implementatie van de index is gebaseerd op relationele tabellen. Deze tabellen bevatten telkens document-identificatienummers (DOCID's), de index termen en hun absolute frekwentie. De tabellayout van de keyword index is als volgt:
DOCID KT F
000001 Keywordl 100
000001 Keyword2 99
000001 Keyword3 97
<Desc/Clms Page number 12>
Een gelijkaardige layout gebruikt kan worden voor concepten en voor een "full-text" index.
Met de nieuwe methode van de huidige uitvinding wordt een bijkomende data-cluster gebruikt naast de reeds bestaande tabellen, zodanig dat elke docid rechtstreeks gekoppeld is met zijn lijsten van de keywords (trefwoorden), van de concepten en van de "full-text" termen.
De structuur van de nieuwe index tabel is dan bijvoorbeeld:
DOCID KT LIST
000001 keyword 1(100);keyword 2(99);...
000002 keyword 1 (98); keyword2(78);...
In de tweede stap wordt dus geen bijkomende filtering toegepast op het niveau van individuele woorden. Bij het filteren van de DOCID's worden de lijsten direct afgehaald van dezelfde record.
Volgens de tweede optie wordt, zoals voornoemd, gebruik gemaakt van een gestructureerde storage.
De gestructureerde storage is een methode die wordt toegepast als persistente dataopslag in COM-gebaseerde software. Een van de kenmerken van de gestructureerde storage is zijn hiërarchische layout bestaande uit folders en data. Via een API in C++ is het mogelijk een root folder te creëren met subfolders en datastreams.
Op deze manier kan een persistente boomstructuur op de harde schijf worden gemaakt in één binaire file, waarbij de data search kan worden geoptimaliseerd. De data kunnen
<Desc/Clms Page number 13>
bewaard worden rechtstreeks als binaire streams: dit maakt het mogelijk om een grote hoeveelheid multimedia data in verschillende "formats" in één persistente file te bewaren.
Bij opzoeking/terugvinden van gegevens kan de boom gebruikt worden. Op deze manier kan de toegangstijd tot data worden geoptimaliseerd.
Volgens een voorkeurdragend en bijzonder aspect van de uitvinding wordt de inhoud van het databestand, meer speciaal van de thesaurus, automatisch dynamisch beheerd.
Hiermede wordt bedoeld dat de gebruikte woordenschat automatisch wordt geëvalueerd teneinde een juiste classificatie toe te laten en/of de in de thesaurus aanwezige woordenschat automatisch wordt geherwaardeerd.
Onder de automatische evaluatie dient bijvoorbeeld verstaan te worden dat, wanneer een bepaald woord verschillende betekenissen heeft in verschillende vakgebieden, dit woord in functie van eventuele andere woorden in het betreffende document, in het juiste vakgebied wordt ondergebracht. Zo heeft bijvoorbeeld het woord "programma" een andere betekenis in het vakgebied van "televisiezenders" dan in het vakgebied van "software". Zo bijvoorbeeld ook heeft het woord "proces" een andere betekenis in het vakgebied "chemie" dan in het vakgebied "software-ontwikkeling".
Onder de automatische herwaardering van de woordenschat dient verstaan te worden dat bepaalde vaktermen in de loop der tijd kunnen wijzigen of dat nieuwe vaktermen worden aangewend in de plaats van andere. Het is duidelijk dat dit ook automatisch kan worden bepaald.
Op deze wijze kan, volgens de uitvinding, een "up-to-date" woordenlijst en databestand worden gehandhaafd.
<Desc/Clms Page number 14>
De uitvinding kan op gelijkaardige wijze worden toegepast voor het opvolgen van de voortschrijding of ontwikkeling van competenties.
Het is duidelijk dat de uitvinding ook betrekking heeft op systemen voor het realiseren van de hiervoor beschreven werkwijze, welke hiertoe bestaan uit elektronische middelen, waaronder algoritmen, door middel waarvan de voornoemde werkwijze kan worden uitgevoerd.
De huidige uitvinding is geenszins beperkt tot de hiervoor aangehaalde voorbeelden, doch dergelijke werkwijze en zulk systeem kunnen volgens verschillende varianten worden verwezenlijkt, zonder buiten het kader van de uitvinding te treden.