BE1025360B1 - Beheren en aanwenden van juridisch-fiscale documenten uit de rechtspraak - Google Patents
Beheren en aanwenden van juridisch-fiscale documenten uit de rechtspraak Download PDFInfo
- Publication number
- BE1025360B1 BE1025360B1 BE2017/6017A BE201706017A BE1025360B1 BE 1025360 B1 BE1025360 B1 BE 1025360B1 BE 2017/6017 A BE2017/6017 A BE 2017/6017A BE 201706017 A BE201706017 A BE 201706017A BE 1025360 B1 BE1025360 B1 BE 1025360B1
- Authority
- BE
- Belgium
- Prior art keywords
- documents
- legal
- computer
- document
- tax
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 29
- 239000013598 vector Substances 0.000 claims description 17
- 238000004891 communication Methods 0.000 claims description 11
- 230000009471 action Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 3
- 238000011835 investigation Methods 0.000 description 3
- 230000036651 mood Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Primary Health Care (AREA)
- Technology Law (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Een computer-geïmplementeerde methode voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak, waarbij uit deze verzameling juridisch-fiscale documenten uit de rechtspraak een lijst van responsieve documenten wordt verkregen, waarbij het ordenen van de lijst een stap omvat waarbij aan elk juridisch-fiscaal document een gewichtsparameter wordt toegeschreven door het maken van een samenvatting welke getoetst wordt aan ten minste één criterium, waarbij deze criteria gecategoriseerd zijn.
Description
BEHEREN EN AANWENDEN VAN JURI Dl SCH-FI SCALE DOCUMENTEN UIT DE RECHTSPRAAK
TECHNISCH DOMEI N
De uitvinding heeft betrekking op een op een computer-geïmplementeerde methode voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak, en een tastbare niet-transitoire computer-leesbare informatiedrager omvattende een computerprogrammaproduct voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak.
STAND DER TECHNI EK
Het Belgische rechtssysteem, evenals een aantal andere rechtsstelsels over de hele wereld zijn sterk afhankelijk van schriftelijke juridische adviezen en de schriftelijke uitspraken van rechters om wetten betreffende de beslechting van geschillen uit te leggen of te interpreteren. Als gevolg daarvan zoeken rechters en advocaten naar de meest relevante vroegere opvattingen of jurisprudentie, zodoende geschillen op te lossen of te voorkomen, terwijl deze hoeveelheid informatie alsmaar blijft toenemen. Gevonden cases worden bestudeerd op relevantie en worden uiteindelijk geciteerd en besproken in documenten, procesmateriaal genoemd, die bijvoorbeeld pleiten voor gerechtelijke stappen, cliënten adviseren over waarschijnlijke gerechtelijke acties of cliënten en advocaten informeren over wetten in bepaalde jurisdicties.
Naast het rechtssysteem zijn in België ook voorafgaande beslissingen of rulings relevant. FOD Financiën bepaalt aan de hand van deze rulings hoe belastingwetten zullen worden toegepast op een specifieke situatie of verrichting die op fiscaal vlak nog geen uitwerking heeft gehad.
EP2008/1 586 055 beschrijft een methode voor het beheren en aanwenden van informatie bij advocatenkantoren en potentieel andere ondernemingen. Eén systeem biedt bijvoorbeeld een gebruikersinterface voor het onderzoeken van jurisprudentie voor online juridisch onderzoek en voor het identificeren en verkrijgen van toegang tot advocatenkantoordocumenten. Via de interface kan een gebruiker, zoals een advocaat, een juridische onderzoeksopdracht initiëren of indienen en de zoekresultaten bekijken die niet alleen relevante externe documenten van de online juridische onderzoeksdienst identificeren, maar ook relevante interne documenten, zoals lastenboeken, klantbrieven, en juridische memoranda uit de eigen documentenverzameling van het advocatenkantoor.
De gekende methodes richten zich echter enkel op gebruik door advocaten of ander hoog opgeleid personeel, terwijl toegang tot juridisch-fiscale documenten van relevante cases ook voor leken een informerend en adviserend karakter kan hebben.
BE2017/6017
Nog een probleem in de manier waarop deze juridisch-fiscale documenten worden geordend, is het ontbreken van een gebruiksvriendelijke computer-geïmplementeerde zoekterminal, waarbij de resultaten volgens relevantie aan de zoekopdracht worden geordend. Het booleaans zoekalgoritme zoals volgens Google is veeleer niet geschikt voor dergelijke ordening gezien de rechtspraak een dynamisch en discontinu systeem van wetten, uitspraken, rechters en rechtbanken betreft, waarbij interpretaties van wetten gebonden kunnen zijn aan een tijdsgeest, sociale of maatschappelijke omstandigheden, verschillende rechtbanken of rechters, anticipaties op toekomstige wetten, enzovoort.
De huidige uitvinding beoogt een oplossing te vinden voor ten minste enkele van bovenvermelde problemen.
SAMENVATTI NG VAN DE UITVINDI NG
In een eerste aspect betreft de huidige uitvinding een computer-geïmplementeerde methode voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak, volgens conclusie 1.
In een tweede aspect betreft de huidige uitvinding een computersysteem voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak, volgens conclusie 12.
In een derde aspect betreft de huidige uitvinding een tastbare niet-transitoire computerleesbare informatiedrager omvattende een computerprogrammaproduct geschikt voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak, volgens conclusie 13.
De huidige uitvinding is voordelig omdat een leek zich, door gebruik van het oomputersysteem, zonder tussenkomst van een advocaat, kan informeren betreffende juridisch-fiscale kwesties.
Daarnaast is de uitvinding voordelig omdat de fiscale-juridische documenten volgens actuele relevantie worden geordend.
GEDETAI LLEERDE BESCHRI JVI NG
De uitvinding betreft een computer-geïmplementeerde methode en een tastbare niettransitoire computer-leesbare informatiedrager omvattende een computerprogrammaproduct voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak. In wat volgt, wordt de uitvinding in detail beschreven, worden voorkeursuitvoeringen toegelicht, en wordt de uitvinding geïllustreerd aan de hand van voorbeelden.
Tenzij anders gedefinieerd, hebben alle termen die gebruikt worden in de beschrijving van de uitvinding, ook technisch en wetenschappelijke termen, de betekenis zoals ze algemeen
BE2017/6017 begrepen worden door de vakman in het technisch veld van de uitvinding. Voor een betere beoordeling van de beschrijving van de uitvinding, worden de volgende termen expliciet uitgelegd.
“Een”, ”de” en “het” refereren naar zowel het enkelvoud als het meervoud tenzij de context duidelijk anders veronderstelt. Bijvoorbeeld, “een segment” betekent een of meer dan een segment.
De termen “omvatten”, “omvattende”, “bestaan uit”, “bestaande uit”, “voorzien van”, “bevatten”, “bevattende”, “behelzen”, “behelzende”, “inhouden”, “inhoudende” zijn synoniemen en zijn inclusieve of open termen die de aanwezigheid van wat volgt aanduiden, en die de aanwezigheid niet uitsluiten of beletten van andere componenten, kenmerken, elementen, leden, stappen, gekend uit of beschreven in de stand der techniek.
De term “actueel relevant” of “actuele relevantie” verwijst naar de mate waarop een bepaald document overeenkomt met het actueel dynamisch en discontinu systeem van wetten, uitspraken, rechters en rechtbanken, gezien interpretaties van wetten gebonden kunnen zijn aan een tijdsgeest, sociale of maatschappelijke omstandigheden, verschillende rechtbanken of rechters, anticipaties op toekomstige wetten, enzovoort. De actuele relevantie van een document wordt in deze uitvinding bepaald door de samenvatting ervan een numerieke waarde in de vorm van een gewichtsparameter toe te schrijven. Deze gewichtsparameter wordt bepaald door een wiskundige bewerking van meerdere numerieke wegingsfactoren, waarbij iedere wegingsfactor een bepaald criterium beschrijft. Het document waarvan de samenvatting de grootste gewichtsparameter heeft, zal zodoende het meest actueel relevant zijn. Tevens worden verwante criteria bij voorkeur gegroepeerd in categorieën.
De term “classifier” refereert naar de abstracte metaklasse van classificatieconcepten welke aangewend worden als mechanisme om elementen met gemeenschappelijke eigenschappen en/of inhoud in sets te verzamelen. In dit document refereert deze term naar een algoritme ontworpen om de samenvattingen en documenten te ordenen volgens hun karakteristieken.
De term “gebruiker” refereert naar een persoon die de inhoud van gegevensverzamelingen van een informatiesysteem gebruiken. In het bijzonder refereert de term in dit document naar de persoon die een inhoud van de responsieve juridisch-fiscale documenten raadpleegt na het doorgeven van instructies aan het computersysteem.
De term “invoerapparaat” refereert naar een apparaat geschikt om input aan te leveren aan een gebruikerstoestel. Deze input is niet beperkt tot een bepaalde modaliteit en kan mechanische beweging, geluid, beelden, en dergelijke omvatten. De input kan discreet en/of continu zijn. De input is ook niet beperkt door het aantal vrijheidsgraden. De input kan zowel directe als indirecte input betreffen. Bij het voorzien van input met betrekking tot een positie of de verandering daarvan, zoals bv. een indicator op een scherm, kan de input zowel absoluut
BE2017/6017 als relatief zijn. Een niet-lim itatieve lijst van voorbeelden van invoerapparaten omvat een toetsenbord, een computermuis, een touchpad, een touchscreen, een camera, een scanner, een joystick, een microfoon, een lichtpen, een trackball, een geprojecteerd keyboard en een spelcontroller.
Een “juridisch-fiscaal document” refereert naar een schriftelijk of elektronisch bewijsstuk te maken met juridische aspecten, ofwel aspecten met betrekking op het recht, van belastingheffing.
De term “parsen” verwijst naar het ontleden van de grammaticale structuur van een invoer volgens een vastgelegde grammatica. Een parser converteert de ingevoerde tekst in een datastructuur vergelijkbaar met het invullen van een formulier met gegevens op de voorgegeven plaatsen in een voorgegeven tekstformaat.
De term “server” verwijst naar een computersysteem dat diensten verleent aan gebruikers gebruik makende van de voorgestelde computer-geïmplementeerde methode. De server bestaat bij voorkeur uit minstens een voeding, een geheugen, een processor, een harde schijf, een moederbord, en een behuizing.
In een eerste aspect betreft de uitvinding een computer-geïmplementeerde methode voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak, met het kenmerk, dat uit deze verzameling juridisch-fiscale documenten uit de rechtspraak een lijst van responsieve documenten wordt verkregen, waarbij het ordenen van de lijst stappen omvat waarbij aan elk juridisch-fiscaal document een gewichtsparameter wordt toegeschreven door het maken van een samenvatting welke getoetst wordt aan ten minste één criterium, waarbij deze criteria gecategoriseerd zijn.
Om tot een samenvatting van een document te komen, doorloopt ieder document een aantal stappen. Per document wordt een samenvatting gemaakt door de tekst en de metadata uit de aangeleverde documenten te extraheren, en deze vervolgens verder te verwerken.
Vooreerst dient de platte tekst uit de documenten geëxtraheerd te worden. Platte tekst kan immers veel beter geïnterpreteerd worden door een computer. Tekstuele data bestaat onder verschillende vormen zoals HTML-pagina's, pdf-documenten, Word-documenten, etc, waarbij elk van deze vormen zijn eigen vorm en opmaak heeft om de representatie als het ware up te graden van platte tekst naar iets wat bruikbaar is binnen hun eigen omgeving. Zo worden bij HTML verschillende tags toegevoegd om de opmaak te verfraaien of wordt er bij pdfdocumenten een fixed-layout gemaakt om het document er onder alle omstandigheden hetzelfde te laten uitzien. Om met deze verschillende soorten van tekst te kunnen werken binnen het voorgestelde systeem is het belangrijk om de platte tekst uit deze verschillende documentenformaten te extraheren. Op die manier wordt een gemeenschappelijke basis gecreëerd die als invoer zal dienen voor de verdere verwerking die dan niet meer afhankelijk
BE2017/6017 is van het type van het document. Naast het extraheren van tekst wordt ook metadata verzameld. Deze data kunnen belangrijk zijn bij de keuze van het taalafhankelijke stem mingsalgoritme dat later in deze stap gebruikt moet worden, of laat toe om verschillende soorten documentformaten, zoals pdf, doc, doex, csv, html, etc, om te vormen tot platte tekst zonder opmaak. Tevens kan de metadata inhoud omvatten die van belang zijn voor het classificeren van de documenten, zoals data, aantal bladzijden, enzovoort.
Vervolgens wordt het document geparst, welke twee delen omvat. Het eerste deel is de taaldetectie en het tweede deel is het effectief parsen van de tekst. Hierbij wordt voor elk document de parser gekozen die voor dat type het beste resultaat zal opleveren. Om alle woorden te verkrijgen die gebruikt worden in een bepaalde tekst, wordt een tokenization proces toegepast. Dit proces zorgt ervoor dat een tekstdocument gesplitst wordt in een stroom van woorden door alle leestekens te verwijderen en alle tabs en niet-tekstuele karakters door spaties te vervangen. De set van verschillende woorden uit alle tekstdocumenten wordt samengevoegd tot het woordenboek van de documentencollectie. Bij voorkeur wordt een NGram tokenizer aangewend, gezien deze de mogelijkheid geeft om twee of drie woorden samen te nemen en die als één woord in de documentencollectie te beschouwen. Dit kan voordeel geven bij o.a. personennamen, welke vaak bestaan uit twee woorden die voor een tekst belangrijk zouden kunnen zijn. Uiteraard wordt een eigennaam ook opgepikt indien alle woorden apart beschouwd worden. Om de grootte van het woordenboek en dus de dimensionaliteit van de beschrijving van de documentencollectie te verkleinen, wordt de set van woorden verder gereduceerd door het toepassen van filters of stemmingsalgoritmes. Filters verwijderen woorden van het woordenboek en dus uit de samenvattingen. Zo kan een filtering worden toegepast om stopwoorden te verwijderen die weinig of geen inhoud hebben. Voorbeelden zijn lidwoorden, verbindingswoorden, voorzetsels, etc. Stemmingsalgoritmes proberen een woord om te vormen tot de standaardvorm van dat woord. Dit doen ze bijvoorbeeld door meervouden van zelfstandige naamwoorden naar het enkelvoud om te zetten of door werkwoorden naar hun stam te vereenvoudigen.
Om het geheel van samenvattingen beter te kunnen begrijpen, moeten deze eerst worden omgevormd tot een karakteristieke vector die vervolgens als input kan dienen voor een computer. De platte tekst in de documentencollectie bevat op zich te weinig structuur om efficiënt verwerkt te worden door een computersysteem. Ondanks de simpele datastructuur zorgt het vectorruimtemodel ervoor dat grote collecties documenten efficiënt kunnen geanalyseerd worden. Het representeert documenten als vectoren in een m-dimensionale ruimte. Elk document d uit de documentencollectie wordt beschreven als een numerieke karakteristieke vector w(d) = (x(d, ti), x(d, tm)) waarbij T= {ti, tm} het woordenboek voorstelt. De hoofdtaak van de vectorruimterepresentatie van documenten is het vinden van een geschikte encodering van de karakteristieke vector. Elk element van de vector representeert meestal een woord (of groep van woorden) van de documentencollectie. De simpelste manier om een document te encoderen is om binaire term vectoren te gebruiken. Als een woord voorkomt in het document wordt het corresponderende element op één gezet,
BE2017/6017 komt het niet voor dan is het nul. De encodering wordt zo herleid tot een simpele Booleaanse vergelijking. Hierbij wordt de belangrijkheid van elk woord echter als gelijkwaardig beschouwd. Om de performantie te verbeteren worden wegingsfactoren gebruikt. Het gewicht dat toegekend wordt aan een woord is een indicatie van de belangrijkheid of relevantie van dat woord in een specifiek document of collectie. Een woord met hoge frequentie in bepaalde documenten, maar dat weinig of niet voorkomt in de volledige documentencollectie, wordt een groot gewicht toebedeeld. Een gewicht w(d, t) voor term t in document d wordt berekend als de term frequentie tf(d, t) vermenigvuldigd met de invers document frequentie idf(t) gedefinieerd als idf(t) = log (N/nt). Dit beschrijft de specificiteit van een bepaalde term in een documentencollectie. Naast term frequentie en invers document frequentie wordt een normalisatie toegepast om ervoor te zorgen dat alle documenten dezelfde kans hebben om gevonden te worden, onafhankelijk van hun lengte. Een meer complexe manier om een document te encoderen door middel van binaire term vectoren, is het aanwenden van een complexere term vector die numerieke waarden oplevert die kunnen verschillen van 0 of 1. Zo kan bijvoorbeeld een algoritme ontworpen worden dat het aantal keren een bepaald woord voorkomt in het document telt, maar tevens kan een nog complexer algoritme gebruikt worden dat aan de hand van de woorden een bepaalde interpretatie van de samenvatting in de vorm van een numerieke waarde weergeeft.
Tevens kunnen attributen die niet relevant zijn, worden verwijderd door te selecteren op karakteristieken. Zo wordt een subset van de karakteristieken gezocht die relevant zijn voor het doelconcept. Dit zorgt er o.a. voor dat de dataset kleiner wordt, waardoor minder rekenkracht en zoekruimte vereist is bij de effectieve verwerking van het vector model. Het reduceert het aantal karakteristieken, het verwijdert irrelevante of redundante data en het zorgt er bijgevolg voor dat de algoritmes sneller werken. Het zorgt er o.m. ook voor dat de voorspelde accuraatheid en begrijpbaarheid van de resultaten verbeterd wordt.
Na de preprocessing wordt de tekst automatisch in een structuur van vooraf ontworpen categorieën geplaatst, waardoor informatie kan verkregen worden over teksten met gelijkaardige inhoud. Teksten die uit dezelfde categorie komen zullen de gebruiker sneller aanspreken en zijn dus mogelijk nuttig om samen aan te bieden. Voor classificatie is een vooraf bekende structuur nodig, welke in dit geval op juridisch-fiscale documenten toegespitst is. Op basis van een leerverzameling kan een classifier getraind worden om onder bepaalde categorieën te classificeren. Het is dus de bedoeling om deze classifiers zo te kiezen dat voor elke categorie een maximaal aantal samenvattingen juist geclassificeerd kan worden. Daartoe zal vooraf voor elke tak in de boomstructuur van een dataset een optimale classifier bepaald worden om zo tot een goed mogelijk en betrouwbaar resultaat te komen. Tevens kan de classificatie gebeuren aan de hand van de geëxtraheerde metadata, of een combinatie van beide methoden.
Deze uitvinding heeft als voordeel dat de methode kan aangewend worden voor het ordenen van documentlijsten van verschillende types zoekopdrachten. Enerzijds kan deze methode
BE2017/6017 aangewend worden voor een categoriale zoekopdracht, waarbij de gebruiker door middel van een invoerapparaat instructies doorgeeft om binnen een vooraf bepaalde categorie te zoeken. De gebruiker kan bijvoorbeeld zoeken op jaartal, datum of locatie, door zich aan de hand van het invoerapparaat naar deze categorieën te navigeren. Anderzijds kan deze methode ook aangewend worden voor een zoekopdracht waarbij de gebruiker als instructie door middel van een invoerapparaat zoekwoorden doorgeeft om de gehele of gedeeltelijke collectie juridischfiscale documenten te doorzoeken naar documenten enigszins verwant met de ingevoerde zoekwoorden. Het spreekt voor zich dat de huidige uitvinding zich niet beperkt tot de bovengenoemde types zoekopdrachten. Zo kunnen bijvoorbeeld beide bovengenoemde zoekopdrachten gecombineerd worden om binnen een categoriale zoekopdracht, een tweede zoekopdracht aan de hand van enkele zoekwoorden op te starten, of vice versa.
De huidige uitvinding heeft als effect dat door het gebruik van het computersysteem door een leek zich, zonder tussenkomst van een advocaat of ander hoogopgeleid personeel, beter kan informeren betreffende juridisch-fiscale kwesties. Dit heeft als potentieel gevolg dat het aantal door de advocaat factureerbare uren gereduceerd kan worden, wat weerklinkt in een reductie in de kostprijs voor de klant en een potentieel grotere klantenportefeuille voor de advocaat.
In het bijzonder kan het computersysteem dienen als een bijkomstige bron van advies en informatie, temeer doordat er deze methode zich specifiek richt op een gebruiksvriendelijke en logische rankschikking van de juridisch-fiscale documenten.
In een voorkeursdragende uitvoeringsvorm bestaat de voorgenoemde samenvatting uit ten minste één categorie, waarbij iedere categorie bestaat uit ten minste één criterium, waarbij aan ieder criterium een numerieke wegingsfactor, wordt toegeschreven. De waarde van de wegingsfactor geeft de actuele relevantie van het overeenkomstige criterium voor de samenvatting weer. Hoe groter de numerieke waarde van de wegingsfactor is, hoe meer actueel relevant het overeenkomstig criterium is. Het criterium zelf wordt bepaald aan de hand van een karakteristieke vector, welke al dan niet een binaire term vector is.
In een verdere uitvoeringsvorm wordt de waarde van de numerieke gewichtsparameter van de samenvatting bepaald door het uitvoeren van een wiskundige bewerking op de wegingsfactoren. Bij verdere voorkeur betreft deze bewerking een optelling.
In een verdere uitvoeringsvorm worden de fiscaal-juridische documenten volgens afnemende waarde van de gewichtsparameter van de samenvatting in een lijst geordend. Dit heeft als effect dat het bovenste document in de lijst tevens het meest actueel relevante document is. Alle daaropvolgende documenten zijn zodoende tevens geordend volgens afnemende actuele relevantie.
BE2017/6017
In een voorkeurvorm is deze verzameling juridisch-fiscale documenten logisch gegroepeerd in een opslagfolder in een geheugeneenheid zodoende het onderhouden van de juridisch-fiscale documenten te vergemakkelijken.
In een verdere voorkeurvorm vormt deze geheugeneenheid een onderdeel van een computersysteem dat verbonden is met het internet. Dit heeft als effect dat de computergeïmplementeerde methode tevens vanop afstand te bereiken is door gebruikers, door bijvoorbeeld via een persoonlijke computer of smartphone een verbinding te maken met het computersysteem.
Bij verdere voorkeur is dit computersysteem een server, welke als voordeel heeft dat deze ontworpen is om data te beheren, te verwerken, op te slaan en te verzenden, in een volcontinu systeem, waardoor de computer-geïmplementeerde methode potentieel 24 uren per dag beschikbaar is.
In een verdere voorkeurvorm wordt deze verzameling juridisch-fiscale documenten onderhouden wordt door een daartoe bevoegde onderneming. Dit heeft als effect dat de logische groepering van de juridisch-fiscale documenten kan worden uitgebreid, aangepast en/of onderhouden.
In een uitvoeringsvorm bevatten de responsieve documenten informatievelden. Dit heeft als effect dat de gebruiker de individuele documenten van elkaar kan onderscheiden vaan de hand van deze informatie, zodoende de zoekopdracht gebruiksvriendelijker te laten verlopen. Bij voorkeur omvatten deze informatievelden titels, het artikelnummer, het hof en de datum betreffende het document.
In een uitvoeringsvorm bevatten de responsieve documenten actievelden waarmee de gebruiker toegang krijgt tot de inhoud van het document. Bij voorkeur is dit een actieveld dat een korte samenvatting oproept, en/of een actieveld dat de volledige inhoud van het document oproept.
In een verdere uitvoeringsvorm is de korte samenvatting van een responsief document gekenmerkt door bij voorkeur een titel, een artikel, een hof, een datum, een boek, en één of meerdere tags.
In een verdere uitvoeringsvorm verwijst de voorgenoemde tag naar een in de verzameling juridisch-fiscale documenten veelvoorkomend kernwoord. In een voorkeursvorm vormt deze tag een actieveld welke een zoekopdracht initieert volgens het betreffende kernwoord.
In een tweede aspect betreft de uitvinding een computersysteem voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak volgens de conclusies 1-11, met het kenmerk, dat het computersysteem geconfigureerd is voor:
BE2017/6017 (a) het ontvangen van juridisch-fiscale documenten via ten minste één oom m unicatienetwerk;
(b) het opslaan van deze documenten in een lokale niet-transitoire computer-leesbare inform atiedrager;
(c) het van de gebruiker via ten minste één communicatienetwerk verkrijgen van één of meerdere kernwoorden onder de vorm van een zoekopdrachtinstructies;
(d) het selecteren van een brongroep met fiscaal-juridische documenten;
(e) het identificeren van zoekinformatie vervat in de brongroep (f) het creëren van een geordende resultatenlijst gebaseerd op de instructies van de gebruiker uit stap (c) volgens stap (e);
(g) het opslaan van de geordende resultatenlijst in een lokaal geheugen;
(h) het ophalen van de geordende resultatenlijst opgeslagen in het lokaal geheugen.
(i) het verzenden via ten minste één communicatienetwerk van de geordende resultatenlijst naar het computersysteem van de gebruiker uit stap (c).
In een derde aspect betreft de uitvinding een tastbare niet-transitoire computer-leesbare informatiedrager omvattende een oomputerprogrammaproduct geschikt voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak volgens de conclusies 1-11, het computerprogrammaproduct omvattende instructies voor:
(a) het ontvangen van juridisch-fiscale documenten via ten minste één corn m unicatienetwerk;
(b) het opslaan van deze documenten in een lokale niet-transistoire computer-leesbare inform atiedrager;
(c) het van de gebruiker via ten minste één communicatienetwerk verkrijgen van instructies;
(d) het selecteren van een brongroep met fiscaal-juridische documenten;
(e) het identificeren van informatie vervat in de brongroep;
(f) het creëren van een geordende lijst gebaseerd op de instructies van de gebruiker uit stap (c) volgens stap (e);
(g) het opslaan van de geordende lijst in een lokaal geheugen;
(h) het ophalen van de geordende lijst opgeslagen in het lokaal geheugen.
(i) het verzenden via ten minste één communicatienetwerk van de geordende lijst naar het computersysteem van de gebruiker uit stap (c).
In wat volgt, wordt de uitvinding beschreven a.d.h.v. niet-limiterende voorbeelden die de uitvinding illustreren, en die niet bedoeld zijn of geïnterpreteerd mogen worden om de omvang van de uitvinding te limiteren.
VOORBEELD
De uitvinding zal nu verder worden toegelicht aan de hand van het volgende voorbeeld, zonder hiertoe overigens te worden beperkt.
BE2017/6017
Het hieropvolgend voorbeeld betreft een uitvoeringsvorm waarbij de samenvatting opgesteld wordt aan de hand van de categorieën, criteria en wegingsfactoren zoals weergegeven in Tabel
1. De criteria komen in dit geval overeen met de voorgenoemde karakteristieke vectoren, al dan niet binair.
De samenvatting volgens tabel 1 bevat de vijf categorieën ‘rechter', ‘wet’, ‘tijd’, ‘inhoud' en ‘specificiteit'. Iedere categorie bestaat uit verschillende subcategorieën, hier criteria genoemd.
De categorie ‘rechter' omvat verschillende criteria welke betrekking hebben op de rechter die de rechterlijke uitspraak in dat document voortbracht. Hierbij wordt de inhoud van het document nagegaan op de naam van de rechter, zijn reputatie, of de uitspraak veranderingen in de rechtspraak teweeg bracht, of de uitspraak een precedent omvatte, en of de uitspraak plaatsvond in een hoger rechtscollege zoals het Hof van Beroep of Hof van Cassatie.
De categorie ‘wet’ omvat verschillende criteria welke betrekking hebben op de wetgeving in het document vermeld. Hierbij wordt de inhoud van het document nagegaan of er veranderingen in de wetgeving vermeld staan, of een bepaalde wetgeving van toepassing was op het ogenblik van de uitspraak, en of een bepaalde wetgeving van toepassing was op het ogenblik van de feiten.
De categorie ‘tijd’ omvat verschillende criteria welke betrekking hebben op data en tijdsduur. Hierbij wordt de inhoud van het document nagegaan op de datum van het pleidooien, de datum van de uitspraak, de datum van de feiten, de datum van betwisting, en de tijd tussen de feiten en uitspraak.
De categorie ‘inhoud' omvat verschillende criteria welke betrekking hebben op de algemene inhoud. Hierbij wordt de inhoud van het document nagegaan op de aanwezigheid van verwijzingen naar andere rechtsleer, verwijzingen naar andere rechtspraak, de inhoud van de uitspraak en de nieuwheid ervan, alsook het aantal bladzijden, het aantal tegenstrijdige uitspraken, het aantal uitspraken aangehaald uit het verleden, en het aantal uitspraken in dezelfde materie.
De categorie ‘specificiteit' omvat verschillende criteria welke betrekking hebben op de nieuwheid van de uitspraken. Hierbij wordt de inhoud van het document nagegaan op eventuele vernieuwende passages en precedenten.
TABEL 1
CATEGORI E | WEGI NGS FACTOR | CRITERI UM |
Rechter | 1 | Omvat het document een verandering in de rechtspraak? |
1 | Omvat het document de naam van de rechter? |
BE2017/6017
2 | Omvat het document uitspraken van hogere rechtscolleges? | |
2 | Is de uitspraak vernieuwend? Heeft de uitspraak een bepaalde actualiteitswaarde? | |
2 | Heeft de rechter een gekende reputatie? | |
3 | Zijn er precedenten gekend in de rechtspraak? | |
Wet | 1 | Omvat het document een verandering in de wetgeving? |
2 | Omvat het document de wetgeving die van toepassing was op het ogenblik van de uitspraak? | |
3 | Omvat het document de wetgeving die van toepassing was op het ogenblik van de feiten? | |
Tijd | 1 | Omvat het document de datum van het pleidooien? |
1 | Omvat het document de tijd tussen de feiten en de uitspraak? | |
2 | Omvat het document de datum van de uitspraak? | |
2 | Omvat het document de datum van de feiten? | |
2 | Omvat het document de datum van de betwisting? | |
Inhoud | 1 | Omvat het document verwijzingen naar andere rechtsleer |
1 | Omvat het document verwijzingen naar andere rechtspraak | |
1 | Hoeveel bladzijden omvat de uitspraak? Dit is immers een criterium dat wijst op de grondigheid van de analyse. | |
1 | Zijn er over dezelfde materie al meerdere uitspraken geweest die tegenstrijdig zijn? Het kan immers een meerwaarde zijn dat dit punt wordt uitgeklaard teneinde te komen tot een zekere rechtszekerheid. | |
2 | Hoeveel uitspraken van dezelfde rechter zijn er in het verleden reeds gewezen? Dit is immers minder relevant is hoe meer gewezen uitspraken er zijn. | |
2 | Hoeveel uitspraken in dezelfde materie zijn er al in het verleden gewezen? Dit is immers minder relevant is hoe meer gewezen uitspraken er zijn. | |
3 | In welke mate is de inhoud van de uitspraak en de vernieuwende passage te gebruiken in andere zaken? | |
Specificiteit | 1 | Is er een vernieuwende passage in de uitspraak te vinden? |
1 | Wordt er in het document verwezen naar een precedent? |
BE2017/6017
Claims (13)
- CONCLUSIES1. Een computer-geïmplementeerde methode voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak, met het kenmerk, dat uit deze verzameling juridisch-fiscale documenten uit de rechtspraak een lijst van responsieve documenten wordt verkregen, waarbij het ordenen van de lijst een stap omvat waarbij aan elk juridisch-fiscaal document een gewichtsparameter wordt toegeschreven door het maken van een samenvatting welke getoetst wordt aan ten minste één criterium, waarbij deze criteria gecategoriseerd zijn en waarbij samenvattingen worden aangemaakt, waarbij deze eerst worden omgevormd tot een karakteristieke vector die vervolgens als input kan dienen voor een computer, welke samenvattingen als vectoren worden voorgesteld in een m-dimensionale ruimte, waarbij elk document d uit de documentencollectie wordt beschreven als een numerieke karakteristieke vector w(d) = (x(d, ti), x(d, tm)) waarbij T = {ti, tm} een woordenboek voorstelt.
- 2. Een computer-geïmplementeerde methode volgens conclusie 1, met het kenmerk, dat iedere categorie uit ten minste één criterium bestaat, waarbij aan ieder criterium een wegingsfactor wordt toegeschreven.
- 3. Een computer-geïmplementeerde methode volgens conclusie 2, met als kenmerk, dat de gewichtsparameter bepaald wordt door een wiskundige operatie uit te voeren op de wegingsfactoren.
- 4. Een computer-geïmplementeerde methode volgens conclusie 3, met als kenmerk, dat fiscaal-juridische documenten volgens afnemende waarde van de gewichtsparameter in de resultatenlijst worden geordend.
- 5. Een computer-geïmplementeerde methode volgens conclusie 1, met als kenmerk, dat deze verzameling juridisch-fiscale documenten logisch gegroepeerd zijn in een opslagfolder in een geheugeneenheid.
- 6. Een computer-geïmplementeerde methode volgens conclusie 5, met als kenmerk, dat deze geheugeneenheid een onderdeel vormt van een computersysteem dat verbonden is met het internet.
- 7. Een computer-geïmplementeerde methode volgens conclusie 1, met als kenmerk, dat deze verzameling juridisch-fiscale documenten onderhouden wordt door een bevoegde onderneming.
- 8. Een computer-geïmplementeerde methode volgens conclusie 1, met als kenmerk, dat de responsieve documenten informatievelden bevatten zoals bij voorkeur titel, artikel, hof en datum.
- 9. Een computer-geïmplementeerde methode volgens conclusie 8, met als kenmerk, dat de responsieve documenten actievelden bevatten zoals bij voorkeur een actieveld dat een korte samenvatting oproept, of een actieveld dat de volledige inhoud van het document oproept.
- 10. Een computer-geïmplementeerde methode volgens conclusie 9, met als kenmerk, dat de korte samenvatting van een responsief document gekenmerkt is door bij voorkeur een titel, een artikel, een hof, een datum, een boek, en één of meerdere tags.BE2017/6017
- 11. Een computer-geïmplementeerde methode volgens conclusie 10, met als kenmerk, dat de voorgenoemde tag verwijst naar een kernwoord van het document.
- 12. Een computersysteem voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak volgens de conclusies 1-11, met het kenmerk, dat het computersysteem geconfigureerd is voor:a. het ontvangen van juridisch-fiscale documenten via ten minste één communicatienetwerk;b. het opslaan van deze documenten in een lokale niet-transitoire computerleesbare informatiedrager;c. het van de gebruiker via ten minste één communicatienetwerk verkrijgen van instructies;d. het selecteren van een brongroep met fiscaal-juridische documenten;e. het identificeren van informatie vervat in de brongroep;f. het creëren van een geordende lijst gebaseerd op de instructies van de gebruiker uit stap (c) volgens stap (e);g. het opslaan van de geordende lijst in een lokaal geheugen;h. het ophalen van de geordende lijst opgeslagen in het lokaal geheugen.i. het verzenden via ten minste één communicatienetwerk van de geordende lijst naar het computersysteem van de gebruiker uit stap (c).
- 13. Een tastbare niet-transitoire computer-leesbare informatiedrager omvattende een computerprogrammaproduct geschikt voor het sorteren van een verzameling juridischfiscale documenten uit de rechtspraak volgens de conclusies 1-11, het computerprogrammaproduct omvattende instructies voor:a. het ontvangen van juridisch-fiscale documenten via ten minste één communicatienetwerk;b. het opslaan van deze documenten in een lokale niet-transitoire computerleesbare informatiedrager;c. het van de gebruiker via ten minste één communicatienetwerk verkrijgen van instructies;d. het selecteren van een brongroep met fiscaal-juridische documenten;e. het identificeren van informatie vervat in de brongroep;f. het creëren van een geordende lijst gebaseerd op de instructies van de gebruiker uit stap (c) volgens stap (e);g. het opslaan van de geordende lijst in een lokaal geheugen;h. het ophalen van de geordende lijst opgeslagen in het lokaal geheugen.i. het verzenden via ten minste één communicatienetwerk van de geordende lijst naar het computersysteem van de gebruiker uit stap (c).
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
BE2017/6017A BE1025360B1 (nl) | 2017-12-28 | 2017-12-28 | Beheren en aanwenden van juridisch-fiscale documenten uit de rechtspraak |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
BE2017/6017A BE1025360B1 (nl) | 2017-12-28 | 2017-12-28 | Beheren en aanwenden van juridisch-fiscale documenten uit de rechtspraak |
Publications (1)
Publication Number | Publication Date |
---|---|
BE1025360B1 true BE1025360B1 (nl) | 2019-01-30 |
Family
ID=61156911
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BE2017/6017A BE1025360B1 (nl) | 2017-12-28 | 2017-12-28 | Beheren en aanwenden van juridisch-fiscale documenten uit de rechtspraak |
Country Status (1)
Country | Link |
---|---|
BE (1) | BE1025360B1 (nl) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BE1031226A1 (nl) | 2022-12-30 | 2024-07-23 | Advocatenkantoor Thierry Lauwers Bv Bvba | Werkwijze voor het classificeren en gebruiken van juridische documenten |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004061619A2 (en) * | 2002-12-30 | 2004-07-22 | Thomson Corporation | Knowledge-management systems for law firms |
WO2007041688A1 (en) * | 2005-10-04 | 2007-04-12 | Thomson Global Resources | Systems, methods, and software for identifying relevant legal documents |
US7249026B1 (en) * | 1993-03-24 | 2007-07-24 | Engate Llc | Attorney terminal having outline preparation capabilities for managing trial proceedings |
US8032533B1 (en) * | 2005-01-14 | 2011-10-04 | Thomson Reuters Global Resources | Systems, methods, and software for researching statutory information |
-
2017
- 2017-12-28 BE BE2017/6017A patent/BE1025360B1/nl active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7249026B1 (en) * | 1993-03-24 | 2007-07-24 | Engate Llc | Attorney terminal having outline preparation capabilities for managing trial proceedings |
WO2004061619A2 (en) * | 2002-12-30 | 2004-07-22 | Thomson Corporation | Knowledge-management systems for law firms |
US8032533B1 (en) * | 2005-01-14 | 2011-10-04 | Thomson Reuters Global Resources | Systems, methods, and software for researching statutory information |
WO2007041688A1 (en) * | 2005-10-04 | 2007-04-12 | Thomson Global Resources | Systems, methods, and software for identifying relevant legal documents |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BE1031226A1 (nl) | 2022-12-30 | 2024-07-23 | Advocatenkantoor Thierry Lauwers Bv Bvba | Werkwijze voor het classificeren en gebruiken van juridische documenten |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210109958A1 (en) | Conceptual, contextual, and semantic-based research system and method | |
US8983963B2 (en) | Techniques for comparing and clustering documents | |
US8583419B2 (en) | Latent metonymical analysis and indexing (LMAI) | |
KR101658794B1 (ko) | 문서 분류 시스템, 문서 분류 방법 및 문서 분류 프로그램 | |
US9251249B2 (en) | Entity summarization and comparison | |
US11263523B1 (en) | System and method for organizational health analysis | |
CN109508373B (zh) | 企业舆情指数的计算方法、设备及计算机可读存储介质 | |
WO2010035455A1 (ja) | 情報分析装置、情報分析方法、及びプログラム | |
CN110892398A (zh) | 多因素文档分析 | |
US11544306B2 (en) | System and method for concept-based search summaries | |
CA2956627A1 (en) | System and engine for seeded clustering of news events | |
Haque et al. | Opinion mining from bangla and phonetic bangla reviews using vectorization methods | |
JP2015194955A (ja) | 入札情報検索システム | |
KR20110010664A (ko) | 문서 분석 시스템 | |
JP5224532B2 (ja) | 評判情報分類装置及びプログラム | |
BE1025360B1 (nl) | Beheren en aanwenden van juridisch-fiscale documenten uit de rechtspraak | |
JP2010198142A (ja) | 文書中に含まれる語句がカテゴリ別に配属されるデータベースの作成装置、データベースの作成方法、および、データベースの作成プログラム | |
Prakhash et al. | Categorizing food names in restaurant reviews | |
JP2020067864A (ja) | 知識検索装置、知識検索方法、および、知識検索プログラム | |
CN109408808A (zh) | 一种文艺作品的评估方法及评估系统 | |
US20220156285A1 (en) | Data Tagging And Synchronisation System | |
Scholtes et al. | Big data analytics for e-discovery | |
Sanda et al. | Opinion mining feature-level using Naive Bayes and feature extraction based analysis dependencies | |
KR101078966B1 (ko) | 문서 분석 시스템 | |
KR101987301B1 (ko) | 소셜 미디어 데이터 및 증시 관련 웹데이터 분석을 통한 감성레벨산출시스템 및 그 제어방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG | Patent granted |
Effective date: 20190130 |