BE1025360B1 - Administering and using legal and tax documents from the case - Google Patents

Administering and using legal and tax documents from the case Download PDF

Info

Publication number
BE1025360B1
BE1025360B1 BE2017/6017A BE201706017A BE1025360B1 BE 1025360 B1 BE1025360 B1 BE 1025360B1 BE 2017/6017 A BE2017/6017 A BE 2017/6017A BE 201706017 A BE201706017 A BE 201706017A BE 1025360 B1 BE1025360 B1 BE 1025360B1
Authority
BE
Belgium
Prior art keywords
legal
documents
computer
characterized
tax
Prior art date
Application number
BE2017/6017A
Other languages
Dutch (nl)
Inventor
Thierry Lauwers
Original Assignee
Advocatenkantoor Thierry Lauwers Bv Bvba
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advocatenkantoor Thierry Lauwers Bv Bvba filed Critical Advocatenkantoor Thierry Lauwers Bv Bvba
Priority to BE2017/6017A priority Critical patent/BE1025360B1/en
Application granted granted Critical
Publication of BE1025360B1 publication Critical patent/BE1025360B1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06QDATA PROCESSING SYSTEMS OR METHODS, SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL, SUPERVISORY OR FORECASTING PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL, SUPERVISORY OR FORECASTING PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services; Handling legal documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06QDATA PROCESSING SYSTEMS OR METHODS, SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL, SUPERVISORY OR FORECASTING PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL, SUPERVISORY OR FORECASTING PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation, e.g. computer aided management of electronic mail or groupware; Time management, e.g. calendars, reminders, meetings or time accounting

Abstract

Een computer-geïmplementeerde methode voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak, waarbij uit deze verzameling juridisch-fiscale documenten uit de rechtspraak een lijst van responsieve documenten wordt verkregen, waarbij het ordenen van de lijst een stap omvat waarbij aan elk juridisch-fiscaal document een gewichtsparameter wordt toegeschreven door het maken van een samenvatting welke getoetst wordt aan ten minste één criterium, waarbij deze criteria gecategoriseerd zijn. A computer-implemented method for sorting a collection of legal and tax documents from the case, with this collection of legal and tax documents from the case obtained a list of responsive documents, which organize the list includes a step in which each legal and fiscal document weight parameter is attributed by making a summary which will be tested on at least one criterion, these criteria are categorized.

Description

BEHEREN EN AANWENDEN VAN JURIDISCH-FISCALE DOCUMENTEN UIT DE RECHTSPRAAK Administering and using LEGAL-TAX DOCUMENTS FROM THE LAW

TECHNISCH DOMEIN TECHNICAL FIELD

De uitvinding heeft betrekking op een op een computer-geïmplementeerde methode voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak, en een tastbare niet-transitoire computer-leesbare informatiedrager omvattende een computerprogramma-product voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak. The invention relates to a computer-implemented method for sorting a collection of legal and tax documents from the case, and a tangible non-transitory computer-readable data carrier comprising a computer program product for sorting a collection of legal and fiscal documents from the case.

STAND DER TECHNIEK ART

Het Belgische rechtssysteem, evenals een aantal andere rechtsstelsels over de hele wereld zijn sterk afhankelijk van schriftelijke juridische adviezen en de schriftelijke uitspraken van rechters om wetten betreffende de beslechting van geschillen uit te leggen of te interpreteren. The Belgian legal system, as well as some other legal systems around the world rely heavily on written legal opinions and the written decisions of judges to explain or interpret from laws governing the settlement of disputes. Als gevolg daarvan zoeken rechters en advocaten naar de meest relevante vroegere opvattingen of jurisprudentie, zodoende geschillen op te lossen of te voorkomen, terwijl deze hoeveelheid informatie alsmaar blijft toenemen. As a result, judges and lawyers searching for the most relevant historical views or jurisprudence, as to resolve disputes or to avoid, while volume of information constantly continues to increase. Gevonden cases worden bestudeerd op relevantie en worden uiteindelijk geciteerd en besproken in documenten, procesmateriaal genoemd, die bijvoorbeeld pleiten voor gerechtelijke stappen, cliënten adviseren over waarschijnlijke gerechtelijke acties of cliënten en advocaten informeren over wetten in bepaalde jurisdicties. Found cases are studied by relevance and eventually cited and discussed in documents, said process equipment, for example, call for legal action, advising clients inquire about probable legal proceedings or clients and lawyers on laws in certain jurisdictions.

Naast het rechtssysteem zijn in België ook voorafgaande beslissingen of rulings relevant. Besides the legal system in Belgium also advanced ruling or rulings relevant. FOD Financiën bepaalt aan de hand van deze rulings hoe belastingwetten zullen worden toegepast op een specifieke situatie of verrichting die op fiscaal vlak nog geen uitwerking heeft gehad. FPS Finance determines, on the basis of these rulings, the tax laws will be applied to a specific situation or transaction that has had on tax matters no effect yet. EP 2008/1 586 055 beschrijft een methode voor het beheren en aanwenden van informatie bij advocatenkantoren en potentieel andere ondernemingen. EP 2008/1 586 055 describes a method to manage and use information from law firms and potentially other companies. Eén systeem biedt bijvoorbeeld een gebruikersinterface voor het onderzoeken van jurisprudentie voor online juridisch onderzoek en voor het identificeren en verkrijgen van toegang tot advocatenkantoordocumenten. For example, one system provides a user interface for examining jurisprudence online legal research and for identifying and accessing documents law. Via de interface kan een gebruiker, zoals een advocaat, een juridische onderzoeksopdracht initiëren of indienen en de zoekresultaten bekijken die niet alleen relevante externe documenten van de online juridische onderzoeksdienst identificeren, maar ook relevante interne documenten, zoals lastenboeken, klantbrieven, en juridische memoranda uit de eigen documentenverzameling van het advocatenkantoor. Through the interface, a user, such as a lawyer, initiating a legal research assignment or submit and view the search results that not only identify relevant external documents online legal research service, but also relevant internal documents such as specifications, customer letters and legal briefs from own document collection of the law firm.

De gekende methodes richten zich echter enkel op gebruik door advocaten of ander hoog opgeleid personeel, terwijl toegang tot juridisch-fiscale documenten van relevante cases ook voor leken een informerend en adviserend karakter kan hebben. The known methods, however, focus only on the use by lawyers and other highly trained personnel, while access to legal and tax documents relevant cases also seemed to have an informative and advisory nature.

Nog een probleem in de manier waarop deze juridisch-fiscale documenten worden geordend, is het ontbreken van een gebruiksvriendelijke computer-geïmplementeerde zoekterminal, waarbij de resultaten volgens relevantie aan de zoekopdracht worden geordend. Another problem in the way they are organized legal and tax documents, is the lack of a user-friendly computer-implemented search terminal, the results are sorted according to relevance to the query. Het booleaans zoekalgoritme zoals volgens Google is veeleer niet geschikt voor dergelijke ordening gezien de rechtspraak een dynamisch en discontinu systeem van wetten, uitspraken, rechters en rechtbanken betreft, waarbij interpretaties van wetten gebonden kunnen zijn aan een tijdsgeest, sociale of maatschappelijke omstandigheden, verschillende rechtbanken of rechters, anticipaties op toekomstige wetten, enzovoort. The Boolean search algorithm such as Google is rather not suitable for such arrangement in view of the law is a dynamic and discontinuous system of laws, rulings, judges and courts, with interpretations of laws may be subject to a time spirit, social or social circumstances, various courts or judges, anticipations of future laws, and so on.

De huidige uitvinding beoogt een oplossing te vinden voor ten minste enkele van bovenvermelde problemen. The present invention aims to find a solution to at least some of the above-mentioned problems.

SAMENVATTING VAN DE UITVINDING SUMMARY OF THE INVENTION

In een eerste aspect betreft de huidige uitvinding een computer-geïmplementeerde methode voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak, volgens conclusie 1. In a first aspect, the present invention relates to a computer-implemented method for sorting a collection of legal and tax documents from the case according to claim 1.

In een tweede aspect betreft de huidige uitvinding een computersysteem voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak, volgens conclusie 12. In a second aspect, the present invention relates to a computer system for sorting a collection of legal and tax documents from the case according to claim 12.

In een derde aspect betreft de huidige uitvinding een tastbare niet-transitoire computer-leesbare informatiedrager omvattende een computerprogrammaproduct geschikt voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak, volgens conclusie 13. In a third aspect, the present invention relates to a non-transitory tangible computer-readable information carrier comprising a computer program product suitable for the sorting of a set of legal-tax documents from the case according to claim 13.

De huidige uitvinding is voordelig omdat een leek zich, door gebruik van het computersysteem, zonder tussenkomst van een advocaat, kan informeren betreffende juridisch-fiscale kwesties. The present invention is advantageous because a layman himself, using the computer, without the intervention of a lawyer, to inform on legal and tax issues.

Daarnaast is de uitvinding voordelig omdat de fiscale-juridische documenten volgens actuele relevantie worden geordend. In addition, the invention is advantageous because the tax-legal documents are organized according to topical relevance.

GEDETAILLEERDE BESCHRIJVING DETAILED DESCRIPTION

De uitvinding betreft een computer-geïmplementeerde methode en een tastbare niet-transitoire computer-leesbare informatiedrager omvattende een computerprogrammaproduct voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak. The invention relates to a computer-implemented method and a tangible non-transitory computer-readable data carrier comprising a computer program product for sorting a collection of legal and tax documents from the case. In wat volgt, wordt de uitvinding in detail beschreven, worden voorkeursuitvoeringen toegelicht, en wordt de uitvinding geïllustreerd aan de hand van voorbeelden. In the following, the invention will be described in detail, preferred embodiments will be explained, and the present invention is illustrated by way of examples.

Tenzij anders gedefinieerd, hebben alle termen die gebruikt worden in de beschrijving van de uitvinding, ook technisch en wetenschappelijke termen, de betekenis zoals ze algemeen begrepen worden door de vakman in het technisch veld van de uitvinding. Unless otherwise defined, all terms used in the description of the invention, including technical and scientific terms, have the meaning as they are generally understood by the skilled person in the technical field of the invention. Voor een betere beoordeling van de beschrijving van de uitvinding, worden de volgende termen expliciet uitgelegd. For a better assessment of the description of the invention, the following terms are explicitly explained. “Een”, ”de” en “het” refereren naar zowel het enkelvoud als het meervoud tenzij de context duidelijk anders veronderstelt. "A," "an" and "the" refer to both the singular and plural unless the context clearly implies otherwise. Bijvoorbeeld, “een segment” betekent een of meer dan een segment. For example, "a segment" means one or more than one segment.

De termen “omvatten”, “omvattende”, “bestaan uit”, “bestaande uit”, “voorzien van”, “bevatten”, “bevattende”, “behelzen”, “behelzende”, “inhouden”, “inhoudende” zijn synoniemen en zijn inclusieve of open termen die de aanwezigheid van wat volgt aanduiden, en die de aanwezigheid niet uitsluiten of beletten van andere componenten, kenmerken, elementen, leden, stappen, gekend uit of beschreven in de stand der techniek. The terms "comprise", "comprising", "consisting of", "consisting of", "having", "containing", "including", "include", "behelzende", "contents", "including" are synonyms and are inclusive or open terms that indicate the presence of what follows, and which do not preclude the presence or prevention of other components, features, elements, members, steps, known from, or disclosed in the prior art.

De term “actueel relevant” of “actuele relevantie” verwijst naar de mate waarop een bepaald document overeenkomt met het actueel dynamisch en discontinu systeem van wetten, uitspraken, rechters en rechtbanken, gezien interpretaties van wetten gebonden kunnen zijn aan een tijdsgeest, sociale of maatschappelijke omstandigheden, verschillende rechtbanken of rechters, anticipaties op toekomstige wetten, enzovoort. The term "topical relevance" or "topical relevance" refers to the degree to which a particular document matches the current dynamic and discontinuous system of laws, rulings, judges and courts, seen interpretations of laws may be subject to a time spirit, social or circumstances, different courts or judges, anticipations of future laws, and so on. De actuele relevantie van een document wordt in deze uitvinding bepaald door de samenvatting ervan een numerieke waarde in de vorm van een gewichtsparameter toe te schrijven. The actual relevance of a document is determined in this invention by its summary can be attributed a numerical value in the form of a weight parameter. Deze gewichtsparameter wordt bepaald door een wiskundige bewerking van meerdere numerieke wegingsfactoren, waarbij iedere wegingsfactor een bepaald criterium beschrijft. This weighting parameter is determined by a mathematical operation of a plurality of numerical weighting factors, each weighting factor describing a particular criterion. Het document waarvan de samenvatting de grootste gewichtsparameter heeft, zal zodoende het meest actueel relevant zijn. The document which the summary is the biggest weight parameter, will thus be the most innovating. Tevens worden verwante criteria bij voorkeur gegroepeerd in categorieën. Also, related criteria are preferably grouped into categories.

De term “classifier” refereert naar de abstracte metaklasse van classificatieconcepten welke aangewend worden als mechanisme om elementen met gemeenschappelijke eigenschappen en/of inhoud in sets te verzamelen. The term "classifier" refers to the abstract meta-class classification of concepts which are used as a mechanism for collecting elements with common attributes and / or contents in sets. In dit document refereert deze term naar een algoritme ontworpen om de samenvattingen en documenten te ordenen volgens hun karakteristieken. In this document, this term refers to an algorithm designed to organize the summaries and documents according to their characteristics.

De term “gebruiker” refereert naar een persoon die de inhoud van gegevensverzamelingen van een informatiesysteem gebruiken. The term "User" refers to a person using the contents of datasets of information. In het bijzonder refereert de term in dit document naar de persoon die een inhoud van de responsieve juridisch-fiscale documenten raadpleegt na het doorgeven van instructies aan het computersysteem. In particular, the term refers in this document to the person a content responsive legal and tax documents, see after passing instructions to the computer system.

De term “invoerapparaat” refereert naar een apparaat geschikt om input aan te leveren aan een gebruikerstoestel. The term "input device" refers to a device suitable to supply input to a user equipment. Deze input is niet beperkt tot een bepaalde modaliteit en kan mechanische beweging, geluid, beelden, en dergelijke omvatten. This input is not limited to a particular modality and to mechanical motion, sound, images, and the like. De input kan discreet en/of continu zijn. The input may be discrete and / or continuous. De input is ook niet beperkt door het aantal vrijheidsgraden. The input is not limited by the number of degrees of freedom. De input kan zowel directe als indirecte input betreffen. Input may involve both direct and indirect inputs. Bij het voorzien van input met betrekking tot een positie of de verandering daarvan, zoals bv. een indicator op een scherm, kan de input zowel absoluut als relatief zijn. By providing input in relation to a position or the change thereof, such as eg. An indicator on a display, the input can be in both absolute and relative. Een niet-limitatieve lijst van voorbeelden van invoerapparaten omvat een toetsenbord, een computermuis, een touchpad, een touchscreen, een camera, een scanner, een joystick, een microfoon, een lichtpen, een trackball, een geprojecteerd keyboard en een spelcontroller. A non-exhaustive list of examples of input devices includes a keyboard, a computer mouse, a touchpad, a touch screen, a camera, a scanner, a joystick, a microphone, a light pen, a trackball, a projected keyboard and a game controller.

Een “juridisch-fiscaal document” refereert naar een schriftelijk of elektronisch bewijsstuk te maken met juridische aspecten, ofwel aspecten met betrekking op het recht, van belastingheffing. A "legal and fiscal document" refers to a written or electronic make proof of legal issues or issues relating to the right of taxation.

De term “parsen” verwijst naar het ontleden van de grammaticale structuur van een invoer volgens een vastgelegde grammatica. The term "parse" refers to the decomposition of the grammatical structure of an input according to a predefined grammar. Een parser converteert de ingevoerde tekst in een datastructuur vergelijkbaar met het invullen van een formulier met gegevens op de voorgegeven plaatsen in een voorgegeven tekstformaat. A parser converts the text entered in a data structure similar to filling out a form with information on the given place in a given text format.

De term “server” verwijst naar een computersysteem dat diensten verleent aan gebruikers gebruik makende van de voorgestelde computer-geïmplementeerde methode. The term "server" refers to a computer system that provides to users services using the proposed computer-implemented method. De server bestaat bij voorkeur uit minstens een voeding, een geheugen, een processor, een harde schijf, een moederbord, en een behuizing. The server preferably comprises at least one power supply, memory, processor, hard drive, motherboard, and a housing.

In een eerste aspect betreft de uitvinding een computer-geïmplementeerde methode voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak, met het kenmerk, dat uit deze verzameling juridisch-fiscale documenten uit de rechtspraak een lijst van responsieve documenten wordt verkregen, waarbij het ordenen van de lijst stappen omvat waarbij aan elk juridisch-fiscaal document een gewichtsparameter wordt toegeschreven door het maken van een samenvatting welke getoetst wordt aan ten minste één criterium, waarbij deze criteria gecategoriseerd zijn. In a first aspect, the invention relates to a computer-implemented method for sorting a collection of legal and tax documents from the case, characterized in that a list of responsive documents obtained from the law legal and tax documents from this collection, which arranging the list steps where all legal and fiscal document weight parameter is attributed by making a summary which will be tested on at least one criterion, these criteria are categorized.

Om tot een samenvatting van een document te komen, doorloopt ieder document een aantal stappen. To get a summary of a document, every document goes through several steps. Per document wordt een samenvatting gemaakt door de tekst en de metadata uit de aangeleverde documenten te extraheren, en deze vervolgens verder te verwerken. Each document is a summary by extracting text and metadata from the documents presented, and to process them further.

Vooreerst dient de platte tekst uit de documenten geëxtraheerd te worden. First, the plain text is from the documents to be extracted. Platte tekst kan immers veel beter geïnterpreteerd worden door een computer. Plain text can be interpreted better by a computer. Tekstuele data bestaat onder verschillende vormen zoals HTML-pagina's, pdf-documenten, Word-documenten, etc, waarbij elk van deze vormen zijn eigen vorm en opmaak heeft om de representatie als het ware up te graden van platte tekst naar iets wat bruikbaar is binnen hun eigen omgeving. Textual data exists in various forms such as HTML pages, PDF documents, Word documents, etc, each of these forms has its own shape and layout for the representation as it were to upgrade from plain text to something useful within their own environment. Zo worden bij HTML verschillende tags toegevoegd om de opmaak te verfraaien of wordt er bij pdf-documenten een fixed-layout gemaakt om het document er onder alle omstandigheden hetzelfde te laten uitzien. So be added at various HTML tags to decorate the layout or is in PDF documents created a fixed-layout in order to look the same under all circumstances the document. Om met deze verschillende soorten van tekst te kunnen werken binnen het voorgestelde systeem is het belangrijk om de platte tekst uit deze verschillende documentenformaten te extraheren. To work with these different types of text in the proposed system, it is important to extract plain text from these various document formats. Op die manier wordt een gemeenschappelijke basis gecreëerd die als invoer zal dienen voor de verdere verwerking die dan niet meer afhankelijk is van het type van het document. In this way creates a common base which will serve as input for further processing or is no longer dependent on the type of document. Naast het extraheren van tekst wordt ook metadata verzameld. In addition to extracting text metadata is also collected. Deze data kunnen belangrijk zijn bij de keuze van het taalafhankelijke stemmingsalgoritme dat later in deze stap gebruikt moet worden, of laat toe om verschillende soorten documentformaten, zoals pdf, doc, docx, csv, html, etc, om te vormen tot platte tekst zonder opmaak. These data may be important in the choice of language specific voting algorithm to be used later in this step, or allows different types of document formats, such as pdf, doc, docx, csv, html, etc, in order to create plain text without formatting . Tevens kan de metadata inhoud omvatten die van belang zijn voor het classificeren van de documenten, zoals data, aantal bladzijden, enzovoort. In addition, the metadata can include content that are of interest for the classification of the documents, such as data, number of pages, and so on.

Vervolgens wordt het document geparst, welke twee delen omvat. Then, the document is parsed, which comprises two parts. Het eerste deel is de taaldetectie en het tweede deel is het effectief parsen van de tekst. The first part is the language detection and the second part is the actual parsing of the text. Hierbij wordt voor elk document de parser gekozen die voor dat type het beste resultaat zal opleveren. Here for each document is selected parser that will yield the best results for that type. Om alle woorden te verkrijgen die gebruikt worden in een bepaalde tekst, wordt een tokenization proces toegepast. To obtain all the words used are used in a text, is a tokenization process. Dit proces zorgt ervoor dat een tekstdocument gesplitst wordt in een stroom van woorden door alle leestekens te verwijderen en alle tabs en niet-tekstuele karakters door spaties te vervangen. This process ensures that a text document is split to remove a stream of words, all punctuation and all tabs and non-text characters to be replaced by spaces. De set van verschillende woorden uit alle tekstdocumenten wordt samengevoegd tot het woordenboek van de documentencollectie. The set of different words from all text documents will be merged into the vocabulary of the document collection. Bij voorkeur wordt een N-Gram tokenizer aangewend, gezien deze de mogelijkheid geeft om twee of drie woorden samen te nemen en die als één woord in de documentencollectie te beschouwen. Preferably used N-gram tokenizer gives considering the possibility to take along two or three words and be regarded as one word in the document collection. Dit kan voordeel geven bij oa personennamen, welke vaak bestaan uit twee woorden die voor een tekst belangrijk zouden kunnen zijn. This may provide benefit in including people names, which often consist of two words that could be important for a text. Uiteraard wordt een eigennaam ook opgepikt indien alle woorden apart beschouwd worden. Of course, a proper name is also picked up, if all of the words to be considered separately. Om de grootte van het woordenboek en dus de dimensionaliteit van de beschrijving van de documentencollectie te verkleinen, wordt de set van woorden verder gereduceerd door het toepassen van filters of stemmingsalgoritmes. To reduce the size of the dictionary and therefore the dimensionality of the description of the document collection, the set of words is further reduced by applying filters or tuning algorithms. Filters verwijderen woorden van het woordenboek en dus uit de samenvattingen. Filters remove words from the dictionary and therefore the summaries. Zo kan een filtering worden toegepast om stopwoorden te verwijderen die weinig of geen inhoud hebben. Such a filtering can be used to remove stop words that have little or no content. Voorbeelden zijn lidwoorden, verbindingswoorden, voorzetsels, etc. Stemmingsalgoritmes proberen een woord om te vormen tot de standaardvorm van dat woord. Examples include: articles, conjunctions, prepositions, etc. Mood Algorithms try a word to form the standard form of that word. Dit doen ze bijvoorbeeld door meervouden van zelfstandige naamwoorden naar het enkelvoud om te zetten of door werkwoorden naar hun stam te vereenvoudigen. They do this by, for example, plural forms of nouns to the singular to convert or by simplifying verbs by their stem.

Om het geheel van samenvattingen beter te kunnen begrijpen, moeten deze eerst worden omgevormd tot een karakteristieke vector die vervolgens als input kan dienen voor een computer. To understand all of summaries better, it must first be transformed into a characteristic vector which can then serve as a computer input. De platte tekst in de documentencollectie bevat op zich te weinig structuur om efficiënt verwerkt te worden door een computersysteem. The plain text in the document collection has in itself too little structure to be efficiently processed by a computer system. Ondanks de simpele datastructuur zorgt het vectorruimtemodel ervoor dat grote collecties documenten efficiënt kunnen geanalyseerd worden. Despite the simple data structure the vector space model ensures that large collections of documents can be analyzed efficiently. Het representeert documenten als vectoren in een m-dimensionale ruimte. It represents documents as vectors in an m-dimensional space. Elk document d uit de documentencollectie wordt beschreven als een numerieke karakteristieke vector w(d) = (x(d, ti), ..., x(d, tm)) waarbij T = {ti, ..., tm} het woordenboek voorstelt. Each document d is described in the document collection as a numeric characteristic vector w (d) = (x? (D, t i), ..., x (d, tm)) where T = {ti, ..., tm} is the represents dictionary. De hoofdtaak van de vectorruimterepresentatie van documenten is het vinden van een geschikte encodering van de karakteristieke vector. The main task of the vector space representation of documents is to find a suitable encoding of the characteristic vector. Elk element van de vector representeert meestal een woord (of groep van woorden) van de documentencollectie. Each element of the vector, usually represents a word (or set of words) of the document collection. De simpelste manier om een document te encoderen is om binaire term vectoren te gebruiken. The simplest way to encode a document is to use binary expression vectors. Als een woord voorkomt in het document wordt het corresponderende element op één gezet, komt het niet voor dan is het nul. If a word appears the corresponding element is put on one of the document, it does not exist then it is zero. De encodering wordt zo herleid tot een simpele Booleaanse vergelijking. The encoding is thus reduced to a simple Boolean equation. Hierbij wordt de belangrijkheid van elk woord echter als gelijkwaardig beschouwd. Here, the importance of each word is, however, considered to be equivalent. Om de performantie te verbeteren worden wegingsfactoren gebruikt. To improve the performance weighting factors are used. Het gewicht dat toegekend wordt aan een woord is een indicatie van de belangrijkheid of relevantie van dat woord in een specifiek document of collectie. The weight assigned to a word is an indication of the importance or relevance of that word in a particular document or collection. Een woord met hoge frequentie in bepaalde documenten, maar dat weinig of niet voorkomt in de volledige documentencollectie, wordt een groot gewicht toebedeeld. A word with high frequency in certain documents, but little, if not in the entire document collection, a large weight is assigned. Een gewicht w(d, t) voor term t in document d wordt berekend als de term frequentie tf(d, t) vermenigvuldigd met de invers document frequentie idf(t) -gedefinieerd als idf(t) = log (N/nt). A weight w (d, t) for term t in the document d is calculated as the term frequency TF (d, t) is multiplied by the inverse document frequency idf (t) -gedefinieerd as idf (t) = log (N / nt) . Dit beschrijft de specificiteit van een bepaalde term in een documentencollectie. This describes the specificity of a particular term in a document collection. Naast term frequentie en invers document frequentie wordt een normalisatie toegepast om ervoor te zorgen dat alle documenten dezelfde kans hebben om gevonden te worden, onafhankelijk van hun lengte. In addition to term frequency and inverse document frequency normalization is used to make sure that all the documents have the same probability to be found, regardless of their length. Een meer complexe manier om een document te encoderen door middel van binaire term vectoren, is het aanwenden van een complexere term vector die numerieke waarden oplevert die kunnen verschillen van 0 of 1. Zo kan bijvoorbeeld een algoritme ontworpen worden dat het aantal keren een bepaald woord voorkomt in het document telt, maar tevens kan een nog complexer algoritme gebruikt worden dat aan de hand van de woorden een bepaalde interpretatie van de samenvatting in de vorm van een numerieke waarde weergeeft. For example, a more complex way to encode a document by means of binary expression vectors is the use of a more complex expression vector that produces numeric values ​​which may vary from 0 or 1. As can be designed an algorithm that the number of times a particular word prevents counts in the document, but also that on the basis of the words, a more complex algorithm could be used representing a particular interpretation of the summary in the form of a numerical value.

Tevens kunnen attributen die niet relevant zijn, worden verwijderd door te selecteren op karakteristieken. It also can attributes which are not relevant, can be removed by selecting for characteristics. Zo wordt een subset van de karakteristieken gezocht die relevant zijn voor het doelconcept. For example, searches for a subset of the characteristics that are relevant to the purpose concept. Dit zorgt er oa voor dat de dataset kleiner wordt, waardoor minder rekenkracht en zoekruimte vereist is bij de effectieve verwerking van het vector model. This ensures, among other things that the data set is smaller, thus requiring less computing power, and search space in the effective processing of the vector model. Het reduceert het aantal karakteristieken, het verwijdert irrelevante of redundante data en het zorgt er bijgevolg voor dat de algoritmes sneller werken. It reduces the number of characteristics, removing irrelevant or redundant data and therefore it ensures that the algorithms work faster. Het zorgt er om ook voor dat de voorspelde accuraatheid en begrijpbaarheid van de resultaten verbeterd wordt. It ensures there is also improved for the predicted accuracy and comprehensiveness of the results.

Na de preprocessing wordt de tekst automatisch in een structuur van vooraf ontworpen categorieën geplaatst, waardoor informatie kan verkregen worden over teksten met gelijkaardige inhoud. After preprocessing the text is automatically placed in a structure of pre-designed classes, so that information can be obtained about texts with similar content. Teksten die uit dezelfde categorie komen zullen de gebruiker sneller aanspreken en zijn dus mogelijk nuttig om samen aan te bieden. Texts that will appeal to users more quickly from the same category and are therefore potentially useful to offer together. Voor classificatie is een vooraf bekende structuur nodig, welke in dit geval op juridisch-fiscale documenten toegespitst is. For classification requires a previously known structure, which in this case legal and tax documents focused. Op basis van een leerverzameling kan een classifier getraind worden om onder bepaalde categorieën te classificeren. Based on a learning set a classifier can be trained to classify certain categories. Het is dus de bedoeling om deze classifiers zo te kiezen dat voor elke categorie een maximaal aantal samenvattingen juist geclassificeerd kan worden. It is intended to select those classifiers so it can be properly classified a maximum number of summaries for each category. Daartoe zal vooraf voor elke tak in de boomstructuur van een dataset een optimale classifier bepaald worden om zo tot een goed mogelijk en betrouwbaar resultaat te komen. For this purpose, in advance, for each branch in the tree structure of a data set to determine an optimal classifier in order to achieve a good as possible and reliable results. Tevens kan de classificatie gebeuren aan de hand van de geëxtraheerde metadata, of een combinatie van beide methoden. Also, the classification can be done on the basis of the extracted metadata, or a combination of both methods.

Deze uitvinding heeft als voordeel dat de methode kan aangewend worden voor het ordenen van documentlijsten van verschillende types zoekopdrachten. This invention has the advantage that the method can be used to organize document lists various types of searches. Enerzijds kan deze methode aangewend worden voor een categoriale zoekopdracht, waarbij de gebruiker door middel van een invoerapparaat instructies doorgeeft om binnen een vooraf bepaalde categorie te zoeken. Firstly a categorical search, this method can be used where the user passes through an input device instructions to find within a predetermined category. De gebruiker kan bijvoorbeeld zoeken op jaartal, datum of locatie, door zich aan de hand van het invoerapparaat naar deze categorieën te navigeren. The user can search for example, year, date, or location, by itself to navigate using the input device to these categories. Anderzijds kan deze methode ook aangewend worden voor een zoekopdracht waarbij de gebruiker als instructie door middel van een invoerapparaat zoekwoorden doorgeeft om de gehele of gedeeltelijke collectie juridisch-fiscale documenten te doorzoeken naar documenten enigszins verwant met de ingevoerde zoekwoorden. Alternatively, this method can also be used for a search where the user and instruction through an input device transmits keywords to the total or partial collection of searchable legal and tax documents for documents somewhat related to the keywords entered. Het spreekt voor zich dat de huidige uitvinding zich niet beperkt tot de bovengenoemde types zoekopdrachten. It goes without saying that the present invention is not limited to the above types of searches. Zo kunnen bijvoorbeeld beide bovengenoemde zoekopdrachten gecombineerd worden om binnen een categoriale zoekopdracht, een tweede zoekopdracht aan de hand van enkele zoekwoorden op te starten, of vice versa. For example, can be combined, for example, both of the above-mentioned search to initiate a second search on the basis of a number of keywords within a categorical search query, or vice versa.

De huidige uitvinding heeft als effect dat door het gebruik van het computersysteem door een leek zich, zonder tussenkomst van een advocaat of ander hoogopgeleid personeel, beter kan informeren betreffende juridisch-fiscale kwesties. The present invention has the effect that the use of the computer by a layman himself, without the intervention of a lawyer or other highly trained staff can better inform on legal and tax issues. Dit heeft als potentieel gevolg dat het aantal door de advocaat factureerbare uren gereduceerd kan worden, wat weerklinkt in een reductie in de kostprijs voor de klant en een potentieel grotere klantenportefeuille voor de advocaat. This has the potential effect that the number can be reduced billable hours by the lawyer, which resounds in a reduction in cost for the customer and a potentially larger customer portfolio for the lawyer.

In het bijzonder kan het computersysteem dienen als een bijkomstige bron van advies en informatie, temeer doordat er deze methode zich specifiek richt op een gebruiksvriendelijke en logische rankschikking van de juridisch-fiscale documenten. In particular, the computer system can serve as a secondary source of advice and information, especially because this method focuses specifically on a user-friendly and logical rank settlement of the legal and tax documents.

In een voorkeursdragende uitvoeringsvorm bestaat de voorgenoemde samenvatting uit ten minste één categorie, waarbij iedere categorie bestaat uit ten minste één criterium, waarbij aan ieder criterium een numerieke wegingsfactor, wordt toegeschreven. In a preferred embodiment, the aforementioned summary of at least one category, wherein each category is comprised of at least one criterion, wherein a numerical weighting factor, is attributed to each criterion. De waarde van de wegingsfactor geeft de actuele relevantie van het overeenkomstige criterium voor de samenvatting weer. The value of the weighting factor indicates the actual relevance of the corresponding criterion for the summary. Hoe groter de numerieke waarde van de wegingsfactor is, hoe meer actueel relevant het overeenkomstig criterium is. The higher the numerical value of the weighting factor, the more relevant it is current under test. Het criterium zelf wordt bepaald aan de hand van een karakteristieke vector, welke al dan niet een binaire term vector is. The criterion itself is determined on the basis of a characteristic vector, which is or is not a binary expression vector.

In een verdere uitvoeringsvorm wordt de waarde van de numerieke gewichtsparameter van de samenvatting bepaald door het uitvoeren van een wiskundige bewerking op de wegingsfactoren. In a further embodiment, the numerical value of the weighting parameter of the summary is determined by performing a mathematical operation on the weighting factors. Bij verdere voorkeur betreft deze bewerking een optelling. More preferably, this operation is an addition.

In een verdere uitvoeringsvorm worden de fiscaal-juridische documenten volgens afnemende waarde van de gewichtsparameter van de samenvatting in een lijst geordend. In a further embodiment, the tax and legal documents are in order of decreasing value of the weighting parameter of the summary arranged in a list. Dit heeft als effect dat het bovenste document in de lijst tevens het meest actueel relevante document is. This has the effect that the top document in the list is also the most current relevant document. Alle daaropvolgende documenten zijn zodoende tevens geordend volgens afnemende actuele relevantie. All subsequent documents are thus also arranged in order of decreasing current relevance.

In een voorkeurvorm is deze verzameling juridisch-fiscale documenten logisch gegroepeerd in een opslagfolder in een geheugeneenheid zodoende het onderhouden van de juridisch-fiscale documenten te vergemakkelijken. In a preferred form, this collection logically grouped legal and tax documents in a storage folder in a storage unit makes it easier to maintain the legal and tax documents.

In een verdere voorkeurvorm vormt deze geheugeneenheid een onderdeel van een computersysteem dat verbonden is met het internet. In a further preferred form, this memory unit forms a part of a computer system that is connected to the internet. Dit heeft als effect dat de computer-geïmplementeerde methode tevens vanop afstand te bereiken is door gebruikers, door bijvoorbeeld via een persoonlijke computer of smartphone een verbinding te maken met het computersysteem. This has the effect that to reach the computer-implemented method also remotely by users by, for example, via a personal computer, or smart phone to make a connection with the computer system.

Bij verdere voorkeur is dit computersysteem een server, welke als voordeel heeft dat deze ontworpen is om data te beheren, te verwerken, op te slaan en te verzenden, in een volcontinu systeem, waardoor de computer-geïmplementeerde methode potentieel 24 uren per dag beschikbaar is. More preferably this computer system is a server, which has the advantage that it is designed to process management data, store and send in a fully continuous system whereby the computer-implemented method potentially 24 hours per day available .

In een verdere voorkeurvorm wordt deze verzameling juridisch-fiscale documenten onderhouden wordt door een daartoe bevoegde onderneming. In a further preferred embodiment this collection of legal and tax documents is maintained by an authorized company. Dit heeft als effect dat de logische groepering van de juridisch-fiscale documenten kan worden uitgebreid, aangepast en/of onderhouden. This has the effect that the logical grouping can be extended to the legal and tax documents, adjusted and / or maintained.

In een uitvoeringsvorm bevatten de responsieve documenten informatievelden. In one embodiment, the responsive documents contain information fields. Dit heeft als effect dat de gebruiker de individuele documenten van elkaar kan onderscheiden vaan de hand van deze informatie, zodoende de zoekopdracht gebruiksvriendelijker te laten verlopen. This has the effect that the user's individual documents of each vane can distinguish the basis of this information, so as to conduct the search to use. Bij voorkeur omvatten deze informatievelden titels, het artikelnummer, het hof en de datum betreffende het document. Preferably this information fields include title, the item number, the court and the date on the document.

In een uitvoeringsvorm bevatten de responsieve documenten actievelden waarmee de gebruiker toegang krijgt tot de inhoud van het document. In one embodiment, the responsive documents contain action fields allow the user to access the contents of the document. Bij voorkeur is dit een actieveld dat een korte samenvatting oproept, en/of een actieveld dat de volledige inhoud van het document oproept. Preferably, this is an action field recall a brief summary, and / or a field of action that calls the entire contents of the document.

In een verdere uitvoeringsvorm is de korte samenvatting van een responsief document gekenmerkt door bij voorkeur een titel, een artikel, een hof, een datum, een boek, en één of meerdere tags. In a further embodiment, the summary of a responsive document comprising preferably a title, an article, a court, a date, a book, and one or more tags.

In een verdere uitvoeringsvorm verwijst de voorgenoemde tag naar een in de verzameling juridisch-fiscale documenten veelvoorkomend kernwoord. In a further embodiment refers to the aforementioned tag to the collection of legal and tax documents common keyword. In een voorkeursvorm vormt deze tag een actieveld welke een zoekopdracht initieert volgens het betreffende kernwoord. In a preferred form this tag is a field of action which initiates a search in accordance with the relevant key word.

In een tweede aspect betreft de uitvinding een computersysteem voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak volgens de conclusies 1-11, met het kenmerk, dat het computersysteem geconfigureerd is voor: (a) het ontvangen van juridisch-fiscale documenten via ten minste één communicatienetwerk; In a second aspect, the invention relates to a computer system for the sorting of a set of legal-tax documents from the case according to claims 1-11, characterized in that the computer system is configured to: (a) receiving a legal-tax documents via at least one communication network; (b) het opslaan van deze documenten in een lokale niet-transitoire computer-leesbare informatiedrager; (B) storing these documents in a local non-transitory computer-readable information carrier; (c) het van de gebruiker via ten minste één communicatienetwerk verkrijgen van één of meerdere kernwoorden onder de vorm van een zoekopdrachtinstructies; (C) obtaining from the user via at least one communication from one or more key words in the form of a search instruction; (d) het selecteren van een brongroep met fiscaal-juridische documenten; (D) selecting a resource group with tax-legal documents; (e) het identificeren van zoekinformatie vervat in de brongroep (f) het creëren van een geordende resultatenlijst gebaseerd op de instructies van de gebruiker uit stap (c) volgens stap (e); (E) identifying search information contained in the source group (f) creating an ordered list of results based on the instructions of the user from step (c) according to step (e); (g) het opslaan van de geordende resultatenlijst in een lokaal geheugen; (G) storing the ordered list of results in a local memory; (h) het ophalen van de geordende resultatenlijst opgeslagen in het lokaal geheugen. (H) retrieving the ordered results list stored in the local memory. (i) het verzenden via ten minste één communicatienetwerk van de geordende resultatenlijst naar het computersysteem van de gebruiker uit stap (c). (I) transmitting, via at least one communication network of the ordered list of results to the computer system of the user from step (c).

In een derde aspect betreft de uitvinding een tastbare niet-transitoire computer-leesbare informatiedrager omvattende een computerprogrammaproduct geschikt voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak volgens de conclusies 1-11, het computerprogrammaproduct omvattende instructies voor: (a) het ontvangen van juridisch-fiscale documenten via ten minste één communicatienetwerk; In a third aspect, the invention relates to a tangible non-transitory computer-readable information carrier comprising a computer program product suitable for the sorting of a set of legal-tax documents from the case according to the claims 1-11, the computer program product comprising instructions for: (a) the receiving legal and tax documents via at least one communication network; (b) het opslaan van deze documenten in een lokale niet-transistoire computer-leesbare informatiedrager; (B) storing these documents in a local non-transistoire computer-readable information carrier; (c) het van de gebruiker via ten minste één communicatienetwerk verkrijgen van instructies; (C) the number of the user in instructions via at least one communication network; (d) het selecteren van een brongroep met fiscaal-juridische documenten; (D) selecting a resource group with tax-legal documents; (e) het identificeren van informatie vervat in de brongroep; (E) identifying information contained in the source group; (f) het creëren van een geordende lijst gebaseerd op de instructies van de gebruiker uit stap (c) volgens stap (e); (F) creating an ordered list based on the instructions of the user from step (c) according to step (e); (g) het opslaan van de geordende lijst in een lokaal geheugen; (G) storing the ordered list in a local memory; (h) het ophalen van de geordende lijst opgeslagen in het lokaal geheugen. (H) retrieving the ordered list stored in the local memory. (i) het verzenden via ten minste één communicatienetwerk van de geordende lijst naar het computersysteem van de gebruiker uit stap (c). (I) transmitting, via at least one communication network of the ordered list to the computer system of the user from step (c).

In wat volgt, wordt de uitvinding beschreven adhv niet-limiterende voorbeelden die de uitvinding illustreren, en die niet bedoeld zijn of geïnterpreteerd mogen worden om de omvang van de uitvinding te limiteren. In the following, the invention is described adhv non-limiting examples which illustrate the invention, and which may be intended or not construed to limit the scope of the invention.

VOORBEELD EXAMPLE

De uitvinding zal nu verder worden toegelicht aan de hand van het volgende voorbeeld, zonder hiertoe overigens te worden beperkt. The invention will now be further elucidated with reference to the following example, without however being limited thereto.

Het hieropvolgend voorbeeld betreft een uitvoeringsvorm waarbij de samenvatting opgesteld wordt aan de hand van de categorieën, criteria en wegingsfactoren zoals weergegeven in Tabel 1. De criteria komen in dit geval overeen met de voorgenoemde karakteristieke vectoren, al dan niet binair. The subsequent example relates to an embodiment in which the summary is drawn up on the basis of the categories, criteria, and weighting factors as shown in Table 1. The criteria will in this case correspond to the aforementioned characteristic vectors, whether or not binary.

De samenvatting volgens tabel 1 bevat de vijf categorieën 'rechter', 'wet', 'tijd', 'inhoud' en 'specificiteit'. The summary of Table 1 includes the five categories of 'right', 'law', 'time', 'content' and 'specificity'. Iedere categorie bestaat uit verschillende subcategorieën, hier criteria genoemd. Each category includes several subcategories, here called criteria.

De categorie 'rechter' omvat verschillende criteria welke betrekking hebben op de rechter die de rechterlijke uitspraak in dat document voortbracht. The category 'court' includes various criteria relating to the court that produced the judgment in that document. Hierbij wordt de inhoud van het document nagegaan op de naam van de rechter, zijn reputatie, of de uitspraak veranderingen in de rechtspraak teweeg bracht, of de uitspraak een precedent omvatte, en of de uitspraak plaatsvond in een hoger rechtscollege zoals het Hof van Beroep of Hof van Cassatie. Here, the content of the document is checked in the name of the judge, his reputation, or judgment brought about changes in the law or the ruling involved a precedent and that the judgment took place in a higher court such as the Court of Appeal or Court of Cassation.

De categorie 'wet' omvat verschillende criteria welke betrekking hebben op de wetgeving in het document vermeld. The category of "law" includes various criteria relating to the legislation mentioned in the document. Hierbij wordt de inhoud van het document nagegaan of er veranderingen in de wetgeving vermeld staan, of een bepaalde wetgeving van toepassing was op het ogenblik van de uitspraak, en of een bepaalde wetgeving van toepassing was op het ogenblik van de feiten. Here, the content of the document verification that indicated changes in legislation, or specific legislation was applicable at the time of the ruling, and whether a particular law applicable at the time of the events.

De categorie 'tijd' omvat verschillende criteria welke betrekking hebben op data en tijdsduur. The category of 'time' includes various criteria relating to dates and duration. Hierbij wordt de inhoud van het document nagegaan op de datum van het pleidooien, de datum van de uitspraak, de datum van de feiten, de datum van betwisting, en de tijd tussen de feiten en uitspraak. Here, the content of the document is checked on the date of the oral arguments, the date of the judgment, the date of the facts, the date of dispute, and the time between the facts and judgment.

De categorie 'inhoud' omvat verschillende criteria welke betrekking hebben op de algemene inhoud. The category of "content" includes various criteria relating to the general content. Hierbij wordt de inhoud van het document nagegaan op de aanwezigheid van verwijzingen naar andere rechtsleer, verwijzingen naar andere rechtspraak, de inhoud van de uitspraak en de nieuwheid ervan, alsook het aantal bladzijden, het aantal tegenstrijdige uitspraken, het aantal uitspraken aangehaald uit het verleden, en het aantal uitspraken in dezelfde materie. Here, the content of the document is checked for the presence of references to other legal theory, references to other law, the contents of the judgment and the novelty of it, as well as the number of pages, number of contradictory statements, the number of statements quoted from the past, and the number of statements in the same matter.

De categorie 'specificiteit' omvat verschillende criteria welke betrekking hebben op de nieuwheid van de uitspraken. The category of "specificity" includes various criteria relating to the novelty of the statements. Hierbij wordt de inhoud van het document nagegaan op eventuele vernieuwende passages en precedenten. Here, the content of the document is checked for possible innovative passages and precedents. TABEL 1 TABLE 1

Claims (13)

  1. CONCLUSIES CONCLUSIONS
    1. Een computer-geïmplementeerde methode voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak, met het kenmerk, dat uit deze verzameling juridisch-fiscale documenten uit de rechtspraak een lijst van responsieve documenten wordt verkregen, waarbij het ordenen van de lijst een stap omvat waarbij aan elk juridisch-fiscaal document een gewichtsparameter wordt toegeschreven door het maken van een samenvatting welke getoetst wordt aan ten minste één criterium, waarbij deze criteria gecategoriseerd zijn en waarbij samenvattingen worden aangemaakt, waarbij deze eerst worden omgevormd tot een karakteristieke vector die vervolgens als input kan dienen voor een computer, welke samenvattingen als vectoren worden voorgesteld in een m-dimensionale ruimte, waarbij elk document d uit de documentencollectie wordt beschreven als een numerieke karakteristieke vector w(d) = (x(d, ti), ..., x(d, tm)) waarbij T = {ti, ..., tm} een woordenboek voorstelt. 1. A computer-implemented method for sorting a collection of legal and tax documents from the case, characterized, obtained from this set of legal and tax documents a list of responsive documents from the case in which the ordering of the list a step in which each legal and fiscal document weight parameter is attributed by making a summary which will be tested on at least one criterion, these criteria are categorized and where summaries are created, these are first transformed into a characteristic vector then as the input can be used for a computer, which abstracts as vectors are represented in an m-dimensional space, each document d is described in the document collection as a numeric characteristic vector w (d) = (x? (d, t),. .., x (d, tm)) where T = {ti, ..., t m} denotes a dictionary.
  2. 2. Een computer-geïmplementeerde methode volgens conclusie 1, met het kenmerk, dat iedere categorie uit ten minste één criterium bestaat, waarbij aan ieder criterium een wegingsfactor wordt toegeschreven. 2. A computer-implemented method according to claim 1, characterized in that each category is composed of at least one criterion, wherein a weighting factor is attributed to each criterion.
  3. 3. Een computer-geïmplementeerde methode volgens conclusie 2, met als kenmerk, dat de gewichtsparameter bepaald wordt door een wiskundige operatie uit te voeren op de wegingsfactoren. 3. A computer-implemented method according to claim 2, characterized in that the determined parameter is weight by carrying out a mathematical operation on the weighting factors.
  4. 4. Een computer-geïmplementeerde methode volgens conclusie 3, met als kenmerk, dat fiscaal-juridische documenten volgens afnemende waarde van de gewichtsparameter in de resultatenlijst worden geordend. 4. A computer-implemented method according to claim 3, characterized in that tax and legal documents are arranged according to decreasing value of the weighting parameter in the results list.
  5. 5. Een computer-geïmplementeerde methode volgens conclusie 1, met als kenmerk, dat deze verzameling juridisch-fiscale documenten logisch gegroepeerd zijn in een opslagfolder in een geheugeneenheid. 5. A computer-implemented method according to claim 1, characterized in that this collection of legal-tax documents are logically grouped in a storage folder in a memory unit.
  6. 6. Een computer-geïmplementeerde methode volgens conclusie 5, met als kenmerk, dat deze geheugeneenheid een onderdeel vormt van een computersysteem dat verbonden is met het internet. 6. A computer-implemented method according to claim 5, characterized in that said memory unit is a component of a computer system that is connected to the internet.
  7. 7. Een computer-geïmplementeerde methode volgens conclusie 1, met als kenmerk, dat deze verzameling juridisch-fiscale documenten onderhouden wordt door een bevoegde onderneming. 7. A computer-implemented method of claim 1, characterized in that the collection maintained legal and tax documents by an authorized company.
  8. 8. Een computer-geïmplementeerde methode volgens conclusie 1, met als kenmerk, dat de responsieve documenten informatievelden bevatten zoals bij voorkeur titel, artikel, hof en datum. 8. A computer-implemented method according to claim 1, characterized in that the responsive documents contain information fields such as title, preferably, article, court and date.
  9. 9. Een computer-geïmplementeerde methode volgens conclusie 8, met als kenmerk, dat de responsieve documenten actievelden bevatten zoals bij voorkeur een actieveld dat een korte samenvatting oproept, of een actieveld dat de volledige inhoud van het document oproept. 9. A computer-implemented method according to claim 8, characterized in that the responsive action documents contain fields such as, preferably a play field which evokes a brief summary, or an action field which evokes the entire contents of the document.
  10. 10. Een computer-geïmplementeerde methode volgens conclusie 9, met als kenmerk, dat de korte samenvatting van een responsief document gekenmerkt is door bij voorkeur een titel, een artikel, een hof, een datum, een boek, en één of meerdere tags. 10. A computer-implemented method according to claim 9, characterized in that characterized the brief summary of a document is responsive preferably by a title, an article, a court, a date, a book, and one or more tags.
  11. 11. Een computer-geïmplementeerde methode volgens conclusie 10, met als kenmerk, dat de voorgenoemde tag verwijst naar een kernwoord van het document. 11. A computer-implemented method according to claim 10, characterized in that the said tag refers to a key word of the document.
  12. 12. Een computersysteem voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak volgens de conclusies 1-11, met het kenmerk, dat het computersysteem geconfigureerd is voor: a. het ontvangen van juridisch-fiscale documenten via ten minste één communicatienetwerk; 12. A computer system for the sorting of a set of legal-tax documents from the case according to claims 1-11, characterized in that the computer system is configured for: receiving a legal-tax documents via at least one communication network;. b. b. het opslaan van deze documenten in een lokale niet-transitoire computer-leesbare informatiedrager; storing these documents in a local non-transitory computer-readable information carrier; c. c. het van de gebruiker via ten minste één communicatienetwerk verkrijgen van instructies; obtaining the user's instructions via at least one communication network; d. d. het selecteren van een brongroep met fiscaal-juridische documenten; selecting a resource group with tax-legal documents; e. e. het identificeren van informatie vervat in de brongroep; identifying information contained in the resource group; f. f. het creëren van een geordende lijst gebaseerd op de instructies van de gebruiker uit stap (c) volgens stap (e); creating an ordered list based on the instructions of the user from step (c) in step (e); g. g. het opslaan van de geordende lijst in een lokaal geheugen; the storage of the ordered list in a local memory; h. h. het ophalen van de geordende lijst opgeslagen in het lokaal geheugen. retrieving the ordered list stored in the local memory. i. i. het verzenden via ten minste één communicatienetwerk van de geordende lijst naar het computersysteem van de gebruiker uit stap (c). transmitting, via at least one communication network of the ordered list to the computer system of the user from step (c).
  13. 13. Een tastbare niet-transitoire computer-leesbare informatiedrager omvattende een computerprogrammaproduct geschikt voor het sorteren van een verzameling juridisch-fiscale documenten uit de rechtspraak volgens de conclusies 1-11, het computerprogrammaproduct omvattende instructies voor: a. het ontvangen van juridisch-fiscale documenten via ten minste één communicatienetwerk; 13. A tangible non-transitory computer-readable information carrier comprising a computer program product suitable for the sorting of a set of legal-tax documents from the case according to the claims 1-11, the computer program product comprising instructions for: a. Receiving legal-tax documents via at least one communication network; b. b. het opslaan van deze documenten in een lokale niet-transitoire computer-leesbare informatiedrager; storing these documents in a local non-transitory computer-readable information carrier; c. c. het van de gebruiker via ten minste één communicatienetwerk verkrijgen van instructies; obtaining the user's instructions via at least one communication network; d. d. het selecteren van een brongroep met fiscaal-juridische documenten; selecting a resource group with tax-legal documents; e. e. het identificeren van informatie vervat in de brongroep; identifying information contained in the resource group; f. f. het creëren van een geordende lijst gebaseerd op de instructies van de gebruiker uit stap (c) volgens stap (e); creating an ordered list based on the instructions of the user from step (c) in step (e); g. g. het opslaan van de geordende lijst in een lokaal geheugen; the storage of the ordered list in a local memory; h. h. het ophalen van de geordende lijst opgeslagen in het lokaal geheugen. retrieving the ordered list stored in the local memory. i. i. het verzenden via ten minste één communicatienetwerk van de geordende lijst naar het computersysteem van de gebruiker uit stap (c). transmitting, via at least one communication network of the ordered list to the computer system of the user from step (c).
BE2017/6017A 2017-12-28 2017-12-28 Administering and using legal and tax documents from the case BE1025360B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
BE2017/6017A BE1025360B1 (en) 2017-12-28 2017-12-28 Administering and using legal and tax documents from the case

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
BE2017/6017A BE1025360B1 (en) 2017-12-28 2017-12-28 Administering and using legal and tax documents from the case

Publications (1)

Publication Number Publication Date
BE1025360B1 true BE1025360B1 (en) 2019-01-30

Family

ID=61156911

Family Applications (1)

Application Number Title Priority Date Filing Date
BE2017/6017A BE1025360B1 (en) 2017-12-28 2017-12-28 Administering and using legal and tax documents from the case

Country Status (1)

Country Link
BE (1) BE1025360B1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004061619A2 (en) * 2002-12-30 2004-07-22 Thomson Corporation Knowledge-management systems for law firms
WO2007041688A1 (en) * 2005-10-04 2007-04-12 Thomson Global Resources Systems, methods, and software for identifying relevant legal documents
US7249026B1 (en) * 1993-03-24 2007-07-24 Engate Llc Attorney terminal having outline preparation capabilities for managing trial proceedings
US8032533B1 (en) * 2005-01-14 2011-10-04 Thomson Reuters Global Resources Systems, methods, and software for researching statutory information

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7249026B1 (en) * 1993-03-24 2007-07-24 Engate Llc Attorney terminal having outline preparation capabilities for managing trial proceedings
WO2004061619A2 (en) * 2002-12-30 2004-07-22 Thomson Corporation Knowledge-management systems for law firms
US8032533B1 (en) * 2005-01-14 2011-10-04 Thomson Reuters Global Resources Systems, methods, and software for researching statutory information
WO2007041688A1 (en) * 2005-10-04 2007-04-12 Thomson Global Resources Systems, methods, and software for identifying relevant legal documents

Similar Documents

Publication Publication Date Title
Hai et al. Implicit feature identification via co-occurrence association rule mining
US8266077B2 (en) Method of analyzing documents
Malouf et al. Taking sides: User classification for informal online political discourse
Scaffidi et al. Red Opal: product-feature scoring from reviews
US9535911B2 (en) Processing a content item with regard to an event
US7685091B2 (en) System and method for online information analysis
US7657546B2 (en) Knowledge management system, program product and method
US7403932B2 (en) Text differentiation methods, systems, and computer program products for content analysis
US9165254B2 (en) Method and system to predict the likelihood of topics
US7617199B2 (en) Characterizing context-sensitive search results as non-spam
US8108204B2 (en) Text categorization using external knowledge
US8781989B2 (en) Method and system to predict a data value
El-Beltagy et al. KP-Miner: A keyphrase extraction system for English and Arabic documents
US8756229B2 (en) System and methods for units-based numeric information retrieval
CN101061478B (en) Method and system for identifying web document
Segev et al. Context-based matching and ranking of web services for composition
US20070198249A1 (en) Imformation processor, customer need-analyzing method and program
US8583419B2 (en) Latent metonymical analysis and indexing (LMAI)
US20080065633A1 (en) Job Search Engine and Methods of Use
KR101672579B1 (en) Systems and methods regarding keyword extraction
WO2007113546A1 (en) Ranking of entities associated with stored content
KR20060045786A (en) Verifying relevance between keywords and web site contents
CN102054016A (en) Systems and methods for capturing and managing collective social intelligence information
US20080147642A1 (en) System for discovering data artifacts in an on-line data object
WO2008097856A2 (en) Search result delivery engine

Legal Events

Date Code Title Description
FG Patent granted

Effective date: 20190130