WO2002095614A1

WO2002095614A1 - Procede d'identification d'un systeme de code de type langage ou par caracteres

Info

Publication number: WO2002095614A1
Application number: PCT/JP2001/004350
Authority: WO
Inventors: Izumi Suzuki
Original assignee: Izumi Suzuki
Priority date: 2001-05-24
Filing date: 2001-05-24
Publication date: 2002-11-28
Also published as: JPWO2002095614A1

Abstract

L'invention porte sur un procédé d'identification mécanique d'un système de code de type langage ou par caractères d'un document textuel codé informatiquement. Dans la liste LBSL/C d'une chaîne d'octets d'une longueur spécifique, formée précédemment pour chaque système de code de type langage ou par caractères, sont stockées des chaînes d'un nombre spécifique d'octets se présentant éventuellement dans un document textuel d'un système de code de type langage ou par caractères considéré. Pour chaque chaîne de codes de type langage ou par caractères, on calcule une «fréquence d'occurrence de la chaîne d'octets apprise », c'est-à-dire la fréquence du nombre de chaînes d'octets d'une longueur spécifique existant déjà dans la liste LBSL/C et contenue dans un document textuel considéré, et ce n'est que lorsque le paramètre considéré se rapproche de 1 qu'on restitue en sortie comme résultat le nom du système de code de type langage ou par caractères.