EP3207465A1

EP3207465A1 - Système et procédé pour une détection de langue

Info

Publication number: EP3207465A1
Application number: EP14790972.5A
Authority: EP
Inventors: Nikhil BOJJA; Pidong WANG; Fredrik LINDER; Bartlomiej Puzon
Original assignee: Machine Zone Inc
Current assignee: MZ IP Holdings LLC
Priority date: 2014-10-17
Filing date: 2014-10-17
Publication date: 2017-08-23
Also published as: JP6553180B2; CN107111607A; AU2014409115A1; WO2016060687A1; JP2017532684A; CA2964331A1; CN107111607B

Abstract

Selon des modes de réalisation, la présente invention concerne un procédé, un système et un dispositif de stockage de programme informatique pour détecter une langue dans un message texte. Une pluralité de différents essais de détection de langue sont effectués sur un message associé à un utilisateur. Chaque essai de détection de langue détermine un ensemble de scores représentant une probabilité que le message est dans l'une des langues d'une pluralité de différentes langues. Une ou plusieurs combinaisons des ensembles de scores sont fournies sous la forme d'une entrée dans un ou plusieurs classificateurs distincts. Une sortie provenant de chacun des classificateurs comprend une indication respective selon laquelle le message est dans l'une des différentes langues. La langue dans le message peut être identifiée comme étant la langue indiquée par l'un des classificateurs, sur la base d'un score de confiance et/ou d'un domaine linguistique identifié.