WO2023187015A1 - Method and system for issuing multimedia quiz cards that provide learning contexts suitable for a learner of a foreign language - Google Patents

Method and system for issuing multimedia quiz cards that provide learning contexts suitable for a learner of a foreign language Download PDF

Info

Publication number
WO2023187015A1
WO2023187015A1 PCT/EP2023/058206 EP2023058206W WO2023187015A1 WO 2023187015 A1 WO2023187015 A1 WO 2023187015A1 EP 2023058206 W EP2023058206 W EP 2023058206W WO 2023187015 A1 WO2023187015 A1 WO 2023187015A1
Authority
WO
WIPO (PCT)
Prior art keywords
learner
quiz
context
multimedia content
learning
Prior art date
Application number
PCT/EP2023/058206
Other languages
French (fr)
Inventor
Christophe COEUR
Mathieu CONSTANT
Marine SCHMITT
Original Assignee
Cardemy
Centre National De La Recherche Scientifique
Universite De Lorraine
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cardemy, Centre National De La Recherche Scientifique, Universite De Lorraine filed Critical Cardemy
Publication of WO2023187015A1 publication Critical patent/WO2023187015A1/en

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/06Foreign languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Definitions

  • the present invention relates to a method for delivering multimedia quiz cards (flashcards) providing learning contexts adapted to a learner of a foreign language, whatever this language is among those currently used in the world. It also targets a system implementing this process.
  • US 2020/0143704 A1 discloses a system for enhancing video-based language learning.
  • the system includes a video server for storing videos that use one or more languages to be learned.
  • the system further includes a video metadata database for storing translations of sentences spoken in the videos, character profiles of characters appearing in the videos, and mappings between the sentences and a learner profile.
  • the system also includes a learner profile database for storing learner profiles.
  • the system further includes a semantic analyzer and a matching engine for finding, for at least a given video and a given learner, alternative sentences for and responding to translations of the sentences spoken in the given video that conflict with a profile learner.
  • the computer processing system further includes a presentation system for playing the given video and providing the alternative sentences to the learner.
  • Document KR102018295B1 discloses a method for accurately extracting and providing only a portion of the video data corresponding to a search word, thereby eliminating the inconvenience and time consumed by playing and verifying the entire video data.
  • a section keyword definition unit defining a representative keyword for each unit reading section which is a unit for dividing the section image constituting the video data using the keyword extracted by the keyword extraction unit.
  • a section image providing unit is configured to provide the user terminal with at least one section image having a representative keyword corresponding to the keyword search request when the keyword search request for the video is received from the user terminal.
  • flashcards are cards virtual quizzes with a question on the front and an answer on the back
  • the pre-filtering step(s) may be performed on text transcriptions of videos hosted on the multimedia content hosting website.
  • the pre-filtering step may also include filtering according to one or more chosen target words.
  • Filtering according to one or more target words can advantageously include a morphosyntactic analysis step allowing lexical ambiguity to be removed.
  • the identification step can be based on several criteria linked to the learner's activity on the learning system.
  • the identification step may include a classification of a textual transcription of a video based on characteristics of this textual transcription, and its tempo, with a view to determining a level of difficulty for the corresponding context.
  • the identification step may also include a selection of the best context for the learner taking into account their history in an application implementing this process (for example, words already mastered).
  • the step of selecting the best context contains a target word to learn which will be the focus of the flashcard created and sent to the learner via the spaced repetition algorithm.
  • An innovative aspect of the system is that its neural learning is based on the data generated by its spaced repetition system, which is very rich in information and allows the learner's level to be better assessed and the neural system to learn more quickly. .
  • the input step in a neural network implementing neural learning with a target word may concern a transcription of a context (sentence) and “features” (for “characteristics”) derived from the sentence or profile of the learner such as readability [28] and information about the learner (for example, words already learned or mastered).
  • the step of selecting the best context may further include a step for encoding the context as a sequence of word vectors.
  • word vectors are generated by existing libraries such as Glove [26] or fastText [27] then passed into sentence-level encoding using a recurrent network such as LSTM [20] or GRU [25]. ) or a “transformer model” of the BERT type [24] or any other network allowing the information of each word to be aggregated into a set representing the sentence.
  • the retrieval method according to the invention may further comprise a step for entering a response from the learner on his perception of the level of difficulty of the video he has just viewed, or an MCQ (Multiple Choice Questionnaire) or a written or oral production exercise.
  • MCQ Multiple Choice Questionnaire
  • the response data entered by the learner by implementing the spaced repetition algorithm can be used to continuously improve the neural network implemented in the selection of the best context via a continuous learning step.
  • the pre-filtering means can be arranged to process textual transcriptions of videos hosted on the multimedia content hosting website.
  • the identification means may include means for classifying a textual transcription of a video based on characteristics of this textual transcription, with a view to determining a level of difficulty for the corresponding context.
  • the identification means may further comprise means for selecting a better context for the learner taking into account its history (for example, known words) in an application implementing this method.
  • the means for selecting the best context can cooperate with a spaced repetition system provided to determine a next optimal timing for reviewing one or more learning quiz cards.
  • Selection of the best context can be determined by the output score of the neural network, which learned based on quiz answers from this learner and others.
  • the recommendation score determines the relevance of content for each learner. The higher the score, the more effectively the content allows the student to learn about the learning system.
  • the means for selecting the best context may include a neural network designed to recommend content.
  • the retrieval system may further comprise means for capturing a response from the learner on his perception of the level of difficulty of the multimedia content he has just viewed, and means for assigning a reward to the neural network or a penalty depending on the response thus entered, as well as means for exploiting the responses entered by the learner by the spaced repetition system, so as to continuously improve the neural network implemented in the selection of the best context .
  • the types of quizzes on the recommended content can cover various skills (oral comprehension by asking the learner to listen to and recognize the audio track, find the definition of the target word, etc.), depending on the educational method used in the learning app.
  • these quizzes are generated automatically however it is also possible to imagine them being created by humans in a more traditional way. Although this has the advantage of ensuring the quality of the quiz and the content, it has the disadvantage of taking a lot of time and being forced to use a smaller scope of authentic content.
  • the inference system can be deployed as a microservice with its own API.
  • the system can be installed on servers with CPU or GPU using for example a standard open source machine learning framework such as PyTorch [23].
  • the training of the system can be carried out on real data from the behavior of learners.
  • the training can be carried out once or continuously in order to take into account the evolution of the performance profile of the learner which evolves over time.
  • Communication equipment smartphone, tablet, personal computer and more generally any equipment connected to one or more communication networks
  • Flashcard or quiz card micro-content compatible with learning on smartphone, tablet or personal computer, by spaced repetitions
  • GRU Gated Recurrent Unit, a gating mechanism in recurrent neural networks [25], introduced in 2014 by Kyunghyun Cho et al.[29].
  • Indexer digital tool for searching multimedia content containing a target word or expression
  • LSTM for “Long Short-Term Memory”, artificial recurrent neural network architecture used in the field of deep learning
  • Spaced repetition a neuroscience-based memorization technique that involves re-showing the item (e.g., a quiz) to be memorized just before the learner forgets
  • This system 10 can be produced in the form of computer equipment in which a computer program implementing the method is executed.
  • This IT equipment can be installed on a local operating site or at a remote site in a digital “cloud”.
  • a search 12 is carried out continuously on a multimedia channel or a multimedia content hosting site 11, on the basis of predetermined target words or key words stored in a dictionary . It should be noted that this research 12 can implement a multimedia channel API.
  • the multimedia content subject to the search can be provided as already indexed by the channel operator 11 or indexed 3 after having been selected at the end of the search 12.
  • NLP Natural Language Processing
  • This pre-filtering 6 can be carried out on textual transcriptions of video content 4. It can be carried out according to one or more chosen target words, with a morphosyntactic analysis allowing lexical ambiguity to be removed.
  • the multimedia contents thus pre-filtered also referred to as micro-multimedia contents, are then processed (13) to create Flashcards, each FlashCard 7 resulting as a digital object from an association of multimedia content and a quiz - question-answer - in relation to the target word associated with this multimedia content.
  • the quiz can be carried out in the form of a set of questions relating to the content of the video segments in relation to the target word or target expression.
  • This quiz can be in audio and/or script format on the multimedia content of the flashcard.
  • Quizzes can be generated either manually by teachers or administrators or automatically by asking the learner for a translation exercise, for example.
  • this learner When a learner S opens for the first time a language learning application implementing the flashcard delivery method according to the invention, this learner will provide his choice of a language and the context in which he wishes to learn this language: for example professional or personal, as well as information related to one's personal profile (for example, which words have already been memorized).
  • the application will then issue a series of FlashCards or multimedia quiz cards which will be displayed on the caller's electronic or communication equipment after having been selected by an identification system 5.
  • This identification system implements an artificial intelligence (AI) module 8 which will control the selection of a FlashCard to be offered to the learner S.
  • AI artificial intelligence
  • the answers 15 of the learner S to the questions contained in the FlashCard quizzes, as well as its feedback and assessment on the relevance of these Flashcards are processed by a spaced repetition algorithm 14 which will produce learning information (machine learning) to the IA module 8.
  • This spaced repetition algorithm 4 is furthermore intended to determine a next optimal timing for reviewing one or more learning quiz cards.
  • a language learning system 1 can be deployed from the FlashCard delivery system 10 according to the invention.
  • This learning system comprises a plurality C1,C2,...Ck of personal communication equipment or electronic equipment such as smartphones, tablets or personal computers used by a plurality of learners S1,S2,...,Sk who have downloaded and use an application implementing the invention.
  • the equipment C1, C2,...Ck are connected via a communication network 30 to the video channel 11, to a server 34 and a database 32 managing the application, and to a cloud 33 to which the delivery system 10 is connected or provision of multimedia FlashCard.
  • This identification method 80 implements a neural network 81 dedicated to neural learning 83.
  • This neural network 81 processes the target word used for the search and selection of a group of FlashCards, a set of contexts i corresponding to these FlashCards, a profile and history of the learner S and sentence-derived features such as readability score.
  • readability in NLP (Natural Language Processing), one of the measures of the complexity of a sentence [28].
  • the identification 80 can be based on several criteria linked to the activity of the learner S on the language learning system 1 and include a classification of a textual transcription of video content on the basis of characteristics of this textual transcription, in order to determine a level of difficulty for the corresponding context.
  • selection 82 of the best context may also include an encoding of the context as a sequence of word vectors.
  • a neural learning system 8' which can be implemented in the quiz card supply system according to the invention, comprises a system 41 for encoding a sentence receiving a set 40 of inputs from the supply system.
  • These entries 40 may include a target word and a sentence in the form of strings, characteristics derived from the sentence such as a readability score or a tempo, words known as the form of lists of character strings; learner information, and a measured recommendation score.
  • the sentence encoding system 41 may implement encoding models and methods such as Glove + LSTM, Glove + GRU, FastText + GRU or BERT or other network that aggregates the information of each word into a set.
  • This normalized vector 42 is applied as input to a “Feed Forward” type neural network 43 [32], which delivers a predicted recommendation score.
  • the neural network 43 is subjected to “backpropagation” training 45 in which each learning iteration evaluates the difference between the predicted score and the measured score via a standard error measure, such as for example MSE (Mean Square Error) or MAE (Mean Absolute Error).
  • MSE Mel Square Error
  • MAE Mel Absolute Error
  • the Flashcards 7 subjected to identification by neural learning can be stored in multiple ways, for example in the remote database 32 or in any other storage space accessible from the Cloud 33.
  • Flashcards are downloaded and stored locally in communications equipment used by a learner.
  • Each personal communication equipment C1,C2,...Ck received a software application comprising a graphical user interface (“front end”) and dedicated to the learning process according to the invention, by downloading from one or more application operators.
  • front end a graphical user interface
  • Each learner S1,S2,...Sk can consult the application server 34 to receive on their communication equipment 43 recommendations for multimedia quizzes (flashcards) corresponding to their profile, in a sequential manner and which will return to be revised every day via the spaced repetition system.
  • multimedia quizzes flashcards
  • the present invention is not limited to the examples which have just been described and numerous other embodiments can be envisaged without departing from the scope of the invention.
  • the neural methods implemented for the identification of Flashcards are not limited to neural learning but can integrate many other artificial intelligence tools capable of delivering Flashcards presenting an optimal context progressively. of a learner's learning of a language.
  • the method which is the subject of the present invention is suitable for learning any language used in the world, as long as a library allowing the creation of word vectors in this language is available.

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

The invention relates to a method for issuing, from multimedia content available on a multimedia content host website (11), multimedia quiz cards (flashcards) (7) that provide learning contexts suitable for a learner of a foreign language according to a plurality of criteria, this method comprising the following steps: - searching (12) indexed multimedia content available on said host site (11), according to a plurality of predetermined target words, - pre-filtering (6), from among the indexed multimedia content (4) resulting from the search step (12), indexed multimedia content corresponding to a plurality of learning contexts, - producing (13), from each of said indexed and pre-filtered multimedia content items, quiz cards (flashcards) (7), each of which incorporates a quiz relating to one or more target words associated with the respective multimedia content, said quiz cards produced in this way being provided to be visualised on an electronic device used by the learner (S), - identifying (5), using a neural learning method, and from among the quiz cards produced in this way (7), one or more quiz cards suitable for allowing the learner (S) to advance on the basis of their profile.

Description

Procédé et système pour délivrer des cartes quiz multimédia procurant des contextes d’apprentissage adaptés à un apprenant d’une langue étrangère Method and system for delivering multimedia quiz cards providing learning contexts adapted to a learner of a foreign language DOMAINE DE L’INVENTIONFIELD OF INVENTION
La présente invention concerne un procédé pour délivrer des cartes quiz multimédia (flashcards) procurant des contextes d’apprentissage adaptés à un apprenant d’une langue étrangère, quelle que soit cette langue parmi celles actuellement pratiquées dans le monde. Elle vise également un système mettant en œuvre ce procédé.The present invention relates to a method for delivering multimedia quiz cards (flashcards) providing learning contexts adapted to a learner of a foreign language, whatever this language is among those currently used in the world. It also targets a system implementing this process.
ETAT DE LA TECHNIQUESTATE OF THE ART
Il existe actuellement une forte demande pour l’apprentissage de langues étrangères sur des supports numériques tels que des smartphones, tablettes ou ordinateurs. Pour cet apprentissage, il existe déjà des applications utilisant des contenus disponibles sur des sites web dédiés.There is currently a strong demand for learning foreign languages on digital media such as smartphones, tablets or computers. For this learning, there are already applications using content available on dedicated websites.
Le document US 2020/0143704 A1 divulgue un système pour améliorer l'apprentissage des langues basé sur la vidéo. Le système comprend un serveur vidéo pour stocker des vidéos qui utilisent une ou plusieurs langues à apprendre. Le système comprend en outre une base de données de métadonnées vidéo pour stocker des traductions de phrases prononcées dans les vidéos, des profils de caractères de caractères apparaissant dans les vidéos, et des mappages entre les phrases et un profil d'apprenant. Le système comprend également une base de données de profils d'apprenants pour stocker les profils d'apprenants. Le système comprend en outre un analyseur sémantique et un moteur d'appariement pour trouver, pour au moins une vidéo donnée et un apprenant donné, des phrases alternatives pour et répondant aux traductions des phrases prononcées dans la vidéo donnée qui sont en conflit avec un profil d'apprenant. Le système de traitement informatique comprend en outre un système de présentation pour lire la vidéo donnée et fournir les phrases alternatives à l'apprenant. US 2020/0143704 A1 discloses a system for enhancing video-based language learning. The system includes a video server for storing videos that use one or more languages to be learned. The system further includes a video metadata database for storing translations of sentences spoken in the videos, character profiles of characters appearing in the videos, and mappings between the sentences and a learner profile. The system also includes a learner profile database for storing learner profiles. The system further includes a semantic analyzer and a matching engine for finding, for at least a given video and a given learner, alternative sentences for and responding to translations of the sentences spoken in the given video that conflict with a profile learner. The computer processing system further includes a presentation system for playing the given video and providing the alternative sentences to the learner.
Le document KR102018295B1 divulgue un procédé pour extraire avec précision et de ne fournir qu'une partie des données vidéo correspondant à un mot de recherche, éliminant ainsi les inconvénients et le temps consommés par la lecture et la vérification de l'ensemble des données vidéo. Il y est proposé une unité de définition de mot-clé de section définissant un mot-clé représentatif pour chaque section de lecture d'unité qui est une unité de division de l'image de section constituant les données vidéo en utilisant le mot-clé extrait par l'unité d'extraction de mot-clé. Une unité de fourniture d'image de section est configurée pour fournir au terminal utilisateur au moins une image de section ayant un mot-clé représentatif correspondant à la demande de recherche par mot-clé lorsque la demande de recherche par mot-clé pour la vidéo est reçue du terminal utilisateur.Document KR102018295B1 discloses a method for accurately extracting and providing only a portion of the video data corresponding to a search word, thereby eliminating the inconvenience and time consumed by playing and verifying the entire video data. There is provided a section keyword definition unit defining a representative keyword for each unit reading section which is a unit for dividing the section image constituting the video data using the keyword extracted by the keyword extraction unit. A section image providing unit is configured to provide the user terminal with at least one section image having a representative keyword corresponding to the keyword search request when the keyword search request for the video is received from the user terminal.
Ces procédés de l’art antérieur ne fournissent pas d’enseignement sur une récupération plus efficace et automatisée de médias audiovisuels sur un site ou une base de données tierce, qui permettrait de délivrer des flashcards de manière automatique et personnalisée (les flashcards sont des cartes virtuelles de quiz avec au recto une question et au verso une réponse) sélectionnées de manière optimales pour faire progresser chaque apprenant.These methods of the prior art do not provide teaching on a more efficient and automated retrieval of audiovisual media on a site or a third-party database, which would make it possible to deliver flashcards in an automatic and personalized manner (flashcards are cards virtual quizzes with a question on the front and an answer on the back) optimally selected to help each learner progress.
Cet objectif est atteint avec un procédé mis en œuvre par ordinateur pour délivrer, à partir de contenus multimédia disponibles sur un site web d’hébergement de contenus multimédia, des cartes quiz procurant des contextes multimédia d’apprentissage adaptés à un apprenant d’une langue étrangère selon une pluralité de critères, ce procédé comprenant les étapes suivantes:
  • recherche de contenus multimédia indexés disponibles sur ledit site d’hébergement, selon une pluralité de mots cible prédéterminés,
  • préfiltrage, parmi les contenus multimédia indexés issus de l’étape de recherche, de contenus multimédia indexés correspondant à une pluralité de contextes d’apprentissage,
This objective is achieved with a computer-implemented method for delivering, from multimedia content available on a multimedia content hosting website, quiz cards providing multimedia learning contexts adapted to a language learner. foreign according to a plurality of criteria, this method comprising the following steps:
  • search for indexed multimedia content available on said hosting site, according to a plurality of predetermined target words,
  • pre-filtering, among the indexed multimedia contents resulting from the search step, of indexed multimedia contents corresponding to a plurality of learning contexts,
caractérisé en ce qu’il comprend en outre les étapes de :
  • production, à partir chacun desdits contenus multimédia indexés et préfiltrés, de cartes quiz intégrant chacune un quiz en relation avec un ou plusieurs mots cible associés au contenu multimédia respectif, ledit quiz étant généré automatiquement comme une demande d’exercice de traduction dudit un ou plusieurs mots cibles, lesdites cartes quiz ainsi produites étant prévues pour être visualisables sur un équipement électronique utilisé par l’apprenant,
  • identification, parmi lesdites cartes quiz ainsi produites, d’une ou plusieurs cartes quiz adaptées pour faire progresser un apprenant de manière optimale en fonction de son profil, comprenant une sélection d’un meilleur contexte pour l’apprenant, cette étape de sélection comprenant  les étapes suivantes :
  • entrer, dans un réseau de neurones implémentant un apprentissage neuronal, un mot cible, une transcription d’un contexte et des caractéristiques dérivées d’une phrase ou d’un profil de l’apprenant,
  • délivrer en sortie du réseau de neurones un score du contexte de recommandation à l’apprenant,
  • répéter les deux étapes précédentes pour tous les contextes préfiltrés.
  • conserver le contexte présentant le score le plus élevé.
characterized in that it further comprises the steps of:
  • production, from each of said indexed and pre-filtered multimedia contents, of quiz cards each integrating a quiz in relation to one or more target words associated with the respective multimedia content, said quiz being automatically generated as a request for a translation exercise of said one or more target words, said quiz cards thus produced being intended to be viewable on electronic equipment used by the learner,
  • identification, among said quiz cards thus produced, of one or more quiz cards adapted to advance a learner in an optimal manner according to his profile, comprising a selection of a better context for the learner, this selection step comprising the following steps :
  • enter, into a neural network implementing neural learning, a target word, a transcription of a context and characteristics derived from a sentence or a profile of the learner,
  • deliver a score of the recommendation context to the learner at the output of the neural network,
  • repeat the previous two steps for all pre-filtered contexts.
  • keep the context with the highest score.
La ou les étapes de préfiltrage peuvent être effectuées sur des transcriptions textuelles de vidéos hébergées sur le site web d’hébergement de contenus multimédia.The pre-filtering step(s) may be performed on text transcriptions of videos hosted on the multimedia content hosting website.
L’étape de préfiltrage peut en outre comprendre un filtrage selon un ou plusieurs mots-cible choisis.The pre-filtering step may also include filtering according to one or more chosen target words.
Le filtrage selon un ou plusieurs mots-cible peut avantageusement comprendre une étape d’analyse morphosyntaxique permettant une levée d’ambiguïté lexicale.Filtering according to one or more target words can advantageously include a morphosyntactic analysis step allowing lexical ambiguity to be removed.
L’étape d’identification peut être basée sur plusieurs critères liés à l’activité de l’apprenant sur le système d’apprentissage.The identification step can be based on several criteria linked to the learner's activity on the learning system.
L’étape d’identification peut comprendre une classification d’une transcription textuelle d’une vidéo sur la base de caractéristiques de cette transcription textuelle, et de son tempo, en vue de déterminer un niveau de difficulté pour le contexte correspondant.The identification step may include a classification of a textual transcription of a video based on characteristics of this textual transcription, and its tempo, with a view to determining a level of difficulty for the corresponding context.
L’étape d’identification peut en outre comprendre une sélection du meilleur contexte pour l’apprenant en tenant compte de son historique dans une application implémentant ce procédé (par exemple, mots déjà maitrisés).The identification step may also include a selection of the best context for the learner taking into account their history in an application implementing this process (for example, words already mastered).
L’étape de sélection du meilleur contexte contient un mot cible à apprendre qui sera le focus de la flashcard crée et envoyée à l’apprenant via l’algorithme de répétitions espacées.The step of selecting the best context contains a target word to learn which will be the focus of the flashcard created and sent to the learner via the spaced repetition algorithm.
Un aspect innovant du système est que son apprentissage neuronal se base sur les données générées produites par son système de répétition espacées, qui sont très riches en information et permettent de mieux évaluer le niveau de l’apprenant et au système neuronal d’apprendre plus rapidement. An innovative aspect of the system is that its neural learning is based on the data generated by its spaced repetition system, which is very rich in information and allows the learner's level to be better assessed and the neural system to learn more quickly. .
L’étape d’entrée dans un réseau de neurones implémentant un apprentissage neuronal avec un mot cible, peut concerner une transcription d’un contexte (phrase) et des « features » (pour « caractéristiques ») dérivées de la phrase ou du profil de l’apprenant telles que la lisibilité [28] et des informations sur l’apprenant (par exemple, les mots déjà appris ou maitrisés).The input step in a neural network implementing neural learning with a target word, may concern a transcription of a context (sentence) and “features” (for “characteristics”) derived from the sentence or profile of the learner such as readability [28] and information about the learner (for example, words already learned or mastered).
L’étape de sélection du meilleur contexte peut en outre comprendre une étape pour encoder le contexte comme une séquence de vecteurs-mots. Ces vecteurs-mots sont générés par des librairies existantes tels que Glove [26] ou fastText [27] puis passés dans un encodage au niveau de la phrase par le moyen d’un réseau récurrent de type LSTM [20] ou GRU [25]) ou un « transformer model » (pour « modèle de transformation ») de type BERT [24] ou tout autre réseau permettant d’agréger les informations de chaque mot dans un ensemble représentant la phrase. The step of selecting the best context may further include a step for encoding the context as a sequence of word vectors. These word vectors are generated by existing libraries such as Glove [26] or fastText [27] then passed into sentence-level encoding using a recurrent network such as LSTM [20] or GRU [25]. ) or a “transformer model” of the BERT type [24] or any other network allowing the information of each word to be aggregated into a set representing the sentence.
Le procédé de récupération selon l’invention peut en outre comprendre une étape pour saisir une réponse de l’apprenant sur sa perception du niveau de difficulté de la vidéo qu’il vient de consulter, ou bien un QCM (Questionnaire à Choix Multiple) ou bien un exercice production écrite ou orale.The retrieval method according to the invention may further comprise a step for entering a response from the learner on his perception of the level of difficulty of the video he has just viewed, or an MCQ (Multiple Choice Questionnaire) or a written or oral production exercise.
Les données des réponses saisies par l’apprenant par mise en œuvre de l’algorithme de répétitions espacées peuvent être exploitées pour améliorer en continu le réseau de neurones mis en œuvre dans la sélection du meilleur contexte via une étape d’apprentissage continue.The response data entered by the learner by implementing the spaced repetition algorithm can be used to continuously improve the neural network implemented in the selection of the best context via a continuous learning step.
Suivant un autre aspect de l’invention, il est proposé un système pour délivrer, à partir de contenus multimédia disponibles sur un site web d’hébergement de contenus multimédia, des cartes quiz multimédia procurant des contextes d’apprentissage adaptés à un apprenant d’une langue étrangère selon une pluralité de critères, mettant en œuvre le procédé selon l’une quelconque des revendications précédentes, ce système comprenant:
  • des moyens pour rechercher des contenus multimédia indexés disponibles sur ledit site d’hébergement, selon une pluralité de mots cible prédéterminés,
  • des moyens pour pr´efiltrer, parmi les contenus multimédia indexés issus de l’étape de recherche, des contenus multimédia indexés correspondant à une pluralité de contextes d’apprentissage,
According to another aspect of the invention, a system is proposed for delivering, from multimedia content available on a multimedia content hosting website, multimedia quiz cards providing learning contexts adapted to a learner of a foreign language according to a plurality of criteria, implementing the method according to any one of the preceding claims, this system comprising:
  • means for searching for indexed multimedia content available on said hosting site, according to a plurality of predetermined target words,
  • means for pre-filtering, among the indexed multimedia contents resulting from the search step, indexed multimedia contents corresponding to a plurality of learning contexts,
caractérisé en ce qu’il comprend en outre :
  • des moyens pour produire, à partir de chacun desdits contenus multimédia indexés et préfiltrés, des cartes quiz intégrant chacune un quiz en relation avec un ou plusieurs mots cible associés au contenu multimédia respectif, ledit quiz étant généré automatiquement comme une demande d’exercice de traduction dudit un ou plusieurs mots cibles, lesdites cartes quiz ainsi produites étant prévues pour être visualisables sur un équipement électronique utilisé par l’apprenant,
  • des moyens pour identifier par une méthode neuronale d’apprentissage, parmi lesdites cartes quiz ainsi produites, une ou plusieurs cartes quiz adaptées pour faire progresser l’apprenant en fonction de son profil, lesdits moyens d’identification étant agencés pour sélectionner un meilleur contexte pour l’apprenant.
characterized in that it further comprises:
  • means for producing, from each of said indexed and pre-filtered multimedia contents, quiz cards each integrating a quiz in relation to one or more target words associated with the respective multimedia content, said quiz being automatically generated as a request for a translation exercise of said one or more target words, said quiz cards thus produced being intended to be viewable on electronic equipment used by the learner,
  • means for identifying by a neural learning method, among said quiz cards thus produced, one or more quiz cards adapted to advance the learner according to his profile, said means of identification being arranged to select a better context for the learner.
Les moyens de préfiltrage peuvent être agencés pour traiter des transcriptions textuelles de vidéos hébergées sur le site web d’hébergement de contenus multimédia.The pre-filtering means can be arranged to process textual transcriptions of videos hosted on the multimedia content hosting website.
Les moyens d’identification peuvent comprendre des moyens pour classifier une transcription textuelle d’une vidéo sur la base de caractéristiques de cette transcription textuelle, en vue de déterminer un niveau de difficulté pour le contexte correspondant.The identification means may include means for classifying a textual transcription of a video based on characteristics of this textual transcription, with a view to determining a level of difficulty for the corresponding context.
Les moyens d’identification peuvent en outre comprendre en outre des moyens pour sélectionner un meilleur contexte pour l’apprenant en tenant compte de son historique (par exemple, des mots connus) dans une application implémentant ce procédé.The identification means may further comprise means for selecting a better context for the learner taking into account its history (for example, known words) in an application implementing this method.
Les moyens de sélection du meilleur contexte peuvent coopérer avec un système de répétitions espacées prévu pour déterminer un prochain timing optimal de révision d’une ou plusieurs cartes quiz d’apprentissage.The means for selecting the best context can cooperate with a spaced repetition system provided to determine a next optimal timing for reviewing one or more learning quiz cards.
La sélection du meilleur contexte peut être déterminée par le score de sortie du réseau de neurones, qui a appris en fonction des réponses des quiz de cet apprenant et d’autres. Selection of the best context can be determined by the output score of the neural network, which learned based on quiz answers from this learner and others.
Le score de recommandation détermine la pertinence des contenus pour chaque apprenant. Plus le score est élevé, plus le contenu permet à l’élève d’apprendre efficacement sur le système d’apprentissage. Ce score peut être défini de manière arbitraire afin de représenter la performance de l’élève sur le système d’apprentissage, en fonction de ses caractéristiques propres. Par exemple ce score pourrait être maximal (=1) quand le contenu sélectionné permet à l’apprenant de faire le moins d’erreurs possible sur l’application d’apprentissage, ce qui revient le plus souvent à minimiser ou maximiser une des valeurs de l’algorithme de répétitions espacées sur une durée arbitraire (par exemple minimiser le « factor » & les « lapses » pour l’algorithme SM-2 [22]).The recommendation score determines the relevance of content for each learner. The higher the score, the more effectively the content allows the student to learn about the learning system. This score can be defined arbitrarily in order to represent the student's performance on the learning system, based on their own characteristics. For example, this score could be maximum (=1) when the selected content allows the learner to make as few errors as possible on the learning application, which most often amounts to minimizing or maximizing one of the values of the repetition algorithm spaced over an arbitrary duration (e.g. minimizing the “factor” & “lapses” for the SM-2 algorithm [22]).
Les moyens de sélection du meilleur contexte peuvent comprendre un réseau de neurones prévu pour recommander des contenus.The means for selecting the best context may include a neural network designed to recommend content.
Les moyens de sélection du meilleur contexte peuvent être configurés pour:
  • entrer dans un réseau de neurones implémentant un apprentissage neuronal, avec un mot, une transcription d’un contexte et des « features » (ou caractéristiques) dérivées de ce contexte (tel qu’un score de lisibilité [28]) et des informations sur l’apprenant,
  • délivrer en sortie du réseau de neurones un score du contexte de recommandation à l’apprenant,
  • répéter les deux étapes précédentes pour tous les contextes préfiltrés,
  • conserver le contexte présentant le score le plus élevé.
The means of selecting the best context can be configured to:
  • enter a neural network implementing neural learning, with a word, a transcription of a context and “features” (or characteristics) derived from this context (such as a readability score [28]) and information on the learner,
  • deliver a score of the recommendation context to the learner at the output of the neural network,
  • repeat the previous two steps for all pre-filtered contexts,
  • keep the context with the highest score.
Le système de récupération selon l’invention peut en outre comprendre des moyens pour saisir une réponse de l’apprenant sur sa perception du niveau de difficulté du contenu multimédia qu’il vient de consulter, et des moyens pour attribuer au réseau de neurones une récompense ou une pénalité en fonction de la réponse ainsi saisie, ainsi que des moyens pour exploiter les réponses saisies par l’apprenant par le système de répétitions espacées, de façon à améliorer en continu le réseau de neurones mis en œuvre dans la sélection du meilleur contexte.The retrieval system according to the invention may further comprise means for capturing a response from the learner on his perception of the level of difficulty of the multimedia content he has just viewed, and means for assigning a reward to the neural network or a penalty depending on the response thus entered, as well as means for exploiting the responses entered by the learner by the spaced repetition system, so as to continuously improve the neural network implemented in the selection of the best context .
Les typologies de quiz sur les contenus recommandés peuvent couvrir diverses compétences (compréhension orale en demandant à l’apprenant d’écouter et reconnaitre la piste sonore, trouver la définition du mot cible etc…), en fonction de la méthode éducative utilisée dans l’application d’apprentissage. The types of quizzes on the recommended content can cover various skills (oral comprehension by asking the learner to listen to and recognize the audio track, find the definition of the target word, etc.), depending on the educational method used in the learning app.
Dans le cadre de notre système, ces quiz sont générés automatiquement cependant il est également possible d’imaginer qu’ils soient créés par des humains de manière plus traditionnelle. Bien que cela a l’avantage de s’assurer de la qualité du quiz et du contenu, cela a le désavantage de prendre beaucoup de temps et d’être contraint à utiliser un scope plus réduit de contenus authentiques.As part of our system, these quizzes are generated automatically however it is also possible to imagine them being created by humans in a more traditional way. Although this has the advantage of ensuring the quality of the quiz and the content, it has the disadvantage of taking a lot of time and being forced to use a smaller scope of authentic content.
Le système d’inférence peut être déployé en tant que micro-service avec sa propre API. The inference system can be deployed as a microservice with its own API.
Le système (entrainement et inférence) peut-être installé sur des serveurs avec CPU ou GPU en utilisant par exemple framework open source de machine learning standard de type PyTorch [23].The system (training and inference) can be installed on servers with CPU or GPU using for example a standard open source machine learning framework such as PyTorch [23].
L’entrainement du système peut être réalisé sur des données réelles provenant du comportement des apprenants. L’entrainement peut être réalisé une seule fois ou de manière continue afin de prendre en compte l’évolution de la performance d profile de l’apprenant qui évolue dans le temps.The training of the system can be carried out on real data from the behavior of learners. The training can be carried out once or continuously in order to take into account the evolution of the performance profile of the learner which evolves over time.
DEFINITIONSDEFINITIONS
BERT : acronyme anglais de « Bidirectional Encoder Representations from Transformers » pour « représentations de codage bidirectionnelles à partir de transformateurs », modèle de langage [24] développé par Google en 2018BERT: English acronym for “Bidirectional Encoder Representations from Transformers”, language model [24] developed by Google in 2018
Bibliothèque : espace numérique de rangement structuré de flashcardsLibrary: structured digital storage space for flashcards
Cours : ensemble de flashcards correspondant à un thème particulier Course: set of flashcards corresponding to a particular theme
Equipement de communication : smartphone, tablette, ordinateur personnel et plus généralement tout équipement connecté à un ou plusieurs réseaux de communicationCommunication equipment: smartphone, tablet, personal computer and more generally any equipment connected to one or more communication networks
FastText : bibliothèque pour l'apprentissage des incorporations de mots et la classification de texte, créée par le laboratoire AI Research (FAIR) de FacebookFastText: Library for learning word embeddings and text classification, created by Facebook's AI Research (FAIR) lab
Flashcard ou carte quiz: micro-contenu compatible avec un apprentissage sur smartphone, tablette ou ordinateur personnel, par répétitions espacéesFlashcard or quiz card: micro-content compatible with learning on smartphone, tablet or personal computer, by spaced repetitions
Glove : algorithme d'apprentissage non supervisé pour obtenir des représentations vectorielles pour les mots. [26]Glove: An unsupervised learning algorithm for obtaining vector representations for words. [26]
GRU : pour « Gated Recurent Unit » (Unité récurrente fermée), mécanisme de déclenchement dans les réseaux de neurones récurrents [25], introduit en 2014 par Kyunghyun Cho et al.[29].GRU: Gated Recurrent Unit, a gating mechanism in recurrent neural networks [25], introduced in 2014 by Kyunghyun Cho et al.[29].
Indexeur : outil numérique de recherche de contenus multimédia contenant un mot ou une expression cibleIndexer: digital tool for searching multimedia content containing a target word or expression
LSTM : pour «”Long Short-Term Memory” (mémoire à long court-terme), architecture de réseau de neurones récurrents artificiels utilisée dans le domaine de l'apprentissage profondLSTM: for “Long Short-Term Memory”, artificial recurrent neural network architecture used in the field of deep learning
Quiz : test ou questionnaire permettant de tester des connaissances spécifiques ou des compétencesQuiz: A test or questionnaire to test specific knowledge or skills.
Répétition espacée : technique de mémorisation basée sur les neurosciences qui consiste à montrer de nouveau l’élément (par exemple, un quiz) à mémoriser juste avant que l’apprenant n’oublie Spaced repetition: a neuroscience-based memorization technique that involves re-showing the item (e.g., a quiz) to be memorized just before the learner forgets
Transformer model modèle d'apprentissage profond qui adopte le mécanisme de l'auto-attention, en pondérant différemment l'importance de chaque partie des données d'entrée, appliqué en NLP (Natural Language Processing).Transformer model deep learning model that adopts the self-attention mechanism, by differently weighting the importance of each part of the input data, applied in NLP (Natural Language Processing).
DESCRIPTION DES FIGURESDESCRIPTION OF FIGURES
On comprendra mieux l’invention à la lumière des figures suivantes :
  • La représente un exemple de réalisation d’un procédé de fourniture de cartes quiz ou micro-contenus multimédia dédiées à l’apprentissage d’une langue étrangère selon l’invention.
  • La représente schématiquement un exemple de réalisation d’un système d’apprentissage de langues étrangères selon l’invention, implémentant un système de fourniture de cartes quiz selon l’invention.
  • La représente un exemple d’architecture d’un système de prédiction de meilleur(s) contexte(s) mis en œuvre dans un système de fourniture de cartes quiz selon l’invention.
  • La illustre un système d’apprentissage neuronal mis en œuvre dans un système de fourniture de cartes quiz selon l’invention.
The invention will be better understood in the light of the following figures:
  • There represents an example of implementation of a method for providing quiz cards or multimedia micro-content dedicated to learning a foreign language according to the invention.
  • There schematically represents an exemplary embodiment of a foreign language learning system according to the invention, implementing a system for providing quiz cards according to the invention.
  • There represents an example of architecture of a system for predicting the best context(s) implemented in a system for providing quiz cards according to the invention.
  • There illustrates a neural learning system implemented in a quiz card supply system according to the invention.
DESCRIPTION DETAILLEEDETAILED DESCRIPTION
On va maintenant décrire, en référence à la , un exemple de réalisation d’un procédé de délivrance de cartes quiz selon l’invention, en même temps que le système mettant en œuvre ce procédé. Ce système 10 peut être réalisé sous la forme d’un équipement informatique dans lequel un programme d’ordinateur implémentant le procédé est exécuté. Cet équipement informatique peut être installé sur un site local d’opération ou en un site distant dans un « nuage » (ou Cloud) numérique.We will now describe, with reference to the , an exemplary embodiment of a method for issuing quiz cards according to the invention, at the same time as the system implementing this method. This system 10 can be produced in the form of computer equipment in which a computer program implementing the method is executed. This IT equipment can be installed on a local operating site or at a remote site in a digital “cloud”.
Avec le procédé de délivrance selon l’invention, une recherche 12 est effectuée en continu sur une chaîne multimédia ou un site d’hébergement de contenus multimédia 11, sur la base de mot cibles ou mots clés prédéterminée et stockés au sein d’un dictionnaire. Il est à noter que cette recherche 12 peut mettre en œuvre une API de la chaîne multimédia.With the delivery method according to the invention, a search 12 is carried out continuously on a multimedia channel or a multimedia content hosting site 11, on the basis of predetermined target words or key words stored in a dictionary . It should be noted that this research 12 can implement a multimedia channel API.
Les contenus multimédia objet de la recherche peuvent être fournis comme déjà indexés par l’opérateur de la chaine 11 ou bien indexés 3 après avoir été sélectionnés à l’issue de la recherche 12.The multimedia content subject to the search can be provided as already indexed by the channel operator 11 or indexed 3 after having been selected at the end of the search 12.
On dispose alors d’un ensemble 4 de contenus multimédia indexés issues de la recherche par mots cible.We then have a set 4 of indexed multimedia content resulting from the target word search.
On soumet ensuite ces contenus multimédia indexés à un algorithme de préfiltrage 6 mettant en œuvre des techniques de traitement en langage naturel NLP (pour « Natural Language Processing »).These indexed multimedia contents are then subjected to a pre-filtering algorithm 6 implementing natural language processing techniques NLP (for “Natural Language Processing”).
Ce préfiltrage 6 peut être effectué sur des transcriptions textuelles des contenus vidéo 4. Il peut être effectué selon un ou plusieurs mots-cible choisis, avec une analyse morphosyntaxique permettant une levée d’ambiguïté lexicale.This pre-filtering 6 can be carried out on textual transcriptions of video content 4. It can be carried out according to one or more chosen target words, with a morphosyntactic analysis allowing lexical ambiguity to be removed.
Les contenus multimédia ainsi préflitrés, désignés aussi sous le terme de micro-contenus multimédia, sont ensuite traités (13) pour créer des Flashcards, chaque FlashCard 7 résultant en tant qu’objet numérique d’une association d’un contenu multimédia et d’un quiz - question-réponse – en relation avec le mot cible associé à ce contenu multimédia.The multimedia contents thus pre-filtered, also referred to as micro-multimedia contents, are then processed (13) to create Flashcards, each FlashCard 7 resulting as a digital object from an association of multimedia content and a quiz - question-answer - in relation to the target word associated with this multimedia content.
Le quiz peut être réalisé sous la forme d’un ensemble de questions relatives au contenu des segments vidéo en relation avec le mot-cible ou l’expression-cible. Ce quiz peut être sous un format audio et/ou script sur le contenu multimédia de la flashcard. Les quiz peuvent être générés soit de manière manuelle par des enseignants ou administrateurs ou soit de manière automatique en demandant par exemple à l’apprenant un exercice de traduction.The quiz can be carried out in the form of a set of questions relating to the content of the video segments in relation to the target word or target expression. This quiz can be in audio and/or script format on the multimedia content of the flashcard. Quizzes can be generated either manually by teachers or administrators or automatically by asking the learner for a translation exercise, for example.
Lorsqu’un apprenant S ouvre pour la première fois une application d’apprentissage de langue implémentant le procédé de délivrance de flashcards selon l’invention, cet apprenant va fournir son choix d’une langue et le contexte dans lequel il souhaite apprendre cette langue : par exemple professionnel ou personnel, ainsi que des informations liées à son profil personnel (par exemple, quels mots ont déjà été mémorisés).When a learner S opens for the first time a language learning application implementing the flashcard delivery method according to the invention, this learner will provide his choice of a language and the context in which he wishes to learn this language: for example professional or personal, as well as information related to one's personal profile (for example, which words have already been memorized).
L’application va alors émettre une suite de FlashCards ou cartes quiz multimédia qui vont être visualisées sur l’équipement électronique ou de communication de l’appelant après avoir été sélectionnés par un système d’identification 5.The application will then issue a series of FlashCards or multimedia quiz cards which will be displayed on the caller's electronic or communication equipment after having been selected by an identification system 5.
Ce système d’identification implémente un module d’intelligence artificielle (IA) 8 qui va contrôler la sélection d’une FlashCard à proposer à l’apprenant S. Les réponses 15 de l’apprenant S aux questions contenus dans les quiz des FlashCards, ainsi que ses retours d’expérience et d’appréciation sur la pertinence de ces Flashcards sont traitées par un algorithme de répétitions espacées 14 qui va produire des informations d’apprentissage (machine learning) au module IA 8. Cet algorithme de répétitions espacées 4 est en outre prévu pour déterminer un prochain timing optimal de révision d’une ou plusieurs cartes quiz d’apprentissage.This identification system implements an artificial intelligence (AI) module 8 which will control the selection of a FlashCard to be offered to the learner S. The answers 15 of the learner S to the questions contained in the FlashCard quizzes, as well as its feedback and assessment on the relevance of these Flashcards are processed by a spaced repetition algorithm 14 which will produce learning information (machine learning) to the IA module 8. This spaced repetition algorithm 4 is furthermore intended to determine a next optimal timing for reviewing one or more learning quiz cards.
En référence à la , un système 1 d’apprentissage de langues peut être déployé à partir du système 10 de délivrance de FlashCards selon l’invention. Ce système d’apprentissage comprend une pluralité C1,C2,…Ck d’équipements personnels de communication ou équipements électroniques tels que des smartphones, tablettes ou ordinateurs personnels utilisés par une pluralité d’apprenants S1,S2,…,Sk qui ont téléchargé et utilisent une application implémentant l’invention. Les équipements C1,C2,…Ck sont connectés via un réseau de communication 30 à la chaine vidéo 11, à un serveur 34 et une base de données 32 gérant l’application, et à un cloud 33 auquel est connecté le système 10 de délivrance ou fourniture de FlashCard multimédia.In reference to the , a language learning system 1 can be deployed from the FlashCard delivery system 10 according to the invention. This learning system comprises a plurality C1,C2,…Ck of personal communication equipment or electronic equipment such as smartphones, tablets or personal computers used by a plurality of learners S1,S2,…,Sk who have downloaded and use an application implementing the invention. The equipment C1, C2,…Ck are connected via a communication network 30 to the video channel 11, to a server 34 and a database 32 managing the application, and to a cloud 33 to which the delivery system 10 is connected or provision of multimedia FlashCard.
Il est à noter que bien d’autres configurations de connexion à des réseaux de communication et à des clouds peuvent être envisagées.It should be noted that many other connection configurations to communication networks and clouds can be considered.
On va maintenant décrire, en référence à la , un exemple de réalisation d’un procédé 80 d’identification par apprentissage mis en œuvre dans le procédé de délivrance de FlashCards selon l’invention.We will now describe, with reference to the , an exemplary embodiment of a method 80 of identification by learning implemented in the method of issuing FlashCards according to the invention.
Ce procédé d’identification 80 implémente un réseau de neurones 81 dédié à un apprentissage neuronal 83. Ce réseau de neurones 81 traite le mot cible utilisé pour la recherche et la sélection d’un groupe de FlashCards, un ensemble de contextes i correspondant à ces FlashCards, un profil et un historique de l’apprenant S et des caractéristiques (« Features ») dérivées de la phrases telles que le score de lisibilité. On entend ici par « lisibilité » (ou « readability » en anglais) en NLP (Natural Language Processing), l’une des mesures de la complexité d’une phrase [28].This identification method 80 implements a neural network 81 dedicated to neural learning 83. This neural network 81 processes the target word used for the search and selection of a group of FlashCards, a set of contexts i corresponding to these FlashCards, a profile and history of the learner S and sentence-derived features such as readability score. Here we mean “readability” in NLP (Natural Language Processing), one of the measures of the complexity of a sentence [28].
Ces entrées sont traitées par une méthode neuronale pour délivrer un score Si de chaque contexte i. L’opération 82 de calcul de score est itérée plusieurs fois pour l’ensemble des n contextes préfiltrés. On détermine en suite le Max des scores Si et ainsi le meilleur contexte 84. La FlashCard correspondante est soumise à l’apprenant S qui en retour va répondre au quiz et émettre une évaluation de la difficulté ressentie pour ce quiz. Ces informations de retour d’expérience (« Feedback ») 85 sont alors exploitées par le module 83 d’apprentissage neuronal sous la forme d’informations Récompense/Pénalité. Les réponses saisies par l’apprenant S sont exploitées pour améliorer en continu le réseau de neurones 81 mis en œuvre dans la sélection du meilleur contexte.These inputs are processed by a neural method to deliver a score Si for each context i. The score calculation operation 82 is iterated several times for all of the n pre-filtered contexts. We then determine the Max scores Si and thus the best context 84. The corresponding FlashCard is submitted to the learner S who in return will answer the quiz and issue an evaluation of the difficulty felt for this quiz. This feedback information (“Feedback”) 85 is then used by the neural learning module 83 in the form of Reward/Penalty information. The responses entered by the learner S are used to continuously improve the neural network 81 implemented in the selection of the best context.
L’identification 80 peut être basée sur plusieurs critères liés à l’activité de l’apprenant S sur le système d’apprentissage de langue 1 et comprendre une classification d’une transcription textuelle d’un contenu vidéo sur la base de caractéristiques de cette transcription textuelle, en vue de déterminer un niveau de difficulté pour le contexte correspondant.The identification 80 can be based on several criteria linked to the activity of the learner S on the language learning system 1 and include a classification of a textual transcription of video content on the basis of characteristics of this textual transcription, in order to determine a level of difficulty for the corresponding context.
Il est à noter que la sélection 82 du meilleur contexte peut en outre comprendre un encodage du contexte comme une séquence de vecteurs-mots.It should be noted that the selection 82 of the best context may also include an encoding of the context as a sequence of word vectors.
En référence à la , un système d’apprentissage neuronal 8’ pouvant être mis en œuvre dans le système de fourniture de cartes quiz selon l’invention, comprend un système 41 d’encodage d’une phrase recevant un ensemble 40 d’entrées du système de fourniture.In reference to the , a neural learning system 8' which can be implemented in the quiz card supply system according to the invention, comprises a system 41 for encoding a sentence receiving a set 40 of inputs from the supply system.
Ces entrées 40 peuvent comprendre un mot cible et une phrase sous la forme de chaines de caractères (« string »), des caractéristiques (« Features ») dérivées de la phrase telles qu’un score de lisibilité ou un tempo, des mots connus sous la forme de listes de chaines de caractères ; des informations relatives à l’apprenant, et un score de recommandation mesuré.These entries 40 may include a target word and a sentence in the form of strings, characteristics derived from the sentence such as a readability score or a tempo, words known as the form of lists of character strings; learner information, and a measured recommendation score.
Le système d’encodage de phrase 41 peut mettre en œuvre des modèles et méthodes d’encodage tels que Glove + LSTM, Glove + GRU, FastText + GRU ou BERT ou autre réseau qui agrègent les informations de chaque mot en un ensemble.The sentence encoding system 41 may implement encoding models and methods such as Glove + LSTM, Glove + GRU, FastText + GRU or BERT or other network that aggregates the information of each word into a set.
Le système d’encodage de phrase 41 délivre un vecteur normalisé 42 dont les composantes comprennent :
  • le mot-cible encodé, par encodage « one hot » [30] dans lequel on encode une variable à n états sur n bits dont un seul prend la valeur 1, le numéro du bit valant 1 étant le numéro de l'état pris par la variable,
  • la phrase encodée, par mise en œuvre d’une tokenisation [31] de lemmes identifiés dans cette phrase,
  • des caractéristiques (ou « Features ») dérivées de la phrase, par exemple un score de lisibilité ou un tempo,
  • des mots connus encodés par encodage « one hot ».
The sentence encoding system 41 delivers a standardized vector 42 whose components include:
  • the encoded target word, by “one hot” encoding [30] in which a variable with n states is encoded on n bits, only one of which takes the value 1, the number of the bit worth 1 being the number of the state taken by the variable,
  • the encoded sentence, by implementing a tokenization [31] of lemmas identified in this sentence,
  • characteristics (or “Features”) derived from the sentence, for example a readability score or a tempo,
  • known words encoded by “one hot” encoding.
Ce vecteur normalisé 42 est appliqué en entrée d’un réseau de neurones 43 de type « à propagation avant » (Feed Forward) [32], qui délivre un score de recommandation prédit.This normalized vector 42 is applied as input to a “Feed Forward” type neural network 43 [32], which delivers a predicted recommendation score.
A ce réseau de neurones 43, sont associés des hyperparamètres :
  • taux d’apprentissage, par exemple 0.01
  • facteur de régularisation (ou « weight decay »), par exemple 0.001
  • optimiseur, par exemple LBFGS, Adam ou ASGDL
Hyperparameters are associated with this neural network 43:
  • learning rate, for example 0.01
  • regularization factor (or “weight decay”), for example 0.001
  • optimizer, for example LBFGS, Adam or ASGDL
Le réseau de neurones 43 présente la structure suivante :
  • une couche d’entrée et de sortie de K dimensions, par exemple avec K = 128 dimensions,
  • M couches cachées de L dimensions, par exemple 10 couches x 512 dimensions
The neural network 43 has the following structure:
  • an input and output layer of K dimensions, for example with K = 128 dimensions,
  • M hidden layers of L dimensions, for example 10 layers x 512 dimensions
Le réseau de neurones 43 est soumis à un entrainement 45 « backpropagation » dans lequel chaque itération d’apprentissage évalue la différence entre le score prédit et le score mesuré via une mesure standard d’erreur, comme par exemple MSE (Mean Square Error) ou MAE (Mean Absolute Error). The neural network 43 is subjected to “backpropagation” training 45 in which each learning iteration evaluates the difference between the predicted score and the measured score via a standard error measure, such as for example MSE (Mean Square Error) or MAE (Mean Absolute Error).
En référence aux figures précitées, les Flashcards 7 soumises à l’identification par apprentissage neuronal peuvent être stockées de multiples façons, par exemple dans la base de données distante 32 ou dans tout autre espace de stockage accessible depuis le Cloud 33. On peut aussi envisager que des Flashcards soient téléchargées et stockées localement dans un équipement de communication utilisé par un apprenant.With reference to the aforementioned figures, the Flashcards 7 subjected to identification by neural learning can be stored in multiple ways, for example in the remote database 32 or in any other storage space accessible from the Cloud 33. We can also consider that Flashcards are downloaded and stored locally in communications equipment used by a learner.
Chaque équipement personnel de communication C1,C2,…Ck a reçu une application logicielle comprenant une interface graphique utilisateur (« front end ») et dédiée au procédé d’apprentissage selon l’invention, par téléchargement depuis un ou plusieurs opérateurs d’applications.Each personal communication equipment C1,C2,…Ck received a software application comprising a graphical user interface (“front end”) and dedicated to the learning process according to the invention, by downloading from one or more application operators.
Chaque apprenant S1,S2,…Sk peut consulter le serveur d’application 34 pour recevoir sur son équipement de communication 43 des recommandations de quiz multimedia (flashcards) correspondant à leur profile, de manière séquentielle et qui reviendront pour être révisées chaque jour via le système de répétitions espacées.Each learner S1,S2,…Sk can consult the application server 34 to receive on their communication equipment 43 recommendations for multimedia quizzes (flashcards) corresponding to their profile, in a sequential manner and which will return to be revised every day via the spaced repetition system.
Bien sûr, la présente invention n’est pas limitée aux exemples qui viennent d’être décrits et de nombreux autres modes de réalisation peuvent être envisagées sans sortir du cadre de l’invention. En particulier, les méthodes neuronales mises en œuvre pour l’identification des Flashcards ne sont pas limitées à l’apprentissage neuronal mais pourront intégrer bien d’autres outils d’intelligence artificielle capables de délivrer des Flashcards présentant un contexte optimal au fur et à mesure de l’apprentissage d’une langue par un apprenant. Par ailleurs, le procédé objet de la présente invention convient pour l’apprentissage de n’importe quelle langue pratiquée dans le Monde, dès lors qu’une librairie permettant de créer des vecteurs mots dans cette langue est disponible.Of course, the present invention is not limited to the examples which have just been described and numerous other embodiments can be envisaged without departing from the scope of the invention. In particular, the neural methods implemented for the identification of Flashcards are not limited to neural learning but can integrate many other artificial intelligence tools capable of delivering Flashcards presenting an optimal context progressively. of a learner's learning of a language. Furthermore, the method which is the subject of the present invention is suitable for learning any language used in the world, as long as a library allowing the creation of word vectors in this language is available.
REFERENCESREFERENCES




Claims (16)

  1. Procédé mis en œuvre par ordinateur pour délivrer, à partir de contenus multimédia disponibles sur un site web d’hébergement de contenus multimédia (11), des cartes quiz (7) procurant des contextes multimédia d’apprentissage adaptés à un apprenant d’une langue étrangère selon une pluralité de critères, ce procédé comprenant les étapes suivantes:
    • recherche (12) de contenus multimédia indexés disponibles sur ledit site d’hébergement (11), selon une pluralité de mots cible prédéterminés,
    • préfiltrage (6), parmi les contenus multimédia indexés issus de l’étape de recherche (12), de contenus multimédia indexés (7) correspondant à une pluralité de contextes d’apprentissage,
    caractérisé en ce qu’il comprend en outre les étapes de :
    • production, à partir chacun desdits contenus multimédia indexés et préfiltrés (7), de cartes quiz intégrant chacune un quiz en relation avec un ou plusieurs mots cible associés au contenu multimédia respectif, ledit quiz étant généré automatiquement comme une demande d’exercice de traduction dudit un ou plusieurs mots cibles, lesdites cartes quiz ainsi produites étant prévues pour être visualisables (9) sur un équipement électronique (C1,C2,…Ck) utilisé par l’apprenant (S;S1,S2,..,Sk),
    • identification, parmi lesdites cartes quiz ainsi produites (7), d’une ou plusieurs cartes quiz adaptées pour faire progresser un apprenant de manière optimale en fonction de son profil, comprenant une sélection (82) d’un meilleur contexte (84) pour l’apprenant (S), cette étape de sélection comprenant  les étapes suivantes :
    • entrer, dans un réseau de neurones (81) implémentant un apprentissage neuronal, un mot cible, une transcription d’un contexte et des caractéristiques dérivées d’une phrase ou d’un profil de l’apprenant,
    • délivrer en sortie du réseau de neurones (81) un score (Si) du contexte de recommandation à l’apprenant (S),
    • répéter les deux étapes précédentes pour tous les contextes préfiltrés,
    • conserver le contexte (84) présentant le score le plus élevé.
    Computer-implemented method for delivering, from multimedia content available on a multimedia content hosting website (11), quiz cards (7) providing multimedia learning contexts adapted to a language learner foreign according to a plurality of criteria, this method comprising the following steps:
    • search (12) for indexed multimedia content available on said hosting site (11), according to a plurality of predetermined target words,
    • pre-filtering (6), among the indexed multimedia contents resulting from the search step (12), of indexed multimedia contents (7) corresponding to a plurality of learning contexts,
    characterized in that it further comprises the steps of:
    • production, from each of said indexed and pre-filtered multimedia contents (7), of quiz cards each integrating a quiz in relation to one or more target words associated with the respective multimedia content, said quiz being automatically generated as a request for a translation exercise of said one or more target words, said quiz cards thus produced being intended to be viewable (9) on electronic equipment (C1,C2,…Ck) used by the learner (S;S1,S2,..,Sk),
    • identification, among said quiz cards thus produced (7), of one or more quiz cards adapted to advance a learner in an optimal manner according to his profile, comprising a selection (82) of a better context (84) for the learner (S), this selection step comprising the following steps:
    • enter, into a neural network (81) implementing neural learning, a target word, a transcription of a context and characteristics derived from a sentence or a profile of the learner,
    • deliver at the output of the neural network (81) a score (Si) of the recommendation context to the learner (S),
    • repeat the previous two steps for all pre-filtered contexts,
    • keep context (84) with the highest score.
  2. Procédé selon la revendication précédente, caractérisé en ce que l’étape de préfiltrage met en œuvre un traitement en langage naturel (NLP) effectué sur des transcriptions textuelles desdits contenus multimédia.Method according to the preceding claim, characterized in that the pre-filtering step implements natural language processing (NLP) carried out on textual transcriptions of said multimedia content.
  3. Procédé selon la revendication précédente, caractérisé en ce que l’étape de préfiltrage (6) comprend en outre un filtrage selon un ou plusieurs mots-cible choisis.Method according to the preceding claim, characterized in that the pre-filtering step (6) further comprises filtering according to one or more chosen target words.
  4. Procédé selon la revendication précédente, caractérisé en ce que le filtrage selon un ou plusieurs mots-cible comprend une étape d’analyse morphosyntaxique permettant une levée d’ambiguïté lexicale.Method according to the preceding claim, characterized in that the filtering according to one or more target words comprises a morphosyntactic analysis step allowing lexical ambiguity to be removed.
  5. Procédé selon la revendication précédente, caractérisé en ce que l’étape d’identification (80) comprend une classification d’une transcription textuelle d’une vidéo sur la base de caractéristiques de cette transcription textuelle, et de son tempo, en vue de déterminer un niveau de difficulté pour le contexte correspondant.Method according to the preceding claim, characterized in that the identification step (80) comprises a classification of a textual transcription of a video on the basis of characteristics of this textual transcription, and of its tempo, with a view to determining a level of difficulty for the corresponding context.
  6. Procédé selon l’une quelconque des revendications précédentes, caractérisé en ce que l’étape d’identification (80) comprend en outre une sélection (82) du meilleur contexte (84) pour l’apprenant (S) en tenant compte de son historique dans une application implémentant ce procédé.Method according to any one of the preceding claims, characterized in that the identification step (80) further comprises a selection (82) of the best context (84) for the learner (S) taking into account his history in an application implementing this process.
  7. Procédé selon la revendication précédente, caractérisé en ce que l’étape (82) de sélection du meilleur contexte comprend en outre une étape pour encoder le contexte comme une séquence de vecteurs-mots.Method according to the preceding claim, characterized in that the step (82) of selecting the best context further comprises a step for encoding the context as a sequence of word vectors.
  8. Procédé selon l’une des deux revendications précédentes, caractérisé en ce qu’il comprend en outre une étape (85) pour saisir une réponse de l’apprenant sur sa perception du niveau de difficulté du contenu multimédia qu’il vient de consulter, et une étape pour attribuer au réseau de neurones (81) une récompense ou une pénalité en fonction de la réponse ainsi saisie.Method according to one of the two preceding claims, characterized in that it further comprises a step (85) for entering a response from the learner on his perception of the level of difficulty of the multimedia content he has just consulted, and a step for assigning to the neural network (81) a reward or a penalty depending on the response thus entered.
  9. Système (10) pour délivrer, à partir de contenus multimédia disponibles sur un site web d’hébergement de contenus multimédia (11), des cartes quiz multimédia procurant des contextes d’apprentissage adaptés à un apprenant (S) d’une langue étrangère selon une pluralité de critères, mettant en œuvre le procédé selon l’une quelconque des revendications précédentes, ce système (10) comprenant:
    • des moyens (12) pour rechercher des contenus multimédia indexés (4) disponibles sur ledit site d’hébergement (11), selon une pluralité de mots cible prédéterminés,
    • des moyens (6) pour pr´efiltrer, parmi les contenus multimédia indexés (4) issus de l’étape de recherche, des contenus multimédia indexés correspondant à une pluralité de contextes d’apprentissage,
    caractérisé en ce qu’il comprend en outre :
    • des moyens (13) pour produire, à partir de chacun desdits contenus multimédia indexés et préfiltrés, des cartes quiz (7) intégrant chacune un quiz en relation avec un ou plusieurs mots cible associés au contenu multimédia respectif, ledit quiz étant généré automatiquement comme une demande d’exercice de traduction dudit un ou plusieurs mots cibles, lesdites cartes quiz (7) ainsi produites étant prévues pour être visualisables sur un équipement électronique (C1,C2,..,Ck) utilisé par l’apprenant (S),
    • des moyens (5) pour identifier par une méthode neuronale d’apprentissage, parmi lesdites cartes quiz ainsi produites (7), une ou plusieurs cartes quiz adaptées pour faire progresser l’apprenant (S) en fonction de son profil, lesdits moyens d’identification étant agencés pour sélectionner un meilleur contexte pour l’apprenant.
    System (10) for delivering, from multimedia content available on a multimedia content hosting website (11), multimedia quiz cards providing learning contexts adapted to a learner (S) of a foreign language according to a plurality of criteria, implementing the method according to any one of the preceding claims, this system (10) comprising:
    • means (12) for searching for indexed multimedia content (4) available on said hosting site (11), according to a plurality of predetermined target words,
    • means (6) for pre-filtering, among the indexed multimedia contents (4) resulting from the search step, indexed multimedia contents corresponding to a plurality of learning contexts,
    characterized in that it further comprises:
    • means (13) for producing, from each of said indexed and pre-filtered multimedia contents, quiz cards (7) each integrating a quiz in relation to one or more target words associated with the respective multimedia content, said quiz being automatically generated as a request for a translation exercise of said one or more target words, said quiz cards (7) thus produced being intended to be viewable on electronic equipment (C1,C2,..,Ck) used by the learner (S),
    • means (5) for identifying by a neural learning method, among said quiz cards thus produced (7), one or more quiz cards adapted to advance the learner (S) according to his profile, said means of identification being arranged to select a better context for the learner.
  10. Système selon la revendication précédente, caractérisé en ce que les moyens d’identification sont agencés pour :
    • entrer, dans un réseau de neurones (81) implémentant un apprentissage neuronal, un mot cible, une transcription d’un contexte et des caractéristiques dérivées d’une phrase ou d’un profil de l’apprenant,
    • délivrer en sortie du réseau de neurones (81) un score (Si) du contexte de recommandation à l’apprenant (S),
    • répéter les deux étapes précédentes pour tous les contextes préfiltrés.
    • conserver le contexte (84) présentant le score le plus élevé.
    System according to the preceding claim, characterized in that the identification means are arranged to:
    • enter, into a neural network (81) implementing neural learning, a target word, a transcription of a context and characteristics derived from a sentence or a profile of the learner,
    • deliver at the output of the neural network (81) a score (Si) of the recommendation context to the learner (S),
    • repeat the previous two steps for all pre-filtered contexts.
    • keep context (84) with the highest score.
  11. Système (10) selon la revendication précédente, caractérisé en ce que les moyens de préfiltrage (6) sont agencés pour traiter des transcriptions textuelles de vidéos hébergées sur le site web d’hébergement de contenus multimédia (11).System (10) according to the preceding claim, characterized in that the pre-filtering means (6) are arranged to process textual transcriptions of videos hosted on the multimedia content hosting website (11).
  12. Système (10) selon la revendication précédente, caractérisé en ce que les moyens d’identification (5) comprennent en outre des moyens (82) pour sélectionner un meilleur contexte pour l’apprenant (S) en tenant compte de son historique dans une application implémentant le procédé selon l’une quelconque des revendications 1 à 8.System (10) according to the preceding claim, characterized in that the identification means (5) further comprise means (82) for selecting a better context for the learner (S) taking into account his history in an application implementing the method according to any one of claims 1 to 8.
  13. Système (10) selon la revendication précédente, caractérisé en ce que les moyens de sélection du meilleur contexte coopèrent avec un système de répétitions espacées (14) prévu pour déterminer un prochain calendrier optimal de révision d’une ou plusieurs cartes quiz d’apprentissage (7). qui va permettre d’accélérer l’apprentissage.System (10) according to the preceding claim, characterized in that the means for selecting the best context cooperate with a spaced repetition system (14) provided to determine a next optimal schedule for revising one or more learning quiz cards ( 7). which will accelerate learning.
  14. Système (10) selon la revendication précédente, caractérisé en ce que les moyens (82) de sélection du meilleur contexte comprennent des moyens pour encoder le contexte comme une séquence de vecteurs-mots en un vecteur représentant la phrase.System (10) according to the preceding claim, characterized in that the means (82) for selecting the best context comprise means for encoding the context as a sequence of word vectors into a vector representing the sentence.
  15. Système (10) selon l’une des deux revendications précédentes, caractérisé en ce qu’il comprend en outre des moyens (85) pour saisir une réponse de l’apprenant (S)) sur sa perception du niveau de difficulté de la vidéo qu’il vient de consulter, et des moyens pour attribuer au réseau de neurones (81) une récompense ou une pénalité en fonction de la réponse ainsi saisie.System (10) according to one of the two preceding claims, characterized in that it further comprises means (85) for entering a response from the learner (S)) on his perception of the level of difficulty of the video that he has just consulted, and means for assigning to the neural network (81) a reward or a penalty depending on the response thus entered.
  16. Système (10)) selon la revendication précédente, caractérisé en ce qu’il comprend en outre des moyens pour exploiter les réponses saisies par l’apprenant par le système de répétitions espacées (14), de façon à améliorer via un entrainement le réseau de neurones (8,81) mis en œuvre dans la sélection du meilleur contexte.System (10)) according to the preceding claim, characterized in that it further comprises means for exploiting the responses entered by the learner by the spaced repetition system (14), so as to improve via training the network of neurons (8,81) implemented in the selection of the best context.
PCT/EP2023/058206 2022-04-01 2023-03-29 Method and system for issuing multimedia quiz cards that provide learning contexts suitable for a learner of a foreign language WO2023187015A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FRFR2203019 2022-04-01
FR2203019A FR3134218A1 (en) 2022-04-01 2022-04-01 Method and system for delivering multimedia quiz cards (flashcards) providing learning contexts adapted to a learner of a foreign language

Publications (1)

Publication Number Publication Date
WO2023187015A1 true WO2023187015A1 (en) 2023-10-05

Family

ID=83899987

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2023/058206 WO2023187015A1 (en) 2022-04-01 2023-03-29 Method and system for issuing multimedia quiz cards that provide learning contexts suitable for a learner of a foreign language

Country Status (2)

Country Link
FR (1) FR3134218A1 (en)
WO (1) WO2023187015A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102018295B1 (en) 2017-06-14 2019-09-05 주식회사 핀인사이트 Apparatus, method and computer-readable medium for searching and providing sectional video
US20200143704A1 (en) 2018-11-02 2020-05-07 International Business Machines Corporation Enhancing video language learning by providing catered context sensitive expressions

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102018295B1 (en) 2017-06-14 2019-09-05 주식회사 핀인사이트 Apparatus, method and computer-readable medium for searching and providing sectional video
US20200143704A1 (en) 2018-11-02 2020-05-07 International Business Machines Corporation Enhancing video language learning by providing catered context sensitive expressions

Non-Patent Citations (21)

* Cited by examiner, † Cited by third party
Title
"Advances in Neural InformationProcessing Systems", vol. 30, 2017, CURRAN ASSOCIATES, INC, pages: 5998 - 6008
ADAM KILGARRIFF, MILOS HUSÂK, KATY MCADAM, MICHAEL RUNDEL, AND PAVEL RYCHLY: "Gdex: Automatically finding good dictionary examples in a corpus", 13TH EURALEXINTERNATIONAL CONGRESS, 2008, pages 425 - 432
BARRET ZOPHQUOC V LE: "Neural architecture search with reinforcement learning", ARXIV PREPRINT ARXIV:1611.01578, 2016
CHO, KYUNGHYUNVAN MERRIENBOER, BARTBAHDANAU, DZMITRYBENGIO, YOSHUA: "On the Properties of Neural Machine Translation: Encoder-Decoder Approaches", ARXIV:1409.1259, 2014
CRISTINA G. HOLGADOL ET AL.: "Évaluation de méthodes et d'outils pour la lemmatisation automatique du français médiéval", 28E CONFÉRENCE SUR LE TRAITEMENT AUTOMATIQUE DES LANGUES NATURELLES, 2 July 2021 (2021-07-02)
DEVENDRA SINGH CHAPLOTRUSLAN SALAKHUTDINOV: "Knowledge-based word sense disambiguation using topic models", AAAI, 2018
HONGSHEN CHENXIAORUI LIUDAWEI YINJILIANG TANG, A SURVEY ON DIALOGUE SYSTEMS: RECENT ADVANCES AND NEW FRONTIERS, 2017
ION MADRAZO AZPIAZUMARIA SOLEDAD FERA: "Multiattentive récurrent neural network architecture for multilingual readability assessment", TRANS- ACTIONS OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, vol. 7, March 2019 (2019-03-01), pages 421 - 436
JACOB DEVLINMING-WEI CHANGKENTON LEEKRISTINA TOUTANOVA: "Bert: Pre-training of deep bidirectional transformera for language understanding", ARXIV PREPRINT ARXIV:18I0.04805, 2018
LOÏC VIALBENJAMIN LECOUTEUXDIDIER SCHWAB: "Approche supervisée à base de cellules LSTM bidirectionnelles pour la désambiguïsation lexicale", TRAITEMENT AUTOMATIQUE DES LANGUES, 2019
LOUIS MARTINBENJAMIN MULLERPEDRO JAVIER ORTIZ SUÂREZYOANN DUPONTLAURENT ROMARYFRIC V ILLEMONTE DE LA CLERGERIEDJAMÉ SEDDAHENOÎT SA: "CamemBERT: a Tasty French Language Model", ARXIV E-PRINTS, November 2019 (2019-11-01)
MATE) MARTINESENJA POLLAKMARKO ROBNIK-SIKONJA: "Supervised and unsupervised neural approaches to text readability", CORR, 2019
NABIL HATHOUTFRANCK SAJOUS: "Proceedings of the Tenth International Con-ference on Language Resources and Evaluation (LREC 2016)", 2016, EUROPEAN LANGUAGE RESOURCES ASSOCIATION (FLRA, article "Wiktionnaire's Wildeode GLA WIfied: a Workable French Machine-Readable Dictionary"
SAWAN KUMARSHARMISTHA JATKARAN SAXENAPARTHA TALUKDAR: "Pro- ceedings of the 57th AnnualMeeting of the Association for Computational Linguistics", July 2019, ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, article "Zero-shot word sense disambiguation using sense définition embeddings", pages: 5670 - 5681
SCOTT A. CROSSLEYDAVID B. ALLENDANIELLE S. MCNAMARA: "Text read- ability and intuitive simplification: A comparison of readability formulas", READING IN A FOREIGN LANGUAGE, vol. 23, April 2011 (2011-04-01), pages 84 - 101
SEPP HOCHREITERJÜRGEN SCHMIDHUBER: "Long short-term memory", NEU- RAZ COMPUT, vol. 9, no. 8, November 1997 (1997-11-01), pages 1735 - 1780
TERRENCE L. FINE: "Feedforward Neural Network Methodology", SPRINGER SCIENCE & BUSINESS MEDIA, 6 April 2006 (2006-04-06)
TERTULIEN NDJOUNTCHE, ÉLECTRONIQUE NUMÉRIQUE 3 : MACHINES AVEC UN NOMBRE FINI D'ÉTATS, vol. 3, 2016, pages 304
VINCENT SEGONNEMARIE CANDITOBENOÎT CRABBÉ: "Using wiktionary as a resource for wsd : the case of french verbs", IWCS, 2019
WEIYAN SHIKUN QIANXUEVVEI WANGZHOU YU, HOW TO BUILD USER SIMULATORS TO TRAIN RL-BASED DIALOG YSTEMS, 2019
ZHONG CHENTIM HUNTERJIWON YUN: "Modeling sentence processing difficulty with a conditional probability calculator", ANNUAL MEETING OFTHE COGNITIVE SCIENCE SOCIETY, 2014, pages 1856 - 1857

Also Published As

Publication number Publication date
FR3134218A1 (en) 2023-10-06

Similar Documents

Publication Publication Date Title
Marconi Newsmakers: Artificial intelligence and the future of journalism
US10929392B1 (en) Artificial intelligence system for automated generation of realistic question and answer pairs
CN111324769B (en) Training method of video information processing model, video information processing method and device
US20110125734A1 (en) Questions and answers generation
CN110516791B (en) Visual question-answering method and system based on multiple attention
US11947582B2 (en) Enhanced knowledge delivery and attainment using a question answering system
US20170287356A1 (en) Teaching systems and methods
CN107210035A (en) The generation of language understanding system and method
US10083219B2 (en) Enhanced knowledge delivery and attainment using a question answering system
US20080281579A1 (en) Method and System for Facilitating The Learning of A Language
CN110852071B (en) Knowledge point detection method, device, equipment and readable storage medium
De Jong et al. Development of a test of spoken Dutch for prospective immigrants
US20170316807A1 (en) Systems and methods for creating whiteboard animation videos
US10275487B2 (en) Demographic-based learning in a question answering system
Samarawickrama et al. Comic based learning for students with visual impairments
Green et al. The Children’s Picture Books Lexicon (CPB-LEX): A large-scale lexical database from children’s picture books
CN118053331A (en) Method, medium and system for on-line teaching artificial intelligence coaching
WO2023094371A1 (en) Method and system for producing video micro-content items dedicated to learning a foreign language, and learning method implementing said video content items
Bulusu et al. Sentiment analysis of learner reviews to improve efficacy of massive open online courses (MOOC’s)-A survey
WO2023187015A1 (en) Method and system for issuing multimedia quiz cards that provide learning contexts suitable for a learner of a foreign language
Wu et al. Cold start problem for automated live video comments
CN114547435B (en) Content quality identification method, device, equipment and readable storage medium
KR20230040565A (en) Customized content providing system ans method for providing real-time collaborative editing services based on operational conversion
CN114139053A (en) Lifelong learning resource intelligent pushing system based on credit bank and big data analysis
Koller et al. Who wants to be a Click-Millionaire? On the Influence of Thumbnails and Captions

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23715520

Country of ref document: EP

Kind code of ref document: A1