WO2021084165A1 - Procede et systeme de caracterisation d'un mouvement d'une entite en mouvement - Google Patents

Procede et systeme de caracterisation d'un mouvement d'une entite en mouvement Download PDF

Info

Publication number
WO2021084165A1
WO2021084165A1 PCT/FR2019/052591 FR2019052591W WO2021084165A1 WO 2021084165 A1 WO2021084165 A1 WO 2021084165A1 FR 2019052591 W FR2019052591 W FR 2019052591W WO 2021084165 A1 WO2021084165 A1 WO 2021084165A1
Authority
WO
WIPO (PCT)
Prior art keywords
movement
images
characteristic points
moving entity
characterizing
Prior art date
Application number
PCT/FR2019/052591
Other languages
English (en)
Inventor
Carlos Javier PINEDA CORDERO
Original Assignee
St37 Sport Et Technologie
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by St37 Sport Et Technologie filed Critical St37 Sport Et Technologie
Priority to EP19832717.3A priority Critical patent/EP4066087A1/fr
Priority to PCT/FR2019/052591 priority patent/WO2021084165A1/fr
Publication of WO2021084165A1 publication Critical patent/WO2021084165A1/fr

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/23Recognition of whole body movements, e.g. for sport training
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30221Sports video; Sports image

Definitions

  • the invention relates to the field of real-time image analysis, and more particularly to image analysis for the characterization of movements or actions, which can be used in particular in aid to refereeing or sports training.
  • the invention relates to a method for characterizing a movement of a moving entity and a system for characterizing the movement of a moving entity.
  • patent application EP3528207 presents a method of analyzing a movement of a gymnast on a vault based on the identification of a plurality of joint knots in a series of images and then on the comparison. of the position of these join nodes throughout the images. Such a method can be useful in the case where the camera shot remains stationary. However, as soon as the shooting position of the camera is changed, such a method becomes unusable. In addition, in the absence of prior selection of images, the processing time can be significantly extended.
  • the object of the invention is to propose a method for characterizing a movement of a moving entity, said method being quick to implement so that it can be used in real time, on shots taken from mobile or fixed camera, and allowing movement to be identified with high sensitivity and specificity in a short time.
  • a method in accordance with the invention makes it possible to dispense with markers carried by the moving entities studied.
  • Another object of the invention is to propose a system for characterizing the movement of a moving entity, said system being able to be based on one or more cameras and not requiring the use of sensors carried by the moving entities. studied.
  • the invention relates to a method of characterizing a movement of a moving entity, for example for aid in refereeing or sports training, said method being implemented by a system.
  • a computer device including a processor and a data memory, said data memory being configured to store a repository of reference actions and a repository of reference movements, said method comprising the following steps:
  • Such a process allows, through this succession of steps, to characterize the movement of a moving entity and to assign a value to it.
  • a user will be able to determine whether a movement has been executed correctly or whether it should lead to a fault.
  • the analysis of the video stream according to the invention makes it possible to generate position values of characteristic points, then descriptors of characteristic points and evolution of these characteristic point descriptors and the comparison of these descriptors with respect to reference data will be rapid and reliable compared to the methods currently used.
  • a method makes it possible to characterize the movement more quickly and more precisely even when the shot is mobile.
  • these values can be compared with reference values so as to generate an arbitrage index value.
  • the arbitrage index value may correspond to an indication of compliance with an arbitration rule.
  • the present invention can therefore be considered in certain aspects as a decision support tool allowing a referee to make the best refereeing decisions or an athlete to constantly improve his practice compared to a standard. .
  • such a method can be used to improve the athletic performance of a practitioner.
  • he can also take the role of a virtual sports trainer allowing the practitioner to develop his practice to a level of extreme mastery.
  • the invention is also in certain aspects a tool for sports improvement.
  • the step of calculating a plurality of descriptors of the characteristic points comprises a calculation of a geometric relationship value between characteristic points and at least part of said descriptors of the characteristic points corresponds to said geometric relationship value calculated between points characteristics. This allows for improved characterization of movement.
  • the calculation step comprises a calculation of geometric relationship values between characteristic points and a calculation of a value for the evolution of the geometric relationship values of the characteristic points between two preselected images and in that at least part of said descriptors of the characteristic points corresponds to said value of evolution of the values of geometric relation of the characteristic points between two preselected images.
  • the preselection comprises the following sub-steps: o Generation of at least one enclosing shape on a plurality of images, each of the enclosing shapes corresponding to the same moving entity and being characterized by dimension values; Comparison of the values of dimensions of enclosing shapes generated for two different images so as to identify markers of action between enclosing shapes, said markers of action corresponding to modifications of the values of dimensions of the enclosing shapes between images; o Comparison of the action markers identified with reference action markers stored on the action repository, said comparison being able to be carried out by means of a model resulting from a training, said comparison making it possible to preselect, at the within the plurality of images, one or more images.
  • the comparison step can be carried out using descriptors of characteristic points from several cameras for the same instant. This helps improve characterization.
  • the confidence score can be used when generating the motion characterization index value to improve accuracy.
  • It further comprises a step of classifying the preselected image (s), said classification corresponding to the attribution of a movement category to the preselected image (s). Likewise, this step makes it possible to improve the precision during the generation of the characterization index value of a movement.
  • the reception step comprises the reception of at least two videos, preferably at least three videos, in a continuous stream, in that a characterization index value of a movement of the moving entity is generated for each of the videos and in that a consolidated index value characterizing a movement of the moving entity is generated from each of the index values characterizing a movement of the moving entity. moving entity.
  • implementations of this aspect include computer systems, apparatus, and corresponding computer programs stored on one or more computer storage devices, each configured to perform the actions of a method according to the invention.
  • a system of one or more computers can be configured to perform particular operations or actions, in particular a method according to the invention, by installing software, firmware, hardware or a combination. software, firmware or hardware installed on the system.
  • one or more computer programs can be configured to perform particular operations or actions through instructions which, when executed by a data processing apparatus, cause the apparatus to perform the actions.
  • the invention further relates to a computer program product comprising one or more instructions executable by a computing device, causing the implementation of a method of characterizing the movement of a moving entity according to the invention.
  • the invention further relates to a system for characterizing the movement of a moving entity, for example for refereeing assistance or sports training, said system comprising:
  • one or more image acquisition devices capable of transmitting a video to a computing device, preferably in a continuous stream
  • the computer device including a processor and a data memory, said data memory being configured to store a reference actions repository and a reference movement repository, said processor being configured to: pre-select one or more images within a plurality of images of the video; o Generate a plurality of characteristic points of the moving entity on the preselected image (s), said characteristic points being characterized by position values; o Calculate, from the position values of the characteristic points, a plurality of descriptors of the characteristic points for several of the preselected images; o Compare the plurality of calculated characteristic point descriptors with descriptors of reference characteristic points stored on the reference movement repository, said comparison being able to be carried out by means of a model resulting from learning; and o Generate, from the comparison of the plurality of characteristic point descriptors, a characterization index value of a movement of the moving entity.
  • the system according to the invention is based in particular, like the method, on its ability to identify, extract and analyze the position of a moving entity in any video scene and this without requiring the wearing of markers, sensors or devices. invasive device by the practitioner.
  • the system will allow to know the action that the practitioner is performing.
  • a system according to the invention can be used as assistance in sports arbitration for the purpose of better arbitration decision making. It can also be used as a sports training aid for the purpose of improving performance.
  • Figure 1 shows a schematic illustration of a method of characterizing a movement according to the invention. Steps framed by dotted lines are optional
  • FIG. 2 represents a schematic illustration of a calibration step according to one embodiment of the method for characterizing a movement.
  • FIG. 3 represents a schematic illustration of a step of preselecting one or more images according to one embodiment of the method for characterizing a movement.
  • Figure 4 shows an illustration of a preselection of one or more images within a plurality of images of a video sequence according to one embodiment of the invention.
  • Figure 5 shows an illustration of a bounding shape generation on a plurality of images according to one embodiment of the invention.
  • FIG. 6 represents an illustration of a comparison of the encompassing forms generated so as to calculate markers of action between encompassing forms according to one embodiment of the invention.
  • FIG. 7 represents several images describing different postures of a moving entity for which a plurality of characteristic points of the moving entity have been generated according to one embodiment of the method for characterizing a movement.
  • FIG. 8 represents a schematic illustration of a step of calculating a plurality of descriptors of characteristic points according to one embodiment of the method for characterizing a movement.
  • FIG. 9 represents two sets of characteristic points (disks) of the same moving entity, some of the characteristic points being connected by segments, each of the sets being respectively associated with an image which differs from the other image in particular by the acquisition time T1, T2.
  • FIG. 9 further shows descriptors of the characteristic points.
  • FIG. 10 represents several images describing an action presenting different postures of two moving entities for which a plurality of characteristic points have been generated according to one embodiment of the method for characterizing a movement.
  • Figure 11A shows a diagram of a movement characterization system according to one embodiment of the invention.
  • Figure 11B shows a diagram of a movement characterization system according to one embodiment of the invention.
  • each block in the flowcharts or block diagrams may represent a system, device, module or code, which comprises one or more executable instructions for implementing the specified logic function (s).
  • the functions associated with the blocks may appear in a different order than that shown in the figures. For example, two blocks shown in succession may, in fact, be executed substantially simultaneously, or the blocks may sometimes be executed in reverse order, depending on the functionality involved.
  • the expression "characterization of a movement” may correspond to the meaning of the invention, to the qualification of a movement carried out by a moving entity.
  • it can correspond to the identification of a movement or an action performed by a moving entity.
  • this could correspond to the identification of the following actions: Feint, Lunge, Balestra, Tackle, Croc-en-leg, Repetition, and Lift.
  • the characterization of a movement may include quantification. That is to say the calculation of a conformity value of a movement identified in a sequence of selected images to a reference movement whose characteristics have been previously recorded.
  • the present invention can allow the determination of a probability of occurrence of a predetermined movement and in particular the determination of the correct execution of a movement.
  • movement characterization index value within the meaning of the invention corresponds to a value, for example a score, a category, a classification or a score attributed to a movement of a moving entity.
  • the present invention makes it possible to obtain a value representative of the movement and this index value can be generated on the basis of numerous scales of different sizes (eg 1, 5, 10, 100) linear or not, numerical or not. .
  • the characterization index of a movement attributed during the implementation of the present invention can also make it possible to assign a moving entity or preferably an action (ie a movement) to a group, for example via a rule of thumb. decision.
  • the characterization according to the invention can be carried out in particular by the implementation of a scoring algorithm generated from a statistical learning or partitioning method.
  • the expression “characterization of a movement” may correspond, within the meaning of the invention, to the qualification of a movement carried out by a moving entity.
  • this can correspond to the identification of a movement or of an action carried out by a moving entity.
  • this may correspond to the identification of the following actions: Feint, Lunge, Balestra, Tackle, Croc-en-leg, Repetition, and Lift.
  • the characterization of a movement can include a quantification. That is to say the calculation of a value of conformity of a movement identified in a sequence of images selected with a reference movement whose characteristics have been previously recorded.
  • the present invention can allow the determination of a probability of occurrence of a predetermined movement and in particular the determination of the correct execution of a movement.
  • the expression “movement characterization index value” within the meaning of the invention corresponds to a value, for example a score, a category, a classification or a score attributed to a movement of a moving entity.
  • the present invention makes it possible to obtain a value representative of the movement and this index value can be generated on the basis of numerous scales of different sizes (eg 1, 5, 10, 100) linear or not, numerical or not. .
  • the characterization index of a movement attributed during the implementation of the present invention can also make it possible to assign a moving entity or preferably an action (ie a movement) to a group, for example via a rule of thumb. decision.
  • the characterization according to the invention can be carried out in particular by the implementation of a scoring algorithm generated from a statistical learning or partitioning method.
  • joint node within the meaning of the invention corresponds to a position at which at least two elements of an assembly join.
  • a joint node can correspond to a joint of a living being.
  • position value of a characteristic point within the meaning of the invention corresponds for example to the pixel position values of a characteristic point on an image. This position can also be expressed in a new frame of reference that disregards other information in the image.
  • the expression “descriptor of the characteristic points” within the meaning of the invention can correspond to a geometric relation value between the positions of at least two characteristic points of a moving entity or the positions of segments, each connecting at least two. characteristic points of a moving entity. In this case, it corresponds in particular to intra-entity moving position descriptors.It can also correspond to a geometric relationship between the positions of at least two characteristic points of two different moving entities or the positions of segments, each connecting at least two characteristic points of two different moving entities. In addition, a position descriptor can correspond to a combination of mathematical transformations.
  • a position descriptor can in particular correspond to: a distance value between two characteristic points, a value of an angle formed by two segments each connecting at least two characteristic points, an area value formed by segments connecting at least three characteristic points, a value of the derivative of revolution of a distance between two characteristic points, a value of the evolution of a distance between two characteristic points over time, or a value of the ratio between two distances .
  • action marker within the meaning of the invention can correspond to a mathematical relationship between dimension values of enclosing shapes of a moving entity originating from different images.
  • an action marker can correspond to a combination of mathematical transformations.
  • an action marker can in particular correspond to: a change in the aspect ratio value of a bounding shape over time, the derivative of the change in the aspect ratio value of an enclosing shape, the evolution of a height of an enclosing shape over time, or a ratio between two aspect ratio values of an enclosing shape between successive images.
  • continuous stream within the meaning of the invention corresponds to the reading or analysis of a video or audio and video audio stream as it is generated by an image acquisition device. This is in contrast to playing or analyzing files which requires you to retrieve all of the data from a video before it can be analyzed.
  • encompassing shape within the meaning of the invention corresponds to a box or a mask making it possible to encompass the representation of the entity in motion on an image and taking for example the shape of one or more polygons, or one or more ellipses.
  • plural within the meaning of the invention corresponds to at least two. Preferably this may correspond to at least three, more preferably at least five and even more preferably at least ten.
  • learning within the meaning of the invention corresponds to a method designed to define a function f making it possible to calculate a value of Y from a base of n labeled observations (X1 ... n, Y1 ... n ) or not labeled (X1 ... n). Learning can be said to be supervised when it is based on labeled observations and unsupervised when it is based on unlabeled observations. In the context of the present invention, learning is advantageously used for the calibration of the method and therefore its adaptation to a particular application such as a given sporting activity.
  • model or “rule” or “notation algorithm” it is necessary to understand within the meaning of the invention a finite series of operations or instructions making it possible to characterize a movement, that is to say to classify one or more movements (or actions) of a moving entity within previously defined groups Y, and in particular to assign a score or to prioritize one or more categories of movement with respect to a movement of a moving entity.
  • the implementation of this finite series of operations makes it possible, for example, to assign a label Yo to an observation described by a set of Xo characteristics thanks for example to the implementation of a function f capable of reproducing Y having observed X.
  • operations refer to actions and / or processes of a data processing system, for example a computer system or an electronic computing device, which manipulates and transforms the data represented as physical (electronic ) in computer system memories or other information storage, transmission or display devices. These operations can be based on applications or software.
  • sample program code may include, but are not limited to, a subroutine, function, executable application, source code, object code, library, and / or any other sequence of instructions designed for the purpose. execution on a computer system.
  • processor is understood to mean at least one hardware circuit configured to perform operations according to instructions contained in a code.
  • the hardware circuit can be an integrated circuit. Examples of a processor include, but are not limited to, a central processing unit, a graphics processor, an application specific integrated circuit (ASIC), and a programmable logic circuit.
  • ASIC application specific integrated circuit
  • Coupled is meant, within the meaning of the invention, connected, directly or indirectly with one or more intermediate elements. Two elements can be mechanically coupled, electrically coupled or linked by a communication channel.
  • man-machine interface within the meaning of the invention corresponds to any element allowing a human being to communicate with a particular computer and without this list being exhaustive, a keyboard and means allowing in response to the commands entered using the keyboard to display and optionally select items displayed on the screen using the mouse or a touchpad.
  • a screen touch screen allowing the elements touched by the finger or an object to be selected directly on the screen and possibly with the possibility of displaying a virtual keyboard.
  • connected object within the meaning of the invention corresponds to an electronic object connected, by a wired or wireless connection, to a data transport network, so that the connected object can share data with a other connected object, a server, a fixed or mobile computer, an electronic tablet, a smartphone or any other device connected to a given network.
  • connected objects can be, for example, tablets, intelligent lighting devices, industrial tools or even smartphones.
  • the inventors have developed a system and a method for characterizing a movement of a moving entity, passing through the generation of a movement characterization index value, exhibiting a high level of recognition and speed of processing allowing analysis in real time.
  • the system and the method for characterizing a movement of a moving entity according to the invention will have good specificity and sensitivity, possibly with a specificity greater than the sensitivity. Indeed, although the sensitivity is Importantly, specificity is even more important because it indicates the ability not to over-solicit users.
  • the present invention relates in particular to a method 1 for characterizing a movement of a moving entity.
  • the moving entity can advantageously be a living being in movement.
  • the living being can be a human but more broadly an animal.
  • the living being can be a human but also an animal such as a horse.
  • the characterization of a movement can correspond to the characterization of the execution of a movement.
  • this can correspond to the determination of a good, or a bad, execution of a movement by a moving entity 9 in particular with respect to a frame of reference comprising the characteristics of a correctly executed movement.
  • a plurality of images of a video is preferably received in a continuous stream.
  • Continuous monitoring corresponds, for example, to reception of images carried out at a frequency less than or equal to one second, preferably less than or equal to 500 ms.
  • the images are for their part generated, for example, at a frequency of at least 50 Hz, preferably at least 70 Hz.
  • a method according to the invention preferably makes it possible to generate a movement characterization index value within a period of time. less than or equal to five seconds, more preferably less than or equal to two seconds, even more preferably less than or equal to one second.
  • a method 1 for characterizing a movement of a moving entity according to the invention can be implemented by a system 2 comprising a computer device 10 including a processor 11 and a data memory 12.
  • the data memory is configured to store a repository of reference actions 12a and a repository of reference movements 12b.
  • a method 1 for characterizing a movement of a moving entity comprises the steps of: reception 300 of a video, pre-selection 400 of one or more images at the within a plurality of images of the video, generation 500 of a plurality of characteristic points of the moving entity on the preselected image (s), calculation 600 of a plurality of descriptors of the characteristic points for several of the preselected images , comparison 700 of the plurality of descriptors of the characteristic points calculated with descriptors of reference characteristic points and generation 800 of a characterization index value of a movement of a moving entity 9.
  • a method 1 for characterizing a movement of a moving entity may comprise the steps of calibrating 100 of the models and frames of reference used, of processing 200 of a plurality of images of the video, and transmission 900 of an alert if the characterization index value of a movement of a moving entity exceeds a predetermined threshold.
  • the present invention may include a calibration procedure 100 of the models and / or frames of reference used in the context of method 1 for characterizing a movement.
  • a calibration according to one embodiment is in particular illustrated in FIG. 2.
  • the calibration procedure 100 may include a training step 110 for a model that can be used for the comparison of the action markers identified with reference action markers, a training step 120 of a model that can be used. for the comparison 700 of a plurality of descriptors of the calculated characteristic points with descriptors of the reference characteristic points and a customization step 130 of the previously generated models.
  • the calibration procedure 100 comprises supervised and / or unsupervised learning steps based on values generated from a sequence of images representing at least one movement of a moving entity.
  • the reference values could be particularly adapted to a typology of entity in movement and / or of actions followed by the method and / or the device according to the invention.
  • the calibration procedure 100 can begin with a preprocessing of the values of the descriptors of the characteristic points so as to facilitate their subsequent use.
  • Preprocessing according to the invention may for example include: data normalization, resampling and / or data aggregation.
  • Such a pre-processing could also be implemented before the steps of comparison 420 of the dimension values of the encompassing shapes and of comparison 700 of the plurality of descriptors of the calculated characteristic points.
  • step 110 advantageously relates to training a model for the comparison of the action markers identified with reference action markers.
  • This training can be carried out directly on one or more categorized images and therefore associated with a particular action.
  • the model can in particular be stored on the repository 12a of reference shares. As will be detailed below, such a comparison makes it possible to preselect, within the plurality of images, one or more images 431 which will be the subject of further processing.
  • step 120 advantageously relates to training a model for the comparison of a plurality of descriptors of the characteristic points calculated with descriptors of the reference characteristic points.
  • This training can be carried out directly on a selection of categorized images and therefore associated with a particular action.
  • the model can in particular be stored on the repository 12b of reference movements.
  • the model used can in particular be a model of a neural network, for example of the Perceptron type, acyclic multilayer or multilayer Perceptron.
  • the model used is an ADALINE or a Cauchy machine.
  • the calibration procedure 100 of the models and / or repositories may include a step 130 of customizing the models.
  • a step may in particular include the transmission to the computing device according to the invention of a sequence of images relating to the performance of an action by a moving entity. This could for example correspond to a video capture of a feint made by an Olympic or world champion.
  • Step 130 can then advantageously comprise a generation of action markers which can be recorded as reference action markers for the selection of a. or several images within the framework of the method in addition to the other reference data.
  • step 130 may include a generation of characteristic points and the calculation of a plurality of descriptors of the characteristic points which can advantageously be recorded as descriptors of the reference characteristic points. These new descriptors of the characteristic reference points could be used to generate an index of movement characterization of the moving entity in relation to an Olympic or world champion.
  • the step of training a model for comparing action markers according to the invention can implement an unsupervised learning method.
  • the unsupervised learning method can be based on a notion of proximity.
  • an unsupervised learning method implemented during the pre-selection step 400 of one or more images may for example include an unsupervised classification, a density calculation or the search for the most. close neighbors.
  • unsupervised classification allows data to be grouped into groups of different densities, the points of a small group generally correspond to images of interest to be preselected.
  • a method according to the invention could include calculating the distance between the action markers of the different images and forming groups. If some images are far from all other points then these images can be preselected.
  • the calculation of the density can for example correspond to the algorithms of the type LOF (“Local Outlier Factor” in English terminology), GLO (“Global-Local Outlier” in English terminology) or DBSVM “Density Based Support Vector Machines” in English terminology) .
  • the calculation of the density can comprise the calculation, for each point, of a density of its local neighborhood (k) then the calculation of a local exceedance factor of a sample p as the average of the ratios of the density of the sample p and the density of its closest neighbors. The abnormal values are then points with the greatest local overshoot factor value.
  • a characterization method according to the invention can also implement supervised approaches for the preselection of one or more images.
  • a preselection step 400 or a comparison step 700 according to the invention may include the implementation of a supervised learning method.
  • neural networks, classification trees, nearest neighbor search or regression trees are among the most robust and efficient machine learning techniques in the context of a method according to the invention.
  • the method preferably comprises a preliminary step of receiving labeled images or more preferably labeled action markers.
  • a method according to the invention can, for example, use predetermined threshold values or predetermined patterns.
  • the reference values can then be predetermined thresholds and for example entered by an operator via a graphical interface.
  • a method 1 for characterizing a movement according to the invention may include processing 200 of a plurality of images of a video, also called processing 200 video.
  • the processing 200 of a plurality of images of a video can be carried out before a step of reception 300 of a video by a computer device 10.
  • the video processing 200 can be produced by the video acquisition device (eg camera) or by a processing device placed between the video acquisition device (s) used in the context of the invention and the computer device 10.
  • a method 1 according to the invention can comprise a video processing 200 after the step of reception 300 of a video by a computing device 10.
  • the video processing 200 can be carried out by the computing device. 10.
  • the step 200 of processing a plurality of images of the video can correspond to a great diversity of transformation of the images so as to facilitate their subsequent exploitation.
  • the video processing step 200 can for example comprise: a transformation of color space, a transition to gray level, a normalization of the contrast effects, a normalization of the luminosity effects, a gamma correction, a cropping and / or a resizing.
  • a method 1 for characterizing a movement comprises a step 300 for receiving a video. It is for example a computer device 10 which will receive the video (s).
  • the video received corresponds to a continuous video stream.
  • the present invention allows rapid processing of images and the characterization of movement in less than a few seconds. Thus, it is particularly suitable for a continuous video stream and in real time.
  • the method may include receiving several videos and preferably several continuous video streams.
  • a video acquisition device such as a camera will be able to capture a sequence 401 of images or a plurality of images, said image sequence 401 being composed of several images 431.
  • the video may correspond to a continuous video stream which is transferred to the computing device 10 in real time or in deferred mode.
  • the video may correspond to stored image data stored and then analyzed.
  • a method 1 for characterizing a movement comprises a step 400 of preselecting one or more images within a plurality of images 401 of the video. It is in particular the processor 11 of a computing device 10 which can be configured to perform such a step.
  • the step 400 of pre-selecting one or more images is in particular intended to select from among the plurality of images of a video, the images referring to a movement of particular interest.
  • the method instead of implementing the subsequent steps of the method on all the images of the video, the method will be able to apply these steps only to part of the images.
  • the images are then preferably preselected according to their content and in particular, as will be described later, the evolution of the moving entity in the plurality of images.
  • a method 1 according to the invention included an identification of a predetermined action carried out by a moving entity 9.
  • identification can correspond to the calculation.
  • a method in accordance with the invention does not include comparison of an image or of an image portion with a collection of images.
  • the method according to the invention comprises in particular the generation 410 of at least one enclosing form 411, 411a, 411b, described in connection with FIG. 4, on a plurality of images .
  • the generation of a bounding shape can correspond to the identification of an outline or of a shape or more broadly to the identification of geometry data of a moving entity 9.
  • This generation step 410 of at least a bounding shape can be repeated for several different moving entities 9.
  • FIG. 4 illustrates in particular a series of images comprising two moving entities 9a, 9b and FIG. 5 shows a generation of at least one enclosing shape 411 a, 411 b on a sequence of images.
  • the method according to the invention will allow the automatic selection of a moving entity 9 (for example in FIG. 4, a fencer 9a on the left and a fencer 9b on the right).
  • a conventional method may for example consist in carrying out a tracking based on the movement of the moving entity by comparing two successive images. Identification of a moving entity could be done manually using a touch screen or other input method in which an object of interest is selected. However, the moving entity is preferably identified automatically.
  • Bounding shapes can be characterized by dimension values.
  • the particular dimensions that can be studied will be dependent on the geometric shape of the enclosing shape.
  • a polygon such as a rectangle could be characterized by a height value and a width value; an ellipse or an assembly of ellipses can be defined by a directing line and values of focus and eccentricity.
  • the generation 410 of one or more enclosing shapes is preferably associated with the calculation of dimension values.
  • the dimension values can for example correspond to a length, width, circumference, angle, volume value.
  • the dimension values can also correspond to a ratio between two dimensions such as for example a ratio between a height and a width.
  • the enclosing shapes can be characterized by a unique identifier shared for all the representations of the same moving entity over the images of a sequence.
  • the encompassing shapes can correspond to the same moving entity 9 represented on different images.
  • the same image from a video can include several moving entities. Additionally, it may not be possible to generate a bounding shape on one of the images. In this case the image can be deleted from the set of processed images.
  • the present invention advantageously further comprises characterizing the change in the geometry of an enclosing shape over a sequence of images and comparing it to a predetermined change in the geometry of an enclosing shape.
  • the inventors have determined that beyond the displacement of the encompassing shape, it is the evolution of its geometry over time and the comparison of this evolution with predetermined evolutions of geometry which makes it possible to obtain the best results. .
  • the method can comprise a comparison 420 of the dimension values of encompassing shapes generated for two different images.
  • the invention is particularly interested in an action performed by a moving entity 9.
  • Such an action can be detected as a function of an evolution of the moving entity 9 over time. This can in particular involve a comparison of the position of the moving entity 9, in particular of the encompassing shapes of this moving entity 9 and more particularly of the dimension values of these encompassing shapes, between two images taken at different times. (eg two successive images whose acquisition time is shifted by a few tens of milliseconds).
  • FIG. 6 illustrates, for example, the evolution of the dimensions of two encompassing shapes 411a, 411b, associated with the fencers on the left 9a and on the right 9b, over the images 401b, 401c, 401 d, 401e taken successively. These dimensions are in particular the width and height of the enclosing shapes. The width and height values of bounding shapes can be used to calculate an aspect ratio value.
  • Table 1 shows the values of a dimension of the enclosing shapes 411 a and 411 b as a function of the images. It also presents reference values for dimensions of bounding shapes that can be used in addition to reference action markers when preselecting images.
  • Table 1 shows that the right fencing entity 9b could perform an action of interest given that on two images 401 d, 401e, the aspect ratio value goes beyond a predetermined threshold (Value reference).
  • the comparison 420 of the dimension values can make it possible to calculate action markers between enclosing shapes, said action markers corresponding in particular to changes in the dimension values of the enclosing shapes between images.
  • the method can then include a comparison 430 of the identified action markers with patterns of reference action markers stored on the actions repository 12a.
  • FIG. 6 illustrates in particular the comparison of the dimension values of the enclosing shape 411b between the images 401c and 401 d so as to calculate an action marker 421. It also illustrates the comparison of the dimension values of the enclosing shape 411b between images 401 c and 401 e so as to calculate an action marker 422.
  • an action marker can for example correspond to a change in an aspect ratio and more particularly the ratio between the aspect ratio of a bounding shape on a first image 401 d and the aspect ratio of this enclosing shape on a second image 401 c.
  • Table 2 shows that the right fencing entity 9b could perform an action of interest given that the change in the aspect ratio between the images 401c and 401 d then 401c and 401 e has a value ranging from- beyond a predetermined threshold (Reference value).
  • the comparison step 430 can also take into account, in addition, external data such as a soundtrack.
  • the comparison can be carried out from databases recorded for example on one or more flat files.
  • the comparison 430 can be carried out by means of a model resulting from a training.
  • the models detailed in particular during the description of the calibration step 100 are suitable.
  • the preselection step 400 comprises a calculation of a mathematical relation value between the dimension values of enclosing shapes of the same image and at least part of the action markers corresponds to this mathematical relation value between the dimension values of enclosing shapes of the same image.
  • the preselection step 400 comprises a calculation of a mathematical relationship value between the dimension values of the same enclosing shape originating from two different images and at least part of the action markers corresponds to this value of. mathematical relation between the dimension values of the same enclosing shape coming from two different images.
  • the preselection step 400 can comprise a calculation of a value of mathematical relation between the dimension values of the same enclosing shape coming from two different images and a calculation of a value of evolution of this value of. mathematical relationship between the dimension values of the same enclosing shape originating from two different images and in that at least part of said descriptors of the characteristic points 501 corresponds to this evolution value.
  • the comparison 430 makes it possible to preselect, within the plurality of images, one or more images 431.
  • the method according to the invention may include a classification step 440 of the preselected image (s).
  • the classification corresponds in particular to the attribution of an action (or movement) category to the preselected image (s).
  • a method according to the invention may include the calculation of similarity scores of the images preselected with several categories of action (or movement).
  • the comparison of the similarity scores with one another for the same image and possibly with a predetermined similarity score threshold, can make it possible to attribute an action (or movement) category to several, preferably each, of the preselected images.
  • the method according to the invention comprises a step of determining a category of action (or movement) for preselected images.
  • these images can be associated with a particular action and their subsequent processing will only be more precise and faster.
  • the determined action category can then be used during the comparison 700 so as to select only descriptors of reference characteristic points associated with this action (or movement) category.
  • the determined category of action (or movement) can then be used during the calculation 600 of the descriptors of the characteristic points so as to select only descriptors suited to this category of action (or movement).
  • the method according to the invention may include a facial recognition step. Facial recognition can be carried out by various techniques of the state of the art such as that described in the documents below (KR20180079894, EP1910977, US20170193284).
  • a method according to the invention may include a step of recognizing emotions.
  • the recognition of emotions can be achieved by various techniques of the state of the art such as that described in the documents below (KR20180109227, US20190213400, WO2019 / 107641).
  • emotion recognition may involve identifying a facial expression associated with suffering.
  • the presence or absence of recognized facial data and / or recognized emotions is data that can also be used during the generation 800 of a movement characterization index value and / or during the transmission 900 an alert.
  • a method 1 for characterizing a movement comprises a step of generating 500 a plurality of characteristic points 501 of the moving entity 9 on the preselected image or images 431.
  • This is in particular the processor 11. a computer device which can be configured to perform such a step.
  • the characteristic points 501 are preferably characterized by position values, preferably on each preselected image 431.
  • FIG. 7 illustrates in particular a preselected image 431 for which characteristic points 501 of each of the moving entities 9a have been generated.
  • the characteristic points of the moving entity 9a or 9b are generally points corresponding to positions of importance in the characterization of a moving entity.
  • the characteristic points 501 of the moving entity 9a or 9b preferably correspond at least in part to joining nodes, more preferably they correspond exclusively at join nodes.
  • the invention can be implemented with characteristic points corresponding to the bone structure of an animal moving entity or else corresponding to the outer envelope of the moving entity.
  • Such joint knots can thus characterize the posture of the moving entity 9a or 9b, in particular a posture of a fencer of the "guard”, "preparation” or even “attack” type.
  • the determination of such positions, respectively associated with a preselected image 431, can make it possible to estimate the respective postures of each moving entity 9a, 9b at a given moment and allow an arbiter to determine which moving entity 9a or 9b to initiate. its action first, in particular by analyzing the passage from a posture in "guard”, to a posture in "preparation” until a posture "attack” which may result in a judgment in favor of one or the other of the moving entities 9a, 9b.
  • the present invention can find use in many fields, including sports fields, for example for aid in refereeing or aid in training.
  • the sports which can benefit from the present invention can be selected from: Boxing, Fencing, Judo, Greco-Roman wrestling, Olympic freestyle wrestling, Taekwondo, Karate, Skating, Horse riding, Canoe Kayak, Track Cycling, Football, American Football, rugby, Basketball, Baseball, Volleyball, Waterpolo, Handball, Tennis, Squash, Badminton, Frontenis, Table Tennis , Gymnastics, Synchronized swimming, and Synchronized Dance.
  • the invention could be used in the field of fencing, football, and horse riding.
  • the characteristic points are preferably characterized by an identifier unique to each join node per image and to position values on the image or on any other frame of reference.
  • the join nodes are selected, for example, from at least ten join nodes, preferably at least fifteen, more preferably seventeen join nodes.
  • the knuckle nodes can be selected among: right eye, left eye, right ear, left ear, nose, right shoulder, left shoulder, right elbow, left elbow, right wrist, left wrist, right hip, left hip, right knee , left knee, right ankle and left ankle.
  • the knuckle knots are selected from: right shoulder, left shoulder, right elbow, left elbow, right wrist, left wrist, right hip, left hip, right knee, left knee, right ankle and left ankle.
  • the position of each join node is advantageously associated with a confidence score.
  • the method according to the invention can assess whether the positioning of the characteristic points can be considered reliable or if the subsequent results obtained must be modulated by any uncertainty about the positioning of the characteristic points.
  • the method can advantageously include a step of calculating a confidence score for each join node.
  • a method 1 for characterizing a movement comprises a step of calculating 600 of a plurality of descriptors 701 of the characteristic points 501 for several of the preselected images 431.
  • This is in particular the processor 11 of a computer device. which can be configured to perform such a step.
  • it is carried out on the basis of the position values of the characteristic points 501 calculated beforehand.
  • This calculation 600 is carried out for several of the preselected images 431.
  • this calculation is carried out for each of the preselected images.
  • it can be carried out for at least two preselected images 431, preferably for at least three preselected images 431, more preferably for all the preselected images 431.
  • FIG. 8 illustrates particular sub-steps of the calculation 600 of a plurality of descriptors 701 of the characteristic points.
  • the descriptors of the most relevant and informative characteristic points about a movement may differ depending on the movement considered.
  • the calculation of these characteristic point descriptors can be preceded by a selection 610 of the most relevant descriptors to be calculated and this can in particular be carried out according to a value associated with the preselected images such as for example a category of movement.
  • this step of calculating 600 of the descriptors of the characteristic points can comprise a calculation 620 of a value of geometric relation between points characteristics and / or a calculation 630 of a value for the evolution of the values of the geometric relation of the characteristic points between two preselected images.
  • the descriptors of the characteristic points can be standardized so as to adapt to any change in the shooting.
  • a moving entity such as a fencer
  • a moving entity is defined by the position in space of characteristic points 501 at a first time T1 and at a second time T2.
  • the method according to the invention comprises in particular the calculation of the value of a plurality of descriptor of characteristic points 701a, 702a, 703a, 701b, 702b, 703b according to preferably a value of geometric relation between the characteristic points.
  • a characteristic point descriptor can correspond to the angle 702a formed by two segments associated with the moving entity, or the distance 701a between two characteristic points 501 of the moving entity or even the surface 703a of a polygon formed from characteristic points.
  • a method according to the invention can comprise a step of calculating a geometric relationship value between the characteristic points 501, preferably from the position values, and a calculation of a geometric relationship evolution value. between position values of the characteristic points 501 between two preselected images.
  • at least part of the descriptors of the characteristic points corresponds to this value of evolution of the geometric relationship between the position values of the characteristic points.
  • at least part of the descriptors of the characteristic points corresponds to this value of evolution of the values of the geometric relation of the characteristic points between two preselected images.
  • the evolution value 701 of the distance between two characteristic points 501 of the moving entity can be a descriptor of the characteristic points within the meaning of the invention.
  • at least part of said position descriptors of characteristic points 501 correspond to a value of evolution of the geometric relationship between position values of characteristic points 501 between two preselected images.
  • a method of characterizing a movement in accordance with the invention can be implemented to analyze an action in connection with a succession of images describing two entities in movement within the framework of a football match.
  • a geometric relation value between characteristic points from the position values, and a relation evolution value geometric between position values of said characteristic points, between two preselected images can be calculated.
  • the characteristic points thus selected can in particular correspond to a characteristic point of a moving entity 9a and to a characteristic point of a moving entity 9b. This can advantageously provide valuable assistance to a referee, wishing to determine whether a fault has been committed between two players.
  • the analysis of the evolution of the geometric relation of the characteristic points of two moving entities through a succession of images describing an action can make it possible to characterize that a physical contact has indeed taken place between said moving entities and thus facilitate arbitration.
  • a method 1 for characterizing a movement comprises a step 700 of comparing the plurality of calculated characteristic point descriptors with reference characteristic point descriptors. It is in particular the processor 11 of a computing device that can be configured to perform such a step. In particular, it can be carried out from the descriptors of characteristic reference points stored on the reference frame 12b of reference movements.
  • the comparison step 700 can rely on supervised or unsupervised learning methods.
  • the comparison step 700 may include the implementation of a model resulting from a supervised learning comprising the implementation of an algorithm selected from: Method of k nearest neighbors, forest of decision trees , or Support Vector Machine.
  • the comparison is carried out by means of a model resulting from training.
  • the comparison is made using a model from a "Neuronal Network Perceptron".
  • the comparison step 700 can be carried out using descriptors of characteristic points originating from several cameras for the same instant.
  • the cameras are then synchronized and / or make use of a time frame allowing only data originating from the same instant to be merged.
  • the method according to the invention can include the acquisition of video coming from different cameras filming the same scene. Several cameras can then generate different data and these data are each compared to rules and a movement can be characterized in particular by generating a movement characterization index value.
  • a method 1 for characterizing a movement comprises a step of generating 800 a value of the characterization index of a movement of a moving entity 9.
  • This is in particular the processor. 11 of a computer device which can be configured to perform such a step. In particular, it can be carried out on the basis of data originating from the comparison 700 of the plurality of descriptors of characteristic points.
  • the movement characterization index value can be generated by the model possibly used in the previous comparison step. Alternatively, it can be generated on the basis of a similarity calculation between calculated characteristic point descriptors and reference characteristic point descriptors. It can also be the result of a step of classifying the descriptors of calculated characteristic points.
  • the characterization index value of a movement may correspond to an arbitrage index value.
  • the arbitrage index value may correspond to an indication of compliance with an arbitration rule.
  • the characterization index value of a movement may correspond to a performance index value, where it corresponds to an indication of compliance with a predetermined movement.
  • the method according to the invention can be based on several videos, preferably in a continuous stream.
  • each of the videos undergoes a processing according to steps 300 to 800 then following the step of generation 800 of a value of index of characterization of a movement of a moving entity 9 for each.
  • the method comprises a step of selecting a consolidated index value for characterizing a movement of a moving entity 9 from the index values for characterizing a movement of a moving entity 9 from each of the videos.
  • a method 1 for characterizing a movement according to the invention can also include a step 900 for transmitting an alert if the value of the characterization index of a movement of a moving entity exceeds a predetermined threshold.
  • the predetermined threshold may for example have been stored in a data memory 12. This is in particular a communication module of a computer device 10 which can be configured to perform such a step.
  • the invention relates to a system 2 for characterizing a movement of a moving entity 9, for example for assistance in refereeing or sports training.
  • a local system 2 for characterizing a movement of a moving entity according to the invention is presented in particular in connection with FIG. 11 A.
  • Such a system 2 comprises one or more image acquisition devices 20, generally placed so that the field of vision of the image acquisition device 20 relative to the moving entity 9a, 9b is clear. .
  • a system 2 according to the invention can include a multitude of image acquisition devices arranged around an area capable of containing the moving entity 9a, 9b.
  • an area can be likened to a sports field in which athletes play.
  • the image acquisition devices are preferably synchronized, which makes it possible to obtain a plurality of images originating from various image acquisition devices at a given moment from the same moving entity 9a or 9b but according to different views. This advantageously allows a more precise analysis of the movement performed by the moving entity 9a or 9b.
  • a system according to the invention also includes a computing device 10 including a processor 11 suitable for processing and analyzing high resolution images. Said processor performs various arithmetic commands or operations and implements various functions by executing an operating system or program instructions stored in a data memory 12.
  • a computer device 10 can include a graphics processing unit for performing image processing.
  • the data memory 12 is configured to store a repository 12a of reference actions.
  • a repository 12a can comprise a plurality of reference images comprising descriptors of characteristic points associated with labeled actions, each label corresponding to a given action.
  • An action may in particular correspond to a specific position of an entity in motion within a given framework, in particular a reference framework 12a of reference actions may be associated with a particular discipline.
  • a discipline such as, by way of non-limiting example, fencing, football or even horse riding, can comprise a multitude of reference images comprising descriptors of characteristic points associated with a moving entity 9a , 9b for each determined action.
  • the moving entity can correspond to a fencer performing different actions, such as for example a simple attack of the forehand type, relief, cut, or of a compound attack of type one-two, feint of the forehand relief, doubling, turn of the sword, or else d 'a simple or compound response.
  • the moving entity may correspond to a footballer performing different actions, such as for example a tackle, a pass, a shot, a touch, a defensive or offensive action.
  • the data memory can further include a repository 12b of reference movements.
  • a repository 12b of reference movements can include a plurality of reference images comprising descriptors of characteristic points associated with a movement performed by a moving entity.
  • the image acquisition device 20 is coupled to the computing device 10 and transmits thereto a plurality of images 401 which will be processed by the processor 11.
  • the image acquisition device 20 and the computing device 10 may be coupled, that is to say communicating using any known communication device, wirelessly, or using a wired communication bus suitable for the transmission of a large stream of images or of a video to a computing device 10, preferably according to a continuous flow of images.
  • the processor of the computing device 10 is advantageously configured to perform various commands or arithmetic operations, in particular the processor 11 is configured to preselect, from the plurality of images 401 received, one or more images 431.
  • the images are then preferably preselected according to their content and in particular, the evolution of the moving entity in the plurality of images.
  • the preselected images, to be identified must correspond to a sequence of images describing a given movement of the moving entity.
  • Such an identification can correspond to the calculation of an action marker (ie of movement) of a moving entity 9 in the plurality of images received and its comparison with a predetermined action marker (ie of movement) (eg reference). This makes it possible to select only a sequence of images corresponding to a given movement, said movement possibly relating to a specific action.
  • the processor is advantageously configured to generate, from the preselected images, a plurality of characteristic points 501 of the moving entity 9 characterized by position values.
  • the characteristic points of the moving entity are generally points corresponding to positions of importance in the characterization of a moving entity and can correspond to join nodes.
  • a system according to the invention can assess whether the positioning of the characteristic points can be considered reliable or if the subsequent results obtained must be modulated by a possible uncertainty on the positioning of the characteristic points.
  • the processor of a computer device 10 is configured to calculate, from the position values of the characteristic points 501, a plurality of descriptors of the characteristic points 501 for several of the preselected images 431. This advantageously makes it possible to reconstruct the movement performed. by an entity in motion from revolution of the value of the characteristic point descriptors of each image at different times.
  • the processor is configured to compare the plurality of calculated characteristic point descriptors with reference characteristic point descriptors stored on the reference frame 12b of reference movements. Such a comparison can be made through a model resulting from supervised or unsupervised learning.
  • the processor is also configured to generate, from the comparison of the plurality of descriptors of characteristic points, a characterization index value of a movement of the moving entity 9a, 9b. This value makes it possible to provide information relating to the realization of the previously identified movement. Such an achievement may be deemed non-compliant following the comparison with the benchmark 12b of reference movements and thus provide decision support, particularly in the context of sports arbitration in connection with a sanction, or even in the context of the sports judge. in connection with the attribution of a score following a performance carried out by an athlete.
  • a system 2 for characterizing a movement of a moving entity according to the invention can be accessible via a suitable communication network, such as in particular an Internet network.
  • a suitable communication network such as in particular an Internet network.
  • Such a remote system 2 comprises one or more image acquisition devices 20 as described in connection with FIG. 11 A.
  • a remote system 2 in accordance with the invention also comprises a computer device 10 including a processor 11 suitable for processing and analyzing high-resolution images, a data memory 12, storing a repository 12a of reference actions and a repository 12b of reference movements as described previously in connection with FIG. 11A.
  • a computer device 10 including a processor 11 suitable for processing and analyzing high-resolution images, a data memory 12, storing a repository 12a of reference actions and a repository 12b of reference movements as described previously in connection with FIG. 11A.
  • Said remote system further comprises an authentication module 13 comprising an identifier as well as an authentication key, allowing said computer device 10 to connect to a remote computer server, via a communication network, for store or use data, in particular one or more images captured by the image acquisition devices 20.
  • an authentication module 13 comprising an identifier as well as an authentication key, allowing said computer device 10 to connect to a remote computer server, via a communication network, for store or use data, in particular one or more images captured by the image acquisition devices 20.
  • the authentication module 13 can, from a suitable communication network, connect to said remote computer server by means of an authentication mechanism including, advantageously but not limited to, the identification of a correspondence between the identifier and the authentication key of a computing device 10 and user and / or computing device identification information and corresponding authentication keys stored in a database of the remote computer server .
  • identification can, in the case of the identification of a user, be done by means of a suitable user interface, in particular in the form of web pages which the user can access by using a connected computing device. to a suitable communication network and using a web browser.
  • the user identifies himself through said web page by entering in corresponding fields an identifier and an authentication key, such as a password. .
  • the image acquisition device 20 is coupled to the computing device 10 and transmits thereto a plurality of images 401 which will be processed by the processor 11.
  • the image acquisition device 20 and the computing device 10 may be coupled, that is to say communicating using any known communication device, wirelessly, or using a wired communication bus suitable for the transmission of a large stream of images or of a video to a computing device 10, preferably according to a continuous flow of images.
  • the computer device 10 will thus be able either to access the remote computer server to process and analyze the images stored therein, or to store them directly after having carried out various commands or arithmetic operations as previously described.
  • a user client 5 in particular a tablet handled by an arbitrator, will be able to access the remote computer server in real time via the computer device 10 or else any suitable device comprising a user interface and hardware and software resources allowing the access to a communication network such as the Internet, and consult the data generated by the implementation of a method for characterizing a movement of a moving entity according to the invention.

Abstract

L'invention porte sur un procédé (1) de caractérisation d'un mouvement d'une entité en mouvement, mis en œuvre par un système (2) comportant un dispositif informatique (10) incluant un processeur (11) et une mémoire (12) de données configurée pour stocker un référentiel (12a) d'actions de référence et de mouvements (12b) de référence, ledit procédé comportant les étapes suivantes : - Réception (300) d'une vidéo; - Pré-sélection (400) d'une ou de plusieurs images (431); - Génération (500) d'une pluralité de points caractéristiques (501) de l'entité en mouvement (9); - Calcul (600) d'une pluralité de descripteurs des points caractéristiques (501); - Comparaison (700) de la pluralité de descripteurs de points caractéristiques à des descripteurs de points caractéristiques de référence; et - Génération (800) à partir de la comparaison (700) de la pluralité de descripteurs de points caractéristiques, d'une valeur d'indice de caractérisation d'un mouvement de l'entité en mouvement.

Description

PROCEDE ET SYSTEME DE CARACTERISATION D’UN MOUVEMENT D’UNE ENTITE EN
MOUVEMENT
L’invention s’intéresse au domaine de l’analyse en temps réel d’images, et plus particulièrement à l’analyse d’images pour la caractérisation de mouvements ou d’actions, pouvant être utilisée notamment dans l’aide à l’arbitrage ou l’entrainement sportif. L’invention concerne un procédé de caractérisation d’un mouvement d’une entité en mouvement et un système de caractérisation d’un mouvement d’une entité en mouvement. rArt antérieur!
Le sport, dont l’on retrouve les racines à toute époque depuis l’Egypte antique et la Grèce jusqu’à nos jours en passant par l’époque médiévale est lui aussi impacté par les efforts de digitalisation de la société.
Ainsi, le monde du sport est en évolution depuis de nombreuses années maintenant avec l’introduction de technologies de plus en plus sophistiquées pour aider l’arbitre ou mesurer les performances sportives. Par exemple, dans le domaine du football, a été introduit en 2014, pour la première fois en compétition mondiale, la technologie sur la ligne de but permettant de confirmer ou non le franchissement d’une ligne de but à partir d’analyse de données vidéo. En 2018, c’est au tour de l’assistance vidéo à l'arbitrage d’être intégrée en Coupe du monde. En escrime, une telle technologie a été introduite depuis bien des années avec une introduction progressive dans les compétitions depuis 2005.
Ces technologies sont très utiles car elles peuvent palier aux capacités de l’œil et du cerveau d’un humain qui, dans certains cas et malgré la pratique, sont susceptibles d’être dépassées par la rapidité d’exécution de certains enchaînements.
Néanmoins, de telles technologies nécessitent des visionnages longs et répétitifs qui peuvent casser le rythme d’un affrontement ou d’une performance et réduire l’intensité du spectacle offert. Ainsi, il existe un besoin pour des technologies capables de venir en assistance à un arbitre ou à un sportif de façon à déterminer l’occurrence de mouvements spécifiques. L'estimation de la pose ou la capture d’un mouvement est un problème complexe en vision par ordinateur pour lequel il n’existe toujours pas de solution universelle satisfaisante. De plus, au-delà de l’estimation de la pose, dans ce contexte il est nécessaire de déterminer une action, c’est-à-dire un mouvement et non une « pose ». Il existe des analyses de posture mais les analyses de mouvement sont plus rares. Or, c’est le mouvement qui sera le plus critique dans la pratique sportive. A cause de cela, de nombreux systèmes de capture de mouvement actuellement disponibles dans le commerce utilisent généralement des marqueurs optiques placés sur tout le corps pour suivre le mouvement dans le temps. Ces systèmes sont très précis et peuvent capturer toutes sortes de postures corporelles ainsi que des expressions faciales. Cependant, ils sont invasifs et travaillent dans un environnement contrôlé. Par conséquent, ils ne conviennent pas à toutes les applications notamment à une application sportive généraliste.
Les méthodes de capture de mouvement sans marqueur ont beaucoup retenu l'attention au cours de la dernière décennie. Néanmoins, ces méthodes, souvent basées sur une caméra, font face à des problèmes de reconstruction de pose (ou capture de mouvement) dus à l’utilisation de scènes haute résolution contenant beaucoup de détails et dont le traitement informatique est ralenti. Par exemple, la demande de brevet EP3528207 présente une méthode d’analyse d’un mouvement d’un gymnaste sur un saut de cheval basé sur l’identification d’une pluralité de nœud de jointure dans une série d’images puis sur la comparaison de la position de ces nœuds de jointure au fil des images. Une telle méthode peut être utile dans le cas où la prise de vue de la caméra reste immobile. Néanmoins, dès que la position de prise de vue de la caméra est modifiée, une telle méthode s’avère inutilisable. En outre, en l’absence de sélection préalable des images, le temps de traitement peut s’avérer significativement allongé.
Il existe aussi des moyens d’acquisition vidéo en 3D mais ces derniers sont très coûteux et nécessitent du personnel hautement qualifié pour utiliser ces systèmes. Il existe aussi des capteurs placés sur le corps de sportif mais ceux-ci ne peuvent pas être utilisés en compétition et ils peuvent gêner le mouvement des sportifs lors des entraînements.
La pratique courante des sportifs tend à une quantification de plus en plus extensive de la pratique et des performances du sportif. Ainsi, il existe un besoin pour un système permettant de caractériser en temps réel un mouvement et en particulier la performance d’un sportif. rProblème technique!
L’invention a donc pour but de remédier aux inconvénients de l’art antérieur. En particulier, l’invention a pour but de proposer un procédé de caractérisation d’un mouvement d’une entité en mouvement, ledit procédé étant rapide à mettre en oeuvre de façon à pouvoir être utilisé en temps réel, sur des prises de vue provenant de caméra mobile ou fixe, et permettant d’identifier un mouvement avec une sensibilité et une spécificité élevée en un temps réduit. En outre, un procédé conforme à l’invention permet de se passer de marqueurs portés par les entités en mouvement étudiées. L’invention a en outre pour but de proposer un système de caractérisation d’un mouvement d’une entité en mouvement, ledit système pouvant se baser sur une ou plusieurs caméras et ne nécessitant pas le recours à des capteurs portés par les entités en mouvement étudiées.
G B rêve description de l’inventionl
A cet effet, l’invention porte sur un procédé de caractérisation d’un mouvement d’une entité en mouvement, par exemple pour de l’aide à l’arbitrage ou l’entrainement sportif, ledit procédé étant mis en oeuvre par un système comportant un dispositif informatique incluant un processeur et une mémoire de données, ladite mémoire de donnée étant configurée pour stocker un référentiel d’actions de référence et un référentiel de mouvements de référence, ledit procédé comportant les étapes suivantes :
- Réception, par le dispositif informatique, d’une vidéo, de préférence en flux continu ;
- Pré-sélection, par le processeur, d’une ou de plusieurs images au sein d’une pluralité d’images de la vidéo ;
- Génération, par le processeur, d’une pluralité de points caractéristiques de l’entité en mouvement sur la ou les images présélectionnées, lesdits points caractéristiques étant caractérisés par des valeurs de position ;
- Calcul, par le processeur et à partir des valeurs de position des points caractéristiques, d’une pluralité de descripteurs des points caractéristiques pour plusieurs des images présélectionnées ;
- Comparaison, par le processeur, de la pluralité de descripteurs de points caractéristiques calculés à des descripteurs de points caractéristiques de référence mémorisés sur le référentiel de mouvements de référence, ladite comparaison pouvant être réalisée par l’intermédiaire d’un modèle issu d’un apprentissage ; et
- Génération, par le processeur et à partir de la comparaison de la pluralité de descripteurs de points caractéristiques, d’une valeur d’indice de caractérisation d’un mouvement de l’entité en mouvement.
Un tel procédé permet de part cette succession d’étapes de caractériser le mouvement d’une entité en mouvement et de lui attribuer une valeur. Ainsi, un utilisateur sera par exemple en mesure de déterminer si un mouvement a été bien exécuté ou s’il doit conduire à une faute.
En particulier, l’analyse du flux vidéo selon l’invention permet de générer des valeurs de position de points caractéristiques, puis des descripteurs de points caractéristiques et d’évolution de ces descripteurs de points caractéristiques et la comparaison de ces descripteurs par rapport à des données de référence sera rapide et fiable par rapport aux méthodes utilisées actuellement. Contrairement aux méthodes de l’art antérieur qui peuvent se baser sur une évolution des positions des points caractéristiques, une telle méthode permet de caractériser le mouvement plus rapidement et plus précisément même lorsque la prise de vue est mobile.
Par exemple, ces valeurs pourront être comparées à des valeurs de référence de façon à générer une valeur d’indice d’arbitrage. La valeur d’indice d’arbitrage pouvant correspondre à une indication de respect d’une règle d’arbitrale.
Dans une utilisation particulière, la présente invention peut être donc considérée par certains aspects comme un outil d’aide à la décision permettant à un arbitre de prendre les meilleures décisions arbitrales ou à un sportif d’améliorer constamment sa pratique en comparaison d’un standard.
En outre, un tel procédé peut être utilisé pour améliorer la performance sportive d’un pratiquant. Ainsi, il peut aussi prendre le rôle d’un entraîneur sportif virtuel permettant au pratiquant de faire évoluer sa pratique jusqu’à un niveau de maîtrise extrême. Ainsi, l’invention est également par certains aspects un outil d’amélioration sportive.
Selon d’autres caractéristiques optionnelles du procédé :
- l’étape de calcul d’une pluralité de descripteurs des points caractéristiques comporte un calcul d’une valeur de relation géométrique entre des points caractéristiques et une partie au moins desdits descripteurs des points caractéristiques correspond à ladite valeur de relation géométrique calculée entre des points caractéristiques. Cela permet une caractérisation améliorée du mouvement.
- l’étape de calcul comporte un calcul de valeurs de relation géométrique entre des points caractéristiques et un calcul d’une valeur d’évolution des valeurs de relation géométrique des points caractéristiques entre deux images présélectionnées et en ce qu’une partie au moins desdits descripteurs des points caractéristiques correspond à ladite valeur d’évolution des valeurs de relation géométrique des points caractéristiques entre deux images présélectionnées. Ainsi, la caractérisation du mouvement peut prendre en compte plus directement le comportement sur plusieurs images de l’entité en mouvement. La caractérisation du mouvement en est améliorée.
- la présélection comporte les sous-étapes suivantes : o Génération d’au moins une forme englobante sur une pluralité d’images, chacune des formes englobantes correspondant à une même entité en mouvement et étant caractérisée par des valeurs de dimensions ; o Comparaison des valeurs de dimensions de formes englobantes générées pour deux images différentes de façon à identifier des marqueurs d’action entre formes englobantes, lesdits marqueurs d’action correspondant à des modifications des valeurs de dimensions des formes englobantes entre images ; o Comparaison des marqueurs d’action identifiés à des marqueurs d’action de référence mémorisés sur le référentiel d’actions, ladite comparaison pouvant être réalisée par l’intermédiaire d’un modèle issu d’un apprentissage, ladite comparaison permettant de présélectionner, au sein de la pluralité d’images, une ou plusieurs images.
Une telle présélection permet un choix plus efficace des images et donc un traitement plus rapide. En outre, la prise en compte des marqueurs d’action permet d’augmenter la spécificité de l’analyse.
- l’étape de comparaison peut être réalisée à partir de descripteurs de points caractéristiques provenant de plusieurs caméras pour un même instant. Cela permet d’améliorer la caractérisation.
- il comporte l’attribution d’un identifiant unique à chaque point caractéristique par image et que chaque point caractéristique est associé à une position.
- la position de chaque point caractéristique est associée à un score de confiance. Le score de confiance peut être utilisé au moment de la génération de la valeur d’indice de caractérisation d’un mouvement pour en améliorer la précision.
- il comporte en outre une étape de classification de la ou des images présélectionnées, ladite classification correspondant à l’attribution d’une catégorie de mouvement à la ou aux images présélectionnées. De même cette étape permet d’améliorer la précision lors de la génération de la valeur d’indice de caractérisation d’un mouvement.
- au moins une partie des points caractéristiques de l’entité en mouvement sont des noeuds de jointures. Les noeuds de jointures permettent d’obtenir de très bons résultats dans le cadre de la présente invention.
Il comporte en outre une procédure de calibration des modèles et/ou référentiels utilisés dans le cadre du procédé. La calibration permet d’augmenter la spécificité et sensibilité de l’analyse.
- il comporte en outre une étape de reconnaissance faciale.
- il comporte une étape de transmission d’une alerte si la valeur d’indice de caractérisation d’un mouvement d’une entité en mouvement dépasse un seuil prédéterminé. - l’étape de réception comporte la réception d’au moins deux vidéos, de préférence d’au moins trois vidéos, en flux continu, en ce qu’une valeur d’indice de caractérisation d’un mouvement de l’entité en mouvement est généré pour chacune des vidéos et en ce qu’une valeur d’indice consolidé de caractérisation d’un mouvement de l’entité en mouvement est généré à partir de de chacune des valeurs d’indice de caractérisation d’un mouvement de l’entité en mouvement. La mise en œuvre du procédé sur plusieurs flux vidéo continu et la consolidation des valeurs d’indice déterminé permet d’augmenter la spécificité et sensibilité de l’analyse.
D'autres mises en œuvre de cet aspect comprennent des systèmes informatiques, des appareils et des programmes informatiques correspondants enregistrés sur un ou plusieurs dispositifs de stockage informatiques, chacun étant configuré pour effectuer les actions d’un procédé selon l’invention. En particulier, un système d’un ou de plusieurs ordinateurs peut être configuré pour effectuer des opérations ou des actions particulières, notamment un procédé selon l’invention, grâce à l’installation d’un logiciel, micrologiciel, matériel ou d’une combinaison de logiciels, micrologiciels ou matériel installé sur le système. En outre, un ou plusieurs programmes informatiques peuvent être configurés pour effectuer des opérations ou des actions particulières grâce à des instructions qui, lorsqu'elles sont exécutées par un appareil de traitement de données, obligent l'appareil à effectuer les actions.
L’invention porte en outre sur un produit programme d’ordinateur comportant une ou plusieurs instructions exécutables par un dispositif informatique, provoquant la mise en œuvre d’un procédé de caractérisation d’un mouvement d’une entité en mouvement selon l’invention.
L’invention porte en outre sur un système de caractérisation d’un mouvement d’une entité en mouvement, par exemple pour de l’aide à l’arbitrage ou l’entrainement sportif, ledit système comportant :
- un ou plusieurs dispositifs d’acquisition d’images, apte à transmettre une vidéo à un dispositif informatique, de préférence en flux continu ;
- le dispositif informatique incluant un processeur et une mémoire de données, ladite mémoire de données étant configurée pour stocker un référentiel d’actions de référence et un référentiel de mouvements de référence, ledit processeur étant configuré pour : o pré-sélectionner une ou plusieurs images au sein d’une pluralité d’images de la vidéo ; o Générer une pluralité de points caractéristiques de l’entité en mouvement sur la ou les images présélectionnées, lesdits points caractéristiques étant caractérisés par des valeurs de position ; o Calculer, à partir des valeurs de position des points caractéristiques, une pluralité de descripteurs des points caractéristiques pour plusieurs des images présélectionnées ; o Comparer la pluralité de descripteurs de points caractéristiques calculés à des descripteurs de points caractéristiques de référence mémorisés sur le référentiel de mouvements de référence, ladite comparaison pouvant être réalisée par l’intermédiaire d’un modèle issu d’un apprentissage ; et o Générer, à partir de la comparaison de la pluralité de descripteurs de points caractéristiques, une valeur d’indice de caractérisation d’un mouvement de l’entité en mouvement.
Le système selon l’invention repose en particulier, tout comme le procédé, sur sa capacité à identifier, extraire et analyser la position d’une entité en mouvement dans toute scène vidéo et cela sans nécessiter le port de marqueurs, de capteurs ou d’appareil invasif par le pratiquant. Le système permettra de connaître l’action que le pratiquant est train de réaliser.
Un système selon l’invention peut être utilisé en tant qu’assistance à l’arbitrage sportif dans le but d’une meilleure prise de décision arbitrale. Il peut aussi être utilisé en tant qu’assistance à l’entrainement sportif dans le but d’une amélioration de la performance.
D’autres avantages et caractéristiques de l’invention apparaîtront à la lecture de la description suivante donnée à titre d’exemple illustratif et non limitatif, en référence aux Figures annexées :
La figure 1 représente une illustration schématique d’un procédé de caractérisation d’un mouvement selon l’invention. Les étapes encadrées par des pointillés sont facultatives
La figure 2 représente une illustration schématique d’une étape de calibration selon un mode de réalisation du procédé de caractérisation d’un mouvement.
La figure 3 représente une illustration schématique d’une étape de présélection d’une ou de plusieurs images selon un mode de réalisation du procédé de caractérisation d’un mouvement.
La figure 4 représente une illustration d’une présélection d’une ou de plusieurs images au sein d’une pluralité d’images d’une séquence vidéo selon un mode de réalisation de l’invention.
La figure 5 représente une illustration d’une génération de forme englobante sur une pluralité d’images selon un mode de réalisation de l’invention.
La figure 6 représente une illustration d’une comparaison des formes englobantes générées de façon à calculer des marqueurs d’action entre formes englobantes selon un mode de réalisation de l’invention. La figure 7 représente plusieurs images décrivant différentes postures d’une entité en mouvement pour lesquelles ont été générées une pluralité de points caractéristiques de l’entité en mouvement selon un mode de réalisation du procédé de caractérisation d’un mouvement.
La figure 8 représente une illustration schématique d’une étape de calcul d’une pluralité de descripteurs des points caractéristiques selon un mode de réalisation du procédé de caractérisation d’un mouvement.
La figure 9 représente deux ensembles de points caractéristiques (disques) d’une même entité en mouvement, certains des points caractéristiques étant reliés par des segments, chacun des ensembles étant associé respectivement à une image qui diffère de l’autre image notamment par l’instant d’acquisition T1 , T2. La figure 9 représente en outre des descripteurs des points caractéristiques.
La figure 10 représente plusieurs images décrivant une action présentant différentes postures de deux entités en mouvement pour lesquelles ont été générées une pluralité de points caractéristiques selon un mode de réalisation du procédé de caractérisation d’un mouvement.
La figure 11 A représente un schéma d’un système de caractérisation d’un mouvement selon un mode de réalisation de l’invention. La figure 11 B représente un schéma d’un système de caractérisation d’un mouvement selon un mode de réalisation de l’invention.
Des aspects de la présente invention sont décrits en référence à des organigrammes et / ou à des schémas fonctionnels de procédés, d'appareils (systèmes) et de produits de programme d'ordinateur selon des modes de réalisation de l'invention.
Sur les figures, les organigrammes et les schémas fonctionnels illustrent l'architecture, la fonctionnalité et le fonctionnement d'implémentations possibles de systèmes, de procédés et de produits de programme d'ordinateur selon divers modes de réalisation de la présente invention. A cet égard, chaque bloc dans les organigrammes ou blocs-diagrammes peut représenter un système, un dispositif, un module ou un code, qui comprend une ou plusieurs instructions exécutables pour mettre en oeuvre la ou les fonctions logiques spécifiées. Dans certaines implémentations, les fonctions associées aux blocs peuvent apparaître dans un ordre différent que celui indiqué sur les figures. Par exemple, deux blocs montrés successivement peuvent, en fait, être exécutés sensiblement simultanément, ou les blocs peuvent parfois être exécutés dans l'ordre inverse, en fonction de la fonctionnalité impliquée. Chaque bloc des schémas de principe et / ou de l'organigramme, et des combinaisons de blocs dans les schémas de principe et / ou l'organigramme, peuvent être mis en oeuvre par des systèmes matériels spéciaux qui exécutent les fonctions ou actes spécifiés ou effectuer des combinaisons de matériel spécial et d'instructions informatiques. [Description de 1’inventionl
Dans la suite de la description, l’expression « caractérisation d’un mouvement » peut correspondre au sens de l’invention, à la qualification d’un mouvement réalisé par une entité en mouvement. En particulier, cela peut correspondre à l’identification d’un mouvement ou d’une action réalisée par une entité en mouvement. Par exemple cela peut correspondre à l’identification des actions suivantes : Feinte, Fente, Balestra, Tacle, Croc-en-jambe, Redoublement, et Ascenseur. De préférence, au sens de l’invention, la caractérisation d’un mouvement peut comporter une quantification. C’est-à-dire le calcul d’une valeur de conformité d’un mouvement identifié dans une séquence d’images sélectionnées à un mouvement de référence dont les caractéristiques ont été préalablement enregistrés. Ainsi, la présente invention peut permettre la détermination d’une probabilité de survenue d’un mouvement prédéterminé et en particulier la détermination de la bonne exécution d’un mouvement.
L’expression « valeur d’indice de caractérisation d’un mouvement » au sens de l’invention correspond à une valeur par exemple un score, une catégorie, un classement ou une note attribuée à un mouvement d’une entité en mouvement. En effet, la présente invention permet d’obtenir une valeur représentative du mouvement et cette valeur d’indice peut être générée sur la base de nombreuses échelles de tailles différentes (e.g. 1 , 5, 10, 100) linéaires ou non, numérique ou non. L’indice de caractérisation d’un mouvement attribué lors de la mise en oeuvre de la présente invention, peut également permettre d’affecter une entité en mouvement ou de préférence une action (i.e. un mouvement) à un groupe par exemple via une règle de décision. La caractérisation selon l’invention peut être réalisée notamment par la mise en oeuvre d’un algorithme de notation généré à partir d’une méthode statistique d’apprentissage ou de partitionnement.
Dans la suite de la description, l’expression « caractérisation d’un mouvement » peut correspondre au sens de l’invention, à la qualification d’un mouvement réalisé par une entité en mouvement. En particulier, cela peut correspondre à l’identification d’un mouvement ou d’une action réalisée par une entité en mouvement. Par exemple cela peut correspondre à l’identification des actions suivantes : Feinte, Fente, Balestra, Tacle, Croc-en-jambe, Redoublement, et Ascenseur. De préférence, au sens de l’invention, la caractérisation d’un mouvement peut comporter une quantification. C’est-à-dire le calcul d’une valeur de conformité d’un mouvement identifié dans une séquence d’images sélectionnées à un mouvement de référence dont les caractéristiques ont été préalablement enregistrés. Ainsi, la présente invention peut permettre la détermination d’une probabilité de survenue d’un mouvement prédéterminé et en particulier la détermination de la bonne exécution d’un mouvement. L’expression « valeur d’indice de caractérisation d’un mouvement » au sens de l’invention correspond à une valeur par exemple un score, une catégorie, un classement ou une note attribuée à un mouvement d’une entité en mouvement. En effet, la présente invention permet d’obtenir une valeur représentative du mouvement et cette valeur d’indice peut être générée sur la base de nombreuses échelles de tailles différentes (e.g. 1 , 5, 10, 100) linéaires ou non, numérique ou non. L’indice de caractérisation d’un mouvement attribué lors de la mise en oeuvre de la présente invention, peut également permettre d’affecter une entité en mouvement ou de préférence une action (i.e. un mouvement) à un groupe par exemple via une règle de décision. La caractérisation selon l’invention peut être réalisée notamment par la mise en oeuvre d’un algorithme de notation généré à partir d’une méthode statistique d’apprentissage ou de partitionnement.
Les « nœud de jointure » au sens de l’invention correspond à une position au niveau de laquelle se joignent au moins deux éléments d’un assemblage. De façon préférée, un nœud de jointure peut correspondre à une articulation d’un être vivant.
L’expression « valeur de position d’un point caractéristique » au sens de l’invention correspond par exemple aux valeurs de position en pixel d’un point caractéristique sur une image. Cette position peut aussi être exprimé dans un nouveau référentiel faisant abstraction des autres informations de l’image.
L’expression « descripteur des points caractéristiques » au sens de l’invention peut correspondre à une valeur de relation géométrique entre les positions d’au moins deux points caractéristiques d’une entité en mouvement ou les positions de segments, chacun reliant au moins deux points caractéristiques d’une entité en mouvement. Dans ce cas, elle correspond en particulier à des descripteurs de position intra-entité en mouvement Elle peut aussi correspondre à une relation géométrique entre les positions d’au moins deux points caractéristiques de deux entités en mouvement différentes ou les positions de segments, chacun reliant au moins deux points caractéristiques de deux entités en mouvement différentes. En outre, un descripteur de position peut correspondre à une combinaison de transformations mathématiques. Par exemple, un descripteur de position peut en particulier correspondre à : une valeur de distance entre deux points caractéristiques, une valeur d’un angle formé par deux segments chacun reliant au moins deux points caractéristiques, une valeur d’aire formée par des segments reliant au moins trois points caractéristiques, une valeur de la dérivée de révolution d’une distance entre deux points caractéristiques, une valeur l’évolution d’une distance entre deux points caractéristique au cours du temps, ou encore à une valeur de rapport entre deux distances. L’expression « marqueur d’action » au sens de l’invention peut correspondre à une relation mathématique entre des valeurs de dimension de formes englobantes d’une entité en mouvement provenant d’images différentes. En outre, un marqueur d’action peut correspondre à une combinaison de transformations mathématiques. Par exemple, un marqueur d’action peut en particulier correspondre à : une évolution de la valeur de ratio d’aspect d’une forme englobante au cours du temps, la dérivée de l’évolution de la valeur de ratio d’aspect d’une forme englobante, l’évolution d’une hauteur d’une forme englobante au cours du temps, ou encore un rapport entre deux valeurs de ratio d’aspect d’une forme englobante entre images successives.
L’expression « en flux continu » au sens de l’invention correspond à la lecture ou à l’analyse d'un flux vidéo ou audio et vidéo audio à mesure qu'il est généré par un appareil d’acquisition d’image. Cela s'oppose à la lecture ou à l’analyse de fichiers qui nécessite de récupérer l'ensemble des données d'une vidéo avant de pouvoir l’analyser.
L’expression « forme englobante » au sens de l’invention correspond à une boite ou un masque permettant d’englober la représentation de l’entité en mouvement sur une image et prenant par exemple une forme d’un ou de plusieurs polygones, ou d’une ou de plusieurs ellipses.
Le terme « pluralité » au sens de l’invention correspond à au moins deux. De préférence cela peut correspondre à au moins trois, de façon plus préférée au moins cinq et de façon encore plus préférée au moins dix.
Le terme « apprentissage » au sens de l’invention correspond à un procédé conçu pour définir une fonction f permettant de calculer une valeur de Y à partir d’une base de n observations labélisées (X1 ...n, Y1 ...n) ou non labélisées (X1 ...n). L’apprentissage peut être dit supervisé lorsqu’il se base sur des observations labélisées et non supervisé lorsqu’il se base sur des observations non labélisées. Dans le cadre de la présente invention, l’apprentissage est avantageusement utilisé pour la calibration du procédé et donc son adaptation à une application particulière telle qu’une activité sportive donnée.
Par « modèle » ou « règle » ou « algorithme de notation » il faut comprendre au sens de l’invention une suite finie d'opérations ou d'instructions permettant de caractériser un mouvement, c’est-à-dire classer un ou plusieurs mouvements (ou actions) d’une entité en mouvement au sein de groupes préalablement définis Y, et en particulier d’attribuer un score ou de hiérarchiser une ou plusieurs catégories de mouvement par rapport à un mouvement d’une entité en mouvement. La mise en oeuvre de cette suite finie d'opérations permet par exemple d’attribuer une étiquette Yo à une observation décrite par un ensemble de caractéristiques Xo grâce par exemple à la mise en œuvre d’une fonction f susceptible, de reproduire Y ayant observé X.
Y = f (X) + e où e symbolise le bruit ou erreur de mesure
On entend par « traiter », « calculer », « exécuter », « déterminer », « afficher », « extraire », « comparer » ou plus largement « opération exécutable », au sens de l’invention, une action effectuée par un dispositif ou un processeur sauf si le contexte indique autrement. À cet égard, les opérations se rapportent à des actions et / ou des processus d’un système de traitement de données, par exemple un système informatique ou un dispositif informatique électronique, qui manipule et transforme les données représentées en tant que quantités physiques (électroniques) dans les mémoires du système informatique ou d'autres dispositifs de stockage, de transmission ou d'affichage de l'information. Ces opérations peuvent se baser sur des applications ou des logiciels.
Les termes ou expressions « application », « logiciel », « code de programme », et « code exécutable » signifient toute expression, code ou notation, d'un ensemble d'instructions destinées à provoquer un traitement de données pour effectuer une fonction particulière directement ou indirectement (e.g. après une opération de conversion vers un autre code). Les exemples de code de programme peuvent inclure, sans s'y limiter, un sous-programme, une fonction, une application exécutable, un code source, un code objet, une bibliothèque et/ou tout autre séquence d'instructions conçues pour l'exécution sur un système informatique.
On entend par « processeur », au sens de l’invention, au moins un circuit matériel configuré pour exécuter des opérations selon des instructions contenues dans un code. Le circuit matériel peut être un circuit intégré. Des exemples d'un processeur comprennent, sans s'y limiter, une unité de traitement central, un processeur graphique, un circuit intégré spécifique à l'application (ASIC) et un circuit logique programmable.
On entend par « couplé », au sens de l’invention, connecté, directement ou indirectement avec un ou plusieurs éléments intermédiaires. Deux éléments peuvent être couplés mécaniquement, électriquement ou liés par un canal de communication.
L’expression « interface homme-machine » au sens de l’invention correspond à tout élément permettant à un être humain de communiquer avec un ordinateur en particulier et sans que cette liste soit exhaustive, un clavier et des moyens permettant en réponse aux ordres entrés au clavier d’effectuer des affichages et éventuellement de sélectionner à l’aide de la souris ou d’un pavé tactile des éléments affichés sur l’écran. Un autre exemple de réalisation est un écran tactile permettant de sélectionner directement sur l’écran les éléments touchés par le doigt ou un objet et éventuellement avec la possibilité d’afficher un clavier virtuel.
L’expression « objet connecté » au sens de l’invention, correspond à un objet électronique connecté, par une connexion filaire ou sans fil, à un réseau de transport de données, de manière que l’objet connecté puisse partager des données avec un autre objet connecté, un serveur, un ordinateur fixe ou mobile, une tablette électronique, un smartphone ou tout autre dispositif connecté d’un réseau donné. De manière connue en soi, de tels objets connectés peuvent être, par exemple, des tablettes, des dispositifs d’éclairage intelligents, des outils industriels ou encore des smartphones.
Dans la suite de la description, les mêmes références sont utilisées pour désigner les mêmes éléments.
Comme cela a été mentionné, il existe déjà des systèmes de suivi d’entité en mouvement et plus particulièrement de personnes ou d’objets. Néanmoins, les systèmes existants se contentent de détecter, et éventuellement d’identifier, une entité en mouvement puis de la suivre. Il existe très peu de système s’intéressant à la caractérisation d’une action ou d’un mouvement de ces entités en mouvement. Ponctuellement, certains proposent une comparaison d’une portion d’image associée à l’entité en mouvement avec des images de références mémorisées mais de tels systèmes sont au mieux lents et généralement imprécis.
Ainsi, avec les méthodes de l’art antérieur, il est fréquent que les personnes s’intéressant à des actions enregistrées par vidéo aient à revisionner à plusieurs des séquences au ralenti de façon à caractériser au mieux l’action ou le mouvement de l’entité. Ainsi, cela est chronophage et soumis à l’appréciation subjective d’une ou de plusieurs personnes. En outre le manque de sensibilité et de spécificité de la méthode en limite les applications.
Or il existe un besoin pour un procédé ou un système capable de générer un indice, de préférence à destination d’utilisateurs et en temps réel, capable de caractériser un mouvement d’une ou plusieurs entités en mouvement.
Comme cela sera détaillé par la suite, les inventeurs ont développé un système et un procédé de caractérisation d’un mouvement d’une entité en mouvement, passant par la génération d’une valeur d’indice de caractérisation d’un mouvement, présentant un haut niveau de reconnaissance et une rapidité de traitement permettant de faire les analyses en temps réel. Avantageusement, le système et le procédé de caractérisation d’un mouvement d’une entité en mouvement selon l’invention présenteront une bonne spécificité et sensibilité, avec éventuellement une spécificité supérieure à la sensibilité. En effet, bien que la sensibilité soit importante, la spécificité est encore plus importante car elle indique la capacité à ne pas sur solliciter les utilisateurs.
Ainsi, la présente invention porte notamment sur un procédé 1 de caractérisation d’un mouvement d’une entité en mouvement. Comme cela sera décrit par la suite, l’entité en mouvement peut avantageusement être un être vivant en mouvement. En outre, l’être vivant peut être un humain mais plus largement un animal. Par exemple, dans le domaine sportif intéressant particulièrement la présente invention, l’être vivant peut être un humain mais également un animal tel qu’un cheval.
En particulier, la caractérisation d’un mouvement peut correspondre à la caractérisation de l’exécution d’un mouvement. Avantageusement cela peut correspondre à la détermination d’une bonne, ou d’une mauvaise, exécution d’un mouvement par une entité en mouvement 9 notamment par rapport à un référentiel comportant les caractéristiques d’un mouvement correctement exécuté.
Ainsi, un tel procédé peut trouver de nombreuses applications dans des domaines très divers. Alors qu’il trouve une application manifeste dans le domaine de l’aide à l’arbitrage ou de l’entrainement sportif, il peut aussi trouver une application et répondre aux problématiques de caractérisation des mouvements d’objets ou d’êtres vivant dans des contextes ou la réponse doit être générée extrêmement rapidement. En effet comme cela a déjà été abordé, un des avantages de l’invention par rapport à des procédés existant est de pouvoir traiter des flux continus d’information en quelques secondes ou moins et en particulier à partir de caméra présentant des prises de vue mobiles ou encore des zooms avant ou arrière. Il est possible de citer dans ce contexte : la caractérisation du mouvement de personnes dans des lieux publics ou dans des salles d’entrainement.
Dans le cadre d’un procédé selon l’invention, une pluralité d’images d’une vidéo est réceptionnée de préférence en flux continu. Le suivi en continu correspond par exemple à des réceptions d’images réalisées à une fréquence inférieure ou égale à une seconde, de préférence inférieure ou égale à 500 ms. Les images sont quant à elles générées par exemple à une fréquence d’au moins 50 Hz, de préférence au moins 70 Hz.
En particulier, partant de la génération d’une image par un dispositif d’acquisition d’images (e.g. caméra), un procédé selon l’invention permet de préférence de générer une valeur d’indice de caractérisation d’un mouvement dans un délai inférieur ou égal à cinq secondes, de façon plus préférée inférieur ou égal à deux secondes, de façon encore plus préférée inférieur ou égal à une seconde. Comme cela sera détaillé par la suite, un procédé 1 de caractérisation d’un mouvement d’une entité en mouvement selon l’invention peut être mis en oeuvre par un système 2 comportant un dispositif informatique 10 incluant un processeur 11 et une mémoire de données 12. En particulier, la mémoire de données est configurée pour stocker un référentiel d’actions de référence 12a et un référentiel de mouvements de référence 12b.
Comme illustré à la figure 1 , un procédé 1 de caractérisation d’un mouvement d’une entité en mouvement selon l’invention comporte les étapes de : réception 300 d’une vidéo, pré-sélection 400 d’une ou de plusieurs images au sein d’une pluralité d’images de la vidéo, génération 500 d’une pluralité de points caractéristiques de l’entité en mouvement sur la ou les images présélectionnées, calcul 600 d’une pluralité de descripteurs des points caractéristiques pour plusieurs des images présélectionnées, comparaison 700 de la pluralité de descripteurs des points caractéristiques calculés à des descripteurs de points caractéristiques de référence et génération 800 d’une valeur d’indice de caractérisation d’un mouvement d’une entité en mouvement 9.
En outre, un procédé 1 de caractérisation d’un mouvement d’une entité en mouvement selon l’invention peut comporter les étapes de calibration 100 des modèles et référentiels utilisés, de traitement 200 d’une pluralité d’images de la vidéo, et de transmission 900 d’une alerte si la valeur d’indice de caractérisation d’un mouvement d’une entité en mouvement dépasse un seuil prédéterminé.
Des modes de réalisation avantageux de ces étapes sont décrits ci-après en référence aux figures.
En particulier, la présente invention peut comporter une procédure de calibration 100 des modèles et/ou référentiels utilisés dans le cadre du procédé 1 de caractérisation d’un mouvement.
Une calibration selon un mode de réalisation est en particulier illustrée à la figure 2.
Comme illustré, la procédure de calibration 100 peut comporter une étape d’entrainement 110 d’un modèle utilisable pour la comparaison des marqueurs d’action identifiés à des marqueurs d’action de référence, une étape d’entrainement 120 d’un modèle utilisable pour la comparaison 700 d’une pluralité de descripteurs des points caractéristiques calculés à des descripteurs des points caractéristiques de référence et une étape de personnalisation 130 des modèles précédemment générés.
Ces différentes étapes peuvent être au moins en partie basées sur les principes généraux des mathématiques statistiques et plus particulièrement de l’apprentissage, qu’il soit supervisé ou non supervisé. De façon préférée, la procédure de calibration 100 comporte des étapes d’apprentissages supervisés et/ou non supervisés basées sur des valeurs générées à partir de séquence d’images représentant au moins un mouvement d’une entité en mouvement. Ainsi, les valeurs de références pourront être particulièrement adaptées à une typologie d’entité en mouvement et/ou d’actions suivies par le procédé et/ou le dispositif selon l’invention.
La procédure de calibration 100 peut débuter par un prétraitement des valeurs de descripteurs des points caractéristiques de façon à en faciliter l’exploitation ultérieure. Un prétraitement selon l’invention peut par exemple comporter : une normalisation des données, un rééchantillonnage et/ou une agrégation de données. Un tel prétraitement pourra aussi être mis en oeuvre avant les étapes de comparaison 420 des valeurs de dimensions des formes englobantes et de comparaison 700 de la pluralité de descripteurs des points caractéristiques calculés.
En particulier, comme cela a été abordé, l’étape 110 porte avantageusement sur l’entrainement d’un modèle pour la comparaison des marqueurs d’action identifiés à des marqueurs d’action de référence. Cet entrainement peut être réalisé directement sur une ou plusieurs images catégorisées et donc associées à une action particulière. Le modèle peut en particulier être mémorisé sur le référentiel 12a d’actions de référence. Comme cela sera détaillé par la suite, une telle comparaison permet de présélectionner, au sein de la pluralité d’images, une ou plusieurs images 431 qui feront l’objet d’un traitement ultérieur.
En particulier, comme cela a été abordé, l’étape 120 porte avantageusement sur un entrainement d’un modèle pour la comparaison d’une pluralité de descripteurs des points caractéristiques calculés à des descripteurs des points caractéristiques de référence. Cet entrainement peut être réalisé directement sur une sélection d’images catégorisées et donc associées à une action particulière. Le modèle peut en particulier être mémorisé sur le référentiel 12b de mouvements de référence. Le modèle utilisé peut en particulier être un modèle de réseau de neurones par exemple de type Perceptron, multicouches acycliques, Perceptron multicouches. De préférence, le modèle utilisé est un ADALINE ou une machine de Cauchy.
En particulier, la procédure de calibration 100 des modèles et/ou référentiels peut comporter une étape 130 de personnalisation des modèles. Une telle étape peut notamment comporter la transmission au dispositif informatique selon l’invention d’une séquence d’image relatives à la réalisation d’une action par une entité en mouvement. Cela peut par exemple correspondre à une prise vidéo d’une feinte réalisée par un champion olympique ou mondial.
L’étape 130 peut alors avantageusement comporter une génération de marqueurs d’action qui pourront être enregistrés comme des marqueurs d’action de référence pour la sélection d’une ou de plusieurs images dans le cadre du procédé en complément des autres données de référence.
En outre, l’étape 130 peut comporter une génération de points caractéristiques et le calcul d’une pluralité de descripteurs des points caractéristiques qui pourront avantageusement être enregistrés comme des descripteurs des points caractéristiques de référence. Ces nouveaux descripteurs des points caractéristiques de référence pourront être utilisés de façon à générer un indice de caractérisation de mouvement de l’entité en mouvement par rapport à un champion olympique ou mondial.
Cela permet un haut niveau de personnalisation du procédé. Ainsi, il est possible de caractériser et d’enregistrer des mouvements provenant d’entité en mouvement particulières tel que par exemple des sportifs d’envergure internationale enregistrant leur mouvement les plus aboutis de façon à les mettre à disposition de pratiquant souhaitant faire évoluer leur pratique.
Parmi les nombreuses méthodes possibles pour générer des modèles utilisables dans la présente invention, il est possible de distinguer les approches non supervisées et les approches supervisées.
L’étape d’entrainement d’un modèle pour la comparaison des marqueurs d’action selon l’invention peut mettre en oeuvre une méthode d’apprentissage non supervisée. La méthode d’apprentissage non supervisée peut reposer sur une notion de proximité. Ainsi, avantageusement, une méthode d’apprentissage non supervisée mise en oeuvre lors de l’étape de pré-sélection 400 d’une ou de plusieurs images peut par exemple comporter une classification non supervisée, un calcul de la densité ou la recherche des plus proches voisins. En particulier, la classification non supervisée permet de regrouper les données en groupes de densités différentes, les points d'un petit groupe correspondent généralement à des images d’intérêt à présélectionner. Lors de l’étude d’une nouvelle séquence d’image, un procédé selon l’invention pourra comporter un calcul de la distance entre les marqueurs d’action des différentes images et former des groupes. Si certaines images sont éloignées de tous les autres points alors ces images peuvent être présélectionnées.
Le calcul de la densité peut par exemple correspondre aux algorithmes de type LOF (« Local Outlier Factor » en terminologie anglosaxonne), GLO (« Global-Local Outlier » en terminologie anglosaxonne) ou DBSVM « Density Based Support Vector Machines » en terminologie anglosaxonne). En particulier, le calcul de la densité peut comporter le calcul, pour chaque point, d’une densité de son voisinage local (k) puis le calcul d’un facteur de dépassement local d'un échantillon p comme moyenne des rapports de la densité de l'échantillon p et de la densité de ses plus proches voisins. Les valeurs anormales sont alors des points avec la plus grande valeur de facteur de dépassement local. Un procédé de caractérisation selon l’invention peut également mettre en oeuvre des approches supervisées pour la présélection d’une ou de plusieurs images. En particulier, une étape de présélection 400 ou une étape de comparaison 700 selon l’invention peut comporter la mise en oeuvre d’une méthode d’apprentissage supervisée.
Parmi les méthodes d’apprentissage supervisées, les réseaux de neurones, les arbres de classification, la recherche des plus proches voisins ou les arbres de régression sont parmi les techniques d’apprentissage automatique les plus robustes et les plus efficaces dans le cadre d’un procédé selon l’invention.
Il est par exemple possible d’utiliser une étape d’apprentissage supervisé pour apprendre à des arbres à classer les images. Pour cela, le procédé comporte de préférence une étape préalable de réception d’images labélisées ou de façon plus préférée de marqueurs d’action labélisés.
Un procédé selon l’invention peut par exemple mettre en oeuvre des valeurs de seuils prédéterminés ou des motifs prédéterminés. Les valeurs de références peuvent alors être des seuils prédéterminés et par exemple renseignées par un opérateur par une interface graphique.
Un procédé 1 de caractérisation d’un mouvement selon l’invention peut comporter un traitement 200 d’une pluralité d’images d’une vidéo aussi appelé traitement 200 vidéo.
Comme cela est illustré à la figure 1 , le traitement 200 d’une pluralité d’images d’une vidéo peut être réalisé avant une étape de réception 300 d’une vidéo par un dispositif informatique 10. Dans ce cas, le traitement 200 vidéo peut être réalisé par le dispositif d’acquisition de la vidéo (e.g. caméra) ou par un dispositif de traitement disposé entre le ou les dispositifs d’acquisition de la vidéo mis en oeuvre dans le cadre de l’invention et le dispositif informatique 10.
Alternativement ou en complément, un procédé 1 selon l’invention peut comporter un traitement 200 vidéo après l’étape de réception 300 d’une vidéo par un dispositif informatique 10. Dans ce cas, le traitement 200 vidéo pourra être réalisé par le dispositif informatique 10.
L’étape de traitement 200 d’une pluralité d’images de la vidéo peut correspondre à une grande diversité de transformation des images de façon à en faciliter l’exploitation ultérieure. L’étape de traitement 200 vidéo peut par exemple comporter : une transformation d’espace colorimétrique, un passage en niveau de gris, une normalisation des effets de contraste, une normalisation des effets de luminosité, une correction gamma, un recadrage et/ou un redimensionnement.
Un procédé 1 de caractérisation d’un mouvement selon l’invention comporte une étape de réception 300 d’une vidéo. C’est par exemple un dispositif informatique 10 qui réceptionnera la ou les vidéos. Avantageusement, la vidéo réceptionnée correspond à un flux vidéo continu. En effet, comme cela a été mentionné, la présente invention permet un traitement rapide des images et la caractérisation d’un mouvement en moins de quelques secondes. Ainsi, il est particulièrement adapté à un flux vidéo continu et en temps réel.
De préférence, le procédé peut comporter la réception de plusieurs vidéos et de préférence de plusieurs flux vidéo continus.
En particulier, lors de la mise en oeuvre de l’invention, un dispositif d’acquisition vidéo, tel qu’une caméra pourra capturer une séquence 401 d’images ou pluralité d’images, ladite séquence 401 d’image étant composé de plusieurs images 431. Dans un mode de réalisation particulier, la vidéo peut correspondre à un flux vidéo continu qui est transféré au dispositif informatique 10 en temps réel ou en différé. Dans un autre mode de réalisation, la vidéo peut correspondre à des données d'images mémorisées stockées puis analysées.
Un procédé 1 de caractérisation d’un mouvement selon l’invention comporte une étape de présélection 400 d’une ou de plusieurs images au sein d’une pluralité d’images 401 de la vidéo. C’est en particulier le processeur 11 d’un dispositif informatique 10 qui pourra être configuré pour réaliser une telle étape.
L’étape de pré-sélection 400 d’une ou de plusieurs images est en particulier destinée à sélectionner parmi la pluralité d’images d’une vidéo, les images se référant à un mouvement d’un intérêt particulier. Ainsi, au lieu de mettre en oeuvre les étapes ultérieures du procédé sur toutes les images de la vidéo, le procédé pourra appliquer ces étapes seulement sur une partie des images. Les images sont alors de préférence présélectionnées en fonction de leur contenu et en particulier, comme cela sera décrit par la suite, de l’évolution de l’entité en mouvement dans la pluralité d’images.
Il existe une grande diversité de méthodes permettant de présélectionner seulement une partie des images d’une vidéo. Il pourrait par exemple être utilisé la bande sonore associée aux images de la vidéo et ne sélectionner que les images associées avec certaines caractéristiques sonores prédéfinis. La présélection pourrait également être basée sur des caractéristiques de contenus des images. En particulier, les inventeurs ont déterminé que l’invention présente des performances améliorées lorsqu'un procédé 1 selon l’invention comportait une identification d’une action prédéterminée réalisée par une entité en mouvement 9. En particulier, une telle identification peut correspondre au calcul d’un marqueur d’action (i.e. de mouvement) d’une entité en mouvement 9 dans une séquence d’image et sa comparaison avec un marqueur d’action (i.e. de mouvement) prédéterminé (e.g. de référence). En particulier, un procédé conforme à l’invention ne comporte pas de comparaison d’une image ou d’une portion d’image à une collection d’images. Ainsi, contrairement à des méthodes de l’art antérieure basées sur l’utilisation d’une collection d’images d’entité en mouvement ou d’action, dans le procédé selon l’invention, il n’y a de préférence pas de comparaison d’une partie d'une image sensée correspondre à une potentielle entité en mouvement 9, à une image de référence.
Dans un mode de réalisation illustré à la figure 3, le procédé selon l’invention comporte en particulier la génération 410 d’au moins une forme englobante 411 , 411a, 411b, décrite en lien avec la figure 4, sur une pluralité d’images. La génération d’une forme englobante peut correspondre à l’identification d’un contour ou d’une forme ou plus largement à l’identification de données de géométrie d’une entité en mouvement 9. Cette étape de génération 410 d’au moins une forme englobante peut être répétée pour plusieurs entités en mouvement 9 différentes.
La figure 4 illustre en particulier une série d’images comportant deux entités en mouvement 9a, 9b et la figure 5 présente une génération d’au moins une forme englobante 411 a, 411 b sur une séquence d’images.
Avantageusement, le procédé selon l’invention va permettre la sélection automatique d’une entité en mouvement 9 (par exemple sur la figure 4, un escrimeur 9a à gauche et un escrimeur 9b à droite). Un procédé classique peut par exemple consister à effectuer un suivi basé sur le mouvement de l’entité en mouvement en comparant deux images successives. L'identification d'une entité en mouvement pourrait être effectuée manuellement à l'aide d'un écran tactile ou d'un autre procédé de saisie dans lequel un objet d'intérêt est sélectionné. Néanmoins, l’entité en mouvement est de préférence identifiée automatiquement.
Les formes englobantes peuvent être caractérisées par des valeurs de dimensions. Les dimensions particulières pouvant être étudiées vont être dépendantes de la forme géométrique de la forme englobante. Par exemple, un polygone, comme un rectangle pourra être caractérisé par une valeur de hauteur et une valeur de largueur ; une ellipse ou un assemblage d’ellipse pourra quant à lui être défini par une droite directrice et des valeurs de foyer et d’excentricité. Ainsi, la génération 410 d’une ou de plusieurs formes englobantes est de préférence associée au calcul de valeurs de dimensions. Les valeurs de dimensions peuvent par exemple correspondre à une valeur de longueur, de largeur, de circonférence, d’angle, de volume. Les valeurs de dimensions peuvent également correspondre à un rapport entre deux dimensions comme par exemple un rapport entre une hauteur et une largeur.
En outre, les formes englobantes peuvent être caractérisées par un identifiant unique partagé pour toutes les représentations d’une même entité en mouvement au fil des images d’une séquence. Dans ce cas les formes englobantes peuvent correspondre à une même entité en mouvement 9 représentée sur différentes images.
Il peut y avoir plusieurs formes englobantes par image. En effet, une même image issue d’une vidéo peut comporter plusieurs entités en mouvement. En outre, il est possible qu’il ne soit pas possible de générer une forme englobante sur une des images. Dans ce cas l’image peut être supprimée de l’ensemble d’images traitées.
En particulier, il est connu des procédés de détection et de suivi d’entité en mouvement (US9852511 , US9836852, US9665804, US-9811732, US9865062). Ces procédés comportent généralement la définition de formes englobantes puis le suivi du déplacement de ces formes englobantes au fil d’une séquence d’images. Ici, la présente invention comporte en outre avantageusement la caractérisation de la modification de la géométrie d’une forme englobante au fil d’une séquence d’images et sa comparaison à une modification prédéterminée de la géométrie d’une forme englobante. Ainsi, les inventeurs ont déterminé qu’au-delà du déplacement de la forme englobante, c’est l’évolution de sa géométrie dans le temps et la comparaison de cette évolution à des évolutions de géométrie prédéterminées qui permet d’obtenir les meilleurs résultats.
Ainsi, avantageusement, une fois des formes englobantes générées sur les images, le procédé peut comporter une comparaison 420 des valeurs de dimensions de formes englobantes générées pour deux images différentes.
En effet, l’invention s’intéresse en particulier à une action réalisée par une entité en mouvement 9. Une telle action pourra être détectée en fonction d’une évolution de l’entité en mouvement 9 dans le temps. Cela peut en particulier passer par une comparaison de la position de l’entité en mouvement 9, en particulier de formes englobantes de cette entité en mouvement 9 et plus particulièrement de valeurs de dimensions de ces formes englobantes, entre deux images prises à des instants différents (e.g. deux images successives dont l’instant d’acquisition est décalé de quelques dizaines de millisecondes).
La figure 6, illustre par exemple l’évolution des dimensions de deux formes englobantes 411a, 411b, associées aux escrimeurs de gauche 9a et de droite 9b, au fil des images 401b, 401c, 401 d, 401e prises successivement. Ces dimensions sont en particulier la largeur et la hauteur des formes englobantes. Les valeurs de largeur et de hauteur des formes englobantes peuvent être utilisées pour calculer une valeur de ratio d’aspect.
Le tableau 1 ci-dessous comporte les valeurs d’une dimension des formes englobantes 411 a et 411 b en fonction des images. Il présente également des valeurs de référence pour les dimensions des formes englobantes pouvant être utilisées en complément des marqueurs d’action de référence lors de la présélection des images.
[Tableau 1]
Figure imgf000023_0001
Ainsi, le tableau 1 montre que l’entité escrimeur de droite 9b pourrait exécuter une action d’intérêt étant donné que sur deux images 401 d, 401e, la valeur de ratio d’aspect va au-delà d’un seuil prédéterminé (Valeur de référence).
La comparaison 420 des valeurs de dimension peut permettre de calculer des marqueurs d’action entre formes englobantes, lesdits marqueurs d’action correspondant en particulier à des modifications des valeurs de dimensions des formes englobantes entre images.
Le procédé peut alors comporter une comparaison 430 des marqueurs d’action identifiés à des motifs de marqueurs d’action de référence mémorisés sur le référentiel 12a d’actions.
La figure 6 illustre en particulier la comparaison des valeurs de dimension de la forme englobante 411b entre les images 401c et 401 d de façon à calculer un marqueur d’action 421. Elle illustre aussi la comparaison des valeurs de dimension de la forme englobante 411 b entre les images 401 c et 401 e de façon à calculer un marqueur d’action 422.
Comme présenté dans le tableau 2 ci-dessous, un marqueur d’action peut par exemple correspondre à une évolution d’un ratio d’aspect et plus particulièrement le rapport entre le ratio d’aspect d’une forme englobante sur une première image 401 d et le ratio d’aspect de cette forme englobante sur une deuxième image 401 c.
[Tableau 2]
Figure imgf000023_0002
Ainsi, le tableau 2 montre que l’entité escrimeur de droite 9b pourrait exécuter une action d’intérêt étant donné que l’évolution du ratio d’aspect entre les images 401c et 401 d puis 401c et 401 e présente une valeur allant au-delà d’un seuil prédéterminé (Valeur de référence).
L’étape de comparaison 430 peut aussi prendre en compte, en outre, des données extérieures telle qu’une bande sonore.
La comparaison peut être réalisé à partir de base de données enregistrées par exemple sur un ou plusieurs fichiers plats. Avantageusement, la comparaison 430 peut être réalisée par l’intermédiaire d’un modèle issu d’un apprentissage. Ainsi, les modèles détaillés notamment lors de la description de l’étape 100 de calibrage sont adaptés.
En particulier, l’étape de présélection 400 comporte un calcul d’une valeur de relation mathématique entre les valeurs de dimension de formes englobantes d’une même image et une partie au moins des marqueurs d’action correspond à cette valeur de relation mathématique entre les valeurs de dimension de formes englobantes d’une même image.
De préférence, l’étape de présélection 400 comporte un calcul d’une valeur de relation mathématique entre les valeurs de dimension d’une même forme englobante provenant de deux images différentes et une partie au moins des marqueurs d’action correspond à cette valeur de relation mathématique entre les valeurs de dimension d’une même forme englobante provenant de deux images différentes.
En outre, l’étape de présélection 400 peut comporter un calcul d’une valeur de relation mathématique entre les valeurs de dimension d’une même forme englobante provenant de deux images différentes et un calcul d’une valeur d’évolution de cette valeur de relation mathématique entre les valeurs de dimension d’une même forme englobante provenant de deux images différentes et en ce qu’une partie au moins desdits descripteurs des points caractéristiques 501 correspond à cette valeur d’évolution.
Comme cela a été évoqué, la comparaison 430 permet de présélectionner, au sein de la pluralité d’images, une ou de plusieurs images 431 .
En outre, le procédé selon l’invention peut comporter une étape de classification 440 de la ou des images présélectionnées. La classification correspond en particulier à l’attribution d’une catégorie d’action (ou de mouvement) à la ou aux images présélectionnées.
Par exemple, un procédé selon l’invention peut comporter le calcul de scores de similarité des images présélectionnées à plusieurs catégories d’action (ou de mouvement). La comparaison des scores de similarité entre eux pour une même image et éventuellement à un seuil prédéterminé de score de similarité, peut permettre d’attribuer une catégorie d’action (ou de mouvement) à plusieurs, de préférence chacune, des images présélectionnées. De façon préférée, le procédé selon l’invention comporte une étape de détermination d’une catégorie d’action (ou de mouvement) pour des images présélectionnées. Ainsi, ces images pourront être associées à une action particulière et leur traitement ultérieur n’en sera que plus précis et plus rapide. En particulier, la catégorie d’action déterminée pourra ensuite être utilisée lors de la comparaison 700 de façon à sélectionner seulement des descripteurs de points caractéristiques de référence associés à cette catégorie d’action (ou de mouvement). De même, la catégorie d’action (ou de mouvement) déterminée pourra ensuite être utilisée lors du calcul 600 des descripteurs des points caractéristiques de façon à sélectionner seulement des descripteurs adaptés à cette catégorie d’action (ou de mouvement).
Le procédé selon l’invention, en particulier au cours de l’étape 400 de présélection peut comporter une étape de reconnaissance faciale. La reconnaissance faciale peut être réalisée par différentes techniques de l’état de la technique telles que celle décrites dans les documents ci-après (KR20180079894, EP1910977, US20170193284).
De façon préférée, un procédé selon l’invention, en particulier au cours de l’étape 400 de présélection peut comporter une étape de reconnaissance d’émotions. La reconnaissance d’émotions peut être réalisée par différentes techniques de l’état de la technique telles que celle décrites dans les documents ci-après (KR20180109227, US20190213400, WO2019/107641). En particulier, la reconnaissance d’émotion peut comporter l’identification d’une expression faciale associée à la souffrance.
La présence ou l’absence de données faciales reconnues et/ou d’émotions reconnues est une donnée pouvant aussi être utilisée lors de la génération 800 d’une valeur d’indice de caractérisation d’un mouvement et/ou lors de la transmission 900 d’une alerte.
Un procédé 1 de caractérisation d’un mouvement selon l’invention comporte une étape de génération 500 d’une pluralité de points caractéristiques 501 de l’entité en mouvement 9 sur la ou les images présélectionnées 431. C’est en particulier le processeur 11 d’un dispositif informatique qui pourra être configuré pour réaliser une telle étape.
Les points caractéristiques 501 sont de préférence caractérisés par des valeurs de position, de préférence sur chaque image présélectionnée 431 .
La figure 7 illustre en particulier une image présélectionnée 431 pour laquelle des points caractéristiques 501 de chacune des entités en mouvement 9a, ont été générés.
Les points caractéristiques de l’entité en mouvement 9a ou 9b sont généralement des points correspondant à des positions d’importance dans la caractérisation d’une entité en mouvement.
Ainsi, les points caractéristiques 501 de l’entité en mouvement 9a ou 9b correspondent de préférence au moins en partie à des noeuds de jointure, de façon plus préférée ils correspondent exclusivement à des nœuds de jointure. Alternativement, l’invention peut être mise en œuvre avec des points caractéristiques correspondants à la structure osseuse d’une entité en mouvement animale ou encore correspondants à l’enveloppe extérieure de l’entité en mouvement.
A titre d’exemple non limitatif, il peut être particulièrement avantageux de pouvoir déterminer la posture d’une entité en mouvement 9a, 9b dans le cadre de l’arbitrage d’un sport tel que l’escrime. En effet, il peut être très compliqué pour un arbitre de déterminer quelle entité en mouvement 9a, 9b à initier une action, par exemple un assaut, correspondant à la rencontre ou à la touche de l’une ou l’autre des entités en mouvement par l’intermédiaire de leur fleuret, et à toucher l’adversaire en premier. De tels nœuds de jointure peuvent ainsi caractériser la posture de l’entité en mouvement 9a ou 9b, notamment une posture d’un escrimeur de type « garde », « préparation » ou encore « attaque ». La détermination de telles positions, respectivement associées à une image présélectionnée 431 , peut permettre d’estimer les postures respectives de chaque entité en mouvement 9a, 9b à un moment donné et permettre à un arbitre de déterminer quelle entité en mouvement 9a ou 9b à amorcer son action en premier, notamment en analysant le passage d’une posture en « garde », à une posture en « préparation » jusqu’à une posture « attaque » qui pourra se solder par un jugement en faveur de l’une ou l’autre des entités en mouvement 9a, 9b. Néanmoins, comme cela est compréhensible à la lecture de ce document, la présente invention peut trouver une utilisation dans de nombreux domaines, dont des domaines sportifs par exemple pour de l’aide à l’arbitrage ou de l’aide à l’entrainement. Par exemple, les sports pouvant bénéficier de la présente invention peuvent être sélectionnés parmi : la Boxe, l’Escrime, le Judo, la Lutte gréco-romaine, la Lutte libre olympique, le Taekwondo, le Karaté, le Patinage, l’Equitation, le Canoë Kayak, le Cyclisme de piste, le Football, le Football américain, le Rugby, le Basket, le Baseball, le Volleyball, le Waterpolo, le Handball, le Tennis, le Squash, le Badminton, le Frontenis, le Tennis de table, la Gymnastique, la Natation synchronisée, et la Danse synchronisée. En particulier et comme cela est illustré dans cette description, l’invention pourra être utilisée dans le domaine de l’escrime, du football, et de l’équitation. Par exemple, elle pourra avantageusement être utilisée lors de l’arbitrage vidéo dans les disciplines d’équitation en cross-country pour le saut d'obstacles et dans l’Attelage pour le franchissement d'obstacles.
Il existe de nombreuses méthodes pour la génération d’une pluralité de points caractéristiques. Ces points et en particulier dans le cas de nœuds de jointure, peuvent notamment être générés selon une approche « Top-down » ou selon une approche « bottom-up ».
Les points caractéristiques sont caractérisés de préférence par un identifiant unique à chaque nœud de jointure par image et à des valeurs de position sur l’image ou sur tout autre référentiel. Les nœuds de jointures sont sélectionnés par exemple parmi au moins dix nœud de jointures, de préférence au moins quinze de façon plus préférée dix-sept nœuds de jointures. Les nœuds de jointures peuvent notamment être sélectionnés parmi : œil droit, œil gauche, oreille droite, oreille gauche, nez, épaule droite, épaule gauche, coude droit, coude gauche, poignet droit, poignet gauche, hanche droite, hanche gauche, genou droit, genou gauche, cheville droite et cheville gauche. De préférence, les nœuds de jointures sont sélectionnés parmi : épaule droite, épaule gauche, coude droit, coude gauche, poignet droit, poignet gauche, hanche droite, hanche gauche, genou droit, genou gauche, cheville droite et cheville gauche.
En particulier dans le cas de nœud de jointure, la position de chaque nœud de jointure est avantageusement associée à un score de confiance. Ainsi, le procédé selon l’invention peut évaluer si le positionnement des points caractéristique peut être considéré comme fiable ou si les résultats ultérieurs obtenus doivent être modulés par une éventuelle incertitude sur le positionnement des points caractéristiques. Ainsi, le procédé peut avantageusement comporter une étape de calcul d’un score de confiance pour chaque nœud de jointure.
Un procédé 1 de caractérisation d’un mouvement selon l’invention comporte une étape de calcul 600 d’une pluralité de descripteurs 701 des points caractéristiques 501 pour plusieurs des images présélectionnées 431. C’est en particulier le processeur 11 d’un dispositif informatique qui pourra être configuré pour réaliser une telle étape. De préférence, elle est réalisée à partir des valeurs de position des points caractéristiques 501 préalablement calculées. Ce calcul 600 est réalisé pour plusieurs des images présélectionnées 431. Alternativement, ce calcul est réalisé pour chacune des images présélectionnées. En particulier, il peut être réalisée pour au moins deux images présélectionnées 431 , de préférence pour au moins trois images présélectionnées 431 , de façon plus préférée pour toutes les images présélectionnées 431 .
La figure 8 illustre des sous étapes particulières du calcul 600 d’une pluralité de descripteurs 701 des points caractéristiques. En particulier, les descripteurs des points caractéristiques les plus pertinent et les plus informatifs sur un mouvement peuvent différer en fonction d’un mouvement considéré. Ainsi, avantageusement, le calcul de ces descripteurs de points caractéristiques peut être précédé par une sélection 610 des descripteurs à calculer les plus pertinent et cela peut notamment être réalisé selon une valeur associée aux images présélectionnées telle que par exemple une catégorie de mouvement.
Les descripteurs des points caractéristiques permettent de décrire la position des points caractéristiques les uns par rapport aux autres mais aussi l’évolution de ces positions en fonction du temps. Ainsi, cette étape de calcul 600 des descripteurs des points caractéristique peut comporter un calcul 620 d’une valeur de relation géométrique entre des points caractéristiques et/ou un calcul 630 d’une valeur d’évolution des valeurs de relation géométrique des points caractéristiques entre deux images présélectionnées. Avantageusement les descripteurs des points caractéristiques peuvent être normalisés de façon à s’adapté à n’importe quelle évolution de la prise de vue.
Comme cela est illustré à la figure 9, une entité en mouvement, tel qu’un escrimeur, est définie par la position dans l’espace des points caractéristiques 501 à un premier instant T1 et à un deuxième instant T2.
Le procédé selon l’invention comporte en particulier le calcul de la valeur d’une pluralité de descripteur de points caractéristiques 701a, 702a, 703a, 701b, 702b, 703b en fonction de préférence d’une valeur de relation géométrique entre les points caractéristiques.
Par exemple, un descripteur de points caractéristiques peut correspondre à l’angle 702a formé par deux segments associés à l’entité en mouvement, ou la distance 701a entre deux points caractéristiques 501 de l’entité en mouvement ou encore la surface 703a d’un polygone formé à partir des points caractéristiques.
En outre, un procédé selon l’invention peut comporter une étape de calcul d’une valeur de relation géométrique entre les points caractéristiques 501 , de préférence à partir des valeurs de position, et un calcul d’une valeur d’évolution de relation géométrique entre des valeurs de position des points caractéristiques 501 entre deux images présélectionnées. Dans ce cas, une partie au moins des descripteurs des points caractéristiques correspond à cette valeur d’évolution de relation géométrique entre les valeurs de position des points caractéristiques. Alternativement, une partie au moins des descripteurs des points caractéristiques correspond à cette valeur d’évolution des valeurs de relation géométrique des points caractéristiques entre deux images présélectionnées.
Par exemple, comme cela est illustré à la figure 9, la valeur d’évolution 701 de la distance entre deux points caractéristiques 501 de l’entité en mouvement peut être un descripteur des points caractéristiques au sens de l’invention. De façon préférée, une partie au moins desdits descripteurs de position des points caractéristiques 501 correspondent une valeur d’évolution de la relation géométrique entre des valeurs de position des points caractéristiques 501 entre deux images présélectionnées.
Comme cela est illustré à la figure 10, un procédé de caractérisation d’un mouvement conforme à l’invention peut être mis en œuvre pour analyser une action en lien avec une succession d’images décrivant deux entités en mouvement dans le cadre d’un match de football. Comme évoqué précédemment en lien avec la figure 9, une valeur de relation géométrique entre des points caractéristiques à partir des valeurs de position, et une valeur d’évolution de relation géométrique entre des valeurs de position desdits points caractéristiques, entre deux images présélectionnées peuvent être calculées. Les points caractéristiques ainsi sélectionnés peuvent notamment correspondre à un point caractéristique d’une entité en mouvement 9a et à un point caractéristique d’une entité en mouvement 9b. cela peut avantageusement fournir une aide précieuse à un arbitre, désireux de déterminer si une faute a été commise entre deux joueurs. L’analyse de l’évolution de relation géométrique des points caractéristiques de deux entités en mouvement au travers d’une succession d’images décrivant une action peut permettre de caractériser qu’un contact physique a bien eu lieu entre lesdites entités en mouvement et ainsi faciliter l’arbitrage.
Un procédé 1 de caractérisation d’un mouvement selon l’invention comporte une étape de comparaison 700 de la pluralité de descripteurs de points caractéristiques calculés à des descripteurs de points caractéristiques de référence. C’est en particulier le processeur 11 d’un dispositif informatique qui pourra être configuré pour réaliser une telle étape. En particulier, elle peut être réalisée à partir des descripteurs de points caractéristiques de référence mémorisés sur le référentiel 12b de mouvements de référence.
Il existe de nombreuses méthodes pour réaliser des comparaisons entre valeurs. De façon préférée, l’étape de comparaison 700 peut s’appuyer sur les méthodes d’apprentissage supervisée ou non supervisée.
Dans la catégorie des apprentissages supervisés il est possible, sur la base de descripteurs de points caractéristiques associés à des actions labellisés, d’attribuer à tous les descripteurs de points caractéristiques une étiquette correspondant à une action donnée. Ainsi, si à l’avenir un motif similaire à de tels descripteurs de points caractéristiques est généré alors il sera considéré comme étant à probabilité de correspondre à une action donnée.
De façon préférée, l’étape de comparaison 700 peut comporter la mise en oeuvre d’un modèle issu d’un apprentissage supervisé comportant la mise en oeuvre d’un algorithme sélectionné parmi : Méthode des k plus proches voisins, forêt d'arbres décisionnels, ou Machine à vecteurs de support.
De façon préférée et comme cela a été évoqué précédemment, la comparaison est réalisée par l’intermédiaire d’un modèle issu d’un apprentissage. En particulier, la comparaison est réalisée par l’intermédiaire d’un modèle issu d’un « Neuronal Network Perceptron ».
L’étape de comparaison 700 peut être réalisée à partir de descripteurs de points caractéristiques provenant de plusieurs caméras pour un même instant. De préférence, les caméras sont alors synchronisées et/ou font appel à un référentiel temporel permettant que ne soient fusionnées que des données provenant d’un même instant. Par exemple, le procédé selon l’invention peut comporter l’acquisition de vidéo provenant de différentes caméras filmant la même scène. Plusieurs caméras peuvent alors générer des données différentes et ces données sont comparées chacune à des règles et un mouvement peut être caractérisé notamment via la génération d’une valeur d’indice de caractérisation d’un mouvement.
En effet, un procédé 1 de caractérisation d’un mouvement selon l’invention comporte une étape de génération 800 d’une valeur d’indice de caractérisation d’un mouvement d’une entité en mouvement 9. C’est en particulier le processeur 11 d’un dispositif informatique qui pourra être configuré pour réaliser une telle étape. En particulier, elle peut être réalisée à partir de données provenant de la comparaison 700 de la pluralité de descripteurs de points caractéristiques.
La valeur d’indice de caractérisation d’un mouvement peut être générée par le modèle éventuellement utilisé lors de l’étape précédente de comparaison. Alternativement, elle peut être générée sur la base d’un calcul de similarité entre des descripteurs de points caractéristiques calculés et des descripteurs de points caractéristiques de référence. Elle peut aussi être issue d’une étape de classement des descripteurs de points caractéristiques calculés.
En outre, la valeur d’indice de caractérisation d’un mouvement peut correspondre à une valeur d’indice d’arbitrage. Dans ce cas, la valeur d’indice d’arbitrage peut correspondre à une indication de respect d’une règle d’arbitrale. De même, la valeur d’indice de caractérisation d’un mouvement peut correspondre à une valeur d’indice de performance, où elle correspond à une indication de respect d’un mouvement prédéterminé.
La description ci-avant a été faite pour un procédé 1 de caractérisation d’un mouvement se basant sur un flux vidéo. Néanmoins, comme cela a déjà été mentionné, le procédé selon l’invention peut se baser sur plusieurs vidéos, de préférence en flux continu. Dans ce cas, de façon préférée, chacune des vidéos subit un traitement selon les étapes 300 à 800 puis suite à l’étape de génération 800 d’une valeur d’indice de caractérisation d’un mouvement d’une entité en mouvement 9pour chacune des vidéos, le procédé comporte une étape de sélection d’une valeur d’indice consolidée de caractérisation d’un mouvement d’une entité en mouvement 9 à partir des valeurs d’indice de caractérisation d’un mouvement d’une entité en mouvement 9 de chacune des vidéos.
Un procédé 1 de caractérisation d’un mouvement selon l’invention peut aussi comporter une étape de transmission 900 d’une alerte si la valeur d’indice de caractérisation d’un mouvement d’une entité en mouvement dépasse un seuil prédéterminé. Le seuil prédéterminé pourra par exemple avoir été mémorisé sur une mémoire de données 12. C’est en particulier un module de communication d’un dispositif 10 informatique qui pourra être configuré pour réaliser une telle étape.
Ainsi, selon un autre aspect, l’invention porte sur un système 2 de caractérisation d’un mouvement d’une entité en mouvement 9, par exemple pour de l’aide à l’arbitrage ou l’entrainement sportif. Un exemple d’un système 2 local de caractérisation d’un mouvement d’une entité en mouvement selon l’invention est présenté notamment en lien avec la figure 11 A.
Un tel système 2 comporte un ou plusieurs dispositifs d’acquisition d’images 20, généralement placés de manière à ce que le champ de vision du dispositif d’acquisition d’images 20 par rapport à l’entité en mouvement 9a, 9b soit dégagé.
Avantageusement, un système 2 conforme à l’invention peut comprendre une multitude de dispositifs d’acquisition d’images disposés autour d’une zone susceptible de contenir l’entité en mouvement 9a, 9b. Notamment, une telle zone peut s’apparenter à un terrain de sport au sein duquel évolue des athlètes.
Les dispositifs d’acquisition d’images sont préférentiellement synchronisés, ce qui permet d’obtenir une pluralité d’images provenant de divers dispositifs d’acquisition d’images à un instant donné d’une même entité en mouvement 9a ou 9b mais selon des vues différentes. Cela permet avantageusement une analyse plus précise du mouvement effectué par l’entité en mouvement 9a ou 9b.
Un système conforme à l’invention comprend également un dispositif informatique 10 incluant un processeur 11 adapté au traitement et à l’analyse d’images de haute résolution. Ledit processeur effectue diverses commandes ou opérations arithmétiques et implémente diverses fonctions en exécutant un système d'exploitation ou des instructions de programmes stockés dans une mémoire 12 de données. Avantageusement, un dispositif informatique 10 peut comprendre une unité de traitement graphique pour effectuer un traitement d'image.
En outre, la mémoire 12 de données est configurée pour stocker un référentiel 12a d’actions de référence. Un tel référentiel 12a peut comprendre une pluralité d’images de référence comprenant des descripteurs de points caractéristiques associés à des actions labellisés, chaque label correspondant à une action donnée. Une action peut notamment correspondre à une position spécifique d’une entité en mouvement dans un cadre donné, notamment un référentiel 12a d’actions de référence peut être associé à une discipline particulière. Ainsi, une telle discipline, telle qu’à titre d’exemple non limitatif l’escrime, le football ou encore l’équitation, peut comprendre une multitude d’images de référence comprenant des descripteurs de points caractéristiques associés à une entité en mouvement 9a, 9b pour chaque action déterminée. Avantageusement mais non limitativement, l’entité en mouvement peut correspondre à un escrimeur effectuant différentes actions, telles que par exemple une attaque simple de type coup droit, dégagement, coupé, ou encore d’une attaque composée de type une-deux, feinte du coup droit dégager, doublement, tour d’épée, ou bien d’une riposte de type simple ou composée.
Dans un mode de réalisation particulier, l’entité en mouvement peut correspondre à un footballer effectuant différentes actions, telles que par exemple un tacle, une passe, un tir, une touche, une action défensive ou offensive.
La mémoire de données peut en outre comprendre un référentiel 12b de mouvements de référence. Un tel référentiel 12b peut comprendre une pluralité d’images de référence comprenant des descripteurs de points caractéristiques associés à un mouvement effectué par une entité en mouvement.
Le dispositif d’acquisition d’image 20 est couplé au dispositif informatique 10 et lui transmet une pluralité d'images 401 qui seront traitées par le processeur 11. Le dispositif d’acquisition d’image 20 et le dispositif informatique 10 peuvent être couplés, c’est-à-dire communiquer selon tout dispositif de communication connu, sans fil, ou selon un bus de communication filaire adapté à la transmission d’un flux d’images important ou d’une vidéo à un dispositif informatique 10, de préférence selon un flux d’images continu.
Comme décrit précédemment, le processeur du dispositif informatique 10 est avantageusement configuré pour effectuer diverses commandes ou opérations arithmétiques, notamment le processeur 11 est configuré pour présélectionner, à partir de la pluralité d’images 401 reçues, une ou plusieurs images 431 .
Les images sont alors de préférence présélectionnées en fonction de leur contenu et en particulier, de l’évolution de l’entité en mouvement dans la pluralité d’images. Ainsi, les images présélectionnées, à identifier, doivent correspondre à une séquence d’images décrivant un mouvement donné de l’entité en mouvement. Une telle identification peut correspondre au calcul d’un marqueur d’action (i.e. de mouvement) d’une entité en mouvement 9 dans la pluralité d’images reçues et sa comparaison avec un marqueur d’action (i.e. de mouvement) prédéterminé (e.g. de référence). Cela permet de sélectionner uniquement une séquence d’images correspondant à un mouvement donné, ledit mouvement pouvant être relatif à une action spécifique.
Le processeur est avantageusement configuré pour générer, à partir des images présélectionnées, une pluralité de points caractéristiques 501 de l’entité en mouvement 9 caractérisée par des valeurs de position. Comme décrit précédemment, les points caractéristiques de l’entité en mouvement sont généralement des points correspondant à des positions d’importance dans la caractérisation d’une entité en mouvement et peuvent correspondre à des noeuds de jointure.
Ainsi, un système selon l’invention peut évaluer si le positionnement des points caractéristique peut être considéré comme fiable ou si les résultats ultérieurs obtenus doivent être modulés par une éventuelle incertitude sur le positionnement des points caractéristiques.
En outre, le processeur d’un dispositif informatique 10 est configuré pour calculer, à partir des valeurs de position des points caractéristiques 501 , une pluralité de descripteurs des points caractéristiques 501 pour plusieurs des images présélectionnées 431. Cela permet avantageusement de reconstituer le mouvement effectué par une entité en mouvement à partir de révolution de la valeur des descripteurs de points caractéristiques de chaque image à des instants différents.
Afin de déterminer le mouvement effectué par une entité en mouvement 9, le processeur est configuré pour comparer la pluralité de descripteurs de points caractéristiques calculés à des descripteurs de points caractéristiques de référence mémorisés sur le référentiel 12b de mouvements de référence. Une telle comparaison peut être réalisée par l’intermédiaire d’un modèle issu d’un apprentissage supervisé ou non supervisé.
Enfin, le processeur est également configuré pour générer, à partir de la comparaison de la pluralité de descripteurs de points caractéristiques, une valeur d’indice de caractérisation d’un mouvement de l’entité en mouvement 9a, 9b. Cette valeur permet de fournir une information relative à la réalisation du mouvement préalablement identifié. Une telle réalisation peut être estimée non conforme suite à la comparaison au référentiel 12b de mouvements de référence et ainsi fournir une aide à la décision notamment dans le cadre de l’arbitrage sportif en lien avec une sanction, ou encore dans le cadre du juge sportif en lien avec l’attribution d’une note suite à une performance réalisée par un athlète.
En outre, l’invention prévoit qu’un système 2 de caractérisation d’un mouvement d’une entité en mouvement selon l’invention puisse être accessible par l’intermédiaire d’un réseau de communication adapté, tel que notamment un réseau Internet. Un tel système 2 distant est présenté en lien avec la figure 11 B.
Un tel système 2 distant comporte un ou plusieurs dispositifs d’acquisition d’images 20 tel que décrit en lien avec la figure 11 A.
Un système 2 distant conforme à l’invention comprend également un dispositif informatique 10 incluant un processeur 11 adapté au traitement et à l’analyse d’images de haute résolution, une mémoire 12 de données, stockant un référentiel 12a d’actions de référence et un référentiel 12b de mouvements de référence tel que décrit précédemment en lien avec la figure 11 A.
Ledit système distant comporte en outre un module d’authentification 13 comportant un identifiant ainsi qu’une clef d’authentification, permettant audit dispositif informatique 10 de se connecter à un serveur informatique distant, par l’intermédiaire d’un réseau de communication, pour stocker ou exploiter des données, notamment une ou plusieurs images capturées par les dispositifs d’acquisition d’images 20.
Pour cela, le module d’authentification 13 peut, à partir d’un réseau de communication adapté, se connecter audit serveur informatique distant par l’intermédiaire d’un mécanisme d'authentification incluant, avantageusement mais non limitativement, l’identification d’une correspondance entre l’identifiant et la clef d’authentification d’un dispositif informatique 10 et des informations d'identification d'utilisateur et/ou de dispositifs informatique et de clefs d’authentification correspondantes stockées dans une base de données du serveur informatique distant. Une telle identification, peut, dans le cas de l’identification d’un utilisateur, se faire par l’intermédiaire d’une interface utilisateur adaptée, notamment sous la forme de pages Web auxquelles l’utilisateur peut accéder en utilisant un dispositif informatique connecté à un réseau de communication adapté et en utilisant un navigateur Web. De la même manière que pour l’identification d’un dispositif informatique 10, l’utilisateur s’identifie au travers de ladite page web en entrant dans des champs correspondants un identifiant et une clef d’authentification, tel qu’un mot de passe.
Le dispositif d’acquisition d’image 20 est couplé au dispositif informatique 10 et lui transmet une pluralité d'images 401 qui seront traitées par le processeur 11. Le dispositif d’acquisition d’image 20 et le dispositif informatique 10 peuvent être couplés, c’est-à-dire communiquer selon tout dispositif de communication connu, sans fil, ou selon un bus de communication filaire adapté à la transmission d’un flux d’images important ou d’une vidéo à un dispositif informatique 10, de préférence selon un flux d’images continu.
Le dispositif informatique 10, pourra ainsi soit accéder au serveur informatique distant pour traiter et analyser les images qui y sont stockées, soit les stocker directement après avoir effectué diverses commandes ou opérations arithmétiques telles que précédemment décrites.
Ainsi, un client utilisateur 5, notamment une tablette manipulée par un arbitre, pourra accéder en temps réel au serveur informatique distant par l’intermédiaire du dispositif informatique 10 ou bien de tout dispositif adapté comprenant une interface utilisateur et des ressources matérielles et logicielles permettant l’accès à un réseau de communication tel qu’internet, et consulter les données générées par la mise en oeuvre d’un procédé de caractérisation d’un mouvement d’une entité en mouvement selon l’invention.

Claims

Revendications
1 . Procédé (1) de caractérisation d’un mouvement d’une entité en mouvement (9), par exemple pour de l’aide à l’arbitrage ou l’entrainement sportif, ledit procédé étant mis en oeuvre par un système (2) comportant un dispositif informatique (10) incluant un processeur (11 ) et une mémoire (12) de données, ladite mémoire de données étant configurée pour stocker un référentiel (12a) d’actions de référence et un référentiel (12b) de mouvements de référence, ledit procédé comportant les étapes suivantes :
Réception (300), par le dispositif informatique (10), d’une vidéo, de préférence en flux continu ;
- Pré-sélection (400), par le processeur (11), d’une ou de plusieurs images (431 ) au sein d’une pluralité d’images (401) de la vidéo ;
- Génération (500), par le processeur (11 ), d’une pluralité de points caractéristiques (501) de l’entité en mouvement (9) sur la ou les images présélectionnées (431), lesdits points caractéristiques (501) étant caractérisés par des valeurs de position ;
- Calcul (600), par le processeur (11 ) et à partir des valeurs de position des points caractéristiques (501), d’une pluralité de descripteurs des points caractéristiques (501) pour plusieurs des images présélectionnées (431) ;
- Comparaison (700), par le processeur (11), de la pluralité de descripteurs de points caractéristiques calculés à des descripteurs de points caractéristiques de référence mémorisés sur le référentiel (12b) de mouvements de référence, ladite comparaison pouvant être réalisée par l’intermédiaire d’un modèle issu d’un apprentissage ; et
- Génération (800), par le processeur (11 ) et à partir de la comparaison (700) de la pluralité de descripteurs de points caractéristiques, d’une valeur d’indice de caractérisation d’un mouvement de l’entité en mouvement (9).
2. Procédé (1) de caractérisation d’un mouvement selon la revendication 1 , caractérisé en ce que l’étape de calcul (600) d’une pluralité de descripteurs des points caractéristiques comporte un calcul (620) d’une valeur de relation géométrique entre des points caractéristiques (501) et en ce qu’une partie au moins desdits descripteurs des points caractéristiques (501) correspond à ladite valeur de relation géométrique calculée entre des points caractéristiques.
3. Procédé (1) de caractérisation d’un mouvement selon la revendication 2, caractérisé en ce que l’étape de calcul (600) comporte un calcul (620) de valeurs de relation géométrique entre des points caractéristiques (501) et un calcul (630) d’une valeur d’évolution des valeurs de relation géométrique des points caractéristiques (501) entre deux images présélectionnées (431) et en ce qu’une partie au moins desdits descripteurs des points caractéristiques (501) correspond à ladite valeur d’évolution des valeurs de relation géométrique des points caractéristiques entre deux images présélectionnées.
4. Procédé (1) de caractérisation d’un mouvement selon l’une quelconque des revendications précédentes caractérisé en ce que la présélection (400) comportant les sous-étapes suivantes :
- Génération (410) d’au moins une forme englobante (411 , 411 a, 411 b) sur une pluralité d’images, chacune des formes englobantes correspondant à une même entité en mouvement (9) et étant caractérisée par des valeurs de dimensions ;
- Comparaison (420) des valeurs de dimensions de formes englobantes générées pour deux images différentes de façon à identifier des marqueurs d’action entre formes englobantes, lesdits marqueurs d’action correspondant à des modifications des valeurs de dimensions des formes englobantes entre images ;
- Comparaison (430) des marqueurs d’action identifiés à des marqueurs d’action de référence mémorisés sur le référentiel (12a) d’actions, ladite comparaison pouvant être réalisée par l’intermédiaire d’un modèle issu d’un apprentissage, ladite comparaison permettant de présélectionner, au sein de la pluralité d’images (401), une ou plusieurs images (431).
5. Procédé (1) de caractérisation d’un mouvement selon l’une quelconque des revendications précédentes, caractérisé en ce que l’étape de comparaison (700) peut être réalisée à partir de descripteurs de points caractéristiques provenant de plusieurs caméras pour un même instant.
6. Procédé (1) de caractérisation d’un mouvement selon l’une quelconque des revendications précédentes, caractérisé en ce qu’il comporte l’attribution d’un identifiant unique à chaque point caractéristique par image et que chaque point caractéristique est associé à une position.
7. Procédé (1) de caractérisation d’un mouvement selon la revendication 6, caractérisé en ce que la position de chaque point caractéristique est associée à un score de confiance.
8. Procédé (1) de caractérisation d’un mouvement selon l’une quelconque des revendications précédentes, caractérisé en ce qu’il comporte en outre une étape de classification (440) de la ou des images présélectionnées, ladite classification correspondant à l’attribution d’une catégorie de mouvement à la ou aux images présélectionnées.
9. Procédé (1) de caractérisation d’un mouvement selon l’une quelconque des revendications précédentes, caractérisé en ce qu’au moins une partie des points caractéristiques (501) de l’entité en mouvement (9) sont des nœuds de jointures.
10. Procédé (1) de caractérisation d’un mouvement selon l’une quelconque des revendications précédentes, caractérisé en ce qu’il comporte en outre une procédure de calibration (100) des modèles et/ou référentiels utilisés dans le cadre du procédé.
11. Procédé (1) de caractérisation d’un mouvement selon l’une quelconque des revendications précédentes, caractérisé en ce qu’il comporte en outre une étape de reconnaissance faciale.
12. Procédé (1) de caractérisation d’un mouvement selon l’une quelconque des revendications précédentes, caractérisé en ce qu’il comporte une étape (900) de transmission d’une alerte si la valeur d’indice de caractérisation d’un mouvement d’une entité en mouvement dépasse un seuil prédéterminé.
13. Procédé (1) de caractérisation d’un mouvement selon l’une quelconque des revendications précédentes, caractérisé en ce que l’étape de réception (300) comporte la réception d’au moins deux vidéos, de préférence d’au moins trois vidéos, en flux continu, en ce qu’une valeur d’indice de caractérisation d’un mouvement de l’entité en mouvement (9) est généré pour chacune des vidéos et en ce qu’une valeur d’indice consolidé de caractérisation d’un mouvement de l’entité en mouvement (9) est généré à partir de de chacune des valeurs d’indice de caractérisation d’un mouvement de l’entité en mouvement (9).
14. Système (2) de caractérisation d’un mouvement d’une entité en mouvement (9), par exemple pour de l’aide à l’arbitrage ou l’entrainement sportif, ledit système comportant : - un ou plusieurs dispositifs d’acquisition d’images (20), apte à transmettre une vidéo à un dispositif informatique (10), de préférence en flux continu ;
- le dispositif informatique (10) incluant un processeur (11 ) et une mémoire (12) de données, ladite mémoire de données étant configurée pour stocker un référentiel (12a) d’actions de référence et un référentiel (12b) de mouvement de référence, ledit processeur étant configuré pour : o pré-sélectionner une ou plusieurs images (431) au sein d’une pluralité d’images (401) de la vidéo ; o Générer une pluralité de points caractéristiques (501 ) de l’entité en mouvement (9) sur la ou les images présélectionnées (431), lesdits points caractéristiques (501) étant caractérisés par des valeurs de position ; o Calculer, à partir des valeurs de position des points caractéristiques, une pluralité de descripteurs des points caractéristiques (501) pour plusieurs des images présélectionnées (431) ; o Comparer la pluralité de descripteurs de points caractéristiques calculés à des descripteurs de points caractéristiques de référence mémorisés sur le référentiel (12b) de mouvements de référence, ladite comparaison pouvant être réalisée par l’intermédiaire d’un modèle issu d’un apprentissage ; et o Générer, à partir de la comparaison de la pluralité de descripteurs de points caractéristiques, une valeur d’indice de caractérisation d’un mouvement de l’entité en mouvement (9).
15. Produit programme d’ordinateur comportant une ou plusieurs instructions exécutables par un dispositif informatique (10), provoquant la mise en oeuvre d’un procédé de caractérisation d’un mouvement d’une entité en mouvement selon l’une quelconque des revendications 1 à 13.
PCT/FR2019/052591 2019-11-03 2019-11-03 Procede et systeme de caracterisation d'un mouvement d'une entite en mouvement WO2021084165A1 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP19832717.3A EP4066087A1 (fr) 2019-11-03 2019-11-03 Procede et systeme de caracterisation d'un mouvement d'une entite en mouvement
PCT/FR2019/052591 WO2021084165A1 (fr) 2019-11-03 2019-11-03 Procede et systeme de caracterisation d'un mouvement d'une entite en mouvement

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/FR2019/052591 WO2021084165A1 (fr) 2019-11-03 2019-11-03 Procede et systeme de caracterisation d'un mouvement d'une entite en mouvement

Publications (1)

Publication Number Publication Date
WO2021084165A1 true WO2021084165A1 (fr) 2021-05-06

Family

ID=69143610

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2019/052591 WO2021084165A1 (fr) 2019-11-03 2019-11-03 Procede et systeme de caracterisation d'un mouvement d'une entite en mouvement

Country Status (2)

Country Link
EP (1) EP4066087A1 (fr)
WO (1) WO2021084165A1 (fr)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1910977A1 (fr) 2005-07-29 2008-04-16 Telecom Italia S.p.A. Reconnaissance biometrique automatique basee sur la reconnaissance faciale et sur le support de machines vectorielles
US20090220124A1 (en) * 2008-02-29 2009-09-03 Fred Siegel Automated scoring system for athletics
US20120214594A1 (en) * 2011-02-18 2012-08-23 Microsoft Corporation Motion recognition
US9665804B2 (en) 2014-11-12 2017-05-30 Qualcomm Incorporated Systems and methods for tracking an object
US20170193284A1 (en) 2016-01-05 2017-07-06 Electronics And Telecommunications Research Institute Face recognition apparatus and method using physiognomic feature information
US9811732B2 (en) 2015-03-12 2017-11-07 Qualcomm Incorporated Systems and methods for object tracking
US9836852B2 (en) 2013-12-21 2017-12-05 Qualcomm Incorporated System and method to stabilize display of an object tracking box
US9852511B2 (en) 2013-01-22 2017-12-26 Qualcomm Incoporated Systems and methods for tracking and detecting a target object
US9865062B2 (en) 2016-02-12 2018-01-09 Qualcomm Incorporated Systems and methods for determining a region in an image
KR20180079894A (ko) 2017-01-03 2018-07-11 한국전자통신연구원 얼굴인식 정보 제공 방법, 이를 이용하는 얼굴인식 서버 및 얼굴인식 시스템
KR20180109227A (ko) 2017-03-27 2018-10-08 (주)아크릴 감정 인식 방법 및 프로그램과, 감정 인식기 생성 방법 및 프로그램
WO2019107641A1 (fr) 2017-12-01 2019-06-06 상명대학교산학협력단 Appareil destiné à la reconnaissance d'émotions par l'intermédiaire d'une analyse de comportement fondée sur le gps, et procédé associé
US20190213400A1 (en) 2018-01-05 2019-07-11 Samsung Electronics Co., Ltd. Method and apparatus with emotion recognition
EP3528207A1 (fr) 2016-10-11 2019-08-21 Fujitsu Limited Dispositif, programme et procédé de reconnaissance de mouvement

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1910977A1 (fr) 2005-07-29 2008-04-16 Telecom Italia S.p.A. Reconnaissance biometrique automatique basee sur la reconnaissance faciale et sur le support de machines vectorielles
US20090220124A1 (en) * 2008-02-29 2009-09-03 Fred Siegel Automated scoring system for athletics
US20120214594A1 (en) * 2011-02-18 2012-08-23 Microsoft Corporation Motion recognition
US9852511B2 (en) 2013-01-22 2017-12-26 Qualcomm Incoporated Systems and methods for tracking and detecting a target object
US9836852B2 (en) 2013-12-21 2017-12-05 Qualcomm Incorporated System and method to stabilize display of an object tracking box
US9665804B2 (en) 2014-11-12 2017-05-30 Qualcomm Incorporated Systems and methods for tracking an object
US9811732B2 (en) 2015-03-12 2017-11-07 Qualcomm Incorporated Systems and methods for object tracking
US20170193284A1 (en) 2016-01-05 2017-07-06 Electronics And Telecommunications Research Institute Face recognition apparatus and method using physiognomic feature information
US9865062B2 (en) 2016-02-12 2018-01-09 Qualcomm Incorporated Systems and methods for determining a region in an image
EP3528207A1 (fr) 2016-10-11 2019-08-21 Fujitsu Limited Dispositif, programme et procédé de reconnaissance de mouvement
KR20180079894A (ko) 2017-01-03 2018-07-11 한국전자통신연구원 얼굴인식 정보 제공 방법, 이를 이용하는 얼굴인식 서버 및 얼굴인식 시스템
KR20180109227A (ko) 2017-03-27 2018-10-08 (주)아크릴 감정 인식 방법 및 프로그램과, 감정 인식기 생성 방법 및 프로그램
WO2019107641A1 (fr) 2017-12-01 2019-06-06 상명대학교산학협력단 Appareil destiné à la reconnaissance d'émotions par l'intermédiaire d'une analyse de comportement fondée sur le gps, et procédé associé
US20190213400A1 (en) 2018-01-05 2019-07-11 Samsung Electronics Co., Ltd. Method and apparatus with emotion recognition

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JEONGEUN SHIN ET AL: "A study on motion analysis of an artistic gymnastics by using dynamic image processing - for a development of automatic scoring system of horizontal bar -", 2008 IEEE INTERNATIONAL CONFERENCE ON SYSTEMS, MAN AND CYBERNETICS : SMC ; SINGAPORE, 12 - 15 OCTOBER 2008, 15 May 2008 (2008-05-15), Piscataway, NJ, US, pages 1037 - 1042, XP055617277, ISBN: 978-1-4244-2383-5, DOI: 10.1109/ICSMC.2008.4811418 *

Also Published As

Publication number Publication date
EP4066087A1 (fr) 2022-10-05

Similar Documents

Publication Publication Date Title
US9600717B1 (en) Real-time single-view action recognition based on key pose analysis for sports videos
US10129608B2 (en) Detect sports video highlights based on voice recognition
US10572735B2 (en) Detect sports video highlights for mobile computing devices
EP3792821A1 (fr) Reconnaissance d'action utilisant des représentations de pose implicites
US9953222B2 (en) Selecting and presenting representative frames for video previews
CN111428088A (zh) 视频分类方法、装置及服务器
Hoang Ngan Le et al. Robust hand detection and classification in vehicles and in the wild
US9767363B2 (en) System and method for automatic detection of spherical video content
TWI510064B (zh) 視訊推薦系統及其方法
US11853357B2 (en) Method and system for dynamically analyzing, modifying, and distributing digital images and video
US10939143B2 (en) System and method for dynamically creating and inserting immersive promotional content in a multimedia
CN111491187A (zh) 视频的推荐方法、装置、设备及存储介质
JP2018081630A (ja) 検索装置、検索方法およびプログラム
JP2009163639A (ja) オブジェクト軌道識別装置、オブジェクト軌道識別方法、及びオブジェクト軌道識別プログラム
KR101124560B1 (ko) 동영상 내의 자동 객체화 방법 및 객체 서비스 저작 장치
EP3937071A1 (fr) Procédé d'assistance au suivi en temps réel d'au moins une personne sur des séquences d'images
US9767564B2 (en) Monitoring of object impressions and viewing patterns
WO2021084165A1 (fr) Procede et systeme de caracterisation d'un mouvement d'une entite en mouvement
CN112104914A (zh) 视频推荐方法及装置
WO2022117096A1 (fr) Procédé et appareil de reconnaissance d'image de point de vue à la première personne, et support de stockage lisible par ordinateur
CN110969133B (zh) 一种乒乓球比赛视频的智能数据采集方法
US11694442B2 (en) Systems and methods for counting repetitive activity in audio video content
de Gevigney Machine Learning Models for Multimodal Detection of Anomalous Behaviors
Han et al. An audio-visual objective quality model based on BP neutral network
Jabaren Tennis Serve Classification Using Machine Learning

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19832717

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2019832717

Country of ref document: EP

Effective date: 20220603