Les types de machine learning et leur différences.

Les types de machine learning et leur différences.

Le domaine de l’apprentissage est vaste et les approches multiples, il en va de même pour les modèles de Machine Learning. L’apprentissage automatique se divise en plusieurs grandes approches en fonction des tâches à réaliser, mais également des éléments dont nous disposons à l’étude.

Pour préparer un modèle de ML, plusieurs étapes sont nécessaires. La première étape consiste à définir la problématique que nous souhaitons résoudre. En parallèle, il est également nécessaire de bien analyser les données que nous avons à disposition ainsi que de les préparer pour notre contexte. A partir de ce moment, plusieurs modèles d’apprentissage automatique peuvent être sollicités en fonction de leurs avantages et de leurs inconvénients aux eus et regards des données. 

S’ensuit la seconde étape, dans laquelle nous pouvons évaluer les résultats de plusieurs modèles et améliorer les algorithmes par de l’optimisation et du paramétrage. C’est donc après cette phase d’étude préliminaire que nous pouvons exploiter un modèle.

Une grande force de l’apprentissage automatique se trouve être la richesse de ces approches permettant d’en de nombreux cas de trouver un modèle pour répondre à une tâche. Dans la pléthore des modèles qui ont été découverts, plusieurs éléments distinctifs permettent de catégoriser les modèles. 

Premier élément distinctif, l’apprentissage supervisé et l’apprentissage non supervisé.

Selon la nature des données disponibles pour le modèle, on distingue trois grandes familles qui sont régulièrement employées comme base pour dissocier les approches.

Le premier principe qui divise les processus de ML est l’aspect prédictif (supervised) ou à l’inverse unsupervised des jeux de données en entrée. L’apprentissage consiste à emmagasiner de l’expérience et à l’utiliser pour faire émerger des connaissances. Mais cette expérience peut varier selon la situation. Parfois, l’expérience consiste à regarder une situation se dérouler à laquelle une réponse est donnée, parfois la réponse n’est pas fournie.

Les rudiments de l’apprentissage supervisé.

Dans le cas où une réponse serait donnée pour un nombre suffisant de cas, nous sommes dans le cadre de l’apprentissage supervisé. Finalement, lorsqu’une réponse est donnée, c’est comme si un superviseur avait apporté une information supplémentaire. Il y a un ensemble d’éléments dont on connaît la réponse, on a un jeu de données dit de test pour valider notre futur modèle.

Lorsque les données sont fournies avec une valeur de sortie attendue, au moins pour une partie des données, l’objectif est de définir une règle générale permettant de faire concorder les données avec celle de sortie. Les données de sortie, quand elles sont définies, indiquent que l’échantillon est labellisé ou étiqueté. La part des données labellisées est généralement fournie par une captation du réel sous la forme de données ou par une labellisation dans un second temps par des experts du domaine d’étude ou un ensemble d’individus labellisant à la main des données à grande échelle.

En d’autres termes, le but est de définir un modèle prédictif qui pour un ensemble d’éléments (X; y) où X est un ensemble de données et y, la réponse apportée pour l’ensemble X permet de trouver plus tard la valeur y inconnus pour un nouvel élément X. Les éléments de X,  sont appelés généralement les features ou les attributs. Ils peuvent être de plusieurs formes allant de données numériques à des images ou des textes. Evidemment, dans un ensemble de données X, il peut y avoir un mélange de différentes formes de données. 

L’élément y peut aussi être de plusieurs formes, mais généralement, il s’agit d’une donnée dite catégoriel se définissant par un format texte ou numérique. On parle dans ce cas de problème de classification, on cherche à définir la classe dans laquelle se situe un ensemble X. Quand y est une valeur non-catégorielle comme un réel par exemple, on parle de problème de régression. On cherche à déterminer la valeur de y en se basant sur les relations d’autres couples (X; y) connus, on fait une régression à ce qu’on sait du comportement mis en avant par le jeu de données.

Dans le champ de l’apprentissage supervisé, on retrouve plusieurs méthodes pour la reconnaissance vocale, les recommandations ou encore la détection de spam. 

Les fondements de l’apprentissage non supervisé.

Dans le cas où nous aurions des données, mais aucune réponse n’a été donnée, la situation devient de plus délicate pour définir une règle. Malheureusement, c’est le cas le plus récurrent. On fait alors intervenir des modèles non supervisés.

Ici, nous n’avons plus de couple (X; y) mais seulement plusieurs éléments X sans la partie y. Des données sont bien présentes mais elles sont transmises sans structure définie et aucune valeur y n’est proposée. C’est au modèle de définir des valeurs y qui lui semblent efficaces pour définir des ensembles. Par ailleurs, les données présentées sans élément de catégorisation sont dites non-étiquetées.

Évidemment, l’analyse de pertinence du modèle est plus difficile car nous ne possédons pas de données de référence pour valider le travail de l’algorithme. Dans cette situation, le modèle doit proposer une structure des données pertinente aux eus et regards des données fournies.

L’apprentissage non supervisé est très souvent employé pour la détection de phénomènes anormaux comme dans le cas de fraude ou de maladies rares. Le fait d’améliorer la compréhension des données d’entrée en employant des techniques de réduction des dimensions ou de nettoyage du bruit est souvent nécessaire.

Pour conclure sur les deux grandes familles supervisées et non supervisées, il est important de préciser qu’il existe des approches hybrides notamment le semi-supervised learning lorsque le volume de données étiquetées est jugé insuffisant pour les modèles d’apprentissage supervisé. Ceci est très récurrent lorsqu’il est coûteux de faire intervenir des experts pour labelliser les jeux de données. Il s’agit souvent d’une alternative efficace face aux difficultés réelles de la récolte d’information ainsi que son traitement.

Le cas particulier de l’apprentissage par renforcement.

Le dernier champ majeur en apprentissage machine est l’apprentissage par renforcement qui utilise un tout autre paradigme. Cette approche est moins mise en avant, mais qui connaît un gain d’intérêt notamment grâce à de nombreux usages ces derniers temps. Ici, à chaque étape, le modèle ML va apprendre si une action menée est positive ou négative à l’aide d’une politique de distribution de récompense. Le modèle va adapter son comportement grâce aux retours que donne une action de sa part sur les données. Le modèle essayant de suivre par lui-même les objectifs que l’on a définis. Dans ce champ, on retrouve la robotique ou les transports autonomes. La grande différence de cette famille de modèles, c’est que l’algorithme interagit directement avec l’environnement.

Les différences liées à l’usage de l’apprentissage automatique.

L’apprentissage actif et l’apprentissage passif.

La question se pose dans cette section, sur l’action menée par le modèle. Si celui-ci lors de son entraînement vient agrémenter les informations mis initialement à disposition en agissant sur les données initiales, on est dans le cadre d’un apprentissage actif. Si le modèle reste dans une lecture stricte des données d’entrée, il est dit passif.

L’apprentissage en ligne et l’apprentissage hors ligne.

Une autre distinction importante concerne le contexte d’apprentissage et distingue les modèles qui doivent analyser la situation en ligne, c’est-à-dire en fournissant un résultat en même temps que d’apprendre, et ceux qui ont le temps en amont (hors-ligne) d’analyser un volume de données d’entraînement et ne se base que sur l’entraînement préalable pour fournir les résultats a posteriori. Dans l’apprentissage en ligne, on imagine bien qu’une courbe de progression est nécessaire pour que le modèle apporte des résultats concluants. Il existe donc des approches hybrides ou le modèle en ligne ne démarre pas totalement sans expérience (démarrage à froid).

Des différences dans les actions à réaliser sur les modèles d’apprentissage machine.

Le modèle a-t-il besoin d’un agent extérieur ?

Une distinction majeure concerne l’accompagnement ou non du modèle. Ceci peut se faire en faisant collaborer un expert humain ou un autre algorithme pour aider le modèle à atteindre ses objectifs. Il est également possible d’utiliser un acteur adversaire du modèle cherchant à l’induire en erreur pour qu’il s’améliore.

Le paramétrage des algorithmes de Machine Learning.

On peut également dissocier les approches de machine learning en fonction que le modèle soit paramétrable ou non-paramétrable. Un modèle paramétrable pourra être optimisé en trouvant la bonne configuration de paramètre et ses performances peuvent être analysées à l’aide d’une fonction.

Le point majeur qui permet de définir la configuration optimale est la nature du jeu de données mis à disposition. Souvent, les jeux de données sont limités en volume. Parfois, et c’est plus grave, les jeux de données ne sont pas représentatif de l’ensemble d’études (surgénéralisation). Il est possible dans ce cas, pour les algorithmes de Machine Learning paramétrable de pallier ce défaut partiellement. 

Des divergences dans le choix des techniques employés par les algorithmes.

Enfin, en plus des différenciations susnommées, les algorithmes de ML sont aussi divisés en plusieurs familles suivant les techniques employés. On peut en présenter quatre principales.

L’apprentissage logique

Il s’agit sûrement de l’approche la plus rapidement mise en avant. Ici, l’humain vient proposer des règles à l’algorithme que celui-ci doit suivre pour suivre un raisonnement logique et émettre des hypothèses. Nous sommes proches ici des fondamentaux de l’automatisation.

L’apprentissage statistique

Les données pour ces algorithmes d’apprentissage jouent un rôle majeur, puisque leur nature va orienter la recherche autour d’une fonction permettant de faire la liaison entre les données d’entrée et les données de sortie. Pour ce faire, les modèles utilisent des notions venant des mathématiques et plus communément des statistiques. 

L’apprentissage par réseaux de neurones artificiels

Les ANN (Artificial Neural Network) se basent sur la structure des neurones en biologie animale pour déterminer des relations complexes entre les données d’entrée et de sortie. Ce groupe a été décliné par la suite en une nouvelle sous-branche appelée le deep learning, consistant à employer les capacités de calcul des machines modernes pour concevoir des réseaux de plus en plus étendus (profond) pour répondre à des problèmes complexes.

Les algorithmes génétiques

Pour terminer, les algorithmes génétiques imitent également un concept biologique, celui de la théorie de l’évolution avec des événements comme les mutations et les croisement pour faire apparaître des modèles optimisés pour une situation précise.

Pour conclure sur cette première introduction autour des différenciations marquantes entre les différentes approches d’apprentissage automatique, il est important de retenir que le Machine Learning propose des solutions variées et que choisir la bonne méthode en amont est la clé de la réussite. Nous ne sommes pas rentrés dans les détails de quelles familles est la meilleure pour tel ou tel problème, tout simplement parce que cette question dépend énormément du contexte et des cas particuliers. Finalement, ce n’est qu’en ayant une culture globale sur les différentes techniques que l’ingénieur IA peut proposer un modèle après avoir analysé dans quel cadre il doit travailler. 

Photo Maxime Macé

Maxime Macé

Simple passionné de thématiques diverses et variées. J’apprécie enrichir mes connaissances dans les disciplines techniques comme l’informatique, les sciences et l’ingénierie, mais aussi dans les domaines merveilleux de la philosophie, l’art et la littérature.

Prenons contact

Vous souhaitez me contacter suite à la lecture de cet article ? Merci de renseigner votre adresse électronique et je vous recontacterai dans les plus brefs délais.

CV Ingénieur développeur informatique

CV Étudiant PhD Artificial Intelligence

Portfolio Artist designer