Différence entre apprentissage automatique supervisé et non supervisé

Différence clé - supervisé contre Non supervisé Apprentissage machine
 

L'apprentissage supervisé et l'apprentissage non supervisé sont deux concepts fondamentaux de l'apprentissage automatique. L'apprentissage supervisé est une tâche d'apprentissage automatique consistant à apprendre une fonction qui associe une entrée à une sortie en fonction des exemples de paires entrée-sortie. L'apprentissage non supervisé est la tâche d'apprentissage automatique consistant à inférer une fonction décrivant la structure cachée à partir de données non étiquetées. le différence clé entre apprentissage automatique supervisé et non supervisé est que l'apprentissage supervisé utilise des données étiquetées tandis que l'apprentissage non supervisé utilise des données non étiquetées.

L'apprentissage automatique est un domaine de l'informatique qui permet à un système informatique d'apprendre à partir de données sans être explicitement programmé. Il permet d’analyser les données et d’en prévoir les tendances. Il existe de nombreuses applications de l'apprentissage automatique. Certains d'entre eux sont la reconnaissance du visage, la reconnaissance des gestes et la reconnaissance de la parole. Il existe différents algorithmes liés à l'apprentissage automatique. Certains d'entre eux sont la régression, la classification et le regroupement. Les langages de programmation les plus courants pour développer des applications basées sur l'apprentissage automatique sont R et Python. D'autres langages tels que Java, C ++ et Matlab peuvent également être utilisés.

CONTENU

1. Vue d'ensemble et différence clé
2. Qu'est-ce que l'apprentissage supervisé?
3. Qu'est-ce que l'apprentissage non supervisé?
4. Similitudes entre l'apprentissage automatique supervisé et non supervisé
5. Comparaison côte à côte - Apprentissage automatique supervisé ou non supervisé sous forme de tableau
6. Résumé

Qu'est-ce que l'apprentissage supervisé??

Dans les systèmes basés sur l'apprentissage automatique, le modèle fonctionne selon un algorithme. En apprentissage supervisé, le modèle est supervisé. Tout d'abord, il est nécessaire de former le modèle. Avec les connaissances acquises, il peut prédire des réponses pour les instances futures. Le modèle est formé à l'aide d'un jeu de données étiqueté. Lorsqu'un échantillon de données est donné au système, il peut prédire le résultat. Voici un petit extrait du jeu de données populaire IRIS.

Selon le tableau ci-dessus, la longueur du sépale, la largeur du sépale, la longueur du patel, la largeur du patel et les espèces sont appelées les attributs. Les colonnes sont appelées caractéristiques. Une ligne contient des données pour tous les attributs. Par conséquent, une ligne s'appelle une observation. Les données peuvent être numériques ou catégoriques. Le modèle reçoit les observations avec le nom de l'espèce correspondant en entrée. Quand une nouvelle observation est donnée, le modèle devrait prédire le type d’espèce à laquelle il appartient..

Dans l'apprentissage supervisé, il existe des algorithmes de classification et de régression. La classification est le processus de classification des données étiquetées. Le modèle a créé des limites séparant les catégories de données. Lorsque de nouvelles données sont fournies au modèle, celui-ci peut être classé en fonction de l'emplacement du point. Les voisins les plus proches (KNN) est un modèle de classification. En fonction de la valeur k, la catégorie est décidée. Par exemple, lorsque k vaut 5, si un point de données particulier se trouve près de huit points de données de la catégorie A et de six points de données de la catégorie B, le point de données sera alors classé en.

La régression est le processus de prédiction de la tendance des données précédentes pour prédire le résultat des nouvelles données. En régression, la sortie peut consister en une ou plusieurs variables continues. La prévision est effectuée à l'aide d'une ligne couvrant la plupart des points de données. Le modèle de régression le plus simple est une régression linéaire. Il est rapide et ne nécessite pas de paramètres de réglage tels que ceux de KNN. Si les données montrent une tendance parabolique, le modèle de régression linéaire ne convient pas.

Voici quelques exemples d’algorithmes d’apprentissage supervisé. En règle générale, les résultats générés par les méthodes d'apprentissage supervisé sont plus précis et fiables, car les données d'entrée sont bien connues et étiquetées. Par conséquent, la machine doit analyser uniquement les motifs cachés.

Qu'est-ce que l'apprentissage non supervisé??

Dans l'apprentissage non supervisé, le modèle n'est pas supervisé. Le modèle fonctionne seul pour prédire les résultats. Il utilise des algorithmes d’apprentissage automatique pour tirer des conclusions sur des données non étiquetées. En règle générale, les algorithmes d'apprentissage non supervisé sont plus difficiles que les algorithmes d'apprentissage supervisé car il y a peu d'informations. Le regroupement est un type d'apprentissage non supervisé. Il peut être utilisé pour regrouper les données inconnues à l'aide d'algorithmes. Le clustering basé sur la moyenne k et la densité sont deux algorithmes de clustering.

algorithme k-mean, place k centroïde au hasard pour chaque groupe. Ensuite, chaque point de données est affecté au centroïde le plus proche. La distance euclidienne est utilisée pour calculer la distance entre le point de données et le centroïde. Les points de données sont classés en groupes. Les positions pour k centroïdes sont à nouveau calculées. La nouvelle position du centroïde est déterminée par la moyenne de tous les points du groupe. Encore une fois, chaque point de données est attribué au centroïde le plus proche. Ce processus se répète jusqu'à ce que les centroïdes ne changent plus. k-mean est un algorithme de clustering rapide, mais il n'y a pas d'initialisation spécifiée des points de clustering. En outre, il existe une grande variation des modèles de clustering basés sur l'initialisation des points de cluster.

Un autre algorithme de clustering est Clustering basé sur la densité. Il est également connu sous le nom d'applications de clustering spatial basé sur la densité avec bruit. Cela fonctionne en définissant un cluster comme l'ensemble maximum de points connectés en densité. Ce sont deux paramètres utilisés pour le clustering basé sur la densité. Ce sont (epsilon) et le minimum de points. Le est le rayon maximum du voisinage. Les points minimum sont le nombre minimum de points dans le voisinage pour définir un cluster. Ce sont quelques exemples de regroupement qui tombe dans l'apprentissage non supervisé.

Généralement, les résultats générés à partir d'algorithmes d'apprentissage non supervisés ne sont pas très précis et fiables car la machine doit définir et étiqueter les données d'entrée avant de déterminer les modèles et fonctions cachés..

Quelle est la similitude entre l'apprentissage automatique supervisé et non supervisé??

  • L'apprentissage supervisé et l'apprentissage non supervisé sont tous deux des types d'apprentissage automatique..

Quelle est la différence entre un apprentissage automatique supervisé et non supervisé??

Apprentissage automatique supervisé ou non supervisé

L'apprentissage supervisé est la tâche d'apprentissage automatique qui consiste à apprendre une fonction qui associe une entrée à une sortie à l'aide d'exemples de paires entrée-sortie.. L'apprentissage non supervisé est la tâche d'apprentissage automatique consistant à inférer une fonction décrivant la structure cachée à partir de données non étiquetées..
 Fonctionnalité principale
En apprentissage supervisé, le modèle prédit le résultat en fonction des données d'entrée étiquetées.. Dans l’apprentissage non supervisé, le modèle prédit le résultat sans données étiquetées en identifiant les modèles par lui-même..
Précision des résultats
Les résultats générés par les méthodes d'apprentissage supervisé sont plus précis et fiables. Les résultats générés par des méthodes d'apprentissage non supervisées ne sont pas très précis et fiables..
Algorithmes Principaux
Il existe des algorithmes de régression et de classification en apprentissage supervisé. Il existe des algorithmes pour la mise en cluster dans l'apprentissage non supervisé.

Résumé - Supervisé contre Non supervisé Apprentissage machine

L'apprentissage supervisé et l'apprentissage non supervisé sont deux types d'apprentissage automatique. L'apprentissage supervisé est la tâche d'apprentissage automatique qui consiste à apprendre une fonction qui associe une entrée à une sortie en fonction d'exemples de paires entrée-sortie. L'apprentissage non supervisé est la tâche d'apprentissage automatique consistant à inférer une fonction décrivant la structure cachée à partir de données non étiquetées. La différence entre l'apprentissage automatique supervisé et non supervisé réside dans le fait que l'apprentissage supervisé utilise des données étiquetées, tandis que l'apprentissage non supervisé utilise des données non étiquetées..

Référence:

1.Le Big Data University. Machine Learning - Apprentissage supervisé vs non supervisé, classe cognitive, 13 mars 2017. Disponible ici 
2. «Apprentissage non supervisé». Wikipedia, Wikimedia Foundation, 20 mars 2018. Disponible ici 
3. «Apprentissage supervisé». Wikipedia, Wikimedia Foundation, 15 mars 2018. Disponible ici

Courtoisie d'image:

1.'2729781 'de GDJ (domaine public) via Pixabay