Recherche de site Web

Introduction douce à la modélisation prédictive


Quand on est un débutant absolu, cela peut être très déroutant. C’est frustrant.

Même les idées qui semblent si simples rétrospectivement sont étrangères lorsque vous les rencontrez pour la première fois. Il y a une toute nouvelle langue à apprendre.

J'ai récemment reçu cette question :

Donc, en utilisant l'exercice de l'iris comme exemple, si je devais cueillir une fleur de mon jardin, comment utiliserais-je l'algorithme pour prédire de quoi il s'agit ?

C'est une excellente question.

Dans cet article, je souhaite donner une introduction douce à la modélisation prédictive.

1. Exemples de données

Les données sont des informations sur le problème sur lequel vous travaillez.

Imaginez que nous voulions identifier l'espèce de fleur à partir des mesures d'une fleur.

Les données sont composées de quatre mesures de fleurs en centimètres, ce sont les colonnes des données.

Chaque ligne de données est un exemple de fleur qui a été mesurée et son espèce connue.

Le problème que nous résolvons est de créer un modèle à partir des données d'échantillonnage qui puisse nous indiquer à quelle espèce appartient une fleur à partir de ses seules mesures.

2. Apprenez un modèle

Ce problème décrit ci-dessus est appelé apprentissage supervisé.

Le but d’un algorithme d’apprentissage supervisé est de prendre des données avec une relation connue (mesures réelles des fleurs et espèces de fleurs) et de créer un modèle de ces relations.

Dans ce cas, le résultat est une catégorie (espèce de fleur) et nous appelons ce type de problème un problème de classification. Si le résultat était une valeur numérique, nous appellerions cela un problème de régression.

L’algorithme fait l’apprentissage. Le modèle contient les relations apprises.

Le modèle lui-même peut être constitué d'une poignée de nombres et d'un moyen d'utiliser ces nombres pour relier une entrée (mesures de la fleur en centimètres) à un résultat (l'espèce de fleur).

Nous souhaitons conserver le modèle après l'avoir appris à partir de nos exemples de données.

3. Faites des prédictions

Nous n'avons pas besoin de conserver les données d'entraînement car le modèle a résumé les relations qu'il contient.

La raison pour laquelle nous conservons le modèle appris à partir des données est que nous voulons l'utiliser pour faire des prédictions.

Dans cet exemple, nous utilisons le modèle en prenant des mesures sur des fleurs spécifiques dont nous ne connaissons pas l’espèce.

Notre modèle lira les entrées (nouvelles mesures), effectuera un calcul quelconque avec ses nombres internes et fera une prédiction sur de quelle espèce de fleur il s’agit.

La prédiction n’est peut-être pas parfaite, mais si vous disposez de bons échantillons de données et d’un modèle robuste tiré de ces données, elle sera assez précise.

Résumé

Dans cet article, nous avons fait une introduction très douce à la modélisation prédictive.

Les trois aspects de la modélisation prédictive que nous avons examinés étaient :

  1. Exemples de données : les données que nous collectons qui décrivent notre problème avec les relations connues entre les entrées et les sorties.
  2. Apprendre un modèle : l'algorithme que nous utilisons sur les exemples de données pour créer un modèle que nous pourrons ensuite utiliser encore et encore.
  3. Faire des prédictions : l'utilisation de notre modèle appris sur de nouvelles données dont nous ne connaissons pas le résultat.

Nous avons utilisé l'exemple de la classification des espèces végétales basée sur les mesures des fleurs.

Il s’agit en fait d’un exemple célèbre en apprentissage automatique car il s’agit d’un bon ensemble de données propre et le problème est facile à comprendre.

Étape d'action

Prenez un moment et comprenez vraiment ces concepts.

Ils constituent le fondement de toute réflexion ou de tout travail que vous pourriez effectuer en matière d’apprentissage automatique.

Votre étape d'action consiste à réfléchir aux trois aspects (données, modèle, prédictions) et à les relier à un problème sur lequel vous aimeriez travailler.

Si vous avez des questions, veuillez les poser dans les commentaires. Je suis là pour vous aider.

Articles connexes