PANDAS PYTHON Français – Introduction + Analyse du Titanic (17/30)




[ad_1]

Ce tutoriel python français vous présente Pandas : la libraire python la plus importante pour l’analyse de données et le data science. Pandas ressemble beaucoup à Excel dans python, mais surpasse de loin les capacités d’Excel en matière d’analyse de data analysis.

Ce tutoriel français vous présente les fonctions d’analyses les plus simples et les plus importantes en faisant l’analyse d’un dataset très célèbre: le Dataset des Passagers du Titanic.

Timecode la vidéo:

PARTIE 1: Analyse des données du TITANIC !
0:00 Intro
01:12 Importer vos données dans python : pd.read_csv()
02:18 Inspecter un Dataframe : shape, head, columns
03:22 Éliminer les colonnes inutiles: drop()
04:23 Statistiques rapides: describe()
05:13 Les données manquantes dans Pandas : fillna() dropna()
07:08 Value_counts et graphiques matplotlib !
08:26 Groupby : équivalent des pivot table de Excel dans Pandas

PARTIE 2: DATAFRAMES ET SÉRIES dans les DÉTAILS
10:11 DataFrame et Séries
12:08 Indexing et Slicing
13:58 Iloc et loc
15:45 Exercice de Feature Engineering

► TÉLÉCHARGEZ LE DATASET DU TITANIC:
https://github.com/MachineLearnia/Python-Machine-Learning/tree/master/Dataset

► Soutenez-moi sur Tipeee pour du contenu BONUS:
https://fr.tipeee.com/machine-learnia

► REJOINS NOTRE COMMUNAUTÉ DISCORD
https://discord.gg/WMvHpzu

► Documentation Pandas
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.html

► MON SITE INTERNET EN COMPLÉMENT DE CETTE VIDÉO:
https://machinelearnia.com/

► Recevez gratuitement mon Livre:
APPRENDRE LE MACHINE LEARNING EN UNE SEMAINE
CLIQUEZ ICI:
https://machinelearnia.com/apprendre-le-machine-learning-en-une-semaine/

► Téléchargez gratuitement mes codes sur github:
https://github.com/MachineLearnia

► Abonnez-vous : https://www.youtube.com/channel/UCmpptkXu8iIFe6kfDK5o7VQ

► Pour En Savoir plus : Visitez Machine Learnia : https://machinelearnia.com/

► Qui suis-je ?
Je m’appelle Guillaume Saint-Cirgue et je suis Data Scientist au Royaume Uni. Après avoir suivi un parcours classique maths sup maths spé et avoir intégré une bonne école d’ingénieur, je me suis tourné vers l’intelligence artificielle de ma propre initiative et j’ai commencé à apprendre tout seul le machine learning et le deep learning en suivant des formations payantes, en lisant des articles scientifiques, en suivant les cours du MIT et de Stanford et en passant des week end entier à développer mes propres codes.
Aujourd’hui, je veux vous offrir ce que j’ai appris gratuitement car le monde a urgemment besoin de se former en Intelligence Artificielle.
Que vous souhaitiez changer de vie, de carrière, ou bien développer vos compétences à résoudre des problèmes, ma chaîne vous y aidera.
C’est votre tour de passer à l’action !

► Une question ? Contactez-moi: contact@machinelearnia.com

Source


[ad_2]

Comment List

  • Machine Learnia
    December 25, 2020

    Pandas ouvre les yeux sur un univers infini de possibilités c'est génial bravo Guillaume cette vidéo est magnifique

  • Machine Learnia
    December 25, 2020

    J'ai pas trouvé les données de Titanic, car le lien ça marche pas pour les télécharger.
    S'il y a une personne pour m'aider

  • Machine Learnia
    December 25, 2020

    Bonjour , le lien ne fonctionne plus pour dl le fichier excel !

  • Machine Learnia
    December 25, 2020

    Je me demandais où doit se trouver le tableau Excel sur notre ordinateur pour pouvoir être importé? PS:je suis sur Pycharms🙂

  • Machine Learnia
    December 25, 2020

    Eh bien c'est tout simplement génial pour débuter. Merci beaucoup 🙂

  • Machine Learnia
    December 25, 2020

    vidéo clair, facile à suivre

  • Machine Learnia
    December 25, 2020

    Salut Guillaume, comment ça va ? Tout d'abord merci pour tes vidéos. J'ai une question simple ou même bête. Est-ce que c'est possible d'utiliser la function value_counts() en mettant deux colunes ? Moi, j'ai essayé dataset[dataset['age'] < 18]['pclass', 'sex'].value_counts(), mais ça ne marche pas. Ce que je voulais est d'avoir le nombre par classe et le nombre selon le sex par classe. Merci pour ta réponse. A plus !!!!

  • Machine Learnia
    December 25, 2020

    ta vidéo est géniale, merci je comprends beaucoup mieux les bases de pandas 🙂

  • Machine Learnia
    December 25, 2020

    Bonjour et merci pour votre travail!
    Actuellement en reconversion professionnelle dans le domaine de la data et de l'IA, je ne peux que recommander vos vidéos!
    Pour ceux qui ont eu du mal à charger le dataset malgré le fait de le mettre dans le même dossier que votre notebook. Il m'est arrivé la même chose !
    Cela peut être dû a JupyterLab qui est moins stable que Jupyter Notebook.
    J'ai fermé JupyterLab puis j'ai ouvert sur Jupyter Notebook et problême résolu!
    Retourner sur JupyterLab et là même en relançant votre kernel, surprise le dataset se charge correctement!
    Voilà 1er jour et 1ère participation ^^
    A plus

  • Machine Learnia
    December 25, 2020

    MERCI BRO , C'EST TRES INTERESSANT LE CONTENU , UNE FOIS DE PLUS MERCI, JE SUIS NOUVEAU SUR LA CHAINE

  • Machine Learnia
    December 25, 2020

    je voulais savoir est ce que votre cours est telechargable je l'ai beaucoup aimé ?

  • Machine Learnia
    December 25, 2020

    print(data.groupby(['sex']).mean()) ne marche pas car vous avez deja supprimer les keys

  • Machine Learnia
    December 25, 2020

    excellent

  • Machine Learnia
    December 25, 2020

    C'est la première vidéo que j'ai vue de votre chaîne. Merci pour votre travail et votre altruisme

  • Machine Learnia
    December 25, 2020

    Bonjour. Merci pour la vidéo et pour vos réponses par email pour notre demande de formation. Dans l'import d'un fichier txt, comment fait-on pour associer le meme format (str) dans dtype pour plusieurs variables en meme temps sans avoir à les lister une à une (par exemple variable 1,5, 8-10 …). Merci ! Raphaël

  • Machine Learnia
    December 25, 2020

    je suis étudiante en master "digital text analysis". Je viens d'avoir un bootcamp d'introduction à python ponctué d'un examen que j'ai raté allègrement (notamment) parce que je n'avais rien compris du tout à "pandas", sur lequel la plupart de l'examen portait. Nous avons travaillé sur ces données du Titanic en classe mais je n'avais pas compris une seule ligne de code. J'ai acheté une adhésion à DataCamp pour m'aider mais rien n'y a fait.
    Et puis je viens de tomber sur votre chaîne! Vous êtes un excellent professeur! Je m'apprête à regarder chacune de vos vidéos excellement expliquées! Merci infiniment.

  • Machine Learnia
    December 25, 2020

    vos vidéo sont trés intéressantes, mais je n'arriva pas à ouvrir le fichier, il me dit que :No such file or directory: 'titanic3.xls'
    alors que j'ai bien changer la directory la ou il est téléchargé mon fichier.
    que dois je faire

  • Machine Learnia
    December 25, 2020

    Bravo et merci pour ces tutos, même si dans mon cas c'est plus la découverte et la curiosité car a 70ans et retraité, je n'ai pas d'application concrète à développer ! Mais c'est très intéressant et sa complète mon expérience en python.

  • Machine Learnia
    December 25, 2020

    Ca commence à etre un peu dense toutes ces présentations de fonctions, j'ai le tourni

  • Machine Learnia
    December 25, 2020

    super video comme toujours je voudrai juste savoir comment importer le fichier excel dans spyder. merci d'avance

  • Machine Learnia
    December 25, 2020

    bonjour Merci beaucoup pour le video , j-ai un souci d-execution de code avec pandas sur Pycharm au contraire sur consol python sur Cmd (sur pycharm pas d'erreur et malgre n'affiche pas de resultat )

  • Machine Learnia
    December 25, 2020

    pip install panda

  • Machine Learnia
    December 25, 2020

    bonjour, je dois trier une dataframe excel de 444 colonnes…… comment faire pour trier plus facilement que drop[nom de colonne]? je voudrais garder de A a F puis de G a K, comment ecrire ca avec pandas (si c'est possible…)?

  • Machine Learnia
    December 25, 2020

    Hello, merci pour ta vidéo, encore du super boulot. Je n'arrive pas à utiliser la plus part de tes fonctions avec mes fichiers csv, en effet, il y a trois ligne utilisé pour décrire chaque colonne. Du coup Python ne comprends pas quand j'appelle seulement l'une d'elle avec le nom d'un des trois lignes. Je peux t'envoyer un des fichier csv que j'ai à traiter.

    Je m'en sors en passant par le module csv et en suppriment les ligne qui m'intéresse pas mais bon je suis sûr qu'il y a plus simple.

    J'ai une autre question. J'ai un tableau de deux dimensions avec une première ligne qui contient le nom des colonnes. Quand je crée un DataFrame de ce tableau, je me retrouve avec des index ( 0, 1, 2 …) pour les colonnes aussi … Tu sais comment je peux changer l'indexation des colonnes par la ligne avec le nom des colonnes ?

    Merci d'avance !

  • Machine Learnia
    December 25, 2020

    bonjour
    j'ai un petit problème lorsque j'essaie d'ouvrir le document Excel dans python on me met une erreur comme quoi python ne trouve pas le document

  • Machine Learnia
    December 25, 2020

    S'il te plait, comment lire un fichier .txt comportant deux colonnes de donnees ?

  • Machine Learnia
    December 25, 2020

    Bonjour, Je suis un nouvel abonné, et très ravi du contenu, de tes vidéos. Ceci dit, j'ai un problème de détection de contour sur image à faire comment puis je te proposer ma solution ? Si possible inbox. Merci Bien

  • Machine Learnia
    December 25, 2020

    Encore une excellente vidéo qui me permet de faire le lien avec Excel que j'utilise au quotidien

  • Machine Learnia
    December 25, 2020

    bonjour guillaume merci pour les vidéos qui m'ont été tres utiles le long de mes études pour un pfe d'ingénieur en machine learning . je soutiens un pfe d estimation des biens immobiliers dans le département 83 en france avec python et machine learning je rencontre des difficultés quant à l'étude de l'existant pouvez vous m 'aider merci d avance

  • Machine Learnia
    December 25, 2020

    Merci pour ta video. S'il te plait, peux tu faire une video sur la representation spatiale d'un modele numerique de terrain?

  • Machine Learnia
    December 25, 2020

    Très pratique ce package! Du coup dans la pratique, toutes les fonctionnalités (scipy, les maths, l'algèbre) que tu nous a montrées sur numpy, tu les utilises directement sur les Dataframes? Ou tu es parfois obligé de passer par les nd.array?
    En tout cas bravo, les vidéos s’enchaînent très biens, c'est top.👍

  • Machine Learnia
    December 25, 2020

    Aucun mot ne peut exprimer ma gratitude envers vous, vos vidéos sont très pédagogiques, votre démarche est très généreuse et ça répond exactement à mon besoin (Je fais un master Big Data) maintenant je Like avant de regarder la vidéo. Mille mercis

  • Machine Learnia
    December 25, 2020

    Est-il possible d'importer Les lignes dans une base de données Sql? Si possible as tu des resources?

  • Machine Learnia
    December 25, 2020

    bonjour je n'arrive pas a importer le ficher titanic avec la syntaxe que vous utilisez

Write a comment