Introdução ao Pandas (curso Python para Machine Learning – Aula 12)




[ad_1]

Nesse vídeo iremos mostrar como usar o pacote Pandas em Python. Esse pacote será muito útil para criar dataframes, abrir arquivos, manipular os dados e posteriormente rodar algoritmos de machine learning.
Resumo dessa aula:
0:16 O que é o pandas (documentação: https://pandas.pydata.org/pandas-docs/stable/)
0:38 O que é um dataframe
0:58 Importando o pandas como pd (import pandas as pd)
4:33 Transformando um dicionário em um dataframe com o comando pd.DataFrame
6:02 Índices do dataframe
7:50 Criando um objeto do tipo Series com o comando pd.Series
8:45 O que é um vetor Series e sua diferença para um array do Numpy
12:12 Transformando um array numpy em um objeto Series do pandas
13:50 Prova de que um objeto Series é unidimensional
14:12 Qual a utilidade de um objeto Series (é um dataframe de uma coluna só)
O pacote Pandas, sem dúvida, será um dos mais utilizados no estudo de machine learning e ciência de dados, pois ele transforma os dados que estão em seu computador em planilhas fáceis de se manipular. Nas próximas aulas, veremos como é fácil tratar os dados de um dataframe para, posteriormente, aplicar um algoritmo de machine learning nesses dados.
Essa é a aula 12 desse curso. Próxima aula (aula 13): https://www.youtube.com/watch?v=an54pc9BW4I

Todas as aulas desse curso de Python para machine learning e análise de dados estão organizados nessa página: https://didatica.tech/curso-de-python-para-machine-learning-e-ciencia-de-dados-gratuito/
E também nessa playlist: https://www.youtube.com/watch?v=MmSXHCxDwBs&list=PLyqOvdQmGdTR46HUxDA6Ymv4DGsIjvTQ-

Para mais detalhes sobre o Pandas, leia esse artigo: https://didatica.tech/o-pacote-pandas-python-para-machine-learning/

Source


[ad_2]

Comment List

  • Didática Tech
    January 22, 2021

    caso ERRO
    dataframe = pd.DataFrame.from_dict(alunos, orient='index')

    dataframe.transpose()

  • Didática Tech
    January 22, 2021

    Se eu crio uma serie dessa forma ele ira printar uma coluna ao lado da outra, isso não seria uma serie bidimensional?

    series2 = pd.Series([12,2,3,36],[8,63,5,54])
    print(serie2)
    >>>
    8 12
    63 2
    5 3
    54 36
    dtype: int64

  • Didática Tech
    January 22, 2021

    Parabéns pelos vídeos, excelente canal!

  • Didática Tech
    January 22, 2021

    Olá professor, poderia me ajudar?
    Coloco o código e quando aperto run ele diz “ “ “ modulenotfounderror: No module named ‘panda’ “
    Segue o código:
    Import pandas as pd
    Alunos = {‘Nome’:[‘Caio’, ‘Bruno’, ‘José’, ‘Jacson’],
    ‘Nota’:[4, 5, 7, 9],
    ‘Aprovado’:[‘não’, ‘não’, ‘sim’, ‘sim’]}

    Não dá dando bom 🙁

  • Didática Tech
    January 22, 2021

    Muito bom!

  • Didática Tech
    January 22, 2021

    Muito bom o curso .

  • Didática Tech
    January 22, 2021

    o meu pandas só dá erro mano

  • Didática Tech
    January 22, 2021

    Para quem quiser entra num grupo de Python, entre no link a seguir: https://chat.whatsapp.com/L0gnZiaClklFV96nxEZNON

  • Didática Tech
    January 22, 2021

    Cara, que didática viu! Tem canal no telegram?

  • Didática Tech
    January 22, 2021

    Cara, muito boa sua didática. Parabéns.
    Tive um pequeno probleminha… quando fui tentar usar a função .Series em um array tive um erro, "Os dados devem ser unidimensionais". Segue o código:

    import numpy as np

    array1 = np.array([(2, 6, 9, 10, 8)])

    array2 = np.array([(2, 6, 9, 11, 23), (10, 5, 8, 21, 11)])

    print(array1)

    print(array2)

    objeto2 = pd.Series(array1)

    print(objeto2)

    Erro: Exception: Data must be 1-dimensional

  • Didática Tech
    January 22, 2021

    Estou usando o VS Code.. Até este exercício, deu certo.. Mas esse não está conseguindo importa o Pandas…
    Alimentei as Extensions com Anacinda, Azure… Mas o pd. DataFrame, não está sendo reconhecido como módulo válido

  • Didática Tech
    January 22, 2021

    Ótima aula!

  • Didática Tech
    January 22, 2021

    Ao digitar dataframe = pd.DataFrame(alunos), me apareceu essa mensagem:

    —————————————————————————
    ValueError Traceback (most recent call last)
    <ipython-input-73-ad22d3dc3b09> in <module>
    —-> 1 dataframe = pd.DataFrame(alunos)

    ~/anaconda3/lib/python3.7/site-packages/pandas/core/frame.py in __init__(self, data, index, columns, dtype, copy)
    390 dtype=dtype, copy=copy)
    391 elif isinstance(data, dict):
    –> 392 mgr = init_dict(data, index, columns, dtype=dtype)
    393 elif isinstance(data, ma.MaskedArray):
    394 import numpy.ma.mrecords as mrecords

    ~/anaconda3/lib/python3.7/site-packages/pandas/core/internals/construction.py in init_dict(data, index, columns, dtype)
    210 arrays = [data[k] for k in keys]
    211
    –> 212 return arrays_to_mgr(arrays, data_names, index, columns, dtype=dtype)
    213
    214

    ~/anaconda3/lib/python3.7/site-packages/pandas/core/internals/construction.py in arrays_to_mgr(arrays, arr_names, index, columns, dtype)
    49 # figure out the index, if necessary
    50 if index is None:
    —> 51 index = extract_index(arrays)
    52 else:
    53 index = ensure_index(index)

    ~/anaconda3/lib/python3.7/site-packages/pandas/core/internals/construction.py in extract_index(data)
    315 lengths = list(set(raw_lengths))
    316 if len(lengths) > 1:
    –> 317 raise ValueError('arrays must all be same length')
    318
    319 if have_dicts:

    ValueError: arrays must all be same length

  • Didática Tech
    January 22, 2021

    O conteúdo do canal é sensacional, muito obrigado, tem me ajudado muito!
    Só uma ideia, e se pra cada aula, ou conjunto de aulas tivessem alguns exercícios pra ajudar a fixar os conceitos?

  • Didática Tech
    January 22, 2021

    Mano, como pode um conteúdo tão bom assim ser gratuito? Muito obrigado pelos vídeos!

  • Didática Tech
    January 22, 2021

    olá professor pq a ordem ficou invertida, seria nome primeiro, depois nota , dai aprovado, o meu esta aprovado, nome e depois nota, como resolvo por gentileza?
    import pandas as pd

    alunos={'nome':['Marcela','Joana','Vagner','Maria'],

    'nota':[4,7,8,4],

    'aprovado':['nao','sim','sim','nao']}

    dataframe=pd.DataFrame(alunos)
    print(dataframe)
    aprovado nome nota

    0 nao Marcela 4

    1 sim Joana 7

    2 sim Vagner 8

    3 nao Maria 4

Write a comment