Introdução ao Pandas (curso Python para Machine Learning – Aula 12)
[ad_1]
Nesse vídeo iremos mostrar como usar o pacote Pandas em Python. Esse pacote será muito útil para criar dataframes, abrir arquivos, manipular os dados e posteriormente rodar algoritmos de machine learning.
Resumo dessa aula:
0:16 O que é o pandas (documentação: https://pandas.pydata.org/pandas-docs/stable/)
0:38 O que é um dataframe
0:58 Importando o pandas como pd (import pandas as pd)
4:33 Transformando um dicionário em um dataframe com o comando pd.DataFrame
6:02 Índices do dataframe
7:50 Criando um objeto do tipo Series com o comando pd.Series
8:45 O que é um vetor Series e sua diferença para um array do Numpy
12:12 Transformando um array numpy em um objeto Series do pandas
13:50 Prova de que um objeto Series é unidimensional
14:12 Qual a utilidade de um objeto Series (é um dataframe de uma coluna só)
O pacote Pandas, sem dúvida, será um dos mais utilizados no estudo de machine learning e ciência de dados, pois ele transforma os dados que estão em seu computador em planilhas fáceis de se manipular. Nas próximas aulas, veremos como é fácil tratar os dados de um dataframe para, posteriormente, aplicar um algoritmo de machine learning nesses dados.
Essa é a aula 12 desse curso. Próxima aula (aula 13): https://www.youtube.com/watch?v=an54pc9BW4I
Todas as aulas desse curso de Python para machine learning e análise de dados estão organizados nessa página: https://didatica.tech/curso-de-python-para-machine-learning-e-ciencia-de-dados-gratuito/
E também nessa playlist: https://www.youtube.com/watch?v=MmSXHCxDwBs&list=PLyqOvdQmGdTR46HUxDA6Ymv4DGsIjvTQ-
Para mais detalhes sobre o Pandas, leia esse artigo: https://didatica.tech/o-pacote-pandas-python-para-machine-learning/
Source
[ad_2]
caso ERRO
dataframe = pd.DataFrame.from_dict(alunos, orient='index')
dataframe.transpose()
Se eu crio uma serie dessa forma ele ira printar uma coluna ao lado da outra, isso não seria uma serie bidimensional?
series2 = pd.Series([12,2,3,36],[8,63,5,54])
print(serie2)
>>>
8 12
63 2
5 3
54 36
dtype: int64
Parabéns pelos vídeos, excelente canal!
Olá professor, poderia me ajudar?
Coloco o código e quando aperto run ele diz “ “ “ modulenotfounderror: No module named ‘panda’ “
Segue o código:
Import pandas as pd
Alunos = {‘Nome’:[‘Caio’, ‘Bruno’, ‘José’, ‘Jacson’],
‘Nota’:[4, 5, 7, 9],
‘Aprovado’:[‘não’, ‘não’, ‘sim’, ‘sim’]}
Não dá dando bom 🙁
Muito bom!
Muito bom o curso .
o meu pandas só dá erro mano
Para quem quiser entra num grupo de Python, entre no link a seguir: https://chat.whatsapp.com/L0gnZiaClklFV96nxEZNON
Cara, que didática viu! Tem canal no telegram?
Cara, muito boa sua didática. Parabéns.
Tive um pequeno probleminha… quando fui tentar usar a função .Series em um array tive um erro, "Os dados devem ser unidimensionais". Segue o código:
import numpy as np
array1 = np.array([(2, 6, 9, 10, 8)])
array2 = np.array([(2, 6, 9, 11, 23), (10, 5, 8, 21, 11)])
print(array1)
print(array2)
objeto2 = pd.Series(array1)
print(objeto2)
Erro: Exception: Data must be 1-dimensional
Estou usando o VS Code.. Até este exercício, deu certo.. Mas esse não está conseguindo importa o Pandas…
Alimentei as Extensions com Anacinda, Azure… Mas o pd. DataFrame, não está sendo reconhecido como módulo válido
Ótima aula!
Ao digitar dataframe = pd.DataFrame(alunos), me apareceu essa mensagem:
—————————————————————————
ValueError Traceback (most recent call last)
<ipython-input-73-ad22d3dc3b09> in <module>
—-> 1 dataframe = pd.DataFrame(alunos)
~/anaconda3/lib/python3.7/site-packages/pandas/core/frame.py in __init__(self, data, index, columns, dtype, copy)
390 dtype=dtype, copy=copy)
391 elif isinstance(data, dict):
–> 392 mgr = init_dict(data, index, columns, dtype=dtype)
393 elif isinstance(data, ma.MaskedArray):
394 import numpy.ma.mrecords as mrecords
~/anaconda3/lib/python3.7/site-packages/pandas/core/internals/construction.py in init_dict(data, index, columns, dtype)
210 arrays = [data[k] for k in keys]
211
–> 212 return arrays_to_mgr(arrays, data_names, index, columns, dtype=dtype)
213
214
~/anaconda3/lib/python3.7/site-packages/pandas/core/internals/construction.py in arrays_to_mgr(arrays, arr_names, index, columns, dtype)
49 # figure out the index, if necessary
50 if index is None:
—> 51 index = extract_index(arrays)
52 else:
53 index = ensure_index(index)
~/anaconda3/lib/python3.7/site-packages/pandas/core/internals/construction.py in extract_index(data)
315 lengths = list(set(raw_lengths))
316 if len(lengths) > 1:
–> 317 raise ValueError('arrays must all be same length')
318
319 if have_dicts:
ValueError: arrays must all be same length
O conteúdo do canal é sensacional, muito obrigado, tem me ajudado muito!
Só uma ideia, e se pra cada aula, ou conjunto de aulas tivessem alguns exercícios pra ajudar a fixar os conceitos?
Mano, como pode um conteúdo tão bom assim ser gratuito? Muito obrigado pelos vídeos!
olá professor pq a ordem ficou invertida, seria nome primeiro, depois nota , dai aprovado, o meu esta aprovado, nome e depois nota, como resolvo por gentileza?
import pandas as pd
alunos={'nome':['Marcela','Joana','Vagner','Maria'],
'nota':[4,7,8,4],
'aprovado':['nao','sim','sim','nao']}
dataframe=pd.DataFrame(alunos)
print(dataframe)
aprovado nome nota
0 nao Marcela 4
1 sim Joana 7
2 sim Vagner 8
3 nao Maria 4