Ementa/Descrição: |
Conceitos básicos: Ciência de Dados, Estatística, Aprendizado de Máquina, população, amostra, tipos de variáveis e
tipos de bases de dados. Medidas de tendência central. Medidas de dispersão. Medidas de associação. Pipeline de
processamento de dados: aquisição, limpeza, transformação, análise e armazenamento. Google Colab. Python.
Importação de dados com a função open() do Python. Numpy. Pandas. Matplotlib. Visualização de Dados: gráfico de
linhas, gráfico de barras, gráfico de pizza, histograma e boxplot. Análise de normalidade dos dados. Análise de
homoscedasticidade. Análise de multicolinearidade. Regressão. Regressão logística. Scikit-Learn. Árvore de Decisão:
classificação e regressão |