Python para data science y big data esencial

CURS-647

New product

En este curso, vas a aprender en primer lugar los fundamentos de Python para Data Science y visualización de datos, para posteriormente aplicarlos en el análisis de grandes volúmenes de datos usando el entorno Spark, una de las herramientas más populares del sector Big Data.

Curso Python para data science y big data esencial


En este curso, vas a aprender en primer lugar los fundamentos de Python para Data Science y visualización de datos, para posteriormente aplicarlos en el análisis de grandes volúmenes de datos usando el entorno Spark, una de las herramientas más populares del sector Big Data. El contenido del curso es práctico. Vamos a sentar las bases para que aprendas a desarrollar tu proyecto de datos, de principio a fin.

1. Introducción a Python para data science y big data

    Evaluación de las necesidades de big data

   Instalar Jupyter Notebook

   Instalar PySpark

   Evaluar la eficiencia del código

 

2. Gestión de datos en Python

    Introducción al Pandas

   Filtrar datos en Python

   Transformaciones de la base de datos

   Groupby: obtener información esencial

   Tratar datos duplicados y perdidos

   Introducción a la librería Numpy

 

3. Gestión de datos avanzada

    Correlaciones. Entender las relaciones entre las variables

   Test de la Chi-Cuadrado

   Análisis de datos extremos

   Principios de las bases de datos relacionales

   Transformar un dataframe en una base de datos relacional

   Joins. Trabajar con bases de datos relacionales

   Paralelizar loops en Python

Publicidad.

4. Visualización de datos en Matplotlib

    Introducción al Matplotlib

   Modificar elementos del gráfico en Matplotlib

   Etiquetas y leyendas en Matplotlib

   Gráficos para series temporales en Matplotlib

   Histogramas y box plots en Matplotlib

   Nubes de puntos y mapas de calor en Matplotlib

   Introducción al Plotly. Visualización interactiva

   Gráficos avanzados con Plotly

   Visualización de Mapas con Plotly

 

5. Machine Learning esencial: Clustering

    Necesidades de Machine Learning: clustering y modelización

   Preparar los datos para Machine Learning

   K-Means, el algoritmo de clustering

   El algoritmo hierarchical clustering

 

6. Machine Learning esencial. Modelización

    Regresión lineal

   Regresión logística

   Naives Bayes Classifier

   Árboles de clasificación y regresión

   Random forest

   Support vector machine

   K-Nearest Neighbours

Publicidad.

7. Trabajar con PySpark

    Introducción a PySpark

   Sintaxis en PySpark. Qué necesitamos saber

   Qué son los RDD (Resilient Distributed Databases)

   Funciones lambda

   Dataframes en PySpark

   Transformaciones básicas en PySpark

   Acciones básicas en PySpark

   Operaciones numéricas con RDD

 

8. PySpark avanzado

    Joins en PySpark

   Acumuladores. Cómo detectar patrones en nuestros datos

   Cómo construir funciones map

   Cómo construir funciones reduce

   Ejemplos básicos de MapReduce en PySpark

 

9. Desafío y solución: MapReduce

    Desafío: MapReduce aplicado con PySpark

   Resolución de los ejercicios de MapReduce


Ver Captures

Totalmente libre de virus y software malicioso, así que no esperes más en descargartelo ahora.

No olvides darnos una opinion acerca del curso, para mejorar el contenido.

Publicidad.

Descargar Curso Python para data science y big data esencial Gratis


DESCARGAR GRATIS AQUI

Quieres ver nuestra Galeria Completa de Cursos Gratis disponible?


Para ver nuestra galeria de cursos pulsa aqui

GALERIA DE CURSOS GRATIS

Siguenos en nuestras redes Sociales


NOTA: No olvides seguirnos en nuestras redes sociales de facebook y twitter para que formes parte de nuestra comunidad y recibas la notificacion cada vez que publiquemos algo nuevo, asi no te perderas de nada.

Calificación 
03/03/2019

Excelente

Gran curso

    ¡Escriba su propia reseña!

    Escriba una reseña

    Python para data science y big data esencial

    Python para data science y big data esencial

    En este curso, vas a aprender en primer lugar los fundamentos de Python para Data Science y visualización de datos, para posteriormente aplicarlos en el análisis de grandes volúmenes de datos usando el entorno Spark, una de las herramientas más populares del sector Big Data.

    Haz una pregunta

    No se requiere registro

    Si luego de leer nuestro articulo aun tiene dudas, puede hacer su pregunta utilizando el siguiente formulario.

    (Opcional)
    *(Requerido para ser notificado cuando la respuesta este disponible)

    Si el enlace de descarga redirige a otro producto que no es el descrito en el artículo o está roto, reportarlo usando nuestro

     FORMULARIO DE REPORTE