Análisis de datos
En el Análisis de Datos (o Data Science) tenemos cinco etapas:
- Enmarcar el problema. Hacer las preguntas adecuadas.
– ¿Cuál es el objetivo?
– ¿Qué queremos estimar o predecir? - Adquirir y preparar los datos.
– ¿Qué recursos tenemos para obtener datos?
– ¿Qué información es relevante?
– Limpiar y filtrar los datos para su posterior análisis. - Explorar los datos.
– Visualizar los datos.
– Localizar en los gráficos posibles tendencias, correlaciones o patrones. - Modelizar y evaluar los datos.
– Utilizar algún algoritmo innovador (según el problema) para crear el modelo.
– Evaluar el modelo. - Comunicar los resultados y/o puesta en producción.
– ¿Qué resultados hemos obtenido?
– ¿Qué hemos aprendido?
– ¿Los resultados tienen sentido?
El ciclo de vida de los proyectos de análisis de datos es el siguiente:
Los lenguajes de programación que se suelen utilizar para realizar Análisis de Datos son:
- Python
- R