TIC, TAC, TEP: Aprender en el siglo XXI

Tecnologías Información, Aprendizaje y Participación


Deja un comentario

Tus datos más limpios, casi sin frotar

Hasta en la profesión más sexy del siglo XXI se tienen que realizar tareas “poco gratas”, como limpiar los datos. Sin embargo, la recogida, limpieza y transformación de los datos puede llegar a consumir hasta un 80% del tiempo del Data Scientist. Para obtener Insights “brillantes”, debemos alimentar los algoritmos con datos que cumplan unos mínimos de calidad. Y no siempre es fácil definir esos “mínimos”. En este post, ,publicado en LUCA, vamos a analizar las posibles fuentes de error de los datos, cómo evaluar su calidad, identificar los tipos de errores más habituales y en qué consiste el proceso de Data Cleansing”. En el siguiente post, nos pondremos manos a la obra con un ejemplo

janitor

Anuncios