La ciencia de datos es un campo interdisciplinar que utiliza métodos, algoritmos, procesos y sistemas para extraer conocimiento y conclusiones a partir de todo tipo de datos. A través del aprendizaje automático se combinan elementos de estadística, informática, matemáticas y técnicas de análisis para resolver problemas, hacer predicciones y generar valor a partir de los datos. Se apoya en grandes volúmenes de datos (Big Data) para descubrir patrones, tendencias y relaciones que pueden ser utilizadas para la toma de decisiones. El aprendizaje automático utiliza dos tipos de técnicas: ò el aprendizaje supervisado, que entrena a un modelo con datos conocidos de entrada y salida para que pueda predecir resultados futuros, y ò el aprendizaje no supervisado, que encuentra patrones ocultos o estructuras intrínsecas en los datos de entrada. Este libro desarrolla la mayoría de las técnicas de aprendizaje no supervisado. Comienza profundizando en las técnicas de reducción de la dimensión, como el análisis de componentes principales y el análisis factorial cuya finalidad es eliminar los efectos nocivos de la correlaci