Factorización de matrices no negativas
Ayer tuve la ocasión de conocer a Carlos J. Gil Bellosta gracias a la charla que dio en el meetup de Machine Learning en La Nave Nodriza. La verdad es que fui a la charla por el ponente, y luego además el tema me pareció interesantísimo.
La Factorización de Matrices no Negativas o Factorización No Negativa de Matrices (Non-negative Matrix Factorization, NMF) es un método que nos permite representar una matriz positiva como producto de otras dos matrices positivas; es prima hermana de otras representaciones como Principal Component Analysis (PCA) o Singular Value Decomposition (SVD). Todas ellas buscan encontrar una representación de un conjunto de datos que nos permita reducir la dimensionalidad del problema y, al mismo tiempo, mostrar ciertas características subyacentes del conjunto de datos.
Estas técnicas se utilizan en los sistemas de recomendación para identificar patrones, similaridades entre usuarios o productos y elaborar recomendaciones.
En el blog de Carlos podéis encontrar las transparencias de la charla y algunos enlaces interesantes a este y muchos otros temas, os dejo aquí el enlace.
Definición del modelo
Algunos enlaces de interés y temas que mencionar:
- Proyecto fin de carrera
- Carlos Gil Bellosta
- Latent Dirichlet Allocation y su relación con NMF
Aplicaciones
Habrá que hablar de:
- Sistema de recomendación
- Topic modelling
Me encantó la conclusión de Carlos: ¿es esta la versión low-cost del Latent Dirichlet Allocation?