ACM Recommender System 2007 (RecSys’07)

En Minneapolis, Minnesota, USA, se realizó RecSys 2007 con una duración de 2 días. El orador principal para este evento y científico de Google Inc (Bharat, 2007) indica en la parte inicial del evento “They can extract information, induce structure, and transform and categorize text in ways that makes news easy to browse and search for both readers and journalists… If we can apply computers to make news more efficient to produce, distribute and absorb and fundamentally more truthful, it can better inform the actions taken by both individuals and nations”.

En este evento se realizaron dos Industrial Panels: Where should we be investing most in research and practice to increase value of recommenders? y Appraisal of Recommender Systems. Se puede percibir el gran interés que muestran empresas como Yahoo!, AOL, eBay junto con varias universidades. Los trabajos de investigación se han agrupado en 4 áreas: Privacy and trust, Algorithms: Colaborative Filtering, User Issues in Recommender Systems; y Algorithms: Learning. Adicionalmente se pueden revisar 14 Research short papers, 2 Industry track abstracts, así como las 6 presentaciones que fueron aceptadas para el Doctoral Symposium.

En la primera jornada, los 4 papers referentes a privacidad y confianza, enfatizan en la protección al usuario, los límites de la información a mostrar en una búsqueda o filtrado. (Lathia, Hailes, & Capra, 2007) hacen una introducción al filtrado colaborativo como método para medir la similitud de los usuarios y hacer predicciones acerca de sus intereses, analizando como para obtener unas medidas precisas de similitud está sufriendo la privacidad del usuario; como solución presentan un método basado en la estimación de métodos concordantes, pares disconcordantes y calificaciones entre dos usuarios respecto a un conjunto comparativo al azar de las calificaciones. (Berkovsky, Eytani, Kuflik, & Ricci, 2007) parten así mismo desde el Filtrado Colaborativo, centran el problema en el almacenamiento centralizado de perfiles de usuario y las vulnerabilidades a la privacidad del usuario; su solución y base de investigación es el almacenamiento descentralizado distribuida de perfiles de usuario combinada con técnicas de modificación de datos puede mejorar la confidencialidad. En otra de las ponencias (Massa & Avesani, 2007) hacen incapié en usuarios no similares, proponiendo las métricas de confianza que remplacen a las de similitud; muestran resultados empíricos de Epinions.com como caso de estudio. En la parte final de esta jornada (Resnick & Sami, 2007) se centran en la manipulación a los Sistemas de Recomendación; proponen un algoritmo de influencia de limitación que puede convertir los actuales sistemas recomendadores en sistemas resistentes a la manipulación.

Los algoritmos de filtrado colaborativo, son el punto de enfoque de la segunda parte. (Mehta, Nejdl, & Hofmann, 2007) presentan su algoritmo de filtrado colaborativo robusto, partiendo del hecho, que muchos usuarios proporcionan información errónea o ruidosa, que provoca inestabilidad en los sistemas de estimación y predicción; incluso personal malintencionado puede intentar introducir esta información al sistema; la solución planteada parte desde la estadística robusta, particularmente estimaciones-M, que permiten generar una estimación estable incluso con la presencia de ruido y spam; con esta base presentan el algoritmo de factorización Robust Matrix. Otro algoritmo interesante, basado en recursividad lo presentan (Zhang & Pu, 2007); parten del concepto nearest-neighbor planteado en el algoritmo común, a un concepto de predicción recursiva que permite al vecino más próximo integrarse en el proceso de predicción    , aún si no está explícitamente previsto.

Partiendo del concepto de colaboración y agrupamiento de redes (Kuflik, Berkovsky, & Ricci, 2007) plantean el filtrado colaborativo distribuido con especialización de dominio; la problematización la ubican en que el usuario casi siempre ubica datos básicos y escasos; su solución se sustenta en: a) particionar los datos del usuario en depósitos
especializados y distribuidos;
b) ir agregando información procedente de estos depósitos; para esto toman como ejemplo una película y presentan un enfoque de cuatro enfoques de agregación.
De forma bastante similar, valiéndose de la música, (Anglade, Tiemann, & Vignoli, 2007) plantean un enfoque para crear automáticamente las comunidades virtuales de usuarios con gustos musicales similares en un sistema distribuido p2p; utilizan epidemic protocols para generar grafos de conexión, desde los cuales generan comunidades.

Un algoritmo que no parte de patrones estáticos, sino de un aprendizaje basado en recomendaciones, derivadas de cada acción que realiza el usuario, plantean (Taghipour, Kardan, & Ghidary, 2007); modelan el problema como Q-Learning y recurren a los conceptos y las técnicas comúnmente aplicadas en mining web y Machine Learning research. En un enfoque parecido (Sandvig, Mobasher, & Burke, 2007) plantean un algoritmo de robustez basado en association rule mining; según demuestran su modelo de abstracción es más eficiente frente a los ataques que un algoritmo de recomendación k-nearest neighbor o k-nn.

Una iniciativa que viene muy bien para los usuarios nuevos la plantean (Te-Nguyen, Denos, & Berrut, 2007); hablan del cold user, como el estado del usuario nuevo que tiene que partir desde cero para ingresar sus datos, con un perfil muy pobre; platean desde el modelo α-comunities spaces, un proceso de inducción basado en normas y en el principio de “nivel de acuerdo”; los resultados de sus estudio muestran que los usuarios nuevos deben hacer un menor esfuerzo al no solicitarle sus calificaciones iniciales. Y el último algoritmo viene desde Motorola Laboratories, y aborda el direccionamiento de la incertidumbre implícita en las preferencias. (Gadanho & Lhuillier, 2007) se ubican en el negocio de la TV, y el ámbito de TV program recommenders valuable tools; parten de la preferencias del usuario hacia programas que ha visto, pero en diferentes grados de fiabilidad; así establecen tres enfoques: usar toda la información por igual, dar un mayor importancia a la información confiable o desechar la información no confiable.

Los problemas de los usuarios en referencia a los Sistemas Recomendadores también se han considerado. Desde las sugerencias y hacia un sistema de recomendación conversacional está encaminada la investigación de (Viappiani, Pu, & Faltings, 2007); Proponen la una estrategia para producir sugerencias que expliquen el conocimiento previo de la distribución de preferencias. Presentan resultados satisfactorios tanto en la medición de los efectos con conocimientos previos, tanto como con las estrategias de adaptación planteadas.

Luego de haber presentado un trabajo previo de un enfoque de recomendación móvil basada en la crítica, del cual se presentó los resultados de los usuarios en vivo (Nguyen & Ricci, 2007) en esta ocasión presentan una innovadora metodología de la simulación y su uso en la comparación de diferentes métodos de representación para consulta por el usuario. En una simulación de procedimientos de evaluación reproducidos off-line, contrasta las varianzas entre las interacciones grabadas y los usuarios en vivo; esta comparativa muestra que no hay diferencia entre estos dos estados, siendo de gran utilidad para futuras investigaciones.

Varias soluciones a sistemas recomendadores parten del Teorema de Bayes, y como lo mencionan (Pronk, Verhaegh, Proidl, & Tiemann, 2007) también tienen problemas para el arranque en frío y la adaptabilidad a los cambios del usuario; Estos problemas, manifiestan, pueden mitigarse al permitir al usuario crear o manipular su perfil. Así proponen una extensión del clasificador bayesiano ingenuo que mejora el control del usuario. Para esto integran dos perfiles para un usuario: uno que se realimenta por rating y otro creado por el usuario. Logran flexibilidad y facilidad de mantenimiento del sistema, logrando mitigar el arranque en frío.

Continuando con las matemáticas, en este caso las funciones de boole que aplican (Bridge & Ricci, 2007) en su investigación. Su aplicabilidad parte de un sistema para consulta de usuario a través de sistema de conversación, donde el usuario realiza una serie de solicitudes hasta llegar al producto que en realidad necesita. En lo que ellos llaman information recomendation,
muestran como un asesor (advisor) puede inferir sobre las acciones que realiza repetidamente el usuario e irla agregando a un modelo de usuario. Aplicando las funciones de boole en su experimentación, demuestran que se reduce el número de consultas del usuario hasta llegar a su producto y por lo tanto el asesor puede atender a mas usuarios.

En esta edición, ACM ha seleccionado algunos short papers de investigaciones, de los cuales han llamado mi atención:

  • Modelo probabilístico para Sistema Recomendador basado en temas.
  • Sistema Recomendador para matriculas de un curso on-line.
  • Comparación y evaluación de algoritmos de recuperación de información para la recomendación de noticias.
  • Caso Amazon: Ratings y comentarios como parte de las recomendaciones.
  • Colaboración en Aprendizaje Activo basado en dependencias.
  • Evaluación de estrategias de presentación de información para recomendaciones habladas.
  • Hacia la explotación de los patrones de acceso social para Recomendaciones.

Trabajos citados

Anglade, A., Tiemann, M., & Vignoli, F. (2007). Complex-network theoretic clustering for identifying groups of similar listeners in p2p systems. RecSys’07. ACM.

Berkovsky, S., Eytani, Y., Kuflik, T., & Ricci, F. (2007). Enhancing privacy and preserving accuracy of a distributed collaborative filtering. RecSys’07. ACM.

Bharat, K. (2007). Computing with News. Minneapolis, Minnesota, EE.UU: ACM.

Bridge, D., & Ricci, F. (2007). Supporting Product Selection with Query Editing Recommendations. RecSys’07. ACM.

Gadanho, S., & Lhuillier, N. (2007). Addressing Uncertainty in Implicit Preferences. ACM.

Koren, Y. (2008). Tutorial on recent progress in collaborative filtering. ACM Conference On Recommender Systems. Lausanne, Switzerland: ACM.

Kuflik, T., Berkovsky, S., & Ricci, F. (2007). Distributed collaborative filtering with domain specialization. RecSys’07. ACM.

Lathia, N., Hailes, S., & Capra, L. (2007). Private distributed collaborative filtering using estimated concordance measures. RecSys’07. ACM.

Massa, P., & Avesani, P. (2007). Trust-aware recommender systems. RecSys’07. ACM.

Mehta, B., Nejdl, W., & Hofmann, T. (2007). Robust collaborative filtering. RecSys’07. ACM.

Nguyen, Q. N., & Ricci, F. (2007). Replaying Live-User Interactions in the Off-Line Evaluation of Critique-based Mobile Recommendations. RecSys’07. ACM.

Pronk, V., Verhaegh, W., Proidl, A., & Tiemann, M. (2007). Incorporating User Control into Recommender Systems Based on Naive Bayesian Classification. RecSys’07. ACM.

Resnick, P., & Sami, R. (2007). The influence limiter: provably manipulation-resistant recommender systems. RecSys’07. ACM.

Sandvig, J. J., Mobasher, B., & Burke, R. (2007). Robustness of Collaborative Recommendation Based on Association Rule Mining. ACM.

Schifanella, R., Panisson, A., Gena, C., & Ruffo, G. (2008). MobHinter: epidemic collaborative filtering and self-organization in mobile ad-hoc networks. ACM Conference On Recommender Systems. Lausanne, Switzerland: ACM.

Taghipour, N., Kardan, A., & Ghidary, S. (2007). Usage-Based Web Recommendations: A Reinforcement Learning Approach. ACM.

Te-Nguyen, U., Denos, N., & Berrut, C. (2007). Improving New User Recommendations with Rule-based Induction on Cold User Data. ACM.

Viappiani, P., Pu, P., & Faltings, B. (2007). Conversational Recommenders with Adaptive Suggestions. RecSys’07. ACM.

Zhang, J., & Pu, P. (2007). A recursive prediction algorithm for collaborative filtering recommender systems. RecSys’07. ACM.

Anuncios
  1. No trackbacks yet.

Disculpa, debes iniciar sesión para escribir un comentario.
A %d blogueros les gusta esto: