Twahpic (pronunciado twa: pik), un acrónimo de Twitter y tema, es un proyecto de demostración de Microsoft Research que combina el modelado de temas semi-supervisado con feeds de Twitter para permitir que las personas exploren qué es un conjunto de tweets (de un usuario, que coinciden con una consulta) todo sobre.
Los temas de Twahpic se generan analizando alrededor de una semana de tweets de Twitter, luego construyendo modelos especiales que encapsulan el lenguaje utilizado para describir varios conceptos. A menudo, estos conceptos se fusionan claramente en torno a sustantivos como personas y lugares. Los temas también pueden estar menos definidos, como adjetivos positivos o palabras de saludo. Luego identifica si cada tema es social, de estatus, sustancia o estilo.
Twahpic o Twitter Topic Modeling es, por tanto, un proyecto destinado a modelar tweets. Según Microsoft, "Twahpic" muestra de qué se tratan los tweets en Twitter. Twahpic utiliza el análisis de Dirichlet latente etiquetado parcialmente (PLDA) para identificar 200 temas utilizados en Twitter. Esto es realmente asombroso en términos de resultados que proporciona, porque antes de esto nunca había encontrado algo que realmente pudiera modelar mis intereses junto con la sustancia, social, estatus y estilo.
Lo que me impresiona aún más es que está alojado en Windows Azure. Sí, es una aplicación basada en la nube que corrobora la inversión que Microsoft está haciendo en los servicios en la nube.
Déjame darte un vistazo:
Visita Twahpic e ingrese el nombre de la persona cuyos tweets desea modelar o simplemente escriba cualquier consulta. Aquí hemos tomado el ejemplo de los tweets de @TheWindowsClub.
Puedes ver sobre lo que twitteamos! Esta es solo una interpretación de nuestros tweets que ayuda a la gente a comprender nuestro contenido. También puede ser divertido intentar buscar con palabras clave como moda, películas, ropa, etc. Estoy seguro de que disfrutarás de esto!