Twahpic (uttalt twa: pik), et portmanteau for Twitter og emne, er et Microsoft Research-demonstrasjonsprosjekt som kombinerer semi-overvåket emnemodellering med twitter-feeds for å la folk utforske hva et sett tweets (fra en bruker, som samsvarer med et spørsmål) er alt om.
Twahpics emner genereres ved å analysere en ukes verdi av tweets fra Twitter, og deretter lage spesielle modeller som innkapsler språket som brukes til å beskrive forskjellige konsepter. Ofte samles disse begrepene tydelig rundt substantiver som mennesker og steder. Emner kan også være mindre definert, for eksempel positive adjektiver eller hilsenord. Deretter identifiserer det om hvert emne er sosialt, status, stoff eller stil.
Twahpic eller Twitter Topic Modeling er altså et prosjekt rettet mot modellering av tweets. I følge Microsoft viser "Twahpic" hva tweets på Twitter handler om. Twahpic bruker Partially Labeled Latent Dirichlet Analysis (PLDA) for å identifisere 200 emner som brukes på Twitter. Dette er virkelig utrolig når det gjelder resultater det gir, for før dette har jeg aldri funnet noe som virkelig kan modellere mine interesser sammen med stoffet, det sosiale, status og stil.
Det som imponerer meg enda mer er at det er vert på Windows Azure. Ja, det er en skybasert app som underbygger investeringen Microsoft gjør i Cloud Services.
La meg få et glimt av det:
Besøk Twahpic og skriv inn navnet på personen du vil lage tweets hvis du vil modellere eller bare skrive spørsmål. Her har vi tatt eksemplet på @TheWindowsClub tweets.
Du kan se hva vi tvitrer om! Dette er bare en tolkning av tweets som hjelper folk med å forstå innholdet vårt. Det kan også være morsomt å prøve å søke med nøkkelord som mote, filmer, klær osv. Jeg er sikker på at du vil like dette!