Nube de palabras do Blogomillo v.0.1
Data de publicación: 26 de Abril de 2006Category: aplicacions, blogMillo, estatistica, lingua, rede
Pois como o prometido é débeda, aquí vai. Empreguei para ilo o TagCloud.com, que sei que está en fase beta.
A preparación deu algún erro cargando o ficheiro OPML cos 1000 e 1 feeds do blogomillo. Aínda que ao final o experimento rematou funcionando non podo asegurarvos que realmente tivera en conta todos os fluxos. Levoulle unha hora identificar os fluxos, e penso que vai botar varios días léndoos, ao tempo que vai actualizándoos coas novas postaxes.
Outros problemas que detectei teñen que ver co hábito que teñen moitos usuarios do MSN Spaces de colocar nos títulos cadeas de caracteres estraños ao estilo do IRC, pero outros son problemas inherentes ao servizo, que presenta problemas coa codificación UTF-8. Alén disto, poderedes apreciar tamén a dificultade que teñen estes motores para identificar palabras con caracteres alleos á lingua inglesa, como as vogais con til e os eñes. Así e todo poderedes deducir facilmente as verdadeiras palabras ás que se refiren algunhas etiquetas que en principio semellan raras.
Debo lembrarvos que o número de postaxes que verte cada blog nun fluxo é limitado e está determinado polos seus autores, e descoñezo cantos foron procesados para cada un ou por termo medio. Podería, por dicir algunha cifra, supor arredor duns 10 ou 20 por cada blog, pero pode que nalgúns casos a cifra chegue até 100. Ignóroo.
Finalmente tiven que facer unha filtraxe de palabras excluídas para evitar a aparición de artigos, preposicións, verbos, adverbios e outras palabras de escaso contido semántico.
Velaquí está:
[Estaba, porque o servizo deixou de funcionar poucos días despois de facer isto]
Mentres creaba esta nube tiven ocasión de comprobar que alguén xa tiña definido no mesmo servizo unha nube co título de Blogomillo. Sería bo poder comparar os resultados con esa outra tentativa.
En calquera caso, coido que este experimento é interesante para visualizar de xeito intuitivo as cousas sobre as que fala a comunidade blogueira, para comparar os resultados con outros grupos ou poboacións blogueiras, e mesmo para verificar as coincidencias e as diferenzas cos medios de comunicación galegos tradicionais, alén da análise lingüística ou sociolóxica á que poida dar pé.
As posibilidades son infindas. Alguén se atreve cun xerador automático de narrativa galega?
Etiquetas: lingua, tag cloud, blogomillo, etiqueta
Esta anotación publicouse o Mércores 26 de Abril de 2006 ás 2.19 pm e arquivouse en aplicacions, blogMillo, estatistica, lingua, rede. Podes seguir os comentarios desta anotación a través do fluxo RSS 2.0. Podes deixar un comentario, ou deixar un rastro desde o teu propio sitio web.

3 comentarios a “Nube de palabras do Blogomillo v.0.1”
Eu é que sendo nova no lugar pérdome un pouquiño con todo isto, pero que non te creas, que me estás ensinando cousiñas que nin se me pasaran pola cabeza.
Bicos bicos :)(Xa sei que estas non son horas, pero aínda non me viña o sono)
Alégrome ben, áinda que eu estou un pouco decepcionado porque penso que o da nube de palabras non vai ben. Intúo ausencias de palabras que son moi frecuentes e cando clicas nunha palabra para ver en que bogs foi pubicada saen moi poucos exemplos.
A ver se co tempo mellora, cando rematen a beta… a ver.
Home, se sae Warrenton e todo na nube esa.
Eu fixen unha nube desas en snapshirts.