tirsdag den 11. januar 2011

Miten voit visualisoida 100 Gt Google Teksti Data?

Mielenkiintoinen uutinen tarkastella http://rss.slashdot.org/~r/Slashdot/slashdot/~3/lRQnkESVHZc/story01.htm:
Anonyymi lukija kirjoittaa: "On hämmästyttävää sarja kaavioita että visualisoi trigrammit ja bigrams, osia lauseita, jotka ovat erotettu Googlen web tietokokonaisuutta. Graafit esiin sana yhdistykset ja taajuus, jolla käytämme niitä web-sivuilla. Chris Harrison Carnegie Mellon-yliopistosta totesi esimerkiksi, että sana "hän" on usein sidottu "toteaa," vaikka "hän" on todettu usein "rakastaa". Myös sana-suhde kaavioita, korostaa sanaa käytetään yhdessä niiden vastakohdat, kuten hyvä ja paha, rauhan ja sodan ja PC ja Mac. " On paljon näitä asioita, ja he todella mielenkiintoista selata.

Lue lisää tämän tarinan on Slashdot.




Ingen kommentarer:

Send en kommentar