Donnerstag, 20. März 2008

Wie gross ist das Internet?

Mit dieser Frage schlagen sich immer wieder Experten herum. Bright Planet stellte 2001 in der Studie The deep Web: Surfacing Hidden Value fest, dass das Deep Web, welches in der Regel nicht von Suchmaschinen erfasst wird, 400 bis 550 mal grösser ist als was gemeinhin als World Wide Web definiert wird. Google durchsuchte 2001 rund 1 Mrd. Webseiten. (Quelle Archive.org) 2005 hatte Google über 8 Mrd. Webseiten in seinem Index verzeichnet. Neuere Zahlen werden auf auf der Website von Google mittlerweile leider nicht mehr angezeigt. Wie viele Webseite werden es dann nun wohl im gesamten World Wide Web sein?

Die Wissenschaftler der UC Berkeley School of Information schätzten den Zuwachs an Informationen 2002, egal ob im Internet, als Print, als Filme usw. in ihrer Studie «How much information» auf rund 5 Exabytes:

Print, film, magnetic, and optical storage media produced about 5 exabytes of new information in 2002. Ninety-two percent of the new information was stored on magnetic media, mostly in hard disks.

Ein Exabyte entspricht dabei einer Trillion Bytes. Wirklich vorstellen kann sich diese gewaltige Datenmenge niemand mehr.

Peter Glaser von Focus Online vergleicht in seinem Artikel «Wie gross ist das Internet» vom 29.11.2007 deshalb diese Angabe mit der Gesamtmenge an Büchern der US Library of Congress bei einem Gesamtbestand rund von 17 Millionen Bücher. Nach seiner Rechnung müsste man diese Bücher nun 37.000 mal digitalisieren um auf 5 Exabytes zu kommen. Andere Experten gehen aber mittlerweile von 10 Exabytes im Internet aus, d.h. man müsste diese Büchermenge noch einmal verdoppeln um alle Daten des World Wide Webs zu erfassen.

Doch welche Daten bzw. Informationen hat man dann? Sind all diese riesigen Datenmengen auch als Information brauchbar? Denn wie Glaser feststellt:

«Erst wenn Daten sich zu einer Information formieren und später vielleicht sogar zu Wissen werden, sind sie für Menschen interessant.»
Tags: Internet, Grösse, Umfang