Vyhledávání v kupě 650 milionů tweetů

Průměrný počet tweetů, který denně prolétne on-line světem, je cca 650 milionů. Abychom si dokázali reálně představit vznik takového množství informací v rámci platformy Twitter, stačí se podívat na „prozatím“ nekonečný stream tweetů srze server Internet Live Stats. Následuje samozřejmě otázka, jak vyhledávat v takové množině a mít výsledky s určitou mírou relevance? Cesta vede přes pokročilé…

Tři druhy webu: povrchový, hluboký a temný

Když se koncem 80. let minulého století v CERNu odehrával vývoj hypertextového značkovacího jazyka HTML (o něm někdy později) v podání Tima Bernerse Leeho, nikdo netušil o jaký pokrok se jedná. První webová stránka, která poté vznikla na začátku 90. let, odstartovala masivní informatizaci světa. Co je to vlastně webová stránka? A proč jsou některé dohledatelné a…