«Главный ключ быстрого и надежного поиска — это разделение данных на порции» — сказал один из главных инженеров Google на прошлогодней конференции EclipseCon 2005. Все компьютеры, задействованные в поиске, работаю на базе операционно системы Linux, дистрибуция Red Hat. Но как заявил Urs Hoelzle, вице-призидент иженерного отдела, с большими собственными изменениями в оригинальном ядре. Google реплецирует веб-страницы, кэшируя разбитые кусочки в так называемые «shards». Шарды небольшие и несколько шардов могут размещаться на одной машине. Потом они реплицируются на другие машине и в случае, если одна поломается, то другая сможет обслужить запрос. Главная индексная база тоже разбивается на несколько серверов и реплицируется на другие сервера.
Когда приходит запрос на поиск, то он попадает сначала на веб-сервер, примером может служить,
Это можно увидеть своими глазами в фильме производства компании Google «