Сегодня в общем трафике глобальной интернет-сети
преобладает трафик службы World Wide Web (WWW). Какие же проблемы
возникают при его передаче по протоколу TCP/IP?
Стремительный рост числа информационных ресурсов и
экспоненциальный рост количества вэб-пользователей обуславливают
значительное увеличение объема WWW-трафика. В связи с этим для
оптимизации протоколов, разработки схем распределения трафика и т.п.
важно понимание особенностей этого трафика. Служба World Wide Web
состоит из большого набора документов, которые называют
"вэб-страницами", и доступ к ним можно получить из любой точки
глобальной интернет-сети. Каждая вэб-страница относится к виду так
называемых "гипермедиадокументов" (hypermedia), где слово "медиа"
означает, что документ может содержать не только текст, но и другие
элементы (например, графику, видео), а приставка "гипер" – что документ
может содержать выбираемые ссылки, которые ведут к другим связанным с
ними элементам. Помимо доступа к гипермедиадокументам, на основе службы
World Wide Web реализуется также вэб-чат и электронная почта (с доступом
через вэб-браузер).
Как у любой поисковой системы, у Google есть система фильтрации своей выдачи. Большой процент сайтов в интернете создано не для людей, а для перенаправления трафика на другие сайты, для влияния на поисковую выдачу и т. п., следовательно, чтобы выдача поисковика была чистой, этот мусор нужно тщательно отфильтровывать. Отфильтровывать таким образом, чтобы не пострадали нормальные сайты. А ведь нет четких критериев "нормальности", поэтому проблема фильтрации является сложной, и она до сих пор окончательно не решена. Под фильтры часто попадают "белые и пушистые" сайты, и причины этого попадания определить бывает очень сложно.