Сетевая библиотекаСетевая библиотека

Как раскрутить и разрекламировать Web-сайт в сети Интернет

Как раскрутить и разрекламировать Web-сайт в сети Интернет
Автор: Александр Загуменов Жанр: Интернет Тип: Книга Издательство: ДМК Пресс Год издания: 2005 Цена: 239.00 руб. Просмотры: 73 Скачать ознакомительный фрагмент FB2 EPUB RTF TXT КУПИТЬ И СКАЧАТЬ ЗА: 239.00 руб. ЧТО КАЧАТЬ и КАК ЧИТАТЬ
Как раскрутить и разрекламировать Web-сайт в сети Интернет Александр Петрович Загуменов Настоящая книга заинтересует всех, кто столкнулся с вопросами подготовки, размещения в Сети и популяризации Internet ресурсов различного уровня: от домашней странички до корпоративного сайта. В ней вы найдете все, что необходимо для оптимизации Web сайтов под поисковые системы: приемы написания Web-страниц, описание множества самых популярных специализированных программ, предназначенных для подготовки сайта и его раскрутки, создания удачного HTML-кода страниц с правильными метаданными. Книга является практическим руководством для разработчиков Web сайтов и всех, занимающихся их продвижением. Автор приводит множество советов, касающихся создания и анонсирования Web страниц. Рассмотрены средства автоматизации для повышения эффективности разработки и маркетинга при создании и обслуживании сайта. Описание программных и сетевых средств, автоматизирующих процессы тестирования и отладки сайта, обеспечивающих проверку работоспособности и корректности гиперссылок, синтаксиса HTML кода и грамматики размещенного на странице текста, занимает центральное место в книге. Подробно излагаются возможности таких программ, как Linkbot Developer Edition, Domain NameChecker, Retrieve, CyberSpyder Link Test, HTML Link Validator, CSE HTML Validator, A Real Validator, MetaTag ToolKit, MetaMan, WebQA. Отдельная глава посвящена регистрации Web ресурсов в поисковых системах и каталогах. Описываются программы автоматической регистрации (WebPosition, Page Promoter, Web Регистратор), способы взаимодействия с индексирующими роботами поисковых машин, правила применения метаданных. Рассматриваются приемы и методы рекламы сайтов в Internet, указаны критерии ее эффективности. Издание рассчитано на широкий круг читателей и будет полезно как начинающим создателям Web сайтов, так и профессионалам, которые хотят научиться более качественно продвигать в Сети свой Web продукт. Александр Петрович Загуменов Как раскрутить и разрекламировать Web-сайт в сети Интернет Введение Настоящее издание заинтересует всех, кто разместил в Internet Web-страницу или целый сайт и стремится привлечь к ним посетителей или своих клиентов. В книге рассматриваются подготовка и проведение рекламной кампании Web-ресурсов, анализ ее результатов. Особое внимание уделено оценке популярности Internet-страниц, исправлению ошибок и поддержке посещаемости на высоком уровне. Указанные задачи вполне поддаются автоматизации при помощи программного обеспечения, а также средствами Internet, чему и посвящена большая часть страниц издания. В главе 1 рассказывается обо всех аспектах раскрутки сайтов, выборе доменного имени, разработке семантического ядра запросов, о том, как управлять индексированием страниц в поисковых системах, о пользе регистрации в каталогах и обмена ссылками с партнерами, о почтовых рассылках, о влиянии баннерной и контекстной рекламы на посещаемость сайта. Большое внимание уделено описанию метаданных, применяемых для оптимизации Web-сайтов под поисковые системы Internet. Описаны различные методы обнаружения технических ошибок при размещении сайтов в Сети, – неверных ссылок, погрешностей HTML-кода, ошибок правописания. Предлагаются разнообразные способы всесторонней проверки страниц. Глава 2 посвящена автоматизации всех этапов работы над сайтом по его продвижению в Internet. То, о чем написано в главе 1, здесь подкреплено описанием возможностей ресурсов Internet и таких программ, как Linkbot Developer Edition, Domain Name Checker, Retrieve, CyberSpyder Link Test, HTML Link Validator, CSE HTML Validator, A Real Validator, MetaTag ToolKit, MetaMan, WebQA. В главе 3 рассмотрены методы и средства анонсирования сайта в поисковых системах, благодаря которому сайт при поиске по ключевым словам попадает в первую десятку найденных. Подробно описываются наиболее популярные отечественные и зарубежные поисковые машины. Поиск в каталогах часто обеспечивает лучшие результаты, нежели в автоматических поисковых системах, поэтому и они не обойдены вниманием, описаны способы добавления сайта в разнообразные каталоги, приведены методы работы с соответствующим программным обеспечением: AI RoboForm, WebPosition, Page Promoter, Web-Регистратор. Прочитав первую главу книги и воспользовавшись какими-либо средствами, представленными во второй и третьей ее главах, вы можете и не читать книгу дальше, так как у вас будет информация и инструменты для практической работы. Однако если вы хотите увидеть не только направление, в котором движетесь, но и результаты своей работы, вам потребуется ознакомиться с главой 4, которая повествует о том, какую важную и интересную информацию можно узнать из журнальных файлов сервера, и посвящена методам их обработки с помощью соответствующего программного обеспечения. В приложении к книге приводится список полезных ссылок на сайты, рекомендуемые к посещению. Книга предназначена для лиц, столкнувшихся с вопросами размещения и продвижения Web-ресурсов независимо от их уровня: будь то домашняя страничка или корпоративный сайт. Вопросы к автору присылайте по электронному адресу: www@inotec.ru (mailto:www@inotec.ru), посетите его сайт http://promote.inotec.ru (http://promote.inotec.ru/). Глава 1 Этапы большого пути Хороший web-сайт – это не просто набор страниц, связанных гиперссылками, и далеко не только то, что видит пользователь на экране монитора. Его внутреннее устройство довольно сложно. Ведь требуется обеспечить максимум удобств, как для посетителей, так и для его владельцев, которые будут управлять сайтом. Поэтому при его создании должны быть учтены тысячи мелочей, что, собственно, и отличает хороший web-сайт от плохого. Но самое главное – сайт должны найти люди, он не должен затеряться на бескрайних просторах Сети. А иначе, какой от него толк, если сайт никто не увидит? Пусть он даже фантастически красив. Грамотно построенный web-сайт – довольно сложная конструкция, пронизанная многочисленными внутренними и внешними связями, с четкой и жесткой логикой. Уже в процессе разработки сайта должны быть заложены механизмы, работающие на его будущую популярность. Internet – мощный и стремительно развивающийся канал для продвижения информации, товаров и услуг. Однако чтобы добиться успеха, недостаточно лишь разместить в Сети свой сайт. Его необходимо разрекламировать или, как говорят, «раскрутить». Вот этим мы с вами и займемся. Чтобы сайт работал, и с его помощью появлялись новые клиенты, его следует правильно спроектировать, учтя все детали, которые важны для поисковых систем, ведь основной поток целевых посетителей идет именно через них. Если считать основной задачей сайта привлечение новых клиентов или читателей, следует начинать работу с анализа ключевых слов, по которым будут искать сайт. На его основе строится так называемое семантическое ядро возможных запросов, с учетом которого проводится разработка страниц и подготовка исходных данных. Далее выполняются следующие работы по оптимизации сайта для поисковых систем: • формируются заголовки HTML-страниц, которые видны в заголовочной части окна браузера; • создаются метатэги с описаниями и ключевыми словами. Их не видят посетители сайта, но учитывают многие поисковые системы; • изготавливается карта сайта, которая очень важна для поисковых машин, так как она позволяет быстрее и с большим весом проиндексировать страницы сайта. Иногда карта сайта не виднапосетителям; • вырабатываются альтернативные подписи ко всем иллюстрациям. Альтернативная подпись возникает на экране при наведении мыши на изображение. Так как эти подписи также индексируются поисковыми системами, их следует насыщать ключевыми словами; • создаются дублирующие переходы. Многие поисковые системы не понимают переходов по формам с выпадающими списками, поэтому нужно сделать дополнительные переходы в виде обычных ссылок; • специальным образом организуется архив новостей. Появление новой информации должно приводить к обновлению всех страниц архива, что очень привлекательно для поисковых машин; • формируется дублирующая навигация в виде цепочки гиперссылок, если дизайн сайта допускает такой подход, что не только улучшает удобство пользования сайтом, но и позволяет увеличить количество ключевых слов; • навигационные элементы сайта по возможности делаются текстовыми. При этом используются слова из семантического ядра запросов; • новости выводятся на главную страницу, в результате чего информация на главной странице постоянно обновляется, а это благоприятно сказывается на результатах поиска; • на всех страницах, включая главную, организуются информационные блоки. Они не являются обязательными, но заполнение их информацией и периодическая ее смена очень полезна для повышения рейтинга в результатах поиска; • организуются места для баннеров каталогов и счетчиков. При продвижении сайта обязательно придется прописывать его в различных каталогах. Чтобы не пришлось делать крупных доработок, заранее следует закладывать эту возможность; • ссылки с сайта делаются такими, чтобы в них присутствовали ключевые слова. Конечно, это не все приемы, которые используются при оптимизации сайта для того, чтобы он занимал первые места в результатах поиска. Поэтому, рассматривая вышеназванные приемы, мы поговорим и о других. Собственное доменное имя Доменное имя наряду с логотипом и торговой маркой является частью бизнес-идентичности компании. При правильном выборе оно ассоциируется у покупателей именно с вашей компанией, ее продуктами, услугами и т. д. Часто доменные имена используются для нескольких целей, включая имя web-сайта, адрес электронной почты, имя FTP– или другого сервера. Собственное доменное имя придаст вам дополнительную солидность и доверие. Доверие – это одна из основ вашего сайта. Если доменное имя легко запоминается, вы сможете привлечь больше покупателей. Люди будут использовать сайт или адрес электронной почты для быстрого и удобного доступа к информации или услуге, которую вы предлагаете. Доменные имена мобильны. Вы можете сменить адрес, номера телефонов, провайдера Internet-услуг, но доменное имя не изменится. Это дает возможность постоянно поддерживать контакты с клиентами и пользователями ваших услуг. Полная длина доменного имени, как правило, составляет от 2 до 67 символов, включая точку и имя домена первого уровня. Имя может состоять из следующих символов: • латинские буквы (от a до z); • арабские цифры (от 0 до 9); • дефис (-), если доменное имя не начинается и не оканчивается этим символом. Доменные имена не чувствительны к регистру букв, так что часто удобно использовать в рекламе прописные буквы. Например, www.ShoppingWorld.com (http://www.shoppingworld.com/). В настоящее время можно регистрировать и многоязычные доменные имена. При выборе имени ориентируйтесь на свою целевую аудиторию. В зависимости от этого имя может быть популярным, веселым, строгим, составляться из профессиональных терминов и т. д. Доменное имя должно быть простым и коротким. Как правило, чем оно короче, тем легче его запомнить или записать, и тем меньше вероятность того, что его воспроизведут неправильно. При остальных равных условиях отдавайте предпочтение словам с меньшим количеством слогов и словам, которые легко произносить. Не используйте сложные для запоминания акронимы, такие как qmxf. Чтобы получить более высокий рейтинг у некоторых поисковых машин, регистрируйте доменные имена, составленные из ключевых слов вашего web-сайта. В этом случае лучше разделять слова дефисами. Можно создать и зарегистрировать отдельную страницу с таким длинным именем и автоматически переводить посетителей на основной сайт. Употребляйте подходящие слова во множественном числе. Например, searchengines.com (поисковые машины) лучше, чем searchengine.com (поисковая машина), если только web-сайт не имеет отношения к какой-то отдельной поисковой машине. Не забывайте о перспективе. Если в будущем вы планируете выпускать новые продукты, позаботьтесь, чтобы доменное имя соответствовало как новым, так и первоначальным продуктам и услугам. Эксперты по Internet-маркетингу утверждают, что web-сайт должен иметь только одну тематику. Сайт широкого профиля не очень привлекает посетителей, которые ищут конкретную информацию. Регистрируйте доменное имя в правильном домене – глобальном или региональном. Для глобальных сайтов используйте домены. com, org или. net. Для региональных – соответствующие домены страны, для России – .ru или. org.ru. Расширения. com и. net предпочтительны для бизнес-сайтов. Доменные имена. org традиционно используются некоммерческими организациями. Обратите внимание, что многие домены имеют ограничения по выбору имен. В некоторых доменах можно использовать только имя, производное от названия организации или зарегистрированной торговой марки. Можно зарегистрировать несколько доменных имен в разных доменах и направлять их на один и тот же сайт. Проверяйте, не посягаете ли вы на торговую марку или имя, которое по праву принадлежит другой компании или отдельному человеку. Не всякое доступное доменное имя следует регистрировать и использовать. По возможности не используйте доменные имена, похожие на другие. Ведь нужно, чтобы посещали именно ваш сайт, а не конкурента! Исключением из этого правила будет ситуация, когда с целью привлечения дополнительных покупателей вы регистрируете доменное имя, состоящее из слов с распространенными орфографическими ошибками. Чтобы проверить доступность конкретного доменного имени, можно воспользоваться сетевыми сервисами или специализированными программами, которые мы рассмотрим в следующей главе. Разработка семантического ядра Процедура проработки семантического ядра запросов не вполне технологична и зиждется, скорее, на интуитивных догадках исследователя, чем на строгих выкладках. Существуют способы получения данных о популярности того или иного слова, но нет четкого механизма определения, являются ли люди, воспользовавшиеся им, вашими целевыми посетителями. Кроме того, далеко не всегда ясно, а какие, собственно, слова нужно рассмотреть. То, что кажется очевидным продавцу, может совсем иначе представляться покупателю. При анализе семантического ядра особое внимание следует уделить запросам с низкой частотой появления. Очень часто практически невозможно позиционировать сайт по запросам, имеющим высокую популярность, зато это достаточно просто делается по большому количеству запросов низкочастотных. А по общей сумме удачных запросов результат продвижения может оказаться и лучше. В итоге работы над семантическим ядром должна быть составлена таблица, в которой отражается: • запрос (слово или выражение); • частота запроса (его популярность); • количество сайтов, найденных по запросу; • место в результатах поиска первого реального конкурента. Такие таблицы составляются на основании данных, по крайней мере, трех основных российских поисковых систем Яndex, Рамблер и Апорт, а также Google и Yahoo!. После этого отбираются те ключевые слова, по которым имеет смысл бороться за место на первых трех страницах результатов поиска: многочисленные исследования показывают, что пользователи редко заглядывают дальше. Старайтесь использовать эти слова, где только возможно (но не злоупотребляйте). Этот прием действенен и очень важен. Лучше уделить больше внимания продумыванию ключевых слов на начальной стадии разработки сайта, чем исправлять их позже, теряя гораздо больше драгоценного времени. Обновление информации Устаревшая информация – это очень серьезная проблема для владельца сайта. Ведь множество сайтов, сходных по тематике с вашим, продолжают постоянно обновляться. Сейчас же, с развитием электронной торговли, особенно важно не потерять доверия посетителей, а показать им устаревшую информацию – верный способ дать понять, чего стоят ваш сайт и ваши услуги. Обратите внимание на то, что архивы и информация о старом товаре или продукте – как раз достоинство сайта, а не недостаток, и они очень сильно отличаются от устаревшей информации. Если вы описываете в документе некую сложную часть системы или чувствуете, что читатели рады иметь хоть какие-то сведения о данном предмете, нет смысла в детальной проверке такого документа. Если есть люди, действительно нуждающиеся в этой информации, они могут смириться с некоторыми недочетами и просмотреть весь материал, чтобы понять ваши идеи. Такой путь может быть весьма эффективным. Обратите на это внимание, потому что существует определенный слой информации, предназначенной для быстрого ознакомления или создания новых файлов на ее основе, и она важна для будущих читателей. Лучше, чтобы эта информация была доступна хотя бы в незаконченной форме, чем отсутствовала вовсе. До появления электронных технологий усилия на публикацию «сырого» материала приводили к браку и могли быть приняты за оскорбление читателя, так как выглядели как издание низкого качества. В настоящее время публикации идут на всех уровнях, и имеют свою ценность, как документы высокого качества, так и недоработанные. Поэтому обратите внимание читателей на текущий уровень подготовки документа, дабы избежать разочарования. Заголовки Корректные заголовки, кратко отражающие общую тематику, облегчают поиск Internet-ресурсов. Использование каждого слова в названиях страниц следует тщательно обдумать. Очень важно грамотно составить начальные фразы; это требование особенно касается текста внутри тэгов . . , так поисковые системы, отвечающие на запросы пользователей, работают в первую очередь с этой лексикой. У всех документов может быть только один заголовок – он должен идентифицировать содержание в довольно широком контексте. Обычно именно эти фразеологические единицы видны в результатах запросов, и именно по ним читатели будут определять, стоит ли щелкнуть по ссылке или продолжить поиск. Заголовок не является частью текста документа. Он не может содержать ссылок, знаков параграфа или подчеркивания. Идеальная длина заголовка – не более 64 символов. Как и прочие смысловые элементы текста Web-страницы, заголовки должны быть написаны иначе, нежели для других средств массовой информации: ведь это часть пользовательского интерфейса и навигационный элемент сервера. Если вы учитываете данный фактор, то многие приложения могут показать заголовки ваших документов в соответствующем окне, в меню, закладках, – другими словами, там, где место ограничено. Специальных ограничений на длину заголовков не существует, они легко генерируются автоматически, но слишком длинные могут быть обрезаны. Заголовок страницы должен содержать как можно больше ключевых слов и в то же время не выглядеть тяжеловесным. Часто заголовки вырезают из контекста, чтобы составить оглавление, краткий обзор сервера и т. п. Кроме того, именно эти элементы в первую очередь считываются роботами поисковых машин. В любом случае писать заголовки текстов для Internet нужно, ставя перед собой две задачи: • дать пользователю точную информация о содержании документа, чтобы ему не приходилось строить догадки; • не ввести пользователя в заблуждение привлекательным, но дезинформирующим заголовком. Сиюминутный успех обернется в дальнейшем резким снижением посещаемости вашего сайта из-за подрыва доверия. Метаданные Метаданными (от греч. met6 – после, за; между, среди) называют информацию о документе, служащую дополнением к его содержимому. Язык гипертекстовой разметки HTML позволяет авторам указывать подобные сведения множеством способов. С этой целью используют метатэги – данные, размещаемые за словом . Если обычные тэги языка HTML применяются для разметки страниц, то есть для придания им определенного внешнего вида, то назначение метатэгов совсем другое. Они несут в себе справочную и управляющую информацию, которая предназначена для различных агентов (клиентских приложений, поисковых роботов). Включение метатэгов в документ, как правило, обусловливает следующие основные цели: • управление процессом индексации документа или всего сайта в целом поисковыми роботами; • описание содержимого документа (также для поисковых роботов); • управление некоторыми функциями браузеров. Многие из метатэгов довольно абстрактны, то есть не содержат никаких полезных сведений и не заслуживают внимания с точки зрения агентов. Сами метатэги и их содержание скрыты от посетителя сайта. Однако поисковые машины их находят, а содержащиеся там данные играют не последнюю роль при определении рейтинга страницы. Однако не следует забывать, что некоторые поисковые машины не придают им значения. Метатэги не несут никакой визуальной информации и располагаются в заголовочной части HTML-документа между тэгами и . В любом другом месте они будут проигнорированы. Особенно важны они для страниц, использующих фреймы. Существует два вида метатэгов: • метатэги – эквиваленты HTTP-заголовков, имеющие формат записи: • информационно-указательные, записываемые следующим образом: Элементом META задается свойство, которому присваивается значение. Метатэги первого вида эквивалентны HTTP-заголовкам и обычно управляют действиями браузеров. Они используются, чтобы оптимизировать информацию, которую содержат обычные заголовки, и особенно важны, если документы загружаются по протоколу HTTP (протоколу передачи гипертекста – ftp://ftp.nsc.ru/pub/rfc/rfc2068.txt (ftp://ftp.nsc.ru/pub/rfc/rfc2068.txt)). Серверы HTTP могут использовать имя свойства, указанное в атрибуте HTTP-EQUIV, для создания заголовка в ответе HTTP. Мета-тэги второго вида чрезвычайно важны для работы поисковых машин. Элемент META лежит в основе механизма введения метаданных. Существуют, однако, некоторые тэги и атрибуты тэгов языка HTML, которые обрабатывают часть метаданных и могут использоваться авторами вместо элементов META: тэги TITLE, ADDRESS, INS и DEL, атрибуты тэгов TITLE и CITE. Метатэги – эквиваленты HTTP-заголовков Для метатэгов этого вида могут быть использованы следующие свойства: • Expires; • Pragma; • Content-Type; • Content-language; • Refresh; • Window-target; • Content-Script-Type; • Content-Style-Type. Рассмотрим их применение. Свойство Expires В примере ниже показано, как выглядит формат метатэга со свойством Expires (Дата устаревания): Клиенту будет возвращен такой заголовок HTTP: Expires: Mon, 29 Nov 2004 08:21:57 GMT Заголовок данного вида используется для управления кэшированием. Если указанный в метатэге срок устаревания истек, то при запросе документа он будет доставлен по сети, а не загружен из кэша. Нулевое значение даты (C0NTENT="0") приводит к тому, что браузер проверяет при каждом запросе, не изменился ли документ. Поисковые роботы могут либо совсем не индексировать его, либо постоянно отслеживать изменения в документе. Формат даты описан в стандарте RFC850 (ftp://ftp.nsc.ru/pub/rfc/rfc850.txt). Для решения ряда задач требуется, чтобы при каждом запросе документ загружался не из кэша браузера, а с сервера. Обычно это необходимо для сайтов, которые поставляют динамически изменяющееся содержание. В качестве примера можно привести результат какого-либо поиска (информация о курсе доллара в реальном режиме, электронный магазин или обычный чат). В таких случаях страница в кэше не обязательно соответствует реальной. В подобной ситуации можно запретить браузеру кэшировать страницы при помощи свойства метатэга Expires, которое указывает дату устаревания содержимого страницы. Для того чтобы она не кэшировалась, достаточно установить прошедшую дату – например, вот так: Если страница содержит постоянные данные и не требует регенерации при каждом запросе, то вам не следует отключать кэширование для браузера. Это позволит браузерам использовать сохраненную в кэше копию страницы в течение некоторого отрезка времени, которым вы можете управлять. Кэширование может значительно снизить нагрузку на вашем сервере. Обычно имеет смысл отключать кэширование лишь для динамических страниц, которые содержат информацию, изменяющуюся со временем. И то далеко не всегда. Какие же из динамических страниц могут быть кандидатами на кэширование? Например, страница с прогнозом погоды, где информация обновляется каждые 5 минут. Или начальная страница сайта, которая содержит список материалов на сервере или официальные сообщения для печати, которые модифицируются два раза в день. Другие подобные страницы, где обновления происходят раз в несколько часов. Заметьте, что с кэшированием в браузере вы получите меньшее количество посетителей, зарегистрированных на вашем сервере. Поэтому, если вы хотите точно измерять количество просмотров страниц или показов баннеров, то, скорее всего, вы откажетесь от кэширования. Свойство Pragma Свойство Pragma (Контроль кэширования) применяется для отказа от кэширования и задается следующим образом: Отказ от кэширования означает, что при запросе документа он будет доставлен по сети, а не загружен из кэша. Обратите внимание, что неразумное запрещение кэширования усложняет навигацию по сайту и увеличивает время ожидания. Так, при нажатии в браузере кнопки Back (Назад) происходит новый запрос сервера и приходится ждать загрузки страницы, которая минутой ранее была отправлена клиенту и уже есть у него в компьютере. Свойство Content-Type Свойство Content-type (Тип содержимого) служит для указания типов содержимого (типов MIME), к которым относятся «text/html», «image/png», «image/gif», «video/mpeg», «audio/basic», «text/tcl», «text/javascript» и «text/vbscript» (с учетом регистра). Текущий список зарегистрированных типов MIME можно найти по адресу ftp://ftp.isi.edu/in-notes/iana/assignments/media-types/ (ftp://ftp.isi.edu/in-notes/iana/assignments/media-types/). Тип содержимого «text/css», хотя он и не зарегистрирован, используется для иерархических, или каскадных, таблиц стилей (CSS). Тип документа "text/html" дополнительно расширяется указанием кодировки страницы charset (набор символов) – тогда браузер выводит ее сразу в заданной кодировке. Однако обратите внимание: если текст документа написан в windows-1251, а значение указано charset=K0I8-r, то изменить кодировку в браузере невозможно и текст совершенно не читается. Формат метатэга следующий (для типа содержимого "text/html" и набора символов windows-1251): Немного о кодировках Кодировка представляет собой таблицу, где каждому символу – буквам алфавита, цифрам и специальным знакам – соответствует свой уникальный номер, код символа. Полностью стандартизирована лишь первая часть таблицы, так называемый ASCII-код – первые 128 символов, включающих цифры и буквы латинского алфавита. Поэтому с ними никогда не бывает проблем. Вторая же часть таблицы (всего в ней 256 символов – по числу состояний, которые может принять один байт) отведена под специальные символы. Она используется для кодировки символов национальных алфавитов, причем для каждого языка и в каждой стране она различна. При этом для букв русского языка создано пять различных кодировок, то есть одному символу соответствуют разные цифровые коды. Таким образом, при неправильной кодировке мы получим совершенно нечитаемый текст. На заре развития вычислительной техники очень широко использовалась кодировка с кириллицей KOI-8. Она появилась в семидесятые годы при адаптации операционной системы UNIX к русскому языку – персональных компьютеров тогда еще не было. KOI-8 – до сих пор основная кодировка в UNIX. Потом началось победное шествие персональных компьютеров IBM, а с ними – операционных систем MS DOS, имевших DOS-кодировку (или кодовую страницу 866). Параллельно развивались компьютеры Macintosh, и, разумеется, была придумана еще одна кодировка – MAC. Наконец, с появлением операционной системы Microsoft Windows появилась и новая windows-кодировка (кодовая страница 1251). Она-то и стала самой распространенной в России. Еще один вариант связан с попытками стандартизации кодировок на уровне всей планеты. Разработчики из ISO, международной организации по стандартам, создали еще одну кодировку и назвали ее ISO-8859-5. В настоящее время она практически не применяется (по-видимому, ее используют лишь в базе данных Oracle), однако поддержка данной кодировки предусмотрена во всех браузерах. В настоящее время создана универсальная кодировка UNICODE, в которую вошли все языки мира, поэтому на каждый символ в ней отведено по два байта. Таким образом, максимальное число знаков в таблице расширилось до 65 535. Сейчас UNICODE находит свое применение, но пока не слишком широкое. Правильное отображение символов национальных алфавитов касается как Web-серверов, так и браузеров. Они должны осуществлять информационный обмен на одном языке и в одной кодировке, и только в этом случае сообщения будут доступны. Сервер должен иметь эффективную систему предварительного оповещения о том, в какой кодировке будет прислана страница. Клиентской программе (браузеру) необходимо принять такое сообщение и, соответственно, настроиться на нужное отображение. Если все сделать правильно, то никаких трудностей не возникнет. Однако при некорректной настройке Web-сервера он сообщает об одной кодировке (например, windows-1251), а страницу пересылает в другой (например, в KOI-8). Пользуясь указаниями сервера, браузер, естественно, ошибается и отображает страницу неверно. Как показано выше, можно задать кодировку документа не на сервере, а непосредственно в HTML-коде – с помощью метатэга со свойством Content-type. Но не все так просто. В России распространен способ, при котором сервер автоматически определяет, в какой кодировке приходит запрос от клиента, и пересылает страницу Web-браузеру уже перекодированной. Вот тут-то использование указанного метатэга и может сыграть с вами злую шутку. Дело в том, что указания на странице имеют приоритет над командами, присылаемыми Web-сервером, и, правильно перекодировав страницу, сервер не может изменить содержимое метатэга. Происходит несовпадение реальной кодировки, в которой пришел документ, и указаний в тэге META. Такую страницу нельзя будет нормально просмотреть и перекодировать средствами браузера. Выбор кодировки вручную в данном случае не поможет, так как метатэг имеет приоритет и над установками браузера. Единственный способ прочитать документ – это сохранить страницу и удалить злосчастный тэг. Учитывая все вышесказанное, данный тэг можно вообще не применять. Тогда просмотр будет вестись в той кодировке, на которую настроен браузер, если сервер не пришлет уведомление о другой кодировке документа. В этом случае клиент сможет легко ее переключить. У подавляющего большинства ваших посетителей из России по умолчанию выставлена кодировка windows-1251, поэтому у них страница сразу же будет показана правильно. Свойство Content-language Язык документа, указанный в метатэге со свойством Content-language (Язык содержимого), может использоваться поисковыми машинами при индексировании страниц. Метатэг имеет следующий формат: Язык задается комбинацией двух значений язык-диалект (при этом значение диалект может отсутствовать), в данном примере – английский-Великобритания. Язык представляет собой двухбуквенный код, зарезервированный для сокращений типа fr – французский, de – немецкий, ru – русский. Спецификация HTML 4.0 допускает явное указание автором языка в самом документе: Подобная информация может пригодиться: • поисковым машинам; • синтезаторам речи; • агентам пользователей (клиентским программам) при выборе вариантов глифов для типографской печати высокого качества; • агенту пользователя при выборе набора кавычек; • агенту пользователя при настройке переноса, лигатур и интервалов; • программам проверки грамматики и орфографии. Все коды языков, которые должны использоваться в документах на языке HTML, определены и описаны в стандарте RFC1766 (ftp://ftp.nsc.ru/pub/rfc/rfc1766.txt). Реализовывать рассмотренную возможность следует крайне осторожно, поскольку могут возникнуть проблемы, из-за которых текст на странице станет нечитаемым. Свойство Refresh Свойством Refresh (Период обновления) определяется время задержки, после которой браузер автоматически обновляет документ. Метатэг часто используется для автоматической загрузки другого документа (или, как говорят, переадресации, перенаправления). Формат метатэга таков: C0NTENT – число, указывающее время задержки в секундах; далее следует адрес, который нужно загрузить по прошествии этого времени. Подобный способ широко используется для создания кратковременных заставок. Но, поскольку некоторые браузеры его не поддерживают, в заставке, чтобы она не «зависала», необходимо предусмотреть возможность перехода на следующую страницу. Кроме того, применение данного способа затрудняет возврат на предыдущие страницы стандартными средствами. При переадресации (то есть при значении 0) пользователь не может вернуться на предыдущую страницу с помощью кнопки Назад (Back), так как его в ту же секунду пересылают на страницу, с которой он пытается уйти. Как известно, изменение адреса сайта влечет за собой потерю его посетителей. Поэтому обычно по старому адресу размещают информацию, которая поможет найти сайт. Но можно сделать и так, чтобы в дополнение к этому браузер сам перешел на использование нового адреса – благодаря метатэгу со свойством Refresh. Свойство Window-target Свойство Window-target (Окно текущей страницы) служит для определения окна текущей страницы. Его можно использовать, чтобы исключить появление новых окон во время применения фреймовых структур. Вид метатэга может быть, например, таким: Свойство Content-Script-Type Поскольку в документах HTML не предполагается использовать определенный язык сценариев, авторы должны указывать его непосредственно в каждом фрагменте кода. Это можно сделать с помощью объявления скрипта по умолчанию для всего документа или с помощью локального объявления. Чтобы объявить скрипт по умолчанию, в текст HTML-документа необходимо включить следующий метатэг: Здесь «type» – тип содержимого, указывающий язык скрипта. Примеры значений – "text/tcl", "text/javascript", "text/vbscript". Свойство Content-Style-Type Чтобы установить для документа язык таблицы стилей по умолчанию, надо использовать следующую строку: Документы, в которых применен тэг STYLE, но не определен язык таблиц стилей по умолчанию, являются некорректными. Метатэги для поисковых машин Метатэги, которые помогают поисковым машинам индексировать сайт, делают документы для них более доступными. Представители большинства поисковых систем уже сошлись во мнении, что применение метатэгов способствует повышению релевантности отклика при обработке запросов. Но есть и прямо противоположная точка зрения, которой придерживаются, например, эксперты российской поисковой машины Rambler. Если ваша компания широко известна и связана с производством уникальной продукции или оказанием услуг повышенного спроса, то проблем с локализацией ваших узлов в Internet у пользователя, скорее всего, не возникнет. Другое дело, если вы пытаетесь предоставить клиентам или читателям сервис или материал, не отличающийся оригинальностью, например, связанный с разработкой Web-страниц. В этом случае даже в первую сотню ссылок из списка отклика в глобальной поисковой системе попасть не просто. Способов повышения доступности узла из поисковых машин – и оправданных, и сомнительных с точки зрения этики – немало. Важно помнить о том, что универсальных рецептов пока не существует: слишком многое зависит от специфики работы отдельного поискового сервиса. Проблема заключается еще и в том, что фактически существует два подхода к решению рассматриваемого вопроса. Один предлагается в рекомендациях по созданию документов экспертами самой поисковой системы, другой используется разработчиками, чтобы достичь высокого рейтинга. По-видимому, самый полезный совет заключается в следующем: анализируйте HTML-код тех документов, которые добились в интересующей вас сфере деятельности и поисковой системе наивысших рейтинговых результатов. Это относится и к метатэгам, и к остальному содержимому страниц. Естественно, такой анализ требует специальных навыков и отличается трудоемкостью, что может послужить веским доводом для обращения к профессионалу. Оптимальный результат обеспечила бы компания-посредник, имеющая прямой контакт с разработчиками поисковых систем. Если нечто подобное и существует, информация об этом по понятным причинам вряд ли когда-либо будет предана огласке. Есть, однако, косвенные, хотя и медленно действующие приемы, которые позволяют провести анализ работы поисковых систем и доступны каждому: речь идет о тестировании. Известны примеры создания целых тестовых Web-узлов, единственная задача которых – определить, насколько чувствительна работа алгоритма отдельной поисковой машины к тому, как размещена информация на Web-страницах. Широкое распространение в Internet получила и разработка так называемых страниц-мостиков, которые оптимально нацелены на конкретную поисковую систему. Добраться с них до основной страницы узла адресатам информации позволяют гиперссылки. В целом ситуация, когда материалы сайта в первую очередь ориентированы на поискового робота, а не на конечного пользователя, не может не вызывать опасений. Так, например, одно время AltaVista особенно высоко оценивала содержимое заголовка страницы, помещаемое в контейнер TITLE. В результате список отклика этого индекса возглавили сотни документов, имеющих вместо связного заголовка набор ключевых слов и фраз. Именно этот набор становился по умолчанию именем закладки на документ при работе с большинством браузеров. Как оказалось, даже такая «прецизионная» настройка на систему не дает долговременных гарантий: после того как AltaVista изменила характер ранжирования документов, рейтинг многих фаворитов катастрофически снизился. Ключевые слова и описания Чтобы получить высокий рейтинг в поисковых системах, требуется выбрать для передачи им основные ключевые слова и фразы сайта. В общей сложности их должно быть не меньше десяти (желательно – несколько десятков), и они должны соответствовать содержанию сайта. Кроме того, требуется составить краткое описание сайта – абзац длиной не более 1 000 знаков (для некоторых поисковых машин – не более 700). Ваш сайт для поисковых систем – один из многих, поэтому текст описания, который обычно появляется на страницах с результатами поиска, должен быть интересным, привлекающим внимание, чтобы у читателя возникло сразу желание посетить сайт. Ключевые слова в нем необходимо использовать как можно чаще – от этого зависит высота рейтинга. Вообще, к подбору ключевых слов следует подойти очень серьезно. Правильный их выбор позволяет сильно повысить позицию сайта при запросах. Какие же слова следует выбирать? Разумеется, те, которые наиболее точно отражают специфику именно вашего проекта. При этом следует избегать случайных и общих фраз. Представьте себя на месте человека, который пытается найти ваш сайт. С каких слов вы начнете поиск? Что наберете в поле запроса поисковой системы? Каждый вариант следует проверить в какой-либо поисковой системе (лучше – в нескольких). Оцените, насколько список найденных сайтов связан с тематикой вашего. Если такая связь не вызывает сомнений, то выбранные вами слова подходят на роль ключевых; в противном случае стоит поискать другие. Для наглядности не мешает посмотреть, какие ключевые слова используются на первых страницах результата поиска. Многие индексирующие машины проводят поиск элементов тэга META, в которых задан разделенный запятыми список ключевых слов и фраз или дается краткое описание. Поисковые машины могут представлять их как итог поиска или использовать для улучшения его результатов. Формат указанных метатэгов иллюстрируют следующие примеры: В поле C0NTENT не должно быть знаков конца строки, кавычек и других специальных символов; регистр символов значения не имеет. Не рекомендуется повторять несколько раз одни и те же ключевые слова, так как это может быть воспринято как спам, в результате чего страница может быть удалена из индекса поисковой машины. Обычно спамом называют несанкционированную рассылку электронной почты. К ней зачастую прибегают недобросовестные рекламодатели, распространители вирусов и т. д. Однако здесь и далее по тексту под спамом будет подразумеваться намеренное злоупотребление ключевыми словами в заголовках, комментариях и тексте самого документа. Не стоит использовать одинаковые списки ключевых слов для разных страниц сайта. Конечно, так проще, но содержимое документов различное, да и поиск ведется по-разному. Если вам хочется автоматизировать эту работу (действительно, довольно трудоемкую, ведь общий объем ключевых слов одного документа может достигать 50 % от его объема), напишите программу, которая выбирала бы текст из определенных блоков документа, например, из контейнеров, заключенных в тэгах H, I и B. Задача не кажется сложной, да и можно найти подобную программу в архивах программного обеспечения в Internet. Если строка в поле C0NTENT получается слишком длинной, не возбраняется разбить ее на несколько конструкций этого вида. Указание ключевых слов – это основной способ использования тэга META. Информация о документе, составленном с использованием различных языков, может быть представлена в нескольких таких тэгах. Тогда поисковые машины могут фильтровать атрибут LANG и отображать результаты поиска с применением выбранного пользователем языка – например, так: <– Для говорящих на английском в американской версии-> <– Для говорящих на британском английском -> <– для русскоязычных пользователей -> Эффективность обращения к поисковым машинам можно повысить также за счет использования тэга LINK для создания ссылок на разноязычные переводы страницы, на версии документа для другого носителя (например, PDF) и, если документ является частью набора, ссылок на соответствующую начальную точку для просмотра набора. Метатэг NAME="keywords" позволяет автору документа самостоятельно создать адекватный содержанию набор ключевых слов и фраз. Допустимая для восприятия роботом длина перечня варьируется от 874 до 1 000 символов. При отсутствии указанного метатэга робот формирует набор автоматически на основе своего алгоритма. Если индексируется все содержимое документа, то он будет участвовать в отклике и по тем терминам, которые входят в текст страницы, но отсутствуют в метатэге. Автоматический индекс при создании поискового образа документа может комбинировать содержимое метатэгов и текста, должным образом взвешивая термины из разных полей Web-страницы. При этом далеко не все системы, которые поддерживают метатэги, отдают явное предпочтение входящим в них терминам. Отметим также, что метатэг ключевых слов стоит размещать в одну строку, поскольку некоторые роботы не умеют переходить к новой строке. Ключевые слова лучше не повторять более двух раз, иначе поисковая система может расценить это как спам. Нежелательно, например, задавать последовательности вида «free, free, free, free, free, free», но вполне допустимы такие, как «free, free web, free stuff, internet for free». Большего успеха можно добиться, если использовать не ключевые слова, а ключевые фразы. Если вы подберете их удачно, то, возможно, при запросе ваша ссылка окажется одной из первых. Есть еще один, не вполне серьезный прием, основанный на известной ошибке. Многие забывают переключать языковую раскладку клавиатуры, и тогда, допустим, вместо запроса «free» возникает запрос: «акуу», то есть английское слово, введенное буквами кириллицы, расположенными на соответствующих клавишах. Как ни странно, результат бывает положительным: поисковая система выдает ссылку на ваш сайт! Для хорошего индексирования документа поисковыми системами рекомендуется в первом абзаце текста на каждой странице использовать как можно больше отобранных для нее ключевых слов. Как известно, основную смысловую нагрузку несут в языке имена существительные. Поэтому именно они составляют большую часть ключевых поисковых слов. Значительно реже используются прилагательные, совсем редко – глаголы, наречия, предлоги, союзы. Имена прилагательные просто незаменимы, если требуется индексировать «голландский сыр» с «баварским пивом» в «ночном клубе». Очень эффективно использование редких слов. К таковым можно отнести специальные термины, названия местностей, организаций, имена людей и т. п. Применение подобной лексики позволяет максимально конкретизировать тематику. Существует целый ряд слов, которые поисковая система будет игнорировать при запросе; их поиск невозможен. Это так называемые стоп-слова, например: на, что, это, для и др. Они настолько часто встречаются в текстах, что искать по ним что-либо крайне затруднительно. Интересно, что в списки стоп-слов для некоторых поисковых машин уже входят такие, как Internet, компьютер, Сеть. Они стали настолько распространенными, что утратили свое значение (с точки зрения поиска, конечно). Очевидно, что использовать стоп-слова в качестве ключевых нет смысла. Метатэг NAME="description" позволяет включить в поле C0NTENT краткое описание документа. В зависимости от робота воспринимаемая длина текста составляет от 150 до 250 символов. После индексирования поисковой машиной описание должно появиться рядом со ссылкой на документ при попадании его в список отклика. Если ресурс ориентирован не только на русскоязычную публику, целесообразно сделать отдельные описания на разных языках. Следует создавать лаконичные и привлекающие внимание тексты; суть должна быть ясна с первого взгляда, поскольку на страницах с результатами поиска в поисковой системе информацию о каждом найденном сайте приводят в одном небольшом абзаце. При составлении описания не нужно указывать в нем название сайта – оно и так будет проиндексировано. С точки зрения индексирования сайта не имеют смысла общие фразы типа: «Здесь есть все», «Вам будет интересно», «Заходи, не пожалеешь!» и т. п. Обратите внимание посетителя именно общее содержание, а он сам разберется, нужна ли ему ваша страница или нет. Стоит ли заманивать читателей, если они сразу же покинут сайт, убедившись, что он не соответствует описанию? Если в документе нет описания, то в качестве такового поисковые машины приводят несколько начальных строк документа. Поэтому случается, что если в самом начале документа есть фрагмент, написанный на языке JavaScript, то вместо нормального описания выдается «абракадабра» в виде фрагмента скрипта. Словом, необходимо, чтобы описание имело вид аннотации, состоящей из нескольких ясных предложений, и тогда пользователь поисковой машины сможет легко понять смысл документа. При подборе ключевых слов для метатэга документа необходимо учитывать различные нюансы. Многие алгоритмы придают больший вес тому термину или фразе, которые расположены ближе к началу перечня. Число повторений ключевых слов не должно превышать определенного количества (как правило, двух-трех), во избежание применения санкций против спама: иначе страница не будет проиндексирована и включена в базу данных поисковой системы. Неплохую помощь могут оказать системы, которые отслеживают запросы, поступающие от пользователей на поисковые машины. Важно найти не просто адекватные содержанию ключевые слова и фразы, а именно те, которые часто применяются пользователями на практике. Итак, поисковые роботы берут ключевые слова и описание сайта непосредственно из кода страницы и содержимого метатэгов NAME = «keywords» и NAME="description". Однако не все системы придерживаются такой методики. Многие проверяют соответствие ключевых слов основному тексту страницы, а полнотекстовые поисковые машины анализируют все ее содержимое, хотя ключевые слова в ней при поиске являются приоритетными. Для более широкого охвата потенциальной аудитории ключевые слова и описание сайта, которые вы стремитесь вставить в большинство документов, рекомендуется корректировать в соответствии со смыслом конкретной страницы. Это повысит вероятность попадания на ваш сайт. Общее же его описание пригодится для страниц с «нейтральным» содержанием. Большинство поисковых машин придает большое значение титулу страницы и метатэгам с ее описанием и ключевыми словами. Однако стоит подумать не только о поисковых системах, но и о тех, кто увидит эти ссылки, – ведь в конечном итоге ссылки будут выведены на экран, а решать, переходить по ним или нет, будет пользователь. Допустим, вы сделали запрос program. Появились результаты, в числе которых, например, такие: Free program, program, free, program free, free program Free program, program, free, program free, free program, free program, program, free, program free, free program, free program, program, free, program free, free program, free program, program, free, program free, free program Воспользоваться такими ссылками уже не тянет – возникает предубеждение к сайту и его хитрому создателю. Современные поисковые роботы определяют спам и не индексируют страницу, но машина – это всего лишь машина. Можно просто вписывать в титул метатэги, ключевые выражения, результат будет тот же: бессмысленные ссылки! Пожалуй, не зря считается, что оформление страниц для поисковых систем – это наука и искусство. Ваша задача – не только правильно подобрать ключевые фразы и слова, но и составить из них логичные предложения для титула и описания, которые и выводятся в результатах поиска. При этом еще надо уложиться в отведенное количество символов. Подбор ключевых выражений начинает походить на некое таинство, особенно это касается иностранных поисковых систем: некоторые расхожие слова уже «проданы», и вы, как ни бейтесь, на первое место по ним не попадете. Появилась даже платная услуга по подбору ключевых слов и оформлению документов под них, осуществляемая профессионалами. Если вы полагаете, что вам это не нужно, – готовьтесь постоянно следить за своим рейтингом в поисковых машинах и определять положение ваших ссылок по заданным ключевым словам, ведь поисковики действительно могут обеспечить вам существенный приток посетителей. Язык документа В глобальном контексте Internet важно знать, на каком языке создается страница. Определите язык документа, как описано выше, в разделе «Свойство Content-language». Языковые варианты документа Если вы подготовили переводы документа на другие языки, используйте тэг LINK для ссылки на эти тексты. Такой подход повысит эффективность поисковых машин и позволит им предлагать результаты поиска на языке, предпочитаемом пользователем, независимо от построения запроса. Например, следующие ссылки предлагают поисковой машине французскую и немецкую версии: Указанным тэгом определяется связь. Хотя он может быть представлен неограниченное число раз, его присутствие допускается только в разделе HEAD документа. Несмотря на то, что тэг LINK не имеет содержимого, он является носителем информации об отношениях, которая может представляться агентами пользователей (браузерами) различными способами, например, в виде панели с выпадающим списком ссылок. Таким же способом с помощью тэга LINK задаются ссылки на версии документа для другого носителя (например, PDF) и, если документ является частью набора, ссылки на соответствующую начальную точку для просмотра набора. Начало набора Наборы документов, или представлений систем обработки текстов, часто переводятся в наборы документов HTML. Для поисковых машин полезно указать ссылку на начало набора в дополнение к тому, что страница попала в результаты поиска. Вы можете помочь поисковым системам, применив тэг LINK, имеющий атрибуты REL="begin" и TITLE=, как показано в следующем примере: Инструкции для роботов – файл robots.txt Алгоритмы работы многих поисковых машин предусматривают возможности ограничения действий роботов. Это достигается с помощью файла robots.txt и тэга META в документах HTML. Файл robots.txt объясняет роботу поисковой машины, что надо индексировать, а что не стоит. Зачем, например, индексировать служебные файлы, скажем, статистические отчеты? Файл содержит набор команд, которые позволяют закрыть от индексирования отдельные каталоги узла. Обычно закрываются каталоги, содержащие скрипты, служебную информацию и т. п. Отчасти это повышает контрастность значимых документов узла в поисковой системе. К тому же поисковые машины нередко вводят ограничение на число ресурсов, регистрируемых для одного сервера. Некоторые – так, например, действовал робот поисковой системы Lycos, – вообще не проводят индексирования, если указанный файл отсутствует. Итак, если вы поддерживаете работу сервера с доменным именем www.mysite.ru (http://www.mysite.ru/), то содержимое файла robots.txt должно быть доступно по адресу: http://www.mysite.ru/robots.txt (http://www.mysite.ru/robots.txt), то есть данный файл следует загрузить в корневой каталог вашего сайта. Когда робот просматривает Web-сайт, сначала он проверяет наличие документа http://www.mysite.ru/robots.txt (http://www.mysite.ru/robots.txt). Если таковой обнаружен, анализируется его содержимое и выясняется, позволено ли загрузить документ. Вы можете настроить файл robots.txt для конкретных роботов и запретить доступ к определенным каталогам или файлам. На одном сайте может быть только один файл robots.txt. Не следует помещать файлы с данным именем в каталоги, поскольку робот их не найдет. Обратите внимание, что при адресации в Internet учитывается регистр, поэтому название robots.txt должно быть задано в нижнем регистре. Файл robots.txt – это обычный текстовый документ, содержащий одну или несколько записей, разделенных пустыми строками, как показано в следующем примере: # robots.txt for http://www.mysite.ru (http://www.mysite.ru/) User-agent: * Disallow: /cgi-bin/maillist/ Disallow: /tmp/ Disallow: /product1.html User-agent: aport User-agent: scooter Disallow: Вот пример файла robots.txt, полностью запрещающего доступ к сайту всем роботам: User-agent: * # Применяется ко всем роботам. Disallow: / # Запретить индексацию всех страниц. Каждая запись должна начинаться с указания переменной User-agent отдельной строкой. Таких строк может быть и несколько. Значением переменной User-agent задается оригинальное имя программы-робота соответствующей поисковой системы, для которой предназначена информация. Согласно спецификации на файл robots.txt, текст в нем чувствителен к регистру, так что следует записать именно User-agent, а не User-Agent. Трудно сказать, вызывает ли неверное написание проблемы у роботов поисковых систем, но для надежности лучше соблюсти требования спецификации. Имя робота может быть похоже на название соответствующей поисковой системы, а может и сильно отличаться от него. Далеко не всегда оно соответствует названию механизма поиска. Поэтому нельзя просто написать AltaVista в Useragent и ожидать, что AltaVista исключит указанные вами страницы. Имя робота указывается без учета регистра и не включает информацию о версии. Можно перечислить несколько имен через пробел. Символ * является маской и означает: «для всех роботов». В этом случае запись описывает режим доступа по умолчанию для любого робота, неупомянутого явно в других записях. В файле robots.txt не может быть нескольких таких записей. В табл. 1 приведены имена роботов некоторых поисковых систем. Таблица 1. Имена роботов поисковых систем Начиная со следующей строки после указания переменной User-agent, определяются собственно правила поведения робота в виде задания значений переменным Allow (Разрешить) и Disallow (Запретить). В поле Allow задается перечень разрешенных для посещения роботами поисковых машин каталогов и файлов, а в поле Disallow – перечень закрываемых каталогов и файлов. Это может быть полный или частичный путь. Любой URL-адрес, начинающийся с этого значения, нельзя будет загрузить. Например, запись Disallow: /help запрещает доступ к /help.html и /help/index.html, в то время как запись Disallow: /help/ запретит доступ к /help/index.html, но разрешит доступ к /help.html. Если файл находится в корневом каталоге, обязательно включите перед его именем символ «слеш» – косую черту вправо. Пустое значение параметра Disallow означает, что все URL сайта могут быть проиндексированы. Частая ошибка при написании robots.txt состоит в том, автор ставит *, чтобы указать, что хочет исключить все файлы в каталоге. Однако правильным будет не включать никаких звездочек в поле Disallow. В файле robots.txt должно быть, по крайней мере, одно поле Disallow. Символ # предваряет комментарии, необрабатываемые роботами. В примере, рассмотренном выше, первая запись запрещает индексирование двух каталогов и файла product1.html. Роботу Scooter поисковой системы AltaVista и роботу Aport поисковой системы Апорт для доступа открываются все каталоги (поле Disallow пусто). При необходимости закрыть все каталоги следовало бы написать: Disallow: /. Пустая строка между записями необходима. Очень важно не допускать ошибок в файле robots.txt. В противном случае конструкции могут не работать, а вы даже не будете знать об этом. Возможно, некоторые поисковые системы без затруднений разрешат проблемы, возникающие из-за различий в синтаксисе, однако абсолютной гарантии нет. Поэтому, если вы обнаружите ошибку в синтаксисе, исправьте ее и повторно зарегистрируйте ресурс в поисковых системах. Роботы поисковых машин снова проиндексируют ваш сайт и выполнят все указания, имеющиеся в файле robots.txt. Обратите внимание, что недопустимы строки вида: Disallow: /tmp/* или Disallow: *.gif Подробное описание стандарта исключений и синтаксиса команд файла robots.txt вместе с другой полезной информацией о роботах (на английском языке) можно найти по адресу http://www.robotstxt.org/wc/robots.html (http://www.robotstxt.org/wc/robots.html). Тэг META для роботов Файл robots.txt поддерживается практически всеми роботами, однако корневой каталог сервера может быть недоступен вам. В этом случае для аналогичных целей, но лишь в пределах одного документа можно использовать специальные метатэги. Они не только решают проблему запрета, но и предоставляют позитивные возможности для управления индексированием. Это более гибкое средство управления индексацией, чем robots.txt. В частности, в тэге можно дать роботу поисковой машины предписание не уходить по ссылкам на чужие серверы, например, в документах со списками ссылок: Из данного примера видно, что все управление в метатэге сводится к указанию двух переменных, а именно NAME и C0NTENT. Для переменной C0NTENT в контексте NAME="robots" допустимо использовать следующие значения (они могут быть записаны как строчными, так и прописными буквами): • index – разрешено индексировать документ; • follow – разрешено следовать по ссылкам; • all – эквивалентно употреблению index и follow одновременно (записывается через запятую), то есть разрешено индексировать данную страницу и все ссылки, исходящие из нее. Когда обнаружено слово all, все другие слова, если они указаны, игнорируются; • noindex – не индексировать сам документ, но следовать по его ссылкам; • nofollow – индексировать, но не идти по ссылкам; • none – эквивалентно одновременному употреблению noindex и nofollow через запятую, то есть всем роботам предложено игнорировать данную страницу при индексации. Если указанный метатэг пропущен или не задано значение переменной C0NTENT, то по умолчанию поисковый робот действует, как при значении C0NTENT="index,follow" (или C0NTENT="all", что равноценно). Если в переменной C0NTENT содержатся противоположные по смыслу ключевые слова (например, follow и nofollow), то робот поступает по своему усмотрению; в данном случае выбрано follow). В приведенном выше примере свойство NAME="robots" дает роботам предписание индексировать и саму страницу (C0NTENT="index"), и документы, ссылки на которые она содержит (C0NTENT="follow"). Вместо двух этих значений, приведенных через запятую, можно было бы написать одно – C0NTENT="all" – с тем же результатом. Указанный метатэг позволяет авторам HTML-документов сообщать роботам о том, может ли документ быть проиндексирован или его следует использовать, чтобы получить дополнительные ссылки. Для этого не требуется вмешательства администратора сервера. В следующем примере роботу не предписано ни индексировать сайт, ни анализировать ссылки: Другие метатэги Другие метатэги также могут использоваться роботами при сканировании. Например, тэг с параметром NAME="author" позволяет ввести имя автора документа и учитывается некоторыми поисковыми системами, что иногда может существенно помочь при поиске. Похожий метатэг с параметром NAME="generator" часто автоматически проставляется различными HTML-редакторами и содержит информацию о программе, в которой был сделан документ. Некоторые авторы в его описании дублируют информацию метатэга "author". Метатэг с параметром NAME="copyright" служит для указания принадлежности авторских прав. Справедливости ради следует отметить, что поисковые системы все же редко используют указанные метатэги в своей работе. Проверка ссылок До начала рекламной кампании стоит убедиться в том, что в текстах страниц, размещенных на сайте, нет технических ошибок. К таковым относятся неправильно расставленные ссылки, отсутствие каких-либо файлов и собственно погрешности в HTML-коде, а также грамматические и орфографические ошибки в текстах документов. Напомним, кстати, что сайтом называют набор документов, которые в установленном порядке размещены на определенной машине и доступ к которым через сеть обеспечивается HTTP-сервером. Реакция пользователя на ошибки такого рода может иметь самые печальные последствия для автора. Замечая их, посетитель испытывает досаду, раздражение и быстро уходит с сайта. Уговорить «обиженных» вернуться будет крайне трудно. Формальную проверку сайта можно провести как сетевыми средствами, так и при помощи различных программ. Кроме того, необходимо обратить особое внимание на смысловые элементы, играющие немаловажную роль при «раскрутке» Web-ресурса: • заголовки; • использование фреймов; • метатэги; • навигацию по Internet-страничкам. В качестве дополнительной проверки понадобится исследование времени загрузки ваших страниц. Кроме того, очень важно иметь доступ к файлам посещений, что позволит вести постоянный анализ жизнедеятельности сайта в самых разнообразных аспектах. В каком-то смысле созданный вами гипертекст похож одновременно и на книгу, которую вы должны откорректировать, и на программу, которую необходимо отладить. По крайней мере, следует дать прочитать его кому-нибудь из той группы людей, для которой он написан, и проанализировать замечания. Но одного этого недостаточно, требуется протестировать документ. Просмотрите его в нескольких различных обозревателях (браузерах), чтобы убедиться, что его вид не зависит от средства вывода. Проверка занимает время. Сколько времени отводить на тест? Все зависит от того, какое качество документа вас устраивает. Есть сведения, что в Internet около 5 % имеющихся ссылок недоступны. Необходимо предотвратить подобные проблемы. Проверка ошибок кода в HTML-документах Если вы используете программное обеспечение для редактирования гипертекста, ваши файлы будут соответствовать действующему стандарту HTML. Многие разработчики редактируют HTML-файлы как обычные текстовые и должны самостоятельно контролировать соответствие написанного правилам HTML. Если вы поступаете именно так, будет уместно проверять файлы при помощи программ и сетевых ресурсов, специально предназначенных для этого. Проверка HTML-кода гарантирует, что все посетители, каким бы браузером они ни пользовались, увидят ваши страницы именно такими, какими видите их вы. Ошибки, определяемые программами или сетевыми сервисами проверки правильности HTML-кода, обычно относятся к двум категориям: неправильное применение тэгов и использование нестандартных расширений. HTML-стандарты задают некий минимальный уровень требований, соблюдение которых дает сходные результаты при обработке тэгов языка HTML различными программами просмотра HTML-документов. На практике требования браузеров несколько отличаются от этого уровня в ту или иную сторону, однако в любом случае исправить ошибки первого рода легко, и это не займет много времени. Со вторыми дело обстоит не так просто. На вашей странице могут оказаться тэги, поддерживаемые только одним из браузеров и неработающие в других. Стоит взвесить, что дает их применение – оправдает ли оно потерю посетителей, использующих несовместимые программы просмотра. При профессиональном проектировании сайта обычно отслеживают, какими браузерами пользуются посетители, чтобы придти к разумному компромиссу при выборе тех или иных решений. Если у 98 % ваших посетителей браузеры могут обрабатывать тэг, который действительно позволяет сделать страницу более красивой и удобной, – можно его сохранить. Проверку синтаксиса HTML-документов невозможно выполнить с помощью обычных браузеров, так как они предназначены только для просмотра HTML-страниц. Если в документе имеются синтаксические ошибки, браузер пытается, игнорируя их, каким-либо образом показать страницу на экране. Однако решается такая задача каждый раз по-новому – в зависимости от типа браузера и даже от его версии. Если ошибок на странице слишком много, она может быть не отображена в окне браузера или отображена лишь частично. Программные и сетевые средства проверки HTML-документов позволяют предупредить такое поведение браузеров, выявляя допущенные при разработке страниц ошибки. Отметим, что сделать это довольно просто. Выявив ошибки до размещения HTML-документов в Internet, вы заметите, что страницы будут загружаться быстрее, а проблем станет значительно меньше. Задание типа документа В соответствии со стандартом каждый HTML-документ предполагает наличие объявления типа документа. В семействе языков разметки HTML является всего лишь одним из многих, хотя и самым популярным. Он имеет уже многолетнюю историю и был за это время нормирован различными версиями. Заданием типа документа указывается используемый язык разметки и его версия. Программы, читающие эти указания (например, обозреватели Internet и программы проверки синтаксиса HTML-кода), придерживаются таких указаний. В частности, декларация типа документа дает возможность программам проверки определить, какую версию HTML следует использовать для контроля. Каждое указание типа документа связано с так называемыми определениями типа документа (DTD, Document type declaration). И для HTML существуют такие DTD. В них оговорено, какие элементы (тэги) может содержать документ типа HTML, какие элементы могут располагаться внутри других элементов, какие атрибуты принадлежат тому или иному элементу, является ли задание того или иного атрибута обязательным и т. д. Рекомендуется начинать любой HTML-документ со строки, содержащей определение типа документа – тэг DOCTYPE. Для этого обычно используются нижеперечисленные конструкции. Такое объявление служит указанием, что используется тип документа HTML 4.01 Strict (Строгий). Строгое следование стандартам повышает ранг документа в рейтингах поисковых машин. Если стандарт полностью соблюден – пользуйтесь этим определением. Задавайте тип документа первой строкой HTML-файла перед открывающим тэгом . Обратите внимание, что за угловой скобкой следует восклицательный знак. Запись DOCTYPE HTML PUBLIC означает, что вы ссылаетесь на всем доступный HTML-DTD. Заключенные в кавычки данные расшифровываются следующим образом: • W3C – издатель DTD: в данном случае, WB-консорциум; • DTD HTML 4.01 – указание типа: в файле применен документ типа HTML в версии 4.01 и варианте Strict (по умолчанию); • EN – сокращение, указывающее на язык (в данном случае – английский) написания элементов (тэгов) и их атрибутов, но не содержания файла. Применяйте всегда EN, так как имена элементов и атрибутов HTML основаны на английском языке. Последним параметром в объявлении является адрес в Internet DTD-файла, который дает возможность программам загрузить его и прочитать определенные в нем правила. Заметим, что, в отличие от программ проверки синтаксиса, большинство браузеров при представлении HTML-документов этого не делают. Такой подход основан на желании разработчиков Internet-обозревателей отображать даже те страницы, которые написаны с большими отклонениями от правил правописания HTML. Используется тип документа HTML 4.01 Transitional (Переходный). Имеется в виду HTML «переходного периода», то есть разрешается применять устаревшие элементы из HTML 3.2. Тип документа HTML 4.01 Frameset – это HTML 4.01 Transitional с добавлением фреймовых элементов. Эта форма задания типа документа применима, если вы хотите сослаться на версию HTML 3.2. То же – на версию HTML 2.0. Шрифтовое оформление Всего лишь десять лет назад в дизайне ощущалась острая нехватка компьютерных шрифтов (как по количеству, так и по качеству). Однако в настоящее время эта ситуация резко изменилась – появилась масса разнообразнейшего шрифтового материала любых стилей. Internet-технологии накладывают специфические ограничения на использование шрифтов в оформлении web-документов. B частности, межплатформенный характер Сети не позволяет однозначно определять шрифт для вывода текста документа на экран монитора клиента. Применение тэга не является панацеей от этой проблемы. На клиентской машине, возможно, не окажется нужного шрифта, а замена его другим, выбранным системой по умолчанию, может привести к появлению нечитаемого документа. Поэтому считается правилом хорошего тона не употреблять указанный тэг при проектировании HTML-документов. Это заставляет изыскивать другие пути для оформления текста страниц. B частности, выделение необходимых его частей цветом, применением строчных символов, их курсивного и полужирного начертания, а также манипуляции с кеглем шрифта, выводимого на экран. Немаловажным для удобства восприятия информации оказывается цветовое соотношение текста и фона. Если предполагается передача клиенту достаточно большого объема информации, то с точки зрения удобства для чтения желательно, чтобы текст был выполнен темным цветом на светлом фоне и был достаточно контрастным. Применение ярких подложек под текст (задний фон) является сильным выразительным средством, но, необходимо помнить, что читать текст по яркому, а тем более неоднородному, фону трудно, а иногда просто невозможно, так как символы теряются в пестроте подложки. Конкретный шрифт, который будет применен для отображения текста, позволяет задавать также каскадные таблицы стилей (CSS). Но и в этом случае шрифты берутся из набора, установленного на компьютере пользователя. Поэтому следует учитывать ряд ограничений. Первое, и основное, заключается в том, чтобы использовать только стандартные шрифты, поставляемые с операционной системой MS Windows и гарантированно находящиеся на машине клиента. А этих шрифтов всего три: Arial, Times New Roman и Courier. Второе – корректное описание шрифта в таблице стилей и перечисление также и других заменяющих шрифтов. В конце списка должно быть обязательное указание общего семейства шрифта (с засечками – без засечек, моноширинный – пропорциональный и т. д.). При помощи такого описания мы увеличиваем потенциальную аудиторию нашего сайта. Пример корректного описания шрифтов в таблице стилей приведен ниже: Почему нежелательно использовать другие шрифты? В этом случае недостающий шрифт будет подменен ближайшим подходящим по умолчанию. Для уменьшения вероятности такой замены и используется в CSS список заменяющих шрифтов. Но еще хуже, если нужный шрифт будет установлен на компьютере, но окажется нерусифицированной версией. Тогда текст будет отображен некими спецсимволами – всевозможными знаками с умляутами, апострофами, тильдами и т. п. Одним из показателей удобочитаемости является ширина строки документа. С появлением мониторов, поддерживающих большое разрешение экрана, стало возможным уместить в одной строке до нескольких сотен символов, однако едва ли следует увеличивать это число более 50–70, так как при большем количестве скорость чтения замедляется, а утомляемость значительно возрастает. В современном «информационном обществе» очень важна способность шрифта привлекать или останавливать внимание. Поэтому из вышесказанного следует вывод – со шрифтами следует работать осторожно, дабы не потерять своих посетителей. Время загрузки страниц Медленная загрузка страниц сайта зачастую раздражает пользователей и, как следствие, снижает посещаемость сервера. Не желая убивать время, многие предпочитают искать информацию в других источниках. Поэтому крайне важно не жалеть материальных затрат на быстрый сервер и специалиста, который проанализирует архитектуру сайта и исходные коды страниц, поможет максимально уменьшить время их загрузки. Посетителям нет дела до причины медленной работы сайта. Все, что они отмечают, – это плохая работа сервера. Изначально основной причиной медленной загрузки страниц было чрезмерное увлечение графикой. Многие сайты перегружены ею, тогда как те же самые эффекты можно было бы получить при помощи DHTML или даже простого HTML. С увеличением количества разнообразных программных приложений, основанных на современных Internet-технологиях, и развитием электронной коммерции возникла необходимость настраивать каждую страницу узла на запрос отдельного пользователя. Таким образом, длительная загрузка может объясняться не только пропускной способностью канала, но и внутренней архитектурой сайта. Иногда конструкция страницы предусматривает обращения к базе данных, находящейся на удаленном сервере, что опять же увеличивает время загрузки. Исследованию времени, в течение которого происходит загрузка страниц сайта, стоит уделить особое внимание при разработке. Использование фреймов В современных браузерах навигация по сайтам с фреймами осуществляется без особых затруднений. Однако некоторые поисковые системы не индексируют фреймы, поэтому при их использовании на запускающей странице обязательно нужно поместить фрагмент кода: Текст между указанными тэгами и будет использован поисковыми роботами для создания индексов. Кроме того, это дань уважения тем, кто пользуется браузерами, неработающими с фреймами, или отключает такую возможность, если позволяет программа-обозреватель. Не пренебрегайте частью вашей аудитории. Проверка правописания Пользователи не любят опечаток и грамматических ошибок и из-за них могут отказаться от посещения вашего сайта. Если вас плохо владеете орфографией и пунктуацией, попросите кого-нибудь сведущего проверить правописание текста, либо воспользуйтесь специальными сервисами в Internet. Как именно – будет показано далее. Ошибки правописания – какая от них польза Не все люди, пользующиеся поисковыми системами, хорошо учились в школе. Составляя запросы, они допускают грамматические ошибки. Некоторые из ошибок носят хронический характер. Создается впечатление, будто большинство твердо уверено, что «агенство» (результат поиска в Яndex: слов – 2 732 174, страниц – 1 515 338, сайтов – не менее 4 126, запросов за месяц – 98 355), «пожайлуста» (соответственно, 1 034 863, 211 855, 1 384, 270), «можите» (260 518, 211 660, 1 670, 482), «интеренет» (175 538, 132 533, 1 697, 3 166) и «координальное» (39 321, 33 341, 1 958, 47) – это правильно и так и надо. Кое-какие опечатки легко спрогнозировать, глядя на клавиатуру компьютера. Если в списки ключевых слов добавить слова с ошибками, можно иногда извлечь из этого пользу: получить не только дополнительный трафик, но и, что более важно, целевых посетителей, которые легко выйдут на искомый сайт. Причем все останутся довольны: пользователь найдет то, что искал, а вы получите, возможно, покупателя своих товаров или услуг. Навигация по сайту В настоящее время люди уделяют Internet-адресам меньше внимания, нежели несколько лет назад. Большинство сайтов сейчас имеют хорошую навигационную поддержку, и пользователи полагаются при определении тематики сайта именно на нее, а не на адрес. Тем не менее, все каталоги и названия страниц должны быть связаны с тематикой и понятно названы, чтобы пользователь мог рассматривать сам адрес как дополнительную помощь в навигации. Подавляющее большинство пользователей не прокручивают навигационный блок, а выбирают несколько из видимых на первом экране опций. На всех сайтах чаще всего используются те элементы навигации, которые расположены на первой странице. Особенно это заметно, если первые несколько ссылок навигационного блока описывают главную тематику сайта – пользователь, как правило, стремится найти нужную информацию, а не изучать оставшиеся ссылки, поэтому на остальные элементы навигации может даже не обратить внимания. А вот малопонятная навигация по сайту представляет серьезную проблему, хотя встречается не так уж часто. Люди уже привыкли к определенным канонам в дизайне и навигации: логотип – он же ссылка на начальную страницу – слева вверху; ясное указание на то, к какой части сайта относится данная страница, наличие ссылки на главную страницу этого раздела и т. д. Если такие базовые элементы навигации отсутствуют, пользователь может попросту «заблудиться». Нестандартные цвета ссылок могут затруднить навигацию, поскольку пользователи полагаются на них, чтобы понять, какие страницы сайта они уже посетили. Когда же стандартные цвета игнорируются, пользователь начинает автоматически щелкать мышью подряд по всем подчеркнутым словам в тексте, которые далеко не всегда являются ссылками, и, конечно же, в итоге раздражается. Появление новых окон Если при щелчке по ссылке открывается новое окно браузера, а такое решение никоим образом не оправдано логикой перемещений по сайту, то это может сбивать с толку пользователей. Большая часть из них обычно максимизирует окно браузера, так что они иногда могут просто не заметить, что открылось еще одно окно. Кроме того, как правило, пользователь исследует сайт, нажимая на кнопку Back (Назад). В новом окне его может смутить дезактированный Back, и он просто закроет окно вместо того, чтобы разбираться, почему ему не дают вернуться на предыдущую страницу обычным способом. Нестандартное использование элементов управления Постоянство – основа удобства сайта. Когда элементы интерфейса ведут себя однозначно, посетителю не приходится гадать, что произойдет, если он нажмет вот на эту кнопку или ссылку. У него есть убежденность, что этот конкретный элемент ведет себя именно так, как известно из предыдущего опыта. Чем полнее оправдываются ожидания пользователя, тем лучше. Он будет чувствовать себя уверенней, и ваш сайт понравится ему еще больше. С другой стороны, необычно работающая система внушает пользователю страх и неуверенность. Постоянство действий – еще одна причина, по которой не стоит открывать новые окна в браузере. Стандартное следствие нажатия на гиперссылку – появление новой страницы в том же окне браузера. Любой другой результат не оправдывает ожиданий пользователя, а значит, заставляет его усомниться в своей способности работать в Internet. Часто закон постоянства нарушают при использовании графических элементов управления, например, кнопок-селекторов и флажков. Так, по правилам действия селекторов нужно выбрать одну из нескольких предложенных опций, однако никаких операций не производится, пока пользователь не нажмет кнопку ОК, подтверждая выбор. Но нередко встречаются сайты, на которых это базовое правило нарушено – действие происходит сразу после выбора опции. При всей своей кажущейся незначительности именно такие нарушения правил работы элементов пользовательского интерфейса затрудняют путешествия по сайту. Сведения об авторах Из результатов первых исследований WWW десятилетней давности следовало, что пользователю интересно, кто стоит за информацией, представленной в Сети. Так, например, фотографии и биографии авторов сайта могут существенно поднять рейтинг ресурса и сделать Internet менее безличной и непонятной средой, увеличить доверие к информации. Показывая пользователю конкретную личность и ее мнение, вы окажетесь в более выигрышном положении, чем те, кто предпочитает давать анонимные сведения. Тем не менее, многие разработчики не используют в информационных ресурсах ни авторских колонок, ни даже развернутых подписей. А те, кто использует подписи, нередко забывают ставить в них ссылки на биографию и другие работы автора. Также плохо, когда вместо ссылок на работы и биографию имя автора становится ссылкой на его, автора, электронную почту (mailto: autor@server.com (mailto:autor@server.com)). Во-первых, читателю свойственно, скорее, желание узнать об авторе больше, нежели напрямую с ним контактировать. Конечно, дать электронный адрес автора очень важно, но лучше делать это в конце биографии или списка работ, но никак не в начале, при первом знакомстве. Во-вторых, это опять нарушает принятые в Internet стандарты: когда вы щелкаете по имени-ссылке, вы ожидаете увидеть страницу с информацией об авторе. Вместо этого вам предлагается тут же написать ему письмо. Такие ссылки существенно уменьшают удобство ресурса, так как делают Internet менее предсказуемым. Отсутствие архивов Старая информация – не значит плохая. Читателям она может оказаться необходимой. Даже если новая информация оказывается гораздо полезней, у старой тоже найдется свой потребитель. Кто-то подсчитал, что поддержка архивных данных на сервере увеличивает расходы приблизительно на 10 %, в то время как полезность и посещаемость ресурса возрастают при этом на все 50 %. Архивы также помогают избежать появления на сервере ошибки 404 (о ней далее), дают преимущество при создании ссылок на ваш ресурс на других серверах. Улучшение посещаемости сайта за счет обработки ошибок Существуют очень простые, но почему-то не всегда используемые методы увеличения числа посетителей сайта за счет тех, кто стремится попасть к вам по устаревшей ссылке. Ясно, что любой сайт подвергается постоянной доработке и переработке. Вы изменяете дизайн, содержание, добавляете новые страницы, иногда удаляете или переименовываете старые. Последние две операции крайне нежелательны, но, бывает, и без них не обойтись. Скорее всего, посетители сайта не застрянут на такой «исчезнувшей» странице, так как большинство знает, что нужно просто «отсечь» конец адреса – и попадешь на главную страницу сервера. Правда, этот способ не всегда известен неопытным пользователям и раздражает опытных. Как правило, при обращении к документу, не существующему на сайте, сервер формирует сообщение об ошибке. Интересно, что в этой ситуации очень легко привести посетителя на любую из ваших страниц, обычно – на главную или страницу поиска по сайту. Вот как это делается: 1. Создайте новую чистую страницу, соответствующую дизайну вашего сайта. Сохраните ее в корневом каталоге сайта под именем 404.html. 2. Между тэгами и включите следующую строку: Так выглядит, как вам известно, указание роботам поисковых машин не индексировать страницу в своих базах данных. Следовательно, метатэги KEYW0RDS и DESCRIPTI0N здесь не нужны. 3. Теперь добавьте на страницу содержание, например, такое: Документ не обнаружен. We recently redesigned our website, replacing many of our pages, updating information and making it more convenient for you to find what you are looking for. It seems that the page you are looking for is one that has been replaced. Please visit our new Home Page, or use the links on this page to find your way around our new website. We apologize for any inconvenience this may have caused you. (Сайт был изменен, некоторые страницы перемещены, информация обновлена, с тем, чтобы Вам было удобнее осуществлять поиск. Видимо, страница, которую вы ищете, теперь находится в другом месте. Пожалуйста, зайдите на обновленную домашнюю страничку или воспользуйтесь ссылками на этой странице для навигации по сайту. Извините за временные неудобства.) И не забудьте дать ссылку на нужную страницу (главную или страницу поиска). 4. Закончив работу с файлом 404.html, создайте обычный текстовый документ и назовите его. htaccess.txt (с точкой в начале). Впишите в него строку: ErrorDocument 404 /404.html 5. Скопируйте оба файла в коревой каталог вашего сайта в Internet. В зависимости от конфигурации сервера файл. htaccess.txt может не иметь расширения (.htaccess). Кроме того, он может уже существовать на сайте. В последнем случае просто добавьте указанную выше строку в конец файла. Теперь спокойно обновляйте дизайн вашего сайта, и можете быть уверены, что посетителей вы не потеряете. Теперь при любом обращении к несуществующей странице посетитель получит вежливое извинение и доступ к сайту через ссылку, а не досадное извещение: 404 – Page not found (Ошибка 404 – Документ не найден). Более того, вам становится доступно то, что раньше безвозвратно терялось – статистика посещений через страницу 404.html. Ее содержание, конечно, может быть любым, сделайте хоть копию главной страницы. Важно, что вы пригласили на свой сайт людей, которые не нашли желаемое, и привлекли посетителей, которые бы к вам заведомо не попали. Перевод на другие языки Увеличение количества посетителей – одна из приоритетных задач любого Web-сайта. Расширить аудиторию за счет иностранных клиентов позволяет перевод Web-страниц на другой язык. Для некоторых сайтов, которые ориентированы на многоязычных пользователей, перевод текстов на иностранные языки становится насущной необходимостью. Однако поддержание таких страниц сопряжено со значительными затратами на оплату услуг переводчиков и редакторов. Наибольшую трудность в этом случае представляет обновление регулярно меняющейся информации – новостей, пресс-релизов, описаний и т. д. Решить указанную проблему отчасти позволяет использование онлайнового машинного перевода. Компания ПРОМТ (http://www.promt.ru/ (http://www.promt.ru/)), ведущий разработчик технологий машинного перевода и лингвистического программного обеспечения, предлагает подобный сервис. С его помощью любой владелец Web-сайта может обеспечить онлайновый перевод своих страниц с русского языка на английский, немецкий, французский и испанский. Установив специальную форму для выбора языка перевода, один из вариантов которой показан на рис. 1.1, владелец Web-ресурса дает возможность своим посетителям открыть любую страницу сайта на том языке, который они предпочтут. Сервис бесплатный; он реализован на основе сервера онлайнового перевода компании ПРОМТ (http://www.translate.ru/ (http://www.translate.ru/)). Рис. 1.1. Одна из форм для выбора языка перевода Чтобы воспользоваться данной услугой, необходимо зайти на страницу http://www.translate.ru/webmaster.asp (http://www.translate.ru/webmaster.asp), получить HTML-код и установить его на страницы своего сайта. Анонсирование в поисковых системах По содержанию Internet представляет собой кладезь информации, а по способу ее организации – огромную свалку. Но, к счастью, положение не столь безнадежно – найти необходимую информацию помогают каталоги и поисковые машины. Работа поисковых систем, к которым часто и при этом ошибочно относят и каталоги, полностью автоматизирована и ведется по следующей схеме: сканирование ресурсов с помощью программы-робота, формирование индексной базы данных и, наконец, обслуживание запросов по ключевым словам. Как бы ни были популярны каталоги, должно быть понятно, что реальную доступность информации в Internet во всем ее объеме могут обеспечить только автоматические индексы. Каким же поисковым машинам отдают предпочтение пользователи? По различным электронным опросам на тему «Какими поисковыми системами Вы пользуетесь?» в России распределение результатов примерно таково: • Яndex – 47 %; • Rambler – 21 %; • Апорт – 10 %; • Google – 6 %; • Altavista – 5 %; • Mail.Ru – 4 %; • Yahoo! – 4 %. Каким же образом пользуются поисковыми машинами для популяризации сайта? До сорока процентов посетителей переходят к нужным ресурсам по ссылкам из поисковых систем. Поэтому правильное индексирование в них сайта, то есть соответствие его содержания запросу, должно быть предметом особой заботы. Как происходит индексирование? Либо робот поисковой машины добирается до вашего сайта по ссылкам, либо вы сами отмечаете его на странице регистрации, которая существует в любой поисковой системе. В первом случае процесс индексирования может затянуться, во втором вам потребуется затратить свое время. Для правильной индексации сайта требуется учесть следующее: • страницы сайта должны быть текстовыми. Текст на графических изображениях поисковые машины не распознают. Правда, текст в атрибуте ALT тэга IMG обычно индексируется; • в каждом документе сайта обязательно должны присутствовать вразумительный заголовок (тэг TITLE), ключевые слова (метатэг NAME="keywords") и краткое описание (метатэг NAME="description"); • следует подготовить файл robots.txt, а также ввести в документы метатэг NAME="robots"; • желательно регистрировать сайт в каждой интересующей вас поисковой машине вручную и в дальнейшем контролировать его индексирование. После регистрации сайта в различных поисковых системах следует добиваться того, чтобы ссылка на него при поиске входила хотя бы в первый десяток (а лучше, если в этом десятке будет несколько ссылок на ваши документы). Информационно-поисковые системы Каталог – это, как правило, база данных, в которой хранятся адрес ресурса и его описание. Описание ресурса делается либо составителями каталога (как, например, на Yahoo!), либо тем, кто хочет включить его в каталог. В поисковой системе все происходит иначе. Поисковые машины – это полностью автоматизированные системы, сканирующие сеть Internet. Ее сетевой агент (робот, «паук», «червяк») обходит все заданные ему серверы и собирает у себя индекс, то есть информацию о том, что и на какой странице было найдено. Сетевые агенты – это, по сути, программы, которые исследуют структуру гипертекста в Internet. Переходя от одного документа к другому, роботы передают собранную информацию поисковой системе, которая заносит ее в свою базу данных. Основными функциями поисковых систем являются следующие: • сбор статистики. Первые роботы были созданы именно для этого и определяли число страниц на сервере, типы присутствующих на нем файлов, их соотношения, средний размер страницы и т. д.; • обслуживание. Имеются в виду такие функции, как сбор информации о неисправных ссылках и обновленных документах, проверка ссылок сайтов, авторы которые самостоятельно подали регистрационную заявку, и др.; • поиск новых ресурсов. Необязательно регистрировать сайт собственноручно – это может сделать робот, поскольку он постоянно ищет новые ресурсы. Однако может уйти много времени. Полнотекстовые поисковые машины индексируют все слова, найденные на Web-странице, за исключением стоп-слов (обычно малоинформативных и имеющих незначительную частоту употребления, например, союзов и предлогов). Каждый день поисковые системы «прочесывают» Web-сайты и сохраняют текстовую информацию в своих огромных каталогах, чтобы завсегдатаи Internet могли по ключевым словам получить список Web-страниц. Как правило, в результате находятся сотни соответствующих запросу ресурсов, но отображаются они на экране «порциями» по 10–25 записей. В первую очередь выведены наиболее подходящие, согласно оценке поисковой системы, страницы. В связи с этим становится понятным нарастание интереса разработчиков Web-узлов к поисковым службам, которые оказываются в состоянии обеспечить до 40 %, а в некоторых случаях, и до 70 % обращений к сайту. Использование поисковых систем для продвижения Web-узла не может гарантировать успеха, если разработчик не учел целый ряд тонкостей этой процедуры. Так, далеко не всегда очевидно, какие из поисковых систем наиболее значимы для увеличения посещаемости. Исчерпывающий ответ на этот вопрос может дать только анализ статистики посещений узла после регистрации. Кроме того, чтобы обеспечить практическую, а не только теоретическую доступность своего сайта из списка отклика по тому или иному запросу, необходимо учитывать особенности функционирования отдельных сервисов. Поиск информации в русскоязычной части Internet облегчает существование специальных поисковых средств. Принцип их действия аналогичен работе традиционных баз данных, когда в ответ на ввод ключевого слова выдается перечень документов, содержащих искомое понятие. Эти системы являются, по сути, базами таких слов, пополняемыми при периодическом сканировании содержимого серверов Internet. С помощью специальных программ-роботов поисковые системы регулярно обследуют Internet, фиксируя, как вновь появившиеся, так и обновленные ресурсы, и удаляя сведения о ресурсах, вышедших из употребления. Этот колоссальный материал с указанием ссылок на то, где хранится каждое слово, содержится в виде гигантских индексных файлов, к которым и обращаются поисковые системы при конкретном запросе. Достоинства и недостатки поисковых машин определяются различными характеристиками. Принципиальным является то, насколько полно система обследует документы: все ли слова заносятся в индексные файлы или же только термины из названий, заголовков, первых нескольких строк или страниц текста, и т. д. Важна также периодичность обновления данных и критерии оценки понятий при определении степени их соответствия запросу. Не последнюю роль играют простота и удобство интерфейса, возможность использовать булевы операторы (операторы математической логики) и операторы расстояния между словами в тексте документа, а также дополнительные сервисные функции, например, поиск новостей, музыкальных файлов, товаров, и т. д. В обслуживание, осуществляемое информационно-поисковой системой, входит предварительная обработка текста, в том числе составление индекса, по которому затем происходит поиск. Такая поисковая система может быть организована как база данных с текстовыми полями. Другой вариант организации – работа с внешними текстами. В этом случае тексты сохраняют первоначальный вид, то есть остаются файлами в файловой системе, страницами на сервере или полями какой-то другой базы данных, а индекс снабжается лишь ссылками на соответствующие источники. Работа с поисковыми средствами требует от пользователя определенного опыта и навыков. Индекс поисковой системы Простейший способ организации индекса для поисковой системы таков: по определенным правилам (используя пробелы, знаки препинания) выделяется и хранится некоторая последовательность из букв и цифр. При этом в качестве адресной информации можно применять путь и имя файла, адрес Web-страницы. По такой схеме действуют разработчики многих поисковых систем, например, одной из самых известных в Интернет – AltaVista компании Dec. Недостатки указанного способа очевидны при использовании любых языков, в которых слова имеют словоформы, то есть изменяются по числам, родам, падежам, временам и др. Пользователь, начиная поиск, вынужден либо вспоминать, как точно выглядела искомая лексическая единица, либо добросовестно склонять и спрягать слова, чтобы получить полную парадигму. Частичное решение проблемы – применение шаблонов, например, символа * (астериск) в конце слова. Такой шаблон неплохо подходит для английского языка, где большинство словоформ образуется за счет добавления окончаний – s, – ed и – ing; впрочем, но эта уловка полностью не спасает от «мусора» в результате поиска. С русским языком все обстоит гораздо сложнее. Найти с помощью шаблона многие слова невозможно в принципе, а именно: • слова, у которых в разных формах меняется основа: идти – шел, плохо – хуже, он – его, человек – люди, ребенок – дети; • слова с большим количеством словоформ. Привести список всех словоформ русского глагола (с причастиями и деепричастиями – до 250 различных форм) человеку, у которого нет лингвистического образования, очень трудно. Понять, все ли словоформы из этого списка охватываются шаблоном * – еще труднее; • слова с беглыми гласными и чередованиями (искать – ищу, окно – окон, расти – рос); • короткие слова (из трех-четырех букв): дом, хор и т. п. Во всех языках, в том числе и в русском, существует общая закономерность: чем короче слово, тем чаще оно используется. Применение шаблона * для поиска такой лексики приводит к большому количеству ненужных ссылок в списке найденных документов. Существует два противоположных подхода к реализации поиска. Первый – «демократический», при котором поиск должен быть настолько прост, чтобы любой неподготовленный человек мог, не испытывая затруднений, сформулировать вопрос и вскоре получить на него приемлемый ответ. Второй – «элитарный», при котором поиск является тонким инструментом, требующим квалифицированного обращения. Оба подхода справедливы, чем и обусловлено наличие у всех крупных поисковых машин в Internet двух поисковых страниц – для обычного и расширенного поиска. Полнотекстовый поиск Когда говорят о полнотекстовом поиске, имеют в виду поиск по всем текстовым полям документа. Под текстом подразумевается набор слов (выделенная по некоторым правилам последовательность букв), чисел и меток (комбинации букв и цифр или букв разных алфавитов). Текстовый документ, как правило, имеет внутреннюю структуру – деление на параграфы, отступ для заголовка, подписи, таблицы. Текстовые редакторы позволяют делать эту структуру достаточно сложной: разбивать текст на колонки, выравнивать его, создавать списки и т. д. Часто структуру документа при отсутствии жесткой регламентации определяет внутренняя логика. Так, вверху делового письма обычно стоят реквизиты адресата, внизу – подпись и число. Несколько иначе дело обстоит с бланками – в них поля заданы строго. Язык HTML, принятый в Internet как стандарт, помимо разметки информации, предусматривает разметку внутренней структуры: заголовка, тела документа, ключевых слов. В задачу полнотекстового поиска наряду с дешифровкой разных форматов (это могут быть текстовые поля баз данных, файлы стандартных форматов – TXT, DOC, HTML, RTF, XLS) входит понимание внутренней структуры текста. В идеальном случае поисковая система должна подчиняться настройке на определенные текстовые структуры. Эта настройка может производиться как формальным описанием данных, так и самообучением системы с обратной связью. Учет морфологии Системы, разработанные с учетом морфологии языка, способны дифференцировать слова по формам и выполнять анализ с использованием всего спектра словоизменений. По способу образования словоформ русский язык – флективный, то есть в нем существуют флексии (от лат. flexio – сгибание), или окончания, выражающие грамматическое значение при словоизменении (склонении, спряжении). Русский язык относится также к классу синтетических языков: в слове объединено и лексическое, и грамматическое значение. Слово во всей совокупности его лексических значений называется лексемой (от греч. lexis – слово, выражение). Лексема – это единица лексического уровня языка; система словоформ, относящихся к одной лексеме, называется ее парадигмой. Другими словами, парадигма слова – это образец типа склонения или спряжения, совокупность всех словоформ, полученных при изменении слова по числам, падежам, родам и временам. Наиболее сложную парадигму в русском языке имеют глаголы. У неизменяемых слов лексема и словоформа совпадают. В словарях каждая лексема представлена одной из словоформ, которая называется словарной или исходной. В русском языке словарными формами являются следующие: • для существительных – именительный падеж единственного числа; • для прилагательных – именительный падеж единственного числа мужского рода; • для глаголов, причастий и деепричастий – глагол в инфинитиве. Все современные поисковые системы, работающие с учетом морфологии русского языка, базируются на «Грамматическом словаре русского языка», составленном А. А. Зализняком. Основное назначение этого словаря – отразить русское словоизменение, то есть для каждого входящего в словарь слова дать сведения о том, изменяемо ли оно, а если да, то как именно это слово склоняется или спрягается. В ранней редакции этот словарь был назван «Обратный словарь русского языка», так как в нем принят не обычный алфавитный порядок расположения слов, а инверсионный (от конца слова к началу). Это обусловлено тем, что одинаковый или похожий тип словоизменения в русском языке имеют слова со сходным концом, а не со сходным началом. Таким образом, при инверсионном алфавитном расположении слова с одинаковым или сходным типом словоизменения обычно оказываются рядом и образуют большие массивы. Работы по формальному описанию естественного языка тесно связаны с идеями автоматического перевода, появление которых относится к 30-м годам XX века. Первые эксперименты в этой области начались в 1954 году в Джорджтаунском университете (США). До сих пор все существующие автоматические переводчики, как отечественные, так и зарубежные, хотя и умеют делать более-менее грубый подстрочник, даже близко не подошли к уровню профессионального художественного перевода. Важная часть морфологической обработки – выделение основы слова. Основой называется часть, которая остается после отсечения окончания слова и с которой связано его лексическое значение. Одна из сложностей формального анализа русского языка – наличие в нем омонимов. Омонимы (от греч. homуs – одинаковый и уnyma – имя) – разные по значению, но одинаково звучащие и пишущиеся слова, например: «рысь» – способ бега и «рысь» – животное. С точки зрения автоматического разбора особенно сложны не полные омонимы (поскольку они имеют одинаковую словоизменительную схему), а омоформы. Это разные слова, часто являющиеся и разными частями речи, но совпадающие по звучанию в отдельных формах, например: существительное «печь» (печи, печью) и глагол «печь» (пеку, печешь); существительное «раздел» (раздел книги) и глагол «раздел» (раздел донага). Очевидно, что определение семантики в таких случаях можно произвести только по контексту. Упомянутый выше словарь А. А. Зализняка включает 90 000 слов. Однако в русском языке их больше, кроме того, постоянно появляются новые. Некоторые системы, работающие с учетом морфологии русского языка (например, Яndex), умеют обрабатывать эти слова, используя описанные в словаре Зализняка словообразовательные типы. Результат обработки будет тем лучше, чем больше новое слово похоже на обычные слова языка. Релевантность Релевантность – это мера соответствия получаемого результата желаемому, или, в терминах поисковых систем, соответствие ответа запросу. Релевантность можно представить как способ сортировки найденных по запросу документов. Каждая поисковая машина имеет свой алгоритм сортировки результатов поиска. Чем больше документ соответствует запросу, тем выше он должен находиться в списке отклика. Для достижения хорошего результата обычно учитывают следующие параметры: количество найденных слов, «контрастность» слова (относительную частоту его использования в данном документе), расстояние между словами, положение слова в документе и в его зонах. Насколько ответ поисковой системы удовлетворяет интересы пользователя, зависит не только от ее свойств, но и от того, насколько удачно сформулирован запрос. Практика показывает, что люди не любят читать справочную информацию и пользоваться операторами языка запросов. Для большинства пользователей Internet более естественно задавать вопрос прямо, как при обычном общении. Поэтому в современных поисковых машинах реализуется естественно-языковый запрос, при котором читатель определяет примерную область своих интересов. Кроме того, применяются функции «Искать в найденном» и «Найти похожие документы», назначение которых понятно из их названий. Методы регистрации Регистрация узла в поисковых системах Internet – процедура, трудоемкость которой зависит от поставленной задачи и используемых инструментов. Неплохо с самого начала разработки Web-сайта определиться с двумя его важными компонентами: доменным именем и структурой. Смысловая нагрузка на доменное имя сервера, будь то название компании, продукта или профиля деятельности, весьма велика, а его изменение бывает равносильно смерти узла. Использование одного-двух ключевых терминов, фигурирующих в доменном имени, для многих становится самым быстрым способом локализовать искомый ресурс. Этому способствует и то, что все больше поисковых систем поддерживают поиск по URL-адресу сайта. Как известно, наиболее значительная функция поисковых систем – продвижение крупных информационных сайтов с десятками и сотнями документов. При создании узла такого типа следует заранее убедиться в том, что в дальнейшем не придется менять его структуру. Изменение системы навигации на узле, имен файлов и каталогов, их перемещение нередко перечеркивает все предыдущие усилия по регистрации ресурсов. Если становление узла или его реконструкция еще не завершены, стоит не только подождать с его «пропиской» в поисковых сервисах, но и предотвратить преждевременную регистрацию, которая может быть выполнена программой-роботом автоматически. После того как принято решение о начале регистрации, необходимо определиться с планом ее проведения. Выбор здесь оказывается достаточно широким. Прежде всего, сами поисковые службы могут различаться по типу функционирования, организации и профилю, иметь разный уровень доступности для ваших потенциальных клиентов и читателей. Желание зарегистрировать сайт везде, где можно, пропадает по мере осознания трудоемкости и низкой эффективности такого подхода. Впрочем, нельзя отрицать, что он дает свои результаты, особенно если параллельно идет «раскрутка» узла альтернативными средствами – баннерной рекламой, рассылкой, публикациями в прессе и др. Максимально широкий охват поисковых систем обычно целесообразен при первоначальной, а также разовой, не предполагающей дальнейшего сопровождения регистрации. Если владельца сайта интересует не столько высокое положение в рейтингах поисковых систем, сколько посещаемость, целесообразно создавать побольше так называемых входных страниц, направляющих посетителей на нужный сайт, и регистрировать именно их. За вопросом «где регистрировать ресурс?» кроется проблема выбора между поисковыми машинами, то есть автоматическими индексами, и каталогами, русскими сервисами и зарубежными, службами общего назначения и специализированными системами. Наконец, важно определиться: если регистрировать ресурс не везде, то где именно. Решающим фактором, конечно, является то, в какой степени интересующая вас аудитория готова к использованию поисковых служб, выбранных вами, – как в профессиональном, так и в географическом отношении. Роботы поисковых машин сканируют Web-страницы, фиксируя гипертекстовые связи, ведущие за пределы стартового документа. Ресурсы, на которые указывают гиперссылки, включаются в план ближайшего ознакомления и служат источником пополнения индекса. Таким образом, наличия хотя бы одной ссылки на страницу вашего сайта достаточно для начала его сканирования роботом даже без вашего желания. При этом сроки появления ресурсов узла в индексных базах данных растянуты и неопределенны. Если вы сами оставляете заявку на индексирование, что аналогично регистрации в каталогах – и даже проще, – то сроки в большей степени фиксированы и существенно сокращаются. После регистрации Web-узла его страницы начинают появляться в списке отклика поисковой машины на запрос из ключевых слов, введенных пользователем. Если ваш сайт не попадает в первые 10–50 пунктов списка, вероятность того, что до странички доберутся посетители, невелика. Стремление занять высокое положение в рейтингах поисковых систем и становится причиной конкурентной борьбы Web-сайтов и сопровождающего ее ажиотажа. Допустим, мы ввели в шаблон одной из поисковых машин запрос, состоящий из двух терминов. Алгоритм поисковой программы присвоит более высокий ранг тому документу, в котором эти термины используются следующим образом: • включены в заголовок Web-страницы; • содержатся в заголовках различного уровня в документе; • расположены близко к началу документа; • часто употребляются; • расположены в тексте поблизости друг от друга. Таковы критерии ранжирования. Какой документ окажется в списке отклика выше: тот, что содержит ключевое слово в заголовке, или тот, в котором оно встречается сто раз, но в поле обычного текста? От ответа на этот вопрос может напрямую зависеть число обращений на ваш узел через поисковую систему. Если добавить к этому, что правила игры, по которым работают поисковые машины, меняются постоянно и без широкого уведомления пользователей, то появление в Internet нового круга специалистов и направлений бизнеса – Search Engine Promotion (Продвижение в поисковых системах) и Search Engine Optimization, SEO (Оптимизация для поисковых систем) – кажется в порядке вещей. Речь идет о поиске, при котором используются специальные методы и средства воздействия на работу автоматического индекса с целью получения высокого места в списке отклика по ключевым словам, наиболее ярко отражающим профиль узла. Успех применения таких методов базируется на знании принципов регистрации и использовании специального программного обеспечения. Постоянный мониторинг реальных запросов к поисковым системам позволяет отбирать именно те слова и словосочетания, которые привлекут внимание необходимого количества пользователей. Подготовка к регистрации Информация, которую запрашивают каталоги и поисковые системы при регистрации ресурса, практически одинакова. При этом поисковые машины обычно (хотя и не всегда) учитывают совсем немногое. Посмотрите на регистрационные формы, предлагаемые для заполнения, например, поисковыми системами Яndex и Апорт. Форма для регистрации поисковой системы Яndex, показанная на рис. 1.2, требует заполнения лишь одного поля: адреса ресурса. Рис. 1.2. Форма для регистрации сайта в поисковой системе Яndex Регистрация в поисковой машине Апорт намного сложнее и выполняется поэтапно. Если заявка, заполняемая на первом этапе, весьма проста (она представлена на рис. 1.3), то в дальнейшем предлагается заполнить довольно объемную форму (рис. 1.4), указать рубрику (рис. 1.5) и т. д. Рис. 1.3. Форма первого этапа регистрации сайта в поисковой системе Апорт Рис. 1.4. Форма второго этапа регистрации сайта в поисковой системе Апорт Рис. 1.5. Форма третьего этапа регистрации сайта в поисковой системе Апорт Вводить каждый раз при регистрации ресурса всю информацию – занятие достаточно долгое и утомительное. Ускорить процесс можно, если заранее составить краткий паспорт сайта, который может включать следующие сведения: • название сайта; • URL-адрес; • описание сайта; • ключевые слова; • контактное лицо; • электронный адрес регистратора. Если имеются версии сайта на других языках, необходимо составить подобный паспорт для каждой из них. Благодаря приведенной схеме можно заполнять поля в формах, используя обычные операции копирования и вставки, что значительно ускоряет работу. Итак, остается лишь взять список поисковых систем и приступить к регистрации. После выбора конкретной поисковой системы найдите в ней ссылку типа Добавить сайт, или Предложить ресурс, или Add URL. Отметим, что подчас приходится проявить недюжинную смекалку, чтобы отыскать такую надпись в некоторых каталогах и поисковых системах. Ну, а далее все просто – следуйте появляющимся на экране инструкциям, которые в разных системах немного отличаются друг от друга. Адреса регистрационных форм Яndexhttp://www.yandex.ru/addurl.html (http://www.yandex.ru/addurl.html) Апортhttp://www.aport.ru/addurl.php (http://www.aport.ru/addurl.php) Ramblerhttp://www.rambler.ru/doc/add_site.shtml (http://www.rambler.ru/doc/add_site.shtml) Поиск@Mail.ruhttp://poisk.mail.ru/cgi-bin/add_url.cgi (http://poisk.mail.ru/cgi-bin/add_url.cgi) UAporthttp://uaport.net/cgi-bin/add_new (http://uaport.net/cgi-bin/add_new) Sesnahttp://uazone.net/go/addurl.cgi (http://uazone.net/go/addurl.cgi) METAhttp://meta-ukraine.com/pages/addurl.asp (http://meta-ukraine.com/pages/addurl.asp) Uniartshttp://www.armenian.com/links.html (http://www.armenian.com/links.html) www.KYRGYZSTAN.kghttp://search.kyrgyzstan.kg/cgi-bin/search/add.cgi (http://search.kyrgyzstan.kg/cgi-bin/search/add.cgi) DELFI (Латвия)http://rus.delfi.lv/directory/index.php?add=1 (http://rus.delfi.lv/directory/index.php?add=1) DELFI (Эстония)http://rus.delfi.ee/directory/index.php?add=1 (http://rus.delfi.ee/directory/index.php?add=1) AltaVistahttp://www.altavista.com/addurl/default (http://www.altavista.com/addurl/default) Excitehttps://secure.ah-ha.com/guaranteed_inclusion/teaser.aspx (https://secure.ah-ha.com/guaranteed_inclusion/teaser.aspx) HotBothttp://insite.lycos.com/ (http://insite.lycos.com/) Lycoshttp://insite.lycos.com/ (http://insite.lycos.com/) Googlehttp://www.google.com/addurl.html (http://www.google.com/addurl.html) Если после регистрации вы не увидели свой сайт в поисковой системе, не удивляйтесь. Из-за большой перегруженности робота поисковой машины ваш сайт может стоять в очереди от одного дня до двух недель. В дальнейшем робот будет самостоятельно (автоматически) находить новые и измененные документы. И чем чаще будет меняться страница, тем чаще робот будет на нее заходить. Особенности регистрации в поисковой системе Яndex В поисковой машине Яndex допускается регистрация только русскоязычных сайтов. Для добавления ресурса введите адрес его главной страницы в форму Яndex: Добавить сайт (http://www.yandex.ru/addurl.html (http://www.yandex.ru/addurl.html)) – остальные страницы Яndex найдет самостоятельно по ссылкам. Робот работает со стандартными ссылками языка HTML (HREF, LINK и FRAME), то есть так, как работал бы пользователь с отключенной в браузере поддержкой Java и JavaScript. Если ссылки на страницы вашего сайта сделаны с помощью скриптов, надо добавить адреса этих страниц через форму Яndex: Добавить сайт. Запрещения на индексацию отслеживаются системой Яndex обычным образом – через файл robots.txt, находящийся в корневом каталоге сервера. Яndex контролирует намеренное злоупотребление ключевыми словами в заголовках, комментариях и тексте самого документа и при обнаружении подобных фактов снижает место документа на странице результатов. В случаях злостного использования таких приемов администрация Яndex может исключить документы и сайты из базы. Страницы со временем перенаправления на другие страницы, равным нулю, не подлежат индексированию. Индексация одних и тех же документов, выдаваемых Web-серверами в разных кодировках, лишена особого смысла. При этом русские поисковые системы держат в базах документы только в одной из кодировок, другие рекомендуется исключать из индексирования. Если кодировки распределяются по портам сервером, на разных портах (серверах) следует выдавать разный robots.txt. Это значит, что во всех портах/серверах, кроме основного, должно быть написано: disallow: / Если кодировки выдаются, например, по директориям, необходимо сделать один файл robots.txt следующего содержания: disallow: /alt disallow: /mac disallow: /koi В уникальные заголовки документов, вкратце описывающие сайт и текущий документ, не следует включать более 20–25 слов. Слова в заголовках имеют больший вес, чем остальные. Система учитывает описания и ключевые выражения, указанные в соответствующих метатэгах, а также подписи к картинкам в тэге ALT. Яndex работает только с текстами и не умеет распознавать графические изображения. Поэтому, если название выполнено средствами графики, стоит продублировать его в текстовом виде. Чем длиннее документ, тем менее заметны в нем слова, заданные в запросе, и, следовательно, тем ниже будет находиться ваша страница в результатах поиска при прочих равных условиях. Поэтому старайтесь разбивать длинные документы на более короткие – это правило важно для любых поисковых систем. При оформлении документов надо придерживаться следующих требований: • не следует набирать слова в р а з р я д к у – система не воспримет их; • без особой необходимости не стоит набирать слова ПРОПИСНЫМИ буквами, если только это не аббревиатура; • точки и запятые не отделяются от слова пробелом, иначе Яndex определит их как отдельные слова. После них пробел ставится. Проверять, проиндексирован ли ресурс, нужно не сразу, а через несколько дней после его добавления в базу Яndex. Обычно страницы появляются в поисковой базе в течение недели после их создания или изменения. Новые страницы, внесенные в базу самостоятельно с помощью механизма добавления ресурса, появятся быстрее. Если Вы не находите свою страницу, проверьте с помощью формы Яndex: Добавить сайт, включена ли она в базу Яndex; другими словами, попробуйте добавить ее еще раз. Если вы получите сообщение «Ваш URL … был только что внесен в нашу базу данных», это значит, что адрес вашего ресурса системе ранее не был известен. Теперь он добавлен и в ближайшее время будет проиндексирован. Если поступило сообщение «Ваш URL … уже известен роботу Яndex. Данный ресурс будет проиндексирован в ближайшее время», подождите еще пару дней. Сообщение «Ваш URL … уже проиндексирован. Вы можете посмотреть, какие страницы Вашего сайта проиндексированы в Яndex.Ru к настоящему времени» означает, что по имеющейся здесь же ссылке вы можете перейти ко всему списку документов вашего ресурса, проиндексированных в поисковой машине Яndex. В дальнейшем робот будет самостоятельно (автоматически) находить новые и измененные документы. Причем частота обхода конкретного сервера зависит от зафиксированной роботом частоты изменения его страниц. Особенности регистрации в поисковой системе Апорт Пополнение базы ресурсов Апорта происходит двумя путями. Во-первых, при индексировании новых страниц проверяются все имеющиеся там ссылки; те, которые отвечают определенным требованиям, добавляются в базу ресурсов. В основном, конечно же, проверяется принадлежность к России и странам ближнего зарубежья. Ресурсы других доменов могут быть добавлены только вручную. Во-вторых, любой пользователь может добавить ресурс вручную на странице, которая доступна по ссылке Добавить URL (http://www.aport.ru/addurl.php (http://www.aport.ru/addurl.php)) почти с любой страницы Апорта. При указании ресурса вручную проверяется его наличие и корректность. Сразу после нажатия кнопки Добавить Апорт пытается получить корневую страницу ресурса и определяет, является ли страница русскоязычной. При этом простого использования кириллицы недостаточно: Апорт ищет закрепленные в языке русские слова. Если оба условия выполнены, то ресурс добавляется в базу и будет проиндексирован. Прибегать к помощи страницы Добавить URL следует, если добавляемый ресурс – это сервер и есть вероятность, что он еще не известен Апорту, или если новый ресурс – это часть сервера и вы предполагаете, что на него нет ссылок с других страниц сервера. Особенности регистрации в поисковой системе Rambler Регистрационная анкета в поисковой системе Rambler находится по адресу http://www.rambler.ru/doc/add_site.shtml (http://www.rambler.ru/doc/add_site.shtml). Ее заполнение гарантирует, что, по крайней мере, эта анкета будет найдена при соответствующем поиске, и по ссылке с нее пользователь сможет попасть на ваш сайт. Рекомендуется также воспользоваться регистрацией в случае, если ваши страницы располагаются на зарубежных сайтах. Роботы сканируют ресурсы, находящиеся в странах ближнего зарубежья, и игнорируют остальные иностранные сайты. Если ваш сайт находится за рубежом, но существенная его часть содержит русскоязычные материалы, или если он расположен в пределах ближнего зарубежья, но входит в иные домены первого уровня (.com, .org, .net и пр.), вы можете отослать письмо с просьбой включить сайт в число сканируемых. Сотрудники Rambler рассмотрят ее и примут решение о целесообразности такого включения. Что не надо делать при регистрации Не надо регистрировать ваш сайт в одной и той же поисковой системе слишком часто. Излишняя активность чревата не только отказом в очередной регистрации, но и удалением всех имеющихся в базе данных сведений о вашем ресурсе. Вводите только те ключевые слова, которые соответствуют вашему сайту, и не используйте заведомо чужеродных. Как управлять индексированием На сегодняшний день разработчик Web-узла располагает скромным арсеналом технических средств, которые позволяют управлять роботами поисковых машин, занятых индексированием. Основных способов всего два: размещение файла со специальным именем robots.txt в корневом каталоге сервера и применение мета-тэгов в секции HEAD отдельного документа. Оба метода рассматривались выше. Еще раз подчеркнем, так как это очень важно, что метатэги, по возможности уникальные, следует применять в каждом документе. Существует ряд простых правил, которых стоит придерживаться, если вы хотите, чтобы поисковые системы находили ваш ресурс. На входных страницах сайта обязательно должен быть текст. Если вся информация представлена в виде графических файлов, весьма велика вероятность того, что ни одна поисковая система не найдет сайт. Правда, большинство поисковых машин индексирует текст, содержащийся в тэге ALT и в метатэгах, а также текст комментариев (), но не надо забывать о системах, которые этого не делают. При этом намеренное злоупотребление ключевыми словами в заголовках, комментариях и тексте самого документа может быть расценено поисковой системой как попытка регистрации ресурса с несоответствующим содержанием. В качестве защитной меры система попросту не станет индексировать ваши страницы. Кроме того, довольно трудно применить выбранное ключевое слово многократно в самом документе, не превратив его в нечто громоздкое и неуклюжее. Очень важная часть страницы – заголовок, то есть ее титул, который расположен между тэгами и . Лучше сделать его информативным и внести в него ключевые слова. Возможно, имеет смысл использовать в заголовках, даже для полностью русскоязычных документов, английский язык. Оптимальная длина заголовка – не более 50 символов. Очевидно, что заголовок следующего содержания, размещенный на странице index.htm, является неинформативным для поиска: www.inotec.ru Целесообразнее заменить его, например, таким: Программы для бухгалтерского и складского учета Заметим кстати, что текст этого заголовка, гораздо более наглядный, чем предыдущий вариант, будет оставаться и в закладках посетителей. Многие поисковые системы для индексирования и построения списка ключевых слов используют первые по положению в документе 200–300 слов из текстов страниц Web-узла. Чем длиннее документ, тем менее заметны в нем слова, заданные в запросе, и, следовательно, тем ниже будет ваша страница в результатах поиска. Поэтому старайтесь разбивать длинные документы на несколько коротких. Индекс цитирования Изначально индекс цитирования (CI, Citation Index) – это принятый в научном мире «показатель значимости» трудов какого-либо ученого. Величина индекса определяется количеством ссылок на этот труд (или автора) в работах других ученых. Популярность сайта в Internet определяется числом ссылок на него. Таким образом, индекс цитирования здесь – это число внешних ссылок в сети Internet, которые ведут на сайт. Так, если 205 страниц с других доменов содержат ссылки на страницы вашего сайта, то ваш индекс цитирования – именно 205. В англоязычных источниках данному термину соответствуют названия Link popularity (Популярность ссылки), PageRank (Ранг страниц) – торговая марка Google. Применительно к WWW индекс цитирования – это показатель популярности Web-страницы или Web-сайта среди создателей аналогичных «творений», то есть среди «писателей». Этим он принципиально отличается от счетчиков и рейтингов посещений Web-страниц или Web-сайтов, являющихся, по сути, показателями популярности среди «читателей». Попутно отметим, что одна из проблем рейтингов – положительная обратная связь. Чем выше ресурс в рейтинге, тем больше посетителей обращаются к нему, и, соответственно, тем выше он поднимается в рейтинге. Идея, оправдывающая применение индекса цитирования, проста: как правило, люди, создающие свой сайт в Internet, со вниманием и ответственностью относятся к его содержанию, а также к содержанию того, на что они ссылаются, и что тем самым рекомендуют своим посетителям. Индекс цитирования не может быть увеличен ни за счет внутренних (с одних страниц ресурса на другие), ни за счет внешних ссылок, когда один и тот же ресурс имеет их несколько. Разработчики поисковой машины Яndex ввели показатель индекса цитирования в свой каталог ресурсов (http://yaca.yandex.ru/ (http://yaca.yandex.ru/)), что было призвано обеспечить авторитетность расположения ресурсов в рубриках этой поисковой системы. При определении величины индекса цитирования Яndex учитывает ссылки только с тех ресурсов, которые Яndex проиндексировал и которые содержатся в его поисковой базе, то есть только «русский» Internet. Это означает, что ссылки на русские ресурсы, например, из каталога Yahoo! не могут быть учтены при установке индекса цитирования Яndex. С другой стороны, этот показатель можно определить для всех ресурсов, на которые кто-либо ссылался с сайтов, просканированных поисковой машиной Яndex, даже если это произошло всего один раз. Поэтому для каталога Yahoo! индекс цитирования Яndex определить можно, несмотря на то, что Yahoo! не проиндексирован в Яndex. Кстати, он для каталога Yahoo! довольно высок (на 23 октября 2004 года – 6300), поскольку Yahoo! весьма популярен в русской части Internet. В индекс цитирования включаются все ресурсы, ссылки на которые Яndex нашел в русском Internet, при условии, что значение индекса цитирования для них не меньше 10. Чтобы выяснить число ссылок на сайт из русскоязычного сектора сети, можно воспользоваться также средствами, предоставляемыми ресурсом, расположенным по адресу http://www.registratura.ru/service/ (http://www.registratura.ru/service/). Форма, имеющаяся на странице по указанному адресу, представлена на рис. 1.6. Рис. 1.6. Форма для определения индекса цитирования В поле URL введите адрес ресурса. Отметьте системы, которые будут использованы для подсчета: Яndex, Апорт, Rambler, AltaVista или рейтинг Rambler Top 100. Список в поле Ссылки предназначен для настройки поиска следующим образом. Пункт Чужие используется для поиска ресурсов, ссылающихся на данный (возможно только в поисковой машине Яndex). Свои – для собственных страниц, ссылающихся на данный ресурс, Все – для поиска как собственных, так и чужих страниц. Индексы цитирования каждого ресурса в разных поисковых системах отличаются друг от друга, поскольку эти системы имеют неодинаковые базы данных. Величина Link popularity легко проверяется, например, с помощью сервиса Link Popularity Checker, расположенного по адресу http://www.webmaster-toolkit.com/link-popularity-checker.shtml (http://www.webmaster-toolkit.com/link-popularity-checker.shtml). Его страница показана на рис. 1.7. Рис. 1.7. Страница сервиса Link Popularity Check С помощью данного сервиса вы быстро узнаете Link popularity вашего сайта в пяти основных поисковых системах – Google, AltaVista, MSN, All the Web и Yahoo. В поле Your URL (Ваш URL-адрес) введите адрес проверяемого сайта и щелкните по кнопке Check Popularity (Проверить популярность). Результаты проверки будут представлены в таблице, изображенной на рис. 1.8. Здесь величина Link popularity указана в колонке Number of Links (Количество ссылок). Рис. 1.8. Таблица с результатами проверки В чем смысл увеличения числа ссылок на ваш сайт в Internet, то есть увеличения показателя Link popularity? Во-первых, чем больше ссылок на ваши страницы, тем больше посетителей вы можете ожидать на своем сайте. Переходы по ссылкам так же популярны, как и использование поисковых систем. Удачно расположенные ссылки на ваш сайт могут быть хорошими «генераторами» притока пользователей. Во-вторых, чем выше величина Link popularity, тем выше ранг ваших страниц в основных поисковых машинах, что, конечно же, обеспечит вам дополнительную клиентуру. В-третьих, чем больше ссылок на сайт, тем больше открывается входов на ваш ресурс для роботов поисковых систем. Поэтому ваши страницы чаще включаются в очередь на индексацию. Таким образом, можно рекомендовать следующую стратегию увеличения Link popularity: • количество ссылок на ваш сайт должно постоянно расти; • поскольку некоторые поисковые системы при определении рейтинга положительно оценивают ссылки с популярных сайтов, следует обеспечить их наличие; • необходимо чаще использовать ключевые слова, которым при определении ранга сайта поисковые системы отдают предпочтение. Возникает вопрос: чему соответствует величина Link popularity – числу ссылок на домен или на определенную страницу в домене? Есть основания утверждать, что скорее на первое, чем на второе, – хотя поисковые системы, кажется, делают исключение из этого правила для доменов, обеспечивающих так называемый бесплатный хостинг, то есть размещение сайтов в рекламных целях в бесчисленных подкаталогах своего сервера. Например, домен www.geocities.com (http://www.geocities.com/) имеет чрезвычайно высокую величину Link popularity. Однако наличие сайта в каталоге www.geocities.com/mywebsite/ (http://www.geocities.com/mywebsite/) не поможет извлечь из этого выгоду. Иначе вы видели бы в результатах поиска гораздо больше сайтов, расположенных на подобных серверах. Ведь известно, что в некоторых поисковых машинах при прочих равных условиях многие бесплатные сайты или сайты, совместно использующие одно доменное имя, ранжированы ниже ресурсов с уникальным доменным именем. Видимо, поисковые системы имеют список доменов, согласно которому следует либо полностью исключать Link popularity, либо игнорировать этот показатель для любого адреса, который включает подкаталог. Поэтому собственное доменное имя может дать определенные преимущества при поиске. Контроль наличия документов в индексе поисковых машин Регулярно проверять наличие документов в индексе поисковых машин необходимо хотя бы потому, что временами из них исчезают отдельные страницы. Обычно поисковые системы позволяют узнать, какие документы на данный момент находятся в индексе и сколько их. Вот как это делается. Поисковая система AltaVista Для проверки статуса URL следует набрать в строке запроса следующую строку: host: www.inotec.ru (http://www.inotec.ru/) В окно браузера будут выданы все проиндексированные страницы сайта. Таким образом, мы узнаем, есть ли в индексе AltaVista файлы указанного домена. Поисковая система Go.com В поисковой машине Go.com для проверки статуса URL используется следующая команда: site: abcnews.com Здесь указывается доменное имя сайта или часть имени. Поисковая система HotBot В поисковой машине HotBot статус URL проверяется по-другому. С помощью ссылки Advanced Search (Расширенный поиск) перейдите на соответствующую страницу. В ваш браузер загрузится форма, фрагмент которой показан на рис. 1.9. В поле запроса введите адрес (например, www.inotec.ru (http://www.inotec.ru/)) и, кроме того, наберите его же в поле Include (Включая) раздела Domain/Site (Домен/Сайт). Рис. 1.9. Фрагмент формы расширенного поиска поисковой системы HotBot Строки, аналогичные приведенным выше для других поисковых машин, также воспринимаются системой нормально: site: www.inotec.ru (http://www.inotec.ru/) А вот если в форме расширенного поиска в разделе Domain/Site поле Include оставить незаполненным, а в поле Exclude (Исключая) указать то же имя, что и в строке поиска, то в результате получим величину Link popularity со ссылками на сайты, указывающими на наш сайт. Поисковая система Lycos В поисковой машине Lycos статус URL проверяется со страницы расширенного поиска (http://search.lycos.com/adv.asp (http://search.lycos.com/adv.asp)), на которую можно перейти по ссылке Advanced Search (Расширенный поиск). В строке запроса введите адрес (например, www.inotec.ru (http://www.inotec.ru/)) и, кроме того, наберите его же в поле Only Include (Только включая) раздела URL/SITE (URL-адрес/Сайт). Если в форме расширенного поиска поле Only Include оставить незаполненным, а в поле Exclude (Исключая) указать то же имя, что и в строке поиска, то в результате получим величину Link popularity со ссылками на сайты, указывающими на наш сайт. Строки, аналогичные приведенным выше для других поисковых машин, также работают в Lycos: site: www.inotec.ru (http://www.inotec.ru/) Поисковая система Google В поисковой машине Google статус URL проверяется, как и в Lycos, со страницы расширенного поиска. В поле Домен введите адрес ресурса (например, www.inotec.ru (http://www.inotec.ru/)), а из раскрывающегося списка выберите Только. В строке запроса укажите тот же ресурс. Подобный поиск можно осуществить и с основной страницы системы. Для этого следует набрать запрос следующего вида: site: www.inotec.ru (http://www.inotec.ru/) Для поиска ссылающихся сайтов в форме расширенного поиска выберите из раскрывающегося списка вместо слова Только слово Не. Поисковая система Яndex В поисковой машине Яndex статус URL можно проверить двумя способами: 1. В поле запроса наберите строку вида #url="www.inotec.ru"; 2. Воспользуйтесь формой на странице Расширенный поиск и в разделе Страницы введите требуемый адрес в поле Находятся на сайте. Для поиска ссылающихся сайтов в форме расширенного поиска в разделе Страницы введите требуемый адрес в поле Содержат ссылку. Поисковая система Апорт Для проверки статуса URL в поисковой машине Апорт представлен специальный запрос следующего вида: url=www.inotec.ru/* Поисковая система Rambler Чтобы проверить статус URL в поисковой машине Rambler, в обычном поле запроса наберите строку типа $URL:www.inotec.ru (http://www.inotec.ru/). Поисковая система Поиск@Mail.ru В поисковой машине Поиск@MaiLRu статус URL можно проверить со страницы расширенного поиска. Для этого укажите в поле раздела Принадлежность к доменам то же доменное имя, что и в разделе Найти результаты. При этом в раскрывающемся списке первого раздела выберите значение Показать. Для поиска ссылающихся сайтов введите требуемый адрес в поле Ссылающиеся страницы раздела Поиск по странице. Регистрация в каталогах Каталог – это, как правило, база данных, в которой хранится ссылка на ресурс (адрес) и его описание. Обычно каталоги имеют иерархическую структуру, а их содержимое классифицировано по темам; при этом тексты – описания включенных в каталоги ресурсов – позволяют осуществлять их поиск. Классификацию выполняют либо авторы каталога, либо авторы ресурсов. Несмотря на то, что в первом случае этот процесс занимает определенное время, он гарантирует правильное размещение ссылки в соответствующем тематическом разделе, что не всегда происходит во втором случае, когда ответственность за точность рубрикации ложится на самого автора ресурса. Описание сайта также выполняется либо составителями каталога (как на Yahoo!), либо принимается от того, кто хочет включить ресурс в каталог (как на dmoz.org). Каталоги ресурсов представляют собой солидные собрания ссылок, организованных по определенному принципу. В отличие от поисковых систем каталоги заполняют информацией вручную. Это осуществляют составители или ведущие каталогов либо, если это предусмотрено, сами владельцы сайтов при заполнении ими специальных форм в соответствии со структурой каталога. Владелец сайта вводит данные в регистрационную форму, отсылает ее, а персонал, поддерживающий каталог, решает, в какую категорию внести ссылку на заявленный сайт. Вследствие такой технологии поиск в каталогах часто приводит к лучшим результатам, чем поиск с помощью автоматических поисковых систем. Каталоги традиционно предлагают удобный и понятный интерфейс для поиска ресурсов. Источником их пополнения может быть работа экспертов и самостоятельная регистрация пользователей. Приглашение к регистрации можно быстро найти на главной странице каталога по ссылкам типа Add URL, Добавить или аналогичным. В самом простом случае в предлагаемую форму требуется ввести URL-адрес главной страницы вашего сайта и дополнительные сведения (ключевые слова, краткую аннотацию и информацию для контактов с человеком, сопровождающим ресурс). В некоторых случаях материалы необходимо представить на двух языках: на английском и на языке региона, который имеет отношение к каталогу. Поскольку пополнение каталогов часто происходит не автоматически, а требует работы сотрудников, число записей здесь, как правило, уступает количеству ресурсов, проиндексированных поисковыми машинами. Несмотря на явный проигрыш в количестве записей, каталоги достаточно успешно конкурируют с поисковыми системами на информационном рынке. Причина их популярности не только в простоте эксплуатации. Так, небезызвестный каталог Yahoo! побил все рекорды по частоте цитирования в книжной литературе об Internet. Одна из причин такого успеха – четкая и достаточно стабильная классификационная схема, которая позволяет авторам ссылаться на существующие годами разделы (категории) каталога Yahoo!. Хотя регистрация в Yahoo! и предполагает длительную экспертизу со стороны сотрудников каталога, она не является гарантированной. Этот процесс уже оброс легендами, равно как и посредниками, предлагающими содействие в регистрации за круглые суммы. Пытаясь отыскать свою нишу в информационном пространстве, многие разработчики каталогов и поисковых систем делают ставку на специализацию своего сервиса в какой-нибудь области, например, в бизнесе. Регистрация сервера компании в таких профильных каталогах бывает крайне полезной, если речь идет о каком-то популярном сервисе. Как же искать нужные каталоги? Один из возможных способов таков: посмотрите, кто ссылается на узлы ваших конкурентов, и предложите им разместить ссылку на ваш сайт. При поиске деловых связей часто бывает целесообразной регистрация узла в соответствующем региональном каталоге. Эксперты таких служб обычно принимают заявки лишь от компаний, которые имеют представительства на данной территории. Тем не менее, в каждом конкретном случае возможны и обходные пути. Если ваш сайт имеет тематические разделы, есть смысл зарегистрировать их как отдельные ресурсы. В этом случае число посещений возрастет благодаря многократному размещению в каталоге ссылок на ресурс. В глобальном масштабе Сети любая специализированная система, конечно, уступает по популярности поисковым сервисам общего назначения, таким как автоматические индексы AltaVista, HotBot, каталог Yahoo!. Выяснить популярность каталога можно с помощью специальных запросов к поисковым системам. Как выяснить популярность каталога Число ссылок на каталог в индексе поисковых машин не дает правильного представления о его рейтинге. Определение индексов популярности, о которых говорилось в главе, посвященной поисковым машинам, точнее было бы охарактеризовать как определение популярности ресурса. Во многих поисковых системах можно посмотреть, какие именно источники ссылаются на каталог и сколько их. Вот как это делается. Оценка популярности в поисковой системе AltaVista Для того чтобы найти документы, ссылающиеся на некий URL-адрес, следует набрать в строке запроса одну из строк типа: link: www.inotec.ru (http://www.inotec.ru/) link: www.inotec.ru/promote/index.htm (http://www.inotec.ru/promote/index.htm) В первом случае в окне браузера будут представлены все источники, указывающие на сайт с именем www.inotec.ru (http://www.inotec.ru/). Во втором – мы найдем в индексе AltaVista источники, ссылающиеся на файл index.htm из каталога promote. Оценка популярности в поисковой системе Go.com В поисковой машине Go.com для оценки популярности ресурса используется следующее выражение: link: www.inotec.ru (http://www.inotec.ru/) Оценка популярности в поисковой системе Excite Так же просто, как в AltaVista или в Go.com, проверяется статус URL в поисковой машине Excite – достаточно набрать в поле запроса: link: www.yandex.ru (http://www.yandex.ru/) Оценка популярности в поисковой системе HotBot В поисковой машине HotBot популярность ресурса проверяется по-другому. Перейдите на страницу расширенного поиска. Введите адрес (например, www.inotec.ru (http://www.inotec.ru/)) в поле запроса и в поле Exclude раздела Domain/Site. Система исключит из результатов поиска внутренние ссылки сайта, оставив только ссылающиеся на него извне. Оценка популярности в поисковой системе Lycos В Lycos популярность ресурса проверяется со страницы расширенного поиска (http://search.lycos.com/adv.asp (http://search.lycos.com/adv.asp)), на которую следует перейти по ссылке Advanced Search (Расширенный поиск). На странице, которая будет загружена в браузер (см. рис. 1.10), в строке запроса введите адрес ресурса, на который вы ищете ссылки. В поле Only Include (Только включая) раздела URL/SITE (URL-адрес/Сайт) введите доменное имя узла или его часть, например: .ru, если хотите определить, имеются ли там ссылки на требуемый ресурс. Чтобы исключить какие-либо источники ссылок – обычно внутренние ссылки со своего сайта, – введите его доменное имя в поле Exclude (Исключая). Рис. 1.10. Страница поисковой машины Lycos для поиска источников ссылок Оценка популярности в поисковой системе Google В поисковой машине Google популярность ресурса проверяется, как и в Lycos, со страницы расширенного поиска. Эта страница представлена на рис. 1.11. Рис. 1.11. Страница расширенного поиска поисковой машины Google Для поиска документов со ссылками заполните поле Ссылки, расположенное в разделе Поиск по странице, и нажмите на кнопку Поиск рядом с указанным полем. Подобный поиск можно осуществить и с основной страницы системы. Для этого следует набрать запрос следующего вида: link: www.inotec.ru (http://www.inotec.ru/) Оценка популярности в поисковой системе Яndex В поисковой машине Яndex ссылки на ресурс можно найти двумя способами: 1. В поле запроса наберите строку типа #link="www.inotec.ru"; 2. Воспользуйтесь формой на странице Расширенный поиск. В последнем случае введите следующие данные в форму, фрагмент которой изображен на рис. 1.12: в разделе Страницы заполните поле Содержат ссылку. Рис. 1.12. Фрагмент формы расширенного поиска Яndex Кроме указанных возможностей, система Яndex, как отмечалось в главе, посвященной поисковым машинам, рассчитывает индекс цитирования, который служит определенным критерием популярности ресурса в русскоязычной части Internet. Для его определения зайдите на страницу по адресу http://yaca.yandex.ru/ (http://yaca.yandex.ru/). В окно браузера будет загружена заглавная страница каталога ресурсов с рассчитываемыми для каждого из них индексами цитирования. Чтобы найти нужный ресурс, в строке запроса наберите его адрес и щелкните по кнопке Найти. Если искомый ресурс представлен в каталоге, откроется страница с его описанием (рис. 1.13), где, в числе прочего, будет присутствовать строка Цитируемость, в которой и будет указана величина индекса цитирования. Рис. 1.13. Страница с описанием ресурса и указанием его индекса цитирования Оценка популярности в поисковой системе Rambler Чтобы найти ссылки на ресурс, в поисковой машине Rambler в поле запроса наберите строку типа $LINK:www.inotec.ru (http://www.inotec.ru/). Оценка популярности в поисковой системе Поиск@Mail.Ru В поисковой машине Поиск@Mail.Ru популярность ресурса можно проверить со страницы расширенного поиска. Для этого задайте в поле раздела Принадлежность к доменам то же доменное имя, что и в разделе Найти результаты. При этом в раскрывающемся списке первого из указанных разделов выберите значение Исключить. Кроме того, в разделе Упоминание поисковых слов выберите из списка значение в ссылках на данную страницу. Для поиска всех ссылающихся сайтов введите требуемый адрес в поле Ссылающиеся страницы раздела Поиск по странице. Баннерная реклама Баннер – это прямоугольный или квадратный блок, иногда текстовый, а чаще графический, одного из стандартных размеров. Наиболее распространенные из них – 468x60 (см. рис. 1.14), 100x100; реже встречаются 88x31, 120x60, 125x125, 400x40 пикселов и т. д (см. рис. 1.15). Баннер используется, как правило, в рекламно-информационных целях. Графический формат – JPG или GIF, в последнее время – иногда и PNG. Кроме того, как отдельное направление, применяются Flash-баннеры. Формат GIF, как и Flash-технология, позволяет создавать анимированные баннеры, то есть изображения с движущимися объектами. Используются текстовые баннеры (без графического изображения). Кроме того, существуют HTML-баннеры, а также баннеры, написанные с использованием языка Java. Рис. 1.14. Пример баннера формата 468x60 Рис. 1.15. Пример баннера другого формата Баннер служит ссылкой на сайт, который он рекламирует. Щелкнув по нему мышью, заинтересованный пользователь сразу же попадает на рекламируемый сайт. В этом, собственно, и состоит основная задача баннера. Один из способов привлечения посетителей к сайту – обмен баннерами с другими Web-серверами или регистрация в программах баннерного обмена (иногда называемых баннерными сетями). При этом происходит взаимовыгодный обмен: вы размещаете баннеры партнеров, а они – ваши. При регистрации в баннерной сети вы получаете специальный код, который, будучи встроен в ваши страницы, позволяет показывать баннеры сети на вашем сайте. В свою очередь, баннерная сеть обязуется показывать ваши баннеры на сайтах своих партнеров, оставляя себе «комиссионные». Например, показу у вас на сайте 100 сетевых баннеров будет соответствовать показ на других сайтах от 50 до 90 ваших. Процент комиссионных зависит от службы регистрации и ряда условий, например, количества показов. Наиболее распространенное значение комиссионных – 10 %. При размещении баннеров следует учитывать, что многократный показ одного баннера постоянному пользователю не ведет к увеличению отклика. Каждый баннер имеет «срок жизни», после которого он устаревает, и дальнейшая его демонстрация становится неэффективной. Результативность показов оценивается соотношением числа щелчков по баннеру с общим числом его показов и называется CTR (Click/Through Ratio – коэффициент переходов по щелчку). Это своеобразный коэффициент полезного действия баннера. Хорошим уровнем CTR считается значение 2–3 %. Значит, в лучшем случае к вам будут приходить 2–3 человека на каждые сто показов вашего баннера. И, как это ни печально, за последнее время средний CTR стал ниже: по некоторым данным – от 0,4 до 1 %. При размещении баннеров рекомендуется использовать так называемый таргетинг (от англ. targeting – планирование, нацеливание), то есть показ рекламного баннера только целевой аудитории. Солидные службы обмена баннерами предоставляют возможность выбирать тематику серверов, на которых будет показана ваша реклама, или, наоборот, исключать нежелательные, вплоть до выбора доменов и отдельных страниц. Таким образом, вы сможете добиться наибольшего отклика на баннер. Кажущаяся эффективность баннерных показов весьма невысока. Однако, судя по среднему уровню CTR, не столь уж она и плоха, а потому не следует считать, что ваши усилия в 98 случаях из 100 пропадают даром. Во-первых, люди видят ваш баннер, и у них складывается определенный образ вашего сайта (имидж). Во-вторых, даже если вы добились высокого отклика на баннер, это не значит, что достигнут конечный результат: пользователь, попавший к вам только под наплывом эмоций, вызванных баннером, может больше никогда не вернуться, разочаровавшись в том, что увидел на сайте (как зачастую и бывает). Поэтому для того, чтобы щелчки по баннеру служили свидетельством подлинного интереса к теме, а показы баннеров никогда не пропадали даром, рекомендуется соблюдать два условия: • баннер должен соответствовать содержанию сайта. Тогда щелчок по нему будет вызван не только эстетическим воздействием, но и интересом к тематике; • баннер должен содержать ваш логотип или адрес в Internet. Тогда пользователь подсознательно будет запоминать вашу рекламу и впоследствии соотнесет свои потребности в услугах или информации подобного рода именно с вашим сайтом. Требования к баннеру Для успешной рекламы сайта баннер должен отвечать следующим требованиям. 1. Красочное оформление. Рекомендуются яркие, привлекающие внимание цвета. Психологи советуют применять синий цвет для привлечения внимания мужчин, которых, по статистике, большинство в русскоязычной части Internet. Рекомендации психологов основаны на тесте Макса Люшера, применяемого в медицине и при подборе кадров. Тест Люшера считается классическим – одним из наиболее достоверных, применяемых в психологии. На каких же принципах он основан? Испытуемый располагает в порядке предпочтения восемь карточек различных цветов. Во-первых, каждый цвет характеризует определенную человеческую потребность, ассоциируется с ней, является ее символом. Во-вторых, иерархия цветовых предпочтений человека позволяет выявить значимость этих потребностей. Наибольшей эмоциональной окрашенностью отличаются следующие цвета: синий, сине-зеленый, оранжево-красный, светло-желтый, коричневый, фиолетовый, черный. Каждый цвет в комбинации с другими соответствует определенному состоянию человека, как показано в табл. 2 (первый цвет в паре – преобладающий): Таблица 2. Соответствие цветовой гаммы эмоциональному состоянию человека Конечно, эта таблица не является директивой для выбора цветовой гаммы вашего баннера, но принять информацию к сведению не помешает. 2. Профессиональный дизайн. При рекламировании в Internet товаров или услуг, у которых уже сложился определенный имидж, важно, чтобы реклама его не нарушала. Качество художественного исполнения баннера не должно вызывать нареканий, иначе пострадает имидж фирмы, и вы получите антирекламу. Лучше обратиться к дизайнерам-профессионалам. 3. Активно используемая анимация. Движущиеся объекты привлекают зрение, поэтому даже неяркий баннер с анимацией предпочтительнее раскрашенного статического. Анимированный баннер в среднем имеет на 30–50 % больший CTR по сравнению с обычным. Кроме того, анимация расширяет возможности баннерной рекламы. 4. Максимальный визуальный размер при минимальном объеме в байтах. Чем больше размер баннера, тем больше шансов, что его заметят и не примут за элемент оформления сайта. Рекомендуемый размер – 468x60 пикселов. Однако сам баннер не должен занимать более 15 Кб. Для уменьшения объема используйте меньшее количество цветов. Некоторые службы обмена баннерами устанавливают свои лимиты, но в любом случае, чем меньше килобайтов занимает ваш баннер, тем быстрее он загрузится и тем больше шансов, что пользователь увидит его прежде, чем покинет страницу. 5. Запоминаемость, а, следовательно, оригинальность. 6. Интригующее содержание и некоторая недосказанность, вызывающие любопытство и желание познакомиться с сайтом поближе. Считается, что полосы прокрутки и кнопки, присутствующие на баннере, оказывают положительное влияние на CTR. Однако злоупотребление ими приводит к тому, что они вызывают лишь раздражение у пользователя. Кроме того, многие службы обмена баннерами запрещают использование таких эффектов, справедливо считая их дурным тоном. Особенно эффективны имитаторы полосы прокрутки, если интригующий текст уходит за пределы баннера: в этом случае проявляется обычный рефлекс, и вы непроизвольно нажимаете на скроллер. Размещение большого количества баннеров на одной странице недопустимо, так как вызывает у посетителей негативную реакцию. На одну страницу следует помещать максимум два баннера (сверху и снизу). Эффективность баннера Давайте определим несколько правил, следование которым позволит повысить эффективность использования баннеров. • Самое главное – не следует делать баннер очень громоздким. Объем статичных баннеров должен варьироваться от 5 до 8 Кб, анимированных – от 9 до 12 Кб. • Цветовая гамма не должна быть слишком пестрой, оптимальный вариант – не более трех-четырех цветов. • Не делайте баннер с прозрачным фоном, так как на некоторых страницах текст не будет виден. • Используйте оригинальные надписи. Текст типа «Это моя страничка – там много всего» никого не привлечет, и показы такого баннера не принесут никакого результата. • Прибегая к услугам рекламной сети, сделайте несколько видов одного и того же баннера; даже незначительное изменение дизайна в некоторых случаях существенно повышает отклик посетителей. Конец ознакомительного фрагмента. Текст предоставлен ООО «ЛитРес». Прочитайте эту книгу целиком, купив полную легальную версию (https://www.litres.ru/aleksandr-zagumenov/kak-raskrutit-i-razreklamirovat-web-sayt-v-seti-internet/?lfrom=390579938) на ЛитРес. Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.