Любой пользователь, делая запрос в поисковой машине, естественно ожидает получить наиболее релевантные результаты. Например, если некто делает поиск по фразе “отпуск на Бали”, он будет весьма разочарован, получив в ответ ссылку на личный блог Васи Пупкина с фотографиям его поездки на Бали. Очевидно, что целью поиска был крупный туроператор с приемлемыми ценами. Таким образом, пользователю важно получить не просто релевантные, но и авторитетные результаты. И чем больше страниц появляется каждый день в интернете, тем сильнее сдвиг в алгоритмах поисковых машин в сторону авторитетности.
По сравнению с недавним прошлым сейчас позиции страниц в поисковиках рассчитываются по-иному. Все меньший вес получают в алгоритмах плотность ключевых слов или структура страницы. Отныне релеватность страницы определяется контекстом, в котором существет страница. Контекст - это набор страниц, связанных входящими или исходящими ссылками с данной страницей. Если эта страница об отпуске на Бали, то от нее ожидается связь с другими страницами о Бали и отпусках. Содержимое страницы, плотность ключевых слов имеют второстепенное значение и используются для регулирования результатов в случае, когда имеется ссылка на нерелевантные страницы, например, на сайты рейтингов или статистики.
Почему же контент страницы недостаточен для определения релевантности? В первую очередь - из-за проблемы избытка результатов поиска, когда количество страниц, считающихся релевантыми на основе только их содержимого, слишком велико для просмотра пользователем. В этом случае, поиск авторитетных страниц способен резко сократить количество результатов и повысить их качество. Однако, авторитетность страницы еще более расплывчатое понятие, чем релевантность. Авторитетность должна выражать важность и вес данного веб-документа. И тут сама природа сети -среды, связанной гипертекстовыми ссылками,- предлагает эффективный способ расчета авторитетности - использование ссылок, как параметра, отражающего “общественное признание” веб-страниц.
Эта идея появилась еще на заре интернета и Джон Клейнберг (Jon Kleinberg) был одним из первых, кто разработал работоспособный подход, описанный в его эпохальной работе “Authoritative Sources in a Hyperlinked Environment” (1998). Он предложил идею, согдасно которой каждая страница выступает одновременно в роли хаба (“hub”) и авторитета (“authority”). Авторитет (далее authority-страница) это страница с большим количеством входящих ссылок (высокой степенью in-degree). Authoritiy-страницы, возвращенные поисковиком как релевантные некоему запросу, должны демнострировать перекрытие множеств страниц, ссылающихся на них. Страницы, которые содержат ссылки на релевантные источники, называются хабами (hubs). Хабы опеределяют релевантность authority-страниц некой теме и позволяют отсекать нерелевантные страницы, несмотря на то, что они обладают высокой степенью in-degree.
Ссылочные алгоритмы сортировки используют графы, подобные изображенному на рисунке. Узлы графа представляют собой страницы, ребра - гипертекстовые ссылки. Эти графы - простые, т.е. две и более ссылки между страницами считаются одним ребром, ссылки страницы на саму себя не считаются вовсе. Ребрам графа может назначаться различный вес, в зависимости от того, какие параметры кроме ссылок поисковики считают важными при опеределении авторитетности, например, возраст домена.
Смотрите другие мои посты, в которых я более подробно описываю ссылочные алгоритмы сортировки.
Borodin, A, Roberts, G.O., Rosenthal, J.S. and Tsaparas, P. ‘Finding authorities and hubs from link structures on the World Wide Web’. In Proceedings of the 10 th International World Wide Web Conference, Hong Kong, May 2001. Available at http://citeseer.ist.psu.edu/borodin01finding.html
Именно так называется материал на SeoChat - Searchles: The Next Generation of Search?
Переводить не стал, ибо итак всё ясно - сообщество любителей поделиться интересненькими ссылочками, ну и поиск по всему этому делу. Пока там хоть и небольшая, но уже помоечка, ссылок накидали, в том числе и я запостил)))
http://www.searchles.com/
А вообще мне сложно представить насколько радужны перспективы [...]
Домейнерский и бизнес-мир восприняли введние специализированной доменной зоны, ориентированной на мобильные устрояства, неоднозначно. Кто-то тихо посмеивался, кто-то злился, мол, развелось, понимаешь ли. Умудрённые опытом домейнеры и юное поколение киберсквоттеров регистрировали красивые имена, ключевики и т.п. Но не забывали и про основу сегодняшнего домейнерского благоденствия - трёхбуквенные домены. Вон, как в зоне .COM они в цене поднялись. Да и в .RU стоят недёшево. В .MOBI регистрация трёхбуквенников шло вяленько. Ещё два дня назад там было свыше 6000 свободных имён. Как вдруг, как гром среди ясного неба, ба-бах - в течение суток весь остаток LLL.MOBI был выкуплен двумя игроками-инкогнито. Столь скоростная реакция домейнеров вызвана, пожалуй, последними заявлениями компаний, работающих в индустрии мобильных устройств. В любом случае, могу поздравить всех обладателей трёхбуквенных доменов - .MOBI побил все рекорды по времени, за которое все тройки разошлись по владельцам - всего 33 дня. Конечно, в .EU это было ещё быстрее, но всё же, всё же. Я рад, что успел себе прикупить пяток троек. Теперь будем ждать реакции вторичного рынка.
Костя Каширин собирает коллекцию ответов Платона Щукина. // Источник. Очень полезная подборка. Можно прочесть и получить представление о том, за что могут забанить в Яндексе. Потому как сама политика компании на этот счет весьма противоречивая и непонятная. PS: Если и дальше так пойдет дело, то Платон Щукин будет известен не меньше, чем Николя Бурбаки.
Если спросить рядового пользователя Интернета, что он знает о государстве под названием Тувалу и о том вкладе в историю всемирной паутины, который это самое Тувалу сделало, скорее всего, ответом будет недоуменное молчание. Тем не менее, более просвещенный пользователь наверняка слышал о доменном имени .tv, а искушенный даже о том, что принадлежало оно изначально маленькому островному государству, затерянному где-то посредине Тихого Океана. О нем-то и пойдет речь, и история эта, в...
Этот алгоритм впервые описал Джон Клейнберг (Jon Kleinberg) в своей статье “Авторитетные источники в гипертекстовой среде” (“Authoritative Sources in a Hyperlinked Environment” (1998)). В алгоритме HITS (Hyperlink Induced Topic Distillation) authority-страницы и хабы взаимно определяют вес друг друга. Значимость authority-страницы рассчитывается как сумма весов хабов, указывающих на нее, а вес хаба, в свою очередь, - как сумма значений авторитетности authority-страниц, ссылки на которые он содержит.
В алгоритме используются следующие обозначения. S - множество страниц, для которых рассчитываются веса хабов и authority, n – количество страниц в множестве. H - подмножество S, содержащее страницы в роли хабов, и A - подмножество S со страницами в роли authority. Поскольку любая страница может одновременно играть и роль хаба, и роль authority, множества A и H перекрываются. Для каждой страницы j в роли хаба F(j) является количеством исходящих ссылок. Для каждой страницы i в роли authority B(i) - количество входящих ссылок. Вектор значений authority с размерностью n обозначается буквой a, а вектор значений хабов - h. Таким образом расчет весов хабов и authority принимает следующий вид:
Процесс расчета производится итеративно.Изначально все веса имеют значение 1. Алгоритм начинается с перерасчета весов по формуле, указанной выше, после чего векторы нормализуются. Эта итерация повторяется до тех пор пока векторы a и h не сойдутся.
Алгоритм HITS, к сожалению, не лишен недостатков. К примеру, сама идея взаимного влияния хабов и authority-страниц создает следующую ситуацию. Представим себе хаб, который ссылается на несколько authority-страниц (хаб B на рисунке ниже), и несколько хабов, указывающих на одну authority-страницу (A). Если количество authority-страниц, на которые указывает В, больше, чем количество хабов, ссылающихся на А, то алгоритм HITS распределит весь вес авторитетности между authority-страницами в правой части рисунка, и назначит authority-странице А вес практически равный нулю.
Причиной этого явления является то, что хаб В уже на первой итерации получит большой вес от многочисленных authority-страниц и немедленно распределит его обратно между страницами, ссылки на которые он содержит. В тоже самое время хабы слева получат малый вес (вес одной лишь страницы А, поделенный между всеми ими) и в ответ назначат А также низкий вес, хотя очевидно, что страница А должна быть намного авторитетнее страниц справа.
Мэтт Каттс (Matt Cutts) работает программистом в Google с 2000 г, автор семейного фильтра SafeSearch, известен благодаря своему блогу, в котором он раскрывает некоторые секреты крупнейшего поисковика в мире. Представляю вашему вниманию транскрипт одного из видеоклипов, в котором Мэтт отвечает на вопросы читателей его блога.
В: Есть ли какие-либо рекомендации, следуя которым можно улучшить позиции сайта в Google?
О: В первую очередь необходимо убедиться что поисковые роботы могут беспрепятственно проиндексировать ваш сайт. Взгляните на ваш сайт глазами робота, с помощью, к примеру, текстового браузера типа Lynx. Если ваш сайт использует навигацию, реализованную на Javascript, Flash или при помощи меню-картинок, обязательно продублируйте все текстовыми ссылками. Если вы можете по имеющимся текстовым ссылкам открыть любую страницу сайта, то у вас все в порядке. В противном случае, я советую создать отдельную страницу - карту сайта с текстовыми ссылками или воспользоваться для этого службой Google Sitemaps.
Другой крайне важный аспект – контент. Ваш контент должен быть действительно интересным и полезным для посетителей сайта, он должен быть причиной, заставляющей их снова и снова посещать его. Убедитесь, что контент доступен поисковым роботам и после этого смело начинайте оптимизировать и раскручивать свой сайт. Планируя маркетинговую кампанию, подумайте об организациях и людях, связанных с вашей нишей и сделайте так, чтобы они о вас узнали. Например, если ваш сайт о косметологии, поищите докторов-косметологов или косметологические центры. Если у них есть сайты, свяжитесь с ними, расскажите о своем сайте и возможно они начнут ссылаться на вас.
Придумайте какую-нибудь «фишку», нечто действительно ценное, с чем пользователи могут ассоциировать ваш сайт. Это может быть качественный и уникальный контент, статьи или уроки, видео-клипы. Уроки и туториалы, в том числе видео-уроки (обязательно с текстовым транскриптом), исключительно полезны в этом качестве. Они представляют собой весьма ценный контент и особенно любимы пользователями. В урок всегда можно включить маркетинговую фразу типа «если вы собираетесь последовать этому туториалу, то вам возможно понадобится этот продукт, и его вы всегда можете заказать у нас». Таким образом, туториалы могут стать отличным дополнением к онлайновым магазинам – контент для поисковиков, маркетинг для пользователей.
Еще один способ заявить о себе миру и получить односторонние ссылки – это сайты типа Digg, Slash-dot, Reddit, Fark и другие социальные сети с сотнями тысяч посетителей. Придумайте нечто, что выделит вас из толпы и запостьте ваши новости на сайты закладок. В скором времени вы заметите прирост посетителей с этих сайтов, а также по ссылкам с блогов, т.к. пользователи социальных сетей нередко копируют интересные новости к себе в блоги.
Каково распределение кликов на страницах выдачи поисковиков? Насколько больше внимания и кликов получит второй результат в выдаче по сравнению с первым? Как частно пользователи кликают результаты внизу страницы? Взаимодействие пользователей со списком результов поиска является одной из наиболее часто обсуждаемых тем в SEO коммьюнити и также представляет собой важную область исследования для инженеров-поисковиков. Пролить свет на эту тему помогают исследования движений глаз пользователя во время взаимодействия со страницей результатов поиска - так называемые ‘eye-tracking studies’. (Смотреть графики)