Сделать стартовой  
Главная   О проекте   обновлено: 2008-02-19 13:05:00
Всего 2672 новостей, + 0 сегодня.
Индикатор апдейтов поисковых систем

ПРЯМОЙ ЭФИР
forum.searchengines.ru

Оценки
значит кому-то понравилось

Архив за Октябрь, 2006

Самый быстрый сервис для массовой проверки Гугл ПР (Google PR) на основе технологии AJAX/XAP (работает без перезагрузки страницы)

Октябрь 30, 2006
http://www.thousands.ru/

Гипертекстовые ссылки и поисковые алгоритмы

Октябрь 30, 2006

Релевантность и авторитетность

Любой пользователь, делая запрос в поисковой машине, естественно ожидает получить наиболее релевантные результаты. Например, если некто делает поиск по фразе “отпуск на Бали”, он будет весьма разочарован, получив в ответ ссылку на личный блог Васи Пупкина с фотографиям его поездки на Бали. Очевидно, что целью поиска был крупный туроператор с приемлемыми ценами. Таким образом, пользователю важно получить не просто релевантные, но и авторитетные результаты. И чем больше страниц появляется каждый день в интернете, тем сильнее сдвиг в алгоритмах поисковых машин в сторону авторитетности.

По сравнению с недавним прошлым сейчас позиции страниц в поисковиках рассчитываются по-иному. Все меньший вес получают в алгоритмах плотность ключевых слов или структура страницы. Отныне релеватность страницы определяется контекстом, в котором существет страница. Контекст - это набор страниц, связанных входящими или исходящими ссылками с данной страницей. Если эта страница об отпуске на Бали, то от нее ожидается связь с другими страницами о Бали и отпусках. Содержимое страницы, плотность ключевых слов имеют второстепенное значение и используются для регулирования результатов в случае, когда имеется ссылка на нерелевантные страницы, например, на сайты рейтингов или статистики.

Ссылочные алгоритмы сортировки (Link Analysis Ranking Algorithms)

Почему же контент страницы недостаточен для определения релевантности? В первую очередь - из-за проблемы избытка результатов поиска, когда количество страниц, считающихся релевантыми на основе только их содержимого, слишком велико для просмотра пользователем. В этом случае, поиск авторитетных страниц способен резко сократить количество результатов и повысить их качество. Однако, авторитетность страницы еще более расплывчатое понятие, чем релевантность. Авторитетность должна выражать важность и вес данного веб-документа. И тут сама природа сети -среды, связанной гипертекстовыми ссылками,- предлагает эффективный способ расчета авторитетности - использование ссылок, как параметра, отражающего “общественное признание” веб-страниц.

Эта идея появилась еще на заре интернета и Джон Клейнберг (Jon Kleinberg) был одним из первых, кто разработал работоспособный подход, описанный в его эпохальной работе “Authoritative Sources in a Hyperlinked Environment” (1998). Он предложил идею, согдасно которой каждая страница выступает одновременно в роли хаба (“hub”) и авторитета (“authority”). Авторитет (далее authority-страница) это страница с большим количеством входящих ссылок (высокой степенью in-degree). Authoritiy-страницы, возвращенные поисковиком как релевантные некоему запросу, должны демнострировать перекрытие множеств страниц, ссылающихся на них. Страницы, которые содержат ссылки на релевантные источники, называются хабами (hubs). Хабы опеределяют релевантность authority-страниц некой теме и позволяют отсекать нерелевантные страницы, несмотря на то, что они обладают высокой степенью in-degree.

Hubs and Authorities in an interlinked environment

Ссылочные алгоритмы сортировки используют графы, подобные изображенному на рисунке. Узлы графа представляют собой страницы, ребра - гипертекстовые ссылки. Эти графы - простые, т.е. две и более ссылки между страницами считаются одним ребром, ссылки страницы на саму себя не считаются вовсе. Ребрам графа может назначаться различный вес, в зависимости от того, какие параметры кроме ссылок поисковики считают важными при опеределении авторитетности, например, возраст домена.

Смотрите другие мои посты, в которых я более подробно описываю ссылочные алгоритмы сортировки.

Источники

Проверить Google пиар сразу на 100 урлах

Октябрь 30, 2006
http://pagerank.cascandra.com/

Новое поколение поиска?

Октябрь 30, 2006
Именно так называется материал на SeoChat - Searchles: The Next Generation of Search? Переводить не стал, ибо итак всё ясно - сообщество любителей поделиться интересненькими ссылочками, ну и поиск по всему этому делу. Пока там хоть и небольшая, но уже помоечка, ссылок накидали, в том числе и я запостил))) http://www.searchles.com/ А вообще мне сложно представить насколько радужны перспективы [...]

.MOBI - тройки ушли

Октябрь 30, 2006

Домейнерский и бизнес-мир восприняли введние специализированной доменной зоны, ориентированной на мобильные устрояства, неоднозначно. Кто-то тихо посмеивался, кто-то злился, мол, развелось, понимаешь ли. Умудрённые опытом домейнеры и юное поколение киберсквоттеров регистрировали красивые имена, ключевики и т.п. Но не забывали и про основу сегодняшнего домейнерского благоденствия - трёхбуквенные домены. Вон, как в зоне .COM они в цене поднялись. Да и в .RU стоят недёшево. В .MOBI регистрация трёхбуквенников шло вяленько. Ещё два дня назад там было свыше 6000 свободных имён. Как вдруг, как гром среди ясного неба, ба-бах - в течение суток весь остаток LLL.MOBI был выкуплен двумя игроками-инкогнито. Столь скоростная реакция домейнеров вызвана, пожалуй, последними заявлениями компаний, работающих в индустрии мобильных устройств. В любом случае, могу поздравить всех обладателей трёхбуквенных доменов - .MOBI побил все рекорды по времени, за которое все тройки разошлись по владельцам - всего 33 дня. Конечно, в .EU это было ещё быстрее, но всё же, всё же. Я рад, что успел себе прикупить пяток троек. Теперь будем ждать реакции вторичного рынка.

Коллекция Платона Щукина

Октябрь 30, 2006
Костя Каширин собирает коллекцию ответов Платона Щукина.
// Источник.

Очень полезная подборка. Можно прочесть и получить представление о том, за что могут забанить в Яндексе. Потому как сама политика компании на этот счет весьма противоречивая и непонятная.
PS: Если и дальше так пойдет дело, то Платон Щукин будет известен не меньше, чем Николя Бурбаки.

О доменном имени .tv

Октябрь 30, 2006
Если спросить рядового пользователя Интернета, что он знает о государстве под названием Тувалу и о том вкладе в историю всемирной паутины, который это самое Тувалу сделало, скорее всего, ответом будет недоуменное молчание. Тем не менее, более просвещенный пользователь наверняка слышал о доменном имени .tv, а искушенный даже о том, что принадлежало оно изначально маленькому островному государству, затерянному где-то посредине Тихого Океана. О нем-то и пойдет речь, и история эта, в...

Алгоритмы сортировки поисковиков - HITS

Октябрь 30, 2006

Алгоритм HITS

Этот алгоритм впервые описал Джон Клейнберг (Jon Kleinberg) в своей статье “Авторитетные источники в гипертекстовой среде” (“Authoritative Sources in a Hyperlinked Environment” (1998)). В алгоритме HITS (Hyperlink Induced Topic Distillation) authority-страницы и хабы взаимно определяют вес друг друга. Значимость authority-страницы рассчитывается как сумма весов хабов, указывающих на нее, а вес хаба, в свою очередь, - как сумма значений авторитетности authority-страниц, ссылки на которые он содержит.

В алгоритме используются следующие обозначения. S - множество страниц, для которых рассчитываются веса хабов и authority, n – количество страниц в множестве. H - подмножество S, содержащее страницы в роли хабов, и A - подмножество S со страницами в роли authority. Поскольку любая страница может одновременно играть и роль хаба, и роль authority, множества A и H перекрываются. Для каждой страницы j в роли хаба F(j) является количеством исходящих ссылок. Для каждой страницы i в роли authority B(i) - количество входящих ссылок. Вектор значений authority с размерностью n обозначается буквой a, а вектор значений хабов - h. Таким образом расчет весов хабов и authority принимает следующий вид:

HITS Algorithm calculation of weights

Процесс расчета производится итеративно.Изначально все веса имеют значение 1. Алгоритм начинается с перерасчета весов по формуле, указанной выше, после чего векторы нормализуются. Эта итерация повторяется до тех пор пока векторы a и h не сойдутся.

Алгоритм HITS, к сожалению, не лишен недостатков. К примеру, сама идея взаимного влияния хабов и authority-страниц создает следующую ситуацию. Представим себе хаб, который ссылается на несколько authority-страниц (хаб B на рисунке ниже), и несколько хабов, указывающих на одну authority-страницу (A). Если количество authority-страниц, на которые указывает В, больше, чем количество хабов, ссылающихся на А, то алгоритм HITS распределит весь вес авторитетности между authority-страницами в правой части рисунка, и назначит authority-странице А вес практически равный нулю.

HITS Algorithm faults

Причиной этого явления является то, что хаб В уже на первой итерации получит большой вес от многочисленных authority-страниц и немедленно распределит его обратно между страницами, ссылки на которые он содержит. В тоже самое время хабы слева получат малый вес (вес одной лишь страницы А, поделенный между всеми ими) и в ответ назначат А также низкий вес, хотя очевидно, что страница А должна быть намного авторитетнее страниц справа.

Источники

Мэтт Каттс: что нужно, чтобы преуспеть в Google

Октябрь 30, 2006

Мэтт Каттс (Matt Cutts) работает программистом в Google с 2000 г, автор семейного фильтра SafeSearch, известен благодаря своему блогу, в котором он раскрывает некоторые секреты крупнейшего поисковика в мире. Представляю вашему вниманию транскрипт одного из видеоклипов, в котором Мэтт отвечает на вопросы читателей его блога.

В: Есть ли какие-либо рекомендации, следуя которым можно улучшить позиции сайта в Google?

О: В первую очередь необходимо убедиться что поисковые роботы могут беспрепятственно проиндексировать ваш сайт. Взгляните на ваш сайт глазами робота, с помощью, к примеру, текстового браузера типа Lynx. Если ваш сайт использует навигацию, реализованную на Javascript, Flash или при помощи меню-картинок, обязательно продублируйте все текстовыми ссылками. Если вы можете по имеющимся текстовым ссылкам открыть любую страницу сайта, то у вас все в порядке. В противном случае, я советую создать отдельную страницу - карту сайта с текстовыми ссылками или воспользоваться для этого службой Google Sitemaps.

Другой крайне важный аспект – контент. Ваш контент должен быть действительно интересным и полезным для посетителей сайта, он должен быть причиной, заставляющей их снова и снова посещать его. Убедитесь, что контент доступен поисковым роботам и после этого смело начинайте оптимизировать и раскручивать свой сайт. Планируя маркетинговую кампанию, подумайте об организациях и людях, связанных с вашей нишей и сделайте так, чтобы они о вас узнали. Например, если ваш сайт о косметологии, поищите докторов-косметологов или косметологические центры. Если у них есть сайты, свяжитесь с ними, расскажите о своем сайте и возможно они начнут ссылаться на вас.

Придумайте какую-нибудь «фишку», нечто действительно ценное, с чем пользователи могут ассоциировать ваш сайт. Это может быть качественный и уникальный контент, статьи или уроки, видео-клипы. Уроки и туториалы, в том числе видео-уроки (обязательно с текстовым транскриптом), исключительно полезны в этом качестве. Они представляют собой весьма ценный контент и особенно любимы пользователями. В урок всегда можно включить маркетинговую фразу типа «если вы собираетесь последовать этому туториалу, то вам возможно понадобится этот продукт, и его вы всегда можете заказать у нас». Таким образом, туториалы могут стать отличным дополнением к онлайновым магазинам – контент для поисковиков, маркетинг для пользователей.

Еще один способ заявить о себе миру и получить односторонние ссылки – это сайты типа Digg, Slash-dot, Reddit, Fark и другие социальные сети с сотнями тысяч посетителей. Придумайте нечто, что выделит вас из толпы и запостьте ваши новости на сайты закладок. В скором времени вы заметите прирост посетителей с этих сайтов, а также по ссылкам с блогов, т.к. пользователи социальных сетей нередко копируют интересные новости к себе в блоги.

Распределение кликов на страницах результатов поиска Google

Октябрь 29, 2006
Каково распределение кликов на страницах выдачи поисковиков? Насколько больше внимания и кликов получит второй результат в выдаче по сравнению с первым? Как частно пользователи кликают результаты внизу страницы? Взаимодействие пользователей со списком результов поиска является одной из наиболее часто обсуждаемых тем в SEO коммьюнити и также представляет собой важную область исследования для инженеров-поисковиков. Пролить свет на эту тему помогают исследования движений глаз пользователя во время взаимодействия со страницей результатов поиска - так называемые ‘eye-tracking studies’.
(Смотреть графики)
Последние новости
Самое популярное

Записи (RSS)
Комментарии (RSS)