Значимость ссылочной массы сайта и ее анализ
Введение
Внешние ссылки являются одним из основных факторов ранжирования результатов выдачи поисковых систем. Размещение одной ссылки на главной странице авторитетного сайта до недавнего времени способствовало повышению рейтинга сайта-акцептора и, соответственно, приводило к повышению его позиций в результатах поиска по определенным запросам. Постоянно растущий объем ссылок, предназначенных для увеличения релевантности, и возможность их относительно простого платного размещения на авторитетных порталах позволили влиять на результаты поиска. Поэтому на сегодняшний день большинство поисковых систем применяет комплекс фильтров и методов для выявления «неестественных» ссылок и занижения их влияния. Так, в поисковой машине Яндекс были внедрены программы «Магадан» и «Находка». Это привело к тому, что для сайта определяющее значение стали играть не каждая ссылка в отдельности, а вся ссылочная масса в целом. Поэтому поиск количественных показателей, характеризующих значимость ссылочной массы сайта и способов ее анализа является актуальной задачей, что и было основной целью данной работы.
Результаты и их обсуждение
Исследовались зависимости интегрального показателя значимости ссылки p от ее положения n в ссылочной массе p = f(n) для сайтов из определенных тематических групп, выбранных на основе совокупности запросов из ТОП-50 поисковой системы Яндекс. Интегральные показатели значимости ссылок рассчитывались на основе статистических данных и зависели от ТИЦ сайта, PR страницы, количества ссылок на странице, а также от его нахождения в каталогах Яндекса и DMOZ.
Все исследованные сайты, по зависимостям значимости p от положения n ссылки в ссылочном ряду можно разделить на две группы. Первую группу составляют сайты имеющие монотонные зависимости p = f(n), отличающиеся скоростью спада (рис. 1, а). Как правило, такие сайты находятся на первых 10 позициях по определенной совокупности запросов. Вторая группа включает сайты, характеризующиеся наличием локальных экстремумов, большей скоростью спада, что указывает на более неоднородную ссылочную массу (рис. 1, б). Как правило, такие сайты находятся ниже десятой позиции. Следует отметить, что некоторые сайты с искаженным распределением могли занимать первые пять позиций выдачи. Как оказалось, такие сайты имеют большее количество ссылок, превышающее ссылочную массц сайтов первой группы в 2-5 раза, что, очевидно, позволяет за счет большего количества ссылок, в том числе и с авторитетных порталов, добавить вес или компенсировать его отрицательную составляющую, порождаемую остальными ссылками. И, наоборот, сайты с плавным распределением находились ниже десятой позиции, что может быть обусловлено меньшим числом внешних ссылок, бедным контентным содержанием, его дублированием и т.п.
Рис. 1. Зависимости p = f(n) сайтов первой (а) и второй (б) группы. Первое и одиннадцатое места в выдаче поисковой системы Яндекс, соответственно.
Особый интерес представляли сайты, имеющие более низкие позиции в выдаче при меньшей ссылочной массе. Распределение ссылок по значимости для сайтов этой группы, стоящих ближе к верхним позициям выдачи являются более плавными кривыми и характеризуются невысокой скоростью спада (рис. 2). В то же время для сайтов, находящихся на более низких позициях скорость спада зависимостей p = f(n), увеличивается. Кроме того, на них видны ступеньки, а в области ссылок средней значимости зачастую выделяются отдельные максимумы, число которых индивидуально для каждого из исследованных сайтов.
Рис. 2. Зависимости p = f(n) сайтов, стоящих в выдаче на третьем, четвертом и пятом местах в выдаче поисковой системы Яндекс.
Сайты находящиеся на более низких позициях характеризуются наличием более авторитетных ссылок, за счет чего кривая p = f(n) в начале имеет наибольшую скорость спада. Все исследованные сайты характеризовались уникальным контентом, а наиболее значимые ссылки были установлены на авторитетных порталах с относительно небольшим числом внешних ссылок на главной странице (не более 6-ти). Характерно, что в области ссылок средней значимости с уменьшением позиции сайта наблюдается появление локального максимума, имеющего вид ступеньки. Все это в совокупности указывает на то, что позиция сайта определяется не только количеством ссылок, но и характером распределения ссылочной массы. При этом высокие позиции сайта в результатах поиска могут быть обеспечены сочетанием контентной оптимизации и определенной ссылочной поддержкой.
Следует отметить, что часто для сайтов, стоящих на близких позициях достаточно сложно обнаружить отличия в ссылочной массе. Поисковые исследования показали, что эффективным способом выявления наиболее тонких ее особенностей является дискретное вейвлет-преобразование. Типичные результаты дискретного вейвлет-преобразования на пяти уровнях для сайта первой группы, полученные с помощью вейвлета Хаара приведены на рис. 3.
Рис. 3. Аппроксимирующая и детализирующие компоненты дискретного вейвлет-преобразования для сайта первой группы.
При таком преобразовании зависимость p = f(n) разбивается на аппроксимирующую и детализирующие составляющие, которые в сумме дают исходное распределение и, по сути, раскрывают характер накопления ссылочной массы сайта. Первая из них является грубым приближением исходного распределения и представляет собой спадающую ступенчатую кривую. При этом характер изменения шага между уровнями аппроксимирующей компоненты, то есть скорость ее спада является индивидуальной характеристикой каждого сайта. Сопоставление грубых приближений для исследованных кривых p = f(n) показало, что для сайтов первой группы, находящихся на первых позициях поисковой выдачи, скорость спада аппроксимирующей составляющей является нелинейной (рис. 3, кривая а5). Она возрастет в области авторитетных и быстро спадает в области менее значимых ссылок, в то время как для сайтов второй группы она близка к линейной зависимости, а чаще является непостоянной и меняется в различных диапазонах значимости (рис. 4, кривая а5). Аппроксимирующая компонента вейвлет преобразования отдаленно, таким образом, отражает ссылочную структуру на начальных этапах продвижения сайта, от которой в дальнейшем будет зависеть направление дальнейших работ по увеличению ссылочной массы.
Действительно, детализирующее компоненты вейвлет-преобразования разбиваются на несколько ссылочных областей, в которых необходимо вносить наибольшие изменения, то есть по сути, на ссылочные кластеры. Характерно, что для сайтов первой группы число таких кластеров минимально и сосредоточено в основном в области наиболее авторитетных ссылок (рис. 3, кривые d5-d1), что только подтверждает стремление поисковых систем, в частности, Яндекса, бороться с растущим количеством авторитетных ссылок, которые способны существенно изменять поисковую выдачу. С увеличением уровня детализации, отклонение коэффициентов постепенно становится одинаковым, а их зависимости – симметричными относительно нулевого уровня.
Для сайтов второй группы характерно наличие от 2-х и более ссылочных кластеров на зависимостях детализирующих коэффициентов, в которых требуются наибольшие изменения для приближения аппроксимирующей составляющей к исходному распределению (рис. 4, кривые d5-d1). Как правило, большая их часть сосредоточена в области ссылок наибольшей и средней значимости, что указывает на более масштабные работы по накоплению ссылочной массы путем размещения ссылок на главных страницах, как с авторитетных, так и с сайтов с невысокими параметрами. При этом размах детализирующих коэффициентов неодинаков на большем количестве уровней разложения.
Рис. 4. Аппроксимирующая и детализирующие компоненты дискретного вейвлет-преобразования для сайта второй группы
Кроме того, для сайтов второй группы характерны изменения детализирующих коэффициентов в области дешевых ссылок, ширина которых индивидуальна для каждого из исследованных сайтов. Их наличие может быть связано с наличием однотипных ссылок, массовой регистраций в каталогах и т.п. То есть сайты второй группы характеризуются относительно большой скоростью прироста ссылочной массы, что обусловливает применение штрафных и занижающих санкций со стороны поисковых систем и подтверждается сопоставлением ссылочных распределений после цикла апдейтов.
Следует отметить, что результаты выдачи по фиксированным запросам для всех поисковых систем, в том числе и для наиболее популярных – Яндекс и Google, являются индивидуальными. Это обусловлено различными алгоритмами учета внешних ссылок и, соответственно, предпочитаемыми особенностями зависимостей p = f(n), выявление и сопоставление которых является задачей дальнейших исследований.
Заключение
Таким образом, предложен интегративный показатель, характеризующий значимость ссылки. С помощью дискретного вейвлет-преобразования зависимости интегрального показателя значимости ссылки p от ее положения n в ссылочной массе показано, что положение сайта в выдаче поисковой системы Яндекс определяется не каждой ссылкой в отдельности, а интегральным действием всей внешней ссылочной массы.
раздел — поиск и SEO ;
Tweet |
Написать отзыв: