Особенности ранжирования в Яндексе и Google для сайтов недвижимости
Автор аналитического отчета: Михаил Волович, «Ашманов и партнеры».
Пятый отраслевой аналитический отчет посвящен недвижимости. Здесь правят бал агрегаторы — в Яндексе они занимают почти 75% топ-30, 90% топ-10 и 95% топ-3, в Google лишь немногим меньше (60%, 80% и 90%, соответственно).
Оставшиеся места делят между собой агентства недвижимости, информационные сайты, доски объявлений и (едва ли не на последнем месте) девелоперы. Последние в топ-10 попадают лишь эпизодически: на 300 запросов нашей выборки меньше 10 случаев в Яндексе, меньше пятидесяти — в Google.
В ситуации, когда доминирование одного типа сайтов столь явно выражено, ни смысла, ни возможности оценивать ранжирование других типов по отдельности не остается — для этого просто недостаточно данных.
«Магазины» недвижимости
Но кроме того, создается впечатление, что сайты других типов ранжируются по более или менее общим правилам с агрегаторами и просто не выдерживают конкуренции с ними.
Напомним, что в автомобильном отчете мы видели, что сайты производителей занимают высокие (хотя не обязательно первые) места по многим запросам, относящимся к моделям и маркам автомобилей, их покупке и т. п., — включая запросы типа рено автосалоны или мицубиси дилеры. Судя по всему, производители автомобилей «идут вне конкурса» и подмешиваются в выдачу примерно так же, как в нее подмешиваются результаты собственных сервисов поисковой машины (например, Яндекс.Недвижимость или карты Google).
С «производителями» недвижимости ситуация в корне другая. Казалось бы, результаты поиска, например, по запросу новостройки в Зеленограде от застройщика должны начинаться с сайтов этих самых застройщиков, они же девелоперы. Но нет — в обоих поисковиках застройщики отметились разве что в рекламных объявлениях, а основная выдача состоит из агрегаторов, которые подобрали 17 новостроек эконом класса в Зеленограде от застройщиков ПИК ГК, А101, ДСК-1 и других компаний или сделали что-нибудь еще в этом роде. И не сильно отличается от результатов поиска по запросу новостройки в Зеленограде. Если сайты застройщиков не возглавляют поисковую выдачу, а плетутся в хвосте, есть ли основания предполагать, что к ним применяется некий особый алгоритм ранжирования?

С точки зрения пользователя, который ищет квартиру (офис, участок земли), сайты застройщика, агентства или агрегатора мало отличаются друг от друга и решают одни и те же задачи. Каждый из них предлагает какое-то количество вариантов продаваемой (сдаваемой в аренду) недвижимости, среди которых пользователь будет искать подходящие. Сколько-то объектов представлены прямо на странице, на которую выводит поисковик, а для выбора остальных сайт предоставляет более или менее удобный сервис: карту, отбор по характеристикам, калькулятор и т. п. Изучив варианты на странице и оценив предлагаемые средства навигации по сайту, пользователь решает, продолжить ли поиск здесь или перейти к другому сайту.
В этом смысле любой сайт недвижимости похож на интернет-магазин — только товар здесь специальный. Главное отличие агрегаторов не в том, что товар у них «чужой», а у застройщиков и агентств «свой», а в том, что ассортимент у них шире и выбор больше. Соответственно, успешно конкурировать с агрегаторами удается прежде всего тем агентствам (а иногда и крупным застройщикам), у которых ассортимент тоже достаточно велик.
Естественно, если запрос касается конкретного жилищного комплекса или агентства, вступают в действие иные механизмы — например, навигационного поиска. Но такие запросы мы в нашу выборку не включали. Чем уже запрос, тем больше шансов у небольших сайтов (агентств и застройщиков, включая сайты конкретных проектов) попасть в топ — просто в силу меньшей конкуренции со стороны крупных проектов.
Продолжая аналогию с «магазинами недвижимости», можно сравнить агрегаторы с гипер- и супер- маркетами, агентства — с магазинами среднего размера, застройщиков — со специализированными «монобрендовыми» магазинчиками. Понятно, что небольшие магазины могут конкурировать с гипермаркетами, только если их товар эксклюзивный или нишевый. Так и происходит: в области эксклюзивного жилья и при узкой географической привязке агентствам и застройщикам легче конкурировать с агрегаторами — уже хотя бы потому, что далеко не у всех агрегаторов есть соответствующие предложения.
Какие-то различия в ранжировании между сайтами разных типов, конечно, существуют, и формула ранжирования, например, для агентств у одного или обоих поисковиков может отличаться от фор- мулы ранжирования для агрегаторов. Это отчасти подтверждается тем, что для агрегаторов некоторые параметры оказываются сильнее, чем для всей выборки в целом, а некоторые слабее. Тем не менее, для недвижимости анализ ранжирования по выборке в целом, без деления на типы сайтов, представляется и оправданным, и едва ли не единственно возможным.
Подобно рынку интернет-торговли, в онлайн-недвижимости велик уровень «монополизации»: небольшое количество крупных сайтов занимают ведущие позиции сразу по многим запросам. Не удивительно, что многие параметры (и даже группы параметров) в нашей «риелторской» выборке ведут себя примерно так же, как в e-commerce.
Одна из характерных особенностей ранжирования для запросов по недвижимости — сильная корреляция с позицией (или связь с попаданием в топ) у параметров, характерных для крупных сайтов: ИКС, трафиковые факторы, ассортимент, размер сайта, ссылочные факторы и др.
Коммерческие факторы
Коммерческие параметры — это та сфера, где отраслевые особенности ранжирования проявляются особенно ярко. В случае недвижимости на отраслевые особенности накладываются особенности преобладающего типа сайтов — в нашем случае это агрегаторы.
Ассортимент, размер витрины, размер сайта
Наши асессоры оценивают ассортимент товаров или услуг, предлагаемых сайтом, по довольно грубой шкале с четырьмя «делениями»: он может быть огромным, широким, средним или узким. Когда мы проектировали анкету для оценки сайтов, мы, пожалуй, не ожидали, что эти не вполне формальные оценки будут так сильно коррелировать с ранжированием. Тем не менее, границы между широким и средним ассортиментом и особенно между огромным и широким оказались очень важными. И чем больше «монополизированы» результаты поиска, тем сильнее основанные на них параметры — огромный и включающий его широкий ассортимент.
Не будет преувеличением сказать, что в топ-30 Яндекса и Google как минимум широкий ассортимент имеют почти все сайты: 96% в Яндексе (против 83% в фоне) и 91% в Google. Коэффициент корреляции с позицией в Яндексе 0,10, в Google 0,18 — но это как раз тот случай, когда связь с попаданием в топ-30 важнее, чем корреляция с позицией.

В 92% случаев сайты, попавшие на первую позицию в Яндексе и в 84% — в Google имеют огромный ассортимент. Дальше средние значения этого параметра быстро падают с позицией, но всё равно остаются заметно выше, чем на общей выборке. Значения в Яндексе выше, чем в Google.
Огромный ассортимент встречается, естественно, реже, но таких сайтов тоже очень много — около половины (в Яндексе 52%, в Google 48%). Это намного больше, чем в общей выборке, больше, чем в электронной коммерции и в автомобилях. В обоих поисковиках процент таких сайтов очень сильно растет при приближении к первой позиции: в топ-3 их 81% в Яндексе и 77% в Google (в других выборках не более 60%). Неудивительно, что коэффициенты корреляции очень высокие.
Интересно, что если посмотреть только на агрегаторы, сила параметров, связанных с ассортиментом, там слабее (хотя значения параметров выше). Похоже, ассортимент — это один из важных факторов, по которым агентства и застройщики проигрывают агрегаторам.
Мы, разумеется, не хотим сказать, что Яндекс или Google, как и мы, делит ассортимент на огромный, широкий и средний. Поисковые машины выкачивают сайты целиком, умеют распознавать типы страниц и делить их на функциональные зоны, и у них есть все возможности для количественной оценки ассортимента. Однако нет сомнений, что ассортимент влияет на ранжирование, и при поисковой оптимизации необходимо это учитывать.
При этом поисковые машины, при всей их технологической продвинутости, вынуждены судить об ассортименте только по внешним признакам — грубо говоря, они могут сосчитать количество категорий товаров, брендов и т. п., а также самих товаров. Но в недвижимости «товары» специфические — их можно квантовать по-разному. Можно подавать как отдельное предложение целый жилищный комплекс, можно — двухкомнатные квартиры в нём, а можно — квартиры определенного метража и планировки (и еще этаж, например, учитывать). От того, с какой степенью подробности создатели сайта представили предлагаемую на нём недвижимость, сильно зависит, каким увидят ассортимент сайта поисковые машины.
Если подробно описать на сайте все типы квартир в качестве отдельных товарных позиций, снабдив их фотографиями, описаниями планировки и т. п., от этого не только расширится ассортимент, но и пользователи получат больше информации, что положительно скажется на поведенческих факторах.
Оценки количества брендов в ассортименте к недвижимости неприменимы. Зато здесь очень важны другие параметры, косвенно связанные с ассортиментом. Чем он больше, тем большестраниц в индексе (мы получаем данные от Яндекса) и тем больше на сайте релевантных страниц — растет количество найденных страниц с сайта (опять же, данные от Яндекса). В обоих поисковиках для этих параметров есть сильная связь с попаданием в топ и очень сильная корреляция с позицией.
Косвенной оценкой ассортимента можно считать также размер «витрины» на найденной стра- нице. О нём можно (правда, тоже косвенно) судить по количеству цен на странице. Здесь очень большая разница в значениях между страницами, попавшими в топ-30 Яндекса (20) и фоном (3,27). В Google разница меньше, но тоже заметная, и в обоих поисковиках очень сильная корреляция с позицией: коэффициент корреляции 0,27. Агентства и тем более девелоперы по этому параметру катастрофически отстают от агрегаторов (не удивительно, что они в основном плетутся в хвосте), но параметр остается сильным и только для агрегаторов.

Региональность и связь с пользователем
Привязка к региону, из которого задан запрос, присутствие в других регионах, контактные данные и каналы связи с посетителем сайта — всё это для недвижимости не то чтобы не работает, но заметно ослаблено по сравнению с общей выборкой.
Локализация сайта в Москве (то есть наличие московских адресов, телефонов и т. п.) для запросов, заданных из Москвы, — всегда очень сильный параметр, и недвижимость тут не исключение. В Яндексе для него характерны значения, близкие к 100%, и сильная связь с попаданием в топ-30; в Google — сильная корреляция с позицией. Но уже с основной локализацией в Москве — обычно тоже весьма сильным параметром — у запросов по недвижимости всё как-то не складывается: в Яндексе значения ниже и связь с попаданием в топ слабая, в Google слабая корреляция с позицией (правда, есть связь с попаданием в топ).
Наличие представительств в других регионах менее характерно для сайтов недвижимости, чем для сайтов из общей выборки, и соответствующие параметры слабее. Для локализации в Санкт- Петербурге падение по сравнению с общей выборкой более слабое, чем для присутствия в нескольких или многих регионах.
Наличие адреса на сайте и на странице, нескольких или многих адресов для запросов по недвижимости в Яндексе не связано или очень слабо связано с ранжированием; в Google есть связь с попаданием в топ.
Правда, для некоторых из этих параметров связь с ранжированием усиливается, если посмотреть отдельно на сайты агрегаторов. При оценке без разделения по типам сайтов начинает перевешивать «хвост» топ-30, где больше агентств и застройщиков, которые, естественно, чаще публикуют свой адрес (или адреса). Этим же может объясняться и связь с попаданием в топ в Google, где доля агрегаторов меньше, а агентств и застройщиков — больше. Наличие адреса у агрегаторов и в Яндексе, и в Google довольно сильно коррелирует с позицией и связано с попаданием в топ-30; а вот наличие адреса на странице, нескольких и тем более многих адресов для агрегаторов не характерно.
Аналогичная ситуация и с телефонами: телефон на сайте, на странице, несколько или много телефонов — в Яндексе эти параметры «не работают», а в Google для них есть связь с попаданием в топ. Однако если посмотреть отдельно на агрегаторы, в Яндексе для этих параметров появляется и связь с попаданием в топ-30, и корреляция с позицией.
Интересная ситуация со знаменитым телефоном 8-800 — возможно, самым раскрученным из предполагаемых коммерческих факторов. На сайтах, попадающих в результаты поиска по нашей риелторской выборке, он встречается редко и на ранжирование, судя по всему, не влияет.
Совершенно другая картина с автоматическим аналогом этого параметра (автоматически проверяется наличие телефона с кодом региона 800 на найденной странице). Парадоксальным образом его значения заметно выше, чем для «ручного» параметра. Для обеих поисковых машин есть и связь с попаданием в топ-30, и корреляция с позицией — правда, не очень сильная, но если смотреть только на агрегаторы, она усиливается. Аналогичная ситуация, кстати, с телефонами на странице: при автоматическом определении их оказывается намного больше, чем «видят» асессоры. Разгадка в том, что автомат реагирует преимущественно не на контактный телефон сайта или стоящей за ним компании (как это делают асессоры), а на телефоны владельцев недвижимости, которая представлена на сайте. Напомним, что в результатах поиска по риелторским запросам преобладают агрегаторы, которые чаще публикуют контактные данные своих клиентов, чем свои собственные.
То есть преимущество в поиске получают не те агрегаторы, у которых есть телефон на сайте или странице, или у которых этот телефон бесплатный для клиентов, — а те, которые включают в карточки объектов недвижимости номера телефонов (особенно если среди этих телефонов есть начинающиеся с 8-800).


Заказ обратного звонка, как и номер 8-800, дает преимущество тем, кому дорого звонить, — т. е. прежде всего иногородним клиентам. Довольно сомнительное преимущество — но для сайтов по недвижимости (как, впрочем, и для других выборок) «работает». В Яндексе видна корреляция с позицией, а для агрегаторов и связь с попаданием в топ; в Google — связь с попаданием в топ, а для агрегаторов и корреляция с позицией.
А вот для онлайн-консультанта (и автоматически определяемой формы чата) на нашей выборке связи с ранжированием не видно. Впрочем, и на общей выборке корреляции с позицией нет, а видна только связь с попаданием в топ-30 в Яндексе (где онлайн-консультант при определенных условиях показывается прямо в результатах поиска). На выборке по недвижимости значения этих параметров выше в Google — скорее всего потому, что в результатах поиска Google меньше агрегаторов.

Представление объектов недвижимости
Слабость параметров, связанных с присутствием в регионах и контактными данными, компенсируется в сфере недвижимости большей значимостью параметров, связанных с представлением предлагаемого «товара» — объектов недвижимости.
Здесь значения параметров близки к максимальным, а связь с ранжированием обычно сильнее, чем на общей выборке.
Так, описание «товаров» и в Яндексе, и в Google есть почти в 100% случаев, и при этом сохраняется корреляция с позицией. Фотографии есть практически всегда, и даже несколько фотографий на предложение предусмотрены в 98% случаев в Яндексе и в 94% в Google (против 72-73% на общей выборке).
Казалось бы, совсем небольшая разница между выборкой по недвижимости и общей выборкой — всего 1-2 процентных пункта, 99% против 98% или 97% — на самом деле означает сокращение доли сайтов выборки без соответствующего свойства в два-три раза. Чем ближе мы к 100%, тем тяжелее даются оставшиеся единицы процентов. В этой зоне статистические методы могут уже не показывать разницы (или показывать слабо), однако влияние на ранжирование при этом может быть решающим: сайт без свойства просто не имеет шансов пролезть в топ.
Характеристики предлагаемых объектов присутствуют почти всегда; в Яндексе есть сильная связь с попаданием в топ-30 и в обоих поисковиках — корреляция с позицией. Подбор по параметрам есть чуть реже, но тоже очень часто: 97% в топ-30 Яндекса и 93% в Google; и там, и там — сильная корреляция с позицией и связь с попаданием в топ. А вот сравнение предлагаемых объектов встречается гораздо реже — всего примерно в 20% случаев. Но это тоже очень сильный параметр, особенно в Яндексе.

Доля сайтов, на которых есть сравнение предложений по параметрам, растет при приближении к топ-1... но, достигнув максимума на третьей позиции, на второй и особенно на первой резко падает. Этот парадокс объясняется просто. Иметь на сайте сравнение предложений полезно для ранжирования, но если этот сайт — Cian.ru или Avito (именно они чаще всего встречаются на первых позициях), то он вполне может обойтись и без сравнения.
Мы долго сомневались, упоминать ли среди сильных параметров наличие на сайте калькуляторастоимости недвижимости с рекордной корреляцией с позицией в Яндексе 0,59. Дело в том, что калькулятор вполне уместен на сайте застройщика (определить цену квартиры и т. п. в зависимости от метража, планировки, этажа и других условий), а на сайтах агентств и агрегаторов вроде бы и не нужен, хотя иногда встречается и там. При отсутствии калькулятора асессоры часто ставили оценку «неактуально», а при наличии, естественно, «да» (калькулятор есть) — и результаты получились не вполне объективными. Автоматический параметр калькулятор в интерфейсетоже демонстрирует и сильную связь с попаданием в топ, и сильную корреляцию с позицией в обоих поисковиках, хотя и показывает более скромные результаты. Зато его объективность не вызывает сомнений.

Цены, скидки, оплата и др.
Цены на сайте есть практически всегда, на странице — у 97% сайтов, попавших в топ-30 Яндекса, и у 90% — в Google. Автоматическая проверка наличия цен на странице дает меньшую полноту, но зато очень сильную корреляцию с позицией и связь с попаданием в топ в обеих поисковых машинах. О том, что такая же ситуация и с количеством цен на странице, мы выше уже упоминали.
Как и в случае с автомобилями, поисковики не гонятся за дешевизной: какую бы цену мы ни взяли —минимальную, медианную, среднюю или максимальную — в топ-30 Яндекса и Google она выше, чем в фоне, а внутри топа растет при приближении к первой позиции.
Несмотря на то, что уровень цен может быть высоким, акции, скидки, спецпредложения очень желательны — на сайтах, попавших в топ-30 по недвижимости, они встречаются примерно в 80% случаев. Это, правда, меньше, чем в других отраслях (электронная коммерция, автомобили) и на сайтах из общей выборки, но зато на сайтах из первой тройки спецпредложения есть в 97-98% случаев. Параметр в обеих поисковых машинах довольно сильный: есть и связь с попаданием в топ-30, и корреляция с позицией.
На найденной странице спецпредложения присутствуют заметно реже — менее чем в 40% случаев. Несмотря на то, что сайты первой тройки в этом отношении отстают, для этого параметра в обоих поисковиках также есть и связь с попаданием в топ, и корреляция с позицией.

Другие коммерческие факторы
Параметры, имеющие отношение к контенту, обычно важны для сайта в целом, но не для конкретной найденной страницы — там ничего такого обычно нет. Такая ситуация со справочными материалами, ответами на вопросы, а также с видео, отзывами, представлением специалистов компании.
Упомянем здесь для полноты картины несколько групп параметров, для которых внятной картины не получается — по-видимому, они для недвижимости (по крайней мере, для преобладающих в этой сфере агрегаторов) не слишком актуальны:
- «кнопка заказа» (возможность выполнить действие, направленное на получение товара или услуги);
- оплата, оплата картой и др.
- гарантия;
- доставка;
- список услуг компании;
- сертификаты, лицензии, награды.

Что делать
- Расширять ассортимент, увеличивать количество предложений на «витрине» — благо в случае недвижимости это можно сделать за счет вариантов имеющихся предложений.
- Чем подробнее представление объектов недвижимости и больше возможностей для их подбора и сравнения, тем лучше.
- Подбор по параметрам — необходимый функционал, сравнение различных предложений и калькулятор — очень желательный.
- Цены необходимо показывать. Они не обязательно должны быть низкими, но очень желательно демонстрировать готовность идти навстречу покупателю, анонсируя акции и скидки.
- На сайте (но не обязательно на каждой его странице) полезно иметь видео, отзывы, справочные материалы и ответы на вопросы.
Трафиковые, ссылочные и другие факторы
Несколько вроде бы разнородных групп факторов — трафиковые, ссылочные, социальные и некоторые технические — демонстрируют похожую и уже знакомую нам по другим отраслям картину, характерную для выборок с сильным расслоением, где первые позиции часто принадлежат одним и тем же крупным сайтам.
В отличие от коммерческих и (отчасти) текстовых параметров, здесь очень мало отраслевой специфики. Побеждают сильнейшие — и эти сильнейшие часто оказываются первыми сразу по множеству параметров. У них больше накопленная ссылочная масса, больше ссылок из соцсетей, они в среднем старше и просто больше — по количеству страниц вообще и страниц, релевантных запросу. У них лучше поведенческие факторы, выше ранги и больше трафик.
Это запускает положительную обратную связь, которая закрепляет статус-кво. Чем выше сайт в результатах поиска, тем больше у него трафик — прежде всего поисковый, но не только. Чем больше посетителей, тем больше на него ставят ссылок, делятся им в соцсетях и т. д. И тем больше сайт зарабатывает — что позволяет находить ресурсы на дальнейший рост и улучшение поведенческих факторов.
В результате выдача оказывается монополизированной: по самым разным запросам наверху оказываются одни и те же очень крупные сайты, а у сайтов поменьше шансы есть только по нишевым запросам, которые «крупняку» по тем или иным причинам менее интересны.
Безусловный лидер по видимости — сайт Cian.ru. Он попадает в топ-30 по 246 запросам из 300 в Яндексе и по 252 — в Google, со средней позицией... 1. То есть в 80% случаев — по-видимому, просто всегда, когда на Cian.ru есть релевантная страница, — к первой позиции «прибит гвоздями» один и тот же сайт.
Следом за Cian.ru в Яндексе идут Avito (285 запросов, средняя позиция 3; в Google 216 и 6 соответственно) и Яндекс.Недвижимость (277 запросов, средняя позиция 4, в Google 236 и 7). Понятно, что во многих случаях первая тройка именно из этих трех сайтов и состоит. В Яндексе есть еще одиннадцать, а в Google — семь сайтов, которые попадают в топ-30 более чем по половине из наших 300 запросов, но у них средние позиции в выдаче уже не такие высокие.
Для недвижимости в большей степени, чем для других отраслей, характерен контраст между очень высокими значениями многих параметров в первой десятке (и особенно тройке) и значительно более низкими и медленно падающими их значениями в оставшейся части результатов поиска. Параметры рассматриваемых групп получаются очень сильными — но их сила в большой мере определяется весом лидирующих сайтов, оторвавшихся от «пелотона». Эффект усиливается тем, что мы смотрим на все коммерческие сайты вместе, без разделения по типам.
Икс и трафиковые параметры
Мы традиционно начинаем раздел про трафиковые факторы с «индекса количества качества сайта» (написать без кавычек рука не поднимается), который, как известно, имеет самое прямое отношение к посещаемости: по Яндексу, качество сайта меряется в первую очередь размером аудитории. Параметр очень сильный — в обоих поисковиках сильны и связь с попаданием в топ, и корреляция с позицией.
Такая же ситуация и с другими трафиковыми параметрами: с рангами — Alexa Rank и всеми вариантами рангов от SimilarWeb: Global Rank, Country Rank, Category Rank; с количеством посещений сайта и любыми его «срезами» — например, из поиска, по ссылкам, из почты, из соц- сетей, с рекламы (display) или прямых переходов.
В Яндексе трафиковые параметры сильнее, чем в Google: выше коэффициенты корреляции с позицией и больше контраст между значениями для топ-30 и фона. По-видимому, это связано с большей степенью монополизации первых позиций в выдаче крупными сайтами.

Посещения из соцсетей (по данным SimilarWeb): средние значения по позициям в топ-30 Яндекса и Google. Очень высокие коэффициенты корреляции у трафиковых параметров, особенно в Яндексе, определяются тем, что первые несколько позиций по большинству запросов заняты крупнейшими сайтами. При этом максимальные значения параметра — не на первой позиции, которую фактически монополизировал Cian.ru, а на второй: в Яндексе за нее обычно конкурируют Яндекс.Недвижимость и Avito.ru, в Google разнообразие немного больше.

Структура трафика и поведенческие параметры
Параметры, связанные со структурой трафика, и поведенческие параметры в обеих поисковых машинах также весьма сильные — и тоже в большой мере благодаря крупным сайтам, имеющим по ним хорошие показатели.
Несмотря на то, что больше половины трафика на сайты топ-30 приходит из поиска, доля поискового трафика в Яндексе — сильный «обратный» параметр. Если смотреть только на агрегаторы, то в Яндексе этот параметр еще заметно усиливается, а в Google — становится сильным.
Доля прямых переходов в топ-3 Яндекса превышает одну треть: 34% против 20% на общей выборке (и 23–24% в оставшейся части топ-30). Cian.ru и другие сайты, занимающие верхние позиции, действительно имеют свою собственную аудиторию! Доля других источников трафика —соцсети, почта, реклама (display) — ниже, но корреляции с позицией в обоих поисковиках еще сильнее. Для всех этих параметров корреляция с позицией выше в Яндексе, и в обеих поисковых машинах она заметно возрастает, если смотреть отдельно на агрегаторы. Исключение — доля переходов по ссылкам: здесь корреляции с позицией не видно.
Аналогичная картина — и с имеющимися в нашем распоряжении поведенческими факторами: количество просмотренных страниц за посещение, продолжительность посещения, процент отказов. Здесь в Яндексе очень высокие коэффициенты корреляции с позицией, а в Google — чуть ниже; коэффициенты корреляции увеличиваются, если смотреть отдельно на агрегаторы.

Ссылочные параметры
Со ссылочными параметрами — ничего необычного.
- И в Яндексе, и в Google они заметно сильнее, чем на общей выборке — что не удивительно, если учесть, что первая тройка в обоих поисковиках «захвачена» крупными сайтами.
- В Google немного сильнее, чем в Яндексе.
- Для Google важны как ссылки на сайт, так и ссылки на страницу (но корреляции с позициейу страничных параметров слабее).
- Для Яндекса, похоже, важны только ссылки на сайт. Это, в принципе, нормально — хотя на автомобильной выборке мы видели другую картину.
Из разных способов считать ссылки — по количеству ссылающихся доменов, уникальных ссылок, количеству ссылающихся страниц, суммарному LinkRank — в Яндексе с небольшим отрывом «побеждают» домены, а в Google (правда, с еще меньшим отрывом) — LinkRank.
Долю ссылок на главную страницу сайта можно считать косвенным показателем качества ссылочной массы: чем она меньше, тем лучше. Наша выборка по недвижимости по этому параметру — едва ли не рекордсмен, и главные герои здесь, как всегда, — Cian.ru и другие крупные сайты, прочно занимающие первую тройку результатов, особенно в Яндексе. Значение для топ-3 в Яндексе — 9% (на общей выборке 33%), для топ-30 — 24% (на общей выборке 38%).
К сожалению, несмотря на очень сильные корреляции с позицией в обоих поисковиках и не менее сильную связь с попаданием в топ-30 в Яндексе (в Google она тоже есть, но контраст между топ-30 и фоном гораздо слабее), мы не можем утверждать, что этот параметр учитывается при ранжировании. Дело тут не только в том, что лидирующая группа сайтов опережает все остальные сайты, попавшие в поиск, и по множеству других параметров. В нашей выборке очень много агрегаторов, а у них доля ссылок на главную страницу обычно сильно ниже, чем у сайтов «продавцов» и «производителей».
Для ссылочно-текстовых параметров верно всё перечисленное выше про ссылочные параметры. Кроме того, действует принцип антибуквализма: количество отдельных слов запроса, входящих в текст ссылок, (а также их синонимов и слов, выделяемых поисковиками в снипетах наряду со словами запроса), важнее, чем количество входящих в них точных (или даже неточных) запро- сов. См. ниже таблицы для ссылочно-текстовых параметров и диаграммы для двух из них — по словам запроса в ссылках на сайт и на отдельную страницу.
Мы условно считаем «SEO-ссылками» все ссылки с доменов, когда-либо замеченных в размеще- нии ссылок за деньги — например, в участии в ссылочных биржах. Несмотря на то, что наш способ деления ссылок на «серые» и «белые» далек от совершенства, видно, что разница между ними важна. Для «серых» ссылок в Яндексе коэффициенты корреляции сильно ниже, а в Google — просто ниже, чем для всех ссылок без разделения на два класса. Наоборот, параметры для«белых» ссылок сильнее, чем для всех ссылок.


Соцсети
Наличие групп в соцсетях, а также по отдельности группы в Facebook, ВКонтакте, в Твиттере, в «Одноклассниках», страницы в Инстаграммеи канала на Youtube — сильные факторы в обеих поисковых машинах.
В Яндексе выше коэффициенты корреляции с позицией, зато в Google сильнее связь с попаданием в топ-30 — выше контраст между топ-30 и фоном. Из всех соцсетей, если судить по коэффициентам корреляции, важнее всего группы в Facebook и ВКонтакте, а в Яндексе также группа в «Одноклассниках» и канал на Youtube; наименее важен Твиттер.
Как обычно на нашей выборке, большой вклад в коэффициенты корреляции и даже в средние значения по топ-30 вносят крупные сайты, занимающие верхние позиции в выдаче поисковиков. И трудно оценить, что первично: группы в соцсетях помогают этим сайтам высоко ранжироваться, или, наоборот, то, что у этих сайтов есть группы в соцсетях, помогает социальным параметрам быть сильными.
Ссылки «Поделиться» на сайте — в целом и по отдельности в Facebook, ВКонтакте, в «Одноклассниках», в Твиттере — тоже сильные параметры в обоих поисковиках. Только в этом случае коэффициенты корреляции немного выше в Google, а в Яндексе больше контраст между топ-30 и фоном. Из конкретных соцсетей сильнее Facebook и ВКонтакте, а Твиттер слабее всех (даже «Одноклассников»).
При этом если ссылки «Поделиться» встречаются примерно на 80% сайтов, найденных по нашим запросам, то непосредственно на найденных страницах они есть всего примерно в 15% случаев, а в топ-3 — в 2-3%. Не удивительно, что для ссылок «Поделиться» на странице видна обратная корреляция с позицией. Получается, что при «витринах» с объектами недвижимости ссылки на группы в соцсетях нужны, а ссылки «Поделиться» — не очень.
Еще один сильный параметр, опирающийся на «топовые» крупные сайты, — наличие микроразметки Open Graph, предназначенной для оптимизации представления страницы в соцсетях. Интересно, что разметка присутствует и на тех страницах, которые (судя по отсутствию на них ссылок «Поделиться») для выкладывания в соцсети не предназначены.
Количество «шеров» страницы ВКонтакте и в «Одноклассниках» (для других соцсетей разумных данных получить не удается) — параметры весьма слабые: корреляции с позицией есть, но сильными их не назовешь.

Некоторые технические параметры
Среди технических параметров достаточно таких, которые характерны для крупных и/или хорошо оптимизированных сайтов. На нашей риелторской выборке они сильнее, чем на большинстве других.
Параметры, связанные с возрастом сайта — возраст домена и возраст по упоминаниям на Archive.org — ожидаемо сильны (в Google немного сильнее, чем в Яндексе): в обеих поисковых машинах сильная связь с попаданием в топ-30 и высокая корреляция с позицией. Средний возраст домена в топ-30 Google — 12,6 лет (в Яндексе просто 12), в топ-3 — 13,8 (в Яндексе 13,9).
Переход к защищенному протоколу https обычно ассоциируется в первую очередь с Google, однако доля сайтов с https немного выше в Яндексе; в обоих поисковиках есть связь с попаданием в топ-30 (контраст с фоном сильнее также в Яндексе) и сильная корреляция с позицией (и там, и там коэффициент корреляции 0,21).
Поисковые машины рекомендуют добавлять на сайт микроразметку — и крупные сайты этой рекомендации следуют. Наличие микроразметки Schema.org — сильный параметр и в Яндексе, и в Google (в Яндексе немного сильнее). И там, и там сильная связь с попаданием в топ-30 и коэффициент корреляции 0,20.
В мобильной выдаче процент страниц с адаптивной версткой в обоих поисковиках выше 90%, в первой тройке — почти 100%. Есть корреляция с позицией, а в Яндексе — и связь с попаданием в топ-30. В десктопной выкачке страниц с адаптивной версткой детектируется меньше — но, похоже, это объясняется скорее трудностями ее распознавания, чем реальным отсутствием: десктопные и мобильные результаты поиска не совпадают, но отличаются друг от друга не очень сильно.
Сайтам выгодно иметь большие «витрины»; см. выше о количестве цен на странице и ниже — о текстовом ранжировании. Не удивительно, что параметры, связанные с размером страницы —размер HTML-кода и текста — сильны и в Яндексе, и в Google.
Было бы странно, если бы при этом страницы из первой тройки загружались быстрее, чем страницы из «хвоста» топ-30. И действительно — время загрузки страницы в обеих поисковых машинах положительно коррелирует с позицией (чем ближе к первой позиции, тем больше время загрузки), а страницы из топ-30 загружаются дольше, чем страницы из фона. Правда, всё это в пределах одной секунды (но оценивается загрузка только чистого кода, без картинок и т. п.)

Что делать
- Расти большими. Использовать любые доступные источники трафика. Увеличивать долю трафика из непоисковых источников (прямые переходы, соцсети и др.)
- Работать над поведенческими факторами: добиваться увеличения глубины просмотра и продолжительности посещений.
- Наращивать ссылочную базу. Для Яндекса важны ссылки на сайт, для Google — и ссылки на страницу.
- Иметь группы в соцсетях, микроразметку Open Graph для соцсетей, ссылки «Поделиться» на текстовых страницах.
- Https, микроразметка, адаптивная верстка — всем этим не стоит пренебрегать.
- Не нужно любой ценой сокращать время загрузки — поисковики не имеют ничего против больших страниц.
Текстовые факторы
Текстовое ранжирование, лежащее в основе всякого ранжирования, на разных выборках выглядит немного по-разному, но при этом подчиняется одним и тем же закономерностям.
Вынуждены заранее извиниться перед теми, кто читал наши предыдущие аналитические отчеты: поскольку эти закономерности не меняются, нам поневоле приходится повторяться.
За текстовое ранжирование у нас отвечает примерно половина всех параметров — около трехсот! Многие из них представлены в сводных таблицах, приведенных в конце этого раздела. Рекомендуем перед чтением раздела на них взглянуть — они дают хорошее представление об общей картине текстового ранжирования.
Строки этих таблиц — зоны документа, для которых оценивается связь между наличием слов запроса и т. п. и ранжированием. Сравнивая строки, можно оценить значимость различных зон для ранжирования. Столбцы соответствуют разным способам подсчета количества вхождений запроса и связанных с ним слов в документ. Справа налево — от самых жестких (запрос в точной форме) до самых мягких (слова запроса «россыпью», с учетом слов, выделенных в снипетах). Как обычно, иконки с двумя столбиками показывают силу связи с попаданием в топ-30 (если она есть), иконки с «трапециями» — силу корреляции с позицией (мы также приводим под каждой из них коэффициент корреляции).
Напомним здесь основные закономерности текстового ранжирования:
- в Яндексе для текстовых параметров чаще видна связь с попаданием в топ, а в Google — корреляция с позицией;
- слов запроса в тексте должно быть много — по крайней мере для конкурентных запросов;
- «принцип антибуквализма»: чем дальше от точного запроса, тем сильнее параметры;
- кроме текста страницы и <title>, могут быть важны и другие зоны — но значение некоторых из них часто преувеличивают;
- Яндекс научился игнорировать SEO-тексты, Google учится.
Яндекс vs. Google
В Яндексе значения основных текстовых параметров — например, количества вхождений слов запроса в текст страницы — для топ-30 обычно сильно отличаются от их значений для фона, и этот контраст обычно сильнее, чем разброс их значений внутри топ-30 (например, между первой тройкой и третьей десяткой).
Наши данные по общей и другим выборкам позволяют выдвинуть гипотезу (и данные по недвижимости ей не противоречат), что в Яндексе учет текстовых факторов осуществляется в основном на предварительном этапе ранжирования.
Формулы ранжирования современных поисковых машин очень сложны. Даже на мощных серверах и при многопоточной обработке успеть применить полную формулу ранжирования к миллионам страниц, поднятых из индекса по короткому запросу, — практически нереально. Поэтому обычно ранжирование разбивают на несколько этапов. Сначала выполняется предварительное ранжирование по упрощенной — и потому гораздо быстрее вычисляемой — формуле. Таким образом отбирается ограниченное количество — порядка тысячи — страниц, к которым уже и применяется окончательное ранжирование по полной формуле. Именно поэтому, кстати, количество результатов поиска по запросу, которые можно получить, подгружая страницы выдачи одну за другой, ограничено примерно тысячей сайтов.
В Google, наоборот, обычно велик разброс между значениями основных текстовых параметров между «головой» и «хвостом» топ-30, что обеспечивает очень сильные корреляции с позицией. При этом значения для топ-30 часто ниже, чем для фона — а если и выше, то не сильно.
Это не значит, что в Яндексе не бывает корреляции текстовых параметров с позицией, а в Google — связи с попаданием в топ. На нашей выборке по недвижимости представлено и то, и другое, но корреляции с позицией в Яндексе обычно слабее, чем в Google, а связь с попаданием в топ в Google слабее, чем в Яндексе.

Количество вхождений
Если в Яндексе текстовые факторы действительно, как мы предполагаем, играют важную роль в предварительном отборе кандидатов на окончательное ранжирование, то получается, что у страниц, содержащих недостаточно вхождений запроса (или слов запроса), высок риск остаться за бортом, даже если с другими факторами ранжирования у них всё хорошо. Они могут не пройти конкурс на предварительном этапе, и при окончательном ранжировании их многочисленные достоинства уже не будут замечены — просто потому, что они не примут в нём участия.
А «достаточно» вхождений — это сколько?
Разумеется, для разных запросов по-разному, но в среднем довольно много. Например, по запросу новостройки Мытищи в тексте половины найденных Яндексом страниц слова запроса содержатся в количестве, эквивалентном 27,7 запросам или больше (это медиана значения параметра для топ-30 по этому запросу). Всего на четырех из тридцати найденных страниц слов запроса набирается меньше, чем на 15 запросов; всего на одной (с сайта Avito.ru) — меньше, чем на 10.
Среднее количество слов запроса (в пересчете на запросы) на нашей выборке составляет 33,6. Мы рекомендуем ориентироваться не на средние значения, а на медианы (как в примере выше) — но результат получается лишь немногим меньше: в среднем по запросам выборки 27,7, как раз как в нашем примере.
Если смотреть на вхождения в текст страницы слов запроса с учетом синонимов, пороги для попадания в топ-30 оказываются еще выше — среднее по выборке 45, усредненная медиана — 36,8. Это меньше, чем для общей выборки и для электронной коммерции, но всё равно много.
Список коммерческих предложений (то, что мы называем витриной) с таким количеством слов запроса может выглядеть естественно, а вот связный текст — вряд ли.

Принцип антибуквализма
Поисковые машины давно ушли от прямой оценки релевантности страниц запросу по количеству вхождений «ключевиков». Их многократное повторение в тексте страницы, особенно в точной форме, уже не помогает ранжированию и к тому же может быть воспринято поисковой машиной как переспам.
Для точного запроса, запроса с точностью до словоформ, даже «неточного запроса» (все значимые слова из него недалеко друг от друга) сила текстовых параметров невелика — а часто связи с ранжированием просто нет или она отрицательная. Связь с ранжированием сильнее для слов запроса вразбивку, и часто повышается еще больше, если учитывать слова, связанные с запросом, но не входящие в него — например, синонимы слов запроса или слова, выделяемые в снипетах. Возможно, какие-то еще группы слов (или, например, «вектора») также важны, но у нас пока нет соответствующих параметров.
Во всяком случае, идея, что может быть полезно иметь в тексте слова и выражения, которые часто встречаются на страницах из топ-10, (и вредно — слова, которых там нет), — представляется не лишенной оснований.
На нашей выборке по недвижимости принцип антибуквализма выражен очень сильно, особенно в Яндексе, — аналогичную картину мы уже видели в таблицах по ссылочно-текстовым параметрам, см. выше. Так, для текста страницы сильная связь с попаданием в топ в Яндексе и сильная корреляция с позицией в Google есть только начиная с вхождений отдельных слов запроса.
Уже для неточного запроса сколько-нибудь сильной связи с ранжированием не видно, и при этом резко падает количество вхождений. В Яндексе среднее значение по нашей выборке — 2,76, усредненная медиана — всего 1,16, а для неточного запроса с учетом синонимов — 4,8 и 2,66 соот- ветственно.
Есть, правда, одно важное исключение из принципа антибуквализма, а заодно и принципа, согласно которому в Google связь текстовых параметров с ранжированием проявляется обычно в форме корреляции с позицией. Вхождения точного запроса в <title> в Google обычно сильно связаны с попаданием в топ. На нашей выборке по недвижимости связь с попаданием в топ есть не только для точного запроса, но и для запроса с точностью до словоформ, и даже для неточ- ного запроса, а также для точного запроса в <h1>. В Яндексе же на выборке по недвижимости сильная связь с попаданием в топ-30 для <title> видна только для параметров, учитывающих синонимы и слова, выделенные в снипетах.

Текст, заголовки, далее, везде
Текст страницы и <title>, очевидно, очень важны для текстового ранжирования, но ими оно не ограничивается. Есть ряд дополняющих их зон (доменное имя и URL, meta descriptionи keywords, атрибуты alt и title) и ряд зон, часто выделяемых внутри текста страницы (заголовки, жирный шрифт и курсив, элементы списков, ссылки), про которые тоже важно понимать, участвуют ли они в ранжировании.
Вхождения слов запроса в доменное имя (отдельно или с учетом синонимов) демонстрируют корреляцию с позицией в Google и связь с попаданием в топ в Яндексе. Несмотря на то, что статистика по Яндексу выглядит не слишком убедительной (8% по топ-30 против 6% в фоне, при этом в топ-3 — всего 5%), кажется всё-таки, что доменные имена очень важны. Прежде всего, топ-3 Яндекса почти полностью захвачен крупными сайтами — и если туда попадают хоть какие-то говорящие домены, то это для них — невероятный успех, которого никакими другими средствами добиться бы, скорее всего, не получилось. Например, по запросу купить лофт после неизбежного Cian.ru следуют сайты KupiteLoft.ru и Loft-Catalog.ru.
Если вхождений слов запроса в доменные имена — как обычно, в пересчете на целые запросы — 6% в Яндексе и 4% в Google, то вхождений в URL вне доменной зоны — на порядок больше: 53% и 47% соответственно (а в топ-3 — 65% и 61%). В Яндексе сильная связь с попаданием в топ- 30, в обоих поисковиках — сильная корреляция с позицией. В общем, ЧПУ («человекопонятные URL») работают.
Представление об остальных зонах легко составить по таблицам, приведенным ниже. Вот некоторые наблюдения.
- В отличие от некоторых других выборок (включая общетематическую), заголовки <h1> в Яндексе на выборке по недвижимости сильнее связаны с ранжированием, чем заголовки более низких уровней (<h2>–<h4>). В Google, в принципе, тоже — но здесь связь с ранжированием для обеих групп параметров слабая.
- Важны вхождения во внутренние ссылки — группа параметров, ассоциируемых с «витриной» и с блоком страниц, подчиненных данной.
- Для вхождений в элементы списков <li> в Яндексе видна сильная связь с попаданием в топ-30; в то же время в Google для большинства параметров этой группы связи с ранжированием не видно.
- Важны вхождения в meta description, но не в keywords.

SEO-текст и «текстовые фрагменты»
Самый большой текстовый блок на странице (выделяется автоматически) часто содержит SEO- текст — высокооптимизированный текст, предназначенный в первую очередь для поисковых машин. Яндекс не без оснований считает, что SEO-тексты используются для манипулирования выдачей, и борется с ними — в частности, в 2017 году был введен фильтр «Баден-Баден», наказывающий за плохое качество текстов понижением в результатах поиска. Поэтому интересно посмотреть, как связаны с ранжированием а) SEO-текст; б) часть текста за вычетом SEO-текста, которую часто условно называют «текстовыми фрагментами», поскольку это текст из описаний товаров или услуг на «витрине» и различных небольших текстовых блоков.
На нашей риелторской выборке результаты для SEO-текста резко отличаются от результатов для текста в целом, причем не только в Яндексе, но и в Google: связи с попаданием в топ-30 не видно; наблюдаются сильные обратные корреляции с позицией — чем ближе к топ-1, тем ниже значения параметров. Наоборот, для части текста за вычетом самого большого текстового блока многие параметры в обеих поисковых машинах усиливаются по сравнению с аналогичными параметрами для текста в целом.
Однако в данном случае не стоит торопиться с выводом, что не только Яндекс, но и Google считает SEO-тексты вредными и учитывает их «с обратным знаком», а текстовым фрагментам придает больший вес. Для нашей выборки есть более прозаическое объяснение наблюдаемой картины — в том числе и обратных корреляций в Google.
Дело в том, что размер SEO-текста при приближении к первой позиции быстро падает.

Отчасти это объясняется тем, что на сайтах агентств и застройщиков, которых больше в «хвосте» топ-30, тексты в среднем длиннее, чем у агрегаторов; однако и на сайтах агрегаторов объем SEO-текстов с позицией растет. Если концентрация слов запроса примерно одинакова, то в более длинном тексте их поместится больше — отсюда и обратные корреляции количества вхождений слов запроса и т. п. с позицией.





Что делать
- Слов запроса на странице должно быть не меньше, чем у большинства конку- рентов. При этом наличие в тексте запросов целиком менее важно.
- Если для вас важно продвижение в Google, в <title> должны быть запросы, по которым продвигается страница, причем желательно в начальной форме.
- Если домен вашего сайта говорящий — это ваш шанс; постарайтесь его не упустить.
- Чем меньше на странице SEO-текста, тем лучше. Текстовая релевантность должна достигаться прежде всего за счет «витрины» — в данном случае, за счет анонсов описаний объектов недвижимости.
Общие выводы:
Недвижимость — очень трудная тематика для поискового продвижения. Здесь впереди сайты, у которых всё хорошо — и со ссылками, и с ИКСом, и с поисковым трафиком, и с непоисковым, и с поведенческими параметрами, и с ассортиментом, и с текстами, и даже с возрастом домена.
Эти сайты — агрегаторы, и если у вас, например, агентство недвижимости или вы сами — застройщик, то, возможно, следует думать в первую очередь не о том, как их обогнать, а о том, как сделать, чтобы ваши объекты недвижимости были у них достойно представлены. Но это уже совсем другая тема.
В любом случае, если вы продвигаете сайт, имеющий отношение к недвижимости, вам нужно не забыть о следующем.
- Найдите те ниши и поисковые запросы, по которым конкуренция ниже или у вас есть серьезные козыри — например, ваше доменное имя.
- Расширяйте ассортимент, который видят пользователи и поисковые машины. Это можно сделать не только в ширину, но и в глубину, представив те объекты, которые у вас есть, более подробно и всесторонне.
- У каждого предложения должна быть своя полноценная страница, они должны быть собраны в разделы, и так далее. Витрина вашего «магазина недвижимости» должна быть большой и яркой. Товар на ней не должен быть дешевым, но обязательно нужны акции и спецпредложения.
- Не гонитесь за вхождениями ключевиков, но слов запроса и связанных с ним слов на странице (и на сайте) должно быть много. Причем не в SEO-тексте (которого как раз должно быть мало), а в представлении объектов недвижимости на вашей витрине. Впрочем, в <title> ключевики как раз нужны — для Google.
- Https, «человекопонятные URL», адаптивная верстка, несколько фотографий на предложение, отбор по характеристикам и сравнение вариантов, калькулятор, видео, отзывы, микроразметка, активные группы в соцсетях — всё это или необходимые, или просто очень полезные вещи.