Сайты на копипасте по nopyx ;)

  • спарсить унылых конкурентов;
  • добавить к статьям видосики найденные по главному ключу этих статей;
  • добавить галерею картинок;
  • оформить цветные списки (автоматом);
  • сделать нормальное юзабилити\читабельность самого тела статьи (нормальный шрифт, нормальны дизайн);
  • и все это еще хорошо полить знатной тизерной перелинковкой в стиле relap.io;
  • добавить disqus/cackle/hypercomments;
  • дополнить табличками по теме;
  • добавить немного ссылок на трастовые сайты.

Рецепт копипаста 2018

  • Берем некую нишу Х, собираем всех лидеров ниши, парсим их, получаем около 1 млн. документов-статей, удаляем мусор (короткие статьи, статьи в которых менее 3-х изображений и т.п.).
  • К каждой статье на автомате подбираем 5-6 картинок и несколько ютуб роликов (поиск по заголовку).
  • Заводим пару сотню .RU’шек и рандомно накидываем на каждую по 10-50к статей из этой выборки.
  • Все это загоняем в твиттер и гугл+, наблюдаем…
  • После входа в индекс рандомно перелинковываем документы между площадками (не более 2-3 ссылок со страницы), идеальнее, если организовать полнотекстовый поиск по заголовку страницы по всем документам всех площадок.
  • = профит.

Примерно треть площадок войдут в индекс на 80-90%, еще треть площадок войдет в индекс на 1-2 тыс. страниц, ну и треть будет забанена.

Ответы на «как» вопросы:
1) ускорить индексацию и повысить её полноту
2) обойти оригинал документа в выдаче
3) перелинковывать доры между собой, чтобы не словить фильтры
4) хостить такие массивные вещи и при этом не тратить много денег

ПС выделяют на хост определенные баллы «ценности» хоста, чем меньше вы тратите эти баллы, тем более лояльна ПС к вашему хосту. Т.е. грубо говоря, краулеры ПС могут тратить на обработку вашего хоста ограниченное количество времени\ресурсов. Чем больше документов лопает краулер за 1 секунду, тем быстрее и полнее пройдет индексация, от скорости и полноты индексации зависит выживаемость хоста в целом

Прогони статьи через твиттер и они через АП буду в индексе.

Оцените, пожалуйста, статью, я старался :)

Задайте вопрос в комментариях

1 × четыре =