Как grab(ят) наши сайты

Для копирования контента вашего сайта могут использовать как ридеры, так и специальные грабберы.

Reader

Ридер уберет лишние элементы страницы html: меню, сайдбар, рекламу, кнопки, ссылки, комментарии и пр., останется выделить все и перетянуть в визуальный редактор WordPress (или войти в режим «Просмотр кода страницы» и скопировать оттуда html-код).

Расширения для Google Chrome добавляющее Reader:

Reader View — не убрал похожие статьи, в режиме «Просмотр кода страницы» не видно исходного кода — приходится сохранять в html и открывать этот документ, но смог наиболее чисто транслировать таблицу из Tablepress в html.

Just Read — не убрал меню, содержание, похожие статьи, комментарии, футер, смог транслировать таблицу из Tablepress в html.

Clearly — не убрал похожие статьи, смог транслировать таблицу из Tablepress в html.

    Основные недостатки всех ридеров:

  • содержимое страницы приходится выискивать среди исходного кода страницы;
  • картинки, которые загружаются в нескольких разрешениях, так и есть в коде несколькими файлами.

В браузер Firefox ридер встроен по умолчанию, называется «Вид для чтения», включается клавишей F9.

Плагин Wpgrabber

WPGrabber

Плагин WPGrabber импортирует контент с любого HTML-сайта, RSS-потока, со стен групп и сообществ ВК. Благодаря гибким настройкам обработки автоматически удаляются ненужные блоки информации, ссылки и картинки. Поддерживает режим автоматической работы обновления с другими сайтами.

Может использоваться журналистами для постинга записей с различных источников в черновики для последующего рерайта и публикации на своем сайте.

    Официальная версия плагина прекратила поддержку в 2016 году и в настоящее время плагин продолжают разрабатывать и поддерживать две команды:

  1. wpgrabber.ru.com — здесь бесплатно можно скачать актуальную версию. Или воспользоваться версией с синономайзером, которую на основе этого плагина сделали партнеры textorobot.ru
  2. wpgrabber.su — версию с приставкой PRO можно купить за символические 300 руб. На сайте есть форум по установке и настройке плагина и ленты.

P.S. Важное замечание по плагину Wpgrabber от Алекс читайте в комментариях.

    Актуальные услуги на Kwork:

  • Настройки ленты на плагин Wpgrabber для WordPress — Wpgrabber 5.5 + 5 русскоязычных лент.
    Исполнитель Денис (baxmut), выполнено заказов 689,
    233 положительных отзыва по данному кворку, 0 отрицательных.
  • Настройка лент WPGrabber для WordPress — Wpgrabber 7.0 + 7 русскоязычных лент.
    Исполнитель Анастасия (wissta77), выполнено заказов 656,
    179 положительных отзыва по данному кворку, 2 отрицательных.
  • WPGrabber — настройка парсинга для WordPress — Wpgrabber (собственная редакция) + 5 русскоязычных лент.
    Исполнитель Артем (wturm), выполнено заказов 3681,
    120 положительных отзывов по данному кворку, 2 отрицательных.

FAQ

Можно ли спарсить одну запись? Для парсинга одной (конкретной) записи укажите в поле «Шаблон ссылки» URL этой записи.

Что посмотреть по настройке WPGrabber? Годные видосики по настройке WPGrabber плейлист.



Комментарии
  1. Удалите из своей статьи wpgrabber.su. Это мошенники. Они берут бесплатную версию wpgrabber.ru.com и меняют автора и название и продают как типа про версию за деньги и мало ли что еще туда пихают. Хотя по факту скрипт один в один. Сегодня сравнил и убедился лично, плюс пообщался с wpgrabber.ru.com.

    • Алекс, спасибо за инфу. Когда писал статью — пытался разобраться с авторством. Там черт ногу сломит — автор, к сожалению, уже не с нами, а его идею и код подхватили другие люди (команды).

Задайте вопрос в комментариях