Як знайти зовнішні і внутрішні дублі

08.06.2016

Як знайти дублі сторінок на сайті

Сьогодні я продовжую тему про дубльованому контенті. Ви, звичайно, вже прочитали мою попередню статтю про види дубльованого контенту. тепер саме час зрозуміти, як же шукати всі ці види.

Я розповім і про самих простих способи пошуку дублів, для яких не потрібно нічого встановлювати, і про деяких програмах і сервісах. Готові? Поїхали!

  1. Заходимо в свій Вебмастер Гугла. потім йдемо таким шляхом: Діагностика> Пропозиції HTML> і тут вам будуть показані адреси сторінок з дубльованими (і відсутніми) мета тегами. заголовками і описами.

Для чого це потрібно? Сторінок-дублів є й однакові мета дані, і саме таким способом ви зможете їх знайти.

  1. Використовуємо оператори Google. По-перше, пошук за точним збігом. Для цього беремо частина тексту зі сторінки (достатньо однієї щіпки захотілося мені написати, але немає – достатньо одного рядка) і вводимо в рядок пошуку в лапках. Наприклад:

Якщо дублі є – то вони вам з’являться). Але: щоб все було в кращому вигляді, краще перевірити сторінку кілька разів, тобто взяти шматки тексту з різних її частин. Так результат буде точніше. Я зустрічала випадки, коли по одному шматку тексту нічого, крім перевіряється сторінки не знаходиться, а береш іншого – і ось, будь ласка – цілий букет.

Таким способом ви зможете, в основному, шукати зовнішні дублікати. Щоб знайти внутрішні, повні або часткові. потрібно шукати по шматку тексту, але в межах сайту. Тут знову допоможуть оператори Гугла. Набираємо в пошуковому рядку:

site:vashsite.ru «текст зі сторінки»

Щоб перевірити статті всередині блогу, краще всього брати початкові рядки (якщо ви використовуєте тег. звичайно, якщо немає – то без різниці) — так можна дізнатися, де всередині вашого блогу дублюються статті/частини статей і запобігти зупинити це.

  1. Онлайн пошук дублів – Copyscape . Цей сервіс на англійській мові, але розібратися в ньому досить просто, він дуже схожий на звичайний пошуковик. Заходимо, вписуємо адресу сторінки, що перевіряється і натискаємо «Copyscape search». Тут з’являються результати пошуку:

Натискаючи на кожен результат, можна подивитися сторінку з схожим/ідентичним текстом і відсоток збігу.

До 30% збігів – це нормально, ну більш-менш. Звичайно, все залежить від самого повторюваного тексту: якщо це календар на блозі WordPress (а він теж враховується) – такий збіг можна сміливо ігнорувати.

  1. Mira Tools — теж онлайн сервіс, який покаже унікальність вашого тексту. а сторінки. тому сюди вводиться саме текст (до 3000 символів). Для зручності тут є рядок «Ігнорований домен», сюди вводите сайт, текст якого перевіряєте, щоб він не враховувався як дублікат.
  1. Тепер про програми для пошуку дублів. Спочатку Advego Plagiatus. скачати яку безкоштовно можна звідси Після скачування встановлюємо і запускаємо. Вводимо адресу сторінки, яку хочемо перевірити на унікальність, тиснемо блакитну стрілочку праворуч і кнопочку «Перевірити унікальність» (логічно))).

Унікальність вважається у відсотках, а в кінці видається оцінка. Наприклад,

  1. Наступна програма для перевірки унікальності тексту Antiplagiat (можна і онлайн, але потрібно реєструватися). Вона схожа на Advego Plagiatus. Сюди теж потрібно ввести адресу сторінки, що перевіряється, натиснути на синю стрілку, а потім на «Перевірити унікальність» — і отримати результат.
  1. Є й інші, непрямі, способи виявити, що ваш текст хтось скопіював. Наприклад, аналіз джерел відвідуваності сайту. Так, я нещодавно по Метриці знайшла, що одну з моїх статей (ТОП 10 розширень Google Chrome, які зроблять вашу роботу ефективніше ), а точніше, її половину, скопіювали. Спасибі, що хоч з посиланням на мене з анкором «Далі».

Маленький експеримент

Я перевірила на унікальність свою статтю «Одна сторінка, різні тайтли» всіма перерахованими мною способами і отримала наступні результати:

  1. Судячи з Вебмастеру внутрішніх дублів у мене взагалі немає ;
  2. Пошук з операторами Google: стаття унікальна ;
  3. Copyscape знайшов тільки один збіг на 3% (назва моєї статті як анкор посилання з іншого сайту), т.е. унікальність — 97% ;
  4. Miratools 100% унікальність;
  5. Advego Plagiatus: 77% унікальності. Частина неуникальна з-за анонсу статті в одному з rss-агрегаторів, решта – 2-6% збігів абсолютно лівим сайтів (навіть 100500.tv затесався!);
  6. Antiplagiat 89% (і знову ж купа лівих сайтів, один з них з фільмом «Пункт призначення» — так добре?!).

Отже, що ми маємо.

Особисто я для пошуку зовнішніх і внутрішніх дублів використовую оператори Google і сервіс Copyscape – таким чином можна знайти багато чого «цікавого».

На сьогодні все. Не хочеться з вами розлучатися… і не треба! Шукайте мене в соціальних мережах, діліться цієї (і не тільки цієї) статтею з друзями та підписуйтесь на оновлення! Все це особливо корисно, так як у наступних статтях цієї серії ви дізнаєтеся:

Короткий опис статті: як знайти сайт Шукаємо дублі контенту як в межах свого сайту, так і на інших. Кілька способів пошуку дублів за допомогою різних програм і сервісів google,Зовнішня оптимізація,Внутрішня оптимізація,Новачкам,Корисне,Вчимося

Джерело: Як знайти зовнішні і внутрішні дублі

Також ви можете прочитати