Како уклонити дупликате страница

Многи блогери траже одговор на ово питање: „Како да се ослободите дупликата страница?“, Како би уклонили дупликатне странице своје веб странице из резултата претраживача. Дуплиране странице спадају у индекс претраживача, где су присутне заједно са главном промовисаном страницом.

Може бити пуно таквих страница, истовремено ће претраживач морати да рангира исте странице у резултатима претраге. Због тога претраживач може на главну страницу увести санкције, спуштајући га у резултатима претраге. Дакле, дуплиране странице имају штетан утицај на промоцију страница сајта у претраживачу.

Садржај:
  1. Моја прича о узимању дупликата страница
  2. Тражи дуплиране странице
  3. Забрана индексирања у датотеци роботс.ткт
  4. Додавање параметра реплитоцом алатима за вебмастере
  5. ВордПресс Тхреад Цоммент Плугин за коментаре на дрвету
  6. ВордПресс СЕО додатак од Иоаст-а за уклањање одговора
  7. 301 преусмеравање да бисте уклонили реплитоцом
  8. Подешавања СЕО додатака
  9. Ручно уклањање дупликата страница
  10. Како се дупликати бришу на мојој веб локацији
  11. Још један начин суочавања са дупликатом страница
  12. Закључци чланка

Дупликатне странице могу копирати комплетан садржај или само делимични садржај главне странице. Конкретно, сам ВордПресс ЦМС креира, у неким случајевима, дупликатне странице, на пример, познати „реплитоцом“ (коментар, одговор на коментар, реплика).

Ако су коментари на стабло укључени на вашој веб локацији, у том случају ће сваки коментар створити дупликат странице. Дакле, ако су у индексу претраживача присутне дупликиране странице веб локације, тада ће бити потребно уклонити такве странице из резултата претраживача.

Присуство дупликата страница у претраживању штети сајту када се промовише у претраживачима. Тражилице снижавају положај веб локације, смањује се такозвана тежина странице, погоршава се индексирање сајта итд..

Гоогле претраживач обраћа посебну пажњу на присуство дуплираних страница, спуштајући положај веб странице у присуству великог броја њих. Нећу више теоретизирати о овој теми, већ ћу вам рећи о томе како се борим против дупликата страница, користећи примјер моје веб странице - веллиса.ру.

Моја прича о узимању дупликата страница

На самом почетку пролећа 2013. године, мој сајт је напунио годину дана, у то време саобраћај странице је износио отприлике 2000 посетилаца дневно. Тада је саобраћај ка месту почео да се смањује. Већ средином маја посећеност је једва премашила 1000 посетилаца дневно..

У пролеће 2013. многи блогери су, због увођења нових алгоритама, смањили број посетилаца Гоогле-а. На мојој веб локацији саобраћај са Гоогле претраживача смањио се за око 40%. У мом случају, на пад саобраћаја утицало је увођење нових алгоритама, као и неке промене које сам у то време направио на својој веб локацији.

Размишљајући, одлучио сам да вратим претходни саобраћај за своју веб локацију. Током лета завршио сам овај задатак, у септембру је моја веб локација поново успела да достигне просечан промет од 2000 посетилаца дневно. Надаље, промет на мојој веб локацији наставио се повећавати..

Чини се да је све у реду, али чињеница је да се раст посјета догодио углавном захваљујући претраживачу Иандек. Ако је раније однос посетилаца који су дошли на сајт из Иандек-а и Гоогле претраживања био 3 на 1 (приближан однос, отприлике) у корист Иандек-а, што отприлике одговара учешћу претраживача у Рунету, онда је тај омјер порастао на 5 до 1. Постоји снажна зависност од један претраживач.

Гоогле је присуствовао врло споро, тек у пролеће 2014. достигао је ниво прошле године. Али у то време, читаву годину, писао сам нове чланке. Испада да је Иандек адекватно реаговао на додавање нових чланака на веб локацији, што се не може рећи за Гоогле.

У децембру 2013. морао сам да инсталирам нови образац на своју веб локацију, јер у претходној теми нисам могао да променим структуру своје веб локације. Свеједно сам требао да радим ове акције.

Након тога скренуо сам пажњу на дуплиране странице у индексу претраживача. Пре тога, знао сам за овај проблем, читао о начинима његовог решавања, али још нисам ништа урадио..

У сваком случају, не бих искључио коментаре стабала на својој веб локацији, због тога би било непријатно за посетиоце сајта, а нисам хтео да користим додатке за уклањање дупликата страница.

Као резултат тога, код је инсталиран у датотеци хтаццесс, а неке директиве су уклоњене из датотеке роботс.ткт (ја ћу вам рећи више о ономе што сам урадио у наставку). Постепено, број дуплицираних страница на мојој веб локацији смањио се у резултатима претраживача.

У марту 2014. године, Гоогле-овим алатима за вебмастере додао сам параметар „реплитоцом“, а у мају сам додао још један параметар: „феед“.

Тренутно на мојој веб страници нема дуплицираних страница у резултатима претраживача Гоогле, које имају варијабилни одговор на адресу, али прије је постојао огроман број таквих страница (неколико хиљада).

Најзад, био сам пријатно изненађен порастом, око 2 пута више од посете Гоогле-у. Сада је омјер између претраживача постао око 2 према 1 у корист Иандек-а.

Тако сам из властитог искуства научио о томе какав ефекат може имати промоција веб странице, постојање дупликата страница у индексу претраживача.

Тачно, биће потребно узети у обзир да претраживачи рангирају странице у резултатима резултата претраживања на више начина. Због тога можда нећете имати значајан пораст промета на својој веб локацији. У сваком случају, уклањање дупликата из резултата претраживања повољно ће утицати на вашу веб локацију..

Тражи дуплиране странице

Да бисте потражили дупликатне странице на својој веб локацији, у поље за претрагу унесите израз „вебсајта: веллиса.ру“ (уместо „веллиса.ру“ унесите назив своје веб локације). Идите на последњу страницу резултата претраживања, ја у овом случају имам 19 страница. Запамтите број ове странице, како бисте касније брзо могли да одете на ову страницу.

На последњој страници резултата претраживања, испод последњег резултата резултата претраге, видећете најаву у којој сте обавештени да је претраживач сакрио неке резултате који су врло слични онима који су већ представљени горе. Затим кликните на везу "Прикажи скривене резултате".

Након тога ће се отворити прва страница резултата претраживања. Пређите одмах на страницу које се сећате, у мом случају ово је страница 19. На овој или следећој страници видећете дупликат странице вашег вебсајта.

Ова слика приказује дуплиране странице које у УРЛ-у имају везе „феед“ и „таг“. Такође у резултатима претраге могу бити дупликати са „реплитоцом“, „паге“ и неким другим параметрима.

Још један велики проблем, ако веб локација користи коментаре стабла, је огроман број страница са променљивом реплитоцом коју генерише сам ВордПресс ЦМС.

Доступност страница са реплитоцомом можете проверити на овај начин: у траку Гоогле унесите израз "сите: веллиса.ру реплитоцом" (без наводника). Уместо "веллиса.ру" уметните назив своје веб странице.

На мојој веб страници не постоје дуплиране странице са одговором за одговор, иако постоје коментари на дрвету. Као пример узећу сајт моје девојке Јулије (инет-боом.ру), надам се да се неће увредити због тога.

На овој слици, на самом крају везе, након адресе странице, видећете крај везе - „? Реплитоцом = 3734“. Бројеви на крају адресе мењаће се у зависности од броја коментара.

У индексу претраживача може бити огроман број таквих страница. Стога ће требати борити са одговорима.

Шта треба да се уради?

  1. Проверите да ли се у индексу претраживача налазе дуплиране странице.
  2. Затворите потребне параметре из индексирања у датотеци роботс.ткт.
  3. Додајте подешавања на траку са алаткама Гоогле вебмастер.

Ове захтеве ће морати да се испуне без грешке. Остатак поступака зависи од методе којом се одлучите борити против дупликата странице..

Морате да додате своју веб локацију Гоогле-овим алаткама за вебмастере и Иандек-ом да бисте решили проблем уклањања дуплираних страница помоћу ових алата за претрагу.

Забрана индексирања у датотеци роботс.ткт

Да бисте забранили индексирање одређених параметара који утичу на појављивање дупликата страница у претраживању, у датотеку роботс.ткт додају се директиве. Када користите директив Дисаллов, дата је наредба за претраживање робота да забрани индексирање.

Наредбе за спречавање индексирања у датотеци роботс.ткт могу изгледати овако (у овом примеру, део датотеке):

Директиве са упитником (?) Обично су присутне ако се на веб локацији направе такозване ЦНЦ везе помоћу којих се мења УРЛ веб странице. Такође постоји наредба за забрану индексирања веза са променљивом реплитоцом.

Ако је претраживач Иандек уопште усаглашен са директивама које су унете у датотеку роботс.ткт, онда је са Гоогле претраживачем све много сложеније. Гоогле роботи индексирају све, упркос забранама наведеним у датотеци роботс.ткт.

Додатак за СЕО оптимизацију може да затвори заглавље, тагове, архиве, странице за претрагу итд. Ознаком „ноиндек“. Тачно, ова упутства не прате увек роботи за претрагу..

Додавање параметра реплитоцом алатима за вебмастере

У Гоогле алатки за вебмастере идите на страницу са алаткама за вебмастере. У десној колони „Алатна трака странице“ прво кликните дугме „Скенирање“, а затим дугме „Подешавања УРЛ-а“..

На овој страници можете додати нове параметре или променити већ додате параметре за обраду од стране Гоогле робота за претрагу. Овисно о подешавањима, Гооглебот претраживач ће игнорисати одређене параметре приликом уноса страница веб локације у индекс претраживача.

  1. Да бисте додали нови параметар, кликните на дугме „Додај параметар“.

  1. Након тога отвара се прозор "Додај параметар"..
  2. У поље параметра (велика и мала слова) додајте нови параметар, у овом случају „реплитоцом“.
  3. На питање: „Да ли овај параметар мења садржај странице који корисник види?“, Ви одговарате: „Да, параметар мења или реорганизује или ограничава садржај странице“.
  4. Када одговарате на питање: „Како овај параметар утиче на садржај странице?“, Изаберите опцију одговора: „Остало“.
  5. На питање: „Које УРЛ адресе са овим параметром би Гооглебот требало да пузи“, одговорите: „Нема УРЛ адреса“.
  6. Затим кликните на дугме "Саве".

Слично томе, можете да додате и друге параметре. Ако је параметар већ на листи, да бисте променили његове поставке, мораћете да кликнете на везу "Промени".

Након додавања параметра реплитоцом на плочу вебмастера, морат ћете уклонити нешто попут директиве „Дисаллов: / *? Реплитоцом“ (ако постоји у датотеци робота) из датотеке роботс.ткт тако да гооглебот прати везе са овим параметром и избрисали су их из индекса.

Ако ваша веб локација нема дуплиране странице са овим параметром, такву директиву можете оставити у датотеци роботс.ткт.

Постепено дуплиране странице уклањаће се из индекса претраживача. Ако постоји пуно дуплираних страница, тада ће поступак уклањања дупликата потрајати прилично дуго, можда чак и за неколико месеци.

ВордПресс Тхреад Цоммент Плугин за коментаре на дрвету

Будући да је појава одговора олакшана коментарима стабала, неки корисници их углавном онемогућују на својој веб локацији. Након онемогућавања коментара са стабала, посебно ако се чланци на веб локацији активно коментаришу, добија се врло незгодна навигација. Посетиоцу, понекад уопште није јасно ко је, где, коме, шта је одговорио.

Додатак за ВордПресс Тхреад Цоммент решава проблем коментара на дрвећу у ВордПрессу. Коментари на дрвету остају на веб локацији, без додавања променљивих за одговор. Додатак приказује везу са коментаром преко ЈаваСцрипта, тако да претраживачи не индексирају ову везу.

Нове варијабле реплитоцом више се неће појављивати у индексу претраживача, а старе променљиве ће морати да се постепено уклањају из индекса претраживача.

Лично ми се није допао изглед коментара у овом додатку. Нисам користио овај додатак на својој веб локацији. Примјећујем да је додатак за ВордПресс Тхреад Цоммент за борбу против одговора препоручио Александар Борисов.

ВордПресс СЕО додатак од Иоаст-а за уклањање одговора

ВордПресс СЕО би Иоаст додатак, прилично моћан додатак за СЕО оптимизацију веб места, између осталог, омогућава вам да уклоните респотоцом променљиве са веб локације. Истовремено, коментари на стабло остаће на вашој веб локацији.

После инсталирања ВордПресс СЕО би Иоаст додатка на вашу веб локацију, у подешавањима додатака, у одељку „Пермалинкс“, мораћете да активирате „Делете тхе вариаблес? Реплитоцом“.

Након тога, постепено удвостручене странице са одговором "снот" биће уклоњене из Гоогле индекса.

Будући да је на мојој веб локацији инсталиран додатак СЕО ин Алл из једног и из неког разлога, не желим да се пребацим на ВордПресс СЕО би Иоаст додатак, нисам користио ову опцију за борбу против дупликата страница..

301 преусмеравање да бисте уклонили реплитоцом

Ово је вероватно најрадикалнији начин за решавање одговора. Користио сам овај одређени метод.

Након промене шаблона, Лариса Веб-Цат предложила је да користим 301 преусмеравања за борбу против одговора. Пре промене шаблона на веб локацији, нисам се усудио користити ову методу.

Сада могу рећи да се приликом коришћења преусмеравања 301, а такође и после неких радњи, о којима ћу писати у даљем тексту, моја веб локација успешно суочила са дупликатима реплитоцом.

На овој слици можете видети да на мојој веб страници нема дупликата страница са променљивом реплитоцом, упркос чињеници да на мојој веб страници постоје коментари стабла, без коришћења посебних додатака.

Да бисте користили преусмеравање 301, мораћете да уметнете посебан код у датотеку "хтаццесс", која се налази у коријенској мапи ваше веб локације. Коренска фасцикла сајта је фасцикла ваше веб локације која садржи фасцикле „вп-администратор“, „вп-садржај“, „вп-укључује“ итд..

У датотеку хтаццесс, испод ретка "РевритеБасе /", морат ћете уметнути следећи код:

РевритеЦонд% КУЕРИ_СТРИНГ реплитоцом = РевритеРуле ^ (. *) $ / $ 1? [Р = 301, Л] 
Пажња! Пре уградње овог кода оригинална хтаццесс датотека на ваш рачунар. Ако погријешите, нешто пође по злу, тада можете замијенити модифицирану хтаццесс датотеку с оригиналном датотеком помоћу управитеља датотека на вашем хостингу или ФТП-а путем ФилеЗилла.

Ако се појави проблем, уместо ваше веб локације можете видети „бели екран смрти“. Замена модификоване датотеке оригиналном хтаццесс датотеком вратиће функционалност ваше веб локације.

Након уметања кода, морат ћете провјерити рад преусмјеравања 301. Да бисте то учинили, прво ћете морати да у адресну траку прегледача убаците везу која садржи одговор за одговор, а затим проверите резултат преласка. Након прелаза, веза на отвореној веб страници мораће да се промени у оригиналну везу која не садржи променљиву одговор за одговор у УРЛ-у.

Даље, мораћете да урадите још две ствари. Прво ћете морати да уклоните директиве из датотеке роботс.ткт која садржи забрану индексирања страница са упитником. Ако користите овај метод, директиве се бришу..

Тада ћете морати да додате параметар реплитоцом у „Гоогле Вебмастер Тоолс“, као што сам горе написао у чланку.

Подешавања СЕО додатака

Да бисте спречили индексирање архивских страница, категорија, ознака, 404 странице, страница за претрагу, пагинације (навигација по страни), у додатку за све у једном СЕО пакету мораћете да активирате ставке за додавање аргумената ноиндек, фоллов и ноиндек, нофоллов (за навигацију по страници).

У ВордПресс СЕО би Иоаст додатку, параметри индексирања за претраживаче ће изгледати овако: ноиндек, следите.

Сада морате бити стрпљиви и сачекати да Гоогле уклони дупликате страница из свог индекса. Ако не желите да дуго чекате или ако на вашој веб страници остане врло мало дупликата страница, можете убрзати њихово уклањање.

Ручно уклањање дупликата страница

Можете ручно додати линкове до дуплираних страница у Вебмастер Тоолс како бисте их уклонили из индекса претраживача. Кад није било толико дуплицираних страница на мојој веб локацији у резултатима претраживача, такође сам ручно додао резултате пронађене да их брже уклоним из индекса.

  1. На страници "Алати за вебмастере", у десној колони "Алатне траке за веб локације", прво кликните дугме "Гоогле индекс", а затим дугме "Избриши УРЛ-ове"..
  2. Затим ће се отворити страница „Избриши УРЛ-ове“. На овој страници морат ћете кликнути на дугме "Креирај нови захтјев за брисање".

  1. Испод дугмета отвориће се поље у које ћете уметнути везу. Након тога, морат ћете кликнути на дугме "Настави".

  1. Затим се отвара нова страница на којој ће се приказати избрисани УРЛ. У ставци „Разлог“ изаберите ову опцију: „Избришите страницу из резултата претраге и из кеш меморије“. Затим кликните на дугме "Пошаљите захтев".

  1. На страници Избриши УРЛ-ове видећете додате везе које чекају да се избришу. Управо на овај начин можете додати следећу везу да бисте је уклонили из резултата претраге и из кеш меморије Гоогле претраживача.

Проблем постоји, може негативно утицати на промоцију веб локације, тако да ће администратор веб локације морати да се реши дупликата да би добио позитиван резултат.

Прошао је месец дана од објављивања овог чланка, а сада је време да се публикација допуни новим информацијама.

Како се дупликати бришу на мојој веб локацији

Сада ћу вам тачно рећи како се тренутно води борба против дупликата страница на мојој веб локацији.

  1. Уклонио сам неке забране директиве из датотеке роботс.ткт како бих омогуцио ботовима приступ неким директоријима моје веб локације.
  2. У додатку за СЕО оптимизацију (АИОСП) приметио сам бодове за додавање робота мета тагова за одговарајуће странице веб локације. Алат за индексирање који се креће на такву страницу видеће забрањивање метаознаке и неће је индексирати.

Да бисте то учинили, приступ одређеним страницама у датотеци са роботима је отворен, тако да је робот отишао на ову страницу и видео следеће метаознаке:

мета наме = "роботи" цонтент = "ноиндек, нофоллов" мета наме = "роботи" цонтент = "ноиндек, следите"

Стога робот за претрагу неће индексирати страницу таквим метаознакама. Ранији прегледи у индексу страница постепено ће се уклањати из резултата претраживача..

  1. Опције за одговоре су додате на панел за вебмастере Гоогле-а.
  2. У хтаццесс датотеку сам додао следећи код:
РевритеЦонд% КУЕРИ_СТРИНГ реплитоцом = РевритеРуле ^ (. *) $ / $ 1? [Р = 301, Л] РевритеРуле (. +) / Феед / $ 1 [Р = 301, Л] РевритеРуле (. +) / Страна са коментарима / $ 1 [Р = 301, Л] РевритеРуле (. +) / Трацкбацк / $ 1 [Р = 301, Л] РевритеРуле (. +) / Коментари / $ 1 [Р = 301, Л] РевритеРуле (. +) / Прилог / $ 1 [Р = 301, Л] РевритеЦонд% КУЕРИ_СТРИНГ ^ аттацхмент_ид = [НЦ] РевритеРуле (. *) $ 1? [Р = 301, Л]

Овај код обухвата 301 преусмеравање са респотоцомом, као и преусмеравања са другим параметрима које сам узео са места Александра Борисова. Колико сам разумео, аутор преусмеравања за друге параметре је познати блогер Александар Алаев (Алаицх).

Одговарајуће директиве (феед, коментари, трацкбацк итд.) За параметре који су додани у хтаццесс датотеку су избрисани из датотеке роботс.ткт.

Након тога, робот за претраживање који иде на дуплицирану страницу која има такве параметре у УРЛ-у биће преусмерен помоћу преусмеравања 301 на оригиналну страницу моје веб локације.

  1. У датотеку фунцтион.пхп додан је код за спречавање појављивања нових преузимања уз реплитоцом, које је посетилац моје странице Антон Лапсхин пронашао на Интернету:
функција цханге_репли_то_цом ($ линк) ретурн прег_реплаце ('/хреф=\'(.*(\?|&)реплитоцом=(\д+)# репли)/', 'хреф = \' # коментар-$ 3 ', $ линк ); адд_филтер ('цоммент_репли_линк', 'субститу_репли_то_цом');

Да ли ћете морати да залепите овај код у датотеку "Функције теме" (фунцтион.пхп) пре закључне ознаке?>.

Након уметања кода, када пређете мишем преко дугмета „Одговори“ у коментарима, варијабла респонсетоцом се више неће појављивати на вези која ће бити видљива у доњем левом углу прозора прегледача. Због тога се нове везе са овим параметром неће додати у индекс претраживача.

Пре него што извршите измене, обавезно направите сигурносну копију датотеке са карактеристикама теме..

Сва ова подешавања раде углавном за Гоогле претраживач. У Иандек-у је омјер броја страница које је робот учитао и страница које претражују на мојој веб локацији тренутно оптималан..

Још један начин суочавања са дупликатом страница

На Интернету сам пронашао још један начин уклањања дупликата страница из резултата претраживања. Коришћењем кода, метаознака робота ноиндек, нофоллов ће бити додато на одређене странице веб локације да се забрани индексирање таквих страница.

Овај се код убацује у датотеку фунцтион.пхп одмах након тога

функција мета_роботс () иф (ис_арцхиве () или ис_цатегори () или ис_феед () или ис_аутхор () или ис_дате () или ис_даи () или ис_монтх () или ис_иеар () или ис_таг () или ис_так () или ис_татацхмент () или ис_пагед () или ис_сеарцх ()) ецхо "". ''. "\ н";  додавање датотеке ('вп_хеад', 'мета_роботс');

Након додавања овог кода, у додатку за СЕО оптимизацију морат ћете онемогућити додавање мета ознаке Робот на ове странице. У додатку за све у једном СЕО Пацк - одељак „подешавања индексирања (ноиндек)“.

Тада ће бити потребно уклонити одговарајуће директиве за забрану из датотеке робота..

На овај начин можете затворити потребне странице за индексирање. Само да бисте се решили дупликата одговора, потребно је користити једну од метода описаних у овом чланку. Поред коришћења преусмеравања и додатака, такође ће бити могуће приложити везе од коментара у распону ознаке тако да их индексери не претражују.

Након довршетка подешавања, повремено ћете требати да надгледате поступак уклањања дупликата са ваше веб локације.

Закључци чланка

Вебмастер треба да обрати пажњу на присуство дуплираних страница веб странице, а ако се пронађу, предузме мере да их уклони из резултата претраге, јер они негативно утичу на промоцију веб локације. Због тога на веб страницу могу бити изложене санкције претраживача..

Повезане публикације:
  • Како пребацити веб локацију на ХТТПС
  • Како повећати саобраћај на веб локацији
  • Како инсталирати огласе на сајт
  • Преглед брзог хостинга АдминВПС-а
  • Бревцрумб НавКСТ додатак - пециво за сајт