Воровство контента сайта с целью говно-SEO
От: Sharewarkin  
Дата: 02.09.10 19:19
Оценка:
Подписан на googlealerts. Последнее время гугл стал присылать ссылки на посты во всяких говноблогах. Пост состоит из предложений/абзацев надёрганных с моего сайта. Причём они идут в случайном порядке (видимо автогенератор). В середину некоторых предложений вставлены релевантные тексту анкоры со ссылками на некий ресурс, который автор блога пытается поднять в СЕРПе таким образом. Вобщем текст с сайта-донора, т.е. моего сайта использован в качестве мяса для нескольких ссылок. Возможно это давно уже практикуется, но я недавно заметил.

Кто-нить разбирался, есть ли какие-то отрицательные последствия для сайта-донора?
Варю шарики • • •
Re: Воровство контента сайта с целью говно-SEO
От: vitsavinov  
Дата: 02.09.10 19:35
Оценка: 5 (2)
Здравствуйте, Sharewarkin, Вы писали:

S>Вобщем текст с сайта-донора, т.е. моего сайта использован в качестве мяса для нескольких ссылок.

S>Кто-нить разбирался, есть ли какие-то отрицательные последствия для сайта-донора?

Есть. К сожалению эту хрень я изучал на собственной шкуре.
Это дублирование контента, которое наказывается Гуглом понижением в выдаче.

Гугл, при обнаружении дублирования, наказывает того, кого он считает плагиатором.
А вот как он разбирается — это интересный вопрос.
Имхо (и это имхо подтверждается многими сеошниками) гугл не ведет лог у кого контент
появился раньше, а у кого позже. Он сравнивает траст сайтов. У кого больше траст — тот и прав.

Такая система особенно опасна для молодых сайтов. Один раз я спалил себе контент
всего лишь разместив кнопку ретвита на молоденьком сайте. Сам и отретвитил на своем
твиттер-эккаунте. А твиты в твиттере дублируются RSS-лентой.
На эту ленту приперся робот с одной помойки, скоммуниздил твит, потом пошел по ссылке
на сайт, скоммуниздил оттуда все, до чего смог дотянуться.
В результате — у помойки какой-никакой но PR3, а у моего сайта молодого ноль целых
хрен десятых и он камнем пошел в выдаче вниз. И я попал на рерайт.

Также воровством контента занимаются Softonic и Brothersoft.
Им мало PAD-файла, который вы им даете. Они еще идут на ваш сайт и коммуниздят контент оттуда.
А так-как Softonic и Brothersoft это старые, мощные и хорошо перелинкованные архивы,
они легко могут убить молодой сайт в серпе — не сабмитьтесь туда.
Re[2]: Воровство контента сайта с целью говно-SEO
От: extraspy  
Дата: 02.09.10 19:39
Оценка: 1 (1)
V>Также воровством контента занимаются Softonic и Brothersoft.

еще softpedia

только контент так все равно не защитить.
почаще смотрите в copyscape, и если видите дублирование, заказывайте качественный рерайт либо заново пишите контент. разумеется, пока ваш сайт не оценивается как трастовый.
Re: Воровство контента сайта с целью говно-SEO
От: BulatZiganshin  
Дата: 02.09.10 20:00
Оценка:
Здравствуйте, Sharewarkin, Вы писали:

S>Возможно это давно уже практикуется, но я недавно заметил.


из тысяч ссылок по слову freearc 99.9% — это копипаста моей главной страницы
Люди, я люблю вас! Будьте бдительны!!!
Re: Воровство контента сайта с целью говно-SEO
От: Александр  
Дата: 02.09.10 21:37
Оценка:
Возможно обычный дорвей, таких миллионы.
http://forum.searchengines.ru/forumdisplay.php?f=14
Re[2]: Воровство контента сайта с целью говно-SEO
От: x_art  
Дата: 03.09.10 04:20
Оценка:
Привет

А как оценить, что мой сайт попал в опалу у гугла за дублирующий контент?
Как узнать что сайт стал трастовым?

--
С уважением,
Артем Герасимов

>

> Такая система особенно опасна для молодых сайтов. Один раз я спалил себе
> контент
> всего лишь разместив кнопку ретвита на молоденьком сайте. Сам и
> отретвитил на своем
Posted via RSDN NNTP Server 2.1 beta
Re[3]: Воровство контента сайта с целью говно-SEO
От: vitsavinov  
Дата: 03.09.10 04:38
Оценка:
Здравствуйте, x_art, Вы писали:

_>А как оценить, что мой сайт попал в опалу у гугла за дублирующий контент?


Ну в моем случае сайт стал опускаться в поисковой выдаче все ниже и ниже.
Я пошел на http://www.copyscape.com/ и обнаружил воровство.
После рерайта сайт недельки через три вернулся обратно.

_>Как узнать что сайт стал трастовым?

Ну это только косвенные признаки. Самый видимый и самый
косвенный — это тулбарный PR. Но если PR больше 4, то в общем можно сказать,
что сайт имеет траст выше плинтуса. Если больше 6 — то это хороший траст.
А так — насколько много страниц сайта находится в основном индексе,
насколько часто на сайт забегает гугльбот, насколько быстро индексируются
новые страницы. Ну и кого наказывают за дублированный контент.

На трастовых сайтах в основном индексе находится бОльшая часть страниц и
изменения попадают в индекс очень быстро. Иногда даже меньше часа занимает.


>>

>> Такая система особенно опасна для молодых сайтов. Один раз я спалил себе
>> контент
>> всего лишь разместив кнопку ретвита на молоденьком сайте. Сам и
>> отретвитил на своем
Re[4]: Воровство контента сайта с целью говно-SEO
От: BoberPlus  
Дата: 03.09.10 09:02
Оценка: 1 (1)
Здравствуйте, vitsavinov, Вы писали:

_>>Как узнать что сайт стал трастовым?

V>Ну это только косвенные признаки. Самый видимый и самый
V>косвенный — это тулбарный PR. Но если PR больше 4, то в общем можно сказать,
V>что сайт имеет траст выше плинтуса. Если больше 6 — то это хороший траст.
Вы уверены что PR вообще имеет какое-то отношение к трасту ?
Re[2]: офф: вопрос по freearc
От: 8bit  
Дата: 03.09.10 11:29
Оценка:
А какая у него лицензия? Написано что free for both commercial and non-commercial users, но все же?
И нет ли варианта в виде библиотеки по типу zlib, которую можно легко собрать и использовать, например,
просто на каких-то данных или абстрактном файле?
Re[3]: офф: вопрос по freearc
От: BulatZiganshin  
Дата: 03.09.10 11:45
Оценка:
Здравствуйте, 8bit, Вы писали:

8>А какая у него лицензия? Написано что free for both commercial and non-commercial users, но все же?

8>И нет ли варианта в виде библиотеки по типу zlib, которую можно легко собрать и использовать, например,
8>просто на каких-то данных или абстрактном файле?

хотите написать к нему морду?
Люди, я люблю вас! Будьте бдительны!!!
Re[5]: Воровство контента сайта с целью говно-SEO
От: vitsavinov  
Дата: 03.09.10 13:40
Оценка:
Здравствуйте, BoberPlus, Вы писали:

_>>>Как узнать что сайт стал трастовым?

V>>Ну это только косвенные признаки. Самый видимый и самый
V>>косвенный — это тулбарный PR. Но если PR больше 4, то в общем можно сказать,
V>>что сайт имеет траст выше плинтуса. Если больше 6 — то это хороший траст.
BP>Вы уверены что PR вообще имеет какое-то отношение к трасту ?

А разве сказал, что он "имеет отношение" ?
Вообще-то я написал "косвенный признак". И это не одно и то же, как мне кажется.

Просто по теории вероятности страница с большим PR может иметь больше ссылок
из "трастового пула" (http://en.wikipedia.org/wiki/Trust_Rank), чем страница с маленьким PR.
Вот и все.

Я уверен в том, что сайт USA Today с PR=7 — это трастовый сайт.
А сайт buy-viagra-cheap.com с PR=0 — это нетрастовый сайт.

Еще я уверен в том, что бывают и исключения (и это надо учитывать).
Black-SEO умеют накачивать PR, но у этих методов есть потолок возможностей.
PR=10 для говносайта не сможет накачать никакой дорвейщик. И 9 не сможет,
да и 8 навряд ли (8 у google.ru)

В большинстве случаев сайты с PR=5 и выше окажутся скорее трастовыми, чем нет,
а вот сайты с PR=3 и ниже вряд ли (а сайты с PR=n/a даже и не вряд ли, а почти наверняка).
Re[6]: Воровство контента сайта с целью говно-SEO
От: BoberPlus  
Дата: 03.09.10 14:05
Оценка:
Здравствуйте, vitsavinov, Вы писали:

V>Здравствуйте, BoberPlus, Вы писали:


_>>>>Как узнать что сайт стал трастовым?

V>>>Ну это только косвенные признаки. Самый видимый и самый
V>>>косвенный — это тулбарный PR. Но если PR больше 4, то в общем можно сказать,
V>>>что сайт имеет траст выше плинтуса. Если больше 6 — то это хороший траст.
BP>>Вы уверены что PR вообще имеет какое-то отношение к трасту ?

V>А разве сказал, что он "имеет отношение" ?

V>Вообще-то я написал "косвенный признак". И это не одно и то же, как мне кажется.
Это абсолютно разные вещи.

V>Просто по теории вероятности страница с большим PR может иметь больше ссылок

V>из "трастового пула" (http://en.wikipedia.org/wiki/Trust_Rank), чем страница с маленьким PR.
V>Вот и все.
Это не так, все зависит от ссылок. Теоретически можно набрать пару миллиардов говноссылок и получить высокий PR, но не траст.

V>Я уверен в том, что сайт USA Today с PR=7 — это трастовый сайт.

V>А сайт buy-viagra-cheap.com с PR=0 — это нетрастовый сайт.
Так и есть, только с PR это никак не связано.

V>В большинстве случаев сайты с PR=5 и выше окажутся скорее трастовыми, чем нет,

Ну как вам например такой сайт с pr=4:
http://www.jrsoftware.org/

V>а вот сайты с PR=3 и ниже вряд ли (а сайты с PR=n/a даже и не вряд ли, а почти наверняка).


PR это, грубо говоря, вероятность того что пользователь попадет на сайт, т.е. чем больше ссылок тем выше pr, чем выше pr ссылок, тем выше pr. Т.е. чистая математика. Траст это какой-то полумифический показатель, как его гугль определяет — хз, но то что он есть — факт
Re[7]: Воровство контента сайта с целью говно-SEO
От: vitsavinov  
Дата: 03.09.10 16:01
Оценка:
Здравствуйте, BoberPlus, Вы писали:

_>>>>>Как узнать что сайт стал трастовым?

V>>>>Ну это только косвенные признаки. Самый видимый и самый
V>>>>косвенный — это тулбарный PR. Но если PR больше 4, то в общем можно сказать,
V>>>>что сайт имеет траст выше плинтуса. Если больше 6 — то это хороший траст.
BP>>>Вы уверены что PR вообще имеет какое-то отношение к трасту ?

V>>Просто по теории вероятности страница с большим PR может иметь больше ссылок

V>>из "трастового пула" (http://en.wikipedia.org/wiki/Trust_Rank), чем страница с маленьким PR.
V>>Вот и все.
BP>Это не так, все зависит от ссылок. Теоретически можно набрать пару миллиардов говноссылок и получить высокий PR, но не траст.
Я ровно про это и писал. Есть исключения. И даже писал, каким образом они чаще всего возникают.
Зависимости вообще нет между PR и трастом, есть только непрямое, вероятностное совпадение.
Но вероятность совпадения повышается с повышением PR (а не наоборот)

V>>Я уверен в том, что сайт USA Today с PR=7 — это трастовый сайт.

V>>А сайт buy-viagra-cheap.com с PR=0 — это нетрастовый сайт.
BP>Так и есть, только с PR это никак не связано.
А я и не говорю, что "связано". Я говорю — "косвенный признак"

V>>В большинстве случаев сайты с PR=5 и выше окажутся скорее трастовыми, чем нет,

BP>Ну как вам например такой сайт с pr=4:
BP>http://www.jrsoftware.org/

Ну я ж говорю — вероятностное распределение-то. Примеров можно и больше найти,
причем как для траста, так и для нетраста. Но теорвер это не отменит.


V>>а вот сайты с PR=3 и ниже вряд ли (а сайты с PR=n/a даже и не вряд ли, а почти наверняка).

BP>PR это, грубо говоря, вероятность того что пользователь попадет на сайт, т.е. чем больше ссылок тем выше pr, чем выше pr ссылок, тем выше pr. Т.е. чистая математика. Траст это какой-то полумифический показатель, как его гугль определяет — хз, но то что он есть — факт

Ну так я я про что. Чем больше ссылок — тем больше вероятность, что среди них есть трастовые.

Как гугль определяет — он никогда не скажет.
Но в теории (см. википедию) это описано примерно так.
Экспертами вручную отбирается определенный ограниченный пул seed сайтов. Это первый уровень.
Сайты из этого пула на кого-то ссылаются, те, на кого они ссылаются, образуют второй уровень,
они как бы тоже трастовые, но траст у них уже меньше.
Второй левел тоже на кого-то ссылается, но и траст передаваемый ими тоже падает. и так далее
до некоторой глубины.
Соответственно и "простые" сайты имеют шанс отхватить трастовую ссылку определенного
уровня крутизны, но чем левел выше — тем этот шанс меньше. Чтобы попасть на первый уровень,
надо, чтобы о тебе заговорил весь оффлайн (ну что-нибудь типа chatroulette сотворить или
milliondollarhomepage или еще какое чЮдо)
Re[4]: офф: вопрос по freearc
От: 8bit  
Дата: 03.09.10 18:23
Оценка:
Здравствуйте, BulatZiganshin, Вы писали:

BZ>хотите написать к нему морду?


нет
Re: Воровство контента сайта с целью говно-SEO
От: loginx  
Дата: 04.09.10 22:37
Оценка:
S>Кто-нить разбирался, есть ли какие-то отрицательные последствия для сайта-донора?

устав гадать что такое траст-ранк и где его брать, написал в гугл слезную жалобу, привел 20 примеров как по одному и тому же запросу нужный ммне сайт являющися источником текста отброшен далеко вниз а копирователи все в топе, и о чудо через две недели практически все самые злбные типа бразерсофт улетели вообще из выдачи, а мелкие остались но ниже основного сайта. Не зная письмо ли сработало либо алшоритм как-то подкрутили...
Но попробовать стоит — главное поьольше конкретных примеров в письме имхо...
Re[2]: Воровство контента сайта с целью говно-SEO
От: Александр  
Дата: 05.09.10 08:40
Оценка:
Не будет Гугл ничего руками подкручивать в выдаче, это вам не Яндекс их Платонами.


L>устав гадать что такое траст-ранк и где его брать, написал в гугл слезную жалобу, привел 20 примеров как по одному и тому же запросу нужный ммне сайт являющися источником текста отброшен далеко вниз а копирователи все в топе, и о чудо через две недели практически все самые злбные типа бразерсофт улетели вообще из выдачи, а мелкие остались но ниже основного сайта. Не зная письмо ли сработало либо алшоритм как-то подкрутили...

L>Но попробовать стоит — главное поьольше конкретных примеров в письме имхо...
Re[3]: Воровство контента сайта с целью говно-SEO
От: loginx  
Дата: 05.09.10 12:17
Оценка:
Здравствуйте, Александр, Вы писали:

А>Не будет Гугл ничего руками подкручивать в выдаче, это вам не Яндекс их Платонами.


мой опыт говорит об обратном, в частности обнуление ПР снимается именно руками после покаянного письма гуглу (в вебмастере раздел пересмотр сайта)
и мой опыт говорит как раз что в яндексе автоматизация больше, в частности АГС это полный автомат и платон на него не может никак влиять,
потому всегда идут отписки типа развивайте сайт и он возможно появитсья в выдаче.

Еще раз если такая проблема возникла после подписки новой проги по сфт архивам стоит написать в гугл на пересмотр с максимально
подробными примерами "неудачных" запросов. Я тоже никогда не верил в ручную или полуавтоматическую обработку но...
видимо источник или сайт-автор все же может быть в гугле указан руками, а не только автоматом и тогда копипастеры уходят вниз...
но для достоверности нужна конечно статистика...
Re[4]: Воровство контента сайта с целью говно-SEO
От: loginx  
Дата: 05.09.10 12:37
Оценка:
а в яндексе к сожалению такого алгоритма ни ручного ни автоматического по определению сайта источника нет. В одной из переписок платон полностью согласился со мной что я и есть автор скопипастенной статьи и именно мой сайт и есть источник, т.к. в скопипастенной статье остались частично ссылки на исходник, но сказал что алгоритмы все еще в разработке и на данный момент ничего изменить не может, потом блах блах про зеркало интернета и совет договориться с владельцем сайта вора. Но из бана все же вывел, правда сразу в "дополнительные результаты" и трафика все равно с яндекса ноль, только с копипастов по неудаленным ссылкам. То есть ручного улучшения ранжирования источника и ручной пессимизации за копипаст в яндексе нет. Матрикс полный автомат.
Re[4]: Воровство контента сайта с целью говно-SEO
От: icezone  
Дата: 05.09.10 12:51
Оценка:
Здравствуйте, loginx, Вы писали:

L>мой опыт говорит об обратном, в частности обнуление ПР снимается именно руками после покаянного письма гуглу (в вебмастере раздел пересмотр сайта)


А для чего вам нужен тулбарный ПР?
Re[2]: А на какой адрес писали в Гугл ?
От: vitsavinov  
Дата: 05.09.10 19:08
Оценка:
Здравствуйте, loginx, Вы писали:

S>>Кто-нить разбирался, есть ли какие-то отрицательные последствия для сайта-донора?


L>устав гадать что такое траст-ранк и где его брать, написал в гугл слезную жалобу, привел 20 примеров как по одному и тому же запросу нужный ммне сайт являющися источником текста отброшен далеко вниз а копирователи все в топе, и о чудо через две недели практически все самые злбные типа бразерсофт улетели вообще из выдачи, а мелкие остались но ниже основного сайта. Не зная письмо ли сработало либо алшоритм как-то подкрутили...

L>Но попробовать стоит — главное поьольше конкретных примеров в письме имхо...

Тот, который для реконсидерейшн используется или другой?
На какой сабжект письма платоны клюнули, если не секрет?
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.