76

Re: Черный список сайтов, Ворующих контент

Нашел тут в одной теме старый пост от sputnik 1818:

sputnik1818 пишет:
dane-mo пишет:
sputnik1818 пишет:

Я наоборот выскажусь против одного сайта, а конкретно venividi - сайт наглым образом копирует у жж юзеров отчеты и если поначалу ссылки ставил, то потом пошло я так понял просто копирование... Где-то была тема по этому поводу на хабре...

Они мои отчеты тоже время от времени без спроса копируют, но ссылку на мой жж ставят в конце...

Ну это сайт не имеющий ничего своего, собирает инфу с ЖЖ. Копипастер по-русски:) Я считаю подобные сайты вредны не только для этой базы, что собирает Аджей, но и для всего интернета... ИМХО

Категорически не согласен с утверджением, что такие сайты вредны для интернета. До того, как начал заниматься своими сайтами, я с огромным удовольствием искал инфу на венивиди, и благодарил того, кто создал этот агрегатор отчетов. Для простого пользователя такие сайты полезны. Им совершенно до фени, что кто-то там что-то копипастит и не ставит индексируемую ссылку.

Со своей стороны, конечно, я был бы против копипаста моих отчетов на другие сайты.


Notice: Undefined variable: pattern_callback in /var/www/html/travelbloggers.ru/public_html/include/parser.php on line 814

77

Re: Черный список сайтов, Ворующих контент

Вот очередной агрегатор наших RSS лент: http://tayland.ru/
Те, кто публикует свои статьи целиком в RSS без обратных ссылок могут понегодавать. Особенно ЖЖники.

78 Отредактировано Котовский (23.05.2012 16:41)

Re: Черный список сайтов, Ворующих контент

Вот уроды. И как такое в индексе удерживается?


Notice: Undefined variable: pattern_callback in /var/www/html/travelbloggers.ru/public_html/include/parser.php on line 814

79

Re: Черный список сайтов, Ворующих контент

Например, википукия и ответ.маил.ру. Проблема в том, что они ещё и трастовые воры, и обычно  будут ранжироваться в поисковой выдаче выше сайтов-первоисточников. Воровство прикрыто тем, что во-первых это не ОНЕ, а их читатели постят, а во-вторых его величество добродетельные оне не могут бороться со спамом, бедьненькие, поэтому ссылки на первоисточник, им, несчастным, приходится скрывать nofollow. А потом эта морда с Википукии клянчит миллионы на своё «святое» дело – за сервер ему надо платить.

80

Re: Черный список сайтов, Ворующих контент

По-хорошему, нужен профсоюз вебмастеров, который выставит счёт этому ворью.

81

Re: Черный список сайтов, Ворующих контент

По-хорошему, нужен профсоюз вебмастеров, который выставит счёт этому ворью.

это было бы круто. Но по сути, если они ставят ссылку, то счет им не выставишь. Индексируемая или нет, но она есть.

82

Re: Черный список сайтов, Ворующих контент

Котовский пишет:

По-хорошему, нужен профсоюз вебмастеров, который выставит счёт этому ворью.

это было бы круто. Но по сути, если они ставят ссылку, то счет им не выставишь. Индексируемая или нет, но она есть.

При наличии профсоюза такие вопросы можно было бы юридически обосновать.

83

Re: Черный список сайтов, Ворующих контент

А это что, Спрут увлекся копипастой??

http://feedbang.ru/about/

Особенно порадовал пассаж:

Мы не в коем случае не присваеваем ваши материалы себе, сервис всего лишь аггрегирует публично доступную информацию с сохранением авторства. Однако все вопросы по удалению вашего блога из базы останутся без ответа, а краткие записи будут принудительно превращатся в полные (пока что с помощью сторонних сервисов) - мы ценим своих пользователей и хотим предоставлять им полную информацию. Это не касается анонсов с убиранием большей части поста "под кат". Можете не беспокоится - если ваш пост действительно интересен, то пользователи все равно будут заходить на блог, хотя бы для комментирования. Никакие ухищрения не заставят посетителей посещать блог, автор которого пишит не интересно.

Как-то нехорошо.

84

Re: Черный список сайтов, Ворующих контент

Котовский пишет:

А это что, Спрут увлекся копипастой??

Это не копипаста, а агрегация. Полезное дело со всех точек зрения, кроме вашей, как мы уже выяснили на прошлой странице.
Чтобы ваш контент там не появлялся, отключите RSS блога или сделайте доступ только для зарегистрированных пользователей по паролю. Также, можно запретить поисковикам индексировать сайт, потому что там тоже есть части ваших постов со ссылками.

0


Notice: Undefined variable: pattern_callback in /var/www/html/travelbloggers.ru/public_html/include/parser.php on line 814

85

Re: Черный список сайтов, Ворующих контент

ajayver пишет:

Это не копипаста, а агрегация. Полезное дело со всех точек зрения

Честно говоря - это копипаст чистейший, прикрытый якобы благими намерениями...
По сути парсер.

"Однако все вопросы по удалению вашего блога из базы останутся без ответа"

Правильно - увидел блог, писать нужно не Спруту, а в Яндекс,  хостеру и т.д

86

Re: Черный список сайтов, Ворующих контент

Но ведь у нас под рейтингом тоже парсер, тоже копипаст? :)

87

Re: Черный список сайтов, Ворующих контент

Но здесь мы сами попросили нас парсить.

Не, мне в принципе тоже пофиг на такие агрегаторы, видимо это неизбежное зло. Просто удивило, что это детище Спрута.

88

Re: Черный список сайтов, Ворующих контент

ajayver пишет:

Но ведь у нас под рейтингом тоже парсер, тоже копипаст? :)

Ты видимо не вчитался внимательно.
Здесь просто агрегатор рсс, то есть ссылки в одном месте (это действительно удобно), а там все оригинальные тексты целиком на другом сайте.

89

Re: Черный список сайтов, Ворующих контент

sputnik1818 пишет:

Ты видимо не вчитался внимательно.

feedbang.ru пишет:

Это не касается анонсов с убиранием большей части поста "под кат"

90

Re: Черный список сайтов, Ворующих контент

ajayver пишет:
sputnik1818 пишет:

Ты видимо не вчитался внимательно.

feedbang.ru пишет:

Это не касается анонсов с убиранием большей части поста "под кат"

feedbang.ru пишет:

"а краткие записи будут принудительно превращатся в полные (пока что с помощью сторонних сервисов) - мы ценим своих пользователей и хотим предоставлять им полную информацию"

91

Re: Черный список сайтов, Ворующих контент

я так понимаю, что речь идет о сокращенной rss ленте, когда туда выводятся только заголовки.

92

Re: Черный список сайтов, Ворующих контент

ajayver пишет:

я так понимаю, что речь идет о сокращенной rss ленте, когда туда выводятся только заголовки.

Нет. Речь идет о том, что если вебмастер выводит в RSS  заголовок+ анонс, то парсер заберет полную версию статьи с помощью сторонних сервисов (Pocket или Readability, к примеру)

93

Re: Черный список сайтов, Ворующих контент

Ты сайт то посмотрел? Там нет ничего подобного. По крайней мере у нас rss как rss.


Notice: Undefined variable: pattern_callback in /var/www/html/travelbloggers.ru/public_html/include/parser.php on line 814

94

Re: Черный список сайтов, Ворующих контент

http://content.webmaster.yandex.ru/originals/

наткнулся и вспомнил про КЭШа :)

может кому-то ещё пригодиться ;)


Notice: Undefined variable: pattern_callback in /var/www/html/travelbloggers.ru/public_html/include/parser.php on line 814

95

Re: Черный список сайтов, Ворующих контент

Лучше поздно чем никогда.. Касаемо моего агррегатора feedbang.ru:

1. Ссылки на посты и блоги прямые и индексируемые поисковиками, с указанием авторства и блога.

2. Если вам так важна SEO-составляющая - этот сайт в Яндексе забанен, так что не представляет конкуренции.

3. Касаемо кратких RSS - имелось ввиду автообрезание постов до 300 слов тем же вордпрессом, что выглядит ужасно. Собственно, "угрозы" о принудительно парсинге так и остались угрозами, кроме пары блогов. Все ленты с анонсами (в том числе лента travelbloggers) никак не изменяются.

Вообще, идея была взята с моего же сервиса http://topsape.ru/reader/ (аггрегатор блогов манимейкерской тематики), когда любой новичок может добавить свой блог в ленту, и если пишет интересно - сразу же получить сотни переходов на пост и десятки комментов (и ничего, если пишет абы как) - отличный способ заявить о себе. К сожалению, в глобальном плане или даже в отдельно туристическом направлении это не сработало, и сервис просто остался как веб.архив для блоггеров с 55'000 сохраненных постов, с мизерной посещаемостью (30 человек в день) и убыточный :)

----

Ну и вообще насчет темы копипаста.. Это интернет, детка. Тут очень много нехороших вещей и людей (копипаст, спам в комментарии, воровство фотографии и т.д.), и тебе остается либо каждый день с этим бороться, либо просто не обращать внимание на всю эту возню под ногами (например, как это делает Сергей Доля, разрешая копировать свои материалы и фотографии куда угодно, с сохранением авторства). В конце концов, вы блоггер, вы пишите чтобы вас читали - и в случае аггрегаторов не настолько важно, где именно люди вас читают, на сайте или в  ридере/аггрегаторе.

StoryFinder.ru - поиск по тревел-блогам

+1

96

Re: Черный список сайтов, Ворующих контент

Привет! И что такая важная и нужная тема вот так заглохла? Я вас нашла тоже потому, что на днях обнаружила весь свой контент (более 70 самостоятельно написанных достаточно объемных статей) на чужом г...носайте безо всяких там ссылок со всеми до единой маркированными картинками, да еще и последняя моя статья была слизана до индексации и там проиндексировалась быстрее. А это уже извините, вызывает не просто негодование. Ищу какую-нибудь управу на эту чуму.

97

Re: Черный список сайтов, Ворующих контент

в яндоксе есть штука , поискать надо в вебмастере ... отправляите им свои статьи , они ставят на них ваше авторство и индексируют только ваш сайт с этим текстом !!
ну может что-то переврал , но в целом смысл такой ;)

98

Re: Черный список сайтов, Ворующих контент

текст с яндекса !!!

Оригинальные тексты

Если вы публикуете на своем сайте оригинальные тексты, а их перепечатывают другие интернет-ресурсы, предупредите Яндекс о скором выходе текста. Мы будем знать, что оригинальный текст впервые появился именно на вашем сайте, и попробуем использовать это в настройке поисковых алгоритмов.

Загрузить текст вы можете через эту форму.

Пожалуйста, загружайте только оригинальные тексты, которые до сих пор не были опубликованы в интернете. Рекомендуемый минимальный объем – 2000 знаков, максимальный – 32000 знаков. Вы можете размещать текст на сайте сразу после отправки заявки.

Обратите внимание, что мы не гарантируем учет вашей заявки в работе поисковых алгоритмов.

Вы можете ознакомиться с ответами на часто задаваемые вопросы.

99

Re: Черный список сайтов, Ворующих контент

Все, что нажито непосильным трудом… Три магнитофона, три кинокамеры заграничных, три портсигара отечественных, куртка замшевая… три куртки. Магнитофон импортный! Пиджак!

+1


Notice: Undefined variable: pattern_callback in /var/www/html/travelbloggers.ru/public_html/include/parser.php on line 814

100

Re: Черный список сайтов, Ворующих контент

R-SILVER пишет:

текст с яндекса !!!

Оригинальные тексты

Если вы публикуете на своем сайте оригинальные тексты, а их перепечатывают другие интернет-ресурсы, предупредите Яндекс о скором выходе текста. Мы будем знать, что оригинальный текст впервые появился именно на вашем сайте, и попробуем использовать это в настройке поисковых алгоритмов.

Загрузить текст вы можете через эту форму.

Пожалуйста, загружайте только оригинальные тексты, которые до сих пор не были опубликованы в интернете. Рекомендуемый минимальный объем – 2000 знаков, максимальный – 32000 знаков. Вы можете размещать текст на сайте сразу после отправки заявки.

Обратите внимание, что мы не гарантируем учет вашей заявки в работе поисковых алгоритмов.

Вы можете ознакомиться с ответами на часто задаваемые вопросы.

Только есть несколько НО:
Эта функция находится в тестовом режиме и как я понял ничего не гарантирует (кроме внутреннего успокоения), а второе, что тексты можно отдавать яндексу только при 10 или 20 ТИЦ))) Вот

+1