… beschreibt Jaimie Sirovich auf seinem Blog in wenigen Sätzen.
Die drei Punkte sind schnell nachvollzogen und damit kann man die potenzielle Diebe aussperren.
- Get the IP of the web site that is stealing your content.
%ping www.trafficboosterpro.com
PING trafficboosterpro.com (74.52.58.162): 56 data bytes
- Search your logs for that IP address (via SSH).
%cat www.20061231 | grep "74.52.58.162"
74.52.58.162 - - [31/Dec/2006:01:00:38 -0500] "GET /blog/feed/ HTTP/1.0" 200 49330 "-" "TrafficBoosterPRo (+http://TrafficBoosterPro.com/)"
- Place the following directives in your .htaccess file.
RewriteEngine On
RewriteCond %{REMOTE_ADDR} ^74\.52\.58\.162
RewriteRule ^.*$ - [F]
q: How You Can Stop Dirty Feed Scrapers In 3 Easy Steps
Um Contentdiebstahl erst einmal fest zu stellen, kann man das Plugin ©Feed nutzen oder man nutzt Suchmaschinen und weitere spezielle Werkzeuge, die hier näher erläutert sind.
Was den Einsatz von Tools wie z.B. Feedburner in den Fokus der Diskussion rücken könnte.
Einerseits entlastet Feedburner die Webseite da der Feed dort (zwischen)gespeichert wird. Außerdem bietet Feedburner noch ein paar nette Tools an, die man sich ansonsten mühsam per Plugin-Sammlung zusammenstellen müsste.
Auf der anderen Seite macht es Feedburner Content-Dieben natürlich höllisch einfach. Sie müssen ja nur noch feeds.feedburner/deinFeedbeiFB abgreifen.
Und somit ist man dann auch bei der alles entscheidenden Frage: Welcher Seite darf/soll man seinem Feed anvertrauen?
Außerdem ist Deny from IP.Ad.re.ss viel schöner als das urselige mod_rewrite 😉
Wesentlich einfacher und effektiver (!) am Beispiel der genannten IP:
Netrange ermitteln (so genannter IP-Kreis), CIDR errechnen und ein für alle mal über die htaccess-Datei sperren:
order allow,deny
allow from all
deny from 74.52.0.0/16
@Ralf & Enrique: Vielen Dank für den Hinweis, werde es mal versuchen.
@Enrique: Wünsche dir noch was im neuen Jahr, scheinst ja ganz schön im Stress zu sein mit deinen Aktionen.
Wenn man sowieso schon IPs in der .htaccess sperrt, sollte man auf diese Weise auch die Bots von Digital Infinity Ltd in die Schranken weisen. Die haben den Range von 63.148.99.224 bis 63.148.99.255.
38.118.25.56/29, 38.118.42.32/29, 63.148.99.224/27 und 65.118.41.192/27 gehören dem dubiosen Laden angeblich auch noch.
Mehr zu dem Thema gibt es auf der Cyveillancebot Information Page.
Lieben Dank und auch Dir alles Gute für 2007. Bin zurzeit in Hanseatien und hier gibt es einen schönen Satz für diese Gelegenheit: „Ich wünsche Dir immer eine Handbreit Wasser unter’m Kiel“.
P.S.: Gut, dass geschwollene Augen und Ränder unter denselben hier nicht abgebildet werden.