<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Elradon &#187; robots.txt</title>
	<atom:link href="http://elradon.me/blog/tag/robotstxt/feed/" rel="self" type="application/rss+xml" />
	<link>http://elradon.me</link>
	<description>Weil es doch so viel zu schreiben gibt!</description>
	<lastBuildDate>Sun, 25 Dec 2011 21:30:25 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>Archive.org aussperren</title>
		<link>http://elradon.me/blog/archive-org-aussperren.html</link>
		<comments>http://elradon.me/blog/archive-org-aussperren.html#comments</comments>
		<pubDate>Fri, 12 Sep 2008 14:24:51 +0000</pubDate>
		<dc:creator>Elradon</dc:creator>
				<category><![CDATA[nicht vergessen]]></category>
		<category><![CDATA[Programmierung]]></category>
		<category><![CDATA[archive.org]]></category>
		<category><![CDATA[html archive]]></category>
		<category><![CDATA[robots.txt]]></category>
		<category><![CDATA[wayback machine]]></category>

		<guid isPermaLink="false">http://elradon.me/?p=9</guid>
		<description><![CDATA[Wie so viele Seiten hat auch archive.org einen Spider. Soll der die eigene Seite aber nicht spidern und soll auch auf archive.org nichts f&#252;r deine Seite hinterlegt sein, kannst du den Crawler einfach aussperren.]]></description>
			<content:encoded><![CDATA[<p>Das Internet archivieren, das m&#246;chte archive.org. Doch es gibt verschiedene Gr&#252;nde seine eigene Seite nicht in der <em>Wayback Machine</em> sehen zu wollen. Dank des <em>Robots Exclusion Protocol</em> ist es nat&#252;rlich m&#246;glich archive.org auszusperren und selbst schon indizierte Versionen seiner Seite zu deaktivieren.<span id="more-9"></span></p>
<p>Wenn man ersteinmal wei&#223;, wie es geht, ist es auch nicht schwer&#8230;</p>
<blockquote><p><em>User-agent: ia_archiver<br />
Disallow: /</em></p></blockquote>
<p>in einer robots.txt sperrt sowohl den Zugriff f&#252;r den Spider, als auch deaktiviert es den Zugriff auf schon indizierte Seiten.</p>
<p>Selbstverst&#228;ndlich ist es auch m&#246;glich einzelne Dateien anzuschlie&#223;en. Etwa so:</p>
<blockquote><p><em>User-agent: ia_archiver<br />
Disallow: /impressum.html</em></p></blockquote>
]]></content:encoded>
			<wfw:commentRss>http://elradon.me/blog/archive-org-aussperren.html/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
	</channel>
</rss>

