Sensible Texte vor Google, Bots & Crawlern verstecken
Heute stelle ich euch mal wieder eine nette kleine Webapplikation vor. Aber erstmal ein paar Worte vorab. Jeder der sich im Internet bewegt wird schon einmal auf Texte gestoßen sein die in Wirklichkeit keine Texte waren, sondern ein Bild. In den allermeisten Fällen dienen diese Bilder dazu Texte mit sensiblen Daten, wie zum Beispiel Telefonnummern, Email-Adressen, ganze Anschriften und andere Inhalte vor Suchrobotern oder Crawlern aller Gattungen zu schützen. Inhalte eines Bildes können weder von Google indexiert werden, noch von Telefonmarktingagenturen oder Spamverteilern automatisch abgefarmt werden.
Besonders in Impressen kommt diese Technik mittlerweile häufig zum Einsatz, denn sie sind Anlaufstelle Nummer 1 für Datensammler. Für die meisten von uns ist so ein Bild vermutlich relativ schnell mit einem entsprechenden Grafikprogramm erstellt, jedoch nicht für jeden. An dieser Stelle bietet sich dann ein Service mit Namen TXTNinja an. Der TXTNinja ist ein kostenloses Tool um Texte schnell in eine Grafik umzuwandeln. Man gibt den gewünschten Text einfach ins Eingabefeld ein, wählt Schriftart, Schriftgröße, Schriftfarbe und Hintergrundfarbe aus und mit einem Klick auf Ninjafy geht es los. Einen Mausklick später ist der Text in ein Bild umgewandelt worden.
Dieses Bild kann man dann bequem speichern und es auf dem eigenen Webspace oder bei einem Bilderhoster hochladen. Neben dem fertigen Bild und der entsprechenden URL bietet der TXTNinja jedoch auch noch 2 weitere Optionen an. Die Bild-URL wird automatisch in BB-Code (für Foren) und HTML-Code integriert und kann einfach entführt werden. Die maximale länge eines Texte schätze ich auf rund 200-250 Zeichen, danach wirkt das Bild abgeschnitten. Auch Zeilenumbrüche lassen sich nicht realisieren, das Bild wächst stetig in die Breite.
Der ein oder andere wird sich jetzt fragen warum ich so eine Spielerei hier vorstelle? Nun, trotz aller Spielerei finde ich diese kleine Tool ganz nützlich. Mit dem TXTNinja habe ich Text in ein Bild umgewandelt und eingebunden noch bevor mein Photoshop mit dem laden fertig ist. Ausserdem hat man ja nicht immer ein Grafikprogramm zur Hand wenn man unterwegs ist.
Ein Beispiel für die Arbeit vom TXTNinja darf natürlich auch nicht fehlen:

An manchen Tagen spiele ich mit dem Gedanken hier alle Texte nur noch als Grafik anzubieten, denn gestern habe ich wiedermal einen Blog entdeckt der fleißig meine Artikel 1:1 kopiert hatte. Wenns ein Bild wäre hätte der Dieb wenigsten abtippen müssen. Aber so, alles was sich mit STRG+C markieren lässt steht wohl zur freien Verfügung im Netz. Nunja, den Frust über sowas verwerfe ich dann meist schnell wieder. Denn wenn hier alles aus Bildern bestünde würde mir der Traffic wohl irgendwann ein Loch in den Geldbeutel fressen. Und so ganz ohne Spidermänner und Suchroboter ist ja auch nichts, dann bleiben schnell die heißgeliebten Besucher aus.
Zur Umwandlung des eigenen Impressums in ein Bild habe ich noch eine Anmerkung/Frage an euch. Ich bin mir aktuell nicht wirklich sicher ob es erlaubt ist das gesamte Impressum in ein Bild umzuwandeln oder ob das unter Umständen nicht auch wieder ein Grund ist Abmahnungen befürchten zu müssen. Habe da so einen Bericht im Kopf den ich leider aktuell nicht wiedergefunden habe. Wer mehr zu diesem Thema weiß darf sich also gerne zu Wort melden.
Verwandte Artikel:
Abgelegt unter: Internet
Benutzer, die diese Seite fanden, suchten auch nach:
- Inhalte vor robots verstecken
- text für anschriften verstecken html
- wie google verstecken
- css googlebot verstecken
- html vor google bot schützen
- bot crawler liste
- email vor robots verbergen
- wordpress impressum google verstecken
- email address crawler
- html seiten verstecken bots

Ich hab neulich erst wieder nachgeschaut und es ist noch immer so, dass das Impressum NICHT aus einer Grafik bestehen darf.
Wer desswegen abgemahnt wird ist also selbst schuld.
Wie das bei einzelnen Sachen wie zum Beispiel der Mail-Adresse ist weiß ich allerdings nicht. Bei solchen Fragen am besten immer jemanden fragen der sich mit sowas auskennt
Und zum Thema geklauter Inhalt: ich würde mich immer erst direkt an den Verfasser wenden. Ist keine Kontaktmöglichkeit zu finden würde ich einen Kommentar schreiben.
Wenn keinerlei Reaktion kommt, dann kann man immernoch gezielt die Krallen ausfahren.
Wie maya schon sagt. Impressum und Bild iss nicht. Ansonsten wenn Du Deine Inhalte als Bild anbieten willst, kannst ja für die Robots den Text im Alt Tag schreiben Lol
Soweit ich informiert bin ist es völlig unklar, ob Privatpersonen die nicht gewerblich bloggen überhaupt ein Impressum brauchen.
Das schlimmste was diesem Personenkreis passieren kann ist, von der zuständigen Aufsichtsbehörde aufgefordert zu werden, das Impressum zu ergänzen. Wer auf diese Aufforderung nicht reagiert, wird in ganz seltenen Fällen mit einem Bußgeld belegt.
Abmahnungen gegen den oben genannten Personenkreis sind doch eh nciht möglich. Abmahnung kann man z.B. bei Wettbewerbsverstößen oder Urheberrechtsverletzungen. Und auch da nur die Geschädigten oder Mitbewerber – beides gibt es bei einem rein privaten Blogger ohne gewerbliches handeln nicht.
Dass Google ein Bild im Impressum nicht “lesen” kann, ist ein gefährliches Gerücht. Johannes Müller von Google hat auf der SMX in München gezeigt, wie Google Spam erkennt. Jede billige OCR Software kann Text erkennen über jeden billigen Scanner. Warum sollte Google, die technisch problemlos Gesichter auf Gruppenfotos erkennen können (siehe Picasa!), die Schrift in einem Gif oder jpg nicht lesen können? Johannes Müller hat bei der Frage, die er selber gestellt hat, statt einer Antwort nur gelächelt. Im Gegenteil halte ich es für gefährlich, ein Impressum SO verstecken zu wollen! Das ist doch recht in Indiz für die Suchmaschine, dass mit der Domain was nicht in Ordnung ist – von den rechtlichen Problemen ganz abgesehen.
Der einfachste, beste und billigste Weg ein Impressum vom Robot zu “verstecken” ist, die Seite in der robots.txt auszuschließen und in die Metatags “noindex” reinzuschreiben!
Um den Text vor Spambots zu verstecken, hilft das freilich nix. Aber Google ein starkes Signal zu setzen, in dem man das als Bild “tarnt”… Dieses Risiko würde ich wg. ein paar Spambots nicht eingehen!
@Mario Fischer Sorry aber das Google etwas dagegen hat wenn in Impressum etwas als Bild ist glaub ich nicht. Da hätte Google viel zu tun und müsste einige “abstrafen”. Es gibt genug Seiten die bestimmte Daten als Bild hinterlegt haben.
@Parkrocker Warum kommt eigentlich immer wennn es ums Thema Impressum geht jemand mit der Aussage daher wegen privaten Blogs und so? Wer sagt das es um private Blogs geht? Was ist ein rein privater Blog? Ab wann ist er gewerblich? Und warum sollte ein privater Blogger nicht abgemahnt werden können?
@Maya & @Markus Freut mich das zu lesen, dann liege ich ja richtig mit meiner Vermutung dass ein reines Bildimpressum ein NoGo ist. Emailadresse alleine als Bild aber müsste theoretisch in Ordnung sein.
@parkrocker Ich gebe zu, ich bin auch nicht auf dem aktuellste Stand bzgl. Impressumspflicht. Mein letzter Stand ist das Seiten, im speziellen Blogs, mit rein privaten und familiären Inhalt aktuell noch ohne Impressum ins Web gestellt werden dürfen. Jedoch reicht beispielsweise schon das einbinden einer Adsense-Anzeige aus um unter die Impressumspflicht zu fallen.
@Mario Ich gestehe, ich kenne weder Johannes Müller noch weiß ich was sich hinter der SMX verbirgt. Die Tatsache das Bildinhalte erkannt werden können habe ich schon einmal gelesen, und ich glaube auch gerne das so etwas bei Bilddiensten wie Picasa eingesetzt wird, aber ob sich Google wirklich die Mühe macht diese Technik auch bei der Indexierung von kleinen Blogs/Webseiten zu nutzen bezweifle ich.
Mir persönlich ist der Google Bot immer willkommen, auch wenn das aus dem Titel des Artikel nicht so hervorgeht. Aber dadurch dass ich den Google Bot anspreche wirkt der Artikel ja gleich ein wenig anziehender *g*. Die Möglichkeit Inhalte durch die robots.txt zu “verstecken” ist bekannt.
Der Googlebot ist also nicht das Sorgenkind, sondern viel eher die Armee der Zwielichtigen Datensammler. Wenn ich mir Logs anschaue was hier so täglich durch meinen kleinen Blog spidert krieg ich echt große Augen. Ich denke wenn man zumindest die eigene Mailadresse (die ins Impressum gehört) als Bild einbindet gehen einige Datensammler leer aus. Auch manuelle Adressensammler müssen sich dann mehr Mühe machen für 1 Eintrag.
Noch als kleine Anekdote, erst gestern habe ich einem Forum einen Beitrag gelesen wo jemand knapp 10.000 handgesammelte “gültige” Mailadressen höchstbietend verkaufen wollte.
Die Robots.txt kann aber nicht die alleinige Lösung sein – siehe hier
Irgendwie bezweifle ich, dass es nicht legitim ist, ein Impressum als Bild zu verwenden. Ebenso wie Mario Fischer bezweifle ich auch, dass Bilder nicht gelesen werden können (OK – eine gewisse Hürde ist es schon).
Was die Impressumspflicht betrifft, so schließe ich mich Markus an: Meines Erachtens sind auch private Blogs dazu verdonnert, Angaben nach MdStV zu tätigen.
Doch leider hab ich auch keine Lösung für das Dilemma
Im Telemediengesetz (TMG) §5 Absatz 1:
[...] Diensteanbieter haben für geschäftsmäßige Teledienste mindestens folgende Informationen leicht erkennbar, unmittelbar erreichbar und ständig verfügbar zu halten [...]
So was ist jetzt ständig verfügbar? Bilder sind es nicht, auch wenn Browser dominieren die Bilder anzeigen. Dann gibt es ja noch die Verordnung zur Schaffung barrierefreier Informationstechnik nach dem Behindertengleichstellungsgesetz, wo ich jetzt nicht genau schlau draus werd ob die immer noch nur für Behörden gilt?
http://bundesrecht.juris.de/bitv/__1.html
Da es auch kein Grundsatzurteil meines wissens gibt, ist das ein ganz gefährliches Ding in meinen Augen-
Ich sage nur Textbrowser.
Selbst wenn man nicht genau weiß was das ist kann man die Spannung zwischen den Begriffen “Textbrowser” und “Grafik” quasi spühren.
Und robots.txt und Co. sind auch keine ultimativen Lösungen, weil es nunmal auch SuMas gibt, denen Wurscht ist, was in dieser Datei steht.
Präzisierung: Ich meinte nicht, dass ein “Bild”Impressum gleich eine Strafe verursacht. Warum immer so schwarz-weiß gedacht? Es ist (kann sein) eines von mehreren Signalen. In der Regel bestraft Google nie auf Grund nur eines einzelnen Grundes. Aber wenn mehr dubiose Dinge zusammen kommen…
Und “warum soll sich Google die Mühe machen, das zu scannen…” – Hallo? Wo soll hier Aufwand oder Mühe sein? Das macht eine Maschine und in der gleichen Geschwindigkeit wie das Parsen von Text. Ich kann nur immer und immer wieder raten, sich näher mit G. und dessen technischen Möglichkeiten zu beschäftigen. Die haben da nicht nur ein paar Großerechner mit USB-Platten rumstehen. Experten schätzen, dass G. “Datenverarbeitung” etwa zehn mal günstiger und schneller abwickeln, als die besten IT-Unternehmen der Welt.
SMX: Search Marketing Expo. Eine der großen Konferenzen, bei denen es eigentlich nur um Suchmaschinen geht.
Ich bezweifel, dass Google diesen Text nicht lesen kann. Vor google kann man nichts mehr verstecken, Google liest sogar SWF Dateien aus und analyisiert darin enthaltene Texte.
Und Seit google reCaptcha übernommen hat, dürften auch sehr schwierige Bilder für google kein Problem mehr darstellen.
Ich würde mich darauf zumindest nicht verlassen, was keiner lesen soll stellt man nicht ins Internet
Deshalb schrieb ich ja “gewerblich”. Sobald Adsense drauf ist, wird das Blog gewerblich betrieben (weil mit Gewinnerzielungsabsicht).
Mit einer Abmahnung setzt man Unterlassungsansprüche im Zivilrecht durch. Wer mag denn jetzt mal das Zivilrecht, das fehlende Impressum eines privaten (nicht gewerblich handelnden) Bloggers und einen Unterlassungsanspruch konstruieren? Keiner?
Natürlich gibt es gesetzliche Vorschriften zur Impressumspflicht. Die durchzusetzen ist allerdings nicht Aufgabe irgendwelcher Abmahner, sondern der Behörden.
Im Zwiefelsfall schreibt man sich eine ausgedachte Adresse aus dem Ausland ins Impressum und ins Whois und selbst die Behörden betrachten den Fall als erledigt.
>und selbst die Behörden betrachten den Fall als erledigt.
Kommt auf die Schwere des Falls an. Wenn die Behörde in diesem Fall das Finanzamt ist, muss man sich warm anziehen. Unabhängig von der Adresse und dem Whois-Eintrag hinterlässt man Spuren. Die Domain muss irgendwie bezahlt werden, schließlich nehmen die Anbieter selten Bargeld entgegen… Das zu recherchieren ist für eine Behörde kein Hexenwerk. Eine reine Mitbewerber-Abmahnung wird sicher ins Leere laufen. Aber die Behördenmühlen mahlen – langsam zwar – aber sie mahlen…
@Mario Hallo? Entschuldige bitte meine Unwissenheit. Mein subjektiver Eindruck ist das es heutzutage bestimmt immer noch ein Mehraufwand für eine Maschine ist Bilder ebenso zu lesen wie Text. Bei bestimmten Portalen die als Foto-Community etc. identifiziert werden kommt das möglicherweise zur Anwendung. Aber bei den Trilliarden Bildern aus denen das Web besteht? Ich weiß ja nicht. Aber wenn du sagst das es keinen Unterschied macht dann nehme ich das natürlich so hin. Danke auch für die Erklärung zur SMX.
@Parkrocker Da habe ich dich wohl falsch verstanden, dann sind wir uns ja einig. Deine Methode für den Zweifelsfall würde ich allerdings nicht als Tipp weitergeben wollen. Ich persönlich mache um deutschsprachige Seiten mit Impressen die Adressen im Ausland (besonders englische Briefkastenfirmen) zeigen schon seit längerem einen großen Bogen. Habe da viel mehr schlechte als positive Erfahrungen gesammelt in der Vergangenheit.
Eine Frage habe ich aktuell jedoch noch offen zum Thema Impressum. Wie schaut es mit Service-Rufnummern aus? Also anstelle der richtigen Festnetz-Nummer? Ich habe festgestellt das ein paar Tage nachdem mein Impressum häufiger aufgerufen wurde auch die Zahl an Werbeanrufen wieder ansteigt.
Eine Frage. Zuerst lese ich folgendes Zitat:
“Besonders in Impressen kommt diese Technik mittlerweile häufig zum Einsatz, denn sie sind Anlaufstelle Nummer 1 für Datensammler.”
Aber dann gibt man TxtNinja all seine Daten? Werden ja dann vermutlich auch ein nettes Datenbänkchen haben!
Möglich ist alles, aber ich bezweifle das die Daten die man in ein Bild umwandelt dort auf diese Weise gespeichert werden. Das Bild wird auf Wunsch gehostet, ja. Aber ich glaube nicht das da eine große Gefahr besteht.
Ein Impressum als Grafik dürfte abmahnfähig sein.
Ähnliche Urteile dazu gab es meiner Meinung schon einmal gegen eBay-Anbieter, die Imp. und Widerruf so dargestellt hatten.
Dass TxtNinja Daten sammeln könnte, ist ein interessanter Aspekt, den ich bis jetzt noch nicht so betrachtet hatte, der aber vielleicht weiter recherchiert werden könnte.
Hallo Piet,
toller Artikel, ein paar Wochen früher und ich hätte mir die ganze Sache mit der robots.txt und dem verstecken meiner Adresse sparen können! Mist, wie findest du sowas immer!
Ich habe danach auch gesucht und habe es nicht gefunden! Leider!
Aber wie gesagt sehr informativ!
Zu dem Punkt, ob die Nutzung mahntechnisch verfolgt wird, kann ich leider nichts beitragen, aber ich habe die Nutzung schon sehr oft gesehen und bis dato noch nie gelesen, dass jemand davon abgemahnt worden wäre?
Aber wie gesagt, ich weiß es leider nicht!
Gruß
Matthias
Zum Thema Werbeanrufe und Bots würde ich folgende Methode empfehlen:
“CSS unicode-bidi” http://www.csarven.ca/hiding-email-addresses
Ich hab das auf große Teile meines Impressums angewendet und bin seit ca. einem Jahr werbefrei
Werbefrei, das würde ich auch gern mal erleben!
Ich stehe gerade vor der Problematik zwischen meinen Namen/Tel/Mail-Addy (nicht als Text einzublenden) und gleichfalls kein Bild wegen unsicherer/unbekannter aktueller Rechtslage zu verwenden.
Ich versuche darum mom einen kleinen Spagat:
Ich wandel ein Kontaktdaten-Bild in HTML mit einem Programm um (gibt es auch Online-Konverter für) und füge dann dieses HTML-Table-Konstrukt ins Impressum ein.
Nachteil:
- viel Quellcode -> kann man aber bei 2 Farben noch etwas mit CSS optimieren.
- nicht barrierefrei
Vorteil:
- es ist kein Bild -> also auch auch mit jedem Browser der HTML darstellen/parsen kann sichtbar