« China ist für den meisten SPAM verantwortlich | Main | Mac OSX Backup und Re-Install Tricks »
January 08, 2005
Finden, was nicht gefunden werden will: mp3 und cracks für alle!
Google's Spinnenarme greifen weit, manchmal etwas zu weit. Teilweise ist es gar nicht notwendig verschiedenste p2p Suchmaschinen oder Filesharing Programme anzuwerfen, wenn das gute manchmal doch so nahe ist. mp3- Files, Cracks oder auch Telefonnummern können mit ihr gefunden werden, mit der Suchmaschine, die mittlerweile ein Monopol auf dem Searchengine- Sektor besitzt, wenn es um den Bekanntheitsgrad geht. Richtig Suchen muss man können. Dann finden sich auch Inhalte, die gar nicht gefunden werden wollen.Oft wundert man sich über die Suchergebnisse, vor allem von images.google.com, die logischerweise nur sehr vage sein können: Bilder können auch nur sehr schwer automatisch indiziert werden. Die Zuordnung passiert mittels des Textes, der das Bild umgibt, oder auch dem Dateinamen. Daneben kann es auch lustig sein, keine Resultate zu erhalten (wie das relativ bekannte Suchergebnis der französischen Militärerfolge) oder auch unerwartete Antworten zu bekommen. Suchanfragen wie "miserable failure", die auf die Website von G.W. Bush zeigt oder auch diverser anderer Scherze zeigen den Entertainmentfaktor der Suchmaschine.
Neben der bekannten Syntax von Google (ein Überblick findet sich etwas weiter unten) gibt es auch einige undokumentierte Features und Tricks, um bestimmte Inhalte zu finden:
- mp3 Suche - mit der Suche
nach
"Index of /" +mp3finden sich viele Webserver-File-Listings, wo mp3 Dateien gebunkert wurden. Eine weitere Möglichkeit istintitle:"index of /" "parent directory" intitle:"mp3" -filetype:htm -filetype:html- happy leeching!
- Telefonnummern - mit der
Angabe der internationalen Vorwahl des gesuchten Landes und dem Namen
der Person kann oft eine Telefonnummer schnell in Google gefunden
werden: zB.
Vorname Nachname "+43". Meistens zwar nicht der erste Hit, oft aber schneller als das Telefonbuch zu Rate zu ziehen. (Alternativ kann man auch "0043" und "tel" als zusätzliche Suchbegriffe verwenden)
- Sabotage - mit den
Standardtexten verschiedenster (Web-)Services kann man viele offene
Systeme finden, und so auf fremder leute Drucker ausdrucken
intitle:"Home" "Xerox Corporation" "Refresh Status"oder auch private Webcams ansehen:intitle:"my webcamXP server!"inurl:":8080"
Viele Suchmaschinen bedienen sich offener Systeme und frei zugänglicher FTP-Server. filesearching.com und auch andere gelistete Seiten auf ftpsearchengines.com sind FTP-Suchmaschinen. Google indiziert frei zugängliche FTPs noch nicht, was aber sicher nur eine Frage der Zeit sein dürfte. Oft finden sich auch so schon gesuchte Dateien/ Dokumente, ohne Filesharingprogramme verwendet zu haben.
"Seit einigen Jahren ist Google die bekannteste und am häufigsten genutzte Suchmaschine. Google ist auch für die Suche nach PDF-, Postscript-, Word- und PowerPoint-Dateien geeignet." (de.wikipedia.org)
Das bedeutet aber nicht automatisch, dass man genau das findet, was man auch gesucht hat. Die wenigsten Leute kennen die boolschen Operatoren der GoogleSyntax, wie etwa "AND", "OR", "NOT" und Anführungszeichen:
Hier die GoogleSyntax im Überblick (von der Wikipedia-Seite zu google)
- filetype: – Sucht nach Dokumenten, mit bestimmten Dateiendungen. Beispiel: geschäftsbericht filetype:xls . Möglich sind grundsäzlich alle Dateiendungen. Google kann derzeit aber nur in folgende Formate „reinschauen“: PS, PDF, AI, DOC, PPT, XLS, sowie alle textbasierten Dateien wie RTF, TXT, ASP, PHP, CGI, HTM, LOG, INI, JS usw
- site: – mit diesem Schüsselbegriff lässt sich die Suche auf eine bestimmte Domain eingrenzen. Praktisch vor allem dann, wenn eine Homepage keine eigene Suchfunktion hat. Beispiel: Desoxribonukleinsäure site:wikipedia.org
- link: – Gibt alle Seiten aus, die auf eine bestimmte Seite verlinken. Beispiel: link:wikipedia.org .Diese Ausgabe kann z.B. wichtig sein, um den Page Rank zu optimieren oder verwandte Seiten zu finden.
- intitle: – Sucht nach Dokumenten, bei welchen der oder die Suchbegriffe nur im Titel der Datei vorkommen. Beispiel: intitle:"Bearbeiten von Google"
- inurl: – gibt Seiten zurück, bei denen der Suchbegriff in der URL auftaucht. Beispiel: "Karl Müller" inurl:impressum
- daterange: – schränkt die Suche auf das Datum ein, in dem die Seite von Google indiziert wurde. Als Zeitangaben müssen Zahlen bezogen auf das Julianische Datum eingegeben werden. Errechnet werden diese Zahlen aus der Anzahl der Tage die seit dem 1.Januar 4713 v.Chr. vergangen sind. Beispiel: 30.06.2003-30.06.2004 = daterange:2452820-2453186 (Onlinehilfe (http://www.myvasco.com/daterange.htm)). Vorteil für Computer, sie brauchen sich nicht um Formate oder Namen von Tag, Woche oder Jahr zu kümmern.
- cache: – gibt nur die von Google gespeicherten Seiten aus. Ist vor allem praktisch, wenn bei Portalen die Inhalte oft wechseln. Der Link, den man bei Google findet, führt aktuell oftmals auf eine Seite, deren Inhalte sich inzwischen geändert haben oder gar gelöscht wurden. Die Inhalte sind aber über einen bestimmten Zeitraum noch bei Google gespeichert und können dort gelesen werden.
- inanchor: - Sucht nach den Begriffen nur in Links. Oftmals führt ein Link mit einer bestimmten Bezeichnung präziser zu einem Ziel, als wenn die Bezeichnung irgendwo im Text vorkommt.
"Das Suchen per Google ist so einfach und beliebt, dass das Verb googeln oder googlen bereits für die allgemeine Websuche (zunächst nur im Usenet) oder gar überhaupt für die Suche nach Information verwendet wird. Schüler geben an, dass sie lieber und schneller googeln als bibliografieren oder in einer Enzyklopädie oder einem Lexikon nachschlagen. Seit 2004 ist googeln im Duden aufgenommen." (de.wikipedia.org)
Natürlich ist ein Google-Suchergebnis sortiert nach einer selber definierten Relevanz von META-Tags. Das bedeutet auch, dass immer nur der Mainstream der Information sichtbar ist. Ein nettes Projekt mit dem Namen BananaSLUG kämpf dagegen an:
"BananaSlug was designed to promote serendipitous surfing: finding the unexpected in the 3,083,324,652 web pages indexed by Google. Directed Google searches return pages most relevant to your search term, based on the pages' popularity on the Web. You may never see some of the pages way down the list that are relevant or interesting, but off the beaten path. So we give you a little boost. We "seed" your search with another word, chosen at random, and this accidental encounter results in pages you may have overlooked. What, if anything, do all the results have in common? You tell me! We show the seed word at the end of the page, along with the number of results, and how many seed words we needed to try before we got results (it doesn't always happen the first time!)." (BananaSLUG)
Falls übrigens das eine oder andere Suchergebnis von Google unerwünschte Resultate bringt, gibt es die Möglichkeit sich auszutragen. Das gilt auch für alte Seiten in Google's Cache oder Bildersuche. Manche Leute werden gar nicht erst eingetragen oder blockiert. Aber das ist eine andere Geschichte...
