Reddit verbietet allen Suchmaschinen außer Google, seine neuen Beiträge und Inhalte zu durchsuchen, um seine Daten vor KI-Missbrauch zu schützen.
Im Februar schloss Google eine Vereinbarung mit Reddit, die es dem Unternehmen erlaubt, seine KI-Modelle mit Reddit-Inhalten zu trainieren. Im Gegenzug würde Google Reddit-Beiträge in den Suchergebnissen aufwerten.
OK, this is a huge story. Reddit has completely blocked Bing search.
Google just bought off one of the biggest data sources on the web:
Huge find from @thetafferboy and reported by @rustybrick. Microsoft has also publicly confirmed that Bing has been blocked via Reddit's… pic.twitter.com/pdEcWIijMF
— Chris Long (@gofishchris) July 25, 2024
Hat der Deal zwischen Google und Reddit Auswirkungen auf die Richtlinie?
Vielen ist wahrscheinlich schon aufgefallen, dass Reddit-Beiträge bei vielen Suchanfragen ganz oben in den Google-Suchergebnissen auftauchen. Die genaue Zahl wurde noch nicht offiziell bekannt gegeben, aber Bloomberg berichtet, dass der Deal etwa 60 Milliarden Dollar wert sein soll.
Am 1. Juli änderte Reddit seine “robots.txt”-Datei, um zu verhindern, dass andere Suchmaschinen als Google die Daten auf der Plattform durchsuchen. Als diese Nachricht bekannt wurde, gab es im Internet Spekulationen, dass dies mit der Vereinbarung zwischen Google und Reddit vom Februar zusammenhänge.
Reddit-Sprecher Tim Rathschmidt erklärte jedoch gegenüber The Verge, dass die Entscheidung nichts mit dem Google-Deal zu tun habe. Er fügte hinzu, dass man sich mit Betreibern anderer Suchmaschinen in Verbindung gesetzt habe, aber keine Einigung erzielen konnte, da diese nicht bereit waren, einklagbare Verpflichtungen einzugehen, wie sie Reddit-Inhalte nutzen würden, einschließlich für KI-Zwecke.
Wer mit einer anderen Suchmaschine als Google nach Reddit-Beiträgen sucht, bekommt nur Beiträge angezeigt, die älter als einen Monat sind – also vor der Änderung der “robots.txt”-Datei. Man darf gespannt sein, wie sich das auf andere Suchmaschinen auswirkt, denn Reddit ist eine riesige Informationsquelle. Ohne Zugang zu den Daten von Reddit könnten sie im Wettlauf mit der künstlichen Intelligenz ins Hintertreffen geraten.
was @Reddit 's robots.txt always a disallow:/ ?@lilyraynyc @rustybrick pic.twitter.com/Vc43hPuDOc
— Paulo 🐀 (@pandraus) July 3, 2024