Common Crawl
Ein großes, öffentlich zugängliches Web-Archiv, das durch regelmäßiges Crawlen des Internets erstellt wird. Die Daten (Milliarden von Webseiten) sind eine wichtige Ressource für das Training großer Sprachmodelle.
Das erste große deutschsprachige KI-Lexikon
Ein Community-Projekt von David Mirga
Ein großes, öffentlich zugängliches Web-Archiv, das durch regelmäßiges Crawlen des Internets erstellt wird. Die Daten (Milliarden von Webseiten) sind eine wichtige Ressource für das Training großer Sprachmodelle.