heise online: KI-Training: Urheberrechtlich geschützter Datensatz von Buchtexten jetzt offline
Monatelang war eine Textdatei aus fast 200.000 Buchtexten einfach abrufbar, damit wurden KI-Systeme trainiert. Nun wurde sie offline genommen – und analysiert.
Oliver Schafeld hat dies geteilt.