Hi zusammen,
ich muss mir grad für die Arbeit Webscraping (online verfügbare Daten automatisiert in einem verwertbaren Format herunterladen) und ein paar darauf aufbauende Verfahren wie Topic Modelling (also Texte über die verwendeten Wortstämme automatisiert einem Thema zuordnen) beibringen.
Da ich das ganze erst mal experimentell im Kleinen ausprobieren möchte, wollte ich mal in die Runde fragen, ob es okay für euch ist, wenn ich das Vampire-Forum dafür als Spielfeld benutze. Genauer gesagt würde ich mir das Unterforum "Zufällige Treffen der Charaktere" aus der alten Chronik angucken. Daten, die ich extrahieren würde wären: Thread-Titel und Timestamps, Titel, Inhalt, Autor und Timestamps von Posts, Profilnamen, Beitragszahl und Registrierungs-Datum von Usern, die darin geschrieben haben.
Das ganze würde lokal gespeichert, nicht online und ich würde nichts davon veröffentlichen (außer vielleicht mal bei nem OT, nem Domänengeburtstag oder hier im Forum selbst, wenn was witziges dabei rauskommt, aber das bliebe dann ja unter uns).
Deshalb mal konkret an die SL gefragt und auch allgemein in die Runde der Beteiligten: Wäre das für euch okay? Gibt es Bedenken oder Wünsche nach Einschränkungen?