Dorian2B 's Collections

📚 Humanities - Dataset (Pre-training)

Petit Dataset de pre-training en langue française. (Environ 8 Millions de jetons)