cc-by-sa-4.0Hämäläinen, MikaAlnajjar, KhalidPartanen, Niko2025-03-242021-02-192021-02-19https://hydatakatalogi-test-24.it.helsinki.fi/handle/123456789/9123The larger corpus consists of fan written stories about Pokémon. The corpus is sentence and word tokenized. The order of sentences is shuffled for copyright reasons. The smaller corpus is a Pokémon description corpus for the first 151 Pokémon. Sources: https://www.fanfiction.net/ and https://www.giantbomb.com/ Please cite the following paper if you use the resources: Hämäläinen, M.,  Alnajjar, K. & Partanen, N. (2021). Nettikorpuksen avulla tuotettuja sanavektorimalleja Pokémonien ominaisuuksien kuvaamiseksi. In Saarikivi, T. & Saarikivi, J. (eds.) Turhan tiedon kirja — Tutkimuksista pois jätettyjä sivuja. p. 199-214. SKS Kirjat Translation of the paper in English  OpenPokémonPokemonPikachuPokémon Story Corpusdataset