Plik zawiera listę haseł Słownika języka polskiego J. Karłowicza, A.A. Kryńskiego i W. Niedźwiedzkiego (1900-1927), tzw. „warszawskiego”. Sam słownik można przeszukiwać na stronie http://poliqarp.wbl.klf.uw.edu.pl/pl/slownik-warszawski/ i (nowej i docelowej) https://szukajwslownikach.uw.edu.pl/. [...]
Niniejsza wersja korpusu zawiera 1000 próbek, po 200 w każdym ze stylów. Cały korpus liczy 1 055 293 słów (segmentów między spacjami). Ponieważ kierowaliśmy się zasadą zapisywania pełnych zdań, długość próbki może się wahać nie więcej niż 10% od przyjętych 1000 słów, przy czym we fragmentach dramatu do liczby tej nie liczą się didaskalia i imiona postaci (z wyjątkiem pierwszego wystąpienia). [...]
Udostępniamy drugą wersję roboczą korpusu tekstów z lat 1830-1918. Aktualnie w jego skład wchodzi 414 próbek podzielonych na pięć stylów funkcjonalnych. Obecny stan korpusu obrazuje około 40% jego rozmiaru docelowego. [...]
Udostępniamy pierwszą wersję korpusu roboczego tekstów z lat 1830-1918. Jest to wersja, w skład której wchodzi 200 próbek podzielonych na pięć stylów funkcjonalnych. Obecny stan korpusu obrazuje 20% jego rozmiaru docelowego (docelowo ma składać się z 1000 próbek po 1000 słów). [...]