aktualności

1829

Po długiej przerwie dodajemy dziś kolejny rok wstecz, 1829. Paczka składa się z próbek i plików meta, bez korekty i pełnych plików źródłowych. [...]

lista haseł Słownika „warszawskiego”

Plik zawiera listę haseł Słownika języka polskiego J. Karłowicza, A.A. Kryńskiego i W. Niedźwiedzkiego (1900-1927), tzw. „warszawskiego”. Sam słownik można przeszukiwać na stronie http://poliqarp.wbl.klf.uw.edu.pl/pl/slownik-warszawski/ i (nowej i docelowej) https://szukajwslownikach.uw.edu.pl/. [...]

korpus, wstępna wersja pełna

Niniejsza wersja korpusu zawiera 1000 próbek, po 200 w każdym ze stylów. Cały korpus liczy 1 055 293 słów (segmentów między spacjami). Ponieważ kierowaliśmy się zasadą zapisywania pełnych zdań, długość próbki może się wahać nie więcej niż 10% od przyjętych 1000 słów, przy czym we fragmentach dramatu do liczby tej nie liczą się didaskalia i imiona postaci (z wyjątkiem pierwszego wystąpienia). [...]

Korpus, wersja 0.4

Udostępniamy drugą wersję roboczą korpusu tekstów z lat 1830-1918. Aktualnie w jego skład wchodzi 414 próbek podzielonych na pięć stylów funkcjonalnych. Obecny stan korpusu obrazuje około 40% jego rozmiaru docelowego. [...]

Korpus, wersja 0.2

Udostępniamy pierwszą wersję korpusu roboczego tekstów z lat 1830-1918. Jest to wersja, w skład której wchodzi 200 próbek podzielonych na pięć stylów funkcjonalnych. Obecny stan korpusu obrazuje 20% jego rozmiaru docelowego (docelowo ma składać się z 1000 próbek po 1000 słów). [...]

Początek

Na tej stronie wkrótce pojawią się informacje na temat projektu poświęconego automatycznej analizie fleksyjnej polszczyzny XIX wieku zainicjowanego w Instytucie Języka [...]