Prof. Ogrodniczuk: O tym się mówi w Sejmie! Prosty dostęp do stenogramów.
O Korpusie Dyskursu Parlamentarnego, narzędziu pozwalającym analizować pracę Sejmu i Senatu, w kolejnym wywiadzie LubBezpośrednio.pl!

Jak łatwo analizować jednocześnie wszystkie stenogramy sejmowe od 1919? Czy dostęp do danych parlamentarnych jest prosty? Czym jest Korpus Dyskursu Parlamentarnego? O to pytała Agata Kempa, a odpowiadał prof. Maciej Ogrodniczuk.
Premiera rozmowy będzie miała miejsce w środę 14 czerwca o godzinie 19.00 na kanale LubBezpośrednio na YouTube.
Maciej Ogrodniczuk jest kierownikiem Zespołu Inżynierii Lingwistycznej w Instytucie Podstaw Informatyki Polskiej Akademii Nauk. Ukończył studia magisterskie z informatyki oraz studia doktoranckie z językoznawstwa na Uniwersytecie Warszawskim. Uczestniczył w wielu projektach z zakresu lingwistyki komputerowej i inżynierii lingwistycznej, których efektem było opracowanie kilku korpusów tekstowych (m.in. Korpusu Dyskursu Parlamentarnego, Korpusu Zależności Referencyjnych, Polskiego Korpusu Streszczeń) oraz narzędzi do komputerowego przetwarzania języka polskiego (m.in. Korpusomatu – narzędzia do tworzenia korpusów czy Jasnopisu – aplikacji do mierzenia zrozumiałości tekstu). Obecnie zajmuje się referencyjnym i meta tekstowym opisem języka polskiego oraz tworzeniem korpusu ParlaMint – wielojęzycznego porównywalnego korpusu zasobów parlamentarnych.
Korpus Dyskursu Parlamentarnego jest zbiorem anotowanych lingwistycznie tekstów z posiedzeń plenarnych Sejmu i Senatu RP, interpelacji i zapytań poselskich oraz posiedzeń komisji od roku 1919 do chwili obecnej (są stale uzupełniane materiałami z kolejnych posiedzeń). Teksty opisane metadanymi oraz przetworzone automatycznie narzędziami lingwistycznymi (do segmentacji, analizy morfoskładniowej, rozpoznawania grup składniowych i nazw własnych) są dostępne do przeszukiwania oraz pobrania.