Używamy cookies i podobnych technologii m.in. w celu świadczenia usług i w celach statystycznych. Możesz określić warunki przechowywania lub dostępu do plików cookies w Twojej przeglądarce, w jej ustawieniach. Jeżeli wyrażasz zgodę na zapisywanie informacji zawartej w cookies, kliknij „Zamknij”. Jeżeli nie wyrażasz zgody – zmień ustawienia swojej przeglądarki.Więcej informacji znajdziesz w naszej Polityce cookies.

Zamknij informację o cookies
.

Ośrodek  Przetwarzania  Informacji  –  Państwowy  Instytut  Badawczy

Analizy tekstu języka naturalnego

Nasi programiści najlepsi w wykrywaniu zmian stylu autora

Programiści z Laboratorium Inżynierii Lingwistycznej uzyskali najlepszy wynik w międzynarodowym konkursie na wykrywanie plagiaryzmu w tekście w zadaniu Style Breach Detection. Konkurs ogłosił Komitet Konferencyjny PAN (http://pan.webis.de), a rozwiązanie zadania ukazało się w materiałach konferencyjnych CLEF 2017

PAN to międzynarodowa sieć ekspertów zajmujących się detekcją plagiaryzmu. Jej działalność koncentruje się m.in. na rozwoju nowoczesnych technologii, kompilacji nowych rozwiązań dotyczących zbiorów danych, organizowaniu konferencji i konkursów tematycznych.  

Przed uczestnikami postawiono problem zidentyfikowania autora tekstu. W jego ramach zostały ogłoszone dwa zadania: klastrowanie autorów oraz określanie zmiany stylu autorów w tekście. Zespół w składzie: Daniel Karaś, Martyna Śpiewak i Piotr Sobecki z LIL rozwiązał oba zadania. Ich wynik w zadaniu Style Breach Detection okazał się być najlepszy według miary WinF.

Dane potrzebne do rozwiązania konkursu zostały ogłoszone w lutym 2017. Na ich rozwiązanie uczestnicy mieli dwa miesiące. Programiści jako bazę do ich rozwiązania wykorzystali część badań jakie realizowali dla powstającego w naszym Instytucie Jednolitego Systemu Antyplagiatowego.

Publikacja opisująca metodykę użytą do rozwiązania zadań znalazła się w materiałach konferencyjnych CLEF 2017 - konferencji, która odbyła się we wrześniu 2017 r. w Dublinie. Można się z nimi zapoznać pod linkami: http://ceur-ws.org/Vol-1866/paper_133.pdfhttp://pan.webis.de/clef17/pan17-web/author-identification.html.

powrót