Używamy cookies i podobnych technologii m.in. w celu świadczenia usług i w celach statystycznych. Możesz określić warunki przechowywania lub dostępu do plików cookies w Twojej przeglądarce, w jej ustawieniach. Jeżeli wyrażasz zgodę na zapisywanie informacji zawartej w cookies, kliknij „Zamknij”. Jeżeli nie wyrażasz zgody – zmień ustawienia swojej przeglądarki.Więcej informacji znajdziesz w naszej Polityce cookies.

Zamknij informację o cookies
.

Ośrodek  Przetwarzania  Informacji  –  Państwowy  Instytut  Badawczy

Programiści z OPI PIB najlepsi w wykrywaniu zmian stylu autora (ang. style breach detection)

Programiści z OPI PIB najlepsi wykrywaniu zmian stylu autora (ang. style breach detection)

Programiści z Laboratorium Inżynierii Lingwistycznej uzyskali najlepszy wynik w międzynarodowym konkursie na wykrywanie plagiaryzmu w teście, w zadaniu Style Breach Detection. Konkurs ogłosił Komitet Konferencyjny PAN (http://pan.webis.de), a rozwiązanie zadania ukazało się w materiałach konferencyjnych CLEF 2017.

PAN to międzynarodowa sieć ekspertów zajmujących się detekcją plagiaryzmu. Jej działalność koncentruje się m.in. na rozwoju nowoczesnych technologii, kompilacji nowych rozwiązań dotyczących zbiorów danych, organizowaniu konferencji i konkursów tematycznych.  

Przed uczestnikami postawiono problem zidentyfikowania autora tekstu. W jego ramach zostały ogłoszone dwa zadania: klastrowanie autorów oraz określanie zmiany stylu autorów w tekście. Zespół w składzie: Daniel Karaś, Martyna Śpiewak i Piotr Sobecki z LIL rozwiązali oba zadania. Ich wynik w zadaniu Style Breach Detection okazał się być najlepszy według miary WinF.

Dane potrzebne do rozwiązania konkursu zostały ogłoszone w lutym. Na ich rozwiązanie uczestnicy mieli dwa miesiące. Programiści, jako bazę do ich rozwiązania wykorzystali część badań, jakie realizowali dla powstającego w naszym Instytucie Jednolitego Systemu Antyplagiatowego.

Publikacja opisująca metodykę użytą do rozwiązania zadań znalazła się w materiałach konferencyjnych CLEF 2017, która odbędzie się we wrześniu w Dublinie. Już teraz można się z nim zapoznać pod linkiem:

http://ceur-ws.org/Vol-1866/paper_133.pdf

Cała publikacja znajduje się pod poniższym linkiem:

http://pan.webis.de/clef17/pan17-web/author-identification.html