41@KSMM'2022pb AI Tech: Klasyfikator naturalności stylu tekstu - autentyczny czy syntetyczny.

typ projektu: aplikacyjny

edycja: 2022pb

liczba studentów w projekcie 3 - 5

kierownik: Jan Tobolewski


W ramach projektu dokonać należy przeglądu dziedziny parametryzacji tekstu, klasyfikacji tekstów, zastosowań uczenia głębokiego i grafowych sieci neuronowych do przetwarzania języka oraz generowania tekstów modelem GPT-2.
Należy zaimplementować metodę generującą tekst syntetyczny na podstawie podanego ciągu słów, tzw. zachęty, identycznej jak w wybranym, krótkim tekście autentycznym. Następnie, bazując na wybranym gotowym modelu analizy i klasyfikacji tekstu, dotrenować należy go do realizacji nowego zadania - skutecznego rozróżnienia między tekstem autentycznym a syntetycznym.



Zadania do wykonania:

1. Przegląd literatury

2. Przegląd dostępnych implementacji klasyfikacji i generowania tekstu

3. Przygotowanie zbioru danych


4. Wybór modelu

5. Douczanie modelu do zdefiniowanego zadania

6. Weryfikacja działania

7. Analiza wyników i dokumentacja w postaci raportu i publikacji

Temat kierowany wyłącznie do studentów specjalności AI Tech: uczenie maszynowe lub sztuczna inteligencja.




Zgłaszając się do realizacji projektu wykonawca przyjmuje do wiadomości, że temat projektu będzie wymagał przeniesienia praw majątkowych do wytworzonego utworu/wyników projektu w celu publikacji w czasopiśmie naukowym lub materiałach konferencyjnych.


Członkowie zespołu

Karol Baran
Natalia Rucińska
Jan Tobolewski
Tomasz Truszkowski

Prezentacja / Dokumentacja

Semestr 1 : Brak prezentcji
Semestr 2