41@KSMM'2022pb AI Tech: Klasyfikator naturalności stylu tekstu - autentyczny czy syntetyczny.
typ projektu: aplikacyjny
edycja: 2022pb
klient:
Piotr Szczuko (Konsorcjum AI Tech - Akademia innowacyjnych zastosowań technologii cyfrowych)
liczba studentów w projekcie 3 - 5
kierownik: Jan Tobolewski
W ramach projektu dokonać należy przeglądu dziedziny parametryzacji tekstu, klasyfikacji tekstów, zastosowań uczenia głębokiego i grafowych sieci neuronowych do przetwarzania języka oraz generowania tekstów modelem GPT-2.
Należy zaimplementować metodę generującą tekst syntetyczny na podstawie podanego ciągu słów, tzw. zachęty, identycznej jak w wybranym, krótkim tekście autentycznym. Następnie, bazując na wybranym gotowym modelu analizy i klasyfikacji tekstu, dotrenować należy go do realizacji nowego zadania - skutecznego rozróżnienia między tekstem autentycznym a syntetycznym.
Zadania do wykonania:
1. Przegląd literatury
2. Przegląd dostępnych implementacji klasyfikacji i generowania tekstu
3. Przygotowanie zbioru danych
4. Wybór modelu
5. Douczanie modelu do zdefiniowanego zadania
6. Weryfikacja działania
7. Analiza wyników i dokumentacja w postaci raportu i publikacji
Temat kierowany wyłącznie do studentów specjalności AI Tech: uczenie maszynowe lub sztuczna inteligencja.
Zgłaszając się do realizacji projektu wykonawca przyjmuje do wiadomości, że temat projektu będzie wymagał przeniesienia praw majątkowych do wytworzonego utworu/wyników projektu w celu publikacji w czasopiśmie naukowym lub materiałach konferencyjnych.
Członkowie zespołu
Karol Baran |
|
Natalia Rucińska |
|
Jan Tobolewski |
|
Tomasz Truszkowski |
|
Prezentacja / Dokumentacja
Semestr 1 : Brak prezentcji |
Semestr 2 |