18@KASK'2016 Wielkoskalowy wieloetykietowy klasyfikator dokumentów tekstowych bazujący na wstępnie nauczonej sieci neuronowej
typ projektu: klasyczny
edycja: 2016
liczba studentów w projekcie 3 - 3
kierownik: -
Celem projektu jest opracowanie i implementacja algorytmu wielkoskalowej
wieloetykietowej klasyfikacji dokumentów tekstowych. Klasyfikowanymi
danymi są artykuły angielskiej wikipedii, których jest ok. 3 milionów
(wielkoskalowość), a każdy może należeć do więcej niż jednej kategorii
(wieloetykietowość) spośród ok. 300 tys. kategorii powiązanych
hierarchicznie. Z racji skali problemu, preferowana jest implementacja
wykorzystująca techniki zrównoleglania obliczeń oraz wykorzystywania
mocy obliczeniowych kart graficznych.
Najbardziej obiecującym
rozwiązaniem wydaje się zastosowanie globalnej głębokiej sieci
neuronowej, której uczenie można wspomóc poprzez zastosowanie
istniejących rozproszonych reprezentacji pojęć języka angielskiego jako
wstępne wagi sieci na początku procesu uczenia.
Projekt dla 3-4 studentów.
Członkowie zespołu
Plakat
Semestr 1 : Brak plakatu |
Semestr 2 : Brak plakatu |
Prezentacja / Dokumentacja
Semestr 1 : Brak prezentcji |
Semestr 2 : Brak prezentcji |