18@KASK'2016 Wielkoskalowy wieloetykietowy klasyfikator dokumentów tekstowych bazujący na wstępnie nauczonej sieci neuronowej

typ projektu: klasyczny

edycja: 2016

liczba studentów w projekcie 3 - 3

kierownik: -


Celem projektu jest opracowanie i implementacja algorytmu wielkoskalowej
wieloetykietowej klasyfikacji dokumentów tekstowych. Klasyfikowanymi
danymi są artykuły angielskiej wikipedii, których jest ok. 3 milionów
(wielkoskalowość), a każdy może należeć do więcej niż jednej kategorii
(wieloetykietowość) spośród ok. 300 tys. kategorii powiązanych
hierarchicznie. Z racji skali problemu, preferowana jest implementacja
wykorzystująca techniki zrównoleglania obliczeń oraz wykorzystywania
mocy obliczeniowych kart graficznych.
Najbardziej obiecującym
rozwiązaniem wydaje się zastosowanie globalnej głębokiej sieci
neuronowej, której uczenie można wspomóc poprzez zastosowanie
istniejących rozproszonych reprezentacji pojęć języka angielskiego jako
wstępne wagi sieci na początku procesu uczenia.
Projekt dla 3-4 studentów.

Członkowie zespołu

Plakat

Semestr 1 : Brak plakatu
Semestr 2 : Brak plakatu

Prezentacja / Dokumentacja

Semestr 1 : Brak prezentcji
Semestr 2 : Brak prezentcji