31@KASK'2015 Wielkoskalowy wieloetykietowy klasyfikator dokumentów tekstowych

typ projektu: klasyczny

edycja: 2015

liczba studentów w projekcie 3 - 5

kierownik: -


Celem projektu jest opracowanie i implementacja algorytmu wielkoskalowej wieloetykietowej klasyfikacji dokumentów tekstowych. Klasyfikowanymi danymi są artykuły angielskiej wikipedii, których jest ok. 3 milionów (wielkoskalowość), a każdy może należeć do więcej niż jednej kategorii (wieloetykietowość) spośród ok. 300 tys. kategorii powiązanych hierarchicznie. Z racji skali problemu, preferowana jest implementacja wykorzystująca techniki zrównoleglania obliczeń oraz wykorzystywania mocy obliczeniowych kart graficznych.
Najbardziej obiecującym rozwiązaniem wydaje się zastosowanie globalnej głębokiej sieci neuronowej, której uczenie można wspomóc poprzez zastosowanie istniejących rozproszonych reprezentacji pojęć języka angielskiego jako wstępne wagi sieci na początku procesu uczenia.

Członkowie zespołu

Plakat

Semestr 1 : Brak plakatu
Semestr 2 : Brak plakatu

Prezentacja / Dokumentacja

Semestr 1 : Brak prezentcji
Semestr 2 : Brak prezentcji