TÁVKÖZLÉSI ÉS MÉDIAINFORMATIKAI TANSZÉK
Budapesti Műszaki és Gazdaságtudományi Egyetem - Villamosmérnöki és Informatikai Kar

Keresés eredménye gépi tanulás kulcsszóra keresve

Deep Learning: Mély neurális hálózat alapú gépi tanulás
A számos tudományterületen kinyerhetõ nagy adatmennyiségnek, továbbá a nagy tárolási- és számítási kapacitásnak köszönhetõen a statisztikai alapú adatvezérelt rendszerek az elmúlt évtizedben jelentõs teret hódítottak meg a szabályalapú megoldásokkal szemben. Alkalmazási területtõl (pl. kép-, szöveg-, beszédfeldolgozás) függõen különbözõ matematikai modelleket használnak. Az elmúlt évek egyik legígéretesebb technológiája a mély tanulás (deep learning) alapú modellalkotás. A mély tanuláson alapuló mély neurális hálózatok új tipusú architektúrájuknak és többszintû rejtett rétegeinek köszönhetõen a korábbi hálózatoknál pontosabb és általánosabb modellezésre képesek. A hallgató feladata a félév(ek) során segítségünkkel a gépi tanulás és a mély tanulás alapjainak és a rendelkezésre álló eszközöknek a megismerése után egy közösen választott probléma megoldása. Ilyen feladat lehet például (1) zenei számok azonosítása; (2) rosszindulatú bõrdaganat szûrés; (3) gépi szövegfelolvasó (Text-To-Speech) természetességének növelése; (4) beszédfelismerés; (5) pénzügyi idõsorok modellezése; (6) személyi asszisztens, intelligens chatbot; (7) intelligens játékos az Open AI Gym-ben (pl. "Gyõzd le a 2048-at!", "DeepSneak", "MarioKart"). A munka a legelterjedtebb, magas szintû deep learning keretrendszerek segítségével folyik (pl. TensorFlow, PyTorch, Keras). A hallgatónak a munka elõrehaladtával nagyteljesítményû GPU erõforrást biztosítunk. A feladatok megoldása jelentõs mennyiségû programozást kíván (elsõsorban Python, de lehet LUA vagy C, C++ nyelven). Tudományos érdeklõdés esetén lehetõség van kutatási munkára is, a téma elméleti kihívásokat tartalmaz, amely TDK konferencián való részvételhez is megfelel. A téma diplomáig, illetve akár PhD témaként is folytatható. Elvárás: Korrekt, egyenletes munkavégzés, proaktívitás, olvasás szintû angoltudás. Elõny: "Deep Learning a gyakorlatban Python és LUA alapon" (VITMAV45) tárgyban szerzett 4-es vagy 5-ös osztályzat.
Témavezető: Gyires-Tóth Bálint
Mély neurális háló alapú beszédszintézis (Deep learing)
A gépi tanulás az élet sok területén használható, így a beszéd elõállítására is. A Google kutatói által kifejlesztett WaveNet rendszer segítségével közvetlenül elõállítható a beszéd hullámformája: https://deepmind.com/blog/wavenet-generative-model-raw-audio/ A generált beszédnek fontos szerepe van mai felhasználó interfészekben (pl. Apple Siri, Amazon Echo, Microsoft Cortana), ezért a generált beszéd minõségének javítása folyamatos igény. A hallgató feladata lenne megismerkedni a mély neurális halók mûködésével és tanításával, majd a beszédszintézisben ezt alkalmazni. Elvárás a rendszeres munka, a korrekt hozzáállás. A téma diplomatervig is folytatható, TDK munkára is alkalmas.
Témavezető: Dr. Zainkó Csaba