TÁVKÖZLÉSI ÉS MÉDIAINFORMATIKAI TANSZÉK
Budapesti Műszaki és Gazdaságtudományi Egyetem - Villamosmérnöki és Informatikai Kar

Keresés eredménye deep learning kulcsszóra keresve

Deep Learning: Mély neurális hálózat alapú gépi tanulás
A számos tudományterületen kinyerhetõ nagy adatmennyiségnek, továbbá a nagy tárolási- és számítási kapacitásnak köszönhetõen a statisztikai alapú adatvezérelt rendszerek az elmúlt évtizedben jelentõs teret hódítottak meg a szabályalapú megoldásokkal szemben. Alkalmazási területtõl (pl. kép-, szöveg-, beszédfeldolgozás) függõen különbözõ matematikai modelleket használnak. Az elmúlt évek egyik legígéretesebb technológiája a mély tanulás (deep learning) alapú modellalkotás. A mély tanuláson alapuló mély neurális hálózatok új tipusú architektúrájuknak és többszintû rejtett rétegeinek köszönhetõen a korábbi hálózatoknál pontosabb és általánosabb modellezésre képesek. A hallgató feladata a félév(ek) során segítségünkkel a gépi tanulás és a mély tanulás alapjainak és a rendelkezésre álló eszközöknek a megismerése után egy közösen választott probléma megoldása. Ilyen feladat lehet például (1) zenei számok azonosítása; (2) rosszindulatú bõrdaganat szûrés; (3) gépi szövegfelolvasó (Text-To-Speech) természetességének növelése; (4) beszédfelismerés; (5) pénzügyi idõsorok modellezése; (6) személyi asszisztens, intelligens chatbot; (7) intelligens játékos az Open AI Gym-ben (pl. "Gyõzd le a 2048-at!", "DeepSneak", "MarioKart"). A munka a legelterjedtebb, magas szintû deep learning keretrendszerek segítségével folyik (pl. TensorFlow, PyTorch, Keras). A hallgatónak a munka elõrehaladtával nagyteljesítményû GPU erõforrást biztosítunk. A feladatok megoldása jelentõs mennyiségû programozást kíván (elsõsorban Python, de lehet LUA vagy C, C++ nyelven). Tudományos érdeklõdés esetén lehetõség van kutatási munkára is, a téma elméleti kihívásokat tartalmaz, amely TDK konferencián való részvételhez is megfelel. A téma diplomáig, illetve akár PhD témaként is folytatható. Elvárás: Korrekt, egyenletes munkavégzés, proaktívitás, olvasás szintû angoltudás. Elõny: "Deep Learning a gyakorlatban Python és LUA alapon" (VITMAV45) tárgyban szerzett 4-es vagy 5-ös osztályzat.
Témavezető: Gyires-Tóth Bálint
Silent Speech Interface (Mély neurális hálózat alapú artikuláció-beszéd becslés)
A beszédhangok az artikulációs szervek (hangszalagok, nyelv, ajkak stb.) koordinált mozgásának eredményébõl állnak elõ. Az artikuláció és a keletkezõ beszédjel (akusztikum) kapcsolata régóta foglalkoztatja a beszédkutatókat. Az artikuláció és az akusztikai kimenet kapcsolatát gépi tanulás alapú eszközökkel is vizsgálták már. Az artikuláció-akusztikum konverzió eredményei a szakirodalomban elsõsorban az ún. 'Silent Speech Interface' (SSI, magyarul 'némabeszéd-interfész', https://t.co/M3yY4WnMmF) rendszerek fejlesztéséhez járulnak hozzá. Az SSI lényege, hogy az artikulációs szervek hangtalan mozgását felvéve a gépi rendszer ebbõl beszédet szintetizál, miközben az eszköz használója valójában nem ad ki hangot. A hallgató feladata deep learning alapú (pl. mély neurális hálózat, AutoEncoder) megoldás kidolgozása a Silent Speech Interface témakörben. Javasolt programozási nyelvek: Python / Matlab. A kutatás az MTA-ELTE Lingvális Artikuláció Kutatócsoporttal (Lendület pályázat, http://lingart.elte.hu) együttmûködésben történik.
Témavezető: Dr. Csapó Tamás Gábor
Variational AutoEncoder - felügyelet nélküli tanítás deep learning-ben
A deep learning rendszerekben a felügyelet nélküli (nemellenõrzött, tanító nélküli) tanulás egyik potenciális megoldása a Variational AutoEncoder (VAE) típusú hálózatok. A hallgató feladata VAE-k alkalmazása beszédtechnológiai problémákra.
Témavezető: Dr. Csapó Tamás Gábor
GAN - Versengõ hálózatok és generatív modellek deep learning-ben
A deep learning egyik ága a generatív modellezéssel foglalkozik, melynek során a tanítóadatokhoz hasonló, új adatokat szeretnénk létrehozni. Ennek egyik példája a lehetséges jövõ szimulálása (pl. egy videóban mi lesz a következõ képkocka?), vagy éppen színészek arcaiból új arcok generálása (https://www.youtube.com/watch?v=XOxxPcy5Gr4). A hallgató feladata megismerkedni a versengõ hálózatokkal (Generative Adversarial Networks, GAN) és egyénileg választott részfeladat megoldása valamelyik deep learning keretrendszerben. Javasolt programozási nyelv: Python.
Témavezető: Dr. Csapó Tamás Gábor
Deep learning alapú algoritmikus végrehajtási stratégiák kereskedési platformokon
Ma már pénzügyi forgalom jelentõs része elektronikusan történik szinte minden termékosztályban. A különbözõ piacokon egyre nagyobb a jelentõsége annak, hogy a szereplõk a kereskedési döntés meghozása után, hogyan hajták azt végre a piacokon. Sok esetben elvárás, hogy a kereskedés ne legyen nagy hatással a piaci ára, illetve más szereplõk számára észrevétlenül hajtódjon végre. A hallgató(k) feladata a problémakörrel kapcsolatosan eddig elvégzett munkák és a szakirodalom (gépi tanulás, mély tanulás/deep learning, algoritmikus kereskedés) eredményeinek áttekintése és új típusú eljárások kidolgozása. A hallgató(k) feladata továbbá olyan Python alapú szoftver készítése, amely képes különbözõ végrehajtási stratégiák futtatására, kiértékelésére és összehasonlítására - különös tekintettel a deep learning alapú megoldásokra. A munka a legelterjedtebb, magas szintû deep learning keretrendszerek segítségével folyik (pl. TensorFlow, PyTorch, Keras). A hallgatónak a munka elõrehaladtával nagyteljesítményû GPU erõforrást biztosítunk. A feladatok megoldása jelentõs mennyiségû programozást kíván (Python, LUA vagy C, C++ nyelven). Tudományos érdeklõdés esetén lehetõség van kutatási munkára is, a téma elméleti kihívásokat tartalmaz, amely TDK konferencián való részvételhez is megfelel. A téma diplomáig, illetve akár PhD témaként is folytatható. Elvárás: Korrekt, egyenletes munkavégzés, proaktívitás, olvasás szintû angoltudás. Elõny: "Deep Learning a gyakorlatban Python és LUA alapon" (VITMAV45) tárgyban szerzett 4-es vagy 5-ös osztályzat. Tanszéki konzulens: Dr. Gyires-Tóth Bálint (BME TMIT) Ipari konzulens: Dr. Ottucsák György (Morgan Stanley)
Témavezető: Gyires-Tóth Bálint
Beszédvezérelt otthon és környezet
A beszédvezérelt megoldások elterjedése megállíthatatlan, mint például Amazon Echo, a Google Home vagy az Apple Siri. Ezekben természetes nyelvi kommunikációt használnak, beszédfelismerést és beszédszintézist. A hallgató feladata megismerni egy ilyen megoldást (pl. Amazon Echo-t) és annak alapján új funkciókat létrehozni. A téma lehetõséget biztosít a hallgatónak, hogy beszédtechnológiák (beszédfelismerés, beszédszintézis) és gépi tanulás (deep learning) területeit megismerje, kipróbálja azokat. A cél egy mûködõ megoldás összeállítása, tesztelése és értékelése. A vezérlõ rendszer a már kialakított okosotthonos megoldásokkal összekötve jól demonstrálható.
Témavezető: Dr. Zainkó Csaba
Mély neurális háló alapú beszédszintézis (Deep learing)
A gépi tanulás az élet sok területén használható, így a beszéd elõállítására is. A Google kutatói által kifejlesztett WaveNet rendszer segítségével közvetlenül elõállítható a beszéd hullámformája: https://deepmind.com/blog/wavenet-generative-model-raw-audio/ A generált beszédnek fontos szerepe van mai felhasználó interfészekben (pl. Apple Siri, Amazon Echo, Microsoft Cortana), ezért a generált beszéd minõségének javítása folyamatos igény. A hallgató feladata lenne megismerkedni a mély neurális halók mûködésével és tanításával, majd a beszédszintézisben ezt alkalmazni. Elvárás a rendszeres munka, a korrekt hozzáállás. A téma diplomatervig is folytatható, TDK munkára is alkalmas.
Témavezető: Dr. Zainkó Csaba
Tartalomösszegzés és szentiment-elemzés
A nagy méretû szöveges vagy audió adathalmazok, jegyzõkönyvek stb. humán áttekintésére, elolvasására ritkán van lehetõség, ezért különösen fontosak az olyan eszközök, amelyek a fõ mondandót és a lényeges információt kiemelik, összefoglalják. Járulékosan nem csak a tartalom, hanem az elõadás módja, vagy a tartalomra vonatkozó minõsítés vagy szubjektív vélemény is kinyerhetõ szövegekbõl (szentiment-elemzés). A témához kapcsolódóan az érdeklõdõ hallgató a gépi tanulás, neurális hálózatok, deep learning, közösségi média vagy enkóder alapú jelentésbeli (szemantikus) reprezentációk témaköreiben fejlesztheti tudását, készségeit.
Témavezető: Dr. Szaszák György József
Deep-learning technológia alkalmazása a precíziós mezõgazdaságban
A feladat a takarmány összetételének, illetve az összetétel változásának monitorozása, kamerák képének feldolgozásával deep learning technológiák segítségével. A témában egy konkrét kutatás-fejlesztési projekthez kapcsolódik, melyben partnerünk az Invitech, a Holstein Genetika, és egy kisalföldi állatgazdaság.
Témavezető: Dr. Vida Rolland