所屬欄目:關(guān)于優(yōu)越, 錄取榜單 發(fā)表時間:2022-09-13 來源:本站原創(chuàng)
2022offer:恭喜黃同學(xué)獲得帝國理工大學(xué)環(huán)境數(shù)據(jù)科學(xué)與機器學(xué)習碩士通知書
offer詳情如下:
錄取院校:帝國理工大學(xué)
錄取專業(yè): Environmental Data Science and Machine Learning
【項目介紹】
項目內(nèi)容涉及強化學(xué)習核心理論和技能,具體包括遺傳算法、強化學(xué)習框架、Q-learning、行動者-批評(actor-critic;AC)模型、馬爾可夫決策過程、優(yōu)化控制、圖神經(jīng)網(wǎng)絡(luò)(graph neural networks; GNN)、自動機器學(xué)習(Auto ML)等。學(xué)生通過項目了解如何開發(fā)基于強化學(xué)習的生產(chǎn)力軟件,在結(jié)束時提交項目個性化研究課題報告,進行成果展示。
個性化研究課題參考:
強化學(xué)習在博弈論中的應(yīng)用:類alpha算法開發(fā)
利用經(jīng)驗留存解決強化學(xué)習所需樣本太多問題的可行性分析
強化學(xué)習中的機器獎勵設(shè)置方法迭代
為強化學(xué)習過擬合的特定場景重新建模的自動過程研究
具有精確尺度估計的動作-評價網(wǎng)絡(luò)結(jié)構(gòu)與強化學(xué)習優(yōu)勢函數(shù)