人物經曆
2011年畢業于南京大學計算機科學,博士
2011年LAMDA集團(LAMDA刊物)技術部擔任助理研究員
2014年任南京大學計算機科學系副教授
2019年加入南京大學人工智能學院任教授
主要成就
科研成就
強化學習旨在自主學習最佳順序決策的模型
強化學習的環境虛拟化(與阿裡巴巴和滴滴公司合作)
為了将強化學習應用于現實世界的工業應用,我們的研究發現僅從曆史數據構建具有良好泛化性的虛拟環境是可行的。這些環境為工業應用提供零成本的試錯培訓
強化學習中的經驗重用(與青達、張超、周志華等)我們的研究設計了通過重新利用經驗來加速強化學習的方法,特别是在模拟器中積累的經驗
星際争霸上的強化學習(與Zhen-Jia Pang、Ruo-Zhe Liu 等)我們的研究嘗試盡可能高效地為這種超大規模的部分可觀察實時策略遊戲學習良好的遊戲策略
Z.-H。周,Y. Yu,C. Qian。進化學習:理論和算法的進展。柏林:斯普林格,2019年
無導數優化旨在解決具有複雜結構的優化問題,例如具有許多局部最優值的非凸、不可微和非連續問題。我們正緻力于以理論為基礎的高效無導數優化方法,以更好地解決機器學習問題
基于模型的無導數的優化(與洪謙與易奇虎等),對于真正的領域複雜的優化,我們的研究解決這些問題,包括理論基礎,高維,和嘈雜的評價
近似分析和帕累托優化(與錢超、姚欣和周志華等)我們的研究分析了進化算法解的優劣,并設計了帕累托優化,該優化已被證明是各種子集選擇問題的強大逼近工具
進化優化的運行時間分析(與Chao Qian和Zhi-Hua Zhou)我們開發了用于分析進化算法複雜性的工具,這是進化算法最基本的問題之一
人才培養
人工智能教程(AI學院本科生,2018年秋季)
高級機器學習(研究生,2018年秋季)
高級機器學習(研究生,2017年秋季)
人工智能(本科生,2015年、2016年、2017年、2018年春季)
數據挖掘(碩士生,2014、2013、2012秋季)
數字圖像處理(數學系本科生,2014年春季,2013年)
數據挖掘導論(本科生,2013、2012年春季)