“第十二章 机器学习基本流程”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
第24行: 第24行:
 
* 百度百科:奥卡姆剃刀[https://baike.baidu.com/item/%E5%A5%A5%E5%8D%A1%E5%A7%86%E5%89%83%E5%88%80%E5%8E%9F%E7%90%86/10900565][http://baike.baidu.com/l/HUkXrXzT]
 
* 百度百科:奥卡姆剃刀[https://baike.baidu.com/item/%E5%A5%A5%E5%8D%A1%E5%A7%86%E5%89%83%E5%88%80%E5%8E%9F%E7%90%86/10900565][http://baike.baidu.com/l/HUkXrXzT]
 
* 维基百科:过拟合[http://aigraph.cslt.org/courses/12/Overfitting.pdf][http://aigraph.cslt.org/courses/12/過適.pdf]
 
* 维基百科:过拟合[http://aigraph.cslt.org/courses/12/Overfitting.pdf][http://aigraph.cslt.org/courses/12/過適.pdf]
 +
* 维基百科:GPT-3 [http://aigraph.cslt.org/courses/12/GPT-3-zh.pdf][http://aigraph.cslt.org/courses/12GPT-3-zh.pdf/]
 +
* 机器之心:当谈论机器学习中的公平公正时,我们该谈论些什么?[https://www.jiqizhixin.com/articles/2020-06-03-11]
 
* 机器之心:数据增强 [https://www.jiqizhixin.com/articles/2019-12-04-10]
 
* 机器之心:数据增强 [https://www.jiqizhixin.com/articles/2019-12-04-10]
 
* 知乎:数据增强 [https://zhuanlan.zhihu.com/p/38345420][https://zhuanlan.zhihu.com/p/41679153]
 
* 知乎:数据增强 [https://zhuanlan.zhihu.com/p/38345420][https://zhuanlan.zhihu.com/p/41679153]
 
* 什么是模型预训练[https://paddlepedia.readthedocs.io/en/latest/tutorials/pretrain_model/pretrain_model_description.html]
 
* 什么是模型预训练[https://paddlepedia.readthedocs.io/en/latest/tutorials/pretrain_model/pretrain_model_description.html]
 
* 迁移学习 [https://baike.baidu.com/item/%E8%BF%81%E7%A7%BB%E5%AD%A6%E4%B9%A0/22768151]
 
* 迁移学习 [https://baike.baidu.com/item/%E8%BF%81%E7%A7%BB%E5%AD%A6%E4%B9%A0/22768151]
 +
  
 
==演示链接==
 
==演示链接==
第36行: 第39行:
  
 
==开发者资源==
 
==开发者资源==
 
 
  
 
==高级读者==
 
==高级读者==
第45行: 第46行:
 
* Sebastian Ruder, An overview of gradient descend algorithms,2017 [https://arxiv.org/pdf/1609.04747.pdf]
 
* Sebastian Ruder, An overview of gradient descend algorithms,2017 [https://arxiv.org/pdf/1609.04747.pdf]
 
* Kirkpatrick, S.; Gelatt Jr, C. D.; Vecchi, M. P. (1983). "Optimization by Simulated Annealing". Science. 220 (4598): 671–680. [https://sci2s.ugr.es/sites/default/files/files/Teaching/GraduatesCourses/Metaheuristicas/Bibliography/1983-Science-Kirkpatrick-sim_anneal.pdf]
 
* Kirkpatrick, S.; Gelatt Jr, C. D.; Vecchi, M. P. (1983). "Optimization by Simulated Annealing". Science. 220 (4598): 671–680. [https://sci2s.ugr.es/sites/default/files/files/Teaching/GraduatesCourses/Metaheuristicas/Bibliography/1983-Science-Kirkpatrick-sim_anneal.pdf]
 +
* Brown et al., Language Models are Few-Shot Learners [https://arxiv.org/pdf/2005.14165.pdf]

2022年8月3日 (三) 00:48的版本

教学资料

  • 教学参考
  • 课件
  • 小清爱提问:什么是爬山法?[1]
  • 小清爱提问:什么是模拟退火算法?[2]
  • 小清爱提问:什么是奥卡姆剃刀准则? [3]
  • 小清爱提问:为什么说数据是人工智能的粮食?[4]


扩展阅读

  • 维基百科:没有免费的午餐定理 [5]
  • 维基百科:梯度下降法[6][7]
  • 百度百科:梯度下降法[8][9]
  • 知乎:梯度下降法[10]
  • 知乎:小批量梯度下降法[11]
  • 知乎:动量梯度下降法[12][]
  • 维基百科:模拟退火算法 [13][14]
  • 百度百科:模拟退火算法[15][16]
  • 知乎:模拟退火详解 [17]
  • 维基百科:牛顿法 [18][19]
  • 维基百科:奥卡姆剃刀[20][21]
  • 百度百科:奥卡姆剃刀[22][23]
  • 维基百科:过拟合[24][25]
  • 维基百科:GPT-3 [26][27]
  • 机器之心:当谈论机器学习中的公平公正时,我们该谈论些什么?[28]
  • 机器之心:数据增强 [29]
  • 知乎:数据增强 [30][31]
  • 什么是模型预训练[32]
  • 迁移学习 [33]


演示链接

  • 优化方法在线演示 [34]
  • 基于神经网络的二分类任务演示 [35]

开发者资源

高级读者

  • 王东,机器学习导论,第一章“绪论”,第十一章“优化方法”[36]
  • Wolpert, David (1996), "The Lack of A Priori Distinctions between Learning Algorithms", Neural Computation, pp. 1341–1390 [37]
  • Sebastian Ruder, An overview of gradient descend algorithms,2017 [38]
  • Kirkpatrick, S.; Gelatt Jr, C. D.; Vecchi, M. P. (1983). "Optimization by Simulated Annealing". Science. 220 (4598): 671–680. [39]
  • Brown et al., Language Models are Few-Shot Learners [40]