课程简介

大数据给数据分析和处理带来了前所未有的机遇和挑战。本课程介绍大数据分析中一些算法:数据的稀疏和低秩表达,稀疏和低秩矩阵优化,社交网络计算中的图与网络流问题,机器学习和数据挖掘的最优化算法,随机优化算法,强化学习等等。通过本课程学习,掌握最优化的基本概念,典型的几类最优化建模方法,相关优化问题的基本计算方法,并能熟练调用基于MATLAB或Python等语言的典型优化软件程序求解一些标准的优化问题,灵活运用所讲授的算法和理论求解一些非标准的优化问题。达到锻炼将实际问题建立合适最优化模型的能力,选择合适的现有软件包和算法的能力,遇到没有现成算法自己实现简单算法的能力。

课程大纲

1.课程简介,大数据分析中的最优化理论与算法介绍,2学时

2.线性规划,二次锥规划,半定规划简介,2学时

3.对偶理论,3学时

4.线性规划单纯形方法和内点法,3学时

5.压缩感知和稀疏优化基本理论,2学时

6.压缩感知和稀疏优化算法,4学时

7.推荐系统与低秩矩阵恢复的算法,3学时

8.最优运输算法,3学时

9.随机优化算法,3学时

10.随机特征值算法,3学时

11.相位恢复和低温电子显微镜模型和算法,3学时

12.高维数据降维,支撑向量机,3学时

13.图和网络流问题: 最短路径问题,最大流问题,组合优化,3学时

14.次模优化,3学时

15.强化学习,8学时

课程说明

先修课程要求:

  • 年级要求: 大三,大四,研究生

  • 不是必须先修但有帮助: 数值代数,最优化(凸优化),概率论

  • 会Matlab或者Python程序编写


参考资料

“Convex optimization”, Stephen Boyd and Lieven Vandenberghe
https://web.stanford.edu/~boyd/cvxbook/

“Numerical Optimization”, Jorge Nocedal and Stephen Wright, Springer
http://users.iems.northwestern.edu/~nocedal/book/num-opt.html


其它课程参考资料和最新的课程信息请参考网页

http://bicmr.pku.edu.cn/~wenzw/bigdata2020.html

拓展阅读

其他

主讲教师

文再文   副教授

文再文, 主要研究最优化理论与算法及其应用。2013年获得国家自然科学基金委优秀青年科学基金。2015年获得中组部青年拔尖人才计划,在第十届全国计算数学年会做特邀报告。 2016年获中国青年科技奖,2017年在第十一届全国数学规划学术会议做大会报告。

课程助教

  • 1901110049

  • wanghao960607

相关课程推荐

  • 正在进行
    算法设计与分析(高级)
    “算法设计与分析”是计算机科学与技术专业的一门核心课程。通过学习算法不但对学习其他专业课程奠定了扎实的基础,也对培养学生的计算思维和求解问题的能力起到重要的作用。算法与计算复杂性理论一直是计算机科学研究的热点领域。面对各个应用领域的大量实际问题,最重要的是根据问题的性质选择正确的求解思路,即找到一个好的算法。特别在复杂的、海量信息的处理中,一个好的算法往往起到决定性的作用。 算法设计与分析涉及内容较多,根据MOOC课程的教学特点和需求,我们将它分成两个部分。其中“算法设计与分析(1)”主要讲授有关算法的基础知识和通用设计技术,包括算法的基本概念和数学基础、分治策略、动态规划、贪心法、回溯和分支限界等。“算法设计与分析(2)”是在上述基础上介绍两类重要问题的建模和算法设计,并进一步讨论问题难度的界定和困难问题的应对策略。这次开课的是第二部分“算法设计与分析(2)”。选修本课程的学生应该预先修过“算法设计与分析(1)”或者具有相关的基础。“算法设计与分析(1)”已经在华文慕课平台上线,网址是:http://www.chinesemooc.org/mooc/4748/,需要了解相关教学内容的同学可以访问。
  • 正在进行
    设计模式
    本课程介绍什么是设计模式,设计模式的分类及每种设计模式的具体结构类图、角色和java实例,还包括每种设计模式的优缺点和使用场景。
  • 即将开始
    数据分析软件平台----ROOT
    ROOT(下载地址: https://root.cern.ch/ )是科学数据处理的平台。利用它,可将数据(普通数值或C++类)以压缩二进制的办法保存起来并且可以很方便的对其进行挑选、画1维、2维、3维直方图、散点图、拟合等分析工作。利用个人电脑可以登录到远程服务器进行多个文件大批量操作分析数据。ROOT还提供数学及统计工具、并行处理、神经网络及多变量分析软件包,实现多种分布的数据样本产生工具以便于对复杂问题的MC模拟开发,可方便地绘制高质量的图形并存储成pdf等不同格式。对于代码可以不需要编译即可进行解释运行以追求便利也可轻松实现编译运行以追求速度。 该软件现为国际上高能物理数据分析的必备工具,也可用于低能物理、工程、经济、军事等需要处理和分析科学数据及软件开发的领域。通过本培训的学习,学员可以在短时间将数据处理能力快速提高。ROOT系全免费开源软件且可运行在Windows和Linux下,国际上有大量科研人员及科研机构使用,学员掌握该软件后,有助于在参与国际合作和交流的科研活动过程中迅速适应国际科研环境。

恭喜,报名成功

进入学习中心

恭喜,报名成功

确定

请进入开课界面预览

确定

X

请去您的邮箱验证

还没收到验证邮件?

1. 试试去广告邮件、垃圾邮件目录看看

2. 再次发送验证邮件

对不起,班次容量已满

请报名下一班次

知道了~!

对不起,您没有操作权限

知道了~!