课程简介

得益于现代科学技术的快速发展,目前生物科学家可以在短时间内产生大量的数据。这些生物技术的普及使得生物大数据的分析已经变成了生物学研究及应用的关键。在此课程中,我们将主要讲授在生物数据分析中特别是近年来高通量生物数据分析中常用的统计方法,并基于软件R介绍利用这些方法进行生物数据分析的具体实例。本课程无指定教材,但可参考所列参考资料。本课的视频和文字内容仅用于课程学习,仅允许登陆本慕课的同学观看,未经任课教师本人授权,禁止课程之外的下载和传播。

课程大纲

1.   统计及生物统计概要(2学时)

2.   数据探索性分析、可视化(4学时)

3.   生物统计中常用的假设检验和置信区间估计方法(12学时)

a)    参数假设检验

b)    非参数假设检验

c)    Bootstrap方法、permutation 方法

d)    多重假设检验

4.   生物统计中常用的回归分析方法(12 学时)

a)    线性回归分析

b)    广义线性回归

c)    非线性回归方法、广义非线性回归方法

d)    混合效应回归模型

5.   高维生物统计学方法 (12学时)

a)    模型选择方法

模型衡量准则;传统变量选择方法,如前向选择方法、后向选择方法;罚函数方法

b)    超高维数变量筛选方法

线性模型中的变量筛选、非线性模型中的变量筛选

c)    降维方法

PCA, NMF,LLE,DiffusionMap, tSNE, UMAP等线性、非线性降维方法

6.   生物数据的分类、聚类分析(6学时)

a)    逻辑回归、支持向量机、随机森林等分类方法

b)    K-means、混合正态模型、隐马氏模型等聚类方法


课程说明

有同学反映注册华文慕课时,系统提示该邮箱已注册,这可能是华文慕课系统的问题,可以在登录界面,点击忘记密码,输入邮箱后,按照华文慕课给指定邮箱发送的邮件提示操作,可以找回密码,完成注册。

参考资料

1. Introduction to Data Science: Data Analysis and Prediction with R, Rafael A. Irizarry

2. Generalized Additive Models: an introduction with R, Simon Wood

3. Elements of Statistical Learning by Jerome H. Friedman, Robert Tibshirani, and Trevor Hastie

4. Advanced Data Analysis from an Elementary Point of view, Cosma Rohilla Shalizi

5. Mixed Effects Models and Extensions in Ecology with R,  Alain F. Zuur, Anatoly A. Saveliev, Elena N. Ieno, and Graham M. Smith

6. An Introduction to Statistical Learning with Applications in R,  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani

7. Bootstrap Methods: A Guide for Practitioners and Researchers, Michael R. Chernick.




拓展阅读

其他

主讲教师

席瑞斌   

席瑞斌,北京大学数学科学学院、统计科学中心、生物统计系研究员。席瑞斌常年从事生物医学大数据、大数据、贝叶斯统计、高维统计等领域的研究,在统计学、生物信息学顶级和权威杂志发表文章40余篇。

课程助教

  • 辛未

相关课程推荐

  • 正在进行
    电磁学(上)
    电磁学是普通物理系列中最重要的基础课之一,是高等学校每一个理工科学生必修课程,本课程包括静电场、恒磁场、电磁感应、电磁介质、电路、麦克斯韦电磁场理论、电磁波等内容,首次系统地向学生介绍“场”的概念和处理“场”的方法,对学生今后学习和工作有深远的影响。本课程作为中国大学先修课(AP课程)向有志于学习物理及相关专业的学有余力的优秀中学生开放,培养学科兴趣,提高科学素养,打下扎实的物理基础。
  • 正在进行
    面向对象技术高级课程
    《面向对象技术高级课程》深入、系统、完整地讲解当今主流的面向对象软件开发方法的分析、设计、实现及重构方法,深入讲解UML语言的高级技术细节,以及近年来面向对象方法最新的发展趋势。课程集百家之所言,并结合主讲者最新的研究成果,并通过大量、丰富、完整、不同领域、应用不同技术的案例将其中的关键知识点串联起来,便于理解和应用。 此课程适用人群:面向广大软件开发爱好者,并不局限专业与学历层次。最佳选课者为计算机科学和软件工程专业的大学生和硕士研究生。选课者最好具有一门面向对象的编程语言的基本知识和软件工程的基本知识。
  • 正在进行
    推荐系统
    随着信息技术的飞速发展和互联网的全面普及,加快了数据产生和信息传播的速度。这为人们的生活和工作提供了便捷,但同时也带来了困扰:信息超载。为解决这一问题,搜索引擎和推荐系统两种信息过滤系统应运而生。不同于搜索引擎需要“用户主动寻找信息”且反馈结果“千人一面”,推荐系统的目标是“系统主动推送信息”且推荐结果“千人千面”。由于推荐系统能够让用户、平台、商家等多方受益,它已成为互联网(特别是移动互联网)应用和服务的一种标配。 本课程主要介绍推荐系统中的各种常用算法和一些典型应用。通过本课程的学习,学生不仅可以掌握各种常用推荐算法的思想、原理和实现,同时还能熟悉各种推荐算法的应用场景和一些典型的应用案例,并把握推荐系统未来的发展方向。

恭喜,报名成功

进入学习中心

恭喜,报名成功

确定

请进入开课界面预览

确定

X

请去您的邮箱验证

还没收到验证邮件?

1. 试试去广告邮件、垃圾邮件目录看看

2. 再次发送验证邮件

对不起,班次容量已满

请报名下一班次

知道了~!

对不起,您没有操作权限

知道了~!