课程简介

得益于现代科学技术的快速发展,目前生物科学家可以在短时间内产生大量的数据。这些生物技术的普及使得生物大数据的分析已经变成了生物学研究及应用的关键。在此课程中,我们将主要讲授在生物数据分析中特别是近年来高通量生物数据分析中常用的统计方法,并基于软件R介绍利用这些方法进行生物数据分析的具体实例。本课程无指定教材,但可参考所列参考资料。本课的视频和文字内容仅用于课程学习,仅允许登陆本慕课的同学观看,未经任课教师本人授权,禁止课程之外的下载和传播。

课程大纲

1.   统计及生物统计概要(2学时)

2.   数据探索性分析、可视化(4学时)

3.   生物统计中常用的假设检验和置信区间估计方法(12学时)

a)    参数假设检验

b)    非参数假设检验

c)    Bootstrap方法、permutation 方法

d)    多重假设检验

4.   生物统计中常用的回归分析方法(12 学时)

a)    线性回归分析

b)    广义线性回归

c)    非线性回归方法、广义非线性回归方法

d)    混合效应回归模型

5.   高维生物统计学方法 (12学时)

a)    模型选择方法

模型衡量准则;传统变量选择方法,如前向选择方法、后向选择方法;罚函数方法

b)    超高维数变量筛选方法

线性模型中的变量筛选、非线性模型中的变量筛选

c)    降维方法

PCA, NMF,LLE,DiffusionMap, tSNE, UMAP等线性、非线性降维方法

6.   生物数据的分类、聚类分析(6学时)

a)    逻辑回归、支持向量机、随机森林等分类方法

b)    K-means、混合正态模型、隐马氏模型等聚类方法


课程说明

有同学反映注册华文慕课时,系统提示该邮箱已注册,这可能是华文慕课系统的问题,可以在登录界面,点击忘记密码,输入邮箱后,按照华文慕课给指定邮箱发送的邮件提示操作,可以找回密码,完成注册。

参考资料

1. Introduction to Data Science: Data Analysis and Prediction with R, Rafael A. Irizarry

2. Generalized Additive Models: an introduction with R, Simon Wood

3. Elements of Statistical Learning by Jerome H. Friedman, Robert Tibshirani, and Trevor Hastie

4. Advanced Data Analysis from an Elementary Point of view, Cosma Rohilla Shalizi

5. Mixed Effects Models and Extensions in Ecology with R,  Alain F. Zuur, Anatoly A. Saveliev, Elena N. Ieno, and Graham M. Smith

6. An Introduction to Statistical Learning with Applications in R,  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani

7. Bootstrap Methods: A Guide for Practitioners and Researchers, Michael R. Chernick.




拓展阅读

其他

主讲教师

席瑞斌   

席瑞斌,北京大学数学科学学院、统计科学中心、生物统计系研究员。席瑞斌常年从事生物医学大数据、大数据、贝叶斯统计、高维统计等领域的研究,在统计学、生物信息学顶级和权威杂志发表文章40余篇。

课程助教

  • 辛未

相关课程推荐

  • 正在进行
    化学与社会
    欢迎来到化学与社会! 这是北京大学化学学院开设的一门面向人文社科方向的全校通选课。考虑到文科生的理科基础,我在课程中回避了一些令文科生头痛的概念、计算和方程式,而把重点放在了化学与社会的交叉领域。 这不是一门系统的化学基础课,课程没有把重点放在全面系统地介绍化学领域上,甚至也没有期望完整地介绍化学的应用领域,而是以点带面地通过几个与当前社会紧密相关的专题,探讨化学与社会、科学与社会的关联。 此外,我也试图通过课程引导学生去阅读一些经典好书,这些书曾带给我们观念上的冲击,在人类认识世界的过程中曾发挥重要作用。对年轻人来说,越早读到这些书就越好。 这门课是北大“好课大家评”活动中学生推举的校园热门课程之一,也是在学生微信群中受到隆重推荐的“那些闪着光的北大通选课”的八门课程之一。 祝大家有一个开心愉快的学习体验!
  • 正在进行
    从北斗定向到北斗卫星导航
    日常生活中始终离不开两大信息:时间和空间。古代中国人就已经知道利用北斗恒星进行定向、定时、定春秋,并发明了指南针,开启了中国与世界的海上贸易往来。指南针的发明体现了古代中国人的聪明智慧,也是中国人对世界导航的极大贡献。为了适应信息化时代需求,中国又建成了北斗区域卫星导航系统,并即将建成全球卫星导航系统,使中国成为全球卫星导航四大核心供应商之一。中国的北斗卫星导航系统,不仅具有美国GPS的基本导航定位功能,而且具有位置报告、短报文通信和双向定时功能。中国北斗卫星导航系统不仅对中国及周边区域的导航、定位、授时用户作出贡献,而且也将对全球用户作出显著贡献。本报告课程将侧重重点介绍北斗卫星导航系统的发展、现状及主要应用,分析了中国北斗卫星导航系统面临的问题与挑战。
  • 正在进行
    解密教育的技术变革史
    互联网并非人类历史上第一次“信息技术”革命。人类历史上一共出现过5种媒介技术:口头语言、手工抄写/羊皮书、印刷技术、广播电视和互联网。 媒介技术提供的记录和传承功能,对人类的群体社会认知,带来了革命性的影响。西方历史上曾经发生的两次文明的大发展,都正好处于媒介技术变革前后。希腊文明处于希腊从口传到手工抄写的媒介技术变革中;近代科学史上的哥白尼革命,又正好处于欧洲从手工抄写到机器印刷的技术转型中;今天,轮到了信息技术…… 吟唱、诗歌、戏曲、绘画、文字书写等,都曾经是一种表达“技术”;《荷马史诗》、《圣经》都曾经充当过识字课本;口头语言、羊皮纸卷、印刷书、广播电视,都是曾经的“教育技术”。 这门课程从重新定义教育和人这两个核心概念开始,带着你从媒介史、知识产业分工配套体系、教学模式和教育组织方式等不同的视角,游历人类一路走来传播生态环境、知识产业、教育教学的发展过程,从中寻找媒介技术影响教育变革的规律,指导学习者迎接未来教育变革的挑战,寻找创新和发展方向!

恭喜,报名成功

进入学习中心

恭喜,报名成功

确定

请进入开课界面预览

确定

X

请去您的邮箱验证

还没收到验证邮件?

1. 试试去广告邮件、垃圾邮件目录看看

2. 再次发送验证邮件

对不起,班次容量已满

请报名下一班次

知道了~!

对不起,您没有操作权限

知道了~!