课程简介

得益于现代科学技术的快速发展,目前生物科学家可以在短时间内产生大量的数据。这些生物技术的普及使得生物大数据的分析已经变成了生物学研究及应用的关键。在此课程中,我们将主要讲授在生物数据分析中特别是近年来高通量生物数据分析中常用的统计方法,并基于软件R介绍利用这些方法进行生物数据分析的具体实例。本课程无指定教材,但可参考所列参考资料。本课的视频和文字内容仅用于课程学习,仅允许登陆本慕课的同学观看,未经任课教师本人授权,禁止课程之外的下载和传播。

课程大纲

1.   统计及生物统计概要(2学时)

2.   数据探索性分析、可视化(4学时)

3.   生物统计中常用的假设检验和置信区间估计方法(12学时)

a)    参数假设检验

b)    非参数假设检验

c)    Bootstrap方法、permutation 方法

d)    多重假设检验

4.   生物统计中常用的回归分析方法(12 学时)

a)    线性回归分析

b)    广义线性回归

c)    非线性回归方法、广义非线性回归方法

d)    混合效应回归模型

5.   高维生物统计学方法 (12学时)

a)    模型选择方法

模型衡量准则;传统变量选择方法,如前向选择方法、后向选择方法;罚函数方法

b)    超高维数变量筛选方法

线性模型中的变量筛选、非线性模型中的变量筛选

c)    降维方法

PCA, NMF,LLE,DiffusionMap, tSNE, UMAP等线性、非线性降维方法

6.   生物数据的分类、聚类分析(6学时)

a)    逻辑回归、支持向量机、随机森林等分类方法

b)    K-means、混合正态模型、隐马氏模型等聚类方法


课程说明

有同学反映注册华文慕课时,系统提示该邮箱已注册,这可能是华文慕课系统的问题,可以在登录界面,点击忘记密码,输入邮箱后,按照华文慕课给指定邮箱发送的邮件提示操作,可以找回密码,完成注册。

参考资料

1. Introduction to Data Science: Data Analysis and Prediction with R, Rafael A. Irizarry

2. Generalized Additive Models: an introduction with R, Simon Wood

3. Elements of Statistical Learning by Jerome H. Friedman, Robert Tibshirani, and Trevor Hastie

4. Advanced Data Analysis from an Elementary Point of view, Cosma Rohilla Shalizi

5. Mixed Effects Models and Extensions in Ecology with R,  Alain F. Zuur, Anatoly A. Saveliev, Elena N. Ieno, and Graham M. Smith

6. An Introduction to Statistical Learning with Applications in R,  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani

7. Bootstrap Methods: A Guide for Practitioners and Researchers, Michael R. Chernick.




拓展阅读

其他

主讲教师

席瑞斌   

席瑞斌,北京大学数学科学学院、统计科学中心、生物统计系研究员。席瑞斌常年从事生物医学大数据、大数据、贝叶斯统计、高维统计等领域的研究,在统计学、生物信息学顶级和权威杂志发表文章40余篇。

课程助教

  • 辛未

相关课程推荐

  • 正在进行
    计算概论PartA
    你有没有好奇过:计算机为什么能够进行计算?计算机程序是怎样运行的?你是否想知道:计算机未来可能的发展趋势有哪些?程序是如何编写出来的?如何学习程序设计语言?程序设计语言的基本成分有哪些?《计算导论》这门课将帮助你解决这些疑惑。 学完这门课,你将能够解释计算机和程序的基本运行原理以及它们的特性,向你的朋友讲述计算机的历史和发展趋势;同时,你也将充分“热身”,迎接“计算机程序设计语言”的学习!
  • 正在进行
    IT项目管理
    IT项目管理的对象是软件工程项目。它所涉及的范围覆盖了整个软件工程过程。 为使软件项目开发获得成功,关键问题是必须对软件项目的工作范围、可能风险、需要资源(人、硬件/软件)、要实现的任务、经历的里程碑、花费工作量(成本)、进度安排等做到心中有数。 这种管理在技术工作开始之前就应开始,在软件从概念到实现的过程中继续进行,当软件工程过程最后结束时才终止。
  • 正在进行
    计算机网络原理和因特网
    自20世纪70年代以来, Internet已经彻底改变了世界和人们的生活,而底层的计算机网络知识是Internet出现和不断发展的基石。计算机网络和通信技术是近年来发展最快的学科领域之一,新技术不断涌现,新产品日新月异。为了在纷繁网络技术世界拥有判断和驾驭能力,本课程将紧紧围绕网络科学技术(例如连接管理、差错控制、流量控制、拥塞控制、路由选择、网络安全等),讲授计算机网络概念和技术原理,选择典型网络协议和流行网络产品作为案例进行剖析,使学生不仅获得必要的网络基础知识,而且面对网络问题具有专业的分析判断和解决能力。

恭喜,报名成功

进入学习中心

恭喜,报名成功

确定

请进入开课界面预览

确定

X

请去您的邮箱验证

还没收到验证邮件?

1. 试试去广告邮件、垃圾邮件目录看看

2. 再次发送验证邮件

对不起,班次容量已满

请报名下一班次

知道了~!

对不起,您没有操作权限

知道了~!