python编程入门软件(快速学会的空间统计学)

wufei123 发布于 2024-08-17 阅读(13)

欢迎转发朋友圈,得赞,赢福利 ^-^今年的北京春天,格外舒适。在这样适合外出的季节里,一门讲给非统计学专业的统计学课程,在北京大学、中科院静悄悄的小范围投放试听预约。

▲ 北京大学校园 | Andre, 2022年四月没想到,课程开发团队不仅迅速收到大量本校师生的试听申请,一些来自同济大学、中国地质大学、林科院的学生和年轻老师也纷纷表达听课意愿课程结束后,这些来自不同学科、不同专业、不同阶段的学习者,全都打出高分!。

▲ 课程学习指导微信群。因为申请听课的人太多,只好分成两个班级。

▲ 部分课后反馈和授课情况(左右滑动)这门神奇课程是一门空间统计学课,全称很长:贝叶斯地统计模型R-INLA四阶保姆式课程看起来就难,为什么要跨学科、跨专业,辛辛苦苦来学它?这是因为,这门0差评宝藏课,不仅开阔视野,还是一枚能帮助科研人员发。

高水平论文、数据分析人员抓住客户核心需求的利器高校、科研机构研究人员,事业单位、企业研发人员,包括医药、城市规划、社会调查、市场调查、环境保护等行业,全都用得上!它讲授的空间统计学工具,先进而应用广泛试问如今,有哪一门学科不需要数据支持?。

“数据分析报告足够创新,杂志编辑才会多看你一眼”01空间统计学 — 数据科学利器﹀﹀﹀这门名字很长的空间统计学课程,由 Mochi 团队开发,其主创成员来自浙江大学、牛津大学、悉尼大学、香港城市大学等著名学府的统计、计算机、地理、社会学等专业。

团队的指导老师 Andre Python 博士,是空间统计学领域的一颗学术新星,先后在牛津大学、帝国理工大学、圣安德鲁斯大学,瑞士洛桑大学、弗里堡大学等国际顶尖大学工作学习多年他擅长发展应用空间统计学,特别是贝叶斯和可解释机器学习算法,开展在流行病学、医学、地理、环境、经济、社会学等领域的交叉研究。

2019年,因为他在贝叶斯方面的开创性工作,荣获亚马逊国际机器学习奖[1];2022年,其发表在 Science Advances 杂志上的工作获评浙江大学“年度学术创新奖”[2]。

Andre Python儿时为了成为职业篮球手拼搏多年,离开大学多年发现,自己最热爱的只有科研与教育放弃高薪转身走进博士殿堂时,曾经的导师日内瓦大学Martin Beniston教授说,我知道你一定会回来。

Python博士投入极大精力的空间统计学,究竟是什么呢?简单来讲,我们每个人都生活在空间里,一言一行全都带着深深的空间和时间烙印,即使保守地说,现实生活中约80%以上的数据也一定带有时空特征这些数据,可以是流行病的爆发数据,一个地区的交通事故数据;可以是显微镜下组织切片中的细胞位置,田野里生物种群的密度和空间模式;也可以是一个地区的经济、营销布局,消费人群的分布情况;地质、地理和城市规划数据等更不用说,天然自带空间属性。

▲ 人、城市、生物群落 | 图片来源:网络这些空间数据如此庞大,又不容忽视,掌握空间统计理论和工具,学习先进的空间统计算法,势在必行现在,这个强大的课程来了!“在4天共12小时的课堂里,你可以将R语言基础、空间数据、空间统计、贝叶斯R-INLA地统计模型的精华一网收尽!。

”‍‍‍‍‍‍‍‍‍‍02贝叶斯R-INLA地统计模型﹀﹀﹀

什么是贝叶斯R-INLA地统计模型?贝叶斯统计,大概是截至目前最接近人类认识世界方式的一套理论人生活在宇宙这样的空间中,认识这个世界的手段,离不开贝叶斯和空间相关理论的支撑因为对空间分析的需求,又有了空间统计学。

贝叶斯和空间统计学虽然年轻,却已经在近二十年间迅速融入人类科研技术、生活空间的方方面面R-INLA,R 语言中的一个包(package),它可以对潜在高斯模型进行近似贝叶斯推断R-INLA 中的“INLA”是“Integrated Nested Laplace Approximation”的缩写,也就是积分嵌套拉普拉斯近似。

因为 INLA 具有显著的计算效率,R-INLA 这个 R 软件包又有极大的便利性,近几年已经逐渐取代很多其他统计算法,比如马尔可夫链蒙特卡洛(Markov chain Monte Carlo)[3]

▲ 贝叶斯在各行各业中的应用

R-INLA的优势在哪里?很多,对国内的学习者和应用者来说,主要是新和高效。首先,这是潜力巨大却尚未充分应用的新工具。

许多的非统计学专业,非常需要空间统计学工具的加持,在本领域开拓创新像地信、环境专业,生态、医药、生物、流行病学专业,甚至人文学科包括经济学、社会学等专业,都必须用到先进的数据工具但目前国内在空间统计学教育方面极为空缺。

能够充分利用R-INLA进行数据分析的团队少之又少,系统开设空间统计学课程的高校也属凤毛麟角,远远落后于海外的资源量‍国内能搜索到的系统性学习资料少得可怜,像碎片一般洒落在百度的汪洋大海中 ▼。

再搜一下B站,竟然只搜到4个相关教程,其中2个还是Mochi开发团队近期上传 ▼。

再看看海外资源,相比较之下多出不少 ▼。

油管上也更多一些讲座资源 ▼。

也有几个略为系统的海外在线课程。但是,这些课程很少结合实例;过于专业,没有考虑跨专业人员学习难度;虽然提供了编程代码,却不能实现实时编程的有效体验与练习 ▼。

(上下滚动查看更多)▲ 国外在线课程资源,但是没有实时编码环境:Advanced Spatial Modeling with Stochastic Partial Differential Equations Using R and INLA

[4];Geospatial Health Data: Modeling and Visualization with R-INLA and Shiny [5];Introduction to modelling using INLA

[6].其次,这是目前国际上已经被广泛使用的高效工具。

自从 R-INLA 问世到今天,十多年来,使用R-INLA工作的团队越来越多。

▲ 谷歌学术搜索:使用 R-INLA 完成的科研成果2014年,牛津大学 Robert Snow 教授团队就已在 Lancet 上发表了使用 R-INLA 研究非洲疟疾时空传播的相关内容[7]同一年,来自北境赫尔辛基大学的 Anna-Liisa Laine团队同样使用 R-INLA 对传染性疾病的生态和进化开展研究,发表于 。

Science [8]2015年,牛津大学 Peter Gething 教授团队仍然使用 R-INLA 方法对全球疟疾传播深入研究,成果发表于 Nature [9];同年,一支瑞士领衔的科研团队采用 R-INLA 地统计模型对非洲蠕虫感染进行调查,工作发表在 。

Lancet Infecious Disease 杂志[10]到今天,使用 R-INLA 探索开创性成果的范围愈发广泛,每年都有不少使用 R-INLA的研究成果发表在国际顶尖期刊,有研究鸟类的[11],有研究婴儿先天疾病的地域差异

[12],还有研究某些疾病的全球分布[13]我们这门空间统计学课程的指导老师 Python 博士,应用 R-INLA 对国际关系学进行研究,成果发表在统计学领域的旗舰期刊 JRSSA(Journal of the Royal Statistical Scociety: Series A。

,英国皇家统计学会会刊A刊)[14],还多次受中美统计学会会刊 Significance 主编邀请撰文 [15, 16]。

(上下滚动查看更多)▲ 以上部分研究案例图例“R-INLA 的强大毋庸置疑在很多人还不了解,甚至没听说过这一数据科学利器的时候,快速掌握它,用好它,才能先走一步如果说科研有“捷径”,这才是真正可以走的“。

捷径””‍‍‍‍‍‍‍‍‍‍03一门理想的空间统计学课程﹀﹀﹀看到这里,想必你也很想要学一点空间统计理论来解决实际问题但现实是,一方面,空间统计学著作高高在上,不接地气,让想学的人望而却步;另一方面,网络信息不仅少,不成体系,有的甚至还有错误。

更重要的是,要快速高效的学好、用好空间统计,需配合掌握一些基础技能,包括编程(主要是R语言)等,这就需要计算机、数学领域的老师同时在线给予指导,才能融会贯通如果有一门课程,简明扼要又成体系,简单易学又切中要害,内容深入浅出,理论公式少一些,现实应用多一些,既可以帮助系统了解空间理论,又能配合练习编程,要是有实时指导反馈,就更好了。

而这正是我们这门空间统计学课程的特点开发团队将这种特点称为保姆式教学课程特点‍‍‍‍‍‍‍‍(a)练习编程的环境直接预装在我们的私有服务器上,而无需学员在自己的电脑上下载各种安装程序和语言包,省去了烦恼,从而可以集中注意力在课程内容本身;。

(b)平台中嵌入的代码窗口不仅结合课程内容举出实例,更可以允许学员自己在窗口中自由修改并运行,立刻观察到运行结果从而加深对课程内容的理解,通过动手增强理解;(c)不管有多少人同时在线学习,如何自行修改代码块内容,大家互不影响,也就是说喜欢自学的人可以极大的享受自己学带来的自由和效率;

(d)而有的同学更喜欢有老师带进门的学习方法,喜欢沟通协作,则可以借助老师的讲解视频和我们的真人在线指导来获得帮助因此,在这个学习平台,对学习过程中所需要的帮助和资源,开发团队将像保姆一样全方位照顾我们的课程倾注了开发团队不同专业背景成员多年学习和应用空间统计的经验体会,其中的每一个字、每一张图,都由老师带领开发人员反复推敲和校正。

我们确信,这门学科,一旦掌握,在跨专业领域研究和民生发展决策中都是利器04课程内容﹀﹀﹀这门课程目前共包括四部分内容,从第一阶到第四阶,知识点由浅入深通过课程的学习,你将了解R,并学习空间数据和地理统计模型,以及如何使用R-INLA设计和实现贝叶斯地统计模型。

课程的形式可以通过下面这个短视频窥见一斑 ▼:以下视频来源于BayeStat关闭观看更多更多退出全屏视频加载失败,请刷新页面再试

刷新

视频详情 课程形式简介 | 视频制作:Yucheng学习形式有别于传统的书本式教学,学习者无需在个人电脑上安装任何R语言环境,可以在交互式教程里观看多媒体,交互学习数学公式,运行代码块并看到结果,完成课程测验题,等等。

▲本课件平台登录界面课程采用的练习数据为真实的火星沙丘大数据,通过在线实时交互反馈的代码练习,给予学习者最直观有效的数据分析体验当课程结束时,你就可以尝试使用不同专业的数据,运行和解释你自己的R-INLA模型了!。

四阶课程内容1走进 R学习R语言基础知识,熟悉本次课程使用的数据集(火星沙丘)2空间数据沉浸空间统计学世界这是统计学中研究空间数据的一个分支, 本课程将着重围绕地理统计模型学习相关空间数据基础知识, 以及空间建模主要概念。

3贝叶斯统计学初见贝叶斯统计学(仅保留最低限度的数学公式), 掌握实现用R-INLA建立、解释和调整地理统计模型所需基本统计学知识4贝叶斯地统计模型R-INLA应用火星沙丘数据,学习如何编译和解释贝叶斯地理统计模型。

学习的前提基础并不用太多,也不需要在自己的电脑上安装任何学习环境如有一点R语言或其它编程语言的基本知识可能会更加方便学习,仅此而已课程资源包括12小时老师的视频讲解一对一在线指导(微信团队)108小时机时,用于使用课件学习与练习平台。

有关四阶内容的更详细介绍,请参见未名时空公众号的一篇推文(Geostatistical Modelling of Martian Dunes with R-INLA)。

小提示:目前的课件版本是全英文环境,中文版本正在紧张的制作中但是我们仍旧建议你选择英文版本,毕竟,空间统计学的大部分发展都来自西方,用英语进行学习也更方便掌握精髓、寻找资源,以及未来的应用(比如发论文

)费用说明course cost本课程实行付费制,既是为私有服务器和维护的费用提供补充,也是对团队全心付出的尊重费用包含完成课程所需的机时(108小时),教师讲解(线下现场或线上视频),以及在线辅导课件可以单人购买,也可以集体订购(有优惠);或者有特殊情况也可以申请优惠。

课件购买可按实际支付金额提供发票欢迎联系我们具体询价。售前客服微信:

小提示:欢迎大家在朋友圈转发此文。课程报名时,凭朋友圈得赞截图可获得100元课程费优惠

参考资料:[1] Amazon AWS Machine Learning Research Award, 2019, A Bayesian reinforcement learning algorithmto predict the risk of malaria in low-endemicity context。

‍[2] 浙江大学2021年度十大学术进展,http://zhfw.zju.edu.cn/zhfw_jsgx/2022/0419/c5074a2520947/page.htm[3] R-INLA project. https://www.r-inla.org/home

[4] Advanced Spatial Modeling with Stochastic Partial Differential Equations Using R and INLA. https://becarioprecario.bitbucket.io/spde-gitbook/index.html

[5] Geospatial health data: Modeling and Visualization with R-INLA and Shiny. https://www.paulamoraga.com/book-geospatial/index.html

[6] Introduction to modelling using INLA. https://ourcodingclub.github.io/tutorials/inla/[7] Noor AM, Kinyoki DK, Mundia CW, KabariaCW, Mutua JW, et al. 2014. The changing riskof Plasmodium falciparum malaria infection in Africa: 2000-10: aspatial and temporal analysis of transmission intensity. 

Lancet, 383:1739–47[8] Jousimo J, Tack AJM, Ovaskainen O, MononenT, Susi H, et al. 2014. Ecological and evolutionary effectsof fragmentation on infectious disease dynamics.

 Science, 344:1289–93[9] BhattS, Weiss DJ, Cameron E, Bisanzio D, Mappin B, etal. 2015. The effect of malaria control on Plasmodiumfalciparum in Africa between 2000 and 2015. 

Nature, 526:207–11[10] Karagiannis-Voules DA, Biedermann P, Ekpo UF, Garba A, Langer E, et al. 2015. Spatial and temporal distribution of soil-transmitted helminth infection in sub-Saharan Africa: a systematic review and geostatistical meta-analysis.

Lancet Infect. Dis., 15:74–84[11] Wijewardhana UA, ApputhuraiP, Jayawardana M, Meyer D (2022) Effectiveness of the conservation areas on theMornington Peninsula for the common resident shorebird species using citizenscience data.

PLoS ONE, 17(5): e0267203[12] Michelle L Udine, Frank Evans, Kristin M Burns, Gail DPearson, Jonathan R Kaltman, 2021, Geographical variation in infant mortality dueto congenital heart disease in the USA: a population-based cohort study,

The Lancet Child & Adolescent Health, DOI: 10.1016/S2352-4642(21)00105-X[13] Local Burden of Disease 2019 Neglected TropicalDiseases Collaborators, 2021, The globaldistribution of lymphatic filariasis, 2000–18: a geospatial analysis,

The Lancet Global Health, DOI: 10.1016/S2214-109X(20)30286-2[14] Python, André, J. Illian, C. Jones-Todd,and M. Blangiardo, 2019, A Bayesian Approach to Modelling Subnational SpatialDynamics of Worldwide Non-State Terrorism, 2010 - 2016, Journal of the Royal StatisticalSociety - Series A: Statistics in Society, 182(1): 323–344

[15] Python, André. What we know—and don’t know—about terrorism. Significance, 17(4):14–14, 2020.[16] Python, André,

et al.. The deadly facets of terrorism. Significance, 16(4):28–31, 2019.

亲爱的读者们,感谢您花时间阅读本文。如果您对本文有任何疑问或建议,请随时联系我。我非常乐意与您交流。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。