一、R语言介绍

《区域水环境污染数据分析实践》
Data analysis practice of regional water environment pollution

苏命、王为东
中国科学院大学资源与环境学院
中国科学院生态环境研究中心

2024-04-09

R的历史

  • 1976年:
    • 前身是S语言,由贝尔实验室John Chambers及其同事开发
  • 1993年:
    • R语言由Ross Ihaka和Robert Gentleman在奥克兰大学开发
    • R的诞生是为了提供一个强大的统计计算和图形显示的平台

  • 1995年:R发布第一个公开版本
  • 2000年代: R语言逐渐成为统计学和数据科学领域重要工具
  • 2010年:Hadley Wickham发布了ggplot2包,数据可视化方面更强
  • 2016年:创建CRAN(Comprehensive R Archive Network),R包中央库
  • 至今
    • R语言已成为数据科学和统计学领域最受欢迎的工具之一,被广泛用于数据分析、机器学习、数据可视化等领域

R的特点

一般特点

  • 免费、开源、支持各个主要计算机系统。
  • 完整的程序设计语言,基于函数和对象。
  • 支持完善的数据类型,如向量、矩阵、数据框等。

技术特点

  • 所有存在都是对象。
  • 所有动作都是函数调用。
  • 支持函数编程和对象类。
  • 是动态类型语言,运行速度相对较慢。

R的参考资料

推荐参考书

R的参考资料

中文参考书

  • 《R语言编程艺术》
  • 《R语言实战》
  • 《R语言教程与实践》
  • 《R语言数据可视化实战》
  • 《R语言从入门到精通》

R的下载与安装

R的下载与安装

RStudio

什么是RStudio?

  • RStudio官方网站: https://posit.co/products/open-source/rstudio/
  • RStudio是一个集成开发环境(IDE),专门用于R语言编程和数据分析。
  • 它提供了一个直观的界面,使得编写、调试和运行R代码变得更加容易。

RStudio

RStudio的功能

  1. 代码编辑器:提供了语法高亮、自动补全和代码折叠等功能。
  2. 控制台:用于直接执行R代码并查看结果。
  3. 环境和历史记录:可以查看当前加载的数据、函数和变量,以及之前执行过的命令。
  4. 图形和可视化:RStudio内置了绘图设备,可以方便地创建各种统计图表。
  5. 文件管理器:可直接在RStudio中管理文件和项目。
  6. 包管理器:方便地安装、更新和管理R包。
  7. Markdown编辑器:支持Markdown格式,可以创建美观的文档和报告。

如何获取RStudio?

  • RStudio可以从官方网站免费下载并安装:RStudio官网
  • RStudio是一个强大的R编程环境,为R用户提供了丰富的功能和工具。
  • 它简化了R语言的使用,提高了数据分析和可视化的效率。

扩展包:R package

  • R有一万多个扩展软件包,提供了各种各样的功能
  • 已安装的基本R包,如base, stats, graphics等,启动R时默认载入
  • 其它扩展包需要用library(.)函数载入运行;或者采用dplyr::filter(.)方式
# load a R package
library(ggplot2)

# plot it based on the functions from `ggplot2` package
mtcars |>
  dplyr::filter(cyl != 8) |>
  ggplot(aes(hp, mpg, color = am)) +
  geom_point() +
  geom_smooth(formula = y ~ x, method = "loess")

安装R包

  • 以安装sos包为例。
  • 在RStudio中调用“Tools”菜单的“Install Packages”,输入或选择sos即可安装。
  • R图形界面安装
  • 如果不用RStudio, 在R图形界面选菜单“程序包-安装程序包”进行安装。
  • 在CRAN镜像选择窗口中选择中国的镜像,如“China (Beijing 2)”,然后选择要安装的扩展软件包名称即可完成下载和安装。
  • 程序安装
# 指定镜像网站并安装扩展包
options(repos=c(CRAN="https://mirror.tuna.tsinghua.edu.cn/CRAN/"))
install.packages("sos")

# 当R包不是CRAN标准包,代码放在[github](https://github.com)
if (!require(devtools)) install.packages('devtools')
devtools::install_github("kjhealy/socviz")

安装R包

结语

  • R语言是一种强大的统计计算和数据分析工具,适用于各种领域。
  • 通过学习R语言,可以进行数据处理、统计分析和数据可视化。

欢迎讨论!

苏命|https://drwater.rcees.ac.cn; https://drwater.rcees.ac.cn/bcard; Slides