导入 .csv 文件

使用基础 R 导入

可以使用包含 read.tableread.csv 导入逗号分隔值文件(CSV),但使用 sep = "," 将分隔符设置为逗号。

# get the file path of a CSV included in R's utils package
csv_path <- system.file("misc", "exDIF.csv", package = "utils")

# path will vary based on installation location
csv_path
## [1] "/Library/Frameworks/R.framework/Resources/library/utils/misc/exDIF.csv"

df <- read.csv(csv_path)

df
##    Var1 Var2
## 1  2.70    A
## 2  3.14    B
## 3 10.00    A
## 4 -7.00    A

用户友好的选项 file.choose 允许浏览目录:

df <- read.csv(file.choose())

笔记

  • read.table 不同,read.csv 默认为 header = TRUE,并使用第一行作为列名。
  • 除非 as.is = TRUEstringsAsFactors = FALSE,否则所有这些函数都会默认将字符串转换为 factor 类。
  • read.csv2 变体默认为 sep = ";"dec = ",",用于来自以逗号用作小数点且分号作为字段分隔符的国家/地区的数据。

使用包导入

readr 软件包的 read_csv 功能提供了更快的性能,大文件的进度条,以及比标准 read.csv 更受欢迎的默认选项,包括 stringsAsFactors = FALSE

library(readr)

df <- read_csv(csv_path)

df
## # A tibble: 4 x 2
##    Var1  Var2
##   <dbl> <chr>
## 1  2.70     A
## 2  3.14     B
## 3 10.00     A
## 4 -7.00     A