导入 .csv 文件
使用基础 R 导入
可以使用包含 read.table 的 read.csv 导入逗号分隔值文件(CSV),但使用 sep = "," 将分隔符设置为逗号。
# get the file path of a CSV included in R's utils package
csv_path <- system.file("misc", "exDIF.csv", package = "utils")
# path will vary based on installation location
csv_path
## [1] "/Library/Frameworks/R.framework/Resources/library/utils/misc/exDIF.csv"
df <- read.csv(csv_path)
df
## Var1 Var2
## 1 2.70 A
## 2 3.14 B
## 3 10.00 A
## 4 -7.00 A
用户友好的选项 file.choose 允许浏览目录:
df <- read.csv(file.choose())
笔记
- 与
read.table不同,read.csv默认为header = TRUE,并使用第一行作为列名。 - 除非
as.is = TRUE或stringsAsFactors = FALSE,否则所有这些函数都会默认将字符串转换为factor类。 read.csv2变体默认为sep = ";"和dec = ",",用于来自以逗号用作小数点且分号作为字段分隔符的国家/地区的数据。
使用包导入
readr 软件包的 read_csv 功能提供了更快的性能,大文件的进度条,以及比标准 read.csv 更受欢迎的默认选项,包括 stringsAsFactors = FALSE。
library(readr)
df <- read_csv(csv_path)
df
## # A tibble: 4 x 2
## Var1 Var2
## <dbl> <chr>
## 1 2.70 A
## 2 3.14 B
## 3 10.00 A
## 4 -7.00 A