博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《机器学习与数据科学(基于R的统计学习方法)》——2.6 读取Excel文件
阅读量:5942 次
发布时间:2019-06-19

本文共 841 字,大约阅读时间需要 2 分钟。

本节书摘来异步社区《机器学习与数据科学(基于R的统计学习方法)》一书中的第2章,第2.6节,作者:【美】Daniel D. Gutierrez(古铁雷斯),更多章节内容可以访问云栖社区“异步社区”公众号查看。

2.6 读取Excel文件

机器学习中另一种重要的文件类型是Excel。Excel是应用很广泛的电子表格软件,各种规模的企业都依赖这个工具来存储商业信息。这样一来,你希望在机器学习中使用存放在Excel中的数据就很容易理解了。

R提供了直接从Excel 2007电子表格文件中读取数据的工具:read.xlsx()和read.xlsx2()函数。read.xlsx2()函数通常能更快地处理大型电子表格。为了测试读取Excel文件,我们需要回到San Francisco Data网站去下载同一个Parking Meters数据集,但是这一次是下载XLSX格式的数据。注意到Excel文件是一个二进制文件而不是纯文本文档,我们需要为download.file()函数指定mode=“wb”(说明文件是二进制类型)。我们还需要使用library()函数来加载xlsx包,否则使用中会找不到包中的函数。最后,为了把Excel文件读入数据框中,我们将使用read.xlsx2(),并设定参数sheetIndex=1,这指示了读入Excel文件中的哪一个表单。

> fileUrl <- "https://data.sfgov.org/api/views/7egw-qt89/rows. xlsx?accessType=DOWNLOAD"> download.file(fileUrl, destfile="./data/SFParkingMeters.  xlsx", mode="wb")> library(xlsx)> SFParkingMeters <- read.xlsx2("./data/SFParkingMeters.xlsx", sheetIndex=1)```

转载地址:http://nyhtx.baihongyu.com/

你可能感兴趣的文章
使用data pump工具的准备
查看>>
springMVC---级联属性
查看>>
get和post区别
查看>>
crontab执行shell脚本日志中出现乱码
查看>>
cmd.exe启动参数说明
查看>>
《随笔记录》20170310
查看>>
网站分析系统
查看>>
从零开始来看一下Java泛型的设计
查看>>
Shell编程基础
查看>>
Shell之Sed常用用法
查看>>
3.1
查看>>
校验表单如何摆脱 if else ?
查看>>
JS敏感信息泄露:不容忽视的WEB漏洞
查看>>
分布式memcached服务器代理magent安装配置(CentOS6.6)
查看>>
Create Volume 操作(Part III) - 每天5分钟玩转 OpenStack(52)
查看>>
tomcat 8.0虚拟机配置文档
查看>>
pxc群集搭建
查看>>
JS中加载cssText延时
查看>>
常用的脚本编程知识点
查看>>
XILINX_zynq_详解(6)
查看>>