qplot()的意思是快速作图,利用它可以很方便的创建各种复杂的图形,其他系统需要好几行代码才能解决的问题,用qplot只需要一行就能完成。
本篇主要介绍:
- qplot()的基本用法
- 如何将变量映射到图形属性上(如大小、颜色和形状等)
- 如何通过指定不同的几何对象来创建不同类型的图形,以及如何将他们组合在一张图中
- 分面的应用,将数据拆分子集
1.数据集
首先我们示例使用的数据集是R自带的diamonds数据集,包含54000颗钻石的价格和质量信息。
我们同时使用一个小数据集dsmall,它是原始数据一个容量为100的随机样本,我们用这个数据集进行小数据的作图展示。
set.seed
(123)
dsmall <- diamonds[
sample
(
nrow
(diamonds),100),]
2.基本语法
qplot()
的意思是快速作图,利用它可以很方便的创建各种复杂的图形,其他系统需要好几行代码才能解决的问题,用qplot只需要一行就能完成。
qplot()
函数的语法与基础绘图系统类似,简短易输入,通常用于探索性数据分析。
语法格式:qplot(x,y,data,geom=c(xx,xx))
qplot()
的前两个参数是x和y,分别代表所画对象的x坐标和y坐标,还有一个可选的data参数,如果进行指定,那么qplot()会首先在的数据框中查找变量名,然后再到R的工作空间中进行搜索。
下面是使用qplot()
的一个简单例子:
qplot(carat,price,data=diamonds)
现在这种关系就接近线性了,
这张图显示了变量之间很强的相关关系,以及一些明显的异常值,这些关系似乎是指数型的,我们接下来对变量进行一些变换:
qplot(
log
(carat),
log
(price),data=diamonds)
现在这种关系就接近线性了,由于图中的元素有很大的重叠,下结论时需要谨慎。如果我们研究体积(X*Y*Z)和其重量之间的关系,我们可以这样:
我们可以看到,大部分的钻石都落在同一条直线上,但依然存在一些大的异常点。钻石的密度应该是一个常数,所以体积和重量之间应该是线性关系。