学习笔记及经历。 博客园 首页 新随笔 联系 订阅 管理 1.2为多变量数据绘制散点阵图

 在这篇博客中,用一个小栗子来介绍一下散点图在多变量数据中的一方面应用。

  scikit库中提供了一些数据,这里使用iris数据集,是一种鸢尾属植物,所给数据中包括两种类型的花,目的是根据所给信息判断两种花分别属于哪一类。也就是说找到区分这两种花的方法。

  加载库

复制代码
1 from sklearn.datasets import load_iris 2 import numpy as np 3 import matplotlib.pyplot as plt 4 import itertools
复制代码

  导入数据

复制代码
1 data = load_iris() 2 x = data['data'] 3 y = data['target'] 4 col_names = data['feature_names']
复制代码

  首先看一下这个数据集中都有什么,放一张过程中的截图。

 

 

 

 

 

 

 

 

 

 

 

 

 

  从上面以及具体内容(数据较多,可以自行查看)可以看到,x中是150x4的二维数组,对应着花萼的长度宽度和花瓣的长度宽度。y中是存储着已知的每组数据对应的花的种类,有0、1两种情况。feature_names中存了每个属性的名称。

  先给出主要的程序,然后慢慢解释其中用到的知识点。

复制代码
 1 # 绘出6个图形,包括了以下几个列:花萼长度、花萼宽度、花瓣长度和花瓣宽度  2 plt.close('all') # 关掉其他的图像  3 plt.figure(1)  4   5 # 绘制一个3行2列的图  6 subplot_start = 321  7 col_numbers = range(0, 4)  8 # 为图形添加标签  9 col_pairs = itertools.combinations(col_numbers, 2) 10 plt.subplots_adjust(wspace = 0.5) 11  12 for col_pair in<
                    
50000+
5万行代码练就真实本领
17年
创办于2008年老牌培训机构
1000+
合作企业
98%
就业率

联系我们

电话咨询

0532-85025005

扫码添加微信