糖尿病数据集

注释

从442例糖尿病患者中获得了十个基线变量,年龄,性别,体重指数,平均血压和六个血清测量值,以及一个我们感兴趣的,在基线后一年疾病发展的定量测量值。

数据集特征:

实例数量:

442

属性数量:

前10列是数值型的帮助预测的值

目标:

第11列是基线后一年疾病进展的定量测量址

属性:
Age年龄:
Sex性别:
Body mass index体重指数:
 
Average blood pressure平均血压:
 
S1血清测量值1:
S2血清测量值2:
S3血清测量值3:
S4血清测量值4:
S5血清测量值5:
S6血清测量值6:

注意: 这10个特征变量都已经分别以均值为中心,并按照标准偏差乘以样本数(n_samples)进行缩放(即每列的平方和为1)。

源 URL: http://www4.stat.ncsu.edu/~boos/var.select/diabetes.html

更多信息,请参阅: Bradley Efron, Trevor Hastie, Iain Johnstone and Robert Tibshirani (2004) “Least Angle Regression,” Annals of Statistics (with discussion), 407-499. (http://web.stanford.edu/~hastie/Papers/LARS/LeastAngle_2002.pdf)