
[译]sklearn.preprocessing.StandardScaler
发布日期:2021-05-07 14:32:31
浏览次数:29
分类:原创文章
本文共 1138 字,大约阅读时间需要 3 分钟。
class sklearn.preprocessing.StandardScaler(copy=True, with_mean=True, with_std=True)
通过去除均值和缩放为单位变量实现特征标准化。
计算方式为
z = x − μ s z=\frac{x-\mu}{s} z=sx−μ
μ \mu μ是训练样本的均值或者为0(当with_mean=False
), s s s是标准差或者1(如果with_std=False
)
针对么个特征通过计算训练样本的相关统计量实现中心化和缩放独立进行,均值和标准差会被存储一遍后续transform
方法使用。
数据集的标准化是很多机器学习算法常见的要求:这些算法可能会表现低劣如果独立特征不是或多或少呈现标准正态分布。
例如,一个学习算法(如SVM算法的RBF核,线性模型的L1、L2正则因子)目标函数中常用的元素假定所有特征均值为0,且同方差。
如果一个特征的方差比其他的量级要大,它可能会主宰目标函数,导致模型不能正确的从其它特征处学到本质的规律。
这个定标器也可用于sparse CSR or CSC 矩阵通过with_mean=False
避免破坏数据的稀疏结构
-
Parameters
Parameters | 数据结构 | 意义 |
---|---|---|
copy | boolean, optional, default True | False:不保存副本,立即缩放 |
with_mean | boolean, True by default | True:指定数据中心。 |
with_std | boolean, True by default | True:以单位标准差缩放 |
-
Attributes
Attributes | 数据结构 | 意义 |
---|---|---|
scale_ | ndarray or None, shape (n_features,) | |
mean_ | ndarray or None, shape (n_features,) | |
var_ | ndarray or None, shape (n_features,) | |
n_samples_seen_ | int or array, shape (n_features,) |
-
Methods
Methods | 意义 |
---|---|
(self, X[, y]) | 计算缩放用的均值和方差 |
(self, X[, y]) | 拟合,然后转换 |
(self[, deep]) | 获取参数 |
(self, X[, copy]) | 将数据返回原始形式 |
(self, X[, y]) | Online computation of mean and std on X for later scaling. |
(self, **params) | 设置参数 |
(self, X[, copy]) | 执行标准化 |
发表评论
最新留言
路过,博主的博客真漂亮。。
[***.116.15.85]2025年03月23日 19时12分12秒
关于作者

喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
阿里巴巴Json工具-Fastjson教程
2019-03-06
Spring Cloud Gateway - 快速开始
2019-03-06
Spring Security 实战干货:理解AuthenticationManager
2019-03-06
Java对象转JSON时如何动态的增删改查属性
2019-03-06
Python 面向对象进阶
2019-03-06
Linux常用统计命令之wc
2019-03-06
Git安装及使用以及连接GitHub方法详解
2019-03-06
docker容器与虚拟机的区别
2019-03-06
shell脚本里使用echo输出颜色
2019-03-06
Python2跟Python3的区别
2019-03-06
并发编程——IO模型详解
2019-03-06
Java之封装,继承,多态
2019-03-06
wait()与notify()
2019-03-06
使用js打印时去除页眉页脚
2019-03-06
Spring security OAuth2.0认证授权学习第二天(基础概念-RBAC)
2019-03-06
ORA-00904: "FILED_TYPE": 标识符无效
2019-03-06
数据仓库系列之维度建模
2019-03-06
Scala教程之:函数式的Scala
2019-03-06
java中DelayQueue的使用
2019-03-06
线程stop和Interrupt
2019-03-06