
[译]train_test_split()
发布日期:2021-05-07 14:32:29
浏览次数:24
分类:技术文章
本文共 1337 字,大约阅读时间需要 4 分钟。
-
sklearn.model_selection.train_test_split(*arrays, **options)
将数组或矩阵随机拆分成训练子集和测试子集。
-
Parameters
Parameters 数据类型 意义 *arrays sequence of indexables with same length / shape[0] 待分数据集 test_size float, int or None, optional (default=None) float:表示比例int:表示绝对数量None:表示0.25 train_size float, int, or None, (default=None) 同上,None表示test的补集 random_state int, RandomState instance or None, optional (default=None) int:随机数生成器的种子RandomState:随机数生成器None:np.random所用生成器的实例用于此处的生成器 shuffle boolean, optional (default=True) 不管是否再拆分前进行数据混洗,如果是False则stratify只能是None stratify array-like or None (default=None) 非None则数据按分层范式拆分,且以此为类别的labels,比如stratify= y 关于随机数生成器种子(seed uesd by the random number generator),理解为随机数生成过程的一个记录,种子相同则生成器生成的随机数相同。
Return:包含train-test的list。
如果输入是sparse,输出是
scipy.sparse.csr_matrix
,不然与输入类型相同。 -
Examples
>>> import numpy as np>>> from sklearn.model_selection import train_test_split>>> X, y = np.arange(10).reshape((5, 2)), range(5)>>> Xarray([[0, 1], [2, 3], [4, 5], [6, 7], [8, 9]])>>> list(y)[0, 1, 2, 3, 4]
>>>
>>> X_train, X_test, y_train, y_test = train_test_split(... X, y, test_size=0.33, random_state=42)...>>> X_trainarray([[4, 5], [0, 1], [6, 7]])>>> y_train[2, 0, 3]>>> X_testarray([[2, 3], [8, 9]])>>> y_test[1, 4]
>>>
>>> train_test_split(y, shuffle=False)[[0, 1, 2], [3, 4]]
发表评论
最新留言
表示我来过!
[***.240.166.169]2025年03月27日 13时04分52秒
关于作者

喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
JS数据类型的判断
2019-03-04
实现一个简易Vue(三)Compiler
2019-03-04
仿小米商城(上)
2019-03-04
仿小米商城(下)
2019-03-04
【30】kotlin 闭包
2019-03-04
文件md5怎么会变化
2019-03-04
好玩的editText
2019-03-04
自动安装服务2
2019-03-04
android 用action拦截打电话界面
2019-03-04
错误: 编码GBK的不可映射字符
2019-03-04
Python-Url编码和解码
2019-03-04
2019年一个程序员的回顾与成长计划
2019-03-04
vue if else用法。
2019-03-04
vue 官方实例教程 markdown demo
2019-03-04
Python数据类型 列表、元组、集合、字典的区别和相互转换
2019-03-04
宝塔配置404 502页面
2019-03-04
Mac OS X 下 su 命令提示 sorry 的解决方法
2019-03-04