深度学习-数据集的划分
数据集的划分方法留出法留出法:将已知数据集分成两个互斥的部分,其中一部分用来训练模型,另一部分用来测试模型,评估其误差,作为泛化误差的估计
通常,训练集:测试集=7:3(按照分层采样的方式)
交叉验证法k折交叉验证法:将数据集D划分K个大小相似的互斥的数据子集,子集数据尽可能保证数据分布的一致性(分层采样),每次从中选取一个数据集作为测试集,其余用作训练集,可以进行k次训练和测试,得到评估均值。也叫k折交叉验证。重复p次,就是p次k折交叉验证。K的取值会影响到结果的稳定性和保真性,通常k取10。
常用于分类
实现代码
from sklearn.model_selection import train_test_split, KFoldimport torchfrom torch.utils.data import DataLoader, TensorDataset# 假设我们有一些数据X = torch.randn(1000, 20) #创建一个形状为(1000,20)的张量y = torch.randint(0, 2, (1000,)) #创建了一个长度为1000的一维张 ...
Marktext用法、hexo指令以及一些乱七八糟的指令
Martext用法学习记录@键可以显示出所有可用功能的窗口
Ctrl+j 可以打开侧边栏
Ctrl+shift+T可以创建表格
:s:可以创建小表情:sleeping::sneezing_face::kissing_closed_eyes:
改变字体颜色加上 <font color='red'></font> 改变字体颜色
Ctrl+Shift+i快速导入图片
数学符号书写语法上标:$x^{2}$ $x^2$下标:$x_{i}$ $x_{i}$分数:$\frac{分子}{分母}$ $\frac{分子}{分母}$累加:$\sum_{i=0}^{y}x_i$ $\sum_{i=0}^{y}x_i$累和:$\prod_{i=0}^{y}x_i$ $\prod_{i=0}^{y}x_i$极限:$\lim_{x \to \infty} 表达式 ...