讨论/《Python 深度学习》 - 3.6.2 准备数据/
《Python 深度学习》 - 3.6.2 准备数据
共 1 个回复

求解训练集的均值 mean 和 训练集的标准差 x - u / std
mean = train_data.mean(axis = 0)
train_data -= mean
std = train_data.std(axis = 0)
train_data /= std
工作中不可能提前知道测试集的信息。比如online learning
理论上来说,训练集和测试集应该同分布,使用训练集的均值和方差应该可。

mean = train_data.mean(axis=0)
train_data -= mean
std = train_data.std(axis=0)
train_data /= std

test_data -= mean
test_data /= std
  • 用于测试数据标准化的均值和标准差都是在训练数据上计算得到的。
  • 在工作流程中,你不能使用在测试数据上计算得到的任何结果,即使是像数据标准化这么简单的事情也不行。