在校正数据上训练全连接的多层神经网络

在这个例子中，我们将考虑基于神经网络模型的数据处理和训练。将演示滑动窗口方法，将训练和测试样本划分为训练数据集，并确定模型参数以获得最准确的预测值。

启动必要的库:

Pkg.add(["Statistics", "CSV", "Flux", "Optimisers"])

   Resolving package versions...
  No Changes to `~/.project/Project.toml`
  No Changes to `~/.project/Manifest.toml`

using Statistics
using CSV
using DataFrames
using Flux
using Plots
using Flux: train!
using Optimisers

培训和测试样本的准备:

上传用于训练模型的数据:

df = DataFrame(CSV.File("$(@__DIR__)/data.csv"));

执行示例**/start/examples/data_analysis/data_processing后保存了数据。ipynb**。

训练数据集的形成:

整个数据集分为训练和测试样本。训练样本为总数据集的0.8，测试样本为0.2。

T = df[1:1460,3]; # 训练数据集的定义，1825行的整个数据集
first(df, 5)

将向量T分成长度为100个观测值的批次:

batch_starts = 1:1:1360 # 为循环定义范围

weather_batches = [] # 定义一个空数组来记录循环的结果
for start in batch_starts
    dop = T[start:start+99] # 批次处于当前时间步
    weather_batches = vcat(weather_batches, dop) # 将批处理写入数组
end

批处理是一个小数据集，可用作构建预测模型的训练集。取自初始训练集T采用滑动窗方法。

滑动窗口方法:

其中x是观测值，y1是预测值。

将结果集转换为向量字符串:

weather_batches = weather_batches'

1×136000 adjoint(::Vector{Any}) with eltype Any:
 19.7  22.1  23.0  23.4  21.9  23.35  …  26.4  18.8  19.7  16.3  16.8  20.5

更改数组的形状以匹配上面指定的批处理的长度:

weather_batches = reshape(weather_batches, (100,:))

100×1360 reshape(adjoint(::Vector{Any}), 100, 1360) with eltype Any:
 19.7   22.1   23.0   23.4   21.9   23.35  …  -4.4     -2.9  -4.0  -4.7  -4.2
 22.1   23.0   23.4   21.9   23.35  24.8      -2.9     -4.0  -4.7  -4.2  -7.8
 23.0   23.4   21.9   23.35  24.8   26.25     -4.0     -4.7  -4.2  -7.8   1.7
 23.4   21.9   23.35  24.8   26.25  27.7      -4.7     -4.2  -7.8   1.7   2.8
 21.9   23.35  24.8   26.25  27.7   28.0      -4.2     -7.8   1.7   2.8   2.9
 23.35  24.8   26.25  27.7   28.0   27.4   …  -7.8      1.7   2.8   2.9   5.8
 24.8   26.25  27.7   28.0   27.4   25.1       1.7      2.8   2.9   5.8   3.1
 26.25  27.7   28.0   27.4   25.1   25.6       2.8      2.9   5.8   3.1   4.1
 27.7   28.0   27.4   25.1   25.6   24.5       2.9      5.8   3.1   4.1   5.1
 28.0   27.4   25.1   25.6   24.5   21.9       5.8      3.1   4.1   5.1   4.4
 27.4   25.1   25.6   24.5   21.9   15.5   …   3.1      4.1   5.1   4.4   4.3
 25.1   25.6   24.5   21.9   15.5   22.7       4.1      5.1   4.4   4.3   7.5
 25.6   24.5   21.9   15.5   22.7   23.1       5.1      4.4   4.3   7.5   6.9
  ⋮                                  ⋮     ⋱   ⋮                         
 22.1   18.9   17.9   15.5   20.9   20.3      19.9917  19.7  15.3  20.5  19.5
 18.9   17.9   15.5   20.9   20.3   16.7      19.7     15.3  20.5  19.5  19.3
 17.9   15.5   20.9   20.3   16.7   15.5   …  15.3     20.5  19.5  19.3  21.6
 15.5   20.9   20.3   16.7   15.5   12.7      20.5     19.5  19.3  21.6  21.1
 20.9   20.3   16.7   15.5   12.7    9.7      19.5     19.3  21.6  21.1  23.8
 20.3   16.7   15.5   12.7    9.7    6.7      19.3     21.6  21.1  23.8  23.6
 16.7   15.5   12.7    9.7    6.7    4.3      21.6     21.1  23.8  23.6  26.4
 15.5   12.7    9.7    6.7    4.3    5.6   …  21.1     23.8  23.6  26.4  18.8
 12.7    9.7    6.7    4.3    5.6   12.2      23.8     23.6  26.4  18.8  19.7
  9.7    6.7    4.3    5.6   12.2   12.8      23.6     26.4  18.8  19.7  16.3
  6.7    4.3    5.6   12.2   12.8   12.3      26.4     18.8  19.7  16.3  16.8
  4.3    5.6   12.2   12.8   12.3    9.8      18.8     19.7  16.3  16.8  20.5

X = weather_batches # 重新划分选区

100×1360 reshape(adjoint(::Vector{Any}), 100, 1360) with eltype Any:
 19.7   22.1   23.0   23.4   21.9   23.35  …  -4.4     -2.9  -4.0  -4.7  -4.2
 22.1   23.0   23.4   21.9   23.35  24.8      -2.9     -4.0  -4.7  -4.2  -7.8
 23.0   23.4   21.9   23.35  24.8   26.25     -4.0     -4.7  -4.2  -7.8   1.7
 23.4   21.9   23.35  24.8   26.25  27.7      -4.7     -4.2  -7.8   1.7   2.8
 21.9   23.35  24.8   26.25  27.7   28.0      -4.2     -7.8   1.7   2.8   2.9
 23.35  24.8   26.25  27.7   28.0   27.4   …  -7.8      1.7   2.8   2.9   5.8
 24.8   26.25  27.7   28.0   27.4   25.1       1.7      2.8   2.9   5.8   3.1
 26.25  27.7   28.0   27.4   25.1   25.6       2.8      2.9   5.8   3.1   4.1
 27.7   28.0   27.4   25.1   25.6   24.5       2.9      5.8   3.1   4.1   5.1
 28.0   27.4   25.1   25.6   24.5   21.9       5.8      3.1   4.1   5.1   4.4
 27.4   25.1   25.6   24.5   21.9   15.5   …   3.1      4.1   5.1   4.4   4.3
 25.1   25.6   24.5   21.9   15.5   22.7       4.1      5.1   4.4   4.3   7.5
 25.6   24.5   21.9   15.5   22.7   23.1       5.1      4.4   4.3   7.5   6.9
  ⋮                                  ⋮     ⋱   ⋮                         
 22.1   18.9   17.9   15.5   20.9   20.3      19.9917  19.7  15.3  20.5  19.5
 18.9   17.9   15.5   20.9   20.3   16.7      19.7     15.3  20.5  19.5  19.3
 17.9   15.5   20.9   20.3   16.7   15.5   …  15.3     20.5  19.5  19.3  21.6
 15.5   20.9   20.3   16.7   15.5   12.7      20.5     19.5  19.3  21.6  21.1
 20.9   20.3   16.7   15.5   12.7    9.7      19.5     19.3  21.6  21.1  23.8
 20.3   16.7   15.5   12.7    9.7    6.7      19.3     21.6  21.1  23.8  23.6
 16.7   15.5   12.7    9.7    6.7    4.3      21.6     21.1  23.8  23.6  26.4
 15.5   12.7    9.7    6.7    4.3    5.6   …  21.1     23.8  23.6  26.4  18.8
 12.7    9.7    6.7    4.3    5.6   12.2      23.8     23.6  26.4  18.8  19.7
  9.7    6.7    4.3    5.6   12.2   12.8      23.6     26.4  18.8  19.7  16.3
  6.7    4.3    5.6   12.2   12.8   12.3      26.4     18.8  19.7  16.3  16.8
  4.3    5.6   12.2   12.8   12.3    9.8      18.8     19.7  16.3  16.8  20.5

定义目标值数组:

Y = (T[101:1460]) # 倒计时从101开始，因为之前的100个观测值用作初始数据。
Y = Y'

1×1360 adjoint(::Vector{Float64}) with eltype Float64:
 5.6  12.2  12.8  12.3  9.8  11.0  8.7  …  18.8  19.7  16.3  16.8  20.5  19.2

转换为神经网络处理可接受的格式:

X = convert(Array{Float32}, X)
Y = convert(Array{Float32}, Y)

1×1360 Matrix{Float32}:
 5.6  12.2  12.8  12.3  9.8  11.0  8.7  …  18.8  19.7  16.3  16.8  20.5  19.2

创建测试数据集:

将测试样品分成长度为100个观测值的批次:

X_test = df[1461:1820, 3] # 定义测试数据集
batch_starts_test = 1:1:261  # 为循环定义范围

test_batches = [] # 定义一个空数组来记录循环的结果
for start in batch_starts_test
    dop = X_test[start:start+99] # 批次处于当前时间步
    test_batches = vcat(test_batches, dop) # 将批处理写入数组
end
test_batches = reshape(test_batches, (100,:)) # 更改数组的形状以匹配上面指定的批处理的长度:

X_test = convert(Array{Float32}, test_batches) # 转换为神经网络处理可接受的格式

100×261 Matrix{Float32}:
 23.1  18.9  17.2  12.4  15.0  23.3  …  -9.7  -8.8  -7.4  -5.2  -3.1  -2.0
 18.9  17.2  12.4  15.0  23.3  20.7     -8.8  -7.4  -5.2  -3.1  -2.0  -1.3
 17.2  12.4  15.0  23.3  20.7  15.0     -7.4  -5.2  -3.1  -2.0  -1.3  -0.5
 12.4  15.0  23.3  20.7  15.0  13.2     -5.2  -3.1  -2.0  -1.3  -0.5  -2.4
 15.0  23.3  20.7  15.0  13.2  11.2     -3.1  -2.0  -1.3  -0.5  -2.4  -0.9
 23.3  20.7  15.0  13.2  11.2  15.5  …  -2.0  -1.3  -0.5  -2.4  -0.9  -0.2
 20.7  15.0  13.2  11.2  15.5  13.4     -1.3  -0.5  -2.4  -0.9  -0.2  -3.9
 15.0  13.2  11.2  15.5  13.4  14.1     -0.5  -2.4  -0.9  -0.2  -3.9   2.0
 13.2  11.2  15.5  13.4  14.1  10.9     -2.4  -0.9  -0.2  -3.9   2.0   1.3
 11.2  15.5  13.4  14.1  10.9  14.5     -0.9  -0.2  -3.9   2.0   1.3   1.0
 15.5  13.4  14.1  10.9  14.5  15.2  …  -0.2  -3.9   2.0   1.3   1.0   0.3
 13.4  14.1  10.9  14.5  15.2  25.0     -3.9   2.0   1.3   1.0   0.3   1.4
 14.1  10.9  14.5  15.2  25.0  26.5      2.0   1.3   1.0   0.3   1.4  -0.5
  ⋮                             ⋮    ⋱   ⋮                             ⋮
 16.7  16.4  21.4  17.1  17.1  20.0     21.5  22.2  23.3  21.8  22.4  26.3
 16.4  21.4  17.1  17.1  20.0  18.0     22.2  23.3  21.8  22.4  26.3  28.0
 21.4  17.1  17.1  20.0  18.0  24.2  …  23.3  21.8  22.4  26.3  28.0  27.9
 17.1  17.1  20.0  18.0  24.2  14.7     21.8  22.4  26.3  28.0  27.9  27.7
 17.1  20.0  18.0  24.2  14.7  16.0     22.4  26.3  28.0  27.9  27.7  26.6
 20.0  18.0  24.2  14.7  16.0  24.6     26.3  28.0  27.9  27.7  26.6  25.1
 18.0  24.2  14.7  16.0  24.6  23.3     28.0  27.9  27.7  26.6  25.1  21.0
 24.2  14.7  16.0  24.6  23.3  19.4  …  27.9  27.7  26.6  25.1  21.0  18.7
 14.7  16.0  24.6  23.3  19.4  11.6     27.7  26.6  25.1  21.0  18.7  17.8
 16.0  24.6  23.3  19.4  11.6  13.7     26.6  25.1  21.0  18.7  17.8  21.3
 24.6  23.3  19.4  11.6  13.7   8.3     25.1  21.0  18.7  17.8  21.3  21.6
 23.3  19.4  11.6  13.7   8.3  13.9     21.0  18.7  17.8  21.3  21.6  21.9

构建和训练神经网络:

定义神经网络的体系结构:

model = Flux.Chain(
    Dense(100 => 50, elu),
    Dense(50 => 25, elu),
    Dense(25 => 5, elu),
    Dense(5 => 1)
)

Chain(
  Dense(100 => 50, elu),                # 5_050 parameters
  Dense(50 => 25, elu),                 # 1_275 parameters
  Dense(25 => 5, elu),                  # 130 parameters
  Dense(5 => 1),                        # 6 parameters
)                   # Total: 8 arrays, 6_461 parameters, 25.738 KiB.

定义学习参数:

# 初始化优化器
learning_rate = 0.001f0
opt = Optimisers.Adam(learning_rate)
state = Optimisers.setup(opt, model)  # 创建初始状态

# 损失函数
loss(model, x, y) = Flux.mse(model(x), y)

loss (generic function with 1 method)

模型训练:

loss_history = []
epochs = 200

for epoch in 1:epochs
    # 计算梯度
    grads = gradient(model) do m
        loss(m, X, Y)
    end
    
    # 更新模型和状态
    state, model = Optimisers.update(state, model, grads[1])
    
    # 计算及保存损失
    current_loss = loss(model, X, Y)
    push!(loss_history, current_loss)
    
    # 每个步骤的损耗输出
    if epoch == 1 || epoch % 10 == 0
        println("Epoch $epoch: Loss = $current_loss")
    end
end

Epoch 1: Loss = 147.93127
Epoch 10: Loss = 40.457306
Epoch 20: Loss = 34.76956
Epoch 30: Loss = 26.913574
Epoch 40: Loss = 24.001925
Epoch 50: Loss = 20.977661
Epoch 60: Loss = 18.199791
Epoch 70: Loss = 16.144032
Epoch 80: Loss = 14.6047535
Epoch 90: Loss = 13.4236555
Epoch 100: Loss = 12.447013
Epoch 110: Loss = 11.691035
Epoch 120: Loss = 11.081361
Epoch 130: Loss = 10.575395
Epoch 140: Loss = 10.132528
Epoch 150: Loss = 9.736594
Epoch 160: Loss = 9.365963
Epoch 170: Loss = 9.002684
Epoch 180: Loss = 8.6449375
Epoch 190: Loss = 8.312174
Epoch 200: Loss = 7.997946

损失函数变化的可视化:

plot((1:epochs), loss_history, title="更改损失函数", xlabel="时代", ylabel="损失函数")

获取预测值:

y_hat_raw = model(X_test) # 将测试样本上传到模型并获得预测
y_pred = y_hat_raw'
y_pred = y_pred[:,1]
y_pred = convert(Vector{Float64}, y_pred) 
first(y_pred, 5)

5-element Vector{Float64}:
 19.431472778320312
 20.471216201782227
 18.861164093017578
 13.53215217590332
 14.286093711853027

预测值的可视化:

days = df[:,1] # 形成一个阵列的天，从第一次观察开始
first(days, 5)

5-element Vector{Int64}:
 1
 2
 3
 4
 5

启用后端图形显示方法:

plotlyjs()

Plots.PlotlyJSBackend()

从初始数据集生成数据集以进行比较:

df_T = df[:, 3]# df[1471:1820, 3]
first(df_T, 5)

5-element Vector{Float64}:
 19.7
 22.1
 23.0
 23.4
 21.9

根据初始数据和预测数据绘制温度与时间的相关性:

plot(days, df_T)# plot(days, T[11:end]) #T[11:end]
plot!(days[1560:1820], y_pred)

由于原始数据集具有缺失值已被线性插值替换的部分，因此很难在直线上评估训练的神经网络模型的性能。

为了做到这一点，真实的数据被上传没有任何差距。:

real_data = DataFrame(CSV.File("$(@__DIR__)/real_data.csv"));

根据真实数据和预测数据绘制温度与时间的关系图:

plot(real_data[1:261,2])
plot!(y_pred)

让我们使用Pearson相关性检查获得值的关系，从而评估获得模型的准确性。:

corr_T = cor(y_pred,real_data[1:261,2])

0.9028290729873935

Pearson相关系数可以取-1到1的值，其中0表示变量之间没有任何关系，-1和1表示密切关系（分别为逆关系和直接关系）。

结论:

在这个例子中，来自过去五年温度观测的数据被预处理，并且神经网络的架构，优化器的参数和损失函数被确定。
该模型经过训练，并显示出预测值与真实数据的相当高但不完美的收敛。为了提高预测的质量，可以通过改变层的体系结构和增加训练样本来修改神经网络。

Row	date	P	T
	Int64	Float64	Float64
1	1	747.7	19.7
2	2	744.2	22.1
3	3	748.6	23.0
4	4	754.5	23.4
5	5	754.6	21.9