1

2026-02-10 12:26:14 +08:00 · 2026-02-10 12:26:14 +08:00 · 33f8edcd86
parent e42b71ca5e
commit 33f8edcd86
2 changed files with 25 additions and 10 deletions
--- a/parameters.pkl
+++ b/parameters.pkl
--- a/神经网络/main.py
+++ b/神经网络/main.py
@ -4,7 +4,7 @@
 """
 # 导入模块
-from typing import List, Literal, Optional, Dict, Tuple
+from typing import List, Literal
 import numpy
 import pickle
@ -43,6 +43,8 @@ class NeuralNetwork:
            raise RuntimeError("神经网络结构应为列表，长度大于等于3且元素均为正整数")
        # 初始化神经网络结构
        self.structure = structure
        # 神经网络层数（定义，第0层为输入层，第l层为隐含层（l=1,2,...,L-1），第L层为输出层（L为神经网络层数），深度为L+1）
        self.layer_counts = len(structure) - 1
        if hidden_activate not in self.HIDDEN_ACTIVATES:
            raise RuntimeError(f"该隐含层激活函数 {hidden_activate} 暂不支持")
@ -51,9 +53,6 @@ class NeuralNetwork:
            raise RuntimeError(f"该输出层激活函数 {output_activate} 暂不支持")
        self.output_activate = output_activate
        # 神经网络层数（定义，第0层为输入层，第l层为隐含层（l=1,2,...,L-1），第L层为输出层（L为神经网络层数），深度为L+1）
        self.layer_counts = len(structure) - 1
        # 初始化神经网络参数
        self.parameters = {}
@ -414,7 +413,17 @@ class NeuralNetwork:
        """
        with open("parameters.pkl", "wb") as file:
            pickle.dump(
-                obj=self.parameters,
+                obj={
                    layer_index: {
                        key: value
                        for key, value in layer_parameters.items()
                        if layer_index == 0
                        and key in ["mean", "variance"]
                        or layer_index != 0
                        and key in ["weight", "bias", "activate"]
                    }
                    for layer_index, layer_parameters in self.parameters.items()
                },
                file=file,
                protocol=pickle.HIGHEST_PROTOCOL,
            )
@ -456,17 +465,25 @@ class NeuralNetwork:
                == (self.structure[layer_index], self.structure[layer_index - 1])
                and self.parameters[layer_index]["bias"].shape
                == (self.structure[layer_index], 1)
                and (
                    self.parameters[layer_index]["activate"] in self.output_activate
                    if layer_index == self.layer_counts
                    else self.parameters[layer_index]["activate"]
                    in self.hidden_activate
                )
                if isinstance(self.parameters[layer_index]["weight"], numpy.ndarray)
                and isinstance(self.parameters[layer_index]["bias"], numpy.ndarray)
                else False
            ):
-                raise RuntimeError("神经网络参数中权重和偏置的维度与神经网络结构不匹配")
+                raise RuntimeError(
                    "神经网络参数中权重和偏置的维度与神经网络结构不匹配、或激活函数不匹配"
                )
 # 测试代码
 if __name__ == "__main__":
-    X = numpy.random.randn(2, 5000)
+    X = numpy.random.randn(2, 1000)
    # 真实函数：y = 2*x1 + 3*x2 + 1
    y_true = 2 * X[0:1, :] ** 2 + 3 * X[1:2, :] + 1
@ -476,9 +493,7 @@ if __name__ == "__main__":
    )
    # 训练
-    neural_network.train(
+    #neural_network.train(X=X, y_true=y_true, target_loss=0.01, epochs=1000_000, learning_rate=0.05)
        X=X, y_true=y_true, target_loss=0.01, epochs=1_000, learning_rate=0.1
    )
    print(f"推理结果：{y_true[:, 0:5]}")