Binomial_CrossEnthophy

fixed rowwise/colswise mean/sum and implemented binomial_corssentrhopy. Next up is regression.
2026-05-22 10:11:43 +02:00
parent eb0a49591e
commit cb65174cf4
21 changed files with 894 additions and 159 deletions
@@ -20,9 +20,9 @@
 int main(int argc, char const *argv[])
 {   

-    uint64_t number_of_classes = 3;
-    uint64_t number_of_samples = 1000;
-    uint64_t number_of_epochs = 500;
+    uint64_t number_of_classes = 2;
+    uint64_t number_of_samples = 150;
+    uint64_t number_of_epochs = 1000;

    utils::Mf X;
    utils::Mf X_test;
@@ -34,13 +34,14 @@ int main(int argc, char const *argv[])
    float accuracy;

    utils::Vector<uint64_t> class_targets;
-    utils::Vector<uint64_t> predections;
+    utils::Vector<float> predictions;


    // Create dataset
    neural_networks::create_spital_data<float, int64_t>(number_of_samples, number_of_classes, X, y);
    //neural_networks::create_vertical_data<float, int64_t>(number_of_samples, number_of_classes, X, y);

+    
    // Create Dense layer with 2 input featues and 3 output values
    neural_networks::Dense_Layer<float> dense1(
                                            2, 16,  // input/output
@@ -65,29 +66,31 @@ int main(int argc, char const *argv[])
                                            0.0f,   // bias L1
                                            5e-4f    // bias L2
                                            );
-    // Create Softmax activation (to be used with Dense layer)
    neural_networks::Activation_Softmax<float> activation2;


    // Create a second Dense layer with 3 inputs (as we take the vlaues from the last layer)
    // and 3 output values
    neural_networks::Dense_Layer<float> dense3(
-                                            16, number_of_classes,  // input/output
+                                            16, 1,  // input/output
                                            0.0f,  // weight L1
                                            5e-4f,  // weight L2
                                            0.0f,   // bias L1
                                            5e-4f    // bias L2
                                            );
+    neural_networks::Activation_Sigmoid<float> activation3;
+

    // Create a Sfotmax classifier's combined loss and activation
-    neural_networks::Activation_Softmax_Loss_CategoricalCrossentropy<float, int64_t> loss_activation;
+    //neural_networks::Activation_Softmax_Loss_CategoricalCrossentropy<float, int64_t> loss_activation;
+    neural_networks::Loss_BinaryCrossentropy<float, int64_t> loss_activation;

    // Create optimizer
    //neural_networks::Optimizer_SGD<float> optimizer(1, 1e-3, 0.5);
    //neural_networks::Optimizer_Adagrad<float> optimizer(1, 1e-3, 1e-6);
    //neural_networks::Optimizer_RMSprop<float> optimizer(1, 1e-3, 1e-6, 0.9);
    neural_networks::Optimizer_Adam<float> optimizer(
-                                                    0.05,      // Learning-rate
+                                                    0.05,   // Learning-rate
                                                    5e-5,   // Learning-rate decay
                                                    1e-6,   // epsilons
                                                    0.9,    // beta 1 
@@ -101,51 +104,36 @@ int main(int argc, char const *argv[])

        // Perform a forward pass of our training data through this layer
        dense1.forward(X);
-
-        // Perform a forward pass thourgh activation function
-        // takes the output fo the first layer here
        activation1.forward(dense1.outputs);
        dropout1.forward(activation1.outputs);

-        // Perform a forward pass through second Dense layer
-        // takes output of activation function of the first layer as input
        dense2.forward(dropout1.outputs);
-
-
-        // Perform a forward pass thourgh activation function
-        // takes the output fo the first layer here
        activation2.forward(dense2.outputs);

-        // Perform a forward pass through second Dense layer
-        // takes output of activation function of the first layer as input
        dense3.forward(activation2.outputs);
-
-
+        activation3.forward(dense3.outputs);

        // Perform a foard pass through the activation/loss function
        // takes the output of the second dense layer here and returns loss
-        data_loss = loss_activation.forward(dense3.outputs, y);
+        data_loss = loss_activation.calculate(activation3.outputs, y);

        // Calculate regularization penalty
-        regularization_loss = loss_activation.loss.regularization_loss(dense1) + loss_activation.loss.regularization_loss(dense2) + loss_activation.loss.regularization_loss(dense3);
+        regularization_loss = loss_activation.regularization_loss(dense1) + 
+                            loss_activation.regularization_loss(dense2) + 
+                            loss_activation.regularization_loss(dense3);

        loss = data_loss + regularization_loss;

-        // Calculate accuracy from output of activation2 and targets
-        //predections = numerics::matargmax_row <int64_t, float>(loss_activation.outputs);
-        predections = numerics::argmax_rowwise(loss_activation.outputs);
-
-        if (y.cols() > 1){
-            class_targets = numerics::argmax_rowwise(y);
-        }else{
-            class_targets = utils::veccast <uint64_t, int64_t> (y.get_col(0));
-        }
-
-
-        accuracy = numerics::mean( utils::veccast<float, uint64_t> (numerics::equal_elementwise_serial(predections, class_targets)));
+        // Calculate accuracy from output of activation3 and targets
+        // Part in the brackets returns a binary mask - array consisting
+        // of True/False values, multiplying it by 1 changes it into array
+        // of 1s and 0s
+        predictions = numerics::greater_than(activation3.outputs, 0.5f).get_col(0);
+        accuracy = numerics::mean(numerics::equal_elementwise_serial(predictions, utils::veccast<float, int64_t>(y.get_col(0))));


        if (!(epoch%100)){
+            
            std::cout << "epoch: " << epoch;
            std::cout << ", acc: " << accuracy;
            std::cout << ", loss: " << loss;
@@ -153,18 +141,22 @@ int main(int argc, char const *argv[])
            std::cout << ", regularization_loss: " << regularization_loss;
            std::cout << ", lr: " << optimizer.current_learning_rate;
            std::cout << std::endl;
+
        }

        // Backward pass
-        loss_activation.backward(loss_activation.outputs, y);
-        dense3.backward(loss_activation.dinputs);
+        loss_activation.backward(activation3.outputs, y);
+
+        activation3.backward(loss_activation.dinputs);
+        dense3.backward(activation3.dinputs);
+
        activation2.backward(dense3.dinputs);
        dense2.backward(activation2.dinputs);
+
        dropout1.backward(dense2.dinputs);
        activation1.backward(dropout1.dinputs);
        dense1.backward(activation1.dinputs);

-
        // Update weights and biases
        optimizer.pre_update_params();
        optimizer.update_params(dense1);
@@ -179,48 +171,34 @@ int main(int argc, char const *argv[])
    // Create dataset
    neural_networks::create_spital_data<float, int64_t>(100, number_of_classes, X_test, y_test);

-    // Perform a forward pass of our testing data through this layer
+    // Perform a forward pass of our training data through this layer
    dense1.forward(X_test);
-
-
-    // Perform a forward pass thourgh activation function
-    // takes the output fo the first layer here
    activation1.forward(dense1.outputs);
+    //dropout1.forward(activation1.outputs);

-    // Perform a forward pass through second Dense layer
-    // takes output of activation function of the first layer as input
    dense2.forward(activation1.outputs);
-
-    // Perform a forward pass thourgh activation function
-    // takes the output fo the first layer here
    activation2.forward(dense2.outputs);

-    // Perform a forward pass through second Dense layer
-    // takes output of activation function of the first layer as input
    dense3.forward(activation2.outputs);
-
+    activation3.forward(dense3.outputs);

    // Perform a foard pass through the activation/loss function
    // takes the output of the second dense layer here and returns loss
-    data_loss = loss_activation.forward(dense3.outputs, y_test);
+    data_loss = loss_activation.calculate(activation3.outputs, y_test);

    // Calculate regularization penalty
-    regularization_loss = loss_activation.loss.regularization_loss(dense1) + loss_activation.loss.regularization_loss(dense2) + loss_activation.loss.regularization_loss(dense3);
+    regularization_loss = loss_activation.regularization_loss(dense1) + 
+                        loss_activation.regularization_loss(dense2) + 
+                        loss_activation.regularization_loss(dense3);

    loss = data_loss + regularization_loss;

    // Calculate accuracy from output of activation2 and targets
-    predections = numerics::argmax_rowwise(loss_activation.outputs);
+    predictions = numerics::greater_than(activation3.outputs, 0.5f).get_col(0);

-    if (y.cols() > 1){
-        class_targets = numerics::argmax_rowwise(y_test);
-    }else{
-        class_targets = utils::veccast <uint64_t, int64_t> (y_test.get_col(0));
-    }
+    accuracy = numerics::mean(numerics::equal_elementwise_serial(predictions, utils::veccast<float, int64_t>(y_test.get_col(0))));


-    accuracy = numerics::mean( utils::veccast<float, uint64_t> (numerics::equal_elementwise_serial(predections, class_targets)));
-
    std::cout << "validation, acc: " << accuracy << ", loss: " << loss << std::endl;

    return 0;