diff --git a/Result-Reports/Policies.md b/Result-Reports/Policies.md
index 2bf8139..dfae14d 100644
--- a/Result-Reports/Policies.md
+++ b/Result-Reports/Policies.md
@@ -174,9 +174,6 @@ TODO:
 
 Visualizatie van thresholds over test set voor baselines en complexere modellen -> zonder penalties tonen
 
-
-
-
 1 a 2 Case studies (extreme gevallen, thresholds 150, -5, normale mss)
 
 - Generatie van NRV (echte NRV)
@@ -197,4 +194,12 @@ Inleiding +
 Literatuurstudie +
 Tabellen die we gaan bespreken -> updaten met nieuwe data dan
 
-Nog eens 3e meeting opbrengen voor 2e deel maart.
\ No newline at end of file
+
+!!!!! Fix the test set (maybe save pickle)
+
+Plot profits per year (maybe with charge cycles) for the different models and baselines.
+Spread plotten van difference between charge and discharge thresholds
+
+RESULTATEN FIXEN
+
+Nog eens 3e meeting opbrengen voor 2e deel maart.
diff --git a/src/data/dataset.py b/src/data/dataset.py
index bd31402..e572159 100644
--- a/src/data/dataset.py
+++ b/src/data/dataset.py
@@ -25,18 +25,22 @@ class NrvDataset(Dataset):
         self.sequence_length = sequence_length
         self.predict_sequence_length = predict_sequence_length
 
-        self.samples_to_skip = self.skip_samples(dataframe=dataframe, full_day_skip=self.full_day_skip)
+        self.samples_to_skip = self.skip_samples(
+            dataframe=dataframe, full_day_skip=self.full_day_skip
+        )
         total_indices = set(
             range(len(dataframe) - self.sequence_length - self.predict_sequence_length)
         )
         self.valid_indices = sorted(list(total_indices - set(self.samples_to_skip)))
 
-        # full day indices
-        full_day_skipped_samples = self.skip_samples(dataframe=dataframe, full_day_skip=True)
-        full_day_total_indices = set(
-            range(len(dataframe) - self.sequence_length - self.predict_sequence_length)
+        full_day_skipped_samples = self.skip_samples(
+            dataframe=dataframe, full_day_skip=True
+        )
+
+        full_day_total_indices = set(range(len(dataframe) - self.sequence_length - 96))
+        self.full_day_valid_indices = sorted(
+            list(full_day_total_indices - set(full_day_skipped_samples))
         )
-        self.full_day_valid_indices = sorted(list(full_day_total_indices - set(full_day_skipped_samples)))
 
         self.history_features = []
         if self.data_config.LOAD_HISTORY:
@@ -74,7 +78,7 @@ class NrvDataset(Dataset):
             self.time_feature = torch.tensor(time_feature).float().reshape(-1)
         else:
             self.time_feature = None
-    
+
         self.nrv = torch.tensor(dataframe["nrv"].values).float().reshape(-1)
         self.datetime = dataframe["datetime"]
 
@@ -84,12 +88,7 @@ class NrvDataset(Dataset):
         nan_rows = dataframe[dataframe.isnull().any(axis=1)]
         nan_indices = nan_rows.index
         skip_indices = [
-            list(
-                range(
-                    idx - self.sequence_length - 96, idx + 1
-                )
-            )
-            for idx in nan_indices
+            list(range(idx - self.sequence_length - 96, idx + 1)) for idx in nan_indices
         ]
 
         skip_indices = [item for sublist in skip_indices for item in sublist]
@@ -106,10 +105,12 @@ class NrvDataset(Dataset):
             skip_indices = list(set(skip_indices))
 
         return skip_indices
-    
-    def preprocess_data(self, dataframe):
-        return torch.tensor(dataframe[self.history_features].values).float(), torch.tensor(dataframe[self.forecast_features].values).float()
 
+    def preprocess_data(self, dataframe):
+        return (
+            torch.tensor(dataframe[self.history_features].values).float(),
+            torch.tensor(dataframe[self.forecast_features].values).float(),
+        )
 
     def __len__(self):
         return len(self.valid_indices)
@@ -117,21 +118,38 @@ class NrvDataset(Dataset):
     def _get_all_data(self, idx: int):
         history_df = self.dataframe.iloc[idx : idx + self.sequence_length]
         forecast_df = self.dataframe.iloc[
-            idx + self.sequence_length : idx + self.sequence_length + self.predict_sequence_length
+            idx
+            + self.sequence_length : idx
+            + self.sequence_length
+            + self.predict_sequence_length
         ]
         return history_df, forecast_df
 
     def __getitem__(self, idx):
-        actual_idx = self.valid_indices[idx]
-                
+        try:
+            actual_idx = self.valid_indices[idx]
+        except IndexError:
+            print(f"Index {idx} not in valid indices.")
+            raise
+
         # get nrv history features
         nrv_features = self.nrv[actual_idx : actual_idx + self.sequence_length]
 
-        history_features = self.history_features[actual_idx : actual_idx + self.sequence_length, :]
-        forecast_features = self.forecast_features[actual_idx + self.sequence_length : actual_idx + self.sequence_length + self.predict_sequence_length, :]
+        history_features = self.history_features[
+            actual_idx : actual_idx + self.sequence_length, :
+        ]
+        forecast_features = self.forecast_features[
+            actual_idx
+            + self.sequence_length : actual_idx
+            + self.sequence_length
+            + self.predict_sequence_length,
+            :,
+        ]
 
         if self.time_feature is not None:
-            time_features = self.time_feature[actual_idx : actual_idx + self.sequence_length]
+            time_features = self.time_feature[
+                actual_idx : actual_idx + self.sequence_length
+            ]
         else:
             time_features = None
 
@@ -154,7 +172,9 @@ class NrvDataset(Dataset):
             all_features_list = [nrv_features.unsqueeze(1)]
 
             if self.forecast_features.numel() > 0:
-                history_forecast_features = self.forecast_features[actual_idx + 1 : actual_idx + self.sequence_length + 1, :]
+                history_forecast_features = self.forecast_features[
+                    actual_idx + 1 : actual_idx + self.sequence_length + 1, :
+                ]
                 all_features_list.append(history_forecast_features)
 
             if time_features is not None:
@@ -163,7 +183,12 @@ class NrvDataset(Dataset):
             all_features = torch.cat(all_features_list, dim=1)
 
         # Target sequence, flattened if necessary
-        nrv_target = self.nrv[actual_idx + self.sequence_length : actual_idx + self.sequence_length + self.predict_sequence_length]
+        nrv_target = self.nrv[
+            actual_idx
+            + self.sequence_length : actual_idx
+            + self.sequence_length
+            + self.predict_sequence_length
+        ]
 
         # check if nan values are present
         if torch.isnan(all_features).any():
@@ -188,7 +213,6 @@ class NrvDataset(Dataset):
 
         return all_features, nrv_target
 
-
     def get_batch(self, idx: list):
         features = []
         targets = []
@@ -216,8 +240,8 @@ class NrvDataset(Dataset):
         # check if the date is in the valid indices
         if date not in self.datetime.dt.date.unique():
             raise ValueError(f"Date {date} not in dataset.")
-        
+
         idx = self.datetime[self.datetime.dt.date == date].index[0]
 
         valid_idx = self.valid_indices.index(idx)
-        return valid_idx
\ No newline at end of file
+        return valid_idx
diff --git a/src/policies/PolicyEvaluator.py b/src/policies/PolicyEvaluator.py
index 57b77ee..38d09c2 100644
--- a/src/policies/PolicyEvaluator.py
+++ b/src/policies/PolicyEvaluator.py
@@ -45,7 +45,8 @@ class PolicyEvaluator:
     ):
         idx = test_loader.dataset.get_idx_for_date(date.date())
 
-        print("Evaluated for idx: ", idx)
+        if idx not in idx_samples:
+            print("No samples for idx: ", idx, date)
         (initial, samples) = idx_samples[idx]
 
         if len(initial.shape) == 2:
@@ -98,16 +99,17 @@ class PolicyEvaluator:
 
     def evaluate_test_set(self, idx_samples, test_loader):
         self.profits = []
-        try:
-            for date in tqdm(self.dates):
-                self.evaluate_for_date(date, idx_samples, test_loader)
-        except KeyboardInterrupt:
-            print("Interrupted")
-            raise KeyboardInterrupt
 
-        except Exception as e:
-            print(e)
-            pass
+        for date in tqdm(self.dates):
+            try:
+                self.evaluate_for_date(date, idx_samples, test_loader)
+            except KeyboardInterrupt:
+                print("Interrupted")
+                raise KeyboardInterrupt
+
+            except Exception as e:
+                print(e)
+                pass
 
         self.profits = pd.DataFrame(
             self.profits,
diff --git a/src/policies/baselines/BaselinePolicyEvaluator.py b/src/policies/baselines/BaselinePolicyEvaluator.py
index ac2e5f6..846d527 100644
--- a/src/policies/baselines/BaselinePolicyEvaluator.py
+++ b/src/policies/baselines/BaselinePolicyEvaluator.py
@@ -151,13 +151,25 @@ class BaselinePolicyEvaluator(PolicyEvaluator):
 
         return best_thresholds
 
-    def evaluate_test_set(self, thresholds: dict):
+    def evaluate_test_set(self, thresholds: dict, data_processor=None):
         """Evaluate the test set using the given thresholds (multiple penalties)
 
         Args:
             thresholds (dict): Dictionary with penalties as keys and the corresponding thresholds tuple as values
         """
         self.profits = []
+
+        if data_processor:
+            filtered_dates = []
+            _, test_loader = data_processor.get_dataloaders()
+            for date in self.dates:
+                try:
+                    test_loader.dataset.get_idx_for_date(date.date())
+                    filtered_dates.append(date)
+                except:
+                    pass
+            self.dates = filtered_dates
+
         try:
             for date in tqdm(self.dates):
                 real_imbalance_prices = self.get_imbanlance_prices_for_date(date.date())
diff --git a/src/policies/baselines/YesterdayBaselinePolicyExecutor.py b/src/policies/baselines/YesterdayBaselinePolicyExecutor.py
index 0e57455..a12b5d7 100644
--- a/src/policies/baselines/YesterdayBaselinePolicyExecutor.py
+++ b/src/policies/baselines/YesterdayBaselinePolicyExecutor.py
@@ -54,14 +54,26 @@ class YesterdayBaselinePolicyEvaluator(PolicyEvaluator):
                 ]
             )
 
-    def evaluate_test_set(self):
+    def evaluate_test_set(self, data_processor):
+
+        if data_processor:
+            filtered_dates = []
+            _, test_loader = data_processor.get_dataloaders()
+            for date in self.dates:
+                try:
+                    test_loader.dataset.get_idx_for_date(date.date())
+                    filtered_dates.append(date)
+                except:
+                    pass
+            self.dates = filtered_dates
+
         self.profits = []
-        try:
-            for date in tqdm(self.dates):
+        for date in tqdm(self.dates):
+            try:
                 self.evaluate_for_date(date)
-        except Exception as e:
-            print(e)
-            pass
+            except Exception as e:
+                print(e)
+                pass
 
         self.profits = pd.DataFrame(
             self.profits,
diff --git a/src/policies/baselines/global_threshold_baseline.py b/src/policies/baselines/global_threshold_baseline.py
index b68df6a..64f6e8e 100644
--- a/src/policies/baselines/global_threshold_baseline.py
+++ b/src/policies/baselines/global_threshold_baseline.py
@@ -7,6 +7,25 @@ task.execute_remotely(queue_name="default", exit_process=True)
 
 from src.policies.baselines.BaselinePolicyEvaluator import BaselinePolicyEvaluator
 from src.policies.simple_baseline import BaselinePolicy, Battery
+from src.data import DataProcessor, DataConfig
+
+### Data Processor ###
+data_config = DataConfig()
+data_config.NRV_HISTORY = True
+data_config.LOAD_HISTORY = True
+data_config.LOAD_FORECAST = True
+
+data_config.WIND_FORECAST = True
+data_config.WIND_HISTORY = True
+
+data_config.QUARTER = False
+data_config.DAY_OF_WEEK = False
+
+data_config.NOMINAL_NET_POSITION = True
+
+data_processor = DataProcessor(data_config, path="", lstm=False)
+data_processor.set_batch_size(64)
+data_processor.set_full_day_skip(True)
 
 ### Policy Evaluator ###
 battery = Battery(2, 1)
@@ -14,7 +33,7 @@ baseline_policy = BaselinePolicy(battery, data_path="")
 policy_evaluator = BaselinePolicyEvaluator(baseline_policy, task)
 
 thresholds = policy_evaluator.determine_best_thresholds()
-policy_evaluator.evaluate_test_set(thresholds)
+policy_evaluator.evaluate_test_set(thresholds, data_processor=data_processor)
 
 policy_evaluator.plot_profits_table()
 
diff --git a/src/policies/baselines/yesterday_baseline.py b/src/policies/baselines/yesterday_baseline.py
index eaed82a..8456c5a 100644
--- a/src/policies/baselines/yesterday_baseline.py
+++ b/src/policies/baselines/yesterday_baseline.py
@@ -2,7 +2,7 @@ from src.utils.clearml import ClearMLHelper
 
 #### ClearML ####
 clearml_helper = ClearMLHelper(project_name="Thesis/NrvForecast")
-task = clearml_helper.get_task(task_name="Global Thresholds Baseline")
+task = clearml_helper.get_task(task_name="Yesterday Baseline")
 task.execute_remotely(queue_name="default", exit_process=True)
 
 from src.policies.baselines.BaselinePolicyEvaluator import BaselinePolicyEvaluator
@@ -10,13 +10,32 @@ from src.policies.simple_baseline import BaselinePolicy, Battery
 from src.policies.baselines.YesterdayBaselinePolicyExecutor import (
     YesterdayBaselinePolicyEvaluator,
 )
+from src.data import DataProcessor, DataConfig
+
+### Data Processor ###
+data_config = DataConfig()
+data_config.NRV_HISTORY = True
+data_config.LOAD_HISTORY = True
+data_config.LOAD_FORECAST = True
+
+data_config.WIND_FORECAST = True
+data_config.WIND_HISTORY = True
+
+data_config.QUARTER = False
+data_config.DAY_OF_WEEK = False
+
+data_config.NOMINAL_NET_POSITION = True
+
+data_processor = DataProcessor(data_config, path="", lstm=False)
+data_processor.set_batch_size(64)
+data_processor.set_full_day_skip(True)
 
 ### Policy Evaluator ###
 battery = Battery(2, 1)
 baseline_policy = BaselinePolicy(battery, data_path="")
 policy_evaluator = YesterdayBaselinePolicyEvaluator(baseline_policy, task)
 
-policy_evaluator.evaluate_test_set()
+policy_evaluator.evaluate_test_set(data_processor=data_processor)
 policy_evaluator.plot_profits_table()
 
 task.close()
diff --git a/src/trainers/quantile_trainer.py b/src/trainers/quantile_trainer.py
index dd59ef6..403bd1b 100644
--- a/src/trainers/quantile_trainer.py
+++ b/src/trainers/quantile_trainer.py
@@ -155,31 +155,38 @@ class AutoRegressiveQuantileTrainer(AutoRegressiveTrainer):
         generated_samples = {}
 
         with torch.no_grad():
-            total_samples = len(dataloader.dataset) - 96
-            for _, _, idx_batch in tqdm(dataloader):
-                idx_batch = [idx for idx in idx_batch if idx < total_samples]
+            total_samples = len(dataloader.dataset)
+            print(
+                "Full day valid indices: ",
+                len(dataloader.dataset.full_day_valid_indices),
+            )
+            print(
+                "Valid indices: ",
+                len(dataloader.dataset.valid_indices),
+            )
 
-                if len(idx_batch) == 0:
-                    continue
+            print(dataloader.dataset.valid_indices)
 
-                for idx in tqdm(idx_batch):
-                    computed_idx_batch = [idx] * 100
-                    initial, _, samples, targets = self.auto_regressive(
-                        dataloader.dataset, idx_batch=computed_idx_batch
-                    )
+            for i in tqdm(dataloader.dataset.full_day_valid_indices):
+                idx = dataloader.dataset.valid_indices.index(i)
 
-                    generated_samples[idx.item()] = (
-                        self.data_processor.inverse_transform(initial),
-                        self.data_processor.inverse_transform(samples),
-                    )
+                computed_idx_batch = [idx] * 100
+                initial, _, samples, targets = self.auto_regressive(
+                    dataloader.dataset, idx_batch=computed_idx_batch
+                )
 
-                    samples = samples.unsqueeze(0)
-                    targets = targets.squeeze(-1)
-                    targets = targets[0].unsqueeze(0)
+                generated_samples[idx] = (
+                    self.data_processor.inverse_transform(initial),
+                    self.data_processor.inverse_transform(samples),
+                )
 
-                    crps = crps_from_samples(samples, targets)
+                samples = samples.unsqueeze(0)
+                targets = targets.squeeze(-1)
+                targets = targets[0].unsqueeze(0)
 
-                    crps_from_samples_metric.append(crps[0].mean().item())
+                crps = crps_from_samples(samples, targets)
+
+                crps_from_samples_metric.append(crps[0].mean().item())
 
         task.get_logger().report_scalar(
             title="CRPS_from_samples",
@@ -190,10 +197,7 @@ class AutoRegressiveQuantileTrainer(AutoRegressiveTrainer):
 
         # using the policy evaluator, evaluate the policy with the generated samples
         if self.policy_evaluator is not None:
-            _, test_loader = self.data_processor.get_dataloaders(
-                predict_sequence_length=self.model.output_size, full_day_skip=True
-            )
-            self.policy_evaluator.evaluate_test_set(generated_samples, test_loader)
+            self.policy_evaluator.evaluate_test_set(generated_samples, dataloader)
             df = self.policy_evaluator.get_profits_as_scalars()
 
             # for each row, report the profits
diff --git a/src/trainers/trainer.py b/src/trainers/trainer.py
index 27ff21f..73f05d2 100644
--- a/src/trainers/trainer.py
+++ b/src/trainers/trainer.py
@@ -8,6 +8,7 @@ from plotly.subplots import make_subplots
 from clearml.config import running_remotely
 from torchinfo import summary
 
+
 class Trainer:
     def __init__(
         self,
@@ -95,13 +96,15 @@ class Trainer:
             loader = test_loader
 
         np.random.seed(42)
-        actual_indices = np.random.choice(loader.dataset.full_day_valid_indices, num_samples, replace=False)
+        actual_indices = np.random.choice(
+            loader.dataset.full_day_valid_indices, num_samples, replace=False
+        )
         indices = {}
         for i in actual_indices:
             indices[i] = loader.dataset.valid_indices.index(i)
 
         print(actual_indices)
-        
+
         return indices
 
     def train(self, epochs: int, remotely: bool = False, task: Task = None):
@@ -190,9 +193,7 @@ class Trainer:
                             # )
 
                         if hasattr(self, "calculate_crps_from_samples"):
-                            self.calculate_crps_from_samples(
-                                task, full_day_skip_test_loader, epoch
-                            )
+                            self.calculate_crps_from_samples(task, test_loader, epoch)
 
             if task:
                 self.finish_training(task=task)
@@ -259,7 +260,6 @@ class Trainer:
             self.model = torch.load("checkpoint.pt")
         self.model.eval()
 
-        
         # set full day skip
         self.data_processor.set_full_day_skip(True)
         train_loader, test_loader = self.data_processor.get_dataloaders(
@@ -361,7 +361,6 @@ class Trainer:
             for trace in sub_fig.data:
                 fig.add_trace(trace, row=row, col=col)
 
-
             # loss = self.criterion(predictions.to(self.device), target.squeeze(-1).to(self.device)).item()
 
             # fig['layout']['annotations'][i].update(text=f"{loss.__class__.__name__}: {loss:.6f}")
diff --git a/src/training_scripts/autoregressive_quantiles.py b/src/training_scripts/autoregressive_quantiles.py
index bc4b96b..4b8f2fe 100644
--- a/src/training_scripts/autoregressive_quantiles.py
+++ b/src/training_scripts/autoregressive_quantiles.py
@@ -49,7 +49,7 @@ data_processor.set_full_day_skip(False)
 
 
 #### Hyperparameters ####
-data_processor.set_output_size(96)
+data_processor.set_output_size(1)
 inputDim = data_processor.get_input_size()
 epochs = 300
 
@@ -80,7 +80,7 @@ time_embedding = TimeEmbedding(
 # lstm_model = GRUModel(time_embedding.output_dim(inputDim), len(quantiles), hidden_size=model_parameters["hidden_size"], num_layers=model_parameters["num_layers"], dropout=model_parameters["dropout"])
 non_linear_model = NonLinearRegression(
     time_embedding.output_dim(inputDim),
-    len(quantiles) * 96,
+    len(quantiles),
     hiddenSize=model_parameters["hidden_size"],
     numLayers=model_parameters["num_layers"],
     dropout=model_parameters["dropout"],
@@ -97,18 +97,7 @@ baseline_policy = BaselinePolicy(battery, data_path="")
 policy_evaluator = PolicyEvaluator(baseline_policy, task)
 
 #### Trainer ####
-# trainer = AutoRegressiveQuantileTrainer(
-#     model,
-#     inputDim,
-#     optimizer,
-#     data_processor,
-#     quantiles,
-#     "cuda",
-#     policy_evaluator=policy_evaluator,
-#     debug=False,
-# )
-
-trainer = NonAutoRegressiveQuantileRegression(
+trainer = AutoRegressiveQuantileTrainer(
     model,
     inputDim,
     optimizer,
@@ -119,6 +108,17 @@ trainer = NonAutoRegressiveQuantileRegression(
     debug=False,
 )
 
+# trainer = NonAutoRegressiveQuantileRegression(
+#     model,
+#     inputDim,
+#     optimizer,
+#     data_processor,
+#     quantiles,
+#     "cuda",
+#     policy_evaluator=policy_evaluator,
+#     debug=False,
+# )
+
 trainer.add_metrics_to_track(
     [PinballLoss(quantiles), MSELoss(), L1Loss(), CRPSLoss(quantiles)]
 )