Some fixes

2023-04-17 15:52:19 +00:00
parent 2e66cccf50
commit 2f7063b70d
6 changed files with 158 additions and 61 deletions
--- a/export_model.py
+++ b/export_model.py
@@ -0,0 +1,66 @@
+import numpy as np
+import onnx
+import torch
+import torchvision
+
+from models.spoter_embedding_model import SPOTER_EMBEDDINGS
+
+# set parameters of the model
+model_name = 'embedding_model'
+output=32
+
+# load PyTorch model from .pth file
+
+device = torch.device("cpu")
+if torch.cuda.is_available():
+    device = torch.device("cuda")
+
+CHECKPOINT_PATH = "out-checkpoints/augment_rotate_75_x8/checkpoint_embed_1105.pth"
+checkpoint = torch.load(CHECKPOINT_PATH, map_location=device)
+
+model = SPOTER_EMBEDDINGS(
+    features=checkpoint["config_args"].vector_length,
+    hidden_dim=checkpoint["config_args"].hidden_dim,
+    norm_emb=checkpoint["config_args"].normalize_embeddings,
+).to(device)
+model.load_state_dict(checkpoint["state_dict"])
+# set model to evaluation mode
+model.eval()
+
+model_export = "onnx"
+if model_export == "coreml":
+    dummy_input = torch.randn(1, 10, 54, 2)
+    traced_model = torch.jit.trace(model, dummy_input)
+    out = traced_model(dummy_input)
+    import coremltools as ct
+
+    # Convert to Core ML
+    coreml_model = ct.convert(
+        traced_model,
+        inputs=[ct.TensorType(name="input", shape=dummy_input.shape)],
+    )
+
+    # Save Core ML model
+    coreml_model.save("models/" + model_name + ".mlmodel")
+else:
+    # create dummy input tensor
+    dummy_input = torch.randn(1, 10, 54, 2)
+
+    # export model to ONNX format
+    output_file = 'models/' + model_name + '.onnx'
+    torch.onnx.export(model, dummy_input, output_file, input_names=['input'], output_names=['output'])
+
+    torch.onnx.export(model,                                # model being run
+                    dummy_input,                          # model input (or a tuple for multiple inputs)
+                    'output-models/' + model_name + '.onnx',     # where to save the model (can be a file or file-like object)
+                    export_params=True,                   # store the trained parameter weights inside the model file
+                    opset_version=9,                      # the ONNX version to export the model to
+                    do_constant_folding=True,             # whether to execute constant folding for optimization
+                    input_names = ['X'],                  # the model's input names
+                    output_names = ['Y']                  # the model's output names
+                    )
+
+
+    # load exported ONNX model for verification
+    onnx_model = onnx.load(output_file)
+    onnx.checker.check_model(onnx_model)
--- a/hyperparam_opt.py
+++ b/hyperparam_opt.py
@@ -1,7 +1,7 @@
 from clearml.automation import UniformParameterRange, UniformIntegerParameterRange, DiscreteParameterRange
 from clearml.automation import HyperParameterOptimizer
 from clearml.automation.optuna import OptimizerOptuna
-
+from optuna.pruners import HyperbandPruner, MedianPruner
 from clearml import Task

 task = Task.init(
@@ -17,19 +17,19 @@ optimizer = HyperParameterOptimizer(
      base_task_id="4504e0b3ec6745249d3d4c94d3d40652",  
      # setting the hyperparameters to optimize
      hyper_parameters=[
-        # epochs
-        UniformIntegerParameterRange('Args/epochs', 200, 800),
+        # epochs:
+        DiscreteParameterRange('Args/epochs', [200]),
        # learning rate
-        UniformParameterRange('Args/lr', 0.000001, 0.1),
+        UniformParameterRange('Args/lr', 0.000001, 0.01),
        # optimizer
        DiscreteParameterRange('Args/optimizer', ['ADAM', 'SGD']),
        # vector length
        UniformIntegerParameterRange('Args/vector_length', 10, 100),
          ],
      # setting the objective metric we want to maximize/minimize
-      objective_metric_title='silhouette_coefficient',
-      objective_metric_series='val',
-      objective_metric_sign='max',  
+      objective_metric_title='train_loss',
+      objective_metric_series='loss',
+      objective_metric_sign='min',  

      # setting optimizer  
      optimizer_class=OptimizerOptuna,
@@ -40,7 +40,34 @@ optimizer = HyperParameterOptimizer(
      compute_time_limit=480, 
      total_max_jobs=20,
      min_iteration_per_job=0,
-      max_iteration_per_job=150000,
+      max_iteration_per_job=150000, 
+      pool_period_min=0.1,
+
+      save_top_k_tasks_only=3,
+      optuna_pruner=MedianPruner(),
+
      )

-task.execute_remotely(queue_name='default', exit_process=True)
+def job_complete_callback(
+    job_id,                 # type: str
+    objective_value,        # type: float
+    objective_iteration,    # type: int
+    job_parameters,         # type: dict
+    top_performance_job_id  # type: str
+):
+    print('Job completed!', job_id, objective_value, objective_iteration, job_parameters)
+    if job_id == top_performance_job_id:
+        print('WOOT WOOT we broke the record! Objective reached {}'.format(objective_value))
+
+task.execute_remotely(queue_name='hypertuning', exit_process=True)
+
+optimizer.set_report_period(0.3)
+
+optimizer.start(job_complete_callback=job_complete_callback)
+
+optimizer.wait()
+
+top_exp = optimizer.get_top_experiments(top_k=3)
+print([t.id for t in top_exp])
+
+optimizer.stop()
--- a/notebooks/visualize_embeddings.ipynb
+++ b/notebooks/visualize_embeddings.ipynb
--- a/requirements.txt
+++ b/requirements.txt
@@ -9,7 +9,7 @@ opencv-python==4.6.0.66
 plotly==5.11.0
 scikit-learn==1.0.2
 clearml==1.10.3
-torch==2.0.0+cu118
-torchvision==0.15.1+cu118
+torch==2.0.0
+torchvision==0.15.1
 tqdm==4.54.1
 optuna==3.1.1
--- a/train.py
+++ b/train.py
@@ -75,12 +75,25 @@ def train(args, tracker: Tracker):

    # Construct the model
    if not args.classification_model:
-        slrt_model = SPOTER_EMBEDDINGS(
-            features=args.vector_length,
-            hidden_dim=args.hidden_dim,
-            norm_emb=args.normalize_embeddings,
-            dropout=args.dropout
-        )
+        # if finetune, load the weights from the classification model
+        if args.finetune:
+            checkpoint = torch.load(args.checkpoint, map_location=device)
+
+            slrt_model = SPOTER_EMBEDDINGS(
+                features=checkpoint["config_args"].vector_length,
+                hidden_dim=checkpoint["config_args"].hidden_dim,
+                norm_emb=checkpoint["config_args"].normalize_embeddings,
+                dropout=checkpoint["config_args"].dropout,
+            )
+        else:
+            slrt_model = SPOTER_EMBEDDINGS(
+                features=args.vector_length,
+                hidden_dim=args.hidden_dim,
+                norm_emb=args.normalize_embeddings,
+                dropout=args.dropout,
+            )
+            
+
        model_type = 'embed'
        if args.hard_triplet_mining == "None":
            cel_criterion = nn.TripletMarginLoss(margin=args.triplet_loss_margin, p=2)
--- a/train.sh
+++ b/train.sh
@@ -1,10 +1,10 @@
 #!/bin/sh
-python -m train \
+python3 -m train \
 	--save_checkpoints_every 10 \
    --experiment_name "wlasl" \
-    --epochs 300 \
-	--optimizer "ADAM" \
-	--lr 0.0001 \
+    --epochs 600 \
+	--optimizer "SGD" \
+	--lr 0.001 \
    --batch_size 16 \
 	--dataset_name "WLASL" \
 	--training_set_path "WLASL100_train.csv" \
@@ -12,7 +12,7 @@ python -m train \
 	--vector_length 32 \
 	--epoch_iters -1 \
 	--scheduler_factor 0.2 \
-	--hard_triplet_mining "None" \
+	--hard_triplet_mining "in_batch" \
 	--filter_easy_triplets \
 	--triplet_loss_margin 2 \
 	--dropout 0.2 \