Improve wandb logging (#1576)

* fix: wrong training steps were recorded to wandb, and no log was sent when logging_dir was not specified * fix: checking of whether wandb is enabled * feat: log images to wandb with their positive prompt as captions * feat: logging sample images' caption for sd3 and flux * fix: import wandb before use
2026-04-06 13:47:06 +00:00 · 2024-09-11 22:21:16 +09:00
parent d83f2e92da
commit a823fd9fb8
14 changed files with 80 additions and 49 deletions
--- a/fine_tune.py
+++ b/fine_tune.py
@@ -337,6 +337,9 @@ def train(args):
    train_util.sample_images(
        accelerator, args, 0, global_step, accelerator.device, vae, tokenize_strategy.tokenizer, text_encoder, unet
    )
+    if len(accelerator.trackers) > 0:
+        # log empty object to commit the sample images to wandb
+        accelerator.log({}, step=0)

    loss_recorder = train_util.LossRecorder()
    for epoch in range(num_train_epochs):
@@ -456,7 +459,7 @@ def train(args):
                        )

            current_loss = loss.detach().item()  # 平均なのでbatch sizeは関係ないはず
-            if args.logging_dir is not None:
+            if len(accelerator.trackers) > 0:
                logs = {"loss": current_loss}
                train_util.append_lr_to_logs(logs, lr_scheduler, args.optimizer_type, including_unet=True)
                accelerator.log(logs, step=global_step)
@@ -469,7 +472,7 @@ def train(args):
            if global_step >= args.max_train_steps:
                break

-        if args.logging_dir is not None:
+        if len(accelerator.trackers) > 0:
            logs = {"loss/epoch": loss_recorder.moving_average}
            accelerator.log(logs, step=epoch + 1)