Merge branch 'dev' into masked-loss

2026-04-06 13:47:06 +00:00 · 2024-03-26 19:39:30 +09:00
parent 8d5858826f ea05e3fd5b
commit ab1e389347
18 changed files with 424 additions and 250 deletions
--- a/train_textual_inversion_XTI.py
+++ b/train_textual_inversion_XTI.py
@@ -8,6 +8,7 @@ from multiprocessing import Value
 from tqdm import tqdm

 import torch
+from library import deepspeed_utils
 from library.device_utils import init_ipex, clean_memory_on_device

 init_ipex()
@@ -441,7 +442,7 @@ def train(args):
            with accelerator.accumulate(text_encoder):
                with torch.no_grad():
                    if "latents" in batch and batch["latents"] is not None:
-                        latents = batch["latents"].to(accelerator.device)
+                        latents = batch["latents"].to(accelerator.device).to(dtype=weight_dtype)
                    else:
                        # latentに変換
                        latents = vae.encode(batch["images"].to(dtype=weight_dtype)).latent_dist.sample()
@@ -667,6 +668,7 @@ def setup_parser() -> argparse.ArgumentParser:
    train_util.add_dataset_arguments(parser, True, True, False)
    train_util.add_training_arguments(parser, True)
    train_util.add_masked_loss_arguments(parser)
+    deepspeed_utils.add_deepspeed_arguments(parser)
    train_util.add_optimizer_arguments(parser)
    config_util.add_config_arguments(parser)
    custom_train_functions.add_custom_train_arguments(parser, False)