From 16f5eb68ac187e8d3f64288a1d637981b3d8cf78 Mon Sep 17 00:00:00 2001
From: miaomiaomiao-LJY <48284713+miaomiaomiao-LJY@users.noreply.github.com>
Date: Tue, 13 Apr 2021 17:54:57 +0800
Subject: [PATCH] ADD

# Add train.train_net1:
#     Add the main function for Net1 model training
#     Add the parameter Settings required for training
#     The training function of implementing NET1 model training: loading data, calculating model, calculating loss, reverse transfer, printing log, etc
#     Add a debug scheme for NET1 model training
#     Test the training function of the NET1 model
---
 train/train_net1.py | 135 ++++++++++++++++++++++++++++++++++++++++++++
 1 file changed, 135 insertions(+)
 create mode 100644 train/train_net1.py

diff --git a/train/train_net1.py b/train/train_net1.py
new file mode 100644
index 0000000..b07599d
--- /dev/null
+++ b/train/train_net1.py
@@ -0,0 +1,135 @@
+import argparse
+import hparams
+import torch
+from model.Net1 import Net1
+from dataloader.Net1DataLoader import get_net1_data_loader
+
+
+def train(arg):
+    device = torch.device(arg.device)
+
+    # Build net1 model
+    net1 = Net1(in_dims=arg.in_dims,
+                hidden_units=arg.hidden_units,
+                dropout_rate=arg.dropout_rate,
+                num_conv1d_banks=arg.num_conv1d_banks,
+                num_highway_blocks=arg.num_highway_blocks)
+
+    # Create optimizer
+    net1_optimizer = torch.optim.Adam(net1.parameters(), lr=arg.learning_rate)
+
+    # Set Multi-GPU training mode
+    if arg.multiple_train:
+        device = torch.device('cuda')
+        net1 = torch.nn.DataParallel(net1)
+
+    # Move net1 model into the computing device
+    net1.to(device)
+
+    # Set data loader
+    data_loader = get_net1_data_loader(data_path=arg.data_path,
+                                       batch_size=arg.batch_size,
+                                       num_workers=arg.num_workers)
+
+    # Start training
+    print("Start training ... ")
+
+    data_iter = iter(data_loader)
+
+    start_step = 1
+    for step in range(start_step, arg.train_steps):
+
+        # Get input data
+        try:
+            mfccs, phones = next(data_iter)
+        except:
+            data_iter = iter(data_loader)
+            mfccs, phones = next(data_iter)
+
+        # Moving input data into the computing device
+        mfccs = mfccs.to(device)
+        phones = phones.long().to(device)
+
+        # Train net1 model
+        net1 = net1.train()
+        ppgs, preds, logits = net1(mfccs)
+
+        # Compute the loss
+        compute_loss = torch.nn.CrossEntropyLoss()
+        loss = compute_loss(logits.transpose(1, 2) / hparams.net1_logits_t, phones)
+
+        is_target = torch.sign(torch.abs(torch.sum(mfccs, -1)))
+        loss = loss * is_target
+        loss = torch.mean(loss)
+
+        # Backward and optimize
+        net1_optimizer.zero_grad()
+        loss.backward()
+        net1_optimizer.step()
+
+        debug = False
+        if debug:
+            print("net1 info : " + str(net1))
+            print("net1_optimizer info : " + str(net1_optimizer))
+
+            print("mfccs shape : " + str(mfccs.shape) + " , mfccs type : " + str(mfccs.dtype))
+            print("phones shape : " + str(phones.shape) + " , phones type : " + str(phones.dtype))
+
+            print("ppgs shape : " + str(ppgs.shape) + " , ppgs type : " + str(ppgs.dtype))
+            print("preds shape : " + str(preds.shape) + " , preds type : " + str(preds.dtype))
+            print("logits shape : " + str(logits.shape) + " , logits type : " + str(logits.dtype))
+
+        # Print out training info
+        if step % arg.log_step == 0:
+            log = "Iteration [{}/{}], [loss : {:.6f}]".format(step, arg.train_steps, loss)
+            print(log)
+
+
+def get_arguments():
+    parser = argparse.ArgumentParser()
+
+    # Set Net1
+    parser.add_argument('-in_dims', default=hparams.net1_in_dims, type=int,
+                        help='Number of Net1 input dimensions.')
+    parser.add_argument('-hidden_units', default=hparams.net1_hidden_units, type=int,
+                        help='Number of Net1 hidden units.')
+    parser.add_argument('-dropout_rate', default=hparams.net1_dropout_rate, type=float,
+                        help='Rate of net1 Dropout layers.')
+    parser.add_argument('-num_conv1d_banks', default=hparams.net1_num_conv1d_banks, type=int,
+                        help='Number of Net1 conv1d banks.')
+    parser.add_argument('-num_highway_blocks', default=hparams.net1_num_highway_blocks, type=int,
+                        help='Number of Net1 Highway blocks.')
+
+    # Set DataLoader
+    parser.add_argument('-data_path', default=hparams.net1_dataset, type=str,
+                        help='Path of Net1 dataset.')
+    parser.add_argument('-batch_size', default=hparams.net1_batch_size, type=int,
+                        help='Batch size.')
+    parser.add_argument('-num_workers', default=hparams.net1_num_workers, type=int,
+                        help='Number of workers.')
+
+    # Set Train config
+    parser.add_argument('-device', default=hparams.net1_train_device, type=str,
+                        help='Net1 training device.')
+    parser.add_argument('-train_steps', default=hparams.net1_train_steps, type=int,
+                        help='Net1 training steps.')
+    parser.add_argument('-learning_rate', default=hparams.net1_train_lr, type=float,
+                        help='Net1 learning rate.')
+    parser.add_argument('-log_step', default=hparams.net1_train_log_step, type=int,
+                        help='Net1 training log steps.')
+    parser.add_argument('-multiple_train', default=hparams.net1_train_multiple_flag, type=bool,
+                        help='Net1 training log steps.')
+
+    arguments = parser.parse_args()
+    return arguments
+
+
+if __name__ == '__main__':
+    args = get_arguments()
+    print("Train Net1 parameters : \n " + str(args))
+
+    if args.multiple_train and args.device is not 'cuda':
+        raise Exception("Multi-GPU training mode enabled, but the default computing device does not support it. "
+                        "Calculate device conflicts, please check the Settings.")
+
+    train(args)