Performance considerations for large scale deep learning training on Azure NDv4 (A100) series