ML LGSep 8, 2021

Rethinking Multidimensional Discriminator Output for Generative Adversarial Networks

Mengyu Dai, Haibin Hang, Anuj Srivastava

arXiv:2109.03378v33.61 citations

Originality Incremental advance

AI Analysis

This work addresses a gap in GAN research for machine learning practitioners by enhancing training efficiency and output quality, though it is incremental as it builds on existing Wasserstein GAN methods.

The paper tackles the problem of improving Generative Adversarial Networks by generalizing the Wasserstein GAN framework to use multidimensional discriminator output, introducing a square-root velocity transformation block to aid training, and proposing a maximal p-centrality discrepancy for theoretical analysis. The result shows that high-dimensional critic output leads to faster convergence and increased diversity, with empirical evidence supporting these advantages.

The study of multidimensional discriminator (critic) output for Generative Adversarial Networks has been underexplored in the literature. In this paper, we generalize the Wasserstein GAN framework to take advantage of multidimensional critic output and explore its properties. We also introduce a square-root velocity transformation (SRVT) block which favors training in the multidimensional setting. Proofs of properties are based on our proposed maximal p-centrality discrepancy, which is bounded above by p-Wasserstein distance and fits the Wasserstein GAN framework with multidimensional critic output n. Especially when n = 1 and p = 1, the proposed discrepancy equals 1-Wasserstein distance. Theoretical analysis and empirical evidence show that high-dimensional critic output has its advantage on distinguishing real and fake distributions, and benefits faster convergence and diversity of results.

View on arXiv PDF

Similar