GAN

GAN Prior

Image Classification with GAN! 一个 Conditional GAN + GAN Prior = GAN classification。
Image Segmentation with GAN! 一个 Layer-wise GAN + GAN Prior = GAN Segmentation。
Video Prediction with GAN! 一个 Layer-wise Video GAN + GAN Prior = Video Understanding + Prediction。

gradient palnety 做 robust。(已有人做啦)
尝试证明NN在满足一定平滑性条件后，会在别的地方更加不平滑。然后以此作为一个网络结构鲁棒性潜能的度量。
通过训练集确定一个kernel到底接受哪些组何的激活，然后在测试的时候只接受这些组何的激活，而非卷积后加起来。也就是分析每层weight*input的结果矩阵，做下SVD，看看基和秩，对比测试集上的表现。
是否可以通过把输入图片normal到 U[0.5, 1.5] 而非 N(0,1) 来避免第一个conv的条件数过大，而后面部分ReLU 从 0.5 起步，避免其他conv 条件数过大。

是什么导致了non-robust feature的出现？数据集里同一只猫？
为什么神经网络会倾向于学习更偏纹理或者non-robust feature的特征？是否是因为初始值在1附近导致学习ID mapping更容易？
Nerual Network Debugging Sampling for Deep Learning Model Diagnosis
寻找一个好的 benchmark for interpretability。
把神经网络的 interests 和 similarity 结合起来做。
结合可解释性与domain adaptation。
使用多个不同初始化的网络来改进出一个准确度更高网络。
MINE-Mutual Information Neural Estimation, 那么 representation similarity measurment 解决了, 是不是意味着 KD 也解决了。
把一张图片迭代到某个简化形式，并且不改变整个网络activation的激活状态。
把一个分类模型 data free 逆向得到一个生成模型。

目前Domain translation的方法，在classifier 是robust的情况下，是不是都没用？
对于robust feature，如何正确找到域之间的mapping?以及如何训练？
是否对应的non-robust feature在 $L_{\infty}$ 下是接近的？
Use CycleGAN loss to estimate DA upper bound.
Use feature distance measurement to show how network behave on different domains.

Adaptive Gradient Clipping 需要解决的问题是——原权重向量太小，加上梯度后方向变化太大。原权重向量太小可能来自于 Weight Decay。是否可以从根源上增加某种loss解决这个问题？