自适应遥感水印

问题可以分成两部分解决：自适应与水印。

自适应 (Adaptive)

由于处理的目标数据为遥感图像。典型的遥感图像如下：

图片来自LEVIR-CD

共同要求

针对遥感图像自适应（主要创新点）
要结合遥感图像的特征，如果简单的将遥感图当作普通图像来处理，那就没意思。
分为显式特征与隐式特征：
- 显式：地物类型，地物特征；
- 隐式：在神经网络中引入上下文注意（Context Attention）。
水印要具有鲁棒性（Robustness）
能抗多种攻击。
水印要有不可感知性
评价指标：峰值信噪比（PSNR）。

方案1

主要内容

修改地物的pattern，将水印携带的信息隐藏在生成的pattern中，或者pattern就是水印本身，且要求与原有的背景看起来不突兀。

Jia, X., Wei, X., Cao, X., and Han, X., “Adv-watermark: A Novel Watermark Perturbation for Adversarial Examples”, arXiv e-prints, 2020.

对图像做一次语义分割（Semantic segmentation）或者实例分割（Instance segmentation），用某种算法（？）挑选出最适合进行显式修改（explicit modification）的pattern，然后使用Generative Networks生成对应的pattern，但是这个pattern里面嵌了水印。这样做的好处就是肉眼几乎无法分辨，因为是GAN生成的pattern。一开始，我尝试了DCGAN，主要考虑到DCGAN所生成的模型是可线性叠加的，只要用不同类别的地物训练出不同的模型，再分别赋以不同的权重，即可生成具有不同风格的伪遥感图像；具体的权重应该可以通过对标的地块进行简单的地物分类得出，这类算法已相对成熟。这是我所设想出的一种自适应的方法。

研究阻碍

对遥感数据的GAN极其难做，我首先尝试生成低分辨率的遥感图形。

Radford, A., Metz, L., and Chintala, S., “Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks”, arXiv e-prints, 2015.

DCGAN原论文使用的数据集是ImageNet，里面什么数据都有。我尝试将数据集替换为AID数据集中的操场进行训练，但是效果十分不理想。模型最后是收敛的，但是生成的都是噪声，说明模型实际上并没有学习到遥感图的任何特征。后来我换了一个分辨率较低的数据集，用了海岸线的数据集，生成的图像正常。这应该是由于特征太少导致的。

但是正如前面失败的实验，正常的遥感图不可能只要那么简单的特征。后来我上网搜索，几乎所有尝试复现的中文资料都表明遥感图的GAN实验结果是不理想的。我又尝试模仿StyleGAN（该模型是英伟达专为人脸的生成打造的，在人脸的生成方面数一数二），用全连接层替换了DCGAN中的卷积层，但是实验效果仍不理想（跟之前一样是噪声但是模型仍然收敛）。

Karras, T., Laine, S., Aittala, M., Hellsten, J., Lehtinen, J., and Aila, T., “Analyzing and Improving the Image Quality of StyleGAN”, arXiv e-prints, 2019.

后来我改变了思路，推测出一种可能，那就是一般的卷积无法处理遥感图像这种具有复杂特征的数据。我将目光转向了Transformer，也就是注意力机制，它不依赖任何卷积，我期望它能够在我之后的实验中起到一个比较好的效果。但是由于我对注意力机制不太熟悉，有花了一段时间研究了一下ViTGAN和TransGAN，这两个都是将 Transformer 加入 GAN 的网络。

Lee, K., Chang, H., Jiang, L., Zhang, H., Tu, Z., and Liu, C., “ViTGAN: Training GANs with Vision Transformers”, arXiv e-prints, 2021.
Jiang, Y., Chang, S., and Wang, Z., “TransGAN: Two Pure Transformers Can Make One Strong GAN, and That Can Scale Up”, arXiv e-prints,

在这一步我们甚至可以大胆假设，能不能不光在GAN中引入注意力机制，甚至在整个对抗生成网络中都使用Transformer？

方案2

主要内容

将水印隐藏在噪声中，向图像叠加噪声，使人眼无法识别。

有文献提出，将水印识别单独置一个 private network ，与发布网络 public network 相隔离。这样我们在识别水印时只要调用 private network 即可。我认为相比起图像里包含的显式特征，想要学习噪声这种隐式特征是尤为困难的。这本质上类似于神经网络的特征过拟合。

为了使这种过拟合现象明显一些（这正是我们需要的），就不能使用普通的噪声。有一种噪声（包括但不限于噪声，可以是任何信号甚至pattern）专为实现这种目的而存在，即对抗样本攻击。我们只需要对遥感数据做一次对抗样本攻击，即可使图像分类的 softmax 产生较大的改变（即误分类）。我们这时就可以设置一个新的类，比如 watermark ，使所有经过对抗样本攻击的遥感图像被分类为 watermark 。

Chen, L., Zhu, G., Li, Q., and Li, H., “Adversarial Example in Remote Sensing Image Recognition”, arXiv e-prints, 2019.（遥感图像识别中的对抗性实例）

到这个地步，这个方向的目的已经十分明显了：这就是鲁棒性的对抗。

对于目标网络来说，要保证目标识别的鲁棒性（即CNN的鲁棒性）；作为隐藏信息，嵌入水印的一方，要保证自己水印的鲁棒性，要保证自己生成的对抗性样本能够抵御各种攻击。

可能的防御手段：用魔法打败魔法。假如这里有若干张待识别的遥感图像，你不知道其中有没有对抗性样本，同时你对你的CNN网络不太自信，这时候只需要在前面加上一层GAN网络。因为高频的水印（噪声）信息不太可能被GAN所识别到，并且在生成的网络中复现。对于采用了注意力机制的GAN如上面提到的TransGAN与ViTGAN尤其如此。

困难&疑惑

使用对抗样本攻击所生成的噪声为空间域噪声，鲁棒性不佳；
此方法致力于使判别网络产生误判，从而将图像置于Watermark类，只能起到标记的作用。
假如仅仅是这样，为何不直接用加水印的照片与未加水印的照片训练一个Network专门由于分类加了水印的图片呢？
忘了哪一篇了
此方法只能应用于地物分类模型

这个算自适应吗？他跟普通图像的处理流程有什么不同呢？步骤必须有意义，比方说遥感图加了一个处理步骤，或者用了一种新的处理方法后，比使用通用图像的处理方法处理后效果要好，etc。

实验结果

基于FGSM的对抗样本实例

水印（Watermark）

传统方法

基于空间域的水印（鲁棒性不强）
基于频率域，如傅里叶，小波，DCT的水印算法

W. Chen, C. Zhu, N. Ren, T. Seppänen and A. Keskinarkaus, "Screen-Cam Robust and Blind Watermarking for Tile Satellite Images," in IEEE Access, vol. 8, pp. 125274-125294, 2020, doi: 10.1109/ACCESS.2020.3007689.

攻击方法

旋转
裁剪，拼接
重采样（缩放）
滤波（中值，均值，高斯）
噪声（椒盐，高斯）
投影变换
Screen-Cam Robust

必须有一种有效的定位手段，确认水印在图像的哪一部分。

难道就没有一种水印他的信息是与其完整性无关的吗？即只要拿到水印的任意部分都能完整的还原出信息。
遥感图一般是以瓦片Tile的形式存在，当前的图像过大或者过小都会自动切换到上一级或下一级显示。

目前方向

水印同步(Synchronization Watermark)

基于CNN定位精度，Robust

水印提取(Watermark Extraction)

基于CNN/DNN的判读法

水印嵌入

Pattern + Image 基于感知与Robust
You, Zhengxin, et al. "Image Generation Network for Covert Transmission in Online Social Network." Proceedings of the 30th ACM International Conference on Multimedia. 2022. 将CelebA换成GID训练遥感地块的Pattern来生成水印。

遥感数据的图像生成

最近把遥感数据GAN的实验结果整理出来，现在做成什么样就什么样。要明确现在实验数据、GAN是否调参过，生成数据的结果，目前的最新的相关论文大概是什么样。

目前的图像生成方法主要有：

GANs: DCGAN, StyleGAN, WGAN
VAEs: VQ-VAE, Beta-VAE, FactorVAE
Augoregressive Models: PixelCNN
Diffusion Models: DDPM

目前对抗生成网络在遥感方面的应用

遥感图超分辨率
遥感图像分类
伪遥感图的生成

DCGAN实验发现效果不理想

然后尝试使用Transformer模型代替传统卷积。

实验结果

2022年9月22日 22:28

DCGAN in Remote Sense Images

总结：
需加大Epoch数。但由于数据集过小，很难训练出一个很好的模型。实验证明，只要合理调整参数，DCGAN一样可以生成很好的伪遥感图......
至于为什么上学期的实验总是不成功，我觉得可能的原因有：
上学期的实验主要使用了Tensorflow，而且本学期换用了Pytorch；
上学期参数调得不好，训练了很多轮但是效果总是不好，误认为传统的CNN网络做不了遥感；
玄学问题（大虚。

2022年9月13日

Generator and Discriminator Loss

自适应 (Adaptive)

共同要求

针对遥感图像自适应（主要创新点）

水印要具有鲁棒性（Robustness）

水印要有不可感知性

方案1

主要内容

研究阻碍

方案2

主要内容

困难&疑惑

实验结果

水印（Watermark）

传统方法

攻击方法

目前方向

水印同步(Synchronization Watermark)

水印提取(Watermark Extraction)

水印嵌入

遥感数据的图像生成

实验结果

2022年9月22日 22:28

2022年9月13日

0 评论