AI模型水印
应用背景:神经网络模型作为一种服务提供给用户使用,既可能通过远程API接口提供给用户进行黑盒使用,也可能借助神经网络良好的迁移性将网络完全提供给用户进行白盒使用。这两种场景下都存在恶意用户盗取模型的可能性,此时就需要一种机制来证明模型的知识产权。
解决方案:在模型中嵌入水印,借助于水印来标识模型的所有者。具体来说包括两类,一是在模型的权重中嵌入水印,另一种是借助于后门的思想在网络训练的过程中引入后门触发集。
应用背景:神经网络模型作为一种服务提供给用户使用,既可能通过远程API接口提供给用户进行黑盒使用,也可能借助神经网络良好的迁移性将网络完全提供给用户进行白盒使用。这两种场景下都存在恶意用户盗取模型的可能性,此时就需要一种机制来证明模型的知识产权。
解决方案:在模型中嵌入水印,借助于水印来标识模型的所有者。具体来说包括两类,一是在模型的权重中嵌入水印,另一种是借助于后门的思想在网络训练的过程中引入后门触发集。