自然语言文本水印
应用背景:数字作品极易被盗版者抄袭和篡改,严重侵害拥有者的知识产权;此外,网络上数字内容泛滥,很难对内容的来源进行确认。因此,研究文本水印实有必要,这对于确认信息来源和信息的秘密传送,以及版权维护等方面都有着很大的应用价值 。
解决方案:基于长短时记忆网络研究(生成式)自然语言文本水印。
核心技术:
(1)注意力机制:利用关键词引导语言模型生成长文本,提高嵌入容量。
(2)自适应候选词替换:依照候选词的概率选择最合适的词作为当前输出,能够充分利用数据承载空间。
(3)主题感知损失设计:面对未知测试环境,引导模型生成与主题相关的文本,泛化能力强,稳健性好。