当前位置: 首页 · 研究动态 · 正文

研究动态

实验室学术论文被多媒体领域顶会ACM MM 2024录用
发布日期:2024-10-11 点击量:

近日,实验室论文“Groot: Generating Robust Watermarking for Diffusion-Model-Based Audio Synthesis”被ACM国际多媒体会议(ACM International Conference on Multimedia,ACM MM 2024)录用,实验室2022级硕士生刘为之与实验室李越老师为论文第一作者,田晖教授为通讯作者。新加坡工程院院士、新加坡国立大学终身教授、香港中文大学(深圳)数据科学学院执行院长李海洲教授和深圳大学林东东博士参与了该研究工作。ACM MM是多媒体领域的顶级国际会议,也是中国计算机学会(CCF)推荐的A类会议。本届会议共收到4385篇投稿,录用1149篇论文,录用率约为26.2%。

图1 论文首页

随着生成模型特别是扩散模型的蓬勃发展,区分合成音频与自然音频的任务变得愈发艰巨。水印技术作为一种主动且可持续的解决策略,可从源头上监管合成内容的创建和传播。因此,本文率先提出了基于隐变量感知的生成式音频水印算法Groot,为主动监管合成音频及其源模型提供了一种新范式。该方法不仅免除了针对扩散模型复杂的训练过程,同时面向不同的文生语音扩散模型能够达到即插即用的效果。实验结果表明,该算法在不同音频数据集(LJSpeech,LibriTTS 和 LibriSpeech)和不同扩散模型(DiffWave,WaveGrad 和 PriorGrad)上具有较好的保真度及容量,并且可以有效抵御多种面向音频的单项或复合型后处理攻击。

论文详细信息如下:WZ Liu, Y Li, DD Lin, H Tian* and HZ Li. Groot: Generating robust watermarking for diffusion-model-based audio synthesis. ACM International Conference on Multimedia, 2024. ArXiv: 2407.10471.


上一条:实验室学术论文被IJCIM录用
下一条:实验室学术论文被Measurement录用

厦门市数据安全与区块链技术重点实验室

访问量:

Baidu
map