Steg.AI推出基于深度学习的水印方案 可将隐形水印嵌入数字内容中

2023-08-03 15:54:04 来源:站长之家

编程客栈()8月3日 消息:2023年5月,全球震惊于五角大楼冒烟的图片。许多新闻频道根据这些图片报道事件,甚至股市也做出了短暂的反应。然而后来证明,这是一张虚假的由人工智能生成的图片。

这样的事例凸显了编程客栈在各种情况下识别由人工智能生成的内容的挑战。也重新引发了关于深度伪造和虚假图片的更大讨论 —编程— 这是由于生成式人工智能工具和它们根据提示产生超逼真图片的能力所加剧的。


(资料图片)

所有这些都导致全球各国政府争相寻找解决方案和安全监管人工智能的方法。知名的人工智能公司,包括亚马逊、Anthropic、谷歌、Inflection、Meta、微软和 OpenAI 等,已自愿承诺采取措施,如为人工智能生成的内容加水印,以增强其安全性,但尚未取得任何实质性进展。

当前的方法,如将数据编码到图像或音频中,很容易被绕过。需要一种稳健、隐形的水印技术,易于应用和检测,同时抵抗各种变换。研究表明,人类很难区分人工智能生成的内容和人类生成的内容。由于在线知识产权盗窃猖獗,证明内容创作来源的能力日益重要。

与此同时,总部位于加利福尼亚的平台 Steg.AI 已经开发出一种基于深度学习的解决方案,可以将几乎不可察觉的水印嵌入数字内容中。即使这些图片经过修改、压缩或操纵,Steg.AI 的水印仍然完整。这种水印具有非常强大的韧性,甚至可以在 iPhone 相机上捕捉到屏幕上显示或打印出的水印。

官网地址:https://steg.ai/

Steg.AI 的水印技术在股票摄影服务、社交媒体平台上的内容分享、电影的预发行副本和保护机密文件等各种场景中都有应用。早期版本的产品面临挑战,导致公司转变重点关注韧性,这一突出特点与客户产生共鸣。

Steg.AI 的核心概念是在分发之前将水印无缝地整合到人工智能生成的图片中。虽然具体的过程保密,但基本思想围绕着一对机器学习模型。一个模型负责定制水印在图片中的位置,确保对人眼来说不可察觉,但仍然可以被解码算法检测到。

类似于一个几乎不可见且不可更改的 QR 码,这种方法潜在地可以容纳千字节的数据,足以存储 URL、哈希值和纯文本信息。每一页多页文档或视频帧都可以隐藏不同的代码,从而呈指数级增加容量。

该公司的大量工作可以追溯到2019年的 CVPR 论文,以及获得的第一和第二阶段 SBIR 政府拨款。创始人 Eric Wengrowski 和 Kristin Dana 曾参与学术研究,他们致力于多年来改进他们的方法。

Steg.AI 的进展得到了 NSF 拨款和天使投资的支持,总额达120万美元。最近,该公司宣布取得重要里程碑,完成了500万美元的种子轮融资,由 Paladin Capital Group 领投,华盛顿广场天使投资、NYU 创新风投基金和个人天使投资者参与。

大型科技公司已经采取措施将水印技术应用到他们的内容中。微软在其年度 Build 会议上宣布,正在为 Bing 图像创建和设计师增加新的媒体出处功能,使用户能够验证人工智能生成的图像和视频。这项创新采用加密方法,在内容上标记和签署元数据编程以指示其来源。为此,网站必须采用与 Adobe、Arm、Intel、微android软和 Truepic 共同开发的联合内容出处和真实性(C2PA)规范。

然而,微软的努力的影响取决于更广泛的媒体出处标准的采用,得到了 Stability AI 和谷歌等公司的支持,他们也在探索类似的方法。Shutterstock 和 Midjourney 已采用指导方针,嵌入标记表示生成式人工智能创建的内容。

另一方面,Meta AI、Centre Inria de l’Universite de Rennes 和 Sorbonne 大学进行的合作研究已经开发出一种创新技术,可以在图像生成过程中无缝地加入水印,同时保留架构的完整性。这种方法修改了预训练的生成模型,以有效地将水印整合到生成的图像中,增强安全性和计算效率。这项技术使模型提供商能够为不同的用户群体分发带有不同水印的模型版本,以便监控道德使用。

这种技术对于媒体机构来说是宝贵的,可以识别计算机生成的图像。研究人员利用潜在扩散模型(LDM)成功地将水印与生成模型进行了最少的调整。该过程涉及使用感知图像损失和一个名为 HiDDeN 的简化深度水印方法的隐藏信息损失来对 LDM 解码器进行微调。这种技术在图像编辑任务中表现出很强的性能,即使是对于严重裁剪的图像,也能保持原始模型在各种基于 LDM 的任务中的效用。

上个月,这七家大型科技公司的举动支持了拜登政府对繁荣和受欢迎的人工智能技术进行监管的推动。美国国会还在审议一项法案,要求在创建政治广告时披露人工智能的参与情况。

x 广告
最近更新