Article

动态

您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器 此为临时链接,仅用于文章预览,将在时失效 发私信给梁丙鉴 0 导语:多模态理解与生成的真统一。 开发者在讨论什么?除了效果有多惊艳,还有一个更底层的问题:为什么这次把 VAE也去掉了?从 Stable Diffusion 到 FLUX,几乎所有主流扩散模型都依赖变分自编码器(VAE)把图像压进潜空间,这是近年来整个图像生成技术栈的地基。SenseNova U1 的 NEO-unify 架构选择把它整个拆掉,直接在像素层面端到端建模语言与视觉。这不是工程优化,是架构层面的重新选边站。 HuggingFace 社区的热门讨论包括「能否在单张 RTX 5090 上运行」、「是否会有更轻量版本」等极具落地指向的问题,说明已经有大量开发者在认真跑通它。有开发者评价称,这是「终于有人在原生统一方向上认真做了工程落地」,和此前的伪统一架构完全不可同日而语。 与此同时,模型以 Apache 2.0 协议完全开源,支持商用,发布后不到两周,团队已陆续推出 8 步推理加速版、LoRA 微调版、GGUF 量化版

去掉 VAE 之后,商汤用 8B 参数重新定义了开源生图的上限

您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器 此为临时链接,仅用于文章预览,将在时失效 发私信给梁丙鉴 0 导语:多模态理解与生成的真统一。 开发者在讨论什么?除了效果有多惊艳,还有一个更底层的问题:为什么这次把 VAE也去掉了?从 Stable Diffusion 到 FLUX,几乎所有主流扩散模型都依赖变分自编码器(VAE)把图像压进潜空间,这是近年来整个图像生成技术栈的地基。SenseNova U1 的 NEO-unify 架构选择把它整个拆掉,直接在像素层面端到端建模语言与视觉。这不是工程优化,是架构层面的重新选边站。 HuggingFace 社区的热门讨论包括「能否在单张 RTX 5090 上运行」、「是否会有更轻量版本」等极具落地指向的问题,说明已经有大量开发者在认真跑通它。有开发者评价称,这是「终于有人在原生统一方向上认真做了工程落地」,和此前的伪统一架构完全不可同日而语。 与此同时,模型以 Apache 2.0 协议完全开源,支持商用,发布后不到两周,团队已陆续推出 8 步推理加速版、LoRA 微调版、GGUF 量化版

去掉 VAE 之后,商汤用 8B 参数重新定义了开源生图的上限

背景介绍 最近,商汤科技发布了一项基于其最新技术成果的重要进展。这项突破在于他们去掉了传统的人工神经网络中的卷积层(VAE),并利用新型深度学习方法重新定义了生成对抗网络(GAN)中的参数量,从而实现了高效且高质量的生图生成。

商汤的技术背景 商汤科技是一家专注于人工智能领域的创新企业,其核心业务涵盖了计算机视觉、自然语言处理等多个领域。近年来,在AI技术的多个细分赛道中取得了显著成就,尤其是在图像和视频分析方面更是处于领先地位。这次的技术突破也体现了商汤在该领域的深厚积累和技术实力。

新技术详解 去掉 VAE 的意义 传统的生成对抗网络(GAN)模型通常包含大量的卷积层,这不仅增加了计算复杂度,还可能影响生成图像的质量和多样性。而商汤科技在这项新技术中去掉了 VAE 部分,并用更加高效的算法替代了它。

8B 参数的突破 在去掉 VAE 后,商汤引入了一种全新的参数化方法:使用了仅 8 亿个参数(即“8B”)来构建生成模型。这一数量相比于以往动辄数十亿甚至上百亿参数的模型来说,已经大大减少。

实验结果与表现 实验结果显示,尽管参数量降了不少,但新模型在生成图像的质量和多样性上依然表现出色。通过对大量数据集进行训练后,该技术能够快速生成高质量、细节丰富的生图,这为未来的图像生成应用场景打开了新的可能性。

技术优势与应用前景 高效性与可扩展性 新技术不仅提高了计算效率,还增强了模型的灵活性和可扩展性。这对于需要实时处理大量数据的应用场景来说尤为重要,比如在线视频平台、即时通讯软件中的动态内容生成等。

商业价值 此项技术对于商业领域同样具有巨大的吸引力。通过降低生成图像所需的计算资源成本,企业能够更便捷地整合先进的人工智能技术到其产品和服务中去,从而提升用户体验和竞争力。

结语 整体来看,商汤科技此次在生图生成领域的突破性进展令人瞩目。它不仅展示了该公司领先的技术实力,也为整个AI产业带来了新的发展机遇。未来,类似的高效算法和技术将会被越来越多的企业所采用,并推动相关领域持续向前发展。看来商汤的团队确实不简单,真正做到了技术上的革新与突破。

用本文提到的模型?

注册即送 1000 万 Token,GPT / Claude / Gemini 一键接入。

免费注册

评论反馈

0/500

相关推荐