英伟达(Nvidia)的新流媒体技术可以通过深度伪造你的脸来节省带宽_科技

Nvidia Maxine

有很多方法可以提高视频通话的质量，但添加花哨的麦克风和复杂的照明设置只能起到这么多的作用。图形处理单元(gpu)制造商英伟达(NVIDIA)最近发布了一个名为Maxine的新平台，可以为视频通话提供一些由人工智能驱动的升级，其中一些功能既令人毛骨悚然，又令人惊叹。

Maxine在云上处理数据，而不是在消费者设备上，所以如果流媒体平台启用了它，用户就可以在不需要强大到足以处理计算的计算机或智能手机的情况下享受高级功能的好处。从最基本的角度来看，这种非设备计算与谷歌Stadia等应用能够将高端PC游戏玩法实时传输到智能手机的理念是相同的。

英伟达的平台内置了各种有用或有趣的应用程序，但关键因素是它能够减少每天约3000万视频通话所需的带宽。通常，网络会议需要移动连续的视频流。然而，玛克辛能识别出你脸上的关键点，并在观众的屏幕上重现它们，利用人工智能驱动的动画技术来填补缺失的部分。由于该平台不需要流媒体传输整个屏幕的像素，英伟达声称Maxine可以将视频通话所需的带宽削减十倍。

这个动画过程与deepfake应用程序类似，比如那些可以把你的马克杯贴在电影片段中的演员身上的应用程序。使用这项技术，玛克辛可以为电话接收者创造更流畅的观看体验。通常情况下，在正常的视频通话中，当连接速度出现问题时，画面会掉下来，通话者看起来就像被冻结了一样。因为玛克辛只依赖少量传输的面部数据，动画图像仍然可以在短暂的中断期间平稳地移动。

https://www.youtube.com/watch?v=ZYx3jek0KCs 特点= emb_logo / /

人工智能还可以将这些面部数据超越简单的流媒体。面部对齐工具可以让扬声器看起来像是直视着摄像头，即使他们看的方向略有不同。这个演示有点令人不安，因为你可以看到实时发生的变化，但如果你参加了一个电话会议，而对方已经启用了这项技术，你可能不会注意到，尤其是当你自己试图看着摄像头的时候。

Maxine还提供了其他基于人工智能的技术，如实时翻译和现实的memoji风格的屏幕化身，但它们没有带宽削减功能那样的潜在影响。

玛克辛不是你可以自己下载的应用。这是一个让开发者和制造商在他们的产品中构建的平台。现在，公司可以申请早期使用这项技术，很可能我们会看到其他公司尝试类似的方法来减少带宽使用。毕竟，在可预见的未来，我们将会有更多的视频会议。