首页 > 资讯 > 科技 > 正文
2022-02-19 19:23

这张Billie Eilish的封面与众不同(因为它是由谷歌的AI制作的)

Billie Eilish Google AI mashup

谷歌使用常见的人工智能工具被称为神经网络对于一个巨大的各种各样的任务,从你的Gmail账户的说明文本服务你无穷无尽的推荐视频每次你启动的YouTube应用。现在,谷歌已经任务自定义神经网络同步组织超过150000 YouTube封面版本的“坏人”,比利Eilish。

这听起来并不像一个令人印象深刻的任务,直到你考虑到项目的规模。当你访问bile.wityoutube.com时,“坏家伙”的原始视频开始播放。然而,从那里,你可以点击播放器旁边的相关视频或屏幕底部滚动的任何标签。一旦你这样做了,视频将无缝过渡到歌曲的翻唱版本,在节奏和音调上完美同步。它可以在电脑、智能手机和平板电脑上所有主流浏览器的最新版本上运行。

分类范围从典型的翻唱类型如“声学”和“唱诗班”到“手风琴”甚至是“猫风琴”。我点击了大约10分钟,惊讶地发现有这么多不同的版本,以及它们之间的无缝转换。

该应用程序是使用谷歌的开源机器学习软件库张量流构建的。《Bad Guy》作为一首分析歌曲是有意义的,因为它有一个强烈但简单的节拍,主要是基于低音鼓四分音符。几乎恒定的“砰砰砰砰”为节奏排列提供了坚实的参考。

算法并不是每次都能完美运行。它所获取的内容池的绝对深度可以转化为一些奇怪的东西。例如,有时算法会在诗之间有点迷失,从结构的角度来看,这听起来很相似。

谷歌还表示,它没有做任何事情来规范化从一个视频到另一个视频的音量,所以你可能会发现一些声音比它之前来的更小或更大。

如果你想坐下来看视频的每一次迭代,谷歌说这将需要1.46乘以10的100次方年,也就是差不多15十二万亿,这比你的感恩节假期要长得多。

如果你想在mashup中包含“Bad Guy”的封面,你可以使用YouTube的“Manage Your Videos”页面来选择加入。

该项目是谷歌人工智能实验项目的一部分,如果你有一些空闲时间,值得探索。

它包括其他很酷的项目,包括Quick, Draw!这是一个游戏,你试着画出物体,然后让神经网络猜出它们是什么。它从“世界上最大的涂鸦数据集”中提取,其中包括5000多万幅用来教算法如何识别潦草涂鸦的物体的图画。

此外,还有其他与音乐相关的挑战,包括今年早些时候的弗雷迪·米特(Freddie Meter),该项目要求参与者模仿已故皇后乐队(Queen)主唱的演唱风格,并提供基于准确性的配乐。

2018年,谷歌推出了一个名为Semi-Conductor的音乐人工智能项目,该项目使用电脑的网络摄像头来跟踪你的动作,并使用它们来指挥一个虚拟的管弦乐队,同时看起来非常可笑。幸运的是,人工智能不会做出判断。