谷歌AI新星转投Pika：视频生成Lumiere一作，担任创始科学家

量子位 716 阅读 0 评论 15 点赞

视频生成进展如火如荼，Pika迎来一位大将——

谷歌研究员Omer Bar-Tal，担任Pika创始科学家。

一个月前，还在谷歌以共同一作的身份发布视频生成模型Lumiere，效果十分惊艳。

当时网友表示：谷歌加入视频生成战局，又有好戏可看了。

Stability AI CEO、谷歌前同事等在内一些业内人士送上了祝福。

Omer Bar-Tal，2021年本科毕业于特拉维夫大学的数学与计算机系，随后前往魏茨曼科学研究所攻读计算机硕士，主要聚焦于图像和视频合成领域的研究。

其论文成果多次被顶会接收，比如Text2LIVE（ECCV 2022 Oral）、MultiDiffusion（ICML 2023）、TokenFlow（ICLR 2024）。

以TokenFlow为例，他们提出了一种框架，基于扩散模型实现文本驱动的视频编辑，支持视频编辑任务无需任何训练或微调。

此次加盟Pika前，他曾是谷歌研究院以Student Researcher身份待了9个月，最终经过7个月的研究以共同一作身份推出了Lumiere。这时候硕士应该还没有毕业。

Lumiere的创新点在于，提出了时空U-Net（STU-Net）架构：将视频在空间和时间两个维度同时进行下采样和上采样，在网络的中间层得到视频的压缩时空表示。

在学习了3000万视频之后，Lumiere可支持文生视频、视频编辑修复、图片转视频以及视频风格化等多种功能。

当时Jeff Dean盛赞：多模态视频生成革命正在发生。

官宣加盟Pika消息之后，官方以及投资人等也送上了祝福。

前几天，还有位Pika华人研究员Yilun Du发布了篇文章，不过应该刚从MIT博士毕业（也可能还没毕业），论文单位仍是MIT。

另外在官网还在继续招人中。

点赞(15) 打赏

免责声明：本文内容由网友自发贡献，或转载各大站转载，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系123246359@163.com核实处理。
本文分类：科技前沿
本文标签：研究
浏览次数：716 次浏览
发布日期：2024-02-27 09:59:27
本文链接：https://yinghuohong.cn/kejiqianyan/24728.html

暂无评论