“O”:视频输出。2023年,我们看到了文字到视频合成的浪潮:WALT(谷歌)、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等,数不胜数。然而,大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。
6. Transformer架构的替代方案将得到真正的采用。
图源:微博用户“纽太普同学”
就目前而言,React Agent生成的代码还不够生产就绪,需要在合并到现有代码库之前进行大量调整。但总的来说,它提高了我的生产力。
Inpaint_wechat的开发过程中借鉴了inpaint_web项目,成功实现了该功能从web平台到微信小程序的迁移。这意味着用户可以在微信平台上方便地使用这一实用功能。