StoryDiffusion: Consistent Self-Attention for Long-Range Image and Video Generation

paper: StoryDiffusion: Consistent Self-Attention for Long-Range Image and Video Generation codes: https://storydiffusion.github.io/ 1. 前情提要 两个核心创新点: ...

阅读更多

RAR:Retrieving And Ranking Augmented MLLMs for Visual Recognition

paper: RAR:Retrieving And Ranking Augmented MLLMs for Visual Recognition codes: https://github.com/Liuziyu77/RAR 闲言碎语 RAR,整体动机总结一下:clip知道吧?Multimodal ...

阅读更多

Interative Learning from Verbal Correction

paper: Interactive Robot Learning from Verbal Correction codes: Olaf: Interactive Robot Learning from Verbal Correction 0. 碎碎念 最近真是想不到,看了几周的机器人相关的交互式学...

阅读更多

李云龙二次元风格化!一键fork你也能行

李云龙二次元风格化!一键star、fork,你也可以生成这样的团长! 打滚卖萌求star求fork! 视频效果前往B站观看效果最佳:李云龙二次元风格化: github开源repo:李云龙二次元风格化 百度AIstudio开源地址,一键fork即可运行: 李云龙二次元风格化!一键fork你也能行 ...

阅读更多

量子纠缠:invisible man

源代码: 百度aistudio notebook:量子纠缠:invisible man 知乎链接:量子纠缠:invisible man 废话不多说,效果视频如下: 然后是一一剖析:以上是在装逼[捂脸] 哈哈,客官勿怪哈,其实是闲来无聊,下班回来体验了下百度paddlepaddle新出的人体抠...

阅读更多

2019-ncov的一些记录

新冠肺炎闹得愈来愈凶,发生了很多事情,很多魔幻现实主义的事情,但也有些正能量的事情. 然而发表在国内的载体,总有很多404,让事情显得愈加滑稽. 多可喜亦多可悲. 在这里记录一些我觉得值得一记的东西,也并不为了什么. note:视频是放在github上的,所以访问可能比较慢,每个视频我都在后面加了视频地址...

阅读更多

论文阅读-年龄估计_SSRNet

年龄估计,也是一个颇有点意思的task。 今天来介绍一个其中的经典算法:SSRNet。 paper: SSR-Net: A Compact Soft Stagewise Regression Network for Age Estimation codes: SSR-Net 1. 前情提要 年龄...

阅读更多

论文阅读-可迁移对抗样本攻击

paper:Transferable Adversarial Attacks for Image and Video Object Detection Hello 大家好,本次带来的是针对目标检测的可迁移对抗样本攻击。 听起来好高大上的样子,其实就是对抗样本攻击,不过这次用在了目标检测上,然后加了个小...

阅读更多