Lego Pokémon Venusaur, Charizard and Blastoise
这个模型并不像其他 AI 巨头那样「刷分」,而是朝着小型化、端侧化、低延迟的方向做了极致优化,将视觉处理所需的 Token 降到传统 ViT 的 1/16,极大降低延迟,可以根据摄像头捕捉到的内容实时给出判断,反应速度非常快。
。业内人士推荐Line官方版本下载作为进阶阅读
最先感受到的变化,是它开始更好地理解空间和比例了。
不过更便宜,也意味着消耗同样的 Token,我们能生成更多的图片了。像这种九宫格大头贴的照片,先生成一张总的,直接再要 Nano Banana 2 逐一分割生成。