梦瑶 发自 凹非寺
量子位 | 公众号 QbitAI
这些刷屏的AI图片,你刷到了没?
就是那种——和自己专属emoji合影的黏土风照片,画风长这样:
本来以为是NanoBanana整的新玩法,结果点开评论区一看:嗐,原来是美图自家的AI Agent——叫RoboNeo~
一向本着“啥都得测测”的原则,我也来试了试,立刻跟风搓了个黏土风Q版形象!
还有这个,全网最近爆火的马维斯风宋朝打工人图,仕女眼神已经写明白了——不想卷、不敢躺:
图上整活还不够,这Agent还支持生成视频,来看看网友搞的这一段转绘动画,有热血校园内味儿了:
还是熟悉的配方,熟悉的味道——美图这一波,又把自家祖传手艺拿出来开整了。
话不多说,直接开测,看看这RoboNeo到底香否!
一个能边唠嗑边P图的快乐老家实测前先唠唠RoboNeo的web端生图页面。
说实话,第一眼看上去,其实有点像Lovart的表亲……
只不过页面布局反着来了:左边聊天,右边编辑~
我合理怀疑产品经理是考虑了Chinese宝宝的写字习惯: 从左到右更顺手~(毕竟从小老师都教这么写的)
操作也简单,就像日常跟AI唠嗑一样跟它聊就行,把甲方需求丢进对话框,它就会“听话”出图:
在有提示词的明确指令能生图不算稀奇事儿,关键是模模糊糊的指令它行不行?
于是乎,我丢给AI一句模糊的指令——帮我生成一张海报:
看到AI这反应我心里就有谱了。
当遇到模糊提示词,这个AI会切换成“追问模式”,甩出来几个选项让我们充实提示信息。
就这么你一句我一句,一直问到它搞懂为止……
(原来是这么唠啊…)
再看看RoboNeo的画布编辑区,也是大家最关心的p图功能。
说实话功能挺全的,像AI改图、扩图、超清、抠图这些基本操作都安排上了。
这熟悉的功能列表……不就是美图秀秀吗!!!
但其实像改图、扩图、裁剪这种涉及不到具体图片细节的功能点算不上啥亮点,大部分AI都有。
但是这拆分图层功能的功能值得一测,这玩意儿要真好用,那就是AI版的Photoshop。
来,直接上效果:
AI能自动识别图片里的元素,把它们拆成不同的图层,想拖哪就拖哪,用起来还挺顺手的。
实测下来,这个功能是我最想点赞的…..
修图这块差不多摸完了,接下来看看它的生图效果。
先跟风整个网友同款玩法——做个ios风emoji形象Photo,体验一把做贴纸的快乐~
Prompt:学习苹果iOS系统表情符号风格,将照片中的人物生成为此风格的3D贴纸头像。背景透明底,只要完整人物,确保最终图像看起来像官方的iOS表情符号贴纸。
项链、姿势、眼睛和衣服都算完美复刻了,和苹果手机自带的贴纸对比一下,还挺像那么回事儿的~
卡通特效玩够了,这回再玩点有意思的,让奥特曼带兵马俑进城,看他们沪漂的一天都干了啥:
Prompt:右图的兵马俑和左图的男子,在上海外滩合影,背景是东方明珠夜景。
好家伙,不知道真以为奥特曼本人真来上海报当地旅游团了,感觉兵马俑和奥特曼合照都变得拘谨了?(笑)
生这个图的时候也发现了一个小bug——
RoboNeo似乎不支持在对话框里编辑图片尺寸。
如果想改尺寸还得挪步到编辑「画布」或者「工作流」里改图,说实话有点麻烦了……
再来玩一把最近网上点赞超多的清透感人像写真大片,看看RoboNeo的修图实力能不能吊打影棚:
Prompt:采用细腻皮肤真实质感的风格,画面中展现了一个不改变原图形象的萌萌少女的脸部特写,通过略微俯视的镜头角度进行呈现。背景营造出清醒系且阳光的场景氛围,少女有着散乱的头发随风飘动的感觉。眼神闪闪发光,画面呈现摄影机极蓝噪点的画质,并且有着蓝白色通透效果。
诶,这改得怎么说呢,像是急着交作业,只把背景换成了草坪,氛围感和俯视效果是一点没看出来……
(不知道是不是没氪金的原因,到后面生图速度明显慢了???)
除了基础生图功能外,RoboNeo的工作流功能也值得一提,它能帮忙润色提示词、生成脚本,也能直接进行内容创作。
「画布」和「工作流」的侧重点其实不太一样——
只是想修修图、P个细节,那画布更合适,编辑功能多,操作也直观。
但如果是“成批出图”或“有明确创作目标”,那工作流用起来会更高效,应该会省心不少~
视频功能也来掺一脚了生图能力确实还不错,这回试试这个修图起家的RoboNeo,在视频生成能力上表现咋样~
我先是上传了一张迪士尼真实城堡的图片,让AI帮忙转绘为超级可爱浪漫的像素插画风视频:
Prompt:生成视频,将真实城堡画面转绘为像素风格:建筑墙面闪着光,天空中烟花缓缓绽放,现实与像素感交融过渡。
下面这个会跳草裙舞的小猫也很不错,感觉一秒置身夏威夷了!
Prompt:生成一只穿着草裙在热带海滩上跳舞的可爱小猫视频,风格为卡通明亮,背景有棕榈树和夕阳。
还有这个,最近超超超火的jellycat风“一刀切”的小视频,感觉很好rua的样子:
Prompt:生成一个5秒的gif,让一个餐具刀切开图片中的披萨饼。
emm……就是披萨饼到最后有点崩,还没动手切,披萨饼就自动“瓦解”了……
最后再试试RoboNeo的声画同步能力。声音倒是有了,感觉嘴型有点没对上,字幕也扭曲了:
Prompt:生成一个真实视频,一只可爱的小猫边骑三轮车边说:“我是一个快乐的小猫,快乐小猫长得高~”
One More Thing总的来说,RoboNeo的修图能力确实不枉自己这么多年的功底,甚至把一些Photoshop的高频功能都打包上了。
用在图像上,它是靠谱的。
但是也有一些小问题,生成速度有点拉垮...(可能在暗示我氪金)
在不太擅长的视频生成领域,暴露的缺陷也比较明显,比如画面的逻辑性问题有bug,文字生成不好等等。
但整体上工具思路和底子还算扎实~
说完产品本身,RoboNeo产品背后的故事也挺有意思。
之前美图CEO吴欣鸿透露说,RoboNeo是美图一个小团队用差不多一个月的封闭开发时间“赶工”做出来的——
没有层层工作审批,所有不产生决策的汇报都被砍了,甚至没有传统意义上的“产品经理”。
设计师想到一个点子,不用等产品经理拍板,就能直接训练模型、云端上线??
这是真快啊……
当然了,RoboNeo不按常理出牌的快节奏打法也不难理解——
毕竟,今年国内外影像类AI产品一个接一个,谁慢半拍,可能就没位置了。(doge)
— 完 —
量子位 QbitAI · 头条号
关注我们,第一时间获知前沿科技动态