如果没有关注这些消息,你根本想象不到中国AI的真正实力! AI是中美科技竞争的深水区,在语言大模型卷生卷死之后,双方又在视频大模型领域厮杀得难舍难分!中国的实力比大家想象得要强得多,先是海外传回来消息,阿里通义实验室研发的AI模型EMO论文发布后,成为SORA之后最热门的AI模型之一,外媒争相报道。 没过多久,通义APP就把这个应用免费推出来了,只要上传一段音频、上传一张肖像照,就能让照片中的人物开口唱歌说话。不是那种机械的AI,EMO模型学习并编码了人类表达情绪的能力,直接将音频内容和人物的表情、嘴型匹配,甚至连语气和情绪都能体现在表情上。 一直以来,大家都有个误区:好像中国AI应用比较强,搞理论弱一些。但如果关注过中国AI头部大厂的消息,就会发现,事情并非如此。 比如这次通义APP的功能,让照片开口唱歌,表面上看起来只是个有趣的应用。实际上,这是阿里云多次技术迭代进步之后,厚积薄发的一个现象而已。这一次爆火的EMO算法其实与通义实验室去年就火遍海外的Animate Anyone、Outfit anyone等模型一脉相承,在算法原理上都采用了Backbone + ReferenceNet的结构,实现有参考图像引导的去噪生成过程,这是声音+照片生成视频的技术保障。 大概只有中国人不知道中国AI发展的速度到底有多恐怖!技术的进步不是一下子就惊天动地的,是一次又一次更新、迭代。不得不承认,中国AI起步晚了一些,但发展进步的速度中国AI不输给任何人!
如果没有关注这些消息,你根本想象不到中国AI的真正实力! AI是中美科技竞争的
白猫学
2024-04-25 19:45:46
0
阅读:200
Jason
AI不等于AIGC,这条路走到头也就是帮人生成多媒体内容而已。真正的强AI应该可以从推理判断等角度,帮助人类解决真正的各方面的难题。