【[355星]Seed1.5-VL:一款强大的视觉-语言基础模型,专为通用多模态

爱生活爱珂珂 2025-05-13 12:58:48

【[355星]Seed1.5-VL:一款强大的视觉-语言基础模型,专为通用多模态理解和推理而设计,能在多种复杂任务中提供卓越表现。亮点:1. 高效架构,仅用5.32亿视觉编码器和200亿参数的MoE LLM,实现顶尖性能;2. 在60个公共基准测试中,38个达到最佳水平;3. 擅长复杂推理、OCR、图解理解、视觉定位、3D空间理解及视频理解等多种能力】

'Seed1.5-VL, a vision-language foundation model designed to advance general-purpose multimodal understanding and reasoning, achieving state-of-the-art performance on 38 out of 60 public benchmarks.'

GitHub: github.com/ByteDance-Seed/Seed1.5-VL

多模态模型 视觉语言 高效推理 AI创造营

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注