↓Skip to main content

Vision-Language Models

SynerGen-VL: Towards Synergistic Image Understanding and Generation with Vision Experts and Token Folding

12 December 2024·3268 words·16 mins· loading · loading

AI Generated 🤗 Daily Papers Multimodal Learning Vision-Language Models 🏢 Tsinghua University

SynerGen-VL: 간단한 구조로 이미지 이해 및 생성을 동시에 수행하는 강력한 MLLM.

BiMediX2: Bio-Medical EXpert LMM for Diverse Medical Modalities

10 December 2024·2792 words·14 mins· loading · loading

AI Generated 🤗 Daily Papers Multimodal Learning Vision-Language Models 🏢 Mohamed Bin Zayed University of Artificial Intelligence

BiMediX2: 아랍어-영어 이중 언어 의료 전문가 LMM 출시!