↓Skip to main content

🏢 University of Bonn

Video-Panda: Parameter-efficient Alignment for Encoder-free Video-Language Models

24 December 2024·3101 words·15 mins· loading · loading

AI Generated 🤗 Daily Papers Multimodal Learning Vision-Language Models 🏢 University of Bonn

Video-Panda: 초경량 인코더 없는 비디오-언어 모델로, 계산 비용을 획기적으로 줄이면서 최첨단 성능을 달성!