↓Skip to main content

🏢 Snap Inc

AV-Link: Temporally-Aligned Diffusion Features for Cross-Modal Audio-Video Generation

19 December 2024·2525 words·12 mins· loading · loading

AI Generated 🤗 Daily Papers Multimodal Learning Multimodal Generation 🏢 Snap Inc

AV-Link: 시간 정렬 확산 기능을 통한 크로스 모달 오디오-비디오 생성의 획기적인 발전!