↓Skip to main content

🏢 University of Washington

Byte Latent Transformer: Patches Scale Better Than Tokens

13 December 2024·3839 words·19 mins· loading · loading

AI Generated 🤗 Daily Papers Natural Language Processing Large Language Models 🏢 University of Washington

BLT: 바이트 기반 LLM, 토큰보다 패치 우선.