Paper Reviews by AI
2024
PartGen: Part-level 3D Generation and Reconstruction with Multi-View Diffusion Models
·2572 words·13 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Computer Vision
3D Vision
๐ข Meta AI
PartGen: ๋ค์ค ๋ทฐ ํ์ฐ ๋ชจ๋ธ์ ์ด์ฉ, ํ
์คํธ, ์ด๋ฏธ์ง, ๊ธฐ์กด 3D ๊ฐ์ฒด๋ก๋ถํฐ ์๋ฏธ์๋ ๋ถ๋ถ์ผ๋ก ๊ตฌ์ฑ๋ ๊ณ ํ์ง 3D ๊ฐ์ฒด ์์ฑ ๋ฐ ์ฌ๊ตฌ์ฑ.
Orient Anything: Learning Robust Object Orientation Estimation from Rendering 3D Models
·2368 words·12 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Computer Vision
3D Vision
๐ข Zhejiang University
๋จ์ผ ์ด๋ฏธ์ง์์ ๊ฐ์ฒด ๋ฐฉํฅ ์ถ์ ์ ์ ํ๋๋ฅผ ํฌ๊ฒ ๋์ด๋ ‘Orient Anything’ ๋ชจ๋ธ ์ ์!
Mulberry: Empowering MLLM with o1-like Reasoning and Reflection via Collective Monte Carlo Tree Search
·2002 words·10 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Multimodal Learning
Vision-Language Models
๐ข Tsinghua University
Mulberry๋ ์ง๋จ ๋ชฌํ
์นด๋ฅผ๋ก ํธ๋ฆฌ ํ์(CoMCTS)์ ์ด์ฉ, ๋จ๊ณ์ ์ถ๋ก ๋ฐ ๋ฐ์ฑ ๋ฅ๋ ฅ์ ๊ฐ์ถ ๋ค์ค ๋ชจ๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(MLLM)์ ๊ฐ๋ฐํ ์ฐ๊ตฌ์
๋๋ค.
Molar: Multimodal LLMs with Collaborative Filtering Alignment for Enhanced Sequential Recommendation
·2158 words·11 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Multimodal Learning
Vision-Language Models
๐ข University of Science and Technology of China
Molar: ๋ฉํฐ๋ชจ๋ฌ LLM๊ณผ ํ์
ํํฐ๋ง์ ๊ฒฐํฉํ์ฌ ์ํ์
์ถ์ฒ ์ฑ๋ฅ์ ํ๊ธฐ์ ์ผ๋ก ํฅ์์ํจ ํ์ ์ ์ธ ํ๋ ์์ํฌ!
MMFactory: A Universal Solution Search Engine for Vision-Language Tasks
·2306 words·11 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Multimodal Learning
Vision-Language Models
๐ข University of British Columbia
MMFactory: ์ฌ์ฉ์ ๋ง์ถคํ ๋น์ -์ธ์ด ์์
์๋ฃจ์
๊ฒ์ ์์ง
How "Real" is Your Real-Time Simultaneous Speech-to-Text Translation System?
·1013 words·5 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Machine Translation
๐ข Fondazione Bruno Kessler
์ค์๊ฐ ๋์ ํต์ญ ์์คํ
์ ํ์ค์ ์ธ ํ๊ณ๋ฅผ ๊ท๋ช
ํ๊ณ , ํ์คํ๋ ์ฉ์ด์ ์ฒด๊ณ๋ฅผ ์ ์ํ์ฌ ์ฐ๊ตฌ ๋ฐ์ ์ ์ด์งํ๋ ๋
ผ๋ฌธ.
DiTCtrl: Exploring Attention Control in Multi-Modal Diffusion Transformer for Tuning-Free Multi-Prompt Longer Video Generation
·3181 words·15 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Computer Vision
Video Understanding
๐ข Tencent AI Lab
DiTCtrl: ํ๋ ์์ด ๋ค์ค ํ๋กฌํํธ๋ก ๋งค๋๋ฌ์ด ์ฅ์๊ฐ ๋น๋์ค ์์ฑ
DepthLab: From Partial to Complete
·1980 words·10 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Computer Vision
3D Vision
๐ข HKU
DepthLab: ๋ถ๋ถ ๊น์ด ์ ๋ณด๋ก ์์ ํ 3D ์๊ฐ ์ ๋ณด ๋ณต์
CypherBench: Towards Precise Retrieval over Full-scale Modern Knowledge Graphs in the LLM Era
·2988 words·15 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Question Answering
๐ข Megagon Labs
๋ณธ ์ฐ๊ตฌ๋ ๋๊ท๋ชจ ํ๋ ์ง์ ๊ทธ๋ํ์์ LLM์ ์ด์ฉํ ์ ํํ ์ ๋ณด ๊ฒ์์ ์ํ ์๋ก์ด ๋ฒค์น๋งํฌ์ธ CypherBench๋ฅผ ์ ์ํฉ๋๋ค. ๊ธฐ์กด์ RDF ๊ธฐ๋ฐ ์ง์ ๊ทธ๋ํ๋ ๊ณผ๋ํ๊ฒ ํฐ ์คํค๋ง์ ๋ฆฌ์์ค ์๋ณ์ ์ฌ์ฉ์ผ๋ก LLM์ ๋นํจ์จ์ ์ด๋ผ๋ ๋ฌธ์ ์ ์ ๋ถ์ํฉ๋๋ค. ํนํ, Wikidata์ ๊ฐ์ ํ๋ ์ง์ ๊ทธ๋ํ๋ LLM์ ๋ฌธ๋งฅ ์ฐฝ ํฌ๊ธฐ๋ฅผ ์ด๊ณผํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋…
3DGraphLLM: Combining Semantic Graphs and Large Language Models for 3D Scene Understanding
·2837 words·14 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Computer Vision
Scene Understanding
๐ข AIRI
3DGraphLLM: ์๋ฏธ๋ก ์ ๊ทธ๋ํ์ ๊ฑฐ๋ ์ธ์ด ๋ชจ๋ธ์ ๊ฒฐํฉํ์ฌ 3D ์ฅ๋ฉด ์ดํด ์ฑ๋ฅ์ ํ๊ธฐ์ ์ผ๋ก ํฅ์์ํจ ์ต์ฒจ๋จ ์ฐ๊ตฌ!
1.58-bit FLUX
·1092 words·6 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Computer Vision
Image Generation
๐ข ByteDance
1.58-bit FLUX: 99.5%์ ํ๋ผ๋ฏธํฐ๋ฅผ 1.58-bit๋ก ์์ํํ์ฌ ๋ชจ๋ธ ํฌ๊ธฐ 7.7๋ฐฐ, ์ถ๋ก ๋ฉ๋ชจ๋ฆฌ 5.1๋ฐฐ ๊ฐ์, ๊ณ ํ์ง ์ด๋ฏธ์ง ์์ฑ ์ ์ง!
YuLan-Mini: An Open Data-efficient Language Model
·3531 words·17 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Large Language Models
๐ข Renmin University of China
YuLan-Mini: 24์ต ๊ฐ ๋งค๊ฐ๋ณ์๋ฅผ ๊ฐ์ง ๋ฐ์ดํฐ ํจ์จ์ ์ธ ๊ฐ๋ฐฉํ LLM
WavePulse: Real-time Content Analytics of Radio Livestreams
·2678 words·13 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Information Extraction
๐ข New York University
WavePulse: ์ค์๊ฐ ๋ผ๋์ค ๋ฐฉ์ก ์ฝํ
์ธ ๋ถ์ ํ๋ ์์ํฌ๊ฐ ์ ์น์ ๋ด๋ก , ๋ฏธ๋์ด ์ ํต, ์ฌ๋ก ๋ํฅ์ ์ค์๊ฐ ๋ถ์ํ์ฌ ์ ์น ๊ณผํ ๋ฐ ๋ฏธ๋์ด ์ฐ๊ตฌ์ ์๋ก์ด ๊ฐ๋ฅ์ฑ์ ์ด์์ต๋๋ค.
VidTwin: Video VAE with Decoupled Structure and Dynamics
·2381 words·12 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Computer Vision
Video Understanding
๐ข Peking University
VidTwin: ๊ตฌ์กฐ์ ๋์ญํ์ ๋ถ๋ฆฌํ์ฌ ๋น๋์ค ์์ถ ๋ฐ ์์ฑ์ ์๋ก์ด ๊ธฐ์ค์ ์ ์ํ๋ ํ์ ์ ์ธ ๋น๋์ค ์๋ ์ธ์ฝ๋!
SBS Figures: Pre-training Figure QA from Stage-by-Stage Synthesized Images
·2234 words·11 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Question Answering
๐ข Kyoto University
SBS Figures: 100๋ง ๊ฐ์ ํฉ์ฑ ์ด๋ฏธ์ง์ QA ์์ผ๋ก ์ฌ์ ํ์ต๋, ํจ์จ์ ์ธ Figure QA ๋ชจ๋ธ!
ResearchTown: Simulator of Human Research Community
·16894 words·80 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Large Language Models
๐ข University of Illinois Urbana-Champaign
RESEARCHTOWN: LLM ๊ธฐ๋ฐ ์ธ๊ฐ ์ฐ๊ตฌ ๊ณต๋์ฒด ์๋ฎฌ๋ ์ดํฐ๋ก, ๋ค์ํ ์ฐ๊ตฌ ํ๋์ ํ์ค์ ์ผ๋ก ๋ชจ๋ฐฉํ๋ฉฐ ํ์ ๊ฐ ์ฐ๊ตฌ ์์ด๋์ด ์์ฑ ๊ฐ๋ฅ
PC Agent: While You Sleep, AI Works -- A Cognitive Journey into Digital World
·3159 words·15 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Multimodal Learning
Human-AI Interaction
๐ข Shanghai Jiao Tong University
PC Agent๋ ์ธ๊ฐ์ ์ธ์ง ๊ณผ์ ์ AI ์ ์ ์ดํ์ฌ ๋ณต์กํ ๋์งํธ ์์
์ ์๋ํํ๋ ํ์ ์ ์ธ ์์คํ
์
๋๋ค.
Large Motion Video Autoencoding with Cross-modal Video VAE
·2098 words·10 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Computer Vision
Video Understanding
๐ข Hong Kong University of Science and Technology
๊ณ ํ์ง ์์ ์์ฑ ๋ฐ ํจ์จ์ ์์ถ์ ์ํ ํ์ ์ ์ธ ํฌ๋ก์ค ๋ชจ๋ฌ ๋น๋์ค VAE!
In Case You Missed It: ARC 'Challenge' Is Not That Challenging
·2275 words·11 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Large Language Models
๐ข Snowflake AI Research
๊ธฐ์กด ๋ค์ค ์ ํ ๋ฌธ์ ํ๊ฐ ๋ฐฉ์์ ์ค๋ฅ๋ฅผ ์ง์ ํ๊ณ , ๋ชจ๋ ์ต์
์ ํจ๊ป ๊ณ ๋ คํ๋ ์๋ก์ด ํ๊ฐ ๋ฐฉ์์ ์ ์ํ์ฌ ๋ชจ๋ธ ์ฑ๋ฅ ํ๊ฐ์ ์ ํ์ฑ์ ๋์์ต๋๋ค.
Friends-MMC: A Dataset for Multi-modal Multi-party Conversation Understanding
·1812 words·9 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Dialogue Systems
๐ข Peking University
Friends-MMC: ๋ฐฉ๋ํ ๋น๋์ค ๋ฐ์ดํฐ์ ์ฃผ์์ ํฌํจํ ์๋ก์ด ๋ค์ค ๋ชจ๋ฌ ๋ค์ค ์ฐธ์ฌ ๋ํ ๋ฐ์ดํฐ์
์ ํตํด ์ค์ ์ธ๊ณ์ ๋ํ ์ดํด๋ฅผ ์ํ ์๋ก์ด ๊ฐ๋ฅ์ฑ์ ์ ์ํฉ๋๋ค!