Natural Language Processing
Do NOT Think That Much for 2+3=? On the Overthinking of o1-Like LLMs
·2075 words·10 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Large Language Models
๐ข Tencent AI Lab
๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ๊ณผ๋ํ ์ฐ์ฐ ๋ฌธ์ ํด๊ฒฐ: ํจ์จ์ ์ธ ์ถ๋ก ์ ์ํ ์๋ก์ด ์งํ ๋ฐ ์๊ธฐ ํ์ต ์ ๋ต ์ ์
OneKE: A Dockerized Schema-Guided LLM Agent-based Knowledge Extraction System
·304 words·2 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Information Extraction
๐ข Zhejiang University
OneKE: ๋์ปค ๊ธฐ๋ฐ, ๋ค์ค ์์ด์ ํธ LLM ์ง์ ์ถ์ถ ์์คํ
์ผ๋ก ์น, PDF์์ ๋ค์ํ ๋๋ฉ์ธ ์ง์ ์ถ์ถ ๊ฐ๋ฅ
Xmodel-2 Technical Report
·2136 words·11 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Large Language Models
๐ข Xiaoduo AI Lab
Xmodel-2: 12์ต ๋งค๊ฐ๋ณ์์ ์ถ๋ก ์ ๋ฌธ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ๋ก, ํจ์จ์ ์ธ ์ค๊ณ์ ํ๋ จ ์ ๋ต์ ํตํด ์ต์ฒจ๋จ ์ฑ๋ฅ ๋ฌ์ฑ!
Safeguard Fine-Tuned LLMs Through Pre- and Post-Tuning Model Merging
·177 words·1 min·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Large Language Models
๐ข Intel Labs
๋ฏธ์ธ ์กฐ์ ์ผ๋ก ์์ ์ฑ์ด ์ ํ๋ LLM์ ์ฑ๋ฅ์ ํฅ์์ํค๋ ๋์์ ์์ ์ฑ์ ์ ์งํ๋ ๊ฐํธํ๊ณ ํจ๊ณผ์ ์ธ ๋ชจ๋ธ ๊ฒฐํฉ ๋ฐฉ๋ฒ ์ ์!
Token-Budget-Aware LLM Reasoning
·2417 words·12 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Large Language Models
๐ข Nanjing University
ํ ํฐ ์์ฐ ์ธ์ LLM ์ถ๋ก ํ๋ ์์ํฌ(TALE)๋ฅผ ํตํด LLM ์ถ๋ก ์ ํ ํฐ ๋น์ฉ์ ํฌ๊ฒ ์ค์ด๋ฉด์ ์ฑ๋ฅ ์ ํ๋ฅผ ์ต์ํํ์ต๋๋ค!
How "Real" is Your Real-Time Simultaneous Speech-to-Text Translation System?
·1013 words·5 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Machine Translation
๐ข Fondazione Bruno Kessler
์ค์๊ฐ ๋์ ํต์ญ ์์คํ
์ ํ์ค์ ์ธ ํ๊ณ๋ฅผ ๊ท๋ช
ํ๊ณ , ํ์คํ๋ ์ฉ์ด์ ์ฒด๊ณ๋ฅผ ์ ์ํ์ฌ ์ฐ๊ตฌ ๋ฐ์ ์ ์ด์งํ๋ ๋
ผ๋ฌธ.
CypherBench: Towards Precise Retrieval over Full-scale Modern Knowledge Graphs in the LLM Era
·2988 words·15 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Question Answering
๐ข Megagon Labs
๋ณธ ์ฐ๊ตฌ๋ ๋๊ท๋ชจ ํ๋ ์ง์ ๊ทธ๋ํ์์ LLM์ ์ด์ฉํ ์ ํํ ์ ๋ณด ๊ฒ์์ ์ํ ์๋ก์ด ๋ฒค์น๋งํฌ์ธ CypherBench๋ฅผ ์ ์ํฉ๋๋ค. ๊ธฐ์กด์ RDF ๊ธฐ๋ฐ ์ง์ ๊ทธ๋ํ๋ ๊ณผ๋ํ๊ฒ ํฐ ์คํค๋ง์ ๋ฆฌ์์ค ์๋ณ์ ์ฌ์ฉ์ผ๋ก LLM์ ๋นํจ์จ์ ์ด๋ผ๋ ๋ฌธ์ ์ ์ ๋ถ์ํฉ๋๋ค. ํนํ, Wikidata์ ๊ฐ์ ํ๋ ์ง์ ๊ทธ๋ํ๋ LLM์ ๋ฌธ๋งฅ ์ฐฝ ํฌ๊ธฐ๋ฅผ ์ด๊ณผํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋…
YuLan-Mini: An Open Data-efficient Language Model
·3531 words·17 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Large Language Models
๐ข Renmin University of China
YuLan-Mini: 24์ต ๊ฐ ๋งค๊ฐ๋ณ์๋ฅผ ๊ฐ์ง ๋ฐ์ดํฐ ํจ์จ์ ์ธ ๊ฐ๋ฐฉํ LLM
WavePulse: Real-time Content Analytics of Radio Livestreams
·2678 words·13 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Information Extraction
๐ข New York University
WavePulse: ์ค์๊ฐ ๋ผ๋์ค ๋ฐฉ์ก ์ฝํ
์ธ ๋ถ์ ํ๋ ์์ํฌ๊ฐ ์ ์น์ ๋ด๋ก , ๋ฏธ๋์ด ์ ํต, ์ฌ๋ก ๋ํฅ์ ์ค์๊ฐ ๋ถ์ํ์ฌ ์ ์น ๊ณผํ ๋ฐ ๋ฏธ๋์ด ์ฐ๊ตฌ์ ์๋ก์ด ๊ฐ๋ฅ์ฑ์ ์ด์์ต๋๋ค.
SBS Figures: Pre-training Figure QA from Stage-by-Stage Synthesized Images
·2234 words·11 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Question Answering
๐ข Kyoto University
SBS Figures: 100๋ง ๊ฐ์ ํฉ์ฑ ์ด๋ฏธ์ง์ QA ์์ผ๋ก ์ฌ์ ํ์ต๋, ํจ์จ์ ์ธ Figure QA ๋ชจ๋ธ!
ResearchTown: Simulator of Human Research Community
·16894 words·80 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Large Language Models
๐ข University of Illinois Urbana-Champaign
RESEARCHTOWN: LLM ๊ธฐ๋ฐ ์ธ๊ฐ ์ฐ๊ตฌ ๊ณต๋์ฒด ์๋ฎฌ๋ ์ดํฐ๋ก, ๋ค์ํ ์ฐ๊ตฌ ํ๋์ ํ์ค์ ์ผ๋ก ๋ชจ๋ฐฉํ๋ฉฐ ํ์ ๊ฐ ์ฐ๊ตฌ ์์ด๋์ด ์์ฑ ๊ฐ๋ฅ
In Case You Missed It: ARC 'Challenge' Is Not That Challenging
·2275 words·11 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Large Language Models
๐ข Snowflake AI Research
๊ธฐ์กด ๋ค์ค ์ ํ ๋ฌธ์ ํ๊ฐ ๋ฐฉ์์ ์ค๋ฅ๋ฅผ ์ง์ ํ๊ณ , ๋ชจ๋ ์ต์
์ ํจ๊ป ๊ณ ๋ คํ๋ ์๋ก์ด ํ๊ฐ ๋ฐฉ์์ ์ ์ํ์ฌ ๋ชจ๋ธ ์ฑ๋ฅ ํ๊ฐ์ ์ ํ์ฑ์ ๋์์ต๋๋ค.
Friends-MMC: A Dataset for Multi-modal Multi-party Conversation Understanding
·1812 words·9 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Dialogue Systems
๐ข Peking University
Friends-MMC: ๋ฐฉ๋ํ ๋น๋์ค ๋ฐ์ดํฐ์ ์ฃผ์์ ํฌํจํ ์๋ก์ด ๋ค์ค ๋ชจ๋ฌ ๋ค์ค ์ฐธ์ฌ ๋ํ ๋ฐ์ดํฐ์
์ ํตํด ์ค์ ์ธ๊ณ์ ๋ํ ์ดํด๋ฅผ ์ํ ์๋ก์ด ๊ฐ๋ฅ์ฑ์ ์ ์ํฉ๋๋ค!
Fourier Position Embedding: Enhancing Attention's Periodic Extension for Length Generalization
·1717 words·9 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Large Language Models
๐ข Tsinghua University
FoPE: ์ฃผํ์ ์์ญ ํน์ง ๊ฐ์ ์ผ๋ก ๊ธด ๋ฌธ๋งฅ ๊ธธ์ด ์ผ๋ฐํ ๋ฌ์ฑ!
DRT-o1: Optimized Deep Reasoning Translation via Long Chain-of-Thought
·366 words·2 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Machine Translation
๐ข Tencent AI Lab
DRT-01 ๋ชจ๋ธ์ ์ฅ๋ฌธ์ ์ฌ๊ณ ๊ณผ์ ์ ํ์ฉํ์ฌ ๋ฌธํ ๋ฒ์ญ์ ์ ํ๋์ ์ ์ฐฝ์ฑ์ ํฌ๊ฒ ํฅ์์์ผฐ์ต๋๋ค.
Diving into Self-Evolving Training for Multimodal Reasoning
·2584 words·13 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Large Language Models
๐ข Hong Kong University of Science and Technology
M-STAR: ๋ค๋ชจ๋ฌ ์ถ๋ก ์ ์ํ ์๊ธฐ ์งํ ํ๋ จ์ ์๋ก์ด ํ๋ ์์ํฌ๋ฅผ ์ ์!
Deliberation in Latent Space via Differentiable Cache Augmentation
·2751 words·13 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Large Language Models
๐ข Google DeepMind
๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ์ถ๋ก ์ฑ๋ฅ์ ํฅ์์ํค๋ ์๋ก์ด ๋ฐฉ๋ฒ์ธ โ์ฐจ๋ณ ๊ฐ๋ฅํ ์บ์ ์ฆ๊ฐโ ๊ธฐ๋ฒ ์ ์!
B-STaR: Monitoring and Balancing Exploration and Exploitation in Self-Taught Reasoners
·1797 words·9 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Large Language Models
๐ข Hong Kong University of Science and Technology
B-STAR: ์๊ธฐ ํ์ต ์ถ๋ก ์์์ ํ์๊ณผ ํ์ฉ์ ๊ท ํ์ ๋ชจ๋ํฐ๋งํ๊ณ ์กฐ์ ํ์ฌ ์ฑ๋ฅ์ ํฅ์์ํค๋ ์๋ก์ด ํ๋ ์์ํฌ
Revisiting In-Context Learning with Long Context Language Models
·3818 words·18 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Large Language Models
๐ข Google DeepMind
์ฅ๋ฌธ ์ปจํ
์คํธ ์ธ์ด ๋ชจ๋ธ์์ ์ ๊ตํ ์ํ ์ ํ ์ ๋ต๋ณด๋ค ๋ฌด์์ ์ํ๋ง์ด ICL ์ฑ๋ฅ ํฅ์์ ๋ ํจ๊ณผ์ ์ด๋ฉฐ, ๋ฐ์ดํฐ ์ฆ๊ฐ์ ํตํด ์ ์์ ์์
์ฑ๋ฅ์ 5% ํฅ์์์ผฐ๋ค๋ ๋๋ผ์ด ์ฐ๊ตฌ ๊ฒฐ๊ณผ๋ฅผ ๋ฐํ!
OpenRFT: Adapting Reasoning Foundation Model for Domain-specific Tasks with Reinforcement Fine-Tuning
·1880 words·9 mins·
loading
·
loading
AI Generated
๐ค Daily Papers
Natural Language Processing
Large Language Models
๐ข Beijing Jiaotong University
OpenRFT๋ ์ ํ๋ ๋๋ฉ์ธ ํน์ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ์ผ๋ฐ์ ์ธ ์ถ๋ก ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ ํ๋ ์๋ก์ด ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค.