Paper Reviews by AI

MapQaTor: A System for Efficient Annotation of Map Query Datasets

30 December 2024·2879 words·14 mins· loading · loading

AI Generated 🤗 Daily Papers Natural Language Processing Question Answering 🏢 Department of Computer Science and Engineering

MAPQATOR: 플러그앤플레이 방식의 지리공간 질의응답 데이터셋 생성 시스템

LTX-Video: Realtime Video Latent Diffusion

30 December 2024·2625 words·13 mins· loading · loading

AI Generated 🤗 Daily Papers Computer Vision Video Understanding 🏢 Lightricks

LTX-Video: 초고속 실시간 고해상도 비디오 생성 모델

HUNYUANPROVER: A Scalable Data Synthesis Framework and Guided Tree Search for Automated Theorem Proving

30 December 2024·1341 words·7 mins· loading · loading

AI Generated 🤗 Daily Papers Natural Language Processing Large Language Models 🏢 Tencent AI Lab

HunyuanProver: 대규모 언어 모델 기반의 확장 가능한 데이터 합성 프레임워크와 안내 트리 탐색을 통해 최첨단 자동 정리 증명 성능 달성!

HumanEval Pro and MBPP Pro: Evaluating Large Language Models on Self-invoking Code Generation

30 December 2024·3353 words·16 mins· loading · loading

AI Generated 🤗 Daily Papers Natural Language Processing Large Language Models 🏢 Tsinghua University

LLM의 점진적 추론 및 문제 해결 능력을 평가하기 위한 새로운 벤치마크 HumanEval Pro, MBPP Pro, BigCodeBench-Lite Pro 제시!

Facilitating large language model Russian adaptation with Learned Embedding Propagation

30 December 2024·1947 words·10 mins· loading · loading

AI Generated 🤗 Daily Papers Natural Language Processing Large Language Models 🏢 Lomonosov Moscow State University

LEP(Learned Embedding Propagation)는 적은 양의 학습 데이터만으로도 다국어 대규모 언어 모델을 효율적으로 적응시키는 새로운 기법입니다.

Efficiently Serving LLM Reasoning Programs with Certaindex

30 December 2024·3238 words·16 mins· loading · loading

AI Generated 🤗 Daily Papers Natural Language Processing Large Language Models 🏢 UC San Diego

Dynasor은 LLM 추론 프로그램의 자원 사용을 최적화하는 시스템으로, certaindex라는 새로운 지표를 활용하여 어려운 질의에는 더 많은 연산을, 간단한 질의에는 적은 연산을 할당하고, 전망이 없는 질의는 조기에 종료함으로써 정확도, 지연 시간 및 비용을 균형 있게 맞춥니다.

Edicho: Consistent Image Editing in the Wild

30 December 2024·2213 words·11 mins· loading · loading

AI Generated 🤗 Daily Papers Computer Vision Image Generation 🏢 Hong Kong University of Science and Technology

Edicho: 이미지 간 일관성 유지하며 제로샷 이미지 편집 가능!

Do NOT Think That Much for 2+3=? On the Overthinking of o1-Like LLMs

30 December 2024·2075 words·10 mins· loading · loading

AI Generated 🤗 Daily Papers Natural Language Processing Large Language Models 🏢 Tencent AI Lab

대규모 언어 모델의 과도한 연산 문제 해결: 효율적인 추론을 위한 새로운 지표 및 자기 학습 전략 제시

Are Vision-Language Models Truly Understanding Multi-vision Sensor?

30 December 2024·3155 words·15 mins· loading · loading

AI Generated 🤗 Daily Papers Multimodal Learning Vision-Language Models 🏢 Integrated Vision Language Lab, KAIST

멀티 비전 센서 데이터에 대한 VLMs의 이해도 향상을 위한 새로운 벤치마크(MS-PR)와 DNA 최적화 기법 제시

Bringing Objects to Life: 4D generation from 3D objects

29 December 2024·2224 words·11 mins· loading · loading

AI Generated 🤗 Daily Papers Computer Vision Image Generation 🏢 NVIDIA

3to4D: 텍스트 프롬프트로 사용자 제공 3D 객체를 실감나게 애니메이션화!

OneKE: A Dockerized Schema-Guided LLM Agent-based Knowledge Extraction System

28 December 2024·304 words·2 mins· loading · loading

AI Generated 🤗 Daily Papers Natural Language Processing Information Extraction 🏢 Zhejiang University

OneKE: 도커 기반, 다중 에이전트 LLM 지식 추출 시스템으로 웹, PDF에서 다양한 도메인 지식 추출 가능

On the Compositional Generalization of Multimodal LLMs for Medical Imaging

28 December 2024·4972 words·24 mins· loading · loading

AI Generated 🤗 Daily Papers Computer Vision Visual Question Answering 🏢 Chinese University of Hong Kong, Shenzhen

의료 영상에 대한 다중 모드 거대 언어 모델의 일반화 능력 향상에 구성적 일반화(CG)가 핵심 역할을 수행하며, 제한된 데이터에서도 효과적임을 밝힘.

Xmodel-2 Technical Report

27 December 2024·2136 words·11 mins· loading · loading

AI Generated 🤗 Daily Papers Natural Language Processing Large Language Models 🏢 Xiaoduo AI Lab

Xmodel-2: 12억 매개변수의 추론 전문 대규모 언어 모델로, 효율적인 설계와 훈련 전략을 통해 최첨단 성능 달성!

VideoMaker: Zero-shot Customized Video Generation with the Inherent Force of Video Diffusion Models

27 December 2024·3812 words·18 mins· loading · loading

AI Generated 🤗 Daily Papers Computer Vision Image Generation 🏢 Tencent AI Lab

VideoMaker: 영상 확산 모델의 고유한 힘을 이용한 제로샷 맞춤형 영상 생성

Safeguard Fine-Tuned LLMs Through Pre- and Post-Tuning Model Merging

27 December 2024·177 words·1 min· loading · loading

AI Generated 🤗 Daily Papers Natural Language Processing Large Language Models 🏢 Intel Labs

미세 조정으로 안전성이 저하된 LLM의 성능을 향상시키는 동시에 안전성을 유지하는 간편하고 효과적인 모델 결합 방법 제시!

OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis

27 December 2024·2961 words·14 mins· loading · loading

AI Generated 🤗 Daily Papers Multimodal Learning Vision-Language Models 🏢 Hong Kong University of Science and Technology

OS-Genesis는 역방향 작업 합성을 통해 GUI 에이전트 궤적 생성 자동화 문제를 해결하는 혁신적인 파이프라인입니다.

From Elements to Design: A Layered Approach for Automatic Graphic Design Composition

27 December 2024·2870 words·14 mins· loading · loading

AI Generated 🤗 Daily Papers Multimodal Learning Vision-Language Models 🏢 Xi'an Jiaotong University

LaDeCo: 계층적 접근 방식을 사용한 자동 그래픽 디자인 합성

Task Preference Optimization: Improving Multimodal Large Language Models with Vision Task Alignment

26 December 2024·3029 words·15 mins· loading · loading

AI Generated 🤗 Daily Papers Multimodal Learning Vision-Language Models 🏢 Shanghai AI Laboratory

시각적 과제 정렬을 통한 작업 선호도 최적화(TPO)로 멀티모달 대규모 언어 모델의 성능을 획기적으로 향상시켰습니다.

Video-Panda: Parameter-efficient Alignment for Encoder-free Video-Language Models

24 December 2024·3101 words·15 mins· loading · loading

AI Generated 🤗 Daily Papers Multimodal Learning Vision-Language Models 🏢 University of Bonn

Video-Panda: 초경량 인코더 없는 비디오-언어 모델로, 계산 비용을 획기적으로 줄이면서 최첨단 성능을 달성!

Token-Budget-Aware LLM Reasoning

24 December 2024·2417 words·12 mins· loading · loading

AI Generated 🤗 Daily Papers Natural Language Processing Large Language Models 🏢 Nanjing University

토큰 예산 인식 LLM 추론 프레임워크(TALE)를 통해 LLM 추론의 토큰 비용을 크게 줄이면서 성능 저하를 최소화했습니다!