ArXiv Intelligence

GPF-LiveNews: A Streaming Evaluation Protocol for Group-Conditioned Framing in Large Language Models

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Thoughts-as-Planning: Latent World Models for Chain-of-Thoughts Optimization via Reinforcement Planning

Topic · Agent

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

How Consistent Are LLM Agents? Measuring Behavioral Reproducibility in Multi-Step Tool-Calling Pipelines

Topic · Agent

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Specialty-Specific Medical Language Model for Immune-Mediated Diseases

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

SERC: LDPC-Inspired Semantic Error Correction for Retrieval-Augmented Generation

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

No Reader Left Behind: Multi-Agent Summaries Everyone Can Understand

Topic · Agent

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

GenesisFunc: Multi-Agent Data Generation for Accurate and Generalizable Function-Calling

Topic · Agent

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Assessing Dutch Syllabification Algorithms and Improving Accuracy by Combining Phonetic and Orthographic Information through Deep Learning

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Transcribing Children's Speech: ASR Performance and Obtaining Reliable Orthographic Transcriptions

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

A comparative study of transformer-based embeddings for topic coherence

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

S3Mem: Structured Spatiotemporal Scene-Event Memory for Long-Horizon Interactive Question Answering

Topic · 记忆

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Benchmarking Open-Source Safety Guard Models: A Comprehensive Evaluation

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Aryabhata 2: Scaling Reinforcement Learning for Advanced STEM Reasoning

Topic · 强化学习

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

Micro-Macro Retrieval: Reducing Long-Form Hallucination in Large Language Models

Topic · 其他

仅有原始 MD

Quick Read

LLM failed, fallback used

详情问答

2026-05-29 · 354 篇

GPF-LiveNews: A Streaming Evaluation Protocol for Group-Conditioned Framing in Large Language Models

Thoughts-as-Planning: Latent World Models for Chain-of-Thoughts Optimization via Reinforcement Planning

How Consistent Are LLM Agents? Measuring Behavioral Reproducibility in Multi-Step Tool-Calling Pipelines

Specialty-Specific Medical Language Model for Immune-Mediated Diseases

SERC: LDPC-Inspired Semantic Error Correction for Retrieval-Augmented Generation

No Reader Left Behind: Multi-Agent Summaries Everyone Can Understand

GenesisFunc: Multi-Agent Data Generation for Accurate and Generalizable Function-Calling

Assessing Dutch Syllabification Algorithms and Improving Accuracy by Combining Phonetic and Orthographic Information through Deep Learning

Transcribing Children's Speech: ASR Performance and Obtaining Reliable Orthographic Transcriptions

A comparative study of transformer-based embeddings for topic coherence

S3Mem: Structured Spatiotemporal Scene-Event Memory for Long-Horizon Interactive Question Answering

Benchmarking Open-Source Safety Guard Models: A Comprehensive Evaluation

Aryabhata 2: Scaling Reinforcement Learning for Advanced STEM Reasoning

Micro-Macro Retrieval: Reducing Long-Form Hallucination in Large Language Models