arxiv.org 20/01/2026 MD Sandbox

[2511.18538] From Code Foundation Models to Agents and Applications: A Comprehensive Survey and Practical Guide to Code Intelligence

Coding AI Tecnologia LLM

Conteudo

TLDR;

  1. Quais modelos de linguagem são abordados no artigo?
    O artigo analisa LLMs gerais como GPT-4, Claude e LLaMA, além de modelos especializados em código como StarCoder, Code LLaMA, DeepSeek-Coder e QwenCoder.

  2. Que aspectos do ciclo de vida dos modelos de código são explorados?
    O survey cobre desde a curadoria de dados e pré-treinamento até o fine-tuning supervisionado e o aprendizado por reforço, incluindo o desenvolvimento de agentes autônomos.

  3. Qual a principal contribuição do trabalho em relação à aplicação prática dos modelos de código?
    O trabalho destaca a lacuna entre a pesquisa acadêmica e as aplicações reais, propondo direções futuras e realizando experimentos práticos que sintetizam experiências em modelos de código.

Conclusoes

[Variável $PROMPT não encontrada]{"Quais as principais conclusoes e contribuicoes?"}

Formato de saida (IMPORTANTE - siga exatamente):
Escreva APENAS as 3 respostas, sem as perguntas, no formato:
[resposta 1]. [resposta 2]. [resposta 3]

NAO inclua as perguntas na saida, apenas as respostas em italico separadas por ponto. NAO comece as respostas com SIM ou NÃO. Va direto ao ponto.
}

Abstract

O estudo apresenta uma metodologia abrangente que abrange diferentes etapas do ciclo de vida dos grandes modelos de linguagem (LLMs) voltados para código, envolvendo desde curadoria de dados até a implementação de agentes autônomos. Inicialmente, a pesquisa examina o processo de pré-treinamento, onde dados são coletados e organizados, seguido por fine-tuning supervisionado e aprendizado por reforço, buscando aperfeiçoar o desempenho dos modelos. Através de experimentos rigorosos, os autores investigam leis de escala, decisões sobre frameworks e a sensibilidade a hiperparâmetros, o que fornece insights sobre a eficácia das diferentes abordagens. Além disso, a metodologia avalia tanto LLMs gerais, como GPT-4 e Claude, quanto modelos especializados em código, como StarCoder e Code LLaMA. A pesquisa também foca na identificação de lacunas entre a pesquisa acadêmica e suas aplicações práticas, abordando questões como correção de código e segurança. Com isso, o estudo não apenas compila dados sobre o estado atual da tecnologia, mas também propõe direções futuras para o desenvolvimento de inteligência em código, servindo como um guia prático para profissionais e pesquisadores na área. Essa abordagem metódica fornece uma sólida base para a análise e evolução do uso de LLMs no desenvolvimento de software.

Conclusoes

[Variável $PROMPT não encontrada]{"Quais as principais conclusoes e contribuicoes?"}
}

Metodologia

[Variável $PROMPT não encontrada]{"Resuma a metodologia utilizada no estudo"}

Conclusoes

[Variável $PROMPT não encontrada]{"Quais as principais conclusoes e contribuicoes?"}