O Coral Protocol supera a Microsoft em 34% com a melhor Referência GAIA para Mini-Modelo de IA

Em Resumo

O sistema multi-agente do Coral Protocol superou o Magnetic-UI apoiado pela Microsoft em 34% no GAIA Benchmark, demonstrando que a orquestração inteligente de modelos menores pode rivalizar ou superar abordagens tradicionais de IA em grande escala.

O Coral Protocol Estabelece Um Novo Referencial Para Sistemas Mini-Agent AI, Superando A Microsoft Em 34% No Teste GAIA

Infraestrutura descentralizada para IA colaborativa, o Coral Protocol relatou que seu sistema multiagente superou o Magnetic-UI apoiado pela Microsoft em 34% no GAIA Benchmark—um resultado sem precedentes que sugere que a escalabilidade horizontal pode oferecer uma abordagem mais eficaz do que a expansão dos parâmetros do modelo. O sistema do protocolo aproveita a orquestração inteligente entre múltiplos agentes, em vez de se concentrar apenas no aumento do tamanho do modelo.

Este desempenho marcou a maior pontuação verificada no GAIA Benchmark utilizando mini agentes, apoiando a premissa da NVIDIA de que modelos menores bem coordenados poderiam desempenhar um papel crucial no futuro da IA. O resultado, segundo os desenvolvedores da Coral, reflete uma mudança conceptual na abordagem da escalabilidade da IA, em vez de um mero aumento no poder do sistema.

Como um protocolo aberto, o Coral facilita a expansão das capacidades de IA ao permitir a coordenação entre agentes especializados globalmente, em vez de depender de modelos gerais centralizados. Sua arquitetura permite a interação paralela e segura entre agentes, melhorando a funcionalidade dos modelos de linguagem de todos os tamanhos em tarefas que requerem raciocínio avançado, planejamento e resolução de problemas.

“Este avanço marca um ponto de viragem na infraestrutura de IA,” disse Caelum Forder, CTO da Coral, em um comunicado escrito. “É prova de que a escalabilidade horizontal não é apenas possível—é prática, e a Coral é a forma mais eficaz de o fazer. A Internet dos Agentes é agora uma realidade em funcionamento. Se você é um desenvolvedor de agentes, basta Coralise. Se você é um desenvolvedor de aplicações, construa melhor por menos usando a nossa infraestrutura,” acrescentou.

Coral Tops GAIA Benchmark, Valida o Poder de Modelos Pequenos em Sistemas Agenticos Avançados

Num cenário de crescente concorrência para desenvolver sistemas agentes avançados, grande parte do foco tem permanecido em escalar modelos para gerenciar a crescente complexidade das tarefas. O desempenho recente do Coral desafia essa abordagem predominante, alinhando-se com as descobertas de um estudo recente da NVIDIA que sugere que sistemas menores podem oferecer alto desempenho sem comprometer velocidade, segurança ou eficiência. O GAIA Benchmark, um conjunto de avaliações abrangente para IA avançada, foi projetado para avaliar quão bem os sistemas lidam com tarefas do mundo real que normalmente exigiriam tempo e habilidades substanciais de especialistas humanos. Composto por 450 prompts complexos que testam capacidades de pesquisa, análise e raciocínio, o benchmark serve como uma métrica chave da indústria para avaliar a eficácia de modelos de linguagem de propósito geral (LLM) agentes.

O Sistema de Agentes GAIA da Coral, utilizado no teste de referência, é baseado no Protocolo Coral e inspira-se nos princípios de design do OWL da CAMEL. Incorpora agentes especializados para realizar uma variedade de tarefas, incluindo pesquisa, análise, crítica, planejamento e navegação na web, todas as quais se comunicam através da infraestrutura de servidor MCP da Coral.

Liderar o ranking GAIA Benchmark para modelos menores indica o potencial do Coral para estender a funcionalidade dos sistemas de IA através de uma estrutura baseada em gráficos. Este resultado sugere que agentes leves e de alto desempenho podem ser criados usando modelos menores—facilitando um manuseio de dados mais amplo, uma integração mais suave no ecossistema e uma comunicação aprimorada entre agentes.

“O papel dos pequenos modelos em sistemas agentes tem sido subestimado até agora, mas as marés estão começando a mudar,” disse Caelum Forder. “Provamos que tais modelos podem escalar além de seus limites conhecidos anteriormente e superar os incumbentes. Estou confiante de que eles têm um papel central a desempenhar no futuro da IA agente,” concluiu.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
0/400
Sem comentários
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)