image

Bootcamps ilimitados + curso de inglés para sempre

80
%OFF
Article image
Carlos Lima
Carlos Lima18/05/2024 12:24
Compartir

Dados, modelo e performance

    Você mataria um mosquito com um canhão?

    Mamba é uma arquitetura de rede neural baseada em Recurrent Neural Networks (RNNs). Comparada aos transformers, ela é mais ágil, e ambas têm seu foco em Processamento Neural de Linguagem (NLP).

    image

    No dia 13 de Maio, um artigo foi publicado na plataforma Paper with Code discutindo o uso da arquitetura Mamba em Visão Computacional. Esta arquitetura, que até então não havia alcançado resultados satisfatórios em comparação com outras, foi abordada no artigo. Eles introduziram uma biblioteca chamada MambaOut, que remove o principal mecanismo dessa arquitetura, e observaram melhorias nos resultados.

    image

    fonte: paper with code

    MambaOut é uma simplificação do Mamba, pense que antes estávamos tentando matar uma mosca com um canhão (o que realmente não é necessário); o MambaOut remove o canhão para tarefas mais simples, o que permite uma maior eficiência.

    Artigos como estes ressaltam a importância de usar adequadamente os recursos que temos, uma vez que determinam o futuro da inteligência artificial, avançando também pela qualidade dos dados, modelos e desempenho.

    Referências

    Paper with Code

    Demostração - Github

    image

    fonte: autor

    Compartir
    Recomendado para ti
    AWS - Agentes de IA em Campo
    Riachuelo - Criando produtos com IA
    Michael Page - Criando Seu Primeiro Agente de IA
    Comentarios (0)