image

Acesse bootcamps ilimitados e +650 cursos pra sempre

60
%OFF
Article image
Carlos Lima
Carlos Lima18/05/2024 12:24
Compartilhe

Dados, modelo e performance

    Você mataria um mosquito com um canhão?

    Mamba é uma arquitetura de rede neural baseada em Recurrent Neural Networks (RNNs). Comparada aos transformers, ela é mais ágil, e ambas têm seu foco em Processamento Neural de Linguagem (NLP).

    image

    No dia 13 de Maio, um artigo foi publicado na plataforma Paper with Code discutindo o uso da arquitetura Mamba em Visão Computacional. Esta arquitetura, que até então não havia alcançado resultados satisfatórios em comparação com outras, foi abordada no artigo. Eles introduziram uma biblioteca chamada MambaOut, que remove o principal mecanismo dessa arquitetura, e observaram melhorias nos resultados.

    image

    fonte: paper with code

    MambaOut é uma simplificação do Mamba, pense que antes estávamos tentando matar uma mosca com um canhão (o que realmente não é necessário); o MambaOut remove o canhão para tarefas mais simples, o que permite uma maior eficiência.

    Artigos como estes ressaltam a importância de usar adequadamente os recursos que temos, uma vez que determinam o futuro da inteligência artificial, avançando também pela qualidade dos dados, modelos e desempenho.

    Referências

    Paper with Code

    Demostração - Github

    image

    fonte: autor

    Compartilhe
    Recomendados para você
    BairesDev - Machine Learning Training
    Savegnago - Lógica de Programação
    meutudo - Mobile Developer
    Comentários (0)