image

Access unlimited bootcamps and 650+ courses forever

75
%OFF
Article image
Carlos Lima
Carlos Lima18/05/2024 12:24
Share

Dados, modelo e performance

    Você mataria um mosquito com um canhão?

    Mamba é uma arquitetura de rede neural baseada em Recurrent Neural Networks (RNNs). Comparada aos transformers, ela é mais ágil, e ambas têm seu foco em Processamento Neural de Linguagem (NLP).

    image

    No dia 13 de Maio, um artigo foi publicado na plataforma Paper with Code discutindo o uso da arquitetura Mamba em Visão Computacional. Esta arquitetura, que até então não havia alcançado resultados satisfatórios em comparação com outras, foi abordada no artigo. Eles introduziram uma biblioteca chamada MambaOut, que remove o principal mecanismo dessa arquitetura, e observaram melhorias nos resultados.

    image

    fonte: paper with code

    MambaOut é uma simplificação do Mamba, pense que antes estávamos tentando matar uma mosca com um canhão (o que realmente não é necessário); o MambaOut remove o canhão para tarefas mais simples, o que permite uma maior eficiência.

    Artigos como estes ressaltam a importância de usar adequadamente os recursos que temos, uma vez que determinam o futuro da inteligência artificial, avançando também pela qualidade dos dados, modelos e desempenho.

    Referências

    Paper with Code

    Demostração - Github

    image

    fonte: autor

    Share
    Recommended for you
    CAIXA - Inteligência Artificial na Prática
    Binance - Blockchain Developer with Solidity 2025
    Neo4J - Análise de Dados com Grafos
    Comments (0)