Dados, modelo e performance
Você mataria um mosquito com um canhão?
Mamba é uma arquitetura de rede neural baseada em Recurrent Neural Networks (RNNs). Comparada aos transformers, ela é mais ágil, e ambas têm seu foco em Processamento Neural de Linguagem (NLP).
No dia 13 de Maio, um artigo foi publicado na plataforma Paper with Code discutindo o uso da arquitetura Mamba em Visão Computacional. Esta arquitetura, que até então não havia alcançado resultados satisfatórios em comparação com outras, foi abordada no artigo. Eles introduziram uma biblioteca chamada MambaOut, que remove o principal mecanismo dessa arquitetura, e observaram melhorias nos resultados.
fonte: paper with code
MambaOut é uma simplificação do Mamba, pense que antes estávamos tentando matar uma mosca com um canhão (o que realmente não é necessário); o MambaOut remove o canhão para tarefas mais simples, o que permite uma maior eficiência.
Artigos como estes ressaltam a importância de usar adequadamente os recursos que temos, uma vez que determinam o futuro da inteligência artificial, avançando também pela qualidade dos dados, modelos e desempenho.
Referências
fonte: autor