Explorando ML com notebooks no Vertex AI.
Explorando ML com notebooks no Vertex AI
Este artigo aborda de forma introdutória os ambientes baseados em notebooks Jupyter da GCP: Vertex AI. Trata-se de uma introdução a essa plataforma unificada para todo o fluxo de trabalho de aprendizado de máquina.
O fluxo de trabalho de aprendizado de máquina tem três fases principais: preparação de dados, treinamento de modelo e serviço de modelo. Na preparação de dados, você coleta dados com base no negócio cujo a solução de ML deseja atender e os prepara para entrada em um modelo de aprendizado de máquina. No treinamento de modelo, você usa os dados coletados para informar previsões. E depois que o modelo for treinado e avaliado, o próximo passo é implantar ou servir esse modelo em um ambiente de produção - serviços da nuvem GCP, por exemplo - para que ele possa ser usado em previsões do mundo real ou auxiliar tomadores de decisão. Evidentemente, o fluxo de grandes projetos de aprendizado de máquina é bem mais complexo do que isso. Entretanto, dentro da GCP existem basicamente três ferramentas que podem auxiliar na implementação e nesse fluxo de trabalho: 1. usando o Automated Machine Learning (AutoML) é possível implementar o fluxo de trabalho sem escrever uma única linha de código; 2. usando BigQuery Machine Learning (BQML) é possível usar SQL para implementar as fases de treinamento e exibição do modelo; 3. usando o treinamento personalizado através de uma linguagem de programação como Python, biblioteca de código aberto criada como o TensorFlow. Uma das ferramentas utilizadas para escrever código em projetos de ciência de dados são os notebooks Jupyter, que são ambientes de computação interativos que permitem aos usuários criar e compartilhar documentos que contêm código ao vivo, equações, visualizações e texto narrativo, de modo que sua interatividade permitem que o usuário execute o código e veja os resultados imediatamente. Isso é importante porque ciência e análise de dados comumente incorporam em seus fluxos tentativas e erros como parte dos processos de IA.
O Google Vertex AI oferece computação totalmente gerenciada, escalável e pronta para empresas, oferecendo uma infraestrutura completa, com políticas e gerenciamento de usuários facilmente aplicáveis, integrações visuais baseadas no Jupyter, sendo que essa integração está na ponta dos dedos, o que significa que você pode carregar e compartilhar notebooks junto com suas tarefas de IA e dados. São duas as soluções de notebook: Colab Enterprise e Workbench.




