image

Acesso vitalício ao Atalho Secreto + bootcamps ilimitados

86
%OFF
Article image
Olímpio Meirelles
Olímpio Meirelles13/11/2025 19:47
Compartilhe
Microsoft Certification Challenge #5 - DP 100Recomendados para vocêMicrosoft Certification Challenge #5 - DP 100

IA Generativa não precisa ser "generalista": Princípios de Prompt em um case real para o Audiovisual

  • #IA Generativa

O Desafio de 'Mostrar, Não Apenas Dizer'

O boom da Inteligência Artificial Generativa fez muitas ferramentas prometerem criar "qualquer coisa". Em meio a essa euforia, muitos profissionais utilizam a IA de forma genérica.

___________________________________________________________________________________________________________________________________________________

No entanto, o verdadeiro valor da GenAI não está em ser generalista. Ele reside na sua capacidade de ser específica, direcionada e especializada. O segredo está na Engenharia de Prompt. Essa é a tese que me motivou a ir além de apenas obter um certificado.
Profissionais de Comunicação, Marketing e Vendas precisam de soluções robustas, e o público de TI busca a excelência técnica. A Engenharia de Prompt é a ponte que transforma uma ideia criativa em um comando técnico.

___________________________________________________________________________________________________________________________________________________

Para provar isso, decidi usar a conclusão do meu bootcamp, "Fundamentos de IA Generativa", para criar um estudo de caso.

O resultado? Um vídeo de 16 segundos que, por si só, demonstraria a habilidade de traduzir a criatividade humana em resultados visuais impecáveis.

image

O Princípio I: Especificidade e o Conceito de 'Asset Control'

Se a IA não é generalista, o prompt também não pode ser. O erro mais comum é começar com um prompt vago, como: "Crie um vídeo sobre um curso". Isso resulta em algo imprevisível.

A solução? Desmembrar a ideia em partes:

  • Personagem
  • Cenário
  • Ação
  • Áudio

A Engenharia de Prompt ensina a construir um protótipo de IA, alimentando-a com Assets Visuais de referência para garantir que ela não "alucine" o resultado.

image

Princípio II: A Lição de Iteração no Processo de Refino

Mesmo com assets visuais e descrições detalhadas, a IA Generativa ainda pode falhar na interpretação de nuances. É aqui que o Engenheiro de Prompt se diferencia do usuário casual.

O nosso desafio no projeto audiovisual foi o caimento da camisa.

A instrução inicial era simples, mas o modelo de imagem insistia em colocar a camisa para dentro da calça, ignorando o estilo mais jovem e descontraído que buscávamos.

image

Evoluindo a Comunicação com a IA

Para resolver esse problema, o prompt teve que evoluir de uma descrição simples para um comando altamente específico, com instruções de restrição e de caimento:

  • O prompt evoluiu para: ...shirt untucked and flowing naturally outside dark black dress pants, covering the belt area...
  • A IA precisou ser forçada a entender a ação (untucked, ou "para fora da calça") e a função (covering the belt area, ou "cobrindo a área do cinto").

O Aprendizado:

A Engenharia de Prompt exige paciência e a capacidade de identificar exatamente onde a IA falhou. O sucesso não está no primeiro comando, mas sim no refinamento constante e na adaptação da linguagem até que a máquina compreenda a nossa visão humana.

A iteração é o coração da Engenharia de Prompt.

Princípio III: Engenharia de Continuidade (O Storyboard Multimodal)

O meu projeto não era um único prompt, mas sim uma sequência de quatro takes, todos interligados.
Isto introduz o desafio da continuidade visual.

Como garantir que a cor da parede, o posicionamento da mesa e, principalmente, os logos de branding se mantivessem idênticos do Take 1 ao Take 4?


A resposta está no conceito de Storytelling Multimodal.

O prompt de texto puro falharia aqui, pois a IA poderia "alucinar" diferentes tons de bordô ou trocar a logo do notebook a cada geração.

O Caso das Logos e o Poder da Imagem
Os maiores riscos de inconsistência eram as logos: a logo da DIO no notebook e o emblema do curso no portal de liquid glass.

Para resolver isso, usamos o princípio da Restrição Multimodal: em vez de apenas descrever a logo, instruímos a IA a replicar fielmente o que já estava na imagem de referência da cena.

image

A Instrução Final no Prompt

A chave de sucesso foi adicionar comandos explícitos como: "O notebook na mesa deve exibir o logo colorido 'dio' contra um fundo preto, exatamente como visto na imagem de referência cena_X.jpg."

Isso forçou a IA a priorizar o Asset Visual (a imagem) sobre sua própria capacidade criativa.

A Engenharia de Continuidade transforma um conjunto de vídeos desconexos em uma produção coesa e confiável.

A IA como Ponte entre Áreas

A prova final do sucesso deste projeto não veio de um código ou de um prompt perfeito, mas sim da reação humana.

O vídeo gerou um engajamento surpreendente de públicos que raramente se misturam no LinkedIn: programadores, desenvolvedores, Scrum Masters, e profissionais de Marketing e Comunicação.

Por quê? Porque a Engenharia de Prompt se provou ser a linguagem universal.

Não importa se sua área é código ou storytelling. O domínio da técnica de comunicação com a IA é o que estreita a distância entre os setores e gera soluções de alto impacto para qualquer desafio.

O futuro da inovação em todas as áreas está nas mãos de quem sabe dialogar com a Inteligência Artificial Generativa.

link para o vídeo completo: https://www.linkedin.com/feed/update/urn:li:activity:7393626563734306816/
Convido a todos da comunidade da DIO a se conectar comigo no LinkedIn. A experiência em compartilhar conteúdos com tantos talentos da área de TI é algo inriquecedor para mim, que vem da área de Marketing/Audiovisual.
Compartilhe
Recomendados para você
Microsoft Certification Challenge #5 - AZ-204
Microsoft Certification Challenge #5 - DP 100
Klabin - Excel e Power BI Dashboards 2026
Comentários (2)
Olímpio Meirelles
Olímpio Meirelles - 18/11/2025 14:07

Com certeza o maior desafio é ser autêntico e integrar a ética. Para o desenvolvedor, isso se resume a um grande dilema de balanceamento. O desafio é garantir que a Ética e a Privacidade não sejam uma barreira rígida ('podar a inovação'), mas sim uma parte fluida do processo de desenvolvimento.

Podemos ver isso através da nossa 'Porta de Vidro Líquido':

  • O Vidro (Ética/Privacidade): Exige Transparência (Explicabilidade, Explainability) e Responsabilidade. A camada de código não pode ser uma 'caixa-preta'; precisa ser auditável.
  • O Líquido (Inovação/Eficiência): Permite que o desenvolvimento flua (eficiência) e que a inovação continue, tratando a ética como um guia de design contínuo, e não um checklist de última hora.

A chave é começar a implementar esses princípios desde o fine-tuning inicial, garantindo que o propósito do produto se mantenha, enquanto minimizamos ativamente os vieses (bias) e protegemos os dados, transformando o desafio em uma oportunidade para inovar de forma sustentável.

DIO Community
DIO Community - 17/11/2025 17:25

Excelente, Olímpio! Que artigo cirúrgico, inspirador e de altíssimo valor estratégico! Você tocou no ponto crucial da Engenharia de Prompt Multimodal: a IA Generativa não é generalista, mas deve ser específica e direcionada para garantir a continuidade visual e o controle de assets em um projeto audiovisual.

É fascinante ver como você aborda o tema, mostrando que a Engenharia de Prompt é a ponte que traduz a criatividade humana (a visão do vídeo) em um comando técnico preciso para o Veo 3.1 Flash.

Qual você diria que é o maior desafio para um desenvolvedor ao implementar os princípios de IA responsável em um projeto, em termos de balancear a inovação e a eficiência com a ética e a privacidade, em vez de apenas focar em funcionalidades?

Recomendados para vocêMicrosoft Certification Challenge #5 - DP 100