Muito além da Engenharia de Prompt - A linguagem invisível por trás da engenharia

Quando comecei a aprofundar meus estudos em Engenharia de Inteligência Artificial, percebi que a chamada Engenharia de Prompt era apenas a parte mais visível de um campo muito mais amplo.

Escrever uma boa instrução para um modelo de linguagem é importante, mas construir sistemas inteligentes confiáveis exige compreender como o conhecimento é representado, organizado, interpretado, recuperado e aplicado.

Nesse caminho, comecei a encontrar palavras que pareciam ter vindo de outros campos do conhecimento:

Semiótica, Semântica, Taxonomia, Ontologia, Teleologia, Epistemologia, Pragmática, Engenharia Semiótica, Deriva Semântica e Embeddings.

Para quem vem do desenvolvimento de software, da arquitetura de sistemas ou da engenharia tradicional, esses termos podem parecer excessivamente filosóficos ou acadêmicos. No entanto, quando comecei a relacioná-los, percebi que eles formavam uma sequência lógica.

Cada conceito responde a uma pergunta fundamental:

Como algo passa a representar outra coisa?
O que essa representação significa?
Como organizamos os conceitos?
Como estabelecemos as relações entre eles?
Como sabemos se determinada informação é confiável?
Para qual finalidade o sistema utiliza esse conhecimento?
Como o contexto modifica a interpretação?
Como representamos tudo isso matematicamente?
Como evitamos que os significados mudem silenciosamente ao longo do tempo?

Foi então que compreendi que a Engenharia de Inteligência Artificial não trata apenas de fazer uma máquina produzir respostas. Ela trata de construir sistemas capazes de operar sobre signos, significados, relações, contextos, objetivos e critérios de conhecimento.

Tudo começa com um signo

Antes de falar sobre inteligência, modelos ou agentes, precisamos compreender que seres humanos e sistemas computacionais trabalham com representações.

Uma palavra, um ícone, um som, um valor numérico, uma variável, um símbolo elétrico ou uma mensagem de erro pode representar alguma coisa.

A palavra temperatura, por exemplo, não é a temperatura física. Ela é um signo que representa determinado fenômeno.

Da mesma maneira, o valor:

{
"temperature": 38.5
}

não é o calor existente em um ambiente. É uma representação simbólica desse estado físico.

É nesse ponto que surge a Semiótica.

Semiótica: o estudo dos signos e da produção de sentido

A Semiótica estuda os signos, os sistemas de signos e os processos pelos quais alguma coisa representa outra coisa para alguém ou para algum sistema interpretativo.

Podemos pensar em três elementos básicos:

o signo;
aquilo que ele representa;
a interpretação produzida.

Uma luz vermelha em um painel industrial é um signo. Ela pode representar uma falha, uma emergência, uma parada ou apenas um estado específico de operação.

O problema é que o signo, isoladamente, não garante a interpretação correta.

Em um sistema, a luz vermelha pode significar:

equipamento desligado;
temperatura crítica;
falha de comunicação;
parada de emergência;
manutenção necessária.

Portanto, o signo precisa estar associado a um significado.

É aqui que a Semiótica nos conduz naturalmente à Semântica.

Semântica: o significado atribuído aos signos

A Semântica trata do significado.

Enquanto a Semiótica pergunta como algo funciona como signo, a Semântica pergunta:

O que esse signo significa dentro de determinado sistema?

No desenvolvimento de software, trabalhamos com semântica o tempo inteiro, mesmo quando não usamos essa palavra.

Considere o seguinte código:

int status = 1;

Sintaticamente, sabemos que existe uma variável inteira chamada status recebendo o valor 1.

Entretanto, semanticamente, ainda não sabemos o que isso significa.

O valor 1 poderia indicar:

equipamento ligado;
operação concluída;
presença de erro;
usuário autenticado;
sensor ativo.

Uma implementação mais semanticamente clara seria:

typedef enum {
  SYSTEM_OFF,
  SYSTEM_RUNNING,
  SYSTEM_ERROR
} SystemStatus;

Agora, os símbolos utilizados comunicam melhor o significado pretendido.

Na Engenharia de Inteligência Artificial, a questão semântica se torna ainda mais importante porque os modelos trabalham com linguagem natural, na qual uma mesma palavra pode assumir significados diferentes.

A palavra “banco” pode representar:

uma instituição financeira;
um assento;
um banco de dados;
um banco de capacitores;
um banco de ensaios;
uma margem de rio.

O significado não está apenas na palavra. Ele depende das relações da palavra com outras palavras e com o contexto em que aparece.

Quando começamos a reunir muitos conceitos, precisamos organizá-los. É nesse momento que chegamos à Taxonomia.

Taxonomia: organizando conceitos por categorias

A Taxonomia é uma forma estruturada de classificação.

Seu objetivo é organizar elementos em grupos, categorias e subcategorias segundo determinadas características.

Em um sistema industrial, poderíamos criar uma taxonomia como esta:

Equipamentos
├── Sensores
│   ├── Temperatura
│   ├── Pressão
│   └── Vazão
├── Atuadores
│   ├── Motores
│   ├── Válvulas
│   └── Relés
└── Controladores
  ├── CLPs
  ├── Microcontroladores
  └── Computadores industriais

Essa estrutura ajuda a responder perguntas como:

A qual categoria determinado componente pertence?
Quais elementos compartilham características?
Qual classe é mais genérica?
Qual classe é mais específica?

A Taxonomia é extremamente útil para documentação, busca, classificação de dados, treinamento de modelos, organização de bases de conhecimento e construção de sistemas RAG.

Entretanto, ela possui uma limitação importante: normalmente organiza conceitos principalmente por relações hierárquicas.

Ela consegue expressar que:

Um sensor de temperatura é um tipo de sensor.

Mas não necessariamente expressa, com riqueza suficiente, que:

o sensor mede uma grandeza;
a grandeza possui uma unidade;
a leitura pertence a determinado instante;
o sensor está instalado em um equipamento;
o equipamento faz parte de uma linha de produção;
determinada leitura pode provocar uma ação de controle.

Quando precisamos representar essas relações, avançamos da Taxonomia para a Ontologia.

Ontologia: representando conceitos e suas relações

Na Filosofia, a Ontologia investiga aquilo que existe e quais tipos de entidades compõem a realidade.

Na Ciência da Computação e na Inteligência Artificial, uma ontologia é uma representação explícita de conceitos, propriedades, relações e restrições pertencentes a determinado domínio.

Uma taxonomia poderia afirmar:

Sensor de temperatura → Sensor → Dispositivo

Uma ontologia pode ir além:

Sensor de temperatura
  mede → Temperatura
  está instalado em → Motor
  produz → Leitura
  utiliza unidade → Grau Celsius
  comunica-se por → Modbus

Com uma ontologia, não armazenamos apenas nomes. Representamos relações dotadas de significado.

Podemos modelar, por exemplo:

Motor M1
  possuiSensor → Sensor T1

Sensor T1
  mede → TemperaturaDoMotor

TemperaturaDoMotor
  possuiValor → 92 °C
  possuiLimiteMáximo → 80 °C

A partir dessas relações, um sistema pode inferir que o motor está operando acima do limite permitido.

É por isso que as ontologias aparecem em:

grafos de conhecimento;
web semântica;
sistemas especialistas;
modelos de domínio;
integração de dados;
agentes inteligentes;
sistemas de diagnóstico;
mecanismos de inferência;
arquiteturas RAG mais avançadas.

A Taxonomia organiza o vocabulário. A Ontologia transforma esse vocabulário em uma rede de conhecimento.

Mas ainda surge uma pergunta: quem define que essas relações são verdadeiras?

Essa pergunta nos leva à Epistemologia.

Epistemologia: como o sistema sabe o que afirma saber?

A Epistemologia é o campo que investiga o conhecimento:

O que significa conhecer alguma coisa?
Como o conhecimento é adquirido?
Quais evidências sustentam uma afirmação?
Como diferenciar conhecimento, crença, hipótese e opinião?
Até que ponto uma fonte é confiável?

Na Engenharia de Inteligência Artificial, considero a Epistemologia uma das áreas mais importantes e, ao mesmo tempo, menos discutidas.

Quando um modelo responde a uma pergunta, precisamos perguntar:

De onde veio essa resposta?

Ela pode ter vindo:

dos dados utilizados no treinamento;
do contexto fornecido no prompt;
de um documento recuperado;
de uma ferramenta externa;
de uma API;
de uma inferência;
de uma generalização estatística;
de uma combinação imperfeita dessas fontes.

Essa origem é importante porque uma resposta linguisticamente convincente não é necessariamente uma resposta verdadeira.

Um sistema de IA epistemologicamente mais bem projetado precisa conseguir distinguir:

Fato verificado
Hipótese
Inferência
Estimativa
Opinião
Informação desatualizada
Informação não confirmada

Podemos imaginar uma estrutura como:

{
"claim": "O motor está superaquecendo",
"source": "sensor:T1",
"timestamp": "2026-06-12T10:30:00-03:00",
"confidence": 0.97,
"evidence": {
  "measured_temperature": 92,
  "maximum_temperature": 80
}
}

Aqui não temos apenas uma afirmação. Temos também procedência, evidência, instante da observação e nível de confiança.

Em sistemas agênticos, isso se torna essencial. Um agente não deveria apenas apresentar conclusões; deveria avaliar a qualidade das fontes, os limites de sua informação e o grau de incerteza envolvido.

Entretanto, conhecer alguma coisa ainda não explica o que o sistema deve fazer com esse conhecimento.

Para isso, precisamos da Teleologia.

Teleologia: para qual finalidade o sistema existe?

A Teleologia trata de finalidades, propósitos e objetivos.

Em engenharia, raramente construímos sistemas sem uma finalidade definida. Um controlador, uma API, um agente ou um modelo existe para realizar algum objetivo.

Um sistema pode ter como finalidade:

reduzir o consumo de energia;
manter a temperatura estável;
detectar falhas;
recomendar um produto;
responder perguntas;
organizar documentos;
proteger um equipamento;
auxiliar uma decisão humana.

Em um agente de IA, a teleologia aparece na definição de:

Objetivo
Subobjetivos
Critérios de sucesso
Restrições
Prioridades
Condições de parada

Por exemplo:

Objetivo:
Manter a temperatura do motor abaixo de 80 °C.

Restrições:
Não interromper imediatamente a produção.

Estratégia:
Reduzir a velocidade, aumentar a ventilação e avaliar novamente.

Condição de parada:
Encerrar o processo caso a temperatura ultrapasse 95 °C.

O objetivo fornece direção ao sistema.

Entretanto, objetivos mal definidos podem produzir comportamentos indesejados. Um agente orientado apenas a “reduzir custos” poderia tomar decisões tecnicamente eficientes, mas inseguras, antiéticas ou incompatíveis com as necessidades humanas.

Por isso, a Teleologia precisa estar associada a restrições, valores, políticas e supervisão.

Mas mesmo com objetivo, conhecimento e representação, uma mensagem ainda pode mudar de significado dependendo do contexto.

É aqui que entra a Pragmática.

Pragmática: o significado dentro do contexto de uso

A Pragmática estuda como o contexto, a intenção e a situação de comunicação influenciam a interpretação.

Considere a seguinte frase:

Está quente aqui.

Semanticamente, ela descreve uma condição térmica.

Pragmaticamente, ela também pode significar:

abra a janela;
ligue o ventilador;
reduza o aquecimento;
verifique o ar-condicionado;
estamos diante de uma falha térmica.

O significado pretendido depende do contexto.

Para um chatbot doméstico, a frase pode ser uma solicitação indireta para ligar o ar-condicionado.

Para um agente industrial, pode representar um alerta sobre o ambiente.

Para um sistema de manutenção, pode iniciar uma investigação sobre ventilação, dissipação ou sobrecarga.

Isso explica por que fornecer apenas dados ao modelo muitas vezes não é suficiente. Precisamos fornecer:

contexto;
papel;
intenção;
histórico;
ambiente;
restrições;
público;
momento;
critérios de ação.

A Engenharia de Prompt trabalha intensamente com a Pragmática, ainda que nem sempre utilize esse nome.

Quando escrevemos:

Atue como um engenheiro eletrônico.
Analise a falha considerando segurança, custo e facilidade de manutenção.
Não recomende a substituição do equipamento antes de verificar os sensores.

não estamos apenas adicionando palavras ao prompt. Estamos construindo um contexto pragmático para orientar a interpretação e a resposta.

Isso nos aproxima da Engenharia Semiótica.

Engenharia Semiótica: projetando a comunicação entre pessoas e sistemas

A Engenharia Semiótica estuda sistemas computacionais como meios de comunicação entre seus projetistas e seus usuários.

Quando desenvolvemos uma interface, uma mensagem de erro, um fluxo conversacional ou um agente, estamos comunicando ao usuário:

o que o sistema pode fazer;
como ele deve ser utilizado;
quais informações são necessárias;
quais limites existem;
o que determinada resposta significa;
o que o usuário deve fazer em seguida.

Considere estas duas mensagens:

Erro 503.

O serviço de monitoramento está temporariamente indisponível.
Os dados coletados foram preservados.
Uma nova tentativa será realizada automaticamente em 30 segundos.

As duas mensagens podem estar relacionadas ao mesmo evento técnico, mas comunicam experiências completamente diferentes.

A segunda reduz a incerteza e orienta a ação do usuário.

Em sistemas de IA, a Engenharia Semiótica ajuda a projetar:

mensagens compreensíveis;
explicações sobre decisões;
indicação de incerteza;
confirmação antes de ações críticas;
distinção entre sugestão e execução;
apresentação das fontes utilizadas;
sinalização dos limites do agente.

Um agente não deve apenas funcionar. Ele precisa comunicar corretamente como funciona, o que compreendeu e o que pretende fazer.

Até aqui, construímos uma sequência:

Semiótica
  ↓
Signos e representação

Semântica
  ↓
Significados

Taxonomia
  ↓
Categorias

Ontologia
  ↓
Relações entre conceitos

Epistemologia
  ↓
Validade e origem do conhecimento

Teleologia
  ↓
Finalidades e objetivos

Pragmática
  ↓
Interpretação contextual

Engenharia Semiótica
  ↓
Comunicação entre sistema e usuário

Porém, ainda precisamos transformar parte desse conhecimento em algo que um modelo matemático consiga processar.

É nesse ponto que aparecem os Embeddings.

Embeddings: transformando significado em posição matemática

Um computador não compreende palavras da mesma maneira que um ser humano.

Para que modelos de aprendizado de máquina processem textos, imagens, sons ou outros dados complexos, esses elementos precisam ser convertidos em representações numéricas.

Um embedding é uma representação vetorial na qual determinado objeto é convertido em uma sequência de números.

Simplificando, poderíamos imaginar:

"motor elétrico"
  ↓
[0.21, -0.74, 0.13, 0.89, ...]

Esses números formam um vetor em um espaço multidimensional.

A característica mais importante é que elementos semanticamente relacionados tendem a ocupar regiões próximas nesse espaço.

Por exemplo:

motor
gerador
estator
rotor
enrolamento

provavelmente aparecerão mais próximos entre si do que palavras como:

receita
poesia
oceano
astronomia

Essa proximidade matemática permite realizar:

busca semântica;
recomendação;
classificação;
agrupamento;
recuperação de documentos;
detecção de similaridade;
identificação de duplicidade;
construção de sistemas RAG.

Em uma busca tradicional por palavras-chave, uma consulta por “aquecimento excessivo do motor” poderia não encontrar um documento chamado “procedimento para sobretemperatura em máquinas elétricas”.

Com embeddings, o sistema pode reconhecer que “aquecimento excessivo” e “sobretemperatura” possuem proximidade semântica, mesmo sem coincidência exata de palavras.

Porém, é importante não confundir proximidade vetorial com compreensão completa.

Um embedding representa padrões de relação aprendidos a partir de dados. Ele não garante, sozinho:

verdade;
causalidade;
intenção;
contexto operacional;
validade científica;
atualização;
coerência ética.

Os embeddings oferecem uma geometria do significado, mas essa geometria depende dos dados, do modelo e da forma como foi produzida.

E os significados podem mudar.

Essa mudança nos conduz à Deriva Semântica.

Deriva Semântica: quando o significado muda silenciosamente

A Deriva Semântica ocorre quando o significado associado a uma palavra, categoria, variável, relação ou representação muda ao longo do tempo ou entre diferentes contextos.

Isso pode acontecer na linguagem humana.

A palavra “nuvem”, por exemplo, durante muito tempo estava associada principalmente a fenômenos atmosféricos. Na computação, passou a representar infraestrutura, armazenamento e processamento distribuído.

Também pode acontecer dentro de sistemas.

Suponha que o campo status = 1 originalmente signifique:

Equipamento ligado

Depois de uma atualização, uma equipe passa a interpretar:

Equipamento disponível

Ligado e disponível não são necessariamente a mesma coisa.

O equipamento pode estar ligado, mas indisponível por manutenção, falha ou bloqueio operacional.

Mesmo sem alterar o tipo do campo ou a estrutura da API, o significado mudou.

Em sistemas de IA, a deriva semântica pode surgir quando:

o vocabulário dos usuários muda;
os documentos são atualizados;
novas categorias são introduzidas;
o domínio de aplicação muda;
o modelo de embeddings é substituído;
os dados de treinamento deixam de representar a realidade;
diferentes equipes usam o mesmo termo com significados distintos;
conteúdos gerados por IA passam a alimentar novas gerações de dados.

Uma base vetorial também pode sofrer problemas quando documentos antigos e novos utilizam conceitos de maneira diferente.

Por isso, trocar um modelo de embeddings pode exigir a recriação de todos os vetores armazenados. Os espaços vetoriais gerados por modelos diferentes não devem ser tratados automaticamente como se fossem equivalentes.

Para controlar a deriva semântica, considero importantes algumas práticas:

versionar taxonomias e ontologias;
registrar a origem dos dados;
documentar alterações de significado;
manter glossários de domínio;
monitorar mudanças no vocabulário;
validar periodicamente resultados de busca;
identificar conceitos ambíguos;
reprocessar embeddings quando necessário;
envolver especialistas humanos na revisão;
preservar referências temporais.

Assim como monitoramos a deriva estatística dos dados, também precisamos monitorar a deriva dos significados.

Como todos esses conceitos se complementam

Ao reunir esses termos, percebi que eles não são peças isoladas. Eles descrevem diferentes camadas de um mesmo problema: transformar informação em conhecimento operacional.

Podemos imaginar uma cadeia completa.

1. A Semiótica define as representações

O sensor, a palavra, o ícone, o número e a mensagem funcionam como signos.

2. A Semântica atribui significado

O valor 92 passa a representar uma temperatura de 92 graus Celsius.

3. A Taxonomia classifica

A temperatura é classificada como uma grandeza física, e o dispositivo como um sensor térmico.

4. A Ontologia estabelece relações

O sensor mede a temperatura de um motor pertencente a uma linha de produção.

5. A Epistemologia avalia o conhecimento

O sistema verifica a origem da leitura, o horário, a calibração do sensor e a confiabilidade da informação.

6. A Teleologia define a finalidade

O objetivo é proteger o motor sem interromper desnecessariamente a produção.

7. A Pragmática interpreta o contexto

Uma temperatura de 92 °C pode ser normal em um processo e crítica em outro.

8. Os Embeddings permitem recuperar conhecimentos relacionados

O sistema localiza manuais, históricos e procedimentos semanticamente semelhantes.

9. A Engenharia Semiótica comunica a situação

O agente explica ao operador o problema, as evidências e as ações possíveis.

10. O controle da Deriva Semântica preserva a coerência

O sistema verifica se conceitos, limites e interpretações ainda correspondem à realidade operacional.

Assim, a inteligência não está concentrada em uma única resposta produzida pelo modelo.

Ela está distribuída por toda a arquitetura.

Um exemplo em um sistema agêntico

Imagine um agente responsável por auxiliar na manutenção de motores industriais.

O operador escreve:

O motor principal está esquentando novamente.

Uma solução baseada apenas em palavras-chave poderia procurar documentos contendo “motor”, “principal” e “esquentando”.

Uma solução mais completa utiliza várias camadas.

Semiótica

Identifica os signos presentes na mensagem: “motor principal”, “esquentando” e “novamente”.

Semântica

Relaciona “esquentando” a conceitos como sobretemperatura, dissipação térmica, sobrecarga e falha de ventilação.

Pragmática

Compreende que o operador provavelmente não está fazendo apenas uma observação. Ele está solicitando uma investigação.

Taxonomia

Classifica o problema como:

Manutenção
└── Máquinas elétricas
  └── Motores
      └── Falhas térmicas

Ontologia

Relaciona:

Motor principal
  possuiSensor → Sensor T1
  utilizaVentilação → Ventilador V1
  éAcionadoPor → Inversor INV1
  pertenceÀLinha → Linha 2

Epistemologia

Consulta:

leitura atual do sensor;
histórico;
registros de manutenção;
confiabilidade da medição;
documentação do fabricante.

Embeddings

Recupera documentos semanticamente relacionados a:

sobretemperatura;
ventilação insuficiente;
desbalanceamento de fases;
sobrecarga mecânica;
operação em baixa rotação;
parametrização do inversor.

Teleologia

Prioriza:

segurança;
preservação do equipamento;
continuidade operacional;
redução do tempo de parada.

Engenharia Semiótica

O agente responde:

A temperatura do motor está 12 °C acima do limite registrado para esta condição operacional. O aumento começou após a redução da rotação do inversor. Antes de interromper a linha, recomendo verificar o ventilador auxiliar e comparar as correntes das três fases. Posso iniciar a coleta dessas medições.

Essa resposta não nasceu apenas de um prompt bem escrito.

Ela dependeu de uma arquitetura de significado, conhecimento, contexto, objetivos, fontes e comunicação.

Engenharia de Prompt continua importante, mas não está sozinha

Depois de compreender esses conceitos, passei a enxergar a Engenharia de Prompt de outra maneira.

Um prompt é uma interface textual por meio da qual fornecemos ao modelo:

signos;
instruções;
contexto;
objetivos;
restrições;
exemplos;
critérios de resposta.

Portanto, a Engenharia de Prompt atua sobre aspectos semióticos, semânticos, pragmáticos, epistemológicos e teleológicos.

Mas ela não substitui:

uma boa modelagem de domínio;
uma taxonomia consistente;
uma ontologia bem estruturada;
a validação das fontes;
o gerenciamento do contexto;
o uso correto de embeddings;
o controle de versões;
a observabilidade;
a governança;
a supervisão humana.

Um prompt excelente não corrige uma base de conhecimento contraditória.

Também não elimina uma ontologia mal construída, uma fonte desatualizada, um objetivo ambíguo ou um mecanismo de recuperação semanticamente inadequado.

A Engenharia de IA é uma engenharia do significado

Hoje entendo que projetar sistemas de Inteligência Artificial é, em grande medida, projetar sistemas de produção, transformação e aplicação de significado.

A Semiótica nos ajuda a compreender as representações.

A Semântica nos ajuda a definir os significados.

A Taxonomia organiza os conceitos.

A Ontologia estabelece suas relações.

A Epistemologia questiona a origem e a validade do conhecimento.

A Teleologia define os objetivos.

A Pragmática introduz o contexto e a intenção.

Os Embeddings transformam relações semânticas em representações matemáticas.

A Engenharia Semiótica organiza a comunicação entre o sistema e seus usuários.

E o estudo da Deriva Semântica nos lembra que os significados não permanecem necessariamente estáveis.

Quando relacionamos esses campos, percebemos que a Engenharia de Inteligência Artificial não é apenas uma extensão do desenvolvimento de software.

Ela exige que o engenheiro compreenda não apenas como processar dados, mas também:

o que esses dados representam;
o que significam;
de onde vieram;
como estão relacionados;
em qual contexto são válidos;
para qual objetivo serão utilizados;
como suas conclusões serão comunicadas;
como seus significados podem mudar.

Foi assim que deixei de enxergar a Inteligência Artificial como uma simples máquina de responder perguntas.

Passei a enxergá-la como uma arquitetura na qual signos são transformados em significados, significados são organizados como conhecimento e conhecimentos são utilizados para orientar ações.

E é justamente nesse ponto que começamos a sair da Engenharia de Prompt e entramos, de fato, na Engenharia de Inteligência Artificial.