Como obter melhores resultados no uso da IA com a engenharia de prompt
Introdução:
Para entendermos melhor sobre a engenharia de prompt é necessário entender como a inteligência artificial funciona. Desta forma fica fácil entender como aplicar os prompts e como melhorá-los. Com o advento da Inteligência artificial. As instituições e profissionais atualmente tem uma nova questão a ser levada em conta. A inteligência artificial vem intrigando as pessoas com as novas possibilidades que ela vem trazendo. E dando-nos ferramentas para podermos fazer mais com menos recursos. Já que podemos delegar diversas atividades e entregar melhores resultados. E abrindo possibilidades de aumentar a produtividade, criar novos produtos e serviços e reinventar processos e negócios no mundo todo. Este campo de estudo não é novo, existem estudos desde meados da década de 70. Por isto esta área veio se aprimorando até chegar no estado atual. Por isso, é importante continuar se aperfeiçoando porque estes modelos vão continuar evoluindo e agregando cada vez mais valor ao nosso dia-a-dia.
O que é inteligência artificial:
É o campo de estudo que busca fazer com que a máquina consiga executar tarefas simples para humanos mas complexas para as máquinas. É uma forma de fazer a máquina conseguir simular a forma de pensar humana. Os algoritmos usados na inteligência artificial, diferente dos algoritmos clássicos utilizados em sistemas dos mais diversos, funcionam de forma um pouco diferente. São utilizados algoritmos de redes neurais profundas em larga escala para tarefas de processamento de texto. E para processamento de visão computacional são utilizadas redes neurais convolucionais. O que difere tanto no tratamento quanto como escrevemos os prompts para cada tipo de inteligência artificial. Neste artigo vamos focar nos prompts para processamento de texto.
O que é Modelo de linguagem em larga escala - Large Language Model (LLM ):
O que faz um modelo ser de linguagem de larga escala. Além de utilizar um dos algoritmos acima citados para o seu processamento. Eles têm algumas características únicas. A quantidade de colunas é gigantesca. A OpenAi ( ChatGPT ) tinha divulgado que seu modelo tinha mais de 275 bilhões de colunas. Além de que cada arquitetura tem diferenças em dados, algoritmos e forma de treinamento e etc. Por isso é importante entender a base para um prompt de qualidade e como cada ferramenta utilizada funciona.
O que é Processamento de Linguagem Natural ( PNL ):
É o estudo das formas de um computador se comunicar com humanos. Não diferindo se é texto, voz ou qualquer outro formato. Estes algoritmos têm como entrada de dados textos que são processados e baseados na análise sintática e na análise semântica usados como base para uma resposta ao usuário.
Análise sintática:
- Lematização: Converte diversas variações de uma palavra para uma única variável. Assim, carro, carros, carrinho e carrão são todos tratados da mesma forma.
- Segmentação Morfológica: Divide as palavras para a identificação dos morfemas.
- Segmentação de Palavras: Identifica cada palavra do texto.
- Stemização: Reduz cada palavra ao seu radical.
- Correção Ortográfica: Corrige erros na fala humana.
- Parsing: Analisa as palavras a partir de regras gramaticais.
- Remoção de Stopwords: Elimina palavras como artigos e preposições, que normalmente são desnecessárias para a identificação da intenção.
Análise semântica
- Reconhecimento de Entidades Nomeadas (Named Entity Recognition – NER). Identifica partes do texto que fazem parte de grupos pré-definidos.
- Remoção de Ambiguidade (Word Sense Disambiguation): Dá sentido para a palavra dentro do contexto.
- Resumindo o texto precisa ser analisado, codificado, feito a desambiguação e corrigido para depois ser processado pelo algoritmo e retornado uma resposta ao usuário.
O que é Claude 3?
É uma ferramenta de inteligência artificial criada pela startup chamada Anthropic que consegue analisar imagem, som, vídeo e texto e devolver uma resposta em texto de acordo com o solicitado. Segundo o próprio site da empresa, cada um dos modelos Claude posteriores vieram para melhorar os serviços oferecidos e a última versão é a Claude 3.
Dentro desta versão nós temos três produtos: Opus, Sonnet e Haiku. Sendo que a mais aperfeiçoada é a Opus e a mais básica sendo Haiku. Estes modelos ultrapassa outros concorrentes em questão de performance nas respostas deste conhecimento comum até de nível superior conforme tabela abaixo divulgada no site da empresa:
Referência: anthropic.com
Além de forte capacidade para analisar vários formatos de arquivos como descrito acima. Tendo um diálogo mais rápido, preciso e menos ofensivo ao usuário.
O que é engenharia de prompt e como melhorar os resultados:
Com toda a base de conhecimento que tivemos, podemos aprofundar neste assunto. Engenharia de prompt é o campo de estudo de como podemos utilizar melhor e obter melhores respostas das ferramentas de inteligência artificial. Como estas ferramentas ainda estão em processo de melhorias podemos ter novidades no futuro em relação a este campo mas com algumas informações podemos extrair ótimos resultados das ferramentas baseadas em textos.
Limites:
- Sem Compreensão Verdadeira: Ele não entende o mundo como nós. Ele apenas reconhece padrões.
- Contexto Limitado: Às vezes, esquece o que foi dito antes em uma conversa longa.
- Informações Desatualizadas: Ele só sabe sobre o que foi treinado até um certo ponto no tempo.
- Perigos:
- Possibilidade de respostas incorretas.
- fantasiadas ou inventadas.
- Importância de validar informações com fontes confiáveis.
- Necessidade de precauções com dados pessoais sensíveis com risco à violação da LGPD que devem ser levadas em consideração no uso de serviços oferecidos de fora da organização.
Com estes conceitos em mente. Começaremos a construir os conceitos básicos para começar a evoluir os prompts. A estrutura básica de texto do prompt é a seguinte:
- Remetente da mensagem ( descrição, atributos ou persona da personagem que está enviando a mensagem );
- Destinatário da mensagem ( descrição, atributos ou persona da personagem que está recebendo a mensagem );
- A tarefa a ser executada ( resumo, descrição, tópicos, perguntas e outras );
- A forma como deve ser executada ( quantidade de linhas, regras, restrições, elementos que devem constar na mensagem e outras );
- A língua utilizada ( Português, Inglês, Espanhol, Italiano e outras );
- A linguagem utilizada ( Formal, Informal, Jovial, Técnica e outras );
- Exemplos ( Assim facilita com que a ferramenta consiga entender melhor o que precisa ser feito );
Algumas dicas extras para ter um prompt mais efetivo:
- Evitar termos redundantes;
- Preferência por prompts em inglês porque a maioria dos modelos são bem mais completos em inglês;
- Evitar gírias e linguagem informal no prompt;
- Informa o contexto em que a resposta está inserido;
- Importância da completude do prompt para assertividade;
- Contexto diferente para cada chat aberto também chamado de agente;
- Melhorar prompts vagos e refazer perguntas. Assim a Inteligência Artificial melhora o resultado final;
- Processo iterativo para refinar os pedidos feitos;
- Limites de caracteres nas respostas de IA;
- Considerar caracteres vazios e linhas em branco no limite;
- Dar exemplos. Ajuda a Inteligência Artificial à ajustar o conteúdo;
Alguns exemplos de Utilização:
Exemplo de prompt e resposta com Claude 3
- Faça um resumo como que feito por um escritor de contos infantis sobre o livro “O pequeno príncipe” em linguagem informal para que uma criança de 10 anos consiga entender. O texto deve ser em português e em 15 linhas.
- Escreva um conteúdo para redes sociais como instagram como que escrito por uma pessoa jovem de 16 anos para outras pessoas da mesma idade sobre como é importante reciclar o lixo separando cada item corretamente.
- Aja como professor de engenharia de prompt. Escreva-me 15 perguntas sobre o tema “ Engenharia de prompt”. E para cada pergunta dê 5 alternativas sendo que uma delas é correta e as outras são falsas. Assim que eu acabar de responder corrija se está correto ou errado e me explique o porquê.
Conclusão:
É importante continuar estudando para se manter atualizado. Já que os modelos continuarão a evoluir à medida que surgir novos hardwares, softwares, redes e demais tecnologias que trarão novas mudanças para os negócios e para a sociedade.
Referência:
Gemini, https://gemini.google.com/. Pesquisa feita em 15 de agosto de 2024.
ChatGPT, https://chatgpt.com/. Pesquisa feita em 09 de agosto de 2024.
Anthropic, https://www.anthropic.com/. Pesquisa feita em 09 de agosto de 2024.
Dio, https://web.dio.me/. Pesquisa feita em 09 de agosto de 2024.
Kaggle, https://www.kaggle.com/. Pesquisa feita em 09 de agosto de 2024.