Definição de Large Language Models (LLMs)

LLMs, ou Grandes Modelos de Linguagem, são comparáveis a um papagaio muito inteligente, capaz de não apenas repetir palavras, mas também de combinar informações anteriores para criar novas frases coerentes. Esses modelos, como GPT-3.5, GPT-4, e o BARD do Google (baseado na LLM chamada Palm 2), são treinados em uma enorme quantidade de dados disponíveis na internet.

Objetivo dos LLMs

O principal objetivo de um LLM é gerar a palavra ou sequência de palavras mais prováveis, com base no input (ou prompt) fornecido. Por exemplo, após a frase "Está chovendo, então eu vou levar o meu...", é provável que o modelo preveja a palavra "guarda-chuva".

Variabilidade das Respostas

LLMs apresentam variabilidade nas respostas, ou seja, eles quase sempre fornecerão respostas diferentes, mesmo para o mesmo prompt. Isso é devido à maneira como trabalham com probabilidade. Por exemplo, mesmo o prompt contendo a letra de uma música popular pode gerar diferentes continuidades da canção.

Necessidade de Precisão

Apesar da variabilidade ser uma característica interessante para a criatividade, a precisão é muitas vezes necessária em determinados contextos profissionais. Para aprimorar a precisão das respostas dos LLMs, é utilizada a engenharia de prompts, que será explorada em aulas futuras.

IA Generativa

É importante entender que os LLMs são uma forma de IA generativa, neste caso gerando texto, embora também possam gerar imagens ou áudio. Depois de compreender o que é um LLM, torna-se mais fácil entender o que são os prompts, assunto que será abordado na próxima aula.