# Ajuste Fino Supervisionado com SFTTrainer

Este caderno demonstra como ajustar o modelo `HuggingFaceTB/SmolLM2-135M` usando o `SFTTrainer` do m√≥duli `trl`. As c√©lulas do caderno s√£o executadas e v√£o ajustar finamente o modelo. Voc√™ pode selecionar sua dificuldade experimentando diferentes conjuntos de dados.

<div style='background-color: lightblue; padding: 10px; border-radius: 5px; margin-bottom: 20px; color:black'>
    <h2 style='margin: 0;color:blue'>Exerc√≠cio: Ajuste fino do SmolLM2 com SFTTrainer</h2>
    <p>Pegue um conjunto de dados do hub do Hugging Face e fa√ßa um ajuste fino em um modelo. </p> 
    <p><b>N√≠veis de Dificuldade</b></p>
    <p>üê¢ Use o conjunto de dados `HuggingFaceTB/smoltalk`.</p>
    <p>üêï Experimente o conjunto de dados `bigcode/the-stack-smol` e ajuste um modelo de gera√ß√£o de c√≥digo no subconjunto espec√≠fico `data/python`.</p>
    <p>ü¶Å Selecione um conjunto de dados relacionado a um caso de uso do mundo real que seja do seu interesse.</p>
</div>

In [None]:
# Instale os requisitos no Google Colab
# !pip install transformers datasets trl huggingface_hub

# Autentique ao Hugging Face

from huggingface_hub import login
login()

# Por conveni√™ncia, voc√™ pode criar uma vari√°vel de ambiente que cont√©m seu token do hub como HF_TOKEN

In [None]:
# Importe m√≥dulos necess√°rios
from transformers import AutoModelForCausalLM, AutoTokenizer
from datasets import load_dataset
from trl import SFTConfig, SFTTrainer, setup_chat_format
import torch

device = (
    "cuda"
    if torch.cuda.is_available()
    else "mps" if torch.backends.mps.is_available() else "cpu"
)

# Carregue o modelo e o tokenizador
model_name = "HuggingFaceTB/SmolLM2-135M"
model = AutoModelForCausalLM.from_pretrained(
    pretrained_model_name_or_path=model_name
).to(device)
tokenizer = AutoTokenizer.from_pretrained(pretrained_model_name_or_path=model_name)

# Configure o formato de bate-papo
model, tokenizer = setup_chat_format(model=model, tokenizer=tokenizer)

# Defina nosso nome para o ajuste fino a ser salvo e/ou carregado em um local
finetune_name = "SmolLM2-FT-MyDataset"
finetune_tags = ["smol-course", "module_1"]

# Gerar com o modelo base

Aqui vamos experimentar o modelo base que n√£o tem um modelo de bate-papo. 

In [None]:
# Vamos testar o modelo base antes do treinamento
prompt = "Write a haiku about programming"

# Formato com o modelo de bate-papo
messages = [{"role": "user", "content": prompt}]
formatted_prompt = tokenizer.apply_chat_template(messages, tokenize=False)

# Gerando a resposta
inputs = tokenizer(formatted_prompt, return_tensors="pt").to(device)
outputs = model.generate(**inputs, max_new_tokens=100)
print("Before training:")
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

## Prepara√ß√£o do Conjunto de Dados

Carregaremos um conjunto de dados de amostra e o formataremos para treinamento. O conjunto de dados deve ser estruturado com pares de input-output, em que cada input √© um prompt e o output √© a resposta esperada do modelo.

**TRL formatar√° as mensagens de entrada com base nos modelos de bate-papo.** Elas precisam ser representadas como uma lista de dicion√°rios com as chaves: `role` e `content`.

In [None]:
# Carregue um conjunto de dados de amostra
from datasets import load_dataset

# TODO: Defina seu pr√≥prio conjunto de dados e configura√ß√µes usando os par√¢metros do caminho e do nome
ds = load_dataset(path="HuggingFaceTB/smoltalk", name="everyday-conversations")

In [None]:
# TODO: ü¶Å Se o seu conjunto de dados n√£o estiver em um formato que o TRL possa converter para o modelo de chat, voc√™ precisar√° process√°-lo. Consulte o [m√≥dulo](../chat_templates.md)

## Configura√ß√£o do SFTTrainer

O `SFTTrainer` √© configurado com v√°rios par√¢metros que controlam o processo de treinamento. Eles incluem o n√∫mero de etapas de treinamento, o tamanho do lote, a taxa de aprendizado e a estrat√©gia de avalia√ß√£o. Ajuste esses par√¢metros com base em seus requisitos espec√≠ficos e recursos computacionais.

In [None]:
# Configure o SFTTrainer
sft_config = SFTConfig(
    output_dir="./sft_output",
    max_steps=1000,  # Adjust based on dataset size and desired training duration
    per_device_train_batch_size=4,  # Set according to your GPU memory capacity
    learning_rate=5e-5,  # Common starting point for fine-tuning
    logging_steps=10,  # Frequency of logging training metrics
    save_steps=100,  # Frequency of saving model checkpoints
    evaluation_strategy="steps",  # Evaluate the model at regular intervals
    eval_steps=50,  # Frequency of evaluation
    use_mps_device=(
        True if device == "mps" else False
    ),  # Use MPS for mixed precision training
    hub_model_id=finetune_name,  # Set a unique name for your model
)

# Inicie o SFTTrainer
trainer = SFTTrainer(
    model=model,
    args=sft_config,
    train_dataset=ds["train"],
    tokenizer=tokenizer,
    eval_dataset=ds["test"],
)

# TODO: ü¶Å üêï alinhe os par√¢metros do SFTTrainer com o conjunto de dados escolhido. Por exemplo, se estiver usando o conjunto de dados `bigcode/the-stack-smol`, ser√° necess√°rio escolher a coluna `content`

## Treinando o modelo

Com o trainer configurado, podemos prosseguir com o treinamento do modelo. O processo de treinamento envolver√° a itera√ß√£o do conjunto de dados, o c√°lculo da perda e a atualiza√ß√£o dos par√¢metros do modelo para minimizar essa perda.

In [None]:
# Treine o modelo
trainer.train()

# Salve o model
trainer.save_model(f"./{finetune_name}")

In [None]:
trainer.push_to_hub(tags=finetune_tags)

<div style='background-color: lightblue; padding: 10px; border-radius: 5px; margin-bottom: 20px; color:black'>
    <h2 style='margin: 0;color:blue'>Exerc√≠cio b√¥nus: Gerar com o modelo ajustado</h2>
    <p>üêï Use o ajuste fino para modelar e gerar uma resposta, assim como no exemplo b√°sico.</p>
</div>

In [None]:
# Teste o modelo ajustado no mesmo prompt

# Vamos testar o modelo b√°sico antes do treinamento
prompt = "Write a haiku about programming"

# Formatar com o modelo
messages = [{"role": "user", "content": prompt}]
formatted_prompt = tokenizer.apply_chat_template(messages, tokenize=False)

# Gerar resposta
inputs = tokenizer(formatted_prompt, return_tensors="pt").to(device)

# TODO: use o ajuste fino para modelar e gerar uma resposta, assim como no exemplo b√°sico.

## üíê Voc√™ conseguiu!

Este caderno fornece um guia passo-a-passo para o ajuste fino do modelo `HuggingFaceTB/SmolLM2-135M` usando o `SFTTrainer`. Seguindo essas etapas, voc√™ pode adaptar o modelo para executar tarefas espec√≠ficas com mais efici√™ncia. Se quiser continuar trabalhando neste curso, aqui est√£o as etapas que voc√™ pode experimentar:

- Experimente este caderno com uma dificuldade maior
- Revisar o PR de um colega
- Melhorar o material do curso por meio de uma Issue ou PR.