Lecture

BioLLM

14 Sep 2025

BioLLM

Training

SmolLM2

Paper: SmolLM2: When Smol Goes Big — Data-Centric Training of a Small Language Model
Model: SmolLM2
State-of-the-art compact LLMs for on-device applications: 1.7B, 360M, 135M
Dataset: EleutherAI/SmolLM2-135M-10B

sparify

Dataset :
Code: https://github.com/EleutherAI/sparsify

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

tokenizer = AutoTokenizer.from_pretrained("meta-llama/Meta-Llama-3-8B")
inputs = tokenizer("Hello, world!", return_tensors="pt")

with torch.inference_mode():
    model = AutoModelForCausalLM.from_pretrained("meta-llama/Meta-Llama-3-8B")
    outputs = model(**inputs, output_hidden_states=True)

    latent_acts = []
    for sae, hidden_state in zip(saes.values(), outputs.hidden_states):
        # (N, D) input shape expected
        hidden_state = hidden_state.flatten(0, 1)
        latent_acts.append(sae.encode(hidden_state))

# Do stuff with the latent activations

This site was last updated December 09, 2025.

genai

BioLLM

BioLLM

SAE (Sparse Autoencoder)

SAE survey

Transcoder

Sparse Crosscoders

Evo2

CellVerse

C2S (cell2sentence)

Training Transcoder on C2S

Training

SmolLM2

sparify