Templates

Bibliotheque de workloads

Utilise ces templates comme base de depart. Les presets publics sont limites aux chemins actuellement valides: Knowledge QA, smoke GGUF, LoRA GGUF standard et CUDA performance.

Parcours recommande pour debuter

Prepare un petit dataset JSONL et publie-le sur /datasets.
Choisis Knowledge QA si tu veux surtout des reponses factuelles fiables.
Choisis Tiny GGUF smoke pour verifier une machine.
Passe ensuite a LoRA GGUF standard, puis a CUDA performance seulement sur Nvidia.

Pack public recommande

Dataset conseille pour la premiere demo publique: public-support-mini-v1.jsonl. Lance d abord knowledge-qa-starter ou tiny-gguf-smoke, confirme l artefact, puis passe a un template LoRA.

Telecharger le dataset Ouvrir datasets Guide modele Demo workloads

Knowledge QA

Le choix le plus fiable et le moins cher pour petits datasets factuels, FAQ, docs produit et support.

Knowledge QA rapide

Template le plus fiable pour un petit dataset factuel JSONL: il construit un bundle de reponses ancrees dans le dataset, sans promettre un GGUF.

recommendedstartertextqacheapreliable

Utiliser ce template Doc modele

Modele: byo
Runtime: text_memory_qa / orcrux-runtime
Sortie: full_checkpoint
Dataset attendu: jsonl
Placement: auto
Temps estime: 0.02 GPU-hours
Reward cible: 20 CRUX
Blocks target: 1
Dataset template: Dataset QA JSONL utilisateur

Smoke GGUF

Tests courts pour verifier qu'une machine AMD/DML ou Nvidia/CUDA peut produire un artefact GGUF.

Tiny GGUF smoke

Petit test de bout en bout pour verifier qu'une machine AMD/DirectML ou Nvidia/CUDA peut produire un hf-model et un model.gguf.

recommendedsmoketextggufdmlcuda

Utiliser ce template Doc modele

Modele: byo
Runtime: auto_train / transformers
Sortie: gguf
Dataset attendu: jsonl
Placement: cuda ou dml
Temps estime: 0.08 GPU-hours
Reward cible: 35 CRUX
Blocks target: 1
Dataset template: Petit JSONL utilisateur

CUDA performance

Presets Nvidia uniquement pour modeles plus lourds. A lancer seulement si la machine expose cuda=true.

LoRA GGUF standard

Template texte standard pour dataset utilisateur: auto_train choisit LoRA SFT et exige un model.gguf final. Compatible CUDA ou DML avec petits reglages memoire.

recommendedtextloraggufdmlcuda

Utiliser ce template Doc modele

Modele: byo
Runtime: auto_train / transformers
Sortie: gguf
Dataset attendu: jsonl
Placement: cuda ou dml
Temps estime: 0.35 GPU-hours
Reward cible: 80 CRUX
Blocks target: 4
Dataset template: Dataset instruction JSONL utilisateur

CUDA performance - Qwen GGUF

Template Nvidia uniquement pour valider un vrai fine-tuning Qwen 1.5B avec export GGUF. A utiliser quand la machine expose cuda=true.

recommendedtextloraggufcudanvidia

Utiliser ce template Doc modele

Modele: byo
Runtime: auto_train / transformers
Sortie: gguf
Dataset attendu: jsonl
Placement: cuda
Temps estime: 0.7 GPU-hours
Reward cible: 140 CRUX
Blocks target: 4
Dataset template: Dataset instruction JSONL utilisateur