Brand Fidelity Engine — zo houdt AI-content brand-true
·Bijgewerkt: 28-5-2026·11 min lezen

Brand Fidelity Engine — zo houdt AI-content brand-true

De Brand Fidelity Engine scoort elk AI-asset op 5 dimensies en blokkeert publicatie onder 75. Walkthrough op één echte asset.

L
Lars Berends

Founder Felax Agency

De Brand Fidelity Engine is het systeem dat elk AI-gegenereerd asset scoort tegen het merk-DNA van de klant, vóórdat het gepubliceerd wordt. Score onder 75 → asset gaat niet live. Score boven 75 → publiceerbaar. Geen designer hoeft naar 100 assets te kijken; de gate doet dat in seconden.

Dit is de diepte bij de pillar Brand-true content op industriële schaal. Daar lees je waarom een fidelity-laag nodig is. Hier lees je hoe hij intern werkt — 5 fasen, 5 scoring-dimensies, één concreet voorbeeld op één echte asset.

Wat is de Brand Fidelity Engine?

De engine is geen tool en geen plug-in. Het is een 5-fase-pijplijn die elke output tussen prompt en publicatie scoort op vijf merk-dimensies en de composite tegen een drempel afzet. Bij Felax draait hij standaard op 75/100 als publish-threshold.

Vijf scoring-dimensies, met vaste gewichten:

DimensieGewichtWat het meet
Color fidelity25%ΔE-afstand tussen asset-kleuren en brand-tokens
Typography fidelity20%Font-family, weight, tracking match
Composition fidelity20%Negative space, hierarchie, forbidden elements
Voice fidelity20%Ban/allow-list + tone-of-voice LLM-judge
Pillar alignment15%Mapt asset op een van de merk-content-pillars

Gewichten zijn empirisch — kleur is de meest zichtbare merk-marker (vandaar 25%), pillar de minst zichtbare op asset-niveau (vandaar 15%). Voor visueel-zware merken (mode, design) kantelt het gewicht naar 30/25/25/10/10, maar de standaard is 25/20/20/20/15.

Live performance bij Felax (mei 2026): 78% van eerste generaties haalt de drempel, 95% na één regen-cyclus, gemiddelde fidelity-score op gepubliceerde assets is 84/100.

De 5 fasen — overzicht

FaseDoelDoorlooptijd
1. Merk-scrapeBrand-DNA extraheren uit live website + bestaande assets1 dag
2. Brand-system bouwenTokens, prompt-templates, ban/allow-lists1–2 dagen
3. Gate-configuratieThresholds + gewichten + dimensies activeren0,5 dag
4. Productie + gates draaienGenereer → score → publish of regenper asset ~12s
5. Continuous learningPerformance-data terug in het systeemweekly cycle

Fase 1–3 zijn éénmalig per klant. Fase 4 draait per asset, fase 5 draait op kalender (weekly pattern-extract).

Fase 1 — Merk-scrape

Doel. De engine kan alleen scoren waar hij eerst het merk gemeten heeft. Fase 1 extraheert 100+ data-punten uit de bestaande merk-aanwezigheid.

Input. Eén URL — de hoofdsite van de klant. Optioneel: social-accounts, oude brand-PDF, bestaande templates.

Wat we doen. Headless-browser crawlt alle pagina's, pixel-samplet logo's en hero-images, parseert CSS voor font-stacks, scrapet de laatste 200 social posts voor copy-patronen. Tone-of-voice analyzer leest 200 captions en bouwt een top-frequent fraseringen-lijst.

Output. brand-data.json van ~50 KB met:

  • Logo-varianten (alle versies, alle achtergronden)
  • Kleurpalet (primair + secundair + scales, via pixel-sampling)
  • Typografie (alle fonts in CSS + gebruik per template)
  • 200 bestaande social-posts (image + caption + engagement)
  • Tone-of-voice patterns (frequent fraseringen, ban/allow-candidates)
  • Pillar-mapping van bestaande messaging
  • Markering: eigen klant-foto's vs stock

Doorlooptijd. 1 dag voor de scrape, asynchroon. Klant levert alleen de URL.

Fase 2 — Brand-system bouwen

Doel. De rauwe scrape-data omzetten naar uitvoerbare tokens en prompt-templates die de gate later kan checken.

Input. brand-data.json uit fase 1 + 30-minuten kick-off-call voor scherpstellen.

Wat we doen. We bouwen:

  • Tokens voor color, type, motion, spacing — exact gespecificeerd (geen "ongeveer oranje", wel #FF6B4A)
  • Prompt-templates per output-type: Instagram-static, Reels-thumb, LinkedIn-cover, blog-hero, ad-creative — elke template merk-context-aware
  • Ban-list — woorden, kleuren, composities die nooit mogen (bv. lens flare, "innovatief", off-brand secundair palet)
  • Allow-list — woorden en composities die we juist willen forceren

Output. Een prompt-library van 30–50 templates per klant, een brand-tokens.json en een ban-allow-list.json. Alles versioned in git.

Doorlooptijd. 1–2 dagen, parallel aan fase 1's tail.

Fase 3 — Gate-configuratie

Doel. De drempel en gewichten kalibreren op het merk-type. Een YMYL-klant krijgt strenger, een speed-focused B2B-klant soepeler.

Input. Brand-system uit fase 2 + risico-profiel-call met de klant (5 vragen: hoeveel handmatige review wil je, welke pillars wegen zwaarder, hoe streng op kleur).

Wat we doen. Per klant zetten we:

  • Publish-threshold — standaard 75, premium-merken 85, speed-focus 70 (nooit onder 70)
  • Dimensie-gewichten — standaard 25/20/20/20/15, instelbaar
  • Blockers — hard-fail-condities ongeacht composite (bv. off-brand-gezicht, ban-list-hit)
  • Regen-policy — max aantal auto-pogingen voordat operator getrigd wordt (default 3)

Output. gate-config.yaml — één bestand per klant dat de engine bij elke run leest.

Doorlooptijd. 0,5 dag.

Fase 4 — Productie + gates draaien

Doel. Elke gegenereerde asset evalueren en alleen publishable output doorlaten.

Input. Brief → prompt → generation (Higgsfield, Flux 2, Veo, Kling). Asset komt binnen als file + metadata.

Wat we doen. De 5 dimensies draaien parallel — niet sequentieel. Elke dimensie levert een sub-score 0–100. Composite-formule:

fidelity_score = 0.25*color + 0.20*typography + 0.20*composition + 0.20*voice + 0.15*pillar

Daarnaast checken we hard-blockers (off-brand-gezicht, ban-list-hit, forbidden color) die altijd direct retire forceren, ongeacht composite.

Output. Per asset een fidelity-report.json met 5 sub-scores, composite, blocker-flags en publish/retire-beslissing. Composite-evaluatie kost ~12 seconden per asset.

Pad bij failure:

  • Composite 60–75 → soft fail → auto-regenerate met aangescherpte prompt
  • Composite < 60 of blocker → hard fail → retire + log
  • 3 opeenvolgende fails → operator-trigger (gebeurt ~1% van de runs)

Fase 5 — Continuous learning

Doel. Het systeem maand-op-maand beter maken per klant.

Input. Performance-data uit gepubliceerde posts (engagement, reach, conversie) + fail-logs uit fase 4.

Wat we doen. Wekelijkse pattern-extract job:

  • Hooks die top-10% engagement halen → success-score omhoog → meer gebruik
  • Visuals die converteren → fidelity-templates worden bijgesteld (welke compositie wint?)
  • Captions die delen → caption-templates worden bijgesteld
  • Prompt-shapes met chronische fails → automatisch gedeprioriteerd

Output. Bijgewerkte prompt-library + updated success-scores per template. Bij Felax meten we maandelijks de "win rate" (% posts in top-10% van klant's eigen historie). Q1 2026: 12%. Q2 (live nu): 28%.

Doorlooptijd. Weekly cron-job, ~20 minuten compute per klant.

Voorbeeld: brand-fidelity check op één echte asset

Concreet maken: we nemen een hypothetische Felax Instagram-static — 1080×1080, headline + statistic + Felax-logo onderaan. Doel: een carrousel-cover voor het pillar-blog B04 brand-true content.

De asset (gegenereerd door Higgsfield):

  • Achtergrond: warm oranje
  • Headline: "100 assets/maand, 1 operator"
  • Subline: "78% pass-rate op de gate"
  • Logo rechts-onder

We draaien hem door de engine.

Color fidelity check. Pixel-sampler trekt 50 pixels, clustert naar 5 dominante kleuren. Dominant: #F77852. Brand-token: #FF6B4A. Delta-E (CIEDE2000) = 4. Formule 100 - (ΔE × 2) → score 92. Secundaire kleuren (off-white text, dark slate logo) binnen scales. Sub-score: 92.

Typography fidelity check. OCR leest "100 assets/maand, 1 operator" en "78% pass-rate op de gate". Font-fingerprint via x-height en stroke-width: Inter 700 voor headline (match), Inter 400 voor subline (match). Tracking gemeten op -0.018em vs brand-spec -0.020em — binnen tolerantie. Sub-score: 88.

Composition fidelity check. Negative-space-ratio: 42% (brand-spec min 30% → pass). Single focal-point (de headline). Geen forbidden elements (geen lens flare, geen gradient achtergrond, geen neon glow). Hairline-detection: geen 1–2px borders aanwezig waar brand-spec ze wel suggereert voor cards — minor demerit. Sub-score: 81.

Voice fidelity check. LLM-judge tegen de voice-guide. "100 assets/maand, 1 operator" → cijfer-onderbouwd, direct, geen filler — hit op allow-list. "78% pass-rate op de gate" → idem. Geen ban-list-hits ("game-changer", "cutting-edge", "synergy" allemaal afwezig). Sub-score: 90.

Pillar alignment check. Mapping: asset raakt pillar-2 (brand-true content op schaal) expliciet, pillar-1 (one-person agency-OS) impliciet via "1 operator". Niet diffuus, heldere focus. Sub-score: 88.

Composite. 0.25*92 + 0.20*88 + 0.20*81 + 0.20*90 + 0.15*88 = 87.85. Publishable. Asset gaat live.

Wat een fail-versie zou zijn. Stel dezelfde asset maar met:

  • Achtergrond #FFB300 (Material amber, ΔE 18 van het brand-token) → color sub-score 64
  • Helvetica i.p.v. Inter → typography sub-score 30
  • Headline "Game-changing AI voor jouw merk!" → voice sub-score 22 (ban-list-hit + filler)

Composite zou uitkomen op 0.25*64 + 0.20*30 + 0.20*81 + 0.20*22 + 0.15*88 = 47,4. Hard fail. Asset retired automatisch, regen-cyclus start met aangescherpte prompt (anchor de brand-hex expliciet, force font-family Inter, vervang headline tegen de voice-guide). Tweede generatie haalt in 95% van gevallen de drempel.

Wat de gate detecteert — per dimensie, met voorbeelden

Per dimensie de concrete fails die het systeem in de praktijk vangt.

Color fidelity — wat we fail-en:

  • Asset met dominant #FFB300 waar brand-token #FF6B4A is → ΔE 18 → sub-score 64 → fail
  • Asset met "branding-correct" oranje maar verkeerd secundair palet (bv. paars uit Tailwind-default waar het brand-system slate gebruikt) → secundair score 50, weegt mee in composite
  • Asset met sepia-gradient over brand-foto's terwijl het brand-system flat colors voorschrijft → composition + color beide gedeerd

Typography fidelity — wat we fail-en:

  • Helvetica of Arial waar Inter voorgeschreven is → exact-family-mismatch → sub-score 30
  • Inter Regular (400) waar Bold (700) hoort voor headlines → weight-mismatch → sub-score 55
  • Letter-spacing +0.05em waar brand-spec -0.02em is → tracking off → sub-score 65
  • Captions in een mismatched font (gegenereerd door image-model dat font-instructie negeert) → instant retire

Composition fidelity — wat we fail-en:

  • 4-kwadrant-layout met 4 statistieken waar brand-spec single-focal-point voorschrijft → "te druk" → sub-score 45
  • Negative-space-ratio onder 30% (brand minimum) → automatic demerit van 20 punten
  • Forbidden elements: lens flare, neon glow, vignette, plastic-y gradient achtergronden — elk een instant retire-blocker
  • Symmetrische perfectie waar brand-aesthetic juist asymmetrische rauwheid voorschrijft (zeldzaam maar voorkomt bij premium-design-klanten)

Voice fidelity — wat we fail-en:

  • Ban-list-hit: "game-changer", "cutting-edge", "synergy", "innovatief", "futureproof" → sub-score onder 25
  • Marketing-bullshit-zinnen ("Discover our solutions to take your marketing to the next level") → LLM-judge geeft 20
  • Anglicismen waar Nederlands kan ("deliverables", "stakeholders", "actionable") → demerit per stuk
  • "U" i.p.v. "je" buiten YMYL-context → tone-mismatch → sub-score 60

Pillar alignment — wat we fail-en:

  • Asset met willekeurige boodschap die geen pillar raakt ("AI is leuk!") → pillar-score 20
  • Diffuse boodschap die 3+ pillars tegelijk probeert te raken → "te diffuus" → sub-score 50
  • Off-pillar messaging die past bij een concurrent-positionering maar niet bij Felax (bv. "AI voor iedereen") → 30
  • Campagne-mix-check: te veel posts achter elkaar op dezelfde pillar → strategie-flag, niet fail

Tussen 5 dimensies zo gemiddeld 12–15 concrete fail-patronen die de engine in productie elke week vangt. Het zijn niet de spectaculaire fails (die filter je met blockers); het zijn de kruip-fouten waardoor merk-drift ontstaat.

Veelgestelde vragen (FAQ)

Wat is de standaard publish-threshold?

75 voor base-tier merken, 85 voor premium/luxe-merken, 70 voor speed-focused B2B. Nooit onder 70 — daar verlies je ontwerpgebonden merk-consistentie.

Kan ik de gewichten van de 5 dimensies aanpassen?

Ja, per klant configureerbaar in gate-config.yaml. Standaard 25/20/20/20/15. Voor visueel-zware merken adviseren we 30/25/25/10/10.

Werkt de engine ook op video?

Ja. Video krijgt frame-sampling (1 frame per 2 seconden) en elk frame wordt door dezelfde 5 dimensies gehaald. Audio krijgt aparte voice-fidelity-check via transcript-LLM-judge.

Wat gebeurt er met assets die de gate niet halen?

Soft fail (60–75): auto-regenerate met aangescherpte prompt. Hard fail (<60 of blocker): retire en log. Max 3 auto-pogingen voordat operator-review getriggerd wordt — gebeurt in ~1% van de runs.

Hoe weet de engine wat "Inter Tight" is vs "Helvetica"?

Font-fingerprint via x-height, stroke-width-ratio, terminal-shapes en optional OCR-confidence-score per font-candidate. Niet 100% sluitend op zeer subtiele varianten, wel sluitend op family-niveau.

Wat kost een fidelity-check per asset?

Felax-side onder €0,80 per asset (compute + LLM-calls). Voor de klant onzichtbaar — het zit in de tier-pricing.

Kan ik een score betwisten?

Ja. Elke score is herleidbaar tot 5 sub-scores met onderliggende data (pixel-samples, OCR-output, LLM-judge-rationale). Bij gerede twijfel passen we de threshold of weging aan — niet de individuele asset.

Wat als mijn merk nog geen vaste tokens heeft?

Dan begint fase 0 (brand-system-creatie) — 1–2 dagen extra. Daarna draait de engine zoals beschreven.

Test de Brand Fidelity Engine gratis

Stuur ons een URL van je huidige website. Wij draaien fase 1 + 2 + 4 op één sample-asset en sturen binnen 24 uur de fidelity-score per dimensie + de publish-or-retire-beslissing. Gratis, geen sales-pitch.

felaxagency.com/fidelity-test

Verder lezen:


Over de auteur Lars Berends is founder van Felax Agency en bouwer van de Brand Fidelity Engine. Tien jaar marketing-ervaring, opgebouwd in B2B SaaS en premium retail. Lees meer.

Bronnen

  • Felax Agency interne data, mei 2026 — geanonimiseerd
  • McKinsey CMO Generative AI Report 2025 — Brand consistency degradation in scaled AI content
  • CIEDE2000 color difference formula, CIE Technical Report 142-2001

Laatst bijgewerkt: 2026-05-28