Hva styrer forbruket av KI-kreditter?
Mange brukere opplever at KI er dyrt. Den vanligste årsaken er likevel ikke at verktøyet er dyrt i seg selv, men at det brukes på samme måte uansett hva man spør om. Et enkelt spørsmål og en omfattende juridisk drøftelse behandles da likt – med den kraftigste og mest kostbare modellen, og med en stadig voksende samtale i bakgrunnen.
For å forstå forbruket er det nyttig å vite hva en KI-assistent faktisk gjør. Hver gang du sender et spørsmål, leser modellen gjennom alt den har fått tilgang til: spørsmålet ditt, eventuelle dokumenter du har lastet opp, og hele den foregående samtalen. Deretter genererer den et svar. Både det modellen leser og det den skriver, måles i såkalte tokens (se ordlisten nederst). Jo mer tekst som leses og skrives, desto flere tokens forbrukes – og det er tokenforbruket som ligger til grunn for hvor mange kreditter en oppgave koster.
Forbruket styres dermed i hovedsak av tre forhold: hvilken modell du bruker, hvor mye tekst modellen må lese, og hvor langt svaret blir. Alle tre kan du selv påvirke.
KI-økonomisk bruk
Et nyttig begrep i denne sammenhengen er KI-økonomisk bruk (Kjelland 2026). Tanken er enkel: man tilpasser verktøyet til oppgaven, slik at man bruker akkurat den kapasiteten spørsmålet krever – verken mer eller mindre. Det er det samme prinsippet som ligger til grunn for økonomisk kjøring av en bil. En kraftig motor bruker mer drivstoff per kilometer, og en tungt lastet bil bruker mer enn en lett. Velger man kjøretøy og last etter behovet, kommer man like langt til en lavere kostnad.
Overført til KI betyr dette at en avansert modell bruker mer per spørsmål enn en enklere modell, og at en lang samtale med mye innhold koster mer å lese gjennom enn en kort og fokusert samtale. KI-økonomisk bruk handler om å gjøre bevisste valg på begge punkter.
Hva som trekker KI-kreditter
Følgende faktorer øker forbruket. De fleste kan justeres.
Valg av modellDe kraftigste og nyeste modellene bruker mest per spørsmål. De gir gjerne svært gode svar, men på enklere oppgaver er forskjellen i kvalitet liten, mens forskjellen i kostnad kan være betydelig.
Opplasting av lange dokumenterNår du laster opp et omfattende dokument, må modellen lese hele dokumentet hver gang den skal svare på noe knyttet til det. Et langt dokument trekker derfor mange tokens. Last opp bare det du faktisk trenger svar på, og vurder å klippe ut de mest relevante delene framfor å laste opp alt.
Lange samtaler med mye innholdDette er en faktor mange overser. En KI-assistent har ingen hukommelse mellom de enkelte meldingene – den får i stedet hele samtalen presentert på nytt for hvert spørsmål du stiller. Etter hvert som en samtale vokser, blir denne konteksten stadig lengre, og modellen må lese gjennom alt på nytt hver gang. En lang chat blir dermed gradvis dyrere, selv om hvert enkelt spørsmål er kort.
Lange svarBer du om uttømmende, lange svar, genereres flere tokens enn ved et kort og presist svar. Be om den lengden du faktisk har bruk for.
Manglende nystart av samtalenFordi konteksten bygger seg opp, lønner det seg å starte en ny samtale når du går over til et tema som ikke har noen kobling til det du nettopp har spurt om. Da slipper modellen å lese gjennom irrelevant tidligere innhold, og du betaler bare for det som er relevant for det nye spørsmålet.
Allrounder-KI eller temaspesifikk assistent
Et første valg er hvilken assistent du henvender deg til. Allrounder-KI-en besvarer alle typer spørsmål og kan normalt brukes på opptil 95 prosent av skadebehandlingen. Den bygger på de mer autoritative rettskildene og er et godt utgangspunkt for det løpende arbeidet.
De temaspesifikke assistentene er ment særlig for mer detaljerte, emnespesifikke søk. Det er også her det meste av underrettspraksisen er knyttet, slik at denne praksisen ikke «støyer til» de mer autoritative kildene som Allrounder-KI-en bygger på. Velg en temaspesifikk assistent når du arbeider inngående med et avgrenset rettsområde og har behov for den mer detaljerte dekningen.
Slik bruker du KI-assistenten slik at du får mest igjen for kredittene dine
Det viktigste grepet er å velge modell etter oppgavens vanskelighetsgrad, og å starte forsiktig. Du velger selv språkmodell fra en nedtrekksmeny inne i hver enkelt KI – både i Allrounder-KI-en og i de temaspesifikke KI-assistentene for de ulike rettsområdene. Du kan dermed tilpasse modellen til hvert enkelt spørsmål og bytte underveis ved behov. Min anbefaling er å bygge på følgende prinsipper.
Start med en enklere eller litt eldre modell. De litt eldre og mindre avanserte modellene er fullt ut tilstrekkelige for en stor del av spørsmålene. Begynn der, og bruk en kraftigere modell først dersom svaret viser seg ikke å holde mål. Det å gire opp til en sterkere modell underveis koster langt mindre enn å starte med den kraftigste på alt.
Bruk mindre avanserte modeller på mindre avanserte spørsmål. Oppslag, korte forklaringer, begrepsavklaringer og enkle utkast krever sjelden toppmodellen. Spar den kraftige kapasiteten til de oppgavene som faktisk trenger den.
Min anbefaling for juridiske spørsmål er å bruke Sonnet på de noe enklere juridiske spørsmålene, og Opus på de mer avanserte – men altså ikke på alle. Den aller nyeste versjonen bør forbeholdes det mest komplekse, der du har behov for det ypperste verktøyet har å tilby. På den måten betaler du for toppkapasitet bare når oppgaven virkelig krever det.
Hold samtalene fokuserte. Start en ny samtale når du skifter tema, og last bare opp de dokumentene du trenger svar på. En kort, ryddig samtale gir ofte både bedre og rimeligere svar enn en lang samtale der mye ulikt innhold blander seg sammen.
Hurtigoversikt: HVA, HVORFOR, HVORDAN, NÅR
| Aspekt | Hva | Hvorfor | Hvordan | Når |
|---|---|---|---|---|
| Valg av modell | Velg modell etter oppgavens vanskelighetsgrad | Kraftigere modeller bruker mer per spørsmål | Velg modell i nedtrekksmenyen inne i KI-en | Før hvert nytt spørsmål av en annen art |
| Lengden på samtalen | Hold chatten fokusert på ett tema | Hele samtalen leses på nytt for hvert spørsmål | Start en ny samtale ved temaskifte | Når det nye spørsmålet ikke henger sammen med det forrige |
| Opplasting av dokumenter | Last opp bare det du trenger svar på | Lange dokumenter leses i sin helhet hver gang | Klipp ut de relevante delene framfor å laste opp alt | Hver gang du skal arbeide med et dokument |
| Svarlengde | Be om den lengden du faktisk trenger | Lange svar genererer flere tokens | Be om et kort og presist svar når det holder | Når du formulerer spørsmålet |
| Oversikt over forbruket | Følg med på eget forbruk og på varslene underveis | Gir kontroll og forutsigbarhet | Sjekk Dashboard > AI Usage og les varslene | Løpende, gjennom hele arbeidsdagen |
Personvern og taushetsplikt
I personskadesaker arbeider du med sensitive helse- og personopplysninger, og taushetsplikten gjelder fullt ut også når du bruker KI. Last derfor ikke opp mer identifiserbar informasjon enn oppgaven krever, og gjør det i anonymisert form. Fjern navn, fødselsnummer og andre opplysninger som direkte eller indirekte kan identifisere den skadelidte, før du laster opp materiale.
Anonymisering og avgrensning gir en dobbel gevinst. Ut over å ivareta personvern og taushetsplikt bidrar det samtidig til mer KI-økonomisk bruk, ettersom du laster opp mindre tekst og dermed forbruker færre tokens.
Kvalitetssikring og kildekontroll
En KI-assistent kan formulere svar med stor sikkerhet og likevel ta feil. Dette gjelder særlig henvisninger til lovbestemmelser, forarbeider og rettspraksis, der både innhold og referanser i enkelte tilfeller kan være unøyaktige. Behandle derfor svarene som et kvalifisert utgangspunkt, ikke som en endelig rettskilde.
Kontroller alltid sentrale henvisninger, sitater og domsreferanser mot de opprinnelige rettskildene før du bygger videre på dem. Det faglige ansvaret for resultatet ligger hos deg som bruker, og en rask kildekontroll er en rimelig forsikring mot feil.
Forskjell på proffsegmentet og øvrige brukere
Det er en viktig forskjell på hvordan grensene fungerer for ulike brukergrupper.
Personskadeportalen 3.0 – ingen øvre grense
Brukere i proffsegmentet har ingen øvre grense for KI-bruken. Du blir likevel varslet underveis om forbruket ditt, slik at du har full oversikt og kan bruke verktøyet KI-økonomisk. Varslene er ment som en hjelp til bevisst bruk, ikke som en stopp.
Lexias KI-løsninger – hardt tak
Andre brukere, som studenter som benytter Lexias KI-løsninger, møter derimot et hardt tak. Når kredittene er brukt opp, stopper KI-assistenten inntil det er kjøpt flere kreditter. For denne gruppen er det derfor særlig viktig å bruke verktøyet KI-økonomisk, slik at kredittene rekker lengst mulig.
Vanlige spørsmål
Hva er inkludert i månedsabonnementet for Personskadeportalen 3.0?
Ruller de månedlige kredittene over til neste måned?
Hva koster en KI-kreditt?
Hvordan faktureres bedriftskunder?
Hva skjer når kredittene mine er brukt opp?
Hvordan kjøper jeg flere kreditter?
Hvordan vet jeg hvor mye jeg har brukt?
Får jeg et dårligere svar hvis jeg velger en enklere modell?
Hvorfor blir en lang samtale dyrere?
Bør jeg laste opp hele dokumentet?
Liten ordliste
Sentrale begreper innen KI, forklart kort.
- KI-kreditt
- En enhet for KI-bruk i Lexias løsninger. Kredittene trekkes etter hvor mye arbeid modellen utfører, det vil si hvor mange tokens som leses og skrives. Én kreditt rekker lenger jo mer KI-økonomisk du bruker verktøyet.
- Token
- Den minste tekstenheten modellen regner i. Et token er omtrent en kort orddel; en setning består av mange tokens. Både teksten modellen leser (spørsmål, dokumenter, tidligere samtale) og teksten den skriver, måles i tokens. Tokenforbruket avgjør kostnaden.
- Kontekst (kontekstvindu)
- Alt modellen har foran seg når den svarer: spørsmålet ditt, opplastede dokumenter og hele den foregående samtalen. Konteksten leses på nytt for hvert spørsmål, og den vokser etter hvert som samtalen blir lengre.
- Modell
- Selve KI-en som besvarer spørsmålet. Modellene finnes i ulike størrelser og generasjoner. Sonnet er en effektiv modell godt egnet til de noe enklere oppgavene, mens Opus er kraftigere og bedre egnet til de mer krevende. De nyeste versjonene er de mest avanserte, og også de mest ressurskrevende.
- Prompt
- Selve spørsmålet eller instruksjonen du gir modellen. En presis og avgrenset prompt gir gjerne både et bedre og et rimeligere svar enn en vag og vidtfavnende.
- Input og output
- Input er det modellen leser (prompt, dokumenter, tidligere samtale). Output er det modellen skriver (svaret). Begge deler forbruker tokens.