Normalisering – lovlig og hensiktsmessig

Av Alf Amund Gulsvik, assosiert partner, Kluge Advokatfirma

Stornemndavgjørelsen 2021/1000 i KOFA om normalisering av poengene ved evaluering i offentlige anskaffelser har skapt ny debatt om normalisering. I innlegget fra advokat Ellingsen og Haukeli på Anbud365 19. juli trekker de unyanserte slutninger det ikke er grunnlag for.

I en offentlig anskaffelse hvor oppdragsgiver skal avgjøre konkurransen ut fra flere forhold enn kun laveste pris må man ta stilling til hvilke forhold som skal være avgjørende for valg av tilbud og hvordan disse forholdene skal avveies mot hverandre. Anskaffelsesregelverket oppstiller forskjellige krav til forutberegnelighet for ulike deler som inngår i denne prosessen. For anskaffelser underlagt forskrift om offentlige anskaffelser del III stilles det krav om at det skal oppstilles tildelingskriterier og opplyses om vekten til tildelingskriteriene. Forskriften oppstiller ikke krav om at det skal opplyses om poengsettingsmetoden. Det er imidlertid praksis fra EU-domstolen, norske domstoler og KOFA som skaper rammer for oppdragsgivers fastsettelse av metoden.

Det er totaliteten av tildelingskriteriene, vekten til tildelingskriteriene, poengsettingsmetoden herunder normalisering som gir det endelige resultatet i anskaffelsen.

Hvis konkurransegrunnlaget angir at anskaffelsen vil bli avgjort ut fra to tildelingskriterier pris og kvalitet, som hver er vektet 50 %, har man fått noen opplysninger om hva som vil være avgjørende, men det er fortsatt opplysninger av stor betydning for utfallet av konkurransen som mangler. Eksempelvis vil metoden man benytter for å poengsette pris ha stor betydning for hvor mye priskriteriet teller. Dersom man benytter en lineær metode hvor dobbel pris gir 0 poeng, vil pris telle vesentlig mindre enn om man benytter en lineær metode hvor 50 % høyere pris gir 0 poeng. For ikke å undergrave plikten til å opplyse om vekten til tildelingskriteriene, mens det ikke er plikt til å opplyse om evalueringsmetoden, så følger det av praksis at det vil være i strid med kravet til forutberegnelighet å benytte en evalueringsmodell som innebærer at den relative vektingen av tildelingskriteriene forskyves.

Begrepet normalisering brukes normalt om en prosess som oppdragsgiver gjør etter å ha poengsatt et tildelingskriterium hvor ingen av tilbudene har fått beste score. Beste tilbud blir da oppjustert slik at det får høyeste score på det aktuelle tildelingskriteriet, og scoren til de andre tilbudene blir også oppjustert.

Situasjonen hvor beste tilbyder ikke får full poengscore på tildelingskriterium oppstår normalt fordi man har poengsatt evalueringskrav på lavere nivå som blir summert opp til en score på tildelingskriteriet. Hvis man tenker seg at et tildelingskriterium består av 5 evalueringskrav som hver blir poengsatt på en skala fra 0-10, så vil ingen tilbyder få score 10 på tildelingskriteriet med mindre de får 10 poeng på alle fem underliggende evalueringskrav.

At en tilbyder ikke får 10 poeng på alle underliggende evalueringskravene, vil til dels avhenge av hvordan hvert enkelt evalueringskrav er vurdert.

En metode er at oppdragsgiver poengsetter hvert evalueringskrav ut fra en absolutt skala om tenkte kvalitetsnivåer. Dersom ingen tilbud er på det høyeste tenkte kvalitetsnivået vil tilbudet ikke få 10 poeng.

En annen metode er at oppdragsgiver poengsetter hvert evalueringskrav slik at beste tilbyder får 10 poeng og de andre poengsettes relativt i forhold til hvor mye dårligere kvalitet de har enn beste tilbyder på det enkelte evalueringskravet.

Begge metoder er vanlig i Norge, men de fleste synes å poengsette ved å gi høyeste poengsum til beste besvarelse og så gi trekk for de andre ut fra det.

Hvis man etter å ha gjennomført poengsettingen av de underliggende evalueringskravene kommer i en situasjon der ingen av tilbyderne har fått full poengscore på tildelingskriteriet, kan en oppjustering av tilbudene skje i hovedsak på to måter.

Den ene metoden er at alle tilbyderne i absolutt størrelse oppjusteres like mye. Hvis skalaen går fra 0-10 og beste tilbyder før normalisering har 8,3 poeng, vil alle tilbudene oppjusteres med 1,7 poeng. En slik oppjustering har ingen betydning for utfallet av konkurransen, da forskjellen mellom tilbudene forblir den samme. En slik absolutt normalisering er det ingen grunn til å gjøre.

Den andre metoden er at de øvrige tilbyderne oppjusteres forholdsmessig likt som beste tilbyder. Dersom beste tilbyder må oppjusteres fra 8,3 poeng til 10 poeng, så innebærer det at beste tilbyder oppjusteres 20,5 %. De andre tilbudene skal da tilsvarende oppjusteres 20,5 %. Det betyr i eksemplet at mens et tilbud som opprinnelig scoret 8,3 poeng blir oppjustert 1,7 poeng, så vil et tilbud som opprinnelig scoret 6,3 poeng bli oppjustert til 7,6 poeng, altså oppjustert 1,3 poeng. Den relative forskjellen mellom tilbudene forblir lik, men den beste tilbyderen øker sitt forsprang på tildelingskriteriet med 0,4 poeng.

Hvis man etter å ha gjennomført poengsettingen av de underliggende evalueringskravene rt i situasjonen at en tilbyder samlet på tildelingskriteriet har 8,3 poeng, mens en annen har 6,3 poeng, så er det et spørsmål om hvordan man betrakter hvor stor forskjell det er mellom tilbudene. Her kan man enten si at det er 2 poengs forskjell mellom tilbudene, altså se det i en absolutt målestokk. Man kan imidlertid også si at nest beste tilbud har 24 % dårligere kvalitet.

Ellingsen og Haukeli skriver i sin kommentar at:

«Normalisering har den iboende effekten at det alltid øker poengdifferanser i strid med det som i utgangspunktet var oppdragsgivers innkjøpsfaglige vurdering av kvalitetsforskjeller mellom tilbudene. Med andre ord: Hvorfor skal to tilbud som gis 1 og 2 poeng økes til henholdsvis 5 og 10 poeng, slik at en differanse økes fra 1 til 5 poeng?»

Ellingsen og Haukeli synes utelukkende å være opptatt av den absolutte forskjellen, og mener at det er den som gir det korrekte uttrykk for kvalitetsforskjellen mellom tilbudene. Hvis man har poengsatt fem evalueringskrav på en absolutt skala, som så samlet gir en poengscore er jeg enig i at forskjeller i den samlede poengscoren ikke gir prosentvis uttrykk for relative forskjeller i kvalitet.

Dersom hvert evalueringskrav har vært poengsatt relativt, altså at man for hvert evalueringskrav har ment at en tilbyder er en viss andel dårligere enn en annen tilbyder, så er det etter min forståelse imidlertid korrekt å si at den samlede poengsummen gir uttrykk for at det andre tilbudet er 24 % relativt dårligere.

I mitt eksempel skal kvalitet skal telle 50 % opp mot pris som også skal telle 50 %. Dersom pris poengsettes ved at beste tilbud gis 10 poeng og et tilbud som er 24 % dyrere får 7,6 poeng, så blir det også riktig at et tilbud som er 24 % dårligere på kvalitet enn beste tilbud får 7,6 poeng på kvalitet.

Det er på denne måten man mest korrekt utformer en poengsettingsmetode som ikke forskyver den relative vektingen som er kommunisert gjennom å opplyse om vektingen på tildelingskriteriene. Da de fleste oppdragsgivere etter min erfaring poengsetter det enkelte evalueringskravet relativt, så betyr det at det blir riktig å normalisere i de fleste anskaffelser som gjennomføres i Norge.

Å ikke normalisere relativt vil ha den konsekvensen at tildelingskriteriet får mindre vekt enn det tilsynelatende skal ha ut fra sin vekting. Dersom oppdragsgiver har et tildelingskriterium med mange underliggende evalueringskrav, og ikke planlegger å normalisere relativt, så bør oppdragsgiver gi tildelingskriteriet en større vekt enn dersom man planlegger å normalisere relativt. Problemet for oppdragsgiver er at selv om man vet hvor mange evalueringskrav som inngår i evalueringskravet, vil man ikke i forkant vite om det er samme tilbyder som scorer høyest på alle evalueringskravene. Hvorvidt høyeste oppnådde totale poengsum vil ligge nært opp mot maksimalt oppnåelig score, eller om tilbyderne vil være best på ulike områder, slik at høyeste oppnådde totale poengsum vil være lav med dertil behov for å vekte tildelingskriteriet høyere, vil ikke oppdragsgiver kunne vite i forkant. Istedenfor å korrigere i forkant i konkurransegrunnlaget for forventet sprik på evalueringskravene ved å endre vekten på tildelingskriteriet, er det derfor bedre å legge opp til å normalisere.

Hva man mener at er den mest korrekte metoden, er imidlertid et annet spørsmål enn spørsmålet om hvilke rettslige krav som følger av lov om offentlige anskaffelser § 4 til forutberegnelighet om normalisering. Om det er hensiktsmessig å evaluere ved å poengsette med utgangspunkt i laveste pris og beste tilbud er også en annen diskusjon.

Om stornemndavgjørelsen

Stornemndavgjørelsen 2021/1000 avsagt 8. juli 2021 gjaldt en anskaffelse med to tildelingskriterier «pris» vektet 80 % og «prosjektorganisasjon og kompetanse» vektet 20 %. Pris ble poengsatt basert på totalpris etter en lineær modell. «Prosjektorganisasjon og kompetanse» ble poengsatt ved at tre evalueringskrav; utdanning, erfaring og relevante prosjekter, ble poengsatt for noen nøkkelroller ut fra en definert skala knyttet til type utdanning, antall års erfaring og antall relevante referanseprosjekt. Hvert evalueringskrav var dermed poengsatt absolutt. Det var opplyst at for «prosjektorganisasjon og kompetanse» ville «ytterpunktene på skalaen ikke nødvendigvis benyttes».

På tildelingskriteriet «prosjektorganisasjon og kompetanse» fikk beste tilbud 8,17 poeng. På «pris» fikk beste tilbud 10 poeng. Poengscoren på «prosjektorganisasjon og kompetanse» ble ikke normalisert. Klager anførte at dette endret tildelingskriteriene ved at pris fikk større vekt enn det som var angitt i konkurransegrunnlaget.

Stornemnden tok utgangspunkt i EU-domstolens avgjørelse i C-6/15 Dimarso hvor det ble uttalt at det ikke kan benyttes evalueringsmetoder, som ikke er gjort kjent i konkurransegrunnlaget, hvor metoden fører til en endring av tildelingskriterienes vekt. KOFA uttalte at bedømmelsen av prosjektorganisasjon og kompetanse innebærer skjønnsmessige vurderinger. Det gjør det vanskelig å fastsette en metode. Dette har betydning for hvilke rammer som er oppstilt ved vektingen av tildelingskriteriene og klagenemndas prøving av om tildelingskriterienes vekt er endret. KOFA konkluderte med støtte i Dimarso og praksis fra lagmannsrettene, at i den innklagede anskaffelsen innebar ikke fravær av normalisering at den relative vektingen til tildelingskriteriene ble forskjøvet.

I en anskaffelse hvor det ikke var opplyst noe om det ville bli foretatt normalisering, så uttalte KOFA i stornemnd at det ikke var i strid med kravet i lov om offentlige anskaffelser § 4 til forutberegnelighet at det ikke ble foretatt normalisering.

Motsatt dersom oppdragsgiver hadde foretatt normalisering er det ikke noe i KOFAs avgjørelse som tilsier at det ville bli ansett å være i strid med kravet til forutberegnelighet. Det avgjørende for KOFA slik jeg leser avgjørelsen var at om man normaliserte eller ikke normaliserte ikke hadde en sånn betydning for konkurransen at det forskjøv den relative vekten av tildelingskriteriene, og dermed var noe som ble rammet av det prøvingstemaet KOFA oppstilte.

Ellingsens oppsummering av avgjørelsen at «etter vårt syn må det også kunne slås fast at normalisering i utgangspunktet vil være ulovlig der det blir utslagsgivende for resultatet. Dette innebærer at dersom oppdragsgiver hadde normalisert poengscoren i denne anskaffelsen, ville dette utgjort et brudd på anskaffelsesregelverket», følger etter mitt syn ikke av avgjørelsen. Avgjørelsen er basert på et resonnement om at oppdragsgiver har utøvd sitt skjønn innenfor de rammene kravene til forutberegnelighet stiller for den poengsettingsmetoden oppdragsgiver lovlig kan bruke når det ikke er opplyst noe om metoden.

Bør man normalisere?

Ellingsen og Haukeli sin generelle konklusjon om at normalisering alltid er en uting, blir etter min mening unyansert, og feil i flertallet av norske anskaffelser.

Utgangspunktet er at normalisering er aldri feil. Som sagt innledningsvis er evaluering et samspill mellom som de viktigste faktorene tildelingskriterier, underkriterier, evalueringskrav, vekting, poengsettingsmodeller/bruk av skalaer og normalisering. Å normalisere er en av mange samvirkende faktorer som har betydning for sluttresultatet. Om man velger å normalisere, om man velger å ha en annen vekting av tildelingskriteriene eller om man benytter en annen poengsettingsmodell vil kunne ha samme effekt på sluttresultatet.

Dersom man opplyser om at man enten vil normalisere, med en angivelse av metoden, eller ikke vil normalisere, vil man alltid være rettslig trygg i forhold til kravet til forutberegnelighet.

Jeg er enig med Ellingsen og Haukeli at absolutt normalisering har ingen effekt og er helt unødvendig å gjennomføre. Relativ normalisering etter å ha poengsatt de enkelte evalueringskravene absolutt blir etter min forståelse ikke riktig fordi poengforskjellen mellom tilbyderne ikke gir uttrykk for relative forskjeller, men absolutte forskjeller. Jeg er dermed enig med Ellingsen og Haukeli i at man ikke bør normalisere i slike anskaffelser. Dersom man opplyser om at man vil normalisere er det imidlertid ikke noe rettslig i veien for dette.

Dersom man har poengsatt evalueringskrav relativt, altså å gi høyeste poengsum til beste besvarelse på det enkelte evalueringskravet og relativt trekk for de andre ut fra hvor mye dårligere de scorer, så gir det etter min forståelse det beste uttrykket for vektingen av tildelingskriteriene at man normaliserer relativt. Den ferdig normaliserte poengscoren gir da uttrykk for den korrekte relative forskjellen mellom tilbudene og man opprettholder i størst mulig grad den relative vektingen mellom tildelingskriteriene. Den faktiske vektingen av tildelingskriteriet blir ikke påvirket av om ulike tilbydere er best på ulike underliggende evalueringskrav.

Det stornemndavgjørelsen gir veiledning om er at i den konkrete saken med de gitte tildelingskriteriene, med den gitte vektingen og den benyttede evalueringsmodellen så var det ikke i strid med kravet til forutberegnelighet å ikke normalisere.

De oppdragsgivere som poengsetter evalueringskrav relativt, og som normaliserer relativt for hvert tildelingskriterium, bør fortsette med det. I de fleste norske anskaffelser bør man dermed (fortsatt) normalisere.

Fra et rettslig perspektiv kan oppdragsgiver gjerne opplyse i konkurransegrunnlaget om man vil normalisere eller ikke, men i mange anskaffelser vil man med støtte i stornemndavgjørelsen til KOFA kunne si at det ikke vil være ulovlig at det valget er gjort uten at det er opplyst om det.