Den svarte ?konomien i Norge blomstrer. Hvert ?r unndras minst 150 milliarder kroner bare i skatter og avgifter.
Skatteetaten, Gjensidige Forsikring og Den norske Bank (DnB) har n? g?tt sammen med forskere ved Universitetet i Oslo og Norsk Regnesentral for ? ta innersvingen p? ?konomisk kriminelle. Prosjektet deres har f?tt det klingende navnet ?Persontilpasset svindeldeteksjon?.
Juksemakerne
DnB trenger bedre metoder for ? jakte p? dem som driver med hvitvasking, en oppgave som de er lovp?lagt ? rapportere om.
Gjensidige Forsikring ?nsker ? avsl?re dem som melder ifra at skader er mer alvorlige enn i virkeligheten, og dem som oppgir for h?ye verdier p? stj?lne gjenstander.
Skatteetaten ?nsker ? ta i bruk nye metoder for ? bekjempe den svarte ?konomien. Tiltaket er godt nytt for alle dem som ikke jukser med skatten: ?De som f?lger regelverket, skal ikke tape konkurransen mot dem som ikke f?lger regelverket.?
Takket v?re nye digitale muligheter, vil de tre akt?rene f? tilgang til langt mer informasjon enn tidligere. Det gir enorme muligheter.
Momsjuks
En av kampsakene til Skatteetaten er ? finne frem til nye metoder for ? avsl?re dem som jukser med innrapporteringen av merverdiavgift (mva).
Hvert ?r tar Skatteetaten imot 1,6 millioner mvameldinger. Mange av dem inneholder feil. Feilene skyldes enten at innmelderne bevisst overrapporterer kostnadene, underrapporterer inntektene, misforst?r regelverket eller feilf?rer avgiftene.
Det er umulig ? sjekke alle mva-meldingene manuelt.
– Skatteetaten m? derfor ha et automatisk system for ? sile ut hvem de skal se n?rmere p?. S? m? saken sendes videre til en saksbehandler for grundigere vurdering, forteller f?rsteamanuensis Ingrid Hob?k Haff p? Matematisk institutt ved Universitetet i Oslo.
?rlig opprettes det 34 000 nye mva-pliktige bedrifter. Skatteetaten ?nsker ogs? ? lage en statistisk modell som allerede fra f?rste dag kan angi risikoen for hvem som kommer til ? jukse.
Beslektet svindel
Selv om hvitvasking skiller seg fra forsikringssvindel og skattesvindel, fins det visse likheter. Likhetene brukes til ? utvikle helt nye statistiske metoder som skal avdekke lurendreierne.
De tre 澳门葡京手机版app下载spartnerne skal ikke utveksle hverandres datasett, men ved ? bryne seg p? forskjellige datasett med beslektete problemstillinger kan statistikerne komme et godt stykke videre.
Dagens metoder fungerer ikke godt nok. Ingrid Hob?k Haff utvikler derfor nye metoder for ? avsl?re svindel.
– Hver gang det kommer inn en ny sak, ?nsker vi ? beregne sannsynligheten for at det er svindel.
Prosjektet er en del av Big Insight, et senter for forskningsdrevet innovasjon ved UiO. Senteret har som spesiale ? utvikle helt nye statistiske metoder for ? avdekke irregul?re m?nstre i enormt store datamengder.
M?let til forskerne er ? beregne sannsynlighet en for at noe er galt og at saken b?r unders?kes n?rmere.
De fleste svindelfors?kene blir aldri kontrollert. Selv om en sak er kontrollverdig, er det likevel ikke sikkert at det l?nner seg ? sjekke den ut. Dataprogrammet skal derfor samtidig ansl? den forventete gevinsten ved ? unders?ke saken.
Avsl?rer lurendreierne
De nye statistiske metodene testes p? datasett der innholdet allerede er kontrollert. Det betyr at statistikerne p? forh?nd vet hvem som er svindlere eller ikke.
– Vi kan da kontrollere resultatene v?re opp imot fasiten. Ulempen er at vi ikke f?r sjekket programmet v?rt p? de sakene som ikke allerede er kontrollert. Sakene som ble kontrollert, hadde kanskje noe suspekt ved seg i utgangspunktet. Da er de ikke plukket ut tilfeldig.
Kontrolldatasettet kan derfor v?re skjevt vinklet fordi sakene som er manuelt plukket ut til kontroll, allerede er valgt ut etter visse kriterier.
Ingrid Hob?k Haff lurer derfor p? om det finnes informasjon i resten av datasettet som utfyller den informasjonen de allerede har, og om det er mulig ? utnytte denne informasjonen p? et eller annet vis.
– Da m? vi skille mellom ?Ja, vi kjenner fasiten? og ?Nei, vi kjenner ikke til fasiten?. Hele poenget er ? finne de dataene som skiller seg ut.
De dataene som skiller seg ut, beh?ver ikke n?dvendigvis v?re svindel.
Og selv om den nye statistiske metoden kan f?re til at flere blir avsl?rt, er det ikke sikkert at de f?r tak i alle. Det er ikke s? farlig.
– Hvis vi gj?r metoden bare litt bedre, kan det likevel f?re til store gevinster.
Metoden m? ogs? ta hensyn til at svindlere endrer m?ten ? jukse p?.
– Hvis vi avsl?rer hva som er svindel, pr?ver svindlerne andre metoder i stedet. Vi m? derfor stadig utvikle nye metoder.
Matematisk kinkig
En av de mange matematiske vanskelighetene er ubalanserte datasett. Svindelsakene utgj?r bare en liten andel av alle sakene. Ettersom det er vanskelig ? plukke dem ut, er faren til stede for at saksbehandlerne f?r beskjed om ? sjekke ut mange lovlydige saker i forhold til svindelsaker.
– Vi ?nsker bare ? finne de sakene der sannsynligheten for svindel er h?y.
Et annet kinkig problem for matematikerne er ikke bare den store datamengden, men ogs? de mange avhengighetene mellom de ulike dataene.
– Flere variabler i et datasett kan gi den samme informasjonen. Da er det mange av de statistiske metodene som begynner ? slite.
Og som om dette ikke er nok.
– Vi har mye informasjon med forskjellige, statistiske egenskaper. Noe av informasjonen kan ha alle mulige verdier og noe kan ha bare f? verdier. Denne kombinasjonen kan v?re vanskelig matematisk.
Bedriftshemmelighet
Norge er ikke det f?rste landet i verden som forsker p? ? avsl?re svindel. Ingrid Hob?k Haff har derfor sjekket hva andre forskere har gjort.
– Vi har testet metodene deres, men de l?ser ikke problemene v?re slik vi ?nsker det.
Dette betyr likevel ikke at ingen i verden har pr?vd ? knekke svindelkoden.
– Jeg vil absolutt anta at store forsikringsselskaper og banker ute i den store verden har l?st problemet med egne statistiske metoder. De publiserer ikke l?sningene sine. De forblir derfor godt bevarte hemmeligheter, forteller Ingrid Hob?k Haff.