09.09.2020

SOCO Frokostseminar: Syntetiske testdata gir lysere tider for «Trine Tester»

Testdata har lenge vært en utfordring. Hvordan kan vi finne testpersonene vi trenger med de rette egenskapene og som gjenspeiler virkeligheten?

SOCO Frokostseminar var onsdag viet syntetiske testdata, altså fiktive data laget til utviklingsformål. Vi startet dagen med en "fullsatt" sal, det vil si etter covid19-standaren, av engasjerte fremmøtte for en lærerik og nyttig presentasjon av Margrethe Myrstad Bedregal og Mats Flaten fra Skatteetaten. Margrethe, som er testleder i Modernisering av Folkeregisteret, fortalte om syntetiske testdata hos dem og bakgrunnen for det tverrfaglige samarbeidet Test-Norge. Mats, leder for innføringsløpet for Tenor testdatasøk, viste oss hvordan vi allerede nå kan begynne å søke i disse dataene og mulighetene som ligger der videre.

Hadde du ikke mulighet til å komme for å se foredraget? Se hele når det passer deg på vår YouTube kanal (link) 

Jeg trenger en testperson som er …

Vi kjenner oss alle igjen i situasjonen hvor vi skulle hatt en testperson med spesifikke egenskaper. Bestilling og oppsett av slike data har gjerne måttet planlegges i god tid, og vært tidkrevende å produsere manuelt. Spesielt har det vært frustrerende å måtte generere, vedlikeholde og gjenbruke slike kunder selv når man vet at slike testdata allerede fantes hos andre etater. Likeså har de økte kravene til beskyttelse av personopplysninger og etterlevelse av Personvernforordningen (GDPR) gjort at mange har måttet få på plass bedre løsninger for testdata. Margrethe og Mats kunne gi oss et innblikk i løsninger på denne problematikken. Bak klart oppdiktede navn som «Trine tester» kan vi nå finne en testperson som på ingen måte kan spores til en reell person, men som likevel skal kunne benyttes som om personen var ekte. 

«Vakker Blomst» – nye data spirer frem fra tverrfaglig samarbeid

Test-Norge er et samarbeid mellom flere etater innen offentlig forvaltning, og foruten fra Skatteetaten er det deltakere fra Brønnøysundregistrene, NAV og Digitaliseringsdirektoratet bare for å nevne noen få. «Vi var lei alt forarbeidet før integrasjonstester, med koordinering via mail, og drømte om en enklere tilgang til testdata til verdikjedetester», påpekte Margrethe og Mats. Test-Norge ønsker å opprette og vedlikeholde testdata som nesten komplett gjenspeiler den norske befolkningen, både når det gjelder mengde, egenskaper og alle de konstante endringer. 

Fordelen er at vi bruker den samme verdikjeden i test som vi gjør i produksjon, men med syntetiske testdata. Da får konsumentene en trygg måte å teste integrasjon mot Folkeregisteret på. Margrethe Myrstad Bedregal

Disse dataene er nemlig ikke bare syntetiske, de er også dynamiske. I det ligger det at de følger en utvikling som tilsvarer den som vanlige mennesker vil oppleve i løpet av livet. Nå kan også «Vakker Blomst» gifte seg, skifte navn, melde flytting, få barn og dessverre også en gang gå bort. Slike «hendelser» er med på å gjøre testdataene mer levende, uten at det går på bekostning av personvernet. Disse begivenhetene 

er igjen generert av maskinlæring som har studert det virkelige livet i Norge. Per i dag er det 1 million tilgjengelige testpersoner fra Folkeregisteret gjennom Test-Norge.

Etter hvert som flere etater i Test-Norge tilgjengeliggjør sine data for dette samarbeidet, vil det komme en stadig større bredde og mengde av nyttige data. De ulike kildene til testdata kan koble seg på så lenge testdataene er syntetiske.

Nyttig, oversiktlig og tidsbesparende søk

«Tenor» er navnet på løsningen for søk av testdata. Løsningen gir deg i dag enkel tilgang til testpersoner fra det syntetiske folkeregisteret og det syntetiske enhetsregisteret. Og flere kilder er på vei. Du kan allerede nå søke deg frem til dataene ved å søke i Tenor testdatasøk(krever innlogging via ID-Porten). 

Du kan søke deg frem basert på flere ulike egenskaper til testdataene, og du kan også dra nytte av å kunne se kildedataene fra Folkeregisteret sitt testmiljø.

Tenor gjør testdata fra Test-Norge søkbare Mats Flaten

I tillegg til å søke via det grafiske brukergrensesnittet (GUI) er det tilrettelagt for maskinelle søk via API. Mens Tenor er selve søkeløsningen, vil brukerne måtte gå direkte til kildene for testdataene hvis de ønsker å benytte seg av dem. Tenor tilgjengeliggjør også eksempelpakke for de som ønsker å utvikler løsninger for å dele sine testdata til søket, sa Mats. Kode og teknisk informasjon vil også være tilgjengelig på GitHub og Swagger.

Så hva så er veien videre med Tenor testdatasøk? Stadig flere kilder skal koble seg på, og på sikt vil søkeløsningen utvides med testdata fra andre etater som for eksempel Lånekassen eller Statens pensjonskasse. Det private næringsliv vil også kunne koble seg til. 

Med et stort tverretatlig samarbeid og åpne tekniske løsninger var det nok flere av oss som etter frokostseminaret kunne se frem til lysere tider for testdataene våre! Tusen takk til Margrethe og Mats som ga oss dette innblikket! 

Presentasjon SOCO Frokostseminar 09.09.2020: Syntetisk Testdata Og Tenor Testdatasøk v/Skatteetaten (PDF)