1

Wave Image

Innhold

    Publisert: 10.05.24 | AI IT-sikkerhet

    Hvordan bruke generativ AI for å gjenopprette data etter dataangrep

    Innhold

      Vi hører stadig oftere om selskaper som får stans i driften på grunn av dataangrep. Et dataangrep kan resultere i at du, fra en dag til en annen, ikke lenger har tilgang til dine IT-systemer og data.

      I januar tok en fortvilet kunde kontakt med oss. De hadde blitt utsatt for et dataangrep og alt på deres server var slettet, inkludert ERP-systemet. Det eneste de hadde tilgang til av finansiell data var noe grunndata fra en back-up og en PDF (bilde) med åpne poster per 31.10.23 fra deres revisor.

      I denne bloggen kan du lese om hvordan vi, ved blant annet bruk av generativ AI, klarte å få tilbake det meste av kundens løsning og data.

      God lesning!

       

      Gjenskapte regnskapet i en redningsklient

      En av våre kunder ble utsatt for et dataangrep som førte til full kollaps av deres Visma Global database, og de sto plutselig uten et fungerende ERP-system. Når vi startet arbeidet for dem i midten av januar, var alt de hadde av informasjon noe grunndata fra en back-up og en saldobalanse i PDF per oktober 2023 fra sin revisor.  

      Løsningen ble å opprette en «redningsklient» for å gjenskape regnskapet for de to siste månedene i 2023. Sammen med kunden klarte vi å rekonstruere regnskapet slik at de kunne rapportere momstermin 6 i tide.

      Men dette hadde ikke vært mulig uten bruk av AI og API for å hente, tolke, rekonstruere og importere det som var å redde av data innen forholdsvis kort tid for å rekke momstermin i tide.

       

      Kreativ bruk av generativ AI

      Det som gjorde det mulig å gjenskape regnskapet til kunden var blant annet kreativ bruk av generativ AI.

      Det er viktig å være ekstremt forsiktig med både kundenes data og enge forretningsdata. Det betyr at bruk av gratisversjonen til ChatGPT for slikt arbeid er helt uaktuelt, med mindre du er nøye på å “scramble” dataene som sendes inn først.
      I Exsitec bruker vi ChatGPT Team til slikt arbeid. I ChatGPT Team har du tilgang til et eget, privat arbeidsområde som er strengt beskyttet mot "data slurping".

       

      Slik løste vi det

      1. Gjøre om en PDF (et bilde) av åpne poster til tekst og tall

      Føst måtte vi gjøre om PDF-dokumentet med åpne leverandørposter til et format som kan importeres inn i ERP-systemet. åpne-poster-leverandør

      For å løse utfordringen med å gjøre om en PDF'en til et importerbart format benyttet vi Google Clouds OCR tolk. Prosessen med å bruke tjenesten var relativt enkel. Utfordringen var at formatet på dataene vi fikk tilbake var ganske rotete, men håndterbart, og definitivt mer brukervennlig sammenlignet med et bildeformat. Vi fikk nå et solid grunnlag for videre bearbeiding og analyse av dataene. Slik så dataene ut når vi fikk det i et tekstformat:åpne-poster-leverandør2

      2. Strukturere om dataene fra OCR-tolken til et format som kan importeres via API eller fil-import

      Først må vi fjerne all data vi ikke trenger. Dette kan løses enkelt med et ChatGPT-prompt der vi spesifiserer at den skal fjerne all annen data som ikke starter med et datoformat.

      Vi skrev følgende pomti til ChatGPT:

      "Can you filter out everything in the data set except the lines that start with DD.MM.YY? No code."

      promt1

      ChatGPT fjernet dermed all tekst som ikke starter med en dato, og dette fikk vi tilbake:promt1-svar

      Men vi har fortsatt ikke et format som kan importeres.
      Det neste vi gjorde var å fortelle ChatGPT hvilke deler av tekststrengen som tilhører hvilken kolonne. I dette promptet ber vi ChatGPT filtrere ut verdiene som er markert med “*verdi*” og deretter hvilken kolonne den skal havne i (*kolonnenavn*).
      Nå har ChatGPT et utgangspunkt til å lete etter verdiene vi vil ha i kolonner og rader.
      I tillegg spesifiserer vi at vi ikke ønsker å få en kodesnutt tilbake, men resultatene i en tabell. Vi kan også spesifisere hvilken del av strengen vi vil ha ut ved å sende inn følgende prompt:

      Can you split up each line into rows and columns using this logic: "*string*" (Column). Only extract the values that are specified by "" and (column). No code. Output=table. 
      Example: "02.10.23" (Invoice date) "3510" (Invoice number) Faktura leve "60001" (Supplier no) Pepperl+Fuc 0 34410 0  "30.11.23" (Due date) -12 669,25 "-12 669,25" (Outstanding amount) 

      Nå får vi tilbake en tabell det er mulig å legge inn i en fil vi kan importere inn i ERP-systemet.tabell

      Hvordan er dette mulig?

      Vi spurte ChatGPT og fikk svar!

      “Som en AI-språkmodell utviklet av OpenAI har jeg blitt trent på en enorm mengde tekstdata fra internett. Denne treningen gjør det mulig for meg å forstå og generere menneskelignende tekst basert på den inndataen som blir gitt til meg.

      I dette tilfellet ga du en spesifikk forespørsel om å dele opp hver linje i rader og kolonner ved hjelp av en bestemt logikk. Selv om jeg ikke utfører kode direkte, kan jeg forstå instruksjonene du har gitt og generere det ønskede resultatet ved å følge disse instruksjonene. Jeg analyserer inntekstteksten, identifiserer de spesifiserte mønstrene ("streng" (Kolonne)), og formaterer deretter utdataene tilsvarende.

      I hovedsak utnytter jeg mønstrene og logikken som er gitt i forespørselen din for å produsere det ønskede resultatet uten å faktisk kjøre noen kode i tradisjonell forstand. Mine evner er resultatet av komplekse algoritmer og maskinlærings-teknikker, som gjør det mulig for meg å forstå og behandle naturlig språkinndata for å generere relevante og sammenhengende svar.”

      - ChatGPT

       

      Les mer om IT-sikkerhet og skysikkerhet →

      Abonner på Økonombloggen

      Relaterte artikler

      Hvordan bruke generativ AI for å gjenopprette data etter dataangrep

      AI IT-sikkerhet 5 min

      Hvordan bruke generativ AI for å gjenopprette data etter dataangrep

      Det er systemene som gir oss data, men det er menneskene som gir oss innsikt. Derfor er det viktig å bygge en...

      Hvordan forberede seg til Gen AI i CRM-systemet

      CRM AI 3 min

      Hvordan forberede seg til Gen AI i CRM-systemet

      I dagens stadig mer digitaliserte verden er det avgjørende å forberede seg på Gen AI for å maksimere effektiviteten og...

      Er KI og robotisering digitalisering?

      Automatisering AI 1 min

      Er KI og robotisering digitalisering?

      KI er intelligens som vises av maskiner, i motsetning til mennesker og dyr – såkalt naturlig intelligens.

      Toggle Icon Author Avatar

      Kontakt
      skribenten

      Close

      Kontakt Thomas Eide