Med ökad användning av automatiska system är det viktigt att vi förstår begränsningarna i alla delar av kedjan.
Rickard Sjögren har utforskat gränssnittet mellan kemometri och AI för att hitta metoder som kan förbättra förutsättningarna för förståelse.
Han försvarar sin avhandling fredagen den 28 maj vid Umeå universitet.
Artificiell intelligens, AI, är på mångas läppar med stora löften om vad det kan bidra med till samhället. I nuläget är dock den mesta AI som används ganska snäv och utgörs av det som kallas maskininlärning.
Tack vare att maskininlärning har matematiska metoder för att ta fram datorprogram som lär sig uppfatta mönster utifrån exempel, snarare än att programmeras av en människa, är det oerhört användbart inom många delar av samhället och industrin.
Eftersom maskininlärning är så användbart samlas det i dag in stora mängder data för att användas som exempel. Inom kemi till exempel, syftar fältet kemometri till att utveckla metoder för att utvinna kunskap ur komplexa kemiska data för att optimera eller undersöka kemiska processer. Detta sker bland annat med hjälp av just maskininlärning, men även multivariat statistik.
– Kemometriska metoder har använts i praktiken sedan 80-talet, vilket gett gedigen erfarenhet av egenheter hos data från verkliga processer och hur man ser till att ens metoder gör det som man tror de gör. Detta praktiska förhållningssätt har lett till att kemometriska metoder i dag används inom bland annat kvalitetssäkring i den hårt reglerade farmaceutiska industrin, säger Rickard Sjögren, doktorand på Kemiska institutionen vid Umeå universitet.
I sin avhandling har Rickard Sjögren utforskat gränslandet mellan kemometri och maskininlärning. Det finns många lärdomar inom kemometri som går att använda i typiska applikationer av maskininlärning. Samtidigt är maskininlärning ett mycket större fält med ett enormt samlat vetande som kan hjälpa kemometrin framåt.
– Trots att bägge fält har mycket gemensamt så är korspollineringen mellan dem ganska begränsad, just därför visar jag i min avhandling exempel på hur vi kan förbättra utbytet.
Till exempel har Rickard Sjögren inspirerats av kemometri för att utveckla en metod som tillåter en viss typ av maskininlärningsmetoder, vanliga i mer avancerade AI-applikationer, att upptäcka när de är osäkra på vad de förstår av data.
– Dessa metoder används bland annat för datorseende som tolkar omgivningen åt beslutssystem i självkörande bilar. Då är det oerhört viktigt att systemen kan märka av när de är osäkra på vad de ser framför bilen för att undvika trafikolyckor. Det finns redan metoder för att lösa detta problem, men den metod som jag har utvecklat är både pålitlig och beräkningsmässigt effektiv jämfört med alternativen.
För att skapa riktigt bra maskininlärningssystem krävs enorma dataset, men att säkra kvaliteten i enorma dataset är inte alltid lätt. I en annan studie medverkade Rickard Sjögren i att skapa ett stort dataset för mikroskopisk bildanalys, vilket inte tidigare gjorts så storskaligt.
– På grund av det stora antalet mikroskopibilder och deras komplexitet och att många människor var inblandade så var vi tvungna att noggrant planera arbetet för att säkra kvaliteten. Vi använde bland annat metoder för försöksplanering som är vanliga inom kemometrin för att minska risken att det kryper in systematiska fel.
Genom sin avhandling hoppas Rickard Sjögren ge inspiration till hur två fält som har ganska begränsat utbyte med varandra kan gynnas på fler sätt än man kanske trott innan.
– Det går inte att undgå att det finns mycket att hämta i den enorma utvecklingstakt vi ser inom maskininlärning. Men samtidigt finns det många lärdomar från andra mindre fält som länge fokuserat på praktisk användning.
Rickard Sjögren är född och uppvuxen i Vårgårda i Västergötland men bor sedan tio år tillbaka i Umeå. Han har en civilingenjörsexamen inom bioteknik med fokus på bioinformatik från Umeå universitet. Sedan 2018 har han parallellt med sina doktorandstudier arbetat heltid som forskare inom avancerad dataanalys hos Sartorius, en global leverantör till biofarmaceutisk industri.