kunstig intelligens

«AI i venture-investeringer: Slik er den nye skolen»

Noen investorer gjør det fortsatt på den manuelle gamlemåten, men er i ferd med å bli frakjørt av de som bruker store databaser, nye språkmodeller og algoritmebasert analyse for å plukke vinnerne, skriver Fredrik Winther i dette dykket ned i de vitktigste verktøyene og trendene.

fredrik winther ai kommentar
Til venstre: AI-verktøyet NightCafes resultat da vi spurte om den kunne illustrere "1000 tech founders with computers in a big pile". Til høyre: Fredrik Winther i Katapult.

For to år siden spådde analytikerne i analysesselskapet Gartner at 75 prosent av alle venture-investorer innen 2025 vil anvende kunstig intelligens i sine investeringsbeslutninger. Tallet virker allerede utdatert. Det betyr i så fall at 25 prosent ikke gjør jobben sin.

Etter lansering av ChatGPT er kraftfulle språkmodeller (LLMs) blitt tilgjengelig for alle. Det har eksplodert utviklingen, og Googles CEO Sundar Pichai uttalte nylig at ingen virksomheter slipper unna. Det er ikke vanskelig å være enig. Hva betyr det for VC og ventureinvesteringer?

Software har de site tiårene spist verden til frokost, i stor grad drevet av venturekapital. Allikevel er det lett å bli overrasket hvor lite som har skjedd med utviklingen av “tech-stacken” til kolleger som driver tidligfase investeringer. Som mange har påpekt, så har innovasjonen gått sakte og overraskende mange har så vidt beveget seg ut av Excel-arkene. Før nå.

Og nei, heller ikke for investorer kommer AI og tar jobben din. Men venture-selskaper og investeringsteam bevæpnet med AI kommer til å gjøre det. De som tar del i utviklingen vil oppleve at størstedelen av jobben får mindre verdi, samtidig blir en liten del av kompetansen veldig mye mer verdt.

Hva skjer akkurat nå?

For to år siden satte vi i gang de første AI prosjektene i Katapult. Med støtte fra både EU og Norges Forskningsråd, og i samarbeid med eksterne AI-fagmiljøer som Backen&Beck, i tillegg til å bygge opp et internt team. Erfaringen er ikke så overraskende at alle deler av investeringsprosessen kan og vil bli forbedret, og utviklingen har aldri gått fortere enn akkurat nå.

Vi kan kaste nettet bredere og fiske etter selskaper i en mengde globale databaser, “scoute og screene” veldig mange flere selskaper, og gå raskere i dybdeanalyser av selskaper, være mer presise og matche fond og porteføljeselskaper raskere med strategisk relevante investorer, og med mindre ressurser og tidsbruk enn før.

I dette bildet oppstår det også et gryende “klasseskille” mellom “den gamle skole” - investorer som fortsetter med de “manuelle” investeringsprosessene som før, gjør jobben slik de alltid har gjort den, og “den nye skolen”, de som ligger foran i bruk og utvikling av store databaser, nye språkmodeller, algoritmebaserte analyseverktøy, og ikke minst bygger opp proprietære data og lokal ekspertise.

Det siste halvåret er det ChatGPT som har aksellerert utviklingen, nye verktøy lanseres ukentlig, og tilgjengeligjøringen av avanserte store språkmodeller (LLMs) gjør at selv små team kan lage avanserte verktøy i jakten på de nye globale vinnerne.

Å plukke globale vinnere

I kjernen handler investeringer om å plukke vinnere. For oss å plukke globale vinnere innen klimateknologi. Det handler grunnleggende sett om å analysere i grenseløse mengder informasjon. I det landskapet lanseres det kontinuerlig nye verktøy og tjenester for å finne, analysere, og hjelpe selskaper.

For et par uker siden lanserte en av de største VC-databasene, Pitchbook, sin “VC Exit Predictor”. Et verktøy som trener på både Pitchbook-data og alternative data, og gir oppstartselskaper en score for hvor sannsynlig det er at selskapet blir kjøpt opp, går på børs, - eller går under. Ikke i seg selv et imponerende verktøy i dag (du kan faktisk få mer ut av et GPT4 abonnement og litt “basic prompting”) men gitt hurtigheten i utviklingen akkurat nå, så vil dette verktøyet raskt bli så avansert at det erstatter noen årsverk.

Pitchbook bruker data fra aktive investorer og investeringsaktivitet, selskapenes egne resultatindikatorer, proxy-indikatorer på lederteamets kompetanse, sosial medieaktivitet, business-modeller, skalerbarhet i teknologi, vekst-tall og metric-modeller for engasjement, “retention”, “churn” og annet. I tillegg til nyhetsartikler, LinkedIn-profiler, og artikler og analyser av markedsposisjon. Kort sagt, stort sett det samme et analyseteam manuelt kan anvende i analyser, men da etter ukers og måneders arbeid, større feilkilder, og tregere læring.

“VC Exit predictor” forutsetter foreløpig at selskapene som analyseres har hentet to runder med invisteringer eller mer, og fungerer ikke på de aller tidligste investeringene. Pitchbook har allerede en av verdens største databaser, og en enkel spådom er at nettverkseffekter gjør denne typen verktøy selvoppfyllende bedre. Blant annet fordi selskapene ikke vil ligge inne med lav eller feil score og vil sørge for oppdaterte data. Verktøyet i seg selv incentiverer for oppdatering av egne data, og samtidig oppdateres modellen hver 4. time, fintuner stadig mer avanserte algoritmer og blir raskt mer presis.

Som en test la vi inn Katapults porteføljeselskaper, og selv om sammenligningsgrunlaget foreløpig er tynt så ser resultatene bra ut. Ikke minst barnslig gøy å se norske Chooose som topper listen med en solid “opportunity score” på 96.

Dette er et enkelt eksempel på hva som har kommet siste måneder. Med eksponentiell vekst i både utvikling og tilgang på data, hvordan ser det ut om ett år? Eller 3? Eller når fondet ditt skal returneres om 7-10år?

Hva vil effekten være av stadig kraftigere og mer presise analysemodeller? Hvordan påvirker det investeringsbeslutninger? Blir de selvoppfyllende bobler? Hvem vil investere i selskaper med lav score?

Hva kan vi lære av finanshistorien?

For det første kan vi lære at alt som kan kvantifiseres vil bli kvantifisert og at kvalitative og menneskelige vurderinger og ekspertise fortsatt blir nødvendig. Vi kan også lære at de som er tidlig ute blir de største vinnerne. Det ligger i investeringenes natur. Mer informasjon, bedre analyser, og flere datapunkter gir fordeler. Mye av den samme som utviklingen som nå skjer i venture har vi for eksempel sett før innen forvaltning av hedgefond. Noe er allikevel nytt.

Helt fra 80-tallet, og spesielt de siste 20 årene, i takt med stadig mer data tilgjengelig og bedre analysekapasitet, har hedgefond blitt stadig mer dominert av kvantiative modelleringer og investeringsbeslutninger.

Wall Streets opprinnelige “Gordon Gekko-karikaturer”, som baserte seg på “instinkter”, magefølelse, nettverk og innside-informasjon, ble fort satt på sidelinjen når tilgangen på data økte. Innsideinformasjon virker helt sikkert fortsatt, men kompetansebehovet forøvrig er endret.

Etter hvert som store mengder offentlig data ble tilgjengelig og nye databaser ble etablert, så ansatte tradisjonelle fondsforvaltere stadig mer algoritme- og matematikkekspertise. Siden tidlig 2000-tall har veksten i andel algoritmestyrt handel vokst fra nær null, estimert til over 75 prosent av totalen i dag, og det vokser videre. I dag er det like selvsagt for hedgefond å basere analyser på “big-data”, kunstig intelligens og algoritmer, som det vil være innen venture i morgen.

For å ta i bruk både nye analyseverktøy som store språkmodeller, og ikke minst fremveksten av nye databaser - og plukke bedre vinnere - så vil vi i venture selskaper se inntog av “data scientist” team.

Det er to hovedgrunner til at venture disruptes akkurat nå

Oppstarts- og tidligfaseinvesteringer kjennetegnes av både strukturerte og av store mengder ustrukturerte data. Og jo tidligere fase et selskap er, jo mer ustrukturert data, og jo mer ustrukturerte data, jo mindre tilgjengelig for analyser. Derfor har vi også fått klisjeen om at “magefølelsen”, eller instinkt og erfaring, er viktige egenskaper. Det er en klisje fordi det er riktig. Har du sett noen tusen selskaper er sjansen stor for at du kjenner igjen et godt gründerteam.

Å systematisk behandle store mengder data har til nå vært tidkrevende, og hvis selskapene og investeringene i tillegg er små som de er i tidligfase, så har det for de fleste fondsmodeller vært vanskelig å forsvare tidsbruken som kreves. Analysejobben har vært for stor i forhold til selskapenes verdi. Selv om det har vært en kraftig glidning mot tidligere fase, så har regelen vært at større fond investerer i senere fase. Med nye analyseverktøy vil interessen for tidligfase forsterkes videre.

For rundt 10 år siden kom den første “big-data”-bølgen innen venture, og mange spådde tilsvarende store endringer som nå. Blant annet Google Ventures gikk høyt på banen om at fremtiden i startup-investeringer lå i “big-data”. De første årene skjedde det ikke så mye, og det viste seg at datatilfanget generelt var for lite, og analysemodellene ble fort begrenset til å måle Twitter-trafikk som signal på traction, eller enkle innsikter som at suksess-gründere avlet mer suksess. I starten leverte modellene stort sett selvfølgeligheter.

Den største endringen nå er fremveksten av og kvaliteten på tilgjengelige databaser som Pitchbook, Crunchbase, Dealroom, kombinert med muligheten til å enkelt sette opp egne databaser, og ikke minst de mange alternative datakilder tilgjengelig som for eksempel Peopledatalabs.com og Startup-insights-com. Det gir enkel tilgang på analysedata på så og si alt som er registrert av startups. Selv før de har en hjemmeside. I i tillegg er det grenseløst med alternative data tilgjengelig enten man vil crawle LinkedIn-profiler for erfarne gründere med “stealth”-profil, eller Github eller tech medier, community-grupper, andre inkubatorer, akselleratorer, VCer, osv, osv .

Å plukke vinnere er både magefølelse og vitenskap, og nå nærmer vitenskapen nærmer seg den mest erfarne magefølelse - bare uten bias og fordommer. Forskjellen fra for bare ti år siden er enorm, og med fremveksten av LLMs og nye databaser gjør at om 80 prosent av analysen kan hentes med nye verktøy, så blir verdien av de resterende 20 prosentene veldig mye høyere.

Scouting, screening og 100X dealflow

For tidligfase-fond og investeringer så ligger ofte majoriteten av - og den mest ressurskrevende jobben - i selve sourcing og screening fasen. I å finne selskapene. Når de er funnet, så må vinnerne plukkes - og utvikles.

I Katapult analyserer vi i snitt 100 selskaper per investering, og i 2022 alene så innebar det å identifisere nærmere 4000 tidligfase klimaselskaper fra hele verden, og som etter screening, intervjuer, og omfattende due diligence endte med til slutt totalt 37 investeringer.

Det er i denne første fasen - scouting og tidlig screening - det foreløpig er lettest å ta i bruk store språkmodeller og mer automatiserte analyser, og tune disse til å finne relevante selskaper. Når et selskap identifiseres og havner i vår pipeline har vi allerede analyseverktøy integrert som gir oss tilgang på alt fra vår egenutviklede “netverk-score” som viser hvilke investorer og nettverk av investorer som er involvert i selskapet, antall ansatte og sammensetning av gründerteam, antall og hvilke finansieringsrunder som er gjort, forretningsområder og sektor, hva slags impact og hvilke bærekraftsmål de operer innenfor, og enkle “summarisations” av annen tilgjengelig informasjon om selskapet.

Og enda viktigere, tempoet i denne utviklingen går fort, nye indikatorer legges til ukentlig basert på erfaringer fra tidligere runder, analyser, og etter hvert også basert på erfaringer i stadig flere fag- og -diskusjonsgrupper og artikler som deler playbooks for data-drevne investeringsprosesser.

Den tidlgere manuelle og tildels tidkrevende scouting prosessen kan gjøres raskere og mer presist og med mer informasjon tilgjengelig. Bare ved å koble våre databaser med GPT4 og Google search - så har vi minst “10Xed” - som det heter - kapasiteten til en “junior investment analyst”. Besparelsen er enkel å regne hjem, og enda viktigere så blir grunnlaget for investeringsbeslutninger bedre, som igjen øker både impact og alpha.

In-house eller innleie?

Verktøy og løsnigner for tilgang på spesialisert dealflow er også det enkleste å kjøpe eksternt. Det gjør at også større fond kan bevege seg inn i tidlig fase - slik vi har sett de siste årene - og få tilgang på selskaper som matcher med investeringsstrategien i en skala som ikke var mulig mindre enn to år tilbake.

Med verktøy som for eksempel Leadpicker får du investeringsmuligheter lett tilgjengelig, relativt skreddersydd ut fra investeringsstrategien din. Samtidig er utfordringen de mange variablene du ikke har kontroll på, "blackboxen" av algoritmer fra eksterne leverandører kan hjelpe på kort sikt, men gir deg lite ekspertise, og du risikerer å miste domene- og konkurransefortrinn over tid. Å trene algoritmene på egne og til dels proprietære data, i tillegg til eksterne er nødvendig for å differansiere egne fond.

Kompetansemessig er man avhengig av å matche investeringsteamet med AI og data-analytics-kompetanse om du vil ligge foran. Om 80 prosent av den “manuelle” jobben kan automatiseres, så er man fortsatt avhengig av å bygge den unike kompetansen som ligger i de resterende 20 prosentene. Som spesialiserte impact-investorer må vi derfor ha kontroll på analysene “in-house” også for å ta i bruk og utnytte de nye verktøyene som lanseres ukentlig. Så løsningen er hybrid.

Hos Katapult er vi ikke helt der hvor “Leadspicker” hevder å være enda, hvor de erstattet 35 junioranalytikere med automatiserte prosesser, og årlig grovsorterer nærmere 100 000 startups for VC-investorer. Med tempoet i utviklingen vi ser nå så er det ikke sikkert det er så lenge til.

I lengden må man uansett levere bedre “aplha” enn konkurrentene. Da fungerer det verken gå i flokk, følge etter, eller være prisgitt ekstern ekspertise. Intern AI-kompetanse og miljø må bygges. I Katapult startet vi denne jobben for et par år siden, har et solid AI-team, er godt igang med å integrere arbeidet i investeringsprosessene, og erfarer first hand hvor fort utviklingen går.

Investeringsstrategi som “prompt”

Med GPT4 og hvor begrensningene i input (prompt) og output (svar) har gått fra 3000 til 25000 ord på noen måneder, kan du mate inn det meste av investeringsstrategien, kriteriene du bruker, matche det mot data, og få ut et helt grei summary på et hvilket som helst selskap. Evt la den lese hele pitchdeck. Språkmodeller som GPT4 og Googles Bard er generalister og tar allerede de fleste universitetseksamener enkelt, kan de fleste språk, og har tilgang på det meste som er skrevet på nett. Da skal du ha gjort noen analyser og sett noen tusen oppstartselskaper før du kan konkurerre manuelt.

Med godt strukturerete data kan du fintune GPT-modeller mot egne databaser, og du kan gjøre det samme for enkeltselskaper, eller for å bygge innsikter fra “anti-porteføljen”, og systematisere erfaringer fra de du ikke investerte i. Du kan gjøre det for å kvalitessikre opp mot foretningsmodeller, kvalitetssikre TAM modeller, eller du kan for eksempel ta playbooken til Andreessen Horowitz (a16z) for vekstmål og analysere vekstmål. Eller du kan raskt få oversikt over konkurransebildet både blant andre tilsvarende selskaper, investorene som finansierer dem, og du kan få brukbare svar på sekunder.

“Motherbrain”

EQT var relativt tidlig ute med sitt “Motherbrainprosjekt” som ble lansert allerede i 2016, og er utviklet til en intern generell support for investeringsbeslutninger. En av nøkkeltjenestene til Motherbrain er å støtte oppkjøp av mindre selskaper som strategiske add-ons til eksisterende eierskap, og i analyser av komplementaritet i forhold til produkter og tjenester. På samme måte som for tidligfase-investeringer har de brukt språkmodeller (LLMs) til å scanne tusenvis av selskaper for å både mer presist og raskere finne gode match for M&As. Prosessen består enkelt sagt av at investeringsteamet beskriver egenskaper og kriterier for selskaper de ser etter, så får de forslagene, og swiper høyre eller venste på videre og mer manuelle analyser.

Erfaringene fra EQTs utviklkng er de samme som for Katapult. For at anaylsene skal være brukbare, må det investeres i et team som faktisk kan teknologien, slik at analysene er transparante, resultatene sporbare, og innsiktene fra investeringsekspertisen i investeringsteamet kan tunes inn. Black box-prosesser og blind bruk av teknologi prosesser er lite egnet for investeringsanalyser. Du trenger skreddersøm, og per i dag kan det sammenlignes med å sykle en bratt oppoverbakke med eller uten el-sykkel.

Globale investornettverk - varme introduksjoner på sterioider

Venture har i stor grad vært drevet av nettverkslogikk. Varme introduksjoner, stort nettverk, og personlige relasjoner har alltid vært avgjørende. Varme introduksjoner gir raskere tillit til at informasjonen stemmer, og en snarvei til kvalitetssikret informasjon. Det er også hovedårsaken til at lokale økosystemer er viktig og at for eksempel Sillicon Valley har fått en global posisjon. Tette investornettverk som kjenner hverandre ga snarveier til smart kapital, som igjen ga selskaper rakettvekst.

Begrensningne i personlige nettverk er samtidig at verden er stor, antallet og utbredelse av velfungerende økosystemer øker raskt, og de nye vinnerselskapene kommer i stadig større grad fra nye geografiske områder. I Katapult alene har vi investeringer i til sammen 146 selskaper fra 62 land.

I summen av våre databaser har vi i dag over 200 000 investorer fra hele verden, og vi kan koble porteføljeselskaper eller egne fond med kontakter og informasjon med hvem som helst av disse i løpet av sekunder. Ved hjelp av språkmodeller og databaser kan vi finne de 10-15 eller 100 mest aktive og kompetente investorene innen ett spesifikt felt, hvilken fase de investerer i, hvem de ofte investerer med, vanlig ticket size, hovedpunktene i investeringsstrategien, og det meste annet av data som for få år siden kun var tilgjengelig om du hadde en nær og personlig kontakt.

Poenget er ikke at AI vil erstatte varme introduksjoner, men allerede nå gjør det mulig å bygge investornettverk på steroider. Du kan bruke mindre tid på tilfeldige konferanser, og mer på å bygge og pleie relasjoner med de som har den beste strategiske match, og ikke minst lete fram investorer som matcher og som du før ikke visste fantes.

På den måten gir AI oss allerede en supermuskel i det som er den aller viktigste jobben i tillegg til å finne vinneren: Å finne strategiske riktige investorer som sikrer videre vekst, og ikke minst investorer og LPer som matcher våre investeringsstrategier og fond. De er det mange av globalt, og kun de færreste finnes i eget lokalt økosystem eller eksisterende nettverk.

Sånn sett fungerer språkmodelleler og nye databaser som lyskastere inn i et globalt nettverk av investorer som alltid overgår tilfeldigheten i personlige nettverk. De erstattes ikke, men de kan bygges raskere og veldig mer presist. Varme introduksjoner blir enda varmere når de er presise. Får du en treffsikker anbefaling fra noen som har gjort leksa si - gjerne med hjelp av ChatGPT - så forblir relasjonen fortere varm, enn når du får enda en introduksjon av han som hver gang kommer med tips som er litt halveis.

For ikke mer enn 10 år siden kom flertallet av vellykkede tech startups fra Silicon Valley. Det var også der de lendende VC-miljøene var. Siden da har det vokst fram solide økosystemer spredt over hele verden, og i EU alene kom de nesten 100 nye VC-fond bare i 2022. For 10 år siden var det også mulig å bygge et globalt ledende nettverk ved å delta på afterworks på Sand Hill Road en gang i uka. Selv om Sand Hill Road fortsatt er viktigere enn Wall Street for finansiering av tech startups, så er den tiden definitivt over.

The Tech Hype - Er det anderledes denne gangen?

Det er vanskelig for den menneskelige hjerne å gripe “the power law” og forstå eksponentielle mønstre som preger de fleste nye teknologier. Og selv om det teoretisk forstås og modellereres så viser historien at erkjennelsen kommer for sent. I de mange tech-revolusjonene som har kommet de siste tyve årene har man også blitt “trett” og sløvet at “revolusjonerende” teknologi, og mye nytt blir lansert med den samme “hype”-retorikken hvert år.

VR og augmented reality skulle gi oss Metaverse og nye visuelle grensesnitt, Web3, Blockchain og krypto, skulle demokratisere kreative næringer og eierskap til digital produksjon, og vi kan legge til en endeløse rekke nye “tech-fenomener” som ikke har blitt som spådd. Selv om AI har vært høyt på listen i et par tiår, så er det akkurat nå ChatGPT og DallE som leder ann. Da gjelder det å skille snørr og smoothie. Noen teknologier utgjør ganske enkelt mer fundamentale endringer.

Når AI griper rett inn språket, det mest eksistensielle verktøyet mennesket har for å forstå verden, og for å skape mening, og på stadig flere områder gjør jobben bedre enn vi klarer selv, så er det noe annet enn innovative produksjonsmidler. Det er også noe annet enn en ny industriell revolusjon. Det er mer fundamentalt.

Hvem skal ut?

I følge forskerne og noen av de aller beste utviklerne innen AI så skal alle ut. Mange av de ledende miljøene i verden ba også nylig om at videre utvikling av de mest kraftfulle modellene stoppes inntil bedre regulering er på plass. Det skjer nok ikke, og gjennomgangstonen blant ekspertisen er at vi nærmere oss AI som en eksistensiell trussel.

Ressonnementet er forenklet at når vi skaper kunstig intelligens som gjør seg selv smartere, så mister vi kontrollen. Da er det ikke lenger programmereren som programerer, men modellene selv. Måler vi utviklingen av datakraften i “FLOPS” (Floating-point Operations Per Second) så er “gamle Moores law”, som spådde at doblingen av datakraft skjer hver 20. mnd, allerede utdatert. Vi er nå nede på hver 6 mnd. Samtidig eksploderer tilgjengeligheten av og produksjonen av data, og spørsmålet er om vi fortsatt har kontroll.

Tilgjengelige databaser for oppstartselskaper, kvaliteten på disse, enkelheten i bruk, har eksplodert siste året. Det vi vet er at denne utviklingen ikke kommer til å bremse, og man trenger ikke tro på de mest dystopiske forskerne og ekspertene for å forstå at også kjernen i venture og VC-investeringer vil endres for alltid.

Å analysere selskaper og kunnskapen som trengs for å plukke vinnere, å kunne matche porteføljeselskaper eller egne fond med de riktigeinvestorene, og ikke minst utvikle enkeltselskaper og monitorere portefølje, er alle områder som er i ekstremt rask endring.

Algoritmer og store språkmodeller spiser foretningsmodeller til frokost, jobber til lunsj, og skaper minst like mange nye. Det eneste som er sikkert er at du ikke vil stå igjen på perrongen om fondet ditt skal konkurrere med AI toget som allerede har kjørt. Da skal du ut.