De reis van een laboratoriumhypothese naar een apotheekschap is een van de meest slopende marathons in de moderne industrie, die doorgaans tien tot vijftien jaar en miljarden dollars aan investeringen beslaat.
Vooruitgang wordt vaak niet alleen belemmerd door de inherente mysteries van de biologie, maar ook door de ‘gefragmenteerde en moeilijk op te schalen’ workflows die onderzoekers dwingen handmatig te wisselen tussen de feitelijke experimentele ontwerpapparatuur, software en databases.
Maar OpenAI brengt een nieuw gespecialiseerd model uit GPT-Rosalind specifiek om dit proces te versnellen en efficiënter, eenvoudiger en idealiter productiever te maken. Vernoemd naar de baanbrekende scheikundige Rosalind Franklin, wiens werk cruciaal was voor de ontdekking van de structuur van DNA (en vaak over het hoofd werd gezien door haar mannelijke collega’s James Watson en Francis Crick), is dit nieuwe grensverleggende redeneermodel ontworpen om te fungeren als een gespecialiseerde intelligentielaag voor biowetenschappelijk onderzoek.
Door de rol van AI te verschuiven van een algemene assistent naar een domeinspecifieke ‘redeneringspartner’, signaleert OpenAI een langetermijnengagement voor biologische en chemische ontdekkingen.
Wat GPT-Rosalind biedt
GPT-Rosalind gaat niet alleen over snellere tekstgeneratie; het is ontworpen om bewijsmateriaal te synthetiseren, biologische hypothesen te genereren en experimenten te plannen – taken die traditioneel jaren van deskundige synthese door mensen vereisten.
In de kern is GPT-Rosalind de eerste in een nieuwe reeks modellen die zijn geoptimaliseerd voor wetenschappelijke workflows. Terwijl eerdere versies van GPT uitblonken in algemene taaltaken, is dit model verfijnd voor een dieper begrip van genomica, eiwittechnologie en chemie.
Om de mogelijkheden ervan te valideren, heeft OpenAI het model getest aan de hand van verschillende branchebenchmarks. Op BixBench, een echte benchmark voor bio-informatica en data-analyse, behaalde GPT-Rosalind toonaangevende prestaties onder de modellen met gepubliceerde scores.
Bij meer gedetailleerde testen via LABBench2 presteerde het model beter dan GPT-5.4 op zes van de elf taken, waarbij de grootste winst werd getoond in CloningQA – een taak die het end-to-end ontwerp van reagentia voor moleculaire kloneringsprotocollen vereist.
Het meest opvallende prestatiesignaal van het model kwam voort uit een samenwerking met Dyno Therapeutics. In een evaluatie met niet-gepubliceerde, “niet-verontreinigde” RNA-sequenties kreeg GPT-Rosalind de taak om de sequentie-naar-functie te voorspellen en te genereren.
Bij directe evaluatie in de Codex-omgeving scoorden de inzendingen van het model boven het 95e percentiel van menselijke experts op het gebied van voorspellingstaken en bereikten ze het 84e percentiel voor het genereren van sequenties.
Dit niveau van expertise suggereert dat het model kan dienen als een samenwerkingspartner op hoog niveau die in staat is ‘expert-relevante patronen’ te identificeren die generalistische modellen vaak over het hoofd zien.
De nieuwe laboratoriumworkflow
OpenAI publiceert niet alleen een model; het lanceert een ecosysteem dat is ontworpen om te integreren met de tools die wetenschappers al gebruiken. Centraal hierin staat een nieuw Life Sciences-onderzoeksplug-in voor Codex, beschikbaar op GitHub.
Wetenschappelijk onderzoek is beroemd in silo’s. Voor één enkel project kan het nodig zijn dat een onderzoeker een database met eiwitstructuren raadpleegt, twintig jaar aan klinische literatuur doorzoekt en vervolgens een afzonderlijk hulpmiddel gebruikt voor sequentiemanipulatie. De nieuwe plug-in fungeert als een ‘orkestratielaag’ die een uniform startpunt biedt voor deze uit meerdere stappen bestaande vragen.
-
Vaardigheden ingesteld: Het pakket omvat modulaire vaardigheden voor biochemie, menselijke genetica, functionele genomica en klinisch bewijs.
-
Verbinding: Het verbindt modellen met hierboven 50 openbare multi-omics-databases en literatuurbronnen.
-
Efficiëntie: Deze aanpak richt zich op ‘lange horizon, gereedschapszware wetenschappelijke workflows’, waardoor onderzoekers herhaalbare taken kunnen automatiseren, zoals het opzoeken van eiwitstructuren en het zoeken naar sequenties.
Beperkte en afgesloten toegang
Gezien de potentiële kracht van een model dat biologische structuren opnieuw kan ontwerpen, schuwt OpenAI brede ‘open source’- of algemene publieke releases ten gunste van een Trusted Access-programma.
Het model wordt gelanceerd als onderzoeksvoorbeeld, specifiek voor gekwalificeerde Enterprise-klanten in de VS. Deze beperkte implementatie is gebaseerd op drie kernprincipes: nuttig gebruik, sterk bestuur en gecontroleerde toegang.
Organisaties die om toegang verzoeken, moeten een kwalificatie- en veiligheidsbeoordeling ondergaan om ervoor te zorgen dat zij legitiem onderzoek uitvoeren met een duidelijk openbaar voordeel.
In tegenstelling tot reguliere modellen is GPT-Rosalind ontwikkeld met verhoogde beveiligingscontroles van bedrijfskwaliteit. Voor de eindgebruiker betekent dit:
-
Beperkte toegang: Gebruik is beperkt tot geautoriseerde gebruikers in veilige, goed beheerde omgevingen.
-
Bestuur: Deelnemende organisaties moeten strikte anti-misbruikcontroles handhaven en akkoord gaan met specifieke voorwaarden voor het bekijken van biowetenschappelijk onderzoek.
-
Kosten: Tijdens de previewfase verbruikt het model geen bestaande credits of tokens, waardoor onderzoekers kunnen experimenteren zonder onmiddellijke budgettaire beperkingen (onder voorbehoud van anti-misbruik).
Warme ontvangst door eerste industriële partners
De aankondiging kreeg veel steun van OpenAI-partners in de farmaceutische en technologische sector.
Sean Bruich, SVP AI en Data bij Amgen, merkte op dat de samenwerking het bedrijf in staat stelt geavanceerde tools toe te passen op manieren die “de manier waarop we medicijnen aan patiënten leveren, kunnen versnellen.” De impact is ook voelbaar in de gespecialiseerde technologische infrastructuur die laboratoria ondersteunt:
-
NVIDIAKimberly Powell, vicepresident gezondheidszorg en biowetenschappen, beschreef de convergentie van domeinredenering en versneld computergebruik als een manier om “jarenlange traditionele R&D te comprimeren in onmiddellijke, bruikbare wetenschappelijke inzichten”.
-
Modern: CEO Stéphane Bancel benadrukte het vermogen van het model om “complex biologisch bewijsmateriaal te doorgronden” om teams te helpen inzichten te vertalen naar experimentele workflows.
-
Allen Instituut: CTO Andy Hickl benadrukte dat GPT-Rosalind zich onderscheidt door handmatige stappen – zoals het vinden en aanpassen van gegevens – ‘consistenter en herhaalbaarder te maken in uitzendwerk’.
Dit bouwt voort op tastbare resultaten die OpenAI al in het veld heeft gezien, zoals de samenwerking met Ginkgo Bioworks, waar AI-modellen hielpen de eiwitproductiekosten met 40% te verlagen.
Wat is de toekomst voor Rosalind en OpenAI in de levenswetenschappen?
De missie van OpenAI met GPT-Rosalind is om de kloof te verkleinen tussen een ‘veelbelovend wetenschappelijk idee’ en het daadwerkelijke ‘bewijs, experimenten en beslissingen’ die nodig zijn voor medische vooruitgang.
Door samen te werken met instellingen als het Los Alamos National Laboratory om AI-gestuurd katalysatorontwerp en biologische structuurmodificatie te onderzoeken, positioneert het bedrijf GPT-Rosalind als meer dan alleen een hulpmiddel: het is bedoeld als een ‘capabele partner in ontdekking’.
Nu het veld van de levenswetenschappen steeds datadichter wordt, kan de beweging naar gespecialiseerde ‘redeneermodellen’ zoals Rosalind de standaard worden voor het navigeren door de ‘grote zoekruimtes’ van de biologie en scheikunde.


