Wetenschapsters ontwikkelen open en transparant ki-zoeksysteem

Akari Asai

Akari Asai (afb: Carnegie Mellonuniversiteit)

Onderzoeksters hebben een open-bron-ki-systeem ontwikkeld dat goedkoop en transparant zou zijn en alle concurrente grote taalmodellen achter zich zou laten. Zou het nou niet enig zijn als een product van de wetenschap al die dikke, poenerige en energieverslindende systemen van de techbedrijven zou verslaan op alle fronten? En klap doet dan de zeepbel die ki heet (hoop ik=as) dan.
Het, voorgestelde, ki-systeem heet OpenScholar. Het is bedoeld om wetenschappelijke artikelen op te snorren. Het systeem put uit 45 miljoen wetenschappelijke artikelen en moet voorkomen dat een zoeksysteem met rare en nonsenscitaten uit wetenschappelijke artikelen komt.
Die ki-systemen bestaan al, maar die zijn zelden ‘open’ (broncode bekend) stelt auteur Akari Asai van de Carnegie Mellonuniversiteit. ‘Open’ betekent dat iedereen dat systeem gratis kan gebruiken maar ook op haarzijn eigen computer kan zetten en het systeem kan verbeteren om gepaste artikelen te zoeken.

Die zoeksystemen zijn steeds verder verbetert, maar OpenScholar kost slechts een fractie van de ki-systemen van de grote techbedrijven zoals GPT-5 van OpenAI, stellen de onderzoeksters. Het schijnt wel met gebreken te komen. Het komt niet altijd met de meest relevante of representatieve resultaten en is beperkt door de omvang van de databank. Ook met artikelen die achter betaalmuren liggen heeft OpenScholar moeite.

Nonsenscitaten

Grote taalmodellen kunnen veel, maar hebben moeite met citaten. Dat komt doordat ze via hun leerstof verbanden tussen woorden leggen en dan met een tekst komen op basis van mogelijke associaties (die niet hoeven te kloppen). Dat is inherent aan hoe veel ki-systemen zijn ingericht.

Daar zou OpenScholar geen of althans minder last van hebben. Asai: “We hebben een efficiënt systeem ontworpen waarbij het model één keer een antwoord genereert, maar dat vervolgens indien nodig continu verbetert.”
De databank van OpenScholar bevat artikelen tot oktober 2024, maar kan ook putten uit de acedemische zoekmachine Semantic Scholar van het Alleninstituut voor kunstmatige intelligentie in Seattle voor latere artikelen.

Ongetwijfeld zal er nog gesleuteld moeten worden aan OpenScholar, maar voorlopig lijkt dit wetenschappelijke zoeksysteem al beter dan wat de grote taalmodellen van de techbedrijven ervan maken. Is dat trouwens niet ook op andere terreinen te gebruiken dan het zoeken van de juiste wetenschappelijke artikelen en/of citaten?

Bronnen: Nature, Science

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie gegevens worden verwerkt.