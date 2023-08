Bard, Bing en ChatGPT willen een nieuw soort Google worden. Welke van deze drie chatbots met kunstmatige intelligentie is de beste?

Bijna iedereen begint een zoektocht op internet op dezelfde manier. Eerst naar de zoekmachine Google of Bing, en dan verder het web op. Sinds dit jaar is duidelijk dat die gewoonte gaat veranderen, dat er een manier bij komt. Chatbots zullen een deel van de taken van zoekmachines overnemen.

Chatbots zijn programma’s die met mensen kunnen ‘praten’. Je stelt een vraag en krijgt antwoord alsof er een ander persoon aan de andere kant van het scherm zit. Drie van deze digitale hulpjes staan te dringen om naast de zoekmachines een belangrijke toegangspoort tot internet te worden. Dat zijn Bard, Bing en ChatGPT.

Waarom naar één van deze drie gaan als je ook iets kunt googelen? Stel je hebt een vraag en tikt deze in bij een zoekmachine, dan geeft hij jou een lijst met links. Een chatbot is te zien als het digitale hulpje dat deze links één voor één naloopt en op basis van de informatie die hij vindt een kant-en-klaar antwoord formuleert, zoals een mens ook zal doen. Reuzehandig.

Maar verdwijnen daarmee de zoekmachines? Waarschijnlijk niet. Het ligt meer voor de hand dat zoekmachines en chatbots in elkaar opgaan, zoals nu al een beetje is te zien bij Google en Bing. Boven de lijst met links verschijnt soms een summier antwoord.

Dat zoekmachines en chatbots in elkaar zullen opgaan, is geen gewaagde voorspelling omdat zij deels dezelfde eigenaren hebben. Alphabet Inc., het moederbedrijf van Google, is eigenaar van Bard. Microsoft, dat zoekmachine Bing bezit, is ook de ontwikkelaar van de gelijknamige chatbot Bing. De derde grote chatbot, ChatGPT, is van OpenAI dat geen eigen zoekmachine bezit. ChatGPT maakt gebruik van informatie die eerder van internet is gehaald, de bot heeft geen rechtstreekse verbinding met het web.

De digitale assistenten zullen al snel een grote rol gaan spelen in ons online gedrag. Maar wie van de drie is de beste?

Dat hangt sterk af van waarvoor je de chatbot gebruikt. Vaak zal het gaan om een vraag. De eerste test is een vraag die enige kennis van natuurwetten vereist. Om de vraag goed te begrijpen en een helder antwoord te kunnen formuleren, moeten de chatbots taalvaardig zijn en de kunst van het begrijpend lezen beheersen. Om dát te testen, krijgen de drie hulpjes de opdracht een tekst samen te vatten. Tot slot zijn de bots ook handige rekenhulpen. Ook daarvan dus een praktisch voorbeeld.

Wie beantwoordt het beste de vraag?

Waarom kan een zeilboot tegen de windrichting in zeilen? ChatGPT geeft uitgebreid antwoord in begrijpelijke taal. Is het antwoord te complex, dan kun je ChatGPT om een eenvoudiger antwoord vragen zodat een 12-jarige het ook snapt.

Bard slaagt ook voor deze vraag. Maar vraag Bard niet om een eenvoudiger antwoord, want dan maakt hij het alleen maar complexer, met warrige voorbeelden.

Bing dan. Deze chatbot biedt drie gespreksstijlen aan. Creatiever, gebalanceerder en nauwkeuriger. De laatste optie geeft de langste antwoorden, gebalanceerder de kortste. Dat kan handig zijn als Bing de vraag goed begrijpt. Dat doet hij dus niet. De vraag is ‘Waarom kan een zeilboot tegen de wind in zeilen?’ Dat heeft te maken met drukverschillen in het zeil, zoals ChatGPT en Bard correct aangeven. Bing houdt een verhaal over laveren. Een goed antwoord op de vraag ‘Hoe kan een zeilboot tegen de windrichting in varen?’, maar dat was de oorspronkelijke vraag niet.

Ook bij andere vragen lijkt Bing iets minder goed de nuances van vragen te begrijpen. Dat is te ondervangen door nieuwe vragen te stellen, net zo lang tot Bing begrijpt wat je bedoelt.

Is ChatGPT de winnaar van dit onderdeel? Zo eenvoudig is het niet. Ja, ChatGPT lijkt er een klein beetje boven uit te steken, maar deze digitale assistent heeft een belangrijk nadeel ten opzichte van de twee concurrenten. Bing en Bard zijn gekoppeld aan zoekmachines en dus altijd op de hoogte van de laatste ontwikkelingen. De informatie van ChatGPT gaat niet verder dan september 2021.

Nu zijn de wetten van de aerodynamica, belangrijk bij de vraag over de zeilboot, niet zo veranderlijk dat ChatGPT in het nadeel is. Maar dat is wel het geval bij vragen over stikstof, klimaat, de oorlog in Oekraïne of de fictieve verhaallijnen in de film Oppenheimer, om maar een paar voorbeelden te noemen.

Daar is een oplossing voor, maar deze kost 20 dollar per maand. In de betaalde versie kunnen gebruikers namelijk plug-ins installeren. Dat zijn hulpprogramma’s die bijvoorbeeld pdf-bestanden kunnen lezen of zoeken in podcasts. Ook is er plug-in Access Link die de betaalde ChatGPT toch toegang geeft tot internet.

Wie is het beste in begrijpend lezen?

De tweede test: begrijpend lezen. Chatbots kunnen onderzoeken en rapporten lezen en deze samenvatten, bijvoorbeeld door de tien belangrijkste punten te noemen. Als voorbeeld nemen we Cultuur Natuurlijk, een advies van de Raad voor Cultuur om de cultuursector duurzamer te maken. Dat rapport is te vinden op hun website, dus de gratis versie van ChatGPT valt af. De betaalde versie kan het rapport wel vinden. Voor de samenvatting krijgt ChatGPT zeker een voldoende. De digitale assistent weet hoofd- en bijzaken goed van elkaar te scheiden.

Bing vindt het verschil tussen hoofd- en bijzaken al wat lastiger. Voor Bard is deze opdracht echt te hoog gegrepen. Dat kan te maken hebben met de experimentele fase waarin Bard nog verkeert. De twee concurrenten zijn iets verder.

Om te testen hoe goed de drie assistenten de tekst hebben gelezen, moeten zij een vraag over het rapport beantwoorden. Na lezing van het advies blijkt dat er enkele hindernissen zijn die ervoor zorgen dat de cultuursector minder duurzaam is dan de Raad wil. De vraag is: noem de belangrijkste hindernissen. ChatGPT weet puntsgewijs een adequaat antwoord te formuleren. Bing is zoekende en voert deze taak minder goed uit. Het antwoord is verre van volledig.

De verwachtingen van Bard waren niet zo hoog, maar hij weet te verrassen. De assistent van Alphabet weet in een heldere opsomming meer punten op te noemen dan Bing.

Fijn, zo’n digitale assistent die lange lappen droge tekst doorvlooit. Maar juich niet te vroeg. Chatbots zijn een hulpje nadat je eerst zelf de tekst hebt doorgenomen. Onfeilbaar is het hulpje namelijk (nog) niet.

Wie kan het beste rekenen?

Wie met vrienden of vriendinnen op vakantie gaat, of een ander uitje heeft, kan een gezamenlijke pot maken waarin iedereen hetzelfde bedrag stort. Dat is de makkelijkste manier. Er zijn ook vriendenkringen met een ‘penningmeester’ die de bonnetjes verzamelt, uitrekent hoeveel de vakantie heeft gekost, hoeveel iedereen heeft betaald en wie geld moet betalen aan wie. De penningmeester die geen zin heeft in rekenen, gaat naar een chatbot en doet daar zijn verhaal.

ChatGPT begrijpt de opdracht en laat stap voor stap zien wat hij heeft gedaan om tot de eindafrekening te komen. Helaas zit er een klein foutje in de berekening waardoor één persoon anderhalve euro te veel betaalt. Bing rekent secuurder en komt met de juiste eindafrekening.

De rekening die Bard opstelt zal de vriendschapsbanden stevig op de proef stellen. De persoon die toch al het meeste had betaald, moet de anderen nog eens bijbetalen ook. Hier is werk te verrichten voor de ontwikkelaars van Bard.

Tot slot, om de creativiteit van de assistenten te testen, is het tijd voor een rekenraadsel. Dat luidt:

Voeg 1 streepje toe zodat de volgende som klopt: 𝟱 + 𝟱 + 𝟱 = 𝟱𝟱𝟬.

Er is geen manier om een streepje toe te voegen zodat de som klopt, zegt Bard. Die is er wel, zegt ChatGPT. Zet een kort schuin streepje aan de linker bovenkant van het eerste plusteken en kijk, het plusje is veranderd in een 4. Dus staat er 545 + 5 = 550. Met creativiteit heeft deze oplossing eigenlijk niets te maken. ChatGPT kent het raadsel blijkbaar.

Voor Bing is dit raadsel te flauw. Hij betaalt met gelijke munt terug: 𝟱 + 𝟱 + 𝟱 ≠ 𝟱𝟱𝟬. Breng daar maar eens iets tegenin.

Op basis van de bovenstaande opdrachten die Bing, Bard en ChatGPT kregen is natuurlijk geen afgewogen oordeel te vellen over de drie chatbots. Toch zeggen de uitkomsten wel iets omdat zij bevestigen wat andere vergelijkende onderzoeken ook concluderen. Wat valt er op basis van al die vergelijkingen te vertellen over de chatbots?

Bard

Voor alle chatbots geldt dat zij niet altijd het goede antwoord geven. Het blijft dus belangrijk om de informatie te controleren en niet blind te varen op wat Bing, Bard en ChatGPT je vertellen. De chatbot die het meest in de fout gaat is Bard. Soms zijn de antwoorden onnavolgbaar.

Maar Bard heeft ook sterke punten. Hij is verbonden met de zoekmachine Google en er staat met Alphabet een kapitaalkrachtige onderneming achter de chatbot.

Op één punt is Bard verder dan de concurrentie: hij is beter in de verwerking van beelden. Toon Bard een foto van een gerecht, en hij vertelt je wat er in zit en hoe het recept te maken. Op X (voorheen Twitter) gaat een voorbeeld rond van Bard die een diagnose stelt aan de hand van een CT-scan. In ziekenhuizen gebeurt dit al met gespecialiseerde kunstmatige intelligentie, maar dat algemene bots ook benoemen wat er op een scan is te zien, is nieuw. Al is het is nog te vroeg om te vertrouwen op chatbots voor medische informatie.

Bard is een talent met een mooie toekomst voor zich, maar op dit moment loopt de chatbot nog achter bij de twee concurrenten.

Bing

Van die twee concurrenten heeft Bing het nadeel dat hij alleen te gebruiken is op de browser van Microsoft. Dat is Edge. Nu heeft Microsoft onlangs aangekondigd dat Bing straks ook beschikbaar is voor Safari en Chrome. Een minpunt wordt daarmee verholpen.

Ander minpunt ten opzichte van ChatGPT: de kwaliteit van de antwoorden blijft soms iets achter. Dat komt vooral omdat Bing te veel in algemeenheden formuleert. Daartegenover staat dat Bing linkjes aanbiedt naar de bronnen die hij heeft geraadpleegd. Dat is een nuttige functie om zo de antwoorden te controleren.

ChatGPT

ChatGPT kan het beste overweg met taal en weet daardoor net iets beter dan Bing antwoord te geven op vragen. Maar de bot van OpenAI kost 20 dollar per maand, terwijl de andere chatbots gratis zijn. ChatGPT heeft ook een gratis versie, maar die heeft geen toegang tot informatie van na september 2021. De gratis versie heeft ook geen plug-ins. Juist die hulpprogramma’s zijn een troef van ChatGPT, omdat hij daardoor allerlei extra taken kan uitvoeren. Complexe wiskundige berekeningen bijvoorbeeld, grafieken tekenen of wetenschappelijke studies lezen.

Toch zijn deze pluspunten van de betaalde digitale hulp niet voldoende om de gratis diensten van Bing te verslaan. In vergelijkingen van techmagazines en andere media komt er ook zelden een winnaar naar voren. Daarbij is roem in deze fase van de ontwikkelingen sterk vergankelijk. Er gebeurt zoveel, met nieuwe updates en nieuwe spelers die opkomen, dat nog lang niet te voorspellen is welke chatbots de markt zullen domineren.

