OpenAI heeft aangekondigd dat de spraakfunctie van ChatGPT voortaan volledig is geïntegreerd in de hoofdinterface. Gebruikers kunnen nu tijdens een voicegesprek meteen meelezen met realtime transcripties en tegelijkertijd visuele elementen bekijken, zoals kaarten en afbeeldingen. Dat bevestigt OpenAI in een update die dinsdag werd gepubliceerd .
Met deze verandering verdwijnt de afzonderlijke spraakmodus met de bekende blauwe animatiebol. Voorheen konden gebruikers wel luisteren naar antwoorden, maar niet tegelijk de tekstweergave of extra content zien, waardoor zij steeds moesten wisselen tussen schermen. De nieuwe update maakt een einde aan die beperking.
Naadloze multimodale ervaring
De nieuwe spraakmodus is beschikbaar op zowel mobiele apparaten als in de webversie. Door op het waveform-icoon naast het tekstveld te tikken, kunnen gebruikers direct een voicegesprek starten. Terwijl zij spreken, verschijnen de transcripties zichtbaar in beeld. OpenAI meldt dat ChatGPT nu ook tijdens gesprekken relevante visuals toont.
Volgens voorbeelden van OpenAI laat de interface bijvoorbeeld een kaart zien met populaire bakkerijen, inclusief foto’s, terwijl de gebruiker vragen stelt over locaties of producten.
Gebruikers moeten nog steeds handmatig op “End” tikken om het voicegesprek te beëindigen voordat ze terugkeren naar tekstinput.
Gebruikersbehoud: oude modus blijft beschikbaar
Hoewel de geïntegreerde spraakmodus nu de standaard is, kunnen gebruikers die de oude audio-only interface prefereren deze blijven gebruiken. In de instellingen kan onder Voice Mode de optie “Separate mode” worden geactiveerd.
De wijziging past in een bredere trend waarin OpenAI inzet op multimodale AI, waarbij spraak, beeld en tekst naadloos kunnen worden gecombineerd. Ook concurrenten, zoals Google met Gemini Live, onderzoeken manieren om visuele aanwijzingen en overlays toe te voegen tijdens voicegesprekken.
Relevantie voor ondernemers
Voor ondernemers die AI-tools inzetten voor klantcontact, service of productadvies betekent de update een stap richting natuurlijkere en snellere interactie. Door spraak te combineren met beeld, kaarten en real-time tekst, wordt de functionaliteit breder toepasbaar voor bijvoorbeeld supportafdelingen, verkoopteams en digitale assistants.
