OpenAI introduces an advanced voice mode for its ChatGPT desktop application, available on Windows and Mac, allowing users to engage in natural conversations with their computers. This native voice synthesis can comprehend spoken language nuances and context. Users can interact with the AI while multitasking, enhancing productivity. Future updates promise even more capabilities, including real-time API functionalities and AI agents that could revolutionize our interaction with technology, making it more conversational and efficient.
OpenAI a enfin lancé le mode vocal avancé pour les ordinateurs de bureau, désormais accessible via les versions Windows et Mac de l’application ChatGPT. Ce mode fonctionnera de la même manière que la version mobile, permettant aux utilisateurs d’engager de véritables conversations avec leur ordinateur.
Contrairement aux interactions limitées avec des assistants vocaux comme Siri ou Alexa, cette nouvelle fonctionnalité permet une communication plus naturelle, simulant un échange humain. Advanced Voice intègre une technologie de synthèse vocale de pointe, capable de comprendre les nuances de votre discours, y compris votre ton et les pauses.
Comment utiliser Advanced Voice sur desktop ?
Pour accéder à Advanced Voice sur l’application de bureau, il suffit de cliquer sur l’icône dédiée dans la barre de chat. Une fois activée, une interface aux couleurs dégradées s’ouvre, vous invitant à commencer la conversation.
Ce qui est particulièrement intéressant, c’est que vous pouvez continuer à interagir avec l’IA tout en étant occupé par d’autres tâches. Bien qu’elle ne puisse pas voir ce que vous faites, vous pouvez lui décrire votre activité. Par exemple, si vous jouez à un jeu comme Minecraft, vous avez la possibilité de lui narrer la scène, et elle saura vous recommander des constructions ou des éléments à utiliser.
Le lancement d’Advanced Voice sur les ordinateurs est une avancée significative pour OpenAI, consolidant ainsi la position de ChatGPT en tant qu’outil de productivité complet. Engager une conversation avec l’IA ouvre la porte à la génération d’idées et à la réalisation de tâches qui pourraient autrement sembler intimidantes. À l’avenir, avec l’évolution des agents d’IA, il pourrait même être possible de lui demander de gérer certaines tâches spécifiques sur votre écran.
À quoi s’attendre ensuite ?
Bien que le mode Advanced Voice soit un ajout précieux, c’est l’API en temps réel qui offre un potentiel encore plus vaste. Lors d’une récente présentation, Romain Huet, responsable des relations avec les développeurs chez OpenAI, a démontré avec succès comment cette technologie peut animer des explorations interactives, comme un voyage à travers le système solaire, en répondant à des questions en toute fluidité.
Dans une autre démo, il a montré comment utiliser l’IA en tant qu’agent de voyage virtuel. Ce système ne se limite pas à réserver un vol : il peut également vous aider à dénicher les meilleures offres en interagissant avec vos besoins spécifiques, surpassant ainsi l’approche standard des appels automatisés.
Ces fonctionnalités innovantes seront bientôt disponibles, non seulement dans les applications d’OpenAI, mais également dans celles d’autres développeurs au fil des mois et des années à venir. La voix pourrait bien devenir le moyen principal d’interaction avec nos ordinateurs, révolutionnant notre quotidien numérique.
Il ne reste plus qu’à trouver un outil de dictée performant pour éviter de passer des heures à corriger les erreurs de transcription que ma voix laisse derrière elle.