OpenAI a récemment lancé son agent d’intelligence artificielle, Operator, tandis qu’un concurrent, Browser Use, propose un outil d’IA gratuit permettant d’exécuter des tâches en ligne sans abonnement. Browser Use, bien que complexe à configurer, a introduit une version cloud plus accessible. Des tests ont révélé son efficacité pour comparer des prix, planifier des voyages et fournir des prévisions météo. Toutefois, des limitations subsistent, notamment dans la formulation des requêtes et la vitesse d’exécution, le rendant plus adapté aux développeurs et passionnés d’automatisation.
La semaine dernière, OpenAI a dévoilé son premier agent d’intelligence artificielle, nommé Operator. Cependant, un concurrent audacieux a également fait surface, proposant un outil d’IA appelé Browser Use, capable d’effectuer des tâches en ligne pour vous. Cet agent utilisant un ordinateur (CUA) a la capacité d’écrire, de rechercher, de cliquer sur des boutons et de copier des informations de divers sites web, le tout sans que vous n’ayez à utiliser votre souris ou votre clavier, et sans nécessiter d’abonnement à 200 $ par mois pour ChatGPT Pro.
Browser Use est en réalité gratuit, à condition que vous soyez prêt à passer un certain temps à explorer le code API. Bien que je ne sois pas un expert en programmation, je pensais avoir une compréhension suffisante de GitHub pour utiliser la version API. Après des heures à naviguer dans la documentation, à ajuster des paramètres et à examiner des exemples, j’ai réalisé que cela nécessitait des compétences en codage plus avancées que les miennes, sans parler de celles de l’utilisateur moyen d’internet.
Heureusement, Browser Use a récemment lancé une version cloud qui exploite le modèle GPT-4o d’OpenAI. Cela allège une grande partie du travail technique complexe et présente les fonctionnalités dans un format de chat plus convivial, sans nécessiter d’efforts supplémentaires. Bien qu’il ait ses limites et coûte 30 $, cela semblait être une option raisonnable après mes difficultés avec l’API. Même dans cette version, encore clairement en développement, il faut toujours fournir un certain effort pour formuler des requêtes et comprendre le fonctionnement de l’IA. L’une des principales contraintes est que vous pouvez soumettre une seule requête avant de devoir entamer une nouvelle interaction. Malgré la présence d’une zone de texte, il n’est pas possible de répondre directement aux actions de l’IA et d’ajuster vos demandes.
Test de l’IA sur les prix
Après avoir tout configuré, j’ai soumis Browser Use à quelques tests pratiques. Pour commencer, j’ai demandé une comparaison de prix. J’ai écrit cette requête : ‘Naviguez sur Amazon, Best Buy et Walmart pour rechercher ‘MacBook Air M2′. Extraire le nom du produit, le prix et la disponibilité des cinq premiers résultats sur chaque site. Comparez les prix et identifiez le plus bas. Si des réductions ou des coupons sont disponibles, enregistrez-les. Fournissez un résumé final avec la meilleure offre et l’endroit où acheter.’
Browser Use a bien exécuté la tâche, même s’il n’a pas trouvé de réductions ou de coupons cachés. Néanmoins, le fait de pouvoir automatiser le suivi des prix sur plusieurs plateformes était très prometteur. Un défi récurrent pour tout agent comme celui-ci survient lorsque des sites web souhaitent vérifier si l’utilisateur est humain. Browser Use dispose d’un bouton qui vous permet de reprendre le contrôle à tout moment, tout en vous avertissant lorsqu’une vérification est nécessaire. Vous pouvez prouver votre humanité et ensuite cliquer sur « reprendre » pour que l’IA continue de travailler.
Planification de voyage avec l’IA
J’ai ensuite testé les capacités de Browser Use en matière de planification de voyage avec la requête suivante : ‘Recherchez un vol aller-retour de New York à Londres le 15 décembre 2025 sur British Air. Sélectionnez l’option la moins chère et extrayez les détails, y compris le prix, la compagnie aérienne et l’heure de départ.’
Browser Use a répondu en affichant un vol British Airways à 750 $, avec tous les détails pertinents. Cela pourrait s’avérer extrêmement utile pour ceux qui voyagent fréquemment, surtout si vous souhaitez automatiser la vérification des baisses de prix.
Prévisions météorologiques avec l’IA
Enfin, j’ai testé les prévisions météorologiques en formulant la demande suivante : “Vérifiez les prévisions météorologiques sur 7 jours pour New York sur weather.com et résumez les tendances de température, les chances de pluie et les alertes de temps sévère, puis suggérez comment s’habiller en conséquence.”
Étant donné que la météo est l’une des requêtes les plus courantes pour les assistants vocaux, je voulais évaluer la performance de l’IA sur une demande plus complexe. Elle a fonctionné efficacement, extrayant non seulement les informations de la prévision, mais suggérant également quels jours porter un manteau léger et quand il serait préférable de s’habiller chaudement en raison des températures fraîches et des faibles chances de pluie.
Comparaison des outils d’IA
La principale distinction entre Browser Use et d’autres outils similaires réside dans leur accessibilité. Browser Use agit comme un couteau suisse pour les développeurs, offrant une flexibilité presque illimitée pour effectuer diverses tâches dans un navigateur, tout en nécessitant une certaine expertise pour les utiliser efficacement. Vous pouvez explorer le code, l’adapter et le personnaliser selon vos besoins spécifiques. Si une fonctionnalité fait défaut, rien ne vous empêche de l’ajouter. De plus, en tant qu’outil open-source, Browser Use bénéficie d’une communauté de développeurs active qui contribue constamment à son amélioration. Cela signifie que si vous rencontrez des difficultés, des forums et discussions sur GitHub sont probablement à votre disposition pour trouver des solutions.
En revanche, l’Operator d’OpenAI est comparable à un majordome qui se charge de nombreuses tâches, mais avec certaines restrictions. Sa force réside dans son intégration avec l’écosystème IA d’OpenAI, lui permettant d’accéder à des modèles propriétaires qui peuvent effectuer des analyses plus nuancées. Cependant, cela vous soumet à la structure tarifaire d’OpenAI et à des options de personnalisation limitées.
Cependant, Browser Use n’est pas sans défaut. Même sa version cloud nécessite un peu de patience. Il est essentiel de formuler vos requêtes avec soin, de vous préparer à d’éventuels dépannages, et parfois de devoir recommencer. Bien que la version cloud puisse compenser une partie de ces frustrations à l’avenir, pour l’instant, l’impossibilité d’éditer ou de répondre dans la conversation limite sa flexibilité autrement prometteuse.
La vitesse d’exécution peut également s’avérer frustrante. Par exemple, regardez une vidéo de mon second test ; elle tourne à quatre fois la vitesse du processus réel.
Actuellement, Browser Use est idéal pour ceux qui aiment expérimenter, tels que les développeurs, les chercheurs et les passionnés d’automatisation qui n’hésitent pas à se plonger dans le code. Si vous êtes prêt à investir le temps nécessaire, vous découvrirez un outil puissant et adaptable qui est également beaucoup moins cher que ses concurrents.
D’un autre côté, si