PANews a rapporté le 27 février que, selon Cointelegraph, le laboratoire d’IA open source Sentient a annoncé le lancement d’Arena, un environnement de test de qualité production pour évaluer les performances des agents IA dans les flux de travail au niveau des entreprises. Les divisions d’actifs numériques de Pantera Capital et Franklin Templeton ont rejoint la première cohorte de test d’Arena.
Sentient a indiqué qu’Arena n’est pas un test statique de modèle, mais teste plutôt l’agent IA sur une tâche standardisée en simulant les conditions d’entreprise avec de longs documents, des informations incomplètes et des sources contradictoires. La plateforme suit les catégories d’échecs telles que les hallucinations, les preuves manquantes, les erreurs de citation et les vulnérabilités de raisonnement afin d’aider les développeurs à diagnostiquer les problèmes. Arena prévoit de publier des indicateurs de performance comparatifs via des classements publics et de publier des rapports de test résumant les schémas de défaillance courants et les correctifs.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
Supériorité en matière de chiffrement : Zcash et Privacy à l’ère de l’échelle
L’essai aborde les progrès de l’apprentissage automatique pour la classification des transactions Bitcoin, met en évidence l’utilisation croissante des transactions protégées de Zcash et décrit la croissance de la liquidité décentralisée permettant de contourner la KYC. Il traite également des initiatives post-quantiques de Zcash et de sa récente restructuration organisationnelle.
CoinDeskIl y a 2h
Aave perd son responsable clé des risques, Chaos Labs, au milieu d’une vague de départs de contributeurs et de différends
Chaos Labs quitte Aave, mettant en évidence des frictions internes liées à l’évolution de la stratégie du protocole et un décalage dans la gestion des risques. Malgré son historique de réussite, la société invoque une économie non viable et une complexité opérationnelle accrue comme raisons de son départ, soulevant des inquiétudes au sujet de la future gestion des risques d’Aave.
CoinDeskIl y a 3h
Polymarket révèle une « mise à niveau complète de l’échange » pour reprendre le contrôle de ses propres transactions et de la vérité
Polymarket prévoit de lancer un nouveau jeton de collatéral adossé à l’USDC, Polymarket USD, dans le cadre d’une mise à niveau complète de la plateforme. Cette démarche vise à renforcer le contrôle sur le règlement et la liquidité. L’éventuelle introduction d’un token POLY pour la gouvernance pourrait encore affiner l’intégrité du marché, à la suite de controverses dans son système de gouvernance actuel.
CoinDeskIl y a 3h
Io.net cible les coûts du cloud IA grâce à un réseau décentralisé de GPU
Io.net propose une solution décentralisée pour le calcul IA, répondant aux coûts croissants auxquels font face les développeurs. Elle offre une capacité GPU abordable, à la demande, dans le but de combler l’écart pour les petits innovateurs sur un marché dominé par des dépenses élevées.
BlockChainReporterIl y a 4h
Polymarket lancera le moteur de trading V2 et la stablecoin native Polymarket USD dans les 2 à 3 prochaines semaines
Annonce de Polymarket : une mise à niveau majeure aura lieu dans les 2 à 3 prochaines semaines, comprenant notamment la refonte du moteur de trading, l’introduction de Polymarket USD et l’optimisation de l’efficacité de l’appariement. Cette mise à niveau est la plus importante depuis le lancement de la plateforme : elle améliorera l’efficacité des transactions et réduira les inquiétudes des utilisateurs concernant les actifs non officiels.
GateNewsIl y a 4h
Les principaux contributeurs d’Aave DAO, Chaos Labs, annoncent leur départ
Nouvelles de la passerelle : message, selon les informations de gouvernance, le contributeur clé Chaos Labs s’est retiré de l’Aave DAO. Auparavant, BGD et ACI avaient quitté cette organisation DAO à leur tour.
GateNewsIl y a 4h