Pantera Capital與Franklin Templeton加入Sentient Arena平台評估企業級AI代理
開源AI實驗室Sentient推出名為Arena的生產級基準測試平台,用於在企業導向工作流程中測試AI代理,首期參與方包括Pantera Capital及Franklin Templeton的數碼資產部門。該平台讓AI代理在處理長篇文件、不完整數據及互相衝突資訊等標準化任務下接受測試,並記錄如幻覺與缺失證據等失誤類別。Sentient計劃推出公開排行榜,隨着金融及加密貨幣行業加緊探索更具自主性的AI系統,相關治理與可靠性評估需求正同步上升。Sentient向Cointelegraph披露了這一計劃。