(function(){var el = document.createElement("script");el.src = "https://lf1-cdn-tos.bytegoofy.com/goofy/ttzz/push.js?0fd7cab5264a0de33b798f00c6b460fb0c1e12a69e1478bfe42a3cdd45db451bbc434964556b7d7129e9b750ed197d397efd7b0c6c715c1701396e1af40cec962b8d7c8c6655c9b00211740aa8a98e2e";el.id = "ttzz";var s = document.getElementsByTagName("script")[0];s.parentNode.insertBefore(el, s);})(window)

Chatbot Arena

古风汉服美女图集

Chatbot Arena 也被成为聊天机器人竞技场,它是由LMSYS Org 创建的一个 大语言模型(LLM、对比竞技平台,通过对比后并将这个大语言模型(LLM、进行排名。最新一期大语言模型(LLM、排行榜出炉,GPT4 依旧是独领风骚,排在第二位的是 Claude-v1 模型,GPT 3.5 turbo 排名第四。
 目前该平台通过三种评分机制,来对比哪个聊天机器人实力最强。这三个机制分别是Arena Elo rating 、MT-bench 、MMLU 其中第一个Arena Elo rating 评分系统类似于王者荣耀中的elo匹配机制,它把各家的聊天机器人当做玩家,让他们之间随机对战,通过4万多名用户投票来进行elo评级。

  • Chatbot Arena – 一个众包、随机的战斗平台。我们使用 40K+ 用户投票来计算 Elo 评级。
  • MT-Bench – 一组具有挑战性的多回合问题。我们使用 GPT-4 对模型响应进行评分。
  • MMLU(5-shot、——衡量模型在 57 项任务上的多任务准确性的测试。

 


Chatbot Arena
收录说明:
1、本网页并非 Chatbot Arena 官网网址页面,此页面内容编录于互联网,只作展示之用;
2、如果有与 Chatbot Arena 相关业务事宜,请访问其网站并获取联系方式;
3、本站与 Chatbot Arena 无任何关系,对于 Chatbot Arena 网站中的信息,请用户谨慎辨识其真伪。
4、本站收录 Chatbot Arena 时,此站内容访问正常,如遇跳转非法网站,有可能此网站被非法入侵或者已更换新网址,导致旧网址被非法使用,
5、如果你是网站站长或者负责人,不想被收录请邮件删除:i-hu#Foxmail.com (#换@)

前往AI网址导航
© 版权声明

相关文章