HELM

微草AIGC录1年前 (2024)发布 873b2a563b3acc92

HELM全称Holistic Evaluation of Language Models（语言模型整体评估、是由斯坦福大学推出的大模型评测体系，该评测方法主要包括场景、适配、指标三个模块，每次评测的运行都需要指定一个场景，一个适配模型的提示，以及一个或多个指标。它评测主要覆盖的是英语，有7个指标，包括准确率、不确定性/校准、鲁棒性、公平性、偏差、毒性、推断效率；任务包括问答、信息检索、摘要、文本分类等。

HELM
收录说明：
1、本网页并非 HELM 官网网址页面，此页面内容编录于互联网，只作展示之用；
2、如果有与 HELM 相关业务事宜，请访问其网站并获取联系方式；
3、本站与 HELM 无任何关系，对于 HELM 网站中的信息，请用户谨慎辨识其真伪。
4、本站收录 HELM 时，此站内容访问正常，如遇跳转非法网站，有可能此网站被非法入侵或者已更换新网址，导致旧网址被非法使用,
5、如果你是网站站长或者负责人，不想被收录请邮件删除：i-hu#Foxmail.com （#换@）

前往AI网址导航

# 微草AIGC录 # AI模型评测

文章版权归作者所有，未经允许请勿转载。

HELM

Decktopus

zeroscope_v2_XL

相关文章