C-Eval
C-Eval官网
大语言模型的多层次多学科中文评估套件
网站服务:C-Eval。
C-Eval 是一个全面的中文基础模型评估套件。它包含了13948个多项选择题,涵盖了52个不同的学科和四个难度级别,如下所示。 通过 C-Eval 试题的测试后得到了一份中文大语言模型的排行榜,其中表现最好的是来自 是由清华大学和智谱 AI 联合研发的第二代 GLM 系列对话语言模型,其次是GPT – 4模型。
C-Eval网址入口
https://cevalbenchmark.com/index_zh.html#home_zh
小编发现C-Eval网站非常受用户欢迎,请访问C-Eval网址入口试用。
收录说明:
1、本网页并非 C-Eval 官网网址页面,此页面内容编录于互联网,只作展示之用;
2、如果有与 C-Eval 相关业务事宜,请访问其网站并获取联系方式;
3、本站与 C-Eval 无任何关系,对于 C-Eval 网站中的信息,请用户谨慎辨识其真伪。
4、本站收录 C-Eval 时,此站内容访问正常,如遇跳转非法网站,有可能此网站被非法入侵或者已更换新网址,导致旧网址被非法使用,
5、如果你是网站站长或者负责人,不想被收录请邮件删除:i-hu#Foxmail.com (#换@)
前往AI网址导航