书生·浦语大模型实战营-第六节
输入“/”快速插入
书生·浦语大模型实战营-第六节
飞书用户6850
2月18日创建
文档:
https://github.com/InternLM/tutorial/blob/main/opencompass/opencompass_tutorial.md
视频:
为什么要对 LLM 评测
场景、模型众多,需要一个统一的评测方式
LLM 评测对各方面的好处
传统 NLP 任务
Image by NLPlanet
LLM 任务的评估指标