https://livebench.ai/ 2024年6月上线,Yann LeCun 联合 Abacus.AI,纽约大学等机构推出。 世界上第一个无法被操纵的大语言模型基准测试,包含 6 大类 18 项任务。 每个月发布新问题。