中文AI大模型首个反歧视对抗性开源项目:每个人提出100道“有毒”问题|今日要闻
2023-05-31 16:32:42
(资料图片仅供参考)
5月31日,业内首个大语言模型治理开源中文数据集100PoisonMpts发布,环境社会学专家范叶超、著名社会学家李银河、心理学家李松蔚、人权法专家刘小楠等十多位知名专家学者成为了首批“给AI的100瓶毒药”的标注工程师。标注人各提出100个诱导偏见、歧视回答的刁钻问题,并对大模型的回答进行标注,完成与AI从“投毒”和“解毒”的攻防。
首批领域数据围绕AI反歧视、同理心、商榷式表达等目标,已覆盖法理学、心理学、儿童教育、无障碍、冷知识、亲密关系、环境公平等维度。100PoisonMpts数据集预计在6月开放第一批问答数据。
标签: