2024 年《人工智能指数报告》是我们迄今为止最全面的一份,并且是在人工智能对社会的影响空前显著的重要时刻发布。今年,我们扩大了范围,更广泛地涵盖了一些关键趋势,如人工智能的技术进步、公众对该技术的看法以及围绕其发展的地缘政治动态。本版包含了比以往任何时候都多的原始数据,引入了对人工智能训练成本的新估计、对负责任的人工智能领域的详细分析,以及一个全新的章节,专门探讨人工智能对科学和医学的影响。
1.人工智能在某些任务上击败了人类,但不是在所有任务上。
人工智能已经在几个基准上超越了人类的表现,包括一些图像分类、视觉推理和英语理解。但它在更复杂的任务上落后,如竞赛级数学、视觉常识推理和规划。
2.工业界继续主导前沿人工智能研究。
2023年,工业界产生了51个著名的机器学习模型,而学术界只贡献了15个。2023年,产业界和学术界合作产生了21个值得注意的模型,创下新高。
3.前沿模型变得更加昂贵。
根据人工智能指数的估计,最先进的人工智能模型的训练成本已经达到了前所未有的水平。例如,OpenAI的GPT-4使用了价值约7800万美元的计算来训练,而谷歌的双子座超成本为1.91亿美元。
4.美国领先中国、欧盟和英国成为顶级人工智能模型的主要来源。
2023年,61个著名的人工智能模型来自美国机构,远远超过欧盟的21个和中国的15个。
5. 缺乏负责任AI的标准化基准报告
AI工具的基准效果很大程度上依赖于其标准化的方法和应用。然而,人工智能指数的研究显示,负责任AI的报告标准化程度严重不足。例如,OpenAI、谷歌和Anthropic等领先开发者大多用不同的负责任AI基准测试模型。这些使用不同基准的测试模型使我们更难做出比较,因为每个基准都有其特点。标准化的基准测试对提高AI能力的透明度至关重要。
6. 生成式AI的投资飙升
尽管2023年整体的AI私人投资有所下降,但对生成式AI的投资大幅增加。生成式AI领域去年吸引了252亿美元的投资,几乎是2022年的9倍、2019年的约30倍。2023年,生成式AI占所有AI相关私人投资的25%以上。
7.人工智能使员工更有效率,并带来更高质量的工作。****
2023年,几项研究评估了人工智能对劳动力的影响,表明人工智能使员工能够更快地完成任务,并提高他们的产出质量。这些研究还证明了人工智能弥合低技能和高技能员工之间技能差距的潜力。还有一些研究警告说,在没有适当监督的情况下使用人工智能会导致绩效下降。
8. AI越来越推动科学进步
人工智能指数指出,AI从2022年就开始推动科学发现,2023年则在推出科学相关的AI应用方面取得了更大的飞跃。例如,AI驱动化学机器人Synbot可用于合成有机分子,GNoME发现了适用于机器人和半导体制造等领域的稳定晶体等。
9.美国人工智能法规数量急剧增加。
美国人工智能相关法规的数量在过去一年大幅上升。2023年,美国有25项人工智能相关法规,而2016年美国只有一项AI法规出台。仅去年一年,美国人工智能相关法规的总数就增长了56.3%。欧盟通过的AI相关的法规数量从2022年的22项增加到2023年的32项。不过,2021年欧盟批准的法规最多,达到了46项。
10.人类更加认识到AI的潜在影响——也更加紧张。
Ipsos的一项调查显示,在过去的一年里,认为人工智能将在未来三到五年内极大地影响他们生活的比例从60%上升到66%。此外,52%的人对人工智能产品和服务表示紧张,比2022年上升了13个百分点。在美国,Pew数据显示,52%的美国人表示对人工智能感到担忧而不是兴奋,高于2022年的38%。
信息来源:斯坦福大学
更多信息请见:https://aiindex.stanford.edu/report/
2 个月前
CheXNet 是由斯坦福大学研究团队开发的一种深度学习模型,专门用于从胸部 X 光片中检测和诊断疾病。它基于卷积神经网络(CNN),最初是在 2017 年由 Pranav Rajpurkar、Jeremy Irvin 等研究人员在论文《CheXNet: Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning》中提出的。 CheXNet 的背景与目标 医学影像分析一直是人工智能在医疗领域的重要应用方向。胸部 X 光片是诊断多种胸部疾病(如肺炎、肺结节、心脏扩大等)的常见工具,但传统的诊断依赖放射科医生的人工判读,效率和准确性可能因医生的经验而异。CheXNet 旨在通过自动化分析达到甚至超过人类放射科医生的诊断水平,尤其是针对肺炎的检测。 技术原理 CheXNet 是基于 DenseNet-121(一种深度卷积神经网络架构)进行改进的模型。研究团队利用了 NIH(美国国立卫生研究院)发布的 ChestX-ray14 数据集,该数据集包含超过 10 万张胸部 X 光图像,标注了 14 种常见胸部疾病。CheXNet 在这个数据集上进行训练,能够同时预测这些疾病的存在与否。 具体来说: 输入:单张胸部 X 光图像。 输出:14 种疾病的概率分布(例如肺炎、肺气肿、胸腔积液等)。 创新点:通过微调 DenseNet-121 的最后一层,CheXNet 不仅能检测单一疾病,还能处理多标签分类任务(即一张图像可能同时存在多种疾病)。 在测试中,CheXNet 的表现尤其在肺炎检测上达到了放射科医生的水平,其 ROC 曲线下面积(AUC)超过了 0.76,显示出较高的敏感性和特异性。 应用与影响 CheXNet 的开发展示了 AI 在医学影像诊断中的潜力,尤其是在资源匮乏地区,自动化的工具可以辅助医生快速筛选和诊断。它也推动了后续研究,比如结合注意力机制、可解释性分析(如热力图,显示模型关注图像的哪些区域)以及与其他数据集的迁移学习。 局限性 尽管 CheXNet 表现优异,但它仍有局限性: 数据依赖性:模型的效果依赖于训练数据的质量和多样性,可能在不同人群或设备生成的 X 光片上表现不一致。 可解释性:作为深度学习模型,它的决策过程对人类来说仍是“黑箱”,需要进一步改进以获得医生的信任。 临床验证:虽然在研究中表现良好,但在真实临床环境中的广泛应用还需要更多验证。 后续发展 CheXNet 开辟了医学影像 AI 研究的新方向。斯坦福团队和其他研究者在此基础上开发了更先进的模型(如 CheXNeXt),并探索了与自然语言处理结合的系统,用于生成放射学报告。xAI 等公司也在类似领域推进研究,试图将 AI 更深入地融入医疗实践。
7 个月前
德国人工智能研究的高校重镇 德国作为工业强国,在人工智能领域也具有深厚的底蕴和领先地位。众多德国高校在AI研究方面投入了大量资源,取得了丰硕成果。
9 个月前
2024 年《人工智能指数报告》是我们迄今为止最全面的一份,并且是在人工智能对社会的影响空前显著的重要时刻发布。