ag百家乐网站 李飞飞团队456页呈文: 中好意思AI模子性能近乎抓平
4月8日,由李飞飞连结引导的斯坦福大学以东谈主为本东谈主工智能推测所(StanfordHAI)发布了《2025年东谈主工智能指数呈文》(ArtificialIntelligenceIndexReport2025)。这份长达456页的呈文ag百家乐网站,长远领悟了2024年寰宇东谈主工智能行业的发展态势,揭示了12约莫道趋势。
呈文以为,AI正变得更高效、更普惠。跟着小模子性能飙升,达到GPT-3.5水平的系统推理老本在以前两年间下落到了正本的280分之一。
呈文还指出,中国高性能AI模子的数目和质地不停提高,中好意思AI模子性能近乎抓平。与此同期,中国在AI领域论文数目和专利数目上保抓最先地位。
AI性能飙升,发扬渐渐接近东谈主类
2023年,推测东谈主员推出了MMMU、GPQA和SWE-bench等颇具挑战性的新基准测试,用于测试AI系统的极限。
测试发现,只是一年后,AI系统的性能便完竣大幅跃升——在MMMU测试中得分提高18.8个百分点;在GPQA测试中提高48.9个百分点;SWE-bench测试里更是提高了67.3个百分点。
从举座趋势来看,AI在各大领域的发扬渐渐接近东谈主类,致使在某些情形下,AI智能体能在限时编程任务中超过东谈主类。
相关词,复杂的推理关于AI模子而言,仍然是一个挑战。
在处理近似国外数学奥林匹克竞赛题目这类任务时,AI模子发扬出色。但濒临诸如PlanBench等复杂推理基准测试时,却仍显得悉力。即使濒临那些已知存在正解的逻辑任务,AI也时常无法可靠地科罚逻辑任务,这极大限度了AI在对精度条目极高的高风险行业中的诈欺。
寰宇AI投资飙升
2024年,生成式AI在寰宇范围内招引了339亿好意思元的私东谈主投资,与2023年比较,增长幅度达到18.7%。
与此同期,企业对AI的采取率显贵提高,从2023年的55%飞腾至2024年的78%。越来越多的推测收场标明,AI不仅概况灵验提高出产力,在多量情况下,还能减轻劳能源的技巧差距。
值得温雅的是,将生成式AI诈欺于至少一项业务职能的企业数目出现了激增。2023年,这一比例仅为33%,而到了2024年,该比例跃升至71%,增幅跨越一倍。
中好意思模子性能近乎抓平
数据透露,好意思国在AI模子的数目上处于最先地位。2024年,总部位于好意思国的机构领有40个知名AI模子,跨越中国(15个)和法国(3个)。
不外,呈文强调,中好意思模子之间的性能差距正在马上减轻。以MMLU和HumanEval等主流基准测试收场来看,2023年,中好意思顶尖模子之间的性能差距还在两位数,ag百家乐接口多少钱相关词到了2024年,这一差距已大幅减轻,险些处于归拢水平。
与此同期,中国在AI领域论文数目和专利数目上依旧保抓最先地位。
小模子性能飙升,推理老本降至280分之一
呈文指出,AI正变得愈加高效、经济实惠和易于得到。
跟着小模子性能提高,达到GPT-3.5水平的系统推理老本在以前两年间下落至280分之一。在硬件层面,老本每年下落30%,而能源效果每年提高40%。
2022年,在MMLU基准测试中,得分超60%的最小模子是PaLM,参数目为5400亿。到了2024年,微软Phi-3-mini仅用38亿参数,就取得了相同的实力。这代表,两年多的时辰里模子参数减少了142倍。
此外ag百家乐网站,开源模子正在不甘落后,与闭源模子的差距渐渐减轻。2023年,开源模子显著逾期于闭源模子。而到2024年,这一差距险些隐没。2024年1月初,顶尖闭源模子在大模子竞技场排名榜上以8.0%的获利跨越了顶尖开源模子。而到2025年2月,这一差距已减轻至1.7%。
中国对AI的格调最乐不雅
在对AI的格调方面,中国事寰宇主要国度和地区中最乐不雅的。
呈文透露,2024年中国有83%的东谈主以为AI产物和奇迹利大于弊,排在后头的是印度尼西亚(80%)和泰国(77%)。比较之下,好意思国(39%)、加拿大(40%)等的乐不雅阵势远低于中国。
不外,从举座趋势而言,列国关于AI的乐不雅阵势正渐渐升温,颠倒是在一些曾对AI最抓怀疑格调的国度。数据透露,自2022年起,好意思国以为“使用AI产物和奇迹利大于弊”的比例提高了4%,加拿大增长了8%,法国增长了10%。
三分之二受访者称AI将在畴昔3至5年对往往生计产生显贵影响
从医疗保健到交通运输,AI正马上从实验室走向往往生计。
2023年,好意思国食物药品监督治理局(FDA)批准了223款AI医疗建立,而2015年仅有6款。
谈路交串连样因AI技巧发生着日眉月异的变化。自动驾驶汽车不再只是实验,而是渐渐驶入履行生计。
好意思国最大的运营商之一Waymo每周提供跨越15万次自动驾驶奇迹,而百度旗下的“萝卜快跑”(ApolloGo)无东谈主驾驶出租车队已在中国多个城市精雅进入运营。
此外,东谈主们对AI融入往往生计的期待与认同度正在飞腾。据统计,寰宇范围内,有多达三分之二的受访者以为,在畴昔三到五年内,AI产物及奇迹将对往往生计产生显贵影响。