广场
最新
热门
资讯
我的主页
发布
MilesDeutscher
2026-06-27 05:49:44
关注
很难想象,在大约12个月后,我们可能会拥有一个比Fable 5强大2倍的模型。
而且这可能是保守估计,届时模型成本也可能会便宜很多。
原因如下:
衡量AI能力的最佳单一指标是Epoch的能力指数(ECI)
(一个涵盖40多个基准测试的综合得分——数学、编程、
科学、推理)。
可以把它看作是前沿模型的智商测试。
当Fable发布时,它在ECI上达到了161的新高。
现在关键的部分来了:
前沿模型的改进速度在2024年4月左右几乎翻了一番,从每年约8分提高到15分。
自那以后,这个更快的速度在每个季度的测量周期中都保持了下来,并且成为了新趋势。
因此,理论上,自2024年以来保持的趋势只需在Fable 5之后的模型发布中继续下去,那么12个月后的最低水平将是模型能力提高2-3倍。
但最惊人的统计数据甚至不是能力曲线。
而是成本曲线:
在固定性能水平下运行AI模型的成本每两个月减半。
综合来看:
在12个月内,你不仅会拥有一个比Fable 5强大2倍的模型。
而且它会更便宜、更快,并且可能在你已有的硬件上运行。
我们还处于早期阶段。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见
声明
。
赞赏
点赞
评论
转发
分享
评论
请输入评论内容
请输入评论内容
评论
暂无评论
热门话题
查看更多
#
0成本拿2股SK海力士
23.08万 热度
#
Gate完成141只股票股息派发
395.13万 热度
#
预测世界杯法国VS瑞典
52.3万 热度
#
Solana生态ANSEM暴涨
2202.91万 热度
#
Strategy拟回购股票涨超12%
873.99万 热度
置顶
网站地图
很难想象,在大约12个月后,我们可能会拥有一个比Fable 5强大2倍的模型。
而且这可能是保守估计,届时模型成本也可能会便宜很多。
原因如下:
衡量AI能力的最佳单一指标是Epoch的能力指数(ECI)
(一个涵盖40多个基准测试的综合得分——数学、编程、
科学、推理)。
可以把它看作是前沿模型的智商测试。
当Fable发布时,它在ECI上达到了161的新高。
现在关键的部分来了:
前沿模型的改进速度在2024年4月左右几乎翻了一番,从每年约8分提高到15分。
自那以后,这个更快的速度在每个季度的测量周期中都保持了下来,并且成为了新趋势。
因此,理论上,自2024年以来保持的趋势只需在Fable 5之后的模型发布中继续下去,那么12个月后的最低水平将是模型能力提高2-3倍。
但最惊人的统计数据甚至不是能力曲线。
而是成本曲线:
在固定性能水平下运行AI模型的成本每两个月减半。
综合来看:
在12个月内,你不仅会拥有一个比Fable 5强大2倍的模型。
而且它会更便宜、更快,并且可能在你已有的硬件上运行。
我们还处于早期阶段。