
Xin Zhiyuan报告编辑:Taozi [Xin Zhiyuan简介] GPT-5更近了!如今,神秘的模型Horizon Alpha在整个Internet上都著名,首次对天空进行了编码测试性能,并且各个三方的基准已单独发布。 Openai Brain采访仅在发布前夕,该模型仍然具有瓶颈,但坚信该规模法是无限的。 GPT-5发布的迹象变得越来越强。今天早上,一个神秘的模型,地平线alpha突然推出了一个开放式,各种列表和试验都渗透了整个网络。 Horizon Alpha模型的背景为256K,反应迅速且创意写作出色。它也具有“推理”功能,但推断令牌的预算在O4-Mini中是两次。扩展全文
当涉及编程时,TheHorizon Alpha是无敌的。
它可以生产各种游戏,例如“水果忍者”和“外星人捕捉COWS“在句子中,可以直接显示基于徽标的广告,并且可以轻松地通过“六角形物理模拟”测试。
关于
在编写EQ-Bench基准测试时,以前对Horizon Alpha进行了排名,该测试超过了O3和Gemini 2.5 Pro。
关于
更令人惊讶的是,它可以在30秒内完成20位数字和20位数字的再现。
在许多试验中,龙虾,天顶,峰会等诸如龙虾,天顶,峰会等都暴露的各种代码名称模型都在想知道所有模型。
所有迹象都表明,GPT-5“家庭桶”绝对是最强的表面模型。
Google包括GPT-5 OpenAI文档页面,当前404
在网络的实际试验中,有关地平线α的更多详细信息都是Nakalana。
神秘的地平线阿尔法在舞台上,编程非常强大地对抗天堂
当前,可以在OpenRouter平台上启用Horizon Alpha版本的测试。
门户网站:https://openrouter.ai/chat?room = orc-1954007231-sx8gtgcuynkhH6O6IN2L
当涉及到推理模型时,与Claude Sonnet 4(60-80令牌/s)相比,Horizon Alpha的吞吐量最快,具有120个令牌/s。
比较吞吐量的测试,地平线α是当前最快的测试。
消费 - 通过模拟的模拟,立即与网页匹配
一些网民要求创建一个完整的Windows 95 Retro桌面功能,具有令人惊讶的效果和非常快的世代。
另一个将球赋予多边形的测试,模仿物理。
如果是六角形或三角形,即使是可以移动球的范围也将减少,也不会影响效果。
回到贫困水平,20球向旋转的七角弹弹跳。网民惊讶地说:“这是我见过的最好的版本之一。”
Horizon Alpha可以创建一个网页,显示一系列简单且有趣的浏览器游戏3分48秒。
给地平线alpha一个相同的提示:“创建一个vis可以遇到Twigl应用程序的尤利有趣的着色器,使其看起来像是暴风雨中的海洋。”
沃顿CS教授伊桑·莫利克(Ethan Mollick)宣布,它是最好的,而且创建非常快。
当网民要求他们“创建一个为狗walking狗的商业网站”时,Horizon Alpha提出了许多需要预先确认的问题。十四行诗4将直接提供解决方案。
左:Horizon Alpha;右:克劳德十四行诗4
最终,从建筑物的影响的角度来看,地平线α的产出具有高质量和简洁的效果。十四行诗4输出更长,更全面和创造力。
顶部:Horizon Alpha;底部:克劳德十四行诗4
Horizon Alpha还将独立构建银行网站。
该设计令人惊叹 - 令人敬畏,美学意义在线
Ai Tycoon Matthew Berman亲自尝试了SVG和UI设计的创建,而Horizon Alpha立即开发了专业的美学图片设计。
过去,西蒙·威利森(Simon Willison),一个人工智能硕士说,您将通过“自行车上的鹈鹕”图片从AI历史发展中看到。
如今,使用Horizon Alpha产生相同的SVG测试是所有模型中最强的。
其他一些出色的SV案例。
关于
应当指出的是,即使根据许多猜测,即使表现良好的各种试验,地平线α也可能只是一个小模型。
GPT-5中的哪个都没关系,我将等待下一个OpenAi发布。
Openai的“两个英雄”采访,Ultraman称赞它
仅在GPT-5发行前夕,Openai的两个英雄,科学家Jakub Pachocki和研究总监Mark Chen同时发表了一次重大采访。
这对黄金伙伴是具有GPT-5的“双重巨人”。
预计MIT技术评论的独家访谈不会赢得Ultraman的心。
他赞扬了这一点:“我通常认为这类文章是不对的,但是本文获得了合作的本质二。”
完全否认超人是什么?
Openai最好的合作伙伴
熟悉NAI内部改变的每个人都知道Jakub Pachocki和Mark Chen都是新兴的明星。
他们有不同的样式,但它们构成了完美的补充。
马克·陈(Mark Chen)是一位前华尔街商人,他穿着独特的方式并自由地说话,据说与AI不相容。
加入OpenAI之后,他迅速与Dall·E和GPT-4多模式和法典功能的主要驾驶员一起长大,更改每个人都可以使用的产品的复杂研究是一件好事。
低调的理论计算机科学家Jakub Pachocki离开后取代了ILYA,痴迷于破坏AI的逻辑限制和创造力。
关于职责的内部划分,帕乔基说:“陈负责开发和研究团队管理,因为我负责建立研究路线图并促进我们的长期技术ICAL的观点。 “
他们之间的合作模型可以说是“无缝移动”。
不管技术问题多么复杂,Pachocki和Mark总是可以很好地理解,并迅速分配任务并共同努力克服它们。
AGI经理,自主时间
目前,GPT-5世界以外的期望是一个更强大,更快,更通用的怪物。
在采访中,尽管马克·陈(Mark Chen)并未直接面对GPT-5问题,但他承认:“我们一直在努力了解深入研究的技术瓶颈。即使是当今最强的理解模型,也没有有效地与知识联系在一起。”
“我们仍处于颚式范式的开始,” Pachocki补充说。
重要的是要建立一个很长一段时间的模型,并在小说中提出想法。
同时,在他们看来,规模法远非触及天花板,通过投资更多的资源和计算数据,该模型将成为tter和更好。
当质疑AGI时,马克·陈(Mark Chen)提出了一个指标 - 该模型在较长时间内工作自治的能力,尤其是“自主时间”。
这个概念很简单,但很深。它代表了在没有人类干预的情况下面临复杂问题时可以继续发展的时间长度。
该愿景超出了当前模型的功能。自主时间仅限于几分钟到一小时,当遇到奇怪的场景时,它常常会“卡住”。
数学 +编程,删除AI圣杯?
几个小时前,OpenAI模型在两场顶级比赛中取得了出色的成绩:
首先,他在Atcoder世界巡回赛决赛中赢得了第二名。其次,他在IMO 2025比赛中获得了金牌。
在Atcoder比赛中,Psyho的胜利表现出了对人类的独特创意思想,类似于Alphago击败Lee Sedol的比赛。
“我们在这里谈论编程和数学,但确实关于创造力,有新颖的想法,将不同领域的思想联系起来。” Pachocki说。
在他们两个看来,数学和编程是“通用情报”的基础。
参考:
https://x.com/karminski3/status/1950987896565182587 https://x.com/chetaslua/status/1950784759799718161
https://www.technologyreview.com/2025/07/31/1120885/the-two-people-aple-shaping-the-future-the-future-opena-search/return to sohu看到更多