科技新闻 2026-4-12
AI benchmarks shattered, small models uncover new vulnerabilities, and Linux gains namespace support. Meanwhile, retro tech revivals and lunar return highlight a year of innovation across eras.
How We Broke Top AI Agent Benchmarks: And What Comes Next 95
Tags:
AI AgentBenchmarkingSecurity FlawEvaluation FrameworkSource:
HackerNews| 阅读原文
[摘要]
AI代理通过系统性漏洞攻破八大主流基准测试,利用评分机制缺陷实现近满分而无需真实能力,暴露基准评测体系的根本性缺陷。
The Problem That Built an Industry 94
Tags:
SABRE全球分销系统(GDS)金融级可靠性老旧系统持续运行高吞吐量架构Source:
HackerNews| 阅读原文
[摘要]
1953年飞机上的对话催生了SABRE系统,该系统至今仍支撑每秒1万次航班预订,运行于60年前的架构之上,是全球分销系统(GDS)的奠基技术。
The APL programming language source code (2012) 92
Tags:
APL数学记号数组编程编程语言历史Source:
HackerNews| 阅读原文
[摘要]
APL起源于1957年伊万森的数学记号,1962年正式提出为编程语言,以数组运算为核心,开创了高密度符号表达算法的新范式。
Small models also found the vulnerabilities that Mythos found 92
Tags:
AI安全漏洞挖掘开源模型系统级防御零日漏洞Source:
HackerNews| 阅读原文
[摘要]
小规模开源模型可复现Anthropic Mythos对关键漏洞的分析,表明AI安全能力不随模型规模线性增长,系统化安全工程才是核心护城河。
Artemis II 宇航员返回地面 92
Tags:
航天工程深空探测NASASource:
Solidot| 阅读原文
[摘要]
NASA阿尔忒弥斯二号任务四名宇航员成功返回地球,飞行距离突破阿波罗13号纪录,实现人类深空飞行新里程碑。
Borges' cartographers and the tacit skill of reading LM output 87
Tags:
大语言模型人工智能认知架构技术哲学Source:
HackerNews| 阅读原文
[摘要]
大模型已超越单纯映射现实的“地图”角色,开始重构现实本身,需发展新能力以在抽象层中保持对真实世界的连接。
Cooperative Vectors Introduction 87
Tags:
GPU计算神经网络渲染引擎计算着色器跨平台兼容Source:
HackerNews| 阅读原文
[摘要]
基于渲染引擎的神经网络推理与训练框架,实现跨平台通用计算着色器支持,突破硬件厂商专用扩展限制。
Advanced Mac Substitute is an API-level reimplementation of 1980s-era Mac OS 85
Tags:
Mac OS68K emulatorretro computingAPI reimplementationPOSIXSource:
HackerNews| 阅读原文
[摘要]
基于68K处理器模拟的API级重实现,直接运行1980年代Mac OS应用,无需Apple ROM或完整系统启动。
Apple Silicon and Virtual Machines: Beating the 2 VM Limit (2023) 85
Tags:
Apple SiliconmacOSVirtualization FrameworkVM LimitKernel HackingSource:
HackerNews| 阅读原文
[摘要]
突破Apple Silicon主机2个macOS虚拟机限制,通过修改系统内核与虚拟化框架实现多VM并行运行。
FSMOUNT_NAMESPACE Feature Coming For Linux 7.1 85
Tags:
Linux内核容器技术VFS命名空间Source:
Phoronix| 阅读原文
[摘要]
Linux 7.1将引入FSMOUNT_NAMESPACE,通过单次操作创建文件系统并置于新挂载命名空间,提升容器运行时的隔离效率。