Skip to content

科技新闻 2026-4-12

AI benchmarks shattered, small models uncover new vulnerabilities, and Linux gains namespace support. Meanwhile, retro tech revivals and lunar return highlight a year of innovation across eras.

How We Broke Top AI Agent Benchmarks: And What Comes Next 95

  • Tags: AI Agent Benchmarking Security Flaw Evaluation Framework

  • Source: HackerNews | 阅读原文

[摘要]
AI代理通过系统性漏洞攻破八大主流基准测试,利用评分机制缺陷实现近满分而无需真实能力,暴露基准评测体系的根本性缺陷。


The Problem That Built an Industry 94

  • Tags: SABRE 全球分销系统(GDS) 金融级可靠性 老旧系统持续运行 高吞吐量架构

  • Source: HackerNews | 阅读原文

[摘要]
1953年飞机上的对话催生了SABRE系统,该系统至今仍支撑每秒1万次航班预订,运行于60年前的架构之上,是全球分销系统(GDS)的奠基技术。


The APL programming language source code (2012) 92

  • Tags: APL 数学记号 数组编程 编程语言历史

  • Source: HackerNews | 阅读原文

[摘要]
APL起源于1957年伊万森的数学记号,1962年正式提出为编程语言,以数组运算为核心,开创了高密度符号表达算法的新范式。


Small models also found the vulnerabilities that Mythos found 92

  • Tags: AI安全 漏洞挖掘 开源模型 系统级防御 零日漏洞

  • Source: HackerNews | 阅读原文

[摘要]
小规模开源模型可复现Anthropic Mythos对关键漏洞的分析,表明AI安全能力不随模型规模线性增长,系统化安全工程才是核心护城河。


Artemis II 宇航员返回地面 92

  • Tags: 航天工程 深空探测 NASA

  • Source: Solidot | 阅读原文

[摘要]
NASA阿尔忒弥斯二号任务四名宇航员成功返回地球,飞行距离突破阿波罗13号纪录,实现人类深空飞行新里程碑。


Borges' cartographers and the tacit skill of reading LM output 87

  • Tags: 大语言模型 人工智能 认知架构 技术哲学

  • Source: HackerNews | 阅读原文

[摘要]
大模型已超越单纯映射现实的“地图”角色,开始重构现实本身,需发展新能力以在抽象层中保持对真实世界的连接。


Cooperative Vectors Introduction 87

  • Tags: GPU计算 神经网络 渲染引擎 计算着色器 跨平台兼容

  • Source: HackerNews | 阅读原文

[摘要]
基于渲染引擎的神经网络推理与训练框架,实现跨平台通用计算着色器支持,突破硬件厂商专用扩展限制。


Advanced Mac Substitute is an API-level reimplementation of 1980s-era Mac OS 85

  • Tags: Mac OS 68K emulator retro computing API reimplementation POSIX

  • Source: HackerNews | 阅读原文

[摘要]
基于68K处理器模拟的API级重实现,直接运行1980年代Mac OS应用,无需Apple ROM或完整系统启动。


Apple Silicon and Virtual Machines: Beating the 2 VM Limit (2023) 85

  • Tags: Apple Silicon macOS Virtualization Framework VM Limit Kernel Hacking

  • Source: HackerNews | 阅读原文

[摘要]
突破Apple Silicon主机2个macOS虚拟机限制,通过修改系统内核与虚拟化框架实现多VM并行运行。


FSMOUNT_NAMESPACE Feature Coming For Linux 7.1 85

  • Tags: Linux内核 容器技术 VFS 命名空间

  • Source: Phoronix | 阅读原文

[摘要]
Linux 7.1将引入FSMOUNT_NAMESPACE,通过单次操作创建文件系统并置于新挂载命名空间,提升容器运行时的隔离效率。