科技新闻 2026-3-1
Qwen3.5模型本地运行性能逼近Sonnet 4.5,小规模Transformer实现10位数加法,MCP输出压缩98%,轻量级图像哈希SplatHash亮相,动态2.0 GGUF优化加速,AI代理与认知债务引发反思。
Qwen3.5 122B and 35B models offer Sonnet 4.5 performance on local computers 96
Tags:
大语言模型开源AI量化技术上下文长度Hybrid架构Source:
HackerNews| 阅读原文
[摘要]
Qwen3.5系列发布四款新LLM,其中三款开源且性能超越GPT-5-mini与Claude Sonnet 4.5,支持百万级上下文窗口与4-bit量化仍保高精度,实现前沿模型能力下放至消费级GPU。
Smallest transformer that can add two 10-digit numbers 95
Tags:
Transformer深度学习架构创新小模型算术推理Source:
HackerNews| 阅读原文
[摘要]
通过创新的架构设计与训练策略,已实现仅36参数的Transformer模型在10位数加法任务上达到100%准确率,突破小模型极限。
Stop Burning Your Context Window – How We Cut MCP Output by 98% in Claude Code 94
Tags:
AI AgentMCPContext ManagementSandboxingFull-Text SearchRustPythonJavaScriptSecurity IsolationSource:
HackerNews| 阅读原文
[摘要]
MCP Context Mode reduces AI tool output bloat via sandboxed execution and semantic indexing, cutting context usage by 98% through selective data capture and FTS5-powered search.
Show HN: SplatHash – A lightweight alternative to BlurHash and ThumbHash 94
Tags:
图像哈希低延迟编码跨语言一致性Oklab色彩空间固定大小输出Source:
HackerNews| 阅读原文
[摘要]
SplatHash实现图像到16字节固定长度哈希的高效编码,支持跨语言比特级一致解码,32×32模糊预览解码仅需0.067ms,显著优于ThumbHash和BlurHash。
Unsloth Dynamic 2.0 GGUFs 94
Tags:
LLM量化GGUF动态量化模型压缩推理优化Source:
HackerNews| 阅读原文
[摘要]
Unsloth Dynamic 2.0 GGUF实现全层动态量化,显著提升低精度LLM推理准确率,支持多模型与主流引擎,且通过自研150万+token校准数据优化对话性能。
The Windows 95 user interface: a case study in usability engineering 92
Tags:
Windows 95用户界面设计可用性工程迭代设计人机交互Source:
OSNews| 阅读原文
[摘要]
Windows 95用户界面设计团队采用迭代设计与可用性工程,基于真实用户行为数据优化交互体验,体现1990年代末期以用户为中心的科学化UI设计巅峰。
Verified Spec-Driven Development (VSDD) 92
Tags:
软件工程AI辅助开发形式化验证开发流程创新Source:
HackerNews| 阅读原文
[摘要]
VSDD将Spec、TDD与VDD融合为AI驱动的统一开发流水线,以形式化规范为起点,通过测试与对抗性验证确保代码完备性,人类主导战略决策。
Show HN: Decided to play god this morning, so I built an agent civilisation 92
Tags:
人工生命NEAT自演化计算生态机器意识Source:
HackerNews| 阅读原文
[摘要]
Werld构建基于NEAT神经网络的自演化计算生命体,无预设目标与人类知识干预,实现开放式智能涌现,局部运行且具代谢成本约束。
Don't trust AI agents 92
Tags:
AI安全容器化信任最小化系统架构Source:
HackerNews| 阅读原文
[摘要]
AI代理应默认视为恶意,NanoClaw通过容器化隔离、无特权运行和瞬态环境实现强制信任最小化架构。
Cognitive Debt: When Velocity Exceeds Comprehension 92
Tags:
软件工程人工智能系统架构认知负荷Source:
HackerNews| 阅读原文
[摘要]
AI辅助开发加速代码产出,但认知理解滞后,形成难以量化的“认知债务”,长期影响系统可维护性与可靠性。