Skip to content

科技新闻 2026-2-23

本周科技前沿聚焦大模型本地化部署、硬件加速突破与分布式系统创新。从Llama 3.1在单张3090显卡上的高效运行,到芯片级LLM打印技术,再到新型内存架构与开源协议进展,展现算力与安全协同演进趋势。

Show HN: Llama 3.1 70B on a single RTX 3090 via NVMe-to-GPU bypassing the CPU 96

  • Tags: C++/CUDA LLM推理 GPU内存管理 NVMe直通 量化模型 自适应缓存

  • Source: HackerNews | 阅读原文

[摘要]
基于CUDA与NVMe直通的三层级自适应缓存架构,实现Llama 70B在单张RTX 3090上高效推理,通过层跳过与SLEP流水线优化,突破消费级硬件极限。


How Taalas “prints” LLM onto a chip? 94

  • Tags: ASIC LLM推理 模型量化 硬件加速 固定功能芯片

  • Source: HackerNews | 阅读原文

[摘要]
Taalas推出专用ASIC芯片,通过硬编码量化后的Llama 3.1 8B模型权重实现每秒17,000 tokens的推理速度,显著降低功耗与成本。


A Botnet Accidentally Destroyed I2P 94

  • Tags: I2P 后量子加密 Sybil攻击 IoT僵尸网络 安全漏洞 网络隐私

  • Source: HackerNews | 阅读原文

[摘要]
I2P遭Kimwolf物联网僵尸网络意外冲击,触发史上最大规模Sybil攻击,开发者6天内发布含默认后量子加密的v2.11.0版本,实现关键安全升级。


Black-White Array: fast, ordered and based on with O(log N) memory allocations 92

  • Tags: 数据结构 算法优化 内存效率 Go语言 有序集合

  • Source: HackerNews | 阅读原文

[摘要]
黑-白数组(BWArr)是一种基于数组的有序数据结构,实现 摊还时间复杂度的插入、删除与查找,无指针开销,具备优异缓存友好性与低内存占用,可作为 BTree 的直接替代方案。


Symplex, an open-source protocol semantic negotiation between distributed agents 92

  • Tags: AI Agents Semantic Interoperability Distributed Systems Protocol Design Vector Embeddings

  • Source: HackerNews | 阅读原文

[摘要]
基于向量语义的AI代理通信协议,实现无预定义API的动态协作与分布式工作流,支持去中心化信任与自发协商。


Show HN: Local-First Linux MicroVMs for macOS 92

  • Tags: macOS Linux VM Apple Silicon AI Agents Virtualization.framework Ephemeral Environment

  • Source: HackerNews | 阅读原文

[摘要]
基于Apple Virtualization.framework的轻量级、默认瞬态Linux虚拟机,支持AI代理的隔离运行与快照管理,无Docker依赖,原生ARM64性能。


Man accidentally gains control of 7k robot vacuums 92

  • Tags: 安全漏洞 AI辅助开发 智能家居 逆向工程 物联网安全

  • Source: HackerNews | 阅读原文

[摘要]
工程师用AI工具逆向DJI机器人通信协议,意外发现7000+设备存在严重安全漏洞,可远程访问实时视频、音频与位置数据。


Volatility: The volatile memory forensic extraction framework 92

  • Tags: 内存取证 Volatility Python 数字取证 安全研究

  • Source: HackerNews | 阅读原文

[摘要]
Volatility 3 是对经典内存分析框架的全面重写,支持 Python 3.8+,提供更高效、可扩展的内存取证能力,采用自定义 VSL 许可证。


The Human Root of Trust – public domain framework for agent accountability 92

  • Tags: 密码学 自主代理 可信根 问责机制 公共领域

  • Source: HackerNews | 阅读原文

[摘要]
人类可信根框架(HRT)提出在自主代理系统中实现可审计的密码学问责机制,通过三支柱架构与双路径设计,重建数字系统对“人类存在”的信任基础。


GNU Gawk 5.4 Released With New MinRX Regex Matcher, Faster Reading Of Files 87

  • Tags: GNU Gawk 正则表达式 性能优化 POSIX 兼容 Linux 工具链

  • Source: Phoronix | 阅读原文

[摘要]
GNU Gawk 5.4 引入完全符合 POSIX 的 MinRX 正则引擎,提升文本处理性能与兼容性,同时优化文件读取速度、UTF-8 支持及跨平台能力。