下载APP
范樱真实
每天进步一点点。
关注
艺术+
“瞬悉”1.0(SpikingBrain-1.0)是中科院自动化所联合沐曦等机构,于 2025 年 9 月发布的首个全流程国产化类脑脉冲大模型。它打破了 Transformer 架构依赖,模拟人脑的“脉冲神经网络(SNN)”机制,在国产 GPU 上实现了超长序列处理和极低能耗的突破。 技术原理:像人脑一样“稀疏放电” - 脉冲通信:不同于传统 AI 神经元持续输出数值,“瞬悉”的神经元平时静默,仅在信息累积到阈值时才发出“1”或“0”的脉冲信号。这种“事件驱动”机制大幅减少了冗余计算。 - 内生复杂性:借鉴人脑树突计算原理,模型具备线性复杂度。处理长文本时,计算量不再随长度平方级爆炸增长,而是线性增长。 - 全栈国产:从模型架构、训练框架到算子库,完全适配沐曦等国产 GPU 平台,摆脱了对英伟达生态的依赖。 性能优势:省电且长记性 - 百倍加速:在 400 万 Token(约 300 万字)的超长文本推理中,首字生成速度比 Transformer 快 100 倍以上,且内存占用极低。 - 数据极简:仅用主流模型约 2% 的预训练数据量,即可达到 Qwen-7B 等模型约 90% 的理解能力。 - 高稀疏度:模型激活稀疏度超 69%,天生适合未来类脑芯片,具备极低功耗潜力。 场景化示例 场景 1:百万字法律卷宗“秒级”摘要 - 痛点:律师处理跨年诉讼,卷宗含数百万字证据链。传统大模型加载即爆显存,且分析耗时数小时。 - 瞬悉方案:模型将文本视为“长序列脉冲流”,利用线性复杂度直接通读全卷。1 分钟内提取关键时间线、矛盾证词并生成案情摘要,且全程运行在国产算力卡上。 场景 2:基因测序与物理粒子轨迹分析 - 痛点:生物学家分析长达数 GB 的 DNA 序列或粒子对撞轨迹,传统模型无法一次性读入完整数据,需复杂切分丢失上下文。 - 瞬悉方案:利用其“超长记忆”特性,将连续序列映射为脉冲信号流。无需切分即可一次性建模整个基因组变异或粒子衰变路径,辅助科研人员发现长程关联规律。 场景 3:边缘设备长对话助手 - 痛点:车载或手机上的 AI 助手,对话历史越长越卡顿,且耗电剧增。 - 瞬悉方案:移植“瞬悉”轻量化版本。它像人脑一样压缩记忆(只记要点而非逐字历史),在手机 CPU 上实现 4-15 倍的解码加速,且发热量显著降低。 注意:该模型目前主要优势在于长文本推理和能效,在通用创意写作或复杂逻辑推理的“涌现能力”上,与顶级闭源大模型仍有差距。它是 AI 向“类脑计算”演进的关键一步,而非直接替代现有 ChatGPT。 AI生成,(工具:夸克,腾讯元宝)配图是AI生成的,(工具:混元)
勤丰小区
2026-04-05 10:20
浙江杭州
打开潮新闻参与讨论