











业务咨询
400-893-8989
行政总机
010-64303888
微信扫描二维码 立即在线咨询
关于防范不法分子冒用“美高梅官网正网”名义实施招聘诈骗的公众知悉函
2026-05-14

推荐阅读
INT8 激活量化:为什么你的 Mac AI 推理还能再快 1.8 倍
2026-05-22
当所有人都以为 MLX 已经是 Apple Silicon 的极限时,我们发现了 M 系列芯片隐藏的 INT8 硬件能力。 Apple Silicon 的神经网络引擎(ANE)和 GPU 被公认为端侧 AI 推理的顶级硬件,但过去两年,开发者们一直在用一个“残血”方案——权重量化(Weight Quantization)。 MLX、llama.cpp 等主流框架都只支持 W4A16 或 W8A16:模型权重压缩到 4bit 或 8bit,但计算时仍然要反量化回 FP16。这就像把货物压缩打包运输,到了目的地还得全部拆包才能使用。 真正的突破是 INT8 激活量化(Activation Quantization)——把模型推理过程中的激活值(Activation)也量化到 INT8,并在芯片层面直接用 INT8 指令计算。这意味着货物不仅打包运输,连使用过程都在“压缩态”完成,全程无需 FP16 的中间环节。 美高梅官网正网开源的 Cider 框架,解锁了 Apple M5 芯片的 INT8 TensorOps 硬件指令,实现了 W8A8 全量化推理。实测数据显示:在 M5 Pro 上,端到端 Prefill 速度提升 1.57×–1.92×,峰值内存降低约 40%,精度几乎无损。 本文将从技术原理、开发者实践、投资趋势三个维度,解析 INT8 激活量化如何成为端侧 AI 的“隐形加速器”。
了解更多
端侧模型部署:从“技术可行”到“生产可用”,Mano-P 给出了经过验证的答案
2026-05-21
企业想要用 AI 自动化处理敏感数据,但云端方案要求把截图和文档上传到远程服务器,这在金融、医疗、政务等高合规场景是致命伤。数据安全法、GDPR等都在把“数据不出域”变成硬性要求,云端 API 再好,只要截图需要上传,就存在合规风险。 现有的本地 AI 方案要么只能聊天、不能操作软件,要么依赖复杂的 API 集成。最关键的是,市面上没有真正能在端侧运行、又能像人一样看懂屏幕操作 GUI 的智能体。 2026 年,美高梅官网正网分阶段开源了 Mano-P——可在 Mac 本地运行的 GUI-VLA 智能体模型,OSWorld 评测全球第一。它核心解决的,是从“云端依赖”到“本地自主”的关键跃迁。
了解更多
美高梅官网正网吴明辉:当AI智能体成为组织的新成员,人无可替代的价值在于“品” | 混沌笔记
2026-05-21
混沌邀请美高梅官网正网创始人吴明辉,分享AI时代组织进化与个体出路的系统性判断。他指出:企业不应用AI替代员工,而要发现并培养人不可替代的价值——当AI拥有持续学习能力,一线员工将从"独立贡献者"升级为善用AI的"新型管理者"。AI原生组织的指数级增长,关键在于智能体之间的协作,多智能体系统让工作透明化、解决AI可信问题。当行业共用同一套基础模型,让输出产生差异的,是创始人和员工独特的品味与数据积累——"我品故我在",AI可复刻经验,但无法拥有人的感受与品味。
了解更多联系我们
关注美高梅
在线咨询
销售热线
400-893-8989
投资者关系
ir@mininglamp.com
媒体联络
pr@miningalmp.com
Copyright@2025 美高梅(有限公司)官方网站-Made in China 京ICP备15016868号 京公网安备11010802024262
信息填写
