51OpenLab-一站式ICT创新服务平台

OpenVINO™ 2026.1: 模型持续上新，性能全面进阶

openlab_96bf3613 更新于 2小时前

延续 2026 年的持续演进，OpenVINO™ 2026.1 正式发布。作为又一次面向 AI 部署体验的重要升级，这一版本进一步推动了 AI 在 Intel 硬件上的高效落地与便捷部署。在 2026.0 已带来混合专家模型（MoE）支持、Text2Video 流水线和更智能压缩能力的基础上，OpenVINO™ 2026.1 持续扩展模型支持版图，并针对 GenAI 模型带来进一步的性能优化。无论您正处于 AI 开发和部署的哪个阶段，OpenVINO™ 都在持续演进，帮助开发者更高效地构建并加速自己的 AI 应用。接下来，就让我们一起看看 OpenVINO™ 2026.1 带来了哪些新能力。

更多新模型，更强性能表现

OpenVINO™ 2026.1 在 CPU 和 GPU 上新增了更多模型支持。此次发布中，CPU 端正式支持 GPT-OSS 120B，相比 2026.0 版本中引入的 20B 模型，是一次非常明显的升级，也让超大语言模型能够更好地服务于对算力要求更高的应用场景。与此同时，CPU 和 GPU 端还新增支持 Qwen3-VL，可用于更高级的视觉语言任务，例如视觉内容分析、图像自动描述、多模态推理，以及智能文档处理。

OpenVINO™ 模型服务器（OpenVINO™ Model Server）进一步扩展了能力边界，增强了对 Qwen3-MOE 和 GPT-OSS-20B 模型的支持。借助持续批处理（continuou***atching）机制，它能够在多请求并发场景下实现更优的性能、更高的准确性，以及更稳定可靠的请求处理能力。这些经过优化的模型也可以直接从 Hugging Face或魔搭社区OpenVINO专区便捷获取并完成部署。与此同时，Model Server 还通过 /image 端点新增了图像内补（inpainting）和外扩（outpainting）功能，进一步支持更高级的 AI 图像编辑能力。

LoRA 以及视觉语言模型提升

在本次发布中，动态 LoRA 适配器支持正式扩展到视觉语言（VL）模型。作为 OpenVINO™ GenAI 在视觉语言模型 LoRA 能力上的进一步增强，Qwen3-VL 现已被纳入支持范围，适用于这类包含 LLM 组件的 VL 模型。借助动态 LoRA，开发者无需重新加载基础模型，即可在运行时灵活切换不同的适配器，从而更高效地在生产环境中服务多个模型变体。

为了帮助开发者更快上手视觉语言模型，本次还新增了一个 notebook：统一式 VLM 聊天机器人示例。该示例支持视频文件输入，并可在 Qwen3-VL、Qwen2.5-VL 和 LLaVA-Next-Video 之间进行交互式模型切换。这一资源让开发者能够更方便地体验基于视频输入的多模态对话能力，并直观对比不同模型的实际表现。

VLM 聊天机器人 Notebook

性能进一步释放

本次发布在图像生成、视频生成以及多模态推理等工作负载上都带来了具有实际价值的性能提升。

其中，TaylorSeer Lite caching 被引入到图像与视频生成流程中，可加速 Flux、SD3 和 LTX-Video 流水线中的 diffusion transformer 推理。该优化与 Hugging Face Diffusers 保持一致，通过减少去噪步骤之间的重复计算，在不牺牲输出质量的前提下，进一步提升生成速度。

在 GPU 平台上，LTX-Video 的生成流程也通过对 RMSNorm 与 RoPE 算子的融合实现了进一步的端到端加速。该优化将原本顺序执行的多个算子合并为一次 kernel 启动，不仅降低了内存开销，也减少了 kernel 启动带来的额外时延，从而显著提升了视频生成吞吐量。

与此同时，提示词查询解码（Prompt Lookup Decoding）也已扩展到视觉语言推理流水线，为运行在 Intel CPU 和 GPU 上的多模态工作负载带来了更快的 token 生成速度。该技术通过识别并复用输入上下文中重复出现的 token 模式，减轻主模型的计算负担，进而加速整体推理过程。

小结

OpenVINO™ 2026.1 正在持续拓展 Intel 硬件平台上的 AI 部署边界。无论是更丰富的模型支持、面向视觉语言模型的动态 LoRA 能力，还是覆盖图像生成、视频生成与多模态推理的性能提升，这一版本都更贴近开发者的真实需求，也为 AI 应用落地带来了更强支撑。现在就下载 OpenVINO™ 2026.1，亲自体验新版本带来的能力升级。

与此同时，我们也诚邀您参加 OpenVINO™ DevCon 2026中国系列工作坊，参与迄今为止最全面、最具实践深度的一次开发者活动。您将有机会与 Intel 工程师及行业专家面对面交流，并通过全年持续开展的 workshop 系列，深入了解面向 Intel® 硬件平台的 AI 部署方法与实战经验。欢迎大家点击链接（https://bizwebcast.intel.cn/devcon2026.aspx），了解全年活动详情并注册。期待与您在线下现场相见，一起探索 AI 应用落地的更多可能。

声明与免责声明

*其他名称和品牌可能归其各自所有者所有。

性能因使用场景、配置及其他因素而异。更多信息请参阅性能指标网站。

性能结果基于配置中所示日期的测试，可能未反映所有公开可用的更新。

任何产品或组件都无法做到绝对安全。

你的成本和结果可能会有所不同。

英特尔技术可能需要启用相应硬件、软件或服务激活。

OpenVINO 小助手微信： OpenVINO-China
如需咨询或交流相关信息，欢迎添加OpenVINO小助手微信，加入专属社群，与技术专家实时沟通互动。

0个评论

提交

OpenVINO™ 2026.1: 模型持续上新，性能全面进阶

用户登录还没账户？去注册

新用户注册已有账户，立即登录

重置密码

提示

提示

公告栏