Chat History

No chat history yet. Start a new conversation!

探索 GPT-OSS：OpenAI 的革命性开源 AI 模型

激发创意：GPT-OSS 完全开放、响应迅速、完全定制。

您好！有什么可以帮您的吗？

什么是 GPT-OSS？

GPT-OSS 是 OpenAI 继 GPT-2 后首次开源的全新开放权重系列，采用 Mixture-of-Experts（MoE）架构，在减少参数激活的同时，实现高效推理。

开源智能引擎：

包括 gpt-oss-120b 和 gpt-oss-20b 等模型，在编程、计算与复杂分析等任务中表现出色，完全开放，支持自由修改与部署。

本地部署，节能高效：

专为笔记本、显卡等常见设备优化，无需依赖外部服务器也能轻松运行专业级 AI。

为开发者打造的创新引擎：

采用 Apache 2.0 协议发布，支持灵活调整与多场景落地，无论是个人项目还是大规模基础设施部署皆可灵活应用。

GPT-OSS 新特性

Mixture-of-Experts 混合专家架构优化

在保持接近主流性能的同时大幅降低资源消耗，使常规设备也能快速运行。

本地设备智能

支持个人电脑和消费级 GPU 的运行，提供安全、即时的 AI 交互，无需在线连接。

嵌入功能与应用范围

提供 128K token 容量、脚本运行和在线查询等功能，增强实用功能。

GPT-OSS 关键特点

宏伟蓝图：

混合专家设计采用 MoE 架构，只激活必要的模块，提供简化且高效的推理，媲美 o4-mini 等闭源系统。

自主独立：

设备端处理在常见笔记本或显卡上运行 gpt-oss-20b，进行快速、安全的 AI 处理，无需外部费用或延迟。

逻辑发展：

精细的逐步推理擅长处理连续操作，整合思路，精准生成开发、公式及推理中的结果。

功能增强：

内置增强功能集成代码运行和网络查询等功能，提高动态环境中的效率。

适配中心：

灵活定制 Apache 2.0 协议允许在多个领域进行简单修改，从学术研究到企业工具。

多元化应用：

128K 输入容量处理大规模数据，支持复杂对话和评估，确保一致性。

GPT-OSS 应用场景

编程高手：简化编程流程

将 GPT-OSS 嵌入开发环境中，快速创建脚本、修复错误、进行功能扩展，加速技术开发。

学术探索者：推动科研进展

运用其分析能力，制定理论、审查数据集，并在生命科学、力学等领域进行建模实验。

个人创新者：构建个性化助手

设计离线运行的个性化助手或数字助理，用于安全任务，例如规划或教育。

GPT-OSS 与其他模型的对比

特性/模型	GPT-OSS (120b/20b)	Meta Llama 3	Mistral AI 模型系列	DeepSeek V2
Architecture	MoE for optimization	Standard Transformer	MoE options	MoE with refinements
Reasoning Capability	Close to top benchmarks like MMLU, superior in sequential logic	Solid yet behind in intricate chains	Effective for languages, weaker in core analysis	Strong in scripting, prone to inaccuracies
On-Device Support	Tuned for notebooks/GPUs (20b on basic setups)	Demands ample memory	Resource-friendly but scope-restricted	Requires premium hardware
Context Length	128K tokens	Up to 128K in bigger versions	Differs, max 32K	Up to 128K

如何使用 GPT-OSS 模型

启动 GPT-OSS 非常简单，下面是如何在您的设备上设置它的步骤：

下载模型

前往 OpenAI 网站或 Hugging Face 下载 gpt-oss-20b 或 120b 模型文件。请确保您的设备满足要求（例如，120b 需要 80GB GPU）。

平台设置

您可以使用 Ollama、Hugging Face Transformers (v4.55+) 或 LM Studio 进行快速安装，必要时通过 pip install transformers 安装依赖。

本地执行

使用类似 ollama run gpt-oss-20b 的命令启动，并通过 API 或 UI 开始交互。

连接和优化

通过 OpenAI 风格的接口将其与您的应用程序连接，或根据特定需求使用独特数据进行定制。

客户反馈

GPT OSS—初步印象：不错，达到了极限并且无法继续，正常的感觉。喜欢它在理解我需求时持续推理……并且持续了35秒。

Engineer Faisal

FlintSH

@xFlintSHx

gpt-oss 系列表现卓越。它让我确信本地 AI 的潜力巨大，之前的模型让我失望。DeepSeek 表现也不错，但有些地方不够连贯（根据我的经验）。20b 的性能极为强大，足以满足 99.99% 的用户需求。

2023-10-05

Engineer Faisal

@PyeparFaisal

Of course the new gpt-oss are free & can run on your laptop… We are about to experience some NEXT LEVEL data mining shit anytime now 😅. One small step for mankind, one GIANT loop for AI

2023-09-20

Logan Campbell

@LoganAMCampbell

The new gpt-oss 20b model is awesome, but at least on a base M3 macbook, it runs extremely slow, and isn't functionally useable. 1.17 tokens/s. They claim it can run on 'most laptops' but at least in it's current state, it's too slow.

2023-09-30

Kevin Kern

@Theo - t3.gg

在Cursor和Cline中试用了gpt-oss，初步印象是工具调用没有成功。在提问模式下，你会得到极快的回答，但大约1/3的请求无法成功。它总是遇到相同的API错误，或不断出现同样的循环。总体来说，现在对我来说并没有带来任何价值。不过，我很高兴OpenAI发布了开源模型。

2023-09-15

Theo - t3.gg

@theo

According to OpenAI, the new response format ('Harmony') should not be your concern if you are using an API provider or tools like Ollama. From my experience, both the gpt-oss models are REALLY bad at tool calling. Does the implementation differ by provider?

2023-09-25

kregenrek

@OpenAI表示，如果你使用API提供商或像Ollama这样的工具，那么新的响应格式（‘Harmony’）对你来说不需要特别关注。根据我的经验，这两个gpt-oss模型在工具调用方面的表现非常糟糕。不同的提供商实现是否有所不同？

2023-09-10