首页 > Ai资讯 > Ai产品

谷歌推出Gemma 3：性能超越DeepSeek V3、o3mini为全球第二强开源模型

Gemma于2025-03-12发布在Ai产品

Gemma 3是什么？

Gemma 3是Google 发布的最新开源模型，超越了 DeepSeek V3 和 o3mini，成为全球第二强开源模型。Gemma 3 具备强大的多模态能力，能够理解文本、图片和短视频，同时还支持超过 140 种语言的预训练，直接支持超过 35 种语言。它配备了 128K 令牌的上下文窗口，能够处理大量信息，并支持函数调用和 ai 代理开发，可实现复杂任务的自动化。Gemma 3 提供四种不同尺寸的模型（1B、4B、12B 和 27B），以满足不同硬件和性能需求，并且能够在手机、电脑等多种设备上高效运行，支持从移动设备到工作站的广泛部署。

谷歌推出Gemma 3：性能超越DeepSeek V3、o3mini为全球第二强开源模型.webp

Gemma 3功能特征

多模态能力：支持文本、图像和短视频的混合输入，能够处理复杂的多模态任务。
强大的语言支持：预训练支持超过 140 种语言，直接支持超过 35 种语言。
大上下文窗口：支持 128k 令牌的上下文窗口，能够处理大量信息，例如 30 张高分辨率图像或 1 小时视频。
高性能：在单 GPU 或 TPU 上的表现优于其他同类模型，如 Llama、DeepSeek 和 OpenAI 的 o3-mini。
优化与量化：提供官方量化版本，减少模型大小和计算需求，同时保持高精度。
安全性：配备 ShieldGemma 2 图像安全分类器，可检测和标记危险内容。

Gemma 3 四种尺寸的模型特点

1B：轻量级，适合在手机或笔记本等资源受限设备上运行。
4B：适合多模态任务，具备更强的图像和文本处理能力。
12B：性能更强，适合复杂图像和视频分析。
27B：最大版本，性能最强，适合高性能计算场景。

Gemma 3应用场景

自然语言处理：用于聊天机器人、智能助手、文本分类、情感分析和机器翻译。
图像识别与分析：支持人脸识别、物体检测、图像问答和图像比较。
视频分析：能够处理短视频内容，适用于视频内容分析和生成。
智能客服：结合多模态输入，提供更智能的客户服务。
工业质检：利用图像分析能力检测产品质量问题。
代码生成与编程辅助：支持代码生成和自动代码修复。

Gemma 3使用方法

快速实验：通过 Google AI Studio 在浏览器中直接使用 Gemma 3，无需设置。
下载与微调：从 Hugging Face、Ollama 或 Kaggle 下载模型，并使用 Hugging Face Transformers 或其他工具进行微调。
部署选项：支持多种部署方式，包括 Vertex AI、Cloud Run、Google GenAI API、本地环境以及 NVIDIA GPU。
开发工具支持：兼容 Hugging Face Transformers、Ollama、JAX、Keras、PyTorch 等多种开发工具。

谷歌推出Gemma 3：性能超越DeepSeek V3、o3mini为全球第二强开源模型.webp