AI Skill Hub 强烈推荐:llama-cpp AI技能包 是一款优质的AI工具。在 GitHub 上收获超过 110.4k 颗 Star,AI 综合评分 9.2 分,在同类工具中表现稳健。如果你正在寻找可靠的AI工具解决方案,这是一个值得深入了解的选择。
高效的大语言模型C/C++推理框架,支持在本地CPU/GPU上运行量化LLM模型,具有内存占用小、推理速度快的特点。适合想要部署私有AI应用、边缘计算场景的开发者和研究人员。
llama-cpp AI技能包 是一款基于 C++ 开发的开源工具,专注于 LLM推理、C++实现、GGML量化 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
高效的大语言模型C/C++推理框架,支持在本地CPU/GPU上运行量化LLM模型,具有内存占用小、推理速度快的特点。适合想要部署私有AI应用、边缘计算场景的开发者和研究人员。
llama-cpp AI技能包 是一款基于 C++ 开发的开源工具,专注于 LLM推理、C++实现、GGML量化 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
# 克隆仓库 git clone https://github.com/ggml-org/llama.cpp cd llama.cpp # 查看安装说明 cat README.md # 按 README 完成环境依赖安装后即可使用
# 查看帮助 llama.cpp --help # 基本运行 llama.cpp [options] <input> # 详细使用说明请查阅文档 # https://github.com/ggml-org/llama.cpp
# llama.cpp 配置说明 # 查看配置选项 llama.cpp --config-example > config.yml # 常见配置项 # output_dir: ./output # log_level: info # workers: 4 # 环境变量(覆盖配置文件) export LLAMA.CPP_CONFIG="/path/to/config.yml"

LLM inference in C/C++
The main goal of llama.cpp is to enable LLM inference with minimal setup and state-of-the-art performance on a wide range of hardware - locally and in the cloud.
The llama.cpp project is the main playground for developing new features for the ggml library.
<details> <summary>Models</summary>
Typically finetunes of the base models below are supported as well.
Instructions for adding support for new models: HOWTO-add-model.md
</details>
<details> <summary>Bindings</summary>
</details>
<details> <summary>UIs</summary>
(to have a project listed here, it should clearly state that it depends on llama.cpp)
</details>
<details> <summary>Tools</summary>
</details>
<details> <summary>Infrastructure</summary>
- Paddler - Open-source LLMOps platform for hosting and scaling AI in your own infrastructure - GPUStack - Manage GPU clusters for running LLMs - llama_cpp_canister - llama.cpp as a smart contract on the Internet Computer, using WebAssembly - llama-swap - transparent proxy that adds automatic model switching with llama-server - Kalavai - Crowdsource end to end LLM deployment at any scale - llmaz - ☸️ Easy, advanced inference platform for large language models on Kubernetes. - LLMKube - Kubernetes operator for llama.cpp with multi-GPU and Apple Silicon Metal support" </details>
<details> <summary>Games</summary>
</details>
llama-server - MIT licenseGetting started with llama.cpp is straightforward. Here are several ways to install it on your machine:
llama.cpp using brew, nix or wingetOnce installed, you'll need a model to work with. Head to the Obtaining and quantizing models section to learn more.
Example command:
```sh
llama.cpp. Useful for developers.- <details> <summary>Basic text completion</summary>
llama-simple -m model.gguf
# Hello my name is Kaitlyn and I am a 16 year old girl. I am a junior in high school and I am currently taking a class called "The Art of
</details>
llama-server -hf ggml-org/gemma-3-1b-it-GGUF ```
业界最成熟的轻量级LLM推理框架,GitHub星标超11万,代码质量高、更新活跃,是本地AI部署的黄金标准方案。
AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。
建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。
✅ MIT 协议 — 最宽松的开源协议之一,可自由商用、修改、分发,仅需保留版权声明。
总体来看,llama-cpp AI技能包 是一款质量优秀的AI工具,在同类工具中具备一定竞争力。AI Skill Hub 将持续追踪其更新动态,建议收藏备用,结合自身场景选择合适时机引入使用。
| 原始名称 | llama-cpp |
| 原始描述 | 开源AI工具:LLM inference in C/C++。⭐110.4k · C++ |
| Topics | LLM推理C++实现GGML量化本地部署 |
| GitHub | https://github.com/ggml-org/llama.cpp |
| License | MIT |
| 语言 | C++ |
收录时间:2026-05-16 · 更新时间:2026-05-19 · License:MIT · AI Skill Hub 不对第三方内容的准确性作法律背书。