入门指南
要求
在开始集成之前,请确保您已经满足以下前提条件。
获取 ComIDP 许可证密钥
ComIDP 提供两种类型的许可证密钥:30 天免费试用许可证和正式许可证。
如何获取免费试用许可证联系我们的销售团队,我们将向您发送 ComIDP 的 30 天免费试用许可证。
如何获取正式许可证 ComPDFKit 转换 SDK 是一个商业 SDK,需要许可证才能发布应用程序。禁止将 ComIDP 已发布软件包中的任何文档、示例代码或源代码分发给任何第三方。
安装 ComIDP 包
联系我们 获取 ComIDP。
系统要求
支持的操作系统 ComIDP 可在多种平台上运行。支持以下操作系统:
- Ubuntu、Fedora、Debian 或 CentOS。Ubuntu 和 Debian 的衍生版本,例如 Kubuntu 或 Xubuntu,也受支持。目前仅支持 64 位 Intel (x86_64) 处理器。
功能组合推荐配置
系统组合 | CPU 推荐 | GPU 推荐 | 内存 推荐 | 存储 推荐 |
---|---|---|---|---|
知识库(KB) | ≥ 4 核(Intel i5 / AMD Ryzen 5) | ≥ 12GB 显存(如 RTX 3060 / A2000)可以根据问答模型调整 | ≥ 16 GB | ≥ 100 GB SSD(SATA 或 NVMe) |
文档抽取(Extract) | ≥ 8 核(Intel i7 / AMD Ryzen 7) | RTX 3090 / 4080(≥16GB 显存) | ≥ 32 GB | ≥ 500 GB NVMe SSD |
文档解析(Parse) | ≥ 16 核(Xeon Gold 63xx / EPYC 7402) | 无需独立 GPU | ≥ 64 GB | ≥ 1 TB NVMe SSD(读取速度 >2GB/s) |
KB + Extract | ≥ 8 核(Intel i7 / Ryzen 7) | RTX 3090 / 4080(≥16GB 显存) | ≥ 48 GB | ≥ 500 GB NVMe SSD |
KB + Parse | ≥ 8 核(Intel i7 / Ryzen 7) | ≥ 12GB 显存(如 RTX 3060 / A2000)可以根据问答模型调整 | ≥ 96 GB | ≥ 500 GB NVMe SSD |
Extract + Parse | ≥ 16 核(EPYC 7402 / Xeon Gold 63xx) | RTX 4090 / A100(≥24GB 显存) | ≥ 96 GB | ≥ 1 TB NVMe SSD(读取速度 >2GB/s) |
KB + Extract + Parse | ≥ 16 核(EPYC / Xeon Gold 多核并发支持) | RTX 4090 / A100 / H100(≥24GB 显存) | ≥ 128 GB | ≥ 1 TB 高速 NVMe SSD(读取速度 >2GB/s) |
安装 Docker
ComIDP 以 Docker 容器的形式分发。要在您的计算机上运行它,您需要安装适合您操作系统的 Docker 运行时环境。
请按照 Docker 官方网站 上的说明安装并启动 Docker Engine。
安装 Docker 后,您可以按照 安装说明 安装 Docker Compose。
安装 NVIDIA Container Toolkit
安装 NVIDIA 驱动程序
访问官方 NVIDIA 驱动程序页面 下载并安装正确的驱动程序。
验证您的 GPU 是否正在运行且可访问。
以下示例为 Ubuntu 22.04 - NVIDIA T4
sh
# 确保服务器已安装 gcc 和 make 环境。您可以使用以下命令检查 gcc 版本
gcc -v
# 您可以使用以下命令检查 make 版本
make -v
# 下载安装包
wget https://us.download.nvidia.com/tesla/550.54.15/NVIDIA-Linux-x86_64-550.54.15.run
# 执行安装包
sudo sh NVIDIA-Linux-x86_64-550.54.15.run
使用 nvidia-smi
检查安装是否成功。如果出现以下截图,则表示驱动程序已成功安装
安装 Nvidia Container Toolkit
请按照 NVIDIA Container Toolkit 的官方安装说明进行安装。
以下示例基于 Ubuntu 22.04 - NVIDIA T4
- 配置生产仓库:
sh
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
&& curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
- 从存储库更新软件包列表:
sh
sudo apt-get update
- 安装 NVIDIA Container Toolkit 软件包:
sh
sudo apt-get install -y nvidia-container-toolkit
运行 nvidia-container-toolkit -version
验证安装是否成功
- 配置 Docker
sh
sudo nvidia-ctk run-configure --runtime=docker
sh
# 重新启动 Docker 守护程序
sudo systemctl restart docker