LK-UniDock · 跨平台 GPU 分子对接引擎合集

跨平台 GPU 分子对接引擎，
为原项目补齐 Windows/Linux GPU 发行。

GPU-Accelerated Molecular Docking Engines with Pre-built Portable Binaries for All Major Platforms

LK-UniDock 是 Uni-Dock 与 UniDock-Pro 的跨平台打包发行项目。提供预编译二进制（含 两个原项目尚未提供的 Windows GPU 版本）和适配补丁后的源代码。静态链接 CUDA Runtime、Boost、MSVC CRT，运行时仅需 1 个 DLL。特别感谢 Uni-Dock 与 UniDock-Pro 原项目作者的工作。

2 个 GPU 引擎 3 个平台原生支持 sm_60 → sm_120 GTX 10 → RTX 50 CUDA 12.8 Blackwell 支持

面向 Windows GPU 构建的适配工作。 在实际构建 Uni-Dock v1.1.3 与 UniDock-Pro v0.0.1 的 Windows GPU 版本过程中，我们识别并适配了下列几个点：

① MSVC + CUDA 12 的头文件交互：boost/filesystem/path.hpp 在 CUDA 编译单元中会触发 __std_fs_copy_options 相关问题，原源码在 Windows MSVC 环境下需采用 __CUDACC__ guard 隔离；
② conda Boost 与静态打包的适配：BUILD_PORTABLE=ON 与 conda 预编译动态 Boost 同时使用时会约束冲突，采用 FETCH_BOOST=ON 策略从源码拉取静态 Boost；
③ CUDA 11.8 与 Blackwell 架构：GitHub CI 默认的 CUDA 11.8 不覆盖 sm_100 / sm_120（RTX 50），需升级至 CUDA 12.8；
④ UniDock-Pro 项目补齐：NiBoyang/UniDock-Pro 尚未提供 LICENSE 与自动化构建配置，LK-UniDock 同步补齐 Apache 2.0 LICENSE 与 GitHub Actions 构建流程。

Windows 用户的现实选择。 在原项目提供 Linux GPU 版本的前提下，Windows 用户一般通过 WSL2 + CUDA 访问。WSL2 本身表现优秀，但在部分 GPU 上可能会有小幅性能损耗（常见为 10-15%），且需额外配置 CUDA-WSL 驱动栈。对企业科研团队而言，原生 Windows 工作站 + RTX 显卡 + 复制即用 的部署模式依然有价值。

从 RTX 10 到 RTX 50 的硬件跨越。 NVIDIA 近十年发布了 Pascal（sm_60）、Volta（sm_70）、Turing（sm_75）、Ampere（sm_80/86）、Ada Lovelace（sm_89）、Hopper（sm_90）、Blackwell（sm_100/120）七代架构。研发实验室中常混合使用多代显卡，一份二进制覆盖全部架构才能实用。

能力维度	LK-UniDock 预编译	原项目源码自编译	WSL2 方案
Windows GPU 可用性	✓ 预编译 exe	需适配 MSVC + CUDA 12 构建	需安装 WSL2 + CUDA-WSL
部署时间	< 1 分钟（解压）	数小时（首次构建）	30 分钟 ~ 数小时
依赖安装	零（静态打包）	CUDA + Boost + MSVC 全套	WSL2 + Linux 工具链
运行时 DLL 数	1（vcomp140.dll）	10+	Linux 动态库
GPU 性能	原生 100%	原生 100%	原生 85~90%（常见 WSL 损耗）
Blackwell（RTX 50）	✓ sm_100/120 支持	需 CUDA 12.8+ 配置	需 CUDA 12.8 WSL 驱动
跨机器可移植	✓ 复制即用	需重复构建或备齐 DLL	需在每台机器配 WSL
UniDock-Pro 发行	✓ 同步补齐 LICENSE + CI	需自行适配	同 Linux 方案
许可证合规	Apache 2.0 明确	与原项目一致	与原项目一致
macOS Apple Silicon	✓ CPU 版预编译	需安装 brew + libomp	不支持

能力维度

LK-UniDock 预编译

原项目源码自编译

WSL2 方案

Windows GPU 可用性

✓ 预编译 exe

需适配 MSVC + CUDA 12 构建

需安装 WSL2 + CUDA-WSL

部署时间

< 1 分钟（解压）

数小时（首次构建）

30 分钟 ~ 数小时

依赖安装

零（静态打包）

CUDA + Boost + MSVC 全套

WSL2 + Linux 工具链

运行时 DLL 数

1（vcomp140.dll）

10+

Linux 动态库

GPU 性能

原生 100%

原生 100%

原生 85~90%（常见 WSL 损耗）

Blackwell（RTX 50）

✓ sm_100/120 支持

需 CUDA 12.8+ 配置

需 CUDA 12.8 WSL 驱动

跨机器可移植

✓ 复制即用

需重复构建或备齐 DLL

需在每台机器配 WSL

UniDock-Pro 发行

✓ 同步补齐 LICENSE + CI

需自行适配

同 Linux 方案

许可证合规

Apache 2.0 明确

与原项目一致

macOS Apple Silicon

✓ CPU 版预编译

需安装 brew + libomp

不支持

组件	LK-UniDock build	原项目 GitHub release
Windows GPU binary	✓ 提供	— 尚未提供
CUDA Runtime	静态嵌入（无需安装）	动态 DLL（需 CUDA Toolkit）
Boost	静态嵌入 `FETCH_BOOST=ON`	动态 conda DLL
MSVC CRT	静态嵌入 `BUILD_PORTABLE=ON`	需 VC++ Redist
运行时 DLL 依赖	仅 1 个：`vcomp140.dll`（bundled）	10+ 个，需逐一配置
CUDA 架构	sm_60 → sm_120（GTX 10 → RTX 50）	取决于 CI 配置
可移植性	✓ 复制 exe + dll，任意机器运行	需同步部署运行时环境

组件

LK-UniDock build

原项目 GitHub release

Windows GPU binary

✓ 提供

— 尚未提供

CUDA Runtime

静态嵌入（无需安装）

动态 DLL（需 CUDA Toolkit）

Boost

静态嵌入 FETCH_BOOST=ON

动态 conda DLL

MSVC CRT

静态嵌入 BUILD_PORTABLE=ON

需 VC++ Redist

运行时 DLL 依赖

仅 1 个：vcomp140.dll（bundled）

10+ 个，需逐一配置

CUDA 架构

sm_60 → sm_120（GTX 10 → RTX 50）

取决于 CI 配置

可移植性

✓ 复制 exe + dll，任意机器运行

需同步部署运行时环境

架构	代表 GPU	支持
`sm_60 / sm_61`	GTX 1060 / GTX 1080 Ti（Pascal）	✓
`sm_70`	Tesla V100 / Titan V（Volta）	✓
`sm_75`	RTX 20 系列 / T4（Turing）	✓
`sm_80 / sm_86`	RTX 30 系列 / A100（Ampere）	✓
`sm_89`	RTX 40 系列 / L40（Ada Lovelace）	✓
`sm_90`	H100（Hopper）	✓
`sm_100 / sm_120`	RTX 50 / Blackwell（CUDA 12.8 构建）	✓

架构

代表 GPU

支持

sm_60 / sm_61

GTX 1060 / GTX 1080 Ti（Pascal）

✓

sm_70

Tesla V100 / Titan V（Volta）

✓

sm_75

RTX 20 系列 / T4（Turing）

✓

sm_80 / sm_86

RTX 30 系列 / A100（Ampere）

✓

sm_89

RTX 40 系列 / L40（Ada Lovelace）

✓

sm_90

H100（Hopper）

✓

sm_100 / sm_120

RTX 50 / Blackwell（CUDA 12.8 构建）

✓

参数	默认值	说明
Uni-Dock
`--exhaustiveness`	8	搜索彻底性（越大越准、越慢）
`--num_modes`	9	最大输出构象数
`--energy_range`	3.0	能量窗口（kcal/mol）
`--scoring`	vina	评分函数：`vina` / `vinardo` / `ad4`
`--score_only`	—	仅评估当前 pose，不搜索
`--local_only`	—	仅局部优化
UniDock-Pro 额外参数
`--reference_ligand`	—	相似性引导对接的参考配体
`--similarity_searching`	—	启用相似性搜索引导
`--hybrid_mode`	—	混合模式（相似性 + 自由对接）
`--max_gpu_memory`	all	限制 GPU 内存使用（MB）
`--refine_step`	3	精化步数

参数

默认值

说明

Uni-Dock

--exhaustiveness

搜索彻底性（越大越准、越慢）

--num_modes

最大输出构象数

--energy_range

3.0

能量窗口（kcal/mol）

--scoring

vina

评分函数：vina / vinardo / ad4

--score_only

—

仅评估当前 pose，不搜索

--local_only

—

仅局部优化

UniDock-Pro 额外参数

--reference_ligand

—

相似性引导对接的参考配体

--similarity_searching

—

启用相似性搜索引导

--hybrid_mode

—

混合模式（相似性 + 自由对接）

--max_gpu_memory

all

限制 GPU 内存使用（MB）

--refine_step

精化步数

项目	原项目 `dptech-corp/Uni-Dock`	LK-UniDock
源码版本	v1.1.3	v1.1.3（同源）
Windows GPU 预编译	尚未提供	✓ 提供
CUDA 版本	11.8（GitHub CI）	12.8（支持 RTX 50 / Blackwell）
CUDA Runtime	动态（需 CUDA Toolkit）	静态嵌入
Boost	动态（需 conda / vcpkg）	静态嵌入 `FETCH_BOOST=ON`
MSVC CRT	动态（需 VC++ Redist）	静态嵌入 `BUILD_PORTABLE=ON`
Windows 运行时 DLL 数	10+	1（`vcomp140.dll`）
MSVC + CUDA 环境适配	需手工处理	✓ 已通过 `__CUDACC__` guard 适配

项目

原项目 dptech-corp/Uni-Dock

LK-UniDock

源码版本

v1.1.3

v1.1.3（同源）

Windows GPU 预编译

尚未提供

✓ 提供

CUDA 版本

11.8（GitHub CI）

12.8（支持 RTX 50 / Blackwell）

CUDA Runtime

动态（需 CUDA Toolkit）

静态嵌入

Boost

动态（需 conda / vcpkg）

静态嵌入 FETCH_BOOST=ON

MSVC CRT

动态（需 VC++ Redist）

静态嵌入 BUILD_PORTABLE=ON

Windows 运行时 DLL 数

10+

1（vcomp140.dll）

MSVC + CUDA 环境适配

需手工处理

✓ 已通过 __CUDACC__ guard 适配

错误信息	原因	解决方案
`[CPU-only build] GPU batch docking unavailable`	CUDA 未检测到	使用 `-DCMAKE_CUDA_COMPILER=...` 显式指定 nvcc
`boost/filesystem/path.hpp` 编译错误	CUDA TU 导入 Boost filesystem	应用 `__CUDACC__` guard（此仓库已包含）
`boost_thread.lib (shared, Boost_USE_STATIC_LIBS=ON)`	conda Boost + `BUILD_PORTABLE=ON` 冲突	使用 `-DFETCH_BOOST=ON` 跳过 conda Boost
`nvcc fatal: Unsupported gpu architecture 'compute_60'`	CUDA 13+ 已移除 Pascal / Volta	使用 CUDA 12.8
CMake CUDA 检测失败（即使 nvcc 在 PATH）	`-T cuda="..."` 路径含空格	使用 `-DCMAKE_CUDA_COMPILER=full\path\to\nvcc.exe`

错误信息

原因

解决方案

[CPU-only build] GPU batch docking unavailable

CUDA 未检测到

使用 -DCMAKE_CUDA_COMPILER=... 显式指定 nvcc

boost/filesystem/path.hpp 编译错误

CUDA TU 导入 Boost filesystem

应用 __CUDACC__ guard（此仓库已包含）

boost_thread.lib (shared, Boost_USE_STATIC_LIBS=ON)

conda Boost + BUILD_PORTABLE=ON 冲突

使用 -DFETCH_BOOST=ON 跳过 conda Boost

nvcc fatal: Unsupported gpu architecture 'compute_60'

CUDA 13+ 已移除 Pascal / Volta

使用 CUDA 12.8

CMake CUDA 检测失败（即使 nvcc 在 PATH）

-T cuda="..." 路径含空格

使用 -DCMAKE_CUDA_COMPILER=full\path\to\nvcc.exe

跨平台 GPU 分子对接引擎，
为原项目补齐 Windows/Linux GPU 发行。

Uni-Dock 与 UniDock-Pro。

为什么 GPU 分子对接需要一个跨平台发行版？

LK-UniDock 的三重价值。

LK-UniDock vs 从源码自行编译。

三平台开箱即用。

原项目尚未提供，LK-UniDock 静态打包补齐。

从 10+ 个动态依赖到仅 1 个。

从 Pascal 到 Blackwell，
一份二进制全覆盖。

三种典型对接场景。

常用选项一览。

LK-UniDock 在原项目上进行了哪些适配？

从源码构建三平台完整版本。

遇到报错对号入座。

开始 GPU 加速虚拟筛选