[速采]中国政法大学算力及大模型管理服务采购项目(CUPL2025FSC068)-中国政法大学

项目名称	中国政法大学算力及大模型管理服务采购项目	项目编号	CUPL2025FSC068
项目编号	CUPL2025FSC068
公告时间	2025/12/15 08:25	报价截止时间	2025/12/18 08:25
报价截止时间	2025/12/18 08:25
采购单位	中国政法大学	采购预算	￥99,000.00
采购预算	￥99,000.00
联系人	成交后在我参与的项目中查看	联系手机	成交后在我参与的项目中查看
联系手机	成交后在我参与的项目中查看
是否需要踏勘	否
是否需要踏勘	否
踏勘联系人		踏勘联系电话
踏勘联系电话
踏勘地点
付款计划	通过验收后付合同总额的100%
供应商须知的其他事项或要求

采购清单

采购内容		是否限定品牌型号
算力及大模型管理服务		否
采购数量	1
预算总价（元）	99000
售后服务及质保期	合同签订生效后提供12个月算力及大模型管理服务，在服务期限内，及时响应和应对出现的相关问题，电话技术支持响应时间不大于15分钟，技术人员到位时间不大于两小时，一般问题在24小时之内解决，如遇重大问题在72小时内解决。
技术参数要求	GPU集群管理 1）OS与架构：支持RedHat/Ubuntu/OpenEuler等主流Linux及x86/ARM架构。2）异构硬件：统一纳管NVIDIA/AMD/昇腾/海光/寒武纪/燧原/天数/摩尔/沐曦等主流GPU，支持混合部署。3）集群池化：支持Docker/K8s/公有云主机等方式组建纳管多物理/逻辑集群。模型访问及下载 1）仓库集成：图形化集成HuggingFace/ModelScope，支持在线搜索。2）下载管理：支持不占GPU在线下载及本地模型注册纳管。模型部署及管理 1）多模态：原生支持LLM/VLM/Embedding/Rerank/TTS/STT/视频及OCR等自定义引擎。2）多引擎：内置vLLM/SGLang/MindIE及国产卡适配版，支持容器化接入自定义引擎。3）多版本：解耦引擎与平台，支持多版本按需选择/下载/切换。4）分布式：支持张量/流水线并行及多机多卡自动调度。5）调度策略：提供Binpack/Spread智能调度及标签/指定GPU手动调度，支持共享GPU。6）高可用：支持多实例负载均衡、故障自愈及跨节点迁移。7）兼容性：图形化检测模型/OS/资源依赖。8）公有云：集成千问/DeepSeek等服务及鉴权。性能优化 1）生成加速：支持N-gram/Eagle/MTP算法及草稿模型配置，降低延迟。2）扩展KV缓存：一键启用LMCache/HiCache优化长文本。3）预置模式：提供延迟/吞吐量/标准优先模式，支持参数自定义。调测管理 1）交互测试：图形化调整参数（Temp/Top P）实时查看输出。2）对比测试：支持同输入下多模型并行对比。3）全类型支持：覆盖对话/图像/语音等全模态测试。4）代码生成：自动生成CURL/Python/Node.js代码。用户及用量 1）RBAC：支持Admin/User角色及精细权限控制。2）访问控制：支持用户/组的模型白名单授权。3）度量配额：统计Token用量与资源趋势，支持设限管控成本。可观测性 1）服务监控：采集vLLM等引擎延迟/吞吐/队列/KV缓存指标。2）资源监控：实时监控节点CPU/内存/GPU负载/显存/温度。3）统一接口：提供归一化指标，支持Prometheus/Grafana集成及预置面板。接口与集成 1）管理API：提供OpenAPI/Swagger支持自动化运维。2）推理API：兼容OpenAI/Jina协议，对接LangChain/Dify/RAGFlow。3）SSO：支持OIDC/SAML对接企业认证。

注：请点击我要报价点击"统一登录入口"进行登录并在线报价。