[速采]中国政法大学算力及大模型管理服务采购项目(CUPL2025FSC068)

    

项目名称 中国政法大学算力及大模型管理服务采购项目 项目编号 CUPL2025FSC068
项目编号 CUPL2025FSC068
公告时间 2025/12/15 08:25 报价截止时间 2025/12/18 08:25
报价截止时间 2025/12/18 08:25
采购单位 中国政法大学 采购预算 ¥99,000.00
采购预算 ¥99,000.00
联系人 成交后在我参与的项目中查看 联系手机 成交后在我参与的项目中查看
联系手机 成交后在我参与的项目中查看
是否需要踏勘
是否需要踏勘
踏勘联系人 踏勘联系电话
踏勘联系电话
踏勘地点
付款计划 通过验收后付合同总额的100%
供应商须知的其他事项或要求


   采购清单
1
采购内容 是否限定品牌型号
算力及大模型管理服务
采购数量 1
预算总价(元) 99000
售后服务及质保期 合同签订生效后提供12个月算力及大模型管理服务,在服务期限内,及时响应和应对出现的相关问题,电话技术支持响应时间不大于15分钟,技术人员到位时间不大于两小时,一般问题在24小时之内解决,如遇重大问题在72小时内解决。
技术参数要求 GPU集群管理 1)OS与架构:支持RedHat/Ubuntu/OpenEuler等主流Linux及x86/ARM架构。2)异构硬件:统一纳管NVIDIA/AMD/昇腾/海光/寒武纪/燧原/天数/摩尔/沐曦等主流GPU,支持混合部署。3)集群池化:支持Docker/K8s/公有云主机等方式组建纳管多物理/逻辑集群。 模型访问及下载 1)仓库集成:图形化集成HuggingFace/ModelScope,支持在线搜索。2)下载管理:支持不占GPU在线下载及本地模型注册纳管。 模型部署及管理 1)多模态:原生支持LLM/VLM/Embedding/Rerank/TTS/STT/视频及OCR等自定义引擎。2)多引擎:内置vLLM/SGLang/MindIE及国产卡适配版,支持容器化接入自定义引擎。3)多版本:解耦引擎与平台,支持多版本按需选择/下载/切换。4)分布式:支持张量/流水线并行及多机多卡自动调度。5)调度策略:提供Binpack/Spread智能调度及标签/指定GPU手动调度,支持共享GPU。6)高可用:支持多实例负载均衡、故障自愈及跨节点迁移。7)兼容性:图形化检测模型/OS/资源依赖。8)公有云:集成千问/DeepSeek等服务及鉴权。 性能优化 1)生成加速:支持N-gram/Eagle/MTP算法及草稿模型配置,降低延迟。2)扩展KV缓存:一键启用LMCache/HiCache优化长文本。3)预置模式:提供延迟/吞吐量/标准优先模式,支持参数自定义。 调测管理 1)交互测试:图形化调整参数(Temp/Top P)实时查看输出。2)对比测试:支持同输入下多模型并行对比。3)全类型支持:覆盖对话/图像/语音等全模态测试。4)代码生成:自动生成CURL/Python/Node.js代码。 用户及用量 1)RBAC:支持Admin/User角色及精细权限控制。2)访问控制:支持用户/组的模型白名单授权。3)度量配额:统计Token用量与资源趋势,支持设限管控成本。 可观测性 1)服务监控:采集vLLM等引擎延迟/吞吐/队列/KV缓存指标。2)资源监控:实时监控节点CPU/内存/GPU负载/显存/温度。3)统一接口:提供归一化指标,支持Prometheus/Grafana集成及预置面板。 接口与集成 1)管理API:提供OpenAPI/Swagger支持自动化运维。2)推理API:兼容OpenAI/Jina协议,对接LangChain/Dify/RAGFlow。3)SSO:支持OIDC/SAML对接企业认证。

注:请点击 我要报价  点击"统一登录入口"进行登录并在线报价。