学校概况
学校简介
校长致辞
现任领导
历任领导
法大概览
学校章程
法大文化
党政机关
教学机构
人才培养
科学研究
招生就业
人才招聘
海外交流
图书馆
信息公开
EN
学校概况
学校简介
校长致辞
现任领导
历任领导
法大概览
学校章程
法大文化
党政机关
教学机构
人才培养
科学研究
招生就业
人才招聘
海外交流
图书馆
信息公开
智慧法大
办公系统
ENGLISH
法大邮箱
网上投诉
服务指南
远程访问
招标公告
[速采]中国政法大学算力及大模型管理服务采购项目(CUPL2025FSC068)
发布单位:
发布时间:2025-12-15 08:25
点击数:Views
项目名称
中国政法大学算力及大模型管理服务采购项目
项目编号
CUPL2025FSC068
项目编号
CUPL2025FSC068
公告时间
2025/12/15 08:25
报价截止时间
2025/12/18 08:25
报价截止时间
2025/12/18 08:25
采购单位
中国政法大学
采购预算
¥99,000.00
采购预算
¥99,000.00
联系人
成交后在我参与的项目中查看
联系手机
成交后在我参与的项目中查看
联系手机
成交后在我参与的项目中查看
是否需要踏勘
否
是否需要踏勘
否
踏勘联系人
踏勘联系电话
踏勘联系电话
踏勘地点
付款计划
通过验收后付合同总额的100%
供应商须知的其他事项或要求
采购清单
1
采购内容
是否限定品牌型号
算力及大模型管理服务
否
采购数量
1
预算总价(元)
99000
售后服务及质保期
合同签订生效后提供12个月算力及大模型管理服务,在服务期限内,及时响应和应对出现的相关问题,电话技术支持响应时间不大于15分钟,技术人员到位时间不大于两小时,一般问题在24小时之内解决,如遇重大问题在72小时内解决。
技术参数要求
GPU集群管理 1)OS与架构:支持RedHat/Ubuntu/OpenEuler等主流Linux及x86/ARM架构。2)异构硬件:统一纳管NVIDIA/AMD/昇腾/海光/寒武纪/燧原/天数/摩尔/沐曦等主流GPU,支持混合部署。3)集群池化:支持Docker/K8s/公有云主机等方式组建纳管多物理/逻辑集群。 模型访问及下载 1)仓库集成:图形化集成HuggingFace/ModelScope,支持在线搜索。2)下载管理:支持不占GPU在线下载及本地模型注册纳管。 模型部署及管理 1)多模态:原生支持LLM/VLM/Embedding/Rerank/TTS/STT/视频及OCR等自定义引擎。2)多引擎:内置vLLM/SGLang/MindIE及国产卡适配版,支持容器化接入自定义引擎。3)多版本:解耦引擎与平台,支持多版本按需选择/下载/切换。4)分布式:支持张量/流水线并行及多机多卡自动调度。5)调度策略:提供Binpack/Spread智能调度及标签/指定GPU手动调度,支持共享GPU。6)高可用:支持多实例负载均衡、故障自愈及跨节点迁移。7)兼容性:图形化检测模型/OS/资源依赖。8)公有云:集成千问/DeepSeek等服务及鉴权。 性能优化 1)生成加速:支持N-gram/Eagle/MTP算法及草稿模型配置,降低延迟。2)扩展KV缓存:一键启用LMCache/HiCache优化长文本。3)预置模式:提供延迟/吞吐量/标准优先模式,支持参数自定义。 调测管理 1)交互测试:图形化调整参数(Temp/Top P)实时查看输出。2)对比测试:支持同输入下多模型并行对比。3)全类型支持:覆盖对话/图像/语音等全模态测试。4)代码生成:自动生成CURL/Python/Node.js代码。 用户及用量 1)RBAC:支持Admin/User角色及精细权限控制。2)访问控制:支持用户/组的模型白名单授权。3)度量配额:统计Token用量与资源趋势,支持设限管控成本。 可观测性 1)服务监控:采集vLLM等引擎延迟/吞吐/队列/KV缓存指标。2)资源监控:实时监控节点CPU/内存/GPU负载/显存/温度。3)统一接口:提供归一化指标,支持Prometheus/Grafana集成及预置面板。 接口与集成 1)管理API:提供OpenAPI/Swagger支持自动化运维。2)推理API:兼容OpenAI/Jina协议,对接LangChain/Dify/RAGFlow。3)SSO:支持OIDC/SAML对接企业认证。
注:
请点击
我要报价
点击"统一登录入口"进行登录并在线报价。
上一条:
[速采]中国政法大学学籍材料制作采购项目成交公告(CUPL2025FSC062)
下一条:
[速采]中国政法大学2025年网络安全等级保护测评服务采购项目成交公告(CUPL2025FSC063)