北京软件产品质量检测检验中心有限公司
010-82825511

人工智能测评

针对以大模型等技术为基础的人工智能系统及应用,从底层基础架构到中间模型管理再到工具链、以及上层应用表现等提供测评服务,协助用户评估人工智能相关基础设施和应用系统的质量水平,为用户选择合适的人工智能产品和服务提供咨询。

·适用场景或对象:
  • 单模态大模型、多模态大模型、行业大模型、基于大模型的应用系统,提供大模型服务的MaaS平台、算力中心以及提供大模型算力的一体机等
·检测流程:
  • 确定测试范围->确定测评指标->开发测试用例->执行测试->计算准确率、召回率、精度等客观指标->对理解能力、生成能力等进行主观评价->对MaaS平台或大模型一体机功能/工具链/性能/安全进行评测->生成报告
·测试依据:
  • —— 人工智能 预训练模型 第1部分 通用要求
  • —— 人工智能 预训练模型 第2部分 评测指标与方法
  • —— 人工智能 预训练模型 第3部分 服务能力成熟度评估
  • —— 人工智能 计算中心 计算能力评估
  • —— 人工智能 深度学习算法评估
  • —— 人工智能 产品与服务 模型即服务(MaaS)参考框架
  • —— 人工智能 产品与服务 模型即服务(MaaS)技术规范
·咨询电话:

010-82825511-691