为便于供应商及时了解政府采购信息,根据《财政部关于开展政府采购意向公开工作的通知》(财库〔2020〕10号)等有关规定,现将海关总署风控司2025年9月政府采购意向公开如下:
序号 | 采购项目名称 | 采购需求概况 | 预算金额(万元) | 预计采购时间 | 备注 |
1 | 海关数据治理服务项目 | 具体服务内容分为两个子项目: (一)数据治理咨询及实施服务(600万元) 一是对海关数据资源进行全面梳理,形成海关数据资源目录和数据源目录,完善海关数据源(一数一源)管理体系,实现全业务领域海关数据的系统整合;二是制定完善的数据质量标准并建立数据质量规则库,对海关数据质量开展评估,根据评估结果进行数据质量检查,并对重点表建立数据质量监控规则及策略,深化海关数据质量管理实施。三是通过提供数据咨询服务、建立海关数据专家培训及认证机制、提供数据架构指导等,打造包含业务领域数据专员和数据架构专家的海关大数据专家库,提升海关内部专家数据治理及数据架构能力。五是开展海关数据标签管理,包括海关管理标签及技术标签管理服务、海关业务对象标签管理服务。基于一期海关数据标签体系建设基础上,围绕海关业务对象及高频使用的库表进行标签建设和管理实施服务,对海关不少于3个业务条线进行开发应用。制定海关业务对象标签全生命周期管理规范,建立海关重点业务对象标签基础数据集,供海关使用标签进行风险分析,提升数据的可用性、可管理性和价值。 (二)数据治理助手(360万元) 引入大模型助手辅助实现数据治理,提升数据治理效率及质量。引入大模型到数据治理活动的各个环节,通过提供数据治理助手,辅助完成数据采集、清洗、应用等全数据治理过程。核心功能应包括但不限于:数据清洗、建模辅助、数据中台表信息应用、数据质量核查、数据资产管理、安全治理等。 | 960 | 2025年9月 |
|
2 | 海关高质量数据集建设项目 | 本项目针对海关实际业务需求导向,将相关业务条线内的不同格式与形态的数据加工为高价值、高密度、标准化的数据集合,构建数据知识资源底座,通过建设高质量数据集,支持海关开展人工智能模型开发和训练。高质量数据集应重点实现如下目标: 一是海关内部高质量数据集管理全流程规定,全面覆盖数据集完整生命周期。 二是海关跨模态数据关联规则,依照海关数据实际特征,完成海关高质量数据集中至少两种及以上的非结构化数据跨模态关联,完成可复制推广的特征提取与数据关联经验。 三是制定高质量数据集。参照智能大模型建设需求,制定实现1个海关通识高质量数据集及不少于5个重点业务条线的专识高质量数据集,含结构化及非结构化数据。 四是促进智能大模型发展应用。在实际应用中,通过有标注的指令数据对模型进行精细化调整,加强大模型的分析执行能力,加强大模型批量处置数据的精度准度与速率,并具备详细的数据技术处理计划和方案,满足该业务条线的各类大模型的数据供给及全面应用。 | 600 | 2025年9月 |
|
3 | 海关人工智能大模型语料库建设项目
| 本项目旨在通过系统性、规范化的数据资源整合与治理,为海关大模型训练与应用提供高质量、适配性强的基础支撑,核心目标是实现高质量语料供给、提升数据处理效率、增强数据安全性、增强数据合规性、促进技术应用与创新。应包含以下内容: 一是结构化知识网络构建。提供海关法律法规、公文报告等大规模文本数据,为海关大模型训练提供基础的语言规律学习素材,支撑大模型的参数训练,提升对上下文规律的捕捉能力。 二是数据预处理与动态更新。提供数据清洗与标准化,提升数据质量与模型训练效率。提供实时数据整合与泛化,并持续更新语料库,确保海关大模型适应时效性需求,增强对新场景的泛化能力。 三是逻辑推理能力构建。支持掩码语言建模(BERT)、自回归预测(GPT)等预训练任务,使大模型掌握语法、语义及上下文逻辑,为逻辑推理与自然语言生成提供底层支持。 四是多模态数据融合。整合文本、图像、语音等结构化与非结构化数据,构建覆盖海关业务领域多场景的训练资源池。 五是适配海关工作场景。针对海关业务场景定向采集专用语料(如通关监管、税收征管、动植物检疫),提升模型在专业术语理解与合规性输出上的表现。 | 325 | 2025年9月 |
|
本次公开的采购意向是本单位政府采购工作的初步安排,具体采购项目情况以相关采购公告和采购文件为准。
海关总署风控司
2025年7月1日