无障碍|长者模式
 | 支持IPV6|无障碍|长者模式
 
 
2024年“数据要素×”大赛优秀项目案例集——科技创新案例之三 | 数据驱动海洋大模型训练,加速探索海洋科学研究新范式
发布时间:2025-02-15
来源:国家数据局
【字体: 】    打印
党中央高度重视科技创新发展,科技创新已成为发展新质生产力的核心要素,加强基础研究是世界科技强国建设的必由之路。当前,海洋科研数据的开发利用面临数据质量低、数据处理应用难、海洋科技成果转化难等痛点。为推动海洋科研数据的价值转化和流通增值,青岛国实信息科技有限公司作为崂山国家实验室的服务支撑平台和科技成果转化平台,多渠道汇聚海洋科研数据驱动海洋大模型产品研发,服务物理海洋学研究及全国沿海省市海洋信息化建设,打造海洋科学研究新范式,为我国科研数据资产化管理探路先行。
图1 打造海洋科学研究新范式
一是打通三种获取数据渠道,建设全球海洋大数据中心。通过建设自主海洋数据观测体系、搭建全国首个海洋数据交易服务平台,以及开展互联网数据采集等三种渠道,汇聚四大领域292类数据资源共100亿条,打造全球海洋高质量训练数据集共10大类171个,为深入挖掘数据应用场景、开展海洋大模型训练提供支撑。
图2 海洋科研数据汇聚与治理
二是突破两项核心技术,研发海洋大模型产品。一方面,创新海洋大数据治理技术,整合卫星、浮标、船舶观测等13类多源异构类型数据,形成海洋数据处理规则31种。另一方面,突破海洋大模型技术,面向国产算力平台进行模型适配与优化,助力大模型对海洋复杂知识系统的理解能力提升10%,训练周期缩短90%、成本降低30%。在产品研发方面,以全球海洋再分析数据集作为训练数据构建海洋环境预报大模型,研发全球高分辨率海洋环境预报产品,服务于海洋气候模拟与预测、海洋环境保护等领域海洋科学研究。同时,依托海洋科研文献训练的“海悟”大模型产品,辅助科研人员快速处理和提取科研文献关键信息,助力发现新规律、推理科研新方向。
图3 全球海洋环境精细化预报服务
三是构建海洋数据可信服务底座,保障数据应用安全。依托混合算力集群资源和百P级数据存储设施,应用国密算法、安全协议、数据保密通信中间件等,保障数据软硬件环境安全。同时,基于隐私计算、区块链技术建设海洋数据资产登记系统,建立数据访问权限控制机制,制定数据来源合规性审查、数据流通管理等制度共42项。
四是打造海洋数据流通交易新模式,形成海洋治理新引擎。项目建设的海洋数据交易服务平台,创新海洋数据存证溯源、数据质量评估、数据定价方法等机制,实现场内累计交易额3110万元,与40余家涉海单位开展数据生态合作。海洋大模型产品已应用于山东、福建、广西等沿海11个省市海洋信息化建设中,渔船大风网格化精准调度能力提升20%,浒苔灾害治理处置效率提升15%以上,服务大型涉海企业50余家。
图4 海洋数据流通平台
相关文件
联系我们 | 网站地图
版权所有:石家庄市数据局
地址:石家庄市中山东路216号市政府1号楼
邮编:050011 联系电话:0311-86687924
网站标识码:冀ICP备20007409号-11
 冀公网安备13010202004105号