□ 本报记者 王晓涛
10月24日上午,在2024年“数据要素×”大赛全国总决赛科技创新赛道的比赛现场,记者注意到,科技创新领域多源数据共享模式突出,数据驱动的新科研范式亮点频出。
第一个出场的是甬江实验室团队。他们基于独创的虚拟眼图生成式大模型——Eye-2大模型,成功实现了降本增效的目标:硬件成本降低80%、人力投入降低75%、数据标注效率增加250倍、数据标注精度提升200%。目前,该团队已经与OPPO、舜宇、歌尔、Meta、信通院等国内外多家知名的龙头企事业单位开展了技术合作。
中国科学院空天信息创新研究院团队倒数第二个出场,他们的参赛项目是“地球大数据促进全球和区域可持续发展目标实现”。项目汇报人闫冬梅介绍,团队率先提出了地球大数据的概念,并且汇聚了19.5PB级的数据资源,建立了数据算法模型应用的一体化程序,构建SDG大数据平台,并且在此基础上研发全球及区域可持续发展数据产品,实现多尺度的监测评估与示范应用。“我们突破了多元算力超融合的系统架构,研制了DataBank等专业系统,创新了数据、算法、模型和服务一体化的数据共享新模式,我们的平台入选了联合国SDG技术促进在线机制。”
闫冬梅表示,自2019年系统上线以来,共服务了174个国家和68万用户。项目取得的直接经济效益达到16.64亿元,并且为11个国家示范区进行推广应用,国际数据委员会评价其是世界上首个服务SDG的大数据平台,具有支持SDG决策的独特数据集和先进算法。最终,项目以92.20的高分荣获科技创新赛道一等奖。
北京大学深圳研究生院的AI+蛋白质设计团队,通过四维冷冻电镜的拍照,用计算的方式模拟蛋白在高维空间中的动态并建模,实现药物研发效率的提高。目前,他们组建了一个有60PB级的公共数据库,对大模型进行预训练。项目汇报人陈杰表示,传统药物研发一般建立庞大的数据库需要24个月,而采用该团队的计算方式,只需要5个月。“希望通过我们这种计算的方式,能够将研发周期大幅度缩短至3至5年,研发成本也大幅度降低。”
透过2024年“数据要素×”大赛全国总决赛科技创新赛道的比赛,不难发现,数据要素正在各行业各领域发挥协同优化、复用增效、融合创新作用,赋能千行百业发展。
正如一位参赛团队的成员所说:“一滴水只有融入大海才能永不干涸。”通过开放共享,无数数据汇聚成蕴藏丰富宝藏的海洋,遨游其间,科技创新的大航海时代正在开启。