重点围绕大数据等数字领域新职业,以技术创新为核心,以数据赋能为关键……分职业、分专业、分等级开展规范化培训、社会化评价 点击查看
数据交易师回到顶部
考生须知
数据交易师关注二维码 扫码关注官方微信 预约考试公开课
热点推荐
综合服务
行业动态 入表周报
考生须知
数据交易师官方微信 扫码关注官方微信 预约考试公开课

行业动态|复旦大学联合上智院发布三项科学数据新基建

来源: 新民晚报      发布日期:2025-04-30
在数据要素价值加速释放的背景下,科学数据的开放共享与协作正成为破解科研难题、推动产业升级的核心引擎。4月29日,第八届数字中国建设峰会科学数据合作分论坛在福州数字中国会展中心举行。会上,复旦大学人工智能创新与产业研究院副院长、上智院院长助理程远作为代表发布了三项科学数据基础设施——生命流体数据集、催化化学反应活性数据集及科学数据标注平台。
血流动力学研究是生物医学领域的重要组成部分,它帮助科学家深入理解生物体内的运动规律,有助于理解心血管系统的功能和疾病机制。通过分析血液在血管中的流动特性及其与血管内壁的相互作用,研究人员能够识别出血压、血管直径、血液粘度等影响血流的因素,这对高血压、心力衰竭、颅内动脉瘤等心脑血管疾病的预防和治疗至关重要。其中,颅内动脉瘤是一类脑部血管畸变,通常无症状,但是一旦破裂却可能导致严重的蛛网膜下腔出血(SAH)。尽管临床实践通常基于动脉瘤的个体因素和形态特征,但其病理生理和血流动力学机制仍存在争议。
生命流体数据集Aneumo基于466个真实颅内动脉瘤的几何形状开发,通过切除和变形操作生成超10000个合成几何形状(含 466 个无动脉瘤几何和 9534 个变形动脉瘤几何),涵盖流速、压力、壁面切应力等关键参数,为研究动脉瘤的发病机制和临床预测提供了宝贵资源。
该数据集将为颅内动脉瘤破裂风险预测提供多场景模拟支持,还可基于血流动力学原理助力优化血管支架、人工血管等医疗设备的设计流程。这将有助于加深对颅内动脉瘤病理特征和血流动力学机制的理解,并支持相关领域的深入研究,加速心脑血管疾病诊疗方案的临床转化。
催化化学反应活性数据集聚焦于解决化学研发中的关键挑战。化学文献中反应数据的记录方式存在显著差异,特别是产率计算标准、催化剂命名规则等关键信息往往缺乏统一规范。通过开发专用的化学信息提取算法与人工校验流程,团队实现了对海量非结构化数据的标准化重构,基于该数据集训练的催化反应预训练模型在Buchwald-Hartwig、Suzuki-Miyaura等关键交叉偶联反应上能实现反应活性的精准预测,预测误差低于10%。
该数据集在微观层面完整记录了反应底物、催化剂、溶剂、添加剂等关键组分,在宏观层面系统整合了制药、化工催化及电池研发等领域的近30类反应类型,包括经典的偶联反应、环加成反应以及前沿的碳氢键活化反应等。数据集提供了超过100万条经过严格校验的反应记录,并建立了从实验室小试到工业化放大的标准化数据桥梁。
会上发布的另一项科学数据成果——科学数据标注平台,则旨在通过人工智能与专业标注工具的结合,提升科研数据处理效率,加速科学发现进程。平台打造了端到端智能文献提取方案,实现自动化采集,加工,标注和落库的一站式自动化方案,大幅度提高质量数据集加工效率。
该平台将提供化学分子式标注、文献表格提取及2D/3D医疗影像标注等多模态工具,通过AI辅助标注功能大幅缩短标注周期、降低专业门槛,并构建安全可信可审计的数据标注环境。平台配备50人以上专业化标注团队,以低培训门槛和高效率服务支持科研需求。
来源:新民晚报 作者:张炯强