details
【华体会最新】海洋学院博士生韩明宇发表研究成果,利用基于深度学习的主题建模和聚类分析探索海洋学研究趋势与新兴主题
2024/12/10

近日,上海交通大学海洋学院博士生韩明宇在npj Ocean Sustainability上发表了题为“Exploring trends and emerging topics in oceanography (1992-2021) using deep learning-based topic modeling and cluster analysis”的研究论文,海洋学院周韫韬副教授为通讯作者。上海交通大学海洋学院为唯一完成单位。

image.png

过去几十年,海洋学在科学探索和数据收集的推动下取得了显著发展。尽管各分支领域取得诸多突破,但仍然缺乏对整个海洋学文献的全面分析。近年来,大数据和深度学习的兴起为处理海量文献提供了可能。基于深度学习的主题建模方法,如BERTopic,结合先进的降维和聚类技术,可从数十万篇文献中提取隐含主题,系统分析研究热点和发展趋势。本研究通过构建BERTopic模型,揭示近三十年来海洋学研究的热点、地理分布及其动态演变,为未来研究与政策提供指导。

image.png

图1. 海洋学文献的主题聚类图

本研究收集了来自Web of Science的334,765篇海洋学文献,创新性地结合了多标签分类、主题建模和聚类分析,构建了海洋学文献的主题聚类图(图1),有效展示了过去三十年最热门的100个研究主题及其领域分布。图中每个点表示一篇文献,位置由基于 BERT 的高维文本向量通过 t-SNE 降维技术得到,颜色反映研究领域。统计显示,“marine & freshwater biology”领域文献数量最多,其次是“engineering”和“water resources”。此外,图中小型多色点聚类表现了交叉学科特征,如涉及“tidal”、 “eddies”、 “kuroshio”等主题,与“water resources”、“meteorology & atmospheric sciences”等领域相关联,这些主题应归属于“physical oceanography”领域。尽管Web of Science在领域中未单独标注“physical oceanography”,但我们构建的BERTopic模型成功识别其为一个独立区域。

 

image.png

图2. 各国在太平洋a)、大西洋b)、北冰洋c)和印度洋d)四大海域主题上发表的文献比例。

海洋学研究的地理分布展现了各国家在不同海域的研究重点和国际合作的潜力。根据322,764篇带有作者国家信息的文献分析(图2),太平洋领域研究由中国和美国主导;大西洋研究以美国为主,加拿大、英国、法国等沿岸发达国家的贡献也较为显著;瑞典、挪威、芬兰等北欧国家更关注于北冰洋研究,而南半球国家的参与度较低;印度洋研究则以中国为主,美国和印度次之。整体来看,各国研究资源多聚焦于周边海域,而中美等科研强国对远洋区域也展现了浓厚兴趣。这种格局为国际合作提供了机遇:发达国家与目标海域沿岸的国家进行合作获取研究成果,发展中国家则通过合作弥补研究空白,实现互利共赢。

 

image.png

图3. 前十大主题的文献对应子领域的比例及其主题熵。

研究利用信息熵的概念,构建了衡量主题跨领域特征的主题熵指标。图3展示了前十大主题在跨学科领域中的表现。结果表明,“evapotranspiration”(et)、“sediment”和“drought”跨领域特征较强。相比之下,“marine & freshwater biology”领域的主题较为专一,如“spawning”、“fish”和“zooplankton”等主题主要局限于该领域。总体上,跨学科特征在“meteorology & atmospheric sciences”、“geology”和“water resources”领域较为显著。

 

从三十年的发展趋势来看,海洋学研究从集中于经济发达国家逐渐转向全球分布,中国和印度、巴西等新兴经济体的研究贡献显著增加。研究主题也发生了变化,早期集中在海洋生物学,后期的水资源和气候变化的主题增长较快,特别是与干旱、洪水和沿海地区相关的主题增长迅速,反映了对气候变化引发极端事件及沿海地区面临压力的关注。近年来,气候变化与海洋学研究的结合日益紧密,地质学、气象学和水资源等跨学科领域的关注度显著上升。

 

本研究得到国家自然科学基金(42276201,42341201)、国家重点研发计划(2023YFF0805004)和上海交通大学深蓝计划项目(SL2022PT204)的资助。

 

论文链接:https://www.nature.com/articles/s44183-024-00097-z

供稿:周韫韬课题组


回到顶部
Baidu
map