海底的情报

海洋天文台的AI解决方案

在最新的年度全球数据科学挑战中,凯捷在世界各地的同事们被要求帮助挪威的Lofoten-Vesterålen (LoVe)海洋天文台识别其海洋传感设备记录的异常数据。在这里,两个获胜的团队都解释了他们是如何回应这一行动号召的。

来源:图片由海洋研究所和Lofoten-Vesterålen海洋天文台提供

在挪威罗浮敦群岛海岸的水下深处,一个科学传感器阵列正在监听和记录。每天24小时,每周7天,Lofoten-Vesterålen (LoVe)海洋天文台产生一系列的化学、物理和生物读数。

在这些数据中隐藏着座头鲸的歌声,大量洄游的鲱鱼群的振动,以及全球气候变化的线索。只有一个难题:如何从海量数据中发现重要的科学事件。

全球调出

这是凯捷在全球各地的同事通过最新的全球数据科学挑战(GDSC)提出的挑战。在这个一年一度的全公司内部竞争中,数百名员工竞相利用人工智能解决现实世界的挑战。

2020年,参赛者将利用人工智能和机器学习识别单个抹香鲸,目的是监测鲸鱼的迁徙模式,保护它们的自然栖息地。

今年,在参加比赛的673个团队(1200名凯捷的同事)中,有两个团队胜出,分享了最高奖项:一个位于印度,另一个位于英国。

海量的数据

凯捷印度公司(Capgemini India)高级交付经理、印度团队负责人阿努帕姆•萨哈(Anupam Saha)解释了挑战所在。他说:“我们被要求构建一个AI解决方案,能够分析LoVe天文台收集的大量传感器数据,并检测出异常情况,从而指导进一步的研究。”

主要顾问和项目经理戴维•Gilhooley凯捷英国领导的其它获奖的团队,补充说,大量的数据本身提供了一个技术挑战:“这就是问题的症结所在:天文台收集大量的数据显示,海洋被“正常”,而这是异常有趣。”

获得方法

Anupam的团队通过分解数据来解决这个问题。“我们分别处理了每个数据源,设计了一个模型来识别每个集合中的异常值。因此,我们的大部分注意力都集中在数据预处理上,从我们面对的数千个变量中确定最相关的变量。”

英国团队还将谨慎的数据管理列为优先事项。David解释说:“我们必须获取这些多个数据源,并每天对它们进行组织。”。“除了填补缺失的区域,我们还必须规范化数据,以便正确部署机器学习分析。”

来源:图片由海洋研究所和Lofoten-Vesterålen海洋天文台提供

学习新技能

大卫的团队曾在小规模的学术环境中涉足数据处理和机器学习,所以他们把这次比赛看作是在现实世界中提高技能的机会。

他表示:“这是你在工业环境中遇到的那种问题——在一个包含许多变量的庞大数据集中寻找离群值。”“从这个角度来看,这个挑战非常实际。我们很高兴能学习AWS(亚马逊网络服务)的机器学习工具,获得这项技术的经验非常有用。”

让团队合作

来源:图片由海洋研究所和Lofoten-Vesterålen海洋天文台提供

大卫的团队包括Vincent Malmedy, Gabriela Pomery和Andrew Pennington,他们都在布里斯托尔凯捷公司的办公室工作。“在大流行造成的所有破坏之后,比赛是将团队重新团结在一起的完美方式,”戴维说。

对阿努帕姆来说,他最自豪的时刻是他的团队向评委的展示。“在此之前,我们排在第五位,”他解释道。“但我们意识到,在天文台使用我们模型的人可能没有数据背景。因此,我们避免了过于理论化的陈述,我认为这有助于我们获得整体第一名。”

环境人工智能

虽然这些技术不应该被视为“灵丹妙药”,但大卫认为,人工智能和机器学习非常适合帮助我们了解气候变化和全球变暖。“人类很难理解这些巨大过程中所涉及的所有渐进步骤。然而,只要有正确的指令,机器学习工具可以帮助解决这些复杂问题。”

他认为,竞争,加上凯捷更广泛的气候承诺,使他的团队更加意识到他们的选择——例如,在通勤方式和使用多少塑料方面。

来源:图片由海洋研究所和Lofoten-Vesterålen海洋天文台提供

准备迎接下一个挑战

两支参赛队伍都获得了一项技术奖,而不是去挪威参观天文台,不幸的是,由于疫情不得不取消。然而,德国的凯捷团队仍在继续与LoVe天文台合作,将获奖的解决方案整合到其平台中,使大量研究人员能够从对海洋生态系统的更广泛理解中受益。

明年,GDSC将专注于寻找河盲症的治疗方法,这将是另一个利用人工智能和机器学习塑造更美好未来的机会。

成功的故事

用人工智能和机器学习加深我们对海洋的了解

LoVe Ocean Observatory与Capgemini合作发起了第四届全球数据科学挑战,并开发了一种基于人工智能的解决方案,可以更快地审查和分析来自水下传感器的大量数据

成蓝色的

海藻的创新和可持续性