Return to site

Kaggle 盐识别挑战赛,羽医甘蓝斩获全球Top 0.5%

近日,全球最大机器学习竞赛社区Kaggle组织的盐识别挑战赛落下帷幕。本次比赛高手林立,参赛人员来自新加坡国立大学、哥伦比亚大学、阿尔伯塔大学、波恩大学、北京大学、南开大学、华中科技大学、俄罗斯联邦储蓄银行AI实验室、英伟达、携程、美团、同花顺等知名高校、科研院所和科技公司。经过三个多月的角逐,羽医甘蓝组建的“Less is More”战队凭借出色的图像分割技术,取得全球Top 0.5%(17/3291),国内第四的好成绩

大赛背景

地球上有大量石油和天然气聚集的地区,其地表下面往往也富含盐沉积物。遗憾的是,确定大型盐沉积物的确切位置是非常困难的。目前采用人工分割盐层比较主观且不准确,这将给石油和天然气公司的钻探者带来潜在危险。为生成最精确的地震图像和3D渲染,世界领先的地球科学数据公司TGS委托Kaggle发布全球召集令,寻求能自动准确识别地下目标是否为盐的精确算法。

此次大赛所用数据为随机选取的不同地下位置的地震图像。训练集为101 x 101像素地震图像和对应的标示出盐体的mask图像。此外还提供每张图像成像位置的深度。盐是无定形岩石,没有太多的内部结构,比赛图片缺乏典型的形态特征,识别难度大幅提高。此次羽医甘蓝(DeepCare)在比赛中名列前茅,充分证明了羽医甘蓝团队在不规则图像分割和识别方面的技术优势。

训练图像示例

图像识别是 AI 赋能医疗的重要一环,但并非所有的医疗图像都具有明显的形态特征。以常见口腔疾病根尖周炎为例,其病灶大小不一,形态不规则,边界不清,给识别带来了极大难度。而大赛所用图像为灰度图像,形态特征不明显,与医学影像十分相似。在本次比赛中,团队成员分割模型的结构采用U-Net形式,encoder部分采用在大型自然图像数据集ImageNet上预训练好的SENet-154结构,decoder部分采用FPN结构以及multi-loss(分割loss+分类loss) 结构, 来应对图像中盐层面积大小及尺度不一的特点(0%~100%),最终本方案总体在18000张测试图像上获得了0.890的测试分数(第一名0.896)。大赛采用的AI技术未来可进一步用于医学影像识别,以大幅提高识别效率和准确率。

根据《促进新一代人工智能产业发展三年行动计划(2018-2020)》,到 2020 年,国内先进的多模态医学影像辅助诊断系统对以上典型疾病的检出率超过 95%,假阴性率低于 1%,假阳性率低于 5%。未来,羽医甘蓝(DeepCare)将紧跟政策方向,强化技术优势,在病理、口腔和骨髓图像识别等领域继续高歌前行,尽早实现三年行动计划的“小目标”。

All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OK