SIIM-ACR Pneumothorax Segmentation 气胸x光识别比赛数据处理

  • train-rle包含12955份dicom文件(站立位胸片),有气胸:无气胸 = 3577:9378
  • ImageId 这一列比较好理解,是训练数据的 id,对应的是 dcm 文件的文件名,也是DCM文件内的SOPInstanceUID,这个联系线索很重要。
  • EncodedPixels 实际存放的就是 mask 的像素数据,这些像素数据是以run-length-encoded (RLE)编码存放的。

接下来,我们需要定义一个函数来将 RLE 编码的数据还原成 mask 图片数据。这部分官方已经提供了一个函数,给我们直接使用,如下:

2.2 导入 DCM 文件

接下来我们将DCM读入并存储到字典中,方便以后查看跟使用。我们还将之前读入的 mask 数据也合并到相应的 ImageId 的字典中。

在训练数据中,如果胸片没有被 mask 标记,表示这个病例他并不患有气胸。通过 EncodedPixels 中的数据,将是否是气胸的患者记录到 has_pneumothorax 这一字段中。-1 即为无气胸,也无标记信息。

在后续对标注信息操作的时候,也记得对标记为-1对数据跳过,否则会 错提示。

查看下读取dcm的代码,是否正常打印,代码如下:

打印头部5行如下:

展示的图像如下:

SIIM-ACR Pneumothorax Segmentation 气胸x光识别比赛数据处理可以看到dcm获取的影像文件可以直接被展示了,并且病人相关信息和是否是气胸,也获取到了。后面我们就开始对标注信息进一步处理,展示出来。

3.2 mask可视化

我们在看下 mask 图像在相对应的病例中的位置:

我们分两组来显示:

  • 第一组我们将原始胸片图像中用红色的框框出 mask 的最小包围盒. 然后将mask 数据部分用不同的颜色区分
  • 第二组我们直接显示原始图像

两者形成对比,便于查看我们标注的气胸位置在哪里。(注视部分包含了3.1的内容)

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年11月22日
下一篇 2021年11月22日

相关推荐