- train-rle包含12955份dicom文件(站立位胸片),有气胸:无气胸 = 3577:9378
- ImageId 这一列比较好理解,是训练数据的 id,对应的是 dcm 文件的文件名,也是DCM文件内的SOPInstanceUID,这个联系线索很重要。
- EncodedPixels 实际存放的就是 mask 的像素数据,这些像素数据是以run-length-encoded (RLE)编码存放的。
接下来,我们需要定义一个函数来将 RLE 编码的数据还原成 mask 图片数据。这部分官方已经提供了一个函数,给我们直接使用,如下:
2.2 导入 DCM 文件
接下来我们将DCM读入并存储到字典中,方便以后查看跟使用。我们还将之前读入的 mask 数据也合并到相应的 ImageId 的字典中。
在训练数据中,如果胸片没有被 mask 标记,表示这个病例他并不患有气胸。通过 EncodedPixels 中的数据,将是否是气胸的患者记录到 has_pneumothorax 这一字段中。-1 即为无气胸,也无标记信息。
在后续对标注信息操作的时候,也记得对标记为-1对数据跳过,否则会 错提示。
查看下读取dcm的代码,是否正常打印,代码如下:
打印头部5行如下:
展示的图像如下:

3.2 mask可视化
我们在看下 mask 图像在相对应的病例中的位置:
我们分两组来显示:
- 第一组我们将原始胸片图像中用红色的框框出 mask 的最小包围盒. 然后将mask 数据部分用不同的颜色区分
- 第二组我们直接显示原始图像
两者形成对比,便于查看我们标注的气胸位置在哪里。(注视部分包含了3.1的内容)
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!