数据集名称:AbdoSeg(Abdominal Segmentation)医学影像数据集
数据来源:医院和医疗机构的 CT、MRI 扫描
观测目标:腹部多个器官,如肝脏、肾脏、脾脏、胰腺等
数据内容:
DICOM(数字成像和通信)格式的 CT、MRI 影像数据:腹部区域的三维 CT、 MRI 影像数据
NIfTI格式的 CT、MRI 影像数据:腹部区域的三维CT影像数据
标注数据:由自动标注软件自动标注的多个腹部器官的分割标签,用于训练和评估分割算法
样本数量:数据集中包含约 2400张 CT 扫描样本和约 1300 张 MRI 扫描样本,每个样本包含相应的 DICOM 格式影像数据、NIfTI格式影像数据及其对应的标注数据,共计约 287 G
应用场景:用于开发和评估医学影像分割算法,帮助自动化医疗诊断和治疗计划
数据准备
数据格式转换:确保数据格式(如DICOM、NIfTI等)适合模型输入,并进行必要的格式转换。
数据预处理:进行必要的预处理步骤,如图像归一化、裁剪、增强等,以适应预训练模型的输入要求。
选择预训练模型:选择适合任务的预训练模型;为完成标注,本流程预先训练了一下六种模型:
模型名称 | 模型规模 |
---|---|
nnFormer | 2.24 GB |
nnUNet | 238.1 MB |
Swin-Unetr | 958.8 MB |
Unetr | 1.39 GB |
VNet | 696.9 MB |
CoTr | 639.2 MB |
模型规模表
运行预测
输入数据:将预处理后的图像数据输入到预训练模型中。
执行预测:运行模型,获取预测结果(例如,每个像素的分类结果)。
后处理:对模型输出的预测结果进行后处理,如平滑、形态学操作、区域选择等,以提高标注结果的准确性。
人工审核与修正
初步标注:利用预训练模型的输出结果作为初步标注。
人工审核:由经验丰富的标注专家对模型的初步标注结果进行审核,检查和纠正模型可能的错误。
手动修正:对不准确的标注区域进行手动修正,确保最终标注结果的高质量。
数据存储与管理
保存结果:将最终的标注结果以 NIfTI 格式进行存储。
版本控制:对标注数据进行版本控制,保存不同阶段的标注结果以备查。
数据备份:对标注数据进行备份,确保数据安全和可靠。
模型反馈与优化
性能评估:对预训练模型的标注结果进行评估,计算指标如准确率、召回率、F1分数等。
模型优化:根据评估结果,对模型进行进一步训练和优化,利用修正后的标注数据作为新的训练集。
迭代优化:多次迭代上述步骤,不断提高模型的标注性能。
CT 扫描数据
标签数据
/data_medical/
|-- /dicom/
| |-- CT/
| | |-- 2018.tar
| | |-- 2019.tar
| | |-- ...
| |-- MRI/
| |-- 2015.tar
| |-- 2016.tar
| |-- ...
|
|-- /data/
| |-- CT/
| | |-- 0001.nii.gz
| | |-- 0004.nii.gz
| | |-- ...
| |-- MRI/
| |-- 0500.nii.gz
| |-- 0501.nii.gz
| |-- ...
|
|
|-- /label/
| |-- CT/
| | |-- 0001.nii.gz
| | |-- 0004.nii.gz
| | |-- ...
| |-- MRI/
| |-- 0500.nii.gz
| |-- 0501.nii.gz
| |-- ..