月想月乐
智能医疗有很多的发展方向,例如医学影像处理、诊断预测、疾病控制、 健康 管理、康复机器人、语音识别病历电子化等。当前人工智能技术新的发力点中的医学图像在疾病的预测和自动化诊断方面有非常大的意义,本篇即针对医学影像中的病例分析,降噪,分割,检索等领域来介绍一些常用的数据集。
病例分析数据集
ABIDE
发布于2013年,这是一个对自闭症内在大脑结构的大规模评估数据集,包括539名患有ASD和573名正常个体的功能MRI图像。
OASIS
OASIS,全称为Open Access Series of Imaging Studies,已经发布了第3代版本,第一次发布于2007年,是一项旨在使科学界免费提供大脑核磁共振数据集的项目。它有两个数据集可用,下面是第1版的主要内容。
(1) 横截面数据集:年轻,中老年,非痴呆和痴呆老年人的横断面MRI数据。该组由416名年龄在18岁至96岁的受试者组成的横截面数据库组成。对于每位受试者,单独获得3或4个单独的T1加权MRI扫描包括扫描会话。受试者都是右撇子,包括男性和女性。100名60岁以上的受试者已经临床诊断为轻度至中度阿尔茨海默病。
(2) 纵向集数据集:非痴呆和痴呆老年人的纵向磁共振成像数据。该集合包括150名年龄在60至96岁的受试者的纵向集合。每位受试者在两次或多次访视中进行扫描,间隔至少一年,总共进行373次成像。对于每个受试者,包括在单次扫描期间获得的3或4次单独的T1加权MRI扫描。受试者都是右撇子,包括男性和女性。在整个研究中,72名受试者被描述为未被证实。包括的受试者中有64人在初次就诊时表现为痴呆症,并在随后的扫描中仍然如此,其中包括51名轻度至中度阿尔茨海默病患者。另外14名受试者在初次就诊时表现为未衰退,随后在随后的访视中表现为痴呆症。
DDSM
发布于2000年,这是一个用于筛选乳腺摄影的数字数据库,是乳腺摄影图像分析研究社区使用的资源。该项目的主要支持来自美国陆军医学研究和装备司令部的乳腺癌研究计划。DDSM项目是由马萨诸塞州综合医院(D. Kopans,R. Moore),南佛罗里达大学(K. Bowyer)和桑迪亚国家实验室(P. Kegelmeyer)共同参与的合作项目。数据库的主要目的是促进计算机算法开发方面的良好研究,以帮助筛选。数据库的次要目的可能包括开发算法以帮助诊断和开发教学或培训辅助工具。该数据库包含约2,500项研究。每项研究包括每个乳房的两幅图像,以及一些相关的患者信息(研究时间,ACR乳房密度评分,异常微妙评级,异常ACR关键字描述)和图像信息(扫描仪,空间分辨率等)。包含可疑区域的图像具有关于可疑区域的位置和类型的像素级“地面真实”信息。
MIAS
MIAS全称为MiniMammographic Database,是乳腺图像数据库。
乳腺MG数据(Breast Mammography)有个专门的database,可以查看很多数据集,链接地址为:
MURA
发布于2018年2月,吴恩达团队开源了 MURA 数据库,MURA 是目前最大的 X 光片数据库之一。该数据库中包含了源自14982项病例的40895张肌肉骨骼X光片。1万多项病例里有9067例正常的上级肌肉骨骼和5915例上肢异常肌肉骨骼的X光片,部位包括肩部、肱骨、手肘、前臂、手腕、手掌和手指。每个病例包含一个或多个图像,均由放射科医师手动标记。全球有超过17亿人都有肌肉骨骼性的疾病,因此训练这个数据集,并基于深度学习检测骨骼疾病,进行自动异常定位,通过组织器官的X光片来确定机体的 健康 状况,进而对患者的病情进行诊断,可以帮助缓解放射科医生的疲劳。
参考2018年论文:MURA: Large Dataset for Abnormality Detection in Musculoskeletal Radiographs.
ChestX-ray14
参考论文:
CheXNet: Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning
ChestX-ray14 是由NIH研究院提供的,其中包含了30,805名患者的112,120个单独标注的14种不同肺部疾病(肺不张、变实、浸润、气胸、水肿、肺气肿、纤维变性、积液、肺炎、胸膜增厚、心脏肥大、结节、肿块和疝气)的正面胸部 X 光片。研究人员对数据采用NLP方法对图像进行标注。利用深度学习的技术早期发现并识别胸透照片中肺炎等疾病对增加患者恢复和生存的最佳机会至关重要。
LIDC-IDRI
LIDC-IDRI数据集是由美国国家癌症研究所(National Cancer Institute)发起收集的,目的是为了研究高危人群早期肺结节检测。该数据集中,共收录了1018个研究实例。对于每个实例中的图像,都由4位经验丰富的胸部放射科医师进行两阶段的诊断标注。该数据集由胸部医学图像文件(如CT、X光片)和对应的诊断结果病变标注组成。
LUNA16
发布于2016年,是肺部肿瘤检测最常用的数据集之一,它包含888个CT图像,1084个肿瘤,图像质量和肿瘤大小的范围比较理想。数据分为10个subsets,subset包含89/88个CT scan。
LUNA16的CT图像取自LIDC/IDRI数据集,选取了三个以上放射科医师意见一致的annotation,并且去掉了小于3mm的肿瘤,所以数据集里不含有小于3mm的肿瘤,便于训练。
NSCLC
发布于2018年,来自斯坦福大学。数据集来自211名受试者的非小细胞肺癌(NSCLC)队列的独特放射基因组数据集。该数据集包括计算机断层扫描(CT),正电子发射断层扫描(PET)/ CT图像。创建该数据集是为了便于发现基因组和医学图像特征之间的基础关系,以及预测医学图像生物标记的开发和评估。
DeepLesion
DeepLesion由美国国立卫生研究院临床中心(NIHCC)的团队开发,是迄今规模最大的多类别、病灶级别标注临床医疗CT图像开放数据集。在该数据库中图像包括多种病变类型,目前包括4427个患者的32,735 张CT图像及病变信息,同时也包括肾脏病变,骨病变,肺结节和淋巴结肿大。DeepLesion多类别病变数据集可以用来开发自动化放射诊断的CADx系统。
ADNI
ANDI涉及到的数据集包括如下几部分Clinical Data(临床数据)、MR Image Data(磁共振成像)、Standardized MRI Data Sets、PET Image Data(正电子发射计算机断层扫描)、Gennetic Data(遗传数据)、Biospecimen Data(生物样本数据)。
医学降噪数据集
BrainWeb数据集
发布于1997年,这是一个仿真数据集,用于医学图像降噪。研究者可以截取不同断层的正常脑部仿真图像,包括T1,T2,PD3种断层,设置断层的厚度,叠加高斯噪声或者医学图像中常见的莱斯噪声,最终会得到181×217大小的噪声图像。
医学分割数据集
DRIVE数据集
发布于2003年,这是一个用于血管分割的数字视网膜图像数据集,它由40张照片组成,其中7张显示出轻度早期糖尿病视网膜病变迹象。
SCR数据集
发布于2000年,胸部X光片的分割,胸部X光片中解剖结构的自动分割对于这些图像中的计算机辅助诊断非常重要。SCR数据库的建立是为了便于比较研究肺野,心脏和锁骨在标准的后胸前X线片上的分割。
本着合作科学进步的精神,我们可以自由共享SCR数据库,并致力于在这些分割任务上维护各种算法结果的公共存储库。在这些页面上,可以在下载数据库和上载结果时找到说明,并且可以检查各种方法的基准结果。
医学图像分析benchmark
在网址提供了时间跨度超过10年的医学图像资料。
Ardiac MRI
ardiac MRI 是心脏病患者心房医疗影像数据,以及其左心室的心内膜和外膜的图像标注。包括33位患者案例,每个受试者的序列由沿着长的20帧和8-15个切片组成,共7980张图像。
NIH
发布于2017年,这是一个胸部X射线数据集,包含30,805个患者,14个疾病图像标签(其中每个图像可以具有多个标签),112,820个正面X射线图像,标签是使用自然语言处理从相关的放射学报告中自动提取。十四种常见的胸部病变包括肺不张,巩固,浸润,气胸,水肿,肺气肿,纤维化,积液,肺炎,胸膜增厚,心脏扩大,结节,肿块和疝。由于许多原因,原始放射学报告(与这些胸部X射线研究相关)并不是公开分享的。所以文本挖掘的疾病标签预计准确度 > 90%,这个数据集适合做半监督的学习。
List of Open Access
在List of Open Access Medical Imaging Datasets网站上可以看到更多的相关方向的数据集。
VISCERAL
VISCERAL 是Visual Concept Extraction Challenge in Radiology的缩写,是放射学中的视觉概念提取挑战赛。他们提供几种不同成像模式(例如CT和MR)的几种解剖结构(例如肾,肺,膀胱等)的放射学数据以及一个云计算实例。
Grand Challenges
提供了医学图像分析领域内所有挑战的概述,下面举的例子是2019年的医学图像方面将要举办的竞赛。
Dream Challenges
这个挑战赛中包括有数字乳腺摄影梦想挑战;ICGC-TCGA DREAM体细胞突变称为RNA挑战(SMC-RNA)等等。
最后提供给对医学影像处理感兴趣的童鞋一个超级赞的github链接如下:
这是Github上哈佛 beamandrew机器学习和医学影像研究者贡献的数据集,包括了医学影像数据、竞赛数据、来自电子 健康 记录的数据、医疗数据、UCI数据集、生物医学文献等。
Agent数码Reaper
肺部肿瘤标志物检验组合
鳞状细胞癌相关抗原(SCC):是肺鳞癌较特异的标志物,肺鳞癌患者血清阳性率为40%-55%,在其他类型的鳞癌中如宫颈癌、皮肤癌等也有较好的表达,而在其他类型的肺癌中阳性率极低,是特异性较好的鳞癌肿瘤标志物。其含量的增高主要取决于肿瘤细胞的内在特性,其次为肿瘤组织的大小。此外,肝肾功能不良时SCC也会升高。
细胞角蛋白19片段(CYFRA21-1):为细胞结构蛋白,主要分布于单、复层上皮细胞内,对不同组织类型的癌细胞表达强度不同,鳞状细胞癌最强,腺癌其次,是非小细胞肺癌最灵敏的肿瘤标志物,对非小细胞肺癌的早期发现、疗效监测和预后观察均有重要价值。
神经特异性烯醇化酶(NSE):是最经典的诊断小细胞肺癌的肿瘤标志物,血清NSE是神经元和神经内分泌细胞所特有的一种酸性蛋白酶,除作为小细胞肺癌的常规标志物外,在神经母细胞瘤、甲状腺髓质癌等疾病中均有不同程度的升高,由于其也存在与红细胞胞浆中,所以容易受溶血等因素的影响。
胃泌素释放肽前体(ProGRP):是一种在血清中可稳定存在的,极其高效的`小细胞肺癌肿瘤标志物,在多种神经内分泌源性肿瘤中含量升高,其中包括小细胞肺癌、类癌、具有神经内分泌特征的未分化大细胞癌。肾功能不良时ProGRP也会升高,但其不受标本溶血影响,可与NSE优势互补,对于小细胞肺癌的诊断具有高度敏感性及特异性,良性疾病及其他恶性肿瘤患者ProGRP的释放量极少。ProGRP是监测治疗效果较好的指标,治疗过程及治疗后定期检测其浓度,有助于判断疗效及预测复发。
糖类抗原19-9(CA19-9)、糖类抗原125(CA125):二者是肺腺癌较为敏感的标志物,由于在血液循环中速度较快,敏感性高,更易于治疗过程中进行疗效的观察,由于二者具有一定的交叉性,联合检测CA19-9与CA125可起到互补作用,提高阳性检出率。
组织多肽抗原(TPS-A):TPS-A是一种广谱肿瘤标志物,没有组织特异性及器官特异性,在多种肿瘤增殖过程中增高,具有较高的敏感性。
癌胚抗原(CEA):CEA是最经典的广谱肿瘤标志物,在各类型肺癌中都可增高,其中肺腺癌增高最明显。
肿瘤标志物在早期诊断、病理分型、疗效观察及预后评价中有不可估量的价值,但在实际临床工作中,没有任何一种标志物会与任何一种疾病“一一对应”。所以单一检测某种标志物容易造成漏诊及误诊,而采用联合检测多种肿瘤标志物,则能改变其局限性,增加检测准确率,可谓“团队作战力量大”。
珠宝理财
症状
临床症状表现
肺部肿瘤的主要临床症状表现为以下几个方面:
1.咳嗽 2.咯血 3.发热 4.胸痛 5.气急或胸腔有积液。
体征
1.锁骨上淋巴结肿大2.喉返神经压迫征:如声带麻痹、音哑 3.上腔静脉压迫综合症:如颈、胸部静脉曲张,紫绀 4.颈交感神经综合症:如患侧眼球凹陷,上眼睑下垂,瞳孔缩小等 5.恶性积液 6.血行性转移。如骨、肝、脑转移。
肺部肿瘤检查
检查方式汇总
一、胸部X线检查:本项检查是发现肺肿瘤的最重要的一种方法。
二、电子计算机体层扫描(CT):CT的优点在于能发现普通X线检查不能显示的解剖结构CT对转移癌的发现率比普通断层高。
三、磁共振(MRI):MRI在肺肿瘤的诊断价值基本与CT相似。
四、痰脱落细胞检查。
五、纤维支气管镜检查(简称纤支镜检)。对明确肿瘤的存在和获取组织供组织学诊断均具有重要的意义。
胸部X线检查
X线检查这是诊断肺肿瘤的一个重要手段。大多数肺肿瘤可以经胸部x线摄片和CT检查获得临床诊断。中心型肺肿瘤早期X线胸片可无异常征象。当癌肿阻塞支气管,排痰不畅,远端肺组织发生感染,受累的肺段或肺叶出现肺炎征象。若支气管管腔被癌肿完全阻塞,可产生相应的肺叶或一侧全肺不张。当癌肿发展到―定大小,可出现肺门阴影,由于肿块阴影常被纵隔组织影所掩盖,需作胸部X线断层摄影和CT检查才能显示清楚。
在断层x线片上可显示突入支气管腔内的肿块阴影,管壁不规则、增厚或管腔狭窄、阻塞。支气管造影可显示管腔边缘残缺或息肉样充盈缺掼,管腔中断或不规则狭窄。肿瘤侵犯邻近的肺组织和转移到肺门及纵隔淋巴结时,可见肺门区肿块,或纵隔阴影增宽,轮廓呈波浪形,肿块形态不规则,边缘不整齐,有时呈分叶状。纵隔转移淋巴结压迫膈神经时,可见膈肌抬高,透视可见膈肌反常运动。气管隆凸下肿大的转移淋巴结,可使气管分叉角度增大,相邻的食管前壁,也可受到压迫。晚期病例还可看到胸膜腔积液或肋骨破坏。
CT检查
电子计算机体层扫描(CT)可显示薄层横断面结构图像,避免病变与正常组织互相重叠,密度分辨率很高,可发现一般X线检查隐藏区(如肺尖、膈上,脊柱旁、心后、纵隔等处)的早期肺肿瘤病变,对中心型肺肿瘤的诊断有重要价值。CT可显示位于纵隔内的肿块阴影、支气管受侵的范围、癌肿的淋巴结转移状况以及对肺血管和纵隔内器官组织侵犯的程度,并可作为制定中心型肺肿瘤的手术或非手术治疗方案的重要依据。
痰脱落细胞检查
痰脱落细胞检查是诊断肺部肿瘤的一个非常重要的手段。以往人们对于肺部肿瘤性疾病的检查,多采用痰液直接涂片法,需制备多张涂片、多次检查,这不仅大大增加了检查人员的工作强度和压力,且因涂片中的背景模糊、有形成分多而复杂,常可掩盖肿瘤细胞并增加识别的难度;加上患者不按要求留取合格的标本,而是非常随便的留取一点口水、唾液等送检,检出的阳性率明显降低,这也相对的使痰液肿瘤细胞的检测受到了极大的限制。
临床诊断
支气管腺瘤
多发生在30~40岁女性。好发于近肺门的大支气管,右下叶支气管多见。肿瘤来源于支气管腺体。一部分向管腔内生长,表面覆盖正常的支气管粘膜;一部分向管腔外肺组织生长,常呈亚铃状。其组织学特点为典型的腺瘤样结构,支气管表面上皮完整,有时可见鳞状上皮化生,支气管局部粘膜内的粘液腺增多,有乳头形成。据其组织学将支气管腺瘤分为二型:①类瘤型,绝大多数支气管腺瘤属此型,与胃肠道类型肿瘤相似。②圆柱型,此型有明显的浸润性生长特点,可侵犯附近的组织和器官,也可呈息肉型垂于支气管管腔内,它可撑大管腔内径但不侵犯外膜。此型 X射线检查可正常,支气管造影或支气管镜检查可发现有半圆形阴影。
支气管平滑肌瘤
起源于支气管平滑肌的良性肿瘤,少见。肿瘤主要向支气管内生长,引起管腔狭窄或阻塞。
支气管软骨瘤
来源于支气管壁和肺内的软骨,呈光滑分叶状或息肉状,突出于管腔内。质硬,其组织学属正常的软骨成分。
支气管脂肪瘤
发生于支气管粘膜下组织,呈息肉样肿块,突于管腔内,少见。
肺和支气管的神经源性肿瘤
分为神经瘤、神经鞘瘤和神经纤维瘤。神经源性肿瘤在胸内多见于后上纵隔,而气管、支气管和肺内很少见。肺内神经源性肿瘤来源于小支气管。它位于气管、支气管管壁,向腔内外生长,腔内部分少,腔外部分大。肿瘤有包膜,表面光滑,呈结节状。此瘤可恶变,切除不彻底时可局部复发。
肺粘液瘤
位于肺脏深部,临床症状不明显,很难发现。组织学结构颇似原始的间皮瘤。多见于皮下组织,腱膜组织,骨、肌肉和泌尿生殖器,发生于肺者极少见。
肺纤维瘤
极少见,中国曾有一例报告。瘤体藏于肺脏深部,多无症状。 X射线检查偶然发现,手术切除后,经病理检查方能确诊。
肺化学感受器瘤
98%发生于颈动脉窦,发生在肺者很少见。中国曾有 2例报告。是由肺间质内细静脉周围存在的化学感受器细胞增生和集结而形成的肿瘤。
肺错构瘤
是器官的正常成分,肺在正常组织胚胎发育过程中,由于排列、增殖或分化的异常,形成的肿瘤样畸形。其发生率占肺原发肿瘤的 ,在肺良性肿瘤中属最常见。男女发病无明显差异。但多发性错构瘤女性多见,常伴有子宫肌瘤。
肺畸胎瘤
多发生于前上纵隔,原发于肺者罕见。肺内畸胎瘤可能系迷走神经的胚胎沿组织支气管下行为肺胚基包绕而形成的肿瘤,与错构瘤同属发育性肿瘤。肿瘤可位于肺实质或支气管腔内,多为圆形实质性或囊性肿物,大小不等。位于支气管内的则形状小,似息肉状,表面光滑。
肺乳头状瘤
多发生于喉、气管和支气管壁,可为多发。有人认为肺乳头状瘤系原发于喉或气管向下蔓延而形成的肺内继发性肿瘤。
上述支气管和肺部良性肿瘤在临床上很罕见。多数无临床症状,一般在肺部检查或行支气管镜检时偶然发现。但若瘤体较大,则可部分或完全阻塞支气管,造成呼吸困难、肺不张或肺部感染。病人可出现咳嗽、咯痰、咯血等。
良性肿瘤一旦发现应手术切除,一般预后良好。部分良性肿瘤可有恶变,并有浸润性增长,故手术时应切除彻底,力求根治。
是知网么?确定,还是淘宝上找的,如果是淘宝上的可能有问题很正常,最好找真的,这年头假的太多,呵呵,维普,万方淘宝也很多假的。
基因检测对早期的肿瘤,有所改变,如果早期的肿瘤基因检测OK的话,就可以不用化疗,用其他的方法治疗
第一、论文查重主要检查论文摘要、关键字、正文、引用等内容,而公式、图表等论文中的非文字内容,大部分论文查重系统都无法查重,因为系统没有开发这种不能进行比对的技术
我的也是这个题目 还没开始做呢 主要是对算法的介绍与比较,然后用其中某两种算法进行编程用软件处理出结果 在对结果进行分析 大概流程就是这样
1、Cancer research(癌症研究)2、Journal of clinical oncology : official journal of the