2020 全球新冠肺炎之下,了不起的 AI 人
本篇文章3190字,读完约8分钟
艾源创评论道:目前,新型冠状病毒(covid-19)仍在世界范围内传播。在这种情况下,除了在前线作战的医务人员,从个人到国家,每个人都在努力做好防疫工作。
计算机科学家和机器学习研究人员也在以他们自己的方式处理这种疾病,包括编译数据集和构建算法来从中学习。虽然目前大多数人不能参与R&D进程,但我们可以见证并赞扬他们的成就。
为此,雷对元创的一些数据集和算法论文进行了评论和整理,并对所有为疫情做出贡献的人表示了敬意。
图片来源:Sompong Rattanakunchon/Getty Images
Covid-19病例数据集
目前,一个covid-19案例数据集已经在谷歌的数据科学竞赛平台kaggle上发布,并将每天更新。
数据包括患者的年龄、位置、何时开始出现症状、何时暴露、何时进入医院等。是根据实际情况输入的,是可靠的。据统计,近300人在自己的分析中使用了这些数据。
数据集地址:
www . kaggle/sudalairajkumar/new-corona-virus-2019-dataset
Covid-chestxray数据集
蒙特利尔大学的一名研究人员收集并公布了一个数据库,其中包含数十份ct扫描和胸部x光图像。这些图像取自已发表的covid-19疾病研究数据。
数据集地址:
github/IEEE 8023/covid-chest x ray-dataset
全球感染分布图
约翰·霍普金斯大学建立了一个令人印象深刻的“仪表板”,它详细显示了全球covid-19病例数据。这些数据将定期更新,以便每个人都能对疾病的传播及其死亡率有一个全球视角。
目前,该项目在github上有开放源代码,可以自己复制和修改。
开放源代码地址:
github/cssegisanddata/covid-19
COVID-19中肺炎的大型开放数据集
艾伦的人工智能研究所(ai)、czi、乔治敦大学的cset、微软、国立卫生研究院的nlm和ostp今天联合发布了COVID-19肺炎的开放研究数据集。
据报道,该数据集包含超过29,000篇与肺炎、新型冠状病毒和冠状病毒组相关的COVID-19学术文献,其中超过13,000篇为完整文献。
该数据集是最广泛的机器可读冠状病毒文献集合,可用于数据和文本挖掘研究。它将主要用于医学和机器学习等相关领域的研究,以帮助人们更快更好地应对COVID-19中的肺炎疫情。
全球疫情信息实时查询网站:
www.bing/covid
区域资源网站数据集
其他数据集直接来自治疗患者的医院和某些领域的数据资源网站,例如:
数据集“新型冠状病毒感染肺炎病例信息”,由北京政务数据资源网开放,由市卫生委员会提供。(data.beijing.gov/)
山东公共数据开放网在平台首页“疫情防控”栏目下,开放了省卫生委提供的五套数据集。(data.sd.gov/)
到目前为止,covid-19案例研究已经出现了一些算法,以下是一些论文:
基于肺ct的covid-19诊断准确性评价
本文是柯亚医学中心最近的原创性研究成果,也是世界顶级期刊《放射学》首次发表的基于人工智能评估COVID-19诊断准确性的论文。
该方法采用前沿的深度学习技术,开发了一种针对covid-19肺炎的三维检测神经网络COVID-19,能够从肺部ct图像中提取多种图像特征来识别COVID-19肺炎。
最后,在一个独立的试验组中验证了covnet 对COVID-19肺炎的敏感性和特异性分别高达89.76%和95.77%,roc曲线下的auc为0.96。同时,验证了该模型识别社区获得性肺炎的准确性(敏感性86.85%,特异性92.28%,auc 0.95)。
论文地址:
doi.org/10.1148/radiol.2020200905
通过深度学习定量研究ct图像中covid-19肺部感染
上海的研究人员设计了一种可以与人工检查结果相匹配的系统,从而将ct图像的分析时间从几个小时减少到大约4分钟。
具体来说,研究人员开发了基于深度学习(dl)的分割系统,并训练vb-net神经网络来分割ct扫描图像中的covid-19感染区域。
在300名covid-19患者的胸部ct扫描中,通过比较自动分割的感染区域和手动描绘的感染区域来评估系统性能。
为了加快数据标注速度,该方法采用人在回路优化的方法对每个案例进行标注,从而大大减少了总的分割时间。
最后,自动分割和人工分割的Dyce相似系数分别为91.6%和10.0%,兴趣点的平均预测误差为0.3%。
纸张地址:
arxiv . org/ABS/2003.04655 v2
异常呼吸模式分类器有助于大规模筛查covid-19
在这项研究中,研究人员寻找一种听觉方法,通过分析人类呼吸频率来筛选covid-19。这项研究不是结论性的,但它是一个新的想法,以更少的入侵方式测试病毒。
根据最新的临床研究,covid-19的呼吸模式不同于流感和普通感冒;感染covid-19的人呼吸暂停,呼吸加快。
用于呼吸模式分类的Bi-at-gru模型
因此,本文提出根据患者的呼吸特征筛选新型冠状病毒。具体来说,研究人员使用深度相机和深度学习来完成这项筛选任务。
然而,基于实际情况中的数据量不足以进行深度模型训练的事实,本文提出了一种新的呼吸模拟模型来弥补训练数据不足的问题。
随后,本文首次利用双向注意机制的gru模型对六种临床上重要的呼吸模式进行了分类。这种方法可以扩展到大规模的应用场景,并补充现有的筛选方法。
纸张地址:
arxiv.org/abs/2002.05534v1
使用深度学习ct图像分析进行自动检测和患者监测的初步结果
非对称胸部ct已被证明是一种有效的检测、量化和跟踪疾病的工具,因此可以开发深度学习算法来帮助分析大量的胸部ct图像。
因此,研究人员开发了基于人工智能的自动ct图像分析工具,并证明它们能够区分冠状病毒患者和非冠状病毒患者。
本文提出的系统具有输入胸部ct图像和标记可疑covid-19病例的功能。此外,对于分类为阳性的病例,系统将输出异常肺标测和测量值。
最后,胸部ct冠状病毒和非冠状病毒的分类结果为0.996 AUC (95%置信区间:0.989-1.00),这是基于中国控制和感染患者数据集的结果。实际应用结果:敏感性和特异性分别为98.2%和92.2%。
目前,这项研究正在向更大的人群扩展,这证明基于人工智能的图像分析在检测冠状病毒、量化和跟踪疾病方面可以获得高精度的结果。
纸张地址:
arxiv.org/abs/2003.05037
三个临床特征预测严重covid-19患者的临界程度
目前,快速、准确、早期地评估疾病的严重程度非常重要。在缺乏某种生物标志物作为标准的情况下,该方法可以快速检测出COVID-19中的高危患者,早期干预并可能降低其死亡率。
在这项研究中,利用最先进的机器学习框架,研究人员选择了三种生物标志物来预测个体患者的存活率:乳酸脱氢酶(ldh)、淋巴细胞和hs-crp(高敏c反应蛋白)。
研究人员开发了一个基于
xboost机器学习的预后模型,并采用了来自中国武汉的近3000名患者的电子健康记录。最后,通过使用患者的最新血液样本,该模型能够以90%以上的准确率预测covid-19重症患者的存活率。使用其他血液样本可以达到90%的预测准确率。
这也表明这三种生物标志物能够准确预测疾病的严重程度,从而大大减轻了监测临床参数的压力和其他相关的医疗负担。
纸张地址:
doi.org/10.1101/2020.02.27.20028027
Xgboost机器学习算法流程图
原始参考:零。媒体/计算机科学家们正在构建算法以应对挑战雷锋的艾源创评论
标题:2020 全球新冠肺炎之下,了不起的 AI 人
地址:http://www.qdgzw.com/kjcy/32953.html
免责声明:京青年创业网是一个专业为创业者提供学习交流的创业资讯媒体,更新的资讯来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,京青年创业网编辑将予以删除。