Ehrrapy:一种用于分析复杂健康数据的新开源工具

 

Ehrrapy:一种用于分析复杂健康数据的新开源工具



在亥姆霍兹慕尼黑的领导下,科学家们开发了一种易于使用的软件解决方案,专门用于分析复杂的医疗健康数据。名为“ehrapy”的开源软件使研究人员能够构建和系统地检查大型异构数据集。该软件可供全球科学界使用和进一步开发。

主要开发者之一、慕尼黑亥姆霍兹计算生物学研究所和慕尼黑工业大学 (TUM) 的科学家 Lukas Heumos 表示,Ehrapy 旨在填补健康数据分析中的一个关键空白。 “到目前为止,还没有标准化的工具可以系统、高效地分析多样化且复杂的医疗数据。我们通过 ehrapy 改变了这一状况,”Heumos 说。

erapy 背后的团队来自生物医学研究,在分析复杂的科学数据集方面拥有丰富的经验。 Heumos 在 ehrapy 项目开始时指出:“医疗保健部门在数据分析方面面临着与实验室工作类似的挑战。”

该研究发表在《自然医学》杂志上。

探索性方法——无假设分析

Heumos 与许多其他贡献者一起利用他在科学软件开发方面的专业知识创建了用于分析患者数据的解决方案。 Heumos 说:“Ehrapy 可以发现新的模式并产生见解,而不需要根据特定的假设或假设来分析数据。” Heumos 说,这种探索性方法是 ehrapy 的独特之处。

Ehrapy 允许研究人员对大型、异构且复杂的数据集进行排序、分组和分析,而无需任何预先存在的假设。这开辟了新的见解,可以进一步探索。

Heumos 解释说:“探索性方法为健康数据分析带来了新的视角。由于这些数据的复杂性和异质性,这些数据通常无法得到有效的分析。”因此,Ehrrapy 开辟了使健康数据对医学研究和实践更有用的新途径。

长期目标:临床实践中常规使用

Ehrrapy 从一开始就被设计为开源软件。 Heumos 强调说:“从第一天起,向科学界提供该软件对我们来说非常重要。”

该软件在 GitHub(一个在线软件开发平台)上以 Python 包的形式提供,可供世界各地的研究人员使用和进一步开发。

目前,ehrapy 专注于高效快速地分析研究数据集,例如存储在大型健康研究中心的数据集。 “在临床实践中常规使用是一个长期目标,但目前,我们专注于为研究界提供强大的工具,”Heumos 说。

未来,该团队计划为电子健康记录(EHR)提供标准化数据库。这些数据库将能够更好地集成和分析大量医疗数据。此外,这将促进 EHR 地图集的开发,该地图集可以作为参考数据集,用于对新数据集进行背景化和注释。

漫长的旅程

亥姆霍兹计算生物学研究所所长 Fabian Theis 教授表示:“Ehrapy 能够实现跨系统的全面数据分析,这可能是未来医学人工智能系统的关键一步。因此,我希望能够在各个站点相对较快地采用。”慕尼黑和慕尼黑工业大学教授。 “在医学领域建立此类技术是一个漫长的过程,可能需要数十年的时间。我们的目标是弥合生物医学研究与医学实际应用之间的差距。”

泰斯进一步解释说,开发团队正在专注于整体形式的探索性数据分析方法,以更容易地揭示隐藏的联系,并补充说:“我们还试图支持医疗保健领域的学术和商业参与者。”

本视频下方有视频中的链接,感兴趣的可以打开看看
谢谢观看本视频。要是喜欢,请订阅、点赞。谢谢

原文:https://medicalxpress.com/news/2024-09-ehrapy-source-tool-complex-health.html
更多信息:使用 ehrapy 进行探索性电子健康记录分析, Nature Medicine (2024)。 DOI:10.1038/s41591-024-03214-0
Ehrapy on GitHub: https://github.com/theislab/ehrapy
GitHub 上的 Ehrrapy: https://github.com/theislab/ehrapy
期刊信息: 《自然医学》

油管:https://youtu.be/_XziHhGEd2I


留言