——mj Condon(导师:Esmaeil Bahalkeh)

摘要

在2023年的夏天, I participated in the Summer 本科研究 Fellowship (SURF) program through the Hamel Center for 本科研究 at the 澳门葡京网赌游戏. Conducting undergraduate research through the Hamel Center provided me with the unique opportunity to advance my understanding of data analytics beyond what had been introduced in my courses. 我主修分析经济学,辅修统计学, 通过对Python等开源编程语言的介绍,我对数据分析及其应用有了基本的了解, RStudio, 统计软件JMP. My coursework allowed me to demonstrate that I have the practical skills and potential to learn varying coding and computational platforms in preparation for a career as a data analyst. 然而, conducting undergraduate research allowed me to leverage a real-world application of data analytics while enabling my exploration of an industry I am interested in.

Following my completion of the course 健康 Economics (ECON620) I was inspired to continue exploring how my love for economics may be employed to help others. 在我作为女童子军的12年里,我一直在养老院做志愿者, I hoped to pay tribute to all the wonderful friends I made during that time by using healthcare analytics to find ways to improve quality of care for the approximately 5,807名新罕布什尔州居民在熟练的护理机构. My research investigated the seventy-three skilled nursing facilities in New Hampshire to identify whether a relationship exists between ownership type and quality of care.

熟练护理机构的居民是一个独特的弱势群体,他们的整体健康状况预计会有所下降, 因为经常, 恶化的卫生措施是导致他们进入这些设施的原因. 由于预期的健康状况下降, 研究人员必须仔细工作,以准确地确定可接受的护理措施的质量, 经常参考州和联邦的指导方针. 我研究的目的是调查经济指标和护理质量之间是否存在关系, 目的是将这个行业在新罕布什尔州的现状进行背景化和形象化. 确定所有权类型等经济指标, 人力资源指标, 乡村性指标为研究人员提供了更好地确定需要制定政策以提高熟练护理机构护理质量的能力.

理解数据

养老院有不同类型的所有权:营利性,非营利性或政府所有. 我无法走访新罕布什尔州所有的73家专业护理机构,调查每家机构的护理水平, 因此我依赖于公开的医疗质量指标. Publicly available quality of care measures allow prospective residents and those related to current residents to monitor the average level of care provided in an individual skilled nursing facility. 除此之外, 护理质量指标使研究人员能够量化和统计地描述个别熟练护理机构内护理的差异. 这些指标包括再住院率等变量, 流动性改善, 医院门诊急诊的百分比, 和更多的.

为了收集这些数据,我从CMS下载了不同的数据集.政府, 包括提供者信息, 熟练护理机构质量报告项目国家数据, 熟练护理机构最低数据集质量指标, 处罚, 国家级卫生检验数据, 消防安全不足, 医疗保险要求质量措施, 健康缺陷数据, 健康检查日期, 和所有权. 使用RStudio, 我把这些数据集结合起来, 使用他们的共享变量CMS认证号创建一个包含国家数据的大型数据集. 然后我过滤了这个数据集,只包括新罕布什尔州的养老院, 保持研究的范围可管理,以最好地适应项目的十周跨度. 从这一点开始, 我能够专注于该州73家专业护理机构中的每一家. 我给每家专业护理机构增加了农村指标, 1表示在农村地区,0表示相反, 以便更好地了解新罕布什尔州居民在选择专业护理机构时面临的障碍. It was important to include these 田园风光 indicators to investigate whether additional barriers for quality care exist for New Hampshire state residents because of geographic location. 这也使我能够根据地理位置调查营利性和非营利性专业护理机构的分布情况.

创建自己的数据集的机会使我有机会更好地了解进行有效研究的步骤. 我面临着清理和处理我为这项研究创建的数据集的任务. 虽然这在我的课上已经提到过了, 我还没有被指派亲自进行清理过程. Cleaning a dataset means reformatting data to successfully load and manipulate it within a coding platform through fixing incorrectly inputted or formatted values, 确保没有重复的变量, 重构变量的输入方式. An instance of variable reformatting meant changing how measurements of time were recorded or changing the format from hours and minutes to aggregated minutes. 我用均值代替了缺失的值, 并且必须纠正错别字以及重新格式化数据类型以最好地显示数据(例如将变量表示为地理指示器以映射变量)。. 在这个项目的清洗/加工部分, I filtered out facilities that served only short-term rehabilitation patients to focus on the specific population of long-stay residents at a skilled nursing facility. 清理和处理我自己的数据集的机会增加了我对数据分析的理解, 这需要我了解有效数据分析的细致要求.

数据分析

后续数据收集和清理, 我开始了单变量分析——单变量单独分析——比如质量评级, 流动性改善, 再入院治疗的速度, 因跌倒而住院的人数, 以及其他医疗质量的指标.  

在分析这一人群的护理质量时, I compared the quality measures of the seventy-three skilled nursing facilities in New Hampshire to the national and state averages to account for expected levels of declining health measures. Focusing on variance of quality of care from national and state averages allowed me to better understand how each individual skilled nursing facility performed, 考虑到预期的健康下降, 确定所提供的护理水平. 因此, 本研究中的护理质量是使用这些与长期住院患者预期平均值的偏差的组合来计算的, 省略了短期康复患者的数据.

我能够调查收集到的每个变量的属性, 为数据分析中使用的每个变量计算描述性统计. 描述性统计,如平均值, 中位数, 模态可以让我研究每个变量的集中趋势, 表示每个变量分布的计算中值. 计算标准差, 四分位范围, 范围使我能够理解变量的分布并识别潜在的异常值.

通过计算这些描述性统计数据,我确定了分析变量分布的条件. 这种分析的条件包括样本量大于30, 正态分布, 变量的独立性, 没有异常值存在. 正态分布是变量集中在均值周围的分布, 分布在两边以相似的速率逐渐变细.

一旦检查了这些变量, 我能够使用Tableau, 数据可视化工具, 创建显示变量分散的模型. 我通过不同的条件过滤数据,比如设施所有权, 田园风光, 以及各种质量测量, 制作图表和图表来代表新罕布什尔州的养老院市场. 绘制了具体的地图来展示非营利和营利性专业护理机构的分布情况, 使用农村指标来了解新罕布什尔州居民的城市如何影响不同所有权模式的熟练护理机构的获取. 我绘制了地图,展示了所有养老院的分布情况, 营利性养老院, 非营利性/政府拥有的设施,位于农村城市的养老院的指标. (见 图1, 图2, 图3.)

除了这些地图, 我计算了各种护理质量指标的分布,如再住院率, 流动性的变化, 以及服用抗抑郁/抗精神病药物的居民比例. 包括在这篇论文是分布的整体护理质量, 这是由医疗保险和医疗补助服务中心在1-5分的范围内衡量的, 按所有权状态过滤. 值得注意的是,营利性养老院的平均质量评级高于非营利/政府拥有的养老院, however the non-profit/政府ernment owned nursing facilities have an outlier (Glencliff Home for the Elderly with a Quality Rating of 1) and a smaller standard deviation indicating a smaller spread of the distribution. 格伦克利夫老人之家是一家政府拥有的护理机构, raising the question of whether non-profit nursing facilities have significantly different quality rating’s than for-profit nursing facilities when 政府ernment owner facilities are excluded.

Condon无花果.4

图4:直方图和箱线图显示了新罕布什尔州营利性养老院的总体质量评级分布. 居中为4.4667,标准差为1.1402. 质量等级从1(质量差)到5(质量高)不等。.

结果与讨论

我的研究显示新罕布什尔州有45家以营利为目的的专业护理机构, 16家非营利性专业护理机构, 还有12家政府拥有的专业护理机构. 在调查了该州28家非营利和政府拥有的专业护理机构后, 我的导师. Esmaeil Bahalkeh和我发现它的平均质量评分为3分.346,标准差为1.03为非营利/政府所有的养老院. 在95%的置信水平下,我们确定护理质量的真实平均值在2之间.96176和3.730778.

这些质量评级是5分之一, 并考虑短期和长期护理质量指标. 这一指标对那些购买熟练护理设施的人至关重要, 因为它综合了积极和消极的指标,如医院的急诊次数, 流动性改善, 瀑布数量, 每名注册护士每名住院医师每天的工作时间.

非营利/政府所有的养老院的分布似乎大致正常. 然而, 两个异常值的低护理质量熟练护理机构使分布略微向左倾斜. 这45家营利性护理机构的平均质量评分为3分.477,标准差为1.151. 在95%的置信水平下,我们确定真实的平均质量评级介于3之间.127和3.827.

营利性护理机构的质量评分分布相对正常,呈右偏. Because the 95% confidence interval for quality rating of nonprofit/政府ernment-owned nursing facilities overlaps with the for-profit nursing facilities’ 95% confidence interval, 我们无法得出结论,在不同的所有权类型之间,平均护理质量有显著差异.

Condon图5

Figure 5: Histogram and boxplot displaying the distribution of overall quality rating for non-profit and 政府ernment-owned nursing homes in the state of New Hampshire. 居中为3.4286,标准差为0.96. 质量等级从1(质量差)到5(质量高)不等。. 请注意,存在一个异常值(政府拥有的Glencliff Home for the Elderly),其质量评级为1分(满分5分).

当将新罕布什尔州的非营利性养老院的质量评级与州平均水平进行比较时, 我们看到了 非营利性和政府所有的设施的平均质量评级略低. 然而,营利性护理机构的平均质量评级略高. This evidence leads us toward the conclusion that the original hypothesis that for-profit nursing facilities have a worse average quality of care is likely false. 通过所有权状态得出澳门葡京网赌游戏护理质量真实状态的明确结论需要进一步研究. 移除异常值等步骤, 关注长期护理质量评级, 调查人员评级将提供进一步的证据,以确定所有权是否显著影响护理质量.

营利性和非营利性设施的平均质量评级都在3分以上, 我们推断新罕布什尔州有相对高质量的护理在熟练的护理设施. 然而. 通过将新罕布什尔州的护理机构与缅因州等附近州的护理机构进行比较,未来的研究还有空间, 佛蒙特州, 和马萨诸塞州, 因为这些州是新罕布什尔州居民的地理选择.

在新罕布什尔州的45家营利性护理机构中, 其中21家属于创世纪医疗公司, 代表46.67%的营利性专业护理机构. To determine if there is a significant difference between the quality of care at for-profit nursing facilities owned by Genesis 健康care and the 24 other for-profit-owned nursing facilities, 分发将需要满足几个条件. 然而, 本研究项目对营利性护理机构的样本量不足以进行比较. 目的:探讨捷恩斯医疗拥有护理设施是否对护理质量有显著影响, 需要进行新的调查, 我建议做一个差异调查, 比较Genesis 健康care购买护理设施前后的护理质量指标. 此时此刻, 我们承认创世纪医疗保健公司拥有很大比例的营利性护理机构. 然而, 捷恩斯只拥有21个设施, 24家公司属于一般营利性企业, 而且这两个样本都没有超过要求的30个, 我们不能正确地调查护理质量的差异.

从冲浪到实习

在我完成SURF之后,我开始寻找2024年夏天的实习机会. 在UNH的职业和专业成功招聘会上与雇主联系时, 我亲眼目睹了SURF对我与雇主建立联系能力的影响. 我不仅展示了我对数据分析的了解, 但我的研究经历为某些行业提供了一个连接点. 而完成SURF让我展示了我的技术数据分析能力, 我还能和养老院的招聘人员交谈, 健康保险公司, 以及医院利用我对医疗分析的介绍. 通过我的课程提供了更一般的数据分析背景, 分析我的专业兴趣领域的独特机会使我从其他充满希望的数据分析师中脱颖而出.  

2023年秋天,我申请了利宝互助保险公司的分析师发展项目. 在面试过程中, 在讨论我的第一手数据分析经验时,我可以引用我的SURF项目, 这个项目也证明了我的职业道德. 最后的面试持续了三个小时. 它包括一个30分钟的概述, 一个小时的行为访谈, 一个小时的案例研究, 还有30分钟的工作见习. 在行为面试中,我的SURF经验证明了我以在线/混合方式工作的能力, 时间管理能力, 还有我对数据分析的热情. 我向面试官证明了我可以独立填补自己的知识空白, 除了向导师学习, 这是分析师发展计划的一个方面. 我获得了实习机会,我期待着在2009年夏天在他们的波士顿办公室以混合安排的方式工作.

我主修分析经济学,辅修统计学, 我的课程为我提供了作为一名成功的数据分析师进入劳动力市场的工具. 然而, it is my completion of undergraduate research experiences such as the Summer 本科研究 Fellowship that proves to recruiters that I am not only capable of doing the job, 但我是最佳人选. Participating in such a high-impact experience has taken my understanding of data analytics from a classroom level to one that can and has been employed in real-world scenarios. The opportunity to work closely with real-world data relating to my greater community provided me the firsthand chance to understand the complexities of working with real-world data, 尤其是与医疗保健分析相关的并发症.

 

首先,我要感谢我的良师益友. Esmaeil Bahalkeh, whose patience in guiding me through understanding healthcare analytics was an invaluable asset in my completion of my Summer 本科研究 Fellowship (SURF). To Mr. Dana Hamel和Patricia M. 弗劳尔斯45年奖学金基金 感谢您为我的SURF助学金提供资金支持. 感谢哈默尔大学本科生研究中心令人难以置信的工作人员,在过去的三年里,我有幸与他们一起工作, Dr. 曾俊华博士. 莫莉·道尔,还有 阿曼达·莱热、 感谢您不仅给了我扩展研究旅程的机会,也感谢您在整个过程中给予我的同情和耐心. 感谢我以前在哈默尔中心的研究经验和学徒计划的导师, 里根·鲍曼教授, 谢谢你让我认识并培养了对卫生经济学的热爱. 我非常感激我有足够的机会在本科阶段进行研究, 从这些经历中产生了对探究和学习更深层次的热爱. 最后,我想感谢我的父母,感谢他们在我探索研究领域的过程中一直给予我的支持.

 

作者和导师简介

乔丹康登

原产于懊恼瀑布, 俄亥俄州, Mary " MJ " Condon将于2025年5月毕业,获得分析经济学学士学位, 辅修统计学. 她是保罗澳门葡京网赌游戏, 也是澳门葡京网赌游戏国际荣誉协会的成员. 一门卫生经济学课程启发了MJ进行这个研究项目,这将扩大她对健康分析的理解, 同时也影响了新罕布什尔州更大的社区. 她的暑期本科研究奖学金让她在分析真实数据的复杂性方面获得了第一手经验, 从第一次收集和处理我自己的数据开始, 深入了解调查医疗保健数据时出现的复杂性. MJ喜欢创造自己的研究,并提交给 调查 向其他好奇的学生展示,本科研究是每个学生的,无论学科. She says that “the opportunity to discover something new about a topic and the ability to change systems through research has helped me better understand my own college major and possible careers.MJ希望读研,继续她的经济学领域.

Esmaeil Bahalkeh 是卫生管理和政策系的助理教授吗. 他于2021年开始在澳门葡京网赌游戏任教,专门从事医疗运营管理, 健康分析, 医疗流程, 质量改进. 由于他们在医疗分析和长期护理方面的共同研究兴趣,MJ和Dr. Bahalkeh决定调查新罕布什尔州养老院质量指标的变化. 有趣的是,他发现新罕布什尔州的养老院在质量指标和特征方面差异很大. 他将从不同来源收集养老院数据描述为MJ成功完成的项目中具有挑战性的部分之一. 在与MJ合作的过程中. Bahalkeh说, “这是一次有趣而有益的经历”,他期待着未来有类似的指导机会.

 

CONTACT THE AUTHOR > 

版权所有2023©MJ Codon

类别