< >

研究称谷歌的 Gemini 比人类更好的健康教练

发表日期：2024-6-14 作者来源：派谷网络浏览次数：

谷歌的 Gemini 模型诞生仅六个月，已经在安全、编码、调试等领域展现出令人瞩目的能力，当然，它也表现出了严重的局限性。不过，这个大型语言模型（LLM）在睡眠和健身建议方面胜过人类。

谷歌的研究人员推出了个人健康大语言模型（PH-LLM），这是经过精细调整的 Gemini 版本，可以理解和推理来自可穿戴设备(如智能手表和心率监测器)的时间序列个人健康数据。在他们的实验中，该模型对问题的回答和预测明显优于在健康和健身领域拥有多年经验的专家。

可穿戴技术可以帮助人们监测他们的健康状况，并在最理想的情况下进行有意义的改变。这些设备提供了一个 “丰富且长期的数据来源”，可以从运动和饮食日志、心情日记，甚至有时甚至包括社交媒体活动等输入中 “被动和持续地获取”。然而，它们捕获的关于睡眠、体力活动、心脏代谢健康和压力的数据很少被纳入 “零散性的” 临床环境中。研究人员推测，这很可能是因为数据被捕获时缺乏上下文，并且需要大量计算来存储和分析。此外，这些数据的解释可能也颇具难度。

然而，谷歌的研究人员在训练 PH-LLM 模型以提供建议、回答专业考试问题以及预测自我报告的睡眠干扰和睡眠障碍结果方面取得了突破。该模型被给予多项选择题，研究人员还使用了 “思维链”（模仿人类推理）和 “零 - shot” 方法(识别之前未遇到的对象和概念)。

令人印象深刻的是，PH-LLM 在睡眠考试中取得了79% 的成绩，在健身考试中取得了88% 的成绩，这两项成绩均超过了一个样本人类专家群体的平均成绩，包括五名专业运动训练师(平均经验13.8年)和五名睡眠医学专家(平均经验25年)。人类专家在健身和睡眠方面的平均成绩分别为71% 和76%。

研究人员指出:“虽然在个人健康领域还需要进一步的开发和评估工作，但这些结果证明了 Gemini 模型的广泛知识基础和能力。”

为了实现这些结果，研究人员首先创建和整理了三个数据集，用于测试来自可穿戴设备的个性化见解和建议、专业领域知识以及对自我报告的睡眠质量的预测。他们与领域专家合作，创建了857个案例研究，代表了睡眠和健身领域的真实场景。睡眠场景使用个体指标来识别潜在的因素，并提供个性化建议以帮助改善睡眠质量。健身任务使用来自训练、睡眠、健康指标和用户反馈的信息，为某一天的身体活动强度制定建议。

两类案例研究都包含了可穿戴传感器数据，其中包括了睡眠数据长达29天，健身数据长达30天以上，以及人口统计信息（年龄和性别）和专家分析。

尽管研究人员注意到 PH-LLM 只是一个开始，像任何新兴技术一样，它还有一些问题需要解决。例如，模型生成的回答并不总是一致的，在案例研究中存在 “显著差异” 的虚构，并且 LLM 有时在回答上显得保守或谨慎。在健身案例研究中，该模型对过度训练非常敏感，而在一个案例中，人类专家注意到它未能确定睡眠不足可能导致伤害的潜在原因。此外，案例研究广泛涵盖了各种人口统计学数据和相对活跃的个体，因此可能并不完全代表人群，也无法解决更广泛的睡眠和健身问题。

本文章系本站编辑转载，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容！

返回列表

研究称谷歌的 Gemini 比人类更好的健康教练

相关网站设计案例

行业动态

网站策划

网站制作

网站维护

网站推广

网站运营

网站安全

网站优化

网络营销

本站动态