加速度计生成变量概览

加速度计原始数据cwa格式,需要申请有UKB tier2以上或者student档次才可以正常分析。

适合学员:

  • 1.UKB已生成的衍生变量中没有你所需要的
  • 2.编程基础薄弱,需要一键无脑完成原始数据批量分析的
  • 3.想节约RAP成本的

视频课程地址:

【UKB-RAP加速度原始数据处理进阶课程-1.课程预处理】

【UKB-RAP加速度计原始数据-变量可视化网页2】

【UKB-RAP加速度计原始数据-数据的存储详细介绍3】

【UKB-RAP加速度计原始数据-示例加速度计cwa的数据结构4】

【UKB-RAP加速度计原始数据-分析流程讲解5】

【UKB-RAP加速度计原始数据-分析详细实操6】

【UKB-RAP加速度计原始数据-汇总与结果解读7】

文档地址:https://doc.medicineitlab.com/

购买课程后,可以获得加速度计进阶课程的激活码以及文档权限

注意:每个同学的每个RAP工程的数据都是不同的,eid(个体id)会有区别,这个是UKB防止数据泄露的独特手段

所以,每个同学需要自己运行自己RAP工程内的原始数据分析,是无法共用数据的

需要更多的UKB资讯,可以扫描下面的二维码进群

加入群聊二维码.png

该课程版权由 医工科研团队 所有

所有的课程、代码、分析流程,都由团队内的技术老师 医工科研kim 开发

UKBiobank数据库已生成的加速度计指标

UK Biobank 身体活动测量指标概览

https://biobank.ndph.ox.ac.uk/ukb/label.cgi?id=1008

一、核心指标分类

1. 日常活动模式指标

  • 睡眠相关
    • 日均/工作日/周末睡眠时长(如 40030 睡眠-每天平均小时
  • 久坐行为
    • 日均/工作日/周末久坐时长(如 40031 久坐一天平均小时
  • 活动强度
    • 轻度活动(40032)、中高强度活动(40033)的日均/工作日/周末时长

研究价值
▸ 慢性病风险分析(如久坐与心血管疾病)
▸ 睡眠健康与认知功能关联研究
▸ 工作日与周末活动模式差异对代谢健康的影响


2. 设备原始数据指标

  • 采样质量
    • 采样率统计(均值、标准差、极值,如 90188 平均采样率
  • 环境监测
    • 温度统计(均值、极值,如 90194 最低温度

研究价值
▸ 数据质量控制(采样率异常检测)
▸ 环境温度对活动模式的动态影响分析


3. 研究管理指标

  • 参与状态
    • 邀请接受状态(110005)、邀请发送日期(110006

研究价值
▸ 研究参与者选择偏倚分析
▸ 季节因素对研究参与率的影响


二、指标扩展研究方向

1. 跨时间分析

  • 构建"社会时差"(工作日与周末活动差异)与慢性炎症关联模型

2. 环境交互研究

  • 极端温度暴露下活动模式改变对老年跌倒风险的影响

3. 精准预防

  • 基于活动强度分层的个性化运动处方开发

三、关键数据特征

指标类型 数据量 单位 典型变量示例
时间分配指标 200+ 小时等 40030 睡眠-每天平均小时
设备质量指标 10 Hz / Celsius 90188 平均采样率 (Hz)
研究管理字段 2 110005 邀请接受状态 (0/1)

注:可通过字段链接获取详细定义(示例):
http://biobank.ctsu.ox.ac.uk/crystal/field.cgi?id=40030

官方accelerometer包生成指标

加速度计数据指标总结

https://biobankaccanalysis.readthedocs.io/en/latest/index.html

https://biobankaccanalysis.readthedocs.io/en/latest/datadict.html

https://github.com/OxWearables/biobankAccelerometerAnalysis

一、设备元数据指标

1. 基础信息

指标名称 类型 单位 描述 医学应用场景
file-name string - 加速度计文件名(非公开显示) 数据溯源与文件管理
file-deviceID integer - 设备唯一编号 多中心研究的设备效应控制
file-startTime string - 监测开始时间(ISO8601格式) 昼夜节律对代谢指标的影响研究
file-firstDay integer - 监测起始日(0=周一,6=周日) 长期监测的周周期对齐
totalReads integer 计数 总数据采样点数 数据完整性评估

二、设备校准参数

2. 三维校准指标

参数名称 类型 单位 物理意义 临床影响案例
calibration-xOffset numeric 重力加速度(g) 冠状面加速度偏移 步态对称性分析准确性
calibration-yOffset numeric 重力加速度(g) 矢状面加速度偏移 坐立转换检测可靠性
calibration-zOffset numeric 重力加速度(g) 垂直方向加速度偏移 垂直运动测量精度

三、时间活动分布指标

3. 精细化时段监测

指标命名规则:

<活动类型>-hourOf[Weekday/Weekend]-[小时段]-[统计量]
示例:
<activity>-hourOfWeekday-08-avg = 工作日8:00-8:59平均活动强度

时间维度分布

时间周期 时间粒度 指标数量 单位 研究价值
工作日 每小时 24 时间占比(0-1) 通勤时段行为模式分析
周末 每小时 24 时间占比(0-1) 周末夜间活动健康影响研究

活动强度分类

强度等级 代谢当量(MET) 典型活动 健康关联性
静息状态 1.0-1.5 静坐/躺卧 心血管风险因子
低强度 1.6-2.9 慢走/家务 血糖调控机制
中等强度 3.0-5.9 快走/骑车 心肺功能改善
高强度 ≥6.0 跑步/球类运动 骨密度维持

四、核心研究应用方向

1. 慢性病研究

  • 糖尿病管理:分析餐后1小时活动强度与血糖波动的剂量效应关系
  • 心血管健康:检测久坐时段持续时长与血管内皮功能的关联性

2. 康复医学

  • 术后恢复评估:建立日常活动强度梯度与康复进度的预测模型
  • 神经康复:量化震颤患者的活动模式异常特征

3. 公共卫生

  • 职场健康:识别工作日中高强度活动"黄金时段"(如午间12:00-13:00)
  • 老年医学:构建跌倒风险预测模型(基于夜间活动变异系数)

五、数据使用注意事项

关键环节 质量控制要点 典型问题处理方案
数据采集 设备温度范围(10℃-40℃) 极端温度时段数据标记剔除
预处理 24小时活动占比校验(∑=1±0.05) 数据重新标准化
分析解释 强度分类阈值验证 结合心肺运动试验金标准校准

文档说明:本总结涵盖506个指标的3大核心类别,完整指标清单需结合原始数据字典使用。重力加速度单位换算:1g = 9.8m/s²

GGIR分析日汇总指标

GGIR日级别活动分析指标文档 (GGIR-part5_dictionary_daysummary.csv)

https://github.com/wadpac/GGIR

https://wadpac.github.io/GGIR/articles/GGIRoutput.html#day-level-summary-csv-1

一、核心指标分类体系

1. 时间标识参数

变量ID 英文定义 中文定义 医学研究价值
calendar_date Calendar date 日历日期 长期追踪研究的时序对齐
weekday Day of the week (full name) 星期名称 周周期活动模式分析
daytype WD=weekday, WE=weekend 工作日/周末标识 社会时差效应研究

2. 睡眠分析指标

变量ID 计算逻辑 关键特征 临床应用场景
sleeponset_ts Sleep onset time (hh:mm:ss) 精确到秒级时间戳 睡眠相位延迟综合征诊断
wakeup_ts Wakeup time (hh:mm:ss) 基于加速度数据推算 睡眠效率计算(TST/TIB)
sleepefficiency Total sleep time / Time in bed 百分比形式 失眠症疗效评估

3. 活动强度分块统计

变量ID 算法描述 阈值标准 健康关联性
Nblocks_day_total_VIG 连续剧烈活动区块数(≥10分钟/区块) 加速度≥400mg 心血管适应性评估
boutdur.mvpa 中高强度活动持续时长 每分钟≥100mg 糖尿病管理效果监测
boutcriter.mvpa 活动区块有效比例阈值 默认80%时段达标 运动处方依从性分析

4. 数据分段参数

变量ID 设置逻辑 典型配置 分析影响
window_number 数据记录窗口编号 按自然日自动分段 纵向研究时段对齐
start_end_window 分析窗口时间范围 默认00:00-23:59:59 跨日节律研究基础

5. 报告元数据

变量ID 生成规则 质控用途
GGIRversion 分析软件版本标识 方法学可重复性验证
lastDate 最后有效记录日期 数据更新状态监控

WW waking to wake up 代表


GGIR个体汇总指标

GGIR个体级别活动分析指标文档 (GGIR-part5_dictionary_personsummary.csv)

https://github.com/wadpac/GGIR

https://wadpac.github.io/GGIR/articles/GGIRoutput.html#person-level-summary-csv-1

一、核心指标分类体系

1. 数据质量评估

变量ID 英文定义 中文定义 质控标准
Nvaliddays Valid days meeting quality criteria 有效监测天数 ≥4天(含3工作日+1周末)
Nvaliddays_WD Valid weekdays 有效工作日数 ≥3天为研究可用
Nvaliddays_WE Valid weekend days 有效周末天数 ≥1天为研究可用
Ncleaningcodezero Nights with perfect sleep data 无异常睡眠数据天数 占比≥70%为优质数据

2. 睡眠模式分析

变量ID 计算逻辑 临床意义 异常阈值
Ndaysleeper Daysleeper classification count 日间睡眠模式识别 ≥3天提示昼夜节律紊乱
sleepregularity 睡眠-觉醒时间标准差 睡眠规律性评估 >1.5小时需干预

3. 活动分块统计

活动强度分型

强度等级 加速度阈值(mg) 分块时长标准 健康关联性
静息 <40 ≥20分钟连续时段 代谢综合征风险因子
轻度 40-99 5-10分钟连续时段 基础代谢维持
中等 100-399 ≥10分钟连续时段 心肺功能改善
剧烈 ≥400 ≥5分钟连续时段 骨密度提升

分块统计指标

变量ID 统计逻辑 研究应用场景
Nblocks_day_IN_bts_20_30_wei 20-30分钟静息区块加权计数 久坐行为累积效应分析
Nblocks_day_LIG_bts_10_wei 10分钟轻度活动区块加权计数 日常活动模式评估
Nblocks_day_total_VIG_wei 剧烈活动区块总频次加权值 运动处方效果监测

4. 时间加权参数

变量ID 计算模型 医学解释
lastHour_weighted 末小时活动量时间加权 昼夜节律末端效应评估
wake_interval_avg 清醒时段活动强度区间均值 日间
GGIR分析概要指标

GGIR加速度计数据分析指标文档 (GGIR-part2_summary.csv)

https://github.com/wadpac/GGIR

https://wadpac.github.io/GGIR/articles/GGIRoutput.html#person-level-summary-csv

一、核心指标分类体系

1. 设备元数据

指标ID 英文定义 中文定义 医学研究价值
device_sn Device serial number 设备序列号 多中心研究设备追踪
bodylocation Body location from header 设备佩戴位置 活动数据空间定位参考
filename Name of the data file 数据文件名 原始数据溯源管理
device Accelerometer brand 加速度计品牌 设备间测量差异分析

2. 时间参数

指标ID 英文定义 中文定义 关键特征
start_time Recording start timestamp 记录开始时间 ISO8601格式(YYYY-MM-DD HH:MM:SS)
startday Day of week when recording started 记录起始星期 0=周一, 6=周日编码体系
samplefreq Sample frequency 采样频率 典型范围30-100Hz
meas_dur_dys Measurement duration in days 测量持续天数 长期监测数据完整性评估

3. 数据质量评估

指标ID 计算逻辑 质控标准 异常处理建议
clipping_score 15分钟窗口内单轴加速度饱和时间占比 <0.05为优质数据 剔除得分>0.2的时段
complete_24hcycle 完整昼夜周期覆盖率 ≥0.8为有效数据 补充睡眠日记辅助判断

4. 活动分析指标

指标ID 算法描述 医学应用场景
WWE_MVPA_E5S_B10M80%_T100_ENMO_0-24hr 基于5秒时段的中高强度活动时间加权计算 心血管疾病风险预测
L5M5VALUE 最不活跃5小时与最活跃5小时活动量比值 代谢综合征筛查
iglevels_0-24hr 24小时活动强度梯度分析 糖尿病管理方案优化

5. 数据处理参数

参数ID 设置逻辑 典型配置 影响范围
data_masking_strategy 数据排除策略(1=时间截断,3=全天排除) 策略1用于队列研究 影响最终样本量10-15%
ndayswindow 有效测量天数窗口 默认7天 决定最小佩戴时长要求
winhr 分析时间窗长度(小时) 常用24小时 影响昼夜节律分析精度

6. 报告输出信息

指标ID 生成逻辑 文档管理建议
pdffilenumb 报告文件编号 按研究中心-日期归档
pdfpagecount 报告总页数 质量控制复核标记
GGIR_version 分析软件版本号 方法学部分必须标注

WW与MM时间窗口分析对比文档

一、核心概念定义

1. WW时间窗口(Waking to Waking Up)

  • 定义:基于个体清醒状态转换的时间段分析
  • 时间范围:从一次清醒事件开始到下一次完全清醒事件结束
  • 典型场景:研究个体自然作息周期中的活动模式

2. MM时间窗口(Midnight to Midnight)

  • 定义:基于日历时间的固定时间段分析
  • 时间范围:00:00至次日00:00的完整24小时周期
  • 典型场景:标准化日周期行为模式研究

二、核心对比分析

对比维度 WW时间窗口 MM时间窗口
时间界定依据 生物节律事件(清醒状态转换) 日历时间(固定午夜边界)
时段长度 可变(取决于个体作息) 固定24小时
数据连续性 可能跨日历日 严格限定在单日历日内
适用人群 作息不规律人群(如轮班工作者) 作息规律人群
分析重点 自然作息周期内的活动模式 标准化日周期行为特征

三、详细异同解析

(一)相同点

  1. 分析目标一致

    • 均用于揭示活动模式与健康指标的关联
    • 支持计算日均活动量、强度分布等核心指标
  2. 数据基础相同

    • 依赖加速度计等可穿戴设备的连续监测数据
    • 需要预处理步骤(如无效数据过滤、非佩戴时段识别)
  3. 应用领域重叠

    • 睡眠健康研究
    • 慢性病管理(如糖尿病、心血管疾病)
    • 行为流行病学调查

(二)不同点

标签 描述
WW 生物时间驱动
MM 日历时间驱动