タイトル:2時点のメンタルヘルスデータに対するGMM分析
必要なパッケージ:
library(mclust) # GMM分析用
library(tidyverse) # データ処理用
library(ggplot2) # 可視化用 library(gridExtra) # プロットレイアウト用
library(svglite) # SVG出力用 データセット:
データセット:"~/Dropbox (個人用)/R studio/Analysis_SMAP2/SMAP2_Analysis_shared/dataset/imputed/GMM/GMM.csv"
- データ構造
- 測定時点:2時点(Time 1, Time 2)
- 従属変数:抑うつスコア(dep_s)
- ID:同一患者の識別子
- 設計:反復測定
分析手順 A. データ前処理
- wideフォーマットへの変換
- 欠損値の処理
- 必要に応じてスケール調整
- mclust::Mclust()関数を使用
- 1-5クラスターでのモデル比較
- BICによるモデル選択 C. 視覚化要件(SVG形式)
- クラスターごとの軌跡プロット(ggplot2)
- 95%信頼区間の表示
- 生データの表示(jitter使用、透明度0.3)
- クラスターサイズと特徴の要約プロット D. 統計出力
- モデル適合度(BIC値)
- クラスター特性の要約統計量
- 時点間の変化量と効果量
- クラスター分類の不確実性指標 出力要件:
- すべての出力は英語表記
グラフ仕様:
- Trajectory Plot: Title: "Depression Score Trajectories" X-axis: "Time Point" Y-axis: "Depression Score"
- BIC Plot: Title: "Model Selection Criteria" X-axis: "Number of Clusters" Y-axis: "BIC"
- Cluster Size Plot: Title: "Cluster Sizes" X-axis: "Cluster" Y-axis: "Number of Subjects"
- Effect Size Plot: Title: "Effect Sizes by Cluster" X-axis: "Cluster" Y-axis: "Cohen's d"