機械学習により、全身性エリテマトーデスの転帰を予測する縦断的自己抗体プロファイルのクラスターの同定【Journal Club 20230719】

Machine learning identifies clusters of longitudinal autoantibody profiles predictive of systemic lupus erythematosus disease outcomes
機械学習により、全身性エリテマトーデスの転帰を予測する縦断的自己抗体プロファイルのクラスターの同定
Choi MY, et al. Ann Rheum Dis. 2023;82(7):927-936.

——————————————————-
<サマリー>SLEクラスターを定義するための過去の機械学習(ML)解析は、横断的で、単一の施設で受診した患者を対象とし、比較的少数のSLE関連抗体を評価するもの。SLEにおける縦断的な自己抗体データを研究するML的アプローチの報告はこれまでない。SLE患者の縦断的な4つの自己抗体クラスターは、長期的な疾患活動性、臓器病変、治療必要性、死亡リスクを予測した。

<セッティング>
1999年から2011年にかけて、11ヵ国31施設から

<研究デザインの型>
前向きコホート

<Population、およびその定義>
1997年ACRSLE分類基準を満たし、診断から15ヵ月以内にSLEと確定診断された患者1827人が、SLICCのinception cohortに登録。登録時およびその後毎年、血清、臨床データ、人口統計学的データが収集され、1827人の患者のうち、1432人(78.4%)が4年以上追跡。1432人のうち、登録と、登録から5年以内に2つの追加血清サンプルを提供した805人の患者が組み入れられた。

<主な取得データ>
登録時の人口統計学的データおよび臨床データ
登録から3年後、5年後、10年後の腎炎、SLEDAI-2K、SDI、薬剤使用に関する縦断的データ

<解析方法>
主成分分析(Principal component analysis:PCA)で縦断的なANAと自己抗体のプロファイル(ANAの陽性度と力価を含む71の変数と各自己抗体の結果を、登録、3年目、5年目の3回の来院)を解析。累積説明分散(Cumulative variance explained)主成分の数を選択するために使用され、選択された成分の数のオーバーフィッティングを避けながら、全分散の少なくとも70%~80%を説明することを保証。PCA変換したANAと自己抗体のデータに対してK-meansクラスタリングアルゴリズムを使用。最適なクラスター数はelbow法を用いて選ばれた。クラスタの頑健性を評価するため、PCA変換とK-meansクラスタリングを異なるランダムシードで5回繰り返した。一元配置分散分析検定とα=0.05のBenjamini-Hochberg補正を用いて、クラスターの人口統計学的結果と、登録後10年間の疾患活動性(SLEDAI-2KとAMSの合計)、SDIと臓器特異的領域、SLE治療などの臨床的結果を比較。クラスター間の結果の違い(例えば、クラスター間のLNの頻度や抗dsDNA陽性との関連)を調べるためにカイ二乗一対比較。結果はt-distributed stochastic neighbour embedding(t-SNE)を用いて可視化。発症年齢で調整した多変量ロジスティック回帰を用いて、クラスターが10年目の死亡率を予測するかどうかを決定。生存曲線もKaplan-Meier法を用いて作成。最後に、多変量Cox比例ハザードモデルを用いて、発症年齢を考慮した生存の調整ハザードを推定。

<結果>
表1:805例、診断時年齢:35.2歳(13.6)、88.7%が女性、47.7%が白人以外の人種・民族、登録時の罹病期間は0.58年(0.49)、腎炎の頻度は28.9%、平均SLEDAI-2K総スコアは5.4(S5.3)、登録時の抗マラリア薬70.1%、グルココルチコイド69.6%、免疫抑制剤41.0%。
登録時に最も多かった自己抗体は抗SSA/Ro60(42.5%)、抗Ro52/TRIM21(37.5%)、PS/PT IgG/IgM、抗dsDNA(34.2%)、抗ヒストン(31.3%)、抗U1RNP(28.2%)、抗リボソームP(24.3%)、抗Sm(22.7%)。ほとんどのSLE関連自己抗体の頻度は、登録時と比較して5年目には減少。最も一般的なANAパターンは、AC-4核小斑(39.4%)、AC-1核均一(34.9%)、AC-5核大斑(34.4%)、AC-19細胞質密小斑(13.8%)、AC-20細胞質小斑(12.4%)、AC-10点状核小斑(7.2%)。
登録時と5年目のANAパターンの頻度は、ほとんどのパターンで有意な変化なし。

図1:SLE患者805人を登録から3年目、5年目まで追跡し、4つの自己抗体クラスター群を同定。クラスタラベルに基づく色を用いたt-distributed stochastic neighbour embedding (t-SNE)を用いた潜在空間の可視化。

図2:SLE患者805人の自己抗体プロファイルを、(A)クラスター1、(B)クラスター2、(C)クラスター3、(D)クラスター4の自己抗体の多い順に並べたもの。グラフを見やすくするため、網掛け95%信頼区間を削除。

図3:各クラスターにおける抗核抗体(ANA)価およびそのパターン。

表2:これらのクラスターは、発症年齢、人種/民族、体格指数(BMI)および予測される疾患活動性、臓器病変および10年追跡時の治療経過、死亡率などの臨床的因子と関連。805人の患者のうち、581人について死亡日または10年までの追跡データが入手可能であり、このうち71人が死亡(12.2%)。

[4つのクラスターの特徴]
クラスター1(n=137、抗Smith、抗U1RNP、AC-5(大きな核の斑点模様)の頻度が高く、ANA力価が高い)は、10年目の累積疾患活動性と免疫抑制剤/生物学的製剤の使用量が最も高かった。
クラスター2(n=376、低抗二本鎖DNA(dsDNA)およびANA力価)は、疾患活動性、ループス腎炎の頻度および免疫抑制剤/生物学的製剤の使用頻度が最も低かった。
クラスター3(n=80、5つの抗リン脂質抗体すべての頻度が最も高い)では、痙攣発作と低補体血症の頻度が最も高かった。
クラスター4(n=212)も疾患活動性が高く、抗ヒストン、抗dsDNA、抗リボソームP、抗シェーグレン症候群抗原AまたはRo60、抗シェーグレン症候群抗原BまたはLa、抗Ro52/Tripartite Motif Protein 21、抗増殖細胞核抗原、抗セントロメアBを含む複数の自己抗体反応が特徴的であった。)

[死亡率]
10年目に死亡した患者の割合はクラスター3が最も高く(7.9%)、次いでクラスター1(4.7%)、クラスター4(3.7%)、クラスター2(3.2%)であった。多変量Cox回帰で発症時の年齢で調整した生存のハザードは、クラスター1(調整HR 2.60(95%CI 1.12~6.05)、p=0.03)と3(調整HR 2.87(95%CI 1.22~6.74)、p=0.02)
k-meanクラスタリングに先立ち、データセットの累積説明分散の75%を捉えるように10個の主成分が選ばれた。クラスタの頑健性は高く、上に示した元の4つのクラスタと頑健性評価で生成された新しいクラスタは、高い平均修正ランド指数(ARI)(ARI 0.971、ここで1.0は同一のクラスタリングを表し、0は正反対のクラスタリングを表す)によって示されるように、一致した。

[抗dsDNA抗体とLN]
クラスター間のLNを比較したところ、クラスター2(抗dsDNA陽性頻度が最も低い)のみが、5年目(それぞれp=0.01、p=0.01、p=0.007)と10年目(それぞれp<0.001、p=0.01、p=0.004)において、クラスター1、3、4と比較してLNの頻度が有意に低かった。クラスター1、3、4を比較した場合、LN頻度に差はなかった(データは示さず)。LN頻度と抗dsDNA頻度は、現在の抗dsDNA陽性度(p<0.0001)、平均力価(p=0.0002)、陽性経験(p<0.0001)によって互いに強く関連していた。

<結果の解釈>
4つの異なる血清学的クラスターが、発症年齢、人種/民族、BMIなどの臨床的特徴と関連し、長期的な疾患活動性、臓器病変、治療経過、死亡率を予測した。

<結果のメカニズム>
複数の自己抗体反応性、高い疾患活動性、免疫抑制剤・生物学的製剤の使用を特徴とする2つのハイリスククラスター(1と4)は、SLEがより重症であることが知られている非白人人種・民族に多くみられた。これは、自己抗体産生の増加、免疫複合体形成、炎症、最終的な臓器障害につながる免疫調節異常感受性の違いを、遺伝的要因が支えている可能性を示すさらなる証拠。
高リスクプロファイルクラスターはクラスター3で、APLAが複数上昇し、発作や死亡を含む重篤な転帰。SLICCの先行研究では、ループスアンチコアグラント、抗カルジオリピン、抗β2GP1をベースラインで検査したところ、ループスアンチコアグラントと脳血管障害のリスク上昇との関連(p=0.04)のみが検出された。APLAが5つとも持続的に陽性であった場合、発作や死亡などSLEに関連するいくつかの重篤な転帰の発生を予測できることが示された。

<Limitation>
①本研究は縦断的クラスターを報告した最初の研究であるが、追跡期間がかなり短いため、多くの比較で差が観察されなかった。より長い追跡データを用いた今後の研究が進行中であり、それによって疾病の損傷を調べることができる。
②登録時の平均罹病期間は0.58年であったが、登録時の受診は診断から15ヵ月後であったため、ほとんどの患者(96%以上)は登録時までに少なくとも1つの免疫調節薬に曝露されており、ANAや自己抗体の結果に影響を与える可能性がある。
③ほとんどの施設では、クラスター解析に含まれる20の自己抗体すべてを連続測定することは不可能であり、この結果の臨床応用性にも限界がある。

<どのように臨床に活かす?どのように今後の研究に活かす?>
SLE診断時の抗体プロファイルを意識しどこの属するかを確認する。将来の予後の関連を意識した診療にあたる

<この論文の好ましい点>
SLEという異質性の高い集団を再分類することで今後の分類基準の見直しにつながる。また新薬開発の際の適切な患者選択につながる。個別化医療への基礎ともなる。
診断時コホートの強さが出ている。

<この論文にて理解できなかった点> 
もろもろの機械学習の解析方法

担当:柳井亮

  • このエントリーをはてなブックマークに追加

私たちと一緒に学びませんか?

プログラム・募集要項はこちら


昭和大学病院
〒142-8666 東京都品川区旗の台1-5-8
アクセスマップ
電話:03-3784-8000(代表)

[初 診]月曜~土曜 8:00~11:00
[再 診]月曜~土曜 8:00~11:00(予約のない方)
[休診日] 日曜日、祝日、創立記念日(11月15日)、年末年始