疾患の変異を読み解き、実験を設計する
脂質結合能を持つタンパク質には、神経疾患、免疫疾患、内分泌疾患、代謝疾患、網膜変性、難聴、がんなどに関わるものが数多く存在します。しかし、患者で見つかった遺伝子変異が、脂質との結合、脂質依存的な構造変化、膜局在、シグナル伝達をどのように変えるのかは、多くの場合まだ十分に調べられていません。
私たちは、こうした疾患関連変異を、「脂質結合異常」という未検証の視点から読み解くことを目指しています。すなわち、疾患変異がタンパク質の立体構造や脂質結合ドメイン、脂質との接触残基をどのように変化させるのかをAIで予測し、実験で検証可能な仮説へと落とし込みます。
本手法では、野生型タンパク質と変異型タンパク質について、どの脂質がどの領域に結合しやすいか、どのアミノ酸が脂質認識に関わるか、変異によって結合ドメインや接触残基がどう変化するかを、構造のレベルで検討します。これにより、病態メカニズムについて実験で検証可能な仮説を立てることができます。疾患変異による異常が脂質結合や脂質シグナルの失調に基づくと分かれば、脂質代謝への介入を通じた新しい治療戦略にもつながる可能性があります。
構造予測AIの登場と、その限界
AlphaFold3などの構造予測AIにより、タンパク質だけでなく、核酸、低分子、脂質を含む複合体構造の候補を予測できるようになりました。脂質–タンパク質相互作用についても、脂質がどのポケットに配置されるか、どのアミノ酸と近接するかを検討できる可能性があります。
一方で、構造予測AIの出力は、実験的な証明そのものではありません。予測には毎回揺らぎがあり、また実際には結合しない組み合わせでも、複合体らしい構造が出力される場合があります。したがって、1回の予測結果をそのまま正解として扱うことはできません。
実験科学の作法を計算に持ち込む
そこで当研究室では、実験生化学で当たり前に用いられる反復・統計・対照という考え方を、構造予測の解析に取り入れています。同じタンパク質–脂質の組み合わせについて数千回の反復予測を行い、得られた構造候補をアンサンブルとして扱います。
各構造について、脂質とアミノ酸残基の距離、接触頻度、結合ドメインの再現性、対照脂質との差を解析します。これにより、偶然に得られた配置ではなく、繰り返し現れる脂質結合様式や、特定の脂質に特徴的な相互作用候補を抽出します。
深層学習が提示する多数の構造候補を、実験科学の考え方で評価し、脂質結合に関わるアミノ酸、結合ドメイン、変異体設計の候補を絞り込む。
生成AIとスーパーコンピュータの活用
多数の予測構造から、原子間距離、接触頻度、結合ドメインの位置、変異による構造変化などを抽出するには、目的に応じた解析プログラムが必要です。当研究室では、こうしたPythonスクリプトの作成・修正や、解析手順の整理に生成AIを活用しています。解析したい内容を言葉で明確にし、コードの下書き、エラー修正、処理手順の改善をAIに支援させることで、プログラミングを専門としないウェット研究者や学生でも、自分の研究目的に沿った解析を組み立てやすくなります。
さらに、生成AIを単なるコード作成補助にとどめず、多数の予測結果を整理し、どの脂質、どのアミノ酸残基、どの変異体、どの実験系を優先して検証すべきかを考えるための支援技術として活用します。大規模な構造予測や分子動力学シミュレーションは、学内のスーパーコンピュータTSUBAME4.0上で実行し、得られた数値データはPython、R、構造表示ソフトを用いて集計・可視化します。