| メール | yokoi.shun.gm@u.tsukuba.ac.jp |
| 名前 | 横井 駿 |
| 所属(教員組織)※学生は指導教員の所属を選択 /Affiliation (Faculty/Organization) | 国際統合睡眠医科学研究機構/International Institute for Integrative Sleep Medicine |
| 専門分野/ Research Field | 生物物理、計算物理、構造生物、創薬化学 |
| 以下の項目から選んでください。 Please select from the options below. | 教員・研究員/ Faculty Member / Researcher |
| 職位 Position | 研究員 |
| 2-1研究へのAIの活用経験と意識(当てはまるものを選んでください)/Experience with and Perceptions of AI Utilization in Research | AIを活用して研究を実施したことがある/I have conducted research using AI. |
| 3-1 AI を活用することで推進したい(推進した)研究テーマを回答ください。(1テーマ40字程度)Please describe the research theme(s) you would like to promote (or have promoted) by utilizing AI. | 動的構造情報を学習した生成AIによるGPCRバイアス型化合物の設計 |
| 3-2 AIを活用することで解決したい(解決した)学術的課題の概要を教えてください(分野外の専門家がわかるように。1テーマ100〜300字程度)Please provide an overview of the academic challenge(s) you would like to address (or have addressed) by utilizing AI. | Gタンパク質共役受容体 (GPCR) は、リガンドごとに異なる動的な構造変化を示し、それがシグナル選択性 (バイアス) を決定すると考えられている。しかし、現在の創薬研究では主に静的構造に基づいた化合物設計が行われており、動的構造変化を考慮した設計手法は確立されていない。本研究では、分子動力学 (MD) シミュレーションによって得られる受容体の時系列構造データを深層学習で解析し、シグナル選択性に重要な動的な特徴量やアロステリックネットワークを抽出する。さらに、それらの動的情報を条件として学習した生成AIを構築することで、特定の構造ダイナミクスを誘導する新規化合物を創出し、GPCRにおけるシグナル選択性制御の原理の解明と創薬応用の両立を目指す。 |
| 3-3 以下内容がわかる場合は具体的に教えてください。1.研究テーマで AI が特に有効または改善ができる部分はどこ(何)でしょうか?2.AIを活用することによって、研究分野にどのようなインパクトをあたえられるでしょうか?If possible, please provide specific details on the following points: 1Which part(s) ... | 1.本研究においてAIが特に有効なのは、MDシミュレーションによって得られる高次元かつ長時間の動的な構造データを、客観的かつ体系的に解析できる点である。GPCRのシグナル選択性は単一の構造状態ではなく、複数の構造状態間の遷移や残基間の協調的な運動によって決定されると考えられるが、従来の解析手法ではその全体像を網羅的に把握することは困難である。AIを用いることで、膨大な時系列データからシグナル選択性に寄与する重要な動的特徴量やアロステリックネットワークを自動的に抽出し、受容体の機能を制御する構造ダイナミクスを定量的に記述することが可能となる。さらに、抽出された動的情報を条件として用いることで、特定の構造変化を誘導する化合物を生成するAIモデルの構築が可能となり、静的構造に基づく従来の化合物設計では実現できなかった機能を意図的に制御する分子設計へと研究を発展させることができると考えている。
2.現在のGPCRの研究や創薬現場では、構造解析技術の進展により多くの受容体の構造が解明されている。しかし、それらの多くは特定条件下で安定化された静的構造にとどまっており、シグナル選択性を決定する動的構造な変化を設計に活かすことが難しい。その結果、バイアス型リガンドの創出は依然として試行錯誤的であり、化合物設計と機能評価の反復に多大な時間とコストを要している。本研究で提案したい動的な構造情報を学習したAIによる解析や生成手法は、こうした現場のボトルネックを根本から改善し、受容体の構造ダイナミクスに基づいて機能を予測・制御するという新しい設計指針を提供する。これにより、シグナル経路選択性を理論的に説明可能な形で扱えるようになり、副作用の低減や作用選択性の向上を目指した合理的創薬が実現する。また、本アプローチはGPCRに限らず、多くの生体分子系に応用可能であると考えており、構造生命科学と創薬研究の研究様式そのものを刷新するインパクトを持つと考えている。 |
| 3-4 現時点で AI for Science チャレンジ型に応募したいと思いますか?At this point, would you like to apply for the AI for Science Challenge–type program? | 共同研究先が見つかれば応募したい I would like to apply if a suitable collaborative research partner is found. |
| 3-5 ご自身の研究活動にAIを導入・活用するときの課題があれば教えてください。支援構築の参考にします。(複数選択可)If you have any challenges or concerns regarding the introduction or use of AI in your own research activities, please let us know. | データ整理・前処理が大変そう Data organization and preprocessing seem difficult and time-consuming.;相談できる相手がいない/AI専門研究者への伝手がない I do not have anyone to consult with / I have no connections to AI specialist researchers.; |
| 3-6 上記テーマのためのデータは既に取得済みですか? Have the data for the above research theme already been collected? | データは既に取得済み、取得途中・公開データ・パブリックデータを活用予定 / The data have already been collected. The data are currently being collected, or we plan to use existing open or public datasets. |
| 4-1 今後AI活用したい(これまでAI活用した)研究データについて取得先や収集手法について可能な範囲で教えてください。 Please describe, to the extent possible, the sources and collection methods of the research data that you would like to use (or have us... | 本研究では、Protein Data BankやGPCRmdに公開されているGPCRの構造、MDのデータを活用するとともに、これらを基に自前でMDシミュレーションを実施し、受容体の動的構造データを生成して学習・テストデータに用いたいと考えている。また、化合物ごとの実験データも適宜活用したい。 |
| 4-2 以下を参考にデータの種類等を可能な範囲で教えてください。 観測データ / 実験データ / 測定データ 画像 / 音声 / 動画 / テキスト / 時系列 数値シミュレーション結果 センサーデータ 行動データ / 社会調査・アンケートデータ (横断的にデータ取得/縦断的:一人物に複数点) 文献データ / デジタルアーカイブ その他 Please descr... | 実験データ / 測定データ、テキスト / 時系列、数値シミュレーション結果 |
| 4-5 データの基本情報(サンプル数、説明変数、目的変数)について教えてください。Please provide basic information about the data, such as the number of samples, explanatory variables (independent variables), and target variables (depend... | サンプル数は数十〜数百のMDシミュレーションの条件を想定している。説明変数には時系列の構造データから抽出した残基間距離や相関などの特徴量やそれぞれの化合物に対応する実験データを用い、目的変数としてリガンドの活性・シグナル選択性の指標や特定の構造状態の出現確率を設定できないかと考えている。 |
| 4-6 これまでデータへ適応した解析手法や統計手法・モデル等があれば教えてください。Please describe any analytical methods, statistical techniques, or models that have been applied to the data so far, if applicable. | Principal component analysis、Relaxation Mode Analysis、Dynamical Network Analysisなどを用いて、分子動力学シミュレーションから得られるデータの次元削減、遅い構造変化の抽出、残基間相互作用ネットワークの解析を行ってきた。 |
| 4-7 データの信頼性について次の点を記述してください。例)・測定精度/誤差範囲/ノイズがあればその特徴、もしくは、専門家によるアノテーションが必要かどうか Please describe the reliability of the data, addressing the following points as appropriate. Examples: Measurement a... | 本研究で扱うMDシミュレーションデータは、確立された力場や計算条件に基づいて生成されており、原子座標の数値精度は計算手法に依存して一貫性が保たれている。一方で、熱揺らぎに起因する構造ノイズや初期条件依存性によるばらつきが含まれるため、単一軌道ではなく複数シミュレーション条件を用いた統計的解析を行う必要は考えられる。データは数値的に自動取得が可能であり、専門家による個別のアノテーションは必要ないと考えているが、機能解釈やモデル検証の段階では専門的知見に基づく評価が必要であると考えている。 |
| 4-9 データの構造・複雑性について以下から教えてください。(複数選択可) Please indicate the structure and complexity of the data by selecting from the options below. (Multiple answers allowed) | 線形・非線形 Linear / Nonlinear;多変量性 Multivariate;階層構造 Hierarchical structure;時系列データ Time-series data;次元性 High dimensionality; |