2012 津川裕司
博士論文要旨
ガスクロマトグラフィー質量分析を用いたメタボロミクス研究に資するノンターゲット解析システムの開発
大阪大学大学院 工学研究科 生命先端工学専攻 生物資源工学領域 福崎研究室
津川裕司
第一章 緒論
ガスクロマトグラフィー質量分析(GC/MS)はメタボロミクス研究の中核を成す分析技術として頻用されており,品質評価やバイオマーカー探索等に幅広く利用されている.しかしながら,メタボロミクス研究におけるGC/MSの有用性が認識されている一方で,得られる分析データを解析するための解析手法の開発はほとんど行われていない.特に,大量クロマトグラムデータのノンターゲット解析においては,代謝産物由来ピークの化合物同定または化合物構造推定といったピークのアノテーション作業や,統計解析を行うための整理されたデータ行列を作成する作業は解析者の目視手作業によって行われているのが現状であり,解析に膨大な時間と労力が必要であった.また,このような目視・手作業による解析は,解析者の経験,知識によってデータ処理の正確性が異なるため結果の客観性が得られないといった重大な問題を含んでいた.これはGC/MSから出力される膨大なデータセットに対して化合物同定や化合物構造推定を含めたノンターゲット解析を行うための好適な方法論がないことに起因しており,GC/MSメタボロミクス研究を円滑に遂行するためのノンターゲット解析システムの開発が望まれていた.
そこで,当該研究では,解析者の知識・経験によらずGC/MSから得られた膨大なクロマトグラムデータに対してノンターゲット解析を行うための,化合物同定,化合物構造推定,多変量解析適応のデータ行列作成作業,さらには統計解析に至るすべてのデータ解析行程を自動的に行うノンターゲット解析システムの開発を第一の目的とした.さらに,分析装置に依存しない汎用性のある解析技術の開発,加えて従来研究よりも安価かつ高解像度でGC/MSメタボロミクス研究を遂行できる実用性の高いノンターゲット解析プラットホームの開発を第二の目的とした.
第二章 ノンターゲットGC/MSメタボロミクス研究のためのデータ解析システムの開発
当該研究では,外部標準物質を使用しない化合物同定アルゴリズム,及び化合物構造推定アルゴリズムの開発を行うことでピークのアノテーションを客観的に行い,生データから統計解析に至るすべてのデータ処理を自動的に行うデータ解析システムの開発を試みた.化合物同定において,代謝産物由来ピークを擬似内部標準物質として保持時間補正を行うことで外部標準物質を用いない補正アルゴリズムの開発を行った.また,重み付きマススペクトルのピアソン相関係数を用いたマススペクトルの類似度,及び保持時間の類似度のトータルスコアを計算することで,ピークの同定を客観的に行うアルゴリズムの開発を行った.
化合物構造推定に関しては,Soft Independent Modeling of Class Analogy (SIMCA)を用いた化合物構造推定アルゴリズムの構築を行った.SIMCAは,多変量を扱うことができる分類手法であり,主成分分析に基づいたクラスモデルを複数作成できるというメリットを持っている.当該研究では,化合物のマススペクトルを説明変数とし,5つの化合物グループ(アミン,有機酸,脂肪酸,糖,糖リン酸)を構築した.そして未知ピークのマススペクトルをSIMCAに適用することで,未知ピークの代謝物構造推定を行うアルゴリズムを構築した.
化合物同定及び化合物構造推定アルゴリズムに加え,マススペクトル抽出,定量イオンの決定及び定量,そして組織化されたデータ行列の作成,さらにはメタボロミクス研究で頻用される多変量解析手法を実行するためのアルゴリズム及びグラフィカルユーザーインターフェイス(GUI)をVisual Basic for Applicationで記述し,本研究にて開発されたソフトウェアを『AIoutput』と命名した.
第三章 実用的なノンターゲットGC/MSメタボロミクスプラットホームの開発
従来のメタボロミクス研究では,Pegasus GC-TOF/MSが,その高速データ取得の特性から,Fast GC及びデータ処理が正確に実行可能であるためGC/MSメタボロミクスに最も優れた分析機器として認識されてきた.第二章で構築したAIoutput及びreference libraryも,本装置に基づき構築されたものであった.しかしながら,飛行時間型の質量分析装置は高価であり定量範囲が狭いため,メタボロミクス研究では低コストかつ汎用性の高い四重極型の質量分析が広く用いられており,分析装置非依存的なデータ解析システムの開発が望まれている.当該研究では,AIoutputの汎用性の検証及びreference libraryを異なる分析装置に適用するための解析技術の開発,そしてより安価かつ高解像度のメタボロミクス研究が実行可能な実用性の高いプラットホームの開発を試みた.以上の目的を達成するため,当該研究では四重極型質量分析装置を採用した,高速スキャンが可能なShimadzu GC-MS QP2010 Ultra(以下,Ultra GC-Q/MS)を適用した.
当該研究ではノンターゲット解析システムの汎用性及び,有用性を示すためにPegasus GC-TOF/MS,Ultra GC-Q/MS両方の分析装置を用いて,3つの検証実験を行った.1つ目は,100化合物の標準品混合液を用いた定性能の検証を行った. 2つ目は,アミノ酸混合液を用いたプラットホームのダイナミックレンジ,定量性の検証を行った.装置の性能だけでなく,AIoutputによって自動的に定量かつ同定を行い,データ処理の有効性の検証も同時に行った.3つ目には,生物系の基礎研究において炎症刺激として広く用いられているLipopolysaccharide(LPS)を投与した炎症モデルマウス血漿の代謝物表現型解析をノンターゲット解析により行った.
第四章 総括
本研究では,従来主観的かつ膨大な時間をかけて行われていた化合物同定,構造推定といったピークアノテーション,定量,そしてデータ行列の作成の自動化に成功した.また,GC/MSメタボロミクス研究のノンターゲット解析において,分析装置に依存せず,熟練解析者と同等以上の解析結果が客観的に取得可能なノンターゲット解析システムを開発した.さらに,Ultra GC-Q/MSを用いることで従来よりも安価かつ高解像度のメタボロミクスプラットホームを構築した.本研究は,GC/MSメタボロミクスを推進するにあたって複雑かつボトルネックであったデータ解析行程を,簡単,迅速,正確に実行可能なデータ解析技術を提供するものであり,今後のメタボロミクス研究の飛躍的な進歩に貢献し,食品,医療分野に限らず様々な分野において革新的な技術として応用されることが期待される.
論文リスト(本学位論文に関与する論文)
1) Tsugawa, H., Tsujimoto, Y., Arita, M., Bamba, T., and Fukusaki, E. (2011) GC/MS based metabolomics: development of a data mining system for metabolite identification by using soft independent modeling of class analogy (SIMCA), BMC bioinformatics, 12, 131.
2) Tsugawa, H., Bamba, T., Shinohara, M., Nishiumi, S., Yoshida, M., and Fukusaki, E. (2011) Practical non-targeted gas chromatography/mass spectrometry-based metabolomics platform for metabolic phenotype analysis, Journal of Bioscience and Bioengineering, 112, 292-8.