2015 小倉泰郎

博士論文概要

液体クロマトグラフィー質量分析法を用いたノンターゲットメタボロミクスに資する

化合物推定方法の開発

大阪大学大学院 工学研究科 生命先端工学専攻 生物資源工学領域 福崎研究室

小倉泰郎

    1. 緒論

メタボロミクスに用いられる測定方法としては,ガスクロマトグラフィー質量分析(GC/MS)や液体クロマトグラフィー質量分析(LC/MS)などの手法が頻用されている.ノンターゲットメタボロミクスでは不特定多数の化合物を対象とするため,標準試料を用いずに化合物を推定する必要がある.

LC/MSはGC/MSでは測定できない不揮発性化合物などの幅広い化合物を測定することが可能でありノンターゲットメタボロミクスに適した測定手法であるが,現状ではLC/MSに使用可能なスペクトルライブラリの収載化合物数が不足しているため化合物の推定は困難である.質量分析情報から推定される分子量や組成式を用いて化合物データベースから化合物候補を得ることも可能だが,膨大な数の候補が現れてしまうため化合物を推定することは容易ではない.さらに,膨大な化合物を収載するデータベースであっても,想定される化合物を網羅するには至っていない.例えば,生体内に取り込まれた外因性化合物の一部は抱合反応を受けて尿などを経て体外へ排出されることが一般的に知られており,これらの抱合体は重要な測定対象の一つであるが化合物データベースにおける抱合体の収載数は非常に少ない.このようにLC/MSを用いたノンターゲットメタボロミクスを実用的に運用するためには,化合物の推定方法を開発する必要性は高い.

そこで本研究では,衝突誘導解離 (CID) と高分解能質量分析により得られるマススペクトルに対して化合物データベースを用いて化合物を推定する方法の開発を目的として,膨大な候補化合物を絞り込むために同位体パターンを含めた新たなスコアリング方法および多段階CID (MSn分析) による脱抱合を応用し,化合物データベースを用いた抱合体の化合物推定を行う手法について検討を行った.

    1. 化合物データベースを用いた化合物推定方法の開発

PubChemやChemSpiderといった化合物データベースはそれぞれ5100万および3200万という膨大な化合物情報を収載している.化合物データベースを用いた化合物推定では分子量や組成式を用いた検索によって候補化合物を得るが,一般にその候補数は数百から数千に及ぶため候補化合物の合理性を評価しランキングすることが重要である.本章では同位体パターンや精密質量およびプロダクトイオンから組成式を推定し,データベース検索に用いた.また,得られた全ての候補化合物に対してプロダクトイオンスペクトルの自動帰属を行い,帰属されたイオン量を計算することで部分構造の合理性を示すスコアを得た.これらの組成式や部分構造のスコアを組み合わせた最終的なスコアを得ることで化合物を絞り込む手法を開発した.開発した手法のモデル実験として,緑茶抽出液に含まれる化合物推定を実施した.品評会にてランク付けされた緑茶をLC/MS法により測定し,測定結果の多変量解析を行うことによりランクと相関の高い20成分を決定した.そこでこれら20成分の分析結果をもとに化合物の推定を行ったところ,カフェインやカテキン類のほか有機酸エステルなどの候補化合物を示すことができた.また,これらのうち入手可能な標準試料を用いた分析結果との比較によって,正しい候補を示していることが確認できた.

その後の検討においてこれまでに検討した方法では負イオンの帰属率が低いという問題が判明したため,新たな化合物推定方法を検討した.新たな自動帰属方法ではプロダクトイオンから推定された組成式に該当する部分構造を探索する方法を用いることにより,帰属率の向上が確認できた.これに伴い部分構造の評価方法を再検討し,切断された結合の様式をスコアに追加した.最終的に同位体イオンを含む組成推定の結果と,帰属されたイオンの割合,切断された結合の様式によるスコアリング方法を用いた.ここで新たに開発した方法をChemProphetと名付け,この妥当性を確認するために医薬品などの102成分を含むベンチマークデータセットに対する化合物推定を行った.これまでに報告された化合物の推定結果と比較して良好な化合物推定結果を示した.これらの結果により,新たに開発した化合物データベースを用いた化合物推定方法の妥当性が示された.

    1. データベースに含まれない化合物を対象とした化合物推定方法の開発

抱合体などの検出や構造解析にはLC/MSが広く用いられている.なかでも高分解能質量分析計におけるCIDを用いたプロダクトイオンスペクトルは測定対象化合物の部分構造情報を与える.例えば,医薬品の薬物動態解析の様に既知成分を基点とする抱合体の構造解析は一般的な手法として確立されている.しかしながら,ノンターゲット分析のように基点となる化合物が明らかにされていない場合,抱合体の化合物推定は依然として困難である.その理由としては化合物データベースにおける化合物情報の不足が挙げられる. ChemSpiderは3200万件以上の化合物を収載する巨大な化合物データベースのひとつとして知られるが,グルクロン酸抱合体の検索結果はわずか9556件であり,これは全体の0.03%に過ぎない.そこで,本章では化合物データベースに収載されていない化合物の推定方法の開発を目的として,抱合体を対象とした化合物推定方法について検討を行った.一般に抱合体はCIDによって特徴的なニュートラルロスを生成し,脱抱合体をプロダクトイオンとして生成することが報告されている.多段階CIDを用いてさらにこの脱抱合体のCIDを行うことにより,脱抱合体の部分構造情報を含むプロダクトイオンスペクトルを得ることが可能であると考えた.開発したシステムでは,これらの多段階CID分析結果の解釈による抱合反応の種類や数の判別,脱抱合体の組成推定,脱抱合体のランキング,in silico で生成された抱合体のランキングを行うことにより,抱合体の化合物推定を実施した.

新たに開発したシステムにより抱合体が推定可能であることを確認するために,入手可能な抱合体の標準試料を質量分析し,化合物データベースを用いた抱合体の化合物推定を行った.それに引き続き,モデル実験としてマウスに投与した緑茶成分に由来する抱合体を探索し,これらを対象とした化合物推定を試みた.その結果として,カテキンに関連する4成分が示された.これらの化合物はこれまでにNMRや標準試料を用いた解析などで報告されている成分であった.質量分析結果と化合物データベースを用いてこれらの化合物を推定した報告はなく,本研究で開発した新たな手法の有用性を示すことができた.

    1. 総括

本研究ではノンターゲットメタボロミクスにおけるLC/MSの効果的な利用を目指し,化合物データベースを用いた化合物推定方法の開発に取り組んだ.

第2章では,化合物データベースを用いた化合物推定を目的として,候補化合物の評価方法を開発した.質量精度,同位体パターン,プロダクトイオンの帰属率,および開裂部分の結合様式を用いたスコアリング方法を開発した.第3章では,化合物データベースに含まれていない抱合体の化合物推定を目的としたシステムの構築について述べた.抱合体の標準試料および緑茶投与マウスの尿中抱合体を対象としたモデル分析を行い,開発したシステムの妥当性を確認した.

本研究で開発された一連の手法を用いることによって,化合物データベースを用いて得られる膨大な候補の合理性を評価することができるようになった.また,MSn分析結果による脱抱合を考慮することにより化合物データベースに含まれていない化合物も対象とした化合物推定が可能であることが示された.これらの結果により,ノンターゲットメタボロミクスにおいて幅広い化合物が分析可能であるというLC/MSの実用性を高めることができたと考える.

論文リスト 本学位論文に関与する論文

1) Ogura, Tairo; Bamba, Takeshi; Fukusaki, Eiichiro: Development of a practical metabolite identification technique for non-targeted metabolomics. J. Chromatogr. A, 1301, 73-79 (2013).

2) Ogura, Tairo; Bamba, Takeshi; Tai, Akihiro; Fukusaki, Eiichiro: Compound annotation method for conjugated compounds in non-targeted metabolomics by using accurate mass with multistage product ion spectra and compound database searching. Mass spectrometry (Revised)