マテリアルズインフォマティクス(MI)は、文章や画像生成AIが注目を集める以前から一定の実績が積み重ねられており、材料探索における新たな研究分野を切り開いた。本稿では、MIが効果的に機能するのはどのような分野なのかということに焦点を当て、その事例を紹介していく。

マテリアルインフォマティクス・MIとは?その利便性と課題

新たな材料開発技術の登場は、材料応用の可能性を拡大するとともに、その探索範囲を爆発的に広げる。研究者はこれまで通りに材料を合成・評価し、新たな知見を得て次の材料設計に活かすというフィードバックループを回してきた。しかし、広範な探索領域のすべてを調べることは困難だ。

そこで大量のデータを扱う情報科学(インフォマティクス)の知見を用いて、このフィードバックを効率化しようという動き、MIが現れた。

MIとは、機械学習など情報科学分野の知見を用いた材料探索・研究を指す。

例えば、材料に関する大量の構造データとその材料物性を学習させれば、特定の構造を有する材料がどのような物性を持つかを予測するモデルを作成できる。MIによって、実際に材料を合成することなく、コンピュータ上である程度、材料の物性を予測し、探索領域を絞り込むことも可能だ。

材料の表現

効果的にMIを利用する上で、機械学習アルゴリズムの選択は重要であり、それとともに「材料をどのように記述するか」が求められる。

複雑な分子式や材料の組成について、人間であれば、それらを画像データから読み取る、あるいは、言語化されない感覚から学習できるだろう。しかし、コンピュータに入力して学習させる際には数値で、少なくとも文字列で定義されたデータでなければならない。元データがコンピュータに入力できる形式を取っていないという問題は他の機械学習分野でもあり得ることだが、MIではこれが顕著だ。

例えば、無向グラフを用いたSMILESという記述法は、あらゆる分子の化学構造を一意に、一次元的文字列へ変換できる。ただ、SMILESはMIを目的とした記述法ではなく、この文字列を学習に用いても優れた予測モデルを作ることは難しい。

他方、分子フィンガープリントという記述法は主にMIを目的として用いられてきた。こちらは特定の部分構造が含まれるかどうかで分子を記述する。

例えば、アミド結合を有す、チオフェンを含む、ベンゼン環に直接結合する水素原子が3個以上、などだ。それぞれの条件を満たしていれば1, そうでなければ0とし、この1, 0の順列で分子が記述される。

また、目的とする探索領域に応じて適切な表現方法は変わってくる。ここまでの例は分子の表現法だが、材料が高次構造を持つ場合、例えば結晶構造を持つ場合や、ナノマテリアルのようにサイズ依存性がある場合、先述の記述法では十分でない。

材料を正確に記述するとデータ量が増大してしまうため、必要十分な長さで材料を記述する方法を見つけ出すことが肝要だ。以上のことから、MIには機械学習アルゴリズムのみならず、対象とする材料群についての高度な理解が求められる。

MIによって材料探索された6つの事例

材料開発に携わる大多数の企業にとって興味があるのは「MIによって自社の材料開発は恩恵を受けられるのか」、あるいは、「自社の材料開発にMIを導入すべきかどうか」といったことではないだろうか。

実際にMIで何ができるのか、どのような恩恵があるのか、どのような材料探索に向いているのかを包括的に語ることは難しい。ここからは過去のMI活用に関する個別事例を紹介していく。

絶縁破壊強度予測モデルの作成

絶縁破壊とは絶縁体に限界を超える電界が印加された際に、電気抵抗が急激に低下する現象を指す。この現象にはさまざまな要因があり、メカニズムについては明確に分かっていない。よって、絶縁破壊電界強度の正確な予測は困難だ。

こうした背景から米ジョンズ・ホプキンズ大学では、教師あり機械学習によって絶縁破壊強度を予測するモデルの構築を試みた。本研究では遺伝的アルゴリズムを用い、代表的な82の誘電体材料について各材料の8つのパラメーターと絶縁破壊強度の関係を調べている。

結果として、バンドギャップ Egの寄与が最も大きく、次いで最大フォノン周波数 ωmaxの寄与が大きいことが分かった。また、本モデルは、絶縁破壊強度 ωmax(~15eV-Eg)-1 という従来の型に囚われない規則性を一例として提示した。

機械学習では目的とする物性値(今回の場合は絶縁破壊強度)に材料の各パラメータがどのくらい寄与するかを数値化できる。加えてMIは、複雑なデータ群から常識に囚われない規則性を導き出す。

ただし、論文中では今回の結果が遺伝的アルゴリズムに特有のものであることが強調されており、目的に応じて機械学習プロセスを使い分けることの重要性が示唆される。

海洋ごみ削減のための生分解性プラスチック探索

海洋プラスチックごみの削減は、カーボンニュートラルと並び人類にとって喫緊に解決すべき環境問題となっている。今後も、海洋にプラスチックが流出していけば生態系が破壊され、海洋の二酸化炭素(CO2)吸収力の減少、海産物の収穫減、円滑な海運への影響につながり得る。

そして、衣料品や漁網といった繊維製品に含まれるプラスチックにも、海洋ごみとならないための対策が求められる。これらを生物分解性プラスチック、海洋分解性プラスチックとすることで解決する方法があるが、高い強度と分解のしやすさの両立を狙いMIが活用された事例がある。

日立グループは開発したMIのソリューションを活用し、すでに生分解性プラスチックとして活用されているポリ乳酸、50種の化合物・有機物質、添加剤として利用できる可能性のある約100種類から最適な組み合わせを探索。50万通りの組み合わせをすべて検証し、有効性のあるものを見つけ出すのにかかった時間は2日だった。同社は、従来法と比べて60分の1の時間でシミュレーションができ、被験物質の廃棄量を5分の1に削減できると訴求している。

エルパソライト結晶のエネルギー予測モデルの構築

スイス、バーゼル大学の研究グループはエルパソライト結晶(ABC2D6で表される無機結晶)に関する200万の材料構造データを学習することで、DFT計算の代替となり得る結晶エネルギー予測モデルの構築を目指した。

本研究では、最初に200万の材料構造データからDFTよりも簡易な結晶エネルギー計算を行う。幾つかのDFT計算の結果と簡易な結晶エネルギー計算の結果を比較し、カーネルリッジ回帰からこの差を補正するモデルを構築した。

これにより、200万すべての構造についてDFT計算を行うことなく、精度の高い結晶エネルギー予測モデルを構築することができた。本研究事例のように、MIは材料探索に要する時間を大幅に短縮できる。

MIシミュレーター「Matlantis」を利用したENEOSの事例

ディープラーニングを中心にさまざまなIoT分野の開発を進めるスタートアップ、Preferred Networksは「Matlntis」というMIシミュレーターをリリースしている。

参考記事:【展示会レポート】「NexTech Week 2024(春)」で見たAI分野の動向

このMatlantisを利用し、石油大手のENEOSは「アンモニア合成触媒の探索」「潤滑剤・グリースの設計」「タイヤゴム材料開発のためのシミュレーション」を行った実績がある。アンモニア合成触媒の探索では、物理的な実験をせずに有望な候補材料を発見。潤滑油・グリースの設計は、環境負荷が少なく効率を上げるためのプロダクトの開発をMIを通じて行う。

低熱ヒステリシス形状記憶合金における組成の調整

長期的な視点に立ち、機械学習から得られた結果を元に実験を行い、データを集め、再度機械学習を行う、というフィードバックを繰り返していく運用もあり得る。この場合、現状のデータからグローバルな最適解を算出することだけでなく、モデル品質を向上させる得るデータ点を見つけることも同様に重要だ。

米ロスアラモス研究所の低熱ヒステリシス形状記憶合金の探索研究では、未探索領域のデータ点がモデルの品質向上にどの程度寄与するかを定量化し、材料探索を効率化する方法を示した。

「期待される改善」を定量化するためには、データ点の不確実性が利用される。機械学習では予測される結果が不明瞭で、実験によってモデル品質の大幅な向上が期待される点を見つけ出す。同時に、現状モデルでの大局的な最適解をバランス良く探索することが本アプローチの趣旨だ。

本研究の成果としては、Ni50−x−y−zTi50CuxFeyPdzの材料系で、本論文で提案される手法の9ループ目にして、元のデータセットよりも小さな熱ヒステリシスを持つ合金が得られた。

材料組成の最適化や微調整はMIの典型的な活用分野であり、ペロブスカイト材料や有機EL材料、触媒など、さまざまな分野で利用されている。

なお、本研究と次に取り上げる圧電材料探索研究の中心人物であったロスアラモス研究所のTurab Lookman氏は、中国政府の研究者招聘プロジェクト「千人計画」に応募していた事実を開示しなかったとして、$75k(約1179万円)の罰金を科す保護観察処分付き有罪判決を受けている。

BaTiO3ベースの圧電材料探索

MIは人間の先入観、憶測、既存の常識にとらわれない客観的で機械的な結論を導くが、これは機械学習が既存の理論から無縁に存在するという意味ではない。既存の理論の中でMIに有用なものがあればそれを取り入れることができる。

機械学習の代表的なアルゴリズムであるベイズ推定は、新たに得られたデータによって逐次モデルを更新していくものだが、初期条件として設定する関数によって結果をある程度方向付け、探索領域を制限できる。

米ロスアラモス研究所が中心となり行われた圧電材料に関する探索研究では、圧電材料に関する基本的な理論であるランダウ・デボンシャー理論を適切にベイズ推定に組み込むことを目指した。鉛フリーの圧電材料であるBaTiO3の最適な組成を見つけ出す上で、本手法は計算量と実験回数の削減に寄与している。

MIの利用に適した分野を見極める

人間が解析的に解くことができるシンプルな問題にわざわざ機械学習を導入する必要はない。一方、機械学習が探索を効率化するとはいえ、専用のアルゴリズムを構築し、データを入力して計算させることは大変な労力を要する。

MIを導入するのに適した分野は、対象とする現象についての支配的な法則が明らかにされていない、もしくは多数の物理現象が絡み合うことである程度の複雑さを有し、統一的な説明が困難な領域だ。

同時に、データ主導で結論を導くためには、その分野について確度の高いデータが揃っており、適切なデータ形式でコンピューターに入力できることが望ましい。


参考文献:
※1:SMILES, a chemical language and information system. 1. Introduction to methodology and encoding rules, David Weininger, ACS Publications(リンク
※2:マテリアルズインフォマティクス概説, 吉田亮, 『統計数理』第69巻第1号(リンク
※3:Identifying models of dielectric breakdown strength from high-throughput data via genetic programming, Fenglin Yuan & Tim Mueller, scientific reports(リンク
※4:Development of Materials Using Materials Informatics, 岩崎富生他, 『Hitachi Review』71巻4号(リンク
※5:Machine Learning Energies of 2 Million Elpasolite (ABC2D6)Crystals, O. Anatole von Lilienfeld他(リンク
※6:Development of new materials using Materials Informatics (MI), ENEOS(リンク
※7:Accelerated search for materials with targeted properties by adaptive design, Turab Lookman 他, nature communications(リンク
※8:Machine learning for perovskite materials design and discovery, Wencong Lu他, 「npj computational materials」(リンク
※9:A materials informatics driven fine-tuning of triazine-based electron-transport layer for organic light-emitting devices, 相原秀典他, 「scientific reports」(リンク
※10:「nature catalysis 」特集 Machine Learning in Catalysis (リンク
※11:Former Los Alamos physicist gets probation for failing to disclose China ties, Science(リンク
※12:Accelerated search for BaTiO3-based piezoelectrics with vertical morphotropic phase boundary using Bayesian learning, Turab Lookman他, PNAS(リンク


【世界のマテリアルズインフォマティクスに関する技術動向調査やコンサルティングに興味がある方】

世界のマテリアルズインフォマティクスに関する技術動向調査や、ロングリスト調査、大学研究機関も含めた先進的な技術の研究動向ベンチマーク、市場調査、参入戦略立案などに興味がある方はこちら。

先端技術調査・コンサルティングサービスの詳細はこちら