Aidemy Business

化学・創薬メーカーのDX 〜研究現場のAI活用とAI人材育成について〜【セミナーレポート・前編】

この記事は2021年2月25日に開催されたWebセミナー「化学・創薬メーカーのDX 研究現場のAI活用とAI人材育成について」のレポートです。

ゲストに国立研究開発法人 産業技術総合研究所 触媒化学融合研究センター 主任研究員の矢田陽氏をお招きし、 株式会社アイデミー代表取締役執行役員社長CEOの石川聡彦とともに、研究現場におけるAI活用と人材育成についての講演を開催しました。

この記事ではセミナーレポートの前編として、矢田陽氏の講演部分をお届けします。

※記事化のために一部を編集しています。

矢田 陽(やだ あきら)氏

国立研究開発法人 産業技術総合研究所
触媒化学融合研究センター フロー化学チーム 主任研究員

石川 聡彦

株式会社アイデミー
代表取締役執行役員社長CEO

「研究現場でのAI活用について」産業技術総合研究所 矢田陽様

触媒×AI研究を始めた経緯と取り組みについて

まず私が所属する触媒化学融合研究センターを紹介します。

私たちは砂や植物、空気から化学品をつくる実用触媒を開発研究しています。触媒とは、別々の原料を結びつける役割を果たすものです。最終的に原料同士が結合すると、基幹化学物や機能性化学物に変化し、それぞれの原料を結んでいた触媒は元に戻ります。

触媒には主に「分子触媒」「固体触媒」「バイオ触媒」の3種があり、私たちはそれらを融合することによって挑戦的な課題解決に取り組んでいます。環境調和型のものづくりへの貢献や、学術の深化と技術の発展により新たな触媒科学の領域を開拓することが私たちのミッションです。私たちが主に取り組んでいる課題は下記の4点です。

  • 砂から有用な機能性化学品を作るケイ素化学技術の開発
  • 酸素や過酸化水素を活用した廃棄物が水のみのクリーンな革新的酸化技術の開発
  • 植物を化学変化させ有用な化学品を作る官能基変換技術の開発
  • 空気中の二酸化炭素から有用な物質を作るための製造プロセス技術の開発

いずれの開発においても「触媒」がキーワードであり、これをいかに活用して良いものを作るか考えながら研究を進めています。

現状の触媒開発は一般的に上図のような流れで進みます。

研究者が経験や勘に基づいて触媒設計を行い、それを元に手作業で合成しルート開発を行います。その後、触媒を反応させ成績を評価するスクリーニングを行い、得られた結果を元に、触媒の性質や構造を照らし合わせます。そして再び新しい触媒設計、合成、スクリーニングを行うというサイクルを繰り返します。この過程で性能の良い触媒を発見することになります。

しかし、触媒が社会実装され実用化に至るまでには数十年かかることもよくあります。私たちは触媒設計や開発のサイクルを短期化し、 先の課題を解決する必要があるため、AIの研究を始めているのです。

触媒化学融合研究センターがAIの活用を考え始めたのは、私が参画する2年前の2014年頃です。

2015年頃のAIブームを少し先取った形で、触媒を自動的に創造するシステムの開発を目的とした研究を進める分科会を立ち上げました。これはいわゆる「触媒創造の自動化」の取り組みで、AIやコンピュータサイエンスの技術と触媒科学を融合させる研究です。弊所のAI・人工知能研究センターが設立される1年前に、既に触媒化学融合研究センターではこういった取り組みを始めていたのです。世間で、AIと科学の融合が囁かれるようになるよりも前のことでした。

当時は「キャタリストインフォマティクス(触媒における情報科学)」の概念を研究するというコンセプトを掲げていました。昨今の化学分野ではMI(マテリアルインフォマティクス)という言葉も多く用いられますが、その一分野と位置付けることもできます。情報科学とデータ科学に基づいた触媒開発にAI技術を活用し、新しい触媒の知識や高活性触媒を見出すことを目指して「キャタリストインフォマティクス」が立ち上がりました。コンセプトの立ち上げには成功した一方で、当時はまだAIを使える人材がいなかったため、2016年に私が先駆けとして参画した形になります。

しかし、当時は「AIとは何か」がよくわかっていませんでした。Gartner社のプレスリリースにもある「人工知能に関する10の『よくある誤解』」の通り、当時はAIに対してこのようなイメージを抱いていました。今はこのように考えている方は非常に少ないと思いますが、こういった認識で研究を進めていった次第です。

私が参画した頃にはAIの研究が立ち上がっていたので、関係者とコンタクトを取って研究を進めました。その当時は、とりあえずAIの研究者と連携してデータを渡せば、機械学習で何かを作って結果を戻してくれるという認識でした。

私は触媒の性能予測をしたいと思っていたので、ある反応をターゲットに設定し、収集した触媒のデータを彼らに見せることで、何かやってくれると期待しましたが、「急にそんなことはできない」と返答されました。

触媒化学の知識がない研究者にとっては当然ですが、データを渡すだけでAIができるはずがなかったのです。つまり、研究者の意見を聞きながらどうすれば望んだAIができるのかを考えて、自分で勉強していく必要がありました。

研究者との議論の末、まずは入出力データを準備し、集まったデータを元に独自で機械学習を進めることになりました。

最初は上手く行きませんでしたが、どのような触媒化学のデータを入力すればよいか考えていくうちに、計算化学を使って入力データを作るとよさそうだと分かりました。計算化学の専門家と連携することで触媒活性を予測する機械学習を作るためのパ ラメータ(説明変数)について理解するなど、異分野の知見を上手く盛り込んでいくことで良いAIが構築できることに気づきました。

そして最終的に、AI構築には以下の4点が重要だと分かりました。

  • 課題設定
  • データ収集
  • 予測モデルの作成 
  • 推定

まず、開発を開始する時点の「課題設定」が重要です。今回の場合データでは、いかに効率の良い触媒反応で化合物を作ることができるか、という点を課題に設定しました。その次は「データ収集」です。その際に、緻密なデータであることなど、触媒の性質を上手く表すような触媒反応の条件が定義されていなければいけません。続いて「予測モデルの作成」です。説明変数と目的変数の関係を機械学習させることで、このモデルにどういった触媒を使えば良いかをAIの研究者と議論しながら決定し、最後に「推定」を行います。

上図は、オレフィンを過酸化水素でエポキシドに変える触媒反応をAI構築の目的とした事例です。この反応に関するデータを集め、先ほどのスキームに沿って機械学習を進めていくと、実験収率と予測収率は次のようになりました。

右上のグラフをご覧ください。青は学習データ、赤は予測検証データです。良い触媒と悪い触媒はある程度予測できるという成果を出すことができました。この技術によって以前の約10倍の実験効率が達成できることになります。

最近ではこれをさらに発展する形で、触媒反応の最終収率の予測と合わせて触媒反応のサイクル高速化についても研究を進めており、その指標となる反応初速度を予測する技術の開発も行っています。

有機合成や触媒研究で活用されるAIについても紹介します。

ある機能性化学品を作る時は、社会的な要求を元に設計し、その後合成経路の提案や反応を予測・選定し、実験に進みます。有機合成や触媒研究の分野ではほぼ全てにおいてAIの活用が進んでいる状況にあります。分子設計においては、機能予測や分子構造の提案などのマテリアルズインフォマティクス分野が主流となりつつあります。合成経路の提案では、いわゆる囲碁AIを使うと効率的な分子の作り方が分かります。先に紹介した収率予測技術も用いることができます。最近ではロボティクス分野において、自動で化合物を作るロボットの開発が進んでいます。

このように有機合成や触媒に対するAI技術の活用は着実に進んでおり、私たちもこのような研究開発に取り組んでいます。

AIは非常に有用なツールではありますが、全てをAIに任せることは考えていません。AIが出す答えが私たちの予想通りであれば良いのですが、そうでない時もあります。私たちの考えと一致するか否かを見て、もし一致しなかった場合は「AIが新しい仮説を提唱してくれている可能性があるのでは」と考えながらAIを活用しています。

AIによる新しい仮説が提唱された際には、知的作業が得意な人間が頭を使って、価値の創造や原理・原則の発見に繋げます。AIというツールを使いながら研究者が頭を使う、いわば「AIとの協働作業」ですね。これにより人間の創造性を増幅させることができ、触媒化学や有機合成の飛躍的な進歩に繋がるため、積極的にAIが活用されています。

触媒センターにおけるAI人材育成

AIを研究で活用するためには越えなければならない「3つの山」があります。

第1の山は、機械学習の基礎知識です。機械学習やプログラミングの知識が1つの山であることは皆さんも認識されていると思います。

第2の山は、課題の設定です。何を開発したいか、機械学習で何を実現するのか明確に定義する必要があります。ここで課題を曖昧に設定してしまったために上手くいかないということが多くあります。科学研究におけるAIの活用は課題の設定によって8割方決まるのではないかと思っています。

その上で第3の山として、データ取得と説明変数の設定があると考えています。特に出力と相関のある説明変数は何かを考えることが非常に大事だと思っています。

上記の山はAIの研究者が十分乗り越えられるものですが、課題の設定やデータの取得、あるいは説明変数については開発分野の知識が重要になるため、それらを駆使しながら研究していくものだと私は考えています。

ここからは、私がAI人材となった後、次に新しい研究員が入所した時にどのようにAI人材育成をしていたかお話しします。

私の専門は「均一系触媒」というものです。かつて半年間ほど「固体触媒」という少し性質の異なる触媒の開発へのAI活用を進めたことがありました。その際、先述した第2の山である課題の設定はクリアできたのですが、これまで扱ってきた「均一性触媒」ではない「固体触媒」についての説明変数の準備が難しく、第3の山を越えられない事態に直面しました。その際、「固体触媒」専門家の博士研究員Aさんに研究に加わっていただくことにしました。

AさんはAIについては素人です。私は、Aさんに機械学習のサンプルコードと以前の研究で使った入出力のデータを渡し、「まずはこの機械学習が実行できるようになってください」「このコードに何が書かれているかを解明してください」と依頼しました。同時に、機械学習を活用した固体触媒研究の関連論文も紹介しました。結果としてAさんは自分で機械学習を実行できるようになり、第3の山を自分で越えられるほどに成長しました。

その後、Aさんは自主的に色々な機械学習の勉強会にも参加するようになり、1年ほどで様々な手法を実行できるまでになり、共同研究も大幅に進むこととなりました。

AI研究者に化学の知識を教えることと、化学者にAIの知識を教えることでは、どちらが望ましいのでしょうか。私は後者の方が、研究を進める上では非常に大事だと考えています。

AI研究者にとって化学者の学習は難しく時間がかかってしまうため、化学者にAIを教える方が研究の進みが早いという理由からです。また前提として、私たちの化学分野でAI人材の募集をかけても、AI研究者が応募してくることはほぼないという事実もあります。

アイデミーとの取り組み

現在、触媒化学融合研究センターではアイデミーのe-Learningを利用していますが、受講するか否かで差が出てくるのを面白いと感じています。かなり進めている人と、全然取り組まない人がいる状況になっています。また、利用開始から1年経過しましたが、学習が進んだ人でも実際の研究に活用している人はまだ現れていません。ただ、「なんとかしてAIを研究で使ってみたい」という一定数の相談や案件は出てきています。

e-Learningは研究所全体の知識の底上げには非常に大事ではありますが、第1の山を越えるだけでは研究現場での活用は進みません。ここからは現場での利活用を主導できるような人材を育てる必要があると感じています。

AIリーダー的存在となる人材を育成し、どんどん次の人を引っ張っていくような環境作りが非常に大事だと思っています。関連研究の情報や適切な手法を経験者が後続に示し、一度上手く波に乗って小さな成果を出していくと、そこから良いスパイラルが生まれ、また後続がその成果を見ることによって全体のAIスキルが底上げされるように考えています。

DX人材育成サービス「Aidemy Business」

未経験からでもDX推進に必要な知識を習得できます。無料トライアルも実施中

画像:ダウンロード資料のイメージ

    必須

    必須

    会社名必須

    業種必須

    部署名必須

    役職必須

    メールアドレス必須

    電話番号必須

    従業員数必須

    無料トライアル利用必須

    株式会社アイデミーは、特定電子メールの送信について同意のうえ登録いただいた会員のメールアドレスに、本サービスに関連した最新のAI活用情報やAidemy関連サービスのご案内、キャンペーンのお知らせなどの広告宣伝を含む内容のメールをお送りします。メールを受け取らない方はチェックを外してください。


    利用規約 / 個人情報取扱い / 個人関連情報の取得および利用について

    ※ 上記フォームで送信できない場合は、必要項目をご記入の上、
    support@aidemy.co.jpまでメールをお送りください。

    当サイトはreCAPCHAとGoogleにより保護されています。

    reCAPCHA利用規約

    reCAPCHAプライバシーポリシー