前編では、機械学習モデルをどのように実運用していくのかを紹介しました。
後編では、機械学習モデルの実運用フェーズでよくある質問にお答えします。
modeloy導入について
Q:現在既に会社で機械学習のモデルの実用化されている状態なのですが、アイデミーのmodeloyを導入することは可能ですか?
A:はい、もちろん可能です。
既に機械学習モデルの実運用されている状態であれば、是非そのまま進めていけばいいかと思います。しかし1~2個のプロジェクトが始まり、今後10個~20個に増える可能性があるならば、横串組織で効率化した方が、会社全体のAIプロジェクトをより大きく前進させることができると思います。いくつか出来上がったプロトタイププロジェクトまとめながら、スピード感と全社最適を追い求めていくような点でご支援できます。
MLOps開発について
Q:MLOPps開発は通常のシステム開発のWBSと大きな違いはありますか?
A:大きな差はないかと思います。
ただ、前回の記事で紹介しましたように、機械学習モデルの性能が変化する前提のもと、再学習の管理や機械学習に読み込ませるデータをどのように集めてモデリングするかという議論が、通常のシステム開発にはない視点かと思います。
共同開発について
Q:自動車関連のTier1、Tier2の検査システムを共同で開発することは可能ですか?
A:はい、可能です。
大前提として、アイデミーは機械学習モデルの構築を受託で行っておりません。機械学習のモデルを構築することは、会社の競争優位そのものに近いので、各社様に機械学習モデルを制作いただきます。その後の運用については競争優位性と切り離された部分なので、アイデミーのプラットフォームをご利用いただければと思います。
ただ、機械学習モデルの構築をお手伝いするようなパッケージはあります。例えば教育研修の「Aidemy Busuness」という製品や、作成支援のインテンシブプラン、コンサルティングプランもありますので、ご興味があればぜひご相談いただければと思います 。
MLモデル構築やMLOps開発の期間について
Q:MLモデルの構築やMLOPs開発の期間はどのくらいですか?
A:千差万別です。
制作する複雑なシステムや機械学習モデルの複雑さによって変わります。機械学習が作成されており、データが既に手元にあることを前提とするならば、1か月ほど見積もっていだければ問題ないと思います。
モデリング自体はさほど時間がかからないのですが、
- 機械学習モデル作成前のデータ収集
- データの正規化
- アノテーション(データのラベルづけ)
など、データの状況によって変化するため千差万別なのです。
アノテーションに関する解説
アノテーションについてもう少し具体的に説明します。前回の記事では、データを蓄積して再学習することで機械学習モデルの性能を上げられると解説しました。
基本的に実運用に近いプロジェクトは「教師あり学習」のラベル付きのデータを用いて学習させるケースが非常に多いと思います。運用して継続的に再学習させるようなプロジェクトは大きく分けて2つあります。
- アノテーションが必要なプロジェクト
- アノテーションが自動で行われるプロジェクト
後者については、アイデミー社内で教育研修プロダクトの需要予測を行っており、アイデミーのサービスが1時間毎に何回利用されるのかという予測モデルがそれにあたります。そのモデルの結果に応じて、サーバの台数を増減しています。正解ラベルが自動でつけられるよう設計しているため、アノテーション作業は不要で、データを収集すればすぐに再学習ができるのです。
問題は前者の場合です。例えば不良品検知のようなプロジェクトの場合ですと、不良か否かという正解ラベルを付けたデータを学習させたり、正常品だけで機械学習モデルを構築したりするなど様々なケースがあります。実際に機械学習モデルをデプロイした後も、同じようなデータも継続的にアノテーションが必要です。
機械学習モデルが運用された後、全データをアノテーションするのは意味がなく、最終的なチェックは人間が取り組まなければなりません。 たとえば毎日1万個の中から10個の不良品が出てくるようなラインがあった時、300個~500個に関してはAIを使って広めに自動検知することになります。自動検知した500個の中から、人間が検査して10個の不良品を見つける作業が、アノテーションのデータになります。
最後に
このように機械学習プロジェクトは千差万別です。お悩みごと、お困りごとがありましたら、ぜひご相談いいただければと思います。