MLflowのdocumentを読んだメモ

機械学習のライフサイクル全体で、workflow, artifactを管理できるOSS。様々なMLライブラリで利用することができる。MLのコードに対して、最小限の変更を行うだけで、各data scientistが実行した実験結果を再現できるようになる。

なお、ここでいうartifactはどういう形式でもOK（png, pickled data, parquet etc）。

5つのcomponentからなる。

MLflow tracking

parameter, metrics, env, model artifactなどを管理できる。local file, database, tracking serverなど、様々な形で出力・保存できる。

MLflow models

trainingしたモデルを管理できる。あとからモデルをloadできる。

MLflow model registry

MLflowモデルの承認・品質保証・展開に焦点を当てた集中型のモデルストア・API・UI。実験で良かったモデルにタグをつけたり、registerできる。

MLflow projects

再利用可能なデータサイエンスのコードをパッケージ化できる。Databricks, k8sなどの環境でも実行可能。Dockerファイルにして、k8sで実行するなど。

MLflow recipes

分類・回帰など、一般的なタスク向けモデルを開発するための事前定義されたtemplate。簡単にMLモデルが作れる？

MLflow AI gateway

LLM向けに開発された。APIキーの集中管理が可能。gatewayをコマンドラインで起動しておくことで、Python側ではgatewayにリクエストを送るだけで、LLMからリクエストが帰ってくる。

LLM

LLMの実験もtrackingできる。prompt, output, version, parameterなど。

その他

databricksのworkspaceでもMLflowを使える。

疑問