[go: up one dir, main page]

タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

LLMとazureに関するigrepのブックマーク (1)

  • OpenAIのモデルアップデートに備えてPrompt Flowでモデルの評価フローを作る

    LLMがアプリケーションに組み込まれ始めていますが、LLMを組み込んだアプリケーションというのは非常に評価が難しいです。 いわゆる"AI"を使用しないアプリケーションの場合は基的に処理はルールベースで実行されるため、単体テストやE2Eテストなりで評価を行うことが可能です。 一方でLLMをはじめとしたAIモデルは確率生成に依る部分が多く、テストパスが通ったからと言って毎回同じ出力が得られるとは限りませんし、自然言語で出力された結果をルールベースで評価することも困難です。 上記のように、モデルアップデートのための評価は大変な反面、LLM自体の進化は早く、モデルのアップデートが頻繁に行われています。 例えばOpenAIGPT-3.5-turboやGPT-4を見ると、リリースから現在まで0301 / 0613 とバージョニングがされていて、それを並行してgpt-35-turbo-16kなどの別

    OpenAIのモデルアップデートに備えてPrompt Flowでモデルの評価フローを作る
  • 1