の発売 deepseek 2月、AIレースにおけるヨーロッパの立場についての議論を引き起こしました。競争力のある価格設定と効率性で宣伝されていましたが、中国のLLMSオープンソースの性質とデータストレージも、イタリアで深刻なセキュリティ上の懸念を引き起こしました。 禁止 その使用など 制限 政府機関と請負業者による使用。
OpenEurollmプロジェクトを入力してください
2月には、の発売も見られました Openeurollm ヨーロッパのAI製品の開発と改良のためのしきい値を下げながら、ヨーロッパの競争力とデジタル主権を改善することを目的としたプロジェクト。
多くの人が何を疑問に思っているように、それはタイムリーです ヨーロッパの企業 Deepseekと競合する可能性があります。 ミストラルAI (フランス)と アレフアルファ (ドイツ)が最も頻繁に言及されました。ただし、後者は、基本的なLLMSから、企業および政府のクライアントにAIインフラストラクチャとプラットフォームの提供に移行しました。
両社は、JanHajič(JanHajič)が調整した20の主要なヨーロッパの研究機関、企業、EuroHPCセンターのコンソーシアムであるOpeneuropellmのメンバーです。チャールズ大学、チェコ)とピーター・サルリンが共同主導する(amd silo ai、フィンランド)。 Openeuropellmは、商業、産業、公共サービスのためのパフォーマンスの多い、多言語の大規模な言語基盤モデルの家族を構築しています。
重要なことに、モデルはヨーロッパの堅牢な規制の枠組み内で開発され、ヨーロッパの価値とオープンソースおよびオープンサイエンスコミュニティとの協力を確保し、モデル、ソフトウェア、データ、および評価が完全にオープンになり、特定の業界および公共部門のニーズに合わせて微調整され、指導が調整できるようにします。
しかし、AIレースでのヨーロッパの地位について別の議論があります。イノベーションを促進し、より小さく専門のAIモデルとアプリケーションに投資することでAIイノベーションギャップを埋めることができますか?
SLMは別の方法です
EUファンディードのCEO、AnitaSchjøllAbildgaard Iris.ai、ヨーロッパのAIの未来は、より小さなドメイン固有のモデル(SLM)とオープンソースのコラボレーションを受け入れることに依存していると主張しています。
ヨーロッパのデータセンターの電力需要が2030年までに3倍に設定されているため、AIに対する別のアプローチを想像することは説得力があります – 1つ これは、膨大なエネルギー資源を消費することを大きくするモデルに依存していません。
私は話しました abildgaard、 IRIS.AI CTOと共同設立者のVictor Botevを詳しく知る。
Abildgaardは主張します:
「2,000億ユーロのような動きがありましたが Investai 計画、オープンユーロLLM、およびその他のイニシアチブは、まだ大きなプッシュにはなりません。
勢いは本物ですが、大きな警告が付属しています。資金はどのように割り当てられ、どのような時間枠で割り当てられますか?」
小言語モデルは、AIの実世界の採用をブリッジします
SLMは、高品質のデータを生成するために基礎モデルが必要です 必要 小さなものを訓練する。したがって、ヨーロッパが競争力を持つためには、 両方 基礎と 小さい モデル。
ただし、SLMは安価です。 可能です 特定のビジネスニーズに合わせて、 は 大規模な汎用モデルよりも実用的です。
さらに、Botevによると、ほとんどのビジネスユースケースは大規模なLLMの全力を必要としません。
“できれば 蒸留します より小さなモデルに必要な知識だけで、より効率的で費用対効果が高くなります。それが私たちの焦点です – 小さなモデルを使用して実際のワークフローに対処します。」
SLMSは、迅速で効率的な意思決定が必要な場所で動作します。たとえば、いくつかの小さなモデルが協力するエージェントベースのワークフローなどです。また、化学やヘルスケアなどのドメインでもうまく機能します。
Botevによると、「DNAまたは化学構造を理解するために大規模なモデルをトレーニングする「壊滅的な忘却」リスク – 既存の能力を失う場合。
さらに、SLMはマンモスのエネルギー節約を提供します。 Botev共有:
「1Bパラメーターモデルは、400Bの1よりもはるかに少ないコンピューティングが必要です。これは、60,000倍のリソースが60,000倍少ない可能性があります。 彼らはそうです 安くだけでなく、環境に優しいだけではありません、ヨーロッパの持続可能性の目標と一致しています。」
ヨーロッパの利点としての透明性とコラボレーション
Botevによると、 オープンソース Deepseekのようなプロジェクトのおかげで、コラボレーションが爆発しています:
「彼らはオープンソースの蒸留方法を持っています。これにより、人々は大きなモデルから小さなモデルを構築できます。現在、10,000を超える蒸留モデルがあります。 顔を抱き締める。
強化学習も効果的であることが証明されています。それはカスタマイズには巨大です。
しかし、ヨーロッパでは、安全性、ガードレール、効率的なシステムに関する専門知識があります。それを倍にする必要があります。」
Abildgaardは、ヨーロッパの新興企業がオープンアクセス出版からインスピレーションを得ることができると示唆しました。
“私fあなたはEUの資金を得る、 多分 仕事の一部、特に基礎的なモデルをオープンソーシングする必要があります。 それはコラボレーションと透明性を促進します – ヨーロッパが率いる地域。」
コラボレーションに関しては、Iris.aiが提携しています Sigma2 として は 提供する責任 計算科学のための国家e-frastructure ノルウェー、 これは、高性能コンピューティング(スーパーコンピューティング)および研究および教育目的のための大規模なデータストレージのサービスを提供します。
同社はSigma2を使用して小さなモデルをトレーニングおよびドメインに適応させます(1〜9Bパラメーター)、、 システムコンポーネントを評価します。
ボトフによると、評価 しばしば見落とされています「しかし、複数のエージェントと検索層を備えたスケーリングシステムにとって、それは計算集約的で重要です。」
アイリスは最近、新しいビジネスラインを立ち上げました – 強力な RAG(検索充電された生成)システム、 10年 作品で。 Botevによると、Iris-AiのRAGシステムはエージェントベースで詰め込まれています 小さい モデル。
より多くのSLMが必要です
そうは言っても、slms(または、 確かに、 LLMSの地元の競合他社)は、ヨーロッパで出現するのが遅かった。
1つの傑出した会社です 麦芽AI (スコットランド)、大きなモデルの出力を取り、それらをより小さなモデルに蒸留します。そのテクノロジーにより、企業は10〜100倍のコスト削減でドメイン固有の問題を解決する小言語モデル(SLM)を適用できます。何千ものタスクを適度にうまく行う代わりに、麦芽AIのSLMは1つを行います タスク ほぼ完璧です。
スケールだけを追いかけるのではなく、ヨーロッパは擁護することでリードする可能性があります 頭いい、オープンで持続可能なAI。 それは投資を意味します 基礎モデルだけでなく、 アジャイル開発、コラボレーション、微調整を可能にするエコシステム。 最終的に、ヨーロッパのAIの未来は、最大のモデルを構築することではなく、最も賢く、最も専門的なモデルを構築することではありません。