BeatpulseLabs が AI トレーニング データを拡張するために 180 万ドルのプレシードを調達

BeatpulseLabs は、専門家による人間の判断を高度なマルチモーダル AI モデル用の忠実度の高いトレーニング データセットに変換する、ロンドンを拠点とする AI データ会社で、プレシード資金として 180 万ドルを調達しました。このラウンドはAraya VenturesとLighthouse Venturesが共同主導し、Alumni VenturesとAvalancha Venturesが参加した。

この資金調達の発表は、高品質の専用 AI トレーニング データに対する企業の需要の高まりを反映して、BeatpulseLabs が 2026 年上半期に収益が 10 倍に成長すると報告している中で行われました。

企業によるマルチモーダル AI の導入が加速するにつれて、企業は増大する課題に直面しています。生データへのアクセスは豊富にありますが、人間の専門知識、コンテキスト、意思決定を正確に捉えるデータセットの作成は依然として大きなボトルネックとなっています。 BeatpulseLabs は、組織がドメイン固有の知識を本番環境に対応したトレーニング データに変換できるよう支援することで、このギャップに対処しています。

南アフリカ人のジェイソン・リーフ氏とブルガリア人のニコライ・ヴィタノフ氏によって設立された BeatpulseLabs は、人工知能の根本的な限界に対処するために設立されました。多くのマルチモーダル モデルは、注釈が不十分なデータセットや汎用的なデータセットでトレーニングされ続けており、コンテキストや微妙な人間の判断が重要となる現実の環境で確実に実行する能力が低下しています。

Vitanov 氏によると、エンタープライズ AI は、管理されたテスト環境から現実世界の運用に移行するときに、課題に直面することがよくあります。同氏は、BeatpulseLabs は、個々のビジネスが実際にどのように機能するかを反映するトレーニング データを作成することでこの問題に対処していると述べました。

私たちは、音楽、ビデオ、音声など、最も要求の厳しいマルチモーダル ドメインのいくつかでこのアプローチを証明しました。ロボット工学から知識労働に至るまで、エラーの許容範囲が低いあらゆる場所に同じ論理が当てはまります。一般的なトレーニング データを使用することは、自信に満ちた見知らぬ人にビジネスの意思決定を任せるようなものです。お勧めしません。

BeatpulseLabs は、データセットの準備とデータセットのプロビジョニングという 2 つの統合サービスを提供します。同社は、機械学習アプリケーション用に生の音声、音楽、ビデオ資産をクリーニング、構造化、ラベル付け、検証、強化、フォーマットすることにより、既存のマルチメディア コンテンツ ライブラリをエンタープライズ グレードの AI トレーニング データセットに変換します。また、独自のコンテンツ アーカイブのみに依存せず、高品質のトレーニング データを求める組織向けに、既製の権利クリア済みのカスタム データセットも提供します。

これらのデータセットは、モデルのトレーニング、微調整、強化学習、評価をサポートするように設計されており、AI システムがより高い精度、コンテキスト認識、信頼性で動作できるようになります。

Rieff氏は、AIシステムの能力は主にトレーニングデータの品質によって決まることを強調し、現在使用されているデータの多くは広範囲で一貫性がなく、企業のユースケースには注釈が不十分であると指摘した。

私たちは、生のマルチメディア コンテンツを、AI システムがパターンだけでなくコンテキストを理解できるようにする、構造化され、注釈が付けられた、モデル対応のデータセットに変換することで、不足しているデータ層を構築しています。大量のコンテンツに広範なラベルを適用する従来のアプローチは、次世代 AI にはもはや十分ではありません。

この資金は、高品質でドメイン固有の AI トレーニング データに対する需要が高まる中、BeatpulseLabs がプラットフォームと顧客ベースを拡大するのを支援します。