Neuphonic、テキスト読み上げ音声 AI に 300 万ポンドを調達

世界最速のテキスト読み上げ技術で人間と AI のコミュニケーションを再定義する英国のスタートアップ企業が、プレシード資金で 300 万ポンドを調達した。このラウンドを主導したのは、 ムーンファイアVC、チーム内のエンジニアの割合に基づく世界トップ 10 のデータドリブン VC の 1 つであり、Tiny VC、Salica Oryx Fund、および Cur8 Capital が参加しています。

これまで、会話型 AI の可能性は、技術的な大きな制約によって妨げられてきました。テキスト読み上げモデルは大きすぎ、速度が遅く、高価で、不自然な響きが大きいということです。 Neuphonic はこれを変えます。特許出願中のアルゴリズムにより、わずか 25 ミリ秒の超低遅延でリアルタイムの増分音声生成が可能になり、世界最速のテキスト読み上げソリューションになります。この増分手法により、Neuphonic は、より人間らしく、言語に依存しない方法で、あらゆる大規模言語モデルを操作できるようになります。 Neuphonic の API は、独占的なクローズド ベータ プログラムを通じて、自社の製品で人間のような音声を作成したい顧客が利用できます。

「音声 AI の遅延が長いと、自然な対話が妨げられ、ゲーム、会話型 AI、デジタル アバター、リアルタイム翻訳などの主要分野の成長が遅れます」とニューフォニックの共同創設者兼 CEO のソハイブ アーマドは述べています。 「その結果、人々は音声 AI と実際に対話することに苦労しています。私たちは、AI が私たち自身の自然な延長のように感じられる、つまり直感的かつ簡単に感じられる段階に到達したいと考えています。理想的には、人々は画面を見つめる時間を減らし、実際のコミュニケーションに多くの時間を費やします。」

Neuphonic は、Papercup の元共同創設者 Jiameng Gao と元ヘッジファンド クオンツ トレーダーの Sohaib Ahmad によって設立されました。両氏はケンブリッジ大学で機械学習を学んでいたときに知り合いました。中国、アイルランド、パキスタンにルーツを持つ多言語を話す第一世代の移民であるソハイブとジアメンは、言語の壁と文化の微妙な違いについて独自の洞察力を持っており、それが彼らを音声テクノロジーへの情熱と並行してニューフォニックを開発し、課題を解決するきっかけにしました。既存のテキスト読み上げソリューションが直面している問題。

「テキストが到着すると一語一語音声を生成することで、以前は不可能だった Text-To-Speech の幅広い使用例が可能になります。現在、カスタマー サービス、デジタル レセプション、ヒューマノイド ロボット工学などの企業と協議中です。 、エドテック、ストーリーテリング、コンテンツ作成により、速度の向上を超えて、人間の会話と同じくらい自然で応答性の高い AI インタラクションを作成できるようになります」と Neuphonic の共同創設者兼 CTO である Jiameng Gao 氏は付け加えました。 「人々が即座に話すのと同じように、私たちのモデルは完全な文の必要性を回避し、そうすることで待ち時間を大幅に短縮します。」

Moonfire のパートナー、アクシャット ゴエンカ氏は、「音声 AI は眠っている巨人であり、ニューフォニックが現在解決している技術的限界によって足止めされています。そのテクノロジーには、複数の業界にわたって大きな価値を引き出す可能性があります。顧客サービスにおいては、より多くのことが可能になる可能性があります」とコメントしています。コンテンツ クリエーターにとって、デジタル アバターや AI ゲームなどの新興分野において、Neuphonic のソリューションはイノベーションの触媒となる可能性があります。これらの分野だけでなく、それ以外の分野にも応用できるようになり、最終的にはこれまで不可能だったまったく新しいビジネス モデルやユーザー エクスペリエンスが可能になる可能性があります。」

「リアルタイム音声合成におけるニューフォニックの画期的な進歩は、人間と機械のインタラクションにパラダイムシフトを引き起こすでしょう」と情報工学名誉教授でケンブリッジ大学の元上級副学長であるスティーブ・ヤング CBE 教授は述べています。 「遅延を人間に近いレベルまで短縮することで、日常生活のさまざまな側面で画面に代わるシームレスな音声インタラクションへの道が開かれます。」ニューフォニック社の現在の資金調達におけるアドバイザー兼投資家であるヤング教授は、同社が音声技術の将来を再定義する可能性があることを強調した。

ロンドンのキングスクロスに本社を置くニューフォニックは、この資金を言語機能と音声サービスの拡張、研究の拡大によるモデルのパフォーマンスの向上、オンデバイスソリューションの開発に使用する予定です。チームが成長し、数百の潜在的なユーザーと企業の待機リストを抱えている同社は、2030 年までに 413 億 9,000 万米ドルに達すると予測される音声 AI 市場で急速な成長を遂げる立場にあります。