Good Tapeと呼ばれるジャーナリストの痛みに触発されたチームによって設立された転写のスタートアップについて学んだとき、私の興味はピークにされました。私は10年以上にわたって転写ソフトウェアのさまざまな反復を使用しています。
私の最も苦痛な経験の1つは、シリコンバレーの出版物のIoTビートをカバーしている間、何年も前のことでした。当時最も最新の機械学習の組み込みソフトウェアは、話されたすべての「IoT」を「コヨーテ」に変換します。私が会社に連絡し、解決策を請いをするまで続いた痛みを伴う問題。
そこで、CEOのLasse Finderupに話しかけて、スピーチをテキストに変換するAIを搭載した転写を専門とする先駆的なコペンハーゲンに拠点を置くスケールアップ会社であるGood Tape About Good Tapeについてすべてを学びました。世界中で250万人のユーザーが信頼している間、1,000万個以上のファイルを転写しています。 2年以内に200万ドルのARRに達しました。
ほとんどジャーナリストを泣かせます
Finderupによると、同社は本当のニーズから生まれました。
「このアイデアは、デンマークのデジタル新聞であるゼトランドのIT部門にいた男から来ました。彼は昼休みの間にジャーナリストの隣に座っていました。
関係することができます。私はかつてインタビューを書き起こすために私に100ユーロを支払う同僚がいました。ソフトウェアは非常に信頼できなかったため、年齢がかかりました。私は貧しく、仕事が必要でした、そしてそれは間違いなく困難なスローでした!
Finderupによると、彼の同僚は本当のオープンソースオタクであり、その頃、ささやきモデルが出てきました。彼はゼトランドのCEOに、一緒に何かをハッキングすることを試みることができるかどうか尋ねました。彼らは言った、「あなたがこれを解決できるなら、先に進んでください。」
それで彼はそうしました。最初は、ファイルをフォルダーにドラッグするだけで、明日の朝、準備ができていました。 finderup共有:
「それを使用した最初のジャーナリストの1人は、ほとんど泣きそうになりました。彼はそれがすぐに行われたとは信じられませんでした。彼はCEOに行って、彼に試して、それ以上に何かをしてやるように言いました。
プライバシーの問題は過小評価されています
ただし、翻訳の唯一の課題ではありません。セキュリティ、プライバシー、ユーザーエクスペリエンスに関連する課題もあります。
ジャーナリストとして、私たちは転写を速く、正確で、私的であることを望んでいます。多くのユーザーは、転写サービスでデータがどのように使用されているかについての懸念を提起しています。
たとえば、Revのような大きな転写プレーヤーは、ユーザーのデータを「永続的に」、「匿名で」利用してAIシステムを訓練します。アカウントを削除しても、その情報についてAIをトレーニングします。
これは、ジャーナリストとして内部告発者とのインタビューを転写している場合、または専有情報を含む可能性のある職場会議の場合のインタビューをしている場合、大きな懸念事項です。
転写サービスはどのようにプライバシーにアプローチしますか?
Finderupによると、業界には2つのアプローチがあります。これは、公開データに依存するオープンソースモデルと、プライベートデータでトレーニングされた閉鎖モデルです。
「私たちは最初のルートを選びました。私たちは非常に明確です。あなたのデータに触れません。それが私たちの最大の差別化要因です。
「私たちはまた、商業目的であなたの個人情報を第三者と共有、販売、レンタル、または交換することもありません。」
優れたテープは、機密性の高いソースや資料を処理するときに機密性を優先し、顧客の転写ファイルがAI学習に使用されないようにします。さらに、プラットフォームは業界標準の暗号化を採用し、欧州連合内ですべてのファイルを安全に処理し、完全にGDPRに準拠しており、プレミアムアカウントパッケージの一部としてデータ保護契約を提供します。
「私たちはゲームではなくコンソールです」というレースでの転写のレースで
転写のもう1つの一般的な問題はアクセントです。転写モデルのパフォーマンスは、どの程度、どのようなデータをトレーニングしているかに直接結び付けられています。はい、多くの利用可能なデータを備えた英語と主要言語は、特にさまざまな方言やアクセントを使用して、はるかに優れたパフォーマンスを発揮する傾向があります。
会議の人々のグループはすべて英語を話している可能性があり、オーストラリア人、スコットランド、非ネイティブの話者の間の地域のアクセントは、痛みの世界につながる可能性があります。そして、これをグローバルに拡張すると、疑問が生じます。小さな言語や多様な方言のための十分なトレーニングデータがありますか?
さらに、エストニアやウクライナ人などの小言語、または地域の方言でさえ、トレーニングに利用できる高品質のデータが十分にないため、多くのモデルも機能しません。
Finderupによると、Good Tapeのモデルはオープンソースコミュニティに依存していますが、同社は事前処理オーディオ、ファイル形式、ノイズリダクション、サイレンスに多くの作業を行っています。
「ベースモデルは「PlayStationゲーム」であり、私たちはそれを実行する「コンソール」です。
より多くのデータがあるため、英語は最適です。しかし、私たちはこれを機会の瞬間と考えています。特にヨーロッパでは、プライバシーに配慮することが競争上の利点になります。」
Finderupによると、UXの観点から、「プラットフォームの機能が不足しているため、際立っています。
「Wetransferのように、ドラッグアンドドロップのようなものをシンプルに保ちます。それがデータプライバシーを損なうため、概要のためにOpenaiやChatGptと統合することはありません。すべてを安全に保ちながら、概要と転写チャットを提供する独自の社内言語モデルを立ち上げました。」
たとえば、ソースへのアクセスを維持しながら、概要を生成して転写とチャットできます。
「ユーザーの旅の初めには、プロセスを例に挙げましょう。記事を書くときに最初に行うことは、私たちが今やっていることです。会話をすることです。もちろん、あなたはそれを転写します。
良いテープのアプローチアプローチは、その旅の各ステップを徐々にサポートすることです。最初の焦点は品質保証でした。転写が正確であることを確認し、耳を傾け、編集を行い、出力を信頼することができます。
「次に、要約を生成する機能を追加しました。そして今、あなたは実際にあなたの転写とチャットすることができます。ユニークなのは、私たちの社内言語モデルを使用すると、転写産物から直接クリック可能なソースを提供することです。
モデルが「ラッセはマイクロソフトが嫌いだと言った場合、「あなたは文脈で元の引用をクリックして見ることができます。実際に「マイクロソフトがこれを行うのが嫌いだ」と言っています。それはすべて透明性と信頼についてです。」
優れたテープは、独自のLLMを持つことで際立っています。つまり、Open AIのような大企業の決定に依存していないことを意味します。
また、人々のグループにインタビューするという一般的なインタビュアーの問題を解決します。それは、見積もりのどの部分から来たのか、誰が何を言ったかを正確に示します。
「私たちはスピーカーラベルでそれを早く解決しました。最初の名前である「Cate Said…」という名前に言及した場合、システムはそのパターンに従います。
飽和市場でのサービスに関しては、私はいつもチャーンについて疑問に思っていましたが、Finderupは、最初はチャーンが高かったのに、改善していることを共有しました。
「この分野の誰もが同じパターン、つまりユーザーの成長を増やしているだけでなく、急速なドロップオフも見ています。」
転写の将来の観点から、Finderupは、この技術はすでに非常に優れており、将来の改善は小さいと主張しています。彼は、ジャーナリストがソースの引用を必要とするような、特定のユーザーの特定の機能に関する大きな機会があると考えています。転写は商品になります。勝者は、その周りに有用なものを構築する人です。
飽和市場でどのように成長しますか?
他のソフトウェアサブスクリプション内に豊富なスタンドアロンと組み込みソリューションの中で、同社は信頼を通じて成長しました。 Finderupは、「デンマークに拠点を置く – およびEUが役立つ」と主張する。
「私たちがGDPRに準拠しているからといって、多くの企業がサインオンしています。また、サインアップせずに人々に製品を試してもらうこともできます。私たちはそれ自体を話すことを信頼しています。」
さらに、ズームや転写機能を追加するチームなどの大きなプラットフォームは、転写が可能であることをユーザーに教育し、人々がより良いツールを探しているという点で、会社を実際に支援します。 Good Tapeのトップマーケットの1つは台湾です。これは、中国の転写ツールが不足していたため、安全な代替品を望んでいたからです。
同社は、刑事事件を転写するためにチリの裁判所制度と提携しています。
「それは大きな瞬間でした。私たちは安全であることを絶対に確信しなければなりませんでした。」
AIが進化するにつれて、どのような課題に直面しましたか?
Finderupは、「正直なところ?遅くなるのは難しいです。角を切ることで派手な機能を追加する競合他社を見ると、魅力的です。しかし、私たちは物事をシンプルで適切に保ちます。
「私たちはこれについて多くの内部で話します。新しい機能を追加する時間、シンプルさにコストがかかります。それは私たちのコアバリューの1つです。
AIが非常に速く動いていると、実際の価値があります ない 急いで。そして、良いテープは今その見返りを見ています。
たとえば、良いテープがすべてが安全であると言うとき、それはそれを意味します – それは独自の大きな言語モデルをホストしているためです。
「しかし、それはまた、概要機能を立ち上げるのに4か月余分にかかったことを意味していましたが、競合他社はChatGptにプラグインしてすぐに出荷されました。私たちは角を切りませんでした。それは意図的です。」
最初は、Openaiにはすべての力があったようですが、今では「ラッパー」、つまりトップにある建物がレバレッジを持っています。そして私たちのような企業。地面は絶えず変化しています。」
転写は、技術インフラストラクチャの商品化された層になるため、それはもはや精度だけではありません。それは信頼とユーザーエクスペリエンスについてです。プライバシーと明快さに対する優れたテープのコミットメントは、ジャーナリスト、研究者、および敏感な情報を処理する人のための単なる別のアプリ以上のものです。
そして、多分、ちょうど多分、それは他の誰も、彼らの記事が物事のインターネットについての作品で「コヨーテ」について話している誰かを引用する理由を編集者に説明する必要がないことを意味します。
リード画像:良いテープ。写真:クレジットされていません。