Scale AIとは | テック業界の新鋭、米ユニコーン企業に注目
AI技術の発展とともに、アメリカを中心にさまざまなプラットフォームやアプリケーションが台頭しています。今回はその中から、堅調な資金調達と契約を獲得し続けているテック企業の新鋭「Scale AI」を解説します。Scale AIはAI開発に欠かせないアノテーション代行を中心に、アメリカのAI優位性に貢献している企業です。
目次
Scale AIとは?
Scale AIは「AI開発を加速させる」をミッションに掲げ、データラベリングおよび機械学習モデルのトレーニングデータを提供するアメリカのユニコーン企業です。ユニコーン企業とは評価額10億ドル以上・設立10年以内の未上場ベンチャーを意味します。
サンフランシスコに本社を置き600人以上の従業員を擁するScale AIは、2016年に設立され、創業当初は機械学習プロジェクトにおける「データのラベリング(アノテーション)」代行プラットフォームを中心におこなっていました。その後、キュレーションやクリーンアップ、機械学習モデル構築と監視の支援などサービスを拡張し、現在ではマイクロソフトやOpen AIなど有名企業を中心に300以上の企業に導入されています。
事業の成功や拡大のために多くのスタートアップやベンチャーが頭を悩ませるのが資金調達の問題ですが、その画期的なシステムと展望でコンスタントに投資を獲得し続けているのがScale AIです。創業4年目には総額100億円を達成しているほか、2022年には米国防衛省からも契約を獲得しています。直近ではロシアのウクライナ侵攻において衛星画像から被害状況を分析するなど、ビジネス以外のシーンでも利用されています。
創業者 アレグザンダー・ワンCEO(最高経営責任者)のプロフィール
Scale AIを語るうえで欠かせないのがCEOであるアレグザンダー・ワン(Alexandr Wang)氏の存在です。幼少期から天才と言われたワン氏は米マサチューセッツ工科大学でコンピューター科学と数学を学び、ソフトウエアエンジニアやアルゴリズム開発者として米ベンチャーなどに参画したのち、19歳のときにScale AIを創業しました。2019年には米フォーブス誌の「AI50」ランキングにおいて、アメリカでもっとも将来有望なAI企業50社の1つに選ばれ、25歳で史上最年少のビリオネア(個人資産が10億通貨単位以上の人)となった注目の人物です。
Scale AIの顧客リスト
偏りのない高精度なトレーニング データを提供するScale AIの顧客リストには自動運転領域の主要企業やメガスタートアップなど、多くの企業で採用されています。
下記は、Scale AIの顧客リストの一例です。
- Microsoft
- Meta
- OpenAI
- Adept
- GM
- Toyota
- Nvidia
- Zoox
- Aurora
- Nuro
- OpenSea
Scale AIのソリューション
Scale AIはソフトウエアと人を組み合わせたデータのラベリングサービスを提供しています。具体的には顧客がAPIを通して生のデータ(テキスト、静止画、動画など)をScale AIに送ると、Scale AIが受け取ったデータを自動でタグ付けします。そして最後に社員がデータのクオリティチェックをして、顧客へ納品します。顧客は受け取ったタグ付けデータを活用して、AIモデルを構築します。
アノテーションの重要性
この作業は機械学習アルゴリズムがデータを理解し、パターンを識別できるようにするために重要なプロセスです。たとえば画像認識の場合、画像内の物体や特徴を正確に識別するために、画像にラベルを付ける必要があります。テキストの場合、文章内の感情やトピックなどにラベル付けをおこないます。
昨今、ビッグデータの活用が重要視されAI市場が活発化しています。そしてAI開発の作業に欠かせないのがアノテーションです。アノテーションを用いてデータを分類したりパターン化したりすることで、AIモデルの品質や性能が向上します。
ASTUTE ANALYTICAが公開しているレポートによると、日本におけるアノテーションの市場規模は2030年に13億6380万米ドルに達すると予測されています。2023年から2030年までの予測期間中に約2.7倍の成長率が期待されており、今後も新たなアノテーションツールやソフトウェアが登場するでしょう。
参考:Astute Analytica プレスリリース|PR TIMES
Scale AIが提供するサービス
本章では、Scale AIが提供する具体的なサービスを解説します。
- Scale Data Engine
- GenAI プラットフォーム
- ドノバン
それぞれについて見ていきましょう。
データエンジン
Scale AIのデータエンジンを活用すると、企業は独自のカスタムモデルを効率的に構築できます。また、モデルの障害を簡単に検索・分類・修正できるため、コストパフォーマンスを高めることも可能です。世界トップレベルの高品質なラベルを用いてモデルをトレーニングすることで、効率的なAI構築に貢献します。
GenAI プラットフォーム
Scale AIは独自のデータでカスタマイズされたプラットフォームを使用して、Generative AIの取り組みを拡張できます。たとえばOpenAI、Cohere、Metaなど主要なクローズドおよびオープンソースの基盤、埋め込み、再ランキング、補完モデルのカスタマイズ、テスト、デプロイが可能です。クラウド上であらゆるモデルのデータを使用して、組織全体が最適化されたソリューションを構築できるようにします。
ドノバン
Scale AIは安全保障に特化したプラットフォーム「ドノバン」を提供しています。防衛およびインテリジェンスのAIデジタル参謀として意思決定を改善し、洞察を明らかにし、ミッションの成功を達成するために従来のワークフローを迅速化します。電子メール、インテリジェンスレポート、注文、衛星画像などあらゆる種類のデータを取り込むことが可能です。
Scale AIを利用するメリット
さまざまなAI開発ツールがある中で、Scale AIが選ばれている理由には以下の2点が挙げられます。
- 高品質のラベル
- 万全のセキュリティ体制
それぞれについて見ていきましょう。
高品質のラベル
どのようなアノテーションプラットフォームを使用する場合でも、その性能を最大限に活用するには、データラベルの品質を最大化することが重要です。ここではScale AIの特長として以下の3点を解説します。
- 可能な限り高品質のデータを収集する
- 最適なラベル付け担当者を振り分ける
- 人力と機械を組み合わせる
可能な限り高品質のデータを収集する
Scale AIは可能な限りデータに一貫性を持たせ、モデルの有用性を低下させる可能性バイアスを回避することで、その精度を高めています。また、データ収集パイプラインをラベル付けパイプラインに統合し、作業時間を最小限に抑えています。
最適なラベル付け担当者を振り分ける
Scale AIでは、ラベル付けに最適な担当者を選定することに注力しています。ラベル付けが適切な言語を話せるか、特定の地域の出身者であるか、また特定の分野に精通しているかなどを確認したうえでプロセスを進めています。
人力と機械を組み合わせる
既知のシステムを使えばラベル付けを自動化することは容易ですが、人間参加型のプロセスを選択することで信頼できる最高品質のデータを実現しているのがScale AIです。前述のとおり、Scale AIはAPI経由で送られてきたデータを自動処理でソートとラベル付けしたのち、人力でクオリティチェックをおこないます。
引用:Scale AIの機械学習モデル|scale
万全のセキュリティ体制
Scale AIの製品は顧客のニーズに合わせてアクセス制御を拡張できるほか、堅牢な管理や外部監査、テストをおこなっています。また最先端のセキュリティ技術を導入して、セキュリティ業界の標準と、ベストプラクティスを常に最新の状態に保ち、あらゆるセキュリティの脅威から顧客を守っています。
Scale AIが認定を取得しているセキュリティ基準やフレームワークは以下のとおりです。
- SOC 2 タイプ II
- 国防総省 IL4 暫定認可
- ISO27001
- FedRAMP (高) ※許可申請中(記事公開時点)
Scale AIが懸念されている課題点と今後
Scale AIは、競合他社より“安くて速い”ことが強みでもありますが、ラベル付けの作業をケニアやフィリピンなどの外部委託業者に発注しています。また、その多くが賃金水準の60〜70%以下の報酬で雇われており、このようなブルーカラー的な仕事のうえに成り立っている仕組みを揶揄する声もあるようです。さらに競合他社が次々と台頭し、市場が活発化するだけでなく、絶対的な優位性に懸念が生じています。
一方でScale AI側は「彼ら(ラベル付けをおこなう労働者)の生活賃金の支払いに取り組んでいる」と主張していますが、本質的な課題解決については述べられていません。これまでにワン氏はいくつかのインタビューで「彼らは強力なAIシステムを構築するプロセスにおいて非常に重要な存在である」とし、今後も人間参加型のアノテーションを継続することを示唆しています。
2024年に入り「TikTokとの提携を断念」というニュースが報じられていましたが、ワン氏は現在も企業の成長に向けてさまざまな挑戦を続けているようです。
Scale AIの活用事例
引用元:https://scale.com/data-engine
Scale AIは国内外でさまざまな用途に活用されています。本章ではいくつかの代表的な事例を紹介します。
自動運転技術
自動運転技術の開発において、大量のセンサーデータやカメラ画像のラベル付けは必要不可欠な作業です。
Scale AIは自動車メーカーや自動運転技術企業に対し、道路や交通標識などのオブジェクトの検出・追跡、道路のセグメンテーション、障害物の認識など自動運転に必要なデータのラベル付けを提供しています。これまでにトヨタ・リサーチ・インスティチュート、General Motors、Lyftといった自動運転分野で活躍している企業と提携した実績があります。
ChatGPT
Sacle AIが世界的トレンドとなった生成AI「ChatGPT」の開発で大きな役割を果たしたのは周知の事実です。ChatGPTの開発にあたって、画像・文字・声・動画など大量のデータを生成AIに読みこませる過程でデータを整理して分類する必要がありますが、その役割をSacle AIが担っています。
ユーザーの声
Sacle AIの公式サイトに掲載されている顧客のコメントをいくつか紹介します。Sacle AIのどのような点に魅力を感じているのかを知るために、参考にしてください。
クラウド型CTIシステム(コールシステム)Goodcall:
「モデルの改善に関しては、すべてのパーセンテージポイントが重要です。100,000件の通話が1%改善されるということは、1,000人のエクスペリエンスが向上することを意味します。今回Scale Rapidと連携し、わずか3か月で5%の改善を経験しました。」
ハーバード大学医学部のダッタ研究室:
「Scale Rapidを使用することでデータのラベル付けが数週間から一晩という速さで完了しました。私たちは今、新たな興味深い問題にリソースを費やすことができます。」
まとめ:Scale AIで品質とセキュリティを向上しよう
Scale AIはAI開発に欠かせないラベル付け=アノテーションや機械学習モデルの構築などを提供しており、AIによる効率化を検討している企業にとっては今後も注目の企業です。
Scale AIがどのように課題解決を支援できるかは、企業の課題や状況によって異なりますが、産業分野にかかわらずデータを扱うすべての企業が対象となります。
Scale AIのようなAIを活用した取組みは各社で取組みが進んでいます。
ギャプライズではAIを用いたWebにおけるデータ分析ツールの選定や導入に関するアドバイスも可能ですが、ツールの導入だけでなく、お客様のマーケティング課題に応じたトータルソリューションをご提案することを得意としています。
データとテクノロジーを活用した、効果的なマーケティング活動の実現に向けて、ぜひギャプライズをご利用ください。お客様のマーケティングのDX化を、チーム一丸となってサポートいたします。
お気軽にお問い合わせください。
今本 たかひろ/MarTechLab編集長
料理人→旅人→店舗ビジネスオーナー→BPO企業にてBtoBマーケティング支援チームのPLを4年半経験し、2023年2月よりギャプライズへジョイン。フグを捌くのもBtoBマーケティングを整えるのも根本は同じだという思考回路のため、根っこは料理人のままです。家では猫2匹の下僕。虎党でビール党。