Meta、革新的な物体検出 AI モデル「SAM」と比類のないデータセットを発表
Facebook の親会社である Meta は、人工知能の世界への最新の進出を発表しました。 「Segment Anything Model」と名付けられた Meta の新しい AI モデルは、画像またはビデオ内の個々のオブジェクトを驚くべき精度で識別して分離できます。
Meta によると、「Segment Anything Model」は単なるツールではありませんコンテンツ作成と写真編集用。それは私たちの周囲の世界の見方や関わり方を変える可能性があります。画像内の個々のオブジェクトを識別するこのツールの機能は、AR (拡張現実) から科学研究に至るまでの業界に多くの可能性をもたらします。
新しい AI モデルを発表することに加えて、Meta はまた、画像アノテーションの画期的なデータセット。この種のデータセットの中で最も包括的であると Meta が主張するこのデータセットには、日常の家庭用品から複雑な科学画像に至るまで、膨大な数のオブジェクトやシナリオに対する注釈が含まれています。
Meta の SAM AI モデルは、自身が持つオブジェクトを認識できます。 't Been Training on
SAM の特徴は、トレーニングされていないオブジェクトを識別する機能であり、市場の他の AI モデルよりも優れています。ユーザーは、SAM のシンプルで使いやすいインターフェイスを使用して、ビデオや画像内の項目をタップするか、テキスト プロンプトに応答することで選択できます。
最近のデモンストレーションでは、新しい AI ツールが写真でテストされました。数匹の猫が含まれています。ツールがオブジェクトをどの程度正確に識別できるかを確認するために、ユーザーはプロンプトとして「猫」という単語を入力するだけでした。数秒以内に、このツールは写真内の各猫の周囲にボックスを検出して描画し、物体を簡単に識別する優れた能力を示しました。
関連記事: Say Hello To Chat GPT 4 – より賢い AIボット
SAM の仕組み
SAM は、新しいデータセットと少数ショットの学習を実行できる基礎モデルです。プロンプト手法を使用したタスク。モデルは、前景/背景ポイント、ラフ ボックス、マスク、自由形式のテキストなど、任意のプロンプトに対して有効なセグメンテーション マスクを返すことができます。アノテーターが SAM を対話的に使用できるようにするには、モデルは Web ブラウザーの CPU 上でリアルタイムで実行する必要があります。 SAM は、画像エンコーダー、軽量エンコーダー、軽量デコーダーを使用して、セグメンテーション マスクをわずか 50 ミリ秒で予測します
SAM についてメタは何を言っているのか
写真にタグを付けたり、禁止されている素材を管理したり、Instagram や Facebook で人々に投稿を提案したりするために、同社はSAMと同様のテクノロジーを採用してきました。 SAM のリリースにより、このようなテクノロジーへのアクセスがより幅広いユーザーに拡大されます。新しい AI モデルとデータセットは、非営利ライセンスに基づいて同社の Web サイトからダウンロードしてアクセスできます。デモの申請者は、画像をアップロードする際に、研究目的でのみツールを使用することに同意する必要があります。
さらに、SAM モデルは科学研究にも応用できる可能性があります。これは、研究者が宇宙や地球上で発生する自然現象のビデオ録画の中から特定の物体や動物を特定して監視するのに役立つ可能性があります。
このような最新のテクノロジー ニュース、リスト、トラブルシューティング ガイド、および関連するヒントとテクニックの詳細については、こちらをご覧ください。 Windows、Android、iOS、macOS の場合は、 と Pinterest でフォローしてください。
読み取り: 2