Rozdělit cokoliv, nedávno vydaný společností Facebook Research, dělá něco, co většinu lidí ponořených do počítačového vidění zaráží: spolehlivě vědět, které pixely na obrázku patří objektu. Usnadnit to je cílem modelu Segment Anything Model (SAM), který byl nedávno vydán pod licencí Apache 2.0.
Výsledky vypadají skvěle a jsou Interaktivní prezentace k dispozici Můžete si hrát s různými způsoby fungování SAM. Je možné vyzvednout věci tak, že na obrázek ukážete a kliknete na něj, nebo lze obrázky automaticky rozdělit. Upřímně řečeno, je působivé vidět, jak SAM dělá maskování různých objektů na obrázku tak snadné. To, co to umožňuje, je strojové učení a součástí toho je fakt, že model za systémem byl trénován na obrovském datovém souboru vysoce kvalitních obrázků a masek, díky čemuž je v tom, co dělá, extrémně efektivní.
Jakmile je obraz segmentován, lze tyto masky použít k interakci s jinými systémy, jako je detekce objektů (která identifikuje a označí, co objekt je) a další aplikace počítačového vidění. Tento systém funguje mnohem účinněji, pokud skutečně vědí, kde hledat. tento Blogový příspěvek od Meta AI Jde do dalších podrobností o tom, co je možné se SAM, úplné podrobnosti v výzkumný papír.
Takové systémy se spoléhají na vysoce kvalitní datové sady. Samozřejmě nic nepřekoná spoustu skutečných dat, ale také jsme viděli, že je možné generovat automatizovaná data, která ve skutečnosti neexistovala, a získat užitečné výsledky.
„Obhájce Twitteru. Zombie fanatik. Hudební fanoušek. Milovník cestování. Webový expert. Pivní guru. Kávový fanatik.“