OpenPose nedir? Poz tahmininin temelleri

Günümüzde, görüntüler ve kameralar her yerde - telefonlarımıza, evlerimize ve hatta kamusal alanlara yerleştirilmiş durumda. Sadece anları yakalamak için değil, aynı zamanda etrafımızdaki dünyayı anlamamıza ve onunla etkileşime girmemize yardımcı olmak için de onlara güveniyoruz.

Sahne arkasında, yapay zekanın (YZ) bir alt alanı olan bilgisayarlı görüş , makinelerin görsel verileri yorumlamasını sağlayarak bunu mümkün kılar. Sistemlerin nesneleri algılamasına, yüzleri tanımasına ve hareketi izlemesine olanak tanır ve her gün kullandığımız birçok teknolojide önemli bir rol oynar.

Yapay zekadaki son gelişmeler sayesinde, bilgisayarlı görüş modelleri artık daha karmaşık verileri ve içgörüleri analiz edip çıkarabiliyor. Bunun bir örneği, insan hareketini anlamaya odaklanan bir bilgisayarlı görüş görevi olan poz tahminidir .

Görüntülerde veya videolarda omuzlar, dirsekler ve dizler gibi vücuttaki önemli noktaları belirleyerek çalışır. Bu, insanların nasıl hareket ettiğini analiz etmeyi mümkün kılar ve fitness takibi, animasyon, sağlık hizmetleri ve daha fazlasında uygulamalara olanak tanır.

Poz tahmini için geliştirilen birçok araç arasında OpenPose büyük bir atılım olarak öne çıkıyor. Carnegie Mellon Üniversitesi'ndeki Algısal Hesaplama Laboratuvarı'ndaki araştırmacılar tarafından yaratılan bu araç, yalnızca bir kamera kullanarak (kişi başına 135'e kadar anahtar nokta ile) birden fazla kişi için eller, ayaklar ve yüz anahtar noktaları dahil olmak üzere tüm vücut pozlarını gerçek zamanlı olarak tespit edebilen ilk açık kaynaklı sistemlerden biriydi.

Bu yazımızda OpenPose'u, nasıl çalıştığını ve bilgisayarlı görüş alanında bir dönüm noktası olarak önemini inceleyeceğiz.

Şekil 1. OpenPose kullanılarak çoklu kişi poz tahmini.

‍

Poz tahmininin tarihine bir bakış

Yapay zeka yaygın olarak benimsenmeden önce, videolarda insan hareketlerini izlemek için özel ekipman kullanmak gerekiyordu. Film ve animasyon gibi endüstrilerde, aktörler genellikle kameraların kontrollü bir stüdyo ortamında hareketlerini yakalayabilmesi için yansıtıcı işaretleyicilere sahip kıyafetler giyerlerdi.

Bu işaretleyici tabanlı hareket yakalama teknikleri doğru olsa da, pahalıydı ve belirli kurulumlarla sınırlıydı. Bilgisayarlı görüş geliştikçe, araştırmacılar işaretleyici kullanmadan vücut hareketini izlemenin yollarını aradılar. Görüntülerde insan şekillerini bulmak için kenarlar, konturlar ve şablonlar kullandılar.

Bu erken sistemler basit ve anlaşılır durumlarda işe yarıyordu ancak gerçek dünya senaryolarıyla mücadele ediyordu. İnsanlar beklenmedik şekillerde hareket ettiğinde veya bir karede birden fazla kişi göründüğünde genellikle kötü sonuçlar veriyorlardı.

2010'ların sonlarında, derin öğrenme poz tahmininde büyük bir değişime yol açtı. Görüntü AI modelleri, insan pozlarının büyük veri kümeleri üzerinde eğitilebilirdi. Kenarlara ve şablonlara güvenmek yerine, modeller binlerce etiketli görüntüyü inceleyerek vücut eklemlerini ve yapılarını tanımayı öğrendi. Bu, poz tahminini daha geniş bir ayar aralığında daha doğru, esnek ve etkili hale getirdi.

Şekil 2. 2017'den 2023'e insan duruşu tahmin modellerinin evrimi.

‍

OpenPose: Modern poz tahmininin başladığı yer

OpenPose ilk olarak 2017'de piyasaya sürüldü ve tek bir görüntüde aynı anda birden fazla kişinin pozlarını tahmin etme yeteneğine sahip. Eski sistemlerin aksine, OpenPose özel kıyafetler veya işaretleyiciler gerektirmez. Standart kameralarla çalışır ve görüntüleri ve videoları gerçek zamanlı olarak işleyebilir. Bu özellikler poz tahminini geliştiriciler ve araştırmacılar için daha erişilebilir hale getirdi

OpenPose'un bilgisayarlı görüş için attığı temel, diğerlerinin çeşitli diğer uygulamalar için daha yeni mimariler oluşturmasına yardımcı oldu. Günümüzde, poz tahmin görevlerini destekleyen Ultralytics YOLO8 ve Ultralytics YOLO11 gibi Vision AI modelleri daha hızlı sonuçlar ve daha düşük gecikme süresi sunar.

Şekil 3. Poz tahmini için YOLO11 kullanımı.

‍

Ancak, poz tahmininin nasıl evrimleştiğini merak ediyorsanız OpenPose başlamak için harika bir yerdir. Bugün hala birçok yeni sistemin dayandığı temel fikirleri tanıttı.

OpenPose'un temel yetenekleri

Artık OpenPose'un neden önemli olduğunu daha iyi anladığımıza göre, gerçekte neler yapabileceğine daha yakından bakalım.

OpenPose'un yeteneklerinin merkezinde anahtar nokta tespiti adı verilen bir şey vardır. Anahtar noktalar, burun ucu, omuzların merkezi, dirsekler, bilekler, kalçalar, dizler ve ayak bilekleri gibi insan vücudundaki belirli işaret noktalarıdır. OpenPose, parmaklar ve yüz hatları gibi ayrıntılı alanlar dahil olmak üzere kişi başına bu noktalardan 135'e kadarını tespit edebilir.

Bu noktalar birbirine bağlandığında, insan vücudunun basitleştirilmiş bir temsilini oluştururlar - bunu dijital bir iskelet olarak düşünebilirsiniz. Bu iskelet taslağı yalnızca bir kişinin nerede olduğunu değil, nasıl poz verdiğini de gösterir: oturuyor, ayakta duruyor, el sallıyor, gülümsüyor veya yürüyor. Bilgisayarlar, tıpkı birinin vücut dilini içgüdüsel olarak anladığımız gibi, bu iskeletleri kullanarak insan hareketini görsel olarak yorumlayabilir.

İskelet izleme özellikle yararlıdır çünkü arka plan gürültüsünü ve dikkat dağıtıcı unsurları ortadan kaldırarak sistemin tamamen insan duruşuna ve hareketine odaklanmasını sağlar. OpenPose her pikseli analiz etmek yerine, bir kişinin nasıl hareket ettiği veya etkileşimde bulunduğu hikayesini anlatan anlamlı noktalara yoğunlaşır.

OpenPose, bu yapılandırılmış bilgileri günlük görüntü veya videolardan çıkararak, hareketlere yanıt veren, fiziksel aktiviteyi izleyen, duygusal ipuçlarını değerlendiren veya hatta dijital karakterleri canlandıran uygulamalar oluşturmayı mümkün kılıyor.

OpenPose nasıl çalışır?

OpenPose'un görsel girdiden insan vücudundaki önemli noktaları nasıl algıladığı ve bağladığına dair genel bir bakış:

Bir görüntüyle başlar: OpenPose, bir fotoğraftan, videodan veya canlı kamera yayınından tek bir görüntü alır.
‍
Önemli vücut parçalarını tespit eder: Sistem, burun, dirsekler, bilekler, dizler ve ayak bilekleri gibi vücuttaki önemli noktaları arar. Sistemin bir vücut parçasının bulunduğundan emin olduğu her yerde işaretlenirler.
‍
Hangi parçaların bir araya geldiğini bulur: Ardından, OpenPose anahtar noktaların nasıl bağlandığını kontrol eder. Aynı kişiye ait olan eklemlerin hangileri olduğuna karar vermek için matematiksel hesaplamalar kullanır - örneğin, bir bileği sağ dirsek ve omuzla eşleştirmek.
‍
Her kişi için bir iskelet çizer: Anahtar noktaları gruplandırdıktan sonra, OpenPose bunları her kişinin pozunu gösteren bir "çöp adam"a bağlar. Bu, aynı karede birden fazla kişi göründüğünde bile işe yarar.
‍
Poz verilerini döndürür: Son olarak, algılanan tüm anahtar noktaların tam konumlarını sağlar. Bunlar, hareketi izlemek, jestleri tanımak veya etkileşimli araçlar oluşturmak için kullanılabilir - hepsi gerçek zamanlı olarak.

Şekil 4. OpenPose kullanılarak insan anahtar noktası tespiti ve takibi.

‍

OpenPose'u kullanarak sektörler genelinde poz tahmin uygulamaları

OpenPose, poz tahminini çeşitli gerçek dünya kullanım durumları için pratik hale getiren ilk gelişmiş araçlardan biriydi. Günümüzde gerçek zamanlı bilgisayarlı görüş çözümlerinde yaygın olarak kullanılmasa da, spor, eğlence, eğitim ve güvenlik gibi alanlarda erken çalışmaları şekillendirmede önemli bir rol oynamıştır.

Gelin bu alanlarda nasıl yol açtığına daha yakından bakalım.

Fitness ve spor için OpenPose ile poz tahmini

Beyzbol izlediğinizde, neler olduğunu anlamak kolaydır - bir atışı, bir vuruşu veya çalınan bir üssü anında tanıyabilirsiniz. İnsanlar olarak, vücut hareketlerini sezgisel olarak okur ve fazla çaba harcamadan bunları anlamlandırırız. Ancak makineler için bu eylemleri tanımak çok daha karmaşıktır. Vücudun her bir parçasının uzayda nasıl hareket ettiğine dair kesin bilgilere ihtiyaç duyarlar.

OpenPose, bilgisayarlı görüş alanında önemli bir adımdı. Çeşitli ortamlarda atletik formu analiz etmek için pratik bir araçtı.

Birçok araştırma projesi, sallama ve zıplama gibi hareketleri parçalamak için OpenPose'u kullandı, hatta oyuncuların nasıl hareket ettiğine göre belirli beyzbol hareketlerini sınıflandırdı. Standart videonun olduğu açık ortamlarda çalıştığı için araştırmacıların bu tür sistemlerin gerçek dünya eğitim veya koçluk senaryolarında nasıl çalışabileceğini test etmelerine olanak sağladı.

Bu ilk çalışmalar, günümüzde ileri spor teknolojisinde kullanılan performans izleme araçlarının temellerinin atılmasına yardımcı oldu.

Şekil 5. OpenPose kullanılarak bir beyzbol aksiyon sınıflandırma hattına bir bakış.

‍

Güvenlik ve emniyet sistemlerinde OpenPose kullanımı

Benzer şekilde, araştırmacılar OpenPose'u video tabanlı poz takibinin güvenlik izlemeyi nasıl destekleyebileceğini keşfetmek için de kullandılar. Kamusal alanlarda düşmeler, beklenmedik hareketler veya hareket kalıpları gibi davranışları tespit etmede test edildi.

Standart kameralarla çalıştığı için OpenPose, hastaneler ve ulaşım merkezleri gibi ortamlarda erken deneyleri daha erişilebilir hale getirdi. Bu çalışmalar, gözetim, düşme tespiti ve acil müdahale sistemlerinde kullanılan daha yeni modellerin geliştirilmesine yardımcı oldu.

Şekil 6. OpenPose ile etkinleştirilen düşme algılama.

‍

OpenPose'un artıları ve eksileri

OpenPose'un sunduğu avantajlardan bazıları şunlardır:

Araştırma ve prototipleme için kullanışlıdır: Özellikle insan-bilgisayar etkileşimi, biyomekanik ve davranış analizi gibi alanlarda akademik araştırmalarda yaygın olarak kullanılmaktadır.
‍
Platformlar arası destek: Windows, Linux ve macOS'ta çalışabilir ve hem merkezi işlem birimleri (CPU) hem de grafik işlem birimleri (GPU) için destek sunar.
‍
Çevrimdışı işlem yeteneği : İnternet erişimi olmayan ortamlarda çalışabilir, bu da onu sağlık veya eğitim gibi gizliliğe duyarlı ayarlar için ideal hale getirir.

OpenPose büyük bir adım olsa da, akılda tutulması gereken teknik sınırlamaları da vardır. İşte OpenPose ile ilişkili bazı temel zorluklar:

Yüksek işlem gereksinimleri: OpenPose'u gerçek zamanlı çalıştırmak için güçlü bir GPU ve önemli miktarda bilgi işlem kaynağı gerekir.
‍
Ortama duyarlı: Düşük ışıkta, kalabalık ortamlarda veya kamera açıları ideal olmadığında performans düşebilir.
‍
Daha yeni modellere kıyasla ağır: Daha yeni poz tahmin modellerine kıyasla, OpenPose nispeten büyük ve yavaştır. Akıllı telefonlar, tabletler veya gömülü sistemler gibi kaynak sınırlı cihazlarda dağıtım için uygun değildir.

Önemli çıkarımlar

OpenPose, poz tahminini daha erişilebilir hale getirmede önemli bir rol oynadı. Vücut hareketlerinin takibinin, kıyafetlere veya özel ekipmanlara güvenmeden basit bir kamera ile yapılabileceğini gösterdi.

Sağlık, eğitim, eğlence ve araştırma alanlarında birçok pratik uygulama için temel oluşturdu. Daha yeni modeller artık daha hızlı hızlar ve daha hafif performans sunarken, OpenPose poz tahmininin nasıl evrimleştiğini anlamak için önemli bir referans noktası olmaya devam ediyor.

Topluluğumuza katılın ve AI hakkında daha fazla bilgi edinmek için GitHub havuzumuzu ziyaret edin. Kendi bilgisayarlı görüş çözümlerinizi oluşturmak istiyorsanız, lisanslama seçeneklerimizi keşfedin. Ayrıca, sağlık hizmetlerinde bilgisayarlı görüşün ve lojistikte AI'nın nasıl etki yarattığını görün!

OpenPose nedir? Poz tahmininde bir dönüm noktasını keşfetmek

Poz tahmininin tarihine bir bakış

OpenPose: Modern poz tahmininin başladığı yer

OpenPose'un temel yetenekleri

OpenPose nasıl çalışır?

OpenPose'u kullanarak sektörler genelinde poz tahmin uygulamaları

Fitness ve spor için OpenPose ile poz tahmini

Güvenlik ve emniyet sistemlerinde OpenPose kullanımı

OpenPose'un artıları ve eksileri

Önemli çıkarımlar

Bu kategoride daha fazlasını okuyun

OpenPose nedir? Poz tahmininde bir dönüm noktasını keşfetmek

Ultralytics YOLO11'i kullanarak hapları tespit etmeye derin bir dalış

Yapay zeka nedir? Hızlı bir genel bakış

Yapay zekanın gelecekteki
adresini birlikte inşa edelim!

OpenPose nedir? Poz tahmininde bir dönüm noktasını keşfetmek

Poz tahmininin tarihine bir bakış

OpenPose: Modern poz tahmininin başladığı yer

OpenPose'un temel yetenekleri

OpenPose nasıl çalışır?

OpenPose'u kullanarak sektörler genelinde poz tahmin uygulamaları

Fitness ve spor için OpenPose ile poz tahmini

Güvenlik ve emniyet sistemlerinde OpenPose kullanımı

OpenPose'un artıları ve eksileri

Önemli çıkarımlar

Bu kategoride daha fazlasını okuyun

OpenPose nedir? Poz tahmininde bir dönüm noktasını keşfetmek

Ultralytics YOLO11'i kullanarak hapları tespit etmeye derin bir dalış

Yapay zeka nedir? Hızlı bir genel bakış

Yapay zekanın gelecekteki adresini birlikte inşa edelim!

Yapay zekanın gelecekteki
adresini birlikte inşa edelim!