SELAMUN ALEYKÜM
İnşaallah istifadeye medar olur!!!!!!
9 Ağustos 2010 Pazartesi
Bilgisayarla Görme
Çocukluğumun geçtiği köyü uzun bir aradan sonra ziyaret ettim. Köyün bende birçok hatırası olan okulunun bahçesinde, büyük bir coşkuyla top oynayan çocuklar vardı. Babalarını muhtemelen tanıdığım bu çocukların hangi aileye mensup olabileceği hususunda tahminler yapıp, çocuklara babalarının kim olduğunu sordum. Çehre, fizik, yürüme, konuşma ve mimiklerinde yakaladığım küçücük benzerliklerle yaptığım tahminlerin isabetine kendim bile şaşırdım. Bunun üzerine aklıma, bilgisayarla görme alanında doktora yapan bir arkadaşımın, avuç içi tanıma, dudak okuma, yüz tanıma gibi çalışmaları geldi. Onun anlattıklarından, bilhassa dudak okuma gibi alanlarda, bilgisayarla görme teknikleriyle şimdilik fazla bir başarı sağlanamadığını biliyordum. Ebeveynden hareketle çocukların tanınması hususunda ise, çalışmalar yok denecek kadar az. Tahminlerimdeki isabet bir ânda bana, gözlerin ve görme kabiliyetin ne büyük bir nimet olduğunu düşündürdü. Acaba, bilgisayarın görmesi tam olarak ne mânâya gelmekteydi? İnsanlara bahşedilmiş görme nimeti ile bilgisayarın görmesi aynı şeyler miydi?
Muhteşem göz mekanizması ve görme
Göz, oldukça muhteşem yaratılmıştır. Konumu, simetrisi-estetiği, korunma mekanizmaları, mükemmel işleyen kapakları, refleksi, değişik vazifeler için çeşitli karışım kombinasyonlarıyla yaratılmış gözyaşı, günde yaklaşık 100.000 defa kasılan kasları, gözyaşı salgılanmasına vesile olarak gözün sürekli bakımıyla vazifeli konjonktivası, görmeye vesile hikmetli yapısı ve ışığı retinaya düşüren objektife benzer şekliyle korneası, retinayı zararlı ışınlardan koruyan iris tabakası, göze gelen ışık ışınlarını kırarak ağ tabakaya odaklanmasına vesile olan ve adeta objektif ayarı vazifesi gören göz merceği, görüntünün elektrik sinyallerine çevrilerek beyne gönderilmesine vesile olan retinasıyla göz, bilim adamlarını her zaman hayrette bırakmıştır.
Göz optiği, fotoğraf makinesi üzerinden daha kolay anlatılabilir. Fotoğraf makinesindeki gibi bir mercekler sistemi, ışığın göze girmesine izin verilen bir açıklık (pupilla), bir de fotoğraf filmine karşılık gelen retina ihtiva eder.
Gözler, nesnelerin mesafelerine göre beyin tarafından anbean kontrol edilen bir 'uzak ve yakına uyum mekanizması'na sahip kılınmıştır. İnsanlar bunun hiç farkında değillerdir. Gözler birkaç santimetre yakınındaki bir cisme bakarken, başın bir hareketiyle ânında çok uzaklardaki dağlara da odaklanabilir. Bu esnada görüntüde bir bozulma olmaz. Buna gözün uzağa-yakına uyumu (akkomodasyon) denir.
Retinada, renkli görmede görevli koni şeklinde üç tip reseptör hücresi mevcuttur. Bunlar; sarı, yeşil ve kırmızı renkleri algılayacak ve bunlardan çeşitli yoğunluklarda karışımlar yaparak bütün renkleri idrâk edebilecek hususiyette yaratılmıştır. 400–700 nm arasındaki dalga boylarına denk gelen ışığın görülmesi ve algılanması mükemmeldir. Her bir dalga boyundaki ışık, bu üç renk konisini farklı nispetlerde uyarmaktadır. Her koninin uyarılma oranlarına karşılık gelen renkler, beyne yaratılıştan kodlanmıştır. Beynin görme merkezinde renk, her bir dalga boyundaki ışık huzmesinin hangi oranlara karşılık geldiği karşılaştırılarak algılanır. Meselâ 580 nm dalga boyundaki turuncu ışık; kırmızı konileri % 99, yeşil konileri % 42, mavi konileri % 0 nispetinde uyarır. Bu uyarılma nispetleri 99:42:0 şeklinde kodlanırsa, beyin açısından turuncu ışığı temsil eder. Aynı şekilde mavi ışığın beyinde algılanması için 0:0:97 şeklinde bir kod gereklidir; benzer şekilde yeşil ışığın kodu 31:67:36; sarı ışığın kodu da, 83:83:0'dır. Bu kodların birinde hafif bir değişiklik olsa renk tonu değişir; meselâ sarı ışığın kodu 83:83:0 yerine 83:83:01 olsa, sarının farklı bir tonu algılanır.
Nesnelerin görülmesi, göz ve beynin uyum içinde çalıştırılmasıyla sağlanır. Beynin görmedeki vazifeleri:
• İki ayrı gözün retinasından gelen sinyallerin üst üste çakıştırılması
• Bu görüntülerin karşılaştırılarak derinliğin algılanması
• Çizgi ve sınırların fark edilmesi
• Görme merkezinde renk analizi
• Beyinde parlaklığın algılanması (Parlaklık seviyesinin nasıl bir mekanizmayla tespit edildiği henüz kesin olarak anlaşılamamıştır)
• Gözbebeği çapının kontrolü
• Göz hareketlerinin kaslarla kontrolü
• Retinadan gelen görüntünün parçalanıp tekrar birleştirilmesi
• Ters görüntünün düzleştirilmesi
• Kör noktaya düşen kısımların doldurulması ve boşlukların önlenmesi
Gözler, Rabb'imizin Kur'ân-ı Kerîm'de; "De ki: 'Sizi inşa eden (yaratan), size kulak, gözler ve gönüller veren O'dur. Ne az şükrediyorsunuz?' (Mülk Sûresi, 23) âyetiyle bizleri şükrünü edâya davet ettiği organlardır. Görmenin gerçekleştirilmesinde, gözle beyin işbirliği içinde çalıştırılmaktadır. Beynin dünyaya açılan penceresi olan göz, aslında görmenin oluşumunda beyne yardımcı olmak üzere yaratılmıştır.
Teknik olarak bilgisayarla görme
Bilgisayarla görme, bilgisayar ortamına aktarılmış resim veya görüntülerin yine insanlar tarafından geliştirilen programlar vasıtasıyla analiz edilip otomatik olarak incelenmesidir. Bu işlem sırasında görüntü işleme ve tahlil teknikleri kullanılır ve resimler analiz edilerek muhtevayla ilgili bazı bilgiler elde edilir.
Bilgisayarla görmede, resim hakkında bir değerlendirmede bulunabilmek için, resme ait piksel ve renk bilgileri kullanılır. Resim üzerindeki küçük kareler şeklinde tarif edilebilecek piksellerin her birinin renk değeri vardır. Meselâ resmin parlaklığını yükseltmek için, her bir pikselin değeri belli nispette artırılır. Bilgisayarın, resmin muhtevasıyla alâkalı tahminde bulunması da mümkündür. Bu işlemde, mevcut resimle ilgili bilgilerle daha önce sisteme tanıtılmış misâller, sun'î zekâ teknikleri kullanılarak karşılaştırılır ve böylece bilgi çıkarmaya çalışılır.
Resimlerdeki bozuklukları giderme, kenar çıkarma, resmin kontrastını artırma, resmi büyütüp küçültme vb. uygulamalar görüntü işleme uygulamalarına verilebilecek misâllerdendir. Meselâ küçültme veya büyütme işleminde resimden bazı pikseller atılır veya resme bazı yeni pikseller ilâve edilir.
Birbiriyle bağlantılı iki resmin birleştirilmesi şöyle gerçekleştirilir: Her iki resimdeki bazı ortak noktalar bulunur ve bunlar örtüştürülerek resimler birleştirilir. Bu işlem görüntü işlemede zaman alıcı ve maliyetli bir işlemdir. Bu noktada, insanın iki gözüyle elde ettiği görüntülerin, beyinde hiçbir gayret sarf edilmeden otomatik olarak tek bir resim hâline getirilmesi ve bu işlemin bize hiç hissettirilmeden her ân defalarca gerçekleştirilmesi gerçekten üzerinde düşünülmesi gereken muhteşem bir hâdisedir.
Bilgisayarla görme uygulamalarına misâller
Bilgisayarla görme sahasında son yıllarda büyük gelişmeler yaşanmıştır. Otomatik geçiş sistemleri (OGS) ile araç plâkalarının tanınması, kişinin avuç içi resminden tanınması, tıbbî görüntülerden otomatik olarak hastalık teşhisi ve takibi (meselâ beyin tümörlerinin tespiti), doku ve hücre analizinde belli tip hücrelerin otomatik olarak sayımı, güvenlik uygulamalarında parmak izi veya yüz tanıma, oto yollarda aşırı hız yapan araçların tespiti, uzay araştırmalarında insansız araçların çevrelerindeki nesneleri algılaması, savaşlarda hedef belirlenmesi, uydular vasıtasıyla çekilen fotoğrafların otomatik analizi ile harita üretimi, meteorolojik bilgilerin ve gezegenimizdeki değişikliklerin tespiti, eğlence endüstrisinde oyunlarda sun'î görüntü üretimi bu alanda verilebilecek misâllerden bazılarıdır. Hattâ insan gözlerinin kabiliyet sahası dışında kalan bazı fonksiyonlar da bu yolla gerçekleştirilebilmektedir. Meselâ gece görüş dürbünleri sayesinde görüntü bilgileriyle beraber başka bilgilerin de kullanılmasıyla hedefler tespit edilebilmektedir.
Bilgisayarla görme teknikleri birçok açıdan henüz gelişme aşamasındadır. Meselâ, yaşadığımız dünyada uzaklık boyutu, otomatik olarak algılanır ve beynimizde biz farkında olmadan işlenir; bu sayede dünyayı üç boyutlu tanıma imkânı elde ederiz. Bilgisayarlar ise, kâğıt üzerindeki (iki boyutlu) görüntünün aslında üç boyutlu bir dünyadan çekildiğini algılayamamaktadır. Üç boyutlu görüntüler, çok büyük bir bilgi yığınının analizini gerektirdiğinden, işlenmesi çok daha zordur ve pratik açıdan uygulanabilirliği sınırlıdır. Ancak ileride yeni bazı yazılımlar geliştikçe, belki insanın görmesine benzer (üç boyutlu) görüntüler yaygın hâle gelebilecektir. İnsanın görme sistemi söz konusu olduğunda ise boyut, uzaklık gibi değişkenler, hiçbir karmaşıklık ve yük getirmeden bize bahşedilen görme sistemi ile algılanmaktadır. Öyle ki, bir insanın sabahları uyandığında görebilmek için yapması gereken tek şey, gözlerini açmaktır. Bunun dışında en ufak bir gayret göstermesi gerekmez. Görmenin fizyolojik muhtevası ve beyinle işbirliği içinde gerçekleştirilen görme/tanıma göstermektedir ki, beyin ve diğer bazı organlarla bağlantılı şekilde çalıştırılan gözler, son derecede girift ve hikmetli mekanizmalarla bezenmiştir. Yüce Yaratıcı'nın görme hususunda bize bahşettiği kolaylık, görme işleminin basit bir hâdise olduğu mânâsına gelmez. Bilgisayarla görme, sun'î zekâ gibi teknolojik uygulamalar ise, beyinden ve görme fonksiyonlarından ilham alınarak yapılmaktadır.
Kaynaklar
- Computer Imaging, Scott E. Umbaugh, CRC Press Book, 2005, sayfa 3-87
Kaydol:
Kayıt Yorumları (Atom)
Hiç yorum yok:
Yorum Gönder