Arama Sonuçları

Listeleniyor 1 - 2 / 2
  • Öğe
    Derin öğrenme ile anlamsal bölütleme ve piksel görüntülerinden gerçek görüntü üretimi
    (Batman Üniversitesi Lisansüstü Eğitim Enstitüsü, 2023-07-10) Arıca, Emre; Kaya, Yılmaz
    İki bölümden oluşan bu tez çalışmasının ilk bölümünde derin öğrenme metotları ile anlamsal bölütleme işlemi gerçekleştirilmiştir. Anlamsal bölütleme işlemi, bir görüntüdeki her pikselin ilgili bir etiket ile ilişkilendirme işlemidir. Anlamsal bölütleme ile görüntüdeki nesnelerin tespiti, yerinin belirlenmesi mümkün kılınmaktadır. Bilgisayar sistemleri tarafından görüntülerin daha iyi yorumlanması, anlaşılması için anlamsal bölütleme önemlidir. Son yıllarda derin öğrenme metotları ile görüntülerden nesne tespiti nesnelerin yorumlanmasında yaygın bir şekilde kullanılmaktadır. Mevcut araştırmada Resnet-18 transfer yöntemini temel alan Deeplab v3+ CNN ağı ile anlamsal bölütleme işlemi gerçekleştirilmiştir. Bunun için Camvid veri seti kullanılmıştır. 701 yüksek çözünürlüklü görüntüden oluşan veri setindeki görüntülere piksel bazlı anlamsal bölütleme manuel olarak uygulanmıştır. Öncelikli olarak bölütleme işlemi Gretag–Macbeth renk şeması esas alınarak gerçekleştirilmiştir. Ardından Deeplab v3+ gerçek görüntüler piksel görüntülerle eşleştirilerek eğitim işlemi gerçekleştirilmiştir. Modeli test etmek için farklı görüntüler kullanılmıştır. Gözlenen Jaccard, Sørensen-Dice ve BF Skoru metriklerine göre yüksek başarılar gözlenmiştir. Tezin ikinci aşamasında derin öğrenme metotları ile piksel görüntülerden sentetik görüntüler oluşturulmuştur. Bu kapsamda derin öğrenme metotlarından GAN yöntemlerinden faydalanılmıştır. GAN modeller farklı alanlarda sentetik veriler üretmek için yaygın bir şekilde tercih edilmektedir. Araştırmada gerçek görüntüler oluşturmak için Pix2PixHD GAN modeli kullanılmıştır. Pix2PixHD, yüksek çözünürlüklü görüntülerin düşük çözünürlüklü eşlemelerinden gerçekçi ve ayrıntılı görüntüler üretmek için kullanılan bir görüntü çeviri yöntemidir. Bu yöntemin temelinde, derin öğrenme ve özellikle de evrişimli sinir ağları vardır. Pix2PixHD GAN yönteminde CNN ağı olarak VGG19 transfer derin öğrenme metodu kullanılmıştır. Denemeler Camvid veri seti üzerinde gerçekleştirilmiştir. Gerçekleştirilen denemelerde başarılı yüksek çözünürlüklü görüntülerin üretildiği sonucuna varılmıştır.
  • Öğe
    Şarkı sözlerinden yeni şarkı türetme: Derin öğrenme yöntemleri ile sanatsal üretim
    (Batman Üniversitesi Lisansüstü Eğitim Enstitüsü, 2025-07-30) Gezer, Fatma; Kaya, Yılmaz
    Şarkı sözü yazımı yaratıcı bir süreçtir. Geleneksel olarak bu süreç ilham, sezgi ve bireysel yaratıcılığa dayanır. Ancak yapay zekâ teknolojilerinin gelişmesiyle birlikte bu süreç yeni bir döneme girmiştir. Son yıllarda, özellikle yaratıcı metin üretimi alanında, Doğal Dil İşleme (NLP) kapsamında önemli ilerlemeler kaydedilmiştir. Özellikle GAN mimarileri, özgünlük ve rastlantısallık gerektiren içeriklerin üretiminde dikkat çekmektedir. Bununla birlikte, GAN'ların metin üretimine uyarlanması, görüntü üretimine kıyasla daha karmaşık bir süreçtir. Türkçe gibi sondan eklemeli dillerde hem anlamlı hem de yapısal olarak tutarlı metinler üretmek daha da zordur. TextGAN, SeqGAN, LeakGAN, RankGAN, MaliGAN ve RelGAN gibi mimariler, Türkçe şarkı sözü üretimi bağlamında sistematik olarak değerlendirilmemiştir. Bu durum, çalışmanın temel problemini oluşturmaktadır. Bu tez çalışmasının amacı, mevcut şarkı sözlerini analiz ederek, özgün ve sanatsal değeri yüksek içerikler üretebilen en uygun yapay zekâ modelini belirlemektir. Bu kapsamda, derin öğrenme modellerinin yanı sıra duygu analizi, ritmik yapı analizi ve yaratıcı metin üretimi teknikleri kullanılmıştır. Elde edilen sonuçlara göre, düşük BLEU ve Jaccard skorları, modellerin referans metinlerle yüzeysel düzeyde benzerlik kurmakta zorlandığını göstermektedir. Buna karşılık, RelGAN modeli Cosine Similarity metriğinde en yüksek skoru (0.0693) elde ederek, anlamsal olarak en tutarlı çıktıları üretmiştir. MaliGAN modeli ise düşük perplexity değeri (9588.23) ile dil modelleme açısından öne çıkmıştır. Ancak, çeşitlilik metriklerinin (TTR ve Unique Word Ratio) 1.0 değerine ulaşması, anlamlı tekrarların eksikliğini ve doğal akışın zayıf olduğunu göstermektedir. Edebi analizlere göre, yalnızca RelGAN modeli tematik bütünlük ve duygu yoğunluğu açısından tatmin edici şarkı sözleri üretebilmiştir. Sonuç olarak sayısal başarı ve edebi değerlendirme birlikte ele alındığında, RelGAN en dengeli ve başarılı model olarak öne çıkmıştır. Türkçe gibi eklemeli yapıya sahip dillerde şarkı üretimi için GAN modelleri hâlen sınırlı kalmakta olup, gelecekte Transformer tabanlı yapılarla desteklenmesi önerilmektedir.