PowerPoint (PPT/PPTX) sunumları, eğitimden kurumsal iletişime, akademik konferanslardan kamu kampanyalarına kadar pek çok alanda bilgi yoğun içeriklerin hızla dolaşıma girmesini sağlar. Fakat bu hız ve erişilebilirlik, intihal (plagiarism) riskini de artırır. Slaytlarda yer alan metinler; ders notlarından, kitaplardan, bloglardan, kurumsal raporlardan, çalışma arkadaşlarının sunumlarından veya önceki dönem öğrenci projelerinden alıntılanarak—çoğu zaman farkında olmadan—kaynaksız kullanılabilir. Üstelik slaytların doğası (kısa madde işaretleri, görsel üstü kısa cümleler, ekran görüntüleri) klasik metin benzerliği tekniklerini zorlar: OCR gereksinimi, metin kutularının yerleşiminden kaynaklanan parça parça içerik akışları, aynı sunumun farklı şablonlarla yeniden paketlenmesi ve PDF’e çevrilmiş sürümlerde biçimsel dönüşümler gibi sorunlar sık görülür.
Bu kapsamlı yazı, PowerPoint sunumlarında slayt metinlerinde intihal tespitini teknik, operasyonel ve etik boyutlarıyla ele alır. Önce slayt bağlamında intihalin kapsamını ve tipolojisini tanımlar, ardından metin çıkarma ve normalizasyon, yüzeysel ve semantik benzerlik, şablon/boilerplate ayrıştırma, görsel-üstü metin ve multimodal tespit, raporlama ve eşik yönetimi konularını ayrıntılandırır. Kurumsal ve akademik ortamlar için örnek mimariler, vaka çalışmaları, öğretici geri bildirim tasarımları ve KVKK/GDPR uyumlu veri yönetişimi adımları sunar. Amaç, “yüzde kaç benzerlik?” sorusunun ötesine geçerek, kanıta dayalı, adil ve öğretici bir intihal denetim pratiği geliştirmektir.
1) Slayt Bağlamında İntihalin Kapsamı ve Tipolojisi
Slaytlarda intihal yalnızca birebir kopyalamayı kapsamaz; şu biçimlerde ortaya çıkar:
-
Madde işaretlerinin aynen aktarımı: Ders kitabı veya web makalesindeki başlıklar ve bullet’ların doğrudan alınması.
-
Parafraz/özet intihali: Kaynak metnin anlamını koruyup cümle yapısını değiştirerek kaynaksız sunma.
-
Görsel üstü metin intihali: Bilgi grafikleri, tablo ekran görüntüleri veya diyagram üzerindeki metinlerin kaynak göstermeden kullanımı.
-
Çeviri-intihali: Yabancı dildeki sunumların Türkçeye çevrilip kaynak belirtilmeden kullanılması.
-
Yapı intihali: Bir sunumun akışının (giriş–yöntem–bulgular–tartışma gibi) ve örnek diziliminin, ifade farklı olsa da aynen kopyalanması.
-
Kendi kendine intihal: Aynı kişinin önceki dönem/etkinlik sunumundaki slaytlarını kaynaksız yeniden kullanması (kurum politikasına göre ihlal sayılabilir).
2) Dosya ve Biçim Sorunları: PPT/PPTX–PDF–Görsel Karışıklığı
İntihal tespit zincirinin en kırılgan halkası metne erişimdir. Karşılaşılan yaygın durumlar:
-
PPTX içinde birden çok metin kutusu: İçerik akışı doğrusal değildir; bir slaytta iki sütun, başlık–alt başlık–dipnot gibi dağınık kutular vardır.
-
Yerleşik font/biçim varyasyonları: Farklı temalar, sembolik madde işaretleri, alt çizgiler ve smart art biçimleri tokenizasyonu zorlaştırır.
-
PDF’e dönüştürme: Metin katmanı duruyorsa çıkarma kolaydır; yoksa sayfalar raster (görüntü) olabilir ve OCRgerekir.
-
Görsel ekran görüntüleri: Tablo/şema, ekran görüntüsü olarak yer alır; metin tespiti için OCR şarttır.
Çözüm: Birleştirici çıkarım yaklaşımı—PPTX içinden düz metin, PDF varsa metin+OCR, görsel varsa OCR; ardından tüm akış slayt-satır sırası korunacak şekilde birleştirilir.
3) Metin Çıkarma ve Normalizasyon Boru Hattı
Sağlam bir tespit için ön-işleme kritik önemdedir:
-
Katmanlı içe aktarma: Önce PPTX (Open XML) içindeki metin run’larını, ardından PDF metin katmanını, yoksa OCR çıktısını toplayın.
-
Yerleşim kaydı: Her pasaj için
(dosya, slayt_no, x, y, genişlik, yükseklik)
metadata’sı tutun; raporlama ve görsel vurgulama için şarttır. -
Normalizasyon:
-
Unicode harf varyantları, tırnak türleri, kısa/uzun tire vs.
-
Liste işaretlerinin (
•
,–
,›
) düz metne çevrilmesi. -
“Başlık olasılığı” algısı: Tüm KAPSLIK, CamelCase, Title Case gibi özelliklerin not edilmesi.
-
-
Segmentasyon: Slayt → metin kutusu → satır → cümle (veya kısa ifade) hiyerarşisi.
-
Boilerplate maskelemesi: Telif uyarıları, kurumsal sloganlar, “Teşekkürler” slaytları gibi tekrar eden kalıpları ayrı işaretleyin.
4) Yüzeysel Benzerlik için Shingling, MinHash ve LSH
Slayt metinleri çoğu kez kısa olduğundan, uygun bir n-gram/shingle penceresi belirlemek hassastır (ör. k=5–7 kelime). İş akışı:
-
Shingle çıkarımı: Slayt satırı/bullet düzeyinde pencereler üretin.
-
MinHash imzaları: Büyük arşivlerle karşılaştırmak için imza seti.
-
LSH bantlama: Yakın imzaları aynı kovaya atarak aday eşleşmeleri hızlıca bulun.
Bu katman birebir veya yüksek yüzey benzerliği içeren slayt metinlerini hızlıca işaretler. Kısa metinlerde yanlış pozitif riskini azaltmak için boilerplate maskesi ve stop-phrase listeleri (örn. “Giriş”, “Sonuç”) kritik önemdedir.
5) Semantik Benzerlik: Kısa İfadelerde Anlam Yakalama
Slaytlar çoğu kez sloganik, yüksek sıkıştırmalı ifadeler kullanır (“Veri odaklı karar”, “Yalın süreçler”, “Düşük gecikme”). Bu tür ifadelerde yüzeysel benzerlik düşük olsa bile anlam çakışmaları çoktur. Strateji:
-
Cümle/paragraf embedding (Sentence-BERT türevleri) ile slayt satırı veya bullet başına vektör çıkarın.
-
ANN (HNSW/FAISS) araması ile kurum arşivleri ve açık web indekslerinden yakın komşular bulun.
-
Kontrastif eşikleme: Aynı slayt içindeki ifadelerle (negatif örnekler) ve kaynak evreninden (pozitif/negatif) kalibrasyon yapın.
-
Üstü kapalı kalıp eşleşmesi: “X odaklı Y” kalıplarını varyantlarıyla yakalamak için şablon-tabanlı embedding genişletmeleri kullanın.
6) Yapısal Benzerlik ve Slayt Akışı (Deck Structure)
Bir sunumun akışı da intihaldir: Bölüm başlıklarının sırası, örneklerin dizilimi, vaka–veri–öneri üçlemesi. Yaklaşım:
-
Topic segmentation: Slayt başlıklarından ve içeriklerinden bölümler çıkarmak.
-
Dizi/hiyerarşi benzerliği: Levenshtein uzaklığı ile başlık sıralarının kıyası; Jaccard ile bölüm kümeleri.
-
Şablon tespiti: Aynı kurumda dolaşan “örnek slayt seti”nin iskeleti tekrar ediyorsa, raporda iskele/boilerplate notu düşülür.
7) Görsel Üstü Metin, Tablolar ve Diyagramlar: OCR ve pHash
Slaytlardaki metnin bir kısmı görsel üzerindedir:
-
OCR (İki aşamalı): Genel OCR + diyagram/tablolar için ince ayar; satır düzenini koruyup tümleşik metne bağlayın.
-
Perseptüel hash (pHash/dHash/aHash): Aynı görsel/infografiğin farklı boyut/filtrede tekrarını yakalar.
-
Tablo şeması eşleşmesi: Sütun başlıklarının ve birimlerin normalizasyonu; “yakın ama farklı” tablolarda dikkat gerekir.
Rapor, görselin kaynağına dair delil (URL/ID, tarih) ve benzerlik ısı haritası (nerede hangi yazılar eşleşti?) içermelidir.
8) Boilerplate ve Şablon Maskelemesi: Adil Skor için Zorunlu
Kurumsal template’lerde aynı kapanış slaydı, “Ajanda”, “Hakkımızda”, “Teşekkürler” gibi metinler bulunur. Bu alanlar adil skor için kapsam-dışı sayılmalı ya da ağırlığı düşürülmelidir. Yöntem:
-
Sıklık eşiği: Arşivin %X’inden fazlasında görülen cümleler boilerplate’e aday.
-
Regex/şablon sözlüğü: Tipik cümle ve çerçeve sözleri.
-
Konum ipucu: İlk/son slaytlar, alt bilgi, yasal uyarı kutuları.
9) Çokdillilik ve Çeviri-İntihali
Uluslararası sunumlarda İngilizce–Türkçe–Almanca gibi çokdilli akışlar görülür. Çeviri-intihali için:
-
Çokdilli embedding ile çapraz dil yakınlığı;
-
Pivot çeviri (TR→EN→TR) ile geri çeviri kıyası;
-
Adlandırılmış varlık ve terim sözlüğü: Marka, ürün, süreç adları diller arasında eşleşir.
Raporlar “TR slayt → EN kaynak adayı” eşleştirme örnekleri ve pasaj karşılaştırmalarını görselleştirmelidir.
10) Eşikler, Bantlar ve Risk Skoru
Tek sayı yerine bileşik risk skoru önerilir:
-
Syu¨zey: shingle/MinHash/LSH katmanından gelen yüzeysel benzerlik,
-
Ssemantik: embedding yakınlığı,
-
Syapı: başlık/bölüm akışı benzerliği,
-
Sgo¨rsel: OCR + pHash bulguları,
-
Sboiler: düşürücü faktör (şablon payı).
Çift eşik: Üst bant (otomatik uyarı), orta bant (insan incelemesi), alt bant (temiz). ROC/PR eğrileriyle kalibre edin; kısa slayt metinlerinde ağırlıklar farklılaştırılmalıdır (semantik sinyale daha fazla ağırlık gibi).
11) Raporlama Tasarımı: Kanıtı Net ve Öğretici Sunmak
Editör/öğretim üyesi dostu bir rapor şu öğeleri içermelidir:
-
Slayt önizlemesi ve eşleşen pasajların renkli vurgusu (metin kutusu bazında).
-
Kaynak paneli: URL, başlık, yazar, tarih/sürüm; kurumsal arşivlerde doküman ID.
-
Boilerplate rozeti: “Skora etkisiz” alanların işaretlenmesi.
-
Çeviri eşleşmesi: Dil bayraklarıyla kaynak hedef eşleştirmesi.
-
Düzeltme önerileri: Slayt bazında “yeniden yazım, atıf ekleme, özgün örnek/medya ekleme” ipuçları.
Bu şeffaflık hem yanlış pozitifleri azaltır hem de öğretici geri bildirim sağlar.
12) Kurumsal ve Akademik Mimari: Entegrasyon ve Ölçek
Akademik birimler için:
-
LMS entegrasyonu (Moodle/Canvas/Google Classroom): Teslim → otomatik tarama → öğrenciye geri bildirim.
-
Arşiv dizini: Geçmiş ders sunumları, tez savunmaları, öğrenci projeleri.
-
Politika ve itiraz süreci: Eşikler, yaptırımlar ve savunma hakkı.
Kurumsal dünyada:
-
DAM (Digital Asset Management) entegrasyonu: Kurumsal sunum havuzunun indekslenmesi.
-
İçerik sürümleme: Marka mesajı değiştikçe boilerplate sözlüğünün güncellenmesi.
-
Yetkilendirme ve loglama: Kim neyi taradı/görüntüledi; KVKK/GDPR uyumu.
13) Pedagojik Boyut: Yakalamaktan Çok Öğretmek
Sunum; bilginin öğretici bir paketidir. İhlal tespiti sonrası:
-
Atıf eğitimi: Slaytlarda kaynak belirtme (APA/MLA kısa atıf veya URL).
-
Özgünleştirme atölyesi: Öğrenciler/ekipler “aynı fikri kendi örnekleriyle” anlatmayı deneyimler.
-
Kendi-çalışma şablonları: “Bu slaytın amaç cümlesi nedir? Hangi veriyi kime kanıtlıyorsun?” gibi kısa form.
-
Rubrik: “Özgün örnek/uygulama”, “kaynak şeffaflığı”, “görsel etik” başlıklarına puan.
14) Yasal ve Etik Çerçeve: Telif, Marka, Kişisel Veri
-
Telif: Metin ve görsellerin kullanım hakları; stok görsel lisansları; alıntı sınırları.
-
Marka: Logo ve tescilli ifadelerin izinli kullanımı.
-
Kişisel veri: Slaytlara yerleştirilen gerçek vaka verileri; anonimleştirme ve açık rıza gereklilikleri.
-
Saklama: Öğrenci sunumlarının kaç dönem saklanacağı, silme/unutulma hakkı.
15) İnce Ayar: Kısa Metinlerde Yanlış Pozitifleri Azaltmak
Slayt metinleri kısa olduğundan benzerlik ölçütleri hassastır. İyileştirmeler:
-
N-gram penceresi adaptasyonu: Kısa satırlarda k=4–5, uzun satırlarda k=7–9.
-
Stop-phrase ve domain-özel sözlük: “Giriş”, “Özet”, “Yöntem” gibi nötr başlıkları dışarıda bırakma.
-
Kanıt parçalarının minimum uzunluğu: En az N karakter/küme şartı.
-
Çoklu sinyal şartı: Bayrak için hem yüzeysel hem semantik eşiklerin aynı anda aşılması.
16) Multimodal Genişleme: Sesli Anlatım ve Notlar
PowerPoint anlatıcı notları (speaker notes) ve bazen sesli anlatım (narration) içerir:
-
Not metni çıkarımı: Sunum metninden ayrı değerlendirin; çoğu özgün anlatım burada saklıdır.
-
Transkript/ASR: Sesli sunum varsa metne dökün ve semantik taramaya dahil edin.
-
Tutarlılık kontrolü: Slayt metni ile not/konuşma tutarlı mı? Aşırı benzerlikte “mış gibi özgün” sunum riski vardır.
17) Vaka Çalışması A: Üniversite Düzeyi Proje Sunumları
Bağlam: 180 öğrenci, dönem sonu proje sunumları.
Uygulama: PPTX + PDF yüklemesi; metin+OCR; k=6 shingle, MinHash=128 imza; SBERT tabanlı semantik arama; boilerplate sözlüğü (17 kalıp).
Sonuç: Üst bant uyarı %6, orta bant %12; yanlış pozitifler boilerplate maskesi sonrası %38 azaldı. Öğrenci itirazlarında kanıt slayt görsellemesi ikna ediciydi; yeniden yazım atölyesiyle tekrar oranı bir sonraki yıl %27 düştü.
18) Vaka Çalışması B: Kurumsal İK Eğitim Sunumları
Bağlam: Şirket içi eğitim setleri, farklı birimler aynı konuyu anlatıyor.
Bulgu: Aynı “değerler” slaytları yüzünden yüksek benzerlik skorları; aslında kurumsal şablon.
Müdahale: Boilerplate beyaz listesi; “kurumsal mesaj” alanları skor dışı. Asıl özgünlük “vaka ve sayı” slaytlarında puanlanmaya başlandı.
Sonuç: Risk skorları normalleşti; “özgün vaka paylaşımı” KPI’sı eklendi.
19) Süreç ve Roller: Kim Ne Zaman Devreye Girer?
-
İçerik sahibi (öğrenci/çalışan): Taslak aşamasında kendini-tarama, kaynak ekleme.
-
Eğitmen/Editör: Orta bant inceleme, pedagojik geri bildirim.
-
Hukuk/İçerik denetimi: Üst bant vakalarda telif/marka/yükümlülük analizi.
-
BT/Veri ekibi: Arşiv, indeks, erişim ve loglama; model sürümleme.
Süreç şeffaf olmalı; itiraz ve düzeltme yolları açıkça duyurulmalıdır.
20) Gelecek Yönelimleri: Su-İzi, Gerçek Zamanlı Yardım ve Üretken YZ ile Düzeltme
-
Watermark/su-izi: Bazı üretken YZ metin/görsellerinde istatistiksel izler; slayt metninde olası YZ-kaynağısinyali.
-
Gerçek zamanlı yardım: Sunum hazırlanırken “benzerlik artıyor” uyarısı ve alternatif ifade önerileri.
-
YZ ile yaratıcı düzeltme: Bayraklı satırları “kaynakça ekleyerek” veya “kurum içi verilerle” özgünleştirme; insan denetimiyle.
Sonuç
PowerPoint sunumlarında slayt metinlerinde intihal tespiti, klasik makale/rapor denetimlerinden farklı ve multimodal bir titizlik gerektirir. Başarılı bir yaklaşım şu bileşenlerin birlikte işlemesine dayanır:
-
Sağlam ön-işleme: PPTX/PDF/görsel–OCR bileşimi; metin kutusu ve yerleşim metadatası ile tutarlı segmentasyon.
-
Katmanlı tespit: Shingle/MinHash/LSH ile yüzeysel, embedding ile semantik; gerektiğinde yapı (akış) ve pHash ile görsel eşleştirme.
-
Adil skor: Boilerplate/kurumsal şablon maskelemesi; kısa metinler için dikkatli eşikleme ve çoklu-sinyal şartı.
-
Şeffaf raporlama: Slayt önizleme, kanıt pasajı, kaynak paneli ve düzeltme önerileri ile öğretici geri bildirim.
-
Yönetişim ve etik: KVKK/GDPR, telif/marka, saklama politikaları; itiraz ve revizyon kanalları.
-
Pedagojik entegrasyon: Atıf becerileri, özgünleştirme atölyeleri ve rubriklerle “yakalamak” yerine öğretmek.
Bu çerçeve, hem akademide hem kurumlarda sunumların güvenilirliğini ve öğretici değerini artırır. İntihal tespiti, korkulan bir kontrol noktası yerine, özgün içerik üretimini teşvik eden bir editoryal destek sistemine dönüşür. Nihayetinde amaç, slaytların yalnızca güzel görünmesi değil; etik, özgün ve kaynaklı bilgiyi etkili biçimde aktarmasıdır.
No responses yet