Ses Transkripsiyon

Ses dosyalarını metne çevirir. Toplantı kayıtları, dikte, podcast, mülakat gibi her tür konuşma kaydını yazıya döker. OpenAI Whisper modelini kullanır.

Ne işe yarar

Toplantı kayıtlarını yazılı tutanak haline getirmek, podcast'lerin yazılı versiyonunu üretmek, ders kaydından notlara çevirmek, sesli mesajı metne çevirmek için kullanılır.

Nasıl kullanılır

  1. Ses dosyalarını listeye sürükleyin.
  2. AI Modeli seçin (kaliteye göre).
  3. Kaynak Dili seçin: Otomatik tespit veya belirli dil.
  4. Çalıştır butonuna basın.

Her dosya için metin çıktısı (.txt) üretilir.

AI modelleri

ModelHızKalite
tinyÇok hızlıDüşük, taslak için
baseHızlıOrta, genel kullanım için dengeli
smallOrtaİyi, çoğu durum için yeterli
mediumYavaşYüksek, önemli işler için
largeÇok yavaşEn yüksek, profesyonel kullanım

Büyük model daha doğru transkripsiyon yapar ama daha çok RAM ve süre gerektirir.

Dil seçenekleri

  • Otomatik Algıla: Sistem konuşma dilini tespit eder. Karışık dilli kayıtlar için.
  • Türkçe (tr): Sadece Türkçe içerik.
  • İngilizce (en): Sadece İngilizce.
  • Almanca (de), Fransızca (fr), İspanyolca (es): Diğer Avrupa dilleri.

Doğru dili belirtmek doğruluğu artırır.

Kullanım örnekleri

Toplantı tutanağı çıkarmak: Toplantı kaydını ekleyin, model small, dil Türkçe, çalıştırın. Yazılı tutanak .txt dosyası.

Podcast bölümlerinin yazılı versiyonu: Bölümleri ekleyin, model medium, dil İngilizce, çalıştırın. SEO için kullanılabilir transkriptler.

Ders kaydından notlar: Kaydı ekleyin, model base, dil otomatik, çalıştırın. Hızlı taslak.

Önemli mülakat için yüksek doğruluk: Mülakatı ekleyin, model large, dil Türkçe, çalıştırın.

Dikkat edilmesi gerekenler

  • İlk kullanımda Whisper modeli internetten indirilir (yaklaşık 100MB-3GB modele göre). Sonraki kullanımlar offline çalışır.
  • Büyük modeller (medium, large) çok RAM gerektirir, eski bilgisayarlarda yavaş çalışır.
  • Gürültülü ortamda yapılan kayıtlarda doğruluk düşer. Önce Denoiser ile temizleyin.
  • Çok kötü kalite mikrofon kayıtlarında sonuç yetersiz olabilir.
  • Birden fazla konuşmacıyı ayırt etmez. Onun için Speaker Diarizer kullanın.
  • Noktalama ve cümle yapısı genelde iyi tahmin edilir ama özel isimler bazen yanlış yazılır.

Lisans

Bu araç Ultimate paketine özeldir. Ücretsiz ve Office paketlerinde görünmez.