Sesle Etkileşimli Web Dönemi
Modern web sadece yazı ve tıklama üzerine kurulmaz. Sesle kontrol edilebilen sistemler de giderek yaygınlaşmaktadır.
https://www.udemy.com/course/ai-ile-aha-html-ile-her-seyi-yaparsn-sor-ogren-uret/
Bu teknoloji sayesinde:
- Eller kullanılmadan komut verilebilir
- Yazı otomatik oluşturulabilir
- Daha doğal etkileşim sağlanır
Speech Recognition API Nedir?
Speech Recognition API, tarayıcının mikrofon üzerinden sesi algılayıp metne dönüştürmesini sağlar.
Bu sistem:
- Mikrofonu aktif eder
- Ses akışını dinler
- Konuşmayı yazıya çevirir
Sesli Not Mantığı
Sesli not sistemi, konuşulan kelimeleri gerçek zamanlı olarak metne dönüştürür.
Bu yapı:
- Kullanıcının konuşmasını alır
- Metne çevirir
- Ekranda gösterir
Chrome Tabanlı Çalışma Mantığı
Bu API özellikle Chrome tarayıcısında daha stabil çalışır.
Sistem:
- Mikrofon izni ister
- Ses dinlemeyi başlatır
- Tanıdığı kelimeleri ekrana yazar
AI ile Sesli Sistem Tasarımı
Yapay zekâ bu süreçte ses akışını yöneten bir yardımcıdır.
Sistem:
- Mikrofonu başlatır
- Ses verisini işler
- Metne dönüştürür
- UI üzerinde gösterir
Kursiyerin Uygulama Süreci: İlk Sesli Komut Sistemi
Öğrenci bu aşamada sesle çalışan bir uygulama geliştirir.
Süreç:
- “Konuş” butonu eklenir
- Mikrofon erişimi sağlanır
- Speech Recognition başlatılır
- Konuşma ekrana yazılır
Gerçek Zamanlı Ses-Text Dönüşümü
Sistem konuşma sırasında sürekli güncellenir.
Bu yapı:
- Anlık dinleme yapar
- Kelimeleri sürekli ekler
- Dinamik metin oluşturur
Aha! Anı: Klavyeden Bağımsız Etkileşim
Bu dersin en önemli farkındalığı şudur:
- Kullanıcı artık yazmaz
- Sistem konuşmayı anlar
- Doğrudan iletişim kurulur
Metafor: Dijital Kulak Sistemi
Bu yapı şöyle düşünülebilir:
- Speech API = dijital kulak
- Mikrofon = giriş sensörü
- Tarayıcı = işlem merkezi
Bu sistem doğal etkileşim sağlar.
Sonuç: İlk Ses Kontrollü Uygulama
Speech Recognition API ile birlikte uygulama artık sesle kontrol edilen bir sisteme dönüşür.
Bu aşamada öğrenci:
- Ses tanıma mantığını öğrenir
- Mikrofon API kullanımını kavrar
- Ses → metin dönüşümünü uygular
Bu adım, üretici zihnin “ses tabanlı etkileşim ve doğal arayüz” seviyesine geçtiği noktadır.