Sesle Komut (Speech Recognition API): Tarayıcı ile Sesli Not Sistemi

Sesle Etkileşimli Web Dönemi

Modern web sadece yazı ve tıklama üzerine kurulmaz. Sesle kontrol edilebilen sistemler de giderek yaygınlaşmaktadır.


https://www.udemy.com/course/ai-ile-aha-html-ile-her-seyi-yaparsn-sor-ogren-uret/


Bu teknoloji sayesinde:

  • Eller kullanılmadan komut verilebilir
  • Yazı otomatik oluşturulabilir
  • Daha doğal etkileşim sağlanır

Speech Recognition API Nedir?

Speech Recognition API, tarayıcının mikrofon üzerinden sesi algılayıp metne dönüştürmesini sağlar.

Bu sistem:

  • Mikrofonu aktif eder
  • Ses akışını dinler
  • Konuşmayı yazıya çevirir

Sesli Not Mantığı

Sesli not sistemi, konuşulan kelimeleri gerçek zamanlı olarak metne dönüştürür.

Bu yapı:

  • Kullanıcının konuşmasını alır
  • Metne çevirir
  • Ekranda gösterir

Chrome Tabanlı Çalışma Mantığı

Bu API özellikle Chrome tarayıcısında daha stabil çalışır.

Sistem:

  • Mikrofon izni ister
  • Ses dinlemeyi başlatır
  • Tanıdığı kelimeleri ekrana yazar

AI ile Sesli Sistem Tasarımı

Yapay zekâ bu süreçte ses akışını yöneten bir yardımcıdır.

Sistem:

  • Mikrofonu başlatır
  • Ses verisini işler
  • Metne dönüştürür
  • UI üzerinde gösterir

Kursiyerin Uygulama Süreci: İlk Sesli Komut Sistemi

Öğrenci bu aşamada sesle çalışan bir uygulama geliştirir.

Süreç:

  • “Konuş” butonu eklenir
  • Mikrofon erişimi sağlanır
  • Speech Recognition başlatılır
  • Konuşma ekrana yazılır

Gerçek Zamanlı Ses-Text Dönüşümü

Sistem konuşma sırasında sürekli güncellenir.

Bu yapı:

  • Anlık dinleme yapar
  • Kelimeleri sürekli ekler
  • Dinamik metin oluşturur

Aha! Anı: Klavyeden Bağımsız Etkileşim

Bu dersin en önemli farkındalığı şudur:

  • Kullanıcı artık yazmaz
  • Sistem konuşmayı anlar
  • Doğrudan iletişim kurulur

Metafor: Dijital Kulak Sistemi

Bu yapı şöyle düşünülebilir:

  • Speech API = dijital kulak
  • Mikrofon = giriş sensörü
  • Tarayıcı = işlem merkezi

Bu sistem doğal etkileşim sağlar.


Sonuç: İlk Ses Kontrollü Uygulama

Speech Recognition API ile birlikte uygulama artık sesle kontrol edilen bir sisteme dönüşür.

Bu aşamada öğrenci:

  • Ses tanıma mantığını öğrenir
  • Mikrofon API kullanımını kavrar
  • Ses → metin dönüşümünü uygular

Bu adım, üretici zihnin “ses tabanlı etkileşim ve doğal arayüz” seviyesine geçtiği noktadır.