Site icon IT Tutorial

Ses ve Konuşma Tanıma -3

Filtre YAPILARI

Sayısal bir sistemin transfer fonksiyonu H(z) olarak gösterilmektedir. Bu transfer fonksiyonu sistemin bir giriş işaretine olan etkisini ve aynı zamanda sistemin süzgeç etkisini tanımlar. Süzgeçler verdikleri frekans cevabına göre

 

 

 

Alçak geçiren (Lowpass, LP)

Yüksek geçiren (High pass, HP)

Bant geçiren (Bandpass, BP)

Bant durduran ‘geçirmeyen’ (Band reject, BR)

Tüm geçiren (All pass, AP) şeklinde ayrılmaktadır.

Transfer fonksiyonu H(z)’nin genel biçimi

 

 

olarak verilmekte ve n.derece sayısal süzgeç yapısını belirtmektedir. Sayısal süzgeçler,

standart fark denklemleri ile de tanımlanır. Genel olarak fark denklemi;

 

 

biçimindedir. (4) eşitliğinde N1=0 değeri için, a0=1 olacak şekilde transfer fonksiyonu elde

edilir. Örnek olarak;

transfer fonksiyonuna karşılık gelen fark denklemi

y(n) = 0.2066x(n) + 0.4131x(n −1) + 0.2066x(n − 2) + 0.3695y(n −1) − 0.1958y(n − 2)

 

 

biçimindedir. Transfer fonksiyonu verilen bir sistemi incelemek için, transfer fonksiyonun genlik ve faz eğrilerinin çizilmesi gerekir.

Filtreleme tekniklerinden bahsettikten sonra bizim çalışmamızda kullandığımız filtreleme yöntemine geçebiliriz. Çalışmamızda fft’sine aldığımız sesi smooting(yumuşatma) filtresinden geçirip gelen işaretteki gürültüleri kaldırmayı hedefledik.

Şekil 1. Gelen işaretin fft’si

 

 

 

Şekil 2. Fft’si alınan işaretin filtrelenmesi

 

Görüldüğü üzere filtre sonucu ses üzerinde bir yumuşama sös konusu.

Fiziki ortamdan dijital ortama aktardığımız işaretle ilgili gelen incelemeleri yaptıktan sonra yapmaya çalıştığımız yazımlımdan bahsetmetme zamanı.

Yaptığımız çalışmada bilgisayara tanıtacağımız kelimeleri bir öğretim aşamasından geçiriyoruz. Öğretim aşaması gelen işaretin fft’sinin alınması ve yumuşatılamasından sonraki halinin veritabanımıza aktarılmasından ibarettir.

 

 

Burada şuna dikkat etmek gerekir her birkelimeden kaç farklı örneğin alınmasıdır.Uygulamada gördükki her herbir kelimeyle ilgili aldığımız örnek sayısının fazlalılığına göre işaretin tanınması kolaylaşıyor.

Şikil 3. Veritabanını yerleştirilen ses dosyaları

Kelimelerin eğitiminden sonra sıra geldi tanıma olayının gerçekleştirilmesine.Tanıma olayında aldığımız işaret eğitim sırasında ğeçirdiğimiz aşamalardan ğeçiriyoruz.

 

 

Son işlemlerden sonra gelen işaretin veritabanında olan işeretlerle benzerliğini arıyoruz.

Benzerlik oranı iki işaretin bir biri üzerinden hareket ettirilerek bulunur.Bir biri üzerinden hareket ettirilen işaretlerde her hareket sonucunda bir benzerlik degeri ortaya çıkar bu benzerlik değerlerinden maksimum olan alınır.

İki işaret arasındaki benzerlik oranı 0-1 arasında olmalıdır. Yalnız işaretlerin birbiri üzerinden hareketlerinden ortaya çıkar benzerlik değerleri 0-1 arasından olmaya bilir.Bundan solayı gelen benzerlik oranını normalizeli bir frma dönüşümü yapılır.Sonuç olarak elimizde 0-1 arasında bir benzerlik değeri oluşur.

 

Exit mobile version