Enerji ve Çevre Dünyası 121. Sayı (Ekim 2015)

Enerji Verimliliği ) Makale 3.1.2. K-Means kümelenme algoritması kümede toplanabileceği öngörülmüştür. Sistem içerisinde K-Mean Clustering, eldeki verileri özelliklerine göre hiçbir zaten ayrıksı durumların verileri temizlenmek istendiği için sınıf bilgisi olmadan "K" sayıda kümeye gruplama işlemidir. küme sayısı vardiya sayısı olarak belirlenmiştir. Gruplama, ilgili kümenin merkez (centroid) değeri ile veri setindeki her objenin/nesnenin arasındaki çeşitli uzaklık he saplama yöntemlerine göre hesaplama yapıp (farkın kareleri toplamının) minimumu alınarak gerçekleştirilmektedir. Objelerin sınıflandırılması işlemi gerçekleştikten sonra her bir sınıfa veya kümeye ilgili etiketin verilmesi uzman bir kişi tarafından yapılmaktadır. K-Means algoritmasının dezavan tajları; küme sayısının önceden biliniyor olmasının gerekmesi, sistem modeli oluşturulurken kullanılacak verinin gürültü içeren (kirli, ayrıksı durum) veriden temizlenmiş Ayrıksı durumların ayrı bir küme oluşturmasının tercih edil mediği durumlarda, küme sayısı belirleme işleminin ayrıksı durum verilerinin temizlenmesinden sonra yapılması man tıklı olacaktır. Bu bağlamda; her vardiya verisi için ayrı bir değerlendirme uygulanmıştır. Seçilen vardiyaya ait veriler ayrıksı durumlardan temizlenmiştir. Temizlenmiş veriler üzerinde "Normal Gaussian Distribution Yöntemi" uygu lanmıştır. olması gerektiği, sistem gerçek zamanlı çalışan bir sistem 3.1.3. Normal Gaussian Distribution uygulaması olduğu için algoritmanın sürekli olarak kendisini yeni veri- Bu uygulamada, öncelikle verilerin aritmetik ortalaması ve lere adapte etmesi ve yapının adaptif olması gerekliliğidir. standart sapmaları hesaplanmaktadır. Daha sonra her bir veri için Şekil 4'te verilen formül uygulanmaktadır. Çıkan Bu sorunları çözmek için sistem içerisinde aşağıdaki çözüm sonuç belirli bir oranda hassasiyet verisi içermektedir. Heyöntemlerine başvurulmuştur: saplanan hassasiyet değeri önceden belirlenmiş olan hassa- siyet değerinin altında veya üzerindeyse kirli veri yani ayÖncelikle "k" sayısı yani küme sayısının kaç adet olacağı rıksı durum olarak tespit edilmekte ve veri vardiya verileri belirlenmiştir. "k" sayısı belirlenirken; vardiya sayısı göz arasından çıkarılmaktadır (Şekil 6). Bu işlem tüm vardiyaönünde bulundurulmuştur fakat her türlü ihtimale karşı ve- lar için ayrı ayrı uygulanmaktadır. Sonuç olarak; tüm ayrıksı riler grafiğe dökülerek tepe noktası sayıları belirlenmiştir. durumları temizlenmiş vardiya verileri elde edilmektedir. Bu belirlemeden sonra küme sayısının tepe noktası sayısı Ayrıksı durumlar temizlendikten sonra Şekil 7'deki sonuca veya vardiya sayısı kadar olması gerektiği anlaşılmıştır. Bahsi ulaşılmıştır. geçen vardiya kavramının; mutlaka çalışma saatleri ile belir- lenmiş bir vardiya olmayabileceği, tesisin doğası gereği or- Veriler üzerinde model çalıştırılmış, "K-Means" algoritmataya çıkmış bir vardiya yapısı olabileceği değerlendirilmiştir. sından elde edilen "Outliers, Means, Centroids" verileri "k" sayısının vardiya sayısı veya bir fazlası olarak da belir- lenebileceği, ihtiyaç oluşursa ayrıksı durumların bu fazlalık Şekil 3. K-Means kümelenme algoritması. ı -cx-ıılI n( .Y, ıı, er) = ı:::----ı e I '2. cr l -.,J :. Tı CT - Şekil 4. Gaussian formülü. Şekil S. Normal Gaussian fonksiyonu. Şekil 6. Normal Gaussian veri temizleme aralığı. ENERJi ve ÇEVRE DÜNYASI EKiM 201s 61

RkJQdWJsaXNoZXIy MTcyMTY=