Boşluk ve Yazdırılmayan Karakterleri Metinden Kaldırma
Boşluk ve Yazdırılmayan Karakterleri Metinden Kaldırma
Bazen metinlerin içinde, başında, arasında yada sonunda, boşluklar, veya birden çok eklenmiş boşluk karakterler bulunmaktadır.Bunlar; 32 ve 160 değerleri Unicode karakter kümesi veya yazdırılmayan karakterler olan 0-31, 127, 129, 141, 143, 144 ve 157 değerleri olan Unicode karakter kümesi karakterleri olabilmektedir.
Bu durumda; olan veriye kirli veri denir. Bunların temizlenmesi gerekir. Çünkü sıralama, filtre uygulama veya arama gibi işlemlerde beklenmeyen sonuçlara neden olabilir.
Örneğin, kullanıcıların yanlışlıkla fazladan boşluk karakterleri ekleyerek yazım hataları sağlayabilir veya dış kaynaklardan sağlanan veri basılamayan karakterleri içerebilir. Bu karakterleri kolayca fark edemeyiz. Bu istenmeyen karakterleri kaldırmak için TRIM – KIRPMA, CLEAN – TEMİZ ve SUBSTITUTE – YERİNEKOY işlevlerinin tek tek yada birlİkte kullanmak gerekebilir.
TRIM – KIRP işlevi sözcükler arasındaki tek boşluklar dışında boşlukları kaldırır. TRIM – KIRP işlevi sözcükten ASCII boşluk karakteri ve değeri 32 olanı kırpmak üzere tasarlanmıştır. Unicode karakter kümesinde değeri 160 olan bölünmez boşluk olarak bilinen ek bir boşluk karakteri vardır. Bu karakter yaygın olarak HTML öğesi olarak, , Web sayfalarında kullanılır. TRIM – KIRP fonksiyonu, kendi başına bölünmez boşluk karakterini kaldıramaz.
CLEAN – TEMİZ fonksiyonu ASCII kodundaki değeri 0 – 31 ve ilk 32 yazdırılamaz karakterleri sözcükten kaldırmak üzere tasarlanmıştır. Unicode karakter kümesinde fazladan yazdırılamaz ve değerleri 127, 129, 141, 143, 144 ve 157 olan karakterleri CLEAN – TEMİZ işlevi, kendi başına bu ek yazdırılamaz karakterleri kaldıramaz.
Bu görevi gerçekleştirmek için, Unicode karakterlerinin yüksek değerini TRIM – KIRP ve CLEAN -TEMİZ işlevlerinin tasarlandığı karakter kümesi olan ASCII karakterlerle değiştirmek üzere SUBSTITUTE – YERİNEKOY fonksiyonunu kullanılır.
Dosya:
Son Yorumlar