Boşluk ve Yazdırılmayan Karakterleri Metinden Kaldırma

Boşluk ve Yazdırılmayan Karakterleri Metinden Kaldırma

Bazen metinlerin içinde, başında, arasında yada sonunda, boşluklar, veya birden çok eklenmiş boşluk karakterler bulunmaktadır.Bunlar; 32 ve 160 değerleri Unicode karakter kümesi veya yazdırılmayan karakterler olan  0-31, 127, 129, 141, 143, 144 ve 157 değerleri olan Unicode karakter kümesi karakterleri olabilmektedir.

Bu durumda; olan veriye kirli veri denir. Bunların temizlenmesi gerekir. Çünkü sıralama, filtre uygulama veya arama  gibi işlemlerde beklenmeyen sonuçlara neden olabilir.

Örneğin, kullanıcıların yanlışlıkla fazladan boşluk karakterleri ekleyerek yazım hataları sağlayabilir veya dış kaynaklardan sağlanan veri basılamayan karakterleri içerebilir. Bu karakterleri kolayca fark edemeyiz. Bu istenmeyen karakterleri kaldırmak için TRIM - KIRPMA, CLEANTEMİZ ve SUBSTITUTEYERİNEKOY işlevlerinin tek tek yada birlİkte kullanmak gerekebilir.

TRIMKIRP işlevi sözcükler arasındaki tek boşluklar dışında boşlukları kaldırır. TRIMKIRP işlevi sözcükten ASCII boşluk karakteri ve değeri 32 olanı kırpmak üzere tasarlanmıştır. Unicode karakter kümesinde değeri 160 olan bölünmez boşluk olarak bilinen ek bir boşluk karakteri vardır. Bu karakter yaygın olarak HTML öğesi olarak,  , Web sayfalarında kullanılır. TRIMKIRP fonksiyonu, kendi başına bölünmez boşluk karakterini kaldıramaz.

CLEANTEMİZ fonksiyonu ASCII kodundaki değeri 0 – 31 ve ilk 32 yazdırılamaz karakterleri sözcükten kaldırmak üzere tasarlanmıştır. Unicode karakter kümesinde fazladan yazdırılamaz ve değerleri 127, 129, 141, 143, 144 ve 157 olan karakterleri  CLEANTEMİZ işlevi, kendi başına bu ek yazdırılamaz karakterleri kaldıramaz.

Bu görevi gerçekleştirmek için, Unicode karakterlerinin yüksek değerini TRIM – KIRP ve CLEAN -TEMİZ işlevlerinin tasarlandığı karakter kümesi olan ASCII karakterlerle değiştirmek üzere SUBSTITUTEYERİNEKOY fonksiyonunu kullanılır.

 

Dosya:

kirp_trim-temiz_clean-yerinekoy_substitute

You may also like...

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Şu HTML etiketlerini ve özelliklerini kullanabilirsiniz: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>