יום שני, 20 ביוני 2011

הסרת ניקוד מטקסט


להלן קוד לקבלת מחרוזת תווים והסרת הניקוד ממחרוזת זו:

static String RemoveDiacritics(String s)
{
     String normalizedString s.Normalize(NormalizationForm.FormD);
     StringBuilder stringBuilder new StringBuilder();
     for (int i = 0; i < normalizedString.Length; i++)
     {
          Char c = normalizedString[i];
          if (CharUnicodeInfo.GetUnicodeCategory(c) != UnicodeCategory.NonSpacingMark)
               stringBuilder.Append(c);
     }
     return stringBuilder.ToString();


שימוש בקוד זה נעשה למטרת עבודה עם טקסטים מנוקדים.
הרבה פעולות לא יכולות להיעשות על טקסט מנוקד, והפונקציה הנ"ל מסירה ניקוד ומאפשרת עבודה עם הטקסט.

אין תגובות:

הוסף רשומת תגובה