Регулярні вирази - це частина невеликої технологічної області, неймовірно широко використовується у величезному діапазоні програм. Регулярні вирази можна уявити собі як міні-мову програмування, що має одне специфічне призначення: знаходити підрядка в великих строкових виразах.
Це не нова технологія, спочатку вона з'явилася в середовищі UNIX і зазвичай використовується в мові програмування Perl. Розробники з Microsoft перенесли її в Windows, де до недавнього часу ця технологія застосовувалася в основному зі сценарними мовами. Однак тепер регулярні вирази підтримуються безліччю класів .NET з простору імен System.Text.RegularExpressions. Випадки застосування регулярних виразів можна зустріти в багатьох частинах середовища .NET Framework. Зокрема, ви знайдете їх в серверних елементах управління перевіркою ASP.NET.
Введення в регулярні вираження
Мова регулярних виразів призначений спеціально для обробки рядків. Він включає два засоби:
Набір керуючих кодів для ідентифікації специфічних типів символів
Система для групування частин подстрок і проміжних результатів таких дій
За допомогою регулярних виразів можна виконувати досить складні і високорівневі дії над рядками:
Ідентифікувати (і можливо, позначати до видалення) все повторювані слова в рядку
Зробити великими перші літери всіх слів
Перетворити перші літери всіх слів довше трьох символів на чільні
Забезпечити правильну капіталізацію пропозицій
Головною перевагою регулярних виразів є використання метасимволов - спеціальні символи, що задають команди, а також керуючі послідовності, які працюють подібно керуючим послідовностям C #. Це символи, упереджені знаком зворотного слеша (\) і мають спеціальне призначення.
У наступній таблиці спеціальні метасимволи регулярних виразів C # згруповані за змістом:
Метасимволи, використовувані в регулярних виразах C #