Регулярные выражения : Введение



Регулярные выражения являются мощным инструментом для обработки текста. Это особенно полезно для интерпретируемого языка, так как множество отдельных строковых функций заменяются функциями низкоуровневого языка программирования. Чтобы не повторять существующие разделы справки, опустим некоторые базовые понятия, с которыми можно ознакомится в разделах StringRegExp, StringRegExpReplace, Обучение - Регулярные выражения, предполагая, что вы уже ознакомились с ними. Отмечу, что в StringRegExp вы найдёте краткий справочник по всем элементам регулярного выражения, а в статье "Обучение - Регулярные выражения" описание работы регулярного выражения.


Инструменты для теста

Существует несколько скриптов-утилит для теста рег.выр., в том числе и в официальной справке, а также никто не запрещает использовать редактор, в котором выполнив редактирование выполняем тест горячей клавишей F5. Но всё же для теста и обучения рекомендую утилиту RegExp. В ней уже есть библиотека для обучения - "Example", с помощью которой можно выбирать готовый пример для каждого метасимвола и видеть его работу в действии. Так же на начальной стадии обучения, чтобы понять, что такое диапазон символов, то есть наглядно увидеть какие символы включает в себя метасимвол удобно воспользоваться кнопкой "T". Откроется окно со списком всех символов ASCI и те символы, что удовлетворяют диапазону будут подсвечены зелёным цветом. Учтите, что диапазон символов берётся из Юникода, до 127-го символа она совпадает с ASCI, а диапазон 128-255 для каждой страны отличается, соответственно диапазон взятый с помощью символов ASCI после 127-го символа может не совпадать с диапазоном в Юникоде.