Что нового

[RegExp] Удалить ссылки из текста

Dedullika

Новичок
Сообщения
22
Репутация
0
Добрый вечер!

Прошу помочь удалить ссылки из текста. Пока что делаю вот так -
Код:
$sText = FileRead($sPath);
$sPattern = '(?m)(?s)http.*\)'
$text92 = StringRegExpReplace($sText, $sPattern, '')


То есть иногда сслыка заканчивается скобкой и все работает верно. Однако бывает что после ссылки пробел, символ каретки, русская буква (ссылки на англ) или же символ "/". Прошу помочь, не получается сделать более сложный паттерн
 
Автор
D

Dedullika

Новичок
Сообщения
22
Репутация
0
текст примерно такой -
Развлечения

Комикс: происхождение видов (http://dl.dropbox.com/u/933073/lj/ie_shit.jpg)
Как бы выглядел Google в 80-х http://www.businessinsider.com/google-2012-4
Как бы выглядел Twitter в 80-х http://www.youtube.com/watch?v=FCvidD5JKBg/
Как бы выглядел Facebook в 90-х (http://dl.dropbox.com/u/933073/lj/ie_shit.jpg/)
Видео о том, что чувствуешь после продажи Instagram http://www.break.com/index/how-it-feels-to-sell-instagram-for-a-billion-dollars-2318230/ за миллиард долларов.

Если возможно, идеально было бы сделать шаблон для RegExpReplace который начинает удалять ссылку с http и заканчивает первым символом который не может входить в ссылку то есть любой отличный от [0-9],[a-z],[A-Z],[_],[-].
UPD Ой одумался. бывает же и другие символы если не домен и бывают русские .рф. = (
 

sngr

AutoIT Гуру
Сообщения
1,011
Репутация
409
Код:
$file=FileRead(@ScriptDir&'\123')
$str=StringRegExpReplace($file,'(\(?http://\S+\.\S{2,})','')
MsgBox(0,'',$str)

Вот, попробуй.
 
Верх