Как очистить текст от лишнего текста с обеих сторон от искомого текста?

csharp
Теги: #<Tag:0x00007fedbbc64e58>

(It Ot) #1

Используется С#
С сайта парсится текст, имеющий несколько вариантов:
Вар 1
FG654HGFH=FGJ6DJ131HDFHSFSGRv=http://site1.ru/jfd6oin/bfg654ryan-knight%3Futm_/te654DDFm%3D%26cid%3D1065

или Вар 2
dfg6546sdgs=dgd646ttrdhx32gfh=http://site2.com/nhgh65h/bfg654ryan-kng654fight%/etesd6s5d4sdgs654DDFm%3D%2

или Вар 3
dfh6565jrtu=u63mb2,1CjyttmKYU=http://site3.net/nsdxch6/bfg654vcvn-knsdsffbnht%/sdg987bn,uuio98ofp64utrury

Особые условия:
- домен site(1,2,3, …) - принят условно. Имя домена не имеет какой-либо тенденции и всегда разное;
- http://, может быть и https://

ВОПРОС.
Как очистить текст, чтобы осталось, к примеру для http://site1.ru:
- http://site1.ru
или
- site1.ru
или
- site1
при этом не привязываясь к имени домена, т.к. имена доменов не известны.


(Dema W) #2

Полагаю, вам сюда http://regexlib.com/Search.aspx?k=url


(Nik Sidorenko) #3

Удочка:
Учите Regular Expression. Потренироваться можно тут https://regex101.com/

Рыбка:


Этот regexp “https?://[^/:]+” поможет вам вытянуть URL с http/https//: и доменом
А дальше можно изврещатся с Substring.