Regex of All gTLD & ccTLDs

The following Regex will match every gTLD and ccTLD.

(\.ac/|\.ad/|\.ae/|\.af/|\.ag/|\.ai/|\.al/|\.am/|\.an/|\.ao/|\.aq/|\.ar/|\.as/|\.at/|\.au/|\.aw/|\.ax/|\.az/|\.ba/|\.bb/|\.bd/|\.be/|\.bf/|\.bg/|\.bh/|\.bi/|\.bj/|\.bl/|\.bm/|\.bn/|\.bo/|\.br/|\.bs/|\.bt/|\.bv/|\.bw/|\.by/|\.bz/|\.ca/|\.cc/|\.cd/|\.cf/|\.cg/|\.ch/|\.ci/|\.ck/|\.cl/|\.cm/|\.cn/|\.co/|\.cr/|\.cu/|\.cv/|\.cx/|\.cy/|\.cz/|\.de/|\.dj/|\.dk/|\.dm/|\.do/|\.dz/|\.ec/|\.ee/|\.eg/|\.eh/|\.er/|\.es/|\.et/|\.eu/|\.fi/|\.fj/|\.fk/|\.fm/|\.fo/|\.fr/|\.ga/|\.gb/|\.gd/|\.ge/|\.gf/|\.gg/|\.gh/|\.gi/|\.gl/|\.gm/|\.gn/|\.gp/|\.gq/|\.gr/|\.gs/|\.gt/|\.gu/|\.gw/|\.gy/|\.hk/|\.hm/|\.hn/|\.hr/|\.ht/|\.hu/|\.id/|\.ie/|\.il/|\.im/|\.in/|\.io/|\.iq/|\.ir/|\.is/|\.it/|\.je/|\.jm/|\.jo/|\.jp/|\.ke/|\.kg/|\.kh/|\.ki/|\.km/|\.kn/|\.kp/|\.kr/|\.kw/|\.ky/|\.kz/|\.la/|\.lb/|\.lc/|\.li/|\.lk/|\.lr/|\.ls/|\.lt/|\.lu/|\.lv/|\.ly/|\.ma/|\.mc/|\.md/|\.me/|\.mg/|\.mh/|\.mk/|\.ml/|\.mm/|\.mn/|\.mo/|\.mp/|\.mq/|\.mr/|\.ms/|\.mt/|\.mu/|\.mv/|\.mw/|\.mx/|\.my/|\.mz/|\.na/|\.nc/|\.ne/|\.nf/|\.ng/|\.ni/|\.nl/|\.no/|\.np/|\.nr/|\.nu/|\.nz/|\.om/|\.pa/|\.pe/|\.pf/|\.pg/|\.ph/|\.pk/|\.pl/|\.pm/|\.pn/|\.pr/|\.ps/|\.pt/|\.pw/|\.py/|\.qa/|\.re/|\.ro/|\.rs/|\.ru/|\.rw/|\.sa/|\.sb/|\.sc/|\.sd/|\.se/|\.sg/|\.sh/|\.si/|\.sj/|\.sk/|\.sl/|\.sm/|\.sn/|\.so/|\.sr/|\.st/|\.su/|\.sv/|\.sy/|\.sz/|\.tc/|\.td/|\.tf/|\.tg/|\.th/|\.tj/|\.tk/|\.tl/|\.tm/|\.tn/|\.to/|\.tp/|\.tr/|\.tt/|\.tv/|\.tw/|\.tz/|\.ua/|\.ug/|\.uk/|\.um/|\.us/|\.uy/|\.uz/|\.va/|\.vc/|\.ve/|\.vg/|\.vi/|\.vn/|\.vu/|\.wf/|\.ws/|\.ye/|\.yt/|\.yu/|\.za/|\.zm/|\.zw/|\.aero/|\.asia/|\.biz/|\.cat/|\.com/|\.coop/|\.edu/|\.gov/|\.info/|\.int/|\.jobs/|\.mil/|\.mobi/|\.museum/|\.name/|\.net/|\.org/|\.pro/|\.tel/|\.travel/)

The following regex will allow you to clean inbound links so that you can sum the number of inbound links coming from each domain. It grabs the everything up to the TLD and adds a tab after the TLD. This separates the root domain from the URI.

Find:

(.*)(\.ac/|\.ad/|\.ae/|\.af/|\.ag/|\.ai/|\.al/|\.am/|\.an/|\.ao/|\.aq/|\.ar/|\.as/|\.at/|\.au/|\.aw/|\.ax/|\.az/|\.ba/|\.bb/|\.bd/|\.be/|\.bf/|\.bg/|\.bh/|\.bi/|\.bj/|\.bl/|\.bm/|\.bn/|\.bo/|\.br/|\.bs/|\.bt/|\.bv/|\.bw/|\.by/|\.bz/|\.ca/|\.cc/|\.cd/|\.cf/|\.cg/|\.ch/|\.ci/|\.ck/|\.cl/|\.cm/|\.cn/|\.co/|\.cr/|\.cu/|\.cv/|\.cx/|\.cy/|\.cz/|\.de/|\.dj/|\.dk/|\.dm/|\.do/|\.dz/|\.ec/|\.ee/|\.eg/|\.eh/|\.er/|\.es/|\.et/|\.eu/|\.fi/|\.fj/|\.fk/|\.fm/|\.fo/|\.fr/|\.ga/|\.gb/|\.gd/|\.ge/|\.gf/|\.gg/|\.gh/|\.gi/|\.gl/|\.gm/|\.gn/|\.gp/|\.gq/|\.gr/|\.gs/|\.gt/|\.gu/|\.gw/|\.gy/|\.hk/|\.hm/|\.hn/|\.hr/|\.ht/|\.hu/|\.id/|\.ie/|\.il/|\.im/|\.in/|\.io/|\.iq/|\.ir/|\.is/|\.it/|\.je/|\.jm/|\.jo/|\.jp/|\.ke/|\.kg/|\.kh/|\.ki/|\.km/|\.kn/|\.kp/|\.kr/|\.kw/|\.ky/|\.kz/|\.la/|\.lb/|\.lc/|\.li/|\.lk/|\.lr/|\.ls/|\.lt/|\.lu/|\.lv/|\.ly/|\.ma/|\.mc/|\.md/|\.me/|\.mg/|\.mh/|\.mk/|\.ml/|\.mm/|\.mn/|\.mo/|\.mp/|\.mq/|\.mr/|\.ms/|\.mt/|\.mu/|\.mv/|\.mw/|\.mx/|\.my/|\.mz/|\.na/|\.nc/|\.ne/|\.nf/|\.ng/|\.ni/|\.nl/|\.no/|\.np/|\.nr/|\.nu/|\.nz/|\.om/|\.pa/|\.pe/|\.pf/|\.pg/|\.ph/|\.pk/|\.pl/|\.pm/|\.pn/|\.pr/|\.ps/|\.pt/|\.pw/|\.py/|\.qa/|\.re/|\.ro/|\.rs/|\.ru/|\.rw/|\.sa/|\.sb/|\.sc/|\.sd/|\.se/|\.sg/|\.sh/|\.si/|\.sj/|\.sk/|\.sl/|\.sm/|\.sn/|\.so/|\.sr/|\.st/|\.su/|\.sv/|\.sy/|\.sz/|\.tc/|\.td/|\.tf/|\.tg/|\.th/|\.tj/|\.tk/|\.tl/|\.tm/|\.tn/|\.to/|\.tp/|\.tr/|\.tt/|\.tv/|\.tw/|\.tz/|\.ua/|\.ug/|\.uk/|\.um/|\.us/|\.uy/|\.uz/|\.va/|\.vc/|\.ve/|\.vg/|\.vi/|\.vn/|\.vu/|\.wf/|\.ws/|\.ye/|\.yt/|\.yu/|\.za/|\.zm/|\.zw/|\.aero/|\.asia/|\.biz/|\.cat/|\.com/|\.coop/|\.edu/|\.gov/|\.info/|\.int/|\.jobs/|\.mil/|\.mobi/|\.museum/|\.name/|\.net/|\.org/|\.pro/|\.tel/|\.travel/)(.*)

Replace with:

$1$2\t$3